密码子偏好性分析

密码子偏好性分析_密码子统计数据库与使用方法介绍(深度好文)

一:密码子使用统计数据库

其中第一个为我们所要的酵母的密码子使用情况统计,它在统计过程中参考了14288个CDS,其链接如下:


Coding GC 39.78% 1st letter GC 44.58% 2nd letter GC 36.63% 3rd letter GC 38.12% 统计的是每1000个碱基中其特定密码子出现的频率,比如GCU 21.2(136804)代表GCU密码子在mRNA中出现频率为21.2‰,在所统计的14288CDS中共出现了136804次。在 页的下面显示List of codon usage for each CDS 的链接,是对每个CDS的密码子使用统计。从数据的可读性考虑,PrimerX编写了Codon Usage Analyzer在线密码子统计表处理软件(http://bioinformatics.org/codon/cgi-bin/codon.cgi),它使得对密码子的统计用图表的形式显示出来,更加的直观可读。对于上例中的密码子使用情况统计表,处理后的形式为:

二:密码子偏好性分析

对于密码子偏好性的分析,有Correspondence Analysis of Codon Usage软件分析程序codonw(http://codonw.sourceforge.net//)和https://www.biologicscorp. com/tools/GCContent/ ,graphical codon usage analyser在线分析软件(http://gcua.schoedl.de/faq/faq.php=cut)及detaibio稀有密码子分析软件(http://www.detaibio.com/tools/rare-codon-analyzer.html)。而对于E. coli,由于其作为发酵工程表达蛋白的最主要的手段,因此Morris Maduro博士针对E. coli开发了E. coli Codon Usage Analyzer(http://www.faculty.ucr.edu/~mmaduro/codonusage/usage.htm),目前的版本为V2.1,它对于在E. coli中异源蛋白的表达效率给出了很好的建议。而由于graphical codon usage analyser的直观性和方便性,在密码子偏好性分析中得到了广泛的应用。下面就重点介绍以图形形式进行密码子偏好性分析的graphical codon usage analyser系统。
Graphical codon usage analyser是由***科学家Thomas Sch?dl开发设计的以图形形式对异源基因表达的密码子使用分析,用以帮助异源基因表达时对异源基因进行改造,以适应受体物种,避免由于翻译时密码子使用情况的限制使受体物种对外源基因表达产生负面影响。
Graphical codon usage analyser有三大方面的功能。它们完成了对特定序列的异源表达密码子使用情况的统计以及不同物种密码子使用情况间的比较。它与Codon Usage Database 联合使用,可以完成对Codon Usage Database 中已存在的所有物种的密码子偏好性的分析。

  1. compare two usage tables的功能则不是针对特定基因序列的,而是把两个不同物种的密码子使用频率进行对比,估计其总体翻译效率的差异。在交互式的选择中,只要指定两种想要比较的物种,即可得到其数据。
三.CodonW结果解读

1.密码子在生物体遗传信息的mRNA到蛋白质的传递过程中起着关键作用,编码20种不同氨基酸的密码子共61种,其中2种氨基酸(Met和Trp)由一种密码子编码,18种氨基酸由2种或2种以上的同义密码子(synonymous codon)编码,这种现象称为密码子简并性(Degeneracy),同义密码子通常只在第三位碱基上不同(摇摆性)。
2.不同物种、组织或基因对同义密码子的使用频率呈现出丰富的多样性,即同义密码子偏好性(synonymous codon usage bias,SCUB)。
密码子使用偏好性普遍存在于生物界,在绝大多数基因(基因组)中都已经发现了同义密码子使用偏好性。

02 密码子适应指数( Codon adaption index , CAI )
该指数以一组具高表达水平的基因为参考 , 测量某一个基因的密码子偏好情况和这些高表达基因密码子偏好情况的接近程度 , 如果一个基因完全使用高表达基因中所用的密码子 , 则其C AI 值为 1 。目前这个指数已被广泛用来预测基因的表达水平。
CAI指具有物种特异性,不能用于物种间的比较。

03 Effective Number of Codon(ENC/Nc)有效密码子数
指基因中使用的有效密码子的数量。该值反映同义密码子非均衡使用的偏好程度。
与CAI 不同 ,Nc反应的是某个基因的密码子偏好程度 , 如果一个基因平均使用每一个密码子 ,则其 Nc 为 61 ,如果一个基因只使用每组同义密码子中的一个 ,则其 Nc 为 20。ENC值越低,说明密码子使用偏好性越强。
一般认为,当ENc≤35,则该基因具有显著的密码子偏好性。Nc是评价基因整体密码子偏好性中最具有参考价值的参数。可以通过比较Nc值来确定内源基因表达量的相对高低。通常高表达基因的密码子偏好程度大,其Nc值较小;低表达基因则含有较多种类的稀有密码子,其Nc值较大。

04 Franction、Frequency
如cusp的分析结果中,第三列为每个密码子的Franction,第四列为Frequency,那是什么意思呢r> 1.Franction表示各个密码子在编码该氨基酸的密码子中所占的比例,即Franction=某个密码子出现的次数/该密码子编码的氨基酸的所有密码子出现的次数。
2.Frequency表示该密码子在编码总基因密码子中出现的频率,一般表示为在1000个密码子中该密码子出现的次数,即Frequency=某个密码子出现的次数*1000/基因所有密码子总数

cusp分析结果
四、使用心得

在实际的使用过程中发现利用Codon Usage Database和Graphical codon usage analyser连用,可达到非常强大的异源表达蛋白翻译效率的估算。经验上认为,对于以水稻为代表的单子叶植物,其GC含量高,较双子叶植物及细菌等物种来说,密码子偏好性强,更不容易进行针对非单子叶植物的异源表达。而相比之下,双子叶植物在该问题上则不存在翻译效率上的问题。由于单子叶植物组培体系的周期长、效果差,水稻功能基因的挖掘及其在双子叶植物中的表达以成为必然,然而对于表达过程中的效率以及表达鉴定等方面的问题的困扰,可以通过密码子偏好性分析并从中找到答案。

文章知识点与官方知识档案匹配,可进一步学习相关知识MySQL入门技能树数据库组成33002 人正在系统学习中

声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2022年10月25日
下一篇 2022年10月25日

相关推荐