密码子使用分析以及分析工具——EMBOSS

尔云间 一个专门做科研的团队

文献解读期刊推荐代码

铁死亡免疫浸润肿瘤微环境

生物体遗传信息的传递,经历了“中心法则”所描述的从DNA到mRNA, 终至具有生物功能的蛋白质这一渐进过程。

其间重要的一个环节是以三联体密码的形式编码蛋白质的结构单元——氨基酸。近年来, 人们发现不同功能的基因,其密码子使用偏性也存在较大的差异。

今天要介绍的是强大的综合型工具EMBOSS( European Molecular Biology Open Software Suite),该工具的功能涵盖从核苷酸到蛋白质的各种分析,是生物信息学分析中不可多得的好帮手,这里主要介绍其冰山一小角——在密码子使用分析上的应用。

工具连接:
http://emboss.bioinformatics.nl/

密码子分析步骤:

1. 从工具的左分布选项中查找得到“NUCLEIC CODON USAGE”。

2. 计算CAI参数:CAI值(Codon Adaptation Index, CAI)——密码子适应指数,CAI值介于0-1之间,该值越大表示偏性越强;分析密码子偏好性有助于指导外源基因进行分子改造, 从而提高该基因的表达效率以及新基因预测和基因组注释的准确性。

通过密码子使用偏好性的研究, 可以判定一些最优密码子,针对这些最优密码子的翻译调控,能够调节蛋白质的表达量,对特定蛋白质表达量进行有效地控制。

输入形式有几种可供选择,序列access编 ,标准的FASTA格式的序列贴入到空白框以及本地文件格式的FASTA序列

结果:直接返回输入序列的CAI值。

3. 计算ENC值:ENC值(Effective Number of Codon)的范围在20~61之间, 越靠近20偏性越强。此值是描述密码子使用偏离随机选择的程度(并不是某个特殊密码子的使用频率与其他密码子的比较),。

能反映密码子家族中同义密码子非均衡使用的偏好程度。已知高表达基因其密码子偏爱程度也大,从而ENC值较小; 低表达基因则含有较多种类的稀有密码子, ENC值也较大

输入与计算CAI时类似。

结果

4. 计算每类型的密码子在输入序列中的个数分布:此步能够得到64中三联密码子中,每个类型的密码子所占的个数,从而能够看到最优势型的氨基酸密码子

结果:

这里只是介绍了EMBOSS多个功能中的其中一种,该工具还包含了其余多种分析功能,如finding genes、ORF scan、RNA folding、protein 3D structure等,是一个功能强大的好帮手。

更多生信热点及干货

声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2022年1月10日
下一篇 2022年1月10日

相关推荐