今天给大家介绍MITOS这个线粒体在线注释 站,该 站主要用来注释动物线粒体和部分真菌,但是不推荐用来注释植物的线粒体。
小编主要从版本、使用说明、注释结果说明、注意事项、注释文件这五个方面来进行介绍。
一、版本
MITOS 站有新版(http://mitos2.bioinf.uni-leipzig.de/index.py)和旧版(http://mitos.bioinf.uni-leipzig.de/index.py)两种版本。小编推荐大家使用新版界面,相对与旧版,新版界面操作更方便,数据库较新,注释信息更全,并且可以预测线粒体OH(repeat origin、control region)区,这是旧版所不具备的。
二、使用说明
今天小编用某一昆虫的线粒体序列(环状序列,完整的线粒体序列)来说明MITOS 站的使用步骤。
1.NCBI下载线粒体序列
该昆虫线粒体序列下载 址是https://www.ncbi.nlm.nih.gov/nuccore/EU725832.1/,文件以fasta文件存储。
Genetic Code:
2 Vertebrate :脊椎动物
3 Yeast :酵母
4 Mold:霉菌
5 Invertebrate:无脊椎动物
9 Echinoderm:棘皮动物
13 Ascidian:海鞘类
14 Alternative Flatworm:扁虫
16 Chorophycean:绿藻
三、注释结果说明
注释结果(以下主要以新版为例进行说明)。大家可能会疑惑,新旧版区别到底是啥实区别也不是特别大,新版注释结果会在每个tRNA后面注明其反密码子,而旧版注释结果中注明的不是反密码子,而是与其互补的密码子,并且旧版注释缺少OH结构区(上面也提到过),也未给出基因cds区的起始/终止密码子,所以旧版对于新版注释结果效果而言差了一点。
如下图,第一列(Name),线粒体主要结构区名称;第二、三列(Start、Stop),该结构区在该线粒体序列(输入文件fasta序列)中的起始、终止位置;第四列(Strand),该结构区位于正链(+)/负链(-);第五列(Length),该结构区长度(bp);第六列(ovl/nc),该结构区和上一个结构区的间隔,若为负数,则表明二者区域有所重叠(正常现象,只要不很大就没什么问题);第七列(Codons),若为蛋白编码基因(CDS区),则标明起始/终止密码子;第八列(Infos),若为非编码RNA(rRNA、tRNA),则同时给出其二级结构图。
5.线粒体序列起点位置调整(起点调整仅限环状序列)
最后确认无误,或者说你通过了一系列的方法获得了可靠的注释结果后,先不着急导出结果。尽管动物线粒体结构单元在种类上通常来讲比较保守,但是不同的物种之间,这些结构单元在基因组中的排列顺序可能相差较大。最好对它们确定个前后顺序。
此外,如果你的线粒体序列是环状的,注释结果中还可能会出现某段结构区在末尾处仍未到终点,然后延伸至起点位置继续(如下所示)。这时候肯定也需要调整下起点位置,不要在注释结果中出现这类的状况。

声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!