常用生物学软件的安装与应用(五)— 进化树的构建与美化

导语:上期小编给大家介绍了MEGA软件的用法(常用生物学软件的安装与应用(四))。本期给大家介绍MEGA软件的重要用途之一,构建进化树,并讨论如何生成美观的进化树图片。

1.进化树1.0版本

上一期已经给大家介绍根据基因或者蛋白ID在NCBI上进行BLAST并下载FASTA序列,然后将序列导入MEGA软件中进行比对,最后生成.meg的序列比对文件。

那么用这个文件是不是就能构建进化树呢,当然可以。方法也很简单,单击菜单【File】→【Open A File/Session】,打开上述.meg文件,点击工具栏中的【PHYLOGENY】→【Construct/Test Neighbor-Joining Tree】,表示用邻接法构建进化树。在弹出的对话框中选择参数,一般默认即可。这样就生成了一个最简单的进化树。

现在问题来了,进化树是有了,但这棵树长得着实有点丑,最大的问题在于后面一长条英文看得人脑壳疼。那么怎么解决呢?

2.进化树2.0版本

2.1序列预处理

我们知道进化树的基本作用是反映物种的进化关系,而在分子生物学的研究中,进化树也能反映某单个或几个基因的进化情况。上一期的推送里我们的目的基因是水稻绿色革命基因SD1,这是一个赤霉素20氧化酶基因。我们在NCBI下载其同源序列后得到的FASTA文件是这样的:

现在发现问题了吧,从NCBI下载的序列中,每条序列的名称非常繁琐,这也直接导致了我们后面的进化树出现了一条条很长的英文。解决办法也很容易,直接将“>”后面序列名称改成简称就行了。比如第一条序列是我们的目的基因SD1,第二条序列可以按照简写直接命名成AtGA20ox1,其中的At是拟南芥的简写,GA20ox1表示赤霉素20氧化酶1。这也是UniProt 站上蛋白序列的命名规则。

另外一个问题是假阳性的问题,既然我们的目的基因是一个赤霉素20氧化酶,那么我们只需要关注这个家族的蛋白,因此像下面这些蛋白序列则需要手动删除。

2.2 重新构建进化树

序列处理完成后,按照上面的方法重新构建进化树,这样就得到了我们的进化树2.0版本。看起来好看多了!

3.进化树3.0版本

3.1 改变进化树形状

上面一排有两个树形的按钮,可用于改变进化树的形状,包括矩形、辐射形和圆圈形(下图从左到右),也可以调整序列名称是否对齐。

3.2 显示分支节点属性

Tree Explorer窗口左侧一栏也有大量的选项,下图列举了部分功能。这些按钮能在进化树上显示出相应的信息,常用的有节点属性、分支长度和序列名称等信息。

3.3 调整序列名称字体和颜色

单击上方工具栏中的工具按钮,选择【Lables】,在弹出的窗口中可修改字体和颜色,并且能给相应的序列添加不同的符 。

4.进化树终极版本

4.1 上传文件

打开ITOL 站,第一次使用需要先注册。注册完成后选择【Upload a tree】,将上面生成的Newick文件上传。

4.3 导出文件

结语

声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2021年1月8日
下一篇 2021年1月8日

相关推荐