玩转基因组浏览器之使用IGV查看基因结构信息

”生信修炼手册”!

基因结构是最基本的基因组注释信息,通常情况下,我们最关心基因区域内的数据分布情况,有多种文件格式可以存储基因结构信息

  1. GFF

  2. GTF

  3. BED

用固定格式来存储对应的信息,使得生物信息软件可以更加标准化其输入输出,为数据分析带来便利。但是存储在文件中的信息对于我们而言,并不够直观。为了更加直观的查看基因结构,可以使用IGV浏览器,只需要将对应格式的文件导入软件中即可。

基因结构信息的本质是染色体坐标,IGV要求导入的数据必须是排序之后的结果。以GTF文件为例,可以采用如下命令先进行排序

排序之后还需要对文件建立索引,这样检索的速度会更快,用igvtools可以建立索引,命令如下

运行完成后,会生成一个后缀为的文件,将排序后的gtf文件和其索引放在同一个目录下,然后导入gtf文件即可。导入成功之后,  可以看到如下所示的结果

2. Squished

结果示意如下

其中矩形表示exon区域 ,线条表示基因的正负链信息,向右的箭头表示正链,向左的箭头表示负链。有时会看到类似下图的转录本结构

一个只分享干货的

声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2020年1月17日
下一篇 2020年1月17日

相关推荐