iMeta | 华南农大陈程杰/夏瑞等发布TBtools构造Circos图的简单方法

点击蓝字 关注我们

定制Circos图:使用TBtools,从数据准备到可视化

● 全基因组尺度数据可视化的开箱即用解决方案

● Circos图绘制与参数定制的手把手教程

● 可重现的项目管理

视频教程

Bilibili:https://www.bilibili.com/video/BV1iT411u7y1/  

Youtube:https://youtu.be/ERWo7KhLQs0

中文翻译、PPT、中/英文视频解读等扩展资料下载

请访问期刊官 :http://www.imeta.science/

全文解读

开发动机

因此,我们在TBtools [8]中开发了“Advanced Circos”功能,旨在提供创建Circos图的最简单、最方便的方法。用户需要做的是按照TBtools图形界面中的简单提示来组织以制表符分隔的输入文件。所有绘图参数可以交互调整,Circos图可以立即生成和刷新。用户可以保存工作项目以供进一步修改、复制和共享。此外,TBtools作为一个多功能工具包,具有一系列文本处理和数据整理功能,帮助用户轻松快速地准备输入数据,为Circos绘图创建提供一站式解决方案。

数据类别

TBtools中的“Advanced Circos”功能支持可视化多组连续或离散数据。通常,这些数据类型可分为四大类,如图1所示:

图2.  Advanced Circos的主界面和参数面板

(A)-(C)输入文件面板;(D)现有项目恢复按钮;(E)按钮点击生成基因组骨架图;(F)Cirocs绘图的全局参数设置;(G)用于导出绘图或保存项目的按钮;(H)每个染色体区域统计可视化的参数设置。

●  高级参数设置

通过单击“Show Control Dialog”按钮,可以打开高级Circos控制面板。参数设置面板可分为三个主要部分(图2F-G)。

1、位于界面底部的保存按钮(图2G)。“Save Graph”按钮用于导出当前绘图,支持位图和矢量格式;“Save Curr. Project”按钮可用于保存正在进行的项目,该项目可通过上述“Load Project…”恢复,也可以直接与其他用户共享或直接在其他设备上复现;

2、位于界面左侧的全局参数设置(图2F)。这些设置用于控制总体绘图细节,详细分为几个部分:图形设置、颜色栏、颜色标签、颜色记 、关联信息、特征标签、热图颜色比例。而顶部的“Refresh Graph”按钮用于应用调整后的参数并刷新当前绘图。

3、位于界面右侧的单道图形控制参数(图2H)。它们用于控制染色体区域统计信息的可视化细节,染色体区域统计信息也分为几个部分,包括BIN设置、颜色设置、Bar设置和线条设置。单击“添加”按钮,将生成图形轨道。对于每个参数的详细效果,建议用户使用示例数据自行探索(见支持数据1)。

●  案例演示

Advanced Circos是TBtools的内置功能之一,它与一系列可用于输入数据准备的功能集成在一起。在本节中,我们将逐步演示如何使用TBtools的Advanced Circos功能从常见的生物大数据出发,到Circos图生成。

(a) 染色体骨架文件制备

染色体骨架是Circos图的主干。可以使用TBtools中的“Fasta Stat”功能从基因组序列文件中获取有关基因组的信息(图S1)。

功能位置:“Sequence Toolkit”->“Fasta Tools”->“Fasta Stats”;

输入文件:“Arabidopsis_ thaliana.genome.fna

输出文件:“Arabidopsis_ thaliana.genome.fna.ChrLen.txt

操作步骤:

1、转到“Fasta Stats”;

2、设置输入文件和输出文件;

3、勾选“仅保留序列长度”;

4、点击“开始”按钮,所需信息将保存到输出文件

(“Arabidopsis_thaliana.genome.fna.ChrLen.txt”)。

注:演示数据的文件名为斜体

Chr1       30427671

Chr2       19698289

Chr3       23459830

Chr4       18585056

Chr5       26975502

ChrM      366924

ChrC      154478

只需将染色体长度信息的结果文件拖放到Advanced Circos(图2A)的第一个字段中,按“Show My Circos Plot!”按钮,立即生成染色体骨架的Circos图(图3A)。

图4:使用不同的轨道类型查看连续数据

(A)轨道参数面板;(B)在点图中查看的N比率情况;(C)GC偏斜度;(D)热图中的基因密度;(E)条形图中的排序覆盖率。

类似地,我们可以使用线条图来可视化GC偏斜。GC偏移的计算以0为界,因此我们在右侧的行设置中将“Sep Line Value”设置为0,以实现正负偏移值的不同着色(图4C)。

基因密度

基因组范围内的基因密度分布通常通过Circos图进行可视化。TBtools有一个方便的功能——“Gene Density Profile”,它允许用户从基因结构注释文件中计算基因密度,通常为GFF3和GTF格式。

功能位置: “Sequence Toolkits” -> “GFF3/GTF Manipulate” -> “Gene Density Profile”

输入文件: Arabidopsis_thaliana.genome.gff3

输出文件: GeneDensity.profile

在“Control Dialog”面板中,单击“Add”以获得附加轨道,拖放基因密度信息文件(“GeneDensity.profile”),选择热图模式,然后刷新绘图(图4D)。如果基因密度分布明显有偏差,用户可以在左下角面板的“Heat Color Scale”菜单中尝试不同的颜色缩放模式,以获得更好的视图。每个热图轨道都会自动触发绘制颜色方案图例,并且这些图例可以轻松移动。

测序数据覆盖度分布

在许多情况下,除了基因组序列本身的特征外,我们还对查看实际NGS数据在基因组上的分布感兴趣,例如,深度测序数据的覆盖范围。TBtools中的“SAM/BAM/CRAM BIN Cov”功能可用于根据映射工具生成的原始对齐文件(通常为SAM、BAM或CRAM格式)准备输入文件。

功能位置: “Others” -> “HTS Data” -> “SAM/BAM/CRAM BIN Cov”

输入文件: SRR17382349_1.bam

输出文件: SRR17382349_1.bam.BINStat.tab.xls

这里,我们选择了条形图来可视化覆盖率数据。勾选“Color by Chr”,使条形图的颜色与染色体的颜色一致。“Bar Fill”选项控制轨道的背景色,此处设置为灰色(图4E)。

基因组变异数据

与比对文件(用于序列覆盖)类似,在TBtools中,用户还能够处理基因组变异的数据,例如,包含基因组序列变异信息的VCF文件。“VCF BIN Cov”功能可用于输入准备。

功能位置: “Others” -> “HTS Data” -> “VCF BIN Cov”

输入文件: Est-1.qual50.filtered.direct.vcf.gz

输出文件: Est-1.qual50.filtered.direct.vcf.BINCount.tab.xls

使用热图模式,可以全面查看染色体上序列变异的热点区域。总体模式在很大程度上与上述基因密度分布互补。

QTLs/Arrow/TAD

上面使用的所有演示数据都是连续的基因组数据,“Advanced Circos”还提供了显示离散数据的各种模式。我们可以参考上述Tile track的格式要求组织QTL信息,例如:

Chr3 7842037 11192039 56,108,176,0.7 Blue Light

Chr5 2899846 8562462 56,108,176,0.7 Blue Light

Chr1 19672910 24443023 227,26,28,0.7 Red Light

Chr1 592464 24581765 255,255,179,0.7 White Light

Chr5 1507102 5275918 255,255,179,0.7 White Light

使用此数据作为输入,并选择“Tile”模式以显示它(图5A)。请注意,最后一列是可选的,它的存在将自动触发图例生成。所有图例都可以轻松移动。此外,“Advanced Circos”还可用于可视化TAD(使用“三角形”模式)或带方向基因区间(使用“箭头”模式)(图1)。

图6:Circos的重叠轨道

(A)从Circos图的内部到外部分别是:基因组区域关联的Bézier曲面;N-比率分布的点图;GCskew的线图;基因密度分布的热图与GC比率变化的线图重叠;测序覆盖率条形图;倒置的条形图;基因家族的标签;(B)捋值的Circos

直线型还是环型strong>

保存、共享和重新加载项目

在主绘图面板中,单击“Save Curr. Project”,将当前绘图数据和状态保存到指定目录。用户可以随时直接从Advanced Circos主界面重现保存的项目,做进一步调整。此外,用户只需打包目录并将其发送给同事共享他们的Circos项目,或直接从其他设备工作。

结论

致谢

本研究由岭南现代农业广东实验室(项目编 :NZ2021007)、国家自然科学基金(32102320)和广东省专项支持计划(2019TX05N193)资助。我们感谢华西医院的于浩鹏博士和中国热带农业科学院的冯筠庭博士就改进TBtools的Advanced Circos功能提出的建设性建议。我们非常感谢40000多名TBtools用户,尤其是30多名高级用户的良好建议。

利益冲突

数据可用性

所有演示数据和TBtools的相应版本可在https://tbtools.cowtransfer.com/s/c60a5cfec3274f.补充材料(图、表、脚本、图形摘要、幻灯片、视频、中文翻译版和更新材料)可在在线DOI或iMeta Science中找到http://www.imeta.science/。

引文

Chen, Chengjie, Ya Wu, and Rui Xia. 2022. “A painless way to customize Circos plot: From data preparation to visualization using TBtools.” iMeta. e35. https://doi.org/10.1002/imt2.35

博导,华南农业大学园艺学院教授

● 目前是亚热带农业生物资源保护与利用国家重点实验室和农业部华南地区园艺作物生物学与种质创制重点实验室的学术骨干和青年学科带头人。2019年获得广东省特支计划科技创新领军人才项目支持。长期致力于园艺植物基因组和小分子RNA相关研究,已取得了国际领先的研究成果,在Nature Genetics, Nature Communication, Molecular Plant和The Plant Cell等学术刊物发表SCI论文50多篇,累计引用>5000次。目前主要利用生物信息学、基因组学及分子生物学等手段,围绕无患子科植物花性别分化机制以及南方主要水果花果发育调控机理等生物学问题开展研究。并已开发一系列生物信息数据分析工具数据库,如TBtools和sRNAanno(www.plantsRNAs.org)等

更多推荐

(▼ 点击跳转)

iMeta文章中文翻译+视频解读

iMeta封面 | 宏蛋白质组学分析一站式工具集iMetaLab Suite(加拿大渥太华大学Figeys组)

????

iMeta | 南科大夏雨组纳米孔测序揭示微生物可减轻高海拔冻土温室气体排放

????

iMeta | 华南农大曾振灵/熊文广等-家庭中宠物犬与主人耐药基因的共存研究

????

iMeta | 南医大陈连民等综述从基因组功能角度揭示肠菌对复杂疾病的潜在影响

????

iMeta | 电子科大林昊组开发蛋白质赖氨酸乳酸化位点预测工具DeepKla

????

iMeta | 浙大倪艳组MetOrigin实现代谢物溯源和肠道微生物组与代谢组整合分析

联系我们

iMeta主页:http://www.imeta.science

出版 :https://onlinelibrary.wiley.com/journal/2770596x
投稿:https://mc.manuscriptcentral.com/imeta
邮箱:office@imeta.science

iMeta

微微 

文章知识点与官方知识档案匹配,可进一步学习相关知识Java技能树首页概览92563 人正在系统学习中

声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2022年6月4日
下一篇 2022年6月4日

相关推荐