【软件介绍】IGV软件的安装和基本介绍
- 1. IGV 下载与安装
- 2. Java 安装及环境变量设置
- 3. IGV 基本介绍
-
- 3.1 IGV 界面布局
- 3.2 IGV 结果界面
- 3.3 序列比对结果说明
- 4. 文件格式说明
-
- 4.1 FASTA 文件
- 4.2 BAM 文件
- 4.3 TDF 文件
- 4.4 bw文件
- 4.5 GFF/GTF文件
- 4.6 VCF文件
- 4.7 GWAS文件
2. Java 安装及环境变量设置
查看电脑上已安装的Java版本:
3. IGV 基本介绍
3.1 IGV 界面布局
官方示例:http://software.broadinstitute.org/software/igv/MainWindow
3.3 序列比对结果说明
IGV使用颜色、透明度和其他的标记来显示SNV变异、插入和删除/缺失等。
(1) 可通过 面板设置相关参数;
(2) 在 Track 区不进行 的情况下,alignments 只有亮灰和白色两种长条,其中灰色为与参考基因能比对上的reads,白色的比对质量为零 (mapping quality equal to zero);
(3) 插入:用紫色或红色的 (当插入的碱基数多余预设的阀值时)表示;鼠标停留察看详细的插入碱基情况;
(4) 删除/缺失:黑色横线表示;
(5) 可对Track区域进行排序,如想返回最初结果则选择 即可;
(6) 默认情况下 区以紧凑的单个 reads 的形式展示,通过 可成对显示;
(7) (View as pairs) 时,将reads以pairs形式和颜色来区分(红色-负链,蓝色-正链);右键选择 可以分为几个屏幕显示;右键选择 可返回单个分区。
注:颜色等标注详解见,
Viewing Alignments:http://software.broadinstitute.org/software/igv/AlignmentData
Interpreting Color by Insert Size:http://software.broadinstitute.org/software/igv/interpreting_insert_size
Interpreting Color by Pair Orientation:http://software.broadinstitute.org/software/igv/interpreting_pair_orientations
Interpreting Color by Bisulfite Mode:http://software.broadinstitute.org/software/igv/interpreting_bisulfite_mode
4. 文件格式说明
IGV支持多种文件格式 http://software.broadinstitute.org/software/igv/FileFormats:BAM、BED、BEDPE、BedGraph、bigBed、bigWig、Custom File Formats、Cytoband、FASTA、GCT、CRAM、genePred、GFF/GTF、GISTIC、Goby、GWAS、IGV、LOH、MAF (Multiple Alignment Format)、MAF (Mutation Annotation Format)、Merged BAM File、MUT、narrowPeak、PSL、RES、RNA Secondary Structure Formats、SAM、Sample Info (Attributes) file、SEG、TDF、Track Line、Type Line、VCF、WIG 等。
当数据通过 导入时,IGV通过导入文件的扩展名来确认数据格式 (file format),进而确定数据类型 (data type),再确定数据展现的 Track 形式 (track default display options)。
4.1 FASTA 文件
导入:可以在工具栏选择参考基因组;也可以通过菜单栏选择 从本地以及服务器(server)中导入参考基因组。
IGV服务器上有多个基因组:http://software.broadinstitute.org/software/igv/Genomes
4.2 BAM 文件
官方说明:http://software.broadinstitute.org/software/igv/BAM;http://software.broadinstitute.org/software/igv/merged_BAMs
命名原则:IGV要求sam和bam文件都按位置进行排序(sort)和建索引(index),并且索引文件遵循特定的命名约定,这两步骤可以用samtools或Picard软件实现(NGS数据分析实践:06. 数据预处理 – 序列比对+PCR重复标记+Indel区域重比对+碱基质量重校正)。bam索引文件应该通过在bam文件名后附加. bai来命名。sam索引文件应该通过在sam文件名后附加. sai来命名。bam文件(.bam)是sam文件的二进制版本。IGV的推荐格式是bam,而不是sam。命名示例: 的索引文件需被命名为或。
4.4 bw文件
bam文件很大,不方便查看和转移。而有些时候,只需要测序深度这一个值,并不需要具体某条reads的碱基序列,碱基质量值。因此,可以把bam格式转化为bw格式,以查看测序深度分布。bw格式全称是bigwig格式,规定了数据的每个坐标区间的测序深度。详见,NGS数据分析实践:03. 涉及的常用数据格式[4] – bed和Wiggle/Bigwig/bedgraph格式。
利用deeptools这个软件的bamCoverage工具来完成bam到bw的转换:
4.5 GFF/GTF文件
4.6 VCF文件
VCF 代表 Variant Call Format,1000 Genomes 项目使用它来编码结构遗传变异。官方说明见,http://software.broadinstitute.org/software/igv/VCF。有关突变和 VCF 文件的 IGV 可视化示例见:http://software.broadinstitute.org/software/igv/viewing_variants。变异识别包括:SNPs,indels和基因组重排。样本也可以注释属性信息,包括血统、家系等。IGV 使用这些注释对样本进行分组、排序和过滤,例如按人口组对样本进行分组。
需要的扩展名包括:或 ,如果文件进行了gzip压缩,那么还需要相应的格式的索引文件。该文件可以利用bcftools等工具生成,也可以使用IGV Tools生成(),http://software.broadinstitute.org/software/igv/igvtools。
为VCF文件track载入相应的BAM track: 可使用 2 列制表符分隔的mapping文件将 BAM 文件与 VCF 文件中的样本相关联。文件名必须是,其实就是将 添加到 vcf 文件名的末尾。第1列是来自 vcf 文件的样本名称;第2列是指向 bam 文件的路径,可以是 URL 或文件路径;它可以是绝对路径,也可以是相对于 vcf 文件所在位置的路径。如果存在mapping文件,它将自动加载,并且 VCF track中将出现一个名为的新菜单项。

VCF文件格式数据详解见:NGS数据分析实践:03. 涉及的常用数据格式[5] – vcf格式 和 v4.2 specifications:http://samtools.github.io/hts-specs/VCFv4.2.pdf。
结果图形展示:
VCF Files:http://software.broadinstitute.org/software/igv/viewing_vcf_files
Multi-Locus View:http://software.broadinstitute.org/software/igv/multilocus_view
Regions of Interest:http://software.broadinstitute.org/software/igv/regionsofinterest
4.7 GWAS文件
GWAS 文件是来自全基因组关联研究分析的空格或制表符分隔的结果文件。这些文件包括整合map信息(即每个关联的染色体位置)的 PLINK 结果文件。GWAS 文件的扩展名有:、、、、。
GWAS 文件必须包含一个标题行和四个必需的列(不区分大小写):
① CHR: chromosome (aliases chr, chromosome);
② BP: nucleotide location (aliases bp, pos, position);
③ SNP: SNP identifier (aliases snp, rs, rsid, rsnum, id, marker, markername);
④ P: p-value for the association (aliases p, pval, p-value, pvalue, p.value)
列可以按任何顺序排列,除必需列外的其他列是允许的。p 值将转换为 -log10 尺度进行绘图。
结果图形示例:http://software.broadinstitute.org/software/igv/viewing_gwas。
参考阅读:
(1) Java11安装及环境变量设置:https://blog.csdn.net/sihai12345/article/details/83834201
(2) windows IGV下载和常见的打开 错原因:https://www.jianshu.com/p/5cde024fac50
(3) IGV User Guide:http://software.broadinstitute.org/software/igv/UserGuide
(4) 生信技能树,学IGV必看的初级教程
(5) 生信技能树,使用IGV看序列比对情况
(6) 生信技能树,【直播】我的基因组 35:bam格式转化为bw格式看测序深度分布
(7) 必备可视化Integrative Genomic Viewer(IGV)(一)
(8) 必备可视化Integrative Genomic Viewer(IGV)(二)
(9) 基因组数据可视化:IGV软件使用详解
(10) 眼到手到-IGV的高级实操
(11) 3篇10分用户文章教你如何将m6A-seq和RIP-seq结果一起可视化 | m6A专题
(12) NGS 测序深度和覆盖度—Depth、Coverage
(13) 测序深度和覆盖度综述:基因组学分析的关键参数
声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!