群体遗传 | haplotype block | HaploBlocker使用

HaploBlocker是分析单条染色体haplotype blocks,这也很容易理解,haplotype block是同一条染色体的某些区域。因此,分析时,需要按染色体或者Scaffold切分VCF文件。


准备HaploBlocker的准备文件,以Chr1为例。这里主要需要两个输入文件:

1)chr1.vcf_forR

该文件为SNP矩阵,行代表SNP位点,列代表样本。换句话说,就是不包含头信息和前9列信息的VCF文件,然后转化成下面这种格式。(想必大家应该能明白)

在这里,我将杂合位点设置为H,将空值设置为X。如果不考虑空值和杂合位点,则将其设置为NA。

空值的原因有很多:①可能是未能检测到该样品的该位点信息,②也可能是由于该样本的该位点的缺失(Deletion),③或该样本不携带REF和ALT这两种Allele,而是另一种Allele(如果是利用芯片检测)。


2)chr1.vcf_bpmap

该文件为1列,记录了SNP在染色体上面的位置。该文件主要是用于后续按照SNP在染色体上的位置进行热图绘制。

上面文件隐藏的含义是下面这个文件内容:

仔细想想,这个文件的含义,这是我在后续处理blocks信息用到的。因为该软件输出的block区间给出的是Rank这一列的位置信息,而非SNP在染色体上物理位置。


万事俱备,只欠东风!

上回我介绍了关于HaploBlocker软件的一些参数,其中有些比较重要的和常用的参数可以回去仔细看一下,根据自己的分析需要进行设置,包括:window_size,merging_error,window_sequence,bp_map,at_least_one,block_mode_na,na_snp_weight,actual_snp_weight,consideration _nodes,consideration _edge,min_share,min_similarity,block_extend,snp_extend

群体遗传 | haplotype block | HaploBlocker参数介绍


好了,先初步展示一下计算的haplotype blocks的结果吧!

后续打算:

1)携带优异位点的blocks的进化起源追溯。

2)基于haplotype block的GWAS分析

声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2022年2月22日
下一篇 2022年2月22日

相关推荐