”生信修炼手册”!
shapeit是一款单倍型分析工具,运算速度快,准确率高,是impute2官方推荐的pre-phasing工具,官 如下
http://mathgen.stats.ox.ac.uk/genetics_software/shapeit/shapeit.html
对应的文献发表在nature method上,链接如下
https://www.nature.com/articles/nmeth.1785
通过隐马可夫模型来分析单倍型,简化的模型示意如下
采用了3个不同的数据集,比较了运行时间和错误率,shapeit错误率最低,运行速度最快。
该软件的基本用法如下
需要指定的参数分成了以下3个部分
1. input unphased genotypes
支持以下3种格式
-
ped/map
-
bed/bim/fam
-
gen/sample
-
vcf
前两种为plink软件的格式,是GWAS分析最常见的文件格式,第三种格式是WTCCC默认的文件格式 第四种是最常见的VCF格式。
不同类型的输入文件对应的用法如下
对于gen/sample文件格式,可以通过这个软件来进行格式转换,
2. genetic map
参考基因组对应的连锁图谱,可以提高单倍型分析的准确性,官方提供了hapmap项目的连锁图谱供下载,链接如下
http://mathgen.stats.ox.ac.uk/genetics_software/shapeit/shapeit.html#formats
每列之间用空格分隔,第一列为snp位点所在的染色体名称,第二列为snp id,第三列为染色体的位置,第四列为不同样本中该位点的分型结果,0代表ref allle, 1代表alt allel, 每两列对应一个样本。
后缀为sample的文件内容如下所示
声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!