SubPhaser原文链接:https://nph.onlinelibrary.wiley.com/doi/10.1111/nph.18173
(2)测试
上述运行的脚本, 内容如下:
(3)测试数据结果解读
SubPhaser的结果,主要就是如下6个图
- A:不同类型Kmer的频数统计图
- B:不同类型Kmer的聚类结果(用heatmap & 聚类树来显示)
- C:PCA
- D:染色体圈图
- E:亚基因组LTR-RTs的插入时间估计
- F:对LTR/Gypsy成分进行1000次后验检验的系统发育树构建结果
其中,D图给出的信息很多,从外圈到内圈,分别代表:
1.使用k-means方法,得到的染色体分组信息
2.对应区段内,亚基因组特异性kmer的富集结果
3.对应区段内,经过标准化的亚基因组kmer组分估计
4-6.对应区段内,对应亚基因组特异性的kmer频数概率密度(划分为几个亚基因组,这边就对应有几圈)
7.亚基因组特异性LTR-RTs & 非特异性LTR-RTs的概率密度
8.不同区段之间的同源关系分析
D图解读
- 1.基于k-means聚类算法,将输入基因组,分成了2个亚基因组(黄色 & 蓝色部分)
- 2.对应区段的特异性kmer富集结果(我这边猜测的话,哪一种kmer显著富集就显示哪一种结果)
- 3.经过标准化的kmer占比
- 4-5.对应特异性kmer的概率密度结果
- 6.对应LTR-RTs的概率密度结果
- 7.同源关系
2.HiC热图
根据HiC热图的结果,可以得到如下的config设置:

参考资料
[1] https://github.com/zhangrengang/SubPhaser
[2] https://github.com/zhangrengang/SubPhaser/issues/4
声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!