”生信修炼手册”!
在测序一个新物种时,首先需要对该物种的基因组结构有所了解,包括以下几个内容:
-
基因组大小
-
重复片段大小
-
杂合度大小
基因组越大,杂合度也大,重复片段越大,该物种的组装难度就越大。通常我们会通过genome survery分析,对以上几个指标进行简单评估,核心就是通过kme 分布来进行评估。
对于不同的基因组杂合度,kmer分布如下
蓝色区域是实际观测到的kmer分布,红色线条下方是一些频数很低的kmer,这些kmer被认为是测序错误,黑色线条下方被认为是可靠的kmer数据,只拿这部分数据来评估基因组的大小,垂直的虚线认为是kmer的几个峰值,黄色线条下方的区域认为是非重复区域的大小。
扫描关注微信 ,更多精彩内容等着你!

声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!