plink软件初体验3–计算样本杂合度和SNP位点杂合度

这里,模拟一个plink文件的数据,8个样本,8个SNP位点,通过手动Excel计算样本杂合度和位点杂合度,比较plink计算杂合度的方法。

1. 模拟数据

ped数据:

map数据:

2. 计算样本的杂合度

结果查看:

这里:

  • FID,家系ID
  • IID,个体ID
  • O(HOM):观察到的纯合个数
  • E(HOM):期望的纯合个数
  • N(NM):没有缺失的SNP个数
  • F:计算的值

其中F的计算方法:
F= O?EN?E F = frac{O-E}{N-E} F=N?EO?E?

  • O: O(HOM)
  • E: E(HOM)
  • N: N(NM)

可以这样认为,F值越小(包括负值),杂合度越高,F值越高,纯合度越高!

Excel对比
将ped文件,copy到Excel中,手动计算纯合和杂合的个数,进行统计:

4. 计算SNP位点的基因频率

结果查看:

声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2020年10月22日
下一篇 2020年10月22日

相关推荐