这里,模拟一个plink文件的数据,8个样本,8个SNP位点,通过手动Excel计算样本杂合度和位点杂合度,比较plink计算杂合度的方法。
1. 模拟数据
ped数据:
map数据:
2. 计算样本的杂合度
结果查看:
这里:
- FID,家系ID
- IID,个体ID
- O(HOM):观察到的纯合个数
- E(HOM):期望的纯合个数
- N(NM):没有缺失的SNP个数
- F:计算的值
其中F的计算方法:
F= O?EN?E F = frac{O-E}{N-E} F=N?EO?E?
- O: O(HOM)
- E: E(HOM)
- N: N(NM)
可以这样认为,F值越小(包括负值),杂合度越高,F值越高,纯合度越高!
Excel对比
将ped文件,copy到Excel中,手动计算纯合和杂合的个数,进行统计:
4. 计算SNP位点的基因频率
结果查看:
声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!