一.概念简述:
主成分分析的思想主要是将高维数据降到低维数据,俗称“降维”。但是,如果你的数据行数小于列数,或者在你的数据中各列数之间本身相关性就不大,那么这时候你会发现使用主成分分析的效果其实不是很好。这个时候,我们可以考虑一下偏最小二乘法判别分析,该方法是结合多元线性回归和主成分分析的优点,在很大程度上解决了上述所说的问题。(建了个群,交流学习哈:553621380。)
也可到楼主自己编写的 站上去查看更多内容, 址:http://www.omicsolution.org/wu-kong-beta-linux/main/?
二.代码实现。
比如说我们现在有这样的一批数据,取56个人(正常组:28,病灶组(胰腺癌):28)胰腺组织,做蛋白质组学数据分析。上样,跑质谱,搜库(这些步骤非本节内容,在此省略)。得到最后如下数据:
我们发现,前两个主成分的累积贡献率可以达到84%,效果还算不错。
2.PLS-DA分析
#加载相应的安装包?,没有的话进行:install.packages(“mixOmics”)
library(mixOmics)
#读取数据?
data
head(data)
#转换成矩阵?
datat
row.names(datat)
datatm
XXt
YY
#PLS-DA分析,这里也是选取2个主成分?
plsda.datatm
2)
plotIndiv(plsda.datatm,ind.names = T, plot.ellipse = TRUE,
add.legend =TRUE,style=”ggplot2″)

建了个群,交流学习哈:553621380。
文章知识点与官方知识档案匹配,可进一步学习相关知识算法技能树首页概览34530 人正在系统学习中 相关资源:求解偏微分方程的数学软件Fastflo-教育工具类资源
声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!