学点统计:主成分分析(PCA)怎么降维分析的?内含代码+教程

背景介绍

多元统计分析

multivariate statistical analysis

研究客观事物中多个变量(或多个因素)之间相互依赖的统计规律性。它的重要基础之一是多元正态分析,又称多元分析。

20世纪30年代,R.A.费希尔,H.霍特林,许宝碌以及S.N.罗伊等人作出了一系列奠基性的工作,使多元统计分析在理论上得到迅速发展。50年代中期,随着电子计算机的发展和普及 ,多元统计分析地质 、气象、生物、医学、图像处理、经济分析等许多领域得到了广泛的应用 ,同时也促进了理论的发展。

有需要软件的小伙伴可以戳戳链接~

软件包|Stat、SAS、SPSS、Python、R包一键拥有

科研利器|MATLAB,一款集计算机、医学与生物学的软件

资料|400集Python基础全面讲解助力医学科研汪


主成分分析(PCA)

又称主分量分析,是将多个变量通过线性变换以选出较少个数重要变量的一种方法。

主要目的

是希望用较少的变量去解释原来资料中的大部分变量,将我们手中许多相关性很高的变量转化成彼此相互独立或不相关的变量。通常是选出比原始变量个数少,能解释大部分资料中变量的几个新变量,即所谓主成分,并用以解释资料的综合性指标。由此可见,主成分分析实际上是一种降维方法

分析步骤

  1. 将原始数据按行排列组成矩阵X
  2. 对X进行数据标准化,使其均值变为零
  3. 求X的协方差矩阵C
  4. 将特征向量按特征值由大到小排列,取前k个按行组成矩阵P
  5. 通过计算Y = PX,得到降维后数据Y
  6. 用下式计算每个特征根的贡献率Vi;Vi=xi/(x1+x2+……..)根据特征根及其特征向量解释主成分物理意义。

PCA运行

  • 主成分计算
  • 主成分选择,方差累计贡献度75%以上
  • 因子负载荷图
  • 带有标签的PCA图
  • 3D-PCA

  • 3D图
  • 图例
  • 导入到PPT中进一步修改图片
  • 温馨提醒:需要代码文本形式的小伙伴可以直接联系小助理,后台发消息现在不太好接收,加油,Paper就在不远方~

    声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

    上一篇 2020年7月21日
    下一篇 2020年7月21日

    相关推荐