1、偏最小二乘法(PLS)介绍
偏最小二乘法是一种新型的多元统计数据分析方法,于1983年由S.Wold和C.Albano等人首次提出。偏最小二乘法实现了,在一个算法下,可以同时实现回归建模(多元线性回归)、数据结构简化(主成分分析)以及两组变量之间的相关性分析(典型相关分析)。
PCA方法虽解决了自变量共线性的问题,但是并没有考虑自变量主元对于因变量变化的解释作用。所以删除的次要主元有可能包含对回归有益的信息,而保留的主元有可能会夹杂一些对回归模型输出无益的噪声。
PLS方法,通过将自变量和因变量的高维数据空间投影到相应的低维空间,分别得到自变量和因变量的相互正交的特征向量,再建立自变量和因变量的特征向量间的一元线性回归关系。不仅可以克服共线性问题,它在选取特征向量时强调自变量对因变量的解释和预测作用,去除了对回归无益噪声的影响,使模型包含最少的变量数。
2、基于目标优化的PLS模型的计算
2.1 PLS的准则函数
准则函数通俗的讲就是提取主元时所按照的准则,与PCA不同,PLS在提取主元时考虑的不仅是能最大程度概括自变量空间的数据信息,还应该考虑自变量主元对于因变量变化的解释作用。因此J.Hinkle提出的新的残差平方和指标:
2.2 偏最小二乘基本算法
2.2.1 基于拉格朗日算法的极大值求解
令E0=X, F0=Y,那么上式即在 的约束条件
2.2.3 回归系数向量的计算
2.2.5 重构X,Y
3.1 基于得分矩阵的模型输出
-
将数据矩阵E0=X,F0=Y的每一列进行中心化和方差归一化处理
-
计算互协方差矩阵
-
计算Ei-1,Fi-1相应于ti的负荷向量pi,bi
-
令i=i+1返回2继续计算
-
计算PLS模型对得分矩阵T的输出:Y=TB
4、PLS回归的计算工具
4.1 MATLAB函数包
MATLAB当中有偏最小二乘的函数plsregress函数,介绍如下:
4.2 Unscrambler分析软件
4.2.1 软件介绍
Unscrambler is built to solve complex problems using powerful multivariate analysis, with unique capabilities for spectroscopy and chemometrics. Choose from more than 20 different methods to analyse data, including Design of Experiments (DoE), exploratory data analysis, Partial Least Squares regression (PLS), Principal Component Analysis (PCA) and Soft Independent Modelling of Class Analogies (SIMCA). Easily explore and validate models through interactive graphics and visualisations to optimise product development, improve product quality and process efficiency.
4.2.2 Unscrambler中PLS回归模型建立流程

5、参考资料
[1] 王桂增《主元分析与偏最小二乘法》清华大学出版
[2] 偏最小二乘(pls)回归分析 matlab 博客链接
[3] 百度文库 偏最小二乘法(PLS)简介 百度文库链接
[4] 道客巴巴 Unscrambler X教程 教程链接
文章知识点与官方知识档案匹配,可进一步学习相关知识算法技能树首页概览34529 人正在系统学习中
声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!