SPSS操作(五):主成分分析

    为综合评价我国2006年省级地区服务业发展水平,现构建我国省级地区服务业发展水平综合评价指标体系,具体如下:铁路运输业职工人数(人)、城市公共交通业职工人数(人)、邮政业职工人数(人)、电信和其他信息传输服务业职工人数(人)、客运量(万人)、接待入境旅游人数(万人次)、普通高校师生比(%)、星级住宿业营业额(亿元),请利用主成分分析法抽取主成分,并对我国31个省级地区服务业发展水平进行综合排名。

数据如下:

操作步骤如下:

1、将数据导入spss,并定义变量,将铁路运输业职工人数(人)、城市公共交通业职工人数(人)、邮政业职工人数(人)、电信和其他信息传输服务业职工人数(人)、客运量(万人)、接待入境旅游人数(万人次)、普通高校师生比(%)、星级住宿业营业额(亿元)分别定义为x1,x2,x3,x4,x5,x6,x7,x8
如图:

②添加要标准化的变量,勾选【将标准化值另存为变量(Z)】,再点确定

③点击【描述】进入描述框,勾选【系数】,再点击【继续】【确定】

从表1可知x1与x3、x3与x4、x6与x8等几个指标存在着极其显著的关系。可见许多变量之间直接的相关性比较强,证明他们存在信息上的重叠。

主成分个数提取原则主要包括两个标准,第一个是为主成分对应的特征值大于1的前m个主成分,第二个是前m个主成分累计贡献率大于85%。

对于第一个原则:特征值在某种程度上可以被看成是表示主成分影响力度大小的指标,如果特征值小于1,说明该主成分的解释力度还不如直接引入一个原变量的平均解释力度大,因此一般可以用特征值大于1作为纳入标准。对于第二个原则,累计贡献率反映了前m个主成分,反映了原来总体样本85%以上的信息,基本反应了原来数据的总体情况。

通过表2可知,前三个主成分的特征值大于1,且累计贡献率达到87.777%,前4个主成分的累计贡献率达到94.614%,并不同时满足两个选择主成分的标准。我们可以选择以下处理方法:
    ①坚持特征至大于1的原则(本例可提取前3个主成分,即m=3)
    ②坚持累计贡献率大于85%的原则(本例可提取3个主成分,即m=3)
    ③从解释变量的角度出发,两者兼顾,看提取几个主成分更容易从经济学的角度对各主成分进行解释,更能说明问题;

本例子中,由三个处理方法可知,选择提取3个主成分最合适,结合表3,我们可知:
    第一个主成分中x2、x3、x4、x5、x6、x8较大,说明第一主成分基本反映了这些指标的信息;
    x7在第二主成分上有较大,说明第二主成分基本反映了x7这个指标的信息;
    x1在第三个主成分中较大,说明第三主成分基本反映了x1这个指标的信息;

我们发现,提取3个主成分因子时,从经济学上很容易对三个主成分进行解释,第一个主成分反映地区经济发展水平,第二个主成分反映地区教育发展水平,第三个主成分反映地区铁路运输发展水平。我们可以以此为依据对3个主成分进行命名。

有时候根据处理方法的原则,分为默认的几个成分是不可取的,比如本例分了三个成分,可是有可能事先我们不能根据经验判断需要分几个成分,那么该怎么办呢/strong>

那我们可以再做以下操作,前面的操作我们是按特征值大于1的标准进行提取,是默认选择,由前面的分析可知,在这里我们是提取3个因子的,那么这次我们尝试提取4个因子,再看看它的结果是怎么样的:

操作如下:选择【分析】—【降维】—【因子】—【提取】,勾选【因子的固定数目】,在【要提取的因子数】填入4,然后点击继续、确定,得到表4、表5

特征值在表2中

加油!!!

声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2021年10月15日
下一篇 2021年10月15日

相关推荐