主成分分析将多个有一定相关性的指标进行线性组合,以最少的维度解释原数据中尽可能多的信息为目标进行降维,降维后的各变量间彼此线性无关,最终确定的新变量是原始变量的线性组合,且越往后主成分在方差中的比重也小,综合原信息的能力越弱,与因子分析不同的是,因子分析是利用少数几个公共因子去解释较多个要观测变量中存在的关系,它不是对原始变量的重新组合。
工具/原料
SPSSPRO 5.0
win 7/8/10
输入输出描述
1、输入:2个或两个以上的定量变量(假设为N个变量)输出:最低可降维成1维(一个变量,一般用于综合评价),最多可降维成N个变量(一般用于数据脱敏),同时可以获取降维后各个变量的组成权重,用于代表原先变量的数据保留情况。
案例示例
1、示例:某金融服务公司为了了解贷款客户的信用程度,评价客户的信用等级,采用信用评级常用的5C(能力,品格 ,担保 ,资本,环境)方法, 说明客户违约的可能性。某金融服务公司为了了解贷款客户的信用程度,评价客户的信用等级,采用信用评级常用的5C(能力,品格 ,担保 ,资本,环境)方法, 说明客户违约的可能性。品格:指客户的名誉;能力:指客户的偿还能力;资本:指客户的财务实力和财务状况;担保:指对申请贷款项担保的覆盖程度;环境:指外部经济政策环境对客户的影响
案例数据

2、step4:选择【主成分分析】;step5:查看对应的数据数据格式,【主成分分析】要求输入数据为放入 [定量] 自变量X(变量数≥2)。step6:选择主成分个数(注意:主成分个数的选择,依赖于个人能接受的最大主成分个数,而特征根选择则是根据设定的阈值为界限,以大于该界限对应的主成分个数作为选取的主成分个数,默认为1。)step7:点击【开始分析】,完成全部操作。

2、输出结果2:方差解释表格图表说明: 上表为总方差解释表格,主要是看主成分对于变量解释的贡献率(可以理解为究竟需要多少主成分才能把变量表达为100%),一般都要表达到90%以上才可以,否则就要调整主成分数量。由表可知,前三个主成分累积解释的贡献率达到93.192%(一般情况下大于90%即可),说明使用前三个主成分就能够很好地评价客户的信用等级。

4、输出结果4:因子载荷系数表图表说明: 上表为因子载荷系数表,可以分析到每个主成分中隐变量的重要性。 第一个主成分与能力、品格、资本、担保这四个变量的相关程度较大,可以概括为“个人信用品质”;第二个主成分主与环境这一个变量的相关程度较大,可以概括为“外部政策影响”。(注意:因子载荷矩系数表在主成分分析的意义不大)

6、输出结果6:因子载荷象限分析图表说明:因子载荷图通过将多因子降维成双主成分或者三主成分,通过象限图的方式呈现主成分的空间分布。如果提取3个主成分时,则呈现三维载荷因子散点图。(注意:因子载荷象限分析在主成分分析的意义不大)。

8、输出结果8:因子权重分析图表说明: 主成分分析的权重计算结果显示,主成分1的权重为76.007%、主成分2的权重为17.589%、主成分3的权重为6.405%,其中指标权重最大值为主成分1(76.007%),最小值为主成分3(6.405%)。

模型理论
