因素分析原理及与主成分分析的区别
关键词:主成分分析原理,主成分分析法原理,pca主成分分析原理
1 因素分析原理
因素分析的目的是采用少数几个潜变量即因子来解释一组变量间的相关,当潜在变量被抽取后条目之间将不存在相关性,即达到局部独立性。换句话说,之所以变量之间存在相关,(完全)是因为潜变量的影响,当潜在变量被抽取后,之前的相关便不存在。在因素分析中,将观测分数变异划分成三个部分:公共因子、独特性(Unique Factor; 单个条目子特有的部分或几个条目共有部分,如方法效应)和测量误差(随机和系统误差)。因素分析主要关注的是共因子部分,所以常将独特性部分和测量误差合并,公式如下(芝祐顺, 1979):
zij=aj1fi1+aj2fi2+···+ajmfim+djuij (4-1)
式中Zij为个体i在项目j上的标准分,f 为共因素,aj为每个共因子的权重即因子负荷量,uij为独特性因子,dj为独特性因子的权重。
由上式不难看出,个体在某个条目上的得分等于一组公共因子和条目独特性加权之和。因为是一组因子,所以在探索性因素分析里面决定条目反应的原因不止一个,在实际结果中会发现一个条目会在多个因素上有负荷。因素分析一般有如下假设:(1)指标与共因子之间为线性关系;(2)共因子间相互独立(正交)或彼此相关(斜交);(3)误差不相关;(4)共因子与误差不相关。
2 因素分析与主成分分析
分析连续变量时的因素分析又称作线性因素分析,因为此时潜变量与项目之间的关系是线性的。线性因素分析在很多商业大型统计分析软件中被作为默认分析程序,如SPSS。在SPSS因素分析模块,默认的因素提取方法为主成分法(Principal Components Analysis, PCA)。主成分法与主轴因子抽取法或共因子抽取法不同[1],虽然在多数情况下两种方法所得结果非常接近(Velicer & Jackson, 1990)。
主成分分析是通过将一组变量组成一个线性方程来解释原来变量尽可能多的信息即变异最大化,其主要目标是用较少的几个主成分来解释这组变量尽可能多的信息,即简化数据。而因素分析是用少数几个因子来解释众多指标间彼此相关的原因即共同变异,其主要目标在于提取造成指标间共变的原因即提取公因子。如上所述,在因素分析模型中是将观测分数变异划分公因子、独特性和测量误差三部分。而在PCA中并没有单独区分独特性部分(公式4-2和图4-1b),所以在PCA中往往会高估因子负荷和因子间相关(这主要是由于独特性成分造成的虚假关系)。从这个意义上说,主成分并非潜变量,所以将主成分分析完全等同于因素分析是不妥的。
C1 = w11X1+ w12X2 + w13X3+ w14X4+···+ w1pXp
C2 = w21X1+ w22X2 + w23X3+ w24X4+···+ w2pXp
:
:
Cq = wq1X1+ wq2X2 + wq3X3+ wq4X4+···+ wqpXp
式中C1为第一个主成分,Cq为第q个主成分,wij表示第j个X指标在主成分Ci上的权重。
然而在特定条件下,这两种方法所得到的结果会很相近(Velicer & Jackson, 1990a),但如果研究的目标是确定潜在因子,EFA将更合适(Cattell, 1978; Gorsuch, 1983; McDonald, 1985)。应用研究者在研究中很可能被统计分析软件所误导,如SPSS中的因素分析模块中默认主成分分析。
图1a 因子分析示意图 图1b主成分分析示意图
Mplus学习机会:
[1]数学上,主成分分析采用的相关矩阵对角线元素为1,而主轴法采用的对角线元素为复相关系数平方(Squared Multiple Correlation, SMC)。
转载请注明:数据分析 » 因素分析原理及与主成分分析的区别_因素分析与主成分分析