spss多重共线性检验_spss共线性检验_spss做多重共线性检验
关键词:spss多重共线性检验、spss多重共线性分析、spss共线性诊断怎么看
例如在回归分析中,线性回归-统计量-有共线性诊断。 多重共线性:自变量间存在近似的线性关系,即某个自变量能近似的用其他自变量的线性函数来描述。 多重共线性的后果: 整个回归方程的统计检验P<a,但所有偏回归系数的检验均无统计学意义。 偏回归系数的估计值大小明显与常识不符,甚至连符号都是相反的。比如拟合结果表明累计吸烟量越多,个体的寿命就越长。 在专业知识上可以肯定对应变量有影响的因素,在多元回归分析中却P>a,不能纳入方程 去掉一两个变量或记录,方程的回归系数值发生剧烈抖动,非常不稳定。 多重共线性的确认: 做出自变量间的相关系数矩阵:如果相关系数超过0.9的变量在分析时将会存在共线性问题。在0.8以上可能会有问题。但这种方法只能对共线性作初步的判断,并不全面。 容忍度(Tolerance):有 Norusis 提出,即以每个自变量作为应变量对其他自变量进行回归分析时得到的残差比例,大小用1减决定系数来表示。该指标越小,则说明该自变量被其余变量预测的越精确,共线性可能就越严重。陈希孺等根据经验得出:如果某个自变量的容忍度小于0.1,则可能存在共线性问题。 方差膨胀因子(Variance inflation factor, VIF): 由Marquardt于1960年提出,实际上就是容忍度的倒数。 特征根(Eigenvalue):该方法实际上就是对自变量进行主成分分析,如果相当多维度的特征根等于0,则可能有比较严重的共线性。 条件指数(Condition Idex):由Stewart等提出,当某些维度的该指标数值大于30时,则能存在共线性。 多重共线性的对策: 增大样本量,可部分的解决共线性问题 采用多种自变量筛选方法相结合的方式,建立一个最优的逐步回归方程。 从专业的角度加以判断,人为的去除在专业上比较次要的,或者缺失值比较多,测量误差比较大的共线性因子。 进行主成分分析,用提取的因子代替原变量进行回归分析。 进行岭回归分析,它可以有效的解决多重共线性问题。 进行通径分析(Path Analysis),它可以对应自变量间的关系加以精细的刻画。
如何用SPSS检验多重共线性
操作步骤:
1、先打开回归的对话框:analyse–regression–linear,打开线性回归对话框;
2、将自变量因变量都放到各自的位置,然后点击statistic;
3、在该对话框中,有一个多重共线性诊断的选项,勾选他,如图所示,点击continue按钮,返回主对话框;
4、点击ok按钮,开始输出诊断结果;
5、特征根(Eigenvalue):多个维度特征根约为0证明存在多重共线性;条件指数(Condition Index):大于10时提示我们可能存在多重共线性,相关系数矩阵,找到数值接近1的相关,这也提示出可能存在多重共线性。