本站分享:AI、大数据、数据分析师培训认证考试,包括:Python培训Excel培训Matlab培训SPSS培训SAS培训R语言培训Hadoop培训Amos培训Stata培训Eviews培训

怎么检验是否存在多重共线性_多重共线性检验

stata培训 cdadata 30716℃
怎么检验是否存在多重共线性
想检验一下是否存在多重共线性,应该把模型里每一项都做相关分析吗?交互项也需要放吗?哑变量呢?
得到相关系数表之后应该怎么判断是否存在多重共线性?
统计学没学好= =,求指教。。
模型如图:
怎么检验是否存在多重共线性_多重共线性检验
解答:一种是给出各变量的相关系数;还有一种是方差膨胀因子(VIF)检验。
相关系数矩阵我会,方差膨胀因子(VIF)检验怎么弄呢?
得到相关系数矩阵后,相关系数怎么样才能得到我的模型可以用的结论呢?
是每个变量都要看相关系数还是交互项就不用了?
求各路高手指教啊!
解答:交互项放进方程时,需要中心化处理,一般是用变量实际值减去均值后相乘,再放进方程,避免多重共线性。
———-*******——–
多重共线性的检验方法比较多也是可以分成几个层次来检验:一种是初步判断:如果回归完以后拟合优度和F统计量很大,而与此同时模型中应当显著的变量不显著或是没有一个变量是显著的,甚至参数估计量的正负号发生了改变,可以初步判定会存在多重共线性;二、进一步可以用逐步回归法,方差膨胀因子VIF来检验,一般情况下VIF大于5就表明存在较为严重的多重共线性,利用条件数来判断(STATA命令:coldiag2+自变量)如果条件数小于30,表明不存在共线性,在30到100之间表明存在一定程度的多重共线性,但不会对模型的回归与解释产生影响,如果高于100则表明存在严重的多重共线性。
******
如果已经计算出解释变量之间的相关系数,可以将各解释变量之间的相关系数与回归的拟合优度比较,如果大于拟合优度,则表明存在共线性。
——————————————————————–
其他精彩回答:
在SPSS中有专门的选项的。例如在回归分析中,线性回归-统计量-有共线性诊断。
多重共线性:自变量间存在近似的线性关系,即某个自变量能近似的用其他自变量的线性函数来描述。 多重共线性的后果: 整个回归方程的统计检验P<a,但所有偏回归系数的检验均无统计学意义。 偏回归系数的估计值大小明显与常识不符,甚至连符号都是相反的。比如拟合结果表明累计吸烟量越多,个体的寿命就越长。 在专业知识上可以肯定对应变量有影响的因素,在多元回归分析中却P>a,不能纳入方程 去掉一两个变量或记录,方程的回归系数值发生剧烈抖动,非常不稳定。
多重共线性的确认: 做出自变量间的相关系数矩阵:如果相关系数超过0.9的变量在分析时将会存在共线性问题。在0.8以上可能会有问题。但这种方法只能对共线性作初步的判断,并不全面。 容忍度(Tolerance):有 Norusis 提出,即以每个自变量作为应变量对其他自变量进行回归分析时得到的残差比例,大小用1减决定系数来表示。该指标越小,则说明该自变量被其余变量预测的越精确,共线性可能就越严重。陈希孺等根据经验得出:如果某个自变量的容忍度小于0.1,则可能存在共线性问题。 方差膨胀因子(Variance inflation factor, VIF): 由Marquardt于1960年提出,实际上就是容忍度的倒数。
特征根(Eigenvalue):该方法实际上就是对自变量进行主成分分析,如果相当多维度的特征根等于0,则可能有比较严重的共线性。 条件指数(Condition Idex):由Stewart等提出,当某些维度的该指标数值大于30时,则能存在共线性。 多重共线性的对策: 增大样本量,可部分的解决共线性问题 采用多种自变量筛选方法相结合的方式,建立一个最优的逐步回归方程。 从专业的角度加以判断,人为的去除在专业上比较次要的,或者缺失值比较多,测量误差比较大的共线性因子。 进行主成分分析,用提取的因子代替原变量进行回归分析。 进行岭回归分析,它可以有效的解决多重共线性问题。 进行通径分析(Path Analysis),它可以对应自变量间的关系加以精细的刻画。Spss可以进行比较基本的通径分析,但复杂的模型需要使用SPSS公司的另外一个软件AMOS来进行。

转载请注明:数据分析 » 怎么检验是否存在多重共线性_多重共线性检验

喜欢 (8)or分享 (0)