数据分析技术:中介效应及其检验方法介绍
介绍的是结构方程模型中比较重要的一项内容:中介效应,以及中介效应能够用哪些方法进行检验。
中介效应
通俗解释,中介效应是指某个(某些)变量在另两个(两组)变量间扮演了中间人的角色,也就是社会上说的掮客。当然,这里的变量可以是测量变量,也可以是测量模型,如下图所示,如果是测量变量,那么该模型就是一个路径分析模型;如果是一个测量模型,那么就是结构方程模型。
如上图所示,在A变量和C变量之间,存在B变量,只要A到B的路径,以及B到C的路径同时都是通畅的(A对B有显著性影响,同时B对C有显著性影响),那么就可以说在A变量和C变量之间存在由B变量引起的中介效应。当然,根据A变量和C变量之间的直接路径是否通顺,中介效应又细分为完全中介效应和部分中介效应。
生活中,中介效应的例子有很多。例如,有时吃中药需要用到药引,如果没有药引,患者直接吃药是没有效果的,而有了药引以后,中药就能发挥作用,药引在中药和患者之间其实就是一个中间人角色,而且这种中介效应是一种完全中介效应。再举一个部分中介效应的例子,过去没有外卖平台的时候,快餐店与消费者之间都是直接交易的,现在有了这些互联网中介,快餐店与消费者之间又建立了一条沟通路径,快餐店和消费者之间的这种中介效应就是部分中介效应。
检验中介效应是否存在,其实就是检验A到B,B到C的路径是否同时具有有显著性意义。为了讲解更有效率,我们以最简单的模型为例,进行说明,如下如所示,图中路径上的符号代表路径系数(回归系数)。
做中介效应检验的方法目前有四种:逐步回归法;系数乘积检验法;差异系数检验法和Bootstrapping。严格意义上来说,它们的分析原理都是一致的,检验W2和W3路径是否同时有意义(通畅),区别在于判断有意义的标准严谨度不同。
逐步回归法
分别检验W1,W2,W3和W1-1是否有显著,如果W2和W3同时有意义,那么中介效应存在;如果W1也有意义,那么就是部分中介,否则就是完全中介。部分中介存在的缺陷容易出现假阳性,因为W2的置信度为95%,而W3的置信度也是95%,如果不加以控制,判断A和B之间存在中介效应的置信度将会降低为95%的平方,也就是90.25%,也就意味着这个结论的可靠性降低了。逐步回归法直接用SPSS的回归功能就能完成。
系数乘积检验法(Sobel检验)
鉴于逐步回归法的缺陷,很多研究者创造了修正的方法,系数乘积检验法就是其中一种。系数乘积检验法的原理是将W2和W3综合考虑,也就是考虑W2*W3是否有意义,这样就避免了分别检验W2和W3造成的置信度降低问题。Sobel检验也存在缺陷,那就是要求W2*W3服从正态分布,但是这一点是很难保证的,即使是W2和W3服从正态分布,W2*W3也不一定服从正态分布。Sobel检验可以使用SPSS中的Process插件来完成。
差异系数检验法
差异系数检验法检验的是(W1-W1-1)是否有意义,因为通常情况下,W2*W3=(W1-W1-1),因此,乘积系数法和差异系数法的检验效力是基本上相同的,区别在于两者的标准误不同。经过很多研究者的对比,乘积系数法和差异系数法都比逐步回归法的检验结果更为准确。
Bootstrapping法
跟着草堂君学习了统计基础部分内容的朋友应该知道,大多数假设检验用到的标准误都是做无偏估计或有偏估计得来的,也就是说,检验用的标准误都是伪标准误(估计值),要使估计值准确,需要服从很多的假设条件(例如上面说到的正态分布),系数乘积检验法和差异系数检验法的标准误都是如此。
有些可惜的是,很多数据无法完全满足标准误估计的假设条件,这样Bootstrapping就应运而生了。这种方法是根据标准误的理论概念,将样本容量很大的样本当作总体,进行有放回抽样(抽样次数可以自己定),从而得到更为准确的标准误。
总结一下
上面介绍了4种中介效应的检验方法,其实它们的检验原理都是一样的,区别在于显著性(置信度)水平的校正方式不同,显而易见,后面三种的检验结果优于第一种逐步回归结果,但是草堂君需要告诉大家,校正不是万能的,即使是最优的Bootstrapping方法,因为它们都有前提假设条件,如果不满意这些假设条件,结论可想而知不会准确,因此想要得到准确的模型结果,还是要收集到具有代表性的样本数据,这个才是根本。
转载请注明:数据分析 » 数据分析技术:中介效应及其检验方法介绍