数据分析技术：中介效应及其检验方法介绍

介绍的是结构方程模型中比较重要的一项内容：中介效应，以及中介效应能够用哪些方法进行检验。

中介效应

通俗解释，中介效应是指某个（某些）变量在另两个（两组）变量间扮演了中间人的角色，也就是社会上说的掮客。当然，这里的变量可以是测量变量，也可以是测量模型，如下图所示，如果是测量变量，那么该模型就是一个路径分析模型；如果是一个测量模型，那么就是结构方程模型。

如上图所示，在A变量和C变量之间，存在B变量，只要A到B的路径，以及B到C的路径同时都是通畅的（A对B有显著性影响，同时B对C有显著性影响），那么就可以说在A变量和C变量之间存在由B变量引起的中介效应。当然，根据A变量和C变量之间的直接路径是否通顺，中介效应又细分为完全中介效应和部分中介效应。

生活中，中介效应的例子有很多。例如，有时吃中药需要用到药引，如果没有药引，患者直接吃药是没有效果的，而有了药引以后，中药就能发挥作用，药引在中药和患者之间其实就是一个中间人角色，而且这种中介效应是一种完全中介效应。再举一个部分中介效应的例子，过去没有外卖平台的时候，快餐店与消费者之间都是直接交易的，现在有了这些互联网中介，快餐店与消费者之间又建立了一条沟通路径，快餐店和消费者之间的这种中介效应就是部分中介效应。

中介效应检验方法

检验中介效应是否存在，其实就是检验A到B，B到C的路径是否同时具有有显著性意义。为了讲解更有效率，我们以最简单的模型为例，进行说明，如下如所示，图中路径上的符号代表路径系数（回归系数）。

做中介效应检验的方法目前有四种：逐步回归法；系数乘积检验法；差异系数检验法和Bootstrapping。严格意义上来说，它们的分析原理都是一致的，检验W2和W3路径是否同时有意义（通畅），区别在于判断有意义的标准严谨度不同。

逐步回归法

分别检验W1，W2，W3和W1-1是否有显著，如果W2和W3同时有意义，那么中介效应存在；如果W1也有意义，那么就是部分中介，否则就是完全中介。部分中介存在的缺陷容易出现假阳性，因为W2的置信度为95%，而W3的置信度也是95%，如果不加以控制，判断A和B之间存在中介效应的置信度将会降低为95%的平方，也就是90.25%，也就意味着这个结论的可靠性降低了。逐步回归法直接用SPSS的回归功能就能完成。

系数乘积检验法（Sobel检验）

鉴于逐步回归法的缺陷，很多研究者创造了修正的方法，系数乘积检验法就是其中一种。系数乘积检验法的原理是将W2和W3综合考虑，也就是考虑W2*W3是否有意义，这样就避免了分别检验W2和W3造成的置信度降低问题。Sobel检验也存在缺陷，那就是要求W2*W3服从正态分布，但是这一点是很难保证的，即使是W2和W3服从正态分布，W2*W3也不一定服从正态分布。Sobel检验可以使用SPSS中的Process插件来完成。

差异系数检验法

差异系数检验法检验的是(W1-W1-1)是否有意义，因为通常情况下，W2*W3=(W1-W1-1)，因此，乘积系数法和差异系数法的检验效力是基本上相同的，区别在于两者的标准误不同。经过很多研究者的对比，乘积系数法和差异系数法都比逐步回归法的检验结果更为准确。

Bootstrapping法

跟着草堂君学习了统计基础部分内容的朋友应该知道，大多数假设检验用到的标准误都是做无偏估计或有偏估计得来的，也就是说，检验用的标准误都是伪标准误（估计值），要使估计值准确，需要服从很多的假设条件（例如上面说到的正态分布），系数乘积检验法和差异系数检验法的标准误都是如此。

有些可惜的是，很多数据无法完全满足标准误估计的假设条件，这样Bootstrapping就应运而生了。这种方法是根据标准误的理论概念，将样本容量很大的样本当作总体，进行有放回抽样（抽样次数可以自己定），从而得到更为准确的标准误。

总结一下

上面介绍了4种中介效应的检验方法，其实它们的检验原理都是一样的，区别在于显著性（置信度）水平的校正方式不同，显而易见，后面三种的检验结果优于第一种逐步回归结果，但是草堂君需要告诉大家，校正不是万能的，即使是最优的Bootstrapping方法，因为它们都有前提假设条件，如果不满意这些假设条件，结论可想而知不会准确，因此想要得到准确的模型结果，还是要收集到具有代表性的样本数据，这个才是根本。

转载请注明：数据分析 » 数据分析技术：中介效应及其检验方法介绍