管理实证研究中统计控制滥用的分析与改进_因变量论文

管理实证研究中的统计控制误用分析及改进，本文主要内容关键词为：实证研究论文，此文献不代表本站观点，内容供学术参考，文章仅供参考阅读下载。

0 引言

在实证研究的研究设计中纳入控制变量，并在统计分析时对其进行统计控制已经成为管理研究中的一种惯例而被广为接受。Atinc等人的数据分析显示，在发表于2005-2009年之间的管理类四个主流期刊的1200篇文章中，有813篇文章使用了控制变量，所占比例高达67.7%[1]。并且，在使用问卷调查的管理研究中，使用分层回归分析的方法，将控制变量先放入第一层已经成为一种标准做法[2]。在理论分析中，控制变量经常被称为“混淆变量”或“干扰变量”[1]，其会与研究所关注的自变量和因变量产生共变，从而扭曲自变量与因变量之间的关系，使其不能对两者之间的关系做出有效推断[3]。研究人员认为，在对自变量与因变量之间的关系进行统计分析时加入控制变量，并采用分层回归分析的方法将其放入第一层可以“净化”控制变量的混淆效应，达到统计控制的目的，从而可以对自变量与因变量之间的关系进行更精准的估计。

然而，近年来的一些研究显示，未经审慎的思考而盲目的使用控制变量可能会导致自变量和因变量之间的概念关系模糊不清，对统计结果进行不恰当的解释，从而做出错误的统计推断和研究结论[1-7]。Carlson和Wu(2012)指出[4]，统计控制可以用于不同的研究目的，而统计控制中经常使用的分层回归分析并不是一把“万能钥匙”，只能使用在有限的场合，需要审慎使用。Breaugh(2008)和Becker(2005)通过对文献内容分析发现[5，7]，研究人员很少清晰地汇报其为何采用控制变量以及控制变量的采用是否达到了预期目的。Newcombe(2003)以及Breaugh和Arnold(2007)指出[8-9]，在对控制变量进行统计控制的同时，也会排除一部分自变量与因变量间的共同变异，从而减少自变量对因变量的统计效应。

尽管统计控制存在上述问题，但在研究实践中控制变量还是未经审慎的大量使用[5]，这可能是因为很多研究人员对统计控制对分析结果的影响以及假设检验所产生的偏差尚未有充分的理解，甚至存在某些程度的误解。这种不解或误解很大程度上是由实证研究的一个重要过程——理论构念的操作化造成的：管理的实证研究经常处理的是不可观测的构念与构念之间的关系，为了对他们之间的关系进行检验，就需要为理论构念设置可观测的测量指标。而根据控制变量是影响测量指标还是理论构念，在统计控制上会产生不同的后果，从而使得统计控制具有不一样的理论意义。本文认为，当控制变量与理论构念相关时，通常所采用的统计控制策略——分层回归分析可能会产生理论检验偏差的问题；而当控制变量与测量指标相关时，则通常会产生构念效度的问题。

有鉴于此，对控制变量对统计推断的影响进行系统论证，分别分析控制变量与测量指标或理论构念相关情况下的具体分析策略，指出分层回归分析的不足，并提出相应的改进建议，对于当前我国管理学界实证研究的规范化具有重要的指导意义。

1 控制变量、理论构念与测量指标概念分析

1.1 控制变量

管理研究是对未被解释的管理现象之间的关系进行探索的过程，在这里通常将一个现象称为自变量(或前因变量)，另一个现象称为因变量(或后果变量)，并探究自变量对因变量的影响。然而，经常会有第三个变量也对研究关注的因变量有影响，与其产生共变关系，使得我们对自变量与因变量之间的关系不能做出因果推断[5]，这个变量就被称为控制变量(或混淆变量)。在形式上，一个控制变量既可以是感知型的也可以是非感知型的[1]，感知型的控制变量需要调查对象对其进行评价和判断，如人格特质等；而非感知型的控制变量就是一些人口统计学特征，如年龄、性别等，在回归分析中，通常将这类变量转换成虚拟变量来处理。

为了消除控制变量的影响，就需要在研究设计时对其加以考虑和控制。研究人员通常采用两种方式对控制变量进行控制，一种是实验设计，即研究人员通过操纵实验对象或随机分配实验对象使得其除了自变量之外在其余所有方面均保持一致；另一种是统计控制，即研究人员在事后通过将控制变量纳入多元回归分析来消除它的影响。在管理研究中，统计控制是比较常用的方式，其依据的是“净化原则”，目的是获得自变量对因变量的纯粹效应[2]。

具体来讲，使用多元回归分析的方法来对混淆变量进行统计控制，是通过计算自变量与因变量之间的半偏相关系数来实现的。分层回归中，通常将控制变量先放入第一层，然后加入自变量，通过看

的增加量(Δ

)是否显著来判断自变量是否对因变量具有显著影响。实际上，计算半偏相关系数和计算

增加量是一个意思，因为半偏相关系数的平方值就等于

增加量[10]。这在数学上可以表示为：

式中：Y是因变量；X是自变量；W表示控制变量。

如果

，这意味着在考虑控制变量W的情况下，Y总变异中的21.1%可以由X来独自解释。

1.2 理论构念与测量指标

在管理研究中，研究人员需要用学术化的语言去抽象、概括所要研究的现象，并把这种理论构念进一步的操作化，使之变成可以量化的指标[11]。管理研究中的绝大多数构念是不可直接观测的，如组织公民行为、工作满意度、家长式领导等。Nunnally和Bernstein(1994)认为，构念是一种变量，“是抽象的、潜在的，而非具体的、可观测的”[12]。一个构念通常具有以下几个特征：(1)构念是研究人员为了建构理论而构造出来的；(2)构念是抽象的，不可直接观测的；(3)构念是与理论和模型相联系的；(4)构念应该是清晰而明确的[13]。

因为理论构念是不可直接观测的，所以就需要根据对这些构念的理解和定义，选择恰当的测量指标，使其显性化、具体化。在管理研究中，根据测量指标与理论构念之间关系的不同，可以将测量指标分为两种类型：反映型指标和构成型指标[14]。

(1)反映型指标。反映型指标被认为是理论构念的外在表现形式，同一构念的一组反映型指标之间的共同变异可以由构念的变异来解释。这种指标下的测量模型可以用图1中模型A来表示，根据古典测量模型，反映型指标与理论构念之间的关系可以表示为：

式中：

表示第i个测量指标的观测值，i=1，2，3；θ表示理论构念的真实值；

表示第i个测量指标的随机误差。

在图1的测量模型A中，箭头的方向是由构念指向测量指标，意味着构念可以解释观测指标的变异；同时，由于

三个观测指标都反映的是同一个理论构念，所以它们之间应该高度相关，具有很好的内部一致性；而且，每一个测量指标都反映了理论构念的全部内涵，因此测量指标之间是可互换的，这也就意味着去掉其中一两个测量指标并不会改变构念的意义；最后，此测量模型下的误差项是与测量指标项相关联的，与理论构念无关。

(2)构成型指标。与反映型指标不同，构成型指标是指测量指标说明了理论构念的不同方面，构念的意义存在于对这些指标的整合基础之上[15]。构念的变异要由所有指标的变异来解释。图1中的模型B展示了构成型测量模型，在这种模型下，一个构念与它的构成型指标之间的关系可以表示为：

式中：η表示理论构念的真实值；

表示第i个测量指标的观测值，i=1，2，3；

表示第i个测量指标影响理论构念的权重；D表示随机干扰项。

在图1的测量模型B中，箭头的方向是由测量指标指向理论构念的，说明这些指标通过一定的组合方式，作为一个整体共同决定了构念的意义。这也意味着，模型本身并不要求测量指标之间具有关联性，实际上这些指标最好是完全不相关的(由式(2)可知，若指标之间的关联性过高就会产生类似于回归分析中的多重共线性问题，导致无法有效识别每个指标的独特效应)。因此，指标之间是不具备互换性的，去掉任何一个指标都会导致构念测量的不完整。此外，构成型测量模型的误差项是表现在构念层次上的，而非测量指标上，因为构成型测量模型假定测量指标是没有测量误差的，而误差项代表的是构念不能被测量指标完全表示的部分。

图1 反映型与构成型测量模型

2 统计控制误用对统计推断的影响分析

在分析了控制变量、理论构念、反映型指标和构成型指标的概念之后，下面将分别就控制变量与理论构念和测量指标相关联的情况下，所可能产生的统计控制误用的情况进行介绍，分析其对统计推断的影响，并给出相应的应对策略。

2.1 控制变量与理论构念相关联情况下的分析

研究中考虑的控制变量与因变量和自变量相关是管理实证研究中经常遇到的情形，并且控制变量与因变量和自变量相关也是在研究设计和统计分析中纳入控制变量最常见的理由[1]。这种情况可以用图2来表示。

图2 控制变量与自变量和因变量相关情况下的模型

在图2中，控制变量(W)用矩形表示，以示其为可观测的显变量。从理论上讲，控制变量既可能是显变量也可能是潜变量，不过管理研究中通常采用一些人口统计学变量作为控制变量，如年龄、公司规模等。这些人口统计学变量都是显变量，所以本文将控制变量暂设定为显变量，以便于展示、分析，实际上控制变量的属性并不影响本文的分析。

通常的分层回归分析的处理方式是：(1)将

的平均值作为自变量的观测值；(2)将

的平均值作为因变量的观测值；(3)在统计软件中先放入控制变量作为第一层，然后放入自变量作为第二层，进行分析；(4)分析放入自变量后的

增加量是否显著，若显著，则说明自变量对因变量的影响关系显著。

然而，

增加量并不是自变量对因变量变异的全部解释比例，而是其独特解释比例。这可以通过图3的韦恩图来解释。在图3中，标示Y的圆表示因变量，标示X的圆表示自变量，标示W的圆表示控制变量。因变量的总变异为a+b+c+e，自变量与因变量的共同变异为a+b，控制变量与因变量的共同变异为b+c。可以看到，控制变量、自变量与因变量之间有一个共同的部分——b，这表示3个变量之间的共同变异。

图3 变量关系韦恩图

那么，(a+b)/(a+b+c+e)就表示因变量的变异可以被自变量解释的比例，其值等于两个变量之间的简单相关系数的平方

；而a/(a+b+c+e)就表示在考虑控制变量W的情况下，因变量的变异可以被自变量所独自解释的比例，其值为自变量与因变量之间偏相关系数的平方

，等同于

增加量。这样，在分层回归中使用R[2]增加量来判断自变量对因变量影响的显著性就会出现问题，因为由于自变量和控制变量之间的相关性，在用分层回归移除控制变量对因变量的影响的同时，也移除了一部分自变量的变异，使得自变量对因变量变异的解释比例下降，并且下降程度随着自变量和因变量之间的相关系数的增大而增加。当自变量与控制变量之间相关性非常高时，就会使得a变得很小，最终使得△

变得统计不显著。于是在统计推断上就会犯第二类错误，接受本来错误的原假设，认为自变量对因变量的影响不显著。

这种关系同时可以用数学公式来说明，表示为：

从式(4)可以看出，当自变量与控制变量之间完全不相关(

)时，自变量的半偏相关系数就等于其简单相关系数(

)。意味着移除控制变量并不会减少自变量对因变量变异的解释比例，

增加量就等于两个变量之间的简单相关系数的平方

，即为因变量的变异可以被自变量解释的全部比例。但随着

就会减小。举例来说，假定自变量与因变量之间的简单相关系数为0.6，控制变量与因变量之间的简单相关系数为0.5，自变量与控制变量之间的相关系数为0.3，那么自变量就可以解释因变量变异的36%(0.6×0.6)，根据式(4)计算出

为0.472，则在控制W的情况下，自变量对因变量的解释比例变为22%。但当自变量与控制变量之间的相关系数变为0.6时，

为0.375，自变量对因变量的独自解释比例下降为14%。

从以上分析可以得出三点结论：(1)自变量对因变量变异的总解释比例为两者之间的简单相关系数平方

；(2)分层回归中使用的

增加量仅表示在控制W的情况下，自变量对因变量的独自解释比例；(3)若自变量与控制变量相关，则会使得△

小于

，并且其相关系数越大，缩减幅度就越大。

此外，从假设检验的角度来考虑，分层回归中所使用的

增加量所检验的假设并不是我们经常所设定的“自变量对因变量有显著影响”；而是“在控制W的情况下，自变量仍能对因变量提供额外解释”，这时，所检验的其实是自变量对因变量的增加效度[16]。

因此，当原假设是“自变量对因变量有显著影响”时，仅需要对自变量和因变量做简单回归分析，并根据

是否显著来判断原假设是否为真；当原假设是“在控制W的情况下，自变量仍能对因变量提供额外解释”时，就需要使用分层回归分析，先放入控制变量W作为第一层，再放入自变量X作为第二层，最后依据

增加量是否显著来判断原假设是否为真。

从以上分析可以看出，当使用分层回归时，这种统计分析策略与本文提出的研究假设通常是不一致的，使用分层回归分析将控制变量放在第一层反而弱化了自变量与因变量之间的关系，未能如实反映自变量对因变量的影响。

2.2 控制变量与测量指标相关联情况下的分析

尽管控制变量与因变量和自变量相关是研究中最常提及的使用统计控制策略的原因，但控制变量的使用还有另一种情况，就是其与测量指标相关，会污染测量指标的精准观测。这种情况下，控制变量与理论构念之间是无关的，其影响的仅是观测值的准确性，使得观测值不能精准的表示理论构念，即这是一个构念效度的问题。

举例来讲，要研究领导成员交换对下属组织公民行为的影响，因为这两个构念都是不可直接观测的，于是分别设置了三个测量指标，在对测量指标进行自评打分的过程中，一个自我效能感低的下属可能会低估自己在指标上的评分，而自我效能感高的下属可能会高估自己在指标上的评分。在这种情况下，自我效能感就作为控制变量，干扰了测量指标的精准观测。下面分别就测量指标是反映型指标和构成型指标的情况进行分析。

(1)反映型指标下的分析。控制变量污染反映型测量指标观测的情况可以用图4表示。图4A表示控制变量同时影响自变量和因变量的观测；图4B和图4C表示控制变量只影响自变量或因变量的观测，下面以图4A为例进行说明。

图4 控制变量对反映型测量指标的影响模型

在图4A中，箭头的方向是由理论构念和控制变量同时指向测量指标，意味着理论构念和控制变量同时影响着指标的观测值。根据古典测量理论，自变量的测量指标可以表示为：

式中：

表示自变量的第i个测量指标的观测值，i=1，2，3；θ表示自变量的真实值；

表示自变量的第i个测量指标的随机误差；W表示控制变量的值；

表示控制变量对自变量的第i个测量指标的影响系数；θ、

和W之间不相关。

同理，因变量的测量指标可以表示为：

式中：

表示因变量的第i个测量指标的观测值，i=1，2，3；η表示因变量的真实值；

表示因变量的第i个测量指标的随机误差；W表示控制变量的值；

表示控制变量对自变量的第i个测量指标的影响系数；η、

和W之间不相关。

这样，由于受控制变量的影响，测量指标的实际观测值不等于构念的真实值加上随机误差，于是测量过程中就产生了“构念效度”的问题。采用指标观测值计算得到的自变量与因变量之间的相关系数，并不等于构念之间的真实相关系数，这降低了假设检验的统计效力。

在这种情况下，要将控制变量对观测指标的影响剔除，从而获得理论构念的“纯净”观测值，即

。其具体操作步骤为：(1)做观测指标对控制变量的回归，得到控制变量对测量指标的预测值

；(2)用指标的观测值减去控制变量的预测值，得到观测指标去除控制变量影响后的残值

，残值与控制变量无关，二者的均值分别为构念的“纯净”观测值；(3)用残值

的均值来做自变量和因变量的回归，其回归系数就是两个构念之间的“纯净”相关系数，

即自变量对因变量变异的“纯净”解释度。

在图4B中，控制变量只污染自变量的测量，此时只需要对

做回归即可；在图4C中，控制变量只污染因变量的测量，此时只需要对

做回归即可。

从以上分析可以看出，在控制变量影响反映型测量指标观测的情况下，采用去除控制变量影响后的残值才能正确的衡量构念的真实值，以保证构念效度，而分层回归的统计控制策略此时是不适用的。

(2)构成型指标下的分析。控制变量污染构成型测量指标观测的情况，可以用图5为例来说明。与图4有所不同的是，控制变量只污染自变量的某一个测量指标的观测，而不是所有。这是因为，构成型指标分别说明的是理论构念的不同方面，他们之间通常相关性不高，所以一个控制变量通常只污染一个测量指标的观测。

图5 控制变量对构成型测量指标的影响模型

在图5中，箭头的方向是有控制变量指向测量指标，并且由测量指标指向理论构念，并且测量指标不存在误差项。根据古典测量理论，测量指标

可以表示为：

式中：

表示自变量的第二个测量指标的观测值；

表示自变量的第二个测量指标的真实值；W表示控制变量的值；r表示控制变量对自变量的第二个测量指标的影响系数；

和W不相关。

与反映型指标类似，控制变量通过污染某一个构成型指标，最终影响了理论构念值的估计。其处理情况也与上文一致，通过计算残值将控制变量对

的污染剔除出去，获得其“纯净”观测值。其具体操作步骤为：(1)做

对控制变量的回归，得到控制变量对

的预测值；(2)用

的观测值减去上述预测值，得到的就是去除控制变量影响后的残值，也就是

的真实值

；(3)将

进行加权得到自变量“纯净”值。

以上只以自变量的某一个构成指标为例，说明控制变量影响构成型观测指标时的情形，并给出了相应的处理策略，当控制变量影响因变量的观测指标或者同时影响二者的观测时，可以采用同样的逻辑进行处理。

当然，还有更复杂的情况就是，自变量的测量指标是反映型，因变量的测量指标是构成型。在这种情况下，采用上文的策略获得自变量的“纯净”观测值，再用本节的策略获得因变量的“纯净”观测值，对两者进行回归，就可以对自变量与因变量之间的影响关系进行统计推断。

3 结论

虽然控制变量的使用已成为目前管理实证研究的普遍现象，但研究人员对控制变量的重视并未达到和自变量与因变量相当的程度，对控制变量的使用和分析也并未进行足够深入地分析。本研究质疑了这种常态做法，并进行理论分析指出，统计控制虽然希望达到和实验控制等同的效果，但因为管理研究中控制变量经常与自变量相关，所以在使用统计控制策略将控制变量对因变量的影响排除的同时，也移除了一部分自变量对因变量的效应，使得最终得到的自变量对因变量的解释度小于其真实解释度，并且这种削减幅度随着自变量与控制变量之间相关系数的增大而增强。

当控制变量与理论构念相关时，进行统计控制并不会得到自变量与因变量之间关系更精准的估计，分层回归分析得到的仅是在考虑控制变量的情况下，自变量对因变量的增加效度。

同时，本文也分析了控制变量分别与反映型测量指标和构成型测量指标相关时的统计控制策略。当控制变量污染测量指标的观测时，经过统计控制会净化控制变量的不良影响，其方法为计算剔除控制变量影响后的残值，分层回归分析在此时并不适用。

因此，我国学者在进行管理实证研究时，需要特别注意控制变量的使用和分析，只有这样才能得出科学、合理、可信的理论结果。

本文虽然只讨论了存在一个控制变量的情况，实际上当存在多个控制变量时，其分析逻辑是一致的，并不影响本文分析的有效性，研究所提出的统计建议一并适用。

标签：因变量论文; 自变量论文; 控制变量论文; 回归模型论文; 统计模型论文; 相关性分析论文; 解释变量论文; 测量理论论文; 统计学论文;

管理实证研究中统计控制滥用的分析与改进_因变量论文

猜你喜欢