二次响应曲面回归方法及其在个体环境匹配研究中的应用_响应面论文

二次响应面回归方法及其在个体-环境匹配研究中的使用,本文主要内容关键词为:个体论文,环境论文,方法论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

分类号 B841

1 引言

二次多项式回归(quadratic polynomial regression)与响应面分析(response surface analysis; Box & Draper,1987)相结合的研究方法范式(在此叫做二次响应面回归方法),近年来在工 业与组织心理学中得到了较为广泛的应用(Bashshur,Hernāndez,& Gonzālez-Romā,2011; Gentry,Hannum,Ekelund,& Jong,2007; Gentry,Yip,& Hannum,2010; Ostroff,Atwater,& Feinberg,2004)。其应用起源于并主要集中于个体-环境匹配(person-environment fit,简称P-E)研究。P-E匹配通常是指个体与其工作环境的一致性或相容性程度(Kristof-Brown,Zimmerman,& Johnson,2005)。行为交互理论(Sekiguchi,2004)认为,个体或团队态度、行为等变化的原因不能简单归因为个体或者环境因素,而是应当归因于二者相互作用共同产生的效应(Caplan & van Harrison,1993; Kristof-Brown & Guay,2009)。P-E匹配包含着很宽泛的具体研究领域,如个体-职业匹配,个体-组织匹配,个体-工作匹配,个体-群体匹配,个体-上级匹配等,不同的匹配之间还会存在着相互关联与层级嵌套关系,比如群体嵌套于组织(Schneider,2001),从而构成了复杂的人与环境的匹配关系(Kristof,1996)。

研究者基于不同的理论视角,往往采用不同的P-E匹配测量策略。纵观以往P-E匹配数据的获得方式,可以分为两种测量方法:一种是直接的匹配测量,它要求被试(或他人)直接判断个体与环境的匹配程度(Resick,Baltes,& Shantz,2007)。该测量方法较为简单,但不能考察个体或环境的独立效应(Edwards,1991;缪自光,付继娟,2005;邱林,王雁飞,2009);另一种是间接的匹配测量(唐源鸿,卢谢峰,李柯,2010),它要求被试分别评价个体和环境的特征,然后比较二者评定分数的一致性或相似性程度。间接测量通常采用如下计算指标,如差异分数(difference scores)、轮廓相似性、Q分类法、乘积项指标等。然而,Edwards(1991),Edwards和Parry(1993)指出,这些间接匹配测量的统计策略在理论与方法学上存在着很多难以克服的问题,例如,差异分数会导致测量信度降低、个体与环境的效应相互混淆等(Edwards & Parry,1993)。二次响应面回归方法正是为了克服上述缺陷而发展起来的一项匹配测量与统计分析策略(Edwards & Parry,1993; Edwards,2002,2007)。

近年来,虽然二次响应面回归方法得到西方学者们的广泛关注与运用(Kristof-Brown,et al.,2005),但国内相关领域中则鲜有研究采用该范式,而且对二次响应面回归方法本身的关注也明显欠缺,因而限制了该方法在工业与组织心理学研究领域的应用。因此,文章在分析差异分数等间接匹配测量方法存在的固有缺陷的基础上,着重阐述了二次响应面回归分析在P-E匹配研究中的产生与发展、统计分析原理和方法,及其相对于其他统计分析技术的优势与不足,并以实例说明其分析操作步骤与研究结果的解释。

2 二次响应面回归方法的产生与发展

2.1 二次多项式回归在P-E匹配研究中的使用

如上所述,以往P-E匹配研究常使用差异分数把个体与环境的测量分数结合成一个单一指标(如算术差、绝对差或平方差),用来代表P-E的匹配程度。然而,用这些指标对结果变量进行预测,掩盖和限制了个体、环境本身对结果变量的预测作用(Edwards,2001)。例如,在算术差回归方程中,当两个测量指标同时大或同时小时,可能会得到相同的差异分数值,而实际上测量指标本身的高、低对结果变量通常具有不同的效应;又如,在平方差回归方程中(见方程1),忽略了两个测量指标乘积项以及测量指标本身(即方程中的一次项)对结果变量的作用,等等。二次多项式回归则克服了差异分数的这些缺陷与限制,允许对两个测量指标本身及其之间的各种关系进行直接的、未加限定的、全面的测量(Edwards,2008)。

下面以差异分数的平方差回归方程为例,说明二次多项式回归方程对其的发展。如方程1所示,当b[,1]为负值时,表示Z(代表因变量)首先随着X(代表个体P)与Y(代表环境E)之间的差值的增加而增加,到了一定程度之后,又随着差值的增加而减小,而不管差值的方向如何(见图1-a)。但根据P-E匹配的理论可知(Kristof-Brown,et al.,2005; Edwards,1996),环境的供应(supplies)与个体的需求(needs)之间的不平衡关系对工作结果具有不同的影响。以工作压力为例,当组织的供应充足时(供大于求),个体的工作压力会减轻,而当组织的供应满足不了个人的需求时(供小于求),个体的工作压力则会加重,但由于方程1表示的是用两个指标的差值作为一个指标来对因变量进行预测,因而不允许探索这种不对称的关系。

图1 方程1(a),方程2(b)与方程3(c)所生成的函数图(引自Edwards,2002)

为了克服此缺陷,Edwards(1993)指出可以把方程1展开,进而得到方程2,从而可以对X和Y的单独效应,以及乘积项的影响进行探讨。但从方程2可以看出,展开的平方差回归方程限制平方项的回归系数相等,同时乘积项XY的回归系数是平方项的两倍但符号相反。表明虽其已经包含交互项,但没有考虑低阶一次项(如图1-b示例生成的对称图形)。对方程2进一步扩展(包括低阶一次项)和放松限制(允许各个路径的系数自由估计),可得到方程3。从方程3可见,差异分数平方差回归方程只是限定了X、Y的回归系数为0,与Y[2]的回归系数相等,、XY与的回归系数总和为0,但在实际应用中这些限定常常被违背。因此,Edwards和Parry(1993),Edwards(2002,2007)认为差异分数只是二次多项式回归的一个特例,而二次多项式回归是差异分数和其他指标的延伸与概括化。

2.2 二次多项式回归与响应面分析的结合

二次多项式回归经常会产生一些难以解释的回归系数,如二次项或乘积项。响应面分析被用作一种数理统计技术,根据未加任何限定的二次多项式回归方程得到的回归系数,能够绘制出各种形状的三维图形(如图1-c),并可以在三维平面上对回归系数所代表的X、Y与Z的各种关系进行解释。从图1-a和图1-c的对比发现,差异分数把研究定位于二维空间,而二次多项式回归利用响应面技术把研究扩展到了三维空间。

响应面技术有三个关键特征指标:第一个指标为固定点(stationary point),被定义为三维平面上的某个点,其沿着所有方向的斜率均为0。固定点在X-Y平面上(如图1-c的坐标点P)的计算公式如下:

(4)

(5)

第二个指标为主轴(principle axes),用于描述响应面在X-Y平面上的方向。主轴分为第一主轴(如图1-c的蓝色实线)和第二主轴(如图1-c的蓝色虚线),且相互垂直并在固定点位置相交。根据主轴可以对响应面的形状进行判断,例如,对于一个凸面(convex surface),沿着第一主轴向上的曲率(curvature)最大,而沿着第二主轴最小;对于一个凹面(concave surface),沿着第一主轴向下的曲率最小,而沿着第二主轴最大。另外,根据响应面落在X-Y平面上的阴影线条也可以辅助进行判断。方程6-8代表第一主轴的计算公式:方程9-11代表第二主轴的计算公式:

第三个指标是感兴趣目标线上的斜率与曲率。如一致性线(congruence)是指在X-Y平面上,两个测量指标值相等且方向相同(X=Y;如图1-b连结最近端和最远端两点的虚线);不一致性线(dis-congruence)是指在X-Y平面上,两个测量指标值相等但方向相反(X=-Y;如图1-c连结最左边和最右边两点的虚线)。把X=Y和X=-Y代入方程3,从而产生了一致性线(方程12)与不一致性线(方程13)的计算公式:

2.3 二次响应面回归方法的逻辑思想

二次响应面分析根据二次多项式回归所取得的回归系数绘制出一个可视性更强的三维图像,这便是二次响应面回归分析的逻辑思想。如图1-c所示,将X与Y所组成的平面作为地板,Z作为垂直轴,从而X、Y与Z的关系构成了一个三维曲面,此图的所有关键特征指标及其曲面形状,均可从落在X-Y平面的位置及其形状进行判断。根据图形能够直观地理解二次多项式回归所取得的关系结果,从而找到X-Y的最佳匹配状态,并可以深入挖掘与诠释X、Y与Z之间更复杂的关系。

3 二次响应面回归方法的统计分析

3.1 应用前提条件

二次响应面回归方法有如下一些前提条件必须满足:第一,两个匹配的测量指标只能作为预测变量,而且必须是概念同构的,即他们必须测量同一种理论概念,从而使得到的任意形式匹配情况的解释都具有意义。例如,Bashshur等(2011)关于组织支持氛围对团队绩效影响的研究中,组织支持氛围是理论上界定的影响团队绩效的因素,那么来自员工和领导双方的被测量的预测变量必须是组织支持氛围。由于测量源于相同的理论构念,所以二者评定的组织支持氛围之间的一致性或偏差程度对团队绩效的影响是有意义的和可解释的。

第二,两个匹配的测量指标要用相同量尺的量表来测量(Edwards,2002; Shanock,Baran,Gentry,Pattison,& Heggestad,2010)。为了避免多重共线性,在分析之前需要对预测变量做中心化处理。以往研究常采用标准分数的方法,可以把不同等级的原始值转换到相同尺度上(Harris,Anseel,& Lievens,2008)。但Edawrds(1993,2002)建议此研究范式最好采用量表的中间等级作为中心点,从而使得对回归系数的解释更加容易理解。例如,这样可使响应面上的斜率或曲率代表的是X与Y平面中心点位置的斜率或曲率,同时当两个预测变量的值为中间等级时,代表响应面的期望高度(Cohen,Nahum-Shani,& Doveh,2010)。

第三,需要满足所有多元回归分析的假设。多项式回归是基于传统的回归分析模式进行的,所以也必须符合多元回归分析的前提假设。

3.2 统计分析原理与方法

二次响应面回归的统计分析原理是基于典型的多元回归的思想,利用分层回归的分析方法,并采用响应面技术对复杂的回归系数结果进行计算处理、检验与解释。如上所述,为了避免多重共线性,需要先把测量指标X、Y进行中心化处理,然后计算X、Y的平方项()与乘积项(XY)。之后,对二次多项式回归方程的分析方法如下:第一步,把X和Y放入回归方程,用来检验他们与Z的线性关系(模型1);第二步,把和XY放入方程,用来检验曲线关系与交互效应(模型2)。

如果模型2相对于模型1的具有显著增量意义,那么,需要进一步进行响应面分析。首先,制作三维响应面(有多种统计软件可完成此操作,如Matlab,SAS,Design-Expert,Excel等)并检验其特征。其次,对响应面进行解释。例如,个体、环境本身对结果变量的影响如何?个体与环境匹配与不匹配之间的差异如何?个体与环境不匹配的大小与方向对结果变量的影响如何?要完成上述这些目的需要计算X=Y线与X=-Y线上的斜率和曲率(即),并对其显著性进行检验。由于他们仅含有回归系数的线性结合,因而可采用传统线性模式的检验方法,即使用模型2中的非标准化回归系数、回归系数协方差以及标准误求联合标准误。其具体检验公式如表1所示。

3.3 实例演示

文章以实例数据演示为例(在此把自我评定的工作绩效与上级主管评定的工作绩效作为匹配变量,工作投入作为因变量,探讨自我-他人评定的工作绩效的一致性程度对工作投入的影响效应),说明用二次多项式回归与响应面方法来处理匹配研究的分析步骤,以及如何对结果进行解释等。另外,在此只对实例数据的分析过程与解释要点进行说明,而不对理论的正确性与否进行探讨。

第一步:提供匹配偏差的描述性统计。Shanock等(2010)认为在二次响应面回归分析之前,要先明确多少被试在两个预测变量之间存在差异以及差异的方向如何,即确定匹配一致、不一致以及两种不一致的方向(如自我评定的工作绩效大于或小于领导评定的工作绩效)各自所占的百分比与理论假设的是否相同。如果匹配不一致的数据很少,那么检验偏差大小与方向对结果变量的影响将受到质疑。具体操作方法为,把两个预测变量转换为标准分数,然后以一个预测变量高于或低于另一个预测变量半个标准差为划分依据(Fleenor,McCauley,& Brutus,1996)。如表2所示,此实例表明当自我与他人分别对工作绩效进行评定时,往往会出现不一致或偏差的情况(两种不一致情况共占74%)。

第二步:进行二次多项式回归分析。如表3中模型1所示,自我与他人评定的工作绩效均对工作投入具有显著预测作用(=0.56,p<0.01;=0.28,p<0.05)。模型2得到的二次多项式回归方程为Z=4.27+0.26X+0.70Y-0.02+0.46XY-0.35,检验结果显示其具有显著的增量意义(=0.046,p<0.01),因此,需要进一步进行响应面分析。

第三步:响应面分析及结果解释。在此,选用Excel制作图形,该制作方法操作简单且容易掌握(电子计算表格见附录)。如图2所示,响应面分析结果显示为凹面(或拱桥面)。同定点位于=-1.16,=-0.48;第一主轴方程为=0.11+0.51X,第二主轴方程为=2.26+1.95X。由于固定点、主轴上的斜率和曲率的计算公式含有乘积项和回归系数比率(如方程5、6、8、11等),所以与X=Y线与X=-Y线上的误差与显著性检验方法不同,即不能采用传统线性模式对标准误进行求解,只能采用Jackknife或bootstrap等非参数检验程序计算标准误(Edwards & Parry,1993)。然而,对于P-E匹配研究,一般主要关注X=Y线与X=-Y线(见表3)上的结果变化。对于固定点与主轴的结果解释,有兴趣的读者可参见Venkatesh和Goyal(2010)的分析。

图2 自评(X)-他评(Y)工作绩效匹配对工作投入(Z)的影响

另外,固定点的一项特殊作用在于可以估计预测变量在何种匹配条件下达到最好或最坏(Cohen,et al.,2010)。在此数据中,自我评定与他人评定的工作绩效的最佳组合坐标为(-1.16,-0.48)。

4 二次响应面回归方法的优势与不足

4.1 二次响应面回归方法的贡献

二次响应面回归分析为P-E匹配研究提供了一种完整的统计分析与解释框架,不仅多项式回归方程的二次系数可以被很好地解释,而且能够检验这些系数所构成的响应面的特征与形状;不仅限于只对代表的匹配关系进行测量,而不匹配关系造成的影响也可以进行检验。从而为P-E匹配研究相关的理论模型提供了更加强健的评估手段。

同时,二次响应面回归分析相对于传统的间接匹配测量方法具有更高的预测效度。Edwards和Parry(1993)用前人的研究数据进行了再次分析,发现未加任何限定的二次多项式回归方法可解释的方差变异数均大于差异分数方法;并且原来在差异分数分析中所限定相等的回归系数,在二次多项式回归中被证明是很难满足的。例如,French等(1982)采用差异分数方法发现实际和理想的工作量负荷与工作满意度呈对称关系。而Edwards和Parry(1993)采用多项式回归,发现实际和理想的工作量负荷与工作满意度的关系是非对称的。正如上面实例分析所示,在自我-他评工作绩效匹配或一致的情况下,当二者的评定均较高与均较低相比,个体的工作投入较高,但传统的差异分数分析却忽略了这种情况。

近些年,二次响应面回归分析的应用方法也有所突破。如在个体与团队环境的匹配关系中,由于团队环境变量指标一般是对团队内个体分数进行聚合而得到的,所以,有研究者把多项式回归与多层线性模型进行结合,从而使个体方差的分解更加科学(Jansen & Kristof-Brown,2005)。又如,一些研究者在个体与环境匹配和结果变量之外,加入其他调节变量,进行更复杂的关系探讨(Shaw & Gupta,2004; Hecht & Allen,2005)。

4.2 二次响应面回归方法的缺陷

虽然二次响应面回归方法为人们理解和预测员工在组织背景中的行为起到了重要作用,即说明行为是个体与环境共同作用的结果,而无论是个体还是环境特征都不足以单独解释行为。然而,二次响应面回归方法是一种间接测量策略,即将个体所具有的特征与对组织属性的评价进行比较,其是个人与环境知觉的认知比较的结果(邱林,王雁飞,2009)。这种过程基于主观比较的评定,但忽略了比较过程中P-E匹配程度的自我评价,Edwards,Cable,Williamson,Lambert和Shipp(2006)指出个体本身对他们是否与环境匹配的意见更多地以情感为基础,其对工作态度与行为的解释同样重要,而这种自我评价的匹配是基于直接测量方法。因此,不同的测量方法代表着不同的理论构念,他们都为P-E匹配理论与研究范式的发展做出了贡献。在实际研究中,要在理论背景和研究目的的基础上选择合适的研究方法验证假设。

而且,在此分析模式的框架内,P-E匹配指标只能做预测变量,但基于不同的研究目的,也经常被作为结果变量。如上面所提到的实例所示,自我-他评的工作绩效匹配被作为预测变量,考察其对个体工作投入的影响。但在绩效研究领域,研究者也试图探索影响自我-他评绩效一致性的因素,如工作性质、工作复杂性以及评价者的教育程度等(Heidemeier & Moser,2009)。

另外,文章所介绍的二次响应面回归方法是用一系列的统计检验判定响应面上各种目标线上的斜率与曲率的显著性,因而,这种反复检验会增大Ⅰ类统计错误(Edwards,2002,2007)。同时,虽然jackknife等非参数检验程序能够在一定程度上克服数据的共线性等缺陷,但jackknife程序也往往会出现标准误高估的现象。并且,二次响应面回归分析跟一般的回归分析应用面临同样的问题,即假设所测量的指标变量没有误差,而这与实际的测量情况也是不相符合的。Cheung(2009)试图用结构方程模型研究匹配关系,并提出潜变量一致性模型(latent congruence model)来克服测量误差的缺陷,然而,该模型限定高阶项的系数固定不变,从而把模型限定为只研究一次项的线性关系,但对P-E匹配常具有的曲线关系却不能探讨(Edwards,2009)。可见,虽然从差异分数到多项式回归代表了P-E匹配研究的方法进展,但将来的工作应该找到合适的方式把二次响应面回归分析与潜变量结构方程模型整合起来。

4.3 小结

总之,在研究P-E匹配过程中,二次响应面回归方法具有很多其他方法所不及的优势。从方法学视角看,二次多项式回归克服了差异分数、轮廓相似性等一致性指标的很多缺陷与限定;从理论视角看,二次多项式回归通过与响应面方法相结合,扩展了P-E匹配研究能够检验的假设范围,为P-E匹配研究的数据分析和假设检验提供了新的契机。诚然,二次响应面回归分析没有完全跳出传统的数理统计分析框架,但从现有的统计分析技术来看,二次响应面回归方法在P-E匹配或一致性研究领域仍具有很广阔的应用前景。

另外,文章限定从P-E匹配的角度对二次响应面回归方法进行介绍与说明,但实际上,这种研究框架已经应用于诸多研究领域。例如,在信息管理领域,考察信息系统的感知有用性与实际有用性对新技术使用的影响(Venkatesh & Goyal,2010);在营销学领域,研究分销商与供应商的相互依存对营销渠道的影响(Kim & Hsieh,2003),等等。简而言之,对于成对的两个构念(主观或客观)之间的一致性或差异与结果变量的关系效应的检验均可采用此研究方法框架。

附录:用Excel制作响应面及其检验示例图

注:在此感谢Baran,Benjamin E.提供的电子表格计算模版。

数据输入说明:F列是二次回归方程的非标准化系数输入区;H列是系数的标准误输入区;K列是系数的协方差输入区。

斜率和曲率检验说明:Q列是响应面上对应的斜率和曲率计算区,计算公式如Q5=(F6+F7);R列为斜率和曲率的联合标准误的计算区,计算公式如R5=SQRT((H6*H6)+(H7*H7)+(2*K5));S和T列为斜率和曲率的t检验区,计算公式如S5=Q5/R5(t值),T5=TDIST(ABS(S5),F12,2)(P值);U列为显著性检验区,计算公式如U5=IF(T5<0.05,″Sig!″,″″)。

画图点说明:取-2到2五个数值作为画图点,计算公式如P16=(F5+(F6*P15)+(F7*O16)+(F8*P15*P15)+(F9*P15*O16)+(F10*O16*O16))。

收稿日期:2011-07-19

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

二次响应曲面回归方法及其在个体环境匹配研究中的应用_响应面论文
下载Doc文档

猜你喜欢