什么样的产品评论最有用?网络评论的数量特征和文本特征对其有用性的影响研究_客观性论文

什么样的产品评论最有用?——在线评论数量特征和文本特征对其有用性的影响研究,本文主要内容关键词为:在线论文,有用论文,特征论文,对其论文,文本论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

      中图分类号:F270 文献标识码:A 文章编号:1001-4950(2015)04-0041-15

      中国拥有世界上最多的互联网用户,近年来网络消费呈指数式增长,人们的消费行为正受到网络和网络信息的深刻影响。相对于企业发布的广告等商业信息,对于消费者之间传播的口碑信息,消费者反而更为信任(Katz和Lazarsfeld,1955;Herr、Kardes和Kim,1991)。在亚太地区,这一点更为显著(Nielsen,2007)。波士顿咨询(2011)的调查表明,在20个受访国家中,中国消费者发表在线评论数量最多,同时阅读在线评论也最频繁,中国消费者对线上信息源(如在线点评)的信任程度要远远高于线下信息源(如电视广告)。在此背景下,研究在线评论的特征及其对评论感知有用性的影响,对于拓展劝服理论以及帮助企业正确应对电子商务环境的极速变化具有重大的理论价值和现实意义。

      目前,中国几乎所有的电子商务网站(简称“电商网站”)都有产品评论,有些网站,如当当网和亚马逊网,更是大张旗鼓地举行各种活动来鼓励用户进行产品评论。对于某些热门产品,评论数量能达到上千甚至上万条,这使得本来有助于消费者判断产品质量的用户评论开始困扰消费者。因此,大部分电商网站都建立了针对评论的声誉系统,即评论的阅读者可以对评论进行再评论,以及就评论的有用性进行投票,大多数电商网站(如当当网、亚马逊网等)会针对每一条消费者评论,让其阅读者回答“这条评论对您有用吗?”。但是,这种对评论的评价机制的效果是有限的。例如,2006年国外Amazon网站上关于MP3的两万多条评论只有38%被认为是有用的(Cao、Duan和Gan,2011),空洞无物的产品评论在网上随处可见,81%的电商网站对于如何提高用户发布的在线评论的质量感到困惑(Ludwig等,2013)。此外,这种对评论的评价机制对于近期发表的评论是无效的,因为一条评论的有用票数只有经过较长时期的累计才能产生指示作用。因此,企业要想对用户评论进行快速有效的管理,就要找出影响产品评论有用性的重要因素。

      目前已经有一些研究探讨了评论的数量特征(如评分)对评论有用票数的影响(Mudambi和Schuff,2010),也有研究探讨了评论的文本特征对评论有用票数的影响(Cao、Duan和Gan,2011;Ghose和Ipeirotis,2011;Li和Zhan,2011),但是,这些研究均是基于美国市场的数据进行的,其结论不一定适用于中国市场和中国消费者。与此同时,这些研究的结论存在互相矛盾的地方,需要找到新的变量来调和这种矛盾。此外,目前还没有研究探讨评论数量特征与评论文本特征的交互作用。本研究拟探讨产品类型、评论数量特征、评论文本特征及其交互作用对评论感知有用性的影响。本研究首次验证了对于不同类型的产品,产品评论的客观性这一文本特征对评论感知有用性的影响存在差异,这为丰富劝服理论做出了有益的尝试。本研究的结论对于帮助电商网站引导客户写出更有效的产品评论,进而降低交易成本、促进产品销售也有重要的应用价值。

      本文首先对相关研究进行了综述,接着提出了本文的理论框架和研究假设,第四部分介绍了变量和数据收集情况,第五部分报告了模型分析和研究结论,最后探讨了研究启示并进行了未来研究展望。

      二、相关研究综述

      现有关于在线评论的研究主要可分为三大主线:一是探讨在线评论特征与企业绩效之间的关系(如Liu,2006;Chevalier和Mayzlin,2006;Trusov、Bucklin和Pauwels,2009;卢向华和冯越,2009;Zhu和Zhang,2010;龚诗阳等,2012;Luding等,2013)。二是探讨在线评论与其他变量对企业绩效影响的交互作用(如Hu、Liu和Zhang,2008;Trusov、Bucklin和Pauwels,2009;Zhu和Zhang,2010;Chen、Wang和Xie,2011;Lu等,2013)。三是探讨在线评论特征与评论有用性之间的关系(如Mudambi和Schuff,2010;Li和Zhan,2011)。在上述第三个主题下,近年来涌现的大量研究探讨了评论有用性及其影响因素。

      Mudambi和Schuff(2010)将评论有用性定义为,顾客感知的产品评论对其购买决策过程的助益。由于电商网站提供了有关产品评论是否有用的投票机制,目前所有研究均用有用投票数除以总票数来测量评论的有用性①。当消费者面临海量的在线产品评论时,他们是如何提取和选择信息的,多数来自信息系统领域的研究表明,信息质量是影响消费者对信息有用性判断的重要因素之一。

      事实上,综观近年来针对评论有用性影响因素的研究,我们发现,不论作者是否明示,这些研究大部分运用信息质量框架来探讨信息质量的一些维度对评论有用性的影响作用。我们将现有研究提出的评论有用性影响因素分为信息质量因素和非信息质量因素。由表1可知,这些信息质量因素与Wang和Strong(1996)提出的信息质量维度基本一致。

      

      对于表1中列出的在线产品评论有用性的影响因素,我们总结如下:

      1.评论客观性。Holbrook(1978)在研究态度的信息性影响因素时,根据文本的语义特征,将信息分为客观事实型和主观评价型两类。Holbrook指出,客观事实型和主观评价型信息对受众如何解码信息有重要的差异性影响。具体到营销说服情境中,客观事实型信息指“对产品特征进行客观的、有逻辑的、可检验的描述”,相反,主观评价型信息指“对产品特征进行涉及主观印象的情绪性表达描述”。Holbrook(1978)针对汽车广告的实验研究表明,与主观评价型信息广告相比,客观事实型信息广告激起的消费者品牌态度更正面。

      在有关在线产品评论的研究中,金立印(2007)通过实验操控发现,主观评价型口碑信息比客观事实型口碑信息对消费者决策的影响更大,因为主观评价主要是购买心得和体验信息,是购买使用者的购买或者使用经验,更具有感染力。Ghose和Ipeirotis(2011)则采用“主观性”这一变量来定量研究主观评价和客观评价对评论有用性的影响。他们采用LingPipe toolkit文字处理文件,对在线评论信息的“主观性”进行量化,得出评论的主观性系数,他们研究发现主观性系数对评论感知有用性的影响为负,即消费者更偏好相对客观的在线评论。与他们的发现类似,Chen和Tseng(2011)发现评论客观性是体现评论信息质量的重要指标,同时也是区分评论有用与否的有效指标。此外,郝媛媛等(2010)研究发现,评论的主客观表达混杂度越高,评论的感知有用性越高。

      金立印(2007)的研究结论与国外学者不一致的原因有两点:一是研究方法不同,前者用的是实验法,后两者用的是真实的在线产品评论数据;二是研究情境不同,前者是基于中国情境,后两者是基于国外的情境。因此,有必要针对中国情境下的真实在线产品评论来研究评论客观性对评论有用性的影响。

      2.评论可信度。评论可信度主要指评论本身的可信度,有时也指评论信息源即评论人的可信度。虽然网络的虚拟性和匿名性导致可信度评价较为困难,但Mackiewicz(2010)指出,多数电商网站允许产品评论的读者对评论进行有用性评分和回复,通过这种方式,评论人和评论读者共同建立了评论人的可信度。

      Forman、Ghose和Wiesenfeld(2008)的研究显示,如果亚马逊网站上产品评论人提供其真实的姓名和地址信息,则其产品评论得到的有用票数更多。Hu、Liu和Zhang(2008)发现,评论人的质量(根据其撰写评论获得的有用票数计算得到)在产品评论对产品销量的影响中有显著调节作用,即评论人质量越高,正面评论带来的销量增加越明显。Ghose和Ipeirotis(2011)发现,对于某些产品,评论人是否披露其真实姓名对评论有用性有显著正向影响。Chen和Tseng(2011)也发现评论人的排名是区分评论有用与否的有效指标。

      此外,有基于调查数据的研究表明,信息源的可信度或评论人的级别对产品评论信息的感知有用性和可信度有显著影响(Cheung、Lee和Rabjohn,2008;包敦安和董大海,2009)。

      综上所述,评论人的可信度(声誉或权威性)通过信息边缘加工路径(Petty和Cacioppo,1986)对消费者对评论的可信度和有用性判断产生重要影响。

      3.评论可诊断性。评论的可诊断性是指评论是否包含显著的能够帮助消费者对产品质量进行判断的信息。评论的可诊断性可由评分来表示,极端的评分易于消费者对产品的好坏进行判断,中间评分包含了模棱两可的信息,需要消费者付出更多的认知努力。

      Ghose和Ipeirotis(2011)发现中间评分(评分为3分)相对于极端评分对评论有用性有显著负向影响,Forman、Ghose和Wiesenfeld(2008)也得出了相同的结论。Mudambi和Schuff(2010)则发现,极端评分对评论有用性的影响方向取决于产品类型,对于体验型产品,中间评分比极端评分带来的“有用票数”更高;对于搜索型产品,极端评分比中间评分带来的“有用票数”更高。此外,Pan和Zhang(2011)以及Scholz和Dorner(2013)的研究表明,评分越高,有用票数就越多,且评论评分对有用票数的正向影响会受到产品类型的调节,对于体验型产品,评分对有用票数的正向影响更强。上述五项研究的样本量均很大,且数据来源均是amazon.com,但得出了彼此不同的结论,因此,很有必要在中国情境下继续探讨评论可诊断性对评论有用性的影响。

      4.产品类型。Nelson(1974)从信息经济学的信息搜索成本出发,将产品分为搜索型产品(或功能型产品)、体验型产品和信念型产品三类。搜索型产品指消费者在购买之前通过自身的知识、产品观察、消费者观察报告等渠道就可以对其进行评估的产品,比如数码相机、DVD播放器等(Nelson,1974)。体验型产品指消费者必须通过自身一小段时间的使用才能评估其主要属性,或者其属性相关信息的搜索成本很高的产品,例如香水(Klein,1998)。信念型产品指消费者由于缺少相关专业知识,在使用之后仍不能评估其质量的产品,例如牙医服务等。

      由于信念型产品在在线销售的产品中较为少见,目前研究者主要探讨了前两种类型的产品在评论有用性上的差异。王平和代宝(2012)、Mudambi和Schuff(2010)以及Pan和Zhang(2011)研究发现,体验型产品评论比功能型产品评论得到的有用票数少。与之相反的是,Scholz和Dorner(2013)发现,体验型产品评论比功能型产品评论得到的有用票数多。这些不一致的结论说明产品类型对产品评论有用性的影响还有待进一步探索。此外,已经有国外学者探讨了产品类型的调节作用,我们还需进一步探讨产品类型在中国情境下的调节作用。

      5.评论字数长度。评论字数长度指评论包含的信息数量。理论研究表明,支撑一个观点的信息数量越多,该观点就越有说服力(Schwenk,1986);决策者得到的决策理由越充分,其决策信心就越强(Tversky和Kahneman,1974)。现有关于产品评论有用性的研究得出了一致的结论,即评论长度对评论有用性有正向影响(Kim等,2006;Mudambi和Schuff,2010;Li和Zhan,2011;Pan和Zhang,2011;王平和代宝,2012)。此外,Mudambi和Schuff(2010)以及Pan和Zhang(2011)发现产品类型在评论长度对评论有用性的影响中有相同的调节效应。

      6.评论及时性。评论及时性指评论出现时间的早晚。越早出现的评论,越能吸引读者的关注,也越有可能获得更多的有用票数。而另一方面,晚出现的评论包含了新的发展情况,其对读者可能更有用。Chen和Tseng(2011)发现,评论及时性不是判断评论有用与否的有效指标。Scholz和Dorner(2013)以及Pan和Zhang(2011)却发现,评论出现的时间(以天计)越长,其得到有用投票的概率越高。

      7.评论文本特征。随着文本挖掘技术的快速发展,研究者还研究了在线评论的其他文本特征对评论感知有用性的影响。Li和Zhan(2011)研究发现,平均段落长度和评论中感叹号数目对“有用票数”有显著负向影响。Cao、Duan和Gan(2011)的研究结果表明,评论中出现的“否定性”单词以及四个字母单词越多,该评论获得的“有用票数”就越多;评论标题中的单词越多,该评论获得的“有用票数”就越少。Ghose和Ipeirotis(2011)研究了评论的文本特征(评论可读性、评论的字词错误率、评论的主观性等)对在线评论感知有用性的影响,结果发现评论可读性对感知有用性有正向影响,评论字词错误率和评论主观性对感知有用性有负向影响。Scholz和Dorner(2013)也发现,评论可读性对感知有用性有正向影响,评论字词错误率对感知有用性有负向影响。

      通过上面的文献梳理我们发现,对于有些影响因素,现有研究的结论是不一致的。导致这种不一致的原因,除了样本不同之外,更重要的是忽略了一些重要调节变量的影响作用。因此,未来的研究有必要引入必要的调节变量,以更准确地揭示评论特征与评论有用性之间的关系。我们还发现,现有研究将评论数量特征与评论文本特征拆开来研究,这不利于完整地探究评论特征对评论有用性的影响,未来的研究有必要将两者进行有机结合。

      三、理论框架与研究假设

      消费者对搜索型产品的判断是由认知驱动的、工具性的和目标导向性的(Strahilevitz和Meyers,1998),相反,消费者对体验型产品的判断取决于美学情感体验和感官愉悦性(Hirschman和Holbrook,1982),因此,对于这两类产品,消费者搜寻和处理信息的方式是不同的(Huang、Lurie和Mitra,2009)。搜索型产品的特点决定了针对这类产品的消费者评论更可能是事实型的、客观性的,反映的是功能驱动的消费者经验;而体验型产品的消费者评论更可能是情绪型的、主观性的,反映的是消费者个人的特别感受。

      对于搜索型产品,消费者比较容易从卖方提供的产品信息(如广告、产品测试报告、第三方专业报告等)中获得有用的信息,而搜索型产品评论提供的仍是一些客观事实型信息,当重复的信息再次出现时,根据边际效用递减规律,产品评论信息的效用下降,即有用性降低。相反,对于体验型产品,卖方提供的产品信息对消费者而言是远远不够的,其他消费者提供的产品评论因个体体验差异而千差万别,消费者可以从其他消费者提供的产品评论中获得有关产品特征和产品质量的新信息和新观点,由于产品评论信息与卖方提供的信息并不重复,此时边际效用递减规律的适用条件不成立,在线产品评论对消费者而言仍有重要价值。基于上述分析,本文提出假设1。

      假设1(H1):产品类型不同,产品评论的感知有用性就有差异,具体而言,体验型产品评论的感知有用性要高于搜索型产品评论的感知有用性。

      在线评论可以是正面的、负面的,也可以是中性的,这称为在线评论的情感倾向。目前有些研究通过对评论内容进行编码,来衡量评论的情感正负(如Liu,2006)。但大部分研究用点评的评分代表评论的情感方向,极低的评分(如1分)代表极端负面情感,极高的评分(如5分)代表极端正面情感,中间的评分(如3分)代表中性情感倾向。

      传统研究认为广告中同时包含正反两方面主张能提高消费者感知的信息源可信度,进而增强其对品牌态度的好感(Eisend,2006),这意味着中性评论比极端情感评论更有用。然而,相对于广告,消费者更信任消费者之间传播的信息(Katz和Lazarsfeld,1955,Herr、Kardes和Kim,1991),因此,对于可信度本身比较高的在线评论,来自广告研究的结论不一定适用。

      中性评论和极端评论何者更有用呢?根据可达性—可诊断性模型(accessibility-diagnosticity model)(Feldman和Lynch,1988),一条信息对人们判断和选择的影响权重取决于信息的可达性(即信息从记忆中提取出来的容易程度)、替代信息的可达性以及信息的可诊断性(即信息与决策的关联性)。如果所有信息都是可达的,则可诊断性越强,该信息对消费者的判断影响越大。如果用评论评分来衡量评论的可诊断性,极端的评分易于消费者对产品的好坏进行判断,可诊断性高,而中间评分包含了模棱两可的信息,可诊断性低。因此,本文提出假设2。

      假设2(H2):评分极端性对产品评论的感知有用性有正向影响。

      不同于搜索型产品,体验型产品必须经过使用才能判断产品质量,因此,零售商提供的产品信息对消费者而言是远远不够的,在线评论为消费者提供了一个虚拟体验平台。一条具有极端情感倾向的评论是评论者切身体会和感受的真实反应,它相比于中性情感倾向,更有利于消费者形成产品印象和产品体验。基于上述观点,本文提出假设2a。

      假设2a(H2a):产品类型在评分极端性对产品评论感知有用性的影响中起调节作用。相对于搜索型产品,评分极端性对体验型产品评论感知有用性的正向影响更强。

      Holbrook(1978)指出,客观事实型和主观评价型信息对受众如何解码信息有重要的差异性影响。具体到产品评论,哪种信息的感知有用性更高,目前的研究未达成一致。现有研究在探讨这一问题时,没有考虑产品类型的调节作用。

      产品类型不同,产品评论的信息类型对产品评论感知有用性的影响就不同。对于搜索型产品,消费者本身就可以通过产品外在线索评估产品质量,因此,通过产品评论对搜索型产品的质量进行评估,其确定性较高,所以,产品评论的信息类型是客观型还是主观型,对产品评论感知有用性的影响不明显。对于体验型产品,消费者必须通过自身一小段时间的使用才能判断产品的主要属性,因此消费者通过产品评论来判断产品质量的不确定性较高。根据不确定性降低理论,个体在面临不确定性时会采用一些降低不确定性的策略(Berger和Calabrese,1975)。个体可以通过寻找可信度更高的信息来降低不确定性(Jacoby等,1994),也可以通过信息质量来判断信息的可信度(Slater和Rouner,1996;Pornpitakpan,2004)。在这种情况下,评论中的客观性信息无疑会提高评论的感知信息质量和感知可信度,从而提高评论的感知有用性。

      此外,对于搜索型产品,消费者从卖方提供的产品描述中可以获得有关产品客观属性的信息,因此产品评论中出现的客观事实型信息只是对产品描述的确认,根据归因理论,消费者会更多地把感知到的有用性归因于卖方提供的产品描述,而不是在线评论本身。对于体验型产品,其在线评论本身就是高度个性化的,消费者无法通过这些高度个性化的评价来判断产品质量。此时对产品特色、产品功能进行一些客观描述的评论,能给消费者提供有价值的参考信息(王平和代宝,2012),让其通过这些客观描述来形成对产品本身的印象。基于这些分析,本文提出假设3。

      假设3(H3):产品类型在评论客观性对评论感知有用性的影响中起调节作用。对于搜索型产品,评论客观性对评论感知有用性无显著影响;对于体验型产品,评论客观性对评论感知有用性有显著正向影响。

      一条评论的评分越极端,说明评论人对产品持有的情感倾向越强烈,那么,这种极端的情感倾向是否真会对评论阅读者产生影响?要想产生较大的影响,评论人还需要充足的论据来证明其观点。按照Liu等(2007)对在线评论质量的定义,只有对产品有非常详细的描述,呈现产品的各个方面,并提供非常强的论据支撑的在线评论,才是优秀的高质量评论。呈现产品的各个方面就涉及本文提出的“评论客观性”,按照前述论证,客观性和评分极端性对感知有用性都有正向影响,一条评论情感倾向越具极端性,论据越充分,其说服力就越强,消费者对该评论的感知有用性也就越强。基于此,本文提出假设4。

      假设4(H4):评论客观性在评分极端性对评论感知有用性的影响中起调节作用。评论客观性越强,评分极端性对评论感知有用性的正向影响就越大。

      回帖数是指针对一条评论回帖(再评论)的数量,一条评论获得回复的帖子数越多,有更多消费者参与讨论进而提供更多有用信息的可能性就越大,对后续消费者的助益也就越大。基于上述分析,本文提出假设5。

      假设5(H5):一条评论的回帖数量对该评论的感知有用性有正向影响。

      评论时间指评论在线发布的时间。一条在线评论的感知有用性会受到评论时间早晚的影响。以往的研究表明,一条评论发布的时间越早,获得的关注就越多(Jindal和Liu,2008),Liu等(2007)将这一现象称为“早起者偏差效应”。当电商网站按照评论获得的有用票数对所有评论进行排序的时候,发布时间较早的评论会有更大的可能性出现在评论页面首页,这能使其进一步获得更高的关注度和有用票数。基于此,本文提出假设6。

      假设6(H6):一条评论的发布时间长度对其感知有用性有正向影响。

      图1对上述假设关系进行了描绘。

      

      图1 评论感知有用性影响因素模型

      四、数据与变量

      (一)样本数据说明

      本文选取手机和图书这两种产品作为研究对象,原因如下:第一,相对来说,这两种产品的在线评论较多;第二,这两种产品分别是具有代表性的搜索型产品和体验型产品。人们在选购手机时所关注的关键属性包括通话时间长短、像素、屏幕尺寸、网络兼容性、外观、耐用性、音效、系统及支持软件等,而这些关键属性可以通过自身知识、观察和产品宣传等进行评估,而无需通过产品使用。所以,手机可以作为搜索型产品的代表。而图书是高度个性化的产品,其外在包装、印刷效果可以观察、评估,但其关键属性即内容质量是高度个人化的,只有通过阅读体验才能感知。所以图书可以作为体验型产品的代表。

      关于图书,我们选择了上海财经大学出版社出版的《短线点金——揭开市场的底牌》一书,我们用网页爬虫程序采集了该书在当当网上的670条在线评论;至于手机,我们选择了诺基亚(NOKIA)E63 3G手机(黑色)WCDMA/GSM,我们采集了该产品在京东商城中的568条在线评论。

      网页爬虫程序同时采集了以下数据:(1)产品名称;(2)评论时间;(3)产品购买时间;(4)评论内容;(5)评论评分;(6)评论者姓名和城市;(7)评论回帖数;(8)认为该评论有用的人数;(9)认为该评论无用的人数。

      (二)变量测量

      本文将产品类型设为虚拟变量。当产品类型为搜索型时,产品类型=0;当产品类型为体验型时,产品类型=1。

      本文将评分极端性也设为虚拟变量。当评分是极端分数时,其值为1,其他为0。京东商城和当当网都允许购买者为产品进行星级评分,评分区间为1~5分,分值越高,代表对产品的满意度越高,对产品的情感倾向越正向。由于网络评论呈不对称双峰分布,俗称J型分布(Hu、Pavlou和Zhang,2006),在线评分大多在4分以上,因此,本文将5分、1分、2分定义为极端评分,3分和4分定义为中性评分。当评论评分为5分、1分或2分时,评分极端性为1;当评论评分为3分或4分时,评分极端性为0。

      本文将“客观性”定义为对产品宣传的确认,即评论中包含的在产品说明或者宣传中出现过的产品特有名词或有关产品特点的信息的多少②。这一定义与Ghose和Ipeirotis(2011)提出并测量的评论“主观性”刚好相对应。对“客观性”的测量,首先通过ROST CM的提取行特征值功能来进行。ROST CM软件是一款用于内容挖掘的软件,它能够通过分词、词频分析和情感分析以及语义网络分析等功能对文本进行深度挖掘。提取行特征值是指软件首先分词,然后将每一条评论按标点进行拆分,提取每句话的中心词(即行特征值)和高频词(出现频率排名前300的词)。我们在研究中先由4位编码员分别阅读网页上的产品信息介绍,并按照前述“客观性”定义,从高频词中挑选出他们认为和产品、产品特点或产品宣传相关的词,然后对他们所挑选出的词进行筛选,用出现频率超过2次的词组成“产品特征词库”。一条评论的“客观性”就体现为该评论的行特征值所包含的在产品特征词库中出现过的词的数目。

      对4位编码员的编码结果进行归类一致性系数分析,结果表明编码一致性较高,即信度较高。归类一致性系数分析结果如表2所示。

      

      关于感知有用性的测量,以往文献所采用的一种方法是直接用认为该评论有用的人数来测量,而Ghose和Ipeirotis(2008)用认为一条评论有用的人数占所有投票的比例来测量。考虑到直接用认为评论有用的人数来测量有失准确,而用比例来测量又会损失一些数据(因为有些在线评论认为其有用和无用的人数都为0),本文采用认为该评论有用的人数减去认为该评论无用的人数来测量在线评论的有用性,这样既能保证准确,又不会丢失很多有效数据。

      本文将回复帖子数和评论发表时间长度作为控制变量。对于回复帖子数,本文直接用一条评论的回复人数来测量。对于评论发表时间长度,本文以评论信息采集日期为基准,用评论发表日期和基准日期间隔的月数来测量。

      (三)变量描述统计

      表3列示了本研究所涉及的所有变量的描述统计值及相关系数。

      

      从上表可以看出,回帖数、评论发表时间长度、评分极端性、产品类型和客观性五个变量都与感知有用性有较显著的相关关系。然而,相关系数无法揭示多个变量对感知有用性的共同作用和交互作用。下面我们将建立计量模型来进一步分析评论特征对评论感知有用性的影响。

      五、模型分析与研究发现

      (一)模型分析

      本文主要探讨产品类型、评分极端性、评论客观性及其交互作用对感知有用性的影响,与此同时,将评论发表时间长度和回复帖子数作为控制变量,采用多元线性回归。回归方程为:

      评论感知有用性=

+

评论回帖数量+

评论发表时间长度+

产品类型+

评论客观性+

评分极端性+

产品类型×评分极端性+

产品类型×评论客观性+

评论客观性×评分极端性+ε

      假设检验主要通过层级回归法完成。我们用两个方程来检验交互效应。第1个方程检验了控制变量和自变量的作用,第2个方程在方程1的基础上增加了自变量之间的交互项。模型2的

在模型1的基础上提高了0.025,F值为9.47,

变化显著,表明变量间交互作用显著。为了降低多重共线性对回归的不利影响,我们对涉及交互项的自变量进行了均值中心化处理。回归结果显示,没有一个自变量的方差膨胀因子大于5,表明回归方程不存在严重的多重共线性问题。层级回归分析结果见表4。

      

      (二)研究发现

      从上表的多元回归分析结果来看,产品类型的回归系数为0.661,且在统计上是显著的,表明产品类型对评论的感知有用性有正向影响,即体验型产品评论收到的有用票数显著多于搜索型产品,假设1得到支持。购买搜索型产品的消费者较少使用网络信息,更多地利用零售商及制造商的网页信息;相反,购买体验型产品的消费者则更多地使用网络信息,从其他消费者以及中立方收集到的网络信息,被其认为更重要(张茉和陈毅文,2006)。正是这些差异的存在使得不同类型产品的在线评论收到的有用票数存在差异,体验型产品评论收到的有用票数显著高于搜索型产品。

      评分极端性的回归系数为0.724,且在统计上是显著的。这表明情感倾向对评论的感知有用性有正向影响。一条评论的评分越极端,情感倾向越正向或者越负向,消费者对它的感知有用性就越高,假设2得到验证。根据数据分析结果,产品类型和评分极端性的交互项为正且显著,假设2a得到验证。

      评论客观性的回归系数为0.078,在统计上不显著。与此同时,评论客观性与产品类型交互项的系数为0.458,且在统计上是显著的,这表明,对于搜索型产品,评论客观性对评论感知有用性无显著影响;对于体验型产品,评论客观性对评论感知有用性有显著正向影响,假设3得到验证。

      金立印(2007)的研究所选取的搜索型产品是手机和DVD影碟,该研究发现,主观评价型口碑信息比客观事实型口碑信息对消费者决策有更大的影响。本研究针对搜索型产品的发现与金立印(2007)的发现是一致的。同时,本研究还发现,产品类型不同,产品评论的信息类型对产品评论感知有用性的影响就存在差异。

      图2显示了上述交互作用的影响模式。图2根据Cohen等(2003)推荐的程序,对于评论客观性这个连续型变量,分别以高于均值一个标准差和低于均值一个标准差为基准,对于分类变量,则直接以0—1为基准,描绘了对于不同类型的产品,评分极端性和评论客观性对评论感知有用性的影响差异。

      评分极端性和评论客观性的交互项回归系数为0.161,在统计上不显著。如果将显著性水平放宽至0.1,则假设4得到近似验证,即在一定程度上,评论客观性越强,评分极端性对感知有用性的正向影响越大。

      评论回帖数的回归系数为0.415,且在统计上显著。说明一条评论的回帖数越多,消费者对该评论的感知有用性就越强,假设5得到支持。

      评论发表时间长度的回归系数为0.020,在统计上不显著。如果将显著性水平放宽至0.1,则假设6得到近似验证,表明一条评论发表的时间越长,由于积累效应,其获得的有用票数就越多,从而在网络零售商按照评论获得的有用票数为标准进行排序的情况下,其曝光度就越高,进一步获得有用票数的可能性也就越大。

      (三)稳健性检验

      为了提高研究发现的效度,我们通过如下方式进行稳健性检验。首先,保持分析模型不变,将评论“客观性”这一连续变量按照中位数3分为高、低两个水平,用这个评论客观性虚拟变量替换原来的连续变量,重新进行回归分析。从分析结果来看,除了回归系数略有变化,各个系数的显著性均没有发生改变。其次,改用多元方差分析法,以评论感知有用性为因变量,以产品类型、评论客观性和评分极端性为因子,以评论回帖数和评论发表时间长度为协变量,同时引入三个交互项进行方差分析。从分析结果来看,每个变量及交互项影响的显著性与回归分析结果一样,具体如表5所示。

      

      

      图2 产品类型在评分极端性和评论客观性对评论感知有用性影响中的调节作用

      六、研究贡献、研究启示与未来研究展望

      (一)研究贡献与创新点

      劝服理论是有关信息接收者态度转变的理论。由于在线产品评论是一种多对多传播,具有匿名性、瞬时性和广泛性,现有的劝服理论已经无法很好地解释在线产品评论对消费者态度的影响。本文借用信息质量的概念框架,构建了在线产品评论有用性影响因素模型,研究了产品类型、评论数量特征、评论文本特征对评论感知有用性的影响,同时研究了三者的交互作用对评论感知有用性的影响。本文首次验证了评论的客观性这一文本特征对评论感知有用性的影响对于不同类型产品来说存在差异,这对劝服理论做出了有益的补充。

      在营销学中,社会互动指非销售方(如消费者、第三方群体)对消费者有关产品和服务价值评估的影响(Godes等,2005)。在线产品评论作为一种重要的社会互动形式,对其形成、传播与影响机制的研究有助于推动社会互动理论的发展。Godes等(2005)就社会互动理论在营销领域的应用提出了一些未得到解答的问题,如社会互动的前因变量和结果变量等。本研究力图回应这些问题,并为社会互动理论的发展与完善做出一定的贡献。

      本文对产品评论“客观性”的测量运用了最新的文本挖掘软件,这对于将新兴技术应用于营销学研究具有重要的探索性意义。现有的针对在线产品评论有用性影响因素的研究,所得出的结论还存在相互不一致的地方。本文引入产品类型作为调节变量,所得结论可以部分地解释这种不一致的成因。目前绝大多数相关研究是以美国的在线产品评论数据为研究对象的,鉴于中国消费者对在线产品评论信息的高度依赖和中外消费者点评行为的差异,本研究的发现可以为中国的网络营销者提供更有针对性的参考。

      (二)研究启示

      基于本文的研究发现,再结合前人的研究结论,我们可以总结出那些对消费者最有用、最能深入人心的产品评论的特征。

      第一,产品评论中应包含客观事实型信息。虽然总体而言,相对于广告,消费者更信任产品评论,但由于网络的匿名性,虚假评论、恶意评论等现象会导致评论可信度下降。产品评论中包含的客观事实型信息越多,消费者感知的信息质量和信息可信度就越高,感知的评论有用性也就越大。

      第二,产品评论应观点明确。具体到产品评分,评分越靠近两个极端,其表达的观点就越明确,也就越有助于消费者进行判断,消费者的感知有用性也越大。

      第三,观点明确且客观性强的产品评论,其感知有用性最大。有明确的情感倾向,而且有详细的客观事实型信息支撑的产品评论,对消费者判断产品质量最有用。

      第四,产品评论应在第一时间出现。产品评论出现的时间越早,其感知有用性越大。也就是说,评论信息越及时,消费者感知的有用性越大。

      第五,产品评论应避免文字错误。产品评论文字错误率越低,越容易理解,可读性越强,消费者感知的有用性就越大。

      第六,产品评论应该简洁。虽然评论字数长度越长,感知有用性就越大,但平均段落长度对感知有用性有负向影响。因此,将产品评论分成几段来写,且每一段都有适量的观点和信息,消费者感知的有用性会更大。

      第七,按照上述六个秘诀撰写的产品评论,其收获的“有用票数”更多,这有助于提升评论人的在线声誉和可信度;而高可信度的评论人所撰写的评论,被消费者感知的有用性更大。这样就构成了良性循环。

      基于本文的研究结论,我们可以得到对电商网站的管理实践富有意义的启示。

      本文研究得出评论的客观性对评论的感知有用性有显著正向影响,因此,电商网站可以引导和制定在线评论发布规则,比如按照产品特点、功能区分进行评论,提高评论的客观性。

      当前实践中较为流行的一种做法是,电商网站按照发表时间和有用性对评论进行排序和展示。我们的研究发现评论的评分极端性和客观性这两个指标对顾客购买决策有重要影响,因此,电商网站在设计评论系统时应该考虑根据这两个指标对评论进行排序和展示,以提高那些具有高度极端情感倾向和客观性的在线评论的曝光度,利用消费者对这些评论的高感知有用性,来降低消费者的感知购买风险,从而促进销售。

      本文的另一个重要结论是,产品类型调节着评分极端性和客观性对评论感知有用性的影响。相比于搜索型产品,体验型产品评论的情感极端倾向和客观性对感知有用性的正向影响更强。因此,体验型产品的零售商应该更加注重对在线评论的主动管理。

      本研究还发现回帖数对评论的感知有用性有正向影响,因此,零售商可以采取一系列激励措施,鼓励消费者对在线评论进行再次评论,并按照回复帖子的数量对评论进行分类,以吸引消费者的注意,方便消费者在更短的时间内找到感兴趣的话题参与讨论,并搜索到有用的信息。

      (三)不足及未来研究展望

      本文重点研究了评论内容文本特征的客观性和评分极端性对感知有用性的影响,还有其他一些影响感知有用性的因素未被纳入考虑,比如评论长度。“客观性”和评论长度有很大的相关性,因为一般客观性强的评论,长度就较长,但长度长的评论,其客观性不一定强。考虑到变量间的多重共线性,本文未将评论长度纳入回归方程,以后的研究可以尝试寻找评论长度的代理变量,将其纳入回归方程。

      另外,本文未考虑评论的可读性等因素对评论客观性的影响。比如,一条评论的客观性越强,其长度往往就越长,提供的有用信息往往就越多,但人的注意力和记忆力是有限的,太长或者太复杂的句子容易引起视觉疲劳,可读性降低。因此,未来可以利用文本分析软件对评论的可读性进行充分的测量,研究可读性对客观性的影响。

      ①与评论有用性相关的一个概念是信息系统研究领域的信息质量,在Rieh(2002)的经典研究中,信息质量的操作性定义是指信息使用者所认为的信息的有用、优良、及时和准确程度。从这个定义不难看出,信息质量的定义与有用性概念有一定程度的重叠。因此,有些学者直接用评论的有用票数来测量评论信息质量(Zhang和Aradarajan,2006;Kim等,2006),也有学者直接将口碑质量定义为口碑接收者感知到的有用性(陈明亮,2009)。但是,由于信息质量类型较多,维度丰富(Wang和Strong,1996),评论的有用性显然不能与评论的信息质量划等号。

      ②与评论“客观性”相对的变量是评论“主观性”,在Liu等(2007)的研究中,评论的主观性被定义为评论中主观性句子(不论是正面情感还是负面情感)所占百分比,但这一定义与常用的评论的情感效价(valence)变量有所重叠。因此,在本研究中,笔者采纳的是Pang和Lee(2004)的观点,即评论中的客观性信息是指评论中出现的与产品描述中出现过的相关的信息,而评论中的主观性信息是指除此之外的任何信息。

标签:;  ;  ;  

什么样的产品评论最有用?网络评论的数量特征和文本特征对其有用性的影响研究_客观性论文
下载Doc文档

猜你喜欢