社交问答平台答案有用性评价影响因素研究论文

社交问答平台答案有用性评价影响因素研究

谢陈博

(武汉理工大学,湖北 武汉 430070)

摘 要 :Web2.0时代背景下,以知乎、quora为代表的社交问答平台逐步取代了传统的搜索式问答网站。为了探索社交问答平台中答案有用性的影响因素,以说服的双过程模型为理论基础,考虑答题者社会性因素影响,提出研究假设,并基于代表性社交问答平台的客观数据进行分析。研究结果表明,答案长度、答案及时性和答题者内向中心度能正面影响答案有用性,其中答题者内向中心度的影响最大,答题者答题能力、答题者外向中心度和答案有用性之间关系并不显著。

关键词 :社交问答平台;说服的双过程:社会性因素;答案有用性

1 引言

社会化问答平台是Web2.0时代背景下知识共享的互联网创新应用。相比于百度知道、新浪爱问这些传统的捜索式问答平台,社会化问答以“社交关系”和“问答机制”为基本特征。社会化问答平台通常不依靠某个权威机构或专家提供信息,而是采用UGC(用户生产内容)的方式,每个使用者同时兼具信息接收者和信息提供者的双重角色。社交关系的加入促进了UGC内容的生产,但同时也让答案采纳更加容易受到粉丝效应的影响,可能会破坏问答质量的权威性。为了分析社交问答平台答案有用性影响因素,特别是社会性因素的影响,本文对知乎客观数据进行了实证研究,并依据分析结果给网站管理者和用户提出了建议。

2 研究现状和理论基础

2.1 相关研究现状

目前,对社交问答平台的研究多集中在知识共享和用户动机方面,杨海娟(2014)采用问卷调查的方法,构建了影响社会化问答网站用户贡献意愿的模型。研究表明利他主义、互惠对用户贡献态度有显著影响。Jin,Li& Zhong,et al(2015)通过对知乎上1500个用户的数据进行分析,研究了用户在社交问答平台中分享知识的原因,认为自我表达,同行认可和社会学习对用户知识贡献行为有正向激励作用。

在社交问答平台问答信息质量方面,Zhu Z,Bernhard D(2009)等采用专家分析、用户调研以及比较法,提炼并总结了判定问答社区回答质量的十三个维度(相关性、信息量、完整性、客观性等),并建立了问答社区多维质量评估模型。Ishikawa(2014)等人从 Yahoo!Chiebukuro(日文数据)中7443 个回答为研究样本,邀请专家将回答归为三类(满意的答案、部分相关的答案、完全无关的答案),得出判断答案质量高低的标准包括:回答者的经验、答案包含的支持性证据等。曹高辉,胡紫祎(2016)等采用网络调研的方式,研究了答案质量感知的外部线索影响,结果表明用户感知答案信息质量时所采用的外部线索包括信息利用线索、信息认同线索等。

就现有的文献而言,学者更多地关注社交问答平台中知识共享的动机,而对共享的知识本身的研究并不多,且大多是通过问卷调查,或是依靠专家的经验对数据进行解释归纳,对网站客观数据的实证分析较少。

2.2 研究理论基础

说服是信息传播与处理的最基本形式之一,定义为个体接收别人发出的信息而产生态度或行为的改变。在众多说服过程模式中,Chaiken S(1980)提出的HSM(Heuristic-Systematic Model,启发-系统式模型)和Petty R E,Cacioppo J T(1986)提出的ELM(Elaboration Likelihood Model,精细加工可能性模型)是两个最具代表性的双过程模型。HSM、ELM已经被广泛用于广告营销、消费者行为等领域研究。为了研究在线情境下的信息传播,Sussman和Siegal(2003)以ELM为基础,提出了IAM(Information Adoption Model,信息接受模型),如图1所示。该模型分别将信息内容质量和信息源可靠性作为ELM中的中心路径和边缘路径,直接影响信息接收者感知信息有用性,并最终影响对信息的采纳行为。

图1 信息接受模型

3 研究假设

图2 答案有用性理论模型

说服的双过程模式表明,当信息接收者沿着边缘路径处理信息时,最重要线索往往是信息源的可靠性,直接影响信息接收者的基本判断。信息源的可靠性可以从两个维度衡量:可信任度、专业能力。在问答网站的情境下,答题者的可信任度和专业能力也是用户在对答案进行评价时会采用的启发式原则。因此,提出如下假设。

3.1 答案特征

3.2.1 答题者答题能力

OA学术资源的利用主要包括外部环境上的政策规划、指导以及内部管理上的资源收录、揭示、组织、宣传与维护等方面,考虑到军队网络安全保密管理的特殊性,结合军队院校科研实际,本文从宏观上总部统一规划、分工协调、资金保障与微观上各馆立足实际、借鉴经验、优化利用两方面对军队院校图书馆OA学术资源利用模式进行探讨。

1.燃气类分布式能源企业分类。燃气类分布式能源企业分为区域型和楼宇型。分布式能源主要特征是实现冷、热、电三联供,能源就地消纳。

答案长度能反映答题者的重视程度,态度越认真的答题者往往给出的答案越长,这在一定程度上保证了长答案比短答案具有更高的质量。另外,在在线评论的领域中已有研究表明评论长度会刺激评论阅读者仔细浏览,加深或改变原有的态度,提高对产品或服务的认知度,抵消用户的不确定性,因此评论长度对其感知有用性有正向作用。因此,提出如下假设。

H1:答案长度与答案有用性正相关。

3.1.2 答案及时性

H4a:答题者内向网络中心度与其答案有用性正相关。

在在线评论信息的领域中,已有研究认为信息的及时性是评论内容质量的关键维度,影响消费者对于该评论的消费者有用性评价。对于知乎的问答,知乎的问题页面下默认只会显示排在靠前位置的数个答案。晚些发表的答案会被排在后面,要看到这些答案需要点击“查看全部回答”。获取这些信息需要额外的搜寻成本,会对答案的感知有用性产生负面影响。因此,提出如下假设。

H3:答题者答题能力与其答案有用性正相关。

3.2 答题者特征

3.1.1 答案长度

客观性是“非虚构文学”必要的准则之一。但在文学创作中“由于叙述主体特别是某一叙述个体的生活积累、知识结构、思想境界、审美情趣、表达习惯不同,所以叙述者面对类似或同一生活客体时所作出的审美选择必定有异。非虚构叙述如此,虚构性写作也是如此。”“写什么”与“如何写”这一大权掌握在作家手中,具体呈现出来的效果如何,与他本人对叙述对象的主观情感有着密切的关系。

说服的双过程模型在在线评论领域已经有了较多的应用,用户在社交问答平台中对答案的采纳行为与对在线评论信息的采纳行为较为相似,因此本文将说服的双过程模型作为研究的理论基础,在边缘路径考虑答题者的社会网络属性,综合答案特征和答题者特征两方面考察答案有用性的影响因素。

H2:答案及时性与答案有用性正相关。

3.2.2 答题者网络中心度

从社会网络视角分析,中心度是分析网络中节点特性分析的关键步骤,是衡量个体在社会网络中影响力的重要指标。基于YouTube在线数据的实证研究表明,视频内容创作者所链接的订阅者越多,那么该视频易于得到正向评价,并进一步加速视频内容的传播与扩散。在社交问答平台中,用户创作的答案同样会受到其社会网络中心度的影响。因此,提出如下假设。

哲次郎的东洋哲学史一课为人所知,但从没有研究者论及过其内容。不过,在东洋大学井上圆了研究中心有一本用“和纸”(译者注:日本传统的纸)做的笔记本,其封面上有井上圆了所记录“东洋哲学史卷一”的文字(共96页),在此将写出其概略。笔记本的第1页中有如下记载:

H4b:答题者外向网络中心度与其答案有用性正相关。

另一是,4月24日中午,午餐后,我们在埃里斯塔市中心步行街散步观光,只见有披着披肩的一男一女青年肃立在一处房前,我们的第一反应是宗教徒在募捐吧,问陪同我们的巴兹尔先生,“这不是宗教徒募捐行为,‘5·9’胜利日快到了,每年这个日子之前之后一个月当地中学生有一项活动,在卫国战争时获得英雄称号的战士旧居前站岗纪念,以示对英雄的怀念,对光荣传统的尊重,一次2人,一小时换岗一次。”巴兹尔还说:“当年我当中学生时也参加过这项活动!”听到此回答,我提议赶快返回照相留念。我在想不忘历史、永怀先烈的传统,真是值得学习,记住英雄、不忘历史,从娃娃抓起,多好啊!

4 研究方法

4.1 数据采集

知乎是目前国内最大的社交问答平台。由于用户数量庞大,在热门问题下回答数量会达到上万条,知乎在每个回答下设置了「赞同」、「反对」、「感谢作者」和「没有帮助」四种操作,「赞同」和「反对」是对阅读到的答案进行投票。「感谢」表示对该作者的回答行为表示感谢,「没有帮助」表示该答案对自己没有价值,并采用了基于用户话题权重和赞同反对票数的威尔逊得分算法来对答案进行排序,本文选取知乎中的两个没有标准答案的主观开放性问题“如何长时间高效学习?”“有什么知识,你知道后你的世界马上就不一样了?”作为研究对象,尽可能避免答案观点正误和时事评论类问题时效性因素的影响。于2017年11月13日用python爬虫爬取两个问题下非匿名用户的2778条答案的答题者信息和答案内容信息,去除已注销用户的回答和未获得赞同的答案,共996组数据。爬取数据的描述性统计分析结果如表1所示。

表1 数据描述性统计分析

4.2 研究变量

研究模型包含6个变量,答案有用性以答案赞同数作为测度指标。在自变量方面,答案长度以评论全文的字数为测度指标,答案及时性以该答案发表日期减去首条答案发表日期的天数进行测度,两者均属于答案特征;评论者特征主要从社会网络视角出发,网络内向中心度以该答题者关注者(粉丝)数量为测度指标,网络外向中心度则以该答题者关注的用户数量为测度指标,答题者的答题能力以历史答案的平均赞同数(答题者的答案总数/答题者获得的总赞同数)为测度指标。所有变量均使用知乎网上抓取的真实数据。对变量的描述性统计分析如表2所示。

表2 变量描述性统计分析

4.3 研究方法

公式(1)中,Y为因变量,X i1-in 表示n个自变量,b 0为截距,e i 为残差。

Y =b 0+b 1X i1 +b 2X i2 +…+b n X in +e i

(1)

本研究需要考察多个因素对同一结果的影响,因此选用多重线性回归模型作为理论验证的计量模型。表达式如下:

结合往复式真空泵在运行过程中所产生的温度及其变化情况,基本上超温常常发生在抽空的3阶段中。此时,往复式真空泵进口的真空压力在-0.05~0.075MPa,而出口的压力则处于0.008~0.02MPa。在本组往复式真空泵的实际运行中,其最高的压缩比值等于4.8,而平均的压缩值则为3.04。在抽空2阶段时,该工序所产生的最高压缩比值等于2.16,而其平均的压缩比值则等于1.75。将二者进行比较能够得出,往复式真空泵运行的2个工序中,压缩比之间具有较大的差距,而其所产生的热量则为处于正常状态,发热量与工作时间具有一定的关系。

1.2.4 对比分析法 应用归纳、演绎和对比等逻辑分析方法,对首届女篮亚洲杯中国队与冠亚军队的进攻能力在投篮得分情况、不同位置主力队员的得分情况以及前场篮板球、助攻、失误、造犯规等方面的技术统计数据进行对比分析,并结合相关体育学科知识进行统计、归纳、分析,以找出中国女篮与澳大利亚、日本女篮在进攻能力方面所存在的差距。

根据之前广大学者的研究我们发现,对于推迟法定退休年龄这一政策的看法,社会各界人士主要持两种观点。第一种观点为支持者所提出,首先,他们认为随着现代社会科学技术的进步、人们生活水平的提高,我国人均寿命已经有所提高,这导致了我国人口结构的变化,因此推迟退休年龄是更好地利用社会资源的需要;其次,随着我国人口老龄化现象日趋严重,推迟法定退休年龄有利于国家财政弥补养老金缺口。另一种观点为反对者提出,他们主要站在就业形势严峻的角度,认为推迟退休年龄会增加就业压力,对劳动力市场产生冲击。

5 结果与讨论

5.1 研究结果

本文将自变量分为答案特征、答题者答题能力、答题者网络中心度三块分块进入回归模型,如表3所示,由模型的决定系数可以得出 3 个模型解释度是在增进的,即加入新的解释变量之后模型均有所改进、拟合度更优。变量在各模型中的VIF值均在1左右,不存在共线性问题。

表3 分析结果

注:***,p<0.001; **,p<0.01;ns,不显著;VIF,方差膨胀因子。

对结果进行分析。模型Ⅰ考察答案特征与因变量的相关关系,其中答案长度对答案有用性呈现显著地正向相关 ( β= 0.250,p<0.001) 。答案及时性也与答案有用性存在显著相关性(β=0.092,p<0.01),证实了答案发表越晚,越难得到赞同。在模型Ⅰ的基础上,模型Ⅱ加入了答题者答题能力对因变量的影响,答题能力对答案有用性有显著的正向影响(β=0.172,p<0.001)。在模型III中加入了答题者社会网络特征,即内向中心度和外向中心度。结果表明,在加入了社会网络特征后,答题能力的影响不再显著,而是非常接近显著性水平(β=0.065,p=0.051)。答案长度、答案及时性仍然显著地影响评论答案有用性,系数方向、显著性检验并未由于加入答题者社会网络特征而有所改变。答题者内向中心度对答案有用性的影响显著且系数最大(β=0.264,p<0.001),而答题者外向中心度的影响并不显著(β=0.264,p>0.05)。模型III的决定系数较模型Ⅱ有大幅提高,并且答题者内向中心度的系数大于其他系数,证实了答题者的内向中心度对答案有用性的贡献最大,假设检验结果如表4所示。

表4 假设检验结果

5.2 结果讨论

研究结果较好地验证了研究模型,证实了中心路径和边缘路径都对答案有用性产生了影响,同时说明了答题者内向网络中心度这样的社会性因素的重要影响。

在答案特征方面,答案长度和答案及时性都和答案有用性有显著的正相关关系。在答题者特征方面,答题者答题能力对答案有用性有正向影响,但是在答题者社会网络特征进入模型后影响不再显著。可能有两方面原因:一是答题者历史回答的平均赞同数不能完全代表答题者的答题能力,因为在不同领域下,答题者的经验技能水平是不同的,历史答案质量不能代表当前答案的质量。二是部分优质答案因为答题者的影响度不够或因为回答较晚答案曝光度不够。答题者的外向中心度对答案有用性的影响不显著,而内向中心度影响显著且影响程度最大。原因可能是知乎的关注功能作用是单向的,关注者(粉丝)能随时获得被关注者的最新动态(提问、回答、收藏、点赞等),而被关注者无法得到关注者的动态,因此外向中心度对答题者答案的传播和曝光度影响并不大。内向中心度对答案有用性的影响是多方面的,一方面部分粉丝的盲目相信被关注者,会增加答案赞同数。另一方面粉丝能即时看到答题者的回答,直接增加了答案的曝光度,同时在问题下答案较少时,粉丝的第一时间点赞会让答案排序提升,显示在问题首页,进一步提高了答案的曝光度。

6 总结与建议

实验结果证实了在知乎这样的社交问答平台中,社交机制,特别是关注功能的加入让答案的赞同更多的受到了答题者影响力,即内向中心度的影响,而减弱了答题者答题能力和答案质量的重要性。内向中心度高的中心用户,通常是在某些领域内的专业人士,其在非自身专业领域下的一些并不优质的答案也能得到大量采纳,这是对一些内向中心度低的普通用户的不公。这种情况出现的原因:一方面是部分粉丝对关注者的盲目支持;另一方面是知乎答案排序、推送和管理方式的不完善。本文对社交问答平台用户和管理者提出以下建议。

对于用户:维护问答质量需要每一个用户的共同努力,社交问答平台作为以UCG为主的平台,每个用户既是内容的生产者也是内容的接受者,问答质量的降低会影响所有用户的使用体验。因此每一次对答案的赞同都应该是对答案有用性的认可,而不是对关注者的盲目支持。受到大众关注的中心用户应该避免随意发表低质量的内容,更多地承担起对问答质量的维护责任。

对于社交问答平台:目前大部分社交问答平台都采用让用户投票决定答案排序的模式,如果不采取监督措施,完全依靠用户来决定最佳答案,等于是将平台的内容质量完全交给用户来决定,对于平台的长期发展是不利的。平台应该探索更合理的答案排序和推送方式,增加初始排位靠后的优质答案的曝光度,并对关注动态推送设置一定的延迟,减少粉丝带来的曝光度的影响。同时,在各个话题模块下选择具有对应专业知识且具备管理能力的管理者,及时对中心用户发表的没有价值的高票答案进行必要的处理,让其他优质答案能够得到因有的关注。

参考文献

[1] Alton Y.K.Chua,Snehasish Banerjee.So fast so good:An analysis of answer quality and answer speed in community Q uestion-answering sites[J].J Am Soc Inf Sci Tec.,2013,(10).

[2] Oh Sanghee.The characteristics and motivations of health answerers for sharing information,knowledge and experiences in online environments[J].Journal of the American Society for Information Science and Technology,2012,63(3):543-557.

[3] Jiahua,Li Yijun,Zhong Xiaojia,et al.Why users contribute knowledge to online communities:An empirical study of an online social Q&A community[J].Information& Management,2015,52(7):840-849.

[4] Zhu Z,Bernhard D,Gurevych I.A Multi-Dimensional Model for Assessing the Quality of Answers in Social Q&A Sites[C]// International Conference on Information Quality,Iciq 2009,Hasso Plattner Institute,University of Potsdam,Germany,November.DBLP,2009:264-265.

[5] Ishikawa D,Kando N,Sakai T.What Makes a Good Answer in Community Question Answering? An Analysis of Assessors' Criteria[J].Research.nii.ac.jp,2012.

[6] 曹高辉,胡紫祎,张煜轩,胡守敏.基于外部线索的社会化问答平台信息质量感知模型研究[J].情报科学,2016,34(11):122-128+134.

[7] Chaiken S.Heuristic versus systematic information processing and the use of source versus message cues in persuasion.[J].Journal of Personality & Social Psychology,1980,39(5):752-766.

[8] Petty RE,Cacioppo JT.Elaboration likelihood model[C]// Advances in Experimental Social.2001:197-216.

[9] Sussman SW,Siegal WS.Informational Influence in Organizations:An Integrated Approach to Knowledge Adoption[J].Information Systems Research,2003,14(1):47-65.

[10]Chen CC,Tseng YD.Quality evaluation of product reviews using an information quality framework[M].Elsevier Science Publishers B.V.2011.

[11]Zhang KZK,Lee MKO,Zhao S J.Understanding the Informational Social Influence of Online Review Platforms[C]// International Conference on Information Systems,Icis 2010,Saint Louis,Missouri,Usa,December.DBLP,2010:71.

[12]Smith T,Coyle JR,Lightfoot E,et al.Reconsidering Models of Influence:The Relationship between Consumer Social Networks and Word-of-Mouth Effectiveness[J].Journal of Advertising Research,2007,47(4):387-397.

[13]Susarla A,Oh J H,Tan Y.Social Networks and the Diffusion of User-Generated Content:Evidence from YouTube[J].Information Systems Research,2012,23(1):23-41.

[14]如何正确使用知乎的“赞同、反对、感谢、没有帮助”功能?——知乎官方账号回答[EB/OL].https://www.zhihu.com/question /19581512

[15]知乎如何对回答进行排序?你的一票很重要——知乎产品专栏[EB/OL].https://zhuanlan.zhihu.com/zhihu-product/19902495.

中图分类号 :F27

文献标识码: A

doi:10.19311/j.cnki.1672-3198.2019.10.028

标签:;  ;  ;  ;  ;  

社交问答平台答案有用性评价影响因素研究论文
下载Doc文档

猜你喜欢