基于文献计量的个性化推荐研究进展分析论文

基于文献计量的个性化推荐研究进展分析

徐勇 XU Yong;汪倩 WANG Qian;张玮 ZHANG Wei;武雅利 WU Ya-li;焦梦蕾 JIAO Meng-lei;许崇 XU Chong

(安徽财经大学管理科学与工程学院,蚌埠233000)

摘要: 个性化推荐有效缓解了大数据时代“数据爆炸”的现象,通过事先了解用户的潜在兴趣偏好,有针对性的提供符合用户实际需求的信息,从而提高用户的使用效率。本文通过文献计量的方法对2008年到2018年之间的有关个性化推荐的相关文献进行统计分析,分别从时间分布、期刊分布、关键词共现分析以及关键词聚类分析几个部分展开研究,以发现个性化推荐领域的主要研究热点问题与发展趋势,进而探讨未来研究的走向,为个性化推荐的发展提供依据。

关键词: 个性化推荐;文献计量;研究进展

0 引言

Web 2.0时代的到来,用户从过去单纯的浏览网络信息到现在既能阅读信息同时还能自由的在网络上生成大量内容,使得网络资源数量庞大,用户使用网络获取资源时,很难准确找到所需要的信息,从而浪费用户时间,促使互联网的使用不再方便便捷。个性化推荐技术有效缓解了该现象,它通过事先了解用户的需求偏好,并针对其偏好推荐相应的内容信息,从而满足用户的需求。目前,个性化推荐技术也被广泛应用于多个领域,有效促进各行各业的发展进步。因此,本文针对个性化推荐领域进行文献计量分析,了解该领域的研究整体趋势特征,挖掘研究热点问题,进而更好的把握个性化推荐的研究进展状况[1]

盛夏的早晨,沿着蜿蜒的山路一直向上,一片片翠柏苍松,一垄垄整齐的茶园,随时夺走目光的是闪烁着大红大紫的花树,空气清新,心旷神怡。在最顶峰,极目远眺,蜿蜒起伏的绿意,犹如一条静静盘卧的巨龙,在曙光的照耀下,它抬头顿足,咬住了山脚下的一处明晃晃的金潭,真是“游龙戏珠”的奇特景观啊,“龙山”不虚此名!而开创这龙山盛景的当家人韩金来更是让我们由衷的钦佩!

“双师素质”教师团队是高职院校实现现代化人才培养目标的根本,是高职院校提高教学质量的关键所在人力。我们要积极优化教学团队,合理配置教学资源,改进教师管理制度,建立科学的“双师素质”培养平台,从而建设一支适应互联网时代的“双师素质”教学团队。

1 数据来源与研究方法

本文以CSSCI和EI两个数据库作为数据来源,并以“个性化推荐”作为“主题”“关键词”“篇名”分别进行检索,时间跨度为2008年1月1日到2018年12月31日,共获得510篇相关研究文献。通过人工对搜索到的文献进行阅读筛选,去除无关、重复等文献后,最终获得503篇文献(检索时间:2019年3月17日)。

文献计量法是一种专门通过数学的方式统计文献的如发文时间分布、期刊来源分布、作者机构分布等文献一般特征,并基于得到的特征了解所研究领域的研究整体状况以及研究的走向,探索未来的研究发展趋势,为更好的促进该领域的进一步深入提供支持。本文通过使用Excel、citespace软件对所获得的研究文献进行文献计量分析,获得研究文献的文献特征,并通过对核心关键词以及关键词的聚类分析等来挖掘研究热点问题,探索未来的研究发展方向。

2 计量结果分析

2.1 时间分布

通过对关键词进行聚类分析,将相同主题的关键词聚成一类,并对同一类别的关键词进行梳理,进而挖掘个性化推荐领域的研究热点话题。本文使用citespace软件进行聚类,并过滤掉较小的类别,按时间进行展示,各聚类结果如图3所示。

图1 时间分布图

2.2 期刊分布

期刊分布能在一定程度上反映个性化推荐领域研究的现状以及研究深度,对于想要初步了解此领域的学者可提供一定的相关信息[2]。通过对这503篇文献的统计后,发现文献共分布在103种期刊上。其中,发表文献数量在10篇以上的期刊共有11种(如表1所示),而这11个期刊所发表的文献总量高达274篇。图书情报工作发表的相关文献数量最多,高达43篇,情报理论与实践、现代情报、情报科学这3种期刊发表的文献数量也均在30篇左右。可以发现,对于此领域的研究,学者发表的文献主要在这11种,且大多在图情领域较多。

2.3 关键词共现分析

从表2可以看出,词频在10次以上的共有16个关键词,除了“个性化推荐”“个性化”“个性化服务”“个性化信息服务”这4个明显有代表性的关键词以外,其余几个高频关键词的中心度也很高,说明这些词在个性化推荐领域研究的较多。通过对这12个高频词进行分析,可以将其分为3个部分。第1部分包括“协同过滤”“推荐系统”,它是个性化推荐研究的核心构件,目前对于个性化推荐的研究主要集中于推荐算法、推荐模型、推荐系统的构建,而协同过滤技术是运用较多的一种推荐算法。第2部分是“大数据”“电子商务”“数字图书馆”“高校图书馆”“图书馆”等,表明了个性化推荐的主要应用领域。第3部分由“情境感知”“用户偏好”“数据挖掘”等组成,显示出此研究领域中密切相关的技术与研究方向,是实现个性化推荐的关键部分。

表1 主要期刊来源分布

并统计出频次在10次及以上的高频关键词,如表2所示。

文献中的关键词是涵盖该文献主要研究内容与研究方法,代表研究的中心思想的。因此,关键词共现分析对于明晰个性化推荐领域的研究进展与现状是必不可少的。使用citespace软件进行关键词分析,如图2所示。其中,节点的大小代表其中心度的大小,节点越大,表明中心度越多高,各关键词之间的连线代表其共现的次数,连线越粗,表明共现次数越多。

2.4 关键词聚类分析

通过对2008年到2018年间发表的503篇相关研究文献进行统计分析后,绘制成发文篇数随时间变化的折线图,如图1所示。从图中可以看出,从2008年到2018年期间发文篇数整体呈现上升的趋势,虽期间存在一定的下降,但整体相对于2008年的16篇仍是上升的。而此现象的出现正是由于互联网时代的到来,越来越多的用户使用互联网,造成网络数据泛滥的现象开始出现,为了使用户更好的使用互联网,个性化推荐技术显得尤为重要。因此,对于个性化推荐的研究越来越引起学者的重视,相关的研究文献不断涌现。

从表2中可以看出,第一行和第三行是请求控制被授权后,系统执行车道校正时,执行机构失效了,系统安全性概率降低了,但系统没有违背安全属性,此时产生的系统最大可能执行路径不是系统反例.第二行和第四行的系统安全性概率非常低,根据观测序列可知,系统的执行机构失效后,请求控制获得授权,系统违背了安全属性,即此时系统的最大可能执行路径是系统反例.通过对表2的分析可知,系统安全性预测结果和以最大可能执行路径作为反例的预测都可能产生错误,5.3节通过实验评估本文方法的安全性和反例预测结果的错误率.

从图中可以看出,将关键词主要分为了6大类,分别为“电子商务”“用户画像”“个性化信息服务”“情境感知”“协同过滤”“个性化推荐”。通过对这6类的主题进行统计分析后,将其分为两大主要研究类别。其一是个性化推荐技术的应用领域研究。目前个性化推荐主要应用于电子商务[3,4,5,6]、图书情报[7,8,9]、音乐[10]、新闻推荐[11]等领域中,这是由于个性化推荐技术能够有效缓解大数据时代网络信息资源泛滥的情形,根据用户喜好进行自主推荐,对于提高用户的使用效率和主观感受,显得尤为重要。另一个主要研究类别是实现个性化推荐技术所需的推荐算法、用户画像、数据挖掘等技术的进一步研究。推荐算法是实现个性化推荐的核心所在,而目前使用较多的是协同过滤技术,它通过挖掘出与目标用户相同喜好的其他用户,并将其他用户购买的物品中目标用户未购买的商品推荐给用户,从而实现个性化推荐。而事先了解用户的兴趣偏好对于个性化推荐的实现是不可或缺的,用户画像技术也因此逐渐展开研究。通过采集用户在网络上的行为数据,运用自然语言处理、机器学习等技术分析数据,从而提取用户特征标签,构建用户画像。因此,运用用户画像技术,能够迅速便捷的获取用户偏好,从而进行有针对性的推荐,实现“个性化”。

表2 高频关键词

图3 关键词聚类时间图谱

图2 关键词共现图

3 结论

本文通过使用文献计量的方法,运用citespace、Excel软件对2008年到2018年之间的有关个性化推荐的研究文献进行统计分析,分别从时间分布、期刊分布、关键词共现以及聚类分析几方面进行研究,以发现个性化推荐领域的主要研究热点问题与发展趋势。未来对于个性化推荐的研究仍需进一步提高推荐算法的推荐精度,更好的消除冷启动、数据稀疏所造成的影响,实现更精准的推荐。其次,需采集跨领域的用户相关数据,构建更加完善的用户画像,以发现用户的多方面的需求特征,提高推荐效果,同时考虑用户兴趣变化的特点,构建实时的用户画像。然后,现有的个性化推荐大多应用于电子商务、音乐、新闻等领域,未来可继续扩展其应用范围,可将其推广到医疗领域、教育领域等。最后,对于推荐效果的好坏如何进行评价,可构建一个统一的指标体系,提高评价的可信度,更好的实现个性化推荐。

参考文献:

[1]孙湘湘,周小亮.我国产业经济学研究热点和前沿的可视化分析 [J].武汉理工大学学报(信息与管理工程版),2018,40(05):550-555,560.

[2]刘智颖,贺颖.基于CNKI数据库的档案用户需求文献计量分析(2010-2017)[J].档案管理,2019(01):22-25.

[3]杜巍,高长元.移动电子商务环境下个性化情景推荐模型研究[J].情报理论与实践,2017,40(10):56-61.

[4]刘晶,李妍,侯会茹.移动电子商务多源关联个性化推荐架构[J].情报理论与实践,2014,37(04):98-100.

[5]陈明.基于信息流的实时电子商务动态个性化推荐[J].情报杂志,2008(08):29-30,56.

[6]邵波,宋继伟.国内外电子商务个性化服务研究分析[J].情报杂志,2008(07):78-80.

[7]耿立校,晋高杰,李亚函,孙卫忠,马士豪.基于改进内容过滤算法的高校图书馆文献资源个性化推荐研究 [J].图书情报工作,2018,62(21):112-117.

[8]焦玉英,袁静.基于情景模型的数字图书馆个性化服务研究[J].中国图书馆学报,2008(06):58-63.

[9]王庆,赵发珍.基于“用户画像”的图书馆资源推荐模式设计与分析[J].现代情报,2018,38(03):105-109,137.

[10]李瑞敏,林鸿飞,闫俊.基于用户-标签-项目语义挖掘的个性化音乐推荐[J].计算机研究与发展,2014,51(10):2270-2276.

[11]孟祥武,陈诚,张玉洁.移动新闻推荐技术及其应用研究综述[J].计算机学报,2016,39(04):685-703.

Research Progress Analysis of Personalized Recommendation Based on Bibliometrics

(School of Management Science and Engineering,Anhui Finance and Economics University,Bengbu 233000,China)

Abstract: Personalized recommendations effectively alleviate the phenomenon of"data explosion"in the age of big data,through the prior understanding of the user's potential interest preferences,targeted to provide information in line with the actual needs of users,so as to improve the efficiency of user use.Through the method of literature measurement,this paper makes a statistical analysis of the relevant literatures about personalized recommendations between 2008 and 2018,and studies them from several parts,such as time distribution,periodical distribution,keyword co-analysis and keyword clustering analysis,in order to find out the main research hot issues and development trends in the field of personalized recommendation.Then it discusses the trend of future research and provides the basis for the development of personalized recommendation.

Key words: personalized recommendation;literature measurement;research progress

中图分类号: TP274+.2

文献标识码: A

文章编号: 1006-4311(2019)15-0142-03

基金项目: 2015年度国家社科基金规划项目《跨媒体用户生成内容情感倾向挖掘及其应用研究》(项目编号:15BTQ043);2018年度安徽省自然科学基金《大数据知识工程视角下UGC挖掘算法及其应用》(项目编号:1808085MF194);2018年度安徽财经大学研究生科研创新基金《基于用户生成内容的增量式用户画像研究》(项目编号:ACYC2018229);2018年度安徽财经大学大学生科研创新基金项目《跨媒体UGC的管理分析和识别算法研究》(项目编号:XSKY1820ZD);2018年国家级大学生创新创业训练计划项目《基于淘宝、唯品会等电子商务平台的UGC管理和用户信誉评级模型和算法的设计》(项目编号:201810378212)。

作者简介: 徐勇(1978-),男,安徽泾县人,教授,安徽财经大学管理科学与工程学院,研究方向为数据挖掘与社会计算、大数据与人工智能。

标签:;  ;  ;  ;  

基于文献计量的个性化推荐研究进展分析论文
下载Doc文档

猜你喜欢