链路分析的热点与前沿综述_相关性分析论文

链路分析的热点与前沿综述_相关性分析论文

链接分析研究热点与前沿综述,本文主要内容关键词为:热点论文,分析研究论文,链接论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

      1 前言

      从Mc Kiernan于1996年首先提出了Sitation这一新术语研究网页之间的引用关系开始,链接分析已经有十多年的研究历史。链接分析通过对网页间链接的数量、类型、集中与分散特征、变化特征等内容进行分析,用于网络信息资源评价和网络信息挖掘等领域。超链接(HyperLink)是互联网知识表现层中最典型、最重要的元素和现象,超链接的指向质量和密集程度直接关联该网站或网页的信息质量和可用程度,也能直接影响用户对该网站或网页的访问频度。通过对链接特征的分析,可以深入了解网络信息资源的拓扑结构及资源分布状况。超链接也是追踪和发现信息资源、资源聚类和自动分类、搜索反馈相关度排序、网络信息传播、竞争情报挖掘以及评价信息资源质量的重要指标,因此引起了包括图书情报学、计算机科学、经济学、社会学、物理学以及传播学等众多学科及其分支领域的关注,演变出不同的链接分析研究范式。2004年,Mike Thelwall提出了研究链接分析的三大方法[1]:情报学链接分析方法(Information Science Link Analysis Approach,ISLAA)、计算机科学链接分析方法(Computer Science Link Analysis Approach,CSLAA)和社会科学链接分析方法(Social Science Link Analysis Approach,SSLAA)。上述三种方法论视角的研究范畴相对稳定:CSLAA主要研究网络动力学、链接与内容的关系、链接和信息检索、网络挖掘等;SSLAA主要研究网络空间分析、虚拟民族志、超链接网络分析等;而ISLAA则以引文分析为基础,将“链接”视为一种推荐或认可,采用并改进现有的信息技术与方法,借助文档之间的相互关联,对文档自身的特征进行深入分析。

      由于网络的迅速发展,大数据时代的到来,链接分析研究领域有很多问题待解决:从用户的角度,研究用户通过链接浏览和获取信息资源的持续性、频率和效率评价问题,从安全的角度,垃圾链接与不安全链接引发的链接利用排斥问题,从知识产权的角度,用户利用链接缓存引发的链接内容知识产权纠纷问题等。而国内外的相关研究也同时关注到传统链接分析理论的弊端,包括没有及时清除链接中的无效链接、没有对链接进行有效分类以及没有深入地探究用户的链接动机等;在国内外的研究中尤其缺乏链接动机的理论的研究。

      2014年,我们在《情报学报》上面发表一篇名为《链接分析:知识基础、研究主体、研究热点与前沿综述——基于科学知识图谱的途径》的论文,论文基于Web of Science和中国知网中“链接分析”方面的文献数据,利用Citespace Ⅱ、SATI 3.1和Netdraw等文献计量与可视化分析工具绘制出国内外全时段链接分析文献关键词的共现知识图谱和分时段关键词共现知识图谱,以此识别出国内外链接分析领域不同学科视角下的研究热点与前沿范畴[2,3],然而此文对这些研究热点与前沿的总结不够全面、直观和清晰,并且未对他们的国内外研究情况进行文献综述。本文结合链接分析的图谱分析结果,并通过仔细研读领域的相关文献,归纳出链接分析研究领域的八大研究视角:检索优化的视角、网络计量学和评价的视角、竞争情报的视角、信息挖掘的视角、社会学的视角、法学的视角、行为学和心理学视角(属于链接分析研究前沿,包括链接行为和动机、链接作弊研究,等等)、统计物理学和传播学的视角。由于链接分析自身特征方面的研究文献较多,本文将不涉及该主题文献的综述。下面分别对每个视角下的链接分析研究文献进行详细综述。

      2 不同视角下的链接分析研究

      2.1 检索优化视角下的链接分析研究

      从检索优化的视角研究链接分析这一领域是国内外学者关注较早的领域,早在1997年,丹麦学者Almind和Ingwersen就开始采用网络计量学的方法对互联网链接展开深入研究,这也开启了网络计量学研究的新时代。Almind和Ingwersen在提出网络计量学的同时,还提出信息检索结果相关性排序的链接分析问题[4]。之后,在完全独立的搜索引擎研究领域,Google提出的Pagerank算法[5]和IBM提出的HITS算法[6],不约而同地将页面中的链接作为检索相关性评价的主要指标,这标志着链接分析在检索结果相关性排序的大规模商业应用的开启。伴随Google和IBM的商业成功,基于链接分析的网络广告服务商和搜索引擎优化服务商SEO(Search Engine Optimization)引领计算机学领域的学者,不断改进链接分析算法及其类似的迭代算法,其中包括IBM Almaden实验室开发的CLEVER系统、Compaq研究中心的Web Archaeology项目以及国内一些学者提出的改进算法[7],并应用于网页聚类、页面自动分类、知识推荐、页面扰动和主题漂移分析[8;9]。而在上述链接分析算法及其改进算法中,都采用了Pagerank算法的迭代原理,然其固有缺陷仍然存在:①站内网页在权值计算上的非独立性;②自动生成链接的干扰;③与主题无关或者主题漂移的链接干扰。目前用户生成内容越来越丰富,链接随机性和作弊行为会越来越多,链接干扰和主题漂移现象也会更加强烈,搜索引擎不得不正视这一问题。

      同时,众多信息服务评估机构和学者将链接分析的结果用于评价搜索引擎的性能,例如目前一致性指标(链接分析结果与搜索引擎结果的一致性)被国内外学者广泛用于评价搜索引擎的检索性能[10]。此外,链接分析工具还促进了网络信息自动采集技术,主要是聚集爬虫(Focused Crawler)的发展。与通用爬虫不一样的是,聚焦爬虫能够抓取具体主题的网页链接及内容,从而使用户能够建立各类主题的检索资源库,借检索研究之用。在聚焦爬虫的相关研究中,Almpanidis、Kotropoulos、Pitas等[11]学者设计了一种融合文本和链接分析的聚集爬虫算法,并应用于垂直搜索引擎[9]。罗林波、陈绮和吴清秀融合基于网页内容评价的Shark-Search算法和基于网页链接关系的HITS算法,实现了一个主题爬虫算法[12]。此外,倪贤贵和蔡明2008年研发了一款融合链接结构和内容相似度的聚焦爬虫系统[13]。这些成果都得益于链接分析方法的改善。

      2.2 网络计量学和评价视角下的链接分析研究

      链接分析法犹如文献计量学中的引文分析法[14],可借助其演绎推算出的一些指标,如网络影响因子、链接总数、入链数、外链数、自链数和共链数等,去评估网站、数字图书馆、学术机构、网络期刊等的网络影响力及其之间的关系,以及用于网页或页面排序,增强有用信息被发现的可能性。早在1996年,Mckiernan[15]在一系列关于网络组织和自动分类的研究中创立了“Sitation”的研究术语,最早将网络链接关系类比为文献引用和推荐关系,创建了网络链接分析的基本思想。随后,Abraham[16]、Rousseau[17]、Ingwerson[18]分别从网络结构和网页评价角度关注对网络链接的应用,提出了网络复杂性分析和网络影响因子等重要链接分析的工具和概念。Ingwerson在提出网络影响因子(Web Impact Factor)概念的同时,提出外链(external-link)、自链(self-link)和入链分析(inlink)的主要分析框架,并用于评价网站的网络影响力,标志着网络计量学的诞生。因此,网络计量学在诞生之初就与链接分析密切相关。2000年以后,Mike Thelwall将链接分析方法广泛应用于大学网站评价、资源发现和竞争情报分析[19,20],使之成长为全球LIS领域最高产的学者之一。而Owen Thomas和Peter Willett[21]等一大批图书情报工作者的跟进研究[22,23],促成了链接分析和网络计量学在图书情报学界的兴起。

      然而,网络影响因子方法的适用范围和有效性并未广泛认可。在“链接=推荐、认可”的假设前提下,链接分析和网络影响因子具有一定的可行性与可靠性[24,25];但众多学者仍指出内链接数的影响、链接与推荐认可的差异、无效链接等问题是链接分析的内在逻辑缺陷。因此,Mike Thelwall主张将分子中的内部链接数剔除,并将改良后的网络评价方法应用于大学网站、个人学术主页和学术期刊评价;Smith则主张将链接区分为实质链接和非实质链接的链接分类来改进链接分析框架[26];Franz Barjak和Li Xuemei等学者还运用类似链接分析的改良方法评价了欧洲科学家链接网络[27]。

      在网络计量和链接分析领域,国内学者结合应用实践,也作出了积极的理论贡献。如邱均平教授的研究团队独立发现了链接的网站分层规律、链接类型分布和动态变化规律[28,29],刘雁书[30]独立提出了链接分类标准和筛选机制。在实证应用中,参考国外的研究方法,国内也集中在规范网站评价(大学网站、政府机构网站和图书馆网站等)、学术评价和网络资源评价[31]。

      总之,国内外学者将链接分析类比文献计量学中的引文分析,资源评价则对应于科学评价理论,利用链接分析的具体指标构建网络信息资源综合评价指标体系。而在链接分析应用中,竞争情报、知识挖掘和知识社区分析得到拓展[32],逻辑上也试图通过链接行为理论弥补链接分析理论的缺陷。

      2.3 竞争情报视角下的链接分析研究

      企业要在市场中保持竞争力,竞争情报(Competitive Intelligence,CI)非常关键。一些有价值的商业信息通常隐藏在网络超链接中,因而链接分析也成为企业竞争情报获取的新的途径和来源。网络链接分析无论用于各类网络资源(包括网站、网页、博客、网络期刊等)评价及其资源拥有者之间相互关系的仿真推演,还是用于检索内容相关性排序和有用信息挖掘,无一不与竞争情报获取密切相关。例如,通过企业网站之间的共链分析或网页共引分析,可以发现主要竞争对手及其之间的相互关系,从而获得有关竞争对手的有用信息或情报,制定有效的竞争策略和方案;通过对网络用户或竞争对手的Web使用内容、日志或访问链接进行挖掘,可以提前得知用户喜好哪些信息或产品,也可以预先得知竞争对手的商业活动信息,从而制定用户偏好的信息推荐机制和产品销售策略,以及针对竞争对手的商业活动制定应对之策。

      2002年,Tan基于网络超链接关系构建了一个面向竞争情报获取的Web信息动态监控系统[33]。2005年,Liwen Vaughan基于“Yahoo”网站对32家电信企业进行共链分析,展示出每家电信企业的相对竞争地位[34]。段宇锋和邱均平使用两大链接分析指标:网页数和网络影响因子(Web-IF)对20个美国商学院网站质量进行评价,用户能够通过网站质量评价结果发现好的商学院,各商学院也能从中发现自己的竞争对手[35]。2006年,Liwen Vaughan基于企业网站共链数据绘制出主要企业及其之间关系的多维尺度分析法,揭示出企业的竞争地位及其与其他企业之间的关系[36]。2007年,杨宇航和赵铁军等提出一种基于链接分析的Blog信息源的量化评估方法,该方法能够发现反映Blog特点的重要信息源,并且在一定程度上减小了作弊链接对链接分析的影响,提供方便良好的用户阅读体验[37]。2012年,李志义等提出基于网络隐社区反链接挖掘的情报分析方法,利用企业反链接主题分析得出企业“隐社区”,并根据其相关度和反链接的贡献值计算出战略代表值,针对高代表值的网址挖掘竞争情报,分析战略意图,提出战略决策建议[38]。

      2.4 Web挖掘视角下的链接分析研究

      链接搜索引擎、Web信息检索、主题爬虫(或称聚焦爬虫)、Web结构挖掘是Web挖掘视角下链接分析研究的重要主题。现有的进行链接分析的主要工具有:Google搜索引擎、Alltheweb、Altavista等。国外学者进行链接分析实证研究主要以Altavista工具为代表[39]。而国内链接分析实证研究主要以Fast Search、Alltheweb和Google为主。并且可利用搜索引擎作为链接分析工具的分析效果对搜索引擎性能进行评价,例如Peter Ingwerson在网络影响因子的测算过程中,利用搜索引擎的统计结果性能作为其评价的一个测度[40]。

      Web信息检索和传统信息检索的最大区别在于被检索文档资源特征的不同,即Web文档或网页内有超链接结构,而普通文档没有。超链接将不同网络文档或网页链接起来,形成一种互联的链接关系,体现这种链接关系的基本元素是链接结构和链接文本。由此引出两类不同的Web信息检索方法:基于链接结构的Web信息检索方法和基于链接文本的Web信息检索方法。目前基于链接结构的检索方法已经发展的比较成熟。Botafogo根据链接结构,利用超链接方法使各类不同的网络文档或网页相互链接形成一种网络链接结构图,网络文档或网页是图中的各节点,节点之间的连线是链接。根据每个节点的出度和入度大小可以很方便地查找出众多Web文档或网页中的重要性或权威性文档或网页[41]。Kleinberg基于链接结构图中网络文档或网页的权威性(Authority)和继承性(Hub)理念,提出HITS算法[6],并应用于国际商业机器公司的检索系统,HITS算法是一个经典的链接分析算法,国内外学者不断对此算法进行改进[42]。此外,还有一种与HITS算法齐名的链接分析算法:PageRank算法[43],也广泛应用于各类检索系统,如Google检索系统。张敏和高剑峰等选择另一个发展尚未成熟的方面作为研究方向,深入研究链接文本在Web信息检索中的作用,通过实验考察链接文本及其上下文信息对检索系统性能的影响,并在此基础上提出基于链接描述文本及其上下文的Web信息检索方法[44]。

      主题爬虫(或称聚焦爬虫)主要用于采集具体主题的网络文档,为用户建立各类主题的检索资源库,借检索研究之用。主题爬虫与通用网络爬虫不同之处在于其抓取资源不要求覆盖所有主题,而只需要将与特定主题内容密切相关的网页进行抓取,是面向主题的检索。链接分析用于主题爬虫的研究中,汪涛等将链接分析用于改进主题爬虫的爬取算法[45]。Almpanidis等结合文本和链接分析设计了分类器[46]。2008年,一种融合链接结构和内容相似度的聚焦爬虫系统被提出,系统联合网页链接结构和内容相似度来计算网页相关度,提取权威网页或hub网页作为种子网页,实验证明该方法能够提高主题爬虫的爬取效率和所抓取网页的查准率[47]。这些成果都得益于链接分析方法的改善。

      Web挖掘主要包括内容挖掘、结构挖掘、日志挖掘和使用挖掘。Web结构挖掘主要挖掘页面的链接关系,研究站点的主题、潜在关联内容、连接与响应速度以及站点信息构建等,从中发现站点的重要程度、信息化水平等。Web页面间链接结构事实上隐含着权威的信息,能够改善Web信息检索(或搜索引擎)的性能,通过分析网页间的频繁链接,可以挖掘出网络中的权威资源。2005年,何拥军通过分析比较各类链接分析算法,融入权威来源和Web社团等最新设计理念,设计了一种基于链接结构发现Web社团的最大流算法,并提出基于链接结构的Web搜索结果聚类算法[48]。2006年,江裕民针对Web结构挖掘算法HITS算法中完全只考虑Web页面之间的超链接分析而忽略的Web页面的内容,导致分析结果出现主题偏移等不足,提出一种结合超链接分析和内容相关性分析的改进型Web结构挖掘算法。该算法通过对不同Web页面进行内容分析并赋予链接之间不同的权重来实现对HITS的改进[49]。2011年,一些学者针对传统Web结构挖掘算法只考虑出、入网页链接数,不考虑出、入网页链接相似度的不足,提出一种基于链接相似度的Web结构挖掘算法。

      2.5 社会学视角下的链接分析研究

      在社会学中,以网络虚拟社区和共链分析的弱关系为研究对象,引入社会学中的社会网络分析方法(SNA),先后提出了网络行为图、网络嵌入和网络社区理论[50]。社会网络视角的链接分析将网站、网页、链接以及链接关联的知识概念都视为一个网络个体,通过网络图谱的绘制和网络结构的分析,研究网页聚类和自动分类、共链分析、知识社区等问题。

      网络文档或网页聚类研究方面,一些国内学者利用网络文档或网页之间的超链接关系,设计了一些新的改进型聚类算法,如基于链接分析对检索结果进行聚类,来提高检索效果。基于共链分析法分析网络文档或网页之间的隐含关系,并对它们聚类分析,运用链接分析方法并结合聚类分析、多维尺度分析进行网站聚类[51]。

      网络共链分析(Web Colink Analysis,WAC)是网络知识挖掘(尤其是隐性网络信息资源获取)中常用的方法。1996年,Larson引入共链分析的基本理论,针对Web网页共链关系可以观察网络空间结构这一假设,结合共引分析对地球科学、地理信息系统、卫星遥感进行了实证分析[52]。2003年,Mike Thelwall基于共链分析方法和耦合理论对学术网站进行聚类分析[53]。2006年,Alesia Zuccala对网络共链分析和作者共引分析进行了比较分析,认为WAC的适用性仍有待深入考证[54]。周倩介绍与研究了共链分析方法在优化搜索引擎算法、研究学术机构关系、挖掘网络结构、分析学科发展态势与企业竞争情报等方面的应用[55]。2012年,毛彦妮和王菲菲综合运用共链分析与社会网络分析的方法,对国内市场份额排名前50位的电子商务网站的企业竞争态势与竞争关系及地位进行综合分析,并探索了如何挖掘企业间的潜在竞争关系[56]。

      Web在发展过程中存在着大量的社区,用户可以从社区中发现有用的、感兴趣的信息和知识,同时可以帮助网络服务提供者有效地组织门户网站。因此,Web社区发现是链接分析领域的一个重要研究主题。通过基于链接分析、共引和共耦合的社区发现方法可以对Web上的主题进行聚类,方便用户从网上获取信息。目前Web社区发现方法主要有四种:①基于重要度分析的PageRank算法。PageRank算法是与主题无关的页面排名算法,Taher H.Haveliwala[57]假设用户会选择自己感兴趣的主题页面进入,然后通过页面链接到达其他页面,即用户浏览的游动模型是基于主题的,从而将PageRank改造为与主题相关的算法,并且可以发现与主题相关的社区。②基于共引与共耦合关系的社区发现方法:HITS算法。Kleinberg[58]研究发现Web页面可分为两种类型:中心页面(Hub)和权威页面(Authority)。中心页面是指具有大量指向权威页面链接的页面,权威页面是指在某一主题领域被公认为权威的页面,从而中心页面和权威页面形成相互加强的关系,从而成为HITS算法的基础,但它只是利用重要的页面来标志社区,没有将Web页面划分为多个社区及子社区。③基于完全二分图核的算法。该算法建立在中心页面和权威页面的二分图关系上,由它提取的Web社区是主题相关的,但该算法提取的是社区核心,且无法确定社的边界及建立层次化的社区树。④基于最大流的社区发现方法。该方法是利用社区内的页面链接比社区外的页面链接要稠密的这一原则来设计的,与上述算法相同的是也不能发现层次化的社区。

      2.6 法学视角下的链接分析研究

      法学视角下的链接分析研究是国内学者研究的重要主题,国外类似的研究相对较少。基于链接行为和动机等分析的侵权责任、间接侵权、知识产权纠纷、著作权、信息网络传播权、合理使用、商标权和不正当竞争研究是法学视角下链接分析研究的重要主题。经常引发法律问题的链接行为和动机有:超链接行为、深度链接、链接作弊行为(以隐藏链接为代表),链接利用排斥问题(由垃圾链接与不安全链接引发)、链接内容知识产权纠纷问题(由链接缓存引发)等。北京金融城网络有限公司与成都财智软件有限公司之间的网络纠纷一案就是因财智公司的网站对金融城公司网站上的外汇币种走势图建立了深层链接而引起的。沈木珠和乔生认为应结合中外典型案例深入分析搜索引擎使用、未经著作权人同意的链接及链接有协议的侵权作品是否构成侵权等方面的问题,正确处理网络链接与信息网络传播权司法保护之间的关系[59]。2008年,江清云通过对德国“报童”案进行分析,并与中国相关法律进行比较,对超链接是否侵害了原作者的复制权、使用权、网络传播权,以及超链接是否违反了反不正当竞争法进行深入剖析[60]。王迁深入研究了“信息定位服务提供者”和链接服务间接侵权的认定问题[61]。

      2.7 行为学和心理学视角下的链接分析研究

      上世纪的九十年代中期,国外兴起了网络环境下作者链接行为以及用户通过链接浏览和查询行为的研究。1996年,Larson[62]尝试利用图形可视化网络知识研究超链接组织,并与树型结构作出对比。而后的1999年,Kleinberg[6]发现网络链接图谱中信息资源权威的“嵌入”行为。

      Thelwall、Kretschmer和Newman为代表的研究者引领了网络行为研究领域的研究,主要基于实验研究和数据实证,构建了大量网络行为参考模型并总结出了网络社会分析结论。Kim[63]针对个人超链接行为进行了研究,Cothey[64]经过10个月对206个英国大学生的网络信息查询行为进行了研究,经过事务日志分析用户信息搜寻的行为。

      链接行为动机主要包含学术性动机、社会性动机、技术性动机和价值增值动机四大类。Kim学者的研究发现:技术动机而使用的链接至少有39%,但是在资源引用的影响力评测价值不大。Chu[65]通过研究指向学术网站的链接,发现指向资源或者目录信息的链接占了50%,研究或者教学/学习动机的链接只有27%。Wilkinson等研究发现在链接到大学网站中只有不到1%的链接是正式的研究引用。Smith研究大学网站外部链接的来源网页和目标网页的类型发现20%的链接与引用相似。

      另外,由于网络链接存在广泛动因以及网络链接目标文献的复杂性,网络链接不同于引用的动机。且Kim的研究方法也存在缺陷,就是链接动机调查的受访人群局限于印第安纳大学的学生,留下了改进其研究的空间。同时,链接行为研究尚未建立系统模型框架,国内还没有利用间接分析来研究潜在的链接动机的先例。

      在链接作弊研究方面,2012年,贺志明等学者在分析多种作弊方法对传统PageRank算法所造成不利影响的基础上,提出了一种可以抵抗链接作弊的三阶段PageRank算法——TSPageRank算法。实验证明TSPageRank算法比传统PageRank算法在效果上提高了59.4%,能够有效地提升重要网页的PageRank值,并降低作弊网页的PageRank值[66]。

      2.8 统计物理学和传播学视角下的链接分析研究

      在统计物理学研究中,以Barabasi、Albert、Jeong为代表的研究团队[67]和Newman[68]、Kumar[69]、Watts和Stogatz[70]等学者经常关注网络链接的拓扑结构、链接密度和链接特征的动态演变规律,开创了结构分析或网络动力学的研究视角。早在1998年Watts和Stogatz在《自然》杂志发文提出小世界网络模型,1999年Barabasi和Albert在《科学》杂志发文提出无标度网络模型,并认为网页节点度的分布服从幂数定律,并用偏好性依附解释了幂数分布形成的机制等,为人们对Web社区的理解提供了理论依据。Kumar等学者利用网络拓扑结构建立了一种Web图数学模型,并给出一种用于模拟Web超链接建立过程的随机拷贝机制。随后2000年Barabasi和Albert研究了网络内部加链接和链接的重定向对网络结构的影响[71]。2011年Liu、Slotine和Barabasi在Nature杂志发文提出致密、均一的网络可以通过少数几个驱动节点来调控[72]。

      国内外学者对传播学视角下的链接分析研究还相对较少,2000年Rogers[73]分析了互联网空间科技主题辩论角色之间的超链接特征,通过链接内容的相似性揭示了科技主题辩论角色的群体特征。2002年,Foot[74]通过分析2000年美国总统选举期间政治性网络内容发布者之间的相互链接情况和政治信息传播扩散的途径,揭示了网络空间中政治活动的本质。随后2016年Liu[75]分析了“占领华尔街运动”期间Twitter超链接传播网络的形成和演化规律,并以信息源类型、网络节点流行性和网络中心度作为三个指标预测了“占领华尔街运动”信息源网络族系形成的概率,同时从Twitter上识别出对“占领华尔街运动”讨论至关重要的一组信息源。

      3 结语

      虽然链接分析发展非常迅速,但还需要进一步研究其理论基础、研究方法及工具等。需要对链接分析的理论基础进行系统的梳理,突破对链接分析的常规认识,从用户、链接内容和情境三者互动的角度对链接行为动机和链接类型进行深入探讨;在利用计量分析和共链分析方法进行研究方法研究过程中,可借鉴大样本用户调研法、小样本用户访谈法、社会网络分析法或Delphi法等拓宽其应用。尽管链接分析理论和实证研究体系已日臻成熟和完善,但仍缺乏一套融入不同学科范式以及行为学视角的集成理论框架。因而本文进行了国内外全时段链接分析,文献关键词共现知识图谱和分时段关键词共现知识图谱的绘制,识别出国内外不同学科范式下的链接分析领域研究热点与前沿范畴:检索优化视角;网络计量学和评价视角;竞争情报视角;信息挖掘视角;社会学视角;法学视角;行为学和心理学视角(属于链接分析研究前沿,包括链接行为和动机、链接作弊研究,等等);统计物理学和传播学视角进行链接分析研究,以及链接分析自身特征研究。在对不同学科范式下链接分析领域研究热点与前沿进行简要综述的过程中,我们发现:检索优化视角、网络计量学和评价视角下的链接分析研究已经发展得比较成熟,而竞争情报视角、Web挖掘视角、社会学视角、法学视角、行为学和心理学视角、统计物理学和传播学视角下的链接分析有待更深入的研究与探索,尤其在法学、行为学、心理学和传播学视角方面。希望能够为相关领域读者提供一个理论指导框架。

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

链路分析的热点与前沿综述_相关性分析论文
下载Doc文档

猜你喜欢