我国图书情报领域研究人员对网络信息资源利用的分析_相关性分析论文

我国图书情报领域研究者对网络信息资源的利用分析,本文主要内容关键词为:研究者论文,信息资源论文,情报论文,领域论文,我国论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

      1 引言

      网络信息资源数量庞大,增长迅速,形式多种多样,来源分散,质量参差不齐,研究者对网络信息资源的选择和利用情况必然与对传统信息资源的使用情况不同,他们如何进行选择,主要选择哪些资源,对网络信息资源又有着怎样的需求,这些都是数字时代下需要探讨的问题。另外,如何能通过深度聚合特定学科领域需要的网络信息资源让研究者更加准确快捷地搜索并获取所需要的学术信息,即如何实现网络上分散资源的整合利用已经成为亟待解决的研究课题,为进行此课题的研究必须首先对特定领域研究者选择和利用网络信息资源的情况有较深入的了解,并在此基础上总结研究者的聚合需求。

      董小英等学者采用问卷调查的方法,对我国学术界互联网用户的背景、用户利用互联网资源的现状、用户的信息查询行为、用户对互联网信息资源的评价和用户对未来互联网服务的期望5个方面进行了分析和讨论[1]。而更多学者通过网络引文计量分析来了解网络信息资源的使用情况。网络引文即参考文献中,著录内容含有网址(URL)的引文[2],一篇论文的网络引文就是该论文引用的网络信息资源。国内研究有宋歌[3]、谭芳兰[4]、张洋等[5]、薛卫双等[6]学者分别在2001-2010年不同时期对我国图书情报学期刊所载论文的网络引文的各种特征量进行统计分析,探讨网络学术资源开发与利用的相关问题,分析的特征量包括网络引文的数量、语种、域名、类型、网站被引频次、高频被引网站、篇平均网络引文量、作者情况等。国外研究主要有:①网络引文的衰减规律即对网络信息资源生存期的研究,如Harter和Kim[7],Robert[8],Sampath Kumar[9]等学者,研究结果表明,不同时期,不同学科领域,不同期刊网络引文链接的可访问性存在差异,而且都不理想,同时随着时间回溯,可访问性越来越低;②探讨网络引文类型或引用网络引文的目的,如Kousha指出存在于开放存取期刊的网络参考文献中仅仅有1/4的参考文献为学术目的,许多参考文献只是一般或具体的导航和自我宣传,而且不同学科的网络参考文献也存在着许多差异[10];③还有学者提供逆向的研究思路,探究论文被网络信息资源引用的情况,这种网络引文被称为Web-Print网络引文,如Vaughan和Shaw使用Web of Science检索图书情报学期刊论文被引次数(传统被引数),使用Google搜索引擎记录W-P网络引文情况(网络被引数),结果显示57%的期刊网络被引数与传统被引数显著相关,期刊影响因子和网络引文平均值之间也具有显著正相关性[11]。

      本文也是采用对网络引文的计量分析来进行研究。因为通过对网络引文进行深入的统计及数据挖掘分析,来研究特定学科网络信息资源使用情况,比访谈和问卷调查等方式更具有客观性、实用性与针对性[12],同时,笔者发现尽管已有不少论文运用网络引文的实证分析方法探究研究者利用网络信息资源的情况,但是通过对网络引文的分析还能得到更多的信息,特别是能够为网络信息资源聚合提供理论指导的信息,如研究者使用网络信息资源的目的、网络信息资源来源网站的具体类型等,较少研究深入分析这方面的内容,本文增加了对这些内容的分析,也是对目前研究现状的一种补充。

      另外,现有研究的样本基本来源于期刊所载论文,而没有考虑学位论文、会议论文的网络引文。学位论文与会议论文同样是学术研究成果的重要组成部分。学位论文是在导师的严格审核和直接指导下,用2~3年时间才完成的科研成果,还必须通过院校或研究所的专家评审答辩后才能通过,其论文质量有保障,而且,研究生在撰写论文的过程中,往往要查阅大量的国内外文献资料,使参考文献呈现多而全面的特点,这是学位论文与期刊论文、会议论文最大的区别[13];对于会议论文,鉴于定期举行会议,会议论文讨论的研究课题紧扣当下热点,且审查速度较快,而期刊论文受限于比会议论文更为细致的评估标准,研究人员必须不断地修改自己的文章,直到它与审稿委员会成员提出的建议一致。因此,期刊论文缺乏会议论文所具有的时效性和新颖性[14]。基于学位论文、会议论文同期刊论文存在的差异以及它们在学术研究上的重要性,笔者认为有必要将学位论文与会议论文与期刊论文一起列为研究对象,以得到更加全面、客观、充分的研究结果。这也是本文对网络引文研究发展方向提出的新的思考。

      2 分析框架

      图书情报领域网络信息资源聚合是指将来自于多个位置、异构的,能够在图书情报领域用户专业学习、学术研究与管理决策中发挥作用的、不同粒度的结构与非结构化的网络信息资源整合在一起。因此,网络信息资源聚合需要了解研究者利用的网络信息资源的主题、来源、类型、利用目的等的分布规律。借鉴已有的网络引文研究内容,并增加进行网络信息资源聚合研究需要的并可以从网络引文中获得的信息(如网络信息资源的主题分布、网页类型分布、网站类型分布等),笔者建立如图1所示的分析框架,并将分析内容划分为整体利用情况和个体利用情况两方面。

      

      图1 网络引文分析框架

      整体利用情况主要指研究者利用网络信息资源的广度、深度、集中度和所利用资源的稳定性。个体利用情况分析主要立足于单篇论文分析研究者引用网络信息资源的数量、类型和目的。

      3 图书情报领域网络引文定量分析研究

      3.1 数据来源

      为探究当前图书情报领域网络信息资源的特征和需求,同时考虑到网络引文衰减规律的影响,笔者选取2010-2012年发表的图书情报领域的期刊论文、会议论文、学位论文进行分析。期刊论文上选择《中国图书馆学报》《图书与情报》《情报理论与实践》这三种期刊为分析样本。期刊论文的引文通过CSSCI引文数据库下载,再从中抽取网络引文。对于学位论文和会议论文,笔者采用的方法是在CNKI博硕士文献/会议文献的检索页面下,将学科领域选定为“信息科技”下的“图书情报与数字图书馆”,再选定发表时间以及增加参考文献包含“http”或“www.”这个检索条件进行检索,获取包括网络引文的文献。由于CNKI无法直接下载参考文献,所以笔者是先将论文下载下来,再抽取其中的网络引文,考虑到数据处理能力的限制,笔者对包含网络引文的期刊论文,会议论文,学位论文进行随机抽样(利用SPSS 20中选择个案的功能,会议论文每年选择50个样本,期刊论文每年选择60个样本,学位论文每年选择65个样本,以时间为随机数种子),记录这些文献的网络引文再利用Excel和SPSS进行分析。抽样情况及网络引文的可获得率如表1所示。

      由表1可知,学位论文引用网络引文的现象最为明显,2010-2012年都有超过60%的文献包含网络引文,且篇均网络引文量在7条左右,其次是期刊论文,包含网络引文的文献占50%以上,篇均网络引文量在4条左右,会议论文也有超过20%的文献引用了网络引文,篇均网络引文量在2~3条。不过,这三种文献在三年间对网络引文的利用频率并没有明显的增长,甚至有细微的下降,这表明图书情报领域研究者对网络信息资源的利用已经到达一种较为平稳的状态,相较于其他较早时期相关文献提到的飞速增长的势头已经过去,研究者对网络引文的利用渐趋理性,此时利用网络引文对研究者网络信息资源的使用情况进行分析应该能获得更客观、有价值的结果。样本的网络引文可获得率为65.78%。

      

      

      图2 网络引文主题分布图

      3.2 整体利用情况分析

      3.2.1 资源利用广度分析

      (1)被引资源主题分布

      笔者浏览采集到的2012年所有能够成功链接的网络引文,记录网络引文的主题,并利用Excel宏操作将会议、期刊、学位三个论文集的全部网络引文主题分布情况绘制成标签云图,如图2所示。图中括号内的数字表示主题出现的频次。为了消除单篇论文网络引文数量的影响,如果在同一篇论文中引用了多篇相同主题的网络引文,这多篇网络引文的主题频次只记为1。

      从图2不难发现,网络引文的主题非常丰富,既有与图情领域紧密相关的理论,如图书馆、本体、云计算、语义网等,也有精准营销、生态城市、留守儿童等跨学科的主题。其中,以图书馆为主题的相关内容被引用得最多,其次是本体、微博、云计算、标签等。笔者继而统计了图书情报领域主题与非图书情报领域主题的引用频次,得到如表2的数据。有18.38%的网络引文是非本学科领域的理论,比重较大,一方面是因为图书情报学具有交叉学科性质,另一方面也是因为随着网络的发展,网络的便捷性日益凸显,网络信息资源的质量逐渐提高,通过网络来获取自己不熟悉领域的信息是一种高效率的途径。其中,会议论文的跨学科引用情况最为显著,有35.29%的网络引文是非图书情报领域的内容,笔者认为这与会议论文的特点有关,会议论文时效性最强,论文中会引用更多与政治形势,时代特点,前沿学科相关的内容,而这些内容往往最先在网络上发布,因此,会议论文参考较多非图书情报领域的网络引文。而期刊论文与学位论文的网络引文在主题上分布情况相似。

      (2)被引网页类型分布

      为了了解图书情报领域研究者对网络信息资源文本格式的需求,笔者对2010-2012年网络引文的网页类型进行了统计,结果如表3所示。

      动态网页是指与静态网页相对的,通过网页脚本和语言自动处理、自动更新的页面,多以.asp、.aspx、.php、.jsp结尾[15]。其他类主要是一些只以网站、主机形式或IP地址著录的引文。由上表可以看出,2010-2012年网页类型引用变化最明显的是对PDF的引用,且呈现增长的趋势。PDF能够跨平台显示任何源文档的原貌(包括字体、格式、颜色和图形等),且压缩的Adobe PDF文件比源文件小,易于传输与存储,同时,它还是页独立的,可以单独处理各页,每次下载一页在网页上快速显示,而且不会降低网络速度[16],因此,PDF越来越成为网络学术资源的标准格式[17]。

      会议、期刊、学位论文网络引文的网页类型如图3所示。可见,在会议论文中,研究者们引用PDF格式资源的情况并不显著,笔者认为这和会议论文的特点有关,会议论文更多参考时下最新的前沿信息,这类信息较少以PDF格式存在,所以,会议论文更多地参考动态网页或者以html/htm/shtml等静态网页格式呈现的资源。三种文献都较少引用网络Excel表格,Word文档,PPT文档等资源。

      (3)被引网站域名分布

      通过对网络引文的高层域名进行分析,可以了解网络信息资源的来源和分布集中情况。笔者统计发现网络引文较常见的类别域名有.com(工商金融等企业)、.edu(教育机构)、.org(非营利性组织)、.ac(科研机构)、.gov(政府部门)、.net(互联网络的信息中心和运行中心),类别域名可能在网站中充当顶级域名,也可能充当二级域名,如.com.cn,对于后者,本文提取该网址的二级域名进行统计。不同域名在三类论文的网络引文中的分布情况如图4所示,其他指著录为IP地址、网址中无类别域名只有国别域名以及属于其他类别域名如.mil、.info、.name等的网站。

      

      

      

      图3 被引网页类型分布情况

      

      图4 被引网站类别域名分布情况

      读图可知,会议论文引用域名的频率.com>.edu>.org>.gov>.net>.ac,而期刊论文.org>.com>.gov>.edu>.gov>.net>.ac,学位论文.com>.org>.gov>.edu>.gov>.net>.ac。三类文献的引用情况接近。从全球范围来看,.com网站在所有网站中比例最高,其次是.net,但是网络引文中引用.net的比例较少,可见,研究者们对网络信息资源是有选择性地使用的,.com、.org、.edu的网站中包含了较多可信度较高、质量较好、满足图书情报领域研究者学术需求的网络信息资源。本文同时对2010-2012年三年类别域名使用频率进行统计,发现差别不大,在此不赘述。

      值得注意的是,笔者对国家或地区级域名也进行了统计,发现图书情报领域研究者除了引用中国域名和国际域名的资源外,还引用其他国家或地区域名的资源,如表3所示。我们可以发现图书情报领域网络信息资源的来源非常广泛,研究者们具有较强的外文资源使用意识和能力。并且,对其他国家或地区资源的引用频次逐年有所增加,来源也有愈加广泛的趋势。英国、德国、中国台湾地区、加拿大的资源参考较多。

      

      (4)被引网站类型分布

      尽管通过网站的域名可以了解网络信息资源的来源,但是域名的分类比较宽泛,不足以帮助我们建立对网络引文来源网站的清晰认识。本文对网站进行更具体的分类,以更深入地探究图书情报领域网络信息资源利用的特征和需求。本文的分析基于网址的服务器级别,即根据URL中hostname(主机名)来分析,它是指存放资源的服务器域名(显著特点是在URL中有“/”符号与其他部分分隔开)[18]。

      中国互联网络信息中心按照主题性质的不同,将网站分为政府网站、企业网站、商业网站、教育科研网站、个人网站、其他公益性网站以及其他网站七类。笔者通过观察采集到的网络引文并参考互联网信息中心的分类,将网站类型分为政府网站、机构网站(包括企业与非营利组织)、商务网站、教育科研网站、个人网站、新闻网站、在线百科全书、信息门户网站和其他网站九类,并按获取途径对一些类目再进行细分,得到如表4的网站类型体系。

      笔者按照表4分类体系,统计采集到2012年的所有可打开网络信息资源的网站类型,得到被引网站类型分布如图5、图6所示。由图5可知,教育科研网站在三类论文中都占据最大的比重,会议论文占48.24%,期刊论文占47.71%,学位论文占38.80%,这里的教育科研类网站不只包括域名为.edu的网站,还包括域名为.org的学术机构主页,学术会议主页,开源软件下载网站,协议标准说明网站等学术类网站,可见图书情报领域引用的网络信息资源仍较多来自学术网站。在细分类目中,会议和期刊论文引用最多的是图书馆网站,而学位论文网络引文最多来自专业信息门户,专业信息门户指经过组织、有序化和人工处理、专家排选、定期检查处理的某一学科或某一领域的信息导航系统,如SocialBeta(http://www.socialbeta.com/)专注于社会化媒体这一领域的研究和资源共享,便是一个社会化媒体的专业信息门户网站。可见,专业信息门户网站也是图书情报领域网络信息资源的重要来源,应予以重视。

      

      图5 被引网站类型分布情况(1)

      学术协会/机构网站被引用的频率也很高,会议论文的网络引文来自学术协会/机构网站的占所有网络引文的7.06%,期刊的占11.11%,学位的占10.06%。学术协会/机构网站指学术型组织的主页,如OCLC(联机计算机图书馆中心)主页(http://www.oclc.org/)提供中心成员、产品及服务、新闻及活动等的信息,便归入到学术协会/机构类网站。文献导航网站也被引用较多,文献导航网站指如CSSCI、Calis、CiteSeer等提供文献索引的网站,笔者观察发现作者对这类网站大多是整体引用,即将这类网站作为论点的例证或实证分析的对象,而比较少引用网站中全文型的信息。对商务网站、搜索引擎、社交网站的引用也存在这样的情况。

      网站引用类型的整体分布情况如图7所示,可见教育科研机构网站在图书情报领域网络信息资源中的重要地位。

      (5)被引网络信息资源语种分布

      本文通过统计网络引文来源网站的语种来获得被引网络信息资源的语种分布情况,得到如图8的结果,对于少数日语、德语、法语等的网络资源以及没有标出题目的网络引文归入其他类。除了会议论文,其他两类论文都较多地参考了外文的网络信息资源,外文大部分是英文。结果反映了图书情报领域研究者掌握和使用外国文献的能力较高,对外文文献有较高的需求。笔者认为会议论文引用外文网络信息资源较少的原因在于会议的主题(较多涉及图书馆和信息服务)需要更多地参考我国的信息资源,期刊和学位论文主题范围较广,参考的网络信息资源相较之下会分布较广。2010-2012年,三类论文总体来说对中文和英文网络信息资源的使用频次较为接近,英文资源的利用略高于中文资源。

      

      图6 被引网站类型分布情况(2)

      

      图7 被引网站类型总体分布情况

      

      图8 被引网络信息资源语种分布情况

      

      图9 2012被引网络信息资源URL深度分布情况

      3.2.2 利用资源深度分析

      资源利用深度,需分析被引URL的深度分布,本文这样描述URL深度:网址中每增加一个“/”,就认定其深度加1,若没有“/”或“/”在URL末尾,则深度为0[18],如http://informationr.net/ir/6-1/paper90.html其深度为3。笔者统计所有网络引文的URL深度。URL深度为0表示论文对该网站整体引用或论文虽参考了较深层次的网络信息资源,但著录不完整。不管是会议论文,期刊论文还是学位论文,引用最多的都是深度为2的网络信息资源。2010-2012年网络引文URL深度分布情况基本一致,图9是2012年的分布情况,都是深度为2的网络信息资源被引用最多。三种论文URL深度小于或等于5的网络引文都占了95%以上,会议论文网络引文最深的深度为9,期刊和学位最深为11,中文网络引文最深为11,英文网络引文最深为10。

      3.2.3 利用资源集中度分析

      本文主要对服务器级别的网站进行频次分析,即把主机名相同的网址聚集分析。得到较高频被引网站列表如表5所示。在这些高频被引网站中,除了百度百科、百度文库和新华网,其他网站都是学术性较强的网络资源,包括图书情报领域的相关协会组织,信息技术领域具有权威性的网站和具有相当影响力的文献导航库,这些网站被引频次较高。由表5可以发现研究者在网络信息资源的利用上有一定的集中度,倾向于引用本领域相关协会组织提供的信息,但是集中度并不强,网络信息资源的来源非常广泛。

      

      3.2.4 资源稳定性分析

      如果访问不到网络引文指向的网络信息资源,即使资源的质量再高也无济于事。网络引文的可访问性一直是研究的热点,国外更针对这个问题积极构建互联网档案馆,可见,网络信息资源的可访问性意义重大。因此,本文认为有必要通过网络引文的可获得性探究利用对象网站的稳定性。本文统计了高频网站的可访问率,使用公式(1),得到表6的“可访问率”一列。其他被引网站也可以基于此公式计算可访问率。

      可访问率=可访问的与高频网站同主机名的引文网址/所有与高频网站同主机名的引文网址 (1)

      

      

 由表5可知,高频被引的国际图书馆协会联合会主页、中国互联网信息中心、美国图书馆协会,中国国家数字图书馆的网站稳定性都不高,可访问率小于50%,意味着很多重要的信息会随着时间的流逝而消失。针对这种情况,笔者认为图书情报领域网络信息资源聚合过程中应该采取能够更久地保存资源的策略,满足图书情报领域研究者的研究需求。

      3.3 个体利用情况分析

      3.3.1 利用数量分析

      本文统计不同类型文献2010-2012年每篇论文引用的网络引文数量,发现会议论文的网络引文数量较少,集中在每篇引用1~3条网路引文;期刊论文也基本上集中在每篇论文引用1~3条网络引文,但引用4条以上网络引文的比例较会议论文大;学位论文篇均网络引文的数量较多,且集中在5~20条的区域。这与学位论文篇幅较长,本身参考文献总数就较期刊、会议论文多有关。

      3.3.2 利用类型分析

      笔者统计每篇论文的网络引文量以及引用的网络信息资源来源网站的类型(分类体系见表3),用SPSS分析发现网络引文量与网站类型数量之间并没有相关性,也就是说,并不是作者引用的网络引文越多,其网络引文的类型越丰富。对2012年的样本进行统计发现,在141篇论文中(共175篇论文,34篇论文的网络引文超过一半无法获得,则不予以统计)只参考了一种网站类型的论文有52篇,占所有论文的37%,参考两种网站类型的论文有34篇,占24%,参考三种网站类型的引文23篇,占16%,同一篇论文参考四种以上类型网站的较少,合起来总共是32篇,占23%。参考网站类型最多的一篇论文共参考了14种类型的网站。研究者们对于网络信息资源的使用是基于论文主题的,根据主题研究的需要寻找网络上相应的信息资源,而往往相关的信息资源会被存储在相似类型的网站中,因此,一篇论文参考的网站类型会集中在3种之内。

      由表7也可发现,52%的会议论文参考一种类型网站,26%的论文参考了两种类型的网站,13%的论文参考了三种类型网站,参考三种以内类型网站的论文比例占91%;47%的期刊论文参考了一种类型的网站,23%的论文参考两种类型的网站,13%的论文参考了是那种类型的网站,参考三种以内类型网站的论文比例占83%;22%的会议论文参考了一种类型的网站,24%的论文参考了两种类型的网站,21%的论文参考了三种类型的网站,合67%的论文参考了三种以内类型的网站。由此,不管是会议、期刊还是学位论文,论文参考的网站类型都较多在一到三种,且只参考一种网站类型的论文占据较高比例。

      3.3.3 利用目的分析

      在前面被引网站类型分布分析中也提到,作者标注网络引文,大部分是因为参考了该网址对应网页的内容,但是,当作者将网站作为证明论点的例子或者是实证分析的对象时,也会将对象网站的URL标注为网络引文。如在论文《学术型开放存取期刊的质量评估》中,作者的网络引文[24]DOAJ.http://www.doaj.org.2012便不是参考了该网址的内容,而是将开放存取期刊DOAJ作为质量评估实验的对象。笔者发现按表3的网站类型体系分类,商务网站、文献导航网站、微博、社区网站、搜索引擎这几种类型的网站经常被作者整体引用。如论文《社会标签的应用功能分析》里引用商务网站亚马逊,是将其作为电子商务网站嵌入标签的成功案例;又如论文《心理学在图书馆用户服务工作中的运用研究》引用搜索引擎Google Scholar,是将其与图书馆的功能搜索进行对比;再如论文《基于社会标签的推荐系统研究》引用社区网站Delicious,Flickr,CiteULike网站说明什么是社会标签。

      

      本文认为,图书情报领域研究者对网络信息资源的引用基于两种目的,一种是对内容的参考,一种是对网站整体的引用。在进行网络信息资源聚合时,我们只需考虑研究者出于第一种引用目的所需要的网络信息资源。

      对2012年的网络引文样本进行统计,80.33%的网络引文是研究者对网络信息资源内容的参考,19.67%的网络引文是研究者以对网站的整体引用为目的而使用网络信息资源。笔者经再统计发现,175篇论文中有109篇论文的网络引文都是基于第一种目的——内容参考其比例为62%;有60篇论文,即34%的论文引用网络信息资源既有第一种目的也有第二种目的;另外,有6篇论文,即4%的论文对网络信息资源的引用仅出于对网站整体引用的目的。

      4 总结与讨论

      本文通过定量方法,对图书情报领域的三种文献(期刊论文、学位论文、会议论文)2010-2012年网络引文引用情况进行分析,在整体利用方面,发现①利用的非图情领域主题内容大概占20%;②对pdf网页类型的引用呈现增长的趋势;③.com、.org、.edu是被引用最多的网站域名;④英国、德国、中国台湾地区、加拿大域名的资源被引用较多,且对其他国家或地区资源的引用频次逐年有所增加;⑤本文将网站类型分为九类,发现教育科研网站、信息门户网站、政府网站被引用频次较高,教育科研网站中图书馆主页、学术协会/机构主页是研究者参考的主要来源;⑥中文和英文网络信息资源的使用频次较为接近,英文资源的利用略高于中文资源;⑦URL深度为2的网络信息资源被引用最多,URL深度小于或等于5的网络引文占了95%;⑧研究者在网络信息资源的利用上倾向于引用本领域相关协会组织提供的信息,但是集中度并不强,网络信息资源的来源非常广泛;⑨被引信息资源的可获取率在65%左右,一些高频被引的网络信息资源可获取率小于50%。在个体利用方面,发现①会议和期刊论文每篇引用1~3条网路引文,大部分学位论文每篇引用5~20条网络引文;②论文参考的网站类型都较多在1~3种,且只参考一种网站类型的论文占据较高比例;③80%的网络引文基于参考引用网页内容的目的,20%的网络引文是对网站整体的引用。以上是图书情报领域研究者利用网络信息资源的总体情况,会议论文、学位论文、期刊论文的情况略有不同,在上文中笔者都进行了统计和分析。本文的数据来源较为全面,力图补充此前仅仅通过期刊论文数据得到的研究结果。

      基于上文的分析结果,笔者认为,图书情报领域研究需要参考的不只有本学科领域的网络信息资源,还需要本学科领域外的信息资源。对于学科外信息资源需求的满足,由于学术性要求较低,主题广泛,可以通过提供在线百科全书、机构网站、相关信息门户网站等的入口链接即可。对于图情领域网络信息资源的需求,教育科研类网站,特别是这类别中的图书馆网站、学术协会/机构网站,被利用频率最高,在进行网络信息资源聚合时应该给予更高的权重。另外,专业信息门户网站提供较深入、全面、可信的专业信息,学者对这类网站的引用也较为普遍,随着开源思想的传播以及图情领域研究技术需求的提高,开源软件/协议标准提供网站的网络信息资源越来越受到重视,这两类网站也可作为聚合本学科领域网络信息资源的首选。网络信息资源的来源不能只局限于中文网站和美国、英国等国家的网站,还应该包括德国、意大利、日本、加拿大等网域。

      在聚合细节上,域名为.com、.org、.edu的应赋予较高权重;在进行网络信息资源聚合时可以考虑挖掘深度取URL深度5;对于核心信息资源,尤其是来源于稳定性不高的网站的重要资源,应该建立数据库对这些重要的信息资源进行备份。

      网络引文实际上就是研究者使用的网络信息资源,通过对网络引文的分析可以了解学科领域网络信息资源的利用情况和需求,笔者认为,各引文数据库有必要增强网络引文的检索功能,这样才能对更多来源的数据进行分析,获得更全面更客观的研究结果。

      ①通过软件Web Link Validator 5.7进行链接检测,可获得率为可以访问的网络引文网址数量所占的比例。

      ②除了中国域名(.cn)、国际域名(.com、.net、.org等)的国家域名分布情况。

      ③表格中列举的网站例子均来源于采集的网络引文。

标签:;  ;  ;  ;  

我国图书情报领域研究人员对网络信息资源利用的分析_相关性分析论文
下载Doc文档

猜你喜欢