基于社会网络分析的数字图书馆大数据研究论文

基于社会网络分析的数字图书馆大数据研究

曾 玲

(黑龙江大学信息管理学院,黑龙江 哈尔滨 150080)

摘 要: 文章基于中国知网刊载的论文,利用社会网络的分析方法对我国数字图书馆大数据领域下的相关学术内容关联特征进行了分析和探究。文章研究的重点在于探究2013—2018年国内在该领域的研究热点、内容的关联特征及发展演化规律。由此利用社会网络分析的方法,借助Ucinet和NetDraw等工具,从关联角度对该领域的研究内容进行探究和分析,对该领域未来的发展方向和研究内容提出了可参考的建议。

关键词: 数字图书馆;大数据;社会网络分析

0 引言

大数据,又称为巨量资料,大数据所具有的强决策力以及洞察力,使得新的模式可以对流程数据进行优化。大数据以其海量的数据、多样化的特征受到越来越多网民的喜爱[1]。数字图书馆其实就是用数字信息技术处理和储存各种图文资料的图书馆,它将纸质或者其他载体的资料以数字技术形式进行储存下载,使得读者可以跨越空间、面向不同的对象来查询和获取自己所要的数字信息[2]。数字图书馆将信息资源从头到尾进行加工、储存、利用,有效地节约了读者时间,也方便了信息资料的长时间保存。大数据给图书馆带来的改变无疑是巨大的,为了更好地研究大数据和图书馆之间的关系,本文将利用社会网络分析方法对2013—2018年我国数字图书馆大数据领域的内容进行研究。本文以中国知网(China National Knowledge Infrastructure,CNKI)所刊载的论文为研究资料,为了进行更加深层次的分析,对关键词、作者分布等内容进行相关梳理,同时,本文将计算出各个节点及整体的中心度,其中包括点度中心度、中间中心度和紧密中心度,从而进一步揭示该领域中各类学术对象之间的内容关联及其程度,了解并促进学术对象之间的广泛交流与深度合作,最后对数字图书馆大数据所处领域的研究侧重点进行讨论并给出相关建议,以期对数字图书馆未来发展能够有所帮助。

1 大数据背景下的数字图书馆

1.1 大数据

“大数据”这一概念最早由维克托·迈尔·舍恩伯格等在编写书籍的过程中提出,和以往获取海量数据的方法不同,反而是对现有的数据进行分析和相关处理[3]。大数据所具有的大量、高速、多样、价值等特点,即所谓的4V特点是大数据独一无二的优势。大数据和数字图书馆相辅相成,因为有了大数据,数字图书馆的蓝图才能够顺利实现。

1.2 数字图书馆

数字图书馆相对于真实存在的图书馆而言,具有虚拟的、没有围墙、没有时间地点限制等特点,数字图书馆是信息技术飞速发展背景下出现的产物[4]。数字图书馆是基于网络环境下共建、共享所产生的,各大数字图书馆互相分享自己的信息资源,并扩展自身的知识网络系统。数字图书馆充分利用自身所具有的超大规模、没有时间空间限制、便于利用的特点,顺利实现跨系库无缝链接,从而成为智能检索的知识中心。数字图书馆方便读者查阅书籍相关信息,同样的电子资源可以供多人在线同时使用。数字图书馆给读者带来的便利,使得读者无论身处何地无论何时都能获取到自己所需要的信息,阅读到自己所需要的书籍。

2008年9月份,《Nature》发表的文章中最早提出大数据的理念,2011年5月份,全球著名的咨询公司麦肯锡接着发布了一篇报告,在这次报告中麦肯锡首次提出了大数据这一概念,引起了各个行业,尤其是科技界和政府部门的高度关注[5]。2012年,时任美国总统奥巴马的白宫政府也宣布推出“大数据的研究和发展计划”,以至于后来我国图书馆界也开始逐渐研究起了大数据。很多学者认为大数据给数字图书馆带来了良好的发展机遇,但是数字图书馆也面临信息储存和安全等问题。现如今学者大多研究大数据环境下的数字图书馆资源的聚合、数字图书馆资源的安全保障、数字资源的开放与共享等方面的内容,进一步讨论了大数据对数字图书馆各方面的影响。数字图书馆使得信息的存储与利用可以为大多数人所使用,知识获取平等的权利大大提高,数字图书馆带来的不仅是便利,更是知识革命传播方式的革新。数字图书馆在信息技术高速发展的今天,将图书馆的纸质载体转化成为信息载体,未来图书馆的发展,数字图书馆必将是重要的、不可缺少的里程碑。

2 数据的来源和处理方法

本文的分析数据主要来源于CNKI,由于本文讨论的是2013—2018年,关于大数据背景下数字图书馆的研究内容,所以刊载出来的文章题目中含有“大数据”和“数字图书馆”等关键词的期刊论文将会作为此篇文章的分析对象。经过中国知网的相关检索之后,提取了2013—2018年的文章,同时也下载了这些论文的相关著录信息,包括刊名、关键词、摘要等,作为本文分析的数据源。本文将排名前十的期刊,例如《现代情报》《情报科学》《图书情报工作》《图书馆学研究》等期刊的著录数据进行拆分,主要包括关键词、摘要等信息。经过相关处理的数据可以分别对两个方面进行分析:(1)对“数字图书馆大数据”领域所呈现的数据进行统计,以探究该领域研究特征及其分布。(2)对该领域研究的内容关联特征进行详细叙述,以此来研究该领域未来发展的方向。

此外,本文还计算出了各节点及整体的中心度,包括点度中心度、中间中心度和紧密中心度,并且表1中列出来了各节点名称及三大中心度的数值。

3 内容关联分析

3.1 关键词网络分析

关键词是一篇论文内容的浓缩精华,为了得到更好的分析结果,需要了解数字图书馆研究内容的总特征及分布规律,对其关键词及其关联内容进行深入讨论,基于此,本文建立了共现矩阵,以供研究。由共现矩阵所显示的结果可以看出排名第一的是图书馆和数字化,一共出现了530次,排名第二的是数字图书馆和信息服务,一共出现了522次,排名第三的是数字图书馆和传统图书馆,共出现475次。数字资源、信息资源、云计算、知识产权出现的次数也名列前茅,这说明这几个关键词的联系都是比较紧密的。关键词联系的越紧密就说明两者被专家、学者放在一起研究的次数越多,所以彼此之间影响的数值较大,由此可见大量关键词与大部分核心术语存在关联。

教学方法是指教学过程中教师和学生为实现教学目标采用的某种方法,是为完成教学任务而采取的教与学相互作用的活动方式的总和[4],寻找有效的教学方法始终是教师不断探索和追求的目标。病例讨论教学法能促进教师的成长。比如病例选择上,教师要力求真实,病例临床表现要典型,编排要目的性明确,并具有良好的启发性。因此,教师在备课阶段要全面掌握教学大纲要求,并具备一定的临床知识及实践经验,在案例讨论的每个环节能进行针对性引导。这对教师的综合素质提出了更高要求,教师要不断学习,丰富自身专业知识,在教与学中不断成长。

为了更好地对关联强度进行分析,本文采用Net-Draw做出了该领域的网络结构图,网络结构图对于学术的创新和研究主题的演化及预测具有重要意义。网络结构图中,图形的大小为节点对应的Degree值,节点关键词之间如果存在相似关联,就会用连线来表示,连线的粗细表示关联强度[7]。(1)从总体上来看,由于涉及的10个节点比较多,数字图书馆的密度比较大,网络比较紧凑,节点之间的连线还算多,整体围绕着“数字图书馆”“高校图书馆”“图书馆”为核心进行构建,因此,这几个节点的关联数量及强度和对其他节点的控制能力均远远大于其他节点。整个网络分成中心区及周边区,而且周边区的节点数量比中心区多,可见整个网络的紧密中心度比较低,即各节点在总体上依赖比较强。(2)由于“数字图书馆”和“大数据”的绝对核心地位,使得大多数节点之间均存在关联。“数字图书馆”相当于大中心,紧密联系下面的小中心,最后再辐射出去,扩大自己作为中心的影响力。

3.2 网络结构图分析

本文数据研究选取了排名前10的表格名称,可以从表格的总体上看出“数字图书馆”和“图书馆”节点的中心度值绝大多数都排在前两位,而且“数字图书馆”“图书馆”与排名第3的节点“高校图书馆”有着显而易见的差距,可见“数字图书馆”作为该领域的标签术语,且这3者在该领域的核心地位不可动摇。其次,表1中给出的中间中心度反映的是节点对其他节点的控制能力[6]。可以看出数字图书馆对于其他节点的控制能力是比较大的。紧密中心度可以看出节点之间的紧密度,节点之间关系的强弱。从表1中的紧密中心度可以看出很多节点还是受到关键节点不同程度的控制,“数字图书馆”“图书馆”“高校图书馆”都处在比较关键的位置。当然上述的分析,由于相关数据可能会有不是很全面的地方,所以最后的结果可能有所偏差。

表1 各节点的中心度值情况

3.3 作者分布

根据由CiteSpace所处理的数据可以得出作者共线网络图谱,从作者共线网络图谱当中可以清楚地看到核心作者和合著情况。核心作者是学术发展、学科建设的顶梁柱,引领学科发展方向[8],探索该学科的发展热点。毕强、李洁、鄂丽君等所撰写的论文数量是名列前茅的,也就是说这几位是高产学者,对数字图书馆这一领域了解得比较透彻,有自己的见解。毕强、李洁、吉宇宽等人与他人经常合著,形成了属于自己的研究团队。越是有影响力的人,他的周围越容易形成“小聚居”现象,其他作者会参考他的论文,围绕他的论文或者主题进行研究,当然,这从侧面也反映出该作者的实力[9]

长期以来,我国危险货物国际运输和国内运输在船舶技术条件、货物适运条件等方面是差异化要求,国际运输适用相关国际公约和规则,国内运输则适用国内法规和技术规范。但由于国际和国内运输的货物适运条件不一致,导致危险货物国内运输转国际运输时需按照国际公约规定重新包装、积载、隔离,给货主与船东造成很大不便,也增加安全监管与执法难度。同时,《危险化学品安全管理条例》对危险化学品的适运要求统一适用于国际和国内运输,未有所区分。在实践中,长期以来国内运输包装危险货物已在参照国际公约管理。

4 结语

综上所述,本文采用的社会网络分析方法对大数据背景下的数字图书馆领域的相关学术对象的内容关联特征进行了比较深入的探讨和分析。在关键词网络中,词间关联比较紧凑,关键词的控制能力以及独立性都比较强,形成了数字图书馆、高校、图书馆的三大基本研究方向,但很明显的是,技术领域的研究还是比较薄弱的,虽然其关于信息资源、信息服务、信息化的研究涉及较多,但更多只是在理论层次上探讨。当然,数字图书馆在云计算的方面也引起了很多人的关注,云计算作为一项科技技术,使得数字资源得以更好地进行分享,使得信息更好地被利用,方便广大读者,由此可以得知,数字图书馆在云计算的相关领域未来发展也会越来越好。与此同时,从网络结构图中也可以看出,知识产权也吸引了大家的目光,由于数字图书馆的发展,很多纸质的资料变成了相应的电子资料,于是这些电子资料的版权归属也是引起争论的问题之一,在数字图书馆中,应确定相应的知识产权,以免将来引起不必要的误会。数字图书馆大数据领域,目前还处于研究的初级阶段,但是大数据又要求该领域需要技术、资源的有力支持。所以,可以想象未来大数据数字图书馆必然会向数据资源建设、方法技术的应用等方面发展。数字图书馆未来的发展将会充满了机遇与挑战,数字图书馆必将是未来社会图书馆发展的重点方向。

(2)采用不同数据处理方式获得组成数据对计算的烃露点有较大影响,实际应用中,组成采用苯、甲苯、环己烷和甲基环己烷等组分单独定量,而其余组分按照碳数归类分析时,获得的完整组成数据计算的烃露点和直接测定结果更为接近,两者平均偏差在3℃以内。因此,在需要使用组成数据计算烃露点时,宜采用苯、甲苯、环己烷和甲基环己烷等组分单独定量,而其余组分按照碳数归类的分析和数据处理方式,由此获得的烃露点更为准确可靠。

参考文献

[1]张小琴,孙承军,王昊.基于社会网络分析的我国图书馆大数据研究的内容关联分析[J].图书情报导刊,2017(10):40-50.

[2]汪曼.国内社会网络分析应用现状研究[J].情报工程,2016(5):75-85.

[3]陈臣.基于大数据的图书馆数字资源重构与融合研究[J].现代情报,2016(8):10-13,20.

[4]徐升华,王琪.大数据时代数字图书馆信息服务研究与发展[J].图书馆学刊,2016(4):59-62,66.

[5]文杰.大数据时代下数字图书馆发展创新服务的必要性[J].河南图书馆学刊,2015(11):124-125.

[6]苏新宁.大数据时代数字图书馆面临的机遇和挑战[J].中国图书馆学报,2015(6):4-12.

[7]毕强,王雨,孙畅.数字图书馆资源聚合模式研究——基于社会网络分析的视角[J].数字图书馆论坛,2014(6):2-7.

[8]贯君,王雨,吴海媛.基于社会网络分析的数字图书馆资源聚合实证研究[J].数字图书馆论坛,2014(6):8-15.

[9]李白杨,张心源.数字图书馆建设中大数据问题初探[J].情报科学,2013(11):26-29.

Research on big data of digital library based on social network analysis

Zeng Ling
(School of Information Management,Heilongjiang University,Harbin 150080,China)

Abstract: Based on the papers published in CNKI journals,this paper uses social network analysis method to analyze and explore the content related characteristics of related academic objects in the field of digital library in China.The focus of this paper is to explore the research hot spots,the related features of the content and the law of development and evolution in this field during the period from 2013 to 2018.With the help of social network analysis and Ucinet and NetDraw tools,this paper analyzes and explores the research contents in this field from the perspective of relevance,and tries to make some suggestions for future development direction and research contents in this field.

Key words: digital library;big data;social network analysis

中图分类号: G250.76

文献标志码: A

作者简介: 曾玲(1994—),女,湖北荆州人,硕士研究生;研究方向:信息服务与用户。

(责任编辑 杨欢)

标签:;  ;  ;  ;  

基于社会网络分析的数字图书馆大数据研究论文
下载Doc文档

猜你喜欢