图书馆书目数据社会化应用研究_图书馆论文

图书馆书目数据社会化应用研究,本文主要内容关键词为:书目论文,图书馆论文,数据论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

       中图分类号:G250.7

       DOI:10.3772/j.issn.1673-2286.2015.06.001

       书目数据是图书馆馆藏资源内容特征及形式特征的描述记录,是资源揭示、识别、检索、发现和利用的重要途径,主要表现为MARC、DC等传统的书目数据格式。随着数据环境的发展与变化,图书馆书目数据已经成为全社会大数据的重要组成部分,能够为其他领域的数据描述与组织提供可借鉴的方法,RDA、关联数据、社会元数据等方法与技术在图书馆书目数据描述组织中的探索与实践,为图书馆书目数据社会化应用提供了方法与技术上的支撑。因此,如何提升图书馆在未来数据环境中的作用,重新认识与定位图书馆书目数据的内在价值,使图书馆书目数据在新的数据环境下被更多领域的用户发现利用,扩展其应用范围与社会影响,成为图书馆领域重要的研究课题。

       1 书目数据社会化应用的价值

       书目数据社会化应用是指通过各种途径扩展图书馆传统书目数据的应用范围与程度,使图书馆的书目数据更好地适应社会需求,实现图书馆书目数据与图书馆以外的各类型数据的转换、关联,增强现有书目数据体系的社会化应用程度,提升图书馆在未来数据环境中的作用与价值。

       目前,图书馆领域已经积累了数量庞大的书目数据,仅OCLC的WorldCat已经涵盖了世界9000多个图书馆的5700多万条记录。随着馆藏资源类型的增加,图书馆书目数据体系也更加丰富,馆藏书刊书目、电子图书书目、特色数据书目、开放资源书目、音频视频书目等都成为图书馆书目数据体系的重要内容。长期以来图书馆书目数据主要应用于图书馆领域,作为揭示、组织、管理与报道馆藏的工具,成为图书馆服务支撑的基础,在专指度强的知识信息服务中发挥了重要作用。同时,在社会其他领域也存在着与图书馆书目数据结构功能相似的数据记录,OCLC将其定义为用来描述网络用户产生内容的元数据以及有助于对内容进行判别的用户及其行为信息,如描述开放网络社区书目数据、DBpedia、FOAF、CAM等,这些数据与图书馆书目数据存在着千丝万缕的联系。在大数据环境下,图书馆书目数据是全社会大数据的重要组成部分,应该充分发挥其资源描述、揭示与组织的优势作用,通过对某一对象主题单元的关联揭示,强化智能检索导航,实现数据资源的深度挖掘与计量分析,在语义出版、科学数据管理、关联科学等领域得到广泛的应用。

       图书馆书目数据社会化应用的价值体现在以下两方面:

       (1)使图书馆的数据能够被更多用户发现利用,同时随着图书馆资源组织方法的向外渗透,使图书馆的书目数据信息真正融入关联数据社区。

       目前,图书馆书目数据主要应用于图书情报领域,用以揭示资源的内容与形式特征,许多图书馆的书目数据没有面向社会开放或者只是实现特定范围的开放,社会化开放程度与认知程度还没有得到全社会的认可,进而无法更好的实现书目数据的核心价值。其主要原因在于传统的书目数据格式的可扩展性受到一定程度的限制,随着书目数据扩展与关联技术的发展,图书馆书目数据的开放描述、数据转换、关联发现已经成为可能,通过图书馆书目数据社会化应用研究,能够使图书馆书目数据被更多领域用户发现利用,同时扩大图书馆资源组织描述方法的社会影响,进一步提升图书馆在未来数据环境中的作用。

       (2)图书馆书目数据社会化应用的实现能够增强图书馆书目数据的社会化参与程度。

       随着数字化信息资源数量的增长,用户已经不满足于信息资源的罗列式提供,用户需要通过概念的识别、语义化的分析实现知识之间的有效链接和关联,更有效提高信息资源发现和共享的效率。传统的图书馆书目数据主要由图书馆员或专家创建,能够提供标准化的资源揭示的途径,资源揭示的程度取决于选择的元数据元素和标准,但是用户关注的资源的相关属性如行为属性、分类属性、注释属性、时空属性及等级评价属性等都不能灵活的呈现,同时对于概念体系发展的动态监测、用户交互、词表及时更新、网络资源与规范数字信息资源的有效关联也无法有效的实现。因此,图书馆书目数据的社会化应用,能够进一步丰富图书馆编目和元数据理论,同时用社会化方法有效的弥补专业性书目数据体系用户参与不足的问题,增强其社会化参与程度,促进图书馆书目数据的社会化维护与更新。

       2 书目数据社会化应用的研究现状

       从目前国内外的理论研究与实践来看,书目数据社会化应用的广度与深度与书目记录格式开放程度密切相关,随着书目数据揭示描述技术与方法的发展,书目数据社会化应用的程度也日益提高。

       对图书馆书目数据社会化应用的理论研究主要可以表现为以下几个方面。

       2.1 MARC书目数据格式的扩展研究

       现有书目数据包含着多种实体要素,这些实体要素在传统环境下以MARC或DC的格式呈现,早期图书馆界书目数据开放是通过Z39.50或API等方式开放MARC数据,重点研究如何实现MARC数据的转换描述与开放架构,但是这种开放及应用更多局限于图书馆领域内部。FRBR和RDA的出现,为图书馆书目数据提供了新的模型和规则,FRBR通过关注利用附加信息实现用户之间的交互共享,是书目数据社会化应用的起步,而RDA为书目数据社会化应用提供了语义描述的基础和实现的可能。如Joaquim等[1]提出了MARC元信息架构,为MARC或UNIMARC XML手册。Lee等[2]提出了促进MARC和FRBR互操作的方法。Sharma等[3]提供了一个将MARC21书目数据格式转变成基于RDF三元组表示的方法。黄伟红和张炎福[4]研究了基于XML/RDF的MARC元数据描述技术。与此同时,研究人员开始探索构建用于不同书目数据格式转换的本体,如Giasson等[5]开发的基于RDF的书目本体Bibliographic Ontology Specification,欧盟DERI的MarcOnt等,我国学者白海燕和乔晓东[6]也提出了基于本体构建数据组织模型,并进行了初步的实现。这些相关研究与实践是图书馆书目数据社会化扩展与应用的重要基础。

       2.2 关联数据理论与方法的研究

       关联数据理论与方法的发展为图书馆书目数据社会化应用提供了可能。将图书馆数据以关联数据的形式发布,以便其他网络可以利用这些数据,这是关联数据在图书馆应用中的主要模式。从2008年开始,国外图书馆领域开展对关联数据的理论研究与应用探索。近年来,关联数据云LOD中与图书馆相关的关联数据规模不断扩大,越来越多的图书馆将自己的资源发布为关联数据。截止到2015年6月,Datahub(http://datahub.io/dataset)中“library linked data”和“bibliography data”相关关联数据集的数量已经增长到238个。业界对书目数据关联的研究主要集中在将图书馆书目数据及词表资源发布为关联数据的方法、基于MapReduce技术的书目数据匹配等。目前图书馆书目数据社会化应用主要表现在将图书馆机构信息与书目数据实现关联、图书馆数据集与第三方数据及非图书馆数据相关联,如开放图书馆描述了1亿多种同书目数据关联的电子书数据,德国UBA计划将图书馆书目数据与相关的环境观察数据建立关联。Eric和Micheline[7]描述了关联数据的概念、应用空间及图书馆实现关联数据的途径。Getaneh等[8]认为应该将图书馆数据从RDA和FRBR模型调整到基于RDF的数据模型。Rob等[9]探讨如何把图书馆MARC记录转换为SKOS,进而发布为关联数据。Summers等[10]提出将美国国会图书馆MARCXML格式的主题标目转换为SKOS的技术方法。虞为和陈俊鹏[11]提出基于MapReduce的书目数据关联匹配架构。

       总体来看,图书馆发布的关联数据类型和应用领域呈现出不断扩展的趋势,发布的数据类型日益多样,书目数据是目前图书馆发布数量最多的数据,但是,其他类型的数据资源,如知识组织系统数据、名称规范数据等也呈现出日益增长的趋势。同时,图书馆在发布书目数据资源的基础上,也开始对期刊、引文、论文、历史手稿、特藏等多种资源元数据进行关联发布与实践。关联数据方法与技术的出现及应用为图书馆书目数据的进一步开放提供了理论与技术支撑。

       2.3 书目框架转换计划研究

       美国国会图书馆于2011年5月发起“书目框架计划”(The Bibliographic Framework Initiative,简称BIBFRAME),从书目环境的角度出发,对资源进行有效的分类和描述并使之发生关联。目前有美国国会图书馆、德国国家图书馆等7个参与机构提供8个样本数据集参与测试。从目前研究来看,主要集中于书目数据的内容、结构、数据转换格式等,如Adamich和Tom[12-14]发表了系列文章对BIBFRAME的性质、框架、结构等进行探讨。Mitchell和Erik[15]在图书馆技术报告第3章中探索了由美国国会图书馆发起的书目框架计划。目前国内学者已经开始关注BIBFRAME,刘炜和夏翠娟等学者[16]对BIBFRAME的框架模型、术语词表、用例与需求和用具等内容进行归纳与总结。BIBFRAME为图书馆书目数据格式的进一步转换与映射提出了可行的技术框架与实施方案,能够有效的促进图书馆书目数据的社会化扩展应用。

       2.4 开放的社会元数据研究

       网络上存在着大量由用户产生的书目数据资源,如开放网络社区书目数据、DBpedia、FOAF、CAM、Folksonomy等,这些数据能够为图书馆书目数据扩展提供丰富的内容,Thomas等[17]指出用户提供的Folksonomy标签数据能够有效补充现有的资源揭示与描述内容,标签数据与书目数据结合形成的复合型目录能够形成更为丰富的资源揭示与描述的元数据。研究人员已经开始关注传统书目数据与用户书目数据之间的联系,如Alexander等人将社会标注同现有本体关联应用于科技论文的描述、识别和揭示,以更好的支持eScience[18]。Kwan等人尝试将Folksonomy同国会主题词表(LCSH)有效链接,实现用户词表与专家词表的有效融合[19]。

       目前,相关机构对书目数据社会化应用也积极地开展实践探索工作。在20世纪90年代中期,the Network Development and MARC Standards Office支持从MARC 21数据结构到SGML的编目数据相互转换[20]。国会图书馆2004年开发了基于XML环境利用MARC数据的框架[21]。2012年6月,OCLC将WorldCat.org中的书目元数据发布为关联数据[22]。图书馆系统服务商VTLS宣称其Open Skies平台支持BIBFRAME书目框架[23]。科罗拉多大学启动了“BIBFRAME数据存储库”项目,在Redis图书馆服务平台上,实现MARC21记录到BIBFRAME实体的转换[24]。

       可见,传统图书馆书目数据的社会化扩展及应用已经成为近年来业界关注的热点问题,研究人员从书目数据的扩展、关联等多个角度进行了相关的研究,扩展了图书馆书目数据的应用范围。但是,从目前的研究来看,这些研究大都处于起步阶段,重点关注书目数据的转换与关联,而没有从书目数据整个生命周期出发来构建其社会化应用的整体架构,对其中涉及图书馆书目数据社会化应用的需求及价值定位、数据的规范、转换与关联方法、应用路径等核心问题及关键技术,都需要进一步深入研究。

       3 基于数字生命周期的图书馆书目数据社会化应用体系架构

       图书馆书目数据作为揭示与描述图书馆各类型资源的重要内容,是图书馆资源的重要组成部分。同所有的数字资源的创建、获取、揭示、组织、发布与利用过程一样,图书馆的书目数据的创建、组织、发布与利用也具有相似的数字生命周期。图书馆书目数据社会化的应用能够体现在书目数据生命周期的每个阶段。

       因此,图书馆书目数据社会化应用需在对书目数据内在价值重新认识与定位的基础上,从资源层、技术层及服务层构建基于书目数据获取集成—关联加工—传播利用生命周期的书目数据社会化应用整体架构。在BIBFRAME模型和RDA框架的基础上,重点研究适用于中文书目数据的数据映射、转换与关联方法,实现图书馆书目数据与图书馆以外的各类型数据格式的转换与关联,增强现有书目数据体系的社会化应用程度,如图1所示。

      

       图1 基于数字资源生命周期的图书馆书目数据社会化应用体系架构

       3.1 图书馆书目数据社会化应用需求及其应用价值分析

       3.1.1 现有社会化元数据结构分析

       现有的社会化元数据主要包括图书流通和出版行业中的MARC书目、描述特藏和档案藏品的EAD目录指引、学术期刊的文摘与索引库、开放书目数据LOBID.org、网络开放资源DBpedia、开放社区书目数据Librarything等。这些社会化元数据都采用开放的内容描述架构,具有较强的开放性和可扩展性,包含着大量的资源描述信息,可以作为图书馆书目数据的有效补充与扩展。对这些社会化元数据的数据结构、描述规范、应用环境等方面进行分析,提取出能够与图书馆书目数据开放链接的实体要素,为图书馆书目数据社会化开放关联提供语义要素。

       3.1.2 图书馆书目数据社会化应用的价值维度

       新的数据环境下,图书馆书目数据的功能不断扩展和深化,需要在多个维度对书目数据的价值进行深入挖掘与研究。从宏观的社会发展层面来看,图书馆书目数据作为全社会大数据的重要组成部分,能够为各类型用户提供优质的学术信息资源,同时图书馆书目数据作为资源描述的有效方式,也能够为其他领域借鉴与采纳,促进各领域的资源揭示与描述。从中观层面来看,图书馆书目数据能够有效的支持学科领域发展,有效揭示学科主题关联,实现学科智能检索。从微观层面来看,图书馆书目数据能够促进资源内容的深层揭示与关联,实现数据资源的深度挖掘与计量分析。

       3.2 基于书目数据获取集成—关联加工—传播利用的社会化应用整体架构

       从书目数据的获取集成、关联加工和传播利用三个阶段研究书目数据社会化应用内容与框架。其中,书目数据的社会化获取集成包括书目数据的收集、规范化处理、开放描述规则等,书目数据的社会化关联加工包括书目数据库中各个元素属性及关系的识别界定、语义映射和数据转换、数据关联等,书目数据的社会化传播利用包括书目数据的关联发布、社会化推荐、元数据丰富等。

       3.2.1 书目数据社会化获取集成

       各类型书目数据资源分散于各种网络环境中,因此需要将分布的数据资源集成获取,建立各类型书目数据库,同时进行数据的规范化处理,制定标准化的开放数据描述规则,抽取语义元素,构建出各类型数据的语义关系表,实现基于关联书目数据的数据发布者之间及与数据使用者之间的数据共享。

       3.2.2 图书馆书目数据社会化关联加工

       图书馆书目数据的社会化应用是对书目数据本身结构的扩展实现,图书馆书目数据结构与社会化数据结构之间存在着一定的差异,需要对图书馆书目数据进行转换、清洗、规范和关联等一系列数据加工处理。具体包括:

       ①基于BIBFRAME的书目数据格式转化模型,BIBFRAME格式可以很好地与MARC格式兼容,所以要实现两种格式在书目描述中各字段的关联匹配,使MARC格式的书目数据向BIBFRAME格式的转化,最后达到图书馆书目数据的开放共享。

       ②基于RDA的图书馆书目数据与用户标注数据及网络书目数据之间转换方法。基于RDA的社会元数据(如标签数据及网络书目数据)与图书馆书目数据有效映射及转换的方法,实现社会元数据与图书馆书目数据属性之间的有效映射。以更好的实现资源之间的链接,促进资源发现与共享。

       ③图书馆书目数据社会化关联规则与关联方法。图书馆书目数据社会化关联主要表现为三个层面,即图书馆书目数据与其他各类型图书馆开放书目数据的关联、图书馆书目数据与社会化网络社区的开放书目数据之间的关联、图书馆书目数据与社会化网络社区中的非书目数据资源之间的关联。针对这三个不同层面的书目数据社会化应用的内容,应制定相应的关联规则和关联方法,采取适用的关联技术,并实现不同层面书目数据社会化关联方法的融合,建立完整的图书馆书目数据社会化关联方法。

       3.2.3 图书馆书目数据社会化传播利用

       图书馆书目数据社会化应用是实现图书馆书目数据价值的最终体现。可以通过图书馆书目数据的关联、社会化推荐、元数据等途径实现图书馆书目数据与其他数据如用户标注数据、网络书目数据及开放关联数据之间的融合与呈现。图书馆书目数据的利用平台不再局限在OPAC系统,可以通过特定的浏览器或者移动设备应用对书目数据进行智能化检索,实现基于知识单元关联的书目数据社会化关联服务,实现图书馆书目数据与开放网络社区的数据关联及多种资源获取途径与书目数据的关联。

       3.3 图书馆书目数据社会化应用推广

       图书馆书目数据社会化应用的程度与其宣传推广的程度密切相关,因此,图书馆在积极开展图书馆书目数据社会化应用理论与方法的同时,需要制定明确的应用推广策略,将书目数据社会化的方式引入图书馆书目数据体系中来,提出适合我国的图书馆书目数据社会化应用推广策略,如用户交互与用户激励策略、可持续的社会化应用环境发展策略等,通过改进图书馆书目数据结构封闭性的问题来适应社会化需要,建立起图书馆书目数据的社会化应用机制。

       4 结语

       图书馆书目数据是全社会的财富,其价值应该在社会各个领域有所体现,通过图书馆书目数据社会化应用研究,能够使图书馆书目数据更好地适应社会化需求,实现图书馆书目数据与图书馆以外的各类型数据的转换与关联,有效提升图书馆在未来数据环境中的作用,这是书目数据建设未来的发展趋势。

       收稿日期:2015-06-01

标签:;  ;  ;  ;  ;  

图书馆书目数据社会化应用研究_图书馆论文
下载Doc文档

猜你喜欢