图书馆书目数据社会化应用研究,本文主要内容关键词为:书目论文,图书馆论文,数据论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
中图分类号:G250.7 DOI:10.3772/j.issn.1673-2286.2015.06.001 书目数据是图书馆馆藏资源内容特征及形式特征的描述记录,是资源揭示、识别、检索、发现和利用的重要途径,主要表现为MARC、DC等传统的书目数据格式。随着数据环境的发展与变化,图书馆书目数据已经成为全社会大数据的重要组成部分,能够为其他领域的数据描述与组织提供可借鉴的方法,RDA、关联数据、社会元数据等方法与技术在图书馆书目数据描述组织中的探索与实践,为图书馆书目数据社会化应用提供了方法与技术上的支撑。因此,如何提升图书馆在未来数据环境中的作用,重新认识与定位图书馆书目数据的内在价值,使图书馆书目数据在新的数据环境下被更多领域的用户发现利用,扩展其应用范围与社会影响,成为图书馆领域重要的研究课题。 1 书目数据社会化应用的价值 书目数据社会化应用是指通过各种途径扩展图书馆传统书目数据的应用范围与程度,使图书馆的书目数据更好地适应社会需求,实现图书馆书目数据与图书馆以外的各类型数据的转换、关联,增强现有书目数据体系的社会化应用程度,提升图书馆在未来数据环境中的作用与价值。 目前,图书馆领域已经积累了数量庞大的书目数据,仅OCLC的WorldCat已经涵盖了世界9000多个图书馆的5700多万条记录。随着馆藏资源类型的增加,图书馆书目数据体系也更加丰富,馆藏书刊书目、电子图书书目、特色数据书目、开放资源书目、音频视频书目等都成为图书馆书目数据体系的重要内容。长期以来图书馆书目数据主要应用于图书馆领域,作为揭示、组织、管理与报道馆藏的工具,成为图书馆服务支撑的基础,在专指度强的知识信息服务中发挥了重要作用。同时,在社会其他领域也存在着与图书馆书目数据结构功能相似的数据记录,OCLC将其定义为用来描述网络用户产生内容的元数据以及有助于对内容进行判别的用户及其行为信息,如描述开放网络社区书目数据、DBpedia、FOAF、CAM等,这些数据与图书馆书目数据存在着千丝万缕的联系。在大数据环境下,图书馆书目数据是全社会大数据的重要组成部分,应该充分发挥其资源描述、揭示与组织的优势作用,通过对某一对象主题单元的关联揭示,强化智能检索导航,实现数据资源的深度挖掘与计量分析,在语义出版、科学数据管理、关联科学等领域得到广泛的应用。 图书馆书目数据社会化应用的价值体现在以下两方面: (1)使图书馆的数据能够被更多用户发现利用,同时随着图书馆资源组织方法的向外渗透,使图书馆的书目数据信息真正融入关联数据社区。 目前,图书馆书目数据主要应用于图书情报领域,用以揭示资源的内容与形式特征,许多图书馆的书目数据没有面向社会开放或者只是实现特定范围的开放,社会化开放程度与认知程度还没有得到全社会的认可,进而无法更好的实现书目数据的核心价值。其主要原因在于传统的书目数据格式的可扩展性受到一定程度的限制,随着书目数据扩展与关联技术的发展,图书馆书目数据的开放描述、数据转换、关联发现已经成为可能,通过图书馆书目数据社会化应用研究,能够使图书馆书目数据被更多领域用户发现利用,同时扩大图书馆资源组织描述方法的社会影响,进一步提升图书馆在未来数据环境中的作用。 (2)图书馆书目数据社会化应用的实现能够增强图书馆书目数据的社会化参与程度。 随着数字化信息资源数量的增长,用户已经不满足于信息资源的罗列式提供,用户需要通过概念的识别、语义化的分析实现知识之间的有效链接和关联,更有效提高信息资源发现和共享的效率。传统的图书馆书目数据主要由图书馆员或专家创建,能够提供标准化的资源揭示的途径,资源揭示的程度取决于选择的元数据元素和标准,但是用户关注的资源的相关属性如行为属性、分类属性、注释属性、时空属性及等级评价属性等都不能灵活的呈现,同时对于概念体系发展的动态监测、用户交互、词表及时更新、网络资源与规范数字信息资源的有效关联也无法有效的实现。因此,图书馆书目数据的社会化应用,能够进一步丰富图书馆编目和元数据理论,同时用社会化方法有效的弥补专业性书目数据体系用户参与不足的问题,增强其社会化参与程度,促进图书馆书目数据的社会化维护与更新。 2 书目数据社会化应用的研究现状 从目前国内外的理论研究与实践来看,书目数据社会化应用的广度与深度与书目记录格式开放程度密切相关,随着书目数据揭示描述技术与方法的发展,书目数据社会化应用的程度也日益提高。 对图书馆书目数据社会化应用的理论研究主要可以表现为以下几个方面。 2.1 MARC书目数据格式的扩展研究 现有书目数据包含着多种实体要素,这些实体要素在传统环境下以MARC或DC的格式呈现,早期图书馆界书目数据开放是通过Z39.50或API等方式开放MARC数据,重点研究如何实现MARC数据的转换描述与开放架构,但是这种开放及应用更多局限于图书馆领域内部。FRBR和RDA的出现,为图书馆书目数据提供了新的模型和规则,FRBR通过关注利用附加信息实现用户之间的交互共享,是书目数据社会化应用的起步,而RDA为书目数据社会化应用提供了语义描述的基础和实现的可能。如Joaquim等[1]提出了MARC元信息架构,为MARC或UNIMARC XML手册。Lee等[2]提出了促进MARC和FRBR互操作的方法。Sharma等[3]提供了一个将MARC21书目数据格式转变成基于RDF三元组表示的方法。黄伟红和张炎福[4]研究了基于XML/RDF的MARC元数据描述技术。与此同时,研究人员开始探索构建用于不同书目数据格式转换的本体,如Giasson等[5]开发的基于RDF的书目本体Bibliographic Ontology Specification,欧盟DERI的MarcOnt等,我国学者白海燕和乔晓东[6]也提出了基于本体构建数据组织模型,并进行了初步的实现。这些相关研究与实践是图书馆书目数据社会化扩展与应用的重要基础。 2.2 关联数据理论与方法的研究 关联数据理论与方法的发展为图书馆书目数据社会化应用提供了可能。将图书馆数据以关联数据的形式发布,以便其他网络可以利用这些数据,这是关联数据在图书馆应用中的主要模式。从2008年开始,国外图书馆领域开展对关联数据的理论研究与应用探索。近年来,关联数据云LOD中与图书馆相关的关联数据规模不断扩大,越来越多的图书馆将自己的资源发布为关联数据。截止到2015年6月,Datahub(http://datahub.io/dataset)中“library linked data”和“bibliography data”相关关联数据集的数量已经增长到238个。业界对书目数据关联的研究主要集中在将图书馆书目数据及词表资源发布为关联数据的方法、基于MapReduce技术的书目数据匹配等。目前图书馆书目数据社会化应用主要表现在将图书馆机构信息与书目数据实现关联、图书馆数据集与第三方数据及非图书馆数据相关联,如开放图书馆描述了1亿多种同书目数据关联的电子书数据,德国UBA计划将图书馆书目数据与相关的环境观察数据建立关联。Eric和Micheline[7]描述了关联数据的概念、应用空间及图书馆实现关联数据的途径。Getaneh等[8]认为应该将图书馆数据从RDA和FRBR模型调整到基于RDF的数据模型。Rob等[9]探讨如何把图书馆MARC记录转换为SKOS,进而发布为关联数据。Summers等[10]提出将美国国会图书馆MARCXML格式的主题标目转换为SKOS的技术方法。虞为和陈俊鹏[11]提出基于MapReduce的书目数据关联匹配架构。 总体来看,图书馆发布的关联数据类型和应用领域呈现出不断扩展的趋势,发布的数据类型日益多样,书目数据是目前图书馆发布数量最多的数据,但是,其他类型的数据资源,如知识组织系统数据、名称规范数据等也呈现出日益增长的趋势。同时,图书馆在发布书目数据资源的基础上,也开始对期刊、引文、论文、历史手稿、特藏等多种资源元数据进行关联发布与实践。关联数据方法与技术的出现及应用为图书馆书目数据的进一步开放提供了理论与技术支撑。 2.3 书目框架转换计划研究 美国国会图书馆于2011年5月发起“书目框架计划”(The Bibliographic Framework Initiative,简称BIBFRAME),从书目环境的角度出发,对资源进行有效的分类和描述并使之发生关联。目前有美国国会图书馆、德国国家图书馆等7个参与机构提供8个样本数据集参与测试。从目前研究来看,主要集中于书目数据的内容、结构、数据转换格式等,如Adamich和Tom[12-14]发表了系列文章对BIBFRAME的性质、框架、结构等进行探讨。Mitchell和Erik[15]在图书馆技术报告第3章中探索了由美国国会图书馆发起的书目框架计划。目前国内学者已经开始关注BIBFRAME,刘炜和夏翠娟等学者[16]对BIBFRAME的框架模型、术语词表、用例与需求和用具等内容进行归纳与总结。BIBFRAME为图书馆书目数据格式的进一步转换与映射提出了可行的技术框架与实施方案,能够有效的促进图书馆书目数据的社会化扩展应用。 2.4 开放的社会元数据研究 网络上存在着大量由用户产生的书目数据资源,如开放网络社区书目数据、DBpedia、FOAF、CAM、Folksonomy等,这些数据能够为图书馆书目数据扩展提供丰富的内容,Thomas等[17]指出用户提供的Folksonomy标签数据能够有效补充现有的资源揭示与描述内容,标签数据与书目数据结合形成的复合型目录能够形成更为丰富的资源揭示与描述的元数据。研究人员已经开始关注传统书目数据与用户书目数据之间的联系,如Alexander等人将社会标注同现有本体关联应用于科技论文的描述、识别和揭示,以更好的支持eScience[18]。Kwan等人尝试将Folksonomy同国会主题词表(LCSH)有效链接,实现用户词表与专家词表的有效融合[19]。 目前,相关机构对书目数据社会化应用也积极地开展实践探索工作。在20世纪90年代中期,the Network Development and MARC Standards Office支持从MARC 21数据结构到SGML的编目数据相互转换[20]。国会图书馆2004年开发了基于XML环境利用MARC数据的框架[21]。2012年6月,OCLC将WorldCat.org中的书目元数据发布为关联数据[22]。图书馆系统服务商VTLS宣称其Open Skies平台支持BIBFRAME书目框架[23]。科罗拉多大学启动了“BIBFRAME数据存储库”项目,在Redis图书馆服务平台上,实现MARC21记录到BIBFRAME实体的转换[24]。 可见,传统图书馆书目数据的社会化扩展及应用已经成为近年来业界关注的热点问题,研究人员从书目数据的扩展、关联等多个角度进行了相关的研究,扩展了图书馆书目数据的应用范围。但是,从目前的研究来看,这些研究大都处于起步阶段,重点关注书目数据的转换与关联,而没有从书目数据整个生命周期出发来构建其社会化应用的整体架构,对其中涉及图书馆书目数据社会化应用的需求及价值定位、数据的规范、转换与关联方法、应用路径等核心问题及关键技术,都需要进一步深入研究。 3 基于数字生命周期的图书馆书目数据社会化应用体系架构 图书馆书目数据作为揭示与描述图书馆各类型资源的重要内容,是图书馆资源的重要组成部分。同所有的数字资源的创建、获取、揭示、组织、发布与利用过程一样,图书馆的书目数据的创建、组织、发布与利用也具有相似的数字生命周期。图书馆书目数据社会化的应用能够体现在书目数据生命周期的每个阶段。 因此,图书馆书目数据社会化应用需在对书目数据内在价值重新认识与定位的基础上,从资源层、技术层及服务层构建基于书目数据获取集成—关联加工—传播利用生命周期的书目数据社会化应用整体架构。在BIBFRAME模型和RDA框架的基础上,重点研究适用于中文书目数据的数据映射、转换与关联方法,实现图书馆书目数据与图书馆以外的各类型数据格式的转换与关联,增强现有书目数据体系的社会化应用程度,如图1所示。图书馆书目数据社会化应用研究_图书馆论文
图书馆书目数据社会化应用研究_图书馆论文
下载Doc文档