美国高校图书馆数据管理服务体系建设与策略研究_大数据论文

美国高校图书馆的研究数据管理服务体系构建及策略研究,本文主要内容关键词为:数据管理论文,美国论文,服务体系论文,图书馆论文,策略论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

      分类号G250

      早在2010年美国科学基金会(National Science Foundation,NSF)要求科研人员在项目申请时需要提交数据管理计划之后,其他的一些基金组织,如国家卫生研究所(National Institutes of Health,NIH)、能源部(Department of Energy,DOE)等,也陆续提出类似的要求。基金组织或期刊出版社的推动为图书馆开展数据管理服务提供了外部条件,考虑到科研人员的实际需求以及图书馆自身发展的需要,研究数据管理服务成为了图书馆一项重要的服务内容。英美等国家的高校图书馆在研究数据管理服务理论与实践方面进行了不懈的探索,研究主题主要涵盖研究数据管理的概念、内容、技术、政策、工具、培训与教育、案例分析等。考克斯(Cox)[1]把研究数据管理(Research Data Management,RDM)界定为贯穿数据生命周期的数据收集、存储、安全、保护、检索、共享与再利用等一系列主要活动与过程,以及与之相关的技术设施、道德准则、法律问题与管理框架等。田纳普(Tenopir)[2]调查了美国和加拿大高校图书馆研究数据服务(Research Data Services,RDS)实践,结果显示目前RDS没有有效开展起来,主要以资讯型RDS为主,而技术型RDS相对较少。品菲尔德(Pinfield)[3]提出的图书馆RDM项目的组成元素有战略规划、政策、指南、过程、技术与服务,以及文化、技能、交流等诸多影响因素。约翰斯顿(Johnston)[4]以明尼苏达大学为例,介绍了图书馆围绕数据管理为全校师生举办的“数据管理”系列研讨会实践。威廉姆斯(Williams)[5]通过与伊利诺伊大学香槟分校作物科学系教师进行访谈,探讨数据共享的原因、途径及优缺点、图书馆在数据共享中的作用等,并总结了数据共享面临的挑战。国内诸多学者[6-11]主要通过网络调查等方法引介国外图书馆研究数据服务的实践,并在此基础上进行理论探讨。

      在对美国50所高校图书馆的研究数据管理服务进行网络调查的基础上[12],根据服务体系构建的3个核心要素:技术平台是支撑、机构人员是关键、资源工具是基础,从中优选了服务体系构建特色比较鲜明的加州大学圣地亚哥分校[13]、威斯康星大学麦迪逊分校[14]、埃默里大学[15]和伊利诺伊大学香槟分校[16]4所高校作为分析案例,并辅以现场考察、咨询交流等方式对伊利诺伊大学香槟分校的服务案例进行了详细剖析,构建了“361型”图书馆研究数据管理服务体系模型,并提出了相应的构建策略。

      1 高校图书馆的研究数据管理服务案例研究

      1.1 加州大学圣地亚哥分校

      加州大学圣地亚哥分校主要通过成立服务团队、开通交流平台、举行研讨会、依据数据生命周期免费向全校师生提供数据管理计划、元数据、数据标识符、数据共享与发现、数据保存等服务。成立6人组成的研究数据管护项目团队,1人担任主任、其余5人各司其职、职责明晰。开通的数据咨询交流平台,方便科研人员在提交数据管理与共享之前进行自我摸底,如数据的潜在用户、数据存在与利用方式、是否为敏感数据等。通过研讨会等形式提供专题培训,如利用数据管理计划工具(Data Management Plan,DMP Tool)制定数据管理计划、利用长期标识符EZID(easy-eye-dee)创建标识符等。提出了科研人员和服务团队分工合理的6个阶段的数据生命周期,团队可以参与除数据分析和数据出版外的其余4个阶段的服务。

      服务内容包括:(1)数据管理计划。提供适用各种基金资助机构要求的DMP Tool案例和模板资源。(2)数据描述。提供元数据咨询、元数据标准、协助创建元数据,以及审查元数据的质量和可用性等服务。(3)数据存储。学校的数字保存服务网络(Digital Preservation Across Space & Time)Chronopolis提供长期的数据存档,具有健全的管理流程和持续的监控功能。(4)数据共享。主要包括使用元数据描述数据、获得永久标识符、选择学科存储库(如生命科学的Dryad等)和学校存储库数字资产管理系统(Digital Asset Management System,DAMS)。(5)最佳实践服务。包括数据保存、备份、存储、组织、描述、标识符、元数据和清洗服务。以数据保存为例,长期保存最好选择学校的数字保存(Digital Preservation)。科研团队内可以考虑电子实验笔记(Electronic Laboratory Notebook,ELN)维护和共享数据文件。

      1.2 威斯康星大学麦迪逊分校

      威斯康星大学麦迪逊分校通过成立数字管护团队、联合校内机构、提供丰富的资源等形式免费向全校师生提供数据管理计划帮助、咨询、培训与教育、参考等服务。数字管护团队由15人组成,成员背景广泛,来自科研人员、图书馆员、IT职员和图书情报专业的研究生。团队的使命是利用合适的工具与资源满足科研人员的数据保存和维护要求。图书馆联合信息技术部门(Division of Information Technology,DoIT)、首席信息官(Chief Information Officer,CIO)、研究生院和图书情报研究学院共同提供服务。丰富的资源链接包括研究数据管理的指南教程与工具、校内外教育资源、会议日历表、培训资料、推荐阅读等。

      服务内容包括:(1)数据管理计划。提供各种基金机构的数据计划案例、指南及资源。(2)数据存储与备份。存储主要有MINDS@UW、UW-Madison Box、UW-Google Apps、UW-Madison/Google、DoIT Tech Store的外部硬盘驱动器和亚马逊(Amazon)S3 Dropbox等第三方云存储。(3)数据组织。主要包括元数据、文件命名和版本控制、本体和受控词汇。院系的IT员工、数据管护咨询专家、学科馆员等均提供元数据标准、本体和受控词汇的查找、修改和利用服务。(4)数据共享。可选择学校数字档案库(如MINDS@UW和在线数字档案馆(Online Data Archive))、学科存储库。(5)数据引用。主要使用DataCite initiative进行数据引用。(6)数据再利用。数据再利用之前需要进行数据清洗、数据理解,并且防止数据不全带来的损失。(7)数据可视化。提供了23种可视化应用程序和编程语言在名称、描述、平台、语言和许可5个方面的比较。

      1.3 埃默里大学

      埃默里大学通过LibGuides提供研究数据管理服务,主要方式有进行在线调查、成立服务团队、招聘新员工、联合其他机构、借鉴数据生命周期理念等。早在2012年对该校科研人员进行研究数据管理实践与看法的在线调查[17],发现用户最需要的服务是数据管理计划和数据管理培训。2012年秋成立数据管理团队,联合学校的6家相关机构,如电子数据中心(Electronic Data Center)等,共同提供数据管理指南与帮助服务。团队新聘用了一名数据管理专家和一名e-Science图书馆员。团队的使命是协助科研人员完成RDM、探索新趋势与共享信息、尝试新服务、新工具与新资源。借鉴英国数据档案(UK Data Archive)的研究数据生命周期[18]作为服务理念提供服务。此外还提供DMP Tool、数据管理与出版等丰富的在线资源链接以及相关的期刊论文、研究报告链接。

      服务内容包括:(1)数据管理计划。包括DMP工具使用指南、基金资助机构的要求以及数据管理计划的组成部分。(2)数据保存。优先选择学校资源进行集中存储,如学校技术服务部(University Technology Services)等。如需要长期保存,数据集可放在学科存储库(如Databib和re3data.org)。(3)数据共享。数据可以通过电子邮件、个人网页、相关期刊论文的补充信息共享,或者通过学科存储库(如生物科学的Dryad、社会科学的ICPSR)。(4)数据文档与元数据。为使计算机可读和可搜索,应当使用标准的格式或模式创建元数据。(5)数据引用。列举了几个数据集不同格式的引用案例以及学术期刊对数据复制的政策,如数据集存储在学科存储库(比如Dryad、ICPSR)、发表在数据期刊上或分配一个唯一的数字对象标识符(Digital Object Identifier,DOI)。(6)数据出版。数据出版信息包括研究目的、设计、采样程序、数据采集和处理方法,相关设备和软件、质量控制措施等。提供3个数据出版的例子,如自然出版集团的科学数据(Scientific Data(Nature Publishing Group))等。

      1.4 伊利诺伊大学香槟分校

      伊利诺伊大学香槟分校开展研究数据管理服务既受到科研人员数据管理的困惑与基金组织推动的影响,也是大数据时代图书馆学科服务拓展的需要。其研究数据管理服务探索的时间比较长,基础比较牢固。其中团队组建是重中之重,从早期的参与研究图书馆协会(Association of Research Libraries,ARL)eScience项目的团队,到eResearch Task Force,再到eResearch执行委员,一直到最近的研究数据服务团队。团队成员主要为科研人员提供研究数据管理的专业知识、工具和基础设施服务。专职人员有3人,1人负责服务的规划、管理和运营;另外两人分别承担数据管理政策与软件、数据管理咨询与资源共享等。主要以咨询和研讨会的方式面向科研人员开展培训,内容包括数据管理计划过程、数据获取、数据存储、校内外资源等。通过学术共享空间的服务连接提供丰富的数据管理资源,帮助研究人员理解数据管理的组成部分并制定满足基金资助机构要求的数据管理计划。

      服务内容包括:(1)数据管理计划。提供NSF、NIH等多个基金资助机构的数据管理与共享要求与使用指南。(2)数据组织。分为文件命名、版本控制、文件格式和数据描述(元数据)。文件命名要保持一致,避免特殊字符和空格。版本控制能够找回源数据,因此需要保存一份原始数据。学术共享空间推荐了多种类型的文件格式供参考。提供数字管护中心(Digital Curation Centre)的不同学科的元数据资源链接。(3)数据保存与共享。主要包括数据备份、数据安全、共享至数据存储库、长期保存。数据需要备份3份,个人电脑、院系网络驱动器、U of I Box或者外部硬盘。需要采取额外的预防措施来确保含有人类测试的数据安全,U of I Box支持家庭教育权和隐私权法案(Family Educational Rights and Privacy Act,FERPA)数据,而禁止健康保险隐私及责任法案(Health Insurance Portability and Accountability Act,HIPAA)数据。敏感数据需要联系机构审查委员会(Institutional Review Board)。数据应当保存在定期备份、非现场复制和经过数据完整性审查的系统,具体参考伊利诺伊学习与研究数字环境(Illinois Digital Environment for Access to Learning and Scholarship,IDEALS)数据保存政策[19]。

      综上所述,4所高校都根据自己的实际需要在技术平台、机构设置、人员配置、教育培训、服务内容等方面构建了独具特色的研究数据管理服务体系(表1),如加州大学圣地亚哥分校提供EZID与开放研究者与贡献者身份(Open Researcher and Contributor ID,ORCID)注册等数据引用工具、开通数据咨询交流平台;威斯康星大学麦迪逊分校与谷歌公司合作开发UW-Google Apps、通过会议日历表与博客等形式提供丰富的培训资源;埃默里大学专门开通培训网站、发布研究数据管理报告等。与其他3所学校相比,伊利诺伊大学香槟分校研究数据管理服务在技术平台、机构人员、资源工具、教育培训等方面呈现如下特色:一是校内外的技术平台结合使用。不但自建学校机构库IDEALS,而且与Box云服务合建U of I Box,还计划开发数据银行等。二是服务团队成员来源广泛,职责分工明确。团队成员以图书馆为主,其他来自分管副校长、教务长、图书情报研究生院、IT部门、超级计算中心等部门。三是通过学术共享空间的服务连接提供丰富的数据管理资源。主要包括基金要求、数据类型、存储与备份、文件格式与组织、文档与元数据、知识产权、隐私与保密、数据共享与许可、工具资源与名词术语10个部分。四是教育培训模式内外结合,根据用户层次设计针对性的培训内容。培训方式既有派员工外出参加研究数据管理研讨会/会议,又有邀请校外专家来图书馆针对员工开展研究数据服务培训活动。

      

      

      图1 “361型”图书馆研究数据管理服务体系

      2 高校图书馆研究数据管理服务体系构建研究

      图书馆研究数据管理与服务是一个系统工程,具有复杂性、动态性和持续性等特点。通过对美国4所高校的网络调查以及伊利诺伊大学香槟分校的实地考察,本文构建了“361型”的图书馆研究数据管理服务体系(图1)。“3”指的是技术平台、机构人员和资源工具组成的服务基础,这是服务实现的前提保障;“6”指的是服务内容,包括数据管理计划、数据组织、数据存储和共享、数据引用、数据分析和数据再利用,这是服务实现的组织核心;“1”指的是教育培训,这是服务实现的有效途径。

      (1)技术平台。指用于数据管理服务活动的大型存储设备、高性能服务器和软件系统等基础设施。主要分为三种方式:一是图书馆或校内其他相关部门建设的基础设施,图书馆自建的主要指学校机构库,校内相关部门主要是指数字档案馆、各院系的IT部门、科研办公室等,如埃默里大学的学校技术服务部和艺术与科学学院均提供数据保存服务。二是图书馆与校外关机构合作建设的基础设施,如威斯康星大学麦迪逊分校和伊利诺伊大学香槟分校分别与Box云服务公司合建UW-Madison Box和UI Box。三是校外机构第三方的基础设施,主要有学科存储库(如Databib、re3data.org、Dryad等)和第三方云存储(如Amazon S3 Dropbox等)。

      (2)机构人员。机构设置与人员配置是图书馆顺利开展数据服务的先决条件。机构设置是通过设置实体机构或成立服务团队来实现,以图书馆为主体,联合校内其他相关机构共同提供服务,如加州大学圣地亚哥分校成立的数据管护项目团队、埃默里大学成立的数据管理团队等。人员配置主要通过内部挖潜和外部招聘两种方式来完成,内部挖潜主要是对图书馆员进行专业知识与技能的培训,外部招聘是引进数据管理方面的行家能手,如伊利诺伊大学香槟分校计划招聘2名数据管护人员和1名数据机构库工程师来弥补现有人员职责分工方面的不足。

      (3)资源工具。资源工具主要是指与研究数据管理活动各环节相关的信息资源与实现工具,丰富的数据管理资源是图书馆顺利开展数据服务的重要保障。信息资源的内容包括数据管理活动的指南与模板案例、最佳实践、培训资料、数据政策、元数据标准、资源链接等。提供方式主要是网站链接、参考咨询、教育培训、开通博客等,如威斯康星大学麦迪逊分校提供校内外教育资源、会议日历表、培训资料、推荐阅读等丰富的资源链接。数据管理工具主要包括数据管理计划工具(如DMP Tool)、数据组织工具、数据存储工具(如DataBib、Figshare、Dryad)、数据引用工具(如DataCite)、数据分析工具等。

      (4)服务内容。指记录与数据管理活动密切相关的包含数据管理计划、数据组织、数据存储共享与出版、数据引用、数据分析和数据再利用等全过程的资源、工具与策略服务,其中数据管理计划是数据管理活动的核心,是对其他活动的总体规划与顶层设计。主要包括:①数据管理计划。包括DMP的组成部分、DMP工具使用指南、基金组织的模板、优秀案例等。②数据组织。包括数据文档(元数据标准)、文件命名与重命名、文件格式、版本控制、文件管理等。③数据存储共享与出版。包括数据存储共享与出版的原因、方式选择(网页、机构存储库、学科存储库、数据期刊)等。④数据引用。包括数据引用的原因、组成部分、格式、工具、案例等。⑤数据分析。包括数据分析的对象、方法、工具等。⑥数据再利用。包括数据再利用的对象、方式以及限制条件等。此外还包括围绕数据管理活动相关的其他服务,如数据安全(保密与隐私)、数据备份、数据政策、数据版权与知识产权、最佳实践等服务。

      (5)教育培训。教育培训是图书馆员与科研人员沟通的桥梁,是决定图书馆数据服务能否顺利开展的根本保证。既包括图书馆员自身能力的提升,也包括图书馆员对科研人员各种方式的指导、咨询与培训。主要方式有链接网络资源、举行研讨会、开通交流平台等,如加州大学圣地亚哥分校开通数据咨询交流平台(Research data Curation Program Consultation Form for Data Providers),为科研人员进行数据存储提供基本反馈;埃默里大学计划开通培训网站(researchdata.emory.edu),为全校师生提供数据管理资源与服务。安排专人成立专门的服务团队,针对不同的受众开发不同的培训内容及培训方式。如伊利诺伊大学香槟分校面向全校用户以研讨会的形式举行3个讲座,面向本科生录制数据管理概述的微视频,面向博士后研究人员开发证书项目,面向学科专家提供数据管护原理和数据管理工具服务,面向一般馆员提供数据管理用户需求与资源工具服务。

      3 我国图书馆开展研究数据管理服务的策略

      3.1 以战略规划为根本点,全面营造服务氛围

      一项管理工作一般都是从计划开始,经过组织、领导到控制结束。同样,对于图书馆开展的数据管理活动来讲,计划阶段是重中之重。科学合理、高瞻远瞩的制定战略规划,不折不扣、斩钉截铁的实施战略规划,把计划变为行动,有利于实现服务愿景与预期目标。美国高校图书馆研究数据管理服务的案例表明,各馆都会实事求是的进行顶层设计、制定战略规划。通常成立专门小组,仔细梳理以前的工作基础、目前的实际进展、未来的实现目标,制定制度与政策,构建包含机构、人员、资源、技术平台、教育培训、服务内容等数据管理活动全部内容的立体化服务体系。对我国图书馆来讲,一是成立专门规划小组,合理分工、明确职责。二是剖析图书馆已有的数据管理服务基础与存在问题,结合未来目标,有侧重、有特色的选择规划内容。三是多角度、全方位宣传战略规划,营造服务氛围。四是细化战略规划为年度计划、月度计划,甚至周计划,落实跟踪阶段表的实施与监督,确保顺利完成。

      3.2 以用户需求为切入点,着力创造服务效益

      了解、挖掘、满足用户需求成为用户和图书馆服务提供方的桥梁和纽带,因此理解用户真实需求是图书馆开展数据服务的有效切入点,能够提供针对性的精准服务,创造一流的服务效益。美国高校图书馆研究数据管理服务的案例表明,各馆都会千方百计、不失时机的采集、捕捉用户需求,然后分析用户需求,提出解决方案。有的图书馆采取网络调查的形式,有的采取派驻学科馆员进入科研一线的形式洞察用户需求。有的利用国家自然基金申请时的有利时机开展培训,抓住用户的需求心理,“顺藤摸瓜”深入挖掘用户的潜在需求。对我国图书馆来讲,一是巧妙设计用户需求调研内容,做到难易适中、恰到好处。二是合理选择用户需求调研时机,切合用户的心理需求与技术需求。三是丰富用户需求调研形式,如网络调查、问卷调查、访谈、焦点小组、观察等。四是深入挖掘用户需求调研结果,提出有针对性、实效性、预见性、持续性的解决方案。

      3.3 以内容构建为着重点,切实保障服务运行

      服务内容是核心与灵魂,是决定服务开展成功与否,以及服务质量水平的关键性因素,确保服务顺利开展。美国高校图书馆研究数据管理服务的案例表明,各家图书馆都会根据本校与本馆的实际,竭尽全力的拓展、完善服务内容,直至构建生态化的内容体系。虽然各馆服务内容建设的数量、层次与水平有所差异,但从整体来说,以生命周期为理论,由数据管理计划、数据组织、数据备份、数据出版、数据存储与共享、数据引用、数据分析与数据再利用组成的研究数据管理服务内容框架基本形成。对我国图书馆来讲,一是要借鉴国外成熟的服务内容,结合本馆实际,构建特色的服务内容理论框架。二是细化服务内容理论框架,对每一部分服务内容,都要进行深入的分解,如概念、目的、方式与途径、工具、案例、特点等。三是在具体服务实践的过程中,积极采纳用户的意见与建议,反复修改与完善。

      3.4 以学科团队为突破点,顺利引导服务实施

      数据管理服务的基础准备工作就绪后,下一步非常重要的工作就是如何为全校科研人员提供服务。由于科研人员或科研团队对数据管理服务需求的层次或程度千差万别,很难一刀切的全盘推进,因此以重点“学科团队”为抓手,成为推动服务开展的上佳选择。美国高校图书馆研究数据管理服务的案例表明,各馆在具体开展服务时,都会遵循由易到难、循序渐进的原则,学科馆员从自己所服务的学科团队入手,逐渐总结经验,不断深入,即所谓的“集中优势兵力,各个击破”的谋略。这样做的好处是以学科团队为突破点,按照工作目标,有计划、有步骤地执行,带动数据管理服务不断全面铺开。对我国图书馆来讲,一是确定学科馆员所服务的学科团队,采集其服务需求内容,总结规律以制定相应对策。二是选择合适的服务时机,立即切入,以此为突破点,把服务推向深入。三是学科馆员嵌入所在的学科团队,先行开展试点,总结经验加以交流、推广。

      3.5 以多方合作为支撑点,确保提高服务质量

      鉴于图书馆一方在开展数据管理服务时在技术、人员、费用、资源等方面能力有限,因此寻求校内外多个机构与部门的合作是面向用户提供高质量服务的策略之一。美国高校图书馆研究数据管理服务的案例表明,各馆在开展服务时都会根据具体目标选择合适的合作机构与部门,如进行基础设施建设的相关技术机构包括学校的机构知识库、档案馆、各院系的IT部门以及校外的学科存储库、第三方云存储等;如进行服务规划、营销、提供的合作部门或人员有校长办公室、教务处、图书情报专业教师、专业科研人员、校外数据管理专家等。对我国图书馆来讲,一是成立数据管理服务战略顾问委员会,成员由图书馆馆长、副校长、教务长、各学院院长、IT部门主任等组成。二是成立数据管理服务团队,以不同职能分工的图书馆员为主体,联合IT部门职员、图书情报专业师生共同提供服务。三是根据具体的服务目标与内容选择合适的校内外合作机构与部门,如校内的IT部门,校外的学科存储库、云服务公司等。

      3.6 以教育培训为结合点,努力搭建服务桥梁

      教育培训是实现图书馆员与科研人员双向沟通的有效途径之一,是建立在供需双方之间的一座双向交流桥梁。美国高校图书馆研究数据管理服务的案例表明,教育培训的内容丰富多彩,形式变幻无穷,既有针对员工自身的充电培训,保证员工掌握基本的知识与技能以便为科研人员提供更具科学性的指导;当然更主要的是员工针对科研人员的指导培训,让科研人员了解并掌握服务的基本理论与基本技能。对我国图书馆来讲,一是通过多种方式与途径提高图书馆员自身的研究数据管理服务的基本知识与基本技能。二是以用户的基本需求为依据,为用户设计培训内容框架体系。三是针对不同的用户群体,如研究人员、博士生、本科生等,设置不同的培训内容。四是提供丰富的培训方式,既包括静态的链接网络资源、开通交流平台、专题视频点播等,也包括动态的参考咨询、举行研讨会、嵌入科研过程等。

      4 结语

      研究数据管理服务对图书馆来说既是难得的机遇又是巨大的挑战,图书馆要在其中发挥主导作用。同时,研究数据管理服务又是一项复杂的系统工程,不仅需要软硬件的建设,还需要服务体系的有效整合。本文在对美国4所高校服务实践网络调查的基础上,结合现场考察的方式对伊利诺伊大学香槟分校的服务体系进行系统梳理,根据科学性、有效性、系统性和实用性的原则构建了“361型”的高校图书馆研究数据管理服务体系。最后提出了我国高校图书馆开展研究数据管理服务的策略。总体来说,尽管各家图书馆在此领域进行了不懈的探索和实践,但是在战略规划、技术设施、内容设计、团队组建、人才培养、体系整合、营销推广等方面需要循序渐进,毕竟研究数据管理服务不是一蹴而就的,而且在新的时代环境下一直在不断变化。

标签:;  ;  ;  ;  ;  ;  

美国高校图书馆数据管理服务体系建设与策略研究_大数据论文
下载Doc文档

猜你喜欢