档案理论在数字监护研究中的应用及启示_档案学论文

档案理论在数字监护研究中的应用及启示_档案学论文

数字监护研究中档案学理论的应用及启示探析,本文主要内容关键词为:探析论文,启示论文,学理论论文,档案论文,数字论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

       [中图分类号]G270

       Digital Curation(数字监护,以下简称DC)是指对科学数据的筛选、鉴定、表示、组织、维护和存档等一系列活动,通过DC来维持和增加科学数据的价值。①DC研究立足于数据的整个生命周期,包括三个核心概念,即对科学数据的保护(Conservation)、保存(Preservation)和获取(Access)②6。DC工作的目的是为确保科学数据当前使用及未来的再开发与再利用,包含科学数据的共享。其首次出现可以追溯到2001年在英国伦敦召开的“Digital Curation:digital archives,libraries and e-science seminar”③国际研讨会,与会专家首次提出了DC的概念,并认为档案学家与数据专家应当在e-science中开展关于科学数据管理的跨部门交流与合作,以确保科学数据的长期保存与开发利用。随后DC在国外逐渐成为图情及档案领域研究的热点。DC针对科学研究中数据管理困境,可以有效满足科学研究的现实需要、扩大数据的开放与共享、促进岗位优化转型、实现科学数据的长久保存与开发利用,对科研及社会发展具有重要意义。作为DC研究的创始性学科,国外档案学界一直积极融入DC研究之中,档案学理论与原则在DC研究中也发挥着重要的作用。梳理国外档案学在DC研究中的参与性及档案学理论的应用状况,可以有效促进国内DC研究进展及档案学科的发展完善,具有重要的研究意义。

       1 国外DC研究中对档案学理论的借鉴与应用

       国外DC研究中十分注重档案学科的参与性及档案学理论的应用,DC概念的提出离不开档案学者的努力,2001年在英国伦敦召开的首次DC国际研讨会就有众多档案学者参加,关于档案学参与DC的重要性获得与会专家的一致认可。④Wallis J等人则进一步指出将档案学理论与原则尽早地运用于科学数据生命周期的管理之中可以有效增加数据的可信度、真实性以及DC的顺利进行。⑤梳理国外DC研究理论及实践,可也发现应用其中的档案学基本理论与原则主要有三个:来源原则、档案鉴定理论与文件生命周期理论。

       1.1 对来源原则的借鉴及应用

       数字背景下档案学领域中的来源原则指文件的形成过程和背景,即文件由谁、在什么条件下、为了何种目的、运用哪些数据、采用什么结构等方面的综合信息,是了解、管理与利用文件的关键所在。这里的文件范围比较广,既包括实体意义的文件材料、档案资源,也包括各种数据资源、电子档案等资源。来源原则中尊重来源与强调完整性的核心思想及元数据的应用对国外DC研究具有重要的指导意义。

       首先,来源原则强调尊重文件(数据)的来源,这对DC研究中确保科学数据的真实性及可靠性具有重要的指导意义。档案学中“尊重来源”是指档案馆整理档案时首先应当按照来源标准,保持档案与其形成者之间的来源联系。数字环境下,来源原则更加拓展到文件形成过程来源,更加关注于文件形成目的、形成活动、过程、处理程序和职能范围等概念来源,⑥这与国外DC研究中对科学数据质量要求一脉相承。科学数据作为特定单位、科研机构、组织与个人在科技实践活动中直接形成的产物,在产生和处理过程中会产生多方面的历史联系,包括来源联系、时间联系、内容联系、结构与形式联系等,其中来源联系应当是首要的。决定科学数据来龙去脉的重要信息就出自其来源⑦,而科学数据的来源信息与其将来的再开发与再利用就有直接的必然联系⑧。这里的来源正是指在工作或生活中创造、获取、使用、管理科学数据的人员、单位、机构、过程、活动等完整的背景性信息②⑩,只有完整掌握科学数据运动的详细信息,才能更好地对其进行管理与监护,更好地发挥其长久保存价值。

       其次,来源原则强调尊重全宗的完整性,国外DC研究中有效借鉴这一核心思想,对科研数据完整性也有很高的要求。来源原则尊重全宗的完整性强调全宗是一个有机整体,整理档案应当遵循全宗的完整性,不同全宗的档案不能混淆,这一思想对DC研究具有重要借鉴意义。科学数据也是一个有机的整体,相关联的科学数据应当有机地整合在一起,不相关的科学数据不能混杂,这样即可为其进一步开发利用提供便利,又可保障科学数据的质量。在DC实践中,需要保护与保存科学数据完整的来源信息,因为用户将来使用科学数据时需要确保其真实性与可靠性,然而用户对科学数据的产生、捕获及管理等运营情况并不知晓,这就需要数据保管机构将科学数据完整的来源信息以用户可视化的形式呈现于用户,辅助于用户对科学数据的再开发与再利用。⑨

       最后,元数据作为数字环境下来源原则有效的实现途径,对国外DC研究的开展具有重要的现实意义。元数据是关于数据的数据,是数字环境下描述档案资源生成、运转、处理、存储、检索、传递与利用过程的数据集合。在数字档案资源管理中,只要始终掌握其形成、管理与利用的元数据,并与档案资源内容一起保存起来,就可以掌握其生成与运转的来龙去脉,从而有效保持档案资源历史联系。借鉴档案学中元数据管理思想,国外DC研究中也积极运用元数据管理科学数据。元数据作为科学数据生成、管理与利用的关键,既能在其生成过程中自动抽取,又能在其利用过程中动态产生,还能由管理系统按功能软件同步生成,是与科学数据生成、保管与利用的全过程息息相关的原始信息的忠实记录,一经形成便被有效封装,只能被读取不能被删除与修改,因而是科学数据真实性与可靠性的重要保证。实际上元数据贯穿DC的全过程,从科学数据的保存到其获取与再利用,科学界对其重要性的认识却远远不足。⑩元数据的格式标准也不一致,这使得元数据在不同设备间的互操作性大大降低,且研究人员和课题组在科研项目中虽然有潜在大量元数据集合,但却缺乏足够的意识与时间来深入挖掘其中的隐性知识及进一步开发利用的价值,甚至忽略对这些元数据的保护与保存。(11)因而,科学数据管理人员在DC实践中,应当进一步借鉴档案学中元数据的管理与运用经验,开发利用元数据,统一格式降低成本,以元数据忠实呈现科学数据原始的来源信息,进一步保障科学数据的真实性与可信性。

       1.2 对档案鉴定理论的借鉴及应用

       档案鉴定理论的基本内容包括对档案价值的认识、对鉴定原则的规定和对鉴定标准的选择,这些内容在国外DC实践中对数据鉴定与选择时具有很强的应用性。数字环境下,科学数据海量而增长迅速,因而并不是所有的数据都会被归入DC之中,需要通过科学数据的鉴定来对其有效评估,通过对科学数据的筛选来确定哪些归档保存哪些清除销毁(12),这一过程中档案鉴定理论就有很强的应用性。

       国外DC对科学数据鉴定与选择时十分注重对数据价值的正确认识,并用全面的、历史的、发展的观点来判定科学数据的价值。就像档案鉴定一样,科学数据的鉴定与选择不能仅凭鉴定人员的头脑一热,所有的科学数据对未来的再利用都可能具有一定的价值(13),因而国外DC对科学数据的鉴定与选择不仅关注于科学数据自身的内容、来源和形式特点等方面的价值性,更关注科学数据对社会需求的价值性,根据社会需求的变化去评估和预测科学数据价值和社会需求之间的吻合程度。在对科学数据选择与鉴定时,全面分析数据的内容、来源和形式等各方面的有机联系,全面预测与分析社会多层次、多角度、多方面的利用需求;用发展的眼光看待鉴定的科学数据,既着眼于当前的作用又注重其未来发挥的作用,而且还结合历史环境与历史条件来判定数据的价值性,维护科学数据的真实面目。

       国外DC对科学数据鉴定与选择的标准注重参考档案鉴定理论。第一是借鉴档案鉴定的来源标准,这里的来源通常是指档案的形成者。科学数据价值的判定也充分考虑到数据的来源,数据的形成者在社会或机构中的地位、作用、职能直接影响并决定着科学数据的价值。第二是借鉴档案鉴定的内容标准。在对科学数据价值鉴定时,注重依据其内容的真实性、重要性、客观性、独特性、时效性等因素进行判定,因社会对科学数据的需求集中体现于内容需求,因而这也是科学数据价值判定的首要依据。第三是借鉴档案鉴定的相对价值标准,即被鉴定档案与其他档案相比较而存在的价值。国外科学数据价值的判定注重结合科学数据群体的完整程度,科学数据有一定的集合与群体,具有诸多的内在联系,数据群体越多越完整,个体数据的价值性相对降低,因而科学数据价值的判定需要结合相关数据群体的完整程度。第四是借鉴档案鉴定的效益标准,即考虑鉴定的投入产出比。国外科学数据价值鉴定也注重结合其监护效益,只有当科学数据发挥的价值大于对其监护的代价时对其监护才是有价值的,这里的效益包括社会效益与经济效益。

       1.3 对文件生命周期理论的借鉴及应用

       文件生命周期理论作为档案学重要支柱性理论,对档案学科发展与完善产生了重要的影响。数字环境下,文件生命周期理论中强调的文件运动整体性及全程管理与前端控制思想与国外DC实践具有很强的交融性。

       一方面,文件生命周期理论强调文件从其产生到销毁或永久保存,是一个完整的运动过程,这里的文件泛指人类实践活动中形成的各种形式的信息与记录。而国外DC将这一理论很好地融入研究与实践中,将科学数据运动视为“从摇篮到坟墓”的生命循环过程。DC涵盖对科学数据贯穿其整个生命周期的管理,从项目产生前的设计信息,到运行阶段的数据收集、元数据捕获,到最终的归档保存或销毁,贯穿科学数据运动的一生。(14)在数据生命周期之中,DC对科学数据的维护更像是对“蔬菜”的培育,需要不断地给予其营养,培育数据使其实现价值增值,而不仅仅是保存起来以备未来之用。(15)DC对数据生命周期的注重与应用可以有效保障科学数据的真实性、可靠性、完整性与可用性,进而可以促进数据监护投资效益的最大化。(16)另一方面,数字环境下文件生周期理论主张对文件进行全程管理与前端控制,即“对电子文件从生成到归档的整个过程进行统一规划和要求,把可以预先设定的监控功能和档案管理功能嵌入OA文件、档案工作业务流程进行重组,并在文件形成和维护阶段进行有效的监督,从而实现对电子文件与档案的超前控制和全程管理。”(17)国外DC实践中也注重在数据生命周期的基础上实现科学数据的全程管理与前端控制。为保障科学数据的高质量,DC注重实现数据监护的整体规划分析,业务环节提前进行,全过程管理监控。注重对数据监护的目标、要求及规则进行系统分析与有效整合,从而将数据形成阶段实现的功能在数据系统设计时就进行统一规划与设计,并在数据形成与维护过程中全程监控,从而可以有效保障科学数据原始的来源信息不会改变与丢失,完整真实地保存下来,以保证科学数据的真实完整、可靠可信及再利用。全程管理和前端控制对保障DC过程中科学数据的高质量具有十分重要的现实意义。

       2 国内DC研究现状及档案学参与DC研究的意义

       相比于国外DC研究,国内档案界并没有引入DC概念,至今也没有对这一领域展开详细研究,而图情学界则于2011年引入这一概念,其翻译名称有“数据监护”、“数字监管”、“数据存管”、“数据管理”、“数据策展”等不同理解与译法,通过对图情领域关于DC研究的文献进行分析可以发现,国内DC研究多关注于其定义分析、国外相关成果及经验介绍、国内图书馆环境分析与DC实施策略以及相应的研究综述等内容(18),关于档案学在DC中的参与性、档案学理论在DC中的应用等方面的研究凤毛麟角。笔者认为,档案学作为DC研究的创始性学科,且数字环境下数字档案资源与DC研究具有越来越强的交融性与渗透性,档案学参与DC研究具有重要的现实意义,且应在其中发挥重要的引领性作用。

       首先,数字环境下档案学理论与原则对DC实践具有很强的指导性,可以促进DC研究的丰富与完善。DC实践中一直面临着科学数据海量且增长迅速,科学数据无序杂乱而难于管理,科学数据真实性、可靠性、完整性及可持续利用性难以保障等多方面的困境,档案学科发展中也曾面对着同样的难题,而档案学基本理论与原则可对其提供有益的指导。数字环境下档案学中的来源原则就是针对海量档案资源的整理及档案来源信息的真实性问题进行探讨,档案鉴定理论也可以很好地解决海量资源的评估与选择,确保有价值的资源得以保存与利用,而文件生命周期理论对数据的全程管理及前端控制等都有很好的参考性,所以档案学理论与原则参与DC研究可以有效促进其丰富与完善。其次,数字环境下的档案学实践与DC实践具有很大的交叉渗透性,档案学实践经验可以为DC研究提供有益的参考与借鉴。档案学中对各种数字档案资源的保护与保存实践由来已久,从人类社会进入计算机网络时代,电子文件产生伊始,档案学界就开始探索数字档案资源的保护与保存问题,并进行一系列的实践与探索,而这些经验与教训可以为DC实践提供重要的借鉴,保障我国DC研究少走弯路及更快地发展。最后,DC研究跨学科交融性更强,研究领域更趋前沿,参与DC研究可以有效拓宽档案学研究视野,促进档案学在数字环境下更好地向前发展。DC是一门多学科共同参与的研究领域,需要档案学、情报学、图书馆学与计算机科学等学科加强交流与合作,共同探讨应对DC困境的多学科知识与原则。(19)档案学作为DC研究的创始性学科应当以积极的姿态参与DC研究,在多学科交流中档案学科也可以开阔视野,促进其进一步发展完善。我国DC研究时间尚短,还处于起步阶段,我国档案学科应当把握住这一有利时机,借鉴国外档案学参与DC研究的先进经验,发挥自身学科优势,在我国DC研究中发挥自身独特的作用。

       3 结论与启示

       档案学作为DC概念及研究的创始性学科,在国外DC研究中一直主动参与并结合自身的学科优势,积极发挥自身价值与影响。档案学基本理论与原则,如来源原则、档案鉴定理论、文件生命周期理论等在国外DC研究中发挥着至关重要的作用。(20)来源原则强调尊重科学数据来源、完整性及元数据在其中的应用,对确保科学数据的真实性、完整性及可信性具有重要意义,并且可以指导海量科学数据的整理;档案鉴定理论为DC实践中科学数据的鉴定与选择提供指导,保障科学数据的质量及DC的效益性;文件生命周期理论对数据生命周期的完整性认识及对科学数据全程管理及前端控制的思想为DC研究提供全新的思考与借鉴。国内档案学界并未对DC研究引起足够的重视,而DC研究的丰富与完善需要档案学理论与实践的指导,分析国外档案学参与DC研究状况,对我国档案学参与DC研究具有一定的启示作用。

       首先是更新观念提高认识。国内档案学界要认识到DC研究的重要性及良好前景,这种重要性对档案学科自身的发展完善也大有裨益,并进一步认识到数字环境下档案资源管理任务的艰巨性,重要的数字档案资源随时都有永久消失的风险,需要引起档案界重视并采取手段加强其监护。其次是发扬优势积极参与。档案学参与DC研究具有自身的学科优势,这也是档案学能够成为DC研究创始性学科的重要原因,档案学在数字资源归档、保存等管理实践中进行了大量的探索与尝试,总结了大量的经验与教训,也形成了具有自身学科特色的理论体系,这些都是档案学科参与DC研究的重要筹码,参与其中必将有力推动DC研究向着更全面的方向发展。再者是加强教育培养人才。档案学界应当结合自身学科特色及专业优势,设置DC研究方向的人才培养策略与教育规划,为其参与DC研究储备专业人才资源,这些人才资源也将成为我国DC研究中不可或缺的独特力量。最后是结合实践深入研究。DC研究的深入进展需要结合具体实践而持续推进,而目前国内DC实践还没有全面展开,档案界对DC的实践更是寥寥无几,这些都将影响DC研究的深入。而国外档案机构如英国国家档案馆(UKDA)、荷兰国家数据档案和网络服务中心(DANS)、欧洲社会科学数据存档委员会(CESSDA)等均从档案角度对DC进行了一系列的研究与实践,富有成效。我国档案界应当借鉴其有益经验,积极开展国内档案方面的DC实践,并结合实践加强DC的深入研究,促进学科研究内容的深化与升华。

       注释:

       ①DCC.What is digital curation?[EB/OL].(2004-01-01)[2015-04-25].http://www.dcc.ac.uk/digital-curation/what-digital-curation.

       ②张智雄,吴振新,刘建华.Digital Curation和Digital Preservation之概念辨析[J].现代图书情报技术,2014(1).

       ③Beagrie N,Pothen P.The digital curation:digital archives,libraries and e-science seminar[EB/OL].[2015-04-25].http://www.ariadne.ac.uk/issue30/digital-curation.

       ④Beagrie N.Digital Curation for Science,Digital Libraries,and individuals[J].International Journal of Digital Curation,2006,1(1):3-16.

       ⑤Wallis J,Borgman C L,Mayernik M,et al.Moving archival practices upstream:an exploration of the life cycle of ecological sensing data in collaborative field research[J].The International Journal of Digital Curation,2008,1(3):114-126.

       ⑥冯惠玲,张辑哲.档案学概论[M].北京:中国人民大学出版社,2006:255.

       ⑦Simmhan Y,Plale B,Gannon D.A survey of data provenance in e-science[J].SIGMOD Record,2005,34(3):31-36.

       ⑧Goodman A,Pepe A,Blocker A,et al.10 simple rules for the care and feeding of data[EB/OL].(2014-01-9)[2015-04-26].http://journals.plos.org/ploscompbiol/article? id=10.1371/journal.pcbi.1003542.

       ⑨Ross S.Digital preservation,archival science,and methodological foundations for digital libraries[C].Budapest:Proceedings of the 11th European Conference on Digital Libraries,2007:1-19.

       ⑩Riley J.Metadata services[C]//Ray J.Research data management:Practical strategies for information professionals.West Lafayette:Purdue University Press,2014:149-165.

       (11)Ray J.The rise of digital curation and cyberinfrastructure:From experimentation to implementation and maybe integration[J].Libr Hi Tech,2012,30(4):604-622.

       (12)Angus W,Andrew W.How to Appraise and Select Research Data for Curation[EB/OL].(2010-10-25)[2015-04-26].http://www.dcc.ac.uk/resources/how-guides/appraise-select-data/.

       (13)Neilsen H J,Hjorland B.Curating research data:the potential roles of library and information Professionals[J]J Doc,2014,70(2):221-240.

       (14)Lee C A,Tibbo H R,Schaefer J C.Defining what digital curators do and what they need to know:the DigCCurr Project[EB/OL].(2007-08-02)[2015-04-26].http://www.ils.unc.edu/digccurr/archiving2007_paper.pdf.

       (15)Heidorn P B.The emerging role of libraries in data curation and e-science[J].Journal of Library Administration,2011(51):662-672.

       (16)Higgins S.The lifecycle of data management[C]//Pryor G.Research data management.London:Facetm2012:17-45.

       (17)康雷震.电子档案管理中的前端控制[C]//王茂法.档案管理理论与实践——浙江省基层档案工作者论文集.杭州:浙江工商大学出版社,2013:219-223.

       (18)曹霞.国内Data Curation研究现状与热点分析[J].图书情报工作,2014(9):144-148.

       (19)Milena D,Wendy M D.The ever changing face of digital curation:introduction to the special issue on digital curation[J].Archival Science,2015(3):1-4.

       (20)Alex H.Poole.How has your science data grown digital curation and the human factor:a critical literature review[J].Archival Science,2014(11):1-40.

标签:;  ;  ;  ;  

档案理论在数字监护研究中的应用及启示_档案学论文
下载Doc文档

猜你喜欢