日本档案数字化建设过程分析_档案数字化论文

日本档案数字化建设过程分析_档案数字化论文

日本档案数字化建设进程分析,本文主要内容关键词为:日本论文,进程论文,档案论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

[中图分类号]G270 [文献标识码]A [文章编号]1003-2797(2009)06-0051-06

在全球性信息化浪潮的推动下,建立信息存储量巨大、信息资源共享的数字化档案信息系统成为21世纪档案馆信息资源建设的新的发展方向,世界各国档案界在档案馆档案数字化建设方面进行了许多有益的探索。笔者认为,传统档案馆的数字化建设之路是一个循序渐进的过程,对世界一些先进国家的档案馆档案数字化建设的进程进行深入剖析,是规划档案数字化建设工程,为今后的数字档案馆、虚拟档案馆的建设打好基础的必要条件。

20世纪后期特别是进入新世纪以来,世界第二大经济强国日本为了扭转其信息化和数字化建设落后于世界头号信息化大国美国以及信息化发展速度最快的国家韩国的局面,着手全面推动信息化建设。日本政府提出了IT立国,制定了IT基本法、“e-Japan战略”和“e-Japan计划”,信息化建设取得了初步成效,这也为日本档案数字化工程的实施奠定了基础。日本国立公文书馆,即日本国家档案馆以此为契机和条件,开始积极推进档案数字化建设,提出了档案数字化的概念和日本档案数字化建设的基本理念,制定了《独立行政法人国立公文书馆档案数字化推进纲要》,明确了日本国家档案馆数字化建设的工作目标和工作步骤,同时,国立公文书馆成立了日本亚洲历史资料中心,通过因特网向用户提供数字化的亚洲历史资料,2005年4月,国立公文书馆数字化档案信息系统开始正式运行,这标志着日本国立公文书馆数字化建设已取得阶段性成果并渐趋成熟。深入研究和了解日本国家档案馆档案数字化建设的进程及其成效和经验教训,对我国档案馆档案数字化建设具有重要的参考和借鉴意义。

1 分析之一:档案馆档案数字化建设实施的条件

据日本国家档案馆——国立公文书馆的网页介绍[1]:国立公文书馆成立于1971年7月,收藏有以《日本国宪法》原件为代表的日本政府各行政机关移交的行政档案以及古代、现代其他文书档案1003万卷(册),古籍、古代文献资料、地图、绘画等54万5千余册(幅),它既是日本的国家级档案管理中心,也是面向社会各界广泛提供档案利用的中心。全球以计算机技术、通信技术、网络技术以及多媒体技术为基础的数字技术革命浪潮的冲击,促使日本国立公文书馆开始积极推进档案数字化建设。

1.1 因特网在日本社会的日益普及为档案数字化建设奠定了基础

进入21世纪以来,日本的网络应用环境得到了极大改善,网站的社会使用普及率有飞跃式的提升,日本总务省的统计数据显示[2]:日本2003年已经提前实现了政府提出的“到2005年,全日本建成至少有3000万家庭可以时时在线宽带上网,1000万家庭可以超高速上网的环境”的目标,并且为用户建立了世界上速率最高、价格最低的宽带平台。

1.2 日本全民IT教育计划的强化为档案数字化工程的实施创造了条件

近年来,日本公立学校的IT教育得到普及。根据日本文部科学省与有关方面的联合调查[3],到2003年末,全国公立学校平均每8.8个学生拥有一台计算机,计算机互联网连接率达到99.8%,同时,日本政府还特别重视和鼓励IT高级人才的培养,各大学普遍开设了IT课程,加强了IT教学。

1.3 日本“e-Japan战略”的制定为档案数字化工程实施确定了工作目标

日本政府为了促进高度信息通信网络社会的快速形成,于2000年制定颁布了IT基本法,奠定了IT政策的法律基础。2001年1月,日本内阁下设的IT战略本部提出[4]:“e-Japan战略”[日本IT战略],旨在确保2005年将日本建设成为世界最先进的信息化国家,以期全面加快信息化基础建设,其基本理念是:充分利用信息技术,最大限度地发挥信息网络的作用,使国民能够充分、方便地使用信息网络,并且优先发展医疗、食品、生活、中小企业金融、知识、劳动就业和行政服务等7个领域,其中,知识领域的侧重点是加快广播、电视、出版业的信息产品、美术馆、博物馆、图书馆等的馆藏资源、网络信息资源以及传统文化资源等的数字化建设。作为“e-Japan战略”的具体实施方案,“e-Japan重点计划—2002”和“e-Japan重点计划—2003”分别于2002年6月和2003年8月出台,明确提出要构建一个不受空间限制的、无论在何地都能查阅到包括重要的文书档案在内的历史档案资源的信息化环境的目标,具体地说,就是采取必要措施,到2005年末完成涉及与亚洲近邻各国关系的重要的文书档案、国家及地方自治体所保存的文化遗产信息的数字化建设工程,并通过各有关机构和部门的网页向国内外提供档案信息服务。为了确保日本在2006年以后继续成为世界IT产业的领跑者和开拓者,日本转向了IT立国战略的新阶段,据日本总务省网页介绍[5],总务省已于2004年12月超前制定出今后五年(2006-2010年)的IT战略—“u-Japan战略”,提出了在2010年将日本建设成一个“任何人可以随时随地以任何方式无限上网的泛在网络社会”的构想,日本将成为一个高度发达的信息化大国。

1.4 日本政府关于档案数字化建设的研究、指导和管理机构的设置及其职能活动为档案数字化工程的实施提供了理论依据和业务指导

据日文维基百科介绍[6],“档案数字化”这一概念,最早是在20世纪90年代中期,由东京大学名誉教授月尾嘉男传入日本。

2003年4月,日本内阁府设置了以庆应义塾大学教授、国家档案馆理事高山正也为会长,包括情报公开、文献管理、行政学及历史学等方面的六名专家为成员的“文书档案妥善保管和利用研究会”,共同探讨日本档案馆的数字化建设问题。7月,该研究会发布了以“2003年内研发新的档案目录检索系统、2005年实现馆藏档案包括高清晰图像档案网上阅览”为中心内容的中期报告。“文书档案妥善保管和利用研究会”还组织了对各主要国家档案馆数字化建设状况的调查,从调查数据中得出结论:目前,各国档案馆馆藏中纸质档案、电子文件档案等多种载体并存,各国都在以建设数字化档案馆为目标,对电子文件档案的特点及其保存、开放利用的措施开展积极的研究,国立公文书馆档案数字化工程必须将馆藏纸质档案和电子文件档案的保存与开放利用同时纳入数字化建设的轨道中。

2003年7月,以筑波大学图书馆情报学系教授石川彻也为会长,数据库技术、电子图像处理、字符转换、元数据管理及档案学等领域的五名专家组成的“档案目录数据库系统研讨委员会”宣告成立,截至2004年3月,该委员会召开了6次研讨会,指导并参与了日本国家档案馆目录数据库系统及先行数据库系统任务书的设计、编撰与论证,并提出了以互联网为基础、教育与娱乐相结合、图像信息与文字信息综合管理、图像档案的画质与成本综合考虑以及借鉴亚洲历史资料中心的经验,最大限度地方便检索的五大方针。

同年,日本执政党自民党设立了“档案数字化建设委员会”,该委员会在中期报告中指出[7]:国会图书馆和公文书馆是国家珍贵历史资料、文书档案的保存与利用机构,对现有馆藏资源和新接收的文书档案实施数字化工程势在必行。

2007年1月,日本国家档案馆以“构建数字化档案信息系统,推进国家档案馆档案数字化建设”为主题,召开了平成18年(2006年)度业务研讨会。会上,高山正也教授作了题为《国家档案馆档案数字化建设的现状与课题》的专题讲座,对以下三个方面的内容进行了论述[8]:

(1)档案数字化的概念:包括馆藏档案的数字化、待移交入馆档案的数字化、分散保管在各处的数字化档案检索系统的建立三个层面。

(2)文书档案的数字化与数据库建设问题:首先,强调档案数字化建设的必要性。档案信息数字化不仅是档案馆档案信息现代化管理的又一次飞跃,更重要的是通过信息数字化,对久远档案信息的保存也起到了信息抢救的作用,因此档案数字化是档案馆现代化管理、馆藏档案信息保存和利用的方向,应积极推进。其次,现行档案移交时,应实现相应电子文档目录与电子图像档案同步移交,以便于向用户及时提供利用。再次,应加强对档案馆人员IT知识的培训。

(3)数字化档案的利用、管理问题:首先,统一电子文档的存贮载体与格式,并严格按照法律与有关规定公开、利用数字化档案信息。其次,重视并解决数字化处理档案的鉴选标准问题、档案原本保存问题、人员培训问题、预算问题、个人信息保护与信息公开问题、电子文档的长期保存问题等等。

2 分析之二:档案馆档案数字化建设的基本理念

2005年9月,日本国立公文书馆在国际档案理事会东亚地区分会第七次会议的发言中,提出[9]:日本档案数字化建设的基本理念为:建立“无论何时、何地、何人都能自由利用的‘Ubiquitous’(泛在网络)数字化档案信息系统”,并指出其溯源于欧美信息学、网络学及法学专家所倡导的“Being Digital”(数字化)、“Commons”(共享性)、“WWW”(网络化)的三者结合。

(1)数字化。根据美国麻省理工学院教授尼葛洛庞帝在其著作《数字化生存》中所描述的:数字化就是构成物质世界的原子转变为数字化信息“比特”的过程,是以光速、廉价地将电子数据通过因特网传播的过程。档案与普通图书的不同之处在于它只存在一份原件,如果档案以原子状态存在,那么多人同时阅览一份档案原件是不可能的,但是,数字化的档案信息则使得无论何时、何地、何人自由地阅览同一份档案成为可能。这是数字化给档案工作带来的革命性变化。

(2)共享性。“用户应该可以自由地利用因特网所提供的情报信息”,这是美国网络法学家劳伦斯·莱斯格在其著作《共享》中提出的观点。莱斯格认为,依靠企业及个人的税收而运转的政府各部门所形成的各类档案信息原则上属于公有财产,应该实行共享制。美国的著作权法存在因过度保护而限制创作的弊病。在日本,法律上承认政府出版物的著作权,但文书档案因不属于出版物,所以没有版权。对于国立公文书馆来说,原则上其馆藏档案没有著作权,属于共享资源,利用者的身份只要是中学生以上,不需要登录全天24小时都可以自由、免费地阅览利用。

(3)网络化。档案数字化建设所要达到的终极目标是无论何时、何地、何人都能自由地利用档案信息,这里所谓的“自由”不仅是指自由地利用档案的内容,还指自由地利用档案的环境,在当前计算机广泛应用的时代,它包括性能良好的软件和无任何制约条件的网络通信环境,也就是因特网世界的WWW(World Wide Web:环球信息网)技术,通过它,全球各地的用户可以方便快捷地存取世界各地的超媒体文件,包括文字、图形、声音、动画、资料库以及各式各样的软件。

3 分析之三:档案馆档案数字化建设的工作目标

2004年4月1日,日本国立公文书馆发表《独立行政法人国立公文书馆档案数字化建设推进纲要》,明确提出了其数字化建设的工作目标[10]:

(1)构建档案数字化信息系统:为全体国民构建一个不需出门,通过因特网就能检索国立公文书馆馆藏档案、阅览和打印已数字化的原文图像档案的方便快捷的档案信息系统。

档案目录数据库模式:著录采用国际化标准的以XML为编码语言的编码档案著录EAD标准;对目录条目采用能灵活更新与修改的系统;为便于与其他各级各类档案馆进行网上关联信息检索,采用都柏林核心元数据集以描述网络档案信息资源。

图像档案数据模式:为方便网上阅览图像档案,采用JPEG2000格式、Adobe PDF格式以及JPEG格式等三种方式提供图像信息。

(2)确立快捷方便的档案检索语言系统,提供包括分级检索、关键词检索、复合检索、跨库检索等在内的检索手段,以便于用户快速、高效地检索出所需的档案信息。

(3)编制检索用语词典。文书档案中经常会出现一些生僻的公文用语、法律用语、历史事件、人名、组织名以及地名,用户想定的检索主题词与公文用语之间往往会出现不匹配的情况,在参考亚洲历史资料中心网站搭载的检索用语词典的基础上,编制出适合国立公文书馆档案信息检索用语词典,为用户提供档案信息检索的辅助手段。

(4)补充档案目录信息。尽快完成档案文件级目录的编制,做好馆藏档案关键词的抽取工作,为建立馆藏档案全文检索系统目录做准备,同时,补充原有的按移交档案部门全宗而分级编制的《档案全宗指南》的内容。

(5)加快馆藏档案数字化建设的进程。将现存已缩微胶卷化的文书档案逐步转换为数字化信息并实现网上公开利用;对于列入重要文化遗产的文书档案和绘画等超大型的档案资料,将现存的彩色负片逐步转换为高清晰的数字化图像档案信息;完成古籍、古文书档案中所附插图的数字化工作。按照馆藏档案的重要程度、利用频率、经费预算等情况,确定档案数字化工程的轻重缓急的目标。

(6)充实网站内容。在国立公文书馆网站建立展示高清晰图像档案的“网络阅览室”和面向中学生的展示中心,并为社会提供网络教育的素材。

4 分析之四:档案数字化建设的成效

4.1 网站的开设

1998年2月,国立公文书馆网站开始建立,通过因特网提供馆藏档案信息指南、档案陈列展览介绍以及数字化图像档案信息。2001年11月30日,亚洲历史资料中心网站开设,该网站在提供各类档案信息的同时,还举办了网上专题档案展览。

4.2 目录数据库系统的构建

1999年4月,利用因特网检索馆藏档案信息的目录数据库系统开始运行,到2004年3月,文书档案约53万册,古籍、古文书档案约43万册的数据已录入该目录数据库中。2005年6月,该目录数据库系统随着国立公文书馆数字化档案信息系统的正式运行而停止使用。

4.3 亚洲历史资料数据库的建设[11]

根据1999年11月30日日本内阁会议的决定,亚洲历史资料中心首先决定对战前公文档案的主要收藏机构国立公文书馆、外务省外交史料馆、防卫厅防卫研究所图书馆收藏的从明治初期到太平洋战争结束为止的日本与亚洲近邻各国关系的档案资料进行数字化,构筑图像数据库,并于2001年11月在因特网上正式运行。该中心可以说是通过互联网提供数字化图像和目录数据库的真正大规模的数字档案馆,其图像数据是通过为在互联网上提供大量文字内容而开发的世界尖端的图像压缩技术DjVu进行处理后提供的,其目录中收有各文件开头300字左右的文字,不仅可以以题名为检索对象,也可以直接以原文内容的一部分作为检索的对象。中心从2008年起,对于将公开提供利用的图像数据则采用了国际标准化的高清晰图像压缩技术JPEG2000格式。据2008年12月的统计数据显示,该中心提供公开利用的数字化图像合计已达115万件,1740万张,到2012年将达到3000万张,其中,国立公文书馆所保存的战前日本政府的中枢机构——内阁所形成的《太政类典》、《公文录》、《公文类聚》、《公文杂纂》及《御署名原本》、《返还文书》等文书档案目录数据22万件,图像397万张;外交史料馆所保存的二战结束前日本外务省形成的《外务省记录》和《外交调书》等文书档案目录数据18万件,图像500万帧;防卫省防卫研究所图书馆保存的陆军关系史料和海军关系史料档案目录数据75万件,图像843万张。

4.4 数字化档案信息检索系统的建立

2005年4月,国立公文书馆数字化档案信息系统开始正式运行,该系统是检索国立公文书馆所藏文书档案、古籍及古代文献资料目录数据库及利用数字化图像档案的“网络阅览室”,采用关键词检索、分级检索以及复合检索等多种检索方式以方便用户查阅利用。例如,目前公文书馆保存的文书档案62万册以及江户幕府时期保存下来的内阁文库约48万册古籍目录可利用关键词检索,日本政府各省、厅等行政部门全宗可通过分级检索方式进行检索。同时,该系统还安装了Z39.50(美国国家标准远程搜索馆藏信息协议)和SOAP(能与多种因特网协议和格式结合进行信息传输的简单对象访问协议),使得国立公文书馆与其他各级各类公文书馆、图书馆的目录数据库之间的跨库检索成为可能。在图像档案信息的利用方面,它采用了JPEG2000、PDF、JPEG等多种阅览格式,以方便用户不受计算机条件的限制及适应用户不同的需要。该系统运行伊始,就以日本国宪法制定等战后改革相关联的档案为中心进行数字化处理,提供了12万张数字化文书档案的网上阅览,到2008年12月,提供网上阅览文书档案的图像达165万帧,与在亚洲历史资料中心网站提供的文书档案图像合计达428万帧[12]。

4.5 高清晰数字化图像档案的提供

国立公文书馆收藏有一些被列为重要文化遗产的舆图、古代绘画等超大型、色彩丰富的档案,例如,幕府时代绘制的《天保国绘图》(82件)边长达7米,因档案实体形制较为特异而不能提供实物阅览;还有一些出于保护珍贵的历史档案原件的目的,如《日本国宪法》等,只能通过黑白缩微胶卷阅览。从2000年4月起,国立公文书馆逐步设立了提供高清晰图像档案阅览服务的数字化档案图库。运行开始时,只能通过馆内计算机主机画面提供阅览,2004年3月,采用了JPEG和JPEG2000模式后,开始尝试通过因特网提供彩色图像阅览。该数字化档案图库设置了分类检索(分为文书、图纸、古画和地图、照片、卷轴及广告招贴画六类)、50音图顺序检索、按地区检索(分为北海道、东北、关东、中部、近畿、中国、四国及九州八大地区)等3种检索方式,图像阅览具有扩大、缩小、“显微”、卷轴滚读等多项功能。例如,《安艺国》古地图为3.5m×3.5m的大型资料,即使将画面全部展开也很难看到全貌,经过数据压缩等数字化技术处理后,以一张数字化图像就可以比较清晰地阅览整个画面。《严岛神社》等国画,通过“扩大”和“显微”,可以欣赏到细部。另外,对于《樱町殿行幸图》这样的卷轴古画,长度达20米,利用JPEG2000的卷轴滚读功能,阅览起来可以卷展自如。截至2008年12月,该图库已公开提供利用《民选议院设立建白书》、《全国主要都市战灾概况图》、《天保国绘图》等531件、710张高清晰图像[13]。

4.6 与国家其它史料保存机构及地方公文书馆档案数字化建设的合作与交流网络的建立

为了提高国家历史档案信息的利用效率,为用户创造一个高效、便利的信息网络环境,国立公文书馆会同外务省外交史料馆、宫内厅书陵部、防卫省防卫研究所以及国立国会图书馆宪政资料室成立了“历史文书档案保存机构情报网联席会议”,其职责是调查各协作机构的馆藏档案信息状况、研究构建历史文书档案利用情报网。作为该联席会议的先行者,国立公文书馆还在其网站主页开设了历史文书档案探究网页——“文藏”,通过因特网详细介绍外务省外交史料馆、宫内厅书陵部、防卫省防卫研究所以及国立国会图书馆宪政资料室等历史文书档案保存机构的馆藏信息,提供资料检索,并通俗易懂地讲解日本历史文书档案及其保存机构的基本知识,定期更新,成为一般利用者学习了解历史文书档案知识的一个有效的工具。

同时,国立公文书馆还加强了与各地方自治体公文书馆的合作,建立了档案信息利用协作网。在2005年和2006年对全国52个地方自治体公文书馆档案数字化建设状况调查的基础上,于2007年和2008年,制订了档案数字化与网络化建设的国家标准,为档案信息的共享创造了条件,提高了历史文书档案的保存与利用效率,降低了国家规模的档案数字化工程的实施成本。

5 分析之五:档案馆数字化建设工程下阶段面对的课题

2008年11月18日,日本国立公文书馆理事、庆应义塾大学文学部名誉教授高山正也代表国立公文书馆,在庆应义塾大学作了题为《日本的档案数字化建设——从国立公文书馆及亚洲资料中心的档案数字化工程谈起》为题的专题讲演,高山教授将国立公文书馆数字化建设工程下阶段将面对的问题概括为以下几个方面[14]:

5.1 国立公文书馆的档案数字化建设方面

尽快完成国立公文书馆的文书档案数字化工作。虽然近年来日本国立公文书馆数字化建设取得了较大的进展,但是,截至2008年底,其完成的档案数字化的数量与该馆馆藏资料数相比,只是很小的一部分。

加强国立公文书馆的人员队伍建设。该馆的人员队伍与世界其他各国的国家档案馆有一定的差距,例如,美国、中国和韩国国家档案馆的人员编制分别为2500人、560人和300人,而日本仅有42人,给国立公文书馆的档案数字化建设工程的实施造成了一定的局限性。

建立和健全对各地方自治体所属公文书馆数字化建设的技术支援制度。

5.2 各地方自治体公文书馆的档案数字化建设方面

(1)提高全社会的档案意识,建立各级档案馆。目前,日本全国的地方自治体共有1800余个,其中,只有52个地方自治体设置了公文书馆,不到总数的3%。

(2)建立档案目录检索数据库系统,提供网上利用。

(3)妥善解决地方自治体档案馆的机构设置、财务预算和人员问题。

5.3 现代社会急速增长的电子文件的归档、鉴定、长期保存及利用问题

(1)确立电子文件的归档范围、留存方法。

(2)确保电子文件档案的保存与利用环境。

(3)制定电子文件元数据的制作与管理标准。

5.4 亚洲历史资料中心的档案数字化建设方面

(1)扩充与调整亚洲历史资料中心的机构设置与人员。

(2)对散佚在外的亚洲历史资料进行统计调查并进行数字化处理。

(3)进一步促进亚洲历史资料中心馆藏史料档案的广泛利用。

6 分析之六:日本国家档案馆档案数字化建设对我国的启示

(1)充分发挥政府与国家档案局在档案数字化建设中的主导作用。由国家档案局履行统一组织协调职能,建立健全档案数字化建设方面的各项法规,制定发展战略、发展计划和有关政策措施,彻底改变目前我国档案数字化建设中,各级各类档案馆各自为战、重复建设的现象,以保证档案数字化建设的高效实施。

(2)加快档案数字化标准建设的步伐。运用行政和技术手段,制定档案数字化建设的系列标准体系,如档案数字化建设统一的著录格式和目录格式标准,行业标准,档案信息分类标准,档案信息安全标准,网络基础建设标准,档案信息数据库管理软件设计与验收标准等等,同时,建立标准的修正、修订、推广、执行的长效管理机制,为真正实现档案信息资源的共享创造条件。

(3)加强对电子文件的收集和电子档案的管理,实现文档一体化管理模式。随着电子政务和电子商务的出现和发展,电子文件成为未来馆藏数字档案的最主要来源,我国档案馆的档案数字化建设应具有前瞻性,在档案馆同时建立“数字化档案数据库”与“数字化档案目录数据库”,对电子文件实行“前端控制”,“全程管理”,以保障电子档案的真实性、完整性和有效性。

(4)防范档案数字化建设中出现的数据安全隐患。尽快建立和健全数字化档案信息的安全防范体系、评估体系和保障体系,采用网络安全先进技术,同时提高人员的安全意识,强调操作的规范性,以保证档案数据的安全。

标签:;  ;  ;  ;  ;  

日本档案数字化建设过程分析_档案数字化论文
下载Doc文档

猜你喜欢