档案信息浅论,本文主要内容关键词为:档案论文,信息论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
档案信息这一概念在档案学界已被广泛使用,但以档案信息为主题或在论述中引用这一概念的文章大多是档案信息对整个人类社会作用的宏观论述,较少从档案信息的概念本身作更深入的探讨以反思这一概念的出现对档案学和档案工作的影响。
一、档案与档案信息的区别和联系
档案的概念在档案学界一直是最为关注的理论热点之一。目前虽然还难以找到一个绝对权威的学术定义,但我们可以肯定认为档案是文献的一个种类,它与图书、期刊报纸等构成文献家族。文献是记录、贮存和传播信息的物质形态,它由载体和信息两大要素构成,它是信息与其载体的结合体,是实实在在的物质形式。档案作为特殊的文献,它还必须是信息与载体的最原始的结合形式。
信息如果不从哲学高度进行抽象而仅从易于理解的角度进行描述,我们可以认为信息是消息、指令、数据、符号、信号中所包含的知识和内容。由此可见,信息不但不是文献,也不是消息、指令、数据、符号、信号本身,而是它们之中所含有的内容。信息虽然必须依附于物质载体而存在,但它本身却与物质载体无关。信息与知识、情报等属于相似概念,不具有物质形态,不具备物理测量的可操作性。例如一件档案,我们可以知道记录档案的纸张的长度、厚度和重量,表达档案内容的语言可用“句”、“字”划分长短。物体的长、宽、厚度和重量以及“句”、“字”都是具有客观标准的。而同一档案信息(比如会议通知)若用另一种文字记录在不同的载体上,以上的测量结果都会发生改变。作为档案信息它不具备物理测量性,只具有思维的主观判断性,同一份档案对不同的利用者可能有不同的理解,而且需求的心理也是千差万别的。
由以上讨论可知,档案是一种特殊文献,是档案的内容与载体的最原始的结合体。档案信息是档案实体中包含的一切信息的总和,它既可以沉睡于档案实体之中,亦可从档案实体中游离出来进行其它形式的贮存和传递,可以说档案信息是档案的灵魂,档案因为有信息存在而有生命和价值。档案实体是档案信息的载体,有了它档案信息才有最早的存在形式,档案信息的原始性、凭证性才得以体现。
二、档案信息的分类与存在形式
根据以上分析,档案信息大致可分为三类:即档案内容信息、形式信息和载体信息。
1.档案内容信息。档案内容信息是档案信息中最重要的组成部分,即指档案制作时档案形成者主观想要表达传递的信息内容。档案内容信息决定了档案形成的目的,它直接贮存和传递档案形成者的意愿。
档案内容信息具备以下特点:
①与其它文献信息相比具有原始性,因此它是最初被赋予档案载体之中的。它是这一信息产生的源泉。
②与档案的形式信息和载体信息相比,它具有易于转换的特性。档案内容信息大多用文字、符号(文字也是符号的一种表现形式)等表述。档案内容清晰,易于转换和翻译,我们多见的档案内容的摘编、引用皆属档案内容信息的转换。
③从档案形成的目的考虑,具有主观意愿性。档案内容信息是档案信息的主体,它是档案形成者所要表达的意愿,因此是档案形成者形成档案时主观赋予的内容,而形式信息和载体信息则不具备这一特性。
2.形式信息。档案的形式信息具有结构意义,所以亦可称为结构信息。形式信息指档案的存在形式中所含有的信息,它不被内容信息所包含,又不属于载体中所含有的信息。例如:常见的封建王朝中的文书“抬头制度”和“避讳制度”。这种制度本身给我们一种皇权至上的信息。我们所获得的这一信息既不来源于档案内容,也不来源于档案载体,这种信息表达在档案形成时,不是形成档案的目的,而是档案形成时的客观要求。又如公文体式、科技文件的代字代码标准、制图标准等所表现出来的信息都属于形式信息,档案的形式信息是档案信息中不可缺少的组成部分。档案形式信息是社会和历史的一种映射。
3.载体信息。载体信息即档案信息的载体中所含有的信息,档案信息载体可分为两个层次,一是承载文字或符号的载体,如纸张、胶片、磁带、磁盘等,二是符号和文字本身,我们可将前者称为第一载体,后者称为第二载体。
第一载体的界定,在档案界已达成共识,第一载体中也含有丰富的信息量,如我们通过对档案纸张进行物理、化学分析,可以了解和掌握当时的造纸技术,进而推断当时其它与造纸相关的科学技术水平。我们今天见到的三年自然灾害时期形成的档案,其纸张的粗糙、易碎,从一个侧面反映出当时特定的社会背景。因此,第一载体信息从宏观上折射历史,具有客观性,对历史具有间接性和客观性的反映。
第二载体信息是文字和符号所含有的又非它所代表的内容的那一部分信息,比如我们通过对历史档案字迹材料分析可获得信息。通过对文字表现观察可欣赏到书法艺术。字迹专家可从未签名的文字中分析签名人,甚至可以从多个圈阅领导人的“圈阅”中鉴别出对应的领导人,这些信息皆来源于文字载体信息,它不是档案内容中的固有的信息。
三、档案信息分类研究对档案学理论的影响
1.可以加深认识档案与其它文献的区别和联系。档案作为一种特殊文献,从所包含的信息角度分析,它具有独特的意义。就图书或期刊文献而言,因为它们不是其信息与载体最初的结合形式,因此除它们的内容信息之外,其它信息显得无足轻重,不具有原始性,也就难以发挥凭证作用。就档案工作与情报工作的内容来看,尽管其工作的环节极为相似,但情报工作更强调信息传递的方式和速度,在这一前提指导下,其内容信息得以充分的翻译和转换(即情报加工),而可以对载体和形式信息的丢失视而不见。然而档案工作要求我们既要重视内容信息的贮存和传递,又要关心载体信息和形式信息的保护。档案学专业的档案保护技术学正是研究如何保护档案载体的专门技术。
从档案信息的分类意义考虑,应有以下重要命题:档案信息大于档案内容信息,若将档案信息只简单理解为档案内容的信息,必造成档案信息的丢失。从而也失去了档案特殊文献的本质特性,档案工作也变为一般的情报工作。就情报工作而言,一般文献的内容即是它的全部信息量,可以通过任何情报加工手段将其信息进行转换,甚至可通过广播报导,均不会造成原文献的信息丢失。但是档案无论采取什么方式,只要使其中内容与最初载体相分离,载体信息和形式信息将会丧失。
2.重新审视档案编研工作的得与失。档案编研是档案室和档案馆工作的重要组成部分,它以其对社会的影响确立了它在档案工作中的地位。如果我们从档案信息的转换角度分析,档案编研工作的基本机理是档案信息的增殖与丢失。从某种意义上理解,编研工作从选题直至编研成果问世,是档案信息整理的过程(而非档案实体整理过程),在这一过程中最大限度地实现档案信息的增殖。档案编研工作是将若干内容相关的档案按照一定的体例进行分类编排,编排的结果可以得到在原档案中不能显现的信息。
例:1996年3月18日最高气温15℃
1997年3月18日最高气温11℃
1998年3月18日最高气温18℃
以上三条信息散存于三个案卷之中,是孤零零的三条信息,若出于某种需要,将它们排列在一起(编研中的编排过程),则还可得出另外三条信息,即
①1997年3月18日最高气温比1996年低4℃。
②1998年3月18日最高气温比1996年高3℃。
③1998年3月18日最高气温比1997年高7℃。
由原来三条信息增至6条信息。 这即是编研工作信息增殖的基本机理。
但另一方面,编研工作是档案信息加工和转移的过程,必然造成信息丢失。影印汇编造成第一载体信息丢失,原文汇编导致第一载体和第二载体信息丢失,其它的编研形式则会导致更大程度的信息丢失。
3.关于档案价值鉴定。档案价值鉴定应该是对档案信息价值的总体评价。不仅重视内容信息,同样重视载体信息和形式信息。例如《档案管理学》(邓绍兴、陈智为主编,中国人民大学出版社,1996年11月版)在论及鉴定档案价值的原则和标准时要求“全面地分析文件的各方面特征,从档案的来源、内容、时间、文本、外型等方面综合判定档案价值”。其中来源、时间、文本和外型中所含的信息,皆为档案内容以外的信息,进而论述到“有的文件是因为时间久远,因载体特殊,因有名人手迹等而身价倍增”。因为这些方面都赋予档案以内容以外的特殊信息。又如《科学技术档案管理学》(陈作明主编,档案出版社,1989年版)中也认为科技档案的鉴定,应分析它的“史料价值”、“工作查考价值”和“文物价值”。
从档案利用者角度分析,有的利用者是想获得内容信息,有的利用者是想获得内容信息,有的利用者则对文本形式、特殊载体或名人手迹感兴趣,以获取这些方面的信息为满足。
4.关于档案检索中查全率的思考。英国著名情报学家布鲁克斯(B.C.Brookes)在其名著《情报学基础》中,依照波普尔的三世界划分理论,创造性地提出三个世界中的测量问题,而且提出三个世界间的测量转换遵循对数变换的假设。波普尔的三世界划分即:物理世界(世界1)指宇宙间的所有物质形态;主观知识世界(世界2)指人类的精神世界;客观知识世界(世界3)即由“语言、艺术、科学、 技术等所有被人类储存起来或传播到地球各地的人工产物所记录下来的人类精神产物”(布鲁克斯《情报科学》,1983年第4期,第87页)。 根据这一划分我们可知档案具有两重属性,从档案的物质形态考虑,它属于物理世界,而档案信息又属于客观知识世界。依布鲁克斯观点,两个世界之间的测量变换遵循对数变换。
据此我们可以重新审视档案检索中的查全率问题。依据我们目前的经验,查全率指检出的相关档案件(或卷)与库藏总相关档案件(或卷)的比例。这一比例的计算是以档案件(或卷)为计量单位的,属于物理世界的量度。而真正对利用者起作用的是其中的档案信息,档案信息属于客观知识世界。因此对同一次检索过程,用两个世界的测量法则其结果是不同的,若物理世界(我们的经验测量)查全率为x, 则在客观知识世界其查全率为ln(1+x)。设x=0.6,则ln(1+x)≈0.79。换言之,档案件的查全率为60%,那么利用者的信息获得则高达79%。
这一结果尽管与我们的经验相悖,但与理性思考是相符的。应该承认同一主题的档案中信息内容具有交叉和重叠,具体表现在同一内容信息可能在多份档案中出现。假设某份档案的内容全部被其它档案所包含,那么这份档案对利用者来讲则毫无意义。依上例,虽然利用者见到的档案只占总数的60%,而其它40%的档案内容已有19%与检索出的档案重复,所以实际获得的信息量占总信息量的79%。
档案信息是我们档案界既熟识又陌生的概念。如果我们对它进行更深入的理性思考,不但具有理论价值,而且具有实践意义。
标签:文献论文;