从FRBR看编目规程与机读目录格式的改革方向_实体关系图论文

从FRBR看编目条例及机读目录格式的变革路向,本文主要内容关键词为:编目论文,条例论文,格式论文,目录论文,FRBR论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

分类号 G254

世界各国以《巴黎原则》和ISBDs为依据编制的编目条例,均存在一对矛盾,即著录以手头文献的物理形式为依据,而标目则以手头文献所反映的著作为依据[1]。例如全球最著名也最权威的AACR2的第一部分引言说,“著录的起点是手头文献的物理形式,而非著作早先已经出版的原始形式或先前形式”,而其第二部分引言却说,“第二部分中的规则适用于各类著作,而非这些著作的物理表达形式”[2]。AACR2的这一矛盾和痼疾虽然适应了以实体信息资源为主的编目对象,但却不能适应包括网络信息资源在内的文献编目,因此不断受到越来越多学者的抨击和批评[3]。国际图联1998年颁布的《书目记录的功能需求》(Functional Requirements for Bibliographic Records,FRBR)[4],为解决这一矛盾和痼疾提供了理论依据。本文试在对FRBR内容分析的基础上,阐述编目条例及其相关的机读目录格式变革路向。

1 FRBR的编目实体

与《巴黎原则》不同,FRBR此次借鉴开发关系型数据库所常用的“实体—关系模型”(Entity-relationship model,E-R模型),从探讨编目的实体及其属性与关系着手来揭示书目记录的功能需求。众所周知,E-R模型的前身即P.P.S.Chen于1976年提出的实体—关系图(Entity-relationship diagram)[5]。实体—关系图中所用的E-R方法直接列出所有的实体、实体属性以及实体间的联系,并将实体间的联系用一种抽象的命名来表示。因此,E-R方法作为人们认识客观世界的概念框架,具有真实性和抽象性这两大特征,并为准确把握书目记录的功能需求提供了可靠保证。

图1 FRBR中的实体及其关系

(图中单箭头表示两个实体间的关系是惟一的,而双箭头则表示两个实体间的关系不是惟一的。)

在FRBR的第三章中,实体被划分为三组。第一组包括书目记录中所命名或描述的知识产品或艺术产品:著作(Work)、表现方式(Expression)、表达形式(Manifestation)和文献单元(Item);第二组包括对知识或艺术内容、物质产品和传播或保管负有责任的实体:个人(Person)和团体(Corporate body);第三组包括作为知识或艺术主题的附加实体:概念(Concept)、物体(Object)、事件(Event)和地点(Place)。上述三组10个实体的关系用图1来表示。

图1第一组实体(中栏)是一主线,其中的第一个实体——著作,是指独特的知识或艺术创作,著作是一抽象实体,必须通过一定的表现方式才能被人感知。第一组实体中的第二个实体——表现方式,是指知识或艺术创作得以实现的方式,如文字、音乐或舞蹈、声音、图像、物体、动作或上述方式的任何组合。一个表现方式可以有一个或一个以上的表达形式。第一组实体中的第三个实体——表达形式,是指一个著作的一个表现方式的物理体现,包括手稿、图书、期刊、地图、张贴画、音像资料、影片、录像资料、CD-ROM、多媒体资料等。作为一个实体,表达形式代表了具有相同特征的所有物质对象,无论是知识的内容还是物质的形式。同样,一个表达形式也可以有一个或一个以上的表现方式。第一组实体中的第四个实体——文献单元,是指一个表达形式的个别范例,等同于前文中的手头文献,如一本或一套专著、一盘或多盘录音带等。

图1第二组实体(右栏)中的个人和团体实体与第一组四个实体之间存在的关系实为责任关系,即一个著作可由一个或多个个人或团体创作;反之,一个个人或团体也可创作一个或多个著作。一个表现方式可由一个或多个个人或团体来实现;反之,一个个人或团体也可使用多个表现方式。一个表达形式可由一个或多个个人或团体来制作;反之,一个个人或团体也可产生一个或多个表达形式。一个文献单元可由一个或多个个人或团体所拥有;反之,一个个人或团体也可拥有一个或多个文献单元。

图1第三组实体(左栏)中的概念(指客观事物的抽象特征的反映,包括科学知识、学术思潮、理论、技术等)、物体(指物质实体,包括有生命的、无生命的、人工的、自然的)、事件(指活动与事变,如历史事件、历史时期等)和地点(指场所,可以是地球的、外星的、历史的、当代的、自然的、行政的),与第一组实体中的著作间的关系为主题关系,即一个著作可以有一个或多个概念、物体、事件或地点作为自己的主题;反之,一个概念、物体、事件或地点也可以是一个或多个著作的主题。此外,一个著作还可以有一个或多个著作、表现方式、表达形式、文献单元、个人和(或)团体作为自己的主题。

总之,FRBR将E-R模型用于书目记录的功能需求,为我们认清编目的对象提供了一个有效的参照系统:从注重文献的物理形式到注重著作的创作内容。这是变革传统的编目条例和机读目录格式所应探讨的基本问题,也是掌握编目变革路向的重要依据。一旦今后采用FRBR的E-R模型及其思维方式,传统的编目条例和机读目录格式将会发生重大变革,甚至开始动摇100多年建立起来的现代文献编目基石[6]。

2 编目条例的变革路向

如前所述,E-R方法的关键是划分实体和实体属性。在第三章划分了实体后,FRBR的第四章紧接着就是划分各个实体的属性。由于编目对象通常从前述第一组实体中产生,所以下面仅列出著作、表现方式、表达形式和文献单元这四个实体的属性。

表1各类编目实体的属性非等同于但类似于著录项目或著录单元。从中不难看出,传统的编目条例是以文献单元为依据,并假设同一种著作的所有文献单元是相同的,即根据文献单元推知它的表达形式——编目。当著作的表达形式不同时,传统的编目条例便假定编目的对象发生了变化,这是其一。其二,当新的文献载体问世后,人们便根据新载体的特征在编目条例中添加新的章节。这是传统的编目条例以载体划分文献,并以此确定编目对象的基本依据[7]。其实,作为编目条例著录法部分之基础的ISBDs也是如此。例如ISBD(NBM)第一版中原来包含有关机读件(Machine-readable data files)著录的规则,由于机读件特性的迅速变化,ISBD(NBM)第二版已将这类资料的著录规则分出,并由后来的ISBD(CF)描述。又由于ISBD(CF)中的计算机文档只包含本地存取的电子资源,而对汹涌而至的远程存取的电子资源无法描述,所以ISBD(CF)后来又重新修订为ISBD(ER)。

传统的编目条例以文献单元,确切地说以表达形式作为自己的编目对象,它迎合了当时以实体信息资源为主的文献编目,即有什么样的馆藏就编制什么样的款目及目录。随着计算机技术和现代通信技术的发展,一种著作本身要由多种载体承担,而且许多著作本身一开始就以数字的形式出现,即原始数字信息资源。这些信息资源加以数字化后的信息资源没有任何可见的载体(即看得见却摸不着),但却能把各种表达形式的知识或艺术创作的内容融合为一种表现方式。例如原先某一表现方式的音乐作品存在录音带、光盘和唱片三种不同的表达形式,因其物质媒体的不同而在表达形式层次上具有目录学的差异。但在数字化后(如将它们都转换为MP3格式),就其内容而言,物质媒体的差异已显得不重要,而在表现方式层次上,这三种表达形式的作品却完全相同[8]。因此,现代文献编目的对象不能仅停留在文献单元和表达形式层次上,而应提升到表现方式甚至著作的层次上。这样做也与目录使用者的需求相吻合,因为人们获取信息首先考虑的是它的内容,其次才是它的物质媒体,尤其在著作的物质媒体变得越来越模糊的今天。

表1 四种编目实体的属性

著作的属性

表现方式的属性

表达形式的属性

文献单元的属性

著作题名 表现方式的题名

表达形式的题名

文献单元标识符

著作形式 表现方式的形式

责任说明 指纹印

著作日期 表现方式的日期

版次/期次标识文献单元出处

其他识别特征 表现方式的语种

出版地/发行地标记/题词

预期的结果

其他识别特征 出版者/发行者展览历史

预期的受众

表现方式的扩展

出版日期/发行日期文献单元状况

著作的背景

表现方式的修订

制造者/制作者处置历史

表演媒介(音乐著作) 表现方式的长度

丛编说明 处置日期

数字标识(音乐著作) 内容提要 载体形态 文献单元的存取限制

调名(音乐著作) 表现方式的背景

载体篇幅

坐标(绘图著作) 对表现方式评论的反馈 物质媒体

二分点(绘图著作)

表现方式的使用限制

捕获方式

排序模式(连续出版物)

载体尺寸

预计固定的期次(连续出版物) 表达形式标识符

预计出版周期(连续出版物)

采访源/存取授权

乐谱类型(乐谱符号) 获得方式

表演媒介(乐谱符号或声音)表达形式的存取限制

比例尺(测绘图像/物体) 字样(印刷本)

投影(测绘图像/物体)字号(印刷本)

呈现技术(测绘图像/物体)编张数号(手印本)

地势描述(测绘图像/物体)页数、插图等说明(手印本)

测地线、地图的坐标方格和垂直 出版物状况(连续出版物)

测量法(测绘图像/物体) 编号(连续出版物)

记录技术(遥感影像) 播放速度(录音资料)

特殊特征(遥感影像) 纹(道)宽度(录音资料)

技术(图画或放映图像)

刻录种类(录音资料)

磁带构造(录音资料)

声音种类(录音资料)

特殊复制品的特性(录音资料)

颜色(图像)

缩小比例(缩微品)

极性(缩微品或视觉放映)

产品代次(缩微品或视觉放映)

展现形式(视觉放映)

系统需求(电子资源)

文档特征(电子资源)

存取模式(电子资源远程存取)

存取地址(电子资源远程存取)

制订以表现方式以及著作实体为编目对象的编目条例,能够解决本文开头提出的一对矛盾。但困难在于:(1)广大编目员已习惯以文献单元和表达形式为编目对象;(2)需要相应的国家或国际标准作基础;(3)如何与以文献单元和表达形式为编目对象的编目条例兼容?好在FRBR已清楚地列出表现方式和著作这两个编目实体的各自属性,国外如美国图书馆协会编目委员会也曾建议采用基于表现方式的记录(Expression-based records)来修改AACR2。

3 机读目录格式的变革路向

机读目录格式与编目条例的关系紧密。据国际图联UBCIM计划(即由UBC和IMP两项计划合并的Universal Bibliographic Control and International MARC)的调查,20世纪90年代中期,在全球60个国家的国家图书馆采用的机读目录格式中,有近半数采用的是基于USMARC的格式,另有1/4采用的是基于UNIMARC的格式(含我国使用的CNMARC格式,下同)。这两种机读目录格式的共同之处是将格式本身只划分成记录和字段两个层次,所不同的是其字段标识符、字段指示符和子字段标识符定义各异。

E-R方法直接列出所有的实体、实体属体以及实体间的联系,并将实体间的联系用一种抽象的命名来表示。FRBR也是如此,在其第三和第四章列出所有实体和实体属性后,其第五章开始论述各实体间的关系。在其5.2.1节中,我们发现前述著作、表现方式、表达形式和文献单元间均都存在一种内在的“亲族”关系(An implicit "sibling" relationship)。著作、表现方式、表达形式和文献单元间的这种内在亲族关系,若用前述两层结构的USMARC或UNIMARC格式来反映确实比较困难,尽管这两种机读目录格式各有自己的连接字段。其实,在20世纪60年代出现USMARC,70年代出现UNIMARC,80年代联合国教科文组织和国际图联还共同推出过一种CCF(Common Communication Format)格式,我国全国情报文献工作标准化技术委员会在1991年也已制订了CCFC(Common Communication Format of China)格式[9],90年代还作为GB/T2901-92国家标准的附录颁布(即GB/T2901-92推荐执行格式)[10]。

CCF和CCFC格式与前述USMARC和UNIMARC格式不同。前者的设计者从一开始就以实体和实体关系为指导原则,并把客观世界的存在以实体形式划分。据此,CCF和CCFC将记录的格式不是划分成两层而是划分成三层,即在USMARC和UNIMARC格式都有的记录和字段之间划分出一个中间层次——区段(Segment)。区段是记录的下级单位,一个记录中仅有一个区段的情况是最简单的情况,但若想用一条记录来描述若干个文献,那就必须在记录中设置若干个区段,而这些不同文献间存在的关系就将影射为区段之间的关系。例如图2。

图2 文献及其关系

(图中S表示连续出版物,M表示专著,A表示分析级单篇作品。)

图2举例若用一条CCF和CCFC记录表达,则在该记录中就必须要设置10个区段(见图3)。

图3 区段及其关系

CCF和CCFC记录中的基本区段(Primary segment)所记录的文献为目标文献(一条记录中允许存在一个基本区段),次级区段(Secondary segment)所记录的文献为相关文献(一条记录中允许存在一个及其以上的次级区段),每一区段对应于结点上的文献,而不论该文献是属于哪个书目级别的。同理,若将图2改为图4形式,那么使用CCF和CCFC格式的区段同样可使FRBR中的实体分隔问题得到合理解决,即以实体方式将客观世界进行科学映象,又以特定的关系内容将同类或不同类实体进行连接。这种借用不仅可从目次上清楚地知道记录中描述了几个编目实体、每个编目实体都记录了哪些内容,又可反映这些编目实体间的关系。CCF和CCFC的这种设计思想完全符合当代数据库的设计思想,特别适合网络型及关系型数据库。此外,CCF和CCFC格式尽管比USMARC和UNIMARC格式多一区段概念,但其记录中也依然只有一个头标区和一个目次区,因此完全符合GB2901和ISO2709的有关规定。CCF和CCFC格式不同于USMARC和UNIMARC格式的一个重要之处,是它的目次项长度要定义为14个字符而不是像USMARC和UNIMARC格式那样定义为12个字符,多出的两个字符一个用于反映区段标识(Segment identifier),一个用于反映字段第次号(Occurrence identifier)。当然,目前在我国用CCF或CCFC格式替代CNMARC格式还存在一定困难:一是因为在我国CNMARC格式已占主导地位,人的观念尤其是编目员的观念一下子难以转变;二是借用CCF和CCFC格式来反映FRBR中的各个编目实体及其属性需要重新定义CCF和CCFC格式中的各个字段。但是,借用或采用CCF或CCFC格式来反映FRBR中的编目实体、实体属性及其关系要大大优于USMARC和UNIMARC格式,这是一个不争的事实,至少可以为变革机读目录格式提供一种借鉴。

图4 实体及其关系

(图中W表示著作,E表示表现方式,M表示表达形式,I表示文献单元。)

4 结束语

FRBR中第三至五章中提出的实体、实体属性及其关系模型完全符合并满足其第二和第六章中提出的当代目录用户的任务,即(1)发现实体:按实体的属性或关系从文档或数据库中检索到一个或一组实体;(2)识别实体:确认找到的实体正是所要查寻的实体,或从两个或两个以上类似特征的实体中区分出所需的实体;(3)选择实体:根据内容、物理格式等选取符合用户需求的实体,或舍取不符合用户需求的实体;(4)获取实体:通过购买、借阅等途径获得实体,或通过联机方式存取远程计算机上的实体。此外,FRBR的第二个研究目的是为国家书目机构创建记录推荐一个基本功能标准,所以其第七章在论述了功能的基本标准和数据的基本要求后,还提出了国家书目记录的基本标准。因此有理由相信它会像《巴黎原则》后出现一批著名的编目条例和机读目录格式一样,随着各国对FRBR研究的深入,也会出现一批符合当今文献编目工作的编目条例和机读目录格式。

标签:;  ;  

从FRBR看编目规程与机读目录格式的改革方向_实体关系图论文
下载Doc文档

猜你喜欢