图书馆OPAC的FRBR实践及相关思考--RDA标准的启示_元数据论文

图书馆OPAC的FRBR实践及相关思考——来自RDA标准的启示,本文主要内容关键词为:启示论文,图书馆论文,标准论文,FRBR论文,OPAC论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

OPAC(Online Public Access Catalogue,联机公共检索目录)是图书馆最早建设的数字资源之一,其本身也是图书馆最基础的数字资源。作为一种揭示与利用馆藏资源最基本、最直接的手段,随着Google时代的到来,因其受到书目结构与显示模式的限制,这种曾经最为读者熟悉、最常用的检索工具逐渐受到人们的质疑和冷落。

FRBR(Functional Requirements for Bibliographic Records,书目记录的功能需求)的出现,为图书馆新一代OPAC的诞生创造了条件,使基于FRBR模型的OPAC检索系统在功能、结构和服务方面产生质的飞跃,从而更加便捷、高效地满足了用户的需求。近年来,国内外同行就FRBR对OPAC可能产生的影响,纷纷发表见解,一些书目情报机构也开始尝试并实施了基于FRBR的OPAC应用,效果显著。但由于FRBR仅是一个抽象的概念模型,不利于具体的操作,使得OPAC的FRBR化进程受到阻碍。

RDA(Resource Description and Access,资源描述与检索)是替代AACR2的新规则,它在很大程度上继承了AACR2,同时又汲取了当今信息组织领域最先进的思想,极大地丰富和发展了AACR2,成为数字时代的编目规则。RDA组织文献资源的理念更新,涉及的内容和范围更宽,它承载了图书馆人整序资源、传递信息以及获取知识的理想。作为一部充分体现FRBR概念和结构的新的内容标准,它的诞生不仅会对书目记录的结构和关系产生深远的影响,也将为OPAC的革命性变革提供有力的支持。

1 图书馆OPAC的FRBR实践

1.1 FRBR结构显示的必要性

图书馆OPAC经历了近40年的发展,在其功能、结构和书目情报服务方面都取得了较大的发展。但目前多数图书馆OPAC是根据与用户检索词的匹配程度来显示检索结果,结果集往往是对单独书目的罗列,对书目关系的揭示明显不足,很难了解同一作品有多少种版本或载体形式。这种情况在高产作家作品以及文学名著、音乐作品、宗教文献中表现的尤为突出,给用户获取文献带来了极大的不便。

FRBR以作品、内容表达、载体表现逐层聚集书目的理念表明,图书馆目录已不再是简单罗列文献及其复本或其他版本的清单,而是由作品、内容表达、载体表现、单册和属性、书目关系构成的一组实体信息的情报网络。其核心就是将文献形态进行分面分类,分解成不同的层次,从而建立一种能够准确描述数字环境下文献多种形态的有效方法。FRBR的这种模式是革命性的,它打破了传统书目记录概念的单一性和平面性,使业已形成的情报网络可以揭示出同一作品的不同实体之间的关系以及不同作品的实体之间的关系[1]。

由此,我们设想,基于FRBR模型的OPAC可以以作品为聚合点,进而提供作品的不同版本和译本,以树状结构进行区分,按作品进行集中和浏览,并关联相关作品与主题,从而对资源及其关系进行清晰的揭示。在基于FRBR模型的OPAC系统检索书目时,用户不仅能查询到特定检索条件下所需的资源,还能查询到馆藏中显示出的其他有关的版本及有关某一著者、某一主题或某一种载体的所有资源。因为,FRBR的每一个著录实体都是基于作品内容的相互关联。如印第安纳大学FRBR试验项目“Scherzo”,在目录中用检索词“Franz,Liszt”查询,在众多的检索结果中,通过FRBR的几组实体的内在属性进行组织并提供导航链接,从而使用户执行一次检索就可以获取所有相关资源,这些资源按照作品聚合的形式呈现,便于用户能在海量数据中识别和选择资源。如图1、图2所示。

图1 基于FRBR相关实体属性组织的检索结果

1.2 FRBR结构的显示途径

FRBR化的OPAC显示,因能较好地弥补传统OPAC的缺陷而成为信息组织领域的研究热点之一。目前,国外一些FRBR化或类似FRBR结构的OPAC系统已开发成功并提供信息服务。总体看,OPAC实现FRBR化的途径包括前组聚类方式(pre-coordinated clustering)和后组聚类方式(post-coordinated clustering)。前组聚类方式需要在内容表达层编制书目数据,在文献编目的实际操作中难度较大,成本也较高。因此,图书馆的编目机构普遍认同后组聚类方式。

后组聚类方式要求编目员编制较低层次(即载体表现层)的MARC记录,系统管理员利用转换程序按MARC字段自动抽取有关文献内容的共性部分,并生成作品和内容表达层记录。再进一步讲,就是系统运用特定的运算法则,按照FRBR第1组实体的4个层次,对其中的书目内容,按作品——内容表达——载体表现三个层次或简化的作品——内容表达两个层次进行了区分和层次关系构建。其中,运算法则是FRBR实现分层组织的核心,目前国外开发的运算法则中,“FRBR显示工具”(FRBR Dis-play Tool)和“FRBR作品聚焦算法”(FRBR Work-Set Algorithm)具有相当的代表性。

“FRBR显示工具”由美国国会图书馆网络发展办公室和MARC标准办公室联合发布。该工具由XSLT语言编写,具体操作流程就是运用运算法则,把原有的MARC记录聚集成作品、内容表达、载体表现三个层次。

图2 基于FRBR“个人”实体属性组织的检索结果

(1)作品层以“责任者”和“题名”为匹配条件

(2)内容表达层以“记录类型”和“语种”为匹配条件。MARC21提取规则为头标/06字符位(记录类型)和008字段/35-37字符位(语种代码)。

(3)载体表现层的显示。在载体表现层,匹配条件无需另外分配,只需将内容表达层聚集的书目记录按008字段中的第07-10字符位的出版时间进行排序,并按照以下元素进行显示。

“FRBR作品聚焦算法”与上述算法则有所不同,它引入了LC的规范文档,利用LC名称规范建立“责任者/题名”规范信息,再抽取书目记录中的“责任者”和“责任者/题名”与规范信息进行匹配后,建立作品集信息标识。[3]

综上可知,目前OPAC实现FRBR化的基本原理都是将书目记录和规范记录中的相关记录以“FRBR树结构”形式反馈给用户,因此,高质量的书目数据和规范数据正是真正实现FRBR化的前提。众所周知,书目质量控制是图书馆编目工作的灵魂,其内容范围涵盖编目规则的制定与应用、书目文献的查证与补正、复本控制、相关书目关系的建立以及规范控制,尤其后两者在OPAC的FRBR化显示中的作用十分重要,其带来的互动关系也相当微妙。只有认识和领会RDA的思想与方法,才能建设高质量的书目数据库和规范数据库,进而有效地构建基于FRBR模型的OPAC检索系统。

2 认识RDA

如前所述,FRBR仅是一个概念模型,它对文献信息的转录、信息源、著录语言、大小写、缩写等均无任何规定。如此,我们做个比喻,FRBR就好比一个“球”,究竟是足球、排球还是篮球,球场的大小,球员的人数以及球赛规则都无从知晓。而RDA所做的正是制定规则,按照FRBR的实体、属性和关系做出一系列的指南和说明,从而有效地支持了FRBR的用户任务(发现、识别、选择和获取)以及FRAD的用户任务(发现、识别、情景化和论证)。RDA继承了AACR2的优点,除能与AACR2记录兼容外,还能兼容如MARC21、UNIMARC、XML、MODS、MARCXML及DC、EAD、VRA、MPEG7、ONIX等多种标准数据格式,足以加强和改进书目描述和资源间的相互关系。[4]RDA增加的最核心的内容就是“书目关系”和“规范控制”,这既是对FRBR模型的具体运用,同时也为OPAC实现进一步的FRBR化提供了充分的条件。

2.1 强化书目关系是核心

RDA的结构分为两大部分外加附录。第一部分覆盖第1-16章,包括载体表现和单件的属性,作品和内容表达的属性,个人、家族和团体的属性,概念、实物、事件和地点的属性等四小部分;第二部分覆盖第17-37章,包括主要关系(检索点选取的一般原则),与资源相关的个人、家族和团体之间的关系,作品的主题关系,作品、内容表达、载体表现和单件之间的关系,个人、家族和团体之间的关系,概念、对象、事件和地点之间的关系等六小部分。上述各种关系均体现了FRBR、FRAD中表达的关系。RDA附录I-L中则描述了书目记录与规范记录中实体间的关系类型,如表2。

说明:

2.2 充实规范控制规则

规范控制是手段,借此某种特定实体的多个款目被汇集在一个单一、统一的标目形式下,检索将从多种变异形式指向规范形式,实体间的各种关系将被表达。一旦我们提供对书目资源的规范控制,读者便能更容易、更精确地检索到所需要的资源。

FRAD《规范记录的功能需求》是RDA中检索点和名称规范的理论基础。RDA中描述的数据元素反映了FRAD中定义的个人、家族、团体、地点等实体的属性,还反映了名称、标识符、受控检索点和规则等实体的属性。另外,RDA还涵盖了FRBR中不具备而FRAD中所定义的作品的一些属性。

RDA细化了规范记录元素的属性,增加了家族属性。以个人名称规范为例,FRAD模型中定义的“个人”实体之属性包括生卒年、称谓、其他名称、性别、出生地、死亡地、居住地、所属单位、传记/历史等。个人名称的相关参照关系包括笔名、归属、合作、兄弟、父母/儿女关系,个人与团体、个人与家族的成员关系,以及与个人有关的单纯参照关系,如实名、笔名、俗名、教名、职务名称、旧名称、新名称、交替语言形式、其他变异名称关系等。通过在规范记录里将这些复杂的关系进行细化,并通过符号的形式表达清楚,无疑有利于提高信息资源查全率和准确率。

RDA规则充实了书目规范控制的内容,对规范记录的创建作出了必要的指导,这是AACR2所不具备的。它指导编目员判断何时文献题名为新作品或内容表达,如何在作品或内容表达层面创建标目,如何提供作品、内容表达、个人、家族、团体的选用检索点及其变异形式。RDA还沿用了AACR2关于统一题名的功能,它指出,代表作品和内容表达的首选检索点(统一题名)可以用于各种目的,并为下列目的提供了实现方法:(1)当作品的各种内容表达或载体表现以不同的题名出现时,应著录统一题名汇集和反映体现作品的所有资源;(2)知名作品的题名不同于所著录资源的正题名时,统一题名可用于识别该作品;(3)区分以相同正题名发行的两部或多部作品;(4)当资源体现作品的各种内容表达时,可为资源组织有层次的显示;(5)为相关作品(RDA第25章)或相关内容表达(RDA第26章)命名。

值得一提的是,MARC21也为适应RDA在规范记录中的应用新增了以下字段:046/特殊编码日期、336/内容类型、370/相关地点、371/地址、372/活动领域、373/关系、374/职业、375/性别、376/家族信息、377/相关语言字段、380/作品形式、381/作品、内容表达的区分字符、382/表演媒介、383/音乐作品的数字标识等。当然,RDA还正在开发主题关系,必将为主题规范控制的实现提供有效的指南。

2.3 文献类型标识的新表达

RDA是一种为数字环境设计的资源描述与检索新标准,它在设计上利用了新的数据库技术,在数据获取、存储、检索和显示方面具有有效性和灵活性。一般资料标识的变化是本次RDA修订的亮点之一,它为解决多文献类型、多元化、动态的资源描述提供了崭新的方法,解决了文献类型多元化与线性描述之间的矛盾。

RDA引入了一种全新的方法,从技术和内容方面对资源进行了分类,它采用三元素替换了一般资料标识(GMDs),三元素分别为内容类型、媒介类型和载体类型,它们是用户发现资源、限定检索的重要切入点。

例1:印刷型图书

在图书馆OPAC的显示中,RDA中新的资料标识元素比AACR2中的GMDs更具灵活性:界面显示可采用按钮、图标等更直观的方式来表现资源的一个或多个类型;MARC字段可以从公共显示中屏蔽;336-338字段中的信息可用于资料类型的限定检索[6]。

3 RDA对图书馆OPAC构建的启示与思考

RDA是具体化的FRBR,作为一种全新的资源组织标准,由RDA指导创建的书目记录,注重了各个实体之间关系的客观揭示,注重了书目规范控制的实施,每一个著录实体都基于作品内容的相互关联,形成了一张覆盖各种相关作品的网络,为文献资源编目、OPAC的检索服务以及数据显示带来诸多启示。

3.1 继续探索文献层次的划分问题

FRBR本身是一个概念模型或参考模型,而不是数据模型,它在实践中还有不明确、不完美之处,它为每个实体所定义的属性在多数情况下都过于一般化,它既没有表明如何架构数据单元,亦没有说明如何显示数据单元。于是,在文献层次划分方面,FRBR的操作性能还具有一定的局限。而RDA在文献的层次划分方面做了大量的工作,采用大量的样例进行说明,力图使FRBR中的抽象概念明确化。

3.2 强化书目关系的建立

实现FRBR结构的OPAC显示,书目关系的建立至关重要,它必应遵循如下的原则:

(1)易识别性。书目记录应该能够识别目录中编目实体和其他实体之间的关系。

(2)方便连接。书目记录的数据元素应方便连接,书目记录应提供足够的信息识别关系和建立连接。

(3)用户至上。建立书目记录应时时考虑到:①少数常用的关键项目就可满足多数读者的检索需求;②多数读者将目录作为检索工具,习惯上会首先用题名、著者检索;③读者希望目录中增加关于文献内容的说明,以帮助区分和选择图书;④读者喜欢简略型目录;⑤读者用主题检索时,通常不是太多就是太少;⑥读者与检索系统采用的检索词很难相符;书目数据编制应符合用户方便使用原则。

(4)多层描述。编目规则应提供一个实体不同层次的独立描述,包括抽象的作品、载体表现和特定单册,这些层属间的描述应彼此连接。

(5)一致性。书目关系的识别和连接应本着一致性原则,打破文献载体的界限,即不同文献类型的处理采用相同的方式,包括应用中的一致性和使用统一题名[7]。

3.3 加强书目规范控制的实施

规范控制的核心是书目控制,其目标是实现目录系统中的精确查找和同类实体的汇集,达到准确查找目录中某一特定文献、同一著作的所有版本、特定责任者的全部著作、特定主题的全部资源等目的。为达此目的,必须通过建立规范形式的名称、主题和题名来实现,通过单纯参照、参见参照或连接款目的形式连接。名称可汇集相同责任者的不同作品,题名可汇集相同文献的不同题名、相同文献的不同语言版本、相同文献的不同载体版本、相同文献的不同印次等。规范控制的应用,实际是在目录中构建了书目实体之间隐含的书目关系,即通过名称、题名和主题汇集、区分作品,并在作品间建立导航。

3.4 持续的实践投入

实践应用表明(如OCLC支持的“FRBRisation'”实验项目),依据当前编目规则所编制的书目记录,还不能完全满足不同层级数据间的匹配,书目记录中还需要著录大量的通用性元素,这仍有待于我们进一步的实践与拓展[8]。

3.5 提高用户检索的全面性

关系标识的广泛使用和规范控制的加强,不仅能够有效划分作品、内容表达、载体表现和单件的层次,还能细化实体间的关系,提高用户检索的准确性。用户检索的关注点是作品及其内容表达,而传统书目记录都是针对“载体表现”进行的,在这种情况下,同一个作品可能有多条记录,例如小说、录音带和唱片等,而传统的编目规则又不能系统揭示这些记录之间的关系,因此很难满足用户对检索全面性的要求。RDA转向以作品为基础来创建书目记录,使相关记录以“作品”为核心聚合在一起,执行一次检索就可以获取所有相关资源,提高了检全率,同时也为数据库节省空间,提高检索效率。

3.6 增强图书馆OPAC的导航功能

RDA通过揭示实体关系的内在、外在联系,有利于增强OPAC的导航功能。从编目效率看,在相对开放的网络环境下,使OPAC向WebPAC转化,对纷繁复杂的信息进行迅速揭示和有效组织变得更加困难,由此,提高编目效率就成了实现转化的关键。FRBR使书目信息可以被同一作品的不同载体表现直接利用,这将在很大程度上节省编目开支,提高编目效率和质量。从查询方式看,将图书馆的OPAC纳入搜索引擎的检索范围,如Google中的图书搜索,既可扩大用户的检索范围也可以提高图书馆的利用率。图书馆中的OPAC系统和Web上的搜索引擎是两种查询方式,这对于只进行一次搜索的用户来说不太方便,所以,增强图书馆资源在网络中的可见度成为OPAC的革新方向。而基于FRBR的这种方式刚好为这种革新提供了便利,用户可以按照关键词进行检索,结果则可以按照FRBR中的作品内容和相关度进行排序,并附加提供馆藏地址信息。而除了MARC21,它还可以与MODS、Dublin Core、ONIX等格式兼容,有利于OPAC向WebPAC方向发展。

3.7 加强对多载体、多种类型的文献资源的整合

任何一所图书馆资源的来源都可能包括自建、外购、缴送、网络采集等多种渠道,因此,资源类型复杂多样、元数据格式亦复杂多样是多数图书馆的现状。为保证元数据在组织、管理与检索中的质量,必须建立元数据组织结构模型,以统一的机制管理图书馆元数据。组织模型需要重点解决:(1)确定核心元数据集,用于元数据交换与整合;(2)确定元数据映射规则,用于不同元数据间映射;(3)确定元数据唯一标识符,用于元数据管理。同时,在元数据的组织结构中,更要关注元数据的等级关系、元数据之间的关联关系以及元数据的识别机制;在数字环境下,还要特别注重元数据与对象数据的关系,探索通过元数据连接与揭示、对象数据唯一标识与元数据唯一标识建立关联、同一内容不同载体的对象数据要有明显的识别信息并有连接关系等。

3.8 一站式检索界面

一站式检索界面需要从以下几点入手设计:(1)文献类型及语种多样化。除了被大家重点整合的数据库、电子期刊外,还应增加电子图书的整合,特别加强不同语种资源的分类,使读者可按需要获得中外文文献资源。(2)要求用户入口统一化。一次登陆即可按需要有目的的浏览不同主题、不同类型的文献。(3)要求检索界面一体化。读者在同一个检索界面上,可以检索馆藏资源,如印刷型文献、非书资料、电子期刊、电子图书和中外文数据库等,若读者没有特别指定文献类型时,则会根据主题同时提供满足要求的数据库、期刊和图书,并可直接浏览。(4)要求显示信息丰富化。不同类型文献的揭示程度与显示内容应有所区别。如普通图书只需显示著者、题名等基本信息,电子资源除基本信息外,更注重URL的显示,而馆藏特色资源、学术资源等则更需要目次、提要等详尽信息。此外,RDA所具有的兼容性与新资料标识元素的应用,可为界面显示丰富的信息提供强大的灵活性。

综上所述,笔者介绍和分析了基于FRBR模型的OPAC检索系统的特点,着重探讨了RDA对图书馆OPAC可能产生的积极影响和变革。作为信息组织者,我们可以预见,RDA势必会对OPAC的改进升级提供强有力的支持。不过,由于RDA目前尚未完全发布,初期的测试阶段也刚刚进行完毕,一些概念还在讨论中,所以,RDA对图书馆OPAC所可能产生的实际作用,还有待进一步的验证。

标签:;  ;  ;  ;  ;  ;  ;  

图书馆OPAC的FRBR实践及相关思考--RDA标准的启示_元数据论文
下载Doc文档

猜你喜欢