“中文分类词表”综合索引的实验分析与评价_主题词论文

“中文分类词表”综合索引的实验分析与评价_主题词论文

《中国分类主题词表》一体化标引实验分析及其评价,本文主要内容关键词为:词表论文,中国论文,评价论文,主题论文,一体化论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

〔摘要〕 《中国分类主题词表》是《中图法》与《汉语主题词表》相互兼容互换的检索工具。本文从一体化标引试验入手,对《中国分类主题词表》进行了分析、评价,并提出了改进意见。

〔关键词〕 中国分类主题词表 一体化标引 评价

《中国分类主题词表》是在《中国图书馆图书分类法》第3版(含《中国图书资料分类法》第3版)和《汉语主题词表》基础上编制的分类法——叙词表对照索引式的一体化检索语言。它融《中国图书馆图书分类法》、《中国图书资料分类法》、《汉语主题词表》、《中国图书馆图书分类法索引》为一体,是我国使用最广泛的分类语言与主题语言相互兼容互换的检索工具。《中国分类主题词表》的主要职能就在于,经一次主题分析,通过标引数据的转换,同时完成分类标引和主题标引,该表面世以后,其一体化标引的功能究竟如何呢?为了检验《中国分类主题词表》一体化标引的功能,笔者就《中国分类主题词表》一体化标引进行了试验,现将试验结果简要分析、评价如下:

1 一体化标引试验方法

采用《中国分类主题词表》进行一体化标引,既可从分类标引入手,也可以从主题标引入手。因而,我们把试验方法分为两个方面:一方面是分类标引入手的一体化标引试验;另一方面是主题标引入手的一体化标引试验,具体步骤如下:

(1) 从分类目录社会科学A至K每一类目中,随机抽样出100篇文献,共计1100篇文献,作为一体化标引试验的对象。

(2) 将这1100篇文献,用《汉语主题词表》进行主题标引,得到每篇文献相应的主题词和主题词串。

(3) 依据每篇文献的分类号,查《中国分类主题词表》“分类号——主题词对应表”,将分类号转换为与文献相应的主题词和主题词串。

(4) 将用《汉语主题词表》标引得到的主题词和主题词串,与用“分类号——主题词表”转换得到的主题词和主题词串进行对比、分析,检验从分类标引入手的一体化标引的一致性。

(5) 依据用《汉语主题词表》标引所得到的主题词和主题词串,查《中国分类主题词表》“主题词——分类号对应表”,将主题词和主题词串,转换为相应的分类号。

(6) 将原分类号与用“主题词——分类号对应表”转换得到的分类号进行对比、分析,检验从主题标引入手的一体化标引的准确性。

2 一体化标引的试验结果

通过一体化标引试验结果的对比、分析,我们把检验从分类标引入手的一体化标引的一致性程度,即用《汉语主题词表》标引得到的主题词和主题词串,与用“分类号——主题词对应表”转换得到的主题词和主题词串的一致性程度,分为5种类型,这5种类型是完全符合、基本符合、部分符合、大致符合和不符合。

(1) 完全符合是指用《汉语主题词表》标引的主题词和主题词组配形式,与用“分类号——主题词对应表”转换的主题词和主题词组配形式完全一致。

(2) 基本符合是指用《汉语主题词表》标引的主题词组配形式,与用“分类号——主题词对应表”转换的主题词组配形式,其表达主体因素的叙词相一致,其他因素有个别不相同。

(3) 部分符合是指用《汉语主题词表》标引的主题词组配形式,与用“分类号——主题词对应表”转换的主题词组配形式,其表达主体因素的叙词有部分相同,有部分不相同。

(4) 大致符合是指用《汉语主题词表》标引的主题词组配形式,与用“分类号——主题词对应表”转换的主题词组配形式,其组配叙词完全不同,但表达的含义相近或基本相同。

(5) 不符合是指用《汉语主题词》标引的主题词和主题词组配形式,与用“分类号——主题词对应表”转换的主题词和主题词组配形式,表达的含义完全不相同。

这样分析的结果是:完全符合的有635篇,占总数的58%;基本符合的有107篇,占总数的10%;部分符合的有233篇,占总数21%;大致符合的有36篇,占总数的3%;不符合的有89篇,占总数的8%。将其按类进行统计,其结果如表1。

表1

完全符合基本符合部分符合大致符合

不符合

数量及数量及数量及 数量及 数量及

百分比百分比百分比 百分比 百分比

A 71 28 1

0 0

B 73 1213

2 0

C 62 1218

2 6

D 50 623

6 15

E 40 631

4 19

F 55 337

0 5

G 51 631

4 8

H 53 430

3 10

I 76 15 7

2 0

J 46 728 10 9

K 58 814

3 17

同样,我们把检验从主题标引入手的一体化标引的准确程度,即原分类号(用《中图法》直接标引的类号)与用“主题词——分类号对应表”转换得到的分类号的准确程度,分为3种类型,这3种类型是完全相符、基本相符、不相符。

(1) 完全相符是指用“主题词——分类号对应表”转换的分类号,与原分类号完全一致。

(2) 基本相符是指用“主题词——分类号对应表”转换的分类号,与原分类号基本一致,只是在类目细分程度上有一点差别。

(3) 不相符是指用“主题词——分类号对应表”所转换的分类号,与原分类号完全不同。

这样分析的结果是:完全相符的有529篇,占总数的48%;基本相符的有419篇,占总数的38%;不相符的有152篇,占总数的14%。如按类进行统计,结果如表2。

表2

类 完全相符基本相符 不相符

目 数量及百分比数量及百分比 数量及百分比

A 2856

16

B 75187

C 5828

14

D 4535

20

E 3352

15

F 4246

12

G 4044

16

H 4834

18

I 73234

J 3746

17

K 5037

13

3 《中国分类主题词表》一体化标引的评价

通过一体化标引试验结果的分析,可以看出《中国分类主题词表》是一部实用性很强、一体化标引准确性较高的分类主题词表,它具有以下优势和特点:

(1) 《中国分类主题词表》是一部适应性很强的一体化词表,无论是从分类标引入手,还是从主题标引入手,均具有较好的一体化标引功能。从试验结果看,分类标引入手的大致符合以上的占了总数的92%,不符合的只占了总数的8%;主题标引入手的完全相符和基本相符的就占了86%,不相符的只有14%。这说明《中国分类主题词表》完全可以满足普通图书的一体化标引的需要,并且,从分类标引入手的一体化标引效果佳于从主体标引入手的一体化标引效果。

(2) 《中国分类主题词表》能为分类标引向主题标引转换提供准确的组配模式,降低了一体化标引的难度,减轻了劳动强度,提高了主题标引的准确性,达到事半功倍的目的。在实验中笔者把从分类标引入手,达到完全符合一体化标引要求的635篇文献进行分析,发现这635篇文献,72%是在标引类号之后,从“分类号——主题词对应表”的右栏对应的主题词和主题词串中,就能直接获得主题标引的主题词或主题词串;另28%只需将对应的组配模式,转换个别主题词就能达到一体化标引的要求。这说明使用“分类号——主题词对应表”,从分类标引入手的一体化标引,42%的文献就能直接获得分类号和主题词或主题词串,仅从这一点看就在很大程度上降低了一体化标引劳动强度。

(3) 《中国分类主题词表》从学科体系的角度全面展示了本学科的主题词,为主题标引提供了按学科体系进行选词的途径,因而便于主题标引时选用较为专指的主题词,提高了选词的专指性和标引的准确性。由于我国比较习惯于分类检索,因而按学科体系检索主题词更为适应于标引人员,相比之下,它能够提高选词的专指性。如《文字改革简易手册》,分类标引为H125,相对应的主题标引为“汉字改革——手册”,较好地引导标引人员选用了“汉字改革”这一专指词,避免了标引中易产生的“文字改革——手册”的错误。

(4) 《中国分类主题词表》能对综合性、总论性主题文献的归类起着指导标引的作用。由于《中国分类主题词表》将每一单个主题词都视为独立的、综合性的、总论性文献,按照分类标引规则,都给了相应的分类号,因而标引人员只需查阅“主题词——分类号对应表”就能较好地对综合性、总论性主题文献进行分类标引。如综合论述“水”的文献,通过查“主题词——分类号对应表”就可归入P548.41类。

总的来说,《中国分类主题词表》是分类主题合璧、相得益彰,它发挥了《中国图书馆图书分类法》、《汉语主题词表》最佳综合效益,成功地创造了编制大型综合性一体化词表的经验,并为专业一体化词表的编制奠定了基础。

4 影响《中国分类主题词表》一体化标引质量因素分析

《中国分类主题词表》在一体化标引方面具有较高准确性和较强的适应性,但它也存在很多不足的方面,对从分类标引入手的一体化标引实验不符合的文献进行分析,有以下几个方面的原因影响了《中国分类主题词表》一体化标引的质量:

(1) 分类体系类目设置较粗,造成从分类标引入手的一体化标引组配专指程度差或上位词标引的错误。在《中国分类主题词表》中由于类目设置较粗,因而对应的主题词和主题词串都比较概括,而当文献阐述的内容较细时,分类标引只能归入其上位类,转换的主题词或主题词串则缺乏专指性。如《独生子女教育法》,分类标引归入G78家庭教育,转换的主题标引为“家庭教育”,而正确的主题标引应为“独生子女——家庭教育”。

(2)分类法划分体系与文献所阐述的角度不一致,造成标引转换的不相符合。由于《中国分类主题词表》是在体系分类法《中国图书馆图书分类法》的基础上编制的,类目展开采用的是层层划分,层层累积,因而对于某些与其体系结构不相适应的文献,只能采用靠类标引或归入其上位类的方法来处理,这类标引在一体化标引转换时,必然造成转换结果不相符合。如《当代世界经济发展规律探索》,分类标引只能归入F11,转换的主题标引则为“经济——世界”,实际正确的主题标引应为“经济发展——经济规律——世界——现代”。

(3) 分类体系中人为形式划分的类目,在一体化标引中,由分类标引向主题标引转换准确性程度较差。《中国分类主题词表》“分类号——主题词对应表”中的一些形式划分类目,如依人列类、依对象列类等类目,由于对应时采用的是纯形式的主题对应,因而很多文献都难以通过分类标引达到向主题标引的转换。如《理想与人生》,分类标引归入D432.62青年思想教育类,对应转换的主题词串为“青年工作——思想政治教育——中国”,实际正确的主题标引应为“人生观——青年读物”。

(4) 应用类目、与其他学科关系类目、总论性类目、“其他”类目,难以实现从分类标引向主题标引的正确转换。由于这些类目收录的文献比较庞杂,而类目的对应也只能是纯类目形式的对应,从而无法满足各种文献的一体化标引。如《家庭心理漫谈》分类标引归入G913.1,对应转换的主题词为“家庭”,正确的标引为“家庭——社会心理学——普及读物”。

总的来说,《中国分类主题词表》属于对照索引式的一体化词表,因而它必然受到《中图法》体系结构和《汉语主题词表》选词专指度的限制,以及两者之间的兼容程度也受到这两种表的主题内容的重合程度、词汇的专指程度、先组程度和对词形、词义、词间关系控制的影响,所以,它不可能完全满足文献复杂性一体化标引的所有需求。

5 提高《中国分类主题词表》一体化标引质量的几点意见

《中国分类主题词表》在编制技术和编制方法、标引技术和标引方法等方面,还可以不断完善,使其一体化标引的质量进一步得到提高。

(1) 增加类目的细分程度及多重列类,使分类体系更适合于文献的主题内容。转换的主题标引也更为准确。由于类目较粗或划分的标准与文献不相适应,所以对于一些文献的标引只能采取上位类标引和靠类标引,用这种标引方法转换的主题标引,必然与文献的主题内容不相适应,同样,这类文献由主题标引向分类标引转换也不会正确。解决这一问题的方法,可以适当增加类目的细分程度和采用多重列类。考虑到文献保障率和分类体系的庞大等因素,“分类号——主题词对应表”可采用不增加类目,而只在类目下,按一定的划分标准增加主题词的组配形式的方法来处理。也就是在类目不增加的情况下,增加主题词组配形式,以适应文献分类标引向主题标引的转换。

(2) 增强类目外延的对应及其类目注释的对应。目前《中国分类主题词表》主要是对类目本身的对应,这主要表现为内涵的对应和形式的对应,这种对应方法在满足文献复杂性和多样性方面有一定的缺陷,因而要提高一体化标引效果,在有文献保障的前提下,可相应增加类目的外延对应。同样很多类目注释都是对类目含义及类目外延的说明,因而也应加强类目注释的对应。如F270企业经济理论和方法,在有文献保障的情况下,可增加企业管理——现代化”、“企业管理——系统工程”等组配主题词串。

(3) 增加主题词串调整组配方法的注释。采用“分类号——主题词对应表”从分类标引入手进行一体化标引,将会有两种情况:一种情况是从相应类目获得的主题词或主题词串,就适合该文献的主题标引;另一种情况是从相应类目只能获得一个主题词串的组配形式,这就需要进一步选择专指词,对组配形式进行调整和转换组配。因此,《中国分类主题词表》应在类目中适当增加对组配形式进行调整和转换的组配方法,以更好地适应一体化标引的要求。

(4) 制定《中国分类主题词表》标引规则,加强对《中国分类主题词表》标引技巧的研究。《中国分类主题词表》是一种一体化的检索语言,使用一体化语言与使用分类语言和主题语言都有所不同,一体化语言的标引有其自身的规律、方法和法则。因此,有必要制定出《中国分类主题词表》的标引规则,使标引人员能较好的掌握这一方法,提高一体化标引的质量。同时,应当加强《中国分类主题词表》一体化标引技巧的研究,使人们能够很熟练地应用《中国分类主题词表》进行一体化标引。

总之,《中国分类主题词表》在使用过程中,随着《中图法》和《汉语主题词表》的修订完善,也将会得到不断的完善,其一体化标引的功能也会不断增强,它将成为我国一体化标引和检索不可缺少的检索工具。

(收稿日期:1996-04-09)

标签:;  ;  ;  ;  ;  

“中文分类词表”综合索引的实验分析与评价_主题词论文
下载Doc文档

猜你喜欢