叙词表的面转换_聚类论文

叙词表的面转换_聚类论文

叙词表的分面化改造,本文主要内容关键词为:词表论文,分面化论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

1 叙词表分面化改造的实质和好处

分面叙词表与传统叙词表的主要区别在于:分面叙词表有一个相当于传统叙词表的范畴表和词族表功能的分面分类表。在分面分类表中,叙词词间关系的显示比在范畴表和词族表中具有更高度的系统性、明确性和完备性。

叙词表分面化改造的实质就是将范畴表和词族表改成分面分类表。传统叙词表经过分面化改造后,可具有更高的质量和更好的易用性。

2 分面叙词表的三种编制方法

分面叙词表可能有三种编制法:(1 )将分面分类表改造为分面叙词表;(2)新编一部分面叙词表(与(1)基本相同,也是先编制分面分类表部分,分面类目(实即叙词)的设立则同时考虑叙词选词原则);(3)将传统叙词表改造为分面叙词表。

这三种编制方法的差别在于:第一种方法先有分面分类表,词表部分是依据分面分类表编制的,如果分面分类表基础较好,编制工作是比较容易的;第二种方法可同时考虑分面分类表的编制和词表的选词,两个方面的协调最容易;第三种方法是选词过程在前,然后把现有的词编成分面分类表,编制分面分类表(即分面化处理)的工作相对来说就要难一些。

本文以下讨论的,主要是第三种编制方法中的问题。

3 分面叙词表中的分面

所谓“分面”,是指可以表征一类事物或一类事物某一方面属性、问题的一组概念或类目。在分面叙词表中,一个分面大致可与一个词族相对应,但存在着以下问题:

(1)概念成族与字面成族问题。一个严格的分面, 其中所包含的概念必须是具有概念成族关系的。但在传统叙词表中,有时可看到把没有概念成族关系的词编入同一词族。例如,把“车辆检验”、“司法检验”、“卫生检验”组成一个“检验”词族,那就不是概念成族,而是字面成族。分面分类表中不能有字面成族的分面,所以,在分面化处理时,应将这类词族拆散,分别设立分面或将词分别归入有关类的分面。必要时,可将被拆散的原词族,作成参照形式,如:

检验(字面成族词族)见

车辆检验(概念成族词族)

司法检验(概念成族词族)

卫生检验(概念成族词族)

(2)永久聚类与随需聚类问题。在概念成族分面中, 可以分为永久聚类分面和随需聚类分面。例如,“档案检索语言”与“情报检索语言”聚类是永久聚类,与“档案标引”聚类是随需聚类。一般来说,一个概念必须归入永久聚类分面,如有需要,也可同时归入随需聚类分面。

(3)非专一内容分面。有些概念在词表中比较孤立, 不能构成一个分面,可把这样的概念集中起来,组成一个“非专一内容分面”,类似体系分类法中的“其他”类。

4 分面中概念的序列原则

分面叙词表分面中概念序列原则与体系分类法中同位类序列原则相同,也是逻辑次序原则。即:

(1)概念序列连续性准则。 包括:①进化顺序准则(低级→高级,原始→现代);②复杂性渐增准则(简单→复杂);③时间顺序准则(先→后);④空间接近准则(近→远);⑤数量渐增准则(少→多);⑥生产过程顺序准则;⑦习惯序列惯例;

(2)概念序列稳定性准则;

(3)概念序列中突出重要概念惯例。例如:①优惠惯例; ②突出本国惯例;③首都、省会居前惯例;④多数民族居前惯例。

分面中的概念尽可能不采用字顺序列。

5 类目体系和分面标头

分面叙词表中的类目体系层次不宜过多。大小类目最好都从左端开始,以不同字体、字号表示。

一个类下设若干分面。分面下可设亚面。亚面属于多重列类性质,类似体系分类法的多重列类法。

在非专一内容分面中,可将属于同性质的、有关联的词集中在一起成为词块。

分面和亚面设立分面标头。在字块之间应有分隔。设有多个分面的类目,设有多个亚面的分面,在其开始处应有“简目”,必要时可加适当注释。

6 分面叙词表中概念关系的显示

分面叙词表中概念关系的显示有三种基本模式:(1 )在分面分类表和词表两部分重复显示概念关系;(2 )在分面分类表部分显示等级关系,在词表部分显示其他关系;(3 )集中在分面分类表部分显示全部概念关系。印刷型分面叙词表以采用第三种模式较好,机读型分面叙词表以采用第一种模式较好。

在分面分类表部分适当采用轮排索引形式作重要显示,这种方法似可一试。

7 分面化处理的程序

由于一个分面大致与一个词族相等,一个词族的词一般不超出一个范畴的范围,范畴索引具有对叙词进行分类的性质,所以,对叙词的分面化处理可以范畴索引中的范畴为基础,先根据词族索引或全显示式参照系统,将一个范畴内有等级关系的叙词排列成等级结构形式,再在其余无等级关系的叙词中找出有关联的词构成词块,最后将等级结构和词块划分成分面。

对内容过于庞大的词族(如《军用医学主题词表》中的“神经疾病”词族),最好予以分拆,方法可仿照3(1)。

对原来的词族,可以划分成若干亚面的,最好划分成亚面。

对可以多向聚类的概念,原来只作单向聚类处理的,应补作多向聚类。例如,“鼻粘膜”一词,原来只与“粘膜”构成词族,应补充与“鼻疾病”构成词族。

对叙词表的范畴体系根据分面处理结果进行调整(包括将隶属于不同范畴但可构成同一个分面的词合并),形成分类体系,并将各分面置于适当的类目下。

对分面、分面中的词、词块、词块中的词按逻辑次序作适当的排列。

标签:;  

叙词表的面转换_聚类论文
下载Doc文档

猜你喜欢