“社会科学检索词库”研究报告_中国社科院论文

“社会科学检索词库”研究报告_中国社科院论文

《社会科学检索词表》研究报告,本文主要内容关键词为:词表论文,研究报告论文,社会科学论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

《社会科学检索词表》是以全国社会科学研究机构为服务对象的社会科学综合性词表,遵循科学性与实用性原则编制而成的。它具有分类检索语言和叙词(即主题词)检索语言一体化、传统分类法与分面分类法相结合、一次检索过程可以同时收到两种检索功效的特点。现将有关研制工作的几个关键问题报告如下:

一、关于两种检索语言兼容互换问题

传统分类法是按传统的知识门类的稳定性、学科体系的等级性和概念从整体到局部的排列原则编制的。现代分类法在传统分类法原有的基本大类中,出现了跨学科的主题类目和属种以外的其他关系。由于考虑到检索语言发展的这一趋势,我们选择了编制分类主题一体化词表的方案。

为了尽可能利用编制一体化词表的现有成果,我们收集了国内外具有代表性的专著、论文和各类词表,就分类系统和主题系统中语义因素对应关系问题进行了比较研究。当前解决两种语言兼容互换的方法大致可以归纳为四种:一是把原有的分类表改造成半分面和全分面分类表,然后利用计算机软件,自动生成对应字顺叙词表。英国情报学家艾奇逊编制的《分面叙词表》就是在《英国电力分面分类法》基础上改造的。二是对原有的叙词表引入分类体系,进行一体化改造。例如美国的《市政叙词表》就是引入《国际十进分类法》后实现一体化的。三是通过对照表作中介,把现有的两种检索语言沟通,实现对应转换。现在北京图书馆组织编制的《中国图书馆分类主题词表》就是《中图法》与《汉语主题词表》的对应表。四是直接编制分类主题一体化词表,如《联合国教科文组织叙词表》。前三种是对原有检索语言的改造,第四种是最新技术的直接应用(目前对我们来说,无论是社会科学分类法,还是社会科学主题词表,都尚未问世)。为同时解决我国社会科学学术资料分类和机检的急需,我们决定借鉴《联合国教科文组织叙词表》的编制技术,结合我国社会科学的实际情况,直接编制分类主题一体化的社会科学检索词表。

编制一体化词表的关键是解决分类检索语言和主题检索语言的兼容与互换问题。对此问题,我们是采取词汇控制的办法实现的。首先把分类表中的每个类名叙词化(即主题词化),也就是对分类表中的每个类名实行严格的词形(即简化)、词义(即单一)控制和词间关系(指同义、属分和相关关系)控制,要求一个类名代表一个主题概念,一个主题词(即叙词)只用一个类名表示。例如,“文学”在传统的分类法中,它仅仅是一个基本大类;但在本词表中,它既是分类表部分的基本大类的一级类名,又是叙词表部分的一个叙词。然后再按叙词语言的分面要求(详见下一问题)将它分成文学史、文学流派、文艺理论、文艺事业、文学创作、文学批评等10个组面,作为二级类名归入分类表内的基本大类之下。这10个二级类名,在叙词表部分同时又是10个叙词。以此类推,有的类表最多可达8级类名。这样同一个主题概念同时分布在本词表的分类表和叙词表这两个部分之中,并用同一符号加以标识。然后将上述数据编入数据表内,输入计算机,通过软件控制,一次检索可自动生成两种检索标识,收到两种检索语言兼容互换的效果。对不能叙词化的个别类目的类名,也就是说,这些类名在分类表和叙词表中不能做到一一对应,我们将这些类名作为过渡类目,称之为“聚类词”,在数据表中采用特殊符号(P)加以标识,表明其只在分类表中出现,而不在叙词表内出现,这些过渡类目同样可以进行分类检索,并不影响整体兼容效果。

二、关于分面问题

本词表的分类表部分采用的是半分面分类法,即体系分类法(传统分类法)和分面分类法(现代分类法)相结合的体系组配分类法,根据不同学科本身历史形成的体系分类特点,在一、二级类目中大体采用体系分类法设类,列出社会科学传统学科、专业或惯用类,组成基本类表。在基本类表(即二级类)下进行分面分析,组成分面类表。这样做既保持了学科的完整性,又具有分面结构的灵活性。

体系分类法是以传统学科体系为基础展开的单维等级结构关系;分面分类法是具有分面结构性、采取组配方法的分类法,它将各门学科主题内容或文献的特征因素分成若干个范畴面,即分面,这些被划分出来的面就是具有同一范畴性质的一组类目词。它是横向多维关系的等级结构,可将所有文献的主题分出层次范围,并纳入一个简单的框架之中,使文献的分类能够通过分面组配的方法进一步适应知识领域的多维型的动态发展,解决了能够随时扩展和容纳各学科不断出现的新概念和新论题的难题。

分面分类法来源于印度阮冈纳赞的《冒号分类法》。他将各门知识的主题概念概括为五个组面范畴(即本体面[P]、物质面[M]、动力面[E]、空间面[S]和时间面[T]),并用这五个分面符号PMEST来代表通用分面公式。但是阮氏的分面公式不能准确地反映社会科学学科的主题概念的特征。本词表所收学科是纯学术性的学科,如哲学、宗教学、历史学和法学等学科已经形成了自身的严密体系,在这些学科的主题概念里,找不出材料[M]和动力[E]两个面的因素。可见,阮氏的分面公式只是给我们提供了进行多维分类的思考模式,但不能照搬。

我们针对社会科学不同学科的特点进行了具体的分面分析,来处理本词表各学科之间与各层次之间主题概念的共性与个性的关系,编制出比较适合于社会科学各门学科不同特点的分面模式,列表如下:

分面代号面的名称 内 容

A历史面 学科史、思想史

B学派面 学科思潮、流派

C方法论面

D学科面 学科分支学科、交叉学科

E理论面 学科研究对象、学说

F结构面 事业、机构、组织、体制

G管理面 管理问题、活动、作用

H时间面 历史时期和年代

K空间面 地域和国家

以上A—K九个面中,H、K为通用面,其他七个面是囊括本词表中全部学科的主题概念的分面,并非各门学科都具有这七个分面,也不完全都按以上系列排序,主要是根据各学科的不同特点灵活运用。在分面过程中,不搞硬性概念推理,不生造叙词。

三、关于词表的结构问题

本表包括字顺叙词表、半分面分类表、英汉对照索引和轮排索引四部分,并均备有数据软盘,其中字顺叙词表、半分面分类表和英汉对照索引三部分将于1995年初正式出版。附表(人物、机构名称)采用表外控制手段解决,以《中国大百科全书》社会科学各卷有关索引为范本对人物、机构名称进行规范。

本词表的主表是半分面分类表和字顺叙词表两部分,前表的分类框架是:

A马克思主义L法学

B哲学 M军事学

BM

逻辑学N新闻学、传播学

BN

伦理学P图书馆学、情报学、档案学

BP

美学 Q教育学

C宗教学Y管理科学

D语言学YB

统计学

E文学 YL

科学学

F历史学YM

未来学

G考古学YP

管理学

H社会学YQ

人才学

HP

人口学YR

决策学

I民族学

J经济学a/y 通用表

K政治学

全表17个基本学科大类,27个专业类目,包容了我国社会科学传统学科及新兴学科。由于本词表服务对象是我国的社会科学研究机构,所以它的学科覆盖面应该以我国社会科学研究的学科范围为准。它既不同于为公共图书馆服务的综合性叙词表,也有别于面向党政、新闻、艺术、军事和档案等部门的专业词表。这种分类框架符合我国社会科学传统分类体系,适合社会科学文献机构标引和检索的习惯。

本词表对一些学科范围难于界定、研究对象不清、至今尚无定论的“超前科学”均不设类。

四、关于学科收词问题

本词表的收词原则以能够表达社会科学学术主题概念为标准。与学术无关的生活用语、操作用语、大众用语等一律不收。

在收录叙词中,首先要突出我国的学术特色。中国社会科学源远流长,学术思想极其丰富,学术文献汗牛充栋,相应地学术术语浩如繁星。但又不可能收入中国社会科学文献中反映出来的所有主题概念的词汇,只能重点收录使用频率较高的学术观点、学派、学说、理论、方法等方面的学术用语。正确处理好这种繁简关系,是我们在收词过程中始终注意的问题之一。

在本词表的17个基本大类中,我们根据本表的收词原则和收词特点,又重点加强了哲学、语言学、文学、历史学、考古学、社会学、民族学、政治学和法学等社会科学核心学科的收词量。

五、存在问题

本词表系探索分类主题一体化技术的首次尝试。编制这类社会科学综合词表,国内外尚无先例。我们虽然参照国外类似的词表的模式,结合我国的情况,突破和解决了一些问题。但是在解决分类主题一体化语言相互兼容与互换这个关键问题上,并未能做到完全的一一对应;在对社会科学进行分面的问题上,尽管拟定出社会科学主题概念的分面模式,但这些面的设置是否完全得当,是否符合社会科学的内在规律和社会科学学术界的传统习惯,还有待于在实践中检验。另外,试标引阶段较短,所标引的学科较少,因而所收到的反馈信息不够充足,也是不足之一。总之,本词表有待在使用过程中,发现问题,不断修改和完善。

标签:;  

“社会科学检索词库”研究报告_中国社科院论文
下载Doc文档

猜你喜欢