表面分类在网络资源组织中的应用_搜索引擎论文

表面分类在网络资源组织中的应用_搜索引擎论文

分面分类在网络资源组织中的应用,本文主要内容关键词为:网络资源论文,组织论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

[分类号]G254.1

1 前言

网络信息量的指数级增长,以及网络信息检索工具效率的低下,使用户很难从网上检索到所需信息。搜索引擎虽然对检索信息提供了一些帮助,但它们检出的信息有很多并不是用户真正需要的。尤其是对检索出的信息的相关性判断,很难满足用户需求。实际上,同一检索,不同的用户会产生完全不同的相关性排序。另外,网络信息资源不同于传统的文献资源,它在资源主题方面呈现出如下特点:主题专指度较深、主题因素不断增多、复杂主题增多、主题处于多维状态、主题的时效性更强。

在新的资源环境下,如何才能面向用户的特定需求,提高信息检索的效率呢?笔者将从这一问题出发,针对网络信息资源的主题特点,探讨分面分类在组织网络信息资源中的应用。

2 复分表、仿分在网络分类体系中的使用

分类搜索引擎在编制自己的分类表时,可以借鉴传统文献分类法中的复分表、仿分技术。但在网络环境下,复分表和仿分一般是用在信息组织标引的后台工作当中的。在编制的过程中,会有许多地方与传统文献分类法的复分仿分不同,尤其在资源类型复分表的编制上,几乎已经完全不同于传统文献分类法中总论复分表中所列出的文献形式。

2.1 通用复分表的使用

在编制网络分类体系时,可以编制各种类型的通用复分表,作为全表各级类目组配复分的依据,也可以用于规范分类体系展开的方式,使整个分类体系更具科学性和逻辑性。网络分类体系的通用复分表包括:主题通用复分表、世界地区复分表、中国地区复分表、时代表(包括国际的和中国的)、资源类型表、人物复分表。

主题通用复分表规定了整个类目体系展开的次序,内容可以包括:综合网站、热点问题、政策法规、机构(包括管理机构、事业机构与协会、事业单位、公司企业单位)、人物、理论、事业与管理、改革研究、教育培训。

在编制世界地区复分表、中国地区复分表的时候,可以采用超链接技术,突破传统复分表的线性排列方式,将一些用户经常用到的国家或国内的一些重点城市的类目提前,突出重复反映,这样有利于用户查找。

时代复分表则要根据网站的服务功能和所收集的资源特点来定。对于收集历史文献的网络站点或历史类专业搜索引擎来说,需要编制国际的和中国的时代复分表,复分表的详尽程度要视资源的具体情况而定。而综合性的站点和搜索引擎也可以不用时代复分表,因为网上的资源大多是时效性很强的,历史文献较少。

网络环境下所使用的资源类型复分表中的资源类型,除了包括传统文献分类法中的期刊、报纸、杂志等文献形式外,还包括BBS与论坛、会议与活动、个人主页、新闻组、Mailing List/LISTSERV等。

2.2 专类复分表的使用

在编制网络分类体系的时候,在有关类目中编制专类复分表,作为某些类目组配细分的依据。例如,在“医疗与健康”类下的西医中的各科,可以按照一个统一的次序展开,编制成一个专类复分表。顺序依次为:机构团体、医院、医界人物、药品、期刊、会议与活动。这几项是各科都共有的,可以采用统一的次序。这就是专类复分表的应用,但它并不需要像传统文献分类法中的专类复分表那样赋予统一的类号,而只需要在各类中采用统一的形式,在信息加工的后台工作中,使信息处理人员更好地理解各类的类目展开方式,更好地使用分类体系来加工整合信息资源。

2.3 仿分的使用

规定部分类目可以仿照已列出的类目进行细分,即类目仿分。例如,在“教育类”下,“中等教育”中的“题库”就可以仿分“各科考试”,因为它们都是按“语文、数学、政治、几何、物理、化学、英语、生物、历史、地理、其它”进行细分的。在网络分类体系中,这种情况很多,不一一列举。

3 分面叙词表的应用

分面叙词表的建立,一般都是局限于某一个主题领域的,因为每一个主题领域的基本分面的划分是不同的,所以对于整个知识领域,建立一个分面叙词表是非常困难的。分面叙词表主要用于网上学术资源的组织,或是用于组织建立专业搜索引擎。分面叙词表具有下面几个作用:

·利用分面叙词表,可以有序的组织某一主题领域的检索词。

·在信息标引的后台工作中,信息标引员利用分面叙词表对网页进行主题标引。一方面可以利用分面组配提高描述特定信息资源的能力,一方面用分面组配公式来标引网页,可以实现标引的一致性,提高标引质量。

·在信息检索的前台工作中,可以向用户提供其输入的检索词的同义词和相关词,同时可以提供多个主题领域的检索词,以供用户进行自由组配,这样通过组配的方式,可以达到概念的高度专指。

·采用这种组配的方式,可以使用户拥有最大程度的决定权,即由用户从系统推荐的检索词中选择合适的词语,来实现自由的组配,从而避免了用户构造复杂的检索式。同时,在检索过程中,通过人机对话,由用户来判断与其检索最相关的文献。

4 分面分类用于可视化检索

在网络资源组织与检索中,也可以完全采用一个分面分类的用户界面,从而实现可视化的检索。目前的分类搜索引擎,基本上采用了等级列举式分类法,当用户选择了一个主题之后,用户的思维就被限定在某一个分面之内。但多数信息资源都呈现出多维度、多侧面,例如它们可能同时包含主题分面、书目形式面、时间分面和地域分面。为了使用户能从多个角度进行信息资源的检索,我们可以在检索界面上设置主题分面、书目形式面、时间分面和地域分面,然后,在这几个分面下,再按等级列举的方式分别展开,各个分面中的子分面之间,可以相互进行组配。这样,既可以使用户的检索达到较高的专指性,又可以使类表的修订与维护变得简单易行,从而能够使类表紧跟时代的发展。

但是,因为一个综合性搜索引擎或综合网站的信息资源的主题、学科范围太广泛,而不同学科领域会有不同的分面,所以在确定基本分面时,难度较大。因此,在一个综合性的搜索引擎分类体系中只能部分地采用分面分类的思想,但在专业学术资源站点网络资源组织与检索中,或在专业分类搜索引擎中,却可以完全采用一个分面分类的用户界面,从而实现可视化检索。

这种完全采用分面分类表的站点,在界面上以菜单形式列出这个分面分类表的基本分面,基本分面的数量视文献资源特点和主题特点而定。每一个基本分面可以展开为一个视窗,在每个视窗中,有这一分面的细分,它们的构建逻辑可能并不相同,例如:在材料面下可以按等级结构展开,在地域面下可以按部分/整体树展开,而在时期分面下,则可按时间线展开。在各视窗下的展开结构中,每个子分面或子类目旁都注明相关文献资源的数量,同时在打开另一个视窗(即分面)时,视窗之间相互限定组配,最后通过这种组配,帮助用户查找到有用的信息资源。在用户选择子分面或子类目的时候,系统可以向用户提供与之相关的同义词或近义词。也就是说,要编制一个入口词表。

目前,英国的Huddersfield大学的数据库检索研究中心,已研究出可视化检索界面,完全利用了分面分类的思想。

这种可视化检索,可以将网络用户从构造复杂的检索式中解放出来,同时通过组配,用户的主动权、选择权较大,对文献的相关性判断也会较为准确。另外,还可以不必考虑困扰了分类界很久的引用次序问题,使用户从多维度进行检索。

5 小结

分面分类法虽然产生已久,但现实应用却很少。在网络环境下应用分面分类是否具有可行性这一问题上,人们的意见并不统一。有人提出,分面分类法虽然具有各种优势,非常适合网络信息资源的组织,但在实际操作中,却存在各种问题。例如:网络信息标引员的专业水平不够高,在进行分面分类时,会出现主题分析错误,从而导致标引错误;基本分面较难确定,不同的学科具有不同的分面;检索速度会降低,而运营成本增加等等。但笔者认为,将分面分类应用于网络资源组织,将是一个发展趋势,关键问题是我们应进一步研究探讨分面分类理论的相关问题。

标签:;  

表面分类在网络资源组织中的应用_搜索引擎论文
下载Doc文档

猜你喜欢