互联网上中国社会科学信息资源学科分布初探_中国社科院论文

网上中文社会科学信息资源学科分布初探,本文主要内容关键词为:信息资源论文,中文论文,社会科学论文,学科论文,网上论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

网上信息资源浩如烟海,其中包含大量社会科学信息资源,就目前为数不多的网上中文信息资源而言,社会科学信息资源却比较丰富。有了如此丰富的资源,一方面,为利用社会科学信息创造了条件,另一方面,由于这些信息过于庞杂和无序,人们对其整体状况难以把握,检索网上信息犹如大海上行船,使绝大多数网上中文社科信息资源未被发现和利用。为了解网上中文社科信息资源的整体状况,促进网上中文社科信息资源的开发和利用,本文通过网站搜索、类目划分、栏目设置三种途径,从学科角度对网上中文社科信息进行测试与研究,以窥网上中文社科信息资源学科分布的全貌。

1 样本

为了搞清网上中文社科信息资源的学科分布,首先必须明确网上社会学科信息包括哪些学科。本文以中国社会科学院文献信息中心编制的权威性较高的社会科学综合性检索词表——《社会科学检索词表》所确定的学科范围为准。据此划定网上社会科学信息主要包括:马克思列宁主义、哲学、宗教学、语言学、文学艺术、历史学、考古学、社会学、民族学、经济学、政治学、法学、军事学、传播学与新闻学、图书馆学-情报学-档案学、教育学、管理学等17个学科。

其次,为了提高测试的准确度,我们根据《社会科学检索词表》的基本大类为列类标准,检索词的选择以基本大类下的一级类为依据。从网络信息资源的关键词检索特征的角度,进行了去重处理,适当增加了一些关键词,并对个别类目做了适当变通和修改。同时,为了保证检索的全面性,列类与选词也参考了《中国图书馆图书分类法》的基本大类和一级类目。列类和选词以提高全面性、避免重复为原则。由此形成了17个学科外加通用概念共18个基本大类、98个检索词。

在网站搜索测试方面,我们选用知名度、使用频度较高并能够提供稳定的网站检索的3个搜索引擎作为样本:搜狐(http://www.sohu.com.cn)、新浪搜索(http://www.sina.com.cn)、搜索客(http://www.cseek.com)

在类目划分测试方面,选用中国互联网信息中心(http://www.cnnic.net)统计报告所推荐的10个优秀综合性搜索引擎作为样本:新浪搜索(http://www.sina.com.cn)、搜狐(http://www.sohu.com.cn)、Yahoo中文(http://www.yahoo.com.cn)、常青藤(http://www.tonghua.com.cn)、找到了(http://www.zhaodaola.com.cn)、悠游(http://www.goyoyo.com.cn)、搜索客(http://www.cseek.com)、网易搜索(http://www.netea se.com)、中华网搜索引擎(http://search.china.com)、深圳热线中文搜索引擎(http://solo.szonline.net)、在栏目设置测试方面,选用中国互联网信息中心(http://www.cnnic.net)统计报告所推荐的10个优秀综合性网站作为样本:新浪(http://www.sina.com.cn)、中华网(http://china.com)、网易(http://www.163.com)、263在线(http://www.263.com)、上海热线(http://www.online.sh.cn)、东方网景(http://www.east.cn.net)、瀛海威(http://www.ihw.com.cn)、21CN(http://www.21cn.com)、深圳之窗(http://www.szptt.net.cn)、广州视察(http:www.gznet.com)。

2 测试

2.1 各学科信息资源在网站上的分布

通过搜狐、新浪、搜索客三个搜索引擎对Internet进行搜索,搜索结果用相关网站数(包括重复网站)表示,如表1所示。

从表1的数据,可以看出:

(1)我国网上中文社科信息资源数量较多。通过三个搜索引擎对18个基本大类98个关键词进行检索,共搜索出网站315467个,平均每个关键词搜索出3219个网站。可见,相关信息数量之大。

(2)我国网上中文社科信息资源内容丰富。《社会科学索引》词表所列出的社会科学17个基本学科以及社会科学通用概念均有相关网站提供,而且每个基本学科下关键词也都能检索出相关网站。可见,目前网上中文社科信息资源范围已覆盖了整个社会科学领域。

(3)网上中文社科信息资源的学科分布不均衡。大体上,网站数量可以分为最多、较多、较少、最少4组,其中,最多的是E(文学艺术)33%;较多的是J(经济学)、M(传播学与新闻学)、Q(教育学)及d/y(通用概念),分别为12%、11%、11%和15%;较少的L(法学)和P(图书馆学、情报学、档案学)为3%,D(语言学)、F(历史)和K(政治)为2%,B(哲学)、I(民族学)和N(军事)为1%;最少的是A(马克思列宁主义、毛泽东思想)、C(宗教学)、G(考古学)、H(社会学),所占比例几乎为0。可见,网上中文社科信息资源的学科分布不均衡现象比较严重。这种不均衡大体上可以反映学科对网民的实用性、现实性。

(4)同一基本大类下一级类的网站分布也不均衡。虽然18个基本大类都可搜索出相关网站,但在每个大类下,不同的关键词所检索出的网站数相差也很大。比如,在文学艺术基本大类下,有关小说的网站,三个搜索引擎的搜索结果分别为18052、12703、563个,而有关戏剧的搜索结果分别为88、325、79个网站。再如,在教育基本大类下,有关教育的搜索结果分别为13834、3652、2028个网站,而有关德育的搜索结果分别只有19、13、6个网站。在其它类下也普遍存在着这种现象。这种不均衡也与网民的兴趣面有关。

2.2 各学科信息资源在类目上的分布

我国各网站均按分类方式组织信息资源,并按分类提供检索。但目前各网站的分类标准不统一,层次也不一致。本文以各网站的一级类为准,不考虑二级类,各网站类目划分情况如表2所示。

通过表1和表2可知,社会科学各学科在网站的类目划分上具有如下特征:

(1)网上中文社会科学各学科信息资源在网站分类目录上得不到充分显示。从表1数据可知,社会科学各学科在网上都有相关信息存在。表2又显示,这些信息并没有在网站的分类目录上进行展示并提供分类检索途径。比如,A(马克思列宁主义、毛泽东思想)、B(哲学)、C(宗教学)、D(语言学)、G(考古学)、I(民族学)、P(图书馆学、情报学、档案学)、Y(管理学)8个学科在类目划分上没有得到显示。

(2)网站类目划分的学科界限不明显,存在多学科混杂的现象。比如,K(政治)、L(法律)、N(军事)3个学科在网站分类中常常出现在一个类目中。再如,文学、艺术、人文也常常互相交织,作为一个类目出现。

(3)不同学科在网站分类目录中出现的频次不一。其中E(文学艺术)、F(历史学)、J(经济学)以及K(政治)L(法学)N(军事)三学科的综合体在所有网站的分类目录中都有所反映。而H(社会学)、M(新闻学)、Q(教育学)和d/y(通用概念)分别有70%、80%、90%、60%的网站提供。

(4)在每一具体学科内,各方面信息提供不均匀。虽然有的学科在网站分类目录中出现,但从表2可知,几乎所有的网站都只反映某一学科的某一方面的信息,而对该学科其它信息则不予提供。比如,在F(历史学)中,各网站均以社会文化为类名,而对历史学的其它方面,如史学史、史学理论、历史形态、各国历史等均不予涉及。这又一次体现出网上信息资源的实用性倾向。

2.3 各学科信息资源在栏目上的分布

各网站一般都将其所收录的信息按一定的标准分栏提供,以便供用户检索和利用。各学科在网站栏目中出现的多少反映着该网站占有该学科内容的多少。10个综合性网站的栏目设置情况如表3所示。

通过表3内容可知,社会科学各学科在网站栏目设置上的具体情况如下:

(1)多数学科内容在网站栏目未被显示。通过对10个网站的调查可知,有E(文学艺术)、F(历史学)、H(社会学)、J(经济学)、M(传播学与新闻学)、N(军事)、Q(教育学)和Y(管理学)8个学科在网站栏目中有所反映,而18个基本大类中的其余10个学科都没有得到反映。

(2)各学科在网站栏目中出现的频次不一。80-90%的网站都提供E(文学艺术)、H(社会学)、J(经济学)、Q(教育学)栏目。而只有30%的网站提供F(历史学)栏目,40%的网站提供N(军事)栏目,20%的网站提供Y(管理学)栏目。(3)各栏目不以学科名称命名,且网站栏目名称不一。从表3可见,只有教育等极少数栏目与学科名称一致,其它大多数栏目都是各网站根据习惯命名。而且也只是某一学科的一部分内容。

3 结论与建议

3.1 网上中文社会科学信息资源学科分布总体特征

通过上述三个方面的测试与研究,我们可以总结出网上中文社会科学信息资源的总体特征如下:

(1)数量庞大,内容丰富。一方面几乎所有的综合性搜索引擎都提供社科信息相关网站,而且绝大多数综合性网站都提供社科信息相关类目与栏目;另一方面社会科学所包含的各个学科都能够在因特网上能够找到与之对应的相关信息。

(2)各学科信息在网上的分布不均匀。从上面的测试、分析中,可以明显看出,不论是网站,还是类目和栏目,它们所提供的各学科信息数量相差悬殊。

(3)信息的全面性、系统性较差。一方面,各网站在类目与栏目设置方面,所提供的只是某一学科的某一方面的信息,而类目设置之间、栏目设置之间的有机联系较少;另一方面,所有网站提供的信息都是某一学科几乎同一方面的内容,从网站整体来看,不具有互补性、系统性,特色不鲜明。

(4)生活娱乐方面的信息最多,理论研究方面的信息最少。从上述各表数据可见,不论是搜索引擎检索出的网站数,还是各网站的类目与栏目设置,与人们生活关系密切的学科、学科内的某一主题内容繁多(如休闲娱乐、经济、教育等),而涉及到学科理论与研究的内容却十分贫乏。

3.2 关于网上中文社会科学信息资源组织与管理的几点建议

严格地讲,虽然我国网上中文社会科学信息资源十分丰富,但到目前为止,尚没有形成一套比较有效的网上中文社会科学信息资源组织与管理规则和办法,而网上中文社会科学信息有序化程度不高的现状与人们对中文社会科学信息需求日益增加的矛盾又特别突出,迫切需要一套科学、有效的网上中文社会科学信息资源组织与管理规则和办法。在对网上中文社会科学信息资源进行调查研究的基础上,提出以下几点建议:

(1)进一步丰富网上中文社会科学信息资源。具备丰富的网上中文社会科学信息资源是进行科学、有效组织与管理的前提。通过分析和研究得知,虽然目前中文社会科学信息在中文网上信息资源中所占比例较大,但内容的全面性和系统性还较差,生活娱乐方面的信息特别多,理论研究方面信息很少,远远不能满足社会的全面信息需求。因此,中文社会科学信息资源仍亟待丰富。基于此,为了丰富网站上的中文社会科学信息资源应当扩大信息来源,增加信息稀少学科与理论性、研究性信息的网站、类目与栏目等。

(2)制定中文社会科学信息统一的分类标准,规范栏目名称及类目设置。虽然我国已有《社会科学检索词表》、《中图法》、《资料法》等分类表,但它们在很大程度上是针对印刷型文献的。与传统的信息资源相比,网络信息资源具有数量巨大、种类繁多、动态性强等特点,传统分类体系对网络信息有许多不适用的地方。况且,现在也没有要求网上信息按这些分类体系进行组织的规定。正是由于目前我国尚没有相关的网上信息资源分类体系,才使许多学科的信息资源在类目和栏目上得不到反映。即使在类目和栏目中反映出来,也因名称不统一而造成大量误检与漏检,给信息资源的开发和利用带来了困难。网络信息资源仍在不断激增,这就要求有新的、适合处理网络信息的分类框架,使网站的制作者、维护者有“法”可依,使用户有类可查。通过对栏目名称及其内容设置规范化,实现网站内容、特色栏目一目了然,检索具有针对性、相关性。

(3)规范网上中文社会科学信息发布行为,使各网站形成有机整体。目前我国网上中文社会科学信息互相是孤立的,缺少有机联系,造成了各学科信息分布不均衡,有的重复,有的空白。利用网络易于建立连接的特征,可以使网站之间建立分工与协作,一来可以形成各学科内容的系统性与全面性,二来也有利于网站形成各自的特色,提高信息服务的种类和质量。

(4)建立一套全面、规范的网上中文社会科学信息资源导航系统。针对我国网上中文社会科学各学科相关网站彼此孤立、缺乏联系以及缺少专门的网络导航和搜索引擎的状况,需要建立一套全面、规范的网上中文社会科学信息资源导航系统,使各个学科的每个网站、每条信息都在这个系统的控制之下。通过这一导航系统,使网上中文社会科学各学科信息资源融于一体,以便对各学科信息资源进行有序组织、多途径检索与高效利用。

标签:;  

互联网上中国社会科学信息资源学科分布初探_中国社科院论文
下载Doc文档

猜你喜欢