四大门户分类引擎系统的初步研究(1)_搜狐论文

四大门户网站分类引擎体系初探(一),本文主要内容关键词为:门户网站论文,体系论文,引擎论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

四大门户网站分类引擎(以下简称为分类引擎)是网络环境的产物,是直接根据网络环境的特点和要求编制的。其分类体系集中反映在以下几个方面:

1.分类引擎的分类对象。

网络信息资源在内容分布上,新兴科学技术(尤其是电脑网络等)、商业、娱乐和生活类的资源数量较多,传统知识门类(如传统的社会科学、自然科学学科)的资源相对较少。各种分类引擎的对象往往因其定位对象的不同,而建立不同的数据库,其分类对象往往与其数据库范围密切相关,因而其分类类目的设置也与之密切结合。

根据信息载体保障原则,分类引擎基本上反映了网络资源的分布情况:资源较多的类目,如“电脑网络”、“新闻媒体”、“国家地区”、“商业经济”、“公司企业”、“娱乐休闲”等,分类引擎大多将其提升为一级类目;搜狐、新浪的分类引擎还设置有“体育健身”、“个人主页”的一级类目:分类引擎在二级类目多设置有BBS、聊天室、股票、就业招聘动态、多媒体资源等。相反,社会科学、自然科学、应用技术门类等,分类引擎只设置了概括性类目。

2.搜索引擎的用户及其需求。

网络的使用对象涉及所有的终端用户,他们直接在网络终端使用搜索引擎。网站世界通行的是“眼球经济”,把用户的高访问量、高回头率争夺注意力、树立品牌形象、提高知名度作为成功的标志。因而,分类引擎要求类目体系应具有较强的通用性、直接性,简明、易于使用,使用户不需经过预先学习,就可以通过类表进行查找,并且能满足从各种不同的角度查找的要求。

2003.6.30CNNIC调查结果显示,网民中学生所占比例最多,达到了30.1%,其次是专业技术人员,占总数的15.9%,排在其后的是商业、服务业人员(比例为9.1%)和办事员等协助人员(比例为9%)。农林牧渔工作人员和军人所占比例最少,分别只有不到1%。网民中从事教育业的人最多,占到13.2%,其次是制造业(比例为11.8%)和公共管理和社会组织(比例为11.6%),批发和零售业以及IT业所占比例也较多,分别达到9.6%和9.2%。从职业、行业的分布上可以看出,网民趋于多元化,涉及各种职业、各种行业。

调查结果显示,就网民上网目的来看,获取信息位居榜首,占46.9%;其次是休闲娱乐(比例为28.6%):位居第三、四位的交友和学习分别占到7%多;选择其它上网目的的网民则要少得多。

根据用户保障原则,分类引擎类目多据用户上网最主要的目的和用户最常使用的网络服务设置,往往以主题(事物)、按问题设置:如娱乐休闲、公司企业、生活服务、新闻媒体、旅游与交通、体育健身、卫生健康、个人主页、国家地区等多设置为一级类目,打破传统文献分类法的知识分类系统层次级别限制二级类目。

3.分类引擎的分类思想依据

分类引擎所依据的是用户需求第一和不断提高访问率的市场规则,往往根据用户使用需要,突出使用频率高的事物主题优先列出类目,动态地设置类目和揭示类目之间的关系,使分类体系具有较强的动态性、实用性,极大地方便用户使用、满足用户需求,并不强求分类体系适应某种知识分类思想或科学分类体系。

4.搜索引擎的技术环境—超文本技术。

分类引擎以网络信息为处理对象,根据网络检索的需要编制,使用的是超文本链接技术。通常是以类目或相关材料为节点,通过链接的方式,进行节点之间的联接,能按照分类体系展开的等级和层次,系统地展示分类体系;能按照主题之间的关系和用户的需要,灵活地、多维地进行揭示,在体系构建、类目设置等方面,具有不同于传统分类法的技术特色。故此,分类搜索引擎在分类架构和技术特点等方面都不等同于传统的分类体系。

5.四大门户网站的栏目分类体系

四大门户网站的栏目分类体系是该网站全部网页所组成栏目的层次结构体系,分类引擎体系则是互联网各种网站信息的层次结构体系。栏目分类体系的大类是其首页上的栏目,点击某—大类(栏目)的链接,就进入该大类(栏目)的网页,该栏目还包含有多个子类目(栏目),点击某—子类目(栏目)的链接,就进入该子类目(栏目)的网页。搜狐栏目分类体系就是这样由大类(栏目)—子类目(栏目)所构成。

6.分类引擎体系的宏观结构

分类引擎的宏观结构往往只有一至三四级类目组成的类目表和一般的搜索“帮助”、“登录新站”。

6.1.帮助:分类引擎一般都有以“帮助”菜单对使用方法加以说明。

如搜狐“分类与搜索使用说明”包括:怎样使用搜狐的关键词检索方式?在进行关键词搜索时,怎样选择各类信息?使用关键词搜索时有那些技巧?怎样使用搜狐的目录航检索方式?搜狐的类目主要涉及哪些行业或领域?使用目录导航检索方式有哪些技巧?网站搜索和网页搜索有什么不同?为什么在搜狐的搜索引擎中找不到我的网站?用逻辑“与”、“或”、“非”进行高级检索、搜索结果怎样排序?

6.2.登录新站:在网络泡沫破灭后,四大门户网站纷纷—改过去登录新站全为免费的方式,推出各种各样的收费登录新站服务。如搜狐的登录新站有免费型网站登录、推广型登录、普通型登录,有网站登录产品说明和搜狐网站的收录标准。

分类引擎登录新站的方法步骤基本类似。登录新站过程与信息载体分类过程很相似。

6.3.大类设置

6.3.1分类引擎首页

一般都显示其大类和部分二级类目,分类引擎即使大类相同,其列出的二级类目也不尽相同。

6.3.2分类引擎的类目表

分类引擎类目表,先由其大类表和部分二级类目构成其首页,再从二级类目细分,组成其一至三四级类目的类目表。

分类引擎通过上下层次与链接显示其级别关系,首页显示其一二级类目的从属关系,再通过链接与导航条,显示其二三级的类目的从属关系,形成一个由总到分的层层划分纵横交错的类目表。

6.3.3分类引擎的立类

(1)分类引擎大类序与类目的动态变化

表1 分类引擎大类比较(2002/1/8-9:42)

从比较可知:随着时间进程,分类引擎大类类名和类序都发生了变化。其中,新浪变化较少,大类类名不变,只有5大类排列顺序发生了变化。网易增加1个大类行业分类,使大类增至19大类,只有3个大类类序不变,其他的大类类序都发生变化。搜狐4个大类类名改变,教育改为教育与培训,计算机与互联网改为电脑与网络,工商经济改为工商与经济,公司企业改为公司与企业,只有2个大类类序不变,其他的大类类序都发生变化。中华网增加3个大类:增加公司企业、生活服务,删去运动旅游改为体育运动、旅游与交通,改2个大类类名,商业经济改为商业与经济,自然科学改为科学技术,只有2个大类类序不变,其他的大类类序都发生变化。

(2)分类引擎立类的标准

分类引擎由于网络信息资源特点、用户及其需求的不同,超文本技术提供的多维检索能力,使其立类标准,形成了新特色。

①大类的立类

分类引擎大类的立类采用了以主题为中心或主题与学科相结合的两种方式。突出了教育、娱乐、旅行、生活等与日常生活密切相关、普通用户感兴趣的类目,弱化了科学技术、学术性类目的设置,是通用性、生活性的类目结构。为了使分类体系有较强的直接性,分类引擎往往直接按照特定的事物对象设类。

从表2可知:搜狐、新浪、中华网分类引擎以学科为标准设置的大类只有文学、社会科学、艺术、科学与技术、政治/法律/军事5个,网易分类引擎则把社会科学的各门学科归入社会文化大类下的二级类目,而以社会科学为类名的则为:网易首页〉〉综合参考〉〉个人主页(内容分)〉〉人文社会〉〉社会科学,以及社会文化类个人主页@.其类下直接著录相关网站。分类引擎其余大类均以主题立类。因其用户需求较高,所以将其从原来所属学科范畴中剥离出来,单独设为大类,置于首页之上,极大方便了用户的查找。

表2 分类引擎大类比较(2003/8/3-11:26)

这种设置方式减少常用类目的显示等级,并可增强分类体系的直接性与易用性;形成一个更加重视直接性、实用性,侧重于从事物、问题为中心设类的体系;使主题立类与学科立类可优势互补,在一定程度上弥补了完全按主题立类实用性差,无法完全列举所有主题的缺点,也在一定程度上克服了按学科立类实用性差,用户不易掌握复杂的分类方法的缺点。

②检索入口

分类引擎大类体系提供了多维检索入口。除信息资源的主题、学科外,同时从地区、资源类型、机构等角度设类。如搜狐、新浪设立“区域(国家与地区)”大类提供了地区检索的入口,网易、新浪、中华网设立“参考资料”大类提供了资源类型角度检索的入口,搜狐、网易设立“公司企业”提供了机构检索的入口,搜狐、新浪将“个人主页”直接设为一级类目,便于用户从不同角度检索。

③二级及其以下类目的多种标准立类

分类引擎二级类目及以下的类目设置,都采用多种分类标准立类---多重列类。以分类引擎的“社会文化”类为例,该类同时采用了主题对象、学科、机构、人物、信息资源类型等多重标准设置类目。即使是按学科设置的类目,也并非属于一个标准。

这种多重列类做法减少分类体系的层次,使得用户不必一层层深入,减少了点击次数,便于快速检索。但在客观上,这种做法破坏了分类的等级结构和系统性,影响了类目体系的清晰度,在一定的程度上干扰用户的检索,使其在相应的类目中找不到相关的内容,降低查准率。分类标准的多样化并未与完全列举相结合,因此下位类的完整性也难以得到保证。

标签:;  

四大门户分类引擎系统的初步研究(1)_搜狐论文
下载Doc文档

猜你喜欢