中国网络信息资源的分布_网站数据库论文

中国网络信息资源的分布_网站数据库论文

我国网络信息资源分布,本文主要内容关键词为:信息资源论文,我国论文,网络论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

1 网络信息资源的地域分布

根据最新的互联网带宽调查,截止2001年9月30日,我国国际线路的总容量为57245M,连接的国家有美国、加拿大、澳大利亚、英国、德国、法国、日本、韩国等。其中,科技网占55M,中国公用计算机互联网占4580M,中国教育和科研计算机网占102.5M,中国金桥信息网占168M,中国联通互联网占259M,中国网通互联网占510M,中国国际经济贸易互联网占4M,中国移动互联网占45M,中国长城互联网和中国卫星集团互联网在建设中。

10大网络中,中国教育和科研计算机网、中国科技网、中国国际经济贸易互联网和中国长城互联网是公益性网络,其他网络均属于赢利性网络。从信息资源状况来看,中国教育和科研计算机网(CERNET)、中国科技网(CSTNET)、中国公用计算机互联网(CHINANET)等信息资源比较丰富,信息质量也较高。其他网络普遍存在着信息资源较少,没有搜索引擎,没有网络导航等问题,有的网络处于建设中,出现这些问题是难免的。这10大网络的信息资源结构与分布不平衡,从总体上存在着资源配置的不合理问题。

网络信息资源的地域分布主要是通过占有IP地址及在线数据库的数量、记录等表现出来,因此,对全国域名分布、网站分布、数据库状况的分析基本可以看出网络信息资源在全国的地域分布情况。

域名是网站的标识,网站是收集、整理、传播信息的集散地,从网站数量上可以看出一个地区信息发布能力和信息资源占有能力。由于网站与域名是一一对应的关系,因此从域名的统计中可以看出东西部网站建设的差别。从表中可以看出,域名主要分布在北京、广东、上海等东部地区,西部省区域名数量少,占的比例也很小。地区域名数量位于前5名的省市如下:北京(34.8%)、广东(14.1%)、上海(9.4%)、江苏(5.2%)、浙江(4.3%)。虽然互联网在我国的发展只有几年的时间,西部地区在网站数量上已经远远落后于东部地区。

表1 CN域名的地域分布

 北京

上海

天津

重庆

河北

山西

内蒙

域名数量 44304 11913  2155  1174  1335 

840 

624

百分比  34.8% 9.4% 

1.7%  0.9%  1.8% 

0.7%  0.5%

 辽宁

吉林 黑龙江

江苏

浙江

安徽

福建

域名数量 4219

864

1276

6575

5399

1217

1997

百分比

3.4%

0.7%  1.0%

5.2%

4.3%

1.0%

2.4%

 江西

山东

河南

湖北

湖南

广东

广西

域名数量 514

4994

2041

2318

1257

18000

900

百分比

0.4%

3.9%

1.6%

1.8%

1.0%

14.1%  0.7%

  海南

四川

贵州

云南

西藏

陕西

甘肃

域名数量  987

2437

413

1655

 170

 1747

451

百分比

0.8%  1.9%

0.3%

1.3%

0.1%   1.4%

0.4%

 青海

宁夏

新疆

香港

澳门

台湾

域名数量 105

 342

1195

1572

——

百分比

0.1%   0.3%

0.9%

1.2

——

资料来源:www.cnnic.net.cn/develst/中国互联网络发展状况统计报告(2000年7月)

表2 在线数据库及记录的地域分布

华东

华北

华南

华中

东北  西南

西北

地区

地区

地区

地区

地区

地区

地区

数据库数量

 26.3% 32.1%

14.0%

11.4%

7.5% 5.2%

3.6%

(百分比)

数据库记录数量 30.9% 28.5%

16.7%

7.4%

5.9% 9.9%  0.7%

(百分比)

资料来源:http://www.cnnic.net.cn/中国互联网络住处资源数量调查报告(2001年4月)

从在线数据库的地域分布来看,在线数据库主要分布在华北、华东与华南地区,三者之和占72.4%,西北、西南地区的占有比例较低,为8.8%。从在线数据库记录的分布来看,华东地区的比重最大,占30.9%,其次为华北地区,占28.5%,第三为华南地区,占16.7%,西北、西南地区的总和占10%左右。由于我国地域广阔,地区之间发展不平衡,东南沿海和西部欠发达地区差距较大,使得信息网络建设在基础设施上呈现较大差异。

从网络信息资源的发展状况看,华北和华东地区无论从域名数量、网站数量、网页拥有量,以及在线数据库的拥有量,均居全国领先;华南地区的信息资源发展仅次于这两个地区;西北、西南地区已远远落后于东部地区。可见,网络信息资源在地域上的分布和该地区的经济、文化的发展有密切关系。网络信息资源的分布与传统信息资源类似,也存在着地域分布上的不平衡现象。网络信息资源主要集中分布在经济、文化较发达的地区。华北和华东地区的网络信息资源丰富,居全国领先。华南地区仅次于这两个地区,西部地区网络信息资源较贫乏。这与我国文献资源的地区分布基本相同。这种自东向西网络信息资源递减的现象并不是偶然的,这与我国社会经济、文化的发展密切相关。我国互联网的发展还属于起步阶段,经济发达地区具备资金与人才优势,而且传统信息资源较为丰富,在此基础上建设网络信息资源具有优势,其市场前景也比较好。且西部地区由于经济、文化的相对落后及文献信息的相对贫乏,在网络信息资源建设上与东部省市比较起来表现出极大的差别。且人均国内生产总值(GDP)只有全国平均水平的1/2左右,远低于东部、南部地区,且西部地区人才严重短缺,人才队伍不稳定。在这种形式下,西部地区的网络信息资源建设不可避免地面临着困境。在没有长期、大量的经费投入的情况下,网络信息资源建设的薄弱状况很难改变,这是一个应引起重视的问题。

2 网络信息资源的时间分布

网络信息资源的时间分布主要从网站建立的时间,网页及数据库更新的周期等表现出来。从网站的成立时间看,截止2001年4月,2000年以来成立的网站占网站总数的67%,其中2000年成立的网站比例占49.2%,13.3%的网站是在1998年及以前成立的。从网页更新情况看,更新时间在一周以内的占6.89%,更新时间在一周到一个月之间的占5.01%,更新时间在一个月以上的占88.10%。从数据库更新情况看,目前记录的更新比例仍比较低,其中每周更新所有记录中1%~5%的网站占较大比重,大致占35%,另有20%的网站每周对记录的更新比例在1%以下。从网络信息资源的时间分布可以看出,大部分的网站是最近两年建立的,说明随着我国信息化进程的加快,信息资源数量迅猛增长,这是一个良好的发展势头。但从网页的更新情况看,信息更新不够及时,信息资源的时效性差。有88.10%的网页一个月以上更新,有的网页半年甚至一年都没有更新,过时、陈旧的信息内容使信息资源质量下降,阻碍了信息的开发利用。

3 网络信息资源的行业分布

从网络的组织结构可以看出信息资源主要是分布在网站上,人们通过网址来查找和利用信息资源。根据网站的经营主体的性质,我们将网站区分为以下几类:企业网站、政府机构网站、商业网站、教育、科研机构网站、其他非赢利网站、个人网站等。企业网站的比重最大,占整个网站总体的77.8%,其次为政府机构网站,占8.6%,商业网站所占的比重为5.4%,教育科研机构网站占3.3%。

由于发布信息的目的及所拥有的信息资源不同,导致不同机构所产生的网络信息资源存在差异。政府网站所提供的信息资源主要有职能/业务介绍、政府公告、法律法规、政府新闻、行业/地区信息、办事指南、统计资料、电子政务等。我国政府网站上主要有以下三大类信息。(1)政策法规,几乎所有的政府网站都有相应的政策法规数据库。在政府网站上可以得到最新的政策信息、重要的政策法规全文,具有其他网站无法替代的权威性。(2)经济信息,许多政府网站提供经济信息,突出地方特色,为地方经济服务。如信息产业部的投资分析和市场研究专栏;大连市政府投资建立的对外招商引资专用网站;广东省政府将地方特色经济推上网等。(3)服务信息,政府上网为政府机关公开自身工作透明度提供一个方便、快捷、有效的载体,政府职能部门负责人、部门职责、办事程序在网上一览无余。

商业网站提供新闻、网上社区、在线数据库、网上教育、电子商务、软件下载、电子邮箱、网上股票交易、网上订票等信息。商业网站提供的信息资源系统性、完整性较好。有45.4%的商业网站提供电子商务服务。

企业网站提供企业总体概况、产品与服务信息、商业服务信息、行业新闻、企业动态等信息。动态性信息为主,相对静态性信息为辅,信息更新及时。有11.2%的企业网站提供电子商务服务。

大学、科研机构站点主要提供学术性较强的各种信息,而且相对企业来说变化较小。

信息机构站点一般以提供各类专题信息为主,如经济类专题、科技类专题、以及各种专门类型的文献信息,如报刊、图书、专利、会议文献等。

行业机构站点一般系统性、完整性较好,面向企业、面向市场,动态性较强,能够反映市场的变化,以经济类专题信息为主。从行业分布看,电脑/通信设备/网络设备/软件业网站占21%,零售批发贸易业的网站占11.6%,第三为机械及工业制品行业,占6.6%,第四为公关、广告和市场研究等服务业,占6.3%,还包括科学研究和综合技术服务,电子元器件/家用电器、化工、服装/纺织、社会服务、金融保险业、房地产业等。一批专业网站逐步发展并形成规模,如中国科技网、中国经济网、中国医药信息网、中国工程技术信息网等。

从在线数据库的行业分布来看,在拥有在线数据库的网站中,所占比例最大的是企业网站,占48.3%,其次是商业网站,占26.5%。表3是按类型分布的在线数据库情况。

从各类网络信息的网站分布看,企业网站的比例最大,而教育、科研机构网站只占3.3%,政府网站、商业网站、信息机构网站的信息资源建设有待加强。

我国已建成中国教育和科研计算机网(CERNET)、中国科技网(CSTNET)等公益性、学术性计算机网,提供教育、科研等方面的信息,但与整个网络的信息资源相比就显得微不足道。当人们在网络的海洋中寻找相关专业信息时,专业性、学术性网络的重要性才逐渐显现。国家科技与经济信息基础设施的建设势在必行,国家科技与经济信息基础设施的目标就是形成超大规模、高质量的科技与经济信息库群。通过国家骨干通信网和几个主要的全国信息服务网络,向全国及全世界提供内容广泛的信息服务。

表3 拥有在线数据库的各类网站比例

网站

企业

商业

政府机

教育科研

其他非赢

类型

网站

网站

构网站

机构网站

利机构网站

数据

 48.3%

26.5%

21.1%

 3.4%0.7%

资源来源:http://www.cnnic.ent.cn/中国互联网络信息资源数量调查报告(2001年4月)

政府网络信息资源建设需要加强,目前我国有80%的信息资源掌握在政府手中。而我国政府机构网站只占网站总数的8.6%,但提供的信息内容不够丰富。因此,需要进一步加强政府信息资源建设,使政府信息资源在整个网络中占有更大比例。1999年1月,由中国电信和国家经贸委经济信息中心主办、联合40多家部委(办、局)信息主管部门共同发起了“政府上网工程”,取得良好效果。截止2001年6月30日,共有"gov.cn"域名5181个,占域名总数的4.0%,站点数占www站点数的1.4%。但政府提供上网的信息资源所占比例还是偏低,急需加快政府信息网络化进程。

信息机构的网络信息资源建设较薄弱,没有充分发挥其信息资源优势。信息机构丰富的印刷型、视听型、缩微型信息资源亟待转换成电子型,在网上建设一个拥有电子图书、电子期刊、电子报纸以及各种类型电子出版物的数字图书馆。现有信息机构已经开始这方面的探索,如:依托于CERNET的中国高等教育文献保障系统(CALIS)、依托于CSTNET的国家科技图书文献中心、国家知识基础设施工程(CNKI)等。目前存在的问题是没有很好地协调,导致信息资源的重复建设,如何寻求各系统网络资源的优化与整合,形成资源优势互补的网络系统仍是亟待研究的一个课题。

4 网络信息资源的内容分布

内容是网站的生命力,也是衡量网络发展的标志之一。与传统的信息资源一样,网络信息资源涉及人类生产、生活、娱乐以及其他社会活动的各个方面,网络信息资源产生于人类的各种社会活动之中,这些复杂的活动可把网络信息资源内容概括为以下几类:

(1)社会政治活动,产生社会政党、组织、法律、政策、政治方针等方面的网络信息资源。

(2)社会经济活动,产生金融信息、商品经济、技术经济、市场、消费、贸易等网络信息资源。

(3)军事活动,产生战略、战术、战争等方面的网络信息资源。

(4)社会生产活动,产生工农业产品生产、原材料购销、商品流通、生产工艺、产品广告等网络信息资源。

(5)社会技术开发,产生技术交易、开发、发明、推广以及应用等方面的网络信息资源。

(6)社会科学研究活动,产生自然科学和社会科学各门类的成果、活动等方面的网络信息资源。

(7)社会文化、教育活动,产生新闻、文化、教育等方面的网络信息资源。

(8)社会医疗卫生活动,产生医疗、保健及卫生方面的网络信息资源。

(9)社会艺术、体育、娱乐活动,产生各种艺术、体育、娱乐活动方面的网络信息资源。

(10)人类生活,产生反映人类衣、食、住、行等方面的网络信息资源。

除以上10大类网络信息资源外,还存在社会管理等专门活动方面的网络信息资源。

到目前为止,对网络信息资源的分类还没有一致的标准和公认的划分结果,可从多种角度进行划分。按信息交流方式可划分为正式出版的信息、半正式出版物和正式出版物三种类型。按信息组织方式可划分为文件、数据库、主题目录和超媒体四种类型。按信息内容可划分为科技、政治与法律、商业与经济、文化教育、娱乐、保健等多种类型。还可以将网络信息资源分为稳定信息资源和不稳定信息资源,前者包括各种社会组织(政府、大学、研究机构、图书馆)所提供上网的各类机构信息、印刷型文献的数字化资源、网络期刊、联机数据库、图书馆OPAC目录等。其特点是比较稳定可靠、方便存取等,它是学术性信息的主要来源。不同类型的网站提供的信息资源内容也有很大差异。综合性网站的信息内容覆盖面较宽,专业性网站的信息内容较专业,侧重于某一门类、某一行业或专业。从内容形式看,网站提供的信息大多数为文字形式,图像、音频、视频等形式的信息资源数量较少。平均每个网站的图像文件数为4291个,其中,每个网页下图像文件数为6.4个。平均每个网站的音频文件数为5.0个,平均每个网站的视频文件数为0.3个。

根据中国互联网络信息中心发布的网络信息资源数量报告,我国现有在线数据库为45598个,已经拥有在线数据库的网站占全部网站的14%。从数据库记录的内容分布来看,在线数据库的主要服务内容为产品数据库,如粮油、医药、机械产品等数据库。在所拥有在线数据库的网站中,近60%是此类数据库,其他一些如科技信息数据库、报刊新闻数据库、政策法规数据库的占有比例大致在11~15%之间。从在线数据库的记录数量来看,产品数据库占有62.3%的记录,其次为企业名录数据库,记录数占18.6%,科技信息库、报刊新闻数据库记录占有比例不足3%。

我国互联网的发展存在着网络建设各自为政的问题。由于缺乏有力的统一领导的协调,使得各行业、各部门的网络建设各行其是,造成很多地区都出现了在同一区域内各个专用网络系统间互不相通、相互独立的局面。在网络信息资源内容上,资源开发分散、重复现象严重,浏览一下各个网站的资源目录就会发现,大多数站点都存在着设置的信息栏目贪多求全、提供的信息内容大同小异、信息质量参差不齐等问题。在线数据库中,科技信息数据库、报刊新闻数据库、政策法规数据库的比例偏低,三者之和不足15%,对国民经济和社会发展有重大影响的科技、经济等专业化信息资源数量偏少,没有形成规模。

根据中国互联网络信息中心对用户的调查,当问及网络信息中哪些还不能满足用户的需要时,回答中比例最大的依次为电子书籍;科技、教育信息;体育、音乐、艺术等休闲娱乐信息;新闻;法律、法规、政策信息。可见,重视网络信息资源的内容结构,调整、优化其内容构成不仅是网络本身发展的需要,也是用户的迫切需求。

综上所述,我国网络信息资源的分布已形成一定的态势和规模,但网络信息资源的分布不尽合理,网络信息资源在时间、地域上分布不平衡。在行业分布上,经济与科技等网络信息资源建设需要加强;内容上缺乏特色资源,信息资源质量有待提高。急待调整网络宏观结构,优化资源配置。探索网络信息资源的分布规律,研究网络信息资源的合理配置,是开发网络信息资源的迫切任务。

标签:;  ;  ;  ;  

中国网络信息资源的分布_网站数据库论文
下载Doc文档

猜你喜欢