域名分析的概念、原理、内容及应用研究_网络流量论文

域名分析的概念、原理、内容及应用研究_网络流量论文

域名分析法的研究——概念、原理、内容与应用,本文主要内容关键词为:分析法论文,原理论文,概念论文,域名论文,内容论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

[中图分类号]G350 [文献标识码]A [文章编号]1003-2797(2010)06-0072-08

域名作为网络时代的产物,对它的研究由来已久,几乎伴随了整个网络时代的发展,与域名相关的理论、技术方法、应用研究也很多。然而,在国内将域名分析方法作为一种独立的方法进行研究却很少,甚至关于域名分析方法的这种提法都不多见。但由于这方面的研究的日渐成熟,有必要吸纳域名分析法作为网络计量学的一种特征研究方法,并对其进行系统的研究。对域名分析法的系统研究,有利于形成网络计量学真正意义上的特征研究方法。我们认为,从网络计量学的角度出发,域名分析法应该包含网络日志、网络流量、网络引文等为主体的分析内容。1 域名分析法的概念

在国内,对域名分析方法进行的研究很少。因此,还没有出现针对域名分析法的统一的定义。近年来,我们承担了“网络计量学研究”、“网上学术信息的分布与变化规律研究及其应用”等一系列与网络计量学相关的基金项目的研究,已经对网络计量学基本理论,链接分析法、网络内容分析法、社会网络分析法等技术方法,三大定律以及应用研究做了深入的探索。因此也对网络日志、网络流量、网络引文的概念、分类、研究对象以及主要方法有了更加深刻的认识。在以上研究的基础上,我们对域名分析法作出如下定义:

域名分析方法是指在一定时间内,运用一定的定量研究方法对域名的用户广度、域名及其子域名下的资源规模、访问情况、网络影响力及技术因素等参数进行定量描述和统计分析,从而揭示出其中隐藏的客观规律,以便更好地进行研究与分析工作。

2 域名分析法的原理与基本流程

2.1 域名分析法的原理

域名分析法是针对域名以及与域名相关的一系列事件而展开的分析方法,因此,域名的分析方法的基本原理是:

首先,确定以网络服务器中的网络日志、网络数据流量以及学术论文后面所附的、其来源出处是因特网资源的网络引文为中心的研究分析对象;其次,对所选取的对象进行数据的初步整理,主要工作是选取适合进一步分析的规范化数据,保证下一步分析处理结果的准确度和可信度;接着运用统计分析、聚类、分类、关联规则、序列模式识别等方法对上一步经过预处理的数据进行分析;最后,分析挖掘得到的规则和模式,提取有意义的、感兴趣的规则和模式作为分析结果。

2.2 域名分析法的基本流程

为有效地运用域名分析法进行分析研究工作,我们把域名分析方法的基本操作流程定义为如下几个步骤:

(1)选取分析对象。分析对象通常是由分析、研究的目的而确定的[1]。如果我们是在网站建成后,为了了解网站的运行情况、发现网站存在的不足或者检测网络设备的工作状态,通常就会选取网络流量作为研究对象;而如果我们是要了解网站中各页面的访问情况,根据各页面的点击率来改善网页的内容和质量、提高内容的可读性,通常的做法是选取网络服务器的日志文件作为分析和统计的对象。

(2)预处理阶段。该阶段的主要工作是从选取的对象中获取规范化的数据,为进一步分析做好准备。原始数据往往是无序的,而且存在许多与计量没有关系的数据,它们的存在会干扰分析的过程、影响分析的结果。因此,为了保证分析处理结果的准确度和可信度,完全有必要对原始数据进行识别和净化处理。

(3)统计分析。在上一步获取的数据的基础上,根据研究的目的,运用数学的、统计的、计算机软件等各种有效的分析方法,从各种指标或其他不同的角度进行分析。

(4)作出结论。根据分析的数据,作出相应的结论。在域名分析法的基本步骤中,统计分析是最关键的一环。其中要用到各种定量的和定性的分析研究方法,也是最容易出现错误或者导致整个过程中断的环节。然而,我们无论采用哪种类型的分析方法,都必须在占有翔实、可靠、准确的数据的基础上进行。因此,预处理阶段是统计分析的前提。在进行统计分析之前,搜集数据时,首先必须选准统计对象,这也使得预处理阶段变得至关重要。从某种程度上说,它直接决定了整个分析过程的成败。

3 域名分析法的内容

虽然我们对域名分析法的定义侧重于从域名出发进行定义,但当论及域名分析法的内容,应该从域名分析的过程进行。而且在网络这样的大环境下,域名分析方法不应该仅仅局限于对单一域名的分析研究,而应该从宏观层次上去认识域名分析法。因此,我们认为,域名分析方法的内容包括网络使用记录即网络日志的分析内容、网络流量分析的内容和网络引文分析的内容。为进一步说明域名分析法,接下来我们将对域名分析法进行详细阐述。

3.1 网络日志分析及其主要方法

3.1.1 网络日志分析的研究对象

网络日志分析的研究对象比较众多,但是最主要是集中以下几个方面:

(1)Web服务器日志。Web服务器中的日志文件记录了用户访问站点的数据,它是由一条条的记录组成,一般情况下一条记录就记录了用户对Web的一次访问。不同Web服务器产品的日志记录格式不同,但一般都包括访问者的IP地址、访问时间、访问方式(GET-POST)、被请求文件的URL、HTTP版本号、返回码、传输字节数、访问的页面、协议、错误代码等。每当站点被访问一次,Web日志就在数据库中增加相应的记录[2]。

服务器日志有两种格式存储,一种是普通日志文件格式,另一种是扩展日志文件格式。如果能够从这个文件中存储的一些项目语法上的分析,如DNS,就可以知道用户来源的区域。例如,域名edu被分析后可以知道用户来自于教育部门,通过数据挖掘分析,就知道了某一服务的用户多数是来自于教育部门,就可以根据此信息调整服务策略。扩展日志文件格式主要是支持关于日志文件元信息的指令,如版本号,会话监控开始和结束的是日期,被记录的域等。

(2)注册信息。用户注册信息是指用户通过Web页在屏幕上输入的、提交给服务器的相关信息。它具有信息比较全面、具体、客观等特点,在网络服务活动中起着非常重要的作用,特别是在安全方面或者对用户可访问信息的限制方面具有一定的意义。在Web的数据挖掘中,用户登记信息可以和访问日志结合起来,以提高数据挖掘的准确度,从而能进一步了解用户的特点。

(3)曲奇(Cookie)数据记录。Cookie是一种软件构件,它能够在用户端存储用户访问服务器的信息,服务器软件上存储关于Cookie的记录,就是Cookielogs,一般格式是:“name,expiry-date,path,domain,security-level”。Cookie机制提供了解用户的需求,服务器利用Cookie能够跟踪用户的活动。特别是网络文献服务网站,一切方便用户是其追求的目标,而Cookie为分析挖掘提供了很好的工具。

3.1.2 网络日志分析的主要方法

网络用户使用记录的分析主要任务是从数据中发现模式,是关于用户行为及潜在用户信息的知识发现。通常实现方法是对Web服务器日志和Cookie等日志文件进行分析,发现用户访问行为频度和内容等信息,从而找出一定的模式和规则。主要包括关联规则、序列模式、网页聚类、频繁遍历路径等[2]。

(1)统计分析。对网页的访问种类、时间、不同种类的统计(频率、均值、中值)分析,有助于改进系统性能、增强系统的安全性,便于网页的修改并能够提供决策支持。通过对日志访问频率分析,可以在一定程度上发现用户感兴趣的热点问题。

(2)路径分析。路径分析可以用于确定在一个Web站点中最频繁访问的路径。

(3)关联分析。关联规则的发现可以用来找出某次服务器会话中最经常出现的相关网页。在网络信息服务中关联规则的发现也就是要找到用户对网站上各种文献之间访问的相互联系,这些文献之间可能存在或可能不存在直接的联系。

(4)序列模式。序列模式的分析就是在时间戳有序的事务集中,找到那些“一些项跟随另一个项”的内部事务模式。找出会话间的模式,利用会话间的时间排序,预测未来的访问模式,可以用进行趋势分析、转折点检测和相似分析等。

(5)分类规则分析。分类发现就是给出识别一个特殊群体的公共属性的描述,可以分析某些共同的特性。这个特性可以用来分类新的项。

(6)聚类分析。聚类分析可以从Web访问信息数据中聚集出具有相似特性的某些用户。具有相似模式的用户组成的用户群体,便于提供个性化服务。

3.2 网络流量分析

3.2.1 网络流量的分类

为了进行网络流量分析,有必要对网络流量作出如下分类:

(1)节点端口流量。网络节点端口流量指的是网络节点设备端口流入和流出的数据包的信息统计。它包括数据包的个数、字节数、包大小分布、丢包数等非常多的统计信息。监视节点端口流量的典型工具是MRTG(Multi Router Traffic Grapher),另外,许多厂商的网管工具也提供这些功能,如HP公司的即Enview平台,Agilent公司的Firehunter等。MRTG的功能单一,它使用SNMP协议访问网络节点获取MIB信息(包括网络节点端口流量),然后通过用Web方式输出结果。MRTG是一个非常实用的免费软件,在各个运营商的网管中心都作为最常用的网络监视工具来使用。其他类型的网管工具,如以上提到的用来监视网络节点端口流量。因此,当需要监视或分析更多的网络性能参数时,可以考虑用这些工具的强大分析功能与MRTG结合一起使用。

(2)端到端的IP流量。端到端的IP流量指的是在网络层从一个源到一个目的IP包的统计信息,通过对它的分析,可以了解到网络中的用户都访问了哪些目的网络,是网络分析、规划、设计和优化的重要依据。采集端到端IP流量的典型工具包括Sniffer、Netflow、EtherPeek和流量探针等,根据其不同的特点,它们分别适用于不同范围的流量采集。

(3)业务层流量。业务层流量除了包含端到端IP流量的信息之外,还包含了第四层(TCP层)的端口信息。显而易见,它包含了应用服务的种类信息,利用这些信息可以做更详细的分析。Sniffer、EtherPeek、Netflow和流量探针等工具也实现了这个层次的流量信息采集。

(4)完整的用户业务数据流量。完整的用户业务流量对于安全、性能等方面的分析非常有效。例如,捕获黑客的来访数据包可以制止某些犯罪行为或得到重要的证据;由于捕获完整的用户业务数据需要超强的硬盘存储速度和容量,因此利用Sniffer和流量探针等都只能实现短时间内数据包的捕获和跟踪。某些软件如Niksun公司NetDetector产品能提供长时间的完整的用户业务流量采集[4]。

3.2.2 网络流量分析的基本内容

网站流量分析除了流量数据的收集和统计,更多的是对网站流量指标的科学分析,不同的人员从中获得的有效信息大不一样,这需要专业分析人员数据进行深度挖掘,研究不同指标对网络价值的贡献,找出影响网站运营的因素。这些并不是一个综合的定量指标能够计算出来的,因此网站流量分析应当采用定量与定性分析相结合的办法。

(1)网络流量流向分析。流量流向分析通常部署在网络的各个接入点,如城域网/IDO接入点、其他网络接入点,从而可以对所有接入网络中的流量进行分析。网络流量流向分析对网络优化具有极其重要的作用,通过流量流向分析,使网管人员可以快速地对网络隐患进行分析处理,优化网络结构。

流量流向分析及应用是在近年发展起来的一项网络分析技术,目前使用到的分析方法种类较少,本文在流量流向分析方面进行了简单的端口流量统计分析,为网络架构优化提供依据。随着流量流向分析技术的发展,相信将会有更多的分析方法涌现,使流量流向分析能在网络维护中起到更大的作用。

(2)网络流量特征分析及流量协议分析。通过MRTG流量监控软件,可以找出一个时间段内的网络流量分布规律,比如白天的流量从早上8:30开始持续走高,到12点左右达到一个比较高的水平;从晚上十点以后开始回落,在凌晨两点到早上八点之间行成一个波谷。在十一点到二十二点的高峰期中流量起伏比较大,有两个明显的波峰,分别在十一点到十四点和十九点到二十二点之间等。通过RAM监控软件可以按用户流量大小提供一个1~100之内的用户排名。了解现在的网络中那些协议占据了多大的网络带宽比例等。

通过Etherpeek协议分析软件可以提供给我们一个网络端口流量中各协议和各协议端口的比例,流量包的大小等。

有了这些数据和规律信息,我们就可以制定一个网络流量的应用规划,比如BT、eMule等P2P协议软件什么时间开放,445、1433-434等协议端口需不需要打开,哪些IP地址流量过大需要限速等,制定一个符合自己网络的详细规划,合理利用有限的网络资源。

(3)异常流量检测分析。该方法是通过记录一段时间内的网络正常流量数据,建立对应的数学模型,检测或者预测网络异常流量的发生,提醒网络管理人员及时处理。一般来说,通常的流量检测分析是通过设定阀值来实现的。例如,当以太网中每秒内的非单播包数超过一个特定数目时,就发出广播风暴的警报,可能在屏幕上显示用红颜色表示的消息,提醒网络管理人员采取恢复措施。这样可以为网管人员提供早期预警信息,从而有更多的时间来分析问题和采取措施,如果能够建立一个恰当的网络流量模型对将要发生的网络流量进行预测,则可以直接避免网络问题的发生,保证网络服务不受影响或者减轻影响的程度,为用户提供更好的服务[4]。

3.3 网络引文分析

随着计算机网络技术的发展和互联网的深入普及应用,网络成为科学研究获取、交流信息的重要渠道与载体。对网上信息资源的利用与分布规律的研究无疑具有重要意义。网络引文又称网络(电子)参考文献,Web引文,是指学术论文后面所附的、其来源出处是因特网资源的参考文献,实际上是用作引文的网络信息资源,其突出特征是参考文献著录内容中含有网址(URL)。它是网络资源应用于学术研究的最直接表现,是学科专家对网上学术资源的一种变相的同行评议,说明了对网络资源学术价值的认可,反映学者们利用网络信息的情况,与访谈和问卷调查等方式相比,它具有客观、实用与针对性[5-6]。目前网络引文研究内容主要分为网络引文的使用(是否可以使用、怎样进行使用)和网络引文分析(引文分布分析、可获得性分析、影响与应用分析)两方面[7]。

3.3.1 网络引文分布分析

对网络引文的分布分析研究的角度有很多,如时间、地域、期刊等。研究较多的是网络引文的数量分布分析和域名分布分析。

(1)网络引文数量分布分析。网络引文数量分布分析是网络引文分析的重要内容,最初网络引文分析也是对数量进行统计分析开始的。国内外的很多学者都很热衷于对网络引文的数量进行研究,在网络流行之前,网络引文可以说是很少的,随着网络时代的演进,网络引文量呈现一种几何级数的递增趋势,通过网络引文量的分析,不仅可以准确的得到每一年的网络引文量,还可以透过数字分析揭示网络引文的演化规律和分布规律。

不同学科对待网络引文的态度是不同的,有研究表明,信息学科由于本身的特点决定了它们的研究者对网络资源利用的绝对优势,并且他们对待网络引文的态度也是积极的,网络引文在信息科学的论文中的分布明显比其他学科广泛得多,这也说明学者们对网络资源的利用意识、学者们吸收信息的能力与网络资源的利用有着直接的关系。网络引文在不同学科、不同作者的分布也是网络引文数量的分布分析的重要内容。

(2)网络引文的域名分布分析。如果我们通过网络引文分析就不难看出,有4个顶级域名(gov、org、com、edu)是经常在网络引文中出现的。事实上,不同的用户对网络信息资源的需求也不同,比如说,对学术界而言,有关科研、教育等学术性信息最重要。因此,学术界用户最看重的是edu、org、gov三个网站的信息。而将中英文核心期刊网络引文域名引用的情况进行对照可以发现,英文期刊网络引文地址的域名对org网站的信息引用得最多。而对中文期刊来说,引用得最多的是com网站的信息,而后依次是org、edu、gov类网站的信息[8]。以上信息都可以通过域名分布分析来获取,这也构成了网络引文的域名分布分析的基本内容。

3.3.2 网络引文可获得性分析

网络引文可获得性(Availability)是一个较广的概念,包括持久性(Permanence)、稳定性(Stability)、持续性(Persistent)、可获取性(Accessibility)、重现性(repeatability)、可追溯性(Traceability)等概念[9],指对于学术论文的网络引文,根据引证文献的标注,经过不同的方法与途径,通过引文中的网址或其他信息可以真实、免费、可靠、快捷地得到其参考文献内容。

与传统引文相比,网络引文的可获得性存在许多缺陷。传统文献比较稳定,引用也发展得比较成熟。网络资源则可以很容易地被编辑或替换,有的甚至题名没变,但内容已经改变,而发现这些变化有时是很困难的。另外,图书馆、档案馆等部门获取和存档传统文献己有数百年的历史,几乎可以找到所有已出版的书刊,保证了引文的回溯检索。而网络文献却得不到这种保证,尤其网络文献本身不具有稳定性,而且还缺乏科学统一的著录格式和权威的检索工具。另一方面,网络引文也有纸质引文所不具备的优点,如果使用得当,其可获得性将比纸质文献更好、更快捷、更便利。根据以往的研究,网络引文的可获得性现状为:

(1)网络引文分布的广泛性。网络已经深入影响着人类生活和工作的各个方面,使存在了几百年的传统科学研究和学术交流方式发生了巨大变革,学术论文越来越多地引用网络资源。E.Evangelu对全世界最顶尖的Science、Nature、Cell等六种期刊调查表明:4.7%~9.6%的论文使用了在线的补充材料[10]。Susan Davis Herring在2002年的一项网络引文研究中,共统计了175篇文章,发现有97篇文章引用了网络文献,其比例高达55.4%[11]。在国内,我们利用《中国期刊全文数据库》进行统计发现,图书情报和计算机软件及应用两学科中引用网络资源的论文在2007年分别达到15.17%和11.57%[12]。

(2)网络引文可获得性水平低。从以往的调查研究来看,网络引文的可获得性处在较低水平,有的引文甚至在论文发表之前就已经不可获得了。Dellavalle以Science等三种杂志在2000~2003年所载的1000篇论文为样本,发现仅仅27个月之后,就有13%的网络引文打不开了,而能打开的网页中有许多已经改变,即并不是原先作者所看到的网页了[13]。Mary Rumsey认为网络引文“就像远去的火车,一去不复返”,他利用JLR(Journals and Law Reviews)数据库对法律领域的论文进行统计,发现在经过4年后,仅仅30%的引文可打开[14]。Germai以随机抽样方式选取1995~1997年间出版的多个学科的期刊论文31篇(包含64条网络引文),实验历时三年(1997~1999),网络引文的可获取性每年下降11%左右,三年后近一半的引文不可获取[15]。Spinellis验证了两种计算机领域的期刊,出版于1995年到1999年的论文中有4224条网络引文,四年后近50%的网络引文不可追溯[16]。在国内,杜云祥以3种图书情报期刊为例,对网络引文著录格式进行了统计和验证,表明能查到原文的网络引文仅占15.8%,且著录格式混乱,存在明显不足[17]。吴志强以《软件学报》和《中国图书馆学报》1999~2003年所刊登学术论文中的网络引文为对象,考察了网络引文的可追溯性问题,得出以下结论:每年可追溯率递减约9%~10%,发表7年后可追溯率接近于零[18]。安美荣从国内有代表性的六种图书情报学期刊中抽取300篇网络引文,通过验证,最终仅可以找到184篇,所占比例为61.3%[19]。

4 域名分析法的应用

域名分析法具有很广的应用范围,域名分析法的应用主要是由它的研究内容所决定的。例如,通过网络日志分析对用户访问留下的网络使用记录进行Web的数据分析,提取有关的用户行为特征,对用户的访问行为、频度、内容等进行分析,可以得到关于群体用户行为方式的认识。网络使用记录的计量分析是将数据分析的技术应用于网络使用记录文件的分析中,以发现用户的浏览模式、分析站点的使用情况。它可用于协助管理者优化站点结构、提高站点效率,构造合理的Web服务器,提高用户服务的有效性。可进一步做到:①为网络服务提供有效的决策依据;②增加个性化服务;③发现潜在的用户;④用户群体分析和聚类;⑤改进站点的设计;⑥发现网络信息的传播交流规律。

通过网络流量分析,域名分析法就可以具体运用于:

(1)评判网站的价值。互联网上有一种核心理论:互联网经济是注意力经济,网站受瞩目程度是衡量网站价值的核心原则[20]。

(2)优化网络资源。网络流量流向分析技术通过对网络中承载的流量进行分析,从而获得各种分析数据的流向情况等相关数据,为及时优化调整网络架构,处理异常流量提供参考;通过网络流量流向统计信息分析,找出网络瓶颈所在并及时优化调整网络架构。

(3)监控网站本身与经营业务的相关性。通过网络流量分析,观察网站长期流量变化趋势,可以分析得到网站内容与其经营业务的相关性。通过观察网站流量的曲线图,可以观察从3个月到长达2年的变化情况,从而了解网站的稳定性,判断有无异常上升下降情形。

(4)发现黑客攻击,网络病毒防护。现在随着网络不断扩大,网络中也经常会出现黑客攻击、病毒泛滥的情况。而这些网络突发事件从设备和网管的角度看却很难发现问题,经常也让网络管理员感到棘手。病毒突发必然导致异常流量增大,各种协议比例会有较大的突变,通过日常监控,可以非常方便地发现病毒的协议端口号等信息,有利于及时发现、及时处理[21]。

另外,运用域名分析法我们还可以进行:

(1)学术水平的测度。随着因特网的发展,网络信息资源因其传递速度快、传播范围广等特点而被广泛引用,成为引文中的一大亮点。2003年,有关研究者对1994年到2002年,图书馆学、情报学领域的论文做过统计分析,发现它们对网络信息资源的引用呈现几何级数的递增趋势[22]。研究结果还表明,对网络文献引用量最大的论文作者中,几乎无一例外都是图书馆领域的知名学者,其中排名前六名的论文作者中就有三位是武汉大学信息管理学院的教授、博士生导师,而武汉大学信息管理学院在图书学、情报学的教学、研究中一直处于国内的领先地位。另外,网络引文量较大的作者也大都是该领域内的教学、科研的学术带头人和年轻有为的硕士生、博士生。由此看来,用网络引文量来作为学术水平的一种测度方式是可行的。

(2)评价核心期刊。目前国内普遍公认的核心期刊评价工具是《中文核心期刊要目总览(2000年版)》,采用多指标综合加权方法确定学科核心期刊。设计了6项评价指标:被索量、被摘量、被引量、载文量、被摘率、影响因子。其中被引量指标所占权重较大[23]。由于《总览》中被引量指标在核心期刊评价指标体系中所占的权值最大,说明被引量指标在该体系中占有很重要的地位,它与核心期刊的评价结果有着密切的联系。随着网络引文占引文总量的比重加大,网络引文绝对数量迅速增加,已经成为一支不可忽视的力量。因此,通过网络引文分析,充分考虑网络引文对评价结果的影响作用,将网络引文纳入到核心期刊的评价指标中是合情合理的做法。

(3)了解科研人员对网络学术资源的利用效率。在1996年Stephen P.Harter等系统地研究了电子资源对学术交流的影响。主要从电子期刊中发表的论文对电子文献引用的统计分析中进行,结果表明当时的电于文献对学术交流的作用微乎其微[24]。1998年YinZhang研究了网络资源对图书情报学领域学术交流的影响,发现影响仍较小,但这种影响逐渐正在加强[25-26]。此外,她还发现电子期刊比印刷型期刊更多地引用了网络文献。2002年Susan Davis Herring通过引文分析研究了在学术电子期刊中利用网络资源的状况,发现电子资源对现代学者的影响越来越大,同时电子资源促进了学者发现和利用以前不可用资源的能力,加强了资源共享[11]。

我国的学者也对网络引文进行了深入的研究。2004年山西大学信息管理系的张翠英等以我国图书馆学、情报学的7种核心期刊作为研究样本,对1998~2002年所发表的学术论文的参考文献和网络引文进行统计、归纳、分析,发现网络引文/引文总量只有9.6%,含有网络引文的论文数/总论文数只有15.7%[27]。河南师范大学图书馆的王恺荣等以国内5种情报学核心期刊2002~2003年的载文为样本,发现网络引文占当年引文总量的20.59%[28]。南京大学信息管理系宋歌对图书情报学期刊网络资源利用状况探析以及我国各学科学术期刊网络资源利用状况探析,含网络引文的论文量占总论文量的百分比为13.15%[29]。

(4)揭示对网络学术资源利用的发展趋势。对于印刷型引文来说,引文来源是指引文所在的期刊来源。而网络引文大多列出了其来源网址。因此对其来源网址及其所属类型的研究有助于我们了解科研人员对各类型网络学术资源的利用效率。为开发和利用网络学术资源提供科学依据。从组织机构方面,对网络引文提供的网址的最高层域名进行分析,有助于了解图书情报界学者吸收利用网络文献的主要来源。

科研人员在利用网络学术资源时,表现出很强的选择性。对网络学术资源的参考引用主要来源于一些信誉较高的教育网站或可信度很高的政府网站以及一些科研机构的学术网站。同时,对网络学术资源的吸收、利用呈多元化、多来源、多途径的发展变化趋势。

5 结语

网络计量学方法是联系网络计量学理论与实际应用的桥梁,它对网络计量学学科建设具有重大意义。注重方法的研究,将网络计量学方法的研究上升为理论高度并建立网络计量学方法论体系,必将对网络计量学的发展产生积极的推动作用。另外可以看到,随着网络技术的日新月异的发展,网络计量学的研究对象将更加细化,研究方法更加多样化,研究的结果也更具现实的指导意义和实用价值。

(收稿日期:2010-08-15)

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

域名分析的概念、原理、内容及应用研究_网络流量论文
下载Doc文档

猜你喜欢