Internet科技信息资源门户网站(STIP)系统的实践研究

Internet科技信息资源门户网站(STIP)系统的实践研究

张智雄[1]2000年在《Internet科技信息资源门户网站(STIP)系统的实践研究》文中进行了进一步梳理Internet是全球最大而且还在迅速增长的信息资源库,有效地组织和开发Internet信息资源,促进Internet信息资源的利用,对于文献情报机构有着重要的意义。本文将“门户网站”的概念引入文献情报领域,提出了开发“Internet科技信息资源门户网站(简称科技信息门户,Science&Technology InformationPortal,STIP)”的构想,并利用门户网站这种信息搜索、加工、组织和服务的新模式,来推动文献情报机构参与Internet上科技信息资源的开发利用,拓展和增强文献情报机构的服务功能。 在研究和分析了Internet上的数据标记技术、搜索引擎技术、自动文摘及自动分类技术、信息检索技术、以及信息发布技术的基础之上,结合中国科学院知识创新工程的需要,按照软件工程的原理,设计了针对科学技术领域的垂直门户网站系统:STIP。该研究项目已完成了其中几个主要子系统:(1)实现了集Web页面搜索、内容分析和metadata抽取三个功能于一体的网络机器人:STRobot;(2)开发了辅助人工进行Internet信息收集的工具:STBrowser;(3)开发了面向Internet用户的Web信息服务网站:STPortal,通过它提供信息检索、信息导航、专题报导、科技新闻、个性化服务、科技论坛、点击排行、网站提交等服务;(4)借助镜像工具,开发了镜像系统:STMirror,并通过Web提供全文检索服务。 在系统的设计和实践过程中,该论文对一些领域作了创新性尝试,如:将系统建构在先进的Microsoft数字神经结构之上,充分利用其组件技术来开发STIP系统:利用Java技术,研制了多线程搜索算法和精悍的内容分析器;利用数据库系统的特性,开发了逻辑组配检索、加权检索和自然语言检索等多种检索方式;充分利用了“推送”技术,实现了真正的个性化动态频道推送服务。经过此课题的研究,初步形成了一套创建垂直门户网站系统的解决方案,拥有了一批自主版权的,可用于搜集、加工、整理、和发布Internet信息资源的核心技术,为中科院文献情报系统参与Internet信息资源的开发,打下了良好的基础。

胡明玲[2]2005年在《质量受控学科信息门户在数字图书馆中的应用研究》文中进行了进一步梳理图书馆一直视对印刷型文献的整理、利用和开发为己任。随着电子文献和网络信息的凸现,人们渴求由非商业性质的机构提供科研、教学等公益性质的网络信息资源服务,这样,社会又将对网络信息资源的揭示和开发的责任摆在了图书馆面前。作为一种全新的数字图书馆实践的信息组织和服务模式——质量受控学科信息门户(Quality-controlled Subject Information Gateway以下简称QSIG),既将IT领域最为成功的网络信息服务模式——门户与图书情报领域对信息整序的长处充分结合,又解决了当前数字图书馆实践的矛盾,使QSIG成为数字图书馆实践的一个重要体现。由于数字图书馆本身既是网络中的重要资源节点,又是用户利用网络信息资源的重要门户,因而,我们有必要将QSIG建设纳入到数字图书馆建设中来,使之成为数字图书馆建设的一个重要方面,进一步丰富数字图书馆的理论和实践。 本文在分析QSIG研究现状和在数字图书馆开发中的意义的基础上,系统地论述了QSIG及其相关概念,并对QSIG质量受控体系的信息资源选择规范、搜索策略、评价标准、类型词汇表、组织体系、标引规范、管理规范等进行了分析和研究,为QSIG的实践提供了理论依据。随后针对QSIG实际应用中所涉及的学科(或主题)范围和服务范围、学科(或主题)分类体系、信息资源发展政策、技术方案、元数据框架、互操作、管理、附加服务、商业模式等几个重要方面进行了分析和研究,并给出了一些在具体应用中的建议。 作者结合QSIG质量受控体系和在数字图书馆中的应用要求,充分吸收信息服务的新理论和先进技术,融入数字图书馆建设理念,分析和研究了QSIG管理软件——QSIGsystem的设计和实现。文中详细地分析了QSIGsystem的设计思路、数据库设计、各模块的功能与实现等方面的内容,并着重针对QSIGsystem在单个学科信息门户和数字图书馆门户体系中的应用实践进行了研究,为QSIG在数字图书馆中的应用提供了直接的实践经验和可以借鉴的模式。论文最后比较分析了开放目录和QSIG的工作模式和特点,提出基于开放目录的QSIG是QSIG的发展趋势,并就构建基于开放目录的QSIG的几个关键方面提出了具体的解决方案。

佚名[3]2000年在《博士学位研究生论文文摘》文中研究表明Internet科技信息资源门户网站 (STIP)系统的实践研究 张智雄 导师 :沈英研究员 (中国科学院文献情报中心 ) 论文将“门户网站”的概念引入文献情报领域 ,提出了开发“ Internet科技信息资源门户网站 (简称科技信息门户 ,Scienc

陈定权[4]2003年在《自动主题搜索的应用研究》文中研究指明随着互联网上信息量爆炸性地增长,如何高效、低成本地利用Web信息资源就逐渐成为信息服务机构和最终信息用户所关注的问题。本论文研究目的就是希望通过对主题搜索的应用进行研究,探索Web主题资源的建设方法。Web主题资源自动搜索技术可以充分利用Web上大量的免费资源,自动地搜集Web主题资源,摆脱对专家的依赖,降低建设成本,提高Web主题资源建设的速度、效率和质量。 本论文的研究工作主要包含以下四个方面: (1)研究了主题搜索的基本理论和Web主题资源的建设模式,探讨Web主题资源自动搜索的相关技术,为自动主题搜索提供一个可行的研究方案,设计出一个Web主题资源自动建设的功能框架; (2)分析和实现了一个新型的多模式字符串匹配算法。该算法是以确定性有限状态自动机(DFSA)为基础,结合Quick Search算法而提出的,可以用来提高主题爬行器的网页分析和Web网页分类器的速度。经改造之后,状态自动机所占用的内存不到标准DFSA占用内存的一半,提高了多模式字符串匹配算法的性能。 (3)从社会学、文献计量学和计算机科学等角度分析了Web超链相关知识,并在经典的HITS算法基础上,设计并实现了一个Web主题资源的自动发现技术。另外,利用文献同引和文献耦合的思想,实现了查找相关网页的功能,并与Google和Alexa提供的类似功能进行比较,分析它们在查找相关网页方面的性能。 (4)分析和设计了一个合作式主题爬行器。本论文所设计的合作式主题爬行器,利用了Web超链信息和隧道技术,可以有效地提高主题资源的覆盖度和主题的准确度,在一定程度上克服了一般爬行器的固有缺陷,使得爬行网页的主题覆盖度和主题准确度不再完全依赖于种子站点的数量和质量。合作式主题爬行器适合搜索某个学科且主题宽泛的Web学术性资源。 在研究过程中,笔者采用了文献调查法、分解与合成法和实验法等研究方法,对自动主题搜索的应用方面进行了综合性研究。通过研究,本论文从理论和实践上证明了在目前的技术条件下,Web主题资源建设的自动化是可行的也是有效的,可以为数字图书馆的Web主题资源建设提供方法和技术上的支持。 本论文共包括图60幅,表10个。

曾德宏[5]2017年在《EP研究院IT运维管理流程优化》文中研究指明随着信息技术的发展,越来越多的科研院所步入信息时代。信息技术为科学研究带来了机遇与便利,科研人员可以很方便地从互联网上获取最新的科学技术知识,同时财务、设备、材料等方面也实现了自动化管理。但另一方面,各类软硬件系统功能的丰富也使整个IT系统变得越来越复杂,这给IT运维管理人员的工作带来很大的挑战。EP研究院信息中心作为该研究院下属单位,主要业务是面向全院提供各类信息资源、信息产品和信息服务。由于工作流程设置不合理,导致目前IT运维管理工作中存在着不少问题,例如:运维工作缺乏有效记录,相关软硬件配置信息获取很不方便;运维过程缺乏有效监管,操作普遍存在随意性;运维管理经验的共享和沉淀没有有效途径。上述一系列问题导致了两个严重的负面影响:一是STIP网用户对网站服务满意度低,二是业务部门对IT系统故障处理低效率不满。本文以流程优化的理论与方法为基础,以ITIL基础框架为参照,对EP研究院信息中心IT运维管理业务流程进行流程诊断、流程优化研究。首先,介绍了流程优化、流程诊断及优化工具等相关理论,并对IT运维管理、IT服务管理和ITIL等的发展和内容进行阐述,为论文的撰写打下了坚实的理论基础。其次,对EP研究院信息中心的主要业务和IT运维管理流程的现状进行梳理与分析,运用关键成功因素法确定了事故管理、数据管理、问题管理三个关键流程作为优化对象,并运用帕累托分析法、因果分析法对三个关键流程进行诊断与分析。最后,运用ECRS分析法对原流程不足之处进行优化,形成了IT运维管理流程优化方案。本文提出的改进方法可为各类机构的信息部门IT运维管理业务流程优化提供参考。

朱金涛[6]2007年在《基于超链接搜索策略网络爬行器的设计与实现》文中认为近些年互联网上信息的快速增长使得从互联网上有效的发现并收集信息资源变得尤为重要。网络爬行器是一个用来从网络上寻找并保存网页的程序。宽度优先搜索策略是网络爬行器常用策略之一,但是普通宽度优先搜索策略常常对所有的网页都采取一视同仁的态度,这样爬行的结果就导致了它所爬行回来的网页质量不高。本文对宽度优先搜索策略进行了深入的研究,介绍了一种新型的宽度优先搜索策略——基于超链接信息的搜索策略,通过对内部与外部链接类型的区分,定义了一种新的衡量网页重要性的方法,改进了基于超链接信息的搜索策略,提高爬行器得到的网页质量;最后设计一个了基于这种策略的网络爬行器系统,并在实现中采用如下技术:通过自定义的HTTP类与Web服务器进行通信;根据要爬行网页的数目多少动态决定线程池的大小,节省系统资源。

孙雷[7]2006年在《面向特定领域的智能搜索技术研究》文中提出Internet已经成为目前世界上最大的信息资源库,但是网上信息资源纷繁芜杂,如何满足人们快速、准确而全面获取信息的要求,己经成为摆在人们面前的一大难题。搜索引擎的出现可以帮助用户在网络上方便地查找到自己需要的信息。但是随着互联网上面向特定领域“专、精、深”的主题网站和网页不断增多,普通的商用搜索引擎越来越难以满足用户专业化、个性化的信息需求。在这种背景下,面向特定领域的智能搜索技术成为信息处理领域近年十分活跃的研究热点。本文首先对比介绍了通用搜索引擎与领域主题搜索引擎在系统架构、工作原理、关键技术等方面的异同,分析了领域主题搜索技术的研究现状和发展方向。随后,研究了本体的相关技术在网站主题分类中的应用,给出了一种基于本体的站点信息模型,重点研究了两方面内容,包括:网站主题领域本体的构造和站点信息模型的组成及构建,并分析了将此模型应用到主题搜索中的重要意义。接下来,研究了主题爬行器的搜索启发策略,对比分析了几种典型搜索算法;在此研究的基础上,采用改进的HITS算法,设计了一个面向特定领域的多主题联合式爬行器,并简要介绍了软件编程接口的实现。最后,在以上研究内容的基础上,设计了一个应用站点信息模型和领域主题爬行器的智能搜索引擎原型系统,通过几个典型实验,验证了该原型系统在查全率、查准率、用户满意度等评价指标上均达到了较高水平。

黄林英[8]2007年在《学科信息门户的功能探析》文中指出网络信息海量化无序化的增长导致用户难以快速准确地获取所需要的信息和服务,加上用户对专业信息需求的日益提高和各种网络信息组织模式在专业信息的研究、搜集、组织和开发上的滞后,学科信息门户应运而生并引起了人们的广泛关注,成为网络信息的深层组织模式。当前我国的学科信息门户建设处于初步发展的上升阶段,学科信息门户在学界尚属比较新的研究领域。深刻理解学科信息门户的内涵和特点,了解国内外学科信息门户的发展状况,有助于全面地探讨并归纳学科信息门户的功能。通过对国内外部分学科信息门户的功能情况的比较分析,把握学科信息门户用户的真实需求和功能期望,便于我们认识到学科信息门户建设存在的不足并借鉴成功经验,从而为用户提供更强大的功能和更优质的服务,本文的主旨就在于此。本文首先对学科信息门户的有关概念、特点及类型进行界定和理解,结合当前国内外学科信息门户的发展现状,将学科信息门户的功能分建设层和服务层进行全面地归纳并阐述。在此基础上,对当前国内外部分学科信息门户的功能情况做了调研并进行比较分析。然后从用户角度出发通过问卷调查和访谈的形式了解用户的真实需求及对学科信息门户的功能期望,从而提出一个具简明层次结构的功能框架并作出相应的论述。最后,针对我国学科信息门户的功能不足,提出了功能强化对策,并展望了学科信息门户的发展前景和趋势。论文的创新之处在于对学科信息门户的功能进行较为全面地梳理,同时结合国内外学科信息门户的实际情况进行比较分析,对用户需求展开深入地调查,从而提出一个较为简明的功能框架,更清晰地认识到当前国内学科信息门户的功能不足并提出强化对策。学科信息门户的前景光明,发展趋势乐观。研究学科信息门户的功能对当前我国学科信息门户的发展有着重大的现实意义,对网络信息资源组织研究的不断深入起着重要的作用。

刘竟[9]2008年在《面向概念检索的农史信息门户的设计与构建》文中指出近几年,农史领域又出现了一种新型的研究资料,即农史网络信息资源,诸如数字化的农业古籍、农史论文题录库和全文库、农史研究网页/网站、数字博物馆中的图像视频文件等。网络中,多种类型的农史电子信息资源迅速激增,逐渐受到农史科研人员、教师、学生及爱好者的重视。为了解决农史网络信息资源散乱、无序的问题,本文拟采用图书馆学、情报学信息组织的理论和方法,对农史学科信息门户的设计和构建进行研究。农史学科信息门户的工作流程,包括资源采集、资源加工和提供服务三个部分。因此,本文沿着这一流程,对农史学科信息门户的设计和构建进行了研究和论述。首先,对国内外学科信息门户的研究及建设现状进行了介绍,对比分析了国内外著名学科信息门户的差距,并对我国学科信息门户的改进提出了建议,为农史学科信息门户的完善和构建提供了借鉴;其后,对农史学科信息门户的资源采集、资源加工过程中的资源描述和组织机制分别进行了研究;同时,为了克服普通搜索引擎基于关键词字面检索准确率低的问题,实现农史网页的概念检索,对农史门户网页智能搜索引擎的设计和构建进行了研究和论述;最后,对农史学科信息门户的用户服务进行了研究,并介绍了农史学科信息门户实验网站的实现情况。本文对农史学科信息门户设计和构建的研究,综合运用了文献调研法、个案分析法、比较分析法及系统构建法等多种研究方法。本项研究的主要工作,包括以下几个方面:(1)国内外学科信息门户的对比分析。为了使将要构建的农史学科信息门户更加完善,本文对SOSIG、BUBL LINK、LII、CSDL学科信息门户体系、CALIS重点学科网络资源导航库等10个国内外著名学科信息门户的元数据框架、分类法和叙词表的使用、浏览和检索功能、增值服务等进行了对比分析,发现我国学科信息门户仍存在着一些不足:所建成的学科信息门户数量少,社会科学、人文科学领域还是空白;没有利用规范的主题词表对资源进行组织,无法实现概念检索;用户服务方式单一等。本文建议我国学科信息门户:通过多种途径开展学科信息门户建设,扩大学科信息门户的规模和数量;采用规范的主题词表对资源进行标引,并在门户中提供词表导航或主题词转换接口,以实现概念检索;提供更加全面、完善的用户服务,增加具有特色的个性化服务。(2)农史网络资源的选择和收集研究。根据农史学科研究范围和农史网络资源的特点,研究和制订了农史门户网络资源的选择政策、评价标准,总结和探讨了在因特网中收集和发现农史资源的方法和策略。(3)农史叙词表的构建及其在农史门户中的使用方法研究。本文尝试采用整合现有词表、计算机自动构建、人工辅助等多途径相结合的方法构建可用于农史门户资源描述和组织的农史叙词表。其中计算机自动构建方法,综合利用了模式匹配、字面相似度和语词同现计算相关度等方法。通过多种方法构建得到一个覆盖农史领域的、可揭示概念之间等同、等级和相关关系的农史叙词表,包括农史词条6581个,其中,叙词3507个,非叙词3074个。同时,在农史门户网站中设计和构建了农史词表引擎,为农史门户资源标引人员和用户提供概念检索工具。(4)农史学科信息门户元数据框架设计。按照标准、开放和可扩展的原则,根据农史学科信息门户的用户需求和门户管理需要,以DC元数据集为基础,制订出了一套适用于农史学科信息门户的、能有效帮助描述、识别、评估及管理农史网络资源的元数据体系。包括描述型元数据和管理型元数据。其中描述型元数据,结合用户需求,对DC元数据进行了一定的扩展,增加了“推荐级别”、“资源评论”及“资源被点击次数”三个元素;管理型元数据是按照农史门户管理的需要自行设计的,包括记录编目者、记录编目日期和记录更新日期。(5)农史门户网页智能搜索引擎的构建。农史门户网页智能搜索引擎包括农史网页采集、网页智能加工、检索及用户接口四个模块。其中,农史网页的采集,采取了利用WebZIP网页离线浏览软件,对农史门户中经过严格筛选的高质量农史网站中的网页进行下载,作为农史门户网页智能搜索引擎的资源范围;农史网页智能加工包括网页自动标引与自动分类,对于农史网页自动分类,采用的是基于农史类别词知识库的自动分类方法。同时,在对农史门户网页智能搜索引擎设计和研究的基础上,初步构建了农史门户网页智能搜索引擎和农史网页自动标引与自动分类实验系统,实现了农史网页的概念检索。(6)农史门户用户服务的设计和构建。根据农史科研人员、教师、学生及爱好者的信息需求,利用WEB2.0的思想和相关技术,对农史学科信息门户的服务功能进行了设计。并利用ASP动态网站开发技术,初步构建了农史学科信息门户实验网站,为农史用户提供农史资源分类目录浏览、资源类型浏览、检索、个性化定制、学科论坛、用户推荐、用户反馈、资源评论、资源更新、学科最新动态、农史词表引擎等细致、完善的服务。本文的创新点主要体现在以下三个方面:(1)本项研究将农史领域的文献整理研究从传统文献拓展和延伸到网络环境下农史信息资源的整理和组织中。针对目前农史网络资源分布散乱的现状,本文对农史网络信息资源的组织进行了研究。通过对网络中有学术价值的、高质量农史资源进行收集、整理、加工和组织,为农史用户提供一个获取和交流学术资源的新平台,提高农史网络资源的有序性和用户对农史网络资源的利用效率,推动农史研究的发展。(2)在国内首次设计和构建了农史门户。本文从农史学科教师、学生、研究人员及爱好者的信息需求出发,结合农史学科的研究内容、研究热点、发展趋势,制订和设计了规范、合理的农史门户资源选择和评价标准、资源发现策略、元数据框架以及知识组织系统,将传统情报检索语言应用于农史门户资源组织,利用WEB2.0的思想和相关技术,设计和构建了农史门户实验网站,为用户提供多种形式的农史网络资源服务和资源发现工具。(3)为了克服普通搜索引擎基于关键词字面检索准确率低的问题,实现农史网页的概念检索,本文将学科信息门户与搜索引擎结合,充分利用农史门户收集到的高质量网站和网页自动标引与自动分类技术,设计和初步开发了基于农史门户的网页智能搜索引擎。农史学科信息门户的构建是一项复杂的系统工程。本文仅是对农史学科信息门户构建的基本问题进行了探讨和研究,尚有一些不足,同时,对于农史学科信息门户的个性化服务和可持续发展等问题,仍需今后深入研究。

易聪[10]2011年在《基于Web挖掘的企业竞争情报系统构建研究》文中研究指明随着Internet的飞速发展,Web储存了大量有价值的知识,企业竞争情报系统(Competitive Intelligence System,简称CIS)的建设也已经成为各企业的战略举措。当前主流的竞争情报系统采用的全文检索或关键词检索的检索机制不可避免地会带来实际检索结果与用户需求之间的大量偏差,在准确性上很难把握。目前基于自然语言、HTML结构分析和本体等方式的竞争情报抽取方式存在的许多不足,无法从大规模杂乱的检索结果中获取最相关的需求。针对这些问题,本文通过对国内外的竞争情报获取技术进行研究,构建出基于Web挖掘的竞争情报系统。本文研究从获取网页信息入手,首先使用正则表达式灵活、快捷、准确地从大量杂乱的Web网页中抽取最初始的企业竞争情报。这些初步结果由于网页结构的半结构化而存在许多冗余知识,因此对抽取的初步结果使用数据预处理技术进行筛选,以去除广告页面和噪音数据,得到进一步结构化的竞争情报知识集。在竞争情报的挖掘方面,使用基于相似度计算的竞争情报挖掘方法,大大提高竞争情报挖掘的准确率。本文研究主要分为六个章节,第一章描述基于Web挖掘的企业竞争情报系统国内外研究现状,第二章描述Web挖掘和企业竞争情报系统的相关概念,第三章进行基于Web挖掘的企业竞争情报系统需求分析,第四章描述竞争情报系统的Web挖掘关键技术,第五章构建基于Web挖掘的竞争情报模型,第六章实现基于Web挖掘技术的竞争情报系统。本文研究的主要成果有:1)提出了整套Web竞争情报抽取和挖掘的方法和技术,提出了基于正则表达式的网页信息抽取、基于编码经验规则的Web文本抽取和基于相似度计算的竞争情报挖掘方法;2)基于Web挖掘理论和竞争情报系统理论,构建了基于Web挖掘的企业竞争情报系统模型,为企业智能化竞争情报系统的建设提供了理论模型;3)基于提出的算法,实现了基于Web技术的竞争情报系统,为进一步研究提供了素材。本文研究理论结合实际,通过系统实现检验了模型应用的可行性,能对相关企业开展竞争情报工作起到一定的借鉴作用。

参考文献:

[1]. Internet科技信息资源门户网站(STIP)系统的实践研究[D]. 张智雄. 中国科学院文献情报中心. 2000

[2]. 质量受控学科信息门户在数字图书馆中的应用研究[D]. 胡明玲. 武汉大学. 2005

[3]. 博士学位研究生论文文摘[J]. 佚名. 现代图书情报技术. 2000

[4]. 自动主题搜索的应用研究[D]. 陈定权. 中国科学院研究生院(文献情报中心). 2003

[5]. EP研究院IT运维管理流程优化[D]. 曾德宏. 电子科技大学. 2017

[6]. 基于超链接搜索策略网络爬行器的设计与实现[D]. 朱金涛. 吉林大学. 2007

[7]. 面向特定领域的智能搜索技术研究[D]. 孙雷. 哈尔滨工程大学. 2006

[8]. 学科信息门户的功能探析[D]. 黄林英. 浙江大学. 2007

[9]. 面向概念检索的农史信息门户的设计与构建[D]. 刘竟. 南京农业大学. 2008

[10]. 基于Web挖掘的企业竞争情报系统构建研究[D]. 易聪. 华南理工大学. 2011

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

Internet科技信息资源门户网站(STIP)系统的实践研究
下载Doc文档

猜你喜欢