XML技术在数字图书馆系统的应用研究

庄青青^[1]2008年在《基于XML的数字图书馆跨库检索平台研究》文中研究说明数字图书馆跨库检索能够为用户提供统一的检索接口,把用户的检索要求转化为不同数据源的检索表达式,并发地检索本地的和广域网上的多个分布式异构数据源,并对检索结果加以集成,在经过去重和排序等操作后,以统一的格式将结果呈现给用户。用户使用跨库检索查找信息资源,可以同时对多个数据库进行访问,并发检索,不仅减轻了学习检索不同数据源的负担,而且也节省了检索时间,提高了检索效率。本文探讨了基于XML技术的数字图书馆跨库检索平台建设。大多数数字图书馆的数据库资源都具有异构性,且互不兼容,因此在建设跨库检索平台时必须考虑异构数据源的数据整合。XML技术具有开放性、可扩展性、灵活性、自我描述性等特点,且有很强的链接能力,便于网络间的数据交换,具有良好的通用性。本文选取XML技术与中间件技术相结合的方法,进行数字图书馆异构数据库的数据整合研究。相对于传统的中间件系统,XML中间件具有能够描述任何类型的结构化或半结构化信息和对资源快速包装和集成发布的特性,能够较好的解决异构数据库资源的异构问题,有利于异构数据库资源之间的数据交换和共享。因此,可以利用XML中间件技术进行数字图书馆的跨库检索平台建设。本文通过对国内外一些跨库检索系统的分析,探讨了基于XML的跨库检索平台的主要功能和特点。最后选取CALIS统一检索平台为主要案例,分析目前跨库检索平台功能上所存在的不足之处,并针对这些问题,对如何完善和加强跨库检索平台的功能提出一些建议。

王韶红^[2]2001年在《XML技术在数字图书馆系统的应用研究》文中研究指明XML技术属于当前国际上信息领域的前沿技术，是实现数字图书馆系统的关键技术之一，国内相关研究刚刚起步。本文在全面了解XML相关技术规范和数字图书馆关键技术的基础上，重点研究数字图书馆系统资源组织技术和核心元数据的构建技术。作者参照了目前国际上广泛认同的书目描述元数据标准Dublin Core，初步确定了数字图书馆试验系统元数据的XML格式，提出了数据结构要求，设计出自己的示例元数据文档类型定义(DTD)，在此基础上，多种元数据方法并存，并以基于XML的资源描述框架(RDF)体系将它们封装在一起，保证了数字图书馆元数据的完整性与互操作能力。本文还从设计理念，具体实施框架以及未来的发展趋势等几方面对数字图书馆的元数据方案及其实施作了深入探讨。为了演示并验证有关研究成果，作者设计并实现了基于XML的学术论文管理系统，该系统提供基于元数据的数据提取与录入、在线编辑与检索、与关系数据库的数据集成处理等功能，系统中所有资源的元数据都是基于XML来进行存储和管理的。该系统的成功实现为进一步开发实现实用的数字图书馆系统积累了一定的经验。论文在总结前阶段研究开发成果的基础上，还对后续研究工作进行了计划和展望。

刘秋梅, 郑耿忠^[3]2010年在《数字图书馆资源共建共享研究初探》文中研究指明本文对基于元数据的数字图书馆资源共建共享体系进行了尝试性设计。探讨了如何将元数据、XML、J2EE等技术引入数字图书馆,实现数字图书馆资源共建共享。在此基础上,提出并分析了一个以元数据为指导思想,基于XML和J2EE的数字图书馆资源共享模型。

庄青青^[4]2011年在《XML技术在数字图书馆跨库检索中的应用》文中研究说明阐述了数字图书馆跨库检索的数据整合技术,分析了XML技术在数据应用方面的特点,并对XML技术应用于数字图书馆异构数据库数据整合方面的优势进行了分析。

陈玉强^[5]2008年在《数字图书馆系统应用技术研究》文中进行了进一步梳理网络技术飞速发展的今天,数字图书馆以其先进、灵活的信息服务方式受到了社会各届的瞩目。对数字图书馆的研究已经成为信息管理研究领域的重要课题。本文分析了数字图书馆数字信息资源管理中存在的问题、关键技术,国内外数字图书馆的发展状况。针对目前数字图书馆的信息资源组织方式,在全面了解XML相关技术规范和数字图书馆关键技术的基础上,研究XML相关技术在数字图书馆应用的可行性,重点研究数字图书馆系统资源组织技术和核心元数据的构建技术,利用XML技术对书目资源等多种数字图书馆资源进行元数据着录,并研究可用在数字图书馆资源管理的系统结构。以XML为标引语言、RDF为规范的DC元数据是数字图书馆重要应用方案。通过叁者的有机整合,数字图书馆信息系统能够更好的发挥出方便快捷地向社会提供多资源信息服务的优势。分析目前图书馆使用的MARC格式数据、DC元数据的XML实现。并给出了基于XML的数字图书馆体系结构。作为对上述理论的验证,设计实现了一个基于B/S结构的数字图书馆资源管理与发布系统。本文给出了详细体系结构和解决方案,实现了数字资源的管理、检索和查询功能,讨论了XML转换器的实现方法、关键技术以及如何利用XSL来控制显示XML文档,以满足不同用户的需求。

向桂林^[6]2004年在《XML引擎研究》文中进行了进一步梳理XML从1998年由W3C(World Wide Web Consortium)提出之后已得到广泛的关注，各行各业都在采用XML来描述本领域的信息，比如MathML、CML、VoiceML等，随之而来的问题是产生大量XML文档，应该如何管理这些XML文档就成为一个迫切需要解决的现实问题。XML引擎研究就是根据这个问题提出的研究课题。本文所做的主要工作有： (1) XML引擎原型设计。本文设计了一个XML引擎框架，研究了XML引擎与XML数据库、XML应用系统之间的关系，以及XML引擎存储系统、索引系统和查询系统的各种功能。存储系统为索引系统提供存储支持，为查询系统提供临时文件的存储，比如索引文件、索引使用的参数文件等；同时查询系统获取源数据时需要访问存储系统。索引系统分为内容索引和结构索引两部分。索引系统主要为查询系统服务，为查询系统实现全文查询、布尔查询、路径查询提供支撑；索引系统还提供一些接口，使得外部程序可以不经过查询系统也能访问索引系统。查询系统分为内容查询和结构查询两部分。查询系统遵守XPath语法，在实现结构查询功能的同时，也把XML文档看作一般的文本文件来处理，提供内容查询功能。 (2) XML索引技术研究。本文研究了对XML文档进行内容索引和结构索引的方法，尤其是内容索引和结构索引的有机结合机制。在内容索引技术中研究了叁个问题，即变长记录存储问题，中文词、英文短语的索引问题，提高索引建立速度的问题。本文提出的结构索引技术采用了四个索引文件来完成对XML文档的内容索引和结构索引，研究了四个索引文件的建立方法。针对结构索引的建造，本文首先阐明了前序一后序节点标号法，然后提出了树邻接表的概念，并给出了把DOM树转换为树邻接表的办法；最后对树邻接表进行前序-后序遍历，得到每个节点的标号，并组装成结构索引文件。 (3) XML查询技术研究。本文研究了对XML文档进行内容查询和结构查询的办法，关键是研究了内容查询和结构查询的有机结合机制。本文研究了内容查询技术中的叁个问题，即简单检索、字段检索和布尔检索。在研究结构查询技术时，本文提出了五种基本的路径表达式，即简单路径表达式、含序路径表达式、属性路径表达式、含值路径表达式和K C路径表达式，本文研究了这五种基本路径表达式的实现方式，通过分析这五种路径表达式的实现，笔者提出了四种针对结构信息的基本操作，即PC操作、AD操作、CO操作和OR操作。在研究方法上，本文综合应用了文献调查方法、逻辑推理方法、归纳总结法和实证法。针对不同的研究内容，采用不同的研究方法，确保研究过程和研究结果的真实与可靠。

朱晓飞^[7]2007年在《基于Z39.50的分布式检索技术在数字图书馆系统的应用研究》文中研究表明随着信息网络技术的飞速发展,传统图书馆的服务已远不能满足人们对知识的需要,特别是在信息服务和知识服务方面。图书馆数字化的逐步推进,让人们能更加快速、准确的获取所需要的信息与知识。我国图书馆数字化程度及其服务水平,与国外发达国家相比相差甚远,有必要进一步推动图书馆信息服务系统的研究和发展。Z39.50协议(American National Standard Information Retrieval Application Service Definition and Protocol Specification for Open System Interconnection).作为图书馆界现有的数据库通讯协议中最严谨也是最复杂的数据库通讯标准协议之一,在国内越来越受人们重视。本文围绕Z39.50协议在数字图书馆检索系统中的应用和实现,回顾了国内外图书馆发展以及Z39.50协议研究和应用的现状,对Z39.50协议的服务机制、协议规范和协议过程进行了理论探索;讨论了XML技术与MARC标准格式,提出了基于Z39.50协议标准的分布式检索系统的架构模型,剖析了影响检索效率的因素,有针对性地优化了检索策略;最后给出了基于Z39.50协议标准的分布式检索系统在ADLib项目中的具体应用。本文完成的以下研究工作:①基于Z39.50协议在国内外应用现状的研究,指出了当前国内图书馆在信息与知识服务方面存在的问题;②剖析了分布式检索的相关理论和技术,建立了基于Z39.50的分布式检索技术模型;③设计了基于Z39.50的分布式检索模型结构,针对影响检索效率的相关因素,优化了检索策略。④设计实现了一个基于Z39.50的分布式检索模型应用系统——WebOPAC的原型系统。基于Z39.50的分布式检索技术模型的实现,有助于图书馆数字化资源的整合,实现真正意义上的资源共享,提高数字化图书馆的信息与知识服务水平。

丁朝盈^[8]2007年在《数字图书馆Z39.50数据资源整合系统的研究与实现》文中研究指明数字资源整合是目前图书馆界数字资源建设的一个重要发展方向,在当今的数字图书馆界存在着几种数字资源的通讯协议标准,在可预见的将来,各数据资源将会继续使用不同的通讯协议标准来提供数据,给数据资源整合带来了不便,因此用户对资源整合检索的需求将会更加迫切,并推动了资源整合检索技术的研究与发展,各种资源整合系统应运而生。在图书馆界现有的数据库通讯协议中,Z39.50协议标准是最严谨也是最复杂的数据库通讯协议之一。本文作者在对Z39.50协议标准进行了深入的研究后,在实验室进行的河北省某高校的数字图书馆建设项目的支持下,给出了基于Z39.50协议标准的数据资源整合检索系统的实现模型。本文主要围绕Z39.50协议在数字资源整合平台总体解决方案中的作用和实现这一主题,首先简单回顾了国内外Z39.50协议研究和应用的现状,接着对Z39.50协议的服务机制、协议规范和协议过程进行了理论分析研究;然后详细介绍了Web Service和XML技术;接着利用以上的协议和技术,提出了基于Z39.50协议标准的数字资源整合系统的实现模型,并给出了Z39.50协议客户端的具体设计和实现。这一模型的实现,有助于解决数字图书馆解决数字资源整合问题,实现真正意义上的数据共享。本文最后对已实现的系统提出了几个优化策略,作为下一步工作的重点。

徐仲^[9]2002年在《XML技术及在数字图书馆建设中的应用》文中指出通过对XML技术在数字图书馆建设中应用的论述 ,说明XML将对整个数字图书馆的未来产生重要的影响

郦金花^[10]2005年在《基于XML的MARC发布系统的设计与实现》文中认为本文首先简要介绍了元数据的产生及发展,MARC 的产生、发展及在我国的发展和应用情况,其次,阐述了MARC 元数据的地位和作用。同时指出MARC 发展中面临的问题和改革方案:采用XML 对MARC 进行重新描述。然后本文重点设计并实现了一个基于XML技术的XMARC信息资源的发布系统,实现了从MARC到XML的转换,XMARC 信息快速检索和显示的叁大功能。本系统主要根据CNMARC(中国机读书目)标准,建立了CNMARC 信息字典库,定义XML DTD 规范,并根据此解析MARC 为XML 树,在数据库服务器端实现MARC 数据库格式到XML 文档的转换及数据同步,开发的系统通用性和复用性好。对MARC 真正融入Internet 和数字图书馆建设提供了实践经验和参考。本课题的研究与开发,解决了MARC 面向WWW环境的困境,使用户通过WWW浏览器即可检索到MARC 数据,也使MARC 与Internet 网上其它信息集成成为可能,有利于数字图书馆的进一步应用。

参考文献：

[1]. 基于XML的数字图书馆跨库检索平台研究[D]. 庄青青. 华中师范大学. 2008

[2]. XML技术在数字图书馆系统的应用研究[D]. 王韶红. 国防科学技术大学. 2001

[3]. 数字图书馆资源共建共享研究初探[J]. 刘秋梅, 郑耿忠. 山东图书馆学刊. 2010

[4]. XML技术在数字图书馆跨库检索中的应用[J]. 庄青青. 情报探索. 2011

[5]. 数字图书馆系统应用技术研究[D]. 陈玉强. 山东大学. 2008

[6]. XML引擎研究[D]. 向桂林. 中国科学院研究生院（文献情报中心）. 2004

[7]. 基于Z39.50的分布式检索技术在数字图书馆系统的应用研究[D]. 朱晓飞. 重庆大学. 2007

[8]. 数字图书馆Z39.50数据资源整合系统的研究与实现[D]. 丁朝盈. 北京交通大学. 2007

[9]. XML技术及在数字图书馆建设中的应用[J]. 徐仲. 图书馆理论与实践. 2002

[10]. 基于XML的MARC发布系统的设计与实现[D]. 郦金花. 苏州大学. 2005

标签：计算机软件及计算机应用论文; 图书情报与数字图书馆论文; 数字图书馆论文; xml语言论文; 元数据论文; xml数据库论文; 分布式架构论文; 图书馆论文; 数据检索论文; 索引论文;

XML技术在数字图书馆系统的应用研究

猜你喜欢