DC的XML格式在论文数据库描述文档中的应用研究_xml语言论文

DC的XML格式在论文数据库描述文档中的应用研究_xml语言论文

DC的XML格式在学位论文数据库的著录文档中的应用研究,本文主要内容关键词为:学位论文,文档论文,格式论文,数据库论文,论文论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

学位论文特别是硕博士学位论文具有学术水平高、篇幅较长、信息量多、不公开出版等特点,它是大学图书馆或档案馆收藏的一种十分重要的文献资源。近几年来,随着我国高校研究生教育的发展扩招,学生的学位论文的数量也必然增加。根据2004-2005学年初的统计,我校一、二、三年级及其以上的在校硕博士学生数分别为5445人、5140人、6271人,那么可以预计,近三年来浙江大学的硕博士学位论文的年产出量将是5000多种(册)以上。为了积极推进该类文献的检索与利用,大学数字图书馆计划往往优先考虑该种文献的数据库建设。因此,笔者参考有关研究文献[1],以浙江大学学位论文的著录款目为例,采用DC作为该类文献的数字图书馆元数据的标准,与xml结合,进行电子版学位论文著录的实例描述研究如下。

1 DC元数据的内容与目标资源的描述

DC(Dublin Core)--都柏林核心元数据是OCLC等组织提出的用于标识数字资源的一种简要的目录模式。1995年以来,经过不断地开发与完善,美国于2001年7月把这种模式确定为国家标准(Z39.85)。DC共有15个基本元素组成,分成内容描述、知识产权、外形描述等三大部分,具有结构简单、使用灵活、规模最小等特点,它既包含了数字资源重要的检索点和超文本链接信息,也包含了有关数字资源的描述性信息,是用户通过目录检索、阅览最终数字资源的有效手段与桥梁。它是文献资源数据库文档建设采用的一种十分重要的信息规范技术。其内容与学位论文著录款目的DC定义见表一、表二:

表一 DC元数据的名称与标识[2]

内容描述 知识产权

名称款目标识 名称 条目标识

题名Title 创建者

Creator

主题词 Subject

出版者

Publisher

描述Description

其他责任者

Contributor

来源Source权限 Rights

语言Language外形描述

关联Relation 日期 Date

覆盖范围 Coverage 类型 Type

形式 Format

标识符

Identifier

表二 著录款目的DC定义

学位论文的著录款目

Dublin Core描述

题名中文题目

Title

英文题目

Title

主题词或关键词 Subject

创作者 论文作者

Creator

电子版制作者

Creator

指导教师

Contributor

学生培养单位

Relation

所在学科(或专业) Relation

摘要中文摘要

Description

英文摘要

Description

日期论文提交时间

Date

电子版制作时间 Date

(博士、硕士、学士)学位论文 Type

阅读格式、源数据所占空间

Format

标识符

论文提交号Identifier

索取号(排架号) Identifier

文献来源 原文献保管机构Source

电子版所存网站Source

中文或其它语种 Language

使用范围

Coverage

权限管理

Rights

2 基于DC的XML格式与著录实例

XML(eXtension Markup Language)是一种可扩展的标记语言,它集SGML和HTML的优点于一身,具有易于编缉、便于管理、适于存档、容易查询等特点。因此,DC与XML二者的结合应用,将为解决人们迅速有效地在网络上检索获取到所需信息这一问题,带来良好的效益和实用价值。

2.1 DC的XML格式

目前,采用XML对DC元数据的描述有三种格式[3],它们是:

2.1.1 DC的XML DTD格式,

2.1.2统一资源描述框架(RDF)的DC XML DTD,

2.1.3 DC的XML Schema格式。

下面仅写出DC的XML DTD格式:

〈?xml.version=”1.0” encoding=”UTF-16”?〉

〈!--都柏林核心元数据集(DC)XML DTD 1.1 2004-4-12--〉

〈!DOCTYPE DC[

〈!—0 ELEMENT都柏林核心元数据集

(题名[*],主题词[*],创作者[*],其他责任者[*],相关[*],出版者[*],描述[*],日期[*],类型[*],格式[*],标识符[*],来源[*],语种[*],范围[*],权限管理[*])

〈!ELEMENT DC

(Title[*],Subject[*],Creator[*],Contributor[*],Relation[*],Publisher[*],Description[*],Date[*],Type[*],Fomat[*],Identifier[*],Source[*],Language[*],Coverage[*],Righits[*])

〈!—1 ELEMENT 题名(#PCDATA)--〉

〈!ELEMENT title(#PCDATA)〉

〈!—2 ELEMENT主题词(#PCDATA)--〉

〈!ELEMENT Subject(#PCDATA)〉

〈!—3 ELEMENT创作者(#PCDATA)--〉

〈!ELEMENT Creator(#PCDATA)〉

〈!—4 ELEMENT其他责任者(#PCDATA)--〉

〈!ELEMENT Contributor(#PCDATA)〉

〈!—5 ELEMENT相关(#PCDATA)--〉

〈!ELEMENT Relation(#PCDATA)〉

〈!—6 ELEMENT出版者(#PCDATA)--〉

〈!ELEMENT Publisher(#PCDATA)〉

〈!—7 ELEMENT描述(#PCDATA)--〉

〈!ELEMENT Description(#PCDATA)〉

〈!—8 ELEMENT日期(#PCDATA)--〉

〈!ELEMENT Date(#PCDATA)〉

〈!—9 ELEMENT类型(#PCDATA)--〉

〈!ELEMENT Type(#PCDATA)〉

〈!—10 ELEMENT格式(#PCDATA)--〉

〈!ELEMENT Fomat(#PCDATA)〉

〈!—11 ELEMENT标识符(#PCDATA)--〉

〈!ELEMENT Identifier(#PCDATA)〉

〈!—12 ELEMENT来源(#PCDATA)--〉

〈!ELEMENT Source(#PCDATA)〉

〈!—13 ELEMENT语种(#PCDATA)--〉

〈!ELEMENT Language(#PCDATA)〉

〈!—14 ELEMENT范围(#PCDATA)--〉

〈!ELEMENT Coverage(#PCDATA)〉

〈!—15 ELEMENT 权限管理(#PCDATA)--〉

〈!ELEMENT rights((#PCDATA)〉

〈!—End of DC XML DTD--〉

2.2 “学位论文”的DC XML形式的著录实例

下面以我校电子版博士学位论文《声誉与绩效:理论与实证研究》这一目标资源的DC描述为例,编写出其XML的著录形式:

〈?xml version=“1.0” encoding=”UTF-16”?〉

〈dc-record〉

〈Title〉声誉与绩效:理论与实证研究〈/Title〉

〈Title〉Reputation and Performance:Theoretical and Empirical Study〈/Title〉

〈Subject〉企业的声誉与绩效〈/Subject〉

〈Creator〉余津津〈/Creator〉

〈Contributor〉指导教师:金雪军 教授〈/Contributor〉

〈Relation〉培养单位:浙江大学经济学院〈/Relation〉

〈Relation〉所在专业:经济学〈/Relation〉

〈Description〉中文摘要:本文研究了声誉、声誉效应以及声誉与绩效的关系。其中,对声誉与绩效关系的研究构成了本论文的核心与主体。论文主要运用了… 〈/Description〉

〈Description〉英文摘要:This dissertation is a cross-study on reputation,reputation effect and the relationship between reputation and performance,and the study on the latter composes the core of the paper.mainly based on… 〈/Description〉

〈Date〉2003-12-01〈/Date〉

〈Type〉博士学位论文〈/Type〉

〈Fomat〉PDF文件、源数据所占空间:780KB〈/Fomat〉

〈Identifier〉19901008〈/Identifier〉

〈Identifier〉F014 CY5〈/Identifier〉

〈Source〉浙江大学档案馆〈/Source〉

〈Source〉 http://10.13.31.100 〈/Source〉

〈Language〉中文〈/Language〉

〈Coverage〉校园网中公布〈/Coverage〉

〈Righits〉浙江大学〈/Righits〉

〈/dc-record〉

3 说明与结论

3.1学位论文属于灰色文献,一般不公开出版,因此没有出版者这一项著录款目;同时也不存在IBSN、DOI等标准标识符,上述的标识符(Identifier)都是自行确定的。

3.2目前,高校要求学生提交的论文,通常是电子版和纸本版二种形式。因此,用二项“Source”地址来标识学位论文全文可检索或最终可获取地点。

3.3根据国内外学位论文的使用惯例,高等学校可实行学位论文全文上网(如上校园网等)的授权制度,学生同学校签署授权书后,作为一种特殊的科研成果,学校应该享有这类成果的知识产权管理的权利[4]。

3.4根据DC的设计原则,元数据项具有可扩充、可选择、可增加修饰词与可重复使用等的特色。

3.5因为XML是可以将信息的存贮与显现分开的。这里的文档结构和数据结构的XML标记形式,仅是系统处理的格式,著录数据的显现格式则要通过另外的应用程序来实现。

3.6在上述XML声明中是用encoding =“UTF-16”属性。如果标记与内容都是用中文来写作,则在声明中就要换成encoding = “GB2312”属性。但在事实上,XML标准只要求XML处理器支持UTF-8和UTF-16编码。因此,要正确处理包含中文的XML文档,还需要一个支持GB2312编码的处理程序[5]。

3.7书目著录信息可以与学位论文的全文电子版资源的链接,它可以通过〈Source〉…〈/Source〉来实现,也可以通过〈site href=”…”xml:link=”…”〉 〈/site〉来实现。

3.8由于XML是从数据与文档的底层实现格式化。这就保证了网络系统内从里到外、从处理到交换的一致性,从而有利于网络环境下采用通用的检索引擎等软件工具。这为实现异构数字图书馆的集成检索创建了良好的开发前景。

标签:;  ;  ;  

DC的XML格式在论文数据库描述文档中的应用研究_xml语言论文
下载Doc文档

猜你喜欢