论数据库在评估稿件中的作用,本文主要内容关键词为:稿件论文,作用论文,数据库论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
电脑数据库系统的逐步建立,信息传媒的日趋发展与普及,为编辑审核稿件质量的科学性,创造了可靠的前提。一般编辑对稿件的录用与否,质量高低、文章创意,以及事实、数据、结论等方面的评估,主要依据是编辑本人或其他审稿人的个人意见,而这往往因审稿人的专业局限、信息局限、视野局限而使稿件的评估颇有随意性。电脑数据库之类信息系统的建立,使上述诸种局限相对说能获得较好的解决。
一、中文数据库的功能
中文数据库近年来在国内发展很快,比如高校理科学报的《中国高等院校学报论文文摘(英文磁带版)》CUJA数据库①、重庆科技情报所的《全国中文科技报刊篇名数据库》,以及《中文社会科学报刊篇名数据库》等等。本文以《中文社科报刊篇名数据库》为主要论述对象,并以此为例介绍该数据库在稿件评估中的作用。该数据库是由文化部立项、上海图书馆承建的全面覆盖国内中文哲学、社会科学期刊文献篇名的综合性题录库,是目前国内中文报刊文献信息计算机检索的最大最主要的工具。②这一数据库收录全国哲学、社会科学期刊3724种,报纸146种。内容涉及马列主义、毛泽东思想、哲学、社会科学、政治、军事、经济文化、科学、教育、体育、语言文字、文学、艺术、历史、地理各个学科。条目收录采用核心期刊全收,非核心期刊选收的原则。这一数据库已将1993年1月至今发行的报刊全部录入,累积数据达30万余条。目前每季度更新一次,每月以2万条数据的速度在递增,除全部以机读形式发行外,另抽取核心期刊条目部分以书本形式出版。这一数据库将文献的数据字段选择顺序号、分类号、题名、著者、报刊名、出版日期、所在页码、附注、关键词等九种记录要素录入。③该数据库系统具有5种主要功能,即检索功能、索引功能、文件编辑功能、格式转换功能和文件服务功能。其中检索功能具备关键词、分类号、著者、文献题名、母体文献题名、卷期年月、题中人名等途径,除分类、母体文献题名外,其余如篇名、责任者、题中人名分析、关键词等字段均可采用逻辑组配检索。
有了数据库,编辑用户就可以方便、快捷、准确地检索到收录文章的分类号、篇名、作者、出处、题中人名分析、非控主题词(所有有效字段均以国际为准)。例如查找有关列宁关于第二国际历史功绩的论述。可依《中国图书资料分类法》从分类号查,可从论文作者角度查,也可选主题词如“列宁”、“传记”、“第二国际”、“第一次世界大战前”、“历史功绩”等加以组配查寻,依此方法便可查到孙景峰的《第一次世界大战前列宁在第二国际中的历史功绩》一文,刊《河南师范大学学报》(哲社版),1993年第1期,总20期,第63-69页等内容。再如编辑需要了解毛泽东诞辰100周年时,关于毛泽东思想的学术研讨综述情况,以评估所发稿件在近年来毛泽东思想研究中所占有的学术地位,只须键入如“毛泽东”、“毛泽东思想”、“纪念毛泽东诞辰100周年学术研讨会:会议综述”等主题词,根据检索序号进行跨主题逻辑组配检索后,便能从检索后输出的文件中,找到有关论文。比如“A84四川省纪念毛泽东诞辰100周年学术研讨会综述/龚白德//毛泽东思想研究。1994(1)-147-150”等等。而从作者、从篇名、从分类角度去查这文章的出处,利用中文数据库也是得心应手的事。
由于像上述的《中文社科报刊篇名数据库》之类以数据库具有文献信息量大、检索点多、查检速度快等特点,使得用电脑参与评估稿件这样的新鲜事成为可能。使用电脑数据库能使得编辑对稿件的质量有个定性定量的认识,当然,也使得编辑从一稿多投及剽窃之类的困扰中解放出来。
二、稿件“新意”的评估
一篇稿件,尤其是文史哲类的专业稿件,读者喜欢有新意、作者自谓有新意、编辑爱发有新意的稿件。然而,如何定性定量地了解稿件确有新意,或是部分有新意、或是根本就不存在如作者自谓的新意,这正是稿件评估中的关键。评审稿件中,最常见的作法是,作者说自己在某点上有新见,编者便在编辑过程中突出了这点新意,其后或经文摘,或经其他媒体的介绍,这种“新意”便被认可了下来。而往往这一过程是个认识的怪圈,成了谬误的传播者。举个例说,最近有报刊称在宁波某地发现了绝无仅有的明代微型读物,这一新发现被报道者认定是国内仅见的,而事实是,无论搞印刷术研究或是搞古代文物研究的专家,都能随意地举出许多同类微型书的实物来说明这不是“唯一的”。再一个较轰动的消息是有报刊载:经国外某研究家考证,最新公布的科研成果为“马可·波罗没有到过中国”。这一科研成果迅即被认定是新发现、新突破。孰料,热闹了半月余,经记者采访国内的马可·波罗研究专家,才知这一“新发现”是二十年前的观点的翻版。
像这类在编辑审稿中经常要步入的误区如何解决呢?当然,首先编辑应该是个专家,对于自己发稿的专业,应该了解得比较全面,如关于文史类稿件的发稿编辑,对文史上的新发现应该了解得较全面。然而,以每日产生的信息量之大之多,是任何编辑都无法穷尽地了解的。而知识的更新与深化,使得任何编辑都不能建立如此广博,如此深厚的知识结构。因此,在高新技术突飞猛进地传播与普及的今天,由检索数据库来代替人脑完整齐备地记忆了解全新的专业学术的研究成果是编辑业的必然。
编辑面对一篇研究史志类的新考证、新发现的稿件,首先是不能掉以轻心。就文史类的史实而言,经过千百年无数专家学者考订论证的东西,一般是不会被轻意推翻的。如近年来有些研究者指出曹雪芹祖籍是丰润,《红楼梦》原始作者不是曹雪芹而是丰润一个叫曹渊的人,曹雪芹只是增删者之“新发现”。对此,编者只须通过检索有关此主题的论文,便发现这类说法其实是一种牵强意会的推断,完全没有新的历史材料作依据。因此,稿件的正确评估的第一条是在观念上对新发现、新考证有所顾忌。在此前提下,再通过检索手段来进行同题评估。此外,文史史实中本身就有争议的问题,作者往往据一面之辞而以“新说”、“新论”称之,也是编辑在评估中要注意的。编辑在取慎重的态度了解作者的观点同时,还可依据中文报刊数据库提供的大量数据了解这些“新说”、“新论”的真实价值。如关于大汉奸汪精卫死的经过与原因,以前有多种说法。最早的传说是被日本人害死的,近年来又有人说蒋介石谋害致死的,王关兴的《汪精卫传》④则考订汪之丧命“与蒋介石毫不相关”、“把手术本身看成是日本有意谋害汪,是缺乏事实根据的。“孰是孰非,只要依据《中文社科报刊篇名数据库》,对有关此课题的研究情况实行检索,通过跨主题逻辑组配检索。迅速将“汪精卫”、“民族投降主义理论:汪精卫集团”、“蒋介石”、“投敌判国”、“对策”、“中国:抗日战争时期”、“汪精卫伪政权”、“日寇诱降”、“迫随投敌”等主题词逻辑组配检索,便可索得《刺杀汪精卫档案材料一组》、《汪精卫叛逃降日的经过及其下场》等文。编者可由此入手检索有关论文加以比较,了解到注精卫之死因,确为王关兴文中所考订那个结论、而非稗官野史类文字中的“新论”,从而避免了发表一些不着边际的耸人听闻的非科学“新论”。
三、稿件数据等方面的评估
以稿件提供的数据的信息源来判断稿件的质量是一个重要的手段。以中国民族学研究的论文言,其信息来源依据来源等级依次可分为:经过为大量的社会调查后形成的原始结论;通过既有的调查资料形成的推断与演绎或是汇总;通过这些演绎或汇总产生的反证;从汇总的资料中取出非主流的民风民俗加以创造、发挥产生的作品,等等。像这类对稿件信息源的评估,只要使用大型图书馆的馆藏文献数据库,就可以对同一类目或同一主题下所藏文献的情况有个了解。通过查阅这些文献,就能了解到文献的基本源的情况。由此而了解不同等级的文献源,对稿件形成的不同的信息源污染的程度,也可见稿件本身可提供的新信息的可能。
稿件评估的再一依据是信息本身的真伪。除了前面所述的论文的“新说”、“新意”、“新发现”的真伪外,稿件中提供的数据信息亦有个真伪问题。这种真伪或反映在论文中形成的事实性错误、常识性错误、数量性错误、结论论证过程错误等。以事实性错误言,最常见的是引用的信息源的质量性错误,由于信息源本身的不可靠,或是信息的滞后而引用者不觉继续引用产生的错误。如当代史的传记文学创作中,会产生大量不可信的二手三手甚或是篡伪的资料,而在历史学的文章中轻易引用此类资料,本身就是一种事实性数据的错误。
事实性错误,还在于引用一家之说来作为立论的依据,这源于事实性错误的论说文章自然没有了立足的依据。像中国现代文学史的评论其论据来源于解放以来对现代文学史的构建。基于许多主观或客观方面的原因,三、四十年代许多作家许多流派都没有为文学史所列入。例如周作人,张爱玲,抗日战争时期敌占区文学创作,等等。信息源的这种先天性的不足,使评论文学史的稿件少了客观的立足之地。因此,利用中文数据库(包括类似《中文社科报刊篇名数据库》和大型图书馆的馆藏文献数据库)便有为稿件事实性数据的评估提供正本清源的依据。
除这种正本清源的作用外,中文数据库在编辑业务中还有很多作用,如:
1.查找稿件本身提供的出处。一篇稿件,质量如何,常可从其参考文献、引用文献看出。利用数据库查证这类参考引用文献。了解这类文献的自身价值自然为稿件的质量价值作了注脚。此如传记类稿件的质量评定,只须通过数据库了解稿件所引用的传记文件的依据,便对这类稿件的质量立即有了基本的价值分辨。
2.查证稿件数据来源。一篇稿件中的事实、事件、人名、地名、年份、数量之类数据的正确与否,决定了稿件最基本的价值。大的诸如具体历史事件细节的真实;重大事件发生的日期;小的诸如钢产量、煤产量、心脏移植的存活天数等等数据的正确可信与否,决定了稿件最基本的价值。这些只须查证数据库同一主题文献中提供的数据便能查证。
3.开拓编辑的审稿思路。数据库在评估稿件的作用方面,另一不可小视的作用是开拓了编辑的审稿思路。编辑除了可以利用数据库对稿件进行定性定量的评估外,还能为编辑提供如何改稿件,如何组织同类稿件,如何取舍稿件的部分内容等。例如像《宜昌发现最早象形文字 我国文字起源又推前2000年》之类的文章,编辑可以通过数据库了解以往关于人类采用文字的情况的文献,通过就这批象形文字的发现,由此而组织研究文字的起源、发展、长江文明进程之类相应的考古整理、研究稿件,以供支撑“把我国文字起源推到6000年前,比商代殷虚甲骨文还早2000多年”的结论。因为一篇孤证的文章是不足以推翻从清代到今的文字学研究成果的。
4.查证专题学术研究的动态。一篇稿件所形成的研究成果,处于该课题研究的那个分支,该课题研究的近年来动态发展情况等,都可以通过对《中文报刊篇名数据库》的检索来解决。例如要了解关于中国明清小说研究的进展,只要将该母题用主题词输入,就“中国小说”、“古代”、“明清”、“艳情类”等主题词输入加以组合。再经过限定,如限定为是1993年到现在、限定为是发表在高校学生报上的稿件等等,便可对中国高校学报近年来发表的明清小说研究的文章系统地打印出来,在此基础上,经过汇总、归类、评定、筛选,对近年来高校明清小说研究便有了全面了解。
5.定性了解各高校学报的发稿动态。各家学报对自己刊物及兄弟学报发稿情况的关注,要求了解刊物发文被转摘的情况。由此可通过中文篇名数据库对之进行检索,从而定性定量地对学报的学术论文的质量、受国内学术界关注的情况有个全面的了解。
以上,仅为数据库在稿件评估及编辑工作中的一般作用的泛论,数据库在提高编辑学术修养,拓宽编辑编稿思路、提供各类高密度的新信息方面也有许多作用。相信随着高技术的发展与推广,编辑科研的课题也将日益电脑化、科学化、合理化。
注释:
① 即Chinese University Journal Abstracts Taped in English.
② 这一数据库由上海图书馆《全国报刊索引》编辑部负责数据加工,文达信息公司数据中心生产数据。该系统采用“C”语言编制,格式按国家“信息高速公路”要求设置。可在任何386VGA以上内存640K、适量硬盘空间的微机运行。支持系统为MSDOS或PCDOS3.0以上版本SPDOS、CCDOS、UCDOS及汉字系统。
③ 数据分类采用《中国图书资料分类法》第三版;数据主题参照《中国分类主题词表》标引。
④ 王关兴:《汪精卫传》,安徽人民出版社1994年版。
标签:文献论文;