关于数据摘要的讨论_大数据论文

数据性文摘探讨,本文主要内容关键词为:文摘论文,数据论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

在信息工作流程中,文摘可以最优化撷取信息,是一种重要的文献检索手段。随着计算机在图书馆的广泛应用,各种类型的文献数据库相继涌现。文摘和数据既是两个不同的概念,又是相互联系的。一个文摘系统应当同时又是一个情报信息中心,一个文献数据库。在一些期刊特别是文摘期刊中,除了通常采用报导性文摘、指示性文摘和评论性文摘之外,一种带有其自身特点的新的文摘形式,即数据性文摘(计量性文摘),正受到人们的日益重视并逐渐发展起来。

1 数据性文摘产生和发展的必要性

数据信息是一种优化情报。数据性文摘是以数据为主要信息含量的文摘形式。它以广泛的社会科学文献为研究对象,选择摘录其中运用数学方法对情报现象作定量分析基础上产生的数据信息;并可创造性地对有关数据重新加以综合编排,演绎出新的数据,以进一步扩大信息量。数据性文摘用最佳的信息为社会科学研究服务,为生产、经营和决策提供服务。

数据性文摘同其它形式文摘相比较,有它自己的特点:第一,数据性文摘一般不摘取理论分析和论点,侧重于以计量方法形成的有关数据来说明问题;第二,运用有关数据可以在最少的篇幅内容纳最大的信息量;第三,可以从中进一步取得预测性数据信息;第四,数据性文摘的时间效益最长,没有明显的数据更新和老化问题。

搞好数据性文摘的意义和作用是显而易见的。

1.1 数据信息是研究我国国情的基本依据

正确分析国情是进行社会科学研究、发展生产、进行经营活动和决策的基础,加强国情及世界态势的调查研究,才能做出科学的论断。

国情是指一个国家的各种基本情况。例如:经济制度和意识形态;人口数量、素质和结构;国土资源;民族特点和历史文化;经济发展现状和水平,以及科技、教育和文化的发展程度,发展中的经验教训;国际环境和国际条件等。由这些内容可以看出,国情是一种动态性情报,它是必须用各种数据来加以说明的。不掌握有关数据,就不可能了解国情。对国情的研究,一方面要全面系统和准确无误地收集整理那些有关国情的处于不断变化过程中的各种基本资料,另一方面要对所掌握的材料加以分析对比和综合研究,从中得出正确的结论。这些结论毫无疑问是要依靠数学方法取得,并要靠数据加以显示的。

搞好数据性文摘对我国国情的研究具有十分重要的作用。因此,国情资料也应该成为数据性文摘中的一个重要主题。要通过数据性文摘这种形式,不断积累有关国情的基础数字、发展动态、结构变化、前景预测和经验教训等方面的数据,为国情研究提供可靠的扎实的基础。

1.2 数量分析是社会科学研究的重要方法

社会科学的研究不仅要凭借书本知识,更要注重对实际情况的调查研究,掌握第一手资料。我国社会科学的研究中除了定性分析的方法外,还有一种方法越来越多地被重视和采用,这就是数据分析的方法,将数据资料收集、整理和分类并大量采用计算机技术进行定量化研究。有人提出,数据是浓缩的语言,是最简洁的说明书,是最清晰的结论,是最生动的写照。一个严肃的科学工作者不能不关注数据,没有数据的科研报告是苍白无力的。在科学研究中强调数量分析,做到定性分析与定量分析相结合才能更好地避免盲目性和不确定性,使研究方法更加科学。数量分析和数学方法的运用使数据成为科学研究的必要前提。因此,在图书馆提供信息服务的领域,如何收集和运用各种数据,完善数据性文摘,进一步搞好数据性文摘的检索工作也日益成为需要迫切解决的问题。

2 数据性文摘的类型

2.1 文献数据 文献数据一般可以区分为两种。 一种是涉及某一学科或部门发展特点和规律的有关文献的综合数据,从中可以评价和预测某一学科或学术领域的研究水平、发展特点和变化趋势等。另一种是统计在文献信息管理工作中的运用,通过反映文献数量或文献利用的有关数据,对文献进行的统计分析,包括分类统计、著者统计、引文统计、读者统计、流通率、拒借率等,从中可以反映图书馆开展活动情况及探索文献数量特征和文献信息规律。

2.2 数值数据 用于查检的各种数值或统计资料, 比较接近于一般的统计报表,或以此为资料形成的汇编和手册。如在社会生活、生产建设中形成的基本数值,包括社会总产值、工业总产值、农业总产值、国民收入、社会商品零售总额、居民消费水平、进出口贸易总额等的逐年统计或综合统计。

2.3 事实数据 事实数据包括我国和世界上经济、政治、市场、文化、教育、体育、科技等方面的大事记录,以及查询人物、组织、机构等方面的有关数据,相当于百科全书名录等工具书中编辑的有关数据。这些数据是通过事实来表达和反映的。

2.4 对比数据 对比是一种重要的社会科学研究方法。 只有掌握一定的时间和空间数据,并找到用一定数据说明的座标点,才能进行科学对比。研究国情,就要找准我国在世界范围内的座标点;研究市情,就要找准本市在全国范围内的座标点。研究一区一县以至某一系统某一单位也无不如此。只有这样进行对比,才有扎实可靠的立足点。因此,我们必须经常收集这种客观的、鲜明的、在一定时间和空间数据条件下进行科学对比的文献资料,形成可以进行检索的对比数据。

2.5 预测数据 不管是自然科学还是社会科学, 科学预测本身都是一种研究活动和研究目标。科学预测应该是战略情报研究的基本环节,也是领导决策的前提条件之一。这种超前性的理论探讨并不排斥而且非常需要采用数学方法和用数据来证明。只要广泛收集有关主题的情报信息,特别注意完整地收集可供用数学方法整理成为有序的系统数据资料,形成在一定空间和时间条件下的动态数据,然后加以运算和推理,探讨其发展趋势,指明未来发展的条件,就可以取得具有指导性意义的预测数据。图书馆情报工作人员应注意收集预测数据,并将各种预测数据整理成文摘,也可以超越二次文献的界线,在对各种数据性文摘的进一步分析当中,求得新的预测数据。这将使社会科学的文摘工作实现一个飞跃。

3 数据性文摘的情报流程

数据性文摘产生和利用的情报流程如图:

搞好数据性文摘首先要以各种社会文献为信息源,取得大量的数据信息。在此基础上,还要注意以下几点:

3.1 数据的选择 选择社会科学研究所需要的数据, 应遵循的原则是:

3.1.1 客观性 客观性要求政治性和科学性的统一。 要尊重客观事实,以实事求是当做取得科学数据的根本出发点。取得数据不是为某一政策或理论寻求例证;不能靠主观臆断,道听途说;更不能只投领导所好,报喜不报忧。要按照主题要求收集各种数据,包括反映互相对立的情报信息,加以综合分析、比较研究,并不断积累新的信息使数据系统化,以求得反映客观事物本质联系和发展趋势的数据。一定要防止零碎的反映非本质属性的数据搅乱我们的视线,以致得出片面的甚至错误的结论。

3.1.2 准确性 存在于文献中的信息是大量的, 但往往鱼目混珠、真伪难辨。数据信息也经常出现这种情况。因此,对数据的选择要去粗取精、去伪存真。摘取文献中的数据,一定要看引用是否准确,释义是否正确,特别要把握形成某一数据的空间边界和时间界线,了解数据产生的客观环境和背景材料,才能比较准确地形成数据性文摘。还要注意文献所引用的数据来源。一般地说,应以国家统计部门或主管部门颁布的正式数据为准。当然也可收集在社会科学研究过程中所取得的科学数据。

3.1.3 时间性 时间性是对情报信息工作最基本的要求。 及时提供准确的便于检索和使用的数据,并不断进行数据更新的才称为最佳的数据性文摘。另外,社会科学数据也要经得起时间的检验。时间越短要求数据越是准确、专指性强;时间越长越要求能提供反映事物发展规律的数据。

3.2 数据的处理 数据的选择也可看作是数据的常规处理。 这里所讲的数据处理,则属于信息情报研究范围。社会科学研究所需要的数据必须是有序的。在现代科技条件下,“数学+计算机”构成数据处理的主要特点。要研究数据的排列、输入格式、检索主题词表等问题,对有关数据做综合分析、对比分析、溯原分析等,以求出新的数据信息,探讨预测性数据等,最后将这些数据资料输入有关计算机数据存储库或计算机网络,供读者检索查阅。有的单位按不同学科和主题出版了有关数据文摘的资料汇编、目录索引等,为科研人员提供了极大方便。相信包括数据性文摘在内的文摘学理论研究将更加深入,应用更加广泛。

(收稿日期:1997—05—29)

标签:;  

关于数据摘要的讨论_大数据论文
下载Doc文档

猜你喜欢