信息质量控制_质量控制方法论文

信息的质量控制，本文主要内容关键词为：质量控制论文,信息论文，此文献不代表本站观点，内容供学术参考，文章仅供参考阅读下载。

[摘要]通过分析信息污染的表现和危害，提出对信息进行质量控制的必要性，分析信息质量控制的复杂性，并从为信息制定质量等级和对信息进行功能分类这两个角度探讨信息质量控制的具体方法。

[关键词]信息污染质量控制信息检索语言

收稿日期：1997—01—20

正如工业化社会中工业的高度发展对生态环境造成了严重污染一样，信息社会中信息的快速生产也会对我们的信息环境造成污染，这就是现在经常讨论的信息污染问题。虽然我们今天还没有真正进入信息社会，但信息污染日益严重的趋势已经显露出来。

信息污染的表现有很多种，如有害信息的污染、虚假信息的污染等。但笔者认为，最重要的恐怕还是信息泛滥造成的污染。信息的数量急剧膨胀，难免鱼龙混杂，因而产生大量的无用信息。无用信息的产生有很复杂的社会原因，诸如急功近利、需求拉动、价值规律等等，在今天的社会环境下，我们还没有办法杜绝甚至没有办法限制无用信息的泛滥，但我们是不是就没有办法对其造成的损害进行控制呢？我们在发展工业时，走了先污染后治理的弯路，那么在即将进入信息社会的今天，对信息污染是不是也要走同样的弯路呢？

另外，从信息检索的角度来考虑，信息质量不高显然也是影响检索质量的一个非常重要的因素。

因此，信息的质量控制就成为一个亟待解决的问题。但很显然，信息的质量控制是一个复杂的问题，之所以复杂，主要有两方面的原因：一是信息本身内涵的复杂性。大家都知道，信息与物质和能源一起构成世界的三大要素，但我们对信息的研究还几乎刚刚开始，关于信息的知识也还基本上没有形成系统的认识，甚至我们现在还没有一个得到大家公认的关于信息的准确定义。我们通常将信息分为自然信息和人工信息两大部分，前者是我们认识世界的基础，是自然科学研究的起点和对象，后者则是人类社会发展的产物，包容了人类所有的经验和知识，也是我们通常意义上所讲的信息。我们这里所讲的对信息质量的控制，主要指的是对人工信息的质量控制。二是信息质量的标准难以确定。在大多数情况下，什么信息是好的，什么信息是不好的，并没有一个绝对的标准，尤其是还因为信息往往有很强的针对性，即同样的信息在不同用户的眼里其价值往往是截然不同的，就更使判断信息的质量难以有一个客观标准。因此，并没有也不可能有一个判断信息质量的简单公式，而必须根据实际情况对其做出判断。

其实，对信息进行质量控制早已经自觉或不自觉地进行着，如核心期刊的评价和选择明显地是一种信息质量控制方法，虽然这种方法还很粗浅。再如：论文在期刊上所处的位置也往往能反映出其质量情况，也就是说，在出版领域已对信息的质量进行了初步评价和控制。但是，现在还没有专门对信息进行质量控制的方法。

此外，我们还可以借鉴其它部门的质量控制措施，如唱片工业的一些做法就对我们很有启发。大家知道，世界上每年出版的唱片数量非常庞大，为了帮助消费者选择唱片，逐步形成了一些对唱片质量进行评价的权威机构，这些机构负责对新出版的唱片进行试听、评价，并标识以一定的符号，如用几星级来表示，并定期进行公布，供消费者选择唱片时参考。当然，唱片的质量评价包括了音乐的内容、演奏水平、录音质量和产品包装等综合指标，这和我们对信息进行评价是有明显区别的。

由于图书情报部门中期刊论文是最重要和最常见的信息源，这里就以期刊论文为例，简单探讨一下信息质量控制的基本方法和思路。

现有的文献加工方法都是从信息的外部特征和内容特征等方面进行处理的，如分类法和主题法。这固然为文献的识别提供了便利条件，但却不能反映出信息的质量，因为在文献加工过程中并没有把其质量因素考虑进去。只有引文分析法在检索入口选择适应的情况下才多少能反映出所检索出信息的质量，但这也只是相对而言的，其效果并不能得到保证，原因也在于它的着眼点不是质量控制。而对于期刊论文的加工，占主导地位的作法仍然只是通过主题标引的方法来反映其内容。因此，有必要引入一套专门控制信息质量的方法来对现有的分类主题方法进行补充与完善。

要想有效地控制信息的质量，首要的一点就是必须建立起相应的检索语言体系，这与信息加工的一般方法是一致的。该语言体系必须满足两个最基本的条件：①必须能准确地反映和标识信息的质量；②必须保证在加工和使用过程中容易操作，即通常所说的可操作性。

基于上述这两个基本条件，再结合期刊论文的一些特点，笔者提出以下两种方案：

1 通过为信息制定质量等级来控制信息质量

信息存在质量差别，这是显而易见的事实，但怎样才能标识出这种差别，则是一个比较困难的问题。最直接的方法恐怕就是制定一个质量等级体系。在信息加工过程中，由加工人员根据信息质量的具体情况区分出其相应的质量等级，用户就可以对检索出的信息的质量有一个最简便的判断依据。这样就可以极大地节省用户的时间和精力，如果把这种方法融合进检索系统，在显示检索结果时按其质量等级进行排序或者直接把信息的质量等级体现在检索表达式中，则检索系统的效能就肯定会大幅度地提高。当然，这种方法不可避免地存在很大的主观随意性，其使用效果决定于信息加工人员的素质，因为信息质量本身在很大程度上就是个相对的概念，不可能存在一个绝对标准。其实，现有的基于检索语言的信息检索方法也都存在着这种缺陷。如分类法、主题法，对同一信息不同的加工人员给出的分类号和主题词往往不会完全一致，甚至一些表面上看起来是绝对的检索途径，在加工过程中也可能存在一定的随意性，如题名途径与责任者途径，在一些复杂情况下不同加工者的著录也可能出现差异，对此，信息加工人员肯定都是有体会的。但我们只要简单衡量一下利弊得失，就会同意即使采用最简单的质量控制方法，对信息的质量控制也是大有帮助的。

由于信息的质量等级是人为划定的，因此，如何划定就具有很大的随意性。这里，笔者采用最简单的方法，即依据其重要程度把信息质量分为三级。

一级：最重要的信息。划分到这一级里的信息必须是各学科在研究和应用中具有决定性的信息。从数量上来讲，这一级的信息应该是极少数。

二级：重要信息。比较重要的信息都应该划到这一类里，而且这一类信息也是大量的。

三级：一般信息。不怎么重要的信息划到这一类。这一类信息的数量是最大的，因为大部分的文献都只是一般性的论述，而且如前所述，还存在一些由于各种原因出现的滥竽充数的信息。

此外，如果需要，还可以规定一个第四级信息，即无用信息，这主要包括一些文抄公的“杰作”及存在明显问题的信息等。当然，这一类信息的数量应该也是非常少的。

2 从信息的功能角度控制信息的质量

信息的内容和形式虽然千差万别，但从用户的角度来看，还是能总结出一些带有共性的东西。从用户的角度讲，使用信息是为了满足特定的需要，如：为项目寻找依据，为开发和生产查询技术资料，为研究寻求方向和启发，以及对某一课题进行一般性跟踪了解等等。我们可以依据信息的功能对其进行分类，这样虽然还不能详细标识信息的质量情况，但却可以粗略地区分出信息的质量等级。这样进行区分虽然还不一定准确，却能够从使用的角度即信息的功能角度区分出信息的一般质量情况。

2.1 权威性信息这是一类由权威机构发布的具有权威性的信息，如各种标准、法规、文件等。这类信息的特点是一般只能遵照执行，除非在一些特定的情况下才可用于研究、讨论。这类信息通常都是最成熟的信息，但一般不具有新颖性。在需要用到此类信息的时候，非此类信息不能满足要求。

2.2 开拓性信息反映的都是各学科领域前沿的一些研究成果，因此，虽然这类信息往往不够成熟，但对研究人员而言，这类信息具有非常重要的参考价值。

2.3 探讨性信息俗话说，提出问题就等于解决了问题的一半。因此，尽管这类信息中的一些内容一般来说也不够成熟，但能把一些新思想、新方法提出来供大学讨论，这类信息的价值在于可以给有关的研究人员以启发，甚至开拓出一个全新的研究方向。

2.4 应用性信息这类信息的特点是针对某一技术领域的要求提出一个相对成熟的解决方案，因此，这类信息最具实用价值，如专利信息就是标准的应用性信息。

2.5 一般性信息这类信息是数量最大的一类，主要包括对一些问题进行一般性讨论、经验交流等信息。这类信息的价值一般不是太大。

除了上面的分类外，还应该规定一套相应的语言体系来进行标识，如可以用a、b、c、d、e分别代表上述大类，以利于具体操作。此外，还可以对上述大类进一步细分出一些小的类别。

标签：质量控制方法论文;

信息质量控制_质量控制方法论文

猜你喜欢