人类信息学的基本问题,本文主要内容关键词为:信息学论文,人类论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
近年来, 在西方的学术界, 出现了一种叫作信息传播学(Communication and Information Sciences 或Information
andCommunication Sciences)[1]的社会科学分支。 它是人类传播学和人类信息学的合成品,是新闻学和文献学在各自的发展中遇到理论贫乏时所达成的一种妥协。但信息传播学最后的发展可能要超出新闻学和文献学的实践领域,在这里我们不会再看到新闻学和文献学的影子——就像在几何学里看不到土地丈量方法的影子一样,因为从本质上说,信息传播学是关于人类信息问题而不是关于一份报纸或一个文献记录问题的学科。
信息传播学由三个部分组成,它们是:人类信息学、人类传播学和人类信息行为分析。这三个部分有时也被简称为信息学、传播学和信息行为分析。在信息传播学出现之前,传播学的研究中存在着大量的信息研究[2],而信息学中也有少量的传播研究出现[3],对这两个问题的共同兴趣是这两个学科走向合作的直接动力。就目前的情况来看,传播学的研究比较成熟[4],信息学的研究相对比较薄弱[5],信息行为的研究则刚刚起步[6]。在这篇文章里, 我们打算讨论一下信息传播学中的信息学研究,即人类信息学,并展望一下它的未来。
一 人类信息学同一般信息科学的关系
信息传播学把它研究的信息类型仅局限在人类信息的范围之内,这一点已达成了信息传播学研究者们的默认和共识。这里所研究的人类信息指的是在社会生活中由我们人类自己产生,并只在人类社会成员或组织中流动、交流或传播的信息。科技信息、经济信息、商业信息、政治信息、军事信息、生活信息等均是人类信息。对人类信息进行的研究结果就叫人类信息学。而前面不加任何限定词的信息指的是一般信息,它涵盖着所有的信息类型,比如电子信息、细胞信息等。对所有信息类型进行研究所形成的科学,叫一般信息学或普通信息学,或者叫信息科学[7]。人类信息学是信息传播学的一个分支, 但同时也是信息科学的一个分支。
就目前的情况来看,一般意义上的信息,其应用实践涵盖了下述六个领域:一,电子科学与技术领域。信息在这里指的是一种脉冲、信号、电压或磁场方向;二,光技术与理论研究领域。信息在这里指的是光波的强度、位相、色彩等;三,生物科学与技术领域。信息在这里代表基因的排列方式、神经的电冲动或一种化学物质;四,动物的通讯领域。信息在这里指的是动物彼此之间相互协调的一种指令;五,社会及人文科学领域。在这里的信息被看作是人类对客观世界的认识或反映结果;六,其他领域。最近,有个别学者把信息和结构联系起来,认为凡是有结构的地方就有信息,从而认为信息就是结构[8]。 对上述不同领域里信息进行研究的结果,正在形成由电讯信息学、计算机信息学、光信息学、生物信息学(细胞信息学)、动物信息学和人类信息学等六大分支组成的信息科学学科群体。
由于信息的应用范围已经变得非常庞大,信息的内涵和外延都已相当复杂,从而使得人们去把握信息的普通特性和规律变得极为困难,使得人们对一切信息加以研究,形成一个被各个信息应用分支共同认可的普遍信息科学的尝试,已经变得几乎不大可能。结果是,对全部信息中的一种或几种加以研究,旨在形成部门信息科学的行动就变成了目前推动信息科学向前发展的一种行之有效的办法,而信息传播学及其对人类信息学的思考就是这种思维的产物。目前除了信息传播学是信息科学群体中一个比较活跃的分支之外,电讯信息学、计算机信息学和生物信息学[9][10]同样处于活跃状态。但在所有上述六个信息科学分支中, 唯有香农在电讯信息学中建立了一套完整的信息理论[11],其他的信息科学理论分支还都正处于探索之中。
二 人类信息学的基本理论问题
信息传播学中的人类信息学主要解决下述四个问题。第一,对象的信息化;第二,信息的对象化;第三,指标信息集;第四,信息推理。以上四个问题和信息行为分析中的“信息对人类研究有什么作用和怎样起作用的?”一起,构成了人类信息学的五大问题。
1 对象的信息化
对象的信息化指的是我们人类用自己的感官对客观对象世界进行认识或反映的过程。其结果是在我们的信息世界里建立起关于“真实对象世界”的映射,即“信息对象世界”。它需要研究的问题是,一个对象究竟能向我们提供多少信息?把“现实对象”变换成一个“信息对象”的方法是什么?
这个过程依赖于人类自身对对象的认识能力。由于人类对对象的认识是一个循序渐进的过程,是一个不断逼近和完善的过程,所以不存在着最后的终结。因此,一个对象能向我们所提供的信息数量是无限的。
我们人类在对对象的信息化过程中,主要采用下列四个步骤:确定对象,确定主题,确定属性,确定行为[12]。下面我们着重谈谈其中的对象属性和对象行为的确定问题。
如果我们把对象分为静态和动态两类的话,那么确定对象的静态属性就成了我们认识静态对象的基本方法。静态对象的属性分为物理属性和社会属性。一个人的身高、体重、肤色、性别等是物理属性;但民族、姓氏、特长、职业等就是社会属性。物理属性是指那些不以人的意志为转移的属性,而社会属性是人类自身赋予对象的属性。如果我们对对象的属性有足够的了解,我们对对象的了解就会更深刻。
确定动态对象的行为是我们认识动态对象的基本方法。对象在动态情况下所表现出来的属性,如一个人吃饭、喝水和休息;一株植物在某一时段内的生长情况等,都表明着对象的各种行为能力。1972年,尚克等人基于对故事情节的理解,把人的行为分为11种并称之为动作元,它们是:1.驱动元;2.抓握元;3.部分位移元;4.整体位移元;5.物质拾取元;6.物质给出元;7.抽象关系改变元;8.信息拾取元;9.信息给出元;10.信息传递元;11.信息加工元[13]。他们证明,用这11种动作元来理解人类的一些特定行为图式是成功的[14]。但对人类信息学来说,人类的行为只是它需要考虑的信息行为之一,除此之外还有其他生命对象和无生命对象的信息行为,只要它们具有行为能力并被我们人类所认识。
对象的概念起源于计算机科学,近年来也有个别哲学家在独立地使用它[15]。它遍指我们认识的任何一个客体,不论它是一本书、一个人、一个动作行为、一个观念或一个抽象的系统。对象的属性和行为是第四代计算机程序设计——面向对象程序设计中基本的理论问题,对对象属性和行为(方法)的设计是它的核心之一。面向对象程序设计的基本思想是:以对象为中心要比以求解为中心更为科学[16],以对象为中心的方法把人们的注意力吸引到了对象上而不是问题的求解过程上。这样在处理同一对象时,我们就可以采取调用或继承的方法来增加程序设计的效率。对对象的设计分为属性设计和行为设计,属性设计和我们的信息研究中对象的属性分析是一样的,但对象的行为设计在面向对象的计算机程序设计中是被动的,而我们所考虑的对象的行为大多数是主动的。
2 信息的对象化 信息的对象化要解决的问题是, 我们怎样才能从信息世界中把“信息对象”还原成一个“现实对象”?这里的“现实对象”是虚拟的,因为在观念世界里不可能建立起真实对象来。信息的对象化问题是对象的信息化问题的反问题。
当我们用某种语言按照对象信息化的过程把对象信息化以后,关于对象的信息元素——属性或行为——就按照所使用语言的规则被固化在了一个句子里。信息对象化的任务是按照这些固化的法则,把这些信息元素一个个地解析出来并还原成虚拟的对象。
因此对象信息化的过程,就是一个复现信息表达者心目中对象的过程。它包括三个问题:确定基本元素;确定扩展元素;确定附加元素。
信息的框架元素是主位、述位和连位 在我们识别一个句子中的信息的时候,我们首先需要确定的是句子所讨论的主位、述位和连位是什么,这一过程是马泰休斯于1974年提出的[17]。主位中包含着我们要讨论的主题;述位是我们在叙述某一句子时向主位提供的说明,是句子的“信息中心”;连位是联结主位和述位的纽带,也是整个句子的信息模型。连位分为属性连位和行为连位两种。属性连位是由“是”、“有”、“存在”等动词构成的;行为连位是由“来”、“去”、“轰击”、“打”之类动词构成的。我们要讨论的对象既可能存在于主位中,也可能存在于述位中。主位、述位和连位为我们建立对象的信息框架提供了简明的模型。
信息的扩展元素是格 菲尔默于1966年以动词为参照系,把句子中各个具有独立意义的名词成分,按照它们所代表的功能分为6 种并把她们命名为“格”,它们是:施事格、客体格、工具格、处所格、时间格、与格和伴随格[18][19]。后来他又于1968年、1971年和1977年把它们做了不同程度的调整。鲁川和林杏光等人依据菲尔默的思想,确立了汉语中存在的23种格,它们是:施事格、当事格、领事格;受事格、客事格、结果格;与事格、同事格、基准格、系事格、分事格、数量格;工具格、材料格、方式格、范围格、时间格、处所格、方位格、依据格、原因格、目的格[20]。格元素很好地描述了句子中名词成分在一个句子中所扮演的角色,即传递信息时所起的作用。一旦我们知道了不同的句子成分在一个句子中的格角色,它所传递的信息意义就非常清楚了。因此,鲁川等人把基于格理论的语法称之为“信息语法[21]”。
信息的附加元素是修饰词 格语法可以对动词和名词性成分给出描述,但对修饰动词的副词成分和修饰名词的形容词成分没有加以考虑,而这些成分恰巧是我们辨别对象的重要手段。因此我们必须借助于传统的语法,来对这两种成分加以分析。
当两个同类对象在属性或行为部分无法加以区别的时候,描写静态对象的形容词成分和描写动态对象的副词成分就成了我们区别它们的重要工具。红色的铅笔和黄色的铅笔之间是靠颜色描写的形容词来区分的;同样,“这个年轻人有一搭没一搭地在干活”和“这个年轻人不停地在干活”是靠描写方式的副词来区分的。
我们把上述三个方面总结起来用一个例子说明,例如我们有如下信息:
出于经济的原因,那个歹徒于上周六在一个旅馆里用匕首残酷地杀害了那位卡车司机。
按马泰休斯的说法,我们得出这句话的主位:那几个歹徒;连位:杀害;述位:那位卡车司机。其中的对象可能是“那几个歹徒”,也可能是“那位卡车司机”,这要视具体情况而定。
根据鲁川和林杏光等人给出的23种格,我们对它的各个元素确定的格是:
出于经济的原因,那个歹徒于上周六在一个旅馆里用匕首残酷地杀
123 4
5害了那位卡车司。
6
1,原因格;2,施事格;3,时间格;4,处所格;5,工具格;6,受事格。
“经济的”、“那个”、“那位”等是形容词性修饰成分,“残酷地”是副词性修饰成分。
用格的概念来识别句子中元素的信息意义,是我们信息对象化的基本方法。
3 信息指标集
我们人类解决问题时并不是把有关对象的全部信息都拿来,而是仅仅取其一小部分就足够了,我们把这一小部分称之为指标信息。指标信息的作用,是使我们能够把对象无限多的信息迅速缩减到一个小子集里,据此达到我们解决问题的目的。指标信息是和全部信息相对而言的,它是全部信息的一部分。如何确定这一小部分信息的个数就是指标信息集所要研究的内容。
指标信息的选取来自认识对象的角度,从每个角度取一个或若干个不等,其数目或容积取决于问题的性质。我们把那些需要解决的问题,按照所需信息的数目是否确定分为开放的和封闭的两类。所需信息数目是不变的,即不能多、也不能少的问题称之为封闭型问题;所需信息的数目因地而异、因时而异或因人而异的问题称之为开放型问题。
先看开放型问题。对于购买衬衫这样的问题来说,一般人所关注的该对象的指标信息包括:型号、式样、质地、基色、花色、价格、重量、厚度、透明度、光洁度、厂家等,但不同的人所需的指标信息数不同。衬衫的基本功能是遮体,因此,对于一个乞丐来说,他不会考虑任何指标信息,只要是一件衬衫,他都会满足。但对一般人来说,型号、式样、质地、基色、价格是五个必须考虑的指标。但对于一个百万富翁来说,他不需要考虑价格,只要他喜欢即可。而对于一些讲究牌子的人来说,由厂家决定的品牌是一定要考虑的。购买衬衫的指标信息集之所以是不确定的,是因为购买衬衫问题是个开放型的问题。国民经济的统计指标信息体系、社会可持续发展指标信息体系等都是不确定的,因为对国民经济的研究和对可持续发展的研究都是开放型问题,因而其指标信息集一直,也永不会有确定的数量。社会科学中的大多数问题所需的指标信息都是不确定的,因为大多数社会科学问题都是开放型的。
再看封闭型问题。一个裁缝为顾客加工一件衬衫,如果不考虑式样的话,他需要知道顾客的体型信息是上身长、胸围、臀围、肩宽、臂长、臂围、手腕围、脖围等8个信息,不多也不少;我们解y=x+5这样的方程,唯一需要知道的是x等于几这一个信息。解数学方程, 计算机问题求解等等都是封闭型问题的例子,因而所需的信息总是确定的。
因此;指标信息集的容量取决于要解决的问题是封闭的或是开放的。但不论我们问题的信息是属于属性型的,或者是行为型的,所面临的指标集都有可能是封闭的,但检验指标集大小和指标取何值的问题,仍然要由问题本身决定。这就是说,指标容积和指标取值不是由信息学所能决定的。行动性指标集可以检验,而认识性指标集检验起来就困难得多。
在指标信息集研究中引进数学方法,是近年来数理统计学的一大课题。其中的多元分析法得出了一些有效的数学结论。这也证明,统计学中的大多数方法是和人类信息直接相关的,因而也是信息学的。例如指标信息的约减理论,即主成分分析法,以及下一节要提及的点估计和区间估计理论等都直接适用于人类信息问题。
4 信息推理
人们通常获得信息所采用的方法主要有两个:亲自考察对象获得信息,或从信息世界(包括自己和他人大脑里的信息)里直接使用自己或别人对对象的已有考察结果而获得信息。除此之外,我们还在使用着第三种方法:信息推理。信息推理是用一定的方法,在已有信息的基础上挖掘出新信息的一种方法。它使得我们不用去亲自考察对象,也不需要去查找关于该对象的有关信息,而是依据手中已掌握的信息,来推导出我们希望得到的关于该对象的新信息,对所有这些信息推理方法的分析,就构成了人类信息学中的信息推理研究。
在信息推理中,人们都比较熟悉亚里士多德的形式逻辑理论,它是我们通过推理获得信息的重要方法。但除了形式逻辑之外,我们还经常使用下列推理形式来获取信息:
对话推理 当一个人向他人询问某一信息,或表达某一陈述后,其他人用间接、隐晦或暗示的方法而不是用直接的方法来回答这个人的问题,这种表达形式上不相关,事实上又相关的陈述,仍是旨在向他人提供信息。我们把这种用间接方式向别人提供信息的方法叫对话信息推理方法。下面是对话信息推理的一个典型例子。
A问:谁是中国最伟大的小说家?
标准答案形式:某某某是中国最伟大的小说家。
B答:《红楼梦》受到世人的称赞。
C答:《红楼梦》不次于莎士比亚的任何一部作品。
就A的问题来说,显然B和C 都在暗示:曹雪芹是中国最伟大的小说家,但却不是用标准答案形式直接回答A的问题。 虽然我们可以肯定在B和C所表达的信息里蕴含着A的答案,但它们的关系是什么? 这是对话型信息推理要解决的问题。
预设推理 当一个陈述者把一些事先获得的或假定的信息“埋设”在一个陈述中,其目的又是让信息接受者知道这个信息,我们把这种“嵌入”与“取出”信息的形式称信息的预设推理。预设信息推理认为,人们在表述信息的时候,都遵循着人类的某些信息表述行为。例如:如果我们表述了一个行为的开始,那么它就蕴含了这个行为过去某一时刻没有进行的信息;如果我们表述了一个行为的停止,那么它意味着这个行为过去曾进行过的信息;如果我们强调继续进行一个行为,那么它就暗示着这个行为过去正在进行的信息;如果我们表述某个属性或行为的存在,那么存在这个属性和行为的一切重要条件也必然存在。
下面的例子说明了这种信息推理的作用:一个商人总是在一个经理的面前夸耀他的一个秘书小姐是如何如何聪明和漂亮,因为他别有用心。一天他又当着这位小姐和经理故伎重演时,经理说:“是的,她的丈夫也这么说。”商人的梦想最终破灭了。预设信息推理和对话信息推理一样,它们不仅是许多幽默的语义机制,也是像外交这种工于辞令的场合常用的工具。
抽样推理 抽样信息推理的基本含意是,从一类对象整体中随机地抽出一小部分对象,并对其某些指标进行考察,用获得的关于该部分对象的信息,来对其全体对象对应的指标信息进行信息推理的一种方法。它的内容大体可分两部分:一是通过样本对总体的未知信息进行估计,简称参数估计。二是通过样本的信息对总体的某种假设进行检验,简称假设检验。它的理论基础是概率论,它所采用的方法,是用样本平均值来推断总体平均值,用样本成数推断总体成数及用样本方差推断总体方差。总体的特征值或测量值称为参数,它是总体与总体之间相区别的根据。样本的特征值或测量值称为统计量,它是总体内样本与样本之间相区别的根据。抽样信息推理的目的是用统计量来估计参数,所以统计量的抽样分布是用统计量来推断总体参数的基础。
由于客观事物的不确定性,总体中所包含的单位是千差万别的,通过抽取一部分总体单位作为样本而对总体进行估计,首先要求抽样必须遵守随机的原则,即总体中每一单位所抽中的概率是均等的。在这一条件下,有大数定理作为参数估计的可能性理论基础,及中心极限定理作为推断误差不超过某一范围的论据根据,从而使抽样信息推理建立在科学基础之上。
法国著名的《观点》杂志1987年在法国做了一项民意调查,调查要求法国人在最有魅力的职业,最有前途的职业,和最希望自己子女所从事的职业中各列出前十名。结果是信息学理论在“最有前途的职业”和“最希望自己子女所从事的职业”中都被推为榜首,在“最有魅力的职业中”名列第二,其他使人趋之若鹜的职业分别是医生、律师、教授、行政官员、研究员、商人、工程师、中小学教师和手工艺者。法国人那时对信息学所表现出来的热情和尊敬,代表了信息学研究自香农和维纳时代以来在全世界受人注目的程度。法国人所喜欢的信息学理论当然指的是信息科学理论,但它的进展却太有负众望了——直到今天还没有什么可以被公众认可的研究结果。因此,进一步的发展已不再是统一信息科学一直位于先锋地位,而是它和部门信息学一起齐头并进。在信息科学分头前进的六个分支中,生物信息学和动物信息学处于电讯信息学、计算机信息学、光信息学和人类信息学的外围。以传输和处理人类信息为已任的电讯信息学和计算机信息学一开始就是为人类信息学而存在和发展的,光信息学的主要任务今天已转到了人类信息的处理和传输上,因此在这四门核心信息科学学科中,电讯信息学、计算机信息学和光信息学所承担的角色是为人类信息服务的。如果说电讯信息学、计算机信息学和光信息学是18世纪工业革命后最闪耀着活力的技术理论的话,人类信息学就是这些技术理论存在的灵魂。
同样,在丹尼尔·贝尔、梅棹忠夫等人所倡导的,并切切实实向我们走来的信息化社会中,除了由人类需要和商业利益所驱使的信息技术在蓬勃发展之外,我们还需要一个以信息为中心的理论支撑,如果普通的信息科学最终对它也得不出什么有效结论的话——近四十年来的“信息科学”[22]实践越来越使人怀疑它向人们所做的美好承诺[23]——那么这个重任就落到了立足于对人类信息观察和研究的信息传播学上,而其中的人类信息学便是承担这种任务的中坚力量。
注释:
[1]信息传播学的概念最早出现在美国的夏威夷大学, 随后在罗特格斯大学、加州大学奇科分校、内布拉斯加大学,法国的巴黎第四大学、理尔大学,日本的东京大学,澳大利亚的南澳大利亚大学等学校出现。此外还有一些以“信息传播学”命名的学术研究团体。近年来一些政府机构也开始以“信息传播”命名,如法国工业、邮电和外贸部的信息与传播局,法国总理府的信息与传播处。
[ 2] 传播学中大量研究信息的文献如: Brent
Ruben 的Communication and Human Behavior,1988, Macmillan PublishingCompany 出版。
[3][苏]A·米哈依诺夫等人著,徐新民等人译:《科学交流和情报学》,科学技术文献出版社,1980年版。
[4]人类传播学校权威的著作,见Stephen Littlejohn 的Theoriesof Human Communication.从1978-1989年以来共出了4版, 出版者是Wadsworth Publishing Company。
[5]人类信息的概念最早出自认知心理学家Peter H. Lindsay 和Donald A. Norman 的Human
Information
Processing,AnIntroduction to Psychology,(New York:Academic Press,1970), 但人类信息学的概念是作者自己几年前提出的,日本学者倾向于叫社会信息(社会情报),二者所指内容一样。关于日本学者的意见请参阅日本东京大学的URL:http:∥www.tokyo-u.ac.jp 和日本群马大学的 URL:http:∥www.gunma.ac.jp。
[6]美国罗特格斯大学出了一套研究人类信息行为的丛书, 从1988年至今已出了6期,具体情况是: Vo1.1,Information and Behavior;Vo1.2,Infotmation and Behavior;Vo1.3,Mediation, Informationand Communication;Vo1.4,Between Communication and Information;Vo1.5,Interaction and Identity;Vo1.6,Media Literacy in theInformation Age.(New Brunswick:Transaction publishers)
[7]对普通信息的研究,见钟义信:《信息科学原理》, 北京邮电大学出版社,1990 年; 及Howard Resinikoff 的The Illusion ofReality,1980,Springer-Verlarg出版。
[8]Stonier,Tom,Information and the Internal Structureof the Universe,(London:Springer-Verlarg,1990).
[9]Schulze-Kremer, Steffen,
Molecular Bioinfornaeics:Algorithms and Applications, (Berlin: Walrer de Gruyter,1995).
[10] Hatase, Osanu and Wang, Jerry H.Bioinformatics,(Elsevier Science Publishers,1989).
[11][美]C.香农著,沈永朝译:《通信的数学理论》,载《信息论理论基础》,上海科学技术编译馆,1985年。
[12][美]Peter Coad,Edward Yourdon著,邵维忠等译:《面向对象的分析》,北京大学出版社,1992年。
[13]Schank,Roger C., Conceptual Information Processing,(New York:North-Holland Publishing Company,1975).
[14] Schank, Roger
C., Scripts, Plans, Goals andUnderstanding,(Hillsdale:Lawrence Erlvaum Associates,1977).
[15]陶同著:《对象学--大爆炸与哲学的振兴》,中国民航出版社,1996年。
[16]汪成为等著:《面向对象分析、设计及应用》,国防工业出版社,1992年。
[17]Matthews, P.H,Morphology,An Introduction to theTheory of Word- Structure,( Cambridge:Cambridge UnicersityPress,1974).
[18] 杨成凯:《Fillmore 的格语法理论》, 《国外语言学》, 1986(1)(上),1986(2)(下)。
[19]Gook,Walter A,Case Grammar Theory ,( Washington D. C:Georgetown University Press,1989).
[20]林杏光等编著:《现代汉语动词大词典》,北京语言学院出版社,1994年。
[21] 鲁川、 梁镇韩:《汉语信息语法》, 河南财经学院学报,1986(2),
[22]Wellisch认为.“信息科学”的概念1959 年第一次出现在美国宾西法尼亚大学的莫尔电子工程学院,见“From InformationScience to Informatics: A Terminological Investigation ”inJournal of Librarianship,Vol.4(July 1972),PP.164-187.
[23]例如Borko 很早就认为:“信息科学是研究信息的特性和作用,支配信息流的动力,以及处理信息,使之最便于获取并得以最佳应用的方法。信息科学所关注的是信息的产生、收集、组织、存贮、检索、解释、 传递、 转换和利用有关的知识体系。
”见“InformationScience:What Is It?”in American Documentation,1968,19(1)。