论统计函数_数学论文

论统计功能,本文主要内容关键词为:功能论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

一、统计与统计学的源流

统计是以数据为对象的活动。或许,我们的前人没有想到,人类最初的计数活动竟然会衍生出后来的算术(数学)、会计和统计等学科,以及为了解决计算及其相关问题的计算机科学与技术。数的概念是人类与生俱来的,本能的,尽管人类最初对数的表达能力极其浅陋。随着人类有关开发和利用自然资源知识的不断积累,以及人类内部为了不同利益而相互竞争所积淀的智能不断提升,人类最终形成了统一的阿拉伯数字和十进位制的计算规则,掌握了通过数据记录来反映和保存事实的方式,懂得了通过“数”来总结和认识规律的方法,逐渐形成了当今的算术(数学)、会计(学)和统计(学),只是算术沿着抽象数(即数字)的研究向“理”的方向发展,而会计和统计则基于现实数(即数据)的研究向“意”的方向发展。其中,注重每次经济活动结果(实物的和货币的)准确记录的方式和规则属于会计学的范畴,而通过数据研究去认识事物发展规律的方法则属于统计学的范畴。由于统计研究所涉及数据的类型与范围,以及处理数据的方法在一定程度上可以涵盖会计学,所以关于数的学科实际上是两类,即研究抽象数规律的数学和研究实际数规律的统计学。

显然,统计学的产生和发展是以研究实际数据的统计实践活动为基础的,而统计实践活动注定与人类社会活动浑然一体,不可分割。人类的生存与发展大概离不开三个最基本的数:人口、土地和财富,统计也确实是从这三方面的调查开始的。例如,约公元前2700年,古埃及为建造金字塔,进行了全国人口和财产的调查;约公元前2500年,古巴比伦统一了测地工具及单位长度;约公元前2100年,中国的夏禹将人口和土地数字铸于九鼎;约公元前400年,古印度建立了人口登记制度;同期,古罗马、雅典等也都进行了类似的调查。①到了封建社会,封建君主和精明的政治家日益意识到统计对于治国安邦的重要性,统计范围有所扩大。例如,中国战国时期的商鞅就曾指出:要使国家强盛,就必须知一十三数。到了资本主义社会,随着社会生产力的迅速发展和社会分工的愈益精细,统计除了满足政府管理需要外,还逐步扩展到工业、农业、贸易、银行、保险、交通、邮电和海关等经济领域,以及社会、科技和环境等领域,并且出现了专业的统计机构和研究组织,统计的重要性得到了充分的体现。②

在欧洲社会维护封建统治与文艺复兴、发展资本主义的冲突下,基于国家管理的需要和科学研究的推力,统计学于17世纪中期率先在欧洲产生,并且在信息归纳方法系统化研究过程中催生了两大学派:以德国康令、阿亨瓦尔等为代表的国势学派和以英国配第、格兰特等为代表的政治算术学派。国势学与政治算术学的研究目的和内容基本一致,即都以国家治理为目的,都以国家显著事项为内容,其根本区别在于研究方法的不同。国势学派主要采用形式逻辑比较法和文字记述法,给出了推理的一般根据,那就是“哲人的经验”和“历史的事实”,并以“比较级或者最高级的词语进行思辨式的议论”。这种记述和比较的过程已经隐含了归纳推理的思想。“历史的事实”是记述得来的,“哲人的经验”是在记述基础上经过比较得来的,都需要进行归纳,无非这种归纳是定性的而已。政治算术学派则采用计量归纳的方法,包括大量观察法、图示法、分组法、比较法、平均数法、相对数法、推算法等具体方法。配第在《政治算术》的序言写道:“我不采用比较级或者最高级进行思辨式的议论,相反地采用了这样的方法,即是用数字、重量和尺度来表达自己想说的问题。”③之后,苏斯密尔西则提出了大量观察法,目的在于归纳出随机现象的运行规律。

尽管后人认为国势学有统计学之名无统计学之实,但作为开创统计思想争论先河之一的学派,对今后统计学的发展仍然起到了深远的影响,至少它的对国家重大事项即国情国势进行研究和总结,以便为统治者提供依据的思想,成为了统计学研究的主要出发点之一,并且为之后社会统计学派的形成奠定了基础。尤其是国势学的初步比较归纳思想,为今后定量归纳推理思想的形成起到了积极作用。④政治算术学派无统计学之名但有统计学之实(尽管有人认为政治算术是政治经济学的起点而不是统计学的起点⑤),以其更科学的定量分析思想赢得了声誉,为日后统计学的发展指明了正确的方向,奠定了坚实的方法论基础。国势学派与政治算术学派的争论,促成了古典统计学后期两者的思想渗透和交融。虽然在统计学属于实质性社会科学还是方法论科学的问题上还有异议,但其中基于定量的归纳分析方法得到了承认,确立了统计学的定量的特质。正是有了这样的基础,统计的实践应用领域才得以不断拓展,统计学也最终得以发展成为研究现象数量的方法论科学。

18世纪中后期以后,尽管也存在社会统计学派与数理统计学派、旧数理统计学派与新数理统计学派等争论,但随着概率论的引入、数据描述与推断思想的发展以及相关学科的相互渗透,统计的“归纳”与“量化”方法不断创新,统计在探究未知、表现事物数量关系方面的能力不断增强,在生物研究、天文观测、生产质量管理、经济预测预警、国民收入核算、最优决策、风险控制等方面不断展现出其独到的作用,成为了不可缺少的角色。著名遗传学家、统计学家高尔顿就曾在研究生物遗传过程中发出这样的感叹:统计学具有处理复杂问题的非凡能力,当科学的探索者在前进的过程中荆棘载途时,或许唯有统计学可以帮助他们打开一条通道。⑥事实也正是如此,当今人类社会无论是宏观的国家管理还是微观的企业治理、无论是科学研究还是日常生活,哪一个方面可以远离统计学而存在?

有人在总结20世纪对人类社会发展贡献最大的学科时,统计学不仅入围而且名列前茅,也得到了社会公众的普遍认可。显而易见,统计之所以会无所不在,统计学之所以能够成为一门重要的学科,是由其自身难以替代的功能所决定的,即满足人类社会渴望获知大量而又不够充分的数据背后的秘密的功能。那么,统计功能体现在哪些方面?统计功能的科学内涵是什么?如何实现统计功能?这些方面还有很多问题值得我们思考。

二、统计功能表现

关于统计功能表现,国内外已有众多专家学者进行了概括评述,有的直接提出了功能说,有的则基于应用、作用、角色、价值或哲学等角度进行总结。例如,皮尔逊根据格兰特的《对死亡表的自然观察与政治观察》和比利时统计学家凯特勒提出的“平均人”思想,最初将统计功能主要定位于“对人口群体特征的研究”。史蒂芬和罗伯特认为统计学的重要意义体现在:作为一门学科,它在不同的领域都拥有广泛的应用;作为一门技能,它可以给具备好的定量技能的人提供一个有趣和充满挑战的职业生涯。⑦隆认为,统计最重要的三个应用领域是:学术、工业企业和政府统计。⑧丹尼斯则认为统计是一门“应用科学”,它具有直达本质的特点,这一特点在处理变化的、不确定的事物时比应用科学更为重要。例如,统计与农业的联系比物理与农业的联系更为密切。⑨其实,早在1953年,费希尔就曾指出:统计学是人类发展中的奇葩,它对20世纪人类的发展做出了特殊的贡献,它能触及当下社会人类重要活动的本质。⑩其实,统计功能的表现是多方面的,有形与无形、具体与潜在交织在一起。归纳起来,主要表现在以下几个方面:

一是认识分析功能。这方面的功能主要体现在观察、认识和分析事物上,即作为认识和分析的工具。早在1891年,美国政治和社会科学研究院就指出:统计学的特点是深入研究大量关于自然现象和人类文明的数据,通过对典型事件运用分类和说明的方法,从而科学分析研究政治与社会现象,这些典型事件包括:人口、宗教、职业、各行业经济等。(11)也就是说,统计功能首先表现在对最基本的社会经济现象的认识和分析上。社会学家奥格本则认为统计学开创了一条人类探索科学、认知社会的道路,它将分歧越来越大的学科纳入同一条轨道上面。(12)史蒂文斯认为统计具有总结借鉴的功能,在错综复杂的事物中直截了当地将事物的共性总结并放大。(13)戴维明确指出,统计学最根本的功能是帮助我们通过分类和测度收集到的信息来了解这个世界,这也是它为什么能够延伸到众多领域的原因。(14)他还认为,统计在社会科学中一个最基本的作用,就是为解决问题提供一个量化的方法和思路,使得问题能够有条理和科学地解决。安德斯认为,统计学能运用分析方法从一般现象中提取有效信息来解决问题(15),这与琳妮的“统计学在解决社会问题时扮演着一个主要角色”(16)的观点一致。哈特利则这样定位统计学:统计学既是一门应用科学,也是一个学术门类,它是通过不确定信息了解现代社会最主要的方式。(17)这些观点都充分表明,随着人们对定量研究的日益重视和统计方法在众多领域的应用,统计的数据分析功能日益受到了重视和肯定,其原因就是它提供了一套分析数据的方法和工具。

二是管理决策功能。这方面的功能主要体现在国家和社会管理上,即作为管理决策的工具。最初,国势学派代表人物阿亨瓦尔认为统计学是把国家显著事项全部记述下来的学科,主要用对比分析的方法研究了解国家组织、领土、人口、资源财富和国情国力,比较了解各国实力的强弱。显然,记述国家显著事项的目的是为了国家治理。有的专家则从社会评价与组织能力的角度来定位统计功能,认为统计的演进不仅是广泛地定量化分析社会发展与现代化的先决条件,其本身也是评价社会现代化的一个标准。这种现代化体现在一种控制、引导社会经济过程与发展的“集散能力”中。统计能够集合一个组织、一个州甚至一个中央政府,政府统计在这方面的能力尤为突出。(18)理查德也有类似的看法,认为统计学的计量与预测方法在现代科学技术管理中发挥着核心作用,其神奇之处在于其自我应验原则,统计信息通常与一个组织的成功相联系,当大量良好的数据被收集后,组织将最终获得实际的成功。(19)莫尔也认为,如果没有统计相关内容,就难以对政治问题做出思考,至少是对国内的政治。所以看懂统计数据是人民参与政府事务、理解政府政策的关键环节。(20)法比安的评价则更为具体,认为统计学遍布生活的角角落落,涉及教育、工作、媒体、健康等各个方面,关系到每一个居民。新闻媒体对统计结果越来越重视;居民个人可通过评估身体素质统计数据来了解健康状况;绝大部分的公共事务,如医疗保健和社会保障,都有赖于数据管理。(21)可见,统计的管理功能渗透在从微观到宏观的方方面面,难怪曾有多位学者这样定位统计:历史是过去的统计,统计是当下的历史。

三是科学研究功能。这方面的功能主要体现在科学研究应用上,即作为科学研究的工具。很多专家学者都曾经这样总结统计学的作用:统计学与数学一样,其重要意义在于为科学研究提供了一门通用的语言。可以说,现代科学研究如果离开统计学将寸步难行。布鲁斯、乔恩和戴维认为,统计学主要应用于生物科学、工程和工业统计、地理和环境科学、信息技术、物理科学、社会和经济科学六个领域,统计学者的核心工作是构造用于在数据中提取信息的数学和概念工具,最终目的是为经验工作提供有用的信息。(22)戈丁则认为,统计学对基础研究起了重要作用。没有统计调查和统计数据,基础研究的概念永远不会成型,更不会像现在这样发展。(23)法比安也曾指出,统计学是科学的一个衡量标准,科学知识必然包含统计知识。统计学是跨学科的,并渗透到了现在社会的各个方面,正如科学素养已经被用来解释科学与社会的关系,统计数据可以为从对待科学态度的调查中得到的经验主义结论提供解释依据。(24)米隆也强调指出,人类活动的发展离不开一个宽广的统计视野,作为一门技术,统计学是其他科学的基础,它具有无与伦比的价值。米隆还把统计看成人类福利的最主要推动力量,认为统计能增强我们对数据的理解,从而促进人类的福利,提高我们的生活质量,让人们幸福安康。(25)

四是评估预测功能。这方面的功能主要体现在科学评估(评价)和预测未来上,即作为评估与预测的工具。如今,通过运用现代统计手段测量评估社会绩效、发展潜力、竞争优势、生存质量、社会变革、生活条件、福利水平等已经司空见惯。亨利认为,统计学可以广泛运用于政策研究和评价研究,即通过向社会公众展现统计信息以避免混淆视听,并且认为制定和展现统计数据有三个基本原则:可理解性、可解释性和可比较性。可理解性保证了不需要掌握专业的统计方法就能理解统计信息;可解释性保证了统计信息可以用熟悉、具体的数据单位来解释;可比较性保证了统计信息有标准的度量尺度,可以做出横向和交叉比较。(26)哈尔则高度认可统计的预测功能,认为统计是可以预测未来的无价之宝。(27)密契尔和米特哈特也认为近年来评估和预测已成为应用统计工作的重要内容,并强调现代预测工作的重点是增量预测精度。(28)谢邦昌也指出:统计的主要功用是使信息变得更有意义、处理不确定性的问题、分析各种变项之间的关系和预测,统计学正是利用了这四件法宝完成了各个不同领域的不同任务,将杂乱无章的资料经由分析整理之后,成为有用的资讯。(29)可见,统计承担着通过搜集和筛选信息来说明社会现状、并对未来走势进行预测的重任。可以说,统计学是一门研究国家发展进程的历史,而统计学家则是研究未来的历史学家。

五是思维推理功能。这方面的功能主要体现在思维方式和推理方法上,即作为思维与推理的工具。笔者认为,统计学之所以能成为一门学科,关键就在于其与众不同的定量思维推理方式。理查德指出,19世纪统计学的发展使统计数据的广泛收集和利用得到完善,而且统计学和数学概率的一起出现使得人类社会与个人的概念发生了改变。(30)美国政治和社会科学研究院更直接地认为,统计学是一门富于逻辑性的学科,统计的科学性在于其独特的方法,不考虑它所应用的对象,所以很容易就能把这个方法看成是逻辑学的一个分支,看成是合乎逻辑的思维过程,并具有一定的科学独立性。(31)哈金认为统计学是20世纪最重要的发现之一——一门重塑了我们生活的科学,因为统计推断是一种新的推理方法,统计学家改变了我们推理、实验和评价的方式。(32)因为如此,琳妮认为,20世纪初威尔斯的预言“总有一天,统计的思维方式将如读书和写字一样,成为每一个人的必备的能力”已经成为现实(33)。佐依、阿斯帕西娅和詹妮也认为,近年来现代社会对统计学教育的关注度越来越高,对统计思想、统计素养、统计推理的研究愈加密切。(34)陈希孺也曾指出:统计学,或者说统计的观点,是一种看待事物的思想方法。受过统计学熏陶的人易于倾向对事物采取一种平衡和稳健的观点而不走极端。它的重视凭数据说话并充分估计到偶然性的学科特点,对人有一种潜移默化的影响。(35)因此,从某种意义上说,我们学习统计学首要的就是学习其独特的思维推理方式,而不是仅仅记住一堆公式。

当然,上述关于统计功能表现的归纳只是相对的,并且难免有所遗漏。综观各种概述并根据自己的体会,统计的基本功能就是,通过独到的定量分析方法和思维方式帮助人们实现:(1)认识和掌握客观事实;(2)归纳总结事物发展规律;(3)作出合理的推断(包括估计与预测);(4)揭示事物之间的内在联系;(5)为规避风险、最优决策提供依据,从而满足人类的政治性、经济性、公共性和学术性目的。(36)如果用一句话概括,那就是“用数据告知什么是最可能的”。

三、统计功能的学科含义

要理解统计功能,必然离不开对统计学含义的理解。关于统计学的定义,历史上曾经有几百种之多,但核心意思大致相同。统计学名称最早由国势学代表人物阿亨瓦尔首创,他于1749年在《近代欧洲各国国势学纲要》一书中,为自己所研究的这门学科取了一个新的德文词汇“statistik”,即统计学。(37)1787年,齐麦曼发现,虽然国势学派和政治算术学派的思维工具(文字与数字)和研究的具体对象不同,但思维方式却是相同的,即从个体到体系的归纳思维,因此可以共用一个名称“statistics”(使用归纳思维的科学),把词意更新为“归纳思维+文字、归纳思维+算术计算”。(38)19世纪末,日本学者横山雅男把克尼斯的“归纳思维+算术计算”,译成日语汉字:统计,“统”字表示归纳思维,“计”字表示算术计算。由于“统”还具有全局的意思,“计”意味着量化,因此,统计就是基于总体视角和归纳思维的计算,而统计学则为这种计算提供理论和方法。可见,“总体、归纳、数量”成为了统计及其学科的基本特征,是统计学区别于其他学科的根本所在。基于历史的考察,我认为可以从以下三个方面的统计学科含义来深入认识统计功能。

首先,统计学是“政治+算术”。为什么17世纪中期的配第所著《政治算术》被认为是统计学的起源之作(尽管有争议),而不是中国早1600年的汉朝的《九章算术》?一个根本的原因就在于前者有“政治”,是基于政治的算术,而后者只是纯粹的算术。那么,为什么加了“政治”的算术就是统计学呢?因为政治就是现实,政治就是人类社会存在的组织机制,某种意义上讲就是国家治理,也是人们的主观意志或愿望,因此满足政治需要的算术其目的是十分明确的,其内容是与政治紧密联系的国家显著事项及相关问题,算术的结果则是能客观反映事实并据以进一步分析内在联系的各种数据。这正是统计本质特征的最初体现。配第撰写《政治算术》以欧洲文艺复兴和崇尚科学为推力,以英格兰面临外部与荷兰、法国交战,内部面临瘟疫、失业双重压力为背景,以为新兴资产阶级巩固政权提供佐证为目的,以英格兰、荷兰、法国、爱尔兰等的实际调查数据或观测数据为主要素材,以现在仍然广为使用的分组法、比较分析法、推算法和图表法等为主要分析研究方法,以相关国家实力比较的优劣为主要结论。很显然,这里的算术不是单纯的算术,而是有政治目的、有实际内容、有科学方法的算术,并且内容与方法都取决于目的。实际上,统计的实践历史也充分说明了统计满足于统治者治理国家需要的政治性,并且具体体现在人口、土地、财富和军力等的统计上,这些至今还是政府统计的主要内容。这说明,只有以现实数据为对象的“术”才有可能成为统计的“学”。更进一步说,统计的这种政治性是存在于人们认识客观事物的态度和方式上的,或者是人们主观愿望与事物客观本质的结合上的,即如何通过对现实问题的统计来达到人们的主观目的,这正是统计功能的根本所在。在实践的基础上,把实现人们这种目的的统计方法系统化,就形成了统计学,并且不断地在人们主观愿望与事物客观本质的对接中完善与发展。所以说,统计功能的发挥就是人们意图的实现,也就是统计目的性思想(39)的实现。

其次,统计学是“哲学+数学”。就当今学科而言,恐怕没有像哲学和数学这样基础的学科了,因为尽管古代哲学是所有学科的总称,包含数学在内,但现代意义上的哲学和数学已经分别朝着定性与定量这两个方向发展了。哲学与数学的共性是都属于抽象思维的方法论学科,不同之处是前者属于纯定性思维而后者属于纯定量思维,这是两个极端。那么,人类对于客观世界的认识与研究是否非定性即定量呢?答案是否定的,人类认识客观世界既要定性也要定量,需要定性与定量相结合,因为人类不是生存于真空的世界。这就需要有一门能把定性分析与定量分析相结合的思维方法论学科,这就是统计学。可以说,正是在哲学与数学的分野过程中,统计学得以诞生。统计学的诞生过程,实际上就是哲学思想与数学思想融合的过程,就是定性方法与定量方法结合的过程。统计学作为量化和表现不确定性现象数量特征的科学,其基础与很多哲学思想有关,例如物质运动、辩证分析、逻辑推理等思想,因此可以说哲学为统计学提供了在统计分析研究中如何进行定性思维的方法论。与此同时,统计学作为探求事物本质和提供新知识的方法论,其基础也与很多数学思想有关,例如变量设计、函数构造、概率与数理分析等思想,因此也可以说数学为统计学提供了在统计分析研究中如何进行定量思维的方法论。当然,统计学与哲学、数学存在着本质的区别:统计学区别于哲学的是提供用“数”来揭示事物本质的方法而不是定性的方法,即提供一种能从数量上进行辩证分析、逻辑推理和反映事物运动过程及本质的世界观与方法论;而统计学区别于数学的是提供能获取有具体含义的“数”的方法而不是机械演算、纯粹数理推理的方法,即提供一种怎样获取数据、怎样进行推断分析才能达到客观认识事物本质、解决实际问题的方法论。所以说,统计学实际上是一种定量的哲学或定性的数学(40)。可见,统计功能是在定性分析与定量分析的结合过程中发挥的。如果说哲学是一切科学的科学,数学是一切科学的基础,那么统计学就是一切学问的学问。还需要说明的是,哲学的纯定性结论没有对错之分,数学的纯定量结论一定存在唯一正确的答案,而统计的结论则是既定量也定性,既有正确的答案但又没有唯一正确的答案。

再次,统计学是“数据+方法”。人们希望借助统计数据来反映事实、说明问题,希望运用统计数据去揭示事物的内在联系、预测未来,即借用统计数据“说话”,通过数据说话来实现统计功能。然而,尽管统计数据客观存在,但却不会自己跳出来,需要人们去收集、整理和分析。如何收集、整理和分析?这就必然涉及方法论问题。或许有人会说,弄几个数据还不简单,何须这样或那样的方法?要知道,人类社会以及人类所要探求的未知世界是如此的复杂多样,以至于我们所面对的事物是如此的充满不确定性。没有科学的方法,我们的探求之路从何起步?因此,统计通过数据发挥功能不会自然实现,必须以一整套特有的科学方法为支撑,统计学所要解决的就是实现统计方法与统计数据的内在结合。这种结合不仅仅是为了获得统计数据本身,更主要的是要弄清楚统计数据的意义,让数据有生命、有灵魂。因此,从统计活动产生开始,到统计学的形成与发展,一条很清晰的主线就是统计方法的不断创新、完善和积累,不断地实现统计方法与统计数据结合的新突破。当然,统计方法与统计数据的结合不是盲目的,必须首先明确人们需要什么样的统计数据、统计数据有哪些类型、分别有什么作用等问题,然后在不同的数据处理阶段采用不同的统计方法,例如数据收集阶段、整理阶段和分析阶段都有相应的统计方法,并且构成一个相互衔接与补充的方法体系。常用的统计方法包括大量观察法、统计分组法、综合指标法、归纳推断法和统计模型法等,并可相应地归入描述统计方法和推断统计方法两类。在实践中,统计方法可以具体地通过“察、量、分、合、标、表、较、联、估、预、限、策”(41)这12个字表现出来,并且也通过它们来达成人们的目的。在这里还需要强调两点:一是统计方法尽管是定量的方法,但难以脱离定性方法而单独存在,它是定性基础上的定量方法;二是统计方法与统计数据相辅相成,没有统计方法就没有数据,但没有对数据本身的认识和研究也难以产生统计方法,因此一方面统计方法产生统计数据,另一方面统计数据催生统计方法。

由以上阐述可见,统计学是基于客观现象的总体性、数量性和差异性而形成的,以现象数据为研究对象的、带有应用领域实质性的方法论科学,其任务就是实现目的主观性、对象客观性和方法科学性三者的统一。

四、统计功能的实现

统计功能的实现并非易事,因为如何通过算术去实现政治意图,如何达到定性与定量有机结合,如何使用方法去处理统计数据,处处充满着不确定性因素,处处需要灵光智慧。

统计的研究对象就是现象的数据,这也正是上述三种学科含义的共性所在。我们的社会同时受到“无形的手”和“有形的手”支配,并且这两只手的力度是变化着的。因此,来自现实的数据既具有一定的随机性但又不完全随机,属于半随机状态。完全随机和完全不随机的数,属于数学研究或数学阐释的范畴,而这种半随机性的数据则历史地归于了统计研究的领域。统计数据的半随机性,主要体现在如下几个方面:一是个体的差异性。众所周知,构成现象总体的大量个体之间既具有共性,更具有差异性,而这种差异性的存在是由众多因素共同影响决定的,例如有些是先天的、有些是后天的,可谓原因十分复杂。所以,任何客观事物或现象的数量特征之间的差异,绝非纯随机形成的。二是数据收集的复杂性。不论是全面调查观察还是抽样调查观察,我们都难以排除人为干扰和工作差错对统计数据的影响,包括数据的准确性、完整性和及时性,更何况抽样调查还有一个样本代表性高低的问题。在很多情况下,能够完整地获取所观察个体或事物的数据变成了一件很奢侈的事情。三是数据整理与表示的非标准性。当我们获得原始数据后,如何分组、用何种分布描述、用什么指标综合、权重如何确定等问题,就成了影响数据性质的一系列后续因素,因为没有统一的标准,这些方面往往受到人们主观因素的影响(习惯、知识、判断等),稍有不同结果就不一样。所以,任何一个看似简单的统计数据,其背后都交织着各种复杂的影响因素。从某种意义上说,没有一个统计数据是纯粹描述得到的,也没有一个统计数据是纯粹推断得到的,而是描述与推断合一的结果。

根据半随机性数据所做的推断和分析,自然面临着众多的选择,除了统计数据本身的原因外,通常还受如下一些因素的影响:一是对所研究问题背景的了解程度。对背景的了解程度不同,会影响看问题的角度和分析问题的深度,影响对数据与问题最佳结合点的判断,最终影响分析的结论。这也正是为什么专家们常常对经济形势等判断大相径庭的原因所在。二是方法的选用。同样的统计数据用不同的方法进行分析,自然得到不同的结论,因为任何方法的应用都有前提,前提条件越得到满足,所得的结论越有说服力。最怕的是见到数据就搞模型,看到人家用这个方法就跟着用这个方法,全然不顾方法应用的前提条件是否成立。这也正是我们总是难以准确预测经济危机等现象的原因所在。三是对数据本身意义的理解。同样的指标、同样的数据,如果对其本身意义的理解不一样(往往与指标口径不一、计算方法多样、临界值不明确等有关),就会形成不同的结论。这也正是人们常常对例如基尼系数、通货膨胀率、失业率等数据产生分歧的原因所在。很显然,如此众多的不确定性,必然影响统计功能发挥的充分性与有效性。所以,统计学的一个贯穿始终的任务就是不断在总结的基础上完善和创新“能在半随机状态下获得尽可能准确和可信的数据”的统计方法,也就是不断提高能在众多可供选择的数据结论中甄别出最可能结论的能力,即前述的“用数据告知什么是最可能的”。

如何提高统计的“用数据告知什么是最可能的”能力,以最大限度实现统计功能?这就需要掌握正确的统计思想,明确为何统计、统计什么和如何统计,并实现三者的有机统一。笔者认为,一般而言应该掌握九大统计思想:把握全局的总体性思想,胸有成竹的数量性思想,知己知彼的调查性思想,合理定位的差异性思想,高瞻远瞩的推断性思想,科学决策的风险性思想,随机应变的偶然性思想,独具慧眼的关联性思想和以质取胜的误差性思想(42),并把它们形成一个有机的整体。就统计方法论而言,我们认为当前应着重研究如下一些问题:在数据描述方面,一是需要进一步研究变量分布特征的类型,增加可选择的余地,提升各种分布函数相互转换的能力;二是进一步探讨统计指标的方法论,特别是指标的质与量的统一问题,科学的统计指标能够极大地增强统计的功能。在数据质量方面,要结合实际应用领域深入研究误差分解、控制与利用的问题,特别是在弄清楚误差分解后如何有效利用误差的问题。误差的存在不可避免也不可怕,可怕的是我们弄不清楚误差的构成及其自身的正面意义。在估计推断方面,要更关注多种估计方法的结合应用,例如传统估计方法与贝叶斯估计思想的结合;要更系统探讨辅助信息利用、小样本估计、非完全随机抽样估计等问题,以进一步提升“有限信息”情况下估计推断的可靠度与精确度。在预测推断方面,除了继续探讨预测模型、因素分解等问题外,更重要的是对通常被忽视的不规则变动因素量化及影响效应测定的研究,因为不规则因素实际上就是半随机因素,在一定的条件下它对事物的发展方向可能也会起重要的甚至关键的作用,预测推断的准确性也往往取决于似乎并不起眼的不规则因素。在因果推断方面,核心问题始终是因果关系是否确实存在的问题,所以我们所面临的难题是如何筛去那些表面的关系而发现那些确实存在但有“看不见的联系”,正如古希腊哲学家赫拉克利特所说“看不见的联系比看得见的联系更牢固”(43)。所以,任何因果推断模型都不是纯数量的模型,都不能背离事物内在的看不见的联系,否则毫无意义(事实上大量的因果模型都犯了这方面的错误)。因此,我们一定要特别注重模型的假定条件是否满足以及满足与否的可能意义。在逻辑思维方面,我们要深化研究“统”的逻辑、“计”的逻辑以及“统”与“计”结合的逻辑,需要博采其他学科之众长来加厚统计的逻辑思维功底,并逐步形成特有的基于半随机状态和不充分信息的统计逻辑思维方式,奠定实现统计功能的坚实基础。

要实现统计功能,我们还必须克服一些错误的认识,例如:只有数理统计学才是统计学、统计万能、统计无用、统计分析就是纯定量分析、统计方法越复杂越科学,等等。正如斯科特所说,统计不是存在于真空中的,它是一个有定量补充的定性研究,在统计中滥用诡辩而不是严谨地使用分析方法将给统计带来不好的声誉。(44)

注释:

①④⑤陈善林、张哲:《统计发展史》,第14-22、80-82、87-88页,上海,立信会计出版社,1987。

②李金昌、苏为华:《统计学》,第2页,北京,机械工业出版社,2007。

③高庆丰:《欧美统计学史》,第36-37页,北京,中国统计出版社,1987。

⑥陈善林、张哲:《统计发展史》,第216页。

⑦J.Stephen Ruberg and Robert L.Mason,"Increasing Public Awareness of Statistics as a Science and a Profession-Starting in the HighSchools",The American Statistician,Vol.42,No.3,1988,pp.167-170.

⑧L.Miron Straf,"Statistics:The Next Generation",Journal of the American Statistical Association,Vol.98,No.461,2003,pp.1-6.

⑨V.Dennis Lindley,"The Philosophy of Statistics",Journal of the Royal Statistical Society.Series D(The Statistician),Vol.49,No.3,2000,pp.293-337.

⑩R.A.Fisher,"The expansion of statistics",J.R.Statist.Soc.A,116,1953,pp.1-10.

(11)American Academy of Political and Social Science,"The History of Statistics",The ANNALS of the American Academy of Political and Social science,partl,1891,pp.13-100.

(12)W.F.Ogburn,"Statistics and Art",Journal of Amnericanl Statistical Association,No.27,1932,pp.1-8.

(13)S.S.Stevens,"Measurement,statistics and the schemapiric view",Science,161,1968,pp.849-856.

(14)David J.Bartholomew,"What is Statistics",Journal of the Royal Statistical Society.Series A(Statistics in Society),Vol.158,1995,No.1.

(15)Anders Hald,"A History of Probability and Statistics and Their Applications Before 1750",Applied Psychological Measurement,vol.14,No.3,1990.

(16)Lynne Billard,"The Role of Statistics and the Statistician",The American Statistician,Vol.52,No.4,1998,pp.319-324.

(17)H.O.Hartley,"Statistics as a Science and as a Profession",Journal of the American Statistical Association,75,1980,pp.1-7.

(18)SAGE Publications,"Historical Sources of Statistics",Current Sociology,Vol.49,No.4,1975,pp.114-139.

(19)Richard Stivers(2004),"The Role of Statistics in Management Magic",Bulletin of Science,Technology & Society,April,2004.

(20)D.S.Moore,"Statistics among the Liberal Arts",Journal of the American Statistical Association,93(444),1998,pp.1253-1259.

(21)Fabienne Crettaz von Roten,"Do We Need a Public Under-standing of Statistics?",Public Understanding of Science,No.15,2006,pp.243-249.

(22)Bruce Lindsay、Jon Kettenring、David Siegmund:《统计学:二十一世纪的挑战和机遇》,载《数理统计与管理》,2005(5)。

(23)Benoit Godin,"Measuring Science:Is there 'Basic Research' without Statistics?",Social Science Information,Vol .42,No.1,2003.

(24)Fabienne Crettaz von Roten,"Do We Need a Public Understanding of Statistics?",Public Understanding of Science,15,2006,pp.243-249.

(25)Miron L.Straf,"Statistics:The Next Generation",Journal of the American Statistical Association,Vol.98,No.461,2003,pp.1-6.

(26)Henry May,"Making Statistics More Meaningful for Policy Research and Program Evaluation",American Journal of Evaluation,Vol,25(4),2004.pp.525-540

(27)(1914)Hull,,"The Serive of Statistics to History",Journial of American Statistical Association,14,1914,pp.30-39.

(28)Michael W.Kattan,Ph.D.,Mithat Gnen,Ph.D.,"The prediction philosophy in statistics",Urologic Oncology:Seminars and Original Investigations,Vol.26,2008,pp.16-319.

(29)谢邦昌:《邦昌随想——统计有用论》,载《中国统计》,1999(4)。

(30)Richard Stivers,"The Role of Statistics in Management Magic",Bulletin of Science,Technology & Society,April,24(2)2004.pp.99-106

(31)American Academy of Political and Social Science,"The History of Statistics",The ANNALS of the American Academy of Political and Social Science,part1,1891,pp.13-100.

(32)Hacking,I.,"Trial by Number",Science No.9,1894,pp.69-70.

(33)L.Lynne Billard,"The Role of Statistics and the Statistician",The American Statistician,52(4),1998,pp.319-24.

(34)Zoi Nikiforidou,Aspasia Lekka,Jenny Pange,"Statistical literacy at University Level:The Current Trends",Procedia Socialand Behavioral Sciences,No.9,2010,pp.795-799.

(35)陈希孺:《统计学的意义》,载《中学数学月刊》,2004(2)。

(36)李金昌:《统计思想研究》,第40页,北京,中国统计出版社,2009。

(37)高丰庆:《欧美统计学史》,第22页。

(38)薛仲山:《高等统计学》,第1页,上海,商务印书馆,1951。

(39)李金昌:《关于统计思想若干问题的探讨》,载《统计研究》,2006(3)。

(40)李金昌:《关于统计思想若干问题的探讨》,载《统计研究》,2006(3)。

(41)李金昌:《统计思想研究》,第48页。

(42)李金昌:《简论管理统计思想》,载《管理世界》,2008(10)。

(43)龚云、彭克慧:《哲学的故事》,第15页,北京,光明日报出版社,2005。

(44)Doug Scott,"Making the Most of Statistics",Business In-formation Review,Vol.3(3),1987,pp.14-23.

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

论统计函数_数学论文
下载Doc文档

猜你喜欢