基于聚类分析的区域创新能力差异研究_聚类论文

基于聚类分析的区域创新能力差异研究，本文主要内容关键词为：创新能力论文,差异论文,区域论文，此文献不代表本站观点，内容供学术参考，文章仅供参考阅读下载。

[中图分类号]F129.9

[文献标识码]A

众所周知，区域技术创新能力是决定区域产业发展水平和经济增长实力的关键因素，深入研究技术创新能力区域差异，分析其产生的原因，对于指导我国政府制定有效的技术创新政策，形成合理的格局，促进各地区加快提升整体技术创新能力，有着重要的现实意义。区域有不同的划分方法，考虑到统计数据的来源和讨论问题的方便，本文所探讨的是基于省级行政区为“区界”的技术创新能力区域差异与特征问题。

我国是一个有着十多亿人口的发展中大国，共有31个省（区、市）（不包括港、澳、台），发展很不平衡。影响区域创新能力的因素众多，关系复杂，仅凭经验判断或简单的数据分析来研究我国的区域创新能力差异是不够的，必须借用科学、系统的方法。在这方面，基于多元统计的聚类分析提供了一种较为有效的工具。

一、区域技术创新能力评估指标体系设计

区域技术创新能力评估涉及到若干参数，其指标体系的设计和指标的选择，是进行聚类分析的一个关键步骤。

1.评估指标体系的设计原则

(1)科学性原则：区域技术创新能力评估指标体系要能够全面、准确、客观地反映区域技术创新能力的现状及态势。

(2)系统性原则：区域技术创新体系是由若干相互依存的部分构成的具有特定功能的体系，区域技术创新能力是区域创新体系整体功能的体现。

(3)动态性原则：区域技术创新体系是一个动态系统，对区域技术创新能力评估必然是跟踪性评估，具有明显的动态性。

(4)可比性原则：不同区域在同一评估指标上的定义区间、数量化标准等应相同，相互间可加、可比或经换算后可加可比。

(5)可操作性原则：所构成的评估体系要便于实际使用，选取的评估指标要有可以测量和量化的办法使之实现，其评估指标数据最好能在国家及有关部门发布的统计资料中可查。

2.指标体系结构

技术创新是企业家抓住市场的潜在赢利机会，以获得商业利益为目标，重新组织生产条件和要素，建立起效能更强、效率更高和费用更低的生产经营系统，从而推出新的产品、新的生产（工艺）方法、开辟新的市场、获得新的原材料或半成品供给来源或建立企业的新的组织，是包括科技、组织、商业和金融等一系列活动的综合过程[1]。由于创新内容的广泛性，创新过程的复杂性，以及创新影响的时滞性，所以对区域创新能力进行评估要有一个合理的指标体系。根据指标体系设计原则，考虑到统计数据来源，我们选取了如下包括科技投入和科技产出两类要素的十个指标（见表1）。

表1　区域技术创新能力评估指标体系

二、区域技术创新能力的聚类分析

系统聚类分析的基本思想是最开始时每个观测值自成一类，然后根据观测值之间的相似程度并类，并计算新类与其它类之间的距离，再选择相近者并类，每合并一次减少一类，继续这一过程，直到合成一类为止。在聚类过程中，我们选用默认的平方距离来度量类与类之间的相似程度，聚类方法采用类平均法。

1.聚类过程

表2　系统聚类过程

我们以31个地区为研究对象，选取表1中十个反映技术创新能力特征的指标，采用《中国科技发展研究报告(1999)》中的系列统计数据[2]，应用SAS软件对31个地区进行系统聚类，得到表2所示的聚类过程。表2中NCL(Number of Clusters)为聚类数；Clusters Joined为每次聚成一个新类的两个样本或旧类（标有CL）；FREQ(Frequency of New Cluster)为新类中所含的样本数；DIST(Normalized RMS Distance)为标准化的RMS距离，即类间除以观测值间距离均方根而来；SPRSQ为半偏R[2]，表明此次合并所引起的类内离均差平方和的增加，即此次合并对信息的损失程度。从这列数据可以看出，由三类合并成两类时损失（为0.38393）最多，此统计量表明分成三类最合适；另外从五类合并为四类时损失（为0.10314）也较多；CCC为立方聚类判据，它在NCL=3时出现峰值，支持分三类；PSF(Pseudo F)为伪F统计量，PSF出现峰值时所对应的分类数较为合适，从该列的数值可知PSF在NCL=3、5、13、15、27时5次达到峰值；PST2(Pseudo t[2])为t[2]统计量，PST2出现峰值的前一行所对应的分类数较为合适，从该列的数值可知PST2在NCL=2、4、7、12、19、23时6次达到峰值，其中第2、7次较陡。综合这四个统计量可知：将29个观测量（重庆、西藏有缺失值，故未参与聚类）分为三类最合适，分为五类、八类也有一定意义。根据表2，可作出图1所示的聚类谱系图。

图1　区域技术创新能力差异聚类谱系图

当我们取阈值为0.54、0.8和1.5时（图1中虚线处），29个样本被分别分成了三类、五类和八类，各类包含的样本如下（见表3）：

表3　分别按三类、五类和八类划分时，各类所包含的样本一览表

（注：重庆、西藏有缺失值，故未参与聚类。）

从图1和表3可以很直观地看出具有不同技术创新能力的地区之间的动态聚类过程、相互关系及其细微差异。

2.结果分析

根据上面的聚类分析，我们可以得出这样的结论：(1)广东、北京、上海属于创新能力最强的地区。在这三个地区中，广东比较特殊，单独构成一类（据有关资料研究表明[2](P138-158)，广东主要是在科技经济一体化方面显示了它的独特优势）；(2)辽宁、江苏、山东属于创新能力较强的地区；(3)河北、河南、湖北、黑龙江、湖南、四川、浙江、福建、吉林九省属于创新能力中强的地区；(4)山西、内蒙古、江西、广西、贵州、甘肃、青海、宁夏、海南、安徽、陕西、新疆属于创新能力较差的地区；(5)天津与云南是特例。从谱系图可以很清晰地看出，天津介于创新能力较强的地区与创新能力中强的地区之间，而云南介于创新能力中强的地区与创新能力较弱的地区之间。

以上分类结果确实在一定程度上反映了我国的区域创新能力实际：少数地区出类拔萃（如广东、北京、上海），传统强省有一定优势（如辽宁、江苏、山东），其它省份普遍较差，且相互间差距不大。这与人们预想的沿海－中部－西部的三级架构相差甚远。这说明了我国科技创新能力整体上的落后，而不只是西部的落后。在当今信息经济的浪潮中，在这由资源主导的经济向创新主导的经济转变的时代里，我们任重而道远。

对这个分类结果，有几个省份的位置值得关注。首先，广东、北京、上海为什么鹤立鸡群，通过查找原始数据我们发现：在十项评估指标中，广东有四项第一，分别是地方财政科技拨款、基础设施建设投资新增固定资产、专利授权量、高技术产品出口额。且是大大高于第二位的数值；北京也有五项第一，分别是每万人口中科学家与工程师人数、从业人员大专以上文化程度构成、科技经费支出总额、每十万人平均发表科技论文数、技术市场成交额；上海有六项指标排名第二，分别是每万人口中科学家与工程师人数、从业人员大专以上文化程度构成、科技活动经费支出总额、每十万人平均发表科技论文数、工业全员劳动生产率、技术市场成交额。其次是云南，我们发现其工业全员劳动生产率为44212元／人年，竟然处于最高（这与云南的产业结构有关[3](P290-303)），地方财政科技拨款也达680.1万元，与创新能力较强地区差不多。再次，较差省份中安徽、陕西、新疆与其它创新能力较差省份相比，又有许多不同，比较原始数据我们发现：他们确实比其它“差省”要强一些，但比河北、浙江等创新能力中强省份要差一些，算是另类了。

三、关于区域技术创新能力差异原因的几点解释

创新能力的区域差异是客观存在的，然而到底是什么原因造成了这种差异？结合前面的分析，我们认为主要有如下几点：

第一，经济实力因素。从聚类分析不难看出创新能力强的省份其经济实力大都比较强，而经济实力相对较弱的省份其创新能力也相对较弱。这就告诉我们，技术创新与经济发展是互动的，我们不仅要充分认识到技术创新对经济发展的推动作用，而且要特别注意到搞好经济是提高创新能力的基本途径。只有整体经济发展了，创新能力才有可能提高，对创新能力较弱的地区而言尤其如此。

第二，高科技产业发展因素。众所周知，首都、长江三角洲、珠江三角洲是我国高科技产业集中的地区，同时北京、广东、上海是创新能力较强的地区，这不是一种巧合。高科技产业集中了大量的创新人才、技术和信息，是创新之源。所以，优先发展高新技产业确实不失为创新能力中等的地区加快提高创新能力的一条捷径。

第三，科教的发展水平及科教的投入因素。几乎全部的高新产业区都是科教发达地区，甚至直接依托于某一科教基地。换句话说，创新能力的提高就是生产力的提高，就是科教水平的提高。无怪乎全国各省市都打出“科教兴省（市）”的口号。对于创新能力极弱的地区，首先就是要发展基础教育。

[收稿日期]2001-03-13

标签：聚类论文; 差异分析论文;

基于聚类分析的区域创新能力差异研究_聚类论文

猜你喜欢