区域集聚与中国制造业的国际比较_企业代码论文

中国制造业区域聚集及国际比较，本文主要内容关键词为：中国制造业论文,区域论文,国际论文，此文献不代表本站观点，内容供学术参考，文章仅供参考阅读下载。

一、引言

有关产业区域聚集的研究是新经济地理学和产业组织学文献的重要内容之一，一直得到经济学家的广泛关注，并在20世纪90年代以来取得了快速发展（Krugman,1991a;Kim,1995;Hanson,2001）。经济学理论通常把产业区域聚集的原因主要归结为两方面，即区域间自然禀赋的差异性（Ohlin,1933）和产业区域聚集的外部效应（Marshall,1920;Henderson,1974;Krugman,1991b），而外部效应又可以分为技术外溢、专业劳动力聚集、接近客户和供应商等。

国际上近年来有关产业区域聚集的实证研究发展很快。几篇有代表性的文献包括：Kim（1995）研究了美国自1860年至1987年间经济活动区域分布的长期变化趋势；Ellison and Glaeser（1997）优化了衡量产业区域聚集程度的指标体系；Duranton and Overman（2005）采用了接近精确的企业地理位置数据，在假设企业的区域分布是连续，而不是受到区域边际限制的基础上对区域经济的文献作了重要发展。

近年来，关于中国的产业区域聚集状况的研究也有很多，但得出的结论存在争议。例如：Young（2000）利用5个产业（农业、制造业、建筑业、运输业和商业）的数据发现中国的行业区域聚集程度在1985—1997年呈下降趋势，而白重恩等（2004）则利用行业分类较细的2位代码行业数据（29个省、32个2位代码行业）研究发现在同一时期中国的行业区域聚集程度呈上升趋势。① 关于文献中对于中国行业区域聚集程度得出不同结论的原因，白重恩等（2004）认为过于粗糙的行业分类可能导致Young（2000）的结论出现偏差。在本文中，我们利用近一段时期（1998—2003年）更为细化的区域和行业数据（2861个县区、539个4位代码行业）进行分析，试图揭示中国行业区域聚集程度近期的发展趋势。

研究中国产业区域聚集时借鉴西方的相关研究，并与发达国家产业区域聚集的历史进程和现状进行对比，有助于我们理解中国产业区域聚的发展趋势和所处阶段。这方面，范剑勇和杨丙见（2002）以及范剑勇（2004）作了大量的工作。然而，Ellison and Glaeser（1997）表明传统上用于衡量产业区域聚集的指标（例如Hoover系数和Gini系数）没有考虑不同行业内企业集中程度的差别，这样计算出来的产业区域聚集程度即使在同一国家的不同行业之间进行对比也存在偏差。因此，我们在进行产业区域聚集程度的跨国比较时尤其应注意指标的可比性。本文利用细致的行业和区域分类，力争取得与国际上相关研究可比的指标，在比较时侧重于共同趋势的发现，而不是绝对值的比较。

关于解决不同行业内企业集中程度的差别可能导致的偏差，罗勇和曹丽莉（2005）做了有创见的贡献，他们首先使用Ellison and Glaeser（1997）的方法，利用行业数据对我国20个制造行业1993、1997、2002和2003年的聚集程度进行了测定。与罗勇和曹丽莉（2005）不同的是，我们使用了1998—2003年的全国制造业的企业级数据，完全符合Ellison and Glaeser（1997）方法对数据的要求，此外，我们对在这一时期内我国行政区划和行业分类的变化进行了仔细的核对、调整，提高了各年数据的可比性。在此基础上，按照不同细分程度的行政区划和行业标准进行了反复计算，得出了稳健的结果，从而增加了本文结论的说服力。罗勇和曹丽莉（2005）分析了我国制造业聚集程度较长期间的变化和区域间的差别，而本文则对近期的趋势进行了详细分析，并就行业区域聚集和行业区域共同聚集进行了国际比较，二文相互补充，可以勾勒出我国制造业聚集程度变化更加全面的轮廓。

本文第二节描述数据及对数据进行的前期整理工作；第三节中，首先计算Hoover系数，并与现有关于中国行业区域聚集程度的文献进行衔接和对比。其次，借鉴Ellison and Glaeser（1997）创建的指标体系，用尽可能与国际上相关研究近似的行业和区域分类计算中国1998—2003年的行业区域聚集程度和行业区域共同聚集程度，并通过与西方国家（主要是美国）的比较得出关于中国行业区域聚集程度和行业区域共同聚集程度变动趋势的结论；第四节是结论和政策性建议。

二、数据

本文依据的主要数据是国家统计局1998—2003年工业企业数据库。该数据库采用自1998年开始启用的统计口径，涵盖了中国所有国有企业和年销售额500 万元人民币以上的非国有企业，每年企业数目从16万家到19万家不等。相关数据项目主要包括企业所在区域代码（省、市、县和邮编）、行业代码、产值、职工人数等。

一般而言，研究区域经济最理想的数据是普查数据。然而，由于普查规模大，而且包括许多小企业，因此数据质量会受到影响。例如，Pan and Zhang（2002）在使用中国第三次工业普查数据时发现，在去除了销售收入、职工人数、固定资产等数据项缺失的企业之后，企业数量从原始数据中的750,000下降到119,790。这说明普查原始数据中存在严重的数据项缺失问题。如果数据的缺失是系统性的，也就是说由于某些原因造成某些区域或行业的企业整体缺失，就会影响衡量区域经济指标的计算。

一个在研究中国经济问题中难以回避的问题是：中国统计数据的准确性和一致性经常受到学者们的置疑（Holz and Lin，2001；Rawski，2001）。本文的数据始于1998年，在这一年，中国采用的统计口径发生了变化，由原来的乡及乡以上工业企业改为所有国有企业和年销售额500万元人民币以上的非国有企业。这个口径一直沿用至今。研究表明，在1998年采用新的统计口径以后，中国工业企业统计数据质量有明显改善，这在一定程度上应归功于统计系统中采用了较完善的直报体系和更严格的数据审核程序（Holz and Lin，2001；Holz，2004）。

在关于行业区域聚集的研究中，对数据最重要的要求是企业地理位置和行业分类的准确性。如果没有企业精确的经纬度坐标，通常会使用企业所在的行政区划来确定企业位置，越细分的行政区划得出的结果越准确。本文依据的是省、市、县三级区划标准，例如1999 年颁布的《县及县以上行政区划代码表——国家标准GBT2260—1999》。中国的行政区划经常发生变动，变动的原因主要包括行政区域的增减、行政区域的重新划分和区划代码的更改等。具体而言：（1）从1999年到2003年，中国县级行政区划的数目（不含港、澳、台）从2431个增加到2861个；（2）更重要的是，中国行政区划和代码近些年来经常变更。由于行政区划和代码变更，企业在填报行政区划代码时很有可能错报和漏报，这会在很大程度上影响到衡量行业区域聚集指标的计算。因此，关于企业行政区划代码，我们做了两方面的努力力争将错误降到最低限度。首先，我们利用企业的地址信息对企业填报的行政区划代码进行逐一核对。一般来说，企业填报错误地址的可能性比填报错误行政区划代码的可能性要小得多。② 其次，我们把数据期间各年度使用的行政区划代码统一为《国家标准GBT2260—1999》，这样有利于我们进行各年度间的比较。通过以上两个步骤，我们一共修正了14.9万个企业／年度的行政区划代码，占总的企业／年度数目的14.38％。

关于行业代码，中国自2003年开始启用了新的国民经济行业代码（编码为GB／T4754—2002）。这一变化导致数据中2003年企业填报所依据的行业代码标准与以前年度不一致，如果不进行调整，将会使各年度之间的对比变得不合理。为此，我们首先利用行业代码表（GB／T4754—2002，新）和行业代码表（GB／T4754—94，旧）的对照表将2003年企业的（新）代码转换为（旧）代码。对于那些不能利用对照表进行自动转换的企业，我们利用企业主要产品名称的信息，然后利用旧的行业代码表中的行业具体产品信息进行逐一分类。

本文主要研究制造业，而把采掘业，以及电力、煤气、水的生产和供应业排除在外，其原因是这些行业的地理分布很大程度上取决于矿产资源等自然资源的分布，而自然资源在中国的分布是极不平均的，这使得对后两类行业的区域聚集进行研究意义有限。此外，由于数据限制，本文研究不包含港、澳、台地区，而下文的全国即为除港、澳、台外的全国其他地区。文中各项指标的计算主要依据产值数据和职工人数数据，选择的标准尽量和现有文献一致，以便考察较长期间的趋势和进行国际比较。③

三、行业区域聚集和行业区域共同聚集

（一）行业Hoover系数

Hoover系数最早由Hoover（1936）提出，是表示某行业在各区域间的聚集程度最常用的指标之一。Hoover系数计算方法如下：首先，计算区位商，其中Output[,ir]表示行业i在区域r的产值，Output[,i]表示全国范围行业i的产出，Output[,r]表示表示区域r所有行业的总产值，Output 表示全国所有行业的总产值。如果LQ[,ir]大于1，说明行业i在区域r的集中程度较高，如果LQ[,ri]小于1，则相反。接着，对行业i在所有区域r＝1，2，…，m的区位商进行降序排列，得到m个区域的序列组合。计算行业i在各区域产值的累计百分比（Output[,ir]／Output[,i]）并绘制在y坐标轴上，计算所有行业在各区域产值的累计百分比（Output[ ,r]／Output）并绘制在x坐标轴上，由此构建行业i的区域聚集曲线。如果行业i在区域间均匀分布，那么该行业在各区域的区位商都为1，同时该行业的区域聚集曲线成为从原点出发的45度射线。相反，行业i在各区域比例相差越大，则该行业的区域聚集曲线也就越凹。行业Hoover系数定义为由45度直线和行业的区域聚集曲线所围成区域面积与曲线所在三角形面积的比值，取值范围是［0，1］，取值越大表示行业的区域聚集程度越高。

表1中报告了按2位行业代码和县级区划的产值数据计算的行业Hoover系数。从表1中，我们发现以下几点规律：首先，从1998—2003年，在29个行业中只有5个行业的区域聚集程度下降，同时，Hoover系数的算术平均数和加权平均数分别上升了2.51％和3.25％。区域聚集程度上升最明显的行业包括食品加工业、纺织业、食品制造业和造纸及纸制品业等，而这些行业的共同特点是技术含量低。大多数行业区域聚集程度上升与白重恩等（2004）和文玫（2004）的结论相符合。④ 为了展示行业Hoover系数较长期间的变化趋势，我们借用白重恩等（2004）计算的1985—1997年的Hoover系数，并利用我们的数据计算了1998—2003年2位行业省级区域的Hoover系数，两段期间的结果如图1所示，⑤ 1998年后Hoover系数有一个较大的跳跃，其中原因主要是由于1998年前后国家统计局工业企业统计数据口径发生重大变化，导致1998年前后的统计数据并不完全可比。⑥ 然而从整体上看，中国的行业区域聚集程度自20世纪80年代末起呈上升趋势。⑦

图1 2位行业按省级区域计算的Hoover系数均值变化图

注：1998年以前的数值依据白重恩等（2004）中制造数数据重新计算得出。

其次，行业区域聚集程度较高的行业多是高度依赖自然资源的行业，主要包括烟草加工业、石油加工及炼焦业、化学纤维制造业、黑色金属冶炼及压延加工业和木材加工及竹、藤、棕、草制品业等。这一点也与现有文献相一致，例如，Ellison and Glaeser（1999）研究表明，在该文使用的样本中，至少50 ％的行业区域聚集可以用自然资源优势来解释。

（二）Ellison and Glaeser系数：γ[,i]和γ[c][,j]

行业Hoover系数只考虑了行业在区域间的聚集程度，没有考虑不同行业内企业集中程度的差别。如果某行业内只有少数几个企业且规模分布不均，那么这个行业的区域聚集程度自然就会很高；而如果某行业企业数量很多，那么这个行业的区域聚集程度自然就会较低。一个极端的例子是：对于只有一个企业的行业来说，全行业都集中在一个区域，这种情况下的行业区域聚集程度应该和100 个企业都集中在同一个区域的行业不同。从表1行业Hoover系数和行业内企业数量的关系中，可以发现企业数量较少的行业Hoover系数通常较高。例如烟草加工业2003年只有224家企业，而该行业的Hoover系数高达0.965。

在一篇非常有影响的文章里，Ellison and Glaeser（1997）调整了行业内企业集中度，设计了两个系数，分别用于衡量行业区域聚集程度（agglomeration，γ[ ,i]系数）和在产业链上有较强关联性行业的区域共同聚集程度（co-agglomeration，γ[c][,j]系数）。在Ellison and Glaeser（1997）之后，有许多研究将Ellison and Glaeser（1997）的方法运用于对其他发达国家行业区域聚集的研究。例如，Maurel and Sedillot（1999）以及Devereux and Griffith（2004）分别对法国和英国的制造业区域聚集情况进行了研究。然而，目前利用Ellison and Glaeser等（1997）的方法对中国进行研究的文献很少，主要原因是Ellisonand Glaeser（1997）的方法对数据要求比较高，不仅需要各行业在各区域产值（或职工人数等）累计情况，而且需要各行业内企业集中程度的信息。⑧ 本节中，我们利用Ellison and Glaeser（1997）的方法和尽量接近的行业、区域分类计算γ[,i]系数和γ[c][,j]系数，并和Ellison和Glaeser（1997）以及其他相关文献的结果进行跨国对比分析。

1.行业区域聚集程度（γ[,i]系数）

首先，讨论γ[,i]系数。对于行业i来说，系数γ[,i]的计算公式为：，其中G[,i]是行业i在r个区域内的基尼系数，G[,i]≡（x[,r]－s[,r] ）[2]，x[,r]是区域r所有行业职工人数占全国所有行业职工人数的比例，s[,r]是行业i在区域r的职工人数占该行业全国职工人数的比例；而H[,i]是行业i的赫芬达系数，H[,i]≡∑[,i]z[2][,i]，其中z[,i]是企业i的职工人数占行业i（包括1，…，i个企业）职工人数的比例。G[,i]和行业Hoover系数类似，当行业i在区域间的分布与所有行业在区域间的分布相一致时两个系数都等于0，而当行业i集中于一个区域时两个系数都接近于1（取决于该行业规模的大小）。简单而言，γ[,i]可以被粗略地看作是G[,i]和H[,i]的差，γ[,i]系数大于0说明行业i的区域聚集程度超过了行业i内的企业集中度，也就是说现实中行业区域聚集超出了随机区域选择可能产生的行业区域聚集程度。

表2参照了Rosenthal和Strange（2001）的做法，列示了按照2位、3位和4位行业代码以及省、市、县和邮政编码区域计算的γ[,i]系数统计值。与Rosenthal 和Strange（2001）结果相似，我们发现γ[,i]系数的均值随着行业的细化而增加，也就是说给定行政区域，按4位行业代码计算的γ[,i]系数最大，而按2位行业代码计算的γ[,i]系数最小。⑨ 此外，表2还表明，按各类行业和区域组合计算的γ[,i]系数均值在1998—2003年期间都呈稳定上升趋势。这个结果和表1中关于Hoover系数的结果一致，也就是说，以γ[,i]系数表示的行业区域聚集程度在近年来逐年加强。

表1 2位行业代码和县级区域的Hoover系数

行业 1998年 1999年 2000年 2001年 2002年 2003年变动按2003年2003年按2003年

比例Hoover系数企业企业数量

降序排序数量升序排序

烟草加工业0.9531 0.9553 0.9597 0.9594 0.9593 0.9649 1.23%

244 1

石油加工工及炼焦业0.9276 0.9232 0.9138 0.9166 0.9168 0.9114 -1.75% 2

12793

化学纤维制造业0.8788 0.8810 0.8855 0.8751 0.8787 0.8805 0.20%

10012

黑色金属冶炼及压延加工业 0.8433 0.8482 0.8566 0.8550 0.8595 0.8458 0.29%

370511

木材加工及竹、藤、棕、草制品业0.8169 0.8248 0.8312 0.8448 0.8487 0.8335 2.03%

347310

有色金属冶炼及压延加工业 0.8333 0.8383 0.8433 0.8366 0.8336 0.8305 -0.34% 6

31739

橡胶制品业0.7940 0.8016 0.8122 0.8107 0.8207 0.8178 3.01%

19825

皮革、毛皮、羽绒及其制品业0.7760 0.7885 0.8070 0.8113 0.8140 0.8176 5.37%

446114

饮料制造业0.7619 0.7693 0.7785 0.7842 0.7856 0.7917 3.91%

31528

其他制造业0.7366 0.7457 0.7579 0.7584 0.7591 0.7672 4.15%

10 484616

家具制造业0.7544 0.7769 0.7839 0.7679 0.7684 0.7668 1.65%

11 19334

仪器仪表及文化、办公用机械制造化 0.7722 0.7682 0.7787 0.7687 0.7623 0.7617 -1.36% 12 22306

文教体育用品制造业0.7701 0.7696 0.7847 0.7775 0.7698 0.7614 -1.13% 13 25847

医药制造业0.7269 0.7306 0.7438 0.7467 0.7519 0.7587 4.37%

14 372112

电子及通信设备制造业 0.7767 0.7702 0.7650 0.7606 0.7576 0.7523 -3.14% 15 584518

食品制造业0.6913 0.7008 0.7242 0.7306 0.7389 0.7464 7.97%

16 456615

交通运输设备制造业0.7280 0.7320 0.7444 0.7444 0.7428 0.7462 2.50%

17 805120

食品加工业0.6671 0.6822 0.7118 0.7241 0.7362 0.7448 11.65% 18 10413

造纸及纸制品业0.6558 0.6699 0.6964 0.6993 0.7040 0.7050 7.50%

19 553617

印刷业，记录媒介的复制0.6851 0.6918 0.7023 0.7101 0.7095 0.6978 1.84%

20 378013

服装及其他纤维制品制造业 0.6748 0.6780 0.6834 0.6912 0.6915 0.6944 2.91%

21 10111

纺织业0.6213 0.6338 0.6497 0.6614 0.6682 0.6816 9.70%

22 14273

专用设备制造业0.6478 0.6658 0.6658 0.6572 0.6628 0.6620 2.20%

23 688019

电气机械及器材制造业 0.6311 0.6322 0.6367 0.6406 0.6398 0.6409 1.56%

24 10222

非金属矿物制品业 0.6034 0.6070 0.6234 0.6228 0.6275 0.6362 5.44%

25 16080

普通机械制造业0.6017 0.6114 0.6150 0.6128 0.6184 0.6185 2.78%

26 11900

塑料制品业0.5863 0.5889 0.5983 0.5954 0.5948 0.5868 0.09%

27 839821

化学原料及化学制品制造业 0.5594 0.5661 0.5793 0.5716 0.5662 0.5697 1.85%

28 13530

金属制品业0.5565 0.5660 0.5731 0.5706 0.5726 0.5666 1.82%

29 10946

Hoover系数算术平均值 0.7252 0.7316 0.7416 0.7416 0.7434 0.7434 2.51%

Hoover系数加权平均值 0.7026 0.7099 0.7231 0.7229 0.7240 0.7254 3.25%

注：本表按2003年Hoover系数降序排列

表2 1998—2003年γ[,i]系数均值变动情况及2003年γ[,i]系数统计量

行业及行政区域 1998年 1999年

2000年

2001年

2002年

2003 2003年γ[,i]系数

γ[,i]系数均值最小值最大值

标准差

按2拉行业代码计算

邮政编码级 0.00048 0.00044 0.00065 0.00061 0.00067 0.00079 -0.00026 0.00332 0.00082

县级

0.00219 0.00230 0.00276 0.00260 0.00293 0.00354 0.00110

0.01911 0.00389

市级

0.00518 0.00546 0.00614 0.00643 0.00709 0.00797 0.00243

0.02646 0.00645

省级

0.02211 0.02409 0.02562 0.02635 0.02987 0.03308 0.01004

0.12058 0.02675

按3位行业代码计算

邮政编码级 0.00212 0.00221 0.00227 0.00250 0.00277 0.00276 -0.00176 0.03657 0.00396

县级

0.00551 0.00525 0.00757 0.00683 0.00778 0.00832 -0.01138 0.07537 0.01213

市级

0.01059 0.01063 0.01487 0.01373 0.01511 0.01663 -0.02310 0.09310 0.01906

省级

0.03190 0.03298 0.04162 0.04216 0.04601 0.05078 -0.08182 0.39479 0.06072

按4位行业代码计算

邮政编码级 0.00441 0.00484 0.00553 0.00766 0.00619 0.00671 -0.00391 0.21480 0.01513

县级

0.00901 0.00938 0.01193 0.01394 0.01359 0.01448 -0.01357 0.28483 0.02850

市级

0.01607 0.01612 0.01997 0.02296 0.02722 0.02617 -0.03979 0.40325 0.04375

省级

0.04013 0.04101 0.04842 0.05112 0.06310 0.06396 -0.18905 1.07182 0.10117

下面具体讨论γ[,i]系数值的大小。为了便于国际比较，我们力求使用和文献相一致的行业和区域分类标准，并侧重讨论按4位行业代码和县级区域计算的γ[,i]系数。按4位行业代码计算的省、市、县以及邮政编码区域的2003年γ[,i]系数均值分别为0.06396、0.02617、0.01448和0.00671，而四种情况下γ[,i]系数最小值都小于0，说明某些行业的区域分布比随机的区域选择过程产生的分布更分散。图2列示了按4位行业和县级区域计算的2003年γ[,i]系数，我们发现，γ[,i]系数的分布是右偏的，最大值为0.28483，最小值为－0.01357，均值为0.01448，标准差为0.02850。在表3中我们列出了2003年γ[,i]系数最大和最小的各20个4位代码行业的γ[,i]、G[,i]和H[,i]系数。γ[,i]系数最大和最小的4位代码行业分别是钾肥制造业和广播电视设备修理业。从表3中可以发现γ[,i]系数取决于基尼系数和赫芬达系数的差额。以钾肥制造业为例，基尼系数为0.4126表明该行业的区域聚集程度较高，同时由于该行业内企业集中度（赫芬达系数）相对较低（0.1800），使得该行业有较高γ[,i]系数。又以广播电视设备修理业为例，由于行业内企业数目只有4家，并且规模（职工人数）不平均，行业内企业集中度（赫芬达系数）超过了基尼系数，所以该行业的γ[,i]系数为负。

图2 2003年按4位行业和县级区域计算的γ[,i]系数

表3 2003年γ[,i]系数最高和最低的20个4位代码行业

聚集程度最高的20个行业聚集程度最低的20个4位代码行业

行业名称企业 γ[,i] G[,i]

H[,i]

行业名称企业 γ[,i]

G[,i]

H[,i]

数量数量

钾肥制造业350.2848 0.4126 0.1800 假肢、矫形器制造业 33-0.0027 0.0544 0.0571

锡冶炼业 310.2732 0.7019 0.5920 其他纤维素纤维制造业31-0.0028 0.4345 0.4370

漆器工艺品制造业 380.1668 0.2112 0.0538 放射化学产品制造业 6 -0.0028 0.2200 0.2227

刀剪制造业150

0.1570 0.1690 0.0146 邮政机械及器材制造业17-0.0030 0.1193 0.1222

化学纤维工业专用设备制造业250.1534 0.2222 0.0819 其他文化、办公用机械制造业 37-0.0030 0.0476 0.0506

苎麻纤维初步加工业240.1465 0.2164 0.0825 载重汽车制造业 70-0.0032 0.1490 0.1520

交换设备制造业139

0.1423 0.2480 0.1239 实验室仪器及装置制造业 20-0.0035 0.0819 0.0853

其他丝绢纺织业156

0.1391 0.1629 0.0281 其他橡胶制品翻修业 6 -0.0036 0.1858 0.1891

丝印染业 206

0.1333 0.1448 0.0136 日用硅酸制品工业专用设备制造业 14-0.0036 0.1667 0.1701

雷达专用配套设备及部件制造业 210.1236 0.1992 0.0867 幻灯机及投影仪制造业10-0.0039 0.1274 0.1310

收音机、录音机制造业 316

0.1081 0.1165 0.0098 传递标准用计量仪器制造业20-0.0054 0.1913 0.0963

丝织业875

0.1030 0.1097 0.0078 核子及核辐射测量仪器制造业 5 -0.0054 0.4470 0.4509

渔具用丝制造业130.1029 0.2151 0.1256 照明器具工业专用设备制造业 30-0.0057 0.1087 0.1140

渔轮制造业470.0999 0.1489 0.0548 农、林、牧、渔仪器仪表制造业3 -0.0059 0.3893 0.3938

加工纸制造业 311

0.0830 0.0950 0.0134 渔具用线制造业 8 -0.0059 0.2354 0.2404

其他毛纺织业 131

0.0785 0.1025 0.0263 其他电子设备修理业 6 -0.0060 0.1989 0.2042

手术器械制造业660.0777 0.1675 0.0977 腈纶纤维制造业 23-0.0062 0.2094 0.2148

电气机械修理业360.0754 0.1872 0.1214 潜水装备制造业 2 -0.0088 0.5070 0.5124

云母制品业340.0737 0.1266 0.0574 塑料家具制造业 16-0.0114 0.1140 0.1243

人造原油生产业160.0708 0.4034 0.3590 广播电视设备修理业 4 -0.0136 0.3497 0.3592

注：表中行业顺序按γ[,i]系数降序排列。

接下来，分析我国制造业γ[,i]系数值的大小，并进行国际比较。由于判断γ[,i]系数的大小没有绝对的标准，我们沿用Ellison和Glaeser（1997）的分类，并分别把γ[,i]＜0.02、0.02≤γ[,i]＜0.05和γ[,i]≥0.05的情况定义为低度聚集，中度聚集和高度聚集。结果表明，在539个4位行业分类中，有431个行业（79.96％）的γ[,i]系数小于0.02，属低度聚集；有74个行业（13.73％）的γ[,i]系数处于0.02和0.05之间，属中度聚集；而只有37个行业（6.31％）的γ[,i]系数大于等于0.05，属高度聚集。对比现有文献中对美国、英国和法国行业聚集程度的研究，我们发现中国的行业聚集程度低于上述发达国家（表4）。单纯从γ[,i]系数来看，在四个国家中美国属于低度聚集的行业比例最少（10％），而中国最高（79.96％）；属于高度聚集的行业比例在中国只有6.31％，低于其他国家的比例（美国25.00％、英国16.00％、法国27.00％）。值得指出的是，我们在理解这些对比数据时应该注意，由于各国研究使用的数据行业和区域细分程度不同，所得出的结果可能并不完全可比。从表4中我们可以发现，本文计算γ[,i]系数使用的行业和区域分类和Ellison和Glaeser（1997）最为近似，从一定意义上说，这两个结果最可比。然而，表4也表明中美两国关于γ[,i]系数的结果差异很大。综合而言，中国的行业聚集程度较以美国为代表的发达国家偏低。

表4 与文献中γ[,i]系数对比表

文献研究数据行业区域

低度聚集

中度聚集高度聚集

国别年份

行业比例

行业比例行业比例

Ellison和Glaeser(1997) 美国 1987 459个4位代码 3000个县

10.00% 65.00%25.00%

Devereux和Griffith等(2004) 英国 1992 211个4位代码 477个邮编区域 65.00% 19.00%16.00%

Maurel和Sedillot(1999) 法国 1993 273个4位代码 95个县 50.00% 23.00%27.00%

本文中国 2003 539个4位代码 2861个县、区

79.96% 13.73%6.31%

注：低度聚集、中度聚集和高度聚集行业分别指γ[,i]＜0.02、0.02≤γ[,i]＜0.05和γ[,i]≥0.05的行业。

表5我们分析列出了各个2位代码行业的γ[,i]、G[,i]和H[,i]系数在1998—2003年期间的变化情况，发现有两个明显特征：第一，一些技术含量较高的行业（如电子及通信设备制造业、化学纤维制造业、仪器仪表及文化、办公用机械制造业、电气机械及器材制造业等）的γ[,i]系数较高，并且增加趋势明显。这一点和我们在上文从行业Hoover系数分析中得到的结论不同。在上文中，我们发现区域聚集程度上升最明显的行业包括食品加工业、纺织业、食品制造业和造纸及纸制品业等，而这些行业的共同特点是技术含量低。两个结果的差异主要是由于前面计算的Hoover系数未考虑行业内企业集中程度及其变化，也说明技术外溢是促进行业区域聚集的重要因素；第二，除了2个行业外，所有其他2位代码行业的γ[,i]系数都呈增加趋势。同时，29个行业中23个行业的G[,i]系数上升，而29个行业中的21个行业的H[,i]系数有所下降，G[,i]系数的上升和H[,i]系数的下降共同导致了γ[,i] 系数的上升。

2.行业区域共同聚集程度（γ[c][,i]系数）

上述行业Hoover系数和γ系数所考察的是同一行业内企业的区域聚集情况。然而，行业分类只是大致上按企业产品的近似程度进行的分类，而企业之间的关系不仅局限于同一行业内部，相关联（相近、相类似）行业的企业区域聚集也可能带来外部效应。相关联行业最直接的定义是同一个大类行业内的各个小类行业，例如交通运输设备制造业中的小轿车制造业和汽车零部件及配件制造业。衡量行业之间关联程度的另一个方法是利用投入产出关系。下面我们首先计算同一个大类行业内的各个小类行业共同聚集的情况，然后把投入产出关系运用到行业区域共同聚集中，并与Ellison and Glaeser（1997）的结果进行对比。

Ellison and Glaeser（1997）计算γ[c][,j]系数来衡量某一大类行业中各小类企业共同区域聚集的程度。对于某一大类行业j来说，γ[c][,j]的计算公式如下：γ[c][,j]＝，其中j，i，r分别代表大类行业、小类行业和区域，大类行业j中有1…j个小类行业。G[,j]代表大类行业j的区域集中度，表达式为G[,j]＝（x[,r]－s[,r]）[2]。γ[,i]是小类行业i的γ[,i]系数，计算公式见上文。ω[,i]是小类行业i在所属大类行业j中所占的职工人数比例。H[,i]代表小类行业i的赫芬达系数，而H[,j]是大类行业j中j个小类行业i的赫芬达系数的加权平均，计算公式为H[,j]＝∑[,i]ω[2][,i]H[,i]。

γ[c][,j]公式设计的基本思路是：大类行业j的区域集中度（G[,j]）可分解为三个组成部分，分别是行业大类j中企业的集中度（H[,j]）、小类行业i本身（intra-industry）的区域聚集程度（γ[,i]）和大类行业j内小类行业间（inter-industry）的区域共同聚集程度（γ[c][,j]）。利用G[,j]、H[,j]和γ[,i]计算出γ[c][,j]，如果γ[c][,j]大于0 则表明同一大类行业内的各小类行业间存在区域共同聚集，γ[c][,j]越高则区域共同聚集程度越高。

我们使用与Ellison和Glaeser（1997）最近似的区域和行业分类，以县作为区域单位、2位行业作为大类行业j、3位行业作为小类行业i计算2位行业的γ[c][,j]。虽然中国和美国的行业分类和区域划分存在差别，但我们可以通过对比得到一个大致的了解。总的来说中国比美国的行业共同聚集程度低，在可比较的21个2位行业中，只有4个行业（家具制造业、普通机械制造业、电气机械及器材制造业、交通运输设备制造业）中国的γ[c][,j]系数比美国高。

下面我们分析行业共同聚集程度较高的几个大类行业的具体情况，以便了解产生行业共同聚集的原因。中国γ[c][,j]最高的行业是烟草加工业，这一点与美国一致。烟草加工业γ[c][,j]的值最高可能与其行业构成有关，2位代码的烟草加工业只包含3个3位代码的行业，分别是烟叶复烤业、卷烟制造业和其他烟草加工业，而这三个行业的相关性较强，都依赖相同的自然资源。与烟草加工业类似的还有石油加工及炼焦业，该行业包括人造原油生产业、原油加工业、石油制品业和炼焦业等四个3位代码的行业；电子及通信设备制造业与上述两个行业有所不同，该行业包括9个3位代码的行业，⑩ 从1997年投入产出表看，这几个行业间的相互依存关系较高，其中日用电子器具制造业和电子计算机制造业来自电子元器件制造业的直接投入占其总投入的比例分别为39.03％和35.13％，而各小类行业间平均的直接投入系数为10.26％。电子及通信设备制造业的共同聚集程度较高可能反映接近客户和供应商的需要。此外，由于电子及通信设备制造业的各行业小类技术含量较高，相互间可能存在较大的技术外溢效应。

我们还分析了中国行业共同聚集程度从1998—2003年的变动情况（见图3）。图3中列示了在各2位行业大类、3位行业小类和县级区域基础上计算的γ[c][,j]的简单均值和加权均值，其中加权均值采用各2位行业职工人数为权重。图3表明，中国近年来行业的共同聚集程度呈上升趋势。(11)

图3 1998—2003年共同区域聚集指标（γ[c][,j]）均值变动趋势

注：图中的γ[c][,j]以县级区域、2位行业大类和3位行业小类的职工人数计算。

上面我们针对γ[c][,j]的讨论主要是限于大类行业中的小类行业的共同聚集，这些分析的一个局限性是没有充分考虑行业间的投入产出关系，而上面对投入产出关系的分析也仅仅是通过投入产出系数进行的简单推断。下面我们结合投入产出表对γ[c][,j]进行重新计算并期望得到更直接的证据。

我们借鉴Ellison and Glaeser（1997）的方法，选取中国1997年投入产出表内71个制造业分类相互间投入产出关系最强的100 对行业分类计算每对之间的共同聚集程度。具体计算公式如下：γ[c][,2]＝，γ[c][,2]是γ[c][,j]的一个具体运用，γ[c][,2]包括两个行业i＝1，2。把这两个行业一起看作一个大行业用下标表示，即G[,2]和H[,2]分别表示这个大行业的区域集中度和其中两个小类行业i 的赫芬达系数的加权平均。公式的其他部分的含义可参见γ[c][,j]的计算公式。

γ[c][,2]的解释是：如果γ[c][,2]大于0则表明两相关行业间存在共同聚集的现象，而γ[c][,2]越大则共同聚集的关系越明显。我们计算了1998—2003各年相互投入产出关系最强的100对行业分类间γ[c][,2]的均值、γ[c][,2]值小于零行业的比例、前20对行业的投入产出直接消耗系数和γ[c][,2]值。Ellison and Glaeser（1997）的结果表明，在美国下游行业对上游行业产品依赖关系最强100对行业中，有77个行业（77％）的γ[c][,2]为正。而这个比例在中国较高，在1998—2003各年间，投入产出关系最强的100对行业中γ[c][,2]为正的有97至98个，这说明投入产出关系是影响行业共同聚集的重要因素。但是，如果考虑前100对行业γ[c][,2]的均值，则Ellison and Glaeser（1997）中为0.018，而中国在行业共同聚集程度最高的2003年仅为0.0033。当然，在与Ellison and Glaeser（1997）的结果进行比较时，我们必须意识到由于两篇文章使用的行业划分不同而可能导致的差异。在Ellison和Glaeser（1997）中，行业是4位代码行业，行业总数是459个，然而中国投入产出表中行业只是介于2位和3位行业代码之间，我们只有71个行业分类。即使这样，单纯从中国本身的结果我们也可以得出如下结论，即行业的共同聚集在投入产出关系重要的行业间普遍存在，并且共同聚集程度在近几年持续上升。

四、结论和启示

本文的主要工作是在仔细整理和核对中国制造业企业区域分布和行业分类的基础上，借鉴国际上衡量行业区域聚集指标体系的最新发展，对中国近年来制造业的区域聚集和不同制造业间的区域共同聚集进行了细致的分析。我们通过分析我国制造业1998—2003年聚集程度变化趋势，以及与包括美国在内的西方发达国家相对比，得出以下结论。

首先，无论是较长期的以Hoover系数表示的，还是近年来以γ[,i]系数表示的行业区域聚集程度的变化趋势都表明我国的行业区域聚集程度仍处于一个稳定的上升阶段，这与近年来的大多数实证研究的结论相一致（白重恩等，2004；文玫，2004；范剑勇，2004；罗勇和曹丽莉，2005）。本文的意义在于，我们计算了考虑行业内企业集中程度后的聚集程度，并且利用不同细分程度的行业和区域标准，计算的结果一致，为我国行业区域聚集近年来呈上升趋势的论断提供了稳健的证据。

其次，本文通过与西方国家区域集聚相关研究结果谨慎地对比，试图推断出我国行业区域聚集发展的一个中长期的趋势。我们发现，虽然我国行业区域聚集程度在近些年来持续上升，但与西方国家相比，我国行业区域聚集程度还处于一个较低水平，这也预示着我国的制造业的区域聚集程度会在一定时期内进一步上升。

第三，本文考察了我国相互关联的制造业共同区域聚集的情况，我们发现，与制造业区域聚集相类似，制造业共同区域聚集的程度近年来也持续上升。说明我国的产业聚集不仅发生在通常定义的同一行业内，相关行业也由于行业间的相互作用、相互吸引而产生共同聚集的效果。这一点可以从许多地方业已形成的围绕某个支柱产业的产业群得到印证。

最后，从政策含义上讲，行业区域聚集程度和行业共同区域聚集程度的上升反映了各地区地方保护主义和“大而全、小而全”的经济发展思路在逐渐弱化（白重恩等，2004）。随着经济的发展，聚集所产生的外部效应已经成为引导行业区域分布的重要因素，而地方政府在制定区域经济发展战略时应充分考虑影响行业区域聚集的经济因素，因势利导。在这方面，吸引地方经济发展重点行业的高技术企业和高技术人才，进行技术和人才积累应当成为地方政府的重要政策之一；另一方面，本文关于行业共同区域聚集的结果表明，投入产出关系是影响行业区域共同聚集的重要因素，说明虽然随着运输技术的提高，综合运输成本不断降低，(12) 但是，目前运输成本仍然是决定行业区域分布的重要因素之一。这意味着各地区在一定时期内应该大力发展交通运输等基础性产业，进一步降低运输成本，促进行业在区域间的合理布局。

注释：

① 与白重恩等（2004）类似，文玫（2004）利用1980、1985和1995年的工业普查数据也发现在1980年至1995年期间中国的制造业区域聚集程度在整体上提高了。

② 例如，我们在核对中发现1998年上海市的所有企业都填报了“310229”为其行政区划代码，而这个代码是属于当时的青浦县的。我们利用企业地址核对后发现1998年错误填报为青浦县的上海企业有8846个。

③ 具体而言，在计算行业Hoover系数时我们采用了产值指标，其原因是能够与文献（白重恩等，2004）相衔接；在计算Ellison and Glaeser系数的时候，我们采用了职工人数指标，其原因是尽可能与国际上的其他文献相衔接。在本文的初稿中，我们在计算Ellison and Glaeser系数时也使用了产值指标，匿名评审人指出的指标选取不同可能造成结果不可比的问题，我们在这里表示感谢。关于利用产值计算的结果可以向作者索取。

④ 我们使用2位行业代码和市级区划或省级区划得出的结果与县级区划的结果很类似。

⑤ 白重恩等（2004）的图1“跨行业平均Hoover地方系数的时间趋势”中列示的是包括采掘业和制造业在内的Hoover系数均值，而本文研究的行业仅限于制造业。这里，我们利用白重恩等（2004）的数据重新计算了制造业各行业的Hoover系数均值。

⑥ 国家统计局工业统计口径在1998年及以后年度为全部国有和规模以上非国有工业企业，而在1997以及前年度的统计口径为各种经济类型乡及乡以上工业企业。两个统计口径在企业量上差别很大。例如，白重恩等（2004）使用的1997年工业企业数据来源于《中国工业经济统计年鉴》，当年乡及乡以上制造业企业数量为40.7万家。本文使用的数据为1998年开始采用的新的统计口径，仅包括全部国有和规模以上非国有制造业企业，1998年企业数量大幅度减少11.5万家。企业数量的减少增加了各行业在全国各省的分布不均匀的程度，从而使得1998 年及以后年度的EHoover系数有较大程度的提高。

⑦ 从中国统计数据在1998年前后的不可比我们也认识到进行行业区域聚集国际比较时应十分谨慎。

⑧ 一个例外是：罗勇和曹丽莉（2005）使用Ellison and Glaeser（1997）的方法，利用行业数据对我国20个制造行业的聚集程度进行了创见性的研究。

⑨ 其中的原因是：给定行政区划级别，随着行业划分的细化，某行业内企业的区域分布将会越来越偏离所有行业在区域间的分布，从而导致G[,i]和γ[,i] 趋近于1。

⑩ 分别是通信设备制造业、雷达制造业、广播电视设备制造业、电子计算机制造业、电子器件制造业、电子元件制造业、日用电子器制造业、电子设备及通信设备修理业和其他电子设备制造业。

(11) 我们还计算了2位行业大类、4位行业小类和县级区域以及3位行业大类、4位行业小类和县级区域基础上计算的γ[c][,j]值，结果十分类似。

(12) Glaeser和Kohlhase （2004 ）研究表明美国铁路每吨／英里运输成本从1890年的0.185美元下降到2000年的0.023美元。

标签：企业代码论文;

区域集聚与中国制造业的国际比较_企业代码论文

猜你喜欢