作者简介:程叶青 (1976-), 男, 湖南武冈人, 博士, 副研究员, 中国地理学会会员 (S110006162M), 主要从事经济地理与乡村发展研究。E-mail: yqcheng@iga.ac.cn
基于探索性空间数据分析和验证性空间面板模型,本文探讨了2000年以来中国区域创新的时空动态。结果表明:① 自创新战略实施以来,中国各省区创新产出的年均增长率几乎都经历了一个剧烈的加速过程,说明区域创新能力的总体提升,但是,东部沿海地区仍然在创新产出中居于压倒性地位,导致“沿海—内陆”分化加剧和区域鸿沟的进一步突出,省区创新可能会陷入“强者愈强,弱者愈弱”的“马太效应”;② 中国区域创新产出与创新投入的空间集聚随时间推移不断强化,通过识别不同时期各变量“热点”,表明创新产出“热点”地区与创新投入“热点”具有高度的时空耦合特征;③ 人均GDP、研发投入、研发人员及在校大学生数对省区创新产出有显著的直接影响。省区间创新活动存在明显的空间溢出效应,其知识溢出的地理区域跨越了省区边界。空间依赖性的存在导致省区间创新活动具有反馈效应,相邻省区的知识溢出对该省区的创新活动具有实质性影响。
Through an integration of exploratory spatial data analysis (ESDA) and confirmatory spatial data analysis (CSDA), this study examines the space-time dynamics of regional innovation at the provincial scale in China from 2000 to 2011. The results show that: firstly, since the implementation of national innovation strategy, the annual growth ratio of innovation outputs of the provinces in China has experienced a drastic process of acceleration, which suggests the overall improvement of regional innovation capabilities. However, an overwhelming status in growth rate still belongs to eastern region, leading to the rise of the coastal-interior division and the divergence among regions, and regional innovation in China may fall into the “Matthew Effect” that the strong will become stronger and the weak will be constantly weaker. Secondly, regional innovation outputs and inputs in China experience an increasing change of spatial clustering over time. Various types of hot spots are identified over time, revealing that innovation hot spots overlay well with other variables. Finally, the selected explanatory variables, such as GDP, RDE, RDP and PCH, have significant direct impacts on provincial innovation in China. There exist obvious spatial spillover effects in provincial innovation activities, and the geographic region of which has crossed the provincial border. The spatial dependence of innovation activities gives rise to the feedback among the provinces, and the acknowledge spillover of adjacent province have material influence on a specific province.
在经济全球化背景下, 世界各国都关注到创新对经济发展的至关重要作用[1]。新经济增长理论认为知识型创新是促进经济增长和提高生活标准的主要驱动力[2], 研发过程中通过资源投入产生新的知识, 其扩散过程是现代市场经济增长机制的核心[3]。创新是一种以新的方式生产新知识或融合已有知识的过程, 知识为创新性价值创造 (譬如创新过程) 奠定了最为重要的基础[4]。然而, 知识创新来源于一定的支撑 (如企业、研究机构和高等教育机构等), 而这些支撑又趋向于集中在某些具体区位, 这就决定了发明和创造不会均衡分布于空间, 而是趋向于在一定区位聚集[5, 6]。实证研究证明, 知识流动遵循地理衰减规律, 意味着地理距离的增加会提高知识传播成本[7, 8]。区域创新系统中的创新人员依赖空间邻近性从其它人员获益, 由于创新过程复杂性的提升, 创新人员趋向于从各种来源吸收和整合新的或互补知识, 由此, 其他处于相邻区位的人员无疑成为获取知识最经济的选择。此外, 某一区域创新人员生产的新知识将随着时间的推移不仅会扩散到同一区域的其它创新人员 (区内知识溢出), 而且会扩散到其他区域的创新人员 (区际知识溢出) [9]。事实上, 为了生存和跟上日益白热化全球创新竞争的步伐, 区域创新系统的关键人员不得不寻找更多地理区位较远的知识来源, 导致近几十年来跨区域的知识溢出如雨后春笋般涌现。
针对知识溢出如何测度问题, 国外学者存在争论。Krugman 认为知识流动是看不见的, 知识溢出的实证测度是不可能的[10]。但是, Jaffe等认为专利记录可能很好的留下知识溢出的纸质痕迹, 因此, 专利引证可以被视为知识溢出的一个指标[11]。知识溢出的强度可以通过引入空间距离作为解释变量的专利引证强度进行评估, 这种空间相互作用模型已被大量的实证研究所采用[12]。此外, 引入研发投入的知识生产函数被也被用于识别和测度知识溢出, 在该函数中, 创新产出既取决于“ 区域内部” 研发投入, 也取决于通过地理邻居获取的研发投入[13, 14]。随着空间计量经济学快速发展, 空间计量模型逐渐被应用于分析区域创新和知识溢出效应[15]。正如Autant-Bernard指出, 创新过程具有明确的空间异质性和空间依赖性, 在知识生产函数中, 通过空间计量工具中的空间自相关可正确计算出模型系数, 且能区分其直接和间接影响[12]。然而, 除了Lesage等通过解释知识溢出来源地和目的地区域的异质性纠正空间自相关模型外, 现有研究极少将空间计量工具引入到空间相互作用模型的分析框架[16]。
中国针对知识溢出的文献日益增多, 空间计量工具在知识生产函数中的应用研究快速增长[17, 18], 空间误差模型和空间杜宾模型等被应用于阐释高校学术研究溢出效应和高新技术产业创新等领域[19, 20], 研究表明, 知识溢出随地理距离而变化[21], 研发人员对区域创新有积极的溢出效应[22]。但是, 已有研究主要从创新投入视角分析了区域知识溢出效应, 未能突出创新产出溢出效应在创新活动中的重要作用[23]。本文试图从创新投入和创新产出的视角, 应用空间面板杜宾模型定量识别和测度知识创新的溢出效应。
创新活动在地理空间上的分布是不均衡的, 具有高度创新活动的区域往往非常邻近, 表明创新活动存在空间依赖性, 可被视为知识溢出效应在区域间的空间相互作用。因此, 为阐明区域创新的时空动态, 必须考虑空间自相关。GIS技术及探索性数据分析方法 (Exploratory Spatial Data Analysis, 简称ESDA) 为区域发展的空间分析提供了强有力的工具, 且ESDA在近年来区域发展不平衡的实证研究中得到广泛应用[24, 25], 一些最新的研究也应用该方法探讨了知识创新的空间分布等问题[26, 27]。然而, ESDA实质上是一种数据驱动型方法, 因此在一定程度上缺乏与其它理论模型比较的解释力。为了解决这个问题, 本文在知识生产函数中选择了一些创新投入变量, 以阐明其与创新产出变量间的时空耦合特征。此外, 采用验证性空间数据分析方法 (Confirmatory Spatial Data Analysis, 简称CSDA), 结合知识生产函数和空间杜宾面板模型, 定量研究创新产出与创新投入之间的时空关系, 并着重探讨创新投入和创新产出的溢出效应, 进而阐明中国区域创新的时空动态, 旨在为国家创新发展及战略制定提供有益的参考。
本研究以中国31个省 (直辖市、自治区) 为基本空间单元, 分别采集1999-2011年各省级单元数据, 由于缺乏统计数据, 香港和澳门特别行政区和台湾省未被纳入研究范畴。已有文献大多以专利作为创新产出的定量指标[28, 29, 30], 尽管学术界在探讨哪些指标最适合测度创新产出的问题上未形成共识, 所选择的指标也仅能部分地反映区域创新程度[31]。但是, 专利在创新过程中的每个阶段都扮演重要角色, 专利数据为分析区域知识创新的时空分布提供了重要的信息[32, 33], 仍然是到目前为止刻画知识创新最为合适与常用的指标。因为无论专利最终被批准与否, 申请这个产权都包含了支持者重要的成本, 并注重发明相关的新颖性和盈利能力特征[34]。因此, 本研究仍将专利申请数作为衡量创新产出的表征指标, 并基于最先被Griliches 验证并经过不断发展的知识生产函数[15], 采用Jaffe的分析框架[28], 选择4个创新投入变量作为衡量区域创新的决定性因素。Cohen and Klepper指出研发工作是知识创新最重要源泉[35]。除了研发工作, 内生经济理论强调另一个生产决定性因素的经济理念:技术绩效的经济综合水平[36]。因此, 将另外两个变量替代知识生产力的整体经济源纳入知识生产函数。这样, 本研究采用的知识生产函数模型为:
式中:PAT是指专利申请数; RDE为研发支出; RDP为研发人员数; PCH为在校大学生数; GDP表示国内生产总值。借鉴已有研究成果[37, 38], 采用滞后一年的创新投入变量, 由于输入变量与可度量的产出变量间的转化需要一些时间, 采用一年时间的滞后可提升观测值的数量和自由度。为了保持输入变量和产出变量数据的一致性, 需对所有变量进行标准化处理。其中, 专利申请数和在校大学生数分别除以总人口数, 以获得人均数; 研发支出除以总人口数, 获得人均研发支出; 研发人员数用与总雇用相关的研发人员代替。原始数据均来源于《中国统计年鉴》(2000-2012) 和《中国科技统计年鉴》(2000-2012)[39, 40], 为保持数据的可比性, 各省级单元所有GDP数据均转换为1999年不变价。
ESDA是一种在评估和测试之前描述性动态因素来解释空间格局的较为复杂的回归模型[41], 其独特之处在于通过空间权重矩阵建立本区域与周边邻域之间的空间关系, 并通过空间滞后向量确定每一个区域的空间邻域状态[41, 42]。一般采用全局空间自相关 (Moran's I或Geary's C) 和局部空间自相关 (G统计量、Moran散点图和LISA) 来衡量。
Moran's I是测度全局自相关最为常用的指标。本研究采用全局Moran's I统计量测度中国各省级空间单元及其邻阈知识创新的空间关联及差异程度, 该统计量可表达为:
式中:Wij为某一要素的空间权重矩阵; zit和zjt表示观测值偏离i和t平均值的程度; N为观测值数量; So为所有要素权重的总和。Moran's I 取值范围为[-1, 1], 值趋向于+1, 表明绝对的空间正相关, 高值区域或低值区域趋于集聚; 趋向于0, 表明空间随机分布; 趋向于-1, 表明绝对的负相关, 高值区域被低值区域包围或低值区域被高值区域包围。Moran's I是基于999种排列的排列方法统计推论而得[43]。
局部空间自相关 (LISA) 认为每个空间单元彼此邻近, 可有助于识别创新投入和创新产出的“ 热点” [44]。LISA地图可以刻画局部Moran's I统计量的区位, 也能识别一些有影响的观测值的“ 热点” 。局部Moran's I统计量可表达为:
式中:zi和zj为观测值偏离i和j平均值的程度; Ii的期望值
在当前的研究中, 通过整合知识生产函数, 空间面板回归模型被用于从验证的视角阐明创新投入和创新产出的时空关系, 并解决空间自相关问题和估算空间溢出效应的影响。正如Anselin等指出, 在阐明观测值的空间依赖 (空间自相关) 时, 空间面板数据模型可能包含一个空间滞后因变量或一个空间自回归过程的误差项[46]。前一个为空间滞后模型 (Spatial Lag Model, 简称SLM), 后一个即为空间误差模型 (Spatial Error Model, 简称SEM)[47]。空间杜宾模型 (Spatial Durbin Model, 简称SDM) 被认为是第三种空间面板数据模型, 采用这种模型的动机源于当处理区域数据样本时可能会增加遗漏变量等问题, 表明SDM的一个本质特征是因变量中嵌套了空间依赖, 自变量和误差项的参数估计不会受到遗漏变量空间依赖程度的影响[48]。本研究采用SDM的另一个原因在于测度区内及区际尺度知识溢出效应的可行性, 即知识创新的直接效应和间接效应[49]。设定省级单元为 i = 1, ..., 31, 时间序列为 t = 1, ..., 12, 时域为2000-2011年, 共12年。量化区域创新投入和创新产出关系的SDM模型如下:
式中:δ 表示空间回归系数; wij是空间权重矩阵W中的一个元素; yjt表示被解释变量在j单元t时期的观测值; x(i, t-1) 是i单元和t-1时刻自变量的行向量 (1, K); γ 为k维列向量, 表示空间滞后解释变量的系数; μ i表示空间固定效应, 其控制了所有空间固定且不随时间变化的变量; λ i表示时间固定效应, 其控制了所有时间固定且不随空间变化的变量; ε it表示空间自相关误差项。如果将μ i看作是一组随机变量而不是一组固定效应, 则SDM就成为随机效应模型。
中国经济保持了30多年的高速增长态势, 但是, 这种经济增长主要受劳动密集型和出口导向型制造业的推动。中国政府已经认识到创新对国家未来经济发展的重要性, 并且在引导国家创新系统发展中起到了核心和持久的作用[50]。2006年以来, 随着国家创新战略和《国家中长期科技发展规划 (2006-2020)》的实施, 科学、技术和教育的发展促进了中国区域创新产出的快速增长。统计数据表明, 2000-2011年, 中国的专利申请数从140339项增加到1504670项, 年均增长率达24.07%。其中, 东部沿海发达省份对创新产出的时空格局具有重要的影响, 其专利申请数占全国专利申请总数的65%以上, 专利申请的比重也由65.28%提高到74.74% (表1)。分析表1, 中西部地区19个省区的专利申请数仅占全国的35%, 其在全国的地位持续下降。值得指出的是, 东部沿海地区一些省份的创新产出能力甚至能与整个中部或西部地区抗衡。例如, 广东省2006年专利申请数为90886项, 而同期中部和西部地区申请专利数仅分别为60096项和35857项, 同样, 2011年江苏省专利申请数超过中西部地区的总和, 由此可见, 中国创新产出的空间分布极不平衡。表1显示, 自2006年以来, 中国各省区创新产出的年均增长率几乎都经历了一个剧烈的加速过程, 表明创新能力的总体提升, 但是, 东部沿海地区仍然在创新产出中居于压倒性地位, 导致“ 沿海— 内陆” 分化加剧和区域鸿沟的进一步突出, 中国区域创新可能会陷入“ 强者愈强, 弱者愈弱” 的“ 马太效应” 。
为更清楚地阐明中国区域创新产出的空间分布特征, 本研究基于ArcGIS技术平台, 采用自然断裂点方法, 按照2000年、2006年和2011年的专利申请数分别将中国31个省区划分为5类 (图1)。图1表明, 中国省区创新活动呈现明显的空间分布特征:① 大部分创新活动主要集中在广东、江苏、浙江等几个东部沿海发达省份; ② 高密度创新活动的省份在地理空间上趋于集聚。因此, 可依据区域创新产出的空间特征, 将中国划分为东部沿海创新带和中部内陆创新区两部分。2000年以来, 东部沿海创新带的创新活动密度更高, 并表现出稳定的时空演化特征; 中部内陆创新区主要包括陕西、湖北、重庆、四川、湖南等省区, 并有不断向陕西、重庆、湖北等省区集聚的态势, 导致中国创新产出更为集中的空间分布格局。
![]() | 表1 2000-2011年中国各省区专利申请数及增长率 Tab. 1 Growth rates of patent applications in China, 2000-2011 |
3.2.1 探索性空间数据分析 表2揭示了2000-2011年中国创新产出与创新投入的全局空间自相关特征, 除了PCH的全局空间自相关有所波动之外, 其他所有指标均在空间上趋于集聚。但是, 全局空间自相关分析可能掩盖局部空间信息, 会产生一系列问题, 时间关联分析中需要纳入局部空间信息[51, 52]。因此, 本研究通过叠加不同时间截面创新产出和创新投入变量的“ 热点” , 采用时间稳定性“ 热点” 图式方法解决这个问题[45]。如果某个省区3个时间截面 (2000年、2006年和2011年) 仍为创新产出或创新投入的“ 热点” , 将省区识别为“ 1, 1, 1” ; 如果某一省区除2000年外均为“ 热点” , 标识为“ 0, 1, 1” ; 如果某一省区在3个时间截面中都不是“ 热点” , 则标识为“ 0, 0, 0” 。图2-图7显示了PAT、RDE、RDP、PCH和GDP的时间稳定性“ 热点” 类型。其中, 12个省区的专利申请数可识别为6类“ 热点” ; 5个省区的研发支出可识别为3类“ 热点” ; 16个省区的人均GDP可识别为4类“ 热点” ; 14个省区的在校大学生数可识别为5类“ 热点” ; 7个省区的研发人员可识别为3类“ 热点” 。此外, 专利申请数和人均GDP的“ 热点” 在空间分布上相似, 但具有不同的时间稳定性分布格局 (图2和图4), 而研发支出和研发人员数的“ 热点” 在空间分布和时间稳定性上具有一致性 (图3和图6)。图7显示了5个变量叠加后的时间稳定性“ 热点” 分布格局, 由此看出, 中部省区并未形成显著规模的创新产出“ 热点” 。
![]() | 表2 创新变量的Moran's I Tab. 2 Moran's I of innovative variables |
![]() | 图1 2000、2006和2011年中国各省区专利申请数Fig. 1 Patent applications in 2000 (a), 2006 (b) and 2011 (c) (piece per 10, 000 persons) in China |
3.2.2 验证性空间数据分析 采用SDM对创新产出和创新投入进行测试和估算[53]。首先, 选择具有随机效应的SDM 进行测试, Hausman 测试结果 (11.9384, p= 0.2168) 表明, 随机效应模型不能被空间或时间固定效应替代或拒绝。一般而言, 只有当时域范围T足够大时, 空间固定效应才能够被估算[54], 而由于本研究中时域 (T = 10) 较短, 采用具有随机效应的SDM更合适。此外, 通过H0:γ = 0和H0:γ + δ β = 0两种假设进一步验证SDM能否被简化为SLM或SEM。结果表明, SDM可简化为SLM (Wald 验证:18.9158, p< 0.01) 和SEM (Wald test: 20.7649, p< 0.01) 的假设都不成立 (表3), 因此, 具有随机效应的SDM为最优模型。其次, 创新产出和创新投入的SDM参数估计结果表明 (表3), 除了RDE变量外, SDM中所有解释变量的参数估计均很显著, 但是, 由于模型中纳入了空间滞后解释变量与被解释变量, 估计结果不能直接反映其边际效应, 也难以准确衡量创新投入变量对创新产出变量直接影响[53], 因此, 需要对SDM求偏微分来检验创新产出变量和创新投入变量的直接效应和空间溢出效应 (表4)。
![]() | 表3 SDM参数估计 Tab. 3 Parameter estimates of SDM |
![]() | 表4 SDM直接效应和间接效应估计 Tab. 4 Direct and indirect effect estimates of SDM |
由于区域创新过程中反馈效应的存在, 创新投入变量的直接效应不同于其参数估计值, 这种反馈作用部分源于PAT变量的空间滞后系数, 部分源于其自身的空间滞后系数[53]。例如, RDE的弹性系数为0.073244, 其直接效应为0.0964, 造成这种明显差异的原因部分源于W* RDE系数的统计显著为正, 部分源于空间滞后因变量 (W* PAT) 也显著为正。类似的, 由于RDP和PCH两个解释变量的空间滞后系数 (W* RDP 和 W* PCH) 均不显著, 其直接效应和参数估计弹性系数差异主要源于空间滞后变量PAT (W* PAT)。其中, RDP的反馈效应为0.007146, 仅为其直接效应的3.6172%; PCH的反馈效应为0.010531, 仅为其直接效应的5.6415%。由此不难看出, 不同的变量间的反馈效应存在较大的差异。此外, 空间滞后PAT变量统计显著性, 表明其溢出效应的地理区域跨越了省区边界。同时, 某一省区及其相邻省区创新活动的空间平均权重呈正相关, 表明相邻省区创新活动的溢出对本省区的创新活动亦具有实质性影响。同时, 比对分析表3和表4, 空间滞后创新投入变量的参数估计和SDM弹性系数间存在较大的差异, 表明在空间回归模型中, 参数估计结果和空间滞后变量均难以准确衡量间接效应的大小和显著性[47]。例如, 空间滞后RDE变量的参数估计值为0.498953, 而其间接效应估计值为0.6146; 空间滞后GDP变量的参数估计在5%水平统计显著时, 其间接效应并不具有统计上的显著性。此外, RDP和PCH 变量的间接效不具有统计上的显著性, 表明这两个解释变量只有局部效应, 仅影响某一省区自身的创新产出, 而RDE变量的间接效应具有统计上的显著性, 说明其对相邻省区的创新活动具有显著的溢出效应。依据LeSage 和Pace对知识溢出效应的研究, 两种视角可解释间接效应:一种是某一区域对其他区域的影响; 另一种是其它区域对某一特定区域的影响[48]。以RDE为例, 考虑某一具体省区对其它相邻省区的影响, 该省区研发支出每增加1%, 将会促进相邻省区创新产出提高0.6146%, 从另一个视角看, 某一省区的相邻省区研发支出每增加1%, 将会使该省区创新产出提升0.6146%。
本研究应用探索性空间数据分析和验证性空间数据分析方法, 分析了中国区域创新的时空动态, 阐明了创新产出与创新投入的时空耦合特征及作用机制。研究结论为中国省区创新活动的时空维度的分析提供了新的视角。主要结论如下:
(1) 中国省区创新活动的空间分布极不平衡, 呈现明显的“ 沿海— 内陆” 分化格局。东部沿海省区专利申请数超过全国总量的65%, 年均增长率达24.07%, 在全国区域创新活动中居于压倒性地位。中国区域创新具有明显的空间集聚特征, 创新活动进一步向东部沿海和中部内陆地区集聚, 并形成了以江苏、广东、浙江等为核心的东部沿海创新带和以陕西、湖北、重庆、四川、湖南等为核心的中部内陆创新区。
(2) 探索性空间数据分析结果表明, 创新产出与创新投入的空间集聚随时间推移不断强化, 通过识别其不同时期各类型“ 热点” , 表明中国区域创新产出的“ 热点” 与创新投入变量的“ 热点” 具有高度的时空耦合特征。采用具有随机效应的SDM, 从验证性视角阐明了中国区域创新产出与创新投入的时空关系, 研究表明, RDE、RDP、GDP和PCH等变量对创新产出具有显著的影响, 创新活动的溢出的地理区域跨越了省区边界, 由于空间依赖性的存在, 省区间创新活动具有反馈效应, 相邻省区的知识溢出对该省区的创新活动具有实质性影响。
(3) 通过对中国区域创新时空动态的量化研究, 进一步佐证已有研究中关于区域间存在正的知识溢出效应的重要论断, 并从创新产出和创新投入动态关系的视角, 阐明知识创新具有双向的溢出效应, 国家或区域的创新发展不仅需要提高自身研发和技术水平, 而且需要不断提升吸纳区外知识的能力, 研究结论可为促进中国省区创新产出和政策设计提供科学参考。
本研究选择中国31个省区12年的时空数据, 采用探索性空间数据分析和验证性空间数据分析方法, 较为客观的阐释了中国区域创新的时空动态。但是, 由于样本数据和时域节点相对较少, 研究结果可能并未充分揭示中国区域创新的时空变化规律, 需要在后续研究中深入开展区域创新的多时域、多尺度和多机制分析。
The authors have declared that no competing interests exist.
[1] |
|
[2] |
|
[3] |
|
[4] |
|
[5] |
|
[6] |
|
[7] |
|
[8] |
|
[9] |
|
[10] |
|
[11] |
|
[12] |
|
[13] |
|
[14] |
|
[15] |
|
[16] |
|
[17] |
|
[18] |
|
[19] |
|
[20] |
|
[21] |
|
[22] |
|
[23] |
|
[24] |
|
[25] |
|
[26] |
|
[27] |
|
[28] |
|
[29] |
|
[30] |
|
[31] |
|
[32] |
|
[33] |
|
[34] |
|
[35] |
|
[36] |
|
[37] |
|
[38] |
|
[39] |
|
[40] |
|
[41] |
|
[42] |
|
[43] |
|
[44] |
|
[45] |
|
[46] |
|
[47] |
|
[48] |
|
[49] |
|
[50] |
|
[51] |
|
[52] |
|
[53] |
|
[54] |
|