作者简介:王露, 博士生, 主要从事区域人口资源环境可持续发展综合研究。E-mail: wangl.11b@igsnrr.ac.cn
人口空间分布及其集疏变化是区域发展规划的重要科学基础之一。2000-2010年中国人口变化格局及其驱动因素有待进一步梳理。鉴于此,以分县为基本研究单元,利用2000年与2010年两次人口普查数据,首先根据人口密度变化将中国不同地区划分为快速增加、缓慢增加、缓慢降低和快速降低四个类型,并分析其空间格局与地域特征。在此基础上,选取11个自然与社会经济因素,利用偏最小二乘法 (PLS),对全国及四类地区的人口密度变化影响因素及其地域差异进行了定量分析。研究结果表明:① 相较于2000年,2010年全国超过60%的分县单元人口密度增加,平均增速为21人/km2,主要分布在城镇密集地区;不到40%的分县单元人口密度减少,平均降低13人/km2,主要分布在人口密集省份、老城区和边境地区;② 自然因素与社会经济因素对人口密度变化均有影响,但社会经济因素影响更大。高经济发展水平、医疗条件和通讯能力是人口密度增加的主要“拉力”,而地区内稠密的人口是人口密度降低的主要“推力”。上述结论基本理清了中国近10年来人口增减变化空间分布格局及其地域影响因素,可为未来人口发展和区域规划提供有益的借鉴。
Studying the change of population distribution and density can provide important basis for regional development and planning. However, the spatial patterns and driving factors of the change of population density in China were not clear yet. Therefore, using the population census data in 2000 and 2010, this study first analyzed the change of population density in China and divided the changes in all 2353 counties into 4 types, consisting of rapid increase, slow increase, slow decrease and rapid decrease. Subsequently, based on the partial least square (PLS) regression method, we recognized the significant influencing factors of population density change among 11 natural and social-economic factors for the whole country and counties with different types of population change. The results showed that: (1) compared to the population density in 2000, the population density in most counties (over 60%) increased by 21 persons per km2 on average, while the population density in other counties decreased by 13 persons per km2 in 2010. Of all 2353 counties, 860 and 589 counties respectively show rapidly and slowly increasing population density, while 458 and 446 counties show slowly and rapidly decreasing population density, respectively. (2) Among the 11 factors, social-economic factors have impact on population density change more significantly than natural factors. The higher economic development level, better medical condition and stronger communication capability were main pull factors of population increases. The dense population density was the main push factor of population decreases. These conclusions generally clarified the spatial distribution pattern of population change and its influencing factors in China over the past 10 years and could provide reference for the future population planning.
人是一切经济活动的载体[1]。人口分布是人口过程在空间上的表现形式[2, 3]。改革开放以来, 随着经济发展、城市化加速以及国家、区域发展规划与人口政策的影响, 中国区域间人口流动规模迅速增大, 人口分布格局也随之发生改变[4, 5]。无疑, 研究人口空间分布与集疏变化及其影响因素, 不仅能外在把握地域人口特征和人口空间演进过程, 还能内在挖掘导致地域人口变化的驱动力。
对人口分布时空变化及其影响因素的探讨一直是人口研究的热点问题。地域人口增长既来自初始人口的自然增长, 也来自人口的机械增长 (即人口的迁移流动)[1]。一些学者利用人口年龄结构和生育率等资料研究了全国和不同地区的人口自然增长[6, 7, 8]。而对于人口的机械增长, 众多学者利用了“ 推— 拉理论” 阐释了人口迁移流动发生的原因[6, 9, 10]。如人口过多、气候条件恶劣、居住环境差、机会缺乏等不利条件会形成“ 推” 力, 促使原住民迁出; 而丰富的就业机会、舒适的气候、吸引人的生活方式等有利条件则会形成“ 拉” 力, 吸引移民迁入[11]。有研究表明, 区位条件、政策因素是影响人口流动的关键因素[1, 12, 13, 14]; 地区间的就业机会、收入差异、医疗卫生和教育条件差异能直接影响人口迁移流动和地区人口增长[10, 15, 16]; 产业结构亦能通过不同产业对劳动人口的吸纳能力不同来影响地区人口增长[15]。此外, 人口迁移的影响因素还包括潜在内力, 即迁移主体— 人的内在差异, 包括人的年龄、性别、受教育程度、家庭及生命周期以及个性等[10]。
从方法论上看, 区域人口变化及其影响因素研究常采用文献分析、调查分析、理论分析和统计分析等方法。文献分析是指综合已有研究成果来分析人口变化的影响因素[17, 18]。该方法在集成已有研究成果的过程中可能会因不同研究所采用的方法不同而存在不确定性。调查分析是指采用调查问卷等方式来获取迁移主体的个体特征。但该方法只适用于小区域尺度研究[19]。理论分析是指建立诸如“ 推— 拉” 原理等理论模型来解释人口迁移流动过程的方法, 但缺少实证的检验[10]。统计分析是指采用相关分析、主成分分析和简单回归分析等统计学方法来研究人口变化与影响因素之间的相关关系[1, 15, 16, 20]。统计方法潜在的问题是各影响因素之间可能存在自相关问题。部分研究采用滞后变量法来解决自相关问 题[16, 22, 23]。而有些研究并未考虑此问题[1, 15, 21]。
综上所述, 既有人口变化影响因素研究主要集中在小区域尺度, 缺乏在大区域或者全国范围的系统研究。在影响因素选择上, 现有研究较多考虑了社会经济因素, 且常忽略影响因素之间的自相关性。有鉴于此, 本文以县级行政区为基本研究单元, 运用2000年第5次与2010年第6次全国人口普查数据, 在全国和区域尺度对人口分布及人口密度增减变化空间格局进行了分析, 并从自然因素和社会经济因素两个方面共选取11个指标, 运用新型多元统计数据分析方法— — 偏最小二乘 (Partial least squares, PLS) 法, 对人口密度变化影响因素进行了讨论, 试图科学理清中国近10年来人口增减变化空间格局及其地域影响因素。
研究使用的分县人口数据源于2000年和2010年两期全国人口普查数据, 统计口径为常住人口。其余数据来源见表2。为方便对比分析, 本文统一采用2010年中国县级行政区划 (共2353个单元, 包括各县 (旗) 单元、县级市单元、地级市市辖区单元与直辖市各区)作为基本研究单元。并据此将2000年的原数据 (分为栅格数据与统计数据两类) 统一到2010年的行政区划。对于2000年的栅格数据, 本研究以2010年分县行政单元为界线, 对各栅格数据进行重新统计, 分别计算各分县单元内栅格数据的平均值。对于2000年的统计数据, 首先将所有统计数据与2000年中国县级行政区划文件进行链接, 生成空间矢量数据。然后根据各县2000年与2010年的行政区划一致性, 对分县统计数据进行处理, 以形成可对比的数据集。具体处理步骤如下:
(1) 对于2010年与2000年行政区划一致的分县单元, 将2000年的数据直接赋值到2010年的县界数据上。
(2) 对于2010年与2000年行政区划不一致的分县单元, 首先将各空间矢量数据转换为1 km× 1 km的密度栅格数据, 再以2010年分县行政区划为边界, 对2010年该县范围内的栅格值进行求和, 计算出2000年该县各数据的修正值。
研究以分县为基本研究单元, 通过计算人口密度相对变化率, 对人口密度变化进行分类, 以揭示人口变化的地域特征。分县人口密度相对变化率计算公式如下:
式中:Fj为j县的人口密度相对变化率; dj(2010)为j县2010年人口密度; dj(2000)为j县2000年人口密度; D2010为全国2010年人口密度; D2000为全国2000年人口密度。
分县人口密度变化分类规则如表1所示。
![]() | 表1 中国分县人口密度增减变化分类规则 Tab. 1 Classification rule for the change of population density in China on county scale |
人口密度变化是2000-2010年各县人口集疏格局变化的直观表征, 因此本研究选择2000-2010年各分县单元人口密度变化作为响应变量。参考其他研究[15, 24-25], 并基于数据的可获得性, 最终选取了11个自然环境指标和社会经济指标作为影响因子 (表2)。自然环境指标中, 地形起伏度、植被指数能够反映各地区的自然环境状况, 是影响区域人口分布的重要自然条件之一[25]; 多年平均温度和多年平均降水是各地区气候情况的体现, 直接影响当地居民生活的舒适度[26]; 单位面积水资源量与单位面积粮食产量是各地区自然资源与生产能力的重要体现, 通过影响当地居民的生活水平, 从而影响该地区的人口变化。社会经济指标中, 初始人口密度影响各地区的人口基本分布状况和集聚程度; 经济密度、交通密度、电话密度与床位密度可分别表征各地区经济发展水平、通达状况、通讯能力以及健康保障能力, 对地区人口变化有重要影响。
![]() | 表2 人口密度变化影响因子及其数据来源 Tab. 2 Influencing factors of population density change and their data sources |
偏最小二乘 (Partial least squares, PLS) 回归是指建立一组响应变量Y(n× 1) 与预测变量 (即影响因子) X(n× p) 之间的回归模型的方法, 常用于预测研究, 如植物物候期预测、烟草常规成分预测等[31, 32, 33, 34]。偏最小二乘回归分析在建模过程中集中了主成分分析, 典型相关分析和线性回归分析方法的特点, 因此在分析结果中, 可以同时完成一些类似于主成分分析和典型相关分析的研究内容, 同时可避免因因素自相关而造成的误差。偏最小二乘回归的公式为:
(1)
(2)
(3) XS:n× ncomp, 矩阵。预测得分, X0通过线性变换得到的各成分的矩阵。ncomp为采用的成分个数。
(4) W:p× ncomp, 矩阵。响应变量权重, 通过对XS按照W变换可得到XS。
(5) XL:p× ncomp, 矩阵。预测变量载荷 (Loading), 每行确定了每个PLS成分的线性变化系数, 以近似模拟预测变量
(6) YL:p× ncomp, 矩阵, 响应变量载荷, 每行确定了每个PLS成分的线性变化系数, 以近似模拟响应变量。
PLS回归通过寻找使
式中:VIPj是指第j个预测变量的重要性; PVk指第k个成分对响应变量Y的方差解释量。变量重要性越大, 意味着该预测变量对于响应变量起的作用越大。一般来讲, VIP大于0.8时, 意味着该预测变量的作用极为显著, 不可忽视[35]。
式中:Beta为回归系数矩阵 (p× 1); Res为离差。每行代表着各预测变量的回归系数。回归系数的绝对值越大, 意味着该预测变量对响应变量影响的程度越大。回归系数为正时, 意味着响应变量与预测变量正相关, 反之则反之。
全国尺度的分析中, Y是指各县2000-2010年的人口密度变化, 共有 p = 2353个县。预测变量X指上述11个影响因子所形成的矩阵。ncomp取2。另外, 本文根据人口密度增减变化分类结果 (图3), 分别对4类地区进行PLS分析, 以探讨在不同类型区起显著作用的影响因子。所有计算均在Matlab 2010b软件 (MathWorks, Inc.) 下完成。
相较于2000年, 2010年中国2353个分县单元中有1449个分县单元人口密度增加 (图1), 占比61.6%, 占地66.7%, 相应人口占68.2%。其中, 589个分县单元属于缓慢增加类型, 平均增加6.2人/km2; 860个分县单元属于快速增加类型, 平均增加25.6人/km2。从空间分布上看, 人口密度快速增加的地区较为集中的分布于长江三角洲地区、珠江三角洲地区、京津冀都市圈地区、西北干旱地区以及青藏高原地区 (图1)。
2010年与2000年相比, 人口密度降低的分县单元有904个 (图1), 占比38.4%, 占地33.3%, 相应人口占31.8%。其中, 458个分县单元属于缓慢降低类型, 平均降低量为4.9人/km2; 446个属于快速降低类型, 平均降低量为24.0人/km2。从空间分布上看, 人口密度降低的分县单元主要分布于湖北、安徽、河南、江苏北部、重庆、四川东部、贵州、广西西北部、福建等人口密集省份, 上海等大城市的老城区以及东北边境地区也有分布 (图1)。
在全国尺度, 通过各县人口密度变化和各影响因子之间的PLS回归可得到各因子的重要性值 (VIP)。结果表明, VIP超过0.8的因子有5个, 全部为社会经济因素 (图2)。按照重要性由高到低依次为初始人口密度 (VIP = 2.19)、床位密度 (VIP = 1.34)、电话密度 (VIP = 1.16)、交通密度 (VIP = 1.11) 和经济密度 (VIP = 0.98)。其中, 初始人口密度对分县人口密度变化的影响方向为负 (负回归系数, 图2), 即在全国尺度, 初始人口密度越大的地区, 人口集聚速度越缓慢。而其余四个影响因子均为正影响, 即高的床位数、电话、交通和经济密度可促进人口集聚。所有自然因素的VIP值均未达到0.8。这表明在全国尺度自然因素对人口密度变化的影响已不显著, 社会经济因素作用趋强。
![]() | 图2 全国尺度县级单元2000-2010年人口密度变化影响因子的VIP与BETA。影响因子编号对应表2.Fig. 2 VIP and BETA value of influencing factors of population density change on national scale from 2000 to 2010. Numbers of influencing factors are shown in Table 2 |
通过对不同人口密度变化类型的地区进行PLS分析, 可得到各类型地区人口密度变化的影响因子, 具体结果如图3所示。
人口密度快速增加地区, VIP值超过0.8的影响因子全部为社会经济指标, 依次为经济密度 (VIP = 1.69)、电话密度 (VIP = 1.60)、床位数 (VIP = 1.60) 和初始人口密度 (VIP = 1.34)。以上因素均与人口密度增加量呈正相关 (图3a)。
人口密度缓慢增加地区, 与人口密度快速增加地区相类似, 初始人口密度 (VIP = 1.70)、经济密度 (VIP = 1.57)、床位密度 (VIP = 1.48) 和电话密度 (VIP = 1.47)与人口密度增加量呈显著正相关 (图3b), 但顺序和VIP值有所不同。
人口密度缓慢降低地区, 有3个社会经济因子与人口密度变化量呈显著正相关关系, 分别为经济密度 (VIP = 1.08)、电话密度 (VIP = 0.97) 和床位密度 (VIP = 0.90)。而初始人口密度 (VIP = 1.68) 与人口密度变化呈显著负相关关系。自然因素对该类地区人口密度变化的影响较小, VIP值均未达到0.8水平 (图3c)。
人口密度快速降低地区, VIP值超过0.8的因素全部为社会经济因素, 依次为初始人口密度 (VIP = 1.68)、经济密度 (VIP = 1.57)、床位密度 (VIP = 1.53) 和电话密度 (VIP = 1.51), 以上因素均对快速降低地区人口密度变化起显著负影响 (图3d)。
![]() | 图3 中国不同人口密度变化类型2000-2010年人口密度变化影响因子的VIP与BETA。影响因子编号对应表2.Fig. 3 VIP and BETA value of influencing factors for 4 types of population density change from 2000 to 2010. Numbers of influencing factors are shown in Table 2 |
从研究结果来看, 自然因素与社会经济因素都不同程度的影响了人口增减与迁移。目前, 社会经济因素在人口变化过程中起主要作用, 影响程度远大于自然因素。具体而言:
(1) 在人口密度增加地区 (包括缓慢增加和快速增加地区), 经济密度、电话密度和床位密度对人口增长呈显著正影响, 而自然因素的影响已不显著。这表明, 较高的经济发展水平、较好的通讯设施和医疗条件是人口密度增加的“ 拉力” 。该结果符合我们的预期, 也符合人口聚集与经济聚集相互助推的一般认识。因为经济密度越高的地区具有发达的经济和较高的工资水平、生活条件, 对外来务工人口有很大的吸引力。加上, 良好的通讯能力能加快区域内部信息交换和传播的速率, 同时也能及时向外部劳动力提供有关工作机会、买卖交易等方面的经济信息, 吸引外来人口迁入; 医疗条件好的地区, 能够为居民提供更好的医疗保健设施, 可提高人的健康水平, 降低死亡率, 使该地区的本地人口增长大于医疗条件落后的地区; 与此同时, 外来人口为保障健康也倾向于迁入医疗条件好的地区。此外, 研究发现高的初始人口密度也会促使这两类地区人口密度增加, 即人口聚集带来经济聚集, 促进人口进一步聚集。这与全国尺度的结果似乎矛盾。但我们认为, 这主要是因为地区经济发展水平、好的医疗条件等形成的巨大拉力, 掩盖了地区人口密度过大的劣势条件所致 (表3), 并且人口密度与人口规模也并非完全一致。
(2) 在人口密度缓慢降低地区, 初始人口密度呈显著的负影响, 而经济密度、电话密度和床位密度等呈正影响, 自然条件无显著影响, 这表明较高的初始人口密度是促使人口迁出的“ 推力” , 且这种推力大于本地区经济水平、通讯能力和医疗条件带来的“ 拉力” 。一方面, 有限的资源难以满足其高人口的生存需求, 从而使人口迁出。另一方面, 初始人口密度越大, 社会压力越大, 有限的就业岗位和经济规模会促使本地人口去外地寻找就业岗位。
(3) 在人口密度快速降低地区, 初始人口密度仍呈显著负影响, 但经济密度、电话密度和床位密度变成了负影响。这表明, 在人口密度快速降低地区, 较高的初始人口密度、较高的经济水平、较好的医疗和通讯能力均成为人口迁出的“ 推力” 。该结论看似矛盾, 但这是由于在偏回归分析时只使用人口密度快速降低地区的资料, 而忽略了不同类型地区间人口的迁移流动。从图1可以看出, 人口密度快速降低地区多分布在湖北、四川、河南等人口大省, 但这些人口大省的经济发展水平相对于经济发达省份 (人口密度变化类型多为快速增长) 较低 (表3)。因此较高的经济水平、较好的医疗和通讯能力的推力是由沿海经济发达省份对劳动力的更强吸引力导致的。事实上, 在考虑了地区之间的相互作用后, 较高的经济水平、较好的医疗和通讯能力在全国尺度的偏回归分析中均对人口密度有显著正影响 (图2)。
![]() | 表3 2000年中国不同人口密度变化类型分县GDP、电话数和床位数平均值对比 Tab. 3 Average GDP, telephone number and hospital bed number for counties with 4 types of population density change of China in 2000 |
本文的人口密度变化空间分布格局可与其他研究相印证。例如, 之前的研究表明, 青藏高原地区近年来人口密度显著增加, 与该地区的高生育率密切相关[36]。而其余人口密度变化较大地区则主要与人口迁移流动有关。例如有研究发现, 中国人口迁出规模最大的地区是四川、河南、湖北等人口密集地区, 人口迁入规模最大的地区是广东, 其次是上海、北京和浙江[9, 37]。这与本文得到的人口密度变化格局相一致 (图1)。在导致这种人口密度变化的原因方面, 前人发现高人口密度在人口下降地区存在推力和高经济发展水平在人口密度增加地区存在拉力作用, 这也与本文的研究结论基本一致[6, 16]。
此外, 因政策因素难以定量化, 本文没有探讨政策作用及其影响。事实上, 区域人口及其相关政策会对人口密度变化产生一定影响。例如, 四川、湖北等地区人口的降低除了大量劳动力外流外, 还与相对严格的计划生育政策有关[38]。而大城市老城区人口的减少与城市土地使用制度、新区开发政策以及住房制度亦有直接关系。土地有偿使用制度和优惠的开发区税收制度等使大量工业企业从中心城区外迁至郊区; 商品房制度的实行, 使普通市民, 特别是工薪阶层前往郊区购房[39]。
(1) 从人口密度变化空间格局来看, 2000-2010年, 中国人口密度快速增加、缓慢增加、缓慢降低和快速降低的分县单元比例分别为36.5%、25.0%、19.5%和19.0%。从空间分布上看, 人口密度增加的地区集中在长江、珠江三角洲地区、京津冀都市圈地区、西北干旱地区以及青藏高原地区。人口密度降低的地区主要分布于湖北、安徽、河南、江苏北部、重庆、四川东部、贵州、广西西北部、福建等人口密集省份, 上海等大城市的老城区以及东北边境地区。
(2) 从人口密度变化影响因素看, 自然因素对人口密度变化的影响已不显著, 社会经济因素对人口增长与迁移在起主要作用。高的经济发展水平, 发达的通讯设施和医疗条件是人口密度增加的主要“ 拉力” 。而稠密的人口是人口密度降低的主要“ 推力” 。这是由人口稠密地区资源相对稀缺、就业压力较大等不利因素所决定的。
The authors have declared that no competing interests exist.
[1] |
|
[2] |
|
[3] |
|
[4] |
|
[5] |
|
[6] |
|
[7] |
|
[8] |
|
[9] |
|
[10] |
|
[11] |
|
[12] |
|
[13] |
|
[14] |
|
[15] |
|
[16] |
|
[17] |
|
[18] |
|
[19] |
|
[20] |
|
[21] |
|
[22] |
|
[23] |
|
[24] |
|
[25] |
|
[26] |
|
[27] |
|
[28] |
|
[29] |
|
[30] |
|
[31] |
|
[32] |
|
[33] |
|
[34] |
|
[35] |
|
[36] |
|
[37] |
|
[38] |
|
[39] |
|