环境因素与暴力犯罪的非线性和空间异质性关系分析
张延吉(1989-), 男, 上海人, 副教授, 研究方向为社会地理学、犯罪地理学。E-mail: chairman7up@126.com |
收稿日期: 2023-02-24
修回日期: 2023-12-23
网络出版日期: 2024-08-06
基金资助
国家社会科学基金青年项目(21CSH006)
Nonlinear and spatially heterogeneous relationship between environmental factors and violent crime: Based on interpretable machine learning method
Received date: 2023-02-24
Revised date: 2023-12-23
Online published: 2024-08-06
Supported by
Youth Program of National Social Science Foundation of China(21CSH006)
“环境—犯罪”间的非线性关系与空间异质性关系是导致理论争议和实证分歧的关键,但有关分析仍显碎片化,且面临依赖线性模型、共线性问题、遗漏变量等局限。本文利用机器学习中的GBDT算法和SHAP解释器,系统揭示48种建成环境及社会环境因素与北京暴力犯罪的非线性和空间异质性关系。研究表明,案例区环境因素与暴力犯罪存在7类非线性关系,各类环境因素的影响方向和边际效应呈不同变化趋势。环境因素与暴力犯罪的关联还具有不同程度的空间异质性,经K-means聚类分析,可将全域划分成6类拥有差异化犯罪引致因素的区域。犯罪模式理论的设施划分、街道眼与防卫空间理论何者成立、社会解组理论所提因素的影响都取决于环境变量取值区间和空间单元所在区位。犯罪防控应由普适性施策转向因类因地施策,公共资源投入需聚焦特定区间和重点区域。
张延吉 , 朱春武 . 环境因素与暴力犯罪的非线性和空间异质性关系分析[J]. 地理学报, 2024 , 79(8) : 2141 -2156 . DOI: 10.11821/dlxb202408014
The nonlinear relationship and spatially heterogeneous relationship between environmental factors and criminal activities are the main reasons for both the theoretical and empirical divergence, but the relevant analysis remains fragmented and faces limitations such as linear relationship hypothesis, collinearity problems and omitted variable bias. This study uses Gradient Boosting Decision Tree (GBDT) algorithm and Shapley Additive Explanation (SHAP) interpreter in machine learning to systematically reveal the nonlinear and spatially heterogeneous relationships between 48 built and social environmental factors on violent crime in Beijing. Our research has revealed the existence of seven distinct types of nonlinear relationships between environmental factors and violent crime, each exhibiting unique trends in the direction of influence and marginal effects. Furthermore, we have found that the association between environmental factors and violent crime exhibits varying degrees of spatial heterogeneity. By utilizing K-means clustering analysis, the entire area can be segmented into six distinct regions, each characterized by different critical criminogenic factors. These findings suggest that the applicability of crime geography theories, such as the classification of crime generators, attractors, and inhibitors based on crime pattern theory, the validity of street eye theory and defensible space theory, and the impact of social attributes as proposed by social disorganization theory, may depend on the value range of environmental factors and differ across locations. In light of these findings, it is recommended that crime prevention strategies shift from universal to targeted approaches, wherein public resources are allocated to specific value ranges of environmental variables and prioritized regions.
表1 环境因素对暴力犯罪的整体影响和局部分异Tab. 1 Global effects and local variations of environmental factors on violent crime |
变量 | |SHAP| 均值 (排序)① | SHAP值> 0+0.5×标准 差的网格 比例(%)② | SHAP值< 0-0.5×标准 差的网格 比例(%) | 变量 | |SHAP| 均值 (排序) | SHAP值> 0+0.5×标准差的网格 比例(%) | SHAP值< 0-0.5×标准 差的网格 比例(%) |
---|---|---|---|---|---|---|---|
居住小区数量 | 1.33(6) | 9.5 | 5.6 | 到地铁站距离 | 0.25(15) | 14.8 | 4.8 |
社区商业数量 | 2.05(2) | 19.2 | 1.7 | 功能混合度 | 0.50(9) | 39.5 | 27.0 |
文化设施数量 | 0.07(33) | 3.2 | 1.2 | 交叉口数量 | 0.26(13) | 3.5 | 10.1 |
教育科研设施数量 | 0.05(38) | 0.1 | 6.5 | 道路长度 | 0.12(23) | 3.2 | 4.5 |
体育设施数量 | 0.08(30) | 0.0 | 3.6 | 支路面积比例 | 0.08(32) | 8.6 | 28.7 |
医疗卫生设施数量 | 0.08(31) | 2.9 | 2.9 | 夜间灯光值 | 0.54(7) | 27.0 | 2.2 |
社会福利设施数量 | 0.01(47) | 0.0 | 0.0 | 房屋单价 | 0.18(21) | 10.2 | 6.4 |
宗教文物设施数量 | 0.02(43) | 0.3 | 0.1 | 房龄异质性 | 0.10(25) | 14.2 | 10.2 |
零售商业数量 | 1.74(4) | 37.4 | 57.1 | 就业人口数量 | 0.00(48) | 0.0 | 0.0 |
批发市场数量 | 0.26(14) | 7.5 | 8.9 | 男性就业人口比例 | 0.01(44) | 2.2 | 1.2 |
餐馆数量 | 1.46(5) | 14.1 | 70.0 | 青年就业人口比例 | 0.05(36) | 1.7 | 3.3 |
旅馆数量 | 0.20(20) | 5.2 | 0.1 | 低学历就业人口比例 | 0.04(40) | 12.2 | 11.4 |
金融保险办公楼数量 | 0.17(22) | 0.3 | 8.0 | 低收入就业人口比例 | 0.12(24) | 17.6 | 0.5 |
其他商务办公楼数量 | 0.06(34) | 2.8 | 0.0 | 就业人口异质性 | 0.46(10) | 6.8 | 0.0 |
娱乐设施数量 | 0.20(19) | 1.1 | 11.7 | 居住人口数量 | 1.83(3) | 9.2 | 1.9 |
康体场所数量 | 0.05(39) | 1.8 | 0.0 | 男性居住人口比例 | 0.09(29) | 22.5 | 22.3 |
加油加气站数量 | 0.03(42) | 4.2 | 1.5 | 青年居住人口比例 | 0.10(26) | 15.0 | 38.6 |
公用设施网点数量 | 0.05(37) | 0.4 | 12.5 | 低学历居住人口比例 | 0.05(35) | 0.7 | 3.6 |
工厂数量 | 0.01(46) | 1.4 | 0.8 | 低收入居住人口比例 | 0.24(16) | 26.9 | 1.4 |
物流仓储数量 | 0.03(41) | 4.0 | 3.6 | 居住人口异质性 | 0.53(8) | 20.7 | 0.1 |
公园数量 | 0.01(45) | 0.8 | 5.8 | 活动人口数量 | 0.44(11) | 13.4 | 0.1 |
停车场数量 | 0.09(27) | 10.5 | 0.3 | 外来人口比例 | 0.09(28) | 11.2 | 3.9 |
到政府距离 | 0.20(17) | 7.3 | 1.9 | 历史暴力犯罪数量 | 11.62(1) | 7.6 | 2.4 |
到公交站距离 | 0.20(18) | 22.1 | 16.4 | 周边暴力犯罪数量 | 0.30(12) | 7.4 | 14.6 |
注:① 为清晰表达,SHAP绝对值均值较原值扩大100倍;② 标准差指SHAP绝对值标准差。 |
表2 环境因素与暴力犯罪的关系类型及曲线拟合优度Tab. 2 Relation type between environmental factors and violent crime and R2 of fitted curve |
变量 | 关系类型 | R2 | 变量 | 关系类型 | R2 |
---|---|---|---|---|---|
居住小区数量 | I-2 | 0.81 | 到地铁站距离 | II-2 | 0.37 |
社区商业数量 | I-2 | 0.82 | 功能混合度 | I-1 | 0.54 |
文化设施数量 | III-1 | 0.35 | 交叉口数量 | I-3 | 0.77 |
教育科研设施数量 | II-1 | 0.72 | 道路长度 | I-1 | 0.56 |
体育设施数量 | II-1 | 0.81 | 支路面积比例 | III-2 | 0.17 |
医疗卫生设施数量 | I-3 | 0.51 | 夜间灯光值 | III-1 | 0.53 |
社会福利设施数量 | IV | 0.01 | 房屋单价 | I-1 | 0.46 |
宗教文物设施数量 | III-1 | 0.77 | 房龄异质性 | III-1 | 0.12 |
零售商业数量 | III-1 | 0.60 | 就业人口数量 | - | - |
批发市场数量 | I-2 | 0.53 | 男性就业人口比例 | IV | 0.01 |
餐馆数量 | III-1 | 0.81 | 青年就业人口比例 | IV | 0.01 |
旅馆数量 | I-3 | 0.73 | 低学历就业人口比例 | III-2 | 0.35 |
金融保险办公楼数量 | II-2 | 0.69 | 低收入就业人口比例 | III-2 | 0.01 |
其他商务办公楼数量 | I-3 | 0.78 | 就业人口异质性 | III-1 | 0.05 |
娱乐设施数量 | III-1 | 0.39 | 居住人口数量 | I-3 | 0.88 |
康体场所数量 | I-3 | 0.59 | 男性居住人口比例 | III-1 | 0.31 |
加油加气站数量 | IV | 0.08 | 青年居住人口比例 | II-1 | 0.23 |
公用设施网点数量 | III-2 | 0.55 | 低学历居住人口比例 | IV | 0.03 |
工厂数量 | III-2 | 0.14 | 低收入居住人口比例 | III-1 | 0.10 |
物流仓储数量 | III-1 | 0.04 | 居住人口异质性 | III-1 | 0.22 |
公园数量 | III-1 | 0.11 | 活动人口数量 | I-3 | 0.83 |
停车场数量 | III-1 | 0.28 | 外来人口比例 | I-3 | 0.19 |
到政府距离 | II-2 | 0.17 | 历史暴力犯罪数量 | III-1 | 0.98 |
到公交站距离 | II-1 | 0.05 | 周边暴力犯罪数量 | III-1 | 0.31 |
表3 6类区域的SHAP均值Tab. 3 The mean SHAP value of six areal types |
变量 | 类型1 | 类型2 | 类型3 | 类型4 | 类型5 | 类型6 |
---|---|---|---|---|---|---|
居住小区数量 | -0.006 | 0.034 | -0.004 | 0.027 | 0.014 | 0.030 |
社区商业数量 | -0.003 | 0.050 | 0.026 | 0.029 | 0.019 | 0.061 |
文化设施数量 | 0 | -0.004 | 0.005 | -0.002 | 0.002 | 0.001 |
教育科研设施数量 | 0 | 0 | 0.005 | 0.002 | 0 | 0 |
体育设施数量 | 0 | -0.003 | -0.001 | -0.001 | -0.003 | -0.002 |
医疗卫生设施数量 | -0.001 | 0 | 0.004 | 0 | 0.001 | 0 |
社会福利设施数量 | 0 | 0 | 0 | 0 | 0 | 0 |
宗教文物设施数量 | 0 | 0 | 0 | 0 | 0 | 0 |
零售商业数量 | 0 | 0.021 | 0.014 | 0.014 | 0.011 | 0.040 |
批发市场数量 | -0.001 | 0.006 | 0.002 | 0.004 | 0.005 | 0.003 |
餐馆数量 | -0.006 | 0.027 | 0.005 | 0.021 | 0.014 | 0.032 |
旅馆数量 | 0 | 0.011 | 0.002 | 0.013 | 0.008 | 0.007 |
金融保险办公楼数量 | 0 | -0.004 | -0.001 | -0.008 | -0.007 | -0.006 |
其他商务办公楼数量 | 0 | 0.004 | -0.001 | 0.006 | 0.003 | 0.002 |
娱乐设施数量 | -0.001 | -0.007 | -0.002 | -0.005 | -0.003 | -0.005 |
康体场所数量 | 0 | 0.002 | 0 | 0.003 | 0.002 | 0.001 |
加油加气站数量 | 0 | 0.001 | -0.001 | 0.001 | 0.001 | 0.001 |
公用设施网点数量 | 0 | -0.002 | -0.001 | -0.002 | -0.002 | -0.002 |
工厂数量 | 0 | 0 | 0 | 0 | 0.011 | 0 |
物流仓储数量 | 0 | 0 | 0 | 0 | 0 | 0.001 |
公园数量 | 0 | 0 | 0 | 0 | 0 | 0 |
停车场数量 | 0 | 0.003 | 0.004 | 0.009 | 0.006 | 0.003 |
到政府距离 | -0.001 | 0.007 | 0.005 | 0.007 | 0.006 | 0.003 |
到公交站距离 | 0 | -0.001 | -0.003 | 0.005 | 0 | 0 |
到地铁站距离 | 0 | 0.005 | 0.001 | 0.003 | 0.004 | 0.004 |
功能混合度 | 0.001 | 0.010 | 0.006 | 0.008 | 0.004 | 0.006 |
交叉口数量 | -0.002 | 0 | 0.003 | 0.002 | 0 | -0.001 |
道路长度 | -0.001 | 0.002 | 0.001 | -0.001 | 0.002 | 0.001 |
支路面积比例 | 0 | 0 | 0.005 | -0.001 | 0 | 0 |
夜间灯光值 | 0.001 | 0.019 | 0.007 | 0.018 | 0.014 | 0.009 |
房屋单价 | 0 | 0.003 | 0.011 | 0.006 | 0.003 | 0.001 |
房龄异质性 | 0 | 0.004 | 0.004 | -0.001 | 0 | 0 |
就业人口数量 | 0 | 0 | 0 | 0 | 0 | 0 |
男性就业人口比例 | 0 | 0 | 0 | 0.001 | 0 | 0 |
青年就业人口比例 | 0 | 0.001 | 0.022 | 0.001 | 0 | 0 |
低学历就业人口比例 | 0 | 0 | 0 | 0 | 0 | 0 |
低收入就业人口比例 | 0 | 0 | 0 | 0 | 0.008 | 0.003 |
就业人口异质性 | 0.002 | 0.039 | 0.109 | 0.100 | 0.010 | 0.008 |
居住人口数量 | -0.007 | 0.054 | 0.006 | 0.033 | 0.047 | 0.042 |
男性居住人口比例 | 0 | 0.001 | 0.001 | 0 | 0.001 | 0.001 |
青年居住人口比例 | 0 | 0 | -0.001 | 0 | 0 | -0.001 |
低学历居住人口比例 | 0 | -0.003 | 0.001 | 0.004 | -0.002 | -0.001 |
低收入居住人口比例 | 0.001 | 0.002 | 0.002 | 0.030 | 0.001 | 0.003 |
居住人口异质性 | 0.003 | 0.041 | 0.028 | 0.038 | 0.017 | 0.015 |
活动人口数量 | 0 | 0.045 | 0.016 | 0.023 | 0.015 | 0.012 |
外来人口比例 | 0 | 0.011 | 0 | 0.001 | 0.002 | 0 |
历史暴力犯罪数量 | -0.081 | 0.792 | 0.358 | 1.433 | 2.550 | 0.038 |
周边暴力犯罪数量 | -0.001 | 0.003 | 0.026 | 0.001 | 0.001 | -0.001 |
[1] |
|
[2] |
|
[3] |
|
[4] |
[贺力, 陈晨, 王忠民, 等. 城市微环境与盗窃犯罪关系研究进展. 地理研究, 2022, 41(11): 2912-2931.]
|
[5] |
|
[6] |
|
[7] |
|
[8] |
|
[9] |
|
[10] |
|
[11] |
|
[12] |
|
[13] |
|
[14] |
|
[15] |
|
[16] |
|
[17] |
[单勇. 犯罪热点成因: 基于空间相关性的解释. 中国法学, 2016(2): 280-302.]
|
[18] |
|
[19] |
|
[20] |
|
[21] |
|
[22] |
|
[23] |
|
[24] |
|
[25] |
|
[26] |
[徐冲, 柳林, 周素红, 等. 微观空间因素对街头抢劫影响的空间异质性: 以DP半岛为例. 地理研究, 2017, 36(12): 2492-2504.]
|
[27] |
[戴劭勍, 江辉仙, 李佳佳, 等. H市城区步行环境对两抢一盗警情的影响. 地理科学, 2018, 38(8): 1235-1244.]
|
[28] |
|
[29] |
[周素红, 谢蔚翰, 宋广文, 等. 土地利用对街头抢劫影响的空间分异模式: 以H市为例. 地理科学, 2017, 37(6): 885-894.]
|
[30] |
|
[31] |
|
[32] |
|
[33] |
|
[34] |
[陈强. 机器学习及Python应用. 北京: 高等教育出版社, 2021.]
|
[35] |
|
[36] |
|
[37] |
[柳林, 刘文娟, 廖薇薇, 等. 基于随机森林和时空核密度方法的不同周期犯罪热点预测对比. 地理科学进展, 2018, 37(6): 761-771.]
|
[38] |
|
[39] |
|
[40] |
|
[41] |
[龙冬平, 柳林, 冯嘉欣, 等. 社区环境对入室盗窃和室外盗窃影响的对比分析: 以ZG市ZH半岛为例. 地理学报, 2017, 72(2): 341-355.]
|
[42] |
|
[43] |
[张延吉, 秦波, 朱春武. 北京城市建成环境对犯罪行为和居住安全感的影响. 地理学报, 2019, 74(2): 238-252.]
|
[44] |
|
[45] |
[王灿祥, 朱萌, 滕茹洁, 等. 功能区视角下城市夜光与夜间“两抢一盗”犯罪的空间相关性: 以H市市辖区为例. 热带地理, 2022, 42(10): 1739-1751.]
|
[46] |
|
[47] |
|
[48] |
|
[49] |
[徐冲, 柳林, 周素红, 等. DP半岛街头抢劫犯罪案件热点时空模式. 地理学报, 2013, 68(12): 1714-1723.]
|
[50] |
|
[51] |
[张延吉, 朱春武, 秦波. 犯罪数量与危害的空间分布及建成环境影响: 基于北京市刑事案件的纵向研究. 地理科学进展, 2019, 38(12): 1876-1889.]
|
[52] |
|
/
〈 |
|
〉 |