人口密度随机森林模型优化实验研究
李玲玲, 刘劲松, 李智, 温佩璋, 李艳成, 刘艺

Experimental study of population density using an optimized random forest model
LI Lingling, LIU Jinsong, LI Zhi, WEN Peizhang, LI Yancheng, LIU Yi
表1 主要数据集
Tab. 1 The main datasets
目标数据集 原始数据集 数据来源 处理方法
聚落人口密度
数据集
村人口数据集 石家庄市公安局 二元加权模型
村界数据集 第二次全国土地调查数据集
聚落数据集 第二次全国土地调查数据集
自然禀赋因子
数据集
DEM数据集 地理国情监测云平台1∶25万DEM数据 投影转换和重采样[42]
地形起伏度数据集 Focalmean函数[43]
坡度数据集 坡度函数[42]
年均气温数据集 1971—2000年
河北省及周边气象台站气象监测数据
Kriging插值[6]
年均降水数据集 Spline插值[44]
距河流距离数据集 2015年1∶100万全国基础地理数据库 欧氏距离
距自然河流距离数据集 欧氏距离
经济禀赋因子
数据集
距POIs距离数据集 2012年百度中国POIs数据集 欧氏距离[34]
距聚落距离数据集 聚落数据集 欧氏距离
创新禀赋因子
数据集
POIs核密度数据集 2012年百度中国POIs数据集 核密度[34]
聚落核密度数据集 聚落数据集 核密度
夜光影像数据集 2007年DMSP/OLS夜光影像数据集 重采样(像元大小为100 m)
分区训练样本 分区训练样本数据集 通过分层采样,每区获得10套训练样本数据集 分层采样