“模型与方法” 栏目所有文章列表

(按年度、期号倒序)

  • 一年内发表的文章
  • 两年内
  • 三年内
  • 全部

Please wait a minute...
  • 全选
    |
  • 模型与方法
    薛冰, 赵冰玉, 李京忠
    地理学报. 2023, 78(5): 1290-1303. https://doi.org/10.11821/dlxb202305014

    地理大数据实现对区域人地系统的精细刻画,为研究人地关系和区域发展等提供新的数据。当前,地理大数据进入了广泛应用,但一直缺乏对其质量的考察及相应的评估方法。兴趣点(POI)数据是地理大数据重要组成部分,对基于位置服务和区域场景理解具有重要作用。本文提出POI类大数据评估与提升方法,基于场地调研、GIS等方法从地物识别完整率、数据冗余率和空间位置准确率3个维度实现质量评估;基于数据生产过程发现和总结数据质量的可能影响因素,证明多源数据融合是提升POI数据质量的有效手段。研究发现,基于API接口获取的高德数据量略高于百度,空间位置准确率相当,冗余率较低;高德侧重识别地物入口,适于可达性等分析;百度侧重发现非标志性地物,适于空间规划等分析;发现、采集和处理阶段是降低数据质量的可能环节,受数据保护机制影响,数据质量与获取量及面积成反比;多源异构地理大数据质量评估、提升与融合是提升数据“涌现价值”、促进多学科交叉融通、解决新时代地理学问题的关键途径之一。

  • 模型与方法
    李玲玲, 刘劲松, 李智, 温佩璋, 李艳成, 刘艺
    地理学报. 2023, 78(5): 1304-1320. https://doi.org/10.11821/dlxb202305015

    随机森林模型是精准刻画区域人口分布规律和影响机制的主流研究方法。本文以石家庄为实验区,以综合禀赋分区为建模单元,在公顷网格粒度上分区开展分层采样,系统进行了递增式人口密度影响因子遴选实验,全流程(分区建模、分层采样、因子遴选、加权输出)优化了人口密度随机森林模型。研究表明:① 分区建模抑制了模型混淆人口分布法则问题;在栅格粒度上采样,不仅使训练样本数据质量摆脱了MAUP的困扰,而且在形式上尝试降低区群谬误的不良影响;分层采样确保了样本数据集中人口密度标签值的分布稳定性。② 利用人口密度随机森林模型,分区开展人口密度影响因子遴选实验,逐步提升了模型的拟合优度R2;距聚落距离是各区人口密度的主要影响因子;各区的人口分布影响机制存在显著差异,创新禀赋因子对城镇地区人口密度有较强影响,自然禀赋因子对乡村地区人口密度有较强影响。③ 对人口密度预测数据集进行优化组合,显著提高了模型的鲁棒性。④ 所获人口密度数据集具有多尺度叠加特征,大尺度上呈现出平原人口密度高于山区,小尺度上呈现出城镇人口密度高于乡村的“核心—边缘”特征。人口密度随机森林模型优化方案为揭示地方性人口分布规律和人口分布影响机制提供了统一的技术框架。