理论探索

人工智能时代的地理科学前沿问题探析

  • 李宇航 , 1, 2, 3 ,
  • 徐志伟 4 ,
  • 刘燕华 5 ,
  • 张玉虎 6 ,
  • 孙福宝 , 1, 5
展开
  • 1.中国科学院新疆生态与地理研究所,乌鲁木齐 830011
  • 2.中国科学院大学,北京 100049
  • 3.中国21世纪议程管理中心,北京 100038
  • 4.南京大学地理与海洋科学学院,南京 210023
  • 5.中国科学院地理科学与资源研究所,北京 100101
  • 6.首都师范大学资源环境与旅游学院,北京 100048
孙福宝(1979-), 男, 河北唐山人, 博士, 研究员, 研究方向为陆地表层水热格局与全球变化灾害风险研究等。E-mail:

李宇航(1989-), 男, 河南南阳人, 博士生, 副研究员, 研究方向为可持续发展与应对气候变化科技政策、科技创新服务等。E-mail:

收稿日期: 2024-07-15

  修回日期: 2024-09-21

  网络出版日期: 2024-10-25

基金资助

国家自然科学基金项目(42025104)

国家自然科学基金项目(42122001)

AI for geographical sciences: The frontiers

  • LI Yuhang , 1, 2, 3 ,
  • XU Zhiwei 4 ,
  • LIU Yanhua 5 ,
  • ZHANG Yuhu 6 ,
  • SUN Fubao , 1, 5
Expand
  • 1. Xinjiang Institute of Ecology and Geography, CAS, Urumqi 830011, China
  • 2. University of Chinese Academy of Sciences, Beijing 100049, China
  • 3. The Administrative Center for China's Agenda 21, Beijing 100038, China
  • 4. School of Geography and Ocean Science, Nanjing University, Nanjing 210023, China
  • 5. Institute of Geographic Sciences and Natural Resources Research, CAS, Beijing 100101, China
  • 6. College of Resource Environment and Tourism, Capital Normal University, Beijing 100048, China

Received date: 2024-07-15

  Revised date: 2024-09-21

  Online published: 2024-10-25

Supported by

National Natural Science Foundation of China(42025104)

National Natural Science Foundation of China(42122001)

摘要

随着科技的飞速发展,人工智能(AI)已经成为推动科学发展和社会进步的重要力量。在地理科学领域,AI技术的应用正逐渐深入,为地理大数据与时空信息的采集、分析和应用带来了革命性的变化,并在多个方面展现出广泛的创新与应用潜力。本文系统梳理了AI在地理科学领域中的发展与应用,详细介绍了机器学习、计算机视觉、自然语言处理、规划系统以及大模型等不同AI技术的发展脉络及其在地理学中的具体应用,分析了AI在地理学应用中面临的问题与挑战,并对“AI+地理科学”交叉研究的未来发展前景进行了展望。

本文引用格式

李宇航 , 徐志伟 , 刘燕华 , 张玉虎 , 孙福宝 . 人工智能时代的地理科学前沿问题探析[J]. 地理学报, 2024 , 79(10) : 2409 -2424 . DOI: 10.11821/dlxb202410001

Abstract

With the rapid advancement of science and technology, artificial intelligence (AI) has become a significant force driving scientific development and social progress. In the field of geographical sciences, the application of AI technology is deepening, bringing revolutionary changes to the collection, analysis, and application of big data and spatio-temporal information, and demonstrating innovative and application potential in multiple aspects. This paper systematically reviews the development and application of AI in geographical sciences, providing a detailed introduction to the development trajectories of various AI fields such as machine learning, computer vision, natural language processing, planning systems, and large AI models, as well as their applications in geography. It discusses the problems and challenges of AI applications in geography and provides an outlook on the future development of interdisciplinary research between AI and geographical sciences.

1 引言

人工智能(Artificial Intelligence, AI)被认为是第四次工业革命的推进器和加速器[1],在工业、医学、气象与水文预测[2-3]、测绘[4]、地质[5]等领域具有广阔应用前景。AI通常是指计算机系统模拟、扩展和延伸人类智能的技术,其本质是让计算机系统模拟人类智能过程,并且对外部信息进行记忆、学习、判断和推理[6]。在地理科学领域,这些外部信息通常是指通过各种途径获取的地理数据[4],包括来自地球卫星(遥感数据)、地面观测与实验系统(地形、水文、土壤等)、气候和生态观测站以及气候模式模拟在内的地理观测数据、实验数据和模拟数据。随着传感器数量及分辨率的提高、观测系统与实验方法的改进、数值模型的精细化,地理数据获取能力不断增强,数据量急剧增加。地理数据具备了大数据的“5V”的特征:数据量(Volume)大、速度(Velocity)快、真实性(Veracity)强、格式多样(Variety)以及价值(Value)高。但是如何有效地处理和分析多模态、多样化的数据,如何从海量的时空数据中提取出有价值的信息,获得新知识,成为地理学家面临的首要挑战之一[7]
近年来AI技术快速发展,并在大数据以及相关学科中得到广泛应用。大数据被认为是科学研究的第四支柱,也是AI发展的3个重要基础之一。大数据本身与AI就存在紧密的联系,正是基于大数据的积累,AI在技术发展方面取得了许多突破;另一方面,AI为大数据存储、处理、挖掘、分析预测等提供了新的解决办法,能够从中提取有价值的信息[8-9]。在地理科学领域,日益丰富的地理大数据也促使科学家寻求开发先进的计算和分析工具,这进一步促进了AI技术在该领域的发展和应用,并且产生了变革性的影响。利用AI技术对地理大数据进行挖掘和高效利用,可以达到对地理对象进行识别、区分、理解和模拟预测的目的[10-11]
1986年钱学森提出“地理科学”的概念,认为地理科学是一门研究地球表层特征、现象及其空间分布规律的学科,包括自然现象和人类活动的空间分布规律以及它们之间的相互作用过程。他认为地理科学是自然科学与社会科学之间的桥梁科学,其研究对象“地球表层”是一个复杂巨系统。因此,作为一个高度综合性的领域,地理科学研究的一些挑战性问题,包括评估和预测气候系统变化,探究地球表层景观与环境系统的变化规律,监测和模拟生态系统对气候变化的响应,理解自然环境和人类活动之间的相互作用规律等,需要利用跨学科的研究思路,利用观测、实验和模拟数据,构建多要素耦合的复杂系统模型来解决。同时,随着观测技术不断发展、信息技术不断更新,公开可获取的地理时空数据日益丰富,科学家能够使用前所未有的分辨率和规模数据来探索复杂的地理现象,推动了基于数据驱动的AI方法在地理科学中的发展和应用[12-13]。通过对地理大数据进行分析、挖掘、智能解译和可视化,AI技术可以揭示大数据中隐藏着的物理规律、模式和趋势[14],实现观测、数据和模型融合[15-16],解决地理科学研究中的复杂挑战性问题。目前AI在气象水文预报、时空数据挖掘、遥感影像处理、地理信息云计算、土地利用与城市规划等多个方面展现出强大的潜力和实际应用价值(图1),并且推动着地理科学在解决诸如应对气候变化、资源管理和环境可持续性等全球性问题方面发挥着越来越重要的作用。
图1 人工智能在地理科学领域的应用

Fig. 1 The application of artificial intelligence in the field of geographical sciences

为了更好地阐述AI技术在地理科学领域的发展、应用及其未来前景,本文通过对机器学习、计算机视觉、自然语言处理、规划系统以及大模型等不同AI技术在地理科学领域的发展与应用进行系统梳理,分析AI在地理科学应用中存在的问题与挑战,并对其未来发展重点进行展望。

2 人工智能在地理科学领域的发展与应用

数学家和计算机科学家阿兰·图灵被认为是第一次实现人工智能计算的先驱。在他开创性工作的基础上,研究者意识到图灵设计的基于开关的计算系统与哺乳动物神经元的操作之间具有相似性。正是这种跨学科的洞察力启发了麦卡洛克和皮特在1943年提出了一种人工神经元设计,并可能用于构建人工电子大脑。随后,“人工智能”这一术语在20世纪中叶被提出,描述能够执行类似于人类智能的任务机器,如规划、理解语言、识别物体和声音、学习和计算等[17]。这些早期关于人工智能任务或能力的设想,仍然是当前AI的主要研究范畴。
在人工智能发展早期,无论是软件还是硬件层面都存在实际的不足之处,因此经历了几次“寒冬”。直到20世纪末,卷积神经网络的出现使得AI领域的诸多困难得以解决,AI在应用层面开始兴起[18]。按照AI的研究领域划分,除了人们所熟知的机器学习之外,还包括专家系统、自然语言处理、计算机视觉、规划系统、大模型、机器人等,这些领域所取得的一些技术发展在地理科学中得到应用。事实上,地理科学领域最早应用AI技术的案例就包括利用专家系统[19]进行环境诊断[20]、遥感数据解译[21]、资源管理[22]以及数据管理等[23]。当前随着AI技术快速发展,计算机算力不断增强、算法迭代更新、数据愈加丰富,地理时空数据的采集、处理和分析逐步向智能化转变,相关的学术论文发表呈现井喷态势(图2)。以下分别就机器学习、计算机视觉技术、自然语言处理、规划系统以及大模型等方面介绍AI在地理科学中的发展与应用。
图2 2000—2023年美国地球物理联合会和欧洲地球科学联合会主办期刊上与机器学习相关的发文量

注:检索关键词包括“artificial intelligence”“machine learning”和“deep learning”;检索时段为2000—2023年。

Fig. 2 The number of publications related to artificial intelligence, machine learning and deep learning in journals hosted by the American Geophysical Union (AGU) and the European Geosciences Union (EGU), 2000-2023

2.1 机器学习在地理科学中的广泛应用

传统的地理学实证研究针对不同的地理现象进行数据采集和分析,其过程和结果具有高度指示性,数据与现象之间的关系直接且紧密。进入大数据时代后,以刻画地理现象与地理要素的时空联系为目的,从海量、高维、多样的大数据中挖掘提炼有效的信息,凝练机制、解释现象,逐渐形成地理大数据研究范式[24],AI能够帮助研究者从高维大数据中获取更多具有可解释性的信息[25]。机器学习(Machine Learning, ML)是近20年来最受关注的AI活跃领域之一,在地理科学中的应用逐年攀升(图2),尤其在地理时空数据挖掘方面。ML可以分为监督学习、非监督学习,强化学习,还包括半监督学习、主动学习等[26]。虽然大多数研究采用监督或无监督的方法,它们都需要一组代表性数据(在理想情况下总体无偏的代表性子集),用于训练算法以识别其中子组之间的规律性和差异性。由于ML算法复杂、变量数量多,训练数据集的规模通常很大。ML得益于人工神经网络的快速发展,进而出现了更多规模庞大、门类多样的方法,如感知机、决策树、支持向量机等监督学习方法以及奇异值分解、马尔科夫链蒙特卡洛方法等无监督学习方法。近年来,还有使用深层神经网络模型的深度学习方法。深度学习不仅在传统ML擅长处理的领域内显现出更高的准确度和更强的泛化性,还在非结构化数据的处理分析以及多模态任务中展现了强大的性能和应用潜力。
对数据进行分类、聚类以及回归是地理科学中常见的分析手段,而能够抽象为分类、聚类以及回归的地理问题得到了ML的赋能。虽然每种ML方法在模型、策略等方面不尽相同,在有足够数据的情况下,可以适应不同的应用场景,性能水平得到了极大提升。例如,在土地利用变化的研究中需要基于影像数据对土地类型进行分类,一些经典算法如随机森林、支持向量机、随机梯度下降等在该领域得到了大量应用。除了通过构建分类模型对地物进行分类识别和变化监测外,ML还被用于量化影响地表要素的复杂地理环境条件,进而对其气候变化的响应与适应等方面做预测[27]
基于高精度遥感图像对植被、作物类型等进行识别,并结合回归模型进行植被盖度变化、作物产量变化的预测,是ML在地理科学方面的典型应用之一。例如,Jin等利用随机森林模型,结合Sentinel-1雷达与Sentinel-2光学影像数据,不仅成功创建了肯尼亚和坦桑尼亚小规模农户玉米种植区域及产量的10 m分辨率的全覆盖地图,还估算了当地玉米产量[28]。对于缺乏标签的情况,Wang等以美国中西部作物类型为研究对象,验证了随机森林模型和高斯混合模型等方法在缺乏地面标签的地区具有进行田间分辨率作物类型映射的可行性[29]。ML算法在生态系统群落和生物量变化研究中也得到了应用。例如,Liu等考虑包括物化、水文和气象在内的多源要素,预测了挪威最大湖泊Mjosa湖中13个主要类群组成的藻类群落结构变化,揭示了ML在预测复杂藻类群落结构方面的强大能力[30]。而结合小波变换和长短期记忆模型构建的混合深度学习方法,能够实现在不同时间尺度上(小时、日、月)极端水华事件的预测[31]
ML方法在地球表层系统关键要素的估算、空间降尺度以及地理制图等方面也发挥了重要作用。例如,Wu等利用随机森林模型开展了中国地表水稳定同位素空间分布的制图[32]。Alemohammad等开发了一种基于人工神经网络的总初级生产力计算方法,并在感热和潜热通量估算方面有较好的应用潜力[33]。研究者将传统物理模型与ML方法相结合,可以发挥出更优秀的性能。例如,Yang等利用长短期记忆模型改进了全球水文模型,显著提升了模型对洪水的模拟性能,提高了洪水风险评估的稳健性和可靠性[34]。Teng等结合长短期记忆模型和卷积神经网络等,提高了对大气PM2.5浓度的预测准确性,这对于城市可持续发展和人类健康保护具有重要意义[35-36]

2.2 计算机视觉在遥感影像处理中的应用

人类拥有发达的视觉系统,计算机视觉(Computer Vision, CV)即模拟人类视觉,是AI领域中极具吸引力的方向之一,也是较早应用在地理科学中的AI技术。CV将计算机与图像相关的信息进行交互,赋予机器理解图像信息并做出决策的能力。CV源于20世纪60年代对图像处理的研究,最初的算法设计旨在定位边界并确定二维场景中的物体形态,但很快就扩展到通过阴影、纹理和焦点提供的线索推断三维结构。之后,随着束调整理论[37-38]、摄影测量学[39-40]和图分割优化[41-42]等方法的引入,CV在快速三维场景重建方面得到了极大的发展。
自1957年苏联发射人类第一颗人造地球卫星,遥感对地观测技术进入了现代化的新阶段,为空间大尺度的地理科学研究提供了有力支持。遥感对地观测综合技术的发展依赖于平台、传感器和影像处理技术。前两者属于硬件范畴,而影像处理需要将获取的综合信息进行校正,并准确高效识别提取特定信息,这是遥感地理学研究的重要内容。与其他图像数据相比,遥感数据具有独特的空间和时间尺度,观测目标时空变化尺度大、光谱通道多、数据标签稀疏且存在偏差,使得遥感图像成为一种独特的数据模态[43]
当代最先进的CV技术已经在遥感图像处理中得到了广泛的应用。尤其是近年来随着基于图像的深度学习子系统的发展,CV取得了实质性的进步,实现了从高分辨率遥感图像等非结构化数据中识别提取大范围精细尺度的地物信息,能够完成目标对象分类、地物变化检测、地表系统关键参数反演等任务。例如,Yang等为解决地理空间语义分割中簇内高差异性问题,提出了一个新的组织结构,使得簇间差异性显著增加,簇内差异性显著减小,优化了分类效率[44]。Sun等提出一种基于深度多任务学习的框架,在细粒度建筑物变化检测中具备更大的潜力和有效性[45]。Hu等基于CV及ML的超参数和全局自适应检索方法,对河流悬浮泥沙浓度反演方法进行了优化,有望为河道表面悬浮泥沙浓度的长期和大规模监测提供技术支持[46]。Brandt等利用次米级分辨率的卫星影像和卷积神经网络等深度学习方法,在非洲撒哈拉、萨赫勒等地区成功识别、检测到超过18亿棵树木个体,这对于理解干旱区生态系统及其对气候变化、人类活动的响应与适应具有重要价值[47]。Wang等利用CV及深度学习方法开发了一个基于无监督领域自适应的深度适配作物分类网络,在美国和中国东北的实验区取得了较高的分类准确度[48]
AI技术发展使得遥感图像在此前难以应用的领域得到了显著发展,研究者能够获得更高维度的地物信息表征。例如,Jean等通过结合预训练在ImageNet上的卷积神经网络模型和迁移学习方法,以非洲5个国家作为研究区训练了深度学习模型,并结合高分辨率卫星图像特征解释了研究区内75%的经济发展变化,进而预测了家庭尺度消费支出和资产财富,为发展中国家追踪和定位贫困问题提供了新方法[49]。Toker等基于每日多光谱图像数据集,结合语义变化分割及半监督学习方法,能够对森林砍伐进行高分辨率跟踪,在评估土地覆盖变化的生态环境影响等研究中具有重要应用价值[50]

2.3 自然语言处理与地理数据库建设

自然语言处理(Natural Language Processing, NLP)主要是指使用自然口头或书面语言进行交互的理论和应用,近年来与大模型(Foundation Model, FM)一同发展迅猛。图灵将NLP视为AI的主要目标[51],表现为他的“模拟游戏”——后来被称为“图灵测试”——用于评判任何机器展示智能行为的程度。NLP系统通过分析大量文档学习规则,并能够结合上下文信息以概率方式应用这些规则。现代NLP系统非常复杂,性能和发展水平不断提高。例如,ChatGPT便是一种基于深度学习(Transformer架构)的NLP模型,它基于海量文本数据进行大规模训练,使其能够学习自然语言的结构、语法规则和语义信息,进而可以识别和理解输入文本的语义和语境,并生成具有连贯性和语法正确性的自然语言响应。大语言模型能够理解并生成自然语言,与知识图谱相融合,极大促进了对领域内文本数据的深度挖掘和知识提取。对于地理学而言,模型通过预训练地理信息与自然语言之间的联系,可以快速准确地处理与地理相关的自然语言查询。因此,地理大语言模型在兴趣点(Point of Interest, POI)检索和地理编码、逆编码等地图学问题上具有一定优势,在地理知识的智能应用等方面有发展前景。
NLP在地理信息系统中的应用主要集中在3个领域:人机交互、地理解析和地理编码以及基于位置的服务。借助NLP技术提高地理数据检索的灵活性和准确性,可以改善用户与GIS的交互方式,使他们能够更直观、有效地利用地理信息[52]。在系统分类学和生物多样性研究中,利用NLP和ML算法可以从科学文献中自动识别和提取包括生物名称、形态特征描述等方面的信息,以支持生物多样性研究的数据驱动发现[53]。许多研究者结合知识图谱开发地理科学领域的基础语言模型[54],并以此理解和处理地理空间任务。
通过构建统一的模型来整合和共享地理科学领域内的知识,可以充分发挥NLP技术与知识图谱在数据整合、信息检索、知识发现、数据共享、术语标准化以及可视化等方面的优势[55-56]。例如,Curry等基于XML标记语言,开发了能够从分类描述中自动提取生物多样性数据的系统[57]。PaleoDeepDive项目[58]从英文、德文和中文的古生物学文献中提取化石出现数据,并研发NLP工具将化石名称、地层时代等变量聚合成有意义的组合。该项目通过从4万多个出版物中手动提取信息,开发了包含超过30万个分类学名称和120万个分类学出现的Paleobiology数据库,用于训练PaleoDeepDive系统。美国国家科学基金资助了ClearEarth项目,旨在将NLP和地学研究相结合,通过从各种来源提取和整合数据,以支持地理学、地质学和生态学等领域的研究。ClearEarth代表了一种将成熟和经过验证的NLP技术应用到地学领域的尝试。2016年以来ClearEarth一直致力于对地球科学文本来源进行专家指导的标记,以用于训练模型系统,并且已发布了海冰和地震事件的标注指南。Zhang等开发了GeoGPT框架,利用大语言模型的语义理解能力,并结合地理信息系统中成熟的工具,以自动化的方式执行地理空间数据收集、处理和分析任务[56]。GeoGPT能够理解自然语言指令,思考、规划并顺序执行定义好的GIS工具,最终输出有效结果。该框架提高了GIS专业人员开发工作流程的效率,能够适应各种地理空间任务[56]

2.4 规划系统与地理决策支持

在现实世界中,为实现特定目标,人类活动必须按特定顺序执行。受到时间与空间的约束,在明确的单一目标下,规划最佳方案相对容易;但当约束条件增多,需要进行多目标优化时,规划最佳方案变得非常复杂。目前一些通用策略被用来解决规划问题,这些策略用于地理科学中的多类问题,例如物流管理、空间布局、资源配置等。规划系统通过网络以及约束优化[59-60]或模拟退火算法[61]等来确定最优路径,进而提供地理决策服务。例如,基于马尔可夫决策过程,可以规划具有不完全可观察特征的路线[62-64],提供可以嵌入到不同规划场景中的解决方案。
城市与空间规划是地理科学领域的重要研究内容,也是提升生活质量和社会生产效率的重要环节。Zheng等提出了一个基于深度强化学习的城市社会空间规划模型。该模型通过构建图神经网络来描述城市功能拓扑结构,再转化为顺序决策问题,能够根据不同情况和需求生成空间规划方案[65]。Santi在Zheng等的基础上提出了一个基于强化学习的框架,将空间规划问题转化为动态城市邻接图上的马尔可夫决策过程。结果表明集成的人工智能辅助空间规划不仅提高了效率,还可以将城市规划者从繁重的计算任务中解放出来,使他们能够专注于更具概念性和全面的评估任务[66]
道路交通规划问题是现代城市面临的重要挑战之一,其涉及地理学、拓扑学、运筹学等多个领域。从时空尺度对道路网规划进行评估和优化是应对此挑战的重要抓手。Schultz等利用深度学习模型校准交通模拟器,解决旅行者在网络中的最佳调度问题,发现深度强化学习在动态交通系统的优化问题上表现出色,提高了交通系统的整体效率[67]。Thottolil等提出了一个RidgeGAN混合模型,结合了无监督的对抗神经网络和有监督的核岭回归方法,用于预测评估印度中小城市的城市交通指数。结果表明RidgeGAN模型能够有效地预测不同人类定居模式的网络密度,并高效地生成空间规划[68],从而有助于决策者制定更宜居和可持续的城市发展策略[69]

2.5 大模型与气候预测

应对气候变化是当今国际社会公认的全人类共同面对的重要议题。20世纪70年代发展起来的地球系统模式是研究气候变化以及陆面响应的重要工具。近年来AI与地球系统模式相结合,在气象、水文等领域的应用也逐渐成熟[70]。例如,Zhu等利用深度学习集成网络模型,实现了北极地区季节性海冰的预测,为理解海冰与大气因素之间复杂的相互作用提供了新方法[71]。Fu等开发了一个WindNet深度学习模型,并结合区域耦合的海洋—大气—波浪模型,揭示了大气和波浪参数与海面粗糙度之间的复杂非线性关系,显著提高了西北太平洋地区海面风场及极端海浪预报的准确性[72-74]。Sun等利用一种基于深度学习的偏差校正方法,改进了西北太平洋地区数值波浪模型,显著提升了海面显著波高的预报性能[74]。通过AI与物理模型相结合的技术框架,Sun等将深度学习方法用于改善全球预报系统在中国东南部冬季降水预报的性能[75]。Shao等利用卷积神经网络,对基于卫星的地表太阳辐射数据集(ISCCP-ITP)进行优化,有效消除了数据的不均匀性,提高了数据集的准确性和稳定性[76]
随着2017年Transformer结构的出现,大模型得到了快速发展[77-78]。大模型具有自监督学习的特点,显著减少了数据标注带来的高成本、长周期、准确度存疑等问题。目前许多大模型的规模不断增大,参数已经来到了前所未有的亿级乃至万亿级。国内外的科技巨头与研究团队纷纷推出了各自的气象大模型,如微软和华盛顿大学联合开发的DLWP模型[79]、Nvidia公司开发的FourCastNet大模型[80]、谷歌推出的MetNet-3和GraphCast[2,81]、华为开发的盘古大模型[82]、清华大学与中国气象局联合开发的NowcastNet[83]、复旦大学开发的伏羲大模型[84]等。与传统的数值预报模式不同,AI气象大模型基于深度学习方法,根据历史数据进行学习、建模并做出预测。与需要使用超级计算机求解的数值模式不同,训练完成的大模型甚至可以部署在本地个人计算机中运行,数分钟乃至数秒内就能完成对未来中短期天气的预报。这些模型虽然依赖于传统物理模型生成的数据,并且存在诸如多源观测资料难以泛化、数据同化效果难以检验等问题,但是随着气象大模型已经在欧洲中期天气预报中心等部门参与实现了业务运行,AI技术在气象与水文预测等领域的潜力已经彰显无遗。

3 人工智能在地理科学领域面临的问题和挑战

3.1 地理数据集和数据质量

目前AI被广泛应用于地理科学研究中,但是仍然面临一些质疑和挑战,包括基准训练数据集的构建、模型算法的泛化、迁移和可解释性等问题。基准训练数据被用于估计模型参数,是AI模型的基石。因此,生成和发布可供研究人员使用的基准训练数据集是加速AI在地理科学领域应用和创新的关键。当前可用训练数据的短缺是限制AI在地理科学领域中应用发展的主要瓶颈。地理数据的获取和处理仍存在一定的难度和复杂性,数据量和数据质量有待提高。而生成新的训练数据集是一个困难且漫长的过程,并且需要大量财力支持。例如,ML模型算法需要使用带有标签的数据集对算法进行训练,这些数据集包含已经用目标参数标记的样本数据。然而,能够直接应用到模型算法中,与地理观测相适应的基准训练数据集仍然缺乏。除了缺少跨学科的、公开可用的基准训练数据集外,不同来源的数据具有不同的类型和格式,它们之间缺少互操作性[85]。例如,通常获取的地理数据格式可能与ML或CV模型算法的标准数据格式不同。此外,地理测量数据本身也可能不具有结构化,往往不能轻易适应AI模型算法中常用的网格系统。
因此,虽然地理学家在过去长期的研究中积累了大量数据,但如何有效地整合、清理、更新和共享数据,并生成高质量的地理数据集,成为一个挑战。地理大数据可能还存在数据冗余、数据类型复杂、存储空间不足、统计错误、反馈信息慢等许多问题[86-87]。如何将这些原始数据转化为有效信息产品,探索开发先进的计算和分析工具,以提取人地系统中有意义的见解和知识,是需要加强的领域,并将推动AI时代的地理科学发展。

3.2 地理大数据的管理与共享

地理大数据促进了我们深入全面地理解复杂、相互关联和动态的地球表层系统[12]。地理大数据与ML模型相结合,能够更准确地量化陆地水循环的储量和通量,使得我们对地表水的认识更加准确和完整[88]。地球系统模式的时空分辨率不断提高,生产了大量的气候系统模拟数据[89],为理解气候系统动力学过程、极端天气和能源潜力等提供了依据[90-91]。在海洋学中,Argo浮标、水面和水下无人车(机)以及海洋观测站等,为理解海洋的三维特性提供了大量实时观测数据,提升了海洋模型的模拟预测能力[92-93]
然而,与此同时,不断增长的大数据规模给科学研究的可复制性、可重现性以及数据共享和管理带来了挑战[12]。首先,研究者需要从大数据中构建全面、准确的训练数据集,并进行管理和共享。其次,研究者还需要发展适用于各种地理空间数据的目录编制方法,并研究存储非栅格数据的目录标准,以便于发现和检索。研究者还需要开发类似的目录标准来存储AI模型,从而方便不同研究者之间的模型共享。因此,遵循FAIR(可找到、可访问、可互操作、可重复使用)的数据管理原则,对训练数据和模型进行目录编制并开放共享,可以使不同的研究人员能够追踪和复制他人的工作,是十分重要的。除了发表论文本身外,研究人员需要额外投入时间来生产和管理数据集。科学界也需要关注并支持这些数据生成和维护工作,尤其是那些能够解决多学科、跨学科问题的高质量数据集具有重要价值,需要额外关注。例如,美国航空航天局(NASA)专门设立项目用来支持开放共享数据集的生产,来开发基准模型。这些生成的训练数据集、模型和源代码将对学界和公众开放共享,这能够极大促进相关领域的发展。

3.3 机器学习模型算法的泛化和可解释性

在传统的物理学、地理学等研究中,研究人员基于对物理世界及其规律的客观理解,采用“自上而下”的方法建立模型,这种方法使我们能够对模型结果进行合理解释。然而,ML模型“自底向上”的学习方法与根植于物理定律的“自上而下”方法有本质的不同。传统的ML模型是从数据中学习模式,并不包含物理定律,它们通常无法在训练数据集学习到的参数范围之外进行外推,这成为ML模型应用的一个挑战。例如,由于极端天气事件和气候变化的影响在历史观测数据中很少或从未见过,ML模型通常很难提供涉及这类事件或影响的准确预测。
因此,基于物理的建模与ML模型相结合,将物理定律纳入模型架构中,以构建和扩展更具解释性的ML模型,是目前研究中存在的挑战。最新的研究表明,ML模型可以与物理约束相结合,以弥合数据驱动方法和物理建模之间的差距,并增强模型的可解释性[94-95]。近年来研究者通过将物理约束嵌入到ML模型的架构或损失函数中进行训练,提高了模型的自身准确性,在植被动态建模、估算大气对流和海表温度等多方面显示出良好的效果。

4 “AI+地理科学”的前沿热点和展望

地理科学研究正迅速且广泛地结合AI技术,以优化乃至解决传统方法难以应对的复杂问题。arXiv是目前国际上权威的开放预印本平台,近年来已经成了预印论文发布的重要平台,在数理科学和计算机科学的前沿领域,几乎在期刊正式发表的重要论文都在arXiv上有存档。因此,透过此平台可以简析目前相关领域的前沿研究热点。本文分析了arXiv上与地理学相关的3万余篇论文,展示了论文摘要中出现的热点术语(图3)。越来越多的地理科学研究正在与计算机科学前沿相融合,尤其是在遥感、气候变化等传统领域。通过结合以机器学习、计算机视觉等为代表的AI技术,地理科学在多尺度和多源观测数据的校正[72,76,96]、同化[97-99]、已知地球物理过程的特征提取[100]、未知过程的发现与计算效率的优化[56,101]、地理环境参数的观测与模拟[73]、气候模态的预测[102]等多个领域取得创新发展。
图3 arXiv开放预印平台上与地理学相关的论文热门词云注:数据来源为 https://www.kaggle.com/datasets/Cornell-University/arxiv,数据时段为2007—2024年7月10日。

Fig. 3 Hot words of geographies-related papers in arXiv

4.1 AI与物理模型的耦合及其在地理科学中的应用

在地理科学领域,传统模型基于物理定律和数学方程,将人地系统中的研究对象抽象为物理过程。因此,构建的传统模型高度依赖于模型参数和初始条件等以及先验知识的准确性。这类模型易于理解和解释,适用于有明确物理过程的问题。而AI是由数据驱动的路径,依赖于大量的训练数据,需要通过大数据来学习问题的内在规律。AI模型的决策过程往往是黑箱的,解释模型行为的物理意义比较困难。因此,AI模型更适用于数据量大、特征复杂、难以用传统模型描述的问题。
随着技术的发展,AI与物理模型的耦合使用将成为地理科学未来研究的趋势。AI与传统模型模拟方法的结合,能够充分利用两者的优势——AI模型的泛化能力和数值模型的物理约束,有望为解决复杂的地理问题提供新的可能性[94]。例如,物理信息神经网络(PINNs)是一种结合了物理过程的深度学习模型,通过在损失函数中构造物理信息误差项,对网络预测的结果是否满足物理定律进行考量,从而确保物理一致性,在2019年被提出后便迅速在多个领域得到应用[103]。例如,PINNs在处理瞬态地下水流动问题时,不仅提供了可靠的潜水面和压力水头时空分布的估计,还解决了传统方法在复杂物理界面或几何形状处理上的局限[104],能够以高精度再现水分含量和孔隙水盐度的时空分布,并重建二维水分流动和溶质运输过程[105]。PINNs在土壤水分动态预测方面也显示出其优势,能够仅使用体积含水量数据来估计土壤水力特性,克服了传统模型在模拟田间尺度土壤水分动态时的局限性[106]。这些研究中,通过基于微分方程描述的物理过程信息的引入,提高了AI模型的可解释性,进而得到物理意义更明确的结果。

4.2 AI与复杂系统理论的结合来解决地表系统复杂问题

复杂性是新时代地理科学的新特征,深刻影响着地理科学的发展与走向[107]。复杂系统,如人地系统、气候系统、生物网络等,系统的输出与输入之间不是简单的线性关系,系统动态往往表现出非线性特征。复杂系统具有动态演化和多尺度交互等特征,较难用传统方法来分析和预测。AI尤其是深度学习模型,提供了一种强大的工具来理解复杂系统的行为和特征。例如,利用以深度学习为代表的人工智能技术在预测厄尔尼诺-南方涛动等方面取得了许多成果[108-110],证明了其在气候复杂系统中的可用性。不过,由于神经网络节点及链接通常不具有物理意义,复杂系统理论中的气候网络分析和神经网络需要有效结合起来:神经网络能够发现、处理复杂系统中的非线性关系、高维数据和动态变化,气候网络则提供物理解释,二者的结合将成为气候系统预测的有力工具[111]
人地系统是一个典型的复杂系统。目前越来越多的人类活动数据可以公开获取,为理解人与自然之间的交互作用提供了基础数据支撑。基于复杂系统理论,结合ML方法,可以从数据中捕捉人与自然的交互作用特征,进而理解系统中各个要素的相互作用机制和整体行为,并预测系统的未来状态[112]。基于AI、地理大数据和复杂系统理论,探索新的研究范式,有望对传统人地系统研究中的复杂问题进行深度挖掘[24,107]。这不仅可以加深对原有问题的理解,也能够帮助研究者从自然现象与人地关系中发现新的科学问题。

4.3 数字孪生及其在虚拟地理环境中的应用

基于AI和地理大数据的另一个快速发展的领域是数字孪生地球,或称地球的数字孪生体(Digital Twins of Earth)[113]。数字孪生地球旨在建立地球系统的高度精确的数字表示。但与谷歌地球(Google Earth)一类强调突出地表景观的技术产品不同,数字孪生地球将不仅可以对地球系统随时间变化进行连续、准确地刻画,还可以利用AI以及先进的模型和分析手段,结合基于场景的分析工具,来模拟预测地表各要素的响应特征[114]。数字孪生包括数据管理、人工智能、数值模型、行动预测多个方面。数字孪生的准确性高度依赖于其数据的质量、模型的精度以及对子系统之间精确关系的刻画。AI在数字孪生地球架构中发挥着至关重要的作用,能够使得数字孪生体具备识别、分析相关数据并进行模拟预测的能力。
利用数字孪生技术可以为构建虚拟地理环境提供强大的支持,改善我们对地球系统的理解,从而应对气候变化、开展防灾减灾等,服务于可持续发展需求。构建虚拟地理环境不仅可以帮助理解人地系统的当前状况,还能够自动分析地表环境的变化并自主获取新数据以改善其预测和预报,进而更好地评估潜在的社会经济和健康影响,提供决策支持。目前国际上对地球数字孪生的开发工作正在紧张进行中。NASA JPL领导的综合数字地球分析系统(IDEAS)项目团队正在设计可重复使用的地球系统数字孪生框架。法国国家航天中心领导的气候观测空间计划项目团队正在建立一个数字地球,用来帮助预测和分析法国的洪水事件。欧洲航天局正在联合欧洲中期天气预报中心、欧洲气象卫星组织共同设计开发地球数字孪生体Destination Earth,以应对气候变化和可持续发展等挑战。

5 结语

回顾20世纪发生的地理学计量革命,基于逻辑却流于描述的传统地理学在当时饱受质疑,并且出现了以1948年哈佛大学取缔地理系等为代表的标志性事件。为了地理学学科的生存与发展,地理学家们纷纷投入地理学计量化的理论革命中。不过,由于地理现象的非欧几何特性、复杂非线性过程属性等原因,导致当时一些传统的数学工具方法在地理学研究中并不适用,随着新方法的不断发展和引入,地理学才重新焕发生机。
目前AI已经成为推动科学发展和社会进步的重要力量。在地理科学领域,AI技术的应用正逐渐深入,为地理信息的采集、分析和应用带来了革命性的变化,并在多个方面展现出创新和应用潜力。不过需要注意的是,学术界对AI在科学研究以及应用前景也存在一些争议声音,甚至受到地缘政治因素的影响。例如,最近国内GeoGPT展现出快速发展态势,在国际上却引起了欧洲地球科学联合会等的警惕[115]。尽管如此,像GeoGPT这样与地学深入融合的AI模型的发展愈加重要。2024年6月NASA宣布了将与IBM共同开发地球科学大语言模型INDUS。我们应该认识到,AI作为新时代的工具,能够助力地理学研究者利用更海量的数据、识别更深层的机理、分析更复杂的问题。
在当今时代背景下,学科的交叉带来的影响是巨大的。对地理科学而言,方法技术的发展往往领先于研究范式的发展,在这种情况下,突破传统思维,积极拥抱AI等新工具,就显得尤为重要。机器学习、计算机视觉、自然语言处理、规划系统、大模型等AI技术在地理科学中已经展现出强大的应用潜力,但是在地理训练数据集的建设、管理和共享、数据质量和规范性、模型算法的泛化和可解释性等方面也存在可以改进和提升的空间。未来通过加强AI与物理模型的耦合,深化AI与复杂系统理论的结合,完善AI与地理大数据应用的研究范式,势必能够提高地理大数据的挖掘能力,增强地理模拟与计算能力,加强地理新规律的发现能力,从而推动新时代地理科学的发展。
随着技术的进步和社会需求的增长,AI技术的应用将更加广泛和深入,我们也需要关注AI应用中可能出现的技术以及伦理问题,确保其健康、可持续地发展。此外,需要加强地理科学专业学生的培训,以赋予他们利用面对即将到来的AI革命所需的技能。伴随AI技术的发展与地理大数据研究范式的完善,以数据作为驱动的地理科学研究将得到极大的发展,地理学研究者可以利用更多的技术手段,为生态文明建设、“双碳”目标实现、气候变化应对等目标不断做出新贡献。

感谢李正阳同学在文献收集整理和图件绘制中的帮助。

[1]
Klaus S. The Fourth Industrial Revolution. Li Jing, trans trans. Beijing: Citic Press Corporation, 2016.

[克劳斯·施瓦布. 第四次工业革命. 李菁, 译. 北京: 中信出版集团股份有限公司, 2016.]

[2]
Andrychowicz M, Espeholt L, Li D, et al. Deep learning for day forecasts from sparse observations. arXiv Preprint arXiv, 2023: 230606079.

[3]
Sun F B, Roderick M L, Farquhar G D. Rainfall statistics, stationarity, and climate change. PNAS, 2018, 115(10): 2305-2310.

DOI PMID

[4]
Gong Jianya. Chances and challenges for development of surveying and remote sensing in the age of artificial intelligence. Geomatics and Information Science of Wuhan University, 2018, 43(12): 1788-1796.

[龚健雅. 人工智能时代测绘遥感技术的发展机遇与挑战. 武汉大学学报(信息科学版), 2018, 43(12): 1788-1796.]

[5]
Li Canfeng, Liu Da, Zhou Dekun, et al. Application and prospect of artificial intelligence in the field of geology. Bulletin of Mineralogy, Petrology and Geochemistry, 2022, 41(3): 668-677.

[李灿锋, 刘达, 周德坤, 等. 人工智能在地质领域的应用与展望. 矿物岩石地球化学通报, 2022, 41(3): 668-677.]

[6]
Xu Y J, Liu X, Cao X, et al. Artificial intelligence: A powerful paradigm for scientific research. The Innovation, 2021, 2(4): 100179. DOI: 10.1016/j.xinn.2021.100179.

[7]
Di Mingguo. Big data will change geology: Big data mining and machine learning for earth science. Bulletin of Mineralogy, Petrology and Geochemistry, 2018, 37(6): 1.

[翟明国. 大数据定将改变地质: 向读者推荐《地球科学大数据挖掘与机器学习》. 矿物岩石地球化学通报, 2018, 37(6): 1.]

[8]
Hinton G E, Salakhutdinov R R. Reducing the dimensionality of data with neural networks. Science, 2006, 313(5786): 504-507.

DOI PMID

[9]
Leary D E O. Artificial intelligence and big data. IEEE Intelligent Systems, 2013, 28(2): 96-99.

[10]
Zhang Bing, Yang Xiaomei, Gao Lianru, et al. Geo-cognitive models and methods for intelligent interpretation of remotely sensed big data. Acta Geodaetica et Cartographica Sinica, 2022, 51(7): 1398-1415.

DOI

[张兵, 杨晓梅, 高连如, 等. 遥感大数据智能解译的地理学认知模型与方法. 测绘学报, 2022, 51(7): 1398-1415.]

DOI

[11]
Janowicz K, Gao S, Mckenzie G, et al. GeoAI: Spatially explicit artificial intelligence techniques for geographic knowledge discovery and beyond. International Journal of Geographical Information Science, 2020, 34(4): 625-636.

[12]
Karpatne A, Ebert-Uphoff I, Ravela S, et al. Machine learning for the geosciences: Challenges and opportunities. IEEE Transactions on Knowledge and Data Engineering, 2019, 31(8): 1544-1554.

[13]
Vance T C, Huang T, Butler K A. Big data in earth science: Emerging practice and promise. Science, 2024, 383(6688): eadh9607. DOI: 10.1126/science.adh9607.

[14]
Wu Shaohong, Gao Jiangbo, Dai Erfu, et al. Research on dynamic of terrestrial system of China: Academic logic and synthetic scheme. Advances in Earth Science, 2017, 32(6): 569-576.

DOI

[吴绍洪, 高江波, 戴尔阜, 等. 中国陆地表层自然地域系统动态研究: 思路与方案. 地球科学进展, 2017, 32(6): 569-576.]

DOI

[15]
Chen Fahu, Wu Shaohong, Liu Hongyan, et al. Disciplinary structure and development strategy of physical geography in China. Acta Geographica Sinica, 2021, 76(9): 2074-2082.

DOI

[陈发虎, 吴绍洪, 刘鸿雁, 等. 自然地理学学科体系与发展战略要点. 地理学报, 2021, 76(9): 2074-2082.]

DOI

[16]
Liu Changming, Zheng Du, Cui Peng, et al. Innovative development and prospect of physical geography. Acta Geographica Sinica, 2020, 75(12): 2547-2569.

DOI

[刘昌明, 郑度, 崔鹏, 等. 自然地理学创新发展与展望. 地理学报, 2020, 75(12): 2547-2569.]

DOI

[17]
Mccorduck P. Machines Who Think:A Personal Inquiry into the History and Prospects of Artificial Intelligence. New York: CRC Press, 1979.

[18]
Lecun Y, Bottou L, Bengio Y, et al. Gradient-based learning applied to document recognition. Proceedings of the IEEE, 1998, 86(11): 2278-2324.

[19]
Bouillé F. Architecture of a geographic structured expert system. International Seminar on Spatial Data Handling, 1984.

[20]
Couclelis H. Artificial intelligence in geography: Conjectures on the shape of things to come. The Professional Geographer, 1986, 38(1): 1-11.

[21]
Bajcsy R, Tavakoli M. A computer recognition of bridges, islands, rivers and lakes from satellite pictures. Laboratory for Applications of Remote Sensing, 1973(2): 54-68.

[22]
Davis J R, Nanninga P M. Geomycin: Towards a geographic expert system for resource management. Journal of Environmental Management, 1985, 21: 377-390.

[23]
Smith T R, Clark W A V, Cotton J W. Deriving and testing production system models of sequential decision-making behavior. Geographical Analysis, 1984, 16(3): 191-222.

[24]
Song Changqing. On paradigms of geographical research. Progress in Geography, 2016, 35(1): 1-3.

DOI

[宋长青. 地理学研究范式的思考. 地理科学进展, 2016, 35(1): 1-3.]

DOI

[25]
Yang Zhenshan, Long Ying, Douay N. Opportunities and limitations of big data applications to human and economic geography: The state of the art. Progress in Geography, 2015, 34(4): 410-417.

DOI

[杨振山, 龙瀛, Nicolas Douay. 大数据对人文—经济地理学研究的促进与局限. 地理科学进展, 2015, 34(4): 410-417.]

DOI

[26]
Li Hang. Statistical Learning Methods. Beijing: Tsinghua University Publishing House, 2019.

[李航. 统计学习方法. 北京: 清华大学出版社, 2019.]

[27]
Zhang H C, Li S H, Mason J A, et al. Biogeomorphological niche of a landform: Machine learning approaches reveal controls on the geographical distribution of nitraria tangutorum nebkhas. Earth Surface Processes and Landforms, 2024, 49(5): 1515-1529.

[28]
Jin Z N, Azzari G, You C, et al. Smallholder maize area and yield mapping at national scales with Google Earth Engine. Remote Sensing of Environment, 2019, 228: 115-128.

[29]
Wang S, Azzari G, Lobell D B. Crop type mapping without field-level labels: Random forest transfer and unsupervised clustering techniques. Remote Sensing of Environment, 2019, 222: 303-317.

[30]
Liu M Y, Huang Y Z, Hu J, et al. Algal community structure prediction by machine learning. Environmental Science and Ecotechnology, 2023, 14: 100233. DOI: 10.1016/j.ese.2022.100233.

[31]
Liu M Y, He J Y, Huang Y Z, et al. Algal bloom forecasting with time-frequency analysis: A hybrid deep learning approach. Water Research, 2022, 219: 118591. DOI: 10.1016/j.watres.2022.118591.

[32]
Wu H W, Fan H X, Li J, et al. Reproducing surface water isoscapes of δ18O and δ2H across China: A machine learning approach. Journal of Hydrology, 2024, 638: 131565. DOI: 10.1016/j.jhydrol.2022.127847.

[33]
Alemohammad S H, Fang B, Konings A G, et al. Water, energy, and carbon with artificial neural networks: A statistically-based estimate of global surface turbulent fluxes and gross primary productivity using solar-induced fluorescence. Biogeosciences, 2017, 14(18): 4101-4124.

DOI PMID

[34]
Yang T, Sun F, Gentine P, et al. Evaluation and machine learning improvement of global hydrological model-based flood simulations. Environmental Research Letters, 2019, 14(11): 114027. DOI: 10.1088/1748-9326/ab4d5e.

[35]
Teng M F, Li S W, Song G, et al. Including the feature of appropriate adjacent sites improves the PM2.5 concentration prediction with long short-term memory neural network model. Sustainable Cities and Society, 2022, 76: 103427. DOI: 10.1016/j.scs.2021.103427.

[36]
Teng M F, Li S W, Xing J, et al. 24-Hour prediction of PM2.5 concentrations by combining empirical mode decomposition and bidirectional long short-term memory neural network. Science of the Total Environment, 2022, 821: 153276. DOI: 10.1016/j.scitotenv.2022.153276.

[37]
Triggs B, Mclauchlan P F, Hartley R I, et al. Bundle Adjustment:A Modern Synthesis. Cambridge: Springer, 1999.

[38]
Hartley R, Zisserman A. Multiple View Geometry in Computer Vision. Cambridge: Cambridge University Press, 2003.

[39]
Wiora G. Optische 3D-Messtechnik: Präzise Gestaltvermessung mit einem erweiterten Streifenprojektionsverfahren[D]. Heidelberg: Ruprechts-Karls-Universität Heidelberg, 2001.

[40]
Jarve I, Liba N. The effect of various principles of external orientation on the overall triangulation accuracy. Technol Mokslai, 2010, 86: 59-64.

[41]
Boykov Y, Kolmogorov V. An experimental comparison of min-cut/max-flow algorithms for energy minimization in vision. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2004, 26(9): 1124-1137.

DOI PMID

[42]
Boykov Y Y, Jolly M P. Interactive graph cuts for optimal boundary & region segmentation of objects in ND images. The Proceedings Eighth IEEE International Conference on Computer Vision ICCV, 2001.

[43]
Rolf E, Klemmer K, Robinson C, et al. Mission critical: Satellite data is a distinct modality in machine learning. arXiv Preprint arXiv, 2024: 240201444.

[44]
Yang F Y, Ma C Y. Sparse and complete latent organization for geospatial semantic segmentation. 2022 IEEE/CVF Conference on Computer Vision and Pattern Recognition, 2022: 1799-1808.

[45]
Sun Y, Zhang X C, Huang J F, et al. Fine-grained building change detection from very high-spatial-resolution remote sensing images based on deep multitask learning. IEEE Geoscience and Remote Sensing Letters, 2020, 19: 8000605. DOI: 10.1109/LGRS.2020.3018858.

[46]
Hu J L, Miao C Y, Zhang X P, et al. Retrieval of suspended sediment concentrations using remote sensing and machine learning methods: A case study of the lower Yellow River. Journal of Hydrology, 2023, 627: 130369. DOI: 10.1016/j.jhydrol.2023.130369.

[47]
Brandt M, Tucker C J, Kariryaa A, et al. An unexpectedly large count of trees in the West African Sahara and Sahel. Nature, 2020, 587(7832): 78-82.

[48]
Wang Y M, Feng L W, Zhang Z, et al. An unsupervised domain adaptation deep learning method for spatial and temporal transferable crop type mapping using Sentinel-2 imagery. ISPRS Journal of Photogrammetry and Remote Sensing, 2023, 199: 102-117.

[49]
Jean N, Burke M, Xie M, et al. Combining satellite imagery and machine learning to predict poverty. Science, 2016, 353(6301): 790-794.

DOI PMID

[50]
Toker A, Kondmann L, Weber M, et al. Dynamicearthnet: Daily multi-spectral satellite dataset for semantic change segmentation. The Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, 2022.

[51]
Turing A. Computing machinery and intelligence. Mind, 1950(236): 433-460.

[52]
Lampoltshammer T J, Heistracher T. Natural language processing in geographic information systems: Some trends and open issues. International Journal of Computer Science & Emerging Technologies, 2012, 3(3): 81-88.

[53]
Thessen A E, Cui H, Mozzherin D. Applications of natural language processing in biodiversity science. Advances in Bioinformatics, 2012(1): 391574. DOI: 10.1002/aps3.11563.

[54]
Lu Feng, Zhu Yunqiang, Zhang Xueying. Spatiotemporal knowledge graph: Advances and perspectives. Journal of Geo-Information Science, 2023, 25(6): 1091-1105.

[陆锋, 诸云强, 张雪英. 时空知识图谱研究进展与展望. 地球信息科学学报, 2023, 25(6): 1091-1105.]

DOI

[55]
Hu X M, Xu Y W, Ma X G, et al. Knowledge system, ontology, and knowledge graph of the deep-time digital earth: Progress and perspective. Journal of Earth Science, 2023, 34(5): 1323-1327.

[56]
Zhang Y F, Wei C, He Z T, et al. GeoGPT: An assistant for understanding and processing geospatial tasks. International Journal of Applied Earth Observation and Geoinformation, 2024, 131: 103976. DOI: 10.1016/j.jag.2024.103976.

[57]
Curry G B, Connor R J. Automated Extraction of Biodiversity Data from Taxonomic Descriptions. Boca Raton: CRC Press, 2016: 63-81.

[58]
Peters S E, Zhang C, Livny M, et al. A machine reading system for assembling synthetic paleontological databases. Plos One, 2014, 9(12): e113523. DOI: 10.1371/journal.pone.0113523.

[59]
Bertsekas D P. Infinite-space shortest path problems and semicontractive dynamic programming[D]. Boston: Massachusetts Institute of Technology, 2014.

[60]
Verfaillie G, Lemaitre M, Schiex T. Russian doll search for solving constraint optimization problems. Proceedings of the 13th National Conference on Artificial Intelligence and the 8th Innovative Applications of Artificial Intelligence Conference, 1996(1/2): 181-187.

[61]
Kirkpatrick S, Gelatt C D J, Vecchi M P. Optimization by simulated annealing. Science, 1983, 220(4598): 671-680.

DOI PMID

[62]
Burnetas A N, Katehakis M N. Optimal adaptive policies for Markov decision processes. Mathematics of Operations Research, 1997, 22(1): 222-255.

[63]
Feinberg E A, Shwartz A. Handbook of Markov Decision Processes:Methods and Applications. New York: Springer Science & Business Media, 2012.

[64]
Kaelbling L P, Littman M L, Cassandra A R. Planning and acting in partially observable stochastic domains. Artificial Intelligence, 1998, 101(1/2): 99-134.

[65]
Zheng Y, Lin Y M, Zhao L, et al. Spatial planning of urban communities via deep reinforcement learning. Nature Computational Science, 2023, 3(9): 748-762.

DOI PMID

[66]
Santi P. AI improves the design of urban communities. Nature Computational Science, 2023, 3(9): 735-736.

DOI PMID

[67]
Schultz L, Sokolov V. Deep reinforcement learning for dynamic urban transportation problems. arXiv Preprint arXiv, 2018: 180605310.

[68]
Thottolil R, Kumar U, Chakraborty T. Prediction of transportation index for urban patterns in small and medium-sized Indian cities using hybrid RidgeGAN model. Scientific Reports, 2023, 13(1): 21863. DOI: 10.1038/s41598-023-49343-3.

[69]
Liu Y, An Z H, Ming Y J. Simulating influences of land use/land cover composition and configuration on urban heat island using machine learning. Sustainable Cities and Society, 2024, 108: 105482. DOI: 10.1016/j.scs.2024.105482.

[70]
Chen M, Qian Z, Boers N, et al. Iterative integration of deep learning in hybrid earth surface system modelling. Nature Reviews Earth & Environment, 2023, 4: 568-581.

[71]
Zhu Y L, Qin M J, Dai P X, et al. Deep learning-based seasonal forecast of sea ice considering atmospheric conditions. Journal of Geophysical Research: Atmospheres, 2023, 128(24): e2023JD039521. DOI: 10.1029/2023JD039521.

[72]
Fu S, Huang W Y, Luo J J, et al. Deep learning improves GFS sea surface wind field forecast accuracy in the northwest Pacific Ocean. Journal of Geophysical Research: Atmospheres, 2024, 129(13): e2024JD041188. DOI: 10.1029/2024JD041188.

[73]
Fu S, Huang W Y, Luo J J, et al. Deep learning-based sea surface roughness parameterization scheme improves sea surface wind forecast. Geophysical Research Letters, 2023, 50(24): e2023GL106580. DOI: 10.1029/2023GL106580.

[74]
Sun D Y, Huang W Y, Luo Y, et al. A deep learning-based bias correction method for predicting ocean surface waves in the northwest Pacific Ocean. Geophysical Research Letters, 2022, 49(23): e2022GL100916. DOI: 10.1029/2022GL100916.

[75]
Sun D Y, Huang W Y, Yang Z F, et al. Deep learning improves GFS wintertime precipitation forecast over Southeastern China. Geophysical Research Letters, 2023, 50(14): e2023GL104406. DOI: 10.1029/2023GL104406.

[76]
Shao C K, Yang K, Tang W J, et al. Convolutional neural network-based homogenization for constructing a long-term global surface solar radiation dataset. Renewable and Sustainable Energy Reviews, 2022, 169: 112952. DOI: 10.1016/j.rser.2022.112952.

[77]
Vaswani A, Shazeer N, Parmar N, et al. Attention is all you need. 31st Conference on Neural Information Processing Systems (NIPS 2017), Long Beach, 2017.

[78]
Bommasani R, Hudson D A, Adeli E, et al. On the opportunities and risks of foundation models. arXiv Preprint arXiv, 2021: 210807258.

[79]
Weyn J A, Durran D R, Caruana R. Improving data‐driven global weather prediction using deep convolutional neural networks on a cubed sphere. Journal of Advances in Modeling Earth Systems, 2020, 12(9): e2020MS002109. DOI: 10.1029/2020MS002109.

[80]
Pathak J, Subramanian S, Harrington P, et al. Fourcastnet: A global data-driven high-resolution weather model using adaptive fourier neural operators. arXiv Preprint arXiv, 2022: 220211214.

[81]
Lam R, Sanchez-Gonzalez A, Willson M, et al. Learning skillful medium-range global weather forecasting. Science, 2023, 382(6677): 1416-1421.

[82]
Bi K F, Xie L X, Zhang H H, et al. Accurate medium-range global weather forecasting with 3D neural networks. Nature, 2023, 619(7970): 533-538.

[83]
Zhang Y C, Long M S, Chen K Y, et al. Skilful nowcasting of extreme precipitation with NowcastNet. Nature, 2023, 619(7970): 526-532.

[84]
Chen L, Zhong X H, Zhang F, et al. FuXi: A cascade machine learning forecasting system for 15-day global weather forecast. NPJ Climate and Atmospheric Science, 2023, 6: 190.

[85]
Zhang Lifu, Sun Xuejian, Zhang Xia, et al. A multi-dimensional data format (MDD) and analysis tool. Journal of Global Change Data & Discovery, 2017, 1(2): 121-135.

[张立福, 孙雪剑, 张霞, 等. 时空谱多维数据格式(MDD)结构与计算机配套系统. 全球变化数据学报(中英文), 2017, 1(2): 121-135.]

[86]
Zhou Yongzhang, Chen Shuo, Zhang Qi, et al. Advances and prospects of big data and mathematical geoscience. Acta Petrologica Sinica, 2018, 34(2): 255-263.

[周永章, 陈铄, 张旗, 等. 大数据与数学地球科学研究进展: 大数据与数学地球科学专题代序. 岩石学报, 2018, 34(2): 255-263.]

[87]
Wu Chonglong, Liu Gang, Zhang Xialin, et al. Discussion on geological science big data and its applications. Chinese Science Bulletin, 2016, 61(16): 1797-807.

[吴冲龙, 刘刚, 张夏林, 等. 地质科学大数据及其利用的若干问题探讨. 科学通报, 2016, 61(16): 1797-1807.]

[88]
Lehner B, Messager M L, Korver M C, et al. Global hydro-environmental lake characteristics at high spatial resolution. Scientific Data, 2022, 9(1): 351. DOI: 10.1038/s41597-019-0300-6.

PMID

[89]
Eyring V, Bony S, Meehl G A, et al. Overview of the Coupled Model Intercomparison Project Phase 6 (CMIP6) experimental design and organization. Geoscientific Model Development, 2016, 9(5): 1937-1958.

[90]
Priestley M D K, Ackerley D, Catto J L, et al. An overview of the extratropical storm tracks in CMIP 6 historical simulations. Journal of Climate, 2020, 33(15): 6315-6343.

DOI

[91]
Carvalho D, Rocha A, Costoya X, et al. Wind energy resource over Europe under CMIP6 future climate projections: What changes from CMIP5 to CMIP6. Renewable and Sustainable Energy Reviews, 2021, 151: 111594. DOI: 10.1016/j.rser.2021.111594.

[92]
Hayes S P, Mangum L J, Picaut J, et al. TOGA-TAO: A moored array for real-time measurements in the tropical Pacific Ocean. Bulletin of the American Meteorological Society, 1991, 72(3): 339-347.

[93]
Fox-Kemper B, Adcroft A, Böning C W, et al. Challenges and prospects in ocean circulation models. Frontiers in Marine Science, 2019, 6: 65. DOI: 10.3389/fmars.2019.00065.

[94]
Reichstein M, Camps-Valls G, Stevens B, et al. Deep learning and process understanding for data-driven earth system science. Nature, 2019, 566(7743): 195-204.

[95]
Brenowitz N D, Bretherton C S. Prognostic validation of a neural network unified physics parameterization. Geophysical Research Letters, 2018, 45(12): 6289-6298.

[96]
Zhou J, Lu B, Liu Z, et al. MagiNet: Mask-aware graph imputation network for incomplete traffic data. arXiv Preprint arXiv, 2024: 240603511.

[97]
Jia D, Song C, Cheng C, et al. A novel deep learning-based spatiotemporal fusion method for combining satellite images with different resolutions using a two-stream convolutional neural network. Remote Sensing, 2020, 12(4): 698. DOI: 10.3390/rs12040698.

[98]
Wang Y D, Zhou X W, Ao Z R, et al. Gap-filling and missing information recovery for time series of MODIS data using deep learning-based methods. Remote Sensing, 2022, 14(19): 4692. DOI: 10.3390/rs14194692.

[99]
Ao Z R, Sun Y, Pan X Y, et al. Deep learning-based spatiotemporal data fusion using a patch-to-pixel mapping strategy and model comparisons. IEEE Transactions on Geoscience and Remote Sensing, 2022, 60: 5407718. DOI: 10.1109.TGRS.2022.3154406.

[100]
Cao Y, Wang Y B, Peng J H, et al. DML-GANR: Deep metric learning with generative adversarial network regularization for high spatial resolution remote sensing image retrieval. IEEE Transactions on Geoscience and Remote Sensing, 2020, 58(12): 8888-8904.

[101]
Jia D, Cheng C X, Shen S, et al. Multitask deep learning framework for spatiotemporal fusion of NDVI. IEEE Transactions on Geoscience and Remote Sensing, 2022, 60: 5616313. DOI: 10.1109/TGRS.2021.3140144.

[102]
Cheng Changxiu, Pei Tao, Liu Yu, et al. The practice and method of natural disasters situational awareness in the new era. Acta Geographica Sinica, 2023, 78(3): 548-557.

DOI

[程昌秀, 裴韬, 刘瑜, 等. 新时代自然灾害态势感知的实践与方法探索. 地理学报, 2023, 78(3): 548-557.]

DOI

[103]
Raissi M, Perdikaris P, Karniadakis G E. Physics-informed neural networks: A deep learning framework for solving forward and inverse problems involving nonlinear partial differential equations. Journal of Computational Physics, 2019, 378: 686-707.

DOI

[104]
Secci D, Godoy V A, Gómez-Hernández J J. Physics-informed neural networks for solving transient unconfined groundwater flow. Computers & Geosciences, 2024, 182: 105494. DOI: 10.1016/j.cageo.2023.105494.

[105]
Haruzi P, Moreno Z. Modeling water flow and solute transport in unsaturated soils using physics-informed neural networks trained with geoelectrical data. Water Resources Research, 2023, 59(6): e2023WR034538. DOI: 10.1029/2023 WR034538.

[106]
Bandai T, Ghezzehei T A. Physics‐informed neural networks with monotonicity constraints for richardson‐richards equation: Estimation of constitutive relationships and soil water flux density from volumetric water content measurements. Water Resources Research, 2021, 57(2): e2020WR027642. DOI: 10.1029/2020WR027642.

[107]
Song Changqing, Cheng Changxiu, Shi Peijun. Geography complexity: New connotations of geography in the new era. Acta Geographica Sinica, 2018, 73(7): 1204-1213.

DOI

[宋长青, 程昌秀, 史培军. 新时代地理复杂性的内涵. 地理学报, 2018, 73(7): 1204-1213.]

DOI

[108]
Sun M, Chen L, Li T, et al. CNN‐based ENSO forecasts with a focus on SSTA zonal pattern and physical interpretation. Geophysical Research Letters, 2023, 50(20): e2023GL105175. DOI: 10.1029/2023GL105175.

[109]
Mu B, Qin B, Yuan S. ENSO-GTC: ENSO deep learning forecast model with a global spatial-temporal teleconnection coupler. Journal of Advances in Modeling Earth Systems, 2022, 14(12): e2022MS003132. DOI: 10.1029/2022MS003132.

[110]
Ham Y G, Kim J H, Luo J J. Deep learning for multi-year ENSO forecasts. Nature, 2019, 573(7775): 568-572.

[111]
Fan J, Meng J, Ludescher J, et al. Network-based approach and climate change benefits for forecasting the amount of Indian monsoon rainfall. Journal of Climate, 2022, 35(3): 1009-1020.

[112]
Cheng Changxiu, Shi Peijun, Song Changqing, et al. Geographic big-data: A new opportunity for geography complexity study. Acta Geographica Sinica, 2018, 73(8): 1397-1406.

DOI

[程昌秀, 史培军, 宋长青, 等. 地理大数据为地理复杂性研究提供新机遇. 地理学报, 2018, 73(8): 1397-1406.]

DOI

[113]
Bauer P, Hoefler T, Stevens B, et al. Digital twins of Earth and the computing challenge of human interaction. Nature Computational Science, 2024, 4(3): 154-157.

DOI PMID

[114]
Li X, Feng M, Ran Y H, et al. Big data in earth system science and progress towards a digital twin. Nature Reviews Earth & Environment, 2023, 4(5): 319-332.

[115]
Voosen P. Chinese AI stirs panic at European geoscience society. Science, 2024, 385(6704): 12-13.

文章导航

/