高精度、长时间序列、空间连续的降水产品是气候分析、水文模拟等众多研究领域中的重要输入。近期欧洲研究人员融合了3种不同类型的降水数据:站点观测、遥感产品、再分析资料,制作了全球1979-2014年3小时一次0.25°空间分辨率的降水产品(Multi-Source Weighted-Ensemble Precipitation, MSWEP),凭借高时空分辨率及其对多源信息的挖掘和融合,该产品一经发布即受到广泛关注。本文利用三峡库区及附近地区气象站点的降水资料对MSWEP月降水数据进行评估,采用广义加性模型算法(General Additive Model,GAM)融合站点降水空间插值结果和MSWEP产品,对三峡库区融合后降水进行分析。主要结论为:① 降水估算精度呈现冬春季偏高、夏秋季偏低的特征,MSWEP产品与站点插值方法具有互补性,前者对夏秋季降水估算精度更高,后者对冬春季降水估算精度更高;② GAM算法可以充分发挥站点插值和MSWEP数据各自的优势,提高区域降水估算精度,与融合前相比,均方根误差减少了17%~50%,相关系数r提高了10%~30%;③ 2003年库区蓄水前后降水变化的主要特征有:库区中部长江以南地区汛期降水(5-10月)下降,库区西部干季(1-4月,11-12月)降水增加,库区外围西北部(大巴山地区)汛期降水增加,降水空间格局异质性增加,干季降水占全年降水比例升高。

关键词: 降水 ; 三峡库区 ; MSWEP ; GAM


Long time-series, spatially-contiguous and accurate precipitation products are one of the most important inputs for various studies, including climate change detection, hydrological modelling, drought monitoring, etc. However, due to its high spatio-temporal variability, precipitation is one of the meteorological elements that are most difficult to estimate. Recently, a new global gridded precipitation dataset that merges gauge measurements, satellite products, and reanalysis data, has been produced. Owing to its high spatial resolution, long time span, and comprehensive combination of different precipitation data sources, MSWEP data have received wide attention since its release. In this study, we first evaluated accuracy of MSWEP monthly precipitation using local gauge measurements in the Three Gorges Dam region, then produced more accurate precipitation data by combining MSWEP and gauge measurements with the GAM (Generalized Additive Model) method, and finally analysed precipitation changes before and after the dam water level rose to 135 m in June 2003. Main conclusions are drawn as follows. (1) No matter what methods are used, estimation accuracy of precipitation shows strong seasonality: more accurate in cold-dry season (spring and winter), while less accurate in hot-wet season (summer and autumn). Gauge measurement and MSWEP are complementary, with the former being more accurate in cold-dry season and the latter being more accurate in hot-wet season. (2) GAM can take advantages of both gauge measurements and MSWEP with flexibility and achieve more accurate precipitation estimation (rmse decreases by 17%-50%, and r increases by 10%-30%). There are still great seasonal variations in accuracy, with rmse being 8-20 mm in spring and winter and 20-50 mm in summer and autumn. (3) Based on the precipitation estimation results obtained in step 2, we found the following phenomena after the water level rose to 135 m in 2003: 1) dam regions south of the Yangtze River show a precipitation reduction over May-October; 2) dam regions in the western part show a precipitation increase over November-April; 3) The northwestern part outside core dam regions shows a precipitation increase over May-October, which is consistent with the results of other studies; 4) precipitation shows an increase in spatial heterogeneity, but a slight decrease in seasonality conveyed by an increase in proportion of precipitation in dry season.

Keywords: precipitation ; Three Gorges Dam region ; MSWEP ; GAM


1 引言

由于较高的时空异质性,降水是最难估算的气象变量之一[1-3]。目前获取降水信息的主要方法包括:雨量计观测、地基降水雷达、卫星数据反演、数值预报模式模拟等,这些方法在观测原理、算法精度、产品时空分辨率和覆盖范围等方面存在巨大差异和互补性[4]。融合多源信息,获取高精度、长时间序列、空间连续的降水产品已成为众多研究领域(气候分析、水文模拟、生态监测等)中的热点之一[4-7]。近期,欧洲研究人员[4]制作了1979-2014年全球3小时一次的0.25°分辨率的降水产品(Multi-Source Weighted-Ensemble Precipitation, MSWEP),该产品根据站网密度、卫星降水反演精度、数值预报降水精度,适时调整权重,再通过加权平均的方式融合上述3种降水的结果,利用全球125个通量塔的降水观测作为独立样本进行检验,结果表明MSWEP的精度高于其他常用降水产品(WFDEI-CRU,GPCP-1DD, TMPA 3B42,CPC unified)。目前已有多名学者正在利用MSWEP数据开展水文模拟、气候变化等方面的研究。


上述研究中除利用数值模拟技术,主要依赖2种降水数据:站点观测和卫星产品。站点降水虽然精度高,但代表性差,尤其是对于地形复杂的三峡地区;卫星降水产品空间分辨率高,可以进行大面积的整体观测,但时间序列短(1998年至今),精度有限,因此很有必要将站点和卫星数据结合起来,分析三峡库区降水的变化特征。目前常用的方法是利用站点降水对卫星降水进行线性标定,但由于卫星降水误差具有明显的季节性和空间分布特征(例如,对于冬季降水、弱强度降水、地形复杂或高纬度地区,卫星降水误差较大)[15],简单的线性标定无法取得令人满意的效果。近期,广义加性模型(General Additive Model, GAM)正受到学者日益关注[16],GAM具有良好的灵活性、非线性以及对空间数据的平滑处理能力,可以自适应的调整站点插值结果和卫星产品的权重,对两者进行有效融合,前人已开展多项研究,如基于遥感数据估算气温[17]、估算辐射[18-19]、评估滑坡可能性[20]等,结果表明GAM精度高、过学习风险小,是值得推广应用的方法。


2 研究区域、数据、方法

2.1 研究区域

研究区域如图1所示,地理范围:33.375°N~26.625°N、104.875°E~113.625°E(网格中心的经纬度),研究区包含了三峡库区及周边地区,选择如此大的范围一方面是为了增加区域内站点数量,另一方面是为了观察库区和周边区域在降水变化特征方面是否有明显不同。三峡库区的范围大致位于32°N~28°N、106°E~112°E,库区内共有34个县(区),靠近库区的沿江县(区)有12个(白色矢量),其余22个为远库区县(区)(黑色矢量)。根据长江两岸地表特征,可以将库区分为两段,重庆至万州为西段,该段区域内长江走向为西南—东北方向,长江北岸地形平坦,以农田覆盖为主,长江南岸地形略有起伏,地表覆盖为农田、森林交错。从云阳至宜昌为东段,该段内长江走向开始水平向东而后向东南倾斜,长江两岸均为浓密的森林,峡谷地形突出。长江离开库区东段以后,来到地势平坦地区,农田为主要土地覆盖。三峡库区在2003年6月蓄水,水位由66 m涨至135 m。图2显示了研究区的地形图、主要山脉和220个气象站点位置。可以看出,站点的分布比较均匀,两两站点之间距离的平均值是380 km。

图1   研究区2006年MODIS土地覆盖图及库区县位置

Fig. 1   Land cover of the study region (MCD12 product in 2006) as well as the boundaries of counties located near the Yangtze River

图2   研究区高程、站点分布和主要山脉

Fig. 2   DEM, meteorological stations network, and main mountains of the study region

2.2 研究数据

MSWEP数据:1979年1月至2014年12月MSWEP数据产品,空间分辨率为0.25°,时间分辨率为月(原始数据为3小时一次,处理为月累计降水)。根据研究范围,提取研究区内格点上MSWEP降水数据时间序列。MSWEP数据的生成过程和下载地址请参考 文献[4]。


2.3 研究方法

2.3.1 三峡库区站点降水插值和MSWEP数据的精度对比 尽管MSWEP数据已包括了站点的降水观测信息[4],但只利用了全球的一小部分站点,在局部区域如果有更密集的气象台站(如本研究区有220个气象站),利用插值算法也可以得到空间连续的降水数据,那么MSWEP降水数据和区域降水插值结果比较,谁的精度更高?

为了对此进行分析,本文针对每个站点每个月提取了3种降水数据,分别是:① 该站点对应格点上的MSWEP月降水数据 Piju(其中i代表站点,j代表月份,u代表年份);② 利用最近邻插值算法得到的该站点降水数据 Tiju;③ 该站点实际观测的降水数据 Diju。前两者代表了假设某站点没有降水观测条件下,可用的两种估算降水的方法(即遥感产品或空间插值),将这两种方法的估算结果和真实降水观测进行对比,则可以评价两种方法的精度。评价的标准主要包括:相关系数(r),均方根误差(rmse),相对均方根误差(relative rmse),以及偏差(bias),为了分析误差随季节的变化,本文首先针对kj月的降水数据计算误差参数,而后统计其多年的月均值。

2.3.2 基于GAM方法融合站点观测和MSWEP数据 由于区域插值算法和MSWEP降水数据具有很强的互补性,本文利用GAM算法融合了两种降水信息,模型的形式为:


式中:x1x2分别为站点经纬度; sx1,x2表示利用薄盘样条函数对局部做平滑;x3为站点MSWEP降水数据;y为站点降水观测数据,模型中需要估算的参数是s函数的形式,以及x3的系数,通过最小化目标函数(2)实现参数估算。


目标函数由模型误差和模型复杂度两部分组成, λ为光滑参数,在误差和复杂度之间起平衡作用,可以用广义交叉验证(Generalized Cross Validation, GCV)或AIC(Akaike's Information Criterion)为标准进行确定,本文使用GCV方法。在拟合薄盘样条时,需要估算的参数个数随着样本量的增加而增加,当样本量大时,计算量很大且容易受到噪音的影响,对此Wood设计了薄盘样条回归函数[16],该函数需要设定一个基础维数(k)值,来确定模型自由度的上限[21],如果模型优化后得到的有效自由度(effective degree of freedom, edf)非常接近k值,说明先前给定的或缺省的k值偏低,模型形式过于简单以至于真实的数据分布无法被很好的模拟。为改善模拟精度,需要增加k值(但不能超过用于模型训练的样本个数),当拟合后模型的edf明显小于k值(一般要求edf <0.75×k),并且不随k的增加而发生明显变化,此时的k值比较适宜,如果再增加,计算量会上升,过拟合的风险也会增加。针对研究数据,本文通过检验k值和模型edf的变化,发现更适宜的模型形式是k = 70的时候,即:



为了对GAM模型精度有客观的评价,本文采取了留一法(Leave One Out, LOO)计算误差。针对某年某月的降水数据,每次选择一个站点作为检验,用剩下的站点建立GAM模型,而后用该模型估算检验站点的降水数据,如此迭代,直到所有站点的月降水数据都曾被用作检验样本,具有GAM模型估算的降水数据,将此估算值和真实值对比,即可评价GAM算法的精度。

2.3.3 三峡库区的降水特征分析 基于GAM融合后的降水数据提取降水特征,为了突出水库蓄水的影响,将数据分为2个时期:1979-2002年和2003-2014年,对前期、后期降水的多年平均值、Mann-Kendall变化斜率等进行统计[22]。由于研究区域的降水主要集中在夏季,在不同季节降水的空间格局差异巨大,且估算误差也明显不同,因此,本文将一年分为2个时期,5-10月为汛期,1-4月以及11月、12月为干季,对汛期和干季的降水特征分别统计。


3 结果分析

3.1 最近邻插值和MSWEP降水的精度对比

MSWEP和最近邻插值方法估算站点月降水量的精度如图3所示,为了体现精度的季节变化,本文统计了误差变量在1979-2014年期间的月均值,从图3a、3b中可以发现这两种方法都是在冬春季效果更好(r = 0.85~0.9,rmse=10~30 mm),在夏秋季效果更差(r = 0.7~0.8,rmse = 40~70 mm),但这两种方法的优势体现在不同季节,冬春季时插值方法优于MSWEP,而夏秋季时却是MSWEP优于插值方法,这和降水的季节分配、空间格局紧密相关。冬春季对流降水偏少,降水的空间均匀度较高,有助于提高插值算法的精度,而受地面上时有冰雪且小雨偏多的影响,遥感降水产品误差较大,从图3c中可看出,由于冬春季降水量少,MSWEP的相对rmse可达40%,明显高于插值算法(一般在30%以内),上述结果也表明在MSWEP数据的生成中,虽然冬季降水信息主要依赖于站点资料和再分析资料[4],但精度仍然不甚理想。夏秋季对流降水偏多,降水量大且空间异质性高,空间插值算法难以准确表达降水的空间格局,而遥感产品却可以通过对区域的全面观测获取更准确的降水信息。除季节影响外,MSWEP和地面站点观测的尺度不匹配也是造成误差的主要原因之一。

图3   MSWEP降水、最近邻插值和GAM估算精度的对比

Fig. 3   Accuracy comparison among MSWEP, Nearest Neighbour, and GAM estimation results

图3d显示了平均偏差的季节变化,可以看出,插值算法的平均偏差较小,并且几乎不随季节发生变化,相反,MSWEP具有明显的偏差,且这种偏差具有季节性,具体而言,3-8月,MSWEP比实测数据高出10~12 mm,在1-2月和11-12月,MSWEP比实测数据高出2~4 mm,而在9-10月,MSWEP比实测数据平均低2~4 mm。MSWEP或遥感降水相对于站点降水的高估现象,在其他类似研究中也有描述[14],但9-10月份出现低估,此前并没有相关研究发现,这值得进一步探讨,秋汛是三峡库区的主要气象灾害之一,MSWEP的低估可能与秋季降水类型、大气条件有关(秋季发生连阴雨、持续时间长,但雨强不大)。

3.2 GAM融合降水精度

图3中显示了利用GAM方法融合降水的误差,与MSWEP产品和最近邻插值相比,融合降水的rmse减少了17%~50%,r提高了10%~30%,尽管精度提高明显,精度的季节特征并没有发生变化,仍然是夏秋季降水的估算误差较大(rmse = 20~50 mm,r = 0.75~0.85,相对rmse = 25%~33%),而冬春季降水估算误差较小(rmse = 8~20 mm,r = 0.9~0.95,相对rmse = 20%~25%)。


图4   GAM模型中样条函数有效自由度(edf)和MSWEP的回归系数值的月均值

Fig. 4   Monthly mean values for edf and linear coefficients obtained in fitting GAM models

3.3 降水估算精度与高程的关系

地形影响降水,降水估算精度可能和高程有关,为了体现两者的关系,本文计算了每个站点年降水观测值与估算值的相关系数,而后按照高程将站点分成4组(< 200 m,200~500 m,500~1000 m,> 1000 m),统计每组站点相关系数的平均值(图5)。随着高程的增加,估算精度也略有下降,这可能和山区降水的时空异质性更高有关。MSWEP的效果优于最邻近差值法,尤其在站点稀少的高海拔地区(> 1000 m),MSWEP的优势更加明显,这说明站点个数是限制最邻近差值法的重要影响因子。当利用GAM算法融合MSWEP和站点降水时,精度进一步提高,与MSWEP相比,GAM的r值提高了4%~7%,最明显的是在海拔居中的区域(200~1000 m),间接说明低海拔和高海拔处降水估算精度改进的余地较小。

图5   不同海拔区域三种方法估算精度的对比(n值为站点个数)

Fig. 5   Accuracy comparison among different elevation groups (n is the number of stations in each group)

3.4 三峡库区降水特征分析

3.4.1 降水均值 降水均值空间格局具有如下特征:汛期和干季的降水格局明显不同(图6a、6d),干季降水更为均匀,从东南往西北方向逐渐降低,有明显的分带性特征;汛期降水格局更为复杂,有一条东南—西北方向的降雨带,雨带上的降水量明显高于两侧,而且雨带上有两个降雨高值中心,分布在长江两岸。由于汛期降水量大,年总降水量的格局基本由汛期降水格局决定。

图6   干季和汛期多年平均降水在水库蓄水前后的空间格局及其变化

Fig. 6   Mean precipitation in dry and wet season and the precipitation changes before and after dam water level rose to 135 m

汛期降水变化格局:汛期降水格局在蓄水前后发生了明显变化(图6d、6e、6f),位于长江南岸的降水高值区域空间范围明显缩小、强度减弱,而位于长江北岸的降水高值中心空间范围明显扩大、强度增强,这导致了原本比较连续的东南—西北方向的雨带在靠近长江地区出现了间断。从汛期的降水变化图上可以看出,西北区域(大巴山地区)降水增加,中部、南部区域降水减少。三峡库区内部汛期降水以下降为主,下降最明显的是库区内长江以南地区。汛期降水的减少可能是大量水域在夏季升温缓慢,导致上升对流减少、下沉的大气增多,更容易驱散水汽所造成 [9]。由于汛期降水量明显高于干季,所以汛期降水的变化格局也主导了全年降水的变化格局,受篇幅限制,此处没有显示年降水变化图。


3.4.2 降水变化趋势 图7显示了干季、汛期、全年降水量在水库蓄水前后的MK斜率的分布格局,从中可以看出以下特征。

图7   干季、汛期、全年降水变化MK斜率在蓄水前后的分布格局

Fig. 7   MK trends of precipitation in dry season, wet season, and the whole year before and after dam water level rose to 135 m




3.4.3 降水季节分配 由于干季和汛期降水的变化趋势不同,造成了降水的季节分配也出现很大变化,对此计算了干季降水占全年降水的比例,从图8中可以看出,蓄水前,干季降水比例从东南向西北呈递减趋势,数值从0.5下降至0.15左右,库区内干季降水比约为0.25~0.30。在水库蓄水后,整个库区内部的干季降水比例都有所增加,且库区西南部的增加幅度最大。从降水均值变化中可以看出(图6),库区西南部干季降水增加、库区其他地区汛期降水减少,是造成整个库区干季降水占全年降水比例提高的主要原因。

3.4.4 降水空间均匀性变化 降水的空间格局与降水类型有关,也会受到地表覆盖、景观格局、地形等因素的影响,图9显示了水库蓄水前后降水空间均匀性的分布,对比分析可以看出如下特征。

图8   干季降水比例及其蓄水前后变化

Fig. 8   Proportion of precipitation in dry season before and after dam water level rose to 135 m

图9   干季、汛期降水空间代表性在蓄水前后的分布

Fig. 9   Spatial homogeneity of precipitation in dry season and wet seasons before and after 2003



4 讨论

4.1 降水产品精度


4.2 库区降水变化特征


4.3 三峡水库增加大巴山地区降水?

三峡水库的气候效应一直受到科学界和公众的持续关注,最初多数研究都认为三峡水库的气候影响只局限在江面附近,2006年Wu等[8]首先提出三峡水库的气候影响可以发生在百公里尺度上:三峡西北部地区(秦岭大巴山地区)的降水在2003年以后明显增加,而Xiao等[12]则认为这种增加不超过自然变化范畴,在水库修建以前,也发生过这种类似现象。按照Wu等[8]和Xiao等[12]研究中的对比方法,本文计算了三峡北部大巴山地区(中心经纬度范围107.125°E~110.875°E,33.375°N~30.875°N)区域月平均降水和背景区域(107.125°E~110.875°E,33.375°N~27.875°N)月平均降水之间差值在蓄水前后的变化,从图10a中可以看出,蓄水后,三峡北部7-9月平均降水与背景值的差异明显增加,而其他月份平均降水的差异在蓄水前后则无明显变化;图10b中显示了三峡北部和背景区域7-9月平均降水差异值的年际变化,可以看出,Wu等研究中对比的两个时段:1998-2002年和2004-2006年,其降水差异分别位于历史低位和历史高位,前后形成强烈反差(降水差异由-11 mm变为24 mm);Xiao研究中对比的两个时段:1979-1980年和1981-1984年也具有较大反差(由于本文的序列只有1979-2014年,Xiao等研究中提到的1978-1980年只好缩短为1979-1980年),尤其是1981-1984年,北部区域比背景区域7-9月平均降水高出的幅度为26 mm。然而这两个研究所用的数据时段都比较短,虽然差异变化大,但无法通过显著性检验。

图10   北部区域和背景区域降水比较

Fig. 10   Precipitation contrast of northern region compared against background

本文以2003年为界,得出降水差异在蓄水前24年的平均值为-1 mm,蓄水后12年的平均值为16 mm,说明蓄水前北部大巴山地区7-9月平均降水非常接近背景值,蓄水后则是比背景值高出16 mm,且这一变化通过了显著性检验(P < 5%)。如果统计降水差异值最大的5个年份,发现除1981年以外,其他年份(2011年,2005年,2003年,2009年)都是在蓄水以后,说明北部降水高于背景值的情况在近几年发生的比例更高,笔者认为若要解释其变化原因,还需要有更多深入研究,不能简单归结为三峡工程。受数据序列长度限制,当前蓄水后降水数据只有12年,随着数据积累时间更长,可以再检验这种变化是否显著。

5 结论


虽然MSWEP数据在生产过程中综合了3方面的降水信息(站点观测、遥感产品、数值预报),但其质量仍存在缺陷,站点插值方法与MSWEP产品具有互补性。通过GAM模型融合站点降水和MSWEP数据,可以充分发挥两种数据的优势,提高降水估算精度,具体而言,夏秋季降水量大、空间格局复杂,GAM模型主要依赖于MSWEP数据中丰富的空间细节,冬春季降水量少,空间均匀性高,GAM主要依赖于站点空间插值方法的低偏差的估计结果,GAM融合降水精度明显高于融合前,但仍然存在明显的季节变化:冬春季均方根误差rmse = 8~20 mm/月,夏秋季均方根误差rmse = 20~50 mm/月。



The authors have declared that no competing interests exist.


