夏季降水量与气温资料的恢复试验
THE EXPERIMENTAL STUDY OF RECONSTRUCTION FOR SUMMER PRECIPITATION AND TEMPERATURE IN CHINA
-
摘要: 该文对我国汛期降水量和气温缺测资料及资料均一性恢复的方法进行试验研究。对单个气候地区(东北区),以及全国6个气候地区用逐步回归和逐步判别方法进行缺测1~5年恢复试验。对东北地区内所有站点的试验表明,逐步判别分析方法比逐步回归分析方法恢复效果好些;选择邻站用判别分析方法建立的恢复模型,效果更好。全国气候地区试验表明,选择邻站的判别分析方法有较好的恢复效果。Abstract: The examination of reconstruction for missing data and homogeneity for summer precipitation and temperature in China was completed. The experimental study is on the reconstruction for missing data for the period of 1~5 years using stepwise regression and stepwise discrimination. It is found that the stepwise discrimination is better than the stepwise regression in the validity of the reconstruction. The experimental studies about different methods of discriminate group show that the discrimination based on Gamma distribution is better with a good validity. The discrimination selected nearly stations have a good validity than the stepwise discrimination with F value. The experimental results also show that the reconstruction for missing with the little error in the six areas in China on reconstruction using discrimination selected nearly stations.
-
Keywords:
- Data reconstruction /
- Homogeneity /
- Stepw ise discrimination /
- Stepwise reg ression
-
引言
在气候变化的研究中,气候资料的可靠性和精确性是气候变化研究的基础。由于早期观测仪器或者观测台站的变迁等等原因,使早期观测资料的均一性存在很多问题[1]。另外,近年来年代际的气候变化研究十分活跃[2~5],在我国某些台站有100年以上的降水量和气温资料,但是由于解放初期,在一些年份或月份有些测站缺少观测资料。因此较准确估计并恢复测站缺测的资料,对于我国年代际气候变化研究具有十分重要的意义。国内外对资料的均一性有不少研究。例如,Pot te [6]提出两变量正态分布检验对资料序列均一性进行检验。恢复的有关方法也有不少研究。Easterling和Peterso [7]提出用回归分析与非参数统计量结合进行序列均一性进行检验。但是,缺测资料恢复的方法研究还不多。最近,Young使用3种不同的方法,多元判别、多元回归和正态比方法,分别对美国Arizona和Mexico州的111个测站的月降水量进行插值试验[8],对19世纪90个资料和20世纪的260个资料进行插值试验,用3个方法的预测值的中值作为3种方法的预测值。结果表明,多元判别有较好的插值效果。
对于我国的资料,特别是降水量和气温的夏季汛期季节资料用什么方法恢复比较合适? 是否使用判别分析方法有好的效果? 而判别分析方法涉及到首先对恢复对象资料进行分类,怎样分类? 哪种分类方法? 分多少类? 怎样与回归分析方法进行比较? 用多元判别(回归)还是逐步判别(回归)? 由于逐步判别和逐步回归都对进入方程的因子进行引入或剔除,用什么标准进行? 如果用多元判别和多元回归,又怎样选择必须进入方程的因子? 本文就是试图回答这方面问题,并进行比较试验研究。
在我国气候变化的研究中,最重要的研究对象莫过于夏季降水量和气温。因此本文研究缺测资料的恢复,主要是6~8月的降水量和气温,使用我国160测站资料(由中国气象局国家气象中心提供)。
1. 资料与方法
我们选取逐步判别与逐步回归[9]作为资料恢复试验的基本方法。
由于季节降水量和气温是气候要素,试验时先对我国降水量进行气候区划,气候区划分区方法见文献[10],即把我国气候降水特点分为东北、华北、黄河流域、长江流域、华南和新疆等6个地区,各区测站数分别包含22,26,34,37,29和12个测站。
选取1951~2000年东北地区6~8月季节降水量和气温的22个站的资料。比较方法是把其中某站或某些站的资料看成为缺测,用整个地区的其他测站资料进行恢复。以比较哪个方法有较好的恢复效果。恢复值与实测值的差值和它们试验样本的均方误(平均平方根误差)是比较效果的评判标准。又考虑到气温与降水量的恢复值单位不同,而且即使是同一要素,由于站点地理位置不同,其气候变化幅度(即标准差)不同,为了消除要素和站点位置差异,也便于不同要素相互比较,引入标准误差,如下式所示,
(1) 式中
为要素恢复值,x 0 为要素观测值,s 为要素多年的样本标准差。对此标准误差再计算它们试验样本的均方误,称为标准均方误,即(2) 其中m为试验样本容量。均方误的表示与标准均方误类似,只是在式(1) 和式(2) 中令s=1。
由于判别分析仅对恢复对象作分类判别,恢复时,考虑到平均值是最大似然估计量,比中值好些。因此把恢复的类别样本平均值作为类别的恢复值。
分类数和分类方法直接影响类别的平均值。分类数按一般常用的分为3类和5类。考虑到分类后恢复的平均值代表性以类内变化越小越好,因此选取分5类,而且与当前国际对气候要素分类数一致。分类方法一般用正态分类方法[11],以及目前国际常用的Gamma分布分类法。后者按概率0.1、0.3、0.7和0.9作为5、4、3、2、1类的分界点[12]。正态分布分类法则把恢复对象按标准化值划分,分5类时,以-1.29,-0.57,0.57,1.2作为5、4、3、2、1类的分界点。
逐步判别与逐步回归都是双重检验选取进入和剔除方程的因子,它们均用F统计量进行计算,F值可以任意选择以控制方程的因子数。考虑到至少有因子可能被选取到,值不能太高,本文选取F值取1.0~2.5作为试验值。
2. 东北地区夏季降水量与气温的恢复方法试验
为了确定选取什么恢复方法和参数,以东北地区22个站50年资料逐个测站作试验。因为缺测资料常常发生在解放初期,选取1951~1955年的降水量(气温)看作为缺测资料,分别作缺测1、3和5年的试验,独立检验样本容量m分别为21,63,105。取其余2个站降水量(气温)作为因子,样本因子矩阵不包含缺测年份,样本容量为49,用双重检验逐步判别和逐步回归方法选取因子,建立恢复资料的方程。判别时按正态分布和Gamm分类。表 1 给出东北地区22站夏季降水量不同方法独立试验样本均方误与标准均方误的比较。
表 1 东北地区夏季降水量不同方法试验样本均方误与标准均方误的比较从表 1 中可见,22站试验均方误比较表明,逐步回归与判别方法恢复1年气候要素值,以F值取2.0有较好的效果。在3~5年恢复试验中,判别比回归效果好。另外,用正态分布划分5类,逐步判别F值仍然取2.0,标准均方误在1年、3年和5年分别为1.21、1.10和1.03,不如用Gamma分布分类好。又考虑到降水量不遵从正态分布,以后的试验,判别方法仅使用Gamma分布分类。
对夏季气温进行恢复试验。由于气温分布较好的遵从正态分布,所以不需要作Gamm转换。使用判别分析方法时,使用正态分布分类。不同方法试验平均平方根误差比较情况见表 2。
表 2 东北地区夏季气温恢复试验均方误与标准均方误的比较从表 2 中可见,气温的恢复中,回归分析恢复效果比较稳定,随F的取值变化不大。可能因为气温较好遵从正态分布,恢复效果较好。但是判别分析方法的恢复在F值为2.0时有更好的效果。不同方法与夏季降水量的恢复比较中,气温的恢复有更小的误差。
3. 东北地区用邻站作夏季降水量与气温的恢复方法试验
考虑到气候要素的地域的均一性,相同地区的气候变化应该是相似的,选择的因子站应该是恢复对象站的邻近站点。因此我们把东北地区的22个测站,按地理经纬度转换为直角坐标,用欧氏距离最短的方法选取对象站周围的站点。试验时,考虑到邻站不宜离试验站太远,所以邻站因子站试验数取3~6站。由于不是按因子对方程的贡献大小选择因子,而是以邻站选择因子,所以两方法均取F=0.0,即因子全部进入方程,即使用多元回归或多元判别方法进行。不同方法的均方误和标准均方误比较见表 3。
表 3 东北地区22站取最近邻站站数恢复试验夏季降水量的平均平方根误差比较从表 3 可见,使用回归方法,选择3个邻站的3年的降水量恢复中有较小误差,其标准均方误大体比从22个站用F值选取因子的均方误要小些。使用判别方法,选择3个邻站1~5年的降水量恢复有较小误差。而且效果比回归分析方法要好,其标准均方误也比从22个站用F值逐步选取因子的均方误要小。说明邻站使用判别方法恢复方案恢复效果较好。
类似地对夏季气温进行恢复试验,其中使用判别方法时,分类方法直接用正态分布分类。不同方法试验结果见表 4。
从表 4 可见,邻站选择在气温恢复中,回归方法选择6个邻站的气温恢复有较小的误差,其标准均方误大体比22个站用F值选取因子的要小。与使用判别分析方法比较,虽然在1年的恢复中,其效果不如回归方法。但是在选择5个邻站的3~5年的气温恢复中,比回归方法误差小。而且在5~6邻站中,均方误变化不大,效果也比回归方法稳定。因此确定使用判别方法选取5个邻站作为气温恢复的主要方法。
表 4 东北地区22站取最近邻站站数恢复试验夏季气温的均方误与标准均方误比较4. 用邻站作全国夏季降水量与气温的恢复试验
由上述试验发现,用邻站作夏季降水量与气温的恢复方法试验,有较好的效果。而且邻站的恢复有更好的物理意义。因此用邻站恢复方案,同样地使用上述两种方法对我国其他5个气候地区作降水量和气温恢复的试验。根据东北地区的试验结果,还考虑到降水量邻站的均匀性不如气温好,选择3个邻站恢复降水量,气温的恢复则选取5个邻站进行恢复。由于各区地理位置不同,仅比较它们的标准均方误。降水量和气温恢复试验结果见表 5 和表 6。
从表中比较发现,华北地区由于汛期降水量变化大,恢复误差很大,而华南地区降水量变化小,恢复的误差小。气温恢复则由于同样原因,新疆地区气温变化大,恢复误差大。东北地区夏季气温变化小,恢复效果较好。使用判别方法,各地区气温和降水量的恢复值约在1倍标准差范围内变化。
表 5 不同方法对不同地区夏季降水量的恢复试验样本标准均方误误差比较表 6 不同方法对不同地区夏季气温的恢复试验样本标准均方误误差比较用回归方法,作1~5年的降水量恢复试验,有4个地区恢复效果不如判别方法。作1~5年的降水气温恢复试验,除东北地区1年试验略好外,其余地区各年恢复效果不如判别方法。因此,使用邻站的多元判别方法有较好的效果,可以在我国夏季降水量和气温恢复中实际应用。
5. 结论
本文对我国汛期降水量和气温缺测资料及资料均一性恢复的方法进行试验研究。对单个气候地区(东北区),以及全国6个气候地区分别用逐步回归和逐步判别方法进行缺测1~5年恢复试验。有如下结果:
(1) 对东北地区内所有站点试验表明,使用双重检验F值,进行引入和筛选因子,发现逐步判别分析方法比逐步回归分析的方法恢复效果好些。
(2) 对东北地区内所有站选择邻站建立恢复模型,结果发现无论回归分析还是判别分析,恢复效果均比使用F值筛选因子的恢复方案好。
(3) 对东北地区内所有站选择邻站建立恢复模型,结果发现判别分析比回归分析恢复效果好。降水量与气温的恢复,邻站数分别选取3和5有较好的效果。
(4) 对不同地区判别分析恢复试验表明,夏季降水量和气温的恢复,以华南和东北地区有较好的效果。
-
表 1 东北地区夏季降水量不同方法试验样本均方误与标准均方误的比较
表 2 东北地区夏季气温恢复试验均方误与标准均方误的比较
表 3 东北地区22站取最近邻站站数恢复试验夏季降水量的平均平方根误差比较
表 4 东北地区22站取最近邻站站数恢复试验夏季气温的均方误与标准均方误比较
表 5 不同方法对不同地区夏季降水量的恢复试验样本标准均方误误差比较
表 6 不同方法对不同地区夏季气温的恢复试验样本标准均方误误差比较
-
Peterson T, David R E, Karl T R, et al. Homogeneity adjustments of in site atmospheric climate data: a review. Int. J. Climatol. 1998, 18: 1493~1517.
曾红玲,高新全, 戴新刚. 近20年全球冬、夏海平面气压场和500 hPa高度场年代际变化特征分析.高原气象, 2002, 21(1): 66~73. http://www.cnki.com.cn/Article/CJFDTOTAL-GYQX200201010.htm 黄荣辉等. 我国夏季降水的年代际变化及华北干旱化趋势. 高原气象, 1999,18(4): 465~476. http://www.cnki.com.cn/Article/CJFDTOTAL-GYQX199904000.htm 施能,陈家其,屠其璞. 中国近100年来4个年代际的气候变化特征. 气象学报, 1995,53(4):431~439. http://www.cnki.com.cn/Article/CJFDTOTAL-QXXB504.005.htm 李崇银, 李桂龙, 龙振夏. 中国气候年代际变化的大气环流形势对比分析. 应用气象学报, 1999,10(增刊): 1~8. http://www.cnki.com.cn/Article/CJFDTOTAL-YYQX9S1.000.htm Potter K W. Illustration of a new test for detecting a shift in mean in precipitation series. Mon. Wea. Rev., 1981,109: 2040~2045.
Easterling D R, Peterson T C. A new method for detecting undocumented discontinuities in climatological time series. Int. J. Climatol. 1995, 15: 369~377.
Young K C. A three-way model for interpolating for monthly precipitation values. Mon. Wea. Rev., 1992, 120: 2561~2569.
黄嘉佑. 气象统计分析与预报方法. 北京:气象出版社, 2000. 302. 黄茂怡,黄嘉佑. CCA对中国夏季降水场的预报试验和诊断结果.应用气象学报,2000, 11(增刊): 31~39. http://www.cnki.com.cn/Article/CJFDTOTAL-YYQX2000S1003.htm 中央气象局等.中国近五百年旱涝分布图集. 北京:地图出版社, 1980. 黄嘉佑.一种用于旱涝分析的降水概率指标--Gamma分布概率指标. 气象, 1990,16(9): 3~12. http://www.cnki.com.cn/Article/CJFDTOTAL-QXXX199009004.htm
计量
- 文章访问数: 3185
- HTML全文浏览量: 632
- PDF下载量: 1811