热带气旋频数的二次型预测模型
Binomial Climate Prediction Model of Tropical Cyclone Frequency
-
摘要: 使用1951—2005年北半球500 hPa高度场格点资料、1949—2005年海温场 (SST) 格点资料, 计算与后期热带气旋发生频数的相关系数, 分析两个相关场显著相关区的统计特征, 进一步分析其天气气候学意义和物理意义。选取若干相关系数高的格点, 构成组合因子, 建立二次型曲线预测方程, 进行西北太平洋、南海及登陆我国、登陆广东的热带气旋年月频数的预测。预测试验和检验表明, 二次型预测模型有较高的拟合能力, 在业务应用中有较好的效果。Abstract: There are about 28 tropical cyclones per year over the Northwest Pacific Ocean and 7 tropical cyclones per year which make landfall or have significant impacts on China. Tropical cyclones lead to huge damages and economic losses. Accurate prediction of the tropical cyclone (TC) in advance would be a powerful tool in disaster preparedness and prevention.Based on the monthly mean 500 hPa geopotential height in Northern Hemisphere during 1951—2005 of 10°×10° grid points between 10°N and 85°N, monthly mean sea-surface temperature (SST) of the Pacific Ocean during 1949—2005 of 5°×5° grid points between 10°S and 50°N, monthly and annual numbers of TC over the Northwest Pacific Ocean, South China Sea, and TCs make landfalls or generate significant impacts on China or Guangdong Province during 1951—2005, the correlation coefficients between them are calculated. By analyzing the spatial distribution of the correlation coefficients between the TC frequency and the 500 hPa geopotential height and SST respectively, several key regions exist (over significant level of 5%). Those highly significant region's geographical locations are stable. The synoptic climatologically significance and the physical characteristics are investigated. Several high correlated factors are selected and combined and used to construct the binomial prediction equations to predict the TC's monthly and annual frequency in the Northwest Pacific Ocean, South China Sea, and landing ones in China and Guangdong Province respectively.The operational binomial climate prediction system is constructed and verified using the last 11-year data. The accuracy of the TC annual frequency predicted using the 500 hPa and SST is 79.6% and 77.3% respectively. The accuracy is 75.8% by using the preceding 500 hPa in November to predict the TC monthly frequency that lands in China from July to September during last 11 years.The results are as follows: Select the same sign factors to combine in the same group when two to four predictors are chosen. By analyzing high significance regions, it is found that the combined predictor method is preferable to the single sea analysis. The weighted regression ensemble analysis is superior to the general statistical methods, such as the stepwise regression analysis of principle components and empirical orthogonal function. The method has the statistical and physical significance. The prediction of the multinomial prediction equation is better than the linear prediction equation. In practice the binomial prediction equation is the best. The Binomial Climate Prediction Model can be used for many purposes and performs well.
-
引言
西北太平洋及我国南海是全球热带气旋发生最多的地区之一, 每年有28个左右的热带气旋生成, 7个热带气旋在我国登陆。广东是我国热带气旋登陆最多的省份, 平均每年有5个, 造成的直接经济损失年平均为人民币83亿元, 1996年经济损失高达200亿元, 居广东各种自然灾害之首。随着我国进入WTO, 海洋航运、海洋捕捞养殖、南海石油开发、海上救捞等海上经济活动的增加, 对海洋气象预报要求越来越高, 特别是登陆台风往往造成国民经济和生命财产的重大损失。因此热带气旋活动是短期气候变化研究重要课题之一。
许多学者对热带气旋频数与大气环流[1-2]、海温场的关系[3-5]进行分析, 得到许多研究成果。研究的方法有两种: 一种是以时间序列为主的周期分析方法[6-7]; 另一种是以相关分析为主的预报方法, 如刘春霞对广东热带气旋频数异常成因进行相关分析[8], 谢炯光用海温建立了广东初始、终止台风的预报方程[9]。但是这些研究多数只是分析海温及ENSO与热带气旋的相关关系, 以及定性的预测。本文根据业务实践经验, 以周期和韵律为线索, 深入分析热带气旋频数与海温场和大气环流的相关关系, 找出具有天气气候意义和物理意义的因子, 并重点讨论建立热带气旋频数的二次型预测模型的理论和方法, 及其在实际业务中的应用效果。
1. 资料
预报因子文件包括①海温场格点资料: 使用1949—2005年太平洋12个月海温场 (10°S~50°N, 120°E~80°W)5°×5°的286个格点资料作为预报因子场, 共57年样本资料; ②北半球高度格点资料: 使用1951—2005年 (11月、12月、1—5月) 北半球10°~85°N 500 hPa东、西半球10°×10°的576个格点资料作为预测因子场, 共55年样本资料。
根据服务需要建立西北太平洋热带气旋年、月个数, 南海热带气旋年、月个数, 登陆我国热带气旋年、月个数, 登陆广东等热带气旋年、月个数等, 共4个预测对象文件。
2. 热带气旋频数与前期高度场和海温场的相关分析
2.1 热带气旋频数与高度场相关分析
通过近10年的试验和相关分析表明, 前期各月份的高度场格点与后期预报对象热带气旋分别存在着若干相关系数比较大 (通过0.05或0.01检验) 的关键区, 且关键区区域稳定。
以12月500 hPa高度场与次年登陆我国的热带气旋年频数相关系数图为例, 从1995—2004年共10年的相关系数图中, 可以找出分别位于北大西洋的正相关关键区, 格陵兰海、日本海附近的负相关关键区等3个关键区 (图 1)。可以使用关键区的格点资料进行登陆我国的热带气旋年频数预测。
2.2 热带气旋频数与海温场相关分析
通过近10年的试验和相关分析表明, 前期各月的海温场与后期预测对象热带气旋分别存在着若干相关系数比较大 (通过0.05或0.01检验) 的关键区, 且关键区区域稳定。
以12月海温场与次年南海的热带气旋年频数的相关系数图为例, 从1995—2004年共10年的相关系数图中, 可以找出分别位于28°~30°N, 148°~152°E附近的负相关关键区, 38°~42°N, 187°~192° E附近的正相关关键区以及225°~235°E的赤道附近正相关关键区等3个关键区 (见图 2)。可以使用关键区的格点资料进行南海的热带气旋年频数预测。
3. 热带气旋频数的二次型预测模型
20世纪70年代和80年代热带气旋活动的预测多采用方差分析、多元线性回归、逐步回归等线性预测模型, 90年代后期, 随着统计方法的发展, 非线性预测模型有了进一步的广泛应用。本文将介绍二次型预测模型[10]作热带气旋频数的预测原理和预测方法。
3.1 组合因子的建立
本方法是计算某月500 hPa高度场 (或某月SST海温场) 与热带气旋的年、月个数的相关系数, 挑选6到12个通过相关系数信度检验为0.05的格点, 每3个格点值组合为一个因子, 计算组合因子与预测对象的相关系数。下面以11月500 hPa高度场格点资料为预测因子, 次年8月登陆我国 (热带风暴以上级别的) 热带气旋个数为预测对象为例, 说明预测原理及操作方法。
经普查, 11月高度场有如下12个格点21, 22, 23, 56, 57, 58, 110, 111, 112, 435, 458, 475, 与预测对象的相关系数分别是-0.340, -0.335, -0.347, -0.360, -0.355, -0.344, 0.304, 0.319, 0.282, 0.334, 0.276, 0.361。每3个格点值组合为一个因子, 即:
(1) (2) (3) (4) XA, XB, XC, XD与预测对象Y的相关系数分别是:
RA=-0.342, RB=-0.359, RC=0.308, RD=0.504。
显然组合因子的相关系数与原来3个格点的相关系数比较, 大多数绝对值大。也就是拟合和预测能力有明显提高, 而且较稳定。
3.2 用组合因子建立权重回归方程
如上述4个组合因子XA, XB, XC, XD, 其相关系数为RA, RB, RC, RD。
令相关系数绝对值之和为E, 则E=∣RA∣+∣RB∣+∣RC∣+∣RD∣=1.513, 权重回归系数为WA=RA/E=-0.2262, WB=RB/E=-0.2371, WC=RC/E=0.2032, WD=RD/E=0.3334。
权重回归方程为:
(5) 上述回归方程综合了4个组合因子。计算Y1与预测对象Y的相关系数RY1=0.459。相关系数RY1比各单因子和各组合因子的相关系数大多数有明显的提高。
3.3 多次型曲线模拟热带气旋频数的气候规律及预测
统计学理论和实践表明, 非线性回归更能反映预测对象与因子的相关关系。多次型回归在统计中有着特殊的地位。因为任何函数 (或复杂问题) 都可用正交多项式回归进行分析、计算以及模拟。下面介绍二次型曲线模拟热带气旋频数的预测方法。
3.3.1 二次型方程的建立
由高度场格点资料代入式 (1) 到式 (5) 得到自变量Y1和预测对象Y是按等时间取样的等间隔值。适用正交多项式。
(6) 式 (6) 中, Yt为预测对象 (即热带气旋频数), Xt为高度场格点的综合预测因子。令X=Y1, 系数a0, a1, a2, …, ak由正规方程组求得。
将式 (5) 计算得到的Y1历史资料, 作为预测因子, 代入式 (6), 可求得二阶预报方程, 也就是二次型方程:
(7) 式 (7) 中, Y与X的相关系数RY2=0.578, 对比相关系数RY1, 有明显提高。这符合非线性预测的突变理论。
3.3.2 二次型方程的拟合情况
一般来说, 相关系数越高, 预测对象与预测因子的拟合率越高, 即Y与X有式 (7) 的分布规律。图 3是1952—1994年11月500 hPa高度场与次年8月登陆我国热带气旋频数的拟合曲线和实况曲线的对比。以拟合值与实况的绝对误差值小于1评定为正确, 评定1952—1994年的8月登陆我国热带气旋月个数拟合率是34/43=79%。
3.3.3 二次型方程的预测
将1994年11月12个高度场格点资料: -1, -2, -2, 1, 1, 0, 49, 49, 46, 85, 86, 88分别代入式 (1)~式 (4) 后, 再代入式 (5) 可得X=116.2766。
将X=116.2766代入式 (7), 得到1995年8月登陆我国热带气旋频数预测值: Y=5.019个。
8月登陆我国热带气旋数多年平均值为1.8个, 而1995年8月登陆我国带气旋实况有5个, 是历史的极大值。
4. 热带气旋频数的气候预测系统
上述二次型预测模型其优点是能够简便地进行相关分析, 容易选到通过信度为0.05的相关系数检验的预测因子格点资料; 二次型曲线拟合率高; 多年试验预测实际效果好。因此建立热带气旋频数二次型气候预测系统, 简称热带气旋预测系统。
热带气旋预测系统主要功能: 普查500 hPa高度场格点资料、海温场 (SST) 格点资料与热带气旋年、月频数的相关系数; 选取2~4个组合因子; 建立二次型预测方程; 显示预测过程和结果。
5. 预测结果和验证
热带气旋预测系统分别用500 hPa高度场格点资料、海温场 (SST) 格点资料, 制作 (太平洋、南海、我国、广东)4个预报对象的年、月热带气旋频数预测。一般来说, 当绝对误差小于该预测对象历年平均值的30%, 评定预测准确。表 1中误差栏中误差值标有*的, 预测误差大, 评定当年预测为错。太平洋、登陆我国 (热带风暴级别以上)、南海、登陆广东的历年热带气旋平均频数分别是27.6, 7.1, 10.2, 5.3;评定年频数标准 (历年平均值的30%) 分别是4.0, 2.1, 3.0, 1.6。
表 1 12月海温预测热带气旋年频数结果验证Table 1. Verification of the tropical cyclone annual frequency prediction using the preceding SST in December5.1 用海温格点资料作热带气旋的年频数预测结果验证
使用12月海温资料做1995—2005年热带气旋年频数的预测结果验证, 如表 1所示。
评定表明, 用海温资料做热带气旋年频数预测, 11年预测准确率为35/44=79.5%。这里特别指出1998年太平洋热带气旋年频数只有14个, 是极小值, 而预测系统报15个, 说明热带气旋频数的气候预测系统有预测极值的能力。
5.2 500 hPa格点资料作热带气旋年频数预测结果验证
使用11月500 hPa资料做1995—2005年热带气旋年频数预测结果验证, 如表 2所示。
表 2 11月500 hPa预测热带气旋的年频数结果验证Table 2. Verification of the tropical cyclone annual frequency prediction using the preceding 500 hPa in November评定表明, 用500 hPa格点资料做热带气旋年个数预测, 11年预测准确率为34/44=77.3%。
5.3 热带气旋的月频数预测结果验证
下面是1995—2005年, 使用11月500 hPa高度场格点资料作为预测因子, 预测7—9月登陆我国 (热带风暴以上级别的) 热带气旋频数, 其预测结果的验证如表 3所示。
表 3 7—9月份登陆我国热带气旋月频数预测验证Table 3. Verification of the tropical cyclone monthly frequency prediction from July to September据表 3资料, 若预测误差的绝对值 < 1.5时, 评定为预测正确。根据这个标准, 评定1995—2005年的7—9月, 登陆我国热带气旋月个数预测准确率是25/33=75.8%。
6. 结束语
研究表明, 已建立热带气旋年月频数的气候预测系统, 在近几年实际应用中有较好的参考意义。使用二次型预测系统有如下经验:
1) 选取2~4个组合因子时, 要注意同一组合的因子, 其符号要相同。
2) 通过高相关关键区分析选取组合预测因子法优于常用的分海区分析法, 权重回归综合分析优于常用的经验正交函数 (EOF) 分析或主分量分析方法。因其方法可较大地提高拟合因子的相关系数, 易于建立客观定量的预测方程。
3) 使用权重回归综合分析海温、高度场资料与热带气旋年月频数, 建立二次型预报方程的方法, 有较好的物理意义和统计意义, 其方法方便易用。
4) 多次型预测方程对极值的预测能力优于常用的线性回归方程。经多年试验和预报实践, 热带气旋的年月频数预测, 以二次为宜, 因此建立二次型预测模型做热带气旋频数的气候预测。
5) 二次型热带气旋年月频数气候预测系统可以根据不同的业务需要, 做相应的客观定量预测, 也可推广应用到其他类型的气候预测中, 如短期气候降水预测等。
-
表 1 12月海温预测热带气旋年频数结果验证
Table 1 Verification of the tropical cyclone annual frequency prediction using the preceding SST in December
表 2 11月500 hPa预测热带气旋的年频数结果验证
Table 2 Verification of the tropical cyclone annual frequency prediction using the preceding 500 hPa in November
表 3 7—9月份登陆我国热带气旋月频数预测验证
Table 3 Verification of the tropical cyclone monthly frequency prediction from July to September
-