留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于ECMWF产品的站点气温预报集成学习误差订正

陈昱文 黄小猛 李熠 陈悦 徐挚仁 黄兴

引用本文:
Citation:

基于ECMWF产品的站点气温预报集成学习误差订正

Ensemble Learning for Bias Correction of Station Temperature Forecast Based on ECMWF Products

  • 摘要: 提出一种基于数值模式预报产品的气温预报集成学习误差订正方法,通过人工神经网络、长短期记忆网络和线性回归模型组合出新的集成学习模型(ALS模型),采用2013—2017年的欧洲中期天气预报中心数值天气预报模式2 m气温预报产品和中国部分气象站点数据,利用气象站点气温、风速、气压、相对湿度4个观测要素,挖掘观测数据的时序特征并结合模式2 m气温预报结果训练机器学习模型,对2018年模式2 m气温6~168 h格点预报产品插值到站点后的预报结果进行偏差订正。结果表明:ALS模型可将站点气温预报整体均方根误差由3.11℃降至2.50℃,降幅达0.61℃(19.6%),而传统的线性回归模型降幅为0.23℃(8.4%)。ALS模型对站点气温预报误差较大的区域和气温峰值预报的订正效果尤为显著,因此,集成学习方法在数值模式预报结果订正中具有较大的应用潜力。
  • 图 1  ALS模型结构

    Fig.1  The structure of ALS model

    图 2  不同模型订正结果相对站点气温预报改善率分布

    (蓝色表示订正改善率为正,红色表示订正改善率为负)

    Fig.2  average correction improvement rate of different models compared to station temperature forecast

    (the blue denotes a positive correction improvement rate, the red denotes a negative correction improvement rate)

    图 3  2018年6—8月贵阳站、原平站、福州站、台南站72 h气温预报与观测对比

    Fig.3  Comparison of temperature forecast with lead time of 72 h to the observation at Guiyang, Yuanping, Fuzhou and Tainan from Jun to Aug in 2018

    图 4  2018年7月15—22日贵阳站、原平站、福州站和台南站气温预报整体均方根误差对比

    Fig.4  Comparison of averaged root mean square error of temperature forecast at Guiyang, Yuanping, Fuzhou and Tainan from 15 Jul to 22 Jul in 2018

    表 1  2018年不同预报时效的气温预报均方根误差(单位:℃)

    Table 1.  Root mean square error of temperature forecast with different lead times in 2018(unit:℃)

    预报时效/h站点气温预报LR模型ANN模型LSTM-FCN模型ALS模型
    6~242.732.111.841.861.81
    30~482.872.482.262.242.20
    54~722.982.642.452.432.38
    78~963.082.762.652.562.53
    102~1203.192.872.742.682.66
    126~1443.353.022.932.862.83
    150~1683.573.203.143.073.05
    下载: 导出CSV

    表 2  2018年6—8月4个站72 h预报时效气温预报均方根误差(单位:℃)

    Table 2.  Root mean square error of temperature forecast with lead time of 72 h at 4 stations from Jun to Aug in 2018(unit:℃)

    站点站点气温预报LR模型ANN模型LSTM-FCN模型ALS模型
    贵阳站2.021.571.551.481.48
    原平站4.152.882.632.642.60
    福州站2.821.881.801.751.75
    台南站1.861.611.551.491.49
    下载: 导出CSV
  • [1] Bauer P, Thorpe A, Brunet G.The quiet revolution of numerical weather prediction.Nature, 2015, 525(7567):47. 
    [2] Lynch P.The origins of computer weather prediction and climate modeling.Journal of Computational Physics, 2008, 227(7):3431-3444. 
    [3] Glahn H R, Lowry D A.The use of model output statistics (MOS) in objective weather forecasting.J Appl Meteor, 1972, 11(8):1203-1211. 
    [4] 薛谌彬, 陈娴, 张瑛, 等.ECMWF高分辨率模式2 m温度预报误差订正方法研究.气象, 2019, 45(6):831-842. 
    [5] 张玉涛, 佟华, 孙健.一种偏差订正方法在平昌冬奥会气象预报的应用.应用气象学报, 2020, 31(1):27-41. 
    [6] 吴启树, 韩美, 郭弘, 等.MOS温度预报中最优训练期方案.应用气象学报, 2016, 27(4):426-434. 
    [7] 刘还珠, 赵声蓉, 陆志善, 等.国家气象中心气象要素的客观预报——MOS系统.应用气象学报, 2004, 15(2):181-191. 
    [8] Overpeck J T, Meehl G A, Bony S, et al.Climate data challenges in the 21st century.Science, 2011, 331(6018):700-702. 
    [9] Zurada J M.Introduction to Artificial Neural Systems.St Paul:West Publishing Company, 1992.
    [10] Gers F A, Schmidhuber J, Cummins F.Learning to forget:Continual prediction with LSTM.Neural Computation, 12(10):2451-2471. 
    [11] Krizhevsky A, Sutskever I, Hinton G E.Imagenet Classification with Deep Convolutional Neural Networks//Advances in Neural Information Processing Systems, 2012: 1097-1105.
    [12] Reichstein M, Camps-Valls G, Stevens B, et al.Deep learning and process understanding for data-driven earth system science.Nature, 2019, 566(7743):195. 
    [13] Scher S.Toward data-driven weather and climate forecasting:approximating a simple general circulation model with deep learning.Geophys Res Lett, 2018, 45(22):12616-12622. 
    [14] Rasp S, Pritchard M S, Gentine P.Deep learning to represent subgrid processes in climate models.Proceedings of the National Academy of Sciences, 2018, 115(39):9684-9689.
    [15] Ham Y G, Kim J H, Luo J J.Deep learning for multi-year ENSO forecasts.Nature, 2019, 573(7775):568-572. 
    [16] Pan B, Hsu K, AghaKouchak A, et al.Improving precipitation estimation using convolutional neural network.Water Resources Research, 2019, 55(3):2301-2321. 
    [17] 王彦磊, 曹炳伟, 黄兵, 等.基于神经网络的单站雾预报试验.应用气象学报, 2010, 21(1):110-114. 
    [18] 闵晶晶, 孙景荣, 刘还珠, 等.一种改进的BP算法及在降水预报中的应用.应用气象学报, 2010, 21(1):55-62. 
    [19] 杨璐, 韩丰, 陈明轩, 等.基于支持向量机的雷暴大风识别方法.应用气象学报, 2018, 29(6):680-689. 
    [20] Runge J, Bathiany S, Bollt E, et al.Inferring causation from time series in earth system sciences.Nature Communications, 2019, 10(1):2553. 
    [21] Liu Y, Racah E, Correa J, et al.Application of Deep Convolutional Neural Networks for Detecting Extreme Weather in Climate Datasets.arXiv Preprint arXiv: 1605.01156, 2016.
    [22] Polikar R.Ensemble Learning.Boston:Springer, 2012:1-34.
    [23] Bougeault P, Toth Z, Bishop C, et al.The THORPEX interactive grand global ensemble.Bull Amer Meteor Soc, 2010, 91(8):1059-1072. 
    [24] Swinbank R, Kyouda M, Buchanan P, et al.The TIGGE project and its achievements.Bull Amer Meteor Soc, 2016, 97(1):49-67. 
    [25] Myers D E.Spatial interpolation:An overview.Geoderma, 1994, 62(1-3):17-28. 
    [26] 高歌, 龚乐冰, 赵珊珊, 等.日降水量空间插值方法研究.应用气象学报, 2007, 18(5):732-736. 
    [27] 彭彬, 周艳莲, 高苹, 等.气温插值中不同空间插值方法的适用性分析——以江苏省为例.地球信息科学学报, 2011, 13(4):539-548. 
    [28] 潘留杰, 薛春芳, 王建鹏, 等.一个简单的格点温度预报订正方法.气象, 2017, 43(12):1584-1593. 
    [29] Karlik B, Olgac A V.Performance analysis of various activation functions in generalized MLP architectures of neural networks.International Journal of Artificial Intelligence and Expert Systems, 2011, 1(4):111-122. 
    [30] Nair V, Hinton G E.Rectified Linear Units Improve Restricted Boltzmann Machines//Proceedings of the 27th International Conference on Machine Learning (ICML-10), 2010: 807-814.
    [31] Connor J T, Martin R D, Atlas L E.Recurrent neural networks and robust time series prediction.IEEE Transactions on Neural Networks, 1994, 5(2):240-254. 
    [32] 韩丰, 龙明盛, 李月安, 等.循环神经网络在雷达临近预报中的应用.应用气象学报, 2019, 30(1):61-69. 
    [33] Qing X, Niu Y.Hourly day-ahead solar irradiance prediction using weather forecasts by LSTM.Energy, 2018, 148:461-468. 
    [34] Cao Y, Gui L.Multi-step Wind Power Forecasting Model Using LSTM Networks, Similar Time Series and LightGBM//5th International Conference on Systems and Informatics (ICSAI).IEEE, 2018:192-197.
    [35] Shi X, Chen Z, Wang H, et al.Convolutional LSTM Network: A Machine Learning Approach for Precipitation Nowcasting//Advances in Neural Information Processing Systems, 2015: 802-810.
    [36] Woźniak M, Graña M, Corchado E.A survey of multiple classifier systems as hybrid systems.Information Fusion, 2014, 16:3-17. 
    [37] Glahn H R, Lowry D A.The use of model output statistics (MOS) in objective weather forecasting.J Appl Meteor, 1972, 11(8):1203-1211. 
    [38] 曾晓青, 薛峰, 姚莉, 等.针对模式风场的格点预报订正方案对比.应用气象学报, 2019, 30(1):49-60. 
    [39] Marzban C, Sandgathe S, Kalnay E.MOS, perfect prog, and reanalysis.Mon Wea Rev, 2006, 134(2):657-663. 
    [40] Hart K A, Steenburgh W J, Onton D J, et al.An evaluation of mesoscale-model-based model output statistics (MOS) during the 2002 Olympic and Paralympic Winter Games.Wea Forecasting, 2004, 19(2):200-218. 
    [41] 王秀娟, 陈长胜, 冯旭, 等.一阶卡尔曼滤波方法对EC集合预报气温的订正.气象灾害防御, 2019, 26(1):34-38. 
    [42] 肖玉华, 赵静, 蒋丽娟.数值模式预报性能的地域性特点初步分析.暴雨灾害, 2010, 29(4):322-327. 
    [43] 章大全, 郑志海, 陈丽娟, 等.10~30 d延伸期可预报性与预报方法研究进展.应用气象学报, 2019, 30(4):416-430. 
  • [1] 仇永炎等著.  评《中期天气预报》 . 应用气象学报, 1986, 1(2): 219-220.
    [2] 牟惟丰,  杨元琴,  宋文英.  欧洲中期天气预报中心数值预报图的检验 . 应用气象学报, 1987, 2(1): 24-35.
    [3] 郑庆林.  非线性平衡方程初值化方法及其在中期数值天气预报试验中的应用 . 应用气象学报, 1987, 2(2): 113-122.
    [4] 章文茜,  陈明萱.  逐步综合决策的天气预报模式 . 应用气象学报, 1986, 1(2): 212-218.
    [5] 郑庆林.  一个全球七层大气环流谱模式及其30天长期数值天气预报试验 . 应用气象学报, 1989, 4(3): 234-246.
    [6] 吴正华,  葛润生,  许焕斌,  陈奕隆.  京、津、冀中尺度危害性天气监测和超短期预报试验计划梗概 . 应用气象学报, 1986, 1(1): 107-110.
    [7] 郑庆林.  北半球七层原始方程谱模式(三)及其五天中期数值预报试验 . 应用气象学报, 1989, 4(1): 1-12.
    [8] 赵其庚,  郑庆林.  北半球七层初始方程谱模式在制作有限区数值预报中的应用 . 应用气象学报, 1988, 3(1): 17-24.
    [9] 陶诗言.  评《台风预报手册》 . 应用气象学报, 1988, 3(2): 223-224.
    [10] 杨洪昌,  杨喜寿,  徐淑云.  回归预报方程优良性的判断 . 应用气象学报, 1987, 2(2): 174-181.
    [11] 任广成.  夏季鄂海高压的长期预报研究 . 应用气象学报, 1989, 4(2): 193-198.
    [12] 费亮,  吴天泉,  徐静远.  我国台风业务预报的评价 . 应用气象学报, 1989, 4(3): 319-327.
    [13] 金一鸣,  蔡金祥,  刘宁生.  西北太平洋副热带高压强度的统计预报 . 应用气象学报, 1986, 1(1): 18-25.
    [14] 陈孝源,  俞善贤.  基于预测均方误差为最小的梅雨期长度统计预报模型 . 应用气象学报, 1988, 3(1): 100-104.
    [15] 张恩恕,  汤兵勇,  韩志刚.  西太平洋夏季副高积分多层递阶长期预报模型 . 应用气象学报, 1989, 4(1): 69-74.
    [16] 赵四强.  农作物产量预报的马尔柯夫链方法 . 应用气象学报, 1989, 4(1): 103-107.
    [17] 王石立,  王馥棠.  指数平滑法在产量趋势预报中应用的探讨 . 应用气象学报, 1989, 4(2): 178-185.
    [18] 陈桂英,  李小泉,  林本达.  地气耦合非定常距平模式的准业务预报试验 . 应用气象学报, 1990, 1(1): 24-33.
    [19] 王鹏举,  周秀骥.  陆地上空大气温度廓线及地面辐射参数的卫星遥感 . 应用气象学报, 1988, 3(2): 120-128.
    [20] 席林华.  多层递阶方法及其与谐谱分析结合作梅雨期大-暴雨中期预报试验 . 应用气象学报, 1987, 2(2): 220-224.
  • 加载中
图(4) / 表(2)
计量
  • 文章访问数:  565
  • HTML全文浏览量:  452
  • PDF下载量:  9
  • 被引次数: 0
出版历程
  • 收稿日期:  2020-01-15
  • 修回日期:  2020-04-09
  • 刊出日期:  2020-07-31

基于ECMWF产品的站点气温预报集成学习误差订正

  • 1. 清华大学地球系统科学系地球系统数值模拟教育部重点实验室, 北京 100084
  • 2. 国家超级计算无锡中心, 无锡 214011

摘要: 提出一种基于数值模式预报产品的气温预报集成学习误差订正方法,通过人工神经网络、长短期记忆网络和线性回归模型组合出新的集成学习模型(ALS模型),采用2013—2017年的欧洲中期天气预报中心数值天气预报模式2 m气温预报产品和中国部分气象站点数据,利用气象站点气温、风速、气压、相对湿度4个观测要素,挖掘观测数据的时序特征并结合模式2 m气温预报结果训练机器学习模型,对2018年模式2 m气温6~168 h格点预报产品插值到站点后的预报结果进行偏差订正。结果表明:ALS模型可将站点气温预报整体均方根误差由3.11℃降至2.50℃,降幅达0.61℃(19.6%),而传统的线性回归模型降幅为0.23℃(8.4%)。ALS模型对站点气温预报误差较大的区域和气温峰值预报的订正效果尤为显著,因此,集成学习方法在数值模式预报结果订正中具有较大的应用潜力。

English Abstract

    • 天气变化对人们的生产生活有重要影响。气温预报作为天气预报的核心要素之一备受关注。社会发展和人民生活水平的提高,对气温预报的精度提出了更高要求。气温的准确预报不仅对霜冻等灾害性天气的防灾减灾起重要的指导作用,在诸多公共服务领域,准确的气温预报也不可或缺。

      过去几十年中,得益于数值天气预报模式、观测系统和同化技术的发展,数值天气预报精度得到极大提升[1],成为天气预报的重要手段。尽管如此,受制于不完善的物理框架、物理参数化方案和初始、边界条件,数值天气预报精度在很多情况下不尽如人意[1-2]。基于Glahn等[3]的开拓性工作,模式输出统计(Model Output Statistics,MOS)方法现已广泛应用于模式结果修正中[4-7]。MOS方法通过挖掘气象观测要素与数值预报间的关系,对原始的模式输出结果进行处理。但随着观测数据和模式产品种类的增多,常规方法难以应对数据多样性的弊端逐渐显现[8]

      随着计算机技术和应用数学的发展,机器学习逐渐在众多任务中取得超越传统方法的效果。近年以人工神经网络(Artificial Neural Network,ANN)[9]、长短期记忆网络(Long Short-Term Memory,LSTM)[10]、卷积神经网络(Convolutional Neural Network,CNN)[11]等为代表的深度学习模型逐渐成为主流。机器学习方法也为地球科学领域的发展提供了新思路[12-13], 如数值模型次网格参数化方案优化[14]、天气或气候预报精度提升[15-18]、天气现象识别[19]、因果关系挖掘[20]以及极端天气检测[21]等。

      为提高数值天气预报模式的精度以及对极端事件的预报能力,本文提出一种基于集成学习方法(Ensemble Learning)[22]的模型对ECMWF(European Centre for Medium-Range Weather Forecast,欧洲中期天气预报中心)模式2 m气温预报产品插值到站点的6~168 h预报结果进行误差订正,检验该模型对不同时间尺度2 m气温预报的订正能力,并将其与传统的线性回归(Linear Regression,LR)模型进行对比。

    • 本文所用数值模式产品来自ECMWF的TIG-GE(The International Grand Global Ensemble)[23-24]项目,时间为2013年1月1日—2018年12月31日(共2191 d),水平分辨率为0.125°×0.125°。ECMWF模式每日00:00(世界时,下同)和12:00起报。本文选择了6~168 h(时间间隔为6 h)共28个预报时效的ECMWF 2 m气温预报产品,涵盖了从短时临近预报到中期预报。对于单一起报时刻、单一预报时效,数据样本量为2191。

      气象站点观测数据来源于www.meteomanz.com,覆盖中国除西藏、青海地区以外的其他地区,本文筛选出2018年观测时间超过半年的301个站点,时间为2013年1月1日—2018年12月31日,与模式产品一致。观测时次为每日8次,逐3 h正点观测(00:00, 03:00, 06:00, 09:00, 12:00, 15:00, 18:00, 21:00),观测要素包括气温、气压、相对湿度和风速。

    • 为充分挖掘不同特征和不同时刻数据对预报时刻气温的影响,本文对观测数据和模式预报产品进行处理, 作为后续机器学习模型的输入要素。

    • 本文对每个气象站点的观测数据进行以下处理:①对于每一个时刻的观测数据,将气温、风速、相对湿度和气压4个要素组成特征向量;②将T个历史时刻特征向量组成(TF)格式的时序观测特征矩阵,每一个时序观测特征矩阵即为一个机器学习模型输入样本,其中T为超参数,后续试验中统一使用24,F为4,表示每个时刻所使用的气象要素数量;③将S个时序观测特征矩阵组成(STF)的张量,作为机器学习模型输入,称为时序观测特征数据集,其中,S为样本量。以单一气象站点为例,在观测数据没有缺失的前提下,若使用连续3 d的历史观测数据,由于观测数据每日8个,则T=24,该站点每个预报时效、相同ECMWF模式起报时刻所对应使用的时序观测特征数据集格式为(2191,24,4)。

    • ECMWF模式预报产品为规则的网格化数据,为预报某一气象站点的气温,本文采用反距离权重法[25],使用距离目标站点最近的4个网格点的2 m气温进行插值,作为对目标站点的气温预报值,简称站点气温预报。反距离权重法简洁高效,广泛用于数值模式产品的插值处理中[26-28]

    • 机器学习方法是利用大量数据,通过合理的特征选取与模型选择,得到输入数据与目标输出的映射规律进行预报,其优势在于可挖掘站点所在区域各变量间的关系。而数值模式方法则是充分利用已有的物理学知识,通过离散后的微分方程进行预报。本文在构造数据集时将两者结合,用于训练机器学习模型。在后续使用的机器学习模型中,时序观测特征数据集与站点气温预报共同作为输入要素,以充分挖掘不同数据包含的信息。

    • 本文使用3个机器学习模型对站点气温预报进行误差订正,分别为人工神经网络(Artificial Neural Network,ANN)模型、长短时记忆-全连接(Long Short Term Memory-Fully Connected Network,LSTM-FCN)模型以及基于上述两个模型和集成学习方法的ANN-LSTM-Stacking集成学习模型(简称ALS模型),并以LR模型作为基准对比模型。模型训练指标为预报值与观测值间的均方根误差。

    • 本文使用集成学习方法,在ANN模型和LSTM-FCN模型基础上构建了ALS模型,对站点气温预报进行误差订正。ANN模型与LSTM-FCN模型既作为ALS模型的子模块,也作为对比模型,用于验证集成学习方法的有效性。

      ANN模型由多层的全连接神经网络(Fully Connected Neural Network,FCN)[9]构成,具体分为输入层、若干个隐含层和输出层。每层FCN由若干个神经元组成,层与层之间的神经元相互连接,当前层的神经元以前一层神经元的输出作为输入,每条连接均有一定权重,各输入向量与对应突出的权重相乘后再相加,输入到激活函数后得到输出。激活函数一般为非线性函数,常用的激活函数有tanh,sigmoid[29]和线性整流函数(Rectified Linear Unit, ReLU)[30]等。本文使用包含3个隐含层(各层神经元数量分别为512,64和32)的ANN模型,使用ReLU函数作为每个FCN层神经元的激活函数。本文将时序观测特征数据集的(S, T, F)张量转为(S, T×F)矩阵,结合站点气温预报,以(S, T×F+1)的矩阵作为ANN模型输入,模型输出层为气温预报订正结果。

      LSTM是循环神经网络(Recurrent Neural Network,RNN)[31]的变种,广泛用于数据时序关系挖掘,尤其适用于处理长时间序列问题。LSTM网络的结构与FCN类似,不同点在于一个LSTM网络层由若干个LSTM单元组成。一个LSTM单元由记忆细胞、遗忘门、输入门和输出门等组成,通过门控开关状态决定输出信息。气象观测数据作为典型的时序数据,已有相关工作将LSTM应用于天气预报领域,如临近预报[32]、太阳辐射[33]、短时风速[34]以及短时降雨预报[35]等。本文尝试使用LSTM提取观测数据的时序特征。LSTM的局限在于只能以时序数据作为输入,即只能使用由观测数据构建的(S, T, F)张量, 无法结合站点气温预报。为解决这一问题,本文设计了一个LSTM与FCN结合的机器学习模型LSTM-FCN,通过FCN层将LSTM挖掘的时序信息和站点气温预报结合。LSTM-FCN模型先将时序观测特征数据集输入到两层的LSTM(LSTM单元数量分别为256和64),之后将LSTM的输出结果与站点气温预报结合,输入到两层的FCN(神经元数量分别为256和32,激活函数为ReLU),得到最终订正结果。

      为进一步提升模型订正性能,本文在上述两个模型的基础上,使用Stacking方法[22],进行模型集成。Stacking属于集成学习的一种。集成学习通过使用多个机器学习模型获得相比单一模型更好的性能。随着计算机性能的提升,集成学习也在诸多领域得以广泛应用[36]。集成学习首先分别训练多个预测模型,然后以一定策略将多个模型的预测结果结合得到最终预报结果,通过集成多个模型,可以得到比单模型更好的泛化性能。针对回归问题,一种最简单直接的模型结合策略为平均法,即训练若干个模型后,对这些模型的预报结果取平均值作为最终预报结果。Stacking方法分为以下两个阶段:第1阶段训练多个不同的机器学习模型,分别得到各个模型对目标的预测结果;第2阶段将第1阶段训练的各个模型输出的结果作为输入要素再训练一个新模型作为组合器,以组合器的输出作为最终预报结果,常用的组合器有LR模型、ANN模型等。本文设计的ALS集成学习模型(图 1)第1阶段分别使用ANN模型和LSTM-FCN模型,针对站点气温预报进行模型训练和订正,得到两模型各自的气温订正结果;第2阶段以第1阶段两个模型的订正结果作为输入,训练LR模型,通过LR模型将第1阶段两模型的订正结果结合,以LR模型的输出作为最终气温订正结果。

      图  1  ALS模型结构

      Figure 1.  The structure of ALS model

    • LR模型是MOS方法中基本模型之一[37-39],本文构建了LR模型,模型的数据集输入格式与ANN相同,模型输出为气温订正值。针对每个预报时效的每个起报时刻构建一个模型,共56个模型,作为基准模型。

    • 以2013—2017年数据作为训练集,用于模型训练,并随机筛选其中20%的数据作为验证集;2018年数据作为测试集,用于检验模型性能。模型性能的评估标准:①模型订正值与观测值的均方根误差,②模型订正改善率(订正前后均方根误差的差值与订正前均方根误差之比)。

      本文选取6~168 h共28个预报时效的ECMWF预报产品插值到站点,得到站点气温预报,针对每个预报时效的两个起报时刻,分别训练ANN模型、LSTM-FCN模型和ALS模型(即每类分别训练56个模型,对应不同预报时效、不同ECMWF模式起报时刻),得到各模型不同预报时效2018年站点气温预报订正结果,进行评估。

      表 1为2018年气温预报不同订正模型的均方根误差,每4个预报时效分为1组,计算各模型组内平均均方根误差,6~24 h为第1组,150~168 h为第7组。站点气温预报28个预报时效的整体均方根误差为3.11℃。各类模型订正结果相对站点气温预报均有改善,LR模型将气温预报均方根误差整体降低至2.73℃,降幅为0.38℃(12.2%);ANN模型将气温预报均方根误差整体降低至2.53℃,降幅为0.58℃(18.6%);LSTM-FCN模型将气温预报均方根误差整体降低至2.57℃,降幅为0.54℃(17.4%);ALS模型将气温预报均方根误差整体降低至2.50℃,降幅为0.61℃(19.6%)。本文所使用的ANN模型与LSTM-FCN模型在预报精度上均超过LR模型。对比LR模型,LSTM-FCN模型将气温预报均方根误差整体降低0.15℃(5.5%),ANN模型将气温预报均方根误差整体降低0.20℃(7.3%)。在此基础上,ALS模型使气温预报均方根误差进一步降低, 相对LR模型整体降低0.23℃(8.4%), 相对ANN模型整体降低0.03℃(1.2%),相对LSTM-FCN模型整体降低0.08℃(3.1%)。

      表 1  2018年不同预报时效的气温预报均方根误差(单位:℃)

      Table 1.  Root mean square error of temperature forecast with different lead times in 2018(unit:℃)

      预报时效/h站点气温预报LR模型ANN模型LSTM-FCN模型ALS模型
      6~242.732.111.841.861.81
      30~482.872.482.262.242.20
      54~722.982.642.452.432.38
      78~963.082.762.652.562.53
      102~1203.192.872.742.682.66
      126~1443.353.022.932.862.83
      150~1683.573.203.143.073.05

      图 2分别为LR模型、ANN模型、LSTM-FCN模型和ALS模型在301个站点上相对站点气温预报改善率空间分布,蓝色表示订正改善率为正,红色表示订正改善率为负。从空间分布看,使用LR模型、LSTM-FCN模型和ANN模型分别有186个站点(61.8%)、211个站点(70.1%)和238个站点(79.1%)的整体订正效果较站点气温预报有所改善。使用ALS模型后,252个站点(83.7%)效果有改善, 即ALS模型可以进一步改进预报结果。

      图  2  不同模型订正结果相对站点气温预报改善率分布

      Figure 2.  average correction improvement rate of different models compared to station temperature forecast

      本文利用气温、风速、气压和相对湿度4个气象要素作为模型的输入特征,充分挖掘不同气象要素对气温变化的影响。同时,本文还以单一气温和站点气温预报作为输入、训练相同结构的模型进行对比。结果表明:仅使用气温时,LR模型可使气温预报均方根误差整体降低0.31℃(10.0%),ANN模型可使气温预报均方根误差整体降低0.45℃(14.5%),LSTM-FCN模型可使气温预报均方根误差整体降低0.46℃(14.8%),ALS模型可使气温预报均方根误差整体降低0.50℃(16.1%)。由此可见,只使用气温单要素的模型订正效果明显劣于综合利用多个气象要素的模型。

      在预报订正的同类方法中,有针对不同起报时刻分别建立不同订正模型[40],也有针对不同起报时刻采用同样的订正模型[41]。作为对比,本文进行了不区分起报时刻、将不同起报时刻数据合并训练的试验,即对于每个预报时效分别训练一个模型,训练28个模型。结果表明:数据合并后,LR模型将气温预报均方根误差整体降低0.33℃(10.6%),ANN模型将气温预报均方根误差整体降低0.55℃(17.7%), LSTM-FCN模型将气温预报均方根误差整体降低0.53℃(17.0%), ALS模型将气温预报均方根误差整体降低0.58℃(18.6%);LR模型、ANN模型和LSTM-FCN模型分别有165个站点(54.8%)、233个站点(77.4%)和213个站点(70.8%)有所改善, ALS模型则有245个站点(81.4%)改善。结果表明:不同起报时刻数据分开订正后,订正效果进一步提升,但LR模型的提升效果更为明显,而复杂的机器学习模型结果改进较小。

      图 2可知,ALS模型对于站点气温预报水平较低云南、贵州部分地区、重庆部分地区的改善效果尤为明显。这些地区地形、地貌较为复杂,数值预报难度较大,气温预报均方根误差普遍较高[42],且在插值到站点过程中,未考虑地形地貌变化的影响,也增加了插值后的站点气温预报误差。而结合站点观测,ALS模型可以较好地改进预报结果,其订正改善率整体在40%以上。

      本文进一步分析了使用ALS模型后,订正改善率为负值的49个站点。10个站点订正改善率在-1%以内, 12个站点订正改善率为-2%~-1%;46个站点的站点气温预报均方根误差低于其在301个站点上的整体均方根误差结果,其中有6个站点整体均方根误差小于2.0℃,气温预报提升难度较大。因此,在实际业务预报过程中,可通过统计站点历史气温预报,有针对性地使用ALS模型对预报不理想的站点进行预报误差订正。

    • 数值天气预报模式对极端天气预报还有很大提升空间,常出现对极值(峰值)预报偏低。本文选取72 h预报时效下,ALS模型预报精度提升比较明显的4个站,即贵州省贵阳站、山西省原平站、福建省福州站和台湾省台南站加以分析。由图 3可知,站点气温预报对这4个站普遍偏低,而经过不同模型订正后结果有改善,尤其是气温峰值改善明显。由表 2可知,ALS模型在4个站气温预报均方根误差最低,订正效果最佳。相对站点气温预报,LR模型将气温预报均方根误差整体降低24.8%,ALS模型将气温预报均方根误差整体降低30.5%。ALS模型通过充分挖掘观测数据间的时序关系,一定程度上弥补了数值天气预报模式对要素峰值预报的不足,该结果表明,ALS模型对于极端天气预报可能具有较强的订正潜力。

      图  3  2018年6—8月贵阳站、原平站、福州站、台南站72 h气温预报与观测对比

      Figure 3.  Comparison of temperature forecast with lead time of 72 h to the observation at Guiyang, Yuanping, Fuzhou and Tainan from Jun to Aug in 2018

      表 2  2018年6—8月4个站72 h预报时效气温预报均方根误差(单位:℃)

      Table 2.  Root mean square error of temperature forecast with lead time of 72 h at 4 stations from Jun to Aug in 2018(unit:℃)

      站点站点气温预报LR模型ANN模型LSTM-FCN模型ALS模型
      贵阳站2.021.571.551.481.48
      原平站4.152.882.632.642.60
      福州站2.821.881.801.751.75
      台南站1.861.611.551.491.49

      气温是变化较为明显的气象要素,站点气温预报误差也具有一定变化特征。图 4为贵阳站、原平站、福州站和台南站2018年7月15—22日不同模型28个预报时效气温预报整体均方根误差变化对比。4种模型对站点气温预报均有改善,且ANN模型、LSTM-FCN模型和ALS模型改善效果相比LR模型更为明显。由于站点气温预报是订正模型的重要输入要素,因此,不同模型气温预报均方根误差变化受其影响,与站点气温预报趋势基本保持一致。

      图  4  2018年7月15—22日贵阳站、原平站、福州站和台南站气温预报整体均方根误差对比

      Figure 4.  Comparison of averaged root mean square error of temperature forecast at Guiyang, Yuanping, Fuzhou and Tainan from 15 Jul to 22 Jul in 2018

    • 本文基于集成学习模型对ECMWF模式产品插值到站点后的2 m气温预报结果进行订正,验证了该模型进行气温订正的可行性和优越性,集成学习与数值天气预报模式相结合有广阔的应用前景,得到以下主要结论:

      1) 针对气象要素的时序特征,构建时序观测特征数据集,使用ALS模型对站点气温预报进行订正,可有效改善预报结果。

      2) 试验表明:相较站点气温预报,ALS模型将6~168 h时效的2 m气温预报均方根误差整体由3.11℃降至2.50℃,降幅达0.61℃(19.6%),提升了预报精度,对比传统的LR模型,气温预报均方根误差也整体降低了0.23℃(8.4%)。

      3) ALS模型对站点气温预报不理想的区域改善尤为明显,改善率超过40%。对极端天气气温预报个例的分析表明,ALS模型对气温峰值误差订正效果显著。

      ALS模型也存在一定局限性。气温变化具有连续性,而其他要素如降水通常有很大的突变特征。本文仅验证了ALS模型对2 m气温预报订正的有效性,是否适用于其他变化较大的要素需进一步研究。本文所订正的预报时效不超过168 h,使用机器学习进行更长时间尺度(如10~30 d延伸期[43]),尤其是对超过14 d的预报订正值需要深入研究。另外,将模式格点预报产品插值到站点必然带来误差,尤其在地形复杂区域,插值时未考虑地形地貌对气温变化的影响,并将这一误差引入机器学习模型中。因此,未来将利用中国气象局智能网格实况产品直接对模式格点预报结果进行订正,为提高智能网格无缝隙预报水平提供支持。

参考文献 (43)

目录

    /

    返回文章
    返回