CN115496279A - 基于动态权重集成的温度预报订正方法 - Google Patents
基于动态权重集成的温度预报订正方法 Download PDFInfo
- Publication number
- CN115496279A CN115496279A CN202211145330.0A CN202211145330A CN115496279A CN 115496279 A CN115496279 A CN 115496279A CN 202211145330 A CN202211145330 A CN 202211145330A CN 115496279 A CN115496279 A CN 115496279A
- Authority
- CN
- China
- Prior art keywords
- forecast
- temperature
- neural network
- forecasting
- correction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012937 correction Methods 0.000 title claims abstract description 105
- 230000010354 integration Effects 0.000 title claims abstract description 56
- 238000000034 method Methods 0.000 title claims abstract description 51
- 238000013528 artificial neural network Methods 0.000 claims abstract description 99
- 230000002068 genetic effect Effects 0.000 claims abstract description 4
- 238000007781 pre-processing Methods 0.000 claims abstract description 4
- 230000032683 aging Effects 0.000 claims description 45
- 238000012549 training Methods 0.000 claims description 33
- 238000012360 testing method Methods 0.000 claims description 10
- 238000011156 evaluation Methods 0.000 claims description 9
- 238000004364 calculation method Methods 0.000 claims description 7
- 230000006870 function Effects 0.000 claims description 5
- 238000013178 mathematical model Methods 0.000 claims description 3
- 238000013277 forecasting method Methods 0.000 claims description 2
- 230000009897 systematic effect Effects 0.000 claims 1
- 230000008901 benefit Effects 0.000 abstract description 11
- 230000007787 long-term memory Effects 0.000 abstract description 4
- 230000006403 short-term memory Effects 0.000 abstract description 4
- 230000000694 effects Effects 0.000 description 21
- 230000002354 daily effect Effects 0.000 description 10
- 238000007689 inspection Methods 0.000 description 9
- 238000005516 engineering process Methods 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 230000007423 decrease Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000012805 post-processing Methods 0.000 description 2
- 238000012876 topography Methods 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000010835 comparative analysis Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 238000007670 refining Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01W—METEOROLOGY
- G01W1/00—Meteorology
- G01W1/10—Devices for predicting weather conditions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Tourism & Hospitality (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Environmental & Geological Engineering (AREA)
- Marketing (AREA)
- Development Economics (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Business, Economics & Management (AREA)
- Mathematical Physics (AREA)
- Educational Administration (AREA)
- Primary Health Care (AREA)
- Atmospheric Sciences (AREA)
- Biodiversity & Conservation Biology (AREA)
- Ecology (AREA)
- Environmental Sciences (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供基于动态权重集成的温度预报订正方法,包括步骤1.获得地面实况温度数据和模式预报温度数据,步骤2.数据预处理,步骤3.神经网络订正,采用多种神经网络对CMA‑GD预报产品2m温度进行订正。进一步是,采用BP神经网络、遗传算法优化的BP神经网络、广义回归神经网络、小波神经网络、长短期记忆网络等方法对CMA‑GD模式的2m温度预报产品进行订正。步骤4.动态权重集成,步骤5.获得最终订正温度。本发明基于CMA‑GD模式直接输出的2m温度预报产品,通过多种神经网络对模式温度预报进行偏差校正,并采用动态权重方案对订正结果进行优势集成,形成一套本地化客观温度预报订正产品,为温度预报提供有力的参考指导,进一步提升本地温度预报质量。
Description
技术领域
本发明属于气象预报技术领域,尤其涉及基于动态权重集成的温度预报订正方法。
背景技术
随着经济的发展和社会的进步,人们对于天气预报的需求越来越广,对于预报准确率和精细化的要求也越来越高。数值预报作为提高预报精准度的重要手段,在天气预报业务中发挥着关键作用。近年来数值预报技术发展迅速,预报水平不断提高,但由于初值场的不确定性、模式误差及大气的混沌性使得数值模式预报仍存在一定偏差。如何有效减少模式预报误差,不断提高预报准确率和精细化,是气象业务部门一直以来的重点和难点,也是气象科学研究领域一直以来的焦点和热点。
为减少数值模式直接输出预报与实况存在的偏差,人们常采取后处理方法对模式结果进行调整。目前主要的后处理方法有模式输出统计(Model Output Statistics,MOS)、卡尔曼滤波、相似预报法、神经网络等,其中神经网络作为可自动实现两组变量间非线性映射关系的数据处理系统,具有较强的自适应学习能力和集体运算能力,在气象领域获得广泛应用用。熊世为等利用Back propagation(BP)神经网络对欧洲中期天气预报中心(ECMWF,European Centre For Medium Range Weather Forecasts)提供的细网格模式输出产品进行了订正,结果表明神经网络的非线性映射关系使其在容错性方面优势明显。Han等研究发现长短时记忆循环神经网络 (LSTM,Long Short Term Memory)对逐时气温具有较好的预报效果。但同时神经网络方法也存在一定的不足。前人研究发现,由于缺乏问题的先知经验,神经网络在实际训练时容易陷入局部极值点以及出现过拟合现象,因此尽管不同的神经网络都能提供部分有效信息,但得到的结果可能存在较大差异。为了克服单一预报结果的不稳定性,有学者引入集成预报思想,即采用一定的方法对多个结果进行集成以获得确定性预报。诸多研究成果表明集成预报结果在一定程度上改善了单个预报技巧不稳定的现象。例如,魏凤英以多种预报方法的历史预报技巧作为权重系数设计出动态权重集成预报方案,并通过9年全国大范围降水的独立样本检验表明集成预报模型在一定程度上消除了原方法预报的随机性。赵声蓉应用神经网络方法对 3个国家不同业务模式的预报产品建立了温度集成预报系统,结果显示集成的温度预报效果明显好于单个模式的预报。
复杂的地形条件导致温度的局地差异较大,各数值模式温度预报效果不佳,预报质量相对较差,因此基于模式直接输出结果的温度预报本地化订正研究亟需加强。
发明内容
本发明的目的在于解决上述现有技术存在的缺陷,提供基于动态权重集成的温度预报订正方法。
中国气象局广州热带海洋气象研究所快速更新同化数值预报系统 (CMA-GD,China Meteorological Administration,Guangdong)是我国自主研发的区域数值天气预报系统,能够实现区域内卫星、雷达和地面观测资料快速同化。该模式可输出逐小时的温度预报产品,在一定程度上能够满足公众对温度预报时间分辨率的高要求,多年来在日常业务预报中具有重要参考价值。本发明基于CMA-GD模式直接输出的2m温度预报产品,通过多种神经网络对模式温度预报进行偏差校正,并采用动态权重方案对订正结果进行优势集成,形成一套本地化客观温度预报订正产品,为温度预报提供有力的参考指导,进一步提升本地温度预报质量。
本发明采用如下技术方案:
基于动态权重集成的温度预报订正方法,包括:
步骤1.获得地面实况温度数据和模式预报温度数据
步骤2.数据预处理
在温度订正之前,首先需要对数据进行预处理
步骤3.神经网络订正
采用多种神经网络对CMA-GD预报产品2m温度进行订正。进一步是,采用BP神经网络、遗传算法优化的BP神经网络、广义回归神经网络、小波神经网络、长短期记忆网络等方法对CMA-GD模式的2m温度预报产品进行订正。
步骤4.动态权重集成
集成预报是应用数学模型对同一预报对象的多种预报工具或成员的预报结果进行综合集成,从而得到统一预报值的一种方法。这些预报结果可以是不同模式的预报结果,也可以是同一模式不同的订正结果。进一步是,公式如下,假设有n个预报结果,分别为F1,F2,……,Fn,每个预报结果对应的权重系数分别为C1,C2,……,Cn,那么集成预报值E可表示为:
步骤5.获得最终订正温度
进一步的是,步骤2包括将每日地面实况和模式预报数据偏离三倍中位数绝对偏差的值标记为离群值,当连续3小时出现离群值或缺失值时剔除该日样本,缺失样本少于3小时则采用线性插值进行补全。
进一步的是,步骤3神经网络训练样本时间的长短对训练结果的影响至关重要,因此有必要针对不同时间段确定神经网络的训练样本参数,考虑到温度的连续性,并在短期时段内具有稳定趋势,因此选用过去N1天数值模式逐小时预报温度(输入)以及对应实况温度(输出)作为神经网络训练样本,根据训练好的神经网络对当日预报数据进行订正。其中BP、 BP_GA、GRNN、WAVENN神经网络训练时长参数N1选取一致,LSTM 神经网络与前面神经网络有较大差别,因此将过去N天的训练样本设N2 以示区别,LSTM神经网络输入场还涉及过去一段时间的逐小时实况数据,设为N3小时。
进一步的是,针对训练样本过去N1、N2、N3天的选择,采用枚举法对各神经网络的参数进行调试。在对预报准确率和平均绝对误差以及计算效率的综合考量下,文中将N1、N2和N3值分别取为30天、10天和24 小时。
进一步的是,步骤3考虑到温度具有连续性,所选样本要能正确反映当前时段内模式预报温度和实况温度的内在规律,如果训练样本的时长选择过长,与当前时段的预报结果相距较远,反而会对当前时段的训练结果产生一定的干扰。
进一步的是,通过步骤3多种神经网络消除模式系统误差后,采用动态权重方案对订正结果进行优势集成。逐小时集成温度可表示为:
式中,i表示各预报结果的顺序(取值为1,2,……,6,分别表示模式预报、BP、BP_GA、GRNN、WAVENN、LSTM),j表示预报时效(取值为0,1,……,72),Ej为第j小时预报时效各预报结果的权重系数,由不同预报时效模式预报温度和各神经网络订正结果与对应实况温度的历史检验评估结果加以确定,计算公式如下:
式中,MAEij为历史检验评估样本中第j小时预报时效各预报结果与对应实况温度的MAE。
进一步的,步骤4还包括检验,具体是通过平均绝对误差进行检验
平均绝对误差是所有单个观测值与算术平均值偏差绝对值的平均,它能够避免误差相互抵消的问题,因而可以准确反映实际预测误差的大小,其函数表达式为:
式中,Fi为第i站(次)预报温度,Oi为第i站(次)实况温度。
进一步的,步骤4还包括对比,具体是通过预报预报准确率进行判断以预报绝对误差≤2℃作为预报正确的标准,则温度预报准确率表示为温度预报绝对误差≤2℃的百分比,函数表达式为:
式中,K=2,分别表示|Fi-Oi|≤2℃,NrK为预报正确的站(次)数,NfK为预报的总站(次)数。
本发明的有益效果:
本发明针对复杂地形下温度预报的难点问题进行单模式多方法的集成订正。从结果而言:在对历史数据检验评估的基础上利用多种神经网络技术对数值模式直接输出的温度预报结果进行偏差校正,有效降低模式系统误差。其次,基于不同神经网络订正结果相似性的综合考量,采用动态权重方案对模式预报和订正结果进行优势集成,显著提升预报质量及稳定性。
以2020年贵州省72h预报时效逐小时订正结果为例,订正后平均绝对误差较模式降低14.93%(2.01℃降低至1.71℃),预报准确率提升 8.24%(60.46%提升至68.70%)。
附图说明
图1为贵州省365个国家考核站分布图;
图2为不同训练时长对神经网络温度订正的影响图;
图3为不同枚举时长对动态权重集成温度订正的影响图;
图4为本发明的流程图;
图5为2020年7月1日08时贵阳72h预报时效内逐小时温度演变图;
图6(a)为2020年7月贵阳逐日08时起报72h预报时效模式预报温度与实况的偏差;
图6(b)为2020年7月贵阳逐日08时起报72h预报时效订正温度与实况的偏差;
图7(a)为2020年贵阳08时起预报时效模式预报温度图;
图7(b)为2020年贵阳08时起动态权重集成结果与对应实况温度的散点图;
图8为2020年贵州72h预报时效内模式预报温度、不同订正方案结果与实况的逐小时平均绝对误差图;
图9为2020年贵州72h预报时效模式预报温度和动态权重集成订正后结果的逐日平均绝对误差图;
图10(a)、图10(b)为2020年贵州72h预报时效平均绝对误差图;
图11(a)、图11(b)为2020年贵州72h预报时效预报准确率图;
图12(a)、图12(b)为2020年贵州72h预报时效逐月检验结果图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例
资料来源
使用的资料包括2019-2020年CMA-GD预报产品以及同期贵州省境内365个国家考核站地面气象常规观测数据,资料详细说明如下:
(1)CMA-GD预报产品为每日08时(北京时,下同)和20时起报的未来84h预报时效内地面2m温度要素,时间间隔为1h,空间分辨率为 0.03°×0.03°;
(2)贵州省境内365个国家考核站地面2m温度,时间间隔为1h,站点分布情况如图1所示。
格点数据与站点数据之间的匹配原则如下:将数值预报产品采用临近插值法内插至贵州省境内365个国家考核站,得到各站点地面2m温度预报值。
订正方法
(1)神经网络订正
本发明采用BP神经网络、遗传算法(GA,Genetic algorithms)优化的BP神经网络、广义回归神经网络(GRNN,Generalized regression neural network)、小波神经网络(WAVENN,Wave neural network)、长短期记忆网络等方法(LSTM,Long short termmemory)对CMA-GD模式的2m 温度预报产品进行订正。
(2)动态权重集成预报
集成预报是应用数学模型对同一预报对象的多种预报工具或成员的预报结果进行综合集成,从而得到统一预报值的一种方法。这些预报结果可以是不同模式的预报结果,也可以是同一模式不同的订正结果。具体公式如下,假设有n个预报结果,分别为F1,F2,……,Fn,每个预报结果对应的权重系数分别为C1,C2,……,Cn,那么集成预报值E可表示为:
检验参量
本发明涉及的检验参量及订正方法如下:
(1)平均绝对误差(MAE,Mean Absolute Error)
平均绝对误差是所有单个观测值与算术平均值偏差绝对值的平均,它能够避免误差相互抵消的问题,因而可以准确反映实际预测误差的大小,温度平均绝对误差TMAE的函数表达式为:
式中,N为站(次)总数,Fi为第i站(次)预报温度,Oi为第i站(次) 实况温度。
(2)预报准确率(FA,Forecast Accuracy)
本发明以预报绝对误差≤2℃作为预报正确的标准,则温度预报准确率 FA表示为温度预报绝对误差≤2℃的百分比,函数表达式为:
式中,K=2,分别表示|Fi-Oi|≤2℃,NrK为预报正确的站(次)数,NfK为预报的总站(次)数。
订正流程
由于模式本身运行及推送所需时间长达8小时之久,本发明结合实际业务需求对模式预报产品向后错位12h开展订正,即仅对模式12-84h预报时效产品进行订正,并作为下一起报时次0-72h预报时效订正产品。如某日08时起报未来84h预报时效产品,本地接收产品时间约为当日16时左右,则将该日08时起报的12-84h预报时效订正产品作为该日20时起报的未来0-72h预报值。此外考虑到实况要素的截断问题,参照中国气象局智能预报技术方法交流大赛客观产品传输时效要求(08时次在04:30之前, 20时次在16:30之前),本发明将当日起报时次前推4小时后的实况样本进行剔除,保证后续业务化顺利实现。
数据预处理
在温度订正之前,首先需要对数据进行预处理。本发明将每日地面实况和模式预报数据偏离三倍中位数绝对偏差(MAD,Median Absolute Deviation)的值标记为离群值,当连续3小时出现离群值或缺失值时剔除该日样本,缺失样本少于3小时则采用线性插值进行补全。
神经网络订正
本发明采用多种神经网络对CMA-GD预报产品2m温度进行订正,各神经网络订正方案具体见表1。神经网络训练样本时间的长短对训练结果的影响至关重要,因此有必要针对不同时间段确定神经网络的训练样本参数,考虑到温度的连续性,并在短期时段内具有稳定趋势,因此选用过去 N1天数值模式逐小时预报温度(输入)以及对应实况温度(输出)作为神经网络训练样本,根据训练好的神经网络对当日预报数据进行订正。其中BP、BP_GA、GRNN、WAVENN神经网络训练时长参数N1选取一致, LSTM神经网络与前面神经网络有较大差别,因此将过去N天的训练样本设N2以示区别,LSTM神经网络输入场还涉及过去一段时间的逐小时实况数据,本发明设为N3小时。
表1神经网络概要
针对训练样本过去N1天的选择,采用枚举法对各神经网络的参数进行调试。以贵州省9市州代表站点2019年72h预报时效数据为例,通过改变N1值的大小得到BP神经网络不同的订正效果,如图2所示。从图中可以看到,随着N1的不断增大,预报准确率表现为先降后增,在N1达到25天后准确率逐渐超过模式本身,平均绝对误差则相反。BP_GA、GRNN、 WAVENN神经网络结果基本一致。考虑到温度具有连续性,所选样本要能正确反映当前时段内模式预报温度和实况温度的内在规律,如果训练样本的时长选择过长,与当前时段的预报结果相距较远,可能反而会对当前时段的训练结果产生一定的干扰,因此在对预报准确率和平均绝对误差以及计算效率的综合考量下,文中将N1值取为30。同理,将LSTM训练样本天数N2和过去实况小时数N3分别取为10和24。
动态权重集成
通过多种神经网络技术消除模式系统误差后,采用动态权重方案对订正结果进行优势集成。逐小时集成温度可表示为:
式中,i表示各预报结果的顺序(取值为1,2,……,6,分别表示模式预报、BP、BP_GA、GRNN、WAVENN、LSTM),j表示预报时效(取值为0,1,……,72),Ej为第j小时预报时效各预报结果的权重系数,Fij为第j小时预报时效的模式预报温度和各神经网络订正结果,Cij为第j小时预报时效各预报结果的权重系数,由不同预报时效模式预报温度和各神经网络订正结果与对应实况温度的历史检验评估结果加以确定,计算公式如下:
式中,MAEij为历史检验评估样本中第j小时预报时效各预报结果与对应实况温度的MAE,本发明将历史检验样本时段设为过去N4天模式预报温度和各神经网络订正结果与对应实况温度的平均绝对误差的倒数动态更新集成预报的权重系数。
针对动态权重集成参数N4的选择,仍以贵州省9市代表站点2019年 72h预报时效数据为例,采用枚举法进行调试。本发明针对72h预报时效开展订正,则N4应大于或等于3天,但由于传输时效要求导致起报时次前推4小时后的实况样本剔除后,当N4取值为3时仅有0-68h预报时效有对应实况,69-72h预报时效实况则为空值,无法获取其平均绝对误差,因此将N4从4天开始枚举,如图3所示。由图可知,N4在不同枚举时长下,动态权重集成订正温度较模式预报的检验评估结果均较好,其中在7 天及更长时段,平均绝对误差降低和预报准确率提升幅度较明显,并且表现更为稳定,因此在算力条件的允许下降N4值取为7。
订正案例
综上,本发明首先对地面实况和模式预报数据进行预处理,然后利用多种神经网络对CMA-GD模式72h预报时效内逐小时温度进行订正,最后采用动态权重方案对模式预报温度和各神经网络订正结果进行优势集成,并针对订正结果进行逐一检验和对比分析,如图4所示。
本发明以贵州省会贵阳站(57816,106.73°E,26.58°N)为例,分别给出 2020年7月1日08时72h预报时效内逐小时实况温度、模式预报、各神经网络和动态权重集成结果,以及动态权重集成结果与实况的偏差,如图5所示。从神经网络订正情况而言,不同预报时效订正结果差异明显。其中,BP、BP_GA、WAVENN、GRNN神经网络订正后,模式低温偏低得到有效改善,但高温却与实况偏离,相比之下LSTM神经网络由于增加了过去实况数据作为输入,不仅量级发生变化,趋势也有所改变,高温预报与实况更为接近。由于LSTM在连续温度趋势预测方面的趋势,它的订正效果相比其他方法更为突出。从集成效果来看,0-54h预报时效动态权重集成结果与实况偏差较小,高低温预报与实际观测较为接近,较单一模式表现更加稳定,54h预报时效以后由于实况的陡降导致模式本身及订正结果偏差明显。
结果与分析
单站检验
表2给出了2020年7月1日08时起报贵阳单站未来72h预报时效的检验结果。可以看到,动态权重集成方案相较于模式本身和单一神经网络订正结果,在平均绝对误差和预报准确率上都体现出一定的正技巧。尽管动态权重集成方案与LSTM神经网络订正结果的平均绝对误差相当(均为 1.18℃),但通过多个神经网络的优势集成可以显著的提高学习系统的泛化能力,使得预报准确率得到进一步提升(由79.45%提升至83.56%)。
表2 2020年7月1日08时贵阳72h预报时效检验结果
图6(a)分别对比了2020年7月贵阳每日08时起报未来72h预报时效内模式预报温度、动态权重集成结果与实况温度的逐小时偏差。 CMA-GD温度预报存在部分时效预报异常偏高的现象,尤其是在0-12h、 24-36h以及48-60h,偏高值达到4-5℃以上。经动态权重集成订正后这一现象得到有效修正,偏差大部分降低至±1.5℃以内,同时CMA-GD在其余预报时效温度略偏低的情况经订正后也有所改善,如图6b所示。
进一步对更长时段的订正结果进行检验,结果表明动态权重集成方案能够有效提升预报可靠性,相较于单一结果具有更高的预报正技巧。如图 7(a)-图7(b)所示,从图中可以看出,动态权重集成后的订正温度较模式预报温度的平均绝对误差显著降低,由1.80℃降至1.48℃,同时预报准确率也得到大幅提升,由65.96%升至74.13%。模式预报结果中低温部分相较于实况存在明显偏高的现象(图7(a),最下角较多散点高于﹢2℃线),经动态权重集成后偏高部分得到有效修正,散点更加集中于45°对角线附近,图7(b)。相较而言,20时起报订正结果不如08时理想,但对于低温预报订正同样具有正技巧。这可能是由于20时起报相较08起报距离高温(假设为14时)出现的时间间隔更长,一方面模式预报质量随预报时长的延伸会逐渐下降,模式本身对高温的预报质量将会降低,另一方面LSTM神经网络涉及过去一段实况温度的输入,预报时效越长,其偏离实况的程度就越大,因此20:00起报数据订正效果相对08:00不够理想。此外,本发明也计算了72h预报时效的订正结果,与24h的结论定性一致,动态权重集成后的预报质量较模式预报温度有所提高,预报准确率由63.54%提高到69.75%,MAE由1.91℃降至1.70℃。
全省检验
针对贵州全省的温度订正,本发明给出2020年贵州365个国家考核站 72h预报时效内模式预报温度、不同订正方案结果与实况的逐小时平均绝对误差,如图8所示。由图可知,温度预报及其订正结果的平均绝对误差随预报时效增长总体呈周期性变化,但各神经网络在不同预报时效内的订正效果差异较为明显。一般而言,日最高和最低温度常出现时段分别为午后和凌晨,这里假定对应14时和02时。以08时起报为例,6的偶数预报时效(0/12/24/36/48/60/72)平均绝对误差处于相对小值区,6的奇数倍预报时效(6/18/30/42/54/66h)处于相对大值区,则大值区正好与日最高温度(每日14时,高温常出现时段)和最低温度(每日02时,低温常出现时段)相对应,这也正是温度极值预报的难点所在。其中BP、BP_GA、 WAVENN、GRNN神经网络针对低温(每日02时,18/42/66h预报时效) 的订正均由明显正技巧,高温(每日14时,6/30/54h预报时效)的订正效果较差,部分时效为负技巧,而LSTM神经网络在低温的订正效果虽不如前述神经网络,但高温订正仍具有正技巧,整体表现比较稳定,表3。从 0-72h整体预报性能的结果来看,各神经网络均能有效降低模式系统误差,是平均绝对误差降低0.02-0.17℃,通过重新划分权重后集成的温度预报相较于模式本身和各神经网络订正结果具有更好的效果,平均绝对误差降低 0.30℃。
表3 2020年贵州部分预报时效模式预报温度、不同订正方案结果与实况的平均绝对误差(单位:℃)
如图9所示,可以看到,尽管模式和动态权重集成后的平均绝对误差随时间都存在一定波动,但经过订正后的逐日平均绝对误差基本低于模式预报结果,表明动态权重集成方案对于模式预报温度具有明显的订正效果,并且表现出一定的稳定性。
进一步,本发明分别检验了2020年贵州省365国家考核站72h预报时效内模式预报温度和动态权重集成温度的空间分布,如图10(a)-图11 (b)。结果表明,动态权重集成订正方案能有效解决模式预报在贵州省大部分地区偏差较大的问题,全省72h预报时效平均绝对误差降低了14.93%(2.01℃降至1.71℃,图10(a)-图10(b)),同时预报准确率提升了8.24%(60.46%升至68.70%;图11(a)-图11(b))。但值得注意的是,模式预报以及动态权重集成后的温度偏差存在一定的空间分布不均性,尤其省的西部地区,经动态权重集成订正后局地仍然存在平均绝对误差的大值区。这可能与贵州西高东低的地形分布有关,朱文达等利用高分辨地形数据对CMA-GD模式的批量试验表明地形偏高区域常常对应气温平均绝对误差大值区,因此未来可针对地形做进一步的局地订正。此外,从不同预报时效的模式预报和订正效果来看,第一天(0-24h)的订正效果更为明显,后面两天效果基本相当(表4)。
表4 2020年贵州未来三天逐小时温度订正效果
对2020年贵州全省72h预报时效内模式预报及其订正结果进行逐月检验后,从图12(a)-图12(b)可以发现,动态权重集成订正温度相较模式本身在各月都具有明显的订正技巧,平均绝对误差降低(-0.49℃ --0.12℃),预报准确率提升(3.17%-14.16%)。从季节来看,夏季相对其他季节订正效果更为明显,平均绝对误差降低0.39℃,预报准确率提升11.49%。
本发明利用2019-2020年CMA-GD模式资料以及同期贵州省境内365 个国家考核站地面2m温度数据,通过多种神经网络技术消除模式系统误差,并采用动态权重方案对订正结果进行优势集成,最终获得本地化温度预报订正产品,结果表明:
(1)在对历史数据检验评估的基础上,利用多种神经网络方法可有效降低模式系统误差。神经网络方法对于贵阳站7月的模式低温预报偏高有一定改善效果,同时对于贵州省365国家考核站2020年0-72h的整体预报效果而言,采用BP、BP_GA、WAVENN、GRNN、LSTM神经网络等方法订正后的温度平均绝对误差较模式降低0.01-0.17℃。
(2)由于不同神经网络订正效果在不同预报时效存在差异,采用动态权重方案对订正结果进行优势集成可进一步提高模式订正效果。无论是贵阳单站或是贵州全省,经过动态权重集成后的温度预报平均绝对误差在不同预报时效基本低于模式直接输出和各神经网络订正结果,预报准确率也有所提高。以2020年贵州省72h预报时效逐小时订正结果为例,订正后平均绝对误差较模式降低14.93%(2.01℃降低至1.71℃),预报准确率提升8.24%(60.46%提升至68.70%)。此外,动态权重集成订正结果在逐月和逐日检验中都表现出一定的稳定性。
本发明针对贵州复杂地形下温度预报的难点问题进行单模式多方法的集成订正,形成的客观预报产品可为提升本地温度预报质量和精细化预报服务水平提供一定参考。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (6)
1.基于动态权重集成的温度预报订正方法,其特征在于,包括:
步骤1.获得地面实况温度数据和模式预报温度数据
步骤2.数据预处理
在温度订正之前,首先需要对数据进行预处理
步骤3.神经网络订正
采用多种神经网络对CMA-GD预报产品2m温度进行订正,进一步是,采用BP神经网络、遗传算法优化的BP神经网络、广义回归神经网络、小波神经网络、长短期记忆网络的方法对CMA-GD模式的2m温度预报产品进行订正;
步骤4.动态权重集成
集成预报是应用数学模型对同一预报对象的多种预报工具或成员的预报结果进行综合集成,从而得到统一预报值的一种方法,公式如下,假设有n个预报结果,分别为F1,F2,……,Fn,每个预报结果对应的权重系数分别为C1,C2,……,Cn,那么集成预报值E表示为:
步骤5.获得最终订正温度。
2.根据权利要求1所述的基于动态权重集成的温度预报订正方法,其特征在于,步骤2具体是将每日地面实况和模式预报数据偏离三倍中位数绝对偏差的值标记为离群值,当连续3小时出现离群值或缺失值时剔除该日样本,缺失样本少于3小时则采用线性插值进行补全。
3.根据权利要求1所述的基于动态权重集成的温度预报订正方法,其特征在于,步骤3还包括,神经网络训练样本时间的长短对训练结果的影响至关重要,因此有必要针对不同时间段确定神经网络的训练样本参数,考虑到温度的连续性,并在短期时段内具有稳定趋势,因此选用过去N1天数值模式逐小时预报温度以及对应实况温度作为神经网络训练样本,根据训练好的神经网络对当日预报数据进行订正,其中BP、BP_GA、GRNN、WAVENN神经网络训练时长参数N1选取一致,LSTM神经网络与前面神经网络有较大差别,因此将过去N天的训练样本设N2以示区别,LSTM神经网络输入场还涉及过去一段时间的逐小时实况数据,设为N3小时;
针对训练样本过去N1、N2、N3天的选择,采用枚举法对各神经网络的参数进行调试,在对预报准确率和平均绝对误差以及计算效率的综合考量下,将N1、N2和N3值分别取为30天、10天和24小时;
考虑到温度具有连续性,所选样本要能正确反映当前时段内模式预报温度和实况温度的内在规律,如果训练样本的时长选择过长,与当前时段的预报结果相距较远,反而会对当前时段的训练结果产生一定的干扰。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211145330.0A CN115496279A (zh) | 2022-09-20 | 2022-09-20 | 基于动态权重集成的温度预报订正方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211145330.0A CN115496279A (zh) | 2022-09-20 | 2022-09-20 | 基于动态权重集成的温度预报订正方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115496279A true CN115496279A (zh) | 2022-12-20 |
Family
ID=84470824
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211145330.0A Pending CN115496279A (zh) | 2022-09-20 | 2022-09-20 | 基于动态权重集成的温度预报订正方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115496279A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117452527A (zh) * | 2023-12-26 | 2024-01-26 | 贵州省气象台(贵州省气象决策服务中心) | 一种数字气象智能服务方法及系统 |
-
2022
- 2022-09-20 CN CN202211145330.0A patent/CN115496279A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117452527A (zh) * | 2023-12-26 | 2024-01-26 | 贵州省气象台(贵州省气象决策服务中心) | 一种数字气象智能服务方法及系统 |
CN117452527B (zh) * | 2023-12-26 | 2024-03-12 | 贵州省气象台(贵州省气象决策服务中心) | 一种数字气象智能服务方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101989493B1 (ko) | 전력 사용량 예측 시스템 및 방법 | |
Fatemi et al. | Parametric methods for probabilistic forecasting of solar irradiance | |
CN111382897A (zh) | 台区低压跳闸预测方法、装置、计算机设备及存储介质 | |
Monfared et al. | Fuzzy predictor with additive learning for very short-term PV power generation | |
CN112200377A (zh) | 基于sarimax模型的光伏中长期发电量预报方法及装置 | |
CN111538935A (zh) | 基于地形特征和多源模式产品的精细化降水融合方法、系统、电子设备及存储介质 | |
CN113361195B (zh) | 一种基于lstm和相似日的配电网线路超短期负荷预测方法 | |
CN115496279A (zh) | 基于动态权重集成的温度预报订正方法 | |
CN115860797B (zh) | 一种适应新电价改革形势的电量需求预测方法 | |
CN105975791A (zh) | 一种基于双平滑法的稀疏区域降水估算融合方法 | |
CN111915083A (zh) | 一种基于时间分层组合的风电功率预测方法及预测系统 | |
CN115936177A (zh) | 一种基于神经网络的光伏输出功率预测方法及系统 | |
Pessanha et al. | A methodology for joint data cleaning of solar photovoltaic generation and solar irradiation | |
Hou et al. | Improving the forecast accuracy of ECMWF 2-m air temperature using a historical dataset | |
Song et al. | Ensemble framework for daily carbon dioxide emissions forecasting based on the signal decomposition–reconstruction model | |
CN114037138A (zh) | 基于双层分解和深度学习的地铁短时进站客流预测系统及实施方法 | |
Foreman | The Effects of Dust Storms on Economic Development | |
CN112926772A (zh) | 一种基于lstm-gpr混合模型的光能预测方法 | |
CN117251672A (zh) | 基于电力数据的区域行业多维能源碳排放计算方法和装置 | |
CN113919610A (zh) | 低压台区线损预测用arima模型构建方法及评估方法 | |
CN116865232A (zh) | 一种基于风速误差修正的中长期风电功率预测方法及系统 | |
CN115983511A (zh) | 基于改进统计降尺度方法的降水预估方法和系统 | |
Rodil et al. | A novel methodology for determination of soiling on PV panels by means of grey box modelling | |
Tziolis et al. | Direct Against Indirect Short-Term Net Load Forecasting Using Machine Learning Principles for Renewable Microgrids | |
CN109934394A (zh) | 一种基于灰色和马尔科夫理论的需求侧响应预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |