CN111929748B - 一种气象要素预报方法和系统 - Google Patents

一种气象要素预报方法和系统 Download PDF

Info

Publication number
CN111929748B
CN111929748B CN202010977989.7A CN202010977989A CN111929748B CN 111929748 B CN111929748 B CN 111929748B CN 202010977989 A CN202010977989 A CN 202010977989A CN 111929748 B CN111929748 B CN 111929748B
Authority
CN
China
Prior art keywords
trainer
data
forecasting
meteorological
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010977989.7A
Other languages
English (en)
Other versions
CN111929748A (zh
Inventor
陈启智
周德荣
马星星
万秉成
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Sanyun Technology Co ltd
Nanjing Pulan Atmospheric Environment Research Institute Co ltd
Original Assignee
Nanjing Sanyun Technology Co ltd
Nanjing Pulan Atmospheric Environment Research Institute Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Sanyun Technology Co ltd, Nanjing Pulan Atmospheric Environment Research Institute Co ltd filed Critical Nanjing Sanyun Technology Co ltd
Priority to CN202010977989.7A priority Critical patent/CN111929748B/zh
Publication of CN111929748A publication Critical patent/CN111929748A/zh
Application granted granted Critical
Publication of CN111929748B publication Critical patent/CN111929748B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01WMETEOROLOGY
    • G01W1/00Meteorology
    • G01W1/10Devices for predicting weather conditions
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Environmental & Geological Engineering (AREA)
  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Atmospheric Sciences (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Ecology (AREA)
  • Environmental Sciences (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开一种气象要素预报方法和系统,属于气象预报订正技术领域。针对现有技术中存在的传统模式输出统计预报无法获取非线性的关系,计算较慢无法实现实时更新的问题,本发明提供一种气象要素预报方法和系统,通过对一种或多种模式预报数据进行历史统计,获取固定站点模式预报数据与实际观测数据的历史气象相关性,优选出模式要素的特征关系,同时考虑多个气象因子,有效构建特征因子关系网络,实现同步预测,同时实现对模式数据的订正,基于该框架可以实现对固定站点的平均风速、最高温度、最低温度和降水的统计订正,提高预报准确率。

Description

一种气象要素预报方法和系统
技术领域
本发明涉及气象预报订正技术领域,更具体地说,涉及一种气象要素预报方法和系统。
背景技术
精细化天气预报业务是全球预报业务发展的总体趋势,随着经济的发展和科学技术的进步,精细化预报的需求日趋强烈。由于精细化预报涉及的预报对象不断扩充,预报时效逐渐延长,预报空间精细化程度加深,预报员难以按照传统的常规预报方法完成精细化预报制作。
随着数值预报和计算机技术的发展,为精细化天气预报提供了更大的空间。数值预报产品的可用时效不断增强,空间分辨率越来越细,故而为精细化要素预报提供重要的数据基础。而计算机技术的发展,提供了更多的智能统计方法,综合运用动力学、统计学技术进行数值模式的加工和后处理,能够更好地释用数值模式。
目前,对数值模式产品解释应用的研究诸多,相关的各种客观释用方法应运而生:完全预报法(PP法)、模式输出统计(MOS)、人工神经网络(ANN)、卡尔曼滤波(KLM)、支持向量机(SVM)等。其中MOS方法运用诸多,效果明显,MOS预报方法从数值模式输出产品中选取预报因子,建立预报量与预报因子直接的关系,进行实际预报。该方法可以引入许多其他方法不能引入的大量预报因子,自动纠正数值预报系统误差,具有较好的效果。
但是传统MOS预报方法是基于传统的统计方法建立逐步回归公式,无法获取非线性的关系;传统MOS预报的关系式相对固定,计算较慢,无法实现实时更新;此外,传统MOS预报一般针对一种数值模式,而随着集合预报的发展,一般认为多模式集成的效果要优于单个模式;同时以往研究主要基于数值预报,自动站实况要素涉及较少,对于降水模型,自动站的数据对于稳定性的降水预报较为重要。
发明内容
1.要解决的技术问题
针对现有技术中存在的传统模式输出统计(MOS)预报无法获取非线性的关系,计算较慢无法实现实时更新的问题,本发明提供一种气象要素预报方法和系统,同时考虑多个气象因子,有效构建特征因子关系网络,实现同步预测,同时实现对模式数据的订正,提高预报准确率。
2.技术方案
本发明的目的通过以下技术方案实现。
一种气象要素预报方法,包括以下步骤:
步骤1:获取自动气象站数据,对数据进行站点插值和预处理,形成时序匹配的站点数据信息;
步骤2:通过归一化标准化模块对站点数据信息进行归一化和标准化处理;将归一化和标准化方法构建在框架底层,对进入模型训练器的数据进行预处理;
步骤3:针对气象因子分别构建基础训练器,所述气象因子包括日最高温、日最低温、风速和降水;
步骤4:在根据气象因子构建的基础训练器基础上,集成嵌套强度自适应训练器和随机森林训练器两种回归算法分类器,构建时间序列训练器和降水训练器;
步骤5:通过学习机制训练模型对模式预报进行实时建模订正,根据输入的模式预报数据和实时观测数据进行预报。
本发明使用管道机制方法,整套模型可以认为是一种流水线的输入,涵盖了一系列的数据挖掘步骤,从基础数据规整构建到模型的最终预估估计器设定。整个结构环环相扣,管理机制包括转换器和估计器,输入的数据集经过转换器的处理后,输出的结果作为下一步的输入,最后一步的估计器对数据进行预估。
更进一步的,站点数据信息基于强度自适应训练器和随机森林训练器嵌套的分类器,得到预估结果,对预估结果进行平均值和标准化计算处理,针对处理后的结果构建新的要素分布数据,进行二次处理,同时构建时间序列训练器和降水训练器,输入模型进行训练。
更进一步的,步骤4的随机森林训练器中假设训练集中有n个样本,每个样本有d个特征,需要训练一个包含T棵数的随机森林,n、d和T均为自然数,算法如下所示:
(1)、对于T棵决策树,分别重复如下操作:使用有放回的抽样,重复N次,每次抽取m个特征,N和m均为自然数,m值随机选取;
(2)、如果预测是回归问题,则最后的输出是每个树输出的均值;
(3)、如果预测是分类问题,则根据投票原则,确定最终的类别。
更进一步的,步骤4的强度自适应训练器训练流程如下:
(a)先通过对M个训练样本的学习得到第一弱分类器,M为自然数;
(b)将分错的样本和其他的新数据构成一个新的M个的训练样本,通过对这个样本的学习得到第二弱分类器;
(c)将(a)步骤和(b)步骤中都分错的样本加上其他的新样本构成另一个新的M个的训练样本,通过对这个样本的学习得到第三弱分类器;
(d)最终经过提升的强分类器,即某个数据被分为哪一类要由各分类器权值决定。
更进一步的,根据随机森林训练器参数中的最大的弱学习器个数和最大特征数,增强对降水不连续因子的预测效果;根据强度自适应训练器对降水因子进行细化训练。
更进一步的,步骤1中自动气象站数据包括历史模式预报数据和历史观测数据。
更进一步的,数据经插值后在缺省预处理器进行预处理,将输入的无效值用相邻的平均值进行替代。
更进一步的,站点插值使用双线性插值方法。具体的插值方法为:假设一个坐标系统,四个已知点坐标分别为(0,0)、(0,1)、(1,0)和(1,1),插值公式为:f(x,y)=f(0,0)(1-x)(1-y)+f(1,0)x(1-y)+f(0,1)(1-x)y+f(1,1)xy。对格点数据使用双线性插值方法进行站点插值,线性插值的结果与插值的顺序无关,双线性插值的结果与先进行哪个方向的插值无关,先进行y方向的插值或者先进行x方向的插值,所得到的结果是一样的。
本发明目的在于提供一种基于历史多模式预报数据及历史自动站观测数据,利用人工智能多模型集成嵌套框架进行实时智能训练建模,最终构建模式订正参数网络的气象多因子预报方法。风速、最高温度、最低温度、降水分别拟合一个回归器,故而每一个目标可以被一个回归器精确地表示,通过检查对应的回归器,可以获取关于目标的信息。
一种气象要素预报系统,使用所述的一种气象要素预报方法,所述系统包括气象要素预报系统模型,该模型使用管道预测机制,管道预测机制包括缺省预处理器、归一化标准化模块、综合训练器和学习机制训练模型;所述系统包括气象要素预报系统模型,该模型使用管道预测机制,管道预测机制包括缺省预处理器、归一化标准化模块、综合训练器和学习机制训练模型;缺省预处理器对数据进行预处理,归一化标准化模块对数据进行归一化、标准化处理,综合训练器用于训练数据,学习机制训练模型用于对数据实时建模订正。
更进一步的,所述综合训练器包括随机森林训练器、强度自适应训练器、多输出回归分类器、时间序列训练器和降水训练器。
本发明涉及集成多模型的模式预报订正领域,主要是基于一种或多种数值模式预报数据及实况观测数据,利用人工智能大数据模型进行多层嵌套从而构建形成多模型集成框架,实现对模式数据的订正,提高对风速、温度、降水等多种预报因子的预报准确率的方法。
3.有益效果
相比于现有技术,本发明的优点在于:
在当前现状难以满足业务发展需要的情况下,研究科学、有效的精细化温度、风速、降水预报客观方法是形势发展的必然需要。本发明选取的预报因子涉及较广,自动站实况因子的考虑可以起到对数值预报的订正作用。
本发明通过对多种或一种数值预报产品的释用,引入历史观测数据,实时构建站点智能集成嵌套模型,针对全省的70个基准站点,建立温度、降水和风速的短时预报模型,旨在为短时预报提供切实有效的客观预报工具。
本发明基于多模型集成,利用人工智能大数据模型进行多层嵌套从而构建形成多模型集成框架,自动选取多个模式要素因,智能实时建模,可以减少传统MOS因子优选的步骤,有效提升数值预报的结果。同时,模型可以同时考虑,风,温度和降水等多个因子,有效构建特征因子关系网络,实现同步预测。
附图说明
图1为本发明气象要素预报方法流程图;
图2为本发明气象要素预报系统模型框架示意图;
图3为本发明预报方法与EC模式预测结果相关系数对比图;
图4为本发明预报方法与EC模式预测结果的误差对比图;
图5为本发明在58265基准站的模拟结果;
图6为本发明不同等级的降水TS评分计算示意图;
图7为本发明预防方法和EC模式模拟降水的TS评分对比图。
具体实施方式
下面结合说明书附图和具体的实施例,对本发明作详细描述。
实施例
本实施例的气象要素预报系统包括如图2所示气象要素预报系统模型框架,所述模型框架基于人工智能多模型集成嵌套,如图所示,集成嵌套的多模型使用管道(pipeline)预测机制,将多种算法按照封装顺序依次执行。管道预测机制包括缺省预处理器、归一化标准化模块、综合训练器和学习机制训练模型,各模块间数据按数据依次转化。数据先通过缺省预处理器进行预处理,然后在归一化标准被模块进行归一化、标准化处理,随后进入综合训练器进行训练,训练后数据在学习机制训练模型进行实时建模订正。所述综合训练器包括随机森林训练器、强度自适应训练器、多输出回归分类器、时间序列训练器和降水训练器。
基于上述系统提出一种基于人工智能的多模型集成嵌套的预报方法,通过对一种或多种模式预报数据进行历史统计,获取固定站点模式预报数据与实际观测数据的历史气象相关性,优选出模式要素的特征关系,基于该框架实现对固定站点的平均风速、最高温度、最低温度和降水统计订正的方法。
图1是本实施例气象要素预报方法流程,本预报方法基于人工智能多模型集成嵌套实现。结合图1所示的流程,预报方法包括如下步骤:
步骤1:获取自动气象站数据,对数据进行站点插值,形成根据时序排列匹配的站点数据信息。
获取历史自动气象站观测信息,所述历史自动站观测信息包括历史模式预报数据和历史观测数据。
具体的插值方法为:假设一个坐标系统,四个已知点坐标分别为(0,0)、(0,1)、(1,0)和(1,1),插值公式为:f(x,y)=f(0,0)(1-x)(1-y)+f(1,0)x(1-y)+f(0,1)(1-x)y+f(1,1)xy。对格点数据使用双线性插值方法进行站点插值,线性插值的结果与插值的顺序无关,双线性插值的结果与先进行哪个方向的插值无关,先进行y方向的插值或者先进行x方向的插值,所得到的结果是一样的。
步骤2:构建集成模型的底层功能模块,对多种不同的特征数据进行归一化、标准化处理,形成训练器管道机制。
使用pipeline管道机制方法进行训练,整套模型可以认为是一种流水线的输入,涵盖一系列的数据挖掘步骤,从基础数据规整构建到模型的最终预估估计器设定。整个结构环环相扣,包括转换器和估计器两种,输入的数据集经过转换器的处理后,输出的结果作为下一步的输入,最后一步的估计器对数据进行预估。
将缺省预处理器模块和归一化标准化模块设置在集成模型的底层,对进入模型训练器的数据进行预处理。缺省预处理器模块中设定missing_values=NaN,strategy=mean,将输入的无效值用相邻的平均值进行替代。
由于输入的模式预报数据范围区间差别较大,在归一化标准化模块中将输入的不同要素变量进行标准化处理为(-1,1)之间,提升模型的整体运算效率。
步骤3、基于人工智能模型构建多因子的基础训练器。
所述多因子包括日最高温度(即24h气温的最大值)、日最低温度(即24h气温的最小值)、风速和降水四种气象因子,针对不同的气象因子分别建立训练器。所述基础训练器基于多输出回归分类器构建,多输出回归分类器支持被添加到任何回归器中,基于基础的数据处理框架,嵌套多输出回归分类器,可以分别对每个目标:风速、日最高温度、日最低温度和降水分别拟合一个回归器,故而每一个目标均可以被一个回归器精确地表示,通过检查对应的回归器,获取关于目标的信息。由于气象因子彼此具有复杂的物理相关性,在模型的嵌套选取中,考虑多输出因子,即风速、温度和降水的相关性信息。
步骤4、在多因子基础训练器的基础上,集成嵌套强度自适应训练器和随机森林训练器两种回归算法分类器,构建时间序列训练器和降水训练器。
利用集成嵌套的模型对模式预报进行实时建模订正,根据输入的模式预报数据和实时观测数据进行预报。利用强度自适应训练器(AdaBoost)和随机森林(RandomForest,RF)训练模型进行嵌套处理,针对预估得到的降水因子的分布进行重新调整,将随机森林训练器参数中的n_estimators取值为1000,max_features取值为0.75,增强对降水不连续因子的预测效果。同时,将强度自适应训练器AdaBoost的n_estimators取值为50,对降水因子进行细化训练,强度自适应训练器的参数n_estimators表示最大的弱学习器个数。
在随机森林训练器中,假设训练集中有n个样本,每个样本有d个特征,需要训练一个包含T棵数的随机森林,n、d和T均为自然数。具体算法如下所示:
(1)、对于T棵决策树,分别重复如下操作:使用Bootstrap抽样,即有放回的抽样,重复N次,每次抽取m个特征,N和m均为自然数,m值随机选取;
(2)、如果预测是回归问题,输出为连续值,则最后的输出是每个树输出的均值;
(3)、如果预测是分类问题,输出为离散值,则根据投票原则,确定最终的类别。
每棵树的生成都是随机的,至于随机选取的特征数,以及如何决定随机选取的特征数的大小,主要有两种方法,一种是交叉验证,另外一种是经验性设置抽样的特征数m=log2d+1。
随机森林训练器的参数设置中:n_estimators表示最大的弱学习器个数,即建立随机森林分类器(树)的个数。参数sn_estimators增大可以降低整体模型的方差,提升模型的准确度,且不会对子模型的偏差和方差有任何影响。由于降低的是整体模型方差公式的第二项,故准确度的提高有一个上限。根据经验,数据量级在一定范围内时,参数n_estimators取值为1000时,效果一般较好。参数n_jobs表示引擎允许使用处理器的数量,若n_jobs值为1则只能使用一个处理器,n_jobs值为-1则表示没有限制,根据经验设置n_jobs取值为2,也就是使用两个处理器。参数oob_score表示是否采用袋外误差来评估模型的好坏,oob_score值默认为False,设置为True,因为袋外分数反应了一个模型拟合后的泛化能力;max_features表示随机森林算法划分时考虑的最大特征数。可以使用很多种类型的值,默认是"None",意味着划分时考虑所有的特征数;如果是"log2"意味着划分时最多考虑log2N个特征;如果是"sqrt"或者"auto"意味着划分时最多考虑N至
Figure BDA0002686537420000061
个特征。根据样本量进行的经验设定,参数max_features的取值为0.75。
在强度自适应训练器(AdaBoost)中,训练模型具体流程如下:
(a)先通过对M个训练样本的学习得到第一个弱分类器,M为自然数;
(b)将分错的样本和其他的新数据一起构成一个新的M个的训练样本,通过对这个样本的学习得到第二个弱分类器;
(c)将(a)步骤和(b)步骤中都分错的样本加上其他的新样本构成另一个新的M个的训练样本,通过对这个样本的学习得到第三个弱分类器;
(d)最终经过提升的强分类器,即某个数据被分为哪一类要由各分类器权值决定。
由上述强度自适应训练器算法的描述过程可知,该算法在实现过程中根据训练集的大小初始化样本权值,使其满足均匀分布,在后续操作中通过公式来改变和规范化算法迭代后样本的权值。样本被错误分类导致权值增大,反之权值相应减小,这表示被错分的训练样本集包括一个更高的权重。这就会使在下轮时训练样本集更注重于难以识别的样本,针对被错分样本的进一步学习来得到下一个弱分类器,直到样本被正确分类。在达到规定的迭代次数或者预期的误差率时,则强分类器构建完成。
站点数据信息基于强度自适应训练器和随机森林训练器嵌套的分类器,得到预估结果Pre,对预估结果Pre进行平均值和标准化计算处理,针对处理后的结果构建新的要素分布数据,进行二次处理,同时构建时间序列训练器TimeseriesEstimator和降水训练器RaintuningEstimator,输入模型进行训练。
步骤5、利用集成嵌套的模型对模式预报进行实时建模订正,根据输入的模式预报数据和实时观测数据进行预报,输出风速、温度和降水的预报结果。
本实施例基于多模型集成的气象因子预报方法,能够有效提升模式预报的结果,符合气象预报业务要求,根据历史数据提取固定站点的模式预报特征因子,根据观测实时观测数据,智能订正模式业务数据,可以有效提升对风速、温度和降水的预报准确性。
以2018一年的模式预报数据及历史观测数据作为训练样本建立模型,将2019年的模式预报数据输入模型,得到气象预报因子,将自动站观测数据与模型预报结果进行对比分析检验,检验结果与EC模式(ECMWF欧洲中心数值模式,预报准确性较高,在业务预报中具有较强的参考意义)预报的检验结果进行比对。主结果表明集成多模型预报能够在现有模式预报的基础上提升对日最高气温,最低气温,平均风速和降水的预报准确性。
基于江苏的70个基准站数据,释用EC数值模式数据,利用集成嵌套模型框架对2019年的日平均风速、日最高气温、日最低气温和日降水量进行预测,70个站不同要素的预报相关性结果如图3所示,图3中3-a、3-b、3-c和3-d分别代表日降水量、日最高气温、日最低气温和日平均风速,从图3可以看到,模型预报的风速相关性均较原来的模式预报相关性明显提高,温度和降水的相关性提升不是很明显。但是,通过如图4中4-a、4-b、4-c和4-d对应日平均风速、日最高气温、日最低气温和日降水量四种要素的均方根误差分析,可以看到集成多模型预报的要素误差较原始模式预报结果均有降低的趋势。可以得到,集成多模型嵌套方法能够提升模型对四种气象要素的预报结果,改善EC数值模式的系统性预报误差。
图5通过随机选取基准站53265进行预报结果分析,图5中5-a、5-b、5-c和5-d分别代表日降水量、日最高气温、日最低气温和日平均风速。可以看到,与实际观测数据相比,模型预报可以较好地预测出风速和温度的时间变化趋势,并且数值范围较为接近,和原始的EC模式预报结果相比,风速和温度的预报提升较为明显。而对于降水因子而言,模型预报的降水能够一定程度上符合观测降水的变化趋势。但是由于降水因子的不连续性,降水预估效果的不及温度和风速明显。
TS(ThreatScore)评分是一种风险评分,常被用来评价气象预报的准确性,具体含义如图6所示,分为预测值集合和观测值集合,两者交界区域为命中区,TS值=命中值集合/(预测错误值集合+未预测中值集合+命中值集合),其中预测错误值集合=预测值集合-命中值集合,未预测中值集合=观测值集合-命中值集合。
统计70个站的降水预报分级TS评分,如图7中7-a、7-b、7-c和7-d所示,可以看出随着降雨量分别为小雨、中雨、大雨至暴雨量级,模型预报的降水评分较模式有明显提升;其中小雨指日降雨量在10毫米以下;中雨日降雨量为10~24.9毫米;大雨降雨量为25~49.9毫米;暴雨降雨量为50~99.9毫米。总体来看,多模型集成嵌套方法能够较好地进行统计预报,提升原始模式预报的准确性。
本实施例基于人工智能多模型集成嵌套的模型架构,自动选取多个模式要素因子,智能实时建模,减少传统MOS因子优选的步骤,减少预报员的主观性,能够有效提升数值预报的结果。同时,模型可以同时考虑风速,温度和降水等多个气象因子,有效构建特征因子关系网络,实现同步预测。
虽然本发明已较佳实例揭露如上,然其并非用以限定本发明。本发明所属技术领域中具有通常知识者,在不脱离本发明的精神和范围内,当可作各种的更动与润饰。因此,本发明的保护范围当视权利要求书所界定者为准。
以上示意性地对本发明创造及其实施方式进行了描述,该描述没有限制性,在不背离本发明的精神或者基本特征的情况下,能够以其他的具体形式实现本发明。附图中所示的也只是本发明创造的实施方式之一,实际的结构并不局限于此,权利要求中的任何附图标记不应限制所涉及的权利要求。所以,如果本领域的普通技术人员受其启示,在不脱离本创造宗旨的情况下,不经创造性的设计出与该技术方案相似的结构方式及实施例,均应属于本专利的保护范围。此外,“包括”一词不排除其他元件或步骤,在元件前的“一个”一词不排除包括“多个”该元件。产品权利要求中陈述的多个元件也可以由一个元件通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。

Claims (9)

1.一种气象要素预报方法,其特征在于,包括以下步骤:
步骤1:获取自动气象站数据,对数据进行站点插值和预处理,形成时序匹配的站点数据信息;
步骤2:通过归一化标准化模块对站点数据信息进行归一化和标准化处理;
步骤3:针对气象因子分别构建基础训练器,所述气象因子包括日最高温、日最低温、风速和降水;
步骤4:在根据气象因子构建的基础训练器基础上,集成嵌套强度自适应训练器和随机森林训练器两种回归算法分类器,构建时间序列训练器和降水训练器;
步骤5:通过学习机制训练模型对模式预报进行实时建模订正,根据输入的模式预报数据和实时观测数据进行预报;
站点数据信息基于强度自适应训练器和随机森林训练器嵌套的分类器,得到预估结果,对预估结果进行平均值和标准化计算处理,针对处理后的结果构建新的要素分布数据,进行二次处理,同时构建时间序列训练器和降水训练器,输入模型进行训练;
所述预报方法使用管道机制方法,所述管道机制包括转换器和估计器,输入的数据集经过转换器的处理后,输出的结果作为下一步的输入,最后一步的估计器对数据进行预估。
2.根据权利要求1所述的一种气象要素预报方法,其特征在于,步骤4的随机森林训练器中假设训练集中有n个样本,每个样本有d个特征,需要训练一个包含T棵数的随机森林,n、d和T均为自然数,算法如下所示:
(1)、对于T棵决策树,分别重复如下操作:使用有放回的抽样,重复N次,每次抽取m个特征,N和m均为自然数,m值随机选取;
(2)、如果预测是回归问题,则最后的输出是每个树输出的均值;
(3)、如果预测是分类问题,则根据投票原则,确定最终的类别。
3.根据权利要求1所述的一种气象要素预报方法,其特征在于,步骤4的强度自适应训练器训练流程如下:
(a)先通过对M个训练样本的学习得到第一弱分类器,M为自然数;
(b)将分错的样本和其他的新数据构成一个新的M个的训练样本,通过对这个样本的学习得到第二弱分类器;
(c)将(a)步骤和(b)步骤中都分错的样本加上其他的新样本构成另一个新的M个的训练样本,通过对这个样本的学习得到第三弱分类器;
(d)最终经过提升的强分类器,即某个数据被分为哪一类要由各分类器权值决定。
4.根据权利要求2或3所述的一种气象要素预报方法,其特征在于,根据随机森林训练器参数中的最大的弱学习器个数和最大特征数,增强对降水不连续因子的预测效果;根据强度自适应训练器对降水因子进行细化训练。
5.根据权利要求1所述的一种气象要素预报方法,其特征在于,步骤1中自动气象站数据包括历史模式预报数据和历史观测数据。
6.根据权利要求5所述的一种气象要素预报方法,其特征在于,数据经插值后在缺省预处理器进行预处理,将输入的无效值用相邻的平均值进行替代。
7.根据权利要求6所述的一种气象要素预报方法,其特征在于,站点插值使用双线性插值方法。
8.一种气象要素预报系统,其特征在于,使用如权利要求1-7任意一项所述的一种气象要素预报方法,所述系统包括气象要素预报系统模型,该模型使用管道预测机制,管道预测机制包括缺省预处理器、归一化标准化模块、综合训练器和学习机制训练模型;缺省预处理器对数据进行预处理,归一化标准化模块对数据进行归一化、标准化处理,综合训练器用于训练数据,学习机制训练模型用于对数据实时建模订正。
9.根据权利要求8所述的一种气象要素预报系统,其特征在于,所述综合训练器包括随机森林训练器、强度自适应训练器、多输出回归分类器、时间序列训练器和降水训练器。
CN202010977989.7A 2020-09-17 2020-09-17 一种气象要素预报方法和系统 Active CN111929748B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010977989.7A CN111929748B (zh) 2020-09-17 2020-09-17 一种气象要素预报方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010977989.7A CN111929748B (zh) 2020-09-17 2020-09-17 一种气象要素预报方法和系统

Publications (2)

Publication Number Publication Date
CN111929748A CN111929748A (zh) 2020-11-13
CN111929748B true CN111929748B (zh) 2022-12-09

Family

ID=73335222

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010977989.7A Active CN111929748B (zh) 2020-09-17 2020-09-17 一种气象要素预报方法和系统

Country Status (1)

Country Link
CN (1) CN111929748B (zh)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112684520B (zh) * 2020-12-30 2022-12-13 北京墨迹风云科技股份有限公司 一种气象预报的订正方法、装置、计算机设备及存储介质
CN112801357B (zh) * 2021-01-21 2024-04-02 长江慧控科技(武汉)有限公司 日照辐射量预测方法、装置、设备及存储介质
CN112836881A (zh) * 2021-02-08 2021-05-25 国家海洋局东海预报中心 一种近海海面风的预报质量评估方法及装置
CN113034902A (zh) * 2021-03-05 2021-06-25 阿里云计算有限公司 一种交通控制方法、装置及电子设备
CN112949953B (zh) * 2021-05-14 2021-07-16 江苏铨铨信息科技有限公司 基于pp理论和af模型的暴雨预报方法
CN113191568B (zh) * 2021-05-21 2024-02-02 上海市气象灾害防御技术中心(上海市防雷中心) 基于气象的城市运行管理大数据分析预测方法和系统
CN113344290B (zh) * 2021-06-28 2023-02-14 福建师范大学 基于U-Net网络的次季节降水气象预报订正方法
CN113341481A (zh) * 2021-07-02 2021-09-03 北京玖天气象科技有限公司 气象预报结果的确定方法及装置
CN113204061B (zh) * 2021-07-06 2021-10-08 中国气象局公共气象服务中心(国家预警信息发布中心) 一种构建格点风速订正模型的方法及装置
CN114563834B (zh) * 2022-04-27 2022-07-26 知一航宇(北京)科技有限公司 一种数值预报产品解释应用方法及系统
CN115079307B (zh) * 2022-06-09 2023-07-25 中能融合智慧科技有限公司 一种基于多模式最优集成的风电场气象预报方法和系统
CN114792174A (zh) * 2022-06-23 2022-07-26 国网天津市电力公司电力科学研究院 一种基于小波神经网络的配网线路气象预测方法
CN115293410A (zh) * 2022-07-20 2022-11-04 中科三清科技有限公司 气温预测方法、装置、存储介质及电子设备
CN117290792B (zh) * 2023-11-14 2024-05-28 广东省气象服务中心(广东气象影视宣传中心) 一种基于机器学习的气压预报系统及方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2013207551B2 (en) * 2012-07-20 2015-12-17 Tata Consultancy Services Limited Method and system for adaptive forecast of wind resources
CN104463196B (zh) * 2014-11-11 2017-07-25 中国人民解放军理工大学 一种基于视频的天气现象识别方法
CN107179566A (zh) * 2017-05-12 2017-09-19 周调彪 一种区县天气预测的自学习修正方法及系统
CN107991721B (zh) * 2017-11-21 2020-05-08 上海电力学院 一种基于天文和气象环境因子的逐时散射比预测方法
CN108519629A (zh) * 2018-03-20 2018-09-11 叶玉妹 通用航空气象信息处理系统

Also Published As

Publication number Publication date
CN111929748A (zh) 2020-11-13

Similar Documents

Publication Publication Date Title
CN111929748B (zh) 一种气象要素预报方法和系统
Lu et al. Review of meta-heuristic algorithms for wind power prediction: Methodologies, applications and challenges
CN109508360B (zh) 一种基于元胞自动机的地理多元流数据时空自相关分析方法
CN110751318B (zh) 一种基于ipso-lstm的超短期电力负荷预测方法
CN109345027B (zh) 基于独立成分分析与支持向量机的微电网短期负荷预测方法
CN107818302A (zh) 基于卷积神经网络的非刚性多尺度物体检测方法
CN106779087A (zh) 一种通用机器学习数据分析平台
CN111695731B (zh) 基于多源数据和混合神经网络的负荷预测方法、系统及设备
CN111696101A (zh) 一种基于SE-Inception的轻量级茄科病害识别方法
CN109583565A (zh) 基于注意力模型长短时记忆网络的洪水预测方法
CN110837915B (zh) 一种基于混合集成深度学习的电力系统低压负荷点预测及概率预测方法
CN114444378A (zh) 一种区域风电集群的短期功率预测方法
CN109934422A (zh) 一种基于时间序列数据分析的神经网络风速预测方法
CN114169445A (zh) 基于cae和gan混合网络的日前光伏功率预测方法、装置与系统
CN110163444A (zh) 一种基于gasa-svr的需水预测方法
CN110717581A (zh) 一种基于温度模糊处理和dbn的短期负荷预测方法
CN110334584A (zh) 一种基于区域全卷积网络的手势识别方法
CN113033081A (zh) 一种基于som-bpnn模型的径流模拟方法及系统
CN115099511A (zh) 基于优化copula的光伏功率概率估计方法及系统
CN114627467A (zh) 基于改进神经网络的水稻生育期识别方法及系统
Yang et al. A multi-factor forecasting model for carbon emissions based on decomposition and swarm intelligence optimization
CN103605493A (zh) 基于图形处理单元的并行排序学习方法及系统
CN116706907B (zh) 基于模糊推理的光伏发电预测方法和相关设备
CN114120367B (zh) 元学习框架下基于圆损失度量的行人重识别方法及系统
CN115423091A (zh) 一种条件对抗神经网络训练方法、场景生成方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant