CN112053005B - 一种主客观降水预报的机器学习融合方法 - Google Patents

一种主客观降水预报的机器学习融合方法 Download PDF

Info

Publication number
CN112053005B
CN112053005B CN202010967791.0A CN202010967791A CN112053005B CN 112053005 B CN112053005 B CN 112053005B CN 202010967791 A CN202010967791 A CN 202010967791A CN 112053005 B CN112053005 B CN 112053005B
Authority
CN
China
Prior art keywords
precipitation
data
subjective
forecast
objective
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010967791.0A
Other languages
English (en)
Other versions
CN112053005A (zh
Inventor
康志明
李杨
蔡凝昊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiang Sushengqixiangtai
Original Assignee
Jiang Sushengqixiangtai
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiang Sushengqixiangtai filed Critical Jiang Sushengqixiangtai
Priority to CN202010967791.0A priority Critical patent/CN112053005B/zh
Publication of CN112053005A publication Critical patent/CN112053005A/zh
Application granted granted Critical
Publication of CN112053005B publication Critical patent/CN112053005B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01WMETEOROLOGY
    • G01W1/00Meteorology
    • G01W1/10Devices for predicting weather conditions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2111/00Details relating to CAD techniques
    • G06F2111/10Numerical modelling
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Software Systems (AREA)
  • Business, Economics & Management (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Medical Informatics (AREA)
  • Environmental & Geological Engineering (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Quality & Reliability (AREA)
  • Computing Systems (AREA)
  • Game Theory and Decision Science (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Mathematical Physics (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Computer Hardware Design (AREA)
  • Geometry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Atmospheric Sciences (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Ecology (AREA)
  • Environmental Sciences (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明实施例公开了降水预报技术领域的一种主客观降水预报的机器学习融合方法,包括如下步骤:S1、对数值模式确定性预报历史资料进行整编,得到长度不小于一年的降水及与降水相对应的预设相关物理量的标准化数据集Q1;S2、对数值模式集合预报历史资料进行整编,得到长度不小于一年的全集成员降水预报标准化数据集Q2;S3、通过CIMISS数据接口获取长度不小于一年的自动观测站实况降水资料,并整编为标准化数据集Q3。本发明通过建立降水空间分布与数值模式降水及相关产品之间数学模型的方法,解决丢失数值模式降水特征,缺少物理意义的问题。通过重构整个降水空间场内的降水分布特征,解决融合边界处降水量不连续的问题。

Description

一种主客观降水预报的机器学习融合方法
技术领域
本发明实施例涉及降水预报技术领域,尤其涉及一种主客观降水预报的机器学习融合方法。
背景技术
现有的主客观降水预报融合方案主要采用反距离权重插值方法实现,该方法在主客观降水量级相同的区域内不做改变,而在其存在差异的部分采用计算格点与两者落区边缘之间距离差异的方式得到该区域内的具体降水数值。其主要缺点如下:
1、在融合区域丢失了原有数值模式降水的空间分布特征,缺少物理意义;
2、在融合区域边界处容易出现降水量不连续的现象;
3、当空间分辨率过高即格点数过多时,插值计算效率较低,运算时间过长。
基于此,本发明设计了一种主客观降水预报的机器学习融合方法,以解决上述问题。
发明内容
本发明实施例提供一种主客观降水预报的机器学习融合方法,以解决背景技术中提及的技术问题。
本发明实施例提供一种主客观降水预报的机器学习融合方法。在一种可行的方案中,包括如下步骤:
S1、对数值模式确定性预报历史资料进行整编,得到长度不小于一年的降水及与降水相对应的预设物理量的标准化数据集Q1;
S2、对数值模式集合预报历史资料进行整编,得到长度不小于一年的全集成员降水预报标准化数据集Q2;
S3、通过CIMISS数据接口获取长度不小于一年的自动观测站实况降水资料,并整编为标准化数据集Q3;
S4、比对标准化数据集Q1、Q2和Q3,剔除任一数据不齐全时段,将得到相同时段内的规整数据集建立模型;
S5、分析筛选出指定数量的与降水空间分布特征关系相关联的重要性预报因子,并进入模型构建阶段;
S6、通过机器回归方案学习,构建降水空间分布特征与数值模式预报因子之间的关系,并建立预报模型;
S7、通过主观降水落区预报相关降水量级等值线数据;
S8、根据降水空间分布特征模型在不同等值线区域内重构与主观降水落区相符的降水格点场;
S9、融合各降水量级格点场,得出主客观融合预报结果。
本发明实施例提供一种主客观降水预报的机器学习融合方法。在一种可行的方案中,所述S1中相关物理量包括涡度信息、散度信息、水汽通量信息以及不同高度水汽信息。
本发明实施例提供一种主客观降水预报的机器学习融合方法。在一种可行的方案中,所述S1中的标准化数据集为统一空间分辨率的点格数据形式。
本发明实施例提供一种主客观降水预报的机器学习融合方法。在一种可行的方案中,所述S5中筛选预报因子的方法为随机森林法。
本发明实施例提供一种主客观降水预报的机器学习融合方法。在一种可行的方案中,所述S6中机器回归方案学习包括GBDT回归方案学习和ADABOOST回归方案学习中的其中一种。
基于上述方案可知,本发明的有益效果为,
1、本发明通过通过建立降水空间分布与数值模式降水及相关产品之间数学模型的方法,解决丢失数值模式降水特征,缺少物理意义的问题;
2、通过重构整个降水空间场内的降水分布特征,解决融合边界处降水量不连续的问题;
3、通过在业务运行时间外每隔固定时间建模,解决计算效率低下,运行时间过长的问题。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明融合方法的流程框图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”、“轴向”、“径向”、“周向”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
在本发明中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”、“固定”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,也可以是成一体;可以是机械连接,也可以是电连接,也可以是通讯连接;可以是直接连接,也可以通过中间媒介的间接连接,可以是两个元件内部的连通或两个元件的相互作用关系,除非另有明确的限定。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
下面以具体地实施例对本发明的技术方案进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例不再赘述。
图1为本发明提供的一种主客观降水预报的机器学习融合方法;包括如下步骤:
S1、对数值模式确定性预报历史资料进行整编,得到长度不小于一年的降水及与降水相对应的预设物理量的标准化数据集Q1;
S2、对数值模式集合预报历史资料进行整编,得到长度不小于一年的全集成员降水预报标准化数据集Q2;
S3、通过CIMISS数据接口获取长度不小于一年的自动观测站实况降水资料,并整编为标准化数据集Q3;
S4、比对标准化数据集Q1、Q2和Q3,剔除任一数据不齐全时段,将得到相同时段内的规整数据集建立模型;
S5、分析筛选出指定数量的与降水空间分布特征关系相关联的重要性预报因子,并进入模型构建阶段;
S6、通过机器回归方案学习,构建降水空间分布特征与数值模式预报因子之间的关系,并建立预报模型;
S7、通过主观降水落区预报相关降水量级等值线数据;
S8、根据降水空间分布特征模型在不同等值线区域内重构与主观降水落区相符的降水格点场;
S9、融合各降水量级格点场,得出主客观融合预报结果。
通过上述内容不难发现,通过本发明的主客观降水预报的机器学习融合方法对降水预报学习过程中,将确定性预报降水及其相关变量与其相关的物理量预报,集合预报所有集合成员的降水量预报以及自动站实况降水数据作为基础数据。分析数值模式确定性预报降水及分析降水分布情况与数值模式预报之间的联系,进而利用统计和机器学习方法建立可以描述区域内降水分布特征的预报模型。之后根据主观降水落区的降水等值线划分情况,在同一降水量级区域中应用降水分布特造型,重构该区域的内部分布特征。最终得到一套主客观降水融合预报产品;通过建立降水空间分布与数值模式降水及相关产品之间数学模型的方法,解决丢失数值模式降水特征,缺少物理意义的问题。通过重构整个降水空间场内的降水分布特征,解决融合边界处降水量不连续的问题。通过在业务运行时间外每隔固定时间建模,解决计算效率低下,运行时间过长的问题。
可选地,所述S1中相关物理量包括涡度信息、散度信息、水汽通量信息以及不同高度水汽信息。值得说明的是,在本实施例中,涡度信息为围绕垂直轴旋转的涡度分量,散度信息为降水从周围汇合到某一处或从某一处流散开来程度的量,为衡量速度场辐散、辐合强度的物理量;水汽通量信息为水平方向或树枝方向的水汽输送量。
此外,所述S1中的标准化数据集为统一空间分辨率的点格数据形式。
再具体地说,所述S5中筛选预报因子的方法为随机森林法,通过利用随机森林法对预报因子进行筛选工作,可以对标准化数据集产生高准确度的分类器,处理大量的输入变量,减少误差评估,学习过程快捷。
进一步的,所述S6中机器回归方案学习包括GBDT回归方案学习和ADABOOST回归方案学习中的其中一种,在利用ADABOOST回归方案学习时,能“聚焦于”那些较难分(更富信息)的样本上;在具体实现上,最初令每个样本的权重都相等,对于第k次迭代操作,根据这些权重来选取样本点,进而训练分类器。
在本发明中,除非另有明确的规定和限定,第一特征在第二特征“上”或“下”可以是第一特征和第二特征直接接触,或第一特征和第二特征通过中间媒介间接接触。
而且,第一特征在第二特征“之上”、“上方”和“上面”可以是第一特征在第二特征正上方或斜上方,或仅仅表示第一特征水平高度高于第二特征。第一特征在第二特征“之下”、“下方”和“下面”可以是第一特征在第二特征正下方或斜下方,或仅仅表示第一特征水平高度低于第二特征。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”或“一些示例”等的描述,意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任意一个或者多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (3)

1.一种主客观降水预报的机器学习融合方法,其特征在于,包括如下步骤:
S1、对数值模式确定性预报历史资料进行整编,得到长度不小于一年的降水及与降水相对应的预设物理量的标准化数据集Q1;
S2、对数值模式集合预报历史资料进行整编,得到长度不小于一年的全集成员降水预报标准化数据集Q2;
S3、通过CIMISS数据接口获取长度不小于一年的自动观测站实况降水资料,并整编为标准化数据集Q3;
S4、比对标准化数据集Q1、Q2和Q3,剔除任一数据不齐全时段,将得到相同时段内的规整数据集建立模型;
S5、分析筛选出指定数量的与降水空间分布特征关系相关联的重要性预报因子,并进入模型构建阶段;
S6、通过机器回归方案学习,构建降水空间分布特征与数值模式预报因子之间的关系,并建立预报模型;
S7、通过主观降水落区预报相关降水量级等值线数据;
S8、根据降水空间分布特征模型在不同等值线区域内重构与主观降水落区相符的降水格点场;
S9、融合各降水量级格点场,得出主客观融合预报结果;
其中,所述S5中筛选预报因子的方法为随机森林法;所述S6中机器回归方案学习包括GBDT回归方案学习和ADABOOST回归方案学习中的其中一种。
2.根据权利要求1所述的一种主客观降水预报的机器学习融合方法,其特征在于,所述S1中相关物理量包括涡度信息、散度信息、水汽通量信息以及不同高度水汽信息。
3.根据权利要求1所述的一种主客观降水预报的机器学习融合方法,其特征在于,所述S1中的标准化数据集为统一空间分辨率的点格数据形式。
CN202010967791.0A 2020-09-15 2020-09-15 一种主客观降水预报的机器学习融合方法 Active CN112053005B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010967791.0A CN112053005B (zh) 2020-09-15 2020-09-15 一种主客观降水预报的机器学习融合方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010967791.0A CN112053005B (zh) 2020-09-15 2020-09-15 一种主客观降水预报的机器学习融合方法

Publications (2)

Publication Number Publication Date
CN112053005A CN112053005A (zh) 2020-12-08
CN112053005B true CN112053005B (zh) 2024-04-02

Family

ID=73603151

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010967791.0A Active CN112053005B (zh) 2020-09-15 2020-09-15 一种主客观降水预报的机器学习融合方法

Country Status (1)

Country Link
CN (1) CN112053005B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112819237B (zh) * 2021-02-08 2021-09-14 广东省气象台(南海海洋气象预报中心) 降水多尺度融合预报方法和装置
CN113537648B (zh) * 2021-09-16 2021-12-24 国能日新科技股份有限公司 一种基于集合数据的风速预测方法及装置
CN114648181B (zh) * 2022-05-24 2022-11-18 国能大渡河大数据服务有限公司 一种基于机器学习的降水预报修正方法及系统
CN117111181B (zh) * 2023-09-05 2024-04-09 浙江省气象台 一种短时强降水概率预报方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104298851A (zh) * 2014-07-22 2015-01-21 兰州大学 一种用于预报强降水天气的数据处理方法
CN104951847A (zh) * 2014-12-31 2015-09-30 广西师范学院 一种基于核主成分分析和基因表达式编程的降水预报方法
CN110058328A (zh) * 2019-01-30 2019-07-26 沈阳区域气候中心 东北夏季降水多模式组合降尺度预测方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104298851A (zh) * 2014-07-22 2015-01-21 兰州大学 一种用于预报强降水天气的数据处理方法
CN104951847A (zh) * 2014-12-31 2015-09-30 广西师范学院 一种基于核主成分分析和基因表达式编程的降水预报方法
CN110058328A (zh) * 2019-01-30 2019-07-26 沈阳区域气候中心 东北夏季降水多模式组合降尺度预测方法

Also Published As

Publication number Publication date
CN112053005A (zh) 2020-12-08

Similar Documents

Publication Publication Date Title
CN112053005B (zh) 一种主客观降水预报的机器学习融合方法
US11168667B2 (en) Method and device for calculating power generation of wind farm
CN108375808A (zh) Nriet基于机器学习的大雾预报方法
CN105182450A (zh) 一种强对流天气短时预警系统
CN106780089B (zh) 基于神经网络元胞自动机模型的永久性基本农田划定方法
CN102411729B (zh) 基于自适应线性逻辑网络的风电功率预测方法
CN111666656A (zh) 基于微波雨衰的降雨估算方法及降雨监测系统
CN104764868B (zh) 一种基于地理加权回归的土壤有机碳预测方法
CN110490415A (zh) 一种多无人机视觉协同的建筑进度评估方法
CN107610021A (zh) 环境变量时空分布的综合分析方法
CN102183621A (zh) 水产养殖溶解氧浓度在线预测方法及系统
CN105930900B (zh) 一种混合风力发电的预测方法及系统
CN109840260A (zh) 一种基于动态插补的大规模实时降雨自动观测站分级数据处理方法
CN110134907B (zh) 一种降雨缺失数据填补方法、系统及电子设备
CN110826231B (zh) 一种气象站点多源数据整合方法
CN108632832B (zh) 网络覆盖分析方法及系统
KR100920529B1 (ko) 염해 오손 예측 방법
CN111465025B (zh) 一种基于新型容量预测模型的旅游城市5g网络组网方法
Yu et al. Parametrically generating new instances of traditional Chinese private gardens that replicate selected socio-spatial and aesthetic properties
CN115239105A (zh) 一种在役风电场的风资源的评估方法以及装置
KR101094221B1 (ko) 수문 및 수리분석 통합시스템
CN114298270A (zh) 融合领域知识的污染物浓度预测方法及其相关设备
CN113435630B (zh) 一种产流模式自适应的流域水文预报方法及系统
CN107436987B (zh) 一种热对流风暴演变预报概念模型的建立方法
CN116520457B (zh) 复杂地形下重大气象活动的区域集合预报方法及预报装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant