CN112684520A - 一种气象预报的订正方法、装置、计算机设备及存储介质 - Google Patents

一种气象预报的订正方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN112684520A
CN112684520A CN202011644620.0A CN202011644620A CN112684520A CN 112684520 A CN112684520 A CN 112684520A CN 202011644620 A CN202011644620 A CN 202011644620A CN 112684520 A CN112684520 A CN 112684520A
Authority
CN
China
Prior art keywords
data
meteorological
model
data set
historical
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011644620.0A
Other languages
English (en)
Other versions
CN112684520B (zh
Inventor
马新野
黄耀海
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Moji Fengyun Technology Co ltd
Original Assignee
Beijing Moji Fengyun Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Moji Fengyun Technology Co ltd filed Critical Beijing Moji Fengyun Technology Co ltd
Priority to CN202011644620.0A priority Critical patent/CN112684520B/zh
Publication of CN112684520A publication Critical patent/CN112684520A/zh
Application granted granted Critical
Publication of CN112684520B publication Critical patent/CN112684520B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种气象预报的订正方法、装置、计算机设备及存储介质,包括,采集气象历史数值预报数据、采集气象历史观测数据和采集静态特征数据,并对气象历史数值预报数据预处理、气象历史观测数据预处理和静态特征数据加工,得到特征变量、模型特征数据集和模型标签数据集;应用机器学习框架对订正模型进行训练,得到订正模型;对实时采集的气象数值预报数据进行预处理得到预测数据集;应用预测数据集和订正模型输出实时订正后的气象预报结果;本发明利用高程数据加工地形起伏状态变量和太阳入射角度,该变量的引入可以对地形陡峭区域气温、风速等气象要素进行更加有效订正,提高该地区气象预报准确率,降低人们对气象预期和实际体感的落差。

Description

一种气象预报的订正方法、装置、计算机设备及存储介质
技术领域
本发明涉及气象预报领域,特别涉及一种气象预报的订正方法、装置、计算机设备及存储介质。
背景技术
天气预报是应用大气变化的规律,根据当前及近期的天气形势,对某一地未来一定时期内的天气状况进行预测。它是根据对卫星云图和天气图的分析,结合有关气象资料、地形和季节特点、群众经验等综合研究后作出的。
数值天气预报是指根据大气实际情况,在一定的初值和边界条件下,通过大型计算机作为数值计算,求解描写天气演变过程的流体力学和热力学的方程组,预测未来一定时段的大气运动状态和天气现象的方法。
数值天气预报普遍存在系统性偏差,通常通过后订正技术对预报偏差进行校正来提高预报的准确率。数值天气预报后订正技术通过学习历史数值天气预报、地形高度等特征和历史气象要素观测真值之间的规律来训练订正模型,再利用订正模型对未来的天气预报结果进行校正,从而达到提高预报准确率的目的。
地形对气温、风速等气象要素均有不可忽视的影响,目前的气象预报后订正技术通常在模型中加入高程数据来表征地形高度特征,通过学习地形高度对气温、风速等的影响规律来对气象预报结果作出相应的调整。
本发明人经研究发现,现有技术中,在地形陡峭区域,对于具有相同或相近的海拔高度、但具有迥异的地形起伏状态的邻近2个站点,例如2个海拔很接近,分别处于邻近的山谷和山顶的站点,由于现有的订正模型仅仅考虑气象和海拔因子,无法反映出处于不同地形起伏状态下的实际气象差异性,进而导致陡峭地形区域气象预报准确率降低,使人们的气象预期和实际体感之间产生落差。
发明内容
本发明实施例提供了一种气象预报的订正方法、装置、计算机设备及存储介质。为了对披露的实施例的一些方面有一个基本的理解,下面给出了简单的概括。该概括部分不是泛泛评述,也不是要确定关键/重要组成元素或描绘这些实施例的保护范围。其唯一目的是用简单的形式呈现一些概念,以此作为后面的详细说明的序言。
根据本发明第一方面,提供了一种气象预报的订正方法,包括:
在接收到用户发出的气象预报订正请求的情形下,获取气象历史数值预报数据,对所述气象历史数值预报数据进行预处理得到气象历史数值预报特征;获取地形高度特征、地形起伏状态特征和太阳入射角特征,作为静态特征数据,对所述静态特征数据加工,并和气象历史数值预报特征合并得到模型特征数据集;
获取气象历史观测数据,对所述气象历史观测数据进行预处理得到模型标签数据集;
根据所述模型特征数据集和所述模型标签数据集,对订正模型进行训练,生成订正模型,并保存所述订正模型;
获取实时采集到的气象数值预报数据,对所述气象数值预报数据进行预处理得到实时气象数值预报特征,和静态特征数据合并得到预测数据集,将所述预测数据集输入订正模型,输出实时订正后的气象预报结果。
进一步地,所述对所述气象历史数值预报数据进行预处理得到气象历史数值预报特征,对所述气象历史观测数据进行预处理得到模型标签数据,包括,
根据需要订正的气象要素,从所述气象历史数值预报数据中选择并提取对应的气象特征变量;
结合站点及周边格点的经纬度信息,计算出站点与格点距离,根据最近距离原则确定距离站点最近的格点,并提取气象特征变量数据矩阵;
根据时间序列,对所述气象历史观测数据进行筛选,去除连续缺测的时段;对非连续缺测的时刻用前后观测向内插值方法补全;
使所述气象历史观测数据与气象特征变量数据矩阵按照时间对齐,去掉没有观测值时刻的样本,分别得到模型标签数据集和气象历史数值预报特征。
进一步地,所述根据需要订正的气象要素,从所述气象历史数值预报数据中选择并提取对应的气象特征变量,包括,
在所述需要订正的气象要素是风速的情形下,从所述气象历史数值预报数据中选择并提取气压、风速以及位势高度,作为气象历史数值预报特征;
在所述需要订正的气象要素是气温的情形下,从所述气象历史数值预报数据中选择并提取气温、风速、降水量以及总云量,作为气象历史数值预报特征。
进一步地,所述获取地形高度特征、地形起伏状态特征和太阳入射角特征,作为静态特征数据,对所述静态特征数据加工,并和气象历史数值预报特征合并得到模型特征数据集,包括,
获取地形高度特征,对所述地形高度特征进行加工,得到各站点的海拔高度;
获取地形起伏状态特征,对地形起伏状态特征的各空间点计算高程的东西向、南北向梯度,得到地形起伏特征;
获取太阳入射角特征,对所述太阳入射角特征进行计算,得到指定位置太阳高度角。
进一步地,所述获取地形高度特征,对所述地形高度特征进行加工,得到各站点的海拔高度,包括,
下载全球30米分辨率的高程数据;
从站点地理信息表获取每个站点的海拔高度;
对站点海拔高度信息缺少的情形,结合站点及其周边高程数据栅格点的经纬度信息,计算出站点-栅格点距离,根据最近距离原则确定距离站点最近的栅格点,提取该格点高程数据作为站点的海拔高度;
对于数值预报不存在海拔高度的情形,针对每一个数值预报格点,按照最近距离原则从邻近栅格点获取海拔高度。
进一步地,所述对所述太阳入射角特征进行计算,得到指定位置太阳高度角,包括,根据日期和时间算出指定地点在平面上投影点的太阳高度角a;
根据高程数据算出指定位置的坡面角度α;
如果是阳面,其太阳高度角b=a+α,如果是阴面,其太阳高度角c=a-α。
进一步地,所述对订正模型进行训练,包括,
对时间特征进行编码:时间要素包括月份、时间、预报时效3个要素,其中月份和时间分别采用正弦值(sin)和余弦值(cos)进行编码;预报时效采用绝对值;
以模型特征数据集为X和模型标签数据集为Y按照7:1.5:1.5的比例划分成训练数据集、验证数据集和测试数据集;
利用LightGBM机器学习框架对训练数据集进行拟合训练,并在训练过程中利用验证数据集进行检验拟合状态,再将训练出的模型对测试数据集进行预测测试,最终选择出收敛、预测准确率较高且鲁棒性较好的订正模型。
根据本发明第二方面,提供一种气象预报的订正装置,包括:
历史数据加工模块,用于在接收到用户发出的气象预报订正请求的情形下,获取气象历史数值预报数据和气象历史观测数据,对所述气象历史数值预报数据和所述气象历史观测数据进行预处理分别得到气象历史数值预报特征和模型标签数据集;
静态数据加工模块,用于获取地形高度特征、地形起伏状态特征和太阳入射角特征,作为静态特征数据,对所述静态特征数据加工,与所述历史数据加工模块连接,得到模型特征数据集;
模型训练模块,分别与所述历史数据加工模块和所述静态数据加工模块连接,用于根据所述模型特征数据集和所述模型标签数据集,对订正模型进行训练,生成订正模型,并保存所述订正模型;
订正模块,所述模型训练模块连接,用于获取实时采集到的气象数值预报数据,对所述气象数值预报数据进行预处理,和静态特征合并得到预测数据集,将所述预测数据集输入订正模型,输出实时订正后的气象预报结果。
根据本发明第三方面,提供一种计算机设备,包括:处理器和存储器,以及存储在所述存储器中,并能在处理器中运行的计算机程序,所述处理器执行所述程序能够实现如上任一项所述的方法的步骤。
根据本发明第四方面,提供一种计算机可读存储介质,包括,所述计算机可读存储介质中保存有计算机程序,所述程序用于实现如上任一项所述的方法。
本发明实施例提供的技术方案可以包括以下有益效果:
根据上述实施例,本发明提供一种气象预报的订正方法,利用高程数据加工地形高度海拔特征、地形起伏状态特征和太阳入射角度特征,这些变量可以区分海拔高度接近且相互邻近的站点之间地理特征的差别,进而可以对地形陡峭区域气温、风速等气象要素进行更加有效订正,提高该地区气象预报准确率,降低人们对气象预期和实际体感的落差。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
图1是根据一示例性实施例示出的一种气象预报的订正方法流程示意图;
图2是根据一示例性实施例示出的全球30米分辨率高程数据图;
图3是根据一示例性实施例示出的高程梯度和S变量组合所代表的地形起伏状态特征东-西向示意图;
图4是根据一示例性实施例示出的太阳高度角与坡度的关系示意图;
图5a是根据一示例性实施例示出的旧模型(未应用地形起伏特征)预估A和B邻近两站点气温和风速订正结果图;
图5b是根据一示例性实施例示出的新模型(应用地形起伏特征)预估A和B邻近两站点气温和风速订正结果图。
具体实施方式
以下描述和附图充分地示出本发明的具体实施方案,以使本领域的技术人员能够实践它们。实施例仅代表可能的变化。除非明确要求,否则单独的部件和功能是可选的,并且操作的顺序可以变化。一些实施方案的部分和特征可以被包括在或替换其他实施方案的部分和特征。本发明的实施方案的范围包括权利要求书的整个范围,以及权利要求书的所有可获得的等同物。在本文中,各实施方案可以被单独地或总地用术语“发明”来表示,这仅仅是为了方便,并且如果事实上公开了超过一个的发明,不是要自动地限制该应用的范围为任何单个发明或发明构思。本文中,诸如第一和第二等之类的关系术语仅仅用于将一个实体或者操作与另一个实体或操作区分开来,而不要求或者暗示这些实体或操作之间存在任何实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素。本文中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的结构、产品等而言,由于其与实施例公开的部分相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本公开的范围。
需要说明的是,尽管在附图中以特定顺序描述了本公开中方法的各个步骤,但是,这并非要求或者暗示必须按照该特定顺序来执行这些步骤,或是必须执行全部所示的步骤才能实现期望的结果。附加的或备选的,可以省略某些步骤,将多个步骤合并为一个步骤执行,以及/或者将一个步骤分解为多个步骤执行等。
下面结合附图及实施例对本发明做进一步描述:
如图1所示的一种气象预报的订正方法,包括:
S1:在接收到用户发出的气象预报订正请求的情形下,获取气象历史数值预报数据和气象历史观测数据,对气象历史数值预报数据和气象历史观测数据进行预处理分别得到气象历史数值预报特征和模型标签数据集;
在本发明实施例中,在接收到用户发出的气象预报订正请求的情形下,获取气象历史数值预报数据和气象历史观测数据,对气象历史数值预报数据进行预处理,包括,
根据需要订正的气象要素,从气象历史数值预报数据中选择并提取对应的气象特征变量;
进一步地,在需要订正的气象要素是风速的情形下,从气象历史数值预报数据中选择并提取地表气压、10米全风速、10米纬向风速、10米经向风速、边界层高度、1000百帕位势高度、925百帕位势高度、850百帕位势高度,作为历史气象特征变量;
在需要订正的气象要素是气温的情形下,从气象历史数值预报数据中选择并提取2米气温、10米纬向风速、10米经向风速、降水量、1000百帕气温、925百帕气温、850百帕气温、总云量,作为历史气象特征变量。
结合站点及周边格点的经纬度信息,计算出站点与格点距离,根据最近距离原则确定距离站点最近的格点,并提取气象特征变量数据矩阵。
对气象历史观测数据进行预处理,包括,
根据时间序列,对气象历史观测数据进行筛选,去除连续缺测的时段;对非连续缺测的时刻用前后观测向内插值方法补全;
使气象历史观测数据与气象特征变量数据矩阵按照时间对齐,去掉没有观测值时刻的样本,分别得到模型标签数据集和气象历史数值预报特征。
S2:获取地形高度特征、地形起伏状态特征和太阳入射角特征,作为静态特征数据,对静态特征数据加工,和气象历史数值预报特征合并得到模型特征数据集;
本发明实施例中,获取地形高度特征,对地形高度特征进行加工,得到各站点的海拔高度,具体包括,
下载全球30米分辨率的高程数据;
从站点地理信息表获取每个站点的海拔高度;
对站点海拔高度信息缺少的情形,结合站点及其周边高程数据栅格点的经纬度信息,计算出站点-栅格点距离,根据最近距离原则确定距离站点最近的栅格点,提取该格点高程数据作为站点的海拔高度;
对于数值预报不存在海拔高度的情形,针对每一个数值预报格点,按照最近距离原则从邻近栅格点获取海拔高度。
获取地形起伏状态特征,对地形起伏状态特征的各空间点计算高程的东西向、南北向梯度,得到地形起伏特征,获取太阳入射角特征,对太阳入射角特征进行计算,得到指定位置太阳高度角。
其中计算太阳高度角的方法,包括,根据日期和时间算出指定地点在平面上投影点的太阳高度角a;
根据高程数据算出指定位置的坡面角度α;
如果指定地点是处于阳面,其太阳高度角b=a+α,如果指定地点是处于阴面,其太阳高度角c=a-α。
S3:根据模型特征数据集和模型标签数据集,对订正模型进行训练,生成订正模型,并保存订正模型;
本发明中,对时间特征进行编码:时间要素包括月份、时间、预报时效3个要素,其中月份和时间分别采用正弦值(sin)和余弦值(cos)进行编码;预报时效采用绝对值;
以模型特征数据集为X和模型标签数据集为Y按照7:1.5:1.5的比例划分成训练数据集、验证数据集和测试数据集;
利用LightGBM机器学习框架对训练数据集进行拟合训练,并在训练过程中利用验证数据集进行检验拟合状态,再将训练出的模型对测试数据集进行预测测试,最终选择出收敛、预测准确率较高且鲁棒性较好的订正模型。
S4:获取实时采集到的气象数值预报数据,对气象数值预报数据进行预处理,和静态特征合并得到预测数据集,将预测数据集输入订正模型,输出实时订正后的气象预报结果。
在本发明另一实施例中,一种气象预报的订正方法,包括,
S01:采集气象历史数值预报数据(特征)、采集气象历史观测数据(标签)和采集静态特征数据,并对气象历史数值预报数据预处理、气象历史观测数据预处理和静态特征数据加工,得到气象历史数值预报特征变量、模型标签数据集和静态特征;
S02:根据所述模型特征数据集和模型标签数据集,应用LightGBM机器学习框架对订正模型进行训练,得到订正模型;
S03:对实时采集的气象数值预报数据进行预处理,和静态特征合并得到预测数据集;
S04:应用预测数据集和订正模型输出实时订正后的气象预报结果。
根据上述方案,进一步,所述采集气象历史数值预报数据:根据模型训练所需样本的时段和时间长度,采集足够长的历史预报数据;所述采集气象历史观测数据:根据模型训练选定的时间范围,采集对应气象历史数值预报数据时段的历史观测数据。
表1训练风速订正模型所需气象特征变量列表(部分)
Figure BDA0002873463540000071
Figure BDA0002873463540000081
表2训练气温订正模型所需气象特征变量列表(部分)
序号 气象变量(特征)
1 2米气温
2 10米纬向风速
3 10米经向风速
4 降水量
5 1000百帕气温
6 925百帕气温
7 850百帕气温
8 总云量
根据上述方案,进一步,所述气象历史数值预报数据预处理包括:
根据需要订正的气象要素,从气象历史观测数据中选择并提取相应的气象特征变量;
结合站点及其周边格点的经纬度信息,计算出站点-格点距离,根据最近距离原则确定距离站点最近的格点,并提取气象特征变量数据矩阵。
根据上述方案,进一步,所述气象历史观测数据预处理包括:
根据时间序列,对气象历史观测数据进行筛选,去除连续缺测的时段;对非连续缺测的时刻用前后观测向内插值方法补全;
使气象历史观测数据与气象特征变量数据矩阵按照时间对齐,去掉没有观测值时刻的样本。
根据上述方案,进一步,所述静态特征包括,地形数据和太阳入射角度,所述地形数据包括,地形高度、地形起伏状态。
根据上述方案,进一步,如图2所示,所述地形数据加工:利用高分辨率的高程数据加工地形起伏特征;所述利用高分辨率的高程数据加工地形特征包括:
下载全球30米分辨率的高程数据;
从站点地理信息表获取每个站点的海拔高度;
对站点海拔高度信息缺少的情形,结合站点及其周边高程数据栅格点的经纬度信息,计算出站点-栅格点距离,根据最近距离原则确定距离站点最近的栅格点,提取该格点高程数据作为站点的海拔高度;
对于数值预报不存在海拔高度的情形,针对每一个数值预报格点,按照最近距离原则从邻近栅格点获取海拔高度。
根据上述方案,进一步,基于所述全球30米分辨率的高程数据,规定数据排列顺序是从北到南、从西到东;对每个空间点计算高程的东-西向、南-北向梯度;所述东西梯度为,
Figure BDA0002873463540000091
其中,
Dem(i,j)-Dem(i-1,j):表示某点与其以西紧邻点的高程差;
Δx:表示东西格点水平距离;
所述南北梯度为
Figure BDA0002873463540000092
其中,
Dem(i,j)-Dem(i,j-1):表示某点与其以北紧邻点的高程差;
Δy:表示东西格点水平距离。
根据上述方案,进一步,如图3所示,所述地形特征包括,坡面及朝向、是否山顶或山谷;根据高程的东西梯度和南北梯度数值确定地形特征的具体方法包括,
Sx(i,j)>0,
Figure BDA0002873463540000093
面向西的坡面;
Sx(i,j)>0,
Figure BDA0002873463540000094
面向东的坡面;
Sx(i,j)≤0,
Figure BDA0002873463540000095
山顶或山谷;
Sy(i,j)>0,
Figure BDA0002873463540000096
面向北的坡面;
Sy(i,j)>0,
Figure BDA0002873463540000097
面向南的坡面;
Sy(i,j)≤0,
Figure BDA0002873463540000098
山顶或山谷;
其中,
Figure BDA0002873463540000099
Figure BDA00028734635400000910
根据上述方案,进一步,如图4所示,所述太阳入射角度特征加工包括,
根据日期和时间算出指定地点在平面上投影点的太阳高度角a;
根据高程数据算出指定位置的坡面角度α;
如果是阳面,其太阳高度角b=a+α,如果是阴面,其太阳高度角c=a-α。
根据上述方案,进一步,所述应用LightGBM机器学习框架对订正模型进行训练包括,
对时间特征进行编码:时间要素包括月份、时间、预报时效3个要素,其中月份和时间分别采用正弦值(sin)和余弦值(cos)进行编码;预报时效采用绝对值;
以模型特征数据集为X和模型标签数据集为Y按照7:1.5:1.5的比例划分成训练数据集、验证数据集和测试数据集;
利用LightGBM机器学习框架对训练数据集进行拟合训练,并在训练过程中利用验证数据集进行检验拟合状态,再将训练出的模型对测试数据集进行预测测试,最终选择出收敛、预测准确率较高且鲁棒性较好的订正模型。
使用GridSearchCV对LightGBM调参,一方面是网格搜索(GridSearch),即在指定的参数范围内,按步长依次调整参数,利用调整的参数训练学习器,从所有的参数中找到在验证集上精度最高的参数,本质上是一个循环和比较的过程,可以保证在指定的参数范围内找到精度最高的参数。另一方面是交叉验证(CV),即将训练数据集划分为K份(K一般为10以内),依次取其中一份为验证集并测试精度,最后取K次实验的平均精度。
通过subsample_for_bin整型变量构建直方图的样本数量,例如取[20000,2000,1000]。
通过num_leaves整型变量设置一棵决策树上的叶子树,例如取[31,15,50]。
通过max_depth整型变量限制树模型的最大深度,例如取[10,10,10]。
根据上述方案,进一步,采集的气象数值预报数据进行预处理和输出实时订正后的气象预报结果包括,
实时预报数据下载、存储、文件完整性校验;
对实时预报数据进行取点、加工,获取实时预报特征;
采用部分的时间编码方式,以及部分加工好的静态特征,和实时预报特征进行合并,作为订正模型的输入特征矩阵,模型的输出结果作为预报订正值。
如图5所示,分别采用图5(a)未加入地形起伏状态和太阳入射角度特征对气温和风速的订正结果,图5(b)采用加入地形起伏状态和太阳入射角度特征对气温和风速的订正结果。通过对比发现,在模型中加入地形起伏状态和太阳入射角度特征后,可以有效订正气温和风速预报的误差,提高预报准确率。
本发明将高程数据加工成地形起伏状态特征,并计算生成坡面太阳入射角度特征,将上述特征加入模型训练和预测中,可以有效提高预报准确率。
根据本发明第二方面,提供一种气象预报的订正装置,包括:
历史数据加工模块,用于在接收到用户发出的气象预报订正请求的情形下,获取气象历史数值预报数据和气象历史观测数据,对所述气象历史数值预报数据和所述气象历史观测数据进行预处理分别得到气象历史数值预报特征和模型标签数据集;
在本发明实施例中,历史数据加工模块,用于在接收到用户发出的气象预报订正请求的情形下,获取气象历史数值预报数据和气象历史观测数据,对气象历史数值预报数据进行预处理,包括,
根据需要订正的气象要素,从气象历史数值预报数据中选择并提取对应的气象特征变量;
进一步地,在需要订正的气象要素是风速的情形下,从气象历史数值预报数据中选择并提取地表气压、10米全风速、10米纬向风速、10米经向风速、边界层高度、1000百帕位势高度、925百帕位势高度、850百帕位势高度,作为气象特征变量;
在需要订正的气象要素是气温的情形下,从气象历史数值预报数据中选择并提取2米气温、10米纬向风速、10米经向风速、降水量、1000百帕气温、925百帕气温、850百帕气温、总云量,作为气象特征变量。
结合站点及周边格点的经纬度信息,计算出站点与格点距离,根据最近距离原则确定距离站点最近的格点,并提取气象特征变量数据矩阵。
对气象历史观测数据进行预处理,包括,
根据时间序列,对气象历史观测数据进行筛选,去除连续缺测的时段;对非连续缺测的时刻用前后观测向内插值方法补全;
使气象历史观测数据与气象特征变量数据矩阵按照时间对齐,去掉没有观测值时刻的样本,分别得到模型标签数据集和气象历史数值预报特征。
静态数据加工模块,与所述历史数据加工模块连接,用于获取地形高度特征、地形起伏状态特征和太阳入射角特征,作为静态特征数据,对所述静态特征数据加工,和气象历史数值预报特征合并得到模型特征数据集;
在本发明实施例中,静态数据加工模块,用于获取地形高度特征,对地形高度特征进行加工,得到各站点的海拔高度,具体用于下载全球30米分辨率的高程数据,从站点地理信息表获取每个站点的海拔高度,对站点海拔高度信息缺少的情形,结合站点及其周边高程数据栅格点的经纬度信息,计算出站点-栅格点距离,根据最近距离原则确定距离站点最近的栅格点,提取该格点高程数据作为站点的海拔高度;
还用于对于数值预报不存在海拔高度的情形,针对每一个数值预报格点,按照最近距离原则从邻近栅格点获取海拔高度。
用于获取地形起伏状态特征,对地形起伏状态特征的各空间点计算高程的东西向、南北向梯度,得到地形起伏特征,获取太阳入射角特征,对太阳入射角特征进行计算,得到指定位置太阳高度角。
其中计算太阳高度角的方法,包括,根据日期和时间算出指定地点在平面上投影点的太阳高度角a;
根据高程数据算出指定位置的坡面角度α;
如果指定地点是处于阳面,其太阳高度角b=a+α,如果指定地点是处于阴面,其太阳高度角c=a-α。
模型训练模块,分别与所述历史数据加工模块和所述静态数据加工模块连接,用于根据所述模型特征数据集和所述模型标签数据集,对订正模型进行训练,生成订正模型,并保存所述订正模型;
本发明中,模型训练模块用于对时间特征进行编码:时间要素包括月份、时间、预报时效3个要素,其中月份和时间分别采用正弦值(sin)和余弦值(cos)进行编码;预报时效采用绝对值;
用于以模型特征数据集为X和模型标签数据集为Y按照7:1.5:1.5的比例划分成训练数据集、验证数据集和测试数据集;
模型训练模块还用于利用LightGBM机器学习框架对训练数据集进行拟合训练,并在训练过程中利用验证数据集进行检验拟合状态,再将训练出的模型对测试数据集进行预测测试,最终选择出收敛、预测准确率较高且鲁棒性较好的订正模型。
订正模块,用于获取实时采集到的气象数值预报数据,对所述气象数值预报数据进行预处理,和静态特征合并得到预测数据集,将所述预测数据集输入订正模型,输出实时订正后的气象预报结果。
根据本发明第三方面,提供一种计算机设备,包括:处理器和存储器,以及存储在所述存储器中,并能在处理器中运行的计算机程序,所述处理器执行所述程序能够实现如下任一项所述的气象预报的订正方法的步骤,包括,
处理器在接收到用户发出的气象预报订正请求的情形下,获取气象历史数值预报数据和气象历史观测数据,对所述气象历史数值预报数据和所述气象历史观测数据进行预处理分别得到气象历史数值预报特征和模型标签数据集;
获取地形高度特征、地形起伏状态特征和太阳入射角特征,作为静态特征数据,对所述静态特征数据加工,和气象历史数值预报特征合并得到模型特征数据集;
根据所述模型特征数据集和所述模型标签数据集,对订正模型进行训练,生成订正模型,并保存所述订正模型;
获取实时采集到的气象数值预报数据,对所述气象数值预报数据进行预处理,和静态特征合并得到预测数据集,将所述预测数据集输入订正模型,输出实时订正后的气象预报结果。
根据本发明第四方面,提供一种计算机可读存储介质,所述计算机可读存储介质中保存有计算机程序,所述程序用于实现如下任一项所述的方法,包括,
在接收到用户发出的气象预报订正请求的情形下,获取气象历史数值预报数据和气象历史观测数据,对所述气象历史数值预报数据和所述气象历史观测数据进行预处理分别得到气象历史数值预报特征和模型标签数据集;
获取地形高度特征、地形起伏状态特征和太阳入射角特征,作为静态特征数据,对所述静态特征数据加工,和气象历史数值预报特征合并得到模型特征数据集;
根据所述模型特征数据集和所述模型标签数据集,对订正模型进行训练,生成订正模型,并保存所述订正模型;
获取实时采集到的气象数值预报数据,对所述气象数值预报数据进行预处理,和静态特征合并得到预测数据集,将所述预测数据集输入订正模型,输出实时订正后的气象预报结果。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的流程及结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。

Claims (10)

1.一种气象预报的订正方法,其特征在于,包括:
在接收到用户发出的气象预报订正请求的情形下,获取气象历史数值预报数据,对所述气象历史数值预报数据进行预处理得到气象历史数值预报特征;
获取地形高度特征、地形起伏状态特征和太阳入射角特征,作为静态特征数据,对所述静态特征数据加工,并和气象历史数值预报特征合并得到模型特征数据集;
获取气象历史观测数据,对所述气象历史观测数据进行预处理得到模型标签数据集;
根据所述模型特征数据集和所述模型标签数据集,对订正模型进行训练,生成订正模型,并保存所述订正模型;
获取实时采集到的气象数值预报数据,对所述气象数值预报数据进行预处理得到实时气象数值预报特征,和静态特征数据合并得到预测数据集,将所述预测数据集输入订正模型,输出实时订正后的气象预报结果。
2.根据权利要求1所述的气象预报的订正方法,其特征在于,
所述对所述气象历史数值预报数据进行预处理得到气象历史数值预报特征,对所述气象历史观测数据进行预处理得到模型标签数据,包括,
根据需要订正的气象要素,从所述气象历史数值预报数据中选择并提取对应的气象特征变量;
结合站点及周边格点的经纬度信息,计算出站点与格点距离,根据最近距离原则确定距离站点最近的格点,并提取气象特征变量数据矩阵;
根据时间序列,对所述气象历史观测数据进行筛选,去除连续缺测的时段;对非连续缺测的时刻用前后观测向内插值方法补全;
使所述气象历史观测数据与气象特征变量数据矩阵按照时间对齐,去掉没有观测值时刻的样本,分别得到模型标签数据集和气象历史数值预报特征。
3.根据权利要求2所述的气象预报的订正方法,其特征在于,
所述根据需要订正的气象要素,从所述气象历史数值预报数据中选择并提取对应的气象特征变量,包括,
在所述需要订正的气象要素是风速的情形下,从所述气象历史数值预报数据中选择并提取气压、风速以及位势高度,作为气象历史数值预报特征;
在所述需要订正的气象要素是气温的情形下,从所述气象历史数值预报数据中选择并提取气温、风速、降水量以及总云量,作为气象历史数值预报特征。
4.根据权利要求1所述的气象预报的订正方法,其特征在于,
所述获取地形高度特征、地形起伏状态特征和太阳入射角特征,作为静态特征数据,对所述静态特征数据加工,并和气象历史数值预报特征合并得到模型特征数据集,包括,
获取地形高度特征,对所述地形高度特征进行加工,得到各站点的海拔高度;
获取地形起伏状态特征,对地形起伏状态特征的各空间点计算高程的东西向、南北向梯度,得到地形起伏特征;
获取太阳入射角特征,对所述太阳入射角特征进行计算,得到指定位置太阳高度角。
5.根据权利要求4所述的气象预报的订正方法,其特征在于,
所述获取地形高度特征,对所述地形高度特征进行加工,得到各站点的海拔高度,包括,
下载全球30米分辨率的高程数据;
从站点地理信息表获取每个站点的海拔高度;
对站点海拔高度信息缺少的情形,结合站点及其周边高程数据栅格点的经纬度信息,计算出站点-栅格点距离,根据最近距离原则确定距离站点最近的栅格点,提取该格点高程数据作为站点的海拔高度;
对于数值预报不存在海拔高度的情形,针对每一个数值预报格点,按照最近距离原则从邻近栅格点获取海拔高度。
6.根据权利要求4所述的气象预报的订正方法,其特征在于,
所述对所述太阳入射角特征进行计算,得到指定位置太阳高度角,包括,
根据日期和时间算出指定地点在平面上投影点的太阳高度角a;
根据高程数据算出指定位置的坡面角度α;
如果是阳面,其太阳高度角b=a+α,如果是阴面,其太阳高度角c=a-α。
7.根据权利要求1所述的气象预报的订正方法,其特征在于,
所述对订正模型进行训练,包括,
对时间特征进行编码:时间要素包括月份、时间、预报时效3个要素,其中月份和时间分别采用正弦值(sin)和余弦值(cos)进行编码;预报时效采用绝对值;
以模型特征数据集为X和模型标签数据集为Y按照7:1.5:1.5的比例划分成训练数据集、验证数据集和测试数据集;
利用LightGBM机器学习框架对训练数据集进行拟合训练,并在训练过程中利用验证数据集进行检验拟合状态,再将训练出的模型对测试数据集进行预测测试,最终选择出收敛、预测准确率较高且鲁棒性较好的订正模型。
8.一种气象预报的订正装置,其特征在于,包括:
历史数据加工模块,用于在接收到用户发出的气象预报订正请求的情形下,获取气象历史数值预报数据和气象历史观测数据,对所述气象历史数值预报数据和所述气象历史观测数据进行预处理分别得到气象历史数值预报特征和模型标签数据集;
静态数据加工模块,与所述历史数据加工模块连接,用于获取地形高度特征、地形起伏状态特征和太阳入射角特征,作为静态特征数据,对所述静态特征数据加工,并和气象历史数值预报特征得到模型特征数据集;
模型训练模块,分别与所述历史数据加工模块和所述静态数据加工模块连接,用于根据所述模型特征数据集和所述模型标签数据集,对订正模型进行训练,生成订正模型,并保存所述订正模型;
订正模块,与所述模型训练模块连接,用于获取实时采集到的气象数值预报数据,对所述气象数值预报数据进行预处理并和静态特征合并得到预测数据集,将所述预测数据集输入订正模型,输出实时订正后的气象预报结果。
9.一种计算机设备,包括:处理器和存储器,以及存储在所述存储器中,并能在处理器中运行的计算机程序,其特征在于,所述处理器执行所述程序能够实现权利要求1至7任一项所述的方法的步骤。
10.一种计算机可读存储介质,其特征在于,包括,所述计算机可读存储介质中保存有计算机程序,所述程序用于实现权利要求1至7任一项所述的方法。
CN202011644620.0A 2020-12-30 2020-12-30 一种气象预报的订正方法、装置、计算机设备及存储介质 Active CN112684520B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011644620.0A CN112684520B (zh) 2020-12-30 2020-12-30 一种气象预报的订正方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011644620.0A CN112684520B (zh) 2020-12-30 2020-12-30 一种气象预报的订正方法、装置、计算机设备及存储介质

Publications (2)

Publication Number Publication Date
CN112684520A true CN112684520A (zh) 2021-04-20
CN112684520B CN112684520B (zh) 2022-12-13

Family

ID=75456932

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011644620.0A Active CN112684520B (zh) 2020-12-30 2020-12-30 一种气象预报的订正方法、装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN112684520B (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113011106A (zh) * 2021-04-15 2021-06-22 中国气象局公共气象服务中心(国家预警信息发布中心) 一种多数值模式集成预报方法及装置
CN113204061A (zh) * 2021-07-06 2021-08-03 中国气象局公共气象服务中心(国家预警信息发布中心) 一种构建格点风速订正模型的方法及装置
CN113253364A (zh) * 2021-06-30 2021-08-13 中国气象局公共气象服务中心(国家预警信息发布中心) 一种对站点风速预报结果进行订正的方法及装置
CN113743025A (zh) * 2021-11-05 2021-12-03 中化现代农业有限公司 一种气象预报数据订正方法、装置、电子设备和存储介质
CN114545528A (zh) * 2022-03-09 2022-05-27 北京墨迹风云科技股份有限公司 一种基于机器学习的气象数值模式要素预报后订正方法和装置
CN114626577A (zh) * 2022-02-21 2022-06-14 北京大学 一种利用人工智能预报冬季降水相态的方法
CN114626578A (zh) * 2022-02-21 2022-06-14 北京大学 一种利用人工智能预报冻雨的方法
CN115220131A (zh) * 2022-06-23 2022-10-21 阿里巴巴(中国)有限公司 气象数据质检方法及系统
CN115496248A (zh) * 2022-02-14 2022-12-20 山东省气象科学研究所(山东省海洋气象科学研究所、山东省气象局培训中心) 一种基于位温梯度的数值模式地面2米气温预报地形高度订正方法
CN115796394A (zh) * 2023-02-01 2023-03-14 天翼云科技有限公司 数值天气预报订正方法、装置、电子设备及存储介质
CN116070050A (zh) * 2022-04-27 2023-05-05 广东省气象台(南海海洋气象预报中心、珠江流域气象台) 一种立体网格交互订正方法及装置
CN116307153A (zh) * 2023-03-07 2023-06-23 广东热矩智能科技有限公司 用于制冷制热系统节能的气象预测方法、装置及电子设备
CN117290792A (zh) * 2023-11-14 2023-12-26 广东省气象服务中心(广东气象影视宣传中心) 一种基于机器学习的气压预报系统及方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104239706A (zh) * 2014-09-05 2014-12-24 中国科学院寒区旱区环境与工程研究所 一种地面观测气温时空数据集的制备方法
CN107065037A (zh) * 2017-05-19 2017-08-18 宁波耘瑞智能科技有限公司 一种自动气象站数据采集控制系统
CN109447260A (zh) * 2018-10-08 2019-03-08 中国人民解放军空军研究院战场环境研究所 一种基于深度学习的局地数值天气预报产品订正方法
WO2019114160A1 (zh) * 2017-12-14 2019-06-20 北京金风科创风电设备有限公司 结冰预测方法、装置、模型生成方法及装置
CN111723929A (zh) * 2020-05-08 2020-09-29 广州华工中云信息技术有限公司 一种基于神经网络的数值预报产品订正方法、装置和系统
CN111929748A (zh) * 2020-09-17 2020-11-13 南京浦蓝大气环境研究院有限公司 一种气象要素预报方法和系统
CN112149857A (zh) * 2020-10-22 2020-12-29 无锡九方科技有限公司 基于迁移学习的气象智能预报订正方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104239706A (zh) * 2014-09-05 2014-12-24 中国科学院寒区旱区环境与工程研究所 一种地面观测气温时空数据集的制备方法
CN107065037A (zh) * 2017-05-19 2017-08-18 宁波耘瑞智能科技有限公司 一种自动气象站数据采集控制系统
WO2019114160A1 (zh) * 2017-12-14 2019-06-20 北京金风科创风电设备有限公司 结冰预测方法、装置、模型生成方法及装置
CN109447260A (zh) * 2018-10-08 2019-03-08 中国人民解放军空军研究院战场环境研究所 一种基于深度学习的局地数值天气预报产品订正方法
CN111723929A (zh) * 2020-05-08 2020-09-29 广州华工中云信息技术有限公司 一种基于神经网络的数值预报产品订正方法、装置和系统
CN111929748A (zh) * 2020-09-17 2020-11-13 南京浦蓝大气环境研究院有限公司 一种气象要素预报方法和系统
CN112149857A (zh) * 2020-10-22 2020-12-29 无锡九方科技有限公司 基于迁移学习的气象智能预报订正方法

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113011106A (zh) * 2021-04-15 2021-06-22 中国气象局公共气象服务中心(国家预警信息发布中心) 一种多数值模式集成预报方法及装置
CN113011106B (zh) * 2021-04-15 2021-12-03 中国气象局公共气象服务中心(国家预警信息发布中心) 一种多数值模式集成预报方法及装置
CN113253364A (zh) * 2021-06-30 2021-08-13 中国气象局公共气象服务中心(国家预警信息发布中心) 一种对站点风速预报结果进行订正的方法及装置
CN113253364B (zh) * 2021-06-30 2021-10-08 中国气象局公共气象服务中心(国家预警信息发布中心) 一种对站点风速预报结果进行订正的方法及装置
CN113204061A (zh) * 2021-07-06 2021-08-03 中国气象局公共气象服务中心(国家预警信息发布中心) 一种构建格点风速订正模型的方法及装置
CN113743025A (zh) * 2021-11-05 2021-12-03 中化现代农业有限公司 一种气象预报数据订正方法、装置、电子设备和存储介质
CN115496248B (zh) * 2022-02-14 2023-04-28 山东省气象科学研究所(山东省海洋气象科学研究所、山东省气象局培训中心) 一种基于位温梯度的数值模式地面2米气温预报地形高度订正方法
CN115496248A (zh) * 2022-02-14 2022-12-20 山东省气象科学研究所(山东省海洋气象科学研究所、山东省气象局培训中心) 一种基于位温梯度的数值模式地面2米气温预报地形高度订正方法
CN114626578B (zh) * 2022-02-21 2022-11-11 北京大学 一种利用人工智能预报冻雨的方法
CN114626578A (zh) * 2022-02-21 2022-06-14 北京大学 一种利用人工智能预报冻雨的方法
CN114626577A (zh) * 2022-02-21 2022-06-14 北京大学 一种利用人工智能预报冬季降水相态的方法
CN114545528A (zh) * 2022-03-09 2022-05-27 北京墨迹风云科技股份有限公司 一种基于机器学习的气象数值模式要素预报后订正方法和装置
CN114545528B (zh) * 2022-03-09 2024-02-06 北京墨迹风云科技股份有限公司 一种基于机器学习的气象数值模式要素预报后订正方法和装置
CN116070050A (zh) * 2022-04-27 2023-05-05 广东省气象台(南海海洋气象预报中心、珠江流域气象台) 一种立体网格交互订正方法及装置
CN116070050B (zh) * 2022-04-27 2023-09-26 广东省气象台(南海海洋气象预报中心、珠江流域气象台) 一种立体网格交互订正方法及装置
CN115220131A (zh) * 2022-06-23 2022-10-21 阿里巴巴(中国)有限公司 气象数据质检方法及系统
CN115796394A (zh) * 2023-02-01 2023-03-14 天翼云科技有限公司 数值天气预报订正方法、装置、电子设备及存储介质
CN116307153A (zh) * 2023-03-07 2023-06-23 广东热矩智能科技有限公司 用于制冷制热系统节能的气象预测方法、装置及电子设备
CN117290792A (zh) * 2023-11-14 2023-12-26 广东省气象服务中心(广东气象影视宣传中心) 一种基于机器学习的气压预报系统及方法
CN117290792B (zh) * 2023-11-14 2024-05-28 广东省气象服务中心(广东气象影视宣传中心) 一种基于机器学习的气压预报系统及方法

Also Published As

Publication number Publication date
CN112684520B (zh) 2022-12-13

Similar Documents

Publication Publication Date Title
CN112684520B (zh) 一种气象预报的订正方法、装置、计算机设备及存储介质
Boilley et al. Comparison between meteorological re-analyses from ERA-Interim and MERRA and measurements of daily solar irradiation at surface
US11333796B2 (en) Spatial autocorrelation machine learning-based downscaling method and system of satellite precipitation data
CN112905560B (zh) 一种多源时空大数据深度融合的空气污染预测方法
CN109580003B (zh) 一种静止气象卫星热红外数据估算近地面大气温度方法
CN109447260B (zh) 一种基于深度学习的局地数值天气预报产品订正方法
CN113591572A (zh) 基于多源数据和多时相数据的水土流失定量监测方法
CN112880634B (zh) 一种基于cors站网的高程参考框架动态监测方法
CN115204618B (zh) 一种ccmvs区域碳源汇同化反演方法
Schuh et al. Far-field biogenic and anthropogenic emissions as a dominant source of variability in local urban carbon budgets: A global high-resolution model study with implications for satellite remote sensing
CN115357847B (zh) 一种基于误差分解的日尺度星地降水融合方法
CN116450700B (zh) 极轨卫星地表温度时间归一化方法、装置及电子设备
CN105974495A (zh) 利用分类拟合法预判目标区域未来平均云量的方法
CN114881345A (zh) 气候变化下暴雨疾风复合灾害的社会经济暴露度预估方法
CN115544889A (zh) 基于深度学习的数值模式降水偏差校正方法
Lipson et al. Harmonized gap-filled datasets from 20 urban flux tower sites
CN115576033A (zh) 面向南方电网气象保障3公里分辨率中尺度数值预报方法
CN117526274A (zh) 极端气候下新能源功率预测方法、电子设备和存储介质
CN111652126A (zh) 一种基于卫星云图的反演辐射方法
Yao et al. A novel NIR–red spectral domain evapotranspiration model from the Chinese GF-1 satellite: Application to the Huailai agricultural region of China
CN114417728A (zh) 基于温度和发射率及深度学习的近地表空气温度反演方法
CN114118511A (zh) 基于云量预测信息的大区域多星联合覆盖有效性评估方法
CN116340863B (zh) 空气污染物预测方法、装置、电子设备及可读存储介质
KR101335209B1 (ko) 고해상도 격자형 미래기후변화 시나리오 자료 생성 방법
Julien et al. TISSBERT: A benchmark for the validation and comparison of NDVI time series reconstruction methods

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant