CN112285807A - 一种气象信息预测方法及装置 - Google Patents
一种气象信息预测方法及装置 Download PDFInfo
- Publication number
- CN112285807A CN112285807A CN201911098394.8A CN201911098394A CN112285807A CN 112285807 A CN112285807 A CN 112285807A CN 201911098394 A CN201911098394 A CN 201911098394A CN 112285807 A CN112285807 A CN 112285807A
- Authority
- CN
- China
- Prior art keywords
- meteorological
- data
- weather
- model
- prediction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 68
- 238000007637 random forest analysis Methods 0.000 claims abstract description 38
- 238000012549 training Methods 0.000 claims description 50
- 230000004927 fusion Effects 0.000 claims description 47
- 238000012360 testing method Methods 0.000 claims description 17
- 238000004364 calculation method Methods 0.000 claims description 11
- 238000012545 processing Methods 0.000 claims description 6
- 238000012821 model calculation Methods 0.000 claims description 4
- 238000001556 precipitation Methods 0.000 description 16
- 230000008569 process Effects 0.000 description 14
- 238000003860 storage Methods 0.000 description 13
- 238000010586 diagram Methods 0.000 description 11
- 238000010801 machine learning Methods 0.000 description 7
- 238000004422 calculation algorithm Methods 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 4
- 238000003066 decision tree Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 230000002159 abnormal effect Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 238000013179 statistical model Methods 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000019771 cognition Effects 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 238000013075 data extraction Methods 0.000 description 1
- 230000007123 defense Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000013277 forecasting method Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012806 monitoring device Methods 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 238000004579 scanning voltage microscopy Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01W—METEOROLOGY
- G01W1/00—Meteorology
- G01W1/10—Devices for predicting weather conditions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Environmental & Geological Engineering (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Atmospheric Sciences (AREA)
- Ecology (AREA)
- Biodiversity & Conservation Biology (AREA)
- Environmental Sciences (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本公开涉及一种气象信息预测方法及装置。该方法包括:获取与气象站点关联的模式预报站点的实时气象数据;基于所述实时气象数据生成所述气象站点的融合气象数据;将所述融合气象数据输入气象预测模型获取目标气象事件的等级及其对应的概率,其中,所述气象预测模型通过随机森林模型生成;以及基于目标气象事件的等级及其对应的概率进行所述气象站点的气象信息预测。本公开涉及一种气象信息预测方法及装置,能够基于实时气象数据对未来的气象信息进行预测,提高气象信息的预测效率和精准度。
Description
技术领域
本公开涉及气象预测领域,具体而言,涉及一种气象信息预测方法及装置。
背景技术
气象预测或称天气预报,是使用现代科学技术对未来某一地点地球大气层的状态进行预测。气象预报主要是使用收集大量的数据(气温、湿度、风向和风速、气压等等),然后使用目前对大气过程的认识(气象学)来确定未来空气变化。天气预报是气象工作为国民经济和国防建设服务的重要手段,特别是对灾害性天气的预报,在保护人民生命财产,促进经济发展等方面发挥着重要作用。
随着社会发展和人民生活水平的提高,各行各业和人们的生活越来越依赖于天气预测信息,在这种情况下需要进行更加精确的气象预报,更具体的,可例如对某一地区的降水、风力、自然灾害进行精确的预报,以便于人民群众安排相关的生产活动。气象预测的物理过程模型以物理学系统为基础,利用计算机的计算能力,逐渐取代传统的统计学模型,成为降水预报的主要方法。虽然物理过程模型在整体上取得了比传统统计模型更好的结果,但在很多区域范围内的表现不尽人意,物理过程模式需要对实际物理过程有清晰的认识和重现能力,但由于模式的物理参数化方案的不完善和很多参数的不确定性等,且降水属于小概率事件,具有突发性,非连续性的特点,涉及物理过程较为复杂,准确预测降水具有较大的难度。
因此,需要一种新的气象信息预测方法及装置。
在所述背景技术部分公开的上述信息仅用于加强对本公开的背景的理解,因此它可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
有鉴于此,本公开提供一种气象信息预测方法及装置,能够基于实时气象数据对未来的气象信息进行预测,提高气象信息的预测效率和精准度。
本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
根据本公开的一方面,提出一种气象信息预测方法,该方法包括:获取与气象站点关联的模式预报站点的实时气象数据;基于所述实时气象数据生成所述气象站点的融合气象数据;将所述融合气象数据输入气象预测模型获取目标气象事件的等级及其对应的概率,其中,所述气象预测模型通过随机森林模型生成;以及基于目标气象事件的等级及其对应的概率进行所述气象站点的气象信息预测。
在本公开的一种示例性实施例中,还包括:获取模式预报站点的历史气象数据;基于所述历史气象数据生成气象站点的历史融合气象数据;以及基于所述历史融合气象数据对随机森林模型进行训练生成所述气象预测模型。
在本公开的一种示例性实施例中,基于所述历史融合气象数据对随机森林模型进行训练生成所述气象预测模型,包括:获取目标气象事件的等级分类信息;基于所述等级分类信息为所述历史融合气象数据确定等级标签;以及通过带有等级标签的历史融合气象数据对随机森林模型进行训练生成所述气象预测模型。
在本公开的一种示例性实施例中,通过带有等级标签的历史融合气象数据对随机森林模型进行训练生成所述气象预测模型,包括:
基于多个目标气象事件,分别通过带有等级标签的历史融合气象数据对随机森林模型进行训练生成气象预测子模型;
为多个气象预测子模型分别确定决策参数;以及
通过多个气象预测子模型及其对应的决策参数生成所述气象预测模型。
在本公开的一种示例性实施例中,通过带有等级标签的历史融合气象数据对随机森林模型进行训练生成所述气象预测模型,包括:将带有等级标签的历史融合气象数据划分为测试集数据和训练集数据;以及通过所述训练集数据对随机森林模型进行训练生成所述气象预测模型。
在本公开的一种示例性实施例中,通过带有等级标签的历史融合气象数据对随机森林模型进行训练生成所述气象预测模型,还包括:通过所述测试集数据对所述气象预测模型进行验证。
在本公开的一种示例性实施例中,获取与气象站点关联的模式预报站点的实时气象数据,还包括:基于位置信息确定与所述气象站点关联的所述模式预报站点。
在本公开的一种示例性实施例中,基于所述实时气象数据生成所述气象站点的融合气象数据,还包括:基于所述模式预报站点和所述气象站点之间的距离,为所述模式预报站点确定融合权重;以及基于所述融合权重将所述模式预报站点对应的实时气象数据进行插值处理生成所述融合气象数据。
在本公开的一种示例性实施例中,将所述融合气象数据输入气象预测模型获取目标气象事件的等级及其对应的概率,还包括:将所述融合气象数据输入气象预测模型;所述气象预测模型中的多个分类器对所述融合气象数据进行决策计算;以及根据计算结果生成目标气象事件的等级及其对应的概率。
在本公开的一种示例性实施例中,将所述融合气象数据输入气象预测模型,还包括:基于目标气象事件确定所述气象预测模型的决策参数。
在本公开的一种示例性实施例中,还包括:根据目标气象事件的等级及其对应的概率生成气象预测信息。
根据本公开的一方面,提出一种气象信息预测装置,该装置包括:实时数据模块,用于获取与气象站点关联的模式预报站点的实时气象数据;融合数据模块,用于基于所述实时气象数据生成所述气象站点的融合气象数据;模型计算模块,用于将所述融合气象数据输入气象预测模型获取目标气象事件的等级及其对应的概率,其中,所述气象预测模型通过随机森林模型生成;以及气象预测模块,用于基于目标气象事件的等级及其对应的概率进行所述气象站点的气象信息预测。
在本公开的一种示例性实施例中,还包括:历史数据模块,用于获取模式预报站点的历史气象数据;并基于所述历史气象数据生成气象站点的历史融合气象数据;以及模型训练模块,用于基于所述历史融合气象数据对随机森林模型进行训练生成所述气象预测模型。
根据本公开的一方面,提出一种电子设备,该电子设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序;当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如上文的方法。
根据本公开的一方面,提出一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现如上文中的方法。
根据本公开的气象信息预测方法及装置,根据与气象站点关联的模式预报站点的实时气象数据生成所述气象站点的融合气象数据;将所述融合气象数据输入气象预测模型获取目标气象事件的等级及其对应的概率,并基于目标气象事件的等级及其对应的概率进行所述气象站点的气象信息预测的方式,能够基于实时气象数据对未来的气象信息进行预测,提高气象信息的预测效率和精准度。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本公开。
附图说明
通过参照附图详细描述其示例实施例,本公开的上述和其它目标、特征及优点将变得更加显而易见。下面描述的附图仅仅是本公开的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据一示例性实施例示出的一种气象信息预测方法及装置的系统框图。
图2是根据一示例性实施例示出的一种气象信息预测方法的流程图。
图3是根据一示例性实施例示出的一种气象信息预测方法的示意图。
图4是根据另一示例性实施例示出的一种气象信息预测方法的流程图。
图5是根据另一示例性实施例示出的一种气象信息预测方法的示意图。
图6是根据另一示例性实施例示出的一种气象信息预测方法的流程图。
图7是根据另一示例性实施例示出的一种气象信息预测方法的说明图。
图8是根据一示例性实施例示出的一种气象信息预测装置的框图。
图9是根据另一示例性实施例示出的一种气象信息预测装置的框图。
具体实施方式
现在将参考附图更全面地描述示例实施例。然而,示例实施例能够以多种形式实施,且不应被理解为限于在此阐述的实施例;相反,提供这些实施例使得本公开将全面和完整,并将示例实施例的构思全面地传达给本领域的技术人员。在图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。
此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本公开的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本公开的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本公开的各方面。
附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
应理解,虽然本文中可能使用术语第一、第二、第三等来描述各种组件,但这些组件不应受这些术语限制。这些术语乃用以区分一组件与另一组件。因此,下文论述的第一组件可称为第二组件而不偏离本公开概念的教示。如本文中所使用,术语“及/或”包括相关联的列出项目中的任一个及一或多者的所有组合。
本领域技术人员可以理解,附图只是示例实施例的示意图,附图中的模块或流程并不一定是实施本公开所必须的,因此不能用于限制本公开的保护范围。
随着近年来人工智能的发展,以统计学为基础的机器学习模型逐渐在众多预测任务中取得了超越传统方法的最佳效果,诸多流行的机器学习算法,如人工神经网络、随机森林,SVM等在各种预报任务中得到充分利用。为充分利用物理模型和机器学习算法各自的优势,也为了克服现有预报手段预报降水不准确的问题,本公开充分利用现有物理驱动模型及机器学习算法的优势,提出了一套基于机器学习算法和模式预报结果相融合的降水预报方法。
下面结合具体的实施例对本公开的内容进行详细说明。
图1是根据一示例性实施例示出的一种气象信息预测方法及装置的系统框图。
如图1所示,系统架构100可以包括模式预报站点101、102、103,网络104和服务器105。网络104用以在模式预报站点101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
可以使用模式预报站点101、102、103获取当前的气象数据,模式预报站点101、102、103通过网络104与服务器105交互,以接收或发送实时气象数据等。
模式预报站点101、102、103可以是具有气象监测功能并且支持网络发送数据的各种监测设备的集合或系统,包括但不限于温度测量设备、风速测量设备、气压测量设备等等。
服务器105可以是提供各种服务的服务器,例如对模式预报站点101、102、103所上传的气象数据提供支持的后台管理服务器。后台管理服务器可以对接收到的气象数据进行分析等处理,并将处理结果(例如未来的气象信息)反馈给用户。
服务器105可例如获取与气象站点关联的模式预报站点的实时气象数据;服务器105可例如基于所述实时气象数据生成所述气象站点的融合气象数据;服务器105可例如将所述融合气象数据输入气象预测模型获取目标气象事件的等级及其对应的概率,其中,所述气象预测模型通过随机森林模型生成;服务器105可例如基于目标气象事件的等级及其对应的概率进行所述气象站点的气象信息预测。
服务器105可以是一个实体的服务器,还可例如为多个服务器组成,需要说明的是,本公开实施例所提供的气象信息预测方法可以由服务器105执行,相应地,气象信息预测装置可以设置于服务器105中。而提供实时气象数据以供计算的数据监测端一般位于模式预报站点101、102、103中。
图2是根据一示例性实施例示出的一种气象信息预测方法的流程图。气象信息预测方法20至少包括步骤S202至S208。
如图2所示,在S202中,获取与气象站点关联的模式预报站点的实时气象数据。
在一个实施例中,还包括:基于位置信息确定与所述气象站点关联的所述模式预报站点。图3示出了一种模式预报站点和气象站点的位置关系,模式预报站点中的数据的是按照经纬度输出的格点数据,其中,不规则位置的点是气象站点,规则排列的点为模式预报的网格点数据,在实际计算中,需要把模式预报的数据向站点进行融合。
在一个实施例中,可将待进行预测的气象站点中心最近四个模式预报站点作为与气象站的相关联的站点。
在一个实施例中,由于观测数据中存在一些超出合理范围的异常值,需要把这部分的数据规范到一个合理的范围内,可计算该观测变量的平均值(mean)和方差(std),对于不在(mean-2.5*std,mean+2.5*std)范围内的数据规范到这个区间内,以排除异常值抖动对后续机器学习模型训练造成的影响。
在S204中,基于所述实时气象数据生成所述气象站点的融合气象数据。包括:基于所述模式预报站点和所述气象站点之间的距离,为所述模式预报站点确定融合权重;以及基于所述融合权重将所述模式预报站点对应的实时气象数据进行插值处理生成所述融合气象数据。
因需根据气象站点来进行气象预报,所以需要把模式的网格点数据往观测站点插值。采用近邻权重插值的方式,把模式预报站点网格点的数据插值到气象站点。
在一个实施例中,可按照距离站点的远近赋予权重,距离越近权重越大,得到一个插值结果,来辅助观测数据,进行模型预测。更具体的,可选择与气象站点关联的模式预报站点的当前时刻气压、温度、风向、相对湿度、能见度、累计降水量及预报时刻的降水值等气象指标,作为实时气象数据。
在S206中,将所述融合气象数据输入气象预测模型获取目标气象事件的等级及其对应的概率,其中,所述气象预测模型通过随机森林模型生成,还包括基于目标气象事件确定所述气象预测模型的决策参数。
在一个实施例中,可例如,将所述融合气象数据输入气象预测模型;所述气象预测模型中的多个分类器对所述融合气象数据进行决策计算;以及根据计算结果生成目标气象事件的等级及其对应的概率。
更具体的,目标气象事件可为降水预测,那么经过气象预测模型的计算,最终输出的可为该气象站点降水的等级及其对应的概率。
可例如,下表为降水强度等级标准,对应于降水按照国家气象局颁布的降水强度等级标准,气象预测模型输出的为每个降水等级对应的概率。
等级 | 分类标识 | 降雨量(mm) |
无雨 | 0 | 0 |
小雨 | 1 | 0.1~9.9 |
中雨 | 2 | 10~24.9 |
大雨 | 3 | 25~49.9 |
暴雨 | 4 | 50~99.9 |
大暴雨 | 5 | 100~249.9 |
特大暴雨 | 6 | >250 |
更具体的,输出结果可例如为特大暴雨的概率为5%,大暴雨的概率为30%,暴雨的概率为50%等等。
在S208中,基于目标气象事件的等级及其对应的概率进行所述气象站点的气象信息预测。包括:根据目标气象事件的等级及其对应的概率生成气象预测信息。
在一个实施例中,气象预测模型输出的目标气象事件可为多个,可例如同时输出降水概率、大风概率、冰雹概率等等多种气象事件的概率。可综合以上的各种气象条件及其对应的等级概率,最终生成气象信息预测。气象信息预测可为未来24小时的气象信息,也可为未来3天或者更久的气象信息,本公开不以此为限。
应清楚地理解,本公开描述了如何形成和使用特定示例,但本公开的原理不限于这些示例的任何细节。相反,基于本公开公开的内容的教导,这些原理能够应用于许多其它实施例。
根据本公开的气象信息预测方法,根据与气象站点关联的模式预报站点的实时气象数据生成所述气象站点的融合气象数据;将所述融合气象数据输入气象预测模型获取目标气象事件的等级及其对应的概率,并基于目标气象事件的等级及其对应的概率进行所述气象站点的气象信息预测的方式,能够基于实时气象数据对未来的气象信息进行预测,提高气象信息的预测效率和精准度。
图4是根据另一示例性实施例示出的一种气象信息预测方法的流程图。图4所示的流程是对气象预测模型建立的详细描述,
如图4所示,在S402中,获取模式预报站点的历史气象数据。为了使得模型的训练更加准确,可以获取多个模式预报站点的历史气象数据进行后续计算。
在S404中,基于所述历史气象数据生成气象站点的历史融合气象数据。如上文所述,可按照距离气象站点的远近赋予模式预报站点不同的权重,距离越近权重越大,最后综合多个权重获得插值结果,来辅助观测数据,进行模型预测。
在S406中,基于所述历史融合气象数据对随机森林模型进行训练生成所述气象预测模型。可包括:获取目标气象事件的等级分类信息;基于所述等级分类信息为所述历史融合气象数据确定等级标签;以及通过带有等级标签的历史融合气象数据对随机森林模型进行训练生成所述气象预测模型。
其中,通过带有等级标签的历史融合气象数据对随机森林模型进行训练生成所述气象预测模型,可包括:将带有等级标签的历史融合气象数据划分为测试集数据和训练集数据;以及通过所述训练集数据对随机森林模型进行训练生成所述气象预测模型。
还包括:基于多个目标气象事件,分别通过带有等级标签的历史融合气象数据对随机森林模型进行训练生成气象预测子模型;为多个气象预测子模型分别确定决策参数;以及通过多个气象预测子模型及其对应的决策参数生成所述气象预测模型。
选择某一历史时刻的气压、温度、风向、相对湿度、能见度、累计降水量及预报时刻的降水值等气象指标,作为输入特征。构建样本数据集,其中:
训练集记为:Train_Data={(x1,y1),(x2,y2),...,(xm,ym)},
测试集记为:Test_Data={(x′1,y′1),(x′2,y′2),...,(x′k,y′k)}。
更具体的,可将数据的80%划分为训练集,20%划分为测试集。
两个集合之间不存在交集。
随机森林是一个具有高度灵活的机器学习算法,所构建的“森林”是决策树的集成,能处理高维特征,不容易产生过拟合,选择票数多的结果作为最终结果。模型训练速度比较快,特别是对于大数据而言,因为数据抽取和子树生成的过程式可以并行运算的;对数据集的适应能力强,既能处理离散型数据,也能处理连续型数据,数据集无需规范化。数据的处理流程如下所示:
训练阶段:
Step1:对于一个m个训练样本的数据集,采用有放回的抽样,组成含有m*α(其中0<α<0.8)个样本的新的训练集。
Step2:重复Step1进行T遍,得到T个训练集Train_DataT,针对每一个新构建的训练集,根据样本属性,按照式(1),计算基尼系数。
其中k:数据集中样本的类别数,pi:一个样本被归类为第i类的概率。
Step3:计算按照某属性划分后的数据集合的基尼系数,选择基尼系数最小的那个属性作为第一划分依据,然后继续选择第二小的属性,以此类推,完成单个决策树的构建,记为C。
Step4:在新构建的T个训练集上,根据step2、step3的流程,独立的训练出T个决策树,组成森林,记为CT。示意如图5所示。
测试阶段:
对于测试样本Test_Data,每个样本输入到CT中,该样本的最终输出为所有树输出的众数。测试样本的评估,计算模型预报值与真实观测值的均方根误差(RMSE)
图6是根据另一示例性实施例示出的一种气象信息预测方法的流程图。图6详细的描述了气象预测模型训练和测试的全过程。
在S602中,将获取的气象数据进行预处理。
在S604中,选择和目标气象条件相关的气象特征数据。
在S606中,生成训练集。
在S608中,生成测试集。
在S610中,利用训练集数据对随机森林模型进行训练。
在S612中,生成气象预测模型。
在S614中,利用测试数据进行某一目标气象事件的预测。
在S616中,得到目标气象事件的测试值,还可将测试值与真实发生的气象事件进行比较,以对气象预测模型进行调整。
图7是根据另一示例性实施例示出的一种气象信息预测方法的说明图。图7展示了模式的预报值与经过融合后的预报值的MSE(均方差)对比图。从图可以看出随着预报时间的增加,改善的效果也越明显。其中,横坐标是台站,纵坐标是MSE(越低表示误差越少)。图7中的A,B,C,D,E,F分别是1-6天预报的改善情况,蓝线是模式预报(EC)的降水与真值的MSE,橙色是经过模型融合后的降水预报值与真实值的MSE。
图7中G为所有站点的误差分布。经过订正后的降雨预报MSE较EC明显下降,订正后的最大值,均值,最小值都有改善。随着预报期限的增加,提升的幅度也显著增加。对于2日后的预报,93%以上的站点MSE都有降低,幅度在40%以上。
本领域技术人员可以理解实现上述实施例的全部或部分步骤被实现为由CPU执行的计算机程序。在该计算机程序被CPU执行时,执行本公开提供的上述方法所限定的上述功能。所述的程序可以存储于一种计算机可读存储介质中,该存储介质可以是只读存储器,磁盘或光盘等。
此外,需要注意的是,上述附图仅是根据本公开示例性实施例的方法所包括的处理的示意性说明,而不是限制目的。易于理解,上述附图所示的处理并不表明或限制这些处理的时间顺序。另外,也易于理解,这些处理可以是例如在多个模块中同步或异步执行的。
下述为本公开装置实施例,可以用于执行本公开方法实施例。对于本公开装置实施例中未披露的细节,请参照本公开方法实施例。
图8是根据一示例性实施例示出的一种气象信息预测装置的框图。如图8所示,气象信息预测装置80可包括:实时数据模块802,融合数据模块804,模型计算模块806,以及气象预测模块808。
实时数据模块802用于获取与气象站点关联的模式预报站点的实时气象数据;可将待进行预测的气象站点中心最近四个模式预报站点作为与气象站的相关联的站点。
融合数据模块804用于基于所述实时气象数据生成所述气象站点的融合气象数据;包括:基于所述模式预报站点和所述气象站点之间的距离,为所述模式预报站点确定融合权重;以及基于所述融合权重将所述模式预报站点对应的实时气象数据进行插值处理生成所述融合气象数据。
模型计算模块806用于将所述融合气象数据输入气象预测模型获取目标气象事件的等级及其对应的概率,其中,所述气象预测模型通过随机森林模型生成;将所述融合气象数据输入气象预测模型;所述气象预测模型中的多个分类器对所述融合气象数据进行决策计算;以及根据计算结果生成目标气象事件的等级及其对应的概率。
气象预测模块808用于基于目标气象事件的等级及其对应的概率进行所述气象站点的气象信息预测。其中,气象预测模型输出的目标气象事件可为多个,可例如同时输出降水概率、大风概率、冰雹概率等等多种气象事件的概率。可综合以上的各种气象条件及其对应的等级概率,最终生成气象信息预测。气象信息预测可为未来24小时的气象信息,也可为未来3天或者更久的气象信息,本公开不以此为限。
图9是根据另一示例性实施例示出的一种气象信息预测装置的框图。如图9所示,气象信息预测装置90包括:历史数据模块902,模型训练模块904。
历史数据模块902用于获取模式预报站点的历史气象数据;并基于所述历史气象数据生成气象站点的历史融合气象数据;如上文所述,可按照距离气象站点的远近赋予模式预报站点不同的权重,距离越近权重越大,最后综合多个权重获得插值结果,来辅助观测数据,进行模型预测。
模型训练模块904用于基于所述历史融合气象数据对随机森林模型进行训练生成所述气象预测模型。可包括:获取目标气象事件的等级分类信息;基于所述等级分类信息为所述历史融合气象数据确定等级标签;以及通过带有等级标签的历史融合气象数据对随机森林模型进行训练生成所述气象预测模型。
根据本公开的气象信息预测装置,根据与气象站点关联的模式预报站点的实时气象数据生成所述气象站点的融合气象数据;将所述融合气象数据输入气象预测模型获取目标气象事件的等级及其对应的概率,并基于目标气象事件的等级及其对应的概率进行所述气象站点的气象信息预测的方式,能够基于实时气象数据对未来的气象信息进行预测,提高气象信息的预测效率和精准度。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、或者网络设备等)执行根据本公开实施方式的上述方法。
所述软件产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
所述计算机可读存储介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读存储介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本公开操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该计算机可读介质实现如下功能:获取与气象站点关联的模式预报站点的实时气象数据;基于所述实时气象数据生成所述气象站点的融合气象数据;将所述融合气象数据输入气象预测模型获取目标气象事件的等级及其对应的概率,其中,所述气象预测模型通过随机森林模型生成;以及基于目标气象事件的等级及其对应的概率进行所述气象站点的气象信息预测。
本领域技术人员可以理解上述各模块可以按照实施例的描述分布于装置中,也可以进行相应变化唯一不同于本实施例的一个或多个装置中。上述实施例的模块可以合并为一个模块,也可以进一步拆分成多个子模块。
通过以上的实施例的描述,本领域的技术人员易于理解,这里描述的示例实施例可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施例的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、移动终端、或者网络设备等)执行根据本公开实施例的方法。
以上具体地示出和描述了本公开的示例性实施例。应可理解的是,本公开不限于这里描述的详细结构、设置方式或实现方法;相反,本公开意图涵盖包含在所附权利要求的精神和范围内的各种修改和等效设置。
Claims (13)
1.一种气象信息预测方法,其特征在于,包括:
获取与气象站点关联的模式预报站点的实时气象数据;
基于所述实时气象数据生成所述气象站点的融合气象数据;
将所述融合气象数据输入气象预测模型获取目标气象事件的等级及其对应的概率,其中,所述气象预测模型通过随机森林模型生成;以及
基于目标气象事件的等级及其对应的概率进行所述气象站点的气象信息预测。
2.如权利要求1所述的方法,其特征在于,还包括:
获取模式预报站点的历史气象数据;
基于所述历史气象数据生成气象站点的历史融合气象数据;以及
基于所述历史融合气象数据对随机森林模型进行训练生成所述气象预测模型。
3.如权利要求2所述的方法,其特征在于,基于所述历史融合气象数据对随机森林模型进行训练生成所述气象预测模型,包括:
获取多个目标气象事件的等级分类信息;
基于所述等级分类信息为所述历史融合气象数据确定等级标签;以及
通过带有等级标签的历史融合气象数据对随机森林模型进行训练生成所述气象预测模型。
4.如权利要求3所述的方法,其特征在于,通过带有等级标签的历史融合气象数据对随机森林模型进行训练生成所述气象预测模型,包括:
基于多个目标气象事件,分别通过带有等级标签的历史融合气象数据对随机森林模型进行训练生成气象预测子模型;
为多个气象预测子模型分别确定决策参数;以及
通过多个气象预测子模型及其对应的决策参数生成所述气象预测模型。
5.如权利要求3所述的方法,其特征在于,通过带有等级标签的历史融合气象数据对随机森林模型进行训练生成所述气象预测模型,包括:
将带有等级标签的历史融合气象数据划分为测试集数据和训练集数据;以及
通过所述训练集数据对随机森林模型进行训练生成所述气象预测模型。
6.如权利要求5所述的方法,其特征在于,通过带有等级标签的历史融合气象数据对随机森林模型进行训练生成所述气象预测模型,还包括:
通过所述测试集数据对所述气象预测模型进行验证。
7.如权利要求1所述的方法,其特征在于,获取与气象站点关联的模式预报站点的实时气象数据,还包括:
基于位置信息确定与所述气象站点关联的所述模式预报站点。
8.如权利要求1所述的方法,其特征在于,基于所述实时气象数据生成所述气象站点的融合气象数据,包括:
基于所述模式预报站点和所述气象站点之间的距离,为所述模式预报站点确定融合权重;以及
基于所述融合权重将所述模式预报站点对应的实时气象数据进行插值处理生成所述融合气象数据。
9.如权利要求1所述的方法,其特征在于,将所述融合气象数据输入气象预测模型获取目标气象事件的等级及其对应的概率,包括:
将所述融合气象数据输入气象预测模型;
所述气象预测模型中的多个分类器对所述融合气象数据进行决策计算;以及
根据计算结果生成目标气象事件的等级及其对应的概率。
10.如权利要求9所述的方法,其特征在于,将所述融合气象数据输入气象预测模型,还包括:
基于目标气象事件确定所述气象预测模型的决策参数。
11.如权利要求1所述的方法,其特征在于,还包括:
根据目标气象事件的等级及其对应的概率生成气象预测信息。
12.一种气象信息预测装置,其特征在于,包括:
实时数据模块,用于获取与气象站点关联的模式预报站点的实时气象数据;
融合数据模块,用于基于所述实时气象数据生成所述气象站点的融合气象数据;
模型计算模块,用于将所述融合气象数据输入气象预测模型获取目标气象事件的等级及其对应的概率,其中,所述气象预测模型通过随机森林模型生成;以及
气象预测模块,用于基于目标气象事件的等级及其对应的概率进行所述气象站点的气象信息预测。
13.如权利要求12所述的装置,其特征在于,还包括:
历史数据模块,用于获取模式预报站点的历史气象数据;并基于所述历史气象数据生成气象站点的历史融合气象数据;以及
模型训练模块,用于基于所述历史融合气象数据对随机森林模型进行训练生成所述气象预测模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911098394.8A CN112285807B (zh) | 2019-11-12 | 2019-11-12 | 一种气象信息预测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911098394.8A CN112285807B (zh) | 2019-11-12 | 2019-11-12 | 一种气象信息预测方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112285807A true CN112285807A (zh) | 2021-01-29 |
CN112285807B CN112285807B (zh) | 2023-11-07 |
Family
ID=74418908
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911098394.8A Active CN112285807B (zh) | 2019-11-12 | 2019-11-12 | 一种气象信息预测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112285807B (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112966862A (zh) * | 2021-02-25 | 2021-06-15 | 兰州中心气象台(兰州干旱生态环境监测预测中心) | 一种基于机器学习算法的短期定量降水预报方法 |
CN113011092A (zh) * | 2021-03-15 | 2021-06-22 | 广东电网有限责任公司清远供电局 | 一种气象环境监测方法、系统、电子设备和存储介质 |
CN113075752A (zh) * | 2021-04-16 | 2021-07-06 | 中国气象局气象探测中心 | 气象观测台站的三维空间位置正确性判别方法和装置 |
CN113191568A (zh) * | 2021-05-21 | 2021-07-30 | 上海市气象灾害防御技术中心(上海市防雷中心) | 基于气象的城市运行管理大数据分析预测方法和系统 |
CN114594532A (zh) * | 2022-03-09 | 2022-06-07 | 北京墨迹风云科技股份有限公司 | 一种寒潮天气预测方法、装置、电子设备及计算机可读介质 |
CN114880958A (zh) * | 2022-07-12 | 2022-08-09 | 南京气象科技创新研究院 | 一种基于多气象因子智能深度学习的能见度预报模型 |
CN116109007A (zh) * | 2023-03-23 | 2023-05-12 | 阿里巴巴达摩院(杭州)科技有限公司 | 发电功率确定方法、服务器及存储介质 |
CN117111180A (zh) * | 2023-08-15 | 2023-11-24 | 北京大学重庆大数据研究院 | 模式后气象要素发生概率预测方法、可读存储介质及计算设备 |
CN117668135A (zh) * | 2023-11-13 | 2024-03-08 | 中国人民解放军海军工程大学 | 一种基于考虑气象因素的径向基插值方法及系统 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102982658A (zh) * | 2012-11-16 | 2013-03-20 | 浙江省电力公司 | 基于精细化气象预报信息的电力基建气象灾害预警方法和系统 |
CN104656163A (zh) * | 2015-02-04 | 2015-05-27 | 中国人民解放军理工大学 | 一种基于大数据的移动通信网降水分布及动态测量方法 |
CN106324709A (zh) * | 2016-10-21 | 2017-01-11 | 中国人民解放军理工大学 | 微波链路、雨滴谱仪、雨量计与天气雷达多源联合的降雨场重构方法 |
CN107918165A (zh) * | 2016-10-09 | 2018-04-17 | 清华大学 | 基于空间插值的多卫星融合降水预测方法及系统 |
CN108761576A (zh) * | 2018-05-28 | 2018-11-06 | 国网山西省电力公司电力科学研究院 | 一种x波段气象雷达与雨量站数据融合方法及系统 |
CN109031472A (zh) * | 2017-06-09 | 2018-12-18 | 阿里巴巴集团控股有限公司 | 一种用于气象预测的数据处理方法及装置 |
CN109191408A (zh) * | 2018-04-19 | 2019-01-11 | 中国气象局公共气象服务中心 | 快速循环地面气象融合方法、装置及服务器 |
CN109917494A (zh) * | 2019-02-13 | 2019-06-21 | 上海华测导航技术股份有限公司 | 降雨预报方法、装置、设备和存储介质 |
CN110363354A (zh) * | 2019-07-16 | 2019-10-22 | 上海交通大学 | 风场风功率预测方法、电子装置及存储介质 |
-
2019
- 2019-11-12 CN CN201911098394.8A patent/CN112285807B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102982658A (zh) * | 2012-11-16 | 2013-03-20 | 浙江省电力公司 | 基于精细化气象预报信息的电力基建气象灾害预警方法和系统 |
CN104656163A (zh) * | 2015-02-04 | 2015-05-27 | 中国人民解放军理工大学 | 一种基于大数据的移动通信网降水分布及动态测量方法 |
CN107918165A (zh) * | 2016-10-09 | 2018-04-17 | 清华大学 | 基于空间插值的多卫星融合降水预测方法及系统 |
CN106324709A (zh) * | 2016-10-21 | 2017-01-11 | 中国人民解放军理工大学 | 微波链路、雨滴谱仪、雨量计与天气雷达多源联合的降雨场重构方法 |
CN109031472A (zh) * | 2017-06-09 | 2018-12-18 | 阿里巴巴集团控股有限公司 | 一种用于气象预测的数据处理方法及装置 |
CN109191408A (zh) * | 2018-04-19 | 2019-01-11 | 中国气象局公共气象服务中心 | 快速循环地面气象融合方法、装置及服务器 |
CN108761576A (zh) * | 2018-05-28 | 2018-11-06 | 国网山西省电力公司电力科学研究院 | 一种x波段气象雷达与雨量站数据融合方法及系统 |
CN109917494A (zh) * | 2019-02-13 | 2019-06-21 | 上海华测导航技术股份有限公司 | 降雨预报方法、装置、设备和存储介质 |
CN110363354A (zh) * | 2019-07-16 | 2019-10-22 | 上海交通大学 | 风场风功率预测方法、电子装置及存储介质 |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112966862A (zh) * | 2021-02-25 | 2021-06-15 | 兰州中心气象台(兰州干旱生态环境监测预测中心) | 一种基于机器学习算法的短期定量降水预报方法 |
CN113011092A (zh) * | 2021-03-15 | 2021-06-22 | 广东电网有限责任公司清远供电局 | 一种气象环境监测方法、系统、电子设备和存储介质 |
CN113075752A (zh) * | 2021-04-16 | 2021-07-06 | 中国气象局气象探测中心 | 气象观测台站的三维空间位置正确性判别方法和装置 |
CN113075752B (zh) * | 2021-04-16 | 2022-05-17 | 中国气象局气象探测中心 | 气象观测台站的三维空间位置正确性判别方法和装置 |
CN113191568B (zh) * | 2021-05-21 | 2024-02-02 | 上海市气象灾害防御技术中心(上海市防雷中心) | 基于气象的城市运行管理大数据分析预测方法和系统 |
CN113191568A (zh) * | 2021-05-21 | 2021-07-30 | 上海市气象灾害防御技术中心(上海市防雷中心) | 基于气象的城市运行管理大数据分析预测方法和系统 |
CN114594532A (zh) * | 2022-03-09 | 2022-06-07 | 北京墨迹风云科技股份有限公司 | 一种寒潮天气预测方法、装置、电子设备及计算机可读介质 |
CN114594532B (zh) * | 2022-03-09 | 2024-06-14 | 北京墨迹风云科技股份有限公司 | 一种寒潮天气预测方法、装置、电子设备及计算机可读介质 |
CN114880958A (zh) * | 2022-07-12 | 2022-08-09 | 南京气象科技创新研究院 | 一种基于多气象因子智能深度学习的能见度预报模型 |
CN116109007B (zh) * | 2023-03-23 | 2023-07-11 | 阿里巴巴达摩院(杭州)科技有限公司 | 发电功率确定方法、服务器及存储介质 |
CN116109007A (zh) * | 2023-03-23 | 2023-05-12 | 阿里巴巴达摩院(杭州)科技有限公司 | 发电功率确定方法、服务器及存储介质 |
CN117111180A (zh) * | 2023-08-15 | 2023-11-24 | 北京大学重庆大数据研究院 | 模式后气象要素发生概率预测方法、可读存储介质及计算设备 |
CN117668135A (zh) * | 2023-11-13 | 2024-03-08 | 中国人民解放军海军工程大学 | 一种基于考虑气象因素的径向基插值方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN112285807B (zh) | 2023-11-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112285807B (zh) | 一种气象信息预测方法及装置 | |
US11598900B2 (en) | Weather-driven multi-category infrastructure impact forecasting | |
CN112308281A (zh) | 一种温度信息预测方法及装置 | |
CN114493052B (zh) | 多模型融合自适应新能源功率预测方法和系统 | |
CN113822418A (zh) | 一种风电场功率预测方法、系统、设备和存储介质 | |
CN116307291B (zh) | 一种基于小波分解的分布式光伏发电预测方法及预测终端 | |
CN112598883A (zh) | 基于贝叶斯网络的输电线路落雷概率预警方法及预警系统 | |
CN117117819A (zh) | 一种光伏发电短期功率预测方法、系统、设备和介质 | |
CN117526274A (zh) | 极端气候下新能源功率预测方法、电子设备和存储介质 | |
CN116595394A (zh) | 风速修正模型的训练方法及风速预测方法、设备和介质 | |
CN114594532A (zh) | 一种寒潮天气预测方法、装置、电子设备及计算机可读介质 | |
CN111950752A (zh) | 光伏电站发电量预测方法、装置、系统及其存储介质 | |
CN108830405B (zh) | 基于多指标动态匹配的实时电力负荷预测系统及其方法 | |
Khosravi et al. | Wind farm power uncertainty quantification using a mean-variance estimation method | |
CN116739172A (zh) | 一种基于爬坡识别的海上风电功率超短期预测方法及装置 | |
CN116565840A (zh) | 一种用于风电场风功率预测的高精度风速软测量方法 | |
KR20230072219A (ko) | 날씨 예측 데이터를 이용한 확률적 시나리오 기법의 최적 입찰량 결정 시스템 | |
CN113723670A (zh) | 变时间窗口的光伏发电功率短期预测方法 | |
CN114564487A (zh) | 预报预测相结合的气象栅格数据更新方法 | |
CN113112085A (zh) | 一种基于bp神经网络的新能源场站发电负荷预测方法 | |
Indhumathi et al. | IoT-Enabled Weather Monitoring and Rainfall Prediction using Machine Learning Algorithm | |
CN117688367B (zh) | 一种基于即时学习的风力发电超短期功率预测方法及装置 | |
CN117633456B (zh) | 基于自适应焦点损失的海上风电天气事件辨识方法和装置 | |
CN114935788B (zh) | 变电站一次设备多点位雷电联合预警方法与系统 | |
CN113743648B (zh) | 空气质量集合预报方法、装置、设备和可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |