CN116756522B - 概率预报方法、装置、存储介质及电子设备 - Google Patents
概率预报方法、装置、存储介质及电子设备 Download PDFInfo
- Publication number
- CN116756522B CN116756522B CN202311015521.XA CN202311015521A CN116756522B CN 116756522 B CN116756522 B CN 116756522B CN 202311015521 A CN202311015521 A CN 202311015521A CN 116756522 B CN116756522 B CN 116756522B
- Authority
- CN
- China
- Prior art keywords
- time range
- event
- prediction
- target
- probability
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000013277 forecasting method Methods 0.000 title abstract description 17
- 238000000034 method Methods 0.000 claims description 45
- 238000000611 regression analysis Methods 0.000 claims description 27
- 238000002360 preparation method Methods 0.000 claims description 26
- 238000012545 processing Methods 0.000 claims description 26
- 238000011109 contamination Methods 0.000 claims description 22
- 238000007619 statistical method Methods 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 3
- 230000006870 function Effects 0.000 description 25
- 238000004590 computer program Methods 0.000 description 14
- 238000004891 communication Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 8
- 238000001556 precipitation Methods 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000003993 interaction Effects 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000013398 bayesian method Methods 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000012805 post-processing Methods 0.000 description 2
- 241000219094 Vitaceae Species 0.000 description 1
- 239000000926 atmospheric chemistry Substances 0.000 description 1
- 230000010267 cellular communication Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 235000021021 grapes Nutrition 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/29—Graphical models, e.g. Bayesian networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/27—Regression, e.g. linear or logistic regression
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供一种概率预报方法、装置、存储介质及电子设备,其中,该方法包括:获取第一数据集和第二数据集;基于第一数据集和第二数据集,计算目标数值模式在至少一个第二时间范围中各个第二时间范围下,对目标区域进行事件预报的预报准确指标集;基于目标数值模式在各个第二时间范围内的预报准确指标集、第一数据集以及第二数据集,确定概率预报准备数据集,以使概率预报准备数据集用于:计算目标预报事件的发生概率,目标预报事件为目标数值模式在第三时间范围下,对目标区域进行事件预报所得到的。本发明实施例可通过概率预报准备数据集便捷地进行概率预报,并提高概率预报效率。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种概率预报方法、装置、存储介质及电子设备。
背景技术
目前,概率预报已被广泛应用于各种场景,尤其是空气质量预报,此时所谓的概率预报是对未来某气象要素或天气要素在一定取值范围内出现的概率所作的预报;应当理解的是,地球系统是一个高度非线性的系统,基于大气系统、大气化学的非线性和复杂性,加上初值和数值模式等本身无法避免的一些不确定性,空气质量预报从单一值的确定论向多值的概率论转变能更好地服务社会之必需。但在相关技术中,通常采用多种数值方法(也可称为多个集合成员)分别进行事件预测,然后再对不同结果进行统计以得到事件的预报概率,如通过不同的数值模式进行预测,或通过同一数值模式对多个扰动后的初始条件进行多次预测,以进行概率统计,导致多种数值方法非常消耗计算资源,使得计算资源随着集合成员的增加而增加。基于此,如何便捷地进行概率预报,以提高概率预报效率成为一个研究热点。
发明内容
有鉴于此,本发明实施例提供了一种概率预报方法、装置、存储介质及电子设备,以解决概率预报较为繁琐,且非常消耗计算资源等问题;相应的,本发明实施例可确定概率预报准备数据集,以通过概率预报准备数据集便捷地进行概率预报,并提高概率预报效率。
根据本发明的一方面,提供了一种概率预报方法,所述方法包括:
获取第一数据集和第二数据集,所述第一数据集包括:目标区域在至少一个第一时间范围中各个第一时间范围内的实际事件数据集,所述第二数据集包括:所述目标区域在所述各个第一时间范围内的预报事件数据集,且一个预报事件数据是通过目标数值模式进行事件预报得到的;
基于所述第一数据集和所述第二数据集,计算所述目标数值模式在至少一个第二时间范围中各个第二时间范围下,对所述目标区域进行事件预报的预报准确指标集;
基于所述目标数值模式在所述各个第二时间范围内的预报准确指标集、所述第一数据集以及所述第二数据集,确定概率预报准备数据集,以使所述概率预报准备数据集用于:计算目标预报事件的发生概率,所述目标预报事件为所述目标数值模式在第三时间范围下,对所述目标区域进行事件预报所得到的。
根据本发明的另一方面,提供了一种概率预报装置,所述装置包括:
获取单元,用于获取第一数据集和第二数据集,所述第一数据集包括:目标区域在至少一个第一时间范围中各个第一时间范围内的实际事件数据集,所述第二数据集包括:所述目标区域在所述各个第一时间范围内的预报事件数据集,且一个预报事件数据是通过目标数值模式进行事件预报得到的;
处理单元,用于基于所述第一数据集和所述第二数据集,计算所述目标数值模式在至少一个第二时间范围中各个第二时间范围下,对所述目标区域进行事件预报的预报准确指标集;
所述处理单元,还用于基于所述目标数值模式在所述各个第二时间范围内的预报准确指标集、所述第一数据集以及所述第二数据集,确定概率预报准备数据集,以使所述概率预报准备数据集用于:计算目标预报事件的发生概率,所述目标预报事件为所述目标数值模式在第三时间范围下,对所述目标区域进行事件预报所得到的。
根据本发明的另一方面,提供了一种电子设备,所述电子设备包括处理器、以及存储程序的存储器,其中,所述程序包括指令,所述指令在由所述处理器执行时使所述处理器执行上述所提及的方法。
根据本发明的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使计算机执行上述所提及的方法。
本发明实施例可在获取到第一数据集和第二数据集后,基于第一数据集和第二数据集,计算目标数值模式在至少一个第二时间范围中各个第二时间范围下,对目标区域进行事件预报的预报准确指标集;其中,第一数据集包括:目标区域在至少一个第一时间范围中各个第一时间范围内的实际事件数据集,第二数据集包括:目标区域在各个第一时间范围内的预报事件数据集,且一个预报事件数据是通过目标数值模式进行事件预报得到的。然后,可基于目标数值模式在各个第二时间范围内的预报准确指标集、第一数据集以及第二数据集,确定概率预报准备数据集,以使概率预报准备数据集用于:计算目标预报事件的发生概率,目标预报事件为目标数值模式在第三时间范围下,对目标区域进行事件预报所得到的。可见,本发明实施例可通过概率预报准备数据集便捷地进行概率预报,并提高概率预报效率。
附图说明
在下面结合附图对于示例性实施例的描述中,本发明的更多细节、特征和优点被公开,在附图中:
图1示出了根据本发明示例性实施例的一种概率预报方法的流程示意图;
图2示出了根据本发明示例性实施例的一种等级污染事件的示意图;
图3示出了根据本发明示例性实施例的一种等级降水事件的示意图;
图4示出了根据本发明示例性实施例的另一种概率预报方法的流程示意图;
图5示出了根据本发明示例性实施例的一种概率预报装置的示意性框图;
图6示出了能够用于实现本发明的实施例的示例性电子设备的结构框图。
具体实施方式
下面将参照附图更详细地描述本发明的实施例。虽然附图中显示了本发明的某些实施例,然而应当理解的是,本发明可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本发明。应当理解的是,本发明的附图及实施例仅用于示例性作用,并非用于限制本发明的保护范围。
应当理解,本发明的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本发明的范围在此方面不受限制。
本文使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”;术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。需要注意,本发明中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
需要注意,本发明中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
本发明实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。
需要说明的是,本发明实施例提供的概率预报方法的执行主体可以是一个或多个电子设备,本发明对此不作限定;其中,电子设备可以是终端(即客户端)或者服务器,那么在执行主体包括多个电子设备,且多个电子设备中包括至少一个终端和至少一个服务器时,本发明实施例提供的概率预报方法可由终端和服务器共同执行。相应的,此处所提及的终端可以包括但不限于:智能手机、平板电脑、笔记本电脑、台式计算机、智能手表、智能语音交互设备、智能家电、车载终端、飞行器,等等。此处所提及的服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算(cloud computing)、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN(Content Delivery Network,内容分发网络)、以及大数据和人工智能平台等基础云计算服务的云服务器,等等。
基于上述描述,本发明实施例提出一种概率预报方法,该概率预报方法可以由上述所提及的电子设备(终端或服务器)执行;或者,该概率预报方法可由终端和服务器共同执行。为了便于阐述,后续均以电子设备执行该概率预报方法为例进行说明;如图1所示,该概率预报方法可包括以下步骤S101-S103:
S101,获取第一数据集和第二数据集,第一数据集包括:目标区域在至少一个第一时间范围中各个第一时间范围内的实际事件数据集,第二数据集包括:目标区域在各个第一时间范围内的预报事件数据集,且一个预报事件数据是通过目标数值模式进行事件预报得到的。
其中,一个第一时间范围可包括:相应第一隶属时间指标在第一历史时间范围内的至少一个时间子范围;该第一隶属时间指标可以是月份(如1月份或2月份等),此时第一隶属时间指标的指示时长为月;第一隶属时间指标也可以是季度(如第一个季度或第二个季度等),此时第一隶属时间指标的指示时长为季度,等等;本发明对此不作限定。相应的,第一历史时间范围可以指的是当前系统时间之前的Y年,Y的取值可以是5,也可以是3等,本发明对此不作限定;如2019年、2021年以及2022年这三年的时间范围,或2018年-2022年这五年的时间范围,等等;应当理解的是,Y的取值可以不为整数,如Y的取值为5.5时,第一历史时间范围包括五年半的时间范围。
例如,假设一个第一时间范围对应的第一隶属时间指标为1月份,第一历史时间范围为2020年-2022年,那么第一隶属时间指标为1月份对应的第一时间范围可包括:2020年1月、2021年1月以及2022年1月。又如,假设一个第一时间范围对应的第一隶属时间指标为第一个季度,第一历史时间范围为2020年-2022年,那么第一隶属时间指标为第一个季度对应的第一时间范围可包括:2020年的第一个季度、2021年的第一个季度以及2022年的第一个季度,等等。
应当理解的是,实际事件数据是根据实际发生的事件所得到的,且实际发生的事件为至少一个事件中的任一事件。可选的,一个实际事件数据可以为实际发生的一个事件,也可以为相应第一时间范围内某个事件的发生次数,还可以为相应第一时间范围中的一个时间子范围内,某个事件的发生次数等,本发明对此不作限定。可选的,一个预报事件数据可以为目标数值模式预报的一个事件,也可以为目标数值模式在相应第一时间范围内对某个事件的预报次数,还可以为目标数值模式在相应第一时间范围中的一个时间子范围内,对某个事件的预报次数等,本发明对此不作限定。
示例性的,以实际事件数据集为例进行说明,假设第一时间范围1包括时间子范围1(如2021年1月)和时间子范围2(如2022年1月),至少一个事件包括事件1和事件2,且时间子范围1内实际发生的事件包括15个事件1和16个事件2,时间子范围2内实际发生的事件包括12个事件1和19个事件2,那么当一个实际事件数据为实际发生的一个事件时,第一时间范围1内的实际事件数据集可包括时间子范围1内实际发生的事件(即15个事件1和16个事件2),以及时间子范围2内实际发生的事件(即12个事件1和19个事件2);当一个实际事件数据为相应第一时间范围内某个事件的发生次数时,第一时间范围1内的实际事件数据集可包括:第一时间范围1内事件1的发生次数(即27),以及第一时间范围1内事件2的发生次数(即35);当一个实际事件数据为相应第一时间范围中的一个时间子范围内,某个事件的发生次数时,第一时间范围1内的实际事件数据集可包括:时间子范围1内事件1的发生次数(即15)、时间子范围1内事件2的发生次数(即16)、时间子范围2内事件1的发生次数(即12)以及时间子范围2内事件2的发生次数(即19),等等。
需要说明的是,一个事件可以是指等级污染事件(如轻度污染、重度污染或空气优良等),如图2所示;此时目标数值模式可以是指空气质量数值模式(如CMAQ(一种空气质量预报和评估系统)、NAQPMS((Nested Air Quality Prediction Modeling System,嵌套网格空气质量预报模式系统))等)。相应的,一个事件也可以是指等级降水事件(如小雨、中雨或晴等),当等级降水事件仅分为降水(包括小雨、中雨以及暴雨等)和不降水(即晴)时,可如图3所示;此时目标数值模式可以是指降水数值模式(如Ecmwf(一种天气预报系统)或Grapes(另一种天气预报系统)等),等等;本发明对此不作限定。
在本发明实施例中,上述第一数据集和第二数据集的获取方式包括但不限于以下几种:
第一种获取方式:电子设备可获取第一数据集的第一下载链接和第二数据集的第二下载链接,并将基于第一下载链接下载的数据集作为第一数据集,将基于第二下载链接下载的数据集作为第二数据集。或者,电子设备可获取第三下载链接,该第三下载链接对应的数据集包括第一数据集和第二数据集,那么电子设备可根据第三下载链接进行下载,以得到第一数据集和第二数据集。
第二种获取方式:电子设备存储有多个区域中各个区域对应的第一数据集和第二数据集,那么电子设备可从多个区域中选取至少一个区域,并将选取出的区域作为目标区域,从而获取目标区域对应的第一数据集和第二数据集,等等。
需要说明的是,上述目标区域可以是全国区域,也可以是某个省所在的区域,还可以是某个市所在的区域,等等;本发明对此不作限定。
S102,基于第一数据集和第二数据集,计算目标数值模式在至少一个第二时间范围中各个第二时间范围下,对目标区域进行事件预报的预报准确指标集。
其中,一个第二时间范围可包括:相应第二隶属时间指标在第二历史时间范围内的至少一个时间子范围,该第二隶属时间指标可以是月份(如1月份或2月份等),也可以是季度(如第一个季度或第二个季度等)等,本发明对此不作限定;可选的,第二隶属时间指标的指示时长(如月或季度等)可与第一隶属时间指标的指示时长相同,也可与第一隶属时间指标的指示时长不同,本发明对此不作限定。相应的,第二历史时间范围可以指的是当前系统时间之前的Q年,Q的取值可以是5,也可以是3等,本发明对此不作限定。应当理解的是,由于各个第二时间范围下对目标区域进行事件预报的预报准确指标集是根据第一数据集和第二数据集计算得到的,那么第二历史时间范围可等于第一历史时间范围,也可小于第一历史时间范围(即第二历史时间范围为第一历史时间范围中的部分时间范围),等等。
相应的,至少一个第二时间范围中的各个第二时间范围,可与至少一个第一时间范围中的各个第一时间范围一一对应,也就是说,一个第二时间范围可与至少一个第一时间范围中的某个第一时间范围相同,且至少一个第二时间范围中的第二时间范围的数量与至少一个第一时间范围中的第一时间范围的数量相同;或者,一个第二时间范围可包括至少一个第一时间范围中的M个第一时间范围,M为正整数,且M小于或等于至少一个第一时间范围中的第一时间范围的数量,等等;本发明对此不作限定。
例如,假设第一历史时间范围为2019年-2022年,那么当第二历史时间范围与第一历史时间范围相同时,第二历史时间范围则为2019年-2022年;当第二历史时间范围与第一历史时间范围不同时,第二历史时间范围可为2020年-2022年,或第二历史时间范围可为2019年和2021年等。可选的,本发明实施例可优选第二历史时间范围与第一历史时间范围相同的情况进行计算,从而在计算预报准确指标集时充分考虑第一数据集和第二数据集,以提高预报准确指标集的准确性。
又如,假设第一历史时间范围和第二历史时间范围均为2020年-2022年,一个第一时间范围对应的第一隶属时间指标为1月份,且相应的一个第二时间范围对应的第二隶属指标也为1月份时,第一隶属时间指标为1月份对应的第一时间范围可包括:2020年1月、2021年1月以及2022年1月,且第二隶属时间指标为1月份对应的第二时间范围可包括:2020年1月、2021年1月以及2022年1月,此时第一隶属时间指标为1月份对应的第一时间范围,与第二隶属时间指标为1月份对应的第二时间范围相同。
再如,假设第一历史时间范围和第二历史时间范围均为2020年-2022年,一个第一时间范围对应的第一隶属时间指标的指示时长为月,且相应的一个第二时间范围对应的第二隶属时间指标为第一个季度时,第二隶属时间指标为第一个季度对应的第二时间范围包括:第一隶属时间指标为1月份对应的第一时间范围、第一隶属时间指标为2月份对应的第一时间范围以及第一隶属时间指标为3月份对应的第一时间范围;当一个第二时间范围对应的第二隶属时间指标的指示时长为年时,至少一个第二时间范围中的第二时间范围的数量为1,且该第二时间范围包括2020年-2022年,即该第二时间范围包括各个第一时间范围,等等。
S103,基于目标数值模式在各个第二时间范围内的预报准确指标集、第一数据集以及第二数据集,确定概率预报准备数据集,以使概率预报准备数据集用于:计算目标预报事件的发生概率,目标预报事件为目标数值模式在第三时间范围下,对目标区域进行事件预报所得到的。
其中,目标预报事件可以为至少一个事件中的任一事件,该至少一个事件包括目标数值模式支持预报的所有事件。需要说明的是,第三时间范围对应的时长可以为一天(即第三时间范围可以为某天),第三时间范围对应的时长可以为一个月(即第三时间范围可以为某个月),等等;本发明对此不作限定。
应当理解的是,在采用目标数值模式进行事件预报时,可包括两种预报方式,一种是确定性预报,一种是概率预报,其中业务使用的大多数是确定性预报,如目标数值模式为空气质量数值模式时,可预报明天目标区域的AQI(Air Quality Index,空气质量指数)为120,等级为轻度污染,而概率预报则是预报出明天的空气质量等级为轻度污染的同时,还要给出预期发生的概率(如30%)。可见,确定性预报只能给出一个确定的结果,没有给出不确定度,决策者在面对一个确定的结论时,没办法判断这个可信度有多大;而概率预报能够为污染管控的决策提供更多信息(如预报的结果明天有可能为重度污染(即目标预报事件为重度污染)的发生概率为30%,与预报的结果明天有可能为重度污染的发生概率为80%的目标预报事件相同,即预报的等级是一样的,但是对是否需要启动红色预警的决策的影响是不同的)。
需要说明的是,目前基于集合预报的不同成员预报的结果进行统计,最终得到各个事件的发生概率时,关键在于如何获得集合预报,通常情况下可使用多个数值模式、或者基于单个数值模式对其输入条件进行扰动,这两种方法都对计算资源有较高的要求。示例性的,以初始条件扰动,驱动单个数值模式来得到概率预报为例进行说明,在进行概率预报时,可对初始条件进行扰动,得到D个初始条件,并可采用D个初始条件,驱动数值模式(如CMAQ)进行模拟,得到D个集合成员(即D个初始条件)的结果,从而可对D个集合成员的结果进行处理,得到每个集合成员对目标区域的预报事件,以对D个预报事件进行统计,得到各个事件的发生概率。
具体的,可采用公式1.1,计算至少一个事件中第i个事件的发生概率:
式1.1
其中,P(i)为至少一个事件中第i个事件的发生概率,N为集合成员总数(如数值方法的数量或初始扰动的数量等),n i为集合预报第i个事件的个数。示例性的,假设共有4个数值方法,其中3个数值方法预报明天目标区域的空气质量等级为轻度污染,那么轻度污染的发生概率可为75%。
可见,基于集合预报的方式不仅非常消耗计算资源,且没有考虑不同方法的预报准确率对概率统计的影响,比如一个准确度较高的数值模式给出明天目标区域是轻度污染,而一个准确度较低的数值模式给出的明天目标区域是重度污染,那么统计时其权重应该不一样的。相应的,本发明通过引入贝叶斯方法,哪怕只有一个数值模式,也能给出事件的发生概率,即给出预报的不确定度,并可避免因多个数值模式中各个数值模式的准确度不同而对发生概率产生影响。
本发明实施例可在获取到第一数据集和第二数据集后,基于第一数据集和第二数据集,计算目标数值模式在至少一个第二时间范围中各个第二时间范围下,对目标区域进行事件预报的预报准确指标集;其中,第一数据集包括:目标区域在至少一个第一时间范围中各个第一时间范围内的实际事件数据集,第二数据集包括:目标区域在各个第一时间范围内的预报事件数据集,且一个预报事件数据是通过目标数值模式进行事件预报得到的。然后,可基于目标数值模式在各个第二时间范围内的预报准确指标集、第一数据集以及第二数据集,确定概率预报准备数据集,以使概率预报准备数据集用于:计算目标预报事件的发生概率,目标预报事件为目标数值模式在第三时间范围下,对目标区域进行事件预报所得到的。可见,本发明实施例可通过概率预报准备数据集便捷地进行概率预报,并提高概率预报效率。
基于上述描述,本发明实施例还提出一种更为具体的概率预报方法。相应的,该概率预报方法可以由上述所提及的电子设备(终端或服务器)执行;或者,该概率预报方法可由终端和服务器共同执行。为了便于阐述,后续均以电子设备执行该概率预报方法为例进行说明;请参见图4,该概率预报方法可包括以下步骤S401-S405:
S401,获取第一数据集和第二数据集,第一数据集包括:目标区域在至少一个第一时间范围中各个第一时间范围内的实际事件数据集,第二数据集包括:目标区域在各个第一时间范围内的预报事件数据集,且一个预报事件数据是通过目标数值模式进行事件预报得到的。
需要说明的是,一个实际事件数据集可用于指示相应第一时间范围内至少一个事件中各个事件的发生次数,且一个预报事件数据集可用于指示相应第一时间范围内各个事件的预报次数。应当理解的是,当一个实际事件数据为实际发生的一个事件,或一个实际事件数据为相应第一时间范围中的一个时间子范围内,某个事件的发生次数时,一个实际事件数据集是通过包含的实际事件数据的统计结果,对相应第一时间范围内各个事件的发生次数进行指示的;当一个实际事件数据为相应第一时间范围内某个事件的发生次数时,一个实际事件数据集是通过包含的实际事件数据,对相应第一时间范围内各个事件的发生次数进行指示的。同理,当一个预报事件数据为目标数值模式预报的一个事件,或一个预报事件数据为目标数值模式在相应第一时间范围中的一个时间子范围内,对某个事件的预报次数时,一个预报事件数据集是通过包含的预报事件数据的统计结果,对相应第一时间范围内各个事件的预报次数进行指示的;当一个预报事件数据为目标数值模式在相应第一时间范围内对某个事件的预报次数时,一个预报事件数据集是通过包含的预报事件数据,对相应第一时间范围内各个事件的预报次数进行指示的,等等。
S402,基于第一数据集和第二数据集,计算目标数值模式在至少一个第二时间范围中各个第二时间范围下,对目标区域进行事件预报的预报准确指标集。
具体的,针对至少一个第二时间范围中的任一第二时间范围,电子设备可确定该任一第二时间范围对应的M个第一时间范围,M为正整数;并从第一数据集中确定出M个第一时间范围内的实际事件数据集,以及从第二数据集中确定出M个第一时间范围内的预报事件数据集;然后,可采用M个第一时间范围内的实际事件数据集和预报事件数据集,计算目标数值模式在任一第二时间范围下,对目标区域进行事件预报的预报准确指标集。
示例性的,假设第一历史时间范围包括2020年-2022年,也就是说,第一数据集可包括过去3年的观测数据(即实际事件数据),第二数据集可包括过去3年的模式数据(即预报事件数据),且假设至少一个第二时间范围中第二时间范围的数量为1,且该第二时间范围为2020年-2022年,一个第一时间范围对应的第一隶属时间指标的指示时长为月,则至少一个第一时间范围中第一时间范围的数量为12,此时该第二时间范围可对应12个第一时间范围。在此种情况下,电子设备可采用12个第一时间范围内的实际事件数据集和预报事件数据集,计算目标数值模式在该第二时间范围下,对目标区域进行事件预报的预报准确指标集;进一步的,以事件“轻度污染”为例进行说明,假设12个第一时间范围内的实际事件数据集中,轻度污染的发生次数为20(即2020年-2022年间目标区域的轻度污染发生了20次),且12个第一时间范围内的预报事件数据集中,实际发生的20次轻度污染被预报对了12次,那么2020年-2022年间目标区域的轻度污染的预报准确率为60%。
进一步的,一个预报准确指标集可包括至少一个预报指标中各个预报指标下的预报准确指标,一个预报指标用于指示事件的预报时间与相应事件所对应发生时间之间的时间间隔(如一天、两天或三天等),且一个预报事件数据集包括相应第一时间范围内各个预报指标下的预报事件数据子集;也就是说,一个预报准确指标集可包括相应第二时间范围内,至少一个预报指标中各个预报指标下的预报准确指标,且一个预报准确指标可包括相应第二时间范围内,至少一个事件中各个事件在相应预报指标下的预报准确率。应当理解的是,当至少一个预报指标中预报指标的数量为1时,一个第二时间范围内的预报准确指标集中的预报准确指标的数量也为1。
举例来说,假设需对未来5天中的每一天进行事件预报,那么上述至少一个预报指标中预报指标的数量可为5,也就是说,至少一个预报指标可包括预报指标1、预报指标2、预报指标3、预报指标4以及预报指标5;其中,预报指标1可以为时间间隔为1天的预报指标(即在第二天对目标区域进行事件预报的预报指标),预报指标2可以为时间间隔为2天的预报指标(即在第三天对目标区域进行事件预报的预报指标),预报指标3可以为时间间隔为3天的预报指标(即在第四天对目标区域进行事件预报的预报指标),等等。应当理解的是,由于在实际应用过程中,通常会对未来Q天中的每一天进行事件预报,Q为正整数;那么相应的,在实际应用过程中,采用某个预报指标下的预报事件数据子集,计算目标数值模式在该预报指标下对目标区域进行事件预报的预报准确指标,可得到该预报指标下更加精确的预报准确指标,以得到更加精确的概率预报准备数据集(即可包括各个预报指标下的预报准确指标),从而在按照该预报指标对未来某天进行事件预报时,可通过该预报指标下更加精确的预报准确指标,得到精确度较高的预报事件的发生概率。
需要说明的是,一个预报事件数据子集可包括相应第一时间范围内,且相应预报指标下的预报事件数据;示例性的,以时间间隔为1天的预报指标为例进行说明,假设一个第一时间范围包括2021年1月1日、2021年1月2日、2021年1月3日等2021年1月中的每一天,那么此时该第一时间范围内且时间间隔为1天的预报指标下的预报事件数据子集可包括:目标数值模式在2020年12月31日对2021年1月1日的目标区域进行事件预报的预报事件、目标数值模式在2021年1月1日对2021年1月2日的目标区域进行事件预报的预报事件、目标数值模式在2021年1月2日对2021年1月3日的目标区域进行事件预报的预报事件等,也可包括前一天分别对相应时间范围的目标区域进行事件预报的预报事件的预报次数等。
在本发明实施例中,在采用M个第一时间范围内的实际事件数据集和预报事件数据集,计算目标数值模式在任一第二时间范围下,对目标区域进行事件预报的预报准确指标集时,针对至少一个预报指标中的任一预报指标,电子设备可从M个第一时间范围内的预报事件数据集中,确定出任一预报指标下的预报事件数据子集;并采用M个第一时间范围内的实际事件数据集,以及任一预报指标下的预报事件数据子集,计算目标数值模式在任一第二时间范围以及任一预报指标下,对目标区域进行事件预报的预报准确指标;然后,可将计算得到的预报准确指标,添加至目标数值模式在任一第二时间范围下对目标区域进行事件预报的预报准确指标集中,以得到目标数值模式在任一第二时间范围下对目标区域进行事件预报的预报准确指标集。
具体的,在采用M个第一时间范围内的实际事件数据集,以及任一预报指标下的预报事件数据子集,计算目标数值模式在任一第二时间范围以及任一预报指标下,对目标区域进行事件预报的预报准确指标时,电子设备可基于M个第一时间范围内的实际事件数据集,确定至少一个事件中各个事件在M个第一时间范围内的发生次数;针对至少一个事件中的任一事件,电子设备可从上述任一预报指标下的预报事件数据子集中,确定出该任一事件通过目标数值模式在该任一第二时间范围以及该任一预报指标下的预报准确次数,并采用该预报准确次数和该任一事件在M个第一时间范围内的发生次数,计算该任一事件通过目标数值模式在该任一第二时间范围以及该任一预报指标下的预报准确率,从而将该预报准确率添加至目标数值模式在该任一第二时间范围以及该任一预报指标下,对目标区域进行事件预报的预报准确指标中,以得到目标数值模式在该任一第二时间范围以及该任一预报指标下,对目标区域进行事件预报的预报准确指标。
在一种实施方式中,一个实际事件数据为实际发生的一个事件,一个预报事件数据为目标数值模式预报的一个事件,且M个第一时间范围内的实际事件数据集中的实际事件数据,与上述任一预报指标下的预报事件数据子集中的预报事件数据一一对应;在从上述任一预报指标下的预报事件数据子集中,确定出该任一事件通过目标数值模式在该任一第二时间范围以及该任一预报指标下的预报准确次数时,电子设备可遍历上述任一预报指标下的预报事件数据子集中,上述任一事件对应的预报事件数据,并将当前遍历的预报事件数据作为当前预报事件数据。基于此,可从M个第一时间范围内的实际事件数据中与当前预报事件数据对应的实际预报数据,若当前预报事件数据对应的实际事件数据,与当前预报事件数据相同,则将当前预报事件数据作为预报准确的预报事件;在遍历完上述任一预报指标下的预报事件数据子集中,上述任一事件对应的预报事件数据后,可对预报准确的预报事件进行统计,得到该任一事件通过目标数值模式在该任一第二时间范围以及该任一预报指标下的预报准确次数。
示例性的,假设一个第二时间范围对应的M个第一时间范围内的实际事件数据集包括2021年1月1日的实际事件数据“轻度污染”、2021年1月2日的实际事件数据“轻度污染”以及2021年1月3日的实际事件数据“重度污染”,且该第二时间范围内以及该任一预报指标下的预报事件数据子集包括按照该任一预报指标对2021年1月1日的目标区域进行事件预报的预报事件数据“轻度污染”、按照该任一预报指标对2021年1月2日的目标区域进行事件预报的预报事件数据“重度污染”,以及按照该任一预报指标对2021年1月3日的目标区域进行事件预报的预报事件数据“轻度污染”;在此种情况下,可确定该任一预报指标对2021年1月1日的目标区域进行事件预报的预报事件数据为预报准确的预报事件,则此时该任一事件通过目标数值模式在该任一第二时间范围以及该任一预报指标下的预报准确次数为1。
另一种实施方式中,一个预报事件数据可包括目标数值模式预报的一个事件,以及实际对比标识,实际对比标识为实际相同标识和实际不同标识中的任一种,实际相同标识用于指示相应预报事件数据为预报准确的预报事件,实际不同标识用于指示相应预报事件数据为预报不准确的预报事件。基于此,在从上述任一预报指标下的预报事件数据子集中,确定出该任一事件通过目标数值模式在该任一第二时间范围以及该任一预报指标下的预报准确次数时,电子设备可从上述任一预报指标下的预报事件数据子集中,确定出该任一事件对应的至少一个预报事件数据,并对至少一个预报事件数据中实际对比标识为实际相同标识的预报事件数据进行统计,得到该任一事件通过目标数值模式在该任一第二时间范围以及该任一预报指标下的预报准确次数,等等。其中,实际相同标识可以为数字标识(如1),也可以是字母标识(如a)等,本发明对此不作限定;相应的实际不同标识可以为数字标识(如0),也可以是字母标识(如b)等,本发明对此不作限定。
示例性的,假设上述任一预报指标下的预报事件数据子集包括预报事件数据1(包括预报事件“轻度污染”和实际相同标识)、预报事件数据2(包括预报事件“轻度污染”和实际相同标识)、预报事件数据3(包括预报事件“轻度污染”和实际不同标识)、预报事件数据4(包括预报事件“重度污染”和实际相同标识)以及预报事件数据5(包括预报事件“重度污染”和实际相同标识),且假设上述任一事件为轻度污染,此时该任一事件对应的至少一个预报事件数据包括预报事件数据1、预报事件数据2以及预报事件数据3;由于至少一个预报事件数据中实际对比标识为实际相同标识的预报事件数据有预报事件数据1和预报事件数据2,此时该任一事件通过目标数值模式在该任一第二时间范围以及该任一预报指标下的预报准确次数为2。
S403,分别基于各个第一时间范围内的实际事件数据集所指示的发生次数,计算各个第一时间范围内的实际发生概率集,一个实际发生概率集包括相应第一时间范围内各个事件的实际发生概率。
在一种具体的实现中,针对至少一个第一时间范围中的任一第一时间范围,电子设备可对该任一第一时间范围内的实际事件数据集所指示的发生次数进行求和处理,得到该任一第一时间范围对应的发生次数总和,并分别采用该任一第一时间范围内的实际事件数据集所指示的发生次数,以及该发生次数总和,计算该任一第一时间范围内各个事件的实际发生概率,以得到该任一第一时间范围内的实际发生概率集。换句话说,电子设备可对该任一第一时间范围内的实际事件数据集所指示的发生次数进行统计分析,得到该任一第一时间范围内的实际发生概率集。
示例性的,假设基于过去Y年(即第一历史时间范围为过去Y年)的实际事件数据集,分月份统计目标区域各个事件(如等级污染事件)的实际发生概率,且以第一隶属时间指标为1月份对应的第一时间范围为例进行说明;又假设目标区域在第一隶属时间指标为1月份对应的第一时间范围(包括过去Y年中每年的1月)内的实际事件数据集包括:15个实际事件数据“空气优良”、9个实际事件数据“轻度污染”以及6个实际事件数据“中度污染”,此时该第一时间范围对应的发生次数总和为30,那么目标区域在1月份发生空气优良的实际发生概率为50%、轻度污染的实际发生概率为30%,以及中度污染的实际发生概率为20%;也就是说,该第一时间范围内的实际发生概率集可包括空气优良的实际发生概率“50%”、轻度污染的实际发生概率“30%”以及中度污染的实际发生概率“20%”。
另一种具体的实现中,一个第一时间范围可包括多个时间子范围(即一个第一时间范围内的时间子范围的数量可为多个),且一个第一时间范围内的实际事件数据集包括多个时间子范围中各个时间子范围内的实际事件数据子集;基于此,电子设备可针对至少一个第一时间范围中的任一第一时间范围,分别对该任一第一时间范围中各个时间子范围内的实际事件数据子集所指示的发生次数进行统计分析,得到该任一第一时间范围中各个时间子范围内的初始实际发生概率集;然后,可对该任一第一时间范围中各个时间子范围内的初始实际发生概率集进行回归分析,得到该任一第一时间范围内的实际发生概率集。应当理解的是,电子设备在执行回归分析后,可得到目标回归分析函数,并采用目标回归分析函数计算该任一第一时间范围在目标预测数值下的实际发生概率集,以得到该任一第一时间范围内的实际发生概率集。其中,目标回归分析函数可为一个多维回归分析函数,此时一个初始实际发生概率集作为一个因变量,以进行回归分析;目标回归分析函数也可为多个一维回归分析函数(即目标回归分析函数的数量可以为多个),此时可分别将初始实际发生概率集中各个事件的初始实际发生概率作为一个因变量,以进行回归分析,从而得到各个事件对应的目标回归分析函数,等等,本发明对此不作限定。需要说明的是,在进行回归分析时的自变量可以为时间序列,则目标预测数值可为时间序列上的任一时间数值,如4(即预测第4年内相应第一隶属时间指标下的实际发生概率集,以作为相应第一时间范围内的实际发生概率集)或5(即预测第5年内的第一隶属时间指标下的实际发生概率集,以作为相应第一时间范围内的实际发生概率集)等,本发明对目标预测数值的具体取值不作限定。
示例性的,以第一隶属时间指标为1月份对应的第一时间范围为例进行说明,假设该第一时间范围中的多个时间子范围包括:2020年1月、2021年1月以及2022年1月,则可得到3个时间子范围中各个时间子范围内的初始实际发生概率集;又假设2020年1月内的初始实际发生概率集1包括:空气优良的初始实际发生概率“20%”、轻度污染的初始实际发生概率“60%”以及中度污染的初始实际发生概率“20%”,2021年1月内的初始实际发生概率集2包括:空气优良的初始实际发生概率“30%”、轻度污染的初始实际发生概率“50%”以及中度污染的初始实际发生概率“20%”,2022年1月内的初始实际发生概率集3包括:空气优良的初始实际发生概率“30%”、轻度污染的初始实际发生概率“40%”以及中度污染的初始实际发生概率“20%”。那么相应的,电子设备可对初始实际发生概率集1、初始实际发生概率集2以及初始实际发生概率集 3进行回归分析,得到多维的目标回归分析函数;或者,电子设备可对初始实际发生概率集1中空气优良的初始实际发生概率(即20%)、初始实际发生概率集2中空气优良的初始实际发生概率(即30%)以及初始实际发生概率集3中空气优良的初始实际发生概率(即30%)进行回归分析,并对初始实际发生概率集1中轻度污染的初始实际发生概率、初始实际发生概率集2中轻度污染的初始实际发生概率以及初始实际发生概率集3中轻度污染的初始实际发生概率进行回归分析,以及对各个初始实际发生概率集中中度污染的初始实际发生概率进行回归分析,得到各个事件对应的目标回归分析函数(即空气优良对应的目标回归分析函数、轻度污染对应的目标回归分析函数以及中度污染对应的目标回归分析函数等)。在此种情况下,电子设备可将目标预测数值“4”带入目标回归分析函数,得到第4年1月(即2023年1月)内的实际发生概率集,并作为第一隶属时间指标为1月份对应的第一时间范围内的实际发生概率集,等等。
S404,分别基于各个第一时间范围内的预报事件数据集所指示的预报次数,计算各个第一时间范围内的预报概率集,一个预报概率集包括相应第一时间范围内各个事件的预报概率。
在一种具体的实现中,针对至少一个第一时间范围中的任一第一时间范围,电子设备可对该任一第一时间范围内的预报事件数据集所指示的预报次数进行求和处理,得到该任一第一时间范围对应的预报次数总和,并分别采用该任一第一时间范围内的预报事件数据集所指示的预报次数,以及该预报次数总和,计算该任一第一时间范围内各个事件的预报概率,以得到该任一第一时间范围内的预报概率集。换句话说,电子设备可对该任一第一时间范围内的预报事件数据集所指示的预报次数进行统计分析,得到该任一第一时间范围内的预报概率集。
示例性的,假设基于过去Y年(即第一历史时间范围为过去Y年)的预报事件数据集,分月份统计目标区域各个事件(如等级污染事件)的预报概率,且以第一隶属时间指标为1月份对应的第一时间范围为例进行说明;又假设目标区域在第一隶属时间指标为1月份对应的第一时间范围(包括过去Y年中每年的1月)内的预报事件数据集包括:27个预报事件数据“空气优良”、15个预报事件数据“轻度污染”以及18个预报事件数据“中度污染”,此时该第一时间范围对应的预报次数总和为60,那么目标区域在1月份发生空气优良的预报概率为45%、轻度污染的预报概率为25%,以及中度污染的预报概率为30%;也就是说,该第一时间范围内的预报概率集可包括空气优良的预报概率“45%”、轻度污染的预报概率“25%”以及中度污染的预报概率“30%”。
另一种具体的实现中,一个第一时间范围可包括多个时间子范围,且一个第一时间范围内的预报事件数据集包括多个时间子范围中各个时间子范围内的预报事件数据子集;基于此,电子设备可针对至少一个第一时间范围中的任一第一时间范围,分别对任一第一时间范围中各个时间子范围内的预报事件数据子集所指示的预报次数进行统计分析,得到任一第一时间范围中各个时间子范围内的初始预报概率集;然后,可对任一第一时间范围中各个时间子范围内的初始预报概率集进行回归分析,得到任一第一时间范围内的预报概率集。
需要说明的是,由于一个预报事件数据集可包括各个预报指标下的预报事件数据子集,那么针对至少一个第一时间范围中的任一第一时间范围,电子设备可分别基于该任一第一时间范围内各个预报指标下的预报事件数据子集所指示的预报次数,计算该任一第一时间范围内各个预报指标下的预报概率集。其中,一个第一时间范围内的某个预报指标下的预报概率集也可称为相应第一时间范围内的预报概率集中的预报概率子集,一个概率预报子集包括相应第一时间范围内相应预报指标下,各个事件的预报概率。
示例性的,假设至少一个预报指标包括预报指标1(如时间间隔为1天的预报指标)和预报指标2(如时间间隔为2天的预报指标),那么电子设备可分别得到该任一第一时间范围内预报指标1下的预报概率集1和预报指标2下的预报概率集2,以得到该任一第一时间范围内的预报概率集(包括预报概率集1和预报概率集2)。
S405,分别将目标数值模式在各个第二时间范围内的预报准确指标集、各个第一时间范围内的实际发生概率集以及各个第一时间范围内的预报概率集,添加至概率预报准备数据集中,以确定概率预报准备数据集。
其中,概率预报准备数据集用于:计算目标预报事件的发生概率,目标预报事件为目标数值模式在第三时间范围下,对目标区域进行事件预报所得到的。在本发明实施例中,电子设备可基于目标数值模式,预报第三时间范围(即未来一段时间)的污染演变(即污染数值),并对预报的污染数值进行后处理,得到目标区域在第三时间范围下的目标预报事件;其中,后处理过程也可称为数值转换过程,即是指将污染数值转换为相应的事件,以得到目标预报事件,如污染数值AQI为120时,可将轻度污染作为目标预报事件。
在本发明实施例中,概率预报准备数据集可包括:各个第一时间范围内的实际发生概率集、各个第一时间范围内的预报概率集以及各个第二时间范围内的预报准确指标集;基于此,电子设备可从至少一个第一时间范围中,确定出与第三时间范围匹配的第一时间范围,并从确定出的第一时间范围内的实际发生概率集中,选取出第三时间范围在目标预报事件下的目标实际发生概率;然后,可从确定出的第一时间范围内的预报概率集中,选取出第三时间范围在目标预报事件下的目标预报概率;从至少一个第二时间范围中,确定出与第三时间范围匹配的第二时间范围,并从确定出的第二时间范围内的预报准确指标集中,选取出目标预报事件的目标预报准确率,从而采用目标实际发生概率、目标预报概率以及目标预报准确率,计算目标预报事件的发生概率。
相应的,一个预报准确指标集包括相应第二时间范围内至少一个预报指标中各个预报指标下的预报准确指标,且一个预报概率集包括相应第一时间范围内至少一个事件中各个事件,在各个预报指标下的预报概率;基于此,从确定出的第一时间范围内的预报概率集中,选取出第三时间范围在目标预报事件下的目标预报概率时,电子设备可确定目标预报事件对应的目标预报指标,目标预报指标为至少一个预报指标中的任一预报指标;从确定出的第一时间范围内的预报概率集中,选取出第三时间范围在目标预报事件和目标预报指标下的目标预报概率。并且,在从确定出的第二时间范围内的预报准确指标集中,选取出目标预报事件的目标预报准确率时,电子设备可从确定出的第二时间范围内的预报准确指标集中,选取出目标预报事件在目标预报指标下的目标预报准确率。应当理解的是,确定出的第一时间范围内的概率预报集可包括相应第一时间范围内各个预报指标下的预报概率子集
例如,以至少一个预报指标包括预报指标1(如时间间隔为1天的预报指标)和预报指标2(如时间间隔为2天的预报指标)为例进行说明,假设目标预报事件为目标数值模式按照预报指标1在第三时间范围下,对目标区域进行事件预报所得到的,也就是说,假设目标预报事件为目标数值模式对第二天的目标区域进行事件预报所得到的,那么电子设备可确定目标预报指标为预报指标1。在此种情况下,确定出的第一时间范围内的预报概率集可包括预报指标1下的预报概率集1和预报指标2下的预报概率集2,且确定出的第二时间范围内的预报准确指标集可包括预报指标1下的预报准确指标1和预报指标2下的预报准确指标2,那么当目标预报指标为预报指标1时,电子设备可从预报概率集1中选取出第三时间范围在目标预报事件下的目标预报概率,并从预报准确指标1中选取出目标预报事件的目标预报准确率。
具体的,在从至少一个第一时间范围中,确定出与第三时间范围匹配的第一时间范围时,电子设备可确定各个第一时间范围对应的第一隶属时间指标,以及确定第三时间范围对应的第一隶属时间指标;从至少一个第一时间范围中,确定出第一隶属时间指标与第三时间范围对应的第一隶属时间指标相同的第一时间范围,以得到确定出的第一时间范围,且确定出的第一时间范围与第三时间范围相匹配。可选的,电子设备也可将至少一个第一时间范围中的任一第一时间范围,作为与第三时间范围匹配的第一时间范围,本发明对此不作限定;应当理解的是,按照第一隶属时间指标确定与第三时间范围匹配的第一时间范围的方式,由于相同第一隶属时间指标下的第一时间范围内的数据可更好地对第三时间范围进行预测,可有效提高目标预报事件的发生概率的准确性。
示例性的,以第一隶属时间指标的指示时长为月为例进行说明,假设第三时间范围为2023年5月13日,那么电子设备可确定第三时间范围对应的第一隶属时间指标为5月份,从而确定出与第三时间范围匹配的第一时间范围为:第一隶属时间指标为5月份对应的第一时间范围。
相应的,在从至少一个第二时间范围中,确定出与第三时间范围匹配的第二时间范围时,电子设备可确定各个第二时间范围对应的第二隶属时间指标,以及确定第三时间范围对应的第二隶属时间指标;从至少一个第二时间范围中,确定出第二隶属时间指标与第三时间范围对应的第二隶属时间指标相同的第二时间范围,以得到确定出的第二时间范围,且确定出的第二时间范围与第三时间范围相匹配。可选的,电子设备也可将至少一个第二时间范围中的任一第二时间范围,作为与第三时间范围匹配的第二时间范围,本发明对此不作限定。
示例性的,以第二隶属时间指标的指示时长为季度为例进行说明,假设第三时间范围为2023年5月13日,那么电子设备可确定第三时间范围对应的第二隶属时间指标为第二季度,从而确定出与第三时间范围匹配的第二时间范围为:第二隶属时间指标为第二季度对应的第二时间范围。
在本发明实施例中,电子设备可采用公式1.2所示的贝叶斯公式,计算目标预报事件的发生概率:
式1.2
其中,H可表示目标区域实际发生的事件(如空气优良),E为目标数值模式在第三时间范围下对目标区域进行事件预报所得到的目标预报事件(如轻度污染),即E为目标数值模式按照目标预报指标,在第三时间范围下对目标区域进行事件预报所得到的目标预报事件,P(H|E)为目标预报事件的发生概率(即H发生的正式概率,如目标预报事件为轻度污染时,第三时间范围内目标区域发生轻度污染的概率值)。相应的,P(H):为H发生的目标实际发生概率,如轻度污染的目标实际发生概率为30%,也可称为先验概率;P(E|H):H发生了,目标数值模式预报出来的目标预报准确率,即有多大概率预报出来,如轻度污染的目标预报准确率为60%;P(E):代表目标数值模式预报目标预报事件的目标预报概率,如轻度污染的目标预报概率为25%。
示例性的,当目标预报事件为轻度污染,且第三时间范围在轻度污染下的目标实际发生概率为30%、第三时间范围在轻度污染下的目标预报准确率为60%,以及第三时间范围在轻度污染下的目标预报概率为25%,那么P(H|E)=P(H)×P(E|H)/P(E)=0.3×0.6/0.25=72%;在此种情况下,目标数值模式预报出第三时间范围内目标区域为轻度污染的情况下,第三时间范围内目标区域发生轻度污染的发生概率可为72%。进一步的,假设至少一个预报指标包括预报指标1(相应第一时间范围内预报指标1下的预报概率集中轻度污染的预报概率为25%,相应第二时间范围内预报指标1下的预报准确指标中轻度污染的预报准确率为60%)和预报指标2(相应第一时间范围内预报指标2下的预报概率集中轻度污染的预报概率为30%,相应第二时间范围内预报指标2下的预报准确指标中轻度污染的预报准确率为50%),且目标预报事件对应的目标预报指标为预报指标1,那么电子设备可采用目标实际发生概率(即30%)、目标预报概率(即25%)以及目标预报准确率(即60%),计算目标预报事件的发生概率。
本发明实施例可在获取到第一数据集和第二数据集后,基于第一数据集和第二数据集,计算目标数值模式在至少一个第二时间范围中各个第二时间范围下,对目标区域进行事件预报的预报准确指标集;并分别基于各个第一时间范围内的实际事件数据集所指示的发生次数,计算各个第一时间范围内的实际发生概率集,一个实际发生概率集包括相应第一时间范围内各个事件的实际发生概率。然后,可分别基于各个第一时间范围内的预报事件数据集所指示的预报次数,计算各个第一时间范围内的预报概率集,一个预报概率集包括相应第一时间范围内各个事件的预报概率;从而分别将目标数值模式在各个第二时间范围内的预报准确指标集、各个第一时间范围内的实际发生概率集以及各个第一时间范围内的预报概率集,添加至概率预报准备数据集中,以确定概率预报准备数据集,以使概率预报准备数据集用于:计算目标预报事件的发生概率,目标预报事件为目标数值模式在第三时间范围下,对目标区域进行事件预报所得到的。可见,本发明实施例可通过概率预报准备数据集便捷地进行概率预报,即可基于贝叶斯方法量化单个数值模式的不确定度,从而可有效减少因采用集合预报方式进行概率预报所需的计算资源,并可提高概率预报效率。
基于上述概率预报方法的相关实施例的描述,本发明实施例还提出了一种概率预报装置,该概率预报装置可以是运行于电子设备中的一个计算机程序(包括程序代码);如图5所示,该概率预报装置可包括获取单元501和处理单元502。该概率预报装置可以执行图1或图4所示的概率预报方法,即该概率预报装置可以运行上述单元:
获取单元501,用于获取第一数据集和第二数据集,所述第一数据集包括:目标区域在至少一个第一时间范围中各个第一时间范围内的实际事件数据集,所述第二数据集包括:所述目标区域在所述各个第一时间范围内的预报事件数据集,且一个预报事件数据是通过目标数值模式进行事件预报得到的;
处理单元502,用于基于所述第一数据集和所述第二数据集,计算所述目标数值模式在至少一个第二时间范围中各个第二时间范围下,对所述目标区域进行事件预报的预报准确指标集;
所述处理单元502,还可用于基于所述目标数值模式在所述各个第二时间范围内的预报准确指标集、所述第一数据集以及所述第二数据集,确定概率预报准备数据集,以使所述概率预报准备数据集用于:计算目标预报事件的发生概率,所述目标预报事件为所述目标数值模式在第三时间范围下,对所述目标区域进行事件预报所得到的。
在一种实施方式中,处理单元502在基于所述第一数据集和所述第二数据集,计算所述目标数值模式在至少一个第二时间范围中各个第二时间范围下,对所述目标区域进行事件预报的预报准确指标集时,可具体用于:
针对所述至少一个第二时间范围中的任一第二时间范围,确定所述任一第二时间范围对应的M个第一时间范围,M为正整数;
从所述第一数据集中确定出所述M个第一时间范围内的实际事件数据集,以及从所述第二数据集中确定出所述M个第一时间范围内的预报事件数据集;
采用所述M个第一时间范围内的实际事件数据集和预报事件数据集,计算所述目标数值模式在所述任一第二时间范围下,对所述目标区域进行事件预报的预报准确指标集。
另一种实施方式中,一个预报准确指标集包括至少一个预报指标中各个预报指标下的预报准确指标,一个预报指标用于指示事件的预报时间与相应事件所对应发生时间之间的时间间隔,且一个预报事件数据集包括相应第一时间范围内所述各个预报指标下的预报事件数据子集;处理单元502在采用所述M个第一时间范围内的实际事件数据集和预报事件数据集,计算所述目标数值模式在所述任一第二时间范围下,对所述目标区域进行事件预报的预报准确指标集时,可具体用于:
针对所述至少一个预报指标中的任一预报指标,从所述M个第一时间范围内的预报事件数据集中,确定出所述任一预报指标下的预报事件数据子集;
采用所述M个第一时间范围内的实际事件数据集,以及所述任一预报指标下的预报事件数据子集,计算所述目标数值模式在所述任一第二时间范围以及所述任一预报指标下,对所述目标区域进行事件预报的预报准确指标;
将计算得到的预报准确指标,添加至所述目标数值模式在所述任一第二时间范围下对所述目标区域进行事件预报的预报准确指标集中,以得到所述目标数值模式在所述任一第二时间范围下对所述目标区域进行事件预报的预报准确指标集。
另一种实施方式中,一个实际事件数据集用于指示相应第一时间范围内至少一个事件中各个事件的发生次数,且一个预报事件数据集用于指示相应第一时间范围内所述各个事件的预报次数;处理单元502在基于所述目标数值模式在所述各个第二时间范围内的预报准确指标集、所述第一数据集以及所述第二数据集,确定概率预报准备数据集时,可具体用于:
分别基于所述各个第一时间范围内的实际事件数据集所指示的发生次数,计算所述各个第一时间范围内的实际发生概率集,一个实际发生概率集包括相应第一时间范围内所述各个事件的实际发生概率;
分别基于所述各个第一时间范围内的预报事件数据集所指示的预报次数,计算所述各个第一时间范围内的预报概率集,一个预报概率集包括相应第一时间范围内所述各个事件的预报概率;
分别将所述目标数值模式在所述各个第二时间范围内的预报准确指标集、所述各个第一时间范围内的实际发生概率集以及所述各个第一时间范围内的预报概率集,添加至概率预报准备数据集中,以确定所述概率预报准备数据集。
另一种实施方式中,一个第一时间范围包括多个时间子范围,且一个第一时间范围内的实际事件数据集包括多个时间子范围中各个时间子范围内的实际事件数据子集;处理单元502在分别基于所述各个第一时间范围内的实际事件数据集所指示的发生次数,计算所述各个第一时间范围内的实际发生概率集时,可具体用于:
针对所述至少一个第一时间范围中的任一第一时间范围,分别对所述任一第一时间范围中各个时间子范围内的实际事件数据子集所指示的发生次数进行统计分析,得到所述任一第一时间范围中各个时间子范围内的初始实际发生概率集;
对所述任一第一时间范围中各个时间子范围内的初始实际发生概率集进行回归分析,得到所述任一第一时间范围内的实际发生概率集。
另一种实施方式中,所述概率预报准备数据集包括:所述各个第一时间范围内的实际发生概率集、所述各个第一时间范围内的预报概率集以及所述各个第二时间范围内的预报准确指标集;处理单元502,还可用于:
从所述至少一个第一时间范围中,确定出与所述第三时间范围匹配的第一时间范围,并从确定出的第一时间范围内的实际发生概率集中,选取出所述第三时间范围在所述目标预报事件下的目标实际发生概率;
从所述确定出的第一时间范围内的预报概率集中,选取出所述第三时间范围在所述目标预报事件下的目标预报概率;
从所述至少一个第二时间范围中,确定出与所述第三时间范围匹配的第二时间范围,并从确定出的第二时间范围内的预报准确指标集中,选取出所述目标预报事件的目标预报准确率;
采用所述目标实际发生概率、所述目标预报概率以及所述目标预报准确率,计算所述目标预报事件的发生概率。
另一种实施方式中,一个预报准确指标集包括相应第二时间范围内至少一个预报指标中各个预报指标下的预报准确指标,且一个预报概率集包括相应第一时间范围内至少一个事件中各个事件,在所述各个预报指标下的预报概率;处理单元502在从所述确定出的第一时间范围内的预报概率集中,选取出所述第三时间范围在所述目标预报事件下的目标预报概率时,可具体用于:
确定所述目标预报事件对应的目标预报指标,所述目标预报指标为所述至少一个预报指标中的任一预报指标;
从所述确定出的第一时间范围内的预报概率集中,选取出所述第三时间范围在所述目标预报事件和所述目标预报指标下的目标预报概率;
处理单元502在从确定出的第二时间范围内的预报准确指标集中,选取出所述目标预报事件的目标预报准确率时,可具体用于:
从所述确定出的第二时间范围内的预报准确指标集中,选取出所述目标预报事件在所述目标预报指标下的目标预报准确率。
另一种实施方式中,处理单元502在从所述至少一个第一时间范围中,确定出与所述第三时间范围匹配的第一时间范围时,可具体用于:
确定所述各个第一时间范围对应的第一隶属时间指标,以及确定所述第三时间范围对应的第一隶属时间指标;
从所述至少一个第一时间范围中,确定出第一隶属时间指标与所述第三时间范围对应的第一隶属时间指标相同的第一时间范围,以得到确定出的第一时间范围,且所述确定出的第一时间范围与所述第三时间范围相匹配;
处理单元502在从所述至少一个第二时间范围中,确定出与所述第三时间范围匹配的第二时间范围时,可具体用于:
确定所述各个第二时间范围对应的第二隶属时间指标,以及确定所述第三时间范围对应的第二隶属时间指标;
从所述至少一个第二时间范围中,确定出第二隶属时间指标与所述第三时间范围对应的第二隶属时间指标相同的第二时间范围,以得到确定出的第二时间范围,且所述确定出的第二时间范围与所述第三时间范围相匹配。
另一种实施方式中,所述目标预报事件为至少一个事件中的任一事件;其中,一个事件是指等级污染事件,且所述目标数值模式是指空气质量数值模式。
根据本发明的一个实施例,图1或图4所示的方法所涉及的各个步骤均可由图5所示的概率预报装置中的各个单元来执行的。例如,图1中所示的步骤S101可由图5中所示的获取单元501执行,步骤S102和S103均可由图5中所示的处理单元502执行。又如,图4中所示的步骤S401可由图5中所示的获取单元501执行,步骤S402-S405均可由图5中所示的处理单元502执行,等等。
根据本发明的另一个实施例,图5所示的概率预报装置中的各个单元均可以分别或全部合并为一个或若干个另外的单元来构成,或者其中的某个(些)单元还可以再拆分为功能上更小的多个单元来构成,这可以实现同样的操作,而不影响本发明的实施例的技术效果的实现。上述单元是基于逻辑功能划分的,在实际应用中,一个单元的功能也可以由多个单元来实现,或者多个单元的功能由一个单元实现。在本发明的其它实施例中,任一概率预报装置也可以包括其他单元,在实际应用中,这些功能也可以由其它单元协助实现,并且可以由多个单元协作实现。
根据本发明的另一个实施例,可以通过在包括中央处理单元(CPU)、随机存取存储介质(RAM)、只读存储介质(ROM)等处理元件和存储元件的例如计算机的通用电子设备上运行能够执行如图1或图4中所示的相应方法所涉及的各步骤的计算机程序(包括程序代码),来构造如图5中所示的概率预报装置,以及来实现本发明实施例的概率预报方法。所述计算机程序可以记载于例如计算机存储介质上,并通过计算机存储介质装载于上述电子设备中,并在其中运行。
本发明实施例可在获取到第一数据集和第二数据集后,基于第一数据集和第二数据集,计算目标数值模式在至少一个第二时间范围中各个第二时间范围下,对目标区域进行事件预报的预报准确指标集;其中,第一数据集包括:目标区域在至少一个第一时间范围中各个第一时间范围内的实际事件数据集,第二数据集包括:目标区域在各个第一时间范围内的预报事件数据集,且一个预报事件数据是通过目标数值模式进行事件预报得到的。然后,可基于目标数值模式在各个第二时间范围内的预报准确指标集、第一数据集以及第二数据集,确定概率预报准备数据集,以使概率预报准备数据集用于:计算目标预报事件的发生概率,目标预报事件为目标数值模式在第三时间范围下,对目标区域进行事件预报所得到的。可见,本发明实施例可通过概率预报准备数据集便捷地进行概率预报,并提高概率预报效率。
基于上述方法实施例以及装置实施例的描述,本发明示例性实施例还提供一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器。所述存储器存储有能够被所述至少一个处理器执行的计算机程序,所述计算机程序在被所述至少一个处理器执行时用于使所述电子设备执行根据本发明实施例的方法。
本发明示例性实施例还提供一种存储有计算机程序的非瞬时计算机可读存储介质,其中,所述计算机程序在被计算机的处理器执行时用于使所述计算机执行根据本发明实施例的方法。
本发明示例性实施例还提供一种计算机程序产品,包括计算机程序,其中,所述计算机程序在被计算机的处理器执行时用于使所述计算机执行根据本发明实施例的方法。
参考图6,现将描述可以作为本发明的服务器或客户端的电子设备600的结构框图,其是可以应用于本发明的各方面的硬件设备的示例。电子设备旨在表示各种形式的数字电子的计算机设备,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本发明的实现。
如图6所示,电子设备600包括计算单元601,其可以根据存储在只读存储器(ROM)602中的计算机程序或者从存储单元608加载到随机访问存储器(RAM)603中的计算机程序,来执行各种适当的动作和处理。在RAM 603中,还可存储设备600操作所需的各种程序和数据。计算单元601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
电子设备600中的多个部件连接至I/O接口605,包括:输入单元606、输出单元607、存储单元608以及通信单元609。输入单元606可以是能向电子设备600输入信息的任何类型的设备,输入单元606可以接收输入的数字或字符信息,以及产生与电子设备的用户设置和/或功能控制有关的键信号输入。输出单元607可以是能呈现信息的任何类型的设备,并且可以包括但不限于显示器、扬声器、视频/音频输出终端、振动器和/或打印机。存储单元608可以包括但不限于磁盘、光盘。通信单元609允许电子设备600通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据,并且可以包括但不限于调制解调器、网卡、红外通信设备、无线通信收发机和/或芯片组,例如蓝牙TM设备、WiFi设备、WiMax设备、蜂窝通信设备和/或类似物。
计算单元601可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元601的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元601执行上文所描述的各个方法和处理。例如,在一些实施例中,概率预报方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元608。在一些实施例中,计算机程序的部分或者全部可以经由ROM602和/或通信单元609而被载入和/或安装到电子设备600上。在一些实施例中,计算单元601可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行概率预报方法。
用于实施本发明的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本发明的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
如本发明使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编程逻辑装置(PLD)),包括,接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。
并且,应理解的是,以上所揭露的仅为本发明较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。
Claims (10)
1.一种概率预报方法,其特征在于,包括:
获取第一数据集和第二数据集,所述第一数据集包括:目标区域在至少一个第一时间范围中各个第一时间范围内的实际事件数据集,所述第二数据集包括:所述目标区域在所述各个第一时间范围内的预报事件数据集,且一个预报事件数据是通过目标数值模式进行事件预报得到的;一个实际事件数据集用于指示相应第一时间范围内至少一个事件中各个事件的发生次数,且一个预报事件数据集用于指示相应第一时间范围内所述各个事件的预报次数;
基于所述第一数据集和所述第二数据集,计算所述目标数值模式在至少一个第二时间范围中各个第二时间范围下,对所述目标区域进行事件预报的预报准确指标集;
基于所述目标数值模式在所述各个第二时间范围内的预报准确指标集、所述第一数据集以及所述第二数据集,确定概率预报准备数据集,包括:
分别基于所述各个第一时间范围内的实际事件数据集所指示的发生次数,计算所述各个第一时间范围内的实际发生概率集,一个实际发生概率集包括相应第一时间范围内所述各个事件的实际发生概率;
分别基于所述各个第一时间范围内的预报事件数据集所指示的预报次数,计算所述各个第一时间范围内的预报概率集,一个预报概率集包括相应第一时间范围内所述各个事件的预报概率;
分别将所述目标数值模式在所述各个第二时间范围内的预报准确指标集、所述各个第一时间范围内的实际发生概率集以及所述各个第一时间范围内的预报概率集,添加至概率预报准备数据集中,以确定所述概率预报准备数据集,以使所述概率预报准备数据集用于:计算目标预报事件的发生概率,所述目标预报事件为所述目标数值模式在第三时间范围下,对所述目标区域进行事件预报所得到的;所述目标预报事件的发生概率的计算方式包括:
从所述至少一个第一时间范围中,确定出与所述第三时间范围匹配的第一时间范围,并从确定出的第一时间范围内的实际发生概率集中,选取出所述第三时间范围在所述目标预报事件下的目标实际发生概率;
从所述确定出的第一时间范围内的预报概率集中,选取出所述第三时间范围在所述目标预报事件下的目标预报概率;
从所述至少一个第二时间范围中,确定出与所述第三时间范围匹配的第二时间范围,并从确定出的第二时间范围内的预报准确指标集中,选取出所述目标预报事件的目标预报准确率;
采用所述目标实际发生概率、所述目标预报概率以及所述目标预报准确率,计算所述目标预报事件的发生概率;其中,当所述目标数值模式为空气质量数值模式时,一个数据集为应用于空气质量预报的数据集、一个事件为通过所述目标数值模式进行空气质量预报所支持预报的事件、一个概率为通过所述目标数值模式进行空气质量预报所支持预报的事件的概率;或者,当所述目标数值模式为天气预报系统所涉及的数值模式时,一个数据集为应用于天气预报的数据集、一个事件为通过所述目标数值模式进行天气预报所支持预报的事件、一个概率为通过所述目标数值模式进行天气预报所支持预报的事件的概率。
2.根据权利要求1所述的方法,其特征在于,所述基于所述第一数据集和所述第二数据集,计算所述目标数值模式在至少一个第二时间范围中各个第二时间范围下,对所述目标区域进行事件预报的预报准确指标集,包括:
针对所述至少一个第二时间范围中的任一第二时间范围,确定所述任一第二时间范围对应的M个第一时间范围,M为正整数;
从所述第一数据集中确定出所述M个第一时间范围内的实际事件数据集,以及从所述第二数据集中确定出所述M个第一时间范围内的预报事件数据集;
采用所述M个第一时间范围内的实际事件数据集和预报事件数据集,计算所述目标数值模式在所述任一第二时间范围下,对所述目标区域进行事件预报的预报准确指标集。
3.根据权利要求2所述的方法,其特征在于,一个预报准确指标集包括至少一个预报指标中各个预报指标下的预报准确指标,一个预报指标用于指示事件的预报时间与相应事件所对应发生时间之间的时间间隔,且一个预报事件数据集包括相应第一时间范围内所述各个预报指标下的预报事件数据子集;所述采用所述M个第一时间范围内的实际事件数据集和预报事件数据集,计算所述目标数值模式在所述任一第二时间范围下,对所述目标区域进行事件预报的预报准确指标集,包括:
针对所述至少一个预报指标中的任一预报指标,从所述M个第一时间范围内的预报事件数据集中,确定出所述任一预报指标下的预报事件数据子集;
采用所述M个第一时间范围内的实际事件数据集,以及所述任一预报指标下的预报事件数据子集,计算所述目标数值模式在所述任一第二时间范围以及所述任一预报指标下,对所述目标区域进行事件预报的预报准确指标;
将计算得到的预报准确指标,添加至所述目标数值模式在所述任一第二时间范围下对所述目标区域进行事件预报的预报准确指标集中,以得到所述目标数值模式在所述任一第二时间范围下对所述目标区域进行事件预报的预报准确指标集。
4.根据权利要求1-3任一项所述的方法,其特征在于,一个第一时间范围包括多个时间子范围,且一个第一时间范围内的实际事件数据集包括多个时间子范围中各个时间子范围内的实际事件数据子集;所述分别基于所述各个第一时间范围内的实际事件数据集所指示的发生次数,计算所述各个第一时间范围内的实际发生概率集,包括:
针对所述至少一个第一时间范围中的任一第一时间范围,分别对所述任一第一时间范围中各个时间子范围内的实际事件数据子集所指示的发生次数进行统计分析,得到所述任一第一时间范围中各个时间子范围内的初始实际发生概率集;
对所述任一第一时间范围中各个时间子范围内的初始实际发生概率集进行回归分析,得到所述任一第一时间范围内的实际发生概率集。
5.根据权利要求1-3任一项所述的方法,其特征在于,一个预报准确指标集包括相应第二时间范围内至少一个预报指标中各个预报指标下的预报准确指标,且一个预报概率集包括相应第一时间范围内至少一个事件中各个事件,在所述各个预报指标下的预报概率;所述从所述确定出的第一时间范围内的预报概率集中,选取出所述第三时间范围在所述目标预报事件下的目标预报概率,包括:
确定所述目标预报事件对应的目标预报指标,所述目标预报指标为所述至少一个预报指标中的任一预报指标;
从所述确定出的第一时间范围内的预报概率集中,选取出所述第三时间范围在所述目标预报事件和所述目标预报指标下的目标预报概率;
所述从确定出的第二时间范围内的预报准确指标集中,选取出所述目标预报事件的目标预报准确率,包括:
从所述确定出的第二时间范围内的预报准确指标集中,选取出所述目标预报事件在所述目标预报指标下的目标预报准确率。
6.根据权利要求1-3任一项所述的方法,其特征在于,所述从所述至少一个第一时间范围中,确定出与所述第三时间范围匹配的第一时间范围,包括:
确定所述各个第一时间范围对应的第一隶属时间指标,以及确定所述第三时间范围对应的第一隶属时间指标;
从所述至少一个第一时间范围中,确定出第一隶属时间指标与所述第三时间范围对应的第一隶属时间指标相同的第一时间范围,以得到确定出的第一时间范围,且所述确定出的第一时间范围与所述第三时间范围相匹配;
所述从所述至少一个第二时间范围中,确定出与所述第三时间范围匹配的第二时间范围,包括:
确定所述各个第二时间范围对应的第二隶属时间指标,以及确定所述第三时间范围对应的第二隶属时间指标;
从所述至少一个第二时间范围中,确定出第二隶属时间指标与所述第三时间范围对应的第二隶属时间指标相同的第二时间范围,以得到确定出的第二时间范围,且所述确定出的第二时间范围与所述第三时间范围相匹配。
7.根据权利要求1-3任一项所述的方法,其特征在于,所述目标预报事件为至少一个事件中的任一事件;其中,一个事件是指等级污染事件,且所述目标数值模式是指空气质量数值模式。
8.一种概率预报装置,其特征在于,所述装置包括:
获取单元,用于获取第一数据集和第二数据集,所述第一数据集包括:目标区域在至少一个第一时间范围中各个第一时间范围内的实际事件数据集,所述第二数据集包括:所述目标区域在所述各个第一时间范围内的预报事件数据集,且一个预报事件数据是通过目标数值模式进行事件预报得到的;一个实际事件数据集用于指示相应第一时间范围内至少一个事件中各个事件的发生次数,且一个预报事件数据集用于指示相应第一时间范围内所述各个事件的预报次数;
处理单元,用于基于所述第一数据集和所述第二数据集,计算所述目标数值模式在至少一个第二时间范围中各个第二时间范围下,对所述目标区域进行事件预报的预报准确指标集;
所述处理单元,还用于基于所述目标数值模式在所述各个第二时间范围内的预报准确指标集、所述第一数据集以及所述第二数据集,确定概率预报准备数据集,包括:
分别基于所述各个第一时间范围内的实际事件数据集所指示的发生次数,计算所述各个第一时间范围内的实际发生概率集,一个实际发生概率集包括相应第一时间范围内所述各个事件的实际发生概率;
分别基于所述各个第一时间范围内的预报事件数据集所指示的预报次数,计算所述各个第一时间范围内的预报概率集,一个预报概率集包括相应第一时间范围内所述各个事件的预报概率;
分别将所述目标数值模式在所述各个第二时间范围内的预报准确指标集、所述各个第一时间范围内的实际发生概率集以及所述各个第一时间范围内的预报概率集,添加至概率预报准备数据集中,以确定所述概率预报准备数据集,以使所述概率预报准备数据集用于:计算目标预报事件的发生概率,所述目标预报事件为所述目标数值模式在第三时间范围下,对所述目标区域进行事件预报所得到的;所述目标预报事件的发生概率的计算方式包括:
从所述至少一个第一时间范围中,确定出与所述第三时间范围匹配的第一时间范围,并从确定出的第一时间范围内的实际发生概率集中,选取出所述第三时间范围在所述目标预报事件下的目标实际发生概率;
从所述确定出的第一时间范围内的预报概率集中,选取出所述第三时间范围在所述目标预报事件下的目标预报概率;
从所述至少一个第二时间范围中,确定出与所述第三时间范围匹配的第二时间范围,并从确定出的第二时间范围内的预报准确指标集中,选取出所述目标预报事件的目标预报准确率;
采用所述目标实际发生概率、所述目标预报概率以及所述目标预报准确率,计算所述目标预报事件的发生概率;其中,当所述目标数值模式为空气质量数值模式时,一个数据集为应用于空气质量预报的数据集、一个事件为通过所述目标数值模式进行空气质量预报所支持预报的事件、一个概率为通过所述目标数值模式进行空气质量预报所支持预报的事件的概率;或者,当所述目标数值模式为天气预报系统所涉及的数值模式时,一个数据集为应用于天气预报的数据集、一个事件为通过所述目标数值模式进行天气预报所支持预报的事件、一个概率为通过所述目标数值模式进行天气预报所支持预报的事件的概率。
9. 一种电子设备,其特征在于,包括:
处理器;以及
存储程序的存储器,
其中,所述程序包括指令,所述指令在由所述处理器执行时使所述处理器执行根据权利要求1-7中任一项所述的方法。
10.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使计算机执行根据权利要求1-7中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311015521.XA CN116756522B (zh) | 2023-08-14 | 2023-08-14 | 概率预报方法、装置、存储介质及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311015521.XA CN116756522B (zh) | 2023-08-14 | 2023-08-14 | 概率预报方法、装置、存储介质及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116756522A CN116756522A (zh) | 2023-09-15 |
CN116756522B true CN116756522B (zh) | 2023-11-03 |
Family
ID=87949973
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311015521.XA Active CN116756522B (zh) | 2023-08-14 | 2023-08-14 | 概率预报方法、装置、存储介质及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116756522B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117495208B (zh) * | 2024-01-02 | 2024-04-05 | 中科三清科技有限公司 | 空气质量预报评估方法、装置、存储介质及电子设备 |
Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109410527A (zh) * | 2018-12-12 | 2019-03-01 | 国家卫星气象中心 | 空间天气灾害监测预警方法、系统、存储介质及服务器 |
CN110033132A (zh) * | 2019-03-29 | 2019-07-19 | 中国人民解放军空军研究院战场环境研究所 | 基于深度目标检测和数值天气预报的热带气旋预报方法 |
CN110989044A (zh) * | 2019-12-25 | 2020-04-10 | 中科三清科技有限公司 | 空气质量分指数级别概率预报方法、装置、设备及存储介质 |
AU2020103356A4 (en) * | 2020-02-26 | 2021-01-21 | Chinese Research Academy Of Environmental Sciences | Method and device for building river diatom bloom warning model |
CN112329963A (zh) * | 2020-10-28 | 2021-02-05 | 北京嘀嘀无限科技发展有限公司 | 数据处理方法、数据处理装置、存储介质和电子设备 |
CN112949953A (zh) * | 2021-05-14 | 2021-06-11 | 江苏铨铨信息科技有限公司 | 基于pp理论和af模型的暴雨预报方法 |
CN113743013A (zh) * | 2021-09-08 | 2021-12-03 | 成都卡普数据服务有限责任公司 | 一种基于XGBoost气温预测数据修正的方法 |
CN114282721A (zh) * | 2021-12-22 | 2022-04-05 | 中科三清科技有限公司 | 污染物预报模型训练方法、装置、电子设备及存储介质 |
CN114912671A (zh) * | 2022-04-29 | 2022-08-16 | 浙江省水利河口研究院(浙江省海洋规划设计研究院) | 基于气象预报的气象型骤旱预警方法 |
CN114942481A (zh) * | 2022-06-08 | 2022-08-26 | 中国气象局上海台风研究所(上海市气象科学研究所) | 热带气旋过程极值风速概率预报方法、装置和计算机设备 |
CN115114811A (zh) * | 2022-08-30 | 2022-09-27 | 水利部交通运输部国家能源局南京水利科学研究院 | 短时预报降水分类误差和定量误差双重订正方法及系统 |
CN115345245A (zh) * | 2022-08-19 | 2022-11-15 | 复旦大学 | 一种基于随机森林和迁移学习的热带气旋快速加强预报方法 |
CN115471000A (zh) * | 2022-09-23 | 2022-12-13 | 大连理工大学 | 一种确定性分级降雨预报不确定性的评估方法 |
CN116148951A (zh) * | 2023-02-23 | 2023-05-23 | 中科三清科技有限公司 | 空气目标污染物组分预报模型训练方法、预报方法及装置 |
CN116485045A (zh) * | 2023-06-21 | 2023-07-25 | 中科三清科技有限公司 | 一种建立水华预测模型的方法、水华预测方法及装置 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10496927B2 (en) * | 2014-05-23 | 2019-12-03 | DataRobot, Inc. | Systems for time-series predictive data analytics, and related methods and apparatus |
US20190018918A1 (en) * | 2017-07-11 | 2019-01-17 | The Trustees Of Princeton University | System and method for performing accurate hydrologic determination using disparate weather data sources |
US11238167B2 (en) * | 2019-06-14 | 2022-02-01 | Sap Se | Secure sublinear time differentially private median computation |
WO2022103738A1 (en) * | 2020-11-10 | 2022-05-19 | Globalwafers Co., Ltd. | Systems and methods for enhanced machine learning using hierarchical prediction and compound thresholds |
-
2023
- 2023-08-14 CN CN202311015521.XA patent/CN116756522B/zh active Active
Patent Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109410527A (zh) * | 2018-12-12 | 2019-03-01 | 国家卫星气象中心 | 空间天气灾害监测预警方法、系统、存储介质及服务器 |
CN110033132A (zh) * | 2019-03-29 | 2019-07-19 | 中国人民解放军空军研究院战场环境研究所 | 基于深度目标检测和数值天气预报的热带气旋预报方法 |
CN110989044A (zh) * | 2019-12-25 | 2020-04-10 | 中科三清科技有限公司 | 空气质量分指数级别概率预报方法、装置、设备及存储介质 |
AU2020103356A4 (en) * | 2020-02-26 | 2021-01-21 | Chinese Research Academy Of Environmental Sciences | Method and device for building river diatom bloom warning model |
CN112329963A (zh) * | 2020-10-28 | 2021-02-05 | 北京嘀嘀无限科技发展有限公司 | 数据处理方法、数据处理装置、存储介质和电子设备 |
CN112949953A (zh) * | 2021-05-14 | 2021-06-11 | 江苏铨铨信息科技有限公司 | 基于pp理论和af模型的暴雨预报方法 |
CN113743013A (zh) * | 2021-09-08 | 2021-12-03 | 成都卡普数据服务有限责任公司 | 一种基于XGBoost气温预测数据修正的方法 |
CN114282721A (zh) * | 2021-12-22 | 2022-04-05 | 中科三清科技有限公司 | 污染物预报模型训练方法、装置、电子设备及存储介质 |
CN114912671A (zh) * | 2022-04-29 | 2022-08-16 | 浙江省水利河口研究院(浙江省海洋规划设计研究院) | 基于气象预报的气象型骤旱预警方法 |
CN114942481A (zh) * | 2022-06-08 | 2022-08-26 | 中国气象局上海台风研究所(上海市气象科学研究所) | 热带气旋过程极值风速概率预报方法、装置和计算机设备 |
CN115345245A (zh) * | 2022-08-19 | 2022-11-15 | 复旦大学 | 一种基于随机森林和迁移学习的热带气旋快速加强预报方法 |
CN115114811A (zh) * | 2022-08-30 | 2022-09-27 | 水利部交通运输部国家能源局南京水利科学研究院 | 短时预报降水分类误差和定量误差双重订正方法及系统 |
CN115471000A (zh) * | 2022-09-23 | 2022-12-13 | 大连理工大学 | 一种确定性分级降雨预报不确定性的评估方法 |
CN116148951A (zh) * | 2023-02-23 | 2023-05-23 | 中科三清科技有限公司 | 空气目标污染物组分预报模型训练方法、预报方法及装置 |
CN116485045A (zh) * | 2023-06-21 | 2023-07-25 | 中科三清科技有限公司 | 一种建立水华预测模型的方法、水华预测方法及装置 |
Non-Patent Citations (2)
Title |
---|
基于决策树的雷暴天气短临预报;徐全军等;科研信息化技术与应用;全文 * |
基于集合预报的四类持续性灾害性天气中期概率预报应用技术分析;张恒等;成都信息工程学院学报;全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN116756522A (zh) | 2023-09-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10248528B2 (en) | System monitoring method and apparatus | |
CN110443657B (zh) | 客户流量数据处理方法、装置、电子设备及可读介质 | |
CN114285728B (zh) | 一种预测模型训练方法、流量预测方法、装置及存储介质 | |
CN102082703A (zh) | 业务支撑系统设备性能监控的方法及装置 | |
CN116756522B (zh) | 概率预报方法、装置、存储介质及电子设备 | |
CN114500339B (zh) | 一种节点带宽监测方法、装置、电子设备及存储介质 | |
CN107392259B (zh) | 构建不均衡样本分类模型的方法和装置 | |
CN111311014B (zh) | 业务数据处理方法、装置、计算机设备和存储介质 | |
CN113099475A (zh) | 网络质量检测方法、装置、电子设备及可读存储介质 | |
CN111400126A (zh) | 网络服务异常数据检测方法、装置、设备和介质 | |
CN112948223B (zh) | 一种监测运行情况的方法和装置 | |
CN115390161A (zh) | 基于人工智能的降水预测方法及装置 | |
CN114301803A (zh) | 网络质量检测方法、装置、电子设备及存储介质 | |
JP2015167279A (ja) | 必要要員数算出装置、必要要員数算出方法及びプログラム | |
CN113851226A (zh) | 传染病疫情预测方法、装置及电子设备 | |
CN113779335A (zh) | 信息生成方法、装置、电子设备和计算机可读介质 | |
CN112132720A (zh) | 区域警情数量异常趋势确定方法、装置、电子设备及介质 | |
CN117495208B (zh) | 空气质量预报评估方法、装置、存储介质及电子设备 | |
CN118690144A (zh) | 概率预报方法、装置、存储介质及电子设备 | |
CN118245341B (zh) | 业务模型的切换方法、装置、电子设备和计算机可读介质 | |
CN114095390B (zh) | 区域内对象流量的预测方法、装置、设备及存储介质 | |
CN117933466B (zh) | 污染预测方法、装置、存储介质及电子设备 | |
CN115379454B (zh) | 一种基于改进灰色关联分析的移动智能终端安全评估方法及系统 | |
CN115134265B (zh) | 流程的实时监控预警方法、装置、设备及存储介质 | |
CN117573412A (zh) | 系统故障预警方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |