CN113095579B - 一种耦合伯努利-伽马-高斯分布的日尺度降水预报校正方法 - Google Patents

一种耦合伯努利-伽马-高斯分布的日尺度降水预报校正方法 Download PDF

Info

Publication number
CN113095579B
CN113095579B CN202110414246.3A CN202110414246A CN113095579B CN 113095579 B CN113095579 B CN 113095579B CN 202110414246 A CN202110414246 A CN 202110414246A CN 113095579 B CN113095579 B CN 113095579B
Authority
CN
China
Prior art keywords
forecast
distribution
data
precipitation
variable
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110414246.3A
Other languages
English (en)
Other versions
CN113095579A (zh
Inventor
赵铜铁钢
黄泽青
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sun Yat Sen University
Original Assignee
Sun Yat Sen University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sun Yat Sen University filed Critical Sun Yat Sen University
Priority to CN202110414246.3A priority Critical patent/CN113095579B/zh
Publication of CN113095579A publication Critical patent/CN113095579A/zh
Application granted granted Critical
Publication of CN113095579B publication Critical patent/CN113095579B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2462Approximate or statistical queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Tourism & Hospitality (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Probability & Statistics with Applications (AREA)
  • Educational Administration (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • Primary Health Care (AREA)
  • Mathematical Physics (AREA)
  • Fuzzy Systems (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明为克服日尺度降水数据呈现的偏态与离散‑连续混合分布导致难以对日尺度降水预报进行分析及校正的缺陷,提出一种耦合伯努利‑伽马‑高斯分布的日尺度降水预报校正方法,包括以下步骤:采集日尺度的原始预报数据和观测数据;采用伯努利分布进行降水发生分析;采用伽马分布对发生降水的数据进行降水量分析;根据伯努利分布和伽马分布的分析结果,采用高斯分布将原始预报数据和观测数据进行正态转化,得到相应的正态化变量;构建双变量联合正态分布;构建预报变量的条件概率分布;判断待校正预报是否为发生降水事件,根据预报变量的条件概率分布,确定预报变量的条件概率分布参数后对其进行随机采样,再根据正态分位逆变换得到校正预报。

Description

一种耦合伯努利-伽马-高斯分布的日尺度降水预报校正方法
技术领域
本发明涉及水文预报校正技术领域,更具体地,涉及一种耦合伯努利-伽马-高斯分布的日尺度降水预报校正方法。
背景技术
降水是水文循环的关键环节;全球气象模型的稳步发展,能够提供丰富的日尺度降水预报信息,为流域水资源管理与防汛抗旱工作的开展提供重要参考。受全球气象模型的结构、参数和初始与边界条件等的影响,其产生的原始预报常含有复杂的系统误差与随机误差,不利于降水预报的工程应用,因此目前主要通过伽马分布、韦伯分布等对月尺度降水数据进行拟合分析后进行降水预报校正。
但针对日尺度降水数据,由于日尺度降水数据常具有非负性,导致其呈现复杂的偏态与离散-连续混合分布,为建模分析带来困难。在自然条件下,降水具有非负性,即降水量不存在负值,其最小值为零。而在传统的月尺度降水建模分析过程中,除极干旱的地区外,月尺度降水一般不含有零值,其分布可认为是普通的连续分布。与月尺度降水不同,日尺度降水中通常存在一定数量的零值,这导致降水量的分布并不是单纯的连续分布,而是离散-连续的混合分布。伽马分布在零值点上无定义,这导致无法直接通过伽马分布对日尺度降水进行建模分析,难以对日尺度降水预报进行校正。
发明内容
本发明为克服上述现有技术所述的由于日尺度降水数据呈现复杂的偏态与离散-连续混合分布导致难以对日尺度降水预报进行分析及校正的缺陷,提供一种耦合伯努利-伽马-高斯分布的日尺度降水预报校正方法。
为解决上述技术问题,本发明的技术方案如下:
一种耦合伯努利-伽马-高斯分布的日尺度降水预报校正方法,包括以下步骤:
S1:采集日尺度的流域面平均降水的原始预报数据和相应流域面的平均降水的观测数据;
S2:采用伯努利分布对所述原始预报数据和观测数据进行降水发生分析;
S3:采用伽马分布对发生降水的原始预报数据和观测数据进行降水量分析;
S4:根据伯努利分布和伽马分布的分析结果,将所述原始预报数据和观测数据进行正态转化,得到所述原始预报数据和观测数据相应的正态化变量
Figure BDA0003025128120000021
Figure BDA0003025128120000022
S5:根据所述正态化变量
Figure BDA0003025128120000023
Figure BDA0003025128120000024
构建双变量联合正态分布;
S6:将所述原始预报数据的正态化变量
Figure BDA0003025128120000025
作为预报因子,将所述观测数据的正态化变量
Figure BDA0003025128120000026
作为预报变量,构建所述预报变量
Figure BDA0003025128120000027
的条件概率分布;
S7:判断待校正的预报数据是否发生降水事件,确定预报变量
Figure BDA0003025128120000028
的条件概率分布,进一步对预报变量
Figure BDA0003025128120000029
的条件概率分布进行随机采样,再根据正态分位逆变换得到校正预报。
作为优选方案,采用伯努利分布对所述原始预报数据和观测数据进行降水发生分析的步骤包括:
S2.1:设置原始预报数据阈值Tf和观测数据阈值To并对降水事件是否发生进行判断:当原始预报数据的降水量、观测数据的降水量小于相应的阈值Tf、To时,则分析为未发生降水事件;当原始预报数据的降水量、观测数据的降水量大于或等于相应的阈值Tf、To时,则分析为发生降水事件;
S2.2:根据降水事件发生判断结果计算原始预报数据和观测数据中未发生降水事件的概率qf和qo,其计算公式如下:
q=K0/K
式中,K0表示未发生降水事件的数据样本个数,K表示数据样本总数;根据所述未发生降水事件的概率进行伯努利分布拟合,其表达公式如下:
Figure BDA00030251281200000210
式中,F=[f1,f2,...,fK]表示原始预报数据,O=[o1,o2,...,oK]表示观测数据;B()表示伯努利分布。
作为优选方案,采用伽马分布对发生降水的原始预报数据和观测数据进行降水量分析的步骤包括:
将分析为发生降水事件的原始预报数据样本记为Fc,将分析为发生降水事件的观测数据样本记为Oc,采用伽马分布分别拟合原始预报数据样本Fc和观测数据样本Oc,得到其边缘分布,其表达公式如下:
Figure BDA0003025128120000031
式中,G()表示伽马分布,αf、βf、αo、βo分别表示通过拟合得到的原始预报数据、观测数据的伽马分布参数。
作为优选方案,将所述原始预报数据和观测数据进行正态转化的步骤包括:
S4.1:根据伯努利分布和伽马分布的分析结果,将所述原始预报数据和观测数据转化为相应的累积分布函数值,其计算公式如下:
Figure BDA0003025128120000032
式中,
Figure BDA0003025128120000033
表示于第i年的原始预报数据fi、观测数据oi的累积分布函数值,且i=1,2,...,K;
Figure BDA0003025128120000034
分别表示原始预报数据、观测数据的伽马分布的累积分布函数;mf、mo分别表示未发生降水事件的原始预报数据、观测数据的累积分布函数值;
S4.2:通过标准正态分布累积分布函数的反函数,将累积分布函数值
Figure BDA0003025128120000035
转化为服从标准正态分布的变量,其表达公式如下:
Figure BDA0003025128120000036
式中,
Figure BDA0003025128120000037
表示标准正态分布累积分布函数的反函数,
Figure BDA0003025128120000038
分别表示正态分位变换后的原始预报变量和观测变量,则原始预报数据的正态化变量
Figure BDA0003025128120000039
和观测数据的正态化变量
Figure BDA00030251281200000310
服从正态分布。
作为优选方案,所述正态化变量
Figure BDA00030251281200000311
Figure BDA00030251281200000312
的双变量联合正态分布表达式为:
Figure BDA00030251281200000313
式中,ρ表示正态化变量
Figure BDA00030251281200000314
Figure BDA00030251281200000315
的相关系数。
作为优选方案,所述正态化变量
Figure BDA00030251281200000316
Figure BDA00030251281200000317
的相关系数ρ通过极大似然估计法计算得到,其中,似然方程L的计算公式如下:
Figure BDA00030251281200000318
式中,li表示第i年的原始预报数据fi及观测数据oi的似然方程,其中,似然方程l的表达公式如下:
Figure BDA0003025128120000041
式中,PDFBN表示标准双变量联合正态分布的概率密度函数;
Figure BDA0003025128120000042
Figure BDA0003025128120000043
分别表示在双变量联合正态分布中的观测与原始预报对应的条件概率分布的累积分布函数;CDFBN()表示标准双变量联合正态分布的累积分布函数;
Figure BDA0003025128120000044
Figure BDA0003025128120000045
表示阈值Tf、To对应的正态分布变量。
作为优选方案,所述似然方程L中,采用黄金分割搜索算法计算似然方程取得极大值时相关系数的取值。
作为优选方案,将所述原始预报数据的正态化变量
Figure BDA0003025128120000046
作为预报因子,将所述观测数据的正态化变量
Figure BDA0003025128120000047
作为预报变量,得到预报变量
Figure BDA0003025128120000048
的条件概率分布的表达公式如下:
Figure BDA0003025128120000049
式中,ρ表示正态化变量
Figure BDA00030251281200000410
Figure BDA00030251281200000411
的相关系数;
Figure BDA00030251281200000412
表示对标准正态分布N(0,12)随机抽样得到的一组小于等于
Figure BDA00030251281200000413
的随机数。
作为优选方案,根据所述条件概率分布对相应的预报数据进行随机采样,再根据正态分位逆变换得到校正预报的步骤包括,根据所述条件概率分布进行判断:
当待校正的预报数据
Figure BDA00030251281200000414
时,即待校正的预报数据
Figure BDA00030251281200000415
为发生降水事件,则通过直接计算得到预报变量
Figure BDA00030251281200000416
的条件概率分布参数,由此确定预报变量
Figure BDA00030251281200000417
的条件概率分布
Figure BDA00030251281200000418
然后对预报变量
Figure BDA00030251281200000419
的条件概率分布进行随机采样,再根据正态分位逆变换得到校正预报;
当待校正的预报数据
Figure BDA00030251281200000420
时,即待校正的预报数据
Figure BDA00030251281200000421
为未发生降水事件,则先对标准正态分布N(0,12)进行随机抽样,得到一组小于或等于
Figure BDA00030251281200000422
的正态分布随机数
Figure BDA00030251281200000423
根据每一个
Figure BDA00030251281200000424
的取值计算预报变量
Figure BDA00030251281200000425
的条件概率分布参数,进而确定预报变量
Figure BDA00030251281200000426
的条件概率分布
Figure BDA00030251281200000427
对预报变量
Figure BDA00030251281200000428
的条件概率分布进行随机采样,依次对每一个
Figure BDA0003025128120000051
进行相同的计算,最后将所有样本集合后进行正态分位逆变换得到校正预报。
作为优选方案,还包括以下步骤:根据所述校正预报结果计算偏差值、可靠性和预报精度作为预报检验指标对日尺度降水预报校正结果进行检验。
与现有技术相比,本发明技术方案的有益效果是:本发明通过结合伯努利分布、伽马分布对降水发生与降水量进行建模分析,再结合高斯分布对呈现偏态分布的日尺度降水进行正态分位变换,能够对具有偏态分布和离散-连续混合分布特点的日尺度降水预报进行校正,能够有效提高日尺度降水预报的预报精度。
附图说明
图1为本发明的耦合伯努利-伽马-高斯分布的日尺度降水预报校正方法的流程图。
图2为实施例的耦合伯努利-伽马-高斯分布的日尺度降水预报校正方法的原理图。
图3为实施例的原始预报数据的时间序列图。
图4为实施例的校正预报的时间序列图。
图5为实施例的原始预报数据的诊断图。
图6为实施例的校正预报的诊断图。
图7为实施例的原始预报数据的可靠性诊断图。
图8为实施例的校正预报的可靠性诊断图。
具体实施方式
附图仅用于示例性说明,不能理解为对本专利的限制;
对于本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。
下面结合附图和实施例对本发明的技术方案做进一步的说明。
实施例:
本实施例提出一种耦合伯努利-伽马-高斯分布的日尺度降水预报校正方法,如图1~2所示,为本实施例的耦合伯努利-伽马-高斯分布的日尺度降水预报校正方法的流程图。
本实施例提出的耦合伯努利-伽马-高斯分布的日尺度降水预报校正方法中,包括以下步骤:
步骤1:采集日尺度的流域面平均降水的原始预报数据和相应流域面的平均降水的观测数据。
本实施例中的原始预报数据和观测数据通过第三方库读取获得。本实施例根据采集或读取的流域面平均降水的原始预报数据和观测数据进行统计建模分析,分别为采用伯努利分布分析降水的发生过程,以及采用伽马分布分析发生的降水事件中的降水量。
步骤2:采用伯努利分布对所述原始预报数据和观测数据进行降水发生分析。
本实施例中,将“是否发生降水事件”视为随机变量,则该变量有两种可能的取值,当判断为发生降水事件时将变量值为1;当判断为未发生降水事件时将该变量值为0。因此,降水的发生分析过程可以认为是一个伯努利试验,则降水的发生过程可以采用伯努利分布进行分析,其具体步骤包括:
S2.1:设置原始预报数据阈值Tf和观测数据阈值To并对降水事件是否发生进行判断:当原始预报数据的降水量、观测数据的降水量小于相应的阈值Tf、To时,则分析为未发生降水事件;当原始预报数据的降水量、观测数据的降水量大于或等于相应的阈值Tf、To时,则分析为发生降水事件;其中,阈值Tf、To为0或者略大于0的实数;
S2.2:根据降水事件发生判断结果计算原始预报数据和观测数据中未发生降水事件的概率qf和qo(即伯努利分布中的失败概率),其计算公式如下:
q=K0/K
式中,K0表示未发生降水事件的数据样本个数,K表示数据样本总数;根据所述未发生降水事件的概率进行伯努利分布拟合,其表达公式如下:
Figure BDA0003025128120000061
式中,F=[f1,f2,...,fK]表示原始预报数据,O=[o1,o2,...,oK]表示观测数据;B()表示伯努利分布。
步骤3:采用伽马分布对发生降水的原始预报数据和观测数据进行降水量分析;其具体步骤包括:
将分析为发生降水事件的原始预报数据样本记为Fc,将分析为发生降水事件的观测数据样本记为Oc,样本Fc和Oc表示各个发生降水事件中的降水量;采用伽马分布分别拟合原始预报数据样本Fc和观测数据样本Oc,得到其边缘分布,其表达公式如下:
Figure BDA0003025128120000071
式中,G()表示伽马分布,αf、βf、αo、βo分别表示通过拟合得到的原始预报数据、观测数据的伽马分布参数,伽马分布参数由极大似然估计法推求得到。
步骤4:根据伯努利分布和伽马分布的分析结果,将所述原始预报数据和观测数据进行正态转化,得到所述原始预报数据和观测数据相应的正态化变量
Figure BDA00030251281200000713
Figure BDA00030251281200000714
本步骤根据伯努利分布和伽马分布的分析结果,结合高斯分布构建耦合伯努利-伽马-高斯分布的日尺度降水预报校正模型。采用高斯分布对原始预报数据和观测数据进行正态转化的具体步骤如下:
S4.1:根据伯努利分布和伽马分布的分析结果,将所述原始预报数据和观测数据转化为相应的累积分布函数值,其计算公式如下:
Figure BDA0003025128120000072
式中,
Figure BDA0003025128120000073
表示于第i年的原始预报数据fi、观测数据oi的累积分布函数值,且i=1,2,...,K;
Figure BDA0003025128120000074
分别表示原始预报数据、观测数据的伽马分布的累积分布函数;mf、mo分别表示未发生降水事件的原始预报数据、观测数据的累积分布函数值;
S4.2:通过标准正态分布累积分布函数的反函数,将累积分布函数值
Figure BDA0003025128120000075
转化为服从标准正态分布的变量,其表达公式如下:
Figure BDA0003025128120000076
式中,
Figure BDA0003025128120000077
表示标准正态分布累积分布函数的反函数,
Figure BDA0003025128120000078
分别表示正态分位变换后的原始预报变量和观测变量,则原始预报数据的正态化变量
Figure BDA0003025128120000079
和观测数据的正态化变量
Figure BDA00030251281200000710
服从正态分布。
本步骤将日尺度降水中的零值视为小于等于零的未知数值,从而将降水的离散-连续混合分布转化为单一连续分布,简化后续的建模分析过程,该步骤也导致数据删失。
步骤5:根据所述正态化变量
Figure BDA00030251281200000711
Figure BDA00030251281200000712
构建双变量联合正态分布。其表达公式如下:
Figure BDA0003025128120000081
式中,ρ表示正态化变量
Figure BDA0003025128120000082
Figure BDA0003025128120000083
的相关系数。与月尺度降水分析中不同的是,受数据删失的影响,相关系数ρ无法直接通过公式计算。本实施例通过极大似然估计法推求相关系数,其中,似然方程L的计算公式如下:
Figure BDA0003025128120000084
式中,li表示第i年的原始预报数据fi及观测数据oi的似然方程,其中,似然方程l的表达公式如下:
Figure BDA0003025128120000085
式中,PDFBN表示标准双变量联合正态分布的概率密度函数;
Figure BDA0003025128120000086
Figure BDA0003025128120000087
分别表示在双变量联合正态分布中的观测与原始预报对应的条件概率分布的累积分布函数;CDFBN()表示标准双变量联合正态分布的累积分布函数;
Figure BDA0003025128120000088
Figure BDA0003025128120000089
表示阈值Tf、To对应的正态分布变量。
上式4种似然方程l分别表示4种情况下的似然方程,由上至下分别对应:1)原始预报数据与观测数据同时发生降水事件;2)原始预报数据为发生降水事件,观测数据为未发生降水事件;3)原始预报数据为未发生降水事件,观测数据为发生降水事件;4)原始预报数据与观测数据同时未发生降水事件。
根据上述似然方程L,采用黄金分割搜索算法计算似然方程取得极大值时相关系数ρ的取值。
步骤6:将所述原始预报数据的正态化变量
Figure BDA00030251281200000810
作为预报因子,将所述观测数据的正态化变量
Figure BDA00030251281200000811
作为预报变量,构建所述预报变量
Figure BDA00030251281200000812
的条件概率分布。其中,预报变量
Figure BDA00030251281200000813
的条件概率分布的表达公式如下:
Figure BDA0003025128120000091
式中,ρ表示正态化变量
Figure BDA0003025128120000092
Figure BDA0003025128120000093
的相关系数;
Figure BDA0003025128120000094
表示对标准正态分布N(0,12)随机抽样得到的一组小于等于
Figure BDA0003025128120000095
的随机数。
步骤7:判断待校正的预报数据是否发生降水事件,确定预报变量
Figure BDA0003025128120000096
的条件概率分布参数,进一步对其进行随机采样,再根据正态分位逆变换得到校正预报。
具体的,当待校正的预报数据
Figure BDA0003025128120000097
时,即待校正的预报数据
Figure BDA0003025128120000098
为发生降水事件,则通过直接计算得到预报变量
Figure BDA0003025128120000099
的条件概率分布参数,由此确定
Figure BDA00030251281200000910
的条件概率分布
Figure BDA00030251281200000911
然后对
Figure BDA00030251281200000912
的条件概率分布进行随机采样,再根据正态分位逆变换得到校正预报;
当待校正的预报数据
Figure BDA00030251281200000913
时,即待校正的预报数据
Figure BDA00030251281200000914
为未发生降水事件,则先对标准正态分布N(0,12)进行随机抽样,得到一组小于或等于
Figure BDA00030251281200000915
的正态分布随机数
Figure BDA00030251281200000916
根据每一个
Figure BDA00030251281200000917
的取值计算预报变量
Figure BDA00030251281200000918
的条件概率分布参数,进而确定预报变量
Figure BDA00030251281200000919
的条件概率分布
Figure BDA00030251281200000920
对所述预报变量
Figure BDA00030251281200000921
的条件概率分布进行随机采样,依次对每一个
Figure BDA00030251281200000922
进行相同的计算,最后将所有样本集合后进行正态分位逆变换得到校正预报。
进一步的,根据所述校正预报结果计算偏差值、可靠性和预报精度作为预报检验指标对日尺度降水预报校正结果进行检验,分析日尺度降水预报校正的效果。
本实施例中,通过结合伯努利分布、伽马分布对降水发生与降水量这两个不同的过程进行建模分析,再结合高斯分布对呈现偏态分布的日尺度降水进行正态分位变换,可应用于校正具有偏态分布和离散-连续混合分布特点的日尺度降水预报,在使用过程中只需要获取原始预报和观测数据,即可完成对日尺度降水预报的校正。
在一具体实施过程中,针对珠江流域东江上的ECMWF-S2S日尺度降水预报进行降水预报校正。
首先,采用Python第三方库netCDF4中的Dataset函数读取需要进行校正的原始预报与对应时间的观测数据(.nc),通过该对象中的variables属性提取出相应的数据,并将其分别存储在名为temp_fore和temp_obs的变量中。在本实例中,降水预报数据为1-12月月初做出的预见期为7天的累积降水量,观测数据为与预报相对应的观测累积降水量。
对读取的原始预报与观测数据进行建模分析:采用伯努利分布分析样本中降水发生的概率,将其分别存储在q_fore与q_obs变量中;通过伽马分布分析降水量的分布特点,通过stats.gamma.fit函数对降水进行拟合,得到的参数分别存在于para_fore和para_obs变量中。
在上述基础上,构建耦合伯努利-伽马-高斯分布的日尺度降水预报校正模型,主要包括正态分位变换、联合分布构建和条件概率分布,主要通过第三方库Numpy和Scipy进行:
1)采用stats.gamma.cdf与stats.norm.ppf函数,对原始预报与观测数据进行正态分位变换,从而得到服从正态分布的预报与观测变量,分别存储在trans_fore与trans_obs中;
2)构建双变量联合正态分布模型,采用stats.norm和stats.multivariate_normal函数,以循环判断的方式构建相应的似然方程,将其对象存储于likelihood_function列表中,并作为黄金分割搜索算法的目标函数,搜索相应的相关系数使得似然方程取得极大值,最后将对应的相关系数存储在corr变量中;
3)在双变量联合正态分布的基础上,计算观测值的条件概率分布参数;其中标准差sigma可由相关系数直接计算得到,当待校正预报f大于阈值T时,均值mean(即预报变量)可直接计算,采用函数stats.norm.rvs进行随机采样,得到1000个样本;当待校正预报f小于等于阈值T时,先通过Numpy.random.uniform与stats.norm.ppf随机采样得到1000组f的随机值,确定mean(即预报变量)后再通过stats.norm.rvs逐个进行随机采样;
4)根据3)中得到的随机样本,通过正态分位逆变换,得到校正预报。
进一步的,采用Python中的class()和def()语句,将以上各个步骤封装成函数,包括Bernoulli_Gamma_Gaussian类、NQT函数、bi_gaussian函数、golden_section_search函数、conditional_distribution函数和back_NQT等,并保存为.py文件。
通过Python中import语句调用上述函数,对于每一组降水预报,逐个进行校正,得到每个月月初做出的7天累积降水量校正预报。
进一步的,利用Numpy计算偏差、可靠性和预报精度等检验指标,再采用Matplotlib绘制预报诊断图,对原始预报和校正预报进行检验:
1)采用Numpy中的nanpercentile函数,分别计算原始预报和校正预报的10、25、50、75和90分位数,通过第三方库Matplotlib中的pyplot.plot,以年份为x轴,降水量为y轴,绘制降水预报与观测的时间序列图,如图3与图4所示;
2)基于原始预报和校正预报的10、25、50、75和90分位数,以集合预报中位数为x轴,降水量为y轴,绘制原始预报与校正预报诊断图,同时通过pyplot.text将预报检验指标计算结果显示在图中,如图5与图6所示;
3)根据原始预报、校正预报和观测值,计算可靠性检验指标PIT,并用Numpy.sort函数从小到大进行排序,以标准均匀分布为x轴,排序PIT值为y轴,绘制可靠性检验图,如图7与图8所示。
由图3~图8可知,采用本实施例对具有偏态分布和离散-连续混合分布特点的日尺度降水预报能够有效校正降水预报的系统偏差,提高预报精度,有利于降水预报的工程应用,且在使用过程中只需获取相应的原始预报和观测数据,通过本发明即可完成对日尺度降水预报的校正,无需手动设置参数。此外,本实施例将本发明的各个步骤封装成函数,基于开源的Python语言平台,具有良好的可移植性,方便在不同系统、平台上应用。
显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。

Claims (5)

1.一种耦合伯努利-伽马-高斯分布的日尺度降水预报校正方法,其特征在于,包括以下步骤:
S1:采集日尺度的流域面平均降水的原始预报数据和相应流域面的平均降水的观测数据;
S2:采用伯努利分布对所述原始预报数据和观测数据进行降水发生分析;其中:
S2.1:设置原始预报数据阈值Tf和观测数据阈值To并对降水事件是否发生进行判断:当原始预报数据的降水量、观测数据的降水量小于相应的阈值Tf、To时,则分析为未发生降水事件;当原始预报数据的降水量、观测数据的降水量大于或等于相应的阈值Tf、To时,则分析为发生降水事件;
S2.2:根据降水事件发生判断结果计算原始预报数据中未发生降水事件的概率qf和观测数据中未发生降水事件的概率qo,其计算公式如下:
q=K0/K
式中,K0表示未发生降水事件的数据样本个数,K表示数据样本总数;根据所述未发生降水事件的概率进行伯努利分布拟合,其表达公式如下:
式中,F=[f1,f2,...,fK]表示原始预报数据,O=[o1,o2,...,oK]表示观测数据;B()表示伯努利分布;
S3:采用伽马分布对发生降水的原始预报数据和观测数据进行降水量分析;其中:
将分析为发生降水事件的原始预报数据样本记为Fc,将分析为发生降水事件的观测数据样本记为Oc,采用伽马分布分别拟合原始预报数据样本Fc和观测数据样本Oc,得到其边缘分布,其表达公式如下:
式中,G()表示伽马分布,αf、βf、αo、βo分别表示通过拟合得到的原始预报数据、观测数据的伽马分布参数;
S4:根据伯努利分布和伽马分布的分析结果,将所述原始预报数据和观测数据进行正态转化,得到所述原始预报数据和观测数据相应的正态化变量其中,将所述原始预报数据和观测数据进行正态转化的步骤包括:
S4.1:根据伯努利分布和伽马分布的分析结果,将所述原始预报数据和观测数据转化为相应的累积分布函数值,其计算公式如下:
式中,表示于第i年的原始预报数据fi、观测数据oi的累积分布函数值,且i=1,2,...,K;分别表示原始预报数据、观测数据的伽马分布的累积分布函数;mf、mo分别表示未发生降水事件的原始预报数据、观测数据的累积分布函数值;
S4.2:通过标准正态分布累积分布函数的反函数,将累积分布函数值转化为服从标准正态分布的变量,其表达公式如下:
式中,表示标准正态分布累积分布函数的反函数,分别表示正态分位变换后的原始预报变量和观测变量,则原始预报数据的正态化变量和观测数据的正态化变量服从正态分布;所述正态化变量的双变量联合正态分布表达式为:
式中,ρ表示正态化变量的相关系数;
所述正态化变量的相关系数ρ通过极大似然估计法计算得到,其中,总似然函数L的计算公式如下:
式中,li表示第i年的原始预报数据fi及观测数据oi的似然函数,其中,似然函数li的表达公式如下:
式中,PDFBN表示标准双变量联合正态分布的概率密度函数;分别表示在双变量联合正态分布中的观测与原始预报对应的条件概率分布的累积分布函数;CDFBN()表示标准双变量联合正态分布的累积分布函数;表示阈值Tf、To对应的正态分布变量;
S5:根据所述正态化变量构建双变量联合正态分布;
S6:将所述原始预报数据的正态化变量作为预报因子,将所述观测数据的正态化变量作为预报变量,构建所述预报变量的条件概率分布;
S7:判断待校正的预报数据是否发生降水事件,确定预报变量的条件概率分布,进一步对预报变量的条件概率分布进行随机采样,再根据正态分位逆变换得到校正预报。
2.根据权利要求1所述的日尺度降水预报校正方法,其特征在于,所述总似然函数L中,采用黄金分割搜索算法计算总似然函数取得极大值时相关系数的取值。
3.根据权利要求2所述的日尺度降水预报校正方法,其特征在于,将所述原始预报数据的正态化变量作为预报因子,将所述观测数据的正态化变量作为预报变量,得到预报变量的条件概率分布的表达公式如下:
式中,ρ表示正态化变量的相关系数;表示对标准正态分布N(0,12)随机抽样得到的一组小于等于的随机数。
4.根据权利要求3所述的日尺度降水预报校正方法,其特征在于,根据所述预报变量的条件概率分布对相应的预报数据进行随机采样,再根据正态分位逆变换得到校正预报的步骤包括,根据所述预报变量的条件概率分布进行判断:
当待校正的预报数据时,即待校正的预报数据为发生降水事件,则通过直接计算得到预报变量的条件概率分布参数,由此确定预报变量的条件概率分布然后对所述预报变量的条件概率分布进行随机采样,再根据正态分位逆变换得到校正预报;
当待校正的预报数据时,即待校正的预报数据为未发生降水事件,则先对标准正态分布N(0,12)进行随机抽样,得到一组小于或等于的正态分布随机数根据每一个的取值计算预报变量的条件概率分布参数,进而确定预报变量的条件概率分布对所述预报变量的条件概率分布进行随机采样,依次对每一个进行相同的计算,最后将所有样本集合后进行正态分位逆变换得到校正预报。
5.根据权利要求1~4任一项所述的日尺度降水预报校正方法,其特征在于,还包括以下步骤:根据所述校正预报结果计算偏差值、可靠性和预报精度作为预报检验指标对日尺度降水预报校正结果进行检验。
CN202110414246.3A 2021-04-16 2021-04-16 一种耦合伯努利-伽马-高斯分布的日尺度降水预报校正方法 Active CN113095579B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110414246.3A CN113095579B (zh) 2021-04-16 2021-04-16 一种耦合伯努利-伽马-高斯分布的日尺度降水预报校正方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110414246.3A CN113095579B (zh) 2021-04-16 2021-04-16 一种耦合伯努利-伽马-高斯分布的日尺度降水预报校正方法

Publications (2)

Publication Number Publication Date
CN113095579A CN113095579A (zh) 2021-07-09
CN113095579B true CN113095579B (zh) 2023-04-18

Family

ID=76678794

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110414246.3A Active CN113095579B (zh) 2021-04-16 2021-04-16 一种耦合伯努利-伽马-高斯分布的日尺度降水预报校正方法

Country Status (1)

Country Link
CN (1) CN113095579B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024036516A1 (zh) * 2022-08-17 2024-02-22 中山大学 一种基于梯度参数寻优的降水正态化分析方法及系统
CN116757885B (zh) * 2023-07-06 2024-04-23 北京中知智慧科技有限公司 一种企业知识产权维度评审系统

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106991278A (zh) * 2017-03-21 2017-07-28 武汉大学 一种集合降水预报与实时洪水概率预报的耦合方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3281158A1 (en) * 2015-04-08 2018-02-14 The Climate Corporation Improving weather forecasts through post-processing
CN111898093B (zh) * 2020-07-01 2024-02-20 武汉大学 适用于气象集合预报的多维后处理方法、装置以及系统
CN112415635B (zh) * 2020-11-19 2022-03-29 中山大学 一种耦合伽马与高斯分布的月尺度降水预报校正方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106991278A (zh) * 2017-03-21 2017-07-28 武汉大学 一种集合降水预报与实时洪水概率预报的耦合方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
王彬雁 ; 赵琳娜 ; 许晖 ; 刘莹 ; .四川雨季小时降水的概率分布特征及其降水分区.暴雨灾害.2018,(02),第21-29页. *

Also Published As

Publication number Publication date
CN113095579A (zh) 2021-07-09

Similar Documents

Publication Publication Date Title
CN109615226B (zh) 一种运营指标异常监测方法
Jamali et al. Detecting changes in vegetation trends using time series segmentation
CN113095579B (zh) 一种耦合伯努利-伽马-高斯分布的日尺度降水预报校正方法
CN112415635B (zh) 一种耦合伽马与高斯分布的月尺度降水预报校正方法
Chen et al. Comparison of the multiple imputation approaches for imputing rainfall data series and their applications to watershed models
CN114168906B (zh) 一种基于云计算的测绘地理信息数据采集系统
CN111898831A (zh) 一种实时洪水概率预报实用化方法
Jiang et al. Principal component analysis for extremes and application to US precipitation
Capozzi et al. Rescue and quality control of sub-daily meteorological data collected at Montevergine Observatory (Southern Apennines), 1884–1963
Tadesse et al. Long-term trends in storm surge climate derived from an ensemble of global surge reconstructions
Wang et al. A forecast cycle–based evaluation for tropical cyclone rapid intensification forecasts by the operational HWRF Model
CN110907984A (zh) 一种基于自回归移动平均模型的震前红外长波辐射异常信息探测方法
CN114676385B (zh) 一种基于Copula的复合干热事件逐日识别和强度计算方法
US10878329B1 (en) Probabilistic accumulation approach to assess primary uncertainty in catastrophe models
CN115935283A (zh) 一种基于多元非线性因果分析的干旱成因溯源方法
CN113673609B (zh) 一种基于线性隐变量的调查问卷数据分析方法
WO2022217568A1 (zh) 一种耦合伯努利-伽马-高斯分布的日尺度降水预报校正方法
Wheadon Classification accuracy and consistency under item response theory models using the package classify
CN115271332A (zh) 一种旱情监测方法
CN115083570A (zh) 一种基于数据共享的医疗影像管理系统
CN114998719A (zh) 一种基于深度学习和多源遥感数据的林火预测方法
Azhar et al. State-space implementation in forecasting carbon and gas prices in commodity markets
Ganapathy et al. Improved estimation of extreme floods with data pooling and mixed probability distribution
WO2023240509A1 (zh) 一种基于降水预报与遥相关对应关系的空间概率分析方法及系统
Yasar et al. Multivariate outlier detection in a precipitation series using two-dimensional correlation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant