CN116805439A - 一种基于人工智能和大气环流机制的干旱预报方法及系统 - Google Patents
一种基于人工智能和大气环流机制的干旱预报方法及系统 Download PDFInfo
- Publication number
- CN116805439A CN116805439A CN202310774646.4A CN202310774646A CN116805439A CN 116805439 A CN116805439 A CN 116805439A CN 202310774646 A CN202310774646 A CN 202310774646A CN 116805439 A CN116805439 A CN 116805439A
- Authority
- CN
- China
- Prior art keywords
- model
- runoff
- precipitation
- rainfall
- drought
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000007246 mechanism Effects 0.000 title claims abstract description 24
- 238000013473 artificial intelligence Methods 0.000 title claims abstract description 20
- 238000000034 method Methods 0.000 title claims description 31
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims abstract description 78
- 238000010801 machine learning Methods 0.000 claims abstract description 38
- 238000012549 training Methods 0.000 claims abstract description 33
- 238000013277 forecasting method Methods 0.000 claims abstract description 6
- 238000012163 sequencing technique Methods 0.000 claims abstract description 6
- 238000001556 precipitation Methods 0.000 claims description 99
- 230000006870 function Effects 0.000 claims description 18
- 238000000513 principal component analysis Methods 0.000 claims description 17
- 238000002790 cross-validation Methods 0.000 claims description 14
- 230000005484 gravity Effects 0.000 claims description 14
- 238000011160 research Methods 0.000 claims description 12
- 230000008859 change Effects 0.000 claims description 11
- 230000009467 reduction Effects 0.000 claims description 11
- 238000012216 screening Methods 0.000 claims description 7
- 238000004088 simulation Methods 0.000 claims description 7
- 238000007476 Maximum Likelihood Methods 0.000 claims description 6
- 238000004458 analytical method Methods 0.000 claims description 6
- 238000013528 artificial neural network Methods 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 6
- 238000010276 construction Methods 0.000 claims description 6
- 238000003064 k means clustering Methods 0.000 claims description 6
- 238000007637 random forest analysis Methods 0.000 claims description 6
- 238000012706 support-vector machine Methods 0.000 claims description 6
- 230000007704 transition Effects 0.000 claims description 5
- 230000000694 effects Effects 0.000 claims description 4
- 238000012545 processing Methods 0.000 claims description 4
- 238000012795 verification Methods 0.000 claims description 4
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 238000012937 correction Methods 0.000 claims description 3
- 230000001419 dependent effect Effects 0.000 claims description 3
- 238000010200 validation analysis Methods 0.000 claims description 3
- 230000008901 benefit Effects 0.000 abstract description 3
- 230000005856 abnormality Effects 0.000 description 4
- 230000005855 radiation Effects 0.000 description 4
- 239000002689 soil Substances 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 2
- 239000003673 groundwater Substances 0.000 description 2
- 230000033001 locomotion Effects 0.000 description 2
- 230000029553 photosynthesis Effects 0.000 description 2
- 238000010672 photosynthesis Methods 0.000 description 2
- 238000011084 recovery Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 238000000844 transformation Methods 0.000 description 2
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 238000013398 bayesian method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 229930002875 chlorophyll Natural products 0.000 description 1
- 235000019804 chlorophyll Nutrition 0.000 description 1
- ATNHDLDRLWWWCB-AENOIHSZSA-M chlorophyll a Chemical compound C1([C@@H](C(=O)OC)C(=O)C2=C3C)=C2N2C3=CC(C(CC)=C3C)=[N+]4C3=CC3=C(C=C)C(C)=C5N3[Mg-2]42[N+]2=C1[C@@H](CCC(=O)OC\C=C(/C)CCC[C@H](C)CCC[C@H](C)CCCC(C)C)[C@H](C)C2=C5 ATNHDLDRLWWWCB-AENOIHSZSA-M 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000001066 destructive effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000035790 physiological processes and functions Effects 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 230000029058 respiratory gaseous exchange Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000002352 surface water Substances 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000009834 vaporization Methods 0.000 description 1
- 230000008016 vaporization Effects 0.000 description 1
- 238000009736 wetting Methods 0.000 description 1
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供一种基于人工智能和大气环流机制的干旱预报方法及系统,包括:S1、获取备选降水径流影响因子;S2、对备选降水径流影响因子重要性排序并确定最终降水径流影响因子和降水径流状态数目k值;S3、以降水径流预报误差最小的Bayesian‑NHMM模型作为最佳降水径流预报模型获取降水和径流预报结果;S4、实现陆地水储量预报因子的分类分级;S5、对机器学习模型进行训练,将训练好的机器学习模型作为陆地水储量预报模型;S6、基于陆地水储量预报模型实现干旱预报预警。本发明充分利用了Bayesian‑NHMM模型以及当前机器学习模型的优势,弥补传统干旱预报精度低的问题,可推求未来干旱风险并开展干旱风险预警。
Description
技术领域
本发明属于干旱预测技术领域,更具体地,涉及一种基于人工智能和大气环流机制的干旱预报方法及系统。
背景技术
干旱事件成因复杂、时间跨度大、破坏力强,是制约自然生态系统和社会经济可持续发展的重要因素,常被划分为气象干旱、水文干旱、农业干旱以及社会经济干旱。气象干旱主要指降水偏少现象,多由大气环流异常引发;气象干旱是水文干旱的诱因,降水偏少和气温偏高可能造成土壤水、河湖径流和地下水干旱发生,从而进一步触发水文干旱。干旱的影响因子众多,包括水文、气象以及植被等因子,且往往存在密切的相关性。因此,国内外学者为了定量刻画水分亏缺程度,提出了标准化降水指数、标准化降水蒸散发指数、帕默尔干旱指数、标准化径流指数等大量的单因子、多因子综合干旱指标。尽管各干旱指数的研究对象及关注的物理过程不同,但主要考虑降水、蒸散发、径流和土壤含水量等一种或多种气象水文要素,无法全面刻画干旱事件的内在物理特征。
2002年3月,重力恢复与气候实验(Gravity Recovery And Climate Experiment,GRACE)卫星成功发射,为获取全球大尺度地球表面物质迁移提供了连续、高精度的直接观测手段。基于GRACE卫星信号解算的重力场模型,可以提取地球月重力场在300km×300km空间尺度的变化信息,扣除地壳物质移动、大气运动、洋流和潮汐等因素影响,能有效反映冰雪、地表水、土壤水、地下水以及人为因素造成的重力变化,全面监测陆地水储量异常(Terrestrial Water Storage Anomaly,TWSA)信号,在跟踪区域及全球干旱事件中显示出巨大潜力。
尽管GRACE卫星开始应用于干旱监测评估,目前国外基于陆地水储量异常评估旱情的相关研究仍起步不久,国内更是鲜见报道。降水过程是影响陆地水储量的重要环节,不仅受到大尺度气候因子的遥相关驱动影响,还与局地各水文气象因子、下垫面条件紧密相关。如何充分考虑大尺度、局地因子对区域降水过程的影响,构建合理可靠的降水预报模型,与区域陆地水储量预报模型相耦合,是开展高精度干旱事件预报的难点之一。此外,如何综合考虑变化环境下多因子影响,将局地水文气象因子以及下垫面覆被条件降尺度到干旱预报中,获取基于物理机理解析下的流域干旱预报信息,延长洪水预报预见期并提高预报精度,构建干旱预警机制是当前干旱预报的另一大难题。
发明内容
针对现有技术的以上缺陷或改进需求,本发明提供了一种基于人工智能和大气环流机制的干旱预报方法及系统,其目的在于,解决复杂环境下对洪水的预见期短、预报精度过低的问题。
基于上述问题,本发明采用如下技术方案:
一种基于人工智能和大气环流机制的干旱预报方法,包括如下步骤:
S1、获取数据包括大尺度气候因子数据、水文气象因子数据和下垫面影响因子数据并推求相对湿度和比湿,作为备选降水径流影响因子;
S2、初步对备选降水径流影响因子重要性排序,通过主成分分析对降水径流影响进行降维处理,最后通过k折交叉验证确定最终降水径流影响因子;通过BIC函数确定Bayesian-NHMM降水概率预报模型的降水径流状态数目k值;
S3、基于最终降水径流影响因子及降水径流状态数目k值,构建最终降水径流影响因子与不同降水径流状态数目k值组合的Bayesian-NHMM模型,以降水径流预报误差最小的Bayesian-NHMM模型作为最佳降水径流预报模型,获取降水和径流预报结果;
S4、考虑气候变化及下垫面变化对径流的综合影响,选用相关水文气象要素、SIF、LAI和Bayesian-NHMM模型预报降水值为聚类变量,采用K-means聚类方法实现陆地水储量预报因子的分类分级;
S5、通过N类训练子样本分别对机器学习模型进行训练,得到N个训练好的机器学习模型作为陆地水储量预报模型;
S6、基于陆地水储量预报模型实现干旱预报预警。
进一步地,所述步骤2包括如下子步骤:
S2.1:计算备选降水径流影响因子与降水量之间的相关关系排序;
S2.2:基于BIC函数确定Bayesian-NHMM降水概率预报模型中的降水状态数目;
S2.3:基于线性相关系数以及非线性相关互信息指数初步对径流影响因子重要性排序,通过主成分分析对影响因子进行降维处理,通过k折交叉验证确定最终径流影响因子;通过BIC函数确定Bayesian-NHMM中的径流状态数目。
进一步地,所述步骤S2.1具体为:
(1)分别计算各备选降水预报因子与降水量之间的相关系数:线性相关关系用Pearson相关系数计算;非线性相关关系用互信息指标计算,将所有备选降水预报因子与降水量分别进行线性与非线性分析,根据显著性水平判断具体属于线性/非线性关系;
(2)基于主成分分析法优选降水影响因子:选出相关系数超过预设阈值的降水预报因子,通过主成分分析对筛选出的降水预报因子进行降维处理;
(3)通过k折交叉验证确定最终降水影响因子:对处理后的降水预报因子进行k折交叉验证,若验证不通过,则调整预设阈值,并回到步骤(2);若验证通过,则此时处理后的降水预报因子即为最终降水影响因子。
进一步地,所述步骤S2.2具体为:
BIC函数值计算方式为:
BIC=2P-klog(T)
式中:P为最大似然估计,其与模型有关;k为模型的降水状态数目;T为数据的天数;
基于隐藏状态(Z)的降水概率分布最大似然估计P(Rt|X,Z,δ,θ)可通过下式计算:
式中:t=1,2,…T为时刻;Rt为t时刻的观测降水,Xt=Xt,1,Xt,2,…Xt,p为确定的t时刻的p个降水预报因子,θ为与概率矩阵相关的未知参数,δ为与转换概率相关的未知参数,ρj为与Xt相关的概率分布中的系数,令δ=δi,j=(ρj,εi,j);
通过上式,计算得到不同k值时Bayesian-NHMM模型对应的BIC函数值,从而建立k值与BIC函数值的关联曲线图,以该关联曲线图中各拐点处对应的k值作为备选值,若不存在拐点,则选取BIC值最小情况对应的k值。
进一步地,所述步骤S3包括:
根据步骤S2确定的最终降水径流影响因子及降水径流状态数目k值,构建不同降水径流预报因子组合的Bayesian-NHMM模型,计算不同降水预报因子模拟结果的均方根误差偏移系数CVRMSE,即k取不同备选值时的Bayesian-NHMM模型的降水径流预测结果与观测结果的均方根误差偏移系数CVRMSE,获得多组模型的不同表现,CVRMSE计算式如下:
式中:np为预报天数;Si为第i天降水或径流的预报值;Ri为第i天降水或径流的观测值;
针对降水和径流,分别选定CVRMSE最小的模型,确定为最佳降水和径流预测模型,并根据该最佳降水和径流预测模型,通过最终降水和径流影响因子预报降水径流。
进一步地,所述步骤S5具体包括如下子步骤:
S5.1:对影响陆地水储量形成的物理因子进行初步筛选并获取最终影响因子后,基于人工神经网络ANN、支持向量机SVM、随机森林模型RF和长短期记忆模型LSTM,将物理因子降尺度至模拟陆地水储量中,分别开展未来陆地水储量预报工作;
S5.2:根据贝叶斯全概率公式构建各模型模拟陆地水储量的概率密度函数;
S5.3:根据人工神经网络ANN、支持向量机SVM、随机森林模型RF和长短期记忆模型LSTM预测效果的相对贡献确定相应权重,从而建立贝叶斯模式平均校正模型。
进一步地,所述步骤S5.2中根据贝叶斯全概率公式得到S的概率密度函数如下:
式中:pk(S|fk,R)为第K个机器学习模型fk在给定数据R条件下预测值S的概率密度函数;p(fk|R)为给定训练数据R时第k个机器学习模型预测值的后验概率密度函数,S为模拟的陆地水储量,R=[D,O]表征模型输入数据,其中D为机器学习模型的输入系列,O为重力卫星反演的陆地水储量系列,f=[f1,f2,…,fK]为K个不同机器学习模型的输出结果。
进一步地,所述步骤S5.3具体为:
通过Box-Cox函数将各格点重力卫星反演系列和各机器学习模型得到的模拟系列进行正态转换,再基于正态线性分布假设对多种模式估计结果进行加权平均:
式中:表示均值为fk,方差为/>的正态分布;E表示函数期望值,wk为第k个机器学习模型的权重。
进一步地,所述步骤6中,基于陆地水储量预报模型,得到陆地水储量预报值,基于陆地水储量预报值和推求的TWSA-DSI指数,实现对干旱事件及其等级的预警工作。
另一方面,本发明还提供一种基于人工智能和大气环流机制的干旱预报方法的系统,包括:
数据库构建模块,用于收集研究区域的多种陆地水储量相关数据,作为备选降水径流影响因子;
第一参数估计模块,用于分别计算各备选影响因子与降水径流量之间的相关系数,筛选出相关系数超过预设阈值的影响因子,进而通过主成分分析对筛选出的降水径流影响因子进行处理,得到最终降水径流影响因子;构建Bayesian-NHMM模型,并确定Bayesian-NHMM模型中降水径流状态数目k的数个备选值;
降水径流预报模型构建模块,用于将最终降水径流影响因子输入k取不同备选值时的Bayesian-NHMM模型,进行降水径流预报,以降水径流预报误差最小的Bayesian-NHMM模型作为最佳降水径流预报模型;
第二参数估计模块,用于基于最佳降水径流预报模型预测得到的一系列降水径流值构建训练样本,并对训练样本进行分类,得到N类训练子样本;
预报模型训练模块,用于通过N类训练子样本分别对机器学习模型进行训练,得到N个训练好的机器学习模型作为陆地水储量预报模型,
联合预报模块,基于该陆地水储量预报模型实现干旱预报预警。
与现有技术相比,本发明具有如下有益效果:
1.本发明通过设计Bayesian-NHMM模型进行降水径流预测,然后以预测值作为训练数据对机器学习模型进行训练,从而进行陆地水储量预测;充分利用了数学统计模型Bayesian-NHMM以及当前机器学习模型的优势,弥补传统干旱预报精度低的问题,可推求未来干旱风险并开展干旱风险预警,为防灾减灾部门启动应急响应提供依据。
2.本发明充分利用研究区域实测水文气象数据,尤其考虑当前气候变化及下垫面变化(着重通过考虑植被光合作用及呼吸作用影响)对流域产汇流机制的影响,耦合Bayesian-NHMM降水径流预报模型与径流机器学习模型,具有较强的统计基础,能够客观反映区域物理特征。
附图说明
图1为本发明实施例基于人工智能和大气环流机制的干旱预报方法流程图;
图2是本发明实施例降水影响因子筛选流程图;
图3是本发明实施例Bayesian-NHMM模型工作流程图。
具体实施方式
为了便于本领域普通技术人员理解和实施本发明,下面结合附图及实施例对本发明作进一步的详细描述。应当理解,此处所描述的实施示例仅用于说明和解释本发明,并不用于限定本发明。
本发明基于实测大尺度气候因子与研究区域水文气象资料与LAI与SIF指数长序列,充分考虑大尺度与局地各要素对降水和径流的影响,采用主成分分析与k折交叉验证确定降水和径流预报影响因子,通过BIC准则构建Bayesian-NHMM预报模型预报降水和径流,基于K-means聚类方法实现陆地水储量预报因子的分类分级,将各类陆地水储量预报因子输入人工神经网络ANN、支持向量机SVM、随机森林模型RF和长短期记忆模型LSTM,获取不同物理因子影响下的区域预报陆地水储量组合,基于贝叶斯方法平均各模型预报结果,获取研究区域最终陆地水储量预报结果,预估干旱风险预警结果。
下面通过实施例,并结合附图,对本发明的技术方案做进一步具体说明。
实施例1
如图1所示,本实施例提供一种基于人工智能和大气环流机制的干旱预报方法,包括如下步骤:
S1、获取数据包括大尺度气候因子数据、水文气象因子数据和下垫面影响因子数据并推求相对湿度和比湿,作为备选降水径流影响因子;
本实施例中,获取大尺度气候因子中的ENSO指数、大气环流指数、印度洋偶极子等,构建大尺度气候因子数据库;
确定研究区域,从ERA5再分析数据集中获取降水、气压、2m气温、2m露点温度、短波辐射、长波辐射、径流和土壤湿度等气象水文数据,构建水文气象因子数据库。ERA5是欧洲中期天气预报中心的第五代大气再分析数据集,具有0.25°的空间分辨率,提供自1979年以来覆盖全球的逐时气象数据。
获取GRACE重力卫星反演的陆地水储量异常数据,国际上主要有德国波茨坦地球科学中心、美国加州理工学院喷气推进实验室(Jet Propulsion Laboratory,JPL)、美国德克萨斯大学奥斯汀分校空间研究中心(Center for Space Research at University ofTexas,Austin,CSR)和美国宇航局戈达德太空飞行中心(Goddard Space Flight Center,GSFC)等机构负责数据解译,发布月尺度的全球重力场输出数据。本发明同时采用JPL、CSR、GSFC最新发布的第六代产品,将这三套GRACE重力卫星数据集,插值到0.25°×0.25°空间栅格(使该数据与ERA5的空间分辨率一致),在每个时间步长内对各产品取均值,最终得到2002~2022年覆盖研究区域的TWSA月数据集。
此外,收集研究区域内叶面积指数(LAI,衡量生态系统与大气能量和物质交换强度的重要参数)以及日光诱导叶绿素荧光(SIF,指示植被光合作用及生理状态的重要参数),构建下垫面影响因子数据库。
基于ERA5数据集的气象数据推求相对湿度和比湿。
克劳修斯-克拉珀龙热力学方程可定量描述饱和水汽压esat与气温T的非线性关系:
其中,T0和es0为第一积分常数和第二积分常数,分别取273.16K和611Pa;Lv为汽化潜热常数,取2.5×106J kg-1;Rv为水汽气体常数,取461J kg-1K-1。
露点温度表征空气在水汽含量和气压不变条件下,冷却到水汽饱和时的温度,代入克劳修斯-克拉珀龙方程可度量实际水汽压。将ERA5 2m气温(T2m)和露点温度(Tdew)分别代入公式(1),推求近地相对湿度RH=esat(Tdew)/esat(T2m)。
比湿q为水汽质量与空气团总质量的比值,采用ERA5近地气压p和露点温度推求,公式如下:
S2、初步对备选降水径流影响因子重要性排序,通过主成分分析对降水径流影响进行降维处理,最后通过k折交叉验证确定最终降水径流影响因子;通过BIC函数确定Bayesian-NHMM降水概率预报模型的降水径流状态数目k值;
以降水为例,如图2所示,基于线性相关系数以及非线性相关互信息指数初步对降水影响因子重要性排序,通过主成分分析对影响因子进行降维处理,最后通过k折交叉验证确定最终降水影响因子;通过BIC函数确定贝叶斯隐马尔科夫降水概率预报模型(Bayesian-NHMM)中的降水状态数目。采用上述方法,获得径流的影响因子及状态数目。
具体的,步骤S2包括:
S2.1:计算备选降水影响因子与降水量之间的相关关系排序。
(1)分别计算各备选降水预报因子与降水量之间的相关系数:线性相关关系用Pearson相关系数计算;非线性相关关系用互信息指标计算。具体的,将所有备选降水预报因子与降水量分别进行线性与非线性分析,根据显著性水平判断具体属于线性/非线性关系;其中备选降水预报因子包括:LAI、SIF、气压、2m气温、2m露点温度、短波辐射、长波辐射、相对湿度和比湿等气象和下垫面因子及大尺度气候因子。此外,考虑到大尺度气候因子、LAI与SIF对区域降水影响的滞后性,计算它们对区域降水的相关关系之时,先计算前1-12个月各因子与降水的相关关系,再从中分别筛选出各因子对降水相关关系最大的月份。
(2)基于主成分分析法优选降水影响因子:选出相关系数超过预设阈值的降水预报因子,通过主成分分析对筛选出的降水预报因子进行降维处理。
(3)通过k折交叉验证确定最终降水影响因子:对处理后的降水预报因子进行k折交叉验证,若验证不通过,则调整预设阈值,并回到步骤(2);若验证通过,则此时处理后的降水预报因子即为最终降水影响因子。在本实施例中,k折交叉验证时取k=0.6,即0.6倍数据长度进行率定,0.4倍数据长度进行验证,确定最终降水影响因子。
S2.2:基于BIC函数确定贝叶斯隐马尔科夫降水概率预报模型(Bayesian-NHMM)中的降水状态数目。
如图3所示,Bayesian-NHMM模型是一种基于隐藏状态变换的模型,在模型中每一天的降水都对应一个隐藏状态,该状态变化由一阶马尔科夫链特征决定。图3中Qt为t时刻考虑影响变量的概率转换矩阵,Xt,b、Xt,a为不同类别外源影响变量。不同状态之间的转换概率是随着时间变化的,并且和输入的预报因子密切相关。因此,Bayesian-NHMM模型可以反映降水量和预报因子之间的空间相关性和时间依赖性。而不同隐藏状态数目的选择对于模型的模拟结果影响很大,因此确定降水状态数目是模型建立的重要步骤。状态数目k的确定可以通过比较拥有不同k值模型的BIC函数值来完成。BIC函数值计算方式为:
BIC=2P-klog(T) (3)
式中:P为最大似然估计,其与模型有关;k为模型的降水状态数目;T为数据的天数。基于隐藏状态(Z)的降水概率分布最大似然估计P(Rt|X,Z,δ,θ)可通过下式计算:
式中:t=1,2,…T为时刻;Rt为t时刻的观测降水,Xt=Xt,1,Xt,2,…Xt,p为确定的t时刻的p个降水预报因子,θ为与概率矩阵相关的未知参数,δ为与转换概率相关的未知参数,ρj为与Xt相关的概率分布中的系数,令δ=δi,j=(ρj,εi,j)。
通过上式,计算得到不同k值时Bayesian-NHMM模型对应的BIC函数值,从而建立k值与BIC函数值的关联曲线图,以该关联曲线图中各拐点处对应的k值作为备选值。若不存在拐点,则选取BIC值最小情况对应的k值。
S2.3:基于上述方法,基于线性相关系数以及非线性相关互信息指数初步对径流影响因子重要性排序,通过主成分分析对影响因子进行降维处理,最后通过k折交叉验证确定最终径流影响因子;通过BIC函数确定Bayesian-NHMM中的径流状态数目。
S3、基于最终降水径流影响因子及降水径流状态数目k值,构建最终降水径流影响因子与不同降水径流状态数目k值组合的Bayesian-NHMM模型,以降水径流预报误差最小的Bayesian-NHMM模型作为最佳降水径流预报模型,获取降水和径流预报结果;
具体的,步骤S3包括:
根据步骤S2确定的最终降水径流影响因子及降水径流状态数目k值,构建不同降水径流预报因子组合的Bayesian-NHMM模型。而后,计算不同降水预报因子模拟结果的均方根误差偏移系数(the coefficient of variation of root mean squared error,CVRMSE),即k取不同备选值时的Bayesian-NHMM模型的降水径流预测结果与观测结果的CVRMSE,获得多组模型的不同表现,CVRMSE计算式如下:
式中:np为预报天数;Si为第i天降水或径流的预报值;Ri为第i天降水或径流的观测值。
针对降水和径流,分别选定CVRMSE最小的模型,确定为最佳降水和径流预测模型,并根据该最佳降水和径流预测模型,通过最终降水和径流影响因子预报降水径流。
S4、考虑气候变化及下垫面变化对径流的综合影响,选用相关水文气象要素、SIF、LAI和Bayesian-NHMM模型预报降水值为聚类变量,采用K-means聚类方法实现陆地水储量预报因子的分类分级;
具体的,步骤S4包括:
K-means聚类算法是经典的划分聚类方法,优点是原理简单、收敛速度快且聚类效果好,同时它的算法的可解释度很强,需要调节的参数仅仅是聚类的簇数。K-means的基本原理是:对于一个给定的样本集,按照样本之间距离的大小将样本集分为n个簇,其目标是让簇内的点尽量紧密连接在一起,并让簇间的距离尽量大。
在本实施例中,考虑到影响陆地水储量的主要因素是降水和径流,因此通过最佳降水径流预报模型预测得到接下来一段时间的降水和径流值,然后根据需要将所得降水值按低、中、高分为3类,即初步确定聚类个数为3;然后根据K-means聚类算法计算其他因子与3类的距离,从而将所有训练样本进行分类,得到3类子样本。
S5、通过N类训练子样本分别对机器学习模型进行训练,得到N个训练好的机器学习模型作为陆地水储量预报模型;
具体的,步骤S5包括:
S5.1:对影响陆地水储量形成的物理因子进行初步筛选并获取最终影响因子后,基于人工神经网络ANN、支持向量机SVM、随机森林模型RF和长短期记忆模型LSTM,将物理因子降尺度至模拟陆地水储量中,分别开展未来陆地水储量预报工作。
通过步骤S4中获取的3类子样本分别对LSTM以及ANN、SVM和RF进行训练,并获取各格点的陆地水储量预报结果。
S5.2:根据贝叶斯全概率公式构建各模型模拟陆地水储量的概率密度函数。
具体来说,令S为模拟的陆地水储量,R=[D,O]表征模型输入数据(其中D为机器学习模型的输入系列,O为重力卫星反演的陆地水储量系列),f=[f1,f2,…,fK]为K个不同机器学习模型的输出结果,由贝叶斯全概率公式得到S的概率密度函数如下:
式中:pk(S|fk,R)为第K个机器学习模型fk在给定数据R条件下预测值S的概率密度函数;p(fk|R)为给定训练数据R时第k个机器学习模型预测值的后验概率密度函数。
S5.3:根据各机器学习模型预测效果的相对贡献确定相应权重,从而建立贝叶斯模式平均校正模型;
具体来说,首先通过Box-Cox函数将各格点重力卫星反演系列和各机器学习模型得到的模拟系列进行正态转换,再基于正态线性分布假设对多种模式估计结果进行加权平均:
式中:表示均值为fk,方差为/>的正态分布;E表示函数期望值,wk为第k个机器学习模型的权重。
进一步地,本实施例取K=4。
对某一类子样本,基于计算得到的权重wk对四种训练好的机器学习模型进行加权,得到该类样本对应的陆地水储量预报模型,从而分别得到三类样本对应的陆地水储量预报模型。此模型有效考虑了气候变化及下垫面因子对研究区域物理机制的动态影响,可有效延长预见期并提高陆地水储量预报精度。
S6、基于陆地水储量预报模型实现干旱预报预警。
首先,实时获取研究区域的相关数据(具体为实时测得的水文气象因子数据),分别计算相关数据与3类训练子样本的相似度,选取相似度最高的训练子样本对应的陆地水储量预报模型,将相关数据输入该陆地水储量预报模型,得到预报陆地水储量。
采用近年来国内外学者提出的TWSA-DSI指数度量陆地干湿程度,它是一种无量纲的标准化水储量异常指数,在不同水文气候区域之间具有空间可比性。TWSA-DSI的负值表示陆地水储量低于研究期的平均水平,用于表征干旱程度;同理,正值可用于度量陆地湿润水平。TWSA-DSI系列的计算公式如下:
式中:TWSAi,j代表第i年第j月的TWSA数据,和σj分别为研究期内第j月TWSA的均值和标准差。
本文选取2002~2022年长系列计算TWSA的各月均值和标准差,并基于TWSA-DSI指数将陆地干湿强度划分为不同等级。比如,某些流域主要关注这两类干旱事件:中-重度干旱(-1.6<TWSA-DSI≤-0.8)和极端-特大干旱(TWSA-DSI≤-1.6)。
基于陆地水储量预报值和推求的TWSA-DSI指数,可实现对干旱事件及其等级的预警工作,为有关部门提供决策参考。
实施例2
本实施例提供一种基于人工智能和大气环流机制的干旱预报方法的系统,包括:
数据库构建模块,用于收集研究区域的多种陆地水储量相关数据,作为备选降水径流影响因子;
第一参数估计模块,用于分别计算各备选影响因子与降水径流量之间的相关系数,筛选出相关系数超过预设阈值的影响因子,进而通过主成分分析对筛选出的降水径流影响因子进行处理,得到最终降水径流影响因子;构建Bayesian-NHMM模型,并确定Bayesian-NHMM模型中降水径流状态数目k的数个备选值;
降水径流预报模型构建模块,用于将最终降水径流影响因子输入k取不同备选值时的Bayesian-NHMM模型,进行降水径流预报,以降水径流预报误差最小的Bayesian-NHMM模型作为最佳降水径流预报模型;
第二参数估计模块,用于基于最佳降水径流预报模型预测得到的一系列降水径流值构建训练样本,并对训练样本进行分类,得到N类训练子样本;
预报模型训练模块,用于通过N类训练子样本分别对机器学习模型进行训练,得到N个训练好的机器学习模型作为陆地水储量预报模型,
联合预报模块,基于该陆地水储量预报模型实现干旱预报预警。
以上仅为本发明较佳的实施例,并非因此限制本发明的实施方式及保护范围,对于本领域技术人员而言,应当能够意识到凡运用本发明说明书内容所作出的等同替换和显而易见的变化所得到的方案,均应当包含在本发明的保护范围内。
Claims (10)
1.一种基于人工智能和大气环流机制的干旱预报方法,其特征在于,包括如下步骤:
S1、获取数据包括大尺度气候因子数据、水文气象因子数据和下垫面影响因子数据并推求相对湿度和比湿,作为备选降水径流影响因子;
S2、初步对备选降水径流影响因子重要性排序,通过主成分分析对降水径流影响进行降维处理,最后通过k折交叉验证确定最终降水径流影响因子;通过BIC函数确定Bayesian-NHMM降水概率预报模型的降水径流状态数目k值;
S3、基于最终降水径流影响因子及降水径流状态数目k值,构建最终降水径流影响因子与不同降水径流状态数目k值组合的Bayesian-NHMM模型,以降水径流预报误差最小的Bayesian-NHMM模型作为最佳降水径流预报模型,获取降水和径流预报结果;
S4、考虑气候变化及下垫面变化对径流的综合影响,选用相关水文气象要素、SIF、LAI和Bayesian-NHMM模型预报降水值为聚类变量,采用K-means聚类方法实现陆地水储量预报因子的分类分级;
S5、通过N类训练子样本分别对机器学习模型进行训练,得到N个训练好的机器学习模型作为陆地水储量预报模型;
S6、基于陆地水储量预报模型实现干旱预报预警。
2.根据权利要求1所述的一种基于人工智能和大气环流机制的干旱预报方法,其特征在于:所述步骤2包括如下子步骤:
S2.1:计算备选降水径流影响因子与降水量之间的相关关系排序;
S2.2:基于BIC函数确定Bayesian-NHMM降水概率预报模型中的降水状态数目;
S2.3:基于线性相关系数以及非线性相关互信息指数初步对径流影响因子重要性排序,通过主成分分析对影响因子进行降维处理,通过k折交叉验证确定最终径流影响因子;通过BIC函数确定Bayesian-NHMM中的径流状态数目。
3.根据权利要求2所述的一种基于人工智能和大气环流机制的干旱预报方法,其特征在于:所述步骤S2.1具体为:
(1)分别计算各备选降水预报因子与降水量之间的相关系数:线性相关关系用Pearson相关系数计算;非线性相关关系用互信息指标计算,将所有备选降水预报因子与降水量分别进行线性与非线性分析,根据显著性水平判断具体属于线性/非线性关系;
(2)基于主成分分析法优选降水影响因子:选出相关系数超过预设阈值的降水预报因子,通过主成分分析对筛选出的降水预报因子进行降维处理;
(3)通过k折交叉验证确定最终降水影响因子:对处理后的降水预报因子进行k折交叉验证,若验证不通过,则调整预设阈值,并回到步骤(2);若验证通过,则此时处理后的降水预报因子即为最终降水影响因子。
4.根据权利要求2所述的一种基于人工智能和大气环流机制的干旱预报方法,其特征在于:所述步骤S2.2具体为:
BIC函数值计算方式为:
BIC=2P-klog(T)
式中:P为最大似然估计,其与模型有关;k为模型的降水状态数目;T为数据的天数;
基于隐藏状态(Z)的降水概率分布最大似然估计P(Rt|X,Z,δ,θ)可通过下式计算:
式中:t=1,2,…T为时刻;Rt为t时刻的观测降水,Xt=Xt,1,Xt,2,…Xt,p为确定的t时刻的p个降水预报因子,为与概率矩阵相关的未知参数,δ为与转换概率相关的未知参数,ρj为与Xt相关的概率分布中的系数,令δ=δi,j=(ρj,εi,j);
通过上式,计算得到不同k值时Bayesian-NHMM模型对应的BIC函数值,从而建立k值与BIC函数值的关联曲线图,以该关联曲线图中各拐点处对应的k值作为备选值,若不存在拐点,则选取BIC值最小情况对应的k值。
5.根据权利要求1所述的一种基于人工智能和大气环流机制的干旱预报方法,其特征在于:所述步骤S3包括:
根据步骤S2确定的最终降水径流影响因子及降水径流状态数目k值,构建不同降水径流预报因子组合的Bayesian-NHMM模型,计算不同降水预报因子模拟结果的均方根误差偏移系数CVRMSE,即k取不同备选值时的Bayesian-NHMM模型的降水径流预测结果与观测结果的均方根误差偏移系数CVRMSE,获得多组模型的不同表现,CVRMSE计算式如下:
式中:np为预报天数;Si为第i天降水或径流的预报值;Ri为第i天降水或径流的观测值;
针对降水和径流,分别选定CVRMSE最小的模型,确定为最佳降水和径流预测模型,并根据该最佳降水和径流预测模型,通过最终降水和径流影响因子预报降水径流。
6.根据权利要求1所述的一种基于人工智能和大气环流机制的干旱预报方法,其特征在于:所述步骤S5具体包括如下子步骤:
S5.1:对影响陆地水储量形成的物理因子进行初步筛选并获取最终影响因子后,基于人工神经网络ANN、支持向量机SVM、随机森林模型RF和长短期记忆模型LSTM,将物理因子降尺度至模拟陆地水储量中,分别开展未来陆地水储量预报工作;
S5.2:根据贝叶斯全概率公式构建各模型模拟陆地水储量的概率密度函数;
S5.3:根据人工神经网络ANN、支持向量机SVM、随机森林模型RF和长短期记忆模型LSTM预测效果的相对贡献确定相应权重,从而建立贝叶斯模式平均校正模型。
7.根据权利要求6所述的一种基于人工智能和大气环流机制的干旱预报方法,其特征在于:所述步骤S5.2中根据贝叶斯全概率公式得到S的概率密度函数如下:
式中:pk(S|fk,R)为第K个机器学习模型fk在给定数据R条件下预测值S的概率密度函数;p(fk|R)为给定训练数据R时第k个机器学习模型预测值的后验概率密度函数,S为模拟的陆地水储量,R=[D,O]表征模型输入数据,其中D为机器学习模型的输入系列,O为重力卫星反演的陆地水储量系列,f=[f1,f2,…,fK]为K个不同机器学习模型的输出结果。
8.根据权利要求6所述的一种基于人工智能和大气环流机制的干旱预报方法,其特征在于:所述步骤S5.3具体为:
通过Box-Cox函数将各格点重力卫星反演系列和各机器学习模型得到的模拟系列进行正态转换,再基于正态线性分布假设对多种模式估计结果进行加权平均:
式中:表示均值为fk,方差为/>的正态分布;E表示函数期望值,wk为第k个机器学习模型的权重。
9.根据权利要求1所述的一种基于人工智能和大气环流机制的干旱预报方法,其特征在于:所述步骤6中,基于陆地水储量预报模型,得到陆地水储量预报值,基于陆地水储量预报值和推求的TWSA-DSI指数,实现对干旱事件及其等级的预警工作。
10.一种基于人工智能和大气环流机制的干旱预报方法的系统,其特征在于,包括:
数据库构建模块,用于收集研究区域的多种陆地水储量相关数据,作为备选降水径流影响因子;
第一参数估计模块,用于分别计算各备选影响因子与降水径流量之间的相关系数,筛选出相关系数超过预设阈值的影响因子,进而通过主成分分析对筛选出的降水径流影响因子进行处理,得到最终降水径流影响因子;构建Bayesian-NHMM模型,并确定Bayesian-NHMM模型中降水径流状态数目k的数个备选值;
降水径流预报模型构建模块,用于将最终降水径流影响因子输入k取不同备选值时的Bayesian-NHMM模型,进行降水径流预报,以降水径流预报误差最小的Bayesian-NHMM模型作为最佳降水径流预报模型;
第二参数估计模块,用于基于最佳降水径流预报模型预测得到的一系列降水径流值构建训练样本,并对训练样本进行分类,得到N类训练子样本;
预报模型训练模块,用于通过N类训练子样本分别对机器学习模型进行训练,得到N个训练好的机器学习模型作为陆地水储量预报模型,
联合预报模块,基于该陆地水储量预报模型实现干旱预报预警。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310774646.4A CN116805439A (zh) | 2023-06-27 | 2023-06-27 | 一种基于人工智能和大气环流机制的干旱预报方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310774646.4A CN116805439A (zh) | 2023-06-27 | 2023-06-27 | 一种基于人工智能和大气环流机制的干旱预报方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116805439A true CN116805439A (zh) | 2023-09-26 |
Family
ID=88079422
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310774646.4A Pending CN116805439A (zh) | 2023-06-27 | 2023-06-27 | 一种基于人工智能和大气环流机制的干旱预报方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116805439A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117132177A (zh) * | 2023-10-23 | 2023-11-28 | 长江三峡集团实业发展(北京)有限公司 | 基于多重假设检验的径流预报模型构建和径流预报方法 |
CN117610434A (zh) * | 2024-01-19 | 2024-02-27 | 武汉大学 | 一种融合人工智能的干旱指数重构方法及计算机可读介质 |
CN117633539A (zh) * | 2024-01-25 | 2024-03-01 | 水利部交通运输部国家能源局南京水利科学研究院 | 一种面向不均匀站点分布的地下水干旱识别方法及装置 |
-
2023
- 2023-06-27 CN CN202310774646.4A patent/CN116805439A/zh active Pending
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117132177A (zh) * | 2023-10-23 | 2023-11-28 | 长江三峡集团实业发展(北京)有限公司 | 基于多重假设检验的径流预报模型构建和径流预报方法 |
CN117132177B (zh) * | 2023-10-23 | 2024-01-30 | 长江三峡集团实业发展(北京)有限公司 | 基于多重假设检验的径流预报模型构建和径流预报方法 |
CN117610434A (zh) * | 2024-01-19 | 2024-02-27 | 武汉大学 | 一种融合人工智能的干旱指数重构方法及计算机可读介质 |
CN117610434B (zh) * | 2024-01-19 | 2024-04-16 | 武汉大学 | 一种融合人工智能的干旱指数重构方法及计算机可读介质 |
CN117633539A (zh) * | 2024-01-25 | 2024-03-01 | 水利部交通运输部国家能源局南京水利科学研究院 | 一种面向不均匀站点分布的地下水干旱识别方法及装置 |
CN117633539B (zh) * | 2024-01-25 | 2024-04-12 | 水利部交通运输部国家能源局南京水利科学研究院 | 一种面向不均匀站点分布的地下水干旱识别方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Nourani et al. | Estimation of prediction interval in ANN-based multi-GCMs downscaling of hydro-climatologic parameters | |
CN116805439A (zh) | 一种基于人工智能和大气环流机制的干旱预报方法及系统 | |
CN111665575B (zh) | 一种基于统计动力的中长期降雨分级耦合预报方法及系统 | |
Lu et al. | Streamflow simulation in data-scarce basins using Bayesian and physics-informed machine learning models | |
Roy et al. | Predicting land cover change in a Mediterranean catchment at different time scales | |
Huang et al. | An analytical comparison of four approaches to modelling the daily variability of solar irradiance using meteorological records | |
Cherkassky et al. | Computational intelligence in earth sciences and environmental applications: Issues and challenges | |
CN111260111A (zh) | 基于气象大数据的径流预报改进方法 | |
Gong et al. | Extreme learning machine for reference crop evapotranspiration estimation: Model optimization and spatiotemporal assessment across different climates in China | |
Vathsala et al. | Prediction model for peninsular Indian summer monsoon rainfall using data mining and statistical approaches | |
Huang et al. | Fuzzy neural network and LLE algorithm for forecasting precipitation in tropical cyclones: comparisons with interpolation method by ECMWF and stepwise regression method | |
CN107423857B (zh) | 一种区域长期来水多目标联合概率预测方法 | |
Ukkonen et al. | Evaluation of thunderstorm predictors for Finland using reanalyses and neural networks | |
Putri et al. | Learning Bayesian network for rainfall prediction modeling in urban area using remote sensing satellite data (case study: Jakarta, Indonesia) | |
CN108764527B (zh) | 一种土壤有机碳库时空动态预测最优环境变量筛选方法 | |
Ebrahimi-Khusfi et al. | Accuracy, uncertainty, and interpretability assessments of ANFIS models to predict dust concentration in semi-arid regions | |
Zhu et al. | Internal and external coupling of Gaussian mixture model and deep recurrent network for probabilistic drought forecasting | |
Gholami Rostam et al. | Precipitation forecasting by large-scale climate indices and machine learning techniques | |
Jamei et al. | Combined Terrestrial Evapotranspiration Index prediction using a hybrid artificial intelligence paradigm integrated with relief algorithm-based feature selection | |
CN113935228A (zh) | 一种基于机器学习的l波段粗糙海面辐射亮温模拟方法 | |
Lu et al. | Uncertainty quantification of machine learning models to improve streamflow prediction under changing climate and environmental conditions | |
CN116663404A (zh) | 一种耦合人工智能和贝叶斯理论的洪水预报方法及系统 | |
Fernández-Ferrero et al. | Evaluation of statistical downscaling in short range precipitation forecasting | |
Ranjan et al. | ANN and GRNN-based coupled model for flood inundation mapping of the Punpun River Basin | |
Fan et al. | Explainable machine learning model for multi-step forecasting of reservoir inflow with uncertainty quantification |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |