CN115062551B - 一种基于时序神经网络的湿物理过程参数化方法 - Google Patents

一种基于时序神经网络的湿物理过程参数化方法 Download PDF

Info

Publication number
CN115062551B
CN115062551B CN202210935359.2A CN202210935359A CN115062551B CN 115062551 B CN115062551 B CN 115062551B CN 202210935359 A CN202210935359 A CN 202210935359A CN 115062551 B CN115062551 B CN 115062551B
Authority
CN
China
Prior art keywords
data
network
prediction
neural network
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210935359.2A
Other languages
English (en)
Other versions
CN115062551A (zh
Inventor
李孝杰
张�浩
吴锡
周激流
黄小猛
俞永强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu University of Information Technology
Original Assignee
Chengdu University of Information Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu University of Information Technology filed Critical Chengdu University of Information Technology
Priority to CN202210935359.2A priority Critical patent/CN115062551B/zh
Publication of CN115062551A publication Critical patent/CN115062551A/zh
Application granted granted Critical
Publication of CN115062551B publication Critical patent/CN115062551B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/28Design optimisation, verification or simulation using fluid dynamics, e.g. using Navier-Stokes equations or computational fluid dynamics [CFD]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2111/00Details relating to CAD techniques
    • G06F2111/04Constraint-based CAD
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2113/00Details relating to the application field
    • G06F2113/08Fluids
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2119/00Details relating to the type or aim of the analysis or the optimisation
    • G06F2119/14Force analysis or force optimisation, e.g. static or dynamic forces
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Computer Hardware Design (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Geometry (AREA)
  • Molecular Biology (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Fluid Mechanics (AREA)
  • Algebra (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提出了一种基于时序神经网络的湿物理过程参数化方法,方法首先基于时序预测神经网络去学习过去时刻大气状态、对流和云的动态变化关系,然后通过融合筛选这些学习到的特征来预测湿物理过程中湿度和温度变化趋势以及云水和云冰含量。最后,根据预测出的湿度变化趋势计算出当前的降水量。此外,在网络训练过程中加入了物理约束来保证该方法遵循一般的物理规律。该方法相比传统湿物理参数化方案和其他神经网络能够准确再现社区大气模式超参数版本SPCAM的模拟结果,模拟的湿物理过程中的湿度和温度变化趋势、云水和云冰含量,降水等偏差也远小于它们。

Description

一种基于时序神经网络的湿物理过程参数化方法
技术领域
本发明涉及地球科学大气环流模式计算与计算机科学交叉领域,尤其涉及一种基于时序神经网络的湿物理过程参数化方法。
背景技术
大气环流模式(GCM)是根据基本的物理定律(牛顿运动定律、质量守恒定律和热力学第一定律)而构造的一套流体力学和热力学偏微分方程组和求解方案。它们已被广泛应用于地球科学研究中,用来模拟大气环流基本性质或预测气候未来状态变化。尽管GCM在过去二十年中取得了重大进展,但大多数GCM的模拟结果仍然存在着较大的不确定性。这些不确定性主要体现在模拟降水和大气环流偏差,热带模拟误差、区域尺度气候模拟、极端事件模拟等许多方面。
现有的研究表明GCM中的这些不确定性和偏差主要归因于大气湿对流和云微物理过程(湿物理过程)的不完善参数化方案。此外,与云和对流相关的过程也是GCM中最难描述的过程之一,这些过程在空间上小到微米尺度的云核化,大到几千公里尺度的热带扰动。它们还在地球系统中的辐射收支和水文循环起着重要作用,它们与大气环流的相互作用还会影响全球能量的输送和分配,是降水预测偏差的主要来源之一。因此,在GCM中正确模拟湿物理(云和对流)过程目前物理气候系统模式的重要发展目标之一。
早期的对流参数化方案将对流热量和水分传输视被理想化为千米尺度对流单元。尽管这种方案可以定性地表示热量和水分的对流传输,以及冷凝加热,但它们不能代表许多复杂对流结构的影响(例如:对流单元自聚集或中尺度组织,导致气候模拟中存在很大的偏差。因此,一些研究人员使用云解析模型(CRM)[来解析对流中的真实的热力学过程,进而更加准确的模拟低分辨率GCM中的对流(超参数化)。随着气候模式的逐渐发展,美国国家大气研究中心在CRM的基础上开发了分辨率更高的社区大气模型的超参数化版本(SPCAM),以此来取代传统的积云对流和云微物理参数化方案。相比于传统方案,SPCAM可以采用有限体积、有限谱元、谱等 3 种动力框架实现高分辨率模拟,如热带气旋的生消过程,季风,对流的日循环,MJO等。但是,由于计算机资源的限制,目前的高分辨率模式只能在不改变低分辨率模式参数化方案的前提下进行短期的数值试验,还不能在长期气候模拟和集合预测中的应用。因此,在GCM中提出一种新颖且计算效率高的云和对流参数化方案是非常重要的。
而对流和云的机器学习(ML)参数化已被证明具有比传统参数化更好的性能。在过去几年中,基于数据驱动的神经网络已经在次网格参数化中得到了探索和实践,它们可以从高分辨率、高保真的数据集中识别和提取复杂的非线性关系,从而得到更加精确的模拟结果。Krasnopolsky等人首次提出一种基于神经网络集成技术的新方法用于开发气候和数值天气预报模式的神经网络随机对流参数化,实验结果表明,基于NN的参数能够快速模拟出NCAR CAM4中云和降水的主要特征,进一步证明了NN替代传统参数化方案的可行性。此外,为了改进气候模拟,一些研究人员开发了许多基于NN的对流和大气化学参数化方案。还有一部分研究人员将NN用于预测特定的物理量或极端事件,如:降水,云类型和热带气旋,并取得了准确的预测结果。最近,一个深度人工神经网络(NN)也成功的用于在aquaplanet配置的超参数气候模型中模拟嵌入的二维云系统解析模型。尽管基于NN开发次网格参数化方案是一种很有潜力的方法,但大多数方法还存在着欠拟合和过拟合的问题,导致得不到最佳的训练模型,得到的预测结果准确率满足不了如今的要求。此外,由于一些方法不尊重一般的物理特性(如能量守恒或动量守恒),出现了不稳定和气候漂移等缺点,造成机器学习参数化在GCM中的应用受到阻碍。
现有技术方案存在的不足:
1、耗费计算资源
随着科研人员对精度要求的不断提升(分辨率提升),当前大气环流模式中的的湿物理参数化方法会耗费大量计算资源,不符合环保的发展步伐。
2、准确率低
传统湿物理参数化方案会造车降水和大气环流模拟产生较大的误差。尽管当前已有的基于神经网络在预测模拟精度上有所提升,但还是达不到科研人员对准确率的日益提升。
3、不稳定性
现有的部分基于神经网络的湿物理参数化方法没有考虑到物理约束,得到的结果与基本物理定理不完全符合,会造成不稳定和气候漂移等缺点。
4、未考虑历史大气状态变化情况
现有的部分方案没有考虑到过去时刻大气状态、对流和云的动态变化关系,这也是导致预测结果准确率较低的原因。
发明内容
针对现有技术之不足,一种基于时序神经网络的湿物理过程参数化方法,其特征在于,所述方法基于时序预测神经网络去学习过去时刻和当前时刻大气状态、对流和云的动态变化关系,然后通过融合筛选这些学习到的特征来预测湿物理过程中湿度和温度变化趋势以及云水和云冰含量,在训练过程中引入物理约束(湿静态能量守恒)来避免预测结果产生不稳定和气候漂移,具体步骤:
步骤1:获取大气参数数据集,在服务器安装社区大气模式的超参数化版本SPCAM,然后运行SPCAM生成所需要的大气参数数据集,所述大气参数数据数据集包括第一数据集和第二数据集,第二数据集包括第一数据集输入SPCAM后输出的目标结果数据;
步骤2:将所述大气参数数据集按比例划分为训练集、验证集、测试集;
步骤3:构建并初始化湿物理参数化时序神经网络,所述参数化时序神经网络包括粗预测模块、特征融合模块和精细预测模块,将训练集中的第一数据集送入所述神经网络进行训练,具体包括:
步骤31:通过Xavier方法随机初始化所述神经网络的参数;
步骤32:随机从划分的训练数据集中选择一批次第一数据,然后对所述第一数据进行通过最大或最小标准化将其映射到0-1范围,以便进行训练;
步骤33:将步骤32标准化后的第一数据输入到粗预测模块,所述粗预测模块包括预测子网络和全连接子网络,输入数据包括第一输入数据
Figure 429836DEST_PATH_IMAGE001
和第二输入数据
Figure 487922DEST_PATH_IMAGE002
,第一输入数据
Figure 798818DEST_PATH_IMAGE001
为前面四个时间步长的数据,第二输入数据
Figure 646557DEST_PATH_IMAGE002
为当前时间步长已知的特征数据,所述预测子网络基于Transformer算法根据前面四个时间步长的数据预测出当前时间步长的粗预测结果
Figure 867454DEST_PATH_IMAGE003
,全连接子网络可以根据当前时间步长已知的特征数据模拟出当前时间步长的数据分布
Figure 221075DEST_PATH_IMAGE004
,随后将所述粗预测结果
Figure 204005DEST_PATH_IMAGE003
、第一输入数据
Figure 934063DEST_PATH_IMAGE001
中上一时间步长的数据和所述数据分布
Figure 806204DEST_PATH_IMAGE004
进行叠加拼接得到拼接数据
Figure 533989DEST_PATH_IMAGE005
步骤34:将所述拼接数据
Figure 740848DEST_PATH_IMAGE005
输入所述特征融合模块,依次进行残差操作,全局平均池化操作GAP,第一次全连接操作,ReLU激活操作,第二次全连接操作,Sigmoid激活函数操作后得到一个特征权重向量
Figure 884385DEST_PATH_IMAGE006
,随后根据所述特征权重向量
Figure 938929DEST_PATH_IMAGE006
对输入数据进行重新加权筛选出有用的特征,最终将筛选出的有用特征和输入数据
Figure 260451DEST_PATH_IMAGE005
进行跳跃连接操作得到融合细化后的特征
Figure 298814DEST_PATH_IMAGE007
步骤35:将步骤34得到的特征
Figure 714883DEST_PATH_IMAGE007
送入到所述精细预测模块中,该模块包含3个一维卷积残差块,用于提取特征
Figure 810884DEST_PATH_IMAGE007
中不同垂直剖面的特征并得到出最终预测结果
Figure 677209DEST_PATH_IMAGE008
步骤36:分别计算所述粗预测结果
Figure 812655DEST_PATH_IMAGE003
、所述最终预测结果
Figure 422628DEST_PATH_IMAGE008
与所述训练集中的第二数据集中的目标结果数据的L2损失并相加得到第一损失,计算所述最终预测结果
Figure 812283DEST_PATH_IMAGE008
和目标结果数据的物理约束损失,即引入湿静态能量守恒,将第一损失和物理约束损失相加得到的值传入网络中进行反向传播,调整网络中的参数;
步骤37:判断所述训练数据集是否都已经送入所述时序神经网络中进行训练,若是则跳转至步骤38,若否跳转至步骤32;
步骤38:将验证集送入网络进行验证,并判断网络是否收敛,若是,则保存网络参数并结束训练,若否,则跳转至步骤32进行下一轮训练;
步骤4:取出验证过程中表现最佳的网络,然后将测试集依次送入该网络进行测试,并对测试结果进行反标准化得到最终结果。
与现有技术相比,本发明的有益效果在于:
1、本发明的基于时序神经网络设计出了一种新的网络结构来解决湿物理过程参数化中存在的问题,所设计的湿物理参数化神经网络考虑并学习到历史时刻大气状态、对流和云的动态变化关系,得到粗糙的预测结果,有助于提高预测结果的精度和准确度。
2、采用了特征融合模块和精细预测模块来帮助网络得到更接近于真实目标的预测结果。特征融合模块可以根据输入特征计算出一个特征权重向量,该权重向量将输入特种重新加权,抑制无用的特征信息,进而筛选出只包含有用信息的特征送入下一模块进行处理。精细预测模块可以通过其包含的一维卷积残差块提取输入数据中不同维度的特征信息,即不同垂直剖面数据,进而预测出最终的结果。
3、在损失项中引入了物理约束,即湿静态能量守恒,保证了神经网络在训练过程中遵循基本物理定律,避免不稳定和气候漂移等缺点的产生。
4、本发明的神经网络经过训练完成后,对新的气象数据可以快速得到预测结果,相对于传统方案耗费更低的计算资源,符合节能发展的步伐。
附图说明
图1是本发明所提出网络的结构示意图;
图2是全球范围内降水模拟结果的平均值可视化结果对比图;
图3是纬度-压力横截面的湿度变化趋势模拟结果的平均值可视化结果对比图;
图4是纬度-压力横截面的温度变化趋势模拟结果的平均值可视化结果对比图;
图5是纬度-压力横截面的云水含量模拟结果的平均值可视化结果对比图;
图6是纬度-压力横截面的云冰含量模拟结果的平均值可视化结果对比图;
图7是纬度-压力横截面的各属性模拟结果的方差可视化结果对比图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明了,下面结合具体实施方式并参照附图,对本发明进一步详细说明。应该理解,这些描述只是示例性的,而并非要限制本发明的范围。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本发明的概念。
本发明涉及地球科学大气环流模式计算与计算机科学交叉领域,尤其涉及一种基于时序神经网络的湿物理过程参数化方法,它主要解决现有湿物理过程参数化方案占用计算资源高和精度低的问题。当前的大气环流模式中的湿物理参数化方案会造成模拟降水和大气环流偏差,并且运行过程中会占用较大的计算资源。而随着机器学习的不断发展,基于神经网络的湿物理参数化方案被证明比传统参数化具有更好的性能,占用计算资源少,精度相对提升。但是,这些基于神经网络的湿物理参数化方案所得到的预测精度还远达不到实时精准预测的目的。
针对现有方案存在的不足,本发明提出了一种基于时序神经网络的湿物理过程参数化方法,图1为本发明所提出的参数化神经网络结构示意图。它的输入为第一输入数据
Figure 115088DEST_PATH_IMAGE001
和第二输入数据
Figure 472251DEST_PATH_IMAGE002
,输出为
Figure 885915DEST_PATH_IMAGE009
,具体内容如表1所示。其中第一输入数据
Figure 690929DEST_PATH_IMAGE001
的尺寸为
Figure 774423DEST_PATH_IMAGE010
,包括前面4个时间步长30层剖面的8个不同属性,具体为:大尺度的湿度变化趋势
Figure 743516DEST_PATH_IMAGE011
和温度变化趋势
Figure 321390DEST_PATH_IMAGE012
、湿度
Figure 325118DEST_PATH_IMAGE013
、温度T、小尺度的湿度变化趋势
Figure 641830DEST_PATH_IMAGE014
和温度变化趋势
Figure 957274DEST_PATH_IMAGE015
、云水
Figure 712740DEST_PATH_IMAGE016
和云冰
Figure 977499DEST_PATH_IMAGE017
含量,并堆叠了3层标准化的标量在剖面维度,具体为:地表感热
Figure 419107DEST_PATH_IMAGE018
和潜热通量
Figure 362792DEST_PATH_IMAGE019
,地表压力
Figure 797316DEST_PATH_IMAGE020
,如表1所示。
表1输入输出数据
Figure 510057DEST_PATH_IMAGE022
注:
Figure 89943DEST_PATH_IMAGE023
代表当前时间步长,
Figure 520924DEST_PATH_IMAGE024
分别代表前面四个时间步长。带z的变量是30层垂直剖面,不带“z”的变量是根据其时间步长堆叠在每个剖面下方的标量。原始数据除以对应标准化单位,得到归一化后的数值。
第二输入数据
Figure 493559DEST_PATH_IMAGE025
的尺寸为
Figure 326386DEST_PATH_IMAGE026
,包括当前时间步长30层剖面的4个不同属性,具体为:大尺度的湿度变化趋势
Figure 844217DEST_PATH_IMAGE027
和温度变化趋势
Figure 762495DEST_PATH_IMAGE028
、湿度
Figure 335559DEST_PATH_IMAGE029
、温度
Figure 881947DEST_PATH_IMAGE030
,并堆叠了3层标准化的标量在剖面维度,具体为:地表感热
Figure 210160DEST_PATH_IMAGE031
和潜热通量
Figure 959941DEST_PATH_IMAGE032
,地表压力
Figure 664592DEST_PATH_IMAGE020
,输出
Figure 832530DEST_PATH_IMAGE033
尺寸为
Figure 331645DEST_PATH_IMAGE034
,为当前时刻不同垂直剖面(共30层)的湿物理过程中的湿度变化趋势(
Figure 834301DEST_PATH_IMAGE035
)与温度变化趋势(
Figure 998435DEST_PATH_IMAGE036
),以及云水(
Figure 394782DEST_PATH_IMAGE037
)和云冰(
Figure 940163DEST_PATH_IMAGE038
)含量。后续步骤中的降水量根据湿度趋势计算出来。注:表1中带“z”的变量为30层垂直剖面,不带“z”的变量为根据时间步长堆叠在每个剖面下方的标量。第3列为步骤32数据标准化所用归一化因子。
本发明所提出的参数化方法具体包括如下步骤:
步骤1:获取大气参数数据集,在服务器安装社区大气模式的超参数化版本(Community Atmosphere Model),简称SPCAM。然后运行SPCAM生成所需要的大气参数数据集,所述大气参数数据数据集包括第一数据集和第二数据集,所述第一数据集的第一数据包括地球表面不同垂直剖面的湿度、温度、大尺度的温度和湿度变化趋势,小尺度的温度和湿度变化趋势、云水和云冰含量等参数。此外,还包括地表感热通量和潜热通量、地表压力等数据。第二数据集包括第一数据集输入SPCAM后输出的目标结果数据;目标结果数据的尺寸是
Figure 54750DEST_PATH_IMAGE039
,为当前时刻不同垂直剖面(共30层)的湿物理过程中的湿度变化趋势(
Figure 196144DEST_PATH_IMAGE035
)与温度变化趋势(
Figure 712576DEST_PATH_IMAGE036
),以及云水(
Figure 225597DEST_PATH_IMAGE037
)和云冰(
Figure 952113DEST_PATH_IMAGE038
)含量。
步骤2:将所述大气参数数据集按比例划分为训练集、验证集、测试集。
步骤3:构建并初始化湿物理参数化时序神经网络,所述参数化时序神经网络包括粗预测模块、特征融合模块和精细预测模块,将训练集中的参数数据送入所述神经网络进行训练,具体包括:
步骤31:构建神经网络并通过Xavier方法随机初始化网络中的参数。
步骤32:随机从划分的训练数据集中选择一批次数据,然后对这些数据进行通过最大或最小标准化将其映射到0-1范围,以便进行训练;
步骤33:将步骤32标准化后的数据输入到粗预测模块,所述粗预测模块包括预测子网络和全连接自网络,输入数据包括第一输入数据
Figure 536678DEST_PATH_IMAGE040
和第二输入数据
Figure 517404DEST_PATH_IMAGE025
;第一输入数据为前面四个时间步长的数据,第二输入数据
Figure 529222DEST_PATH_IMAGE041
为当前时间步长已知的特征数据,所述预测子网络基于Transformer算法根据前面4个时间步长的数据预测出当前时间步长的粗预测结果
Figure 967201DEST_PATH_IMAGE042
,全连接子网络可以根据当前时间步长已知的特征数据模拟出当前时间步长的数据分布
Figure 355457DEST_PATH_IMAGE043
,由于时序预测任务中前一时间步长对当前时刻预测的影响最大,随后将所述粗预测结果
Figure 456268DEST_PATH_IMAGE042
、第一输入数据
Figure 638988DEST_PATH_IMAGE040
中上一时间步长的数据和所述数据分布
Figure 340097DEST_PATH_IMAGE044
进行叠加拼接得到拼接数据
Figure 938568DEST_PATH_IMAGE045
步骤34:将所述拼接数据
Figure 18520DEST_PATH_IMAGE045
输入所述特征融合模块,依次进行残差操作,全局平均池化操作GAP,第一次全连接操作,ReLU激活操作,第二次全连接操作,Sigmoid激活函数操作后得到一个特征权重向量
Figure 263819DEST_PATH_IMAGE046
,随后根据所述特征权重向量
Figure 796431DEST_PATH_IMAGE046
对输入数据进行重新加权筛选出有用的特征,通过将输入数据和权重向量相乘操作进行,最终将筛选出的有用特征和输入数据
Figure 401856DEST_PATH_IMAGE045
进行跳跃连接操作会得到融合细化后的特征
Figure 336314DEST_PATH_IMAGE047
特征融合模块依次采用全局平均池化(GAP),全连接(FC),和激活函数(ReLU和Sigmoid)等操作学习生成一个特征权重向量,然后利用这个特征权重向量对前一模块叠加的特征进行重新加权,将两者相乘,无用信息的权重低,抑制无用信息,尽可能的传递有用的信息到下一个模块,以便得出更加精确的预测结果。
步骤35:将步骤34得到的所述特征
Figure 251049DEST_PATH_IMAGE047
送入到所述精细预测模块中,该模块包含3个一维卷积残差块,用于提取所述特征
Figure 208641DEST_PATH_IMAGE047
中不同垂直剖面的特征并得到出最终预测结果
Figure 476811DEST_PATH_IMAGE033
步骤36:分别计算所述粗预测结果
Figure 157453DEST_PATH_IMAGE042
、所述最终预测结果
Figure 118456DEST_PATH_IMAGE048
与所述训练集中的目标结果数据的L2损失并相加得到第一损失。目标结果数据是前面制作的数据集中的一部分,仅用于验证输出结果的准确度,随后,计算
Figure 235448DEST_PATH_IMAGE033
和目标结果数据的物理约束损失,即湿静态能量守恒,将第一损失和物理约束损失相加得到的值传入网络中进行反向传播,调整网络中的参数,物理约束损失数学表达式如下:
Figure 307309DEST_PATH_IMAGE049
其中,
Figure 606572DEST_PATH_IMAGE050
Figure 145001DEST_PATH_IMAGE051
分别代表最终预测结果
Figure 405081DEST_PATH_IMAGE033
和目标结果数据的湿静态能量h变化,目标结果数据源于SPCAM模拟的数据。在损失函数中引入了物理约束来避免预测结果产生不稳定和气候漂移等缺点。
步骤37:判断是否所述训练数据集都已经送入所述神经网络中进行训练,若是则跳转至步骤38,若否跳转至步骤32。
步骤38:将验证集送入网络进行验证,并判断网络是否收敛。若是,则保存网络参数并结束训练,若否,则跳转至步骤32进行下一轮训练。
步骤4:取出验证过程中表现最佳的网络,然后将测试集依次送入该网络进行测试,并对测试结果进行反标准化得到最终结果。
预测结果包含30层垂直剖面中的湿度和温度变化趋势(湿物理过程)、云水和云冰含量。进一步根据湿度变化趋势计算出降水量。
为了充分证明本发明相对于其它方法的优益性,将本发明和其他方法在同一个测试集上进行了定量和视觉上的比较。定量评价指标包括均方根误差(RMSE)、决定系数(
Figure 641153DEST_PATH_IMAGE052
)、偏差(Bias),结果如表2所示。其中RMSE越低越好,
Figure 670289DEST_PATH_IMAGE052
越接近于1越好,偏差越接近于0越好。由于本发明方法和ResCu方法在定量比较上明显优于CBRAIN,因此只对ResCU和本发明方法在视觉上进行对比,结果如图2至图6所示。其中,图2是全球范围内降水模拟结果的平均值可视化结果对比图,图2中的a)为SPCAM的模拟结果,图2中的b)为ResCu方法的预测结果,图2中的d)为该发明所提方法的预测结果,图2中的c)为b)图减去a)图的可视化结果,图2中的e)为d)图减去a)图的可视化结果。图3至图6中的a)为SPCAM在纬度-压力横截面所有模拟结果的均值可视化图像,b)为ResCu方法在纬度-压力横截面所有预测结果的均值可视化图像,d)为本发明所提方法在纬度-压力横截面所有预测结果的均值可视化图像,c)为ResCu方法预测结果减去SPCAM模拟结果的平均纬度-压力横截面可视化图像,e)为该发明所提方法结果减去SPCAM模拟结果的平均纬度-压力横截面可视化图像。
表2与其他方法的定量对比结果
Figure 582881DEST_PATH_IMAGE054
表2中展示了不同方法包括CBRAIN方法、ResCu方法和本发明的方法,对湿物理过程中的湿度变化趋势(
Figure 64678DEST_PATH_IMAGE035
)和温度变化趋势(
Figure 602975DEST_PATH_IMAGE036
)以及云水(
Figure 486618DEST_PATH_IMAGE037
)、云冰(
Figure 835691DEST_PATH_IMAGE038
)、降水(
Figure 804784DEST_PATH_IMAGE055
)含量的预测结果进行了定量对比。这些需要预测的结果存在于不同气压共30个垂直剖面上。可以从表2明显看到不同结果的决定系数(
Figure 382658DEST_PATH_IMAGE052
)都达到了最高,说明该发明的结果与真实结果拟合程度最高最相关。同样,本发明方法也都取得最低的均方误差(RMSE),说明本发明方法得到的结果误差最低,从而说明准确率最高。此外,除了降水的偏差(Bias)略低于CBRAIN外,其他预测结果的偏差都最接近于0,表明本发明方法的预测稳定性更好,预测结果的分布最接近于真实结果。因此,该发明所提方法在定量比较上取得了最佳的效果。
图2是全球范围内降水模拟结果的平均值可视化结果对比图。与图2中的b)的ResCu方法相比,图2中的d)本发明方法预测的年平均降水量在全球范围内与图2中的a)SPCAM模拟的结果更为接近。在南美洲北部和青藏高原,ResCu的预测结果与SPCAM得到的结果有很大的偏差,偏差可视化图像如图2中的c)所示。本发明方法更好地捕获到了降水的主要特征,如热带季风系统、热带间辐合区(ITCZ)和南太平洋辐合区(SPCZ)。从年平均降水量的误差上可视化结果上看,对比图2中的c)和图2中的e),图2中的e)为本发明方法的结果与SPCAM得到的模拟结果相减得到的平均偏差可视化图像,本发明方法的预测也比ResCu的预测更接近SPCAM的模拟结果,取得了更低的偏差,e)图的数值明显小于c)图的数值,表明取得了更好的性能。
图3是纬度-压力横截面的湿度变化趋势模拟结果的平均值可视化结果对比图,图3中的a)是SPCAM得到的模拟结果,图3中的b)是ResCu方法的结果,图3中的c)是ResCu与SPCAM预测结果的平均偏差可视化图像,图3中的d)是本发明方法的结果,图3中的e)本发明方法与SPCAM预测结果的平均偏差可视化图像。
图4是纬度-压力横截面的温度变化趋势模拟结果的平均值可视化结果对比图,图4中的a)是SPCAM得到的结果,图4中的b)是ResCu方法的结果,图4中的c)是ResCu与SPCAM预测结果的平均偏差可视化图像,图4中的d)是本发明方法,图4中的e)本发明方法与SPCAM预测结果的平均偏差可视化图像。
图3和图4显示了湿度变化趋势、温度变化趋势的平均纬度-压力横截面可视化图像,以及本发明的方法与ResCu的比较结果。与ResCu相比,本发明的方法很好地再现了SPCAM中由对流和大规模凝结产生的绝热干燥和加热。通过比较图3中的c)和图3中的e),本发明方法预测的湿度变化趋势明显优于ResCu,特别是在高压区。与ResCu相比,本发明方法加热预测与SPCAM模拟的偏差也相对稳定。
图5是纬度-压力横截面的云水含量模拟结果的平均值可视化结果对比图。图5中的a)是SPCAM得到的结果,图5中的b)是ResCu方法的结果,图5中的c)是ResCu与SPCAM预测结果的平均偏差可视化图像,图5中的d)是本发明方法,图5中的e)本发明方法与SPCAM预测结果的平均偏差可视化图像。
图6是纬度-压力横截面的云冰含量模拟结果的平均值可视化结果对比图。图6中的a)是SPCAM得到的结果,图6中的b)是ResCu方法的结果,图6中的c)是ResCu与SPCAM预测结果的偏差可视化图像,图6中的d)是本发明方法,图6中的e)本发明方法与SPCAM预测结果的偏差可视化图像。
图5和图6分别显示了平均云水和云冰的纬度-高度截面对比结果。可以观察到,ResCu在云水和云冰数值较大的地区会造成明显的误差,如图5中的c)和图6中的c)所示。相比之下,本发明方法几乎在所有地区都能得到稳定的预报,与SPCAM模拟的差异非常小,如图5中的e)和图6中的e)。除了时间均值场,研究人员还使用预测结果的时间方差来衡量神经网络参数化的性能。
图7是在纬度-压力横截面下各属性的所有预测结果的方差可视化结果对比图。图7第一行和第二行分别为湿物理过程中的湿度和温度变化趋势属性,第三行和第四行分别为云水和云冰含量属性。
图7中第1列为SPCAM所有模拟结果的方差可视化图像,即图7中的a)、d)、h)、k),第2列为ResCu在测试集上所有预测结果的方差可视化图像,即图7中的b)、e)、i)、l),第3列为该发明在测试集上所有所提方法预测结果的方差可视化图像,即图7中的c)、f)、j)、m)。
图7显示了SPCAM、ResCu和本发明方法的纬度-压力横截面各属性预测结果的方差可视化对比图。直观地看到,本发明方法比ResCu更好地再现了SPCAM模拟的方差,即第3列相比于第2列更接近于第1列。
除了上述对比实验结果外,还对该发明所提方法的不同模块进行了消融研究来证明不同模块的有效性,实验结果如表3所示。Full Network代表该发明所提的完整神经网络结构,M1、M2、M3分别代表完整网络结果分别去除粗预测模块、特征融合模块、精细预测模块的网络配置。从表中结果可以明显看到,当去除粗预测模块时,模型的各项评价指标均取得了较差的结果,这表明本发明方法提出的粗预测模块有效提取到了历史大气、对流和云的状态之间的复杂杂变化关系,从而为后续精确预测湿物理过程中各项变量提供了有效的信息。通过对比M2和Full Network可以发现,特征融合模块对于有效特征的筛选起到了一定的作用。它抑制了不必要的特征,只允许有用的特征传入下一阶段,从而有效提升了预测结果的准确率(对比配置M2与配置Full Network的指标结果)。对比配置M3和完整网络的指标结果表明,精细预测模块也有助于提升网络的准确率。这是因为它内部的一维卷积残差块可以有效提取不同垂直剖面的特征,帮助有效预测结果。此外,实验发现在完整网络配置(Full Network)的降水量预测上性能上略差与M1、M2、M3配置,但Full Network配置的整体性能优于M1、M2、M3配置,且这种情况不影响该发明相对于同类型方法的优越性(如前文的定量和可视化对比结果所示)。
表3消融实验定量对比结果
Figure 58490DEST_PATH_IMAGE057
需要注意的是,上述具体实施例是示例性的,本领域技术人员可以在本发明公开内容的启发下想出各种解决方案,而这些解决方案也都属于本发明的公开范围并落入本发明的保护范围之内。本领域技术人员应该明白,本发明说明书及其附图均为说明性而并非构成对权利要求的限制。本发明的保护范围由权利要求及其等同物限定。

Claims (1)

1.一种基于时序神经网络的湿物理过程参数化方法,其特征在于,所述方法基于时序预测神经网络去学习过去时刻和当前时刻大气状态、对流和云的动态变化关系,然后通过融合筛选这些学习到的特征来预测湿物理过程中湿度和温度变化趋势以及云水和云冰含量,在训练过程中引入物理约束来避免预测结果产生不稳定和气候漂移,具体步骤:
步骤1:获取大气参数数据集,在服务器安装社区大气模式的超参数化版本SPCAM,然后运行SPCAM生成所需要的大气参数数据集,所述大气参数数据集包括第一数据集和第二数据集,第二数据集包括第一数据集输入SPCAM后输出的目标结果数据;
步骤2:将所述大气参数数据集按比例划分为训练集、验证集、测试集;
步骤3:构建并初始化湿物理参数化时序神经网络,所述参数化时序神经网络包括粗预测模块、特征融合模块和精细预测模块,将训练集中的第一数据集送入所述神经网络进行训练,具体包括:
步骤31:通过Xavier方法随机初始化所述神经网络的参数;
步骤32:随机从划分的训练数据集中选择一批次第一数据,然后对所述第一数据进行通过最大或最小标准化将其映射到0-1范围,以便进行训练;
步骤33:将步骤32标准化后的第一数据输入到粗预测模块,所述粗预测模块包括预测子网络和全连接子网络,输入数据包括第一输入数据
Figure 42507DEST_PATH_IMAGE002
和第二输入数据
Figure 967170DEST_PATH_IMAGE004
,第一输入数据
Figure 421941DEST_PATH_IMAGE002
为前面四个时间步长的数据,第二输入数据
Figure 382199DEST_PATH_IMAGE004
为当前时间步长已知的特征数据,所述预测子网络基于Transformer算法根据前面四个时间步长的数据预测出当前时间步长的粗预测结果
Figure 266410DEST_PATH_IMAGE006
,全连接子网络可以根据当前时间步长已知的特征数据模拟出当前时间步长的数据分布
Figure 967169DEST_PATH_IMAGE008
,随后将所述粗预测结果
Figure 262232DEST_PATH_IMAGE006
、第一输入数据
Figure 277112DEST_PATH_IMAGE002
中上一时间步长的数据和所述数据分布
Figure 343726DEST_PATH_IMAGE008
进行叠加拼接得到拼接数据
Figure 636559DEST_PATH_IMAGE010
步骤34:将所述拼接数据
Figure 534763DEST_PATH_IMAGE010
输入所述特征融合模块,依次进行残差操作,全局平均池化操作GAP,第一次全连接操作,ReLU激活操作,第二次全连接操作,Sigmoid激活函数操作后得到一个特征权重向量
Figure 246674DEST_PATH_IMAGE012
,随后根据所述特征权重向量
Figure 928583DEST_PATH_IMAGE012
对输入数据进行重新加权筛选出有用的特征,最终将筛选出的有用特征和输入数据
Figure 767882DEST_PATH_IMAGE010
进行跳跃连接操作得到融合细化后的特征
Figure 17030DEST_PATH_IMAGE014
步骤35:将步骤34得到的特征
Figure 701608DEST_PATH_IMAGE014
送入到所述精细预测模块中,该模块包含3个一维卷积残差块,用于提取特征
Figure 951188DEST_PATH_IMAGE014
中不同垂直剖面的特征并得到出最终预测结果
Figure 430230DEST_PATH_IMAGE016
步骤36:分别计算所述粗预测结果
Figure 556887DEST_PATH_IMAGE006
、所述最终预测结果
Figure 200750DEST_PATH_IMAGE016
与所述训练集中的第二数据集中的目标结果数据的L2损失并相加得到第一损失,计算所述最终预测结果
Figure 842602DEST_PATH_IMAGE016
和目标结果数据的物理约束损失,即引入湿静态能量守恒,将第一损失和物理约束损失相加得到的值传入网络中进行反向传播,调整网络中的参数;
步骤37:判断所述训练数据集是否都已经送入所述时序神经网络中进行训练,若是则跳转至步骤38,若否跳转至步骤32;
步骤38:将验证集送入网络进行验证,并判断网络是否收敛,若是,则保存网络参数并结束训练,若否,则跳转至步骤32进行下一轮训练;
步骤4:取出验证过程中表现最佳的网络,然后将测试集依次送入该网络进行测试,并对测试结果进行反标准化得到最终结果。
CN202210935359.2A 2022-08-05 2022-08-05 一种基于时序神经网络的湿物理过程参数化方法 Active CN115062551B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210935359.2A CN115062551B (zh) 2022-08-05 2022-08-05 一种基于时序神经网络的湿物理过程参数化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210935359.2A CN115062551B (zh) 2022-08-05 2022-08-05 一种基于时序神经网络的湿物理过程参数化方法

Publications (2)

Publication Number Publication Date
CN115062551A CN115062551A (zh) 2022-09-16
CN115062551B true CN115062551B (zh) 2022-11-04

Family

ID=83207518

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210935359.2A Active CN115062551B (zh) 2022-08-05 2022-08-05 一种基于时序神经网络的湿物理过程参数化方法

Country Status (1)

Country Link
CN (1) CN115062551B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116909233B (zh) * 2023-07-28 2024-05-07 安徽华容药品包装有限公司 药用玻璃瓶的生产方法及其系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108734278A (zh) * 2018-05-23 2018-11-02 天津市气象科学研究所 一种基于多重神经网络逐步逼近法的低能见度预报方法
CN112734017A (zh) * 2021-04-01 2021-04-30 成都信息工程大学 一种降水量预测模型的建立方法
CN114330120A (zh) * 2021-12-28 2022-04-12 武汉大学 一种基于深度神经网络预测24小时pm2.5浓度的方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10829236B2 (en) * 2018-06-22 2020-11-10 Pratt & Whitney Canada Corp. Inclement weather detection in aircraft
CN110929603B (zh) * 2019-11-09 2023-07-14 北京工业大学 一种基于轻量级卷积神经网络的天气图像识别方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108734278A (zh) * 2018-05-23 2018-11-02 天津市气象科学研究所 一种基于多重神经网络逐步逼近法的低能见度预报方法
CN112734017A (zh) * 2021-04-01 2021-04-30 成都信息工程大学 一种降水量预测模型的建立方法
CN114330120A (zh) * 2021-12-28 2022-04-12 武汉大学 一种基于深度神经网络预测24小时pm2.5浓度的方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Image segmentation of nasopharyngeal carcinoma using 3D CNN with long-range skip connection and multi-scale feature pyramid;Xiaojie Li等;《Springer》;20200129;第24卷;12671–12680 *
一种有效求解含有不连续"开关"过程的变分资料;郑琴等;《中国科学: 地球科学》;20120315;第42卷(第3期);458-470 *
基于Dense Connected深度卷积神经网络的自动视网膜血管分割方法;李孝杰等;《成都信息工程大学学报》;20181015;第33卷(第5期);525-530 *
我国暴雨形成机理及预报方法研究进展;高守亭等;《大气科学》;20180715;第42卷(第04期);833-846 *

Also Published As

Publication number Publication date
CN115062551A (zh) 2022-09-16

Similar Documents

Publication Publication Date Title
Gagne et al. Machine learning for stochastic parameterization: Generative adversarial networks in the Lorenz'96 model
Luo et al. A fast non-negative latent factor model based on generalized momentum method
Zhu et al. Forming a new small sample deep learning model to predict total organic carbon content by combining unsupervised learning with semisupervised learning
CN112446591B (zh) 一种用于学生综合能力评价的零样本评价方法
CN113299354A (zh) 基于Transformer和增强交互型MPNN神经网络的小分子表示学习方法
Wang et al. Non‐local parameterization of atmospheric subgrid processes with neural networks
CN110837921A (zh) 基于梯度提升决策树混合模型的房地产价格预测研究方法
CN115062551B (zh) 一种基于时序神经网络的湿物理过程参数化方法
Leer et al. Fast flow field estimation for various applications with a universally applicable machine learning concept
CN115512785A (zh) 基于注意力机制的三维蛋白质-配体活性预测方法
Tey et al. Identification of vehicle suspension parameters by design optimization
Li et al. Enhancing the stability of a global model by using an adaptively implicit vertical moist transport scheme
Li et al. A new multi-fidelity surrogate modelling method for engineering design based on neural network and transfer learning
Xiao et al. Adaptive learning‐based projection method for smoke simulation
Wang et al. A four‐dimensional variational constrained neural network‐based data assimilation method
CN116415700A (zh) 一种结合人工智能的风能数值预报方法及其装置
Yang et al. Fast flow field prediction of three-dimensional hypersonic vehicles using an improved Gaussian process regression algorithm
Fu et al. Assessment and prediction of regional climate based on a multimodel ensemble machine learning method
Li et al. Building thermal dynamics modeling with deep transfer learning using a large residential smart thermostat dataset
Akbari et al. Blending machine learning and sequential data assimilation over latent spaces for surrogate modeling of Boussinesq systems
CN114692529B (zh) 一种cfd高维响应的不确定度量化方法、装置、计算机设备
Wang et al. Efficient climate simulation via machine learning method
CN112307670A (zh) 基于bagging集成神经网络的压水堆堆芯参数预测模型设计方法
CN111651887A (zh) 一套数值模型参数不确定性分析方法
Zeng et al. A parallel adaptive sampling strategy to accelerate the sampling process during the modeling of a Kriging metamodel

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant