CN114819289A - 预测方法、训练方法、装置、电子设备及存储介质 - Google Patents

预测方法、训练方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN114819289A
CN114819289A CN202210348989.XA CN202210348989A CN114819289A CN 114819289 A CN114819289 A CN 114819289A CN 202210348989 A CN202210348989 A CN 202210348989A CN 114819289 A CN114819289 A CN 114819289A
Authority
CN
China
Prior art keywords
data
pollutant
meteorological
air quality
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210348989.XA
Other languages
English (en)
Inventor
许睿
刘相阳
万航
李建
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guilin University of Electronic Technology
Original Assignee
Guilin University of Electronic Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guilin University of Electronic Technology filed Critical Guilin University of Electronic Technology
Priority to CN202210348989.XA priority Critical patent/CN114819289A/zh
Publication of CN114819289A publication Critical patent/CN114819289A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06395Quality analysis or management

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Data Mining & Analysis (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Development Economics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Operations Research (AREA)
  • Computational Linguistics (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Software Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Educational Administration (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Game Theory and Decision Science (AREA)
  • Health & Medical Sciences (AREA)
  • Marketing (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请公开了一种空气质量的预测方法、空气质量的预测装置、训练方法、电子设备以及存储介质。空气质量的预测方法包括:获取预定区域内的多个监测点在预定时间段的污染物数据和气象数据;对污染物数据和气象数据预处理,以生成污染物时序数据和气象时序数据;通过空气质量预测模型对污染物时序数据和气象时序数据进行处理,以得到目标监测点在目标时间段的预测结果;空气质量预测模型包括克里金插值模型和深度学习模型。如此,得到的空气质量预测结果较为准确。

Description

预测方法、训练方法、装置、电子设备及存储介质
技术领域
本申请涉及环境领域,特别涉及一种空气质量的预测方法、预测装置、空气质量预测模型的训练方法、电子设备及计算机可读存储介质。
背景技术
区域大气污染物的空间分布表示,是研究大范围大气污染与管控大气污染的关键。相关技术中,克里金插值模型被广泛应用于大气污染的空间分布预测。然而,在区域大气污染物空间分布预测应用中,由于受大气湍流复杂性影响,传统克里金插值模型预测效果较差,并且,存在核心算法与大气污染机理不符的问题。因此,如何提升区域大气污染物空间分布预测的准确度成了亟待解决的问题。
发明内容
有鉴于此,本申请提供一种空气质量的预测方法、预测装置、空气质量预测模型的训练方法、电子设备及非易失性计算机可读存储介质。
本申请实施方式的空气质量的预测方法包括:
获取预定区域内的多个监测点在预定时间段的污染物数据和气象数据;
对所述污染物数据和气象数据预处理,以生成污染物时序数据和气象时序数据;
通过空气质量预测模型对所述污染物时序数据和所述气象时序数据进行处理,以得到目标监测点在目标时间段的预测结果;所述空气质量预测模型包括克里金插值模型和深度学习模型。
在某些实施方式中,所述通过空气质量预测模型对所述时序数据进行处理,以得到目标监测点在目标时间段的预测结果,包括:
通过所述克里金插值模型根据所述污染物时序数据得到每个所述监测点的污染物预测数据;
根据所述污染物预测数据与所述污染物时序数据计算得到误差序列;
将所述误差序列以及所述气象时序数据、所述目标监测点的污染物时序数据输入至所述深度学习模型进行处理,以得到半方差矩阵;
将所述半方差矩阵作为所述克里金插值模型的半方差函数的拟合结果,以根据所述污染物时序数据计算所述目标监测点的预测结果。
在某些实施方式中,所述对所述污染物数据和气象数据预处理,以生成污染物时序数据和气象时序数据,包括:
分别删除所述污染物数据、所述气象数据中的错误数据和全天缺失数据;
分别利用所述污染物数据、所述气象数据的平均值填充局部缺失数据;及
分别采用拉依达准则剔除所述污染物数据、所述气象数据中的异常数据,以得到所述污染物时序数据和所述气象时序数据。
在某些实施方式中,所述通过空气质量预测模型对所述所述时序数据和所述气象时序数据进行处理,以得到目标监测点在目标时间段的预测结果之前,所述空气质量的预测方法还包括:
归一化所述污染物时序数据和所述气象时序数据。
在某些实施方式中,所述气象数据包括大气温度、湿度、风速、气压、雨量和风向。
在某些实施方式中,所述污染物包括PM2.5、O3、CO、PM10、SO2和NO2中的至少一种。
本申请实施方式的空气质量预测模型的训练方法,用于训练得到上述的空气质量预测模型,所述训练方法包括:
获取多个监测点采集的历史污染物数据和历史气象数据;
通过原始克里金插值模型对所述历史污染物数据进行克里金插值计算,得到历史污染物预测数据;
根据所述历史污染物数据和所述历史污染物预测数据计算得到历史误差序列;
根据所述历史污染物数据、历史气象数据和所述历史误差序列对循环神经网络进行训练以得到所述深度学习模型;
将所述深度学习模型作为所述原始克里金插值模型的半方差函数以得到克里金插值优化模型;
根据所述历史污染物数据和历史气象数据对所述克里金插值优化模型训练以得到所述空气质量预测模型。
在某些实施方式中,所述根据所述历史污染物数据和历史气象数据对所述克里金插值优化模型训练以得到所述空气质量预测模型,包括;
将所述历史污染物数据和历史气象数据分为训练样本和验证样本;
利用所述训练样本对所述克里金插值优化模型训练以得到历史预测结果;
根据所述验证样本和所述历史预测结果对所述深度学习模型中的时间步长和每层神经元数量等超参数进行调整寻优,以得到训练好的所述空气质量预测模型。
本申请实施方式的空气质量的预测装置,包括:
获取模块,用于获取预定区域内多个监测点在预定时间段的污染物数据和气象数据;
预处理模块,用于对所述污染物数据和气象数据预处理,以生成污染物时序数据和气象时序数据;
预测模块,通过空气质量预测模型对所述污染物时序数据和所述气象时序数据进行处理,以得到目标监测点在目标时间段的预测结果;所述空气质量预测模型包括克里金插值模型和深度学习模型。
本申请实施方式的电子设备,包括处理器和存储器;所述存储器中存储有计算机程序,当所述计算机程序被所述处理器执行时,使得所述处理器执行所述的空气质量的预测方法以及执行所述的空气质量预测模型的训练方法。
本申请实施方式的非易失性计算机可读存储介质,包括计算机程序,当所述计算机程序被所述处理器执行时,使得所述处理器执行所述的空气质量的预测方法以及执行所述的空气质量预测模型的训练方法。
本申请实施方式的空气质量的预测方法、预测装置、训练方法、电子设备及计算机可读存储介质中,通过获取到预定区域内多个监测点在预定时间段的污染物数据以及气象数据并经预处理后,输入空气质量预测模型进行处理,得到目标监测点在目标时间段的空气质量预测结果,如此,不仅考虑了污染物的时间依赖性,并且气象、地理和其他因素也被考虑,区域大气污染传输机理得以表达,空间物理属性与克里金插值被较完善的结合,从而得到的空气质量预测结果较为准确,提升了对空气质量的预测精度。
本申请的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。
附图说明
本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1是本申请某些实施方式的空气质量的预测方法的流程示意图;
图2是本申请某些实施方式的空气质量的预测装置的模块示意图;
图3是本申请某些实施方式的空气质量的预测方法的场景示意图;
图4-6是本申请某些实施方式的空气质量的预测方法的流程示意图;
图7是本申请某些实施方式的空气质量预测模型的训练方法的流程示意图;
图8是本申请某些实施方式的空气质量预测模型的训练装置的模块示意图;
图9是本申请某些实施方式的空气质量预测模型的训练方法的流程示意图。
具体实施方式
下面详细描述本申请的实施例,实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本申请,而不能理解为对本申请的限制。
请参阅图1,本申请提供一种空气质量的预测方法,包括:
01,获取预定区域内的多个监测点在预定时间段的污染物数据和气象数据;
02,对污染物数据和气象数据预处理,以生成污染物时序数据和气象时序数据;
03,通过空气质量预测模型对污染物时序数据和气象时序数据进行处理,以得到目标监测点在目标时间段的预测结果;空气质量预测模型包括克里金插值模型和深度学习模型。
请参阅图2,本申请实施方式提供了一种空气质量的预测装置100。预测装置100包括获取模块110、预处理模块120和预测模块130。
其中,步骤01可以由获取模块110实现,步骤02可以由预处理模块120实现,步骤03可以由预测模块130实现。或者说,获取模块110可以用于获取预定区域内的多个监测点在预定时间段的污染物数据和气象数据。预处理模块120可以用于对污染物数据和气象数据预处理,以生成污染物时序数据和气象时序数据;预测模块130可以用于通过空气质量预测模型对污染物时序数据和气象时序数据进行处理,以得到目标监测点在目标时间段的预测结果;空气质量预测模型包括克里金插值模型和深度学习模型。
本申请还提供了一种电子设备,包括存储器和处理器,存储器存储有计算机程序,当计算机程序被处理器执行时,使得处理器实现上述空气质量的预测方法。也即是,处理器用于获取预定区域内的多个监测点在预定时间段的污染物数据和气象数据,并对污染物数据和气象数据预处理,以生成污染物时序数据和气象时序数据,以及通过空气质量预测模型对污染物时序数据和气象时序数据进行处理,以得到目标监测点在目标时间段的预测结果;空气质量预测模型包括克里金插值模型和深度学习模型。
本申请的空气质量的预测方法、预测装置100和电子设备中,通过获取到预定区域内多个监测点在预定时间段的污染物数据以及气象数据并经预处理后,输入空气质量预测模型进行处理,得到目标监测点在目标时间段的空气质量预测结果,如此,不仅考虑了污染物的时间依赖性,并且气象、地理和其他因素被考虑,区域大气污染传输机理得以表达,空间物理属性与克里金插值被较完善的结合,从而得到的空气质量预测结果较为准确,提升了对空气质量的预测精度。
在一些实施方式中,预测装置100可以是电子设备的一部分。或者说,电子设备包括预测装置100。
在一些实施方式中,预测装置100可以是一定方式组装以具有前述功能的分立元件、或者是以集成电路形式存在具有前述功能的芯片、又或者是在计算机上运行时使得计算机具有前述功能的计算机软件代码段。
在一些实施方式中,作为硬件,预测装置100可以是独立或者作为额外增加的外围元件加装到电子设备。预测装置100也可以集成到电子设备上,例如,预测装置100是电子设备的一部分时,预测装置100可以集成到处理器上。
需要说明的是,不同的监测点在预定区域的分布位置不同,监测点可连续在线监测到污染物数据以及气象数据,目标监测点为可以为多个监测点中的任意一个。
气象数据包括但不限于大气温度、湿度、风速、气压、雨量和风向等。污染物数据包括PM2.5、O3、CO、PM10、SO2和NO2等中的至少一种。例如,在一些示例中,污染物数据只包括PM2.5一种,也即是,通过获取多个监测点在预定时间段的PM2.5来预测目标监测点在目标时间段的PM2.5值。又例如,污染物数据包括PM2.5、O3两种,则可以通过分别获取多个监测点在预定时间段的PM2.5、O3来分别预测目标监测点在目标时间段的PM2.5值和O3值。
时序数据是指根据时间顺序排列的数据,例如,污染物时序数据是指污染物数据包括有多个,并且,多个污染物数据以时间顺序排列。
预定时间段与目标时间段为相邻时间段,例如,预定时间段为某日0-12时这个时间段,目标时间段为该日12-14时这个时间段,又例如,预定时间段为今年1月份到3月份期间的时间段,目标时间段为4月份期间的时间段。
还需要说明的是,深度学习模型由循环神经网络(Recurrent Neural Network,RNN)训练得到。循环神经网络是一类以序列数据为输入,在序列的演进方向进行递归(recursion)且所有节点(循环单元)按链式连接的递归神经网络(recursive neuralnetwork)。在本实施方式中,循环神经网络可以为长短期记忆(Long Short-Term Memory,LSTM)网络。也即是,深度学习模型由LSTM网络训练得到。
克里金插值模型由克里金法(Kriging)生成,克里金法是依据协方差函数对随机过程/随机场进行空间建模和预测(插值)的回归算法。在特定的随机过程,例如固有平稳过程中,克里金法能够给出最优线性无偏估计(Best Linear Unbiased Prediction,BLUP),因此在地统计学中也被称为空间最优无偏估计器(spatial BLUP)。
例如,请结合图3,在一些实施方式中,为了验证本申请中的空气质量的预测方法的预测性能,采用本申请的空气质量的预测方法预测了某个目标监测点在250小时内关于PM2.5的预测浓度值,并与在目标监测点实际监测得到的PM2.5浓度值作比较,可以得出,在250小时内,目标监测点的PM2.5的预测浓度值与实际浓度值趋势表现一致。因此,本申请的空气质量的预测方法具有较好的预测性能。
请参阅图4,在某些实施方式中,子步骤03包括子步骤:
031,通过克里金插值模型根据污染物时序数据得到每个监测点的污染物预测数据;
032,根据污染物预测数据与污染物时序数据计算得到误差序列;
033,将误差序列以及气象时序数据、目标监测点的污染物时序数据输入至深度学习模型进行处理,以得到半方差矩阵;
034,将半方差矩阵作为克里金插值模型的半方差函数的拟合结果,以根据污染物时序数据计算目标监测点的预测结果。
请进一步结合图2,在某些实施方式中,子步骤031-034可以由预测模块130实现。或者说,预测模块130可以用于通过克里金插值模型根据污染物时序数据得到每个监测点的污染物预测数据,根据污染物预测数据与污染物数据计算得到误差序列;将误差序列以及气象时序数据、目标监测点的污染物时序数据输入至深度学习模型进行处理,以得到半方差矩阵,以及将半方差矩阵作为克里金插值模型的半方差函数的拟合结果,以根据污染物时序数据计算目标监测点的预测结果。
在某些实施方式中,处理器可以用于通过克里金插值模型根据污染物时序数据得到每个监测点的污染物预测数据,根据污染物预测数据与污染物数据计算得到误差序列;将误差序列以及气象时序数据、目标监测点的污染物时序数据输入至深度学习模型进行处理,以得到半方差矩阵,以及将半方差矩阵作为克里金插值模型的半方差函数的拟合结果,以根据污染物时序数据计算目标监测点的预测结果。
需要说明的是,在子步骤031中,污染物预测数据也为时序数据,即,污染物预测数据包括多个,并且,与污染物时序数据对应。
具体地,克里金插值模型包括克里金基础方程:
Figure BDA0003578511150000061
其中,zo=z(xo,yo)是点(xo,yo)处的真实值,
Figure BDA0003578511150000062
是点(xo,yo)处的评估值,权重系数λi,λi是满足点(xo,yo)处的估计值
Figure BDA0003578511150000063
与真实值zo的差最小的一组最优系数。
需要说明的是,权重系数λi的计算公式为:
Figure BDA0003578511150000064
本申请可通过克里金基础方程根据污染物时序数据得到每个监测点的污染物预测数据。
在得到污染物预测数据后,可通过误差计算公式根据污染物预测数据和污染物时序数据计算得到误差序列J;其中,误差序列J计算公式为:
Figure BDA0003578511150000071
根据无偏约束条件,将
Figure BDA0003578511150000072
带误差序列J计算公式:
Figure BDA0003578511150000073
进一步地,在得到误差序列J后,根据时间顺序对预定时间段在不同时刻的气象时序数据(例如温度、湿度、气压、风速、风向等)、污染物时序数据和误差序列进行排列,再对时序数据、污染物时序数据和误差序列进行拼接处理得到输入序列Xt{x1,x2,…,xn}。再将输入序列Xt{x1,x2,…,xn}输入至深度学习模型进行处理,以得到半方差矩阵;
最后,将半方差矩阵作为克里金插值模型的半方差函数的拟合结果,再根据污染物时序数据重新以半方差矩阵为拟合结果重新进行克里金插值计算,得到目标监测点的在目标时间段内的预测结果。
请参阅图5,在某些实施方式中,在步骤02包括:
021,分别删除污染物数据、气象数据中的错误数据和全天缺失数据;
022,分别利用污染物数据、气象数据的平均值填充局部缺失数据;及
023,分别采用拉依达准则剔除污染物数据、气象数据中的异常数据,以得到污染物时序数据和气象时序数据。
请结合图2,在某些实施方式中,子步骤021-023可以由预处理模块120实现。或者说,预处理模块120可以用于分别删除污染物数据、气象数据中的错误数据和全天缺失数据,并分别利用污染物数据、气象数据的平均值填充局部缺失数据,以及分别采用拉依达准则剔除污染物数据、气象数据中的异常数据,以得到污染物时序数据和气象时序数据。
在某些实施方式中,处理器用于分别删除污染物数据、气象数据中的错误数据和全天缺失数据,并分别利用污染物数据、气象数据的平均值填充局部缺失数据,以及分别采用拉依达准则剔除污染物数据、气象数据中的异常数据,以得到污染物时序数据和气象时序数据。
如此,通过对污染物数据、气象数据进行删除、填充以及剔除异常等预处理,使得根据预处理后得到的污染物时序数据、气象时序数据得到的预测结果更准确,从而有效提高了预测精度。
请结合图6,在某些实施方式中,在步骤03之前,空气质量的预测方法还包括:
05,归一化污染物时序数据和气象时序数据。
在某些实施方式中,步骤05可以由预处理模块120实现。或者说,预处理模块120可以用于归一化污染物时序数据和气象时序数据。
在某些实施方式中,处理器可用于归一化污染物时序数据和气象时序数据。
在本实施方式中,可选用线性函数归一化(Min-Max Scaling)污染物时序数据和气象时序数据,需要说明的是,Min-Max是对原始数据进行线性变换使结果映射到[0,1]的范围,从而实现对原始数据的等比缩放。
Min-Max归一化过程如下:
Figure BDA0003578511150000081
其中,x为监测数据,
Figure BDA0003578511150000082
为原始监测数据(污染物时序数据和气象时序数据)中的最小值,
Figure BDA0003578511150000083
为原始监测数据中的最大值,z为归一化处理后的监测数据。
如此,将归一化处理后的污染物时序数据和气象时序数据输入至空气质量预测模型中,可以提高误差预测模型的预测精度。从而得到更为准确的预测结果。
请结合图7,本申请实施方式还提供了一种空气质量预测模型的训练方法,用于训练得到上述预测方法的空气质量预测模型。训练方法包括:
11,获取多个监测点采集的历史污染物数据和历史气象数据;
12,通过原始克里金插值模型对历史污染物数据进行克里金插值计算,得到历史污染物预测数据;
13,根据历史污染物数据和历史污染物预测数据计算得到历史误差序列;
14,根据历史污染物数据、历史气象数据和历史误差序列对循环神经网络进行训练以得到深度学习模型;
15,将深度学习模型作为原始克里金插值模型的半方差函数以得到克里金插值优化模型;
16,根据历史污染物数据和历史气象数据对克里金插值优化模型训练以得到空气质量预测模型。
请结合图8,本申请实施方式还提供了一种空气质量预测模型的训练装置200,训练装置200可包括采集模块210、插值计算模块220、误差计算模块230、第一训练模块240、替换模块250和第二训练模块260;其中,步骤11可以由采集模块210实现,步骤12可以由插值计算模块220实现,步骤13可以由误差计算模块230实现,步骤14可以由第一训练模块240实现,步骤15可以由替换模块250实现。步骤16可以由第二训练模块260实现。
或者说,采集模块210可以用于获取多个监测点采集的历史污染物数据和历史气象数据,插值计算模块220可以用于通过原始克里金插值模型对历史污染物数据进行克里金插值计算,得到历史污染物预测数据;误差计算模块230可以用于根据历史污染物数据和历史污染物预测数据计算得到历史误差序列;第一训练模块240可以用于根据历史污染物数据、历史气象数据和历史误差序列对神经网络进行训练以得到深度学习模型;替换模块250可以用于将深度学习模型作为原始克里金插值模型的半方差函数以得到克里金插值优化模型;第二训练模块260可以用于根据历史污染物数据和历史气象数据对克里金插值优化模型训练以得到空气质量预测模型。
本申请还提供了一种电子设备,包括存储器和处理器,存储器存储有计算机程序,当计算机程序被处理器执行时,使得处理器实现上述空气质量预测模型的训练方法。也即是,处理器用于获取多个监测点采集的历史污染物数据和历史气象数据,插值计并通过原始克里金插值模型对历史污染物数据进行克里金插值计算,得到历史污染物预测数据;以及根据历史污染物数据和历史污染物预测数据计算得到历史误差序列;处理器还可以用于根据历史污染物数据、历史气象数据和历史误差序列对神经网络进行训练以得到深度学习模型;以及将深度学习模型作为原始克里金插值模型的半方差函数以得到克里金插值优化模型;最后根据历史污染物数据和历史气象数据对克里金插值优化模型训练以得到空气质量预测模型。
本申请的空气质量预测模型的训练方法、训练装置和电子设备中,通过将由循环神经网络得到的深度学习模型作为原始克里金插值模型的半方差函数以得到克里金插值优化模型,并通过历史污染物数据和历史气象数据对克里金插值优化模型训练得到空气质量预测模型。从而,后续可通过训练好的空气质量预测模型来根据采集的污染物数据和气象数据对目标监测点的空气质量进行预测,从而得到空气质量的预测结果,如此,不仅考虑了污染物的时间依赖性,并且气象、地理和其他因素被考虑,区域大气污染传输机理得以表达,空间物理属性与克里金插值被较完善的结合,从而预测出预测结果较为准确,提高了空气质量的预测结果的准确性。
请结合图9,在某些实施方式中,步骤16包括:
161,将历史污染物数据和历史气象数据分为训练样本和验证样本;
162,利用训练样本对克里金插值优化模型训练以得到历史预测结果;
163,根据验证样本和历史预测结果对深度学习模型中的时间步长和每层神经元数量等超参数进行调整寻优,以得到训练好的空气质量预测模型。
请进一步地结合图8,在某些实施方式中,子步骤161-163可以由第二训练模块260实现。或者说第二训练模块260可以用于将历史污染物数据和历史气象数据分为训练样本和验证样本,并利用训练样本对克里金插值优化模型训练以得到历史预测结果,以及根据验证样本和历史预测结果对深度学习模型中的时间步长和每层神经元数量等超参数进行调整寻优,以得到训练好的空气质量预测模型。
在某些实施方式中,将历史污染物数据和历史气象数据分为训练样本和验证样本,并利用训练样本对克里金插值优化模型训练以得到历史预测结果,以及根据验证样本和历史预测结果对深度学习模型中的时间步长和每层神经元数量等超参数进行调整寻优,以得到训练好的空气质量预测模型。
在子步骤161中,将历史污染物数据和历史气象数据可以根据时间顺序分成训练样本和验证样本。例如,将多个监测点在1-3月的采集的历史污染物数据和历史气象数据中,把1-2月份的历史污染物数据和历史气象数据作为训练样本,把3月的采集的历史污染物数据和历史气象数据作为验证样本。
在子步骤162中,克里金插值优化模型的训练以小批量进行,批次大小可以为50,所有模型训练迭代100次。在超参数设置方面,被设计的模型主要有神经元数量及time_step。在模型训练过程中,输入层有11个神经元,输出层有1个神经元代表1个预测变量,各层之间Dropout概率被设置为了0.2,以避免过度拟合的问题。神经元的数量被设置为从{16,32,64,128,256}候选集中选择。
在子步骤163中,可采用网格搜索法根据验证样本和历史预测结果对克里金插值优化模型中的深度学习模型中的时间步长和每层神经元数量等超参数进行调整寻优,以得到训练好的空气质量预测模型。
本申请实施方式还提供了一种非易失性计算机可读存储介质,计算机读存储介质存储有计算机程序,当计算机程序被处理器执行时,使得处理器执行上述的空气质量的预测方法或执行上述的空气质量预测模型的训练方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其他任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(digital subscriber line,DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质(例如,软盘、硬盘、磁带)、光介质(例如数字视频光盘(digital video disc,DVD))、或者半导体介质(例如固态硬盘(solid state disk,SSD))等。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。

Claims (11)

1.一种空气质量的预测方法,其特征在于,所述空气质量的预测方法包括:
获取预定区域内多个监测点在预定时间段的污染物数据和气象数据;
对所述污染物数据和气象数据预处理,以生成污染物时序数据和气象时序数据;
通过空气质量预测模型对所述污染物时序数据和所述气象时序数据进行处理,以得到目标监测点在目标时间段的预测结果;所述空气质量预测模型包括克里金插值模型和深度学习模型。
2.根据权利要求1所述的预测方法,其特征在于,所述通过空气质量预测模型对所述时序数据进行处理,以得到目标监测点在目标时间段的预测结果,包括:
通过所述克里金插值模型根据所述污染物时序数据得到每个所述监测点的污染物预测数据;
根据所述污染物预测数据与所述污染物时序数据计算得到误差序列;
将所述误差序列以及所述气象时序数据、所述目标监测点的污染物时序数据输入至所述深度学习模型进行处理,以得到半方差矩阵;
将所述半方差矩阵作为所述克里金插值模型的半方差函数的拟合结果,以根据所述污染物时序数据计算所述目标监测点在所述目标时间段的预测结果。
3.根据权利要求1所述的预测方法,其特征在于,所述对所述污染物数据和气象数据预处理,以生成污染物时序数据和气象时序数据,包括:
分别删除所述污染物数据、所述气象数据中的错误数据和全天缺失数据;
分别利用所述污染物数据、所述气象数据的平均值填充局部缺失数据;及
分别采用拉依达准则剔除所述污染物数据、所述气象数据中的异常数据,以得到所述污染物时序数据和所述气象时序数据。
4.根据权利要求1所述的预测方法,其特征在于,所述通过空气质量预测模型对所述所述时序数据和所述气象时序数据进行处理,以得到目标监测点在目标时间段的预测结果之前,所述空气质量的预测方法还包括:
归一化所述污染物时序数据和所述气象时序数据。
5.根据权利要求1所述的预测方法,其特征在于,所述气象数据包括大气温度、湿度、风速、气压、雨量和风向。
6.根据权利要求1所述的预测方法,其特征在于,所述污染物数据包括PM2.5、O3、CO、PM10、SO2和NO2中的至少一种。
7.一种空气质量预测模型的训练方法,用于训练得到根据权利要求1任一所述的预测方法的空气质量预测模型,其特征在于,所述训练方法包括:
获取多个监测点采集的历史污染物数据和历史气象数据;
通过原始克里金插值模型对所述历史污染物数据进行克里金插值计算,得到历史污染物预测数据;
根据所述历史污染物数据和所述历史污染物预测数据计算得到历史误差序列;
根据所述历史污染物数据、历史气象数据和所述历史误差序列对循环神经网络进行训练以得到所述深度学习模型;
将所述深度学习模型作为所述原始克里金插值模型的半方差函数以得到克里金插值优化模型;
根据所述历史污染物数据和历史气象数据对所述克里金插值优化模型训练以得到所述空气质量预测模型。
8.根据权利要求7所述的训练方法,其特征在于,所述根据所述历史污染物数据和历史气象数据对所述克里金插值优化模型训练以得到所述空气质量预测模型,包括;
将所述历史污染物数据和历史气象数据分为训练样本和验证样本;
利用所述训练样本对所述克里金插值优化模型训练以得到历史预测结果;
根据所述验证样本和所述历史预测结果对所述深度学习模型中的时间步长和每层神经元数量等超参数进行调整寻优,以得到训练好的所述空气质量预测模型。
9.一种空气质量的预测装置,其特征在于,所述预测装置包括:
获取模块,用于获取预定区域内多个监测点在预定时间段的污染物数据和气象数据;
预处理模块,用于对所述污染物数据和气象数据预处理,以生成污染物时序数据和气象时序数据;
预测模块,通过空气质量预测模型对所述污染物时序数据和所述气象时序数据进行处理,以得到目标监测点在目标时间段的预测结果;所述空气质量预测模型包括克里金插值模型和深度学习模型。
10.一种电子设备,其特征在于,包括处理器和存储器,所述存储器存储有计算机程序,当所述计算机程序被所述处理器执行时,使得所述处理器执行权利要求1-6中任一项所述的空气质量的预测方法以及执行7-8任一项所述的空气质量预测模型的训练方法。
11.一种包含计算机程序的可读存储介质,其特征在于,当所述计算机程序被处理器执行时,使得所述处理器执行权利要求1-6中任一项所述的空气质量的预测方法以及执行7-8任一项所述的空气质量预测模型的训练方法。
CN202210348989.XA 2022-04-01 2022-04-01 预测方法、训练方法、装置、电子设备及存储介质 Pending CN114819289A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210348989.XA CN114819289A (zh) 2022-04-01 2022-04-01 预测方法、训练方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210348989.XA CN114819289A (zh) 2022-04-01 2022-04-01 预测方法、训练方法、装置、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN114819289A true CN114819289A (zh) 2022-07-29

Family

ID=82533502

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210348989.XA Pending CN114819289A (zh) 2022-04-01 2022-04-01 预测方法、训练方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN114819289A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115682338A (zh) * 2023-01-04 2023-02-03 百信信息技术有限公司 用于组装生产线车间的温湿度监控调节方法、系统及装置
CN116448966A (zh) * 2023-06-15 2023-07-18 吉林省中农阳光数据有限公司 基于智能物联网和深度学习相结合的空气质量评估方法
CN117093832A (zh) * 2023-10-18 2023-11-21 山东公用环保集团检测运营有限公司 一种用于空气质量数据缺失的数据插补方法及系统

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115682338A (zh) * 2023-01-04 2023-02-03 百信信息技术有限公司 用于组装生产线车间的温湿度监控调节方法、系统及装置
CN116448966A (zh) * 2023-06-15 2023-07-18 吉林省中农阳光数据有限公司 基于智能物联网和深度学习相结合的空气质量评估方法
CN116448966B (zh) * 2023-06-15 2023-09-12 吉林省中农阳光数据有限公司 基于智能物联网和深度学习相结合的空气质量评估方法
CN117093832A (zh) * 2023-10-18 2023-11-21 山东公用环保集团检测运营有限公司 一种用于空气质量数据缺失的数据插补方法及系统
CN117093832B (zh) * 2023-10-18 2024-01-26 山东公用环保集团检测运营有限公司 一种用于空气质量数据缺失的数据插补方法及系统

Similar Documents

Publication Publication Date Title
CN114819289A (zh) 预测方法、训练方法、装置、电子设备及存储介质
CN110727665B (zh) 物联网设备上报数据质量分析方法及系统
CN105593864B (zh) 用于维护设备的分析设备退化
CN112712209B (zh) 水库入库流量预测方法、装置、计算机设备及存储介质
CN111831704B (zh) 异常数据的确定方法、装置、存储介质和电子设备
CN111723929A (zh) 一种基于神经网络的数值预报产品订正方法、装置和系统
CN115118511A (zh) 异常流量识别方法、装置、电子设备及存储介质
CN110705115A (zh) 一种基于深度置信网络的气象预报方法和系统
CN111814956A (zh) 一种基于多维度二次特征提取的多任务学习的空气质量预测方法
CN114037140A (zh) 预测模型训练、数据预测方法、装置、设备及存储介质
Yang et al. Remaining useful life prediction based on normalizing flow embedded sequence-to-sequence learning
Pathan et al. Efficient forecasting of precipitation using LSTM
CN114217025B (zh) 评估空气质量浓度预测中气象数据对其影响的分析方法
CN116843216A (zh) 一种指标预警方法、装置、计算机设备及存储介质
CN116013426A (zh) 一种高时空分辨率的站点臭氧浓度预测方法
CN117236571A (zh) 一种基于物联网的规划方法和系统
CN116960962A (zh) 一种跨区域数据融合的中长期区域负荷预测方法
CN112308282A (zh) 数据处理方法、装置、电子设备和计算机存储介质
CN114897791A (zh) 基于烛台理论的水质预测方法
CN114936664A (zh) 基于混合深度学习模型的流域非点源污染预测方法
CN113011637A (zh) 空气质量的预测方法、装置、设备及存储介质
CN113095608A (zh) 指标分析方法、装置、设备及存储介质
CN112561153A (zh) 一种基于模型集成的景区人群聚集预测方法
CN111625525A (zh) 一种环境数据修复/填充方法及系统
US20220269994A1 (en) System and method for automated creation of a time series artificial intelligence model

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination