CN116148951B - 空气目标污染物组分预报模型训练方法、预报方法及装置 - Google Patents

空气目标污染物组分预报模型训练方法、预报方法及装置 Download PDF

Info

Publication number
CN116148951B
CN116148951B CN202310177188.6A CN202310177188A CN116148951B CN 116148951 B CN116148951 B CN 116148951B CN 202310177188 A CN202310177188 A CN 202310177188A CN 116148951 B CN116148951 B CN 116148951B
Authority
CN
China
Prior art keywords
forecasting
time
target
forecast
component
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310177188.6A
Other languages
English (en)
Other versions
CN116148951A (zh
Inventor
李红丽
徐曼
肖林鸿
王文丁
秦东明
陈焕盛
亢思静
边玉山
吴剑斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
3Clear Technology Co Ltd
Original Assignee
3Clear Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 3Clear Technology Co Ltd filed Critical 3Clear Technology Co Ltd
Priority to CN202310177188.6A priority Critical patent/CN116148951B/zh
Publication of CN116148951A publication Critical patent/CN116148951A/zh
Application granted granted Critical
Publication of CN116148951B publication Critical patent/CN116148951B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01WMETEOROLOGY
    • G01W1/00Meteorology
    • G01W1/10Devices for predicting weather conditions
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N15/00Investigating characteristics of particles; Investigating permeability, pore-volume or surface-area of porous materials
    • G01N15/06Investigating concentration of particle suspensions
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/0004Gaseous mixtures, e.g. polluted air
    • G01N33/0009General constructional details of gas analysers, e.g. portable test equipment
    • G01N33/0027General constructional details of gas analysers, e.g. portable test equipment concerning the detector
    • G01N33/0036General constructional details of gas analysers, e.g. portable test equipment concerning the detector specially adapted to detect a particular component
    • G01N33/0047Organic compounds
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/0004Gaseous mixtures, e.g. polluted air
    • G01N33/0009General constructional details of gas analysers, e.g. portable test equipment
    • G01N33/0062General constructional details of gas analysers, e.g. portable test equipment concerning the measuring method or the display, e.g. intermittent measurement or digital display
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Immunology (AREA)
  • General Health & Medical Sciences (AREA)
  • Pathology (AREA)
  • General Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Physics & Mathematics (AREA)
  • Analytical Chemistry (AREA)
  • Environmental & Geological Engineering (AREA)
  • Combustion & Propulsion (AREA)
  • Food Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Atmospheric Sciences (AREA)
  • Dispersion Chemistry (AREA)
  • Ecology (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Environmental Sciences (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请涉及一种空气目标污染物组分预报模型训练方法、预报方法及装置,通过获取目标监测站点的目标污染物组分在多个时间点的实测值;并获取所述目标监测点在所述多个时间点的气象数据,利用多个时间点的实测值作为标签、以及多个时间点的气象数据作为样本来训练空气目标污染物组分预报模型。训练空气目标污染物组分预报模型之后,通过调用模型来对目标污染物组分进行预报,从而实现了目标污染物组分预报。本申请通过构建空气目标污染物组分预报模型来实现对目标污染物组分的预报,目标污染物组分的种类不受限制,因此具有预报范围广的优点;同时,空气目标污染物组分预报模型与现有的空气质量模式相比,具有预报速度快,消耗计算资源少的优点。

Description

空气目标污染物组分预报模型训练方法、预报方法及装置
技术领域
本申请涉及大气化学技术领域,具体涉及一种空气目标污染物组分预报模型训练方法、预报方法及装置。
背景技术
空气污染物组分监测网络已经不断发展,基于组分实测数据对污染过程进行深入分析,从而识别污染发生的原因、指导污染管控的相关决策等。
现有技术中的空气质量模式虽然能够对一些空气污染物组分进行预报,但是存在一些空气污染物组分无法通过现有的空气质量模式进行预报,存在预报范围不够全面的问题;同时,现有的空气质量模式在进行空气目标污染物组分预报时的运行时间长,需要消耗大量的计算资源。
发明内容
本申请的目的之一在于提供一种空气目标污染物组分预报模型训练方法、预报方法及装置,以解决现有技术中的空气质量模式在对空气污染物组分进行预报时预报范围不全面、运行时间长、以及需要消耗大量计算资源的技术问题。
根据本申请的一方面,提供了一种空气目标污染物组分预报模型训练方法,包括:
获取目标监测站点的目标污染物组分在多个时间点的实测值;
获取所述目标监测点在所述多个时间点的气象数据,其中,所述气象数据包括一个或多个气象要素的值;
建立包括多个样本及其标签的数据集,其中,每个样本包括一个所述时间点的气象数据,所述样本的标签包括所述时间点的实测值;
根据所述数据集训练空气目标污染物组分预报模型。
在本申请一实施例中,每个样本还包括:所述时间点之前第一时间范围的实测值的时间序列。
在本申请一实施例中,还包括:
获取所述目标监测点的所述目标污染物组分在所述多个时间点的数值模式预报值;
其中,每个样本还包括:该时间点的数值模式预报值。
在本申请一实施例中,还包括:
根据所述多个时间点的气象数据确定任一时间点之前第二时间范围的气象变化特征,其中,所述气象变化特征包括一个或多个气象要素的变化特征;
其中,每个样本还包括:所述时间点的气象变化特征。
在本申请一实施例中,每个样本还包括:时间特征,所述时间特征包括预报月份、预报日期、预报时间点中至少之一。
本申请的另一方面,还提供一种空气目标污染物组分预报方法,包括:
获取目标监测站点在预报时间点的气象数据,其中,所述气象数据包括一个或多个气象要素的预测值;
以所述预报时间点的气象数据为输入,调用所述目标监测站点的目标污染物组分的空气目标污染物组分预报模型,得到所述目标污染物组分在所述预报时间点的预报值。
在本申请一实施例中,还包括:
获取所述目标监测站点的所述目标污染物组分在所述预报时间点之前第一时间范围的组分值,其中,所述第一时间范围中在起报时间之前的所述组分值为所述目标检测站点的实测值,所述第一时间范围中在起报时间及其之后的所述组分值为所述目标污染物组分的预报值;
其中,所述输入还包括:所述目标污染物组分在所述预报时间点之前第一时间范围的组分值。
在本申请一实施例中,还包括:
获取所述目标监测站点的所述目标污染物组分在所述预报时间点的数值模式预报值;
其中,所述输入还包括:所述目标污染物组分在所述预报时间点的数值模式预报值。
在本申请一实施例中,还包括:
获取所述目标监测站点在所述预报时间点之前的气象数据;
根据所述目标监测站点在所述预报时间点之前的气象数据,确定所述预报时间点之前第二时间范围的气象变化特征,其中,所述气象变化特征包括一个或多个气象要素的变化特征;
其中,所述输入还包括:所述目标污染物组分在所述预报时间点之前第二时间范围的气象变化特征。
在本申请一实施例中,还包括:
确定时间特征,所述时间特征包括所述预报时间点、预报月份、预报日期中至少之一;
其中,所述输入还包括:所述时间特征。
本申请的另一方面,还提供一种空气目标污染物组分预报模型训练装置,包括:
第一获取模块,用于获取目标监测站点的目标污染物组分在多个时间点的实测值;
第二获取模块,用于获取所述目标监测点在所述多个时间点的气象数据,其中,所述气象数据包括一个或多个气象要素的值;
数据集建立模块,用于建立包括多个样本及其标签的数据集,其中,每个样本包括一个所述时间点的气象数据,所述样本的标签包括所述时间点的实测值;
训练模块,用于根据所述数据集训练空气目标污染物组分预报模型。
本申请的另一方面,还提供一种空气目标污染物组分预报装置,包括:
第三获取模块,用于获取目标监测站点在预报时间点的气象数据,其中,所述气象数据包括一个或多个气象要素的预测值;
预报模块,用于以所述预报时间点的气象数据为输入,调用所述目标监测站点的目标污染物组分的空气目标污染物组分预报模型,得到所述目标污染物组分在所述预报时间点的预报值。
本申请的另一方面,还提供一种电子设备,包括:处理器;以及存储程序的存储器,其中,所述程序包括指令,所述指令在由所述处理器执行时使所述处理器执行本申请实施例的方法。
本申请的另一方面,还提供一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使计算机执行本申请实施例的方法。
本申请的有益效果为:
本申请通过获取目标监测站点的目标污染物组分在多个时间点的实测值;并获取所述目标监测点在所述多个时间点的气象数据,利用多个时间点的实测值作为标签、以及多个时间点的气象数据作为样本来训练空气目标污染物组分预报模型。
训练空气目标污染物组分预报模型之后,通过调用空气目标污染物组分预报模型来对目标污染物组分进行预报,从而实现了目标污染物组分预报。本申请通过构建空气目标污染物组分预报模型来实现对目标污染物组分的预报,目标污染物组分的种类不受限制,因此具有预报范围广的优点;同时,本申请构建的空气目标污染物组分预报模型,与现有的空气质量模式相比,具有预报速度快,消耗计算资源少的优点。
附图说明
图1为本申请的一示例性实施例示出的空气目标污染物组分预报模型训练和预报方法的应用场景图;
图2为本申请的一示例性实施例示出的空气目标污染物组分预报模型训练方法的流程图;
图3为本申请的一示例性实施例示出的空气目标污染物组分预报方法的流程图;
图4为本申请的一示例性实施例示出的空气目标污染物组分预报模型训练装置的结构图;
图5为本申请的一示例性实施例示出的空气目标污染物组分预报装置的结构图;
图6示出了适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。
具体实施方式
以下将参照附图和优选实施例来说明本申请的实施方式,本领域技术人员可由本说明书中所揭露的内容轻易地了解本申请的其他优点与功效。本申请还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本申请的精神下进行各种修饰或改变。应当理解,优选实施例仅为了说明本申请,而不是为了限制本申请的保护范围。
需要说明的是,以下实施例中所提供的图示仅以示意方式说明本申请的基本构想,遂图式中仅显示与本申请中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。
图1是本申请的一示例性实施例示出的一种空气目标污染物组分预报模型训练和预报方法的应用场景图,如图1所示,本申请需要先获取目标监测站点的目标污染物组分在多个时间点的实测值、GFS(Global Forecast System)气象预报数据;并以实测值作为标签,气象预报数据作为样本构建数据集。此外,为了使得预报模型更加准确,还可以在样本中加入空气质量模式预报的多个时间点的目标变量的预报数据(数值模式预报值)、构造的气象变化特征、和时间特征。
构建的数据集经过标准化处理后对算法模型进行训练,得到空气目标污染物组分预报模型。通过将目标监测站点的信息与空气目标污染物组分预报模型进行关联,使得空气目标污染物组分预报模型与目标监测站点对应。空气目标污染物组分预报模型不仅可以对目标监测站点的空气污染物组分数据进行预报,在相邻站点不具有空气目标污染物组分预报模型的情况下,还可以对相邻站点的空气污染物组分数据进行预报。
如图2所示,在一示例性的实施例中,一种空气目标污染物组分预报模型训练方法,可以包括步骤S210至步骤S240,详细介绍如下:
S210,获取目标监测站点的目标污染物组分在多个时间点的实测值;
S220,获取所述目标监测点在所述多个时间点的气象数据,其中,所述气象数据包括一个或多个气象要素的值;
S230,建立包括多个样本及其标签的数据集,其中,每个样本包括一个时间点的气象数据,所述样本的标签包括该时间点的实测值;
S240,根据所述数据集训练空气目标污染物组分预报模型。
在步骤S210中,实测值是指目标监测站点观测得到的目标污染物组分的值,例如:VOCs组分和PM25组分浓度数据的值;具体地,VOCs的组分数据种类较多,大类可以简单分为烷烃、烯烃、炔烃、芳香烃,其中烷烃细分包括乙烷、丙烷、丁烷等;烯烃包括乙烯、丙烯、异戊二烯等;炔烃包括乙炔等,芳香烃包括苯、甲苯等。PM25的组分包括重点关注的硝酸盐(NO3-)、硫酸盐(SO42-)、铵盐(NH4+)、有机碳(OC)、元素碳(EC)等。
在步骤S220中,气象数据可以是GFS(Global Forecasting System,全球天气预报系统)气象预报数据的值,GFS气象预报数据可以包括行星边界层高度、地表向下的辐射通量、海平面气压、10m风向和风速、2m温度、相对湿度等。
在本实施例中,以气象数据作为训练数据,并以实测值作为标签来实现对空气目标污染物组分预报模型的训练,本实施例中的空气目标污染物组分预报模型可以是随机森林(RF)、极致梯度提升树(XGboost)等,在此不做限制。
在本申请一实施例中,每个样本还包括:所述时间点之前第一时间范围的实测值的时间序列。
在本实施例中,可以通过对时间点之前一个小时、前两个小时的实测值进行采集,从而在样本中加入滞后特征(即时间序列);滞后特征可以反映预测时间之前一段时间的实测值的变化规律。因此,在样本中加入时间序列后,可以使得训练得到的空气目标污染物组分预报模型的预报结果更加准确。
在本申请一实施例中,还包括:
获取所述目标监测点的所述目标污染物组分在所述多个时间点的数值模式预报值;
其中,每个样本还包括:该时间点的数值模式预报值。
在本实施例中,数值模式预报值可以是空气质量预报模型,如CMAQ(CommunityMultiscale Air Quality,空气质量预报和评估系统)模型、CAMX(Comprehensive AirQuality Model with Extensions,综合空气质量模型扩展)模型、NAQPMS(The Nested airQuality Prediction Modeling System,嵌套网格空气质量预报模式系统)模型、WRF-CHEM(Weather Research and Forecasting model coupled to Chemistry,耦合化学的天气研究和预报模型)模型等;数值模式预报值以格点数据的形式进行存储,按照目标监测站点的经纬度进行插值处理,即可获取与目标污染物组分观测站点对应的预测数据(即数值模式预报值)。
本实施例将数值模式预报值加入至样本中,从而反映目标污染物组分的实测值与数值模式预报值的关联,进而使得训练得到的空气目标污染物组分预报模型可以在数值模型预报值得影响下,预报目标污染物组分的预报值,进而使得训练得到预报模型更加准确。
在本申请一实施例中,还包括:
根据所述多个时间点的气象数据确定任一时间点之前第二时间范围的气象变化特征,其中,所述气象变化特征包括一个或多个气象要素的变化特征;
其中,每个样本还包括:所述时间点的气象变化特征。
在本实施例中,气象变化特征可以是基于GFS气象数据构造的24小时变压和变温特征;气象数据同样以格点数据的形式进行存储,按照目标监测站点的经纬度进行插值处理,即可得到与目标监测站点对应的气象数据。
在本申请一实施例中,每个样本还包括:时间特征,所述时间特征包括预报月份、预报日期、预报时间点中至少之一。
在本实施例中,时间特征用于标记样本的观测时间,反映样本中实测值随时间变化的规律,例如时间特征中的预报月份可以反映实测值在某一年里随月份变化的规律,预报日期可以反映实测值在某一个月中随日期变化的规律,预报时间点可以反映实测值在某一天中随时间变化的规律。通过在样本中加入时间特征,使得模型可以根据时间规律来输出预测值,预测结果更加准确。
此外,目标污染物组分的实测值、气象数据、数值模式预报值的数据分辨率均为1小时。时长至少为1年。
在本申请另一实施例中,根据如下四种情况来分别构造对应的数据集:
数据集1:包含空气污染物组分的实测值的滞后特征、数值模式预报值、气象数据、气象数据构造特征、时间特征;
数据集2:包含空气污染物组分的数值模式预报值、气象数据、气象数据构造特征、时间特征;
数据集3:包含空气污染物组分的实测值的滞后特征、气象数据、气象数据构造特征、时间特征;
数据集4:包含气象数据、气象数据构造特征、时间特征;
在一些情况下,由于组分监测站点能够实测的空气污染物组分的种类要比空气质量模式预报的空气污染物组分的种类要多。因此,需要考虑到,如果目标污染物组分不能通过空气质量模式进行预报时,如何通过模型准确地预报目标污染物组分的值。针对上述情形,本实施例中,将数据集分为包含数值模式预报值和不包含数值模式预报值两种情况构建数据集,如数据集1/数据集2、数据集3/数据集4,并通过如数据集1/数据集2、数据集3/数据集4训练空气目标污染物组分预报模型,以使得训练得到的空气目标污染物组分预报模型能够适应上述两种情形。
以模型预报数据(预测数据)的颗粒物组分OC(有机碳)举例,该数据对应的特征数据如表1所示:
表1.颗粒物组分OC数据集的特征数据表
另外考虑站点组分实测数据站点存在缺失的情况,针对每个预报的组分变量均构造出两份数据集,一份为包括组分站点实测数据,即滞后特征作为特征输入;另一份不包括组分实测数据,即没有滞后特征作为特征输入。滞后特征为时间点提前一个小时、前两个小时的实测值。如数据集1和数据集3、或者是数据集2和数据集4。
以模型预报数据中输出的VOCs变量丙烯举例,该数据对应的特征数据如表2所示:
表2.丙烯变量数据集的特征数据表
在本实施例中,在训练之前还需要对数据集进行标准化处理,例如:将数据集输入至标准化模型中进行标准化处理,最后再根据标准化处理后的数据集训练预报模型。
与数据集对应地,在数据集包含滞后特征时,通过数据集训练得到第一预测模型;在数据集不包含滞后特征时,通过数据集训练得到第二预测模型;第一预测模型和第二预测模型分别单独命名,如第一预测模型“OC_站点ID_mete_obs_mdl”、和“丙烯_站点ID_mete_obs”;第二预测模型“OC_站点ID_mete_mdl”、和“丙烯_站点ID_mete”。
如图3所示,在一示例性的实施例中,一种空气目标污染物组分预报方法,包括步骤S310至步骤S320,详细介绍如下:
S310,获取目标监测站点在预报时间点的气象数据,其中,所述气象数据包括一个或多个气象要素的预测值;
S320,以所述预报时间点的气象数据为输入,调用所述目标监测站点的目标污染物组分的空气目标污染物组分预报模型,得到所述目标污染物组分在所述预报时间点的预报值。
在本实施例中,将预报时间点的气象数据作为输入,并输入至空气目标污染物组分预报模型中,即可实现对目标污染物组分在预报时间点的预报。
在本申请一实施例中,还包括:
获取所述目标监测站点的所述目标污染物组分在所述预报时间点之前第一时间范围的组分值,其中,所述第一时间范围中在起报时间之前的所述组分值为所述目标检测站点的实测值,所述第一时间范围中在起报时间及其之后的所述组分值为所述目标污染物组分的预报值;
其中,所述输入还包括:所述目标污染物组分在所述预报时间点之前第一时间范围的组分值。
在本实施例中,如果组分监测站点能够采集到预报时间点之前第一时间范围的组分值,那么将该组分值作为滞后特征输入至空气目标污染物组分预报模型进行预报,以减少预报误差。
例如:对于预报当日,设置02时开始起报,目的是获取当日00时和01时目标变量的实测值,将其作为实测值的滞后特征输入减少预报的误差。
例如:对2021年12月1日预报时,12月1日02时开始起报。对于预报日02时进行起报时,需要完成缓存预报日前日至预报日01时一段时间内的组分实测数据,这段时间的长度在此不做限制,可以为2~26个小时,比如对2021年12月1日预报时,需要获取11月30日晚20时-12月1日01时(6个小时)的组分站点实测数据。
在本申请一实施例中,还包括:
获取所述目标监测站点的所述目标污染物组分在所述预报时间点的数值模式预报值;
其中,所述输入还包括:所述目标污染物组分在所述预报时间点的数值模式预报值。
在本实施例中,在能够获取到数值模式预报值时,将数值模式预报值输入至组分预报模型中,以减少预报误差。
例如:对2021年12月1日预报时,12月1日02时开始起报。对于预报日02时进行起报时,还需要完成缓存预报时效内,比如24小时、48小时或者72小时的模式的组分预报数据和GFS气象预报数据。即12月1日02时起报,预报12月1日的数据为24小时时效、预报12月1和2日为48小时时效、预报12月1日、2日、3日为72小时时效,需要在起报时完成缓存该时间段内模式预报的组分数据和GFS气象预报数据。
在本申请一实施例中,还包括:
获取所述目标监测站点在所述预报时间点之前的气象数据;
根据所述目标监测站点在所述预报时间点之前的气象数据,确定所述预报时间点之前第二时间范围的气象变化特征,其中,所述气象变化特征包括一个或多个气象要素的变化特征;
其中,所述输入还包括:所述目标污染物组分在所述预报时间点之前第二时间范围的气象变化特征。
在本实施例中,还可以基于气象数据构造变化特征,并输入至组分预报模型中,以减少预报误差。例如,构造变温和变压特征。
在本申请一实施例中,还包括:
确定时间特征,所述时间特征包括所述预报时间点、预报月份、预报日期中至少之一;
其中,所述输入还包括:所述时间特征。
在本实施例中,还可以构造时间特征,并输入至组分预报模型中,以减少预报误差。
此外,对于预报过程中缓存在本地的组分实测数据,数据缓存完后会对缓存的组分实测数据进行判断,如果某个时刻存在缺失值,则进行插值处理,保证组分实测数据的完整性。如果缓存的所有时刻的实测数据判断为均为缺失值,则会在起报时读取没有实测值滞后特征作为特征输入至第二预报模型(如上述举例中的mdl_OC_站点ID_mete_mdl和丙烯_站点ID_mete)进行预报。预报日00时的预报结果作为01时的组分观测的滞后特征值输入实现01时的预报,以此类推下去,逐时进行站点的长时效预报。
此外,在一些情况下,会存在一些站点建设时间较晚,数据量不足以支撑机器学习训练时输出模型,为了解决这一问题,按照预报站点的经纬度进行判断,在训练完成的站点中搜索与该站点距离的站点,读取这个距离最近的邻近站点的训练完后保存的模型,作为该站点的组分预报模型实现预报过程。
本申请中的一种空气目标污染物组分预报模型训练和预报方法,通过获取目标监测站点的目标污染物组分在多个时间点的实测值;并获取所述目标监测点在所述多个时间点的气象数据,利用多个时间点的实测值作为标签、以及多个时间点的气象数据作为样本来训练空气目标污染物组分预报模型。训练空气目标污染物组分预报模型之后,通过调用空气目标污染物组分预报模型来对目标污染物组分进行预报,从而实现了目标污染物组分预报。本申请通过构建空气目标污染物组分预报模型来实现对目标污染物组分的预报,目标污染物组分的种类不受限制,因此具有预报范围广的优点;同时,本申请构建的空气目标污染物组分预报模型,与现有的空气质量模式相比,具有预报速度快,消耗计算资源少的优点。
如图4所示,本申请还提供一种空气目标污染物组分预报模型训练装置,包括:
第一获取模块,用于获取目标监测站点的目标污染物组分在多个时间点的实测值;
第二获取模块,用于获取所述目标监测点在所述多个时间点的气象数据,其中,所述气象数据包括一个或多个气象要素的值;
数据集建立模块,用于建立包括多个样本及其标签的数据集,其中,每个样本包括一个时间点的气象数据,所述样本的标签包括该时间点的实测值;
在本申请一实施例中,每个样本还包括:所述时间点之前第一时间范围的实测值的时间序列;
训练模块,用于根据所述数据集训练空气目标污染物组分预报模型。
在本申请一实施例中,模型训练装置还包括:
第四获取模块,用于获取所述目标监测点的所述目标污染物组分在所述多个时间点的数值模式预报值;
其中,每个样本还包括:该时间点的数值模式预报值。
在本申请一实施例中,模型训练装置还包括:
变化特征确定模块,用于根据所述多个时间点的气象数据确定任一时间点之前第二时间范围的气象变化特征,其中,所述气象变化特征包括一个或多个气象要素的变化特征;
其中,每个样本还包括:所述时间点的气象变化特征。
在本申请一实施例中,每个样本还包括:时间特征,所述时间特征包括预报月份、预报日期、预报时间点中至少之一。
如图5所示,本申请还提供一种空气目标污染物组分预报装置,包括:
第三获取模块,用于获取目标监测站点在预报时间点的气象数据,其中,所述气象数据包括一个或多个气象要素的预测值;
预报模块,用于以所述预报时间点的气象数据为输入,调用所述目标监测站点的目标污染物组分的空气目标污染物组分预报模型,得到所述目标污染物组分在所述预报时间点的预报值。
在本申请一实施例中,预报装置还包括:
第五获取模块,用于获取所述目标监测站点的所述目标污染物组分在所述预报时间点之前第一时间范围的组分值,其中,所述第一时间范围中在起报时间之前的所述组分值为所述目标检测站点的实测值,所述第一时间范围中在起报时间及其之后的所述组分值为所述目标污染物组分的预报值;
其中,所述输入还包括:所述目标污染物组分在所述预报时间点之前第一时间范围的组分值。
在本申请一实施例中,预报装置还包括:
第六获取模块,用于获取所述目标监测站点的所述目标污染物组分在所述预报时间点的数值模式预报值;
其中,所述输入还包括:所述目标污染物组分在所述预报时间点的数值模式预报值。
在本申请一实施例中,预报装置还包括:
第七获取模块,用于获取所述目标监测站点在所述预报时间点之前的气象数据;
根据所述目标监测站点在所述预报时间点之前的气象数据,确定所述预报时间点之前第二时间范围的气象变化特征,其中,所述气象变化特征包括一个或多个气象要素的变化特征;
其中,所述输入还包括:所述目标污染物组分在所述预报时间点之前第二时间范围的气象变化特征。
在本申请一实施例中,预报装置还包括:
时间特征确定模块,用于确定时间特征,所述时间特征包括所述预报时间点、预报月份、预报日期中至少之一;
其中,所述输入还包括:所述时间特征。
本申请提出一种空气目标污染物组分预报模型训练和预报装置,以使得该装置执行上述各个实施例中提供的空气目标污染物组分预报模型训练和预报方法;通过获取目标监测站点的目标污染物组分在多个时间点的实测值;并获取所述目标监测点在所述多个时间点的气象数据,利用多个时间点的实测值作为标签、以及多个时间点的气象数据作为样本来训练空气目标污染物组分预报模型。训练空气目标污染物组分预报模型之后,通过调用空气目标污染物组分预报模型来对空气污染物组分进行预报,从而实现了空气目标污染物组分预报。本申请通过构建空气目标污染物组分预报模型来实现对目标污染物组分的预报,目标污染物组分的种类不受限制,因此具有预报范围广的优点;同时,本申请构建的空气目标污染物组分预报模型,与现有的空气质量模式相比,具有预报速度快,消耗计算资源少的优点。
图6示出了适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。需要说明的是,图6示出的电子设备的计算机系统600仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图6所示,计算机系统600包括中央处理单元(Central Processing Unit,CPU)601,其可以根据存储在只读存储器(Read-Only Memory,ROM)602中的程序或者从储存部分608加载到随机访问存储器(Random Access Memory,RAM)603中的程序而执行各种适当的动作和处理,例如执行上述实施例中的方法。在RAM 603中,还存储有系统操作所需的各种程序和数据。CPU 601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(Input/Output,I/O)接口605也连接至总线604。
以下部件连接至I/O接口605:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(Cathode Ray Tube,CRT)、液晶显示器(Liquid Crystal Display,LCD)等以及扬声器等的输出部分607;包括硬盘等的储存部分608;以及包括诸如LAN(Local Area Network,局域网)卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入储存部分608。
特别地,根据本申请的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本申请的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的计算机程序。在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。在该计算机程序被中央处理单元(CPU)601执行时,执行本申请的系统中限定的各种功能。
需要说明的是,本申请实施例所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(Erasable Programmable Read Only Memory,EPROM)、闪存、光纤、便携式紧凑磁盘只读存储器(Compact Disc Read-Only Memory,CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的计算机程序。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的计算机程序可以用任何适当的介质传输,包括但不限于:无线、有线等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。其中,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现,所描述的单元也可以设置在处理器中。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定。
本申请的另一方面还提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被计算机的处理器执行时,使计算机执行如前的方法。该计算机可读存储介质可以是上述实施例中描述的电子设备中所包含的,也可以是单独存在,而未装配入该电子设备中。
本申请的另一方面还提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述各个实施例中提供的空气目标污染物组分预报模型训练和预报方法。
以上实施例仅是为充分说明本申请而所举的较佳的实施例,本申请的保护范围不限于此。本技术领域的技术人员在本申请基础上所作的等同替代或变换,均在本申请的保护范围之内。

Claims (10)

1.一种空气目标污染物组分预报模型训练方法,其特征在于,包括:
获取目标监测站点的目标污染物组分在多个时间点的实测值,其中,所述实测值是指所述目标监测站点观测得到的目标污染物组分的值;
获取所述目标监测站点在所述多个时间点的气象数据,其中,所述气象数据包括一个或多个气象要素的值;
根据所述多个时间点的气象数据确定任一时间点之前第二时间范围的气象变化特征,其中,所述气象变化特征包括一个或多个气象要素的变化特征;
建立包括多个样本及其标签的数据集,其中,每个样本包括:一个所述时间点的气象数据、该时间点之前第一时间范围的实测值的时间序列,以及该时间点的气象变化特征,所述样本的标签包括所述目标污染物组分在该时间点的实测值;
根据所述数据集训练空气目标污染物组分预报模型,以使所述空气目标污染物组分预报模型基于预报时间点的气象数据、所述目标污染物组分在所述预报时间点之前第一时间范围的组分值,以及在所述预报时间点之前第二时间范围的气象变化特征,预报所述目标污染物组分在所述预报时间点的预报值。
2.根据权利要求1所述的空气目标污染物组分预报模型训练方法,其特征在于,还包括:
获取所述目标监测站点的所述目标污染物组分在所述多个时间点的数值模式预报值;
其中,每个样本还包括:该时间点的数值模式预报值。
3.根据权利要求1所述的空气目标污染物组分预报模型训练方法,其特征在于,每个样本还包括:时间特征,所述时间特征包括预报月份、预报日期、预报时间点中至少之一。
4.一种空气目标污染物组分预报方法,其特征在于,包括:
获取目标监测站点在预报时间点的气象数据,其中,所述气象数据包括一个或多个气象要素的预测值;
获取所述目标监测站点的所述目标污染物组分在所述预报时间点之前第一时间范围的组分值,其中,所述第一时间范围中在起报时间之前的所述组分值为所述目标监测站点的实测值,所述第一时间范围中在起报时间及其之后的所述组分值为所述目标污染物组分的预报值;
获取所述目标监测站点在所述预报时间点之前的气象数据;根据所述目标监测站点在所述预报时间点之前的气象数据,确定所述预报时间点之前第二时间范围的气象变化特征,其中,所述气象变化特征包括一个或多个气象要素的变化特征;
以所述预报时间点的气象数据、所述目标污染物组分在所述预报时间点之前第一时间范围的组分值,以及在所述预报时间点之前第二时间范围的气象变化特征为输入,调用所述目标监测站点的目标污染物组分的空气目标污染物组分预报模型,得到所述目标污染物组分在所述预报时间点的预报值。
5.根据权利要求4所述的空气目标污染物组分预报方法,其特征在于,还包括:
获取所述目标监测站点的所述目标污染物组分在所述预报时间点的数值模式预报值;
其中,所述输入还包括:所述目标污染物组分在所述预报时间点的数值模式预报值。
6.根据权利要求4所述的空气目标污染物组分预报方法,其特征在于,还包括:
确定时间特征,所述时间特征包括所述预报时间点、预报月份、预报日期中至少之一;
其中,所述输入还包括:所述时间特征。
7.一种空气目标污染物组分预报模型训练装置,其特征在于,包括:
第一获取模块,用于获取目标监测站点的目标污染物组分在多个时间点的实测值,其中,所述实测值是指所述目标监测站点观测得到的目标污染物组分的值;
第二获取模块,用于获取所述目标监测站点在所述多个时间点的气象数据,其中,所述气象数据包括一个或多个气象要素的值;
数据集建立模块,用于建立包括多个样本及其标签的数据集,其中,每个样本包括:一个所述时间点的气象数据、该时间点之前第一时间范围的实测值的时间序列,以及该时间点的气象变化特征,所述样本的标签包括所述目标污染物组分在该时间点的实测值,其中,所述气象变化特征包括一个或多个气象要素的变化特征;
训练模块,用于根据所述数据集训练空气目标污染物组分预报模型,以使所述空气目标污染物组分预报模型基于预报时间点的气象数据、所述目标污染物组分在所述预报时间点之前第一时间范围的组分值,以及在所述预报时间点之前第二时间范围的气象变化特征,预报所述目标污染物组分在所述预报时间点的预报值。
8.一种空气目标污染物组分预报装置,其特征在于,包括:
第三获取模块,用于获取目标监测站点在预报时间点的气象数据,其中,所述气象数据包括一个或多个气象要素的预测值;获取所述目标监测站点的所述目标污染物组分在所述预报时间点之前第一时间范围的组分值,其中,所述第一时间范围中在起报时间之前的所述组分值为所述目标监测站点的实测值,所述第一时间范围中在起报时间及其之后的所述组分值为所述目标污染物组分的预报值;获取所述目标监测站点在所述预报时间点之前的气象数据;根据所述目标监测站点在所述预报时间点之前的气象数据,确定所述预报时间点之前第二时间范围的气象变化特征,其中,所述气象变化特征包括一个或多个气象要素的变化特征;
预报模块,用于以所述预报时间点的气象数据、所述目标污染物组分在所述预报时间点之前第一时间范围的组分值,以及在所述预报时间点之前第二时间范围的气象变化特征为输入,调用所述目标监测站点的目标污染物组分的空气目标污染物组分预报模型,得到所述目标污染物组分在所述预报时间点的预报值。
9. 一种电子设备,包括:
处理器;以及
存储程序的存储器,
其中,所述程序包括指令,所述指令在由所述处理器执行时使所述处理器执行根据权利要求1-6中任一项所述的方法。
10.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使计算机执行根据权利要求1-6中任一项所述的方法。
CN202310177188.6A 2023-02-23 2023-02-23 空气目标污染物组分预报模型训练方法、预报方法及装置 Active CN116148951B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310177188.6A CN116148951B (zh) 2023-02-23 2023-02-23 空气目标污染物组分预报模型训练方法、预报方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310177188.6A CN116148951B (zh) 2023-02-23 2023-02-23 空气目标污染物组分预报模型训练方法、预报方法及装置

Publications (2)

Publication Number Publication Date
CN116148951A CN116148951A (zh) 2023-05-23
CN116148951B true CN116148951B (zh) 2023-08-25

Family

ID=86352451

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310177188.6A Active CN116148951B (zh) 2023-02-23 2023-02-23 空气目标污染物组分预报模型训练方法、预报方法及装置

Country Status (1)

Country Link
CN (1) CN116148951B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116756522B (zh) * 2023-08-14 2023-11-03 中科三清科技有限公司 概率预报方法、装置、存储介质及电子设备

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105243444A (zh) * 2015-10-09 2016-01-13 杭州尚青科技有限公司 一种基于在线多核回归的城市监测站点空气质量预测方法
CN108074011A (zh) * 2017-11-02 2018-05-25 广州工程技术职业学院 一种污泥排放量的监控方法及系统
CN108490115A (zh) * 2018-02-08 2018-09-04 浙江大学 一种基于分布式在线主成分分析的空气质量异常检测方法
WO2021204678A1 (en) * 2020-04-07 2021-10-14 Shell Internationale Research Maatschappij B.V. Method and system for operating an adsorption-based system for removing water from a process stream
CN114282721A (zh) * 2021-12-22 2022-04-05 中科三清科技有限公司 污染物预报模型训练方法、装置、电子设备及存储介质
CN114858976A (zh) * 2022-04-27 2022-08-05 浙江索思科技有限公司 一种工业园区大气质量智能分析方法及系统
CN115239027A (zh) * 2022-09-22 2022-10-25 中科三清科技有限公司 空气质量格点化集合预报的方法及装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160091474A1 (en) * 2014-09-29 2016-03-31 Tanguy Griffon Method and a System for Determining at Least One Forecasted Air Quality Health Effect Caused in a Determined Geographical Area by at Least One Air Pollutant
US10564088B2 (en) * 2014-10-09 2020-02-18 Kinetic River Corp. Particle analysis and sorting apparatus and methods

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105243444A (zh) * 2015-10-09 2016-01-13 杭州尚青科技有限公司 一种基于在线多核回归的城市监测站点空气质量预测方法
CN108074011A (zh) * 2017-11-02 2018-05-25 广州工程技术职业学院 一种污泥排放量的监控方法及系统
CN108490115A (zh) * 2018-02-08 2018-09-04 浙江大学 一种基于分布式在线主成分分析的空气质量异常检测方法
WO2021204678A1 (en) * 2020-04-07 2021-10-14 Shell Internationale Research Maatschappij B.V. Method and system for operating an adsorption-based system for removing water from a process stream
CN114282721A (zh) * 2021-12-22 2022-04-05 中科三清科技有限公司 污染物预报模型训练方法、装置、电子设备及存储介质
CN114858976A (zh) * 2022-04-27 2022-08-05 浙江索思科技有限公司 一种工业园区大气质量智能分析方法及系统
CN115239027A (zh) * 2022-09-22 2022-10-25 中科三清科技有限公司 空气质量格点化集合预报的方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
丽水空气污染物时序特征及与气象条件的关系研究;邓霞君 等;《气象与环境科学 》;第38卷(第02期);60-65 *

Also Published As

Publication number Publication date
CN116148951A (zh) 2023-05-23

Similar Documents

Publication Publication Date Title
US10830922B2 (en) Air quality forecast by adapting pollutant emission inventory
CN110426493B (zh) 空气质量监测数据校准方法、装置、设备和存储介质
CN116148951B (zh) 空气目标污染物组分预报模型训练方法、预报方法及装置
Carnicero et al. Non-parametric copulas for circular–linear and circular–circular data: an application to wind directions
CN110348746B (zh) 基于单个污染源的空气质量影响评估方法和装置
CN112561410B (zh) 道路车辆的排放量确定方法、装置及电子设备
CN113642263B (zh) 基于北斗网格的空气质量预警方法和装置
CN113537563B (zh) 污染应急管控效果评估方法及装置
CN110189026A (zh) 空气质量改善措施的评估方法及装置、介质、电子设备
CN113361690A (zh) 水质预测模型训练、水质预测方法、装置、设备及介质
CN116626233A (zh) 基于多源数据融合的大气污染溯源方法、终端及存储介质
CN115099451A (zh) 一种基于污染精准溯源预报技术的企业敏感性识别方法
Tebaldi et al. Extreme metrics from large ensembles: investigating the effects of ensemble size on their estimates
CN113960252A (zh) 用于引航道船舶尾气监测的方法、系统及数据处理设备
CN115391746B (zh) 针对气象要素数据的插值方法、装置、电子设备及介质
CN116228501B (zh) 排污超标区域行业确定方法、装置、存储介质及电子设备
Hohenberger et al. A proposed population-health based metric for evaluating representativeness of air quality monitoring in cities: Using Hong Kong as a demonstration
CN115239027B (zh) 空气质量格点化集合预报的方法及装置
Sun et al. A subjective and objective evaluation of model forecasts of Sumatra squall events
Mao et al. Predictive anisotropy of surface winds by linear statistical prediction
CN115983329A (zh) 空气质量及气象条件的预测方法、装置、设备及存储介质
CN115705510A (zh) 厂区气体污染分布预测方法、系统、电子设备及存储介质
CN114200078A (zh) Oh自由基浓度的测算方法和装置
WO2020105151A1 (ja) 設備保守点検支援システム及び点検順序決定方法
RU2796370C1 (ru) Система и способ динамической визуализации загрязнения окружающей среды

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant