CN113887143A - 多源异构空气污染物的空间插值方法、装置及计算机设备 - Google Patents

多源异构空气污染物的空间插值方法、装置及计算机设备 Download PDF

Info

Publication number
CN113887143A
CN113887143A CN202111225760.9A CN202111225760A CN113887143A CN 113887143 A CN113887143 A CN 113887143A CN 202111225760 A CN202111225760 A CN 202111225760A CN 113887143 A CN113887143 A CN 113887143A
Authority
CN
China
Prior art keywords
monitoring
data
target
monitoring data
selector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111225760.9A
Other languages
English (en)
Inventor
梁浩
张晓霞
钟福金
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University of Post and Telecommunications
Original Assignee
Chongqing University of Post and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University of Post and Telecommunications filed Critical Chongqing University of Post and Telecommunications
Priority to CN202111225760.9A priority Critical patent/CN113887143A/zh
Publication of CN113887143A publication Critical patent/CN113887143A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Computer Hardware Design (AREA)
  • Geometry (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明属于空气污染检测领域,涉及一种多源异构空气污染物的空间插值方法、装置及计算机设备;所述方法包括获取目标地区的空气污染物监测站点的监测数据和地理数据;将目标地区分为多个目标分区,将目标分区的中心地理数据放入站点选择器中,选择出与目标分区相关的监测站点;采用云模型从所有监测站点中确定出与该目标分区的监测数据分布最相似的M个监测站点;并将M个监测站点的监测数据输入到M‑Transformer网络模型中,同时将该目标分区的监测数据作为训练时的标签值进行训练;直至将整个目标地区的空气污染物监测数据填补完毕。本发明采用站点打分机制和云模型去寻找与目标分区相似的站点,最终能够提高插值的准确性。

Description

多源异构空气污染物的空间插值方法、装置及计算机设备
技术领域
本发明属于空气污染检测领域,特别涉及一种多源异构空气污染物的空间插值方法、装置及计算机设备。
背景技术
现如今,随着经济社会的持续发展,国家和社会也越来越重视环境的可持续发展,其中空气污染监测是一个非常重要的部分,和人民的生活息息相关;因此越来越多的空气质量监测技术也被广泛应用,空气质量监测技术是环境保护工作中的一类重要技术,基于遥感(RS)的空气质量监测系统就是利用环境卫星及其它卫星获取的遥感数据,并以地面环境监测数据、地理信息数据、气象数据等为辅助进行区域环境的监测与评价。对监测系统获取到的数据采用空间插值的方式,利用邻近的已知空间数据对未知空间数据值进行估计和推测,完成对区域空气质量的可视化分析。
空间插值方法是区域空气质量展示与分析的基础,空间插值算法的种类较多,使用时需要结合实际情况对空间插值的算法进行再研究、改进和应用。现有的空气污染物空间插值算法大致可以分为两类,一类是基于物理方法,物理方法都是通过基于观测数据和一些经验假设去模拟空气中污染物的扩散过程,进而预测未监测地区的空气污染物情况。但是这些经验假设并不一定可以很好的满足目标地区的真实情况,因此无法获得很好的数据结果。另一类是基于数据驱动的方法,此类方法就是利用现有的空气污染物监测站的数据以及一些空间因素对空气污染物进行空间插值,空间因素包括了很多因素,例如土地利用情况、交通网络情况以及一些气象因素等,通过数据驱动的方式可以较好的发现目标地区的潜在特征,可以更好的对其空气污染物监测数据进行预测。
现有技术中,基于数据驱动的方法大部分都是使用循环神经网络,以及循环神经网络的变体长短期记忆神经网络等,而此类神经网络对于长序列数据的处理效果不佳,不能很好的发掘长时间序列的信息,会损失很多信息,并且在长时间跨度的预测中的表现并不好。另外,在训练神经网络模型的过程中,大多数时候会采用历史值作为标签;然而空间插值的目标地区自始至终都没有对应的目标值,因此在训练模型中是不能使用历史值作为标签输入,所以传统神经网络模型所输出的预测结果不具备参考价值;因此如何解决循环神经网络在长时间序列预测中效果不佳以及如何训练出空间插值数据严谨的模型,是当前亟待解决的问题。
发明内容
为解决上述问题,本发明提出了一种多源异构空气污染物的空间插值方法、装置及计算机设备。
在本发明的第一方面,本发明提供了一种多源异构空气污染物的空间插值方法,所述方法包括:
获取目标地区所有空气污染物监测站点的监测数据、位置坐标、海拔高度以及地形特征,并对其进行预处理;
将目标地区按照所需的分辨率进行网格划分,从而划分出多个目标分区,并获取缺少空气污染物监测站点的每个目标分区的中心位置坐标、海拔高度和地形特征;
将各个缺少空气污染物监测站点的目标分区的中心位置坐标、海拔高度以及地形特征放入站点选择器中,站点选择器分别按照坐标距离、海拔高度差以及地形相似度选择出与各个目标分区相关的监测站点;
将所有监测站点的监测数据以及选择出的目标分区相关的监测站点的监测数据分别输入到云模型中,从所有监测站点中确定出与目标分区相关的监测站点的监测数据分布最相似的M个监测站点;
将通过云模型计算出的M个监测站点的监测数据输入到M-Transformer网络模型中,并将通过站点选择器选择出的目标分区相关的监测站点的监测数据作为网络模型训练时的标签值进行训练;
利用在每个目标分区训练完成的M-Transformer网络模型,对相应的目标分区的空气污染物监测数据进行填补,直至将整个目标地区的空气污染物监测数据填补完毕。
在本发明的第二方面,本发明还提供了一种多源异构空气污染物的空间插值装置,所述装置包括:
数据获取模块,用于获取目标地区所有空气污染物监测站点的监测数据、位置坐标、海拔高度以及地形特征;
数据预处理模块,用于对数据获取模块所获取的数据进行预处理;
站点选择器,用于接收各个缺少空气污染物监测站点的目标分区的中心位置坐标、海拔高度以及地形特征,按照坐标距离、海拔高度差以及地形相似度选择出与各个目标分区相关的监测站点;
云模型处理器,用于将所有监测站点的监测数据以及选择出的目标分区相关的监测站点的监测数据分别输入到云模型中,从所有监测站点中确定出与目标分区相关的监测站点的监测数据分布最相似的M个监测站点;
M-Transformer网络模型,用于接收云模型计算出的M个监测站点的监测数据,并将通过站点选择器选择出的目标分区相关的监测站点的监测数据作为网络模型训练时的标签值进行训练;
数据填补模块,用于在每个目标分区训练完成的M-Transformer网络模型,对相应的目标分区的空气污染物监测数据进行填补,直至将整个目标地区的空气污染物监测数据填补完毕。
在本发明的第三方面,本发明还提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条计算机程序,所述至少一条计算机程序由所述处理器加载并执行,以实现如本发明第一方面所述的一种多源异构空气污染物的空间插值方法。
本发明的有益技术效果:
(1)本发明具有精度高的效果,能够对不同目标分区的空气污染物数据进行空间插值,甚至可以在不同目标地区之间进行预测插值。
(2)本发明中在对目标分区所对应的监测站点进行计算时使用了站点选择器,该选择器综合考虑了距离、海拔差以及地形相似程度,能够准确找出和目标分区最相似的监测站点,保证了数据可靠性。
(3)本发明首次在空气污染物预测领域使用云模型,利用云模型来分析出不同监测站点所对应的监测数据的分布情况,利用云模型可以很好的判断监测站之间数据分布的相似程度,便于找出在当前目标分区可能存在的监测站点,且相似的监测站点。
(4)本发明的模型主要由Transformer组成,并且对Transformer进行了改进,使用了多个Transformer的组合,在最后的输出之前添加了一个注意力层,将多个Transformer模块输出的预测值进行融合,有着更好的健壮性。
(5)本发明在模型训练过程中并没有使用到历史值作为标签值,保证了输入的历史数据的准确性,提高了模型的预测精确度。
附图说明
图1为本发明实施例的一种多源异构空气污染物的空间插值方法流程图;
图2为本发明实施例的站点选择器的结构示意图;
图3为本发明实施例的云模型判断数据分布相似站点的结构示意图;
图4为本发明实施例的M-Transformer网络结构示意图;
图5为本发明实施例的一种多源异构空气污染物的空间插值网络的结构示意图;
图6为本发明实施例的训练流程示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应理解,本申请提供的空气污染物空间插值方法可以应用于对城市中缺少监测站点的地区的空气污染物的预测场景,例如,用于空气污染事件预警,研究人员对空气污染物分布的分析,赛事举办参考。为了提高空气质量的准确性以及提前发现空气污染事件,本申请提供的空气污染物空间插值方法有助于研究人员了解空气污染物在整个城市中的分布情况,可以更好的分析污染物的扩散情况和导致污染的一些因素,有助于制定政策去干预空气污染的发生,确保更好的生活环境。可选地,本申请提供的空气污染物空间插值方法还可以应用于如下场景:
一、交通出行场景;
例如,用户打开专业空气污染物预报的公众号、小程序或者应用程序(application,APP),点击自己所在的地区,查询当前以及未来几小时甚至几天后的空气状况,为自己的出行提供参考,当空气污染比较少时就适合出行或进行户外锻炼,当空气污染较严重时,就取消一些出行活动。
二、赛事安排场景;
例如,赛事举办方想要举办一些赛事活动时,马拉松、运动会等,为了运动员的身体健康,应该重点参考赛事举办地在举办赛事时的空气污染物情况,根据空气污染物的情况,灵活安排赛事举办的时间以及地点。
三、工业生产场景;
例如,在某一工厂从事生产活动时,通过实时以及未来的空气污染物的分布情况,动态的安排生产活动,以及可能会发现一些污染的事件,找到问题所在,及时解决,可以保证一个更好的空气环境。
为了便于理解,图1为本发明实施例的一种多源异构空气污染物的空间插值方法流程图,如图1所示,所述空间差值方法包括:
101、获取目标地区所有空气污染物监测站点的监测数据、位置坐标、海拔高度以及地形特征,并对其进行预处理;
在一些实施例中,所述目标地区可以指的是上述应用场景中的一些自然区域,在该自然区域中配备有一个或多个空气污染物监测站点,这些空气污染物监测站点的位置坐标、海拔高度以及地形特征可以通过在线或离线地图软件等方式进行获取;例如该监测站是否在居民区、商业区或公园等附近,这些都是可以利用的数据。由于每个监测站点的地形数据属于异构数据,需要进行编码,这里采用的是将地形特征分为五类,分别对每个站点的地形数据进行01编码。
目标地区配置的空气污染物监测站点可以监测该自然区域中部分区域范围内的监测数据,具体地,其中监测数据可以为PM2.5、SO2、NO2、PM10、CO和O3中的一个或多个对应的浓度数据,监测站点可以将监测到的监测数据存储在数据库中,在数据库中存储有多个时间点对应的监测数据,且连续多个时间点对应的多个监测数据构成了监测数据序列,获取该监测数据序列,可以进行后续过程的具体判断。
应当说明的是,在本发明实施例中,获取目标地区的监测数据可以是目标区域的历史监测数据也可以是当前监测数据;具体所需的监测数据可以根据实际情况进行确定,本发明实施例对此不作具体限定。
在本发明一些实施例中,可以采用目标地区所有的空气污染物监测站的监测数据作为数据集,以某市的空气污染物监测站的监测数据为例,使用2019年一整年的小时数据,即每个监测站点都有8760条数据,使用前9个月的数据作为训练集,即前6552条数据,使用10月作为验证集,即744条数据,将剩下的数据作为测试集数据;在后续过程中,可以利用训练集数据对模型进行训练,利用验证集数据对模型进行验证,利用测试集数据调用训练测试完成后的模型实现对整个目标地区的空气污染物监测数据填补。
102、将目标地区按照所需的分辨率进行网格划分,从而划分出多个目标分区,并获取缺少空气污染物监测站点的每个目标分区的中心位置坐标、海拔高度和地形特征;
在本发明实施例中,需要将目标地区按照一定的分辨率划分成多个网格区域,每个网格区域代表一个目标分区,每个目标分区中可能包含空气污染物监测站点,也可能不包含空气污染物监测站点。具体的,这个网格划分的操作类似于图像处理,本发明将目标地区进行像素化处理,按照需要的分辨率进行网格划分,例如1km、500m、100m的分辨率,这些网格区域中,有些网格区域是有监测站点的,但是绝大部分的网格中并没有空气污染监测站,即认为这样的网格是需要填补缺失的分区,本发明需要将每个需要填补缺失的目标分区的中心位置坐标记录下来,同时也确定该目标分区所对应的海拔高度以及地形特征。
103、将各个缺少空气污染物监测站点的目标分区的中心位置坐标、海拔高度以及地形特征放入站点选择器中,站点选择器分别按照坐标距离、海拔高度差以及地形相似度选择出与各个目标分区相关的监测站点;
在本发明实施例中,由于需要填补监测数据的目标分区中,可以利用的只有一些辅助信息,该辅助信息包括该目标分区的中心位置坐标、海拔高度以及地形特征,这些辅助信息并不能反映该目标分区的空气污染物监测数据,没有历史的空气污染物监测数据可以作为数据参考,所以就要综合考虑这些数据,必须为目标分区假设出空气污染物监测站点这个操作,通过站点选择器找出对应的最佳空气污染物监测站点。
如图2所示,站点选择器中会保存有所有可用的空气污染物监测站点的位置坐标、海拔高度以及地形特征。在使用时,先将需要填补的分区位置坐标、海拔高度、地形特征进行输入到站点选择器中;站点选择器分别将距离、海拔差和地形相似度进行计算,这个操作需要对所有的监测站点进行处理;最后选择出与目标分区最相关的空气污染物监测站。
在本发明实施例中,本发明可以为每一个目标分区分配一个站点选择器,所述站点选择器可以分为距离选择器、海拔选择器以及地形特征选择器,采用距离选择器从所有空气污染物监测站点中选择出与目标分区的坐标距离相近的一个或多个监测站点;采用海拔选择器从所有空气污染物监测站点或从距离选择器选择出的多个监测站点中选择出与目标分区的海拔高度差相近的一个或多个监测站点;采用地形特征选择器从所有空气污染物监测站点或从海拔选择器选择出的多个监测站点中选择出与目标分区的地形特征相似的一个或多个监测站点;将选择出的多个监测站点中总体相似程度最靠前作为目标分区相关的监测站点。
在一些实施例中,在本发明中既可以逐次按照距离选择器、海拔选择器以及地形特征选择器选择出一个监测站点,举个例子,通过距离选择器从所有监测站点中选择出N1个监测站点,通过海拔选择器从N1个监测站点中选择出N2个监测站点,通过地形特征选择器从N2个监测站点中选择出一个与目标分区最相关的监测站点,其中N1≥N2≥1。
在另一些实施例中,本发明还可以分别按照距离选择器、海拔选择器以及地形特征选择器选择出一个监测站点;举个例子,通过距离选择器从所有监测站点中选择出N11个监测站点,通过海拔选择器从所有监测站点中选择出N21个监测站点,通过地形特征选择器从所有监测站点中选择出N31个监测站点,综合考虑N11、N21以及N31中的重合监测站点,从重合监测站点中选择出一个相似程度最高的监测站点作为目标分区最相关的监测站点,其中N11≥1、N21≥1,N31≥1。
可以理解的是,站点选择器所保存的空气污染物监测站点的位置坐标、海拔高度以及地形特征既可以包括当前目标地区的所有监测站点,也可以包括除当前目标地区以外的其他目标地区的部分或者所有监测站点,因此,在实现时,本发明可以利用其他目标地区的监测数据来填充本目标地区中目标分区的监测数据。
104、将所有监测站点的监测数据以及选择出的目标分区相关的监测站点的监测数据分别输入到云模型中,从所有监测站点中确定出与目标分区相关的监测站点的监测数据分布最相似的M个监测站点;
在本发明实施例中,如图3所示,云模型是处理定性概念和定量描述的不确定转换模型,云模型是处理定性概念和定量描述的不确定转换模型,它已经成功应用到很多领域,例如自然语言处理、数据挖掘、图像处理等领域,但是并没有在空气污染物空间插值领域进行很好的应用,在本发明这里利用了云模型的特性,云模型是通过三个特征进行表示的,分别为:期望Ex、熵En以及超熵He。该步骤中可以将每个站点的监测数据输入到云模型中,并同时计算出每个站点对应的三个数字特征,即每个站点i的监测数据的期望Exi、监测数据的熵Eni以及监测数据的超熵Hei,i∈I,I表示站点选择器中所存储的所有站点集合,该集合即可以包括当前目标地区的所有空气污染物监测站点,也可以包括其他目标分区的所有空气污染物监测站点;并且同时计算出站点选择器中选出的相关的站点的对应的三个数字特征,即站点选择器中选出的相关的站点j的监测数据的期望Exj、监测数据的熵Enj以及监测数据的超熵Hej,j∈J,J表示由站点选择器选择出的站点集合,该集合指的是不同目标分区的站点选择器选择出的站点集合;在本发明实施例中每个目标分区可以由站点选择器选择出一个站点,所以站点集合的站点个数即对应缺少空气污染物监测站点的目标分区;根据云模型的相关性计算方式,分别计算每个站点i的数据分布与目标分区相关的站点j中的数据分布之间的相关性。在使用的时候需要遍历所有的空气污染物监测站点,将所有监测站点的数据输入云模型中,分别和站点选择器中得出的监测站点进行比对,找出数据分布最为相似的M个站点。
105、将通过云模型计算出的M个监测站点的监测数据输入到M-Transformer网络模型中,并将通过站点选择器选择出的目标分区相关的监测站点的监测数据作为网络模型训练时的标签值进行训练;
在本发明实施例中,可以将通过云模型计算出的M个站点的监测数据划分为训练集、验证集和测试集,这里的训练集、验证集和测试集可以是步骤101的某一些实施例中对应训练集、验证集和测试集的子集;将这里的训练集输入到M-Transformer网络中,并且将通过站点选择器选出的对应监测站点的监测数据作为训练时的标签;
具体的,如图4所示,假设M=5,将云模型计算出的5个站点的数据,将前9个月划分为训练集进行训练,将5个站点的数据分别输入到M-Transformer网络中的5个Transformer子模块分别进行训练,最后每个Transformer子模块进行输出,输入到后面的attention层中,对5个子模块的输出进行融合,进而获得更好的结果。
其中,在本发明实施例中,Transformer网络模型主要应用了Encoder-Decoder架构,在Transformer的Encoder模块中利用了两个基础的结构,其一为多头自注意力层(Multi-head self-attention)结构,该结构是对基础的注意力层(attention)进行了改进,通过h个不同的线性变换对Q,K,V进行投影,最后将不同的attention结果拼接起来,公式表示如下:
MultiHead(Q,K,V)=Concat(head1,...,headh)WO
headi=Attention(QWii Q,KWi K,VWi V)
其二为Position-wise feed-forward networks,这部分主要是提供非线性变换,相当于一个全连接层,并且在通过线性层时每个位置i的变换参数时相同的。Decoder部分结构与Encoder类似,在Decoder中有一个Mask功能,该功能是为了保证训练阶段和推理阶段的一致性。
在训练过程中,计算出预测得到的目标分区的空气污染物监测数据与作为标签值的选择出的目标分区相关的监测站点的监测数据之间的平均绝对误差MAE,当该平均绝对误差趋于稳定时,输出训练完成的M-Transformer模型。
可以理解的是,在空间插值方法中,目标分区中监测数据是没有历史监测数据值,所以本发明利用站点选择器选出的那个监测站点的监测数据作为训练时的标签值,将该标签值与M-Transformer网络模型预测得到的监测数据值进行比较,当MAE趋于稳定,意味着该目标分区预测得到的监测数据结果是较为准确的,此时的M-Transformer网络模型也属于较为优秀的状态,后续过程中可以使用验证集继续对M-Transformer网络模型调优。
需要强调的是,M-Transformer模型的输入的数据为利用云模型得到的站点的历史数据,包括了空气污染物数据(PM2.5、PM10等)以及通过因果分析得出的与目标预测污染物数据最相关的当前的气象数据(湿度、温度等)。
106、利用在每个目标分区训练完成的M-Transformer网络模型,对相应的目标分区的空气污染物监测数据进行填补,直至将整个目标地区的空气污染物监测数据填补完毕。
在本发明实施例中,图5为本发明实施例的一种多源异构空气污染物的空间插值网络的结构示意图,如图5所示,每一个目标分区(1,2,…,n)会单独使用一个站点选择器,且单独使用云模型进行处理;每个云模型输出的结果也会单独对应一个M-Transformer网络模型;对每个M-Transformer网络模型分别进行训练,该模型能够准备反映出该目标分区的一些隐特征;利用该模型,可以将目标分区的空气污染物数据进行填补,不论是历史的监测数据值,还是当前的监测数据值,或者是未来的监测数据值,都可以根据实际需要进行填补。
在本发明实施例中,重复训练模型以及填补对应分区缺失空气污染物数据的过程,将每个目标分区训练出对应的模型,利用所有模型将整个目标平面的空气污染物数据填补完毕。具体的,保存每个缺失值的分区训练出的模型,利用这些模型分别将对应的目标分区进行填补,这样就可以获得一个完整的面数据,是一个从点到面的过程,可以得出整个目标地区的空气污染物监测数据的可视化分布结果。
需要强调的是,在实际的应用中,目标分区的污染物数据是不存在的,所以模型训练时只能使用站点选择器选出的站点作为Label。但是在整个模型的训练以及测试过程中,目标分区的值都是已知的,只是在训练模型时不使用,即训练模型时与最终测试时使用的Label数据是不同的,这样保证了模型的严谨性。在训练时,输入模型的数据是通过云模型选择出的站点的数据,Label使用的是站点选择器中选择出的站点的数据;在测试时,输入模型的数据是与训练时是相同的,但是测试时使用的Label是目标分区的真实数据。这样是由于想要评判模型的好坏,所以将已知污染物数据的地区作为目标分区进行预测,而在真实使用的过程中,即面对未知监测数据的目标分区,此时,本发明的M-Transformer网络模型已经训练完成,所以在实际的预测过程中,并不需要再次测试模型,只需要输入待插值的目标地区所有空气污染物监测站点的监测数据、位置坐标、海拔高度以及地形特征;就可以直接对目标分区的污染物数据进行预测插值即可。
还需要强调的是,本发明可以根据实际需求,利用历史数据预测出缺少空气污染物监测站点地区的当前以及未来的空气污染物数据,本发明可以考虑当下站点的一些影响因素,包括当前的地理数据和气象数据(湿度、温度等),来反映出待预测站点的一些客观规律,从而得到待预测站点的空气污染物数据。
在本发明另一些实施例中,本发明还提供了一种多源异构空气污染物的空间插值装置,所述装置包括:
数据获取模块,用于获取目标地区所有空气污染物监测站点的监测数据、位置坐标、海拔高度以及地形特征;
在本发明实施例中,所述数据获取模块可以具有与现有空气污染物数据平台API接口相匹配的数据接入接口,通过该数据接入接口即可获得目标地区的空气污染物监测站点的监测数据和地理数据;这里的地理数据包括空气污染物监测站点的位置坐标、海拔高度以及地形特征。
数据预处理模块,用于对数据获取模块所获取的数据进行预处理;
在本发明实施例中,由于每个监测站点的地形数据属于异构数据,需要进行编码,这里采用的是将地形特征分为五类,分别对每个站点的地形数据进行01编码。
站点选择器,用于接收各个缺少空气污染物监测站点的目标分区的中心位置坐标、海拔高度以及地形特征,按照坐标距离、海拔高度差以及地形相似度选择出与各个目标分区相关的监测站点;
在本发明实施例中,本发明可以为每一个目标分区分配一个站点选择器,所述站点选择器可以分为距离选择器、海拔选择器以及地形特征选择器,采用距离选择器从所有空气污染物监测站点中选择出与目标分区的坐标距离相近的一个或多个监测站点;采用海拔选择器从所有空气污染物监测站点或从距离选择器选择出的多个监测站点中选择出与目标分区的海拔高度差相近的一个或多个监测站点;采用地形特征选择器从所有空气污染物监测站点或从海拔选择器选择出的多个监测站点中选择出与目标分区的地形特征相似的一个或多个监测站点;将选择出的多个监测站点中总体相似程度最靠前作为目标分区相关的监测站点。
云模型处理器,用于将所有监测站点的监测数据以及选择出的目标分区相关的监测站点的监测数据分别输入到云模型中,从所有监测站点中确定出与目标分区相关的监测站点的监测数据分布最相似的M个监测站点;
在本发明实施例中,通过云模型的方式,将站点选择器选择出的监测站点的监测数据与所有监测站点的监测数据的分布进行逐一对比,选择出站点选择器选择出的监测站点的监测数据分布最相似的M个监测站点的监测数据。
M-Transformer网络模型,用于接收云模型计算出的M个监测站点的监测数据,并将通过站点选择器选择出的目标分区相关的监测站点的监测数据作为网络模型训练时的标签值进行训练;
在本发明实施例中,将M个监测站点的监测数据输入到M-Transformer网络模型中,并将站点选择器选择出的目标分区相关的监测站点的监测数据作为网络模型训练时的标签值进行训练,能够避免目标分区使用并不存在的历史监测数据值,保证了模型的可靠性。
数据填补模块,用于在每个目标分区训练完成的M-Transformer网络模型,对相应的目标分区的空气污染物监测数据进行填补,直至将整个目标地区的空气污染物监测数据填补完毕。
在本发明实施例中,该数据填补模块即可以填补当前目标地区中所有目标分区的历史数据,也可以填补所有目标分区的当前数据,也可以填补所有目标分区的未来数据,当然还可以借用其他目标地区的监测数据来填补当前目标地区的目标分区的监测数据,本发明对此不作具体的限制。
在一些实施例中,本发明可以使用Adam优化器进行训练调节,经过多轮训练后,神经网络趋于稳定,迭代训练结束,训练过程如图6所示:
获取目标分区坐标后,通过站点选择器选出相应的站点;
根据站点选择器的结果,利用云模型找出用于训练的站点;
将训练集输入进行空间插值的M-Transformer网络,并进行多次迭代;
利用Adam优化器进行优化,直到均方根误差趋于平稳;
此时,结束训练并保存训练好的神经网络模型。
在一些实施例中,本发明实施例还提供了计算机设备,该计算机可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,该指令、该程序、该代码集或该指令集由处理器加载并具有以实现上述实施例的一种多源异构空气污染物的空间插值方法中所具有的操作。
可以理解的是,本发明实施例中通过站点选择器的站点打分机制来选择出与当前目标分区的相关的站点,能够保证选择出的站点的可靠性,同时还结合云模型能够选择出与该站点数据分布相关的若干站点,能够避免单个站点的数据孤立性,保证了监测数据的可靠性。本发明再利用多头Transformer网络模型对监测数据进行训练测试,能够保证最终预测得到的监测数据的准确性。
在本发明的描述中,需要理解的是,术语“同轴”、“底部”、“一端”、“顶部”、“中部”、“另一端”、“上”、“一侧”、“顶部”、“内”、“外”、“前部”、“中央”、“两端”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
在本发明中,除非另有明确的规定和限定,术语“安装”、“设置”、“连接”、“固定”、“旋转”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或成一体;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系,除非另有明确的限定,对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (8)

1.一种多源异构空气污染物的空间插值方法,其特征在于,所述方法包括:
获取目标地区所有空气污染物监测站点的监测数据、位置坐标、海拔高度以及地形特征,并对其进行预处理;
将目标地区按照所需的分辨率进行网格划分,从而划分出多个目标分区,并获取缺少空气污染物监测站点的每个目标分区的中心位置坐标、海拔高度和地形特征;
将各个缺少空气污染物监测站点的目标分区的中心位置坐标、海拔高度以及地形特征放入站点选择器中,站点选择器分别按照坐标距离、海拔高度差以及地形相似度选择出与各个目标分区相关的监测站点;
将所有监测站点的监测数据以及选择出的目标分区相关的监测站点的监测数据分别输入到云模型中,从所有监测站点中确定出与目标分区相关的监测站点的监测数据分布最相似的M个监测站点;
将通过云模型计算出的M个监测站点的监测数据输入到M-Transformer网络模型中,并将通过站点选择器选择出的目标分区相关的监测站点的监测数据作为网络模型训练时的标签值进行训练;
利用在每个目标分区训练完成的M-Transformer网络模型,对相应的目标分区的空气污染物监测数据进行填补,直至将整个目标地区的空气污染物监测数据填补完毕。
2.根据权利要求1所述的一种多源异构空气污染物的空间插值方法,其特征在于,对地形特征进行预处理的过程包括对每个空气污染物监测站点的地形特征进行编码,采用二进制编码将地形特征划分为多种类型。
3.根据权利要求1所述的一种多源异构空气污染物的空间插值方法,其特征在于,所述站点选择器分别按照坐标距离、海拔高度差以及地形相似度选择出与各个目标分区相关的监测站点包括为每一个目标分区分配一个站点选择器,所述站点选择器分为距离选择器、海拔选择器以及地形特征选择器,采用距离选择器从所有空气污染物监测站点中选择出与目标分区的坐标距离相近的一个或多个监测站点;采用海拔选择器从所有空气污染物监测站点或从距离选择器选择出的多个监测站点中选择出与目标分区的海拔高度差相近的一个或多个监测站点;采用地形特征选择器从所有空气污染物监测站点或从海拔选择器选择出的多个监测站点中选择出与目标分区的地形特征相似的一个或多个监测站点;将选择出的多个监测站点中总体相似程度最靠前作为目标分区相关的监测站点。
4.根据权利要求1所述的一种多源异构空气污染物的空间插值方法,其特征在于,所述从所有监测站点中确定出与目标分区相关的监测站点的监测数据分布最相似的M个监测站点包括采用云模型将目标分区相关的监测站点的监测数据分别与所有监测站点的监测数据进行一一对比,从所有监测站点中选择出数据分布最相似的M个监测站点。
5.根据权利要求1所述的一种多源异构空气污染物的空间插值方法,其特征在于,所述将通过云模型计算出的M个监测站点的监测数据输入到M-Transformer网络模型中,并将通过站点选择器选择出的目标分区相关的监测站点的监测数据作为网络模型训练时的标签值进行训练包括将云模型计算出的每个监测站点的监测数据输入到M-Transformer网络模型中对应的Transformer子模块中,对M个Transformer子模块的输出结果采用注意力层进行融合,输出预测得到的目标分区的空气污染物监测数据;将站点选择器选择出的目标分区相关的监测站点的监测数据作为M-Transformer网络模型训练时的标签值;计算出预测得到的目标分区的空气污染物监测数据与作为标签值的选择出的目标分区相关的监测站点的监测数据之间的平均绝对误差,当该平均绝对误差趋于稳定时,输出训练完成的M-Transformer模型。
6.根据权利要求1所述的一种多源异构空气污染物的空间插值方法,其特征在于,所述利用训练完成出的M-Transformer网络模型,对相应的目标分区的空气污染物监测数据进行填补,直至将整个目标地区的空气污染物监测数据填补完毕包括对应每个缺少空气污染物监测站点的目标分区,在该目标分区训练完成的M-Transformer网络模型中,输入该目标分区对应的M个监测站点的监测数据对应时间的监测数据,预测得到该目标分区在对应时间的空气污染物监测数据。
7.一种多源异构空气污染物的空间插值装置,其特征在于,所述装置包括:
数据获取模块,用于获取目标地区所有空气污染物监测站点的监测数据、位置坐标、海拔高度以及地形特征;
数据预处理模块,用于对数据获取模块所获取的数据进行预处理;
站点选择器,用于接收各个缺少空气污染物监测站点的目标分区的中心位置坐标、海拔高度以及地形特征,按照坐标距离、海拔高度差以及地形相似度选择出与各个目标分区相关的监测站点;
云模型处理器,用于将所有监测站点的监测数据以及选择出的目标分区相关的监测站点的监测数据分别输入到云模型中,从所有监测站点中确定出与目标分区相关的监测站点的监测数据分布最相似的M个监测站点;
M-Transformer网络模型,用于接收云模型计算出的M个监测站点的监测数据,并将通过站点选择器选择出的目标分区相关的监测站点的监测数据作为网络模型训练时的标签值进行训练;
数据填补模块,用于在每个目标分区训练完成的M-Transformer网络模型,对相应的目标分区的空气污染物监测数据进行填补,直至将整个目标地区的空气污染物监测数据填补完毕。
8.一种计算机设备,其特征在于,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条计算机程序,所述至少一条计算机程序由所述处理器加载并执行,以实现如权利要求1~7任一所述的一种多源异构空气污染物的空间插值方法。
CN202111225760.9A 2021-10-21 2021-10-21 多源异构空气污染物的空间插值方法、装置及计算机设备 Pending CN113887143A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111225760.9A CN113887143A (zh) 2021-10-21 2021-10-21 多源异构空气污染物的空间插值方法、装置及计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111225760.9A CN113887143A (zh) 2021-10-21 2021-10-21 多源异构空气污染物的空间插值方法、装置及计算机设备

Publications (1)

Publication Number Publication Date
CN113887143A true CN113887143A (zh) 2022-01-04

Family

ID=79003994

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111225760.9A Pending CN113887143A (zh) 2021-10-21 2021-10-21 多源异构空气污染物的空间插值方法、装置及计算机设备

Country Status (1)

Country Link
CN (1) CN113887143A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114118637A (zh) * 2022-01-28 2022-03-01 树根互联股份有限公司 一种配件需求的预测模型构建方法、装置及计算机设备
CN114662791A (zh) * 2022-04-22 2022-06-24 重庆邮电大学 一种基于时空注意力的长时序pm2.5预测方法及系统
CN115130747A (zh) * 2022-06-28 2022-09-30 重庆邮电大学 一种基于云模型的空气污染物浓度预测方法及系统
CN115326661A (zh) * 2022-10-12 2022-11-11 深圳市源清环境技术服务有限公司 一种基于大气环境的监测方法、系统和可读存储介质
CN117350175A (zh) * 2023-12-04 2024-01-05 河北东医生物科技有限公司 人工智能生态因子空气环境质量监测方法及系统

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114118637A (zh) * 2022-01-28 2022-03-01 树根互联股份有限公司 一种配件需求的预测模型构建方法、装置及计算机设备
CN114662791A (zh) * 2022-04-22 2022-06-24 重庆邮电大学 一种基于时空注意力的长时序pm2.5预测方法及系统
CN115130747A (zh) * 2022-06-28 2022-09-30 重庆邮电大学 一种基于云模型的空气污染物浓度预测方法及系统
CN115326661A (zh) * 2022-10-12 2022-11-11 深圳市源清环境技术服务有限公司 一种基于大气环境的监测方法、系统和可读存储介质
CN117350175A (zh) * 2023-12-04 2024-01-05 河北东医生物科技有限公司 人工智能生态因子空气环境质量监测方法及系统
CN117350175B (zh) * 2023-12-04 2024-03-12 河北东医生物科技有限公司 人工智能生态因子空气环境质量监测方法及系统

Similar Documents

Publication Publication Date Title
CN113887143A (zh) 多源异构空气污染物的空间插值方法、装置及计算机设备
Yagli et al. Can we justify producing univariate machine-learning forecasts with satellite-derived solar irradiance?
CN105974495B (zh) 利用分类拟合法预判目标区域未来平均云量的方法
CN111027175A (zh) 基于耦合模型集成模拟的洪水对社会经济影响的评估方法
CN113344291B (zh) 城市内涝淹没范围的预报方法、装置、介质和设备
CN116205541B (zh) 评估本地污染源对环境空气质量影响的方法及装置
CN110991262A (zh) 生态服务价值预测的多带宽地理加权回归元胞自动机方法
CN113505521B (zh) 一种耦合神经网络-数值模拟的城市内涝快速预报方法
CN103413036A (zh) 一种连续化的森林火险天气等级预报模型及应用
CN113779760A (zh) 基于可预测气候模态的动力-统计结合季节气候预测方法
CN110826244A (zh) 模拟轨道交通影响城市生长的共轭梯度元胞自动机方法
CN117592005B (zh) Pm2.5浓度卫星遥感估算方法、装置、设备及介质
Li et al. Generating daily high-resolution and full-coverage XCO2 across China from 2015 to 2020 based on OCO-2 and CAMS data
CN116050935B (zh) 一种确定生物多样性优先保护地信息的方法及装置
CN115983478A (zh) 分布式光伏发电功率预测分析方法、系统、终端及介质
CN113988417A (zh) 基于卫星遥感的近地面pm2.5浓度预测方法与系统
Li et al. DeepPhysiNet: Bridging Deep Learning and Atmospheric Physics for Accurate and Continuous Weather Modeling
CN113971348A (zh) 一种基于综合能源系统的源端功率短期预测方法
CN117611108B (zh) 一种城乡建设用地有偿调剂的智能决策构建方法
CN117390590B (zh) 一种基于cim模型的数据管理方法及系统
CN117589646B (zh) 大气细颗粒物浓度监测方法、装置、设备及介质
CN116629415A (zh) 一种基于地理加权回归的就业岗位预测方法、设备、介质
CN113115231B (zh) 基于lbs的数据处理系统
CN117332906B (zh) 基于机器学习的三维时空网格空气质量预测方法及系统
Allen-Dumas et al. A Spatiotemporal Sequence Forecasting Platform to Advance the Prediction of Changing Spatiotemporal Patterns of CO2 Concentration by Incorporating Human Activity and Hydrological Extremes

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination