CN115840881A - 空气数据处理方法、装置及相关设备 - Google Patents
空气数据处理方法、装置及相关设备 Download PDFInfo
- Publication number
- CN115840881A CN115840881A CN202310115173.7A CN202310115173A CN115840881A CN 115840881 A CN115840881 A CN 115840881A CN 202310115173 A CN202310115173 A CN 202310115173A CN 115840881 A CN115840881 A CN 115840881A
- Authority
- CN
- China
- Prior art keywords
- data
- time sequence
- target
- air
- target station
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Complex Calculations (AREA)
Abstract
本发明公开了一种空气数据处理方法、装置、计算机设备及存储介质,所述方法包括:获取目标站点和相邻站点的原始数据;去除原始数据中的异常值,并对去除异常值之后的原始数据进行标准化处理;基于标准化处理之后的目标站点的数据计算得到每一个数据对应的掩码矩阵m;对标准化处理之后的数据进行填补处理得到填补之后的数据;基于填补之后的数据和掩码矩阵m,利用训练完成之后的空气数据补全模型对目标站点的原始数据进行补全,所述空气数据补全模型包含所述目标站点的原始数据之间的时序关系和所述目标站点与所述目标站点连接的相邻站点的空间关系。采用本发明可以提高对异常数据或缺失数据的补全精度。
Description
技术领域
本发明涉及数据处理技术领域,尤其涉及一种空气数据处理方法、装置、计算机设备及存储介质。
背景技术
在常规的空气质量监测过程中,监测站点的监测仪器进行监测仪器校零、校标等日常维护行为,当出现仪器故障、通信故障、停电等情况时,可能会导致一些监测站点出现监测数据异常或缺失等现象,空气质量监测数据存在的异常与缺失会影响公众对所需区域内的空气质量数据的获取,以及用这些数据做一些后续处理操作。
目前为了满足公众对于及时、准确的空气质量监测数据的需求,不影响后续对该数据的进一步处理,一般都是基于统计学方法对异常值进行删除且对缺失值用均值填充或上一值填充等方式进行处理,但是该方法损害了数据中所蕴含的信息,导致所得到的空气质量数据不够准确,同时也对后续数据处理分析带来了不良影响。
因此,如何在空气质量数据出现异常或缺失的情况下提高缺失数据的补全精度是目前亟待解决的技术问题。
发明内容
本发明实施例提供一种空气数据处理方法、装置、计算机设备和存储介质,以提高异常数据或缺失数据的补全精度,满足公众及后续数据处理对空气质量数据的准确性要求。
为了解决上述技术问题,本申请实施例提供一种空气数据处理方法,包括以下步骤:
获取目标站点和与所述目标站点连接的相邻站点的原始数据,所述原始数据包括正常值和异常值;
去除所述原始数据中的异常值,并对去除异常值之后的原始数据进行标准化处理;
基于所述标准化处理后的目标站点的数据,计算得到所述目标站点的每一个数据对应的掩码矩阵m;
对所述目标站点标准化处理之后的数据和所述相邻站点标准化处理之后的数据进行填补处理,得到填补之后的数据;
基于所述填补之后的数据和所述掩码矩阵m,利用训练完成之后的空气数据补全模型对目标站点的原始数据进行补全,得到补全之后的空气数据,其中,所述空气数据补全模型包含所述目标站点的原始数据之间的时序关系和所述目标站点与所述目标站点连接的相邻站点的空间关系。
在一种可能的实现方式中,所述空气数据补全模型包括时间特征提取模型和空间特征提取模型,所述时间特征提取模型用于获取蕴含所述目标站点原始数据时序关系的第一历史记忆向量,所述空间特征提取模型用于获取蕴含所述目标站点与所述目标站点连接的相邻站点空间关系的第二历史记忆向量。
在另一种可能的实现方式中,在利用训练完成之后对的空气数据补全模型对目标站点的原始数据进行补全之前,建立所述目标站点和与所述目标站点连接的相邻站点的完全图,所述相邻站点包括以所述目标站点为圆心,半径为第一预设值内的所有站点;根据所述完全图,得到邻接矩阵A、度矩阵D和距离特征矩阵B,其中,所述邻接矩阵A、所述度矩阵D和所述距离特征矩阵B包含所述目标站点与所述相邻站点的空间信息。
在另一种可能的实现方式中,所述空气数据补全模型的训练过程具体包括:从所述标准化处理之后的目标站点的数据中选取n条时序数据,并输入至所述时间特征提取模型得到所述第一历史记忆向量;将所述n条时序数据、与所述n条时序数据对应同时间的相邻站点的时序数据、所述邻接矩阵A、所述度矩阵D和距离特征矩阵B输入至空间特征提取模型中,得到所述第二历史记忆向量;将所述第一历史记忆向量和所述第二历史记忆向量输入至编码器,得到低维特征表达向量z,并将所述低维特征表达向量z输入解码器得到重构的所述目标站点的时序数据;基于所述掩码矩阵m、所述目标站点的时序数据/>、所述标准化处理之后的目标站点的数据更新所述空气数据补全模型,得到更新后的空气数据补全模型,其中,所述更新后的空气数据补全模型具有数据填补功能。
在另一种可能的实现方式中,所述对去除异常值之后的原始数据进行标准化处理包括:计算所述原始数据中正常值的均值和标准差;利用正常值与所述均值的差值除以所述标准差,得到所述标准化处理之后的目标站点的数据和所述相邻站点的数据。
在另一种可能的实现方式中,所述基于所述填补之后的数据和所述掩码矩阵m,利用训练完成之后的空气数据补全模型对目标站点的原始数据进行补全,得到补全之后的空气数据,包括:将所述标准化处理之后的目标站点的数据和所述相邻站点的数据、重构的所述目标站点的时序数据和所述掩码矩阵m输入更新后的空气数据补全模型,得到补全后的所述目标站点的时序数据ximputed,将所述补全后的所述目标站点的时序数据ximputed进行逆标准化得到补全后的空气数据。
为了解决上述技术问题,本申请实施例还提供一种空气数据补全装置,包括:
数据采集模块,用于采集目标站点和与所述目标站点连接的相邻站点的原始数据,所述原始数据包括正常值和异常值;
数据标准化模块,用于去除所述原始数据中的异常值,并对去除异常值之后的原始数据进行标准化处理;
数据处理模块,用于计算得到所述目标站点的每一个数据对应的掩码矩阵m;对所述目标站点标准化处理之后的数据和所述相邻站点标准化处理之后的数据进行填补处理,得到填补之后的数据;
数据补全模块,用于基于所述填补之后的数据和所述掩码矩阵m,利用训练完成之后的空气数据补全模型对目标站点的原始数据进行补全,得到补全之后的空气数据,其中,所述空气数据补全模型包含所述目标站点的原始数据之间的时序关系和所述目标站点与所述目标站点连接的相邻站点的空间关系。
为了解决上述技术问题,本申请实施例还提供一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。
为了解决上述技术问题,本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述方法的步骤。
本发明实施例提供的空气数据处理方法、装置、计算机设备及存储介质,在获取到目标站点和与目标站点连接的相邻站点的原始数据之后,通过改进后的空气数据补全模型充分提取目标站点原始数据中蕴含的时序因素以及目标站点与相邻站点关联的空间关系,该空气数据补全模型针对目标站点原始数据中删除异常值所带来的缺失与数据本身存在的缺失,能够有效的捕捉时序数据的时序因子并强化了对缺失时刻点数据的前一时刻和后一时刻的信息提取,另外考虑了各个相邻站点与目标站点之间的距离因素,从而完成对有异常值或缺失值的空气数据进行补全。通过此方法能够实现空气质量数据的高精度补全,可以满足公众对于及时、准确的空气质量数据的需求及研究者对这些数据进行后续处理。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请可以应用于其中的示例性系统架构图。
图2是本申请的空气数据处理方法的一个实施例的流程图。
图3是本申请的空气数据补全模型的训练过程的流程图。
图4是根据本申请的空气数据处理装置的一个实施例的结构示意图。
图5是根据本申请的计算机设备的一个实施例的结构示意图。
实施方式
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同;本文中在申请的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本申请;本申请的说明书和权利要求书及上述附图说明中的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。本申请的说明书和权利要求书或上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,如图1所示,系统架构100可以包括编码器110和解码器120,编码器110用于结合目标站点原始数据的时序信息以及目标站点与相邻站点之间的空间信息,通过全连接层输出低维特征表达向量z,解码器120用于将编码器110输出的低维特征表达向量z进行重构,输出完整的目标站点的时序数据。具体地,编码器110包括时间特征提取模型1110、空间特征提取模型1120和全连接层1130,时间特征提取模型1110利用时间卷积网络(TCN)和双向循环神经网络(Enhanced-GRU)对输入的目标站点采集的空气质量数据进行处理得到相应的蕴含时序关系的历史记忆向量,空间特征提取模型1120基于预先建立的完全图,利用图卷积网络(Improved-GCN)进行处理得到相应的蕴含空间关系的历史记忆向量,然后通过全连接层1130对所有并联在一起的历史记忆向量进行降维处理,输出低维特征表达向量z,解码器120接收到低维特征表达向量z之后,利用Enhanced-GRU对其进行重构,最终输出完整的目标站点的时序数据。
需要说明的是,本申请实施例所提供的系统100可以部署在任意一个具备通信能力和计算能力的服务器中,例如边缘服务器、中心服务器等。本申请实施例所提供的空气数据处理方法由服务器执行,相应地,空气数据处理装置设置于服务器中。
请参阅图2,图2示出本申请实施例提供的一种空气数据处理方法,详述如下。
S201、获取目标站点和与所述目标站点连接的相邻站点的原始数据,所述原始数据包括正常值和异常值。
具体地,在获取目标站点和相邻站点的原始数据过程中,主要是获取所监测到的空气质量数据,例如PM2.5、PM10、SO2、NO2、CO、O3等,然后根据国标(HJ654-2013)判断这些数据值是否处于正常范围之内,若处于该范围内,则认为该值为正常值,否则为异常值,当某个时刻点不存在数据(即数据缺失),也认定其为异常值。
S202、去除所述原始数据中的异常值,并对去除异常值之后的原始数据进行标准化处理。
其中,x为采集到的正常值,xnormalized为经过标准化处理之后得到的数据。
其中,x´normalized为经过标准化处理之后得到的数据。
S203、基于所述标准化处理后的目标站点的数据,计算得到所述目标站点的每一个数据对应的掩码矩阵m。
S204、对所述目标站点标准化处理之后的数据和所述相邻站点标准化处理之后的数据进行填补处理,得到填补之后的数据。
S205、基于所述填补之后的数据和所述掩码矩阵m,利用训练完成之后的空气数据补全模型对目标站点的原始数据进行补全,得到补全之后的空气数据,其中,所述空气数据补全模型包含所述目标站点的原始数据之间的时序关系和所述目标站点与所述目标站点连接的相邻站点的空间关系。
具体地,空气数据补全模型包括时间特征提取模型和空间特征提取模型,时间特征模型利用Enhanced-GRU强化了对缺失数据的前后时刻的信息提取,从而更有利于准确的补全数据,空间特征提取模型利用Enhanced-GRU提取目标站点和相邻站点之间的空间信息,对站点之间的联系程度的强弱进行量化,充分考虑了站点之间距离因素的影响,因此,空气数据补全模型能够提高补全数据的精确度。
进一步的,空气数据补全模型在进行工作之前,需要对其进行训练,以使得其具备补全数据的能力,为了更清楚的说明空气数据补全模型的数据补全原理和极致,下面将结合图3对空气数据补全模型的训练过程进行详细描述。
S301、建立完全图,根据所述完全图得到邻接矩阵A、度矩阵B和距离特征矩阵B。
具体地,首先找出目标站点为圆心,第一预设值为半径内的圆内所有的监测站点,然后建立一个完全图,每个站点为一个节点,节点之间都用边相连,其中,第一预设值可以根据实际需要进行选取,例如可以选择为100km,本申请对此不作限定。
其中,ilo和ila分别是站点i的经纬度,jlo和jla分别是站点j的经纬度。
S302、从标准化处理之后的目标站点的数据中选取n条时序数据输入至时间特征提取模型中得到第一历史记忆向量。
具体地,时间特征提取模型在接收到输入的数据之后,可以通过下列公式计算得到相对应时刻的单元状态和输出:此公式所得到的et表示增强提取到的前后时刻中的特征信息,其中,tanh为激活函数,用于将输入映射到-1到1之间的值,We和Ue为对应的权重参数。/>此公式得到的zt决定了xt、ht-1和et的信息有多少保留到了当前时刻ht,其中,xt为当前时刻的输入,ht-1为上一时刻的隐藏状态,σ为sigmoid函数,用于将输入映射为0到1之间的值,Wz、Ut、Vt为对应的权重参数。/>/>
此公式得到的ht为最终得到的隐藏状态,即第一历史记忆向量。
需要说明的是,与传统的GRU所涉及的内部公式相比,本申请实施例引入了状态参数et,该状态参数记录了当前时刻前后的空气质量的状态,可以增强前后时刻对当前时刻的影响,即对短时序因子的捕捉效果显著,而由于空气质量数据具有较强的时效性,因此引入的状态参数et能够提高后续的补全数据的精确度。
S303、将所述n条时序数据、与所述n条时序数据对应同时间的相邻站点的时序数据、所述邻接矩阵A、所述度矩阵B和所述距离特征矩阵B输入至空间特征提取模型中,得到第二历史记忆向量。
具体地,空间特征提取模型在接收到输入的数据之后,可以通过下列公式计算得到相对应的单元状态和输出:此公式得到的Hl+1为提取到的空间信息,即第二历史记忆向量,其中,A为图的邻接矩阵,D为度矩阵,Hl为图的顶点属性矩阵,Wl为对应的权重参数,/>,I为单位矩阵,由于未考虑自身的影响,因此需要加上一个单位矩阵,同理,对于度矩阵D来说,/> ,Wf为对应的权重参数,B为图的距离特征矩阵,值得说明的是,该F能够根据距离,削弱站点之间的影响,站点距离越大,F值越小,其联系越弱,影响就越小。
S304、将所述第一历史记忆向量和所述第二历史记忆向量输入至编码器,得到低维特征表达向量z。
具体地,将时间特征提取模型输出的第一历史记忆向量和空间特征提取模型输出的第二历史记忆向量并联在一起,然后通过全连接层进行降维处理,输出低维特征表达向量z。
经过降维处理之后,所输出的低维特征表达向量z的维度仅为输入数据的一半。
具体地,利用梯度下降算法更新模型,输入掩码矩阵m、完整的目标站点的时序数据
其中,等号之前的w表示更新之后的权重参数,等号之后的w表示更新之前的权重参数,α表示梯度裁剪。
经过上述训练过程之后可以得到具备数据补全能力的空气数据补全模型,该模型不仅可以有效捕捉短时序因子,充分提取站点监测数据中蕴含的时序因素,还可以通过距离度量其他站点在空间维度上所带来的影响,从而确保所补全的数据更加精准。
其中,ximputed为填补后的站点的时序数据,其他参数的含义与上述一致,在此不再赘述。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
图4示出与上述实施例空气数据处理方法一一对应的空气数据处理装置的原理框图。如图4所示,该空气数据处理装置包括数据采集模块410、数据标准化模块420、数据处理模块430和数据补全模块440。各功能模块详细说明如下。
数据采集模块410,用于采集目标站点和与所述目标站点连接的相邻站点的原始数据,所述原始数据包括正常值和异常值。
数据标准化模块420,用于去除所述原始数据中的异常值,并对去除异常值之后的原始数据进行标准化处理。
数据处理模块430,用于计算得到所述目标站点的每一个数据对应的掩码矩阵m;对所述目标站点标准化处理之后的数据和所述相邻站点标准化处理之后的数据进行填补处理,得到填补之后的数据。
数据补全模块440,用于基于所述填补之后的数据和所述掩码矩阵m,利用训练完成之后的空气数据补全模型对目标站点的原始数据进行补全,得到补全之后的空气数据,其中,所述空气数据补全模型包含所述目标站点的原始数据之间的时序关系和所述目标站点与所述目标站点连接的原始站点的空间关系。
在本实施例的一些可选的实现方式中,空气数据补全模型包括时间特征提取模型和空间特征提取模型,时间特征提取模型用于获取蕴含所述目标站点原始数据时序关系的第一历史记忆向量,空间特征提取模型用于获取蕴含所述目标站点与所述目标站点连接的相邻站点空间关系的第二历史记忆向量。
在本实施例的一些可选的实现方式中,空气数据补全装置还包括图建立模块450,所述图建立模块450,用于建立所述目标站点和与所述目标站点连接的相邻站点的完全图,所述相邻站点包括以所述目标站点为圆心,半径为第一预设值内的所有站点;所述数据处理模块,还用于根据所述完全图,得到邻接矩阵A、度矩阵D和距离特征矩阵B,其中,所述邻接矩阵A、所述度矩阵D和所述距离特征矩阵B包含所述目标站点与所述相邻站点的空间信息。
在本实施例的一些可选的实现方式中,数据补全模块440包括以下单元:
选取单元,用于从所述标准化处理之后的目标站点的数据中选取n条时序数据,并输入至所述时间特征提取模型得到所述第一历史记忆向量。
计算单元,用于将所述n条时序数据、与所述n条时序数据对应同时间的相邻站点的时序数据、所述邻接矩阵A、所述度矩阵D和距离特征矩阵B输入至空间特征提取模型中,得到所述第二历史记忆向量。
编解码单元,用于将所述第一历史记忆向量和所述第二历史记忆向量输入至编码器,得到低维特征表达向量z,并将所述低维特征表达向量z输入解码器得到重构的所述目标站点的时序数据。更新单元,用于基于所述掩码矩阵m、所述目标站点的时序数据/>、所述标准化处理之后的目标站点的数据更新所述空气数据补全模型,得到更新后的空气数据补全模型,其中,所述更新后的空气数据补全模型具有数据填补功能。
在本实施例的一些可选的实现方式中,数据标准化模块420具体用于:计算所述原始数据中正常值的均值和标准差;利用正常值与所述均值的差值除以所述标准差,得到所述标准化处理之后的目标站点的数据和所述相邻站点的数据。在本实施例的一些可选的实现方式中,数据补全模块440,具体用于:将所述标准化处理之后的目标站点的数据和所述相邻站点的数据、重构的所述目标站点的时序数据和所述掩码矩阵m输入更新后的空气数据补全模型,得到补全后的所述目标站点的时序数据ximputed,将所述补全后的所述目标站点的时序数据ximputed进行逆标准化得到补全后的空气数据。
关于空气数据处理装置的具体限定可以参见上文中对于空气数据处理方法的限定,在此不再赘述。上述空气数据处理装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
为解决上述技术问题,本申请实施例还提供计算机设备。具体请参阅图5,图5为本实施例计算机设备基本结构框图。
所述计算机设备500包括通过系统总线相互通信连接存储器510、处理器520、网络接口530。需要指出的是,图中仅示出了具有组件连接存储器510、处理器520、网络接口530的计算机设备500,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。其中,本技术领域技术人员可以理解,这里的计算机设备是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程门阵列(Field-Programmable Gate Array,FPGA)、数字处理器 (Digital Signal Processor,DSP)、嵌入式设备等。
所述计算机设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述计算机设备可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。
所述存储器510至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或D界面显示存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,所述存储器510可以是所述计算机设备500的内部存储单元,例如该计算机设备500的硬盘或内存。在另一些实施例中,所述存储器510也可以是所述计算机设备500的外部存储设备,例如该计算机设备500上配备的插接式硬盘,智能存储卡(Smart Media Card, SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。当然,所述存储器510还可以既包括所述计算机设备500的内部存储单元也包括其外部存储设备。本实施例中,所述存储器510通常用于存储安装于所述计算机设备500的操作系统和各类应用软件,例如电子文件的控制的程序代码等。此外,所述存储器510还可以用于暂时地存储已经输出或者将要输出的各类数据。
所述处理器520在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器520通常用于控制所述计算机设备500的总体操作。本实施例中,所述处理器520用于运行所述存储器510中存储的程序代码或者处理数据,例如运行电子文件的控制的程序代码。
所述网络接口530可包括无线网络接口或有线网络接口,该网络接口530通常用于在所述计算机设备500与其他电子设备之间建立通信连接。
本申请还提供了另一种实施方式,即提供一种计算机可读存储介质,所述计算机可读存储介质存储有界面显示程序,所述界面显示程序可被至少一个处理器执行,以使所述至少一个处理器执行如上述的方法的步骤。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本申请各个实施例所述的方法。
显然,以上所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例,附图中给出了本申请的较佳实施例,但并不限制本申请的专利范围。本申请可以以许多不同的形式来实现,相反地,提供这些实施例的目的是使对本申请的公开内容的理解更加透彻全面。尽管参照前述实施例对本申请进行了详细的说明,对于本领域的技术人员来而言,其依然可以对前述各具体实施方式所记载的技术方案进行修改,或者对其中部分技术特征进行等效替换。凡是利用本申请说明书及附图内容所做的等效结构,直接或间接运用在其他相关的技术领域,均同理在本申请专利保护范围之内。
Claims (10)
1.一种空气数据处理方法,其特征在于,所述方法包括:
获取目标站点和与所述目标站点连接的相邻站点的原始数据,所述原始数据包括正常值和异常值;
去除所述原始数据中的异常值,并对去除异常值之后的原始数据进行标准化处理;
基于所述标准化处理后的目标站点的数据,计算得到所述目标站点的每一个数据对应的掩码矩阵m;
对所述目标站点标准化处理之后的数据和所述相邻站点标准化处理之后的数据进行填补处理,得到填补之后的数据;
基于所述填补之后的数据和所述掩码矩阵m,利用训练完成之后的空气数据补全模型对目标站点的原始数据进行补全,得到补全之后的空气数据,其中,所述空气数据补全模型包含所述目标站点的原始数据之间的时序关系和所述目标站点与所述目标站点连接的相邻站点的空间关系。
2.如权利要求1所述的方法,其特征在于,所述空气数据补全模型包括时间特征提取模型和空间特征提取模型,所述时间特征提取模型用于获取蕴含所述目标站点原始数据时序关系的第一历史记忆向量,所述空间特征提取模型用于获取蕴含所述目标站点与所述目标站点连接的相邻站点空间关系的第二历史记忆向量。
3.如权利要求1或2所述的方法,其特征在于,在利用训练完成之后对的空气数据补全模型对目标站点的原始数据进行补全之前,所述方法还包括:
建立所述目标站点和与所述目标站点连接的相邻站点的完全图,所述相邻站点包括以所述目标站点为圆心,半径为第一预设值内的所有站点;
根据所述完全图,得到邻接矩阵A、度矩阵D和距离特征矩阵B,其中,所述邻接矩阵A、所述度矩阵D和所述距离特征矩阵B包含所述目标站点与所述相邻站点的空间信息。
4.如权利要求3所述的方法,其特征在于,所述空气数据补全模型的训练过程具体包括:
从所述标准化处理之后的目标站点的数据中选取n条时序数据,并输入至所述时间特征提取模型得到所述第一历史记忆向量;
将所述n条时序数据、与所述n条时序数据对应同时间的相邻站点的时序数据、所述邻接矩阵A、所述度矩阵D和距离特征矩阵B输入至空间特征提取模型中,得到所述第二历史记忆向量;
5.如权利要求1所述的方法,其特征在于,所述对去除异常值之后的原始数据进行标准化处理包括:
计算所述原始数据中正常值的均值和标准差;
利用正常值与所述均值的差值除以所述标准差,得到所述标准化处理之后的目标站点的数据和所述相邻站点的数据。
7.一种空气数据处理装置,其特征在于,包括:
数据采集模块,用于获取目标站点和与所述目标站点连接的相邻站点的原始数据,所述原始数据包括正常值和异常值;
数据标准化模块,用于去除所述原始数据中的异常值,并对去除异常值之后的原始数据进行标准化处理;
数据处理模块,用于计算得到所述目标站点的每一个数据对应的掩码矩阵m;对所述目标站点标准化处理之后的数据和所述相邻站点标准化处理之后的数据进行填补处理,得到填补之后的数据;
数据补全模块,用于基于所述填补之后的数据和所述掩码矩阵m,利用训练完成之后的空气数据补全模型对目标站点的原始数据进行补全,得到补全之后的空气数据,其中,所述空气数据补全模型包含所述目标站点的原始数据之间的时序关系和所述目标站点与所述目标站点连接的原始站点的空间关系。
8.如权利要求7所述的空气数据处理装置,其特征在于,所述数据补全模块,具体用于:
从所述标准化处理之后的目标站点的数据中选取n条时序数据,并输入至所述时间特征提取模型得到所述第一历史记忆向量;
将所述n条时序数据、与所述n条时序数据对应同时间的相邻站点的时序数据、所述邻接矩阵A、所述度矩阵D和距离特征矩阵B输入至空间特征提取模型中,得到所述第二历史记忆向量;
9.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至6任一项所述的方法。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述的图像库构建方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310115173.7A CN115840881B (zh) | 2023-02-15 | 2023-02-15 | 空气数据处理方法、装置及相关设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310115173.7A CN115840881B (zh) | 2023-02-15 | 2023-02-15 | 空气数据处理方法、装置及相关设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115840881A true CN115840881A (zh) | 2023-03-24 |
CN115840881B CN115840881B (zh) | 2023-07-04 |
Family
ID=85579734
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310115173.7A Active CN115840881B (zh) | 2023-02-15 | 2023-02-15 | 空气数据处理方法、装置及相关设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115840881B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116502539A (zh) * | 2023-05-18 | 2023-07-28 | 淮阴工学院 | 一种VOCs气体浓度预测方法及系统 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2020101900A4 (en) * | 2020-08-21 | 2020-11-05 | Qinghu Rising Sunshine Data Technology (Beijing) Co., Ltd. | A method, device and equipment for detecting abnormal electric meter |
CN113408788A (zh) * | 2021-05-26 | 2021-09-17 | 华南理工大学 | 微气象监测装置高维构建及补全方法、系统、装置及介质 |
CN113821760A (zh) * | 2021-11-23 | 2021-12-21 | 湖南工商大学 | 一种空气数据补全方法、装置、设备及存储介质 |
CN114647819A (zh) * | 2022-03-30 | 2022-06-21 | 重庆邮电大学 | 基于图卷积网络的环境数据的格点处理方法 |
US20220214322A1 (en) * | 2021-01-07 | 2022-07-07 | Tsinghua University | Air pollutants concentration forecasting method and apparatus and storage medium |
US20220316734A1 (en) * | 2021-04-14 | 2022-10-06 | Jiangnan University | Deep Spatial-Temporal Similarity Method for Air Quality Prediction |
CN115600022A (zh) * | 2022-10-17 | 2023-01-13 | 京东城市(北京)数字科技有限公司(Cn) | 时空数据处理模型的训练、处理方法、装置以及介质 |
CN115687322A (zh) * | 2022-10-31 | 2023-02-03 | 北京工业大学 | 基于编码器-解码器和自回归生成对抗网络的水质时间序列缺失数据补全方法 |
-
2023
- 2023-02-15 CN CN202310115173.7A patent/CN115840881B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2020101900A4 (en) * | 2020-08-21 | 2020-11-05 | Qinghu Rising Sunshine Data Technology (Beijing) Co., Ltd. | A method, device and equipment for detecting abnormal electric meter |
US20220214322A1 (en) * | 2021-01-07 | 2022-07-07 | Tsinghua University | Air pollutants concentration forecasting method and apparatus and storage medium |
US20220316734A1 (en) * | 2021-04-14 | 2022-10-06 | Jiangnan University | Deep Spatial-Temporal Similarity Method for Air Quality Prediction |
CN113408788A (zh) * | 2021-05-26 | 2021-09-17 | 华南理工大学 | 微气象监测装置高维构建及补全方法、系统、装置及介质 |
CN113821760A (zh) * | 2021-11-23 | 2021-12-21 | 湖南工商大学 | 一种空气数据补全方法、装置、设备及存储介质 |
CN114647819A (zh) * | 2022-03-30 | 2022-06-21 | 重庆邮电大学 | 基于图卷积网络的环境数据的格点处理方法 |
CN115600022A (zh) * | 2022-10-17 | 2023-01-13 | 京东城市(北京)数字科技有限公司(Cn) | 时空数据处理模型的训练、处理方法、装置以及介质 |
CN115687322A (zh) * | 2022-10-31 | 2023-02-03 | 北京工业大学 | 基于编码器-解码器和自回归生成对抗网络的水质时间序列缺失数据补全方法 |
Non-Patent Citations (2)
Title |
---|
闫旭;范晓亮;郑传潘;臧?;王程;程明;陈龙彪;: "基于图卷积神经网络的城市交通态势预测算法" * |
闫旭;范晓亮;郑传潘;臧?;王程;程明;陈龙彪;: "基于图卷积神经网络的城市交通态势预测算法", 浙江大学学报(工学版), no. 06 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116502539A (zh) * | 2023-05-18 | 2023-07-28 | 淮阴工学院 | 一种VOCs气体浓度预测方法及系统 |
CN116502539B (zh) * | 2023-05-18 | 2024-02-27 | 淮阴工学院 | 一种VOCs气体浓度预测方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN115840881B (zh) | 2023-07-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111581046A (zh) | 数据异常检测方法、装置、电子设备及存储介质 | |
CN111666971A (zh) | 基于位置定位的事件识别方法、装置、设备及存储介质 | |
CN115840881B (zh) | 空气数据处理方法、装置及相关设备 | |
CN112434260A (zh) | 一种公路的交通状态检测方法、装置、存储介质及终端 | |
CN112465141A (zh) | 模型压缩方法、装置、电子设备及介质 | |
CN112419268A (zh) | 一种输电线路图像缺陷检测方法、装置、设备及介质 | |
CN115936180A (zh) | 光伏发电功率预测方法、装置和计算机设备 | |
CN112801315A (zh) | 电力二次设备的状态诊断方法、装置及终端 | |
CN115759365A (zh) | 光伏发电功率的预测方法及相关设备 | |
CN114201336A (zh) | 主站在线监视控制功能的配置校核控制方法、系统及设备 | |
CN113129122A (zh) | 财务风险预警审计方法、装置、电子设备、及存储介质 | |
CN113228056B (zh) | 运行时硬件模拟仿真方法、装置、设备及存储介质 | |
CN115982828B (zh) | 桥梁养护数字孪生体构建方法及装置 | |
CN111882074A (zh) | 数据预处理系统、方法、计算机设备及可读存储介质 | |
CN116306777A (zh) | 模型精度损失定位方法、装置和电子设备 | |
CN116168403A (zh) | 医疗数据分类模型训练方法、分类方法、装置及相关介质 | |
CN116403019A (zh) | 遥感图像量子识别方法、装置、存储介质及电子装置 | |
CN114971053A (zh) | 低压台区网络线损率在线预测模型的训练方法及装置 | |
CN113272813B (zh) | 定制数据流硬件模拟仿真方法、装置、设备及存储介质 | |
CN113887813A (zh) | 台风灾害预警方法、装置、服务器及存储介质 | |
CN113449062A (zh) | 轨迹处理方法、装置、电子设备和存储介质 | |
CN113505039A (zh) | 一种通信故障分析方法、设备及系统 | |
CN113627692A (zh) | 投诉量预测方法、装置、设备及存储介质 | |
CN116958149B (zh) | 医疗模型训练方法、医疗数据分析方法、装置及相关设备 | |
CN112861365B (zh) | 低压配电网负荷状态估计方法、装置及终端设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |