CN113496305A - 数据处理方法及装置 - Google Patents

数据处理方法及装置 Download PDF

Info

Publication number
CN113496305A
CN113496305A CN202010260975.3A CN202010260975A CN113496305A CN 113496305 A CN113496305 A CN 113496305A CN 202010260975 A CN202010260975 A CN 202010260975A CN 113496305 A CN113496305 A CN 113496305A
Authority
CN
China
Prior art keywords
data
air quality
target
city
neural network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010260975.3A
Other languages
English (en)
Inventor
许佳辉
常剑
陈三鉴
陈岭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN202010260975.3A priority Critical patent/CN113496305A/zh
Publication of CN113496305A publication Critical patent/CN113496305A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Tourism & Hospitality (AREA)
  • Economics (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Theoretical Computer Science (AREA)
  • Development Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Educational Administration (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请关于一种数据处理方法及装置。所述方法包括:获取目标监测站点和邻近监测站点在历史时间段内的空气质量及其相关数据,所述邻近监测站点与所述目标监测站点之间的距离小于第一预设距离;将所述目标监测站点及所述邻近监测站点的所述空气质量及其相关数据输入至空气质量预测模型组件中,所述空气质量预测模型组件在对所述目标监测站点和所述邻近监测站点的所述空气质量及其相关数据进行信息交互后,确定所述目标监测站点在未来时间段内的空气质量数据利用本申请各个实施例提供的数据处理方法及装置,可以获取到准确性较高的空气质量数据。

Description

数据处理方法及装置
技术领域
本申请涉及大数据技术领域,尤其涉及一种数据处理方法及装置。
背景技术
时空数据是满足一定空间分布的实体所产生的基于时间的数据,通过挖掘所述实体在历史时间段内的时空数据以预测所述实体在未来时间段内的时空数据,具有十分重要的意义。以空气质量预测举例说明,城市空气质量预测可以预测出监测站点所在区域内数小时甚至数天后的空气质量指数(AQI),是城市计算中极具价值的研究方向,在卫生健康、环境治理、城市规划等领域都具有广阔的应用前景。
现有的时空数据预测方法一般可以分为基于物理模型的方法和基于统计模型的方法。基于物理模型的方法依赖于领域知识,例如在空气质量预测过程中,可以通过模拟污染物产生、扩散的物理化学过程来预测空气质量。该类方法比较依赖数据集质量,并且需要根据场景调整模型的参数设置,泛化能力较差。而基于统计模型的方法由数据驱动,学习从多源输入数据到预测结果间的复杂映射关系。有研究者利用通用的回归模型(如多项式回归模型)和序列分析模型(如ARIMA模型)预测空气质量,但这些方法的性能依赖于特征工程,建模时会大量损失数据中包含的信息。
因此,相关技术中亟需一种能够更加准确地预测实体对象的时空数据的方式。
发明内容
本申请实施例的目的在于提供一种数据处理方法及装置,可以获取到准确性较高的空气质量数据。
本申请实施例提供的数据处理方法及装置是这样实现的:
一种数据处理方法,所述方法包括:
获取目标监测站点和邻近监测站点在历史时间段内的空气质量及其相关数据,所述邻近监测站点与所述目标监测站点之间的距离小于第一预设距离;
将所述目标监测站点及所述邻近监测站点的所述空气质量及其相关数据输入至空气质量预测模型组件中,所述空气质量预测模型组件在对所述目标监测站点和所述邻近监测站点的所述空气质量及其相关数据进行信息交互后,确定所述目标监测站点在未来时间段内的空气质量数据;
其中,所述空气质量预测模型组件被设置为利用所述目标监测站点的空气质量数据与所述目标监测站点和所述邻近监测站点的历史空气质量及其相关数据之间的对应关系训练得到。
一种数据处理方法,所述方法包括:
获取目标对象和邻近对象在历史时间段内的预测参数及其相关数据,所述邻近对象与所述目标对象之间的空间距离小于第一预设距离;
将所述目标对象及所述邻近对象的所述预测参数及其相关数据输入至参数预测模型组件中,所述参数预测模型组件在对所述目标对象和所述邻近对象的所述预测参数及其相关数据进行信息交互后,确定所述目标对象在未来时间段内的预测参数数据;
其中,所述参数预测模型组件被设置为利用所述目标对象的预测参数数据与所述目标对象和所述邻近对象的历史预测参数及其相关数据之间的对应关系训练得到。
一种数据处理方法,所述方法包括:
获取目标服务器和邻近服务器在历史时间段内的负载及负载相关数据,所述邻近服务器与所述目标服务器的网络地址之间的小于第一预设距离;
将所述目标服务器及所述邻近服务器的所述负载及负载相关数据输入至负载预测模型组件中,所述负载预测模型组件在对所述目标服务器和所述邻近服务器的所述负载及负载相关数据进行信息交互后,确定所述目标服务器在未来时间段内的负载数据;
其中,所述负载预测模型组件被设置为利用所述目标服务器的负载数据与所述目标服务器和所述邻近服务器的历史负载及负载相关数据之间的对应关系训练得到。
一种数据处理方法,所述方法包括:
获取目标道路和邻近道路在历史时间段内的交通流量及其相关数据,所述邻近道路与所述目标道路之间的距离小于第一预设距离;
将所述目标道路及所述邻近道路的所述交通流量及其相关数据输入至流量预测模型组件中,所述流量预测模型组件在对所述目标道路和所述邻近道路的所述交通流量及其相关数据进行信息交互后,确定所述目标道路在未来时间段内的交通流量数据;
其中,所述交通流量预测模型组件被设置为利用所述目标道路的交通流量数据与所述目标道路和所述邻近道路的历史交通流量及其相关数据之间的对应关系训练得到。
一种数据处理装置,包括处理器以及用于存储处理器可执行指令的存储器,所述处理器执行所述指令时实现所述的数据处理方法。
一种非临时性计算机可读存储介质,当所述存储介质中的指令由处理器执行时,使得处理器能够执行所述的数据处理方法。
本申请提供的数据处理方法及装置,可以在确定监测站点的空气质量数据的过程中,考虑到与所述监测站点邻近的监测站点对所述监测站点的监测数据的影响,综合考虑到空气质量数据所相关的复杂因素。本申请实施例提供的空气质量预测模型组件能够建立空气质量及其相关数据在时间和空间上的联系,基于所述监测站点及其邻近监测站点之间的动态关联性,可以获取到准确性较高的空气质量数据。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
图1是根据一示例性实施例示出的一种场景示意图。
图2是根据一示例性实施例示出的一种场景示意图。
图3是根据一示例性实施例示出的一种场景示意图。
图4是根据一示例性实施例示出的一种场景示意图。
图5是根据一示例性实施例示出的一种场景示意图。
图6是根据一示例性实施例示出的一种数据处理方法的流程图。
图7是根据一示例性实施例示出的一种数据处理方法的流程图。
图8是根据一示例性实施例示出的一种数据处理装置的框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
为了方便本领域技术人员理解本申请实施例提供的技术方案,下面通过几个具体的应用场景说明本申请提供的实施例。
场景一
首先,在该应用场景中,需要确定XX省XX市工业园区空气监测站点未来24小时内的空气质量。如图1所示,需要准备的数据可以包括工业园区空气监测站点以及工业园区邻近的监测站点(如XX市A区站点、XX市B区站点、XX市C区站点、XX市D站点、相邻城市各区站点等等)在过去24小时内的空气质量及其相关数据,其中,相关数据可以包括气象数据、地域特征数据以及各个监测站点未来24小时内的天气预测数据。在获取到空气质量及其相关数据之后,可以从中提取出预设长度的离散序列,在一个示例中,可以获取到过去24小时内每个整点时刻对应的空气质量值、气象值、地域特征值,这样,可以生成三个长度为24的序列。当然,提取方式不限于上述示例,也可以提取其他时刻的值,或者设置其他的提取间隔,如半小时、40分钟等,本申请在此不做限。在该场景中,生成的空气质量序列可表示为aqi,除风向以外的气象序列可表示为weather,天气预测序列可表示为for,地域特征序列可表示为poi,将风向数据用二维向量重新编码,可得到风向序列wind,以上各个序列的长度(也就是历史时间窗口大小)为τin,预测的序列长度为τout
对于上述各个序列,还可以进行预处理,预处理方式可以包括异常值处理、归一化处理等。所述异常值处理可以包括去除所述空气质量序列、气象序列、地域特征序列、天气预测序列中的异常值,当然,在去除异常值之后,可以对序列进行线性插值处理。所述归一化处理可以包括对上述数据中的各个值进行归一化处理,使处理后的数值都归一化到 [-1,1]的范围内,在一个示例中,归一化处理的转换公式如下:
Figure BDA0002439281370000041
其中x为原始数据中的数值,Xmin为该类原始数据中的最小值,Xmax为该类原始数据中的最大值,x′为归一化之后的数值。
在本应用场景中,可以将上述各个序列输入至空气质量预测模型组件中,如图1和图 2所示,所述空气质量预测模型组件可以包括相互耦接的城市图神经网络、站点图神经网络、循环神经网络(主要包括解码器部分)。如图2、图3、图4中,在历史时间段τin内中的各个时刻,分别对应于一个城市图神经网络(简称城市图)和站点图神经网络(简称站点图)。其中,城市图上的节点表示城市,站点图上的节点表示空气质量监测站点,城市图和站点图上用边连接地理距离小于预设距离阈值的节点,且连接节点的边可以用于表示两个节点间的相关性,由地理相关性gs和动态相关性ws组成,分别描述节点间因地理距离和风向等动态因素产生的影响关系。
在一个示例中,可以用a和b表示两个城市节点或者两个站点节点,用la=[x1,y1]和 lb=[x2,y2]表示a和b的地理位置(如经纬度表示),那么a和b的地理相关性gs的计算公式如下:
Figure BDA0002439281370000051
Figure 1
其中da,b和db,a表示a和b的地理距离,Rh是预设距离阈值,只有地理距离小于Rh的两节点在图上才可用边连接。
动态相关性ws考虑到了因风向变化产生的节点间动态影响关系,t时刻a和b的计算公式如下:
ζa→b=lb-la,ζb→a=la-lb (4)
Figure BDA0002439281370000053
Figure BDA0002439281370000054
其中·表示向量内积,
Figure BDA0002439281370000055
Figure BDA0002439281370000056
表示t时刻a和b的风向向量,ζa→b表示b相对于a的位置向量,ζb→a表示a相对于b的位置向量。
根据地理相关性gs和动态相关性ws即可得到站点图和城市图上节点的连接关系,从而为实施城市图和站点图的信息交互奠定数据基础。
在实际应用场景中,生成的空气质量序列aqi均为各个监测站点监测到的数据,但是,在城市图进行信息交互的过程中,则需要城市所对应的空气质量值,在本申请实施例中,可以根据城市所包含的各个监测站点所对应的空气质量序列计算得到城市的空气质量序列。将t时刻,i城市j站点的空气质量监测值表示为
Figure BDA0002439281370000057
那么i城市的整体空气质量可以通过计算t时刻i城市内所有站点的平均监测值得到:
Figure BDA0002439281370000058
其中|Si|表示i城市中的站点数量。由此得到i城市的整体空气质量序列
Figure BDA0002439281370000059
Figure BDA00024392813700000510
τin表示历史时间窗口大小。
通过上述计算方式,可以计算得到XX市和XX市的邻近城市在历史时间段τin内的空气质量序列。
然后,可以基于所述城市图对XX市及其邻近城市之间的空气质量数据进行信息交互。在信息交互之前,可以首先对各个城市的空气质量序列进行特征提取。具体的提取方式可以采用RNN或其变形算法,在本申请应用场景中,可以利用LSTM算法对所述空气质量序列进行信息提取。将城市对应的空气质量序列输入至LSTM编码器中,LSTM编码器通过门控单元更新隐状态ht和状态ct,获取到城市在τin中各个时刻对应的隐状态。在一个示例中,以i城市对应的空气质量序列AQIi输入至LSTM编码器中,得到τin中各个时刻的隐状态
Figure BDA0002439281370000061
其中
Figure BDA0002439281370000062
将作为t时刻的城市图中i城市节点的输入。通过上述计算方式,可以计算得到τin内各个时刻城市图上包括XX市等各个城市节点的输入,该过程如图3所示,即将站点图上的信息传递至城市图。
然后,可以以LSTM编码器得到的隐状态作为节点输入,以地理相关性和动态相关性作为边权输入,在各个时刻的城市图上利用图卷积操作完成节点间信息交互,得到城市的表示向量,该表示融合了周围城市的空气质量信息。用X表示城市图节点的输入属性,用E表示城市图边的输入属性。以t时刻城市图上的i城市为例,X即为站点图传递的隐状态
Figure BDA0002439281370000063
E由所述地理相关性gsk,i和动态相关性
Figure BDA0002439281370000064
组成,即
Figure BDA0002439281370000065
||表示向量拼接操作,k表示i城市在图上的邻居城市。以城市图上i城市节点的表示更新过程为例,说明城市图上的图卷积的计算过程,具体公式如下:
Ri={(Xs,Xi,Es,i)} (8)
Ri←ρ(Ri) (9)
Zi←φ1(Ri,Xi) (10)
其中Xs为i节点邻居节点的属性,Xi为i节点的属性,Es,i表示连接两节点边的属性,Ri表示所有i节点邻居信息的集合,并转换为向量Ri,由Ri和Xi可得到i节点的新表示Zi,ρ(·)和φ1(·)表示不同的映射函数。
类似地,可以在各个时刻的城市图上利用图卷积操作完成节点间信息交互,更新各个城市节点的表示,这样,可以获取到XX市所对应的城市表示。
在获取到城市的表示向量之后,可以基于城市的表示向量完成站点图中节点间的信息交互。在本申请应用场景中,在对XX市的站点图进行更新的过程中,可以将XX市的表示向量作为站点图的全局状态。另外,由于气象数据往往是以城市为单位,即一个城市的不同监测站点对应的气象数据均相同,因此,也可以将所述气象序列weather作为所述站点图的全局状态。当然,在气象数据分布更加细化的情况下,也可以将气象数据作为各个站点的特征数据,本申请在此不做限制。在一个示例中,可以将t时刻城市图上计算得到的i城市表示向量
Figure BDA0002439281370000066
输入至全连接网络(FNN),输出与气象序列weather拼接,组成站点图的全局状态
Figure BDA0002439281370000067
即可表示为:
Figure BDA0002439281370000068
Figure BDA0002439281370000071
其中W1表示系数矩阵,b1表示偏差向量,σ(·)表示激活函数,
Figure BDA0002439281370000072
表示t时刻i城市的气象向量,||表示拼接操作。
类似地,通过上述过程更新各个时刻各个站点图的全局状态。该过程如图4所示,即将城市图上的信息传递至站点图。
然后,可以以XX市各个站点的空气质量数据和地域特征数据作为节点输入,以地理相关性和动态相关性作为边权输入,基于在上述计算得到的全局状态,在各个时刻XX市站点图上利用图卷积操作完成节点间的信息交互,得到XX市各个站点的表示向量。在一个实例中,可以用x表示站点图节点的输入属性,用e表示站点图边的输入属性,用u站点图的全局状态。以t时刻i城市站点图上的j站点为例,x由空气质量序列和地域特征序列组成,即
Figure BDA0002439281370000073
e由地理相关性gsk,j和动态相关性
Figure BDA0002439281370000074
组成,即
Figure BDA0002439281370000075
||表示向量拼接操作,k表示j站点在图上的邻居站点,u即更新后的全局状态
Figure BDA0002439281370000076
下面以站点图与站点节点的表示更新过程为例,说明站点图上的图卷积的计算过程,具体公式如下:
rj={(xs,xj,es,j)} (13)
Figure BDA0002439281370000077
zj←φ2(rj,xj,u) (15)
其中xs为j节点邻居节点的属性,xj为j节点的属性,es,j表示连接两点边的属性,rj表示j节点邻居信息的集合,并转换为向量rj,由rj和xj可得到j节点的新表示zj
Figure BDA0002439281370000078
和φ2(·)表示不同的映射函数。
类似地,可以在各个时刻XX市站点图上利用图卷积操作完成节点间的信息交互,更新XX市各个站点节点的表示,站点图网络参数在城市间不共享。
在各个时刻各个站点图上利用图卷积操作完成节点间的信息交互后,可以得到各个站点历史时间窗口对应的表示向量序列,如i城市j站点的表示向量序列为
Figure BDA0002439281370000079
即可以获取到XX市各个监测站点的表示向量序列。将各个站点序列输入站点编码LSTM,并将最后时刻的隐状态作为对应站点的编码向量,如把
Figure BDA00024392813700000710
作为i城市j站点的编码向量,站点编码LSTM参数在城市间不共享。
本应用场景中,对于各个站点,用站点的编码向量初始化站点解码LSTM,天气预报数据作为站点解码LSTM的输入,将站点解码LSTM各个时刻的隐状态输入预测FNN,得到各个时刻的预测输出。站点解码LSTM和预测FNN参数在城市间不共享。
以i城市j站点为例,利用站点编码LSTM得到的表示
Figure BDA0002439281370000081
来初始化站点解码LSTM,在t时刻,解码LSTM拼接t-1时刻的预测结果和天气预报向量
Figure BDA0002439281370000082
作为解码LSTM的输入,得到隐状态
Figure BDA0002439281370000083
输入预测FNN得到t时刻的预测结果
Figure BDA0002439281370000084
Figure BDA0002439281370000085
Figure BDA0002439281370000086
其中,LSTMde表示解码LSTM网络,其中W2表示系数矩阵,b2表示偏差向量,σ(·)表示激活函数,||表示拼接操作。
类似地,可以得到j站点τout内各个时刻的空气质量预测结果,站点解码LSTM和预测FNN参数在城市间不共享。上述计算过程可以用图5描述,至此可以获取到XX市工业园区空气监测站点在未来τout时间段内的预测空气质量序列。
场景二
在另一个场景中,可以利用与上述确定空气质量相同的方式确定服务器在未来时间段内的负载情况。若能够确定服务器在未来时间段内的负载情况,则可以计算计算资源的最优调配方式,从而实现计算资源的优化使用。与上述各个实施例的区别在于所使用的数据不相同,在确定服务器在未来时间段内的负载情况下,可以获取到目标服务器和邻近服务器在历史时间段内的负载及负载相关数据。其中,所述邻近服务器与所述目标服务器的网络地址之间的小于第一预设距离,所述网络地址可以包括服务器的IP地址等等。所述负载及负载相关数据可以包括与服务器通信连接的用户数量、响应用户请求的时长、单位时间段内的吞吐量等等。
在获取到所述负载及负载相关数据之后,可以将所述负载预测模型组件中,所述负载预测模型组件在对所述目标服务器和所述邻近服务器的所述负载及负载相关数据进行信息交互后,确定所述目标服务器在未来时间段内的负载数据。需要说明的是,所述负载预测模型组件的训练方式可以参考说明书中其他实施例所述的空气质量预测模型组件的训练方式,所述负载预测模型组件的结构可以参考所述空气质量预测模型组件的结构,其区别在于所述空气质量预测模型组件所使用的训练样本是所述目标监测站点和所述邻近监测站点在历史时间段内的空气质量及其相关数据,而所述负载预测模型组件的样本数据是所述目标服务器及所述邻近服务器的所述负载及负载相关数据,本申请在此不再赘述。
场景三
在本申请实施例中,基于以上确定所述空气质量的方式,本申请实施例还提供一种确定目标道路在未来时间段内的交通流量的方式。在确定道路在未来时间段内的交通流量的情况下,可以帮助交通部门优化交通调度,降低道路拥堵指数。与上述各个实施例的区别在于所使用的数据不相同,在本申请实施例中,可以获取到目标道路和邻近道路在历史时间段内的交通流量及其相关数据,所述邻近道路与所述目标道路之间的距离小于第一预设距离。其中,所述交通流量及其相关数据包括在选定时间段内道路中某一地点或者某一断面的交通实体数,以及影响交通流量的时间段数据、天气数据、交通事故数据、人口因素等等。
在获取到所述交通流量及其相关数据之后,可以将所述流量预测模型组件中,所述流量预测模型组件在对所述道路和所述邻近道路的所述交通流量及其相关数据进行信息交互后,确定所述目标道路在未来时间段内的负载数据。需要说明的是,所述流量预测模型组件的训练方式可以参考说明书中其他实施例所述的空气质量预测模型组件的训练方式,所述流量预测模型组件的结构可以参考所述空气质量预测模型组件的结构,其区别在于所述空气质量预测模型组件所使用的训练样本是所述目标监测站点和所述邻近监测站点在历史时间段内的空气质量及其相关数据,而所述流量预测模型组件的样本数据是所述目标道路及所述邻近道路的所述交通流量及其相关数据,本申请在此不再赘述。
需要说明的是,本申请提供的数据处理方法还可以应用于其他应用场景中,如确定未来时间段内的降水量、确定未来时间段内的网页浏览量等等,本申请在此不做限制。
下面结合附图对本申请所述的数据处理方法进行详细的说明。图6是本申请提供的数据处理方法的一种实施例的方法流程示意图。虽然本申请提供了如下述实施例或附图所示的方法操作步骤,但基于常规或者无需创造性的劳动在所述方法中可以包括更多或者更少的操作步骤。在逻辑性上不存在必要因果关系的步骤中,这些步骤的执行顺序不限于本申请实施例提供的执行顺序。所述方法在实际中的确定空气质量的过程中或者装置执行时,可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境)。
具体的,本申请提供的数据处理方法的一种实施例如图6所示,所述方法可以包括:
S601:获取目标监测站点和邻近监测站点在历史时间段内的空气质量及其相关数据,所述邻近监测站点与所述目标监测站点之间的距离小于第一预设距离;
S603:将所述目标监测站点及所述邻近监测站点的所述空气质量及其相关数据输入至空气质量预测模型组件中,所述空气质量预测模型组件在对所述目标监测站点和所述邻近监测站点的所述空气质量及其相关数据进行信息交互后,确定所述目标监测站点在未来时间段内的空气质量数据;
其中,所述空气质量预测模型组件被设置为利用所述目标监测站点的空气质量数据与所述目标监测站点和所述邻近监测站点的历史空气质量及其相关数据之间的对应关系训练得到。
本申请实施例提供的技术方案用于预测未来时间段内的空气质量,例如,现在时刻为 2020年1月20日,本申请的技术方案用于预测2020年1月20日之后的未来一段时间的空气质量,如未来24小时内的空气质量。在城市基础设施中,往往设置有多个空气质量监测站点,空气质量监测站点的功能是对存在于大气、空气中的污染物质进行定点、连续或者定时的采样、测量和分析。为了对空气进行监测,一般在一个环保重点城市设立若干个空气质量监测站点,站内安装多参数自动监测仪器作连续自动监测,将监测结果实时存储并加以分析后得到相关的数据。空气质量监测站点是空气质量控制和对空气质量进行合理评估的基础平台,是一个城市空气环境保护的基础设施。但是,空气质量监测站点获取到的空气质量只是实时的数据,无法预测未来之间段内的空气质量。
基于此,在本申请实施例中,为了能够预测这些空气质量监测站点在未来时间段内监测到的准确的空气质量数据,可以基于获取到的历史数据以及训练得到的空气质量预测模型组件确定未来时间段内的空气质量。相关技术中的空气质量预测方式往往基于某一个空气质量监测站点自己的历史数据,但是在实际应用中,各个空气质量监测站点监测到的空气质量往往还与其邻近地区的空气质量相关,比如一阵南风有可能将北京的雾霾刮到河北省,导致河北省的空气质量突然下降,如果在预测河北省某站点的空气质量时只考虑到该站点历史上获取的数据,可能很难准确地预测出空气质量结果。
基于此,所述历史数据可以包括目标监测站点和邻近监测站点的历史数据。具体地,可以包括所述目标监测站点和邻近监测站点在历史时间段内的空气质量及其相关数据。所述空气质量及其相关数据可以包括气象数据、地域特征数据以及所述目标监测站点在未来时间段内的天气预测数据。其中,所述邻近监测站点与所述目标监测站点之间的距离小于第一预设距离。在一个示例中,所述第一预测距离可以包括100km、300km、600km等等,与所述目标监测站点的距离越近的邻近监测站点对所述目标监测站点的空气质量影响越大。所述气象数据可以包括下述中的至少一种参数及其对应的参数值:湿度、温度、降水量、风速、风向、气压。发明人发现空气质量不仅与监测站点的历史空气质量数据相关,还与气象数据相关,在一个示例中,根据风向和风速参数可以确定是否有风会将上游城市的雾霾刮到下游城市,对确定下游城市的空气质量具有十分重要的价值。另外,发明人还发现,空气质量还与所述目标监测站点所在的地域特征数据有关系,所述地域特征数据包括下述中的至少一种参数及其对应的参数值:人口数量、经济指数、工业用电量、绿化面积、水域面积、水域数量、地理地貌、住宅区数量、工厂数量。可以发现,人口数量越多,工厂数量越多,工业用电量越多,经济指数越高的地域产生的污染物可能越多,反之,绿化面积越大,水域面积越广阔,有山、湖等自然屏障的地域可能产生的污染物越少或者空气净化能力越强。
另外,空气质量与未来时间段内的天气预测数据也具有关联关系,例如,天气预测数据可以包括晴雨状况、降水量等预测数据。
需要说明的是,所述空气质量及其相关数据不限于上述实施例所提供的数据,还可以包括任何其他能够对空气质量产生影响的数据,本申请在此不做限制。
在一个示例性的场景中,例如需要预测XX市A站点在未来24小时内的空气质量,可以获取到A站点及A站点周边站点(如B站点、C站点、D站点等)在过去24小时内的空气质量数据以及气象、地域特征以及预测的A站点在未来24小时内的天气预测等与空气质量相关的数据。
本申请实施例中,在获取到所述目标监测站点及其邻近监测站点在历史时间段内的空气质量及其相关数据,可以将所述目标监测站点及所述邻近监测站点的所述空气质量及其相关数据输入至空气质量预测模型组件中,所述空气质量预测模型组件在对所述目标监测站点和所述邻近监测站点的所述空气质量及其相关数据进行信息交互后,确定所述目标监测站点在未来时间段内的空气质量数据。其中,所述空气质量预测模型组件被设置为利用所述目标监测站点的空气质量数据与所述目标监测站点和所述邻近监测站点的历史空气质量及其相关数据之间的对应关系训练得到。
在本申请的一个实施例中,所述空气质量预测模型组件可以设置为基于机器学习的模型组件,该模型组件可以从多个训练样本数据中学习到所述目标监测站点的空气质量参数与所述目标监测站点和所述邻近服务器的历史空气质量及其相关参数之间的关联关系。基于此,所述训练样本数据可以从所述目标监测站点和所述邻近监测站点在历史上一段时间内的空气质量数据、气象数据、地域特征数据中提取得到。在一个示例性的场景中,以构建XX市工业园区站点对应的空气质量预测模型为例,可以收集工业园区站点及其周边站点,如XX市A区、B区、C区等多个站点在2015-2019年内的空气质量数据、气象数据、地域特征数据等等。
在本申请实施例中,将数据输入至模型组件之前,可以对数据进行一些预处理。所述预处理可以包括去除异常值处理、归一化处理等等,对于预处理的方式,本申请在此不做限制。
在本申请的一个实施例中,所述空气质量预测模型组件可以包括相互耦接的站点图神经网络和第一神经网络,其中,所述站点图神经网络可以用于对所述目标监测站点和所述邻近监测站点在历史时间段内的空气质量及其相关数据实施信息交互。所述第一神经网络可以用于根据所述站点图神经网络所生成的交互数据预测所述目标监测站点在未来时间段内的空气质量数据。
本申请实施例中,构建的所述站点图神经网络能够对图节点之间的信息进行交互分享。在所述图神经网络中,所述图节点可以对应于各个站点对应的信息。基于此,构建的所述站点图神经网络可以包括多个站点节点、边,其中,所述多个站点节点可以分别包括不同站点的空气质量及其相关数据,所述边连接距离小于第二预设距离的站点节点,所述边包括连接的两个站点节点之间的地理相关信息和动态相关信息。在一个实施例中,所述地理相关信息可以包括连接的两个站点节点之间的距离和相对方向,所述距离可以根据两个站点节点的地理位置计算得到,所述地理位置可以包括经纬度等。所述相对方向也可以根据不同站点节点对应的地理位置之间的向量关系计算得到。在本申请的一个实施例中,所述动态相关信息包括连接的两个站点节点或者城市节点之间风的影响大小和方向。所述风的影响大小和方向可以风向向量与站点节点之间的相对位置计算得到,当然,所述动态相关信息中还可以包括不同风量所产生的影响。需要说明的是,在所述站点图神经网络中,具有连接关系的两个站点节点之间的距离可以小于第二预设距离,在一个示例中,所述第二预设距离可以被设置为30km、50km、60km等。本实施例中,通过将距离比较接近的站点之间实施信息交互,使得生成的空气质量预测模型更加符合实际的站点与站点之间的相互影响关系。
本申请实施例中,所述第一神经网络可以从所述站点图神经网络处接收信息交互后的交互数据,并根据所述交互数据预测得到所述目标监测站点在所述未来时间段内的空气质量数据。需要说明的是,所述天气预测数据属于预测数据,因此,可以不对其进行数据交互,即所述第一神经网络可以根据所述交互数据以及所述目标监测站点在未来时间段内的天气预测数据,预测得到所述目标监测站点在所述未来时间段内的空气质量数据。另外,所述第一神经网络可以包括循环神经网络(RNN)、长短期记忆网络(LSTM)以及基于 RNN的变形神经网络等,本申请在此不做限制。
在实际的机器学习环境中,在涉及到间隔一段时间内的数据的情况下,可以从涉及到的数据中提取出离散序列,这样不仅可以减少机器学习的数据量,还可以提升计算效率。在提取序列的过程中,可以从所述历史时间段内的所述空气质量及其相关数据中提取多个时刻的数据,生成空气质量及其相关数据序列,具体地,所述空气质量及其相关数据序列可以包括空气质量序列、气象序列、地域特征序列、天气预测序列等等。在一个示例中,在获取到某地区在过去24小时内的空气质量数据、气象数据、地域特征数据之后,可以从中提取出每个整点时刻对应的空气质量数据、气象数据、地域特征数据,分别生成长度为24的空气质量序列、气象序列、地域特征序列,对于天气预测数据可以进行相同的处理方式。当然,在其他实施例中,生成的序列长度可以被设置为任意值,如还可以每间隔半小时提取一次数据,以生成长度为48的序列,本申请在此不做限制。然后,在提取出序列之后,可以将所述目标监测站点及所述邻近监测站点的空气质量序列、气象序列、地域特征序列输入至所述站点图神经网络,经所述站点图神经网络进行图卷积操作后,生成所述目标监测站点对应的交互后序列,其中,所述图卷积操作可以实现站点之间的信息交互。最后,可以将生成的交互后序列和所述天气预测数据输入至所述第一神经网络,经所述第一神经网络输出所述目标监测站点在所述未来时间段内的空气质量序列。
需要说明的是,所述空气质量预测模型组件的网络参数可以包括从多组网络参数中选取的与所述目标监测站点相匹配的网络参数,所述多组网络参数分别对应于不同的监测站点对应的空气质量预测模型组件的网络参数。也就是说,不同的监测站点所对应的网络参数不相同,即在训练阶段,可以为各个监测站点分别训练得到对应的网络参数,这样,可以准确地预测得到各个监测站点对应的空气质量。
在实际应用环境中,对于各个城市的空气监测站点,往往比较集中于城市区域,这是因为相对于农村地区,城市人口密集,车辆、工厂等影响空气质量的因素众多,空气质量容易恶化,因此,对于大部分城市而言,城市区域的空气质量需要得到监控。基于此,在图神经网络中,不同城市的两个站点节点之间的关系较弱,很难进行信息交互,或者信息交互的意义不大。在本申请实施例中,可以所述空气质量预测模型组件包括依次耦接的城市图神经网络、站点图神经网络和第一神经网络。其中,所述城市图神经网络用于对所述目标监测站点所在的目标城市及所述目标城市的邻近城市在历史时间段内的空气质量及其相关数据实施信息交互,其中,所述邻近城市与所述目标城市之间的距离小于第三预设距离,所述目标城市和所述邻近城市的空气质量及其相关数据根据所述目标监测站点和邻近监测站点在历史时间段内的空气质量及其相关数据计算得到。所述站点图神经网络用于基于所述城市图神经网络生成的交互信息,对所述目标监测站点和所述邻近监测站点在历史时间段内的空气质量及其相关数据实施信息交互。所述第一神经网络用于根据所述站点图神经网络所生成的交互数据预测所述目标监测站点在所述未来时间段内的空气质量数据。
也就是说,为了使得所述空气质量预测模型组件更加符合实际应用中的监测站点的位置分布,可以在站点图神经网络之前构建城市图神经网络。其中,所述城市图神经网络在构建方式上类似于上述站点图的构建方式,只是在数据上城市图神经网络所涉及到的数据均为城市量级的数据,而站点图神经网络所涉及到的数据均为站点级的数据。在一个实施例中,所述城市图神经网络可以包括多个城市节点、边,其中,所述多个城市节点分别包括不同城市的空气质量及其相关数据,所述边连接距离小于所述第三预设距离的城市节点,所述边包括连接的两个城市节点之间的地理相关信息和动态相关信息。其中,在一个实施例中,所述地理相关信息可以包括连接的两个城市节点之间的距离和相对方向。在另一个实施例中,所述动态相关信息可以包括连接的两个城市节点之间的风的影响大小和方向。
具体地,在本申请的一个实施例中,也可以从所述空气质量及其相关数据中提取出多个时刻的数据,生成空气质量及其相关数据序列。然后,可以分别确定所述目标城市和所述邻近城市所包含的监测站点,根据所述目标监测站点及所述邻近监测站点在所述历史时间段内的空气质量及其相关数据序列,分别生成所述目标城市和所述邻近城市所对应的空气质量及其相关数据序列。在实际应用中,获取到的空气质量数据往往是以监测站点为单位,因此,若需要确定出城市所对应的空气质量数据,则可以通过该城市所包含的监测站点获取的空气质量数据计算得到。例如,在预测XX市某监测站点的空气质量的过程中,在此步骤中,可以分别确定XX市和XX市的邻近城市(如上海、南通、无锡等城市)的空气质量及其相关数据等。在确定XX市的空气质量数据的过程中,可以分别获取到XX 中各个监测站点所监测到的空气质量数据,然后计算得到XX市对应的空气质量数据,如采用平均值计算的方式。
本申请实施例中,在提取得到上述各个序列之后,可以将上述各个序列输入至所述城市图神经网络中,经所述城市图神经网络进行图卷积操作后,生成所述目标城市对应的第一交互后序列。然后,可以将所述第一交互后序列、所述目标监测站点及所述邻近服务器的空气质量及其相关数据序列输入至所述站点图神经网络,经所述站点图神经网络进行图卷积操作后,生成所述目标监测站点对应的第二交互后序列。最后,可以将所述第二交互后序列输入至所述第一神经网络,经所述第一神经网络输出所述目标监测站点在所述未来时间段内的空气质量序列。
本申请提供的数据处理方法,可以在确定监测站点的空气质量数据的过程中,考虑到与所述监测站点邻近的监测站点对所述监测站点的监测数据的影响,综合考虑到空气质量数据所相关的复杂因素。本申请实施例提供的空气质量预测模型组件能够建立空气质量及其相关数据在时间和空间上的联系,基于所述监测站点及其邻近监测站点之间的动态关联性,可以获取到准确性较高的空气质量数据。
本申请另一方面还提供一种数据处理方法,如图7所示,所述方法可以包括:
S701:获取目标对象和邻近对象在历史时间段内的预测参数及其相关参数的数据,所述邻近对象与所述目标对象之间的空间距离小于第一预设距离;
S703:将所述目标对象及所述邻近对象的所述预测参数及其相关参数的数据输入至参数预测模型组件中,所述参数预测模型组件在对所述目标对象和所述邻近对象的所述预测参数及其相关参数的数据进行信息交互后,确定所述目标对象在未来时间段内的预测参数的数据;
其中,所述参数预测模型组件被设置为利用所述目标对象的预测参数数据与所述目标服务器和所述邻近对象的历史预测参数及其相关参数的数据之间的对应关系训练得到。
本申请实施例中,所述目标对象和所述邻近对象可以包括占据一定物理空间的实体对象,如可以包括以上实施例所述的空气质量监测站点、服务器、道路等等。所述实体可以在空间上具有不同的分布状况,且在时间上能够产生数据。所述邻近对象与所述目标对象之间的空间距离小于第一预设距离,对于不同的对象,所述空间距离可以根据所述对象的属性确定,例如,空气质量监测站点、道路之间的空间距离可以包括地理位置之间的距离,服务器之间的空间距离可以包括服务器网络地址之间的距离。所述预测参数可以包括所述目标对象在时间上所产生的数据,例如,所述目标监测站点所对应的空气质量参数,所述目标服务器所对应的负载参数,所述目标道路所对应的交通流量参数等。所述预测参数的相关参数可以包括能够对所述预测参数产生影响的参数。
对于所述参数预测模型组件的实施方式,具体可以参考以上各个实施例所提供的所述空气质量预测模型组件的实施方式。两者实施方式的区别在于所述其区别在于所述空气质量预测模型组件的数据处理对象为所述目标监测站点和邻近监测站点在历史时间段内的空气质量及其相关数据,而所述参数预测模型组件的数据处理对象为目标对象和邻近对象在历史时间段内的预测参数及其相关参数的数据。当然,两个模型组件的训练样本也不相同,所述空气质量预测模型组件所使用的训练样本是所述目标监测站点和所述邻近监测站点在历史时间段内的空气质量及其相关数据,而所述参数预测模型组件的样本数据是所述目标对象及所述邻近对象的所述预测参数及其相关参数的数据,其余的实施例方式参考以上各个实施例,本申请在此不再赘述。
本申请提供的数据处理方法,可以在预测目标对象的预测参数数据的过程中,考虑到与所述目标对象在空间距离上邻近的对象对所述目标对象的预测参数的影响,综合考虑到预测参数所相关的复杂因素。本申请实施例提供的参数预测模型组件能够建立预测参数及其相关参数的数据在时间和空间上的联系,基于所述目标对象及其邻近对象之间的动态关联性,可以获取到准确性较高的预测参数的数据。
对应于上述数据处理方法,如图8所示,本申请还提供一种数据处理装置,包括处理器以及用于存储处理器可执行指令的存储器,所述处理器执行所述指令时可以实现上述任一实施例所述的数据处理方法。
本申请另一方面还提供一种计算机可读存储介质,其上存储有计算机指令,所述指令被执行时实现上述任一实施例所述方法的步骤。
所述计算机可读存储介质可以包括用于存储信息的物理装置,通常是将信息数字化后再以利用电、磁或者光学等方式的媒体加以存储。本实施例所述的计算机可读存储介质有可以包括:利用电能方式存储信息的装置如,各式存储器,如RAM、ROM等;利用磁能方式存储信息的装置如,硬盘、软盘、磁带、磁芯存储器、磁泡存储器、U盘;利用光学方式存储信息的装置如,CD或DVD。当然,还有其他方式的可读存储介质,例如量子存储器、石墨烯存储器等等。
在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray,FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(Hardware Description Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL (RubyHardware Description Language)等,目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个......”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (18)

1.一种数据处理方法,其特征在于,所述方法包括:
获取目标监测站点和邻近监测站点在历史时间段内的空气质量及其相关数据,所述邻近监测站点与所述目标监测站点之间的距离小于第一预设距离;
将所述目标监测站点及所述邻近监测站点的所述空气质量及其相关数据输入至空气质量预测模型组件中,所述空气质量预测模型组件在对所述目标监测站点和所述邻近监测站点的所述空气质量及其相关数据进行信息交互后,确定所述目标监测站点在未来时间段内的空气质量数据;
其中,所述空气质量预测模型组件被设置为利用所述目标监测站点的空气质量数据与所述目标监测站点和所述邻近监测站点的历史空气质量及其相关数据之间的对应关系训练得到。
2.根据权利要求1所述的数据处理方法,其特征在于,所述空气质量预测模型组件包括相互耦接的站点图神经网络和第一神经网络,其中,
所述站点图神经网络用于对所述目标监测站点和所述邻近监测站点在历史时间段内的空气质量及其相关数据实施信息交互;
所述第一神经网络用于根据所述站点图神经网络所生成的交互数据预测所述目标监测站点在所述未来时间段内的空气质量数据。
3.根据权利要求2所述的数据处理方法,其特征在于,所述将所述目标监测站点及所述邻近监测站点的所述空气质量及其相关数据输入至空气质量预测模型组件中,所述空气质量预测模型组件在对所述目标监测站点和所述邻近监测站点的所述空气质量及其相关数据进行信息交互后,确定所述目标监测站点在未来时间段内的空气质量数据,包括:
从所述历史时间段内的所述空气质量及其相关数据中提取多个时刻的数据,生成空气质量及其相关数据序列;
将所述目标监测站点及所述邻近监测站点的空气质量及其相关数据序列输入至所述站点图神经网络,经所述站点图神经网络进行图卷积操作后,生成所述目标监测站点对应的交互后序列;
将所述交互后序列输入至所述第一神经网络,经所述第一神经网络输出所述目标监测站点在所述未来时间段内的空气质量序列。
4.根据权利要求1所述的数据处理方法,其特征在于,所述空气质量预测模型组件包括依次耦接的城市图神经网络、站点图神经网络和第一神经网络,其中,
所述城市图神经网络用于对所述目标监测站点所在的目标城市及所述目标城市的邻近城市在历史时间段内的空气质量及其相关数据实施信息交互,其中,所述邻近城市与所述目标城市之间的距离小于第三预设距离,所述目标城市和所述邻近城市的空气质量及其相关数据根据所述目标监测站点和邻近监测站点在历史时间段内的空气质量及其相关数据计算得到;
所述站点图神经网络用于基于所述城市图神经网络生成的交互信息,对所述目标监测站点和所述邻近监测站点在历史时间段内的空气质量及其相关数据实施信息交互;
所述第一神经网络用于根据所述站点图神经网络所生成的交互数据预测所述目标监测站点在所述未来时间段内的空气质量数据。
5.根据权利要求4所述的数据处理方法,其特征在于,所述将所述目标监测站点及所述邻近监测站点的所述空气质量及其相关数据输入至空气质量预测模型组件中,所述空气质量预测模型组件在对所述目标监测站点和所述邻近监测站点的所述空气质量及其相关数据进行信息交互后,确定所述目标监测站点在未来时间段内的空气质量数据,包括:
从所述历史时间段内的所述空气质量及其相关数据中提取多个时刻的数据,生成空气质量及其相关数据序列;
分别确定所述目标城市和所述邻近城市所包含的监测站点,根据所述目标监测站点及所述邻近监测站点在所述历史时间段内的空气质量及其相关数据序列,分别生成所述目标城市和所述邻近城市所对应的空气质量及其相关数据序列;
将所述目标城市和所述邻近城市的空气质量及其相关数据序列输入至所述城市图神经网络,经所述城市图神经网络进行图卷积操作后,生成所述目标城市对应的第一交互后序列;
将所述第一交互后序列、所述目标监测站点及所述邻近监测站点的空气质量及其相关数据序列输入至所述站点图神经网络,经所述站点图神经网络进行图卷积操作后,生成所述目标监测站点对应的第二交互后序列;
将所述第二交互后序列输入至所述第一神经网络,经所述第一神经网络输出所述目标监测站点在所述未来时间段内的空气质量序列。
6.根据权利要求2-5任一项所述的数据处理方法,其特征在于,所述站点图神经网络包括多个站点节点、边,其中,所述多个站点节点分别包括不同站点的空气质量及其相关数据,所述边用于连接距离小于第二预设距离的站点节点,所述边包括连接的两个站点节点之间的地理相关信息和动态相关信息。
7.根据权利要求4或5所述的数据处理方法,其特征在于,所述城市图神经网络包括多个城市节点、边,其中,所述多个城市节点分别包括不同城市的空气质量及其相关数据,所述边用于连接距离小于所述第三预设距离的城市节点,所述边包括连接的两个城市节点之间的地理相关信息和动态相关信息。
8.根据权利要求2所述的数据处理方法,其特征在于,所述空气质量预测模型组件的网络参数包括从多组网络参数中选取的与所述目标监测站点相匹配的网络参数,所述多组网络参数分别对应于不同的监测站点对应的空气质量预测模型组件的网络参数。
9.根据权利要求6或7所述的数据处理方法,其特征在于,所述地理相关信息包括连接的两个站点节点或者城市节点之间的距离和相对方向。
10.根据权利要求6或7所述的数据处理方法,其特征在于,所述动态相关信息包括连接的两个站点节点或者城市节点之间风的影响大小和方向。
11.根据权利要求1所述的数据处理方法,其特征在于,所述空气质量及其相关数据包括空气质量数据及下述中的至少一种数据:气象数据、地域特征数据、天气预测数据。
12.根据权利要求11所述的数据处理方法,其特征在于,所述气象数据包括下述中的至少一种参数及其对应的参数值:湿度、温度、降水量、风速、风向、气压。
13.根据权利要求11所述的数据处理方法,其特征在于,所述地域特征数据包括下述中的至少一种参数及其对应的参数值:人口数量、经济指数、工业用电量、绿化面积、水域面积、水域数量、地理地貌、住宅区数量、工厂数量。
14.一种数据处理方法,其特征在于,所述方法包括:
获取目标对象和邻近对象在历史时间段内的预测参数及其相关参数的数据,所述邻近对象与所述目标对象之间的空间距离小于第一预设距离;
将所述目标对象及所述邻近对象的所述预测参数及其相关参数的数据输入至参数预测模型组件中,所述参数预测模型组件在对所述目标对象和所述邻近对象的所述预测参数及其相关参数的数据进行信息交互后,确定所述目标对象在未来时间段内的预测参数的数据;
其中,所述参数预测模型组件被设置为利用所述目标对象的预测参数数据与所述目标服务器和所述邻近对象的历史预测参数及其相关参数的数据之间的对应关系训练得到。
15.一种数据处理方法,其特征在于,所述方法包括:
获取目标服务器和邻近服务器在历史时间段内的负载及负载相关数据,所述邻近服务器与所述目标服务器的网络地址之间的小于第一预设距离;
将所述目标服务器及所述邻近服务器的所述负载及负载相关数据输入至负载预测模型组件中,所述负载预测模型组件在对所述目标服务器和所述邻近服务器的所述负载及负载相关数据进行信息交互后,确定所述目标服务器在未来时间段内的负载数据;
其中,所述负载预测模型组件被设置为利用所述目标服务器的负载数据与所述目标服务器和所述邻近服务器的历史负载及负载相关数据之间的对应关系训练得到。
16.一种数据处理方法,其特征在于,所述方法包括:
获取目标道路和邻近道路在历史时间段内的交通流量及其相关数据,所述邻近道路与所述目标道路之间的距离小于第一预设距离;
将所述目标道路及所述邻近道路的所述交通流量及其相关数据输入至流量预测模型组件中,所述流量预测模型组件在对所述目标道路和所述邻近道路的所述交通流量及其相关数据进行信息交互后,确定所述目标道路在未来时间段内的交通流量数据;
其中,所述交通流量预测模型组件被设置为利用所述目标道路的交通流量数据与所述目标道路和所述邻近道路的历史交通流量及其相关数据之间的对应关系训练得到。
17.一种数据处理装置,其特征在于,包括处理器以及用于存储处理器可执行指令的存储器,所述处理器执行所述指令时实现权利要求1-16任一项所述的数据处理方法。
18.一种非临时性计算机可读存储介质,当所述存储介质中的指令由处理器执行时,使得处理器能够执行权利要求1-16任一项所述的数据处理方法。
CN202010260975.3A 2020-04-03 2020-04-03 数据处理方法及装置 Pending CN113496305A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010260975.3A CN113496305A (zh) 2020-04-03 2020-04-03 数据处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010260975.3A CN113496305A (zh) 2020-04-03 2020-04-03 数据处理方法及装置

Publications (1)

Publication Number Publication Date
CN113496305A true CN113496305A (zh) 2021-10-12

Family

ID=77995311

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010260975.3A Pending CN113496305A (zh) 2020-04-03 2020-04-03 数据处理方法及装置

Country Status (1)

Country Link
CN (1) CN113496305A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024077876A1 (zh) * 2022-10-12 2024-04-18 华院计算技术(上海)股份有限公司 一种基于自适应的局部动态焦炭质量预测方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109902863A (zh) * 2019-02-15 2019-06-18 浙江财经大学 一种基于多因素时空相关性的风速预测方法及装置
CN110288170A (zh) * 2019-07-29 2019-09-27 重庆电子工程职业学院 预测模型构建方法、交通流量预测方法、装置及电子设备
CN110598953A (zh) * 2019-09-23 2019-12-20 哈尔滨工程大学 一种时空相关的空气质量预测方法
CN110675623A (zh) * 2019-09-06 2020-01-10 中国科学院自动化研究所 基于混合深度学习的短时交通流量预测方法、系统、装置
CN110910659A (zh) * 2019-11-29 2020-03-24 腾讯云计算(北京)有限责任公司 一种交通流量预测方法、装置、设备以及存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109902863A (zh) * 2019-02-15 2019-06-18 浙江财经大学 一种基于多因素时空相关性的风速预测方法及装置
CN110288170A (zh) * 2019-07-29 2019-09-27 重庆电子工程职业学院 预测模型构建方法、交通流量预测方法、装置及电子设备
CN110675623A (zh) * 2019-09-06 2020-01-10 中国科学院自动化研究所 基于混合深度学习的短时交通流量预测方法、系统、装置
CN110598953A (zh) * 2019-09-23 2019-12-20 哈尔滨工程大学 一种时空相关的空气质量预测方法
CN110910659A (zh) * 2019-11-29 2020-03-24 腾讯云计算(北京)有限责任公司 一种交通流量预测方法、装置、设备以及存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024077876A1 (zh) * 2022-10-12 2024-04-18 华院计算技术(上海)股份有限公司 一种基于自适应的局部动态焦炭质量预测方法

Similar Documents

Publication Publication Date Title
Shaygan et al. Traffic prediction using artificial intelligence: Review of recent advances and emerging opportunities
Mu et al. Hourly and daily urban water demand predictions using a long short-term memory based model
CN109887272B (zh) 一种交通人流量的预测方法及装置
Dadhich et al. Spatio-temporal urban growth modeling of Jaipur, India
CN112132264A (zh) 基于时空残差感知网络的区域尾气排放预测方法及系统
CN111160472B (zh) 对象的目标特征的预测方法、装置、存储介质与电子设备
CN111815098A (zh) 基于极端天气的交通信息处理方法、装置、存储介质和电子设备
Xu et al. A novel hybrid model for six main pollutant concentrations forecasting based on improved LSTM neural networks
Nikolić et al. Implementation of generic algorithm in map-matching model
CN114360239A (zh) 一种多层时空交通知识图谱重建的交通预测方法及系统
WO2023105294A1 (en) Methods, systems, devices and neural networks for forecasting a time series
CN117079148B (zh) 城市功能区的识别方法、装置、设备和介质
Ghassemi et al. Optimal surrogate and neural network modeling for day-ahead forecasting of the hourly energy consumption of university buildings
CN113496305A (zh) 数据处理方法及装置
CN116703004B (zh) 一种基于预训练模型的水系流域智慧巡护方法和装置
Ramhormozi et al. Multi-task graph neural network for truck speed prediction under extreme weather conditions
Feng et al. A survey of visual analytics in urban area
Pueblas et al. ETHOS. PASSION: An open-source workflow for rooftop photovoltaic potential assessments from satellite imagery
Kantamneni et al. An Ontology for Solar Irradiation Forecast Models.
Ye et al. Short-term traffic flow prediction at isolated intersections based on parallel multi-task learning
Nizar et al. Forecasting of temperature by using LSTM and bidirectional LSTM approach: case study in Semarang, Indonesia
CN114757097B (zh) 一种线路故障诊断方法及装置
CN111210513A (zh) 信息处理方法、装置、设备和存储介质
CN115391746A (zh) 针对气象要素数据的插值方法、装置、电子设备及介质
Bosma et al. Estimating solar and wind power production using computer vision deep learning techniques on weather maps

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination