CN116910608A

CN116910608A - 一种基于时空门控图卷积网络的多源数据预测方法和装置及计算机和存储介质

Info

Publication number: CN116910608A
Application number: CN202310741073.5A
Authority: CN
Inventors: 张海涛; 姚祥忠; 韩启龙; 宋洪涛; 刘鹏
Original assignee: Harbin Engineering University
Current assignee: Harbin Engineering University
Priority date: 2023-06-21
Filing date: 2023-06-21
Publication date: 2023-10-20

Abstract

一种基于时空门控图卷积网络的多源数据预测方法和装置及计算机和存储介质，涉及时空预测领域。解决现有的深度学习网络难以对多源数据做到快速精准的预测的问题，本发明提供一种基于时空门控图卷积网络的多源数据预测方法，所述方法包括以下步骤：S1：获取多源时序历史数据；S2：由S1所述多源时序历史数据进行数据预处理，得到所述预处理后的训练样本数据作为训练输入数据；S3：由S2所述的训练输入数据对时空门控图卷积网络模型进行训练，得到时空数据特征的预测值；S4：将所述预测值与真实值比较，得到基于时空门控图卷积网络模型的参数，所述装置采用所述方法实现，适用于多通道声呐发射机的研发过程中。适用于其他的时空预测任务中。

Description

一种基于时空门控图卷积网络的多源数据预测方法和装置及计算机和存储介质

技术领域

本发明涉及时空预测技术领域。

背景技术

时空预测是目前人工智能研究领域的一大热点，其应用范围越来越广泛。针对时空数据的空气质量预测、气象预报、股票预测等在日常生活和生产中得到了广泛应用，并显示出良好的效果。特别是在智能交通系统ITS领域中，使用时空预测技术进行交通预测已成为一项重要的任务，因此也得到了广泛的应用。这种应用不仅可以帮助人们更好地规划自己的行程，还可以提高交通效率，减少堵塞和延误，改善城市交通拥堵现象。随着时空预测技术的不断发展，我们相信它将会在更多领域发挥出强大作用。

最近几年，随着图神经网络的迅速发展和广泛应用，人们开始使用图神经网络在交通预测中取得了一些进展。比如STGCN、ASTGCN、Graph WaveNet和STSGCN等网络都使用图神经网络来构建空间和时间模型，以捕捉各自时间序列数据的时间和空间特征。在这些网络进行特征提取时，它们分别使用空间和时间邻接矩阵来表示不同节点之间时间和空间的联系，并通过图卷积操作来集成这些信息，最后输出预测结果。

然而，现有的方法和模型仍然存在一些局限性：(1)道路交通结构日益复杂，使得提取空间特征变得更加困难；(2)单独生成时间和空间邻接矩阵来捕捉节点特征忽视了节点之间时间和空间上的联系；(3)交通流数据复杂多变，需要能够同时、动态地捕捉全局特征，这对于现有的方法来说非常具有挑战性。

目前在时空预测方面，由于数据量大、准确度和实时性要求高，现有的网络模型和邻接矩阵特征提取方法并不适用。所以需要一个新的技术方案来解决这些问题。

发明内容

本发明的目的是为了克服现有的深度学习网络难以对多源数据做到快速精准的预测的问题，提供一种基于时空门控图卷积神经网络的多源数据预测方法，以解决时空预测任务中的数据量大、实时性要求高、准确性要求高的特点。

为实现上述目的，本发明提供了如下技术方案：

方案一、一种基于时空门控图卷积网络的多源数据预测方法，所述方法包括以下步骤：

S1：获取多源时序历史数据；

S2：由S1所述多源时序历史数据进行数据预处理，得到所述预处理后的训练样本数据作为训练输入数据；

S3：由S2所述的训练输入数据对时空门控图卷积网络模型进行训练，得到时空数据特征的预测值；

S4：将所述预测值与真实值比较，得到基于时空门控图卷积网络模型的参数

进一步的，提供一种优选实施方式，所述S1包括以下步骤：

S1.1：数据同步处理：用于获取到多源时序历史数据；对各数据源的时序数据同步采样，得到同步时序数据集D；

S1.2：归一化处理：对S1.1中得到的同步时序数据集D中各数据源在不同时刻的数据采用min-max标准化处理，经过标准化处理后的数据集记为D^*；

S1.3：数据分类处理：将S1.2中得到的数据集D^*作为训练样本，将训练样本数据分为空间数据X_T、时间数据z_T+1和时空数据S_T。

进一步的，提供一种优选实施方式，所述S1.1具体为：由设定时间间隔ΔT同步获取数据源在同一时刻的采样值，得到同步时序数据集D，

其中，M是数据源的总个数，N是采样数据长度；表示第k个数据源的时序数据进行采样时在时刻t采样到的数据，t₀为采样的起始时刻；采用均值插补法进行缺失值处理，用于获取各数据源在同一时刻的采样值。

进一步的，提供一种优选实施方式，所述时空门控图卷积网络模型包括空间卷积模块、时间卷积模块、时空卷积模块和特征融合模块。

进一步的，提供一种优选实施方式，所述S3包括以下步骤：

S3.1：在空间卷积模块中，利用图卷积神经网络GCN来捕获区域上的空间相关性；

S3.2：在时间卷积模块中，利用门控循环单元GRU捕获预测区域上的时间相关性；

S3.3：在时空卷积模块中，利用时空卷积块GconvGRU通过相似性图可以同时捕获节点在空间和时间上的相关性；

S3.4：在特征融合模块，将上述步骤中训练后的时空数据特征通过全连接层FullyConnected Layer，简称FC，进行特征融合。

方案二、基于时空门控图卷积网络的多源数据预测装置，包括

输入模块，用于获取多源时序历史数据；

预处理模块，用于由S1所述多源时序历史数据进行数据预处理，得到所述预处理后的训练样本数据作为训练输入数据；

模型训练模块，用于由S2所述的训练输入数据对时空门控图卷积网络模型进行训练，得到时空数据特征的预测值；

输出模块，将所述预测值与真实值比较。

方案三、一种计算机设备，包括存储器和处理器，所述存储器中存储有计算机程序，当所述处理器运行所述存储器存储的计算机程序时，所述处理器执行上述方案一和方案二任意一项所述的方法。

方案四、一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现方案一和方案二任意一项所述的方法的步骤。

本发明有益之处在于：

本发明所述的一种基于时空门控图卷积神经网络的多源时空数据预测方法，通过构建不同的模块进行特征提取相应的特征数据，提升预测的准确率。在空间卷积模块中，构建时空图数据，利用图卷积神经网络来捕获区域上的空间相关性。在时间卷积模块中，使用门控循环单元捕获全局的时间相关性。在时空卷积模块中，构建相似性图使用混合神经网络同时捕获节点在空间和时间上的相关性。在交通事故数据集上取得的平均绝对误差、均方根误差和召回率的结果，远远领先于现有方法，且可以动态捕获多源时空数据的特征，并实时更新时间序列数据的变化，更具有鲁棒性。

本发明在数据量方面，现有的预测技术能够处理的数据量是百万级数据，而本发明能够处理千万级数据量，进而体现出本案处理的数据量比现有技术大很多。在准确度方面，本实施例中采用本发明所述的方法在纽约交通事故数据集上取得了平均绝对误差为6.6423，均方根误差为7.7318和召回率为32.78％的结果数据，这些数据要优于现有技术的方法，从而证明本发明在准确度方面具有显著的进步。在实时性方面，在相同数据量的前提下，本发明所述的方法能够对采集到的数据进行实时更新预测，捕捉到不同数据之间潜在的时间和空间联系，此方法具有耗时低，计算复杂度小，处理速度提高了两倍，进而证明本发明的实时性更好。

本发明在多源数据的时空预测方面提供了一种基于时空门控图卷积神经网络的多源时空数据预测方法和装置，对于交通流、交通事故这样的时间序列数据，做到了高实时性与高准确性的预测，可以广泛应用于智能交通系统的检测和管理中。

附图说明

图1为实施方式一所述的一种基于时空门控图卷积网络的多源数据预测方法的流程图。

图2为实施方式一所述的一种基于时空门控图卷积网络的多源数据预测方法的时空门控图卷积神经网络模型图。

图3为实施方式五所述的一种基于时空门控图卷积网络的多源数据预测方法的时间卷积模块的DGRU结构图。

图4为实施方式五所述的一种基于时空门控图卷积网络的多源数据预测方法的时空卷积块GconvGRU模型图。

其中，1为渐进特征，2为周期特征。

具体实施方式

为使本申请实施方式的目的、技术方案和优点更加清楚，下面将结合本申请实施方式中的附图，对本申请实施方式中的技术方案进行清楚、完整地描述，显然，所描述的实施方式是本申请一部分实施方式，而不是全部实施方式。

实施方式一、参见图1说明本实施方式，本实施方式提供了一种基于时空门控图卷积网络的多源数据预测方法，所述方法包括以下步骤：

S1：获取多源时序历史数据；

S4：将所述预测值与真实值比较。

本实施方式通过多源数据的时空预测方法，得到多源时序历史数据；所述多源时序历史数据进行数据预处理，得到所述预处理后的训练样本数据作为输入，用于后续模型的训练；本实施方式S4中进一步阐述了将预测值与真实值比较的方法，以加权均方根误差MSE作为损失函数训练调整基于时空门控图卷积网络模型的参数作为输出，用于达到预测值的精度要求。

所述的训练样本对时空门控图卷积网络模型进行训练，得到时空数据特征的预测值；获得的所述预测值，将预测值与真实值比较，以加权均方根误差MSE作为损失函数训练调整基于时空门控图卷积网络模型的参数作为输出，用于达到预测值的精度要求。有效的解决克服现有的深度学习网络难以对多源数据做到快速精准的预测的问题，从而为缓解样本间的不平衡问题，本发明在MSE损失函数的基础上增加权重信息，称为MSE加权损失函数。在计算损失时，事故风险较大的样本赋予较大的权重，模型更关注事故风险较大的值，避免预测结果集中在零附近。基于本发明能够有效地预防事故，减少事故造成的生命财产损失，基于本发明能够更好地设计交通规划和调度策略。

实施方式二、参见图1和图2说明本实施方式，本实施方式是对实施方式一所提供的种基于时空门控图卷积网络的多源数据预测方法的进一步限定，所述S1包括以下步骤：

实施方式三、本实施方式是对实施方式二所提供的种基于时空门控图卷积网络的多源数据预测方法的进一步限定，所述S1.1具体为：由设定时间间隔ΔT同步获取数据源在同一时刻的采样值，得到同步时序数据集D，

实施方式二至三将实施方式一中S1进行具体说明，将训练样本数据分为空间数据X_T、时间数据z_T+1和时空数据S_T，从而提高预测的准确率。

实施方式四、本实施方式是对实施方式一所提供的种基于时空门控图卷积网络的多源数据预测方法的进一步限定，所述时空门控图卷积网络模型包括空间卷积模块、时间卷积模块、时空卷积模块和特征融合模块。

本实施方式通过构建时空门控图卷积网络模型包括空间卷积模块、时间卷积模块、时空卷积模块和特征融合模块，充分考虑到不同路段之间的空间相关性、时间相关性和时空相关性，提升预测的准确率。

实施方式五、本实施方式是对实施方式四所提供的种基于时空门控图卷积网络的多源数据预测方法的进一步限定，所述S3包括以下步骤：

通过图卷积神经网络可提取节点V_i及其邻域空间结构信息，图卷积神经网络GCN各层之间的传播方式如下：

其中，I为单位矩阵，D为对角阵，/>H⁽⁾为l层的输入，W^l为l层的权重参数，H⁽⁺¹⁾为l层的输出。

为了提高模型的鲁棒性，在图卷积网络后引入批量归一化处理，再通过ReLU激活函数提取出数据中的非线性特征，本发明选择两层图卷积神经网络GCN模型。经过以上处理，空间相关模块中图卷积模型计算公式如下：

其中，表示预处理步骤，BN为批量归一化，W₀∈R^P*H表示从输入到隐藏层的权重矩阵，P表示特征矩阵的长度，H表示隐藏单元的数量，W₁∈R^H*T表示从隐藏层到输出层的权重矩阵。f(X,A)∈R^N*T表示具有预测长度T的输出。

参见图3说明S3.2，提出了双链门控循环单元GRU，英文为Double-chain GRU，简称DGRU网络结构。假设预测t时空的时序特征如假设序列的周期性为5，提取t-1、t-2、t-3、t-4时刻的特征1作为渐近特征，提取t-5、t-2×5、t-3×5、t-4×5时刻的特征2作为周期特征。将渐进特征和周期特征分别传入双链门控循环单元GRU网络，最后将两个门控循环单元GRU链中的特征进行融合，作为DGRU网络的输出特征。因为两种特征同属于多层双链门控循环单元GRU层输出的时序特征，相互之间影响较大，以相乘的方式进行特征融合。

提取渐进特征的计算公式如下：

h₁＝u₁*h_t-1+(1-u₁)*c₁

其中h₁表示时刻t的渐进输出特征，h_t-1表示t-1时刻的隐藏状态；u₁为更新门，用于控制上一次状态信息带入当前状态的渐进程度；c₁为渐进时刻存储的内存内容。

提取周期特征的计算公式如下：

h₂＝u₂*h_t-1+(1-u₂)*c₂

其中h₂表示时刻t的周期输出特征，h_t-1表示t-1时刻的隐藏状态；u₂为更新门，用于控制上一次状态信息带入当前状态的周期程度；c₂为周期时刻存储的内存内容。

将两种时序特征进行特征融合，计算公式如下：

h′_t＝h₁*h₂

其中h′_t是特征融合后的时序输出特征。

为了同时从多源数据中获取空间和时间相关性，我们提出了一种基于图卷积网络和门控递归单元的时空卷积块GconvGRU模型，如图4所示。

其中h_t-1表示t-1时刻的隐藏状态r_t为重置门，用于控制忽略前一时刻状态信息的程度；u_t为更新门，用于控制上一次状态信息带入当前状态的程度；c_t为t时刻存储的内存内容；h_t是t时刻的输出状态。时空卷积块GconvGRU模型以t-1时刻的隐藏状态和当前交通信息为输入，获取t时刻的交通信息。该模型在捕捉当前时刻交通信息时，保留历史交通信息的变化趋势，具有捕捉时间依赖性的能力。

具体计算过程如下：

u_t＝σ(W_u[f(A，X_t)，_t-1]+b_u)

r_t＝σ(W_r[f(A，X_t)，_t-1]+b_r)

c_t＝tan(W_c[f(A，X_t)，(r_t*_t-1)]+b_c)

_t＝u_t*_t-1+(1-u_t)*c_t

时空卷积块GconvGRU模型可以处理复杂的时空相关性问题。一方面，利用图卷积神经网络捕捉节点之间的拓扑结构，获得空间相关性。另一方面，门控递归单元用于捕获节点的动态变化，以获得时间相关性并最终实现时空预测任务。

在特征融合模块，将上述步骤中训练后的时空数据特征通过全连接层FullyConnected Layer，简称，全连接层FC进行特征融合。在特征融合层，将提取的空间特征、时间特征、时空特征串联成一个密集的向量，构建输入全连接网络的高维特征。然后通过全连接层FC将向量转换为模型输出。因此，模型预测输出可转化为公式：

其中分别表示在t时刻的空间特征、时间特征和时空特征；W_gcn、W_gru、W_GconvGru、b_t表示各个属性相关的权重和偏差。

S4：通过S3获得的某路段发生交通事故的风险值，预测未来时间段在该路段发生交通事故的风险。设计整个模型的损失函数，其能进一步缓解事故数据不均衡的问题，其中y表示真实值，表示预测值，λ_i为不同等级的风险值对应的权重。损失函数为：

本实施方式通过在损失函数设计上给予非零值更多的权重，能够有效地解决事故数据样本不均零值过多带来的问题。

本实施方式在空间维度上将待研究区域划分成路段，通过所述特征融合模块融合多源异质数据和外部特征，使用图卷积神经网络门控循环单元GCN模型获得空间依赖性；在时间维度上引入GRU模型捕捉节点属性的动态变化，获得时间依赖性。

实施方式七、一种计算机设备，包括存储器和处理器，所述存储器中存储有计算机程序，当所述处理器运行所述存储器存储的计算机程序时，所述处理器执行实施方式一至五任意一项所述的方法。

实施方式八、一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现实施方式一至五任一项所述的方法的步骤。

附图中的流程图和框图，公开了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图或流程图中的每个方框、以及框图或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

以下对本实施方式涉及到的符号和定义进行解释或说明：

定义一、路段区域：将研究区域划分为N条路段，即得到道路网络；

定义二、事故类型：根据交通事故中的伤亡人数，本发明定义了三种交通事故类型，即轻微事故(轻度)、受伤事故(中度)、和致命事故(重度)，对应的风险值分别为1、2和3。

定义三、事故风险：本发明将事故风险定义为在一段时间内，某个区域发生事故的次数与其对应事故类型的加权求和。用表示在时间段t区域a的所有事故风险总和，a∈{1,…,N}，如果区域a在时间段t内发生了1起重度事故，2起中度事故，则/>

定义四、邻接矩阵A：将定义一中构建的路段区域抽象表达成图G＝(V,E,A)，其中V表示划分的路段集合，E为边集(根据路段之间的连通性构建)，A∈R^N*N,R^N*N为N×N的矩阵，A为图G的邻接矩阵，A矩阵中的元素A_i,j定义如下：

其中，i∈V,j∈V，e_i,j表示路段i和路段j之间的连通关系，Sim(i,j)表示路段i和路段j之间的相似度，通过计算路段i与路段j之间特征的JS散度(Jensen-Shannondivergence)来衡量，用V_i表示路段i的特征向量，用V_j表示路段j的特征向量，V_i包括路段i的道路本身的属性信息和路段i周围的兴趣点(POI)属性信息，V_j包括路段j道路本身的属性信息和路段j周围的POI属性信息，JS散度定义如下：

其中，k表示特征向量的维度。

基于以上定义，将交通事故风险预测问题建模为一个时空预测问题，表示所有道路区域在时间步t的特征，包括路段长度、道路等级、车道数、POI，d_r为区域特征的维度；/>表示时间步t的时间特征，包括天气、风力、风向、气温，d_t为时间特征的维度；/>表示图中所有结点在时间步t的图信号特征，每一行表示一个结点的特征，包括单位时间道路通过车辆数、单位时间道路车辆通过平均速度、单位时间内事故发生数量，d_g为结点特征的维度。综上所述，时空预测问题形式化描述为：给定历史时间长度为T的区域特征{X₁,X₂,…,X_T}、时间特征z_T+1和时空特征矩阵{S₁,S₂,…,S_T}，预测下一个时间步T+1所有区域的交通事故风险Y_T+1∈R^i*j。

现有技术主要是针对网络级别的事故预测，虽然考虑到了事故发生的空间异质性，但是分开训练较为耗时，也不能充分利用区域之间的关联，本发明通过构建路网结构，充分考虑到不同路段之间的空间相关性、时间相关性和时空相关性，提升预测的准确率。本发明是一种融合多源时空数据的城市路网事故风险预测方法，在空间维度上将待研究区域划分成路段，融合多源异质数据和外部特征，使用图卷积神经网络GCN模型获得空间依赖性；在时间维度上引入门控循环单元GRU模型捕捉节点属性的动态变化，获得时间依赖性。为缓解样本间的不平衡问题，本发明在MSE损失函数的基础上增加权重信息，称为MSE加权损失函数。在计算损失时，事故风险较大的样本赋予较大的权重，模型更关注事故风险较大的值，避免预测结果集中在零附近。基于本发明能够有效地预防事故，减少事故造成的生命财产损失，基于本发明能够更好地设计交通规划和调度策略。

以上所述仅为本发明的优选实施方式而已，并不用于限制本发明，尽管参照前述实施方式对本发明进行了详细的说明，对于本领域的技术人员来说，其依然可以对前述各实施方式所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

尽管已描述了本发明的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例作出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

Claims

1.一种基于时空门控图卷积网络的多源数据预测方法，其特征在于，所述方法包括以下步骤：

S1：获取多源时序历史数据；

S4：将所述预测值与真实值比较，得到基于时空门控图卷积网络模型的参数。

2.根据权利要求1所述的一种基于时空门控图卷积网络的多源数据预测方法，其特征在于，所述S1包括以下步骤：

3.根据权利要求2所述的一种基于时空门控图卷积网络的多源数据预测方法，其特征在于，所述S1.1具体为：由设定时间间隔ΔT同步获取数据源在同一时刻的采样值，得到同步时序数据集D，

4.根据权利要求1所述的基于时空门控图卷积网络的多源数据预测方法，其特征在于，所述时空门控图卷积网络模型包括空间卷积模块、时间卷积模块、时空卷积模块和特征融合模块。

5.根据权利要求4所述的一种基于时空门控图卷积网络的多源时空数据预测方法，其特征在于，所述S3包括以下步骤：

S3.4：在特征融合模块，将上述步骤中训练后的时空数据特征通过全连接层FullyConnected Layer，FC进行特征融合。

6.基于时空门控图卷积网络的多源数据预测装置，其特征在于，包括

输入模块，用于获取多源时序历史数据；

输出模块，将所述预测值与真实值比较。

7.一种计算机设备，包括存储器和处理器，其特征在于，所述存储器中存储有计算机程序，当所述处理器运行所述存储器存储的计算机程序时，所述处理器执行权利要求1-5任意一项所述的方法。

8.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现权利要求1-5任一项所述的方法的步骤。