CN113094357A - 一种基于时空注意力机制的交通缺失数据补全方法 - Google Patents

一种基于时空注意力机制的交通缺失数据补全方法 Download PDF

Info

Publication number
CN113094357A
CN113094357A CN202110438939.6A CN202110438939A CN113094357A CN 113094357 A CN113094357 A CN 113094357A CN 202110438939 A CN202110438939 A CN 202110438939A CN 113094357 A CN113094357 A CN 113094357A
Authority
CN
China
Prior art keywords
data
time
model
input
completion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110438939.6A
Other languages
English (en)
Other versions
CN113094357B (zh
Inventor
申彦明
徐文权
齐恒
尹宝才
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dalian University of Technology
Original Assignee
Dalian University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dalian University of Technology filed Critical Dalian University of Technology
Priority to CN202110438939.6A priority Critical patent/CN113094357B/zh
Publication of CN113094357A publication Critical patent/CN113094357A/zh
Application granted granted Critical
Publication of CN113094357B publication Critical patent/CN113094357B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2477Temporal data queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Fuzzy Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Traffic Control Systems (AREA)

Abstract

一种基于时空注意力机制的交通缺失数据补全方法,首先通过注意力机制的方式,捕获路网中所有的路段在当前时刻对路网交通状态的影响程度大小,并在不同时刻重新捕获空间相关性信息,提高数据补全的精度。其次,考虑交通数据的时序性,不同时刻的交通数据对当前时刻的数据影响程度是不一样的,通过时间注意力机制捕获这种不一致的时间相关性信息,在对当前缺失数据补全时保留最有效的信息,提升模型的补全效果。最后,在利用时空注意力机制捕获交通数据的时空相关性同时,考虑数据之间的相关性受到空间距离和时间间隔的增大而衰减,加入时空衰减性矩阵提高补全精度。本发明不仅大幅提高数据缺失率低的情况下补全精度,还提升在数据缺失率高的情况下的补全精度。

Description

一种基于时空注意力机制的交通缺失数据补全方法
技术领域
本发明属于交通领域,涉及一种基于时空注意力机制的交通缺失数据补全方法。
背景技术
随着互联网技术和交通信息化的快速发展,交通数据的规模越来越大,在智能交通系统中,完整有效的交通数据对交通管理的意义重大。但是实际生活中采集交通数据时,由于一些不可避免的事件的发生(如设备损坏、恶劣天气等),会导致数据采集中断,造成部分数据的缺失,这降低了数据集的有效性,制约了智能交通建设的发展。对交通数据集中的缺失值进行有效的补全,具有重要的理论和实际的研究意义。然而交通数据的补全具有非常大的挑战性,一方面,道路交通数据随着时间的变化是非平稳的,比如早晚高峰、节假日等都会影响交通数据的变化趋势,在临近时间上,交通数据具有很强的时间依赖性,同时,交通数据还呈现出显著的长时周期相关性;另一方面,真实世界中的交通路网具有复杂的空间结构,不同路网节点之间存在着空间相关性。此外,数据的缺失模式对缺失值的补全也存在影响。现有的补全方法在处理数据缺失时,对这些特性的建模不充分。比如Li等人通过对输入向量进行分解后,结合LSTM和支持向量机(Support Vector Regression,简称SVR)通过多视角的方法来进行时间序列数据补全,忽略了数据之间时空相关性的动态变化,同时没有考虑交通数据所存在的显著周期相关性。
注意力机制被广泛地使用在自然语言处理、语音识别以及图像识别等各种不同类型的深度学习任务中,是如今深度学习技术中最值得关注与了解的核心技术之一。所以,对于使用深度学习技术进行研究的研究人员来说,熟悉注意力机制的相关知识是很有必要的。从注意力机制的命名方式来看,很明显这是借鉴了人类的注意力这一概念,在人类对事物进行观察时,通常会把注意力集中在特定的某些部分,由此来获得得到目标问题所需要的相关性更高的信息。以人类视觉的选择性注意力机制为例,视觉注意力机制是人类所特有的大脑信号处理机制。在对图像进行观测时,通过对全局图像的快速扫描,可以选择出需要更多注意力来关注的目标区域,这也就是一般所说的注意力焦点。然后对这一块区域投入更多的注意力资源来获取所需要关注的目标的更多细节信息,同时也降低注意力分配给其他无用信息的比重。这是人类利用有限的注意力资源从大量信息中快速筛选出更具有价值的信息的方式,这一机制极大地提高了视觉信息处理的效率与准确性,是人类长期进化中形成的一种生存机制。深度学习中的注意力机制的核心目标也是从众多的信息中选择出对当前任务目标更有价值的信息。
神经网络最开始是受生物神经系统的启发,为了模拟生物神经系统而出现的,由大量的节点(或称神经元)之间相互联接构成。神经网络根据输入的变化,对权值进行调整,改善系统的行为,自动学习到一个能够解决问题的模型。LSTM(长短记忆网络)是RNN(循环神经网络)的一种特殊形式,有效地解决多层神经网络训练的梯度消失和梯度爆炸问题,能够处理长时时间依赖序列。LSTM能够捕获交通数据的序列特性,使用LSTM模型能够有效提高补全精度。
LSTM网络由LSTM单元组成,LSTM单元由单元,输入门、输出门和遗忘门组成。
遗忘门:决定从上一个单元的输出状态中丢弃多少信息,公式如下:
ft=σg(Wfxt+Ufht-1+bf)
其中,ft是遗忘门的输出,xt是输入序列,ht-1是上一个单元的输出,σg表示sigmoid函数,Wf表示输入的权重参数矩阵,Uf表示上一个单元输出的权重参数矩阵,bf表示偏差参数向量。
输入门:决定让多少新的信息加入到Cell状态中,并对单元状态C进行更新,公式如下:
it=σg(Wixt+Uiht-1+bi)
Figure BDA0003034248280000021
其中,ct表示当前单元的单元状态,σg和σc表示sigmoid函数,
Figure BDA0003034248280000022
表示矩阵乘积,Wi表示输入的权重参数矩阵,Ui表示上一个单元输出的权重参数矩阵,bi表示偏差参数向量,ft是遗忘门的输出,ct-1是上一个单元的单元状态,
Figure BDA0003034248280000032
表示矩阵乘积,Wc表示输入的权重参数矩阵,Uc表示上一个单元输出的权重参数矩阵,bc表示偏差参数向量。
输出门:基于当前的单元状态输出结果。
ot=σg(Woxt+Uoht-1+bo)
Figure BDA0003034248280000031
其中,ht表示当前单元的输出,σg和σh表示sigmoid函数,
Figure BDA0003034248280000033
表示矩阵乘积,Wo表示输入的权重参数矩阵,Uo表示上一个单元输出的权重参数矩阵,bo表示偏差参数向量。
发明内容
本发明提出了一种基于时空注意力机制的交通缺失数据补全方法,是一种针对交通数据的临近时间相关性、动态的空间相关性和长时的周期相关性建模的深度学习方法,目的在于提高交通缺失数据的补全精度。
为了达到上述目的,本发明采用的技术方案为:
一种基于时空注意力机制的交通缺失数据补全方法,步骤如下:
第一步、对原始数据进行预处理
获取所有车流量数据作为原始数据,对原始数据进行预处理,将数据按k分钟的时间间隔做聚合操作,同时去除异常值并进行数据的标准化处理。
第二步、根据数据的不同缺失模式处理数据
将通过第一步获得的预处理后的数据进行数据点丢失处理,构建带有缺失点的数据集,然后记录缺失点所在的位置信息,同时保存缺失点对应的车流量数据真实值,作为验证值,用来验证数据补全模型的补全效果。
同时,结合缺失点所在的位置信息构建时空相关性衰减矩阵。当数据中存在缺失值时,利用其它存在观测值的点的信息来对当前缺失点补全时,由于不同观测点和当前点之间时间间隔和空间距离的增大,其它观测点的信息对当前缺失点的补全产生的作用会随之衰减,这会影响最终的补全精度。通过构建时空相关性衰减矩阵来捕获相关性的衰减。时间维度影响衰减性矩阵定义如下:
Figure BDA0003034248280000041
其中,
Figure BDA0003034248280000042
表示第i个路段,t时刻的观测点和它时间上距离最近且存在观测值的点之间的时间间隔;Tt表示t时刻观测点在整个时间序列中的时刻信息。
空间维度影响衰减性矩阵定义如下:
Figure BDA0003034248280000043
其中,
Figure BDA0003034248280000044
表示第i个路段,t时刻的观测点和它空间上距离最近且存在观测值的点之间的空间距离,Li表示第i个路段在整个路网中所在的位置信息。
Figure BDA0003034248280000045
的定义如下:
Figure BDA0003034248280000046
第三步、补全模型的输入定义
所述的补全模型的输入由周期性输入和临近性输入组成:
临近性输入序列包括正向临近性输入序列和反向临近性输入序列:
正向临近性输入序列定义为:
Figure BDA0003034248280000047
其中,LF表示模型需要的正向临近性输入数据时间观测窗口的长度;
Figure BDA0003034248280000048
表示t时刻,长度为LF的时间序列车流量观测值。
反向临近性输入序列定义为:
Figure BDA0003034248280000049
其中,LB表示模型需要的反向临近性输入数据时间观测窗口的长度;
Figure BDA00030342482800000410
表示t时刻,长度为LB的时间序列车流量观测值。
周期性输入序列包括正向周期性输入序列和反向周期性输入序列。
正向周期性输入序列定义为:
Figure BDA0003034248280000051
其中,LF表示模型需要的正向周期性输入数据时间观测窗口的长度;n表示模型输入所需要的周期数;ft,j表示在t时刻的周期数据集合内第j个周期的观测值。
反向周期性输入序列定义为:
Figure BDA0003034248280000052
其中,LB表示模型需要的正向周期性输入数据时间观测窗口的长度;n表示模型输入所需要的周期数;ft,j表示在t时刻的周期数据集合内第j个周期的观测值。
第四步、构建数据补全模型。
结合第三步获得的补全模型的输入,构建数据补全模型。整个数据补全模型包括基于空间注意力机制的编码器模块、基于时间注意力机制的解码器模块、和基于时间卷积网络的周期性特征提取模块,各个模块的结构及训练机制如下:
(1)基于空间注意力机制的编码器模块:是由全连接网络和双向长短期记忆网络组合成的模型,通过全连接网络对输入序列进行特征提取和映射,降低输入序列的维度。然后使用双向长短期记忆网络对序列进行编码,编码的同时,利用空间注意力机制捕获其它路段对目标路段的影响。
基于空间注意力机制的编码器模块的实现细节:首先将正向临近性输入FFS和反向临近性输入FBS通过全连接网络进行映射,然后将降维后的向量输入Bi-LSTM网络中,通过空间注意力机制给不同的路段分配权重系数,然后输入Bi-LSTM单元中,在更新Bi-LSTM单元的隐藏层输出时,同时加入第二步得到的空间维度影响衰减性矩阵,获取编码器的输出。
(2)基于时间注意力机制的解码器模块:由多层长短期记忆网络组合,将编码器的输出作为输入,通过解码过程获取最终的缺失数据补全值。
基于时间注意力机制的解码器模块实现细节:将编码器模块的输出作为输入,通过时间注意力机制捕获不同时间点和目标时间点的相关性程度并分配权重系数,然后输入LSTM单元中,在更新LSTM单元的隐藏层输出时,同时加入第二步得到的时间维度影响衰减性矩阵,获取解码器的输出。
(3)基于时间卷积网络的周期性特征提取模块:由多层时间卷积网络构成的模块。通过对周期性数据特征的提取,获取历史数据中、同一个传感器、同一个时间段车流量的变化规律,然后将提取到的特征输出。
实现细节:首先将正向周期性输入FFL和反向周期性输入FBL通过全连接网络进行映射,将输出的两个映射向量进行拼接,然后用基于无因果卷积的时间卷积网络对周期性特征进行提取。
第五步、对第二步处理后的数据集进行划分,按6:2:2的比例划分为训练集、验证集和测试集。在训练集上对模型进行训练获取最优的参数,在验证集上对当前最优参数组合下模型的效果进行验证,最后在测试集上测试模型最终的补全效果。使用训练集数据对数据补全模型进行预训练,对模型的参数进行初始化,提前优化基于时空注意力机制的数据补全模型的参数,避免在整体训练时将参数优化到局部最优点。
第六步、在第五步获得的带有初始化参数的模型上,使用训练集和验证集数据对第四步构建的数据补全模型同时进行整体性训练,获取数据补全模型最优的参数组合:
将预处理后的数据分别输入到数据补全模型相应的模块中,同时对所有模块进行整体性训练。计算每次训练后的补全值和车流量数据的真值的损失函数值,将模型的参数训练到目标值。根据模型在训练集、验证集上的效果,不断调试模型的超参数,在减小过拟合的条件下提高补全精度。在使用验证集时,将数据补全模型的学习率设置为0,防止数据泄露的发生。
所述的输入数据包括:正向临近性输入
Figure BDA0003034248280000061
(t时刻前t1个时间间隔的车流量数据)、反向临近性输入
Figure BDA0003034248280000062
(t时刻后t1个时间间隔的车流量数据)、正向周期性输入
Figure BDA0003034248280000063
(t时刻前t2天内所有同一时刻的车流量数据)、反向周期性输入
Figure BDA0003034248280000064
(t时刻后t2天内所有同一时刻的车流量数据)、时间维度影响衰减性矩阵
Figure BDA0003034248280000065
空间维度影响衰减性矩阵
Figure BDA0003034248280000066
缺失点位置信息矩阵
Figure BDA0003034248280000067
经过一次迭代后,得到的是经过一次补全操作之后的车流量数据。将这次迭代后的数据作为下一次迭代的输入,之前缺失点虽然有了补全值,但是由于标签还是表示缺失,后续迭代过程中,目标还是对这些缺失点进行数据补全,但是由于已经存在相对接近真值的数据,提供了先验知识,可以提升模型收敛的速度以及补全精度。
第七步、使用测试集利用第六步训练好的数据补全模型进行车流量数据补全。具体如下:
输入数据为:正向临近性输入
Figure BDA0003034248280000071
反向临近性输入
Figure BDA0003034248280000072
正向周期性输入
Figure BDA0003034248280000073
反向周期性输入
Figure BDA0003034248280000074
时间维度影响衰减性矩阵
Figure BDA0003034248280000075
空间维度影响衰减性矩阵
Figure BDA0003034248280000076
缺失点位置信息矩阵
Figure BDA0003034248280000077
通过第六步的数据补全模型得到缺失的车流量数据的补全值,和第二步进行丢失处理后得到的验证值进行对比,验证模型的补全效果。
进一步的,所述第一步中,预处理的具体过程为:
(1)时间粒度划分:将所有车流量数据按k分钟的时间粒度处理为每k分钟的车流量数据;
(2)对数据进行标准化:采用最小值和最大值对车流量数据进行标准化,公式如下:
Figure BDA0003034248280000078
其中,x表示原始值,xmin表示原始值的最小值,xmax表示原始值的最大值,max为归一化的上限值,min为归一化的下限值,[min,max]表示归一化后的区间,x*为标准化后的结果。
进一步的,所述第四步中,基于时空注意力机制的编码器模块、解码器模块的计算过程如下:
在基于空间注意力机制的编码器模块中,使用注意力机制提取不同路段数据之间的空间相关性,公式如下:
Zt=ReLU(WeZS+be)
Figure BDA0003034248280000081
Figure BDA0003034248280000082
其中,ReLU是选用的激活函数,We,Wl,Ul,bl模型训练过程中不断更新的参数,“.;.”表示张量拼接操作。βt表示最终获得的包含空间关联性信息的权重系数。
然后加入空间维度影响衰减性矩阵来捕获空间距离对空间相关性的影响,公式如下:
Figure BDA0003034248280000083
Figure BDA0003034248280000084
其中,
Figure BDA0003034248280000085
表示t时刻的空间相关性衰减因子,ht-1表示上一时刻的隐藏层状态。
在基于时间注意力机制的解码器模块中,通过注意力机制捕获不同时刻和当前时刻之间的时间相关性,公式如下:
Figure BDA0003034248280000086
Figure BDA0003034248280000087
其中,st-1表示LSTM单元的前一时刻的隐藏状态,ct-1表示LSTM单元前一时刻的cell状态,
Figure BDA0003034248280000088
Wd、Ud表示的是模型在训练过程中不断学习更新的参数,.;.表示向量连接操作,
Figure BDA0003034248280000089
表示的就是第i个编码器状态在对当前时刻的缺失值进行补全时的权重系数,也就是在时间维度上,其他时刻与当前时刻的时间关联性强度。
进一步的,所述第六步中,计算每次迭代所得到的车流量补全值和第二步中保存的车流量数据真实值的均方误差MAE,使用Adam方法最小化MAE。
Figure BDA00030342482800000810
其中,x′j表示第j个缺失点的车流量数据真实值,xj表示第j个缺失点的车流量数据补全值,n表示总的缺失点个数。
与现有技术相比,本发明的有益效果:
首先,对交通数据空间相关性特征的捕获上的改进,以往的方法在利用数据的空间相关性时,通常都是考虑临近路段对当前路段的影响,同时没有考虑空间相关性随着时间的变化而动态变化,本发明通过注意力机制的方式,捕获了路网中所有的路段在当前时刻对路网交通状态的影响程度大小,并在不同时刻重新捕获空间相关性信息,大幅提高了数据补全的精度。
其次,考虑到交通数据的时序性,不同时刻的交通数据对当前时刻的数据影响程度是不一样的,本发明通过时间注意力机制捕获这种不一致的时间相关性信息,在对当前缺失数据补全时保留最有效的信息,提升了模型的补全效果。
最后,在利用时空注意力机制捕获交通数据的时空相关性同时,考虑了数据之间的相关性受到空间距离和时间间隔的增大而衰减,加入了时空衰减性矩阵,提高了补全精度。本发明的方法不仅大幅提高低缺失率车流量数据的补全精度,而且能够在数据缺失率较高的情况下达到很好的补全效果。
附图说明
图1是本发明涉及的补全模型结构图。
图2是数据缺失率为20%的缺失率补全结果与真实值的对比图。
图3是数据缺失率为50%的缺失率补全结果与真实值的对比图。
图4是数据缺失率为80%的缺失率补全结果与真实值的对比图。
具体实施方法
下面将结合具体实施例和附图对本发明的技术方案进行进一步的说明。
一种基于时空注意力机制的交通缺失数据补全方法,步骤如下:
第一步,将车流量数据预处理
(1)时间粒度划分:将所有车流量数据按5分钟的时间粒度处理为每5分钟的车流量数据;
(2)对数据进行标准化:采用最小值最大值对车流量数据进行标准化,公式如下:
Figure BDA0003034248280000101
其中,x表示原始值,xmin表示原始值的最小值,xmax表示原始值的最大值,max为归一化的上限值,min为归一化的下限值,[min,max]表示归一化后的区间,x*为标准化后的结果。
第二步,将预处理后的数据进行数据点丢失处理,采用随机数的方法,分别按20%、50%和80%的数据缺失率处理数据,将随机数对应的数据点设置为数据缺失点,保存缺失点对应的车流量数据真实值用来验证数据补全模型最终的补全效果。
同时,结合缺失点的位置信息构建时空相关性衰减矩阵。当序列数据中存在缺失值时,利用其它存在观测值的点的信息来对当前缺失点补全时,由于不同观测点和当前点之间时间间隔和空间距离的增大,其它观测点的信息对当前缺失点的补全产生的作用会随之衰减,这会影响最终的补全精度。通过构建时空相关性衰减矩阵来捕获相关性的衰减。
第三步、模型的输入由周期性输入和临近性输入组成:
临近性输入序列包括正向临近性输入序列和反向临近性输入序列。正向临近性输入序列定义为:
Figure BDA0003034248280000102
其中LF表示模型需要的正向临近性输入数据时间观测窗口的长度,
Figure BDA0003034248280000103
表示t时刻,长度为LF的时间序列车流量观测值。
反向临近性输入序列定义为:
Figure BDA0003034248280000104
其中LB表示模型需要的反向临近性输入数据时间观测窗口的长度,
Figure BDA0003034248280000105
表示t时刻,长度为LB的时间序列车流量观测值。
周期性输入序列包括正向周期性输入序列和反向周期性输入序列。正向周期性输入序列定义为:
Figure BDA0003034248280000111
其中LF表示模型需要的正向周期性输入数据时间观测窗口的长度,n表示模型输入所需要的周期数,ft,j表示在t时刻的周期数据集合内第j个周期的观测值。
反向周期性输入序列定义为:
Figure BDA0003034248280000112
其中LB表示模型需要的正向周期性输入数据时间观测窗口的长度,n表示模型输入所需要的周期数,ft,j表示在t时刻的周期数据集合内第j个周期的观测值。
第四步、结合第三步获得的补全模型的输入,构建数据补全模型。整个数据补全模型包括基于空间注意力机制的编码器模块、基于时间注意力机制的解码器模块、和基于时间卷积网络的周期性特征提取模块,各个模块的结构及训练机制如下:
(1)基于空间注意力机制的编码器模块:是由全连接网络和双向长短期记忆网络组合成的模型,通过全连接网络对输入序列进行特征提取和映射,降低输入序列的维度。然后使用双向长短期记忆网络对序列进行编码,编码的同时,利用空间注意力机制捕获其它路段对目标路段的影响。
基于空间注意力机制的编码器模块的实现细节:首先将正向临近性输入FFS和反向临近性输入FBS通过全连接网络进行映射,然后将降维后的向量输入Bi-LSTM网络中,通过空间注意力机制给不同的路段分配权重系数,然后输入Bi-LSTM单元中,在更新参数时,加入空间维度衰减性矩阵,获取编码器的输出。
(2)基于时间注意力机制的解码器模块:由多层长短期记忆网络组合,将编码器的输出作为输入,通过解码过程获取最终的缺失数据补全值。
基于时间注意力机制的解码器模块实现细节:将编码器模块的输出作为输入,通过时间注意力机制捕获不同时间点和目标时间点的相关性程度并分配权重系数,同时,加入时间维度衰减性矩阵,获取解码器的输出。
(3)基于时间卷积网络的周期性特征提取模块:由多层时间卷积网络构成的模块。通过对周期性数据特征的提取,获取历史数据中、同一个传感器、同一个时间段车流量的变化规律,然后将提取到的特征输出。实现细节:首先将正向周期性输入FFL和反向周期性输入FBL通过全连接网络进行映射,将输出的两个映射向量进行拼接,然后用基于无因果卷积的时间卷积网络对周期性特征进行提取。
第五步、对第二步处理后的数据集进行划分,按6:2:2的比例划分为训练集、验证集和测试集。在训练集上对模型进行训练获取最优的参数,在验证集上对当前参数组合下模型的效果进行验证,最后在测试集上测试模型最终的补全效果。使用训练集数据对模型进行预训练,提前优化基于时空注意力机制的数据补全模型的参数,避免在整体训练时将参数优化到局部最优点。
第六步、在第五步获得的带有初始化参数的模型上,使用训练集和验证集数据对第四步构建的数据补全模型进行整体性训练,获取模型最优的参数组合(在训练时,设置最大迭代次数为1000,学习率为0.001):
将第三步获得的输入数据分别输入到相应的模块中,同时对所有模块进行整体性训练。通过每次训练后的补全值和车流量数据的真实值计算损失函数值,将模型的参数训练到目标值。根据模型在训练集、验证集上的效果,不断调试模型的超参数,在减小过拟合的条件下提高补全精度。在使用验证集时,将模型的学习率设置为0,防止数据泄露的发生。训练过程中,计算每次迭代所得到的车流量数据补全值和第二步中保存的车流量数据真值的MAE(均方误差),使用Adam方法最小化MAE。
Figure BDA0003034248280000121
其中,x′j表示第j个缺失点的车流量数据真实值,xj表示第j个缺失点的车流量数据补全值,n表示总的缺失点个数。
第七步、使用测试集利用第六步训练好的模型进行车流量数据补全。
图2是数据缺失率为20%的补全结果与真实值的对比图,模型补全结果与车流量真实值的均方误差MAE是19.88。
图3是数据缺失率为50%的补全结果与真实值的对比图,模型补全结果与车流量真实值的均方误差MAE是20.87。
图4是数据缺失率为80%的补全结果与真实值的对比图,模型补全结果与车流量真实值的均方误差MAE是25.82。
以上所述实施例仅表达本发明的实施方式,但并不能因此而理解为对本发明专利的范围的限制,应当指出,对于本领域的技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些均属于本发明的保护范围。

Claims (4)

1.一种基于时空注意力机制的交通缺失数据补全方法,其特征在于,包括以下步骤:
第一步、对原始数据进行预处理
获取所有车流量数据作为原始数据,对原始数据进行预处理,将数据按k分钟的时间间隔做聚合操作,同时去除异常值并进行数据的标准化处理;
第二步、根据数据的不同缺失模式处理数据
对第一步预处理后的数据进行数据点丢失处理,构建带有缺失点的数据集,记录缺失点所在的位置信息,同时保存缺失点对应的车流量数据真实值,作为验证值,用来验证数据补全模型的补全效果;
同时,结合缺失点所在的位置信息构建时空相关性衰减矩阵;当数据中存在缺失值时,利用其它存在观测值的点的信息来对当前缺失点补全时,通过构建时空相关性衰减矩阵来捕获相关性的衰减,其中时空相关性衰减矩阵包括时间维度影响衰减性矩阵、空间维度影响衰减性矩阵;
时间维度影响衰减性矩阵定义如下:
Figure FDA0003034248270000011
其中,
Figure FDA0003034248270000012
表示第i个路段,t时刻的观测点和它时间上距离最近且存在观测值的点之间的时间间隔;Tt表示t时刻观测点在整个时间序列中的时刻信息;
空间维度影响衰减性矩阵定义如下:
Figure FDA0003034248270000013
其中,
Figure FDA0003034248270000014
表示第i个路段,t时刻的观测点和它空间上距离最近且存在观测值的点之间的空间距离,Li表示第i个路段在整个路网中所在的位置信息;
Figure FDA0003034248270000015
的定义如下:
Figure FDA0003034248270000021
第三步、定义补全模型的输入,其输入由周期性输入和临近性输入组成:
所述临近性输入序列包括正向临近性输入序列和反向临近性输入序列:
正向临近性输入序列定义为:
Figure FDA0003034248270000022
其中,LF表示模型需要的正向临近性输入数据时间观测窗口的长度;
Figure FDA0003034248270000023
表示t时刻,长度为LF的时间序列车流量观测值;
反向临近性输入序列定义为:
Figure FDA0003034248270000024
其中,LB表示模型需要的反向临近性输入数据时间观测窗口的长度;
Figure FDA0003034248270000025
表示t时刻,长度为LB的时间序列车流量观测值;
所述周期性输入序列包括正向周期性输入序列和反向周期性输入序列;
正向周期性输入序列定义为:
Figure FDA0003034248270000026
其中,LF表示模型需要的正向周期性输入数据时间观测窗口的长度;n表示模型输入所需要的周期数;ft,j表示在t时刻的周期数据集合内第j个周期的观测值;
反向周期性输入序列定义为:
Figure FDA0003034248270000027
其中,LB表示模型需要的正向周期性输入数据时间观测窗口的长度;n表示模型输入所需要的周期数;ft,j表示在t时刻的周期数据集合内第j个周期的观测值;
第四步、构建数据补全模型;
结合第三步补全模型的输入,构建数据全模型;整个数据补全模型包括基于空间注意力机制的编码器模块、基于时间注意力机制的解码器模块、和基于时间卷积网络的周期性特征提取模块,各个模块的结构及训练机制如下:
(1)基于空间注意力机制的编码器模块:是由全连接网络和双向长短期记忆网络组合成的模型,通过全连接网络对输入序列进行特征提取和映射,降低输入序列的维度;使用双向长短期记忆网络对序列进行编码,编码的同时,利用空间注意力机制捕获其它路段对目标路段的影响;
基于空间注意力机制的编码器模块的实现过程:首先将正向临近性输入FFS和反向临近性输入FBS通过全连接网络进行映射,然后将降维后的向量输入Bi-LSTM网络中,通过空间注意力机制给不同的路段分配权重系数,最后输入Bi-LSTM单元中,在更新Bi-LSTM单元的隐藏层输出时,同时加入第二步得到的空间维度影响衰减性矩阵,获取编码器的输出;
(2)基于时间注意力机制的解码器模块:由多层长短期记忆网络组合,将编码器的输出作为输入,通过解码过程获取最终的缺失数据补全值;
基于时间注意力机制的解码器模块的实现过程:将编码器模块的输出作为输入,通过时间注意力机制捕获不同时间点和目标时间点的相关性程度并分配权重系数,然后输入LSTM单元中,在更新LSTM单元的隐藏层输出时,同时加入第二步得到的时间维度影响衰减性矩阵,获取解码器的输出;
(3)基于时间卷积网络的周期性特征提取模块:由多层时间卷积网络构成的模块;通过对周期性数据特征的提取,获取历史数据中、同一个传感器、同一个时间段车流量的变化规律,然后将提取到的特征输出;
基于时间卷积网络的周期性特征提取模块的实现过程:首先将正向周期性输入FFL和反向周期性输入FBL通过全连接网络进行映射,将输出的两个映射向量进行拼接,用基于无因果卷积的时间卷积网络对周期性特征进行提取;
第五步、将第二步处理后的数据集划分为训练集、验证集和测试集;在训练集上对模型进行训练获取最优参数,在验证集上对当前最优参数组合下模型的效果进行验证,在测试集上测试模型最终的补全效果;使用训练集数据对数据补全模型进行预训练,对模型的参数进行初始化;
第六步、在第五步获得的带有初始化参数的模型上,使用训练集和验证集数据对第四步构建的数据补全模型同时进行整体性训练,获取数据补全模型最优的参数组合:
将预处理后的数据分别输入到数据补全模型相应的模块中,同时对所有模块进行整体性训练;计算每次训练后的补全值和车流量数据的真值的损失函数值,将模型的参数训练到目标值;根据模型在训练集、验证集上的效果,不断调试模型的超参数,在减小过拟合的条件下提高补全精度;在使用验证集时,将数据补全模型的学习率设置为0,防止数据泄露的发生;
所述的输入数据包括:正向临近性输入
Figure FDA0003034248270000041
表示t时刻前t1个时间间隔的车流量数据;反向临近性输入
Figure FDA0003034248270000042
表示t时刻后t1个时间间隔的车流量数据;正向周期性输入
Figure FDA0003034248270000043
表示t时刻前t2天内所有同一时刻的车流量数据;反向周期性输入
Figure FDA0003034248270000044
表示t时刻后t2天内所有同一时刻的车流量数据;时间维度影响衰减性矩阵
Figure FDA0003034248270000045
空间维度影响衰减性矩阵
Figure FDA0003034248270000046
缺失点位置信息矩阵
Figure FDA0003034248270000047
经过一次迭代后,得到的是经过一次补全操作之后的车流量数据;将这次迭代后的数据作为下一次迭代的输入;
第七步、使用测试集利用第六步训练好的数据补全模型进行车流量数据补全;具体如下:
输入数据为:正向临近性输入
Figure FDA0003034248270000048
反向临近性输入
Figure FDA0003034248270000049
正向周期性输入
Figure FDA00030342482700000410
反向周期性输入
Figure FDA00030342482700000411
时间维度影响衰减性矩阵
Figure FDA00030342482700000412
空间维度影响衰减性矩阵
Figure FDA00030342482700000413
缺失点位置信息矩阵
Figure FDA00030342482700000414
通过第六步的数据补全模型得到缺失的车流量数据的补全值,和第二步进行丢失处理后得到的验证值进行对比,验证模型的补全效果。
2.根据权利要求1所述的一种基于时空注意力机制的交通缺失数据补全方法,其特征在于,所述第一步中,预处理的具体过程为:
(1)时间粒度划分:将所有车流量数据按k分钟的时间粒度处理为每k分钟的车流量数据;
(2)对数据进行标准化:采用最小值和最大值对车流量数据进行标准化,公式如下:
Figure FDA0003034248270000051
其中,x表示原始值,xmin表示原始值的最小值,xmax表示原始值的最大值,max为归一化的上限值,min为归一化的下限值,[min,max]表示归一化后的区间,x*为标准化后的结果。
3.根据权利要求1所述的一种基于时空注意力机制的交通缺失数据补全方法,其特征在于,所述第四步中,基于时空注意力机制的编码器模块、解码器模块的计算过程如下:
在基于空间注意力机制的编码器模块中,使用注意力机制提取不同路段数据之间的空间相关性,公式如下:
Zt=ReLU(WeZS+be)
Figure FDA0003034248270000052
Figure FDA0003034248270000053
其中,ReLU是选用的激活函数,We,Wl,Ul,bl模型训练过程中不断更新的参数,“.;.”表示张量拼接操作;βt表示最终获得的包含空间关联性信息的权重系数;
然后加入空间维度影响衰减性矩阵来捕获空间距离对空间相关性的影响,公式如下:
Figure FDA0003034248270000054
Figure FDA0003034248270000055
其中,
Figure FDA0003034248270000056
表示t时刻的空间相关性衰减因子,ht-1表示上一时刻的隐藏层状态;
在基于时间注意力机制的解码器模块中,通过注意力机制捕获不同时刻和当前时刻之间的时间相关性,公式如下:
Figure FDA0003034248270000061
Figure FDA0003034248270000062
其中,st-1表示LSTM单元的前一时刻的隐藏状态,ct-1表示LSTM单元前一时刻的cell状态,
Figure FDA0003034248270000063
Wd、Ud表示的是模型在训练过程中不断学习更新的参数,.;.表示向量连接操作,
Figure FDA0003034248270000064
表示的就是第i个编码器状态在对当前时刻的缺失值进行补全时的权重系数,也就是在时间维度上,其他时刻与当前时刻的时间关联性强度。
4.根据权利要求1所述的一种基于时空注意力机制的交通缺失数据补全方法,其特征在于,所述第五步中,训练集、验证集和测试集的数据划分比例为6:2:2。
CN202110438939.6A 2021-04-23 2021-04-23 一种基于时空注意力机制的交通缺失数据补全方法 Expired - Fee Related CN113094357B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110438939.6A CN113094357B (zh) 2021-04-23 2021-04-23 一种基于时空注意力机制的交通缺失数据补全方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110438939.6A CN113094357B (zh) 2021-04-23 2021-04-23 一种基于时空注意力机制的交通缺失数据补全方法

Publications (2)

Publication Number Publication Date
CN113094357A true CN113094357A (zh) 2021-07-09
CN113094357B CN113094357B (zh) 2022-05-10

Family

ID=76679563

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110438939.6A Expired - Fee Related CN113094357B (zh) 2021-04-23 2021-04-23 一种基于时空注意力机制的交通缺失数据补全方法

Country Status (1)

Country Link
CN (1) CN113094357B (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113554105A (zh) * 2021-07-28 2021-10-26 桂林电子科技大学 一种基于时空融合的物联网缺失数据补全方法
CN113806349A (zh) * 2021-11-18 2021-12-17 浙江大学 基于多视图学习的时空缺失数据补全方法、装置及介质
CN113821760A (zh) * 2021-11-23 2021-12-21 湖南工商大学 一种空气数据补全方法、装置、设备及存储介质
CN114154711A (zh) * 2021-11-30 2022-03-08 北京世纪新运交通运输科技应用研究所 交通信息推荐方法、装置、电子设备及计算机存储介质
CN114385619A (zh) * 2022-03-23 2022-04-22 山东省计算中心(国家超级计算济南中心) 一种多通道海洋观测时序标量数据缺失值预测方法及系统
CN115376309A (zh) * 2022-06-29 2022-11-22 华南理工大学 一种基于多视角时间矩阵分解的缺失交通数据修复方法
CN115796259A (zh) * 2022-11-24 2023-03-14 北京百度网讯科技有限公司 模型训练方法、数据处理方法、预测方法及装置、设备
CN116226911A (zh) * 2023-01-06 2023-06-06 中电车联信安科技有限公司 一种基于车云通信的防轨迹泄露用信息处理方法
CN116244281A (zh) * 2022-09-28 2023-06-09 北京百度网讯科技有限公司 车道交通流量数据补全及其模型训练方法、装置
CN117009750A (zh) * 2023-09-28 2023-11-07 北京宝隆泓瑞科技有限公司 一种用于机器学习的甲烷浓度数据补全方法、装置
CN117743859A (zh) * 2024-02-21 2024-03-22 北京航空航天大学 工业分析模型的训练方法、使用方法及介质
CN117955843A (zh) * 2024-03-21 2024-04-30 江西省通信产业服务有限公司 用于建筑物hvac系统的物联网数据传输方法及系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102622880A (zh) * 2012-01-09 2012-08-01 北京捷易联科技有限公司 一种交通信息数据修复方法及装置
US20150006068A1 (en) * 2013-07-01 2015-01-01 Iteris, Inc. Traffic speed estimation using temporal and spatial smoothing of gps speed data
CN110619430A (zh) * 2019-09-03 2019-12-27 大连理工大学 一种用于交通预测的时空注意力机制方法
CN110782663A (zh) * 2019-09-30 2020-02-11 电子科技大学 一种结合时空特性的路网交通流量短时预测方法
CN110837888A (zh) * 2019-11-13 2020-02-25 大连理工大学 一种基于双向循环神经网络的交通缺失数据补全方法
CN112532439A (zh) * 2020-11-24 2021-03-19 山东科技大学 一种基于注意力多组件时空跨域神经网络模型的网络流量预测方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102622880A (zh) * 2012-01-09 2012-08-01 北京捷易联科技有限公司 一种交通信息数据修复方法及装置
US20150006068A1 (en) * 2013-07-01 2015-01-01 Iteris, Inc. Traffic speed estimation using temporal and spatial smoothing of gps speed data
CN110619430A (zh) * 2019-09-03 2019-12-27 大连理工大学 一种用于交通预测的时空注意力机制方法
CN110782663A (zh) * 2019-09-30 2020-02-11 电子科技大学 一种结合时空特性的路网交通流量短时预测方法
CN110837888A (zh) * 2019-11-13 2020-02-25 大连理工大学 一种基于双向循环神经网络的交通缺失数据补全方法
CN112532439A (zh) * 2020-11-24 2021-03-19 山东科技大学 一种基于注意力多组件时空跨域神经网络模型的网络流量预测方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
CHE Z等: "Recurrent neural networks for multivariate time series with missing values", 《SCIENTIFIC REPORTS》 *
LI L等: "Missing value imputation for traffic-related time series data based on a multi-view learning method", 《IEEE》 *
邹晓芳: "城市快速路交通流故障数据修复方法研究", 《中国优秀硕士学位论文全文数据库 工程科技Ⅱ辑》 *

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113554105A (zh) * 2021-07-28 2021-10-26 桂林电子科技大学 一种基于时空融合的物联网缺失数据补全方法
CN113554105B (zh) * 2021-07-28 2023-04-18 桂林电子科技大学 一种基于时空融合的物联网缺失数据补全方法
CN113806349A (zh) * 2021-11-18 2021-12-17 浙江大学 基于多视图学习的时空缺失数据补全方法、装置及介质
CN113821760A (zh) * 2021-11-23 2021-12-21 湖南工商大学 一种空气数据补全方法、装置、设备及存储介质
CN114154711A (zh) * 2021-11-30 2022-03-08 北京世纪新运交通运输科技应用研究所 交通信息推荐方法、装置、电子设备及计算机存储介质
CN114385619A (zh) * 2022-03-23 2022-04-22 山东省计算中心(国家超级计算济南中心) 一种多通道海洋观测时序标量数据缺失值预测方法及系统
CN114385619B (zh) * 2022-03-23 2022-07-15 山东省计算中心(国家超级计算济南中心) 一种多通道海洋观测时序标量数据缺失值预测方法及系统
CN115376309A (zh) * 2022-06-29 2022-11-22 华南理工大学 一种基于多视角时间矩阵分解的缺失交通数据修复方法
CN115376309B (zh) * 2022-06-29 2024-04-26 华南理工大学 一种基于多视角时间矩阵分解的缺失交通数据修复方法
CN116244281A (zh) * 2022-09-28 2023-06-09 北京百度网讯科技有限公司 车道交通流量数据补全及其模型训练方法、装置
CN116244281B (zh) * 2022-09-28 2023-11-21 北京百度网讯科技有限公司 车道交通流量数据补全及其模型训练方法、装置
CN115796259B (zh) * 2022-11-24 2024-03-08 北京百度网讯科技有限公司 模型训练方法、数据处理方法、预测方法及装置、设备
CN115796259A (zh) * 2022-11-24 2023-03-14 北京百度网讯科技有限公司 模型训练方法、数据处理方法、预测方法及装置、设备
CN116226911A (zh) * 2023-01-06 2023-06-06 中电车联信安科技有限公司 一种基于车云通信的防轨迹泄露用信息处理方法
CN116226911B (zh) * 2023-01-06 2023-10-27 中电车联信安科技有限公司 一种基于车云通信的防轨迹泄漏用信息处理方法
CN117009750A (zh) * 2023-09-28 2023-11-07 北京宝隆泓瑞科技有限公司 一种用于机器学习的甲烷浓度数据补全方法、装置
CN117009750B (zh) * 2023-09-28 2024-01-02 北京宝隆泓瑞科技有限公司 一种用于机器学习的甲烷浓度数据补全方法、装置
CN117743859A (zh) * 2024-02-21 2024-03-22 北京航空航天大学 工业分析模型的训练方法、使用方法及介质
CN117743859B (zh) * 2024-02-21 2024-10-29 北京航空航天大学 工业分析模型的训练方法、使用方法及介质
CN117955843A (zh) * 2024-03-21 2024-04-30 江西省通信产业服务有限公司 用于建筑物hvac系统的物联网数据传输方法及系统

Also Published As

Publication number Publication date
CN113094357B (zh) 2022-05-10

Similar Documents

Publication Publication Date Title
CN113094357B (zh) 一种基于时空注意力机制的交通缺失数据补全方法
CN111899510B (zh) 基于发散卷积和gat的智能交通系统流量短期预测方法及系统
Liu et al. Accurate prediction scheme of water quality in smart mariculture with deep Bi-S-SRU learning network
CN109255505B (zh) 一种多模型融合神经网络的短期负荷预测方法
CN113905391B (zh) 集成学习网络流量预测方法、系统、设备、终端、介质
Liu et al. Time series prediction based on temporal convolutional network
CN111310672A (zh) 基于时序多模型融合建模的视频情感识别方法、装置及介质
CN111612243A (zh) 交通速度预测方法、系统及存储介质
CN110837888A (zh) 一种基于双向循环神经网络的交通缺失数据补全方法
CN109146156B (zh) 一种用于预测充电桩系统充电量的方法
CN111191559B (zh) 基于时间卷积神经网络的架空线预警系统障碍物识别方法
CN114595874B (zh) 一种基于动态神经网络的超短期电力负荷预测方法
CN104268594A (zh) 一种视频异常事件检测方法及装置
CN110570035B (zh) 同时建模时空依赖性和每日流量相关性的人流量预测系统
CN112949828A (zh) 一种基于图学习的图卷积神经网络交通预测方法及系统
CN107704924B (zh) 同步自适应时空特征表达学习模型的构建方法及相关方法
CN116976512B (zh) 基于图神经网络的无人机集群航迹预测方法
CN114912666A (zh) 一种基于ceemdan算法和注意力机制的短时客流量预测方法
CN111047078A (zh) 交通特征预测方法、系统及存储介质
CN114120637A (zh) 一种基于连续监测器的智慧高速交通流量预测方法
CN116844041A (zh) 一种基于双向卷积时间自注意力机制的耕地提取方法
CN115376103A (zh) 一种基于时空图注意力网络的行人轨迹预测方法
CN116052254A (zh) 基于扩展卡尔曼滤波神经网络的视觉连续情感识别方法
CN117665825A (zh) 一种雷达回波外推预报方法、系统及存储介质
Niu et al. ALSTM: adaptive LSTM for durative sequential data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20220510