CN114664090B - 基于循环神经网络的交通数据填补方法及系统 - Google Patents

基于循环神经网络的交通数据填补方法及系统 Download PDF

Info

Publication number
CN114664090B
CN114664090B CN202210390324.5A CN202210390324A CN114664090B CN 114664090 B CN114664090 B CN 114664090B CN 202210390324 A CN202210390324 A CN 202210390324A CN 114664090 B CN114664090 B CN 114664090B
Authority
CN
China
Prior art keywords
data
traffic flow
flow data
neural network
representing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210390324.5A
Other languages
English (en)
Other versions
CN114664090A (zh
Inventor
朱文兴
吉中昶
马晓龙
苏士斌
冯远宏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong University
Original Assignee
Shandong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong University filed Critical Shandong University
Priority to CN202210390324.5A priority Critical patent/CN114664090B/zh
Publication of CN114664090A publication Critical patent/CN114664090A/zh
Application granted granted Critical
Publication of CN114664090B publication Critical patent/CN114664090B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0125Traffic data processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明属于数据处理技术领域,提供了基于循环神经网络的交通数据填补方法及系统,包括获取交通流数据;判断交通流数据是否存在缺失,若存在缺失,基于当前交通流数据xt和时间维度的循环神经网络,引入修正系数对循环神经网络的隐藏层变量和当前交通流数据进行修正处理,得到预填补交通流数据;提取预填补交通流数据特征变量,基于预填补交通流数据特征变量和特征维度的循环神经网络,捕捉预填补交通流数据特征变量之间的相关性,利用全连接层将修正后的隐藏变量转换到数据空间,得到填补后的交通流数据。

Description

基于循环神经网络的交通数据填补方法及系统
技术领域
本发明属于数据处理技术领域,尤其涉及基于循环神经网络的交通数据填补方法及系统。
背景技术
本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先技术。
在大数据时代,数据的持久化与挖掘一直是人们研究的重点。在交通领域,多家公司提出智慧城市、智慧交通、城市计算、数字孪生等概念,均在探索智能交通系统的下一步发展。当下的交通系统,每天都会产生海量的交通数据。由于各种各样的现实原因,如干扰交通检测设备的建筑活动,交通检测设备(包括感应线圈的硬件或域控制器)失灵,交通管理系统连接不畅,天气与网络环境较差等原因,均会对数据的获取造成较大影响,导致交通数据缺失现象的产生,对智能交通系统带来巨大挑战。
当前主要存在以下不足:
1、对于统计学习方法通常需要一个没有缺失值的观测数据集来建立概率分布,但在实际应用中可能无法满足这一要求;
2、对于基于张量数据的填补方法,如矩阵或张量分解方法在面对越来越多的数据,需要昂贵的计算成本,硬件开销较大。
发明内容
为了解决上述背景技术中存在的至少一项技术问题,本发明提供基于循环神经网络的交通数据填补方法及系统,其利用改进的循环神经网络捕捉交通数据变化模式,感知数据的缺失信息,泛化处理多元数据时序上与数据间的动态影响,对所缺失数据进行填补。
为了实现上述目的,本发明采用如下技术方案:
本发明的第一个方面提供基于循环神经网络的交通数据填补方法,包括如下步骤:
获取交通流数据;
判断交通流数据是否存在缺失,若存在缺失,基于当前交通流数据和时间维度的循环神经网络,引入修正系数对循环神经网络的隐藏层变量和当前交通流数据进行修正处理,得到预填补交通流数据;
提取预填补交通流数据特征变量,基于预填补交通流数据特征变量和特征维度的循环神经网络,捕捉预填补交通流数据特征变量之间的相关性,利用全连接层将修正后的隐藏变量转换到数据空间,得到填补后的交通流数据。
本发明的第二个方面提供基于循环神经网络的交通数据填补系统,包括:
交通流数据获取模块,被配置为:获取交通流数据;
交通流数据时间插补模块,被配置为:判断交通流数据是否存在缺失,若存在缺失,基于当前交通流数据和时间维度的循环神经网络,引入修正系数对循环神经网络的隐藏层变量和当前交通流数据进行修正处理,得到预填补交通流数据;
交通流数据特征插补模块,被配置为:提取预填补交通流数据特征变量,基于预填补交通流数据特征变量和特征维度的循环神经网络,捕捉预填补交通流数据特征变量之间的相关性,利用全连接层将修正后的隐藏变量转换到数据空间,得到填补后的交通流数据。
本发明的第三个方面提供一种计算机可读存储介质。
一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述所述的基于循环神经网络的交通数据填补方法中的步骤。
本发明的第四个方面提供一种计算机设备。
一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述所述的基于循环神经网络的交通数据填补方法中的步骤。
与现有技术相比,本发明的有益效果是:
本发明通过挖掘在时间和空间两个维的内在联系,通过两种循环神经网络,分别使用针对使用基于时间维度改进的T-RNN和基于特征维度改进的F-RNN分别进行动态填补,感知数据的缺失信息,泛化处理多元数据时序上与数据间的动态影响,对所缺失数据进行填补。
本发明附加方面的优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
构成本发明的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。
图1是基于循环神经网络的交通数据填补方法的整体流程示意图;
图2是基于时间维度改进的T-RNN计算逻辑图;
图3(a)-图3(b)是和本发明的方法和其他方法比较的平均绝对误差(Mean Abso lute Error,MAE)图像和平均平方误差(Mean Square Error,MSE)图像。
具体实施方式
下面结合附图与实施例对本发明作进一步说明。
应该指出,以下详细说明都是例示性的,旨在对本发明提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本发明的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
术语解释
循环神经网络(Recurrent Neura l Network,RNN)是一类以序列数据为输入,在序列的演进方向进行递归且所有节点循环单元按链式连接的递归神经网络。
实施例一
正如背景技术所提及的智能交通系统中,路网的运行状态的感知与判断主要通过交通流数据,因此交通数据的完整性与有效性至关重要。
不可抗的现实因素,如天气状况、网络通信故障、数据持久化系统问题等,会对交通数据的采集处理与保存等造成破坏,很多下游方法与分析在实践的时候,需要完整的数据,因此数据的填补至关重要。
本发明分别使用针对使用基于时间维度改进的T-RNN和基于特征维度改进的F-RNN分别进行动态填补,输入交通流数据,用于表征是否缺失的掩膜矩阵与时间间隔矩阵,得到最终的估计值。
如图1所示,本实施例提供基于循环神经网络的交通数据填补方法,包括如下步骤:
步骤101:获取交通流数据xt
步骤102:判断交通流数据是否存在缺失,若存在缺失,基于当前交通流数据xt和时间维度的循环神经网络T-RNN,引入修正系数对循环神经网络的隐藏层变量和当前交通流数据进行修正处理,得到预填补交通流数据;
步骤103:提取预填补交通流数据特征变量,基于预填补交通流数据特征变量和特征维度的循环神经网络F-RNN,捕捉预填补交通流数据特征变量之间的相关性,利用全连接层将修正后的隐藏变量转换到数据空间,得到填补后的交通流数据。
在循环神经网络中设置回归模块将隐藏变量转换成最终输出,在这里使用的是一个全连接层,输出是对下一时刻值的估计。
如图2所示,作为一种或多种实施例,步骤102中,所述引入修正系数对循环神经网络的隐藏层变量和当前交通流数据进行修正处理,得到预填补交通流数据,具体包括:
(1)经过前向传播和后向传播,基于t-1时刻的隐藏变量得到t时刻的前向传播和后向传播的估计值
Figure BDA0003596657810000051
和/>
Figure BDA0003596657810000052
以t时间前向传播为例,t-1时刻的RNN网络的隐藏层变量经过输出层得到t时刻隐藏变量的估计值
Figure BDA0003596657810000053
Figure BDA0003596657810000054
式中,Wx表示将隐变量转换为估计值的权重矩阵,
Figure BDA0003596657810000055
表示RNN网络上一个时间步的隐变量,bx表示将隐变量转换为估计值的偏差。
(2)引入衰退修正系数λt分别对前向传播和后向传播的隐藏层变量估计值
Figure BDA0003596657810000061
和/>
Figure BDA0003596657810000062
进行衰退修正得到前向传播和后向传播的t时刻预填补交通数据;
以t时刻前向传播为例,衰退修正公式为:
Figure BDA0003596657810000063
式中,
Figure BDA0003596657810000064
表示前向计算过程中的衰退系数λt,mt表示掩膜向量,用来表示数据缺失情况。
(3)基于前向传播和后向传播的t时刻预填补交通数据对循环神经网络的隐藏层变量进行更新,得到前向传播和后向传播t时刻网络的隐藏变量;
以t时刻前向传播为例,t时刻RNN网络隐藏变量的计算公式为:
Figure BDA0003596657810000065
Figure BDA0003596657810000066
表示前向计算中上一个时间步的RNN网络隐藏变量ht-1,/>
Figure BDA0003596657810000067
表示前向计算中的衰退变量ρt;Uh表示RNN网络中计算当前时间步隐藏变量时转换输入数据的权重矩阵,bh表示RNN网络中计算当前时间步隐藏变量转换输入数据的偏差,g为激活函数Re l u,其定义为当输入值大于0时,输出值不变,当输入值小于0时,输出值为0。
(4)根据前向传播和后向传播的t时刻预填补交通数据得到缺失值预填补后的序列
Figure BDA0003596657810000068
基于前向隐藏变量的估计值和后向隐藏变量的估计值得到隐藏变量的估计值/>
Figure BDA0003596657810000069
Figure BDA00035966578100000610
Figure BDA00035966578100000611
Figure BDA00035966578100000612
上述方案的优点在于,传统的RNN网络中,RNN网络的隐藏层变量与输入数据xt是直接输入到下一时刻的循环中的,而当有数据缺失的时候,则需要对隐藏层变量、输入数据进行修正处理,因此引入修正系数λt对估计值
Figure BDA0003596657810000071
进行衰退修正与ρt对上一个时间步的隐藏变量ht-1进行衰退修正。
其中,
Figure BDA0003596657810000072
代表前向传播时,模型中的各个变量,/>
Figure BDA0003596657810000073
代表后向传播时,模型中的各个变量。
作为一种或多种实施例,步骤103中,所述基于预填补交通流数据特征变量和特征维度的循环神经网络F-RNN,捕捉预填补交通流数据特征变量之间的相关性,包括:
(1)多元时间序列的一个重要特点在于,不同特征之间内部也存在联系。
基于不同特征在同一时刻相互并无关联这一假设,估计值
Figure BDA0003596657810000074
只考虑了历史因素。
而这种假设并不适用于交通数据,一般来说,相邻道路之间的交通数据是非常相似的,因此考虑利用数据间的相邻信息。
将预填补交通流数据重新改写为:
Figure BDA0003596657810000075
与时间维度的操作类似,将某一特征组成的向量输入到时间特征维度RNN中,进行跨时间的数据插补工作。
(2)与时间间隔矩阵D类似,设矩阵E来表示特征内部与上一观察到的值间隔大小,其中元素
Figure BDA0003596657810000076
定义如下。
Figure BDA0003596657810000077
式中,i表示交通流数据中的第i个特征变量。
上述过程中得到了基于时间依赖得到的交通流数据
Figure BDA0003596657810000081
F-RNN利用交通流数据特征间的依赖关系进行进一步估计。
(3)基于F-RNN的上一隐藏变量分别计算前向传播第i个特征的估计值
Figure BDA0003596657810000082
和后向传播第i个特征的估计值/>
Figure BDA0003596657810000083
以前向计算为例,基于F-RNN的上一隐藏变量计算第i个特征的估计值
Figure BDA0003596657810000084
公式如下:
Figure BDA0003596657810000085
式中,
Figure BDA0003596657810000086
是第i-1个隐层变量,bi表示计算估计值时的偏置向量,Wy表示对应的权重矩阵。
(4)引入对估计值的进行衰退修正的系数υi与对隐藏变量进行修正的系数ωi,对估计值
Figure BDA0003596657810000087
与填补后的最终数据/>
Figure BDA0003596657810000088
进行更新与RNN网络的隐藏变量进行更新;
引入衰退修正的系数υi对估计值
Figure BDA0003596657810000089
与填补后的最终数据/>
Figure BDA00035966578100000810
进行更新,包括:
以前向计算为例,更新机制为:
Figure BDA00035966578100000811
式中,
Figure BDA00035966578100000812
表示填补后最终的交通流数据,/>
Figure BDA00035966578100000813
表示前向计算中上一模块输出的交通流数据,mi表示i个特征的缺失状况,/>
Figure BDA00035966578100000814
表示前向计算中的模型输出估计值的修正因子;/>
Figure BDA00035966578100000815
表示第i个特征的估计值。
引入隐藏变量进行修正的系数对RNN网络的隐藏变量进行更新,包括:
Figure BDA00035966578100000816
式中,
Figure BDA00035966578100000817
表示当前时间步隐藏变量,/>
Figure BDA00035966578100000818
表示RNN网络的上一时间步的隐藏变量,Ws表示/>
Figure BDA00035966578100000819
前向到当前时间步隐藏变量/>
Figure BDA00035966578100000820
计算的权重矩阵,/>
Figure BDA00035966578100000821
表示前向计算中的隐藏变量的修正因子,US表示将当前时间步输入转换到当前时间步隐藏变量/>
Figure BDA0003596657810000091
的权重矩阵,bs表示将当前时间步输入转换到当前时间步隐藏变量/>
Figure BDA0003596657810000092
的权重矩阵。
其中,
Figure BDA0003596657810000093
其中的/>
Figure BDA0003596657810000094
表示间隔长度,Wω与Wυ表示权重矩阵,bω与bυ表示偏置系数,e表示自然常数。
(5)在经过两个方向的循环计算后,分别输出前向估计值
Figure BDA0003596657810000095
与后向估计值/>
Figure BDA0003596657810000096
最终估计值为两者的平均值,即:
Figure BDA0003596657810000097
通过利用观察到的值的偏差来训练模型,损失函数如下:
Figure BDA0003596657810000098
上述技术方案的优点在于,由于交通流数据在实际中受到多种因素的影响,在时间和空间两个维度均有很强的内在联系,分别使用针对使用基于时间维度改进的T-RNN和基于特征维度改进的F-RNN分别进行动态填补,感知数据的缺失信息,泛化处理多元数据时序上与数据间的动态影响,对所缺失数据进行填补。
如图3(a)所示为本发明方法于其他方法比较的平均绝对误差(Mean Abso l uteError,MAE)图像;
设xi为交通流数据,
Figure BDA0003596657810000099
为填补数据,N为缺失值个数,则MAE的定义为:
Figure BDA00035966578100000910
如图3(b)所示为其他方法比较的平均平方误差(Mean Square Error,MSE)图像,设xi为交通流数据,
Figure BDA00035966578100000911
为填补数据,N为缺失值个数,则MSE的定义为:
Figure BDA0003596657810000101
方法1日平均值法(Dai l y Average,DA)用同一条路的观测数据(在不同的日子里)的平均值来填充缺失的值方法2KNN通过K个最近邻的加权平均值对缺失值进行填补。方法3链式方程的多重插补(M I CE,Mu l t i p l e Imputat i on by Chai ned Equat ions)通过一系列迭代的预测模型来“填充”(插补)数据集中的缺失数据。方法4迭代SVD算法通过迭代低秩SVD分解完成矩阵。算法TFRNN为本文所提出算法。
根据得到的实验结果,与其他以下方法比较,证明本发明提出的交通流数据填补方法符合取得较好效果。
上述技术方案的优点在于,由于交通流数据在实际中受到多种因素的影响,在时间和空间两个维度均有很强的内在联系,分别使用针对使用基于时间维度改进的T-RNN和基于特征维度改进的F-RNN分别进行动态填补,感知数据的缺失信息,泛化处理多元数据时序上与数据间的动态影响,对所缺失数据进行填补。
实施例二
本实施例提供基于循环神经网络的交通数据填补系统,包括:
交通流数据获取模块,被配置为:获取交通流数据;
交通流数据时间插补模块,被配置为:判断交通流数据是否存在缺失,若存在缺失,基于当前交通流数据和时间维度的循环神经网络,引入修正系数对循环神经网络的隐藏层变量和当前交通流数据进行修正处理,得到预填补交通流数据;
交通流数据特征插补模块,被配置为:提取预填补交通流数据特征变量,基于预填补交通流数据特征变量和特征维度的循环神经网络,捕捉预填补交通流数据特征变量之间的相关性,利用全连接层将修正后的隐藏变量转换到数据空间,得到填补后的交通流数据。
实施例三
本实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述所述的基于循环神经网络的交通数据填补方法中的步骤。
实施例四
本实施例提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述所述的基于循环神经网络的交通数据填补方法中的步骤。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-On l y Memory,ROM)或随机存储记忆体(RandomAccessMemory,RAM)等。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.基于循环神经网络的交通数据填补方法,其特征在于,包括如下步骤:
获取交通流数据;
判断交通流数据是否存在缺失,若存在缺失,基于当前交通流数据和时间维度的循环神经网络,引入修正系数对循环神经网络的隐藏层变量和当前交通流数据进行修正处理,得到预填补交通流数据;
所述引入修正系数对循环神经网络的隐藏层变量和当前交通流数据进行修正处理,得到预填补交通流数据,具体包括:经过前向传播和后向传播,基于t-1时刻的隐藏变量得到t时刻的前向传播和后向传播的估计值;引入衰退修正系数分别对前向传播和后向传播的隐藏层变量估计值进行衰退修正得到前向传播和后向传播的t时刻预填补交通数据;基于前向传播和后向传播的t时刻预填补交通数据对循环神经网络的隐藏层变量进行更新,得到前向传播和后向传播t时刻网络的隐藏变量;
提取预填补交通流数据特征变量,基于预填补交通流数据特征变量和特征维度的循环神经网络,捕捉预填补交通流数据特征变量之间的相关性,利用全连接层将修正后的隐藏变量转换到数据空间,得到填补后的交通流数据;
所述基于预填补交通流数据特征变量和特征维度的循环神经网络,捕捉预填补交通流数据特征变量之间的相关性,包括:基于特征维度的循环神经网络的上一隐藏变量分别计算前向传播第i个特征的估计值和后向传播第i个特征的估计值;引入衰退修正的系数分别基于前向传播和后向传播对估计值的进行与对隐藏变量进行修正的系数,对估计值与填补后的最终数据进行更新与RNN网络的隐藏变量进行更新。
2.如权利要求1所述的基于循环神经网络的交通数据填补方法,其特征在于,所述引入衰退修正系数分别对前向传播和后向传播的隐藏层变量估计值进行衰退修正,得到前向传播和后向传播的t时刻预填补交通数据中,t时刻前向传播的衰退修正的公式为:
Figure FDA0004133444780000021
式中,
Figure FDA0004133444780000022
表示前向传播t时刻预填补交通数据,xt表示最初获取的交通流数据,/>
Figure FDA0004133444780000023
表示前向传播的隐藏层变量估计值,/>
Figure FDA0004133444780000024
表示前向计算过程中的衰退系数λt,mt表示表示掩膜向量,用来表示数据缺失情况。
3.如权利要求1所述的基于循环神经网络的交通数据填补方法,其特征在于,所述基于前向传播和后向传播的t时刻预填补交通数据对循环神经网络的隐藏层变量进行更新,得到前向传播和后向传播t时刻网络的隐藏变量中,t时刻前向传播RNN网络隐藏变量的公式为:
Figure FDA0004133444780000025
Figure FDA0004133444780000026
表示前向计算中t时刻时间步的RNN网络隐藏变量ht,wx表示将隐变量转换为估计值的权重矩阵,g为激活函数Relu,/>
Figure FDA0004133444780000027
表示前向传播t时刻预填补交通数据,/>
Figure FDA0004133444780000028
表示前向计算中上一个时间步的RNN网络隐藏变量ht-1,/>
Figure FDA0004133444780000029
表示前向计算中的衰退变量ρt:Uh表示RNN网络中计算当前时间步隐藏变量时转换输入数据的权重矩阵,bh表示RNN网络中计算当前时间步隐藏变量转换输入数据的偏差。
4.如权利要求1所述的基于循环神经网络的交通数据填补方法,其特征在于,引入衰退修正的系数对估计值与填补后的最终数据进行更新,其中,前向计算更新机制公式为:
Figure FDA0004133444780000031
式中,
Figure FDA0004133444780000032
表示填补后最终的交通流数据,/>
Figure FDA0004133444780000033
表示前向计算中上一模块输出的交通流数据,mi表示i个特征的缺失状况,/>
Figure FDA0004133444780000034
表示前向计算中的模型输出估计值的修正因子;/>
Figure FDA0004133444780000035
表示第i个特征的估计值。
5.如权利要求1所述的基于循环神经网络的交通数据填补方法,其特征在于,引入隐藏变量进行修正的系数对RNN网络的隐藏变量进行更新,包括:
Figure FDA0004133444780000036
式中,
Figure FDA0004133444780000037
表示当前时间步隐藏变量,g为激活函数Relu,/>
Figure FDA0004133444780000038
表示RNN网络的上一时间步的隐藏变量,Ws表示/>
Figure FDA0004133444780000039
前向到当前时间步隐藏变量/>
Figure FDA00041334447800000310
计算的权重矩阵,/>
Figure FDA00041334447800000311
表示前向计算中的隐藏变量的修正因子,US表示将当前时间步输入转换到当前时间步隐藏变量/>
Figure FDA00041334447800000312
的权重矩阵,/>
Figure FDA00041334447800000313
表示填补后最终的交通流数据,bs表示将当前时间步输入转换到当前时间步隐藏变量/>
Figure FDA00041334447800000314
的权重矩阵。
6.基于循环神经网络的交通数据填补系统,用于实现权利要求1-5任一项权利要求所述的基于循环神经网络的交通数据填补方法,其特征在于,包括:
交通流数据获取模块,被配置为:获取交通流数据;
交通流数据时间插补模块,被配置为:判断交通流数据是否存在缺失,若存在缺失,基于当前交通流数据和时间维度的循环神经网络,引入修正系数对循环神经网络的隐藏层变量和当前交通流数据进行修正处理,得到预填补交通流数据;
交通流数据特征插补模块,被配置为:提取预填补交通流数据特征变量,基于预填补交通流数据特征变量和特征维度的循环神经网络,捕捉预填补交通流数据特征变量之间的相关性,利用全连接层将修正后的隐藏变量转换到数据空间,得到填补后的交通流数据。
7.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-5中任一项所述的基于循环神经网络的交通数据填补方法中的步骤。
8.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-5中任一项所述的基于循环神经网络的交通数据填补方法中的步骤。
CN202210390324.5A 2022-04-14 2022-04-14 基于循环神经网络的交通数据填补方法及系统 Active CN114664090B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210390324.5A CN114664090B (zh) 2022-04-14 2022-04-14 基于循环神经网络的交通数据填补方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210390324.5A CN114664090B (zh) 2022-04-14 2022-04-14 基于循环神经网络的交通数据填补方法及系统

Publications (2)

Publication Number Publication Date
CN114664090A CN114664090A (zh) 2022-06-24
CN114664090B true CN114664090B (zh) 2023-07-04

Family

ID=82034945

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210390324.5A Active CN114664090B (zh) 2022-04-14 2022-04-14 基于循环神经网络的交通数据填补方法及系统

Country Status (1)

Country Link
CN (1) CN114664090B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3035314A1 (en) * 2014-12-18 2016-06-22 Be-Mobile NV A traffic data fusion system and the related method for providing a traffic state for a network of roads
CN106156748A (zh) * 2016-07-22 2016-11-23 浙江零跑科技有限公司 基于车载双目相机的交通场景参与者识别方法
CN108615360A (zh) * 2018-05-08 2018-10-02 东南大学 基于神经网络的交通需求逐日演变预测方法
CN112242060A (zh) * 2020-10-16 2021-01-19 深圳先进技术研究院 交通流量预测方法及装置、计算机设备及可读存储介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101325004B (zh) * 2008-08-01 2011-10-05 北京航空航天大学 一种实时交通信息的数据补偿方法
CN103971520B (zh) * 2014-04-17 2015-11-18 浙江大学 一种基于时空相关性的交通流量数据恢复方法
CN111063194A (zh) * 2020-01-13 2020-04-24 兰州理工大学 一种交通流预测方法
CN111724601B (zh) * 2020-06-30 2022-03-18 西安电子科技大学 一种适用于数据缺失的机动车交通流预测方法
CN114220271B (zh) * 2021-12-21 2023-06-30 南京理工大学 基于动态时空图卷积循环网络的交通流预测方法、设备及存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3035314A1 (en) * 2014-12-18 2016-06-22 Be-Mobile NV A traffic data fusion system and the related method for providing a traffic state for a network of roads
CN106156748A (zh) * 2016-07-22 2016-11-23 浙江零跑科技有限公司 基于车载双目相机的交通场景参与者识别方法
CN108615360A (zh) * 2018-05-08 2018-10-02 东南大学 基于神经网络的交通需求逐日演变预测方法
CN112242060A (zh) * 2020-10-16 2021-01-19 深圳先进技术研究院 交通流量预测方法及装置、计算机设备及可读存储介质

Also Published As

Publication number Publication date
CN114664090A (zh) 2022-06-24

Similar Documents

Publication Publication Date Title
CN113313947B (zh) 短期交通预测图卷积网络的路况评估方法
CN109635763B (zh) 一种人群密度估计方法
CN111245673A (zh) 一种基于图神经网络的sdn时延感知方法
CN112863180A (zh) 交通速度预测方法、装置、电子设备及计算机可读介质
CN113537580B (zh) 一种基于自适应图学习的公共交通客流预测方法及系统
CN113422952B (zh) 基于时空传播层次编解码器的视频预测方法
CN113255995A (zh) 一种空气污染预测方法
Le et al. GCRINT: network traffic imputation using graph convolutional recurrent neural network
JP2020136884A (ja) 生成装置及びコンピュータプログラム
CN115862319A (zh) 一种面向时空图自编码器的交通流量预测方法
CN115080795A (zh) 一种多充电站协同负荷预测方法及装置
Sun et al. H∞ fusion estimation for uncertain discrete time-delayed Hamiltonian systems with sensor saturations: An event-triggered approach
CN113222209B (zh) 基于域适应的区域尾气迁移预测方法、系统及存储介质
CN114664090B (zh) 基于循环神经网络的交通数据填补方法及系统
CN107729885B (zh) 一种基于多重残差学习的人脸增强方法
CN111275751A (zh) 一种无监督绝对尺度计算方法及系统
CN116319426A (zh) 一种基于图神经网络的网络稀疏化测量方法及系统
CN111144572A (zh) 一种基于树形贝叶斯网络的配电网灾情推断方法及系统
CN115840261A (zh) 一种台风降水短临预测模型优化及预测方法
CN116106909A (zh) 一种雷达回波外推方法、系统及存储介质
CN114399901B (zh) 一种控制交通系统的方法和设备
CN115758643A (zh) 一种基于时空特征融合的网络流量预测方法、装置及存储介质
CN116152263A (zh) 一种基于cm-mlp网络的医学图像分割方法
CN115907000A (zh) 一种用于电力系统最优潮流预测的小样本学习方法
CN114663307A (zh) 基于不确定性网络的集成图像去噪系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant