CN115293428A - 一种基于多模态数据融合的交通预测方法及应用 - Google Patents
一种基于多模态数据融合的交通预测方法及应用 Download PDFInfo
- Publication number
- CN115293428A CN115293428A CN202210944879.XA CN202210944879A CN115293428A CN 115293428 A CN115293428 A CN 115293428A CN 202210944879 A CN202210944879 A CN 202210944879A CN 115293428 A CN115293428 A CN 115293428A
- Authority
- CN
- China
- Prior art keywords
- data
- attention
- time
- traffic
- layer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/0104—Measuring and analyzing of parameters relative to traffic conditions
- G08G1/0125—Traffic data processing
Abstract
本发明公开了一种基于多模态数据融合的交通预测方法及应用,该方法步骤包括:1、构建多模态输入数据,2、利用输入转化模块对多模态输入数据进行处理,3、利用时空信息,产生时空嵌入模块,4、利用跨模态注意力模块处理不同模态间的数据,5、利用最大池融合层将多模态的数据进行融合,6、利用时空注意力模块,进一步进行数据转化,7、利用输出线性层转化输出预测结果,8、迭代进行网络训练,得到训练后的模型。本发明能高效地结合多种模态的交通数据来实现准确的交通状态预测,从而能有效帮助城市交通管理者提前进行统筹安排,减少城市道路拥塞。
Description
技术领域
本发明属于交通预测领域,具体的说是一种基于多模态数据融合的交通预测方法及应用。
背景技术
随着城市汽车保有量的增加,城市交通拥堵现象越来越严重。利用历史交通数据预测未来一段时间的城市交通状况,有助于城市交通管理者提前采取措施减缓或避免交通拥堵的发生,也可帮助出行者制定合理的出行计划。
现有的主流相关技术都利用深度神经网络来实现交通状况预测,但是现有的主流相关技术在进行交通预测时仅使用了一种类型的交通数据,忽略了交通传感器能够同时产生多种类型交通数据的事实,未能充分利用现有丰富的交通数据来提高预测性能。
发明内容
本发明是为了解决上述现有技术存在的不足之处,提出一种基于多模态数据融合的交通预测方法,以期能高效地结合多种模态的交通数据来实现准确的交通状态预测,从而能有效帮助城市交通管理者提前进行统筹安排,减少城市道路拥塞。
本发明为达到上述发明目的,采用如下技术方案:
本发明一种基于多模态数据融合的交通预测方法的特点在于,包括如下步骤:
步骤1、构建多模态输入数据X;
步骤1.1、构建一个有向的路网图其中,是路网中所有交通传感器的集合;是各个交通传感器之间的路段集合;是邻接矩阵,所述邻接矩阵中的元素值若为1,则表示两个交通传感器之间有路段连通,元素值若为0,则表示两个交通传感器之间无路段连通;
步骤2、构建基于多模态数据融合的交通预测模型,包括:输入转化模块、时空嵌入模块、跨模态注意力模块、最大池化融合层、时空注意力模块和输出线性层;
所述输入转化模块包括:输入线性层和位置嵌入层;
所述时空嵌入模块包括:空间嵌入模块和时间嵌入模块;
所述跨模态注意力模块包括:第一跨模态注意力层、第一前馈神经网络、第二跨模态注意力层、第二前馈神经网络;
所述时空注意力模块包括:时间注意力层、第三前馈神经网络、空间注意力层、第四前馈神经网络;
步骤3、所述输入转化模块的处理;
步骤4、所述时空嵌入模块的处理;
步骤4.2、所述时间嵌入模块的处理;
步骤4.2.1、所述时间嵌入模块利用离散傅里叶变换将交通状态数据Xall转化为频域的采样信号,并对频域的采样信号进行分析,得到F条时间周期信息;
步骤4.2.2、利用独热编码对F条周期信息进行编码,得到第l个时间步的F个相对位置向量并连接后,得到第l个时间步对应的周期嵌入向量Vl;
步骤5、所述跨模态注意力模块的处理;
步骤5.1、将Z1与E(T)连接后,得到张量并输入到所述第一跨模态注意力层中,先经过以ReLU作为激活函数的全连接层的处理后,得到第h个注意力头部对应的查询、键、值三个张量分别为再利用式(1)得到所述第一跨模态注意力层输出的张量
式(1)中,||h∈H表示H个子空间依次进行拼接;d表示每个注意力头部的子空间的维度;且H×d=D;
Z3=ReLU(Z2W1+b1)W2+b2 (2)
式(2)中,W1和W2是第一前馈神经网络中可学习的权重参数;b1和b2是第一前馈神经网络中可学习的偏置参数;
步骤6、最大池化融合层的处理;
按各个模态的次序,分别取出张量Z4中一个维度的张量并进行拼接,得到一个维度在C种模态上的拼接张量,从而得到D个维度在C种模态上的拼接张量并拼接为最终的交错拼接张量后输入所述最大池化融合层中进行多模态融合,得到融合后的数据
步骤7、所述时空注意力模块的处理;
步骤7.1、将Z5和E(T′)进行连接后得到张量并输入到所述时间注意力层中,先经过以ReLU作为激活函数的全连接层的处理后,得到第h个注意力头部对应的查询、键、值三个张量分别为从而利用式(3)得到所述时间注意力层输出的张量Z6:
步骤7.3、将Z7和E(T′)进行连接后得到张量并输入到所述空间注意力层中,先经过以ReLU作为激活函数的全连接层的处理后,得到第h个注意力头部对应的查询、键、值三个张量分别为从而利用式(6)得到所述时间注意力层输出的张量Z8:
式(6)中,是注意力分数矩阵中在第a个时间步上第β个交通传感器和第γ个交通传感器之间的注意力分数,表示第h个注意力头部对应的第a个时间步上第β个交通传感器和第γ个交通传感器之间的相关性,并由式(8)得到;
步骤9、网络训练;
步骤8.2、利用反向传播和梯度下降法对所述基于多模态数据融合的交通预测模型进行训练,并计算所述损失值,当迭代轮数达到阈值ξ时或者损失值连续一定轮数不下降时,停止训练,从而得到训练后的最优模型及其最优参数Θ。
本发明一种电子设备,包括存储器以及处理器,其特点在于,所述存储器用于存储支持处理器执行所述交通预测方法的程序,所述处理器被配置为用于执行所述存储器中存储的程序。
本发明一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,其特点在于,所述计算机程序被处理器运行时执行所述交通预测方法的步骤。
与现有技术相比,本发明的有益效果在于:
1、本发明结合了多种模态的交通数据来进行交通状态预测,能够克服单一模态数据信息不足的问题,从而提高了目标模态数据的预测准确度;
2、本发明通过跨模态注意力模块实现了对不同模态数据的学习处理,并通过最大池融合来捕捉不同模态间重要的信息,从而有效地利用了多种模态的交通数据,提升了预测准确度;
3、本发明通过时空嵌入机制深度挖掘了时空信息,为注意力机制提供了更多的时空信息,从而帮助提升模型学习效率,提升预测准确度;
4、本发明通过时空注意力模块实现了对重要时空信息的学习,从而帮助生成更准确的预测结果。
附图说明
图1为本发明模型框架图;
图2为本发明的时空嵌入模块结构图;
图3为本发明的最大池化融合模块中交错拼接操作的示意图,其中每个单元中的数字表示对应的张量中该元素所属的模态序号。
具体实施方式
本实施例中,一种基于多模态数据融合的交通预测方法,包括如下步骤:
步骤1、构建多模态输入数据X;
步骤1.1、构建一个有向的路网图其中,是路网中所有交通传感器的集合;是各个交通传感器之间的路段集合;是邻接矩阵,邻接矩阵中的元素值若为1,则表示两个交通传感器之间有路段连通,元素值若为0,则表示两个交通传感器之间无路段连通;
步骤2、构建基于多模态数据融合的交通预测模型,包括:输入转化模块、时空嵌入模块、跨模态注意力模块、最大池化融合层、时空注意力模块和输出线性层;
输入转化模块包括:输入线性层和位置嵌入层;
时空嵌入模块包括:空间嵌入模块和时间嵌入模块;
跨模态注意力模块包括:第一跨模态注意力层、第一前馈神经网络、第二跨模态注意力层、第二前馈神经网络;
时空注意力模块包括:时间注意力层、第三前馈神经网络、空间注意力层、第四前馈神经网络;
步骤3、输入转化模块的处理,目的是将各个模态的输入数据分别进行处理转化,得到合适后续各个模块读取处理的数据;
步骤4、时空嵌入模块的处理,时空嵌入模块的结构如图2所示,其中包含空间嵌入模块和时间嵌入模块,用来挖掘深度的时空信息,从而为后续的注意力模块提供更多信息;
步骤4.2、时间嵌入模块的处理;
步骤4.2.1、时间嵌入模块利用离散傅里叶变换将交通状态数据Xall转化为频域的采样信号,并对频域的采样信号进行分析,得到F条时间周期信息;
步骤4.2.2、利用独热编码对F条周期信息进行编码,得到第l个时间步的F个相对位置向量并连接后,得到第l个时间步对应的周期嵌入向量Vl;举例说明,假设数据集开始于7月8日的00:00,且总共有5条时间周期信息,分别代表1周、1天、12小时、8小时和6小时这5种时间周期。接下去假设为7月10日的13:00这个时间步进行独热编码,则5个对应编码向量中的编码位分别为3(1周中的第3天)、157(1天中的第157个时间步)、2(位于24小时中的第2个12小时的循环中)、2(位于24小时中的第2个8小时的循环中)、3(位于24小时中第3个6小时的循环中),然后将这5个相对位置向量连接起来得到该时间步对应的周期嵌入向量。
步骤5、如图1中的跨模态注意力模块所示,数据通过跨模态注意力模块的处理,学习挖掘不同模态间的信息;
步骤5.1、将Z1与E(T)连接后,得到张量并输入到第一跨模态注意力层中,先经过以ReLU作为激活函数的全连接层的处理后,得到第h个注意力头部对应的查询、键、值三个张量分别为再利用式(1)对数据的模态内和模态间的特征表示进行增强,得到第一跨模态注意力层输出的张量
式(1)中,||h∈H表示H个子空间依次进行拼接;d表示每个注意力头部的子空间的维度;且H×d=D;
Z3=ReLU(Z2W1+b1)W2+b2 (2)
式(2)中,W1和W2是第一前馈神经网络中可学习的权重参数;b1和b2是第一前馈神经网络中可学习的偏置参数;
步骤6、如图1所示,数据进入最大池化融合层进行处理,将3个模态的数据经过交错拼接后进行最大池化处理,融合后获得最显著的特征表示并作为输出数据;如图3所示,按3个模态的次序,分别取出张量Z4中一个维度的张量并进行拼接,得到一个维度在3种模态上的拼接张量,从而得到D个维度在3种模态上的拼接张量并拼接为最终的交错拼接张量后输入最大池化融合层中进行多模态融合,得到融合后的数据
步骤7、如图1所示,融合后的数据Z5进入时空注意力模块进行处理,对融合后的数据Z5的特征表示进行时间和空间维度的增强;
步骤7.1、将Z5和E(T′)进行连接后得到张量并输入到图1中时间注意力层中,先经过以ReLU作为激活函数的全连接层的处理后,得到第h个注意力头部对应的查询、键、值三个张量分别为从而利用式(3)对数据的时间维度的特征表示进行增强,得到时间注意力层输出的张量Z6:
步骤7.3、将Z7和E(T′)进行连接后得到张量并输入到图1中空间注意力层中,先经过以ReLU作为激活函数的全连接层的处理后,得到第h个注意力头部对应的查询、键、值三个张量分别为从而利用式(6)对数据的空间维度的特征表示进行增强,得到时间注意力层输出的张量Z8:
式(6)中,是注意力分数矩阵中在第a个时间步上第β个交通传感器和第γ个交通传感器之间的注意力分数,表示第h个注意力头部对应的第a个时间步上第β个交通传感器和第γ个交通传感器之间的相关性,并由式(8)得到;
步骤9、网络训练,通过不断地迭代获得训练后的模型;
步骤8.2、利用反向传播和梯度下降法对基于多模态数据融合的交通预测模型进行训练,并计算损失值,当迭代轮数达到阈值ξ时或者损失值连续一定轮数不下降时,停止训练,从而得到模型的最优参数Θ和训练后的模型。
本实施例中,一种电子设备,包括存储器以及处理器,该存储器用于存储支持处理器执行交通预测方法的程序,该处理器被配置为用于执行该存储器中存储的程序。
本实施例中,一种计算机可读存储介质,是在计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时交通预测方法的步骤。
Claims (3)
1.一种基于多模态数据融合的交通预测方法,其特征在于,包括如下步骤:
步骤1、构建多模态输入数据X;
步骤1.1、构建一个有向的路网图其中,是路网中所有交通传感器的集合;ε是各个交通传感器之间的路段集合;是邻接矩阵,所述邻接矩阵中的元素值若为1,则表示两个交通传感器之间有路段连通,元素值若为0,则表示两个交通传感器之间无路段连通;
步骤2、构建基于多模态数据融合的交通预测模型,包括:输入转化模块、时空嵌入模块、跨模态注意力模块、最大池化融合层、时空注意力模块和输出线性层;
所述输入转化模块包括:输入线性层和位置嵌入层;
所述时空嵌入模块包括:空间嵌入模块和时间嵌入模块;
所述跨模态注意力模块包括:第一跨模态注意力层、第一前馈神经网络、第二跨模态注意力层、第二前馈神经网络;
所述时空注意力模块包括:时间注意力层、第三前馈神经网络、空间注意力层、第四前馈神经网络;
步骤3、所述输入转化模块的处理;
步骤4、所述时空嵌入模块的处理;
步骤4.2、所述时间嵌入模块的处理;
步骤4.2.1、所述时间嵌入模块利用离散傅里叶变换将交通状态数据Xall转化为频域的采样信号,并对频域的采样信号进行分析,得到F条时间周期信息;
步骤4.2.2、利用独热编码对F条周期信息进行编码,得到第l个时间步的F个相对位置向量并连接后,得到第l个时间步对应的周期嵌入向量Vl;
步骤5、所述跨模态注意力模块的处理;
步骤5.1、将Z1与E(T)连接后,得到张量并输入到所述第一跨模态注意力层中,先经过以ReLU作为激活函数的全连接层的处理后,得到第h个注意力头部对应的查询、键、值三个张量分别为再利用式(1)得到所述第一跨模态注意力层输出的张量
式(1)中,||h∈H表示H个子空间依次进行拼接;d表示每个注意力头部的子空间的维度;且H×d=D;
Z3=ReLU(Z2W1+b1)W2+b2 (2)
式(2)中,W1和W2是第一前馈神经网络中可学习的权重参数;b1和b2是第一前馈神经网络中可学习的偏置参数;
步骤6、最大池化融合层的处理;
按各个模态的次序,分别取出张量Z4中一个维度的张量并进行拼接,得到一个维度在C种模态上的拼接张量,从而得到D个维度在C种模态上的拼接张量并拼接为最终的交错拼接张量后输入所述最大池化融合层中进行多模态融合,得到融合后的数据
步骤7、所述时空注意力模块的处理;
步骤7.1、将Z5和E(T′)进行连接后得到张量并输入到所述时间注意力层中,先经过以ReLU作为激活函数的全连接层的处理后,得到第h个注意力头部对应的查询、键、值三个张量分别为从而利用式(3)得到所述时间注意力层输出的张量Z6:
步骤7.3、将Z7和E(T′)进行连接后得到张量并输入到所述空间注意力层中,先经过以ReLU作为激活函数的全连接层的处理后,得到第h个注意力头部对应的查询、键、值三个张量分别为从而利用式(6)得到所述时间注意力层输出的张量Z8:
式(6)中,是注意力分数矩阵中在第a个时间步上第β个交通传感器和第γ个交通传感器之间的注意力分数,表示第h个注意力头部对应的第a个时间步上第β个交通传感器和第γ个交通传感器之间的相关性,并由式(8)得到;
步骤9、网络训练;
步骤8.2、利用反向传播和梯度下降法对所述基于多模态数据融合的交通预测模型进行训练,并计算所述损失值,当迭代轮数达到阈值ξ时或者损失值连续一定轮数不下降时,停止训练,从而得到训练后的最优模型及其最优参数Θ。
2.一种电子设备,包括存储器以及处理器,其特征在于,所述存储器用于存储支持处理器执行权利要求1所述方法的程序,所述处理器被配置为用于执行所述存储器中存储的程序。
3.一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,其特征在于,所述计算机程序被处理器运行时执行权利要求1所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210944879.XA CN115293428A (zh) | 2022-08-08 | 2022-08-08 | 一种基于多模态数据融合的交通预测方法及应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210944879.XA CN115293428A (zh) | 2022-08-08 | 2022-08-08 | 一种基于多模态数据融合的交通预测方法及应用 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115293428A true CN115293428A (zh) | 2022-11-04 |
Family
ID=83827813
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210944879.XA Pending CN115293428A (zh) | 2022-08-08 | 2022-08-08 | 一种基于多模态数据融合的交通预测方法及应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115293428A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117216722A (zh) * | 2023-11-09 | 2023-12-12 | 山东农业大学 | 基于传感器时序数据多源异构数据融合系统 |
-
2022
- 2022-08-08 CN CN202210944879.XA patent/CN115293428A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117216722A (zh) * | 2023-11-09 | 2023-12-12 | 山东农业大学 | 基于传感器时序数据多源异构数据融合系统 |
CN117216722B (zh) * | 2023-11-09 | 2024-02-27 | 山东农业大学 | 基于传感器时序数据多源异构数据融合系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109767622B (zh) | 面向卡口相似性划分和循环神经网络的交通流量预测方法 | |
Liu et al. | Time series prediction based on temporal convolutional network | |
CN110619389A (zh) | 一种基于lstm-rnn的冷热电联供系统负荷预测方法及系统 | |
CN113359212B (zh) | 一种基于深度学习的储层特征预测方法及模型 | |
CN114493014A (zh) | 多元时间序列预测方法、系统及计算机产品、存储介质 | |
CN115293428A (zh) | 一种基于多模态数据融合的交通预测方法及应用 | |
CN115587454A (zh) | 基于改进Transformer模型的交通流量长时预测方法及系统 | |
CN111858565B (zh) | 一种基于线段聚类的多维度高精度航迹智能预测方法 | |
CN115862319A (zh) | 一种面向时空图自编码器的交通流量预测方法 | |
Wang et al. | DeepDNA: A hybrid convolutional and recurrent neural network for compressing human mitochondrial genomes | |
CN115641720A (zh) | 基于时空融合图神经网络的交通预测方法及系统 | |
CN114881032A (zh) | 基于多任务学习的层次类别命名实体识别模型设计方法 | |
CN117273188A (zh) | 一种具有增量学习能力的太阳能光伏发电功率预测方法 | |
CN116187496A (zh) | 一种飞机传感器时序预测方法 | |
CN115938112A (zh) | 交通需求预测方法、系统、电子设备及计算机存储介质 | |
US20220138525A1 (en) | Memory network method based on automatic addressing and recursive information integration | |
Wang et al. | MSRN-Informer: Time Series Prediction Model Based on Multi-Scale Residual Network | |
CN117172390B (zh) | 一种基于场景划分的充电量预测方法与终端 | |
CN117725597B (zh) | 一种基于时空记忆网络的漏洞威胁预测方法 | |
CN117272002B (zh) | 一种太阳辐射量估计方法、装置、电子设备及存储介质 | |
CN117636633B (zh) | 一种基于时空感知混合图的交通流量预测方法 | |
Liu | Dynamics evolution prediction from time series data with recurrent neural networks in a complex system | |
CN117787248B (zh) | 量子自注意力文本处理方法、装置、量子设备及存储介质 | |
CN117993431A (zh) | 基于时序二维变化和残差编码器的多元时间序列预测方法 | |
CN116976416A (zh) | 低比特随机配置网络轻量计算方法、系统、设备及终端 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |