CN115985102A - 一种基于迁移对比学习的城市交通流量预测方法和设备 - Google Patents

一种基于迁移对比学习的城市交通流量预测方法和设备 Download PDF

Info

Publication number
CN115985102A
CN115985102A CN202310114056.9A CN202310114056A CN115985102A CN 115985102 A CN115985102 A CN 115985102A CN 202310114056 A CN202310114056 A CN 202310114056A CN 115985102 A CN115985102 A CN 115985102A
Authority
CN
China
Prior art keywords
data
traffic flow
target
source
space
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310114056.9A
Other languages
English (en)
Inventor
肖竹
张天儒
蒋洪波
曾凡仔
刘代波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Research Institute Of Hunan University
Original Assignee
Shenzhen Research Institute Of Hunan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Research Institute Of Hunan University filed Critical Shenzhen Research Institute Of Hunan University
Priority to CN202310114056.9A priority Critical patent/CN115985102A/zh
Publication of CN115985102A publication Critical patent/CN115985102A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Traffic Control Systems (AREA)

Abstract

本发明公开了一种基于迁移对比学习的城市交通流量预测方法和设备,方法包括预测模块、源数据对比学习模块和目标数据对比学习模块;预测模块基于源城市数据和目标城市数据进行迁移学习,即首先利用编码器捕获输入数据特征,然后采用三维卷积层和MMD来进行迁移学习,最后通过注意力机制同时引入外部因素进行预测;两个对比学习模块基于增强处理前数据相对于增强处理后的正对和负对数据的相关性,尽可能提高与正对数据的相似性,减少与负对数据的相似性,实现采用对比学习自监督地学习目标数据和源数据的特征来辅助预测目标城市交通流量。本发明综合迁移学习和对比学习的优点,提高交通流量综合预测模型的泛化能力,进一步提高预测精度。

Description

一种基于迁移对比学习的城市交通流量预测方法和设备
技术领域
本发明主要涉及城市计算和智能交通领域,具体涉及一种基于迁移对比学习的城市交通流量预测方法和设备,主要研究基于两个城市的私家车运动数据进行城市功能区交通流量变化预测。
背景技术
近年来,城市的发展带来很多问题,其中一个问题就是车辆过多带来的交通问题。建模寻找城市交通流量变化规律不仅对交通管理至关重要,而且对能源消耗、城市增长、城市规划、卫生防疫等问题的研究也至关重要。
目前城市交通流预测主要采用深度学习方法,然而,基于深度学习的方法通常需要大量的训练数据。然而,在实际应用中,由于数据收集机制(如低采样率)、数据隐私问题和低城市开发水平等各种原因,时空数据可能会很稀缺。由于训练数据不足,它们的表现可能会显著下降。此外,这些模型是专门为一种特定的数据类型设计的,很难推广到处理其他类型的时空数据。
因此,提出能够解决数据稀缺问题的城市交通流预测模型是十分必要的。
发明内容
针对目前城市交通流预测存在的数据稀缺问题,本发明提供一种基于迁移对比学习的城市交通流量预测方法和设备,基于两个不同城市的私家车运动数据,将迁移学习与对比学习结合,利用迁移学习学习源域(稠密的城市交通流数据)和目标域(稀疏的城市交通流数据)之间的可转移的潜在特征来对目标域进行预测,同时分别对源域和目标域进行自监督对比学习提取特征从而辅助迁移学习进行交通流量预测。
为实现上述技术目的,本发明采用如下技术方案:
一种基于迁移对比学习的城市交通流量预测方法,包括:
步骤1,获取源城市和目标城市在预设历史时间段内的时空交通流量数据,其中源城市的时空交通流量数据的数据量稠密,目标城市的时空交通流量数据的数据量稀疏;
步骤2,将源城市和目标城市的时空交通流量数据分别作为源数据和目标数据;
步骤3,对源数据和目标数据进行增强处理,分别得到源增强数据和目标增强数据;
步骤4,使用编码器分别对源数据、目标数据、源增强数据和目标增强数据进行编码;
步骤5,将编码的源数据和目标数据输入预测模块,利用最大平均偏差MMD在二者卷积的过程中进行调节,将源数据的知识迁移到目标数据中,最后通过注意力机制并引入外部因素来进行预测输出,得到第一个损失函数;
步骤6,将编码的源数据和源增强数据输入源数据对比学习模块,对二者进行非线性变换,最大化正对相似度同时最小化负对相似度来自监督学习源数据的特征,得到第二个损失函数;
步骤7,将编码的目标数据和目标增强数据输入目标数据对比学习模块,对二者进行非线性变换,最大化正对相似度同时最小化负对相似度来自监督学习目标数据的特征,得到第三个损失函数;
步骤8,整合三个损失函数得到总损失函数,并通过总损失函数训练由编码器、预测模块和两个对比学习模块构成的整体模型;
步骤9,获取源城市和目标城市当前的时空交通流量数据,利用训练得到的编码器对其进行编码,再利用训练得到的预测模块预测目标城市未来的交通流量。
进一步地,所述时空交通流量数据,是从城市私家车的GPS和OBD数据中提取停留点数据并统计交通流量得到,具体地:
从城市私家车的GPS和OBD数据中提取停留点数据,所述停留点数据至少包括经纬度信息和时间戳;
将源城市和目标城市划分为m×n的网格地图,每个网格被定义为一个单元区域,所有的网格组成一个单元区域集R={r1,1,…,ri,j,…,rm,n},其中ri,j是指网格地图的第i行第j列的单元区域;
将一天24小时均匀划分为k个时间戳,基于停留点数据统计源城市和目标城市每个单元区域k个时间戳的车辆交通流量,将t时间戳的网格地图每个单元区域的车辆交通流量用矩阵Xt∈Rm×n表示,将当天k个时间戳的车辆交通流量数据表示为三维张量χt={Xt-k+1,…,Xt}∈Rm×n×k
设置统计天数为d天,d天的车辆交通流量序列可以表示为四维张量
Figure BDA0004077844990000021
将统计天数多的源城市的表示为四维张量的交通流量序列,记为源城市的时空交通流量数据
Figure BDA0004077844990000022
将统计天数少的目标城市的表示为四维张量的交通流量序列,记为目标城市的时空交通流量数据
Figure BDA0004077844990000023
进一步地,对源数据和目标数据进行数据增强操作的方式包括:输入输入掩蔽、短期移位操作、长期移位操作;
(1)输入掩蔽:
Figure BDA0004077844990000031
(2)短期移位操作:
Figure BDA0004077844990000032
(3)长期移位操作:
Figure BDA0004077844990000033
其中,
Figure BDA0004077844990000034
表示城市在t时间戳第i行第j列的单元区域交通流量大小,
Figure BDA0004077844990000035
表示对
Figure BDA0004077844990000036
进行增强操作后的交通量大小;V~U(0,1)是一个随机矩阵,r是一个设定的0和1范围内的随机数,λ和α均表示0和1范围内的参数。
进一步地,所述编码器由CNN和LSTM堆叠而成,CNN用于捕获时空交通流量数据的空间相关性,LSTM用于捕获时空交通流量数据的时间相关性;所述编码器对源数据
Figure BDA0004077844990000037
目标数据
Figure BDA0004077844990000038
源增强数据
Figure BDA0004077844990000039
和目标增强数据
Figure BDA00040778449900000310
编码分别表示为:
Figure BDA00040778449900000311
Figure BDA00040778449900000312
Figure BDA00040778449900000313
Figure BDA00040778449900000314
式中,CNNLSTM表示编码器,
Figure BDA00040778449900000315
分别为
Figure BDA00040778449900000316
Figure BDA00040778449900000317
经过编码器编码后的输出。
进一步地,步骤5中所述的预测模块包括两部分:卷积迁移学习部分和注意力机制预测输出部分;
首先进入卷积迁移学习部分,通过MMD调整源数据和目标数据的分布相似度来不断的让目标数据学习源数据的知识,如下:
Figure BDA00040778449900000318
Figure BDA00040778449900000319
Figure BDA00040778449900000320
式中,conv3D表示3维卷积,MMD表示最大平均偏差,φ(·)表示高斯核函数,
Figure BDA00040778449900000327
表示希尔伯特空间,
Figure BDA00040778449900000321
Figure BDA00040778449900000322
分别表示
Figure BDA00040778449900000323
Figure BDA00040778449900000324
经过卷积后的输出,
Figure BDA00040778449900000325
Figure BDA00040778449900000326
分别表示源域和目标域对应输出
Figure BDA0004077844990000041
Figure BDA0004077844990000042
中的数据样本;
然后再通过注意力机制预测输出部分,学习源数据和目标数据之间的相关性,输出目标数据与源数据之间的相关权重矩阵A,再让相关矩阵A与源数据
Figure BDA0004077844990000043
做点积,同时加入外部因素External_features和目标数据
Figure BDA00040778449900000421
辅助预测,输出目标数据未来时刻的预测值Yt和损失函数,如下:
Figure BDA0004077844990000044
Figure BDA0004077844990000045
Figure BDA0004077844990000046
Figure BDA0004077844990000047
式中,Att表示注意力机制,Fq,Fk,Fv分别表示注意力机制里的矩阵,
Figure BDA0004077844990000048
表示点积操作,
Figure BDA0004077844990000049
是中间量,Cat表示Contact操作,
Figure BDA00040778449900000410
表示预测损失函数;
Figure BDA00040778449900000411
表示目标数据未来时刻的真实值。
进一步地,步骤6中所述的源数据对比学习模块,是将源数据
Figure BDA00040778449900000412
与源增强数据
Figure BDA00040778449900000413
作为输入,首先经过一个投影将两个输入进行非线性变换,然后匹配计算非线性变换后的源数据的每一个时空交通流量矩阵和增强源数据每一个时空交通流量矩阵的相似度,得到第二损失函数为:
Figure BDA00040778449900000414
式中,zi代表源数据的某一个时空交通流量矩阵经过非线性变换后的数据,而
Figure BDA00040778449900000415
分别表示增强源数据的某两个时空交通流量矩阵经过非线性变换后的数据;
Figure BDA00040778449900000416
是zi经过增强后的时空交通流量矩阵经过非线性变换后的数据,为zi的正对;而
Figure BDA00040778449900000417
为zi的负对,
Figure BDA00040778449900000418
表示符合条件的负对集合;M表示正对集合和负对集合的并集,i表示M中某一个具体的对。
进一步地,步骤7中所述的目标数据对比学习模块,是将目标数据
Figure BDA00040778449900000419
与目标增强数据
Figure BDA00040778449900000420
作为输入,首先经过一个投影将两个输入进行非线性变换,然后匹配计算非线性变换后的目标数据的每一个时空交通流量矩阵和增强目标数据每一个时空交通流量矩阵的相似度,得到第三损失函数为:
Figure BDA0004077844990000051
式中,zi代表目标数据的某一个时空交通流量矩阵经过非线性变换后的数据,而
Figure BDA0004077844990000052
分别表示增强目标数据的某两个时空交通流量矩阵经过非线性变换后的数据;
Figure BDA0004077844990000053
是zi经过增强后的时空交通流量矩阵经过非线性变换后的数据,为zi的正对;而
Figure BDA0004077844990000054
为zi的负对,Kj表示符合条件的负对集合;K表示正对集合和负对集合的并集,i表示K中某一个具体的对。
进一步地,负对集合的符合条件为|t-ti|>tr,表示负对与待预测时空交通流量矩阵的时间戳间距要大于给定的时间抑制tr;其中ti为待预测时空交通流量矩阵的时间戳,t为符合条件的负对的时空交通流量矩阵的时间戳。
进一步地,整合三个损失函数得到的总损失函数为:
Figure BDA0004077844990000055
式中,Loss表示总损失函数,Tpre表示预测模块的损失函数,
Figure BDA0004077844990000056
Figure BDA0004077844990000057
分别表示源数据和目标数据对比学习损失函数,γ和ζ分别表示源数据和目标数据对比学习损失函数的参数值。
一种基于迁移对比学习的城市交通流量预测设备,包括存储器及处理器,所述存储器中存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器实现上述任一项所述的方法。
有益效果
本发明将私家车数据统计建模为时空交通流量数据,通过迁移学习和对比学习解决目标城市数据稀缺问题,利用迁移学习将源数据知识转移到目标数据进行预测的同时,采用对比学习自监督地学习目标数据和源数据的特征辅助预测,综合两种学习方法的优点,提高了模型的泛化能力,进一步提高预测的精确度。
附图说明
图1是本申请实施例所述预测方法的整体框架图;
图2是本申请实施例中对比学习示意图。
具体实施方式
下面对本发明的实施例作详细说明,本实施例以本发明的技术方案为依据开展,给出了详细的实施方式和具体的操作过程,对本发明的技术方案作进一步解释说明。
下面将将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚,完整地描述,基于本发明的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示为本发明基于城市时空交通流量数据进行迁移对比联合学习的交通流量预测方法的整体框架图,其包括数据编码器、预测模块、源数据对比学习模块和目标数据对比学习模块这四个模块组成。对源数据和目标数据进行增强,将增强后的数据与未增强的数据一同输入编码器,编码后将源数据与目标数据输入预测模块进行预测,将源数据与源增强数据输入源数据对比模块,将目标数据与源目标数据输入目标数据对比模块,利用预测模块与对比模块联合构造的总损失函数对编码器和预测模块不断循环优化,输出最优预测,并用于目标城市区域的交通流量数据预测。
步骤1,采集获取原始数据。
本实施例利用湖南大学开源的深圳与长沙私家车数据作为研究数据,选取深圳的南山区和长沙的岳麓区分别作为源城市和目标城市,并将稠密的南山区私家车数据作为源数据,稀疏的岳麓区私家车数据作为目标数据。
具体地,首先采集两个城市私家车在预设历史时间段内的的GPS(包括车辆匿名化ID、车辆所处经纬度、当前时刻、位置信息)和OBD数据(包括私家车开车和停车状态,速度和方向),从中提取私家车的停留点数据;提取的停留点数据至少包括经纬度信息和时间戳。然后使用数据清洗模块利用原则检测数据集中存在不合理的值,包括数据不一致,数据无效等问题并对其删除或修正,比如检测并删除开车时间间隔少于1分钟的数据、开车距离少于3米的数据。
将深圳南山区和长沙岳麓区均划分为16×16的网格地图,每个网格被定义为一个单元区域,所有的网格组成一个单元区域集R={r1,1,…,ri,j,…,r16,16},其中ri,j是指网格地图的第i行第j列的单元区域;
将一天24小时均匀划分为24个时间戳,基于停留点数据统计源城市和目标城市每个单元区域24个时间戳的车辆交通流量,将t时间戳的网格地图每个单元区域的车辆交通流量用矩阵Xt∈R16×16表示,将当天24个时间戳的车辆交通流量数据表示为三维张量
Figure BDA0004077844990000064
Figure BDA0004077844990000065
设置统计天数为d天,d天的车辆交通流量序列可以表示为四维张量
Figure BDA0004077844990000061
将统计天数多的源城市的表示为四维张量的交通流量序列,记为源城市的时空交通流量数据
Figure BDA0004077844990000062
将统计天数少的目标城市的表示为四维张量的交通流量序列,记为目标城市的时空交通流量数据
Figure BDA0004077844990000063
步骤2,明确源数据和目标数据。
步骤1获得到的源城市的时空交通流量数据
Figure BDA0004077844990000071
目标城市的时空交通流量数据
Figure BDA0004077844990000072
分别作为源数据和目标数据。其中PS的时间长度为1年,PT的时间长度为3个月。本实施例将源数据前9个月和目标数据前2个月数据用于训练,其余数据用于测试。
步骤3,数据增强。
为了对源数据和目标数据无监督学习各单元区域时空交通流量特征,引入对比学习方法,对比学习首先需要对输入数据进行数据增强操作,数据增强对输入数据进行修改并作为新输入用于对比学习提取特征。
对输入的源数据和目标数据分别进行数据增强操作,增强操作主要有三种方式:输入掩蔽、短期移位操作、长期移位操作。
(1)输入掩蔽:
Figure BDA0004077844990000073
(2)短期移位操作:
Figure BDA0004077844990000074
(3)长期移位操作:
Figure BDA0004077844990000075
其中,
Figure BDA0004077844990000076
表示t时间戳第i行第j列的单元区域交通流量大小,
Figure BDA0004077844990000077
表示对
Figure BDA0004077844990000078
进行修改后的交通量大小,V~U(0,1)是一个随机矩阵,r是一个设定的0和1范围内的随机数,λ和α均表示0和1范围内的参数。经过数据增强,得到四组输入数据,分别是源数据,目标数据,源增强数据,目标增强数据,分别表示为
Figure BDA0004077844990000079
步骤4,编码。
编码器由CNN和LSTM堆叠而成,CNN可以捕获时空交通流量数据的空间相关性,LSTM可以捕获时空交通流量数据的时间相关性,两者堆叠后能有效地捕获输入数据的时空特征,便于后续预测与对比。
Figure BDA00040778449900000710
输入编码器,如下:
Figure BDA00040778449900000711
Figure BDA00040778449900000712
Figure BDA0004077844990000081
Figure BDA0004077844990000082
经过编码器编码后,输出
Figure BDA0004077844990000083
步骤5,预测。
预测模块包括两部分:卷积迁移学习部分和注意力机制预测输出部分。
首先进入卷积迁移学习部分,通过MMD调整源数据和目标数据的分布相似度来不断的让目标数据学习源数据的知识,如下:
Figure BDA0004077844990000084
Figure BDA0004077844990000085
Figure BDA0004077844990000086
其中,conv3D表示3维卷积,MMD表示最大平均偏差,φ(·)表示高斯核函数,
Figure BDA0004077844990000087
表示希尔伯特空间,
Figure BDA0004077844990000088
Figure BDA0004077844990000089
分别表示
Figure BDA00040778449900000810
Figure BDA00040778449900000811
经过卷积后的输出,
Figure BDA00040778449900000812
Figure BDA00040778449900000813
分别表示源域和目标域的数据样本。为了学习两个域之间的可转移特征,通过将域特定层的数据表示嵌入到再现核希尔伯特空间中,显式地减少了域的差异,在该空间中,两个域分布的平均嵌入可以显式地匹配。
然后再通过注意力机制预测输出部分,学习源数据和目标数据之间的相关性,输出目标数据与源数据之间的相关权重矩阵,再让相关矩阵与源数据做点积,同时加入外部因素和目标数据辅助预测,输出目标数据未来时刻的预测值Yt和损失函数,如下:
Figure BDA00040778449900000814
Figure BDA00040778449900000815
Figure BDA00040778449900000816
Figure BDA00040778449900000817
Att表示注意力机制,
Figure BDA00040778449900000818
表示点积操作,Cat表示Contact操作,
Figure BDA00040778449900000819
表示损失函数。
Figure BDA00040778449900000820
主要考虑迁移学习率和预测准确度,可以使目标数据尽可能地学到源数据知识的同时保证准确率,提高模型泛化能力。
步骤6,源数据对比学习。
源数据对比学习模块是将源数据
Figure BDA0004077844990000091
与源增强数据
Figure BDA0004077844990000092
作为输入,首先经过一个投影(Head Project)将两个输入进行非线性变换,然后匹配计算非线性变换后的源数据的每一个时空交通量矩阵和增强源数据每一个时空交通量矩阵的相似度,如图2,zi代表源数据的某一个时空交通量矩阵经过非线性变换后的数据,对应某个时间点的Xt∈Rm×n,而
Figure BDA0004077844990000093
分别表示增强源数据的某三个时空交通量矩阵经过非线性变换后的数据,而
Figure BDA0004077844990000094
是zi经过增强后的时空交通量矩阵经过非线性变换后的数据,我们的模型目标就是让
Figure BDA0004077844990000095
(称之为正对)是zi的相似度尽可能大,让zi
Figure BDA0004077844990000096
(称之为负对)的相似度尽可能小,这样就可以自监督地学习到尽可能多的特征。
由于时空交通数据存在很强的时间依赖性,比如某一天下午3点和下午4点的时空交通图可能极为相似,这样就容易对时空交通量矩阵匹配精确度造成影响,因此我们设置了一个时间抑制tr来增大预测的准确性,|t-ti|>tr表示负对与待预测时空交通量矩阵的时间戳间距要大于tr。tr越大,表示选择的负对越少,这样准确度相应高,但模型对时间差异学习能力下降。tr越小,表示选择的负对越多,这样模型的准确度相应下降,模型对时间差异的学习能力增强。可以不断修改tr来优化模型的学习能力和泛化能力。损失函数如下:
Figure BDA0004077844990000097
其中
Figure BDA00040778449900000910
表示负对集合。
步骤7,目标数据对比学习。
目标数据对比学习模块方法与步骤6所述相同。损失函数如下:
Figure BDA0004077844990000098
其中Kj表示负对集合。
步骤8,综合优化。
整合三个损失函数得到总损失函数,并通过总损失函数训练由编码器、预测模块和两个对比学习模块构成的整体模型。总损失函数为:
Figure BDA0004077844990000099
γ和ζ表示源数据和目标数据对比学习损失函数的参数值,两者的大小表示源数据和目标数据对比学习结果在整个模型中的影响力大小,模型运行过程中不断优化使总损失函数最小。
步骤9,预测。获取源城市和目标城市当前的时空交通流量数据,利用训练得到的编码器对其进行编码,再利用训练得到的预测模块预测目标城市未来的交通流量。
上述只是本发明的较佳实施例,并非对本发明作任何形式上的限制。虽然本发明已以较佳实施例揭露如上,然而以限定本发明。任何熟悉并非用本领域的技术人员,在不脱离本发明技术方案范围的情况下,都可利用上述揭示的技术内容对本发明技术方案做出许多可能的变动和修饰,或修改为等同变化的等效实施例。因此,凡是未脱离本发明技术方案的内容,依据本发明技术实质对以上实施例所做的任何简单修改、等同变化及修饰,均应落在本发明技术方案保护的范围内。

Claims (10)

1.一种基于迁移对比学习的城市交通流量预测方法,其特征在于,包括:
步骤1,获取源城市和目标城市在预设历史时间段内的时空交通流量数据,其中源城市的时空交通流量数据的数据量稠密,目标城市的时空交通流量数据的数据量稀疏;
步骤2,将源城市和目标城市的时空交通流量数据分别作为源数据和目标数据;
步骤3,对源数据和目标数据进行增强处理,分别得到源增强数据和目标增强数据;
步骤4,使用编码器分别对源数据、目标数据、源增强数据和目标增强数据进行编码;
步骤5,将编码的源数据和目标数据输入预测模块,利用最大平均偏差MMD在二者卷积的过程中进行调节,将源数据的知识迁移到目标数据中,最后通过注意力机制并引入外部因素来进行预测输出,得到第一个损失函数;
步骤6,将编码的源数据和源增强数据输入源数据对比学习模块,对二者进行非线性变换,最大化正对相似度同时最小化负对相似度来自监督学习源数据的特征,得到第二个损失函数;
步骤7,将编码的目标数据和目标增强数据输入目标数据对比学习模块,对二者进行非线性变换,最大化正对相似度同时最小化负对相似度来自监督学习目标数据的特征,得到第三个损失函数;
步骤8,整合三个损失函数得到总损失函数,并通过总损失函数训练由编码器、预测模块和两个对比学习模块构成的整体模型;
步骤9,获取源城市和目标城市当前的时空交通流量数据,利用训练得到的编码器对其进行编码,再利用训练得到的预测模块预测目标城市未来的交通流量。
2.根据权利要求1所述的城市交通流量预测方法,其特征在于,所述时空交通流量数据,是从城市私家车的GPS和OBD数据中提取停留点数据并统计交通流量得到,具体地:
从城市私家车的GPS和OBD数据中提取停留点数据,所述停留点数据至少包括经纬度信息和时间戳;
将源城市和目标城市划分为m×n的网格地图,每个网格被定义为一个单元区域,所有的网格组成一个单元区域集R={r1,1,…,ri,j,…,rm,n},其中ri,j是指网格地图的第i行第j列的单元区域;
将一天24小时均匀划分为k个时间戳,基于停留点数据统计源城市和目标城市每个单元区域k个时间戳的车辆交通流量,将t时间戳的网格地图每个单元区域的车辆交通流量用矩阵Xt∈Rm×n表示,将当天k个时间戳的车辆交通流量数据表示为三维张量
Figure FDA0004077844980000011
设置统计天数为d天,d天的车辆交通流量序列可以表示为四维张量
Figure FDA00040778449800000218
将统计天数多的源城市的表示为四维张量的交通流量序列,记为源城市的时空交通流量数据
Figure FDA00040778449800000219
将统计天数少的目标城市的表示为四维张量的交通流量序列,记为目标城市的时空交通流量数据
Figure FDA00040778449800000220
3.根据权利要求1所述的城市交通流量预测方法,其特征在于,对源数据和目标数据进行数据增强操作的方式包括:输入输入掩蔽、短期移位操作、长期移位操作;
(1)输入掩蔽:
Figure FDA0004077844980000021
(2)短期移位操作:
Figure FDA0004077844980000022
(3)长期移位操作:
Figure FDA0004077844980000023
其中,
Figure FDA0004077844980000024
表示城市在t时间戳第i行第j列的单元区域交通流量大小,
Figure FDA0004077844980000025
表示对
Figure FDA0004077844980000026
进行增强操作后的交通量大小;V~U(0,1)是一个随机矩阵,r是一个设定的0和1范围内的随机数,λ和α均表示0和1范围内的参数。
4.根据权利要求1所述的城市交通流量预测方法,其特征在于,所述编码器由CNN和LSTM堆叠而成,CNN用于捕获时空交通流量数据的空间相关性,LSTM用于捕获时空交通流量数据的时间相关性;所述编码器对源数据
Figure FDA0004077844980000027
目标数据
Figure FDA0004077844980000028
源增强数据
Figure FDA0004077844980000029
和目标增强数据
Figure FDA00040778449800000210
编码分别表示为:
Figure FDA00040778449800000211
Figure FDA00040778449800000212
Figure FDA00040778449800000213
Figure FDA00040778449800000214
式中,CNNLSTM表示编码器,
Figure FDA00040778449800000215
分别为
Figure FDA00040778449800000216
Figure FDA00040778449800000217
经过编码器编码后的输出。
5.根据权利要求1所述的城市交通流量预测方法,其特征在于,步骤5中所述的预测模块包括两部分:卷积迁移学习部分和注意力机制预测输出部分;
首先进入卷积迁移学习部分,通过MMD调整源数据和目标数据的分布相似度来不断的让目标数据学习源数据的知识,如下:
Figure FDA0004077844980000031
Figure FDA0004077844980000032
Figure FDA0004077844980000033
式中,conv3D表示3维卷积,MMD表示最大平均偏差,φ(·)表示高斯核函数,
Figure FDA0004077844980000034
表示希尔伯特空间,
Figure FDA0004077844980000035
Figure FDA0004077844980000036
分别表示
Figure FDA0004077844980000037
Figure FDA0004077844980000038
经过卷积后的输出,
Figure FDA0004077844980000039
Figure FDA00040778449800000310
分别表示源域和目标域对应输出
Figure FDA00040778449800000311
Figure FDA00040778449800000312
中的数据样本;
然后再通过注意力机制预测输出部分,学习源数据和目标数据之间的相关性,输出目标数据与源数据之间的相关权重矩阵A,再让相关矩阵A与源数据
Figure FDA00040778449800000313
做点积,同时加入外部因素External_features和目标数据
Figure FDA00040778449800000314
辅助预测,输出目标数据未来时刻的预测值Yt和损失函数,如下:
Figure FDA00040778449800000315
Figure FDA00040778449800000316
Figure FDA00040778449800000317
Figure FDA00040778449800000318
式中,Att表示注意力机制,Fq,Fk,Fv分别表示注意力机制里的矩阵,
Figure FDA00040778449800000319
表示点积操作,
Figure FDA00040778449800000320
是中间量,Cat表示Contact操作,
Figure FDA00040778449800000321
表示预测损失函数;
Figure FDA00040778449800000322
表示目标数据未来时刻的真实值。
6.根据权利要求1所述的城市交通流量预测方法,其特征在于,步骤6中所述的源数据对比学习模块,是将源数据
Figure FDA00040778449800000323
与源增强数据
Figure FDA00040778449800000324
作为输入,首先经过一个投影将两个输入进行非线性变换,然后匹配计算非线性变换后的源数据的每一个时空交通流量矩阵和增强源数据每一个时空交通流量矩阵的相似度,得到第二损失函数为:
Figure FDA00040778449800000325
式中,zi代表源数据的某一个时空交通流量矩阵经过非线性变换后的数据,而
Figure FDA0004077844980000041
分别表示增强源数据的某两个时空交通流量矩阵经过非线性变换后的数据;
Figure FDA0004077844980000042
是zi经过增强后的时空交通流量矩阵经过非线性变换后的数据,为zi的正对;而
Figure FDA0004077844980000043
为zi的负对,
Figure FDA0004077844980000044
表示符合条件的负对集合;M表示正对集合和负对集合的并集,i表示M中某一个具体的对。
7.根据权利要求6所述的城市交通流量预测方法,其特征在于,步骤7中所述的目标数据对比学习模块,是将目标数据
Figure FDA0004077844980000045
与目标增强数据
Figure FDA0004077844980000046
作为输入,首先经过一个投影将两个输入进行非线性变换,然后匹配计算非线性变换后的目标数据的每一个时空交通流量矩阵和增强目标数据每一个时空交通流量矩阵的相似度,得到第三损失函数为:
Figure FDA0004077844980000047
式中,zi代表目标数据的某一个时空交通流量矩阵经过非线性变换后的数据,而
Figure FDA0004077844980000048
分别表示增强目标数据的某两个时空交通流量矩阵经过非线性变换后的数据;
Figure FDA0004077844980000049
是zi经过增强后的时空交通流量矩阵经过非线性变换后的数据,为zi的正对;而
Figure FDA00040778449800000410
为zi的负对,Kj表示符合条件的负对集合;K表示正对集合和负对集合的并集,i表示K中某一个具体的对。
8.根据权利要求6或7所述的城市交通流量预测方法,其特征在于,负对集合的符合条件为|t-ti|>tr,表示负对与待预测时空交通流量矩阵的时间戳间距要大于给定的时间抑制tr;其中ti为待预测时空交通流量矩阵的时间戳,t为符合条件的负对的时空交通流量矩阵的时间戳。
9.根据权利要求1所述的城市交通流量预测方法,其特征在于,整合三个损失函数得到的总损失函数为:
Figure FDA00040778449800000411
式中,Loss表示总损失函数,Tpre表示预测模块的损失函数,
Figure FDA00040778449800000412
Figure FDA00040778449800000413
分别表示源数据和目标数据对比学习损失函数,γ和
Figure FDA00040778449800000414
分别表示源数据和目标数据对比学习损失函数的参数值。
10.一种基于迁移对比学习的城市交通流量预测设备,包括存储器及处理器,所述存储器中存储有计算机程序,其特征在于,所述计算机程序被所述处理器执行时,使得所述处理器实现如权利要求1~9中任一项所述的方法。
CN202310114056.9A 2023-02-15 2023-02-15 一种基于迁移对比学习的城市交通流量预测方法和设备 Pending CN115985102A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310114056.9A CN115985102A (zh) 2023-02-15 2023-02-15 一种基于迁移对比学习的城市交通流量预测方法和设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310114056.9A CN115985102A (zh) 2023-02-15 2023-02-15 一种基于迁移对比学习的城市交通流量预测方法和设备

Publications (1)

Publication Number Publication Date
CN115985102A true CN115985102A (zh) 2023-04-18

Family

ID=85976224

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310114056.9A Pending CN115985102A (zh) 2023-02-15 2023-02-15 一种基于迁移对比学习的城市交通流量预测方法和设备

Country Status (1)

Country Link
CN (1) CN115985102A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116206453A (zh) * 2023-05-05 2023-06-02 湖南工商大学 一种基于迁移学习的交通流预测方法、装置及相关设备
CN116959258A (zh) * 2023-08-22 2023-10-27 重庆邮电大学 一种基于时空图迁移学习的交通流预测方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116206453A (zh) * 2023-05-05 2023-06-02 湖南工商大学 一种基于迁移学习的交通流预测方法、装置及相关设备
CN116206453B (zh) * 2023-05-05 2023-08-11 湖南工商大学 一种基于迁移学习的交通流预测方法、装置及相关设备
CN116959258A (zh) * 2023-08-22 2023-10-27 重庆邮电大学 一种基于时空图迁移学习的交通流预测方法

Similar Documents

Publication Publication Date Title
CN109697852B (zh) 基于时序交通事件的城市道路拥堵程度预测方法
CN111400620B (zh) 基于时空嵌入Self-Attention的用户轨迹位置预测方法
CN109166309B (zh) 一种面向复杂城市交通网络的缺失流量数据恢复方法
CN115985102A (zh) 一种基于迁移对比学习的城市交通流量预测方法和设备
CN107529651B (zh) 一种基于深度学习的城市交通客流预测方法和设备
CN112215337B (zh) 一种基于环境注意力神经网络模型的车辆轨迹预测方法
CN115240425B (zh) 一种基于多尺度时空融合图网络的交通预测方法
CN111915059B (zh) 基于注意力机制的Seq2seq泊位占有率预测方法
CN111915081B (zh) 一种基于深度学习的峰值敏感型出行需求预测方法
CN113762338B (zh) 一种基于多重图注意力机制的交通流预测方法、设备及介质
Bao et al. Spatial–temporal complex graph convolution network for traffic flow prediction
CN114692762A (zh) 一种基于图注意力交互机制的车辆轨迹预测方法
CN114495500B (zh) 一种基于对偶动态时空图卷积的交通预测方法
CN111461426A (zh) 一种基于深度学习的高精度行程时长预测方法
CN114202120A (zh) 一种针对多源异构数据的城市交通行程时间预测方法
CN112785077A (zh) 基于时空数据的出行需求预测方法及系统
CN115042798A (zh) 一种交通参与者未来轨迹预测方法及系统、存储介质
CN113068131A (zh) 一种用户移动方式和轨迹的预测方法、装置、设备及存储介质
CN112633602A (zh) 一种基于gis地图信息的交通拥堵指数预测方法及装置
CN117133129B (zh) 一种基于多分量注意力图神经网络的交通速度预测方法
Graser et al. Deep Learning From Trajectory Data: a Review of Deep Neural Networks and the Trajectory Data Representations to Train Them.
CN116778238A (zh) 一种基于轻量型结构感知Transformer网络及VHR遥感图像变化检测方法
Jin et al. Spatiotemporal graph convolutional neural networks for metro flow prediction
CN115358462A (zh) 一种关联多交叉口交通流量预测方法
CN113408786B (zh) 一种交通特征预测方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination