CN115034478B - 一种基于领域自适应与知识迁移的交通流量预测方法 - Google Patents

一种基于领域自适应与知识迁移的交通流量预测方法 Download PDF

Info

Publication number
CN115034478B
CN115034478B CN202210665488.4A CN202210665488A CN115034478B CN 115034478 B CN115034478 B CN 115034478B CN 202210665488 A CN202210665488 A CN 202210665488A CN 115034478 B CN115034478 B CN 115034478B
Authority
CN
China
Prior art keywords
time
traffic flow
domain
space
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210665488.4A
Other languages
English (en)
Other versions
CN115034478A (zh
Inventor
杨燕
欧阳小草
江永全
张熠玲
周威
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southwest Jiaotong University
Original Assignee
Southwest Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southwest Jiaotong University filed Critical Southwest Jiaotong University
Priority to CN202210665488.4A priority Critical patent/CN115034478B/zh
Publication of CN115034478A publication Critical patent/CN115034478A/zh
Application granted granted Critical
Publication of CN115034478B publication Critical patent/CN115034478B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06Q50/40
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A30/00Adapting or protecting infrastructure or their operation
    • Y02A30/60Planning or developing urban green infrastructure
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Abstract

本发明公开了一种基于领域自适应与知识迁移的交通流量预测方法,属于数据挖掘技术领域。首先,提取源域与目标域的时空特征的同时学习潜在的基于时空模式的共享时空知识,在获取时空依赖性的同时挖掘时空模式帮助提升目标域的预测性能。其次,构建了一种知识注意力模块从共享时空知识中抽取可迁移的时空信息,从而获取每个时空特征对应的更加详尽的特征表示。最后,融合抽取的时空特征与可迁移的时空信息实现最终的交通流量预测。本发明可用于实际场景当中,它能够获取交通流量数据中的时空特性,同时该发明中的交通流量预测框架能够扩展到其他时空数据领域的预测任务中,具有良好的普适性。

Description

一种基于领域自适应与知识迁移的交通流量预测方法
技术领域
本发明属于数据挖掘技术领域,尤其涉及跨领域知识迁移的方法。
背景技术
智慧城市的建设大大提高了城市居民的生活水平,交通流量预测在智慧城市中有着举足轻重的地位。准确的交通流量预测对缓解城市交通拥堵与规划交通道路起着指导性的作用。由于其重大的实用价值,众多学者对交通流量预测进行了深入地研究。近年来,随着交通流数据量的急剧增长,深度学习被广泛地应用于智慧城市的交通流量预测任务中。特别地,循环卷积神经网络(recurrent neural network,RNN)以及它的变体模型:门控卷积网络(gate recurrent unit,GRU)和长短时记忆网络(long short-term memory,LSTM),它们在捕获时间依赖性方面表现良好。针对基于网格数据的城市交通流量预测问题,卷积神经网络(convolutional neural network,CNN)常被用于提取局部的特征去建模时空相关性。然而,城市中的数据采集传感器通常呈现出不规则的分布,构成了一种非欧几里得空间的结构,CNN很难处理非欧几里得结构数据。图卷积网络(graph convolutionalnetwork,GCN)由于它强大的处理非欧几里得结构数据的能力,大幅度地提高了交通流预测性能。GCN,CNN与RNN的组合模型在交通流量预测问题上也取得了令人瞩目的效果。虽然以往的工作取得了优异的预测效果,但是仍然存在着以下的问题:第一,基于深度学习的方法过多地依赖于训练数据的数据量,如果只有少量的训练数据,它们的预测性能将会大幅度地下降。但是在实际的应用中,我们常常面临着数据量短缺的问题,例如新的智慧城市或者一些由于数据隐私只能提供少量可用数据的城市,这使得这些基于深度学习的模型训练十分困难。第二,目前现有的基于迁移学习的交通流量预测模型大多针对基于网格数据的城市,很少考虑基于图结构的迁移学习方法。其次,不同城市之间存在的数据分布差异被忽略了,这可能导致负迁移或者迁移效果的不稳定。因此,探索基于图神经网络的能够减小数据分布差异的交通流量预测方法是十分有意义的。
1.交通流量预测
通过对现有的专利及相关技术的检索发现,现有的与交通流量预测相关的方法有:
(1)张旭,张浪文,谢巍,王耀楚,冉杰龙,孙锦晖,陈志乐.一种基于动态时空相关性的交通流预测方法[P].广东省:CN113112793A,2021-07-13.提出了一种基于动态时空相关性的交通流量预测方法。该方法通过流门控机制学习交通点位置之间的动态相似性,引入注意力转移机制处理时间转移,从而实现了区域交通流量预测。
(2)何宏,王欣峰,孙笑笑,俞东进.基于兴趣点时空残差神经网络的多方向交通流量预测方法[P].浙江省:CN114154740A,2022-03-08.提出了一种基于兴趣点时空残差神经网络模型。该模型通过加入时间信号与兴趣点信号去增强时空特征;进一步地,采用3D卷积神经网络提取时空特征;最后,通过加权方法压缩所有时空特征信息,从而实现区域交通流量预测。
目前的基于图神经网络的交通流量预测方法虽然详尽地考虑了交通流量数据中存在的时空依赖性,但是并没有考虑在数据量匮乏的情况下如何实现准确的交通流量预测。
2.迁移学习
通过对现有的专利及相关技术的检索发现,现有的与迁移学习相关的交通流量预测方法有:
(1)王森章,尹成语,缪浩.一种基于深度迁移学习的跨城市交通流量联合预测方法[P].江苏省:CN110148296A,2019-08-20.提出了一种深度知识迁移模型。该模型使用了卷积长短时网络模型ConvLSTM和条件最大平均差异的方法,将迁移学习的思想应用于城市车流预测,从而实现了基于网格数据的城市交通流量预测。
(2)宣帆,徐璀,巢国强,刘新成,周国冬.基于深度迁移融合学习的交通流量预测方法[P].江苏省:CN112862084B,2021-11-30.提出了一种基于深度迁移融合学习的交通流量预测方法。该方法同时结合了时空特征、特征变换、深度神经网络与迁移学习算法,从而实现了交通流量的预测。
但是,以上方法大多是基于网格数据的,所以这些方法并不能直接应用于基于图数据的交通流量预测任务。同时,这些方法并没有考虑源域与目标域存在的数据分布差异问题。因此,我们考虑领域差异的问题并结合图神经网络,提出了一种基于领域自适应与知识迁移的交通流量预测方法。
发明内容
本发明的目的是提供一种领域自适应的交通流量预测方法,它能有效地解决数据量不足的城市无法实现准确的交通流量预测的技术问题。
实现本发明的技术路线如下:
一种基于领域自适应与知识迁移的交通流量预测方法,包括以下步骤:
步骤1、预处理交通流量数据,包括:
1.1利用城市路网中的传感器,将城市交通流量按月或年计的数据量当作源域,将城市交通流量不足三十天的数据量作为目标域,记录一段历史时间内的交通流量情况,它们的交通流量数据量定义如下:
Figure GDA0004075720150000021
Figure GDA0004075720150000022
其中,
Figure GDA0004075720150000027
表示实数,XS是作为源域的整个城市的交通流量数据,/>
Figure GDA0004075720150000023
是源域在时刻t的交通流量数据,t表示当前时刻,NS是作为源域的整个城市交通流量传感器数量,PS是源域的交通流量数据的时间片段总数,XC是目标域的整个城市的交通流量数据,/>
Figure GDA0004075720150000024
是目标域在时刻t的交通流量数据,NC是目标域的交通流量传感器数量,PC是目标域的交通流量数据的时间片段总数,D表示交通流量数据的特征维度;
1.2针对交通流量数据中存在缺失值,先利用线性插值方法填补数据缺失值,再采用零均值标准化对填补后的数据归一化处理;
1.3构建模型输入数据:对源域和目标域的交通流量数据进行整理,P表示输入模型的历史时间步,Q表示需要预测的未来时间步,将距离当前时刻t的前P个时间步的历史数据按照时间先后进行叠加,分别形成源域的P个时间步的历史交通流量数据
Figure GDA0004075720150000025
和目标域的P个时间步的历史交通流量数据/>
Figure GDA0004075720150000026
将源域、目标域的时刻t之前的P个时间步的历史交通流量数据作为模型输入,模型输出为源域、目标域的t时刻之后的,Q个未来时间步的交通流量;
步骤2、设置最大训练次数为E=100;
步骤3、构建时空子网络:该网络用于提取时空特征与共享时空知识,利用循环递归神经网络GRU与图卷积网络GCN构建时空子网络处理时间与空间的关联性,同时学习一种自适应的共享时空知识,将时空子网络的所有模型参数表示为θf,具体过程包括:
3.1通过级联的方式将源域和目标域的历史数据作为时空子网络的输入,记为X=[XS;XC],X表示源域和目标域的交通流量数据的级联结果;首先,通过全连接层FC将原始特征映射到特征空间中;其次,为了捕获数据中的时间依赖性,将映射后的嵌入特征输入循环递归神经网络GRU,最后,采用修正线性单元ReLU作为激活函数,该过程描述为:
H(l)=ReLU(GRU(FC(X)) (3)
其中,H(l)表示时空子网络的第l层的隐藏特征表示;
3.2为了进一步挖掘数据中的空间依赖关系,采用图卷积网络GCN提取数据中的空间关联性:
H(l+1)=GCN(H(l)) (4)
其中,H(l+1)表示时空子网络的第(l+1)层输出的隐藏特征表示;
3.3为了挖掘源域、目标域中潜在的时空模式,学习一种自适应的共享时空知识,首先,随机初始化共享时空知识,将其参数化,记为
Figure GDA0004075720150000031
其中Gk表示潜在的空间模式的类别数目,dk是共享时空知识的特征维度;然后,随着时空子网络迭代训练,采用梯度下降算法更新参数化的共享时空知识K;
步骤4、构建领域判别器:为了得到领域不变的时空特征,使用领域自适应的方法来减少源域与目标域之间的数据分布差异;具体包括:
定义一个二分类领域判别器,将领域判别器的所有模型参数表示为θadv,设置源域的真实领域标签为1,目标域的真实领域标签为0;通过领域判别器预测具有输入特征的领域标签概率,根据预测得到的领域标签概率与真实领域标签计算领域自适应损失函数Ladv
Figure GDA0004075720150000032
其中,qj表示第j个样本的预测领域标签概率,dj表示第j个样本的真实领域标签,n表示样本总数;j={1,2,...,n};
步骤5、构建预测器:预测器包括知识注意力模块和全连接层,将预测器的所有模型参数表示为θg;具体过程如下:
5.1首先,对时空特征做线性变化,即:
Figure GDA0004075720150000033
其中,i表示第i个交通流量传感器,i={1,2,...,(NS+NC)},
Figure GDA0004075720150000034
表示第i个交通流量传感器在t时刻的时空特征;/>
Figure GDA0004075720150000035
dh表示隐藏特征维度;/>
Figure GDA0004075720150000036
表示第i个交通流量传感器在t时刻的特征线性变化结果,/>
Figure GDA0004075720150000037
5.2为了获取交通流量传感器所能提供的可迁移的时空信息,需要构建知识注意力模块,具体过程包括:将时空特征
Figure GDA0004075720150000041
作为查询条目去查询共享时空知识中的可迁移信息,构建注意力模块的过程表示如下:
Figure GDA0004075720150000042
Figure GDA0004075720150000043
其中,
Figure GDA0004075720150000044
表示第i个交通流量传感器在t时刻的特征值与第gk个潜在的空间模式的相似度分数,g′k表示潜在的空间模式的索引,exp(·)表示以为自然常数e为底的指数函数,/>
Figure GDA0004075720150000045
是第i个交通流量传感器在时刻t的可迁移的时空信息;
5.3将时空特征
Figure GDA0004075720150000046
与可迁移的时空信息/>
Figure GDA0004075720150000047
的组合作为最后预测模块的输入,然后采用全连接层FC输出预测结果,即:
Figure GDA0004075720150000048
其中,
Figure GDA0004075720150000049
表示第i个交通流量传感器在时刻t的预测值;
5.4根据预测结果计算源域的预测损失函数
Figure GDA00040757201500000410
和目标域的预测损失函数/>
Figure GDA00040757201500000411
Figure GDA00040757201500000412
Figure GDA00040757201500000413
其中,
Figure GDA00040757201500000414
是源域中第i个交通流量传感器在时刻t的真实值,/>
Figure GDA00040757201500000415
是源域中第i个交通流量传感器在时刻t的预测值,/>
Figure GDA00040757201500000416
是目标域中第i个交通流量传感器在时刻t的真实值,
Figure GDA00040757201500000417
是目标域中第i个交通流量传感器在时刻t的预测值,同时计算源域、目标域的损失函数
Figure GDA00040757201500000418
和/>
Figure GDA00040757201500000419
步骤6、计算最终损失函数L:
Figure GDA00040757201500000420
其中,λ为调节预测损失函数与领域自适应损失函数的超参数,λ∈(0,1);
步骤7、利用梯度下降的方法更新时空子网络的模型参数θf、领域判别器的模型参数θadv、预测器的模型参数θg,具体过程可以表示为:
Figure GDA00040757201500000421
Figure GDA00040757201500000422
Figure GDA00040757201500000423
其中,
Figure GDA00040757201500000424
表示偏微分操作,μ表示梯度下降算法的学习率;
步骤8、重复以上步骤3、4、5、6、7,直到训练次数等于E,最终输出训练好的基于领域自适应与知识迁移的交通流量预测模型。
与现有技术相比,本发明的优点和效果:
(1)该发明针对特点城市数据量少而无法实现准确的交通流量预测问题,提出了一种基于领域自适应的模型,该模型能够同时获取时空数据中的时空特性,预测误差小,准确程度较高。(2)该发明提出的共享时空知识能够有效捕获潜在的时空知识,实现潜在时空模型在不同城市之间的知识迁移。(3)该发明提出的框架,能够扩展到其他相关的城市时空数据领域,解决类似问题,具有普适性。
附图说明
图1为本发明框架结构图,
图2为本发明中知识注意力模块结构图,
图3为本发明中模型输入值、预测值、真实值关联示意图。
具体实施方式
以下结合附图实施对本发明作进一步详细描述。
一、基于领域适应与知识迁移的交通流量预测模型框架:
本发明的整体框架结构如图1所示,即基于领域适应与知识迁移的交通流量预测模型。它主要分为三个部分:(i)时空子网络,该网络用于提取交通流量中的时空特征以及学习共享时空知识。(ii)领域判别器,该模块通过对源域与目标域生成的时空特征进行分类以约束时空子网络提取领域不变的时空特征,减小源域与目标域之间的特征分布差异。(iii)预测器,该模块主要包括两个部分:知识注意力模块与全连接层。知识注意力模块用于挖掘共享时空知识中可迁移的时空信息用于目标域的预测中。全连接层将提取的隐藏表示进行线性映射,得到最终的目标域的预测结果。
二、知识注意力模块:
如图2所示,知识注意力模块的具体过程如下:首先,输入第i个交通流量传感器在时刻t的时空特征
Figure GDA0004075720150000051
同时输入第gk个潜在时空模式的共享时空知识/>
Figure GDA0004075720150000052
时空特征通过全连接层进行线性变化得到时空特征嵌入/>
Figure GDA0004075720150000053
接下来,/>
Figure GDA0004075720150000054
与/>
Figure GDA0004075720150000055
相乘,再经过尺度变换,最后,通过归一化指数函数SoftMax,得到注意力分数/>
Figure GDA0004075720150000056
将分数与时空知识相乘获得最终的可迁移的时空信息/>
Figure GDA0004075720150000057
三、模型输入值、预测值、真实值:
如图3所示,模型输入包括源域输入和目标域输入,模型预测结果包括源域预测值与目标域预测值,真实值包括源域真实值与目标域真实值。
实施例
一种基于领域自适应与知识迁移的交通流量预测方法,包括以下步骤:
步骤1、预处理交通流量数据,包括:
1.1利用城市路网中的传感器,将城市交通流量按月或年计的数据量当作源域,将城市交通流量不足三十天的数据量作为目标域,记录一段历史时间内的交通流量情况,它们的交通流量数据量定义如下:
Figure GDA0004075720150000058
Figure GDA0004075720150000059
其中,
Figure GDA00040757201500000510
表示实数,XS是作为源域的整个城市的交通流量数据,/>
Figure GDA00040757201500000511
是源域在时刻t的交通流量数据,t表示当前时刻,NS是作为源域的整个城市交通流量传感器数量,PS是源域的交通流量数据的时间片段总数,XC是目标域的整个城市的交通流量数据,/>
Figure GDA0004075720150000061
是目标域在时刻t的交通流量数据,NC是目标域的交通流量传感器数量,PC是目标域的交通流量数据的时间片段总数,D表示交通流量数据的特征维度;
1.2针对交通流量数据中存在缺失值,先利用线性插值方法填补数据缺失值,再采用零均值标准化对填补后的数据归一化处理;
1.3构建模型输入数据:对源域和目标域的交通流量数据进行整理,P表示输入模型的历史时间步,Q表示需要预测的未来时间步,将距离当前时刻t的前P个时间步的历史数据按照时间先后进行叠加,分别形成源域的P个时间步的历史交通流量数据
Figure GDA0004075720150000062
和目标域的P个时间步的历史交通流量数据/>
Figure GDA0004075720150000063
将源域、目标域的时刻t之前的P个时间步的历史交通流量数据作为模型输入,模型输出为源域、目标域的t时刻之后的,Q个未来时间步的交通流量;
步骤2、设置最大训练次数为E=100;
步骤3、构建时空子网络:该网络用于提取时空特征与共享时空知识,利用循环递归神经网络GRU与图卷积网络GCN构建时空子网络处理时间与空间的关联性,同时学习一种自适应的共享时空知识,将时空子网络的所有模型参数表示为θf,具体过程包括:
3.1通过级联的方式将源域和目标域的历史数据作为时空子网络的输入,记为X=[XS;XC],X表示源域和目标域的交通流量数据的级联结果;首先,通过全连接层FC将原始特征映射到特征空间中;其次,为了捕获数据中的时间依赖性,将映射后的嵌入特征输入循环递归神经网络GRU,最后,采用修正线性单元ReLU作为激活函数,该过程描述为:
H(l)=ReLU(GRU(FC(X)) (3)
其中,H(l)表示时空子网络的第l层的隐藏特征表示;
3.2为了进一步挖掘数据中的空间依赖关系,采用图卷积网络GCN提取数据中的空间关联性:
H(l+1)=GCN(H(l)) (4)
其中,H(l+1)表示时空子网络的第(l+1)层输出的隐藏特征表示;
3.3为了挖掘源域、目标域中潜在的时空模式,学习一种自适应的共享时空知识,首先,随机初始化共享时空知识,将其参数化,记为
Figure GDA0004075720150000064
其中Gk表示潜在的空间模式的类别数目,dk是共享时空知识的特征维度;然后,随着时空子网络迭代训练,采用梯度下降算法更新参数化的共享时空知识K;
步骤4、构建领域判别器:为了得到领域不变的时空特征,使用领域自适应的方法来减少源域与目标域之间的数据分布差异;具体包括:
定义一个二分类领域判别器,将领域判别器的所有模型参数表示为θadv,设置源域的真实领域标签为1,目标域的真实领域标签为0;通过领域判别器预测具有输入特征的领域标签概率,根据预测得到的领域标签概率与真实领域标签计算领域自适应损失函数Ladv
Figure GDA0004075720150000071
其中,qj表示第j个样本的预测领域标签概率,dj表示第j个样本的真实领域标签,n表示样本总数;j={1,2,...,n};
步骤5、构建预测器:预测器包括知识注意力模块和全连接层,将预测器的所有模型参数表示为θg;具体过程如下:
5.1首先,对时空特征做线性变化,即:
Figure GDA0004075720150000072
其中,i表示第i个交通流量传感器,i={1,2,...,(NS+NC)},
Figure GDA0004075720150000073
表示第i个交通流量传感器在t时刻的时空特征;/>
Figure GDA0004075720150000074
dh表示隐藏特征维度;/>
Figure GDA0004075720150000075
表示第i个交通流量传感器在t时刻的特征线性变化结果,/>
Figure GDA0004075720150000076
5.2为了获取交通流量传感器所能提供的可迁移的时空信息,需要构建知识注意力模块,具体过程包括:将时空特征
Figure GDA0004075720150000077
作为查询条目去查询共享时空知识中的可迁移信息,构建注意力模块的过程表示如下:
Figure GDA0004075720150000078
Figure GDA0004075720150000079
其中,
Figure GDA00040757201500000710
表示第i个交通流量传感器在t时刻的特征值与第gk个潜在的空间模式的相似度分数,g′k表示潜在的空间模式的索引,exp(·)表示以为自然常数e为底的指数函数,/>
Figure GDA00040757201500000711
是第i个交通流量传感器在时刻t的可迁移的时空信息;
5.3将时空特征
Figure GDA00040757201500000712
与可迁移的时空信息/>
Figure GDA00040757201500000713
的组合作为最后预测模块的输入,然后采用全连接层FC输出预测结果,即:
Figure GDA00040757201500000714
其中,
Figure GDA00040757201500000715
表示第i个交通流量传感器在时刻t的预测值;
5.4根据预测结果计算源域的预测损失函数
Figure GDA00040757201500000716
和目标域的预测损失函数/>
Figure GDA00040757201500000717
Figure GDA00040757201500000718
Figure GDA00040757201500000719
其中,
Figure GDA00040757201500000720
是源域中第i个交通流量传感器在时刻t的真实值,/>
Figure GDA00040757201500000721
是源域中第i个交通流量传感器在时刻t的预测值,/>
Figure GDA00040757201500000722
是目标域中第i个交通流量传感器在时刻t的真实值,
Figure GDA00040757201500000723
是目标域中第i个交通流量传感器在时刻t的预测值,同时计算源域、目标域的损失函数
Figure GDA00040757201500000724
和/>
Figure GDA00040757201500000725
步骤6、计算最终损失函数L:
Figure GDA00040757201500000726
其中,λ为调节预测损失函数与领域自适应损失函数的超参数,λ∈(0,1);
步骤7、利用梯度下降的方法更新时空子网络的模型参数θf、领域判别器的模型参数θadv、预测器的模型参数θg,具体过程可以表示为:
Figure GDA0004075720150000081
Figure GDA0004075720150000082
Figure GDA0004075720150000083
其中,
Figure GDA0004075720150000084
表示偏微分操作,μ表示梯度下降算法的学习率;
步骤8、重复以上步骤3、4、5、6、7,直到训练次数等于E,最终输出训练好的基于领域自适应与知识迁移的交通流量预测模型。
对本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。

Claims (1)

1.一种基于领域自适应与知识迁移的交通流量预测方法,包括以下步骤:
步骤1、预处理交通流量数据,包括:
1.1利用城市路网中的传感器,将城市交通流量按月或年计的数据量当作源域,将城市交通流量不足三十天的数据量作为目标域,记录一段历史时间内的交通流量情况,它们的交通流量数据量定义如下:
Figure QLYQS_1
Figure QLYQS_2
其中,
Figure QLYQS_3
表示实数,XS是作为源域的整个城市的交通流量数据,/>
Figure QLYQS_4
是源域在时刻t的交通流量数据,t表示当前时刻,NS是作为源域的整个城市交通流量传感器数量,PS是源域的交通流量数据的时间片段总数,XC是目标域的整个城市的交通流量数据,/>
Figure QLYQS_5
是目标域在时刻t的交通流量数据,NC是目标域的交通流量传感器数量,PC是目标域的交通流量数据的时间片段总数,D表示交通流量数据的特征维度;
1.2针对交通流量数据中存在缺失值,先利用线性插值方法填补数据缺失值,再采用零均值标准化对填补后的数据归一化处理;
1.3构建模型输入数据:对源域和目标域的交通流量数据进行整理,P表示输入模型的历史时间步,Q表示需要预测的未来时间步,将距离当前时刻t的前P个时间步的历史数据按照时间先后进行叠加,分别形成源域的P个时间步的历史交通流量数据
Figure QLYQS_6
和目标域的P个时间步的历史交通流量数据/>
Figure QLYQS_7
将源域、目标域的时刻t之前的P个时间步的历史交通流量数据作为模型输入,模型输出为源域、目标域的t时刻之后的,Q个未来时间步的交通流量;
步骤2、设置最大训练次数为E=100;
步骤3、构建时空子网络:该网络用于提取时空特征与共享时空知识,利用循环递归神经网络GRU与图卷积网络GCN构建时空子网络处理时间与空间的关联性,同时学习一种自适应的共享时空知识,将时空子网络的所有模型参数表示为θf,具体过程包括:
3.1通过级联的方式将源域和目标域的历史数据作为时空子网络的输入,记为X=[XS;XC],X表示源域和目标域的交通流量数据的级联结果;首先,通过全连接层FC将原始特征映射到特征空间中;其次,为了捕获数据中的时间依赖性,将映射后的嵌入特征输入循环递归神经网络GRU,最后,采用修正线性单元ReLU作为激活函数,该过程描述为:
H(l)=ReLU(GRU(FC(X))) (3)
其中,H(l)表示时空子网络的第l层的隐藏特征表示;
3.2为了进一步挖掘数据中的空间依赖关系,采用图卷积网络GCN提取数据中的空间关联性:
H(l+1)=GCN(H(l)) (4)
其中,H(l+1)表示时空子网络的第(l+1)层输出的隐藏特征表示;
3.3为了挖掘源域、目标域中潜在的时空模式,学习一种自适应的共享时空知识,首先,随机初始化共享时空知识,将其参数化,记为
Figure QLYQS_8
其中Gk表示潜在的空间模式的类别数目,dk是共享时空知识的特征维度;然后,随着时空子网络迭代训练,采用梯度下降算法更新参数化的共享时空知识K;
步骤4、构建领域判别器:为了得到领域不变的时空特征,使用领域自适应的方法来减少源域与目标域之间的数据分布差异;具体包括:
定义一个二分类领域判别器,将领域判别器的所有模型参数表示为θadv,设置源域的真实领域标签为1,目标域的真实领域标签为0;通过领域判别器预测具有输入特征的领域标签概率,根据预测得到的领域标签概率与真实领域标签计算领域自适应损失函数Ladv
Figure QLYQS_9
其中,qj表示第j个样本的预测领域标签概率,dj表示第j个样本的真实领域标签,n表示样本总数;j={1,2,...,n};
步骤5、构建预测器:预测器包括知识注意力模块和全连接层,将预测器的所有模型参数表示为θg;具体过程如下:
5.1首先,对时空特征做线性变化,即:
Figure QLYQS_10
其中,i表示第i个交通流量传感器,i={1,2,...,(NS+NC)},
Figure QLYQS_11
表示第i个交通流量传感器在t时刻的时空特征;/>
Figure QLYQS_12
dh表示隐藏特征维度;/>
Figure QLYQS_13
表示第i个交通流量传感器在t时刻的特征线性变化结果,/>
Figure QLYQS_14
5.2为了获取交通流量传感器所能提供的可迁移的时空信息,需要构建知识注意力模块,具体过程包括:将时空特征
Figure QLYQS_15
作为查询条目去查询共享时空知识中的可迁移信息,构建注意力模块的过程表示如下:
Figure QLYQS_16
Figure QLYQS_17
其中,
Figure QLYQS_18
表示第i个交通流量传感器在t时刻的特征值与第gk个潜在的空间模式的相似度分数,g′k表示潜在的空间模式的索引,exp(·)表示以为自然常数e为底的指数函数,/>
Figure QLYQS_19
是第i个交通流量传感器在时刻t的可迁移的时空信息;
5.3将时空特征
Figure QLYQS_20
与可迁移的时空信息/>
Figure QLYQS_21
的组合作为最后预测模块的输入,然后采用全连接层FC输出预测结果,即:
Figure QLYQS_22
其中,
Figure QLYQS_23
表示第i个交通流量传感器在时刻t的预测值;
5.4根据预测结果计算源域的预测损失函数
Figure QLYQS_24
和目标域的预测损失函数/>
Figure QLYQS_25
Figure QLYQS_26
Figure QLYQS_27
其中,
Figure QLYQS_28
是源域中第i个交通流量传感器在时刻t的真实值,/>
Figure QLYQS_29
是源域中第i个交通流量传感器在时刻t的预测值,/>
Figure QLYQS_30
是目标域中第i个交通流量传感器在时刻t的真实值,/>
Figure QLYQS_31
是目标域中第i个交通流量传感器在时刻t的预测值,同时计算源域、目标域的损失函数/>
Figure QLYQS_32
和/>
Figure QLYQS_33
步骤6、计算最终损失函数L:
Figure QLYQS_34
其中,λ为调节预测损失函数与领域自适应损失函数的超参数,λ∈(0,1);
步骤7、利用梯度下降的方法更新时空子网络的模型参数θf、领域判别器的模型参数θadv、预测器的模型参数θg,具体过程可以表示为:
Figure QLYQS_35
Figure QLYQS_36
Figure QLYQS_37
其中,
Figure QLYQS_38
表示偏微分操作,μ表示梯度下降算法的学习率;
步骤8、重复以上步骤3、4、5、6、7,直到训练次数等于E,最终输出训练好的基于领域自适应与知识迁移的交通流量预测模型。
CN202210665488.4A 2022-06-14 2022-06-14 一种基于领域自适应与知识迁移的交通流量预测方法 Active CN115034478B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210665488.4A CN115034478B (zh) 2022-06-14 2022-06-14 一种基于领域自适应与知识迁移的交通流量预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210665488.4A CN115034478B (zh) 2022-06-14 2022-06-14 一种基于领域自适应与知识迁移的交通流量预测方法

Publications (2)

Publication Number Publication Date
CN115034478A CN115034478A (zh) 2022-09-09
CN115034478B true CN115034478B (zh) 2023-06-23

Family

ID=83124472

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210665488.4A Active CN115034478B (zh) 2022-06-14 2022-06-14 一种基于领域自适应与知识迁移的交通流量预测方法

Country Status (1)

Country Link
CN (1) CN115034478B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116959258A (zh) * 2023-08-22 2023-10-27 重庆邮电大学 一种基于时空图迁移学习的交通流预测方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011209818A (ja) * 2010-03-29 2011-10-20 Denso It Laboratory Inc 交通量予測装置、交通量予測方法およびプログラム
CN110148296A (zh) * 2019-04-16 2019-08-20 南京航空航天大学 一种基于深度迁移学习的跨城市交通流量联合预测方法
CN112801404A (zh) * 2021-02-14 2021-05-14 北京工业大学 一种基于自适应空间自注意力图卷积的交通预测方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1021190A (ja) * 1996-07-02 1998-01-23 Nippon Telegr & Teleph Corp <Ntt> エージェント通信方法と装置
JP5070574B2 (ja) * 2008-06-30 2012-11-14 学校法人早稲田大学 局所交通量予測プログラム生成装置、局所交通量予測装置、局所交通量予測プログラム生成方法、局所交通量予測方法及びプログラム
CN113128783A (zh) * 2021-05-06 2021-07-16 大连理工大学 一种基于图迁移学习的交通预测方法
CN113887704A (zh) * 2021-09-29 2022-01-04 南方科技大学 交通信息预测方法、装置、设备及存储介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011209818A (ja) * 2010-03-29 2011-10-20 Denso It Laboratory Inc 交通量予測装置、交通量予測方法およびプログラム
CN110148296A (zh) * 2019-04-16 2019-08-20 南京航空航天大学 一种基于深度迁移学习的跨城市交通流量联合预测方法
CN112801404A (zh) * 2021-02-14 2021-05-14 北京工业大学 一种基于自适应空间自注意力图卷积的交通预测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Reasoning Traffic Pattern Knowledge Graph in Predicting Real-Time Traffic Congestion Propagation;Qingyuan Ji et al.;《IFAC-PapersOnLine》;第53卷(第5期);第 578-581 页 *
基于交通参数预测的城市快速路交通状态判别研究;张源;《中国优秀硕士学位论文全 文数据库 工程科技Ⅱ辑》(第1期);第 1-103 页 *

Also Published As

Publication number Publication date
CN115034478A (zh) 2022-09-09

Similar Documents

Publication Publication Date Title
Dou et al. A hybrid CEEMD-GMM scheme for enhancing the detection of traffic flow on highways
Ren et al. Mtrajrec: Map-constrained trajectory recovery via seq2seq multi-task learning
CN111382676B (zh) 一种基于注意力机制的沙粒图像分类方法
CN113538910B (zh) 一种自适应的全链条城市区域网络信号控制优化方法
Yan et al. Spatial-temporal chebyshev graph neural network for traffic flow prediction in iot-based its
CN108764298B (zh) 基于单分类器的电力图像环境影响识别方法
Yan et al. Convolutional residual-attention: A deep learning approach for precipitation nowcasting
CN114944053A (zh) 一种基于时空超图神经网络的交通流预测方法
Bao et al. Spatial–temporal complex graph convolution network for traffic flow prediction
CN111723660A (zh) 一种用于长形地面目标检测网络的检测方法
CN115034478B (zh) 一种基于领域自适应与知识迁移的交通流量预测方法
Yu et al. 3D CNN-based accurate prediction for large-scale traffic flow
CN116108984A (zh) 基于流量-poi因果关系推理的城市流量预测方法
CN114943365A (zh) 融合多源数据的降水估测模型建立方法及降水估测方法
Lowphansirikul et al. 3D Semantic segmentation of large-scale point-clouds in urban areas using deep learning
Wang et al. A hybrid air quality index prediction model based on CNN and attention gate unit
Abdalla et al. Deep learning weather forecasting techniques: literature survey
Nie et al. An effective recognition of moving target seismic anomaly for security region based on deep bidirectional LSTM combined CNN
Tian et al. Semantic segmentation of remote sensing image based on GAN and FCN network model
CN115497006B (zh) 基于动态混合策略的城区遥感图像变化深度监测方法及系统
CN115861930A (zh) 一种基于层级差异特征聚合的人群计数网络建模方法
Li et al. Cross-modal collaborative representation and multi-level supervision for crowd counting
Wang et al. Contrastive GNN-based Traffic Anomaly Analysis Against Imbalanced Dataset in IoT-based ITS
CN115828990A (zh) 融合自适应图扩散卷积网络的时空图节点属性预测方法
ABBAS A survey of research into artificial neural networks for crime prediction

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant