CN115034478B - 一种基于领域自适应与知识迁移的交通流量预测方法 - Google Patents
一种基于领域自适应与知识迁移的交通流量预测方法 Download PDFInfo
- Publication number
- CN115034478B CN115034478B CN202210665488.4A CN202210665488A CN115034478B CN 115034478 B CN115034478 B CN 115034478B CN 202210665488 A CN202210665488 A CN 202210665488A CN 115034478 B CN115034478 B CN 115034478B
- Authority
- CN
- China
- Prior art keywords
- time
- traffic flow
- domain
- space
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 61
- 230000005012 migration Effects 0.000 title claims abstract description 21
- 238000013508 migration Methods 0.000 title claims abstract description 21
- 239000004973 liquid crystal related substance Substances 0.000 claims description 30
- 230000006870 function Effects 0.000 claims description 28
- 230000008569 process Effects 0.000 claims description 20
- 238000013528 artificial neural network Methods 0.000 claims description 12
- 238000012549 training Methods 0.000 claims description 12
- 230000003044 adaptive effect Effects 0.000 claims description 9
- 230000000306 recurrent effect Effects 0.000 claims description 8
- 238000012545 processing Methods 0.000 claims description 7
- 230000007547 defect Effects 0.000 claims description 6
- 238000010606 normalization Methods 0.000 claims description 6
- 125000004122 cyclic group Chemical group 0.000 claims description 4
- 238000013507 mapping Methods 0.000 claims description 4
- 238000005096 rolling process Methods 0.000 claims description 4
- 230000004913 activation Effects 0.000 claims description 3
- 230000008859 change Effects 0.000 claims description 3
- 238000011478 gradient descent method Methods 0.000 claims description 3
- 238000007781 pre-processing Methods 0.000 claims description 3
- 238000012512 characterization method Methods 0.000 claims description 2
- 238000007418 data mining Methods 0.000 abstract description 2
- 238000013527 convolutional neural network Methods 0.000 description 7
- 238000013526 transfer learning Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 238000013135 deep learning Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000006978 adaptation Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 230000007787 long-term memory Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 239000009853 xinfeng Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G06Q50/40—
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A30/00—Adapting or protecting infrastructure or their operation
- Y02A30/60—Planning or developing urban green infrastructure
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Abstract
本发明公开了一种基于领域自适应与知识迁移的交通流量预测方法,属于数据挖掘技术领域。首先,提取源域与目标域的时空特征的同时学习潜在的基于时空模式的共享时空知识,在获取时空依赖性的同时挖掘时空模式帮助提升目标域的预测性能。其次,构建了一种知识注意力模块从共享时空知识中抽取可迁移的时空信息,从而获取每个时空特征对应的更加详尽的特征表示。最后,融合抽取的时空特征与可迁移的时空信息实现最终的交通流量预测。本发明可用于实际场景当中,它能够获取交通流量数据中的时空特性,同时该发明中的交通流量预测框架能够扩展到其他时空数据领域的预测任务中,具有良好的普适性。
Description
技术领域
本发明属于数据挖掘技术领域,尤其涉及跨领域知识迁移的方法。
背景技术
智慧城市的建设大大提高了城市居民的生活水平,交通流量预测在智慧城市中有着举足轻重的地位。准确的交通流量预测对缓解城市交通拥堵与规划交通道路起着指导性的作用。由于其重大的实用价值,众多学者对交通流量预测进行了深入地研究。近年来,随着交通流数据量的急剧增长,深度学习被广泛地应用于智慧城市的交通流量预测任务中。特别地,循环卷积神经网络(recurrent neural network,RNN)以及它的变体模型:门控卷积网络(gate recurrent unit,GRU)和长短时记忆网络(long short-term memory,LSTM),它们在捕获时间依赖性方面表现良好。针对基于网格数据的城市交通流量预测问题,卷积神经网络(convolutional neural network,CNN)常被用于提取局部的特征去建模时空相关性。然而,城市中的数据采集传感器通常呈现出不规则的分布,构成了一种非欧几里得空间的结构,CNN很难处理非欧几里得结构数据。图卷积网络(graph convolutionalnetwork,GCN)由于它强大的处理非欧几里得结构数据的能力,大幅度地提高了交通流预测性能。GCN,CNN与RNN的组合模型在交通流量预测问题上也取得了令人瞩目的效果。虽然以往的工作取得了优异的预测效果,但是仍然存在着以下的问题:第一,基于深度学习的方法过多地依赖于训练数据的数据量,如果只有少量的训练数据,它们的预测性能将会大幅度地下降。但是在实际的应用中,我们常常面临着数据量短缺的问题,例如新的智慧城市或者一些由于数据隐私只能提供少量可用数据的城市,这使得这些基于深度学习的模型训练十分困难。第二,目前现有的基于迁移学习的交通流量预测模型大多针对基于网格数据的城市,很少考虑基于图结构的迁移学习方法。其次,不同城市之间存在的数据分布差异被忽略了,这可能导致负迁移或者迁移效果的不稳定。因此,探索基于图神经网络的能够减小数据分布差异的交通流量预测方法是十分有意义的。
1.交通流量预测
通过对现有的专利及相关技术的检索发现,现有的与交通流量预测相关的方法有:
(1)张旭,张浪文,谢巍,王耀楚,冉杰龙,孙锦晖,陈志乐.一种基于动态时空相关性的交通流预测方法[P].广东省:CN113112793A,2021-07-13.提出了一种基于动态时空相关性的交通流量预测方法。该方法通过流门控机制学习交通点位置之间的动态相似性,引入注意力转移机制处理时间转移,从而实现了区域交通流量预测。
(2)何宏,王欣峰,孙笑笑,俞东进.基于兴趣点时空残差神经网络的多方向交通流量预测方法[P].浙江省:CN114154740A,2022-03-08.提出了一种基于兴趣点时空残差神经网络模型。该模型通过加入时间信号与兴趣点信号去增强时空特征;进一步地,采用3D卷积神经网络提取时空特征;最后,通过加权方法压缩所有时空特征信息,从而实现区域交通流量预测。
目前的基于图神经网络的交通流量预测方法虽然详尽地考虑了交通流量数据中存在的时空依赖性,但是并没有考虑在数据量匮乏的情况下如何实现准确的交通流量预测。
2.迁移学习
通过对现有的专利及相关技术的检索发现,现有的与迁移学习相关的交通流量预测方法有:
(1)王森章,尹成语,缪浩.一种基于深度迁移学习的跨城市交通流量联合预测方法[P].江苏省:CN110148296A,2019-08-20.提出了一种深度知识迁移模型。该模型使用了卷积长短时网络模型ConvLSTM和条件最大平均差异的方法,将迁移学习的思想应用于城市车流预测,从而实现了基于网格数据的城市交通流量预测。
(2)宣帆,徐璀,巢国强,刘新成,周国冬.基于深度迁移融合学习的交通流量预测方法[P].江苏省:CN112862084B,2021-11-30.提出了一种基于深度迁移融合学习的交通流量预测方法。该方法同时结合了时空特征、特征变换、深度神经网络与迁移学习算法,从而实现了交通流量的预测。
但是,以上方法大多是基于网格数据的,所以这些方法并不能直接应用于基于图数据的交通流量预测任务。同时,这些方法并没有考虑源域与目标域存在的数据分布差异问题。因此,我们考虑领域差异的问题并结合图神经网络,提出了一种基于领域自适应与知识迁移的交通流量预测方法。
发明内容
本发明的目的是提供一种领域自适应的交通流量预测方法,它能有效地解决数据量不足的城市无法实现准确的交通流量预测的技术问题。
实现本发明的技术路线如下:
一种基于领域自适应与知识迁移的交通流量预测方法,包括以下步骤:
步骤1、预处理交通流量数据,包括:
1.1利用城市路网中的传感器,将城市交通流量按月或年计的数据量当作源域,将城市交通流量不足三十天的数据量作为目标域,记录一段历史时间内的交通流量情况,它们的交通流量数据量定义如下:
其中,表示实数,XS是作为源域的整个城市的交通流量数据,/>是源域在时刻t的交通流量数据,t表示当前时刻,NS是作为源域的整个城市交通流量传感器数量,PS是源域的交通流量数据的时间片段总数,XC是目标域的整个城市的交通流量数据,/>是目标域在时刻t的交通流量数据,NC是目标域的交通流量传感器数量,PC是目标域的交通流量数据的时间片段总数,D表示交通流量数据的特征维度;
1.2针对交通流量数据中存在缺失值,先利用线性插值方法填补数据缺失值,再采用零均值标准化对填补后的数据归一化处理;
1.3构建模型输入数据:对源域和目标域的交通流量数据进行整理,P表示输入模型的历史时间步,Q表示需要预测的未来时间步,将距离当前时刻t的前P个时间步的历史数据按照时间先后进行叠加,分别形成源域的P个时间步的历史交通流量数据和目标域的P个时间步的历史交通流量数据/>将源域、目标域的时刻t之前的P个时间步的历史交通流量数据作为模型输入,模型输出为源域、目标域的t时刻之后的,Q个未来时间步的交通流量;
步骤2、设置最大训练次数为E=100;
步骤3、构建时空子网络:该网络用于提取时空特征与共享时空知识,利用循环递归神经网络GRU与图卷积网络GCN构建时空子网络处理时间与空间的关联性,同时学习一种自适应的共享时空知识,将时空子网络的所有模型参数表示为θf,具体过程包括:
3.1通过级联的方式将源域和目标域的历史数据作为时空子网络的输入,记为X=[XS;XC],X表示源域和目标域的交通流量数据的级联结果;首先,通过全连接层FC将原始特征映射到特征空间中;其次,为了捕获数据中的时间依赖性,将映射后的嵌入特征输入循环递归神经网络GRU,最后,采用修正线性单元ReLU作为激活函数,该过程描述为:
H(l)=ReLU(GRU(FC(X)) (3)
其中,H(l)表示时空子网络的第l层的隐藏特征表示;
3.2为了进一步挖掘数据中的空间依赖关系,采用图卷积网络GCN提取数据中的空间关联性:
H(l+1)=GCN(H(l)) (4)
其中,H(l+1)表示时空子网络的第(l+1)层输出的隐藏特征表示;
3.3为了挖掘源域、目标域中潜在的时空模式,学习一种自适应的共享时空知识,首先,随机初始化共享时空知识,将其参数化,记为其中Gk表示潜在的空间模式的类别数目,dk是共享时空知识的特征维度;然后,随着时空子网络迭代训练,采用梯度下降算法更新参数化的共享时空知识K;
步骤4、构建领域判别器:为了得到领域不变的时空特征,使用领域自适应的方法来减少源域与目标域之间的数据分布差异;具体包括:
定义一个二分类领域判别器,将领域判别器的所有模型参数表示为θadv,设置源域的真实领域标签为1,目标域的真实领域标签为0;通过领域判别器预测具有输入特征的领域标签概率,根据预测得到的领域标签概率与真实领域标签计算领域自适应损失函数Ladv:
其中,qj表示第j个样本的预测领域标签概率,dj表示第j个样本的真实领域标签,n表示样本总数;j={1,2,...,n};
步骤5、构建预测器:预测器包括知识注意力模块和全连接层,将预测器的所有模型参数表示为θg;具体过程如下:
5.1首先,对时空特征做线性变化,即:
其中,i表示第i个交通流量传感器,i={1,2,...,(NS+NC)},表示第i个交通流量传感器在t时刻的时空特征;/>dh表示隐藏特征维度;/>表示第i个交通流量传感器在t时刻的特征线性变化结果,/>
其中,表示第i个交通流量传感器在t时刻的特征值与第gk个潜在的空间模式的相似度分数,g′k表示潜在的空间模式的索引,exp(·)表示以为自然常数e为底的指数函数,/>是第i个交通流量传感器在时刻t的可迁移的时空信息;
其中,是源域中第i个交通流量传感器在时刻t的真实值,/>是源域中第i个交通流量传感器在时刻t的预测值,/>是目标域中第i个交通流量传感器在时刻t的真实值,是目标域中第i个交通流量传感器在时刻t的预测值,同时计算源域、目标域的损失函数和/>
步骤6、计算最终损失函数L:
其中,λ为调节预测损失函数与领域自适应损失函数的超参数,λ∈(0,1);
步骤7、利用梯度下降的方法更新时空子网络的模型参数θf、领域判别器的模型参数θadv、预测器的模型参数θg,具体过程可以表示为:
步骤8、重复以上步骤3、4、5、6、7,直到训练次数等于E,最终输出训练好的基于领域自适应与知识迁移的交通流量预测模型。
与现有技术相比,本发明的优点和效果:
(1)该发明针对特点城市数据量少而无法实现准确的交通流量预测问题,提出了一种基于领域自适应的模型,该模型能够同时获取时空数据中的时空特性,预测误差小,准确程度较高。(2)该发明提出的共享时空知识能够有效捕获潜在的时空知识,实现潜在时空模型在不同城市之间的知识迁移。(3)该发明提出的框架,能够扩展到其他相关的城市时空数据领域,解决类似问题,具有普适性。
附图说明
图1为本发明框架结构图,
图2为本发明中知识注意力模块结构图,
图3为本发明中模型输入值、预测值、真实值关联示意图。
具体实施方式
以下结合附图实施对本发明作进一步详细描述。
一、基于领域适应与知识迁移的交通流量预测模型框架:
本发明的整体框架结构如图1所示,即基于领域适应与知识迁移的交通流量预测模型。它主要分为三个部分:(i)时空子网络,该网络用于提取交通流量中的时空特征以及学习共享时空知识。(ii)领域判别器,该模块通过对源域与目标域生成的时空特征进行分类以约束时空子网络提取领域不变的时空特征,减小源域与目标域之间的特征分布差异。(iii)预测器,该模块主要包括两个部分:知识注意力模块与全连接层。知识注意力模块用于挖掘共享时空知识中可迁移的时空信息用于目标域的预测中。全连接层将提取的隐藏表示进行线性映射,得到最终的目标域的预测结果。
二、知识注意力模块:
如图2所示,知识注意力模块的具体过程如下:首先,输入第i个交通流量传感器在时刻t的时空特征同时输入第gk个潜在时空模式的共享时空知识/>时空特征通过全连接层进行线性变化得到时空特征嵌入/>接下来,/>与/>相乘,再经过尺度变换,最后,通过归一化指数函数SoftMax,得到注意力分数/>将分数与时空知识相乘获得最终的可迁移的时空信息/>
三、模型输入值、预测值、真实值:
如图3所示,模型输入包括源域输入和目标域输入,模型预测结果包括源域预测值与目标域预测值,真实值包括源域真实值与目标域真实值。
实施例
一种基于领域自适应与知识迁移的交通流量预测方法,包括以下步骤:
步骤1、预处理交通流量数据,包括:
1.1利用城市路网中的传感器,将城市交通流量按月或年计的数据量当作源域,将城市交通流量不足三十天的数据量作为目标域,记录一段历史时间内的交通流量情况,它们的交通流量数据量定义如下:
其中,表示实数,XS是作为源域的整个城市的交通流量数据,/>是源域在时刻t的交通流量数据,t表示当前时刻,NS是作为源域的整个城市交通流量传感器数量,PS是源域的交通流量数据的时间片段总数,XC是目标域的整个城市的交通流量数据,/>是目标域在时刻t的交通流量数据,NC是目标域的交通流量传感器数量,PC是目标域的交通流量数据的时间片段总数,D表示交通流量数据的特征维度;
1.2针对交通流量数据中存在缺失值,先利用线性插值方法填补数据缺失值,再采用零均值标准化对填补后的数据归一化处理;
1.3构建模型输入数据:对源域和目标域的交通流量数据进行整理,P表示输入模型的历史时间步,Q表示需要预测的未来时间步,将距离当前时刻t的前P个时间步的历史数据按照时间先后进行叠加,分别形成源域的P个时间步的历史交通流量数据和目标域的P个时间步的历史交通流量数据/>将源域、目标域的时刻t之前的P个时间步的历史交通流量数据作为模型输入,模型输出为源域、目标域的t时刻之后的,Q个未来时间步的交通流量;
步骤2、设置最大训练次数为E=100;
步骤3、构建时空子网络:该网络用于提取时空特征与共享时空知识,利用循环递归神经网络GRU与图卷积网络GCN构建时空子网络处理时间与空间的关联性,同时学习一种自适应的共享时空知识,将时空子网络的所有模型参数表示为θf,具体过程包括:
3.1通过级联的方式将源域和目标域的历史数据作为时空子网络的输入,记为X=[XS;XC],X表示源域和目标域的交通流量数据的级联结果;首先,通过全连接层FC将原始特征映射到特征空间中;其次,为了捕获数据中的时间依赖性,将映射后的嵌入特征输入循环递归神经网络GRU,最后,采用修正线性单元ReLU作为激活函数,该过程描述为:
H(l)=ReLU(GRU(FC(X)) (3)
其中,H(l)表示时空子网络的第l层的隐藏特征表示;
3.2为了进一步挖掘数据中的空间依赖关系,采用图卷积网络GCN提取数据中的空间关联性:
H(l+1)=GCN(H(l)) (4)
其中,H(l+1)表示时空子网络的第(l+1)层输出的隐藏特征表示;
3.3为了挖掘源域、目标域中潜在的时空模式,学习一种自适应的共享时空知识,首先,随机初始化共享时空知识,将其参数化,记为其中Gk表示潜在的空间模式的类别数目,dk是共享时空知识的特征维度;然后,随着时空子网络迭代训练,采用梯度下降算法更新参数化的共享时空知识K;
步骤4、构建领域判别器:为了得到领域不变的时空特征,使用领域自适应的方法来减少源域与目标域之间的数据分布差异;具体包括:
定义一个二分类领域判别器,将领域判别器的所有模型参数表示为θadv,设置源域的真实领域标签为1,目标域的真实领域标签为0;通过领域判别器预测具有输入特征的领域标签概率,根据预测得到的领域标签概率与真实领域标签计算领域自适应损失函数Ladv:
其中,qj表示第j个样本的预测领域标签概率,dj表示第j个样本的真实领域标签,n表示样本总数;j={1,2,...,n};
步骤5、构建预测器:预测器包括知识注意力模块和全连接层,将预测器的所有模型参数表示为θg;具体过程如下:
5.1首先,对时空特征做线性变化,即:
其中,i表示第i个交通流量传感器,i={1,2,...,(NS+NC)},表示第i个交通流量传感器在t时刻的时空特征;/>dh表示隐藏特征维度;/>表示第i个交通流量传感器在t时刻的特征线性变化结果,/>
其中,表示第i个交通流量传感器在t时刻的特征值与第gk个潜在的空间模式的相似度分数,g′k表示潜在的空间模式的索引,exp(·)表示以为自然常数e为底的指数函数,/>是第i个交通流量传感器在时刻t的可迁移的时空信息;
其中,是源域中第i个交通流量传感器在时刻t的真实值,/>是源域中第i个交通流量传感器在时刻t的预测值,/>是目标域中第i个交通流量传感器在时刻t的真实值,是目标域中第i个交通流量传感器在时刻t的预测值,同时计算源域、目标域的损失函数和/>
步骤6、计算最终损失函数L:
其中,λ为调节预测损失函数与领域自适应损失函数的超参数,λ∈(0,1);
步骤7、利用梯度下降的方法更新时空子网络的模型参数θf、领域判别器的模型参数θadv、预测器的模型参数θg,具体过程可以表示为:
步骤8、重复以上步骤3、4、5、6、7,直到训练次数等于E,最终输出训练好的基于领域自适应与知识迁移的交通流量预测模型。
对本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。
Claims (1)
1.一种基于领域自适应与知识迁移的交通流量预测方法,包括以下步骤:
步骤1、预处理交通流量数据,包括:
1.1利用城市路网中的传感器,将城市交通流量按月或年计的数据量当作源域,将城市交通流量不足三十天的数据量作为目标域,记录一段历史时间内的交通流量情况,它们的交通流量数据量定义如下:
其中,表示实数,XS是作为源域的整个城市的交通流量数据,/>是源域在时刻t的交通流量数据,t表示当前时刻,NS是作为源域的整个城市交通流量传感器数量,PS是源域的交通流量数据的时间片段总数,XC是目标域的整个城市的交通流量数据,/>是目标域在时刻t的交通流量数据,NC是目标域的交通流量传感器数量,PC是目标域的交通流量数据的时间片段总数,D表示交通流量数据的特征维度;
1.2针对交通流量数据中存在缺失值,先利用线性插值方法填补数据缺失值,再采用零均值标准化对填补后的数据归一化处理;
1.3构建模型输入数据:对源域和目标域的交通流量数据进行整理,P表示输入模型的历史时间步,Q表示需要预测的未来时间步,将距离当前时刻t的前P个时间步的历史数据按照时间先后进行叠加,分别形成源域的P个时间步的历史交通流量数据和目标域的P个时间步的历史交通流量数据/>将源域、目标域的时刻t之前的P个时间步的历史交通流量数据作为模型输入,模型输出为源域、目标域的t时刻之后的,Q个未来时间步的交通流量;
步骤2、设置最大训练次数为E=100;
步骤3、构建时空子网络:该网络用于提取时空特征与共享时空知识,利用循环递归神经网络GRU与图卷积网络GCN构建时空子网络处理时间与空间的关联性,同时学习一种自适应的共享时空知识,将时空子网络的所有模型参数表示为θf,具体过程包括:
3.1通过级联的方式将源域和目标域的历史数据作为时空子网络的输入,记为X=[XS;XC],X表示源域和目标域的交通流量数据的级联结果;首先,通过全连接层FC将原始特征映射到特征空间中;其次,为了捕获数据中的时间依赖性,将映射后的嵌入特征输入循环递归神经网络GRU,最后,采用修正线性单元ReLU作为激活函数,该过程描述为:
H(l)=ReLU(GRU(FC(X))) (3)
其中,H(l)表示时空子网络的第l层的隐藏特征表示;
3.2为了进一步挖掘数据中的空间依赖关系,采用图卷积网络GCN提取数据中的空间关联性:
H(l+1)=GCN(H(l)) (4)
其中,H(l+1)表示时空子网络的第(l+1)层输出的隐藏特征表示;
3.3为了挖掘源域、目标域中潜在的时空模式,学习一种自适应的共享时空知识,首先,随机初始化共享时空知识,将其参数化,记为其中Gk表示潜在的空间模式的类别数目,dk是共享时空知识的特征维度;然后,随着时空子网络迭代训练,采用梯度下降算法更新参数化的共享时空知识K;
步骤4、构建领域判别器:为了得到领域不变的时空特征,使用领域自适应的方法来减少源域与目标域之间的数据分布差异;具体包括:
定义一个二分类领域判别器,将领域判别器的所有模型参数表示为θadv,设置源域的真实领域标签为1,目标域的真实领域标签为0;通过领域判别器预测具有输入特征的领域标签概率,根据预测得到的领域标签概率与真实领域标签计算领域自适应损失函数Ladv:
其中,qj表示第j个样本的预测领域标签概率,dj表示第j个样本的真实领域标签,n表示样本总数;j={1,2,...,n};
步骤5、构建预测器:预测器包括知识注意力模块和全连接层,将预测器的所有模型参数表示为θg;具体过程如下:
5.1首先,对时空特征做线性变化,即:
其中,i表示第i个交通流量传感器,i={1,2,...,(NS+NC)},表示第i个交通流量传感器在t时刻的时空特征;/>dh表示隐藏特征维度;/>表示第i个交通流量传感器在t时刻的特征线性变化结果,/>
其中,表示第i个交通流量传感器在t时刻的特征值与第gk个潜在的空间模式的相似度分数,g′k表示潜在的空间模式的索引,exp(·)表示以为自然常数e为底的指数函数,/>是第i个交通流量传感器在时刻t的可迁移的时空信息;
其中,是源域中第i个交通流量传感器在时刻t的真实值,/>是源域中第i个交通流量传感器在时刻t的预测值,/>是目标域中第i个交通流量传感器在时刻t的真实值,/>是目标域中第i个交通流量传感器在时刻t的预测值,同时计算源域、目标域的损失函数/>和/>
步骤6、计算最终损失函数L:
其中,λ为调节预测损失函数与领域自适应损失函数的超参数,λ∈(0,1);
步骤7、利用梯度下降的方法更新时空子网络的模型参数θf、领域判别器的模型参数θadv、预测器的模型参数θg,具体过程可以表示为:
步骤8、重复以上步骤3、4、5、6、7,直到训练次数等于E,最终输出训练好的基于领域自适应与知识迁移的交通流量预测模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210665488.4A CN115034478B (zh) | 2022-06-14 | 2022-06-14 | 一种基于领域自适应与知识迁移的交通流量预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210665488.4A CN115034478B (zh) | 2022-06-14 | 2022-06-14 | 一种基于领域自适应与知识迁移的交通流量预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115034478A CN115034478A (zh) | 2022-09-09 |
CN115034478B true CN115034478B (zh) | 2023-06-23 |
Family
ID=83124472
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210665488.4A Active CN115034478B (zh) | 2022-06-14 | 2022-06-14 | 一种基于领域自适应与知识迁移的交通流量预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115034478B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116959258A (zh) * | 2023-08-22 | 2023-10-27 | 重庆邮电大学 | 一种基于时空图迁移学习的交通流预测方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011209818A (ja) * | 2010-03-29 | 2011-10-20 | Denso It Laboratory Inc | 交通量予測装置、交通量予測方法およびプログラム |
CN110148296A (zh) * | 2019-04-16 | 2019-08-20 | 南京航空航天大学 | 一种基于深度迁移学习的跨城市交通流量联合预测方法 |
CN112801404A (zh) * | 2021-02-14 | 2021-05-14 | 北京工业大学 | 一种基于自适应空间自注意力图卷积的交通预测方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1021190A (ja) * | 1996-07-02 | 1998-01-23 | Nippon Telegr & Teleph Corp <Ntt> | エージェント通信方法と装置 |
JP5070574B2 (ja) * | 2008-06-30 | 2012-11-14 | 学校法人早稲田大学 | 局所交通量予測プログラム生成装置、局所交通量予測装置、局所交通量予測プログラム生成方法、局所交通量予測方法及びプログラム |
CN113128783A (zh) * | 2021-05-06 | 2021-07-16 | 大连理工大学 | 一种基于图迁移学习的交通预测方法 |
CN113887704A (zh) * | 2021-09-29 | 2022-01-04 | 南方科技大学 | 交通信息预测方法、装置、设备及存储介质 |
-
2022
- 2022-06-14 CN CN202210665488.4A patent/CN115034478B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011209818A (ja) * | 2010-03-29 | 2011-10-20 | Denso It Laboratory Inc | 交通量予測装置、交通量予測方法およびプログラム |
CN110148296A (zh) * | 2019-04-16 | 2019-08-20 | 南京航空航天大学 | 一种基于深度迁移学习的跨城市交通流量联合预测方法 |
CN112801404A (zh) * | 2021-02-14 | 2021-05-14 | 北京工业大学 | 一种基于自适应空间自注意力图卷积的交通预测方法 |
Non-Patent Citations (2)
Title |
---|
Reasoning Traffic Pattern Knowledge Graph in Predicting Real-Time Traffic Congestion Propagation;Qingyuan Ji et al.;《IFAC-PapersOnLine》;第53卷(第5期);第 578-581 页 * |
基于交通参数预测的城市快速路交通状态判别研究;张源;《中国优秀硕士学位论文全 文数据库 工程科技Ⅱ辑》(第1期);第 1-103 页 * |
Also Published As
Publication number | Publication date |
---|---|
CN115034478A (zh) | 2022-09-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Dou et al. | A hybrid CEEMD-GMM scheme for enhancing the detection of traffic flow on highways | |
Ren et al. | Mtrajrec: Map-constrained trajectory recovery via seq2seq multi-task learning | |
CN111382676B (zh) | 一种基于注意力机制的沙粒图像分类方法 | |
CN113538910B (zh) | 一种自适应的全链条城市区域网络信号控制优化方法 | |
Yan et al. | Spatial-temporal chebyshev graph neural network for traffic flow prediction in iot-based its | |
CN108764298B (zh) | 基于单分类器的电力图像环境影响识别方法 | |
Yan et al. | Convolutional residual-attention: A deep learning approach for precipitation nowcasting | |
CN114944053A (zh) | 一种基于时空超图神经网络的交通流预测方法 | |
Bao et al. | Spatial–temporal complex graph convolution network for traffic flow prediction | |
CN111723660A (zh) | 一种用于长形地面目标检测网络的检测方法 | |
CN115034478B (zh) | 一种基于领域自适应与知识迁移的交通流量预测方法 | |
Yu et al. | 3D CNN-based accurate prediction for large-scale traffic flow | |
CN116108984A (zh) | 基于流量-poi因果关系推理的城市流量预测方法 | |
CN114943365A (zh) | 融合多源数据的降水估测模型建立方法及降水估测方法 | |
Lowphansirikul et al. | 3D Semantic segmentation of large-scale point-clouds in urban areas using deep learning | |
Wang et al. | A hybrid air quality index prediction model based on CNN and attention gate unit | |
Abdalla et al. | Deep learning weather forecasting techniques: literature survey | |
Nie et al. | An effective recognition of moving target seismic anomaly for security region based on deep bidirectional LSTM combined CNN | |
Tian et al. | Semantic segmentation of remote sensing image based on GAN and FCN network model | |
CN115497006B (zh) | 基于动态混合策略的城区遥感图像变化深度监测方法及系统 | |
CN115861930A (zh) | 一种基于层级差异特征聚合的人群计数网络建模方法 | |
Li et al. | Cross-modal collaborative representation and multi-level supervision for crowd counting | |
Wang et al. | Contrastive GNN-based Traffic Anomaly Analysis Against Imbalanced Dataset in IoT-based ITS | |
CN115828990A (zh) | 融合自适应图扩散卷积网络的时空图节点属性预测方法 | |
ABBAS | A survey of research into artificial neural networks for crime prediction |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |