CN115034478B

CN115034478B - 一种基于领域自适应与知识迁移的交通流量预测方法

Info

Publication number: CN115034478B
Application number: CN202210665488.4A
Authority: CN
Inventors: 杨燕; 欧阳小草; 江永全; 张熠玲; 周威
Original assignee: Southwest Jiaotong University
Current assignee: Southwest Jiaotong University
Priority date: 2022-06-14
Filing date: 2022-06-14
Publication date: 2023-06-23
Anticipated expiration: 2042-06-14
Also published as: CN115034478A

Abstract

本发明公开了一种基于领域自适应与知识迁移的交通流量预测方法，属于数据挖掘技术领域。首先，提取源域与目标域的时空特征的同时学习潜在的基于时空模式的共享时空知识，在获取时空依赖性的同时挖掘时空模式帮助提升目标域的预测性能。其次，构建了一种知识注意力模块从共享时空知识中抽取可迁移的时空信息，从而获取每个时空特征对应的更加详尽的特征表示。最后，融合抽取的时空特征与可迁移的时空信息实现最终的交通流量预测。本发明可用于实际场景当中，它能够获取交通流量数据中的时空特性，同时该发明中的交通流量预测框架能够扩展到其他时空数据领域的预测任务中，具有良好的普适性。

Description

一种基于领域自适应与知识迁移的交通流量预测方法

技术领域

本发明属于数据挖掘技术领域，尤其涉及跨领域知识迁移的方法。

背景技术

智慧城市的建设大大提高了城市居民的生活水平，交通流量预测在智慧城市中有着举足轻重的地位。准确的交通流量预测对缓解城市交通拥堵与规划交通道路起着指导性的作用。由于其重大的实用价值，众多学者对交通流量预测进行了深入地研究。近年来，随着交通流数据量的急剧增长，深度学习被广泛地应用于智慧城市的交通流量预测任务中。特别地，循环卷积神经网络(recurrent neural network，RNN)以及它的变体模型：门控卷积网络(gate recurrent unit，GRU)和长短时记忆网络(long short-term memory，LSTM)，它们在捕获时间依赖性方面表现良好。针对基于网格数据的城市交通流量预测问题，卷积神经网络(convolutional neural network，CNN)常被用于提取局部的特征去建模时空相关性。然而，城市中的数据采集传感器通常呈现出不规则的分布，构成了一种非欧几里得空间的结构，CNN很难处理非欧几里得结构数据。图卷积网络(graph convolutionalnetwork，GCN)由于它强大的处理非欧几里得结构数据的能力，大幅度地提高了交通流预测性能。GCN，CNN与RNN的组合模型在交通流量预测问题上也取得了令人瞩目的效果。虽然以往的工作取得了优异的预测效果，但是仍然存在着以下的问题：第一，基于深度学习的方法过多地依赖于训练数据的数据量，如果只有少量的训练数据，它们的预测性能将会大幅度地下降。但是在实际的应用中，我们常常面临着数据量短缺的问题，例如新的智慧城市或者一些由于数据隐私只能提供少量可用数据的城市，这使得这些基于深度学习的模型训练十分困难。第二，目前现有的基于迁移学习的交通流量预测模型大多针对基于网格数据的城市，很少考虑基于图结构的迁移学习方法。其次，不同城市之间存在的数据分布差异被忽略了，这可能导致负迁移或者迁移效果的不稳定。因此，探索基于图神经网络的能够减小数据分布差异的交通流量预测方法是十分有意义的。

1.交通流量预测

通过对现有的专利及相关技术的检索发现，现有的与交通流量预测相关的方法有：

(1)张旭，张浪文，谢巍，王耀楚，冉杰龙，孙锦晖，陈志乐.一种基于动态时空相关性的交通流预测方法[P].广东省：CN113112793A，2021-07-13.提出了一种基于动态时空相关性的交通流量预测方法。该方法通过流门控机制学习交通点位置之间的动态相似性，引入注意力转移机制处理时间转移，从而实现了区域交通流量预测。

(2)何宏，王欣峰，孙笑笑，俞东进.基于兴趣点时空残差神经网络的多方向交通流量预测方法[P].浙江省：CN114154740A，2022-03-08.提出了一种基于兴趣点时空残差神经网络模型。该模型通过加入时间信号与兴趣点信号去增强时空特征；进一步地，采用3D卷积神经网络提取时空特征；最后，通过加权方法压缩所有时空特征信息，从而实现区域交通流量预测。

目前的基于图神经网络的交通流量预测方法虽然详尽地考虑了交通流量数据中存在的时空依赖性，但是并没有考虑在数据量匮乏的情况下如何实现准确的交通流量预测。

2.迁移学习

通过对现有的专利及相关技术的检索发现，现有的与迁移学习相关的交通流量预测方法有：

(1)王森章，尹成语，缪浩.一种基于深度迁移学习的跨城市交通流量联合预测方法[P].江苏省：CN110148296A，2019-08-20.提出了一种深度知识迁移模型。该模型使用了卷积长短时网络模型ConvLSTM和条件最大平均差异的方法，将迁移学习的思想应用于城市车流预测，从而实现了基于网格数据的城市交通流量预测。

(2)宣帆，徐璀，巢国强，刘新成，周国冬.基于深度迁移融合学习的交通流量预测方法[P].江苏省：CN112862084B，2021-11-30.提出了一种基于深度迁移融合学习的交通流量预测方法。该方法同时结合了时空特征、特征变换、深度神经网络与迁移学习算法，从而实现了交通流量的预测。

但是，以上方法大多是基于网格数据的，所以这些方法并不能直接应用于基于图数据的交通流量预测任务。同时，这些方法并没有考虑源域与目标域存在的数据分布差异问题。因此，我们考虑领域差异的问题并结合图神经网络，提出了一种基于领域自适应与知识迁移的交通流量预测方法。

发明内容

本发明的目的是提供一种领域自适应的交通流量预测方法，它能有效地解决数据量不足的城市无法实现准确的交通流量预测的技术问题。

实现本发明的技术路线如下：

一种基于领域自适应与知识迁移的交通流量预测方法，包括以下步骤：

步骤1、预处理交通流量数据，包括：

1.1利用城市路网中的传感器，将城市交通流量按月或年计的数据量当作源域，将城市交通流量不足三十天的数据量作为目标域，记录一段历史时间内的交通流量情况，它们的交通流量数据量定义如下：

其中，

表示实数，X_S是作为源域的整个城市的交通流量数据，/>

是源域在时刻t的交通流量数据，t表示当前时刻，N_S是作为源域的整个城市交通流量传感器数量，P_S是源域的交通流量数据的时间片段总数，X_C是目标域的整个城市的交通流量数据，/>

是目标域在时刻t的交通流量数据，N_C是目标域的交通流量传感器数量，P_C是目标域的交通流量数据的时间片段总数，D表示交通流量数据的特征维度；

1.2针对交通流量数据中存在缺失值，先利用线性插值方法填补数据缺失值，再采用零均值标准化对填补后的数据归一化处理；

1.3构建模型输入数据：对源域和目标域的交通流量数据进行整理，P表示输入模型的历史时间步，Q表示需要预测的未来时间步，将距离当前时刻t的前P个时间步的历史数据按照时间先后进行叠加，分别形成源域的P个时间步的历史交通流量数据

和目标域的P个时间步的历史交通流量数据/>

将源域、目标域的时刻t之前的P个时间步的历史交通流量数据作为模型输入，模型输出为源域、目标域的t时刻之后的，Q个未来时间步的交通流量；

步骤2、设置最大训练次数为E＝100；

步骤3、构建时空子网络：该网络用于提取时空特征与共享时空知识，利用循环递归神经网络GRU与图卷积网络GCN构建时空子网络处理时间与空间的关联性，同时学习一种自适应的共享时空知识，将时空子网络的所有模型参数表示为θ_f，具体过程包括：

3.1通过级联的方式将源域和目标域的历史数据作为时空子网络的输入，记为X＝[X_S；X_C]，X表示源域和目标域的交通流量数据的级联结果；首先，通过全连接层FC将原始特征映射到特征空间中；其次，为了捕获数据中的时间依赖性，将映射后的嵌入特征输入循环递归神经网络GRU，最后，采用修正线性单元ReLU作为激活函数，该过程描述为：

H(^l)＝ReLU(GRU(FC(X)) (3)

其中，H^(l)表示时空子网络的第l层的隐藏特征表示；

3.2为了进一步挖掘数据中的空间依赖关系，采用图卷积网络GCN提取数据中的空间关联性：

H^(l+1)＝GCN(H^(l)) (4)

其中，H^(l+1)表示时空子网络的第(l+1)层输出的隐藏特征表示；

3.3为了挖掘源域、目标域中潜在的时空模式，学习一种自适应的共享时空知识，首先，随机初始化共享时空知识，将其参数化，记为

其中G_k表示潜在的空间模式的类别数目，d_k是共享时空知识的特征维度；然后，随着时空子网络迭代训练，采用梯度下降算法更新参数化的共享时空知识K；

步骤4、构建领域判别器：为了得到领域不变的时空特征，使用领域自适应的方法来减少源域与目标域之间的数据分布差异；具体包括：

定义一个二分类领域判别器，将领域判别器的所有模型参数表示为θ_adv，设置源域的真实领域标签为1，目标域的真实领域标签为0；通过领域判别器预测具有输入特征的领域标签概率，根据预测得到的领域标签概率与真实领域标签计算领域自适应损失函数L_adv：

其中，q_j表示第j个样本的预测领域标签概率，d_j表示第j个样本的真实领域标签，n表示样本总数；j＝{1，2，...，n}；

步骤5、构建预测器：预测器包括知识注意力模块和全连接层，将预测器的所有模型参数表示为θ_g；具体过程如下：

5.1首先，对时空特征做线性变化，即：

其中，i表示第i个交通流量传感器，i＝{1，2，...，(N_S+N_C)}，

表示第i个交通流量传感器在t时刻的时空特征；/>

d_h表示隐藏特征维度；/>

表示第i个交通流量传感器在t时刻的特征线性变化结果，/>

5.2为了获取交通流量传感器所能提供的可迁移的时空信息，需要构建知识注意力模块，具体过程包括：将时空特征

作为查询条目去查询共享时空知识中的可迁移信息，构建注意力模块的过程表示如下：

其中，

表示第i个交通流量传感器在t时刻的特征值与第g_k个潜在的空间模式的相似度分数，g′_k表示潜在的空间模式的索引，exp(·)表示以为自然常数e为底的指数函数，/>

是第i个交通流量传感器在时刻t的可迁移的时空信息；

5.3将时空特征

与可迁移的时空信息/>

的组合作为最后预测模块的输入，然后采用全连接层FC输出预测结果，即：

其中，

表示第i个交通流量传感器在时刻t的预测值；

5.4根据预测结果计算源域的预测损失函数

和目标域的预测损失函数/>

其中，

是源域中第i个交通流量传感器在时刻t的真实值，/>

是源域中第i个交通流量传感器在时刻t的预测值，/>

是目标域中第i个交通流量传感器在时刻t的真实值，

是目标域中第i个交通流量传感器在时刻t的预测值，同时计算源域、目标域的损失函数

和/>

步骤6、计算最终损失函数L：

其中，λ为调节预测损失函数与领域自适应损失函数的超参数，λ∈(0，1)；

步骤7、利用梯度下降的方法更新时空子网络的模型参数θ_f、领域判别器的模型参数θ_adv、预测器的模型参数θ_g，具体过程可以表示为：

其中，

表示偏微分操作，μ表示梯度下降算法的学习率；

步骤8、重复以上步骤3、4、5、6、7，直到训练次数等于E，最终输出训练好的基于领域自适应与知识迁移的交通流量预测模型。

与现有技术相比，本发明的优点和效果：

(1)该发明针对特点城市数据量少而无法实现准确的交通流量预测问题，提出了一种基于领域自适应的模型，该模型能够同时获取时空数据中的时空特性，预测误差小，准确程度较高。(2)该发明提出的共享时空知识能够有效捕获潜在的时空知识，实现潜在时空模型在不同城市之间的知识迁移。(3)该发明提出的框架，能够扩展到其他相关的城市时空数据领域，解决类似问题，具有普适性。

附图说明

图1为本发明框架结构图，

图2为本发明中知识注意力模块结构图，

图3为本发明中模型输入值、预测值、真实值关联示意图。

具体实施方式

以下结合附图实施对本发明作进一步详细描述。

一、基于领域适应与知识迁移的交通流量预测模型框架：

本发明的整体框架结构如图1所示，即基于领域适应与知识迁移的交通流量预测模型。它主要分为三个部分：(i)时空子网络，该网络用于提取交通流量中的时空特征以及学习共享时空知识。(ii)领域判别器，该模块通过对源域与目标域生成的时空特征进行分类以约束时空子网络提取领域不变的时空特征，减小源域与目标域之间的特征分布差异。(iii)预测器，该模块主要包括两个部分：知识注意力模块与全连接层。知识注意力模块用于挖掘共享时空知识中可迁移的时空信息用于目标域的预测中。全连接层将提取的隐藏表示进行线性映射，得到最终的目标域的预测结果。

二、知识注意力模块：

如图2所示，知识注意力模块的具体过程如下：首先，输入第i个交通流量传感器在时刻t的时空特征

同时输入第g_k个潜在时空模式的共享时空知识/>

时空特征通过全连接层进行线性变化得到时空特征嵌入/>

接下来，/>

与/>

相乘，再经过尺度变换，最后，通过归一化指数函数SoftMax，得到注意力分数/>

将分数与时空知识相乘获得最终的可迁移的时空信息/>

三、模型输入值、预测值、真实值：

如图3所示，模型输入包括源域输入和目标域输入，模型预测结果包括源域预测值与目标域预测值，真实值包括源域真实值与目标域真实值。

实施例