CN114969532A

CN114969532A - 一种基于异质图神经网络的多模态交通推荐方法

Info

Publication number: CN114969532A
Application number: CN202210622315.4A
Authority: CN
Inventors: 钟萍; 徐爱昆; 王安宁; 鲁鸣鸣; 高建良
Original assignee: Central South University
Current assignee: Central South University
Priority date: 2022-06-01
Filing date: 2022-06-01
Publication date: 2022-08-30
Anticipated expiration: 2042-06-01
Also published as: CN114969532B

Abstract

本发明公开了一种基于异质图神经网络的多模态交通推荐方法，包括获取历史出行数据并处理得到训练数据集；构建起点‑目的地多二部图嵌入方案；构建异质交通图；设计带有残差网络的分层注意力机制；构建多模态交通推荐初始模型并训练得到基于异质图神经网络的多模态交通推荐模型；采用基于异质图神经网络的多模态交通推荐模型进行实时的多模态交通推荐。本发明方法能够显式捕获实体之间的关联并从多种视角以分层次的方式捕获不同实体之间的潜在联系，同时解决模型无法区分节点特征的问题，能够有效提升多模态交通推荐问题的准确性，推荐准确率高且可靠性好。

Description

一种基于异质图神经网络的多模态交通推荐方法

技术领域

本发明属于数字信息处理领域，具体涉及一种基于异质图神经网络的多模态交通推荐方法。

背景技术

近年来，随着经济技术的发展，交通推荐(导航应用)已经广泛应用于人们的生产和生活当中，给人们的生产和生活带来了无尽的便利。在交通推荐技术领域中，多模态交通推荐是众多导航应用的核心组成部分；针对多模态交通推荐的研究，已经得到了交通部门、学术界和工业界的广泛关注。

在导航规划中，仅考虑一种交通方式(例如自行车、公共汽车、出租车或地铁)的单模态交通推荐，已被广泛研究。相反，多模态交通推荐研究仍处于初步阶段；该类交通推荐，一般是研究在路网中同时考虑单一交通方式(如自行车、公共汽车、出租车和地铁)和混合交通方式(如出租车-公共汽车、出租车-地铁)，而且单模态交通推荐方案无法直接应用到多模态交通推荐场景。

针对以上问题，研究人员相继提出了个性化路线推荐方法FAVOUR、多模态交通方式推荐方法Trans2vec、多模态交通推荐方案Hydra等技术方案；而且，Trans2vec和Hydra等方案均已经商业化运行。但是，目前的技术方案，均存在着过度平滑的问题：现有技术方案在使用图神经网络时，随着网络层数和迭代次数的增加，最终所有节点收敛于相同的值，导致模型表示能力下降。

发明内容

本发明的目的在于提供一种推荐准确率高且可靠性好的基于异质图神经网络的多模态交通推荐方法。

本发明提供的这种基于异质图神经网络的多模态交通推荐方法，包括如下步骤：

S1.获取历史出行数据，并处理得到训练数据集；

S2.构建起点-目的地多二部图嵌入方案；

S3.根据构建的起点-目的地多二部图嵌入方案，构建异质交通图；

S4.设计带有残差网络的分层注意力机制，以解决过度平滑的问题；

S5.对步骤S4的结果进行汇聚和处理，得到最终的多模态交通推荐结果，构建多模态交通推荐初始模型；

S6.采用步骤S1得到的训练数据集，对步骤S5构建的多模态交通推荐初始模型进行训练，得到基于异质图神经网络的多模态交通推荐模型；

S7.采用步骤S6得到的基于异质图神经网络的多模态交通推荐模型，进行实时的多模态交通推荐。

步骤S1所述的获取历史出行数据，并处理得到训练数据集，具体包括如下步骤：

所述的历史出行数据包括用户属性数据、起点数据、目的地数据、情境感知数据和交通方式数据，并以时间序列格式进行保存；

根据历史出行数据，将对应的起点和目的地的组合为起点-目的地对(OD对)；收集交通数据集，并转化为图结构数据；图结构数据包括用户、交通方式、OD对、起点、目的地点，具有关系的边和行驶语义；节点数据采用如下公式进行形式化表示：

式中X_u为用户属性数据，且

N为导航数据集的总数据量，q为用户属性数据的维度；X_o为起点数据，且

p为起点和目的地的维度；X_d为目的地数据，且

X_con为情境感知数据，且

k为上下文数据的维度；X_od为OD对数据，且

n为OD对的维度，且n＝p+p。

步骤S2所述的构建起点-目的地多二部图嵌入方案，具体包括如下步骤：

提取起点o、目的地d、OD对od、和用户u的特征；

根据OD对，构建起点-目的地二部图，并在GCN层聚合来自邻居节点的信息，用于表征二部图的点；根据用户在OD对行驶过的数据信息，构建用户-OD对二部图，并通过GAT层更新节点信息；

所述的GCN层，具体为在获得起点-目的地二部图后，通过以下GCN模型分别更新起点和目的地的特征：

式中

为起点o_i的第l+1层的嵌入；N(o_i)为起点o_i的度；N(d_j)为目的地d_j的度；

为目的地d_j的第l层的嵌入；

为目的地d_i的第l+1层的嵌入；N(d_i)为目的地d_i的度；N(o_j)为起点o_j的度；

为起点o_j的第l层的嵌入；当OD对存在时，e_od＝e_o||e_d，||为合并操作；

所述的GAT层，具体为在获得用户-OD二部图后，用户-OD二部图的初始化表征矩阵E为

式中M为OD对的数量；Q为用户的数量；

为第j个OD对的初始化嵌入，j＝1,2,...,M；

为第i个用户的初始化嵌入，i＝1,2,...,Q；

为了获取用户的特征信息，通过聚合用户u邻居传播的信息以更新用户u的表征；定义以下聚合函数

式中

为在第l+1层用户u_i的嵌入；N(u_i)为u_i的邻居聚合；W₁ ^(l)为训练得到的权重矩阵；

为用户u_i和od_j之间的注意力值；

为第l层中用户u_i和od_j之间的注意力值，且

softmax()为归一化指数函数softmax，

为第l层中第i个用户对第j个OD对的重要性，且

ρ()为激活函数LeakyReLU，a为注意力权重向量，

和

为训练得到的权重参数，

为u_i在第l层的表征，

为od_j在第l层的表征；

通过GAT层基于用户-OD二部图用户的特征为e_u和e_od；上下文信息通过标准归一化后为e_m。

步骤S3所述的根据构建的起点-目的地多二部图嵌入方案，构建异质交通图，具体包括如下步骤：

根据导航数据存在用户u使用交通方式m在OD对od上行驶的语义结构(u,m,od)构建异质交通图，异质交通图上每个节点的初始化嵌入向量表示为e_init＝e_u||e_od||e_m，||为合并操作；e_u为用户节点的初始化嵌入向量，e_od为OD对的初始化嵌入向量，e_m为交通方式初始化嵌入向量；

交通方式最后的嵌入表示为

其中E_u为用户节点嵌入，且

E_od为OD对节点嵌入，且

E_m为交通方式节点嵌入，且

f₁为用户节点嵌入维度的大小；f₂为OD对节点嵌入维度的大小；f₃为交通方式节点嵌入维度的大小；e'_m∈ε_m，e'_m为每个交通方式的多模态嵌入向量。

步骤S4所述的设计带有残差网络的分层注意力机制，以解决过度平滑的问题，具体包括如下步骤：

带有残差网络的分层注意力机制包括残差网络层、节点注意力层和权重注意力层；

残差网络层用于维持网络训练的稳定性；残差网络层的值

直接受第l+1层hx视角交通方式节点嵌入

和第l层hx视角交通方式节点嵌入

的影响：

式中hx为节点类型，包含ho和he，其中ho表示同质节点，he表示异质节点；ψ_s为给定的元路径集合；σ()为ReLU激活函数；

为第l+2层hx视角的可训练权重矩阵；

为第l+1层hx视角交通方式节点嵌入；b^hx(l+2)为第l+2层hx视角的偏置向量；

节点注意力层：采用如下公式计算第l+1层hx视角的第i个交通方式节点嵌入

式中m_j为第i个交通方式节点m_i的邻居节点；N(m_i)为第i个交通方式节点m_i的邻居节点集合；

为m_i和m_j之间的注意力值；

为第l层的可训练权重矩阵；

权重注意力层：每个交通方式m的最终嵌入通过以下公式计算得到：

式中softmax()为归一化指数函数softmax。

步骤S5所述的对步骤S4的结果进行汇聚和处理，得到最终的多模态交通推荐结果，构建多模态交通推荐初始模型，具体包括如下步骤：

设计融合神经层，汇聚步骤S4的结果，并将结果输入到全连接层，从而实现多模态交通推荐；

具有若干个全连接层的多模态嵌入e'_m用于预测最适合用户u在od上行驶的交通方式m：

式中

为同质视角的交通方式节点嵌入；

为异质视角的交通方式节点嵌入；||为合并操作；softmax()为softmax函数；θ()为激活函数ReLU；

为训练得到的权重矩阵；

为第l层交通方式m的最终表示；b^(l)为偏置向量；y'_m为最终的预测得分；

对用户使用的若干种交通方式的最后得分进行排序，实现为用户进行多模态交通推荐；

模型训练过程中，进行有监督的训练，采用如下交叉熵损失作为目标函数Loss：

式中C为分类的数量；

为真实的标签；

为预测的标签；

在标签数据的指导下，通过反向传播，优化所提出的多模态交通推荐初始模型。

本发明提供的这种基于异质图神经网络的多模态交通推荐方法，从数据层面出发，将现有交通数据集转化为图结构数据以表征用户、交通方式和OD对等不同实体之间的显式关联；同时，从模型架构角度出发，提出的分层注意力机制实现了从异质和同质视角全面捕获不同类型节点和边之间的潜在关系；此外，设计残差网络参与模型训练，缓解了由于迭代次数增加引起节点特征收敛为相同值的问题；因此，本发明方法能够显式捕获实体之间的关联并从多种视角以分层次的方式捕获不同实体之间的潜在联系，同时解决模型无法区分节点特征的问题，能够有效提升多模态交通推荐问题的准确性，推荐准确率高且可靠性好。

附图说明

图1为本发明方法的方法流程示意图。

图2为本发明方法与现有的推荐方法在F1、Pre、Rec和NDCG上的性能比较结果示意图。

图3为本发明方法的分组鲁棒性验证效果示意图。

图4为本发明方法的消融实验效果示意图。

图5为本发明方法的多二部图嵌入合理性验证效果示意图。

具体实施方式

如图1所示为本发明方法的方法流程示意图：本发明提供的这种基于异质图神经网络的多模态交通推荐方法，包括如下步骤：

S1.获取历史出行数据，并处理得到训练数据集；具体包括如下步骤：

所述的历史出行数据包括用户属性数据(包括年龄、性别、职业等)、起点数据(经纬度坐标数据)、目的地数据(经纬度坐标数据)、情境感知数据(天气数据等)和交通方式数据(交通方式类型等)，并以时间序列格式进行保存；

根据历史出行数据，将对应的起点和目的地的组合为起点-目的地对(OD对)；收集交通数据集，并转化为图结构数据；图结构数据包括用户、交通方式、OD对、起点、目的地点，具有关系的边(具有“Take”和“Travel”等关系)和行驶语义；节点数据采用如下公式进行形式化表示：

式中X_u为用户属性数据，且

p为起点和目的地的维度；X_d为目的地数据，且

X_con为情境感知数据，且

k为上下文数据的维度；X_od为OD对数据，且

n为OD对的维度，且n＝p+p；

S2.构建起点-目的地多二部图嵌入方案；具体包括如下步骤：

提取起点o、目的地d、OD对od、和用户u的特征；

根据OD对，构建起点-目的地二部图，用于挖掘起点和目的地之间的关系以及OD对和用户之间的关系；在GCN层聚合来自邻居节点的信息，用于表征二部图的点；根据用户在OD对行驶过的数据信息，构建用户-OD对二部图，并通过GAT层更新节点信息；

所述的GCN层，基于历史数据构建origin-destination二部图，通过数据分析可知，起点和目的地的组合具有很大的随机性，并且起点和终点的表示是相似的，区分邻居的重要性不再重要，因此GCN适合提取起点和终点的嵌入；具体为在获得起点-目的地二部图后，通过以下GCN模型分别更新起点和目的地的特征：

式中

为目的地d_j的第l层的嵌入；

所述的GAT层，基于user-OD二部图学习用户(或OD对)的嵌入；在user-OD二部图中，用户节点和OD对节点的特征空间和维度有很大的不同，并且从数据中发现，用户选择OD是有一定规律的；引入GAT来区分邻居的重要性是关键的；具体为在获得用户-OD二部图后，用户-OD二部图的初始化表征矩阵E为

式中M为OD对的数量；Q为用户的数量；

为第j个OD对的初始化嵌入，j＝1,2,...,M；

为第i个用户的初始化嵌入，i＝1,2,...,Q；

式中

为用户u_i和od_j之间的注意力值；

为第l层中用户u_i和od_j之间的注意力值，且

softmax()为归一化指数函数softmax，

为第l层中第i个用户对第j个OD对的重要性，且

ρ()为激活函数LeakyReLU，a为注意力权重向量，

和

为训练得到的权重参数，

为u_i在第l层的表征，

为od_j在第l层的表征；

通过GAT层基于用户-OD二部图用户的特征为e_u和e_od；上下文信息通过标准归一化后为e_m；

S3.根据构建的起点-目的地多二部图嵌入方案，构建异质交通图；具体包括如下步骤：

交通方式最后的嵌入表示为

其中E_u为用户节点嵌入，且

E_od为OD对节点嵌入，且

E_m为交通方式节点嵌入，且

f₁为用户节点嵌入维度的大小；f₂为OD对节点嵌入维度的大小；f₃为交通方式节点嵌入维度的大小；e'_m∈ε_m，e'_m为每个交通方式的多模态嵌入向量；

为充分利用异质交通图的丰富语义，本申请设计一种带有残差块的分层注意机制，它包括ResNet层、节点注意层和权重注意层；该机制可以从同质和异质的视角挖掘潜在的特征，并且保证网络稳定训练；交通方式节点的表征受多种类型邻居节点的影响且影响程度不同；因此，有必要使用节点注意力机制来区分邻居节点的重要性；值得注意的是，邻居之间的边(即元路径)的重要性也会影响交通方式m的表示；不同的元路径对节点的表示有不同的影响；因此，本申请引入一种权重注意力机制来区分不同元路径对节点的重要性；对于深度神经网络，随着网络层数的增加，应该训练得越来越好；但是随着网络层数和迭代次数的增加，过度平滑问题越来越明显；本申请中的ResNet模块能够使得在训练更深的网络时确保良好的性能成为可能；

具体包括如下步骤：

残差网络层用于维持网络训练的稳定性；残差网络层的值

直接受第l+1层hx视角交通方式节点嵌入

和第l层hx视角交通方式节点嵌入

的影响：

为第l+2层hx视角的可训练权重矩阵；

为m_i和m_j之间的注意力值；

为第l层的可训练权重矩阵；

式中softmax()为归一化指数函数softmax；研究人员可以将最终的嵌入应用到特定的任务中，例如节点分类、节点预测和推荐系统；

S5.对步骤S4的结果进行汇聚和处理，得到最终的多模态交通推荐结果，构建多模态交通推荐初始模型；具体包括如下步骤：

式中

为同质视角的交通方式节点嵌入；

为训练得到的权重矩阵；

式中C为分类的数量；

为真实的标签；

为预测的标签；

在标签数据的指导下，通过反向传播，优化所提出的多模态交通推荐初始模型；

如图2所示为本发明方法与现有的推荐方法在F1、Pre、Rec和NDCG上的性能比较结果示意图；THAN在常用的4个评测指标上都优于NMTRec、Hydra、HMTRL、HAN和HeCo等基线算法，这展示了所提模型THAN的优势。具体来说，与最先进方案相比，THAN实现了F1(+0.8％)、Pre(+6.2％)、Rec(+0.8％)和NDCG(+4.9％)的改进。这取决于THAN不仅可以学习同质节点之间的关系，还可以从异质性的角度增强特征表示，同时THAN中的残差模块可以稳定模型的训练，保证网络在比较深时同样具有良好的性能。

如图3所示为本发明方法的分组鲁棒性验证效果示意图；为了验证THAN的鲁棒性，本申请将数据随机分成四组，并用每组数据测试THAN模型的性能。结果表明THAN在北京数据集的不同分组上，其F1、Pre、Rec和NDCG四个指标的结果都非常稳定。具体来说，在使用这四个指标的所有测试中，结果值的差异不超过2％。结果验证了THAN框架对于不同的交通方式推荐场景是稳健的。此外，在广州、上海和深圳数据集上的验证结果表明，F1、Pre、Rec和NDCG四个指标的值与在北京数据集上得到的结果相近并且也保持着2％内的差异，进一步说明THAN具有良好的鲁棒性。。

如图4所示为本发明方法的消融实验效果示意图；为了进一步探索多模态融合在THAN模型中的效果，本申请将THAN与其变种THAN(ResNet)(不考虑ResNet层)、THAN(MBigraphE)(不考虑MBigraphE)、THAN(HierAtt)(不考虑HierAtt)和THAN(ResNet&MBigraphE)(不考虑ResNet和MBigraphE)在北京数据集上进行实验测试，并将产生的四个指标的值进行比较，结果如图4所示。结果表明，THAN的性能优于THAN(ResNet)、THAN(MBigraphE)、THAN(HierAtt)和THAN(ResNet&MBigraphE)。此外，THAN(MBigraphE)和THAN(HierAtt)比THAN(ResNet)表现更好，这表明残差块在多模态交通推荐中起着更重要的作用，这是因为ResNet有助于解决过度平滑的问题，让训练变得更好，至少确保当前的结果不比上次差。MBigraphE可以平衡特征的重要性。这是因为MBigraphE不仅可以学习邻居嵌入，还可以区分邻居的重要性。。

如图5所示为本发明方法的多二部图嵌入合理性验证效果示意图；本申请希望通过评估THAN三个变体的性能以验证MBigraphE的合理性，三个变体分别为：(1)THAN_o_d_od_pid在THAN中没有考虑MBigraphE，(2)THAN_o_d表示不考虑o和d之间的相互作用，(3)THAN_od_pid表示不考虑od和u之间的潜在关联。四种方案在北京数据集上四个指标的对比结果如图5所示。由结果可知，考虑o与d或od与u的潜在联系比不考虑o与d或od与u的潜在联系的效果要好。而同时考虑o与d以及od与u之间的相互作用比单独考虑o与d或od与u之间的相互作用效果要好，实验结果进一步证明了MBigraphE的有效性。