CN115146695A

CN115146695A - 一种基于超图注意力网络的公共交通出行群体分类方法

Info

Publication number: CN115146695A
Application number: CN202210295276.1A
Authority: CN
Inventors: 张勇; 池海楠; 张毅; 李孟燃; 张宇晴; 尹宝才
Original assignee: Beijing University of Technology
Current assignee: Beijing University of Technology
Priority date: 2022-03-23
Filing date: 2022-03-23
Publication date: 2022-10-04
Anticipated expiration: 2042-03-23
Also published as: CN115146695B

Abstract

一种基于超图注意力网络的公共交通出行群体分类方法属于智能交通系统领域，旨在解决出行群体分类问题。首先，利用KNN(K‑NearestNeighbor)网络将公共交通个体出行特征数据构建出超图表示，其中节点表示出行个体，超边为KNN建模的出行个体间的属性拓扑关系；接下来使用超图注意力网络(HGAT)学习超图中节点的表示，共分为两步。第一步，用节点注意力来学习节点的特征表示。第二步，采用另一个聚合器来聚合节点的最终表示；最后，将节点的表示输入到线性层，进行出行群体的分类，并采用交叉熵损失来优化模型的预测能力。实验证明，本发明能够实现对于公共交通出行群体的精准分类，且准确度有了很大的提升。

Description

一种基于超图注意力网络的公共交通出行群体分类方法

技术领域

本发明涉及一种基于超图注意力网络的公共交通出行群体分类方法，属于智能交通系统领域。

背景技术

随着城市公共交通的迅速发展以及智慧城市的建设，城市机动化水平不断提高，城市交通和环境压力不断增大，交通运营系统中暴露出许多问题。如出行高峰期乘客在站台等候时间过长，乘车过于拥挤带来的较差出行体验，客流在不同站点间分布不均衡等。这些问题给人们的出行带来极大不便利的同时也对轨道交通从业人员提出了巨大挑战。如何对公共交通个体出行特征数据进行深入分析，挖掘出其中潜在的规律性，进而对出行群体进行精准的画像分析和准确的分类任务成为了亟待解决的问题。这一技术的突破将有助于为轨道交通出行个体提供更合理的出行规划以及更好的出行体验。

对于轨道交通个体出行特征数据的分析研究关键点在于出行特征数据的量化形式以及分类的算法两部分。现有的研究对于数据特征的量化大多将其映射到公共的向量空间，忽略了不同特征之间信息水平的差异。而分类算法虽然在最近几年得到了广泛探索，引入了深度神经网络等技术，但是依旧忽略了数据中的高阶数据相关性，无法准确的学习出个体出行特征间潜在的关联关系。随着深度学习的图神经网络的深入研究，学者们开始将图结构引入到数据的表示中，以图的形式更精准的刻画出数据特征间的拓扑关系，并利用图神经网络来学习图的特征。这也为公共交通出行群体分类问题奠定了强大的理论基础。

发明内容

为了实现精准的公共交通出行群体的分类，本发明将超图引入到分类模型中，提出了一种基于超图注意力网络的公共交通出行群体分类方法。利用超图对个体出行特征数据进行建模，准确量化个体多源异构行为数据中隐含的高阶关联关系，再通过超图注意力网络学习超图中节点之间的重要性。

为实现上述问题，本发明包含以下步骤：

步骤一：利用KNN(K-Nearest Neighbor)算法构建出个体出行特征数据的超图表示。相比其他算法，KNN简洁明了，模型训练时间快，对异常值不敏感且预测效果好，因此本文选用KNN方法来构建超图。利用KNN算法构建超图关键点在于节点距离计算和K值的选取。对于距离计算问题，本文选取欧氏距离作为度量方式。个体出行特征数据具有d维特征，因此第i个出行个体对应的节点可表示为X_i＝(x_i1，x_i2，…，x_id)^T。两个出行个体节点之间的特征相似度计算公式如下：

其中，D(·)表示计算欧氏距离，X_i，X_j分别表示出行个体i和出行个体j对应的节点特征。x_ih表示出行个体i的第h(1≤h≤d)个特征，x_jh表示出行个体j的第h(1≤h≤d)个特征，d是出行个体的特征总数。对于K值的选取，本文采用交叉验证的方法，选取错误率最低(最优)的K值。在确定了KNN算法的节点距离计算方法和K值的选取方法后，我们就可以利用KNN分类算法构造出超图的超边。假设KNN分类结果为m类，则个体出行特征数据的超图表示为G＝(V，ε)，其中V＝{v₁，v₂，…，v_n}为节点集，ε＝{e₁，e₂，…，e_m}为超边集，n为出行个体总数。

步骤二：利用超图注意力网络(HGAT)学习超图中节点的表示。超图注意力网络如图1中(HGAT)所示，主要分为节点注意力的计算和超边特征的聚合两个部分。首先，给定一个超图G，由于超边e_j∈ε中所有节点对于超边的贡献并不相等，因此我们引入了节点级注意力机制来突出那些对于超边含义重要的节点，然后对它们进行聚合，来计算超边的表示：

其中，f_j是第j个超边e_j的超边表示，σ(·)为激活函数ReLU，h_i是第i个节点v_i的节点表示，W₁为可训练权重矩阵(随机初始化得到)，v_i∈e_j表示超边e_j所关联的任意节点v_i，α_ji为节点v_i在超边e_j中的注意力系数，计算方法为：

u_i＝LeakyReLU(W₁h_i)

u_p＝LeakyReLU(W₁h_p)

其中，a₁为权重向量(随机初始化得到)，v_p∈e_j表示超边e_j所关联的任意节点v_p，W₁为可训练权重矩阵(随机初始化得到)，h_i是第i个节点v_i的节点表示，h_p是第p个节点v_p的节点表示，dis(·)表示计算欧氏距离，exp(·)表示计算指数函数，LeakyReLU(·)为激活函数。接下来，在获得超边的表示后，我们采用另一个聚合器来聚合节点的表示，由于节点与超边的交互都发生在相同的特征区间内，因此对于聚合过程中每个超边赋予相同的权重：

其中，

是第i个节点v_i聚合后的节点表示，W₂为可训练权重矩阵(随机初始化得到)，f_j是第j个超边e_j的超边表示。超图注意力网络不仅捕获了出行个体间的高阶特征的相关性，而且在节点表示学习中以不同粒度突了出关键信息。

步骤三：将步骤二学习到的节点特征表示输入到线性层，用以获取分类结果。线性层的计算方式如下：

其中，

是第i个节点v_i聚合后的节点表示，W^T为权重矩阵(随机初始化得到)，bias为偏置，Y则是最终分类结果。

步骤四：计算损失。由于本文主要是做公共交通出行群体分类任务，因此采用交叉熵损失作为本文的损失函数。交叉熵损失H(p，q)计算公式如下：

其中概率分布p(Y)为期望输出结果，q(Y)为实际输出结果。

步骤五：参数设置。在训练过程中，epoch数量设置为3500；学习率设置为0.005；输入向量的维数设置为3；训练集测试集分别为总数的70％和30％；节点维度为3；权重衰减值为0.001；dropout率设置为0.3。

有益效果

本发明解决了传统的分类方法中两大技术难点，一是对于数据特征的量化忽略了不同特征之间信息水平的差异问题，二是分类算法无法准确的学习出个体出行特征间潜在的关联关系问题。提高了公共交通出行群体分类的准确率。

附图说明

图1是本发明一种基于超图注意力网络的公共交通出行群体分类方法的网络结构图。

图2是本发明一个实施例的流程图。

具体实施方式

下面结合附图和实施例对本发明一种基于超图注意力网络的公共交通出行群体分类方法做进一步说明和详细描述。

本实施例详细阐述了本发明“一种基于超图注意力网络的公共交通出行群体分类方法”在公共交通出行群体分类任务中应用的完整过程。

具体实施时，实验使用的是公共交通个体出行特征数据集，该数据集是在2015年7至12月北京市公交和地铁刷卡记录原始数据集的基础上，经过分析提取出的个体出行特征数据。该数据包含了出行个体频繁访问站点、频繁出行时间、指定时间所访问的站点总数、局部异常因子等17个特征。其中选取了13800个出行个体的数据进行试验，这些个体分别隶属于三类出行群体，分别是通勤人员、普通市民以及出行行为异常人员。

实验是在一个带有11G内存的2080TIGPU服务器上进行的，在训练过程中，epoch数量设置为3500；学习率设置为0.005；输入向量的维数设置为3；训练集测试集分别为总数的70％和30％；节点维度为3；权重衰减值为0.001；dropout率设置为0.3。将以上数据输入如图1所示的模型中，得到预测结果。我们使用精准率、召回率、准确率三个指标来评估模型的有效性，其计算公式如下：

(1)精准率：

(2)召回率：

(3)准确率：

其中TP为判断为正向的正确率，TN为判断为负向的正确率，FP为误报率，即把负向判断成了正向，FN为漏报率，即把正向判断称了负向。

本发明将所提出基于超图注意力网络的公共交通出行群体分类方法(HypergraphAttention Network，HGAT)与以下五个分类方法进行比较，其中包括AdaBoost、K最邻近(K-NearestNeighbor，KNN)、支持向量机(support vector machines，SVM)、多图神经网络(Multi Graph Neural Network，MGNN)和超图神经网络(Hypergraph Neural Network，HGNN)。实验结果对比如下表所示，可以看出，相较于其他方法，本发明取得了更加精准的预测效果。

需要说明的是，以上所述内容及实施例只是为了配合本发明的技术方案的解释说明，并不等同于本发明局限于此实施例。凡是在本发明技术范围之内，且不违背发明实施例的思想，所完成的修改及同等替换，都应该在本发明的保护范围之内。

Claims

1.一种基于超图注意力网络的公共交通出行群体分类方法包含以下步骤：

步骤一：利用KNN算法构建出个体出行特征数据的超图表示；

步骤二：利用超图注意力网络学习步骤一中构建的超图中节点的表示；

步骤三：将步骤二学习到的节点特征表示输入到线性层，用以获取分类结果；

步骤四：计算损失；由于主要是做公共交通出行群体分类任务，因此采用交叉熵损失作为的损失函数；

步骤一中对于出行特征数据的量化形式采用KNN算法构建出个体出行特征数据的超图表示；利用KNN算法构建超图关键点在于节点距离计算和K值的选取；对于距离计算问题，选取欧氏距离作为度量方式；个体出行特征数据具有d维特征，因此第i个出行个体对应的节点特征可表示为X_i＝(x_i1，x_i2，…，x_id)^T；两个出行个体节点之间的特征相似度计算公式如下：

其中，D(·)表示计算欧氏距离，X_i，X_j分别表示出行个体i和出行个体j对应的节点特征；x_ih表示出行个体i的第h个特征，x_jh表示出行个体j的第h个特征，其中1≤h≤d；d是出行个体的特征总数；对于K值的选取，采用交叉验证的方法，选取错误率最低的K值；在确定了KNN算法的节点距离计算方法和K值的选取方法后，就利用KNN分类算法构造出超图的超边；假设KNN分类结果为m类，则个体出行特征数据的超图表示为G＝(V，ε)，其中V＝{v₁，v₂，…，v_n}为节点集，ε＝{e₁，e₂，…，e_m}为超边集，n为出行个体总数；

步骤二中利用超图注意力网络学习超图中节点的表示；超图注意力网络分为节点注意力的计算和超边特征的聚合两个部分；首先，给定一个超图G，由于超边e_j∈ε中所有节点对于超边的贡献并不相等，因此引入了节点级注意力机制来突出那些对于超边含义重要的节点，然后对它们进行聚合，来计算超边的表示：

其中，f_j是第j个超边e_j的超边表示，σ(·)为激活函数ReLU，h_i是第i个节点v_i的节点表示，W₁为可训练权重矩阵，v_i∈e_j表示超边e_j所关联的任意节点v_i，α_ji为节点v_i在超边e_j中的注意力系数，计算方法为：

u_i＝LeakyReLU(W₁h_i)

u_p＝LeakyReLU(W₁h_p)

其中，a₁为权重向量，v_p∈e_j表示超边e_j所关联的任意节点v_p，W₁为可训练权重矩阵，h_i是第i个节点v_i的节点表示，h_p是第p个节点v_p的节点表示，dis(·)表示计算欧氏距离，exp(·)表示计算指数函数，LeakyReLU(·)为激活函数；接下来，在获得超边的表示后，采用另一个聚合器来聚合节点的表示，由于节点与超边的交互都发生在相同的特征区间内，因此对于聚合过程中每个超边赋予相同的权重：

其中，h`_i是第i个节点v_i聚合后的节点表示，W₂为可训练权重矩阵，f_j是第j个超边e_j的超边表示。

2.根据权利要求1所述的基于超图注意力网络的公共交通出行群体分类方法，其特征在于对于步骤二学习到的节点特征表示，采用线性层获取分类结果；线性层的计算方式如下：

Y＝h`_iW^T+bias

其中，h`_i是第i个节点v_i聚合后的节点表示，W^T为权重矩阵，bias为偏置，Y则是最终分类结果。

3.根据权利要求1所述的基于超图注意力网络的公共交通出行群体分类方法，其特征在于采用交叉熵损失作为的损失函数；假设概率分布p(Y)为期望输出结果，q(Y)为实际输出结果，则交叉熵H(p，q)计算公式如下：