CN115146695A - 一种基于超图注意力网络的公共交通出行群体分类方法 - Google Patents
一种基于超图注意力网络的公共交通出行群体分类方法 Download PDFInfo
- Publication number
- CN115146695A CN115146695A CN202210295276.1A CN202210295276A CN115146695A CN 115146695 A CN115146695 A CN 115146695A CN 202210295276 A CN202210295276 A CN 202210295276A CN 115146695 A CN115146695 A CN 115146695A
- Authority
- CN
- China
- Prior art keywords
- node
- hypergraph
- trip
- representation
- nodes
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 30
- 238000004364 calculation method Methods 0.000 claims description 16
- 230000006870 function Effects 0.000 claims description 9
- 238000004422 calculation algorithm Methods 0.000 claims description 8
- 238000007635 classification algorithm Methods 0.000 claims description 5
- 230000008569 process Effects 0.000 claims description 5
- 230000004913 activation Effects 0.000 claims description 4
- 230000002776 aggregation Effects 0.000 claims description 4
- 238000004220 aggregation Methods 0.000 claims description 4
- 239000011159 matrix material Substances 0.000 claims description 4
- 238000002790 cross-validation Methods 0.000 claims description 2
- 230000003993 interaction Effects 0.000 claims description 2
- 238000005259 measurement Methods 0.000 claims description 2
- 230000007246 mechanism Effects 0.000 claims description 2
- 238000010187 selection method Methods 0.000 claims description 2
- 229910052731 fluorine Inorganic materials 0.000 claims 1
- 125000001153 fluoro group Chemical group F* 0.000 claims 1
- 238000002474 experimental method Methods 0.000 abstract description 3
- 238000013528 artificial neural network Methods 0.000 description 5
- 238000012549 training Methods 0.000 description 5
- 230000002159 abnormal effect Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 230000006399 behavior Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 238000013145 classification model Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 235000019580 granularity Nutrition 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Tourism & Hospitality (AREA)
- Educational Administration (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
一种基于超图注意力网络的公共交通出行群体分类方法属于智能交通系统领域,旨在解决出行群体分类问题。首先,利用KNN(K‑NearestNeighbor)网络将公共交通个体出行特征数据构建出超图表示,其中节点表示出行个体,超边为KNN建模的出行个体间的属性拓扑关系;接下来使用超图注意力网络(HGAT)学习超图中节点的表示,共分为两步。第一步,用节点注意力来学习节点的特征表示。第二步,采用另一个聚合器来聚合节点的最终表示;最后,将节点的表示输入到线性层,进行出行群体的分类,并采用交叉熵损失来优化模型的预测能力。实验证明,本发明能够实现对于公共交通出行群体的精准分类,且准确度有了很大的提升。
Description
技术领域
本发明涉及一种基于超图注意力网络的公共交通出行群体分类方法,属于智能交通系统领域。
背景技术
随着城市公共交通的迅速发展以及智慧城市的建设,城市机动化水平不断提高,城市交通和环境压力不断增大,交通运营系统中暴露出许多问题。如出行高峰期乘客在站台等候时间过长,乘车过于拥挤带来的较差出行体验,客流在不同站点间分布不均衡等。这些问题给人们的出行带来极大不便利的同时也对轨道交通从业人员提出了巨大挑战。如何对公共交通个体出行特征数据进行深入分析,挖掘出其中潜在的规律性,进而对出行群体进行精准的画像分析和准确的分类任务成为了亟待解决的问题。这一技术的突破将有助于为轨道交通出行个体提供更合理的出行规划以及更好的出行体验。
对于轨道交通个体出行特征数据的分析研究关键点在于出行特征数据的量化形式以及分类的算法两部分。现有的研究对于数据特征的量化大多将其映射到公共的向量空间,忽略了不同特征之间信息水平的差异。而分类算法虽然在最近几年得到了广泛探索,引入了深度神经网络等技术,但是依旧忽略了数据中的高阶数据相关性,无法准确的学习出个体出行特征间潜在的关联关系。随着深度学习的图神经网络的深入研究,学者们开始将图结构引入到数据的表示中,以图的形式更精准的刻画出数据特征间的拓扑关系,并利用图神经网络来学习图的特征。这也为公共交通出行群体分类问题奠定了强大的理论基础。
发明内容
为了实现精准的公共交通出行群体的分类,本发明将超图引入到分类模型中,提出了一种基于超图注意力网络的公共交通出行群体分类方法。利用超图对个体出行特征数据进行建模,准确量化个体多源异构行为数据中隐含的高阶关联关系,再通过超图注意力网络学习超图中节点之间的重要性。
为实现上述问题,本发明包含以下步骤:
步骤一:利用KNN(K-Nearest Neighbor)算法构建出个体出行特征数据的超图表示。相比其他算法,KNN简洁明了,模型训练时间快,对异常值不敏感且预测效果好,因此本文选用KNN方法来构建超图。利用KNN算法构建超图关键点在于节点距离计算和K值的选取。对于距离计算问题,本文选取欧氏距离作为度量方式。个体出行特征数据具有d维特征,因此第i个出行个体对应的节点可表示为Xi=(xi1,xi2,…,xid)T。两个出行个体节点之间的特征相似度计算公式如下:
其中,D(·)表示计算欧氏距离,Xi,Xj分别表示出行个体i和出行个体j对应的节点特征。xih表示出行个体i的第h(1≤h≤d)个特征,xjh表示出行个体j的第h(1≤h≤d)个特征,d是出行个体的特征总数。对于K值的选取,本文采用交叉验证的方法,选取错误率最低(最优)的K值。在确定了KNN算法的节点距离计算方法和K值的选取方法后,我们就可以利用KNN分类算法构造出超图的超边。假设KNN分类结果为m类,则个体出行特征数据的超图表示为G=(V,ε),其中V={v1,v2,…,vn}为节点集,ε={e1,e2,…,em}为超边集,n为出行个体总数。
步骤二:利用超图注意力网络(HGAT)学习超图中节点的表示。超图注意力网络如图1中(HGAT)所示,主要分为节点注意力的计算和超边特征的聚合两个部分。首先,给定一个超图G,由于超边ej∈ε中所有节点对于超边的贡献并不相等,因此我们引入了节点级注意力机制来突出那些对于超边含义重要的节点,然后对它们进行聚合,来计算超边的表示:
其中,fj是第j个超边ej的超边表示,σ(·)为激活函数ReLU,hi是第i个节点vi的节点表示,W1为可训练权重矩阵(随机初始化得到),vi∈ej表示超边ej所关联的任意节点vi,αji为节点vi在超边ej中的注意力系数,计算方法为:
ui=LeakyReLU(W1hi)
up=LeakyReLU(W1hp)
其中,a1为权重向量(随机初始化得到),vp∈ej表示超边ej所关联的任意节点vp,W1为可训练权重矩阵(随机初始化得到),hi是第i个节点vi的节点表示,hp是第p个节点vp的节点表示,dis(·)表示计算欧氏距离,exp(·)表示计算指数函数,LeakyReLU(·)为激活函数。接下来,在获得超边的表示后,我们采用另一个聚合器来聚合节点的表示,由于节点与超边的交互都发生在相同的特征区间内,因此对于聚合过程中每个超边赋予相同的权重:
其中,是第i个节点vi聚合后的节点表示,W2为可训练权重矩阵(随机初始化得到),fj是第j个超边ej的超边表示。超图注意力网络不仅捕获了出行个体间的高阶特征的相关性,而且在节点表示学习中以不同粒度突了出关键信息。
步骤三:将步骤二学习到的节点特征表示输入到线性层,用以获取分类结果。线性层的计算方式如下:
步骤四:计算损失。由于本文主要是做公共交通出行群体分类任务,因此采用交叉熵损失作为本文的损失函数。交叉熵损失H(p,q)计算公式如下:
其中概率分布p(Y)为期望输出结果,q(Y)为实际输出结果。
步骤五:参数设置。在训练过程中,epoch数量设置为3500;学习率设置为0.005;输入向量的维数设置为3;训练集测试集分别为总数的70%和30%;节点维度为3;权重衰减值为0.001;dropout率设置为0.3。
有益效果
本发明解决了传统的分类方法中两大技术难点,一是对于数据特征的量化忽略了不同特征之间信息水平的差异问题,二是分类算法无法准确的学习出个体出行特征间潜在的关联关系问题。提高了公共交通出行群体分类的准确率。
附图说明
图1是本发明一种基于超图注意力网络的公共交通出行群体分类方法的网络结构图。
图2是本发明一个实施例的流程图。
具体实施方式
下面结合附图和实施例对本发明一种基于超图注意力网络的公共交通出行群体分类方法做进一步说明和详细描述。
本实施例详细阐述了本发明“一种基于超图注意力网络的公共交通出行群体分类方法”在公共交通出行群体分类任务中应用的完整过程。
具体实施时,实验使用的是公共交通个体出行特征数据集,该数据集是在2015年7至12月北京市公交和地铁刷卡记录原始数据集的基础上,经过分析提取出的个体出行特征数据。该数据包含了出行个体频繁访问站点、频繁出行时间、指定时间所访问的站点总数、局部异常因子等17个特征。其中选取了13800个出行个体的数据进行试验,这些个体分别隶属于三类出行群体,分别是通勤人员、普通市民以及出行行为异常人员。
实验是在一个带有11G内存的2080TIGPU服务器上进行的,在训练过程中,epoch数量设置为3500;学习率设置为0.005;输入向量的维数设置为3;训练集测试集分别为总数的70%和30%;节点维度为3;权重衰减值为0.001;dropout率设置为0.3。将以上数据输入如图1所示的模型中,得到预测结果。我们使用精准率、召回率、准确率三个指标来评估模型的有效性,其计算公式如下:
其中TP为判断为正向的正确率,TN为判断为负向的正确率,FP为误报率,即把负向判断成了正向,FN为漏报率,即把正向判断称了负向。
本发明将所提出基于超图注意力网络的公共交通出行群体分类方法(HypergraphAttention Network,HGAT)与以下五个分类方法进行比较,其中包括AdaBoost、K最邻近(K-NearestNeighbor,KNN)、支持向量机(support vector machines,SVM)、多图神经网络(Multi Graph Neural Network,MGNN)和超图神经网络(Hypergraph Neural Network,HGNN)。实验结果对比如下表所示,可以看出,相较于其他方法,本发明取得了更加精准的预测效果。
需要说明的是,以上所述内容及实施例只是为了配合本发明的技术方案的解释说明,并不等同于本发明局限于此实施例。凡是在本发明技术范围之内,且不违背发明实施例的思想,所完成的修改及同等替换,都应该在本发明的保护范围之内。
Claims (3)
1.一种基于超图注意力网络的公共交通出行群体分类方法包含以下步骤:
步骤一:利用KNN算法构建出个体出行特征数据的超图表示;
步骤二:利用超图注意力网络学习步骤一中构建的超图中节点的表示;
步骤三:将步骤二学习到的节点特征表示输入到线性层,用以获取分类结果;
步骤四:计算损失;由于主要是做公共交通出行群体分类任务,因此采用交叉熵损失作为的损失函数;
步骤一中对于出行特征数据的量化形式采用KNN算法构建出个体出行特征数据的超图表示;利用KNN算法构建超图关键点在于节点距离计算和K值的选取;对于距离计算问题,选取欧氏距离作为度量方式;个体出行特征数据具有d维特征,因此第i个出行个体对应的节点特征可表示为Xi=(xi1,xi2,…,xid)T;两个出行个体节点之间的特征相似度计算公式如下:
其中,D(·)表示计算欧氏距离,Xi,Xj分别表示出行个体i和出行个体j对应的节点特征;xih表示出行个体i的第h个特征,xjh表示出行个体j的第h个特征,其中1≤h≤d;d是出行个体的特征总数;对于K值的选取,采用交叉验证的方法,选取错误率最低的K值;在确定了KNN算法的节点距离计算方法和K值的选取方法后,就利用KNN分类算法构造出超图的超边;假设KNN分类结果为m类,则个体出行特征数据的超图表示为G=(V,ε),其中V={v1,v2,…,vn}为节点集,ε={e1,e2,…,em}为超边集,n为出行个体总数;
步骤二中利用超图注意力网络学习超图中节点的表示;超图注意力网络分为节点注意力的计算和超边特征的聚合两个部分;首先,给定一个超图G,由于超边ej∈ε中所有节点对于超边的贡献并不相等,因此引入了节点级注意力机制来突出那些对于超边含义重要的节点,然后对它们进行聚合,来计算超边的表示:
其中,fj是第j个超边ej的超边表示,σ(·)为激活函数ReLU,hi是第i个节点vi的节点表示,W1为可训练权重矩阵,vi∈ej表示超边ej所关联的任意节点vi,αji为节点vi在超边ej中的注意力系数,计算方法为:
ui=LeakyReLU(W1hi)
up=LeakyReLU(W1hp)
其中,a1为权重向量,vp∈ej表示超边ej所关联的任意节点vp,W1为可训练权重矩阵,hi是第i个节点vi的节点表示,hp是第p个节点vp的节点表示,dis(·)表示计算欧氏距离,exp(·)表示计算指数函数,LeakyReLU(·)为激活函数;接下来,在获得超边的表示后,采用另一个聚合器来聚合节点的表示,由于节点与超边的交互都发生在相同的特征区间内,因此对于聚合过程中每个超边赋予相同的权重:
其中,h`i是第i个节点vi聚合后的节点表示,W2为可训练权重矩阵,fj是第j个超边ej的超边表示。
2.根据权利要求1所述的基于超图注意力网络的公共交通出行群体分类方法,其特征在于对于步骤二学习到的节点特征表示,采用线性层获取分类结果;线性层的计算方式如下:
Y=h`iWT+bias
其中,h`i是第i个节点vi聚合后的节点表示,WT为权重矩阵,bias为偏置,Y则是最终分类结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210295276.1A CN115146695B (zh) | 2022-03-23 | 2022-03-23 | 一种基于超图注意力网络的公共交通出行群体分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210295276.1A CN115146695B (zh) | 2022-03-23 | 2022-03-23 | 一种基于超图注意力网络的公共交通出行群体分类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115146695A true CN115146695A (zh) | 2022-10-04 |
CN115146695B CN115146695B (zh) | 2024-04-02 |
Family
ID=83406252
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210295276.1A Active CN115146695B (zh) | 2022-03-23 | 2022-03-23 | 一种基于超图注意力网络的公共交通出行群体分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115146695B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020205029A (ja) * | 2019-06-17 | 2020-12-24 | 大連海事大学 | ブロードラーニングシステムに基づく高速ネットワーク表現学習の方法 |
CN113254652A (zh) * | 2021-07-01 | 2021-08-13 | 中南大学 | 一种基于超图注意力网络的社交媒体贴文真实性检测方法 |
CN113693563A (zh) * | 2021-08-27 | 2021-11-26 | 北京工业大学 | 一种基于超图注意力网络的脑功能网络分类方法 |
CN113919441A (zh) * | 2021-11-03 | 2022-01-11 | 北京工业大学 | 一种基于超图变换网络的分类方法 |
-
2022
- 2022-03-23 CN CN202210295276.1A patent/CN115146695B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020205029A (ja) * | 2019-06-17 | 2020-12-24 | 大連海事大学 | ブロードラーニングシステムに基づく高速ネットワーク表現学習の方法 |
CN113254652A (zh) * | 2021-07-01 | 2021-08-13 | 中南大学 | 一种基于超图注意力网络的社交媒体贴文真实性检测方法 |
CN113693563A (zh) * | 2021-08-27 | 2021-11-26 | 北京工业大学 | 一种基于超图注意力网络的脑功能网络分类方法 |
CN113919441A (zh) * | 2021-11-03 | 2022-01-11 | 北京工业大学 | 一种基于超图变换网络的分类方法 |
Non-Patent Citations (1)
Title |
---|
张志扬;张凤荔;陈学勤;王瑞锦;: "基于分层注意力的信息级联预测模型", 计算机科学, no. 06, 15 June 2020 (2020-06-15) * |
Also Published As
Publication number | Publication date |
---|---|
CN115146695B (zh) | 2024-04-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109142171B (zh) | 基于特征扩张的融合神经网络的城市pm10浓度预测方法 | |
CN107529651B (zh) | 一种基于深度学习的城市交通客流预测方法和设备 | |
Li et al. | Learning heterogeneous spatial-temporal representation for bike-sharing demand prediction | |
Zhang et al. | Semi-supervised hierarchical recurrent graph neural network for city-wide parking availability prediction | |
Li et al. | Notice of retraction: intelligent transportation system in Macao based on deep self-coding learning | |
Huang et al. | An intelligent multifeature statistical approach for the discrimination of driving conditions of a hybrid electric vehicle | |
Park et al. | Forecasting multiple-period freeway link travel times using modular neural networks | |
Yan et al. | Spatial-temporal chebyshev graph neural network for traffic flow prediction in iot-based its | |
Wang et al. | Efficient traffic estimation with multi-sourced data by parallel coupled hidden markov model | |
Ou et al. | Learn, assign, and search: real-time estimation of dynamic origin-destination flows using machine learning algorithms | |
Bhanu et al. | Embedding traffic network characteristics using tensor for improved traffic prediction | |
Ahmed et al. | Knowledge graph based trajectory outlier detection in sustainable smart cities | |
CN109086926B (zh) | 一种基于组合神经网络结构的短时轨道交通客流预测方法 | |
CN108921342A (zh) | 一种物流客户流失预测方法、介质和系统 | |
Xiong et al. | A Descriptive Bayesian Approach to Modeling and Calibrating Drivers' En Route Diversion Behavior | |
Dai et al. | Spatio-temporal deep learning framework for traffic speed forecasting in IoT | |
Xu et al. | Short‐term traffic flow prediction based on whale optimization algorithm optimized BiLSTM_Attention | |
CN115862324A (zh) | 一种智慧交通的时空同步图卷积神经网络及交通预测方法 | |
CN115730635A (zh) | 一种电动汽车负荷预测方法 | |
Shuai et al. | Relationship analysis of short-term origin–destination prediction performance and spatiotemporal characteristics in urban rail transit | |
Yang et al. | Predictability of short-term passengers’ origin and destination demands in urban rail transit | |
CN112529294A (zh) | 个体随机出行目的地预测模型的训练方法、介质和设备 | |
CN115146695B (zh) | 一种基于超图注意力网络的公共交通出行群体分类方法 | |
Wang et al. | Dynamic traffic prediction based on traffic flow mining | |
CN114463978B (zh) | 一种基于轨道交通信息处理终端的数据监测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |