CN115392554A - 基于深度图神经网络和环境融合的轨道客流预测方法 - Google Patents

基于深度图神经网络和环境融合的轨道客流预测方法 Download PDF

Info

Publication number
CN115392554A
CN115392554A CN202210985975.9A CN202210985975A CN115392554A CN 115392554 A CN115392554 A CN 115392554A CN 202210985975 A CN202210985975 A CN 202210985975A CN 115392554 A CN115392554 A CN 115392554A
Authority
CN
China
Prior art keywords
passenger flow
time
data
matrix
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210985975.9A
Other languages
English (en)
Inventor
李之红
王晓雨
邱世尧
许晗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Civil Engineering and Architecture
Original Assignee
Beijing University of Civil Engineering and Architecture
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Civil Engineering and Architecture filed Critical Beijing University of Civil Engineering and Architecture
Priority to CN202210985975.9A priority Critical patent/CN115392554A/zh
Publication of CN115392554A publication Critical patent/CN115392554A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • G06Q50/40

Abstract

本发明涉及城市轨道交通客流数据分析技术领域,提供一种基于深度图神经网络和环境融合的轨道客流预测方法,包括:将乘客进站量数据集与外部环境影响因素数据集耦合,耦合后分为训练集和测试集;利用训练集对时空图卷积模型训练,获得第一预测客流量数据;计算第一预测客流量数据与真实客流量数据之间损失,优化时空图卷积模型;将测试集输入优化的时空图卷积模型,获得第二预测客流量数据;计算第二预测客流量数据和真实客流量数据之间损失,将该损失与前一损失对比判断优化后的时空图卷积模型是否出现欠拟合或者过拟合,若是,则调整模型的超参数,直至不再出现欠拟合或者过拟合,然后利用调整好超参数的模型对待测的乘客进站量进行预测。

Description

基于深度图神经网络和环境融合的轨道客流预测方法
技术领域
本发明涉及城市轨道交通客流数据分析技术领域,尤其涉及一种基于深度图神经网络和环境融合的轨道客流预测方法、系统、电子设备以及计算机可读存储介质。
背景技术
近年来,我国城市轨道交通由大规模建设转为大规模安全服役阶段,轨道交通网络规模不断扩大,客流运营与管理压力日益提升,轨道交通网络供给与客流需求运力匹配的协调至关重要。在当前新技术、新算法和新理念的综合加持下,轨道交通系统迎来了一大波创新性的研究成果,轨道交通客流预测方法的研究也受到广泛的关注。准确的客流预测在轨道交通列车调控、轨道交通警报发布、服务效率提升的工作中起到至关重要的作用。然而,在城市轨道交通客流规模扩张和城市用地布局多变的复杂环境下,轨道交通“网-线-站”多粒度动态客流预测非常困难,同时在外部因素的干扰下,例如环境因素、节假日、大型活动等,高度的非线性和不确定性给客流预测带来了严峻的挑战。因此,构建融合巨量异构客流和复杂外在因素的轨道交通高精度预测模型是极为迫切。
目前,国内外在轨道交通乘客出行特征的研究中完成了丰富的工作,但是将乘客区域出行特征融合客流预测工作的较少。在轨道交通客流预测中,网络中站点的随地理位置的不同,具有的客流分布特征不同,且受周围例如重大活动、极端天气等影响时客流产生突变,整体客流是非线性的,基于数理统计分析的预测模型在面对较大变动的客流时往往不能实现良好的预测效果。在基于数理统计分析和浅层机器学习的模型中,通常需要通过组合模型进行交通预测工作以达到高精度的预测效果,且面对的预测对象为单条道路或者单个站点,在整个轨道线网中通常不能进行高精度的预测。
数据源是轨道交通客流预测的关键基础,面对海量多源数据,数据的整理、清洗、特征提取和建模等各个环节都异常重要。以往的研究也尝试利用地铁AFC系统数据基于K-means算法挖掘典型站点的客流分布特征,定义了上海市各个站点的站点属性特征;基于分时降雨量数据和OD客流数据,利用Prophet模型对降雨天气下的进站客流做预测分析等,但是将乘客区域出行特征融合客流预测工作的较少。
现有技术中,有的学者将AR模型与卷积神经网络和深度神经网络组合,提出一种卷积神经网络-循环神经网络-自回归(CNN-LSTM-AR)模型,该模型可以同时处理客流量中线性和非线性特征从而进行高精度预测;在2003年首次将非参数回归的方法应用于交通流量预测中,并对基础的非参数回归方法进行改进,引入密集度变k算法和基于动态聚类的历史数据分析算法;有人对比了K近邻非参数回归模型以及贝叶斯组合模型在早高峰、平峰、晚高峰以及全天客流量分布中的预测性能等。然而在轨道交通客流预测中,网络中站点的随地理位置的不同,具有的客流分布特征不同,且受周围例如重大活动、极端天气等影响时客流产生突变,整体客流是非线性的,基于数理统计分析的预测模型在面对较大变动的客流时往往不能实现良好的预测效果。有人为了处理客流异常值情况下的城市轨道交通客流预测问题,提出了一种基于支持向量回归机(SVR)和长短时记忆神经网络(LSTM)模型融合的组合模型SVR-LSTM,输入特征为异常情况下乘客的进站时间序列来反应客流的异常波动。但浅层机器学习的模型中,通常需要通过组合模型进行交通预测工作以达到高精度的预测效果,且面对的预测对象为单条道路或者单个站点,在整个轨道线网中通常不能进行高精度的预测。
基于深度学习的方法主要分为循环神经网络模型(Rerrent Neural Network,RNN)和卷积神经网络(Convolutional Neural Network, CNN)。在循环神经网络的研究中,早期的循环神经网络模型主要为RNN模型,经过研究发展,RNN模型的变种长短时记忆神经网络LSTM模型和门循环控制单元GRU模型被广泛应用到时间序列预测工作之中。有人给交通量数据中加入噪音数据,探究RNN模型对时间序列中噪音数据的预测性能,提出了一种双向RNN模型Bi-RNN,并对RNN中多对一、多对多和Encoder-Decoder框架做了对比试验,最终在Bi-RNN选择了多对多的框架;而有人提出了一种由变分模态分解和GRU组合的改进门循环控制单元模型VMD-GRU,模型通过VMD模块对轨道交通客流时间序列进行分解,减少序列中的噪音数据,使整体客流分布区间更加平顺,进而利用GRU模块进行预测工作,但依然只能对单一路段预测不能对多路段预测;在卷积神经网络的研究中,学者们突破了以往客流交通流预测在单一路段束缚,将预测范围延展为区域预测,其中有人建立了一种卷积神经网络和循环神经网络组合的模型CNN-BiLSTM,模型通过对网格状区域划分的道路网络进行预测,利用CNN模块捕捉不同区域之间的关联性,将区域属性联通交通量时间序列数据输入BiLSTM模块进行预测工作;还有人研究了大规模交通流的预测工作,提出了一种基于TF-3DNet的三维卷积网络3DCNN实现对网络交通流的预测,其模型主要利用3D卷积核同时提取区域交通流中的时间和空间特征从而进行预测工作。虽然在基于深度学习的模型中,深度模型单体总体显示了高于数理统计分析和浅层机器学习模型的预测性能,且在融合CNN模块后可以进行区域性的预测工作,但是CNN的局限性在于其结构只能针对规则的网格结构进行空间特征的提取,这也就是学者们在基于CNN模型的研究中大多预测对象对可以将道路划分为网格结构的交通流数据,在轨道交通网络中各个站点之间呈现明显的非欧结构,无法使用CNN模型作为其预测框架,也不能加入环境要素例如节假日、天气等环境因素对轨道交通客流影响。
发明内容
本发明的目的在于解决背景技术中的至少一个技术问题,提供一种基于深度图神经网络和环境融合的轨道客流预测方法、系统、电子设备和计算机可读存储介质。
本发明提出一种可以借助图邻接矩阵进行网络拓扑模型学习的图卷积神经网络(GCN)模型,该模型可以根据轨道交通网络拓扑结构进行站点间空间关系的学习,将基于区域预测的深度学习模型应用于轨道交通客流预测领域;以此为出发点,进一步采用轨道交通进出站刷卡数据(AFC数据,Automatic Fare Collection)和外部的环境数据,以城市轨道交通网络和站点的客流为研究对象,开展轨道交通乘客出行特征分析、短时客流预测方法等方面的基础理论和应用方法研究,构建了融合复杂外在因素的客流预测模型-强相关性外界因素耦合的强化特征客流预测模型(GCN Passenger flow forecasting modelintegrating complex external strong correlation factors,IEF-BT-GCN),将时空加强特征和环境影响因素特征与进站客流量的时间序列进行融合进行基于多维度特征的客流预测工作。模型在计算过程中经过1000次迭代即可收敛,大大减少了迭代次数,其预测性能在短期预测有着最好的表现;面对低进站客流值的站点时预测效果与基线模型相比精度大幅提高,在进站客流分布有明显周期性的站点中对峰值的把握相对基线模型有一定提升;在极端天气和节假日的预测中,IEF-BT-GCN模型面对节假日的客流突变时在假期中客流峰值的预测中精度相比基线模型有所提升,在极端天气对客流影响的捕捉中精度相比基线模型提升明显。
为实现上述发明目的,本发明提供一种基于深度图神经网络和环境融合的轨道客流预测方法,包括:
获取轨道线网乘客进站量数据集,将所述轨道线网乘客进站量数据集与外部环境影响因素数据集进行耦合,将耦合后的矩阵数据分为训练集和测试集;
采用时空图卷积模型,利用所述训练集对所述时空图卷积模型进行训练,获得第一预测客流量数据;
计算所述第一预测客流量数据与真实客流量数据之间的损失,优化所述时空图卷积模型;
将所述测试集输入完成优化的所述时空图卷积模型,获得第二预测客流量数据;
计算所述第二预测客流量数据和真实客流量数据之间的损失,将该损失与所述第一预测客流量数据与真实客流量数据之间的损失进行对比判断优化后的所述时空图卷积模型是否出现欠拟合或者过拟合现象,若是,则调整完成优化的所述时空图卷积模型的超参数,调整后再对所述测试集进行测试,直至不再出现欠拟合或者过拟合现象;
利用调整好超参数的所述时空图卷积模型对待测的轨道线网乘客进站量进行预测。
根据本发明的一个方面,所述外部环境影响因素数据集包括:站点类别特征数据、时间强化特征数据、节假日影响特征数据和天气影响特征数据。
根据本发明的一个方面,将所述轨道线网乘客进站量数据集与外部环境影响因素数据集进行耦合的方法为:
根据所述外部环境影响因素数据集构建外部影响因素矩阵
Figure 275945DEST_PATH_IMAGE001
根据所述轨道线网乘客进站量数据集构建线网进站客流量特征矩阵Z;
将外部影响因素矩阵
Figure 357646DEST_PATH_IMAGE002
与线网进站客流量特征矩阵Z进行耦合得到外界因素耦合矩阵IEF=[F,Z];
其中,
Figure 323328DEST_PATH_IMAGE003
值为输入外部因素类别数量,
Figure 177015DEST_PATH_IMAGE004
为F第
Figure 163425DEST_PATH_IMAGE005
类外部影响因素矩阵,i取1、2···m,
Figure 469773DEST_PATH_IMAGE006
,当
Figure 707987DEST_PATH_IMAGE007
时表示第i类外部影响因素随着时间变化会发生变化,其矩阵形式为
Figure 806393DEST_PATH_IMAGE008
,其中
Figure 839071DEST_PATH_IMAGE009
为时间序列长度,
Figure 632715DEST_PATH_IMAGE010
为轨道线网站点数量;
Figure 799254DEST_PATH_IMAGE011
表示在外部影响因素为i、第n个轨道线网站点、时间为t时的特征值;当
Figure 627533DEST_PATH_IMAGE012
时表示第i类外部影响因素与时间变化无关,其矩阵形式为
Figure 99621DEST_PATH_IMAGE013
;T表示矩阵的转置;
Figure 380561DEST_PATH_IMAGE014
表示在外部影响因素为i,第n个轨道线网站点时的特征值;其中线网进站客流量特征矩阵Z为:
Figure 85212DEST_PATH_IMAGE015
,其中
Figure 502418DEST_PATH_IMAGE016
代表a车站b时刻的客流量。
根据本发明的一个方面,所述站点类别特征数据的提取方法为:
Figure 408057DEST_PATH_IMAGE017
Figure 35347DEST_PATH_IMAGE018
Figure 419055DEST_PATH_IMAGE019
重复计算每个样本到
Figure 956347DEST_PATH_IMAGE020
的欧氏距离并更新
Figure 767308DEST_PATH_IMAGE020
,直到
Figure 147474DEST_PATH_IMAGE021
值收敛或者达到设置的迭代次数;对每个站点的特征区别定义为早晚高峰以及平峰占全天客流量百分比差异,分别提取每个站点对应时段的进站客流量并以站点序号排序,利用K-means函数进行基于不同时段进站客流占比的站点分类获得所述站点类别特征数据;
其中,
Figure 334873DEST_PATH_IMAGE020
为k个聚类中心之间的欧氏距离,L=1,2…k,L为聚类中心数量;
Figure 723741DEST_PATH_IMAGE022
为每个聚类中心周围相似对象组成簇;SSE为误差平方准则;x为
Figure 705604DEST_PATH_IMAGE022
任选的相似对象组成簇;
Figure 573066DEST_PATH_IMAGE023
为范数;
Figure 298576DEST_PATH_IMAGE024
表示的是所有样本各自的轮廓系数;max()为最大值函数,表示取其中最大的值;
Figure 810460DEST_PATH_IMAGE025
表示的是某样本点与同簇样本平均距离和凝聚度;
Figure 963224DEST_PATH_IMAGE026
表示的是某样本点与相邻簇全部样本的平均距离和分离度;
Figure 52403DEST_PATH_IMAGE027
表示的是平均轮廓系数,取值范围在[-1,1]之间;n为轮廓系数取值样本数。
根据本发明的一个方面,所述时间强化特征数据的提取方法为:基于时间构建时间特征参数,其中,时间特征参数以时间的时位和分钟位顺序排列构成。
根据本发明的一个方面,所述天气影响特征数据的提取方法为:通过相关性分析来找出降雨量、最高气温、最低气温和空气质量中与轨道线网乘客进站量有强相关性的因素作为天气影响因素的特征值;
所述相关性分析通过筛选轨道线网乘客进站量与降雨量、最高气温、最低气温和空气质量的皮尔逊相关系数实现,公式为:
Figure 316025DEST_PATH_IMAGE028
其中,X和Y分为两组待挖掘隐藏关系的数列,X为轨道线网乘客进站量、降雨量、最高气温、最低气温和空气质量中的任一种,Y为轨道线网乘客进站量、降雨量、最高气温、最低气温和空气质量中的任一种,
Figure 682415DEST_PATH_IMAGE029
为相关系数,表示相关性大小,cov代表的是X和Y之间的协方差,
Figure 396293DEST_PATH_IMAGE030
Figure 848134DEST_PATH_IMAGE031
分别为数列X和Y之间的标准差。
根据本发明的一个方面,所述节假日影响特征数据的提取方法为:将工作日定义为特征值1,将法定公休日定义为特征值2,将法定节假日定义为特征值3。
根据本发明的一个方面,所述时空图卷积模型包括图卷积网络GCN层、双向长短时记忆神经网络BiLSTM层、激活层和损失函数计算层。
根据本发明的一个方面,所述图卷积网络GCN层将轨道线网所有站点的乘客进站量提取出空间维度的特征,计算公式为:
选择2层图卷积作为图卷积网络GCN层属性,
Figure 664517DEST_PATH_IMAGE032
Figure 275627DEST_PATH_IMAGE033
Figure 770193DEST_PATH_IMAGE034
Figure 443751DEST_PATH_IMAGE035
Figure 580334DEST_PATH_IMAGE036
Figure 45951DEST_PATH_IMAGE037
其中,D表示度矩阵,对角线上的元素为图中各个顶点的度,
Figure 445839DEST_PATH_IMAGE038
表示每个顶点的度;A表示以轨道交通线网为基础建立的邻接矩阵;
Figure 872272DEST_PATH_IMAGE039
表示邻接矩阵A上B行G列的值;B表示矩阵的第B行;G表示矩阵的第G列;
Figure 546967DEST_PATH_IMAGE040
为优化后的邻接矩阵;
Figure 601511DEST_PATH_IMAGE041
为优化后的度矩阵;
Figure 703459DEST_PATH_IMAGE042
为单位矩阵;L表示拉普拉斯矩阵;U表示是拉普拉斯矩阵经过特征值分解得到的正交矩阵;
Figure 614259DEST_PATH_IMAGE043
是矩阵U的转置,T为转置符号;
Figure 686120DEST_PATH_IMAGE044
为n个特征值构成的对角阵;
Figure 1695DEST_PATH_IMAGE045
为特征值;
Figure 8965DEST_PATH_IMAGE046
表示第l层的特征矩阵;
Figure 409991DEST_PATH_IMAGE047
表示在特定层L层中的可训练权重矩阵;
Figure 285543DEST_PATH_IMAGE048
为线网进站客流量特征矩阵;
Figure 455624DEST_PATH_IMAGE049
表示激活函数。
根据本发明的一个方面,所述双向长短时记忆神经网络BiLSTM层对融合了所述空间维度的特征的乘客进站量提取出时间维度的特征,其中单向的LSTM模型计算公式为:
Figure 633796DEST_PATH_IMAGE050
Figure 381172DEST_PATH_IMAGE051
Figure 935781DEST_PATH_IMAGE052
Figure 960369DEST_PATH_IMAGE053
Figure 577951DEST_PATH_IMAGE054
Figure 812623DEST_PATH_IMAGE055
其中,
Figure 639765DEST_PATH_IMAGE056
表示遗忘层输出的遗忘权重结果;
Figure 784438DEST_PATH_IMAGE057
为遗忘门中
Figure 429046DEST_PATH_IMAGE058
Figure 26381DEST_PATH_IMAGE059
的权重矩阵;
Figure 922792DEST_PATH_IMAGE060
表示t时刻2层图神经网络输出的隐藏层的隐藏状态;
Figure 781027DEST_PATH_IMAGE061
为当前时刻输入的外部特征序列;
Figure 3061DEST_PATH_IMAGE062
为遗忘门中的偏置参数;
Figure 822112DEST_PATH_IMAGE063
表示记忆层输出的记忆权重结果;
Figure 522215DEST_PATH_IMAGE064
为记忆门中
Figure 500535DEST_PATH_IMAGE058
Figure 359383DEST_PATH_IMAGE059
的权重矩阵;
Figure 665730DEST_PATH_IMAGE065
为记忆门中的偏置参数;
Figure 28578DEST_PATH_IMAGE066
表示描述当前细胞记忆状态的参数;sigmoid、tanh为激活函数;
Figure 2351DEST_PATH_IMAGE067
表示记忆细胞状态储存单元中
Figure 35029DEST_PATH_IMAGE058
Figure 953306DEST_PATH_IMAGE059
的权重矩阵;
Figure 260791DEST_PATH_IMAGE068
表示记忆细胞状态储存单元中的偏置参数;
Figure 823490DEST_PATH_IMAGE069
表示t-1时刻的记忆状态;
Figure 27069DEST_PATH_IMAGE070
表示当前时刻的记忆状态;
Figure 432643DEST_PATH_IMAGE071
表示输出层输出的遗忘权重结果;
Figure 278239DEST_PATH_IMAGE072
为输出门中
Figure 952235DEST_PATH_IMAGE058
Figure 451350DEST_PATH_IMAGE059
的权重矩阵;
Figure 219586DEST_PATH_IMAGE073
为输出门中的偏置参数;
Figure 603294DEST_PATH_IMAGE074
表示模型t时刻的输出;
将正反两个方向的LSTM模型输出
Figure 140585DEST_PATH_IMAGE075
Figure 76180DEST_PATH_IMAGE076
结合得到BiLSTM输出;
Figure 331712DEST_PATH_IMAGE077
其中,
Figure 987953DEST_PATH_IMAGE078
表示BiLSTM模型t时刻的输出。
根据本发明的一个方面,所述激活层为全连接层,全连接层将BiLSTM输出的多维向量进行维度转变,最终得到所需维度进行输出,计算过程如以下公式:
Figure 910909DEST_PATH_IMAGE079
其中,y表示记
Figure 17406DEST_PATH_IMAGE080
时刻输出的进站客流预测值;Q为总时间步长。
根据本发明的一个方面,所述损失函数计算层采用损失函数loss计算预测客流量数据与真实客流量数据之间的损失,计算公式为:
Figure 760234DEST_PATH_IMAGE081
其中,
Figure 482815DEST_PATH_IMAGE082
为预测客流量数据,
Figure 853753DEST_PATH_IMAGE083
为真实客流量数据,
Figure 6517DEST_PATH_IMAGE084
为正则化系数,
Figure 971062DEST_PATH_IMAGE085
为L2正则化项。
为实现上述目的,本发明还提供一种基于深度图神经网络和环境融合的轨道客流预测系统,包括:
数据获取模块,获取轨道线网乘客进站量数据集,将所述轨道线网乘客进站量数据集与外部环境影响因素数据集进行耦合,将耦合后的矩阵数据分为训练集和测试集;
模型训练模块,采用时空图卷积模型,利用所述训练集对所述时空图卷积模型进行训练,获得第一预测客流量数据;
模型优化模块,计算所述第一预测客流量数据与真实客流量数据之间的损失,优化所述时空图卷积模型;
客流量预测模块,将所述测试集输入完成优化的所述时空图卷积模型,获得第二预测客流量数据;
客流量校准模块,计算所述第二预测客流量数据和真实客流量数据之间的损失,将该损失与所述第一预测客流量数据与真实客流量数据之间的损失进行对比判断优化后的所述时空图卷积模型是否出现欠拟合或者过拟合现象,若是,则调整完成优化的所述时空图卷积模型的超参数,调整后再对所述测试集进行测试,直至不再出现欠拟合或者过拟合现象;
实际客流量预测模块,利用调整好超参数的所述时空图卷积模型对待测的轨道线网乘客进站量进行预测。
为实现上述目的,本发明还提供一种电子设备,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现上述基于深度图神经网络和环境融合的轨道客流预测方法。
为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现上述基于深度图神经网络和环境融合的轨道客流预测方法。
根据本发明的方案,IEF-BT-GCN模型大大减少了迭代次数,其预测性能在短期预测有着最好的表现;IEF-BT-GCN模型面对低进站客流值的站点时预测效果与基线模型相比精度大幅提高;IEF-BT-GCN模型在极端天气和节假日的预测中,该模型面对节假日的客流突变时在假期中客流峰值的预测中精度相比基线模型有所提升,在极端天气对客流影响的捕捉中精度相比基线模型提升明显。
根据本发明的方案,本发明提出的是考虑低进站客流或者高进站客流特征和外部环境影响的轨道交通路网客流的预测方法。结合GCN模型(图卷积网络模型)可以捕捉轨道交通线网站点间空间关系的优点和BiLSTM模型(双向长短时记忆神经网络模型)对时间序列数据高精度预测优点,构建轨道交通客流短时预测模型框架BT-GCN。考虑轨道交通时空特征,外部环境影响因素数据特征,捕捉历史进站客流数据与当前时刻进站客流量的相关程度并将相关程度以权重的形式表示。本发明所提模型可以综合考虑进站客流时空特征和外部环境影响因素特征并以历史数据相关时间点对时空属性进行加强工作,从而进行准确的客流预测。
本发明依靠神经网络,将快速获得的规定时间段内各个站点的进出站客流数据映射到高维特征空间中的特性进行各种特征的学习,得到不同时间和不同站点之间的相关特征值。本发明提出的IEF-BT-GCN模型是由BT-GCN和特征耦合IEF两个模块组成的神经网络模型。该模型用于轨道交通客流预测,在传统的轨道交通线网客流预测工作中增加对历史数据特征和外部影响特征的增强工作,进一步提升时空图卷积模型在轨道交通线网客流预测中的精度。本发明一方面提高了中短期进站客流预测的稳定性,另一方面在面对客流峰值以及非周期性客流变化时模型预测精度高于BT-GCN模型,且在低进站客流值情况下预测精度提高更加明显。这对轨道交通列车调控、轨道交通警报发布、以及服务效率提升的工作中起到至关重要的作用。
附图说明
图1示意性表示根据本发明的一种实施方式的基于深度图神经网络和环境融合的轨道客流预测方法的流程图;
图2示意性表示IEF-BT-GCN模型的结构图;
图3示意性表示根据本发明的一种实施方式的基于深度图神经网络和环境融合的轨道客流预测系统的结构框图;
图4表示不同隐藏单元数下平均绝对误差(MAE)、均方根误差(RMSE)对比图;
图5表示不同隐藏单元数下准确度(accuracy)、决定系数(R2)和可释方差得分(EVS)对比图;
图6表示不同预测时长下IEF-BT-GCN模型RMSE变化图;
图7表示不同预测时长下IEF-BT-GCN模型MAE变化图。
具体实施方式
现在将参照示例性实施例来论述本发明的内容。应当理解,论述的实施例仅是为了使得本领域普通技术人员能够更好地理解且因此实现本发明的内容,而不是暗示对本发明的范围的任何限制。
如本文中所使用的,术语“包括”及其变体要被解读为意味着“包括但不限于”的开放式术语。术语“基于”要被解读为“至少部分地基于”。术语“一个实施例”和“一种实施例”要被解读为“至少一个实施例”。
图1示意性表示根据本发明的一种实施方式的基于深度图神经网络和环境融合的轨道客流预测方法的流程图。如图1所示,基于深度图神经网络和环境融合的轨道客流预测方法,包括:
获取轨道线网乘客进站量数据集,将所述轨道线网乘客进站量数据集与外部环境影响因素数据集进行耦合,将耦合后的矩阵数据分为训练集和测试集;
采用时空图卷积模型,利用所述训练集对所述时空图卷积模型进行训练,获得第一预测客流量数据;
计算所述第一预测客流量数据与真实客流量数据之间的损失,优化所述时空图卷积模型;
将所述测试集输入完成优化的所述时空图卷积模型,获得第二预测客流量数据;
计算所述第二预测客流量数据和真实客流量数据之间的损失,将该损失与所述第一预测客流量数据与真实客流量数据之间的损失进行对比判断优化后的所述时空图卷积模型是否出现欠拟合或者过拟合现象,若是,则调整完成优化的所述时空图卷积模型的超参数,调整后再对所述测试集进行测试,直至不再出现欠拟合或者过拟合现象;
利用调整好超参数的所述时空图卷积模型对待测的轨道线网乘客进站量进行预测。
根据本发明的一种实施方式,基于研究区域内地铁运营AFC系统收集的乘客进出站数据,通过以15min粒度为单位的客流聚合工作,得到轨道线网乘客进站量数据集。外部环境影响因素数据集包括:站点类别特征数据、时间强化特征数据、节假日影响特征数据和天气影响特征数据。
其中,站点类别特征数据的提取方法为:
Figure 500263DEST_PATH_IMAGE086
Figure 991287DEST_PATH_IMAGE087
Figure 314952DEST_PATH_IMAGE088
重复计算每个样本到
Figure 32373DEST_PATH_IMAGE089
的欧氏距离并更新
Figure 958740DEST_PATH_IMAGE089
,直到
Figure 179637DEST_PATH_IMAGE090
值收敛或者达到设置的迭代次数;对每个站点的特征区别定义为早晚高峰以及平峰占全天客流量百分比差异,分别提取每个站点对应时段的进站客流量并以站点序号排序,利用K-means函数进行基于不同时段进站客流占比的站点分类获得所述站点类别特征数据;
其中,
Figure 939783DEST_PATH_IMAGE089
为k个聚类中心之间的欧氏距离,L=1,2…k,L为聚类中心数量;
Figure 881850DEST_PATH_IMAGE091
为每个聚类中心周围相似对象组成簇;
Figure 877488DEST_PATH_IMAGE090
为误差平方准则;x为
Figure 952891DEST_PATH_IMAGE091
任选的相似对象组成簇;
Figure 618359DEST_PATH_IMAGE092
为范数;
Figure 169426DEST_PATH_IMAGE093
表示的是所有样本各自的轮廓系数;max()为最大值函数,表示取其中最大的值;
Figure 578542DEST_PATH_IMAGE094
表示的是某样本点与同簇样本平均距离和凝聚度;
Figure 508451DEST_PATH_IMAGE095
表示的是某样本点与相邻簇全部样本的平均距离和分离度;
Figure 735033DEST_PATH_IMAGE096
表示的是平均轮廓系数,取值范围在
Figure 648763DEST_PATH_IMAGE097
之间;n为轮廓系数取值样本数。
时间强化特征数据的提取方法为:基于时间构建时间特征参数,其中,时间特征参数以时间的时位和分钟位顺序排列构成。例如下表1中所示:
Figure 861569DEST_PATH_IMAGE098
表1
天气影响特征数据的提取方法为:通过相关性分析来找出降雨量、最高气温、最低气温和空气质量中与轨道线网乘客进站量有强相关性的因素作为天气影响因素的特征值;
相关性分析通过筛选轨道线网乘客进站量与降雨量、最高气温、最低气温和空气质量的皮尔逊相关系数实现,公式为:
Figure 911565DEST_PATH_IMAGE099
其中,X和Y分为两组待挖掘隐藏关系的数列,X为轨道线网乘客进站量、降雨量、最高气温、最低气温和空气质量中的任一种,Y为轨道线网乘客进站量、降雨量、最高气温、最低气温和空气质量中的任一种,
Figure 43469DEST_PATH_IMAGE100
为相关系数,表示相关性大小,cov代表的是X和Y之间的协方差,
Figure 441565DEST_PATH_IMAGE101
Figure 192483DEST_PATH_IMAGE102
分别为数列X和Y之间的标准差。
在本实施方式中,根据相关性系数计算结果,选降雨量、最高气温、最低气温和空气质量中与线网总进站客流量呈现相关性且相关系数最大的天气因素(即强相关性因素)作为天气影响因素的输入特征,其特征以日为单位。
节假日影响特征数据的提取方法为:将工作日定义为特征值1,将法定公休日定义为特征值2,将法定节假日定义为特征值3。其中,特征值1、特征值2和特征值3用于计算,即将每一日定义为一种数值,作为特征值加入外界因素耦合矩阵中。
进一步地,在本实施方式中,将轨道线网乘客进站量数据集与外部环境影响因素数据集进行耦合的方法为:
根据外部环境影响因素数据集构建外部影响因素矩阵
Figure 362565DEST_PATH_IMAGE103
根据轨道线网乘客进站量数据集构建线网进站客流量特征矩阵Z;
将外部影响因素矩阵
Figure 399791DEST_PATH_IMAGE002
与线网进站客流量特征矩阵Z进行耦合得到外界因素耦合矩阵IEF=[F,Z];
其中,m值为输入外部因素类别数量,
Figure 553691DEST_PATH_IMAGE104
Figure 842721DEST_PATH_IMAGE002
中第
Figure 991943DEST_PATH_IMAGE005
类外部影响因素矩阵,i取1、2···m,
Figure 606595DEST_PATH_IMAGE105
,当
Figure 982213DEST_PATH_IMAGE106
时表示第i类外部影响因素随着时间变化会发生变化,其矩阵形式为
Figure 809355DEST_PATH_IMAGE107
,其中
Figure 78662DEST_PATH_IMAGE009
为时间序列长度,
Figure 691364DEST_PATH_IMAGE010
为轨道线网站点数量;
Figure 288698DEST_PATH_IMAGE108
表示在外部影响因素为i、第n个轨道线网站点、时间为t时的特征值;当
Figure 185110DEST_PATH_IMAGE109
时表示第i类外部影响因素与时间变化无关,其矩阵形式为
Figure 43345DEST_PATH_IMAGE110
;T表示矩阵的转置;
Figure 999799DEST_PATH_IMAGE111
表示在外部影响因素为i,第n个轨道线网站点时的特征值;其中线网进站客流量特征矩阵Z为:
Figure 84430DEST_PATH_IMAGE112
,其中
Figure 518954DEST_PATH_IMAGE113
代表a车站b时刻的客流量。
进一步地,根据本发明的一种实施方式,时空图卷积模型包括图卷积网络GCN层、双向长短时记忆神经网络BiLSTM层、激活层和损失函数计算层,图2表示时空图卷积模型的结构图(BT-GCN)。
其中,将研究实践范围内每个时间段轨道交通线网所有站点的进站客流客流量矩阵X作为输入信息送入图卷积网络GCN层进行空间维度的特征提取工作,在本实施方式中,选择2层图卷积作为图卷积网络GCN层属性,其计算公式如下:
Figure 231695DEST_PATH_IMAGE114
Figure 359051DEST_PATH_IMAGE115
Figure 930977DEST_PATH_IMAGE116
Figure 293826DEST_PATH_IMAGE035
Figure 999089DEST_PATH_IMAGE117
Figure 297346DEST_PATH_IMAGE037
其中,D表示度矩阵,对角线上的元素为图中各个顶点的度,
Figure 215624DEST_PATH_IMAGE038
表示每个顶点的度;A表示以轨道交通线网为基础建立的邻接矩阵;
Figure 991950DEST_PATH_IMAGE039
表示邻接矩阵A上B行G列的值;B表示矩阵的第B行;G表示矩阵的第G列;
Figure 820229DEST_PATH_IMAGE040
为优化后的邻接矩阵;
Figure 148442DEST_PATH_IMAGE041
为优化后的度矩阵;
Figure 429381DEST_PATH_IMAGE042
为单位矩阵;L表示拉普拉斯矩阵;U表示是拉普拉斯矩阵经过特征值分解得到的正交矩阵;
Figure 274978DEST_PATH_IMAGE043
是矩阵U的转置,T为转置符号;
Figure 957763DEST_PATH_IMAGE044
为n个特征值构成的对角阵;
Figure 722457DEST_PATH_IMAGE118
为特征值;
Figure 490692DEST_PATH_IMAGE119
表示第l层的特征矩阵;
Figure 611751DEST_PATH_IMAGE047
表示在特定层L层中的可训练权重矩阵;
Figure 414622DEST_PATH_IMAGE048
为线网进站客流量特征矩阵;
Figure 84638DEST_PATH_IMAGE049
表示激活函数。
进一步地,在本实施方式中,双向长短时记忆神经网络BiLSTM层对融合了所述空间维度的特征的客流量提取出时间维度的特征,此时双向长短时记忆神经网络BiLSTM层中的单项LSTM模型三个门控制单元公式采用以下公式:
Figure 340169DEST_PATH_IMAGE050
Figure 527568DEST_PATH_IMAGE051
Figure 184946DEST_PATH_IMAGE052
Figure 25863DEST_PATH_IMAGE053
Figure 34270DEST_PATH_IMAGE054
Figure 759781DEST_PATH_IMAGE055
其中,
Figure 271665DEST_PATH_IMAGE056
表示遗忘层输出的遗忘权重结果;
Figure 549062DEST_PATH_IMAGE057
为遗忘门中
Figure 245098DEST_PATH_IMAGE058
Figure 774300DEST_PATH_IMAGE059
的权重矩阵;
Figure 265324DEST_PATH_IMAGE060
表示t时刻2层图神经网络输出的隐藏层的隐藏状态;
Figure 588989DEST_PATH_IMAGE061
为当前时刻输入的外部特征序列;
Figure 306409DEST_PATH_IMAGE062
为遗忘门中的偏置参数;
Figure 373722DEST_PATH_IMAGE063
表示记忆层输出的记忆权重结果;
Figure 453674DEST_PATH_IMAGE064
为记忆门中
Figure 213819DEST_PATH_IMAGE058
Figure 152957DEST_PATH_IMAGE059
的权重矩阵;
Figure 617436DEST_PATH_IMAGE065
为记忆门中的偏置参数;
Figure 958419DEST_PATH_IMAGE066
表示描述当前细胞记忆状态的参数;sigmoid、tanh为激活函数;
Figure 880676DEST_PATH_IMAGE067
表示记忆细胞状态储存单元中
Figure 166164DEST_PATH_IMAGE058
Figure 575280DEST_PATH_IMAGE059
的权重矩阵;
Figure 770769DEST_PATH_IMAGE068
表示记忆细胞状态储存单元中的偏置参数;
Figure 731772DEST_PATH_IMAGE069
表示t-1时刻的记忆状态;
Figure 645501DEST_PATH_IMAGE070
表示当前时刻的记忆状态;
Figure 858308DEST_PATH_IMAGE071
表示输出层输出的遗忘权重结果;
Figure 767358DEST_PATH_IMAGE072
为输出门中
Figure 40208DEST_PATH_IMAGE058
Figure 175654DEST_PATH_IMAGE059
的权重矩阵;
Figure 457731DEST_PATH_IMAGE073
为输出门中的偏置参数;
Figure 624882DEST_PATH_IMAGE074
表示模型t时刻的输出。
将正反两个方向的LSTM模型输出
Figure 927688DEST_PATH_IMAGE075
Figure 550430DEST_PATH_IMAGE076
结合得到BiLSTM输出;
Figure 105039DEST_PATH_IMAGE077
由此可以得到分别经过图卷积网络GCN层和双向长短时记忆神经网络BiLSTM层后融合了时间和空间特征属性的轨道交通线网进站客流。
进一步地,在本实施方式中,激活层为全连接层,计算过程如以下公式:
Figure 988681DEST_PATH_IMAGE120
其中,y表示记
Figure 337754DEST_PATH_IMAGE121
时刻输出的进站客流预测值;Q为总时间步长;
Figure 447793DEST_PATH_IMAGE078
表示BiLSTM模型t时刻的输出。
进一步地,在本实施方式中,损失函数计算层在针对轨道交通线网进站客流预测的过程中,为了追求预测误差的最小化,采用损失函数
Figure 665148DEST_PATH_IMAGE122
来判定预测的结果好坏,同时还要防止过度关注测试集误差时所导致的模型过拟合情况。因此在损失函数的计算中,定义yt为模型预测值(即第一预测客流量数据),yyt为实际的进站客流量(即真实客流量数据),引入L2正则化项
Figure 544242DEST_PATH_IMAGE123
加强模型的抗扰动性,具体计算公式如下:
Figure 329795DEST_PATH_IMAGE081
其中,
Figure 51764DEST_PATH_IMAGE084
为正则化系数,合理的系数
Figure 682596DEST_PATH_IMAGE084
可以减小正则化中代价函数最值参数,起到避免模型的过拟合现象,但是过大的系数
Figure 684706DEST_PATH_IMAGE084
会导致模型欠拟合现象的出现。故在本实施方式中通过逐渐增大系数
Figure 765794DEST_PATH_IMAGE084
值的方式找出模型最适合的正则化系数
Figure 319267DEST_PATH_IMAGE084
,从而优化上述基于(融合)注意力机制的时空图卷积模型。
进一步地,根据本发明的一种实施方式,将测试集输入上述优化后的时空图卷积模型后会得到第二预测客流量数据。得到第二客流量数据后,按照上述方式,通过损失函数loss来计算第二预测客流量数据与真实客流量数据之间的损失,然后将该损失与上述第一预测客流量数据与真实客流量数据之间的损失进行对比,通过对比结果判断优化后的时空图卷积模型是否出现欠拟合或者过拟合现象,若是(欠拟合:两者损失值很大,且模型损失函数未收敛;过拟合:训练集损失值很小,但预测集损失随迭代次数的增加变大),则调整优化后的时空图卷积模型中的超参数(对于欠拟合可以进行增加迭代次数和增大学习率的策略;对于过拟合可以采用提前终止模型或者增加数据集等策略来避免)设置,调整后再对测试集进行测试,直至不再出现欠拟合或者过拟合现象。如此方案可以有效地提高本发明的预测轨道交通客流的模型的稳定性,加强模型的抗扰动性,使得轨道交通客流的预测结果精准有效,对于轨道交通列车调控、轨道交通警报发布、以及服务效率提升的工作中起到至关重要的作用。
根据本发明的上述方案,本发明提出的是考虑低进站客流或者高进站客流特征的轨道交通路网客流的预测方法。结合GCN模型(图卷积网络模型)可以捕捉轨道交通线网站点间空间关系的优点和BiLSTM模型(双向长短时记忆神经网络模型)对时间序列数据高精度预测优点,构建轨道交通客流短时预测模型框架BT-GCN。考虑轨道交通时空特征,外部环境影响因素数据特征,捕捉历史进站客流数据与当前时刻进站客流量的相关程度并将相关程度以权重的形式表示。本发明所提模型可以综合考虑进站客流时空特征和外部环境影响因素特征并以历史数据相关时间点对时空属性进行加强工作,从而进行准确的客流预测。
本发明依靠神经网络,将快速获得的规定时间段内各个站点的进出站客流数据映射到高维特征空间中的特性进行各种特征的学习,得到不同时间和不同站点之间的相关特征值。本发明提出的IEF-BT-GCN模型是由BT-GCN和特征耦合IEF两个模块组成的神经网络模型。该模型用于轨道交通客流预测,在传统的轨道交通线网客流预测工作中增加对历史数据特征和外部影响特征的增强工作,进一步提升时空图卷积模型在轨道交通线网客流预测中的精度。本发明一方面提高了中短期进站客流预测的稳定性,另一方面在面对客流峰值以及非周期性客流变化时模型预测精度高于BT-GCN模型,且在低进站客流值情况下预测精度提高更加明显。这对轨道交通列车调控、轨道交通警报发布、以及服务效率提升的工作中起到至关重要的作用。
在本发明中,考虑到天气影响因素的影响范围为某市市域,覆盖了整体轨道线网,所以在挖掘进站客流量雨天气影响之间关系时以15min为粒度的轨道线网乘客进站量为分析序列。利用SPSS软件分别计算分时线网总进站客流量、降雨量、最高气温、最低气温和空气质量五者之间的相关系数。天气影响因素与客流相关性系数计算结果如表2所示,其中**表示显著性检验结果
Figure 284949DEST_PATH_IMAGE124
,表明两数列之间不相关记录的可能性小于1%,即两组数列有相关性。
在相关性系数计算结果中,与轨道线网乘客进站量相关的因素有降雨量以及空气质量两个因素,但从表2中可以看到空气质量因素与其他四组数列全部呈现相关性,且与降雨量、最高气温和最低气温的相关系数大小均大于与轨道线网乘客进站量的相关系数,因此定义空气质量变化为气温和降雨变化的附属变化。最终本文选择四种天气因素中与轨道线网乘客进站量呈现相关性且相关系数最大的降雨量作为天气影响因素的输入特征,其特征以日为单位具体数值如表3所示。
Figure 138635DEST_PATH_IMAGE125
表2
Figure 125046DEST_PATH_IMAGE126
表3
为实现上述目的,本发明还提供一种融合注意力机制和图神经网络的轨道交通客流预测系统,其结构框图如图3所示,具体包括:
数据获取模块,获取轨道线网乘客进站量数据集,将所述轨道线网乘客进站量数据集与外部环境影响因素数据集进行耦合,将耦合后的矩阵数据分为训练集和测试集;
模型训练模块,采用时空图卷积模型,利用所述训练集对所述时空图卷积模型进行训练,获得第一预测客流量数据;
模型优化模块,计算所述第一预测客流量数据与真实客流量数据之间的损失,优化所述时空图卷积模型;
客流量预测模块,将所述测试集输入完成优化的所述时空图卷积模型,获得第二预测客流量数据;
客流量校准模块,计算所述第二预测客流量数据和真实客流量数据之间的损失,将该损失与所述第一预测客流量数据与真实客流量数据之间的损失进行对比判断优化后的所述时空图卷积模型是否出现欠拟合或者过拟合现象,若是,则调整完成优化的所述时空图卷积模型的超参数,调整后再对所述测试集进行测试,直至不再出现欠拟合或者过拟合现象;
实际客流量预测模块,利用调整好超参数的所述时空图卷积模型对待测的轨道线网乘客进站量进行预测。
根据本发明的一种实施方式,基于研究区域内地铁运营AFC系统收集的乘客进出站数据,通过以15min粒度为单位的客流聚合工作,得到轨道线网乘客进站量数据集。外部环境影响因素数据集包括:站点类别特征数据、时间强化特征数据、节假日影响特征数据和天气影响特征数据。
其中,站点类别特征数据的提取方法为:
Figure 696972DEST_PATH_IMAGE086
Figure 935187DEST_PATH_IMAGE087
Figure 768014DEST_PATH_IMAGE088
重复计算每个样本到
Figure 800692DEST_PATH_IMAGE089
的欧氏距离并更新
Figure 594335DEST_PATH_IMAGE089
,直到
Figure 760875DEST_PATH_IMAGE090
值收敛或者达到设置的迭代次数;对每个站点的特征区别定义为早晚高峰以及平峰占全天客流量百分比差异,分别提取每个站点对应时段的进站客流量并以站点序号排序,利用K-means函数进行基于不同时段进站客流占比的站点分类获得所述站点类别特征数据;
其中,
Figure 586224DEST_PATH_IMAGE089
为k个聚类中心之间的欧氏距离,L=1,2…k,L为聚类中心数量;
Figure 789803DEST_PATH_IMAGE091
为每个聚类中心周围相似对象组成簇
Figure 195376DEST_PATH_IMAGE090
Figure 775393DEST_PATH_IMAGE090
为误差平方准则;x为
Figure 458179DEST_PATH_IMAGE091
任选的相似对象组成簇;
Figure 957293DEST_PATH_IMAGE092
为范数;
Figure 725529DEST_PATH_IMAGE127
表示的是所有样本各自的轮廓系数;max()为最大值函数,表示取其中最大的值;
Figure 843658DEST_PATH_IMAGE094
表示的是某样本点与同簇样本平均距离和凝聚度;
Figure 912108DEST_PATH_IMAGE128
表示的是某样本点与相邻簇全部样本的平均距离和分离度;
Figure 582124DEST_PATH_IMAGE096
表示的是平均轮廓系数,取值范围在
Figure 572076DEST_PATH_IMAGE097
之间;n为轮廓系数取值样本数。
时间强化特征数据的提取方法为:基于时间构建时间特征参数,其中,时间特征参数以时间的时位和分钟位顺序排列构成。例如上表1中所示:天气影响特征数据的提取方法为:通过相关性分析来找出降雨量、最高气温、最低气温和空气质量中与轨道线网乘客进站量有强相关性的因素作为天气影响因素的特征值;
相关性分析通过筛选轨道线网乘客进站量与降雨量、最高气温、最低气温和空气质量的皮尔逊相关系数实现,公式为:
Figure 774124DEST_PATH_IMAGE099
其中,X和Y分为两组待挖掘隐藏关系的数列,X为轨道线网乘客进站量、降雨量、最高气温、最低气温和空气质量中的任一种,Y为轨道线网乘客进站量、降雨量、最高气温、最低气温和空气质量中的任一种,
Figure 290556DEST_PATH_IMAGE129
为相关系数,表示相关性大小,cov代表的是X和Y之间的协方差,
Figure 272418DEST_PATH_IMAGE101
Figure 749667DEST_PATH_IMAGE102
分别为数列X和Y之间的标准差。
在本实施方式中,根据相关性系数计算结果,选降雨量、最高气温、最低气温和空气质量中与线网总进站客流量呈现相关性且相关系数最大的天气因素(即强相关性因素)作为天气影响因素的输入特征,其特征以日为单位。
节假日影响特征数据的提取方法为:将工作日定义为特征值1,将法定公休日定义为特征值2,将法定节假日定义为特征值3。其中,特征值1、特征值2和特征值3用于计算,即将每一日定义为一种数值,作为特征值加入外界因素耦合矩阵中。
进一步地,在本实施方式中,将轨道线网乘客进站量数据集与外部环境影响因素数据集进行耦合的方法为:
根据外部环境影响因素数据集构建外部影响因素矩阵
Figure 334232DEST_PATH_IMAGE130
根据轨道线网乘客进站量数据集构建线网进站客流量特征矩阵Z;
将外部影响因素矩阵
Figure 846116DEST_PATH_IMAGE002
与线网进站客流量特征矩阵Z进行耦合得到外界因素耦合矩阵IEF=[F,Z];
其中,
Figure 857934DEST_PATH_IMAGE003
值为输入外部因素类别数量,
Figure 88059DEST_PATH_IMAGE104
Figure 86102DEST_PATH_IMAGE002
中第
Figure 983650DEST_PATH_IMAGE005
类外部影响因素矩阵,i取1、2···m,
Figure 166370DEST_PATH_IMAGE105
,当
Figure 352632DEST_PATH_IMAGE106
时表示第i类外部影响因素随着时间变化会发生变化,其矩阵形式为
Figure 544579DEST_PATH_IMAGE107
,其中
Figure 762546DEST_PATH_IMAGE009
为时间序列长度,
Figure 257112DEST_PATH_IMAGE010
为轨道线网站点数量;
Figure 320883DEST_PATH_IMAGE108
表示在外部影响因素为i、第n个轨道线网站点、时间为t时的特征值;当
Figure 926308DEST_PATH_IMAGE109
时表示第i类外部影响因素与时间变化无关,其矩阵形式为
Figure 532870DEST_PATH_IMAGE110
;T表示矩阵的转置;
Figure 57392DEST_PATH_IMAGE111
表示在外部影响因素为i,第n个轨道线网站点时的特征值;其中线网进站客流量特征矩阵Z为:
Figure 483826DEST_PATH_IMAGE131
,其中
Figure 892941DEST_PATH_IMAGE113
代表a车站b时刻的客流量。
进一步地,根据本发明的一种实施方式,时空图卷积模型包括图卷积网络GCN层、双向长短时记忆神经网络BiLSTM层、激活层和损失函数计算层,图2表示时空图卷积模型的结构图(BT-GCN)。
其中,将研究实践范围内每个时间段轨道交通线网所有站点的进站客流客流量矩阵X作为输入信息送入图卷积网络GCN层进行空间维度的特征提取工作,在本实施方式中,选择2层图卷积作为图卷积网络GCN层属性,其计算公式如下:
Figure 213064DEST_PATH_IMAGE114
Figure 49433DEST_PATH_IMAGE132
Figure 697583DEST_PATH_IMAGE116
Figure 35024DEST_PATH_IMAGE035
Figure 87949DEST_PATH_IMAGE117
Figure 95219DEST_PATH_IMAGE037
其中,D表示度矩阵,对角线上的元素为图中各个顶点的度,
Figure 355299DEST_PATH_IMAGE038
表示每个顶点的度;A表示以轨道交通线网为基础建立的邻接矩阵;
Figure 106218DEST_PATH_IMAGE039
表示邻接矩阵A上B行G列的值;B表示矩阵的第B行;G表示矩阵的第G列;
Figure 10720DEST_PATH_IMAGE040
为优化后的邻接矩阵;
Figure 579104DEST_PATH_IMAGE041
为优化后的度矩阵;
Figure 936267DEST_PATH_IMAGE042
为单位矩阵;L表示拉普拉斯矩阵;U表示是拉普拉斯矩阵经过特征值分解得到的正交矩阵;
Figure 490877DEST_PATH_IMAGE043
是矩阵U的转置,T为转置符号;
Figure 640098DEST_PATH_IMAGE044
为n个特征值构成的对角阵;
Figure 254750DEST_PATH_IMAGE133
为特征值;
Figure 99210DEST_PATH_IMAGE134
表示第l层的特征矩阵;
Figure 582144DEST_PATH_IMAGE047
表示在特定层L层中的可训练权重矩阵;
Figure 192729DEST_PATH_IMAGE048
为线网进站客流量特征矩阵;
Figure 978282DEST_PATH_IMAGE049
表示激活函数。
进一步地,在本实施方式中,双向长短时记忆神经网络BiLSTM层对融合了所述空间维度的特征的客流量提取出时间维度的特征,此时双向长短时记忆神经网络BiLSTM层中的单项LSTM模型三个门控制单元公式采用以下公式:
Figure 700251DEST_PATH_IMAGE050
Figure 331083DEST_PATH_IMAGE051
Figure 330263DEST_PATH_IMAGE052
Figure 145773DEST_PATH_IMAGE053
Figure 964824DEST_PATH_IMAGE054
Figure 523981DEST_PATH_IMAGE055
其中,
Figure 377668DEST_PATH_IMAGE056
表示遗忘层输出的遗忘权重结果;
Figure 505024DEST_PATH_IMAGE057
为遗忘门中
Figure 670426DEST_PATH_IMAGE058
Figure 908640DEST_PATH_IMAGE059
的权重矩阵;
Figure 873624DEST_PATH_IMAGE060
表示t时刻2层图神经网络输出的隐藏层的隐藏状态;
Figure 30935DEST_PATH_IMAGE061
为当前时刻输入的外部特征序列;
Figure 824579DEST_PATH_IMAGE062
为遗忘门中的偏置参数;
Figure 600905DEST_PATH_IMAGE063
表示记忆层输出的记忆权重结果;
Figure 553818DEST_PATH_IMAGE064
为记忆门中
Figure 22976DEST_PATH_IMAGE058
Figure 303916DEST_PATH_IMAGE059
的权重矩阵;
Figure 742988DEST_PATH_IMAGE065
为记忆门中的偏置参数;
Figure 425773DEST_PATH_IMAGE066
表示描述当前细胞记忆状态的参数;sigmiod、tanh为激活函数;
Figure 65833DEST_PATH_IMAGE067
表示记忆细胞状态储存单元中
Figure 834069DEST_PATH_IMAGE058
Figure 480426DEST_PATH_IMAGE059
的权重矩阵;
Figure 142352DEST_PATH_IMAGE068
表示记忆细胞状态储存单元中的偏置参数;
Figure 953313DEST_PATH_IMAGE069
表示t-1时刻的记忆状态;
Figure 208845DEST_PATH_IMAGE070
表示当前时刻的记忆状态;
Figure 396244DEST_PATH_IMAGE071
表示输出层输出的遗忘权重结果;
Figure 647096DEST_PATH_IMAGE072
为输出门中
Figure 628959DEST_PATH_IMAGE058
Figure 230841DEST_PATH_IMAGE059
的权重矩阵;
Figure 956352DEST_PATH_IMAGE073
为输出门中的偏置参数;
Figure 468236DEST_PATH_IMAGE074
表示模型t时刻的输出。
将正反两个方向的LSTM模型输出
Figure 480054DEST_PATH_IMAGE075
Figure 710178DEST_PATH_IMAGE076
结合得到BiLSTM输出;
Figure 711151DEST_PATH_IMAGE077
由此可以得到分别经过图卷积网络GCN层和双向长短时记忆神经网络BiLSTM层后融合了时间和空间特征属性的轨道交通线网进站客流。
进一步地,在本实施方式中,激活层为全连接层,计算过程如以下公式:
Figure 202175DEST_PATH_IMAGE120
其中,y表示记
Figure 791420DEST_PATH_IMAGE135
时刻输出的进站客流预测值;Q为总时间步长;
Figure 977681DEST_PATH_IMAGE078
表示BiLSTM模型t时刻的输出。
进一步地,在本实施方式中,损失函数计算层在针对轨道交通线网进站客流预测的过程中,为了追求预测误差的最小化,采用损失函数
Figure 169628DEST_PATH_IMAGE122
来判定预测的结果好坏,同时还要防止过度关注测试集误差时所导致的模型过拟合情况。因此在损失函数的计算中,定义yt为模型预测值(即第一预测客流量数据),yyt为实际的进站客流量(即真实客流量数据),引入L2正则化项
Figure 656105DEST_PATH_IMAGE123
加强模型的抗扰动性,具体计算公式如下:
Figure 150671DEST_PATH_IMAGE081
其中,
Figure 948863DEST_PATH_IMAGE084
为正则化系数,合理的系数
Figure 819867DEST_PATH_IMAGE084
可以减小正则化中代价函数最值参数,起到避免模型的过拟合现象,但是过大的系数
Figure 895270DEST_PATH_IMAGE084
会导致模型欠拟合现象的出现。故在本实施方式中通过逐渐增大系数
Figure 685372DEST_PATH_IMAGE084
值的方式找出模型最适合的正则化系数
Figure 111805DEST_PATH_IMAGE084
,从而优化上述基于(融合)注意力机制的时空图卷积模型。
进一步地,根据本发明的一种实施方式,将测试集输入上述优化后的时空图卷积模型后会得到第二预测客流量数据。得到第二客流量数据后,按照上述方式,通过损失函数loss来计算第二预测客流量数据与真实客流量数据之间的损失,然后将该损失与上述第一预测客流量数据与真实客流量数据之间的损失进行对比,通过对比结果判断优化后的时空图卷积模型是否出现欠拟合或者过拟合现象,若是(欠拟合:两者损失值很大,且模型损失函数未收敛;过拟合:训练集损失值很小,但预测集损失随迭代次数的增加变大),则调整优化后的时空图卷积模型中的超参数(对于欠拟合可以进行增加迭代次数和增大学习率的策略;对于过拟合可以采用提前终止模型或者增加数据集等策略来避免)设置,调整后再对测试集进行测试,直至不再出现欠拟合或者过拟合现象。如此方案可以有效地提高本发明的预测轨道交通客流的模型的稳定性,加强模型的抗扰动性,使得轨道交通客流的预测结果精准有效,对于轨道交通列车调控、轨道交通警报发布、以及服务效率提升的工作中起到至关重要的作用。
根据本发明的上述方案,本发明提出的是考虑低进站客流或者高进站客流特征和外部环境影响的轨道交通路网客流的预测方法。结合GCN模型(图卷积网络模型)可以捕捉轨道交通线网站点间空间关系的优点和BiLSTM模型(双向长短时记忆神经网络模型)对时间序列数据高精度预测优点,构建轨道交通客流短时预测模型框架BT-GCN。考虑轨道交通时空特征,外部环境影响因素数据特征,捕捉历史进站客流数据与当前时刻进站客流量的相关程度并将相关程度以权重的形式表示。本发明所提模型可以综合考虑进站客流时空特征和外部环境影响因素特征并以历史数据相关时间点对时空属性进行加强工作,从而进行准确的客流预测。
本发明依靠神经网络,将快速获得的规定时间段内各个站点的进出站客流数据映射到高维特征空间中的特性进行各种特征的学习,得到不同时间和不同站点之间的相关特征值。本发明提出的IEF-BT-GCN模型是由BT-GCN和特征耦合IEF两个模块组成的神经网络模型。该模型用于轨道交通客流预测,在传统的轨道交通线网客流预测工作中增加对历史数据特征和外部影响特征的增强工作,进一步提升时空图卷积模型在轨道交通线网客流预测中的精度。本发明一方面提高了中短期进站客流预测的稳定性,另一方面在面对客流峰值以及非周期性客流变化时模型预测精度高于BT-GCN模型,且在低进站客流值情况下预测精度提高更加明显。这对轨道交通列车调控、轨道交通警报发布、以及服务效率提升的工作中起到至关重要的作用。
在本发明中,考虑到天气影响因素的影响范围为某市市域,覆盖了整体轨道线网,所以在挖掘进站客流量雨天气影响之间关系时以15min为粒度的轨道线网乘客进站量为分析序列。利用SPSS软件分别计算分时线网总进站客流量、降雨量、最高气温、最低气温和空气质量五者之间的相关系数。天气影响因素与客流相关性系数计算结果如表1所示,其中**表示显著性检验结果
Figure 252412DEST_PATH_IMAGE136
,表明两数列之间不相关记录的可能性小于1%,即两组数列有相关性。
在相关性系数计算结果中,与轨道线网乘客进站量相关的因素有降雨量以及空气质量两个因素,但从上表1中可以看到空气质量因素与其他四组数列全部呈现相关性,且与降雨量、最高气温和最低气温的相关系数大小均大于与轨道线网乘客进站量的相关系数,因此定义空气质量变化为气温和降雨变化的附属变化。最终本文选择四种天气因素中与轨道线网乘客进站量呈现相关性且相关系数最大的降雨量作为天气影响因素的输入特征,其特征以日为单位具体数值如上表2所示。
为实现上述发明目的,本发明还提供一种电子设备,包括处理器、存储器及存储在存储器上并可在处理器上运行的计算机程序,计算机程序被处理器执行时实现如上所述的基于深度图神经网络和环境融合的轨道客流预测方法。
为实现上述发明目的,本发明还提供一种计算机可读存储介质,计算机可读存储介质上存储计算机程序,计算机程序被处理器执行时实现如上所述的基于深度图神经网络和环境融合的轨道客流预测方法。
为了进一步对比IEF-BT-GCN模型相较于现有技术进步之处,通过以下实验进一步对比和阐述。
实验环境
为保证本文提出模型的可重复性对实验运行环境进行说明:模型在Windows系统中Pycharm集成开发环境下利用Python进行编译。
实验数据集
实验数据分为轨道线网乘客进站量数据集、外部影响因素数据集两部分。
轨道线网乘客进站量数据集为2016年4月到6月某城市市轨道交通线网中全部96个站点以15min为时间粒度的进站客流量,数据集形状为
Figure 572535DEST_PATH_IMAGE137
外部影响因素数据集包括站点类别特征、时间强化特征、节假日影响特征和天气影响特征,因不同因素的性质数据集形状不同,其中时间强化特征、节假日影响特征和天气影响特征随时间变化而变化,数据集形状为
Figure 674483DEST_PATH_IMAGE137
,站点类别特征不随时间变化,数据集形状为
Figure 322633DEST_PATH_IMAGE138
实验评价指标
回归评价指标是对模型预测工作效果的评价的定量指标,不同的评价方法可以从预测数据的不同角度对模型的性能进行反应。因为关于轨道交通客流预测的工作中,在每天的预测期起始点进站客流量值与峰值相比相差很远,此时段MAPE评价效果影响效果较大,且存在有些站点进站客流量为0的情况存在,故本发明所提模型选择平均绝对误差(MAE)、均方根误差(RMSE)、准确度(Accuracy)、决定系数(R2)、可释方差得分(EVS)五个评价指标进行评价工作。
实验超参数设置
如表4所示,IEF-BT-GCN模型超参数包括学习率、迭代次数、训练集和预测集大小比例、批量大小、优化器选择以及隐藏单元数六种。IEF-BT-GCN模型中学习率设置为0.01;迭代次数设置为3000;训练集和预测集大小比例为4:1;批量大小设置为100;优化器选择Adam模型。在隐藏单元数的选择中设置了隐藏单元数为8、16、32、64、128的五组对比实验并以64评价指标作为最终选取隐藏单元数量的依据,具体实验结果如下。在MAE和RMSE评价指标中,当隐藏单元数为64时,MAE和RMSE值同时达到最小,相较其他隐藏单元数分别降低了6.90%-47.64%和8.23%-45.14%;在Accuracy、
Figure 394494DEST_PATH_IMAGE139
和EVS评价指标中,同样当隐藏单元数为64时,MAE和RMSE值同时达到最小,相较其他隐藏单元数分别降低了1.71%-15.87%、0.97%-14.21%和1.01%-14.19%,两类评价指标的对比分别如图4和图5所示,最终选择隐藏单元数64作为模型输入。
Figure 710069DEST_PATH_IMAGE140
表4
综上,本文提出的IEF-BT-GCN模型超参数设置如表5所示。
Figure 451760DEST_PATH_IMAGE141
表5
基线模型选择
在基线模型选择部分同时加入ARIMA(线性模型)、SVR(机器学习模型)、BiLSTM(深度学习模型)、GCN(图神经网络模型)、BT-GCN(时空图卷积模型)、ATT-BT-GCN(融合注意力机制的时空图卷积模型)的模型进行效果对比,具体基线模型如表6所示。其中ATT-BT-GCN型只关注各个站点不同时间段进站客流量之间特征关系,在实际的轨道交通线网中各种外部因素例如天气、节假日、突发情况等都会对进站客流产生影响,然而神经网络在学习这些特征时仅凭各站点不同时间段进站客流量会非常困难,此时需要对影响进站客流量较大的因素进行人为标定,作为各站点对应时段的进站客流特征。
Figure 977419DEST_PATH_IMAGE142
表6
实验结果
在预测工作中,经过1000次迭代后,本文提出的IEF-BT-GCN达到收敛状态,因模型内部特征值较多的缘故在模型调整特征权重时预测会存在小幅波动,但是整体趋于稳定状态,训练集和预测集的每代误差逐渐下降,未出现过拟合情况。所有模型都以前1小时的进站客流量分别对15min、30min、60min后的进站客流量进行预测,并分别作为短期、中期、长期的预测结果,具体模型预测结果如表7所示。
Figure 728338DEST_PATH_IMAGE143
表7
注:*表示数值很小或负值,其预测效果小于直接取历史平均值预测效果。
实验结果表明,本文提出的IEF-BT-GCN模型在短期和长期预测中较ATT-BT-GCN(融合注意力机制的时空图卷积模型,ATT为Attention,即注意力机制)的基础上精确度进一步提升,在中期预测中模型效果与BT-GCN模型相似,预测效果低于ATT-BT-GCN模型。总体来说IEF-BT-GCN模型预测效果有进一步提升。
而且,在考虑不同预测时长的预测效果对比中,本发明提出的IEF-BT-GCN模型在短期预测中效果最好。相较基线模型在短期预测中RMSE和MAE分别降低了1.36%-63.79%和0.75%-66.9%;在中期预测中IEF-BT-GCN模型预测效果相比ATT-BT-GCN模型RMSE和MAE分别增加了12.39%和16.78%,相比其他基线模型RMSE和MAE分别降低了1.44%-57.96%和1.17%-61.12%;在长期预测中IEF-BT-GCN模型预测效果与BT-GCN模型和ATT-BT-GCN模型预测性能相似,相较两模型RMSE分别下降2.99%和3.88,MAE分别上升0.99%和3.67%,相较其他基线模型RMSE和MAE分别降低了10.28%-49.61%和7.39%-52.28%。
由此可知,本发明提出的IEF-BT-GCN模型在短期预测中效果最为突出,模型在随着预测时间增长时精度下降较快;在中期预测中效果差于ATT-BT-GCN;在中长期的预测中IEF-BT-GCN模型拥有左右基线模型中最好的稳定性,在长期预测中效果与BT-GCN模型和ATT-BT-GCN模型相似;不同预测时长下的RMSE和MAE对比图如6和图7所示。
不仅如此,本发明将短期预测下时空加强特征模型和考虑环境影响因素特征模型作为对比实验,实验结果如表8所示。
Figure 632840DEST_PATH_IMAGE144
表8
由表8可知,相比于不加入外部因素的BT-GCN模型来说,加入时空加强特征的模型RMSE和MAE分别降低0.95%和3.95%;加入环境影响因素特征的模型RMSE和MAE分别上升9.86%和12.02%;将全部影响因素耦合的时空环境加强特征模型RMSE和MAE分别降低8.59%和10.06%。在与针对历史客流数据时空特征加强的ATT-BT-GCN模型对比中,单融合时空加强特征的模型RMSE和MAE分别上升6.88%和12.69%;融合时空环境加强特征的模型RMSE和MAE分别下降1.36%和0.75%。
与BT-GCN模型的对比实验表明,只考虑某一方面因素的预测的模型预测效果弱于多维度影响因素融合的时空环境加强特征模型;相比之下时空加强特征与客流分布特征相关性大于环境影响因素特征,但考虑时空加强特征的模型预测效果强于单考虑环境影响因素特征的模型;在单考虑环境影响因素时,降雨量的突变会给模型权重调整带来挑战,甚至出现精确度小于未考虑外部环境的BT-GCN模型精度的情况。
与ATT-BT-GCN模型的对比实验表明,仅靠人为主观定义的时空加强特征对模型性能的提升弱于注意力机制的引入;相比之下融合时空环境加强特征的模型预测效果强于ATT-BT-GCN模型,且IEF-BT-GCN模型收敛时的迭代次数远小于ATT-BT-GCN模型。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的模块及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置和设备的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。
作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本发明实施例方案的目的。
另外,在本发明实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。
功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例节能信号发送/接收的方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、ROM(只读存储器)、RAM(易挥发性随机存取存储器)、磁碟或者光盘等各种可以存储程序代码的介质。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
应理解,本发明的发明内容及实施例中各步骤的序号的大小并不绝对意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。

Claims (10)

1.基于深度图神经网络和环境融合的轨道客流预测方法,其特征在于,包括:
获取轨道线网乘客进站量数据集,将所述轨道线网乘客进站量数据集与外部环境影响因素数据集进行耦合,将耦合后的矩阵数据分为训练集和测试集;
采用时空图卷积模型,利用所述训练集对所述时空图卷积模型进行训练,获得第一预测客流量数据;
计算所述第一预测客流量数据与真实客流量数据之间的损失,优化所述时空图卷积模型;
将所述测试集输入完成优化的所述时空图卷积模型,获得第二预测客流量数据;
计算所述第二预测客流量数据和真实客流量数据之间的损失,将该损失与所述第一预测客流量数据与真实客流量数据之间的损失进行对比,判断优化后的所述时空图卷积模型是否出现欠拟合或者过拟合现象,若是,则调整完成优化的所述时空图卷积模型的超参数,调整后再对所述测试集进行测试,直至不再出现欠拟合或者过拟合现象;
利用调整好超参数的所述时空图卷积模型对待测的轨道线网乘客进站量进行预测。
2.根据权利要求1所述的基于深度图神经网络和环境融合的轨道客流预测方法,其特征在于,所述外部环境影响因素数据集包括:站点类别特征数据、时间强化特征数据、节假日影响特征数据和天气影响特征数据;
将所述轨道线网乘客进站量数据集与外部环境影响因素数据集进行耦合的方法为:
根据所述外部环境影响因素数据集构建外部影响因素矩阵
Figure 64102DEST_PATH_IMAGE001
根据所述轨道线网乘客进站量数据集构建线网进站客流量特征矩阵Z;
将外部影响因素矩阵
Figure 609220DEST_PATH_IMAGE002
与线网进站客流量特征矩阵Z进行耦合得到外界因素耦合矩阵IEF=[F,Z];
其中,
Figure 427265DEST_PATH_IMAGE003
值为输入外部因素类别数量,
Figure 179321DEST_PATH_IMAGE004
Figure 670957DEST_PATH_IMAGE005
中第
Figure 734728DEST_PATH_IMAGE006
类外部影响因素矩阵,i取1、2···m,
Figure 340153DEST_PATH_IMAGE007
,当
Figure 681136DEST_PATH_IMAGE008
时表示第i类外部影响因素随着时间变化会发生变化,其矩阵形式为
Figure 471237DEST_PATH_IMAGE009
,其中t为时间序列长度,n为轨道线网站点数量;
Figure 897671DEST_PATH_IMAGE010
表示在外部影响因素为i、第n个轨道线网站点、时间为t时的特征值;当
Figure 572366DEST_PATH_IMAGE011
时表示第
Figure 767855DEST_PATH_IMAGE012
类外部影响因素与时间变化无关,其矩阵形式为
Figure 463278DEST_PATH_IMAGE013
;T表示矩阵的转置;
Figure 377008DEST_PATH_IMAGE014
表示在外部影响因素为i,第n个轨道线网站点时的特征值;其中线网进站客流量特征矩阵Z为:
Figure 589814DEST_PATH_IMAGE015
,其中
Figure 498864DEST_PATH_IMAGE016
代表a车站b时刻的客流量。
3.根据权利要求2所述的基于深度图神经网络和环境融合的轨道客流预测方法,其特征在于,所述站点类别特征数据的提取方法为:
Figure 774644DEST_PATH_IMAGE017
Figure 910090DEST_PATH_IMAGE018
Figure 785642DEST_PATH_IMAGE019
重复计算每个样本到
Figure 955723DEST_PATH_IMAGE020
的欧氏距离并更新
Figure 133895DEST_PATH_IMAGE020
,直到
Figure 22216DEST_PATH_IMAGE021
值收敛或者达到设置的迭代次数;对每个站点的特征区别定义为早晚高峰以及平峰占全天客流量百分比差异,分别提取每个站点对应时段的进站客流量并以站点序号排序,利用K-means函数进行基于不同时段进站客流占比的站点分类获得所述站点类别特征数据;
其中,
Figure 701459DEST_PATH_IMAGE020
为k个聚类中心之间的欧氏距离,L=1,2…k,L为聚类中心数量;
Figure 991626DEST_PATH_IMAGE022
为每个聚类中心周围相似对象组成簇;SSE为误差平方准则;x为
Figure 340699DEST_PATH_IMAGE022
任选的相似对象组成簇;
Figure 185159DEST_PATH_IMAGE023
为范数;
Figure 668092DEST_PATH_IMAGE024
表示的是所有样本各自的轮廓系数;max()为最大值函数,表示取其中最大的值;
Figure 544257DEST_PATH_IMAGE025
表示的是某样本点与同簇样本平均距离和凝聚度;
Figure 329811DEST_PATH_IMAGE026
表示的是某样本点与相邻簇全部样本的平均距离和分离度;
Figure 786200DEST_PATH_IMAGE027
表示的是平均轮廓系数,取值范围在
Figure 682611DEST_PATH_IMAGE028
之间;n为轮廓系数取值样本数。
4.根据权利要求4所述的基于深度图神经网络和环境融合的轨道客流预测方法,其特征在于,所述时间强化特征数据的提取方法为:基于时间构建时间特征参数,其中,时间特征参数以时间的时位和分钟位顺序排列构成;
所述天气影响特征数据的提取方法为:通过相关性分析来找出降雨量、最高气温、最低气温和空气质量中与轨道线网乘客进站量有强相关性的因素作为天气影响因素的特征值;
所述相关性分析通过筛选轨道线网乘客进站量与降雨量、最高气温、最低气温和空气质量的皮尔逊相关系数实现,相关性分析的公式为:
Figure 681791DEST_PATH_IMAGE029
其中,X和Y分为两组待挖掘隐藏关系的数列,X为轨道线网乘客进站量、降雨量、最高气温、最低气温和空气质量中的任一种,Y为轨道线网乘客进站量、降雨量、最高气温、最低气温和空气质量中的任一种;
Figure 497301DEST_PATH_IMAGE030
为相关系数,表示相关性大小;cov代表的是X和Y之间的协方差,
Figure 316352DEST_PATH_IMAGE031
Figure 16455DEST_PATH_IMAGE032
分别为数列X和Y之间的标准差;
所述节假日影响特征数据的提取方法为:将工作日定义为特征值1,将法定公休日定义为特征值2,将法定节假日定义为特征值3;
所述时空图卷积模型包括图卷积网络GCN层、双向长短时记忆神经网络BiLSTM层、激活层和损失函数计算层;
所述图卷积网络GCN层将轨道线网所有站点的乘客进站量提取出空间维度的特征,计算公式为:
选择2层图卷积作为图卷积网络GCN层属性,
Figure 135721DEST_PATH_IMAGE033
Figure 122131DEST_PATH_IMAGE034
Figure 694058DEST_PATH_IMAGE035
Figure 923483DEST_PATH_IMAGE036
Figure 631676DEST_PATH_IMAGE037
Figure 788988DEST_PATH_IMAGE038
其中,D表示度矩阵,对角线上的元素为图中各个顶点的度,
Figure 582632DEST_PATH_IMAGE039
表示每个顶点的度;A表示以轨道交通线网为基础建立的邻接矩阵;
Figure 624537DEST_PATH_IMAGE040
表示邻接矩阵A上B行G列的值;B表示矩阵的第B行;G表示矩阵的第G列;
Figure 311871DEST_PATH_IMAGE041
为优化后的邻接矩阵;
Figure 781029DEST_PATH_IMAGE042
为优化后的度矩阵;
Figure 921023DEST_PATH_IMAGE043
为单位矩阵;L表示拉普拉斯矩阵;U表示是拉普拉斯矩阵经过特征值分解得到的正交矩阵;
Figure 501040DEST_PATH_IMAGE044
是矩阵U的转置,T为转置符号;
Figure 183826DEST_PATH_IMAGE045
为n个特征值构成的对角阵;
Figure 823886DEST_PATH_IMAGE046
为特征值;
Figure 716755DEST_PATH_IMAGE047
表示第l层的特征矩阵;
Figure 97533DEST_PATH_IMAGE048
表示在特定层L层中的可训练权重矩阵;
Figure 900404DEST_PATH_IMAGE049
为线网进站客流量特征矩阵;
Figure 570420DEST_PATH_IMAGE050
表示激活函数。
5.根据权利要求4所述的基于深度图神经网络和环境融合的轨道客流预测方法,其特征在于,所述双向长短时记忆神经网络BiLSTM层对融合了所述空间维度的特征的乘客进站量提取出时间维度的特征,其中单向的LSTM模型计算公式为:
Figure 560373DEST_PATH_IMAGE051
Figure 747772DEST_PATH_IMAGE052
Figure 264204DEST_PATH_IMAGE053
Figure 246066DEST_PATH_IMAGE054
Figure 457736DEST_PATH_IMAGE055
Figure 307880DEST_PATH_IMAGE056
其中,
Figure 819764DEST_PATH_IMAGE057
表示遗忘层输出的遗忘权重结果;
Figure 972528DEST_PATH_IMAGE059
为遗忘门中
Figure 61707DEST_PATH_IMAGE060
Figure 328259DEST_PATH_IMAGE061
的权重矩阵;
Figure 960228DEST_PATH_IMAGE062
表示t时刻2层图神经网络输出的隐藏层的隐藏状态;
Figure 142948DEST_PATH_IMAGE063
为当前时刻输入的外部特征序列;
Figure 594789DEST_PATH_IMAGE064
为遗忘门中的偏置参数;
Figure 662102DEST_PATH_IMAGE065
表示记忆层输出的记忆权重结果;
Figure 7633DEST_PATH_IMAGE066
为记忆门中
Figure 502199DEST_PATH_IMAGE060
Figure 441336DEST_PATH_IMAGE061
的权重矩阵;
Figure 312340DEST_PATH_IMAGE067
为记忆门中的偏置参数;
Figure 512377DEST_PATH_IMAGE068
表示描述当前细胞记忆状态的参数;
Figure 177845DEST_PATH_IMAGE069
、tanh为激活函数;
Figure 601349DEST_PATH_IMAGE070
表示记忆细胞状态储存单元中
Figure 135098DEST_PATH_IMAGE060
Figure 330587DEST_PATH_IMAGE061
的权重矩阵;
Figure 166956DEST_PATH_IMAGE071
表示记忆细胞状态储存单元中的偏置参数;
Figure 939740DEST_PATH_IMAGE072
表示t-1时刻的记忆状态;
Figure 152547DEST_PATH_IMAGE073
表示当前时刻的记忆状态;
Figure 202542DEST_PATH_IMAGE074
表示输出层输出的遗忘权重结果;
Figure 600026DEST_PATH_IMAGE075
为输出门中
Figure 735472DEST_PATH_IMAGE060
Figure 486390DEST_PATH_IMAGE061
的权重矩阵;
Figure 515526DEST_PATH_IMAGE076
为输出门中的偏置参数;
Figure 693698DEST_PATH_IMAGE077
表示模型t时刻的输出;
将正反两个方向的LSTM模型输出
Figure 331089DEST_PATH_IMAGE078
Figure 10332DEST_PATH_IMAGE079
结合得到BiLSTM输出;
Figure 769340DEST_PATH_IMAGE080
其中,
Figure 383992DEST_PATH_IMAGE081
表示BiLSTM模型t时刻的输出。
6.根据权利要求5所述的基于深度图神经网络和环境融合的轨道客流预测方法,其特征在于,所述激活层为全连接层,全连接层将BiLSTM输出的多维向量进行维度转变,最终得到所需维度进行输出,计算过程如以下公式:
Figure 618665DEST_PATH_IMAGE082
其中,y表示记
Figure 976965DEST_PATH_IMAGE083
时刻输出的进站客流预测值;Q为总时间步长。
7.根据权利要求6所述的基于深度图神经网络和环境融合的轨道客流预测方法,其特征在于,所述损失函数计算层采用损失函数loss计算预测客流量数据与真实客流量数据之间的损失,计算公式为:
Figure 856059DEST_PATH_IMAGE084
其中,
Figure 500667DEST_PATH_IMAGE085
为预测客流量数据,
Figure 98002DEST_PATH_IMAGE086
为真实客流量数据,
Figure 994413DEST_PATH_IMAGE087
为正则化系数,
Figure 852648DEST_PATH_IMAGE088
为L2正则化项。
8.基于深度图神经网络和环境融合的轨道客流预测系统,其特征在于,包括:
数据获取模块,获取轨道线网乘客进站量数据集,将所述轨道线网乘客进站量数据集与外部环境影响因素数据集进行耦合,将耦合后的矩阵数据分为训练集和测试集;
模型训练模块,采用时空图卷积模型,利用所述训练集对所述时空图卷积模型进行训练,获得第一预测客流量数据;
模型优化模块,计算所述第一预测客流量数据与真实客流量数据之间的损失,优化所述时空图卷积模型;
客流量预测模块,将所述测试集输入完成优化的所述时空图卷积模型,获得第二预测客流量数据;
客流量校准模块,计算所述第二预测客流量数据和真实客流量数据之间的损失,将该损失与所述第一预测客流量数据与真实客流量数据之间的损失进行对比判断优化后的所述时空图卷积模型是否出现欠拟合或者过拟合现象,若是,则调整完成优化的所述时空图卷积模型的超参数,调整后再对所述测试集进行测试,直至不再出现欠拟合或者过拟合现象;
实际客流量预测模块,利用调整好超参数的所述时空图卷积模型对待测的轨道线网乘客进站量进行预测。
9.电子设备,其特征在于,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1-7中任一项所述的基于深度图神经网络和环境融合的轨道客流预测方法。
10.计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如权利要求1-7中任一项所述的基于深度图神经网络和环境融合的轨道客流预测方法。
CN202210985975.9A 2022-08-17 2022-08-17 基于深度图神经网络和环境融合的轨道客流预测方法 Pending CN115392554A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210985975.9A CN115392554A (zh) 2022-08-17 2022-08-17 基于深度图神经网络和环境融合的轨道客流预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210985975.9A CN115392554A (zh) 2022-08-17 2022-08-17 基于深度图神经网络和环境融合的轨道客流预测方法

Publications (1)

Publication Number Publication Date
CN115392554A true CN115392554A (zh) 2022-11-25

Family

ID=84120390

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210985975.9A Pending CN115392554A (zh) 2022-08-17 2022-08-17 基于深度图神经网络和环境融合的轨道客流预测方法

Country Status (1)

Country Link
CN (1) CN115392554A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116050673A (zh) * 2023-03-31 2023-05-02 深圳市城市交通规划设计研究中心股份有限公司 基于CNN-BiLSTM的城市公交客流短时预测方法
CN117057488A (zh) * 2023-10-12 2023-11-14 江南大学附属医院 基于人工智能模型的放射医疗设备工作量预测方法及系统
CN117591919A (zh) * 2024-01-17 2024-02-23 北京工业大学 客流预测方法、装置、电子设备和存储介质
CN117273287B (zh) * 2023-11-23 2024-03-08 山东科技大学 一种基于张量-矩阵耦合的地铁客流量预测方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110443448A (zh) * 2019-07-01 2019-11-12 华中科技大学 一种基于双向lstm的飞机机位分类预测方法和系统
CN112418547A (zh) * 2020-12-03 2021-02-26 北京工业大学 一种基于gcn-lstm组合模型的公交车站点客流量预测方法
CN113077090A (zh) * 2021-04-09 2021-07-06 上海大学 客流预测方法、系统及计算机可读存储介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110443448A (zh) * 2019-07-01 2019-11-12 华中科技大学 一种基于双向lstm的飞机机位分类预测方法和系统
CN112418547A (zh) * 2020-12-03 2021-02-26 北京工业大学 一种基于gcn-lstm组合模型的公交车站点客流量预测方法
CN113077090A (zh) * 2021-04-09 2021-07-06 上海大学 客流预测方法、系统及计算机可读存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
林龙: "基于改进k-means的公交时刻表关键站点选择研究" *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116050673A (zh) * 2023-03-31 2023-05-02 深圳市城市交通规划设计研究中心股份有限公司 基于CNN-BiLSTM的城市公交客流短时预测方法
CN116050673B (zh) * 2023-03-31 2023-08-01 深圳市城市交通规划设计研究中心股份有限公司 基于CNN-BiLSTM的城市公交客流短时预测方法
CN117057488A (zh) * 2023-10-12 2023-11-14 江南大学附属医院 基于人工智能模型的放射医疗设备工作量预测方法及系统
CN117057488B (zh) * 2023-10-12 2023-12-26 江南大学附属医院 基于人工智能模型的放射医疗设备工作量预测方法及系统
CN117273287B (zh) * 2023-11-23 2024-03-08 山东科技大学 一种基于张量-矩阵耦合的地铁客流量预测方法
CN117591919A (zh) * 2024-01-17 2024-02-23 北京工业大学 客流预测方法、装置、电子设备和存储介质
CN117591919B (zh) * 2024-01-17 2024-03-26 北京工业大学 客流预测方法、装置、电子设备和存储介质

Similar Documents

Publication Publication Date Title
CN110570651B (zh) 一种基于深度学习的路网交通态势预测方法及系统
CN111161535B (zh) 基于注意力机制的图神经网络交通流量预测方法及系统
CN112801404B (zh) 一种基于自适应空间自注意力图卷积的交通预测方法
CN109508360B (zh) 一种基于元胞自动机的地理多元流数据时空自相关分析方法
CN115392554A (zh) 基于深度图神经网络和环境融合的轨道客流预测方法
CN111210633B (zh) 一种基于深度学习的短时交通流预测方法
CN109492822B (zh) 空气污染物浓度时空域关联预测方法
CN111860951B (zh) 一种基于动态超图卷积网络的轨道交通客流预测方法
CN109142171B (zh) 基于特征扩张的融合神经网络的城市pm10浓度预测方法
CN115081717B (zh) 融合注意力机制和图神经网络的轨道交通客流预测方法
CN111292525B (zh) 基于神经网络的交通流预测方法
CN113487061A (zh) 一种基于图卷积-Informer模型的长时序交通流量预测方法
CN114626512B (zh) 一种基于有向图神经网络的高温灾害预报方法
CN110909924B (zh) 基于交叉熵优化器的城市扩张多情景模拟元胞自动机方法
CN111127888A (zh) 一种基于多源数据融合的城市交通流预测方法
CN113887787B (zh) 一种基于长短时记忆网络和nsga-ii算法的洪水预报模型参数多目标优化方法
CN114693064B (zh) 一种建筑群方案生成性能评价方法
CN115376317B (zh) 一种基于动态图卷积和时序卷积网络的交通流预测方法
CN112966871A (zh) 基于卷积长短期记忆神经网络的交通拥堵预测方法及系统
CN115148019A (zh) 一种基于节假日拥堵预测算法的预警方法及系统
CN116681176B (zh) 一种基于聚类和异构图神经网络的交通流预测方法
CN116721537A (zh) 基于gcn-ipso-lstm组合模型的城市短时交通流预测方法
CN111341109B (zh) 一种基于时空相似性的城市级信号推荐系统
CN112598165A (zh) 基于私家车数据的城市功能区转移流量预测方法及装置
CN111209968B (zh) 基于深度学习的多气象因子模式预报温度订正方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination