CN115392554A - 基于深度图神经网络和环境融合的轨道客流预测方法 - Google Patents
基于深度图神经网络和环境融合的轨道客流预测方法 Download PDFInfo
- Publication number
- CN115392554A CN115392554A CN202210985975.9A CN202210985975A CN115392554A CN 115392554 A CN115392554 A CN 115392554A CN 202210985975 A CN202210985975 A CN 202210985975A CN 115392554 A CN115392554 A CN 115392554A
- Authority
- CN
- China
- Prior art keywords
- passenger flow
- time
- data
- matrix
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 67
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 50
- 230000004927 fusion Effects 0.000 title claims abstract description 27
- 238000010586 diagram Methods 0.000 claims abstract description 56
- 238000012360 testing method Methods 0.000 claims abstract description 33
- 238000012549 training Methods 0.000 claims abstract description 29
- 238000010168 coupling process Methods 0.000 claims abstract description 28
- 238000005859 coupling reaction Methods 0.000 claims abstract description 28
- 230000008878 coupling Effects 0.000 claims abstract description 26
- 239000011159 matrix material Substances 0.000 claims description 131
- 230000006870 function Effects 0.000 claims description 40
- 238000004364 calculation method Methods 0.000 claims description 31
- 230000008859 change Effects 0.000 claims description 24
- 238000003860 storage Methods 0.000 claims description 17
- 230000007613 environmental effect Effects 0.000 claims description 15
- 230000002457 bidirectional effect Effects 0.000 claims description 14
- 230000004913 activation Effects 0.000 claims description 13
- 238000004590 computer program Methods 0.000 claims description 12
- 230000008569 process Effects 0.000 claims description 11
- 238000010219 correlation analysis Methods 0.000 claims description 9
- 238000000605 extraction Methods 0.000 claims description 9
- 239000000284 extract Substances 0.000 claims description 8
- 239000000126 substance Substances 0.000 claims description 7
- 230000002776 aggregation Effects 0.000 claims description 6
- 238000005054 agglomeration Methods 0.000 claims description 4
- 238000012545 processing Methods 0.000 claims description 4
- 238000012216 screening Methods 0.000 claims description 4
- 238000000926 separation method Methods 0.000 claims description 4
- 238000012163 sequencing technique Methods 0.000 claims description 4
- 238000005457 optimization Methods 0.000 claims description 3
- 230000002441 reversible effect Effects 0.000 claims description 2
- 238000012821 model calculation Methods 0.000 claims 1
- 230000009466 transformation Effects 0.000 claims 1
- 238000007405 data analysis Methods 0.000 abstract description 3
- 230000000694 effects Effects 0.000 description 27
- 238000013527 convolutional neural network Methods 0.000 description 11
- 230000008901 benefit Effects 0.000 description 10
- 238000011156 evaluation Methods 0.000 description 10
- 238000003062 neural network model Methods 0.000 description 8
- 238000011160 research Methods 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 7
- 238000009826 distribution Methods 0.000 description 7
- 238000002474 experimental method Methods 0.000 description 7
- 230000006872 improvement Effects 0.000 description 7
- 238000004422 calculation algorithm Methods 0.000 description 5
- 230000000875 corresponding effect Effects 0.000 description 5
- 230000007246 mechanism Effects 0.000 description 5
- 230000007774 longterm Effects 0.000 description 4
- 238000010801 machine learning Methods 0.000 description 4
- 230000002159 abnormal effect Effects 0.000 description 3
- 230000002596 correlated effect Effects 0.000 description 3
- 230000000306 recurrent effect Effects 0.000 description 3
- 238000004220 aggregation Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000013136 deep learning model Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000001537 neural effect Effects 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 101001095088 Homo sapiens Melanoma antigen preferentially expressed in tumors Proteins 0.000 description 1
- 102100037020 Melanoma antigen preferentially expressed in tumors Human genes 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- YHXISWVBGDMDLQ-UHFFFAOYSA-N moclobemide Chemical compound C1=CC(Cl)=CC=C1C(=O)NCCN1CCOCC1 YHXISWVBGDMDLQ-UHFFFAOYSA-N 0.000 description 1
- 239000000178 monomer Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G06Q50/40—
Abstract
本发明涉及城市轨道交通客流数据分析技术领域,提供一种基于深度图神经网络和环境融合的轨道客流预测方法,包括:将乘客进站量数据集与外部环境影响因素数据集耦合,耦合后分为训练集和测试集;利用训练集对时空图卷积模型训练,获得第一预测客流量数据;计算第一预测客流量数据与真实客流量数据之间损失,优化时空图卷积模型;将测试集输入优化的时空图卷积模型,获得第二预测客流量数据;计算第二预测客流量数据和真实客流量数据之间损失,将该损失与前一损失对比判断优化后的时空图卷积模型是否出现欠拟合或者过拟合,若是,则调整模型的超参数,直至不再出现欠拟合或者过拟合,然后利用调整好超参数的模型对待测的乘客进站量进行预测。
Description
技术领域
本发明涉及城市轨道交通客流数据分析技术领域,尤其涉及一种基于深度图神经网络和环境融合的轨道客流预测方法、系统、电子设备以及计算机可读存储介质。
背景技术
近年来,我国城市轨道交通由大规模建设转为大规模安全服役阶段,轨道交通网络规模不断扩大,客流运营与管理压力日益提升,轨道交通网络供给与客流需求运力匹配的协调至关重要。在当前新技术、新算法和新理念的综合加持下,轨道交通系统迎来了一大波创新性的研究成果,轨道交通客流预测方法的研究也受到广泛的关注。准确的客流预测在轨道交通列车调控、轨道交通警报发布、服务效率提升的工作中起到至关重要的作用。然而,在城市轨道交通客流规模扩张和城市用地布局多变的复杂环境下,轨道交通“网-线-站”多粒度动态客流预测非常困难,同时在外部因素的干扰下,例如环境因素、节假日、大型活动等,高度的非线性和不确定性给客流预测带来了严峻的挑战。因此,构建融合巨量异构客流和复杂外在因素的轨道交通高精度预测模型是极为迫切。
目前,国内外在轨道交通乘客出行特征的研究中完成了丰富的工作,但是将乘客区域出行特征融合客流预测工作的较少。在轨道交通客流预测中,网络中站点的随地理位置的不同,具有的客流分布特征不同,且受周围例如重大活动、极端天气等影响时客流产生突变,整体客流是非线性的,基于数理统计分析的预测模型在面对较大变动的客流时往往不能实现良好的预测效果。在基于数理统计分析和浅层机器学习的模型中,通常需要通过组合模型进行交通预测工作以达到高精度的预测效果,且面对的预测对象为单条道路或者单个站点,在整个轨道线网中通常不能进行高精度的预测。
数据源是轨道交通客流预测的关键基础,面对海量多源数据,数据的整理、清洗、特征提取和建模等各个环节都异常重要。以往的研究也尝试利用地铁AFC系统数据基于K-means算法挖掘典型站点的客流分布特征,定义了上海市各个站点的站点属性特征;基于分时降雨量数据和OD客流数据,利用Prophet模型对降雨天气下的进站客流做预测分析等,但是将乘客区域出行特征融合客流预测工作的较少。
现有技术中,有的学者将AR模型与卷积神经网络和深度神经网络组合,提出一种卷积神经网络-循环神经网络-自回归(CNN-LSTM-AR)模型,该模型可以同时处理客流量中线性和非线性特征从而进行高精度预测;在2003年首次将非参数回归的方法应用于交通流量预测中,并对基础的非参数回归方法进行改进,引入密集度变k算法和基于动态聚类的历史数据分析算法;有人对比了K近邻非参数回归模型以及贝叶斯组合模型在早高峰、平峰、晚高峰以及全天客流量分布中的预测性能等。然而在轨道交通客流预测中,网络中站点的随地理位置的不同,具有的客流分布特征不同,且受周围例如重大活动、极端天气等影响时客流产生突变,整体客流是非线性的,基于数理统计分析的预测模型在面对较大变动的客流时往往不能实现良好的预测效果。有人为了处理客流异常值情况下的城市轨道交通客流预测问题,提出了一种基于支持向量回归机(SVR)和长短时记忆神经网络(LSTM)模型融合的组合模型SVR-LSTM,输入特征为异常情况下乘客的进站时间序列来反应客流的异常波动。但浅层机器学习的模型中,通常需要通过组合模型进行交通预测工作以达到高精度的预测效果,且面对的预测对象为单条道路或者单个站点,在整个轨道线网中通常不能进行高精度的预测。
基于深度学习的方法主要分为循环神经网络模型(Rerrent Neural Network,RNN)和卷积神经网络(Convolutional Neural Network, CNN)。在循环神经网络的研究中,早期的循环神经网络模型主要为RNN模型,经过研究发展,RNN模型的变种长短时记忆神经网络LSTM模型和门循环控制单元GRU模型被广泛应用到时间序列预测工作之中。有人给交通量数据中加入噪音数据,探究RNN模型对时间序列中噪音数据的预测性能,提出了一种双向RNN模型Bi-RNN,并对RNN中多对一、多对多和Encoder-Decoder框架做了对比试验,最终在Bi-RNN选择了多对多的框架;而有人提出了一种由变分模态分解和GRU组合的改进门循环控制单元模型VMD-GRU,模型通过VMD模块对轨道交通客流时间序列进行分解,减少序列中的噪音数据,使整体客流分布区间更加平顺,进而利用GRU模块进行预测工作,但依然只能对单一路段预测不能对多路段预测;在卷积神经网络的研究中,学者们突破了以往客流交通流预测在单一路段束缚,将预测范围延展为区域预测,其中有人建立了一种卷积神经网络和循环神经网络组合的模型CNN-BiLSTM,模型通过对网格状区域划分的道路网络进行预测,利用CNN模块捕捉不同区域之间的关联性,将区域属性联通交通量时间序列数据输入BiLSTM模块进行预测工作;还有人研究了大规模交通流的预测工作,提出了一种基于TF-3DNet的三维卷积网络3DCNN实现对网络交通流的预测,其模型主要利用3D卷积核同时提取区域交通流中的时间和空间特征从而进行预测工作。虽然在基于深度学习的模型中,深度模型单体总体显示了高于数理统计分析和浅层机器学习模型的预测性能,且在融合CNN模块后可以进行区域性的预测工作,但是CNN的局限性在于其结构只能针对规则的网格结构进行空间特征的提取,这也就是学者们在基于CNN模型的研究中大多预测对象对可以将道路划分为网格结构的交通流数据,在轨道交通网络中各个站点之间呈现明显的非欧结构,无法使用CNN模型作为其预测框架,也不能加入环境要素例如节假日、天气等环境因素对轨道交通客流影响。
发明内容
本发明的目的在于解决背景技术中的至少一个技术问题,提供一种基于深度图神经网络和环境融合的轨道客流预测方法、系统、电子设备和计算机可读存储介质。
本发明提出一种可以借助图邻接矩阵进行网络拓扑模型学习的图卷积神经网络(GCN)模型,该模型可以根据轨道交通网络拓扑结构进行站点间空间关系的学习,将基于区域预测的深度学习模型应用于轨道交通客流预测领域;以此为出发点,进一步采用轨道交通进出站刷卡数据(AFC数据,Automatic Fare Collection)和外部的环境数据,以城市轨道交通网络和站点的客流为研究对象,开展轨道交通乘客出行特征分析、短时客流预测方法等方面的基础理论和应用方法研究,构建了融合复杂外在因素的客流预测模型-强相关性外界因素耦合的强化特征客流预测模型(GCN Passenger flow forecasting modelintegrating complex external strong correlation factors,IEF-BT-GCN),将时空加强特征和环境影响因素特征与进站客流量的时间序列进行融合进行基于多维度特征的客流预测工作。模型在计算过程中经过1000次迭代即可收敛,大大减少了迭代次数,其预测性能在短期预测有着最好的表现;面对低进站客流值的站点时预测效果与基线模型相比精度大幅提高,在进站客流分布有明显周期性的站点中对峰值的把握相对基线模型有一定提升;在极端天气和节假日的预测中,IEF-BT-GCN模型面对节假日的客流突变时在假期中客流峰值的预测中精度相比基线模型有所提升,在极端天气对客流影响的捕捉中精度相比基线模型提升明显。
为实现上述发明目的,本发明提供一种基于深度图神经网络和环境融合的轨道客流预测方法,包括:
获取轨道线网乘客进站量数据集,将所述轨道线网乘客进站量数据集与外部环境影响因素数据集进行耦合,将耦合后的矩阵数据分为训练集和测试集;
采用时空图卷积模型,利用所述训练集对所述时空图卷积模型进行训练,获得第一预测客流量数据;
计算所述第一预测客流量数据与真实客流量数据之间的损失,优化所述时空图卷积模型;
将所述测试集输入完成优化的所述时空图卷积模型,获得第二预测客流量数据;
计算所述第二预测客流量数据和真实客流量数据之间的损失,将该损失与所述第一预测客流量数据与真实客流量数据之间的损失进行对比判断优化后的所述时空图卷积模型是否出现欠拟合或者过拟合现象,若是,则调整完成优化的所述时空图卷积模型的超参数,调整后再对所述测试集进行测试,直至不再出现欠拟合或者过拟合现象;
利用调整好超参数的所述时空图卷积模型对待测的轨道线网乘客进站量进行预测。
根据本发明的一个方面,所述外部环境影响因素数据集包括:站点类别特征数据、时间强化特征数据、节假日影响特征数据和天气影响特征数据。
根据本发明的一个方面,将所述轨道线网乘客进站量数据集与外部环境影响因素数据集进行耦合的方法为:
根据所述轨道线网乘客进站量数据集构建线网进站客流量特征矩阵Z;
其中,值为输入外部因素类别数量,为F第类外部影响因素矩阵,i取1、2···m,,当时表示第i类外部影响因素随着时间变化会发生变化,其矩阵形式为,其中为时间序列长度,为轨道线网站点数量;表示在外部影响因素为i、第n个轨道线网站点、时间为t时的特征值;当时表示第i类外部影响因素与时间变化无关,其矩阵形式为;T表示矩阵的转置;表示在外部影响因素为i,第n个轨道线网站点时的特征值;其中线网进站客流量特征矩阵Z为:
根据本发明的一个方面,所述站点类别特征数据的提取方法为:
重复计算每个样本到的欧氏距离并更新,直到值收敛或者达到设置的迭代次数;对每个站点的特征区别定义为早晚高峰以及平峰占全天客流量百分比差异,分别提取每个站点对应时段的进站客流量并以站点序号排序,利用K-means函数进行基于不同时段进站客流占比的站点分类获得所述站点类别特征数据;
其中,为k个聚类中心之间的欧氏距离,L=1,2…k,L为聚类中心数量;为每个聚类中心周围相似对象组成簇;SSE为误差平方准则;x为任选的相似对象组成簇;为范数;表示的是所有样本各自的轮廓系数;max()为最大值函数,表示取其中最大的值;表示的是某样本点与同簇样本平均距离和凝聚度;表示的是某样本点与相邻簇全部样本的平均距离和分离度;表示的是平均轮廓系数,取值范围在[-1,1]之间;n为轮廓系数取值样本数。
根据本发明的一个方面,所述时间强化特征数据的提取方法为:基于时间构建时间特征参数,其中,时间特征参数以时间的时位和分钟位顺序排列构成。
根据本发明的一个方面,所述天气影响特征数据的提取方法为:通过相关性分析来找出降雨量、最高气温、最低气温和空气质量中与轨道线网乘客进站量有强相关性的因素作为天气影响因素的特征值;
所述相关性分析通过筛选轨道线网乘客进站量与降雨量、最高气温、最低气温和空气质量的皮尔逊相关系数实现,公式为:
其中,X和Y分为两组待挖掘隐藏关系的数列,X为轨道线网乘客进站量、降雨量、最高气温、最低气温和空气质量中的任一种,Y为轨道线网乘客进站量、降雨量、最高气温、最低气温和空气质量中的任一种,为相关系数,表示相关性大小,cov代表的是X和Y之间的协方差,和分别为数列X和Y之间的标准差。
根据本发明的一个方面,所述节假日影响特征数据的提取方法为:将工作日定义为特征值1,将法定公休日定义为特征值2,将法定节假日定义为特征值3。
根据本发明的一个方面,所述时空图卷积模型包括图卷积网络GCN层、双向长短时记忆神经网络BiLSTM层、激活层和损失函数计算层。
根据本发明的一个方面,所述图卷积网络GCN层将轨道线网所有站点的乘客进站量提取出空间维度的特征,计算公式为:
选择2层图卷积作为图卷积网络GCN层属性,
其中,D表示度矩阵,对角线上的元素为图中各个顶点的度,表示每个顶点的度;A表示以轨道交通线网为基础建立的邻接矩阵;表示邻接矩阵A上B行G列的值;B表示矩阵的第B行;G表示矩阵的第G列;为优化后的邻接矩阵;为优化后的度矩阵;为单位矩阵;L表示拉普拉斯矩阵;U表示是拉普拉斯矩阵经过特征值分解得到的正交矩阵;是矩阵U的转置,T为转置符号;为n个特征值构成的对角阵;为特征值;表示第l层的特征矩阵;表示在特定层L层中的可训练权重矩阵;为线网进站客流量特征矩阵;表示激活函数。
根据本发明的一个方面,所述双向长短时记忆神经网络BiLSTM层对融合了所述空间维度的特征的乘客进站量提取出时间维度的特征,其中单向的LSTM模型计算公式为:
其中,表示遗忘层输出的遗忘权重结果;为遗忘门中和的权重矩阵;表示t时刻2层图神经网络输出的隐藏层的隐藏状态;为当前时刻输入的外部特征序列;为遗忘门中的偏置参数;表示记忆层输出的记忆权重结果;为记忆门中和的权重矩阵;为记忆门中的偏置参数;表示描述当前细胞记忆状态的参数;sigmoid、tanh为激活函数;表示记忆细胞状态储存单元中和的权重矩阵;表示记忆细胞状态储存单元中的偏置参数;表示t-1时刻的记忆状态;表示当前时刻的记忆状态;表示输出层输出的遗忘权重结果;为输出门中和的权重矩阵;为输出门中的偏置参数;表示模型t时刻的输出;
根据本发明的一个方面,所述激活层为全连接层,全连接层将BiLSTM输出的多维向量进行维度转变,最终得到所需维度进行输出,计算过程如以下公式:
根据本发明的一个方面,所述损失函数计算层采用损失函数loss计算预测客流量数据与真实客流量数据之间的损失,计算公式为:
为实现上述目的,本发明还提供一种基于深度图神经网络和环境融合的轨道客流预测系统,包括:
数据获取模块,获取轨道线网乘客进站量数据集,将所述轨道线网乘客进站量数据集与外部环境影响因素数据集进行耦合,将耦合后的矩阵数据分为训练集和测试集;
模型训练模块,采用时空图卷积模型,利用所述训练集对所述时空图卷积模型进行训练,获得第一预测客流量数据;
模型优化模块,计算所述第一预测客流量数据与真实客流量数据之间的损失,优化所述时空图卷积模型;
客流量预测模块,将所述测试集输入完成优化的所述时空图卷积模型,获得第二预测客流量数据;
客流量校准模块,计算所述第二预测客流量数据和真实客流量数据之间的损失,将该损失与所述第一预测客流量数据与真实客流量数据之间的损失进行对比判断优化后的所述时空图卷积模型是否出现欠拟合或者过拟合现象,若是,则调整完成优化的所述时空图卷积模型的超参数,调整后再对所述测试集进行测试,直至不再出现欠拟合或者过拟合现象;
实际客流量预测模块,利用调整好超参数的所述时空图卷积模型对待测的轨道线网乘客进站量进行预测。
为实现上述目的,本发明还提供一种电子设备,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现上述基于深度图神经网络和环境融合的轨道客流预测方法。
为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现上述基于深度图神经网络和环境融合的轨道客流预测方法。
根据本发明的方案,IEF-BT-GCN模型大大减少了迭代次数,其预测性能在短期预测有着最好的表现;IEF-BT-GCN模型面对低进站客流值的站点时预测效果与基线模型相比精度大幅提高;IEF-BT-GCN模型在极端天气和节假日的预测中,该模型面对节假日的客流突变时在假期中客流峰值的预测中精度相比基线模型有所提升,在极端天气对客流影响的捕捉中精度相比基线模型提升明显。
根据本发明的方案,本发明提出的是考虑低进站客流或者高进站客流特征和外部环境影响的轨道交通路网客流的预测方法。结合GCN模型(图卷积网络模型)可以捕捉轨道交通线网站点间空间关系的优点和BiLSTM模型(双向长短时记忆神经网络模型)对时间序列数据高精度预测优点,构建轨道交通客流短时预测模型框架BT-GCN。考虑轨道交通时空特征,外部环境影响因素数据特征,捕捉历史进站客流数据与当前时刻进站客流量的相关程度并将相关程度以权重的形式表示。本发明所提模型可以综合考虑进站客流时空特征和外部环境影响因素特征并以历史数据相关时间点对时空属性进行加强工作,从而进行准确的客流预测。
本发明依靠神经网络,将快速获得的规定时间段内各个站点的进出站客流数据映射到高维特征空间中的特性进行各种特征的学习,得到不同时间和不同站点之间的相关特征值。本发明提出的IEF-BT-GCN模型是由BT-GCN和特征耦合IEF两个模块组成的神经网络模型。该模型用于轨道交通客流预测,在传统的轨道交通线网客流预测工作中增加对历史数据特征和外部影响特征的增强工作,进一步提升时空图卷积模型在轨道交通线网客流预测中的精度。本发明一方面提高了中短期进站客流预测的稳定性,另一方面在面对客流峰值以及非周期性客流变化时模型预测精度高于BT-GCN模型,且在低进站客流值情况下预测精度提高更加明显。这对轨道交通列车调控、轨道交通警报发布、以及服务效率提升的工作中起到至关重要的作用。
附图说明
图1示意性表示根据本发明的一种实施方式的基于深度图神经网络和环境融合的轨道客流预测方法的流程图;
图2示意性表示IEF-BT-GCN模型的结构图;
图3示意性表示根据本发明的一种实施方式的基于深度图神经网络和环境融合的轨道客流预测系统的结构框图;
图4表示不同隐藏单元数下平均绝对误差(MAE)、均方根误差(RMSE)对比图;
图5表示不同隐藏单元数下准确度(accuracy)、决定系数(R2)和可释方差得分(EVS)对比图;
图6表示不同预测时长下IEF-BT-GCN模型RMSE变化图;
图7表示不同预测时长下IEF-BT-GCN模型MAE变化图。
具体实施方式
现在将参照示例性实施例来论述本发明的内容。应当理解,论述的实施例仅是为了使得本领域普通技术人员能够更好地理解且因此实现本发明的内容,而不是暗示对本发明的范围的任何限制。
如本文中所使用的,术语“包括”及其变体要被解读为意味着“包括但不限于”的开放式术语。术语“基于”要被解读为“至少部分地基于”。术语“一个实施例”和“一种实施例”要被解读为“至少一个实施例”。
图1示意性表示根据本发明的一种实施方式的基于深度图神经网络和环境融合的轨道客流预测方法的流程图。如图1所示,基于深度图神经网络和环境融合的轨道客流预测方法,包括:
获取轨道线网乘客进站量数据集,将所述轨道线网乘客进站量数据集与外部环境影响因素数据集进行耦合,将耦合后的矩阵数据分为训练集和测试集;
采用时空图卷积模型,利用所述训练集对所述时空图卷积模型进行训练,获得第一预测客流量数据;
计算所述第一预测客流量数据与真实客流量数据之间的损失,优化所述时空图卷积模型;
将所述测试集输入完成优化的所述时空图卷积模型,获得第二预测客流量数据;
计算所述第二预测客流量数据和真实客流量数据之间的损失,将该损失与所述第一预测客流量数据与真实客流量数据之间的损失进行对比判断优化后的所述时空图卷积模型是否出现欠拟合或者过拟合现象,若是,则调整完成优化的所述时空图卷积模型的超参数,调整后再对所述测试集进行测试,直至不再出现欠拟合或者过拟合现象;
利用调整好超参数的所述时空图卷积模型对待测的轨道线网乘客进站量进行预测。
根据本发明的一种实施方式,基于研究区域内地铁运营AFC系统收集的乘客进出站数据,通过以15min粒度为单位的客流聚合工作,得到轨道线网乘客进站量数据集。外部环境影响因素数据集包括:站点类别特征数据、时间强化特征数据、节假日影响特征数据和天气影响特征数据。
其中,站点类别特征数据的提取方法为:
重复计算每个样本到的欧氏距离并更新,直到值收敛或者达到设置的迭代次数;对每个站点的特征区别定义为早晚高峰以及平峰占全天客流量百分比差异,分别提取每个站点对应时段的进站客流量并以站点序号排序,利用K-means函数进行基于不同时段进站客流占比的站点分类获得所述站点类别特征数据;
其中,为k个聚类中心之间的欧氏距离,L=1,2…k,L为聚类中心数量;为每个聚类中心周围相似对象组成簇;为误差平方准则;x为任选的相似对象组成簇;为范数;表示的是所有样本各自的轮廓系数;max()为最大值函数,表示取其中最大的值;表示的是某样本点与同簇样本平均距离和凝聚度;表示的是某样本点与相邻簇全部样本的平均距离和分离度;表示的是平均轮廓系数,取值范围在之间;n为轮廓系数取值样本数。
时间强化特征数据的提取方法为:基于时间构建时间特征参数,其中,时间特征参数以时间的时位和分钟位顺序排列构成。例如下表1中所示:
天气影响特征数据的提取方法为:通过相关性分析来找出降雨量、最高气温、最低气温和空气质量中与轨道线网乘客进站量有强相关性的因素作为天气影响因素的特征值;
相关性分析通过筛选轨道线网乘客进站量与降雨量、最高气温、最低气温和空气质量的皮尔逊相关系数实现,公式为:
其中,X和Y分为两组待挖掘隐藏关系的数列,X为轨道线网乘客进站量、降雨量、最高气温、最低气温和空气质量中的任一种,Y为轨道线网乘客进站量、降雨量、最高气温、最低气温和空气质量中的任一种,为相关系数,表示相关性大小,cov代表的是X和Y之间的协方差,和分别为数列X和Y之间的标准差。
在本实施方式中,根据相关性系数计算结果,选降雨量、最高气温、最低气温和空气质量中与线网总进站客流量呈现相关性且相关系数最大的天气因素(即强相关性因素)作为天气影响因素的输入特征,其特征以日为单位。
节假日影响特征数据的提取方法为:将工作日定义为特征值1,将法定公休日定义为特征值2,将法定节假日定义为特征值3。其中,特征值1、特征值2和特征值3用于计算,即将每一日定义为一种数值,作为特征值加入外界因素耦合矩阵中。
进一步地,在本实施方式中,将轨道线网乘客进站量数据集与外部环境影响因素数据集进行耦合的方法为:
根据轨道线网乘客进站量数据集构建线网进站客流量特征矩阵Z;
其中,m值为输入外部因素类别数量,为中第类外部影响因素矩阵,i取1、2···m,,当时表示第i类外部影响因素随着时间变化会发生变化,其矩阵形式为,其中为时间序列长度,为轨道线网站点数量;表示在外部影响因素为i、第n个轨道线网站点、时间为t时的特征值;当时表示第i类外部影响因素与时间变化无关,其矩阵形式为;T表示矩阵的转置;表示在外部影响因素为i,第n个轨道线网站点时的特征值;其中线网进站客流量特征矩阵Z为:
进一步地,根据本发明的一种实施方式,时空图卷积模型包括图卷积网络GCN层、双向长短时记忆神经网络BiLSTM层、激活层和损失函数计算层,图2表示时空图卷积模型的结构图(BT-GCN)。
其中,将研究实践范围内每个时间段轨道交通线网所有站点的进站客流客流量矩阵X作为输入信息送入图卷积网络GCN层进行空间维度的特征提取工作,在本实施方式中,选择2层图卷积作为图卷积网络GCN层属性,其计算公式如下:
其中,D表示度矩阵,对角线上的元素为图中各个顶点的度,表示每个顶点的度;A表示以轨道交通线网为基础建立的邻接矩阵;表示邻接矩阵A上B行G列的值;B表示矩阵的第B行;G表示矩阵的第G列;为优化后的邻接矩阵;为优化后的度矩阵;为单位矩阵;L表示拉普拉斯矩阵;U表示是拉普拉斯矩阵经过特征值分解得到的正交矩阵;是矩阵U的转置,T为转置符号;为n个特征值构成的对角阵;为特征值;表示第l层的特征矩阵;表示在特定层L层中的可训练权重矩阵;为线网进站客流量特征矩阵;表示激活函数。
进一步地,在本实施方式中,双向长短时记忆神经网络BiLSTM层对融合了所述空间维度的特征的客流量提取出时间维度的特征,此时双向长短时记忆神经网络BiLSTM层中的单项LSTM模型三个门控制单元公式采用以下公式:
其中,表示遗忘层输出的遗忘权重结果;为遗忘门中和的权重矩阵;表示t时刻2层图神经网络输出的隐藏层的隐藏状态;为当前时刻输入的外部特征序列;为遗忘门中的偏置参数;表示记忆层输出的记忆权重结果;为记忆门中和的权重矩阵;为记忆门中的偏置参数;表示描述当前细胞记忆状态的参数;sigmoid、tanh为激活函数;表示记忆细胞状态储存单元中和的权重矩阵;表示记忆细胞状态储存单元中的偏置参数;表示t-1时刻的记忆状态;表示当前时刻的记忆状态;表示输出层输出的遗忘权重结果;为输出门中和的权重矩阵;为输出门中的偏置参数;表示模型t时刻的输出。
由此可以得到分别经过图卷积网络GCN层和双向长短时记忆神经网络BiLSTM层后融合了时间和空间特征属性的轨道交通线网进站客流。
进一步地,在本实施方式中,激活层为全连接层,计算过程如以下公式:
进一步地,在本实施方式中,损失函数计算层在针对轨道交通线网进站客流预测的过程中,为了追求预测误差的最小化,采用损失函数来判定预测的结果好坏,同时还要防止过度关注测试集误差时所导致的模型过拟合情况。因此在损失函数的计算中,定义yt为模型预测值(即第一预测客流量数据),yyt为实际的进站客流量(即真实客流量数据),引入L2正则化项加强模型的抗扰动性,具体计算公式如下:
其中,为正则化系数,合理的系数可以减小正则化中代价函数最值参数,起到避免模型的过拟合现象,但是过大的系数会导致模型欠拟合现象的出现。故在本实施方式中通过逐渐增大系数值的方式找出模型最适合的正则化系数,从而优化上述基于(融合)注意力机制的时空图卷积模型。
进一步地,根据本发明的一种实施方式,将测试集输入上述优化后的时空图卷积模型后会得到第二预测客流量数据。得到第二客流量数据后,按照上述方式,通过损失函数loss来计算第二预测客流量数据与真实客流量数据之间的损失,然后将该损失与上述第一预测客流量数据与真实客流量数据之间的损失进行对比,通过对比结果判断优化后的时空图卷积模型是否出现欠拟合或者过拟合现象,若是(欠拟合:两者损失值很大,且模型损失函数未收敛;过拟合:训练集损失值很小,但预测集损失随迭代次数的增加变大),则调整优化后的时空图卷积模型中的超参数(对于欠拟合可以进行增加迭代次数和增大学习率的策略;对于过拟合可以采用提前终止模型或者增加数据集等策略来避免)设置,调整后再对测试集进行测试,直至不再出现欠拟合或者过拟合现象。如此方案可以有效地提高本发明的预测轨道交通客流的模型的稳定性,加强模型的抗扰动性,使得轨道交通客流的预测结果精准有效,对于轨道交通列车调控、轨道交通警报发布、以及服务效率提升的工作中起到至关重要的作用。
根据本发明的上述方案,本发明提出的是考虑低进站客流或者高进站客流特征的轨道交通路网客流的预测方法。结合GCN模型(图卷积网络模型)可以捕捉轨道交通线网站点间空间关系的优点和BiLSTM模型(双向长短时记忆神经网络模型)对时间序列数据高精度预测优点,构建轨道交通客流短时预测模型框架BT-GCN。考虑轨道交通时空特征,外部环境影响因素数据特征,捕捉历史进站客流数据与当前时刻进站客流量的相关程度并将相关程度以权重的形式表示。本发明所提模型可以综合考虑进站客流时空特征和外部环境影响因素特征并以历史数据相关时间点对时空属性进行加强工作,从而进行准确的客流预测。
本发明依靠神经网络,将快速获得的规定时间段内各个站点的进出站客流数据映射到高维特征空间中的特性进行各种特征的学习,得到不同时间和不同站点之间的相关特征值。本发明提出的IEF-BT-GCN模型是由BT-GCN和特征耦合IEF两个模块组成的神经网络模型。该模型用于轨道交通客流预测,在传统的轨道交通线网客流预测工作中增加对历史数据特征和外部影响特征的增强工作,进一步提升时空图卷积模型在轨道交通线网客流预测中的精度。本发明一方面提高了中短期进站客流预测的稳定性,另一方面在面对客流峰值以及非周期性客流变化时模型预测精度高于BT-GCN模型,且在低进站客流值情况下预测精度提高更加明显。这对轨道交通列车调控、轨道交通警报发布、以及服务效率提升的工作中起到至关重要的作用。
在本发明中,考虑到天气影响因素的影响范围为某市市域,覆盖了整体轨道线网,所以在挖掘进站客流量雨天气影响之间关系时以15min为粒度的轨道线网乘客进站量为分析序列。利用SPSS软件分别计算分时线网总进站客流量、降雨量、最高气温、最低气温和空气质量五者之间的相关系数。天气影响因素与客流相关性系数计算结果如表2所示,其中**表示显著性检验结果,表明两数列之间不相关记录的可能性小于1%,即两组数列有相关性。
在相关性系数计算结果中,与轨道线网乘客进站量相关的因素有降雨量以及空气质量两个因素,但从表2中可以看到空气质量因素与其他四组数列全部呈现相关性,且与降雨量、最高气温和最低气温的相关系数大小均大于与轨道线网乘客进站量的相关系数,因此定义空气质量变化为气温和降雨变化的附属变化。最终本文选择四种天气因素中与轨道线网乘客进站量呈现相关性且相关系数最大的降雨量作为天气影响因素的输入特征,其特征以日为单位具体数值如表3所示。
为实现上述目的,本发明还提供一种融合注意力机制和图神经网络的轨道交通客流预测系统,其结构框图如图3所示,具体包括:
数据获取模块,获取轨道线网乘客进站量数据集,将所述轨道线网乘客进站量数据集与外部环境影响因素数据集进行耦合,将耦合后的矩阵数据分为训练集和测试集;
模型训练模块,采用时空图卷积模型,利用所述训练集对所述时空图卷积模型进行训练,获得第一预测客流量数据;
模型优化模块,计算所述第一预测客流量数据与真实客流量数据之间的损失,优化所述时空图卷积模型;
客流量预测模块,将所述测试集输入完成优化的所述时空图卷积模型,获得第二预测客流量数据;
客流量校准模块,计算所述第二预测客流量数据和真实客流量数据之间的损失,将该损失与所述第一预测客流量数据与真实客流量数据之间的损失进行对比判断优化后的所述时空图卷积模型是否出现欠拟合或者过拟合现象,若是,则调整完成优化的所述时空图卷积模型的超参数,调整后再对所述测试集进行测试,直至不再出现欠拟合或者过拟合现象;
实际客流量预测模块,利用调整好超参数的所述时空图卷积模型对待测的轨道线网乘客进站量进行预测。
根据本发明的一种实施方式,基于研究区域内地铁运营AFC系统收集的乘客进出站数据,通过以15min粒度为单位的客流聚合工作,得到轨道线网乘客进站量数据集。外部环境影响因素数据集包括:站点类别特征数据、时间强化特征数据、节假日影响特征数据和天气影响特征数据。
其中,站点类别特征数据的提取方法为:
重复计算每个样本到的欧氏距离并更新,直到值收敛或者达到设置的迭代次数;对每个站点的特征区别定义为早晚高峰以及平峰占全天客流量百分比差异,分别提取每个站点对应时段的进站客流量并以站点序号排序,利用K-means函数进行基于不同时段进站客流占比的站点分类获得所述站点类别特征数据;
其中,为k个聚类中心之间的欧氏距离,L=1,2…k,L为聚类中心数量;为每个聚类中心周围相似对象组成簇;为误差平方准则;x为任选的相似对象组成簇;为范数;表示的是所有样本各自的轮廓系数;max()为最大值函数,表示取其中最大的值;表示的是某样本点与同簇样本平均距离和凝聚度;表示的是某样本点与相邻簇全部样本的平均距离和分离度;表示的是平均轮廓系数,取值范围在之间;n为轮廓系数取值样本数。
时间强化特征数据的提取方法为:基于时间构建时间特征参数,其中,时间特征参数以时间的时位和分钟位顺序排列构成。例如上表1中所示:天气影响特征数据的提取方法为:通过相关性分析来找出降雨量、最高气温、最低气温和空气质量中与轨道线网乘客进站量有强相关性的因素作为天气影响因素的特征值;
相关性分析通过筛选轨道线网乘客进站量与降雨量、最高气温、最低气温和空气质量的皮尔逊相关系数实现,公式为:
其中,X和Y分为两组待挖掘隐藏关系的数列,X为轨道线网乘客进站量、降雨量、最高气温、最低气温和空气质量中的任一种,Y为轨道线网乘客进站量、降雨量、最高气温、最低气温和空气质量中的任一种,为相关系数,表示相关性大小,cov代表的是X和Y之间的协方差,和分别为数列X和Y之间的标准差。
在本实施方式中,根据相关性系数计算结果,选降雨量、最高气温、最低气温和空气质量中与线网总进站客流量呈现相关性且相关系数最大的天气因素(即强相关性因素)作为天气影响因素的输入特征,其特征以日为单位。
节假日影响特征数据的提取方法为:将工作日定义为特征值1,将法定公休日定义为特征值2,将法定节假日定义为特征值3。其中,特征值1、特征值2和特征值3用于计算,即将每一日定义为一种数值,作为特征值加入外界因素耦合矩阵中。
进一步地,在本实施方式中,将轨道线网乘客进站量数据集与外部环境影响因素数据集进行耦合的方法为:
根据轨道线网乘客进站量数据集构建线网进站客流量特征矩阵Z;
其中,值为输入外部因素类别数量,为中第类外部影响因素矩阵,i取1、2···m,,当时表示第i类外部影响因素随着时间变化会发生变化,其矩阵形式为,其中为时间序列长度,为轨道线网站点数量;表示在外部影响因素为i、第n个轨道线网站点、时间为t时的特征值;当时表示第i类外部影响因素与时间变化无关,其矩阵形式为;T表示矩阵的转置;表示在外部影响因素为i,第n个轨道线网站点时的特征值;其中线网进站客流量特征矩阵Z为:
进一步地,根据本发明的一种实施方式,时空图卷积模型包括图卷积网络GCN层、双向长短时记忆神经网络BiLSTM层、激活层和损失函数计算层,图2表示时空图卷积模型的结构图(BT-GCN)。
其中,将研究实践范围内每个时间段轨道交通线网所有站点的进站客流客流量矩阵X作为输入信息送入图卷积网络GCN层进行空间维度的特征提取工作,在本实施方式中,选择2层图卷积作为图卷积网络GCN层属性,其计算公式如下:
其中,D表示度矩阵,对角线上的元素为图中各个顶点的度,表示每个顶点的度;A表示以轨道交通线网为基础建立的邻接矩阵;表示邻接矩阵A上B行G列的值;B表示矩阵的第B行;G表示矩阵的第G列;为优化后的邻接矩阵;为优化后的度矩阵;为单位矩阵;L表示拉普拉斯矩阵;U表示是拉普拉斯矩阵经过特征值分解得到的正交矩阵;是矩阵U的转置,T为转置符号;为n个特征值构成的对角阵;为特征值;表示第l层的特征矩阵;表示在特定层L层中的可训练权重矩阵;为线网进站客流量特征矩阵;表示激活函数。
进一步地,在本实施方式中,双向长短时记忆神经网络BiLSTM层对融合了所述空间维度的特征的客流量提取出时间维度的特征,此时双向长短时记忆神经网络BiLSTM层中的单项LSTM模型三个门控制单元公式采用以下公式:
其中,表示遗忘层输出的遗忘权重结果;为遗忘门中和的权重矩阵;表示t时刻2层图神经网络输出的隐藏层的隐藏状态;为当前时刻输入的外部特征序列;为遗忘门中的偏置参数;表示记忆层输出的记忆权重结果;为记忆门中和的权重矩阵;为记忆门中的偏置参数;表示描述当前细胞记忆状态的参数;sigmiod、tanh为激活函数;表示记忆细胞状态储存单元中和的权重矩阵;表示记忆细胞状态储存单元中的偏置参数;表示t-1时刻的记忆状态;表示当前时刻的记忆状态;表示输出层输出的遗忘权重结果;为输出门中和的权重矩阵;为输出门中的偏置参数;表示模型t时刻的输出。
由此可以得到分别经过图卷积网络GCN层和双向长短时记忆神经网络BiLSTM层后融合了时间和空间特征属性的轨道交通线网进站客流。
进一步地,在本实施方式中,激活层为全连接层,计算过程如以下公式:
进一步地,在本实施方式中,损失函数计算层在针对轨道交通线网进站客流预测的过程中,为了追求预测误差的最小化,采用损失函数来判定预测的结果好坏,同时还要防止过度关注测试集误差时所导致的模型过拟合情况。因此在损失函数的计算中,定义yt为模型预测值(即第一预测客流量数据),yyt为实际的进站客流量(即真实客流量数据),引入L2正则化项加强模型的抗扰动性,具体计算公式如下:
其中,为正则化系数,合理的系数可以减小正则化中代价函数最值参数,起到避免模型的过拟合现象,但是过大的系数会导致模型欠拟合现象的出现。故在本实施方式中通过逐渐增大系数值的方式找出模型最适合的正则化系数,从而优化上述基于(融合)注意力机制的时空图卷积模型。
进一步地,根据本发明的一种实施方式,将测试集输入上述优化后的时空图卷积模型后会得到第二预测客流量数据。得到第二客流量数据后,按照上述方式,通过损失函数loss来计算第二预测客流量数据与真实客流量数据之间的损失,然后将该损失与上述第一预测客流量数据与真实客流量数据之间的损失进行对比,通过对比结果判断优化后的时空图卷积模型是否出现欠拟合或者过拟合现象,若是(欠拟合:两者损失值很大,且模型损失函数未收敛;过拟合:训练集损失值很小,但预测集损失随迭代次数的增加变大),则调整优化后的时空图卷积模型中的超参数(对于欠拟合可以进行增加迭代次数和增大学习率的策略;对于过拟合可以采用提前终止模型或者增加数据集等策略来避免)设置,调整后再对测试集进行测试,直至不再出现欠拟合或者过拟合现象。如此方案可以有效地提高本发明的预测轨道交通客流的模型的稳定性,加强模型的抗扰动性,使得轨道交通客流的预测结果精准有效,对于轨道交通列车调控、轨道交通警报发布、以及服务效率提升的工作中起到至关重要的作用。
根据本发明的上述方案,本发明提出的是考虑低进站客流或者高进站客流特征和外部环境影响的轨道交通路网客流的预测方法。结合GCN模型(图卷积网络模型)可以捕捉轨道交通线网站点间空间关系的优点和BiLSTM模型(双向长短时记忆神经网络模型)对时间序列数据高精度预测优点,构建轨道交通客流短时预测模型框架BT-GCN。考虑轨道交通时空特征,外部环境影响因素数据特征,捕捉历史进站客流数据与当前时刻进站客流量的相关程度并将相关程度以权重的形式表示。本发明所提模型可以综合考虑进站客流时空特征和外部环境影响因素特征并以历史数据相关时间点对时空属性进行加强工作,从而进行准确的客流预测。
本发明依靠神经网络,将快速获得的规定时间段内各个站点的进出站客流数据映射到高维特征空间中的特性进行各种特征的学习,得到不同时间和不同站点之间的相关特征值。本发明提出的IEF-BT-GCN模型是由BT-GCN和特征耦合IEF两个模块组成的神经网络模型。该模型用于轨道交通客流预测,在传统的轨道交通线网客流预测工作中增加对历史数据特征和外部影响特征的增强工作,进一步提升时空图卷积模型在轨道交通线网客流预测中的精度。本发明一方面提高了中短期进站客流预测的稳定性,另一方面在面对客流峰值以及非周期性客流变化时模型预测精度高于BT-GCN模型,且在低进站客流值情况下预测精度提高更加明显。这对轨道交通列车调控、轨道交通警报发布、以及服务效率提升的工作中起到至关重要的作用。
在本发明中,考虑到天气影响因素的影响范围为某市市域,覆盖了整体轨道线网,所以在挖掘进站客流量雨天气影响之间关系时以15min为粒度的轨道线网乘客进站量为分析序列。利用SPSS软件分别计算分时线网总进站客流量、降雨量、最高气温、最低气温和空气质量五者之间的相关系数。天气影响因素与客流相关性系数计算结果如表1所示,其中**表示显著性检验结果,表明两数列之间不相关记录的可能性小于1%,即两组数列有相关性。
在相关性系数计算结果中,与轨道线网乘客进站量相关的因素有降雨量以及空气质量两个因素,但从上表1中可以看到空气质量因素与其他四组数列全部呈现相关性,且与降雨量、最高气温和最低气温的相关系数大小均大于与轨道线网乘客进站量的相关系数,因此定义空气质量变化为气温和降雨变化的附属变化。最终本文选择四种天气因素中与轨道线网乘客进站量呈现相关性且相关系数最大的降雨量作为天气影响因素的输入特征,其特征以日为单位具体数值如上表2所示。
为实现上述发明目的,本发明还提供一种电子设备,包括处理器、存储器及存储在存储器上并可在处理器上运行的计算机程序,计算机程序被处理器执行时实现如上所述的基于深度图神经网络和环境融合的轨道客流预测方法。
为实现上述发明目的,本发明还提供一种计算机可读存储介质,计算机可读存储介质上存储计算机程序,计算机程序被处理器执行时实现如上所述的基于深度图神经网络和环境融合的轨道客流预测方法。
为了进一步对比IEF-BT-GCN模型相较于现有技术进步之处,通过以下实验进一步对比和阐述。
实验环境
为保证本文提出模型的可重复性对实验运行环境进行说明:模型在Windows系统中Pycharm集成开发环境下利用Python进行编译。
实验数据集
实验数据分为轨道线网乘客进站量数据集、外部影响因素数据集两部分。
外部影响因素数据集包括站点类别特征、时间强化特征、节假日影响特征和天气影响特征,因不同因素的性质数据集形状不同,其中时间强化特征、节假日影响特征和天气影响特征随时间变化而变化,数据集形状为,站点类别特征不随时间变化,数据集形状为。
实验评价指标
回归评价指标是对模型预测工作效果的评价的定量指标,不同的评价方法可以从预测数据的不同角度对模型的性能进行反应。因为关于轨道交通客流预测的工作中,在每天的预测期起始点进站客流量值与峰值相比相差很远,此时段MAPE评价效果影响效果较大,且存在有些站点进站客流量为0的情况存在,故本发明所提模型选择平均绝对误差(MAE)、均方根误差(RMSE)、准确度(Accuracy)、决定系数(R2)、可释方差得分(EVS)五个评价指标进行评价工作。
实验超参数设置
如表4所示,IEF-BT-GCN模型超参数包括学习率、迭代次数、训练集和预测集大小比例、批量大小、优化器选择以及隐藏单元数六种。IEF-BT-GCN模型中学习率设置为0.01;迭代次数设置为3000;训练集和预测集大小比例为4:1;批量大小设置为100;优化器选择Adam模型。在隐藏单元数的选择中设置了隐藏单元数为8、16、32、64、128的五组对比实验并以64评价指标作为最终选取隐藏单元数量的依据,具体实验结果如下。在MAE和RMSE评价指标中,当隐藏单元数为64时,MAE和RMSE值同时达到最小,相较其他隐藏单元数分别降低了6.90%-47.64%和8.23%-45.14%;在Accuracy、和EVS评价指标中,同样当隐藏单元数为64时,MAE和RMSE值同时达到最小,相较其他隐藏单元数分别降低了1.71%-15.87%、0.97%-14.21%和1.01%-14.19%,两类评价指标的对比分别如图4和图5所示,最终选择隐藏单元数64作为模型输入。
综上,本文提出的IEF-BT-GCN模型超参数设置如表5所示。
基线模型选择
在基线模型选择部分同时加入ARIMA(线性模型)、SVR(机器学习模型)、BiLSTM(深度学习模型)、GCN(图神经网络模型)、BT-GCN(时空图卷积模型)、ATT-BT-GCN(融合注意力机制的时空图卷积模型)的模型进行效果对比,具体基线模型如表6所示。其中ATT-BT-GCN型只关注各个站点不同时间段进站客流量之间特征关系,在实际的轨道交通线网中各种外部因素例如天气、节假日、突发情况等都会对进站客流产生影响,然而神经网络在学习这些特征时仅凭各站点不同时间段进站客流量会非常困难,此时需要对影响进站客流量较大的因素进行人为标定,作为各站点对应时段的进站客流特征。
实验结果
在预测工作中,经过1000次迭代后,本文提出的IEF-BT-GCN达到收敛状态,因模型内部特征值较多的缘故在模型调整特征权重时预测会存在小幅波动,但是整体趋于稳定状态,训练集和预测集的每代误差逐渐下降,未出现过拟合情况。所有模型都以前1小时的进站客流量分别对15min、30min、60min后的进站客流量进行预测,并分别作为短期、中期、长期的预测结果,具体模型预测结果如表7所示。
注:*表示数值很小或负值,其预测效果小于直接取历史平均值预测效果。
实验结果表明,本文提出的IEF-BT-GCN模型在短期和长期预测中较ATT-BT-GCN(融合注意力机制的时空图卷积模型,ATT为Attention,即注意力机制)的基础上精确度进一步提升,在中期预测中模型效果与BT-GCN模型相似,预测效果低于ATT-BT-GCN模型。总体来说IEF-BT-GCN模型预测效果有进一步提升。
而且,在考虑不同预测时长的预测效果对比中,本发明提出的IEF-BT-GCN模型在短期预测中效果最好。相较基线模型在短期预测中RMSE和MAE分别降低了1.36%-63.79%和0.75%-66.9%;在中期预测中IEF-BT-GCN模型预测效果相比ATT-BT-GCN模型RMSE和MAE分别增加了12.39%和16.78%,相比其他基线模型RMSE和MAE分别降低了1.44%-57.96%和1.17%-61.12%;在长期预测中IEF-BT-GCN模型预测效果与BT-GCN模型和ATT-BT-GCN模型预测性能相似,相较两模型RMSE分别下降2.99%和3.88,MAE分别上升0.99%和3.67%,相较其他基线模型RMSE和MAE分别降低了10.28%-49.61%和7.39%-52.28%。
由此可知,本发明提出的IEF-BT-GCN模型在短期预测中效果最为突出,模型在随着预测时间增长时精度下降较快;在中期预测中效果差于ATT-BT-GCN;在中长期的预测中IEF-BT-GCN模型拥有左右基线模型中最好的稳定性,在长期预测中效果与BT-GCN模型和ATT-BT-GCN模型相似;不同预测时长下的RMSE和MAE对比图如6和图7所示。
不仅如此,本发明将短期预测下时空加强特征模型和考虑环境影响因素特征模型作为对比实验,实验结果如表8所示。
由表8可知,相比于不加入外部因素的BT-GCN模型来说,加入时空加强特征的模型RMSE和MAE分别降低0.95%和3.95%;加入环境影响因素特征的模型RMSE和MAE分别上升9.86%和12.02%;将全部影响因素耦合的时空环境加强特征模型RMSE和MAE分别降低8.59%和10.06%。在与针对历史客流数据时空特征加强的ATT-BT-GCN模型对比中,单融合时空加强特征的模型RMSE和MAE分别上升6.88%和12.69%;融合时空环境加强特征的模型RMSE和MAE分别下降1.36%和0.75%。
与BT-GCN模型的对比实验表明,只考虑某一方面因素的预测的模型预测效果弱于多维度影响因素融合的时空环境加强特征模型;相比之下时空加强特征与客流分布特征相关性大于环境影响因素特征,但考虑时空加强特征的模型预测效果强于单考虑环境影响因素特征的模型;在单考虑环境影响因素时,降雨量的突变会给模型权重调整带来挑战,甚至出现精确度小于未考虑外部环境的BT-GCN模型精度的情况。
与ATT-BT-GCN模型的对比实验表明,仅靠人为主观定义的时空加强特征对模型性能的提升弱于注意力机制的引入;相比之下融合时空环境加强特征的模型预测效果强于ATT-BT-GCN模型,且IEF-BT-GCN模型收敛时的迭代次数远小于ATT-BT-GCN模型。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的模块及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置和设备的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。
作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本发明实施例方案的目的。
另外,在本发明实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。
功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例节能信号发送/接收的方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、ROM(只读存储器)、RAM(易挥发性随机存取存储器)、磁碟或者光盘等各种可以存储程序代码的介质。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
应理解,本发明的发明内容及实施例中各步骤的序号的大小并不绝对意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
Claims (10)
1.基于深度图神经网络和环境融合的轨道客流预测方法,其特征在于,包括:
获取轨道线网乘客进站量数据集,将所述轨道线网乘客进站量数据集与外部环境影响因素数据集进行耦合,将耦合后的矩阵数据分为训练集和测试集;
采用时空图卷积模型,利用所述训练集对所述时空图卷积模型进行训练,获得第一预测客流量数据;
计算所述第一预测客流量数据与真实客流量数据之间的损失,优化所述时空图卷积模型;
将所述测试集输入完成优化的所述时空图卷积模型,获得第二预测客流量数据;
计算所述第二预测客流量数据和真实客流量数据之间的损失,将该损失与所述第一预测客流量数据与真实客流量数据之间的损失进行对比,判断优化后的所述时空图卷积模型是否出现欠拟合或者过拟合现象,若是,则调整完成优化的所述时空图卷积模型的超参数,调整后再对所述测试集进行测试,直至不再出现欠拟合或者过拟合现象;
利用调整好超参数的所述时空图卷积模型对待测的轨道线网乘客进站量进行预测。
2.根据权利要求1所述的基于深度图神经网络和环境融合的轨道客流预测方法,其特征在于,所述外部环境影响因素数据集包括:站点类别特征数据、时间强化特征数据、节假日影响特征数据和天气影响特征数据;
将所述轨道线网乘客进站量数据集与外部环境影响因素数据集进行耦合的方法为:
根据所述轨道线网乘客进站量数据集构建线网进站客流量特征矩阵Z;
其中,值为输入外部因素类别数量,为中第类外部影响因素矩阵,i取1、2···m,,当时表示第i类外部影响因素随着时间变化会发生变化,其矩阵形式为,其中t为时间序列长度,n为轨道线网站点数量;表示在外部影响因素为i、第n个轨道线网站点、时间为t时的特征值;当时表示第类外部影响因素与时间变化无关,其矩阵形式为;T表示矩阵的转置;表示在外部影响因素为i,第n个轨道线网站点时的特征值;其中线网进站客流量特征矩阵Z为:
3.根据权利要求2所述的基于深度图神经网络和环境融合的轨道客流预测方法,其特征在于,所述站点类别特征数据的提取方法为:
重复计算每个样本到的欧氏距离并更新,直到值收敛或者达到设置的迭代次数;对每个站点的特征区别定义为早晚高峰以及平峰占全天客流量百分比差异,分别提取每个站点对应时段的进站客流量并以站点序号排序,利用K-means函数进行基于不同时段进站客流占比的站点分类获得所述站点类别特征数据;
4.根据权利要求4所述的基于深度图神经网络和环境融合的轨道客流预测方法,其特征在于,所述时间强化特征数据的提取方法为:基于时间构建时间特征参数,其中,时间特征参数以时间的时位和分钟位顺序排列构成;
所述天气影响特征数据的提取方法为:通过相关性分析来找出降雨量、最高气温、最低气温和空气质量中与轨道线网乘客进站量有强相关性的因素作为天气影响因素的特征值;
所述相关性分析通过筛选轨道线网乘客进站量与降雨量、最高气温、最低气温和空气质量的皮尔逊相关系数实现,相关性分析的公式为:
其中,X和Y分为两组待挖掘隐藏关系的数列,X为轨道线网乘客进站量、降雨量、最高气温、最低气温和空气质量中的任一种,Y为轨道线网乘客进站量、降雨量、最高气温、最低气温和空气质量中的任一种;为相关系数,表示相关性大小;cov代表的是X和Y之间的协方差,和分别为数列X和Y之间的标准差;
所述节假日影响特征数据的提取方法为:将工作日定义为特征值1,将法定公休日定义为特征值2,将法定节假日定义为特征值3;
所述时空图卷积模型包括图卷积网络GCN层、双向长短时记忆神经网络BiLSTM层、激活层和损失函数计算层;
所述图卷积网络GCN层将轨道线网所有站点的乘客进站量提取出空间维度的特征,计算公式为:
选择2层图卷积作为图卷积网络GCN层属性,
5.根据权利要求4所述的基于深度图神经网络和环境融合的轨道客流预测方法,其特征在于,所述双向长短时记忆神经网络BiLSTM层对融合了所述空间维度的特征的乘客进站量提取出时间维度的特征,其中单向的LSTM模型计算公式为:
其中,表示遗忘层输出的遗忘权重结果;为遗忘门中和的权重矩阵;表示t时刻2层图神经网络输出的隐藏层的隐藏状态;为当前时刻输入的外部特征序列;为遗忘门中的偏置参数;表示记忆层输出的记忆权重结果;为记忆门中和的权重矩阵;为记忆门中的偏置参数;表示描述当前细胞记忆状态的参数;、tanh为激活函数;表示记忆细胞状态储存单元中和的权重矩阵;表示记忆细胞状态储存单元中的偏置参数;表示t-1时刻的记忆状态;表示当前时刻的记忆状态;表示输出层输出的遗忘权重结果;为输出门中和的权重矩阵;为输出门中的偏置参数;表示模型t时刻的输出;
8.基于深度图神经网络和环境融合的轨道客流预测系统,其特征在于,包括:
数据获取模块,获取轨道线网乘客进站量数据集,将所述轨道线网乘客进站量数据集与外部环境影响因素数据集进行耦合,将耦合后的矩阵数据分为训练集和测试集;
模型训练模块,采用时空图卷积模型,利用所述训练集对所述时空图卷积模型进行训练,获得第一预测客流量数据;
模型优化模块,计算所述第一预测客流量数据与真实客流量数据之间的损失,优化所述时空图卷积模型;
客流量预测模块,将所述测试集输入完成优化的所述时空图卷积模型,获得第二预测客流量数据;
客流量校准模块,计算所述第二预测客流量数据和真实客流量数据之间的损失,将该损失与所述第一预测客流量数据与真实客流量数据之间的损失进行对比判断优化后的所述时空图卷积模型是否出现欠拟合或者过拟合现象,若是,则调整完成优化的所述时空图卷积模型的超参数,调整后再对所述测试集进行测试,直至不再出现欠拟合或者过拟合现象;
实际客流量预测模块,利用调整好超参数的所述时空图卷积模型对待测的轨道线网乘客进站量进行预测。
9.电子设备,其特征在于,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1-7中任一项所述的基于深度图神经网络和环境融合的轨道客流预测方法。
10.计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如权利要求1-7中任一项所述的基于深度图神经网络和环境融合的轨道客流预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210985975.9A CN115392554A (zh) | 2022-08-17 | 2022-08-17 | 基于深度图神经网络和环境融合的轨道客流预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210985975.9A CN115392554A (zh) | 2022-08-17 | 2022-08-17 | 基于深度图神经网络和环境融合的轨道客流预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115392554A true CN115392554A (zh) | 2022-11-25 |
Family
ID=84120390
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210985975.9A Pending CN115392554A (zh) | 2022-08-17 | 2022-08-17 | 基于深度图神经网络和环境融合的轨道客流预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115392554A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116050673A (zh) * | 2023-03-31 | 2023-05-02 | 深圳市城市交通规划设计研究中心股份有限公司 | 基于CNN-BiLSTM的城市公交客流短时预测方法 |
CN117057488A (zh) * | 2023-10-12 | 2023-11-14 | 江南大学附属医院 | 基于人工智能模型的放射医疗设备工作量预测方法及系统 |
CN117591919A (zh) * | 2024-01-17 | 2024-02-23 | 北京工业大学 | 客流预测方法、装置、电子设备和存储介质 |
CN117273287B (zh) * | 2023-11-23 | 2024-03-08 | 山东科技大学 | 一种基于张量-矩阵耦合的地铁客流量预测方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110443448A (zh) * | 2019-07-01 | 2019-11-12 | 华中科技大学 | 一种基于双向lstm的飞机机位分类预测方法和系统 |
CN112418547A (zh) * | 2020-12-03 | 2021-02-26 | 北京工业大学 | 一种基于gcn-lstm组合模型的公交车站点客流量预测方法 |
CN113077090A (zh) * | 2021-04-09 | 2021-07-06 | 上海大学 | 客流预测方法、系统及计算机可读存储介质 |
-
2022
- 2022-08-17 CN CN202210985975.9A patent/CN115392554A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110443448A (zh) * | 2019-07-01 | 2019-11-12 | 华中科技大学 | 一种基于双向lstm的飞机机位分类预测方法和系统 |
CN112418547A (zh) * | 2020-12-03 | 2021-02-26 | 北京工业大学 | 一种基于gcn-lstm组合模型的公交车站点客流量预测方法 |
CN113077090A (zh) * | 2021-04-09 | 2021-07-06 | 上海大学 | 客流预测方法、系统及计算机可读存储介质 |
Non-Patent Citations (1)
Title |
---|
林龙: "基于改进k-means的公交时刻表关键站点选择研究" * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116050673A (zh) * | 2023-03-31 | 2023-05-02 | 深圳市城市交通规划设计研究中心股份有限公司 | 基于CNN-BiLSTM的城市公交客流短时预测方法 |
CN116050673B (zh) * | 2023-03-31 | 2023-08-01 | 深圳市城市交通规划设计研究中心股份有限公司 | 基于CNN-BiLSTM的城市公交客流短时预测方法 |
CN117057488A (zh) * | 2023-10-12 | 2023-11-14 | 江南大学附属医院 | 基于人工智能模型的放射医疗设备工作量预测方法及系统 |
CN117057488B (zh) * | 2023-10-12 | 2023-12-26 | 江南大学附属医院 | 基于人工智能模型的放射医疗设备工作量预测方法及系统 |
CN117273287B (zh) * | 2023-11-23 | 2024-03-08 | 山东科技大学 | 一种基于张量-矩阵耦合的地铁客流量预测方法 |
CN117591919A (zh) * | 2024-01-17 | 2024-02-23 | 北京工业大学 | 客流预测方法、装置、电子设备和存储介质 |
CN117591919B (zh) * | 2024-01-17 | 2024-03-26 | 北京工业大学 | 客流预测方法、装置、电子设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110570651B (zh) | 一种基于深度学习的路网交通态势预测方法及系统 | |
CN111161535B (zh) | 基于注意力机制的图神经网络交通流量预测方法及系统 | |
CN112801404B (zh) | 一种基于自适应空间自注意力图卷积的交通预测方法 | |
CN109508360B (zh) | 一种基于元胞自动机的地理多元流数据时空自相关分析方法 | |
CN115392554A (zh) | 基于深度图神经网络和环境融合的轨道客流预测方法 | |
CN111210633B (zh) | 一种基于深度学习的短时交通流预测方法 | |
CN109492822B (zh) | 空气污染物浓度时空域关联预测方法 | |
CN111860951B (zh) | 一种基于动态超图卷积网络的轨道交通客流预测方法 | |
CN109142171B (zh) | 基于特征扩张的融合神经网络的城市pm10浓度预测方法 | |
CN115081717B (zh) | 融合注意力机制和图神经网络的轨道交通客流预测方法 | |
CN111292525B (zh) | 基于神经网络的交通流预测方法 | |
CN113487061A (zh) | 一种基于图卷积-Informer模型的长时序交通流量预测方法 | |
CN114626512B (zh) | 一种基于有向图神经网络的高温灾害预报方法 | |
CN110909924B (zh) | 基于交叉熵优化器的城市扩张多情景模拟元胞自动机方法 | |
CN111127888A (zh) | 一种基于多源数据融合的城市交通流预测方法 | |
CN113887787B (zh) | 一种基于长短时记忆网络和nsga-ii算法的洪水预报模型参数多目标优化方法 | |
CN114693064B (zh) | 一种建筑群方案生成性能评价方法 | |
CN115376317B (zh) | 一种基于动态图卷积和时序卷积网络的交通流预测方法 | |
CN112966871A (zh) | 基于卷积长短期记忆神经网络的交通拥堵预测方法及系统 | |
CN115148019A (zh) | 一种基于节假日拥堵预测算法的预警方法及系统 | |
CN116681176B (zh) | 一种基于聚类和异构图神经网络的交通流预测方法 | |
CN116721537A (zh) | 基于gcn-ipso-lstm组合模型的城市短时交通流预测方法 | |
CN111341109B (zh) | 一种基于时空相似性的城市级信号推荐系统 | |
CN112598165A (zh) | 基于私家车数据的城市功能区转移流量预测方法及装置 | |
CN111209968B (zh) | 基于深度学习的多气象因子模式预报温度订正方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |