CN112990536B - 一种基于分位数卷积网络的公交到站时间预测方法 - Google Patents

一种基于分位数卷积网络的公交到站时间预测方法 Download PDF

Info

Publication number
CN112990536B
CN112990536B CN202110113894.5A CN202110113894A CN112990536B CN 112990536 B CN112990536 B CN 112990536B CN 202110113894 A CN202110113894 A CN 202110113894A CN 112990536 B CN112990536 B CN 112990536B
Authority
CN
China
Prior art keywords
bus
data
time
quantile
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110113894.5A
Other languages
English (en)
Other versions
CN112990536A (zh
Inventor
黄昌沛
傅惠
姚奕鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong University of Technology
Original Assignee
Guangdong University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong University of Technology filed Critical Guangdong University of Technology
Priority to CN202110113894.5A priority Critical patent/CN112990536B/zh
Publication of CN112990536A publication Critical patent/CN112990536A/zh
Application granted granted Critical
Publication of CN112990536B publication Critical patent/CN112990536B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/40Business processes related to the transportation industry
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0125Traffic data processing
    • G08G1/0129Traffic data processing for creating historical data or processing based on historical data
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/123Traffic control systems for road vehicles indicating the position of vehicles, e.g. scheduled vehicles; Managing passenger vehicles circulating according to a fixed timetable, e.g. buses, trains, trams
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Strategic Management (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Data Mining & Analysis (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Remote Sensing (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Analytical Chemistry (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Chemical & Material Sciences (AREA)
  • Development Economics (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于分位数卷积网络的公交到站时间预测方法,对公交的到站时间进行点预测和分位数预测两种预测模式,从历史数据中提取更丰富的特征信息,更好地捕捉未来的不确定性。同时,本发明可以克服某些公交线路的历史数据稀疏或偶发性不可用的问题,利用历史中少量的公交GPS数据以及未来时刻已知的变化特征(如月份、星期、小时、是否开放公交专用道等),便可以学习公交运行的复杂模式,得到未来一段时间的多步预测结果。日后本发明可以应用于公交车辆发班间隔过长、GPS信号不稳定的某些特定公交线路中。

Description

一种基于分位数卷积网络的公交到站时间预测方法
技术领域
本发明涉及公交行程时间预测的技术领域,尤其涉及到一种基于分位数卷积网络的公交到站时间预测方法。
背景技术
常规公交是我国城市公共交通方式中历史最悠久,也是承担客运量最大的方式,,相对于地铁等轨道交通,有着密集的服务线网和可定制化的灵活性。
但近年来,随着城市轨道交通的快速发展、网约车以及慢行交通的兴起,在全国大部分城市中,常规公交所承担的公共交通客运量和客运比例近年来呈现明显的下降趋势。
其他交通方式的强力竞争是导致常规公交客运量出现萎缩的主要外因,从其内因看,常规公交也存在自身吸引力不足的问题:出行速度慢、线路服务准点率低,出行时间不可预计。为适应轨道交通和共享单车等其他新型交通方式规模发展对常规公交发展带来的重大影响,常规公交应从传统的单纯满足供需矛盾,以车辆更新、增加覆盖与“量”的供给,转变为更加注重公交服务协同优化和品质提升的“质”的飞越,进一步提供稳定可靠、可预测把控的公共交通服务。
实现更精准、可控的高质量公交服务,其基础是实现公交车到站预测准确率的提升。公交到站时间预测是实时公交出行信息发布、公交出行路径诱导、公交运行动态调度管理等的核心内容,准确的预测有利于帮助居民进行合理的出行规划选择和减少等待时间。目前国内外关于公交到站时间预测的方法可以分为两大类:基于统计的模型与基于分析的模型。前者主要考虑公交到站时问历史数据的变化规律,通过寻找历史到站时问与当前公交运行时间的关系进行预测。后者主要考虑各种内、外部变量(道路条件、交通条件、乘客流量等)对公交到站时间的影响,建立因果关系模型。常用的预测模型有神经网络(ANN)模型、卡尔曼滤波(KF)模型、支持向量机(SVM)模型等。
其中,[1]Jun Gong,Mingyue Liu,Sen Zhang.Hybrid dynamic predictionmodel of bus arrival time based on weighted of historical and real-time GPSdata[C]Control and Decision Conference(CCDC),201325th Chinese.IEEE,2013.基于历史和实时的GPS数据信息提出了混合的动态预测公交到站时间模型。首先,通过数据差值和处理算法获取实时GPS数据,并将其作为预测模型的输入变量;其次,根据各路段平均运行时间的历史数据和各站点的停靠时间的历史数据,分别建立静态预测模型。最后,以实时公交车的GPS数据评价该模型,进而提出混合的动态预测模型。然而此类依靠单一公交行驶历史数据的预测模型,在应对多类型的道路突发情况时,预测效果并不理想。
[2]Xiaobo Qu,Jin Zhang,Shuaian Wang,On the stochastic fundamentaldiagram for freeway traffic:Model development,analytical properties,validation,and extensive applications,Transportation Research Part B:Methodological,Volume 104,2017,Pages 256-271,ISSN 0191-2615.提出一种支持向量机(SVM)和卡尔曼滤波的混合模型来预测公交车的到站时间,其中SVM模型以历史出行数据的时段、天气状况、路段交通量、当前路段的行程时间预计预测路段最新的行程时间为输入参数,得到基线行程时间,基于卡尔曼滤波的动态算法利用最新的公交车到站信息结合基线行程时间,预测公交车在下一站点的到站时间。该种算法在预测精度上有较好的表现,但是,公交系统本质上是一个动态随机系统:道路交通量随时间不断变化,交通量的时间分布具有随机性;居民的乘车需求存在波动性,公交车站乘客的到达具有随机性;公交车到达交叉口的时间具有随机性,根据公交车在交叉口的排队和到达、离开特征,公交车交叉口延误时间受随机因素影响。分析公交车运行过程,识别影响公交运行的随机因素,并研究公交车到站时间的概率分布是目前的模型算法需要进一步改善的问题。
发明内容
本发明的目的在于克服现有技术的不足,提供一种预测精度高的基于分位数卷积网络的公交到站时间预测方法。
为实现上述目的,本发明所提供的技术方案为:
一种基于分位数卷积网络的公交到站时间预测方法,包括以下步骤:
S1、通过提前收集的公交线路信息、路段信息以及公交GPS历史数据,经过清洗处理得到站点序号、站点间长度以及公交运行的历史时空位置数据,将清洗完成的数据集储存在mysql;
S2、以5分钟为时间粒度对公交的站间行驶时间进行数据统计,以y表示公交车辆在任意一个GPS位置中驶回公交末站所需的时间,以x表示对应y的协变量,根据mysql存储的公交数据集分别对x和y进行单个数据特征的生成;
S3、使用x和y生成模型训练所需的特征,包括在t+1时刻至t+6时刻从公交站点i驶回公交末站所需的时间
Figure BDA0002919896490000031
使用对应时刻下相邻的前后两个站点前两个小时的历史数据以及该站点前一个月同星期的4天的同时刻数据集来构建的历史训练集Yhist、对应的协变量为Xhist以及t+1至t+6的未来时刻的协变量
Figure BDA0002919896490000032
S4、对步骤S3生成的特征进行预处理;
S5、对分位数卷积神经网络进行权重参数的初始化,并设置包括迭代次数、学习率、批量大小在内的超参数;将训练集数据
Figure BDA0002919896490000033
以批量的方式输入到编码器模块中;
S6、在编码器模块,根据膨胀系数d={1,2,4,8,16,32,56}进行连续7轮的编码操作;
S7、在解码器模块中进行解码操作;
S8、通过解码器的输出全连接层在每个预测目标中产生一组分位数值Q=(q1,q2,…,qm),其中qj∈(0,1),计算分位数误差:
Figure BDA0002919896490000041
上式中,(y)+=max(0,y),y为历史的行程时间数值,
Figure BDA0002919896490000042
为预测的行程时间分位数值;
将误差反向传播以更新分位数卷积神经网络权重参数,直到经过指定的迭代次数后,完成训练;
S9、模型预测:将模型参数进行离线保存,将需要预测的新序列数据以
Figure BDA0002919896490000043
的形式输入训练好的模型中,按照步骤S4至步骤S7进行处理计算,获取未来时刻的概率分布预测值,反标准化则可得到最终的预测结果。
进一步地,所述步骤S2中,y对应的协变量x为未来时刻已知的变化特征,具体为x={xm,xn,xw,xt,xi,xl,xk,xy},其中,xm∈[0,12]表示该条数据的时刻处于一年中的第几个月,xn∈[1,31]表示该条数据的时刻处于一个月中的第几天,xw∈[1,7]表示该条数据的时刻处于一周中的星期几,xt∈[1,288]表示该条数据的时刻处于一天中的第几个时刻,xi表示该条数据目前处于第几个站点,x1表示第xi个站点到终点站的长度,xk表示公交从站点i行驶回末站需要经过的红绿灯数,xy表示该条数据对应的时间下公交专用道是否开放。
进一步地,所述步骤S4具体包括:
对Yhist、Xhist中的空缺数据进行补零操作;接着,对Yhist
Figure BDA0002919896490000044
进行归一化操作,对Xhist
Figure BDA0002919896490000045
进行哑编码操作得到
Figure BDA0002919896490000046
进一步地,所述步骤S6中,每一轮操作的具体过程如下:
A1、进行膨胀卷积神经网络的运算;
Figure BDA0002919896490000051
其中,x为数据序列,d为膨胀因子,ω为卷积核,k为卷积核的大小,(t-d·k)表示移动的方向,s为扩展卷积的位置t处的输出;
A2、对膨胀卷积运算的输出参数进行BatchNorm批量归一化;
A3、将归一化输出到ReLU激活函数中;
A4、进行第二个膨胀卷积神经网络的运算;
A5、对膨胀卷积运算的输出参数进行BatchNorm批量归一化;
A6、将输出的参数特征与协变量Xhist进行拼接,生成残差块resnet-v;
A7、将残差块resnet-v输出到ReLU激活函数中。
进一步地,所述步骤S7解码操作的具体过程如下:
B1、进行一层全连接层的线性变换操作;
B2、对线性变换运算的输出参数进行BatchNorm批量归一化;
B3、将归一化输出到ReLU激活函数中;
B4、进行第二次全连接层的线性变换操作;
B5、对线性变换运算的输出参数进行BatchNorm批量归一化;
B6、利用公式
Figure BDA0002919896490000052
将输出的参数特征与协变量
Figure BDA0002919896490000053
进行拼接;
B7、将拼接向量输出到Dropout层中;
B8、输出分位数结果,计算分位数损失和。
与现有技术相比,本方案原理及优点如下:
1.通过结合一维卷积与因果卷积,提取了公交车辆行驶时间在历史维度的时间相关信息以及相邻公交站点行驶时间的空间相关信息,并通过膨胀卷积提高了卷积网络的接收场,在使用较少的层数的情况下能够观测到更多的历史信息,解决了某些公交线路的历史数据稀疏或偶发性不可用的情形下的预测问题,在保持同等计算力的前提下大大提高了预测模型的精度。
并且,本方案使用了一种新型的残差神经网络变体,针对公交线路未来一段时间内已知的静态或动态变化特征(月份特征、天数特征、星期特征、时刻特征、站点编号、行驶长度、通行红绿灯个数、是否开放公交专用道共8个特征),生成了预测模型的历史协变量Xhist和未来协变量
Figure BDA0002919896490000061
大大提高了公交已有数据的开发利用程度。通过历史协变量Xhist防止编码器产生梯度爆炸,通过未来协变量
Figure BDA0002919896490000062
一步生成未来6个时间粒度下的概率分布预测值,降低计算量的同时提高了对公交运行中的各种复杂模式的适应性。
2.从公交行程时间的不确定性问题的角度考虑,提供了公交行程时间概率分布预测以及点预测(50%分位数预测值)两种形式的预测结果,为公交管理决策者提供了更多的信息参考。
针对预测结果,本方案所使用的分位数卷积网络对比与其他一些主流模型仍然具有不错的预测效果,符合落地应用的预测精度要求。
从概率分布预测看,该预测结果可以应用于公交运行异常的控制中,实时监控与预测公交车辆之间的运行间隔,当公交车辆的预测串车概率大于50%时,启动系统预警;当公交车辆的预测串车概率大于90%时,启动公交车辆的调度控制策略,及时避免公交异常事件的发生。在公交的异常控制方面,该种预测算法具有良好的应用价值。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的服务作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一种基于分位数卷积网络的公交到站时间预测方法的原理流程图;
图2为编码器与解码器的计算过程示意图;
图3为举例的模型输入变量与预测标签说明示意图;
图4为预测结果示例图;
图5为10%与90%分位数下的预测曲线示例图;
图6为点预测的各模型精度对比图;
图7为本发明在公交运行异常控制中的应用示意图。
具体实施方式
下面结合具体实施例对本发明作进一步说明:
如图1所示,本发明实施例所述的一种基于分位数卷积网络的公交到站时间预测方法,包括以下步骤:
S1、通过提前收集的公交线路信息、路段信息以及公交GPS历史数据,经过清洗处理得到站点序号、站点间长度以及公交运行的历史时空位置数据,将清洗完成的数据集储存在mysql。
S2、以5分钟为时间粒度对公交的站间行驶时间进行数据统计,以y表示公交车辆在任意一个GPS位置中驶回公交末站所需的时间,以
x={xm,xn,xw,xt,xi,xl,xk,xy}表示对应y的协变量,其中xm∈[0,12]表示该条数据的时刻处于一年中的第几个月,xn∈[1,31]表示该条数据的时刻处于一个月中的第几天,xw∈[1,7]表示该条数据的时刻处于一周中的哪一天,xt∈[1,288]表示该条数据的时刻处于一天中的第几个时刻,xi表示该条数据目前处于第几个站点,xl表示第xi个站点到终点站的长度,xk表示公交从站点i行驶回末站需要经过的红绿灯数,xy表示该条数据对应的时间下公交专用道是否开放;
根据mysql存储的公交数据集分别对x和y进行单个数据特征的生成。
S3、使用x和y生成模型训练所需的特征组;
假设当前时刻处于一天中的第t个时刻、一个月中的第n天,则从一条公交线路第i个站点采集到的前两个小时的行驶回公交末站所需时间的数据组可以表示为
Figure BDA0002919896490000081
对应的协变量为
Figure BDA0002919896490000082
每个
Figure BDA0002919896490000083
中包含着8个变量,,
Figure BDA0002919896490000084
表示t时刻公交专用道是否开放。此时预测目标为预测在t+1时刻至t+6时刻(即预测步长为30分钟)从公交站点i驶回公交末站所需的时间,表示为
Figure BDA0002919896490000085
使用该时刻下相邻的前后两个站点前两个小时的历史数据以及该站点前一个月同星期的4天的同时刻数据集来构建历史训练集
Figure BDA0002919896490000086
共240个数据,对应的协变量为Xhist。其中,t+1至t+6的未来时刻的协变量
Figure BDA0002919896490000087
是已知的;因此,最终预测任务为使用历史训练集Yhist、历史协变量Xhist以及未来时刻协变量
Figure BDA0002919896490000088
来预测未来半个小时内在公交站点i驶回公交末站的时间概率分布集合
Figure BDA0002919896490000089
S4、对Yhist、Xhist中的空缺数据进行补零操作;接着,对Yhist
Figure BDA00029198964900000810
进行归一化操作,对Xhist
Figure BDA00029198964900000811
进行哑编码操作得到
Figure BDA00029198964900000812
S5、对分位数卷积神经网络进行权重参数的初始化,并设置包括迭代次数、学习率、批量大小在内的超参数;将训练集数据
Figure BDA00029198964900000813
以批量的方式输入到编码器模块中。
S6、在编码器模块,根据膨胀系数d={1,2,4,8,16,32,56}进行连续7轮的编码操作;
每一轮操作的具体过程如下:
A1、进行膨胀卷积神经网络的运算;
Figure BDA00029198964900000814
其中,x为数据序列,d为膨胀因子,ω为卷积核,k为卷积核的大小,(t-d·k)表示移动的方向,s为扩展卷积的位置t处的输出;
A2、对膨胀卷积运算的输出参数进行BatchNorm批量归一化;
A3、将归一化输出到ReLU激活函数中;
A4、进行第二个膨胀卷积神经网络的运算;
A5、对膨胀卷积运算的输出参数进行BatchNorm批量归一化;
A6、将输出的参数特征与协变量Xhist进行拼接,生成残差块resnet-v;
A7、将残差块resnet-v输出到ReLU激活函数中。
S7、在解码器模块中进行解码操作,具体包括:
B1、进行一层全连接层的线性变换操作;
B2、对线性变换运算的输出参数进行BatchNorm批量归一化;
B3、将归一化输出到ReLU激活函数中;
B4、进行第二次全连接层的线性变换操作;
B5、对线性变换运算的输出参数进行BatchNorm批量归一化;
B6、利用公式
Figure BDA0002919896490000091
将输出的参数特征与协变量
Figure BDA0002919896490000092
进行拼接;
B7、将拼接向量输出到Dropout层中;
B8、输出分位数结果,计算分位数损失和。
S8、通过解码器的输出全连接层在每个预测目标中产生一组分位数值Q=(q1,q2,…,qm),其中qj∈(0,1),计算分位数误差:
Figure BDA0002919896490000093
上式中,(y)+=max(0,y),y为历史的行程时间数值,
Figure BDA0002919896490000094
为预测的行程时间分位数值;
将误差反向传播以更新分位数卷积神经网络权重参数,直到经过指定的迭代次数后,完成训练;
S9、模型预测:将模型参数进行离线保存,将需要预测的新序列数据以
Figure BDA0002919896490000101
的形式输入训练好的模型中,按照步骤S4至步骤S7进行处理计算,获取未来时刻的概率分布预测值,反标准化则可得到最终的预测结果。
本实施例中的到站时间预测模型对公交运行的历史数据进行了高度地开发利用,整体模型的主要优点包括:
(一)模型结构与数据价值挖掘角度的优点
本实施例通过结合一维卷积与因果卷积,提取了公交车辆行驶时间在历史维度的时间相关信息以及相邻公交站点行驶时间的空间相关信息,并通过膨胀卷积提高了卷积网络的接收场,在使用较少的层数的情况下能够观测到更多的历史信息,解决了某些公交线路的历史数据稀疏或偶发性不可用的情形下的预测问题,在保持同等计算力的前提下大大提高了预测模型的精度。
并且,本实施例使用了一种新型的残差神经网络变体,如图3所示,针对公交线路未来一段时间内已知的静态或动态变化特征(月份特征、天数特征、星期特征、时刻特征、站点编号、行驶长度、通行红绿灯个数、是否开放公交专用道共8个特征),生成了预测模型的历史协变量Xhist和未来协变量
Figure BDA0002919896490000102
大大提高了公交已有数据的开发利用程度。通过历史协变量Xhist防止编码器产生梯度爆炸,通过未来协变量
Figure BDA0002919896490000103
一步生成未来6个时间粒度下的概率分布预测值,降低计算量的同时提高了对公交运行中的各种复杂模式的适应性。
(二)模型应用角度的优点
本实施例从公交行程时间的不确定性问题的角度考虑,提供了公交行程时间概率分布预测以及点预测(50%分位数预测值)两种形式的预测结果(如图4、图5所示),为公交管理决策者提供了更多的信息参考。
从点预测的预测结果看,本实施例所使用的分位数卷积网络对比与其他一些主流模型仍然具有不错的预测效果(如图6所示),符合落地应用的预测精度要求。
从概率分布预测看,该预测结果可以应用于公交运行异常的控制中(如图7所示),实时监控与预测公交车辆之间的运行间隔,当公交车辆的预测串车概率大于50%时,启动系统预警;当公交车辆的预测串车概率大于90%时,启动公交车辆的调度控制策略,及时避免公交异常事件的发生。在公交的异常控制方面,该种预测算法具有良好的应用价值。
以上所述之实施例子只为本发明之较佳实施例,并非以此限制本发明的实施范围,故凡依本发明之形状、原理所作的变化,均应涵盖在本发明的保护范围内。

Claims (4)

1.一种基于分位数卷积网络的公交到站时间预测方法,其特征在于,包括以下步骤:
S1、通过提前收集的公交线路信息、路段信息以及公交GPS历史数据,经过清洗处理得到站点序号、站点间长度以及公交运行的历史时空位置数据,将清洗完成的数据集储存在mysql;
S2、以5分钟为时间粒度对公交的站间行驶时间进行数据统计,以y表示公交车辆在任意一个GPS位置中驶回公交末站所需的时间,以x表示对应y的协变量,根据mysql存储的公交数据集分别对x和y进行单个数据特征的生成;
S3、使用x和y生成模型训练所需的特征,包括在t+1时刻至t+6时刻从公交站点i驶回公交末站所需的时间
Figure FDA0003584611350000011
使用对应时刻下公交站点i相邻的前后两个站点前两个小时的历史数据以及该站点前一个月同星期的4天的同时刻数据集来构建的历史训练集Yhist、对应的协变量为Xhist以及t+1至t+6的未来时刻的协变量
Figure FDA0003584611350000012
n表示一个月中的第n天;
S4、对步骤S3生成的特征进行预处理;
S5、对分位数卷积神经网络进行权重参数的初始化,并设置包括迭代次数、学习率、批量大小在内的超参数;将训练集数据
Figure FDA0003584611350000013
以批量的方式输入到编码器模块中;
S6、在编码器模块,根据膨胀系数d={1,2,4,8,16,32,56}进行连续7轮的编码操作;
S7、在解码器模块中进行解码操作;
S8、通过解码器的输出全连接层在每个预测目标中产生一组分位数值Q=(q1,q2,…,qm),其中qj∈(0,1),计算分位数误差:
Figure FDA0003584611350000021
上式中,(y)+=max(0,y),y为历史的行程时间数值,
Figure FDA0003584611350000022
为预测的行程时间分位数值;
将误差反向传播以更新分位数卷积神经网络权重参数,直到经过指定的迭代次数后,完成训练;
S9、模型预测:将模型参数进行离线保存,将需要预测的新序列数据以
Figure FDA0003584611350000023
的形式输入训练好的模型中,按照步骤S4至步骤S7进行处理计算,获取未来时刻的概率分布预测值,反标准化则可得到最终的预测结果;
所述步骤S4具体包括:
对Yhist、Xhist中的空缺数据进行补零操作;接着,对Yhist
Figure FDA0003584611350000024
进行归一化操作,对Xhist
Figure FDA0003584611350000025
进行哑编码操作得到
Figure FDA0003584611350000026
2.根据权利要求1所述的一种基于分位数卷积网络的公交到站时间预测方法,其特征在于,所述步骤S2中,y对应的协变量x为未来时刻已知的变化特征,具体为x={xm,xn,xw,xt,xi,xl,xk,xy},其中,xm∈[0,12]表示该条数据的时刻处于一年中的第几个月,xn∈[1,31]表示该条数据的时刻处于一个月中的第几天,xw∈[1,7]表示该条数据的时刻处于一周中的星期几,xt∈[1,288]表示该条数据的时刻处于一天中的第几个时刻,xi表示该条数据目前处于第几个站点,xl表示第xi个站点到终点站的长度,xk表示公交从站点i行驶回末站需要经过的红绿灯数,xy表示该条数据对应的时间下公交专用道是否开放。
3.根据权利要求1所述的一种基于分位数卷积网络的公交到站时间预测方法,其特征在于,所述步骤S6中,每一轮操作的具体过程如下:
A1、进行膨胀卷积神经网络的运算;
Figure FDA0003584611350000031
其中,x为数据序列,d为膨胀因子,ω为卷积核,k为卷积核的大小,(t-d·k)表示移动的方向,s为扩展卷积的位置t处的输出;
A2、对膨胀卷积运算的输出参数进行BatchNorm批量归一化;
A3、将归一化输出到ReLU激活函数中;
A4、进行第二个膨胀卷积神经网络的运算;
A5、对膨胀卷积运算的输出参数进行BatchNorm批量归一化;
A6、将输出的参数特征与协变量Xhist进行拼接,生成残差块resnet-v;
A7、将残差块resnet-v输出到ReLU激活函数中。
4.根据权利要求1所述的一种基于分位数卷积网络的公交到站时间预测方法,其特征在于,所述步骤S7解码操作的具体过程如下:
B1、进行一层全连接层的线性变换操作;
B2、对线性变换运算的输出参数进行BatchNorm批量归一化;
B3、将归一化输出到ReLU激活函数中;
B4、进行第二次全连接层的线性变换操作;
B5、对线性变换运算的输出参数进行BatchNorm批量归一化;
B6、利用公式
Figure FDA0003584611350000032
将输出的参数特征与协变量
Figure FDA0003584611350000033
进行拼接;
B7、将拼接向量输出到Dropout层中;
B8、输出分位数结果,计算分位数损失和。
CN202110113894.5A 2021-01-27 2021-01-27 一种基于分位数卷积网络的公交到站时间预测方法 Active CN112990536B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110113894.5A CN112990536B (zh) 2021-01-27 2021-01-27 一种基于分位数卷积网络的公交到站时间预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110113894.5A CN112990536B (zh) 2021-01-27 2021-01-27 一种基于分位数卷积网络的公交到站时间预测方法

Publications (2)

Publication Number Publication Date
CN112990536A CN112990536A (zh) 2021-06-18
CN112990536B true CN112990536B (zh) 2022-06-03

Family

ID=76345634

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110113894.5A Active CN112990536B (zh) 2021-01-27 2021-01-27 一种基于分位数卷积网络的公交到站时间预测方法

Country Status (1)

Country Link
CN (1) CN112990536B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113569338B (zh) * 2021-08-06 2022-10-14 大连理工大学 一种基于时间扩张卷积网络的压气机旋转失速预警方法
CN115063978B (zh) * 2022-07-27 2022-11-18 武汉微晶石科技股份有限公司 一种基于数字孪生的公交到站时间预测方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110648014A (zh) * 2019-08-28 2020-01-03 山东大学 一种基于时空分位数回归的区域风电预测方法及系统
CN111666848A (zh) * 2020-05-27 2020-09-15 上海东普信息科技有限公司 运输车辆到站检测方法、装置、设备及存储介质
CN112257928A (zh) * 2020-10-22 2021-01-22 国网山东省电力公司潍坊供电公司 一种基于cnn和分位数回归的短期电力负荷概率预测方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170200249A1 (en) * 2016-01-08 2017-07-13 Florida International University Board Of Trustees Systems and methods for intelligent, demand-responsive transit recommendations
CN106127344A (zh) * 2016-06-28 2016-11-16 合肥酷睿网络科技有限公司 一种基于网络的公交车到站时间预测方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110648014A (zh) * 2019-08-28 2020-01-03 山东大学 一种基于时空分位数回归的区域风电预测方法及系统
CN111666848A (zh) * 2020-05-27 2020-09-15 上海东普信息科技有限公司 运输车辆到站检测方法、装置、设备及存储介质
CN112257928A (zh) * 2020-10-22 2021-01-22 国网山东省电力公司潍坊供电公司 一种基于cnn和分位数回归的短期电力负荷概率预测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Uncertainty in Bus Arrival Time Predictions: Treating Heteroscedasticity With a Metamodel Approach;Aidan O’Sullivan et.al;《IEEE TRANSACTIONS ON INTELLIGENT TRANSPORTATION SYSTEMS》;20161231;3286-3296 *

Also Published As

Publication number Publication date
CN112990536A (zh) 2021-06-18

Similar Documents

Publication Publication Date Title
CN109544908B (zh) 一种实时预测公交到站时间的方法、电子设备及存储介质
CN108197739B (zh) 一种城市轨道交通乘客流量预测方法
CN102081859B (zh) 一种公交车到站时间预测模型控制方法
CN110555990B (zh) 一种基于lstm神经网络的有效停车时空资源预测方法
Chen et al. Uncertainty in urban mobility: Predicting waiting times for shared bicycles and parking lots
CN107919014B (zh) 面向多载客里程的出租车运行线路优化方法
CN112990536B (zh) 一种基于分位数卷积网络的公交到站时间预测方法
CN107358319A (zh) 城市轨道交通客流预测方法、装置、存储介质和计算机设备
CN110866649A (zh) 一种短期地铁客流预测方法、系统及电子设备
CN107194491A (zh) 一种基于公交客流和站间行程时间预测的动态调度方法
CN109272157A (zh) 一种基于门控神经网络的高速公路交通流参数预测方法及系统
CN109508751B (zh) 高速铁路列车晚点时间预测的深度神经网络模型建模方法
CN110570678B (zh) 一种公交车辆从起点到终点总行驶时间预测方法及装置
CN109612488B (zh) 基于大数据微服务的混合出行方式路径规划系统及方法
Kim et al. Idle vehicle relocation strategy through deep learning for shared autonomous electric vehicle system optimization
CN110570656B (zh) 定制公共交通线路方法及装置
Xu et al. Taxi dispatch planning via demand and destination modeling
CN103366224A (zh) 一种基于公交网络的乘客需求预测系统和方法
CN114723125A (zh) 一种结合深度学习和多任务优化的城际车订单分配方法
Kaibei et al. Passenger flow forecast of railway station based on improved LSTM
CN116324838A (zh) 用于通过叫车平台调度共享乘车的系统和方法
Ma et al. Dynamic vehicle routing problem for flexible buses considering stochastic requests
CN116153125A (zh) 一种基于ida-rnn模型的空间维度公交到达时间预测方法
CN114066503A (zh) 一种基于构建虚拟服务片区进行出租车需求预测的方法
CN110490365B (zh) 一种基于多源数据融合预测网约车订单量的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant