CN112907953B - 一种基于稀疏gps数据的公交行程时间预测方法 - Google Patents

一种基于稀疏gps数据的公交行程时间预测方法 Download PDF

Info

Publication number
CN112907953B
CN112907953B CN202110111089.9A CN202110111089A CN112907953B CN 112907953 B CN112907953 B CN 112907953B CN 202110111089 A CN202110111089 A CN 202110111089A CN 112907953 B CN112907953 B CN 112907953B
Authority
CN
China
Prior art keywords
bus
layer
matrix
travel time
road section
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110111089.9A
Other languages
English (en)
Other versions
CN112907953A (zh
Inventor
宋现敏
田婧
李志慧
吴丛
张明业
曹倩
马永建
冷宁
张璐雨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jilin University
Original Assignee
Jilin University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jilin University filed Critical Jilin University
Priority to CN202110111089.9A priority Critical patent/CN112907953B/zh
Publication of CN112907953A publication Critical patent/CN112907953A/zh
Application granted granted Critical
Publication of CN112907953B publication Critical patent/CN112907953B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0125Traffic data processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0137Measuring and analyzing of parameters relative to traffic conditions for specific applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Biophysics (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Computational Linguistics (AREA)
  • Development Economics (AREA)
  • Computing Systems (AREA)
  • General Business, Economics & Management (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Educational Administration (AREA)
  • Primary Health Care (AREA)
  • Traffic Control Systems (AREA)

Abstract

一种基于稀疏GPS数据的公交行程时间预测方法,本发明涉及基于稀疏GPS数据的公交行程时间预测方法。本发明的目的是为了解决现阶段由于公交数据稀疏特性造成公交行程时间预测可信度较低的问题。一种基于稀疏GPS数据的公交行程时间预测方法具体过程为:步骤一、接收到公交车辆上传的原始GPS数据后,对公交原始GPS数据进行归一化预处理,并将归一化预处理后的数据整合为二维时空速度矩阵;步骤二、构建基于交通流先验规则的生成式对抗网络,生成契合实际的公交线路交通状态;步骤三、基于无模型自适应驱动方法,在线预测公交行程时间。本发明用于公共交通信息处理技术领域。

Description

一种基于稀疏GPS数据的公交行程时间预测方法
技术领域
本发明涉及公共交通信息处理技术领域,更具体地说,本发明涉及一种基于稀疏GPS数据的公交行程时间预测方法。
背景技术
近年来,在公共交通优先战略的引领下,城市智能公交出行系统的建设取得了显著发展。然而,路网交通拥堵引起的公交车辆的集中到达或较长时间无法到达的现象日趋严重,造成了居民由于公交出行质量的下降转而选择其他出行方式。公交吸引力的不足制约了公交事业的发展。合理的公交实时调度和可靠的公交行程时间估计是提升乘客出行体验的重要手段。然而由于公交具有车辆数较少、发车间隔大及其GPS数据采集稀疏等特点,在进行公交行程时间在线预测时会出现时间、空间间隔较长后才有数据上传的情况。这些公交GPS数据之间交通关联度较低,直接利用这些稀疏的数据来准确预测公交行程时间的难度较大。
近年来,国内外开展了大量关于利用GPS数据进行公交行程时间预测的研究。这些成果主要可以分为:(1)滤波方法,这类方法主要是利用交通流理论(基本图理论、Lighthill-Whitham-Richards模型)来推断公交行程时间的变化趋势。这些方法能够按照交通状态的演化来预测公交行程时间,但需要保证能提供连续更新的数据才能准确计算。(2)统计学习方法,它们通过拟合前一公交车与当前公交车行程时间之间的关系,在大数据中挖掘交通历史变化规律,来预测公交到达下一站点的行程时间。因此,只有当车辆分布较为密集,车辆间的车头时距较小时,前后公交车经历的交通状态相似,预测结果才较为可信度。
由于公交车辆的发车频率较低且其数据采集的时间间隔较大,公交GPS数据呈现出在时空上采样稀疏性的特点。而从上述研究现状中可以看出,如何在数据稀疏采样的情况下保证公交行程时间预测可信度的问题还有待解决。因此,需要针对公交GPS数据稀疏性的特点,开发一种公交行程时间预测方法。
发明内容
本发明的目的是为了解决现阶段由于公交数据稀疏特性造成公交行程时间预测可信度较低的问题,而提出一种基于稀疏GPS数据的公交行程时间预测方法。
一种基于稀疏GPS数据的公交行程时间预测方法具体过程为:
步骤一、接收到公交车辆上传的原始GPS数据后,对公交原始GPS数据进行归一化预处理,并将归一化预处理后的数据整合为二维时空速度矩阵;
步骤二、构建基于交通流先验规则的生成式对抗网络,生成契合实际的公交线路交通状态;
步骤三、基于无模型自适应驱动方法,在线预测公交行程时间。
本发明的有益效果为:
本发明方法主要包括公交线路交通状态生成和公交行程时间预测两部分。在公交线路交通状态生成方法中,本发明提出了一种基于误差反馈的上采样单元来避免状态生成过程中误差累积,提高交通状态的生成精度。在接收到生成的公交线路交通状态矩阵后,公交行程时间预测部分使用了一种无模型自适应的方法,使得公交预测系统能够在公交交通状态的驱动下进行公交行程时间的在线预测。本发明不仅能够为公交公司提供公交GPS数据处理以及公交行程时间预测的技术支持,还能为乘客提供准确、快捷的出行服务,具有较好的应用前景。
1)本发明提出了一种改进的生成式对抗网络来处理稀疏公交GPS数据。该方法将控制论的反馈思想引入神经网络中,构建了一种设有误差反馈机制的上采样单元。所述上采样单元通过在逐步的交通状态特征还原的过程中对误差进行预测及矫正,能够防止误差的网络层间的逐层传递与累积,可以保证交通状态生成误差的收敛,为公交公司提出公交数据处理的技术支持,同时所述的基于误差反馈的上采样单元能够迁移至其他预测、估计等神经网络中,提高计算的误差精度;
2)现有公交行程时间预测方法大都受到模型结构及预设参数设置的限制,常常会发生过拟合或欠拟合的问题。本发明提出了一种无模型自适应的公交行程时间预测方法。该方法构建了一种伪梯度向量来捕捉公交线路交通状态的变化趋势,不受预设的结构及参数的限制,实现了在交通状态驱动下的预测,计算复杂度较低,能够为公交乘客提供快速、准确的在线公交行程时间预测服务;
3)目前大多数公交行程时间预测方法都是基于采样密集的检测数据或相互补充的多源数据进行计算的。考虑到现阶段各部门间尚未实现完全的数据共享,许多公交公司仅拥有自营公交车辆上传的单一数据源。本发明针对公交数据的稀疏特性,提供了一种先从稀疏采样的数据中还原公交线路的交通状态,再在交通状态的驱动下来预测公交行程时间的思路,保证了利用稀疏数据计算的可信度,能为公交公司的运营提供技术帮助。
附图说明
图1是本发明所述的基于稀疏GPS数据的公交行程时间预测方法的流程框图;
图2是本发明所述的输入速度矩阵、真实掩膜矩阵及噪声矩阵处理示意图;
图3是本发明所述的基于误差反馈的生成式对抗网络结构图;
图4是本发明所述的生成式对抗网络中生成器结构图;
图5是本发明所述的生成式对抗网络中基于误差反馈的上采样单元结构图。
具体实施方式
具体实施方式一:结合图1说明本实施方式,本实施方式一种基于稀疏GPS数据的公交行程时间预测方法具体过程为:
步骤一、接收到公交车辆上传的原始GPS数据后,对公交原始GPS数据进行归一化预处理,并将归一化预处理后的数据整合为二维时空速度矩阵(以作为步骤二所述模型的输入);
步骤二、构建基于交通流先验规则的生成式对抗网络,生成契合实际的公交线路交通状态;
步骤三、基于无模型自适应驱动方法,在线预测公交行程时间。
具体实施方式二:本实施方式与具体实施方式一不同的是,所述步骤一中接收到公交车辆上传的原始GPS数据后,对公交原始GPS数据进行归一化预处理,并将归一化预处理后的数据整合为二维时空速度矩阵(以作为步骤二所述模型的输入);具体过程如下:
步骤一一、接收到公交车辆上传的原始GPS数据后,对公交原始GPS数据进行归一化预处理;过程为:
1)接收到公交车辆上传的原始GPS数据后,将速度超过公交最高限速值(50km/h)的数据视为异常值并删除;
2)为避免原始数据数量级不同对网络学习的干扰,对公交车辆上传的原始GPS数据进行归一化处理;归一化处理的公式为:
Figure BDA0002919372930000031
其中,v和v*分别是公交车辆上传的原始的速度数据和归一化处理后的速度数据,vmin和vmax分别是公交车辆上传的原始数据中速度的最小值和最大值;
步骤一二、将归一化处理后的速度数据整合为速度矩阵;图2为原始公交数据转化为速度矩阵的示意图。
在构建速度矩阵时,首先按照20米间隔将公交线路划分为xn个路段{x1,x2,...,xi,...,xn};其次,统计各个路段每5分钟的归一化处理后的公交GPS数据得到时间序列{t1,t2,...,tj,...,tm};
如果路段xi在第tj个5分钟的时间间隔内采集到了公交数据,设i是速度矩阵的行数,j是速度矩阵的列数,(i,j)索引对应速度矩阵中一个数据点,则速度矩阵中位置(i,j)处数据的取值为这些数据采集到的公交数据速度的平均值;否则,速度矩阵对应位置取空值。
其它步骤及参数与具体实施方式一相同。
具体实施方式三:本实施方式与具体实施方式一或二不同的是,所述步骤二中构建基于交通流先验规则的生成式对抗网络,生成契合实际的公交线路交通状态;具体过程为:
本发明以公交速度为指标来衡量公交线路的交通状态,接收到处理好的公交GPS数据后,需要对速度矩阵中空值位置进行状态的生成,以得到完整的公交交通状态提供给步骤三进行公交行程时间预测。常规的数据生成算法中,往往会采用编码-解码结构来进行数据特征提取与特征还原,从而得到生成结果。然而在逐步的特征还原过程会导致误差的不断累积,从而影响输出结果的准确性。本发明引入了控制论中误差控制的思想,构建了一种基于误差反馈机制的生成式对抗网络来生成公交线路公交状态,保证了在解码过程中计算误差的收敛从而提高了交通状态生成的准确性。最后通过端对端式的对抗训练,可以得到泛化能力较好的网络模型以生成公交交通状态。公交交通状态生成的具体步骤如下:
步骤二一、构建基于交通流先验规则的生成式对抗网络;
步骤二二、对构建的基于交通流先验规则的生成式对抗网络中生成器和判别器进行端对端迭代训练,得到训练好的生成式对抗网络;
步骤二三、基于训练好的生成式对抗网络,生成契合实际的公交线路交通状态。
其它步骤及参数与具体实施方式一或二相同。
具体实施方式四:本实施方式与具体实施方式一至三之一不同的是,所述步骤二一中构建基于交通流先验规则的生成式对抗网络;具体过程为:
图3为本发明所述基于误差反馈的生成式对抗网络结构图,生成式对抗网络包括生成器G和判别器D两部分;此外,为了能准确求解网络中的各个参数,还需要建立生成器的损失函数和判别器的损失函数作为网络的优化目标;
步骤二一一、构建生成器;
生成器G主要是从稀疏的公交采样数据中学习出交通状态的时空分布,并依据该分布推断出待估计位置的公交速度。本发明所述生成器采用交通状态特征提取与特征还原两步骤来进行交通状态的生成,这两步骤分别对应编码器与解码器两部分。图4为本发明所述的生成器结构示意图。首先,编码器中构建了三层卷积网络层来提取速度矩阵中的交通状态分布特征;其次解码器设计了一种考虑误差反馈的解码单元,从编码器提取的状态特征出发,逐步还原出完整的公交速度矩阵。具体地,生成器构造如下:
在进行公交线路交通状态生成之前,首先引入掩膜矩阵用于标记速度未观测的位置,从而指示网络模型生成对应位置的数据;
构建真实掩膜矩阵:
遍历速度矩阵里的每一个位置,若该位置有观测到的速度值,则真实掩膜矩阵的同一位置记为“1”,否则记为“0”,得到真实掩膜矩阵;其次,由于生成式对抗网络主要是通过对随机噪声数据的映射变换得到生成数据的,因此需要先准备噪声矩阵来填充未观测到的速度。
构建噪声矩阵:
先拟定一个尺寸与速度矩阵相同的零矩阵,然后搜索所有未观测到速度的时空位置,记为“0”;观测到速度的时空位置,记为“1”,从一个二维高斯分布中随机采样数据点对“0”进行填补,得到噪声矩阵;
所述二维高斯分布的具体形式为:
Figure BDA0002919372930000051
其中,z(x,t)为噪声;σn为噪声分布的方差,取5;x和t分别为搜索到的未观测到速度的空间、时间位置;
上述预先填入的噪声数据通过编码器与解码器的逐步变换将越来越趋近真实的公交速度。
生成器中包括编码器与解码器,编码器与解码器两大部分具体如下:
第一部分:编码器部分;
构建的提取交通状态特征的编码器中设置了3个隐藏网络层,这些隐藏网络层均为卷积神经网络层。具体的公交线路交通状态特征提取过程为:通过卷积网络的逐步变换将数据映射至一个特征空间,空间的尺寸是由各层采用的卷积核的尺寸大小决定的。卷积核可以缩小数据矩阵的尺寸,这样前三层网络通过逐步缩小数据空间提取了交通特征。
编码器包含第一卷积神经网络层、第一平均池化层、第二卷积神经网络层、第二平均池化层、第三卷积神经网络层、第三平均池化层,第一卷积神经网络层的卷积核尺寸为5×5,第二卷积神经网络层的卷积核尺寸为3×3,第三卷积神经网络层的卷积核尺寸为2×2;
第一卷积神经网络层的输出层连接第一平均池化层的输入层,第一平均池化层的输出层连接第二卷积神经网络层的输入层,第二卷积神经网络层的输出层连接第二平均池化层的输入层,第二平均池化层的输出层连接第三卷积神经网络层的输入层,第三卷积神经网络层的输出层连接第三平均池化层的输入;
将步骤一二构建的速度矩阵、步骤二一一构建的真实掩膜矩阵及噪声矩阵输入第一卷积神经网络层的输入层,经第一平均池化层、第二卷积神经网络层、第二平均池化层、第三卷积神经网络层、第三平均池化层输出公交线路交通状态特征矩阵(速度特征矩阵);
具体地,第l卷积神经网络层的计算过程如下:
为了挖掘交通时空关联性,利用二维卷积运算对公交线路交通状态进行特征映射变换,计算方法如下:
Figure BDA0002919372930000061
其中,
Figure BDA0002919372930000062
为第l层卷积网络使用的卷积核,将在步骤二二网络端对端地迭代训练过程中寻找到最优取值;m和z分别为速度对应的真实掩膜和噪声取值;
Figure BDA0002919372930000063
为第l层卷积运算后输出的公交线路交通状态特征矩阵,l=1,2,3,其中
Figure BDA0002919372930000064
取值为步骤一一归一化处理后的速度数据v*;*为卷积运算符号;
具体地,第l层平均池化层的计算过程如下:
为了消除由公交司机驾驶特性不同等因素造成的公交速度噪声,卷积运算后,本发明都采用平均池化缩减公交线路交通状态特征,平均池化的计算公式如下:
Figure BDA0002919372930000065
其中,k为所有的速度点数;
Figure BDA0002919372930000066
为第l层卷积运算后进行平均池化求得的交通状态特征矩阵中的第q个公交速度点值;
Figure BDA0002919372930000067
为第l层卷积运算输出的交通状态特征矩阵中的第u个数据点;
Figure BDA0002919372930000068
Figure BDA0002919372930000069
对应的权重;
Figure BDA00029193729300000610
由公式(5)确定,表达式为:
Figure BDA00029193729300000611
其中,
Figure BDA0002919372930000071
Figure BDA0002919372930000072
分别为
Figure BDA0002919372930000073
所在的空间和时间位置;
Figure BDA0002919372930000074
Figure BDA0002919372930000075
分别为
Figure BDA0002919372930000076
所在的空间和时间位置;
第二部分:解码器部分;
在解码器部分,本发明构建了一种基于误差反馈的上采样单元,该单元引入控制论中误差反馈的思想,通过计算解码器每一步上采样的误差来预测其在下一步特征还原时的计算误差,从而矫正公交线路交通状态生成结果,避免误差的逐步累积。
解码器包含第一上采样单元、第二上采样单元、第三上采样单元,与编码器中的卷积层相对应,第一上采样单元采用的反卷积核尺寸为2×2,第二上采样单元采用的反卷积核尺寸为3×3,第三上采样单元采用的反卷积核尺寸为5×5;
将编码器的第三平均池化层输出的公交线路交通状态特征矩阵输入第一上采样单元,第一上采样单元的输出及编码器中第三平均池化层的输出连接第二上采样单元的输入,第二上采样单元的输出及编码器中第二平均池化层的输出连接第三上采样单元的输入,第三上采样单元的输出最终生成公交线路交通状态矩阵(生成器最终输出);
基于误差反馈的上采样单元的结构如图5所示。
具体的,第l层上采样单元计算步骤如下:
1)首先,上采样单元通过反卷积将编码器提取的公交线路交通状态特征扩大重构为完整的公交线路交通状态矩阵,反卷积的计算方法如下:
Figure BDA0002919372930000077
其中,
Figure BDA0002919372930000078
为第l层上采样单元使用的反卷积核,将在步骤二二网络端对端地迭代训练过程中寻找到最优取值;
Figure BDA0002919372930000079
为第l层反卷积运算后输出的还原交通状态特征矩阵,l=1,2,3,其中
Figure BDA00029193729300000710
取值为编码器第三平均池化层输出的公交线路交通状态特征矩阵
Figure BDA00029193729300000711
**为反卷积运算符号;
2)将第l-1层反卷积计算结果与第4-l层卷积输出结果作差,求得第l-1层反卷积计算的误差
Figure BDA00029193729300000712
计算公式如下:
Figure BDA00029193729300000713
其中,
Figure BDA00029193729300000714
为第l-1层反卷积计算误差;
Figure BDA00029193729300000715
为第l-1层上采样单元生成的公交线路交通状态矩阵,由公式(10)计算得出;
Figure BDA00029193729300000716
为第4-l层平均池化层提取的交通状态特征矩阵,由公式(4)计算得到;l的取值范围为l=1,2,3,当l=1时,第一层上采样单元的输入为编码器的第三层平均池化层的输出,即
Figure BDA0002919372930000081
Figure BDA0002919372930000082
Figure BDA0002919372930000083
3)将误差
Figure BDA0002919372930000084
通过反卷积扩大维度,并利用全连接层来预测第l层上采样单元交通状态估计误差
Figure BDA0002919372930000085
反卷积层计算公式为:
Figure BDA0002919372930000086
其中,
Figure BDA0002919372930000087
为第l层上采样单元中误差反卷积网络使用的反卷积核,将在步骤二二网络端对端地迭代训练过程中寻找到最优取值;**为反卷积运算符号;
Figure BDA0002919372930000088
为特征扩维后的第l-1层上采样单元交通状态还原误差(上采样单元的目的是进行速度特征的还原,在还原过程中会有误差);
全连接层的计算公式为:
Figure BDA0002919372930000089
其中,
Figure BDA00029193729300000810
Figure BDA00029193729300000811
分别为第l层上采样单元中使用的全连接层权重和偏置,将在步骤二二网络端对端地迭代训练过程中寻找到最优取值;
Figure BDA00029193729300000812
为预测的第l层上采样单元交通状态估计误差;
4)最终,将
Figure BDA00029193729300000813
与公式(6)计算得到的还原交通状态特征矩阵
Figure BDA00029193729300000814
相加,得到误差反馈矫正后的公交线路交通状态生成结果:
Figure BDA00029193729300000815
其中,
Figure BDA00029193729300000816
为第l层上采样单元生成的交通状态矩阵;
步骤二一二、构建判别器;
判别器D作为一个独立的神经网络被引入生成式对抗网络,主要是用来评价生成器的性能。判别器的输入为生成器生成的交通状态矩阵,判别器的输出为估计的掩膜矩阵;
判别器中包括编码器与解码器,编码器与解码器和生成器相同;
在真实的掩膜矩阵的监督下,判别器学习如何判断生成数据中的观测值和估计值并将其判定的结果反馈给生成器。结合判别器的反馈,生成器在下一步迭代中有方向地提高自己的性能。类似生成器的计算过程,判别器的计算如式(3)至式(10)所示,最终输出掩膜矩阵估计值。
步骤二一三、建立生成器的损失函数和判别器的损失函数作为网络的优化目标;
生成式对抗网络需要通过设置生成损失和判别损失来分别优化生成器和判别器;
为保证生成器能够准确地生成符合交通实际的速度值,生成损失函数分为重构损失和估计损失两部分。重构损失中,使用均方误差来保证重构的交通状态能尽可能地接近观察值。估计损失接受判别器估计的掩膜矩阵作为反馈来确保生成的交通状态能使判别器失效。利用超参数α整合重构损失和估计损失,最终得到生成器的损失函数为:
Figure BDA0002919372930000091
其中,mr为步骤二一一计算的第r个数据点的真实掩膜值;
Figure BDA0002919372930000092
为判别器估计的第r个数据点的估计掩膜值;α为超参数;
Figure BDA0002919372930000093
为步骤一一中归一化处理后第r个数据点的速度;
Figure BDA0002919372930000094
为生成器估计的第r个数据点公交速度;h为估计的速度点个数;
判别器判断生成器输出速度的真假属于分类问题,因此将判别器的损失函数为交叉熵函数:
Figure BDA0002919372930000095
其它步骤及参数与具体实施方式一至三之一相同。
具体实施方式五:本实施方式与具体实施方式一至四之一不同的是,所述步骤二二中对构建的基于交通流先验规则的生成式对抗网络中生成器和判别器进行端对端迭代训练,得到训练好的生成式对抗网络;具体过程如下:
步骤二二一、利用贝叶斯搜索方法确定超参数α的取值并随机初始化生成式对抗网络中其他参数W、b等,这些参数α、W、b组成待寻优参数集,它们的最优取值是在端对端的训练过程中确定的。
步骤二二二、将步骤一二的速度矩阵、步骤二一一生成的噪声矩阵及真实掩膜矩阵输入生成器(步骤二一一构建的生成器)中得到完整的公交线路交通状态生成矩阵;
然后将得到的完整的公交线路交通状态生成矩阵和步骤二一一得到的真实掩膜矩阵输入判别器中,得到判别器估计的掩膜矩阵;利用步骤二一一得到的真实掩膜矩阵数据和判别器估计的掩膜矩阵数据,按照公式(11)和公式(12)分别计算出生成损失和判别损失;
步骤二二三、沿生成损失和判别损失快速下降的方向,求解步骤二二一中待寻优参数的反向传播梯度值并更新这些参数值。具体地,设生成器的待寻优参数集为δ,生成器参数的更新规则如下:
Figure BDA0002919372930000101
其中,
Figure BDA0002919372930000102
为待寻优参数集δ的梯度算子;v*为步骤一一中归一化处理后的速度;
Figure BDA0002919372930000103
为第e步迭代生成的公交交通状态;
Figure BDA0002919372930000104
为第e步迭代计算的生成损失;k为所有的速度点数;δ(e)、δ(e-1)分别为第e步和第e-1步迭代时生成器的待寻优参数集的取值;
设判别器的待寻优参数集为θ,判别器参数的更新规则如下:
Figure BDA0002919372930000105
其中,
Figure BDA0002919372930000106
为待寻优参数集θ的梯度算子;
Figure BDA0002919372930000107
为第e步迭代计算的判别损失;m为步骤二一一所计算的真实掩膜值;
Figure BDA0002919372930000108
为第e步迭代估计的掩膜值;k为所有的速度点数,θ(e)、θ(e-1)分别为第e步和第e-1步迭代时判别器的待寻优参数集的取值;
当生成损失和判别损失收敛时,认为此时获得的生成式对抗网络已经具备良好的数据生成能力,可以终止训练过程,得到训练好的生成式对抗网络;否则重复步骤二二中的训练过程。
其它步骤及参数与具体实施方式一至四之一相同。
具体实施方式六:本实施方式与具体实施方式一至五之一不同的是,所述步骤二三中基于训练好的生成式对抗网络,生成契合实际的公交线路交通状态;具体过程为:
通过上述训练过程可以得到一个生成能力较强的生成式对抗网络。将经归一化处理的公交速度矩阵输入训练好的生成式对抗网络中得到生成的输出结果,再将输出结果反归一化还原,即可生成契合实际的公交线路交通状态。
其它步骤及参数与具体实施方式一至五之一相同。
具体实施方式七:本实施方式与具体实施方式一至六之一不同的是,所述步骤三中基于无模型自适应驱动方法,在线预测公交行程时间;具体过程为:
本发明在步骤三中构建了一种数据驱动的在线实时滤波算法来预测公交行程时间。为摆脱传统滤波算法对模型结构的依赖,本发明提出了一种伪梯度向量来自适应地捕捉交通状态的变化趋势,使得算法能够在步骤二生成的公交状态的驱动下,实现公交行程时间的在线准确预测。具体计算过程如下:
步骤三一、考虑到公交线路上各路段的交通状态与其相邻路段的交通状态具有一定的关联性,因此算法可以通过分析上游各个路段上行程时间的变化趋势来预测当前路段的公交行程时间的。本发明从步骤二生成的公交线路交通状态矩阵中选取待预测时间段t对应的列向量,将各路段按照道路的前进方向由小到大编号,用各路段长度(步骤一二中定义的空间间隔为20米)除以该路段对应的速度,求得各路段的行程时间观测值,最终获得第t时段的公交行程时间观测值T的空间序列:
Tt′(x)={Tt(1),Tt(2),Tt(3),...,Tt(x-1),Tt(x)} (15)
其中,Tt(1)为第t时段,第1个路段的公交行程时间观测值,Tt(x)为第t时段,第x个路段的公交行程时间观测值;
将空间序列上各相邻路段的行程时间(包括行程时间观测值和行程时间预测值)相减求差(2-1,3-2,4-3,5-4),计算得各路段的行程时间变化量,作为本发明所提出的无模型自适应公交行程时间预测方法的输入向量ΔI;输入向量ΔI包括第t时段,前Cp个路段公交行程时间观测值的变化量以及由公交行程时间预测模型式(23)对前Cf个路段行程时间预测值的变化量,具体形式如公式(16)所示:
Figure BDA0002919372930000111
其中,Cp和Cf分别为无模型自适应公交行程时间预测方法的输入及输出的伪阶数;
Figure BDA0002919372930000112
为公交线路上各路段的行程时间变化量;ΔTt(x)为第t时段,第x-1个路段与第x个路段间行程时间观测值的差值;
Figure BDA0002919372930000113
为第t时段,第x-1个路段与第x个路段间行程时间预测值的差值;
应注意的是,在开始计算前,需要给
Figure BDA0002919372930000114
设置初始值,ΔTt(·)从公式(15)表达的行程时间的空间序列中直接计算即可,
Figure BDA0002919372930000115
取值与ΔTt(·)相同;
步骤三二、在确定了公交线路上各路段的行程时间变化量
Figure BDA0002919372930000116
后,本发明构建伪梯度向量
Figure BDA0002919372930000117
计算行程时间的变化率;
该伪梯度向量可以捕捉出行程时间的变化趋势以驱动预测方法输出结果,同时还可以控制预测方法的误差变化范围,防止在预测过程中出现结果失效、跑偏等情况。
伪梯度向量的具体形式为:
Figure BDA0002919372930000121
其中,
Figure BDA0002919372930000122
为与
Figure BDA0002919372930000123
相对应的行程时间变化率向量,
Figure BDA0002919372930000124
Figure BDA0002919372930000125
的各个分量一一对应,φa(x)代表公交线路上各路段的行程时间变化量(输入向量)
Figure BDA0002919372930000126
中第a个分量对应路段的行程时间变化率;a=1,...,CP,CP+1,...,CP+Cf
伪梯度向量的具体计算过程如下所示:
1)考虑到交通状态在时间上的变化具有一定的连续性,不会在短时间内发生突变,因此路段相邻两时段间的公交行程时间具有很强的相似性。故本发明以预测路段前一时间段的公交行程时间作为预测期望值;前一时间段的公交行程时间是通过将步骤三一中从步骤二生成的公交速度矩阵中选取待预测时间段t对应的列数减一作为列索引,将预测路段编号(步骤三一中各路段按照道路的前进方向由小到大编号)作为行索引,在步骤二中生成的公交速度矩阵通过行、列索引找到的;
最终本发明以预测路段前一时间段的公交行程时间作为预测期望值,预测期望值E(x+1)的具体计算方法如公式(18)所示:
Et-1(x+1)=Tt-1(x+1) (18)
其中,t为预测时段,x+1为待预测行程时间公交线路路段的紧邻下游路段,Tt-1(x+1)为第x+1个路段在t-1时段的公交行程时间,Et-1(x+1)为第x+1个路段在t-1时段上公交行程时间期望值;
将第x+1个路段在t-1时段和t-2时段公交行程时间相减,得到第x+1个路段公交行程时间期望值的变化量ΔEt-1(x+1),计算公式如下:
ΔEt-1(x+1)=Et-1(x+1)-Et-2(x+1) (19)
其中,ΔEt-1(x+1)为第x+1个路段在t-1时段与t-2时段上公交行程时间期望值的变化量;Et-1(x+1)为第x+1个路段在t-1时段上公交行程时间期望值;Et-2(x+1)为第x+1个路段在t-2时段上公交行程时间期望值;
2)求得公交行程时间预测期望值后,伪梯度的计算方法如公式(20)所示:
Figure BDA0002919372930000131
其中,κ、ηx为权重因子,分别取0.2和1;ΔEt-1(x+1)为第x+1个路段在t-1时段与t-2时段上公交行程时间期望值的差值;
3)为防止在预测过程中结果跑偏,本发明还设置了误差校正机制,当伪梯度或各路段行程时间变化量
Figure BDA0002919372930000132
小于υ时,对伪梯度向量进行修正,修正过程为:
Figure BDA0002919372930000133
其中,υ为无穷小的常数,实际计算中取0.0001。
步骤三三、在求得伪梯度向量
Figure BDA0002919372930000134
即路段行程时间的变化率后,本发明提出了一种动态线性方法来根据变化率预测路段上行程时间的变化量,从而更新公交行程时间预测模型式(23)的输入向量
Figure BDA0002919372930000135
中的分量
Figure BDA0002919372930000136
具体地计算方法如下:
Figure BDA0002919372930000137
其中,ρd、κu为权重因子,分别取0.5和0.8;
步骤三四、将公交行程时间预测过程视作一个控制系统,经由步骤二生成了完整的公交速度矩阵,保证了该系统总是存在可行的输入使得其在公交线路交通状态的驱动下能够进行准确的预测。因此,本发明采用全格式动态线性化无模型自适应控制器来预测公交行程时间。在更新后的伪梯度向量
Figure BDA0002919372930000138
与输入向量
Figure BDA0002919372930000139
的驱动下,预测公交行程时间;具体为:
Figure BDA00029193729300001310
其中,
Figure BDA00029193729300001311
为第x+1个路段在第t时段的公交行程时间预测值。
重复步骤三一至三四,可以滚动预测第t时段时,x+2、x+3、…、x+g等下游路段的公交行程时间。
其它步骤及参数与具体实施方式一至六之一相同。
综上所述,本发明建立的一种基于稀疏GPS数据的公交行程时间预测方法,既能依据交通特性有效地生成GPS数据,又能准确地依据交通状态进行公交行程时间预测。一方面,现有研究大都集中于利用多源数据来进行交通状态估计,忽略了数据的稀疏性。然而,现阶段各部门间的数据共享尚未完全实现,该方法可以直接为仅有单一数据源的公交公司提供技术支持;另一方面,该方法可以较为准确的预测公交行程时间,能为公交公司后续的管理,如公交优化调度等提供信息支持。因此,本发明具有较好的应用前景。
本发明还可有其它多种实施例,在不背离本发明精神及其实质的情况下,本领域技术人员当可根据本发明作出各种相应的改变和变形,但这些相应的改变和变形都应属于本发明所附的权利要求的保护范围。

Claims (1)

1.一种基于稀疏GPS数据的公交行程时间预测方法,其特征在于:所述方法具体过程为:
步骤一、接收到公交车辆上传的原始GPS数据后,对公交原始GPS数据进行归一化预处理,并将归一化预处理后的数据整合为二维时空速度矩阵;
步骤二、构建基于交通流先验规则的生成式对抗网络,生成契合实际的公交线路交通状态;
步骤三、基于无模型自适应驱动方法,在线预测公交行程时间;
所述步骤一中接收到公交车辆上传的原始GPS数据后,对公交原始GPS数据进行归一化预处理,并将归一化预处理后的数据整合为二维时空速度矩阵;具体过程如下:
步骤一一、接收到公交车辆上传的原始GPS数据后,对公交原始GPS数据进行归一化预处理;过程为:
1)接收到公交车辆上传的原始GPS数据后,将速度超过公交最高限速值的数据视为异常值并删除;
2)对公交车辆上传的原始GPS数据进行归一化处理;归一化处理的公式为:
Figure FDA0003420843040000011
其中,v和v*分别是公交车辆上传的原始的速度数据和归一化处理后的速度数据,vmin和vmax分别是公交车辆上传的原始数据中速度的最小值和最大值;
步骤一二、将归一化处理后的速度数据整合为速度矩阵;
在构建速度矩阵时,首先按照20米间隔将公交线路划分为xn个路段{x1,x2,...,xi,...,xn};其次,统计各个路段每5分钟的归一化处理后的公交GPS数据得到时间序列{t1,t2,...,tj,...,tm};
如果路段xi在第tj个5分钟的时间间隔内采集到了公交数据,设i是速度矩阵的行数,j是速度矩阵的列数,(i,j)索引对应速度矩阵中一个数据点,则速度矩阵中位置(i,j)处数据的取值为采集到的公交数据速度的平均值;否则,速度矩阵对应位置取空值;
所述步骤二中构建基于交通流先验规则的生成式对抗网络,生成契合实际的公交线路交通状态;具体过程为:
步骤二一、构建基于交通流先验规则的生成式对抗网络;
步骤二二、对构建的基于交通流先验规则的生成式对抗网络中生成器和判别器进行端对端迭代训练,得到训练好的生成式对抗网络;
步骤二三、基于训练好的生成式对抗网络,生成契合实际的公交线路交通状态;
所述步骤二一中构建基于交通流先验规则的生成式对抗网络;具体过程为:
生成式对抗网络包括生成器G和判别器D两部分;
步骤二一一、构建生成器;
构建真实掩膜矩阵:
遍历速度矩阵里的每一个位置,若该位置有观测到的速度值,则真实掩膜矩阵的同一位置记为“1”,否则记为“0”,得到真实掩膜矩阵;
构建噪声矩阵:
先拟定一个尺寸与速度矩阵相同的零矩阵,然后搜索所有未观测到速度的时空位置,记为“0”;观测到速度的时空位置,记为“1”,从一个二维高斯分布中随机采样数据点对“0”进行填补,得到噪声矩阵;
所述二维高斯分布的具体形式为:
Figure FDA0003420843040000021
其中,z(x,t)为噪声;σn为噪声分布的方差,取5;x和t分别为搜索到的未观测到速度的空间、时间位置;
生成器中包括编码器与解码器,编码器与解码器两大部分具体如下:
第一部分:编码器部分;
编码器包含第一卷积神经网络层、第一平均池化层、第二卷积神经网络层、第二平均池化层、第三卷积神经网络层、第三平均池化层,第一卷积神经网络层的卷积核尺寸为5×5,第二卷积神经网络层的卷积核尺寸为3×3,第三卷积神经网络层的卷积核尺寸为2×2;
第一卷积神经网络层的输出层连接第一平均池化层的输入层,第一平均池化层的输出层连接第二卷积神经网络层的输入层,第二卷积神经网络层的输出层连接第二平均池化层的输入层,第二平均池化层的输出层连接第三卷积神经网络层的输入层,第三卷积神经网络层的输出层连接第三平均池化层的输入;
将速度矩阵、真实掩膜矩阵及噪声矩阵输入第一卷积神经网络层的输入层,经第一平均池化层、第二卷积神经网络层、第二平均池化层、第三卷积神经网络层、第三平均池化层输出公交线路交通状态特征矩阵;
第l卷积神经网络层的计算过程如下:
利用二维卷积运算对公交线路交通状态进行特征映射变换,计算方法如下:
Figure FDA0003420843040000031
其中,
Figure FDA0003420843040000034
为第l层卷积网络使用的卷积核;m和z分别为速度对应的真实掩膜和噪声取值;
Figure FDA0003420843040000036
为第l层卷积运算后输出的公交线路交通状态特征矩阵,l=1,2,3,其中
Figure FDA0003420843040000035
取值为步骤一一归一化处理后的速度数据v*;*为卷积运算符号;
第l层平均池化层的计算过程如下:
卷积运算后,采用平均池化缩减公交线路交通状态特征,平均池化的计算公式如下:
Figure FDA0003420843040000032
其中,k为所有的速度点数;
Figure FDA0003420843040000037
为第l层卷积运算后进行平均池化求得的交通状态特征矩阵中的第q个公交速度点值;
Figure FDA0003420843040000038
为第l层卷积运算输出的交通状态特征矩阵中的第u个数据点;
Figure FDA00034208430400000310
Figure FDA0003420843040000039
对应的权重;
Figure FDA00034208430400000311
由公式(5)确定,表达式为:
Figure FDA0003420843040000033
其中,
Figure FDA00034208430400000312
Figure FDA00034208430400000313
分别为
Figure FDA00034208430400000314
所在的空间和时间位置;
Figure FDA00034208430400000315
Figure FDA00034208430400000316
分别为
Figure FDA00034208430400000317
所在的空间和时间位置;
第二部分:解码器部分;
解码器包含第一上采样单元、第二上采样单元、第三上采样单元,第一上采样单元采用的反卷积核尺寸为2×2,第二上采样单元采用的反卷积核尺寸为3×3,第三上采样单元采用的反卷积核尺寸为5×5;
将编码器的第三平均池化层输出的公交线路交通状态特征矩阵输入第一上采样单元,第一上采样单元的输出及编码器中第三平均池化层的输出连接第二上采样单元的输入,第二上采样单元的输出及编码器中第二平均池化层的输出连接第三上采样单元的输入,第三上采样单元的输出最终生成公交线路交通状态矩阵;
上采样单元计算步骤如下:
1)首先,上采样单元通过反卷积将编码器提取的公交线路交通状态特征扩大重构为完整的公交线路交通状态矩阵,反卷积的计算方法如下:
Figure FDA0003420843040000041
其中,
Figure FDA0003420843040000042
为第l层上采样单元使用的反卷积核;
Figure FDA0003420843040000043
为第l层反卷积运算后输出的还原交通状态特征矩阵,l=1,2,3,其中
Figure FDA0003420843040000044
取值为编码器第三平均池化层输出的公交线路交通状态特征矩阵
Figure FDA0003420843040000045
**为反卷积运算符号;
2)将第l-1层反卷积计算结果与第4-l层卷积输出结果作差,求得第l-1层反卷积计算的误差
Figure FDA0003420843040000046
计算公式如下:
Figure FDA0003420843040000047
其中,
Figure FDA0003420843040000048
为第l-1层反卷积计算误差;
Figure FDA0003420843040000049
为第l-1层上采样单元生成的公交线路交通状态矩阵;
Figure FDA00034208430400000410
为第4-l层平均池化层提取的交通状态特征矩阵,由公式(4)计算得到;l的取值范围为l=1,2,3,当l=1时,第一层上采样单元的输入为编码器的第三层平均池化层的输出,即
Figure FDA00034208430400000411
Figure FDA00034208430400000412
Figure FDA00034208430400000413
3)将误差
Figure FDA00034208430400000422
通过反卷积扩大维度,并利用全连接层来预测第l层上采样单元交通状态估计误差
Figure FDA00034208430400000423
反卷积层计算公式为:
Figure FDA00034208430400000414
其中,
Figure FDA00034208430400000415
为第l层上采样单元中误差反卷积网络使用的反卷积核;**为反卷积运算符号;
Figure FDA00034208430400000416
为特征扩维后的第l-1层上采样单元交通状态还原误差;
全连接层的计算公式为:
Figure FDA00034208430400000417
其中,
Figure FDA00034208430400000418
Figure FDA00034208430400000419
分别为第l层上采样单元中使用的全连接层权重和偏置;
Figure FDA00034208430400000420
为预测的第l层上采样单元交通状态估计误差;
4)最终,将
Figure FDA00034208430400000421
与公式(6)计算得到的还原交通状态特征矩阵
Figure FDA00034208430400000424
相加,得到误差反馈矫正后的公交线路交通状态生成结果:
Figure FDA0003420843040000051
其中,
Figure FDA0003420843040000052
为第l层上采样单元生成的交通状态矩阵;
步骤二一二、构建判别器;
判别器的输入为生成器生成的交通状态矩阵,判别器的输出为估计的掩膜矩阵;
判别器中包括编码器与解码器,编码器与解码器和生成器相同;
步骤二一三、建立生成器的损失函数和判别器的损失函数作为网络的优化目标;
生成器的损失函数为:
Figure FDA0003420843040000053
其中,mr为步骤二一一计算的第r个数据点的真实掩膜值;
Figure FDA0003420843040000054
为判别器估计的第r个数据点的估计掩膜值;α为超参数;
Figure FDA0003420843040000055
为步骤一一中归一化处理后第r个数据点的速度;
Figure FDA0003420843040000056
为生成器估计的第r个数据点公交速度;h为估计的速度点个数;
判别器的损失函数为交叉熵函数:
Figure FDA0003420843040000057
所述步骤二二中对构建的基于交通流先验规则的生成式对抗网络中生成器和判别器进行端对端迭代训练,得到训练好的生成式对抗网络;具体过程如下:
步骤二二一、利用贝叶斯搜索方法确定超参数α的取值并随机初始化生成式对抗网络中参数W、b,α、W、b组成待寻优参数集;
步骤二二二、将步骤一二的速度矩阵、步骤二一一生成的噪声矩阵及真实掩膜矩阵输入生成器中得到完整的公交线路交通状态生成矩阵;
然后将得到的完整的公交线路交通状态生成矩阵和步骤二一一得到的真实掩膜矩阵输入判别器中,得到判别器估计的掩膜矩阵;利用步骤二一一得到的真实掩膜矩阵数据和判别器估计的掩膜矩阵数据,按照公式(11)和公式(12)分别计算出生成损失和判别损失;
步骤二二三、设生成器的待寻优参数集为δ,生成器参数的更新规则如下:
Figure FDA0003420843040000058
其中,
Figure FDA0003420843040000059
为待寻优参数集δ的梯度算子;v*为步骤一一中归一化处理后的速度;
Figure FDA00034208430400000510
第e步迭代生成的公交交通状态;
Figure FDA0003420843040000061
为第e步迭代计算的生成损失;k为所有的速度点数;δ(e)、δ(e-1)分别为第e步和第e-1步迭代时生成器的待寻优参数集的取值;
设判别器的待寻优参数集为θ,判别器参数的更新规则如下:
Figure FDA0003420843040000062
其中,
Figure FDA0003420843040000063
为待寻优参数集θ的梯度算子;
Figure FDA0003420843040000064
为第e步迭代计算的判别损失;m为步骤二一一所计算的真实掩膜值;
Figure FDA0003420843040000065
为第e步迭代估计的掩膜值;k为所有的速度点数,θ(e)、θ(e-1)分别为第e步和第e-1步迭代时判别器的待寻优参数集的取值;
当生成损失和判别损失收敛时,终止训练过程,得到训练好的生成式对抗网络;
所述步骤二三中基于训练好的生成式对抗网络,生成契合实际的公交线路交通状态;具体过程为:
将经归一化处理的公交速度矩阵输入训练好的生成式对抗网络中得到生成的输出结果,再将输出结果反归一化还原,即可生成契合实际的公交线路交通状态;
所述步骤三中基于无模型自适应驱动方法,在线预测公交行程时间;具体过程为:
步骤三一、从步骤二生成的公交线路交通状态矩阵中选取待预测时间段t对应的列向量,将各路段按照道路的前进方向由小到大编号,用各路段长度除以该路段对应的速度,求得各路段的行程时间观测值,最终获得第t时段的公交行程时间观测值T的空间序列:
Tt′(x)={Tt(1),Tt(2),Tt(3),...,Tt(x-1),Tt(x)} (15)
其中,Tt(1)为第t时段,第1个路段的公交行程时间观测值,Tt(x)为第t时段,第x个路段的公交行程时间观测值;
将空间序列上各相邻路段的行程时间相减求差,计算得各路段的行程时间变化量,具体形式如公式(16)所示:
Figure FDA0003420843040000066
其中,Cp和Cf分别为无模型自适应公交行程时间预测的输入及输出的伪阶数;
Figure FDA0003420843040000067
为公交线路上各路段的行程时间变化量;△Tt(x)为第t时段,第x-1个路段与第x个路段间行程时间观测值的差值;
Figure FDA0003420843040000068
为第t时段,第x-1个路段与第x个路段间行程时间预测值的差值;
在开始计算前,给
Figure FDA0003420843040000071
设置初始值,△Tt(·)从公式(15)表达的行程时间的空间序列中直接计算即可,
Figure FDA0003420843040000072
取值与△Tt(·)相同;
步骤三二、在确定了公交线路上各路段的行程时间变化量
Figure FDA00034208430400000710
后,构建伪梯度向量
Figure FDA0003420843040000079
计算行程时间的变化率;
伪梯度向量的具体形式为:
Figure FDA0003420843040000073
其中,
Figure FDA0003420843040000074
为与
Figure FDA0003420843040000075
相对应的行程时间变化率向量,
Figure FDA0003420843040000076
Figure FDA0003420843040000077
的各个分量一一对应,φa(x)代表公交线路上各路段的行程时间变化量
Figure FDA0003420843040000078
中第a个分量对应路段的行程时间变化率;a=1,...,CP,CP+1,...,CP+Cf
伪梯度向量的具体计算过程如下所示:
1)以预测路段前一时间段的公交行程时间作为预测期望值;前一时间段的公交行程时间是通过将步骤三一中待预测时间段t对应的列数减一作为列索引,将预测路段编号作为行索引;
最终以预测路段前一时间段的公交行程时间作为预测期望值,预测期望值E(x+1)的具体计算方法如公式(18)所示:
Et-1(x+1)=Tt-1(x+1) (18)
其中,t为预测时段,x+1为待预测行程时间公交线路路段的紧邻下游路段,Tt-1(x+1)为第x+1个路段在t-1时段的公交行程时间,Et-1(x+1)为第x+1个路段在t-1时段上公交行程时间期望值;
将第x+1个路段在t-1时段和t-2时段公交行程时间相减,得到第x+1个路段公交行程时间期望值的变化量△Et-1(x+1),计算公式如下:
△Et-1(x+1)=Et-1(x+1)-Et-2(x+1) (19)
其中,△Et-1(x+1)为第x+1个路段在t-1时段与t-2时段上公交行程时间期望值的变化量;Et-1(x+1)为第x+1个路段在t-1时段上公交行程时间期望值;Et-2(x+1)为第x+1个路段在t-2时段上公交行程时间期望值;
2)求得公交行程时间预测期望值后,伪梯度的计算方法如公式(20)所示:
Figure FDA0003420843040000081
其中,κ、ηx为权重因子;△Et-1(x+1)为第x+1个路段在t-1时段与t-2时段上公交行程时间期望值的差值;
3)对伪梯度向量进行修正,修正过程为:
Figure FDA0003420843040000082
Figure FDA0003420843040000083
其中,υ为无穷小的常数;
步骤三三、在求得伪梯度向量
Figure FDA0003420843040000084
即路段行程时间的变化率后,根据变化率预测路段上行程时间的变化量,从而更新公交行程时间预测模型式(23)的输入向量
Figure FDA0003420843040000085
中的分量
Figure FDA0003420843040000086
具体地计算方法如下:
Figure FDA0003420843040000087
其中,ρd、κu为权重因子;
步骤三四、在更新后的伪梯度向量
Figure FDA0003420843040000088
与输入向量
Figure FDA0003420843040000089
的驱动下,预测公交行程时间;具体为:
Figure FDA00034208430400000810
其中,
Figure FDA00034208430400000811
为第x+1个路段在第t时段的公交行程时间预测值;
重复步骤三一至三四,滚动预测第t时段时,x+2、x+3、…、x+g下游路段的公交行程时间。
CN202110111089.9A 2021-01-27 2021-01-27 一种基于稀疏gps数据的公交行程时间预测方法 Active CN112907953B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110111089.9A CN112907953B (zh) 2021-01-27 2021-01-27 一种基于稀疏gps数据的公交行程时间预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110111089.9A CN112907953B (zh) 2021-01-27 2021-01-27 一种基于稀疏gps数据的公交行程时间预测方法

Publications (2)

Publication Number Publication Date
CN112907953A CN112907953A (zh) 2021-06-04
CN112907953B true CN112907953B (zh) 2022-01-28

Family

ID=76118881

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110111089.9A Active CN112907953B (zh) 2021-01-27 2021-01-27 一种基于稀疏gps数据的公交行程时间预测方法

Country Status (1)

Country Link
CN (1) CN112907953B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115100897B (zh) * 2022-05-23 2023-11-17 惠州华阳通用电子有限公司 一种车辆位置确定方法及装置

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102610088A (zh) * 2012-03-08 2012-07-25 东南大学 一种公交车站点间行程时间预测方法
CN104064028A (zh) * 2014-06-23 2014-09-24 银江股份有限公司 基于多元信息数据的公交到站时间预测方法及系统
CN109191845A (zh) * 2018-09-28 2019-01-11 吉林大学 一种公交车辆到站时间预测方法
CN109493599A (zh) * 2018-11-16 2019-03-19 南京航空航天大学 一种基于生成式对抗网络的短时交通流预测方法
CN109920248A (zh) * 2019-03-05 2019-06-21 南通大学 一种基于gru神经网络的公交到站时间预测方法
CN110168313A (zh) * 2017-01-10 2019-08-23 北京嘀嘀无限科技发展有限公司 用于预估到达时间的方法及系统
WO2020232732A1 (en) * 2019-05-23 2020-11-26 Beijing Didi Infinity Technology And Development Co., Ltd. Systems and methods for predicting traffic information
CN112017436A (zh) * 2020-09-09 2020-12-01 中国科学院自动化研究所 城市市内交通旅行时间的预测方法及系统

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW201232489A (en) * 2011-01-31 2012-08-01 Huey-Kuo Chen A travel time prediction and arrival time inquiry system for school bus using HHT technique and grey theory
SG11201810989VA (en) * 2017-04-27 2019-01-30 Beijing Didi Infinity Technology & Development Co Ltd Systems and methods for route planning
CN108647834B (zh) * 2018-05-24 2021-12-17 浙江工业大学 一种基于卷积神经网络结构的交通流预测方法
CN110533905B (zh) * 2019-07-03 2022-02-15 广东工业大学 一种交通流预测的方法、系统及设备

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102610088A (zh) * 2012-03-08 2012-07-25 东南大学 一种公交车站点间行程时间预测方法
CN104064028A (zh) * 2014-06-23 2014-09-24 银江股份有限公司 基于多元信息数据的公交到站时间预测方法及系统
CN110168313A (zh) * 2017-01-10 2019-08-23 北京嘀嘀无限科技发展有限公司 用于预估到达时间的方法及系统
CN109191845A (zh) * 2018-09-28 2019-01-11 吉林大学 一种公交车辆到站时间预测方法
CN109493599A (zh) * 2018-11-16 2019-03-19 南京航空航天大学 一种基于生成式对抗网络的短时交通流预测方法
CN109920248A (zh) * 2019-03-05 2019-06-21 南通大学 一种基于gru神经网络的公交到站时间预测方法
WO2020232732A1 (en) * 2019-05-23 2020-11-26 Beijing Didi Infinity Technology And Development Co., Ltd. Systems and methods for predicting traffic information
CN112017436A (zh) * 2020-09-09 2020-12-01 中国科学院自动化研究所 城市市内交通旅行时间的预测方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
《Traffic State Estimation of Bus Line With Sparse Sampled Data》;Xianmin Song,Jing Tian,Pengfei Tao,Haitao Li,Cong Wu;《IEEE Access》;20201126;第8卷;全文 *
《基于GPS数据的公交行程时间计算与预测系统》;李天雷;《中国优秀硕士学位论文全文数据库 工程科技Ⅱ辑》;20090915(第09期);全文 *

Also Published As

Publication number Publication date
CN112907953A (zh) 2021-06-04

Similar Documents

Publication Publication Date Title
CN111724601B (zh) 一种适用于数据缺失的机动车交通流预测方法
CN110766942B (zh) 一种基于卷积长短期记忆网络的交通路网拥堵预测方法
CN111832814A (zh) 一种基于图注意力机制的空气污染物浓度预测方法
CN113313947B (zh) 短期交通预测图卷积网络的路况评估方法
CN108764540B (zh) 基于并行lstm串联dnn的供水管网压力预测方法
CN107958269A (zh) 一种基于隐马尔可夫模型的行车危险度预测方法
CN112966871B (zh) 基于卷积长短期记忆神经网络的交通拥堵预测方法及系统
CN112508173A (zh) 交通时空序列多步预测方法、系统及存储介质
CN114202120A (zh) 一种针对多源异构数据的城市交通行程时间预测方法
CN110738855B (zh) 一种数据稀疏时间段的道路交通流状况预测方法
EP4010769B1 (en) A method for determining a sensor configuration
CN111862592B (zh) 一种基于rgcn的交通流预测方法
CN113052206B (zh) 一种基于浮动车数据的路段旅行时间预测方法及装置
CN113205698A (zh) 一种基于igwo-lstm的短时交通流预测的导航提醒方法
CN113780665B (zh) 一种基于增强循环神经网络的私家车停留位置预测方法和系统
CN112907953B (zh) 一种基于稀疏gps数据的公交行程时间预测方法
CN104318757A (zh) 一种公交专用道上的公交车车路段运行时间预测方法
CN116307152A (zh) 时空交互式动态图注意力网络的交通预测方法
CN112562312A (zh) 一种基于融合特征的GraphSAGE交通路网数据预测的方法
CN114596726A (zh) 基于可解释时空注意力机制的停车泊位预测方法
CN117849902A (zh) 一种时空双订正高分辨次季节网格集合降水预报释用方法
CN114971073B (zh) 一种跨线列车多站到达晚点预测的方法及装置
Tesar et al. Predicting traction energy demand of a light rail vehicle using deep learning methods
CN116166642A (zh) 基于引导信息的时空数据填补方法、系统、设备及介质
CN113515890A (zh) 一种基于联邦学习的可再生能源日前场景生成方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant