CN110570678A

CN110570678A - 一种公交车辆从起点到终点总行驶时间预测方法及装置

Info

Publication number: CN110570678A
Application number: CN201910860805.6A
Authority: CN
Inventors: 赖永炫; 张璐; 徐易凡; 杨诗鹏
Original assignee: Xiamen University
Current assignee: Xiamen University
Priority date: 2019-10-23
Filing date: 2019-10-23
Publication date: 2019-12-13
Anticipated expiration: 2039-10-23
Also published as: CN110570678B

Abstract

本发明公开了一种公交车辆从起点到终点总行驶时间预测方法及装置。该方法在时空特征和属性特征等对影响公交车辆总行驶阶段的各种因素进行处理，充分考虑到了影响结果变化的各种因素。采用特征组合的方式对时空特征和属性特征进行组合，并对其中的缺失数据进行处理，以应对实际应用中发生的数据丢失等异常情况，通过ConvLSTM神经网络预测出各站停留时长、各站行驶时长，通过嵌入处理和标准化处理得到外部属性特征。利用各站停留时长、各站行驶时长和所述外部属性在层叠LSTM神经网络对总时长进行准确的预测。本发明提出的方法能够辅助现有公交公司进行调度决策，帮助调度员及时发现晚点车辆，并根据预测结果作出合理的调度决策。

Description

一种公交车辆从起点到终点总行驶时间预测方法及装置

技术领域

本发明涉及公交车信息处理领域，具体涉及一种公交车辆从起点到终点总行驶时间预测方法、装置及存储介质。

背景技术

目前，我国公交采取排班制发车，以达到公交公司和乘客之间的效益平衡。但由于道路交通、天气等因素复杂多变，导致车辆常常不能按照计划发车时间发班，进而会出现“串车”和“大间隔”现象。为应对各种原因导致车辆不能按原计划发班的情况，需要进行车辆的实时调度。现有的公交调度方式主要由人工完成，即公交调度员通过监视面板观察所负责线路的当前车辆分布状况。调度员根据自身经验估计车辆回场时间，进而进行下一班次发车时间的调整。现有调度方式仅依靠调度员的经验估计车辆到站时间，不仅工作量巨大，且常由于错误预估导致调度策略无法被准确执行，仍无法缓解“串车”和“大间隔”现象的发生。因此，良好的调度系统迫切需要一个能准确预测到站时间的算法，进而辅助调度员合理预估车辆回场时间。这也是近年来智能交通(ITS，Intelligent TransportationSystem)应用的典型场景。

现有关于行驶时长的预测研究常基于历史数据、时间序列数据借助回归模型、卡尔曼滤波模型、神经网络、组合预测模型等方式进行。如：Chun-Hsin Wu等人利用支持向量回归(SVR，Support Vector Regression)进行交通时长的预测(Wu C H,Ho J M,Lee DT.Travel-time prediction with support vector regression[J].IEEE Transactionson Intelligent Transportation Systems,2004,5(4):276-281.)。在该论文的研究中，通过使用过去t个时刻的真实交通时长数据，预测未来一段时间内的交通行驶时长。通过实验证明，该方法在预测旅行时间问题上具有一定可行性。但其在特征使用上，仅使用了过去时刻的数据，无法体现外在因素如驾驶员风格、车辆性能、道路交通状况的差异对预测结果的影响。Vanajakshi L等人利用卡尔曼滤波技术预测不同交通条件下的出行时间(Vanajakshi L,Subramanian S C,Sivanandan R.Travel time prediction underheterogeneous traffic conditions using global positioning system data frombuses[J].IET INTELLIGENT TRANSPORT SYSTEMS,2009,3(1):1-0.)。在该论文的研究中，对路段进行等距离划分，利用2辆前序车辆收集到的信息进行当前车辆的预测。在该方法中假设任何时刻均有两辆前序车辆跑完全程为其收集信息，在实际应用中，较难实现。Mathieu Sinn等人提出了一种用于预测到站时间的基于实时GPS数据的非参数算法，关键思想是使用内核回归模型来表示位置更新与公交车站到达时间之间的依赖关系(Sinn,Yoon,Calabrese,et al.Predicting arrival times of buses using real-time GPSmeasurements[C]International IEEE Conference on Intelligent TransportationSystems.IEEE,2012.)。实验表明，对于50分钟的时间范围，算法的预测误差平均小于10％。在该论文的研究方法中，通过依据历史数据与当前状况的相似性为其赋予不同的权重，计算当前状况的预测值。这种方式对于模型训练的时间跨度要求较为严格，需要更长时间的数据样本。

相比于国外，我国学者对于公交到站预测的研究起步较晚。王麟珠等人提出一种基于Elman神经网络的公交车辆从起点到终点总行驶时间预测方法(王麟珠,苏庆列,郑日博.基于Elman动态神经网络的公交到站时间预测[J].机电技术,2012,35(01):135-137.)，并通过福州的公交数据进行验证。在该论文的研究方法中，以时间、天气、路段、当前路段的运行时间为特征进行预测，结果具有一定的精确度。但其对于天气的划分仅限于是否下雨，未涉及到沙城暴等影响能见度的天气因素，且其同样未考虑驾驶员风格等主观因素对于结果的影响。因此该方法还有待提升。张强等人提出一种基于时间分段的动态实时预测算法，将一天分为24个等长的时间段，分时段对公交到站时间进行预测(张强,张艳艳.基于时间分段的公交车到站时间预测模型研究[J].数字技术与应用,2014(11):60-62.)。其将总时长分为站间行驶时长、站点滞留时长、交叉路口通行时长与等待时长，但其对这些组成因素的预测均采用基于历史时间序列进行预测，缺少对外在因素影响的研究。杨奕等人将遗传算法与BPNN(Back Propagation Neural Network，BP神经网络)结合，从而改进BP神经网络容易陷入局部最优的缺陷(杨奕,张雯蕊,张灿.基于遗传算法的BP神经网络在公交车到站时间预测中的应用[J].现代商业,2017(16):38-40.)。通过对合肥某一公交线路数据的研究，实验表明，该算法确实有比较好的预测效果。但该算法在特征选择上，仅利用最近一班班次的实际发生数据，缺少对于数据历史或周期规律的研究。此外，其同样忽略了外在因素的影响。对于公交到站时间预测，有必要使用一个能够同时捕捉时空特征的网络结构。在ConvLSTM中(Xingjian,S.H.I.,Zhourong Chen,Hao Wang,Dit-Yan Yeung,Wai-Kin Wong,and Wang-chun Woo."Convolutional LSTM network:A machine learning approach forprecipitation nowcasting."In Advances in neural information processingsystems,pp.802-810.2015)，通过将卷积层融入到传统的LSTM中，使得某一单元的输入不再是仅由过去时刻的状态所决定，还与其邻近的邻居状态有关。可以理解为：某一站点的停留时长或站间的行驶时长，不仅与这一站点过去的停留时长或站间行驶时长有关，还与其邻近站点的停留时长或站间行驶时长有关。

现有的关于行程预测或公交预测的研究无法被直接用于辅助调度决策的原因包括：第一，由于公交车与出租车或私家车的行驶特点不同，其需要在固定站点进行停留，因此站点停留时长是其总时长的重要可变组成成分，直接利用出租车或私家车关于行程时长预测的方法往往不够准确。第二，现有关于公交到离站的预测多基于对邻近站点的站数、距离或站间行驶时长的预测，缺少关于起点站到终点站总时长预测的研究。利用站间预测的方式预测总时长会出现误差累加以及无法预测各站点停留时长的情况。第三，目前对于行程时长的预测往往只考虑了某几个影响因素，缺乏对其时空特性和外在因素影响的融合研究。但公交车辆总时长的问题是一个无法避免时间依赖性、空间相关性和外部因素综合影响的复杂问题。因此，需要一种能够直接对公交车辆从起点站至终点站总时长进行预测的算法。

发明内容

本申请的实施例的目的在于提出了公交车辆从起点到终点总行驶时间预测方法、装置及存储介质，来解决以上背景技术部分提到的技术问题。

第一方面，本申请实施例提供了一种公交车辆从起点到终点总行驶时间预测方法，包括以下步骤：

S1：将包含时间属性和空间属性的时空特征分别输入ConvLSTM神经网络预测出各站停留时长和各站行驶时长；

S2：将包含车辆属性、驾驶员属性、天气属性和时间属性的外部属性进行嵌入处理转换为E维向量，将时空特征通过均值和标准差进行标准化处理，将经嵌入处理后的外部属性和经标准化处理的时空属性进行连接处理得到外部属性特征；以及

S3：将各站停留时长、各站行驶时长和外部属性特征连接得到层叠LSTM神经网络的输入向量，通过层叠LSTM神经网络预测出车辆行驶的总时长。

在一些实施例中，在步骤S1中用于预测各站停留时长的时空特征包括近一周同时段各站平均停留时长、近三天同时段各站平均停留时长和最新各站平均停留时长，用于预测各站行驶时长的时空特征包括近一周同时段各站平均行驶时长、近三天同时段各站平均行驶时长和最新各站平均行驶时长，在ConvLSTM神经网络中设置损失函数表示为各站点的真实停留时长与预测停留时长差值之和以及各站点的真实行驶时长与预测行驶时长差值之和，根据各站点的重要性为损失函数赋予不同的权重，预测第i站停留时长时损失函数设置的权重为：

预测第i站行驶时长时损失函数设置的权重为：

其中，w_si和w_ri分别表示预测第i站停留时长和第i站行驶时长的权重，max_si表示第i站停留时长的最大值，min_si表示第i站停留时长的最小值，var_si和var_ri分别为第i站停留时长和第i站行驶时长的方差，mean_si和mean_ri分别表示第i站停留时长和第i站行驶时长的均值，最后预测出的第i站停留时长为s_i，预测出的第i站行驶时长为r_i。

在一些实施例中，步骤S2具体包括以下步骤：

S21：通过嵌入的方式将外部属性转换为低维实向量，外部属性的每个值v_i∈[^V]用E维向量表示，外部属性被映射到空间W∈R^V*E，其中V为外部属性的大小，E为嵌入空间的维度，得到第i站的车辆属性特征为C_i ^c，驾驶员属性特征为D_i ^d，天气属性为W_i ^w，星期几属性为DT_i ^dt，时间段属性为H_i ^h，段内分组属性为M_i ^m；

S22：对时空特征在利用以下公式进行标准化：

其中，x为时空特征，为标准化后的时空特征，x_mean为x的均值，x_std为x的标准差，标准化后得到第i站近一周的运行时长特征为SW_i，近三天的运行时长特征为ST_i，最新的运行时长特征为SC_i；

S23：将步骤S21和步骤S22处理后的结果进行连接得到外部属性向量attr_i为：

在一些实施例中，步骤S3具体包括：

S31：将预测出的第i站行驶时长为r_i、第i站停留时长为s_i和外部属性向量attr_i进行连接处理得到层叠LSTM神经网络的输入向量：

S32：将输入向量merge输入神经元数量分别为96、48、24、1四层的层叠LSTM，预测出车辆行驶的总时长。

在一些实施例中，时空特征和外部属性通过以下步骤得到：

S11：获取车辆原始到离站数据，并对其进行数据清洗以及转换得到车辆属性、驾驶员属性、天气属性和时间属性；

S12：获取线路运行数据，通过在线路运行数据中查询相同时间段下各车辆实际运行的站点停留时长和站间行驶时长，对近一周、近三天的站点停留时长和站间行驶时长求均值得到近一周同时段各站点平均停留时长、近三天同时段各站平均停留时长、近一周同时段各站平均行驶时长和近三天同时段各站平均行驶时长，从起始站依次查询经过各站点的最近一班的车辆在各站的停留时长和行驶时长得到最新各站平均停留时长和最新各站平均行驶时长；

S13：对相同时间段和车辆班次下的车辆属性、驾驶员属性、天气属性、时间属性、近一周同时段各站平均停留时长、近三天同时段各站平均停留时长、近一周同时段各站平均行驶时长、近三天同时段各站平均行驶时长、最新各站平均停留时长和最新各站平均行驶时长进行连接，对于存在数据缺失的外部属性和时空特征根据历史数据或临近班次数据中相同条件下的相应数据进行填充处理得到外部属性和时空特征。

第二方面，本申请的实施例提出了一种公交车辆从起点到终点总行驶时间预测装置，包括：

停留和行驶时长预测模块，被配置为将包含时间属性和空间属性的时空特征输入ConvLSTM神经网络分别预测出各站停留时长和各站行驶时长；

外部属性特征处理模块，被配置为将包含车辆属性、驾驶员属性、天气属性、时间属性的外部属性进行嵌入处理转换为E维向量，将时空特征通过均值和标准差进行标准化处理，将经嵌入处理后的外部属性和经标准化处理的时空属性进行连接处理得到外部属性特征；以及

总时长预测模块，被配置为将各站停留时长、各站行驶时长和外部属性特征进行连接得到层叠LSTM神经网络的输入向量，通过层叠LSTM神经网络预测出车辆行驶的总时长。

在一些实施例中，用于预测各站停留时长的时空特征包括近一周同时段各站平均停留时长、近三天同时段各站平均停留时长和最新各站平均停留时长，用于预测各站行驶时长的时空特征包括近一周同时段各站平均行驶时长、近三天同时段各站平均行驶时长和最新各站平均行驶时长，在ConvLSTM神经网络中设置损失函数表示为各站点的真实停留时长与预测停留时长差值之和以及各站点的真实行驶时长与预测行驶时长差值之和，根据各站点的重要性为损失函数赋予不同的权重，预测第i站停留时长时在损失函数设置的权重为：

预测第i站行驶时长时在损失函数设置的权重为：

在一些实施例中，外部属性特征处理模块包括：

属性转换模块，被配置为通过嵌入方式将外部属性转换为低维实向量，外部属性的每个值v_i∈[V]用E维向量表示，外部属性被映射到空间W∈R^V*E，其中V为外部属性的大小，E为嵌入空间的维度，得到第i站车辆属性特征为C_i ^c，驾驶员属性特征为D_i ^d，天气属性为W_i ^w，星期几属性为DT_i ^dt，时间段属性为H_i ^h，时间段内分钟属性为M_i ^m；

标准化模块，被配置为对时空特征在利用以下公式进行标准化：

其中，x为时空特征，为标准化后的时空特征，x_mean为x的均值，x_std为x的标准差，标准化后得到第i站近一周的停留时长和行驶时长之和的特征值为SW_i，近三天的停留时长和行驶时长之和的特征为ST_i，最新的停留时长和行驶时长之和的特征为SC_i；

第一连接处理模块，被配置为将步骤S21和步骤S22处理后的结果进行连接得到外部属性向量attr_i为：

在一些实施例中，总时长预测模块包括：

第二连接处理模块，被配置为将预测出的第i站行驶时长为r_i、第i站停留时长为s_i和外部属性向量attr_i进行连接处理得到Stack-LSTM神经网络的输入向量：

预测模块，被配置为将输入向量merge输入神经元数量分别为96、48、24、1四层的层叠LSTM，预测出车辆行驶的总时长。

在一些实施例中，时空特征和外部属性通过以下步骤得到：

数据清洗模块，被配置为获取车辆原始到离站数据，并对其进行数据清洗以及转换得到车辆属性、驾驶员属性、天气属性和时间属性；

时长获取模块，被配置为获取线路运行数据，通过在线路运行数据中查询相同时间段下各车辆实际运行的站点停留时长和站间行驶时长，对近一周、近三天的站点停留时长和站间行驶时长求均值得到近一周同时段各站平均停留时长、近三天同时段各站平均停留时长、近一周同时段各站平均行驶时长和近三天同时段各站平均行驶时长，从起始站依次查询经过各站点的最近一班的车辆在各站的停留时长和行驶时长得到最新各站平均停留时长和最新各站平均行驶时长；

第三连接处理模块，被配置为对相同时间段和车辆班次下的车辆属性、驾驶员属性、天气属性、时间属性、近一周同时段各站平均停留时长、近三天同时段各站平均停留时长、近一周同时段各站平均行驶时长、近三天同时段各站平均行驶时长、最新各站平均停留时长和最新各站平均行驶时长进行连接，对于存在数据缺失的外部属性和时空特征根据历史数据或临近班次数据中相同条件下的相应数据进行填充处理得到外部属性和时空特征。

本发明提出一种公交车辆从起点到终点总行驶时间预测方法及装置。该方法在时空特征和属性特征等对影响公交车辆总行驶阶段的各种因素进行处理，充分考虑到了影响结果变化的各种因素。采用特征组合的方式对时空特征和属性特征进行组合，并对其中的缺失数据进行处理，以应对实际应用中发生的数据丢失等异常情况，通过ConvLSTM神经网络预测出各站停留时长、各站行驶时长，通过嵌入处理和标准化处理得到外部属性特征。利用各站停留时长、各站行驶时长和所述外部属性在层叠LSTM神经网络对总时长进行准确的预测。本发明提出的方法能够辅助现有公交公司进行调度决策，帮助调度员及时发现晚点车辆，并根据预测结果作出合理的调度决策。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简要介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域的普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请的一个实施例可以应用于其中的示例性系统架构图；

图2为本发明的实施例的公交车辆从起点到终点总行驶时间预测方法的时空特征和外部属性获取的流程示意图；

图3为本发明的实施例的公交车辆从起点到终点总行驶时间预测方法的流程示意图；

图4为本发明的实施例的公交车辆从起点到终点总行驶时间预测方法的步骤S2的流程示意图；

图5为本发明的实施例的公交车辆从起点到终点总行驶时间预测方法的步骤S3的流程示意图；

图6为本发明的实施例的公交车辆从起点到终点总行驶时间预测装置的流程示意图；

图7为本发明的实施例一中采用的ConvLSTM网络的结构图：

图8为本发明的实施例一中采用本申请的公交车辆从起点到终点总行驶时间预测方法得到的结果示意图；

图9为本发明的实施例一中使用LSTM、CNN等深度学习方法进行预测得到的结果示意图；

图10为本发明的实施例一中使用Adaboost、DecisionTree、SVM及HP方法与深度学习方法进行预测得到的结果示意图；

图11是适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。

具体实施方式

为了使本发明的目的、技术方案和优点更加清楚，下面将结合附图对本发明作进一步地详细描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例，都属于本发明保护的范围。

图1示出了可以应用本申请实施例的公交车辆从起点到终点总行驶时间预测方法或公交车辆从起点到终点总行驶时间预测装置的示例性系统架构100。

如图1所示，系统架构100可以包括终端设备101、102、103，网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型，例如有线、无线通信链路或者光纤电缆等等。

用户可以使用终端设备101、102、103通过网络104与服务器105交互，以接收或发送消息等。终端设备101、102、103上可以安装有各种应用，例如数据处理类应用、文件处理类应用等。

终端设备101、102、103可以是硬件，也可以是软件。当终端设备101、102、103为硬件时，可以是各种电子设备，包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。当终端设备101、102、103为软件时，可以安装在上述所列举的电子设备中。其可以实现成多个软件或软件模块(例如用来提供分布式服务的软件或软件模块)，也可以实现成单个软件或软件模块。在此不做具体限定。

服务器105可以是提供各种服务的服务器，例如对终端设备101、102、103上传的文件或数据进行处理的后台数据处理服务器。后台数据处理服务器可以对获取的文件或数据进行处理，生成处理结果。

需要说明的是，本申请实施例所提供的公交车辆从起点到终点总行驶时间预测方法可以由服务器105执行，也可以由终端设备101、102、103执行，相应地，公交车辆从起点到终点总行驶时间预测装置可以设置于服务器105中，也可以设置于终端设备101、102、103中。

应该理解，图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要，可以具有任意数目的终端设备、网络和服务器。在所处理的数据不需要从远程获取的情况下，上述系统架构可以不包括网络，而只需服务器或终端设备。

首选需要获得时空特征和外部属性，如图2所示，时空特征和外部属性通过以下步骤得到：

S11：获取车辆原始到离站数据，并对其进行数据清洗以及转换得到车辆属性、驾驶员属性、天气属性和时间属性。

其中，车辆原始到离站数据为公交线路上下行收集到的所有车辆进站及出站信息。进行特征提取前，需要先将车辆原始到离站数据按日期进行分割，将分割后的每一天的车辆原始到离站数据根据上下行、车辆id、获取到离站数据的时间进行排列，将同一趟数据划分到同一组中，剔除组内的脏数据。这些脏数据包括：重复的到离站记录、同一站的进站时间在该站出站时间之后的、到达后一站的时间在到达前一站之前的数据以及同一趟的到离站数据大量丢失的数据等。

数据清洗后进行包括线路、方向、车辆及驾驶员信息的处理。其中，线路和方向数据可从车辆原始到离站数据中直接获取。车辆原始到离站数据中车辆数据需要先经过一定规则的转换，转换成计划班次信息中可识别的车辆id，根据此车辆id查询驾驶员id，以车辆id和驾驶员id分别作为车辆特征和驾驶员特征的区分，因此可以得到车辆属性和驾驶员属性。

在获得的原始天气数据中，利用到的主要字段为时间与天气描述。其中，时间需要处理成为日期与时间段；天气描述需要将晴、多云、大雾等转换为可利用的数字描述方式，因此获得天气属性。

公交车辆的运行时长通常具有一定的时间规律，比如工作日与周末的区别，节假日与平时的区别，上下班高峰期与其他平峰期的区别等。为了研究以上时间因素对于研究结果的影响，需要根据到离站数据里的时间字段，提取车辆的发车日期、发车时间、星期几、是否为节假日、是否为工作日等作为时间属性。

S12：获取线路运行数据，通过在线路运行数据中查询相同时间段下各车辆实际运行的站点停留时长和站间行驶时长，对近一周、近三天的站点停留时长和站间行驶时长求均值得到近一周同时段各站点平均停留时长、近三天同时段各站平均停留时长、近一周同时段各站平均行驶时长和近三天同时段各站平均行驶时长，从起始站依次查询经过各站点的最近一班的车辆在各站的停留时长和行驶时长得到最新各站平均停留时长和最新各站平均行驶时长。

线路运行数据主要是线路运行时产生的一些数据，比如站间行驶时长和站点停留时长。根据线路运行具有长期趋势、周期规律、短期影响等特征，处理出车辆实际运行中本趟车在各个站停留时长、各个站行驶时长。此外，计算经过拼接的最新各站停留时长与行驶时长；近3天、近1周相同时段下的各站平均停留时长与平均行驶时长。

其中，近3天、近1周相同时段的数据可通过查询该时间内相同时间段下各车辆实际运行时对应数据的均值。最新各站停留时长与行驶时长通常是从起点站依次查询经过该站最近一班的车辆，以该车辆在该站的运行时长和停留时长作为该站最新运行时长和停留时长的代替，直至查询到终点站。将拼接形成的一整条数据作为该趟车最新的各站停留时长和站间行驶时长。

对于步骤S11和S12中产生的数据特征，利用共有的时间段与车辆班次信息进行连接，形成一条完整的数据特征。此外，由于数据期间的局限，以及部分GPS到离站原始数据的丢失，使得当前车辆、最近时间内、3天内、1周内的站点停留和站间行驶时长可能缺失，需要进行填充。在本发明方法的缺失数据填充中，对于站点停留和站间行驶时长的缺失主要是利用历史数据相同条件下的均值进行填充。当不存在相同条件下的历史数据时，则用临近班次进行填充。对于天气数据的缺失，主要是利用临近小时内的天气状况进行代替，最终获得完整的外部属性和时空特征。

继续参考图3，其示出了根据本申请的实施例提出了一种公交车辆从起点到终点总行驶时间预测方法，包括以下步骤：

S1：将包含时间属性和空间属性的时空特征分别输入ConvLSTM神经网络预测出各站停留时长和各站行驶时长。

在具体的实施例中，利用融合卷积神经网络与循环神经网络的ConvLSTM同时学习事物的时空特性。在步骤S1中用于预测各站停留时长的时空特征包括近一周同时段各站平均停留时长、近三天同时段各站平均停留时长和最新各站平均停留时长，经由一个由多层的ConvLSTMCell组成的ConvLSTM预测各站停留时长；用于预测各站行驶时长的时空特征包括近一周同时段各站平均行驶时长、近三天同时段各站平均行驶时长和最新各站平均行驶时长，经由一个由多层的ConvLSTMCell组成的ConvLSTM预测各站行驶时长。对于ConvLSTM，其由输入门、输出门和遗忘门组成：

有新的输入时，如果输入门i_t被激活，则新输入的信息将会被累加到细胞单元中。输入门是否被激活是由t-1时刻的网络输出h_t-1和这一步的网络输入x_t决定的，其中W_xi、W_hi、W_ci分别为计算输入门是否被激活时这一时刻输入、上一时刻输出、上一时刻细胞记忆状态的权重，b_i为该层的网络偏置：

当输入门被激活后，新时刻学到的记忆经过线性变化和激活函数计算，其中W_xc、W_hc为计算新时刻学到记忆时这一时刻输入与上一时刻输出的权重，b_c为该层的网络偏置：

此时，对于遗忘门，需要计算t-1时刻网络中的记忆单元C_t-1被遗忘的程度f_t，其中W_xf、W_hf、W_cf为计算遗忘系数时这一时刻输入与上一时刻输出、上一时刻记忆的权重，b_f为该层的网络偏置：

t时刻最终的记忆状态将由过去时刻的记忆和新时刻学到的记忆产生：

对于输出门，t时刻网络的输出h_t是由t时刻的输入x_t、t-1时刻网络的输出h_t-1和t时刻记忆状态C_t所决定。首先，需定义输出门系数o_t，其中W_xo、W_ho、W_co为计算输出门系数时这一时刻输入与上一时刻输出的权重，b_o为该层的网络偏置：

根据输出门系数o_t计算最终该时刻的网络输出h_t：

h_t＝o_t*tanh(c_t)

特别的，其中W_xi、W_hi、W_xf、W_hf、W_xc、W_hc、W_xo、W_ho利用卷积操作进行运算，使得每一层的每个细胞单元的状态除了由之前的状态决定外，还由其邻近单元格的状态决定。

在ConvLSTM神经网络中设置损失函数表示为各站点的真实停留时长与预测停留时长差值之和以及各站点的真实行驶时长与预测行驶时长差值之和，根据各站点的重要性为损失函数赋予不同的权重，预测第i站停留时长时损失函数设置的权重为：

预测第i站行驶时长时损失函数设置的权重为：

S2：将包含车辆属性、驾驶员属性、天气属性和时间属性的外部属性进行嵌入处理转换为E维向量，将时空特征通过均值和标准差进行标准化处理，将经嵌入处理后的外部属性和经标准化处理的时空属性进行连接处理得到外部属性特征。

在具体的实施例中，步骤S2利用嵌入、标准化与连接的操作对影响事物发展的外部属性进行学习，如图4所示，具体包括以下步骤：

S21：通过嵌入的方式将外部属性转换为低维实向量，外部属性的每个值v_i∈[V]用E维向量表示，外部属性被映射到空间W∈R^V*E，其中V为外部属性的大小，E为嵌入空间的维度，得到第i站的车辆属性特征为C_i ^c，驾驶员属性特征为D_i ^d，天气属性为W_i ^w，星期几属性为DT_i ^dt，时间段属性为H_i ^h，段内分组属性为M_i ^m；

S22：对时空特征在利用以下公式进行标准化：

在具体的实施例中，层叠LSTM是由多个LSTM层组成的LSTM模型。使用该模型可以允许更大的模型复杂度。在简单前馈网络的情况下，通过增加层数以创建输入数据的分层特征表示，然后用于某些机器学习任务。这同样适用于层叠LSTM。如果输入已经是前馈LSTM层的输出，则当前LSTM层可创建相较于输入更加复杂的特征表示。在优选的实施例中，层叠LSTM神经网络由4层LSTM组成，各层神经元数量分别为96、48、24、1。将步骤S1学习到的时间相关性和空间依赖性以及步骤S2中学习到的外部因素相融合。融合的过程是将时空组件预测到的各站行驶时长r、各站停留时长s与外部属性特征attr进行拼接，拼接得到融合组件的输入向量merge用于预测最终的公交车辆从起点到终点的总时长。如图5所示，具体包括以下步骤：

进一步参考图6，作为对上述各图所示方法的实现，本申请提供了一种公交车辆从起点到终点总行驶时间预测装置的一个实施例，该装置实施例与图2所示的方法实施例相对应，该装置具体可以应用于各种电子设备中。

如图6所示，本实施例的公交车辆从起点到终点总行驶时间预测装置，包括：

停留和行驶时长预测模块1，被配置为将包含时间属性和空间属性的时空特征输入ConvLSTM神经网络分别预测出各站停留时长和各站行驶时长；

外部属性特征处理模块2，被配置为将包含车辆属性、驾驶员属性、天气属性、时间属性的外部属性进行嵌入处理转换为E维向量，将时空特征通过均值和标准差进行标准化处理，将经嵌入处理后的外部属性和经标准化处理的时空属性进行连接处理得到外部属性特征；以及

总时长预测模块3，被配置为将各站停留时长、各站行驶时长和外部属性特征进行连接得到层叠LSTM神经网络的输入向量，通过层叠LSTM神经网络预测出车辆行驶的总时长。

在具体的实施例中，停留和行驶时长预测模块1中用于预测各站停留时长的时空特征包括近一周同时段各站平均停留时长、近三天同时段各站平均停留时长和最新各站平均停留时长，停留和行驶时长预测模块1中用于预测各站行驶时长的时空特征包括近一周同时段各站平均行驶时长、近三天同时段各站平均行驶时长和最新各站平均行驶时长，在ConvLSTM神经网络中设置损失函数表示为各站点的真实停留时长与预测停留时长差值之和以及各站点的真实行驶时长与预测行驶时长差值之和，根据各站点的重要性为损失函数赋予不同的权重，预测第i站停留时长时在损失函数设置的权重为：

预测第i站行驶时长时在损失函数设置的权重为：

在具体的实施例中，外部属性特征处理模块2包括：

在具体的实施例中，总时长预测模块3包括：

在具体的实施例中，时空特征和外部属性通过以下步骤得到：

实施例一

收集基于厦门市公交2018年9月1日至2019年2月28日到离站数据、计划班次信息、车辆信息以及厦门天气状况等数据进行使用。使用python3.7进行数据处理与算法编写，利用sklearn0.18.1库中的模型接口进行部分算法实现。在模型训练时，划分训练集与测试集，其中测试集比例占20％。

对比算法分别是：1)CNN：由卷积层和池化层组成的一种前馈神经网络。2)LSTM：由输入门、输出门、遗忘门组成的基本长短时记忆网络。3)Adaboost：利用训练数据训练多个弱分类器，融合弱分类器的的训练结果进行预测的一种集成方法。4)DecisionTree：决策树，一种用于预测的树结构。5)SVM：支持向量机。一种常用于模式识别、分类及回归分析的监督学习方法。6)HP：基于历史相同条件(是否为工作日、时段)下平均值预测。下表给出了各算法的性能和实验结果(STPM代表本方法，图7为本方法采用的ConvLSTM网络的结构图)。其中，准确率是绝对误差在5分钟以内被判定为正确的数量占测试集的比例。

模型名	误差百分比	准确率
			STPM	5.68％	80.23％
CNN	9.94％	58.69％
			LSTM	6.05％	77.98％
Adaboost	7.32％	66.97％
			DecisionTree	8.49％	64.97％
SVM	9.69％	57.05％
			HP	29.15％	1.18％

从图8中可以看出，本发明所提出的基于深度神经网络的预测算法STPM的误差百分比相对于其他算法更低。这是因为本发明所提出的方法同时考虑到了事物的时空特性和外部因素影响特征，使得结果更符合实际中多变的环境。图9与10展示了利用传统方法与深度学习方法进行预测的结果。其中，纵轴为总时长值，横轴为样本ID。拟合线为预测值，散点为真实值。根据真实值与预测值的绝对误差，对真实值的散点颜色进行区分。+代表误差范围在300s以内，○代表误差范围在300s-400s，╳代表误差范围在400s-500s，▲代表误差范围为500s-600s，□代表误差范围超过600s。可以看出，本发明所提出的预测算法相对于其他几种常用于预测的模型数据点更为集中，即效果更好。

下面参考图11，其示出了适于用来实现本申请实施例的电子设备(例如图1所示的服务器或终端设备)的计算机系统1100的结构示意图。图11示出的电子设备仅仅是一个示例，不应对本申请实施例的功能和使用范围带来任何限制。

如图11所示，计算机系统1100包括中央处理单元(CPU)1101和图形处理器(GPU)1102，其可以根据存储在只读存储器(ROM)1103中的程序或者从存储部分1109加载到随机访问存储器(RAM)1104中的程序而执行各种适当的动作和处理。在RAM 1104中，还存储有系统1100操作所需的各种程序和数据。CPU 1101、GPU1102、ROM 1103以及RAM 1104通过总线1105彼此相连。输入/输出(I/O)接口1106也连接至总线1105。

以下部件连接至I/O接口1106：包括键盘、鼠标等的输入部分1107；包括诸如、液晶显示器(LCD)等以及扬声器等的输出部分1108；包括硬盘等的存储部分1109；以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分1110。通信部分1110经由诸如因特网的网络执行通信处理。驱动器1111也可以根据需要连接至I/O接口1106。可拆卸介质1112，诸如磁盘、光盘、磁光盘、半导体存储器等等，根据需要安装在驱动器1111上，以便于从其上读出的计算机程序根据需要被安装入存储部分1109。

特别地，根据本公开的实施例，上文参考流程图描述的过程可以被实现为计算机软件程序。例如，本公开的实施例包括一种计算机程序产品，其包括承载在计算机可读介质上的计算机程序，该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中，该计算机程序可以通过通信部分1110从网络上被下载和安装，和/或从可拆卸介质1112被安装。在该计算机程序被中央处理单元(CPU)1101和图形处理器(GPU)1102执行时，执行本申请的方法中限定的上述功能。

需要说明的是，本申请所述的计算机可读介质可以是计算机可读信号介质或者计算机可读介质或者是上述两者的任意组合。计算机可读介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读介质的更具体的例子可以包括但不限于：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中，计算机可读介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中，计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于：无线、电线、光缆、RF等等，或者上述的任意合适的组合。

可以以一种或多种程序设计语言或其组合来编写用于执行本申请的操作的计算机程序代码，所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++，还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机，或者，可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。

附图中的流程图和框图，图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

描述于本申请实施例中所涉及到的模块可以通过软件的方式实现，也可以通过硬件的方式来实现。所描述的模块也可以设置在处理器中，例如，可以描述为：一种处理器包括停留和行驶时长预测模块、外部属性特征处理模块和总时长预测模块。其中，这些模块的名称在某种情况下并不构成对该模块本身的限定，例如，停留和行驶时长预测模块还可以被描述为“被配置为将时空特征输入ConvLSTM神经网络分别预测出各站停留时长和各站行驶时长”。

作为另一方面，本申请还提供了一种计算机可读介质，该计算机可读介质可以是上述实施例中描述的电子设备中所包含的；也可以是单独存在，而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序，当上述一个或者多个程序被该电子设备执行时，使得该电子设备：将包含时间属性和空间属性的时空特征分别输入ConvLSTM神经网络预测出各站停留时长和各站行驶时长；将包含车辆属性、驾驶员属性、天气属性和时间属性的外部属性进行嵌入处理转换为E维向量，将时空特征通过均值和标准差进行标准化处理，将经嵌入处理后的外部属性和经标准化处理的时空属性进行连接处理得到外部属性特征；以及将各站停留时长、各站行驶时长和外部属性特征连接得到层叠LSTM神经网络的输入向量，通过层叠LSTM神经网络预测出车辆行驶的总时长。

本申请的经费来源于JCYJ20170818141325209，基于边沿计算模式的交通大数据收集和智能应用研究，深圳市基础研究计划61672441，车载网络环境下基于雾计算模式的适应性数据收集技术研究，国家自然科学基金，面上项目。

以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解，本申请中所涉及的发明范围，并不限于上述技术特征的特定组合而成的技术方案，同时也应涵盖在不脱离上述发明构思的情况下，由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims

1.一种公交车辆从起点到终点总行驶时间预测方法，其特征在于，包括以下步骤：

S2：将包含车辆属性、驾驶员属性、天气属性和时间属性的外部属性进行嵌入处理转换为E维向量，将所述时空特征通过均值和标准差进行标准化处理，将经嵌入处理后的所述外部属性和经标准化处理的所述时空属性进行连接处理得到外部属性特征；以及

S3：将所述各站停留时长、所述各站行驶时长和所述外部属性特征连接得到层叠LSTM神经网络的输入向量，通过层叠LSTM神经网络预测出车辆行驶的总时长。

2.根据权利要求1所述的公交车辆从起点到终点总行驶时间预测方法，其特征在于，在所述步骤S1中用于预测所述各站停留时长的所述时空特征包括近一周同时段各站平均停留时长、近三天同时段各站平均停留时长和最新各站平均停留时长，用于预测所述各站行驶时长的所述时空特征包括近一周同时段各站平均行驶时长、近三天同时段各站平均行驶时长和最新各站平均行驶时长，在所述ConvLSTM神经网络中设置损失函数表示为各站点的真实停留时长与预测停留时长差值之和以及各站点的真实行驶时长与预测行驶时长差值之和，根据各站点的重要性为所述损失函数赋予不同的权重，预测第i站停留时长时损失函数设置的权重为：

预测第i站行驶时长时损失函数设置的权重为：

3.根据权利要求2所述的公交车辆从起点到终点总行驶时间预测方法，其特征在于，所述步骤S2具体包括以下步骤：

S21：通过嵌入的方式将所述外部属性转换为低维实向量，所述外部属性的每个值v_i∈[V]用E维向量表示，所述外部属性被映射到空间W∈R^V*E，其中V为所述外部属性的大小，E为嵌入空间的维度，得到第i站的车辆属性特征为C_i ^c，驾驶员属性特征为D_i ^d，天气属性为W_i ^w，星期几属性为DT_i ^dt，时间段属性为H_i ^h，段内分组属性为M_i ^m；

S22：对所述时空特征在利用以下公式进行标准化：

其中，x为所述时空特征，为标准化后的所述时空特征，x_mean为x的均值，x_std为x的标准差，标准化后得到第i站近一周的运行时长特征为SW_i，近三天的运行时长特征为ST_i，最新的运行时长特征为SC_i；

S23：将所述步骤S21和所述步骤S22处理后的结果进行连接得到外部属性向量attr_i为：

4.根据权利要求3所述的公交车辆从起点到终点总行驶时间预测方法，其特征在于，所述步骤S3具体包括：

S31：将所述预测出的第i站行驶时长为r_i、第i站停留时长为s_i和所述外部属性向量attr_i进行连接处理得到层叠LSTM神经网络的输入向量：

S32：将所述输入向量merge输入神经元数量分别为96、48、24、1四层的层叠LSTM，预测出车辆行驶的总时长。

5.根据权利要求2所述的公交车辆从起点到终点总行驶时间预测方法，其特征在于，所述时空特征和所述外部属性通过以下步骤得到：

S12：获取线路运行数据，通过在所述线路运行数据中查询相同时间段下各车辆实际运行的站点停留时长和站间行驶时长，对近一周、近三天的所述站点停留时长和站间行驶时长求均值得到所述近一周同时段各站点平均停留时长、所述近三天同时段各站平均停留时长、所述近一周同时段各站平均行驶时长和所述近三天同时段各站平均行驶时长，从起始站依次查询经过各站点的最近一班的车辆在各站的停留时长和行驶时长得到所述最新各站平均停留时长和所述最新各站平均行驶时长；

S13：对相同时间段和车辆班次下的所述车辆属性、所述驾驶员属性、所述天气属性、所述时间属性、所述近一周同时段各站平均停留时长、所述近三天同时段各站平均停留时长、所述近一周同时段各站平均行驶时长、所述近三天同时段各站平均行驶时长、所述最新各站平均停留时长和所述最新各站平均行驶时长进行连接，对于存在数据缺失的所述外部属性和所述时空特征根据历史数据或临近班次数据中相同条件下的相应数据进行填充处理得到所述外部属性和所述时空特征。

6.一种公交车辆从起点到终点总行驶时间预测装置，其特征在于，包括：

外部属性特征处理模块，被配置为将包含车辆属性、驾驶员属性、天气属性、时间属性的外部属性进行嵌入处理转换为E维向量，将所述时空特征通过均值和标准差进行标准化处理，将经嵌入处理后的所述外部属性和经标准化处理的所述时空属性进行连接处理得到外部属性特征；以及

总时长预测模块，被配置为将所述各站停留时长、所述各站行驶时长和所述外部属性特征进行连接得到层叠LSTM神经网络的输入向量，通过层叠LSTM神经网络预测出车辆行驶的总时长。

7.根据权利要求6所述的公交车辆从起点到终点总行驶时间预测装置，其特征在于，用于预测所述各站停留时长的所述时空特征包括近一周同时段各站平均停留时长、近三天同时段各站平均停留时长和最新各站平均停留时长，用于预测所述各站行驶时长的所述时空特征包括近一周同时段各站平均行驶时长、近三天同时段各站平均行驶时长和最新各站平均行驶时长，在所述ConvLSTM神经网络中设置损失函数表示为各站点的真实停留时长与预测停留时长差值之和以及各站点的真实行驶时长与预测行驶时长差值之和，根据各站点的重要性为所述损失函数赋予不同的权重，预测第i站停留时长时在损失函数设置的权重为：

预测第i站行驶时长时在损失函数设置的权重为：

8.根据权利要求7所述的公交车辆从起点到终点总行驶时间预测装置，其特征在于，所述外部属性特征处理模块包括：

属性转换模块，被配置为通过嵌入方式将所述外部属性转换为低维实向量，所述外部属性的每个值v_i∈[V]用E维向量表示，所述外部属性被映射到空间W∈R^V*E，其中V为所述外部属性的大小，E为嵌入空间的维度，得到第i站车辆属性特征为C_i ^c，驾驶员属性特征为D_i ^d，天气属性为W_i ^w，星期几属性为DT_i ^dt，时间段属性为H_i ^h，时间段内分钟属性为M_i ^m；

标准化模块，被配置为对所述时空特征在利用以下公式进行标准化：

其中，x为所述时空特征，为标准化后的所述时空特征，x_mean为x的均值，x_std为x的标准差，标准化后得到第i站近一周的停留时长和行驶时长之和的特征值为SW_i，近三天的停留时长和行驶时长之和的特征为ST_i，最新的停留时长和行驶时长之和的特征为SC_i；

第一连接处理模块，被配置为将所述步骤S21和所述步骤S22处理后的结果进行连接得到外部属性向量attr_i为：

9.根据权利要求8所述的公交车辆从起点到终点总行驶时间预测装置，其特征在于，所述总时长预测模块包括：

第二连接处理模块，被配置为将所述预测出的第i站行驶时长为r_i、第i站停留时长为s_i和所述外部属性向量attr_i进行连接处理得到层叠LSTM神经网络的输入向量：

预测模块，被配置为将所述输入向量merge输入神经元数量分别为96、48、24、1四层的层叠LSTM，预测出车辆行驶的总时长。

10.根据权利要求7所述的公交车辆从起点到终点总行驶时间预测装置，其特征在于，所述时空特征和所述外部属性通过以下步骤得到：

时长获取模块，被配置为获取线路运行数据，通过在所述线路运行数据中查询相同时间段下各车辆实际运行的站点停留时长和站间行驶时长，对近一周、近三天的所述站点停留时长和站间行驶时长求均值得到所述近一周同时段各站平均停留时长、所述近三天同时段各站平均停留时长、所述近一周同时段各站平均行驶时长和所述近三天同时段各站平均行驶时长，从起始站依次查询经过各站点的最近一班的车辆在各站的停留时长和行驶时长得到最新各站平均停留时长和最新各站平均行驶时长；

第三连接处理模块，被配置为对相同时间段和车辆班次下的所述车辆属性、所述驾驶员属性、所述天气属性、所述时间属性、所述近一周同时段各站平均停留时长、所述近三天同时段各站平均停留时长、所述近一周同时段各站平均行驶时长、所述近三天同时段各站平均行驶时长、所述最新各站平均停留时长和所述最新各站平均行驶时长进行连接，对于存在数据缺失的所述外部属性和所述时空特征根据历史数据或临近班次数据中相同条件下的相应数据进行填充处理得到所述外部属性和所述时空特征。