CN104123841A

CN104123841A - 一种车辆到站时间的获取方法及系统

Info

Publication number: CN104123841A
Application number: CN201410399025.3A
Authority: CN
Inventors: 李培峰; 谢玲; 朱巧明
Original assignee: Suzhou University
Current assignee: Suzhou University
Priority date: 2014-08-14
Filing date: 2014-08-14
Publication date: 2014-10-29
Anticipated expiration: 2034-08-14
Also published as: CN104123841B

Abstract

本发明公开了一种车辆到站时间的获取方法及系统，从日期、时段及路段三维信息入手，根据车辆到站时间波动性，将待预测的目标路段分成不同的路段，对每个路段进行车辆到站时间的分段预测，最终获取到待预测的目标线路在目标路段上车辆到达路段终点的时间，在达到本发明目的的同时，相对于现有的时间获取方案，基于车辆到站时间的波动性进行到站时间获取，明显提高时间获取的准确性，而且，本发明利用向量机对象对作为训练记录的路线记录生成每个路段的预测运行时间，进而得到车辆到站时间，简化方案的复杂度，降低方案运行时间，提高车辆到站时间的获取效率。

Description

一种车辆到站时间的获取方法及系统

技术领域

本发明涉及车辆交通数据处理技术领域，特别涉及一种车辆到站时间的获取方法及系统。

背景技术

随着科技的发展，车载GPS(Global Positioning System，全球定位系统)已经广泛应用于公交车、地铁、BTR等公共交通设备上，实现对车辆的实时跟踪定位的功能，以实现在电子站牌上实时显示下班车位置信息等。实际应用中，通常利用车辆的位置信息来预测获取下班车到达站点的具体时间，以方便用户合理安排交通线路，节省交通时间。

目前的车辆到站时间获取方案，通常有：以所有路段为单位的车辆到站时间预测方案及以站间路段为单位的车辆到站时间预测方案。前一方案中以起始点到目的站点间的所有路段进行预测，通过忽略线路中各站点的复杂细节，直接预测车辆到站时间，虽然可以提高预测的速率，但明显会降低所预测到的时间的准确度，而后一方案中以相邻两站间的站间路段为单位进行时间预测，虽然其时间的预测准确率较高，但耗时较长，影响方案的时效性。

因此，亟需一种能够快速又准确的对公共交通车辆到达每一站点的时间进行获取的方案。

发明内容

本发明的目的在于提供一种车辆到站时间的获取方法及系统，用以解决现有技术中无法快速又准确的对公共交通车辆到达每一站点的时间进行获取的技术问题。

本发明提供了一种车辆到站时间的获取方法，所述方法包括：

获取站点信息表及历史到站数据集合，所述站点信息表中包括目标区域中所有线路和每条线路上的所有站点，所述历史到站数据集合包括每条线路上的每辆车分别到达所述站点信息表中的每个站点的历史时间信息，其中，以每辆车在其对应线路上的运行线路形成一条历史路线记录，所述历史到站数据集合中以所述历史路线记录为记录单位；

提取所述历史到站数据集合中每条线路所对应的历史路线记录，形成每条线路的线路历史数据集合，所述线路历史数据集合中的历史路线记录以日期属性进行分类；

对每个所述线路历史数据集合中的历史路线记录按照预设的初始时段划分规则进行划分，得到每条线路的初始线路时段表；

利用每个所述初始线路时段表中每个时段的线路运行时间波动性值，分别对每条线路中线路运行时间波动性值之差绝对值小于预设第一阈值的相邻时段进行合并，得到每条线路的最终线路时段表；

对每个所述线路历史数据集合中的历史路线记录按照其对应的最终线路时段表进行划分，得到每条线路的多个线路时段数据集合及其各自的初始线路路段表，其中，所述初始线路路段表中以站间路段为单位；

利用每个所述初始线路路段表中每个路段的路段运行时间波动性值，分别对每条线路中路段运行时间波动性值之差绝对值小于预设第二阈值的相邻路段进行合并，得到每个线路的最终线路路段表；

依据用户需求数据，确定目标路段及其分段状态表，所述分段状态表中包括所述目标路段在所述最终线路时段表中对应的时段及所述目标路段在所述最终线路路段表中对应的路段；

在所述历史到站数据集合中，获取所述分段状态表中的每个路段各自对应的经过该路段的预定时间长内的路线记录组成路段记录集合，其中，所述路段记录与所述分段状态表中的时段相对应；

以所述路段记录集合中的每条路线记录为训练记录，依据预设的向量机对象，生成所述分段状态表中每个路段的预测运行时间；

依据每个所述路段的预测运行时间，获取用户需求数据中目标线路在所述目标路段上车辆达到该目标路段终点的时间。

上述方法，优选的，所述初始时段划分规则包括：以预设时段长度为划分单位对所述历史线路记录进行均匀划分；

其中，所述利用每个所述初始线路时段表中每个时段的线路运行时间波动性值，分别对每条线路中线路运行时间波动性值之差绝对值小于预设第一阈值的相邻时段进行合并，得到每条线路的最终线路时段表，包括：

利用获取每个所述初始线路时段表中每个时段的线路运行时间波动性值，T_<i,j,k,s>为所述线路历史数据集合R_<i,j>的时刻k的第s条路线记录的线路运行时间，N为所述历史路线记录的总数量值，ΔT_<i,j,k>为所有T_<i,j,k,s>的均值，其中，s大于等于1且小于等于N，λ_<i,j,k>为线路i在日期属性j的时段k的线路运行时间波动性值；

分别对每条线路中线路运行时间波动性值之差绝对值小于预设第一阈值的相邻时段进行合并，得到每条线路的最终线路时段表。

上述方法，优选的，所述利用每个所述初始线路路段表中每个路段的路段运行时间波动性值，分别对每条线路中路段运行时间波动性值之差绝对值小于预设第二阈值的相邻路段进行合并，得到每个线路的最终线路路段表，包括：

利用获取每个所述初始线路路段表中每个路段的路段运行时间波动性值，T_<i,j,k,m,s>为所述线路时段数据集合RT_<i,j,k>的路段m的第s条记录的路段运行时间，N为所述历史路线记录的总数量值，ΔT_<i,j,k,m>为所有T_<i,j,k,m,s>的均值，其中，s大于等于1且小于等于N，ω_<i,j,k,m>为线路i在日期属性j的时段k的路段m的路段运行时间波动性值；

分别对每条线路中路段运行时间波动性值之差绝对值小于预设第一阈值的相邻路段进行合并，得到每个线路的最终线路路段表。

上述方法，优选的，所述依据用户需求数据，确定目标路段及其分段状态表，包括：

根据用户需求数据中的目标线路、目标方向及目标站点，在所述线路历史数据集合中确定所述目标线路所在的处于目标方向上且所述目标站点上车辆未经过的当前路线运行记录，所述当前路线运行记录中到站时间为空的站点的数量最小；

在所述当前路线运行记录中，确定距离所述目标站点最近且其到站时间非空的站点与所述目标站点之间的路段为目标路段；

在所述目标线路的线路时段表中确定当前时刻对应的目标时段；

在所述目标线路的线路路段表中，确定所述目标时段对应的目标线路路段集合；

依据所述目标线路路段集合，确定与所述目标路段对应的分段状态表。

上述方法，优选的，以所述路段记录集合中的每条路线记录为训练记录，依据预设的向量机对象，生成所述分段状态表中每个路段的预测运行时间，包括：

对所述路段记录集合中的每条路线记录，生成一条训练记录，组成训练集合，所述训练记录包括多个训练特征及其对应路段的路段实际运行时间；

将所述训练集合中的每条路线记录输入预设的向量机对象，并执行所述向量机对象，得到运行时间预测模型；

依据所述当前运行路线记录，对所述分段状态表中的每个路段生成对应的预测记录，所述预测记录中的特征组成与所述训练记录中的特征组成一致；

将每个所述预测记录作为输入，运行所述运行时间预测模型，得到所述分段状态表中每个路段的预测运行时间。

本发明还提供了一种车辆到站时间的获取系统，包括：

数据获取单元，用于获取站点信息表及历史到站数据集合，所述站点信息表中包括目标区域中所有线路和每条线路上的所有站点及其站点地理位置，所述历史到站数据集合包括每条线路上的每辆车分别到达所述站点信息表中每个站点的历史时间信息，其中，以每辆车在其对应线路上的运行线路形成一条历史路线记录，所述历史到站数据集合中以所述历史路线记录为记录单位；

线路记录提取单元，用于提取所述历史到站数据集合中每条线路所对应的历史路线记录，形成每条线路的线路历史数据集合，所述线路历史数据集合中的历史路线记录以日期属性进行分类；

时段划分单元，用于对每个所述线路历史数据集合中的历史路线记录按照预设的初始时段划分规则进行划分，得到每条线路的初始线路时段表；

时段操作单元，用于利用每个所述初始线路时段表中的每个时段的线路运行时间波动性值，分别对每条线路中线路运行时间波动性值之差绝对值小于预设第一阈值的相邻时段进行合并，得到每条线路的最终线路时段表；

路段划分单元，用于对每个所述线路历史数据集合中的历史路线记录按照其对应的最终线路时段表进行划分，得到每条线路的多个线路时段数据集合及其各自的初始线路路段表，其中，所述初始线路路段表中以站间路段为单位；

路段操作单元，用于利用每个所述初始线路路段表中每个路段的路段运行时间波动性值，分别对每条线路中路段运行时间波动性值之差绝对值小于预设第二阈值的相邻路段进行合并，得到每个线路的最终线路路段表；

分段状态确定单元，用于依据用户需求数据，确定目标路段及其分段状态表，所述分段状态表中包括所述目标路段在所述最终线路时段表中对应的时段及所述目标路段在所述最终线路路段表中对应的路段；

路段记录获取单元，用于在所述历史到站数据集合中，获取所述分段状态表中的每个路段各自对应的经过该路段的预定时间长内的路线记录组成路段记录集合，其中，所述路段记录与所述分段状态表中的时段相对应；

运行时间生成单元，用于以所述路段记录集合中的每条路线记录为训练记录，依据预设的向量机对象，生成所述分段状态表中每个路段的预测运行时间；

到达时间获取单元，用于依据每个所述路段的预测运行时间，获取用户需求数据中目标线路在所述目标路段上车辆达到该目标路段终点的时间。

上述系统，优选的，所述初始时段划分规则包括：以预设时段长度为划分单位对所述历史线路记录进行均匀划分；

其中，所述时段操作单元包括：

时段波动值获取子单元，用于利用获取每个所述初始线路时段表中每个时段的线路运行时间波动性值，T_<i,j,k,s>为所述线路历史数据集合R_<i,j>的时刻k的第s条路线记录的线路运行时间，N为所述历史路线记录的总数量值，ΔT_<i,j,k>为所有T_<i,j,k,s>的均值，其中，s大于等于1且小于等于N，λ_<i,j,k>为线路i在日期属性j的时段k的线路运行时间波动性值；

时段合并子单元，用于分别对每条线路中线路运行时间波动性值之差绝对值小于预设第一阈值的相邻时段进行合并，得到每条线路的最终线路时段表。

上述系统，优选的，所述路段操作单元包括：

路段波动值获取子单元，用于利用获取每个所述初始线路路段表中每个路段的路段运行时间波动性值，T_<i,j,k,m,s>为所述线路时段数据集合RT_<i,j,k>的路段m的第s条记录的路段运行时间，N为所述历史路线记录的总数量值，ΔT_<i,j,k,m>为所有T_<i,j,k,m,s>的均值，其中，s大于等于1且小于等于N，ω_<i,j,k,m>为线路i在日期属性j的时段k的路段m的路段运行时间波动性值；

路段合并子单元，用于分别对每条线路中路段运行时间波动性值之差绝对值小于预设第一阈值的相邻路段进行合并，得到每个线路的最终线路路段表。

上述系统，优选的，所述分段状态确定单元包括：

当前记录确定子单元，用于根据用户需求数据中的目标线路、目标方向及目标站点，在所述线路历史数据集合中确定所述目标线路所在的处于目标方向上且所述目标站点上车辆未经过的当前路线运行记录，所述当前路线运行记录中到站时间为空的站点的数量最小；

目标路段确定子单元，用于在所述当前路线运行记录中，确定距离所述目标站点最近且其到站时间非空的站点与所述目标站点之间的路段为目标路段；

目标时段确定子单元，用于在所述目标线路的线路时段表中确定当前时刻对应的目标时段；

路段集合确定子单元，用于在所述目标线路的线路路段表中，确定所述目标时段对应的目标线路路段集合；

分组状态确定子单元，用于依据所述目标线路路段集合，确定与所述目标路段对应的分段状态表。

上述系统，优选的，所述运行时间生成单元包括：

训练记录生成子单元，用于对所述路段记录集合中的每条路线记录，生成一条训练记录，组成训练集合，所述训练记录包括多个训练特征及其对应路段的路段实际运行时间；

预测模型生成子单元，用于将所述训练集合中的每条路线记录输入预设的向量机对象，并执行所述向量机对象，得到运行时间预测模型；

预测记录生成子单元，用于依据所述当前运行路线记录，对所述分段状态表中的每个路段生成对应的预测记录，所述预测记录中的特征组成与所述训练记录中的特征组成一致；

时间获取子单元，用于将每个所述预测记录作为输入，运行所述运行时间预测模型，得到所述分段状态表中每个路段的预测运行时间。

由上述方案可知，本发明提供的一种车辆到站时间的获取方法及系统，从日期、时段及路段三维信息入手，根据车辆到站时间波动性，将待预测的目标路段分成不同的路段，对每个路段进行车辆到站时间的分段预测，最终获取到待预测的目标线路在目标路段上车辆到达路段终点的时间，在达到本发明目的的同时，相对于现有的时间获取方案，基于车辆到站时间的波动性进行到站时间获取，明显提高时间获取的准确性，而且，本发明利用向量机对象对作为训练记录的路线记录生成每个路段的预测运行时间，进而得到车辆到站时间，简化方案的复杂度，降低方案运行时间，提高车辆到站时间的获取效率。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。

图1为本申请提供的一种车辆到站时间的获取方法实施例一的流程图；

图2为本申请实施例的示例图；

图3为本发明提供的一种车辆到站时间的获取方法实施例二的部分流程图；

图4为本发明提供的一种车辆到站时间的获取方法实施例三的部分流程图；

图5为本发明提供的一种车辆到站时间的获取方法实施例四的部分流程图；

图6为本发明提供的一种车辆到站时间的获取方法实施例五的部分流程图；

图7为本发明提供的一种车辆到站时间的获取系统实施例六的结构示意图；

图8为本发明提供的一种车辆到站时间的获取系统实施例七的部分结构示意图；

图9为本发明提供的一种车辆到站时间的获取系统实施例八的部分结构示意图；

图10为本发明提供的一种车辆到站时间的获取系统实施例九的部分结构示意图；

图11为本发明提供的一种车辆到站时间的获取系统实施例十的部分结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

参考图1，为本申请提供的一种车辆到站时间的获取方法实施例一的流程图，其中，所述方法可以包括以下步骤：

步骤101：获取站点信息表及历史到站数据集合。

其中，所述站点信息表中包括目标区域中所有线路和每条线路上的所有站点，所述目标区域可以为用户当前所在的城市区域，该城市区域中具有公共交通车辆，如公交车、地铁或BTR等车辆，在本实施例中，可以以公交车为例进行说明。所述站点信息表中的所有线路及线路上的站点可以从所在城市的公交信息管理系统中导入之后，这其中包括有从公共地图系统中查询到的每个站点的地理位置，如每个站点的周围是否有学校、商业区、医院和旅游区等特殊单位，这些线路及每条线路上的站点(包括站点名称及站点地理位置)组成站点信息表。

所述站点信息表中的数据结构可以为：

<站点编号><站点名称><经过线路><地理位置>

其中，地理位置用1-8表示，分别对应站点附近有学校、商业区、医院、旅游区、居民区、政府机构、火车站和其他地方。

例如：

表示大公园站的编号是S7，经过该站点的公交线路为1路，23路，45路和202路，该站点附近有学校和医院。

而所述历史到站数据集合包括每条线路上的每辆车分别到达所述站点信息表中的每个停靠站点的历史时间信息，其中，以每辆车在其对应线路上的运行线路形成一条历史路线记录，所述历史到站数据集合中以所述历史路线记录为记录单位。

需要说明的是，所述历史到站数据集合中的每条历史路线记录均具有日期属性，这一日期属性可以从各个专业网站服务器中获取到当天的天气信息，是否为工作日和星期几等信息，这些信息存储在天气日期信息表中，所述天气日期信息表中的数据结构可以为：

<日期><天气情况(1-8分别表示晴天，阴天、小雨、大雨、雪、冰雪、大风、冰冻等天气)><是否工作日(0-不是；1-是)><星期(1-7)>

例如，<2014年6月16日><2><1><1>表示2014年6月16日是阴天，是工作日，星期一。

而所述历史到站数据集合的获取过程可以为：按照一定间隔(如1分钟等)从公交GPS监控系统中获取公交车辆的线路名称、到站时间、站点名称、站点编号和公交车车牌等实时信息，以每辆公交车从起点站到终点站的运行线路为一条路线记录，形成所述历史到站数据集合(也可以称为公交到站数据集合)。其中，所述历史到站数据集合中的每个历史路线记录的数据结构可以为：

<线路名称><上行(0)还是下行(1)><公交车牌号><日期><起点站点编号：发车时间><第一站站点编号：到达时间><第二站站点编号：到达时间>……<终点站点编号：到达时间><运行完成标志>

其中，如果某条运行的线路没有运行完成(运行完成标志为否)，则未到达的站点的到达时间为未知(用0表示)。一般情况下，一条公交线路分为上行(从起始站点到终点站点)和下行(从终点站点到起始站点)，则每次上行或下行分别为一条路线记录。

例如，202路公交车有12个站点，站点编号分别为S1-S12，则其中的一次上行和下行路线记录表示如下：

<202><0(上行)><苏E12345><2014年6月16日><S1：8:12:30><S2：8:14:42><S3：8:17:20><S4：8:20:12><S5：8:24:23><S6：8:26:10><S7：8:31:45><S8：8:35:56><S9：8:41:38><S10：8:45:20><S11：8:52:10><S12：8:57:26><1(完成)>

<202><1(下行)><苏E12345><2014年6月16日><S12：9:05:30><S11：9:10:51><S10：9:14:17><S9：9:17:20><S8：0><S7：0><S6：0><S5：0><S4：0><S3：0><S2：0><S1：0><0(未完成)>

以上路线记录则表示202路的上行路线完成了，下行路线公交车到了站点S9，正在开往S8。

步骤102：提取所述历史到站数据集合中每条线路所对应的历史路线记录，形成每条线路的线路历史数据集合，所述线路历史数据集合中的历史路线记录以日期属性进行分类。

具体的，所述步骤102中，对所述历史到站数据集合中的历史路线记录按照线路、是否为工作日划分为多个线路历史数据集合R_<i,j>，每个所述线路历史数据集合中包括有线路i在工作日或节假日(j＝1：工作日；j＝0：节假日)的所有历史公交到站路线记录(历史路线记录)。

步骤103：对每个所述线路历史数据集合中的历史路线记录按照预设的初始时段划分规则进行划分，得到每条线路的初始线路时段表。

其中，所述步骤103中是指：把1天24小时按照所述初始时段划分规则进行划分成多个不同的时段，然后依据这些划分的时段对每个所述线路历史数据集合中的每个历史路线记录进行时段划分，由此，为每个所述线路历史数据集合建立一个初始线路时段表，每个所述初始线路时段表D_<i,j>中包括有其对应线路i在工作日或节假日(j＝1：工作日；j＝0：节假日)的时段信息。其中，所述初始线路时段表中的每个时段记录的数据结构可以如下：

<是否工作日(1-工作日,0-节假日)><时段(如00:00:00-00:14:59)>

例如：所述历史到站数据集合中有200条不同的公交线路，则按照线路、是否工作日划分可以得到400(200*2)个线路历史数据集合。如，202路可分为工作日线路历史数据集合和节假日线路历史数据集合，每个集合对应一个初始线路时段表，初始情况下以x分钟为时段进行划分，如节假日线路历史数据集合对应的线路时段表为：

<1><00:00:00-00:x-1:59>

<1><00:x:00-00:2*x-1:59>

<1><00:2*x:00-00:3*x-1:59>

……

步骤104：利用每个所述初始线路时段表中每个时段的线路运行时间波动性值，分别对每条线路中线路运行时间波动性值之差绝对值小于预设第一阈值的相邻时段进行合并，得到每条线路的最终线路时段表。

其中，所述步骤104是指：基于所述初始线路时段表中每个时段的线路运行时间波动性值，对相邻时段之间的波动性值进行判断合并，使得相邻时段的线路运行时间波动性值之差绝对值不小于所述第一阈值，最终得到最终的线路时段表。

需要说明的是，所述线路运行时间可以为所述历史到站数据集合中的所述线路的终点站到达时间减去起点站出发时间的时间差。

步骤105：对每个所述线路历史数据集合中的历史路线记录按照其对应的最终线路时段表进行划分，得到每条线路的多个线路时段数据集合及其各自的初始线路路段表。

其中，所述初始线路路段表中以站间路段为单位。

具体的，所述步骤105中，对每个所述线路历史数据集合中的历史路线记录按照对应的最终线路时段表中的时段进行划分，得到每个线路历史数据集合各自对应的多个线路时段数据集合，每个所述线路时段数据集合RT_<i,j,k>中包括有其对应线路i在工作日或节假日(j＝1：工作日；j＝0：节假日)的时段k的所有历史公交到站数据。

例如，如果202路工作日的线路时段表共有6个时段，那么202路的工作日线路历史数据集合划分为6个线路时段数据集合。

进而，在所述步骤105中，再对线路i，从所述站点信息表中获取到该线路所对应的所有站间路段，用站间路段来表示最初划分的路段，得到初始线路路段表，由此，为每个所述线路时段数据集合RT_<i,j,k>建立一个线路路段表S_<i,j,k>。

其中，站间路段为公交线路上任相邻两站间的路线，一个有n站的公交线路有n-1个站间路段。

例如，202路由12个站点，则有11个站间路段。那么，那么202路的12个线路时段数据集合(分节假日和工作日，每个有6个时段)，各有一个线路路段表，初始情况下完全相同，具体如下：

<S1-S2><S2-S3><S3-S4><S4-S5><S5-S6><S6-S7><S7-S8><S8-S9><S9-S10><S10-S11><S11-S12>。

步骤106：利用每个所述初始线路路段表中每个路段的路段运行时间波动性值，分别对每条线路的每个初始线路路段表中的路段运行时间波动性值之差绝对值小于预设第二阈值的相邻路段进行合并，得到每个线路的最终线路路段表；

其中，所述步骤106是指：基于所述初始线路路段表中每个路段的路段运行时间波动性值，对相邻路段之间的波动性值进行判断合并，使得相邻路段的路段运行时间波动性值之差绝对值不小于所述第二阈值，最终得到最终的线路路段表。

需要说明的是，所述路段运行时间可以为：所述路段的终点站的到达时间减去起点站的到达时间的时间差，这里的到达时间可以线路时段数据集合中获取。

步骤107：依据用户需求数据，确定目标路段及其分段状态表，所述分段状态表中包括所述目标路段在所述最终线路时段表中对应的时段及所述目标路段在所述最终线路路段表中对应的路段。

其中，所述用户需求数据中可以有待预测的公交线路i、行进方向d，查询站点qs等，所述步骤107中，利用用户的这些数据，基于前文中线路历史数据集合确定用户所需要查询的目标路段、以及目标路段在所述最终线路时段表中对应的时段和所述目标路段在所述最终线路路段表中对应的路段，所述目标路段对应的时段和路段组成所述分段状态表。

步骤108：在所述历史到站数据集合中，获取所述分段状态表中的每个路段各自对应的经过该路段的预定时间长内的路线记录组成路段记录集合。

其中，所述路段记录与所述分段状态表中的时段相对应。而所述预定时间长可以为距离当前时间的最近半年或距离当前时间的最近一年等时间长。

也就是说，所述步骤108可以为：对于所述分段状态表SS中的每个路段ss，在所述历史到站数据集合中，查找经过所述路段ss，在时段k内的最近半年的路线记录，进而组成路段记录集合。

步骤109：以所述路段记录集合中的每条路线记录为训练记录，依据预设的向量机对象，生成所述分段状态表中每个路段的预测运行时间。

其中，所述步骤109中是指：基于预设的向量机对象，以所述路段记录集合中的每条路线记录为训练记录作为该向量机对象的输入，进而生成所述分段状态表中每个路段的预测运行时间。

步骤110：依据每个所述路段的预测运行时间，获取用户需求数据中目标线路在所述目标路段上车辆达到该目标路段终点的时间。

其中，所述目标线路在所述目标路段上车辆到达该目标路段终点的时间，可以理解为：车辆到达前文中提到的查询站点qs的时间，如图2中所示。

具体的，所述步骤110的实现方式可以为：对每个所述路段的预测运行时间求和，得到所述目标路段PL的总预测运行时间，之后，把所述总预测运行时间加上所述目标路段PL起始站点的到站时间，进而得到查询站点qs的预测到达时间。

例如：路段<S9-S7>、<S7-S4>和<S4-S2>的预测运行时间分别为：6:56、8:12和4:58，则总的预测运行时间为20:06，加上S9-s7的到达时间9:17:20，则S2的预测到达时间为9:37:26。

由上述方案可知，本发明提供的一种车辆到站时间的获取方法实施例一，从日期、时段及路段三维信息入手，根据车辆到站时间波动性，将待预测的目标路段分成不同的路段，对每个路段进行车辆到站时间的分段预测，最终获取到待预测的目标线路在目标路段上车辆到达路段终点的时间，在达到本实施例目的的同时，相对于现有的时间获取方案，基于车辆到站时间的波动性进行到站时间获取，明显提高时间获取的准确性，而且，本实施例利用向量机对象对作为训练记录的路线记录生成每个路段的预测运行时间，进而得到车辆到站时间，简化方案的复杂度，降低方案运行时间，提高车辆到站时间的获取效率。

其中，上述初始时段划分规则可以包括：以预设时段长度为划分单位对所述历史线路记录进行均匀划分，例如，所述预设时段长度可以为15分钟等时间长，如，202路可分为工作日线路历史数据集合和节假日线路历史数据集合，每个集合对应一个线路时段表，初始情况下以15分钟为时段进行划分，如节假日线路历史数据集合对应的线路时段表为：

<1><00:00:00-00:14:59>

<1><00:15:00-00:29:59>

<1><00:30:00-00:44:59>

……

<1><23:30:00-23:44:59>

<1><23:45:00-23:59:59>

参考图3，为本发明提供的一种车辆到站时间的获取方法实施例二中所述步骤104的流程图，其中，所述步骤104可以包括以下步骤：

步骤141：利用获取每个所述初始线路时段表中每个时段的线路运行时间波动性值，T_<i,j,k,s>为所述线路历史数据集合R_<i,j>的时刻k的第s条路线记录的线路运行时间，N为所述历史路线记录的总数量值，ΔT_<i,j,k>为所有T_<i,j,k,s>的均值，其中，s大于等于1且小于等于N，λ_<i,j,k>为线路i在日期属性j的时段k的线路运行时间波动性值。

在本实施例中，所述初始线路时段表D_<i,j>中的每个时段k的线路运行时间波动性值λ_<i,j,k>可以用所述线路历史数据集合R_<i,j>的时段k的所有历史数据的方差来表示，如所述步骤141的具体实现过程。

例如，对于202路的工作日时段8:00:00-8:14:59，从202路的工作日线路历史数据集合中找到所有运行完成标志为是，运行周期(从起始站的出发时间到终点站的到达时间)和时段8:00:00-8:14:59有交集的所有路线记录来统计202路的工作日时段8:00:00-8:14:59线路运行时间波动性值。

步骤142：分别对每条线路中线路运行时间波动性值之差绝对值小于预设第一阈值的相邻时段进行合并，得到每条线路的最终线路时段表。

其中，所述步骤142中对每条线路对应的初始线路时段表执行以下方案：

a：判断线路中是否存在相邻的时段k和k+1的线路运行时间波动性值λ_<i,j,k>和λ_<i,j,k+1>之差绝对值小于所述第一阈值的情况，如果是，执行b，否则，时段合并结束，所述初始线路时段表中的结果即为最终的时段划分合并结果，得到所述线路的最终线路时段表D_<i,j>；

b：把时段k和k+1合并称为一个时段k，并在所述初始线路时段表中删除所述时段k+1，再重新计算所述线路中每个时段的线路运行时间波动性值λ_<i,j,k>，执行a。

例如，202路的工作日时段8:00:00-8:14:59和工作日时段8:15:00-8:29:59的线路运行时间波动性差为0.05，小于第一阈值0.1,则需要把这两个时段合并成为一个时段8:00:00-8:29:59。经过多次合并后，得到202路工作日的线路时段表，共有6个时段如下：

<1><21:15:00-05:29:59>

<1><05:29:00-07:14:59>

<1><07:15:00-09:14:59>

<1><09:15:00-16:29:59>

<1><16:30:00-18:29:59>

<1><18:30:00-21:14:59>

对于合并得到的202路的工作日时段8:00:00-8:29:59，从202路的工作日线路历史数据集合中找到所有运行完成标志为是，运行周期(从起始站的出发时间到终点站的到达时间)和时段8:00:00-8:29:59有交集的所有路线记录来统计202路的工作日时段8:00:00-8:29:59线路运行时间波动性值。

参考图4，为本发明提供的一种车辆到站时间的获取方法实施例三中所述步骤106的流程图，其中，所述步骤106可以包括以下步骤：

步骤161：利用获取每个所述初始线路路段表中每个路段的路段运行时间波动性值，T_<i,j,k,m,s>为所述线路时段数据集合RT_<i,j,k>的路段m的第s条记录的路段运行时间，N为所述历史路线记录的总数量值，ΔT_<i,j,k,m>为所有T_<i,j,k,m,s>的均值，其中，s大于等于1且小于等于N，ω_<i,j,k,m>为线路i在日期属性j的时段k的路段m的路段运行时间波动性值。

在本实施例中，所述初始线路路段表S_<i,j,k>中的每个路段m的路段运行时间波动性值ω_<i,j,k,m>可以用所述线路时段数据集合RT_<i,j,k>的路段m的路段运行时间的所有历史数据的方差来表示，如所述步骤161的具体实现过程。

例如，对于202路的工作日时段8:00:00-8:14:59间的路段S4-S5，从202路的工作日线路历史数据集合中找到所有运行完成标志为是，运行周期(从S4的到达时间到S5的到达时间)和时段8:00:00-8:14:59有交集的所有路线记录，获取每条路线记录中从S4到S5的运行时间，从而统计202路在工作日时段8:00:00-8:14:59，路段S4-S5的线路运行时间波动性。在线路路段表中的每个路段，需要根据不同的时段来计算线路运行时间波动性。202路的11个路段，6个时段，需要计算66个线路运行时间波动性值。

步骤162：分别对每条线路的每个初始线路路段表中路段运行时间波动性值之差绝对值小于预设第一阈值的相邻路段进行合并，得到每个线路的最终线路路段表。

其中，所述步骤162中对每条线路对应的每个初始线路路段表执行以下方案：

c：判断线路中是否存在相邻的路段m和m+1的路段运行时间波动性值ω_<i,j,k,m>和ω_<i,j,k,m+1>之差绝对值小于所述第二阈值的情况，如果是，执行d，否则，路段合并结束，所述初始线路路段表中的结果即为最终的路段划分合并结果，得到所述线路的最终线路路段表S_<i,j,k>；

d：把相邻的路段m和m+1合并称为一个路段m，并在所述初始线路路段表中删除所述路段m+1，再重新计算所述线路中每个路段的路段运行时间波动性值ω_<i,j,k,m>，执行c。

例如，202路在工作日时段05:29:00-07:14:59间，相邻路段S3-S4和S4-S5的路段运行时间波动性差为0.02，小于第二阈值0.05,则把这两个路段段合并成为一个路段S3-S5。经过多次合并后，得到202路在工作日时段05:29:00-07:14:59间的线路路段表，共有4个路段如下：

<05:29:00-07:14:59><S1-S4><S4-S7><S7-S10><S10-S12>

202路有6个时段，则它在工作日有6张线路路段表。

对于合并得到的202路在工作日时段05:29:00-07:14:59间的路段S3-S5，从202路的工作日线路历史数据集合中找到所有运行完成标志为是，运行周期(从S3的到达时间到S5的到达时间)和时段05:29:00-07:14:59有交集的所有路线记录，获取每条路线记录中从S3到S5的运行时间，从而统计202路在工作日时段05:29:00-07:14:59，路段S3-S5的线路运行时间波动性值。

参考图5，为本发明提供的一种车辆到站时间的获取方法实施例四中所述步骤107的流程图，其中，所述步骤107可以通过以下步骤实现：

步骤171：根据用户需求数据中的目标线路、目标方向及目标站点，在所述线路历史数据集合中确定所述目标线路所在的处于目标方向上且所述目标站点上车辆未经过的当前路线运行记录，所述当前路线运行记录中到站时间为空的站点的数量最小。

其中，所述目标线路即为前文中提及的用户的公交到站时间查询要求中的公交线路i，所述目标方向即为行进方向d，所述目标站点即为所述查询站点qs。由此，所述步骤171的具体实现可以为：

根据用户的公交到站时间查询要求<公交线路i，行进方向d，查询站点qs>，根据这些要求：公交线路为i、运行完成标识为否、日期为当前、行进方向为d(上行还是下行)、查询站点qs未经过、到达时间为空站点最少，在所述线路历史数据集合中查询得到一条路线记录，即为当前路线运行记录。

例如，用户的查询要求是<202，1(下行)，S2>表示查询202路下行路线S2站点的公交车到站时间。则从线路历史数据集合中查询得到线路为202路，时间为当天2014年6月16日，路线未完成，行进方向为下行，查询站点S2未经过，具有最少的到达时间为空的站点(8个)的当前路线运行记录如下：

步骤172：在所述当前路线运行记录中，确定距离所述目标站点最近且其到站时间非空的站点与所述目标站点之间的路段为目标路段。

其中，所述步骤172中是指：根据到达时间非空、距离查询站点qs最近站点的条件，在所述当前路线运行记录中查找得到需要预测路段的起始站点ss，从所述起始站点ss到查询站点qs的运行路段即为需要预测公交运行时间的目标路段PL。

例如，S9为到达时间不空，离查询站点S2最近的站点，则需要预测公交运行时间的预测路段为S9-S2。

步骤173：在所述目标线路的线路时段表中确定当前时刻对应的目标时段。

其中，所述步骤173是指：根据当前的日期，确定是否为工作日j，从线路i的所述最终线路时段表D_<i,j>中得到当前时刻对应的时段k。

例如，根据日期2014年6月16日，从天气日期信息表得到所述日期为工作日，则从202路的工作日线路时段划分表中得到当前时间6:25对应的时段为<05:29:00-07:14:59>。

步骤174：在所述目标线路的线路路段表中，确定所述目标时段对应的目标线路路段集合。

其中，所述步骤174是指：根据前一步骤中确定的是否为工作日j、线路i和时段k的条件，从线路i的最终线路路段表S_<i,j,k>中得到时段k对应的目标线路路段集合。

步骤175：依据所述目标线路路段集合，确定与所述目标路段对应的分段状态表。

其中，所述步骤175中是指，依据所述目标线路路段集合中，得到目标路段PL的分段状态表SS。

例如，根据工作日，线路为202路，时段为<05:29:00-07:14:59>，从对应的线路路段表(<S1-S4><S4-S7><S7-S10><S10-S12>)中得到预测路段S9-S2的分段情况表如下：

<05:29:00-07:14:59><S9-S7><S7-S4><S4-S2>

参考图6，为本发明提供的一种车辆到站时间的获取方法实施例五中所述步骤109的流程图，其中，所述步骤109可以通过以下步骤时间：

步骤191：对所述路段记录集合中的每条路线记录，生成一条训练记录，组成训练集合，所述训练记录包括多个训练特征及其对应路段的路段实际运行时间。

其中，所述训练记录可以包括9条特征和路段实际运行时间，如下：

<路段实际运行时间>：<时间段><天气><星期><是否工作日><地理位置><当前路段最新速度><上游路段速度><下游路段最新速度><路况拥挤程度>

其中，所述天气、星期和是否工作日根据当天日期从所述天气日期信息表获取；所述地理位置根据路段ss经过的站点从所述站点信息表得到；时间段取值1-4，分别表示早上(5:00-11:00)、中午(11:00-13:00)、下午(13:00-17:00)和晚上(17:00-5:00)，根据当前时间确定。

路段实际运行时间是从所述路线记录中得到的当前路段ss的实际运行时间。当前路段最新速度、上游路段速度和下游路段最新速度根据对应路段的距离和从所述历史到站数据集合中查询得到的当前路段最新运行时间、上游路段运行时间和下游路段最新运行时间计算得到。所述下游路段是指所述路段ss的终点站到下一站的路段；所述上游路段为所述路段ss的前一站到所述路段ss的起始站的路段。由于在预测时无法找到当前路段的运行时间和下游路段的运行时间(只有上游路段运行时间是已知的)，本实施例用所述当前和下游路段在所述历史到站数据集合中的最新运行时间来估计当前路段和下游路段的最近运行时间。

路况拥挤程度用当前路段最新速度减去当前路段历史运行速度的平均值来表示。

例如，对于预测路段S9-S2的其中一个路段S9-S7，从公交到站数据集合中查找经过所述路段S9-S7，在时段<05:29:00-07:14:59>内的最近半年的路线记录，得到路段记录集合。这些路线记录不限于202路，也可以是其它同样经过S9-S7的线路的记录。假如路段记录集合有一个有1万条路线记录，则生成1万条训练记录，存入训练集合。

路线记录<202><1(下行)><苏E12345><2014年4月11日><S12：6:05:30><S11：6:10:51><S10：6:30:02><S9：6:13:20><S8：6:16:12><S7：6:20:34><S6：6:23:11><S5：6:26:17><S4：6:28:50><S3：6:28:55><S2：6:33:20><S1：6:36:20><1(完成)>可以表示为训练记录：

<7:14>：<1><2><1><1><1，3，4><41.23><50.21><45.78><5.11>

其中，路段实际运行时间(7:14)和上游路段速度(50.21公里/小时)根据上述路线记录计算得到；时间段(1)，天气(2)，星期(1)，是否工作日(1)，地理位置(1,3,4)从天气日期信息表和站点信息表获取；当前路段最新速度(41.23公里/小时)和下游路段最新速度(45.78公里/小时)为公交到站数据集合中截止当前时间最新经过S9-S7的速度和经过S7-S6的速度。

步骤192：将所述训练集合中的每条路线记录输入预设的向量机对象，并执行所述向量机对象，得到运行时间预测模型。

其中，所述步骤192中首先将所述训练集合中的每条路线记录转换成向量机(SVM，Support Vector Machine)对象的输入格式，作为所述向量机对象的输入数据，运行该向量机对象，得到运行时间预测模型。

其中，所述向量机对象(工具)是机器学习中常用的工具，如lihgtSVM等。所述向量机工具可以利用训练数据得到一个预测模型，再把需要预测的数据输入所述预测模型，可以得到预测结果。

所述输入格式如下：

<label><index1>：<value1><index2>：<value2>…

其中，<label>是训练数据的目标值，即运行时间。<index>是以1开始的整数，是特征的编号；<value>为实数，是特征的值。

训练记录<7:14>：<1><2><1><1><1，3，4><41.23><50.21><45.78><5.11>转换为：

4341:12:23:14:15:134,6:41.237:50.218:45.789:5.11

其中，434的单位是秒，有7分14秒转换得到。“1，3，4”转为序号134。

步骤193：依据所述当前运行路线记录，对所述分段状态表中的每个路段生成对应的预测记录，所述预测记录中的特征组成与所述训练记录中的特征组成一致。

其中，所述训练记录中的路段运行时间设置为0，需要进行预测。其它9个参数的获取方法同训练记录。例如预测记录：<0>：<1><2><1><1><1，3，4><40.45><53.48><47.29><3.21>

步骤194：将每个所述预测记录作为输入，运行所述运行时间预测模型，得到所述分段状态表中每个路段的预测运行时间。

例如，路段S9-S7的预测运行时间为6:56。

之后，再执行后续步骤110，得到用户需求数据中目标线路在所述目标路段上车辆达到该目标路段终点的时间。

参考图7，为本发明提供的一种车辆到站时间的获取系统实施例六的结构示意图，其中，所述系统可以包括以下结构：

数据获取单元701，用于获取站点信息表及历史到站数据集合。

所述站点信息表中的数据结构可以为：

<站点编号><站点名称><经过线路><地理位置>

例如：

线路记录提取单元702，用于提取所述历史到站数据集合中每条线路所对应的历史路线记录，形成每条线路的线路历史数据集合，所述线路历史数据集合中的历史路线记录以日期属性进行分类。

具体的，所述线路记录提取单元702中，对所述历史到站数据集合中的历史路线记录按照线路、是否为工作日划分为多个线路历史数据集合R_<i,j>，每个所述线路历史数据集合中包括有线路i在工作日或节假日(j＝1：工作日；j＝0：节假日)的所有历史公交到站路线记录(历史路线记录)。

时段划分单元703，用于对每个所述线路历史数据集合中的历史路线记录按照预设的初始时段划分规则进行划分，得到每条线路的初始线路时段表。

其中，所述时段划分单元703是指：把1天24小时按照所述初始时段划分规则进行划分成多个不同的时段，然后依据这些划分的时段对每个所述线路历史数据集合中的每个历史路线记录进行时段划分，由此，为每个所述线路历史数据集合建立一个初始线路时段表，每个所述初始线路时段表D_<i,j>中包括有其对应线路i在工作日或节假日(j＝1：工作日；j＝0：节假日)的时段信息。其中，所述初始线路时段表中的每个时段记录的数据结构可以如下：

<是否工作日(1-工作日,0-节假日)><时段(如00:00:00-00:14:59)>

<1><00:00:00-00:x-1:59>

<1><00:x:00-00:2*x-1:59>

<1><00:2*x:00-00:3*x-1:59>

……

时段操作单元704，用于利用每个所述初始线路时段表中的每个时段的线路运行时间波动性值，分别对每条线路中线路运行时间波动性值之差绝对值小于预设第一阈值的相邻时段进行合并，得到每条线路的最终线路时段表。

其中，所述时段操作单元704是指：基于所述初始线路时段表中每个时段的线路运行时间波动性值，对相邻时段之间的波动性值进行判断合并，使得相邻时段的线路运行时间波动性值之差绝对值不小于所述第一阈值，最终得到最终的线路时段表。

路段划分单元705，用于对每个所述线路历史数据集合中的历史路线记录按照其对应的最终线路时段表进行划分，得到每条线路的多个线路时段数据集合及其各自的初始线路路段表。

其中，所述初始线路路段表中以站间路段为单位。

具体的，所述路段划分单元705中，对每个所述线路历史数据集合中的历史路线记录按照对应的最终线路时段表中的时段进行划分，得到每个线路历史数据集合各自对应的多个线路时段数据集合，每个所述线路时段数据集合RT_<i,j,k>中包括有其对应线路i在工作日或节假日(j＝1：工作日；j＝0：节假日)的时段k的所有历史公交到站数据。

进而，所述路段划分单元705再对线路i，从所述站点信息表中获取到该线路所对应的所有站间路段，用站间路段来表示最初划分的路段，得到初始线路路段表，由此，为每个所述线路时段数据集合RT_<i,j,k>建立一个线路路段表S_<i,j,k>。

路段操作单元706，用于利用每个所述初始线路路段表中每个路段的路段运行时间波动性值，分别对每条线路的每个初始线路路段表中的路段运行时间波动性值之差绝对值小于预设第二阈值的相邻路段进行合并，得到每个线路的最终线路路段表。

其中，所述路段操作单元706是指：基于所述初始线路路段表中每个路段的路段运行时间波动性值，对相邻路段之间的波动性值进行判断合并，使得相邻路段的路段运行时间波动性值之差绝对值不小于所述第二阈值，最终得到最终的线路路段表。

分段状态确定单元707，用于依据用户需求数据，确定目标路段及其分段状态表，所述分段状态表中包括所述目标路段在所述最终线路时段表中对应的时段及所述目标路段在所述最终线路路段表中对应的路段。

其中，所述用户需求数据中可以有待预测的公交线路i、行进方向d，查询站点qs等，所述分段状态确定单元707中，利用用户的这些数据，基于前文中线路历史数据集合确定用户所需要查询的目标路段、以及目标路段在所述最终线路时段表中对应的时段和所述目标路段在所述最终线路路段表中对应的路段，所述目标路段对应的时段和路段组成所述分段状态表。

路段记录获取单元708，用于在所述历史到站数据集合中，获取所述分段状态表中的每个路段各自对应的经过该路段的预定时间长内的路线记录组成路段记录集合。

也就是说，所述路段记录获取单元708可以为：对于所述分段状态表SS中的每个路段ss，在所述历史到站数据集合中，查找经过所述路段ss，在时段k内的最近半年的路线记录，进而组成路段记录集合。

运行时间生成单元709，用于以所述路段记录集合中的每条路线记录为训练记录，依据预设的向量机对象，生成所述分段状态表中每个路段的预测运行时间。

其中，所述运行时间生成单元709是指：基于预设的向量机对象，以所述路段记录集合中的每条路线记录为训练记录作为该向量机对象的输入，进而生成所述分段状态表中每个路段的预测运行时间。

到达时间获取单元710，用于依据每个所述路段的预测运行时间，获取用户需求数据中目标线路在所述目标路段上车辆达到该目标路段终点的时间。

具体的，所述到达时间获取单元710的实现方式可以为：对每个所述路段的预测运行时间求和，得到所述目标路段PL的总预测运行时间，之后，把所述总预测运行时间加上所述目标路段PL起始站点的到站时间，进而得到查询站点qs的预测到达时间。

由上述方案可知，本发明提供的一种车辆到站时间的获取系统实施例六，从日期、时段及路段三维信息入手，根据车辆到站时间波动性，将待预测的目标路段分成不同的路段，对每个路段进行车辆到站时间的分段预测，最终获取到待预测的目标线路在目标路段上车辆到达路段终点的时间，在达到本实施例目的的同时，相对于现有的时间获取方案，基于车辆到站时间的波动性进行到站时间获取，明显提高时间获取的准确性，而且，本实施例利用向量机对象对作为训练记录的路线记录生成每个路段的预测运行时间，进而得到车辆到站时间，简化方案的复杂度，降低方案运行时间，提高车辆到站时间的获取效率。

<1><00:00:00-00:14:59>

<1><00:15:00-00:29:59>

<1><00:30:00-00:44:59>

……

<1><23:30:00-23:44:59>

<1><23:45:00-23:59:59>

参考图8，为本发明提供的一种车辆到站时间的获取系统实施例七中所述时段操作单元704的结构示意图，其中，所述时段操作单元704可以包括以下结构：

时段波动值获取子单元741，用于利用获取每个所述初始线路时段表中每个时段的线路运行时间波动性值，T_<i,j,k,s>为所述线路历史数据集合R_<i,j>的时刻k的第s条路线记录的线路运行时间，N为所述历史路线记录的总数量值，ΔT_<i,j,k>为所有T_<i,j,k,s>的均值，其中，s大于等于1且小于等于N，λ_<i,j,k>为线路i在日期属性j的时段k的线路运行时间波动性值。

在本实施例中，所述初始线路时段表D_<i,j>中的每个时段k的线路运行时间波动性值λ_<i,j,k>可以用所述线路历史数据集合R_<i,j>的时段k的所有历史数据的方差来表示，如所述时段波动值获取子单元741的具体实现过程。

时段合并子单元742，用于分别对每条线路中线路运行时间波动性值之差绝对值小于预设第一阈值的相邻时段进行合并，得到每条线路的最终线路时段表。

其中，所述时段合并子单元742中对每条线路对应的初始线路时段表执行以下方案：

<1><21:15:00-05:29:59>

<1><05:29:00-07:14:59>

<1><07:15:00-09:14:59>

<1><09:15:00-16:29:59>

<1><16:30:00-18:29:59>

<1><18:30:00-21:14:59>

参考图9，为本发明提供的一种车辆到站时间的获取系统实施例八中所述路段操作单元706的结构示意图，其中，所述路段操作单元706可以包括以下结构：

路段波动值获取子单元761，用于利用获取每个所述初始线路路段表中每个路段的路段运行时间波动性值，T_<i,j,k,m,s>为所述线路时段数据集合RT_<i,j,k>的路段m的第s条记录的路段运行时间，N为所述历史路线记录的总数量值，ΔT_<i,j,k,m>为所有T_<i,j,k,m,s>的均值，其中，s大于等于1且小于等于N，ω_<i,j,k,m>为线路i在日期属性j的时段k的路段m的路段运行时间波动性值。

路段合并子单元762，用于分别对每条线路的每个初始线路路段表中路段运行时间波动性值之差绝对值小于预设第一阈值的相邻路段进行合并，得到每个线路的最终线路路段表。

其中，所述路段合并子单元762中对每条线路对应的每个初始线路路段表执行以下方案：

<05:29:00-07:14:59><S1-S4><S4-S7><S7-S10><S10-S12>

202路有6个时段，则它在工作日有6张线路路段表。

参考图10，为本发明提供的一种车辆到站时间的获取系统实施例九中所述分段状态确定单元707的结构示意图，其中，所述分段状态确定单元707可以包括以下结构：

当前记录确定子单元771，用于根据用户需求数据中的目标线路、目标方向及目标站点，在所述线路历史数据集合中确定所述目标线路所在的处于目标方向上且所述目标站点上车辆未经过的当前路线运行记录，所述当前路线运行记录中到站时间为空的站点的数量最小。

其中，所述目标线路即为前文中提及的用户的公交到站时间查询要求中的公交线路i，所述目标方向即为行进方向d，所述目标站点即为所述查询站点qs。由此，所述当前记录确定子单元771的具体实现可以为：

根据用户的公交到站时间查询要求<公交线路i，行进方向d，查询站点qs>，根据这些要求：公交线路为i、运行完成标识为否、日期为当前、行进方向为d(上行还是下行)、查询站点qs未经过、到达时间为空站点最少，在所述线路历史数据集合中查询得到一条路线记录，即为当前线路运行记录。

目标路段确定子单元772，用于在所述当前路线运行记录中，确定距离所述目标站点最近且其到站时间非空的站点与所述目标站点之间的路段为目标路段。

其中，所述目标路段确定子单元772是指：根据到达时间非空、距离查询站点qs最近站点的条件，在所述当前路线运行记录中查找得到需要预测路段的起始站点ss，从所述起始站点ss到查询站点qs的运行路段即为需要预测公交运行时间的目标路段PL。

目标时段确定子单元773，用于在所述目标线路的线路时段表中确定当前时刻对应的目标时段。

其中，所述目标时段确定子单元773是指：根据当前的日期，确定是否为工作日j，从线路i的所述最终线路时段表D_<i,j>中得到当前时刻对应的时段k。

路段集合确定子单元774，用于在所述目标线路的线路路段表中，确定所述目标时段对应的目标线路路段集合。

其中，所述路段集合确定子单元774是指：根据前一步骤中确定的是否为工作日j、线路i和时段k的条件，从线路i的最终线路路段表S_<i,j,k>中得到时段k对应的目标线路路段集合。

分组状态确定子单元775，用于依据所述目标线路路段集合，确定与所述目标路段对应的分段状态表。

其中，所述分组状态确定子单元775是指，依据所述目标线路路段集合中，得到目标路段PL的分段状态表SS。

<05:29:00-07:14:59><S9-S7><S7-S4><S4-S2>

参考图11，为本发明提供的一种车辆到站时间的获取系统实施例十中所述运行时间生成单元709的结构示意图，其中，所述运行时间生成单元709可以包括以下结构：

训练记录生成子单元791，用于对所述路段记录集合中的每条路线记录，生成一条训练记录，组成训练集合，所述训练记录包括多个训练特征及其对应路段的路段实际运行时间。

<7:14>：<1><2><1><1><1，3，4><41.23><50.21><45.78><5.11>

预测模型生成子单元792，用于将所述训练集合中的每条路线记录输入预设的向量机对象，并执行所述向量机对象，得到运行时间预测模型。

其中，所述预测模型生成子单元792中首先将所述训练集合中的每条路线记录转换成向量机(SVM，Support Vector Machine)对象的输入格式，作为所述向量机对象的输入数据，运行该向量机对象，得到运行时间预测模型。

所述输入格式如下：

<label><index1>：<value1><index2>：<value2>…

4341:12:23:14:15:134,6:41.237:50.218:45.789:5.11

预测记录生成子单元793，用于依据所述当前运行路线记录，对所述分段状态表中的每个路段生成对应的预测记录，所述预测记录中的特征组成与所述训练记录中的特征组成一致。

时间获取子单元794，用于将每个所述预测记录作为输入，运行所述运行时间预测模型，得到所述分段状态表中每个路段的预测运行时间。

例如，路段S9-S7的预测运行时间为6:56。

之后，再触发所述到达时间获取单元710，得到用户需求数据中目标线路在所述目标路段上车辆达到该目标路段终点的时间。

需要说明的是，本说明书中的各个实施例均采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似的部分互相参见即可。

以上对本发明所提供的一种车辆到站时间的获取方法及系统进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种车辆到站时间的获取方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述初始时段划分规则包括：以预设时段长度为划分单位对所述历史线路记录进行均匀划分；

3.根据权利要求1或2所述的方法，其特征在于，所述利用每个所述初始线路路段表中每个路段的路段运行时间波动性值，分别对每条线路中路段运行时间波动性值之差绝对值小于预设第二阈值的相邻路段进行合并，得到每个线路的最终线路路段表，包括：

4.根据权利要求1所述的方法，其特征在于，所述依据用户需求数据，确定目标路段及其分段状态表，包括：

5.根据权利要求4所述的方法，其特征在于，以所述路段记录集合中的每条路线记录为训练记录，依据预设的向量机对象，生成所述分段状态表中每个路段的预测运行时间，包括：

6.一种车辆到站时间的获取系统，其特征在于，包括：

7.根据权利要求6所述的系统，其特征在于，所述初始时段划分规则包括：以预设时段长度为划分单位对所述历史线路记录进行均匀划分；

其中，所述时段操作单元包括：

8.根据权利要求6或7所述的系统，其特征在于，所述路段操作单元包括：

9.根据权利要求6所述的系统，其特征在于，所述分段状态确定单元包括：

10.根据权利要求6所述的系统，其特征在于，所述运行时间生成单元包括：