CN107545314B

CN107545314B - 公共出行路线的排序方法及装置

Info

Publication number: CN107545314B
Application number: CN201610460919.8A
Authority: CN
Inventors: 宋德强; 杨浩; 张凡
Original assignee: Alibaba China Co Ltd
Current assignee: Alibaba China Co Ltd
Priority date: 2016-06-23
Filing date: 2016-06-23
Publication date: 2020-12-15
Anticipated expiration: 2036-06-23
Also published as: CN107545314A

Abstract

本申请提供了一种公共出行路线的排序方法及装置。该方法包括：根据设定的起点和目的地进行公共出行路线规划，获取从所述起点到所述目的地的公共出行路线；若规划出的公共出行路线为两条以上，则从每条公共出行路线中，获取预设的排序特征的数值，所述排序特征至少有两个，一个排序特征代表一种路线成本影响因素；根据公共出行路线的排序特征的数值和预设的排序特征对应的特征权值，获取公共出行路线的排序得分，所述排序特征对应的特征权值是预先通过机器学习算法得到的；按照每条公共出行路线的排序得分，对所述两条以上的公共出行路线进行排序。本申请所提供的出行路线的排序结果更符合用户的实际需求。

Description

公共出行路线的排序方法及装置

技术领域

本申请涉及导航技术领域，尤其涉及一种公共出行路线的排序方法及装置。

背景技术

现代社会，人们出行之前有查询公共出行路线的需求。公共出行是指利用公共交通工具(比如公交、地铁、火车、轮渡等)出行。由这些公共交通工具的路线形成的出行路线即为所述公共出行路线(以下简称出行路线)。为此，各类位置服务提供商提供了不同的可供用户进行出行路线查询的平台/软件。以目前比较常见的电子地图软件为例，用户将从A地去往B地，通过电子地图软件查询，查询到以下几种出行路线：

1)公交124路—>公交699路；

2)公交584路/332路—>地铁10号线—>地铁8号线；

3)699路…。

在查询到多条出行路线的情况下，现有技术需要对出行路线排序后展示给用户，以便用户更加快捷的选择出行路线。现有的出行路线排序技术是根据出行路线的总耗时由少到多的顺序对出行路线进行排序。计算总耗时会考虑行驶耗时、步行耗时和等待耗时三个部分。以计算行驶耗时为例，行驶耗时＝行驶距离/行驶速度+停靠站时间*停靠站数量，其中，行驶速度和停靠站时间是经验值，相较于实际情况，利用经验值计算行驶耗时会出现较大误差。比如，道路实时路况的差异、司机驾驶习惯等均会导致车辆的实际行驶速度与经验值产生较大的差异，从而导致出行路线的总耗时出现误差。这种情况下，按总耗时排序后排在首位的出行路线并不一定是实际的最优出行路线。因此，亟需提供一种公共出行路线的排序技术方案，能够提供更加符合用户实际需求的出行路线排序结果。

发明内容

本申请的一个目的是提供一种出行路线的排序方案，使得所提供的出行路线的排序结果更符合用户的实际需求。

根据本申请的一个实施例，提供了一种公共出行路线的排序方法，所述方法包括：

根据设定的起点和目的地进行公共出行路线规划，获取从所述起点到所述目的地的公共出行路线；

若规划出的公共出行路线为两条以上，则从每条公共出行路线中，获取预设的排序特征的数值，所述排序特征至少有两个，一个排序特征代表一种路线成本影响因素；

根据公共出行路线的排序特征的数值和预设的排序特征对应的特征权值，获取公共出行路线的排序得分，所述排序特征对应的特征权值是预先通过机器学习算法得到的；

按照每条公共出行路线的排序得分，对所述两条以上的公共出行路线进行排序。

根据本申请的一个实施例，还提供了一种公共出行路线的排序装置，所述装置包括：

公共出行路线规划单元，用于根据设定的起点和目的地进行公共出行路线规划，获取从所述起点到所述目的地的公共出行路线；

排序特征数值获取单元，用于若规划出的公共出行路线为两条以上，则从每条公共出行路线中，获取预设的排序特征的数值，所述排序特征至少有两个，一个排序特征代表一种路线成本影响因素；

排序得分获取单元，用于根据公共出行路线的排序特征的数值和预设的排序特征对应的特征权值，获取公共出行路线的排序得分，所述排序特征对应的特征权值是预先通过机器学习算法得到的；

公共出行路线排序单元，用于按照每条公共出行路线的排序得分，对所述两条以上的公共出行路线进行排序。

由于本申请实施例中对公共出现路线的排序不是按照单一的排序特征，而是按照至少两个排序特征，每个排序特征分别代表一种路线成本影响因素，根据至少两个排序特征中每个排序特征的数值和对应的特征权值计算每个公共出行路线的排序得分，按照排序得分进行排序，避免了按照单一的路线成本影响因素排序造成的排序结果不符合用户真正预期的缺点，使得所提供的出行路线的排序结果更符合用户的实际需求。

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述，本申请的其它特征、目的和优点将会变得更明显：

图1为根据本申请一个实施例的一种公共出行路线的排序方法的流程图；

图2为根据本申请一个实施例的一种公共出行路线的排序装置的框图。

附图中相同或相似的附图标记代表相同或相似的部件。

具体实施方式

在更加详细地讨论示例性实施例之前应当提到的是，一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作描述成顺序的处理，但是其中的许多操作可以被并行地、并发地或者同时实施。此外，各项操作的顺序可以被重新安排。当其操作完成时所述处理可以被终止，但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。

在上下文中所称“计算机设备”，也称为“电脑”，是指可以通过运行预定程序或指令来执行数值计算和/或逻辑计算等预定处理过程的智能电子设备，其可以包括处理器与存储器，由处理器执行在存储器中预存的存续指令来执行预定处理过程，或是由ASIC、FPGA、DSP等硬件执行预定处理过程，或是由上述二者组合来实现。计算机设备包括但不限于服务器、个人电脑、笔记本电脑、平板电脑、智能手机等。

所述计算机设备包括用户设备与网络设备。其中，所述用户设备包括但不限于电脑、智能手机、PDA等；所述网络设备包括但不限于单个网络服务器、多个网络服务器组成的服务器组或基于云计算(Cloud Computing)的由大量计算机或网络服务器构成的云，其中，云计算是分布式计算的一种，由一群松散耦合的计算机集组成的一个超级虚拟计算机。其中，所述计算机设备可单独运行来实现本申请，也可接入网络并通过与网络中的其他计算机设备的交互操作来实现本申请。其中，所述计算机设备所处的网络包括但不限于互联网、广域网、城域网、局域网、VPN网络等。

需要说明的是，所述用户设备、网络设备和网络等仅为举例，其他现有的或今后可能出现的计算机设备或网络如可适用于本申请，也应包含在本申请保护范围以内，并以引用方式包含于此。

后面所讨论的方法(其中一些通过流程图示出)可以通过硬件、软件、固件、中间件、微代码、硬件描述语言或者其任意组合来实施。当用软件、固件、中间件或微代码来实施时，用以实施必要任务的程序代码或代码段可以被存储在机器或计算机可读介质(比如存储介质)中。(一个或多个)处理器可以实施必要的任务。

这里所公开的具体结构和功能细节仅仅是代表性的，并且是用于描述本申请的示例性实施例的目的。但是本申请可以通过许多替换形式来具体实现，并且不应当被解释成仅仅受限于这里所阐述的实施例。

应当理解的是，虽然在这里可能使用了术语“第一”、“第二”等等来描述各个单元，但是这些单元不应当受这些术语限制。使用这些术语仅仅是为了将一个单元与另一个单元进行区分。举例来说，在不背离示例性实施例的范围的情况下，第一单元可以被称为第二单元，并且类似地第二单元可以被称为第一单元。这里所使用的术语“和/或”包括其中一个或更多所列出的相关联项目的任意和所有组合。

这里所使用的术语仅仅是为了描述具体实施例而不意图限制示例性实施例。除非上下文明确地另有所指，否则这里所使用的单数形式“一个”、“一项”还意图包括复数。还应当理解的是，这里所使用的术语“包括”和/或“包含”规定所陈述的特征、整数、步骤、操作、单元和/或组件的存在，而不排除存在或添加一个或更多其他特征、整数、步骤、操作、单元、组件和/或其组合。

还应当提到的是，在一些替换实现方式中，所提到的功能/动作可以按照不同于附图中标示的顺序发生。举例来说，取决于所涉及的功能/动作，相继示出的两幅图实际上可以基本上同时执行或者有时可以按照相反的顺序来执行。

下面结合附图对本申请作进一步详细描述。

图1为根据本申请一个实施例的出行路线的排序方法的流程图。

其中，出行路线包括但不限于由公交、地铁、轻轨、轮渡、缆车等中的一种或多种出行方式对应的路线构成。

其中，该排序方法可以由计算机设备来执行。

请参考图1，所述排序方法包括：

步骤S101、根据设定的起点和目的地进行公共出行路线规划，获取从所述起点到所述目的地的公共出行路线；

步骤S102、若规划出的公共出行路线为两条以上，则从每条公共出行路线中，获取预设的排序特征的数值，所述排序特征至少有两个，一个排序特征代表一种路线成本影响因素；

步骤S103、根据公共出行路线的排序特征的数值和预设的排序特征对应的特征权值，获取公共出行路线的排序得分，所述排序特征对应的特征权值是预先通过机器学习算法得到的；

步骤S104、按照每条公共出行路线的排序得分，对所述两条以上的公共出行路线进行排序。

下面对这些步骤进行详细描述。

步骤S101、根据设定的起点和目的地进行公共出行路线规划，获取从所述起点到所述目的地的公共出行路线。

以目前比较常见的电子地图软件为例。用户通过电子地图软件查询，在电子地图软件中输入起点和目的地。电子地图软件能自动为用户规划从起点到目的地的公共出行路线，即获取从所述起点到所述目的地的一条或多条公共出行路线。

例如，用户将从a地去往b地，在电子地图软件中输入起点为a地，目的地为b地，查询到以下几种出行路线：

1)公交124路—>公交699路；

2)公交584路/332路—>地铁10号线—>地铁8号线；

3)699路…。

步骤S102、若规划出的公共出行路线为两条以上，则从每条公共出行路线中，获取预设的排序特征的数值，所述排序特征至少有两个，一个排序特征代表一种路线成本影响因素。

排序特征即用于排序的特征，每个排序特征代表一种路线成本影响因素，例如出行费用成本、步行距离、路线总距离、出行总时间等等。路线成本是指按照该路线出行在人力、财力、时间等方面的各种消耗。现有技术仅按出行总时间这一种路线成本影响因素进行排序，但有时出行总时间短的路线的费用成本很高(例如乘坐机场巴士需要20元)，或中间换乘需要步行距离非常长，造成用户体验差。仅靠出行总时间来对出行路线排序无法客观反映对路线成本能造成影响的各种因素。本申请实施例排序特征至少有两个，代表至少两个不同的路线成本影响因素，就能避免单一按排序特征排序的不客观性。

本发明所称排序特征具体如下，以下各排序特征仅为示例，并非穷举：

-出行费用成本。例如，从a地到b地，先坐地铁后换乘公交，地铁需要3元钱，公交需要2元钱。这5元即出行费用成本。

-步行距离。例如，从a地到b地，先要步行100米到地铁站，坐了5站后在地铁站里步行200米换乘到另一条地铁线，下地铁后步行50米到达b地。步行距离即为350米。

-路线总距离。例如，从a地到b地，先要步行100米到地铁站，在地铁中坐5000米后，步行500米换乘公交，坐公交坐6000米后到达。路线总距离为11600米。

-出行总时间。例如，从a地到b地，先要步行5分钟到地铁站，在地铁中坐10分钟后，步行3分钟，等车2分钟，最后坐公交15分钟到达。出行总时间是35分钟。

-同一出行方式的换乘次数。例如，从a地到b地，先坐公交13路，再转乘地铁5号线，然后换乘地铁8号线到达b地，则对于公交出行方式，换乘次数为1；对于地铁出行方式，换乘次数也为1。

-同一出行方式经过的站数量。例如，从a地到b地，先坐公交13路经5站下车，转乘地铁5号线经3站下车，然后换乘地铁8号线经2站到达b地，则对于公交出行方式，经过的站数量是5；对于地铁出行方式，经过的站数量也是5(3+2＝5)。

例如，在上述排序特征中预设出行总时间、出行费用成本、步行距离、路线总距离作为预设的4个排序特征。对于上述3条规划出的出行路线，每条获取4个排序特征每一个的数值。在数据库中存储有各种出行方式中相邻两站之间的距离、行驶时间等。在计算排序特征的数值时，只需把这些相邻站之间的距离、行驶时间等加和，再估算站间换乘距离、换乘时间、从起点走到出行工具的步行距离、步行时间、从出行工具走到目的地的步行距离、步行时间等，得到各排序特征的数值。关于估算各种排序特征的数值，目前有成熟技术，不在此申请中赘述。

步骤S103、根据公共出行路线的排序特征的数值和预设的排序特征对应的特征权值，获取公共出行路线的排序得分，所述排序特征对应的特征权值是预先通过机器学习算法得到的。

关于如何通过机器学习算法获得特征权重，在后面有更详细的描述。

在机器学习算法是支持向量机(SVM)算法的情况下，步骤103中的根据公共出行路线的排序特征的数值和预设的排序特征对应的特征权值获取公共出行路线的排序得分通过以下方式实现：

用排序特征的数值乘以该排序特征对应的预设的特征权值，得到排序特征的乘积值；获取所有排序特征的乘积值的和值作为所述公共出行路线的排序得分。

例如，预设出行总时间、出行费用成本、步行距离、路线总距离作为预设的4个排序特征。假设某出行路线的出行总时间是30分钟，出行总时间的特征权值是0.5/分钟；出行费用成本是5元，出行费用成本的特征权值是2/元；步行距离是0.5公里，步行距离的特征权值是4/公里；路线总距离是50公里，路线总距离的特征权值是0.1/公里，则该出行路线的排序得分＝30×0.5+5×2+0.5×4+50×0.1＝15+10+2+5＝32。

由于排序特征的数值越大，作为排序特征的数值的加权和的排序得分越大，而排序特征的数值越大(例如出行总时间长)表示了该排序特征对路线成本的影响越大，即，路线成本越大，路线成本越大的出行路线是不优选的，因此往往按照出行路线的排序得分由小到大的顺序，来对所述两条以上的公共出行路线进行排序。例如，起点到目的地有3个出行路线A、B、C，排序得分分别为32、30、25，排序的结果是C、B、A(C最优选，B其次，A最不优选)。

下面对关于如何通过机器学习算法获得特征权值，进行展开的详细描述。

通过机器学习算法得到特征权值具体包括：

1)从作为训练样本的每条历史公共出行路线中，获取预设的排序特征的数值构成该条公共出行路线的特征值向量；

2)用机器学习算法对所有训练样本的特征值向量进行训练，得到每个排序特征对应的特征权值。

训练样本是指用于机器学习算法的训练的历史公共出行路线。在电子地图软件对应的服务器的数据库中，存储着大量用户历史上查询出行路线时给用户规划的出行路线。把每个出行路线作为一个训练样本。所有训练样本是预先按起点和终点分组的，相同起点和终点的训练样本分为一组。例如,在服务器数据库存储的历史出行路线中，起点“首开广场”至目的地“XX建筑物”的出行路线共有5条，如下表所示。在下表的每条出行路线中，预设出行费用成本、步行距离、路线总距离、出行总时间作为预设的排序特征。

对于某条公共出行路线来说，预设的排序特征的数值构成该条公共出行路线的特征值向量。例如，在上表中，各出行路线的特征值向量为：

出行路线a的特征值向量为(5,1.5,18.6,57)；

出行路线b的特征值向量为(4,1.1,20.6,67)；

出行路线c的特征值向量为(6,1.2,17.6,63)；

出行路线d的特征值向量为(6,1.1,28.6,77)；

出行路线e的特征值向量为(6,1.5,19.6,59)。

在一个实施例中，在机器学习算法是支持向量机(SVM)算法的情况下，上述2)用机器学习算法对所有训练样本的特征值向量进行训练，得到每个排序特征对应的特征权值的过程具体如下实现：

2-1)获取所有训练样本中具有相同的起点和终点的训练样本的特征向量值的特征向量差值；

2-2)调用LIBSVM库对所述特征向量差值进行学习，输出每个排序特征对应的特征权值。

在一个实施例中，在2-1)中，针对每一组具有相同的起点和终点的训练样本执行如下操作：

若该组中的训练样本已预先按照优先级由高到低的顺序排序，则针对排序后每一对相邻的训练样本，用排序在前的训练样本对应的特征向量值减去排序在后的训练样本对应的特征向量值，得到正向特征向量差值，用排序在后的训练样本对应的特征向量值减去排序在前的训练样本对应的特征向量值，得到负向特征向量差值；

所有训练样本的正向特征向量差值和负向特征向量差值构成所述所有训练样本的特征向量差值。

该组中的训练样本的优先级顺序如下确定：按照历史上将该组的作为各训练样本的出行路线被推荐给用户后用户的选择次数确定优先级。例如，历史上有50次用户输入起点为“首开广场”、目的地为“XX建筑物”，将出行路线a-e推荐给用户后，30次用户选择出行路线a,10次用户选择出行路线b,5次用户选择出行路线c,3次用户选择出行路线d,2次用户选择出行路线e,则5条出行路线的优先级顺序是a、b、c、d、e。

出行路线a-e的特征值向量分别为：

V_a＝(5,1.5,18.6,57)；

V_b＝(4,1.1,20.6,67)；

V_c＝(6,1.2,17.6,63)；

V_d＝(6,1.1,28.6,77)；

V_e＝(6,1.5,19.6,59)。

用排序在前的训练样本的特征向量值V_a减去排序在后的训练样本的特征向量值V_b得到正向特征向量差值V_a-b＝(1,0.4，-2，-10)。用排序在前的训练样本的特征向量值V_b减去排序在后的训练样本的特征向量值V_c得到正向特征向量差值V_b-c＝(-2,-0.1，3，4)。用排序在前的训练样本的特征向量值V_c减去排序在后的训练样本的特征向量值V_d得到正向特征向量差值V_c-d＝(0,0.1，-11，-14)。用排序在前的训练样本的特征向量值V_d减去排序在后的训练样本的特征向量值V_e得到正向特征向量差值V_d-e＝(0,-0.4，9，18)。

因此，得到以下四个正向特征向量差值：

V_a-b＝(1,0.4，-2，-10)；

V_b-c＝(-2,-0.1，3，4)；

V_c-d＝(0,0.1，-11，-14)；

V_d-e＝(0,-0.4，9，18)。

用排序在后的训练样本的特征向量值V_b减去排序在前的训练样本的特征向量值V_a得到负向特征向量差值V_b-a＝(-1,-0.4，2，10)。用排序在后的训练样本的特征向量值V_c减去排序在前的训练样本的特征向量值V_b得到负向特征向量差值V_c-b＝(2,0.1，-3，-4)。用排序在后的训练样本的特征向量值V_d减去排序在前的训练样本的特征向量值V_c得到负向特征向量差值V_d-c＝(0,-0.1，11，14)。用排序在后的训练样本的特征向量值V_e减去排序在前的训练样本的特征向量值V_d得到负向特征向量差值V_e-d＝(0,0.4，-9，-18)。

因此，得到以下四个负向特征向量差值

V_b-a＝(-1,-0.4，2，10)；

V_c-b＝(2,0.1，-3，-4)；

V_d-c＝(0,-0.1，11，14)；

V_e-d＝(0,0.4，-9，-18)。

所有训练样本的正向特征向量差值和负向特征向量差值构成所述所有训练样本的特征向量差值。也就是说，不仅是起点为“首开广场”、目的地为“XX建筑物”的训练样本的正向特征向量差值和负向特征向量差值会合在一起，其它起点和目的地的训练样本的正向特征向量差值和负向特征向量差值也会合在一起，构成所述所有训练样本的特征向量差值。

然后，进入过程2-2)，即调用LIBSVM库对所述特征向量差值进行学习，输出每个排序特征对应的特征权值。

LIBSVM是一个简单、易于使用和快速有效的SVM(支持向量机)模式识别与回归的软件包，调用LIBSVM库对所述特征向量差值进行学习的过程是：

利用如下公式：

S＝(w·x)+b (公式1)

其中，w表示该最优分类超平面的法向量，b为超平面的偏移量，x为支持向量(SV)。x的取值为任意一个特征向量差值，其有可能是正向特征向量差值或负向特征向量差值,表示为：

x＝(x₁，x₂，x₃…x_m) (公式2)

其中m为预设的排序特征的数目。在前面预设出行费用成本、步行距离、路线总距离、出行总时间作为预设的排序特征的例子中，m＝4。x₁，x₂，x₃…x_m代表的是对于该出行路线来说，各预设排序特征的数值。

每个排序特征对应的特征权值用以下特征权值向量表示：

s＝(s₁，s₂，s₃，…s_m) (公式3)

其中，s₁,s₂,…s_m分别代表各预设排序特征x₁，x₂，x₃…x_m对应的特征权值。

根据支持向量机的已知技术，w可以表达为如下形式：

其中，s_i代表上述公式3中的特征权值向量中的某一元素，即某个特征权值。x_i代表上述公式2中的特征向量差值中的某一元素，即某个排序特征的数值的差值。y_i可以表示某一已知函数运算。

在机器学习过程中，用试错法不断尝试每个排序特征对应的特征权值的各种取值，即公式3中的，s₁,s₂,…s_m的每个s_i的各种取值，直到对于所有正向特征向量差值x,超过第一预定比例的正向特征向量差值x代入公式1后，得到的S为正；对于所有负向特征向量差值x,超过第二预定比例的负向特征向量差值x代入公式1后，得到的S为负。优选地，第一预定比例和第二预定比例相同。

例如，从所有训练样本中得到500个正向特征向量差值、500个负向特征向量差值。第一预定比例都是80％。假设对于超过400个正向特征向量差值代入公式1后，得到的S为正；超过400个负向特征向量差值代入公式1后，得到的S为负，则认为此时s₁,s₂,…s_m是合格的，无需再调整。如不满足上述条件，则仍需再调整。当s₁,s₂,…s_m无需再调整后，s₁,s₂,…s_m就是每个排序特征对应的特征权值。

为了进一步提高特征权值的质量，可以在所述特征权值s₁,s₂,…s_m通过机器学习算法得出后还经过测试过程，所述测试过程包括：

从作为测试样本的每条历史公共出行路线中，获取预设的排序特征的数值；

根据测试样本的排序特征的数值和所述机器学习算法输出的所述排序特征对应的特征权值，获取测试样本的排序得分，

按照测试样本的排序得分，对所述测试样本进行排序；

将排序后的测试样本与预设的所述测试样本的排序结果进行比较，得到排序一致的比率值，若排序一致的比率值大于预设的比例阈值，则确定所述机器学习算法输出的特征权值是可信的。

测试样本即用作特征权值的测试的出行路线。它一般也是从服务器数据库存储的大量出行路线中选出。选出的测试样本也是预先按起点和目的地分组的。起点和目的地完全相同的多个出行路线为一组。在一组中，事先已知这些出行路线的排序结果。该排序结果可以是按照历史上用户在电子地图软件中输入该起点和目的地后向用户推送这些出行路线用户的选择结果得出的。例如，选取500个测试样本，即500个用作测试的出行路线，其中分成100组，每组具有相同起点和目的地。在每组的下面各有5个从该组的起点到该组的目的地的出行路线。对于其中一组，历史上有60个用户在电子地图软件中输入该起点和目的地，在给这些用户推送了5个出行路线a、b、c、d、e后，有40个用户选择出行路线a，10个用户选择出行路线b，5个用户选择出行路线c，3个用户选择出行路线d，2个用户选择出行路线e，则预设这些测试样本的排序结果为a、b、c、d、e。

从这些测试样本的出行路线中，可以获取预设的排序特征的数值。例如，在预设出行总时间、出行费用成本、步行距离、路线总距离作为预设的4个排序特征的情况下，获取到某测试样本的出行路线的出行总时间是30分钟，出行费用成本是5元，步行距离是0.5公里，路线总距离是50公里。

由于所述排序特征对应的特征权值已经通过机器学习算法得出，因此根据测试样本的排序特征的数值和所述机器学习算法输出的所述排序特征对应的特征权值，能获取测试样本的排序得分。具体做法是：用测试样本的排序特征的数值乘以该排序特征对应的特征权值(通过机器学习算法得出的特征权值)，得到排序特征的乘积值；获取所有排序特征的乘积值的和值作为所述测试样本的排序得分。

例如，假设某测试样本出行路线的出行总时间是30分钟，通过机器学习算法得出的出行总时间的权重是0.5/分钟；出行费用成本是5元，通过机器学习算法得出的出行费用成本的权重是2/元；步行距离是0.5公里，通过机器学习算法得出的步行距离的权重是4/公里；路线总距离是50公里，通过机器学习算法得出的路线总距离的权重是0.1/公里，则该测试样本的排序得分＝30×0.5+5×2+0.5×4+50×0.1＝15+10+2+5＝32。

然后，按照测试样本的排序得分，对所述测试样本进行排序。一般来说，是按照排序得分的降序进行排序。

例如，对于具有相同的起点和目的地的一组5个测试样本出行路线a、b、c、d、e，计算出的排序得分分别是30,32,35,27,20,排序的结果是e、d、a、b、c。

然后，将排序后的测试样本与预设的所述测试样本的排序结果进行比较，得到排序一致的比率值，若排序一致的比率值大于预设的比例阈值，则确定所述机器学习算法输出的特征权值是可信的。

仍以上面的例子为例。预设的已知的测试样本a、b、c、d、e的排序结果是a、b、c、d、e，实际排序后的排序结果是e、d、a、b、c，则排序结果不一致。由于有100组测试样本，每组都会有一个排序结果。如果有85组排序结果与该组预设的已知的排序结果一致，则排序一致的比例为85％。假设预设的比例阈值为80％，则确定所述机器学习算法输出的特征权值是可信的。

当确定所述机器学习算法输出的特征权值是可信的后，就可以将所述机器学习算法输出的特征权值投入使用，即应用到图1所示的公共出行路线的排序方法中。

由于本申请实施例排序特征对应的特征权值不是预先人为设定的，而是预先通过机器学习算法得到的，这样得到的特征权值使最终确定的出行路线的排序更加符合客观实际。

基于与方法同样的发明构思，如图2所示，根据本申请的一个实施例，还提供了一种公共出行路线的排序装置，所述装置包括：

公共出行路线规划单元101，用于根据设定的起点和目的地进行公共出行路线规划，获取从所述起点到所述目的地的公共出行路线；

排序特征数值获取单元102，用于若规划出的公共出行路线为两条以上，则从每条公共出行路线中，获取预设的排序特征的数值，所述排序特征至少有两个，一个排序特征代表一种路线成本影响因素；

排序得分获取单元103，用于根据公共出行路线的排序特征的数值和预设的排序特征对应的特征权值，获取公共出行路线的排序得分，所述排序特征对应的特征权值是预先通过机器学习算法得到的；

公共出行路线排序单元104，用于按照每条公共出行路线的排序得分，对所述两条以上的公共出行路线进行排序。

可选地，通过机器学习算法得到特征权值，具体包括：

从作为训练样本的每条历史公共出行路线中，获取预设的排序特征的数值构成该条公共出行路线的特征值向量；

用机器学习算法对所有训练样本的特征值向量进行训练，得到每个排序特征对应的特征权值。

可选地，所述特征权值通过机器学习算法得出后还经过测试过程，所述测试过程包括：

按照测试样本的排序得分，对所述测试样本进行排序；

可选地，所述机器学习算法为SVM算法，所述用机器学习算法对所有训练样本的特征值向量进行训练，得到每个排序特征对应的特征权值具体包括：

获取所有训练样本中具有相同的起点和终点的训练样本的特征向量值的特征向量差值；

调用LIBSVM库对所述特征向量差值进行学习，输出每个排序特征对应的特征权值。

可选地，所有训练样本是预先按起点和终点分组的，相同起点和终点的训练样本分为一组，则获取所有训练样本中具有相同的起点和终点的训练样本的特征向量值的特征向量差值具体包括：

针对每一组具有相同的起点和终点的训练样本执行如下操作：

可选地，排序得分获取单元具体用于：

用排序特征的数值乘以该排序特征对应的预设的特征权值，得到排序特征的乘积值；

获取所有排序特征的乘积值的和值作为所述公共出行路线的排序得分。

需要注意的是，本申请可在软件和/或软件与硬件的组合体中被实施，例如，本申请的各个装置可采用专用集成电路(ASIC)或任何其他类似硬件设备来实现。在一个实施例中，本申请的软件程序可以通过处理器执行以实现上文所述步骤或功能。同样地，本申请的软件程序(包括相关的数据结构)可以被存储到计算机可读记录介质中，例如，RAM存储器，磁或光驱动器或软磁盘及类似设备。另外，本申请的一些步骤或功能可采用硬件来实现，例如，作为与处理器配合从而执行各个步骤或功能的电路。

对于本领域技术人员而言，显然本申请不限于上述示范性实施例的细节，而且在不背离本申请的精神或基本特征的情况下，能够以其他的具体形式实现本申请。因此，无论从哪一点来看，均应将实施例看作是示范性的，而且是非限制性的，本申请的范围由所附权利要求而不是上述说明限定，因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本申请内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外，显然“包括”一词不排除其他单元或步骤，单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一，第二等词语用来表示名称，而并不表示任何特定的顺序。

虽然前面特别示出并且描述了示例性实施例，但是本领域技术人员将会理解的是，在不背离权利要求书的精神和范围的情况下，在其形式和细节方面可以有所变化。

Claims

1.一种公共出行路线的排序方法，其特征在于，所述方法包括：

按照每条公共出行路线的排序得分，对所述两条以上的公共出行路线进行排序，

其中，所述机器学习算法为SVM算法，

通过机器学习算法得到特征权值，具体包括：

用机器学习算法对所有训练样本的特征值向量进行训练，得到每个排序特征对应的特征权值，

所述用机器学习算法对所有训练样本的特征值向量进行训练，得到每个排序特征对应的特征权值，具体包括：

调用LIBSVM库对所述特征向量差值进行学习，输出每个排序特征对应的特征权值，

所有训练样本是预先按起点和终点分组的，相同起点和终点的训练样本分为一组，则获取所有训练样本中具有相同的起点和终点的训练样本的特征向量值的特征向量差值具体包括：

2.根据权利要求1所述的方法，其特征在于，所述特征权值通过机器学习算法得出后还经过测试过程，所述测试过程包括：

按照测试样本的排序得分，对所述测试样本进行排序；

3.根据权利要求1所述的方法，其特征在于，根据公共出行路线的排序特征的数值和预设的排序特征对应的特征权值，获取公共出行路线的排序得分具体包括：

4.一种公共出行路线的排序装置，其特征在于，所述装置包括：

公共出行路线排序单元，用于按照每条公共出行路线的排序得分，对所述两条以上的公共出行路线进行排序，

其中，所述机器学习算法为SVM算法，

通过机器学习算法得到特征权值，具体包括：

5.根据权利要求4所述的装置，其特征在于，所述特征权值通过机器学习算法得出后还经过测试过程，所述测试过程包括：

按照测试样本的排序得分，对所述测试样本进行排序；

6.根据权利要求4所述的装置，其特征在于，排序得分获取单元具体用于：