WO2017063356A1

WO2017063356A1 - 代驾订单预测方法和代驾运力调度方法

Info

Publication number: WO2017063356A1
Application number: PCT/CN2016/080350
Authority: WO
Inventors: 张磊; 钟小武
Original assignee: 深圳市天行家科技有限公司
Priority date: 2015-10-14
Filing date: 2016-04-27
Publication date: 2017-04-20
Also published as: CN105373840A; CN105373840B

Abstract

本发明公开代驾订单预测方法和代驾运力调度方法，可用于机场，代驾订单预测方法包括：建立各机场的历史订单数据库；根据订单变化相似度将机场进行区域聚类；对各区域类按照基础时间段内的订单量，将多个基础时间段进行时间段聚类，使每个区域类下形成不同的订单预测基准时间段；对每一区域类的每一订单预测基准时间段，提取相应的订单量和变化因子，采用BP神经网络进行非线性拟合，从而每一区域类的每一订单预测基准时间段都得到各自不同的订单预测模型；接收到订单预测请求时根据请求的区域类和订单预测基准时间段，选择对应的订单预测模型，结合变化因子预测出订单量。代驾运力调度方法根据上述订单预测结果来产生合理的司机分配方案。

Description

代驾订单预测方法和代驾运力调度方法

技术领域

本发明涉及代驾智能设备技术领域，尤其涉及一种基于数据挖掘技术的代驾订单预测方法和代驾运力调度方法。

背景技术

现如今，越来越多的人选择自驾前往机场乘坐飞机出行，然而，自驾去机场时停车会遇到如下问题：

1、浪费时间：相较于乘坐地铁、的士等交通工具的人而言，需要花费停车过程的时间，尤其是机场客流量大、停车场时常处于饱和状态，导致停车过程会耽误预料之外的宝贵时间，甚至误机。返程回来时，还可能忘记车辆停放位置，给自驾车主带来很大的麻烦；

2、费用昂贵：由于机场停车场的独占性和垄断性，导致机场停车费用昂贵；

3、车辆无人照料：车辆停放于机场而车主出行的期间，车辆无人照料，同时还成为了一种闲置资源。

基于上述机场停车所存在的问题，机场代驾服务应运而生，自驾来机场的车主可以通过选择代驾，付出一点小费，以省去停车所耽误的宝贵时间，同时车辆还能得到很好的看护。最初的机场代驾服务大致是：自驾车主电话咨询代驾服务台，服务台向代驾司机播报需求信息，代驾司机接单后去给车主代驾。但这种方式一方面响应不及时，另一方面可能导致多个代驾司机重复接单甚至抢单的情况发生。

随着技术的不断发展，以及智能电子设备的普及，诸如智能导航设备、智能手机的普及，代驾模式也发生了较大的变革，从最初的电话咨询变为网络或移动终端APP咨询，衍生了许多代驾软件，例如e代驾、滴滴代驾、E都市等。但这些代驾软件存在下列问题：

1)大部分代驾软件对订单量的预估和分析做得不到位，导致司机分配不合理，并且，对代驾司机的动态调度算法仍存在缺陷，导致有些司机时常空闲而有些司机分配订单过多而耽误车主，导致顾客体验不佳，订单量下降，司机资源利用不合理。

2)大部分代驾软件都是面向全部城市群体，市场上缺少针对特定区域(例如机场、高铁站、码头渡口等)、特定方向的专门代驾服务。

发明内容

本发明的主要目的在于提出一种代驾订单预测方法，基于数据挖掘技术，对历史订单情况进行多维度分析，更准确地预测订单，以解决现有技术因对订单的预估和分析不到位而导致的代驾司机分配不合理的技术问题。

本发明解决上述技术问题的技术方案如下：

一种代驾订单预测方法，用于预定场所，包括以下步骤：

S1、分别获取多个预定场所在一历史期间内的代驾订单数据并进行数据预处理，以分别建立各预定场所的订单数据库；

S2、基于每个预定场所的所述订单数据库，将所述多个预定场所按照订单变化相似度进行区域聚类，使得所述多个预定场所归于不同的区域类；

S3、对于每个所述区域类，都执行以下操作：将一天均匀划分为多个基础时间段，从所述订单数据库中获取同一区域类中的预定场所在所述历史期间内的每一天的每一所述基础时间段中的订单量，根据各所述基础时间段内的订单量将所述多个基础时间段进行时间段聚类，以使所述多个基础时间段聚类至不同的订单预测基准时间段；

S4、针对每一区域类中的每一订单预测基准时间段，都执行以下操作：提取一订单预测基准时间段内的订单数据和相应的变化因子，并输入BP神经网络进行非线性拟合，以获得每一区域类中的每一订单预测基准时间段的订单预测模型；

S5、接收订单预测请求，判断所述订单预测请求来自哪个区域类以及请求预测的时间属于哪个订单预测基准时间段，以选择相应区域类下相应订单预测基准时间段的订单预测模型，并获取所述订单预测请求中的变化因子以供所对应的订单预测模型进行订单量预测。

采用上述代驾订单预测方法来预测一些特定场所(即所述预定场所)例如机场、码头、渡口、高铁站等的代驾订单，至少具有以下优势：

1)由于本发明所使用的预定场所有多种类型，并且分布于全国甚至世界各地，存在很大的差异性，因此本发明通过区域聚类将很多个预定场所进行分类，属于同一区域类的预定场所的数据可以采用一个算法流程，减少并行执行的算法数量，更重要的是，将预定场所进行归类，使得一个算法流程中的数据量大大增加，因而增加了预测结果的准确性；

2)由于本发明中的代驾订单预测，订单量的多少所取决的自变因素较多，包括但不限于天气，订单量与这些自变因素之间的关系应当是非常复杂的非线性关系，因此采用BP神经网络来对订单预测模型的生成进行非线性拟合，能够获得更加合理的订单预测模型，以更加准确地预测代驾订单。

更进一步地，所述步骤S1中的所述数据预处理包括：

提取所述代驾订单数据中的关键信息，所述关键信息至少包括所述历史期间内每天的预约订单量、约定执行时间、订单实际执行时间、取消订单量以及取消订单原因；计算每个成功执行的订单的顾客等待时间。

更进一步地，所述步骤S2具体包括：

S21、基于每个所述预定场所的所述订单数据库，将所述历史期间内订单量的变化采用三方向链码来描述，以建立各所述预定场所的变化描述序列；

S22、对所述多个预定场所，采用所述变化描述序列计算两两之间的编辑距离；

S23、根据编辑距离来判断所述订单变化相似度以将所述多个预定场所进行区域类的划分。

更进一步地，所述步骤S22具体包括：

选取待计算的两个预定场所A和B的变化描述序列string₁与string₂，计算变化描述序列string₁中的第i个链码string₁(i)与变化描述序列string₂中的第j个链码string₂(j)之间的链码编辑距离edit(i，j)，其中0≤i≤L1，0≤j≤L2，L1和L2分别表示变化描述序列string₁、string₂的总长度；

初始化一个L1×L2的矩阵D，采用如下公式计算所述链码编辑距离edit(i，j)来填充矩阵D：

经过上述公式计算得到完整的L1×L2的矩阵D，并且，矩阵D中的元素D(L1，L2)即为两个所述预定场所A与B之间的编辑距离edit_AB；

按照上述方法，计算任意两个所述预定场所的编辑距离，共得到

个编辑距离，其中E为预定场所的总个数；

所述步骤S23具体包括：对步骤S22中得到的

个编辑距离采用迭代自组织数据分析算法进行聚类，以使得E个预定场所按照订单变化相似度划分为不同的区域类。

更进一步地，所述三方向链码包括0、1、2：订单量比前一天增加并且增加的值大于第一阈值时用链码2表示“上升”；订单量比前一天减少并且减少的值大于所述第一阈值时用链码0表示“下降”；订单量与前一天相比不变，或者增大但增大的值小于所述第一阈值，或者减小但减小的值小于所述第一阈值时，用链码1表示“不变”。

更进一步地，所述步骤S3中所述基础时间段的时长不小于所述顾客等待时间；

所述步骤S3中进行所述时间段聚类具体包括：

S31、对每一区域类都执行以下操作：统计一区域类中的所有所述预定场所每一天在每一基础时间段内的订单量，分别以各所述基础时间段和每一基础时间段内对应的订单量为维度数据建立二维向量X(r，h)，则该区域类存在y＝F×H个二维向量X₁，X₂，X₃，L，X_y，其中H为所述基础时间段的个数，F为所述历史期间所含的天数；

S32、对每一个区域类均执行以下操作：将每个二维向量中各维度的数据进行标准化以统一量纲，标准化公式

其中x_min、x_max分别为y个二维向量中同一维度数据中的最小值和最大值，从而得到y个标准化后的二维向量

S33、对于每一个区域类，采用最近邻聚类方法，基于欧氏距离对步骤S32中标准化后得到的y个二维向量

进行聚类，得到基于订单量相似程度的m个向量样本类；

S34、统计一基础时间段在m个向量样本类中分别拥有多少订单量，然后将该基础时间段归类于出现订单量最多的一个向量样本类中；

S35、对每个基础时间段都执行步骤S34后，使得每个向量样本类中的基础时间段在时间上连续，并且各向量样本类中不存在重叠的基础时间段；然后对m个向量样本类分别进行基础时间段的合并，从而形成m个所述订单预测基准时间段。

更进一步地，所述步骤S4中提取一订单预测基准时间段内的订单数据包括：对于一区域类中的每个预定场所，提取所述历史期间内的每一天的该订单预测基准时间段内的订单量及对应的日期；所述变化因子至少包括每一天的该订单预测基准时间段的天气情况。

更进一步地，所述步骤S4中采用BP神经网络进行非线性拟合具体包括：

选择神经元的输入输出对照公式以及激活函数；

定义BP神经网络的层数以及各层的神经元数；

将一区域类中的一订单预测基准时间段内的所述订单数据及所述变化因子放入BP神经网络进行训练，即可得到该区域类中的该订单预测基准时间段的所述订单预测模型。

更进一步地，在步骤S1之前还包括步骤S0：将代驾订单依据路线的不同分为不同的代驾类型，并对各所述代驾类型的代驾订单也执行步骤S1至S4；

并且，步骤S5中在接收到订单预测请求时，还需判断所述订单预测请求中的代驾订单属于何种代驾类型，以选择相应代驾类型下相应区域类中相应订单预测基准时间段的订单预测模型。

总之，本发明所提供的上述代驾订单预测方法，针对某些预定场所，通过数据挖掘技术来对历史订单数据进行深层分析，对订单进行有效合理的预测，以对代驾司机进行合理的调度，使代驾司机的利用率得以有效的提高。

另，本发明还提供一种代驾运力调度方法，包括：采用前述的代驾订单预测方法来预测订单；根据订单预测结果，产生代驾司机调度方案，所述调度方案为：代驾司机人数为预测的订单量的一预定倍数，所述预定倍数大于1。将该代驾运力调度方法用于所述预定场所，根据上述代驾订单预测方法所预测的订单结果，对司机进行合理的调度分配，以提高执行效率，提高客户满意度。

具体实施方式

下面结合优选的实施方式对本发明作进一步说明。

本发明的具体实施方式提供一种基于数据挖掘技术的代驾运力调度方法，用于某些特定场所(例如机场、高铁站、渡口、码头等，不限于此)，通过对这些特定场所在任意时间段的订单量进行预测，并基于预测结果给出合理的代驾司机调度方案，以高效地为需要找代驾的车主服务，同时使代驾司机的利用率(即代驾司机执行代驾任务的几率)尽可能高。

所述代驾运力调度方法主要包括两大步骤：代驾订单预测和代驾司机调度，下面以预定场所系机场为例对如何进行代驾订单预测和代驾司机调度进行详细的说明。

一种代驾订单预测方法，包括以下步骤S1至S5：

在一种具体的实施例中，预定场所以机场为例，那么，步骤S1中所述的多个预定场所例如可以包括深圳机场、广州机场、北京机场以及香港机场等。则步骤S1具体包括：从现有的机场代驾预约系统中提取系统运行前期的历史订单数据，例如，分别提取机场A1、机场A2、机场A3、…、机场A10(此处的机场个数仅仅是列举，不构成对本发明的限制，只要是使用机场代驾预约系统的机场都可以)在当天的前300天内(此处的历史期间＝300天仅仅是列举，不构成对本发明的限制)的订单数据，然后从这些订单数据中提取关键信息，所述关键信息至少包括这300天内每天的预约订单量YYDDL、约定执行时间YDZXSJ、订单实际执行时间SJZX、取消订单量QXL以及取消订单原因QXYY，同时，还需要计算每个成功执行的订单的顾客等待时间DDSJ，其中，顾客等待时间

其中

为所有订单的约定执行时间与订单实际执行时间之间的时间差的平均值，μ是本着顾客至上的原则而在实际等待时间的基础上进行适当的夸大，即μ＞1但也不宜过大，在1～1.5之间最佳。从而，每一个机场就产生如下表1所示的订单数据库：

	YYDDL	YDZXSJ	SJZX	QXL	QXYY	DDSJ
第1天
第2天
……
第300天

表1

在表1中，“第1天”表示这300天中最早的一天，以此类推，“第300天”为当天的前一天。

接上例，所述步骤S2进行区域聚类的方法具体包括：

对每个机场的上述订单数据库，将300天内相邻两天之间的订单量变化采用三方向链码来描述，以建立各机场的订单变化描述序列。例如：机场A1在这300 天中，第1天至第300天的订单量数组为{50，70，55，100，……，280，100}，该数组共300个元素，第一个元素50即表示机场A1在所述第1天内的订单量。三方向链码为0、1、2，当后一天的订单量减去前一天的订单量所得差值Δd大于一第一阈值时，用链码“2”表示上升；当差值Ad小于一第二阈值时，用链码“0”表示下降；当差值Δd位于第二阈值与第一阈值之间时，用链码“1”表示订单量不变，其中，所述第一阈值为正数，例如可以是10、20等，视情况而定义，所述第二阈值为负数，例如可以是-10、-20等，视情况而定义。例如，若第一阈值和第二阈值分别为10和-10，则对于上述订单量数组{50，70，55，60，……，280，100}，第1天与第2天之间的订单量变化则用链码2表示，第2天与第3天之间的订单量变化则用链码0表示，第3天与第4天之间的订单量变化用链码1表示，以同样的方法计算，可将机场A1在300天内的订单量变化用一个长度为299的三方向链码串(即订单变化描述序列)来表示。

采用上述同样的方法，对机场A2至A10在300天内的订单变化也采用基于三方向链码的订单变化描述序列来表示。从而得到10个分别对应机场A1至A10的长度为299的订单变化描述序列。

接着，计算10个机场两两之间的编辑距离，以判断两机场之间的订单变化相似度。以计算机场A1和A2之间的编辑距离为例来说明：

1)选取机场A1和机场A2的订单变化描述序列string₁与string₂，先计算序列string₁中的第i个链码string₁(i)与序列string₂中的第j个链码string₂(j)之间的链码编辑距离edit(i，j)，其中i和j的取值在0与序列长度299之间；

2)初始化一个299×299的矩阵D，采用如下公式计算所述链码编辑距离edit(i，j)，并用链码编辑距离edit(i，j)来填充矩阵D：

经过上述公式计算得到完整的矩阵D，如下：

	string₁(1)	string₁(2)	string₁(3)	……	string₁(299)
string₂(1)	edit(1，1)	edit(2，1)	edit(3，1)	……	edit(299，1)
string₂(2)	edit(1，2)	edit(2，2)	edit(3，2)	……	edit(299，2)
string₂(3)	edit(1，3)	edit(2，3)	edit(3，3)	……	edit(299，3)
……	……	……	……	……	……
string₂(299)	edit(1，299)	edit(2，299)	edit(3，299)	……	edit(299，299)

并且，矩阵D中的元素D(299，299)＝edit(299，299)即为机场A1与机场A2之间的编辑距离

按照上述方法计算任意两个机场之间的编辑距离，从而10个机场A1～A10之间，即可存在

个编辑距离。

对上述求得的45个编辑距离采用迭代自组织分析算法ISODATA进行聚类，以将10个机场进行区域聚类。此处也可以采用其他聚类方法，只不过ISODATA聚类方法可以自适应选择聚类数量，使最终的聚类结果更加合理、紧凑。由于ISODATA聚类算法属于现有技术，具体的聚类过程在此不再赘述。

从而，将10个机场A1～A10基于订单变化相似度分成不同的区域类，假设将这10个机场进行所述区域聚类后分为三个区域类：B1(A2、A3、A6)、B2(A1、A8、A9、A10)、B3(A4、A5、A7)。则对10个机场的后续数据处理将以区域类来聚类执行，即对区域类B1、B2、B3都将按照同样的算法流程来并行执行；而同一区域类中的多个机场的数据将集中到一个算法流程，不再每个机场分别执行算法。

下面将对每一区域类进行步骤S3中所述的时间段聚类，以区域类B1(机场A2、机场A3、机场A6)为例来说明如何进行时间段聚类：

步骤1、将一天均分为多个基础时间段，基础时间段的时长应当不小于所述顾客等待时间，在此例子中，将一天分为24个基础时间段0，1，2，……，23，其中0表示0点至1点之间的时间段，1表示1点至2点之间的时间段，以此类推；

步骤2、从订单数据库中获取机场A2、机场A3、机场A6在300天内的每一天的每一所述基础时间段中的订单量之和，即可得到以基础时间段和相应订单量为维度数据建立的二维向量X(r，h)，其中h表示24个基础时间段中的某一基础时间段，r表示某一天中该基础时间段内三个机场的订单量之和。即可得到y个(此处y＝F×H＝300×24＝7200)二维向量X₁，X₂，X₃，L，X_y，例如向量X₁(300，0)表示300天内第1天(日期最早的一天)中的0点至1点之间三个机场A2、A3、A6的订单总量为300个，X₂(200，1)表示所述第1天中的1点至2点之间上述三个机场的订单总量为200个，X₂₅(200，0)表示第2天中的0点至1点之间上述三个机场的订单总量为200个，以此类推；

步骤3、对以上y个二维向量的各个维度数据进行标准化，以统一量纲，消除因为量纲不同带来的极大误差。标准化公式

步骤4、采用最近邻聚类方法，基于欧氏距离对上述步骤3中得到的y个二维向量

进行聚类，得到基于订单量相似程度的m个向量样本类。具体地，首先设定欧氏距离的非负阈值V，从y个二维向量

中随机选取一个向量

作为聚类中心Z₁，假设u＝1即

那么，计算向量

与聚类中心Z₁之间的欧氏距离d₁₂：

若d₁₂＞V，则新建一个聚类中心Z₂，且

再比较向量

与聚类中心Z₁、Z₂的距离d₁₃、d₂₃，若d₁₃和d₂₃均大于V，则再新建一个聚类中心Z₃且

继续进行比较；若d₁₃和d₂₃均小于V，且d₁₃＜d₂₃＜V，则说明向量

距离聚类中心Z₁更近，

应当与

同属一类；而若d₂₃＜d₁₃＜V，则说明向量

距离聚类中心Z₂更近，

应当与

同属一类；

如果d₁₂＜V，则说明

是在以Z₁为中心以V为半径的超球体聚类簇中，即

和

同属一类，再比较

与Z₁之间的距离d₁₃，若d₁₃＞V则新建一个聚类中心Z₂，且

再比较

与聚类中心Z₁、Z₂的欧式距离；

采用同样的方法不断进行比较、聚类，最终将y个二维向量

聚类成为基于订单量相似程度的m个向量样本类C₁、C₂、……、C_m；在每一个向量样本类中，向量数不一定相同。

步骤5、统计一基础时间段在m个向量样本类中分别拥有多少订单量，然后将该基础时间段归类于出现订单量最多的一个向量样本类中。在本例中，由于选取了300天，每种基础时间段存在300个向量，可能分散于多个向量样本类中，并不能确定某个基础时间段到底最终应当归于哪个向量样本类，因此采用最大隶属度原则，统计每个基础时间段在m个向量样本类中分别拥有多少个订单量，例如，属于基础时间段0的300个向量分散于向量样本类C₁和C₂，但是在C₁中，基础时间段0的订单总量为200，而在C₂中为30，则基础时间段0应当归于向量样本类C₁中而不属于C₂。以同样的方法对每个基础时间段进行归类，最终得到的m个向量样本类中，不存在重复的基础时间段，且每个向量样本类中的基础时间段是连续的，将每个向量样本类中连续的基础时间段合并，即可得到m个订单预测基准时间段。例如，采用最大隶属度原则归类后得到的m个向量样本类，例如m＝3，得到{(0，100)，(1，200)，(2，300)}、{(3，10)，(4，25)，(5，50)}、{(6，500)，(7，500)，(8，600)，……，(23，500)}，从而得到三个订单预测基准时间段0～2、3～5、6～23，即表示对于区域类B1，其三个机场A2、A3、A6中的任一个机场在时间段0～2内采用同一个订单预测模型，而在时间段3～5采用另一个订单预测模型，在时间段6～23又采用不同的订单预测模型。

对于不同的区域类，不同的订单预测基准时间段，订单预测模型将不同。下面将详述如何生成订单预测模型：

提取某一区域类中的某一订单预测基准时间段内的订单数据和相应的变化因子，并输入BP神经网络进行非线性拟合，即可获得该区域类中的该订单预测基准时间段的订单预测模型。例如：获取区域类B1中订单预测基准时间段0～2所对应的订单预测模型，首先提取区域类B1中各机场在300天内每一天的0点～2点之间的订单量，以及每个订单对应的日期、该日期中0点～2点期间的天气情况，将所提取的这些数据输入至BP神经网络进行训练(采用非线性拟合)，以获得区域类B1在订单预测基准时间段0～2的订单预测模型。应当说明，在将所提取的数据输入至BP神经网络之前，需要针对待输入的数据来设计BP神经网络的层数、每层的神经元数、神经元的输入输出对照公式以及激活函数。在一种优选的实施例中，神经元的输入和输出对照公式为：

y_i＝f(net_i)，其中，激活函数选择为S形函数(Sigmoid Function)：

x₁＝t；x₂＝w；x₃＝a。而BP神经网络的层数可如此确定：基于区域类的不同，定义一层，该层的神经元个数即为区域类的个数；基于各区域类中具有多个不同的订单预测基准时间段，再定义一层，该层的神经元个数为订单预测基准时间段的个数；而输入层，以上述为例，需输入订单数量(指的是某一区域、某一订单预测基准时间段的订单数量)、日期、天气，因此输入层的神经元个数为3。

采用上述方法BP神经网络的方法，就能够得到不同区域类不同订单预测基准时间段的订单预测模型。根据订单预测请求，判断所述订单预测请求来自哪个区域类以及请求预测的时间属于哪个订单预测基准时间段，以选择相应区域类下相应订单预测基准时间段的订单预测模型，并获取所述订单预测请求中的变化因子例如天气，然后即可运行该订单预测模型来预测订单量。

在另一些实施例中，假如代驾订单不只有一种类型，根据路线的不同会有多种订单类型，例如有两种：航站楼→停车场，停车场→航站楼，对于此种情况，可先将代驾订单进行分类，然后在步骤S1中获取代驾订单数据时需要获取属于同类代驾订单的数据，这样一来，订单预测模型种类将会更多，每一订单类型中的每一区域类下的每一订单预测基准时间段都将对应不同的订单预测模型。在步骤S5中接收到订单预测请求时就还需要判断代驾订单属于那种类型(例如是航站楼→停车场，还是停车场→航站楼)。

还提供一种代驾运力调度方法，在通过前述的代驾订单预测方法进行较为准确的订单预测的基础上，可以对代驾司机进行合理的调配。例如，某一机场接收到预测结果显示某一时间段停车场→航站楼的订单量为20，那么，系统将分配 25个代驾司机于该时间段内停车场等候，之所以代驾司机人数多于订单量，是为了防止车主找不到司机，造成顾客体验不好。

在一些优选的实施例中，可以通过一定的系统规则设定，防止一人重复下单，司机重复接单，顾客过度等待等情况发生。同时引入打分机制，顾客可以对乘务司机进行评分，对于表现不积极、态度恶劣或送车泊车慢的司机进行处理。具体如下：

①通过获取顾客订单的手机号以及手机IMEI序列码作为该顾客订单的唯一标识ID，那么当该顾客多次下单，或者使用同一手机不同手机号(有可能顾客手机为双卡双待)下单时，就可以判定为同一订单，这样防止重复下单，减少订单冗余和误操作率。

②当司机在终端确认接单后，服务器迅速响应，在订单通告中将该订单信息进行删除，防止多个司机接单情况发生，同时对该订单的接客司机进行记录。

③顾客订单完成后，可以对待客司机进行评价打分，后期对于打分过低的司机需要进行学习培训在上岗，举报特别多的司机予以严肃处理。减少顾客过度等待的情况。

以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明，不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的技术人员来说，在不脱离本发明构思的前提下，还可以做出若干等同替代或明显变型，而且性能或用途相同，都应当视为属于本发明的保护范围。

Claims

一种代驾订单预测方法，用于预定场所，其特征在于：包括以下步骤：

S1、分别获取多个预定场所在一历史期间内的代驾订单数据并进行数据预处理，以分别建立各预定场所的订单数据库；

S2、基于每个预定场所的所述订单数据库，将所述多个预定场所按照订单变化相似度进行区域聚类，使得所述多个预定场所归于不同的区域类；

S3、对于每个所述区域类，都执行以下操作：将一天均匀划分为多个基础时间段，从所述订单数据库中获取同一区域类中的预定场所在所述历史期间内的每一天的每一所述基础时间段中的订单量，根据各所述基础时间段内的订单量将所述多个基础时间段进行时间段聚类，以使所述多个基础时间段聚类至不同的订单预测基准时间段；

S4、针对每一区域类中的每一订单预测基准时间段，都执行以下操作：提取一订单预测基准时间段内的订单数据和相应的变化因子，并输入BP神经网络进行非线性拟合，以获得每一区域类中的每一订单预测基准时间段的订单预测模型；

S5、接收订单预测请求，判断所述订单预测请求来自哪个区域类以及请求预测的时间属于哪个订单预测基准时间段，以选择相应区域类下相应订单预测基准时间段的订单预测模型，并获取所述订单预测请求中的变化因子以供所对应的订单预测模型进行订单量预测。
如权利要求1所述的代驾订单预测方法，其特征在于：所述步骤S1中的所述数据预处理包括：

提取所述代驾订单数据中的关键信息，所述关键信息至少包括所述历史期间内每天的预约订单量、约定执行时间、订单实际执行时间、取消订单量以及取消订单原因；计算每个成功执行的订单的顾客等待时间。
如权利要求1所述的代驾订单预测方法，其特征在于：所述步骤S2具体包括：

S21、基于每个所述预定场所的所述订单数据库，将所述历史期间内订单量的变化采用三方向链码来描述，以建立各所述预定场所的变化描述序列；

S22、对所述多个预定场所，采用所述变化描述序列计算两两之间的编辑距离；

S23、根据编辑距离来判断所述订单变化相似度以将所述多个预定场所进行区域类的划分。
如权利要求3所述的代驾订单预测方法，其特征在于：所述步骤S22具体包括：

选取待计算的两个预定场所A和B的变化描述序列string₁与string₂，计算变化描述序列string₁中的第i个链码string₁(i)与变化描述序列string₂中的第j个链码string₂(j)之间的链码编辑距离edit(i，j)，其中0≤i≤L1，0≤j≤L2，L1和L2分别表示变化描述序列string₁、string₂的总长度；

初始化一个L1×L2的矩阵D，采用如下公式计算所述链码编辑距离edit(i，j)来填充矩阵D：

经过上述公式计算得到完整的L1×L2的矩阵D，并且，矩阵D中的元素D(L1，L2)即为两个所述预定场所A与B之间的编辑距离edit_AB；

按照上述方法，计算任意两个所述预定场所的编辑距离，共得到
个编辑距离，其中E为预定场所的总个数；

所述步骤S23具体包括：对步骤S22中得到的
个编辑距离采用迭代自组织数据分析算法进行聚类，以使得E个预定场所按照订单变化相似度划分为不同的区域类。
如权利要求4所述的代驾订单预测方法，其特征在于：所述三方向链码包括0、1、2：订单量比前一天增加并且增加的值大于第一阈值时用链码2表示“上升”；订单量比前一天减少并且减少的值大于所述第一阈值时用链码0表示“下降”；订单量与前一天相比不变，或者增大但增大的值小于所述第一阈值，或者减小但减小的值小于所述第一阈值时，用链码1表示“不变”。
如权利要求2所述的代驾订单预测方法，其特征在于：所述步骤S3中所述基础时间段的时长不小于所述顾客等待时间；

所述步骤S3中进行所述时间段聚类具体包括：

S31、对每一区域类都执行以下操作：统计一区域类中的所有所述预定场所每一天在每一基础时间段内的订单量，分别以各所述基础时间段和每一基础时间段内对应的订单量为维度数据建立二维向量X(r，h)，则该区域类存在y＝F×H个二维向量X₁，X₂，X₃，L，X_y，其中H为所述基础时间段的个数，F为所述历史期间所含的天数；

S32、对每一个区域类均执行以下操作：将每个二维向量中各维度的数据进行标准化以统一量纲，标准化公式
其中x_min、x_max分别为y个二维向量中同一维度数据中的最小值和最大值，从而得到y个标准化后的二维向量

S33、对于每一个区域类，采用最近邻聚类方法，基于欧氏距离对步骤S32中标准化后得到的y个二维向量
进行聚类，得到基于订单量相似程度的m个向量样本类；

S34、统计一基础时间段在m个向量样本类中分别拥有多少订单量，然后将该基础时间段归类于出现订单量最多的一个向量样本类中；

S35、对每个基础时间段都执行步骤S34后，使得每个向量样本类中的基础时间段在时间上连续，并且各向量样本类中不存在重叠的基础时间段；然后对m个向量样本类分别进行基础时间段的合并，从而形成m个所述订单预测基准时间段。
如权利要求1所述的代驾订单预测方法，其特征在于：所述步骤S4中提取一订单预测基准时间段内的订单数据包括：对于一区域类中的每个预定场所，提取所述历史期间内的每一天的该订单预测基准时间段内的订单量及对应的日期；所述变化因子至少包括每一天的该订单预测基准时间段的天气情况。
如权利要求7所述的代驾订单预测方法，其特征在于：所述步骤S4中采用BP神经网络进行非线性拟合具体包括：

选择神经元的输入输出对照公式以及激活函数；

定义BP神经网络的层数以及各层的神经元数；

将一区域类中的一订单预测基准时间段内的所述订单数据及所述变化因子放入BP神经网络进行训练，即可得到该区域类中的该订单预测基准时间段的所述订单预测模型。
如权利要求1所述的代驾订单预测方法，其特征在于：在步骤S1之前还包括步骤S0：将代驾订单依据路线的不同分为不同的代驾类型，并对各所述代驾类型的代驾订单也执行步骤S1至S4；

并且，步骤S5中在接收到订单预测请求时，还需判断所述订单预测请求中的代驾订单属于何种代驾类型，以选择相应代驾类型下相应区域类中相应订单预测基准时间段的订单预测模型。
一种代驾运力调度方法，其特征在于：包括以下步骤：

采用如权利要求1至9任一项所述的代驾订单预测方法来预测订单；

根据订单预测结果，产生代驾司机调度方案，所述调度方案为：代驾司机人数为预测的订单量的一预定倍数，所述预定倍数大于1。