CN113821535A

CN113821535A - 一种模型训练的方法及装置、计算机设备和存储介质

Info

Publication number: CN113821535A
Application number: CN202110800469.3A
Authority: CN
Inventors: 姜正申
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2021-07-15
Filing date: 2021-07-15
Publication date: 2021-12-21

Abstract

本申请公开了一种模型训练的方法及装置、计算机设备和存储介质，包括：获取第一路线整体特征集合以及第一实际到达时间集合，根据第一路线整体特征集合通过待训练时间预估模型得到第一预估到达时间集合，根据第一预估到达时间集合与第一实际到达时间集合得到第一导数集合，根据从标准正态分布中确定的随机数，对第一导数集合进行随机扰动处理，得到随机扰动处理后的第一导数集合，基于第一预估到达时间集合与随机扰动处理后的第一导数集合对待训练时间预估模型进行训练。通过上述方法，能够避免在迭代过程中所得到的预估时间落在不稳定的奇点上，所得到的时间预估模型能够更为可靠以及准确，因此通过该时间预估模型能够更为准确的获取到达时间。

Description

一种模型训练的方法及装置、计算机设备和存储介质

技术领域

本申请涉及人工智能领域中的机器学习领域，尤其涉及一种模型训练的方法及装置、计算机设备和存储介质。

背景技术

到达时间的预估(estimated time of arrival，ETA)是地图中的功能，它能根据给定地图上的一条路线和出发时间，预估出走完这条路线所需要的时间。

目前，在ETA预估的领域，包括基于规则的逐路段累加方法，该方法需要根据每个路段的长度、速度、红绿灯等状况，估计出每个路段的通过时间，再加上每个路口的通过时间，这样累加起来，就构成了整条路线的总时间。然而，该方法对人工经验的依赖很强，并且在实际应用中，路况十分复杂，人为设定的规则无法覆盖各种情形，导致每个路段预估时间出现误差，且该方法需要将各路段的预估时间进行累加，导致每个路段预估时间的误差也会进行累积，使得最终所确定到达时间的不够准确，因此，如何更为准确的获取到达时间成为需要解决的问题。

发明内容

本申请实施例提供了一种模型训练的方法及装置、计算机设备和存储介质，由于对路线样本对应的第一导数进行随机扰动处理，根据随机扰动处理后的第一导数对待训练时间预估模型进行训练，能够避免在迭代过程中所得到的预估时间落在不稳定的奇点上，从而使得所得到的预估时间能够向更接近于真实时间，因此所得到的时间预估模型能够更为可靠以及准确，而通过该时间预估模型确定出发地至到达地的通行时间，能够更为准确的获取到达时间。

有鉴于此，本申请第一方面提供了一种模型训练的方法，包括：

获取第一路线整体特征集合以及第一实际到达时间集合，其中，第一路线整体特征集合包括S条第一路线样本分别对应的路线整体特征，第一实际到达时间集合包括S条第一路线样本分别对应的实际到达时间，第一路线样本对应的路线整体特征为与第一路线样本的通行时间相关的特征，S为整数，S＞1；

根据第一路线整体特征集合通过待训练时间预估模型得到第一预估到达时间集合，其中，第一预估到达时间集合包括S条第一路线样本分别对应的第一预估到达时间；

根据第一预估到达时间集合与第一实际到达时间集合得到第一导数集合，其中，第一导数集合包括S条第一路线样本分别对应的第一导数，第一导数是基于损失函数确定的；

根据从标准正态分布中确定的随机数，对第一导数集合进行随机扰动处理，得到随机扰动处理后的第一导数集合；

基于第一预估到达时间集合与随机扰动处理后的第一导数集合对待训练时间预估模型进行训练。

本申请第二方面提供了一种模型训练装置，包括：

获取模块，用于获取第一路线整体特征集合以及第一实际到达时间集合，其中，第一路线整体特征集合包括S条第一路线样本分别对应的路线整体特征，第一实际到达时间集合包括S条第一路线样本分别对应的实际到达时间，第一路线样本对应的路线整体特征为与第一路线样本的通行时间相关的特征，S为整数，S＞1；

生成模块，用于根据第一路线整体特征集合通过待训练时间预估模型得到第一预估到达时间集合，其中，第一预估到达时间集合包括S条第一路线样本分别对应的第一预估到达时间；

生成模块，还用于根据第一预估到达时间集合与第一实际到达时间集合得到第一导数集合，其中，第一导数集合包括S条第一路线样本分别对应的第一导数，第一导数是基于损失函数确定的；

处理模块，用于根据从标准正态分布中确定的随机数，对第一导数集合进行随机扰动处理，得到随机扰动处理后的第一导数集合；

训练模块，用于基于第一预估到达时间集合与随机扰动处理后的第一导数集合对待训练时间预估模型进行训练。

在一个可能的实施方式中，模型训练装置还包括确定模块；

生成模块，还用于根据第一路线整体特征集合通过待训练时间预估模型得到第二预估到达时间集合；

确定模块，用于基于所述第一预估到达时间集合以及所述第二预估到达时间集合确定第三预估到达时间集合；

生成模块，还用于根据第三预估到达时间集合与第一实际到达时间集合得到第二导数集合，其中，第二导数集合包括S条第一路线样本分别对应的第二导数，第二导数是基于损失函数确定的；

处理模块，还用于根据从标准正态分布中确定的随机数，对第二导数集合进行随机扰动处理，得到随机扰动处理后的第二导数集合。

在一个可能的实施方式中，生成模块，具体用于根据第一路线整体特征集合通过待训练第一学习器得到第一预估到达时间集合；

生成模块，具体用于根据第一路线整体特征集合通过待训练第二学习器得到第二预估到达时间集合；

训练模块，具体用于基于第一预估到达时间集合与随机扰动处理后的第一导数集合对待训练第一学习器进行训练；

基于第三预估到达时间集合与随机扰动处理后的第二导数集合对待训练第二学习器进行训练。

在一个可能的实施方式中，处理模块，还用于对第一预估到达时间集合进行初始化处理，以得到初始化后的第一预估到达时间集合；

生成模块，具体用于根据初始化后的第一预估到达时间集合与第一实际到达时间集合得到第一导数集合；

训练模块，具体用于基于初始化后的第一预估到达时间集合与随机扰动处理后的第一导数集合对待训练时间预估模型进行训练。

在一个可能的实施方式中，初始化处理为将每个第一预估到达时间与预设数值相加，或，将每个第一预估到达时间与属于预设范围内的数值相加，或，将每个第一预估到达时间与实际到达时间的均值相加。

在一个可能的实施方式中，模型训练装置还包括采样模块；

获取模块，还用于获取K条第二路线样本，其中，K为整数，K＞S；

采样模块，用于对K条第二路线样本进行采样，得到S条第一路线样本。

在一个可能的实施方式中，时间预估模型包括N个学习器，N为整数，且N≥1；

获取模块，还用于获取P条第三路线样本，其中，P条第三路线样本与S条第一路线样本不重合，P为整数，P≥1；

获取模块，还用于获取第二路线整体特征集合以及第二实际到达时间集合，其中，第二路线整体特征集合包括P条第三路线样本分别对应的路线整体特征，第二实际到达时间集合包括P条第三路线样本分别对应的实际到达时间，第三路线样本对应的路线整体特征为与第三路线样本的通行时间相关的特征，

获取模块，还用于从时间预估模型中获取M个学习器，其中，M为整数，且1≤M＜N；

生成模块，还用于根据第二路线整体特征集合通过M个学习器得到第四预估到达时间集合；

生成模块，还用于根据第二路线整体特征集合通过待训练第三学习器得到第五预估到达时间集合；

生成模块，还用于基于第四预估到达时间集合以及第五预估到达时间集合确定第六预估到达时间集合；

生成模块，还用于根据第六预估到达时间集合与第二实际到达时间集合得到第三导数集合，其中，第三导数集合包括P条第三路线样本分别对应的第三导数，第三导数是基于损失函数确定的；

处理模块，还用于根据从标准正态分布中确定的随机数，对第三导数集合进行随机扰动处理，得到随机扰动处理后的第三导数集合；

训练模块，还用于基于第六预估到达时间集合与随机扰动处理后的第三导数集合对待训练第三学习器进行训练。

在一个可能的实施方式中，生成模块，还用于在训练模块基于第六预估到达时间集合与随机扰动处理后的第三导数集合对待训练第三学习器进行训练之后，得到第三学习器，并且生成更新后的时间预估模型，其中，更新后的时间预估模型包括N个学习器，更新后的时间预估模型包括M个学习器以及第三学习器。

在一个可能的实施方式中，获取模块，具体用于从时间预估模型中获取前M个学习器；

或，

固定时间预估模型中前L个学习器，从时间预估模型中后N-L个学习器中进行采样，以得到M个学习器，L为整数，1≤L＜M。

在一个可能的实施方式中，第一学习器以及第二学习器包括如下至少之一：决策树、支持向量机SVM或多层感知机MLP；

第一导数为损失函数的一阶导数，或，损失函数的高阶导数。

在一个可能的实施方式中，获取模块，还用于获取待匹配路线集合，其中，待匹配路线集合包括Q条待匹配路线，待匹配路线为目标出发地与目标到达地之间的通行路线，Q为整数，且Q＞1；

获取模块，还用于根据待匹配路线集合获取路线整体特征集合，其中，路线整体特征集合包括每条待匹配路线对应的路线整体特征，待匹配路线对应的路线整体特征为与待匹配路线的通行时间相关的特征；

生成模块，还用于根据路线整体特征集合，通过时间预估模型得到待选择预估到达时间集合，其中，待选择预估到达时间集合包括每条待匹配路线对应的待选择预估到达时间；

确定模块，还用于从待选择预估到达时间集合中确定目标预估到达时间，其中，目标预估到达时间为从目标出发地至目标到达地的通行时间。

在一个可能的实施方式中，时间预估模型包括第一学习器以及第二学习器；

生成模块，具体用于根据路线整体特征集合，通过第一学习器得到第一待选择预估到达时间集合，其中，第一待选择预估到达时间集合包括每条待匹配路线对应的第一待选择预估到达时间；

根据路线整体特征集合，通过第二学习器得到第二待选择预估到达时间集合，其中，第二待选择预估到达时间集合包括每条待匹配路线对应的第二待选择预估到达时间；

基于第一待选择预估到达时间集合以及第二待选择预估到达时间集合，确定待选择预估到达时间集合。

本申请的第三方面提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有指令，当其在计算机上运行时，使得计算机执行上述各方面所述的方法。

从以上技术方案可以看出，本申请实施例具有以下优点：

本申请实施例中，提供了一种模型训练的方法，先获取第一路线整体特征集合以及第一实际到达时间集合，第一路线整体特征集合包括多条第一路线样本分别对应的路线整体特征，第一实际到达时间集合包括多条第一路线样本分别对应的实际到达时间，第一路线样本对应的路线整体特征为与第一路线样本的通行时间相关的特征。再将第一路线整体特征集合作为待训练时间预估模型的输入，待训练时间预估模型输出第一预估到达时间集合，该第一预估到达时间集合包括多条第一路线样本分别对应的第一预估到达时间，进而根据第一预估到达时间集合与第一实际到达时间集合得到第一导数集合，该第一导数集合包括多条第一路线样本分别对应的第一导数，而第一导数是基于损失函数确定的。进一步地，根据从标准正态分布中确定的随机数，对第一导数集合进行随机扰动处理，得到随机扰动处理后的第一导数集合，最后基于第一预估到达时间集合与随机扰动处理后的第一导数集合对待训练时间预估模型进行训练。采用上述方式，由于对路线样本对应的第一导数进行随机扰动处理，根据随机扰动处理后的第一导数对待训练时间预估模型进行训练，能够避免在迭代过程中所得到的预估时间落在不稳定的奇点上，从而使得所得到的预估时间能够向更接近于真实时间，因此所得到的时间预估模型能够更为可靠以及准确，而通过该时间预估模型确定出发地至到达地的通行时间，能够更为准确的获取到达时间。

附图说明

图1为本申请实施例中模型训练系统的一个架构示意图；

图2为本申请实施例中模型训练的方法一个实施例示意图；

图3为本申请实施例中对待训练时间预估模型进行训练的一个实施例示意图；

图4为本申请实施例中获取第二导数集合的一个实施例示意图；

图5为本申请实施例中对待训练时间预估模型进行训练的另一实施例示意图；

图6为本申请实施例提供的一种模型训练装置的结构示意图；

图7为本申请实施例中服务器一个实施例示意图；

图8为本申请实施例中终端设备一个实施例示意图。

具体实施方式

本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本申请的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“对应于”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

ETA是地图中的功能，它所完成的功能为，给定地图上的一条路线和出发时间，预估出走完这条路线所需要的时间。然而，基于规则的逐路段累加方法对人工经验的依赖很强，并且在实际应用中，路况十分复杂，人为设定的规则无法覆盖各种情形，导致每个路段预估时间出现误差，使得最终所确定到达时间的不够准确，因此，如何更为准确的获取到达时间成为亟需解决的问题。基于此，本申请实施例提供了一种模型训练的方法，基于得到更为可靠以及准确的时间预估模型，从而更为准确的获取到达时间。

为了便于理解，对本申请实施例涉及到的一些术语或概念进行解释。

一、到达时间的预估(estimated time of arrival，ETA)

ETA为给定地图上的一条路线和出发时间，预估出走完这条路线所需要的时间。

二、路线

在地图应用中，路线是一条完整的连接起点与终点的线路，实际场景中，通常一条路线的长度在一公里到几十公里的范围内。

三、路段(link)

在地图应用中，路线是用路段的序列来表达的。在地图数据中，道路被划分为一段一段的线段，这些线段的长度在几十米到几公里不等，每个线段称为一个路段，并被赋予一个全局唯一的标识(identity document，ID)。因此，地图中的一条路线，就是这条路线中所有路段组成的序列。

四、实际到达时间(actual time of arrival，ATA)

在地图服务的历史数据中，可以提取出一条路线的实际到达时间(Actual Timeof Arrival，ATA)，因此可以使用这一数据作为真值来训练机器学习算法，来预估到达时间。

五、连续学习/增量学习

连续学习(也可被称为增量学习)是指机器学习模型可以随着新数据的到来，进行增量式的更新，而不必从头重新训练。通常，增量学习中的数据是一批一批的产生的，模型的更新按批进行，每批数据更新一次。

六、梯度下降法

梯度下降法是一种迭代优化算法。在机器学习中，对于损失函数F(x)，其中x为向量，想要计算使其取最小值的，可以通过下述迭代方程求解：

其中，γ为学习率，F(x_n)为损失函数。

上述损失函数F(x_n)是在所有样本上的和，因此可以得到

由此可得到

基于此，上述迭代方程(1)可以得到下述迭代方程(2)：

其中，γ为学习率，F_i(x_n)为损失函数。

七、随机梯度下降法

随机梯度下降法是基于前述梯度下降法，在求梯度时，不计算全部样本的梯度，而是只从所有N个样本中采样出k个样本，即得到下述迭代方程(3)：

其中，γ为学习率，F_i(x_n)为损失函数，S_k为从所有N个样本中采样出k个样本构成的集合。

八、梯度提升决策树(gradient boosting decision tree，GBDT)

GBDT的基本原理与梯度下降法类似，GBDT使用一系列决策树去拟合前面的残差。具体地，通过每轮训练出一棵决策树，最后对所有决策树的结果进行聚合的方式，得到最终的预测值。其中，每棵树训练时，其目标为拟合前面结果的残差。这一过程相当于每棵树都在拟合梯度，因此称为梯度提升决策树。

GBDT可以表达为下述迭代方程(4)：

其中，γ为学习率，F_m(x)为第M个决策树，L为损失函数，y_i为样本i的标签。

九、随机梯度提升决策树(stochastic gradient boosting decision tree，SGB)

SGB与前述梯度提升决策树相比，训练每棵树时，不使用全部的样本，而是仅从样本中采样出一个子集(即前述从所有N个样本中采样出k个样本)进行训练。由于采样引入了随机性，因此这种方法称为随机梯度提升决策树。

基于迭代方程(4)，能够将SGB表达为下述迭代方程(5)：

其中，γ为学习率，F_m(x)为第M个决策树，L为损失函数，y_i为样本i的标签，S_k为从所有N个样本中采样出k个样本构成的集合。

十、随机梯度郎之万动力学(stochastic gradient langevin dynamics，SGLD)

SGLD是一种源于布朗运动的从概率分布进行采样的方法。布朗运动中，由于热涨落，粒子运动会受到一个随机力的影响。类似的，在传统的随机梯度下降算法中，加入一个服从正态分布的随机扰动，就构成了随机梯度郎之万动力学采样。这种方法已被广泛应用在贝叶斯神经网络当中。

具体地，SGLD所对应的郎之万随机微分方程(Langevin StochasticDifferential Equation)为：

其中，B_t为布朗运动。

随机微分方程(6)所对应的离散形式为：

其中，γ为学习率，Z_K+1为从标准正态分布中采样出来的样本。

基于此，对于机器学习任务，可以将公式(7)中的U设为损失函数，因此公式(7)可以写为：

其中，γ为学习率，Z_K+1为从标准正态分布中采样出来的样本，L_i为损失函数。

进一步地，前述随机梯度下降法类似，从样本中采样出一个子集(即前述从所有N个样本中采样出k个样本)，基于公式(8)可以得到如下公式：

其中，γ为学习率，Z_K+1为从标准正态分布中采样出来的样本，L_i为损失函数，S_k为从所有N个样本中采样出k个样本构成的集合。

前面对本申请实施例涉及到的一些术语或概念进行解释，为了更好的理解本方案，下面对本申请实施例的应用场景进行介绍。可以理解的，该模型训练的方法可以由终端设备来执行，也可以由服务器来执行。可实施的，本申请提供的模型训练的方法应用于如图1所示的模型训练系统，请参阅图1，图1为本申请实施例中模型训练系统的一个架构示意图，如图1所示，模型训练系统包括终端设备以及服务器。具体地，服务器在获取第一路线整体特征集合以及第一实际到达时间集合之后，能够能够通过本申请实施例所提供的方法对待训练时间预估模型进行训练，从而得到时间预估模型。同理可知，终端设备在获取第一路线整体特征集合以及第一实际到达时间集合之后，也能够能够通过本申请实施例所提供的方法对待训练时间预估模型进行训练，从而得到时间预估模型。

或者，服务器或者终端设备也能够将第一路线整体特征集合以及第一实际到达时间集合保存于区块链上，在需要进行模型训练时，从区块链下载第一路线整体特征集合以及第一实际到达时间集合，并通过本申请实施例所提供的方法对待训练时间预估模型进行训练，从而得到时间预估模型。或者，终端设备在获取到第一路线整体特征集合以及第一实际到达时间集合之后，可以选择将第一路线整体特征集合以及第一实际到达时间集合向服务器发送，服务器通过本申请实施例所提供的方法对待训练时间预估模型进行训练，从而得到时间预估模型。本方案不具体限定终端设备以及服务器具体获取第一路线整体特征集合以及第一实际到达时间集合的方式。

本申请涉及的服务器可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式系统，还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content DeliveryNetwork，CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。终端设备可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表、车载终端、智能电视等，但不局限于此。且终端设备和服务器之间可以通过无线网络、有线网络或可移动存储介质进行通信。其中，上述的无线网络使用标准通信技术和/或协议。无线网络通常为因特网、但也可以是任何网络，包括但不限于蓝牙、局域网(Local Area Network，LAN)、城域网(Metropolitan Area Network，MAN)、广域网(Wide Area Network，WAN)、移动、专用网络或者虚拟专用网络的任何组合)。在一些实施例中，可以使用定制或专用数据通信技术取代或者补充上述数据通信技术。可移动存储介质可以为通用串行总线(Universal Serial Bus，USB)闪存盘、移动硬盘或其他可移动存储介质等。

虽然图1中仅示出了五个终端设备和一个服务器，但应当理解，图1中的示例仅用于理解本方案，具体终端设备和服务器的数量均应当结合实际情况灵活确定。

进一步地，在需要对目标出发地至目标到达地的通行时间进行预估时，能够通过本申请实施例所提供的方法所得到时间预估模型进行时间预估。基于此，本申请实施例所提供的方法能够应用于多种场景，例如，在应用于地图软件这一种场景中，用户选择了起点和终点后，地图软件基于本申请实施例所得到的时间预估模型对多条可选择路径的通行时间进行预估，由此能够从多条可选择路径中确定耗时最短的路径。或者，在用户需要进行导航的场景中，用户发起导航之后，在导航开始和过程中，能够通过本申请实施例所得到的时间预估模型，实时向用户输出剩余行程所需要的时间。或者，在应用于外卖应用这一种场景中，目的为外卖配送员合理的分配订单，而分配订单通过本申请实施例所得到的时间预估模型，基于根据客户位置、店铺位置和外卖配送员计算出外卖配送员从店铺取餐，至送餐到客户位置的预估时间。或者，在应用于外卖应用这一种场景中，目的为需要合理的匹配用户和出租车，使得出租车空驶时间最短，而规划起点至终点的路线能够通过本申请实施例所得到的时间预估模型对每条可能的路线进行准确的时间预估。本方案还能应用于更多的场景，在此不进行穷举。

由于本申请实施例中，需要基于人工智能领域中的机器学习技术进行模型训练，因此在对本申请实施例提供的模型训练的方法开始介绍之前，先对人工智能领域的一些基础概念进行介绍。人工智能(Artificial Intelligence，AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说，人工智能是计算机科学的一个综合技术，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能。人工智能技术是一门综合学科，涉及领域广泛，既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

随着人工智能技术研究和进步，人工智能技术在多种方向展开研究，机器学习(Machine Learning，ML)是计算机科学领域与人工智能领域中的一个重要方向。机器学习是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。

结合上述介绍，本申请实施例提供的方案涉及人工智能的机器学习技术，下面对本申请中模型训练的方法进行介绍，请参阅图2，图2为本申请实施例中模型训练的方法一个实施例示意图，如图2所示，本申请实施例中模型训练的方法一个实施例包括：

101、获取第一路线整体特征集合以及第一实际到达时间集合，其中，第一路线整体特征集合包括S条第一路线样本分别对应的路线整体特征，第一实际到达时间集合包括S条第一路线样本分别对应的实际到达时间，第一路线样本对应的路线整体特征为与第一路线样本的通行时间相关的特征，S为整数，S＞1。

本实施例中，模型训练装置先获取第一路线整体特征集合，第一路线整体特征集合包括S条第一路线样本分别对应的路线整体特征，第一路线样本对应的路线整体特征为与第一路线样本的通行时间相关的特征。前述第一路线样本的通行时间具体为在第一路线样本上完成通行的时间，例如，第一路线样本的起点为A且终点为B，那么第一路线样本的通行时间为从起点A通行至终点B的时间，应理解，不同的交通工具对应的通行时间是不相同的，例如，起点A行走至终点B的时间为20分钟，而起点A骑行至终点B的时间为10分钟，起点A开车行驶至终点B的时间为6分钟等，本方案中所描述的第一路线样本的通行时间为通过同一类型的交通工具对应的时间。

具体地，第一路线整体特征包括但不限于第一路线样本的全程总长度，第一路线样本的全程平均限速或者第一路线样本的全程平均自由流速度等道路信息，以及根据实时采集的全球定位系统(global positioning system，GPS)数据计算出的第一路线样本的平均车速，根据过去数月采集到的历史GPS数据挖掘出来的在第一路线样本的同一时刻前后5分钟(或10分钟、15分钟等)的全程平均车速等车速信息，此处不对第一路线整体特征进行具体限定。

其次，模型训练装置还能够获取第一实际到达时间集合，第一实际到达时间集合包括S条第一路线样本分别对应的实际到达时间。该实际到达时间即为前述介绍的ATA，即在地图服务的历史数据中提取出第一路线样本的实际到达时间。

可选地，S条第一路线样本可以为全部的路线样本，也可以为对全部的路线样进行采样后的路线样本，此处不做限定。

102、根据第一路线整体特征集合通过待训练时间预估模型得到第一预估到达时间集合，其中，第一预估到达时间集合包括S条第一路线样本分别对应的第一预估到达时间。

本实施例中，模型训练装置将第一路线整体特征集合作为待训练时间预估模型的输入，待训练时间预估模型能够输出第一预估到达时间集合，第一预估到达时间集合包括S条第一路线样本分别对应的第一预估到达时间。第一预估到达时间即前述介绍的ETA，即预估的完成在第一路线样本通行所需要的时间。

示例性地，第一路线整体特征集合包括第一路线样本A对应的路线整体特征，第一路线样B对应的路线整体特征以及第一路线样本C对应的路线整体特征，将前述第一路线整体特征集合输入至待训练时间预估模型，能够得到第一预估到达时间集合，第一预估到达时间集合包括第一路线样本A对应的第一预估到达时间(即预估的完成在第一路线样本A通行所需要的时间)，第一路线样本B对应的第一预估到达时间(即预估的完成在第一路线样本B通行所需要的时间)，以及第一路线样本C对应的第一预估到达时间(即预估的完成在第一路线样本C通行所需要的时间)。

103、根据第一预估到达时间集合与第一实际到达时间集合得到第一导数集合，其中，第一导数集合包括S条第一路线样本分别对应的第一导数，第一导数是基于损失函数确定的。

本实施例中，模型训练装置根据步骤102所得到第一预估到达时间集合与步骤101所获取的第一实际到达时间集合得到第一导数集合，第一导数集合包括S条第一路线样本分别对应的第一导数，第一导数是基于损失函数确定的。具体地，模型训练装置计算每个第一路线样本对应的第一预估到达时间与其对应的实际到达时间的第一导数，将第一导数记为g_i，第一导数g_i具体对应于前述介绍的公式(5)中的

其中，L为损失函数，F_m(x_i)为第一路线样本x_i对应的第一预估到达时间，y_i为第一路线样本x_i对应的第一实际到达时间，因此该第一导数是基于损失函数L所确定的。

104、根据从标准正态分布中确定的随机数，对第一导数集合进行随机扰动处理，得到随机扰动处理后的第一导数集合。

本实施例中，模型训练装置根据从标准正态分布中确定的随机数，对第一导数集合进行随机扰动处理，得到随机扰动处理后的第一导数集合。具体地，模型训练装置对每个第一路线样本，均从标准正态分布中随机采样一个随机数，即随机数从标准正态分布中采样出来的样本，将随机数记为s_i，且随机数s_i对应于前述介绍的公式(9)中的Z_k+1。

进一步地，根据每个第一路线样本从标准正态分布中确定的随机数，对步骤103所得到的第一导数集合进行随机扰动处理，也就是基于前述介绍的公式(8)，在每个第一路线样本对应的第一导数中加入第一路线样本对应的标准服从正态分布的随机数s_i，从而能够得到随机扰动处理后的第一导数集合。应理解，由于随机数s_i服从标准正态分布，而标准正态分布是对称的，因此能够将随机扰动处理后的第一导数记为

或者

前述γ为学习率。

105、基于第一预估到达时间集合与随机扰动处理后的第一导数集合对待训练时间预估模型进行训练。

本实施例中，模型训练装置基于第一预估到达时间集合与随机扰动处理后的第一导数集合对待训练时间预估模型进行训练。具体地，模型训练装置将每个第一路线样本对应的

(随机扰动处理后的第一导数)作为目标进行迭代训练，即根据第一预估到达时间集合以及与之对应的随机扰动处理后的第一导数集合之间的差异确定损失函数的损失值，根据损失函数的损失值判断损失函数是否达到收敛条件，若未达到收敛条件，则利用损失函数的损失值更新待训练时间预估模型的模型参数。

由于当需要预测第一路线样本对应的第一预估到达时间时，优化目标能够使得对第一路线样本进行错误的可能性最小化，本申请实施例中以用交叉熵损失函数衡量每个第一路线样本对应的第一预估到达时间和每个第一路线样本对应的随机扰动处理后的第一导数之间的差异损失作为示例，即本实施例中损失函数为下面所示例的公式(10)：

loss＝∑-[y_ilnp_i+(1-y_i)ln(1-p_i)]； (10)

其中，p_i为第一路线样本对应的第一预估到达时间，y_i为第一路线样本对应的随机扰动处理后的第一导数。

其次，损失函数的收敛条件可以为损失函数的值小于或等于第一预设阈值，作为示例，例如第一预设阈值的取值可以为0.005、0.01、0.02或其它趋近于0的数值。也可以为损失函数的相邻两次的值的差值小于或等于第二预设阈值，第二阈值的取值可以与阈值的取值相同或不同，作为示例，例如第二预设阈值的取值可以为0.005、0.01、0.02或其它趋近于0的数值等，还可以采用其它收敛条件等，此处不做限定。应理解，在实际应用中，损失函数还可以为均方差损失函数、排序损失(ranking loss)函数以及焦点损失(focal loss)函数等，具体此处不做限定。

为进一步理解本方案，请参阅图3，图3为本申请实施例中对待训练时间预估模型进行训练的一个实施例示意图，如图3所示，A1指的是第一路线样本，A2指的是待训练时间预估模型，A3指的是待训练时间预估模型A2输出的第一预估到达时间，A4指的是第一路线样本对应的第一实际到达时间，A5指的是通过前述实施例介绍的方式，基于第一预估到达时间A3以及第一路线样本对应的第一实际到达时间A4得到的第一导数，A6指的是通过前述实施例介绍的方式所得到的随机扰动处理后的第一导数，利用第一路线样本A1、随机扰动处理后的第一导数A6以及损失函数，对待训练时间预估模型进行迭代训练，应当理解，图3中的示例仅为方便理解本方案，不用于限定本方案。

本申请实施例中，提供了一种模型训练的方法，采用上述方式，由于对路线样本对应的第一导数进行随机扰动处理，根据随机扰动处理后的第一导数对待训练时间预估模型进行训练，能够避免在迭代过程中所得到的预估时间落在不稳定的奇点上，从而使得所得到的预估时间能够向更接近于真实时间，因此所得到的时间预估模型能够更为可靠以及准确，而通过该时间预估模型确定出发地至到达地的通行时间，能够更为准确的获取到达时间。

可选地，在上述图2对应的实施例的基础上，本申请实施例提供的模型训练的方法一个可选实施例中，模型训练的方法还包括：

根据第一路线整体特征集合通过待训练时间预估模型得到第二预估到达时间集合；

基于第一预估到达时间集合以及第二预估到达时间集合确定第三预估到达时间集合；

根据第三预估到达时间集合与第一实际到达时间集合得到第二导数集合，其中，第二导数集合包括S条第一路线样本分别对应的第二导数，第二导数是基于损失函数确定的；

根据从标准正态分布中确定的随机数，对第二导数集合进行随机扰动处理，得到随机扰动处理后的第二导数集合。

本实施例中，模型训练装置还能够再次将第一路线整体特征集合作为待训练时间预估模型的输入，并通过待训练时间预估模型输出第二预估到达时间集合，与第一预估到达时间集合类似，第二预估到达时间集合包括S条第一路线样本分别对应的第二预估到达时间，每条第一路线样本对应的第一预估到达时间与第二预估到达时间可能相同或不同，此处不做限定。然后模型训练装置基于第一预估到达时间集合以及第二预估到达时间集合确定第三预估到达时间集合，该第三预估到达时间集合包括S条第一路线样本分别对应的第三预估到达时间。具体地，此时第三预估到达时间也为前述介绍的ETA，即预估的完成在第一路线样本通行所需要的时间，确定第三预估到达时间的方式具体采用下面所示例的公式(11)：

(1-βγ)f_k-1+γf_k； (11)

其中，γ为学习率，β为正则化参数，f_k-1为第一预估到达时间，f_k为第二预估到达时间。

本实施例中，正则化参数取值可以为1，也可以根据实际应用选取为其他值，此处不做限定。

进一步地，模型训练装置根据第三预估到达时间集合与第一实际到达时间集合得到第二导数集合，此时第二导数集合包括S条第一路线样本分别对应的第二导数，第二导数是基于损失函数确定的。得到第二导数集合的具体方式与步骤103类似，在此不再赘述。再进一步地，根据从标准正态分布中确定的随机数，对第二导数集合进行随机扰动处理，得到随机扰动处理后的第二导数集合。即对每个第一路线样本，均从标准正态分布中随机采样一个随机数，再根据每个第一路线样本从标准正态分布中确定的随机数，在每个第一路线样本对应的第二导数中加入第一路线样本对应的标准服从正态分布的随机数，从而能够得到随机扰动处理后的第二导数集合。得到随机扰动处理后的第二导数集合具体方式与步骤104类似，在此不再赘述。

类似地，为进一步理解本方案，请参阅图4，图4为本申请实施例中获取第二导数集合的一个实施例示意图，如图4所示，B1指的是第一路线样本，B2指的是待训练时间预估模型，B3指的是待训练时间预估模型B2输出的第一预估到达时间，B4指的是待训练时间预估模型B2输出的第二预估到达时间，B5指的是通过前述实施例介绍的方式，基于第一预估到达时间B3以及第二预估到达时间B4所得到第三预估到达时间，B6指的是第一路线样本对应的第一实际到达时间，B7指的是通过前述实施例介绍的方式，基于第三预估到达时间B5以及第一路线样本对应的第一实际到达时间B6得到的第二导数，B8指的是通过前述实施例介绍的方式所得到的随机扰动处理后的第二导数，应当理解，图4中的示例仅为方便理解本方案，不用于限定本方案。

本申请实施例中，提供了另一种模型训练的方法，采用上述方式，再次通过待训练时间预估模型输出每个路线样本对应的第二预估时间，并且基于每个路线样本对应的第一预估时间以及每个路线样本对应的第二预估时间获取第三预估时间，通过该第三预估时间得到路线样本对应的第一导数，因此在模型训练中能够拟合多次预估的结果，从而使得损失函数能够收敛到全局最优，而不是局部最优，进一步地使得所得到的预估时间能够向更接近于真实时间，进一步地提升时间预估模型的可靠性以及准确度。

可选地，在上述图2对应的实施例的基础上，本申请实施例提供的模型训练的方法一个可选实施例中，根据第一路线整体特征集合通过待训练时间预估模型得到第一预估到达时间集合，具体包括：

根据第一路线整体特征集合通过待训练第一学习器得到第一预估到达时间集合；

根据第一路线整体特征集合通过待训练时间预估模型得到第二预估到达时间集合，具体包括：

根据第一路线整体特征集合通过待训练第二学习器得到第二预估到达时间集合；

基于第一预估到达时间集合与随机扰动处理后的第一导数集合对待训练时间预估模型进行训练，具体包括：

基于第一预估到达时间集合与随机扰动处理后的第一导数集合对待训练第一学习器进行训练；

本实施例中，模型训练装置具体将第一路线整体特征集合输入待训练第一学习器，并且通过待训练第一学习器输出第一预估到达时间集合，同理可知，具体将第一路线整体特征集合输入待训练第二学习器，并且通过待训练第二学习器输出第二预估到达时间集合。基于此，模型训练装置基于第一预估到达时间集合与随机扰动处理后的第一导数集合对待训练第一学习器进行训练，具体地，模型训练装置将每个第一路线样本对应的随机扰动处理后的第一导数作为目标进行迭代训练，即根据第一预估到达时间集合以及与之对应的随机扰动处理后的第一导数集合之间的差异确定损失函数的损失值，根据损失函数的损失值判断损失函数是否达到收敛条件，若未达到收敛条件，则利用损失函数的损失值更新待训练第一学习器的模型参数。

同理可知，模型训练装置还基于第三预估到达时间集合与随机扰动处理后的第二导数集合对待训练第二学习器进行训练，具体地，模型训练装置将每个第一路线样本对应的随机扰动处理后的第二导数作为目标进行迭代训练，即根据第三预估到达时间集合以及与之对应的随机扰动处理后的第二导数集合之间的差异确定损失函数的损失值，根据损失函数的损失值判断损失函数是否达到收敛条件，若未达到收敛条件，则利用损失函数的损失值更新待训练第二学习器的模型参数。

基于此，模型训练装置在完成对待训练第一学习器训练后，能得到第一学习器，具体地，在模型训练装置得到第一路线样本集合中每个第一路线样本所对应的第一预估到达时间后，基于前述类似的方式确定损失函数的损失值，直至损失函数达到收敛条件，则根据最后一次对模型参数进行更新后获得的模型参数生成第一学习器。同理可知，模型训练装置在完成对待训练第二学习器训练后，能得到第二学习器，具体地，在模型训练装置得到第一路线样本集合中每个第一路线样本所对应的第二预估到达时间，并且基于前述类似的方式确定每个第一路线样本所对应的第三预估到达时间，再基于前述类似的方式确定损失函数的损失值，直至损失函数达到收敛条件，则根据最后一次对模型参数进行更新后获得的模型参数生成第二学习器，由此得到包括第一学习器以及第二学习器的时间预估模型。

具体地，损失函数的收敛条件可以为损失函数的值小于或等于第一预设阈值，作为示例，例如第一预设阈值的取值可以为0.005、0.01、0.02或其它趋近于0的数值。也可以为损失函数的相邻两次的值的差值小于或等于第二预设阈值，第二阈值的取值可以与阈值的取值相同或不同，作为示例，例如第二预设阈值的取值可以为0.005、0.01、0.02或其它趋近于0的数值等，还可以采用其它收敛条件等，此处不做限定。

为进一步理解本方案，请参阅图5，图5为本申请实施例中对待训练时间预估模型进行训练的另一实施例示意图，如图5所示，C1指的是第一路线样本，C2指的是待训练时间预估模型，待训练时间预估模型C2包括待训练第一学习器C21以及待训练第二学习器C22，C3指的是待训练时间预估模型C2中待训练第一学习器C21输出的第一预估到达时间，C4指的是待训练时间预估模型C2中待训练第二学习器C22输出的第二预估到达时间，C5指的是第一路线样本对应的第一实际到达时间，C6指的是通过前述实施例介绍的方式，基于第一预估到达时间C3以及第一实际到达时间C5所得到第一导数，C7指的是通过前述实施例介绍的方式所得到的随机扰动处理后的第一导数，然后利用第一路线样本C1、随机扰动处理后的第一导数C7以及损失函数，对待训练第一学习器进行迭代训练，以得到第一学习器。同理可知，C8指的是通过前述实施例介绍的方式，基于第一预估到达时间C3以及第二预估到达时间C4所得到第三预估到达时间，C9指的是通过前述实施例介绍的方式，基于第三预估到达时间C5以及第一路线样本对应的第一实际到达时间C5得到的第二导数，C10指的是通过前述实施例介绍的方式所得到的随机扰动处理后的第二导数，应当理解，然后利用第一路线样本C1、随机扰动处理后的第二导数C10以及损失函数，对待训练第二学习器进行迭代训练，以得到第二学习器，从而得到包括第一学习器以及第二学习器的时间预估模型。应理解，图5中的示例仅为方便理解本方案，不用于限定本方案。

应理解，本实施例中所介绍的第一学习器与第二学习期不为对时间预估模型中学习器的限定，时间预估模型还能包括更多的学习器。示例性地，若时间预估模型共包括3个学习器，那么在训练过程中，待训练时间预估模型还能够包括待训练第四学习器，基于此，模型训练装置将第一路线整体特征集合输入待训练第四学习器，并且通过待训练第四学习器输出第七预估到达时间集合，通过与前述实施例类似的方式，基于第二预估到达时间集合以及第七预估到达时间集合确定第八预估到达时间集合，并且根据第八预估到达时间集合与第一实际到达时间集合得到第四导数集合，此时第四导数集合包括S条第一路线样本分别对应的第四导数，第四导数也是基于损失函数确定的，然后根据从标准正态分布中确定的随机数，对第四导数集合进行随机扰动处理，得到随机扰动处理后的第四导数集合。最后基于第八预估到达时间集合与随机扰动处理后的第四导数集合对待训练第四学习器进行训练，能够得到第四学习器，此时所生成的时间预估模型包括第一学习器，第二学习器以及第四学习器。前述示例均用于理解本方案，而不应理解为本方案的限定。

本申请实施例中，提供了另一种模型训练的方法，采用上述方式，具体限定通过不同的学习器，基于对分别得到的预估时间以及对应的参数进行训练，从而得到包括多个学习器的时间预估模型，在提升本方案可行性的基础上，进一步地拟合多个不同学习器的预估的结果，从而使得损失函数能够收敛到全局最优，而不是局部最优，因此拟合多次之后的学习器所得到的预估时间能够向更接近于真实时间，进一步地提升所得到的时间预估模型的可靠性以及准确度。

对第一预估到达时间集合进行初始化处理，以得到初始化后的第一预估到达时间集合；

根据第一预估到达时间集合与第一实际到达时间集合得到第一导数集合，具体包括：

根据初始化后的第一预估到达时间集合与第一实际到达时间集合得到第一导数集合；

基于初始化后的第一预估到达时间集合与随机扰动处理后的第一导数集合对待训练时间预估模型进行训练。

本实施例中，模型训练装置还能够对第一预估到达时间集合进行初始化处理，以得到初始化后的第一预估到达时间集合。基于此，根据初始化后的第一预估到达时间集合与第一实际到达时间集合得到第一导数集合，具体地，模型训练装计算每个第一路线样本对应的初始化后的第一预估到达时间与其对应的实际到达时间的第一导数，与步骤S103类似，将第一导数记为g_i，第一导数g_i具体对应于前述介绍的公式(5)中的

但此时，L为损失函数，F_m(x_i)为第一路线样本x_i对应的初始化后的第一预估到达时间，y_i为第一路线样本x_i对应的第一实际到达时间，该第一导数是基于损失函数L所确定的。

进一步地，通过步骤104的类似方式根据从标准正态分布中确定的随机数，对第一导数集合进行随机扰动处理，得到随机扰动处理后的第一导数集合，并且基于初始化后的第一预估到达时间集合与随机扰动处理后的第一导数集合对待训练时间预估模型进行训练。具体地，模型训练装置将每个第一路线样本对应的

可选地，在上述图2对应的实施例的基础上，本申请实施例提供的模型训练的方法一个可选实施例中，初始化处理为将每个第一预估到达时间与预设数值相加，或，将每个第一预估到达时间与属于预设范围内的数值相加，或，将每个第一预估到达时间与实际到达时间的均值相加。

本实施例中，前述实施例中所介绍的初始化处理为将每个第一预估到达时间与预设数值相加。具体地，模型训练装置在得到第一预估到达时间集合后，将第一预估到达时间集合中每个第一预估到达时间均与预设数值相加。为便于理解，以预设数值为1作为示例进行介绍，若第一路线样本集合包括第一路线样本A，第一路线样本B以及第一路线样本C，所得到的第一预估到达时间集合包括第一路线样本A对应的第一预估到达时间30分钟(min)，第一路线样本B对应的第一预估到达时间31min，以及第一路线样本C对应的第一预估到达时间29min。那么将每个第一预估到达时间均与预设数值相加，即可得到第一路线样本A对应的初始化后的第一预估到达时间31min，第一路线样本B对应的初始化后的第一预估到达时间32min，以及第一路线样本C对应的初始化后的第一预估到达时间30min。

或者，将每个第一预估到达时间与属于预设范围内的数值相加。具体地，模型训练装置在得到第一预估到达时间集合后，将第一预估到达时间集合中每个第一预估到达时间与属于预设范围内的数值相加。为便于理解，以预设范围为1至2作为示例进行介绍，若第一路线样本集合包括第一路线样本A以及第一路线样本B，所得到的第一预估到达时间集合包括第一路线样本A对应的第一预估到达时间30in，以及第一路线样本B对应的第一预估到达时间31min。那么将每个第一预估到达时间与属于预设范围内的数值相加，若第一路线样本A对应的第一预估到达时间与2相加，即可得到第一路线样本A对应的初始化后的第一预估到达时间32min，其次，第一路线样本B对应的第一预估到达时间与1相加，即可得到第一路线样本B对应的初始化后的第一预估到达时间32min。

或者，将每个第一预估到达时间与实际到达时间的均值相加。具体地，模型训练装置在得到第一预估到达时间集合后，将第一预估到达时间集合中每个第一预估到达时间与实际到达时间的均值相加。为便于理解，若第一路线样本集合包括第一路线样本A以及第一路线样本B，且第一实际到达时间集合包括第一路线样本A对应的第一实际到达时间29min，以及第一路线样本B对应的第一实际到达时间31min，由此可以的实际到达时间的均值为30min。基于所得到的第一预估到达时间集合包括第一路线样本A对应的第一预估到达时间30in，以及第一路线样本B对应的第一预估到达时间31min。由此能够得到第一路线样本A对应的初始化后的第一预估到达时间59min，且第一路线样本B对应的初始化后的第一预估到达时间61min。

应理解，前述示例均用于理解本方案，在实际应用中，应根据实际情况确定预设数值以及预设范围，并且需要根据实际应用场景确定采用哪种初始化的方法。

本申请实施例中，提供了另一种模型训练的方法，采用上述方式，初始化后的第一预估到达时间集合能够减少预估时间的不稳定度，使得预估时间集合中每个预估时间的差值处于较小的误差内，从而提升模型训练的可靠性。进一步地，还能通过不同的初始化方式进行初始化处理，由此提升本方案的灵活性。

获取K条第二路线样本，其中，K为整数，K＞S；

对K条第二路线样本进行采样，得到S条第一路线样本。

本实施例中，由于在模型训练的过程中所获取的路线样本通常数量较多，每一步都把所获取到的全部路线样本集合载入进来进行计算，时间花费和内存开销都非常大，为了减少模型训练的时间以及内存开销，模型训练装置能够获取K条第二路线样本，K条第二路线样本为所获取的全部路线样本，K为整数，且K＞S，然后对K条第二路线样本进行采样，以得到S条第一路线样本，该采样可以为随机采样，或者根据实际需求进行采样，此处不做限定。具体地，即通过前述实施例所介绍的随机梯度郎之万动力学SGLD的方法进行模型训练，由于能够避免在迭代过程中所得到的预估时间落在不稳定的奇点上，从而使得所得到的预估时间能够向更接近于真实时间，因此所得到的模型训练结果能够更容易收敛到局部最优。

本申请实施例中，提供了一种对路线样本进行采样的方法，采用上述方式，S条第一路线样本是进行采样后得到的，首先能够降低样本数量，从而减少模型训练的时间，提升模型训练的效率，并且能够避免在迭代过程中所得到的预估时间落在不稳定的奇点上，从而使得所得到的预估时间能够向更接近于真实时间，因此所得到的模型训练结果能够更容易收敛到局部最优，从而提升模型训练的可靠性。

可选地，在上述图2对应的实施例的基础上，本申请实施例提供的模型训练的方法一个可选实施例中，时间预估模型包括N个学习器，N为整数，且N≥1；

模型训练的方法还包括：

获取P条第三路线样本，其中，P条第三路线样本与S条第一路线样本不重合，P为整数，P≥1；

获取第二路线整体特征集合以及第二实际到达时间集合，其中，第二路线整体特征集合包括P条第三路线样本分别对应的路线整体特征，第二实际到达时间集合包括P条第三路线样本分别对应的实际到达时间，第三路线样本对应的路线整体特征为与第三路线样本的通行时间相关的特征，

从时间预估模型中获取M个学习器，其中，M为整数，且1≤M＜N；

根据第二路线整体特征集合通过M个学习器得到第四预估到达时间集合；

根据第二路线整体特征集合通过待训练第三学习器得到第五预估到达时间集合；

基于第四预估到达时间集合以及第五预估到达时间集合确定第六预估到达时间集合；

根据第六预估到达时间集合与第二实际到达时间集合得到第三导数集合，其中，第三导数集合包括P条第三路线样本分别对应的第三导数，第三导数是基于损失函数确定的；

根据从标准正态分布中确定的随机数，对第三导数集合进行随机扰动处理，得到随机扰动处理后的第三导数集合；

基于第六预估到达时间集合与随机扰动处理后的第三导数集合对待训练第三学习器进行训练。

本实施例中，在完成对待训练时间预估模型的训练，并且得到时间预估模型后，若出现新的训练样本，此时能够基于所到的时间预估模型进行增量学习，此时时间预估模型包括N个学习器，N为整数，且N≥1。具体地，模型训练装置获取P条第三路线样本，且P条第三路线样本与S条第一路线样本不重合，P为整数，P≥1，即P条第三路线样本相较于S条第一路线样本为新增的训练样本。可选地，P条第三路线样本可以为新增的全部路线样本，也可以为对新增的全部路线样进行采样后的路线样本，此处不做限定。

基于此，模型训练装置获取第二路线整体特征集合以及第二实际到达时间集合，其中，第二路线整体特征集合包括P条第三路线样本分别对应的路线整体特征，第二实际到达时间集合包括P条第三路线样本分别对应的实际到达时间，第三路线样本对应的路线整体特征为与第三路线样本的通行时间相关的特征。具体地，第三路线样本的通行时间具体为在第三路线样本上完成通行的时间，与步骤101所介绍的第一路线样本的通行时间类似，在此不再赘述。

类似地，第二路线整体特征包括但不限于第三路线样本的全程总长度，第三路线样本的全程平均限速或者第三路线样本的全程平均自由流速度等道路信息，以及根据实时采集的GPS数据计算出的第三路线样本的平均车速，根据过去数月采集到的历史GPS数据挖掘出来的在第三路线样本的同一时刻前后5分钟(或10分钟、15分钟等)的全程平均车速等车速信息，此处不对路线整体特征进行具体限定。类似地，模型训练装置还能够获取第二实际到达时间集合，第二实际到达时间集合包括P条第三路线样本分别对应的实际到达时间。该实际到达时间即为前述介绍的ATA，即在地图服务的历史数据中提取出第三路线样本的实际到达时间。

进一步地，模型训练装置从训练好的时间预估模型中获取M个学习器，M为整数，且1≤M＜N。然后将第二路线整体特征集合作为M个学习器的输入，并通过M个学习器输出第四预估到达时间集合，该第四预估到达时间集合包括P条第三路线样本分别对应的第四预估到达时间。进而根据第二路线整体特征集合通过待训练第三学习器得到第五预估到达时间集合，并基于第四预估到达时间集合以及第五预估到达时间集合确定第六预估到达时间集合，确定第六预估到达时间集合的具体方式与前述确定第三预估到达时间集合类似，在此不再赘述。基于此，模型训练装置根据第六预估到达时间集合与第二实际到达时间集合得到第三导数集合，该第三导数集合包括P条第三路线样本分别对应的第三导数，第三导数是基于损失函数确定的，得到第三导数集合的具体方式与步骤103类似，在此不再赘述。

再进一步地，模型训练装置根据从标准正态分布中确定的随机数，对第三导数集合进行随机扰动处理，得到随机扰动处理后的第三导数集合，即对每个第三路线样本，均从标准正态分布中随机采样一个随机数，再根据每个第三路线样本从标准正态分布中确定的随机数，在每个第三路线样本对应的第三导数中加入第三路线样本对应的标准服从正态分布的随机数，从而能够得到随机扰动处理后的第三导数集合。得到随机扰动处理后的第三导数集合具体方式与步骤104类似，在此不再赘述。

基于此，模型训练装置基于第六预估到达时间集合与随机扰动处理后的第三导数集合对待训练第三学习器进行训练。具体地，模型训练装置将每个第三路线样本对应的随机扰动处理后的第三导数作为目标进行迭代训练，即根据第六预估到达时间集合以及与之对应的随机扰动处理后的第三导数集合之间的差异确定损失函数的损失值，根据损失函数的损失值判断损失函数是否达到收敛条件，若未达到收敛条件，则利用损失函数的损失值更新待训练第三学习器的模型参数。

可选地，在上述图2对应的实施例的基础上，本申请实施例提供的模型训练的方法一个可选实施例中，在基于第六预估到达时间集合与随机扰动处理后的第三导数集合对待训练第三学习器进行训练之后，模型训练的方法还包括：

得到第三学习器，并且生成更新后的时间预估模型，其中，更新后的时间预估模型包括N个学习器，更新后的时间预估模型包括M个学习器以及第三学习器。

本实施例中，模型训练装置在基于第六预估到达时间集合与随机扰动处理后的第三导数集合对待训练第三学习器进行训练之后，能够得到第三学习器，由此生成更新后的时间预估模型。由于时间预估模型包括N个学习器，因此更新后的时间预估模型也包括N个学习器，且更新后的时间预估模型具体包括M个学习器以及第三学习器。

具体地，模型训练装置根据第六预估到达时间集合以及与之对应的随机扰动处理后的第三导数集合之间的差异确定损失函数的损失值，根据损失函数的损失值判断损失函数是否达到收敛条件，若未达到收敛条件，则利用损失函数的损失值更新待训练第三学习器的模型参数，并且将第二路线样本集合输入至更新模型参数后的待训练第三学习器中，待训练第三学习器再次输出每个第二路线样本所对应的第六预估到达时间后，然后基于前述类似的方式确定损失函数的损失值，直至损失函数达到收敛条件，则根据最后一次对第三学习器的模型参数进行更新后获得的模型参数生成第三学习器。其中，损失函数的收敛条件可以为损失函数的值小于或等于第一预设阈值，作为示例，例如第一预设阈值的取值可以为0.005、0.01、0.02或其它趋近于0的数值。也可以为损失函数的相邻两次的值的差值小于或等于第二预设阈值，第二阈值的取值可以与阈值的取值相同或不同，作为示例，例如第二预设阈值的取值可以为0.005、0.01、0.02或其它趋近于0的数值等，还可以采用其它收敛条件等，此处不做限定。

本申请实施例中，提供了一种基于增量学习的模型训练的方法，采用上述方式，在出现新增的路线样本的场景下，从已完成训练的时间预估模型获取至少一个学习器，能够使得在进行增量学习的过程中运用到这些学习器包含的训练样本的信息，由此基于增量学习的模型训练的可靠性。其次，有更新后的时间预估模型能够维持N个学习器的总数，使得线上推理的时间可以保持平稳，而不是持续增长，进一步地保证模型训练的可靠性。

可选地，在上述图2对应的实施例的基础上，本申请实施例提供的模型训练的方法一个可选实施例中，从时间预估模型中获取M个学习器，具体包括：

从时间预估模型中获取前M个学习器；

或，

本实施例中，M的取值应该尽可能接近N，例如，M为N-1或N-2。当P条第三路线样本数量较少的情况下，M的取值可以为N-1，因此较少P条第三路线样本只够用来训练1个学习器。当P条第三路线样本数量较多的情况下，M的取值可以为N-2或者N-3。应理解，具体取值需要根据多次实验数据以及具体情况灵活确定。

基于此，模型训练装置从时间预估模型中获取前M个学习器。为便于理解，以时间预估模型包括5(N)个学习器，且获取2(M)个学习器作为示例进行说明，基于此，按照对待训练时间预估模型进行训练过程中，依次得到的学习器进行排序，例如，学习器A为第一个学习器，学习器B为第二个学习器，以此类推，学习器E为第一个学习器，此时将学习器A以及学习器B作为被选择的学习器，并根据学习器A以及学习器B，基于P条第三路线样本进行训练。

或者，模型训练装置固定时间预估模型中前L个学习器，从时间预估模型中后N-L个学习器中进行采样，以得到M个学习器，L为整数，且1≤L＜M。为便于理解，以时间预估模型包括5(N)个学习器，且获取2(M)个学习器作为示例进行说明，基于此，按照对待训练时间预估模型进行训练过程中，依次得到的学习器进行排序，例如，学习器A为第一个学习器，学习器B为第二个学习器，以此类推，学习器E为第一个学习器，此时固定学习器A，将学习器A作为M个学习器中的一个学习器，并且从学习器B至学习器E中岁间确定一个学习器，若确定为学习器D，那么将学习器A以及学习器E作为被选择的学习器，并并根据学习器A以及学习器E，基于P条第三路线样本进行训练。

本申请实施例中，提供了一种获取学习器的方法，采用上述方式，由于在进行模型训练的过程中，训练次数越多即损失函数函数越收敛，基于靠后的学习器进行训练新增的样本会使得迭代次数较少，因此选择靠前的学习器能够更未全面的获取新增样本的信息，从而保证所得到的更新后的时间预估模型更稳定以及可靠。

可选地，在上述图2对应的实施例的基础上，本申请实施例提供的模型训练的方法一个可选实施例中，第一学习器以及第二学习器包括如下至少之一：决策树、支持向量机SVM或多层感知机MLP；

本实施例中，前述实施例中所描述的学习器可以包括如下至少之一：决策树，或，支持向量机(support vector machine，SVM)，或，多层感知机(multi-Layer perceptron，MLP)。即第一学习器，第二学习器，第三学习器以及第四学习器分别为一颗决策树，或者一个SVM，或者一个MLP。

其次，前述实施例中所描述的导数为损失函数的一阶导数，或，损失函数的高阶导数。例如，第一导数可以为第一预估到达时间与第一实际到达时间所构成的损失函数的一阶导数，或，第一预估到达时间与第一实际到达时间所构成的损失函数的高阶导数。而第二导数可以为第三预估到达时间与第一实际到达时间所构成的损失函数的一阶导数，或，第三预估到达时间与第一实际到达时间所构成的损失函数的高阶导数。

本申请实施例中，提供了另一种模型训练的方法，采用上述方式，学习器可以为不同类型的用于进行模型训练的方法框架，而导数可以为一阶或高阶导数，因此能够满足不同模型训练场景的需求，由此提升模型训练的灵活性。

获取待匹配路线集合，其中，待匹配路线集合包括Q条待匹配路线，待匹配路线为目标出发地与目标到达地之间的通行路线，Q为整数，且Q＞1；

根据待匹配路线集合获取路线整体特征集合，其中，路线整体特征集合包括每条待匹配路线对应的路线整体特征，待匹配路线对应的路线整体特征为与待匹配路线的通行时间相关的特征；

根据路线整体特征集合，通过时间预估模型得到待选择预估到达时间集合，其中，待选择预估到达时间集合包括每条待匹配路线对应的待选择预估到达时间；

从待选择预估到达时间集合中确定目标预估到达时间，其中，目标预估到达时间为从目标出发地至目标到达地的通行时间。

本实施例中，在不同的场景下，用户从目标出发地向目标到达地通行前，能够通过前述实施例中训练得到的时间预估模型得到预估时间。

具体地，模型训练装置先获取待匹配路线集合，该待匹配路线集合包括多条待匹配路线，待匹配路线为目标出发地与目标到达地之间的通行路线。例如，目标出发地A与目标到达地A之间存在3条不同的通行路线，此时所得到的待匹配路线集合可以包括待匹配路线A，待匹配路线B以及待匹配路线C。

基于此，模型训练装置再根据待匹配路线集合获取路线整体特征集合，该路线整体特征集合包括每条待匹配路线对应的路线整体特征，待匹配路线对应的路线整体特征为与待匹配路线的通行时间相关的特征，具体路线整体特征包括但不限于待匹配路线的全程总长度，待匹配路线的全程平均限速或者待匹配路线的全程平均自由流速度等道路信息，以及根据实时采集的GPS数据计算出的待匹配路线的平均车速，根据过去数月采集到的历史GPS数据挖掘出来的在待匹配路线的同一时刻前后5分钟(或10分钟、15分钟等)的全程平均车速等车速信息，此处不对待匹配路线对应的路线整体特征进行具体限定。

进一步地，模型训练装置将路线整体特征集合作为时间预估模型的输入，时间预估模型输出待选择预估到达时间集合，该待选择预估到达时间集合包括每条待匹配路线对应的待选择预估到达时间。待匹配路线A对应待选择预估到达时间A，待匹配路线B对应待选择预估到达时间B，以及待匹配路线C对应待选择预估到达时间C。然后模型训练装置从待选择预估到达时间集合中确定目标预估到达时间，其中，目标预估到达时间为从目标出发地至目标到达地的通行时间。

可选地，模型训练装置从待选择预估到达时间集合中确定目标预估到达时间，可以为从待选择预估到达时间集合包括的多个待选择预估到达时间中，选择耗时最短的待选择预估到达时间为目标预估到达时间。或者，在得到待选择预估到达时间时，还能够在用户所使用的终端设备上展示不同待匹配路线对应的路况和实时行车状态，由此用户通过需求从待选择预估到达时间集合中确定目标预估到达时间，此时目标预估到达时间不一定为耗时最短的时间。

为了便于理解，下面对本方案可以应用的场景进行介绍。

1、在用户发起从目标出发地向目标到达地的导航时，首先获取多条待匹配路线，然后通过本方案的训练方法所得到的时间预估模型输出每条待匹配路线对应的预估到达时间，然后将选择耗时最短的待选择预估到达时间为目标预估到达时间，并且展示给用户，以供用户基于该目标预估到达时间以及目标预估到达时间对应的待匹配路线进行导航。

进一步地，基于导航的应用场景，在用户开始导航后，还能在达到预设时间时，确定实时地点，并且通过本方案的训练方法所得到的时间预估模型输出该实时地点与目标到达地计算剩余剩余路线的时间，以便于用户实时安排行程。

2、通过本方案的训练方法所得到的时间预估模型输出每条待匹配路线对应的预估到达时间，并且基于多条待匹配路线对应的预估到达时间进行分组规划，得到15分钟可达区域，半小时可达区域或者一个小时可达区域等，以便于方便用户了解某地点的生活半径。

3、在外卖员进行派送时，可以通过本方案得到的每条待匹配路线对应的预估到达时间，从而更好的给外卖员进行派单，提高外卖配送效率。

4、在乘客通过终端设备进行打车的场景下，也可以通过本方案得到的每条待匹配路线对应的预估到达时间，从而更好的安排司机师傅接单，提高客运效率。

5、通过本方案得到的每条待匹配路线对应的预估到达时间，供上游服务使用，以便上游服务评价各条待匹配路线的优劣，进而基于预估到达时间以及其他判断依据给用户推送最优路线。

6、通过本方案得到的每条待匹配路线对应的预估到达时间，确定每条待匹配路线对预估到达时间的影响权重，供上游服务使用，例如用来躲避拥堵、对预估时间进行解释等。

本申请实施例中，提供了一种基于模型进行到达时间的预估方法，采用上述方式，通过前述实施例所得到的时间预估模型能够更为可靠以及准确，因此通过该时间预估模型确定出发地至到达地的通行时间，能够更为准确的获取到达时间。

可选地，在上述图2对应的实施例的基础上，本申请实施例提供的模型训练的方法一个可选实施例中，时间预估模型包括第一学习器以及第二学习器；

根据路线整体特征集合，通过时间预估模型得到待选择预估到达时间集合，具体包括：

根据路线整体特征集合，通过第一学习器得到第一待选择预估到达时间集合，其中，第一待选择预估到达时间集合包括每条待匹配路线对应的第一待选择预估到达时间；

本实施例中，时间预估模型包括第一学习器以及第二学习器。基于此，模型训练装置根据路线整体特征集合，通过第一学习器得到第一待选择预估到达时间集合，该第一待选择预估到达时间集合包括每条待匹配路线对应的第一待选择预估到达时间，然后根据路线整体特征集合，通过第二学习器得到第二待选择预估到达时间集合，该第二待选择预估到达时间集合包括每条待匹配路线对应的第二待选择预估到达时间。

然后，时间预估模型基于第一待选择预估到达时间集合以及第二待选择预估到达时间集合，确定待选择预估到达时间集合。即基于前述介绍的公式(11)，得到每条待匹配路线对应的待选择预估到达时间。为了便于理解，再次示出公式(11)：

(1-βγ)f_k-1+γf_k； (11)

本申请实施例中，提供了一种确定待选择预估到达时间集合的方法，采用上述方式，通过拟合多个不同学习器的预估的结果，从而使得损失函数能够收敛到全局最优，而不是局部最优，因此拟合多次之后的学习器所得到的预估时间能够向更接近于真实时间，从而提升待选择预估到达时间的准确度。

下面对本申请中的模型训练装置进行详细描述，请参阅图6，图6为本申请实施例提供的一种模型训练装置的结构示意图，如图6所示，模型训练装置600包括：

获取模块601，用于获取第一路线整体特征集合以及第一实际到达时间集合，其中，第一路线整体特征集合包括S条第一路线样本分别对应的路线整体特征，第一实际到达时间集合包括S条第一路线样本分别对应的实际到达时间，第一路线样本对应的路线整体特征为与第一路线样本的通行时间相关的特征，S为整数，S＞1；

生成模块602，用于根据第一路线整体特征集合通过待训练时间预估模型得到第一预估到达时间集合，其中，第一预估到达时间集合包括S条第一路线样本分别对应的第一预估到达时间；

生成模块602，还用于根据第一预估到达时间集合与第一实际到达时间集合得到第一导数集合，其中，第一导数集合包括S条第一路线样本分别对应的第一导数，第一导数是基于损失函数确定的；

处理模块603，用于根据从标准正态分布中确定的随机数，对第一导数集合进行随机扰动处理，得到随机扰动处理后的第一导数集合；

训练模块604，用于基于第一预估到达时间集合与随机扰动处理后的第一导数集合对待训练时间预估模型进行训练。

可选地，在上述图6所对应的实施例的基础上，本申请实施例提供的模型训练装置600的另一实施例中，模型训练装置还包括确定模块605；

生成模块602，还用于根据第一路线整体特征集合通过待训练时间预估模型得到第二预估到达时间集合；

确定模块605，用于基于所述第一预估到达时间集合以及所述第二预估到达时间集合确定第三预估到达时间集合；

生成模块602，还用于根据第三预估到达时间集合与第一实际到达时间集合得到第二导数集合，其中，第二导数集合包括S条第一路线样本分别对应的第二导数，第二导数是基于损失函数确定的；

处理模块603，还用于根据从标准正态分布中确定的随机数，对第二导数集合进行随机扰动处理，得到随机扰动处理后的第二导数集合。

可选地，在上述图6所对应的实施例的基础上，本申请实施例提供的模型训练装置600的另一实施例中，生成模块602，具体用于根据第一路线整体特征集合通过待训练第一学习器得到第一预估到达时间集合；

生成模块602，具体用于根据第一路线整体特征集合通过待训练第二学习器得到第二预估到达时间集合；

训练模块604，具体用于基于第一预估到达时间集合与随机扰动处理后的第一导数集合对待训练第一学习器进行训练；

可选地，在上述图6所对应的实施例的基础上，本申请实施例提供的模型训练装置600的另一实施例中，处理模块603，还用于对第一预估到达时间集合进行初始化处理，以得到初始化后的第一预估到达时间集合；

生成模块602，具体用于根据初始化后的第一预估到达时间集合与第一实际到达时间集合得到第一导数集合；

训练模块604，具体用于基于初始化后的第一预估到达时间集合与随机扰动处理后的第一导数集合对待训练时间预估模型进行训练。

可选地，在上述图6所对应的实施例的基础上，本申请实施例提供的模型训练装置600的另一实施例中，初始化处理为将每个第一预估到达时间与预设数值相加，或，将每个第一预估到达时间与属于预设范围内的数值相加，或，将每个第一预估到达时间与实际到达时间的均值相加。

可选地，在上述图6所对应的实施例的基础上，本申请实施例提供的模型训练装置600的另一实施例中，模型训练装置600还包括采样模块606；

获取模块601，还用于获取K条第二路线样本，其中，K为整数，K＞S；

采样模块606，用于对K条第二路线样本进行采样，得到S条第一路线样本。

可选地，在上述图6所对应的实施例的基础上，本申请实施例提供的模型训练装置600的另一实施例中，时间预估模型包括N个学习器，N为整数，且N≥1；

获取模块601，还用于获取P条第三路线样本，其中，P条第三路线样本与S条第一路线样本不重合，P为整数，P≥1；

获取模块601，还用于获取第二路线整体特征集合以及第二实际到达时间集合，其中，第二路线整体特征集合包括P条第三路线样本分别对应的路线整体特征，第二实际到达时间集合包括P条第三路线样本分别对应的实际到达时间，第三路线样本对应的路线整体特征为与第三路线样本的通行时间相关的特征，

获取模块601，还用于从时间预估模型中获取M个学习器，其中，M为整数，且1≤M＜N；

生成模块602，还用于根据第二路线整体特征集合通过M个学习器得到第四预估到达时间集合；

生成模块602，还用于根据第二路线整体特征集合通过待训练第三学习器得到第五预估到达时间集合；

生成模块602，还用于基于第四预估到达时间集合以及第五预估到达时间集合确定第六预估到达时间集合；

生成模块602，还用于根据第六预估到达时间集合与第二实际到达时间集合得到第三导数集合，其中，第三导数集合包括P条第三路线样本分别对应的第三导数，第三导数是基于损失函数确定的；

处理模块603，还用于根据从标准正态分布中确定的随机数，对第三导数集合进行随机扰动处理，得到随机扰动处理后的第三导数集合；

训练模块604，还用于基于第六预估到达时间集合与随机扰动处理后的第三导数集合对待训练第三学习器进行训练。

可选地，在上述图6所对应的实施例的基础上，本申请实施例提供的模型训练装置600的另一实施例中，生成模块602，还用于在训练模块604基于第六预估到达时间集合与随机扰动处理后的第三导数集合对待训练第三学习器进行训练之后，得到第三学习器，并且生成更新后的时间预估模型，其中，更新后的时间预估模型包括N个学习器，更新后的时间预估模型包括M个学习器以及第三学习器。

可选地，在上述图6所对应的实施例的基础上，本申请实施例提供的模型训练装置600的另一实施例中，获取模块601，具体用于从时间预估模型中获取前M个学习器；

或，

可选地，在上述图6所对应的实施例的基础上，本申请实施例提供的模型训练装置600的另一实施例中，第一学习器以及第二学习器包括如下至少之一：决策树、支持向量机SVM或多层感知机MLP；

可选地，在上述图6所对应的实施例的基础上，本申请实施例提供的模型训练装置600的另一实施例中，获取模块601，还用于获取待匹配路线集合，其中，待匹配路线集合包括Q条待匹配路线，待匹配路线为目标出发地与目标到达地之间的通行路线，Q为整数，且Q＞1；

获取模块601，还用于根据待匹配路线集合获取路线整体特征集合，其中，路线整体特征集合包括每条待匹配路线对应的路线整体特征，待匹配路线对应的路线整体特征为与待匹配路线的通行时间相关的特征；

生成模块602，还用于根据路线整体特征集合，通过时间预估模型得到待选择预估到达时间集合，其中，待选择预估到达时间集合包括每条待匹配路线对应的待选择预估到达时间；

确定模块605，还用于从待选择预估到达时间集合中确定目标预估到达时间，其中，目标预估到达时间为从目标出发地至目标到达地的通行时间。

可选地，在上述图6所对应的实施例的基础上，本申请实施例提供的模型训练装置600的另一实施例中，时间预估模型包括第一学习器以及第二学习器；

生成模块602，具体用于根据路线整体特征集合，通过第一学习器得到第一待选择预估到达时间集合，其中，第一待选择预估到达时间集合包括每条待匹配路线对应的第一待选择预估到达时间；

本申请实施例还提供了另一种模型训练装置，模型训练装置都可以部署于服务器，也可以部署于终端设备，本申请中以模型训练装置部署于服务器为例进行说明，请参阅图7，图7为本申请实施例中服务器一个实施例示意图，如图所示，该服务器1000可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上中央处理器(centralprocessing units，CPU)1022(例如，一个或一个以上处理器)和存储器1032，一个或一个以上存储应用程序1042或数据1044的存储介质1030(例如一个或一个以上海量存储设备)。其中，存储器1032和存储介质1030可以是短暂存储或持久存储。存储在存储介质1030的程序可以包括一个或一个以上模块(图示没标出)，每个模块可以包括对服务器中的一系列指令操作。更进一步地，中央处理器1022可以设置为与存储介质1030通信，在服务器1000上执行存储介质1030中的一系列指令操作。

服务器1000还可以包括一个或一个以上电源1026，一个或一个以上有线或无线网络接口1050，一个或一个以上输入输出接口1058，和/或，一个或一个以上操作系统1041，例如Windows Server^TM，Mac OS X^TM，Unix^TM，Linux^TM，FreeBSD^TM等等。

上述实施例中由服务器所执行的步骤可以基于该图7所示的服务器结构。

该服务器所包括的CPU 1022用于执行如图2所示实施例以及图2对应的各个实施例。

本申请还提供了一种终端设备，用于执行图2所示实施例以及图2对应的各个实施例中模型训练装置执行的步骤。如图8所示，为了便于说明，仅示出了与本申请实施例相关的部分，具体技术细节未揭示的，请参照本申请实施例方法部分。以终端设备为手机为例进行说明：

图8示出的是与本申请实施例提供的终端相关的手机的部分结构的框图。参考图8，手机包括：射频(Radio Frequency，RF)电路1110、存储器1120、输入单元1130、显示单元1140、传感器1150、音频电路1160、无线保真(wireless fidelity，WiFi)模块1170、处理器1180、以及电源1190等部件。本领域技术人员可以理解，图8中示出的手机结构并不构成对手机的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

下面结合图8对手机的各个构成部件进行具体的介绍：

RF电路1110可用于收发信息或通话过程中，信号的接收和发送，特别地，将基站的下行信息接收后，给处理器1180处理；另外，将设计上行的数据发送给基站。通常，RF电路1110包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器(Low NoiseAmplifier，LNA)、双工器等。此外，RF电路1110还可以通过无线通信与网络和其他设备通信。上述无线通信可以使用任一通信标准或协议，包括但不限于全球移动通讯系统(GlobalSystem of Mobile communication，GSM)、通用分组无线服务(General Packet RadioService，GPRS)、码分多址(Code Division Multiple Access，CDMA)、宽带码分多址(Wideband Code Division Multiple Access，WCDMA)、长期演进(Long Term Evolution，LTE)、电子邮件、短消息服务(Short Messaging Service，SMS)等。

存储器1120可用于存储软件程序以及模块，处理器1180通过运行存储在存储器1120的软件程序以及模块，从而执行手机的各种功能应用以及数据处理。存储器1120可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等；存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外，存储器1120可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

输入单元1130可用于接收输入的数字或字符信息，以及产生与手机的用户设置以及功能控制有关的键信号输入。具体地，输入单元1130可包括触控面板1131以及其他输入设备1132。触控面板1131，也称为触摸屏，可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板1131上或在触控面板1131附近的操作)，并根据预先设定的程式驱动相应的连接装置。可选的，触控面板1131可包括触摸检测装置和触摸控制器两个部分。其中，触摸检测装置检测用户的触摸方位，并检测触摸操作带来的信号，将信号传送给触摸控制器；触摸控制器从触摸检测装置上接收触摸信息，并将它转换成触点坐标，再送给处理器1180，并能接收处理器1180发来的命令并加以执行。此外，可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板1131。除了触控面板1131，输入单元1130还可以包括其他输入设备1132。具体地，其他输入设备1132可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。

显示单元1140可用于显示由用户输入的信息或提供给用户的信息以及手机的各种菜单。显示单元1140可包括显示面板1141，可选的，可以采用液晶显示器(LiquidCrystal Display，LCD)、有机发光二极管(Organic Light-Emitting Diode，OLED)等形式来配置显示面板1141。进一步的，触控面板1131可覆盖显示面板1141，当触控面板1131检测到在其上或附近的触摸操作后，传送给处理器1180以确定触摸事件的类型，随后处理器1180根据触摸事件的类型在显示面板1141上提供相应的视觉输出。虽然在图8中，触控面板1131与显示面板1141是作为两个独立的部件来实现手机的输入和输入功能，但是在某些实施例中，可以将触控面板1131与显示面板1141集成而实现手机的输入和输出功能。

手机还可包括至少一种传感器1150，比如光传感器、运动传感器以及其他传感器。具体地，光传感器可包括环境光传感器及接近传感器，其中，环境光传感器可根据环境光线的明暗来调节显示面板1141的亮度，接近传感器可在手机移动到耳边时，关闭显示面板1141和/或背光。作为运动传感器的一种，加速计传感器可检测各个方向上(一般为三轴)加速度的大小，静止时可检测出重力的大小及方向，可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等；至于手机还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器，此处不做赘述。

音频电路1160、扬声器1161，传声器1162可提供用户与手机之间的音频接口。音频电路1160可将接收到的音频数据转换后的电信号，传输到扬声器1161，由扬声器1161转换为声音信号输出；另一方面，传声器1162将收集的声音信号转换为电信号，由音频电路1160接收后转换为音频数据，再将音频数据输出处理器1180处理后，经RF电路1110以发送给比如另一手机，或者将音频数据输出至存储器1120以便进一步处理。

WiFi属于短距离无线传输技术，手机通过WiFi模块1170可以帮助用户收发电子邮件、浏览网页和访问流式媒体等，它为用户提供了无线的宽带互联网访问。虽然图8示出了WiFi模块1170，但是可以理解的是，其并不属于手机的必须构成。

处理器1180是手机的控制中心，利用各种接口和线路连接整个手机的各个部分，通过运行或执行存储在存储器1120内的软件程序和/或模块，以及调用存储在存储器1120内的数据，执行手机的各种功能和处理数据，从而对手机进行整体监控。可选的，处理器1180可包括一个或多个处理单元；优选的，处理器1180可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作系统、用户界面和应用程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到处理器1180中。

手机还包括给各个部件供电的电源1190(比如电池)，优选的，电源可以通过电源管理系统与处理器1180逻辑相连，从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。

尽管未示出，手机还可以包括摄像头、蓝牙模块等，此处不做赘述。

在本申请实施例中，该终端所包括的处理器1180用于执行如图2所示实施例以及图2对应的各个实施例。

本申请实施例中还提供一种计算机可读存储介质，该计算机可读存储介质中存储有计算机程序，当其在计算机上运行时，使得计算机执行如前述图2所示实施例描述的方法以及图2对应的各个描述的方法中模型训练装置所执行的步骤。

本申请实施例中还提供一种包括程序的计算机程序产品，当其在计算机上运行时，使得计算机执行如前述图2所示实施例描述的方法中模型训练装置所执行的步骤。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统，装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统，装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(read-only memory，ROM)、随机存取存储器(random access memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，以上实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims

1.一种模型训练的方法，其特征在于，包括：

获取第一路线整体特征集合以及第一实际到达时间集合，其中，所述第一路线整体特征集合包括S条第一路线样本分别对应的路线整体特征，所述第一实际到达时间集合包括S条第一路线样本分别对应的实际到达时间，所述第一路线样本对应的路线整体特征为与所述第一路线样本的通行时间相关的特征，S为整数，S＞1；

根据所述第一路线整体特征集合通过待训练时间预估模型得到第一预估到达时间集合，其中，所述第一预估到达时间集合包括S条第一路线样本分别对应的第一预估到达时间；

根据所述第一预估到达时间集合与所述第一实际到达时间集合得到第一导数集合，其中，所述第一导数集合包括S条第一路线样本分别对应的第一导数，所述第一导数是基于损失函数确定的；

根据从标准正态分布中确定的随机数，对所述第一导数集合进行随机扰动处理，得到随机扰动处理后的第一导数集合；

基于所述第一预估到达时间集合与所述随机扰动处理后的第一导数集合对所述待训练时间预估模型进行训练。

2.根据权利要求1所述的方法，其特征在于，所述方法还包括：

根据所述第一路线整体特征集合通过所述待训练时间预估模型得到第二预估到达时间集合；

基于所述第一预估到达时间集合以及所述第二预估到达时间集合确定第三预估到达时间集合；

根据所述第三预估到达时间集合与所述第一实际到达时间集合得到第二导数集合，其中，所述第二导数集合包括S条第一路线样本分别对应的第二导数，所述第二导数是基于所述损失函数确定的；

根据从所述标准正态分布中确定的随机数，对所述第二导数集合进行随机扰动处理，得到随机扰动处理后的第二导数集合。

3.根据权利要求2所述的方法，其特征在于，所述根据所述第一路线整体特征集合通过待训练时间预估模型得到第一预估到达时间集合，包括：

根据所述第一路线整体特征集合通过待训练第一学习器得到所述第一预估到达时间集合；

所述根据所述第一路线整体特征集合通过所述待训练时间预估模型得到第二预估到达时间集合，包括：

根据所述第一路线整体特征集合通过所述待训练第二学习器得到所述第二预估到达时间集合；

所述基于所述第一预估到达时间集合与所述随机扰动处理后的第一导数集合对所述待训练时间预估模型进行训练，包括：

基于所述第一预估到达时间集合与所述随机扰动处理后的第一导数集合对所述待训练第一学习器进行训练；

基于所述第三预估到达时间集合与所述随机扰动处理后的第二导数集合对所述待训练第二学习器进行训练。

4.根据权利要求1所述的方法，其特征在于，所述方法还包括：

对所述第一预估到达时间集合进行初始化处理，以得到初始化后的第一预估到达时间集合；

所述根据所述第一预估到达时间集合与所述第一实际到达时间集合得到第一导数集合，包括：

根据所述初始化后的第一预估到达时间集合与所述第一实际到达时间集合得到所述第一导数集合；

基于所述初始化后的第一预估到达时间集合与所述随机扰动处理后的第一导数集合对所述待训练时间预估模型进行训练。

5.根据权利要求4所述的方法，其特征在于，所述初始化处理为将每个第一预估到达时间与预设数值相加，或，将每个第一预估到达时间与属于预设范围内的数值相加，或，将每个第一预估到达时间与所述实际到达时间的均值相加。

6.根据权利要求4或5所述的方法，其特征在于，所述方法还包括：

获取K条第二路线样本，其中，所述K为整数，K＞S；

对所述K条第二路线样本进行采样，得到S条第一路线样本。

7.根据权利要求3所述的方法，其特征在于，所述时间预估模型包括N个学习器，N为整数，且N≥1；

所述方法还包括：

获取P条第三路线样本，其中，所述P条第三路线样本与所述S条第一路线样本不重合，P为整数，P≥1；

获取第二路线整体特征集合以及第二实际到达时间集合，其中，所述第二路线整体特征集合包括P条第三路线样本分别对应的路线整体特征，所述第二实际到达时间集合包括P条第三路线样本分别对应的实际到达时间，所述第三路线样本对应的路线整体特征为与所述第三路线样本的通行时间相关的特征；

从所述时间预估模型中获取M个学习器，其中，M为整数，且1≤M＜N；

根据所述第二路线整体特征集合通过所述M个学习器得到第四预估到达时间集合；

根据所述第二路线整体特征集合通过待训练第三学习器得到第五预估到达时间集合；

基于所述第四预估到达时间集合以及所述第五预估到达时间集合确定第六预估到达时间集合；

根据所述第六预估到达时间集合与所述第二实际到达时间集合得到第三导数集合，其中，所述第三导数集合包括P条第三路线样本分别对应的第三导数，所述第三导数是基于所述损失函数确定的；

根据从标准正态分布中确定的随机数，对所述第三导数集合进行随机扰动处理，得到随机扰动处理后的第三导数集合；

基于所述第六预估到达时间集合与所述随机扰动处理后的第三导数集合对待训练第三学习器进行训练。

8.根据权利要求7所述的方法，其特征在于，在所述基于所述第六预估到达时间集合与所述随机扰动处理后的第三导数集合对待训练第三学习器进行训练之后，所述方法还包括：

得到第三学习器，并且生成更新后的时间预估模型，其中，所述更新后的时间预估模型包括N个学习器，所述更新后的时间预估模型包括所述M个学习器以及所述第三学习器。

9.根据权利要求7或8所述的方法，其特征在于，所述从所述时间预估模型中获取M个学习器，包括：

从所述时间预估模型中获取前M个学习器；

或，

固定所述时间预估模型中前L个学习器，从所述时间预估模型中后N-L个学习器中进行采样，以得到所述M个学习器，L为整数，1≤L＜M。

10.根据权利要求3所述的方法，其特征在于，所述第一学习器以及所述第二学习器包括如下至少之一：决策树、支持向量机SVM或多层感知机MLP；

所述第一导数为所述损失函数的一阶导数，或，所述损失函数的高阶导数。

11.根据权利要求1至10任一项所述的方法，其特征在于，所述方法还包括：

获取待匹配路线集合，其中，所述待匹配路线集合包括Q条待匹配路线，所述待匹配路线为目标出发地与目标到达地之间的通行路线，Q为整数，且Q＞1；

根据所述待匹配路线集合获取路线整体特征集合，其中，所述路线整体特征集合包括每条待匹配路线对应的路线整体特征，所述待匹配路线对应的路线整体特征为与所述待匹配路线的通行时间相关的特征；

根据所述路线整体特征集合，通过时间预估模型得到待选择预估到达时间集合，其中，所述待选择预估到达时间集合包括每条待匹配路线对应的待选择预估到达时间；

从所述待选择预估到达时间集合中确定目标预估到达时间，其中，所述目标预估到达时间为从所述目标出发地至所述目标到达地的通行时间。

12.根据权利要求11所述的方法，其特征在于，所述时间预估模型包括第一学习器以及第二学习器；

所述根据所述路线整体特征集合，通过时间预估模型得到待选择预估到达时间集合，包括：

根据所述路线整体特征集合，通过所述第一学习器得到第一待选择预估到达时间集合，其中，所述第一待选择预估到达时间集合包括每条待匹配路线对应的第一待选择预估到达时间；

根据所述路线整体特征集合，通过所述第二学习器得到第二待选择预估到达时间集合，其中，所述第二待选择预估到达时间集合包括每条待匹配路线对应的第二待选择预估到达时间；

基于所述第一待选择预估到达时间集合以及所述第二待选择预估到达时间集合，确定所述待选择预估到达时间集合。

13.一种模型训练装置，其特征在于，包括：

获取模块，用于获取第一路线整体特征集合以及第一实际到达时间集合，其中，所述第一路线整体特征集合包括S条第一路线样本分别对应的路线整体特征，所述第一实际到达时间集合包括S条第一路线样本分别对应的实际到达时间，所述第一路线样本对应的路线整体特征为与所述第一路线样本的通行时间相关的特征，S为整数，S＞1；

生成模块，用于根据所述第一路线整体特征集合通过待训练时间预估模型得到第一预估到达时间集合，其中，所述第一预估到达时间集合包括S条第一路线样本分别对应的第一预估到达时间；

生成模块，还用于根据所述第一预估到达时间集合与所述第一实际到达时间集合得到第一导数集合，其中，所述第一导数集合包括S条第一路线样本分别对应的第一导数，所述第一导数是基于损失函数确定的；

处理模块，用于根据从标准正态分布中确定的随机数，对所述第一导数集合进行随机扰动处理，得到随机扰动处理后的第一导数集合；

训练模块，用于基于所述第一预估到达时间集合与所述随机扰动处理后的第一导数集合对所述待训练时间预估模型进行训练。

14.一种计算机设备，其特征在于，包括：存储器、收发器、处理器以及总线系统；

其中，所述存储器用于存储程序；

所述处理器用于执行所述存储器中的程序，以实现权利要求1至12中任一项所述的方法；

所述总线系统用于连接所述存储器以及所述处理器，以使所述存储器以及所述处理器进行通信。

15.一种计算机可读存储介质，包括指令，当其在计算机上运行时，使得计算机执行如权利要求1至12中任一项所述的方法。