CN110390503A

CN110390503A - 模型训练、配送时间确定的方法和装置、存储介质和电子设备

Info

Publication number: CN110390503A
Application number: CN201910601412.3A
Authority: CN
Inventors: 杨情; 侯俊杰; 闫聪; 茹强; 李春苗
Original assignee: Beijing Sankuai Online Technology Co Ltd
Current assignee: Beijing Sankuai Online Technology Co Ltd
Priority date: 2019-07-03
Filing date: 2019-07-03
Publication date: 2019-10-29

Abstract

本公开涉及一种模型训练、配送时间确定的方法和装置、存储介质和电子设备，所述模型训练的方法包括：获取样本数据集，所述样本数据包括历史订单的实际送达时刻；根据所述样本数据集和目标损失函数训练用于预测送达时刻的模型；其中，在送达时间误差为正数情况下，所述配送时间确定模型的所述目标损失函数的第一函数关系的第一变化速率，与在送达时间误差为负数情况下，所述配送时间确定模型的所述目标损失函数的第二函数关系的第二变化速率不同。

Description

模型训练、配送时间确定的方法和装置、存储介质和电子设备

技术领域

本公开涉及互联网技术领域，具体地，涉及一种模型训练、配送时间确定的方法和装置、存储介质和电子设备。

背景技术

在快递及外卖等涉及商品配送的场景中，为消费者提供订购服务或配送服务的平台可以为消费者提供商品的预计配送时间，因此，消费者可以提前得知商品大致的到达时间，并可以依据该到达时间对自身的进行事项和日程安排进行调整。同时，配送时间的长短也是一部分消费者决定是否订购商品的因素之一，因此，配送时间的准确率会影响消费者实际的订购体验，进而影响平台在消费者心中的信赖度。

目前，对配送时间的预估主要依靠建立配送时间的估算模型，将配送场景下的可变因素(如天气、时段、距离等)作为模型的变量，最后输出预计的配送时间。在进行配送时间的预估后，还可以根据用户或配送者反馈的实际送达时间对该模型进行训练，因此，从整体上来看，该模型预估出的配送时间会根据订单数量的增加而越来越准确。

但是，在实际的配送场景下，由于提前送达的订单量往往多于滞后送达的订单量，因此，模型的优化会趋于使数量较多的提前送达的订单更准时，这样会导致滞后送达的订单的预估时间会更不准确，影响消费者的服务体验。

发明内容

本公开的目的是提供一种模型训练、配送时间确定的方法和装置、存储介质和电子设备，以解决相关技术中存在的问题。

为了实现上述目的，本公开的第一方面提供一种模型训练的方法，所述方法包括：获取样本数据集，所述样本数据包括历史订单的实际送达时刻；根据所述样本数据集和目标损失函数训练用于预测送达时刻的模型；其中，所述目标损失函数包括：在送达时间误差为正数情况下，所述配送时间确定模型的所述目标损失函数的第一函数关系的第一变化速率，与在送达时间误差为负数情况下，所述配送时间确定模型的所述目标损失函数的第二函数关系的第二变化速率不同，所述送达时间误差为正数表明预测送达时间早于实际送达时间，送达时间误差为负数表明预测送达时间晚于实际送达时间，所述目标损失函数用于表征模型预测的损失量与送达时间误差之间的映射关系；所述第一变化速率为第一关系函数中损失量随送达时刻误差绝对值变化的速率，所述第二变化速率为第二关系函数中损失量随送达时刻误差绝对值变化的速率。

可选地，所述方法还包括：获取损失函数选择指令；根据所述指令，从预置的多个候选函数表达式中，选择目标函数表达式；从预置的对应所述目标函数表达式的多组系数组合中，选择目标系数组合；根据所述目标函数表达式以及所述目标系数组合确定所述目标损失函数。

可选地，所述从预置的对应所述目标函数表达式的多组系数组合中，选择目标系数组合，包括：将每一所述系数组合带入所述目标函数表达式，得到待选损失函数；针对每一得到的所述待选损失函数，执行以下操作：通过所述待选损失函数以及训练样本数据集训练得到待检模型；通过测试样本数据集测试所述待检模型，得到测试评价值；确定所述测试评价值最优的待检模型对应的系数组合，为所述目标系数组合。

可选地，所述多个候选函数表达式包括以下任意类型的表达式：第一类型表达式：其中，所述为所述预计送达时刻，所述Y为所述实际送达时刻，a₁和b₁为所述第一类型表达式的一组系数组合；第二类型表达式：其中，a₂₁、b₂₁、a₂₂和b₂₂为所述第二类型表达式的一组系数组合。

可选地，所述获取损失函数选择指令，包括：根据所述样本数据集中订单的类型信息和/或订单生成时的时间信息，确定损失函数类型；根据所述损失函数类型生成所述损失函数选择指令；其中，不同所述损失函数类型用于表征所述第一关系函数的第一变化速率与所述第二关系函数的第二变化速率不同大小关系。

可选地，所述样本数据集包括表征订单的实际送达时刻早于预计送达时刻的第一样本数据，以及表征订单的实际送达时刻晚于预计送达时刻的第二类样本数据，所述获取样本数据集，包括：比对所述第一类样本数据和所述第二类样本数据的样本数目，确定样本数目较少的目标样本数据类别；将重采样后的所述目标样本数据类别的样本数据录入所述样本数据集。

本公开的第二方面，提供一种配送时间确定的方法，所述方法包括：获取待配送订单的配送特征信息；将所述配送特征信息输入配送时间确定模型，得到所述配送时间确定模型输出的所述待配送订单的预测送达时间；将所述预测送达时间发送给产生所述待配送订单的客户端，以便该客户端对所述预测送达时间进行展示；其中，在送达时间误差为正数情况下，所述配送时间确定模型的所述目标损失函数的第一函数关系的第一变化速率，与在送达时间误差为负数情况下，所述配送时间确定模型的所述目标损失函数的第二函数关系的第二变化速率不同，所述送达时间误差为正数表明预测送达时间早于实际送达时间，送达时间误差为负数表明预测送达时间晚于实际送达时间，所述目标损失函数用于表征模型预测的损失量与送达时间误差之间的映射关系；所述第一变化速率为第一关系函数中损失量随送达时刻误差绝对值变化的速率，所述第二变化速率为第二关系函数中损失量随送达时刻误差绝对值变化的速率。

可选地，所述配送时间确定模型，通过以下训练步骤训练得到：获取样本数据集，所述样本数据包括历史订单的实际送达时刻；根据所述样本数据集和目标损失函数训练用于预测送达时刻的模型。

可选地，所述训练步骤还包括：获取损失函数选择指令；根据所述指令，从预置的多个候选函数表达式中，选择目标函数表达式；从预置的对应所述目标函数表达式的多组系数组合中，选择目标系数组合；根据所述目标函数表达式以及所述目标系数组合确定所述目标损失函数。

本公开的第三方面，提供一种模型训练的装置，所述装置包括：样本获取模块，用于获取样本数据集，所述样本数据包括历史订单的实际送达时刻；模型训练模块，用于根据所述样本数据集和目标损失函数训练用于预测送达时刻的模型；其中，在送达时间误差为正数情况下，所述配送时间确定模型的目标损失函数的第一函数关系的第一变化速率，与在送达时间误差为负数情况下，所述配送时间确定模型的目标损失函数的第二函数关系的第二变化速率不同，所述送达时间误差为正数表明预测送达时间早于实际送达时间，送达时间误差为负数表明预测送达时间晚于实际送达时间，所述目标损失函数用于表征模型预测的损失量与送达时间误差之间的映射关系；所述第一变化速率为第一关系函数中损失量随送达时刻误差绝对值变化的速率，所述第二变化速率为第二关系函数中损失量随送达时刻误差绝对值变化的速率。

可选地，所述装置还包括：指令获取模块，用于获取损失函数选择指令；函数选择模块，用于根据所述指令，从预置的多个候选函数表达式中，选择目标函数表达式；系数选择模块，用于从预置的对应所述目标函数表达式的多组系数组合中，选择目标系数组合；目标确定模块，用于根据所述目标函数表达式以及所述目标系数组合确定所述目标损失函数。

可选地，所述系数选择模块，用于将每一所述系数组合带入所述目标函数表达式，得到待选损失函数；针对每一得到的所述待选损失函数，执行以下操作：通过所述待选损失函数以及训练样本数据集训练得到待检模型；通过测试样本数据集测试所述待检模型，得到测试评价值；确定所述测试评价值最优的待检模型对应的系数组合，为所述目标系数组合。

可选地，所述指令获取模块，用于根据所述样本数据集中订单的类型信息和/或订单生成时的时间信息，确定损失函数类型；根据所述损失函数类型生成所述损失函数选择指令；其中，不同所述损失函数类型用于表征所述第一关系函数的第一变化速率与所述第二关系函数的第二变化速率不同大小关系。

可选地，所述样本数据集包括表征订单的实际送达时刻早于预计送达时刻的第一样本数据，以及表征订单的实际送达时刻晚于预计送达时刻的第二类样本数据，所述样本获取模块，用于比对所述第一类样本数据和所述第二类样本数据的样本数目，确定样本数目较少的目标样本数据类别；将重采样后的所述目标样本数据类别录入所述样本数据集。

本公开的第四方面，提供一种配送时间确定的装置，所述装置包括：特征获取模块，用于获取待配送订单的配送特征信息；特征处理模块，用于将所述配送特征信息输入配送时间确定模型，得到所述配送时间确定模型输出的所述待配送订单的预测送达时间；发送模块，用于将所述预测送达时间发送给产生所述待配送订单的客户端，以便该客户端对所述预测送达时间进行展示；其中，在送达时间误差为正数情况下，所述配送时间确定模型的目标损失函数的第一函数关系的第一变化速率，与在送达时间误差为负数情况下，所述配送时间确定模型的目标损失函数的第二函数关系的第二变化速率不同，所述送达时间误差为正数表明预测送达时间早于实际送达时间，送达时间误差为负数表明预测送达时间晚于实际送达时间，所述目标损失函数用于表征模型预测的损失量与送达时间误差之间的映射关系；所述第一变化速率为第一关系函数中损失量随送达时刻误差绝对值变化的速率，所述第二变化速率为第二关系函数中损失量随送达时刻误差绝对值变化的速率。

可选地，所述装置还包括训练模块，所述训练模块包括：样本获取子模块，用于获取样本数据集，所述样本数据包括历史订单的实际送达时刻；模型训练子模块，用于根据所述样本数据集和目标损失函数训练用于预测送达时刻的模型。

可选地，所述训练模块还包括：指令获取子模块，用于获取损失函数选择指令；函数选择子模块，用于根据所述指令，从预置的多个候选函数表达式中，选择目标函数表达式；系数选择子模块，用于从预置的对应所述目标函数表达式的多组系数组合中，选择目标系数组合；目标确定子模块，用于根据所述目标函数表达式以及所述目标系数组合确定所述目标损失函数。

可选地，所述系数选择子模块，用于将每一所述系数组合带入所述目标函数表达式，得到待选损失函数；针对每一得到的所述待选损失函数，执行以下操作：通过所述待选损失函数以及训练样本数据集训练得到待检模型；通过测试样本数据集测试所述待检模型，得到测试评价值；确定所述测试评价值最优的待检模型对应的系数组合，为所述目标系数组合。

可选地，所述指令获取子模块，用于根据所述样本数据集中订单的类型信息和/或订单生成时的时间信息，确定损失函数类型；根据所述损失函数类型生成所述损失函数选择指令；其中，不同所述损失函数类型用于表征所述第一关系函数的第一变化速率与所述第二关系函数的第二变化速率不同的大小关系。

可选地，所述样本数据集包括表征订单的实际送达时刻早于预计送达时刻的第一样本数据，以及表征订单的实际送达时刻晚于预计送达时刻的第二类样本数据，所述样本获取模块，用于比对所述第一类样本数据和所述第二类样本数据的样本数目，确定样本数目较少的目标样本数据类别；将重采样后的所述目标样本数据类别的样本数据录入所述样本数据集。

本公开的第五方面，提供一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现本公开第一方面中任一项所述方法的步骤。

本公开的第六方面，提供一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现本公开第二方面中任一项所述方法的步骤。

本公开的第七方面，提供一种电子设备，包括：存储器，其上存储有计算机程序；处理器，用于执行所述存储器中的所述计算机程序，以实现本公开第一方面中任一项所述方法的步骤。

本公开的第八方面，提供一种电子设备，包括：存储器，其上存储有计算机程序；处理器，用于执行所述存储器中的所述计算机程序，以实现本公开第二方面中任一项所述方法的步骤。

通过上述技术方案，至少可以达到以下技术效果：

通过设定目标损失函数的第一关系函数的第一变化速率与第二关系函数的第二变化速率的关系，并根据该目标损失函数和样本数据集对用于预测送达时刻的模型进行训练，通过两侧变化速率不同目标损失函数对模型的训练进行修正，减少了模型因不同类型样本数量不同而产生的训练偏差，也就减少了使用训练好的模型得到预测结果的偏移。此外，损失函数的设置更加灵活，对送达时刻的预估更符合业务场景需求，提高消费者的服务体验。

本公开的其他特征和优点将在随后的具体实施方式部分予以详细说明。

附图说明

附图是用来提供对本公开的进一步理解，并且构成说明书的一部分，与下面的具体实施方式一起用于解释本公开，但并不构成对本公开的限制。在附图中：

图1是根据一示例性公开实施例示出的一种模型训练的方法的流程图。

图2是根据一示例性公开实施例示出的一种损失函数的函数图。

图3是根据一示例性公开实施例示出的另一种模型训练的方法的流程图。

图4是根据一示例性公开实施例示出的一种函数表达式的函数图。

图5是根据一示例性公开实施例示出的另一种函数表达式的函数图。

图6是根据一示例性公开实施例示出的一种配送时间确定方法的流程图。

图7是根据一示例性公开实施例示出的一种模型训练的装置的框图。

图8是根据一示例性公开实施例示出的一种配送时间确定的装置的框图。

图9是根据一示例性公开实施例示出的一种电子设备的框图。

图10是根据一示例性公开实施例示出的一种电子设备的框图。

具体实施方式

以下结合附图对本公开的具体实施方式进行详细说明。应当理解的是，此处所描述的具体实施方式仅用于说明和解释本公开，并不用于限制本公开。

下面对本公开的实施场景进行说明。本公开应用于需要对送达时间预估的业务场景下，例如，快递配送、外卖配送、超市配送、上门服务等业务中，由于用于预测送达时刻的模型对送达时间的估计会存在偏差，因此，在后续使用中，会根据大量的历史订单的信息和一个损失函数对模型进行持续的修正和训练，以使模型对送达时间的估计更接近实际送达时刻。由于在现有的模型训练过程中，用于模型训练的损失函数对提前送达和滞后送达所设置的损失量是相同的，而实际的订单信息中，提前送达、准时送达的订单数远多于滞后送达的订单数，为了保证大多数订单的准时，这样的损失函数和训练集会训练模型以使模型更倾向于将多数订单(即提前送达、准时送达)的送达时间预估得更准确。在这样的长期训练下，滞后订单的预计送达时间将越来越靠前，实际滞后的时间也会越来越长，从而影响这部分用户的使用体验。

图1是根据一示例性公开实施例示出的一种模型训练的方法的流程图，如图1所示，该方法包括下述步骤。

S11、获取样本数据集，所述样本数据包括历史订单的实际送达时刻。

样本数据集可以是上述用于对模型进行持续修正和训练的历史订单的数据集合，数据中包括了订单配送的实际送达时刻。在这些历史订单的数据中，存在提前送达(即送达时刻误差为正数)的订单、准时送达(即送达时刻误差为0)的订单和滞后送达(即送达时刻误差为负数)的订单，还包括了每个订单的特征信息，例如，订单生成的时间、订单生成的地址、订单生成地的天气、订单生成地附近的交通状况等信息。

在一种可选的实施方式中，所述样本数据集包括表征订单的实际送达时刻早于预计送达时刻的第一样本数据，以及表征订单的实际送达时刻晚于预计送达时刻的第二类样本数据，所述获取样本数据集，包括：比对所述第一类样本数据和所述第二类样本数据的样本数目，确定样本数目较少的目标样本数据类别，将重采样后的所述目标样本数据类别录入所述样本数据集。

这样，可以使某一类样本数据的数量较小时重新对这类数据进行采样，补齐样本数量，以使预测结果更客观准确。

S12、根据所述样本数据集和目标损失函数训练用于预测送达时刻的模型。

其中，所述目标损失函数包括：在送达时刻误差为正数情况下，所述送达时刻误差的绝对值与损失量之间的第一关系函数，以及在所述送达时刻误差为负数情况下，所述送达时刻误差的绝对值与损失量之间的第二关系函数，所述送达时刻误差为所述预计送达时刻与所述实际送达时刻之间的时间差。

所述第一关系函数的第一变化速率与所述第二关系函数的第二变化速率不同，所述第一变化速率为第一关系函数中损失量随送达时刻误差绝对值变化的速率，所述第二变化速率为第二关系函数中损失量随送达时刻误差绝对值变化的速率。

例如，如果样本数据集中有100条数据，其中提前送达历史订单数据的有80条，准时送达的历史订单数据有5条，滞后送达的历史订单数据有15条，准时率为5％。由于提前送达的历史订单数据的数量远大于其他订单数据，为了使大量的订单数据的预计时间准确(即准时率更高)，如果按照原本的模型的损失函数(第一变化速率与第二变化速率相同)对模型进行训练则会使模型预估的时间整体提前。

例如，为了方便表达，以分钟数表达实际送达时刻和预计送达时刻，在100条样本数据中，预估送达时刻均是40分钟，实际送达时刻为30分钟(即提前送达)的订单为40单，实际送达时刻为10～20分钟的订单为40单，实际送达时刻为40分钟的订单为5单，实际送达时刻为45分钟的为15单，准时率为5％。为了使更多的订单准时，现有技术的模型可能会倾向于将所有订单的预计送达时刻都提前10分钟，即，如果用训练后的模型对原本的100条数据再次进行预估，训练后的模型对这100条样本数据的预计送达时刻都变为30分钟，此时，准时送达的订单变为40单，提前送达的订单变为40单，滞后送达的订单变为20单，准时率变为40％。虽然准时率提高，模型从整体上来看的预估准确性提高了，但是这样造成了更多的滞后送达的订单，且滞后订单的滞后时间较之前的模型更长了。虽然提前送达和滞后送达都属于配送时间预估不准确的情况，但是实际上，在例如外卖配送等场景下，用户更能接受提前送达的订单，而对滞后送达的订单的容忍度更低，因此，即使这样训练的模型对大量订单的预计送达时刻的预估更准确，但是却可能影响消费者的服务体验。

如图2所示的是一种可能的目标损失函数的函数图。图2所示的函数的第二变化速率(即Y轴右侧函数的变化速率)高于第一变化速率(即Y轴左侧函数的变化速率)，即代表着如果订单滞后则会给予模型更高的损失量，以使模型训练时可以更偏向使滞后订单更准时。

同样是上述的100条样本数据，预估送达时刻均是40分钟，实际送达时刻为30分钟(即提前送达)的订单为40单，实际送达时刻为10～20分钟的订单为40单，实际送达时刻为40分钟的订单为5单，实际送达时刻为45分钟的为15单，准时率为5％。如果用图2所示的损失函数对模型进行训练，由于滞后送达的损失量远大于提前送达的损失量，因此模型会倾向于使原本滞后送达的订单的预估时间更准时，即，模型可能会倾向于使预计送达时刻更迟。因此，模型对原本的100条数据再次进行预估，训练后的模型对这100条样本数据的预计送达时刻可能都变为45分钟，此时，准时送达的订单变为15单，提前送达的订单变为85单，准时率变为15％。虽然准时率比上一损失函数训练得到的模型的准时率低，但是滞后送达的订单数变少，从而提高了用户体验。

通过上述的方法，至少可以达到以下的技术效果：

通过设定目标损失函数的第一关系函数的第一变化速率与第二关系函数的第二变化速率的关系，并根据该目标损失函数和样本数据集对用于预测送达时刻的模型进行训练，通过两侧变化速率不同的目标损失函数对模型的训练进行修正，减少了模型因不同类型样本数量不同而产生的训练偏差，也就减少了使用训练好的模型得到预测结果的偏移。此外，损失函数的设置更加灵活，对送达时刻的预估更符合业务场景需求，提高消费者的服务体验。

图3是根据一示例性公开实施例示出的另一种模型训练的方法的流程图，如图3所示，该方法包括：

S21、获取样本数据集，所述样本数据包括历史订单的实际送达时刻。

S22、获取损失函数选择指令。

该损失函数选择指令用于选择一个特定的损失函数，不同的损失函数的第一变化速率与第二变化速率的关系不同，训练所得的模型的预测结果也不同。例如，第一变化速率大于第二变化速率的损失函数，训练得到的模型预测的预计到达时刻会偏早，第一变化速率小于第二变化速率的损失函数，训练得到的模型预测的预计到的时刻会偏迟。

在一种可能的实现方式中，可以根据所述样本数据集中订单的类型信息和/或订单生成时的时间信息确定损失函数类型，并根据所述损失函数类型生成所述损失函数选择指令。其中，不同所述损失函数类型用于表征所述第一关系函数的第一变化速率与所述第二关系函数的第二变化速率不同大小关系。

例如，该模型用于预测外卖配送时间，且样本数据集中的订单都是外卖配送订单时，由于外卖的消费者对滞后送达的容忍度更低，因此，可以选择第二变化速率高于第一变化速率的损失函数，这样训练出的模型预测出的时间会更偏向使滞后送达的超时程度变小；该模型用于预测上门服务等需要在某一时间点之后到达的到达时间时，样本数据集中的订单都是此类订单，由于此类订单的消费者对提前到达的容忍度更低，对滞后到达的容忍度更高，因此，可以选择第一变化速率高于第二变化速率的损失函数，这样训练出模型预测出的时间会更偏向于使提前到达的提前程度更小。

例如，该模型用于预测外卖配送时间，且样本数据集中的订单的生成时间都是夏天或都是冬天，由于夏天天气较热外卖不容易凉，而冬天天气较冷外卖容易凉，因此用户在夏天对滞后送达的容忍度相比冬天更高，因此，用于预测夏天的外卖配送订单的配送时间确定的模型在训练时用到的损失函数的第二变化速率，可以低于用于预测冬天的外卖配送订单的配送时间确定的模型在训练时用到的损失函数的第二变化速率。

S23、根据所述指令，从预置的多个候选函数表达式中，选择目标函数表达式。

可选地，所述多个候选函数表达式包括以下任意类型的表达式：

第一类型表达式：

其中，所述为所述预计送达时刻，所述Y为所述实际送达时刻，a₁和b₁为所述第一类型表达式的一组系数组合。

图4是第一类型表达式的函数图，其中，a₁和b₁分别为0.004和0.01。由图4可知，本函数的第一变化速率和第二变化速率的变化程度很平缓。

第二类型表达式：

其中，a₂₁、b₂₁、a₂₂和b₂₂为所述第二类型表达式的一组系数组合。

图5是第二类型表达式的函数图，其中，a₂₁、b₂₁、a₂₂和b₂₂分别为20、20、0.005、0.005。由图5可知，本函数在靠近对称轴附近的变化速率的变化程度很平缓，在远离对称轴附近的变化速率的变化程度突然升高。

根据所述指令，从预知的多个候选函数表达式中，选择目标函数表达式，则可以根据不同的业务场景需求，选择不同特征的函数表达式。例如，如果是用于预测准时达(用户对提前送达的订单容忍度很低)的订单配送时间，可以选择第二类型表达式，因为第二类型表达式在的送达时刻误差的绝对值在达到一个临界点时，函数的变化速率会突然上升，因此，训练出的函数预测预计送达时刻时，会避免使送达时刻误差达到该零界点值，即预计送达时刻会尽量贴近实际送达时刻。

S24、从预置的对应所述目标函数表达式的多组系数组合中，选择目标系数组合。

可选地，将每一所述系数组合带入所述目标函数表达式，得到待选损失函数，针对每一得到的所述待选损失函数，执行以下操作：

首先，通过所述待选损失函数以及训练样本数据集训练得到待检模型。

然后，通过测试样本数据集测试所述待检模型，得到测试评价值。

在得到每一所述待检模型的测试评价值之后，确定所述测试评价值最优的待检模型对应的系数组合，为所述目标系数组合。

训练样本数据集可以和样本数据集是不同的数据集，也可以是相同的数据集。测试评价值可以是对预测结果的准时率，也可以是预测结果的送达时刻误差满足预设条件的数量与总样本数量的比值等，根据不同的业务需求，可以预设不同的评价值的评判标准。

S25、根据所述目标函数表达式以及所述目标系数组合确定所述目标损失函数。

S26、根据所述样本数据集和目标损失函数训练用于预测送达时刻的模型。

目标损失函数的第一关系函数的第一变化速率与所述第二关系函数的第二变化速率根据不同的函数表达式类型和不同的参数组合各自不同。

例如，为了方便表达，以分钟数表达实际送达时刻和预计送达时刻，在100条样本数据中，预估送达时刻均是40分钟，实际送达时刻为30分钟(即提前送达)的订单为40单，实际送达时刻为10～20分钟的订单为40单，实际送达时刻为40分钟的订单为5单，实际送达时刻为45分钟的为15单，准时率为5％。为了使更多的订单准时，模型可能会倾向于将所有订单的预计送达时刻都提前10分钟，即，如果用训练后的模型对原本的100条数据再次进行预估，训练后的模型对这100条样本数据的预计送达时刻都变为30分钟，此时，准时送达的订单变为40单，提前送达的订单变为40单，滞后送达的订单变为20单，准时率变为40％。虽然准时率提高，模型从整体上来看的预估准确性提高了，但是这样造成了更多的滞后送达的订单，且滞后订单的滞后时间较之前的模型更长了。虽然提前送达和滞后送达都属于配送时间预估不准确的情况，但是实际上，在例如外卖配送等场景下，用户更能接受提前送达的订单，而对滞后送达的订单的容忍度更低，因此，即使这样训练的模型对大量订单的预计送达时刻的预估更准确，但是却可能影响消费者的服务体验。

在外卖配送的场景下，用户对滞后配送的容忍度更低，因此，可以选择第二变化速率高于第一变化速率的目标函数，对模型进行训练。

同样是上述的100条样本数据，预估送达时刻均是40分钟，实际送达时刻为30分钟(即提前送达)的订单为40单，实际送达时刻为10～20分钟的订单为40单，实际送达时刻为40分钟的订单为5单，实际送达时刻为45分钟的为15单，准时率为5％。如果用根据图2所示的损失函数对模型进行训练，由于滞后送达的损失量远大于提前送达的损失量，因此模型会倾向于使原本滞后送达的订单的预估时间更准时，即，模型可能会倾向于使预计送达时刻更迟。因此，模型对原本的100条数据再次进行预估，训练后的模型对这100条样本数据的预计送达时刻可能都变为45分钟，此时，准时送达的订单变为15单，提前送达的订单变为85单，准时率变为15％。虽然准时率比上一损失函数训练得到的模型的准时率低，但是滞后送达的订单数变少，从而提高了用户体验。

通过上述的方法，至少可以达到以下的技术效果：

通过根据不同的业务场景设定不同的目标损失函数，不同的目标损失函数的第一关系函数的第一变化速率与第二关系函数的第二变化速率的关系不同，并根据该目标损失函数和样本数据集对用于预测送达时刻的模型进行训练，通过两侧变化速率不同目标损失函数对模型的训练进行修正，减少了模型因不同类型样本数量不同而产生的训练偏差，也就减少了使用训练好的模型得到预测结果的偏移。此外，损失函数的设置更加灵活，对送达时刻的预估更符合业务场景需求，提高消费者的服务体验，减少了提供订购或配送服务的平台客户流失和赔付金额增多的风险。

图6是根据一示例性公开实施例示出的一种配送时间确定方法的流程图，如图6所示，所述方法包括：

S31、获取待配送订单的配送特征信息。

待配送订单的配送特征信息是指会对订单的配送时间造成影响的信息，例如，订单生成的时间、订单生成的地址、订单目的地的地址、订单生成地的天气、订单目的地的天气、订单生成地到订单目的地之间的交通状况等信息。

S32、将所述配送特征信息输入配送时间确定模型，得到所述配送时间确定模型输出的所述待配送订单的预测送达时间。

其中，在送达时间误差为正数情况下，所述配送时间确定模型的所述目标损失函数的第一函数关系的第一变化速率，与在送达时间误差为负数情况下，所述配送时间确定模型的所述目标损失函数的第二函数关系的第二变化速率不同，所述送达时间误差为正数表明预测送达时间早于实际送达时间，送达时间误差为负数表明预测送达时间晚于实际送达时间，所述目标损失函数用于表征模型预测的损失量与送达时间误差之间的映射关系；在送达时刻误差为正数情况下，所述送达时刻误差的绝对值与损失量之间的第一关系函数，以及在所述送达时刻误差为负数情况下，所述送达时刻误差的绝对值与损失量之间的第二关系函数，所述送达时刻误差为所述预计送达时刻与所述实际送达时刻之间的时间差；

S33、将所述预测送达时间发送给产生所述待配送订单的客户端，以便该客户端对所述预测送达时间进行展示。

可选地，所述获取损失函数选择指令，包括：根据所述样本数据集中订单的类型信息和/或订单生成时的时间信息，确定损失函数类型；根据所述损失函数类型生成所述损失函数选择指令；其中，不同所述损失函数类型用于表征第一关系函数的第一变化速率与第二关系函数的第二变化速率不同大小关系，其中，所述第一关系函数为，在送达时刻误差为正数情况下所述送达时刻误差的绝对值与所述损失函数的损失量之间的关系函数，所述第二关系函数为，在所述送达时刻误差为负数情况下所述送达时刻误差的绝对值与所述损失函数的损失量之间的关系函数。

通过上述的方法，至少可以达到以下的技术效果：

通过获取待配送订单的配送特征信息，并将所述配送特征信息输入送达时间误差为正数情况下的变化速率与在送达时间误差为负数情况下的变化速率不同的目标损失函数训练得到的配送时间确定模型，得到所述配送时间确定模型输出的所述待配送订单的预测送达时间。减少了因不同类型样本数量不同而产生的训练偏差导致的预测结果的偏移，对送达时刻的预估更符合业务场景需求，提高消费者的服务体验。

图7是根据一示例性公开实施例示出的一种模型训练的装置的框图。如图7所示，所述装置700包括样本获取模块701、模型训练模块702。

所述样本获取模块701，用于获取样本数据集，所述样本数据包括历史订单的实际送达时刻。

所述模型训练模块702，用于根据所述样本数据集和目标损失函数训练用于预测送达时刻的模型。

其中，所述目标损失函数包括：在送达时刻误差为正数情况下，所述送达时刻误差的绝对值与损失量之间的第一关系函数，以及在所述送达时刻误差为负数情况下，所述送达时刻误差的绝对值与损失量之间的第二关系函数，所述送达时刻误差为所述预计送达时刻与所述实际送达时刻之间的时间差；所述第一关系函数的第一变化速率与所述第二关系函数的第二变化速率不同，所述第一变化速率为第一关系函数中损失量随送达时刻误差绝对值变化的速率，所述第二变化速率为第二关系函数中损失量随送达时刻误差绝对值变化的速率。

通过上述技术方案，至少可以达到以下技术效果：

图8是根据一示例性公开实施例示出的一种配送时间确定的装置的框图。如图8所示，所述装置800包括特征获取模块801、特征处理模块802和发送模块803。

所述特征获取模块801，用于获取待配送订单的配送特征信息；

所述特征处理模块802，用于将所述配送特征信息输入配送时间确定模型，得到所述配送时间确定模型输出的所述待配送订单的预测送达时间；

所述发送模块803，用于将所述预测送达时间发送给产生所述待配送订单的客户端，以便该客户端对所述预测送达时间进行展示。

可选地，所述装置800还包括训练模块，所述训练模块包括样本获取子模块、模型训练子模块。

所述样本获取子模块，用于获取样本数据集，所述样本数据包括历史订单的实际送达时刻。

所述模型训练子模块，用于根据所述样本数据集和目标损失函数训练用于预测送达时刻的模型。

其中，所述目标损失函数包括：在送达时间误差为正数情况下，所述配送时间确定模型的所述目标损失函数的第一函数关系的第一变化速率，与在送达时间误差为负数情况下，所述配送时间确定模型的所述目标损失函数的第二函数关系的第二变化速率不同，所述送达时间误差为正数表明预测送达时间早于实际送达时间，送达时间误差为负数表明预测送达时间晚于实际送达时间，所述目标损失函数用于表征模型预测的损失量与送达时间误差之间的映射关系；在送达时刻误差为正数情况下，所述送达时刻误差的绝对值与损失量之间的第一关系函数，以及在所述送达时刻误差为负数情况下，所述送达时刻误差的绝对值与损失量之间的第二关系函数，所述送达时刻误差为所述预计送达时刻与所述实际送达时刻之间的时间差；所述第一关系函数的第一变化速率与所述第二关系函数的第二变化速率不同，所述第一变化速率为第一关系函数中损失量随送达时刻误差绝对值变化的速率，所述第二变化速率为第二关系函数中损失量随送达时刻误差绝对值变化的速率。

可选地，所述指令获取子模块，用于根据所述样本数据集中订单的类型信息和/或订单生成时的时间信息，确定损失函数类型；根据所述损失函数类型生成所述损失函数选择指令；其中，不同所述损失函数类型用于表征所述第一关系函数的第一变化速率与所述第二关系函数的第二变化速率不同大小关系。

通过上述技术方案，至少可以达到以下技术效果：

本公开实施例还提供一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现所述模型训练、配送时间确定的方法的步骤。

本公开实施例还提供一种电子设备，包括：

存储器，其上存储有计算机程序；

处理器，用于执行所述存储器中的所述计算机程序，以实现所述模型训练、配送时间确定的方法的步骤。

图9是根据一示例性实施例示出的一种电子设备的框图。如图9所示，该电子设备900可以包括：处理器901，存储器902。该电子设备900还可以包括多媒体组件903，输入/输出(I/O)接口904，以及通信组件905中的一者或多者。

其中，处理器901用于控制该电子设备900的整体操作，以完成上述的模型训练、配送时间确定的方法中的全部或部分步骤。存储器902用于存储各种类型的数据以支持在该电子设备900的操作，这些数据例如可以包括用于在该电子设备900上操作的任何应用程序或方法的指令，以及指令相关的数据，例如本公开实施例中的模型训练需要的数据、历史订单数据、函数数据、参数数据等。该存储器902可以由任何类型的易失性或非易失性存储设备或者它们的组合实现，例如静态随机存取存储器(Static Random Access Memory，简称SRAM)，电可擦除可编程只读存储器(Electrically Erasable Programmable Read-OnlyMemory，简称EEPROM)，可擦除可编程只读存储器(Erasable Programmable Read-OnlyMemory，简称EPROM)，可编程只读存储器(Programmable Read-Only Memory，简称PROM)，只读存储器(Read-Only Memory，简称ROM)，磁存储器，快闪存储器，磁盘或光盘。多媒体组件903可以包括屏幕和音频组件。其中屏幕例如可以是触摸屏，音频组件用于输出和/或输入音频信号。例如，音频组件可以包括一个麦克风，麦克风用于接收外部音频信号。所接收的音频信号可以被进一步存储在存储器902或通过通信组件905发送。音频组件还包括至少一个扬声器，用于输出音频信号。I/O接口904为处理器901和其他接口模块之间提供接口，上述其他接口模块可以是键盘，鼠标，按钮等。这些按钮可以是虚拟按钮或者实体按钮。通信组件905用于该电子设备900与其他设备之间进行有线或无线通信。无线通信，例如Wi-Fi，蓝牙，近场通信(Near Field Communication，简称NFC)，2G、3G或4G，或它们中的一种或几种的组合，因此相应的该通信组件905可以包括：Wi-Fi模块，蓝牙模块，NFC模块。

在一示例性实施例中，电子设备900可以被一个或多个应用专用集成电路(Application Specific Integrated Circuit，简称ASIC)、数字信号处理器(DigitalSignal Processor，简称DSP)、数字信号处理设备(Digital Signal Processing Device，简称DSPD)、可编程逻辑器件(Programmable Logic Device，简称PLD)、现场可编程门阵列(Field Programmable Gate Array，简称FPGA)、控制器、微控制器、微处理器或其他电子元件实现，用于执行上述的模型训练、配送时间确定的方法。

在另一示例性实施例中，还提供了一种包括程序指令的计算机可读存储介质，该程序指令被处理器执行时实现上述的模型训练、配送时间确定的方法的步骤。例如，该计算机可读存储介质可以为上述包括程序指令的存储器902，上述程序指令可由电子设备900的处理器901执行以完成上述的模型训练、配送时间确定的方法。

在可能的方式中，该电子设备的框图可以如图10所示。参照图10，该电子设备1000可以被提供为一服务器。参照图10，电子设备1000包括处理器1001，其数量可以为一个或多个，以及存储器1002，用于存储可由处理器1001执行的计算机程序。存储器1002中存储的计算机程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外，处理器1001可以被配置为执行该计算机程序，以执行上述模型训练、配送时间确定的方法中服务器所执行的步骤。

另外，电子设备1000还可以包括电源组件1003和通信组件1004，该电源组件1003可以被配置为执行电子设备1000的电源管理，该通信组件1004可以被配置为实现电子设备1000的通信，例如，有线或无线通信。此外，该电子设备1000还可以包括输入/输出(I/O)接口1005。电子设备1000可以操作基于存储在存储器1002的操作系统，例如WindowsServerTM，Mac OS XTM，UnixTM，LinuxTM等等。

在另一示例性实施例中，还提供了一种包括程序指令的计算机可读存储介质，该程序指令被处理器执行时实现上述模型训练、配送时间确定的方法中服务器所执行的步骤。例如，该计算机可读存储介质可以为上述包括程序指令的存储器1002，上述程序指令可由电子设备1000的处理器1001执行以完成上述模型训练、配送时间确定的方法的步骤。

以上结合附图详细描述了本公开的优选实施方式，但是，本公开并不限于上述实施方式中的具体细节，在本公开的技术构思范围内，可以对本公开的技术方案进行多种简单变型，这些简单变型均属于本公开的保护范围。

另外需要说明的是，在上述具体实施方式中所描述的各个具体技术特征，在不矛盾的情况下，可以通过任何合适的方式进行组合，为了避免不必要的重复，本公开对各种可能的组合方式不再另行说明。

此外，本公开的各种不同的实施方式之间也可以进行任意组合，只要其不违背本公开的思想，其同样应当视为本公开所公开的内容。

Claims

1.一种模型训练的方法，其特征在于，所述方法包括：

获取样本数据集，所述样本数据包括历史订单的实际送达时刻；

根据所述样本数据集和目标损失函数训练用于预测送达时刻的模型；

其中，所述目标损失函数包括：在送达时间误差为正数情况下，所述配送时间确定模型的所述目标损失函数的第一函数关系的第一变化速率，与在送达时间误差为负数情况下，所述配送时间确定模型的所述目标损失函数的第二函数关系的第二变化速率不同，所述送达时间误差为正数表明预测送达时间早于实际送达时间，送达时间误差为负数表明预测送达时间晚于实际送达时间，所述目标损失函数用于表征模型预测的损失量与送达时间误差之间的映射关系；所述第一变化速率为第一关系函数中损失量随送达时刻误差绝对值变化的速率，所述第二变化速率为第二关系函数中损失量随送达时刻误差绝对值变化的速率。

2.根据权利要求1所述的方法，其特征在于，所述方法还包括：

获取损失函数选择指令；

根据所述指令，从预置的多个候选函数表达式中，选择目标函数表达式；

从预置的对应所述目标函数表达式的多组系数组合中，选择目标系数组合；

根据所述目标函数表达式以及所述目标系数组合确定所述目标损失函数。

3.根据权利要求2所述的方法，其特征在于，所述从预置的对应所述目标函数表达式的多组系数组合中，选择目标系数组合，包括：

将每一所述系数组合带入所述目标函数表达式，得到待选损失函数；

针对每一得到的所述待选损失函数，执行以下操作：

通过所述待选损失函数以及训练样本数据集训练得到待检模型；

通过测试样本数据集测试所述待检模型，得到测试评价值；

确定所述测试评价值最优的待检模型对应的系数组合，为所述目标系数组合。

4.根据权利要求2或3所述的方法，其特征在于，所述多个候选函数表达式包括以下任意类型的表达式：

第一类型表达式：

其中，所述为所述预计送达时刻，所述Y为所述实际送达时刻，a₁和b₁为所述第一类型表达式的一组系数组合；

第二类型表达式：

5.根据权利要求2或3所述的方法，其特征在于，所述获取损失函数选择指令，包括：

根据所述样本数据集中订单的类型信息和/或订单生成时的时间信息，确定损失函数类型；

根据所述损失函数类型生成所述损失函数选择指令；

其中，不同所述损失函数类型用于表征所述第一关系函数的第一变化速率与所述第二关系函数的第二变化速率不同的大小关系。

6.一种配送时间确定的方法，其特征在于，所述方法包括：

获取待配送订单的配送特征信息；

将所述配送特征信息输入配送时间确定模型，得到所述配送时间确定模型输出的所述待配送订单的预测送达时间；

将所述预测送达时间发送给产生所述待配送订单的客户端，以便该客户端对所述预测送达时间进行展示；

其中，在送达时间误差为正数情况下，所述配送时间确定模型的目标损失函数的第一函数关系的第一变化速率，与在送达时间误差为负数情况下，所述配送时间确定模型的目标损失函数的第二函数关系的第二变化速率不同，所述送达时间误差为正数表明预测送达时间早于实际送达时间，送达时间误差为负数表明预测送达时间晚于实际送达时间，所述目标损失函数用于表征模型预测的损失量与送达时间误差之间的映射关系；所述第一变化速率为第一关系函数中损失量随送达时刻误差绝对值变化的速率，所述第二变化速率为第二关系函数中损失量随送达时刻误差绝对值变化的速率。

7.一种模型训练的装置，其特征在于，所述装置包括：

样本获取模块，用于获取样本数据集，所述样本数据包括历史订单的实际送达时刻；

模型训练模块，用于根据所述样本数据集和目标损失函数训练用于预测送达时刻的模型；

8.一种配送时间确定的装置，其特征在于，所述装置包括：

特征获取模块，用于获取待配送订单的配送特征信息；

特征处理模块，用于将所述配送特征信息输入配送时间确定模型，得到所述配送时间确定模型输出的所述待配送订单的预测送达时间；

发送模块，用于将所述预测送达时间发送给产生所述待配送订单的客户端，以便该客户端对所述预测送达时间进行展示；

其中，在送达时间误差为正数情况下，所述配送时间确定模型的目标损失函数的第一函数关系的第一变化速率，与在送达时间误差为负数情况下，所述配送时间确定模型的目标损失函数的第二函数关系的第二变化速率不同，所述送达时间误差为正数表明预测送达时间早于实际送达时间，送达时间误差为负数表明预测送达时间晚于实际送达时间，所述目标损失函数用于表征模型预测的损失量与送达时间误差之间的映射关系；

所述第一变化速率为第一关系函数中损失量随送达时刻误差绝对值变化的速率，所述第二变化速率为第二关系函数中损失量随送达时刻误差绝对值变化的速率。

9.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现权利要求1-5中任一项所述方法的步骤。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现权利要求6中所述方法的步骤。

11.一种电子设备，其特征在于，包括：

存储器，其上存储有计算机程序；

处理器，用于执行所述存储器中的所述计算机程序，以实现权利要求1-5中任一项所述方法的步骤。

12.一种电子设备，其特征在于，包括：

存储器，其上存储有计算机程序；

处理器，用于执行所述存储器中的所述计算机程序，以实现权利要求6所述方法的步骤。