CN114386880A

CN114386880A - 模型训练方法、需求确定方法及装置

Info

Publication number: CN114386880A
Application number: CN202210282448.1A
Authority: CN
Inventors: 曹绍升
Original assignee: Beijing Qisheng Technology Co Ltd
Current assignee: Xiamen Qiwen Technology Co ltd; Beijing Qisheng Technology Co Ltd
Priority date: 2022-03-22
Filing date: 2022-03-22
Publication date: 2022-04-22
Anticipated expiration: 2042-03-22
Also published as: CN114386880B

Abstract

本公开提供了一种模型训练方法、需求确定方法及装置，其中，该模型训练方法包括：针对多个第一历史时间段中的每个第一历史时间段，获取在该第一历史时间段内各网格区域对的订单数量；将前预设数量个第一历史时间段内各网格区域对的订单数量输入至原始模型中，得到第一参考订单数量；将前预设数量个第一历史时间段内各网格区域对的订单数量输入至压缩模型，得到第二参考订单数量；基于第一参考订单数量、第二参考订单数量和最后一个第一历史时间段内各网格区域对的真实订单数量，对压缩模型进行训练。本公开实施例通过知识蒸馏对原始模型进行压缩，得到的压缩模型使用的参数量更少，能够减少订单数量确定过程中的计算资源消耗量。

Description

模型训练方法、需求确定方法及装置

技术领域

本公开涉及计算机技术领域，具体而言，涉及一种模型训练方法、需求确定方法及装置。

背景技术

随着互联网技术的发展，网络预约出行服务逐渐成为人们出行的重要选择。乘客可以按照出行计划，在网上下达从出发地到目的地的出行订单。为了更好地满足乘客的出行需求，可以依据以往的订单数量，确定各个起终点之间在未来一段时间内的订单数量，进而利用确定出来的订单数量，帮助调度人员为各个地点更合理地调度车辆。

但是通常情况下，对订单数量的确定过程需要消耗大量的计算资源，给计算设备带来较大的工作负担。

发明内容

本公开实施例至少提供一种模型训练方法、需求确定方法及装置。

第一方面，本公开实施例提供了一种模型训练方法，包括：

针对多个第一历史时间段中的每个第一历史时间段，获取在该第一历史时间段内，各网格区域对的订单数量；其中，所述网格区域对中包括作为订单起点的第一网格区域和作为订单终点的第二网格区域；

将所述多个第一历史时间段中的前预设数量个第一历史时间段内，所述各网格区域对的订单数量输入至训练好的原始模型中，得到所述多个第一历史时间段的最后一个第一历史时间段内，所述各网格区域对的第一参考订单数量；

将所述前预设数量个第一历史时间段内所述各网格区域对的订单数量输入至待训练的压缩模型，得到所述多个第一历史时间段中最后一个第一历史时间段内，所述各网格区域对的第二参考订单数量；

基于所述第一参考订单数量、所述第二参考订单数量、和所述最后一个第一历史时间段内所述各网格区域对的真实订单数量，对所述待训练的压缩模型进行训练，得到训练好的压缩模型。

一种可选的实施方式中，所述基于所述第一参考订单数量、所述第二参考订单数量、和所述最后一个第一历史时间段内所述各网格区域对的真实订单数量，对所述待训练的压缩模型进行训练，得到训练好的压缩模型，包括：

基于所述第一参考订单数量和所述第二参考订单数量，确定第一损失信息；以及基于所述真实订单数量和所述第二参考订单数量，确定第二损失信息；

基于所述第一损失信息和所述第二损失信息，对所述待训练的压缩模型进行训练，得到训练好的压缩模型。

一种可选的实施方式中，将所述前预设数量个第一历史时间段内所述各网格区域对的订单数量输入至训练好的原始模型中之前，所述方法还包括：

基于各个所述网格区域分别对应的位置信息，确定不同网格区域之间的位置信息相似度；

所述将所述多个第一历史时间段中的前预设数量个第一历史时间段内，所述各网格区域对的订单数量输入至训练好的原始模型中，得到所述多个第一历史时间段的最后一个第一历史时间段内，所述各网格区域对的第一参考订单数量，包括：

将所述多个第一历史时间段中的前预设数量个第一历史时间段内，所述各网格区域对的订单数量，以及所述不同网格区域之间的位置信息相似度输入至训练好的原始模型中，得到最后一个第一历史时间段内所述各网格区域对的第一参考订单数量。

一种可选的实施方式中，将所述多个第一历史时间段中的前预设数量个第一历史时间段内，所述各网格区域对的订单数量输入至训练好的原始模型中之前，所述方法还包括：

将所述多个第一历史时间段中的前预设数量个第一历史时间段内，所述各网格区域对的订单数量作为原始模型输入数据，将所述最后一个第一历史时间段内，所述各网格区域对的真实订单数量作为标注数据，训练得到所述原始模型。

一种可选的实施方式中，所述多个第一历史时间段为多个连续的第一历史时间段；

所述将所述多个第一历史时间段中的前预设数量个第一历史时间段内，所述各网格区域对的订单数量输入至预先训练好的原始模型中，得到所述多个第一历史时间段的最后一个第一历史时间段内，所述各网格区域对的第一参考订单数量，包括：

将所述多个连续的第一历史时间段中，连续的前预设数量个第一历史时间段内所述各网格区域对的订单数量输入至训练好的原始模型中，得到最后一个第一历史时间段内，所述各网格区域对的第一参考订单数量。

一种可选的实施方式中，所述多个第一历史时间段为多个连续的第二历史时间段中的目标子时间段，其中不同的目标子时间段在所属第二历史时间段内的相对时间位置相同；

将多个所述目标子时间段中的前预设数量个目标子时间段内，所述各网格区域对的订单数量输入至预先训练好的原始模型中，得到多个所述目标子时间段的最后一个目标子时间段内，所述各网格区域对的第一参考订单数量。

一种可选的实施方式中，得到训练好的压缩模型之后，所述方法还包括：

针对在目标时间段之前的多个第二历史时间段中的每个第二历史时间段，获取在该第二历史时间段内，各网格区域对的订单数量；所述目标时间段为在所述多个第一历史时间段的最后一个第一历史时间段之后的时间段；

将在所述目标时间段之前的至少一个第二历史时间段内的所述各网格区域对的订单数量输入至训练得到的所述压缩模型中，得到所述目标时间段内所述各网格区域对的第三参考订单数量；

将所述第三参考订单数量与所述目标时间段内所述各网格区域对的真实订单数量进行对比，确定模型测试结果；

在所述模型测试结果不合格的情况下，更新训练样本，并基于更新的训练样本对所述压缩模型进行重新训练，或者，基于更新的训练样本对所述原始模型和所述压缩模型进行重新训练；

其中，更新后的所述训练样本包括在所述目标时间段内，以及在目标时间段之前的至少一个历史时间段内，所述各网格区域对的订单数量。

第二方面，本公开实施例还提供一种需求确定方法，包括：

获取在未来预设时间段之前的至少一个时间段内的各网格区域对的订单数量；

将所述在未来预设时间段之前的至少一个时间段内的各网格区域对的订单数量输入至基于第一方面，或第一方面中任一种可能的实施方式中所述的模型训练方法训练得到的所述压缩模型中，得到所述未来预设时间段内所述各网格区域对的参考订单数量。

一种可选的实施方式中，所述订单为出行服务订单；在得到所述未来预设时间段内所述各网格区域对的参考订单数量之后，所述方法还包括：

获取当前各个网格区域内出行服务对象的数量；

在获取的所述网格区域内出行服务对象的数量，与所述未来预设时间段内，以该网格区域作为订单起点的所述网格区域对的参考订单数量不匹配的情况下，对至少一个所述网格区域内的出行服务对象进行调度，以使得各网格区域内的出行服务对象的数量与所述未来预设时间段内所述各网格区域对的参考订单数量相匹配。

第三方面，本公开实施例还提供一种模型训练装置，包括：

第一获取模块，用于针对多个第一历史时间段中的每个第一历史时间段，获取在该第一历史时间段内，各网格区域对的订单数量；其中，所述网格区域对中包括作为订单起点的第一网格区域和作为订单终点的第二网格区域；

第一输入模块，用于将所述多个第一历史时间段中的前预设数量个第一历史时间段内，所述各网格区域对的订单数量输入至训练好的原始模型中，得到所述多个第一历史时间段的最后一个第一历史时间段内，所述各网格区域对的第一参考订单数量；

第二输入模块，用于将所述前预设数量个第一历史时间段内所述各网格区域对的订单数量输入至待训练的压缩模型，得到所述多个第一历史时间段中最后一个第一历史时间段内，所述各网格区域对的第二参考订单数量；

第一训练模块，用于基于所述第一参考订单数量、所述第二参考订单数量、和所述最后一个第一历史时间段内所述各网格区域对的真实订单数量，对所述待训练的压缩模型进行训练，得到训练好的压缩模型。

第四方面，本公开实施例还提供一种需求确定装置，包括：

第一获取模块，用于获取在未来预设时间段之前的至少一个时间段内的各网格区域对的订单数量；

输入模块，用于将所述在未来预设时间段之前的至少一个时间段内的各网格区域对的订单数量输入至基于第一方面，或第一方面中任一种可能的实施方式中任一所述的模型训练方法训练得到的所述压缩模型中，得到所述未来预设时间段内所述各网格区域对的参考订单数量。

第五方面，本公开实施例还提供一种计算机设备，包括：处理器、存储器和总线，所述存储器存储有所述处理器可执行的机器可读指令，当计算机设备运行时，所述处理器与所述存储器之间通过总线通信，所述机器可读指令被所述处理器执行时执行上述第一方面，或第一方面中任一种可能的实施方式中的步骤，或执行上述第二方面，或第二方面中可能的实施方式中的步骤。

第六方面，本公开实施例还提供一种计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，该计算机程序被处理器运行时执行上述第一方面，或第一方面中任一种可能的实施方式中的步骤，或执行上述第二方面，或第二方面中可能的实施方式中的步骤。

第七方面，本公开实施例还提供一种计算机程序产品，该计算机产品承载有程序代码，所述程序代码包括的指令可用于执行上述第一方面，或第一方面中任一种可能的实施方式中的步骤，或执行上述第二方面，或第二方面中可能的实施方式中的步骤。

本公开实施例提供的模型训练方法，可以通过知识蒸馏的方法对训练好的原始模型进行压缩，得到训练好的压缩模型，即：利用训练好的原始模型得到的多个第一历史时间段的最后一个第一历史时间段内，各网格区域对的第一参考订单数量、待训练的压缩模型得到的多个第一历史时间段中最后一个第一历史时间段内，各网格区域对的第二参考订单数量、以及后一个第一历史时间段内各网格区域对的真实订单数量，得到训练好的压缩模型；通过这种方式训练好的压缩模型可以在一定程度上继承原始模型的学习效果，同时相比于原始模型，使用的模型参数量更少，因此在确定订单数量的过程中，能够减少计算资源的消耗量。

进一步，本公开实施例在确定第一参考订单数量的时候，在训练好的原始模型中还输入了不同网格区域之间的位置信息相似度，如此，可以将位置信息相似的网格区域对之间的订单数量形成参考，从而使得得到的第一参考订单数量更加准确。

为使本公开的上述目的、特征和优点能更明显易懂，下文特举较佳实施例，并配合所附附图，作详细说明如下。

附图说明

为了更清楚地说明本公开实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，此处的附图被并入说明书中并构成本说明书中的一部分，这些附图示出了符合本公开的实施例，并与说明书一起用于说明本公开的技术方案。应当理解，以下附图仅示出了本公开的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1示出了本公开实施例所提供的一种模型训练方法的流程图；

图2示出了本公开实施例所提供的另一种模型训练方法的流程图；

图3示出了本公开实施例所提供的一种需求确定方法的流程图；

图4示出了本公开实施例所提供的一种模型训练装置的示意图；

图5示出了本公开实施例所提供的一种需求确定装置的示意图；

图6示出了本公开实施例所提供的一种计算机设备的示意图。

具体实施方式

为使本公开实施例的目的、技术方案和优点更加清楚，下面将结合本公开实施例中附图，对本公开实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本公开一部分实施例，而不是全部的实施例。通常在此处附图中描述和示出的本公开实施例的组件可以以各种不同的配置来布置和设计。因此，以下对在附图中提供的本公开的实施例的详细描述并非旨在限制要求保护的本公开的范围，而是仅仅表示本公开的选定实施例。基于本公开的实施例，本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本公开保护的范围。

在确定订单数量过程中，通常情况下，订单数量较为庞大，一般会增加服务器的个数，搭建稳定的分布式计算集群，但是仍然需要消耗大量的计算资源，给服务器等计算设备带来较大的工作负担。

基于此，本公开提供了一种模型训练方法，可以通过知识蒸馏的方法对训练好的原始模型进行压缩，得到训练好的压缩模型，即：利用训练好的原始模型得到的多个第一历史时间段的最后一个第一历史时间段内，各网格区域对的第一参考订单数量、待训练的压缩模型得到的多个第一历史时间段中最后一个第一历史时间段内，各网格区域对的第二参考订单数量、以及后一个第一历史时间段内各网格区域对的真实订单数量，得到训练好的压缩模型；通过这种方式训练好的压缩模型可以在一定程度上继承原始模型的学习效果，同时相比于原始模型，使用的模型参数量更少，因此在确定订单数量的过程中，能够减少计算资源的消耗量。

针对以上方案所存在的缺陷以及所提出的解决方案，均是发明人在经过实践并仔细研究后得出的结果，因此，上述问题的发现过程以及下文中本公开针对上述问题所提出的解决方案，都应该是发明人在本公开过程中对本公开做出的贡献。

应注意到：相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步定义和解释。

为便于对本实施例进行理解，首先对本公开实施例所公开的一种模型训练方法进行详细介绍，本公开实施例所提供的模型训练方法的执行主体一般为具有一定计算能力的计算机设备。

本公开实施例提供的模型训练方法可以适用于使用出行服务对象（例如共享单车、共享电动车、代驾、货运、网约车等）下单的场景中。需要说明的是，本公开实施例中所涉及到的所有用户相关数据，比如订单信息（例如订单起点、订单终点）等，都是经用户授权之后使用的。

下面以执行主体为服务器为例对本公开实施例提供的模型训练方法加以说明。

参见图1所示，为本公开实施例提供的模型训练方法的流程图，所述方法包括S101~S104，其中：

S101：针对多个第一历史时间段中的每个第一历史时间段，获取在该第一历史时间段内，各网格区域对的订单数量；其中，所述网格区域对中包括作为订单起点的第一网格区域和作为订单终点的第二网格区域。

在本公开实施例中，网格区域可以是对目标区域进行划分后的子区域，在实际划分中，可以按照预设范围进行划分，例如，将某市区划分成多个3km x 3km的子区域。这里，可以将任一网格区域作为订单起点，并将多个网格区域中出订单起点以外的任一网格区域作为订单终点，因此，第一网格区域可以是多个网格区域中的任一网格区域，第二网格区域可以是多个网格区域中除第一网格区域以外的任一网格区域。示例性地，针对5个网格区域，组合后可以得到20个网格区域对。针对每个网格区域对，可以分别获取在第一历史时间段内，该各网格区域对的订单数量。其中，订单数量可以指下达的订单的数量，也可以指已完成的订单的数量。优选地，订单数量可以指下达的订单的数量。

多个第一历史时间段可以为多个连续的第一历史时间段。例如在过去的24小时，可以将每个小时作为一个第一历史时间段，即在过去的24小时，可以包括24个第一历史时间段。多个第一历史时间段也可以为多个连续的第二历史时间段中的目标子时间段，每个第二历史时间段中的目标子时间段可以为第二历史时间段中的任意一段时间段，其中，不同的目标子时间段在所属第二历史时间段内的相对时间位置相同。例如，在过去的一个月，可以将每天作为一个第二历史时间段，每个目标子时间段可以为每天中的15点至18点。

在本公开实施例中，可以预先获取起终点（Origin-Destination，OD）发单量需求时序数据。OD发单量需求时序数据中包括由多个第一历史时间段组成的目标历史时间段内，各网格区域对的订单数量。OD发单量需求时序数据可以用三维向量的形式表示。按照时间段对三维向量在时间维度进行切分，可以得到多个时间切片，每个时间切片可以对应一个二维矩阵，每个二维矩阵可以对应一个第一历史时间段内各网格区域对的订单数量。

例如，以目标历史时间段为过去的24小时为例，按照每个小时对过去24小时的OD发单量需求时序数据在时间维度进行划分，可以得到24个时间切片，第k（k为大于等于1，且小于等于24的正整数）个二维矩阵可以对应第k小时内各网格区域对的订单数量。在第k个二维矩阵中，第i（i为大于等于1，且小于等于网格区域的总数量的正整数）行第j（j为大于等于1，且小于等于网格区域的总数量的正整数）列的矩阵元素可以表示为：从第i个网络区域（订单起点）到第j个网络区域（订单终点）之间的订单数量。

在本公开实施例中，获取的多个第一历史时间段中的每个第一历史时间段内，各网格区域对的订单数量可以为真实的订单数量。

接下来，可以将获取的多个第一历史时间段中的每个第一历史时间段内，各网格区域对的订单数量可以作为输入，输入到训练好的原始模型中，得到多个第一历史时间段的最后一个第一历史时间段内，各网格区域对的第一参考订单数量，也即，根据训练好的原始模型得到多个第一历史时间段的最后一个第一历史时间段内，各网格区域对的预测订单数量，然后利用得到的第一参考订单数量，和获取的多个第一历史时间段中的每个第一历史时间段内，各网格区域对的订单数量对待训练的压缩模型进行训练，该过程将在下文进行详述。

获取的多个第一历史时间段中的每个第一历史时间段内，各网格区域对的订单数量还可以作为训练样本对待训练的原始模型进行训练，得到前述的训练好的原始模型。

其中，相对于后续的压缩模型而言，原始模型是一种复杂的神经网络模型，也就是原始模型的神经网络层数多于压缩模型的神经网络层数。具体地，原始模型可以为多层的长短期记忆（Long Short Term，LSTM）模型，或者LSTM结合图神经网络（Graph NeuralNetwork，GNN）的模型，或者其他深度学习模型。压缩模型可以为浅层的神经网络模型，具体地，压缩模型可以为1~2层的LSTM模型。

具体地，可以将多个第一历史时间段中的前预设数量个第一历史时间段内，各网格区域对的订单数量作为原始模型输入数据，以及，将多个第一历史时间段中的最后一个第一历史时间段内，各网格区域对的真实订单数量作为标注数据，对待训练的原始模型进行训练，得到训练好的原始模型。其中，对原始模型进行训练的过程可以是在将多个第一历史时间段中的前预设数量个第一历史时间段内，各网格区域对的订单数量输入至训练好的原始模型中之前完成的。

在对原始模型进行的训练过程中，可以按照多个第一历史时间段中各个第一历史时间段的时间顺序，选取前预设数量个第一历史时间段内，各网格区域对的订单数量作为原始模型输入数据。例如，第一历史时间段的总数量为10时，可以选取前9个第一历史时间段内，各网格区域对的订单数量作为原始模型输入数据。然后，可以将第10个第一历史时间段内，各网格区域对的真实订单数量作为标注数据。

这里，可以将多个第一历史时间段中的前预设数量个第一历史时间段内，各网格区域对的订单数量，和多个第一历史时间段中的最后一个第一历史时间段内，各网格区域对的真实订单数量作为一个训练样本，在实际中可以获取多个这样的训练样本，然后利用多个训练样本对原始模型进行训练，直至达到训练截止条件。训练截止条件例如可以为预设训练次数，也可以为多个第一历史时间段中的最后一个第一历史时间段内，各网格区域对的参考订单数量与标注数据的差值小于设定阈值。

通过训练得到的原始模型，能够基于在未来预设时间段之前的至少一个时间段内，各网格区域对的订单数量，确定未来预设时间段内各网格区域对的订单数量。在对原始模型进行训练的时候，原始模型输入数据和标注数据可以是以二维矩阵的形式输入至原始模型中的。也就是，通过训练得到的原始模型，能够基于二维矩阵的形式、未来预设时间段之前的至少一个时间段内，各网格区域对的订单数量，得到二维矩阵的形式、未来预设时间段内各网格区域对的订单数量。

在一种方式中，考虑到某些场景（例如货物运输场景）下的网格区域对的订单数量较少，在订单数量较少的情况下，将多个第一历史时间段中的前预设数量个第一历史时间段内，各网格区域对的订单数量，训练得到的原始模型，得到的第一参考订单数量准确度较低，因此，可以基于各个网格区域分别对应的位置信息，确定不同网格区域之间的位置信息相似度。接下来，可以将原始模型输入数据、不同网格区域之间的位置信息相似度，和标注数据共同输入至待训练的原始模型中，得到训练好的原始模型。

这里，各个网格区域分别对应的位置信息可以包括第一网格区域的位置信息和第二网格区域的位置信息。位置信息可以包括网格区域内包含的各个地点的位置信息，即兴趣点（Point of Interest，POI）信息，例如网格区域内包含的商场的位置信息、学校的位置信息等。其中，POI信息可以用二维矩阵的形式表示，在二维矩阵形式的POI信息中，第i行第j列表示为：第i个网格区域与第j个网格区域的位置信息相似度。这里可以使用向量点积、夹角余弦等方式进行位置信息相似度的计算，这里可以利用GNN对POI信息进行处理，具体过程不再详述。

通常，在不同网格区域之间的位置信息相似度较大的情况下，不同网格区域之间的订单数量也是比较接近的，因此，将不同网格区域之间的位置信息相似度作为输入对原始模型进行训练，可以提高第一参考订单数量的准确性。在上述方式中，示例性地，原始模型可以为LSTM结合GNN的模型。

S102：将所述多个第一历史时间段中的前预设数量个第一历史时间段内，所述各网格区域对的订单数量输入至训练好的原始模型中，得到所述多个第一历史时间段的最后一个第一历史时间段内，所述各网格区域对的第一参考订单数量。

如前所述，训练好的原始模型能够根据未来预设时间段之前的至少一个时间段内，各网格区域对的订单数量，确定出未来预设时间段内各网格区域对的订单数量，这里，在将多个第一历史时间段中的前预设数量个第一历史时间段内，各网格区域对的订单数量作为输入的时候，可以利用训练好的原始模型，得到多个第一历史时间段的最后一个第一历史时间段内，各网格区域对的第一参考订单数量。

在多个第一历史时间段为多个连续的第一历史时间段的情况下，可以将多个连续的第一历史时间段中，连续的前预设数量个第一历史时间段内各网格区域对的订单数量输入至训练好的原始模型中，得到最后一个第一历史时间段内，各网格区域对的第一参考订单数量。

例如，在多个第一历史时间段为过去连续的24小时，一个小时为一个第一历史时间段的情况下，可以将前23小时中每个小时内各网格区域对的订单数量输入至训练好的原始模型中，得到最后一个小时内各网格区域对的第一参考订单数量。

在多个第一历史时间段为多个连续的第二历史时间段中的目标子时间段的情况下，可以将多个目标子时间段中的前预设数量个目标子时间段中的前预设数量个目标子时间段内，各网格区域对的订单数量输入至预先训练好的原始模型中，得到多个目标子时间段的最后一个目标子时间段内，个网格区域对的第一参考订单数量。

例如，在多个连续的第二历史时间段为过去的一个月（以30天为例），一天中的15点至18点为一个目标子时间段，也就是一天中的15点至18点为一个第一历史时间段的情况下，可以将前29天中每天的15点至18点内各网格区域对的订单数量输入至训练好的原始模型中，得到第30天的15点至18点内各网格区域对的第一参考订单数量。

如前所述，考虑到某些场景（例如货物运输场景）下的网格区域对的订单数量较少，在订单数量较少的情况下，将多个第一历史时间段中的前预设数量个第一历史时间段内，各网格区域对的订单数量输入至训练好的原始模型中，得到的第一参考订单数量准确度较低，因此，在一种实施方式中，在将前预设数量个第一历史时间段内各网格区域对的订单数量输入至训练好的原始模型中之前，可以基于各个网格区域分别对应的位置信息，确定不同网格区域之间的位置信息相似度。接下来，可以将多个第一历史时间段中的前预设数量个第一历史时间段内，各网格区域对的订单数量，以及不同网格区域之间的位置信息相似度共同输入至训练好的原始模型中，得到最后一个第一历史时间段内各网格区域对的第一参考订单数量。

在上述实施方式中，确定不同网格区域之间的位置信息相似度的具体过程可以参照前述在对原始模型的训练过程中的描述，这里不再赘述。通常，在不同网格区域之间的位置信息相似度较大的情况下，不同网格区域之间的订单数量也是比较接近的，因此，在训练好的原始模型中输入不同网格区域之间的位置信息相似度，可以提高第一参考订单数量的准确性。

S103：将所述前预设数量个第一历史时间段内所述各网格区域对的订单数量输入至待训练的压缩模型，得到所述多个第一历史时间段中最后一个第一历史时间段内，所述各网格区域对的第二参考订单数量。

同样使用到前预设数量个第一历史时间段内各网格区域对的订单数量，这里，将前预设数量个第一历史时间段内各网格区域对的订单数量作为输入数据，输入到待训练的压缩模型。待训练的压缩模型可以基于输入数据，得到多个第一历史时间段中最后一个第一历史时间段内，各网格区域对的第二参考订单数量，也即基于待训练的压缩模型得到多个第一历史时间段中最后一个第一历史时间段内，各网格区域对的预测订单数量。

S104：基于所述第一参考订单数量、所述第二参考订单数量、和所述最后一个第一历史时间段内所述各网格区域对的真实订单数量，对所述待训练的压缩模型进行训练，得到训练好的压缩模型。

在具体实施中，可以基于第一参考订单数量和第二参考订单数量，确定第一损失信息，这里可以记为L₁，以及基于真实订单数量和第二参考订单数量，确定第二损失信息，这里可以记为L₂。其中，第一损失信息对应的损失函数和第二损失信息对应的损失函数可以相同，也可以不同，这里可以不作具体限定。

然后，基于第一损失信息和第二损失信息，对待训练的压缩模型进行训练，得到训练好的压缩模型。

具体地，可以基于第一损失信息和第二损失信息，计算总的损失信息L=λ₁L₁+λ₂L₂，其中，λ₁和λ₂为超参数，可以根据实际情况设定。在实际中可以对压缩模型进行多轮训练，直至达到训练截止条件。训练截止条件例如可以为总的损失信息小于设定阈值。

训练好的压缩模型能够根据输入的未来预设时间段之前的至少一个时间段内的各网格区域对的订单数量，得到未来预设时间段内各网格区域对的参考订单数量。

在得到训练好的压缩模型之后，还可以通过对压缩模型进行测试的方式，检验压缩模型的准确性。在一种实施方式中，还可以针对在目标时间段之前的多个第二历史时间段中的每个第二历史时间段，获取在该第二历史时间段内，各网格区域对的订单数量；目标时间段为在多个第一历史时间段的最后一个第一历史时间段之后的时间段。

这里，目标时间段也可以是历史时间段，并且目标时间段是在多个第一历史时间段的最后一个第一历史时间段之前的时间段。

接下来，将在目标时间段之前的至少一个第二历史时间段内的各网格区域对的订单数量输入至训练得到的压缩模型中，得到目标时间段内各网格区域对的第三参考订单数量。

然后，将第三参考订单数量与目标时间段内各网格区域对的真实订单数量进行对比，确定模型测试结果。

然后，在模型测试结果不合格的情况下，更新训练样本，并基于更新的训练样本对压缩模型进行重新训练，或者，基于更新的训练样本对原始模型和压缩模型进行重新训练；其中，更新后的训练样本包括在目标时间段内，以及在目标时间段之前的至少一个历史时间段内，各网格区域对的订单数量。

其中，模型测试结果不合格可以指第三参考订单数量与目标时间段内各网格区域对的真实订单数量的差值超出预设数值范围。在模型测试结果不合格的情况下，说明得到的第三参考订单数量准确度较低，也就是先之前得到的压缩模型的准确度较低，因此可以更新训练样本，对压缩模型进行重新训练，或者，基于更新的训练样本对原始模型和压缩模型进行重新训练。

这里，可以将目标时间段内，以及在目标时间段之前的至少一个历史时间段内，各网格区域对的订单数量加入到之前的训练样本中，从而更新训练样本。

为了使得训练好的压缩模型得到的参考订单数量更加准确，对压缩模型进行重新训练或者对原始模型和压缩模型进行重新训练之后，可以继续重复上述测试过程，直至在多轮测试的模型测试结果一直保持合格。

参见图2，本公开实施例还提供另一种模型训练方法的示意图。下面以过去10个小时中每个小时内，各网格区域对的订单数量作为训练数据，对压缩模型进行训练为例，对本公开实施例还提供另一种模型训练方法进行描述。其中，原始模型以多层LSTM模型、压缩模型以1~2层的浅层LSTM模型为例。

步骤1，获取训练数据。

获取过去10个小时中每个小时内，各网格区域对的订单数量，用三维向量形式表示。在获取到过去10个小时中每个小时内，各网格区域对的订单数量之后，进一步地，还可以以每个小时为一个时间切片，得到10个二维矩阵，每个二维矩阵对应一个小时内各网格区域对的订单数量。

具体地，第N（N为大于等于1，且小于等于10的正整数）个矩阵中第i（i为大于等于1，且小于等于网格区域的总数量的正整数）行第j（j为大于等于1，且小于等于网格区域的总数量的正整数）列的矩阵元素可以表示为：从第i个网络区域（订单起点）到第j个网络区域（订单终点）之间的订单数量。

步骤2，利用训练数据，训练原始模型，得到训练好的原始模型。

将过去10个小时中前9个小时对应的二维矩阵作为原始模型输入数据，将第10个小时对应的二维矩阵作为标注数据，也就是原标签，对待训练的原始模型进行训练，得到训练好的原始模型。

步骤3，利用训练数据和训练好的原始模型，得到第一参考结果。

将过去10个小时中前9个小时对应的二维矩阵输入至训练好的原始模型中，得到第一参考结果，也就是伪标签。

步骤4，利用训练数据和第一参考结果，训练压缩模型，得到训练好的压缩模型。

将训练数据中包含的过去10个小时中前9个小时对应的二维矩阵输入至待训练的压缩模型中，得到第二参考结果。

基于第一参考结果（伪标签）和第二参考结果，计算第一训练损失信息，以及基于第10个小时对应的二维矩阵（原标签）和第二参考结果，计算第二训练损失信息。

对第一训练损失信息和第二训练损失信息进行加权求和，对待训练的压缩模型进行训练，得到训练好的压缩模型。

参见图3所示，为本公开实施例提供的一种需求确定方法的流程图，其中：

S301：获取在未来预设时间段之前的至少一个时间段内的各网格区域对的订单数量。

S302：将在未来预设时间段之前的至少一个时间段内的各网格区域对的订单数量输入至本公开实施例提供的模型训练方法训练得到的压缩模型中，得到未来预设时间段内各网格区域对的参考订单数量。

在一种实施方式中，订单为出行服务订单的情况下，可以获取当前各个网格区域内出行服务对象的数量，然后在获取的网格区域内出行服务对象的数量，与未来预设时间段内，以该网格区域作为订单起点的网格区域对的参考订单数量不匹配的情况下，对至少一个网格区域内的出行服务对象进行调度。根据得到的参考订单数量，可以实现对出行服务对象的调度，从而使得各网格区域内的出行服务对象的数量与未来预设时间段内各网格区域对的参考订单数量相匹配。

本领域技术人员可以理解，在具体实施方式的上述方法中，各步骤的撰写顺序并不意味着严格的执行顺序而对实施过程构成任何限定，各步骤的具体执行顺序应当以其功能和可能的内在逻辑确定。

基于同一发明构思，本公开实施例中还提供了与模型训练方法对应的模型训练装置，由于本公开实施例中的装置解决问题的原理与本公开实施例上述模型训练方法相似，因此装置的实施可以参见方法的实施，重复之处不再赘述。

参照图4所示，为本公开实施例提供的一种模型训练装置的架构示意图，所述装置包括：第一获取模块401、第一输入模块402、第二输入模块403、第一训练模块404；其中，

第一获取模块401，用于针对多个第一历史时间段中的每个第一历史时间段，获取在该第一历史时间段内，各网格区域对的订单数量；其中，所述网格区域对中包括作为订单起点的第一网格区域和作为订单终点的第二网格区域；

第一输入模块402，用于将所述多个第一历史时间段中的前预设数量个第一历史时间段内，所述各网格区域对的订单数量输入至训练好的原始模型中，得到所述多个第一历史时间段的最后一个第一历史时间段内，所述各网格区域对的第一参考订单数量；

第二输入模块403，用于将所述前预设数量个第一历史时间段内所述各网格区域对的订单数量输入至待训练的压缩模型，得到所述多个第一历史时间段中最后一个第一历史时间段内，所述各网格区域对的第二参考订单数量；

第一训练模块404，用于基于所述第一参考订单数量、所述第二参考订单数量、和所述最后一个第一历史时间段内所述各网格区域对的真实订单数量，对所述待训练的压缩模型进行训练，得到训练好的压缩模型。

一种可选的实施方式中，第一训练模块404，具体用于：

一种可选的实施方式中，所述装置还包括：

确定模块，用于基于各个所述网格区域分别对应的位置信息，确定不同网格区域之间的位置信息相似度；

第一输入模块402，具体用于：

一种可选的实施方式中，所述装置还包括：

第二训练模块，用于将所述多个第一历史时间段中的前预设数量个第一历史时间段内，所述各网格区域对的订单数量作为原始模型输入数据，将所述最后一个第一历史时间段内，所述各网格区域对的真实订单数量作为标注数据，训练得到所述原始模型。

第一训练模块402，具体用于：

一种可选的实施方式中，所述装置还包括：

第二获取模块，用于针对在目标时间段之前的多个第二历史时间段中的每个第二历史时间段，获取在该第二历史时间段内，各网格区域对的订单数量；所述目标时间段为在所述多个第一历史时间段的最后一个第一历史时间段之后的时间段；

第三输入模块，用于将在所述目标时间段之前的至少一个第二历史时间段内的所述各网格区域对的订单数量输入至训练得到的所述压缩模型中，得到所述目标时间段内所述各网格区域对的第三参考订单数量；

对比模块，用于将所述第三参考订单数量与所述目标时间段内所述各网格区域对的真实订单数量进行对比，确定模型测试结果；

更新模块，用于在所述模型测试结果不合格的情况下，更新训练样本，并基于更新的训练样本对所述压缩模型进行重新训练，或者，基于更新的训练样本对所述原始模型和所述压缩模型进行重新训练；

本公开实施例中还提供了与需求确定方法对应的需求确定装置，由于本公开实施例中的装置解决问题的原理与本公开实施例上述需求确定方法相似，因此装置的实施可以参见方法的实施，重复之处不再赘述。

参照图5所示，为本公开实施例提供的另一种模型训练装置的架构示意图，所述装置包括：

第一获取模块501，用于获取在未来预设时间段之前的至少一个时间段内的各网格区域对的订单数量；

输入模块502，用于将所述在未来预设时间段之前的至少一个时间段内的各网格区域对的订单数量输入至基于本公开实施例提供的模型训练方法训练得到的所述压缩模型中，得到所述未来预设时间段内所述各网格区域对的参考订单数量。

在一种可选的实施方式中，所述订单为出行服务订单；所述装置还包括：

第二获取模块，用于获取当前各个网格区域内出行服务对象的数量；

调度模块，用于在获取的所述网格区域内出行服务对象的数量，与所述未来预设时间段内，以该网格区域作为订单起点的所述网格区域对的参考订单数量不匹配的情况下，对至少一个所述网格区域内的出行服务对象进行调度，以使得各网格区域内的出行服务对象的数量与所述未来预设时间段内所述各网格区域对的参考订单数量相匹配。

关于装置中的各模块的处理流程、以及各模块之间的交互流程的描述可以参照上述方法实施例中的相关说明，这里不再详述。

基于同一技术构思，本公开实施例还提供了一种计算机设备。参照图6所示，为本公开实施例提供的计算机设备600的结构示意图，包括处理器601、存储器602、和总线603。其中，存储器602用于存储执行指令，包括内存6021和外部存储器6022；这里的内存6021也称内存储器，用于暂时存放处理器601中的运算数据，以及与硬盘等外部存储器6022交换的数据，处理器601通过内存6021与外部存储器6022进行数据交换，当计算机设备600运行时，处理器601与存储器602之间通过总线603通信，使得处理器601在执行以下指令：

或者，当计算机设备600运行时，处理器601与存储器602之间通过总线603通信，使得处理器601在执行以下指令：

将所述在未来预设时间段之前的至少一个时间段内的各网格区域对的订单数量输入至基于本公开实施例提供的模型训练方法训练得到的所述压缩模型中，得到所述未来预设时间段内所述各网格区域对的参考订单数量。

本公开实施例还提供一种计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，该计算机程序被处理器运行时执行上述方法实施例中所述的模型训练方法或所述的需求确定方法的步骤。其中，该存储介质可以是易失性或非易失的计算机可读取存储介质。

本公开实施例还提供一种计算机程序产品，该计算机产品承载有程序代码，所述程序代码包括的指令可用于执行上述方法实施例中所述的模型训练方法或所述的需求确定方法的步骤，具体可参见上述方法实施例，在此不再赘述。

其中，上述计算机程序产品可以具体通过硬件、软件或其结合的方式实现。在一个可选实施例中，所述计算机程序产品具体体现为计算机存储介质，在另一个可选实施例中，计算机程序产品具体体现为软件产品，例如软件开发包（Software Development Kit，SDK）等等。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的装置的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。在本公开所提供的几个实施例中，应该理解到，所揭露的装置和方法，可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，又例如，多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本公开各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解，本公开的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备（可以是个人计算机，服务器，或者网络设备等）执行本公开各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器（Read-OnlyMemory，ROM）、随机存取存储器（Random Access Memory，RAM）、磁碟或者光盘等各种可以存储程序代码的介质。

最后应说明的是：以上所述实施例，仅为本公开的具体实施方式，用以说明本公开的技术方案，而非对其限制，本公开的保护范围并不局限于此，尽管参照前述实施例对本公开进行了详细的说明，本领域的普通技术人员应当理解：任何熟悉本技术领域的技术人员在本公开揭露的技术范围内，其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化，或者对其中部分技术特征进行等同替换；而这些修改、变化或者替换，并不使相应技术方案的本质脱离本公开实施例技术方案的精神和范围，都应涵盖在本公开的保护范围之内。因此，本公开的保护范围应以所述权利要求的保护范围为准。

Claims

1.一种模型训练方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述基于所述第一参考订单数量、所述第二参考订单数量、和所述最后一个第一历史时间段内所述各网格区域对的真实订单数量，对所述待训练的压缩模型进行训练，得到训练好的压缩模型，包括：

3.根据权利要求1所述的方法，其特征在于，将所述前预设数量个第一历史时间段内所述各网格区域对的订单数量输入至训练好的原始模型中之前，所述方法还包括：

4.根据权利要求1所述的方法，其特征在于，将所述多个第一历史时间段中的前预设数量个第一历史时间段内，所述各网格区域对的订单数量输入至训练好的原始模型中之前，所述方法还包括：

5.根据权利要求1所述的方法，其特征在于，所述多个第一历史时间段为多个连续的第一历史时间段；

6.根据权利要求1所述的方法，其特征在于，所述多个第一历史时间段为多个连续的第二历史时间段中的目标子时间段，其中不同的目标子时间段在所属第二历史时间段内的相对时间位置相同；

7.根据权利要求1所述的方法，其特征在于，得到训练好的压缩模型之后，所述方法还包括：

8.一种需求确定方法，其特征在于，包括：

将所述在未来预设时间段之前的至少一个时间段内的各网格区域对的订单数量输入至基于权利要求1~7任一所述的模型训练方法训练得到的所述压缩模型中，得到所述未来预设时间段内所述各网格区域对的参考订单数量。

9.根据权利要求8所述的方法，其特征在于，所述订单为出行服务订单；在得到所述未来预设时间段内所述各网格区域对的参考订单数量之后，所述方法还包括：

获取当前各个网格区域内出行服务对象的数量；

10.一种模型训练装置，其特征在于，包括：

11.一种需求确定装置，其特征在于，包括：

输入模块，用于将所述在未来预设时间段之前的至少一个时间段内的各网格区域对的订单数量输入至基于权利要求1~7任一所述的模型训练方法训练得到的所述压缩模型中，得到所述未来预设时间段内所述各网格区域对的参考订单数量。

12.一种计算机设备，其特征在于，包括：处理器、存储器和总线，所述存储器存储有所述处理器可执行的机器可读指令，当计算机设备运行时，所述处理器与所述存储器之间通过总线通信，所述机器可读指令被所述处理器执行时执行如权利要求1至7任一项所述的模型训练方法的步骤，或执行如权利要求8至9任一项所述的需求确定方法的步骤。

13.一种计算机可读存储介质，其特征在于，该计算机可读存储介质上存储有计算机程序，该计算机程序被处理器运行时执行如权利要求1至7任一项所述的模型训练方法的步骤，或执行如权利要求8至9任一项所述的需求确定方法的步骤。

14.一种计算机程序产品，其特征在于，该计算机产品承载有程序代码，所述程序代码包括的指令可用于执行如权利要求1至7任一项所述的模型训练方法的步骤，或执行如权利要求8至9任一项所述的需求确定方法的步骤。