CN112258129A

CN112258129A - 配送路径预测网络训练、配送资源调度方法及装置

Info

Publication number: CN112258129A
Application number: CN202011263395.6A
Authority: CN
Inventors: 张皓; 朱麟; 余维
Original assignee: Rajax Network Technology Co Ltd
Current assignee: Rajax Network Technology Co Ltd
Priority date: 2020-11-12
Filing date: 2020-11-12
Publication date: 2021-01-22

Abstract

本申请公开了一种配送路径预测网络训练方法及配送资源调度方法。配送路径预测网络训练方法，包括：获得待处理的订单数据及配送信息；使用旋转矩阵对待处理的订单数据及配送信息进行旋转处理，得到旋转处理后的目标增强数据；使用目标增强数据训练基于多头注意力机制的配送路径预测网络，得到目标配送路径预测网络。配送资源调度方法，包括：将待分派的订单数据及配送资源信息输入配送路径预测网络，预测将所述订单数据分派给配送资源后配送资源的提取配送顺序；根据配送资源的提取配送顺序，将所述订单数据分派给目标配送资源。采用所述方法，提供合理的配送路径规划算法以实现在具有不同分布的数据集上均能得到较优的订单‑配送资源组合结果。

Description

配送路径预测网络训练、配送资源调度方法及装置

技术领域

本申请涉及计算机技术领域，具体涉及一种配送路径预测网络训练方法、装置及设备。本申请同时涉及一种配送资源调度方法、装置及设备。

背景技术

目前，智能化调度为配送行业的重要解决方法。其中，配送路径规划算法是智能化调度的基础。例如，在外卖场景中采用合理配送路径规划算法，可以提高订单与骑手的匹配度，从而高效的完成订单的配送任务。

现有的路径规划算法一般分为以下两种：一种是以基于树搜索的分支定界算法为代表的精确求解算法，通过建立数学模型精确地描述实际问题，利用优化求解器软件得到问题的解。但是，精确求解算法存在求解问题规模较小以及计算时间较长的问题。另一种是以启发式算法为代表的近似求解算法，比如邻域搜索、禁忌搜索、模拟退火、遗传算法等等。近似求解算法一般需要依赖领域知识，在不同问题和数据之间的迁移能力较弱。当配送环境复杂及取送点的分布变化较大的情况下，上述路径规划算法难以准确地拟合出数据分布的变化。

因此，需要解决的问题是提供合理的配送路径规划算法以准确地拟合数据分布的变化，获得较优的订单-配送资源组合结果。

发明内容

本申请实施例提供的配送路径预测网络训练方法以及配送资源调度方法，提供合理的配送路径规划算法以实现在具有不同分布的数据集上均能得到较优的订单-配送资源组合结果。

本申请实施例提供一种配送路径预测网络训练方法，包括：

获得待处理的订单数据及配送信息；使用旋转矩阵对待处理的订单数据及配送信息进行旋转处理，得到旋转处理后的目标增强数据；使用目标增强数据训练基于多头注意力机制的配送路径预测网络，得到目标配送路径预测网络。

可选的，还包括：获得随机生成的均匀分布矩阵；对所述均匀分布矩阵进行SVD奇异值分解，得到随机的矩阵，作为所述旋转矩阵。

可选的，所述使用旋转矩阵对待处理的订单数据及配送信息进行旋转处理，得到旋转处理后的目标增强数据，包括：对待处理的订单数据及配送信息加入均匀分布的噪声，得到第一增强数据；对第一增强数据进行旋转处理，得到旋转处理后的第二增强数据，将第二增强数据作为目标增强数据。

可选的，所述使用旋转矩阵对待处理的订单数据及配送信息进行旋转处理，包括：根据待处理的订单数据及配送信息，生成输入向量；所述输入向量包括下述信息：订单数据的配送对象的提取位置及目的位置，配送资源的起始位置；使用旋转矩阵对输入向量进行旋转处理。

可选的，所述输入向量还包括下述至少一种信息：配送资源与提取位置之间的距离信息，配送资源与目的位置之间的距离信息，配送对象的配备时间信息。

可选的，所述配送路径预测网络包括：编码网络；以及解码网络；所述使用目标增强数据训练基于多头注意力机制的配送路径预测网络，得到目标配送路径预测网络，包括：将目标增强数据输入所述编码网络，得到嵌入向量；对所述嵌入向量取平均值，得到图嵌入向量；将嵌入向量及图嵌入向量输入所述解码网络，得到订单数据对应的提取配送顺序；根据提取配送顺序训练配送路径预测网络，得到目标配送路径预测网络。

可选的，还包括：在配送路径预测网络的至少一个多头注意力层进行实例归一化处理。

可选的，还包括：在配送路径预测网络中使用掩码机制剔除配送路径预测网络的当前一次训练中异常数据；所述异常数据包括：与未提取过的提取位置对应的配送中或已送达的目的位置。

本申请实施例还提供一种配送资源调度方法，包括：

将待分派的订单数据及配送资源信息输入配送路径预测网络，预测将所述订单数据分派给配送资源后配送资源的提取配送顺序；根据配送资源的提取配送顺序，将所述订单数据分派给目标配送资源；其中，所述配送路径预测网络为上述任一所述的配送路径预测网络。

可选的，所述将待分派的订单数据及配送资源信息输入配送路径预测网络，包括：将待分派的订单数据及配送资源信息加入均匀分布的噪声后输入配送路径预测网络。

可选的，所述将待分派的订单数据及配送资源信息加入均匀分布的噪声后输入配送路径预测网络，包括：根据待分派的订单数据及配送资源信息生成输入向量，所述输入向量包括下述信息：订单数据的配送对象的提取位置及目的位置，配送对象的配备时间，可调度的配送资源与提取位置之间的距离信息，以及可调度的配送资源与目的位置之间的距离信息；对所述输入向量加入均匀分布的噪声后输入向量输入配送路径预测网络。

可选的，所述根据配送资源的提取配送顺序，将所述订单数据分派给目标配送资源，包括：根据配送资源的提取配送顺序，确定每个配送资源的配送路径和/或超时率；根据每个配送资源的配送路径和/或超时率确定目标配送资源，将所述订单数据分派给目标配送资源。

可选的，所述根据每个配送资源的配送路径和/或超时率确定目标配送资源，包括：将配送路径满足路径长度条件，并且超时率满足超时概率条件的配送资源确定为目标配送资源。

本申请实施例还提供一种配送路径预测网络训练装置，包括：

输入数据获得单元，用于获得待处理的订单数据及配送信息；

输入数据增强单元，用于使用旋转矩阵对待处理的订单数据及配送信息进行旋转处理，得到旋转处理后的目标增强数据；

训练单元，用于使用目标增强数据训练基于多头注意力机制的配送路径预测网络，得到目标配送路径预测网络。

本申请实施例还提供一种配送资源调度装置，其特征在于，包括：

路径预测单元，用于将待分派的订单数据及配送资源信息输入配送路径预测网络，预测将所述订单数据分派给配送资源后配送资源的提取配送顺序；

订单分派单元，用于根据配送资源的提取配送顺序，将所述订单数据分派给目标配送资源；

其中，所述配送路径预测网络为上述任一配送路径预测网络。

本申请实施例还提供一种电子设备，包括：存储器，以及处理器；所述存储器用于存储计算机程序，所述计算机程序被所述处理器运行后，执行本申请实施例提供的所述方法。

本申请实施例还提供一种存储设备，存储有计算机程序，所述计算机程序被处理器运行后，执行本申请实施例提供的所述方法。

与现有技术相比，本申请具有以下优点：

本申请实施例提供的一种配送路径预测网络训练方法、装置及设备，通过使用旋转矩阵对待处理的订单数据及配送信息进行旋转处理，得到旋转处理后的目标增强数据；使用目标增强数据训练基于多头注意力机制的配送路径预测网络，得到目标配送路径预测网络。将对用于训练配送路径预测网络的数据集进行旋转操作，能够增加数据多样性，从而可以更好地拟合真实配送场景的数据分布。因而，训练完成的配送路径预测网络泛化性能及鲁棒性更好，当用于分布差异较大的数据集时能得到较优的路径规划结果。

本申请实施例提供的一种配送资源调度方法、装置及设备，通过将待分派的订单数据及配送资源信息输入配送路径预测网络，预测将所述订单数据分派给配送资源后配送资源的提取配送顺序；根据配送资源的提取配送顺序，将所述订单数据分派给目标配送资源。由于预测得到每个配送资源执行配送任务的路径规划信息，因此可以从全局选取较佳的订单-配送资源组合，将订单匹配给更为合适的配送资源。

附图说明

图1是本申请实施例提供的方法的系统结构示意图；

图2是本申请第一实施例提供的配送路径预测网络训练方法的处理流程图；

图3是本申请第一实施例提供的在具有不同分布的数据集上配送路径预测网络与基线模型的训练对比效果示意图；

图4是本申请第二实施例提供的配送资源调度方法的处理流程图；

图5是本申请第三实施例提供的配送路径预测网络训练装置示意图；

图6是本申请第四实施例提供的配送资源调度装置示意图；

图7是本申请提供的电子设备示意图。

具体实施方式

在下面的描述中阐述了很多具体细节以便于充分理解本申请。但是本申请能够以很多不同于在此描述的其它方式来实施，本领域技术人员可以在不违背本申请内涵的情况下做类似推广，因此本申请不受下面公开的具体实施的限制。

本申请实施例提供一种配送路径预测网络训练方法、装置、电子设备及存储设备。本申请实施例提供一种配送资源调度方法、装置、电子设备及存储设备。在下面的实施例中逐一进行说明。

为便于理解，首先给出本申请实施例提供的方法的系统结构。请参考图1，图中包括：配送路径预测网络101、数据旋转平移模块102。

配送路径预测网络为基于MHA机制(Multi Head Attention，多头注意力)构建的神经网络，用于根据待处理的订单数据及配送信息学习得到目标配送路径预测网络。配送路径预测网络通过计算每个配送资源执行一组订单配送任务的预测数据，从而根据预测数据将订单匹配给合适的配送资源(如骑手、自动配送设施等)，高效地完成订单的配送任务。预测数据可以为将特定配送任务分派给每个配送资源后，每个配送资源执行包含特定配送任务在内的已指定当前配送任务的提取配送顺序。其中，提取配送顺序为每个配送资源的配送任务中包含的提取位置及目的位置的排序序列。进一步，根据提取配送顺序可以预测每个配送资源执行所述已指定当前配送任务对应的路径长度及超时率，从而，可以根据预设派单策略和所述路径长度及超时率确定订单-配送资源组合，将特定配送任务对应的订单分派给对应的配送资源。例如，预设派单策略可以为按照路径长度尽可能小超时率尽可能低的派单策略确定订单-配送资源组合，从而将订单匹配到合适的配送资源。

基于MHA机制构建的神经网络，学习过程中并行计算，每个注意力头的每次当前状态的计算，是根据前一个状态学习得到的要关注的信息及当前输入信息，处理输入信息中注意力关注的部分信息。采用基于MHA机制构建配送路径预测网络可以将不变性引入节点的输入顺序，从而提高学习效率；另外并行化计算的计算效率比较高。如图1所示，配送路径预测网络具体包括MHA编码网络101-1及MHA解码网络101-2。MHA编码网络以及MHA解码网络分别包括至少一个多头注意力机制层。MHA编码网络为采用嵌入编码(embedding)方式将输入的离散序列转变为连续向量。MHA解码网络用于将编码网络生成的向量转换为输出序列。配送路径预测网络还可以包括：预测序列输出模块101-3。预测序列输出模块为配送路径预测网络学习过程中每次计算得到的每个配送资源的提取配送顺序。配送路径预测网络还可以包括：MASK机制101-4，通过MASK(掩码)张量在MHA解码网络的学习过程中对MHA解码网络的输入进行处理，剔除逻辑上不可能出现的数据。

用于对配送路径预测网络进行训练的数据集为从历史订单数据及历史配送信息中提取的训练数据。为增加数据的多样性以便更好拟合真实配送场景的数据分布，在输入配送路径预测网络前对训练数据进行增强处理。请参考图1，图中的数据旋转平移模块102为用于对训练数据进行增强处理模块，包括进行旋转平移等增强操作。

以下结合图2和图3对本申请第一实施例提供的配送路径预测网络训练方法进行说明。图2所示的配送路径预测网络训练方法，包括：步骤S201至步骤S203。

步骤S201，获得待处理的订单数据及配送信息。

本实施例中，配送路径预测网络为基于MHA机制构建的神经网络，包括至少一个多头注意力层，用于预测将待分派的订单数据分派给配送资源后配送资源的提取配送顺序。所谓提取配送顺序为每个配送资源的配送任务中包含的提取位置及目的位置的排序序列。配送资源的提取配送顺序可作为表示配送资源的配送路径的数据。进一步，配送路径预测网络为包括编码-解码网络结构的模型，即包括编码网络以及解码网络。优选的，编码网络为基于MHA机制的MHA编码网络，解码网络为基于MHA机制的MHA解码网络。MHA编码网络可包含至少一个多头注意力层。MHA解码网络可包含至少一个多头注意力层。实际实施时，所述配送路径预测网络包括：包含至少一个多头注意力层的编码网络；以及包含至少一个多头注意力层的解码网络。

本步骤为获取用于训练配送路径预测网络的训练数据集。具体使用历史订单数据及每个历史订单数据对应的历史配送信息作为训练数据集。所述获得待处理的订单数据及配送信息，为获得历史订单数据及每个历史订单数据对应的历史配送信息。具体包括下述处理：根据待处理的订单数据及配送信息，生成输入向量；所述输入向量包括下述信息：订单数据的配送对象的提取位置及目的位置，配送资源的起始位置；后续步骤中使用旋转矩阵对输入向量进行旋转处理。由每个输入向量构成作为用于训练配送路径预测网络的训练数据集。其中，所述输入向量还包括下述至少一种信息：配送资源与提取位置之间的距离信息，配送资源与目的位置之间的距离信息，配送对象的配备时间信息。

步骤S202，使用旋转矩阵对待处理的订单数据及配送信息进行旋转处理，得到旋转处理后的目标增强数据。

本步骤为对上述训练数据集进行数据增强处理，以便增加数据的多样性，从而可以更好拟合真实配送场景的数据分布。使用数据增强处理后的训练数据训练配送路径预测网络，得到的目标配送路径预测网络在分布不同的数据集上的泛化性能较好，鲁棒性更好。因此，尤其适用于外卖场景的配送路径预测，区域配送环境复杂，订单的提取位置及目的位置的分布具有多样性，

具体实施中，通过旋转矩阵对训练数据集中的每个训练数据进行旋转处理，或，通过将每个训练数据进行平移处理后再使用旋转矩阵进行旋转处理。其中，旋转矩阵可以通过下述处理获得：获得随机生成的均匀分布矩阵；对所述均匀分布矩阵进行SVD奇异值分解，得到随机的矩阵，作为所述旋转矩阵。其中，SVD奇异值分解(Singular ValueDecomposition)为一种得到任意矩阵的满秩分解方法，下述公式示出了对所述均匀分布矩阵的SVD奇异值分解得到旋转矩阵：

其中，U为得到的旋转矩阵；

为a_i构成的向量的拉伸或压缩矩阵。

将该旋转矩阵U和输入的每条训练数据相乘可实现对训练数据的旋转。

进一步，在对训练数据旋转同时还可以进行平移处理。具体可通过加入噪声进行平移，包括：

对待处理的订单数据及配送信息加入均匀分布的噪声，得到第一增强数据；

对第一增强数据进行旋转处理，得到旋转处理后的第二增强数据，将第二增强数据作为目标增强数据，反之亦然。也就是说，对数据的旋转处理及平移处理的先后顺序不受限制，即，也可以对待处理的订单数据及配送信息进行旋转处理，将旋转处理后的数据再加入均匀分布的噪声进行平移处理，平移处理后的数据作为目标增强数据。

当然，也可以根据待处理的订单数据及配送信息，生成输入向量；所述输入向量包括下述信息：订单数据的配送对象的提取位置及目的位置，配送资源的起始位置；所述输入向量还可以包括下述至少一种信息：配送资源与提取位置之间的距离信息，配送资源与目的位置之间的距离信息，配送对象的配备时间信息。对所述输入向量使用旋转矩阵进行旋转处理，或者，对所述输入向量加入均匀分布的噪声进行平移后在使用旋转矩阵进行旋转处理；进行旋转处理后的输入向量为目标增强数据。

步骤S203，使用目标增强数据训练基于多头注意力机制的配送路径预测网络，得到目标配送路径预测网络。

本步骤为训练配送路径预测网络得到目标配送路径预测网络。目标配送路径预测网络可用于预测将待分派的订单数据分派给配送资源后配送资源的提取配送顺序。通过配送资源的提取配送顺序可以预测配送资源的配送路径长度和/或超时率，从而用于确定出合理的订单-配送资源的派单组合。具体的，所述使用目标增强数据训练基于多头注意力机制的配送路径预测网络，得到目标配送路径预测网络，包括：

将目标增强数据输入所述编码网络，得到嵌入向量；

对所述嵌入向量取平均值，得到图嵌入向量；

将嵌入向量及图嵌入向量输入所述解码网络，得到订单数据对应的提取配送顺序；

根据提取配送顺序训练配送路径预测网络，得到目标配送路径预测网络。

其中，所述嵌入向量，为通过编码网络进行embedding编码后得到的向量，即编码网络的输出。具体实施时，将所述嵌入向量相加然后除以向量个数从而得到平均值作为图嵌入向量；将embedding后的向量和图embedding向量一起输入到MHA解码网络中。图嵌入向量可以看作为描绘嵌入向量的图形结构的向量。

具体实施中，还可以在配送路径预测网络的多头注意力层中进行归一化处理。本实施例中，在配送路径预测网络的至少一个多头注意力层进行实例归一化处理。具体的，在配送路径预测网络的编码网络及解码网络中至少一个网络的多头注意力层进行实例归一化处理。即，编码网络及解码网络中每一次通过MAH层的信息进行实例归一化处理。实际上有多种归一化方法，例如批量归一化(Batch Normalization)和实例归一化。归一化处理可以消除特征间单位和尺度的差异影响，让配送路径预测网络的每一层的数据都能在有效的范围内传播下去，帮助模型训练收敛，增强模型的泛化性能。具体到本实施例，批量归一化可以对全部配送资源的同一个通道进行归一化处理，而实例归一化可以对每个配送资源的每个通道进行归一化处理，从而可以保留每个配送资源的特征，有效降低训练成本，提高网络训练的收敛速度。

本实施例中，在配送路径预测网络中使用掩码机制剔除配送路径预测网络的当前一次训练中异常数据；所述异常数据包括：与未提取过的提取位置对应的配送中或已送达的目的位置。具体在配送路径预测网络的解码网络中采用Mask机制针对与未提取的提取位置对应的目的位置及已到达的目的位置进行掩码(Mask)操作，以便剔除配送中逻辑上异常的提取配送顺序数据。以外卖场景为例，对未取点对应的送餐点及已到达送餐进行掩码处理，以便剔除逻辑上不可能出现的取餐送餐顺序数据。

请参考图3，图中示出了在具有不同分布的数据集上配送路径预测网络与基线模型的训练对比效果，图中线条1为baseline(基线)模型在具有不同分布的训练数据集上的训练曲线；线条2为本实施例提供的方法中配送路径预测网络在具有不同分布的训练数据集上的训练曲线；图中的U(x,y)为表示x到y的均匀分布的训练数据集；图3的各曲线图中的纵坐标cost为代价函数的值，横坐标为训练epoch，1个epoch为使用训练数据集中的全部样本训练一次。从中可以看出，本实施例提供的配送路径预测网络在具有不同分布的训练数据集上的泛化性能较好，并且训练cost更稳定，鲁棒性更好。

本实施例提供的配送路径预测网络可用于智能调度系统的派单，以全局较优的视角统筹区域内的订单和配送资源，将订单匹配给合适的配送资源，高效地完成订单的配送任务。所述配送路径预测网络的预测结果为每个配送资源的提取配送顺序，即每个配送资源的路径规划，能够表示一个配送资源执行一组订单配送任务的效果，以便从中选取效果较佳的订单-配送资源组合，进行派单决策。比如获得新订单后，使用配送路径预测网络预测针对该新订单所有备选骑手接到该订单之后的提取配送顺序，根据每个骑手的提取配送顺序计算每个骑手的路径长度和超时率，从中选取路径长度尽可能小，超时率尽可能低的订单骑手组合，从而完成派单策略。

实际实施中，可对用于训练配送路径预测网络的输入数据进行平移、旋转等数据增强处理得到目标增强数据，使用目标增强数据训练配送路径预测网络；在配送路径预测网络的解码网络及编码网络的每个MHA层进行实例归一化处理；在配送路径预测网络的解码网络中用Mask机制对外卖场景中的取送点进行适配，从而训练得到目标配送路径预测网络。进行数据增强处理有助于克服在分布不同的训练数据集上泛化性能较差的缺陷，并且生成的cost更稳定，鲁棒性更好。实例归一化处理以及掩码机制的引入易于在不同问题之间进行知识迁移，从而可以克服现有的启发式方法在不同问题之间的迁移能力较弱的缺陷。尤其适用于外卖场景的配送路径预测。外卖场景中区域配送环境复杂，取送点的分布具有多样性。

需要说明的是，在不冲突的情况下，在本实施例和本申请的其他实施例中给出的特征可以相互组合，并且步骤S201和S202或类似用语不限定步骤必须先后执行。

至此，对本实施例提供的方法进行了说明，所述方法通过使用旋转矩阵对待处理的订单数据及配送信息进行旋转处理，得到旋转处理后的目标增强数据；使用目标增强数据训练基于多头注意力机制的配送路径预测网络，得到目标配送路径预测网络。将对用于训练配送路径预测网络的数据集进行旋转操作，能够增加数据多样性，从而可以更好地拟合真实配送场景的数据分布。因而，训练完成的配送路径预测网络泛化性能及鲁棒性更好，当用于分布差异较大的数据集时能得到更优化的路径规划的结果。

第二实施例以上述系统结构及实施例为基础，第二实施例提供一种配送资源调度方法。以下结合图4进行说明。图4所示的配送资源调度方法，包括：步骤S401至S402。

步骤S401，将待分派的订单数据及配送资源信息输入配送路径预测网络，预测将所述订单数据分派给配送资源后配送资源的提取配送顺序。

本实施例中，所述配送路径预测网络为上述系统结构及实施例中给出的任一配送路径预测网络及目标配送路径预测网络。配送路径预测网络结构及训练请参见上文，不再一一赘述。

本步骤中待分派的订单数据可为新生成的待指定配送资源的订单的数据。配送资源信息为每个备选的配送资源的信息。所述配送路径预测网络针对每个配送资源如果被指定配送待分派订单后的提取配送顺序进行预测，即为每个配送资源进行路径规划，以便选取效果较佳的订单-配送资源组合，进行派单。比如获得新订单后，使用配送路径预测网络预测针对该新订单所有备选骑手接到该订单之后的提取配送顺序，根据每个骑手的提取配送顺序计算每个骑手的路径长度和超时率，从中选取路径长度尽可能小，超时率尽可能低的订单骑手组合，进行派单。进一步，针对输入数据进行平移后使用配送路径预测网络预测路径规划结果。具体的，所述将待分派的订单数据及配送资源信息输入配送路径预测网络，包括：将待分派的订单数据及配送资源信息加入均匀分布的噪声后输入配送路径预测网络。实际实施时，包括下述处理：

根据待分派的订单数据及配送资源信息生成输入向量，所述输入向量包括下述信息：订单数据的配送对象的提取位置及目的位置，配送对象的配备时间，可调度的配送资源与提取位置之间的距离信息，以及可调度的配送资源与目的位置之间的距离信息；对所述输入向量加入均匀分布的噪声后输入向量输入配送路径预测网络。

步骤S402，根据配送资源的提取配送顺序，将所述订单数据分派给目标配送资源。

本步骤为根据配送路径预测网络输出的配送资源的提取配送顺序，进行派单决策。具体的，所述根据配送资源的提取配送顺序，将所述订单数据分派给目标配送资源，包括：根据配送资源的提取配送顺序，确定每个配送资源的配送路径和/或超时率；根据每个配送资源的配送路径和/或超时率确定目标配送资源，将所述订单数据分派给目标配送资源。其中，所述根据每个配送资源的配送路径和/或超时率确定目标配送资源，包括：将配送路径满足路径长度条件，并且超时率满足超时概率条件的配送资源确定为目标配送资源。

本实施例提供的配送资源调度方法可用于智能调度系统的派单，以全局较优的视角统筹区域内的订单和配送资源，将订单匹配给合适的配送资源，高效地完成订单的配送任务。

至此，对本实施例提供的方法进行了说明，所述方法通过将待分派的订单数据及配送资源信息输入配送路径预测网络，预测将所述订单数据分派给配送资源后配送资源的提取配送顺序；根据配送资源的提取配送顺序，将所述订单数据分派给目标配送资源。由于预测得到每个配送资源执行配送任务的路径规划信息，因此可以从全局选取较佳的订单-配送资源组合，将订单匹配给合适的配送资源，高效地完成订单的配送任务。

第三实施例与第一实施例对应，本申请第三实施例提供一种配送路径预测网络训练装置。以下结合图5对所述装置进行说明。图5所示的配送路径预测网络训练装置，包括：

输入数据获得单元501，用于获得待处理的订单数据及配送信息；

输入数据增强单元502，用于使用旋转矩阵对待处理的订单数据及配送信息进行旋转处理，得到旋转处理后的目标增强数据；

训练单元503，用于使用目标增强数据训练基于多头注意力机制的配送路径预测网络，得到目标配送路径预测网络。

可选的，所述输入数据增强单元502具体用于：获得随机生成的均匀分布矩阵；对所述均匀分布矩阵进行SVD奇异值分解，得到随机的矩阵，作为所述旋转矩阵。

可选的，所述输入数据增强单元502具体用于：对待处理的订单数据及配送信息加入均匀分布的噪声，得到第一增强数据；对第一增强数据进行旋转处理，得到旋转处理后的第二增强数据，将第二增强数据作为目标增强数据。

可选的，所述输入数据增强单元502具体用于：根据待处理的订单数据及配送信息，生成输入向量；所述输入向量包括下述信息：订单数据的配送对象的提取位置及目的位置，配送资源的起始位置；使用旋转矩阵对输入向量进行旋转处理。

可选的，所述配送路径预测网络包括：编码网络；以及解码网络；所述训练单元503具体用于：将目标增强数据输入所述编码网络，得到嵌入向量；对所述嵌入向量取平均值，得到图嵌入向量；将嵌入向量及图嵌入向量输入所述解码网络，得到订单数据对应的提取配送顺序；根据提取配送顺序训练配送路径预测网络，得到目标配送路径预测网络。

可选的，所述训练单元503具体用于：在配送路径预测网络的至少一个多头注意力层进行实例归一化处理。

可选的，所述训练单元503具体用于：在配送路径预测网络中使用掩码机制剔除配送路径预测网络的当前一次训练中异常数据；所述异常数据包括：与未提取过的提取位置对应的配送中或已送达的目的位置。

第四实施例与第二实施例对应，本申请第四实施例提供一种配送资源调度装置。以下结合图6对所述装置进行说明。图6所示的配送资源调度装置，包括：

路径预测单元601，用于将待分派的订单数据及配送资源信息输入配送路径预测网络，预测将所述订单数据分派给配送资源后配送资源的提取配送顺序；

订单分派单元602，用于根据配送资源的提取配送顺序，将所述订单数据分派给目标配送资源；

其中，所述配送路径预测网络为上述提供的任一配送路径预测网络。

可选的，所述路径预测单元601具体用于：将待分派的订单数据及配送资源信息加入均匀分布的噪声后输入配送路径预测网络。

可选的，所述路径预测单元601具体用于：根据待分派的订单数据及配送资源信息生成输入向量，所述输入向量包括下述信息：订单数据的配送对象的提取位置及目的位置，配送对象的配备时间，可调度的配送资源与提取位置之间的距离信息，以及可调度的配送资源与目的位置之间的距离信息；对所述输入向量加入均匀分布的噪声后输入向量输入配送路径预测网络。

可选的，所述订单分派单元602具体用于：根据配送资源的提取配送顺序，确定每个配送资源的配送路径和/或超时率；根据每个配送资源的配送路径和/或超时率确定目标配送资源，将所述订单数据分派给目标配送资源。

可选的，所述订单分派单元602具体用于：将配送路径满足路径长度条件，并且超时率满足超时概率条件的配送资源确定为目标配送资源。

以上述实施例为基础，本申请第五实施例提供一种电子设备，相关的部分请参见上述实施例的对应说明即可。请参考图7，图7所示的电子设备包括存储器701和处理器702。所述存储器存储有计算机程序，所述计算机程序被处理器运行后，执行本申请实施例提供的所述方法。

以上述实施例为基础，本申请第十实施例提供一种存储设备，相关的部分请参见上述实施例的对应说明即可。所述存储设备的示意图类似图7。所述存储设备存储有计算机程序，所述计算机程序被处理器运行后，执行本申请实施例提供的所述方法。

在一个典型的配置中，计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。

1、计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括非暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

2、本领域技术人员应明白，本申请的实施例可提供为方法、系统或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请虽然以较佳实施例公开如上，但其并不是用来限定本申请，任何本领域技术人员在不脱离本申请的精神和范围内，都可以做出可能的变动和修改，因此本申请的保护范围应当以本申请权利要求所界定的范围为准。

Claims

1.一种配送路径预测网络训练方法，其特征在于，包括：

获得待处理的订单数据及配送信息；

使用旋转矩阵对待处理的订单数据及配送信息进行旋转处理，得到旋转处理后的目标增强数据；

使用目标增强数据训练基于多头注意力机制的配送路径预测网络，得到目标配送路径预测网络。

2.根据权利要求1所述的方法，其特征在于，还包括：

获得随机生成的均匀分布矩阵；

对所述均匀分布矩阵进行SVD奇异值分解，得到随机的矩阵，作为所述旋转矩阵。

3.根据权利要求1所述的方法，其特征在于，所述使用旋转矩阵对待处理的订单数据及配送信息进行旋转处理，得到旋转处理后的目标增强数据，包括：

对第一增强数据进行旋转处理，得到旋转处理后的第二增强数据，将第二增强数据作为目标增强数据。

4.根据权利要求1所述的方法，其特征在于，所述使用旋转矩阵对待处理的订单数据及配送信息进行旋转处理，包括：

根据待处理的订单数据及配送信息，生成输入向量；所述输入向量包括下述信息：订单数据的配送对象的提取位置及目的位置，配送资源的起始位置；

使用旋转矩阵对输入向量进行旋转处理。

5.根据权利要求4所述的方法，其特征在于，所述输入向量还包括下述至少一种信息：配送资源与提取位置之间的距离信息，配送资源与目的位置之间的距离信息，配送对象的配备时间信息。

6.根据权利要求1所述的方法，其特征在于，所述配送路径预测网络包括：编码网络；以及解码网络；

所述使用目标增强数据训练基于多头注意力机制的配送路径预测网络，得到目标配送路径预测网络，包括：

将目标增强数据输入所述编码网络，得到嵌入向量；

对所述嵌入向量取平均值，得到图嵌入向量；

7.根据权利要求1所述的方法，其特征在于，还包括：

在配送路径预测网络的至少一个多头注意力层进行实例归一化处理。

8.根据权利要求1所述的方法，其特征在于，还包括：

在配送路径预测网络中使用掩码机制剔除配送路径预测网络的当前一次训练中异常数据；所述异常数据包括：与未提取过的提取位置对应的配送中或已送达的目的位置。

9.一种配送资源调度方法，其特征在于，包括：

将待分派的订单数据及配送资源信息输入配送路径预测网络，预测将所述订单数据分派给配送资源后配送资源的提取配送顺序；

根据配送资源的提取配送顺序，将所述订单数据分派给目标配送资源；

其中，所述配送路径预测网络为权利要求1至8中任一所述的配送路径预测网络。

10.根据权利要求9所述的方法，其特征在于，所述将待分派的订单数据及配送资源信息输入配送路径预测网络，包括：

将待分派的订单数据及配送资源信息加入均匀分布的噪声后输入配送路径预测网络。