CN111860837A

CN111860837A - 装箱问题的处理方法、装置及计算机可读存储介质

Info

Publication number: CN111860837A
Application number: CN202010697468.6A
Authority: CN
Inventors: 高可越; 项党
Original assignee: SAIC Motor Corp Ltd
Current assignee: SAIC Motor Corp Ltd
Priority date: 2020-07-20
Filing date: 2020-07-20
Publication date: 2020-10-30
Anticipated expiration: 2040-07-20
Also published as: CN111860837B

Abstract

本申请提供一种装箱问题的处理方法、装置及计算机可读存储介质，通过以装箱状态与有效装载率之间的映射关系和装箱样本作为训练样本，以映射关系中有效装载率收敛作为训练结束条件，训练得到的神经网络模型对装箱问题进行处理，无需每次都从随机选择一个初始装箱状态开始迭代，这样即使在大规模数据的情况下例如需要装入车厢内的箱子个数很多导致存在很多初始装箱状态的情况下，也能够在短时间内完成对装箱问题的处理，提高了对装箱问题的处理效率。

Description

装箱问题的处理方法、装置及计算机可读存储介质

技术领域

本发明属于装箱问题技术领域，尤其涉及一种装箱问题的处理方法、装置及计算机可读存储介质。

背景技术

装箱问题在工业生产中有着广泛的运用，例如材料切割、卡车装载、仓库存储等。装箱问题在运用过程中随着数据规模增大，处理时间会迅速增长，导致无法在短时间内完成对装箱问题的处理。

发明内容

有鉴于此，本发明的目的在于提供一种装箱问题的处理方法、装置及计算机可读存储介质，用于解决现有技术中对装箱问题的处理效率低的问题。

技术方案如下：

本申请提供了一种装箱问题的处理方法，包括：

将装箱问题输入预先训练得到的神经网络模型；所述神经网络模型为以装箱状态与有效装载率之间的映射关系和装箱样本作为训练样本，以映射关系中有效装载率收敛作为训练结束条件进行训练得到；

获得所述预先训练得到的神经网络模型对所述装箱问题进行处理后输出的装箱状态以及与所述装箱状态对应的有效装载率。

优选地，所述神经网络模型采用以下方法训练得到：

获取装箱状态与有效装载率之间的映射关系以及装箱样本，所述有效装载率用装箱状态与神经网络模型权重的函数来表征；

将装箱样本输入神经网络模型中，并生成装箱样本对应的所有装箱状态，基于表征有效装载率的函数，依次计算得到装箱样本对应的每个装箱状态的有效装载率；

基于所述映射关系和计算得到的每个装箱状态的有效装载率，确定所述映射关系中的有效装载率是否收敛；

若确定所述映射关系中的有效装载率不收敛，则根据与装箱样本对应的每个装箱状态、计算得到的每个装箱状态的有效装载率以及所述映射关系，更新所述映射关系以及神经网络模型的权重，并返回执行确定所述映射关系中的有效装载率是否收敛；

若确定所述映射关系中的有效装载率收敛，则完成对神经网络模型的训练。

优选地，所述根据与装箱样本对应的每个装箱状态、计算得到的每个装箱状态的有效装载率以及所述映射关系，更新所述映射关系，包括：

依次判断与装箱样本对应的每个装箱状态中是否存在于所述映射关系中；

若任意一个与装箱样本对应的装箱状态不存在于所述映射关系中，则将不存在于所述映射关系中的与装箱样本对应的装箱状态均添加至所述映射关系中，并将每个新添加至所述映射关系的装箱状态的有效装载率对应添加至所述映射关系中；

若与装箱样本对应的所有装箱状态均存在于所述映射关系中，则依次判断与装箱样本对应的每个装箱状态的有效装载率是否大于所述映射关系中相同装箱状态的有效装载率；

若判断任意一个与装箱样本对应的装箱状态的有效装载率大于所述映射关系中相同装箱状态的有效装载率，则依次利用与装箱样本对应的装箱状态的有效装载率更新所述映射关系中相同装箱状态的有效装载率。

优选地，所述更新神经网络模型的权重，包括：

通过误差反向传播算法计算得到有效装载率的均方差的梯度，基于所述梯度更新所述神经网络模型的权重。

优选地，所述生成装箱样本对应的所有装箱状态，包括：

根据概率∈-贪心策略生成该装箱样本的所有装箱状态，其中以S₀，S₁，S₂，...，S_T表示所有装箱状态，S₀为初始状态，S₁，S₂…，S_T-1为非终结状态，S_T为终结状态，其中后一个状态为在前一个状态下放入一个箱子后得到的状态，T为自然数。

优选地，所述通过误差反向传播算法计算得到有效装载率的均方差的梯度，基于所述梯度更新所述神经网络模型的权重，包括：

基于公式

更新所述神经网络模型的权重；

其中，W为所述神经网络模型的权重，α为学习率，W[S_k]为所述映射关系中第k+1个状态S_k的有效装载率；

为基于第k+1个状态S_k与神经网络模型的权重计算得到的第k+1个状态S_k的有效装载率；

为对计算得到的第k+1个状态S_k的有效装载率求导，k的取值范围为(0，T)。

本申请还提供了一种装箱问题的处理装置，包括：

输入单元，用于将装箱问题输入预先训练得到的神经网络模型；所述神经网络模型为以装箱状态与有效装载率之间的映射关系和装箱样本作为训练样本，以映射关系中有效装载率收敛作为训练结束条件进行训练得到；

处理单元，用于获得所述预先训练得到的神经网络模型对所述装箱问题进行处理后输出的装箱状态以及与所述装箱状态对应的有效装载率。

优选地，所述装置还包括：

训练单元；

所述训练单元训练得到神经网络模型，具体用于：获取装箱状态与有效装载率之间的映射关系以及装箱样本，所述有效装载率用装箱状态与神经网络模型权重的函数来表征；

优选地，所述训练单元更新所述映射关系，具体用于：

本申请还提供了一种计算机可读存储介质，其上存储有计算机指令，所述计算机指令运行时执行上述的处理方法的步骤。

与现有技术相比，本发明提供的上述技术方案具有如下优点：

从上述技术方案可知，本申请中以装箱状态与有效装载率之间的映射关系和装箱样本作为训练样本，以映射关系中有效装载率收敛作为训练结束条件，预先训练得到神经网络模型，使得训练后的神经网络模型可以学习到不同装箱问题之间的联系和共同点，从而在利用训练好的神经网络模型处理装箱问题时不需要每次都从随机选择一个初始装箱状态开始迭代，这样即使在大规模数据的情况下例如需要装入车厢内的箱子个数很多导致存在很多初始装箱状态的情况下，也能够在短时间内完成对装箱问题的处理，提高了对装箱问题的处理效率，适用于数据规模增大的场景。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的一种装箱问题的处理方法的流程图；

图2是本发明实施例提供的神经网络模型的训练方法的流程图；

图3是本发明实施例提供的一种装箱问题的处理装置的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本申请利用神经网络模型对装箱问题进行处理，以提高对装箱问题的处理效率，实现在短时间内完成对装箱问题的处理。

参见图1所示，本实施例公开的装箱问题的处理方法包括以下步骤：

S101、将装箱问题输入预先训练得到的神经网络模型；所述神经网络模型为以装箱状态与有效装载率之间的映射关系和装箱样本作为训练样本，以映射关系中有效装载率收敛作为训练结束条件进行训练得到。

本实施例采用神经网络模型解决装箱问题。以二维矩形装箱问题为例，二维矩形装箱问题指的是给定一个矩形车厢与一组矩形箱子，车厢长宽与各个箱子长宽都已知，在满足箱子两两不能有重叠部分这一约束条件下将箱子依次放入车厢中，确定如何装箱。其中，将一组矩形箱子装入一个矩形车厢存在两种情况，第一种情况是不存在一种装箱方案能将全部箱子装入车厢中，这样，确定如何装箱时的优化目标为车厢内空闲空间的面积最小；第二种情况是至少存在一种装箱方案能将全部箱子装入车厢中，这样确定如何装箱时的优化目标为实际使用车长最短。其中车长指的是车厢平行于车辆行驶方向的一边的长度，实际使用车长为车厢长度减去车门到放在最外侧箱子的距离得到的距离差。

需要预先以装箱状态与有效装载率之间的映射关系和装箱样本作为训练样本，以映射关系中有效装载率收敛作为训练结束条件，训练得到神经网络模型。

装箱样本包括车厢的尺寸、需要装入车厢的箱子个数以及各个箱子的尺寸。在实际应用中，可以根据业务实际订单生成若干个装箱样本，或者可以估算在业务实际订单中出现的箱子尺寸的概率分布，然后生成符合该概率分布的装箱样本。

装箱状态由两部分组成，第一部分为空间占用状态，第二部分为各个箱子的装入状态。

装箱问题的一个应用场景为将多个箱子装入车厢，在该应用场景下，装箱状态的第一部分为车厢内空间的占用状态，其中以一个布尔值矩阵P来表示车厢内空间的占用状态。示例性地，若车厢内坐标为(x，y)的位置已经放置箱子则P_x，y＝1，即用标识1表征车厢内某一位置处已经放置了箱子；若车厢内坐标为(x，y)的位置没有放置箱子，则P_x，y＝0，即用标识0表征车厢内某一位置处还未放置箱子。

这样可以利用一个二维矩阵表征车厢内空间的占用状态。

装箱状态的第二部分为各个箱子是否已经装入车厢，其中对于每个箱子都以一个三维数组表示该箱子是否已经装入车厢，三维数组中的第一个元素为箱子的长度，第二个元素为箱子的宽度，第三个元素为箱子是否已经装入车厢。示例性地，假设共有n个箱子，其中每个箱子的长为a_i，每个箱子的宽为b_i，标识0表示该箱子还没有被放入车厢，标识1表示该箱子已经被放入车厢，i的取值范围为(1，n)。

确定装箱状态后就可以确定得到对应的装箱方案，即按照怎样的顺序依次装箱并且分别将各个箱子放置在车厢的哪个位置。

由于面对一个具体的装箱问题时，并不能够预先知晓是否存在一种装箱方案能够将全部箱子装入车厢中，因此定义一个新的指标，称为有效装载率，将有效装载率作为优化目标。即有效装载率越大得到的装箱方案越优。

其中，

装载面积指的是装入车厢内箱子的长乘宽的总和。

例如，在车厢内装入了三个箱子，第一个箱子的长为30cm，宽为20cm；第二个箱子的长为20cm，宽为20cm；第二个箱子的长为20cm，宽为10cm，则装载面积为30cm×20cm+20cm×20cm+20cm×10cm＝1200cm²。

确定一个装箱状态后，即可得到按照对应该装箱状态的装箱方案装箱后得到的有效装载率。即装箱状态与有效装载率之间具有映射关系，一个装箱状态对应一个有效装载率。

S102、获得所述预先训练得到的神经网络模型对所述装箱问题进行处理后输出的装箱状态以及与所述装箱状态对应的有效装载率。

通过神经网络模型处理表征车厢内空间的占用状态的二维矩阵，然后将学习到的特征和表征各个箱子是否已经装入车厢的三维数组中包括的各个箱子的大小进行合并，最后经过若干全连接层输出结果。

从上述技术方案可知，本实施例中以装箱状态与有效装载率之间的映射关系和装箱样本作为训练样本，以映射关系中有效装载率收敛作为训练结束条件，预先训练得到神经网络模型，使得训练后的神经网络模型可以学习到不同装箱问题之间的联系和共同点，从而在利用训练好的神经网络模型处理装箱问题时不需要每次都从随机选择一个初始装箱状态开始迭代，这样即使在大规模数据的情况下例如需要装入车厢内的箱子个数很多导致存在很多初始装箱状态的情况下，也能够在短时间内完成对装箱问题的处理，提高了对装箱问题的处理效率，适用于数据规模增大的场景。

下面详细介绍训练得到神经网络模型的方法。

构建初始神经网络模型，如卷积神经网络模型，并初始化该初始神经网络模型中的权重以及选择合适的学习率，其中，学习率可以在后续训练过程中根据训练的迭代次数进行调整，避免由于学习率过小导致训练时间增加，由于学习率过大导致训练结果不收敛。然后采用如图2所示的训练方法对该初始神经网络模型进行训练。

参见图2所示，神经网络模型的训练方法包括以下步骤：

S201、获取装箱状态与有效装载率之间的映射关系以及装箱样本，所述有效装载率用装箱状态与神经网络模型权重的函数来表征。

在还未对神经网络模型进行训练之前，装箱状态与有效装载率之间的映射关系为空，即不存在装箱状态以及对应装箱状态的有效装载率。在后续对神经网络模型的训练过程中将装箱状态以及与装箱状态对应的有效装载率添加至映射关系中，完成对映射关系的更新完善。

可以以字典的方式存储装箱状态与有效装载率之间的映射关系。。

由于在还未得到装箱方案之前，并不能知晓按照装箱方案进行装箱后得到的装载面积以及实际使用车长，因此不能基于上述计算有效装载率的公式计算得到有效装载率，进而无法得知该装箱方案是否是最优的方案。针对此，本实施例采用带参函数

来近似等于有效装载率V(s)，其中，使用神经网络模型来构造

S为装箱状态，W为神经网络的权重，w∈R^d。R为实数，d为正整数且d的取值远远小于装箱状态的总个数。其中，装箱状态的总个数指的是装箱问题的所有装箱状态的个数。所有装箱状态包括初始装箱状态、非终结装箱状态以及终结装箱状态。

初始装箱状态指的是只装一个箱子的状态，可以理解的是，同一个装箱问题，由于装哪个箱子的不同或将箱子放置在车厢哪个位置的不同，导致初始装箱状态不同。

终结装箱状态指的是已经没有还没有放入车厢的箱子即全部箱子都已经装入车厢，或者无论如何摆放都不能将还没有放入车厢的任意一个箱子再放入车厢的装箱状态。

非终结装箱状态指的是在一个装箱状态下放入下一个箱子后得到的装箱状态，任何一个非终结装箱状态都是其前一个装箱状态的子装箱状态。

定义任一非终结装箱状态的有效装载率V(s)为该非终结装箱状态的所有子装箱状态的有效装载率最大值。而初始装箱状态也为一个非终结装箱状态，因此初始装箱状态的有效装载率为该初始装箱状态的所有子装箱状态的有效装载率最大值，而终结装箱状态为一个子装箱状态，从而初始装箱状态的有效装载率为所有装箱状态的有效装载率最大值。

S202、将装箱样本输入神经网络模型中，并生成装箱样本对应的所有装箱状态，基于表征有效装载率的函数依次计算得到装箱样本对应的每个装箱状态的有效装载率。

一种生成装箱样本对应的所有装箱状态的实现方式为：根据概率∈-贪心策略生成装箱样本对应的所有装箱状态，其中以S₀，S₁，S₂，...，S_T表示所有装箱状态，S₀为初始装箱状态，S₁，S₂…，S_T-1为非终结装箱状态，S_T为终结装箱状态，其中后一个装箱状态为在前一个装箱状态下放入一个箱子后得到的装箱状态，将后一个装箱状态称为前一个装箱状态的子装箱状态，T为自然数。

对每个装箱样本，根据概率∈-贪心策略生成该装箱样本对应的所有装箱状态，∈为小概率，如10％。具体地，对于某一个装箱状态S，先生成该装箱状态S的子装箱状态集合，子装箱状态集合中包括装箱状态S的所有子装箱状态；在∈概率下，在S的子装箱状态集合中随机选择一个子装箱状态作为装箱状态S的下一个装箱状态，在(1-∈)的概率下选择子装箱状态集合中价值最大的子装箱状态作为装箱状态S的下一个装箱状态。其中，S为初始装箱状态或者为非终结装箱状态，即从初始装箱状态开始，依据上述生成装箱状态的下一个装箱状态的方式依次生成各个下一个装箱状态，直至生成的下一个装箱状态为终结装箱状态为止。

需要注意的是，受限于车厢尺寸、需要装入车厢内的箱子总数、各个箱子的尺寸以及装箱的约束条件，任一个装箱状态都具有有限个合法的子装箱状态。

此处约束条件对应强化学习通用模型中包括的动作元素。在装箱问题中动作指的是将某一个箱子放到车厢中的某个空闲位置，在一个装箱状态下选择一个动作决定了下一个装箱状态。

若不考虑优化目标，则把箱子放在车厢中任意空闲位置都是可行的，但是由于存在优化目标，即需要考虑有效装载率，因此应该尽可能地把箱子摆在一起，而不是将箱子零乱随意地摆放在车厢内。针对此，设定两个约束条件，第一个约束条件为：箱子的顶边至少有一部分紧贴另外一个箱子的底边或车厢最靠内的一边，第二个约束条件为：箱子的侧边(左边或右边)至少有一部分紧贴另外一个箱子的侧边或车厢的侧边。

S203、基于所述映射关系和计算得到的每个装箱状态的有效装载率，确定所述映射关系中的有效装载率是否收敛；

若确定所述映射关系中的有效装载率不收敛，则执行步骤S204；

若确定所述映射关系中的有效装载率收敛，则执行步骤S205，确定完成对神经网络模型的训练。

一种判断映射关系中的有效装载率是否收敛的实现方式为判断经过预设次数后映射关系中有效装载率的最大值是否发生变化。

若判断经过预设迭代次数后映射关系中有效装载率的最大值不在发生变化，则判断所述有效装载率收敛。

在一可选地实施例中，由于初始装箱状态的有效装载率为所有装箱状态的有效装载率中的最大值，因此，通过判断经过预设迭代次数后映射关系中初始装箱状态的有效装载率是否发生变化来判断所述映射关系中的有效装载率是否收敛。

若判断所述映射关系中的有效装载率不收敛，表征还未完成对该神经网络模型的训练，则执行步骤S204以继续执行对该神经网络模型的训练；若判断所述映射关系中的有效装载率收敛，则确定完成对该神经网络的训练。

S204、根据与装箱样本对应的每个装箱状态、计算得到的每个装箱状态的有效装载率以及所述映射关系，更新所述映射关系以及神经网络模型的权重，并返回执行步骤S203以确定所述映射关系中的有效装载率是否收敛。

生成所有装箱状态并计算得到所有装箱状态中每个装箱状态的有效装载率后，结合所述映射关系中的装箱状态以及分别与每个装箱状态对应的有效装载率，对所述映射关系中的装箱状态和有效装载率进行更新。

更新所述映射关系的方法包括：

依次判断与装箱样本对应的每个装箱状态中是否存在于所述映射关系中。

一种情况为与装箱样本对应的装箱状态中存在所述映射关系中没有的装箱状态，则将所述映射关系中没有的装箱状态添加至所述映射关系中，并将新添加的该装箱状态的有效装载率也对应添加至所述映射关系中。

例如，与装箱样本对应的装箱状态包括a1、a3和a4，而映射关系中包括a1、a2和a3，则判断与装箱样本对应的装箱状态中存在映射关系中不包括的装箱状态，将映射关系中不包括的a4添加至映射关系中，并将a4的有效装载率对应添加至映射关系中。需要注意的是，如果多个装箱状态都不存在于所述映射关系中，则分别将多个装箱状态依次添加至所述映射关系中。

另一种情况为与装箱样本对应的所有装箱状态均存在于所述映射关系中，则依次判断与装箱样本对应的每个装箱状态的有效装载率是否大于所述映射关系中相同装箱状态的有效装载率。

对于与装箱样本对应的装箱状态中与所述映射关系中相同的装箱状态，若计算得到的该装箱状态的有效装载率大于所述映射关系中该装箱状态的有效装载率，则利用计算得到的该装箱状态的有效装载率替换所述映射关系中该装箱状态的有效装载率。使得所述映射关系中各个装箱状态的有效装载率都是该装箱状态所经历的最大有效装载率。

例如，映射关系中包括装箱状态a1及其有效装载率A1，装箱状态a2及其有效装载率A2，装箱状态a3及其有效装载率A3；而生成的装箱状态包括a1、a3和a4，并分别计算得到装箱状态a1的有效装载率A1’，装箱状态a3的有效装载率A3’和装箱状态a4的有效装载率A4。其中，A1’大于A1，A3’小于A3。

经过执行上述对映射关系的更新操作，将原本映射关系中不存在的装箱状态a4及其有效装载率A4添加至所述映射关系中，并且将映射关系中装箱状态a1的有效装载率更新为A1’。得到更新后的映射关系包括装箱状态a1及其有效装载率A1’，装箱状态a2及其有效装载率A2，装箱状态a3及其有效装载率A3，装箱状态a4及其有效装载率A4。

更新神经网络模型的权重的方法包括：

基于公式

更新所述神经网络模型的权重；

S205、完成对神经网络模型的训练。

可选地，在另一个实施例中，利用装箱样本对神经网络进行训练的过程中，将若干个装箱样本作为训练构建的神经网络的训练集，每次只从训练集中获取一个装箱样本对该神经网络进行训练。只有在利用当前获取到的装箱样本完成对神经网络的训练后才会返回获取另一个装箱样本，并重复利用获取到的装箱样本对该神经网络进行训练的操作，直至完成利用预设数量的装箱样本对该神经网络训练的操作后，才结束对神经网络的训练，得到训练后的神经网络。

针对任意一个装箱样本，分别执行步骤S202-S204。需要注意的是，对于任意一个装箱样本，在步骤S203中确定所述映射关系中的有效装载率是否收敛。

若对于任意一个装箱样本确定出所述映射关系中的有效装载率不收敛，则执行步骤S204；

若对于预设数量个装箱样本，都确定出所述映射关系中的有效装载率收敛，才确定完成对神经网络模型的训练。

示例性的，获取第一装箱样本，在利用第一装箱样本对神经网络模型训练过程中判断所述映射关系中的有效装载率是否收敛，若判断所述映射关系中的有效装载率不收敛，表征还未完成对该神经网络模型的训练，则执行步骤S204以继续执行对该神经网络模型的训练；若判断所述映射关系中的有效装载率收敛，则确定利用第一装箱样本完成对该神经网络的训练，并继续获取第二装箱样本。

在利用第二装箱样本对神经网络模型训练过程中判断所述映射关系中的有效装载率是否收敛，若判断所述映射关系中的有效装载率不收敛，表征还未完成对该神经网络模型的训练，则执行步骤S204以继续执行对该神经网络模型的训练；若判断所述映射关系中的有效装载率收敛，则确定利用第二装箱样本完成对该神经网络的训练，并继续获取第三装箱样本。

在利用第三装箱样本对神经网络模型训练过程中判断所述映射关系中的有效装载率是否收敛，若判断所述映射关系中的有效装载率不收敛，表征还未完成对该神经网络模型的训练，则执行步骤S204以继续执行对该神经网络模型的训练；若判断所述映射关系中的有效装载率收敛，则确定利用第三装箱样本完成对该神经网络模型的训练，并继续获取第四装箱样本。以此类推，直至利用预设数量的装箱样本中的每个装箱样本都完成对该神经网络模型的训练，即获取到预设数量个装箱样本都判断出所述映射关系中的有效装载率收敛，则确定完成对神经网络模型的训练。

从上述技术方案可知，根据业务实际订单生成的装箱样本对神经网络模型训练，压缩了训练样本且能够兼顾装箱问题的通用性。利用训练得到的神经网络模型处理装箱问题相较于现有技术中每次都从一个随机的初始装箱状态开始迭代得到的处理结果中有效装载率提高了4％-5％。

且，对于每个重新获取到的装箱样本使用微调的方式对神经网络模型进行训练，不仅可以加快训练速度而且提高了有效装载率，使得得到的处理结果更符合优化目标。

同时，在映射关系中存储有各个装箱状态的最大有效装载率，使得利用装箱样本和映射关系训练得到的神经网络模型处理装箱问题时，可以得到最优处理结果。

对应上述装箱问题的处理方法，本申请还提供了一种装箱问题的处理装置，所述处理装置的结构示意图请参阅图3所示，本实施例中处理装置包括：

输入单元301和处理单元302。

输入单元301，用于将装箱问题输入预先训练得到的神经网络模型；所述神经网络模型为以装箱状态与有效装载率之间的映射关系和装箱样本作为训练样本，以映射关系中有效装载率收敛作为训练结束条件进行训练得到；

处理单元302，用于获得所述预先训练得到的神经网络模型对所述装箱问题进行处理后输出的装箱状态以及与所述装箱状态对应的有效装载率。

可选地，在其他实施例中，所述处理装置还包括：训练单元303。

训练单元303训练得到神经网络模型，具体用于：获取装箱状态与有效装载率之间的映射关系以及装箱样本，所述有效装载率用装箱状态与神经网络模型权重的函数来表征；

可选地，一种实现方式中，训练单元303更新所述映射关系，具体用于：

可选地，一种实现方式中，训练单元303更新神经网络模型的权重，具体用于：

具体地，基于公式

更新所述神经网络模型的权重；

可选地，在其他实施例中，生成装箱样本对应的所有装箱状态，包括：

本申请还提供了一种计算机可读存储介质，其上存储有计算机指令，所述计算机指令运行时执行上述实施例中的装箱问题的处理方法的步骤。

本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。对于实施例提供的装置而言，由于其与实施例提供的方法相对应，所以描述的比较简单，相关之处参见方法部分说明即可。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

对所公开的实施例的上述说明，使本领域技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下，在其它实施例中实现。因此，本发明将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

1.一种装箱问题的处理方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述神经网络模型采用以下方法训练得到：

3.根据权利要求2所述的方法，其特征在于，所述根据与装箱样本对应的每个装箱状态、计算得到的每个装箱状态的有效装载率以及所述映射关系，更新所述映射关系，包括：

4.根据权利要求2所述的方法，其特征在于，所述更新神经网络模型的权重，包括：

5.根据权利要求2所述的方法，其特征在于，所述生成装箱样本对应的所有装箱状态，包括：

6.根据权利要求4所述的方法，其特征在于，所述通过误差反向传播算法计算得到有效装载率的均方差的梯度，基于所述梯度更新所述神经网络模型的权重，包括：

基于公式

更新所述神经网络模型的权重；

7.一种装箱问题的处理装置，其特征在于，包括：

8.根据权利要求7所述的装置，其特征在于，所述装置还包括：

训练单元；

9.根据权利要求8所述的装置，其特征在于，所述训练单元更新所述映射关系，具体用于：

10.一种计算机可读存储介质，其上存储有计算机指令，其特征在于，所述计算机指令运行时执行权利要求1-6任一项所述的处理方法的步骤。