CN114841282A

CN114841282A - 预训练模型的训练方法、求解模型的生成方法及装置

Info

Publication number: CN114841282A
Application number: CN202210553282.2A
Authority: CN
Inventors: 夏俊; 陈珍
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2022-05-20
Filing date: 2022-05-20
Publication date: 2022-08-02

Abstract

本公开提供了一种预训练模型的训练方法、求解模型的生成方法、装置、设备、存储介质以及计算机程序产品，涉及人工智能技术领域，尤其涉及机器学习技术领域。具体实现方案为：获取训练样本，其中，训练样本包括已知求解器的求解状态信息；基于训练样本，对预训练模型中的表征网络进行训练，得到训练样本的问题特征；基于预训练任务和问题特征，对预训练模型中的多个任务网络进行训练；响应于满足训练结束条件，输出训练完成的预训练模型。提高了预训练模型的通用性。

Description

预训练模型的训练方法、求解模型的生成方法及装置

技术领域

本公开涉及人工智能技术领域，具体涉及机器学习技术领域，尤其涉及一种预训练模型的训练方法、求解模型的生成方法、装置、设备、存储介质以及计算机程序产品。

背景技术

组合优化问题(Combinatorial Optimization Problem,COP)是一类在离散状态下求极值的最优化问题，其通过对数学方法的研究，去寻找处理离散事件的编排、分组、次序或筛选等问题的优化方法。目前解决组合优化问题的方法主要包括基于求解器的精确求解、启发式求解和端到端黑盒求解等。

发明内容

本公开提供了一种预训练模型的训练方法、求解模型的生成方法、装置、设备、存储介质以及计算机程序产品，提高了预训练模型的通用性。

根据本公开的第一方面，提供了一种预训练模型的训练方法，包括：获取训练样本，其中，训练样本包括已知求解器的求解状态信息；基于训练样本，对预训练模型中的表征网络进行训练，得到训练样本的问题特征；基于预训练任务和问题特征，对预训练模型中的多个任务网络进行训练；响应于满足训练结束条件，输出训练完成的预训练模型。

根据本公开的第二方面，提供了一种求解模型的生成方法，包括：获取问题样本和初始求解模型；基于问题样本，对预训练模型中的任务网络进行删减，得到目标预训练模型，其中，预训练模型是由上述第一方面的训练方法训练得到的；使用目标预训练模型替换初始求解模型中的前置表征网络，得到待训练求解模型；利用问题样本对待训练求解模型进行训练，得到目标求解模型。

根据本公开的第三方面，提供了另一种求解模型的生成方法，包括：获取问题样本和初始求解模型；通过预训练模型对初始求解模型进行变量选择和变量赋值，得到待训练求解模型，其中，预训练模型是由上述第一方面的训练方法训练得到的；利用问题样本对待训练求解模型进行训练，得到目标求解模型。

根据本公开的第四方面，提供了又一种求解模型的生成方法，包括：获取问题样本和初始求解模型；将问题样本输入预训练模型，得到预训练模型中的表征网络输出的表征样本，其中，预训练模型是由上述第一方面的训练方法训练得到的；利用表征样本对初始求解模型进行训练，得到目标求解模型。

根据本公开的第五方面，提供了一种预训练模型的训练装置，包括：样本获取模块，被配置为获取训练样本，其中，训练样本包括已知求解器的求解状态信息；特征提取模块，被配置为基于训练样本，对预训练模型中的表征网络进行训练，得到训练样本的问题特征；模型训练模块，被配置为基于预训练任务和问题特征，对预训练模型中的多个任务网络进行训练；模型输出模块，被配置为响应于满足训练结束条件，输出训练完成的预训练模型。

根据本公开的第六方面，提供了一种求解模型的生成装置，包括：第一获取模块，被配置为获取问题样本和初始求解模型；调整模块，被配置为基于问题样本，对预训练模型中的任务网络进行删减，得到目标预训练模型，其中，预训练模型是由上述第五方面的训练装置训练得到的；替换模块，被配置为使用目标预训练模型替换初始求解模型中的前置表征网络，得到待训练求解模型；第一训练模块，被配置为利用问题样本对待训练求解模型进行训练，得到目标求解模型。

根据本公开的第七方面，提供了另一种求解模型的生成装置，包括：第二获取模块，被配置为获取问题样本和初始求解模型；赋值模块，被配置为通过预训练模型对初始求解模型进行变量选择和变量赋值，得到待训练求解模型，其中，预训练模型是由上述第五方面的训练装置训练得到的；第二训练模块，被配置为利用问题样本对待训练求解模型进行训练，得到目标求解模型。

根据本公开的第八方面，提供了又一种求解模型的生成装置，包括：第三获取模块，被配置为获取问题样本和初始求解模型；输入模块，被配置为将问题样本输入预训练模型，得到预训练模型中的表征网络输出的表征样本，其中，预训练模型是由上述第五方面的训练装置训练得到的；第三训练模块，被配置为利用表征样本对初始求解模型进行训练，得到目标求解模型。

根据本公开的第九方面，提供了一种电子设备，包括：至少一个处理器；以及与至少一个处理器通信连接的存储器；其中，存储器存储有可被至少一个处理器执行的指令，指令被上述至少一个处理器执行，以使上述至少一个处理器能够执行上述预训练模型的训练方法或求解模型的生成方法。

根据本公开的第十方面，提供了一种存储有计算机指令的非瞬时计算机可读存储介质，其中，上述计算机指令用于使上述计算机执行上述预训练模型的训练方法或求解模型的生成方法。

根据本公开的第十一方面，提供了一种计算机程序产品，包括计算机程序，上述计算机程序在被处理器执行时实现上述预训练模型的训练方法或求解模型的生成方法。

应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

附图说明

附图用于更好地理解本方案，不构成对本公开的限定。其中：

图1是本公开可以应用于其中的示例性系统架构图；

图2是根据本公开的预训练模型的训练方法的一个实施例的流程图；

图3是根据本公开的预训练模型的训练方法的另一个实施例的流程图；

图4是根据本公开的预训练模型的训练方法的又一个实施例的流程图；

图5是根据本公开的预训练模型的训练方法的一个实施例的示意图；

图6是根据本公开的一种求解模型的生成方法的一个实施例的流程图；

图7是根据本公开的另一种求解模型的生成方法的一个实施例的流程图；

图8是根据本公开的又一种求解模型的生成方法的一个实施例的流程图；

图9是根据本公开的预训练模型的训练装置的一个实施例的结构示意图；

图10是根据本公开的一种求解模型的生成装置的一个实施例的结构示意图；

图11是根据本公开的另一种求解模型的生成装置的一个实施例的结构示意图；

图12是根据本公开的又一种求解模型的生成装置的一个实施例的结构示意图；

图13是用来实现本公开实施例的预训练模型的训练方法或求解模型的生成方法的电子设备的框图。

具体实施方式

以下结合附图对本公开的示范性实施例做出说明，其中包括本公开实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本公开的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。

图1示出了可以应用本公开的交互方法或交互装置的实施例的示例性系统架构100。

如图1所示，系统架构100可以包括终端设备101、102、103，网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型，例如有线、无线通信链路或者光纤电缆等等。

用户可以使用终端设备101、102、103通过网络104与服务器105交互，也可以经由服务器105实现终端设备101、102、103之间的交互。终端设备101、102、103上可以安装有各种客户端应用，例如模型训练类应用、模型生成类应用、组合优化问题求解应用等等。

终端设备101、102、103可以是硬件，也可以是软件。当终端设备101、102、103为硬件时，可以是各种电子设备，包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。当终端设备101、102、103为软件时，可以安装在上述电子设备中。其可以实现成多个软件或软件模块，也可以实现成单个软件或软件模块。在此不做具体限定。

服务器105可以提供各种模型训练或模型获取服务。例如，服务器105可以对从终端设备101、102、103获取到的求解器的求解状态信息，并基于求解状态信息进行模型训练，得到训练完成的预训练模型，或者在预训练模型的基础上，进行模型微调或变量选择与赋值等，以生成需要的目标求解模型。

需要说明的是，服务器105可以是硬件，也可以是软件。当服务器105为硬件时，可以实现成多个服务器组成的分布式服务器集群，也可以实现成单个服务器。当服务器105为软件时，可以实现成多个软件或软件模块(例如用来提供分布式服务)，也可以实现成单个软件或软件模块。在此不做具体限定。

无论是模型训练还是模型生成，都需要占用较多的运算资源和较强的运算能力，因此本申请后续各实施例所提供的预训练模型的训练方法或求解模型的生成方法一般由拥有较强运算能力、较多运算资源的服务器105来执行，相应地，预训练模型的训练装置或求解模型的生成装置一般设置于服务器105中。但同时也需要指出的是，在终端设备101、102、103也具有满足要求的运算能力和运算资源时，终端设备101、102、103也可以通过其上安装的模型训练类应用或模型生成类应用完成上述本交由服务器105做的各项运算，进而输出与服务器105同样的结果。相应的，预训练模型的训练装置或求解模型的生成装置也可以设置于终端设备101、102、103中。在此种情况下，示例性系统架构100也可以不包括服务器105和网络104。

应该理解，图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要，可以具有任意数目的终端设备、网络和服务器。

继续参考图2，其示出了根据本公开的预训练模型的训练方法的一个实施例的流程200。该训练方法包括以下步骤：

步骤201、获取训练样本，其中，训练样本包括已知求解器的求解状态信息。

在本实施例中，训练方法的执行主体(例如图1所示的服务器105)可以首先获取需要在训练中使用的训练样本，通常，训练样本的数量多个，其中，每个训练样本可以包括已知求解器的求解状态信息。具体地，已知求解器可以是解决组合优化问题时常用的求解器，例如精确求解器、启发式求解器或端到端黑盒求解器。求解状态信息包括求解器在每次求解组合优化问题的过程中所产生的具体状态信息，例如可以包含变量系数、变量类型和生命周期等信息。需要说明的是，求解器在求解组合优化问题时，可以进行多轮迭代求解，在这种情况下，每一轮求解过程中得到的状态信息都可以作为一个训练样本。

步骤202、基于训练样本，对预训练模型中的表征网络进行训练，得到训练样本的问题结构特征。

在本实施例中，需要进行训练的预训练模型中包括有表征网络，由于该预训练模型在训练完成后主要用于生成下游组合优化问题求解模型，因此其包括的表征网络主要用于对组合优化问题的问题特征进行表征。上述执行主体在获取到输入信息后，可以进一步对预训练模型中的表征网络进行训练，以得到训练样本的问题特征。其中，问题特征可以包括问题类型、变量属性等特征。在一种可选的实现方式中，上述执行主体可以将训练样本输入预训练模型的表征网络，然后根据表征网络输出结果，对表征网络的参数进行调整。

步骤203、基于预训练任务和问题特征，对预训练模型中的多个任务网络进行训练。

在本实施例中，预训练模型还包括有多个任务网络，每个任务网络可以对应于一个预训练任务，可选的，预训练任务可以根据预训练模型的下游任务来确定，具体可以将下游任务需要实现的一种功能确定为一个预训练任务，例如，下游任务通常都需要进行变量赋值，那么变量赋值任务就可以作为一个预训练任务。具体地，上述执行主体在从上述步骤202中得到训练样本的问题特征后，可以将问题特征分别输入预训练模型包括的多个任务网络中，然后根据每个任务网络对应的预训练任务进行网络训练。本实施例的预训练模型可以包括一个表征网络和多个任务网络，表征网络的输出可以作为每个任务网络的输入。

步骤204、响应于满足训练结束条件，输出训练完成的预训练模型。

在本实施例中，上述执行主体在对预训练模型中表征网络和多个任务网络按照上述步骤202和203描述的方法进行多轮训练后，可以进一步判断当前得到的预训练模型是否满足训练结束条件，如果满足，例如训练次数达到预先指定的次数阈值，可以直接输出训练完成的预训练模型，如果不满足，则继续按照上述方法进行训练。

在判断当前得到的预训练模型是否满足训练结束条件时，还可以通过引入下游任务进行评估。在一种实现方式中，可以针对任务网络的功能实现情况进行评估，例如，可以利用变量赋值任务对应的任务网络进行变量赋值操作，并对赋值的准确度进行评估，如果评估出各个任务网络都满足功能需求，则可以认为满足训练结束条件。在另一种可选的实现方式中，可以利用预训练模型生成下游求解模型，对求解模型的生成效率或求解准确度进行评估，如果求解模型满足使用需求，则可以认为满足训练结束条件。需要说明的是，上述两种实现方式都需要在预训练模型的应用端或应用模块中进行判断，并将得到判断结果反馈给上述执行主体。

本公开实施例提供的预训练模型的训练方法，首先获取训练样本集，其中，训练样本包括已知求解器的求解状态信息，然后基于训练样本，对预训练模型中的表征网络进行训练，得到训练样本的问题特征，接着基于预训练任务和问题特征，对预训练模型中的多个任务网络进行训练，最后响应于满足训练结束条件，输出训练完成的预训练模型。通过将下游求解器的求解状态信息作为训练样本，并通过表征网络提取求解问题的问题特征，使得预训练模型能够应对多种求解问题，提高了预训练模型的通用性以及与下游任务的匹配度。

进一步继续参考图3，其示出了根据本公开的预训练模型的训练方法的另一个实施例的流程300。该训练方法包括以下步骤：

步骤301、获取训练样本，其中，训练样本包括已知求解器的求解状态信息。

在本实施例中，步骤301具体操作已在图2所示的实施例中步骤201进行了详细的介绍，在此不再赘述。

在本实施例的一种可选实现方式中，步骤301可以具体包括：通过精确求解器分别求解多个混合整数规划问题；将在上述求解的过程中得到求解状态信息确定为训练样本，其中，求解状态信息包括变量系数和变量类型。在本实施例中，混合整数规划(MixedInteger Program,MIP)问题是组合优化问题中的一类，旨在最小化受限于线性约束的线性目标，其中部分或所有变量被约束为整数值。典型的MIP问题包括背包问题(KnapsackProblem,KP)、旅行商问题(Travelling Salesman Problem,TSP)、最大独立集问题(Maximal Independent Set,MIS)和车辆路径问题(Vehicular Routing Problem,VRP)等多种问题。本实施例中的精确求解器为MIP求解器，其将精确算法，如分支定界法(Branchand Bound Algorithm,B&B)、枚举法分支(Branching)算法，作为求解器的核心框架。

在本实施例中，上述执行主体可以通过精确求解器求解各个MIP问题，并且在求解每个MIP问题的过程中都会经过多轮迭代求解，在每一轮求解过程中的求解状态信息可以共同作为一个训练样本，其中，求解状态信息可以包括在本次求解过程中使用的变量系数和变量类型。通过将精确求解器的求解状态信息作为训练样本，可以使得预训练模型充分学习精确求解器中应用的专家策略，提升预训练模型与下游任务的融合度。

步骤302、通过预训练模型中的二部图类，将训练样本转换为二部图样本。

在本实施例中，预训练模型中包括有二部图类，上述执行主体在获取到训练样本后，可以利用二部图类将训练样本转换成二部图的形式，得到二部图样本。在二部图中，其顶点集合可分割为两个互不相交的子集，并且图中每条边依附的两个顶点都分属于这两个互不相交的子集，两个子集内的顶点不相邻。

在本实施例的一些可选实现方式中，二部图样本包括变量节点特征向量、约束节点特征向量、边特征向量以及拉普拉斯特征向量。其中，变量节点特征向量用于表征在求解过程中使用到的变量，约束节点特征向量用于表征在求解过程中所受到的约束、边特征向量用于表征在求解过程中变量和约束之间的关联关系，拉普拉斯特征向量是一个固定值，其受到变量与约束之间连接关系的影响。

步骤303、基于二部图样本，对预训练模型中的表征网络进行自监督对比学习，得到二部图样本的问题结构特征。

在本实施例中，上述执行主体在得到二部图样本后，可以将二部图样本输入到预训练模型的表征网络中，并对表征网络进行自监督对比学习。自监督学习不需要人工标注的类别标签信息，直接利用数据本身作为监督信息，学习样本数据的特征表达，应用于下游的任务。自监督对比学习的核心思想是将正样本和负样本在特征空间进行对比，学习样本的特征表示。在本实施例中，上述执行主体通过预训练模型的表征网络，对二部图样本进行自监督对比学习，可以学习得到二部图样本的问题结构特征。其中，问题结构特征可以包括二部图的节点连接结构特征以及各个节点本身的属性特征。利用这两个特征可以对MIP问题的结构信息和属性信息进行充分表征，进行自监督学习后的表征网络也可以充分挖掘MIP问题的结构与属性。

步骤304、基于预训练任务和问题特征，对预训练模型中的多个任务网络进行训练。

在本实施例中，将在步骤303中得到的问题结构特征作为问题特征，对预训练模型中的多个任务网络进行训练，步骤304具体操作已在图2所示的实施例中步骤203进行了详细的介绍，在此不再赘述。

在本实施例的一些可选实现方式中，预训练任务包括变量与约束关联预测任务，候选变量预测任务，变量选择任务，变量赋值任务。具体地，变量与约束关联预测任务的目的是提取问题的结构特性，预测变量与约束之间的关联关系；候选变量预测任务，变量选择任务，变量赋值任务的目的是提取精确求解器的专家策略知识。在基于专家策略知识引导构建变量样本的过程中，会存在一些变量无法进入候选名单中，这主要是由于求解器在求解这些变量时将其分值设置为缺省导致的。针对这种情况，可以引入候选变量预测任务，用来学习变量的有效性。

需要说明的是，预训练任务并不局限于上述列举的四种任务，还可以包括节点选择任务、变量平衡任务等，具体可以根据下游任务的需求进行设置。

在一些可选的实现方式中，在对任务网络进行训练时，不但可以根据任务网络的输出结果调整任务网络自身的参数，也可以根据需求调整表征网络的参数。

步骤305、响应于满足训练结束条件，输出训练完成的预训练模型。

在本实施例中，步骤305具体操作已在图2所示的实施例中步骤204进行了详细的介绍，在此不再赘述。

从图3中可以看出，与图2对应的实施例相比，本实施例中的预训练模型的训练方法在得到训练样本后，可以首先将训练样本转换为二部图样本，然后对特征网络进行自监督对比学习，使得表征网络能够学习到多个MIP问题的问题结构特征，提高了预训练模型对MIP问题的表征能力。

进一步继续参考图4，其示出了根据本公开的预训练模型的训练方法的又一个实施例的流程400。该训练方法包括以下步骤：

步骤401、获取训练样本，其中，训练样本包括已知求解器的求解状态信息。

在本实施例中，步骤401具体操作已在图2所示的实施例中步骤201或图3所示的实施例中步骤301进行了详细的介绍，在此不再赘述。

步骤402、通过预训练模型中的二部图类，将训练样本转换为二部图样本。

在本实施例中，步骤402具体操作已在图3所示的实施例中步骤302进行了详细的介绍，在此不再赘述。

步骤403、对二部图样本的边特征向量进行遮蔽，得到遮蔽后的二部图样本。

在本实施例中，二部图样本可以包括变量节点特征向量、约束节点特征向量、边特征向量以及拉普拉斯特征向量。预训练任务包括变量与约束关联预测任务，这个训练任务的目的在于通过还原边连接的预测功能，提升预训练模型对问题的结构性的表征能力。因此，在得到二部图样本后，可以通过随机的方式遮蔽二部图样本中的一部分边特征，然后将遮蔽后的二部图样本作为后续训练中使用的样本。

步骤404、通过多个二部图Transformer层对遮蔽后的二部图样本进行编码，得到问题结构特征。

在本实施例中，表征网络为自注意力Transformer网络，该Transformer网络包括多个二部图Transformer层。具体地，Transformer是完全基于自注意力机制的一类深度学习模型，其通常包括编码器和解码器。在本实施例中作为表征网络的Transformer网络包括有多个二部图Transformer层，每个Transformer层都可以实现编码功能。在通过多个二部图Transformer层对遮蔽后的二部图样本进行编码时，可以使用逐层编码的方式进行编码，即先使用第一个Transformer层对遮蔽后的二部图样本进行编码，然后将编码结果输入第二个Transformer层，以此类推，知道所有Transformer层都对遮蔽后的二部图样本进行编码，此时可以得到问题结构特征。

在本实施例的一些可选实现方式中，二部图Transformer层包括第一Transformer子层和第二Transformer子层，步骤404可以具体包括：利用每个二部图Transformer层，执行如下编码操作：通过该二部图Transformer层的第一Transformer子层，对约束节点特征向量进行编码；通过该二部图Transformer层的第二Transformer子层，对变量节点特征向量进行编码。

在本实施例中，每个二部图Transformer层都可以包括两个Transformer子层，即第一Transformer子层和第二Transformer子层。在利用一个二部图Transformer层，对遮蔽后的二部图样本进行编码时，可以先利用第一子层约束进行编码，然后再利用第二子层对变量进行编码。这是因为对于二部图样本，核心特征是变量，通过先对约束做编码，再对变量做编码，可以增强变量特征的信息饱和度。

在本实施例的一些可选实现方式中，预训练模型还包括特征转换网络，在将二部图样本输入表征网络之前，还可以通过特征转换网络对二部图样本执行Embedding嵌入操作，以降低变量节点特征向量、约束节点特征向量、边特征向量以及拉普拉斯特征向量转换的向量维度，从而提高后续预训练模型的训练效率。

步骤405、将问题结构特征，输入变量与约束关联预测任务对应的目标前馈神经网络。

在本实施例中，任务网络为前馈神经网络(Feedforward Neural Network，FNN)。前馈神经网络采用一种单向多层结构,其中每一层包含若干个神经元，本实施例中的FNN包括多个全连接层。由于任务网络实现的各种功能可以被分为分类和生成两大类，因此FNN的架构通常为分类模型或生成模型。由于本实施例中遮蔽的二部图样本主要针对变量与约束关联预测任务，因此上述执行主体可以将在步骤404中的到问题结构特征，输入变量与约束关联预测任务对应的目标前馈神经网络。

需要说明的是，遮蔽的二部图样本只在训练变量与约束关联预测任务对应的目标前馈神经网络时使用，在训练其他预训练任务对应的任务网络时，不需要对二部图样本进行遮蔽操作。

步骤406、根据目标前馈神经网络的输出结果，调整Transformer网络和目标前馈神经网络的网络参数。

在本实施例中，上述执行主体在目标前馈神经网络的输出结果后，可以根据输出结果，对Transformer网络和目标前馈神经网络的网络参数进行调整。例如可以根据当前输出结果与目标结果之间的差异，进行网络参数调整。

步骤407、响应于满足训练结束条件，输出训练完成的预训练模型。

在本实施例中，上述执行主体在对预训练模型中Transformer网络和目标前馈神经网络的网络参数进行多次调整后，可以进一步判断当前得到的预训练模型是否满足训练结束条件，如果满足，例如训练次数达到预先指定的次数阈值，可以直接输出训练完成的预训练模型，如果不满足，则继续按照上述方法进行训练。

从图4中可以看出，与图3对应的实施例相比，本实施例中预训练模型的训练方法对二部图样本的边特征进行了遮蔽，并利用Transformer网络中的多层二部图Transformer层对遮蔽后的二部图进行多次编码，提高了预训练模型对二部图边连接的预测能力，从而进一步改善了预训练模型对求解问题的表征能力。并且根据目标前馈神经网络的输出结果，同时调整Transformer网络和目标前馈神经网络的网络参数，提高了预训练模型的训练效率。

为了便于理解，图5示出了可以实现本公开实施例的预训练模型的训练方法的示意图。图5左侧部分展示了预训练模型的整体架构，右侧部分进行一步展示了表征网络中一层的结构。如图5左侧部分所示，预训练模型包括特征转换网络，作为表征网络的Transformer网络，以及作为任务网络的FNN网络。Transformer网络包括有三个二部图Transformer层，如图5右侧部分所示，每个二部图层包括有两个子层，即第一Transformer子层和第二Transformer子层。在对预训练模型进行训练时，可以首选获取训练样本，具体可以收集已有数据集中与各类求解问题相关的可实现实例，并通过数据增强的方式，基于这些可实现实例生成大量的新实例。之后将得到的所有实例通过精确求解器进行求解，并记录下求解过程中的变量选择信息以及可行解的信息等状态信息，之后将其构造为样本信息。接着通过二部图类将样本信息转化为二部图样本，每个二部图样本包括变量节点特征X-C、约束节点特征X-V、边特征A以及拉普拉斯特征向量LE。然后将二部图样本包括的各个特征输入特征转化网络，实现对各个特征的Embeding操作，接着将特征转化网络的输出结果，输入Transformer网络。Transformer网络中的三个二部图Transformer层，对得到的二部图特征进行逐层编码，并且每一层中的第一Transformer子层先对约束节点特征X-V进行编码，第二Transformer子层再对变量节点特征X-C进行编码。编码后的数据输入FFN，并针对预先设定的预训练任务进行训练，其中，预训练任务可以包括变量与约束关联预测任务T1，候选变量预测任务T2，变量选择任务T3，变量赋值任务T4。响应于各个预训练任务训练结束，得到训练完成的预训练模型。

进一步继续参考图6，其示出了根据本公开的一种求解模型的生成方法的实施例的流程600，该生成方法包括以下步骤：

步骤601、获取问题样本和初始求解模型。

在本实施例中，训练方法的执行主体(例如图1所示的服务器105)，可以首先获取问题样本作为训练样本，获取初始求解模型作为待训练的初始模型。其中，问题样本是与优化组合问题相关的问题样本，可以包括变量类型、约束条件和求解目标等信息。初始求解模型可以是具备机器学习模块的已知求解器，例如AI(Artificial Intelligence,人工智能)加速精确求解器、AI启发式求解器、AI端到端求解器等。

步骤602、基于问题样本，对预训练模型中的任务网络进行删减，得到目标预训练模型。

在本实施例中，上述执行主体在获取到问题样本后，可以首先对问题样本进行分析，确定出求解相关组合优化问题所需要的任务功能，然后根据需要的功能对预训练模型的任务网络进行删减，保留需要使用的任务网络，删除不需要使用的任务网络，从而得到目标预训练模型。其中，预训练模型是通过上述图2-图4中的一个实施例公开的训练方法训练得到的，预训练模型中的每个任务网络用于实现不同的功能。

在本实施例的一些可选实现方式中，在对预训练模型的任务网络进行删减时，如果初始求解模型的功能模块已经可以满足求解需要，也可以将预训练模型的全部任务网络都删除，只保留预训练模型的表征网络作为目标预训练模型。

步骤603、使用目标预训练模型替换初始求解模型中的前置表征网络，得到待训练求解模型。

在本实施例中，上述执行主体在得到目标预训练模型之后，可以使用目标预训练模型对初始求解模型进行微调(Fine-Tune)，即使用目标预训练模型中的前置表征网络目标预训练模型替换初始求解模型中的前置表征网络。通常，在初始求解模型中包括有前置表征网络和后置任务网络，在用目标预训练模型替换前置表征网络时，可以将前置表征网络从初始求解模型中删除，然后将目标预训练模型中表征网络的输出，作为初始求解模型中后置任务网络的输入，从而得到待训练求解模型。

步骤604、利用问题样本对待训练求解模型进行训练，得到目标求解模型。

在本实施例中，上述执行主体在得到待训练求解模型之后，可以使用问题样本对待训练求解模型进行训练，当训练后的求解模型满足求解精度要求或者训练次数达到指定的次数阈值，则可以认为训练完成，从而得到目标求解模型。

从图6中可以看出，本实施例的求解模型的生成方法，首先获取问题样本和初始求解模型，然后基于问题样本，对预训练模型中的任务网络进行删减，得到目标预训练模型，接着使用目标预训练模型替换初始求解模型中的前置表征网络，得到待训练求解模型，最后利用问题样本对待训练求解模型进行训练，得到目标求解模型。通过使用预训练模型替换初始求解模型中的前置表征网络，可以降低求解模型的训练难度，提高求解模型的生成效率。

进一步继续参考图7，其示出了根据本公开的另一种求解模型的生成方法的实施例的流程700，该生成方法包括以下步骤：

步骤701、获取问题样本和初始求解模型。

在本实施例中，训练方法的执行主体(例如图1所示的服务器105)，可以首先获取问题样本作为训练样本，获取初始求解模型作为待训练的初始模型。其中，问题样本是与优化组合问题相关的问题样本，可以包括变量类型、约束条件和求解目标等信息。初始求解模型可以是具备机器学习模块的已知求解器，例如AI(Artificial Intelligence,人工智能)加速精确求解器，也可以是不具备AI模块的传统求解器，例如传统精确求解器。

步骤702、通过预训练模型对初始求解模型进行变量选择和变量赋值，得到待训练求解模型。

在本实施例中，上述执行主体在获取到初始求解模型后，可以对初始求解模型进行热启动(Warm Start)，即通过预训练模型对初始求解模型进行变量选择和变量赋值，也就是说，上述执行主体并不会改变初始求解模型本身的网络结构，而是将问题样本输入预训练模型，使其执行变量选择和变量赋值任务，然后利用得到的变量值对初始求解模型进行配置，得到待训练求解模型。其中，预训练模型是通过上述图2-图4中的一个实施例公开的训练方法训练得到的。

步骤703、利用问题样本对待训练求解模型进行训练，得到目标求解模型。

从图7中可以看出，本实施例的求解模型的生成方法，首先获取问题样本和初始求解模型，然后通过预训练模型对初始求解模型进行变量选择和变量赋值，得到待训练求解模型，最后利用问题样本对待训练求解模型进行训练，得到目标求解模型。通过使用预训练模型直接对初始求解模型中进行变量选择和变量赋值，可以减少后续训练步骤，提高求解模型的训练效率。

进一步继续参考图8，其示出了根据本公开的又一种求解模型的生成方法的实施例的流程800，该生成方法包括以下步骤：

步骤801、获取问题样本和初始求解模型。

步骤802、将问题样本输入预训练模型，得到预训练模型中的表征网络输出的表征样本。

在本实施例中，上述执行主体在获取到问题样本后，可以利用预训练模型进行表征转换，即将问题样本输入预训练模型，并通过预训练模型中的表征网络进行特征提取，从而得到问题样本对应的表征样本。其中，预训练模型是通过上述图2-图4中的一个实施例公开的训练方法训练得到的。

步骤803、利用表征样本对初始求解模型进行训练，得到目标求解模型。

在本实施例中，上述执行主体在得到表征样本之后，可以使用表征样本对待训练求解模型进行训练，当训练后的求解模型满足求解精度要求或者训练次数达到指定的次数阈值，则可以认为训练完成，从而得到目标求解模型。

在本实施例的一些可选实现方式中，还可以同时使用问题样本和表征样本对初始求解模型进行训练，以进一步提高求解模型的求解精度。

从图8中可以看出，本实施例的求解模型的生成方法，首先获取问题样本和初始求解模型，然后将问题样本输入预训练模型，得到预训练模型中的表征网络输出的表征样本，最后利用表征样本对初始求解模型进行训练，得到目标求解模型。通过使用预训练模型对问题样本进行表征提取，并用得到的表征样本进行求解模型训练，可以减少训练过程对计算资源的需求，高求解模型的训练效率。

进一步参考图9，本公开提供了一种预训练模型的训练装置的一个实施例，该装置实施例与图2所示的方法实施例相对应，该装置具体可以应用于各种电子设备中。

如图9所示，本实施例的预训练模型的训练装置900，可以包括样本获取模块901、特征提取模块902、模型训练模块903和模型输出模块904。其中，样本获取模块901，被配置为获取训练样本，其中，训练样本包括已知求解器的求解状态信息；特征提取模块902，被配置为基于训练样本，对预训练模型中的表征网络进行训练，得到训练样本的问题特征；模型训练模块903，被配置为基于预训练任务和问题特征，对预训练模型中的多个任务网络进行训练；模型输出模块904，被配置为响应于满足训练结束条件，输出训练完成的预训练模型。

在本实施例中，预训练模型的训练装置900中：样本获取模块901、特征提取模块902、模型训练模块903和模型输出模块904的具体处理及其所带来的技术效果可分别参考图2对应实施例中的步骤201-204的相关说明，在此不再赘述。

在本实施例的一些可选实现方式中，样本获取模块901包括：问题求解单元，被配置为通过精确求解器分别求解多个混合整数规划问题；样本获取单元，被配置为将在求解的过程中得到求解状态信息确定为训练样本，其中，求解状态信息包括变量系数和变量类型。

在本实施例的一些可选实现方式中装置900，还包括：样本转换模块，被配置为通过预训练模型中的二部图类，将训练样本转换为二部图样本；特征提取模块902包括：特征提取子模块，被配置为基于二部图样本，对预训练模型中的表征网络进行自监督对比学习，得到二部图样本的问题结构特征。

在本实施例的一些可选实现方式中，二部图样本包括变量节点特征向量、约束节点特征向量、边特征向量以及拉普拉斯特征向量；预训练任务包括变量与约束关联预测任务，候选变量预测任务，变量选择任务，变量赋值任务。

在本实施例的一些可选实现方式中，表征网络为自注意力Transformer网络，Transformer网络包括多个二部图Transformer层；上述特征提取子模块包括：样本遮蔽单元，被配置为对二部图样本的边特征向量进行遮蔽，得到遮蔽后的二部图样本；样本编码单元，被配置为通过多个二部图Transformer层对遮蔽后的二部图样本进行编码，得到问题结构特征。

在本实施例的一些可选实现方式中，二部图Transformer层包括第一Transformer子层和第二Transformer子层，上述样本编码单元包括：编码子单元，被配置为利用每个二部图Transformer层，执行如下编码操作：通过该二部图Transformer层的所述第一Transformer子层，对所述约束节点特征向量进行编码；通过该二部图Transformer层的所述第二Transformer子层，对所述变量节点特征向量进行编码。

在本实施例的一些可选实现方式中，任务网络为前馈神经网络，模型训练模块903包括：特征输入单元，被配置为将问题结构特征，输入变量与约束关联预测任务对应的目标前馈神经网络；参数调整单元，被配置为根据目标前馈神经网络的输出结果，调整Transformer网络和目标前馈神经网络的网络参数。

进一步参考图10，本公开提供了一种求解模型的生成装置的一个实施例，该装置实施例与图6所示的方法实施例相对应，该装置具体可以应用于各种电子设备中。

如图10所示，本实施例的求解模型的生成装置1000，可以包括第一获取模块1001，被配置为获取问题样本和初始求解模型；调整模块1002，被配置为基于问题样本，对预训练模型中的任务网络进行删减，得到目标预训练模型，其中，预训练模型是由前述图9所示的训练装置训练得到的；替换模块1003，被配置为使用目标预训练模型替换初始求解模型中的前置表征网络，得到待训练求解模型；第一训练模块1004，被配置为利用问题样本对待训练求解模型进行训练，得到目标求解模型。

在本实施例中，求解模型的生成装置1000中各个模块的具体处理及其所带来的技术效果可分别参考图6对应实施例中的步骤601-604的相关说明，在此不再赘述。

进一步参考图11，本公开提供了另一种求解模型的生成装置的一个实施例，该装置实施例与图7所示的方法实施例相对应，该装置具体可以应用于各种电子设备中。

如图11所示，本实施例的求解模型的生成装置1100，可以包括第二获取模块1101，被配置为获取问题样本和初始求解模型；赋值模块1102，被配置为通过预训练模型对初始求解模型进行变量选择和变量赋值，得到待训练求解模型，其中，预训练模型是由前述图9所示的训练装置训练得到的；第二训练模块1103，被配置为利用问题样本对待训练求解模型进行训练，得到目标求解模型。

在本实施例中，求解模型的生成装置1100中各个模块的具体处理及其所带来的技术效果可分别参考图7对应实施例中的步骤701-703的相关说明，在此不再赘述。

进一步参考图12，本公开提供了又一种求解模型的生成装置的一个实施例，该装置实施例与图8所示的方法实施例相对应，该装置具体可以应用于各种电子设备中。

如图12所示，本实施例的求解模型的生成装置1200，可以包括第三获取模块1201，被配置为获取问题样本和初始求解模型；输入模块1202，被配置为将问题样本输入预训练模型，得到预训练模型中的表征网络输出的表征样本，其中，预训练模型是由前述图9所示的训练装置训练得到的；第三训练模块1203，被配置为利用表征样本对初始求解模型进行训练，得到目标求解模型。

在本实施例中，求解模型的生成装置1200中各个模块的具体处理及其所带来的技术效果可分别参考图8对应实施例中的步骤801-803的相关说明，在此不再赘述。

根据本公开的实施例，本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。

图13示出了可以用来实施本公开的实施例的示例电子设备1300的示意性框图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本公开的实现。

如图13所示，设备1300包括计算单元1301，其可以根据存储在只读存储器(ROM)1302中的计算机程序或者从存储单元1308加载到随机访问存储器(RAM)1303中的计算机程序，来执行各种适当的动作和处理。在RAM 1303中，还可存储设备1300操作所需的各种程序和数据。计算单元1301、ROM 1302以及RAM 1303通过总线1304彼此相连。输入/输出(I/O)接口1305也连接至总线1304。

设备1300中的多个部件连接至I/O接口1305，包括：输入单元1306，例如键盘、鼠标等；输出单元1307例如各种类型的显示器、扬声器等；存储单元1308，例如磁盘、光盘等；以及通信单元1309，例如网卡、调制解调器、无线通信收发机等。通信单元1309允许设备1300通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。

计算单元1301可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元1301的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元1301执行上文所描述的各个方法和处理，例如预训练模型的训练方法或求解模型的生成方法。例如，在一些实施例中，预训练模型的训练方法或求解模型的生成方法可被实现为计算机软件程序，其被有形地包含于机器可读介质，例如存储单元1308。在一些实施例中，计算机程序的部分或者全部可以经由ROM 1302和/或通信单元1309而被载入和/或安装到设备1300上。当计算机程序加载到RAM1303并由计算单元1301执行时，可以执行上文描述的预训练模型的训练方法或求解模型的生成方法的一个或多个步骤。备选地，在其他实施例中，计算单元1301可以通过其他任何适当的方式(例如，借助于固件)而被配置为执行预训练模型的训练方法或求解模型的生成方法。

本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器，使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行，作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本公开的上下文中，机器可读介质可以是有形的介质，其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备，或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

为了提供与用户的交互，可以在计算机上实施此处描述的系统和技术，该计算机具有：用于向用户显示信息的显示装置(例如，CRT(阴极射线管)或者LCD(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(LAN)、广域网(WAN)和互联网。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以为分布式系统的服务器，或者是结合了区块链的服务器。服务器也可以是云服务器，或者是带人工智能技术的智能云计算服务器或智能云主机。服务器可以为分布式系统的服务器，或者是结合了区块链的服务器。服务器也可以是云服务器，或者是带人工智能技术的智能云计算服务器或智能云主机。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本公开公开的技术方案所期望的结果，本文在此不进行限制。

本公开的技术方案中，所涉及的用户个人信息的获取，存储和应用等，均符合相关法律法规的规定，且不违背公序良俗。

上述具体实施方式，并不构成对本公开保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等，均应包含在本公开保护范围之内。

Claims

1.一种预训练模型的训练方法，所述方法包括：

获取训练样本，其中，所述训练样本包括已知求解器的求解状态信息；

基于所述训练样本，对预训练模型中的表征网络进行训练，得到训练样本的问题特征；

基于预训练任务和所述问题特征，对所述预训练模型中的多个任务网络进行训练；

响应于满足训练结束条件，输出训练完成的预训练模型。

2.根据权利要求1所述的方法，其中，所述获取训练样本包括：

通过精确求解器分别求解多个混合整数规划问题；

将在所述求解的过程中得到求解状态信息确定为所述训练样本，其中，所述求解状态信息包括变量系数和变量类型。

3.根据权利要求1或2所述的方法，还包括：

通过所述预训练模型中的二部图类，将所述训练样本转换为二部图样本；

所述基于所述训练样本，对预训练模型中的表征网络进行训练，得到训练样本的问题特征包括：

基于所述二部图样本，对所述预训练模型中的表征网络进行自监督对比学习，得到二部图样本的问题结构特征。

4.根据权利要求3所述的方法，其中，

所述二部图样本包括变量节点特征向量、约束节点特征向量、边特征向量以及拉普拉斯特征向量；

所述预训练任务包括变量与约束关联预测任务，候选变量预测任务，变量选择任务，变量赋值任务。

5.根据权利要求4所述的方法，其中，所述表征网络为自注意力Transformer网络，所述Transformer网络包括多个二部图Transformer层；

所述基于所述二部图样本，对所述预训练模型中的表征网络进行自监督对比学习，得到二部图样本的问题结构特征包括：

对所述二部图样本的边特征向量进行遮蔽，得到遮蔽后的二部图样本；

通过多个二部图Transformer层对所述遮蔽后的二部图样本进行编码，得到问题结构特征。

6.根据权利要求5所述的方法，其中，所述二部图Transformer层包括第一Transformer子层和第二Transformer子层，所述通过多个二部图Transformer层对遮蔽后的二部图样本进行编码包括：

利用每个二部图Transformer层，执行如下编码操作：

通过该二部图Transformer层的所述第一Transformer子层，对所述约束节点特征向量进行编码；

通过该二部图Transformer层的所述第二Transformer子层，对所述变量节点特征向量进行编码。

7.根据权利要求5或6所述的方法，所述任务网络为前馈神经网络，所述基于预训练任务和所述问题结构特征，对所述预训练模型中的多个任务网络进行训练包括：

将所述问题结构特征，输入所述变量与约束关联预测任务对应的目标前馈神经网络；

根据所述目标前馈神经网络的输出结果，调整所述Transformer网络和所述目标前馈神经网络的网络参数。

8.一种求解模型的生成方法，所述方法包括：

获取问题样本和初始求解模型；

基于所述问题样本，对预训练模型中的任务网络进行删减，得到目标预训练模型，其中，所述预训练模型是由如权利要求1-7任一项所述的训练方法训练得到的；

使用所述目标预训练模型替换所述初始求解模型中的前置表征网络，得到待训练求解模型；

利用所述问题样本对所述待训练求解模型进行训练，得到目标求解模型。

9.一种求解模型的生成方法，所述方法包括：

获取问题样本和初始求解模型；

通过预训练模型对所述初始求解模型进行变量选择和变量赋值，得到待训练求解模型，其中，所述预训练模型是由如权利要求1-7任一项所述的训练方法训练得到的；

10.一种求解模型的生成方法，所述方法包括：

获取问题样本和初始求解模型；

将所述问题样本输入预训练模型，得到预训练模型中的表征网络输出的表征样本，其中，所述预训练模型是由如权利要求1-7任一项所述的训练方法训练得到的；

利用所述表征样本对所述初始求解模型进行训练，得到目标求解模型。

11.一种预训练模型的训练装置，所述装置包括：

样本获取模块，被配置为获取训练样本，其中，所述训练样本包括已知求解器的求解状态信息；

特征提取模块，被配置为基于所述训练样本，对预训练模型中的表征网络进行训练，得到训练样本的问题特征；

模型训练模块，被配置为基于预训练任务和所述问题特征，对所述预训练模型中的多个任务网络进行训练；

模型输出模块，被配置为响应于满足训练结束条件，输出训练完成的预训练模型。

12.根据权利要求11所述的装置，其中，所述样本获取模块包括：

问题求解单元，被配置为通过精确求解器分别求解多个混合整数规划问题；

样本获取单元，被配置为将在所述求解的过程中得到求解状态信息确定为所述训练样本，其中，所述求解状态信息包括变量系数和变量类型。

13.根据权利要求11或12所述的装置，还包括：

样本转换模块，被配置为通过所述预训练模型中的二部图类，将所述训练样本转换为二部图样本；

所述特征提取模块包括：

特征提取子模块，被配置为基于所述二部图样本，对所述预训练模型中的表征网络进行自监督对比学习，得到二部图样本的问题结构特征。

14.根据权利要求13所述的装置，其中，

15.根据权利要求14所述的装置，其中，所述表征网络为自注意力Transformer网络，所述Transformer网络包括多个二部图Transformer层；

所述特征提取子模块包括：

样本遮蔽单元，被配置为对所述二部图样本的边特征向量进行遮蔽，得到遮蔽后的二部图样本；

样本编码单元，被配置为通过多个二部图Transformer层对所述遮蔽后的二部图样本进行编码，得到问题结构特征。

16.根据权利要求15所述的装置，其中，所述二部图Transformer层包括第一Transformer子层和第二Transformer子层，所述样本编码单元包括：

编码子单元，被配置为利用每个二部图Transformer层，执行如下编码操作：

17.根据权利要求15或16所述的装置，所述任务网络为前馈神经网络，所述模型训练模块包括：

特征输入单元，被配置为将所述问题结构特征，输入所述变量与约束关联预测任务对应的目标前馈神经网络；

参数调整单元，被配置为根据所述目标前馈神经网络的输出结果，调整所述Transformer网络和所述目标前馈神经网络的网络参数。

18.一种求解模型的生成装置，所述装置包括：

第一获取模块，被配置为获取问题样本和初始求解模型；

调整模块，被配置为基于所述问题样本，对预训练模型中的任务网络进行删减，得到目标预训练模型，其中，所述预训练模型是由如权利要求11-17任一项所述的训练装置训练得到的；

替换模块，被配置为使用所述目标预训练模型替换所述初始求解模型中的前置表征网络，得到待训练求解模型；

第一训练模块，被配置为利用所述问题样本对所述待训练求解模型进行训练，得到目标求解模型。

19.一种求解模型的生成装置，所述装置包括：

第二获取模块，被配置为获取问题样本和初始求解模型；

赋值模块，被配置为通过预训练模型对所述初始求解模型进行变量选择和变量赋值，得到待训练求解模型，其中，所述预训练模型是由如权利要求11-17任一项所述的训练装置训练得到的；

第二训练模块，被配置为利用所述问题样本对所述待训练求解模型进行训练，得到目标求解模型。

20.一种求解模型的生成装置，所述装置包括：

第三获取模块，被配置为获取问题样本和初始求解模型；

输入模块，被配置为将所述问题样本输入预训练模型，得到预训练模型中的表征网络输出的表征样本，其中，所述预训练模型是由如权利要求11-17任一项所述的训练装置训练得到的；

第三训练模块，被配置为利用所述表征样本对所述初始求解模型进行训练，得到目标求解模型。

21.一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-10中任一项所述的方法。

22.一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行根据权利要求1-10中任一项所述的方法。

23.一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现根据权利要求1-10中任一项所述的方法。