CN114663150A

CN114663150A - 一种模型训练、信息生成方法、装置、设备及存储介质

Info

Publication number: CN114663150A
Application number: CN202210323371.8A
Authority: CN
Inventors: 黄涛; 刘丽; 阳锋
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2022-03-29
Filing date: 2022-03-29
Publication date: 2022-06-24

Abstract

本公开提供了一种模型训练、信息生成方法、装置、设备及存储介质，涉及人工智能领域，尤其涉及深度学习领域。具体实现方案为：获得包含第一样本和第二样本的样本集合，以及样本集合中每一样本的标注信息；将样本集合包含的样本输入待训练模型中的第一子模型和第二子模型，对输入的样本进行收益预估；根据第一子模型和第二子模型针对输入样本的收益预估结果和标注信息，确定第一子模型对第一样本进行收益预估的第一损失值、以及第二子模型对第二样本进行收益预估的第二损失值；基于第一损失值和第二损失值，对第一子模型和第二子模型进行模型训练。应用本公开实施例提供的方案能够训练得到用于生成收益预估信息的模型。

Description

一种模型训练、信息生成方法、装置、设备及存储介质

技术领域

本公开涉及人工智能技术领域，尤其涉及深度学习技术领域。

背景技术

广告主为推广自己的产品往往会在广告投放平台投放广告，但是由于广告主的广告页面制作及优化能力有限，广告主提供的广告页面可能会影响广告的转化率。鉴于此，广告投放平台通常会推出一些优化功能来协助广告主优化广告页面，进而提高广告转化率，增加广告主在广告投放平台的粘性。

为促进广告主使用广告平台推出的优化功能，广告投放平台往往会针对优化功能向广告主推送与预期收益相关的信息。

发明内容

本公开提供了一种模型训练、信息生成方法、装置、设备及存储介质。

根据本公开的一方面，提供了一种模型训练方法，包括：

获得包含第一样本和第二样本的样本集合，以及所述样本集合中每一样本的标注信息，其中，所述第一样本为：针对已开启页面优化功能的广告流量构建的样本，所述第二样本为：针对未开启页面优化功能的广告流量构建的样本，所述标注信息表征样本对应的广告流量是否发生转化行为；

将所述样本集合包含的样本输入待训练模型中的第一子模型和第二子模型，对输入的样本进行收益预估；

根据所述第一子模型和第二子模型针对输入样本的收益预估结果和标注信息，确定所述第一子模型对所述第一样本进行收益预估的第一损失值、以及所述第二子模型对所述第二样本进行收益预估的第二损失值；

基于所述第一损失值和第二损失值，对所述第一子模型和第二子模型参数进行模型训练。

根据本公开的另一方面，提供了一种信息生成方法，包括：

获得目标广告的广告流量信息，其中，所述目标广告为未开启页面优化功能的广告；

将所述广告流量信息输入预先训练的收益预估模型中的第一子模型和第二子模型，得到所述第一子模型针对所述目标广告的第一预估收益和所述第二子模型针对所述目标广告的第二预估收益，其中，所述收益预估模型为：按照上述模型训练方法进行训练得到的模型；

基于所述第一预估收益和所述第二预估收益，生成所述目标广告开启所述页面优化功能后产生的预期增加收益。

根据本公开的另一方面，提供了一种模型训练装置，包括：

样本集合获得模块，用于获得包含第一样本和第二样本的样本集合，以及所述样本集合中每一样本的标注信息，其中，所述第一样本为：针对已开启页面优化功能的广告流量构建的样本，所述第二样本为：针对未开启页面优化功能的广告流量构建的样本，所述标注信息表征样本对应的广告流量是否发生转化行为；

样本输入模块，用于将所述样本集合包含的样本输入待训练模型中的第一子模型和第二子模型，对输入的样本进行收益预估；

损失值确定模块，用于根据所述第一子模型和第二子模型针对输入样本的收益预估结果和标注信息，确定所述第一子模型对所述第一样本进行收益预估的第一损失值、以及所述第二子模型对所述第二样本进行收益预估的第二损失值；

模型训练模块，用于基于所述第一损失值和第二损失值，对所述第一子模型和第二子模型进行模型训练。

根据本公开的另一方面，提供了一种信息生成装置，包括：

广告流量信息获得模块，用于获得目标广告的广告流量信息，其中，所述目标广告为未开启页面优化功能的广告；

广告流量信息输入模块，用于将所述广告流量信息输入预先训练的收益预估模型中的第一子模型和第二子模型，得到所述第一子模型针对所述目标广告的第一预估收益和所述第二子模型针对所述目标广告的第二预估收益，其中，所述收益预估模型为：根据上述模型训练装置训练得到的模型；

预期增加收益生成模块，用于基于所述第一预估收益和所述第二预估收益，生成所述目标广告开启所述页面优化功能后产生的预期增加收益。

根据本公开的另一方面，提供了一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行上述模型训练方法或信息生成方法。

根据本公开的另一方面，提供了一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行上述模型训练方法或信息生成方法。

根据本公开的另一方面，提供了一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现上述模型训练方法或信息生成方法。

由以上可见，应用本公开实施例提供的方案进行模型训练时，首先获得了包含第一样本和第二样本的样本集合，然后采用联合训练的方式，将样本集合中的样本输入待训练模型中的第一子模型和第二子模型，由于第一样本为针对已开启页面优化功能的广告流量构建的样本，第二样本为针对未开启页面优化功能的广告流量构建的样本，这样在训练过程中，能够使得第一子模型和第二子模型学习到已开启页面优化功能的广告流量特征和未开启页面优化功能的广告流量特征，从而训练完成后，可以得到用于预估已开启页面优化功能的广告页面收益的第一子模型和用于预估未开启页面优化功能的广告页面收益的第二子模型，这样也就得到了用于生成收益预估信息的模型。

应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

附图说明

附图用于更好地理解本方案，不构成对本公开的限定。其中：

图1为本公开实施例提供的第一种模型训练方法的流程示意图；

图2为本公开实施例提供的第二种模型训练方法的流程示意图；

图3为本公开实施例提供的一种模型训练过程的示意图；

图4为本公开实施例提供的第一种信息生成方法的流程示意图；

图5为本公开实施例提供的第二种信息生成方法的流程示意图；

图6为本公开实施例提供的一种模型训练装置的结构示意图；

图7为本公开实施例提供的第一种信息生成装置的结构示意图；

图8为本公开实施例提供的第二种信息生成装置的结构示意图；

图9是用来实现本公开实施例的模型训练方法或信息生成方法的电子设备的框图。

具体实施方式

以下结合附图对本公开的示范性实施例做出说明，其中包括本公开实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本公开的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。

首先对本公开实施例涉及的相关概念进行说明。

1、广告主：需要投放广告的主体。

2、广告投放平台：提供广告投放资源的平台，对广告主的广告进行投放。

3、广告流量：用户针对广告主在广告投放平台投放的广告的访问流量，根据广告流量所访问的广告页面是否开启了页面优化功能，可以将广告流量划分为已开启页面优化功能的广告流量和未开启页面优化功能的广告流量。

4、广告流量的来源用户：使用客户端访问广告进而产生广告流量的用户。

下面通过具体实施例对本公开实施例提供的模型训练方法进行详细说明。

参见图1，图1为本公开实施例提供的第一种模型训练方法的流程示意图，上述方法包括以下步骤S101-S104。

步骤S101：获得包含第一样本和第二样本的样本集合，以及样本集合中每一样本的标注信息。

其中，上述第一样本为：针对已开启页面优化功能的广告流量构建的样本，上述第二样本为：针对未开启页面优化功能的广告流量构建的样本，上述标注信息表征样本对应的广告流量是否发生转化行为。

上述转化行为可以是广告主设置的用户操作项，若广告流量的来源用户产生了上述用户操作项，则该广告流量发生了转化行为。

广告主在广告投放平台投放广告的过程中，可以预先设置用户操作项(如，点击、注册、下单等)作为转化项，上述转化项发生的次数越多，则广告的转化率越高，也就越有利于广告主的利益，因此在广告投放过程中，广告主会追求尽可能高的转化率。

为了帮助广告主提高广告的转化率，增加广告主在广告投放平台的粘性，广告投放平台通常会推出页面优化功能来协助广告主优化广告页面，进而提高上述转化率。

上述页面优化功能为有利于提高页面转化的功能，例如，可以是CTA(Call ToAction，行动号召)浮层界面功能、弹窗提示功能、抽奖轮盘功能等，当然，也可以是任意形式的、有助于优化页面的功能，本公开对此不做限定。

具体的，可以通过以下方式获得包含第一样本和第二样本的样本集合。

一种实施方式中，可以基于广告流量所访问的广告页面的文本特征和/或多媒体特征构建第一样本和第二样本，得到包含第一样本和第二样本的样本集合。页面优化功能开启往往带来广告页面文本和/或多媒体内容的改变，例如，开启CTA浮层界面功能后，广告页面在原有的多媒体内容的基础上，还会显示CTA浮层图，这样在提取该广告页面的多媒体特征时，还能够提取到CTA浮层图的特征。因此，针对已开启页面优化功能的广告流量所访问的广告页面，提取该广告页面的文本特征和/或多媒体特征，可以将所提取到的特征构建为第一样本，并针对未开启页面优化功能的广告流量所访问的广告页面，提取该广告页面的文本特征和/或多媒体特征，可以将所提取到的特征构建为第二样本，这样得到了包含第一样本和第二样本的样本集合。其中，将所提取到的特征构建为样本的方式可以是将上述特征构建为特征向量。

其中，文本特征可以是广告的标题、简介等部分的文本特征，可以通过Doc2Vec等算法提取文本特征；多媒体特征可以是广告页面所包含的图像特征，可以基于边缘提取算子提取上述图像特征、基于纹理特征提取算法提取上述图像特征等。

另一种实施方式中，可以通过后续步骤A-步骤C获得包含第一样本和第二样本的样本集合，具体实施方式详见后续实施例，这里暂不详述。

步骤S102：将样本集合包含的样本输入待训练模型中的第一子模型和第二子模型，对输入的样本进行收益预估。

待训练模型可以是DNN(Deep Neural Networks，深度神经网络)模型、双塔预测模型等，本公开并不对待训练模型的模型结构进行限定。

具体的，可以通过以下方式将样本集合包含的样本输入待训练模型中的第一子模型和第二子模型。

一种实施方式中，可以分别获得样本集合中的第一样本和第二样本，然后将样本集合中的第一样本输入待训练模型中的第一子模型，将样本集合中的第二样本输入待训练模型中的第二子模型。

另一种实施方式中，可以将样本集合中的所有样本分别输入待训练模型中的第一子模型和第二子模型，具体实施方式详见图2所示实施例中步骤S202，这里暂不详述。

将样本集合包含的样本输入待训练模型中的第一子模型和第二子模型之后，第一子模型和第二子模型分别对输入的样本进行收益预估。

其中，上述收益预估表示的具体内容因样本标注信息表征的转化行为不同而不同。例如，上述转化行为为点击，那么收益预估为点击率预估；上述转化行为为下单，那么收益预估为下单率预估等。

步骤S103：根据第一子模型和第二子模型针对输入样本的收益预估结果和标注信息，确定第一子模型对第一样本进行收益预估的第一损失值、以及第二子模型对第二样本进行收益预估的第二损失值。

具体的，根据样本输入阶段输入样本的不同的方式，分为以下两种情况说明确定第一损失值和第二损失值的方式。

第一种情况，样本输入阶段将第一样本输入待训练模型中的第一子模型，将第二样本输入待训练模型中的第二子模型。这种情况下，由于第一子模型仅对第一样本进行收益预估，第二子模型仅对第二样本进行收益预估，因此可以直接根据第一子模型和第二子模型针对输入样本的收益预估结果和标注信息，确定第一子模型对第一样本进行收益预估的第一损失值、以及第二子模型对第二样本进行收益预估的第二损失值。

第二种情况，样本输入阶段将样本集合中的所有样本分别输入待训练模型中的第一子模型和第二子模型，这种情况下，需要在反向传播阶段针对第一子模型和第二子模型选择不同的收益预估结果来计算损失值，具体实施方式详见图2所示实施例中步骤S203-S205，这里暂不详述。

计算损失值的具体方式可以是采用现有技术中的损失函数计算，例如，上述损失函数可以是均方差损失函数、交叉熵损失函数等，本公开并不对损失值的具体计算方式进行限定。

步骤S104：基于第一损失值和第二损失值，对第一子模型和第二子模型进行模型训练。

具体的，可以通过以下方式对第一子模型和第二子模型进行模型训练。

一种实施方式中，可以采用第一损失值和第二损失值分别对第一子模型的模型参数进行调整，基于调整后的参数继续迭代训练，在满足预设的训练结束条件后完成训练，得到训练后的第一子模型。其中，本公开不限定采用第一损失值和第二损失值分别对第一子模型的模型参数进行调整时的先后顺序。例如，可以先采用第一损失值对第一子模型的模型参数进行调整，再先采用第二损失值对第一子模型的模型参数进行调整；也可以先采用第二损失值对第一子模型的模型参数进行调整，再先采用第一损失值对第一子模型的模型参数进行调整。同理，可以按照上述方法采用第一损失值和第二损失值对第二子模型进行训练。

另一种实施方式中，可以基于第一损失值和第二损失值，计算总损失值，然后根据总损失值，分别对第一子模型的模型参数和第二子模型的模型参数进行调整，基于调整后的参数继续迭代训练，在满足预设的训练结束条件后完成训练，得到训练后的第一子模型和第二子模型。其中，总损失值可以是第一损失值和第二损失值的平均值、加权平均值等。

上述预设的训练结束条件可以是损失值小于预设值、达到预设的训练次数等。

第一样本为采用未开启页面优化功能的广告流量构建的样本，第一损失值为第一子模型针对第一样本产生的损失值，同样的，第二样本为采用未开启页面优化功能的广告流量构建的样本，第二损失值为第二子模型针对第二样本产生的损失值，由于总损失值基于第一损失值和第二损失值得到，因此总损失值能够兼顾第一样本和第二样本的特征，这样采用总损失值能够更加全面的对第一子模型和第二子模型的模型参数进行调整。

下面通过步骤A-步骤C对前述获得包含第一样本和第二样本的样本集合的方式进行说明。

步骤A：获得已开启页面优化功能的广告的第一广告流量和未开启页面优化功能的广告的第二广告流量。

具体的，由于上述广告为广告主在广告投放平台投放的广告，广告投放平台可以收集并记录广告投放过程中产生的投放信息，因此可以从广告投放平台记录的投放信息中获取上述第一广告流量和第二广告流量。

步骤B：获得第一广告流量在各预设特征项的特征值，得到依据所获得特征值构建的样本集合中的第一样本。

其中，上述预设特征项中包括：与页面优化功能相关的特征项。

下面首先对预设特征项进行说明。

一种实施方式中，预设特征项可以仅包括与页面优化功能相关的特征项。上述与页面优化功能相关的特征项可以为页面优化功能标识项、页面优化功能状态项等，其中，页面优化功能标识项用于根据其特征值标识特定的页面优化功能，页面优化功能状态项用于根据其特征值表征页面优化功能处于开启或关闭状态。上述各预设特征项的特征值可以由工作人员根据经验预先设置。

例如，标识CTA浮层界面功能的特征值为标识a，表征页面优化功能功能开启的特征值为“on”，若广告A开启了CTA浮层界面功能，那么采用广告A的第一广告流量构建的样本S中，页面优化功能标识项的特征值为标识a、页面优化功能状态项的特征值为“on”。当然，上述举例仅为便于理解的简单示范，本公开并不限定第二特征项所包含的特征项数量和特征值形式。

另一种实施方式中，预设特征项中还可以包括：针对用户的特征项和针对广告页面的特征项。其中，针对用户的特征项可以为第一广告流量的来源用户的性别、年龄、喜好、所使用的网络等；针对广告页面的特征项可以是广告流量所访问广告页面的文本特征和/或多媒体特征等，上述文本特征和多媒体特征的含义和获取方式可以参见前述图1所示实施例中步骤S101的描述，这里不再赘述。这样，依据预设项的特征值所构建的第一样本中不仅包含与页面优化功能相关的特征项，还包含了用户维度和广告页面维度的特征项，使得第一样本所能够表征的特征更加丰富。

获得了各预设特征项的特征值之后，具体的，可以将各特征项和特征值构建为特征向量，作为样本集合中的第一样本。

步骤C：获得第二广告流量在各第一特征项的特征值，并设置第二广告流量在各第二特征项的特征值为空信息，得到依据第一特征项的特征值和第二特征项的特征值构建的样本集合中的第二样本。

其中，上述第二特征项为：各预设特征项中与页面优化功能相关的特征项，上述第一特征项为：各预设特征项中除第二特征项之外的特征项。

具体的，上述预设特征项可以仅包含与页面优化功能相关的特征项，也可以在上述特征项的基础上还包括针对用户的特征项和针对广告页面的特征项。其中，各预设特征项的含义可以参加前述步骤B，这里不再赘述。这样，依据预设项的特征值所构建的第二样本中不仅包含与页面优化功能相关的特征项，还包含了用户维度和广告页面维度的特征项，使得第二样本所能够表征的特征更加丰富。

另外，本步骤中第二样本的各预设特征项数量和特征值形式可以与前述步骤B中的第一样本的各预设特征项相同，也可以与第一样本的各预设特征项不相同。

由于第二特征项为各预设特征项中与页面优化功能相关的特征项，而第二广告流量未开启页面优化功能，因此，在构建样本时，设置第二广告流量在各第二特征项的特征值为空信息。

具体的，获得了各预设特征项的特征值，并设置第二广告流量在各第二特征项的特征值为空信息之后，可以将各特征项和特征值构建为特征向量，作为样本集合中的第二样本。

由以上可见，通过设置与页面优化功能相关的特征项，并为各特征项设置特征值，可以更有针对性的基于页面优化功能的特征构建第一样本和第二样本，提高了所构建的样本的质量。

在图1所示实施例的基础上，在样本输入阶段可以将样本集合中的所有样本分别输入待训练模型中的第一子模型和第二子模型，在反向传播阶段针对第一子模型和第二子模型选择不同的收益预估结果来计算损失值。鉴于上述情况，本公开实施例提供了另一种模型训练方法。

具体的，参见图2，图2为本公开实施例提供的第二种模型训练方法的流程示意图，上述方法包括以下步骤S201-S206。

步骤S201：获得包含第一样本和第二样本的样本集合，以及样本集合中每一样本的标注信息。

上述步骤S201与前述图1所示实施例中步骤S101相同，这里不再赘述。

步骤S202：将样本集合包含的所有样本输入待训练模型中的第一子模型，并将所有样本输入待训练模型中的第二子模型。

区别于前述图1所示实施例中步骤S102，本步骤中，分别将样本集合中的所有样本输入第一子模型和第二子模型，也即在样本输入阶段，输入第一子模型和第二子模型的样本相同。

步骤S203：在反向梯度传播阶段，从第一子模型对所有样本的收益预估结果中选择针对第一样本的第一收益预估结果，从第二子模型对所有样本的收益预估结果中选择针对第二样本的第二收益预估结果。

本步骤中，由于在样本输入阶段输入第一子模型和第二子模型的样本相同，因此为了确保各子模型能够针对不同样本进行训练，需要在反向传播阶段从各子模型对所有的样本的收益预估结果中，选择出第一子模型针对第一样本产生的第一收益预估结果，以及第二子模型针对第二样本产生的第二收益预估结果。这样后续能够基于第一收益预估结果和第二收益预估结果对第一子模型和第二子模型进行训练。

步骤S204：根据第一收益预估结果和第一样本的标注信息，确定第一子模型对第一样本进行收益预估的第一损失值。

计算第一损失值的具体方式可以是采用现有技术中的损失函数计算，例如，上述损失函数可以是均方差损失函数、交叉熵损失函数等。

步骤S205：根据第二收益预估结果和第二样本的标注信息，确定第二子模型对第二样本进行收益预估的第二损失值。

本步骤中，计算第二损失值的方式可以参见前述步骤S204，这里不再赘述。

需要说明的是，本公开实施例并不限定上述步骤S204和S205之间的执行顺序，两个步骤可以并行执行，也可以串行执行。

步骤S206：基于第一损失值和第二损失值，对第一子模型和第二子模型进行模型训练。

上述步骤S206与前述图1所示实施例中步骤S104相同，这里不再赘述。

由以上可见，将所有样本分别输入第一子模型和第二子模型，在反向传播阶段针对第一子模型和第二子模型，分别基于上述各子模型对于第一样本和第二样本的收益预估结果计算第一损失值和第二损失值，这样在成功计算出第一损失值和第二损失值的同时，省去了提前筛选第一样本和第二样本所需的时间，提高了训练效率。

下面对应用图2实施例提供的方案进行模型训练时的训练过程进行简要说明。

参见图3，图3为本公开实施例提供的一种模型训练过程的示意图。由图可以看出，在样本输入阶段并不预先筛选出样本集合中的第一样本和第二样本，而是将样本集合中的所有样本分别输入第一子模型和第二子模型，然后在反向传播阶段基于第一子模型对第一样本的收益预估结果计算第一损失值，并基于第二子模型对第二样本的收益预估结果计算第二损失值，这样就能够分别采用第一损失值和第二损失值对第一子模型和第二子模型进行训练，或采用由第一损失值和第二损失值计算出的总损失值对第一子模型和第二子模型进行训练。可见这样能够省去提前筛选第一样本和第二样本所需的时间，提高了训练效率。

与上述模型训练方法相对应的，本公开还提供了一种信息生成方法。

参见图4，图4为本公开实施例提供的第一种信息生成方法的流程示意图，上述方法包括以下步骤S401-S403。

步骤S401：获得目标广告的广告流量信息。

其中，上述目标广告为未开启页面优化功能的广告。

具体的，可以通过以下方式获得广告流量信息。

一种实施方式中，目标广告为已在广告投放平台投放的广告，可以从广告投放平台记录的投放信息中获取目标广告的广告流量信息。这种情况下，上述广告流量信息可以包括目标广告的广告页面信息和广告流量的来源用户信息。

另一种实施方式中，目标广告为在广告投放平台发布，但还未开始实际投放的广告。这种情况下，由于目标广告还未产生广告流量，因此可以通过广告投放平台，获取目标广告的广告页面信息作为广告流量信息，也可以在上述广告页面信息的基础上，基于与目标广告类似的已投放广告，还获取上述已投放广告的广告流量的来源用户信息，将上述来源用户信息和目标广告的广告页面信息作为上述广告流量信息。

步骤S402：将广告流量信息输入预先训练的收益预估模型中的第一子模型和第二子模型，得到第一子模型针对目标广告的第一预估收益和第二子模型针对目标广告的第二预估收益。

其中，上述收益预估模型为：根据本公开实施例提供的模型训练方法训练得到的模型。

得到了广告流量信息之后，将广告流量信息分别输入训练好的第一子模型和第二子模型，第一子模型和第二子模型可以采用上述广告流量信息进行收益预估，从而第一子模型会输出针对目标广告开启页面优化功能后的第一预估收益，第二子模型会输出针对目标广告未开启页面优化功能的第二预估收益。

步骤S403：基于第一预估收益和第二预估收益，生成目标广告开启页面优化功能后产生的预期增加收益。

具体的，由于第一预估收益为目标广告开启页面优化功能后的预估收益，第二预估收益为目标广告未开启页面优化功能的预估收益，因此可以计算第一预估收益和第二预估收益的差值，作为目标广告开启页面优化功能后产生的预期增加收益。

例如，上述第一预估收益为25％点击率，上述第二预估收益为15％点击率，那么上述预期增加收益为25％-15％＝10％的点击率增加。

由以上可见，将广告流量信息输入预先训练好的第二子模型和第二子模型之后，第一子模型能够输出目标广告开启页面功能后的第一预期收益，第二子模型能够输出目标广告未开启页面优化功能的第二预期收益，这样基于第一预期收益和第二预期收益，能够计算出目标广告开启页面优化功能后的预期增加收益。

本发明的一个实施例中，生成了预期增加收益之后，可以向发布目标广告的广告主所使用的客户端发送上述预期增加收益，使得广告主能够获知为目标广告开启页面优化功能后预期能够带来的增加收益，有利于激励广告主为目标广告开启页面优化功能来优化广告页面，进而有利于提高目标广告的转化率，提高了广告主在广告投放平台投放广告的粘性。

在图4所示实施例的基础上，在将广告流量信息输入训练好的模型时，可以分别获得第一广告流量信息和第二广告流量信息，并将第一广告流量信息和第二广告流量信息分别输入第一子模型和第二子模型。在此基础上，本公开实施例提供另一种信息生成方法。

参见图5，图5为本公开实施例提供的第二种信息生成方法的流程示意图，上述方法包括以下步骤S501-S505。

步骤S501：获得反映目标广告在已开启页面优化功能情况下的广告流量的特征的第一广告流量信息。

具体的，可以通过以下方式获得第一广告流量信息。

一种实施方式中，可以基于目标广告的广告页面的文本特征和/或多媒体特征构建第一广告流量信息，上述文本特征和多媒体特征的含义以及获取方式可以参见前述图1所示实施例中步骤S101，这里不再赘述。

另一种实施方式中，可以获得目标广告的广告流量在第一特征项的特征值，并设置广告流量在各第二特征项的特征值为表征目标广告已开启页面优化功能的值，得到依据第一特征项的特征值和第二特征项的特征值构建的第一广告流量信息。

其中，第二特征项为：各预设特征项中与页面优化功能相关的特征项，第一特征项为：各预设特征项中除第二特征项之外的特征项。

上述预设特征项可以仅包含与页面优化功能相关的特征项，也可以在上述特征项的基础上还包括针对用户的特征项和针对广告页面的特征项。其中，各预设特征项的含义可以参见前述步骤B，这里不再赘述。

由于第二特征项为与页面优化功能相关的特征项，而目标广告为未开启页面优化功能的广告，因此，在构建表征目标广告在已开启页面优化功能情况下的广告流量特征的第一广告流量信息时，需要依据页面优化功能的信息，将上述第二特征项的特征值设置为表征目标广告已开启页面优化功能的值。

例如，若预估目标广告开启CTA浮层界面功能后的预期增加收益，那么在构建第一广告流量信息时，若第二特征项包括页面优化功能标识项和页面优化功能状态项，需要将上述页面优化功能标识项的特征值设置为表征CTA浮层界面功能的标识a，将上述页面优化功能状态项的特征值设置为表征功能开启的特征值“on”。

获得了第一特征项的特征值和第二特征项的特征值后，可以将各特征项和特征值构建为特征向量，作为第一广告流量信息。

这样通过设置与页面优化功能相关的特征项，并为各特征项设置特征值，可以更有针对性的基于页面优化功能的特征构建第一广告流量信息，提高了所构建的第一广告流量信息的质量。

步骤S502：获得反映目标广告在未开启页面优化功能情况下的广告流量的特征的第二广告流量信息。

具体的，可以通过以下方式获得第二广告流量信息。

一种实施方式中，可以基于目标广告的广告页面的文本特征和/或多媒体特征构建第二广告流量信息，上述文本特征和多媒体特征的含义以及获取方式可以参见前述图1所示实施例中步骤S101，这里不再赘述。

另一种实施方式中，可以获得目标广告的广告流量在第一特征项的特征值，并设置广告流量在各第二特征项的特征值为空信息，得到依据第一特征项的特征值和第二特征项的特征值构建的第二广告流量信息。

上述预设特征项可以仅包含与页面优化功能相关的特征项，也可以在上述特征项的基础上还包括针对用户的特征项和针对广告页面的特征项。其中，各预设特征项的含义已在前述步骤B中说明，这里不再赘述。

上述第二广告流量信息的各预设特征项数量和特征值形式可以与前述步骤S501中的第一广告流量信息的各预设特征项相同，也可以与第一广告流量信息的的各预设特征项不相同。

由于第二特征项为与页面优化功能相关的特征项，而第二广告广告流量信息表征未开启页面优化功能的目标广告的广告流量信息，因此在构建第二广告流量信息时，可以将各第二特征项的特征值设置为空信息。

具体的，获得目标广告的广告流量在第一特征项的特征值，并设置广告流量在各第二特征项的特征值为空信息后，可以将各特征项和特征值构建为特征向量，作为第二广告流量信息。

这样通过设置与页面优化功能相关的特征项，并为各特征项设置特征值，可以更有针对性的基于页面优化功能的特征构建第二广告流量信息，提高了所构建的第一广告流量信息的质量。

再一种实施方式中，可以获取第一广告流量信息的副本，将第一广告流量信息针对各第二特征项的特征值设置为空信息，将设置后的第一广告流量信息的副本作为第二广告流量信息。这样在第一广告流量信息的副本针对各第一特征项的特征值不变的基础上，将与页面优化功能相关的第二特征项的特征值设置为空信息，就得到了表征未开启页面优化功能的广告流量特征的第二广告流量信息。

步骤S503：将第一广告流量信息输入预先训练的收益预估模型中的第一子模型，得到第一子模型针对目标广告的第一预估收益。

第一广告流量信息反映目标广告在已开启页面优化功能情况下的广告流量的特征，第一子模型基于第一广告流量信息，可以预估目标广告在已开启页面优化功能情况下的第一预估收益。

步骤S504：将第二广告流量信息输入预先训练的收益预估模型中的第二子模型，得到第二子模型针对目标广告的第二预估收益。

第二广告流量信息反映目标广告在未开启页面优化功能情况下的广告流量的特征，第二子模型基于第二广告流量信息，可以预估目标广告在未开启页面优化功能情况下的第二预估收益。

需要说明的是，本公开实施例并不限定上述步骤S503和S504之间的执行顺序，两个步骤可以并行执行，也可以串行执行。

步骤S505：基于第一预估收益和第二预估收益，生成目标广告开启页面优化功能后产生的预期增加收益。

上述步骤S505与前述图4所示实施例中步骤S403相同，这里不再赘述。

由以上可见，第一广告流量信息反映目标广告在已开启页面优化功能情况下的广告流量的特征，第二广告流量信息反映目标广告在未开启页面优化功能情况下的广告流量的特征，这样将第一广告流量信息和第二广告流量信息分别输入预先训练好的第一子模型和第二子模型，能够准确的得到第一子模型针对目标广告开启页面功能后的第一预期收益，以及第二子模型针对目标广告未开启页面优化功能的第二预期收益，进而能够准确的计算出目标广告开启页面优化功能后的预期增加收益。

与上述模型训练方法相对应的，本公开实施例提供了一种模型训练装置。

参见图6，图6为本公开实施例提供的一种模型训练装置的结构示意图，上述装置包括以下模块601-604。

样本集合获得模块601，用于获得包含第一样本和第二样本的样本集合，以及所述样本集合中每一样本的标注信息，其中，所述第一样本为：针对已开启页面优化功能的广告流量构建的样本，所述第二样本为：针对未开启页面优化功能的广告流量构建的样本，所述标注信息表征样本对应的广告流量是否发生转化行为；

样本输入模块602，用于将所述样本集合包含的样本输入待训练模型中的第一子模型和第二子模型，对输入的样本进行收益预估；

损失值确定模块603，用于根据所述第一子模型和第二子模型针对输入样本的收益预估结果和标注信息，确定所述第一子模型对所述第一样本进行收益预估的第一损失值、以及所述第二子模型对所述第二样本进行收益预估的第二损失值；

模型训练模块604，用于基于所述第一损失值和第二损失值，对所述第一子模型和第二子模型进行模型训练。

本公开的一个实施例中，所述样本输入模块602，具体用于将所述样本集合包含的所有样本输入待训练模型中的第一子模型，并将所述所有样本输入所述待训练模型中的第二子模型；

所述损失值确定模块603，具体用于在反向梯度传播阶段，从所述第一子模型对所述所有样本的收益预估结果中选择针对所述第一样本的第一收益预估结果，从所述第二子模型对所述所有样本的收益预估结果中选择针对所述第二样本的第二收益预估结果；根据所述第一收益预估结果和所述第一样本的标注信息，确定所述第一子模型对所述第一样本进行收益预估的第一损失值；根据所述第二收益预估结果和所述第二样本的标注信息，确定所述第二子模型对所述第二样本进行收益预估的第二损失值。

本公开的一个实施例中，所述模型训练模块604，具体用于基于所述第一损失值和所述第二损失值，计算总损失值；根据所述总损失值，分别对所述第一子模型的模型参数和所述第二子模型的模型参数进行调整。

本公开的一个实施例中，所述样本集合获得模块601，具体用于获得已开启页面优化功能的广告的第一广告流量和未开启所述页面优化功能的广告的第二广告流量；获得所述第一广告流量在各预设特征项的特征值，得到依据所获得特征值构建的样本集合中的第一样本，其中，所述预设特征项中包括：与所述页面优化功能相关的特征项；获得所述第二广告流量在各第一特征项的特征值，并设置所述第二广告流量在各第二特征项的特征值为空信息，得到依据所述第一特征项的特征值和所述第二特征项的特征值构建的所述样本集合中的第二样本，其中，所述第二特征项为：各预设特征项中与所述页面优化功能相关的特征项，所述第一特征项为：各预设特征项中除所述第二特征项之外的特征项。

本公开的一个实施例中，所述预设特征项中还包括：针对用户的特征项和针对广告页面的特征项。

这样，依据预设项的特征值所构建的第一样本和第二样本中不仅包含与页面优化功能相关的特征项，还包含了用户维度和广告页面维度的特征项，使得第一样本和第二样本所能够表征的特征更加丰富。

与上述信息生成方法相对应的，本公开实施例提供了一种信息生成装置。

参见图7，图7为本公开实施例提供的第一种信息生成装置的结构示意图，上述装置包括以下模块701-703。

广告流量信息获得模块701，用于获得目标广告的广告流量信息，其中，所述目标广告为未开启页面优化功能的广告；

广告流量信息输入模块702，用于将所述广告流量信息输入预先训练的收益预估模型中的第一子模型和第二子模型，得到所述第一子模型针对所述目标广告的第一预估收益和所述第二子模型针对所述目标广告的第二预估收益，其中，所述收益预估模型为：根据本发明实施例提供的模型训练方法训练得到的模型；

预期增加收益生成模块703，用于基于所述第一预估收益和所述第二预估收益，生成所述目标广告开启所述页面优化功能后产生的预期增加收益。

参见图8，图8为本公开实施例提供的第二种信息生成装置的结构示意图，上述装置包括以下模块801-805。

第一信息获得子模块801，用于获得反映目标广告在已开启页面优化功能情况下的广告流量的特征的第一广告流量信息；

第二信息获得子模块802，用于获得反映所述目标广告在未开启页面优化功能情况下的广告流量的特征的第二广告流量信息；

第一信息输入子模块803，用于将所述第一广告流量信息输入预先训练的收益预估模型中的第一子模型，得到所述第一子模型针对所述目标广告的第一预估收益；

第二信息输入子模块804，用于将所述第二广告流量信息输入所述收益预估模型中的第二子模型，得到所述第二子模型针对所述目标广告的第二预估收益。

预期增加收益生成模块805，用于基于所述第一预估收益和所述第二预估收益，生成所述目标广告开启所述页面优化功能后产生的预期增加收益。

本公开的一个实施例中，所述第一信息获得子模块801，具体用于获得目标广告的广告流量在第一特征项的特征值，并设置所述广告流量在各第二特征项的特征值为表征所述目标广告已开启页面优化功能的值，得到依据所述第一特征项的特征值和所述第二特征项的特征值构建的第一广告流量信息，其中，所述第二特征项为：各预设特征项中与所述页面优化功能相关的特征项，所述第一特征项为：各预设特征项中除所述第二特征项之外的特征项。

本公开的一个实施例中，所述第二信息获得子模块802，具体用于获得目标广告的广告流量在第一特征项的特征值，并设置所述广告流量在各第二特征项的特征值为空信息，得到依据所述第一特征项的特征值和所述第二特征项的特征值构建的第二广告流量信息，其中，所述第二特征项为：各预设特征项中与所述页面优化功能相关的特征项，所述第一特征项为：各预设特征项中除所述第二特征项之外的特征项。

本公开的技术方案中，所涉及的用户个人信息的收集、存储、使用、加工、传输、提供和公开等处理，均符合相关法律法规的规定，且不违背公序良俗。

根据本公开的实施例，本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。

本公开实施例提供了一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行模型训练方法或信息生成方法。

本公开实施例提供了一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行模型训练方法或信息生成方法。

本公开实施例提供了一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现模型训练方法或信息生成方法。

图9示出了可以用来实施本公开的实施例的示例电子设备900的示意性框图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本公开的实现。

如图9所示，设备900包括计算单元901，其可以根据存储在只读存储器(ROM)902中的计算机程序或者从存储单元908加载到随机访问存储器(RAM)903中的计算机程序，来执行各种适当的动作和处理。在RAM 903中，还可存储设备900操作所需的各种程序和数据。计算单元901、ROM 902以及RAM 903通过总线904彼此相连。输入/输出(I/O)接口905也连接至总线904。

设备900中的多个部件连接至I/O接口905，包括：输入单元906，例如键盘、鼠标等；输出单元907，例如各种类型的显示器、扬声器等；存储单元908，例如磁盘、光盘等；以及通信单元909，例如网卡、调制解调器、无线通信收发机等。通信单元909允许设备900通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。

计算单元901可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元901的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元901执行上文所描述的各个方法和处理，例如模型训练方法或信息生成方法。例如，在一些实施例中，模型训练方法或信息生成方法可被实现为计算机软件程序，其被有形地包含于机器可读介质，例如存储单元908。在一些实施例中，计算机程序的部分或者全部可以经由ROM 902和/或通信单元909而被载入和/或安装到设备900上。当计算机程序加载到RAM 903并由计算单元901执行时，可以执行上文描述的模型训练方法或信息生成方法的一个或多个步骤。备选地，在其他实施例中，计算单元901可以通过其他任何适当的方式(例如，借助于固件)而被配置为执行模型训练方法或信息生成方法。

本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、复杂可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器，使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行，作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本公开的上下文中，机器可读介质可以是有形的介质，其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备，或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

为了提供与用户的交互，可以在计算机上实施此处描述的系统和技术，该计算机具有：用于向用户显示信息的显示装置(例如，CRT(阴极射线管)或者LCD(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(LAN)、广域网(WAN)和互联网。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器，也可以为分布式系统的服务器，或者是结合了区块链的服务器。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本公开公开的技术方案所期望的结果，本文在此不进行限制。

上述具体实施方式，并不构成对本公开保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等，均应包含在本公开保护范围之内。

Claims

1.一种模型训练方法，包括：

基于所述第一损失值和第二损失值，对所述第一子模型和第二子模型进行模型训练。

2.根据权利要求1所述的方法，其中，所述将所述样本集合包含的样本输入待训练模型中的第一子模型和第二子模型，对输入的样本进行收益预估，包括：

将所述样本集合包含的所有样本输入待训练模型中的第一子模型，并将所述所有样本输入所述待训练模型中的第二子模型；

所述根据所述第一子模型和第二子模型针对输入样本的收益预估结果和标注信息，确定所述第一子模型对所述第一样本进行收益预估的第一损失值、以及所述第二子模型对所述第二样本进行收益预估的第二损失值，包括：

在反向梯度传播阶段，从所述第一子模型对所述所有样本的收益预估结果中选择针对所述第一样本的第一收益预估结果，从所述第二子模型对所述所有样本的收益预估结果中选择针对所述第二样本的第二收益预估结果；

根据所述第一收益预估结果和所述第一样本的标注信息，确定所述第一子模型对所述第一样本进行收益预估的第一损失值；

根据所述第二收益预估结果和所述第二样本的标注信息，确定所述第二子模型对所述第二样本进行收益预估的第二损失值。

3.根据权利要求1所述的方法，其中，所述基于所述第一损失值和第二损失值，对所述第一子模型和第二子模型参数进行模型训练，包括：

基于所述第一损失值和所述第二损失值，计算总损失值；

根据所述总损失值，分别对所述第一子模型的模型参数和所述第二子模型的模型参数进行调整。

4.根据权利要求1-3中任一项所述的方法，其中，所述获得包含第一样本和第二样本的样本集合，包括：

获得已开启页面优化功能的广告的第一广告流量和未开启所述页面优化功能的广告的第二广告流量；

获得所述第一广告流量在各预设特征项的特征值，得到依据所获得特征值构建的样本集合中的第一样本，其中，所述预设特征项中包括：与所述页面优化功能相关的特征项；

获得所述第二广告流量在各第一特征项的特征值，并设置所述第二广告流量在各第二特征项的特征值为空信息，得到依据所述第一特征项的特征值和所述第二特征项的特征值构建的所述样本集合中的第二样本，其中，所述第二特征项为：各预设特征项中与所述页面优化功能相关的特征项，所述第一特征项为：各预设特征项中除所述第二特征项之外的特征项。

5.根据权利要求4所述的方法，其中，

所述预设特征项中还包括：针对用户的特征项和针对广告页面的特征项。

6.一种信息生成方法，包括：

将所述广告流量信息输入预先训练的收益预估模型中的第一子模型和第二子模型，得到所述第一子模型针对所述目标广告的第一预估收益和所述第二子模型针对所述目标广告的第二预估收益，其中，所述收益预估模型为：根据权利要求1-5中任一项所述的方法训练得到的模型；

7.根据权利要求6所述的方法，其中，所述获得目标广告的广告流量信息，包括：

获得反映目标广告在已开启页面优化功能情况下的广告流量的特征的第一广告流量信息；

获得反映所述目标广告在未开启页面优化功能情况下的广告流量的特征的第二广告流量信息；

所述将所述广告流量信息输入预先训练的收益预估模型中的第一子模型和第二子模型，得到所述第一子模型针对所述目标广告的第一预估收益和所述第二子模型针对所述目标广告的第二预估收益，包括：

将所述第一广告流量信息输入预先训练的收益预估模型中的第一子模型，得到所述第一子模型针对所述目标广告的第一预估收益；

将所述第二广告流量信息输入所述收益预估模型中的第二子模型，得到所述第二子模型针对所述目标广告的第二预估收益。

8.根据权利要求7所述的方法，其中，所述获得反映目标广告在已开启页面优化功能情况下的广告流量的特征的第一广告流量信息，包括：

获得目标广告的广告流量在第一特征项的特征值，并设置所述广告流量在各第二特征项的特征值为表征所述目标广告已开启页面优化功能的值，得到依据所述第一特征项的特征值和所述第二特征项的特征值构建的第一广告流量信息，其中，所述第二特征项为：各预设特征项中与所述页面优化功能相关的特征项，所述第一特征项为：各预设特征项中除所述第二特征项之外的特征项。

9.根据权利要求7所述的方法，其中，所述获得反映所述目标广告在未开启页面优化功能情况下的广告流量的特征的第二广告流量信息，包括：

获得目标广告的广告流量在第一特征项的特征值，并设置所述广告流量在各第二特征项的特征值为空信息，得到依据所述第一特征项的特征值和所述第二特征项的特征值构建的第二广告流量信息，其中，所述第二特征项为：各预设特征项中与所述页面优化功能相关的特征项，所述第一特征项为：各预设特征项中除所述第二特征项之外的特征项。

10.一种模型训练装置，包括：

11.根据权利要求10所述的装置，其中，

所述样本输入模块，具体用于将所述样本集合包含的所有样本输入待训练模型中的第一子模型，并将所述所有样本输入所述待训练模型中的第二子模型；

所述损失值确定模块，具体用于在反向梯度传播阶段，从所述第一子模型对所述所有样本的收益预估结果中选择针对所述第一样本的第一收益预估结果，从所述第二子模型对所述所有样本的收益预估结果中选择针对所述第二样本的第二收益预估结果；根据所述第一收益预估结果和所述第一样本的标注信息，确定所述第一子模型对所述第一样本进行收益预估的第一损失值；根据所述第二收益预估结果和所述第二样本的标注信息，确定所述第二子模型对所述第二样本进行收益预估的第二损失值。

12.根据权利要求10所述的装置，其中，

所述模型训练模块，具体用于基于所述第一损失值和所述第二损失值，计算总损失值；根据所述总损失值，分别对所述第一子模型的模型参数和所述第二子模型的模型参数进行调整。

13.根据权利要求10-12中任一项所述的装置，其中，

所述样本集合获得模块，具体用于获得已开启页面优化功能的广告的第一广告流量和未开启所述页面优化功能的广告的第二广告流量；获得所述第一广告流量在各预设特征项的特征值，得到依据所获得特征值构建的样本集合中的第一样本，其中，所述预设特征项中包括：与所述页面优化功能相关的特征项；获得所述第二广告流量在各第一特征项的特征值，并设置所述第二广告流量在各第二特征项的特征值为空信息，得到依据所述第一特征项的特征值和所述第二特征项的特征值构建的所述样本集合中的第二样本，其中，所述第二特征项为：各预设特征项中与所述页面优化功能相关的特征项，所述第一特征项为：各预设特征项中除所述第二特征项之外的特征项。

14.一种信息生成装置，包括：

广告流量信息输入模块，用于将所述广告流量信息输入预先训练的收益预估模型中的第一子模型和第二子模型，得到所述第一子模型针对所述目标广告的第一预估收益和所述第二子模型针对所述目标广告的第二预估收益，其中，所述收益预估模型为：根据权利要求1-5中任一项所述的方法训练得到的模型；

15.根据权利要求14所述的装置，其中，所述广告流量信息获得模块，包括：

第一信息获得子模块，用于获得反映目标广告在已开启页面优化功能情况下的广告流量的特征的第一广告流量信息；

第二信息获得子模块，用于获得反映所述目标广告在未开启页面优化功能情况下的广告流量的特征的第二广告流量信息；

所述广告流量信息输入模块，包括：

第一信息输入子模块，用于将所述第一广告流量信息输入预先训练的收益预估模型中的第一子模型，得到所述第一子模型针对所述目标广告的第一预估收益；

第二信息输入子模块，用于将所述第二广告流量信息输入所述收益预估模型中的第二子模型，得到所述第二子模型针对所述目标广告的第二预估收益。

16.根据权利要求15所述的装置，其中，

所述第一信息获得子模块，具体用于获得目标广告的广告流量在第一特征项的特征值，并设置所述广告流量在各第二特征项的特征值为表征所述目标广告已开启页面优化功能的值，得到依据所述第一特征项的特征值和所述第二特征项的特征值构建的第一广告流量信息，其中，所述第二特征项为：各预设特征项中与所述页面优化功能相关的特征项，所述第一特征项为：各预设特征项中除所述第二特征项之外的特征项。

17.根据权利要求15所述的装置，其中，

所述第二信息获得子模块，具体用于获得目标广告的广告流量在第一特征项的特征值，并设置所述广告流量在各第二特征项的特征值为空信息，得到依据所述第一特征项的特征值和所述第二特征项的特征值构建的第二广告流量信息，其中，所述第二特征项为：各预设特征项中与所述页面优化功能相关的特征项，所述第一特征项为：各预设特征项中除所述第二特征项之外的特征项。

18.一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-5或6-9中任一项所述的方法。

19.一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行根据权利要求1-5或6-9中任一项所述的方法。

20.一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现根据权利要求1-5或6-9中任一项所述的方法。