CN114971701A

CN114971701A - 转化率预估模型获取方法、转化率预估方法、设备及介质

Info

Publication number: CN114971701A
Application number: CN202210531512.5A
Authority: CN
Inventors: 赵家玉; 彭冲; 范将科; 程兵
Original assignee: Beijing Sankuai Online Technology Co Ltd
Current assignee: Beijing Sankuai Online Technology Co Ltd
Priority date: 2022-05-13
Filing date: 2022-05-13
Publication date: 2022-08-30

Abstract

本申请实施例提供了一种转化率预估模型获取方法、装置、电子设备及介质，所述方法包括：获取多个信息样本，多个信息样本中包括被执行第一操作的信息样本和未被执行第一操作的信息样本；被执行第一操作的信息样本携带转化标签；将多个信息样本输入预设模型，并确定多个信息样本中未携带转化标签的信息样本对应的伪标签；伪标签用于指示若对信息样本执行第一操作，是否再对信息样本执行第二操作；获取预设模型输出的多个信息样本各自对应的转化概率；转化概率表征信息样本被执行第一操作后执行第二操作的概率；基于多个信息样本各自对应的转化概率、转化标签和伪标签，对预设模型进行更新；将多次更新后的预设模型作为转化率预估模型。

Description

转化率预估模型获取方法、转化率预估方法、设备及介质

技术领域

本申请涉及信息处理技术领域，特别是涉及一种转化率预估模型获取方法、转化率预估方法、设备及介质。

背景技术

在搜索、广告、推荐场景中，需要对发布的信息的转化率进行预估。例如，在商品信息的推荐场景中，需要确定向用户推荐的商品信息被用户点击(一次操作)后，再进行收藏、购买、加入购物车等二次操作行为的概率，通过该转化率可以指导平台上信息的推荐。

相关技术中，利用转化率预估模型确定信息的转化率。其中，训练转化率预估模型时，一般是利用有点击行为的信息作为训练样本。然而，相比发布的大量的信息，有点击行为的信息是少量的，这样训练模型的训练样本便过于稀疏，训练到的模型也存在过拟合、测试误差特别大的问题。并且线上发布的信息不可能每个都被用户点击，因此，利用有点击行为的信息训练到的转化率预估模型，便不能适应线上发布的各种信息(有点击行为和无点击行为)的转化率的精准预估。

发明内容

为了解决上述问题，本申请提供了一种转化率预估模型获取方法、装置、电子设备及介质，旨在提高预估信息的转化率的准确度。

本公开实施例的第一方面，提供了一种转化率预估模型获取方法，所述方法包括：

获取多个信息样本，所述多个信息样本中包括被执行第一操作的信息样本和未被执行所述第一操作的信息样本；所述被执行第一操作的信息样本携带转化标签，所述转化标签用于指示被执行所述第一操作后是否再被执行第二操作；

将所述多个信息样本输入预设模型，并确定所述多个信息样本中未携带所述转化标签的信息样本对应的伪标签；所述伪标签用于指示若对所述信息样本执行所述第一操作，是否再对所述信息样本执行所述第二操作；

获取所述预设模型输出的所述多个信息样本各自对应的转化概率；所述转化概率表征信息样本被执行所述第一操作后执行所述第二操作的概率；

基于所述多个信息样本各自对应的转化概率、所述转化标签和所述伪标签，对所述预设模型进行更新；

将多次更新后的预设模型作为所述转化率预估模型。

可选地，获取所述预设模型输出的所述多个信息样本各自对应的转化概率，包括：

获取所述预设模型输出的所述多个信息样本各自对应的第一概率和第二概率；其中，所述第一概率表征所述信息样本被执行所述第一操作的概率、所述第二概率表征所述信息样本被执行所述第一操作后执行所述第二操作的概率；

基于所述多个信息样本各自对应的第一概率和第二概率，获取所述多个信息样本各自对应的转化概率。

可选地，所述每个信息样本携带初始标签，所述初始标签用于表征是否对所述信息样本执行所述第一操作；

基于所述多个信息样本各自对应的转化概率，以及所述转化标签和所述伪标签，对所述预设模型的参数进行更新，包括：

基于所述多个信息样本各自对应的第一概率、转化概率、所述转化标签、所述伪标签以及所述初始标签，对所述预设模型的参数进行更新。

可选地，基于所述多个信息样本各自对应的第一概率、转化概率、所述转化标签、所述伪标签以及所述初始标签，对所述预设模型的参数进行更新，包括：

基于携带所述转化标签的信息样本各自对应的转化概率和所述转化标签，确定所述预设模型对应的第一损失；

基于未携带所述转化标签的信息样本各自对应的转化概率和所述伪标签，确定所述预设模型对应的第二损失；

基于所述多个信息样本各自对应的第一概率和所述初始标签，确定所述预设模型对应的第三损失；

基于所述第一损失、所述第二损失和所述第三损失，对所述预设模型的参数进行更新。

可选地，所述预设模型包括伪标签模块；确定所述多个信息样本中未携带所述转化标签的信息样本对应的伪标签，包括：

通过所述伪标签模块，确定所述多个信息样本中未携带所述转化标签的信息样本对应的伪标签；

将多次更新后的预设模型作为所述转化率预估模型，包括：

将多次更新后的预设模型中的所述伪标签模块剔除，得到所述转化率预估模型。

可选地，所述预设模型还包括第一模块和第二模块；其中，所述第一模块用于确定所述第一概率、所述第二模块用于确定所述第二概率；对所述预设模型的参数进行更新，包括：

对所述第一模块的参数和所述第二模块的参数进行更新；

基于所述第二模块的参数，对所述伪标签模块的参数进行更新。

可选地，确定所述多个信息样本中未携带所述转化标签的信息样本对应的伪标签，包括：

确定未携带所述转化标签的信息样本对应的第二伪概率，所述第二伪概率用于表征若所述信息样本被执行所述第一操作，再被被执行所述第二操作的概率；

基于未携带所述转化标签的信息样本对应的第一概率和所述第二伪概率，确定未携带所述转化标签的信息样本对应的伪标签。

本公开实施例的第二方面，提供了一种转化率预估方法，所述方法包括：

获取待预测的目标信息；

将所述目标信息输入到转化率预估模型中，所述转化率预估模型是根据所述的转化率预估模型的获取方法获取的；

获取所述转化率预估模型输出的所述目标信息对应的转化概率；其中，所述转化概率用于表征若对所述目标信息执行第一操作，再对所述目标信息执行第二操作的概率。

本公开实施例还提供了一种转化率预估模型的获取装置，所述装置具体可以包括以下模块：

样本获取模块，用于获取多个信息样本，所述多个信息样本中包括被执行第一操作的信息样本和未被执行所述第一操作的信息样本；所述被执行第一操作的信息样本携带转化标签，所述转化标签用于指示被执行所述第一操作后是否再被执行第二操作；

输入模块，用于将所述多个信息样本输入预设模型，并确定所述多个信息样本中未携带所述转化标签的信息样本对应的伪标签；所述伪标签用于指示若对所述信息样本执行所述第一操作，是否再对所述信息样本执行所述第二操作；

第一获取模块，用于获取所述预设模型输出的所述多个信息样本各自对应的转化概率；所述转化概率表征信息样本被执行所述第一操作后执行所述第二操作的概率；

更新模块，用于基于所述多个信息样本各自对应的转化概率、所述转化标签和所述伪标签，对所述预设模型进行更新；

第二获取模块，用于将多次更新后的预设模型作为所述转化率预估模型。

本公开实施例提供了一种转化率预估装置，所述装置具体可以包括以下模块：

信息获取模块，用于获取待预测的目标信息；

信息输入模块，用于将所述目标信息输入到转化率预估模型中，所述转化率预估模型是根据转化率预估模型的获取方法获取的；

转化概率获取模块，用于获取所述转化率预估模型输出的所述目标信息对应的转化概率；其中，所述转化概率用于表征若对所述目标信息执行第一操作，再对所述目标信息执行第二操作的概率。

本公开实施例还提供了一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行时实现如的一方面所述的转化率预估模型获取方法或第二方面所述的转化率预估方法。

此外，本申请实施例还提供一种计算机可读存储介质，其存储的计算机程序使得处理器执行如第一方面所述的转化率预估模型获取方法或第二方面所述的转化率预估方法。

本申请实施例中，一方面，可以获取到转化率预估模型，其获取的过程是：获取多个信息样本，在多个信息样本中被执行第一操作的信息样本携带转化标签；之后，将多个信息样本输入预设模型，并确定未携带转化标签的信息样本对应的伪标签；之后，获取预设模型输出的多个信息样本各自对应的转化概率；基于多个信息样本各自对应的转化概率、转化标签和伪标签，对预设模型进行更新，接着，将多次更新后的预设模型作为转化率预估模型。

采用本申请实施例的技术方案，至少具有以下优点：

一方面，由于多个信息样本中包括被执行第一操作的信息样本和未被执行第一操作的信息样本，被执行第一操作的信息样本携带转化标签，而未被执行第一操作的信息样本会给予一个伪标签，由此，无论信息是否被执行第一操作(是否被点击)均可以作为模型的训练样本，因而获取的训练样本中不再仅仅只有有点击(第一操作)的样本，也包括了大量的曝光但是未点击的样本，从而使得训练样本的数量大幅增加，克服了训练样本过于稀疏的问题。

另一方面，由于获取的训练样本中既包括有点击(第一操作)的样本，也包括曝光但是未点击的样本，从而样本极为丰富，这样，使得训练样本的分布适配线上所发布的信息的真实分布，如线上所发布的信息存在有点击有二次操作行为的情况、有点击无二次操作行为的情况以及无点击的情况，从而提高了模型的泛化性能，由此，训练得到的转化率预估模型便能适应线上发布的各种信息，并对信息的转化率进行精准的预估。

再一方面，由于每个被执行第一操作的信息样本本身携带转化标签，而大量的未被执行第一操作的信息样本会给予一个伪标签，由此可以使得预设模型所预测出的每个信息样本的转化概率，均对应有一个标签(转化标签或伪标签)，从而使得模型预测和样本的标签完全对齐，由此，可以提高对预设模型进行更新的准确度，从而提高了对信息的转化率进行预估的精准度。

附图说明

为了更清楚地说明本申请实施例的技术方案，下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本申请一实施例示出的一种转化率预估模型获取方法的整体构思示意图；

图2是本申请一实施例示出的一种转化率预估模型获取方法的步骤流程示意图；

图3是本申请一实施例示出的又一种转化率预估模型获取方法的整体构思示意图；

图4是本申请一实施例示出的对预设模型进行更新的步骤流程图；

图5是本申请一实施例示出的转化率预估方法的步骤流程示意图；

图6是本申请一实施例示出的转化率预估模型获取装置的框架示意图；

图7是本申请一实施例示出的转化率预估装置的框架示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

需要说明的是，本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

为解决相关技术中存在的问题，本申请提出了一种基于半监督的训练方法训练得到转化率预估模型的解决方案，该解决方案中，半监督的训练方法的含义是：对于执行有第一操作的信息样本，利用其携带的真实的转化标签进行训练，而对于未被执行有第一操作的信息样本，会在训练过程中给予一个伪标签，从而利用伪标签进行训练。整体上看，无需获取的全部训练样本均携带真实的转化标签，即部分样本携带标签，另外部分样本未携带标签，由此是一种半监督的训练方案。

采用此解决方案，不再局限于使用被执行有第一操作的信息样本作为训练样本，因此解决了训练样本过于稀疏的问题，从而提高了转化率预估模型进行转化率预估的准确性。

参照图1所示，示出了本申请的转化率预估模型的获取方法的整体构思示意图，如图1所示，训练样本包括被执行第一操作的信息样本和未被执行第一操作的信息样本，其中，被执行第一操作的信息样本作为有标签数据对预设模型进行训练，而未被执行第一操作的信息样本作为无标签数据对预设模型进行训练，在此训练过程中，会给予未被执行第一操作的信息样本一个伪标签。

参照图2所示，示出了本申请的转化率预估模型的获取方法的步骤流程图，该转化率预估模型的获取方法可以形成计算机程序产品，该计算机程序产品可以存储在计算机设备上，从而通过计算机硬件设备实现转化率预估模型的获取方法。

需要说明的是，该方法应用在对发布的信息确定转化率的场景中，通过确定出的转化率可以为发布何类信息、发布信息的数量提供参考，已优化信息发布机制，提高发布的信息的质量。

如图2所示，包括以下步骤：

步骤S201：获取多个信息样本。

其中，所述多个信息样本中包括被执行第一操作的信息样本和未被执行所述第一操作的信息样本；所述被执行第一操作的信息样本携带转化标签，所述转化标签用于指示被执行所述第一操作后是否再被执行第二操作。

本实施例中，信息样本可以是线上发布的信息，其中，发布的信息可以是文本类的信息、图片类的信息、链接类的信息以及音视频类的信息，因此，本申请的信息样本也可以是文本类的信息、图片类的信息、链接类的信息。当然，在信息是音视频类的信息时，可以将音视频的标识，如ID号或名称作为信息样本。

其中，第一操作可以是点击操作，第二操作可以是与第一操作不同的收藏、购买、点赞、加入购物车等二次操作。且第二操作是建立在对发布的信息进行第一操作的基础上的。例如，第二操作是购买操作时，其也是在对信息进行点击的基础上进行的。

本实施例中，在多个信息样本中包括被执行第一操作的信息样本和未被执行第一操作的信息样本，其中，被执行第一操作的信息样本由于被执行有第一操作，便有了后续第二操作的基础，因此，可以为该信息样本标注转化标签，该转化标签表征该信息样本之后是否被用户执行了第二操作。若实际中该信息样本被用户执行了第二操作，则转化标签可以设为1，若若实际中该信息样本未被用户执行第二操作，则转化标签可以设为0。

其中，未被执行第一操作的信息样本便缺乏进行第二操作的基础，由于未对该信息样本执行第一操作，因此，实际中便没有第二操作，因此，该类信息样本便不具备转化标签。

步骤S202：将所述多个信息样本输入预设模型，并确定所述多个信息样本中未携带所述转化标签的信息样本对应的伪标签。

其中，所述伪标签用于指示若对所述信息样本执行所述第一操作，是否再对所述信息样本执行所述第二操作。

本实施例中，由于未被执行有第一操作的信息样本，没有第一操作，便也没有第二操作，对于这类信息样本没有标注转化标签。然而，这类信息样本虽然没有第一操作，但并不表示这类信息样本没有转化的可能。例如，信息A在内容设计上对用户的吸引力较低，因此没有被用户点击，但是若点击信息A后所展现的内容(例如详情页)又具备较强的吸引力，此时，其便有很高的概率被用户购买、收藏等。

因此，本申请中会假设未被执行第一操作的信息样本，若被执行第一操作的情况下，再执行第二操作的概率，然后对该概率进行二值化处理，即将此种情况下得到的概率归于0或1，1表示再执行第二操作，0表示未执行第二操作，从而得到未被执行第一操作的信息样本的伪标签。顾名思义，该伪标签即是假设的信息样本的标签，并不代表真实的转化情况，但是会尽可能地趋近真实的转化情况。

示例地，共有1000个信息样本，在这1000个信息样本中，被执行第一操作的信息样本有200个，而未被执行第一操作的信息样本有800个，则针对200个信息样本，若其中有100个信息样本被执行了第二操作，则该100个信息样本具有转化标签1，另外100个信息样本具有转化标签0(表征未被转化)；而另外的800个信息样本可以设置伪标签，以表征若对该信息样本执行第一操作，则再执行第二操作的概率。

步骤S203：获取所述预设模型输出的所述多个信息样本各自对应的转化概率。

其中，所述转化概率表征信息样本被执行所述第一操作后执行所述第二操作的概率。

本实施例中，可以将多个信息样本输入到预设模型，以对预设模型进行训练，预设模型可以用于确定每个信息样本被执行第一操作后执行第二操作概率，该概率即为转化概率。具体地，预设模型可以将输入的每个信息样本转化为特征向量，之后，基于特征向量确定每个信息样本被执行第一操作后执行第二操作概率。

步骤S204：基于所述多个信息样本各自对应的转化概率、所述转化标签和所述伪标签，对所述预设模型进行更新。

本实施例中，得到了预设模型所输出的每个信息样本对应的转化概率后，由于执行有第一操作的信息样本具有转化标签，而未执行有第一操作的信息样本不具有转化标签，因此，在构建损失函数，对预设模型进行训练时，可以基于执行有第一操作的信息样本的转化概率和转化标签，构建损失函数求取该类信息样本对应的损失，以及，基于未执行有第一操作的信息样本的转化概率和伪标签，构建损失函数求取该类信息样本对应的损失，从而基于上述两种损失对预设模型的参数进行更新。

步骤S205：将多次更新后的预设模型作为所述转化率预估模型。

本实施例中，在多次更新预设模型后，预设模型收敛的情况下，可以结束训练，从而将训练结束时的预设模型作为转化率预估模型，该转化率预估模型可以对信息的转化率进行预估，而被预估的信息可以是未被执行第一操作的信息也可以是被用户执行有第一操作的信息。

采用本实施例的技术方案，由于训练预设模型的训练样本包括了被执行第一操作的信息样本和未被执行第一操作的信息样本，且被执行第一操作的信息样本携带转化标签，而未被执行第一操作的信息样本会在训练过程中授予伪标签。这样，训练样本不再局限于有第一操作的样本，从而一方面克服了训练样本过于稀疏的问题，另一方面，由于训练样本被极大丰富，从而提高了转化率预估模型的泛化性能，使得转化率预估模型便能适应线上发布的各种信息，并对信息的转化率进行精准的预估。再一方面，在训练过程中，每个信息样本要么具有伪标签要么具有转化标签，因此，预设模型所预测出的每个信息样本的转化概率均对应一个标签，从而使得模型预测和样本的标签完全对齐，提高了对预设模型进行更新的准确度，从而提高了转化率预估模型的性能，以更加精准地预估信息的转化率。

实际中，由于转化概率是信息样本被用户执行第一操作后执行第二操作的概率，包括了对信息样本执行第一操作的过程，以及在执行第一操作后执行第二操作的过程，后一过程在前一过程的基础上进行，因此，对于同一个曝光的信息样本，其包括了被执行第一操作的概率，以及被执行第一操作后又被执行第二操作的概率。

可以理解的是，一个信息样本被执行第一操作的概率，是独立于该信息样本被执行第一操作后又被执行第二操作的概率的。示例地说明便是：用户对一条信息的点击行为和对该条信息的购买行为虽然时序上有先后，但是点击信息的概率高低，并不决定购买这条信息的概率。也就是说，若用户点击信息的概率低，并不意味着用户购买这条信息的概率也低。

由此，在一种实施例中，为提高对信息的转化率的预测准确性，转化概率可以是基于该信息样本被执行第一操作的概率(以下称第一概率)，和该信息样本若被执行第一操作后又被执行第二操作的概率(以下称第二概率)确定的。其中，确定第一概率和确定第二概率可以是两个相互独立的过程。

则相应地，在获取信息样本各自对应的转化概率时，可以获取所述预设模型输出的所述多个信息样本各自对应的第一概率和第二概率，并基于所述多个信息样本各自对应的第一概率和第二概率，获取所述多个信息样本各自对应的转化概率。

其中，所述第一概率表征所述信息样本被执行所述第一操作的概率、所述第二概率表征所述信息样本被执行所述第一操作后执行所述第二操作的概率。

可以理解的是，第一概率和第二概率均可以为0-1之间的值。其中，一个信息样本的转化概率可以是该信息样本的第一概率和第二概率之间的乘积，例如，第一概率是0.5，第二概率是0.8，则转化概率是0.4。

采用此种实施方式时，由于分别预测信息的第一概率和第二概率，因此，在预测第一概率时，便不会考虑是否执行第二操作，而在预测第二概率时，也是假设该信息被执行了第一操作，因此，预测第二概率的过程也不会考虑该信息被执行第一操作的概率，从而预测第一概率和第二概率的准确性较高。而后，将第一概率和第二概率的乘积作为转化率，从而使得两个独立过程预测出的第一概率和第二概率在被相乘的过程中，进行了相互影响，从而提高了转化率的预测准确性。

参照图3所示，示出了又一种转化率预估模型的获取方法的整体构思示意图，如图3所示，由于转化概率由第一概率和第二概率确定，此种情况下，每个信息样本还可以携带初始标签，该初始标签是表征信息样本是否被用户执行第一操作。实际中，每个发布出去的信息首先迎来的用户操作可以是第一操作，例如点击操作，这样，信息是否被点击是可以准确获知的。

因此，每个信息样本均可以具有初始标签，从而在第一概率的预测上，全部的信息样本均成为有标签数据的样本，而在转化概率的预测上，则只有部分信息样本具有转化标签，是一种半监督的训练。

此种情况下，在对预设模型进行更新时，便会基于多个信息样本各自对应的第一概率、转化概率、转化标签、所述伪标签以及初始标签，对预设模型的参数进行更新。

如图3所示，在对预设模型更新所依据的模型损失中，便包括了全部信息样本在第一概率上对应的损失、在转化概率上对应的损失，由于转化概率是基于半监督的预测，因此，转化概率上对应的损失，又包括了被执行第一操作的信息样本的转化概率和转化标签之间的损失，和未被执行第一操作的信息样本的转化概率和伪标签之间的损失。如此，是基于上述三种损失对预设模型进行更新的。

参照图4所示，示出了对预设模型进行更新的步骤流程图，如图4所示，具体可以包括以下步骤：

步骤S401：基于携带所述转化标签的信息样本各自对应的转化概率和所述转化标签，确定所述预设模型对应的第一损失。

本实施例中，对于执行有第一操作的信息样本，可以基于转化概率和转化标签构建损失函数，第一损失可以表征预设模型预测出的转化概率和转化标签之间的差距，可以反映预设模型预测转化概率的准确度。

步骤S402：基于未携带所述转化标签的信息样本各自对应的转化概率和所述伪标签，确定所述预设模型对应的第二损失。

本实施例中，对于未执行有第一操作的信息样本，可以基于转化概率和伪标签构建损失函数，第二损失可以表征预设模型预测出的转化概率和伪标签之间的差距。

步骤S403：基于所述多个信息样本各自对应的第一概率和所述初始标签，确定所述预设模型对应的第三损失。

本实施例中，每个信息样本均具有初始标签，且每个信息样本对应有第一概率，因此，对每个信息样本，可以基于第一概率和初始标签构建损失函数，第三损失可以表征预设模型预测出的第一概率和初始标签之间的差距。

通过上步骤S401至步骤S403，对于每个被执行有第一操作的信息样本而言，具有对应的第三损失和第一损失，而对于每个未被执行有第一操作的信息样本而言，具有对应的第三损失和第二损失。

步骤S404：基于所述第一损失、所述第二损失和所述第三损失，对所述预设模型的参数进行更新。

本实施例中，可以将第一损失、第二损失和第三损失之和，作为预设模型的总损失，从而基于总损失对预设模型的参数进行更新。

在一种实施方式中，给出了求取多个信息样本的总损失的公式，如以下公式(一)：

其中，N表示所有信息样本，L表示被执行有第一操作的信息样本，U表示未被执行有第一操作的信息样本，y_i表示初始标签，z_i表示转化标签。θ_ctr和θ_cvr分别表示确定第一概率和确定第二概率的参数，θ’_cvr表示确定伪标签的参数，H是one-hot函数，用于计算得到伪标签。

其中，对如何获得未被执行第一操作的信息样本的伪标签的过程进行介绍，如图3所示，由于转化概率是第一概率和第二概率的乘积得到的，而伪标签是作为转化概率的标签，由此，伪标签也可以基于第一概率和第二概率得到。

实际中，由于伪标签是针对未被执行第一操作的信息样本的，而未被执行第一操作的信息样本由于没有被执行第一操作，这样，便需要假设该信息样本被执行第一操作的情况下，再执行第二操作的概率，此种情况下，被预测出的执行第二操作的概率便称为伪概率。

实际中，可以确定未携带所述转化标签的信息样本对应的第二伪概率，并基于未携带所述转化标签的信息样本对应的第一概率和所述第二伪概率，确定未携带所述转化标签的信息样本对应的伪标签。

其中，所述第二伪概率用于表征若所述信息样本被执行所述第一操作，再被被执行所述第二操作的概率。

本实施例中，可以确定第一概率和第二伪概率的乘积，该乘积作为未携带转化标签的信息样本的伪转化概率，之后，对确定的伪转化概率进行通过one-hot(独热)编码，从而计算得到伪标签。

在一种实施例中，可以在预设模型中增加伪标签模块，该伪标签模块可以是独立的模块，而预设模型由于需要确定出第一概率和第二概率，因此，预设模型中还可以包括确定第一概率的第一模块和确定第二概率的第二模块，第一模块和第二模块可以是相互独立的模块。

则在对预设模型进行训练的过程中，可以通过预设模型中的伪标签模块确定出未被执行第一操作的信息样本的伪标签，这样，随着预设模型的不断被更新，伪标签模块的参数也被不断更新，这样，随着预设模型的训练更加深入，其确定出的伪标签可以越接近于真实标签，即确定出的伪标签可以趋近于信息样本的真实转化情况。

相应地，在获取转化率预估模型时，可以将多次更新后的预设模型中的伪标签模块剔除，得到转化率预估模型。这样，转化率预估模型中便包括了第一模块和第二模块。当然，此种实施方式下，被剔除的伪标签模块可以单独作为一个模型使用，用于为信息标注是否被转化的标签。

其中，对如何更新预设模型的参数进行说明，由于预设模型包括第一模块、第二模块和伪标签模块，实际中，伪标签模块可以共享第二模块的参数，更具体地，伪标签模块的参数可以是第二模块的滑动平均参数。

则在每一次更新时，可以对第一模块的参数和第二模块的参数进行更新；并基于第二模块当前的参数，对伪标签模块的参数进行更新；其中，可以将第二模块的参数的滑动平均值，作为伪标签模块当前的参数。

当然，需要说明的是，预设模型中除第一模块和第二模块外，还可以包括乘积单元和特征提取单元，特征提取单元的输出端分别连接第一模块和第二模块的输入端，这样，第一模块和第二模块可以共享特征提取单元输出的特征，特征提取单元用于对输入的信息样本进行特征提取，输出特征向量。乘积单元的输入端同时连接第一模块和第二模块的输出端，并对第一模块输出的第一概率、和第二模块输出的第二概率进行相乘，得到转化率。

采用本实施方式时，由于未被执行第一操作的信息样本通过预设模型中配置的伪标签模块给予了伪标签，这样，预设模型便可以应用于半监督训练中，训练预设模型的训练样本部分可以携带转化标签，部分可以不用携带转化标签，这样，伪标签可以在训练预设模型的过程中被自动给与，无需单独确定伪标签，从而提高了训练效率。

并且，随着预设模型的不断被更新，伪标签模块的参数和用于确定转化率的第一模块和第二模块同步被更新，使得预设模型同时具备了伪标签确定功能和转化率确定功能，此种模式下，预设模型在半监督的训练中可以实现自我监督，从而优化了模型性能。并随着预设模型的训练更加深入，其确定出的伪标签可以越接近于真实标签，即确定出的伪标签可以趋近于信息样本的真实转化率。

其中，在通过上述实施例的方法得到转化率预估模型之后，便可以将转化率预估模型部署到线上，从而通过转化率预估模型对发布的信息的转化率进行预估。

基于与上述实施例同一发明构思，本公开实施例的第二方面，提供了一种转化率预估方法，参照图5所示，示出了本实施例中转化率预估方法的步骤流程图，如图5所示，具体可以包括以下步骤：

步骤S501：获取待预测的目标信息。

步骤S502：将所述目标信息输入到转化率预估模型中，所述转化率预估模型是根据上述实施例所述的转化率预估模型的获取方法得到的。

步骤S503：获取所述转化率预估模型输出的所述目标信息对应的转化概率；其中，所述转化概率用于表征若对所述目标信息执行第一操作，再对所述目标信息执行第二操作的概率。

本实施例中，待预测的目标信息可以是即将要发布的信息，从而通过转化率预估模型可以确定该信息被发布后，会被用户转化的概率。当该转化率越高时，表征该信息被用户转化的概率高，实际中对用户来说具有更高的价值。

采用本申请实施例的技术方案，由于训练得到转化率预估模型的训练样本包括了被执行第一操作的信息样本和未被执行第一操作的信息样本，实际中，未被执行第一操作的信息样本的数量非常多，由此克服了训练样本过于稀疏的问题，另一方面，由于训练样本被极大丰富，从而提高了转化率预估模型的泛化性能，使得转化率预估模型便能适应线上发布的各种信息，并对信息的转化率进行精准的预估。

基于与上述实施例同一发明构思，本公开实施例的第三方面，提供了一种转化率预估模型的获取装置，参照图6所示，示出了该转化率预估模型的获取装置的结构示意图，如图6所示，所述装置具体可以包括以下模块：

样本获取模块601，用于获取多个信息样本，所述多个信息样本中包括被执行第一操作的信息样本和未被执行所述第一操作的信息样本；所述被执行第一操作的信息样本携带转化标签，所述转化标签用于指示被执行所述第一操作后是否再被执行第二操作；

输入模块602，用于将所述多个信息样本输入预设模型，并确定所述多个信息样本中未携带所述转化标签的信息样本对应的伪标签；所述伪标签用于指示若对所述信息样本执行所述第一操作，是否再对所述信息样本执行所述第二操作；

第一获取模块603，用于获取所述预设模型输出的所述多个信息样本各自对应的转化概率；所述转化概率表征信息样本被执行所述第一操作后执行所述第二操作的概率；

更新模块604，用于基于所述多个信息样本各自对应的转化概率、所述转化标签和所述伪标签，对所述预设模型进行更新；

第二获取模块605，用于将多次更新后的预设模型作为所述转化率预估模型。

可选地，所述第一获取模块，包括：

第一获取子模块，用于获取所述预设模型输出的所述多个信息样本各自对应的第一概率和第二概率；其中，所述第一概率表征所述信息样本被执行所述第一操作的概率、所述第二概率表征所述信息样本被执行所述第一操作后执行所述第二操作的概率；

第二获取子模块，用于基于所述多个信息样本各自对应的第一概率和第二概率，获取所述多个信息样本各自对应的转化概率。

可选地，所述每个信息样本携带初始标签，所述初始标签用于表征是否对所述信息样本执行所述第一操作；所述更新模块，具体用于基于所述多个信息样本各自对应的第一概率、转化概率、所述转化标签、所述伪标签以及所述初始标签，对所述预设模型的参数进行更新。

可选地，所述更新模块，具体包括：

第一损失计算单元，用于基于携带所述转化标签的信息样本各自对应的转化概率和所述转化标签，确定所述预设模型对应的第一损失；

第二损失计算单元，用于基于未携带所述转化标签的信息样本各自对应的转化概率和所述伪标签，确定所述预设模型对应的第二损失；

第三损失计算单元，用于基于所述多个信息样本各自对应的第一概率和所述初始标签，确定所述预设模型对应的第三损失；

更新单元，用于基于所述第一损失、所述第二损失和所述第三损失，对所述预设模型的参数进行更新。

可选地，所述预设模型包括伪标签模块；所述输入模块，具体用于通过所述伪标签模块，确定所述多个信息样本中未携带所述转化标签的信息样本对应的伪标签；

所述第二获取模块，具体用于将多次更新后的预设模型中的所述伪标签模块剔除，得到所述转化率预估模型。

可选地，所述预设模型还包括第一模块和第二模块；其中，所述第一模块用于确定所述第一概率、所述第二模块用于确定所述第二概率；所述更新模块，包括：

第一更新单元，用于对所述第一模块的参数和所述第二模块的参数进行更新；

第二更新单元，用于基于所述第二模块的参数，对所述伪标签模块的参数进行更新。

可选地，所述输入模块，包括：

伪概率确定单元，用于确定未携带所述转化标签的信息样本对应的第二伪概率，所述第二伪概率用于表征若所述信息样本被执行所述第一操作，再被被执行所述第二操作的概率；

伪标签确定单元，用于基于未携带所述转化标签的信息样本对应的第一概率和所述第二伪概率，确定未携带所述转化标签的信息样本对应的伪标签。

基于与上述实施例同一发明构思，本公开实施例的第四方面，提供了一种转化率预估装置，参照图7所示，示出了该转化率预估装置的结构示意图，如图7所示，所述装置具体可以包括以下模块：

信息获取模块701，用于获取待预测的目标信息；

信息输入模块702，用于将所述目标信息输入到转化率预估模型中，所述转化率预估模型是根据转化率预估模型的获取方法获取的；

转化概率获取模块703，用于获取所述转化率预估模型输出的所述目标信息对应的转化概率；其中，所述转化概率用于表征若对所述目标信息执行第一操作，再对所述目标信息执行第二操作的概率。

本发明实施例还提供了一种电子设备，该电子设备可以包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器被配置为执行所述的转化率预估模型获取方法或所述的转化率预估方法。

本申请实施例还提供了一种非临时性计算机可读存储介质，当所述存储介质中的指令由处理器执行时，使得所述处理器能够执行一种以实现本申请上述的转化率预估模型获取方法所执行的操作或所述的转化率预估方法所执行的操作。

本说明书中的各个实施例均采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似的部分互相参见即可。

本领域内的技术人员应明白，本发明实施例的实施例可提供为方法、装置、或计算机程序产品。因此，本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明实施例是参照根据本发明实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上，使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本发明实施例的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例做出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。

最后，还需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。

以上对本发明所提供的一种转化率预估模型获取方法、转化率预估方法、装置、电子设备及介质，进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种转化率预估模型的获取方法，其特征在于，所述方法包括：

将多次更新后的预设模型作为所述转化率预估模型。

2.根据权利要求1所述的方法，其特征在于，获取所述预设模型输出的所述多个信息样本各自对应的转化概率，包括：

3.根据权利要求2所述的方法，其特征在于，所述每个信息样本携带初始标签，所述初始标签用于表征是否对所述信息样本执行所述第一操作；

4.根据权利要求3所述的方法，其特征在于，基于所述多个信息样本各自对应的第一概率、转化概率、所述转化标签、所述伪标签以及所述初始标签，对所述预设模型的参数进行更新，包括：

5.根据权利要求2所述的方法，其特征在于，所述预设模型包括伪标签模块；确定所述多个信息样本中未携带所述转化标签的信息样本对应的伪标签，包括：

将多次更新后的预设模型作为所述转化率预估模型，包括：

6.根据权利要求5所述的方法，其特征在于，所述预设模型还包括第一模块和第二模块；其中，所述第一模块用于确定所述第一概率、所述第二模块用于确定所述第二概率；对所述预设模型的参数进行更新，包括：

对所述第一模块的参数和所述第二模块的参数进行更新；

7.根据权利要求2-6任一所述的方法，其特征在于，确定所述多个信息样本中未携带所述转化标签的信息样本对应的伪标签，包括：

8.一种转化率预估方法，其特征在于，所述方法包括：

获取待预测的目标信息；

将所述目标信息输入到转化率预估模型中，所述转化率预估模型是根据权利要求1-7任一项所述的方法获取的；

9.一种转化率预估模型的获取装置，其特征在于，所述装置包括：

更新模块，用于基于所述多个信息样本各自对应的转化概率、所述转化标签和所述伪标签，对所述预设模型进行更新；并将多次更新后的预设模型作为所述转化率预估模型。

10.一种转化率预估装置，其特征在于，所述装置包括：

信息获取模块，用于获取待预测的目标信息；

信息输入模块，用于将所述目标信息输入到转化率预估模型中，所述转化率预估模型是根据权利要求1-7任一项所述的方法获取的；

11.一种电子设备，其特征在于，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行时实现如权利要求1-7任一项所述的转化率预估模型获取方法，或实现如权利要求8所述的转化率预估方法。

12.一种计算机可读存储介质，其特征在于，其存储的计算机程序使得处理器执行如权利要求1-7任一项所述的转化率预估模型获取方法，或实现如权利要求8所述的转化率预估方法。