CN116523554A

CN116523554A - 点击率预测模型的训练方法及装置

Info

Publication number: CN116523554A
Application number: CN202310491836.5A
Authority: CN
Inventors: 王雅晴; 朴泓名; 徐龙腾; 董大祥; 周景博
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2023-05-04
Filing date: 2023-05-04
Publication date: 2023-08-01
Also published as: US20240104403A1

Abstract

本公开提供了一种点击率预测模型的训练方法及装置，涉及数据处理技术领域。其中点击率预测模型包括超网络模块和预测模块，具体实现方案为：获取样本特征信息和标签值；样本特征信息包括样本用户特征信息和目标对象特征信息；标签值用于表示样本用户是否与目标对象存在交互行为；基于超网络模块对目标对象特征信息进行处理，以得到多个用于特征交互的邻接矩阵；根据样本特征信息与多个邻接矩阵，采用预测模块获取样本用户对目标对象的点击率预测值；根据标签值和点击率预测值，对点击率预测模型进行训练。本公开可在小样本条件下快速提升点击率预测模型的点击率预测准确度，以在一定程度上缓解点击率预测任务中的冷启动问题。

Description

点击率预测模型的训练方法及装置

技术领域

本公开涉及数据处理技术领域，尤其涉及人工智能、NLP、深度学习及智能搜索领域，特别涉及一种点击率预测模型的训练方法及装置。

背景技术

点击率预测任务是指根据用户和物品的特征来预测用户点击物品的概率。准确的点击率预测能够为用户推荐最有价值的物品，提高用户体验。然而在可用于训练的物品数据量非常少的情况下，比如新物品出现初期，传统点击率预测模型对点击率的预测效果较差，难以基于预测结果准确推荐给合适的用户，即存在物品侧冷启动问题。因此，将如何利用少量物品数据快速提升点击率预测的准确度，以将物品推荐给恰当的用户成为十分紧迫的需求。

发明内容

本公开提供了一种点击率预测模型的训练方法及装置。

根据本公开的第一方面，提供了一种点击率预测模型的训练方法，所述点击率预测模型包括超网络模块和预测模块，所述训练方法包括：

获取样本特征信息和标签值；所述样本特征信息包括样本用户特征信息和目标对象特征信息；所述标签值用于表示所述样本用户是否与所述目标对象存在交互行为；

基于所述超网络模块对所述目标对象特征信息进行处理，以得到多个用于特征交互的邻接矩阵；

根据所述样本特征信息与所述多个邻接矩阵，采用所述预测模块获取所述样本用户对所述目标对象的点击率预测值；

根据所述标签值和所述点击率预测值，对所述点击率预测模型进行训练。

根据本公开的第二方面，提供了一种点击率预测方法，包括：

获取用户的特征信息和目标对象的特征信息；

将所述用户的特征信息和所述目标对象的特征信息输入至预先训练的点击率预测模型中；其中，所述点击率预测模型采用如前述第一方面所述的方法训练得到的；

获取所述点击率预测模型输出的点击率预测值，将所述点击率预测值确定为所述用户与所述目标对象交互的概率。

根据本公开的第三方面，提供了一种点击率预测模型的训练装置，其中，所述点击率预测模型包括超网络模块和预测模块，所述训练装置包括：

第一获取模块，用于获取样本特征信息和标签值；所述样本特征信息包括样本用户特征信息和目标对象特征信息；所述标签值用于表示所述样本用户是否与所述目标对象存在交互行为；

第二获取模块，用于基于所述超网络模块对所述目标对象特征信息进行处理，以得到多个用于特征交互的邻接矩阵；

点击率预测模块，用于根据所述样本特征信息与所述多个邻接矩阵，采用所述预测模块获取所述样本用户对所述目标对象的点击率预测值；

训练模块，用于根据所述标签值和所述点击率预测值，对所述点击率预测模型进行训练。

根据本公开的第四方面，提供了一种点击率预测装置，包括：

第一获取模块，用于获取用户的特征信息和目标对象的特征信息；

第二获取模块，用于将所述用户的特征信息和所述目标对象的特征信息输入至预先训练的点击率预测模型中，获取所述点击率预测模型输出的点击率预测值，将所述点击率预测值确定为所述用户与所述目标对象交互的概率；其中，所述点击率预测模型采用如前述第一方面所述的方法训练得到的。

根据本公开的第五方面，提供了一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行前述第一方面所述的方法，或者执行前述第二方面所述的方法。

根据本公开的第六方面，提供了一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行前述第一方面所述的方法，或者执行前述第二方面所述的方法。

根据本公开的第七方面，提供了一种计算机程序产品，包括计算机程序，其中，所述计算机程序在被处理器执行时实现前述第一方面所述方法的步骤，或者实现前述第二方面所述的方法的步骤。

根据本公开的点击率预测模型的训练方法，可基于超网络模块生成目标对象用于特征交互的邻接矩阵，根据邻接矩阵预测点击率并对点击率预测模型进行训练，可在小样本条件下快速提升点击率预测模型的点击率预测准确度，以在一定程度上缓解点击率预测任务中的冷启动问题。

应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

附图说明

附图用于更好地理解本方案，不构成对本公开的限定。其中：

图1是根据本公开实施例提出的一种点击率预测模型的训练方法的流程示意图；

图2是根据本公开实施例提出的另一种点击率预测模型的训练方法的流程示意图；

图3为本公开实施例所提出的一种点击率预测模型的示意图；

图4是根据本公开实施例提出的又一种点击率预测模型的训练方法的流程示意图；

图5是根据本公开实施例提出的一种点击率预测方法的流程示意图；

图6是本公开实施例提供的一种点击率预测模型的训练装置的结构框图；

图7是本公开实施例提供的另一种点击率预测模型的训练装置的结构框图；

图8是本公开实施例提供的一种点击率预测装置的结构框图；

图9是用以实现本公开实施例的点击率预测模型的训练方法或者点击率预测方法的电子设备的框图。

具体实施方式

以下结合附图对本公开的示范性实施例做出说明，其中包括本公开实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本公开的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。

在本公开实施例使用的术语是仅仅出于描述特定实施例的目的，而非旨在限制本公开实施例。在本公开实施例和所附权利要求书中所使用的单数形式的“一种”和“该”也旨在包括多数形式，除非上下文清楚地表示其他含义。

应当理解，尽管在本公开实施例可能采用术语第一、第二、第三等来描述各种信息，但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如，在不脱离本公开实施例范围的情况下，第一信息也可以被称为第二信息，类似地，第二信息也可以被称为第一信息。取决于语境，如在此所使用的词语“如果”及“若”可以被解释成为“在……时”或“当……时”或“响应于确定”。

需要说明的是，本公开的技术方案中，所涉及的用户个人信息的收集、存储、使用、加工、传输、提供和公开等处理，均符合相关法律法规的规定，且不违背公序良俗。

在点击率预测任务中，找到合适的特征交互往往需要大量数据(特征交互能够融合不同特征的信息以产生新信息，从而提升点击率预测准确度)。然而对于新出现的物品或者仅有少量物品样本数据的情况，在点击率预测任务中很难快速进行特征交互，点击率预测效果不佳。为此，本公开提供了一种点击率预测模型的训练方法及装置。具体地，下面参考附图描述本公开实施例的点击率预测模型的训练方法及装置。

图1是根据本公开实施例提出的一种点击率预测模型的训练方法的流程示意图。其中，该点击率预测模型包括超网络模块和预测模块。需要说明的是，本公开实施例的点击率预测模型的训练方法可应用于本公开实施例的点击率预测模型的训练装置，该点击率预测模型的训练装置可被配置于电子设备上。还需要说明的是，该点击率预测模型可应用于推荐、搜索等相关场景中，为用户提供图文个性化推荐、媒资个性化推荐服务等。如图1所示，该点击率预测模型的训练方法可以包括但不限于以下步骤。

步骤101，获取样本特征信息和标签值。该样本特征信息包括样本用户特征信息和目标对象特征信息。标签值用于表示样本用户是否与目标对象存在交互行为。

其中，样本用户特征信息可以包括用户ID、用户年龄、用户兴趣等特征信息。目标对象可以是物品，或者还可以是商品，或者还可以是广告等。目标对象特征信息可以是目标对象ID、目标对象种类、目标对象属性等特征信息。标签值用于表示样本用户是否与目标对象存在交互行为，交互行为可以是样本用户对目标对象进行点击、购买、分享、收藏等操作。

在本公开一些实施例中，样本特征信息可以是经过特征嵌入处理，将离散的原始特征信息转换到稠密空间中所获得的样本特征信息其中，代表第m个样本特征信息，N_v为目标对象特征信息的数量，N_u为样本用户特征信息的数量。

步骤102，基于超网络模块对目标对象特征信息进行处理，以得到多个用于特征交互的邻接矩阵。

需要说明的是，邻接矩阵即代表特征图，用于表征特征交互模式，其中节点表示特征，边表示特征之间的相关性。在一种可能的实现方式中，超网络模块可通过多个图生成器生成多个用于特征交互的邻接矩阵，该邻接矩阵即代表目标对象专属的特征交互模式，以在小样本条件下，可根据少量样本数据快速优化特征交互。

步骤103，根据样本特征信息与多个邻接矩阵，采用预测模块获取样本用户对目标对象的点击率预测值。

作为一种可能的实现方式，样本特征信息可根据邻接矩阵确定邻居特征，并与邻居特征融合，进行特征交互，获得高阶特征信息。进而根据高阶特征信息采用预测模块对点击率进行预测，获得样本用户对目标对象的点击率预测值。

步骤104，根据标签值和点击率预测值，对点击率预测模型进行训练。

可选地，在本公开一些实施例中，可根据标签值与点击率预测值，计算损失函数。根据损失函数调整超网络模块的模型参数和预测模块的模型参数。作为一种示例，可使用元学习对点击率预测模型进行训练，利用损失函数梯度传给元学习器进行更新完成元学习的训练过程，使用Adam优化器优化模型参数，优化目标可如下所示：

其中，为预测模块的模型参数，/>为超网络模块的模型参数，L_meta为元学习的损失函数，/>为专属于各个任务的损失函数，φ_i代表专属于目标对象i的目标对象ID嵌入以及专属于目标对象i的邻接矩阵。可选地，损失函数可采用交叉熵。由此，可在目标对象刚刚出现时，使用超网络模块生成对应的用于特征交互的邻接矩阵。随着可用于训练的目标对象数据量逐渐增加，邻接矩阵将通过梯度下降逐渐优化，最终可生成专属于目标对象最优的特征交互模式。从而在小样本条件下，目标对象特征信息与用户特征信息基于该特征交互模式能够快速找到合适的特征进行交互。

通过实施本公开实施例，可基于超网络模块生成目标对象用于特征交互的邻接矩阵，即目标对象专属的特征交互模式，根据邻接矩阵预测点击率并对点击率预测模型进行训练，可在小样本条件下快速提升点击率预测模型的点击率预测准确度，以在一定程度上缓解点击率预测任务中的冷启动问题。可在后续基于预测点击率向用户提供有效推荐，提高用户体验。

图2是根据本公开实施例提出的另一种点击率预测模型的训练方法的流程示意图。其中，如图3所示，该点击率预测模型中的超网络模块包括多个独热编码单元(one-hot)和与每个独热编码单元对应的图生成器，该点击率预测模型中的预测模块包括多个图神经网络单元和预测单元，图神经网络单元的个数与邻接矩阵的个数相同，且每个图神经网络单元对应一个邻接矩阵。如图2所示，该点击率预测模型的训练方法可以包括但不限于以下步骤。

步骤201，获取样本特征信息和标签值。该样本特征信息包括样本用户特征信息和目标对象特征信息。标签值用于表示样本用户是否与目标对象存在交互行为。

步骤202，将目标对象特征信息分别输入至多个独热编码单元，获得每个独热编码单元输出的独热编码特征。

如图3所示，v_i表示目标对象i的原始目标对象特征信息，u_j表示样本用户j的原始样本用户特征信息，对原始目标对象特征信息与原始样本用户特征信息进行特征嵌入处理，获得样本用户特征信息和目标对象特征信息。需要说明的是，在本公开实施例中，对每个样本特征信息定义一个图生成器，即图3中的n＝N_v+N_u,为样本特征信息的总个数。将目标对象特征信息分别输入至n个独热编码单元，获得每个独热编码单元输出的独热编码特征。

样本特征信息可以是经过特征嵌入处理，将离散的原始特征信息转换到稠密空间中所获得的样本特征信息其中，/> 代表第m个样本特征信息，N_v为目标对象特征信息的数量，N_u为样本用户特征信息的数量。

步骤203，将每个独热编码单元输出的独热编码特征输入至对应图生成器中，获得每个图生成器的输出结果。

需要说明的是，图生成器m的输出结果为第一邻接矩阵中特征m的一行，即邻接矩阵/>的第m行，m∈[1,2,...,N_v+N_u]。可选地，MLP图生成器m的输出结果获取公式可参考如下：

步骤204，将每个图生成器的输出结果进行拼接处理，得到一个用于特征交互的第一邻接矩阵。

也就是说，将n个图生成器的输出结果进行拼接处理，得到一个专属于目标对象i的用于特征交互的(N_v+N_u)×(N_v+N_u)的第一邻接矩阵/>

步骤205，对第一邻接矩阵进行迭代，将第一邻接矩阵和迭代后得到的邻接矩阵确定为多个邻接矩阵。

需要说明的是，为了建模高阶特征交互，需要多个图神经网络单元，其中每个图神经网络单元都需要对应一个邻接矩阵。为此，在一种实现方式中提供了邻接矩阵的迭代公式，可基于第一邻接矩阵生成任一层图神经网络单元对应的邻接矩阵。其中，邻接矩阵迭代公式的设计可参考如下过程：

首先，对邻接矩阵进行修正：

其中normalize(·)是最小-最大规范化，是为了确保邻接矩阵中的元素位于0-1之间。此外，为了避免相关性较低的特征交互对预测结果带来负面影响，使用sparsify(·,K)保留邻接矩阵中最大的K个元素，将其余置零。同时由于特征交互满足交换律,可用如下方式保证邻接矩阵对称：

在此基础上，提出迭代公式如下：

以图3所示实施例为例，基于第一邻接矩阵通过迭代公式可获得图神经网络单元2对应的邻接矩阵/>

步骤206，根据样本特征信息和多个邻接矩阵，采用多个图神经网络单元获取每个图神经网络单元输出的高阶特征信息。

在本公开一些实施例中，可根据样本特征信息和多个邻接矩阵，采用多个图神经网络单元进行特征交互，更新样本特征信息状态，获得每个图神经网络单元输出的高阶特征信息。

作为一种示例，可采用第一个图神经网络单元，基于对应第一邻接矩阵确定样本特征信息的邻居特征，并将样本特征信息及其邻居特征进行融合，获得第一个图神经网络单元输出的高阶特征信息/>

采用第2个图神经网络单元，基于对应邻接矩阵确定样本特征信息的邻居特征，并将第1个图神经网络单元输出的高阶特征信息/>与邻居特征进行融合，获得第2个图神经网络单元输出的高阶特征信息/>以此类推，采用第l个图神经网络单元，基于对应邻接矩阵确定样本特征信息的邻居特征，并将第l-1个图神经网络单元输出的高阶特征信息/>与邻居特征进行融合，获得第l个图神经网络单元输出的高阶特征信息/>其中，1<l≤N，N为图神经网络单元的个数。直至获得所有图神经网络单元输出的高阶特征信息。需要说明的是，图3所示实施例仅以两个图神经网络单元为例，并不构成对本公开中图神经网络单元个数的限定。

在本公开一些实施例中，第l个图神经网络单元输出的高阶特征信息可参考如下公式：

其中，为可学习的参数。

步骤207，根据每个图神经网络单元输出的高阶特征信息，采用预测单元获取样本用户对目标对象的点击率预测值。

在本公开一些实施例中，可将每个图神经网络单元输出的高阶特征信息进行融合，并基于经过融合后的样本特征信息最终表示采用预测单元获取样本用户对目标对象的点击率预测值。

步骤208，根据标签值和点击率预测值，对点击率预测模型进行训练。

在本公开实施例中，步骤201和步骤208可以分别采用本公开的各实施例中的任一种方式实现，对此本公开不作具体限定，也不再赘述。

通过实施本公开实施例，可基于超网络模块生成目标对象用于特征交互的邻接矩阵，根据邻接矩阵采用多个图神经网络单元进行高阶特征交互，基于高阶特征信息预测点击率，并对点击率预测模型进行训练。可在小样本条件下快速提升点击率预测模型的点击率预测准确度，进一步提高预测用户对目标对象点击率的准确度，以在一定程度上缓解点击率预测任务中的冷启动问题。可在后续基于预测点击率向用户提供有效推荐，提高用户体验。

图4是根据本公开实施例提出的又一种点击率预测模型的训练方法的流程示意图。其中，该点击率预测模型中的预测模块包括多个图神经网络单元、特征融合单元和预测单元，图神经网络单元的个数与邻接矩阵的个数相同，且每个图神经网络单元对应一个邻接矩阵。如图4所示，该点击率预测模型的训练方法可以包括但不限于以下步骤。

步骤401，获取样本特征信息和标签值。该样本特征信息包括样本用户特征信息和目标对象特征信息。标签值用于表示样本用户是否与目标对象存在交互行为。

步骤402，基于超网络模块对目标对象特征信息进行处理，以得到多个用于特征交互的邻接矩阵。

步骤403，根据样本特征信息和多个邻接矩阵，采用多个图神经网络单元获取每个图神经网络单元输出的高阶特征信息。

步骤404，基于特征融合单元，采用注意力机制对每个图神经网络单元输出的高阶特征信息进行融合处理，获得样本特征信息之中各自特征的特征表示。

可选地，可通过以下公式采用注意力机制对每个图神经网络单元输出的高阶特征信息进行融合处理，获得样本特征信息之中第m个特征的特征表示

head_h＝attention(W_q,hH_m,W_k,hH_m,W_v,hH_m)

其中N_l为图神经网络单元的个数。

步骤405，将样本特征信息之中各自特征的特征表示输入至预测单元，获得样本用户对目标对象的点击率预测值。

在一种可能的实现方式中，预测单元可利用使用参数W_c,1的第一多层感知机评估样本特征信息中各个特征的特征表示的权重：

进而利用使用参数W_c,2的第二多层感知机对样本特征信息之中每个特征的特征表示进行评分并加权求和，获得样本用户对目标对象的点击率预测值/>

步骤406，根据标签值和点击率预测值，对点击率预测模型进行训练。

在本公开实施例中，步骤401-步骤403，以及步骤406可以分别采用本公开的各实施例中的任一种方式实现，对此本公开不作具体限定，也不再赘述。

通过实施本公开实施例，可基于超网络模块生成目标对象用于特征交互的邻接矩阵，即目标对象专属的特征交互模式，根据邻接矩阵采用多个图神经网络单元进行高阶特征交互，并采用注意力机制对多个图神经网络单元输出的高阶特征信息进行融合，进而预测点击率，并对点击率预测模型进行训练。可在小样本条件下快速提升点击率预测模型的点击率预测准确度，进一步提高预测用户对目标对象点击率的准确度，以在一定程度上缓解点击率预测任务中的冷启动问题。可在后续基于预测点击率向用户提供有效推荐，提高用户体验。

本公开还提出一种点击率预测方法。图5是根据本公开实施例提出的一种点击率预测方法的流程示意图。需要说明的是，本公开实施例的点击率预测方法可应用于本公开实施例的点击率预测装置，该点击率预测装置可被配置于电子设备上。如图5所示，该点击率预测方法可以包括但不限于以下步骤。

步骤501，获取用户的特征信息和目标对象的特征信息。

步骤502，将用户的特征信息和目标对象的特征信息输入至预先训练的点击率预测模型中。

其中，点击率预测模型为采用前述任一实施例的点击率预测模型的训练方法训练得到的，在此不再赘述。

步骤503，获取点击率预测模型输出的点击率预测值，将点击率预测值确定为用户与目标对象交互的概率。

通过实施本公开实施例，通过预先训练的点击率预测模型可获取专属于目标对象最优的特征交互模式，基于该特征交互模式对点击率进行预测，可在小样本条件下，提高点击率预测值的准确度，基于点击率预测值向用户提供有效推荐，可提高用户体验。

图6是本公开实施例提供的一种点击率预测模型的训练装置的结构框图，其中，该点击率预测模型包括超网络模块和预测模块。如图6所示，该点击率预测模型的训练装置可以包括：第一获取模块601第二获取模块602、点击率预测模块603和训练模块604。

其中，第一获取模块601，用于获取样本特征信息和标签值；所述样本特征信息包括样本用户特征信息和目标对象特征信息；所述标签值用于表示所述样本用户是否与所述目标对象存在交互行为；

第二获取模块602，用于基于所述超网络模块对所述目标对象特征信息进行处理，以得到多个用于特征交互的邻接矩阵；

点击率预测模块603，用于根据所述样本特征信息与所述多个邻接矩阵，采用所述预测模块获取所述样本用户对所述目标对象的点击率预测值；

训练模块604，用于根据所述标签值和所述点击率预测值，对所述点击率预测模型进行训练。

在本公开的一些实施例中，所述超网络模块包括多个独热编码单元和与每个所述独热编码单元对应的图生成器；所述第二获取模块602具体用于：将所述目标对象特征信息分别输入至所述多个独热编码单元，获得每个所述独热编码单元输出的独热编码特征；将每个所述独热编码单元输出的独热编码特征输入至对应图生成器中，获得每个所述图生成器的输出结果；将每个所述图生成器的输出结果进行拼接处理，得到一个用于特征交互的第一邻接矩阵；对所述第一邻接矩阵进行迭代，将所述第一邻接矩阵和迭代后得到的邻接矩阵确定为所述多个邻接矩阵。

在本公开的一些实施例中，所述训练模块604具体用于：根据所述标签值和所述点击率预测值，计算损失函数；根据所述损失函数调整所述超网络模块的模型参数和所述预测模块的模型参数。

可选地，在本公开一些实施例中，所述预测模块包括多个图神经网络单元和预测单元，所述图神经网络单元的个数与所述邻接矩阵的个数相同，且每个所述图神经网络单元对应一个所述多个邻接矩阵；如图7所示，所述点击率预测模块703包括：获取单元705和预测单元706。其中，获取单元705，用于根据所述样本特征信息和所述多个邻接矩阵，采用所述多个图神经网络单元获取每个所述图神经网络单元输出的高阶特征信息；预测单元706，用于根据每个所述图神经网络单元输出的高阶特征信息，采用所述预测单元获取所述样本用户对所述目标对象的点击率预测值。其中，图7中701-704和图6中601-604具有相同功能和结构。

在本公开的一些实施例中，所述预测模块还包括特征融合单元；所述预测单元706具体用于：基于所述特征融合单元，采用注意力机制对每个所述图神经网络单元输出的高阶特征信息进行融合处理，获得所述样本特征信息之中各自特征的特征表示；将所述样本特征信息之中各自特征的特征表示输入至所述预测单元，获得所述样本用户对所述目标对象的点击率预测值。

在本公开的一些实施例中，所述获取单元705具体用于：采用第一个所述图神经网络单元，基于对应邻接矩阵确定所述样本特征信息的邻居特征，并将所述样本特征信息及其邻居特征进行融合，获得第一个所述图神经网络单元输出的高阶特征信息；采用第l个所述图神经网络单元，基于对应邻接矩阵确定所述样本特征信息的邻居特征，并将第l-1个所述图神经网络单元输出的高阶特征信息与邻居特征进行融合，获得第l个所述图神经网络单元输出的高阶特征信息；其中，1<l≤N_l，N_l为所述图神经网络单元的个数；直至获得所有所述图神经网络单元输出的高阶特征信息。

关于上述实施例中的装置，其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

图8是本公开实施例提供的一种点击率预测装置的结构框图。如图8所示，该点击率预测装置可以包括：第一获取模块801和第二获取模块802。

其中，第一获取模块801，用于获取用户的特征信息和目标对象的特征信息。

第二获取模块802，用于将所述用户的特征信息和所述目标对象的特征信息输入至预先训练的点击率预测模型中，获取所述点击率预测模型输出的点击率预测值，将所述点击率预测值确定为所述用户与所述目标对象交互的概率；其中，点击率预测模型为采用前述任一实施例的点击率预测模型的训练方法训练得到的，在此不再赘述。

根据本公开的实施例，本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。

如图9所示，图9是用以实现本公开实施例的点击率预测模型的训练方法或者点击率预测方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本公开的实现。

如图9所示，该电子设备包括：一个或多个处理器901、存储器902，以及用于连接各部件的接口，包括高速接口和低速接口。各个部件利用不同的总线互相连接，并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理，包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如，耦合至接口的显示设备)上显示GUI的图形信息的指令。在其它实施方式中，若需要，可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样，可以连接多个电子设备，各个设备提供部分必要的操作(例如，作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图9中以一个处理器901为例。

存储器902即为本公开所提供的非瞬时计算机可读存储介质。其中，所述存储器存储有可由至少一个处理器执行的指令，以使所述至少一个处理器执行本公开所提供的点击率预测模型的训练方法或者点击率预测方法。本公开的非瞬时计算机可读存储介质存储计算机指令，该计算机指令用于使计算机执行本公开所提供的点击率预测模型的训练方法或者点击率预测方法。

存储器902作为一种非瞬时计算机可读存储介质，可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块，如本公开实施例中的点击率预测模型的训练方法或者点击率预测方法对应的程序指令/模块。处理器901通过运行存储在存储器902中的非瞬时软件程序、指令以及模块，从而执行服务器的各种功能应用以及数据处理，即实现上述方法实施例中的点击率预测模型的训练方法或者点击率预测方法。

存储器902可以包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需要的应用程序；存储数据区可存储点击率预测模型的训练方法或者点击率预测方法的电子设备的使用所创建的数据等。此外，存储器902可以包括高速随机存取存储器，还可以包括非瞬时存储器，例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中，存储器902可选包括相对于处理器901远程设置的存储器，这些远程存储器可以通过网络连接至用以实现点击率预测模型的训练方法或者点击率预测方法的电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

点击率预测模型的训练方法或者点击率预测方法的电子设备还可以包括：输入装置903和输出装置904。处理器901、存储器902、输入装置903和输出装置904可以通过总线或者其他方式连接，图9中以通过总线连接为例。

输入装置903可接收输入的数字或字符信息，以及产生与点击率预测模型的训练方法或者点击率预测方法的电子设备的用户设置以及功能控制有关的键信号输入，例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置904可以包括显示设备、辅助照明装置(例如，LED)和触觉反馈装置(例如，振动电机)等。该显示设备可以包括但不限于，液晶显示器(LCD)、发光二极管(LED)显示器和等离子体显示器。在一些实施方式中，显示设备可以是触摸屏。

此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用ASIC(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，即本公开还提出了一种计算机程序，该计算机程序在被处理器执行时，实现上述实施例所描述的点击率预测模型的训练方法或者点击率预测方法，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令，并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的，术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如，磁盘、光盘、存储器、可编程逻辑装置(PLD))，包括，接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。

为了提供与用户的交互，可以在计算机上实施此处描述的系统和技术，该计算机具有：用于向用户显示信息的显示装置(例如，CRT(阴极射线管)或者LCD(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(LAN)、广域网(WAN)、互联网和区块链网络。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器，又称为云计算服务器或云主机，是云计算服务体系中的一项主机产品，以解决了传统物理主机与VPS服务("Virtual Private Server"，或简称"VPS")中，存在的管理难度大，业务扩展性弱的缺陷。服务器也可以为分布式系统的服务器，或者是结合了区块链的服务器。应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本公开公开的技术方案所期望的结果，本文在此不进行限制。

上述具体实施方式，并不构成对本公开保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等，均应包含在本公开保护范围之内。

Claims

1.一种点击率预测模型的训练方法，其中，所述点击率预测模型包括超网络模块和预测模块，所述训练方法包括：

2.如权利要求1所述的方法，其中，所述超网络模块包括多个独热编码单元和与每个所述独热编码单元对应的图生成器；所述基于所述超网络模块对所述目标对象特征信息进行处理，以得到多个用于特征交互的邻接矩阵，包括：

将所述目标对象特征信息分别输入至所述多个独热编码单元，获得每个所述独热编码单元输出的独热编码特征；

将每个所述独热编码单元输出的独热编码特征输入至对应图生成器中，获得每个所述图生成器的输出结果；

将每个所述图生成器的输出结果进行拼接处理，得到一个用于特征交互的第一邻接矩阵；

对所述第一邻接矩阵进行迭代，将所述第一邻接矩阵和迭代后得到的邻接矩阵确定为所述多个邻接矩阵。

3.如权利要求1所述的方法，其中，所述预测模块包括多个图神经网络单元和预测单元，所述图神经网络单元的个数与所述邻接矩阵的个数相同，且每个所述图神经网络单元对应一个所述多个邻接矩阵；所述根据所述样本特征信息与所述多个邻接矩阵，采用所述预测模块获取所述样本用户对所述目标对象的点击率预测值，包括：

根据所述样本特征信息和所述多个邻接矩阵，采用所述多个图神经网络单元获取每个所述图神经网络单元输出的高阶特征信息；

根据每个所述图神经网络单元输出的高阶特征信息，采用所述预测单元获取所述样本用户对所述目标对象的点击率预测值。

4.如权利要求3所述的方法，其中，所述预测模块还包括特征融合单元；所述根据每个所述图神经网络单元输出的高阶特征信息，采用所述预测单元获取所述样本用户对所述目标对象的点击率预测值，包括：

基于所述特征融合单元，采用注意力机制对每个所述图神经网络单元输出的高阶特征信息进行融合处理，获得所述样本特征信息之中各自特征的特征表示；

将所述样本特征信息之中各自特征的特征表示输入至所述预测单元，获得所述样本用户对所述目标对象的点击率预测值。

5.如权利要求3或4所述的方法，其中，所述根据所述样本特征信息和所述多个邻接矩阵，采用所述多个图神经网络单元获取每个所述图神经网络单元输出的高阶特征信息，包括：

采用第一个所述图神经网络单元，基于对应邻接矩阵确定所述样本特征信息的邻居特征，并将所述样本特征信息及其邻居特征进行融合，获得第一个所述图神经网络单元输出的高阶特征信息；

采用第l个所述图神经网络单元，基于对应邻接矩阵确定所述样本特征信息的邻居特征，并将第l-1个所述图神经网络单元输出的高阶特征信息与邻居特征进行融合，获得第l个所述图神经网络单元输出的高阶特征信息；其中，1<l≤N，N为所述图神经网络单元的个数；

直至获得所有所述图神经网络单元输出的高阶特征信息。

6.如权利要求1所述的方法，其中，所述根据所述标签值和所述点击率预测值，对所述点击率预测模型进行训练，包括：

根据所述标签值和所述点击率预测值，计算损失函数；

根据所述损失函数调整所述超网络模块的模型参数和所述预测模块的模型参数。

7.一种点击率预测方法，包括：

获取用户的特征信息和目标对象的特征信息；

将所述用户的特征信息和所述目标对象的特征信息输入至预先训练的点击率预测模型中；其中，所述点击率预测模型采用如权利要求1至6中任一项所述的方法训练得到的；

8.一种点击率预测模型的训练装置，其中，所述点击率预测模型包括超网络模块和预测模块，所述训练装置包括：

9.如权利要求8所述的装置，其中，所述超网络模块包括多个独热编码单元和与每个所述独热编码单元对应的图生成器；所述第二获取模块具体用于：

10.如权利要求8所述的装置，其中，所述预测模块包括多个图神经网络单元和预测单元，所述图神经网络单元的个数与所述邻接矩阵的个数相同，且每个所述图神经网络单元对应一个所述多个邻接矩阵；所述点击率预测模块包括：

获取单元，用于根据所述样本特征信息和所述多个邻接矩阵，采用所述多个图神经网络单元获取每个所述图神经网络单元输出的高阶特征信息；

预测单元，用于根据每个所述图神经网络单元输出的高阶特征信息，采用所述预测单元获取所述样本用户对所述目标对象的点击率预测值。

11.如权利要求10所述的装置，其中，所述预测模块还包括特征融合单元；所述预测单元具体用于：

12.如权利要求10或11所述的装置，其中，所述获取单元具体用于：

直至获得所有所述图神经网络单元输出的高阶特征信息。

13.如权利要求8所述的装置，其中，所述训练模块具体用于：

根据所述标签值和所述点击率预测值，计算损失函数；

14.一种点击率预测装置，包括：

第二获取模块，用于将所述用户的特征信息和所述目标对象的特征信息输入至预先训练的点击率预测模型中，获取所述点击率预测模型输出的点击率预测值，将所述点击率预测值确定为所述用户与所述目标对象交互的概率；其中，所述点击率预测模型采用如权利要求1至6中任一项所述的方法训练得到的。

15.一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1至6中任一项所述的方法，或者执行权利要求7所述的方法。

16.一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行权利要求1至6中任一项所述的方法，或者执行权利要求7所述的方法。

17.一种计算机程序产品，包括计算机程序，其中，所述计算机程序在被处理器执行时实现权利要求1至6中任一项所述方法的步骤，或者实现权利要求7所述方法的步骤。