CN113268645A

CN113268645A - 信息召回方法、模型训练方法、装置、设备及存储介质

Info

Publication number: CN113268645A
Application number: CN202110495693.6A
Authority: CN
Inventors: 尚铮; 王立平; 程佳; 朱静雅
Original assignee: Beijing Sankuai Online Technology Co Ltd
Current assignee: Beijing Sankuai Online Technology Co Ltd
Priority date: 2021-05-07
Filing date: 2021-05-07
Publication date: 2021-08-17

Abstract

本申请公开了一种信息召回方法、模型训练方法、装置、设备及存储介质，属于计算机技术领域。所述方法包括：获取待推荐的用户帐号在至少两个类目下的分类行为数据，类目是根据商品分类确定的；对至少两个类目下的分类行为数据进行特征提取，得到用户帐号在至少两个类目下的分类画像特征；将至少两个类目下的分类画像特征与候选推荐信息的候选信息特征进行匹配，得到候选推荐信息中的召回信息。不同类目下的分类画像特征能够反映用户不同类型的兴趣。通过不同类目下的分类画像特征能够召回不同类型的用户感兴趣的信息，提升召回结果的准确性。

Description

信息召回方法、模型训练方法、装置、设备及存储介质

技术领域

本申请涉及计算机技术领域，特别涉及一种信息召回方法、模型训练方法、装置、设备及存储介质。

背景技术

在信息推荐场景中，由于服务器内存储的信息的数量较庞大，向用户推荐信息会分为两个阶段：召回阶段和推荐阶段。在召回阶段中，服务器先从存储的候选推荐信息中召回(筛选)部分信息作为召回信息。在推荐阶段中，服务器将召回信息通过排序算法进行排序后，向客户端发送排序在前n个的召回信息作为推荐信息。其中，召回阶段的计算复杂度小于排序阶段。

服务器通常采用双塔模型实现上述召回阶段。双塔模型包括两个相互独立的特征提取网络。其中，第一特征提取网络用于根据用户信息(年龄、地区、点击行为、搜索行为等)提取用户画像特征。第二特征提取网络用于根据信息的内容(类别、价格、所属商家等)提取候选推荐信息的候选信息特征。服务器将提取到的用户画像特征和候选信息特征进行匹配，按照相似程度对候选推荐信息进行排序，将排序在前n个的候选推荐信息进行召回。

在基于上述方式进行信息的召回时，服务器会根据用户信息确定出用于描述用户兴趣的特征向量(用户画像特征)，并且考虑到匹配时的计算效率，会限制特征向量的长度。但是，当用户兴趣广泛时，通过该特征向量不能有效反映用户的全部兴趣，导致召回结果的准确性下降。

发明内容

本申请提供了一种信息召回方法、模型训练方法、装置、设备及存储介质，能够提升召回结果的准确性。所述技术方案如下：

根据本申请的一方面，提供了一种信息召回方法，所述方法包括：

获取待推荐的用户帐号在至少两个类目下的分类行为数据，所述类目是根据商品分类确定的；

对所述至少两个类目下的分类行为数据进行特征提取，得到所述用户帐号在所述至少两个类目下的分类画像特征；

将所述至少两个类目下的所述分类画像特征与候选推荐信息的候选信息特征进行匹配，得到所述候选推荐信息中的召回信息。

根据本申请的另一方面，提供了一种模型训练方法，所述方法包括：

获取用户帐号在至少两个类目下的分类行为数据，所述类目是根据商品分类确定的；

根据所述至少两个类目下的所述分类画像特征与候选推荐信息的候选信息特征之间的匹配度，训练机器学习模型，所述匹配度用于反映所述用户帐号与所述候选信息特征对应的所述候选推荐信息产生交互的可能性。

根据本申请的另一方面，提供了一种信息召回装置，所述装置包括：

获取模块，用于获取待推荐的用户帐号在至少两个类目下的分类行为数据，所述类目是根据商品分类确定的；

特征提取模块，用于对所述至少两个类目下的分类行为数据进行特征提取，得到所述用户帐号在所述至少两个类目下的分类画像特征；

匹配模块，用于将所述至少两个类目下的所述分类画像特征与候选推荐信息的候选信息特征进行匹配，得到所述候选推荐信息中的召回信息。

在一个可选的设计中，所述获取模块，用于：

获取待推荐的所述用户帐号的行为数据；

根据所述至少两个类目对所述行为数据进行聚类，得到所述至少两个类目下的所述分类行为数据，所述类目是根据所述候选推荐信息的内容类别确定的。

在一个可选的设计中，所述获取模块，用于：

根据所述至少两个类目对所述行为数据进行硬聚类，得到所述至少两个类目下的所述分类行为数据；

其中，所述硬聚类用于确定所述行为数据唯一所属的所述类目。

在一个可选的设计中，所述匹配模块，用于：

确定所述至少两个类目下的所述分类画像特征与所述候选信息特征之间的相似度；

根据所述相似度在所述候选推荐信息中确定与所述至少两个类目下的所述分类画像特征对应的所述召回信息。

在一个可选的设计中，所述匹配模块，用于：

对至少两个候选推荐信息集合中所述相似度最高的k个所述候选推荐信息进行去重处理以及合并处理，得到所述召回信息；

其中，所述候选推荐信息集合是根据各所述分类画像特征与所述候选信息特征之间的相似度，对所述候选推荐信息进行排序确定的。

在一个可选的设计中，所述获取模块，用于：

获取所述用户帐号的实时行为数据以及历史行为数据，所述历史行为数据的产生时间在所述实时行为数据之前；

将所述实时行为数据与所述历史行为数据进行拼接，得到所述行为数据。

在一个可选的设计中，所述特征提取模块，用于：

将所述至少两个类目下的所述分类行为数据映射至第一特征空间，得到所述至少两个类目下的分类行为向量；

将所述用户帐号的用户属性数据映射至第二特征空间，得到用户属性向量；

将所述至少两个类目下的所述分类行为向量分别与所述用户属性向量进行拼接，得到所述至少两个类目下的拼接向量；

通过机器学习模型对所述拼接向量进行特征提取，得到所述至少两个类目下的所述分类画像特征，所述机器学习模型是根据所述至少两个类目下的样本分类画像特征与样本候选推荐信息的候选信息特征之间的匹配度训练得到的。

根据本申请的另一方面，提供了一种模型训练装置，所述装置包括：

获取模块，用于获取用户帐号在至少两个类目下的分类行为数据，所述类目是根据商品分类确定的；

训练模块，用于根据所述至少两个类目下的所述分类画像特征与候选推荐信息的候选信息特征之间的匹配度，训练机器学习模型，所述匹配度用于反映所述用户帐号与所述候选信息特征对应的所述候选推荐信息产生交互的可能性。

在一个可选的设计中，所述获取模块，用于：

获取所述用户帐号的行为数据；

在一个可选的设计中，所述获取模块，用于：

在一个可选的设计中，所述用户帐号对应有匹配标签，所述匹配标签用于反映所述用户帐号与所述候选推荐信息是否产生交互；所述训练模块，用于：

确定所述分类画像特征与所述候选信息特征之间的相似度；

根据所述相似度与所述匹配标签之间的分类损失确定损失函数，所述分类损失用于反映所述相似度与所述匹配标签之间的差异；

根据所述损失函数基于反向传播训练所述机器学习模型。

在一个可选的设计中，所述训练模块，用于：

基于硬注意力机制根据所述相似度与所述匹配标签之间的所述分类损失确定所述损失函数；

其中，所述硬注意力机制用于筛选出最大的所述相似度来与所述匹配标签确定所述分类损失。

在一个可选的设计中，所述特征提取模块，用于：

通过所述机器学习模型对所述拼接向量进行特征提取，得到所述至少两个类目下的所述分类画像特征。

根据本申请的另一方面，提供了一种计算机设备，所述计算机设备包括处理器和存储器，所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如上方面所述的信息召回方法或模型训练方法。

根据本申请的另一方面，提供了一种计算机可读存储介质，所述可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如上方面所述的信息召回方法或模型训练方法。

根据本申请的另一方面，提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行上述方面的各种可选实现方式中提供的信息召回方法或模型训练方法。

本申请提供的技术方案带来的有益效果至少包括：

通过至少两个类目下的分类画像特征实现信息召回，该分类画像特征是基于用户的分类行为数据确定的，分类行为数据是用户与不同类型的商品进行交互而产生的数据，与不同类型的商品进行交互能够反映用户不同方面的兴趣，因此不同类目下的分类画像特征能够反映用户不同类型的兴趣。通过不同类目下的分类画像特征能够召回不同类型的用户感兴趣的信息，提升召回结果的准确性。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请一个示例性实施例提供的召回模型的结构示意图；

图2是本申请一个示例性实施例提供的信息召回方法的流程示意图；

图3是本申请另一个示例性实施例提供的信息召回方法的流程示意图；

图4是本申请一个示例性实施例提供的模型训练方法的流程示意图；

图5是本申请另一个示例性实施例提供的模型训练方法的流程示意图；

图6是本申请一个示例性实施例提供的信息推荐界面的示意图；

图7是本申请一个示例性实施例提供的信息召回装置的结构示意图；

图8是本申请一个示例性实施例提供的模型训练装置的结构示意图；

图9是本申请一个示例性实施例提供的服务器的结构示意图。

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本申请的实施例，并与说明书一起用于解释本申请的原理。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚，下面将结合附图对本申请实施方式作进一步地详细描述。

图1是本申请一个示例性实施例提供的召回模型的结构示意图，如图1所示，召回模型100为机器学习模型，基于神经网络(Neural Networks，NN)，用于提取用户帐号的特征来向用户帐号推荐信息。召回模型100包括用户特征提取网络101、候选信息特征提取网络102、训练网络103以及召回网络104。其中，用户特征提取网络101用于根据用户帐号的行为数据以及用户属性数据提取用户帐号在至少两个类目下的分类画像特征，该类目是根据商品分类确定的。候选信息特征提取网络102用于根据候选信息提取候选信息特征。训练网络103用于训练用户特征提取网络101以及候选信息特征提取网络102。召回网络104用于将用户帐号的分类画像特征与候选信息的候选信息特征进行匹配，从而从候选信息中确定出召回信息。

在训练阶段，服务器获取用户帐号的用户属性数据、实时行为数据以及历史行为数据，并将实时行为数据与历史行为数据拼接为行为数据。该用户帐号包括服务器中被用于进行模型训练的任一帐号。之后通过用户特征提取网络101中的分类层，基于通过候选推荐信息的内容类别确定的至少两个类目对用户帐号的行为数据进行分类，得到至少两个类目下的分类行为数据。之后服务器将用户属性数据以及分类行为数据输入用户特征提取网络101中的特征映射层(也称为embedding层)，实现将分类行为数据映射至第一特征空间得到分类行为向量，以及将用户属性数据映射至第二特征空间得到用户属性向量。之后将分类行为向量输入池化(pooling)层，通过平均池化保留分类行为向量整体的特征，以及减少模型参数。之后将各个类目下的分类行为向量分别与用户属性向量拼接，并将拼接向量输入全连接(Fully Connected，FC)层，通过全连接层实现对拼接向量进行特征提取，从而得到不同类目下的分类画像特征。之后将属于不同类目的分类画像特征输入激励层，该激励层能够通过线性整流函数(Rectified Linear Unit，ReLU)对分类画像特征进行非线性映射，提升正向传播的计算速度来提升模型收敛速度，最终确定出用户帐号在至少两个类目下的分类画像特征。在此过程中，服务器还会通过候选信息特征提取网络102提取候选推荐信息的候选信息特征，实现过程与提取分类画像特征类似。之后服务器计算分类画像特征与候选信息特征之间的相似度，并基于硬注意力机制根据该相似度与匹配标签之间的分类损失确定损失函数，进而反向传播训练用户特征提取网络101以及候选信息特征提取网络102。其中，用户帐号对应有该匹配标签，匹配标签用于反映用户帐号与候选推荐信息是否产生交互。

在召回阶段，服务器获取客户端反馈的需要进行信息推荐的待推荐的用户帐号的用户属性数据以及行为数据，并输入上述完成训练的用户特征提取网络101，从而得到至少两个类目下的分类画像特征。之后根据分类画像特征与候选信息特征之间的相似度，通过召回网络104将至少两个候选推荐信息集合中相似度最高的k个候选推荐信息确定为召回信息，从而实现信息召回。该候选推荐信息集合是根据各个分类画像特征与候选信息特征之间的相似度，对候选推荐信息进行排序确定的。并且在召回过程中，服务器还会对候选推荐信息进行去重处理以及合并处理。

通过分类画像特征实现信息召回，该分类画像特征是通过对分类行为数据进行特征提取得到的，分类行为数据是根据候选推荐信息的内容类别对用户的行为数据进行分类得到的。属于不同类别的分类行为数据能够反映用户不同类型的行为兴趣，因此分类画像特征能够反映用户不同类型的行为兴趣。通过不同类目下的分类画像特征进行信息召回能够提升召回结果的准确性。并且，通过每个分类画像特征，确定出相似度最高的k个候选推荐信息进行召回，能够实现召回各类用户感兴趣的候选推荐信息，进一步提升召回结果的准确性。

图2是本申请一个示例性实施例提供的信息召回方法的流程示意图。该方法可以用于计算机设备。如图2所示，该方法包括：

步骤202：获取待推荐的用户帐号在至少两个类目下的分类行为数据。

该类目是根据商品分类确定的。该商品分类能够是由运营人员确定的，对于负责运营不同类型商品的运营人员，能够确定出不同的商品分类。例如运营外卖服务的人员确定的商品分类能够包括美食、超市、食材、水果以及药品等。对于运营本地生活服务的人员确定的商品分类能够包括餐饮、酒店、婚庆以及旅游等。并且，对于餐饮还能够进一步分为川菜、粤菜、鲁菜等。对于运营视频和直播的人员确定的商品分类能够包括游戏、数码产品、美食、影视介绍以及娱乐等。该商品分类还能够是根据计算机设备中存储的，用于推荐给用户的信息的分类确定的。例如计算机设备中存储有推荐给用户的本地生活服务的信息，则计算机设备确定的商品分类能够包括餐饮、酒店、婚庆以及旅游等。

该待推荐的用户帐号为计算机设备中任一需要进行信息推荐的帐号。可选地，该计算机设备为服务器，该服务器为一台服务器，或者由若干台服务器组成的服务器集群，或者是一个云计算服务中心中的虚拟服务器等。当服务器对应的客户端向服务器发送信息推荐请求时，服务器会获取该分类行为数据。例如当客户端需要显示的界面中包括推荐信息时，会向服务器发送该信息推荐请求。可选地，计算机设备还会获取待推荐的用户帐号的用户属性数据。

可选地，该分类行为数据是通过对待推荐的用户帐号的行为数据进行分类得到的。用户帐号的行为数据是用户帐号与某一商品分类下的信息进行交互(点击、搜索、浏览等)从而生成的，因此通过基于商品分类确定的类目，能够实现对行为数据按照其交互的信息的商品分类进行分类。计算机设备根据类目对用户帐号的行为数据进行分类，从而得到分类行为数据。该行为数据包括待推荐的用户帐号的点击、搜索、浏览等行为产生的数据，具体能够包括与用户帐号产生上述交互的信息的标识。用户属性数据包括待推荐的用户帐号的基本信息(年龄、性别和所在地等)以及访问服务器时的位置和时间等。

步骤204：对至少两个类目下的分类行为数据进行特征提取，得到用户帐号在至少两个类目下的分类画像特征。

计算机设备通过机器学习模型对分类行为数据进行特征提取，从而得到至少两个类目下的分类画像特征。每个类目下的分类行为数据中的一个，能够提取出该类目下的一个分类画像特征。该机器学习模型是根据至少两个类目下的样本分类画像特征与样本候选推荐信息的候选信息特征之间的匹配度训练得到的。该机器学习模型基于神经网络，例如该机器学习模型为图1中所示的模型。

步骤206：将至少两个类目下的分类画像特征与候选推荐信息的候选信息特征进行匹配，得到候选推荐信息中的召回信息。

该候选推荐信息是计算机设备中存储的，用于向用户进行推荐的信息。例如包括餐饮信息、酒店信息、婚庆信息、旅游信息以及视频信息等。计算机设备通过计算分类画像特征与候选信息特征之间的相似度(例如余弦相似度)，从而能够根据相似度筛选出候选信息中的召回信息。并且，为了保证不同类别的候选推荐信息都能够被召回，计算机设备还能够根据分类画像特征与候选推荐信息之间的相似度，将与各个分类画像特征相似度最高的k个候选推荐信息确定为召回信息。

综上所述，本实施例提供的方法，通过分类画像特征实现信息召回，该分类画像特征是通过对分类行为数据进行特征提取得到的。分类行为数据是用户与不同类型的商品进行交互而产生的数据，与不同类型的商品进行交互能够反映用户不同方面的兴趣，因此不同类目下的分类画像特征能够反映用户不同类型的兴趣。通过不同类目下的分类画像特征能够召回不同类型的用户感兴趣的信息，提升召回结果的准确性。

图3是本申请另一个示例性实施例提供的信息召回方法的流程示意图。该方法可以用于计算机设备。如图3所示，该方法包括：

步骤302：获取待推荐的用户帐号的行为数据。

该类目是根据商品分类确定的。该商品分类能够是由运营人员确定的，还能够是根据计算机设备中存储的，用于推荐给用户的信息的分类确定的。该待推荐的用户帐号为计算机设备中任一需要进行信息推荐的帐号。该行为数据也可称为行为序列，包括用户帐号的点击、搜索、浏览等行为产生的数据。可选地，计算机设备通过获取待推荐的用户帐号的实时行为数据以及历史行为数据，并将实时行为数据与历史行为数据进行拼接，从而得到行为数据。该历史行为数据的产生时间在实时行为数据之前。

步骤304：根据至少两个类目对待推荐的用户帐号的行为数据进行聚类，得到至少两个类目下的分类行为数据。

可选地，该类目是根据候选推荐信息的内容类别确定的，该候选推荐信息被用于推荐给待推荐的用户帐号。可选地，计算机设备能够根据该类目对行为数据进行软聚类，从而确定出各行为数据属于某一类目的概率。或者，计算机设备根据至少两个类目对行为数据进行硬聚类，得到至少两个类目下的分类行为数据。其中，硬聚类用于确定行为数据唯一所属的类目，即在硬聚类下，每个行为数据只属于某一个类目。

步骤306：通过机器学习模型对待推荐的用户帐号的至少两个类目下的分类行为数据进行特征提取，得到待推荐的用户帐号在至少两个类目下的分类画像特征。

计算机设备能够将至少两个类目下的分类行为数据映射至第一特征空间，得到至少两个类目下的分类行为向量。并将用户帐号的用户属性数据映射至第二特征空间，得到用户属性向量。之后计算机设备将至少两个类目下的分类行为向量分别与用户属性向量进行拼接，得到至少两个类目下的拼接向量。之后通过机器学习模型对拼接向量进行特征提取，从而得到至少两个类目下的分类画像特征。该机器学习模型是根据至少两个类目下的样本分类画像特征与样本候选推荐信息的候选信息特征之间的匹配度训练得到的。

示例地，计算机设备通过如图1所示的召回模型100的用户特征提取网络101中的特征映射层，得到该分类行为向量以及用户属性向量。之后通过召回模型100的用户特征提取网络101中的全连接层，能够输入拼接向量从而得到分类画像特征。

步骤308：将待推荐的用户帐号的至少两个类目下的分类画像特征与候选推荐信息的候选信息特征进行匹配，得到候选推荐信息中的召回信息。

在召回信息的过程中，计算机设备会确定至少两个类目下的分类画像特征与候选信息特征之间的相似度(例如余弦相似度)，之后根据相似度在候选推荐信息中确定与至少两个类目下的分类画像特征对应的召回信息。例如选择相似度最高的n个候选推荐信息作为召回信息。可选地，计算机设备会存储训练机器学习模型时提取的候选信息特征，避免在召回信息时再次提取。计算机设备能够通过如图1所示的召回模型中的召回网络104实现召回信息。

可选地，在根据相似度确定召回信息时，计算机设备能够对至少两个候选推荐信息集合中相似度最高的k个候选推荐信息进行去重处理以及合并处理，从而得到召回信息。其中，候选推荐信息集合是根据各分类画像特征与候选信息特征之间的相似度，对候选推荐信息进行排序确定的。即针对每个分类画像特征，计算机设备会根据其与候选推荐信息的相似度对候选推荐信息进行排序，选择部分候选推荐信息从而为其生成一个候选推荐信息集合。之后再对每个候选推荐信息集合中的候选推荐信息进行去重处理和合并处理，再将排序前k个的候选推荐信息进行截断，从而确定出召回信息。也即是计算机设备根据每个分类画像特征都能够召回部分候选推荐信息。

另外，根据候选推荐信息的内容类别确定类目，来对用户帐号的行为数据分类。能够保证分类行为数据的分类与候选推荐信息的分类保持一致，提升匹配时的准确性。通过硬聚类进行分类，能够避免聚类中心不稳定导致最终生成的分类画像特征不稳定。通过确定候选推荐信息集合以及基于候选推荐信息集合中前k个候选推荐信息来确定召回信息，能够基于不同的分类画像特征召回不同类型的用户可能感兴趣的信息，避免召回的信息的类别单一。通过拼接实时行为数据和历史行为数据，以及拼接分类行为向量和用户属性向量，能够使提取的分类画像特征更准确。由于对用户行为数据进行分类，因此能够减少分类画像特征的长度，在信息推荐的推荐阶段能够支持使用更复杂的排序算法来处理分类画像特征。

图4是本申请一个示例性实施例提供的模型训练方法的流程示意图。该方法可以用于计算机设备。如图4所示，该方法包括：

步骤402：获取用户帐号在至少两个类目下的分类行为数据。

该类目是根据商品分类确定的。该商品分类能够是由运营人员确定的，还能够是根据计算机设备中存储的，用于推荐给用户的信息的分类确定的。示例地，该商品分类能够包括餐饮、酒店、婚庆以及旅游等。对于餐饮，还能够进一步分为川菜、粤菜、鲁菜等。

该用户帐号包括计算机设备中，任一被用于进行模型训练的帐号。例如计算机设备为服务器，该用户帐号包括登录服务器对应的客户端的全部帐号。可选地，该分类行为数据是通过对用户帐号的行为数据进行分类得到的。用户帐号的行为数据是用户帐号与某一商品分类下的信息进行交互(点击、搜索、浏览等)从而生成的，因此通过基于商品分类确定的类目，能够实现对行为数据按照其交互的信息的商品分类进行分类。计算机设备根据类目对用户帐号的行为数据进行分类，从而得到分类行为数据。该行为数据包括用户帐号的点击、搜索、浏览等行为产生的数据，具体能够包括与用户帐号产生上述交互的信息的标识。

可选地，计算机设备还会获取用户帐号的用户属性数据，用户属性数据包括用户帐号的基本信息(年龄、性别和所在地等)以及访问服务器时的位置和时间等。

步骤404：对至少两个类目下的分类行为数据进行特征提取，得到用户帐号在至少两个类目下的分类画像特征。

计算机设备通过机器学习模型对分类行为数据进行特征提取，从而得到至少两个类目下的分类画像特征。每个类目下的分类行为数据中的一个，能够提取出该类目下的一个分类画像特征。该机器学习模型基于神经网络，能够为图1中所示的模型。

步骤406：根据至少两个类目下的分类画像特征与候选推荐信息的候选信息特征之间的匹配度，训练机器学习模型。

该匹配度用于反映用户帐号与候选信息特征对应的候选推荐信息产生交互的可能性，即能够反映登录用户帐号的用户对候选推荐信息进行点击、搜索、浏览等行为的可能性。该候选推荐信息是计算机设备中存储的，用于向用户进行推荐的信息。例如包括餐饮信息、酒店信息、婚庆信息、旅游信息以及视频信息等。

可选地，用户帐号对应有匹配标签，该匹配标签用于反映用户帐号与候选推荐信息是否产生交互。计算机设备根据匹配度与匹配标签之间的分类损失能够确定损失函数，通过该损失函数通过反向传播能够训练该机器学习模型。分类损失用于反映匹配度与匹配标签之间的差异。

综上所述，本实施例提供的方法，通过分类画像特征与候选信息特征之间的匹配度训练机器学习模型，能够使得该机器学习模型能够准确提取分类画像特征。该分类画像特征是通过对分类行为数据进行特征提取得到的。分类行为数据是用户与不同类型的商品进行交互而产生的数据，与不同类型的商品进行交互能够反映用户不同方面的兴趣，因此不同类目下的分类画像特征能够反映用户不同类型的兴趣。通过训练的机器学习模型提取不同类目下的分类画像特征能够召回不同类型的用户感兴趣的信息，提升召回结果的准确性。

图5是本申请另一个示例性实施例提供的模型训练方法的流程示意图。该方法可以用于计算机设备。如图5所示，该方法包括：

步骤502：获取用户帐号的行为数据。

类目是根据商品分类确定的。该商品分类能够是由运营人员确定的，还能够是根据计算机设备中存储的，用于推荐给用户的信息的分类确定的。该用户帐号包括计算机设备中，任一被用于进行模型训练的帐号。例如计算机设备为服务器，该用户帐号包括登录服务器对应的客户端的全部帐号。

该行为数据也可称为行为序列，包括用户帐号的点击、搜索、浏览等行为产生的数据，具体能够包括与用户帐号产生上述交互的，计算机设备中存储的候选推荐信息的标识。该候选推荐信息被用于推荐给用户帐号进行查阅。

可选地，计算机设备在获取行为数据时，能够获取用户帐号的实时行为数据以及历史行为数据。并将实时行为数据与历史行为数据进行拼接，得到该行为数据。该历史行为数据的产生时间在实时行为数据之前。例如历史行为数据包括2天以前的数据，实时行为数据为昨天的数据。

步骤504：根据至少两个类目对行为数据进行聚类，得到至少两个类目下的分类行为数据。

可选地，该类目是根据候选推荐信息的内容类别确定的。示例地，候选推荐信息包括餐饮商品的信息、酒店商品的信息、婚庆商品的信息以及旅游商品的信息，则类目包括餐饮、酒店、婚庆以及旅游。

可选地，计算机设备能够根据该类目对行为数据进行软聚类，从而确定出各行为数据属于某一类目的概率。或者，计算机设备根据该至少两个类目对行为数据进行硬聚类，得到至少两个类目下的分类行为数据。其中，硬聚类用于确定行为数据唯一所属的类目，即在硬聚类下，每个行为数据只属于某一个类目。可选地，计算机设备根据与行为数据反映的与用户帐号交互的候选推荐信息的标识，确定候选推荐信息对应的类目，从而确定行为数据所属的类目。

步骤506：通过机器学习模型对至少两个类目下的分类行为数据进行特征提取，得到用户帐号在至少两个类目下的分类画像特征。

计算机设备能够将至少两个类目下的分类行为数据映射至第一特征空间，得到至少两个类目下的分类行为向量。并将用户帐号的用户属性数据映射至第二特征空间，得到用户属性向量。例如，计算机设备通过如图1所示的召回模型100的用户特征提取网络101中的特征映射层，得到该分类行为向量以及用户属性向量。该用户属性数据包括用户帐号的基本信息(年龄、性别和所在地等)以及访问服务器时的位置和时间等。

之后计算机设备将至少两个类目下的分类行为向量分别与用户属性向量进行拼接，得到至少两个类目下的拼接向量。例如此时存在3个分类行为向量，则计算机设备将分类行为向量与用户属性向量拼接后，会得到3个拼接向量。拼接向量包括分类行为向量反映的特征以及用户属性向量反映的特征，能够更准确的反映用户帐号的特征。计算机设备再通过机器学习模型对拼接向量进行特征提取，从而得到至少两个类目下的分类画像特征。该分类画像特征能够反映用户帐号在分类画像特征对应的类目下的行为特征。可选地，该机器学习模型能够为如图1所示的召回模型100，计算机设备通过召回模型100的用户特征提取网络101中的全连接层，能够输入拼接向量得到分类画像特征。

步骤508：根据至少两个类目下的分类画像特征与候选推荐信息的候选信息特征之间的匹配度，训练机器学习模型。

该匹配度用于反映用户帐号与候选信息特征对应的候选推荐信息产生交互的可能性，即登录用户帐号的用户对候选信息特征对应的候选推荐信息感兴趣的可能性。该候选推荐信息的候选信息特征是计算机设备对候选推荐信息进行特征提取得到的。候选推荐信息包括候选推荐信息的提供方(例如商家)的信息，还能够包括价格信息、位置信息、序号信息等。可选地，计算机设备通过机器学习模型提取候选信息特征，例如通过如图1所示的召回模型100的候选信息特征提取网络102来提取候选信息特征。

可选地，用户帐号对应有匹配标签，该匹配标签用于反映用户帐号与候选推荐信息是否产生交互。服务器中存储的该候选推荐信息，用于供用户帐号查阅，因此对于每一个用户帐号，可能已经与候选推荐信息中的某些产生交互。计算机设备会确定分类画像特征与候选信息特征之间的相似度，并根据相似度与匹配标签之间的分类损失确定损失函数，之后根据损失函数基于反向传播训练机器学习模型。该相似度能够为余弦相似度。该分类损失用于反映相似度与匹配标签之间的差异。例如匹配标签反映用户帐号与某一候选推荐信息未交互，则该用户帐号的分类画像特征与该候选推荐信息的相似度越高，分类损失越大，相似度越低，分类损失越小。可选地，该损失函数为铰链损失函数(Hinge Loss)。

在计算机设备确定损失函数时，还能够基于硬注意力机制根据相似度与匹配标签之间的分类损失确定损失函数。其中，该硬注意力机制用于筛选出最大的相似度来与匹配标签确定分类损失。即在确定损失函数的过程中，计算机设备只使用最大的相似度与匹配标签来确定分类损失，进而确定损失函数。

需要说明的是，由于计算机设备中的用户帐号、用户帐号的行为数据、候选推荐信息可能会频繁产生变化，为保证召回结果的准确性，计算机设备会定期通过上述方式采用最新的数据来再次训练机器学习模型。再次训练的时机能够是由计算机设备的管理人员确定的。

需要说明的是，上述通过步骤502-508训练得到的机器学习模型，能够应用于步骤302-308中提供的方法，通过该完成训练的机器学习模型来从候选推荐信息中确定召回信息。

在一个具体的例子中，图6是本申请一个示例性实施例提供的信息推荐界面的示意图。如图6所示，用户通过服务器对应的客户端打开信息推荐界面601时，客户端会向服务器发送信息推荐请求，信息推荐请求携带有用户的用户帐号的标识。服务器根据用户帐号的标识，获取用户帐号的行为数据，从而提取到不同类目下的分类画像特征。将分类画像特征与候选信息特征进行匹配，并针对每个分类画像特征都召回候选推荐信息，之后再通过排序算法对召回的候选推荐信息进行排序，并发送至客户端。该信息推荐界面601包括商品类目筛选按钮602，该商品类目与对用户帐号的行为数据进行分类的类目相同。客户端在接收到候选推荐信息后，会在信息推荐界面601显示完成排序的候选推荐信息603。

综上所述，本实施例提供的方法，通过分类画像特征实现信息召回，该分类画像特征是通过对分类行为数据进行特征提取得到的。分类行为数据是用户与不同类型的商品进行交互而产生的数据，与不同类型的商品进行交互能够反映用户不同方面的兴趣，因此不同类目下的分类画像特征能够反映用户不同类型的兴趣。通过训练的机器学习模型提取不同类目下的分类画像特征能够召回不同类型的用户感兴趣的信息，提升召回结果的准确性。

另外，根据候选推荐信息的内容类别确定类目，来对用户帐号的行为数据分类。能够保证分类行为数据的分类与候选推荐信息的分类保持一致，提升匹配时的准确性。通过硬聚类进行分类，能够避免聚类中心不稳定导致最终生成的分类画像特征不稳定。通过拼接实时行为数据和历史行为数据，以及拼接分类行为向量和用户属性向量，能够使提取的分类画像特征更准确。基于硬注意力机制来训练模型，能够提升模型训练的效率，使模型快速收敛。由于对用户行为数据进行分类，因此能够减少分类画像特征的长度，在信息推荐的推荐阶段能够支持使用更复杂的排序算法来处理分类画像特征。

需要说明的是，本申请实施例提供的方法步骤的先后顺序可以进行适当调整，步骤也可以根据情况进行相应增减，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到变化的方法，都应涵盖在本申请的保护范围之内，因此不再赘述。

图7是本申请一个示例性实施例提供的信息召回装置的结构示意图。该装置可以用于计算机设备。如图7所示，该装置70包括：

获取模块701，用于获取待推荐的用户帐号在至少两个类目下的分类行为数据，类目是根据商品分类确定的。

特征提取模块702，用于对至少两个类目下的分类行为数据进行特征提取，得到用户帐号在至少两个类目下的分类画像特征。

匹配模块703，用于将至少两个类目下的分类画像特征与候选推荐信息的候选信息特征进行匹配，得到候选推荐信息中的召回信息。

在一个可选的设计中，获取模块701，用于：

获取待推荐的用户帐号的行为数据。根据至少两个类目对行为数据进行聚类，得到至少两个类目下的分类行为数据，类目是根据候选推荐信息的内容类别确定的。

在一个可选的设计中，获取模块701，用于：

根据至少两个类目对行为数据进行硬聚类，得到至少两个类目下的分类行为数据。其中，硬聚类用于确定行为数据唯一所属的类目。

在一个可选的设计中，匹配模块703，用于：

确定至少两个类目下的分类画像特征与候选信息特征之间的相似度。根据相似度在候选推荐信息中确定与至少两个类目下的分类画像特征对应的召回信息。

在一个可选的设计中，匹配模块703，用于：

对至少两个候选推荐信息集合中相似度最高的k个候选推荐信息进行去重处理以及合并处理，得到召回信息。其中，候选推荐信息集合是根据各分类画像特征与候选信息特征之间的相似度，对候选推荐信息进行排序确定的。

在一个可选的设计中，获取模块701，用于：

获取用户帐号的实时行为数据以及历史行为数据，历史行为数据的产生时间在实时行为数据之前。将实时行为数据与历史行为数据进行拼接，得到行为数据。

在一个可选的设计中，特征提取模块702，用于：

将至少两个类目下的分类行为数据映射至第一特征空间，得到至少两个类目下的分类行为向量。将用户帐号的用户属性数据映射至第二特征空间，得到用户属性向量。将至少两个类目下的分类行为向量分别与用户属性向量进行拼接，得到至少两个类目下的拼接向量。通过机器学习模型对拼接向量进行特征提取，得到至少两个类目下的分类画像特征，机器学习模型是根据至少两个类目下的样本分类画像特征与样本候选推荐信息的候选信息特征之间的匹配度训练得到的。

图8是本申请一个示例性实施例提供的模型训练装置的结构示意图。该装置可以用于计算机设备。如图8所示，该装置80包括：

获取模块801，用于获取用户帐号在至少两个类目下的分类行为数据，类目是根据商品分类确定的。

特征提取模块802，用于对至少两个类目下的分类行为数据进行特征提取，得到用户帐号在至少两个类目下的分类画像特征。

训练模块803，用于根据至少两个类目下的分类画像特征与候选推荐信息的候选信息特征之间的匹配度，训练机器学习模型，匹配度用于反映用户帐号与候选信息特征对应的候选推荐信息产生交互的可能性。

在一个可选的设计中，获取模块801，用于：

获取用户帐号的行为数据。根据至少两个类目对行为数据进行聚类，得到至少两个类目下的分类行为数据，类目是根据候选推荐信息的内容类别确定的。

在一个可选的设计中，获取模块801，用于：

在一个可选的设计中，用户帐号对应有匹配标签，匹配标签用于反映用户帐号与候选推荐信息是否产生交互。训练模块803，用于：

确定分类画像特征与候选信息特征之间的相似度。根据相似度与匹配标签之间的分类损失确定损失函数，分类损失用于反映相似度与匹配标签之间的差异。根据损失函数基于反向传播训练机器学习模型。

在一个可选的设计中，训练模块803，用于：

基于硬注意力机制根据相似度与匹配标签之间的分类损失确定损失函数。其中，硬注意力机制用于筛选出最大的相似度来与匹配标签确定分类损失。

在一个可选的设计中，特征提取模块802，用于：

将至少两个类目下的分类行为数据映射至第一特征空间，得到至少两个类目下的分类行为向量。将用户帐号的用户属性数据映射至第二特征空间，得到用户属性向量。将至少两个类目下的分类行为向量分别与用户属性向量进行拼接，得到至少两个类目下的拼接向量。通过机器学习模型对拼接向量进行特征提取，得到至少两个类目下的分类画像特征。

需要说明的是：上述实施例提供的信息召回装置，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将设备的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的信息召回装置与信息召回方法实施例属于同一构思，其具体实现过程详见方法实施例，这里不再赘述。

同理，上述实施例提供的模型训练装置，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将设备的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的模型训练装置与模型训练方法实施例属于同一构思，其具体实现过程详见方法实施例，这里不再赘述。

本申请的实施例还提供了一种计算机设备，该计算机设备包括：处理器和存储器，存储器中存储有至少一条指令、至少一段程序、代码集或指令集，至少一条指令、至少一段程序、代码集或指令集由处理器加载并执行以实现上述各方法实施例提供的信息召回方法或模型训练方法。

可选地，该计算机设备为服务器。示例地，图9是本申请一个示例性实施例提供的服务器的结构示意图。

所述服务器900包括中央处理单元(Central Processing Unit，CPU)901、包括随机存取存储器(Random Access Memory，RAM)902和只读存储器(Read-Only Memory，ROM)903的系统存储器904，以及连接系统存储器904和中央处理单元901的系统总线905。所述计算机设备900还包括帮助计算机设备内的各个器件之间传输信息的基本输入/输出系统(Input/Output系统，I/O系统)906，和用于存储操作系统913、应用程序914和其他程序模块915的大容量存储设备907。

所述基本输入/输出系统906包括有用于显示信息的显示器908和用于用户输入信息的诸如鼠标、键盘之类的输入设备909。其中所述显示器908和输入设备909都通过连接到系统总线905的输入输出控制器910连接到中央处理单元901。所述基本输入/输出系统906还可以包括输入输出控制器910以用于接收和处理来自键盘、鼠标、或电子触控笔等多个其他设备的输入。类似地，输入输出控制器910还提供输出到显示屏、打印机或其他类型的输出设备。

所述大容量存储设备907通过连接到系统总线905的大容量存储控制器(未示出)连接到中央处理单元901。所述大容量存储设备907及其相关联的计算机可读存储介质为服务器900提供非易失性存储。也就是说，所述大容量存储设备907可以包括诸如硬盘或者只读光盘(Compact Disc Read-Only Memory，CD-ROM)驱动器之类的计算机可读存储介质(未示出)。

不失一般性，所述计算机可读存储介质可以包括计算机存储介质和通信介质。计算机存储介质包括以用于存储诸如计算机可读存储指令、数据结构、程序模块或其他数据等信息的任何方法或技术实现的易失性和非易失性、可移动和不可移动介质。计算机存储介质包括RAM、ROM、可擦除可编程只读寄存器(Erasable Programmable Read OnlyMemory，EPROM)、电子抹除式可复写只读存储器(Electrically-Erasable ProgrammableRead-Only Memory，EEPROM)、闪存或其他固态存储设备，CD-ROM、数字多功能光盘(DigitalVersatile Disc，DVD)或其他光学存储、磁带盒、磁带、磁盘存储或其他磁性存储设备。当然，本领域技术人员可知所述计算机存储介质不局限于上述几种。上述的系统存储器904和大容量存储设备907可以统称为存储器。

存储器存储有一个或多个程序，一个或多个程序被配置成由一个或多个中央处理单元901执行，一个或多个程序包含用于实现上述方法实施例的指令，中央处理单元901执行该一个或多个程序实现上述各个方法实施例提供的方法。

根据本申请的各种实施例，所述服务器900还可以通过诸如因特网等网络连接到网络上的远程服务器运行。也即服务器900可以通过连接在所述系统总线905上的网络接口单元911连接到网络912，或者说，也可以使用网络接口单元911来连接到其他类型的网络或远程服务器系统(未示出)。

所述存储器还包括一个或者一个以上的程序，所述一个或者一个以上程序存储于存储器中，所述一个或者一个以上程序包含用于进行本申请实施例提供的方法中由服务器所执行的步骤。

本申请实施例中还提供了一种计算机可读存储介质，该可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集，当该至少一条指令、至少一段程序、代码集或指令集由计算机设备的处理器加载并执行时，实现上述各方法实施例提供的信息召回方法或模型训练方法。

本申请还提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行上述各方法实施例提供的信息召回方法或模型训练方法。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，该程序可以存储于一种计算机可读存储介质中，上述提到的可读存储介质可以是只读存储器，磁盘或光盘等。

以上所述仅为本申请的可选实施例，并不用以限制本申请，凡在本申请的精神和原则之内，所作的任何修改、等同切换、改进等，均应包含在本申请的保护范围之内。

Claims

1.一种信息召回方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述获取待推荐的用户帐号在至少两个类目下的分类行为数据，包括：

获取待推荐的所述用户帐号的行为数据；

3.根据权利要求2所述的方法，其特征在于，所述根据所述至少两个类目对所述行为数据进行聚类，得到所述至少两个类目下的所述分类行为数据，包括：

4.根据权利要求1至3任一所述的方法，其特征在于，所述将所述至少两个类目下的所述分类画像特征与候选推荐信息的候选信息特征进行匹配，得到所述候选推荐信息中的召回信息，包括：

5.根据权利要求4所述的方法，其特征在于，所述根据所述相似度在所述候选推荐信息中确定与所述至少两个类目下的所述分类画像特征对应的所述召回信息，包括：

6.根据权利要求2或3所述的方法，其特征在于，所述获取待推荐的所述用户帐号的行为数据，包括：

7.根据权利要求1至3任一所述的方法，其特征在于，所述对所述至少两个类目下的分类行为数据进行特征提取，得到所述用户帐号在所述至少两个类目下的分类画像特征，包括：

8.一种模型训练方法，其特征在于，所述方法包括：

9.根据权利要求8所述的方法，其特征在于，所述获取用户帐号在至少两个类目下的分类行为数据，包括：

获取所述用户帐号的行为数据；

10.根据权利要求9所述的方法，其特征在于，所述根据所述至少两个类目对所述行为数据进行聚类，得到所述至少两个类目下的所述分类行为数据，包括：

11.根据权利要求9所述的方法，其特征在于，所述获取所述用户帐号的行为数据，包括：

12.根据权利要求8至11任一所述的方法，其特征在于，所述用户帐号对应有匹配标签，所述匹配标签用于反映所述用户帐号与所述候选推荐信息是否产生交互；

所述根据所述至少两个类目下的所述分类画像特征与候选推荐信息的候选信息特征之间的匹配度，训练机器学习模型，包括：

确定所述分类画像特征与所述候选信息特征之间的相似度；

根据所述损失函数基于反向传播训练所述机器学习模型。

13.根据权利要求12所述的方法，其特征在于，所述根据所述相似度与所述匹配标签之间的分类损失确定损失函数，包括：

14.根据权利要求8至11任一所述的方法，其特征在于，所述对所述至少两个类目下的分类行为数据进行特征提取，得到所述用户帐号在所述至少两个类目下的分类画像特征，包括：

15.一种信息召回装置，其特征在于，所述装置包括：

16.一种模型训练装置，其特征在于，所述装置包括：

17.一种计算机设备，其特征在于，所述计算机设备包括处理器和存储器，所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或所述指令集由所述处理器加载并执行以实现如权利要求1至7任一所述的信息召回方法，或权利要求8至14任一所述的模型训练方法。

18.一种计算机可读存储介质，其特征在于，所述可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如权利要求1至7任一所述的信息召回方法，或权利要求8至14任一所述的模型训练方法。