CN111737584B

CN111737584B - 行为预测系统的更新方法及装置

Info

Publication number: CN111737584B
Application number: CN202010762440.6A
Authority: CN
Inventors: 程晓程; 曹绍升; 申月; 刘子奇; 李强; 张志强
Original assignee: Alipay Hangzhou Information Technology Co Ltd
Current assignee: Alipay Hangzhou Information Technology Co Ltd
Priority date: 2020-07-31
Filing date: 2020-07-31
Publication date: 2020-12-08
Anticipated expiration: 2040-07-31
Also published as: CN111737584A

Abstract

本说明书实施例提供一种行为预测系统的更新方法，其中行为预测系统包括多个推荐领域各自对应的对象表征模型、领域用户表征模型和行为预测模型，还包括通用用户表征模型和领域判别模型。该方法包括：首先，获取与该多个推荐领域对应的多个训练样本，其中各个训练样本包括推荐对象的对象特征、用户的用户特征，以及指示该用户是否对该第一推荐对象做出特定行为的样本标签；接着，利用行为预测系统对多个训练样本进行处理，从而得到对应的多个行为预测损失和多个领域判别损失，进而确定综合损失，该综合损失与该多个行为预测损失分别正相关，且与该多个领域判别损失分别负相关；然后，利用综合训练损失，调整该行为预测系统中各个模型的模型参数。

Description

行为预测系统的更新方法及装置

技术领域

本说明书实施例涉及计算机技术领域，尤其涉及一种行为预测系统的更新方法及装置。

背景技术

当今，人们越来越频繁地使用服务平台向用户提供的多种多样的服务，相应地，为了提高用户的服务体验，服务平台可以利用机器学习模型对用户在使用服务时的相关行为进行预测，进而根据预测结果为用户定制服务方案。例如，新闻资讯网站可以通过预测某用户针对各类新闻板块的点击概率，确定向该用户推送的新闻资讯页面中所包括新闻板块的类别和排序。又例如，购物网站可以通过预测某用户针对某一商品的喜好程度，确定是否向该用户推荐该商品。

显然，希望针对用户行为的预测结果越准确越好。然而，目前预测用户行为的方式较为单一，得到的预测结果准确度也十分有限。因此，需要提出一种合理的方案，可以有效提高用户行为预测结果的准确性。

发明内容

在本说明书描述的行为预测系统的更新方法及装置中，基于新设计的行为预测系统，引入丰富、全面的相关数据作为系统输入，从而有效提高预测结果的准确性。

第一方面，提供一种行为预测系统的更新方法，所述行为预测系统包括多个推荐领域各自对应的对象表征模型、领域用户表征模型和行为预测模型，还包括通用用户表征模型和领域判别模型；所述方法包括：

获取与所述多个推荐领域对应的多个训练样本，其中任意的第一训练样本中包括第一推荐领域中第一推荐对象的对象特征、第一用户的用户特征，以及第一样本标签，该第一样本标签指示该第一用户是否对该第一推荐对象做出特定行为；所述第一推荐领域对应第一对象表征模型、第一领域用户表征模型和第一行为预测模型。针对所述第一训练样本，将所述对象特征输入所述第一对象表征模型中，得到第一对象表征向量，并且，将所述用户特征输入所述第一领域用户表征模型中，得到第一领域用户表征向量。将所述第一领域用户表征向量输入所述通用用户表征模型中，得到第一通用用户表征向量，进而与所述第一对象表征向量进行融合，得到第一融合向量。将所述第一融合向量输入所述第一行为预测模型中，得到第一行为预测结果，进而结合所述第一样本标签，确定第一行为预测损失。将所述第一通用用户表征向量输入所述领域判别模型中，得到第一领域判别结果，进而基于所述第一推荐领域的领域标识，确定第一领域判别损失。基于确定出的对应于所述多个训练样本的多个行为预测损失和多个领域判别损失，确定综合训练损失，其与所述多个行为预测损失分别正相关，且与所述多个领域判别损失分别负相关。利用综合训练损失，调整所述行为预测系统中各个模型的模型参数。

在一个实施例中，所述多个推荐领域包括以下中的至少一个领域：商品推荐领域、服务推荐领域、内容推荐领域。

在一个实施例中，所述对象特征包括所述第一推荐对象的对象标识，所述第一对象表征模型包括第一嵌入层；其中，将所述对象特征输入所述第一对象表征模型中，得到第一对象表征向量，包括：对所述对象标识进行独热编码，得到独热编码向量；在所述第一嵌入层中，利用嵌入矩阵对所述独热编码向量进行嵌入处理，得到对象嵌入向量，作为所述第一对象表征向量。

在一个实施例中，所述第一推荐对象为第一图片，所述对象特征包括图片像素、图片中的文字内容；或者，所述第一推荐对象为第一文本，所述对象特征包括文本关键词、文本字符数；或者，所述第一推荐对象为第一商品，所述对象特征包括商品类别、商品价格、商品产地。

在一个实施例中，所述第一领域用户表征模型为第一图神经网络；其中，将所述用户特征输入所述第一领域用户表征模型中，得到第一领域用户表征向量，包括：获取预先构建的用户关系图谱，其中包括对应于多个用户的用户节点，以及用户节点之间存在关联关系时形成的连接边；将所述用户特征输入所述第一图神经网络，以使得所述第一图神经网络基于所述用户关系图谱，在所述用户特征的基础上对所述第一用户的邻居节点进行特征聚合，得到所述第一领域用户表征向量。

在一个实施例中，所述用户特征包括所述用户基础信息和/或历史网络操作数据；所述用户基础信息包括以下中的至少一项：性别、年龄、职业、地址、兴趣爱好，所述历史网络操作数据包括以下中的至少一项：操作对象、操作次数、操作时长、操作地点、操作时间段。

在一个实施例中，所述特定行为包括点击行为、浏览达到预设时长的行为、注册行为、登录行为、购买行为和关注行为。

根据第二方面，提供一种行为预测系统的更新装置，所述行为预测系统包括多个推荐领域各自对应的对象表征模型、领域用户表征模型和行为预测模型，还包括通用用户表征模型和领域判别模型；所述装置包括：

样本获取单元，配置为获取与所述多个推荐领域对应的多个训练样本，其中任意的第一训练样本中包括第一推荐领域中第一推荐对象的对象特征、第一用户的用户特征，以及第一样本标签，该第一样本标签指示该第一用户是否对该第一推荐对象做出特定行为；所述第一推荐领域对应第一对象表征模型、第一领域用户表征模型和第一行为预测模型。对象表征单元，配置为针对所述第一训练样本，将所述对象特征输入所述第一对象表征模型中，得到第一对象表征向量。领域用户表征单元，配置为将所述用户特征输入所述第一领域用户表征模型中，得到第一领域用户表征向量。通用用户表征单元，配置为将所述第一领域用户表征向量输入所述通用用户表征模型中，得到第一通用用户表征向量。向量融合单元，配置为将所述第一通用用户表征向量与所述第一对象表征向量进行融合，得到第一融合向量。行为损失确定单元，配置为将所述第一融合向量输入所述第一行为预测模型中，得到第一行为预测结果，进而结合所述第一样本标签，确定第一行为预测损失。领域损失确定单元，配置为将所述第一通用用户表征向量输入所述领域判别模型中，得到第一领域判别结果，进而基于所述第一推荐领域的领域标识，确定第一领域判别损失。综合损失确定单元，配置为基于确定出的对应于所述多个训练样本的多个行为预测损失和多个领域判别损失，确定综合训练损失，其与所述多个行为预测损失分别正相关，且与所述多个领域判别损失分别负相关。系统更新单元，配置为利用综合训练损失，调整所述行为预测系统中各个模型的模型参数。

根据第三方面，提供了一种计算机可读存储介质，其上存储有计算机程序，当所述计算机程序在计算机中执行时，令计算机执行第一方面所描述的方法。

根据第四方面，提供了一种计算设备，包括存储器和处理器，其特征在于，所述存储器中存储有可执行代码，所述处理器执行所述可执行代码时，实现第一方面所描述的方法。

在本说明书实施例披露的行为预测系统的更新方法中，通过采用新设计的行为预测系统，实现多个推荐领域的数据共用，从而提高其中各个推荐领域的推荐结果的精准度，进而有效提高用户体验。

附图说明

为了更清楚地说明本说明书披露的多个实施例的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本说明书披露的多个实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它的附图。

图1示出根据一个实施例的行为预测系统的更新方法的实施架构示意图；

图2示出本说明书实施例披露的行为预测系统的更新方法流程图；

图3示出本说明书实施例披露的行为预测系统的更新装置结构图。

具体实施方式

下面结合附图，对本说明书披露的多个实施例进行描述。

如前所述，目前预测用户行为的方式较为单一，得到的预测结果准确度也十分有限。具体而言，目前在某个领域做用户推荐时，通常会利用该某个领域中的历史数据进行模型构建，比如说，在做商品推荐时，利用用户对商品的历史行为数据，训练预测模型，用于评估用户对候选商品的兴趣分数，进而利用该兴趣分数确定是否向用户推荐该候选商品。然而，出于各种各样的原因，会出现单个领域的历史数据不足、较少或者不够多的情况，导致训练出来的模型预测效果不佳，如预测结果的准确度不够高，例如，对于某些新上市的商品，初期用户对这些商品产生的行为数据较少。

基于此，发明人发现，目前各个推荐领域只用到本领域中的数据，但实际上，不同推荐领域中的数据是具有一些共性的，比如均可以反映用户的个人行为习惯、个人偏好等，举例来说，如果某个用户多次购买了超级英雄系列电影的电影票，那么，其在买衣服时更可能会购买印有超级英雄图案或者包含科幻元素等的服饰，据此，发明人提出，在训练针对某个推荐领域的预测模型时，可以引入其他推荐领域中的数据，具体地，可以利用源领域中较为丰富的训练数据，帮助训练用于完成目标领域下推荐任务的预测模型，或者，对于不同推荐领域，实现训练数据的共用，从而互助提高各个推荐领域中的推荐精准度，优化用户体验。

进一步地，发明人提出设计一种新的行为预测系统，在该行为预测系统中包括多个推荐领域各自对应的对象表征模型、领域用户表征模型和行为预测模型，此外，还包括多个推荐领域共用的通用用户表征模型和领域判别模型。图1示出根据一个实施例的行为预测系统的更新方法的实施架构示意图，图1中示出N（为大于1的正整数）个推荐领域，其中各个推荐领域中对应：用于对该领域中的推荐对象进行表征的对象表征模型，用于对该领域中的用户进行表征的领域用户表征模型，以及用于预测该用户对该推荐对象做出特定行为的可能性的行为预测模型。

此外，该行为预测系统中还包括N个推荐领域共用或公用的通用用户表征模型和领域判别模型，其中的通用用户表征模型用于对各个领域中的领域用户表征向量进行去除领域特性处理，或者说，进行领域无关化处理，从而得到通用用户向量，需要说明，各个领域在做用户表征时，倾向于提取和表征与该领域强相关的用户特征，因此，如果直接将各个领域的用户数据输入同一个用户表征模型中，将导致模型训练紊乱、难以收敛，对用户的表征效果欠佳。因此，通过同时设计各个领域下的领域用户表征模型和去除领域特征的通用标准模型，可以实现对各个领域中用户数据的合理、有效地联结和共用。另外，其中公用的领域判别模型用于判别由通用用户表征模型输出的通用用户向量所属的领域，引入该领域判别模型的目的是：驱使上述通用用户表征模型实现对用户表征的领域无关化。

本说明书实施例披露一种对上述行为预测系统进行更新的方法。下面，结合具体的实施例，对该方法的实施步骤进行描述。

具体地，图2示出本说明书实施例披露的行为预测系统的更新方法流程图，其中行为预测系统包括多个推荐领域各自对应的对象表征模型、领域用户表征模型和行为预测模型，还包括通用用户表征模型和领域判别模型。所述更新方法的执行主体可以为任何具有计算、处理能力的计算平台、服务器或设备集群。如图2所示，所述方法包括以下步骤：

步骤S210，获取与该多个推荐领域对应的多个训练样本，其中任意的第一训练样本中包括第一推荐领域中第一推荐对象的对象特征、第一用户的用户特征，以及第一样本标签，该第一样本标签指示该第一用户是否对该第一推荐对象做出特定行为；该第一推荐领域对应第一对象表征模型、第一领域用户表征模型和第一行为预测模型；步骤S220，针对该第一训练样本，将该对象特征输入该第一对象表征模型中，得到第一对象表征向量，并且，将该用户特征输入该第一领域用户表征模型中，得到第一领域用户表征向量；步骤S230，将该第一领域用户表征向量输入该通用用户表征模型中，得到第一通用用户表征向量，进而与该第一对象表征向量进行融合，得到第一融合向量；步骤S240，将该第一融合向量输入该第一行为预测模型中，得到第一行为预测结果，进而结合该第一样本标签，确定第一行为预测损失；步骤S250，将该第一通用用户表征向量输入该领域判别模型中，得到第一领域判别结果，进而基于该第一推荐领域的领域标识，确定第一领域判别损失；步骤S260，基于确定出的对应于该多个训练样本的多个行为预测损失和多个领域判别损失，确定综合训练损失，其与该多个行为预测损失分别正相关，且与该多个领域判别损失分别负相关；步骤S270，利用综合训练损失，调整该行为预测系统中各个模型的模型参数。

针对以上步骤，首先需要说明的是，上述“第一训练样本”、“第一推荐领域”、“第一用户”等中的“第一”，均是为了描述地清楚简洁，用于区分同类事物，不具有其他限定作用。

以上步骤具体如下：

首先，在步骤S210，获取与该多个推荐领域对应的多个训练样本，其中任意的第一训练样本中包括第一推荐领域中第一推荐对象的对象特征、第一用户的用户特征，以及第一样本标签，该第一样本标签指示该第一用户是否对该第一推荐对象做出特定行为；该第一推荐领域对应第一对象表征模型、第一领域用户表征模型和第一行为预测模型。

需要说明，对于某个训练样本的构建过程可以包括：先确定某个推荐领域中的某个推荐对象所对应的多个触达用户，简而言之，如果将某张广告图片曝光给某个用户，则可以将该某个用户称为该某张广告图片的触达用户；对应该多个触发用户，将其中在触达之后的预定时间（如1min或1天）内，对该某个推荐对象做出特定行为（如点击）的用户确定为转化用户，而将其余的未做出特定行为的用户确定为未转化用户，进而基于转化用户和未转化用户分别构建训练样本。需要理解，转化用户所对应样本的样本标签指示用户对推荐对象做出特定行为，而未转化用户所对应样本的样本标签指示用户没有对推荐对象做出特定行为。

基于此，在本步骤可以获取到与多个推荐领域对应的多个训练样本。对于该多个训练样本，其对应于多个推荐领域，也就是说，该多个训练样本中包括与其中每个推荐领域对应的训练样本。需要理解，在实际训练中，通常每次训练都会从训练数据集中抽取一批次训练样本进行训练，在该训练数据集中会包括在多个推荐领域中各个推荐领域下采集的训练数据，而在某一次训练中，抽取的一批次训练样本中可能会包括各个推荐领域下的样本，也可能只包括部分推荐领域下的训练样本，但总之，多次迭代训练所使用的训练样本的并集，能够实现对上述多个推荐领域的全覆盖。

对于上述多个推荐领域，在一个实施例中，上述多个推荐领域可以包括商品推荐领域、服务推荐领域、内容推荐领域。在另一个实施例中，上述多个推荐领域可以包括商品推荐领域中的多个子商品推荐领域，如服装推荐领域、首饰推荐领域、电影推荐领域、图书推荐领域、主题餐厅推荐领域、理财产品推荐领域等。在又一个实施例中，上述多个推荐领域可以包括服务推荐领域中的多个子服务推荐领域，如健身项目推荐领域、运动场馆推荐领域、养生项目推荐领域。在还一个实施例中，上述多个推荐领域可以包括内容推荐领域中的多个子内容推荐领域，如新闻推荐领域、公众号推荐领域等。

对于上述推荐对象，在多个推荐领域的各个推荐领域中，可以包括对应的一个或多个推荐对象，用于推荐给不同的用户。在一个实施例中，假定上述多个推荐领域中包括服装推荐领域和电影推荐领域，相应地，服装推荐领域中可以包括某几款衣服、某几款裤子等多个服装类推荐对象，其中电影推荐领域中可以包括某几部影片等多个电影类推荐对象。

对于推荐对象的对象特征，在一个实施例中，对象特征可以包括第一推荐对象的对象标识。需要理解，该对象标识用于在第一推荐领域中唯一标识该第一推荐对象，该对象标识可以由数字、字母或符号等组成。在另一个实施例中，若该第一推荐对象为第一图片，则其特征可以包括图片像素、图片中的文字内容、图片的描述信息等。在还一个实施例中，若该第一推荐对象为第一文本，则其特征可以包括文本关键词、文本字符数等。在又一个实施例中，若该第一推荐对象为第一商品，则其特征可以包括商品类别、商品价格、商品产地等。

对于上述用户特征，在一个实施例中，可以包括用户基础信息，例如，性别、年龄、职业、地址、兴趣爱好等。在另一个实施例中，可以包括第一用户的历史网络操作数据，例如，操作对象（如网页、应用APP）、操作次数、操作时长、操作地点（如IP地址、MAC地址等、经纬度数据）、操作时间段（如上午、下午或晚上）等。

对于上述样本标签，其指示对应用户是否对对应推荐对象做出特定行为。在一个实施例中，该样本标签可以是1（指示做出）和0（指示未做出）。另一方面，在一个实施例中，该特定行为包括点击行为、浏览达到预设时长的行为、注册行为、登录行为、购买行为和关注行为。此外需要说明，其中特定行为可以由工作人员根据推荐对象和实际经验进行设定。例如，若推荐对象为广告图片，则特定行为可以被设定为点击行为。又例如，若推荐对象为商品，则特定行为可以被设定为购买行为。再例如，若推荐对象为新闻资讯，则特定行为可以被设定为浏览时长达到预设时长（如5min）。还例如，若推荐对象为公众号，则特定行为可以被设定为关注行为。再又例如，若推荐对象为应用APP，则特定行为可以被设定为登录行为或下载行为或注册行为。

以上，对训练样本的构建以及其中包含的样本特征和样本标签进行介绍。在获取上述多个训练样本后，可以通过以下步骤S220至步骤S250，确定出其中各个训练样本对应的训练损失。为便于描述的清楚，主要以多个训练样本中任意的第一训练样本为例，说明训练损失的确定过程。

具体地，在步骤S220，一方面，将上述第一训练样本中包含的对象特征输入与第一推荐领域对应的对象表征模型（简称第一对象表征模型）中，得到第一对象表征向量。在一个实施例中，该对象特征中包括所述第一推荐对象的对象标识，该第一对象表征模型为第一嵌入层；相应地，可以先对该对象标识进行独热编码，得到独热编码向量，例如，假定第一推荐领域中共包含3个业务对象，该对象标识为编号2，则得到的独热编码向量可以为（0，1，0）；接着，在第一嵌入层中，利用嵌入矩阵对该独热编码向量进行嵌入处理，得到对象嵌入向量，作为该第一对象表征向量，在一个具体的实施例中，可以将嵌入处理表示为：

，其中

表示独热编码向量，

表示嵌入矩阵，

表示对象嵌入向量，即，该第一对象表征向量。

在另一个实施例中，上述对象特征中还包括除对象标识以外的其他特征，或者，只包括该其他特征，如图片像素、文本关键字等，相应地，上述第一对象表征模型可以通过DNN（Deep Neural Networks，深度神经网络）模型实现，或者，可以通过CNN（ConvolutionalNeural Networks，卷积神经网络）模型实现。

另一方面，在本步骤中，还将上述第一训练样本中包含的用户特征输入与第一推荐领域对应的领域用户表征模型（简称第一领域用户表征模型）中，得到第一领域用户表征向量。在一个实施例中，该第一领域用户表征模型可以基于DNN模型或CNN模型实现。

在另一个实施例中，上述第一领域用户表征模型为第一图神经网络，例如，可以实现为图卷积网络（Graph Convolutional Networks）、或图自编码机（Graph Auto-encoder）等。相应地，可以获取构建的用户关系图谱，其中包括对应于多个用户的用户节点，以及用户节点之间存在关联关系时形成的连接边；然后，将上述第一用户的用户特征输入该第一图神经网络，以使得该第一图神经网络基于该用户关系图谱，在该用户特征的基础上对该第一用户的邻居节点进行特征聚合，得到上述第一领域用户表征向量。在一个具体的实施例中，其中用户关系图谱的构建可以包括：基于多个推荐领域涉及的多个用户，以及这些用户之间的关联关系，构建用户关系图谱，其中关联关系可以包括好友关系、亲戚关系、工作关系等，在一个例子中，其中工作关系可以是就职于同一公司，或者，具有业务往来而产生的关系。另一方面，在一个具体的实施例中，上述第一用户的邻居节点可以是第一用户对应的节点在T阶以内的邻居节点，其中T为超参，可以是人为预先设定的正整数，例如可设定为1或5等。进一步地，在T＞1时，具体可以实现为对邻居节点的多级特征聚合，例如，利用1阶邻居节点进行1级聚合，进而利用2阶邻居节点进行2级聚合，最终将T级聚合得到的聚合向量，作为上述第一领域用户表征向量。

由上，可以得到第一对象表征向量和第一领域用户表征向量。然后，基于这两个向量，执行步骤S230，将该第一领域用户表征向量输入通用用户表征模型中，得到第一通用用户表征向量，进而与该第一对象表征向量进行融合，得到第一融合向量。在一个实施例中，其中通用用户表征模型可以实现为DNN模型或CNN模型等。在一个实施例中，其中融合可以是对该第一通用用户表征向量和第一对象表征向量进行拼接、或加和、或求平均等。在一个具体的实施例中，其中拼接可以是将第一对象表征向量拼接在第一通用用户表征向量之前，也可以是拼接在第一通用用户表征向量之后，按照该第一推荐领域下的预设拼接顺序进行拼接即可。

如此，可以得到第一融合向量，并在步骤S240中，将该第一融合向量输入与第一推荐领域对应的行为预测模型（以下简称第一行为预测模型）中，得到第一行为预测结果，进而结合该第一样本标签，确定第一行为预测损失。在一个实施例中，其中第一行为预测模型可以实现为DNN模型或CNN模型。在一个实施例中，可以利用交叉熵损失函数或铰链损失函数，计算该第一行为预测损失。如此，可以得到第一行为预测损失。

另一方面，针对步骤S230中得到的第一通用用户表征向量，在步骤S250中，将其输入上述领域判别模型中，得到第一领域判别结果，进而基于第一推荐领域的领域标识，确定第一领域判别损失。需要理解，该领域标识相当于第一训练样本的领域类别标签。在一个实施例中，该领域判别模型可以实现为二分类或多分类模型。在另一个实施例中，该领域判别模型可以实现为DNN模型或CNN模型。在一个实施例中，可以利用交叉熵损失函数或铰链损失函数，计算该第一领域判别损失。如此，可以得到第一领域判别损失。

以上，针对上述多个训练样本中任意的第一训练样本，执行步骤S220至步骤S250，可以确定出对应的第一行为判别损失和第一领域判别损失。依次类推，可以确定出对应于该多个训练样本的多个行为预测损失和多个领域判别损失，进而在步骤S260，确定综合训练损失，该综合训练损失与该多个行为预测损失分别正相关，且与该多个领域判别损失分别负相关。其中，设定综合训练损失与领域判别损失负相关的目的在于，使得领域判别器无法区分训练样本中的用户数据所对应的通用用户表征向量是来自哪个推荐领域，从而驱使经过通用用户表征模型表征对领域用户表征向量的领域特性进行弱化。

在一个具体的实施例中，可以通过以下公式确定综合训练损失：

（1）

其中，L表示综合训练损失，N表示训练样本的数量，

表示第i个训练样本对应的行为预测损失，

表示第i个训练样本对应的领域判别损失，

为超参，大于0，例如可以设定为0.2或0.05。

以上，在得到综合训练损失后，可以在步骤S270，利用综合训练损失，调整该行为预测系统中各个模型的模型参数。需要说明，其中利用训练损失调整模型参数，可以利用反向传播法实现。此外，上述综合训练损失对应多个推荐领域的训练样本，因此，可以对各个推荐领域下的三个模型，以及多个推荐领域共用的两个模型进行调参，而在某些训练轮次中，确定出的综合训练损失对应部分推荐领域的训练样本，此时，可以只对该部分推荐领域中各个推荐领域下的三个模型，以及领域共用的两个模型进行调参。

通过重复执行上述步骤S210至步骤S270，可以实现对行为预测系统的多次迭代更新，直到模型参数收敛，或者达到预定的迭代次数，从而得到最后一次更新后得到的行为预测系统，在需要执行对应某个推荐领域的推荐任务的情况下，可以利用该某个推荐领域对应的三个模型和上述通用用户表征模型，完成推荐任务。不妨仍以第一推荐领域为例，可以将该领域的目标用户的用户特征输入更新后的第一领域用户表征模型中，得到领域目标用户表征向量，进而输入更新后的通用用户表征模型中，得到通用目标用户表征向量，并且，将第一推荐对象输入更新后的第一对象表征模型中，得到对象表征向量，进一步地，将该通用目标用户表征向量和该对象表征向量进行融合，并将融合后的向量输入更新后的第一行为预测模型中，得到行为预测结果，进而根据行为预测结果判读是否将该第一推荐对象推荐给该目标用户。

综上，在本说明书实施例披露的行为预测系统的更新方法中，通过采用新设计的行为预测系统，实现多个推荐领域的数据共用，从而提高其中各个推荐领域的推荐结果的精准度，进而有效提高用户体验。

与上述更新方法相对应的，本说明书实施例还披露一种更新装置。具体地，图3示出本说明书实施例披露的行为预测系统的更新装置结构图，其中行为预测系统包括多个推荐领域各自对应的对象表征模型、领域用户表征模型和行为预测模型，还包括通用用户表征模型和领域判别模型。如图3所示，所述装置300包括：

样本获取单元310，配置为获取与所述多个推荐领域对应的多个训练样本，其中任意的第一训练样本中包括第一推荐领域中第一推荐对象的对象特征、第一用户的用户特征，以及第一样本标签，该第一样本标签指示该第一用户是否对该第一推荐对象做出特定行为；所述第一推荐领域对应第一对象表征模型、第一领域用户表征模型和第一行为预测模型。

对象表征单元320，配置为针对所述第一训练样本，将所述对象特征输入所述第一对象表征模型中，得到第一对象表征向量。

领域用户表征单元330，配置为将所述用户特征输入所述第一领域用户表征模型中，得到第一领域用户表征向量。

通用用户表征单元340，配置为将所述第一领域用户表征向量输入所述通用用户表征模型中，得到第一通用用户表征向量。

向量融合单元350，配置为将所述第一通用用户表征向量与所述第一对象表征向量进行融合，得到第一融合向量。

行为损失确定单元360，配置为将所述第一融合向量输入所述第一行为预测模型中，得到第一行为预测结果，进而结合所述第一样本标签，确定第一行为预测损失。

领域损失确定单元370，配置为将所述第一通用用户表征向量输入所述领域判别模型中，得到第一领域判别结果，进而基于所述第一推荐领域的领域标识，确定第一领域判别损失。

综合损失确定单元380，配置为基于确定出的对应于所述多个训练样本的多个行为预测损失和多个领域判别损失，确定综合训练损失，其与所述多个行为预测损失分别正相关，且与所述多个领域判别损失分别负相关。

系统更新单元390，配置为利用综合训练损失，调整所述行为预测系统中各个模型的模型参数。

在一个实施例中，所述对象特征包括所述第一推荐对象的对象标识，所述第一对象表征模型包括第一嵌入层；其中对象表征单元320具体配置为：对所述对象标识进行独热编码，得到独热编码向量；在所述第一嵌入层中，利用嵌入矩阵对所述独热编码向量进行嵌入处理，得到对象嵌入向量，作为所述第一对象表征向量。

在一个实施例中，所述第一领域用户表征模型为第一图神经网络；其中领域用户表征单元330配置为：获取预先构建的用户关系图谱，其中包括对应于多个用户的用户节点，以及用户节点之间存在关联关系时形成的连接边；将所述用户特征输入所述第一图神经网络，以使得所述第一图神经网络基于所述用户关系图谱，在所述用户特征的基础上对所述第一用户的邻居节点进行特征聚合，得到所述第一领域用户表征向量。

综上，在本说明书实施例披露的行为预测系统的更新装置中，通过采用新设计的行为预测系统，实现多个推荐领域的数据共用，从而提高其中各个推荐领域的推荐结果的精准度，进而有效提高用户体验。

如上，根据又一方面的实施例，还提供一种计算机可读存储介质，其上存储有计算机程序，当所述计算机程序在计算机中执行时，令计算机执行结合图2所描述的方法。

根据又一方面的实施例，还提供一种计算设备，包括存储器和处理器，所述存储器中存储有可执行代码，所述处理器执行所述可执行代码时，实现结合图2所描述的方法。

本领域技术人员应该可以意识到，在上述一个或多个示例中，本说明书披露的多个实施例所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时，可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。

以上所述的具体实施方式，对本说明书披露的多个实施例的目的、技术方案和有益效果进行了进一步详细说明，所应理解的是，以上所述仅为本说明书披露的多个实施例的具体实施方式而已，并不用于限定本说明书披露的多个实施例的保护范围，凡在本说明书披露的多个实施例的技术方案的基础之上，所做的任何修改、等同替换、改进等，均应包括在本说明书披露的多个实施例的保护范围之内。

Claims

1.一种行为预测系统的更新方法，所述行为预测系统包括多个推荐领域各自对应的对象表征模型、领域用户表征模型和行为预测模型，还包括通用用户表征模型和领域判别模型；所述方法包括：

获取与所述多个推荐领域对应的多个训练样本，其中任意的第一训练样本中包括第一推荐领域中第一推荐对象的对象特征、第一用户的用户特征，以及第一样本标签，该第一样本标签指示该第一用户是否对该第一推荐对象做出特定行为；所述第一推荐领域对应第一对象表征模型、第一领域用户表征模型和第一行为预测模型；

针对所述第一训练样本，将所述对象特征输入所述第一对象表征模型中，得到第一对象表征向量，并且，将所述用户特征输入所述第一领域用户表征模型中，得到第一领域用户表征向量；

将所述第一领域用户表征向量输入所述通用用户表征模型中，得到第一通用用户表征向量，进而与所述第一对象表征向量进行融合，得到第一融合向量；

将所述第一融合向量输入所述第一行为预测模型中，得到第一行为预测结果，进而结合所述第一样本标签，确定第一行为预测损失；

将所述第一通用用户表征向量输入所述领域判别模型中，得到第一领域判别结果，进而基于所述第一推荐领域的领域标识，确定第一领域判别损失；

基于确定出的对应于所述多个训练样本的多个行为预测损失和多个领域判别损失，确定综合训练损失，该综合训练损失与所述多个行为预测损失分别正相关，且与所述多个领域判别损失分别负相关；

利用综合训练损失，调整所述行为预测系统中各个模型的模型参数。

2.根据权利要求1所述的方法，其中，所述多个推荐领域包括以下中的至少一个领域：商品推荐领域、服务推荐领域、内容推荐领域。

3.根据权利要求1所述的方法，其中，所述对象特征包括所述第一推荐对象的对象标识，所述第一对象表征模型包括第一嵌入层；其中，将所述对象特征输入所述第一对象表征模型中，得到第一对象表征向量，包括：

对所述对象标识进行独热编码，得到独热编码向量；

在所述第一嵌入层中，利用嵌入矩阵对所述独热编码向量进行嵌入处理，得到对象嵌入向量，作为所述第一对象表征向量。

4.根据权利要求1所述的方法，其中，所述第一推荐对象为第一图片，所述对象特征包括图片像素、图片中的文字内容；或者，所述第一推荐对象为第一文本，所述对象特征包括文本关键词、文本字符数；或者，所述第一推荐对象为第一商品，所述对象特征包括商品类别、商品价格、商品产地。

5.根据权利要求1所述的方法，其中，所述第一领域用户表征模型为第一图神经网络；其中，将所述用户特征输入所述第一领域用户表征模型中，得到第一领域用户表征向量，包括：

获取预先构建的用户关系图谱，其中包括对应于多个用户的用户节点，以及用户节点之间存在关联关系时形成的连接边；

将所述用户特征输入所述第一图神经网络，以使得所述第一图神经网络基于所述用户关系图谱，在所述用户特征的基础上对所述第一用户的邻居节点进行特征聚合，得到所述第一领域用户表征向量。

6.根据权利要求1所述的方法，其中，所述用户特征包括用户基础信息和/或历史网络操作数据；所述用户基础信息包括以下中的至少一项：性别、年龄、职业、地址、兴趣爱好，所述历史网络操作数据包括以下中的至少一项：操作对象、操作次数、操作时长、操作地点、操作时间段。

7.根据权利要求1所述的方法，其中，所述特定行为包括点击行为、浏览达到预设时长的行为、注册行为、登录行为、购买行为和关注行为。

8.一种行为预测系统的更新装置，所述行为预测系统包括多个推荐领域各自对应的对象表征模型、领域用户表征模型和行为预测模型，还包括通用用户表征模型和领域判别模型；所述装置包括：

样本获取单元，配置为获取与所述多个推荐领域对应的多个训练样本，其中任意的第一训练样本中包括第一推荐领域中第一推荐对象的对象特征、第一用户的用户特征，以及第一样本标签，该第一样本标签指示该第一用户是否对该第一推荐对象做出特定行为；所述第一推荐领域对应第一对象表征模型、第一领域用户表征模型和第一行为预测模型；

对象表征单元，配置为针对所述第一训练样本，将所述对象特征输入所述第一对象表征模型中，得到第一对象表征向量；

领域用户表征单元，配置为将所述用户特征输入所述第一领域用户表征模型中，得到第一领域用户表征向量；

通用用户表征单元，配置为将所述第一领域用户表征向量输入所述通用用户表征模型中，得到第一通用用户表征向量；

向量融合单元，配置为将所述第一通用用户表征向量与所述第一对象表征向量进行融合，得到第一融合向量；

行为损失确定单元，配置为将所述第一融合向量输入所述第一行为预测模型中，得到第一行为预测结果，进而结合所述第一样本标签，确定第一行为预测损失；

领域损失确定单元，配置为将所述第一通用用户表征向量输入所述领域判别模型中，得到第一领域判别结果，进而基于所述第一推荐领域的领域标识，确定第一领域判别损失；

综合损失确定单元，配置为基于确定出的对应于所述多个训练样本的多个行为预测损失和多个领域判别损失，确定综合训练损失，该综合训练损失与所述多个行为预测损失分别正相关，且与所述多个领域判别损失分别负相关；

系统更新单元，配置为利用综合训练损失，调整所述行为预测系统中各个模型的模型参数。

9.根据权利要求8所述的装置，其中，所述多个推荐领域包括以下中的至少一个领域：商品推荐领域、服务推荐领域、内容推荐领域。

10.根据权利要求8所述的装置，其中，所述对象特征包括所述第一推荐对象的对象标识，所述第一对象表征模型包括第一嵌入层；其中对象表征单元具体配置为：

对所述对象标识进行独热编码，得到独热编码向量；

11.根据权利要求8所述的装置，其中，所述第一推荐对象为第一图片，所述对象特征包括图片像素、图片中的文字内容；或者，所述第一推荐对象为第一文本，所述对象特征包括文本关键词、文本字符数；或者，所述第一推荐对象为第一商品，所述对象特征包括商品类别、商品价格、商品产地。

12.根据权利要求8所述的装置，其中，所述第一领域用户表征模型为第一图神经网络；其中领域用户表征单元配置为：

13.根据权利要求8所述的装置，其中，所述用户特征包括用户基础信息和/或历史网络操作数据；所述用户基础信息包括以下中的至少一项：性别、年龄、职业、地址、兴趣爱好，所述历史网络操作数据包括以下中的至少一项：操作对象、操作次数、操作时长、操作地点、操作时间段。

14.根据权利要求8所述的装置，其中，所述特定行为包括点击行为、浏览达到预设时长的行为、注册行为、登录行为、购买行为和关注行为。

15.一种计算机可读存储介质，其上存储有计算机程序，其中，当所述计算机程序在计算机中执行时，令计算机执行权利要求1-7中任一项的所述的方法。

16.一种计算设备，包括存储器和处理器，其中，所述存储器中存储有可执行代码，所述处理器执行所述可执行代码时，实现权利要求1-7中任一项所述的方法。