CN116485505A

CN116485505A - 基于用户表现公平性训练推荐模型的方法及装置

Info

Publication number: CN116485505A
Application number: CN202310751881.XA
Authority: CN
Inventors: 郑小林; 陈超超; 韩钟萱
Original assignee: Hangzhou Jinzhita Technology Co ltd
Current assignee: Hangzhou Jinzhita Technology Co ltd
Priority date: 2023-06-25
Filing date: 2023-06-25
Publication date: 2023-07-25
Anticipated expiration: 2043-06-25
Also published as: CN116485505B

Abstract

本说明书提供基于用户表现公平性训练推荐模型的方法及装置，其中基于用户表现公平性训练推荐模型的方法包括：确定目标用户，以及与目标用户相似的关联用户；基于目标用户的目标行为数据和关联用户的关联行为数据生成差异信息，并基于差异信息构建第一损失函数；利用目标用户对应的推荐模型对目标行为数据和关联行为数据进行处理，根据处理结果和第一损失函数计算第一损失值，以及根据处理结果和推荐模型对应的第二损失函数计算第二损失值；根据第一损失值和第二损失值对推荐模型进行调参，直至获得满足训练停止条件的目标推荐模型。对推荐模型进行训练时，考虑目标用户和关联用户之间的差异性，提高为用户进行推荐的公平性。

Description

基于用户表现公平性训练推荐模型的方法及装置

技术领域

本说明书涉及计算机技术领域，特别涉及一种基于用户表现公平性训练推荐模型的方法。本说明书同时涉及一种基于用户表现公平性训练推荐模型的装置，一种基于用户表现公平性训练商品推荐模型的方法，一种基于用户表现公平性训练商品推荐模型的装置，一种计算设备，以及一种计算机可读存储介质。

背景技术

随着计算机技术的发展，电商进入人们的视野，逐渐成为了人们工作和生活中不可获取的一部分。然而为了提高用户的购物体验，通常会根据用户的喜好为用户进行商品推荐。在音视频应用程序中，也会根据用户的偏好为用户推荐音视频。

现有技术中，通过会基于用户的行为数据训练推荐模型，从而精准的为用户推荐用户可能会喜欢的商品、音视频。然而针对行为数据较少的新用户或活跃度地的用户，则无法完成推荐任务。推荐模型会偏向于行为数据丰富以及活跃度较高的用户，为此类用户进行推荐的准确度较高，无法保证推荐的公平性，无法为不同用户提供平等质量的推荐结果。因此，亟需一种较为有效的方法以解决上述问题。

发明内容

有鉴于此，本说明书实施例提供了一种基于用户表现公平性训练推荐模型的方法。本说明书同时涉及一种基于用户表现公平性训练推荐模型的装置，一种基于用户表现公平性训练商品推荐模型的方法，一种基于用户表现公平性训练商品推荐模型的装置，一种计算设备，以及一种计算机可读存储介质，以解决现有技术中存在的技术缺陷。

根据本说明书实施例的第一方面，提供了一种基于用户表现公平性训练推荐模型的方法，包括：

确定目标用户，以及与所述目标用户相似的关联用户；

基于所述目标用户的目标行为数据和所述关联用户的关联行为数据生成差异信息，并基于所述差异信息构建第一损失函数；

利用所述目标用户对应的推荐模型对所述目标行为数据和所述关联行为数据进行处理，根据处理结果和所述第一损失函数计算第一损失值，以及根据处理结果和所述推荐模型对应的第二损失函数计算第二损失值；

根据所述第一损失值和所述第二损失值对所述推荐模型进行调参，直至获得满足训练停止条件的目标推荐模型。

可选地，所述确定目标用户，以及与所述目标用户相似的关联用户，包括：

确定推荐业务对应的用户集合；

在所述用户集合中选择行为数据量小于预设的行为数据量阈值的用户，作为目标用户；

在所述用户集合中选择与所述目标用户匹配的用户，作为关联用户，其中，所述关联用户的行为数据量大于等于所述行为数据量阈值。

可选地，所述在所述用户集合中选择与所述目标用户匹配的用户，作为关联用户，包括：

确定所述目标用户的目标行为数据；

在所述用户集合中选择用户数据量大于所述行为数据量阈值的待选择用户组；

分别计算所述待选择用户组中每个待选择用户的用户行为数据和所述目标行为数据之间的相似度分值；

基于每个待选择用户对应的相似度分值在所述待选择用户组中确定与所述目标用户匹配的关联用户。

可选地，所述基于所述目标用户的目标行为数据和所述关联用户的关联行为数据生成差异信息，并基于所述差异信息构建第一损失函数，包括：

构建所述目标用户的目标行为数据对应的目标向量，以及构建所述关联用户的关联行为数据对应的关联向量；

计算所述目标向量和所述关联向量之间的向量差异，并基于所述向量差异生成差异信息；

基于所述差异信息和所述目标用户的数量构建第一损失函数。

可选地，所述差异信息通过下述公式生成：

其中，表示目标用户；/>表示与目标用户相似的关联用户组成的关联用户集合；表示目标用户/>的目标行为数据的嵌入特征表示；/>表示关联用户集合中任意一个关联用户；/>表示关联用户集合中关联用户/>的关联行为数据的嵌入特征表示；/>表示对给定向量集合进行按位平均计算；

所述第一损失函数通过下述公式构建：

其中，表示至少一个目标用户组成的目标用户集合中目标用户的数量；/>表示第一损失函数。

可选地，所述利用所述目标用户对应的推荐模型对所述目标行为数据和所述关联行为数据进行处理，根据处理结果和所述第一损失函数计算第一损失值，以及根据处理结果和所述推荐模型对应的第二损失函数计算第二损失值，包括：

对所述目标行为数据和所述关联行为数据进行组合，根据组合结果确定行为数据集合；

在所述行为数据集合中选择目标样本，并确定所述目标样本的样本标签；

将所述目标样本输入所述目标用户对应的推荐模型，获得预测数据；

基于所述预测数据、所述样本标签和所述第一损失函数计算第一损失值；

基于所述预测数据、所述样本标签和所述第二损失函数计算第二损失值。

可选地，所述根据所述第一损失值和所述第二损失值对所述推荐模型进行调参，直至获得满足训练停止条件的目标推荐模型，包括：

根据所述第一损失值和所述第二损失值对所述推荐模型进行调参；

在调参后的推荐模型不满足所述训练停止条件的情况下，执行所述在所述行为数据集合中选择目标样本的步骤；

在调参后的推荐模型满足所述训练停止条件的情况下，将调参后的推荐模型作为目标推荐模型。

可选地，所述根据所述第一损失值和所述第二损失值对所述推荐模型进行调参，包括：

确定所述第一损失函数对应的超参数；

基于所述超参数、所述第一损失值和所述第二损失值确定目标损失值，并基于所述目标损失值对所述推荐模型进行调参。

可选地，所述方法，还包括：

确定商品推荐任务关联的待推荐用户；

将所述待推荐用户对应的推荐行为数据输入至所述目标推荐模型，获得所述待推荐用户的推荐商品信息。

根据本说明书实施例的第二方面，提供了一种基于用户表现公平性训练推荐模型的装置，包括：

确定模块，被配置为确定目标用户，以及与所述目标用户相似的关联用户；

生成模块，被配置为基于所述目标用户的目标行为数据和所述关联用户的关联行为数据生成差异信息，并基于所述差异信息构建第一损失函数；

处理模块，被配置为利用所述目标用户对应的推荐模型对所述目标行为数据和所述关联行为数据进行处理，根据处理结果和所述第一损失函数计算第一损失值，以及根据处理结果和所述推荐模型对应的第二损失函数计算第二损失值；

训练模块，被配置为根据所述第一损失值和所述第二损失值对所述推荐模型进行调参，直至获得满足训练停止条件的目标推荐模型。

根据本说明书实施例的第三方面，提供了一种推荐方法，包括：

获取待推荐用户提交的浏览请求；

根据所述浏览请求确定所述待推荐用户的对象行为数据，将所述对象行为数据输入至目标推荐模型进行处理，获得对象推荐信息；

根据所述对象推荐信息生成对象推荐页面，作为所述浏览请求的响应。

根据本说明书实施例的第四方面，提供了一种推荐装置，包括：

获取模块，被配置为获取待推荐用户提交的浏览请求；

处理模块，被配置为根据所述浏览请求确定所述待推荐用户的对象行为数据，将所述对象行为数据输入至目标推荐模型进行处理，获得对象推荐信息；

生成模块，被配置为根据所述对象推荐信息生成对象推荐页面，作为所述浏览请求的响应。

根据本说明书实施例的第五方面，提供了一种基于用户表现公平性训练商品推荐模型的方法，应用于购物平台，包括：

确定目标用户，以及与所述目标用户相似的关联用户；

基于所述目标用户在所述购物平台产生的目标行为数据，和所述关联用户在所述购物平台产生的关联行为数据生成差异信息，并基于所述差异信息构建第一损失函数；

利用所述目标用户对应的商品推荐模型对所述目标行为数据和所述关联行为数据进行处理，根据处理结果和所述第一损失函数计算第一损失值，以及根据处理结果和所述商品推荐模型对应的第二损失函数计算第二损失值；

根据所述第一损失值和所述第二损失值对所述商品推荐模型进行调参，直至获得满足训练停止条件的目标商品推荐模型。

根据本说明书实施例的第六方面，提供了一种基于用户表现公平性训练商品推荐模型的装置，应用于购物平台，包括：

构建模块，被配置为基于所述目标用户在所述购物平台产生的目标行为数据，和所述关联用户在所述购物平台产生的关联行为数据生成差异信息，并基于所述差异信息构建第一损失函数；

计算模块，被配置为利用所述目标用户对应的商品推荐模型对所述目标行为数据和所述关联行为数据进行处理，根据处理结果和所述第一损失函数计算第一损失值，以及根据处理结果和所述商品推荐模型对应的第二损失函数计算第二损失值；

训练模块，被配置为根据所述第一损失值和所述第二损失值对所述商品推荐模型进行调参，直至获得满足训练停止条件的目标商品推荐模型。

根据本说明书实施例的第七方面，提供了一种商品推荐方法，应用于购物平台，包括：

获取商品用户提交的商品浏览请求；

根据所述商品浏览请求确定所述商品用户的商品行为数据，将所述商品行为数据输入至目标商品推荐模型进行处理，获得商品推荐信息；

根据所述商品推荐信息生成商品推荐页面，作为所述商品浏览请求的响应。

根据本说明书实施例的第八方面，提供了一种商品推荐装置，应用于购物平台，包括：

获取模块，被配置为获取商品用户提交的商品浏览请求；

处理模块，被配置为根据所述商品浏览请求确定所述商品用户的商品行为数据，将所述商品行为数据输入至目标商品推荐模型进行处理，获得商品推荐信息；

生成模块，被配置为根据所述商品推荐信息生成商品推荐页面，作为所述商品浏览请求的响应。

根据本说明书实施例的第九方面，提供了一种计算设备，包括：

存储器和处理器；

所述存储器用于存储计算机可执行指令，所述处理器用于执行所述计算机可执行指令，该指令被处理器执行时实现所述基于用户表现公平性训练推荐模型的方法的步骤。

根据本说明书实施例的第十方面，提供了一种计算机可读存储介质，其存储有计算机可执行指令，该指令被处理器执行时实现所述基于用户表现公平性训练推荐模型的方法的步骤。

本说明书提供的基于用户表现公平性训练推荐模型的方法，通过确定目标用户，以及与目标用户相似的关联用户；基于目标用户的目标行为数据和关联用户的关联行为数据生成差异信息，并基于差异信息构建第一损失函数；利用目标用户对应的推荐模型对目标行为数据和关联行为数据进行处理，根据处理结果和第一损失函数计算第一损失值，以及根据处理结果和推荐模型对应的第二损失函数计算第二损失值；根据第一损失值和第二损失值对推荐模型进行调参，直至获得满足训练停止条件的目标推荐模型。

本说明书一实施例，通过利用目标用户对应的推荐模型对目标行为数据和关联行为数据进行处理，根据处理结果和第一损失函数计算第一损失值，以及根据处理结果和推荐模型对应的第二损失函数计算第二损失值，进而根据第一损失值和第二损失值对推荐模型进行调参，从而实现对推荐模型进行调参时，将目标用户和关联用户之间的差异作为影响因子，从而在对推荐模型进行训练时考虑目标用户和关联用户之间的差异性，提高为用户进行推荐的公平性，提高推荐模型为不同用户进行推荐时的推荐公平性，使得不同用户获得平等质量的推荐结果，进而提高用户体验。

附图说明

图1是本说明书一实施例提供的一种基于用户表现公平性训练推荐模型的方法的示意图；

图2是本说明书一实施例提供的一种基于用户表现公平性训练推荐模型的方法的流程图；

图3是本说明书一实施例提供的一种应用于商品推荐的基于用户表现公平性训练推荐模型的方法的处理流程图；

图4是本说明书一实施例提供的一种基于用户表现公平性训练推荐模型的方法的流程图；

图5是本说明书一实施例提供的一种基于用户表现公平性训练推荐模型的装置的结构示意图；

图6是本说明书一实施例提供的一种推荐方法的流程图；

图7是本说明书一实施例提供的一种推荐装置的结构示意图；

图8是本说明书一实施例提供的一种基于用户表现公平性训练商品推荐模型的方法的流程图；

图9是本说明书一实施例提供的一种基于用户表现公平性训练商品推荐模型的装置的结构示意图；

图10是本说明书一实施例提供的一种商品推荐方法的流程图；

图11是本说明书一实施例提供的一种商品推荐装置的结构示意图；

图12是本说明书一实施例提供的一种计算设备的结构框图。

具体实施方式

在下面的描述中阐述了很多具体细节以便于充分理解本说明书。但是本说明书能够以很多不同于在此描述的其它方式来实施，本领域技术人员可以在不违背本说明书内涵的情况下做类似推广，因此本说明书不受下面公开的具体实施的限制。

在本说明书一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的，而非旨在限制本说明书一个或多个实施例。在本说明书一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式，除非上下文清楚地表示其他含义。还应当理解，本说明书一个或多个实施例中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。

应当理解，尽管在本说明书一个或多个实施例中可能采用术语第一、第二等来描述各种信息，但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如，在不脱离本说明书一个或多个实施例范围的情况下，第一也可以被称为第二，类似地，第二也可以被称为第一。取决于语境，如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。

首先，对本说明书一个或多个实施例涉及的名词术语进行解释。

k-means：k均值聚类算法（k-means clustering algorithm）是一种迭代求解的聚类分析算法，其步骤是，预将数据分为K组，则随机选取K个对象作为初始的聚类中心，然后计算每个对象与各个种子聚类中心之间的距离，把每个对象分配给距离它最近的聚类中心。聚类中心以及分配给它们的对象就代表一个聚类。每分配一个样本，聚类的聚类中心会根据聚类中现有的对象被重新计算。这个过程将不断重复直到满足某个终止条件。终止条件可以是没有（或最小数目）对象被重新分配给不同的聚类，没有（或最小数目）聚类中心再发生变化，误差平方和局部最小。

图1是本说明书一实施例提供的一种基于用户表现公平性训练推荐模型的方法的示意图。如图1所示，目标用户即为行为数据较少的用户。在购物应用程序场景下，用户即为通过购物应用程序进行商品选购的消费者，用户针对商品的行为数据较少的情况下，该用户即为目标用户，针对推荐模型来说，此类用户即为劣势用户；相反的，用户针对商品的行为数据较多的情况下，该用户即为优势用户。图中关联用于即为优势用户，且关联用户的行为数据与目标用户的行为数据相似。

实际应用中，确定目标用户，以及与目标用户相似的关联用户，基于目标用户的目标行为数据和关联用户的关联行为数据生成差异信息，并基于差异信息构建第一损失函数。利用目标用户对应的推荐模型对目标行为数据和关联行为数据进行处理，根据处理结果和第一损失函数计算第一损失值，以及根据处理结果和推荐模型对应的第二损失函数计算第二损失值，进而根据第一损失值和第二损失值对推荐模型进行调参，实现推荐模型的训练，直至获得满足训练停止条件的目标推荐模型。

综上所述，本说明书一实施例，通过利用目标用户对应的推荐模型对目标行为数据和关联行为数据进行处理，根据处理结果和第一损失函数计算第一损失值，以及根据处理结果和推荐模型对应的第二损失函数计算第二损失值，进而根据第一损失值和第二损失值对推荐模型进行调参，从而实现对推荐模型进行调参时，将目标用户和关联用户之间的差异作为影响因子，从而在对推荐模型进行训练时考虑目标用户和关联用户之间的差异性，提高为用户进行推荐的公平性，提高推荐模型为不同用户进行推荐时的推荐公平性，使得不同用户获得平等质量的推荐结果，进而提高用户体验。

在本说明书中，提供了一种基于用户表现公平性训练推荐模型的方法，本说明书同时涉及一种基于用户表现公平性训练推荐模型的装置，一种基于用户表现公平性训练商品推荐模型的方法，一种基于用户表现公平性训练商品推荐模型的装置，一种计算设备，以及一种计算机可读存储介质，在下面的实施例中逐一进行详细说明。

图2是本说明书一实施例提供的一种基于用户表现公平性训练推荐模型的方法的流程图，具体包括以下步骤：

步骤S202，确定目标用户，以及与所述目标用户相似的关联用户。

具体的，目标用户在本实施例中是指行为数据较少的用户。在购物应用程序场景下，用户即为通过购物应用程序进行商品选购的消费者，用户针对商品的行为数据较少的情况下，该用户即为目标用户，针对推荐模型来说，此类用户即为劣势用户；相反的，用户针对商品的行为数据较多的情况下，该用户即为优势用户；关联用于即为优势用户，且关联用户的行为数据与目标用户的行为数据相似。

基于此，在模型训练之前，需要构建训练样本，确定目标用户，以及确定与目标用户相似的用户，将与目标用户相似的用户作为关联用户，其中，相似的判断维度可以是用户属性信息相似也可以是用户的行为数据相似。在目标用户与关联用户对同一个商品进行购买、收藏或加入购物车，则表示关联用户与目标用户相似。

实际应用中，推荐模型可以应用于多个场景，例如商品推荐、歌曲推荐、电影推荐、游戏推荐、美食推荐等。目标用户即为各个场景下的用户，例如：商品买家、歌曲收听者、游戏玩家等。确定与目标用户相似的用户时，可以根据用户之间的行为信息进行确定，例如收听了同一首音乐、观看了同一部电影、下载了同一款游戏等。还可以是对商品的点赞、收藏、购买、分享等行为数据。

进一步的，在推荐业务场景下，推荐业务的用户数量较多，由于用户之间的需求差异以及行为习惯、爱好等差异，不同用户对应的数据量存在较大差异，为了选择目标用户以及关联用户，可以在用户集合中根据用户对应的数据量进行选择，具体实现如下：

确定推荐业务对应的用户集合；在所述用户集合中选择行为数据量小于预设的行为数据量阈值的用户，作为目标用户；在所述用户集合中选择与所述目标用户匹配的用户，作为关联用户，其中，所述关联用户的行为数据量大于等于所述行为数据量阈值。

具体的，推荐业务包括但不限于商品推荐、景点推荐、餐厅推荐、游戏推荐、歌曲推荐、影视剧推荐、应用程序推荐、音视频推荐等业务；用户集合即为与推荐业务对应的待推荐用户集合；相应的，用户可以是消费者、游戏玩家、歌曲收听者、视频观看者等；行为数据阈值是指根据用户在推荐业务下针对商品等进行操作产生的行为数据数量预先设定的数量值。

基于此，确定推荐业务对应的用户集合，根据需求预先设定行为数据量阈值，在用户集合中选择行为数据量小于预设的行为数据量阈值的用户，并将行为数据量小于预设的行为数据量阈值的用户作为目标用户。在用户集合中选择行为数据量大于等于行为数据量阈值的待选用户，并在待选用户中选择与目标用户匹配的用户，作为关联用户。

举例说明，在推荐业务为歌曲推荐的场景下，用户集合即为音乐应用程序的所有注册用户以及歌曲收听用户组合的用户集合。针对用户对于歌曲的播放、收藏、分享等行为数据预设行为数据量阈值为10。在用户针对歌曲的播放、收藏、分享等行为对应的数据量小于10 时，该用户即为目标用户，即劣势用户；相反的，在用户针对歌曲的播放、收藏、分享等行为对应的数据量大于等于10 时，该用户即为优势用于，进而基于目标用户针对歌曲的行为数据在优势用户中进行匹配，从而确定与目标用户具有相似行为数据的关联用户，相似可以通过播放、收藏、分享过的歌曲确定。

综上所述，在用户集合中选择行为数据量小于预设的行为数据量阈值的用户，作为目标用户，以及在用户集合中选择与目标用户匹配的用户，作为关联用户，以便于后续基于关联用户的关联行为数据对目标用户对应的推荐模型进行训练，从而保证推荐模型针对不同用户进行推荐时的公平性。

进一步的，考虑到目标用户的目标行为数据量较少，为了丰富目标用户对应的目标行为数据量，可以在用户集合中选择与目标行为数据相似的行为数据，进而将该行为数据对应的用户作为与目标用户相似的关联用户，具体实现如下：

确定所述目标用户的目标行为数据；在所述用户集合中选择用户数据量大于所述行为数据量阈值的待选择用户组；分别计算所述待选择用户组中每个待选择用户的用户行为数据和所述目标行为数据之间的相似度分值；基于每个待选择用户对应的相似度分值在所述待选择用户组中确定与所述目标用户匹配的关联用户。

基于此，在用户集合中确定目标用户的目标行为数据，在用户集合中选择用户数据量大于行为数据量阈值的用户组成待选择用户组。分别计算待选择用户组中每个待选择用户的用户行为数据和目标行为数据之间的相似度分值。对相似度分值进行排序，根据排序结果确定待选择用户序列，并在待选择用户序列中选择设定数量的用户作为与目标用户匹配的关联用户；或者，并基于预设相似度分值阈值在待选择用户组中确定与目标用户匹配的关联用户。

沿用上例，在用户A针对歌曲的播放、收藏、分享等行为对应的数据量小于10 时，表示用户A针对歌曲进行播放、收藏、分享等操作较少，该用户即为目标用户，也即劣势用户。确定用户A的行为数据：播放了歌曲1；分享了歌曲1；点赞了歌曲1；播放了歌曲2；播放了歌曲3。在用户集合中选择行为数据量大于等于10的用户组成用户组，并根据用户组中用户的行为数据计算用户组中每个用户与用户A之间的相似度。根据相似度的大小对用户组中的用户进行排序，选择设定数量的用户作为与用户A相似的用户，即关联用户；或者选择相似度大于相似度阈值的用户作为与用户A相似的用户，即关联用户。

综上所述，在用户集合中选择与目标用户的目标行为数据之间相似度较高的关联用户，从而便于后续的模型训练。

步骤S204，基于所述目标用户的目标行为数据和所述关联用户的关联行为数据生成差异信息，并基于所述差异信息构建第一损失函数。

具体的，在上述确定目标用户，以及与目标用户相似的关联用户之后，即可基于目标用户的目标行为数据和关联用户的关联行为数据生成差异信息，并基于差异信息构建第一损失函数，其中，目标行为数据即为目标用户对商品、歌曲、电影、游戏做出的行为所产生的数据，包括但不限于对商品的收藏、购买、加入购物车、分享等，以及对歌曲、电影的收听/观看、分享、循环收听/观看等；相应的，关联行为数据即为关联用户对应的行为数据；差异信息是指根据目标用户的目标行为数据和关联用户的关联行为数据进行差异性计算获得的信息，用于表示目标用户和关联用户之间的差异；第一损失函数即为根据差异信息构建的用于进行模型训练的损失函数。

基于此，在确定了目标用户，以及确定了与目标用户相似的关联用户后，再获取目标用户的目标行为数据，以及关联用户的关联行为数据，对目标行为数据和关联行为数据进行计算和分析生成目标用户与关联用户之间的差异信息，并基于差异信息构建第一损失函数，用于进行后续的模型训练。

具体实施时，差异信息可以通过下述公式（1）进行计算获得。

（1）

其中，表示目标用户；/>表示与目标用户相似的关联用户组成的关联用户集合；表示目标用户/>的目标行为数据的嵌入特征表示；/>表示关联用户集合中任意一个关联用户；/>表示关联用户集合中关联用户/>的关联行为数据的嵌入特征表示；/>表示对给定向量集合进行按位平均计算。/>表示目标用户/>和其对应的关联用户集合/>的整体特征表示差异，/>越小，证明该目标用户与其对应关联用户集合的差异越小，学习质量越高。

第一损失函数可以通过下述公式（2）确定。

（2）

其中，表示至少一个目标用户组成的目标用户集合中目标用户的数量；/>表示第一损失函数。该损失函数的值越小，证明目标用户与关联用户的模型训练差异越小，公平性越强。通过最小化第一损失函数，可以让每个目标用户的学习结果逐渐向其相似的关联用户靠近，从而提升目标用户的总体训练质量，平衡两种用户群体的学习结果。

实际应用中，在确定目标用户的关联用户时，可以选择设定数量的与目标用户相似的用户作为关联用户，即，确定与目标用户相似的多个关联用户组成关联用户集合，进而基于关联用户集合计算目标用户与关联用户集合中关联用户之间的差异信息，从而提高差异信息确定的准确性。在生成差异信息时，可以根据目标行为数据的向量表示，以及关联用户数据的向量表示生成。

进一步的，在计算目标用户的目标行为数据和关联用户的关联行为数据之间的差异信息时，为例便于计算差异信息，以及提高差异信息计算的准确度，可以将目标用户的目标行为数据转换为向量表达，确定其嵌入特征表示，以及将关联用户的关联行为数据转换为向量表达，确定其嵌入特征表示，具体实现如下：

构建所述目标用户的目标行为数据对应的目标向量，以及构建所述关联用户的关联行为数据对应的关联向量；计算所述目标向量和所述关联向量之间的向量差异，并基于所述向量差异生成差异信息；基于所述差异信息和所述目标用户的数量构建第一损失函数。

具体的，目标向量即为目标用户对应的目标行为数据的嵌入特征表示；相应的，关联向量即为关联用户的关联行为数据的嵌入特征表示；向量差异即为目标行为数据的嵌入特征表示与关联行为数据的嵌入特征表示之间的差异。

基于此，构建目标用户的目标行为数据对应的目标向量，以及构建关联用户的关联行为数据对应的关联向量；计算目标向量和关联向量之间的向量差异，并基于向量差异生成差异信息；基于差异信息和目标用户的数量构建第一损失函数。

沿用上例，将目标用户的目标行为数据转换为向量表达，将关联用户的关联行为数据转换为向量表达，并基于上述公式（1）计算目标用户与关联用户之间的差异信息。差异信息数值越小，证明该目标用户与其对应关联用户集合的差异越小，学习质量越高。

综上所述，通过基于目标行为数据对应的目标向量，以及关联用户的关联行为数据对应的关联向量计算目标用户与关联用户之间的差异信息，从而提高差异信息的简便性，以及提高差异信息计算的准确度。

步骤S206，利用所述目标用户对应的推荐模型对所述目标行为数据和所述关联行为数据进行处理，根据处理结果和所述第一损失函数计算第一损失值，以及根据处理结果和所述推荐模型对应的第二损失函数计算第二损失值。

具体的，在上述基于目标用户的目标行为数据和关联用户的关联行为数据生成差异信息，并基于差异信息构建第一损失函数之后，即可利用目标用户对应的推荐模型对目标行为数据和关联行为数据进行处理，根据处理结果和第一损失函数计算第一损失值，以及根据处理结果和推荐模型对应的第二损失函数计算第二损失值，其中，推荐模型是指具有推荐功能的机器学习模型，可以是用于进行商品推荐、歌曲推荐、美食推荐、影视剧推荐、游戏推荐等等；第一损失值即为根据推荐模型输出的推荐结果、样本标签以及第一损失函数进行计算获得的计算结果用于表示模型预测的准确性。

基于此，在基于目标用户和关联用户之间的差异信息构建第一损失函数之后，将目标行为数据和关联行为数据作为训练样本，利用目标用户对应的推荐模型分别对目标行为数据和关联行为数据进行处理，根据处理结果和第一损失函数计算第一损失值，以及根据处理结果和推荐模型对应的第二损失函数计算第二损失值，以便于后续基于第一损失值和第二损失值多推荐模型进行调参。

实际应用中，还可以对第一损失函数和第二损失函数进行合并后生成目标损失函数，将目标损失函数作为推荐模型的损失函数对推荐模型进行训练，可以为第一损失函数设置超参数后，对第一损失函数、超参数和第二损失函数进行合并。

具体实施时，目标损失函数可以通过下述公式（3）确定。

（3）

其中，表示第二损失函数，/>表示控制公平性约束和推荐模型准确性约束之间平衡的超参数，/>表示目标损失函数。通过最小化总体损失函数，可以在保证给定推荐模型推荐质量的同时，提升模型在用户表现上的公平性，避免推荐模型偏向于某一用户群体。

进一步的，在基于目标用户的目标行为数据与关联用户的关联行为数据之间的差异信息构建了第一损失函数后，即可对目标用户的推荐模型进行模型训练，考虑到推荐模型具有其对应的第二损失函数，因此可以分别计算每个损失函数的损失值，进而对推荐模型进行调参，具体实现如下：

对所述目标行为数据和所述关联行为数据进行组合，根据组合结果确定行为数据集合；在所述行为数据集合中选择目标样本，并确定所述目标样本的样本标签；将所述目标样本输入所述目标用户对应的推荐模型，获得预测数据；基于所述预测数据、所述样本标签和所述第一损失函数计算第一损失值；基于所述预测数据、所述样本标签和所述第二损失函数计算第二损失值。

具体的，行为数据集合即为基于目标行为数据和关联行为数据生成的数据集，目标行为数据和关联行为数据均为数据集中的一条数据，用于作为模型训练的样本对推荐模型进行训练；目标样本即为在行为数据集合中选择的任意一条行为数据；样本标签即为与目标样本对应的标签，用于在将目标样本输入至推荐模型进行预测，获得预测数据后，基于预测数据、样本标签以及损失函数对推荐模型进行调参。

基于此，对目标用户的目标行为数据和关联用户的关联行为数据进行组合，根据组合结果确定行为数据集合。在行为数据集合中选择目标样本，并确定目标样本的样本标签，将目标样本输入目标用户对应的推荐模型，获得预测数据。基于预测数据、样本标签和第一损失函数计算第一损失值，基于预测数据、样本标签和第二损失函数计算第二损失值。

沿用上例，对用户A的行为数据：播放了歌曲1；分享了歌曲1；点赞了歌曲1；播放了歌曲2；播放了歌曲3。以及关联用户-用户B的行为数据：播放了歌曲1；分享了歌曲2；点赞了歌曲2；播放了歌曲2；播放了歌曲3，进行整合，获得包含：播放了歌曲1；分享了歌曲1；点赞了歌曲1；播放了歌曲2；分享了歌曲2；点赞了歌曲2；播放了歌曲3，的行为数据集合，在行为数据集合中选择数据：播放了歌曲1，并将其输入至推荐模型进行预测，获得预测数据：A类歌曲，并基于A类歌曲、样本标签以及第一损失函数计算第一损失值，以及基于A类歌曲、样本标签以及第二损失函数计算第二损失值。

综上所述，基于预测数据、样本标签和第一损失函数计算第一损失值；基于预测数据、样本标签和第二损失函数计算第二损失值，进而便于基于第一损失值和第二损失值对推荐模型进行调参，从而实现对推荐模型进行调参时，将目标用户和关联用户之间的差异作为影响因子，从而在对推荐模型进行训练时考虑目标用户和关联用户之间的差异性，提高为用户进行推荐的公平性，

步骤S208，根据所述第一损失值和所述第二损失值对所述推荐模型进行调参，直至获得满足训练停止条件的目标推荐模型。

具体的，在上述利用目标用户对应的推荐模型对目标行为数据和关联行为数据进行处理，根据处理结果和第一损失函数计算第一损失值，以及根据处理结果和推荐模型对应的第二损失函数计算第二损失值之后，即可根据第一损失值和第二损失值对推荐模型进行调参，直至获得满足训练停止条件的目标推荐模型，其中，目标推荐模型即为对推荐模型进行训练后，获得的能够实现推荐功能的推荐模型；训练停止条件可以是预测精度达到预设的精度阈值，可以是达到预设的训练轮次或训练时间等。

基于此，根据第一损失值和第二损失值对推荐模型进行调参，并选择训练样本输入至调参后的推荐模型继续进行模型训练，直至获得满足训练停止条件的目标推荐模型。目标推荐模型即可用于执行推荐任务。

进一步的，在对推荐模型进行训练时，对推荐模型进行调参后，需要对调参后的推荐模型是否满足训练停止条件进行判断，从而直到将推荐模型训练为满足训练停止条件的目标推荐模型，具体实现如下：

根据所述第一损失值和所述第二损失值对所述推荐模型进行调参；在调参后的推荐模型不满足所述训练停止条件的情况下，执行所述在所述行为数据集合中选择目标样本的步骤；在调参后的推荐模型满足所述训练停止条件的情况下，将调参后的推荐模型作为目标推荐模型。

具体的，训练停止条件可以是对推荐模型进行调参后，再从数据集合中选择目标样本输入至调参后的推荐模型，基于推荐模型的预测结果、目标样本的样本标签、第一损失函数以及第二损失函数进行计算获得的损失值未达到预设的损失值阈值；训练停止条件还可以是推荐模型未达到预设的训练轮次；训练停止条件还可以是调参后的推荐模型达到预设的预测精度，本实施例对训练停止条件不做任何限定。

基于此，根据第一损失值和第二损失值对推荐模型进行调参，判断调参后的推荐模型是否满足训练停止条件，在调参后的推荐模型不满足训练停止条件的情况下，在行为数据集合中再次选择样本作为目标样本，进而将目标样本输入至调参后的推荐模型中进行预测，直至再次调参后的推荐模型满足训练停条件；在调参后的推荐模型满足训练停止条件的情况下，将调参后的推荐模型作为目标推荐模型，用于执行后续针对用户的推荐任务。

沿用上例，在行为数据集合中选择数据：播放了歌曲1，并将其输入至推荐模型进行预测，获得预测数据：A类歌曲，并基于A类歌曲、样本标签以及第一损失函数计算第一损失值，以及基于A类歌曲、样本标签以及第二损失函数计算第二损失值。在根据第一损失值和第二损失值对推荐模型进行调参后，调参后的推荐模型不满足训练停止条件的情况下，在行为数据集合中选择下一行为数据：分享了歌曲1，并将其输入至调参后的推荐模型进行预测，获得预测数据，基于行为数据：分享了歌曲1、及其样本标签、第一损失函数和第二损失函数计算损失值，以及再次调参，重复上述模型训练步骤，直到调参后的推荐模型满足训练停止条件。

综上所述，在调参后的推荐模型不满足训练停止条件的情况下，继续选择数据集合中的样本进行训练，从而获得目标推荐模型，便于后续基于目标推荐模型进行推荐。

进一步的，在基于第一损失函数和第二损失函数对推荐模型进行调参时，还可为第一损失函数设置超参数，具体实现如下：

确定所述第一损失函数对应的超参数；基于所述超参数、所述第一损失值和所述第二损失值确定目标损失值，并基于所述目标损失值对所述推荐模型进行调参。

具体的，超参数是指预先设定的模型调优参数，相应的，目标损失值即为基于超参数、第一损失值和第二损失值进行计算获得的总体损失值，用于对推荐模型进行调参。

基于此，根据需求预先设定第一损失函数对应的超参数，基于超参数、第一损失值和第二损失值计算目标损失值，并基于目标损失值对推荐模型进行调参，具体实施时，在计算目标损失值时，可以将第一损失函数与超参数相乘，得到的乘积再与第二损失函数相加，即可获得目标损失值。

综上所述，通过确定第一损失函数对应的超参数，基于超参数、第一损失值和第二损失值确定目标损失值，并基于目标损失值对推荐模型进行调参，使得训练获得的目标推荐模型具有较强的推荐能力，推荐的更准确。

进一步的，在对推荐模型进行训练获得目标推荐模型后，即可基于目标推荐模型进行商品推荐，具体实现如下：

确定商品推荐任务关联的待推荐用户；将所述待推荐用户对应的推荐行为数据输入至所述目标推荐模型，获得所述待推荐用户的推荐商品信息。

具体的，商品推荐任务是指为用户推荐商品的任务，相应的，待推荐用户即为与商品推荐任务关联的用户，即，需要被推荐商品的用户；可以是在接收到待推荐用户的应用程序开启指令后，执行待推荐任务，也可以是在待推荐用户提交商品推荐指令后，执行商品推荐任务；在该任务执行时，将获取待推荐用户的推荐行为数据，即待推荐用户针对商品的历史行为数据，包括但不限于对任意商品的浏览、购买、分享、加入购物车、回购等行为对应的行为数据；推荐商品信息是指目标推荐模型输出的为待推荐用户推荐的待推荐用户可能感兴趣的商品对应的商品信息。

基于此，在接收到待推荐用户提交的商品推荐请求后，对商品推荐请求进行解析，确定商品推荐任务，以及与商品推荐任务关联的待推荐用户。获取待推荐用户的推荐行为数据，将待推荐用户对应的推荐行为数据输入至目标推荐模型，由目标推荐模型输出待推荐用户对应的推荐商品信息。

举例说明，在用户B开启购物应用程序后，或者用户B点击推荐控件后，生成商品推荐任务。获取用户B对应的商品行为数据：购买了复古风格的服饰1。将该商品行为数据输入至目标推荐模型进行处理，由目标推荐模型输出复古风格的服饰2对应的商品信息，并将该商品推荐给用户B。

下述结合附图3，以本说明书提供的基于用户表现公平性训练推荐模型的方法在商品推荐的应用为例，对所述基于用户表现公平性训练推荐模型的方法进行进一步说明。其中，图3是本说明书一实施例提供的一种应用于商品推荐的基于用户表现公平性训练推荐模型的方法的处理流程图，具体包括以下步骤：

步骤S302，确定商品推荐任务对应的用户集合。

在商品推荐场景下，用户集合即为任意购物应用程序的用户组成的集合，包括注册用户和非注册用户。

步骤S304，在用户集合中选择行为数据量小于预设的行为数据量阈值的用户，作为目标用户，并确定目标用户的目标行为数据。

预设数据量阈值，数据量阈值用于将用户集合中的用户划分为优势用户和劣势用户；相应的，优势用户即为行为数据量大于数量阈值的用户，劣势用户即为行为数据量小于行为数据阈值的用户。在用户集合中选择任意劣势用户作为目标用户，以及确定该用户针对商品的购买、分享、浏览、收藏等行为数据。

步骤S306，在用户集合中选择用户数据量大于行为数据量阈值的用户，组成待选择用户组。

将行为数据量大于数据量阈值的用户作为待选择用户，组成待选择用户组，待选择用户组中存储的均为优势用户。

步骤S308，计算待选择用户组中每个待选择用户的用户行为数据和目标行为数据之间的相似度分值。

步骤S310，基于每个待选择用户对应的相似度分值在待选择用户组中确定与目标用户匹配的关联用户。

分别计算待选择用户组中每个优势用户的行为数据与目标用户的行为数据之间的相似度，进而选择相似度较高的优势用户作为与目标用户相似的关联用户。

步骤S312，构建目标用户的目标行为数据对应的目标向量，以及构建关联用户的关联行为数据对应的关联向量。

步骤S314，计算目标向量和关联向量之间的向量差异，并基于向量差异生成差异信息。

差异信息通过上述公式（1）。

步骤S316，基于差异信息和目标用户的数量构建第一损失函数。

第一损失函数通过上述公式（2）构建。

步骤S318，对目标行为数据和关联行为数据进行组合，根据组合结果确定行为数据集合。

对用户1的行为数据：购买了服装1；分享了服装1；购买了服装2；将服装3加入购物车。以及关联用户-用户2的行为数据：购买了服装1；分享了服装1；购买了服装2；购买了服装3，进行整合，获得包含：购买了服装1；分享了服装1；购买了服装2；将服装3加入购物车；购买了服装3的行为数据集合。

步骤S320，在行为数据集合中选择目标样本，并确定目标样本的样本标签，将目标样本输入目标用户对应的推荐模型，获得预测数据。

步骤S322，基于第一损失函数和推荐模型对应的第二损失函数构建目标损失函数。

目标损失函数可以通过上述公式（3）确定。通过最小化总体损失函数，可以在保证给定推荐模型推荐质量的同时，提升模型在用户表现上的公平性，避免推荐模型偏向于某一用户群体。

步骤S324，基于预测数据、样本标签和目标损失函数对推荐模型进行调参。

在行为数据集合中选择数据：购买了服装1，并将其输入至推荐模型进行预测，获得预测数据：A类服装，并基于A类服装、样本标签以及目标损失函数对推荐模型进行调参。

步骤S326，判断调参后的推荐模型是否满足训练停止条件，若是，执行步骤S328；若否，执行步骤S320。

步骤S328，将调参后的推荐模型作为目标推荐模型。

步骤S330，确定商品推荐任务关联的待推荐用户。

步骤S332，将待推荐用户对应的推荐行为数据输入至目标推荐模型，获得待推荐用户的推荐商品信息。

综上所述，对推荐模型进行调参时，将目标用户和关联用户之间的差异作为影响因子，从而在对推荐模型进行训练时考虑目标用户和关联用户之间的差异性，提高为用户进行推荐的公平性，提高推荐模型为不同用户进行推荐时的推荐公平性，使得不同用户获得平等质量的推荐结果，进而提高用户体验。

图4是本说明书一实施例提供的一种基于用户表现公平性训练推荐模型的方法的流程图，如图4所示，在推荐模型进行训练之前，通过对推荐模型的损失函数进行更新实现对推荐模型的更新，使得在其训练过程中增加公平性约束，从而让优势用户与劣势用户的学习结果不断靠近，达到平衡两种用户群体的目的。

采用聚类算法，为每一个劣势用户寻找与其相似的优势用户组成优势用户集合。由于推荐模型在训练过程中会偏向于优势用户，所以优势用户通常会获得更好的学习结果，例如更加充分的特征挖掘，质量更好的特征表示等。考虑到劣势用户和优势用户之间存在潜在的相似关联，如果劣势用户可以向对应的相似优势用户学习，就可以提升劣势用户的学习质量。

由于用户与物品的交互可以直接体现用户特征，所以可以通过相同的交互物品衡量用户之间的相似度。交互过的相同物品数量越多，说明用户之间越相似。本说明书一实施例可以采用K-means等聚类技术为每个劣势用户寻找其对应的相似优势用户，便于后续的模型训练。在为每一个劣势用户寻找到对应的相似优势用户并组成优势用户集合后，计算每一个劣势用户和其对应的优势用户集合之间的特征表示差异整合所有劣势用户和其对应的相似优势用户的特征表示差异，并计算总体的公平性损失函数。将公平性损失函数和推荐模型原有的推荐模型损失函数合并，得到目标损失函数，进而实现对推荐模型的更新。

与上述方法实施例相对应，本说明书还提供了基于用户表现公平性训练推荐模型的装置实施例，图5是本说明书一实施例提供的一种基于用户表现公平性训练推荐模型的装置的结构示意图。如图5所示，该装置包括：

确定模块502，被配置为确定目标用户，以及与所述目标用户相似的关联用户；

生成模块504，被配置为基于所述目标用户的目标行为数据和所述关联用户的关联行为数据生成差异信息，并基于所述差异信息构建第一损失函数；

处理模块506，被配置为利用所述目标用户对应的推荐模型对所述目标行为数据和所述关联行为数据进行处理，根据处理结果和所述第一损失函数计算第一损失值，以及根据处理结果和所述推荐模型对应的第二损失函数计算第二损失值；

训练模块508，被配置为根据所述第一损失值和所述第二损失值对所述推荐模型进行调参，直至获得满足训练停止条件的目标推荐模型。

一个可选地实施例，所述确定模块502进一步被配置为：

一个可选地实施例，所述生成模块504进一步被配置为：

所述差异信息通过下述公式生成：

所述第一损失函数通过下述公式构建：

一个可选地实施例，所述处理模块506进一步被配置为：

对所述目标行为数据和所述关联行为数据进行组合，根据组合结果确定行为数据集合；在所述行为数据集合中选择目标样本，并确定所述目标样本的样本标签；将所述目标样本输入所述目标用户对应的推荐模型，获得预测数据；于所述预测数据、所述样本标签和所述第一损失函数计算第一损失值；基于所述预测数据、所述样本标签和所述第二损失函数计算第二损失值。

一个可选地实施例，所述处理模块506进一步被配置为：

一个可选地实施例，所述训练模块508进一步被配置为：

一个可选地实施例，所述训练模块508还被配置为：

上述为本实施例的一种基于用户表现公平性训练推荐模型的装置的示意性方案。需要说明的是，该基于用户表现公平性训练推荐模型的装置的技术方案与上述的基于用户表现公平性训练推荐模型的方法的技术方案属于同一构思，基于用户表现公平性训练推荐模型的装置的技术方案未详细描述的细节内容，均可以参见上述基于用户表现公平性训练推荐模型的方法的技术方案的描述。

图6是本说明书一实施例提供的一种推荐方法的流程图，具体包括以下步骤：

步骤S602，获取待推荐用户提交的浏览请求；

步骤S604，根据所述浏览请求确定所述待推荐用户的对象行为数据，将所述对象行为数据输入至目标推荐模型进行处理，获得对象推荐信息；

步骤S606，根据所述对象推荐信息生成对象推荐页面，作为所述浏览请求的响应。

综上所述，获取待推荐用户提交的浏览请求，根据浏览请求确定待推荐用户的对象行为数据，将对象行为数据输入至目标推荐模型进行处理，获得对象推荐信息，根据对象推荐信息生成对象推荐页面，作为浏览请求的响应。通过目标推荐模型对待推荐用户进行商品推荐，从而提高针对用户进行商品推荐的效率以及准确性。

与上述方法实施例相对应，本说明书还提供了推荐装置实施例，图7是本说明书一实施例提供的一种推荐装置的结构示意图。如图7所示，该装置包括：

获取模块702，被配置为获取待推荐用户提交的浏览请求；

处理模块704，被配置为根据所述浏览请求确定所述待推荐用户的对象行为数据，将所述对象行为数据输入至目标推荐模型进行处理，获得对象推荐信息；

生成模块706，被配置为根据所述对象推荐信息生成对象推荐页面，作为所述浏览请求的响应。

图8是本说明书一实施例提供的一种基于用户表现公平性训练商品推荐模型的方法的流程图，具体包括以下步骤：

步骤S802，确定目标用户，以及与所述目标用户相似的关联用户；

步骤S804，基于所述目标用户在所述购物平台产生的目标行为数据，和所述关联用户在所述购物平台产生的关联行为数据生成差异信息，并基于所述差异信息构建第一损失函数；

步骤S806，利用所述目标用户对应的商品推荐模型对所述目标行为数据和所述关联行为数据进行处理，根据处理结果和所述第一损失函数计算第一损失值，以及根据处理结果和所述商品推荐模型对应的第二损失函数计算第二损失值；

步骤S808，根据所述第一损失值和所述第二损失值对所述商品推荐模型进行调参，直至获得满足训练停止条件的目标商品推荐模型。

综上所述，通过利用目标用户对应的推荐模型对目标行为数据和关联行为数据进行处理，根据处理结果和第一损失函数计算第一损失值，以及根据处理结果和推荐模型对应的第二损失函数计算第二损失值，进而根据第一损失值和第二损失值对推荐模型进行调参，从而实现对推荐模型进行调参时，将目标用户和关联用户之间的差异作为影响因子，从而在对推荐模型进行训练时考虑目标用户和关联用户之间的差异性，提高为用户进行推荐的公平性，提高推荐模型为不同用户进行推荐时的推荐公平性，使得不同用户获得平等质量的推荐结果，进而提高用户体验。

与上述方法实施例相对应，本说明书还提供了基于用户表现公平性训练推荐模型的装置实施例，图9是本说明书一实施例提供的一种基于用户表现公平性训练商品推荐模型的装置的结构示意图。如图9所示，该装置包括：

确定模块902，被配置为确定目标用户，以及与所述目标用户相似的关联用户；

构建模块904，被配置为基于所述目标用户在所述购物平台产生的目标行为数据，和所述关联用户在所述购物平台产生的关联行为数据生成差异信息，并基于所述差异信息构建第一损失函数；

计算模块906，被配置为利用所述目标用户对应的商品推荐模型对所述目标行为数据和所述关联行为数据进行处理，根据处理结果和所述第一损失函数计算第一损失值，以及根据处理结果和所述商品推荐模型对应的第二损失函数计算第二损失值；

训练模块908，被配置为根据所述第一损失值和所述第二损失值对所述商品推荐模型进行调参，直至获得满足训练停止条件的目标商品推荐模型。

图10是本说明书一实施例提供的一种商品推荐方法的流程图，具体包括以下步骤：

步骤S1002，获取商品用户提交的商品浏览请求；

步骤S1004，根据所述商品浏览请求确定所述商品用户的商品行为数据，将所述商品行为数据输入至目标商品推荐模型进行处理，获得商品推荐信息；

步骤S1006，根据所述商品推荐信息生成商品推荐页面，作为所述商品浏览请求的响应。

综上所述，获取商品用户提交的商品浏览请求，根据商品浏览请求确定商品用户的商品行为数据，将商品行为数据输入至目标商品推荐模型进行处理，获得商品推荐信息，根据商品推荐信息生成商品推荐页面，作为商品浏览请求的响应。通过目标推荐模型对待推荐用户进行商品推荐，从而提高针对用户进行商品推荐的效率以及准确性。

与上述方法实施例相对应，本说明书还提供了商品推荐装置实施例，图11是本说明书一实施例提供的一种商品推荐装置的结构示意图。如图11所示，该装置包括：

获取模块1102，被配置为获取商品用户提交的商品浏览请求；

处理模块1104，被配置为根据所述商品浏览请求确定所述商品用户的商品行为数据，将所述商品行为数据输入至目标商品推荐模型进行处理，获得商品推荐信息；

生成模块1106，被配置为根据所述商品推荐信息生成商品推荐页面，作为所述商品浏览请求的响应。

上述为本实施例的装置的示意性方案。需要说明的是，该装置的技术方案与上述的方法的技术方案属于同一构思，装置的技术方案未详细描述的细节内容，均可以参见上述方法的技术方案的描述。

图12是根据本说明书一实施例提供的一种计算设备1200的结构框图。该计算设备1200的部件包括但不限于存储器1210和处理器1220。处理器1220与存储器1210通过总线1230相连接，数据库1250用于保存数据。

计算设备1200还包括接入设备1240，接入设备1240使得计算设备1200能够经由一个或多个网络1260通信。这些网络的示例包括公用交换电话网（PSTN）、局域网（LAN）、广域网（WAN）、个域网（PAN）或诸如因特网的通信网络的组合。接入设备1240可以包括有线或无线的任何类型的网络接口（例如，网络接口卡（NIC））中的一个或多个，诸如IEEE802.11无线局域网（WLAN）无线接口、全球微波互联接入（Wi-MAX）接口、以太网接口、通用串行总线（USB）接口、蜂窝网络接口、蓝牙接口、近场通信（NFC）接口，等等。

在本说明书的一个实施例中，计算设备1200的上述部件以及图12中未示出的其他部件也可以彼此相连接，例如通过总线。应当理解，图12所示的计算设备结构框图仅仅是出于示例的目的，而不是对本说明书范围的限制。本领域技术人员可以根据需要，增添或替换其他部件。

计算设备1200可以是任何类型的静止或移动计算设备，包括移动计算机或移动计算设备（例如，平板计算机、个人数字助理、膝上型计算机、笔记本计算机、上网本等）、移动电话（例如，智能手机）、可佩戴的计算设备（例如，智能手表、智能眼镜等）或其他类型的移动设备，或者诸如台式计算机或PC的静止计算设备。计算设备1200还可以是移动式或静止式的服务器。

其中，处理器1220用于执行如下计算机可执行指令，该计算机可执行指令被处理器执行时实现上述方法的步骤。

上述为本实施例的一种计算设备的示意性方案。需要说明的是，该计算设备的技术方案与上述的方法的技术方案属于同一构思，计算设备的技术方案未详细描述的细节内容，均可以参见上述方法的技术方案的描述。

本说明书一实施例还提供一种计算机可读存储介质，其存储有计算机指令，该指令被处理器执行时实现上述方法的步骤。

上述为本实施例的一种计算机可读存储介质的示意性方案。需要说明的是，该存储介质的技术方案与上述方法的技术方案属于同一构思，存储介质的技术方案未详细描述的细节内容，均可以参见上述方法的技术方案的描述。

上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者可能是有利的。

所述计算机指令包括计算机程序代码，所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括：能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器（ROM，Read-Only Memory）、随机存取存储器（RAM，Random Access Memory）、电载波信号、电信信号以及软件分发介质等。需要说明的是，所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减，例如在某些司法管辖区，根据立法和专利实践，计算机可读介质不包括电载波信号和电信信号。

需要说明的是，对于前述的各方法实施例，为了简便描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本说明书并不受所描述的动作顺序的限制，因为依据本说明书，某些步骤可以采用其它顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作和模块并不一定都是本说明书所必须的。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其它实施例的相关描述。

以上公开的本说明书优选实施例只是用于帮助阐述本说明书。可选实施例并没有详尽叙述所有的细节，也不限制该发明仅为所述的具体实施方式。显然，根据本说明书的内容，可作很多的修改和变化。本说明书选取并具体描述这些实施例，是为了更好地解释本说明书的原理和实际应用，从而使所属技术领域技术人员能很好地理解和利用本说明书。本说明书仅受权利要求书及其全部范围和等效物的限制。

Claims

1.一种基于用户表现公平性训练推荐模型的方法，其特征在于，包括：

确定目标用户，以及与所述目标用户相似的关联用户；

2.根据权利要求1所述的方法，其特征在于，所述确定目标用户，以及与所述目标用户相似的关联用户，包括：

确定推荐业务对应的用户集合；

3.根据权利要求2所述的方法，其特征在于，所述在所述用户集合中选择与所述目标用户匹配的用户，作为关联用户，包括：

确定所述目标用户的目标行为数据；

4.根据权利要求1所述的方法，其特征在于，所述基于所述目标用户的目标行为数据和所述关联用户的关联行为数据生成差异信息，并基于所述差异信息构建第一损失函数，包括：

5.根据权利要求1-4任一项所述的方法，其特征在于，所述差异信息通过下述公式生成：

其中，表示目标用户；/>表示与目标用户相似的关联用户组成的关联用户集合；/>表示目标用户/>的目标行为数据的嵌入特征表示；/>表示关联用户集合中任意一个关联用户；表示关联用户集合中关联用户/>的关联行为数据的嵌入特征表示；/>表示对给定向量集合进行按位平均计算；

所述第一损失函数通过下述公式构建：

6.根据权利要求1所述的方法，其特征在于，所述利用所述目标用户对应的推荐模型对所述目标行为数据和所述关联行为数据进行处理，根据处理结果和所述第一损失函数计算第一损失值，以及根据处理结果和所述推荐模型对应的第二损失函数计算第二损失值，包括：

7.根据权利要求6所述的方法，其特征在于，所述根据所述第一损失值和所述第二损失值对所述推荐模型进行调参，直至获得满足训练停止条件的目标推荐模型，包括：

8.根据权利要求1所述的方法，其特征在于，所述根据所述第一损失值和所述第二损失值对所述推荐模型进行调参，包括：

确定所述第一损失函数对应的超参数；

9.根据权利要求1所述的方法，其特征在于，所述方法，还包括：

确定商品推荐任务关联的待推荐用户；

10.一种推荐方法，其特征在于，包括：

获取待推荐用户提交的浏览请求；

根据所述浏览请求确定所述待推荐用户的对象行为数据，将所述对象行为数据输入至权利要求1-9任一项所述方法中的目标推荐模型进行处理，获得对象推荐信息；

11.一种基于用户表现公平性训练商品推荐模型的方法，其特征在于，应用于购物平台，包括：

确定目标用户，以及与所述目标用户相似的关联用户；

12.一种商品推荐方法，其特征在于，应用于购物平台，包括：

获取商品用户提交的商品浏览请求；

根据所述商品浏览请求确定所述商品用户的商品行为数据，将所述商品行为数据输入至权利要求11所述方法中的目标商品推荐模型进行处理，获得商品推荐信息；

13.一种基于用户表现公平性训练推荐模型的装置，其特征在于，包括：

14.一种推荐装置，其特征在于，包括：

获取模块，被配置为获取待推荐用户提交的浏览请求；

处理模块，被配置为根据所述浏览请求确定所述待推荐用户的对象行为数据，将所述对象行为数据输入至权利要求1-9任一项所述方法中的目标推荐模型进行处理，获得对象推荐信息；

15.一种基于用户表现公平性训练商品推荐模型的装置，其特征在于，应用于购物平台，包括：

16.一种商品推荐装置，其特征在于，应用于购物平台，包括：

获取模块，被配置为获取商品用户提交的商品浏览请求；

处理模块，被配置为根据所述商品浏览请求确定所述商品用户的商品行为数据，将所述商品行为数据输入至权利要求11所述方法中的目标商品推荐模型进行处理，获得商品推荐信息；

17.一种计算设备，其特征在于，包括存储器和处理器；所述存储器用于存储计算机可执行指令，所述处理器用于执行所述计算机可执行指令，以实现权利要求1至12任意一项所述方法的步骤。

18.一种计算机可读存储介质，其存储有计算机指令，其特征在于，该指令被处理器执行时实现权利要求1至12任意一项所述方法的步骤。