CN111460191A

CN111460191A - 推荐方法、装置、电子设备及可读存储介质

Info

Publication number: CN111460191A
Application number: CN202010117855.8A
Authority: CN
Inventors: 王文斌; 罗震
Original assignee: Beijing Sankuai Online Technology Co Ltd
Current assignee: Beijing Sankuai Online Technology Co Ltd
Priority date: 2020-02-25
Filing date: 2020-02-25
Publication date: 2020-07-28

Abstract

本公开提供了一种推荐方法、装置、电子设备及可读存储介质，所述方法包括：获取训练样本，所述训练样本包括样本图像；将所述样本图像输入至预设模型，得到预设数量的有序位置对应的训练得分；根据任意一个有序位置对应的训练得分与相邻有序位置对应的训练得分之间的大小关系，是否符合所述有序位置和所述相邻有序位置的预设顺序，确定顺序损失值；根据所述顺序损失值对所述预设模型进行训练得到质量预测模型；采用所述质量预测模型预测待推荐图像的质量得分，以根据所述质量得分对所述待推荐图像进行推荐。本公开可以提高质量预测模型的准确度和推荐的准确度。

Description

推荐方法、装置、电子设备及可读存储介质

技术领域

本公开涉及个性化推荐技术领域，尤其涉及一种推荐方法、装置、电子设备及可读存储介质。

背景技术

在个性化推荐技术领域中，图像作为一种常见的推荐对象，可以预估图像的质量得分并根据图像的质量得分对图像进行推荐。

现有技术中，一种常用的图像推荐方法主要包括：首先，将待推荐图像输入至预先训练得到的质量预测模型，得到该图像的一个质量得分，该质量预测模型可以是基于图像的特征信息和图像质量等信息训练得到的，其中，图像质量可以为是图像的点击率等；然后，向用户推荐质量得分较高的待推荐图像。

发明人对上述方案进行研究之后发现，上述质量预测模型对待推荐图像的质量得分的预测准确度较低，进而导致推荐的准确度较低。

发明内容

本公开提供一种推荐方法、装置、电子设备及可读存储介质，可以在训练质量预测模型时对于每个样本图像均输出至少两个有序位置对应的训练得分，并根据训练得分在顺序上的损失值对质量预估模型进行训练，有助于提高质量预测模型的准确度，进而提高推荐的准确度。

根据本公开的第一方面，提供了一种推荐方法，所述方法包括：

获取训练样本，所述训练样本包括样本图像；

将所述样本图像输入至预设模型，得到预设数量的有序位置对应的训练得分；

根据任意一个有序位置对应的训练得分与相邻有序位置对应的训练得分之间的大小关系，是否符合所述有序位置和所述相邻有序位置的预设顺序，确定顺序损失值；

根据所述顺序损失值对所述预设模型进行训练得到质量预测模型；

采用所述质量预测模型预测待推荐图像的质量得分，以根据所述质量得分对所述待推荐图像进行推荐。

根据本公开的第二方面，提供了一种推荐装置，所述装置包括：

训练样本获取模块，用于获取训练样本，所述训练样本包括样本图像；

训练得分预测模块，用于将所述样本图像输入至预设模型，得到预设数量的有序位置对应的训练得分；

顺序损失值确定模块，用于根据任意一个有序位置对应的训练得分与相邻有序位置对应的训练得分之间的大小关系，是否符合所述有序位置和所述相邻有序位置的预设顺序，确定顺序损失值；

质量预测模型训练模块，用于根据所述顺序损失值对所述预设模型进行训练得到质量预测模型；

图像推荐模块，用于采用所述质量预测模型预测待推荐图像的质量得分，以根据所述质量得分对所述待推荐图像进行推荐。

根据本公开的第三方面，提供了一种电子设备，包括：

处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述程序时实现前述推荐方法。

根据本公开的第四方面，提供了一种可读存储介质，当所述存储介质中的指令由电子设备的处理器执行时，使得电子设备能够执行前述推荐方法。

本公开提供了一种推荐方法、装置、电子设备及可读存储介质，可以首先获取训练样本，所述训练样本包括样本图像；然后将所述样本图像输入至预设模型，得到预设数量的有序位置对应的训练得分；并根据任意一个有序位置对应的训练得分与相邻有序位置对应的训练得分之间的大小关系，是否符合所述有序位置和所述相邻有序位置的预设顺序，确定顺序损失值；最后根据所述顺序损失值对所述预设模型进行训练得到质量预测模型；从而采用所述质量预测模型预测待推荐图像的质量得分，以根据所述质量得分对所述待推荐图像进行推荐。本公开可以在训练质量预测模型时对于每个样本图像均输出至少两个有序位置对应的训练得分，并根据训练得分在顺序上的损失值对质量预估模型进行训练，有助于提高质量预测模型的准确度，进而提高推荐的准确度。

附图说明

为了更清楚地说明本公开的技术方案，下面将对本公开的描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本公开的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1示出了本公开的推荐方法的步骤流程图；

图2示出了本公开的质量预测模型的结构示意图；

图3示出了本公开的处理层的一种结构示意图；

图4示出了本公开的特征交互层的一种结构示意图；

图5示出了本公开的推荐装置的结构图；

图6示出了本公开的电子设备的结构图。

具体实施方式

下面将结合本公开中的附图，对本公开中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本公开一部分实施例，而不是全部的实施例。基于本公开中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本公开保护的范围。

本公开的实施例可以应用于后台服务器中，后台服务器和对应的客户端构成一个完整的个性化推荐平台。具体地，用户可以在客户端上进行操作，客户端根据用户的操作生成数据请求并发送给后台服务器，后台服务器用于根据数据请求生成图像数据，以返回至客户端向用户展示。

参照图1，其示出了本公开的推荐方法的步骤流程图，具体如下：

步骤101，获取训练样本，所述训练样本包括样本图像。

其中，样本图像是用于训练的图像，可以从网络上下载或从图像库中获取。

样本图像可以通过如下过程得到：首先，获取大量的图像作为初始图像；然后，按照预设的清洗规则对初始图像进行清洗，并将满足清洗规则的初始图像作为样本图像，其中，清洗规则可以包括但不限于：图像在最近时间段内的展示次数需满足最小图像展示次数、图像在最近时间段内的点击次数需满足最小图像点击次数、图像的提供方在最近时间段内的展示次数需满足最小提供方展示次数、图像的提供方在最近时间段内的点击次数满足最小提供方点击次数。

为了提高质量预测模型的泛化能力，还可以根据满足黑名单的负例图像扩充训练样本。其中，黑名单中可以包含负例图像所满足的规则，包括但不限于：基于图像类型的规则、基于图像内容的规则。例如，基于图像类型的规则可以为图像类型不是某种类型；基于图像内容的规则可以为样本图像中不包含指定内容。

此外，为了进一步提高质量预测模型的泛化能力，还可以根据提供方自定义且有历史点击的正例图像扩充训练样本。

步骤102，将所述样本图像输入至预设模型，得到预设数量的有序位置对应的训练得分。

其中，预设模型可以为具有预测功能的任意深度学习模型。该深度学习模型可以根据输入的样本图像输出多个有序位置的质量得分，为了方便区分，在训练时预测的样本图像的质量得分称为训练得分。该多个位置是有序的，即位置为有序位置，每个有序位置对应一个质量得分。可以理解，有序位置的数目可以根据实际应用场景设定，本公开的实施例对其不加以限制。

表1

如表1，示出了理想情况下有序位置的质量得分与样本图像的质量之间的关系，表1中包含有4个有序位置：第一位置、第二位置、第三位置和第四位置，当仅第一位置的质量得分为1时，样本图像的质量为极差；当第一位置的质量得分和第二位置的质量得分均为1时，样本图像的质量为差；当第一位置的质量得分、第二位置的质量得分和第三位置的质量得分均为1时，样本图像的质量为中；当4个位置的质量得分均为1时，样本图像的质量为好。

从表1中可以看出，第一位置的质量得分不可能小于第二位置的质量得分、第三位置的质量得分和第四位置的质量得分，第二位置的质量得分不可能小于第三位置的质量得分和第四位置的质量得分，第三位置的质量得分不可能小于第四位置的质量得分，即：第一位置、第二位置、第三位置和第四位置是有序的。

表2

当然，在实际应用中，还可以设定相反的有序方向，以得到表2所示的有序位置的质量得分与样本图像的质量之间的关系：第四位置的质量得分不可能小于第一位置的质量得分、第二位置的质量得分和第三位置的质量得分，第三位置的质量得分不可能小于第一位置的质量得分和第二位置的质量得分，第二位置的质量得分不可能小于第一位置的质量得分。为方便说明，后续以表1中的关系为例进行说明。

需要说明的是，在训练时，样本图像的样本得分为表1或表2中的0或1，而在应用时，质量预测模型输出的有序位置对应的质量得分可以为0至1之间的数值。

步骤103，根据任意一个有序位置对应的训练得分与相邻有序位置对应的训练得分之间的大小关系，是否符合所述有序位置和所述相邻有序位置的预设顺序，确定顺序损失值。

其中，顺序损失值具体可以按照如下过程确定：若任意一个有序位置的训练得分和与相邻有序位置的顺序均一致，则可以确定一个较小的数值作为顺序损失值；若其中一个有序位置的训练得分和与相邻有序位置的顺序一致，但其余有序位置的训练得分和与相邻有序位置的顺序不一致，则可以确定一个较大的数值作为顺序损失值；若所有有序位置的训练得分和与相邻有序位置的顺序均不一致，则可以确定一个最大的数值作为顺序损失值。

步骤104，根据所述顺序损失值对所述预设模型进行训练得到质量预测模型。

在本公开的一种实施例中，若顺序损失值在多轮迭代中未持续变小，则停止训练；若顺序损失值在多轮迭代中持续变小，则根据顺序损失值对预设模型的梯度调整预设模型的参数，以使下一轮迭代之后的顺序损失值变得更小。

上述过程中的顺序损失值考虑了有序位置之间的预设顺序，从而可以使得质量预测模型可以准确的预测质量得分，避免预测的有序位置的质量得分不符合预设顺序。

步骤105，采用所述质量预测模型预测待推荐图像的质量得分，以根据所述质量得分对所述待推荐图像进行推荐。

在推荐过程中，可以根据每个有序位置的质量得分单独决策，向用户推荐待推荐图像。具体地，首先，针对每个待推荐图像，若待推荐图像的每个有序位置对应的质量得分均大于该有序位置的质量阈值，则可以将该待推荐图像作为候选图像；然后，按照有序位置的质量得分之和或平均值对候选图像进行排序，以推荐给用户。

此外，还可以将所有有序位置的质量得分计算综合质量得分，以将综合质量得分最大的一个或多个待推荐图像，按照综合质量得分降序排列，以推荐给用户。其中，综合质量得分可以为各有序位置的质量得分的和或平均值。

可选地，在本公开的另一种实施例中，所述步骤103包括子步骤A1至A3：

子步骤A1，针对每个有序位置和所述有序位置的相邻有序位置，若所述有序位置的训练得分与所述相邻有序位置的训练得分的大小顺序，与所述有序位置和所述相邻有序位置的预设顺序一致，则确定所述有序位置的顺序子损失值为0。

可以理解，若有序位置对应的训练得分与有序位置之间的顺序一致，则代表训练得分在大小顺序上不存在损失。例如，对于四个有序位置，第一位置POS1、第二位置POS2、第三位置POS3和第四位置POS4，其对应的训练得分分别为TSR1、TSR2、TSR3和TSR4，且TSR1>TSR2>TSR3>TSR4，若POS1、POS2、POS3和POS4的预设顺序为：POS1的质量得分不可能小于POS2、POS3和POS4的质量得分，POS2的质量得分不可能小于POS3和POS4的质量得分，POS3的质量得分不可能小于POS4的质量得分，则对于相邻的POS1和POS2，由于TSR1>TSR2，其与预设顺序一致，从而有序位置POS2的顺序子损失值为0；对于相邻的POS2和POS3，由于TSR2>TSR3，其与预设顺序一致，从而有序位置POS3的顺序子损失值为0；对于相邻的POS3和POS4，由于TSR3>TSR4，其与预设顺序一致，从而有序位置POS4的顺序子损失值为0。

子步骤A2，针对每个有序位置和所述有序位置的相邻有序位置，若所述有序位置的训练得分与所述相邻有序位置的训练得分的大小顺序，与所述有序位置和所述相邻有序位置的预设顺序不一致，则确定所述有序位置的顺序子损失值为所述有序位置的训练得分和所述相邻有序位置的训练得分的差值的绝对值。

可以理解，若有序位置对应的训练得分与有序位置之间的顺序不一致，则代表训练得分在大小顺序上存在损失。例如，对于四个有序位置，第一位置POS1、第二位置POS2、第三位置POS3和第四位置POS4，其对应的训练得分分别为TSR1、TSR2、TSR3和TSR4，且TSR1<TSR2<TSR3<TSR4，若POS1、POS2、POS3和POS4的预设顺序为：POS1的质量得分不可能小于POS2、POS3和POS4的质量得分，POS2的质量得分不可能小于POS3和POS4的质量得分，POS3的质量得分不可能小于POS4的质量得分，则对于相邻的POS1和POS2，由于TSR1<TSR2，其与预设顺序不一致，从而有序位置POS2的顺序子损失值为|TSR1-TSR2|；对于相邻的POS2和POS3，由于TSR2<TSR3，其与预设顺序不一致，从而有序位置POS3的顺序子损失值为|TSR2-TSR3|；对于相邻的POS3和POS4，由于TSR3<TSR4，其与预设顺序不一致，从而有序位置POS4的顺序子损失值为|TSR3-TSR4|。

在本公开的实施例中，由于不限定预设顺序的方向性，即可以为POS1的质量得分不可能小于POS2、POS3和POS4的质量得分，POS2的质量得分不可能小于POS3和POS4的质量得分，POS3的质量得分不可能小于POS4的质量得分，还可以为POS4的质量得分不可能小于POS1、POS2和POS3的质量得分，POS3的质量得分不可能小于POS1和POS2的质量得分，POS2的质量得分不可能小于POS1的质量得分，从而这里采用了相邻两个位置的训练得分的差值的绝对值作为顺序损失值。

子步骤A3，结合各所述有序位置的顺序子损失值确定顺序损失值。

具体地，顺序损失值可以按照如下公式计算得到：

其中，LOSS₂为顺序损失值，M为每次迭代使用的训练样本的数目，N为有序位置的数目，例如可以为如表1中的4，SSR_n为第n个有序位置的顺序子损失值。当然，还可以在上述公式(1)的基础上除以N-1，从而得到每个训练样本每两个相邻有序位置的平均损失值，作为顺序损失值。

上述顺序损失值针对不同的预设顺序而不同，若预设顺序为：POS1的质量得分不可能小于POS2、POS3和POS4的质量得分，POS2的质量得分不可能小于POS3和POS4的质量得分，POS3的质量得分不可能小于POS4的质量得分；则第n个有序位置的顺序子损失值SSR_n可以按照如下公式计算得到：

SSR_n＝max[0，-(y'_m,n-1-y'_m,n)] (2)

其中，y'_m,n-1为第m个训练样本的第n-1个有序位置的训练得分，y'_m,n为第m个训练样本的第n个有序位置的训练得分。

从而，基于公式(2)，公式(1)可以变更为如下公式：

此外，若预设顺序为：POS4的质量得分不可能小于POS1、POS2和POS3的质量得分，POS3的质量得分不可能小于POS1和POS2的质量得分，POS2的质量得分不可能小于POS1的质量得分；则第n个有序位置的顺序子损失值SSR_n可以按照如下公式计算得到：

SSR_n＝max[0，(y'_m,n-1-y'_m,n)] (4)

从而，基于公式(4)，公式(1)可以变更为如下公式：

本公开的实施例可以在训练得分的顺序与有序位置的顺序一致时，将顺序子损失值设置为0，在训练得分的顺序与有序位置的顺序不一致时，根据相邻的有序位置的训练得分的差值，将顺序子损失值设置为不同的大小，进而可以准确的确定顺序损失值。

可选地，在本公开的另一种实施例中，所述训练样本还包括：所述有序位置对应的样本得分，所述步骤104包括子步骤B1至B2：

子步骤B1，根据所述有序位置对应的训练得分和所述有序位置对应的样本得分确定得分损失值。

其中，得分损失值可以采用常用的损失函数计算得到，损失函数可以包括但不限于：交叉熵损失函数、绝对值损失函数、均方损失函数等。以交叉熵损失函数为例，可以参照如下公式计算得分损失值LOSS₁：

其中，M为每次迭代使用的训练样本的数目，N为有序位置的数目，例如可以为如表1中的4，y_m,n为第m个训练样本的第n个有序位置的样本得分，y'_m,n为第m个训练样本的第n个有序位置的训练得分。

在上述公式中的样本得分是根据样本图像的质量确定的，具体可以包括：首先，根据点击率、图像清晰度确定每个样本图像的质量，以点击率为例，若点击率小于第一点击率阈值，则确定该样本图像的质量为“极差”，若点击率大于或等于第一点击率阈值，且小于第二点击率阈值，则确定该样本图像的质量为“差”，若点击率大于或等于第二点击率阈值，且小于第三点击率阈值，则确定该样本图像的质量为“中”，若点击率大于或等于第三点击率阈值，则确定该样本图像的质量为“好”；最后，根据样本图像的质量从表1中确定各有序位置的质量得分作为该样本图像对应的样本得分。

需要说明的是，对于步骤101中扩充的负例图像，将这些负例图像的质量确定为“极差”，并从表1中确定质量“极差”对应的各有序位置的质量得分，以作为该负例图像对应的样本得分：第一位置的样本得分为1、第二位置的样本得分为0、第三位置的样本得分为0、第四位置的样本得分为0。

对于步骤101中扩充的正例图像，将这些正例图像的质量得分确定为“好”，并从表1中确定质量“好”对应的各有序位置的质量得分，以作为该正例图像的样本得分：第一位置的样本得分为1、第二位置的样本得分为1、第三位置的样本得分为1、第四位置的样本得分为1。

子步骤B2，根据所述顺序损失值和所述得分损失值对所述预设模型进行训练得到质量预测模型。

具体地，可以将顺序损失值和得分损失值之和作为综合损失值，从而基于综合损失值调整预设模型的参数，或，先根据顺序损失值调整参数再根据得分损失值调整参数，或先根据得分损失值调整参数再根据顺序损失值调整参数。

本公开的实施例可以结合顺序损失值和得分损失值对预设模型进行训练，由于综合了各方面的损失值，从而有助于提高质量预测模型的预测准确度。

可选地，在本公开的另一种实施例中，所述子步骤B2包括子步骤C1至C3：

子步骤C1，计算所述顺序损失值与预设的损失值调整参数的乘积。

可以理解，得分损失值和顺序损失值的取值大小不一定是同一个数量级。例如，若顺序损失值的取值很小，例如，在0.1以下，而得分损失值的取值很大，例如，在100以上，如此会导致顺序损失值的影响较小，从而导致质量预测模型无法分析有序位置的顺序，使得质量预测模型的预测准确度较低。

在本公开的实施例中，为了使得顺序损失值的数量级与得分损失值的数量级相当，需要预先采用损失值调整参数对子步骤A1至A3计算得到的顺序损失值进行调整，从而使得顺序损失值和得分损失值对质量预测模型训练的影响相当，有助于提高质量预测模型的预测准确度。

具体地，可以按照如下公式调整顺序损失值：

LOSS'₂＝λ·LOSS₂ (7)

其中，LOSS'₂为调整后的顺序损失值，λ为损失值调整参数，可以根据子步骤A1至A3计算得到的顺序损失值LOSS₂，与公式(6)计算得到的得分损失值之间的数量级差距设定，本公开的实时例对其不加以限制。

子步骤C2，计算所述得分损失值和所述乘积之和得到综合损失值。

具体地，可以按照如下公式计算得到综合损失值LOSS：

LOSS＝LOSS₁+LOSS'₂＝LOSS₁+λ·LOSS₂ (8)

子步骤C3，根据所述综合损失值对所述预设模型进行训练得到质量预测模型。

本公开的实施例可以将顺序损失值调整为与得分损失值的数量级相当之后，确定综合损失值，可以避免顺序损失值或得分损失值对综合损失值的影响较小导致的质量预测模型的预测准确度较差。

可选地，在本公开的另一种实施例中，所述步骤105包括子步骤D1至D3：

子步骤D1，将所述待推荐图像输入至所述质量预测模型中得到所述有序位置对应的质量得分。

可以理解，在训练过程中预设模型在每轮迭代中会针对每个样本图像输出有序位置的训练得分，在应用过程中质量预测模型会针对待推荐图像生成有序位置对应的质量得分。

子步骤D2，计算所述有序位置对应的质量得分的平均值，得到所述待推荐图像的综合质量得分。

在本公开的实施例中，待推荐图像的综合质量得分为待推荐图像的质量得分的总和与质量得分的数目的比值。例如，基于表1得到4个质量得分：第一位置的质量得分为0.8、第二位置的质量得分为0.2、第三位置的质量得分为0.14，第四位置的质量得分为0.1，从而综合质量得分可以为(0.8+0.2+0.14+0.1)/4＝0.31。

子步骤D3，根据所述待推荐图像的综合质量得分对所述待推荐图像进行推荐。

具体地，可以将综合质量得分最大的待推荐图像推荐给用户；还可以将综合质量得分大于预设质量阈值的待推荐图像，按照综合质量得分降序排列的顺序推荐给用户。

本公开的实施例可以根据多个有序位置的质量得分的平均值准确的确定综合质量得分，以根据综合质量得分向用户推荐待推荐图像。

可选地，在本公开的另一种实施例中，所述预设模型包括：处理层和至少两个输出层，所述处理层包括：第一归一化层、第一全连接层和第一激活层，所述处理层的输入为所述预设模型的输入，所述第一归一化层的输入为所述处理层的输入，所述第一归一化层的输出作为所述第一全连接层的输入，所述第一全连接层的输出作为所述第一激活层的输入，所述第一激活层的输出作为每个所述输出层的输入，每个所述输出层包括：第二全连接层和第二激活层，所述第二全连接层的输入为所述输出层的输入，所述第二全连接层的输出作为所述第二激活层的输入，所述第二激活层的输出作为一个有序位置的质量得分。

其中，每个输出层均对应一个有序位置；第一激活层和第二激活层可以采用相同的激活函数，也可以采用不同的激活函数，激活函数可以为Sigmoid函数、ELU函数和RELU函数等。参照图2所示的一种预设模型的结构示意图，处理层中的BN(Batch Normalization，归一化层)为第一归一化层，处理层中的FC(Full Connect，全连接)为第一全连接层，处理层中的ELU为第一激活层，第一激活层以ELU函数为激活函数，处理层得到的向量输入至每个输出层。每个输出层中的FC为第二全连接层，输出层中的Sigmoid为第二激活层，第二激活层以Sigmoid函数为激活函数。可以看出，图2中存在4个输出层，从而分别输出四个有序位置的质量得分：第一位置的质量得分、第二位置的质量得分、第三位置的质量得分和第四位置的质量得分。

需要说明的是，图2中处理层仅包含了一个BN、FC和ELU，在具体实施中，可以在处理层中包含多个BN、多个FC和多个ELU，从而处理层的深度会增加，有助于提高处理层的运算准确度。根据经验，两个BN、两个FC和两个ELU的运算准确度较高，且运算量适中。如图3所示，处理层由两个级联的处理单元构成，输入的特征向量直接输入至第一个处理单元中的BN，第一个处理单元的ELU的输出输入至第二个处理单元中的BN，第二个处理单元中的ELU的输出为处理层的输出。

可选地，在本公开的另一种实施例中，所述样本图像替换为多个商品构成的商品组，所述步骤102包括子步骤E1至E5：

子步骤E1，根据所述商品的特征信息生成所述商品的第一向量。

其中，商品组可以为若干商品组成的组合。例如，商品组可以是由商品CMD1、商品CMD2和商品CMD3组成的组合，又例如，当商品为餐点时，商品组可以为由米饭、鱼香肉丝、排骨组成的套餐。当然，在特殊情况下，商品组中可以仅包含一个商品，例如，当商品为餐点时，商品组可以仅包含蛋炒饭。具体地，生成商品的第一向量时需要使用到商品的特征信息，商品的特征信息可以为多种维度上对商品进行表述的信息，包括但不限于：商品名称、商品数目、商品的历史销量、多个等级的标签。其中多个等级的标签可以是从具有等级的标签体系中提取的标签，且等级较高的标签，其粒度较粗，标签对商品的表述较准确；而等级较低的标签，其粒度较细，标签的对商品的表述较不准确。例如，对于标签“主食”和标签“米饭”，标签“主食”的等级相比标签“米饭”的等级较高，标签“米饭”的粒度相比标签“主食”的粒度较细，标签“米饭”对商品的表述相比标签“主食”对商品的表述较准确。

上述商品的特征信息包括离散特征和连续特征，其中，离散特征(例如，第一等级的标签和第二等级的标签)可以采用Embedding层将其转换为向量，连续特征(例如，商品数目和历史销量)的取值可以直接作为第一向量的其中一项。

需要说明的是，离散特征中还包括商品名称，商品名称需要经过CNN(Convolutional Neural Network，卷积神经网络)层和max-pooling层处理得到商品名称向量。

例如，对于一个商品，根据其商品名称转换的商品名称向量为[PNV1，PNV2，…，PNVS1]，第一等级的标签的第一标签向量为[FLV1，FLV2，…，FLVS2]，第二等级的标签的第二标签向量为[SLV1，SLV2，…，SLVS3]，商品数目为2，历史销量为1000，从而可以将商品名称向量、第一标签向量、第二标签向量、商品数目、历史销量拼接为该商品的第一向量[PNV1，PNV2，…，PNVS1，FLV1，FLV2，…，FLVS2，SLV1，SLV2，…，SLVS3，2，1000]。

子步骤E2，采用特征转换层将所述商品的第一向量转换为所述商品的第二向量，所述特征转换层包括：第二归一化层和第三全连接层，所述第二归一化层的输入为所述特征转换层的输入，所述第二归一化层的输出作为所述第三全连接层的输入，所述第三全连接层的输出作为所述特征转换层的输出。

参照图4所示的特征交互层的结构图，其中，BN为第二归一化层，用于防止过拟合；FC为第三全连接层，用于将商品的第一向量中的不同特征进行交互，从而得到交互之后的高级向量，作为该商品的第二向量。

子步骤E3，根据所述商品组的特征信息生成所述商品组的第三向量。

其中，商品组的特征信息可以为商品组的整体特征信息，分为离散特征和连续特征。例如，商品组的历史销量、商品组包含的商品总数目、商品组包含的商品种类数目、预设等级及以下的标签的商品总数目、预设等级及以下的标签的商品总价格、提供商品组的商家类型。其中预设等级可以为任一设定的较低的等级，在通常情况下，预设等级可以设置为第二等级。例如，对于包含4份米饭、2份菜、4份馒头的套餐，若标签“主食”和标签“菜”均为第二等级，标签“米饭”和标签“馒头”均为标签“主食”以下的标签，则预设等级及以下的标签的商品总数目可以包括：米饭的总数目4、菜的总数目2、馒头的总数目4；预设等级及以下的标签的商品总价格可以包括：4份米饭的总价格、2份菜的总价格、4份馒头的总价格。可以理解，本公开的实施例仅统计低等级标签下的商品总价格和商品总数目，这类比较细的特征信息可以保证特征信息的准确度。

具体地，生成商品组的第三向量时需要使用到商品组的离散特征和连续特征，其中，离散特征(例如，商品组的商家类型)可以采用Embedding层将其转换为向量，连续特征(例如，商品组包含的商品总数目、商品组的历史销量)的取值可以直接作为第三向量的其中一项。

例如，对于一个商品组，商品组的商家类型对应的商家类型向量为[MTV1，MTV2，…，MTVS]，商品组包含的商品总数目为4，历史销量为500，从而可以将商家类型向量、商品总数目、历史销量拼接为该商品组的第三向量[MTV1，MTV2，…，MTVS，4，500]。

子步骤E4，将各商品的第二向量和所述商品组的第三向量拼接为所述商品组的特征向量。

其中，商品组的特征向量可以为商品组的向量表示，特征向量可以认为是商品组的身份标识。特征向量可以根据商品组的特征信息和/或商品组中各商品的特征信息生成。

具体地，在拼接得到商品组的特征向量时，不需要考虑拼接的顺序。例如，对于一个由商品CMD1、商品CMD2和商品CMD3构成的商品组，商品CMD1、商品CMD2和商品CMD3对应的第二向量分别是[SVEC11，SVEC12，…，SVEC1S]，[SVEC21，SVEC22，…，SVEC2S]，[SVEC31，SVEC32，…，SVEC3S]，商品组的第三向量为[TVEC1，TVEC2，…，TVECL]。从而商品组的特征向量为：[SVEC11，SVEC12，…，SVEC1S，SVEC21，SVEC22，…，SVEC2S，SVEC31，SVEC32，…，SVEC3S，TVEC1，TVEC2，…，TVECL]。

子步骤E5，将所述商品组的特征向量输入至预设模型，得到至少两个有序位置对应的训练得分。

可以理解，预设模型可以对特征向量进行线性或非线性变换，得到至少两个有序位置对应的训练得分。而进行线性或非线性变换时采用的矩阵即为预设模型的参数构成的矩阵，这些参数是在训练过程中不断调整的。

本公开的实施例可以结合每个商品的特征信息和商品组的特征信息，生成商品组的特征向量，从而实现了从多维度表示商品组，有助于提高商品组的特征向量的准确度。

可选地，在本公开的另一种实施例中，所述子步骤E4包括子步骤F1至F2：

子步骤F1，针对所述商品组中的每个商品，通过自注意力层确定所述商品的权重。

其中，自注意力(Self-Attention)层可以通过学习得到商品组中各商品的权重，该权重表明该商品的重要性。例如，对于饮食行业而言，套餐作为商品组，若其中一个套餐包括：米饭、菜品和小吃，由于菜品的好吃程度通常决定了这个套餐的好坏即商品组的质量得分，而米饭和小吃对套餐的好坏影响较小，从而自注意力层学习到的菜品的权重会大一些，而米饭和小吃的权重会小一些。

子步骤F2，根据所述商品的权重，将所述商品组中的各商品的第二向量和所述商品组的第三向量拼接为所述商品组的特征向量。

具体地，针对每个商品组，首先，将每个商品的第二向量和该商品的权重相乘，得到该商品的加权第二向量。例如，对于一个由商品CMD1、商品CMD2和商品CMD3构成的商品组，商品CMD1、商品CMD2和商品CMD3对应的第二向量分别是[SVEC11，SVEC12，…，SVEC1S]，[SVEC21，SVEC22，…，SVEC2S]，[SVEC31，SVEC32，…，SVEC3S]，商品CMD1、商品CMD2和商品CMD3对应的权重分别为W1、W2和W3。从而，商品CMD1、商品CMD2和商品CMD3对应的加权第二向量分别是[W1·SVEC11，W1·SVEC12，…，W1·SVEC1S]，[W2·SVEC21，W2·SVEC22，…，W2·SVEC2S]，[W3·SVEC31，W3·SVEC32，…，W3·SVEC3S]。

然后，将该商品组中所有商品的加权第二向量和该商品组的第三向量拼接起来，得到该商品组的特征向量。例如，若上述商品组的第三向量为[TVEC1，TVEC2，…，TVECL]，可以将上述商品CMD1、商品CMD2和商品CMD3的加权第二向量，以及，商品组的第三向量拼接为商品组的特征向量：[W1·SVEC11，W1·SVEC12，…，W1·SVEC1S，W2·SVEC21，W2·SVEC22，…，W2·SVEC2S，W3·SVEC31，W3·SVEC32，…，W3·SVEC3S，TVEC1，TVEC2，…，TVECL]。

本公开的实施例可以通过自注意力层学习到商品组合中每个商品的权重，从而赋予了不同商品不同的影响力，有助于提高商品组的特征向量的准确度。

综上所述，本公开提供了一种推荐方法，包括：获取至少一个商品组；生成每个所述商品组的特征向量；将每个所述商品组的特征向量输入至质量预测模型中，得到每个所述商品组的至少两个有序位置对应的质量得分，所述质量预测模型通过训练样本训练得到，所述训练样本包括至少两个样本得分和样本向量，所述质量预测模型在训练时针对每个所述样本向量输出至少两个有序位置对应的训练得分，训练时采用的损失值由第一子损失值和第二子损失值确定，所述第一子损失值由所述至少两个训练得分与所述至少两个样本得分确定，所述第二子损失值是由各两个相邻的有序位置的训练得分与所述有序位置是否一致确定的；根据每个所述商品组的所述至少两个有序位置对应的质量得分，向用户推荐所述商品组。本公开可以在训练质量预测模型时对于每个样本图像均输出至少两个有序位置对应的训练得分，并根据训练得分在顺序上的损失值对质量预估模型进行训练，有助于提高质量预测模型的准确度，进而提高推荐的准确度。

参照图5，其示出了在本公开的推荐装置的结构图，具体如下：

训练样本获取模块201，用于获取训练样本，所述训练样本包括样本图像。

训练得分预测模块202，用于将所述样本图像输入至预设模型，得到预设数量的有序位置对应的训练得分。

顺序损失值确定模块203，用于根据任意一个有序位置对应的训练得分与相邻有序位置对应的训练得分之间的大小关系，是否符合所述有序位置和所述相邻有序位置的预设顺序，确定顺序损失值。

质量预测模型训练模块204，用于根据所述顺序损失值对所述预设模型进行训练得到质量预测模型。

图像推荐模块205，用于采用所述质量预测模型预测待推荐图像的质量得分，以根据所述质量得分对所述待推荐图像进行推荐。

可选地，在本公开的另一种实施例中，所述顺序损失值确定模块203包括第一顺序子损失值确定子模块、第二顺序子损失值确定子模块和顺序损失值确定子模块：

第一顺序子损失值确定子模块，用于针对每个有序位置和所述有序位置的相邻有序位置，若所述有序位置的训练得分与所述相邻有序位置的训练得分的大小顺序，与所述有序位置和所述相邻有序位置的预设顺序一致，则确定所述有序位置的顺序子损失值为0。

第二顺序子损失值确定子模块，用于针对每个有序位置和所述有序位置的相邻有序位置，若所述有序位置的训练得分与所述相邻有序位置的训练得分的大小顺序，与所述有序位置和所述相邻有序位置的预设顺序不一致，则确定所述有序位置的顺序子损失值为所述有序位置的训练得分和所述相邻有序位置的训练得分的差值的绝对值。

顺序损失值确定子模块，用于结合各所述有序位置的顺序子损失值确定顺序损失值。

可选地，在本公开的另一种实施例中，所述训练样本还包括：所述有序位置对应的样本得分，所述质量预测模型训练模块204包括得分损失值确定子模块和质量预测模型训练子模块：

得分损失值确定子模块，用于根据所述有序位置对应的训练得分和所述有序位置对应的样本得分确定得分损失值。

质量预测模型训练子模块，用于根据所述顺序损失值和所述得分损失值对所述预设模型进行训练得到质量预测模型。

可选地，在本公开的另一种实施例中，所述质量预测模型训练子模块包括损失值调整单元、综合损失值计算单元和质量预测模型训练单元：

损失值调整单元，用于计算所述顺序损失值与预设的损失值调整参数的乘积。

综合损失值计算单元，用于计算所述得分损失值和所述乘积之和得到综合损失值。

质量预测模型训练单元，用于根据所述综合损失值对所述预设模型进行训练得到质量预测模型。

可选地，在本公开的另一种实施例中，所述图像推荐模块205包括质量得分预测子模块、质量得分综合子模块和推荐子模块：

质量得分预测子模块，用于将所述待推荐图像输入至所述质量预测模型中得到所述有序位置对应的质量得分。

质量得分综合子模块，用于计算所述有序位置对应的质量得分的平均值，得到所述待推荐图像的综合质量得分。

推荐子模块，用于根据所述待推荐图像的综合质量得分对所述待推荐图像进行推荐。

可选地，在本公开的另一种实施例中，所述样本图像替换为多个商品构成的商品组，所述训练得分预测模块202包括第一向量生成子模块、第二向量生成子模块、第三向量生成子模块、特征向量生成子模块和训练得分预测子模块：

第一向量生成子模块，用于根据所述商品的特征信息生成所述商品的第一向量。

第二向量生成子模块，用于采用特征转换层将所述商品的第一向量转换为所述商品的第二向量，所述特征转换层包括：第二归一化层和第三全连接层，所述第二归一化层的输入为所述特征转换层的输入，所述第二归一化层的输出作为所述第三全连接层的输入，所述第三全连接层的输出作为所述特征转换层的输出。

第三向量生成子模块，用于根据所述商品组的特征信息生成所述商品组的第三向量。

特征向量生成子模块，用于将各商品的第二向量和所述商品组的第三向量拼接为所述商品组的特征向量。

训练得分预测子模块，用于将所述商品组的特征向量输入至预设模型，得到至少两个有序位置对应的训练得分。

可选地，在本公开的另一种实施例中，所述特征向量生成子模块包括权重计算单元和特征向量生成单元：

权重计算单元，用于针对所述商品组中的每个商品，通过自注意力层确定所述商品的权重。

特征向量生成单元，用于根据所述商品的权重，将所述商品组中的各商品的第二向量和所述商品组的第三向量拼接为所述商品组的特征向量。

综上所述，本公开提供了一种推荐装置，所述装置包括：训练样本获取模块，用于获取训练样本，所述训练样本包括样本图像；训练得分预测模块，用于将所述样本图像输入至预设模型，得到预设数量的有序位置对应的训练得分；顺序损失值确定模块，用于根据任意一个有序位置对应的训练得分与相邻有序位置对应的训练得分之间的大小关系，是否符合所述有序位置和所述相邻有序位置的预设顺序，确定顺序损失值；质量预测模型训练模块，用于根据所述顺序损失值对所述预设模型进行训练得到质量预测模型；图像推荐模块，用于采用所述质量预测模型预测待推荐图像的质量得分，以根据所述质量得分对所述待推荐图像进行推荐。本公开可以在训练质量预测模型时对于每个样本图像均输出至少两个有序位置对应的训练得分，并根据训练得分在顺序上的损失值对质量预估模型进行训练，有助于提高质量预测模型的准确度，进而提高推荐的准确度。

本公开的装置实施例可参照方法实施例的详细说明，在此不再赘述。

本公开还提供了一种电子设备，参照图6，包括：处理器301、存储器302以及存储在所述存储器302上并可在所述处理器上运行的计算机程序3021，所述处理器301执行所述程序时实现前述实施例的推荐方法。

本公开还提供了一种可读存储介质，当所述存储介质中的指令由电子设备的处理器执行时，使得电子设备能够执行前述实施例的推荐方法。

对于装置实施例而言，由于其与方法实施例基本相似，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述，构造这类系统所要求的结构是显而易见的。此外，本公开也不针对任何特定编程语言。应当明白，可以利用各种编程语言实现在此描述的本公开的内容，并且上面对特定语言所做的描述是为了披露本公开的最佳实施方式。

在此处所提供的说明书中，说明了大量具体细节。然而，能够理解，本公开可以在没有这些具体细节的情况下实践。在一些实例中，并未详细示出公知的方法、结构和技术，以便不模糊对本说明书的理解。

类似地，应当理解，为了精简本公开并帮助理解各个发明方面中的一个或多个，在上面对本公开的示例性实施例的描述中，本公开的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而，并不应将该公开的方法解释成反映如下意图：即所要求保护的本公开要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说，如下面的权利要求书所反映的那样，发明方面在于少于前面公开的单个实施例的所有特征。因此，遵循具体实施方式的权利要求书由此明确地并入该具体实施方式，其中每个权利要求本身都作为本公开的单独实施例。

本领域那些技术人员可以理解，可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件，以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外，可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述，本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。

本公开的各个部件实施例可以以硬件实现，或者以在一个或者多个处理器上运行的软件模块实现，或者以它们的组合实现。本领域的技术人员应当理解，可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本公开的推荐设备中的一些或者全部部件的一些或者全部功能。本公开还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序。这样的实现本公开的程序可以存储在计算机可读介质上，或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到，或者在载体信号上提供，或者以任何其他形式提供。

应该注意的是上述实施例对本公开进行说明而不是对本公开进行限制，并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中，不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本公开可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中，这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统、装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

以上所述仅为本公开的较佳实施例而已，并不用以限制本公开，凡在本公开的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本公开的保护范围之内。

以上所述，仅为本公开的具体实施方式，但本公开的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本公开揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本公开的保护范围之内。因此，本公开的保护范围应以权利要求的保护范围为准。

Claims

1.一种推荐方法，其特征在于，所述方法包括：

获取训练样本，所述训练样本包括样本图像；

2.根据权利要求1所述的方法，其特征在于，所述根据任意一个有序位置对应的训练得分与相邻有序位置对应的训练得分之间的大小关系，是否符合所述有序位置和所述相邻有序位置的预设顺序，确定顺序损失值的步骤，包括：

针对每个有序位置和所述有序位置的相邻有序位置，若所述有序位置的训练得分与所述相邻有序位置的训练得分的大小顺序，与所述有序位置和所述相邻有序位置的预设顺序一致，则确定所述有序位置的顺序子损失值为0；

针对每个有序位置和所述有序位置的相邻有序位置，若所述有序位置的训练得分与所述相邻有序位置的训练得分的大小顺序，与所述有序位置和所述相邻有序位置的预设顺序不一致，则确定所述有序位置的顺序子损失值为所述有序位置的训练得分和所述相邻有序位置的训练得分的差值的绝对值；

结合各所述有序位置的顺序子损失值确定顺序损失值。

3.根据权利要求1所述的方法，其特征在于，所述训练样本还包括：所述有序位置对应的样本得分，所述根据所述顺序损失值对所述预设模型进行训练得到质量预测模型的步骤，包括：

根据所述有序位置对应的训练得分和所述有序位置对应的样本得分确定得分损失值；

根据所述顺序损失值和所述得分损失值对所述预设模型进行训练得到质量预测模型。

4.根据权利要求3所述的方法，其特征在于，所述根据所述顺序损失值和所述得分损失值对所述预设模型进行训练得到质量预测模型的步骤，包括：

计算所述顺序损失值与预设的损失值调整参数的乘积；

计算所述得分损失值和所述乘积之和得到综合损失值；

根据所述综合损失值对所述预设模型进行训练得到质量预测模型。

5.根据权利要求1所述的方法，其特征在于，所述采用所述质量预测模型预测待推荐图像的质量得分，以根据所述质量得分对所述待推荐图像进行推荐的步骤，包括：

将所述待推荐图像输入至所述质量预测模型中得到所述有序位置对应的质量得分；

计算所述有序位置对应的质量得分的平均值，得到所述待推荐图像的综合质量得分；

根据所述待推荐图像的综合质量得分对所述待推荐图像进行推荐。

6.根据权利要求1所述的方法，其特征在于，所述预设模型包括：处理层和至少两个输出层，所述处理层包括：第一归一化层、第一全连接层和第一激活层，所述处理层的输入为所述预设模型的输入，所述第一归一化层的输入为所述处理层的输入，所述第一归一化层的输出作为所述第一全连接层的输入，所述第一全连接层的输出作为所述第一激活层的输入，所述第一激活层的输出作为每个所述输出层的输入，每个所述输出层包括：第二全连接层和第二激活层，所述第二全连接层的输入为所述输出层的输入，所述第二全连接层的输出作为所述第二激活层的输入，所述第二激活层的输出作为一个有序位置的质量得分。

7.根据权利要求1至6中任一项所述的方法，其特征在于，所述样本图像替换为多个商品构成的商品组，将所述商品组输入至预设模型，得到至少两个有序位置对应的训练得分的步骤，包括：

根据所述商品的特征信息生成所述商品的第一向量；

采用特征转换层将所述商品的第一向量转换为所述商品的第二向量，所述特征转换层包括：第二归一化层和第三全连接层，所述第二归一化层的输入为所述特征转换层的输入，所述第二归一化层的输出作为所述第三全连接层的输入，所述第三全连接层的输出作为所述特征转换层的输出；

根据所述商品组的特征信息生成所述商品组的第三向量；

将各商品的第二向量和所述商品组的第三向量拼接为所述商品组的特征向量；

将所述商品组的特征向量输入至预设模型，得到至少两个有序位置对应的训练得分。

8.根据权利要求7所述的方法，其特征在于，所述将各商品的第二向量和所述商品组的第三向量拼接为所述商品组的特征向量的步骤，包括：

针对所述商品组中的每个商品，通过自注意力层确定所述商品的权重；

根据所述商品的权重，将所述商品组中的各商品的第二向量和所述商品组的第三向量拼接为所述商品组的特征向量。

9.一种推荐装置，其特征在于，所述装置包括：

10.一种电子设备，其特征在于，包括：

处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现如权利要求1-8中任一项所述的推荐方法。

11.一种可读存储介质，其特征在于，当所述存储介质中的指令由电子设备的处理器执行时，使得电子设备能够执行如方法权利要求1-8中任一项所述的推荐方法。