CN111159565A

CN111159565A - 构建基于多目标优化的推荐模型的方法、装置及设备

Info

Publication number: CN111159565A
Application number: CN201911420683.5A
Authority: CN
Inventors: 刘正夫
Original assignee: 4Paradigm Beijing Technology Co Ltd
Current assignee: 4Paradigm Beijing Technology Co Ltd
Priority date: 2019-12-31
Filing date: 2019-12-31
Publication date: 2020-05-15
Anticipated expiration: 2039-12-31
Also published as: CN111159565B

Abstract

本发明公开了一种构建基于多目标优化的推荐模型的方法、装置及设备，其中，方法包括：获取交易数据集，其中，交易数据集中的每一交易数据包括对应的交易产品和进行对应交易的用户；根据交易数据集构建样本集，其中，样本集中包括正样本和负样本；确定推荐多样性指标；以产品召回率和推荐准确率中的任一个以及推荐多样性指标为待优化的指标，通过样本集确定目标模型的至少两组超参数值，并获得相应的至少两个推荐模型，其中，一组超参数值对应一个推荐模型。

Description

构建基于多目标优化的推荐模型的方法、装置及设备

技术领域

本发明涉及人工智能技术领域，更具体地，涉及一种构建基于多目标优化的推荐模型的方法、一种构建基于多目标优化的推荐模型的装置、一种电子设备以及一种计算机可读存储介质。

背景技术

在电子商务领域中，对于用户来说，如何准确的向不同用户推荐产品是至关重要的。

目前，在向不同用户推荐产品时，通常采用预先构建好的推荐模型来实现。而对于预先构建好的推荐模型，该推荐模型是基于例如召回率的单目标优化得到的。由于在对单目标进行优化时，并不会兼顾推荐模型在其他指标上的表现情况，因此，这将导致利用构建好的推荐模型得到的推荐结果并不能给用户带来良好的用户体验。

发明内容

本发明的一个目的是提供一种用于构建基于多目标优化的推荐模型的新技术方案。

根据本发明的第一方面，提供了一种构建基于多目标优化的推荐模型的方法，包括：

获取交易数据集，其中，所述交易数据集中的每一交易数据包括对应的交易产品和进行对应交易的用户；

根据所述交易数据集构建样本集，其中，所述样本集中包括正样本和负样本；

确定推荐多样性指标；

以产品召回率和推荐准确率中的任一个以及推荐多样性指标为待优化的指标，通过所述样本集确定目标模型的至少两组超参数值，并获得相应的至少两个推荐模型，其中，一组超参数值对应一个推荐模型。

可选的，所述推荐多样性指标中包括反映所推荐产品的产品种类的种类多样性指标、反映所推荐产品的产品热度的热度指标、及反映所推荐产品的新颖度的新颖度指标。

可选的，所述目标模型为gbdt模型。

可选的，所述以产品召回率和推荐准确率中的任一个以及推荐多样性指标为待优化的指标，通过所述样本集确定目标模型的至少两组超参数值，包括：

以产品召回率和推荐准确率中的任一个以及推荐多样性指标为待优化的指标，以所述目标模型的模型超参数为待优化的目标，通过所述样本集和设定的多目标优化算法进行迭代训练，获得所述模型超参数的至少两组超参数值。

可选的，所述多目标优化算法为多目标优化遗传算法。

可选的，所述通过所述样本集和设定的多目标优化算法进行迭代训练，获得所述模型超参数的至少两组超参数值包括：

将所述样本集拆分为训练样本集和测试样本集；

通过所述训练样本集，训练所述目标模型，得到对应的至少两个训练后的目标模型；

通过所述测试样本集获得每一所述训练后的目标模型对于所述待优化的指标的指标值；

以所述指标值最大化为搜索条件，从所述训练后的目标模型筛选出部分训练后的目标模型；

根据部分训练后的目标模型，生成至少两个新的训练后的目标模型，获得通过当前训练得到的所述模型超参数的各组超参数值；

在所述当前训练未达到设定的收敛条件的情况下，将所述当前训练得到的所述模型超参数的各组超参数值，分别赋予所述目标模型，并进行下一次训练；

在所述当前训练达到所述收敛条件的情况下，获得所述模型超参数的至少两组超参数值为当前训练得到的各组超参数值。

可选的，所述收敛条件包括训练次数达到设定次数。

可选的，所述方法还包括确定推荐准确率的指标，所述确定推荐准确率的指标的步骤，包括：

确定向每一用户推荐的产品中，属于对应用户交易过的产品的数量；

确定向所有用户待推荐的产品的数量；

将所有所述用户交易过的产品的数量，与向所有用户待推荐的产品的数量之间的比值，确定为推荐多样性指标中的推荐准确率指标。

可选的，所述方法还包括确定准回来率的指标，所述确定召回率的指标的步骤，包括：

确定向所有用户推荐的产品的数量；

将所有所述用户交易过的产品的数量，与向所有用户推荐的产品的数量之间的比值，确定为推荐多样性指标中的召回率指标。

可选的，所述确定推荐多样性指标，包括确定推荐多样性指标中的种类多样性指标，所述确定推荐多样性指标中的种类多样性指标，包括：

将向所有用户推荐的产品的类别数，与待推荐的产品的总数之间的比值，确定为推荐多样性指标中的种类多样性指标。

可选的，所述确定推荐多样性指标，包括确定推荐多样性指标中的热度指标，所述确定推荐多样性指标中的热度指标，包括：

确定向每一用户推荐的产品的数量，与所有用户的用户数量之间的乘积；

将向所有用户推荐的产品中属于热门产品的数量，与所述乘积之间的比值的相反数，确定为推荐多样性指标中的热度指标。

可选的，所述方法还包括确定所述热门产品的步骤，所述确定热门产品，包括：

根据所述交易数据集，计算每一产品对应的交易过的次数；

将交易过的次数最多的前第一预设百分比的产品，确定为热门产品。

可选的，所述确定推荐多样性指标，包括确定推荐多样性指标中的新颖度指标，所述确定推荐多样性指标中的新颖度指标，包括：

根据推荐结果，构建推荐样本集；其中，一个推荐样本由用户及向对应用户推荐的一个产品、对应用户的用户向量值、对应产品的产品向量值组成；

将推荐样本集中的每一推荐样本输入至新颖性函数，以得到对应的新颖性值；所述新颖性函数为度量用户交易向自身推荐的冷门产品的概率的函数；

将推荐样本集中的所有推荐样本对应的新颖性值的和，与所有用户的用户数量之间的比值，确定为推荐多样性指标中的新颖度指标。

可选的，所述方法还包括确定所述冷门产品的步骤，所述确定冷门产品，包括：

根据所述交易数据集，计算每一产品对应的交易过的次数；

将交易过的次数最少的前第二预设百分比的产品，确定为冷门产品。

可选的，所述方法还包括获取新颖性函数的步骤，所述获取新颖性函数包括：

对所述样本集进行修改，以得到修改后的训练样本；所述修改包括：在所述样本集中，将冷门产品对应的正样本以外的样本修改为负样本；

根据修改后的训练样本，训练第一推荐模型；

将训练后的第一推荐模型，作为新颖性函数。

可选的，所述第一推荐模型为gbdt模型、随机森林树模型、XGBoost模型中的任一个。

可选的，所述方法还包括：

获取目标用户对于设定的用户特征向量的用户向量值，以及每一待推荐的产品对于设定的产品特征向量的产品向量值；

将所述用户向量值分别与每一所述产品向量值相结合，构建出各匹配数据；

对于所述各匹配数据中的每一匹配数据，通过所述至少两个推荐模型分别输出对应匹配数据的推荐值；

根据所述推荐值，确定所述对应匹配数据的综合推荐值；

根据每一所述匹配数据的综合推荐值，获得向所述目标用户推荐的产品。

可选的，所述根据所述推荐值，确定所述对应匹配数据的综合推荐值，包括：

确定所述对应匹配数据的综合推荐值等于所有所述推荐值的平均值。

可选的，所述用户特征向量包括年龄、性别、收入、职业中的至少一个特征。

可选的，所述产品特征向量包括名称、价格、折扣、颜色、重量、邮递费用中的至少一个特征。根据本发明的第二方面，提供了一种构建基于多目标优化的推荐模型的装置，包括：

第一获取模块，用于获取交易数据集，其中，所述交易数据集中的每一交易数据包括对应的交易产品和进行对应交易的用户；

第一构建模块，用于根据所述交易数据集构建样本集，其中，所述样本集中包括正样本和负样本；

第一确定模块，用于确定推荐多样性指标；

第二构建模块，用于以产品召回率和推荐准确率中的任一个以及推荐多样性指标为待优化的指标，通过所述样本集确定目标模型的至少两组超参数值，并获得相应的至少两个推荐模型，其中，一组超参数值对应一个推荐模型。

可选的，所述目标模型为gbdt模型。

可选的，所有第二构建模块，具体用于以产品召回率和推荐准确率中的任一个以及推荐多样性指标为待优化的指标，以所述目标模型的模型超参数为待优化的目标，通过所述样本集和设定的多目标优化算法进行迭代训练，获得所述模型超参数的至少两组超参数值。

可选的，所述多目标优化算法为多目标优化遗传算法。

可选的，所述第二构建模块具体用于：将所述样本集拆分为训练样本集和测试样本集；

可选的，所述收敛条件包括训练次数达到设定次数。

可选的，所述装置还包括第二确定模块，所述第二确定模块用于：

确定向所有用户待推荐的产品的数量；

可选的，所述装置还包括第三确定模块，所述第三确定模块用于：

确定向所有用户推荐的产品的数量；

可选的，所述第一确定模块中包括第一确定单元，所述第一确定单元用于：

可选的，所述第一确定模块中包括第二确定单元，所述第二确定单元用于：

可选的，所述第二确定单元还用于：

根据所述交易数据集，计算每一产品对应的交易过的次数；

可选的，所述第二确定单元还用于：

根据所述交易数据集，计算每一产品对应的交易过的次数；

可选的，所述第一确定模块中包括第三确定单元，所述第三确定单元还用于：

根据修改后的训练样本，训练第一推荐模型；

将训练后的第一推荐模型，作为新颖性函数。

可选的，所述装置还包括：

第二获取模块，用于获取目标用户对于设定的用户特征向量的用户向量值，以及每一待推荐的产品对于设定的产品特征向量的产品向量值；

第三构建模块，用于将所述用户向量值分别与每一所述产品向量值相结合，构建出各匹配数据；

输出模块，对于所述各匹配数据中的每一匹配数据，通过所述至少两个推荐模型分别输出对应匹配数据的推荐值；

第四确定模块，用于根据所述推荐值，确定所述对应匹配数据的综合推荐值；

第三获取模块，用于根据每一所述匹配数据的综合推荐值，获得向所述目标用户推荐的产品。

可选的，所述第四确定模块具体用于：

可选的，所述产品特征向量包括名称、价格、折扣、颜色、重量、邮递费用中的至少一个特征。根据本发明的第三方面，提供了一种电子设备，其中，所述电子设备包括如第二方面中任一项所述的构建基于多目标优化的推荐模型的装置；或者，

包括存储器和处理器，所述存储器用于存储计算机指令，所述处理器用于从所述存储器中调用所述计算机指令，以执行如第一方面中任一项所述的方法。

根据本发明的第四方面，提供了一种存储介质，其中，其上存储有计算机程序，所述计算机程序在被处理器执行时实现根据第一方面中任一项所述的方法。

在本实施例中，通过获取交易数据集；根据交易数据集构建样本集；确定推荐多样性指标；以产品召回率和推荐准确率中的任一个以及推荐多样性指标为待优化的指标，通过样本集确定目标模型的至少两组超参数值，并获得相应的至少两个推荐模型，其中，一组超参数值对应一个推荐模型。在本实施例中，一方面提供了量化推荐多样性指标的方法。另一方面，由于该推荐多样性指标能够反映出用户的购物体验，因此，基于产品召回率和推荐准确率中的任一个以及推荐多样性指标，得到的推荐模型，可兼顾多个指标上的表现情况，这样，在利用本实施例构建的基于多目标优化的推荐模型时，可向用户进行更准确且全面的推荐。

通过以下参照附图对本发明的示例性实施例的详细描述，本发明的其它特征及其优点将会变得清楚。

附图说明

被结合在说明书中并构成说明书的一部分的附图示出了本发明的实施例，并且连同其说明一起用于解释本发明的原理。

图1是显示可用于实现本发明的实施例的电子设备的硬件配置的例子的框图；

图2是本发明实施例提供的一种构建基于多目标优化的推荐模型的方法的流程示意图；

图3是本发明实施例提供的一种构建基于多目标优化的推荐模型的装置的结构示意图；

图4是本发明实施例提供的一种电子设备的结构示意图。

具体实施方式

现在将参照附图来详细描述本发明的各种示例性实施例。应注意到：除非另外具体说明，否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本发明的范围。

以下对至少一个示例性实施例的描述实际上仅仅是说明性的，决不作为对本发明及其应用或使用的任何限制。

对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论，但在适当情况下，所述技术、方法和设备应当被视为说明书的一部分。

在这里示出和讨论的所有例子中，任何具体值应被解释为仅仅是示例性的，而不是作为限制。因此，示例性实施例的其它例子可以具有不同的值。

应注意到：相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步讨论。

下面，参照附图描述根据本发明实施例的各个实施例和例子。

<硬件配置>

图1是示出可以实现本发明的实施例的电子设备1000的硬件配置的框图。

电子设备1000可以是便携式电脑、台式计算机、平板电脑等。如图1所示，电子设备1000可以包括处理器1100、存储器1200、接口装置1300、通信装置1400、显示装置1500、输入装置1600、扬声器1700、麦克风1800等等。其中，处理器1100可以是中央处理器CPU、微处理器MCU等。存储器1200例如包括ROM(只读存储器)、RAM(随机存取存储器)、诸如硬盘的非易失性存储器等。接口装置1300例如包括USB接口、耳机接口等。通信装置1400例如能够进行有线或无线通信，具体地可以包括Wifi通信、蓝牙通信、2G/3G/4G/5G通信等。显示装置1500例如是液晶显示屏、触摸显示屏等。输入装置1600例如可以包括触摸屏、键盘、体感输入等。用户可以通过扬声器1700和麦克风1800输入/输出语音信息。

图1所示的电子设备仅仅是说明性的并且决不意味着对本发明、其应用或使用的任何限制。应用于本发明的实施例中，电子设备1000的存储器1200用于存储指令，指令用于控制处理器1100进行操作以执行本发明实施例提供的任意一项构建基于多目标优化的推荐模型的方法。本领域技术人员应当理解，尽管在图1中对电子设备1000示出了多个装置，但是，本发明可以仅涉及其中的部分装置，例如，电子设备1000只涉及处理器1100和存储装置1200。技术人员可以根据本发明所公开方案设计指令。指令如何控制处理器进行操作，这是本领域公知，故在此不再详细描述。

<方法实施例>

本实施例提供一种构建基于多目标优化的推荐模型的方法，该实施例提供的方法可以由电子设备执行，该电子设备可以是如图1所示的电子设备1000。

如图2所示，本实施例提供的构建基于多目标优化的推荐模型的方法，包括如下S2100-S2400：

S2100、获取交易数据集。其中，交易数据集中的每一交易数据包括对应的交易产品和进行对应交易的用户。

在本实施例中，本实施例提供的构建基于多目标优化的推荐模型的方法，应用于一个供用户购买应用中。而交易数据集为该购物应用在某一历史时间段内记录的交易产品，以及进行对应交易的用户组成。

在一个实施例中，产品可以为：书籍、化妆品、衣服、电子产品等。

在一个例子中，交易数据集可以为以为如下述的表1：

表1

其中，u1-u10分别为用户编号，可以理解的是，u1-u10分别表示10个不同的用户。对应的，p1-p4分别为产品的编号。可以理解的是，p1-p4分别标识4个不同的用户。

S2100、根据交易数据集构建样本集。

其中，样本集中包括正样本和负样本。

在本实施例中，样本集中的每一样本包括产品、用户、对应的对于产品特征向量的产品向量值、对应的对于用户特性向量的用户向量值、以及样本的标签。其中，产品特征向量可以为名称、价格、折扣、颜色、重量、邮递费用中的至少一个。用户特性向量可以为：年龄、性别、收入、职业中的至少一个特征。样本的标签用于表示对应样本为正样本还是负样本。

需要说明的是，上述对用户特征向量和产品特征向量的说明仅仅是一种示例性说明，可以理解的是，二者还可以包括其他的特征向量。另外，上述的邮递费用可以用来表示是否包邮的特征。

在本实施例中，正样本指的是，该样本中的产品和对应的用户为交易数据集中出现的一组数据。例如，在一个样本中的产品和对应的用户分别为表1中的u1和p1时，该样本为一个正样本。

负样本指的是，该样本中的产品和对应的用户为交易数据集中未出现的一组数据。例如，在一个样本中的产品和对应的用户分别u1和p2时，该样本为一个负样本。

在本实施例中，根据交易数据集构建样本集的具体实现可以为：将交易数据集中包含的所有用户和所有产品进行随机组合，例如进行笛卡尔积的形式进行随机组合，并在每一组用户和对应的产品中，增加对应的样本标签、用户向量值、产品向量值。

在一个实施例中，当基于上述的随机组合后，得到的样本集中的样本太多时，可以从随机组合后得到的样本集中，随机选取设定数量的样本，或者按照预设的规则选取设定数量的样本，以作为上述S2200中的样本集。

基于上述说明，在一个例子中，基于上述的表1所构建的样本集可如下述的表2所示：

表2

其中f1和f2为两个用户特征向量，f3和f4为两个产品特性向量，样本标签中的1用于表示对应样本为正样本，样本标签中的0用于表示对应样本为负样本。

S2300、确定推荐多样性指标。

在本实施例中，推荐多样性指标为一个反映用户购物体验的指标。

在一个实施中，推荐多样性指标包括反映所推荐产品的产品种类的种类多样性指标、反映所推荐产品的产品热度的热度指标、及反映所推荐产品的新颖度的新颖度指标中的任意组合。基于此，在一个例子中，推荐多样性指标可以包括反映所推荐产品的产品种类的种类多样性指标、反映所推荐产品的产品热度的热度指标、及反映所推荐产品的新颖度的新颖度指标这个三个指标。

基于上述内容，上述S2300包括确定推荐多样性指标中种类多样性指标的步骤，该步骤包括如下S2310：

S2310、将向所有用户推荐的产品的类别数，与待推荐的产品的总数比值，确定为推荐多样性指标中的种类多样性指标。

在本实施例中，可将向所有用户推荐的产品的类别数记为|S_|，待推荐的产品的总数记为N，这样，

可以理解的是，种类多样性指标对应的指标值越大，说明向用户推荐的产品越丰富。

在本实施例中，向所有用户推荐的产品的类别数，是基于所有用户的推荐结果得到的。在一个示例中，当推荐模型的对于所有用户的推荐结果为如下的表3时，向所有用户推荐的产品的类别数为4(该类别数对应的产品分别为p1、p2、p3、p4)。

表3

基于上述内容，上述S2300包括确定推荐多样性指标中热度指标的步骤，该步骤包括如下S2320-S2321：

S2320、确定向每一用户推荐的产品的数量，与所有用户的用户数量之间的乘积。

在本实施例中，向每一用户推荐的产品的数量，为推荐模型输出的推荐结果中涉及到的产品的数量。另外，上述的所有用户的用户数量，为待推荐产品的用户的用户数量。

在本实施例中，向每一用户推荐的产品的数量可以记为n，所有用户的用户数量记为m。

在一个例子中，以表3为例，向每一用户推荐的产品的数量n具体为1。所有用户的用户数量m为10。

S2321、将向所有用户推荐的产品中属于热门产品的数量，与乘积之间的比值的相反数，确定为推荐多样性指标中的热度指标。

在一个实施例中，热门产品可以为根据经验预先确定的产品。

在另一个实施例中，热门产品还可以根据交易数据集统计得到。基于此，本实施例还提供的方法，还包括确定热门产品的步骤，该步骤具体包括如下的S2322和S2323：

S2322、根据交易数据集，计算每一产品对应的交易过的次数。

S2323、将交易过的次数最多的前第一预设百分比的产品，确定为热门产品。

在本实施例中，统计交易数据集中每一产品对应的交易过的次数。然后次数按照从大到小的顺序排列，将位于前第一预设百分比的次数所对应的产品确定为热门产品。

需要说明的是，上述的第一预设百分比可根据经验进行设置。在一个例子中，上述的第一预设百分比可以为30％。

在一个例子中，以表1为例，热门产品为p1。

在本实施例中，向所有用户推荐的产品中属于热门产品的数量可记为：∑_ijhot(p_ij)。其中，p_ij表示的是，向第i个用户推荐的第j个产品。以及，在p_ij对应的产品为热门产品时，hot(p_ij)＝1，在p_ij对应的产品为非热门产品时，hot(p_ij)＝0。

基于上述说明，

可以理解的是，热度指标对应的指标值越大，向用户推荐的热门产品的可能性越小，冷门产品则更有可能被推荐。

基于上述内容，上述S2300包括确定推荐多样性指标中新颖度指标的步骤，该步骤包括如下S2330-S2332：

S2330、根据推荐结果，构建推荐样本集；其中，一个推荐样本由用户及向对应用户推荐的一个产品、对应用户的用户向量值、对应产品的产品向量值组成。

在本实施例中，将推荐结果中的用户和对应的推荐产品进行组合，以得到用户和每一个对应的推荐产品的组合，然后在每一组合中，添加对应用户的用户向量值，以及对应的推荐产品的产品向量值。这样便得到了推荐样本集。

S2331、将推荐样本集中的每一推荐样本输入至新颖性函数，以得到对应的新颖性值。

在本实施例中，新颖性函数为度量用户交易向自身推荐的冷门产品的概率的函数。

在一个实施例中，冷门产品可以为根据经验预先确定的产品。

在另一个实施例中，冷门产品还可以根据交易数据集统计得到。基于此，本实施例还提供的方法，还包括确定冷门产品的步骤，该步骤具体包括如下的步骤A1和A2：

步骤A1、根据交易数据集，计算每一产品对应的交易过的次数。

步骤A2、将交易过的次数最少的前第二预设百分比的产品，确定为冷门产品。

在本实施例中，统计交易数据集中每一产品对应的交易过的次数。然后次数按照从小到大的顺序排列，将位于前第二预设百分比的次数所对应的产品确定为冷门产品。

需要说明的是，上述的第二预设百分比可根据经验进行设置。在一个例子中，上述的第二预设百分比可以为30％。

在一个例子中，以表1为例，冷门产品为p4。

需要说明的是，任一能够度量用户交易向自身推荐的冷门产品的概率的函数，均可作为本实施例中的新颖性函数。

在一个实施例中，本实施例提供了一种新颖性函数。对此，在该实施例的基础上，本实施例提供的构建基于多目标优化的推荐模型的方法，还包括获取新颖性函数的步骤。该步骤具体包括如下步骤B1-B3：

步骤B1、对样本集进行修改，以得到修改后的训练样本；修改包括：在样本集中，将冷门产品对应的正样本以外的样本修改为负样本。

在一个实施例中，当样本标签用1和0表示时，上述的修改具体为：在样本集合中，对于冷门产品对应的正样本以外的样本，将对应样本的标签均修改为0。

在一个例子中，冷门产品为p4的情况下，基于上述的表2得到的修改后的样本集如表4所示：

表4

步骤B2、根据修改后的训练样本，训练第一推荐模型。

在一个例子中，上述的第一推荐模型可以为：gbdt模型、随机森林树模型、XGBoost模型中的任一个。当然，上述的第一训练模型还可以为其他形式的推荐模型，对此，本实施例不做限定。

需要说明的是，上述B2的具体训练过程，与传统的神经网络模型的训练过程相同，因此，这里不再赘述。

步骤B3、将训练后的第一推荐模型，作为新颖性函数。

S2332、将推荐样本集中的所有推荐样本对应的新颖性值的和，与所有用户的用户数量之间的比值，确定为推荐多样性指标中的新颖度指标。

在本实施例中，所有推荐样本对应的新颖性值的和可记为：∑_lf(x_l)，其中，x_l表示的是第l条推荐样本，f(x_l)表示的是推荐样本x_l的新颖性值。

在本实施例中，所有用户的用户数量用m表示时，

结合上述内容可知，在推荐多样性指标用D表示，且推荐多样性指标包括反映所推荐产品的产品种类的种类多样性指标、反映所推荐产品的产品热度的热度指标、及反映所推荐产品的新颖度的新颖度指标这个三个指标的情况下，推荐多样性指标可被表示为如下公式：

可以理解的是，上述推荐多样性指标的公式仅仅是一种示例性说明，任何对上述推荐多样性指标的公式进行的合理变形，都在本申请的保护范围之内。

S2400、以产品召回率和推荐准确率中的任一个以及推荐多样性指标为待优化的指标，通过样本集确定目标模型的至少两组超参数值，并获得相应的至少两个推荐模型，其中，一组超参数值对应一个推荐模型。

在本实施例中，目标模型为一个模型未经优化的推荐模型。在一个实施例中，目标模型可以为gbdt模型，当然，目标模型还可以为其他类型的推荐模型，例如：随机森林树模型，或者XGBoost模型。

在本实施例中，本实施例还包括确定推荐准确率的指标的步骤。该步骤具体包括如下S2410和S2412：

S2410、确定向每一用户推荐的产品中，属于对应用户交易过的产品的数量。

在本实施例中，对于向每一个用户推荐的产品，在交易数据集中，确定向对应用户推荐的每一产品是否为对应用户交易过的产品。再将对应用户对应的交易过的产品数量，作为上述S2410中的数量。

在一个例子中，若向一个用户推荐的产品为p1、p2、p3，而在交易数据集中该用户只交易过p1，则该用户对应的交易过的产品的数量为1。

S2411、确定向所有用户待推荐的产品的数量。

在本实施例中，上述S2411中的，向所有用户待推荐的产品的数量示例性的为：假设每一个用户对应的待推荐的产品的数量为8，以及欲向10个用户推荐产品，则8*10，为上述向所有用户待推荐的产品的数量。另外，每一用户对应的待推荐的产品通常为购物应用中向用户提供的所有类别的产品。例如，购物应用中可向用户提供p1、p2、p3、p4、p5、p6、p7、p8这八种产品，此时，每一用户对应的待推荐的产品分别为p1、p2、p3、p4、p5、p6、p7、p8。

S2412、将所有用户交易过的产品的数量，与向所有用户待推荐的产品的和之间的比值，确定为推荐多样性指标中的推荐准确率指标。

在本实施例中，上述S2412中的所有用户交易过的产品的数量，为上述S2410所有用户对应的属于对应用户交易过的产品的数量的和。

基于上述内容，本实施例还包括确定召回率的指标的步骤。该步骤具体包括如下S2420和S2422：

S2420、确定向每一用户推荐的产品中，属于对应用户交易过的产品的数量。

在本实施例中，上述S2420的具体实现与上述的S2410的具体实现相同，因此，这里不再赘述。

S2421、确定向所有用户推荐的产品的数量。

在本实施例中，上述S2421的具体实现为：确定向每一用户推荐的产品的数量，然后将所有用户对应的产品的数量求和。

需要说明的是，通过同一推荐模型得到的，向每一用户推荐的产品的数量，通常是相同的。基于此，上述S2421的具体实现可以为：向每一用户推荐的产品的数量，乘以所有用户的用户数量。

S2422、将所有用户交易过的产品的数量，与向所有用户推荐的产品的数量的和之间的比值，确定为推荐多样性指标中的召回率指标。

在本实施例中，上述S2422中的所有用户交易过的产品的数量，与上述S2412中的所有用户交易过的产品的数量属于同一概念，这里不再赘述。

在第一种实施例中，上述S2400中的：以产品召回率和推荐准确率中的任一个以及推荐多样性指标为待优化的指标，通过样本集确定目标模型的至少两组超参数值，的具体实现可以为：以召回率和推荐准确率中的任一个，作为待优化指标，通过样本集确定目标模型的至少一组超参数值，并获得相对应的至少一个推荐模型。以及，以推荐多样性指标为待优化指标，通过样本集确定目标模型的至少一组超参数值，并获得相对应的至少一个推荐模型。然后将待优化指标为召回率和推荐准确率中的任一个的推荐模型，以及待优化指标为推荐多样性指标的推荐模型，作为构建的基于多目标优化的推荐模型。

上述的以推荐多样性指标为待优化指标，通过样本集确定目标模型的至少一组超参数值的具体过程可以为：

以推荐多样性指标为待优化指标，以目标模型的模型超参数为待优化的目标，通过样本集和设定的单目标优化算法进行迭代训练，获得模型超参数的至少一组超参数值。

对应的，上述的以召回率和推荐准确率中的任一个，作为待优化指标，通过样本集确定目标模型的至少一组超参数值的具体过程可以为：

以召回率和推荐准确率中的任一个，作为待优化指标，以目标模型的模型超参数为待优化的目标，通过样本集和设定的单目标优化算法进行迭代训练，获得模型超参数的至少一组超参数值。

在第二种实施例中，上述2400中的：以产品召回率和推荐准确率中的任一个以及推荐多样性指标为待优化的指标，通过所述样本集确定目标模型的至少两组超参数值，的具体实现还可以为：

2430、以产品召回率和推荐准确率中的任一个以及推荐多样性指标为待优化的指标，以目标模型的模型超参数为待优化的目标，通过样本集和设定的多目标优化算法进行迭代训练，获得所述模型超参数的至少两组超参数值。

在一个实施例中，上述的多目标优化算法可进一步的为多目标优化遗传算。在一个例子中，多目标优化遗传算法可以为：NSGA算法、NSGA2算法、MOEAD算法等等。

基于上述的实施例，在多目标优化算法为多目标优化遗传算法的情况下，上述2430中的通过样本集和设定的多目标优化算法进行迭代训练，获得模型超参数的至少两组超参数值的具体过程为如下S2431-S2347：

S2431、将样本集拆分为训练样本集和测试样本集。

在本实施例中，可对样本集中的样本进行随机抽取，将抽取出的一部分样本作为训练样本集，一部分作为测试样本集。

S2432、通过训练样本集，训练目标模型，得到对应的至少两个训练后的目标模型。

在本实施例中，以上述的至少两个为100个为例，上述S2432的具体实现为：

随机初始化100个目标模型的超参数值；可以理解的是，100个目标模型的超参数值不完全相同。

对于每一个初始化模型超参数的目标模型，利用训练样本集进行训练，直至目标模型收敛。这样，便得到100个训练后的目标模型；可以理解的是，该步骤为模型的训练过程。由于该训练过程为传统神经网络模型的训练过程，因此，这里不再赘述。

S2433、通过测试样本集获得每一训练后的目标模型对于待优化的指标的指标值。

在本实施例中，继续以S2432中的例子为例，上述S2433的具体实现为：

对于训练后的目标模型中的每一个，将测试样本集输入至对应的经训练后的目标模型中，由对应的经训练后的目标模型输出，向测试样本集中对应的每一用户推荐的产品。即输出一个推荐结果。

基于上述内容可知，对于一个经训练后的目标模型，将得到向测试样本集中对应的每一用户推荐的产品；然后根据向测试样本集中对应的每一用户推荐的产品、测试样本集中对应的所有用户、测试样本集中对应的所有的待推荐的产品，通过上述的对于召回率和推荐准确率中的任一个、以及推荐多样性指标的确定方式，确定出该一个训练后的模型对应的召回率或推荐准确率，以及推荐多样性指标的指标值。

基于上述内容，经过S2433之后，将得到100个训练后的目标模型所对应的待优化指标的指标值。其中，待优化指标的指标值包括：召回率和推荐准确率中的至少一个、以及推荐多样性指标的指标值。

S2434、以指标值最大化为搜索条件，从训练后的目标模型筛选出部分训练后的目标模型。

在本实施例中，指标值最大化为不同指标值的全局最大化。在一个例子中，指标值最大化可以为不同指标的指标值的融合结果最大化。其中，融合可以为进行平均、加权求和等，当然也可以为利用其它函数关系计算不同指标的指标值之间的融合结果。

在本实施例中，上述的部分训练后的目标模型通常为全部训练后的目标模型中的一半。例如，在全部训练后的目标模型为100个时，上述S2434中的部分训练后的目标模型通常为50个。

继续以S2433中的例子为例，上述S2434的具体实现为：按照指标值的大小，对100个训练后的目标模型进行排序，然后将前50个训练后的目标模型进行保留，后50个训练后的目标模型淘汰。

S2435、根据部分训练后的目标模型，生成至少两个新的训练后的目标模型，获得通过当前训练得到的模型超参数的各组超参数值。

在本实施例中，在部分训练后的目标模型为50个时，生成至少两个新的训练后的目标模型具体为50*2＝100个。

在本实施例中，继续以S2434中的例子为例，上述S2435的具体实现为：对保留下来的50个训练后的目标模型，进行交叉编译，以得到新的100个训练后的目标模型。将该新的100个训练后的目标模型对应的超参数值，作为上述S2435中的通过当前训练得到的模型超参数的各组超参数值。

S2436、在当前训练未达到设定的收敛条件的情况下，将当前训练得到的模型超参数的各组超参数值，分别赋予目标模型，并进行下一次训练。

在一个实施例中，收敛条件可以为：训练次数达到设定次数。当然，收敛条件也可以为其他。

在本实施例中，在当前训练未达到设定的收敛条件的情况下，然后当前训练得到的模型超参数的各组超参数值，分别赋予目标模型，然后重复执行上述S2433，直至当前训练达到设定的收敛条件。

S2437、在当前训练达到收敛条件的情况下，获得模型超参数的至少两组超参数值为当前训练得到的各组超参数值。

基于上述S2100-S2400得到的基于多目标优化的推荐模型，在一个实施例中，本实施例还提供如下S2500-S2900：

S2500、获取目标用户对于设定的用户特征向量的用户向量值，以及每一待推荐的产品对于设定的产品特征向量的产品向量值。

在本实施例中，目标用户为使用购物应用的用户。上述设定的用户特征向量，通常为构建基于多目标优化的推荐模型所使用的样本集中对应的用户所包含的用户特征向量。基于此，在一个例子中，用户的特征向量包括年龄、性别、收入、职业中的至少一个特征。

对应的，上述设定的产品特征向量，通常为构建基于多目标优化的推荐模型所使用的样本集中对应的用户所包含的产品特征向量。基于此，在一个例子中，产品特征向量包括名称、价格、折扣、颜色、重量、邮递费用中的至少一个特征。

S2600、将用户向量值分别与每一产品向量值相结合，构建出各匹配数据。

在本实施例中，每一产品指的是购物应用提供的所有产品。上述S2600的具体实现可以为：将用户向量值和每一产品向量值进行笛卡尔积，将笛卡尔积的结果作为各匹配数据。

在一个例子中，当用户用u11来表示，购物应用提供的所有产品为p1、p2、p3、p4、p5来表示，则各匹配数据分别为：

(u11、p1、u11的用户向量值、p1的产品向量值)；

(u11、p2、u11的用户向量值、p2的产品向量值)；

(u11、p3、u11的用户向量值、p3的产品向量值)；

(u11、p4、u11的用户向量值、p4的产品向量值)；

(u11、p5、u11的用户向量值、p5的产品向量值)。

S2700、对于各匹配数据中的每一匹配数据，通过至少两个推荐模型分别给出对应匹配数据的推荐值。

在本实施例中，将每一匹配数据，分别输入至至少两个推荐模型中，得到，得到每一推荐模型对于每一匹配数据的推荐值。

S2800、根据推荐值，确定对应匹配数据的综合推荐值。

在一个实施例中，上述S2800的具体实现可以为：确定对应匹配数据的综合推荐值等于所有推荐值的平均值。当然，也可以为：确定对应匹配数据的综合推荐值等于所有推荐值的中间值等。

在本实施例中，以上述S2800的具体实现为：确定对应匹配数据的综合推荐值等于所有推荐值的平均值，为例，上述S2800的具体实现为：对于同一匹配数据，可以得到不同推荐模型对应的推荐值。针对于该同一匹配数据，将不同推荐模型对应的推荐值求取平均值，将该平均值作为该同一匹配数据的综合推荐值。

S2900、根据每一匹配数据的综合推荐值，获得向目标用户推荐的产品。

在本实施例中，基于上述S2800得到每一匹配数据的综合推荐值，然后将综合推荐值按照从大到小进行排列，将前预设位的综合推荐值对应的匹配数据中包含的产品，作为推荐结果。

<装置实施例>

本实施例提供了一种构建基于多目标优化的推荐模型的装置3000，如图3所示，包括第一获取模块3100、第一构建模块3200、第一确定模块3300以及第二构建模块3400：

第一获取模块3100，用于获取交易数据集，其中，所述交易数据集中的每一交易数据包括对应的交易产品和进行对应交易的用户；

第一构建模块3200，用于根据所述交易数据集构建样本集，其中，所述样本集中包括正样本和负样本；

第一确定模块3300，用于确定推荐多样性指标；

第二构建模块3400，用于以产品召回率和推荐准确率中的任一个以及推荐多样性指标为待优化的指标，通过所述样本集确定目标模型的至少两组超参数值，并获得相应的至少两个推荐模型，其中，一组超参数值对应一个推荐模型。

在一个实施例中，所述推荐多样性指标中包括反映所推荐产品的产品种类的种类多样性指标、反映所推荐产品的产品热度的热度指标、及反映所推荐产品的新颖度的新颖度指标。

在一个实施例中，所述目标模型为gbdt模型。

在一个实施例中，所有第二构建模块3400，具体用于以产品召回率和推荐准确率中的任一个以及推荐多样性指标为待优化的指标，以所述目标模型的模型超参数为待优化的目标，通过所述样本集和设定的多目标优化算法进行迭代训练，获得所述模型超参数的至少两组超参数值。

在一个实施例中，所述多目标优化算法为多目标优化遗传算法。

在一个实施例中，所述第二构建模块3400具体用于：将所述样本集拆分为训练样本集和测试样本集；

在一个实施例中，所述收敛条件包括训练次数达到设定次数。

在一个实施例中，所述装置还包括第二确定模块，所述第二确定模块用于：

确定向所有用户待推荐的产品的数量；

在一个实施例中，所述装置还包括第三确定模块，所述第三确定模块用于：

确定向所有用户推荐的产品的数量；

在一个实施例中，所述第一确定模块3300中包括第一确定单元，所述第一确定单元用于：

在一个实施例中，所述第一确定模块3300中包括第二确定单元，所述第二确定单元用于：

在一个实施例中，所述第二确定单元还用于：

根据所述交易数据集，计算每一产品对应的交易过的次数；

在一个实施例中，所述第二确定单元还用于：

根据所述交易数据集，计算每一产品对应的交易过的次数；

在一个实施例中，所述第一确定模块3300中包括第三确定单元，所述第三确定单元还用于：

根据修改后的训练样本，训练第一推荐模型；

将训练后的第一推荐模型，作为新颖性函数。

在一个实施例中，所述第一推荐模型为gbdt模型、随机森林树模型、XGBoost模型中的任一个。

在一个实施例中，所述装置还包括：

在一个实施例中，所述第四确定模块具体用于：

在一个实施例中，所述用户特征向量包括年龄、性别、收入、职业中的至少一个特征。

在一个实施例中，所述产品特征向量包括名称、价格、折扣、颜色、重量、邮递费用中的至少一个特征。

<设备实施例>

本实施例提供了一种电子设备4000，其中，电子设备4000包括如上述装置实施例中任一项所述的构建基于多目标优化的推荐模型的装置3000；或者，

包括存储器4100和处理器4200，所述存储器4100用于存储计算机指令，所述处理器4200用于从所述存储器4100中调用所述计算机指令，以执行上述方法实施例中任一项所述的方法。

<存储介质实施例>

本实施例提供了一种计算机可读存储介质，其中，其上存储有计算机程序，所述计算机程序在被处理器执行时实现根据上述方法实施例中任一项所述的方法。

本发明可以是系统、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质，其上载有用于使处理器实现本发明的各个方面的计算机可读程序指令。

计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括：便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身，诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如，通过光纤电缆的光脉冲)、或者通过电线传输的电信号。

这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备，或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令，并转发该计算机可读程序指令，以供存储在各个计算/处理设备中的计算机可读存储介质中。

用于执行本发明操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码，所述编程语言包括面向对象的编程语言—诸如Smalltalk、C++等，以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机，或者，可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中，通过利用计算机可读程序指令的状态信息来个性化定制电子电路，例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA)，该电子电路可以执行计算机可读程序指令，从而实现本发明的各个方面。

这里参照根据本发明实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本发明的各个方面。应当理解，流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合，都可以由计算机可读程序指令实现。

这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器，从而生产出一种机器，使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时，产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中，这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作，从而，存储有指令的计算机可读介质则包括一个制造品，其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。

也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上，使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤，以产生计算机实现的过程，从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。

附图中的流程图和框图显示了根据本发明的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分，所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个连续的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或动作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。对于本领域技术人员来说公知的是，通过硬件方式实现、通过软件方式实现以及通过软件和硬件结合的方式实现都是等价的。

以上已经描述了本发明的各实施例，上述说明是示例性的，并非穷尽性的，并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下，对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择，旨在最好地解释各实施例的原理、实际应用或对市场中的技术的技术改进，或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。本发明的范围由所附权利要求来限定。

Claims

1.一种构建基于多目标优化的推荐模型的方法，包括：

确定推荐多样性指标；

2.根据权利要求1所述的方法，其中，所述推荐多样性指标中包括反映所推荐产品的产品种类的种类多样性指标、反映所推荐产品的产品热度的热度指标、及反映所推荐产品的新颖度的新颖度指标。

3.根据权利要求1所述的方法，其中，所述目标模型为gbdt模型。

4.根据权利要求1所述的方法，其中，所述以产品召回率和推荐准确率中的任一个以及推荐多样性指标为待优化的指标，通过所述样本集确定目标模型的至少两组超参数值，包括：

5.根据权利要求4所述的方法，其中，所述多目标优化算法为多目标优化遗传算法。

6.根据权利要求5所述的方法，其特征在于，所述通过所述样本集和设定的多目标优化算法进行迭代训练，获得所述模型超参数的至少两组超参数值包括：

将所述样本集拆分为训练样本集和测试样本集；

7.根据权利要求6所述的方法，其中，所述收敛条件包括训练次数达到设定次数。

8.一种构建基于多目标优化的推荐模型的装置，包括：

第一确定模块，用于确定推荐多样性指标；

9.一种电子设备，其中，所述电子设备包括如权利要求8所述的构建基于多目标优化的推荐模型的装置；或者，

包括存储器和处理器，所述存储器用于存储计算机指令，所述处理器用于从所述存储器中调用所述计算机指令，以执行如权利要求1-7中任一项所述的方法。

10.一种计算机可读存储介质，其中，其上存储有计算机程序，所述计算机程序在被处理器执行时实现根据权利要求1-7任一项所述的方法。