CN110727872A

CN110727872A - 基于隐式反馈进行不明确选择行为挖掘的方法及装置

Info

Publication number: CN110727872A
Application number: CN201910999358.2A
Authority: CN
Inventors: 周洪峰
Original assignee: Shenzhen Microproducts To Mdt Infotech Ltd
Current assignee: Shenzhen Microproducts To Mdt Infotech Ltd
Priority date: 2019-10-21
Filing date: 2019-10-21
Publication date: 2020-01-24

Abstract

本申请提供基于隐式反馈进行不明确选择行为挖掘的方法及装置，该方法包括：获取用户的特征数据，处理成预设数据类型得到用户的特征向量；得到产品的特征向量；进行选择倾向计算得到用户对产品的选择倾向程度；根据用户对该产品的选择倾向程度与用户对所有产品的平均选择倾向程度，得到用户选择该产品的选择倾向概率；根据用户的特征数据与产品的选择倾向概率进行训练得到训练推荐模型；获取待推荐用户的特征数据，代入训练推荐模型得到待推荐用户与各个候选产品的选择倾向概率，将候选产品按照选择倾向概率从高到低进行排序生成候选产品推荐列表。本发明提高了隐式反馈进行不明确选择行为挖掘的可扩展性和效率。

Description

基于隐式反馈进行不明确选择行为挖掘的方法及装置

技术领域

本申请涉及行为选择挖掘的技术领域，尤其涉及一种基于隐式反馈进行不明确选择行为挖掘的方法及装置。

背景技术

随着信息科技的快速发展，人们每时每刻都能接受到大量的信息，如何从这些大量信息中寻求对自己有用信息至关重要，对于人们来讲，从大量信息中选取有用信息的成本也越来越高。人们要想从各种信息中了解有用的信息，需要花费较多的精力，致使对于信息的使用效率反而降低。

为了解决人们在信息生活中遇到的信息过载的问题，帮助人们从众多信息中快速获取想要信息，信息推荐系统就应运而生。推荐系统从已有信息中学习用户和物品的特征，评估用户与物品的匹配度，进而预测用户对物品的偏好程度，物品对用户的效用，再将用户最有可能喜欢的物品推荐给用户。用户偏好可能通过很多渠道来获得，大体上分为显示反馈和隐式反馈，显示反馈包括用户对物品的评论、评分等，它们可以直接体现出用户对物品的喜好程度。而与之对应点，用户的点击、收藏或者搜索记录等不能直接体现用户偏好的信息称为隐式反馈。

随着消费者可选择的商品数量快速增加，消费者做出选择行为决策越来越困难，越来越多的消费者遭受到犹豫不定的困扰，使得消费者在竞争性商品中不能做出快速果断的选择。因此，以数据驱动,挖掘消费者在消费过程中的不明确性，在以数据为驱动的视角下提出自动挖掘不明确性的模型。给出每个行为小节观测到的不明确性的定量化方式，基于这些所观测定量化的不明确性,通过一个概率图模型同时习得潜在消费者的不明确性指数和商品组合中的不明确性指数，分析这类消费者行为中的选择不明确性挖掘在很多方面的潜在应用价值,比如竞争性商品的检测、个性化商品推荐，也就显得十分有必要。

但是，现有的隐式反馈推荐技术中，存在以下问题：(1)样本不平衡：在隐式反馈推荐场景中,往往只有正反馈而没有负反馈，不像评分1-5可代表由“不喜欢”到“很喜欢”的倾向性程度,隐式反馈只包含“已选择”与“未选择”两类(本文将点击、交易、转发等各种交互行为称为选择),即使可以将“已选择”看成是正倾向,那么“未选择”却不能简单看成是负倾向,因为未选择的产品中混杂着用户确实不感兴趣的产品和用户未发现但感兴趣的产品(本文将电影、商品、微博等泛称为产品)，这种只有正例而缺少负例的设置,给训练推荐模型带来了困难。(2)高维稀疏与噪声：如果使用产品作为特征表示用户的话,用户特征向量可能高达百万维。在用户-产品交互矩阵中,往往只有不到1％的交互行为是可被观察的。相对评分而言,用户可能因为误点击产生更多噪声，高维稀疏的数据对噪声会更加敏感。(3)规模大：使得现有推荐模型出现效率跟不上且可扩展性不足,不能处理海量规模数据的问题。(4)冷启动问题：无法获取足够的产品信息进行判定，会导致对冷启动产品的判定误差增大。

因此，如何提供一种能够解决高维稀疏下的噪声问题，以较强可扩展性和高效率基于隐式反馈进行不明确选择行为挖掘的方案是本领域亟待解决的技术问题。

发明内容

本申请的目的在于提供一种基于隐式反馈进行不明确选择行为挖掘的方法及装置，解决现有技术中没有能够解决高维稀疏下的噪声问题，以较强可扩展性和高效率基于隐式反馈进行不明确选择行为挖掘的技术问题。

为达到上述目的，本申请提供一种基于隐式反馈进行不明确选择行为挖掘的方法，包括：

获取用户基本信息、购买次数及点击次数的特征数据，处理成预设数据类型，根据预设权重对应关系分别向所述特征数据赋予相应的权重，得到所述用户的特征向量；根据产品的特征数据得到所述产品的特征向量；

根据所述用户的特征向量与所述产品的特征向量进行选择倾向计算，得到所述用户对所述产品的选择倾向程度；根据所述用户对该产品的选择倾向程度与所述用户对所有产品的平均选择倾向程度，得到所述用户选择该产品的选择倾向概率；

根据所述用户的特征数据与所述产品的选择倾向概率进行训练得到训练推荐模型；

获取待推荐用户的特征数据，代入所述训练推荐模型得到所述待推荐用户与各个候选产品的选择倾向概率，将所述候选产品按照所述选择倾向概率从高到低进行排序生成候选产品推荐列表。

可选地，其中，根据所述用户的特征向量与所述产品的特征向量进行选择倾向计算，得到所述用户对所述产品的选择倾向程度；根据所述用户对该产品的选择倾向程度与所述用户对所有产品的平均选择倾向程度，得到所述用户选择该产品的选择倾向概率，为：

在预设维度特征空间，获取所述用户的特征向量与所述产品的特征向量；

根据所述用户的特征向量与所述产品的特征向量进行选择倾向计算，公式如下：

其中，A_ij表示用户i对产品j的选择倾向程度，U_i为用户i的特征向量，V_j为产品j的特征向量，K为预设总维度，U_ik为在第k维度的用户i的特征向量，V_jk在第k维度的产品j的特征向量；

根据所述用户对该产品的选择倾向程度与所述用户对所有产品的平均选择倾向程度，得到所述用户选择该产品的选择倾向概率。

可选地，其中，根据所述用户对该产品的选择倾向程度与所述用户对所有产品的平均选择倾向程度，得到所述用户选择该产品的选择倾向概率，为：

根据所述用户对该产品的选择倾向程度与所述用户对所有产品的平均选择倾向程度，得到所述用户选择该产品的相关性：

其中，_Δij为用户i选择产品j的相关性，A_ij表示用户i对产品j的选择倾向程度，A_i表示用户i对所有M个产品的平均选择倾向程度；

利用sigmoid函数

将所述用户选择该产品的相关性归一化到(0,1)区间,作为用户i选择产品j的概率

可选地，其中，该方法还包括：

根据所述用户的特征数据与所述产品的选择倾向概率构成训练集；

根据所述训练集计算似然概率：

其中，O为训练集，U为用户潜在特征，V为产品潜在特征；

对所述用户的特征向量与所述产品的特征向量的以下优化目标最小化：

其中,

是调节参数，得到最大化潜在特征矩阵。

可选地，其中，该方法还包括：根据随机梯度下降法对所述优化目标进行优化：

对所述用户i对产品j的选择行为，分别对所述用户的特征向量U_i和所述产品的特征向量V_j求偏导作为梯度：

其中，

表示全部产品的平均特征向量；

使用随机梯度下降法求解得到用户潜在特征矩阵和产品潜在特征矩阵。

另一方面，本发明还提供一种基于隐式反馈进行不明确选择行为挖掘的装置，包括：特征向量数据处理器、选择倾向概率处理器、训练推荐模型创建器及推荐处理器相连接；其中，

所述特征向量数据处理器，与所述选择倾向概率处理器相连接，获取用户基本信息、购买次数及点击次数的特征数据，处理成预设数据类型，根据预设权重对应关系分别向所述特征数据赋予相应的权重，得到所述用户的特征向量；根据产品的特征数据得到所述产品的特征向量；

所述选择倾向概率处理器，与所述特征向量数据处理器及训练推荐模型创建器相连接，根据所述用户的特征向量与所述产品的特征向量进行选择倾向计算，得到所述用户对所述产品的选择倾向程度；根据所述用户对该产品的选择倾向程度与所述用户对所有产品的平均选择倾向程度，得到所述用户选择该产品的选择倾向概率；

所述训练推荐模型创建器，与所述选择倾向概率处理器及推荐处理器相连接，根据所述用户的特征数据与所述产品的选择倾向概率进行训练得到训练推荐模型；

所述推荐处理器，与所述训练推荐模型创建器相连接，获取待推荐用户的特征数据，代入所述训练推荐模型得到所述待推荐用户与各个候选产品的选择倾向概率，将所述候选产品按照所述选择倾向概率从高到低进行排序生成候选产品推荐列表。

可选地，其中，所述选择倾向概率处理器，包括：选择倾向计算处理器及选择倾向概率计算处理器；其中，

所述选择倾向计算处理器，与所述特征向量数据处理器及选择倾向概率计算处理器相连接，在预设维度特征空间，获取所述用户的特征向量与所述产品的特征向量；

所述选择倾向概率计算处理器，与所述选择倾向计算处理器及训练推荐模型创建器相连接，根据所述用户对该产品的选择倾向程度与所述用户对所有产品的平均选择倾向程度，得到所述用户选择该产品的选择倾向概率。

可选地，其中，所述选择倾向概率计算处理器，包括：选择相关性计算处理单元及选择倾向概率计算处理单元；其中，

所述选择相关性计算处理单元，与所述选择倾向计算处理器及选择倾向概率计算处理单元相连接，根据所述用户对该产品的选择倾向程度与所述用户对所有产品的平均选择倾向程度，得到所述用户选择该产品的相关性：

其中，Δ_ij为用户i选择产品j的相关性，A_ij表示用户i对产品j的选择倾向程度，A_i表示用户i对所有M个产品的平均选择倾向程度；

所述选择倾向概率计算处理单元，与所述选择相关性计算处理单元及训练推荐模型创建器相连接，利用sigmoid函数

可选地，其中，该装置还包括：训练推荐处理器，与所述选择倾向概率处理器及训练推荐模型创建器相连接，根据所述用户的特征数据与所述产品的选择倾向概率构成训练集；

根据所述训练集计算似然概率：

其中，O为训练集，U为用户潜在特征，V为产品潜在特征；

其中,是调节参数，得到最大化潜在特征矩阵。

可选地，其中，该装置还包括：训练推荐模型优化处理器，与所述训练推荐模型创建器相连接，根据随机梯度下降法对所述优化目标进行优化：

其中，

表示全部产品的平均特征向量；

本申请的基于隐式反馈进行不明确选择行为挖掘的方法及装置，实现的有益效果至少如下：

本申请的基于隐式反馈进行不明确选择行为挖掘的方法及装置，通过将推荐任务转化为用户选择行为发生概率的最大化问题,达到直接对隐式反馈数据进行建模的目的,这样既利用了“未选择”信息,又避免了在引入负例的同时引入噪声,进而提升推荐质量。借鉴降维技术,模型通过优化用户以及产品的潜在特征来建模用户与产品间的选择倾向,从而解决高维稀疏下的噪声问题。为了提高可扩展性和效率,基于分桶策略进一步提出了并行化隐式反馈推荐模型,并在MapReduce分布式计算框架下予以实现。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请中记载的一些实施例，对于本领域技术人员来讲，还可以根据这些附图获得其他的附图。

图1为本发明实施例中一种基于隐式反馈进行不明确选择行为挖掘的方法的流程示意图；

图2为本发明实施例中一种基于隐式反馈进行不明确选择行为挖掘的原理示意图；

图3为本发明实施例中一种基于隐式反馈进行不明确选择行为挖掘的原理流程示意图；

图4为本发明实施例中一种基于隐式反馈进行不明确选择行为挖掘的方法的应用流程示意图；

图5为本发明实施例中第二种基于隐式反馈进行不明确选择行为挖掘的方法的流程示意图；

图6为本发明实施例中第三种基于隐式反馈进行不明确选择行为挖掘的方法的流程示意图；

图7为本发明实施例中第四种基于隐式反馈进行不明确选择行为挖掘的方法的流程示意图；

图8为本发明实施例中第五种基于隐式反馈进行不明确选择行为挖掘的方法的流程示意图；

图9为本发明实施例中一种基于隐式反馈进行不明确选择行为挖掘的装置的结构示意图；

图10为本发明实施例中第二种基于隐式反馈进行不明确选择行为挖掘的装置的结构示意图；

图11为本发明实施例中第三种基于隐式反馈进行不明确选择行为挖掘的装置的结构示意图；

图12为本发明实施例中第四种基于隐式反馈进行不明确选择行为挖掘的装置的结构示意图；

图13为本发明实施例中第五种基于隐式反馈进行不明确选择行为挖掘的装置的结构示意图。

具体实施方式

下面结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

实施例

如图1至4所示，图1为本实施例中一种基于隐式反馈进行不明确选择行为挖掘的方法的流程示意图；图2为本实施例中一种基于隐式反馈进行不明确选择行为挖掘的原理示意图；图3为本实施例中一种基于隐式反馈进行不明确选择行为挖掘的原理流程示意图；图4为本实施例中一种基于隐式反馈进行不明确选择行为挖掘的方法的应用流程示意图。形式化地定义基于隐式反馈的推荐问题，如图2所示，推荐模型可以利用的信息是用户-产品历史选择集合,如左侧的矩阵所示,其中,灰色代表观察到的用户选择行为,白色代表用户尚未选择该产品.当给定任意用户i以及待推荐列表L(由待推荐候选产品组成),推荐模型可以生成L的排序L,L应尽可能地将用户将要选择的产品排在其他产品前面。而需要解决的问题是,如何根据历史选择集合构造出这样一个推荐模型。具体地，该方法包括如下步骤：

步骤101、获取用户基本信息、购买次数及点击次数的特征数据，处理成预设数据类型，根据预设权重对应关系分别向特征数据赋予相应的权重，得到用户的特征向量；根据产品的特征数据得到产品的特征向量。

步骤102、根据用户的特征向量与产品的特征向量进行选择倾向计算，得到用户对产品的选择倾向程度；根据用户对该产品的选择倾向程度与用户对所有产品的平均选择倾向程度，得到用户选择该产品的选择倾向概率。

步骤103、根据用户的特征数据与产品的选择倾向概率进行训练得到训练推荐模型。

步骤104、获取待推荐用户的特征数据，代入训练推荐模型得到待推荐用户与各个候选产品的选择倾向概率，将候选产品按照选择倾向概率从高到低进行排序生成候选产品推荐列表。

在一些可选的实施例中，如图5所示，为本实施例中第二种基于隐式反馈进行不明确选择行为挖掘的方法的流程示意图，与图1中不同的是，根据用户的特征向量与产品的特征向量进行选择倾向计算，得到用户对产品的选择倾向程度；根据用户对该产品的选择倾向程度与用户对所有产品的平均选择倾向程度，得到用户选择该产品的选择倾向概率，为：

步骤501、在预设维度特征空间，获取用户的特征向量与产品的特征向量。

步骤502、根据用户的特征向量与产品的特征向量进行选择倾向计算，公式如下：

其中，A_ij表示用户i对产品j的选择倾向程度，U_i为用户i的特征向量，V_j为产品j的特征向量，K为预设总维度，U_ik为在第k维度的用户i的特征向量，V_jk在第k维度的产品j的特征向量。

事实上，绝对的选择倾向程度本身不足以反映用户的选择行为，应该在比较下才有意义。比如用户对某产品的选择倾向程度为10，但这不意味着用户会选择该产品或者不会选择该产品。当用户对大多数产品的选择倾向都很高时(平均选择倾向程度为20)，那么用户很可能不会选择该产品；反之，当用户对大多数产品的选择倾向都很低时(平均选择倾向程度为5)，那么用户很可能会选择该产品。综上，用户i之所以选择产品j，是因为对用户i来说，产品j比一般产品更具吸引力。

步骤503、根据用户对该产品的选择倾向程度与用户对所有产品的平均选择倾向程度，得到用户选择该产品的选择倾向概率。

在一些可选的实施例中，如图6所示，为本实施例中第三种基于隐式反馈进行不明确选择行为挖掘的方法的流程示意图，与图5中不同的是，根据用户对该产品的选择倾向程度与用户对所有产品的平均选择倾向程度，得到用户选择该产品的选择倾向概率，为：

步骤601、根据用户对该产品的选择倾向程度与用户对所有产品的平均选择倾向程度，得到用户选择该产品的相关性：

其中，Δ_ij为用户i选择产品j的相关性，A_ij表示用户i对产品j的选择倾向程度，A_i表示用户i对所有M个产品的平均选择倾向程度。

用户i选择产品j的概率与Δ_ij相关：Δ_ij越大，表示用户i越可能选择产品j；Δ_ij越接近于0，表示用户i越不可能选择产品j。

步骤602、利用sigmoid函数

将用户选择该产品的相关性归一化到(0,1)区间,作为用户i选择产品j的概率

在一些可选的实施例中，如图7所示，为本实施例中第四种基于隐式反馈进行不明确选择行为挖掘的方法的流程示意图，与图6中不同的是，还包括：

步骤701、根据用户的特征数据与产品的选择倾向概率构成训练集。

步骤702、根据训练集计算似然概率：

其中，O为训练集，U为用户潜在特征，V为产品潜在特征；

对用户的特征向量与产品的特征向量的以下优化目标最小化：

其中,

是调节参数，得到最大化潜在特征矩阵。

设集合O＝{<i,j>|用户i选择产品j}是观察到的选择行为的集合，假设每一次的选择行为是独立的,那么集合O的似然概率为

训练推荐模型的本质是：给定观察集O(也即是训练集)，最大化潜在特征U,V的后验概率P(U,V|O)。由贝叶斯定理：

当假设U,V服从均值为0、方差为s²的高斯先验时,

取对数：

其中，

表示2范数。于是，最大化后验概率P(U,V|O)等价于最小化以下优化目标：

其中，

是调节参数，用于调节控制潜在特征矩阵U,V的复杂度,以防止过拟合。

至此，IFRM将基于隐式反馈的推荐问题转化为一个最优化问题，即根据可观察选择行为集合O求得潜在特征矩阵U,V。在预测时,对任意给定的用户i以及候选产品集{j1,j2,…,jp},根据由公式(1)计算出的Aij由高到低对候选产品进行排序，即可产生推荐列表。

IFRM借鉴潜在因子模型处理高维稀疏数据的思路，利用降维技术在低维空间对用户以及产品建模，提高了模型抗噪能力。IFRM继承了矩阵分解的良好可扩展性，模型复杂程度仅随可观察的选择行为数|O|线性增长。这与传统的基于用户或基于产品的协同过滤方法有显著不同，当用户或产品规模庞大时，计算用户-用户相似性或产品-产品相似性是非常耗时的。

与传统的基于显示反馈推荐方法不同，IFRM并不去拟合具体评分值，而是去最大化可观察用户行为出现的概率。通过建模用户选择倾向而不是评分行为，IFRM天然地适用于没有评分而只有选择交互行为的隐式反馈推荐场景。

基于隐式反馈的矩阵分解与贝叶斯个性化排序等在隐式反馈场景下进行推荐的方法有个共同潜在假设，即用户表现出来的反馈就是正样本,未表现出来的就是负样本。基于此，iMF将正样本设置为1而将负样本设置为0，而BPR则最大化正样本排在随机抽样得到的“负”样本前面的概率。然而，这些负样本却有可能是潜在的正样本，即在将来会发生的选择行为。这样，难以避免会引入噪声(假负).与它们不同，IFRM并不进行这样的假设,通过关注选择行为本身，并最大化选择行为发生的概率，避免了引入噪声,进而提高推荐质量。

IFRM算法：Input data--->data processing--->model train--->modelassess--->save model。

Input data：采用每隔一段时间输入数据，数据特征为user_name,pro_name,phone,购买次数，点击次数等等。

Data processing:将数据处理成推荐系统所能接受的类型数据，如Rating类型的数据，数据特征包含：user_id,pro_id,ratings。根据用户的点击次数和购买次数分别赋予相应的权重，分别为90％，10％。

Model train：采用IFRM算法进行推荐系统的训练。

Model assess：生成的模型在测试数据上的表现，及模型的优化。

Save model：保存模型。

在一些可选的实施例中，如图8所示，为本实施例中第五种基于隐式反馈进行不明确选择行为挖掘的方法的流程示意图，与图7中不同的是，还包括：根据随机梯度下降法对优化目标进行优化：

步骤801、对用户i对产品j的选择行为，分别对用户的特征向量U_i和产品的特征向量V_j求偏导作为梯度：

其中，

表示全部产品的平均特征向量。

步骤802、使用随机梯度下降法求解得到用户潜在特征矩阵和产品潜在特征矩阵。

可选地，可以使用随机梯度下降法求解IFRM的基本算法如下:

SGD求解IFRM。

输入:可观察选择集合O,学习率a，最大迭代次数T；

输出:潜在特征矩阵U,V。

1.随机初始化U,V

2.for iter＝1,2,…,T do:

3.

4.根据公式(3)所求梯度更新；

5.根据公式(4)所求梯度更新；

6.end for。

在一些可选的实施例中，如图9所示，为本实施例中一种基于隐式反馈进行不明确选择行为挖掘的装置900的结构示意图，该装置可用于实施上述的基于隐式反馈进行不明确选择行为挖掘的方法。具体地，该装置包括：特征向量数据处理器901、选择倾向概率处理器902、训练推荐模型创建器903及推荐处理器904相连接。

其中，特征向量数据处理器901，与选择倾向概率处理器902相连接，获取用户基本信息、购买次数及点击次数的特征数据，处理成预设数据类型，根据预设权重对应关系分别向特征数据赋予相应的权重，得到用户的特征向量；根据产品的特征数据得到产品的特征向量。

选择倾向概率处理器902，与特征向量数据处理器901及训练推荐模型创建器903相连接，根据用户的特征向量与产品的特征向量进行选择倾向计算，得到用户对产品的选择倾向程度；根据用户对该产品的选择倾向程度与用户对所有产品的平均选择倾向程度，得到用户选择该产品的选择倾向概率。

训练推荐模型创建器903，与选择倾向概率处理器902及推荐处理器904相连接，根据用户的特征数据与产品的选择倾向概率进行训练得到训练推荐模型。

推荐处理器904，与训练推荐模型创建器903相连接，获取待推荐用户的特征数据，代入训练推荐模型得到待推荐用户与各个候选产品的选择倾向概率，将候选产品按照选择倾向概率从高到低进行排序生成候选产品推荐列表。

在一些可选的实施例中，如图10所示，为本实施例中第二种基于隐式反馈进行不明确选择行为挖掘的装置1000的结构示意图，与图9中不同的是，选择倾向概率处理器902，包括：选择倾向计算处理器1001及选择倾向概率计算处理器1002。

其中，选择倾向计算处理器1001，与特征向量数据处理器901及选择倾向概率计算处理器1002相连接，在预设维度特征空间，获取用户的特征向量与产品的特征向量。

根据用户的特征向量与产品的特征向量进行选择倾向计算，公式如下：

选择倾向概率计算处理器1002，与选择倾向计算处理器1001及训练推荐模型创建器903相连接，根据用户对该产品的选择倾向程度与用户对所有产品的平均选择倾向程度，得到用户选择该产品的选择倾向概率。

在一些可选的实施例中，如图11所示，为本实施例中第三种基于隐式反馈进行不明确选择行为挖掘的装置1100的结构示意图，与图10中不同的是，选择倾向概率计算处理器1002，包括：选择相关性计算处理单元1101及选择倾向概率计算处理单元1102。

其中，选择相关性计算处理单元1101，与选择倾向计算处理器1001及选择倾向概率计算处理单元1102相连接，根据用户对该产品的选择倾向程度与用户对所有产品的平均选择倾向程度，得到用户选择该产品的相关性：

选择倾向概率计算处理单元1102，与选择相关性计算处理单元1101及训练推荐模型创建器903相连接，利用sigmoid函数

在一些可选的实施例中，如图12所示，为本实施例中第四种基于隐式反馈进行不明确选择行为挖掘的装置1200的结构示意图，与图11中不同的是，还包括：训练推荐处理器1201，与选择倾向概率计算处理器1002及训练推荐模型创建器903相连接，根据用户的特征数据与产品的选择倾向概率构成训练集；

根据训练集计算似然概率：

其中，O为训练集，U为用户潜在特征，V为产品潜在特征；

其中,

是调节参数，得到最大化潜在特征矩阵。

在一些可选的实施例中，如图13所示，为本实施例中第五种基于隐式反馈进行不明确选择行为挖掘的装置1300的结构示意图，与图12中不同的是，还包括：训练推荐模型优化处理器1301，与训练推荐模型创建器903相连接，根据随机梯度下降法对优化目标进行优化：

对用户i对产品j的选择行为，分别对用户的特征向量U_i和产品的特征向量V_j求偏导作为梯度：

其中，

表示全部产品的平均特征向量；

尽管已描述了本申请的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例作出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。显然，本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样，倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内，则本申请也意图包含这些改动和变型在内。