CN106445969A

CN106445969A - 一种全局兴趣探索推荐方法和装置

Info

Publication number: CN106445969A
Application number: CN201510490257.4A
Authority: CN
Inventors: 陈建树; 许景皓; 曹欢欢
Original assignee: Beijing ByteDance Technology Co Ltd
Current assignee: Beijing Douyin Information Service Co Ltd
Priority date: 2015-08-11
Filing date: 2015-08-11
Publication date: 2017-02-22
Anticipated expiration: 2035-08-11
Also published as: CN106445969B

Abstract

一种全局兴趣探索推荐方法和装置，该方法利用统一的兴趣探索模型协调各个场景下的用户兴趣探索及推荐，包括根据推荐内容构建一个层次化的兴趣标签集合为全局兴趣空间模型，并计算所述兴趣标签集合中各兴趣标签的关联度；基于所述全局兴趣空间模型，根据用户已有的兴趣标签确定用户潜在感兴趣的兴趣标签，并通过所述用户兴趣探索规划模型实现各个场景的用户兴趣探索及推荐；针对同一个所述用户兴趣探索规划模型，每个具体场景下的用户兴趣探索均基于用户整体兴趣探索效率最大化，并结合所述具体场景确定兴趣标签的优先级并予以推荐，同时根据用户行为更新所述用户兴趣探索规划模型。本发明还公开了一种全局兴趣探索推荐装置。

Description

一种全局兴趣探索推荐方法和装置

技术领域

本发明涉及一种智能推荐技术，特别是一种融合多场景的全局兴趣探索推荐方法和装置。

背景技术

近年来，随着移动互联网和大数据技术的爆发性发展，智能推荐技术在越来越多的互联网产品上得到广泛应用，比如，新闻推荐(典型产品如今日头条)，电影和书籍推荐(例如豆瓣)，视频推荐(例如优酷、爱奇艺等)，商品推荐(例如淘宝、口袋购物)。推荐技术面临的一个主要难点就是如何尽量全面地挖掘用户的兴趣和需求。具体来说，给定一个用户，基于一些数据挖掘手段(比如挖掘用户点击历史、网页浏览历史、社交网络信息等)，可以获取部分用户兴趣，从而解决推荐的冷启动问题。但是，一味满足已知的用户兴趣容易导致推荐范围变窄和用户满意度下降。为了解决这个问题，一个实用的推荐系统必须考虑如何探索未知的用户兴趣，目前主流的推荐系统一般采用下列几种方式：

1)在推荐的内容中插入一些兴趣扩展的内容：比如，假定推荐模型知道用户对于EXO和鹿晗感兴趣，可以在推荐相关新闻时插入其它韩国明星的新闻。如果用户也点击了这些模型，系统就会把“韩国明星”的标签加入用户的兴趣模型；

2)给推荐的内容打上兴趣扩展标签：沿用上面的例子，系统可以在每一篇推荐出的EXO相关文章后面打上“韩国明星”的标签，用户可以点击查看该标签下的内容并确认“喜欢”。得到用户确认后，系统就会把“韩国明星”标签加入用户的兴趣模型；

3)提供一个用于兴趣探索的入口：系统提供一个入口给用户，方便用户对现有内容感到厌倦的时候探索兴趣。沿用上面的例子，当用户想看看还有什么有意思的内容时可以进入“探索”入口浏览推荐的兴趣标签，如果对推荐出的“韩国明星”标签感兴趣，就可以点击确认，这时系统就会把“韩国明星”标签加入用户的兴趣模型。

现有的几种兴趣探索技术虽然在实际应用中都有一定的作用，但是也有各自的缺点。对于方法1)来说，因为是在推荐内容中直接插入兴趣探索的内容，如果这些内容选择的不好，很可能探索效率比较低，导致影响用户体验。对于方法2)来说，这种方法虽然对用户体验伤害小，但是探索的范围有限。比如对于EXO的文章，系统可以打上“韩国明星”的标签，但是如果用户已经对这个标签表达过“喜欢”，更大范围的兴趣探索就不太好进行。比如如果系统想确认用户是否喜欢“日本明星”，就无法得到支持。方法3)在上述方法中是最灵活的，既可以直接推荐“兴趣标签”，提高兴趣探索的效率，又能够不囿于文章的限制，推荐出用户看过的文章中未曾出现过的兴趣标签。但是方法3)最大的问题是需要用户主动使用探索功能，因为大部分用户是比较被动的，这个功能使用率往往很低。有的推荐系统同时采用上述三种用户兴趣探索方法，但是三种方法的策略没有形成有机整体，容易造成探索效率低下。比如，一个用户的推荐内容中已经插入过若干次“亚冠”的新闻(用于探索该用户对于“亚冠”的兴趣)，如果用户每次都没有点击，当用户主动进入兴趣探索入口时不但“亚冠”的兴趣标签不用再展示，相关的“中国足球”的兴趣标签也不应该优先展示。但是实际上目前的很多推荐系统无法做到这一点。

发明内容

本发明所要解决的技术问题是针对现有技术的上述缺陷，提供一种融合多场景的全局兴趣探索推荐方法和装置，利用统一的兴趣探索模型协调各个场景下的用户兴趣探索，从全局出发规划用户兴趣探索，能够显著提升用户兴趣探索推荐的效率。

为了实现上述目的，本发明提供了一种全局兴趣探索推荐方法，其中，利用统一的兴趣探索模型协调各个场景下的用户兴趣探索及推荐，包括如下步骤：

S100、构建全局兴趣空间模型，根据推荐内容构建一个层次化的兴趣标签集合，并计算所述兴趣标签集合中各兴趣标签的关联度；

S200、建立用户兴趣探索规划模型，基于所述全局兴趣空间模型，根据已经收集的用户数据建立用户兴趣探索规划模型，根据用户已有的兴趣标签确定用户潜在感兴趣的兴趣标签，并通过所述用户兴趣探索规划模型实现各个场景的用户兴趣探索及推荐；以及

S300、各个场景的用户兴趣探索共享，针对同一个所述用户兴趣探索规划模型，每个具体场景下的用户兴趣探索均基于用户整体兴趣探索效率最大化，并结合所述具体场景确定兴趣标签的优先级并予以推荐，同时根据用户行为更新所述用户兴趣探索规划模型。

上述的全局兴趣探索推荐方法，其中，步骤S100中，采用如下公式计算任意两个兴趣标签t1,t2的关联度rel(t1,t2)：

rel(t1,t2)＝2*N(t1,t2)/(N(t1)+N(t2))

其中，N(t1,t2)为所述兴趣标签t1,t2在所述兴趣标签集合中共同出现的次数，N(t1)为所述兴趣标签集合中包含所述兴趣标签t1的用户数，N(t2)为所述兴趣标签集合中包含所述兴趣标签t2的用户数。

上述的全局兴趣探索推荐方法，其中，设定一最小关联度阈值min_rel，若所述兴趣标签t1,t2的关联度小于所述最小关联度阈值min_rel，则所述兴趣标签t1,t2的关联度为0。

上述的全局兴趣探索推荐方法，其中，将所述兴趣标签集合建立为兴趣标签体系树，根据所述兴趣标签t1和t2在所述兴趣标签体系树上的距离确定所述最小关联度阈值min_rel，所述距离为所述兴趣标签t1和t2对应节点在所述兴趣标签体系树上的最短路径包含的节点个数。

上述的全局兴趣探索推荐方法，其中，所述步骤S100还包括兴趣标签的合并，设定一近似关系阈值a，若两个所述兴趣标签t1和t2的关联度大于a，则合并所述兴趣标签t1，t2为一个新的兴趣标签t3，并重新计算所述兴趣标签t3与所述兴趣标签集合中其它兴趣标签的关联度。

上述的全局兴趣探索推荐方法，其中，所述步骤S200中，所述用户兴趣探索规划模型定义一个用户u探索兴趣标签t的优先级分数score(u,t)，以确定用户潜在感兴趣的兴趣标签：

score(u,t)＝w1*hot(t)+w2*rel(t,Tu)–w3*freq(t)

其中，hot(t)为所述兴趣标签t的热门程度，rel(t,Tu)为已知的用户兴趣标签集合Tu和所述兴趣标签t的关联度，freq(t)为所述兴趣标签t已经被探索的程度，w1、w2、w3为权重系数。

上述的全局兴趣探索推荐方法，其中，所述兴趣标签t的热门程度hot(t)采用如下公式计算：

hot(t)＝∑click(i_t)

其中i_t为一个被标记为所述兴趣标签t的推荐项，click(i_t)表示i_t的点击量。

上述的全局兴趣探索推荐方法，其中，所述关联度rel(t,Tu)采用如下公式计算：

rel(t,Tu)＝∑rel(t,t_u)·conf(t_u)

其中t_u为所述兴趣标签集合Tu中的一个兴趣标签，rel(t，t_u)为所述兴趣标签t和t_u的关联度，conf(t_u)为用户对于推荐兴趣标签t_u感兴趣的置信度。

上述的全局兴趣探索推荐方法，其中，所述步骤S300中，更新所述用户兴趣探索规划模型包括：

初始状态给定用户u，所述兴趣标签集合Tu＝{}，对任何t，conf(t)＝0，freq(t)＝0；

当用户对推荐内容反馈时：

若推荐项i有若干兴趣标签{ti},freq(ti)＝freq(ti)+1

对于每一个推荐兴趣标签ti，conf(ti)＝α·conf(ti)+(1-α)·score(i)

其中α是一个介于0和1之间的衰减因子，score(i)表示用户对于所述推荐项i反馈动作的分数；

如果所述推荐兴趣标签ti不在所述兴趣标签集合Tu中，而且freq(ti)>n，并且conf(ti)>σ，则把所述推荐兴趣标签ti加入所述兴趣标签集合Tu，

其中n和σ为一设定阈值；

当用户在兴趣探索入口时：

系统对用户展现多个兴趣标签{t}，freq(ti)＝freq(ti)+n；

对于每一个所述兴趣标签t，conf(t)＝β·conf(t)+(1-β)·score(t)

其中β是一个介于0和1的衰减因子，且β比α小一个数量级，score(t)为用户对于兴趣标签反馈动作的分数；

如果所述推荐兴趣标签ti不在所述兴趣标签集合Tu中，并且conf(ti)>σ，则把所述推荐兴趣标签ti加入所述兴趣标签集合Tu。

为了更好地实现上述目的，本发明还提供了一种上述的全局兴趣探索推荐方法的全局兴趣探索推荐装置。

本发明的技术效果在于：

本发明在不同用户场景下的兴趣探索推荐方法共享一个探索规划模型，既能够了解全面的用户信息，知道哪些兴趣标签还未探索，哪些探索的还不够，又能够结合本场景的特点选取优先探索的兴趣标签。最终，在兴趣探索效率和用户体验上达到更好的平衡，因而能够显著提升用户兴趣探索推荐的效率。

以下结合附图和具体实施例对本发明进行详细描述，但不作为对本发明的限定。

附图说明

图1为本发明一实施例的方法流程图；

图2为本发明一实施例的层次化的兴趣标签集合示意图；

图3为本发明一实施例的用户兴趣探索规划模型示意图；

图4为本发明一实施例的构建全局兴趣空间模型流程图。

其中，附图标记

S100-S300、S101-S105步骤

具体实施方式

下面结合附图对本发明的结构原理和工作原理作具体的描述：

参见图1，图1为本发明一实施例的方法流程图。本发明的全局兴趣探索推荐方法，利用统一的兴趣探索模型协调各个场景下的用户兴趣探索及推荐，包括如下步骤：

步骤S100、构建全局兴趣空间模型，根据推荐内容构建一个层次化的兴趣标签集合，并计算所述兴趣标签集合中各兴趣标签的关联度，该兴趣标签集合例如可以为至少一组在语义上尽量不重合，尽量能够覆盖所有用户兴趣的词语集合，一般来说，对于不同的推荐系统，可以通过分析其可推荐的内容归纳出一个层次化的兴趣标签体系(参见图2)，通常可以认为这样一个兴趣标签体系能够覆盖目标用户的所有兴趣，兴趣探索的目标就是了解用户对这个体系内每一个兴趣标签的感兴趣程度并不断更新数据(用户的兴趣偏好可能会变化)；

步骤S200、建立用户兴趣探索规划模型，基于所述全局兴趣空间模型，根据已经收集的用户数据建立用户兴趣探索规划模型，根据用户已有的兴趣标签确定用户潜在感兴趣的兴趣标签，并通过所述用户兴趣探索规划模型实现各个场景的用户兴趣探索及推荐；参见图3，图3为本发明一实施例的用户兴趣探索规划模型示意图，用户兴趣探索规划模型包括所有兴趣标签的确定程度，用户兴趣的确定程度用颜色的深浅表示，兴趣标签之间边的权重表示它们的关联度，不同用户场景下模型给出不同的待探索兴趣标签列表，正常推荐内容场景中优先探索确定性高的兴趣标签，兴趣探索入口场景中优先探索不确定性高的兴趣标签；

步骤S300、各个场景的用户兴趣探索共享，针对同一个所述用户兴趣探索规划模型，每个具体场景下的用户兴趣探索均基于用户整体兴趣探索效率最大化，并结合所述具体场景确定兴趣标签的优先级并予以推荐，同时根据用户行为更新所述用户兴趣探索规划模型。

参见图4，图4为本发明一实施例的构建全局兴趣空间模型流程图。步骤S100中，具体可包括如下步骤：

步骤S101、根据可推荐内容定义全局兴趣标签集合；

步骤S102、挖掘兴趣标签的关联关系，给定兴趣标签集合，需要挖掘兴趣标签之间的关联关系来帮助根据用户已有的兴趣标签找到用户潜在感兴趣的兴趣标签。可采用如下公式计算任意两个兴趣标签t1,t2的关联度rel(t1,t2)：

rel(t1,t2)＝2*N(t1,t2)/(N(t1)+N(t2))

步骤S103、利用最小关联度阈值删除无效太弱的关联关系：

设定一最小关联度阈值min_rel，若所述兴趣标签t1,t2的关联度小于所述最小关联度阈值min_rel，则所述兴趣标签t1,t2的关联度为0。

其中，可将所述兴趣标签集合建立为兴趣标签体系树，根据所述兴趣标签t1和t2在所述兴趣标签体系树上的距离确定所述最小关联度阈值min_rel，所述距离为所述兴趣标签t1和t2对应节点在所述兴趣标签体系树上的最短路径包含的节点个数(比如在图2中“德甲”和“英超”的距离是3)，如果t1和t2在兴趣标签体系树上的距离很近，阈值min_rel可以取的较小，如果较远，min_rel可以取的大一些，这样可以更合理的对标签关联关系进行建模。

步骤S104、判断是否有可以合并的兴趣标签？若是，则执行步骤S105，若否，则执行步骤S200；因不同的兴趣标签之间在内容覆盖上可能有所重复，如果简单的把所有候选兴趣标签都作为兴趣探索的候选，有可能导致探索效率过低。例如，一般对“电商”感兴趣的人对“O2O”也感兴趣，那么这两个兴趣标签可以合并。具体的，给定一个近似关系阈值a，如果两个兴趣标签t1和t2的关联度大于a，我们可以合并t1，t2为一个新的兴趣标签，并重新挖掘这个新兴趣标签和其它兴趣标签的关联关系。

步骤S105、合并关联度达到一定阈值的兴趣标签，设定一近似关系阈值a，若两个所述兴趣标签t1和t2的关联度大于a，则合并所述兴趣标签t1，t2为一个新的兴趣标签t3，并重新计算所述兴趣标签t3与所述兴趣标签集合中其它兴趣标签的关联度。

其中，所述步骤S200中，基于全局兴趣空间模型，可以建立用户个人的兴趣探索规划模型。具体的，所述用户兴趣探索规划模型定义一个用户u探索兴趣标签t的优先级分数score(u,t)，以确定用户潜在感兴趣的兴趣标签：

score(u,t)＝w1*hot(t)+w2*rel(t,Tu)–w3*freq(t)

其中，hot(t)为所述兴趣标签t的热门程度，rel(t,Tu)为已知的用户兴趣标签集合Tu和所述兴趣标签t的关联度，freq(t)为所述兴趣标签t已经被探索的程度，例如，初始情况下，freq(t)＝0，每推荐一项带标签t的内容，freq(t)加1。每次直接推荐兴趣标签t，freq(t)增加n，w1、w2、w3为权重系数，分别为对应的三项因子的权重，这三项因子即hot(t)，rel(t,Tu)，freq(t)的权重由不同的用户场景决定，这几项因子权重的具体确定需要结合具体的用户场景调试。比如，对于在正常推荐内容中插入用于兴趣探索内容的策略，w1和w2可以大一些，w3可以小一些，这样可以尽量减少对用户体验的干扰。而对于专门兴趣探索入口，因为用户对新奇的内容有预期，可以选择较大的w3和较小的w1，w2，这样更有利于接下来的兴趣探索，保证接下来兴趣探索的空间不会越来越窄。本发明用统一的兴趣探索规划模型指导多个用户场景的兴趣探索策略，不同场景下的策略框架完全相同，只要调整上述权重系数的参数就可以满足不同场景的产品需求。

其中，所述兴趣标签t的热门程度hot(t)可采用如下公式计算：

hot(t)＝∑click(i_t)

其中i_t为一个被标记为所述兴趣标签t的推荐项(例如在视频推荐中就是一段视频，在新闻推荐中就是一篇新闻)，click(i_t)表示i_t的点击量。

其中，所述关联度rel(t,Tu)采用如下公式计算：

rel(t,Tu)＝∑rel(t,t_u)·conf(t_u)

实际上，每个用户的兴趣探索规划模型在数据表示上可以表示为一个兴趣标签集合Tu，用户对所有兴趣标签的置信度{conf(tu)}，以及对所有兴趣标签的探索程度{freq(t)}。本发明的上述模型数据是不同用户场景下用户兴趣探索策略所共享的。也就是说，对一个用户来说，无论是用户对于正常推荐内容中插入的兴趣探索内容反馈(是否点击，是否分享)，还是用户在兴趣探索入口内对兴趣标签是否感兴趣的直接表达，都会用来更新这个用户的Tu，{conf(t)}和{freq(t)}。具体的，本实施例中，所述步骤S300中，联合更新所述用户兴趣探索规划模型包括：

当用户对推荐内容反馈时，数据采用如下方式更新：

若推荐项i有若干兴趣标签{ti},freq(ti)＝freq(ti)+1

对于每一个推荐兴趣标签ti，conf(ti)＝α·conf(ti)+(1-α)·score(i)

其中α是一个介于0和1之间的衰减因子，score(i)表示用户对于所述推荐项i反馈动作的分数，越积极的动作分数越高，比如收藏，分享可以是1分，点击是0.8分，未点击是0.3分；

其中n和σ为一设定阈值；

当用户在兴趣探索入口时，数据采用如下方式更新：

假设系统对用户展现多个兴趣标签{t}，freq(ti)＝freq(ti)+n；

对于每一个所述兴趣标签t，conf(t)＝β·conf(t)+(1-β)·score(t)

其中β是一个介于0和1的衰减因子，且一般优选β比α小一个数量级，score(t)为用户对于兴趣标签反馈动作的分数，越积极的动作分数越高，比如收藏可以是1分，点击查看内容是0.8分，未点击是0.3分；

举个直观的例子，给定一个用户，已知他对“NBA”感兴趣，再给定两个待探索的兴趣标签“CBA”和“搏击”(都不在用户兴趣标签集合中)，其中“CBA”和“NBA”更相关，也更热门，但是已经给用户推荐过类似的文章；而“搏击”和“NBA”关联关系弱一些，也更冷门，但是系统从未给用户推荐过“搏击”的内容。当用户在浏览推荐内容时系统会优先插入“CBA”文章用来探索用户对于“CBA”的兴趣。如果用户点击，“CBA”的置信度会被稍微调高。如果用户未点击，“CBA”的置信度会被稍微调低。

当用户进入探索入口浏览兴趣标签时，系统则会优先推荐“搏击”。如果用户收藏了这个兴趣标签，“搏击”的置信度会被明显调高，如果大于σ，则直接加入用户兴趣标签集合。否则，“搏击”的置信度会被大幅调低，并且之后很难再被探索(因为freq(搏击)增加了一个很大的数)。

本发明还公开了一种用于上述全局兴趣探索推荐方法的全局兴趣探索推荐装置，包括：

构建全局兴趣空间模型模块，用于根据推荐内容构建一个层次化的兴趣标签集合，并计算所述兴趣标签集合中各兴趣标签的关联度；

建立用户兴趣探索规划模型模块，用于基于所述全局兴趣空间模型，根据已经收集的用户数据建立用户兴趣探索规划模型，根据用户已有的兴趣标签确定用户潜在感兴趣的兴趣标签，并通过所述用户兴趣探索规划模型实现各个场景的用户兴趣探索及推荐；

各个场景的用户兴趣探索共享模块，用于针对同一个所述用户兴趣探索规划模型，每个具体场景下的用户兴趣探索均基于用户整体兴趣探索效率最大化，并结合所述具体场景确定兴趣标签的优先级并予以推荐，同时根据用户行为更新所述用户兴趣探索规划模型。

本发明通过建立用户全局兴趣探索规划模型，并且基于此模型协调各个用户场景下的用户兴趣探索和推荐，从而达到整体上提升用户兴趣探索效率的效果。

当然，本发明还可有其它多种实施例，在不背离本发明精神及其实质的情况下，熟悉本领域的技术人员当可根据本发明作出各种相应的改变和变形，但这些相应的改变和变形都应属于本发明所附的权利要求的保护范围。

Claims

1.一种全局兴趣探索推荐方法，其特征在于，利用统一的兴趣探索模型协调各个场景下的用户兴趣探索及推荐，包括如下步骤：

2.如权利要求1所述的全局兴趣探索推荐方法，其特征在于，步骤S100中，采用如下公式计算任意两个兴趣标签t1,t2的关联度rel(t1,t2)：

rel(t1,t2)＝2*N(t1,t2)/(N(t1)+N(t2))

3.如权利要求2所述的全局兴趣探索推荐方法，其特征在于，设定一最小关联度阈值min_rel，若所述兴趣标签t1,t2的关联度小于所述最小关联度阈值min_rel，则所述兴趣标签t1,t2的关联度为0。

4.如权利要求3所述的全局兴趣探索推荐方法，其特征在于，将所述兴趣标签集合建立为兴趣标签体系树，根据所述兴趣标签t1和t2在所述兴趣标签体系树上的距离确定所述最小关联度阈值min_rel，所述距离为所述兴趣标签t1和t2对应节点在所述兴趣标签体系树上的最短路径包含的节点个数。

5.如权利要求2、3或4所述的全局兴趣探索推荐方法，其特征在于，所述步骤S100还包括兴趣标签的合并，设定一近似关系阈值a，若两个所述兴趣标签t1和t2的关联度大于a，则合并所述兴趣标签t1，t2为一个新的兴趣标签t3，并重新计算所述兴趣标签t3与所述兴趣标签集合中其它兴趣标签的关联度。

6.如权利要求1、2、3或4所述的全局兴趣探索推荐方法，其特征在于，所述步骤S200中，所述用户兴趣探索规划模型定义一个用户u探索兴趣标签t的优先级分数score(u,t)，以确定用户潜在感兴趣的兴趣标签：

score(u,t)＝w1*hot(t)+w2*rel(t,Tu)–w3*freq(t)

7.如权利要求6所述的全局兴趣探索推荐方法，其特征在于，所述兴趣标签t的热门程度hot(t)采用如下公式计算：

hot(t)＝Σclick(i_t)

8.如权利要求6所述的全局兴趣探索推荐方法，其特征在于，所述关联度rel(t,Tu)采用如下公式计算：

rel(t,Tu)＝Σrel(t，t_u)·conf(t_u)

9.如权利要求8所述的全局兴趣探索推荐方法，其特征在于，所述步骤S300中，更新所述用户兴趣探索规划模型包括：

当用户对推荐内容反馈时：

若推荐项i有若干兴趣标签{ti},freq(ti)＝freq(ti)+1

对于每一个推荐兴趣标签ti，conf(ti)＝α·conf(ti)+(1-α)·score(i)

其中n和σ为一设定阈值；

当用户在兴趣探索入口时：

系统对用户展现多个兴趣标签{t}，freq(ti)＝freq(ti)+n；

对于每一个所述兴趣标签t，conf(t)＝β·conf(t)+(1-β)·score(t)

10.一种如权利要求1-9中任意一项所述的全局兴趣探索推荐方法的全局兴趣探索推荐装置。