CN107103049A

CN107103049A - 一种推荐方法及网络设备

Info

Publication number: CN107103049A
Application number: CN201710210038.5A
Authority: CN
Inventors: 姬晨; 杨玉林
Original assignee: Nubia Technology Co Ltd
Current assignee: Nubia Technology Co Ltd
Priority date: 2017-03-31
Filing date: 2017-03-31
Publication date: 2017-08-29

Abstract

本发明公开了一种推荐方法及网络设备，通过主题模型算法建立待推荐对象的主题模型，该主题模型包括待推荐对象的主题类型及待推荐对象在该主题类型下的权重，主题类型包括至少两个具有语义关联关系的元素；计算待推荐对象的主题模型与用户的偏好特征模型的相似度，其中用户的偏好特征模型基于用户在该待推荐对象的所属平台下的历史操作记录计算得到；在待推荐对象的主题模型与用户的偏好特征模型的相似度达到预设阈值时，将该待推荐对象推荐给该用户。解决了现有的基于关键词进行推荐时，提取的关键词很难准确全面地反映用户行为偏好的问题，能够更加全面地契合用户需求、满足用户偏好，提升了用户体验。

Description

一种推荐方法及网络设备

技术领域

本发明涉及通信技术领域，更具体地说，涉及一种推荐方法及网络设备。

背景技术

近年来随着移动互联网、电子商务、物联网技术的蓬勃发展，各种数据平台或者数据库中存储有海量的各种数据信息，几乎可以包括人们希望获取的各种信息。尽管如此庞大的数据量为用户获取使用提供了可能，但如何在如此海量的数据信息中筛选出用户真正需要的信息也是一个十分棘手且急需解决的问题，因为用户可能需要花费大量的时间精力进行分析筛选，甚至很有可能由于用户搜索方法不当错过用户真正需要或者感兴趣的内容信息，严重影响用户使用体验。

为了解决上述问题，现有技术基于用户历史操作对象，通过关键词提取算法获取这些用户浏览操作过的对象之相应的关键词，并利用这些关键词来表征用户的行为偏好，然后通过相似度算法计算其他对象相对于该用户的偏好行为之间的相似度，在满足一定的相似度阈值后推荐给该用户。解决了用户手动获取筛选自己感兴趣的对象需要耗费大量时间精力的问题。但是，现有的推荐方法由于算法本身或者其他方面的限制，导致其存在如下技术问题：

首先，由于关键词提取算法自身限制，可能导致提取的关键词并不准确；

其次，提取的关键词仅仅只是所述对象中的一小部分内容，因此提取的关键词很有可能无法很好地反映该对象的中心思想，将其作为用户行为偏好也无法准确反映用户行为偏好，因此推荐精度不高，盲目性大，长此以往反而增加用户反感情绪；

以关键词的方式表征用户行为偏好，并基于此进行推荐，推荐的对象往往是包含该关键词的相应对象，并不能有效推荐其他与用户偏好相关的其他对象，也即推荐方式比较单一，不灵活。

下面以一则简短的新闻信息“韩国军方不顾中国及其民众反对执意与乐天集团签署了萨德用地交换合约”为例进行简要说明，现有的关键词提取算法 (TF-IDF为例)提取出的关键词可能是“韩国”，仅仅以提取的该关键词来表征这则新闻信息的中心思想，可能并不是十分准确；进一步的，若基于这则新闻信息提取的关键词表示用户行为偏好时，用该关键词也很难真实反映用户行为偏好，仅仅基于关键词“韩国”进行推荐时，推荐的对象很有可能只包含有 “韩国”相关的信息，并不会包括与“萨德”和/或“乐天集团”相关的信息，这样将导致推荐的对象单一，无法对潜在的且用户感兴趣的对象进行有效推荐。

发明内容

本发明要解决的技术问题在于：现有的基于关键词进行推荐的方式很难真实完整反映用户行为偏好，导致其推荐的对象单一，无法对潜在的且用户感兴趣的对象进行有效推荐的问题，针对该技术问题，本发明提供一种推荐方法及网络设备。

为解决上述技术问题，本发明提供一种推荐方法，所述推荐方法包括：

通过主题模型算法建立待推荐对象的主题模型，所述主题模型包括所述待推荐对象的主题类型及所述待推荐对象在该主题类型下的权重，所述主题类型包括至少两个具有语义关联关系的元素；

计算所述待推荐对象的主题模型与用户的偏好特征模型的相似度，所述偏好特征模型基于用户在所述待推荐对象的所属平台下的历史操作记录计算得到；

在所述相似度达到预设阈值时，将所述待推荐对象推荐给所述用户。

进一步地，所述计算所述待推荐对象的主题模型与用户的偏好特征模型的相似度包括：根据余弦相似度算法计算所述待推荐对象的主题模型与用户的偏好特征模型的相似度。

进一步地，所述将所述待推荐对象推荐给所述用户包括：当相似度大于预设阈值的待推荐对象超过一个时，按照相似度大小依次推荐给所述用户。

进一步地，所述计算所述待推荐对象的主题模型与用户的偏好特征模型的相似度之前，所述方法还包括：

基于用户在所述平台下的历史操作记录计算所述用户对各主题类型的偏好权重；

根据计算结果将所述用户对各主题类型的偏好权重组合生成该用户的偏好特征模型。

进一步地，所述基于用户在所述平台下的历史操作记录计算所述用户对各主题类型的偏好权重包括：

从所述历史操作记录中获取用户有效操作次数，所述用户有效操作次数为所述用户对包含有所述主题类型下至少一个元素的对象的有效操作次数；

获取所述平台下的用户总数以及所述平台下包含有所述主题类型下至少一个元素的对象之对象总数；

根据所述用户有效操作次数、所述用户总数以及所述对象总数计算所述用户对所述主题类型的偏好权重。

进一步地，所述根据所述有效操作次数、所述用户总数以及所述对象总数计算所述用户对所述主题类型的偏好权重包括通过如下公式进行计算：

其中，所述w_ij为用户U_i对主题类型t_j的偏好权重，tf_ik表示用户U_i对包含有主题类型t_j下的至少一个元素的所有对象进行的有效操作次数，分子中的n 为对包含该主题类型t_j下的至少一个元素的对象进行有效操作的用户数，分母中的n为对包含该主题类型t_k下的至少一个元素的对象进行有效操作的用户数， D_i表示用户U_i进行有效操作过的所有主题类型的集合；x大于0，且小于等于预设数值阈值。

本发明还提供了一种网络设备，所述网络设备包括：

模型建立模块，用于建立待推荐对象的主题模型，所述主题模型包括所述待推荐对象的主题类型及所述待推荐对象在该主题类型下的权重，所述主题类型包括至少两个具有语义关联关系的元素；

权重计算模块，用于基于用户在所述平台下的历史操作记录计算所述用户的偏好特征模型；

相似度计算模块，用于计算所述待推荐对象的主题模型与用户的偏好特征模型的相似度；

推荐模块，用于根据所述相似度计算模块计算出的待推荐对象的主题模型与用户的偏好特征模型的相似度，将相似度达到预设阈值的待推荐对象推荐给所述用户。

进一步地，所述推荐模块用于当相似度大于预设阈值的待推荐对象超过一个时，按照相似度大小依次推荐给所述用户。

进一步地，所述权重计算模块用于基于用户在所述平台下的历史操作记录计算所述用户对各主题类型的偏好权重；

并根据计算结果将所述用户对各主题类型的偏好权重组合生成该用户的偏好特征模型。

进一步地，所述权重计算模块用于从所述历史操作记录中获取用户有效操作次数、所述平台下的用户总数以及所述平台下包含有所述主题类型下至少一个元素的对象之对象总数，并根据获取的所述用户有效操作次数、所述用户总数以及所述对象总数计算所述用户对所述主题类型的偏好权重，所述用户有效操作次数为所述用户对包含有所述主题类型下至少一个元素的对象的有效操作次数。

有益效果

本发明提供一种推荐方法及网络设备，通过主题模型算法建立待推荐对象的主题模型，该主题模型包括待推荐对象的主题类型及待推荐对象在该主题类型下的权重，主题类型包括至少两个具有语义关联关系的元素；计算待推荐对象的主题模型与用户的偏好特征模型的相似度，其中用户的偏好特征模型基于用户在该待推荐对象的所属平台下的历史操作记录计算得到；在待推荐对象的主题模型与用户的偏好特征模型的相似度达到预设阈值时，将该待推荐对象推荐给该用户。由于一个主题类型下的各元素具有语义关联关系，所以，当用户对包含该主题类型下的一个或多个元素的操作对象感兴趣时，用户也极有可能对包含该主题类型下其他至少一个元素的待推荐对象感兴趣。而本发明提供的方案能够向用户推荐这些用户很有可能比较感兴趣的对象，相对于现有技术基于单个的关键词进行推荐的方式，能够更加全面地契合用户需求、满足用户偏好，解决了现有的基于关键词进行推荐时，提取的关键词很难准确全面地反映用户行为偏好的问题，从而有效避免了现有的基于关键词进行推荐时推荐对象单一的问题，提升了用户体验。

附图说明

下面将结合附图及实施例对本发明作进一步说明，附图中：

图1为本发明第一实施例提供的一种推荐方法的流程示意图；

图2为本发明第二实施例提供的一种推荐方法的流程示意图；

图3为本发明第二实施例提供的一种权重计算方法的流程示意图；

图4为本发明第三实施例提供的一种网络设备的结构示意图；

图5为本发明第四实施例提供的一种网络设备的结构示意图；

图6为本发明第四实施例提供的一种可选的服务器的结构示意图。

具体实施方式

以下通过具体实施例进行详细说明，应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

第一实施例

本实施例提供一种推荐方法，请参照图1，图1为本发明第一实施例提供的一种推荐方法的流程示意图，包括：

S11：通过主题模型算法建立待推荐对象的主题模型。

本实施例中，待推荐对象的主题模型可以通过相应的主题模型算法训练得到，这里的主题模型算法包括但不限于PLSA(Probabilistic Latent Semantic Analysis，概率潜在语义分析)、LDA(Latent Dirichlet Allocation，隐含狄利克雷分配)等。本实施例中，待推荐对象一般是基于同一平台下的部分或者全部对象，应当理解的是，当不同的多个平台进行信息整合或者信息共用等时，待推荐对象也可以是不同平台下的部分或者全部对象。当多个平台进行信息整合或者共用时，主题模型算法应当能够针对不同平台建立所有待推荐对象的主题模型。

待推荐对象可以是用户未操作过的对象，对于用户已经操作过的对象则可以不必再将其作为待推荐对象。应当理解的是，针对不同的用户，其所对应的待推荐对象可能是不同的，因为不同的用户操作过的对象一般不同，所以剩下的其未操作过的对象也不同，也就是说待推荐对象是针对某个用户而言的，不同的用户对应的待推荐对象可能不同。

本实施例中，对象可以是一则信息，也可以是其他能够通过信息进行描述的物品，例如一则新闻，一片文章，一件网络商城上的物品，一部影片等等均可以作为一个对象，这些对象可以是属于同一平台下的，也可以是属于不同平台下的，通过相应的主题模型算法可以建立主题模型，该主题模型应当包括待推荐对象的主题类型以及该待推荐对象在该主题类型下的权重。

应当理解的是，一个APP可以看作是一个平台，一个数据库也可以看作一个平台，例如“网易新闻”可以看作是一个平台，应当理解的是，对于不同应用环境的“网易新闻”(比如iOS版、Android版、windows版、网页版)可以将其看作是一个平台，也可以看作是不同的平台。

建立的主题模型，应当包括待推荐对象的主题类型以及该待推荐对象在该主题类型下的权重，且该主题类型包括至少两个具有语义关联关系的元素。为了更好地理解本发明，建立的主题模型可以如下表所示：

表1

待推荐对象	主题类型以及在各主题类型下的权重
		P₁	t₁，w₁₁；t₂，w₁₂；…；t_m，w_1m；
P₂	t₁，w₂₁；t₂，w₂₂；…；t_m，w_2m；
		…	…
P_n	t₁，w_n1；t₂，w_n2；…；t_m，w_nm；

表1中的t₁，t₂，…，t_m表示不同的主题类型，w₁₁表示待推荐对象P₁在主题类型t₁下的权重，w₁₂表示待推荐对象P₁在主题类型t₂下的权重，…，w_1m表示待推荐对象P₁在主题类型t_m下的权重，同样，w_n1表示待推荐对象P_n在主题类型t₁下的权重，w_n2表示待推荐对象P_n在主题类型t₂下的权重，…，w_nn表示待推荐对象P_n在主题类型t_m下的权重。

应当理解的是，通常主题模型中包含多个(至少两个)不同的主题类型，例如50、100、500甚至上千个主题类型。继续参见表1，该主题模型中包括 m个主题类型t₁，t₂，…，t_m，通常每一个主题类型都包含至少两个(例如数十个、数百个、数千个等)语义关联关系的元素，当然，对于其中的部分主题类型所包括的元素少于2个时，同样适用，但至少应当保证主题模型中的至少一个主题类型下所包含的语义关联关系的元素个数大于等于2个。

由于同一主题类型下的元素具有语义关联关系，当用户对该主题类型下的某个元素感兴趣时，可以说明用户该主题下的其他元素也可能比较感兴趣，因此基于主题类型进行推荐时，可以比较准确全面地反映用户行为偏好，同时解决了现有的基于关键词进行推荐时导致推荐的对象单一的问题，对于用户可能感兴趣的其他对象，本发明基于同一主题类型下的元素的语义关联关系，能够对用户可能感兴趣的对象进行很好地发掘，避免用户错过或者无法搜索得到，有效解决用户难以从海量数据中进行筛选的问题。

应当理解的是，所述语义关联关系可以是在语义相近或者相似，例如：“高兴”、“快乐”、“愉悦”、“舒畅”，这些元素可以认为是语义关联关系的，这一类语义关联的元素不会随着用户关注热点的变化而变化。当然，本领域技术人员可以理解的是，具有语义关联的元素也可以是基于时事变化导致的其两者或多者之间的语义关联关系，例如，由于近来有人对“韩国部署萨德系统的事件” 高度关注，此时，元素“韩国”、“萨德”、以及“乐天集团”之间可以导致其语义关联关系。并将这些具有语义关联关系的元素类聚在一个主题类型中。

为了更好地理解，主题类型可以参见下表所示：

表2

一个主题模型中可以包括多个主题类型，例如表2中的Topic 1、Topic 2、…、Topic n；一个主题类型下也可以包括多个元素，例如表2中的主题类型Topic 1 下包括A1、A2、A3、…、An这些相互关联关系的元素。应当理解的是，由于通过相应的主题模型算法将多个相互关联关系的元素类聚形成一个主题类型，也即是一个主题类型中包含有多个元素，在计算待推荐对象的主题模型与用户偏好特征模型时，相对于现有的基于关键词的向量模型，能够有效减少向量维数，从而有利于减少计算量。例如，对于“乔布斯是伟大的”、“苹果公司是令人钦佩的”这两个待推荐对象，通过主题模型算法建立得到的主题模型中所包括的主题类型可能是：T1(乔布斯，苹果公司)；T2(伟大，令人钦佩) 这两个主题类型，参见下表所示：

表3

主题类型	元素
		T1	乔布斯，苹果公司
T2	伟大，令人钦佩

此时形成的待推荐对象的主题模型，参见下表所示：

表4

待推荐对象	主题类型及在该主题类型下的权重
		“乔布斯是伟大的”	(T1，w11；T2，w12)
“苹果公司是令人请钦佩的”	(T1，w21；T2，w22)

此时，这两个待推荐的主题模型(T1，w11；T2，w12)和(T1，w21； T2，w22)实质上就是一个二维向量，也即是(w11，w12)、(w21，w22)。在计算相似度时有效减少了计算量。而现有推荐方法是基于提取的关键词进行推荐，同样以上述“乔布斯是伟大的”、“苹果公司是令人请钦佩的”这两个待推荐对象为例，此时根据相应的关键词提取算法，提取出的关键词可能是“乔布斯”、“伟大”、“苹果公司”、“令人钦佩”这四个关键词，此时为了对上述两个待推荐对象进行量化表征，其必定是一个至少为四维的向量，例如对于待推荐对象“乔布斯是伟大的”，其可能表示为(1,1,0,0)，对于待推荐对象“苹果公司是令人请钦佩的”，其可能表示为(0,0,1,1)，也即是向量维数将增加，不利于计算，特别是针对实际应用中的海量数据时，计算量更是十分庞大，因此不利于提高更新速率。而本发明基于主题类型进行推荐，能够有效减少计算量，因而在用户行为偏好发生改变时，也有利于对用户行为偏好进行快速更新。应当理解的是，通过主题模型算法建立主题模型通常是基于待推荐对象所属平台下当前所有对象进行的，并不是基于该平台下的一个或者部分对象进行的，但存在一个或者多个新的对象加入该平台时，可以对主题模型进行更新。

本实施例中，主题类型下的元素可以是一个词语，也可以是一个短语等。

应当理解的是，建立的主题模型中所包含的待推荐对象在主题类型下的权重可以通过该主题模型算法计算得到，各主题类型下所包含的相互关联关系的元素也可以通过该主题模型算法训练得到。

S12：计算待推荐对象的主题模型与用户的偏好特征模型之间的相似度。

用户的偏好特征模型可以基于用户历史操作记录计算得到。

以上述表3和表4所示的“乔布斯是伟大的”、“苹果公司是令人请钦佩的” 这两个待推荐对象为例，假设“乔布斯是伟大的”是用户浏览过的，此时可以通过该浏览过的对象生成该用户的偏好特征模型(T1，w11；T2，w12)，w11 和w12分别表示该用户对主题T1和主题T2的偏好权重。对象“苹果公司是令人请钦佩的”此时可以作为待推荐对象，计算待推荐对象的主题模型(T1， w21；T2，w22)与该用户的偏好特征模型(T1，w11；T2，w12)两者之间的相似度，所述相似度的计算方法包括但不限于采用余弦相似度算法，具体的，这里可以通过余弦相似度算法计算(w21，w22)与(w11，w12)之间的相似度。具体的计算过程在此不在赘述。

应当理解的是，当用户偏好特征模型发生改变时，可以对用户偏好特征模型进行更新，例如用户浏览了其他对象时，此时用户偏好特征模型发生了一定变化，对其偏好特征模型进行更新时，可以实时更新，也可以每间隔相应的时间后在进行更新，例如每间隔一天、一周或者一个月等再进行更新。

S13：在所述相似度达到预设阈值时，将该待推荐对象推荐给该用户。

根据计算结果，将满足相似度预设阈值的待推荐对象推荐给该用户，预设阈值可以根据实际情况灵活设置，例如采用余弦相似度算法时，预设阈值可以设置为0.8，也可以设置为0.5等。

本实施例中，待推荐对象通常至少应当包括一个对象，因此，满足相似度预设阈值的待推荐对象可能不只一个，可能包含多个，此时，可以按照相似度大小以此推荐给该用户。例如达到相似度预设阈值的待推荐对象分别是：对象 A，相似度为0.9；对象B，相似度为0.8；对象C，相似度为0.7；对象D，相似度为0.6；此时可以依次将对象A、对象B、对象C、对象D依次推荐给该用户，推荐时间隔间可以灵活设置，例如可以是每间隔一个小时依次推荐给该用户，也可以是每间隔一天依次推荐给该用户。当然，当达到预设阈值的待推荐对象为多个时，也可以任意灵活推荐，在此并不作限制。

本实施例提供一种推荐方法，通过主题模型算法建立待推荐对象的主题模型，计算待推荐对象的主题模型与用户偏好特征模型的相似度，将相似度达到预设阈值时将其推荐给该用户；从而能够向用户推荐这些用户很有可能比较感兴趣的对象，相对于现有技术基于单个的关键词进行推荐的方式，能够更加全面地契合用户需求、满足用户偏好，有利于提高用户体验。

第二实施例

本实施例在第一实施例的基础上，提供一种推荐方法，请参照图2，图2 为本发明第二实施例提供的一种推荐方法的流程示意图，包括：

S21：通过主题模型算法建立待推荐对象的主题模型，该主题模型包括待推荐对象的主题类型及待推荐对象在该主题类型下的权重，主题类型包括至少两个具有语义关联关系的元素。

对于上述步骤S21，与第一实施例中的步骤S11相似，请参见第一实施例中对步骤S11的说明，在此不再赘述。

S22：基于用户历史操作记录计算该用户对各主题类型的偏好权重。

本实施例中，用户历史操作记录可以是用户进行操作过的对象，例如用户浏览过的一则新闻、点赞过的一片文章、购买过的一件物品、收藏过的一则信息等。基于用户历史操作信息，也可以说基于用户操作过的对象。

基于用户操作过的对象计算该用户对各主题类型的偏好权重，应当理解的是，一个对象中通常包含多个元素，各个元素可能对应不同的主题类型，对该用户操作过的所有对象进行收集汇总，获取其所操作过的所有对象的不同元素，并将各个元素通过主题模型算法类聚到不同的主题类型，从而能够基于用户操作过的对象来计算该用户对各主题类型的偏好权重，也即是基于用户历史操作记录计算该用户对各主题类型的偏好权重。对于某个主题类型，假设用户操作过的对象中包含该主题的元素较多，则可以说明该用户对该主题类型的偏好权重较高。例如，通过主题模型算法建立的待推荐对象的主题模型中，主题类型如下表所示：

表5

主题类型	元素
		主题1	X1，X2，X3，X4
主题2	Y1，Y2，Y3，Y4，Y5，Y6
		主题3	Z1，Z2，Z3，Z4，Z5

而从该用户操作过的所有对象中，所提取到的元素分别是X1，Y2，Y3， Y4，Y5，也即是从用户历史操作记录中可知，该用户对主题2的偏好权重较高，此时说明该用户对主题类型的内容更感兴趣。

应当理解的是，这里所述示例只是为了便于理解进行的一个简单的说明，并未对其他的一些相关因素进行综合考虑，由此得出该用户对主题2的偏好权重较高也许并不准确，下面针对用户在主题类型下的偏好权重进行详细说明。

请参见图3，图3为本发明第二实施例提供的计算偏好权重的流程示意图，包括：

S31：从用户历史操作记录中获取该用户有效操作次数。

这里所述的有效操作次数是针对用户操作过的对象而言的，也即是对操作过的对象的有效操作次数，进而能够表征该用户对该操作对象中的元素的有效操作次数。例如，用户浏览了一则新闻，则表示该用户对这则新闻进行了一次有效操作，同时，对于这则新闻中所包含的元素，也可以认为用户进行了一次有效操作。所述有效操作包括但不限于浏览、点击、收藏、购买、点赞、阅读、观看等。应当理解的是，当该用户对这则新闻进行相应浏览之后，若用户还对该新闻进行了收藏，此时可以认为该用户对该新闻进行了两次有效操作，也可以认为同一用户对同一对象最多只能进行一次有效操作，即使该用户对该对象既进行了浏览，也进行了收藏，此时也可以认为该用户对该对象进行了一次有效操作。

S32：获取相应平台下的用户总数。

应当理解的是，当待推荐对象的主题模型是基于一个平台进行建立时，应当获取该平台下的用户总数；当待推荐对象的主题模型是基于多个平台进行建立的时，应当获取所述多个平台下的用户总数。这里的用户总数可以是该平台下的注册用户总数。

S33：获取相应平台下包含有相应主题类型下至少一个元素的对象之对象总数。

例如，一个主题类型下包括E1、E2、E3和E4这四个元素，而该平台下的对象1包括元素E1，对象2包括E2和E3，对象3包括E4，对象4包括E3 和E4，其他对象不包括该主题类型下的任意一个或者多个元素，此时包含有该主题类型下至少一个元素的对象之对象总数便为4(分别为对象1、对象2、对象3和对象4)。

应当说明的是，步骤S31-S33的顺序在此并不做限制，可以根据实际应用情况灵活执行。

S34：根据获取的用户有效操作次数、用户总数以及所述对象总数计算该用户对该主题类型的偏好权重值。

具体的，可以通过如下公式计算用户对该主题类型的偏好权重值：

其中，w_ij为用户Ui对主题类型t_j的偏好权重值，tf_ik表示用户Ui对包含有主题类型t_j下的至少一个元素的所有对象进行的有效操作次数，分子中的n 为对包含该主题类型t_j下的至少一个元素的对象进行有效操作的用户数，分母中的n为对包含该主题类型t_k下的至少一个元素的对象进行有效操作的用户数， D_i表示用户Ui进行有效操作过的所有主题类型的集合；x大于0，且小于等于预设数值阈值。

公式2-1中，x大于0，且小于等于预设数值阈值，主要是为了避免(n+x) 的值为0，所述预设数值阈值可以根据实际灵活设定，例如0.1、0.01、0.001 等，保证x值远小于n值，具体的，例如当n值为100时，x值可以为1、0.1 等。

S23：根据计算结果将该用户对各主题类型的偏好权重组合生成该用户的偏好特征模型。

例如，计算得到该用户对各主题类型的偏好权重分别是：w₁、w₂、w₃、 w₄、w₅，然后将其组合生成该用户的偏好特征模型可以表示为：(w₁，w₂， w₃，w₄，w₅)。

S24：计算待推荐对象的主题模型与该用户的偏好特征模型的相似度。

将步骤S21建立的待推荐对象的主题模型与该用户的偏好特征模型进行相似度计算，应当理解的是，待推荐对象的主题模型包括主题类型以及该待推荐对象在主题类型下的权重，为了便于进行相似度计算，可以将该待推荐对象在各主题类型下的权重组合形成该待推荐对象的主题模型。应当理解的是，待推荐对象在各主题类型下的权重的组合顺序应当与用户在各主题类型下的偏好权重的组合顺序相同。例如，用户的偏好特征模型为：(T1,w1；T2,w2；T3,w 3；T4,w4；T5,w5)，T1、T2、T3、T4、T5分别表示主题类型，w1、w2、w 3、w4、w5分别表示该用户在各主题类型下的偏好权重；该待推荐对象的主题模型为：(T1,P1；T2,P2；T3,P3；T4,P4；T5,P5)，P1、P2、P3、P4、P5表示该待推荐对象该各主题类型的权重。此时，可以通过计算(w1，w2，w3，w4， w5)与(P1，P2，P3，P4，P5)之间的这两个向量之间的相似度来计算待推荐对象的主题模型与该用户的偏好特征模型的相似度。

S25：在相似度达到预设阈值时，将待荐推对象推荐给该用户。

在待推荐对象的相似度达到预设阈值时，将其推荐给该用户。将满足预设阈值的待推荐对象大于等于两个时，可以按照相似度大小依次推荐给该用户。

本实施例提供一种推荐方法，根据用户历史操作记录获取用户有效操作次数，以及获取相应平台下的用户总数和该平台下包含相应主题类型下至少一个元素的对象值对象总数，从而计算该用户对各主题模型的偏好权重，并将该用户对各主题类型的偏好权重组合形成该用户的偏好特征模型，能够更加准确地反映用户行为偏好，进而有利于提高推荐的精确度，对于用户感兴趣的相关主题类型下的其他类型也能够进行很好地发掘并推荐给该用户，解决了用户需要耗费大量的时间精力进行筛选搜索的问题，提高了用户体验。

第三实施例

请参照图4，图4为本发明第三实施例提供的一种网络设备的结构示意图，

模型建立模块41，用于建立待推荐对象的主题模型，该主题模型包括待推荐对象的主题类型及待推荐对象在该主题类型下的权重，主题类型包括至少两个具有语义关联关系的元素。

本实施例中，模型建立模块41可以通过相应的主题模型算法实现，包括但不限于PLSA、LDA等。模型建立模块41可以针对一个平台建立该平台下相应的待推荐对象的主题模型，当然，在多个平台进行信息整合或者共用时，模型建立模块41也能够针对不同平台建立所有待推荐对象的主题模型。

本实施例中，对象可以是一则信息，也可以是其他能够通过信息进行描述的物品，例如一则新闻，一片文章，一件网络商城上的物品，一部影片等等均可以作为一个对象，这些对象可以是属于同一平台下的，也可以是属于不同平台下的，通过模型建立模块41建立的主题模型包括括待推荐对象的主题类型以及该待推荐对象在该主题类型下的权重，该主题类型包括至少两个具有语义关联关系的元素。为了更好地理解本发明，模型建立模块41建立的主题模型可以参见下表所示：

表6

所述表中的t₁，t₂，…，t_m表示不同的主题类型，w₁₁表示待推荐对象P₁在主题类型t₁下的权重，w₁₂表示待推荐对象P₁在主题类型t₂下的权重，…， w_1m表示待推荐对象P₁在主题类型t_m下的权重，同样，w_n1表示待推荐对象P_n在主题类型t₁下的权重，w_n2表示待推荐对象P_n在主题类型t₂下的权重，…， w_nn表示待推荐对象P_n在主题类型t_m下的权重。

应当理解的是，模型建立模块41建立的主题模型中可以包含多个(至少两个)不同的主题类型，例如50、100、500甚至上千个主题类型。继续参见表6，该主题模型中包括m个主题类型t₁，t₂，…，t_m，通常每一个主题类型都包含至少两个(例如数十个、数百个、数千个等)语义关联关系的元素，当然，对于其中的部分主题类型所包括的元素少于2个时，同样适用，但模型建立模块41所建立的主题模型中至少一个主题类型下所包含的相互关联关系的元素个数大于等于2个。

由于同一主题类型下的元素语义关联关系，当用户对该主题类型下的某个元素感兴趣时，可以说明用户该主题下的其他元素也可能比较感兴趣，因此基于主题类型进行推荐时，可以比较准确全面地反映用户行为偏好，同时解决了现有的基于关键词进行推荐时导致推荐的对象单一的问题，对于用户可能感兴趣的其他对象，本发明基于同一主题类型下的元素的相互关联关系，能够对用户可能感兴趣的对象进行很好地发掘，避免用户错过，有效解决用户难以从海量数据中进行筛选的问题。

应当理解的是，所述语义关联关系可以是在语义相近或者相似，例如：“高兴”、“快乐”、“愉悦”、“舒畅”，这些元素可以认为是语义关联关系的；也可以是基于时事变化导致的其两者或多者之间的语义关联关系，例如，由于近来有人对“韩国部署萨德系统的事件”高度关注，此时，元素“韩国”、“萨德”、以及“乐天集团”之间可以导致其语义关联关系。并将这些具有语义关联关系的元素类聚在一个主题类型中。

模型建立模块41所建立的待推荐对象的主题模型中，通常具有多个主题类型，请参见下表所示：

表7

主题类型	元素
		Topic 1	A1,A2,A3,…,An
Topic 2	B1,B2,B3,…,Bn
		…	…
Topic n	M1,M2,M3,…,Mn

应当理解的是，由于通过相应的主题模型算法将多个语义关联关系的元素类聚形成一个主题类型，也即是一个主题类型中包含有多个元素，在计算待推荐对象的主题模型与用户偏好特征模型时，相对于现有的基于关键词的向量模型，能够有效减少向量维数，从而有利于减少计算量。

应当理解的是，主题模型中所包含的待推荐对象在主题类型下的权重可以通过模型建立模块41计算得到，各主题类型下所包含的相互关联关系的元素也可以通过该模型建立模块41训练得到。

权重计算模块42，用于基于用户在所述平台下的历史操作记录计算所述用户的偏好特征模型。本实施例中，用户历史操作记录可以是用户进行操作过的对象，例如用户浏览过的一则新闻、点赞过的一片文章、购买过的一件物品、收藏过的一则信息等。

权重计算模块42可以从用户历史操作记录中获取该用户有效操作次数，并获取相应平台下的用户总数以及该平台下包含有相应主题类型下至少一个元素的对象之对象总数。并根据前其所获取的所述有效操作次数、所述用户总数以及所述对象总数计算该用户的偏好特征模型。

权重计算模块42所获取的有效操作次数是针对用户操作过的对象而言的，是对操作过的对象的有效操作次数，进而能够表征该用户对该操作对象中的元素的有效操作次数。例如，用户浏览了一则新闻，则权重计算模块42能够获取该用户对这则新闻进行了一次有效操作，同时，对于这则新闻中所包含的元素，也可以认为用户进行了一次有效操作。所述有效操作包括但不限于浏览、点击、收藏、购买、点赞、阅读、观看等。应当理解的是，当该用户对这则新闻进行相应浏览之后，若用户还对该新闻进行了收藏，此时权重计算模块42 获取到该用户对该新闻进行了两次有效操作，或者将权重计算模块42设置为同一用户对同一对象最多只能进行一次有效操作，即使该用户对该对象既进行了浏览，也进行了收藏，此时权重计算模块42仍然获取到的是：该用户对该对象进行了一次有效操作。

权重计算模块42获取相应平台下的用户总数，可以是该平台下的注册用户总数。

权重计算模块42获取相应平台下包含有相应主题类型下至少一个元素的对象之对象总数。具体的，例如，一个主题类型下包括E1、E2、E3和E4这四个元素，而该平台下的对象1包括元素E1，对象2包括E2，对象3包括E4，对象4包括E3和E4，其他对象不包括该主题类型下的任意一个或者多个元素，此时权重计算模块42可以获取到包含有该主题类型下至少一个元素的对象之对象总数便为4(分别为对象1、对象2、对象3和对象4)。

权重计算模块42可以根据其获取的所述用户有效操作次数、所述用户总数以及所述对象总数计算计算所述用户的偏好特征模型。

应当理解的是，当用户偏好特征模型发生改变时，权重计算模块42可以对用户偏好特征模型进行更新，例如用户浏览了其他对象时，此时用户偏好特征模型发生了一定变化，对其偏好特征模型进行更新时，可以实时更新，也可以每间隔相应的时间后在进行更新，例如每间隔一天、一周或者一个月等再进行更新。

相似度计算模块43，用于计算所述待推荐对象的主题模型与用户的偏好特征模型的相似度；

本实施例中，相似度计算模块43可以通过相应的相似度算法实现，包括但不限于余弦相似度算法。

推荐模块44，用于根据所述相似度计算模块43计算出的待推荐对象的主题模型与用户的偏好特征模型的相似度，将相似度达到预设阈值的待推荐对象推荐给所述用户。

推荐模块44根据相似度计算模块43的计算结果，将满足相似度预设阈值的待推荐对象推荐给该用户，预设阈值可以根据实际情况灵活设置，例如采用余弦相似度算法时，预设阈值可以设置为0.8，也可以设置为0.6等。当达到相似度预设阈值的待推荐对象超过一个时，推荐模块44可以按照相似度大小依次推荐给所述用户。当然，也可以将达到预设阈值的待推荐对象任意灵活推荐，只要保证能够进行有效推荐即可。

本实施例所提供的网络设备40所包括的模型建立模块41、权重计算模块 42、相似度计算模块43以及推荐模块44包括但不限于实施于相应平台下的服务器中，通过相应的处理器以及通信模块实现本实施例中的相应功能。

本实施例提供一种网络设备40，包括模型建立模块41、权重计算模块42、相似度计算模块43以及推荐模块44；其中模型建立模块41用于建立待推荐对象的主题模型，主题模型包括待推荐对象的主题类型及待推荐对象在该主题类型下的权重，主题类型包括至少两个具有语义关联关系的元素；权重计算模块42用于基于用户在所述平台下的历史操作记录计算该用户的偏好特征模型；相似度计算模块43用于计算待推荐对象的主题模型与用户的偏好特征模型之间的相似度；推荐模块44用于根据相似度计算模块43计算出的待推荐对象的主题模型与用户的偏好特征模型的相似度，将相似度达到预设阈值的待推荐对象推荐给该用户。能够更加准确地反映用户行为偏好，有利于提高推荐的精确度，对于用户感兴趣的相关主题类型下的其他类型也能够进行很好地发掘并推荐给该用户，解决了用户需要耗费大量的时间精力进行筛选搜索的问题，提高了用户使用体验。

第四实施例

本实施例在第三实施例的基础上，提供一种网络设备，参照图5，图5为本发明第四实施例提供的一种网络设备的结构示意图，所述网络设备50包括：

模型建立模块51，用于建立待推荐对象的主题模型，该主题模型包括待推荐对象的主题类型及待推荐对象在该主题类型下的权重，主题类型包括至少两个具有语义关联关系的元素。

权重计算模块52，用于基于用户在所述平台下的历史操作记录计算所述用户的偏好特征模型。本实施例中，权重计算模块52可以从用户历史操作记录中获取该用户有效操作次数、获取相应平台下的用户总数以及相应平台下包含有相应主题类型下至少一个元素的对象之对象总数，并基于其所获取的所述有效操作次数、所述用户总数以及所述对象总数计算该用户对该主题类型的偏好权重。具体的，权重计算模块52可以通过如下公式来进行计算：

公式4-1中，x大于0，且小于等于预设数值阈值，主要是为了避免(n+x) 的值为0，所述预设数值阈值可以根据实际灵活设定，例如0.1、0.01、0.001 等，保证x值远小于n值，具体的，例如当n值为100时，x值可以为1、0.1 等。

进一步地，权重计算模块52还可以根据计算结果将该用户对各主题类型的偏好权重组合生成该用户的偏好特征模型。

相似度计算模块53，用于计算所述待推荐对象的主题模型与用户的偏好特征模型的相似度；推荐模块54，用于根据所述相似度计算模块53计算出的待推荐对象的主题模型与用户的偏好特征模型的相似度，将相似度达到预设阈值的待推荐对象推荐给所述用户。

对于本实施例中的模型建立模块51、相似度计算模块53以及推荐模块54 与第三实施例中的模型建立模块41、相似度计算模块43以及推荐模块44相似，能够实现相同或相应的功能，因此不再赘述。本实施例中的模型建立模块 51、权重计算模块52、相似度计算模块53以及推荐模块54可以实施于相应平台下的服务器中，通过相应的处理器、存储器、内存以及通信装置实现本实施例中的相应功能。

具体的，请参照图6，图6为本发明实施例四提供的一种可选的服务器的结构示意图，该服务器至少包括：输入输出(IO)总线61、处理器62、存储器63、内存64和通信装置65。其中，

本发明提供的网络设备50中，模型建立模块51、权重计算模块52、相似度计算模块53以及推荐模块54的功能的软件代码可存储在存储器63中，并由处理器62执行或编译后执行。

具体的，处理器62建立待推荐对象的主题模型，所述主题模型包括待推荐对象的主题类型及待推荐对象在该主题类型下的权重，主题类型包括至少两个具有语义关联关系的元素；计算待推荐对象的主题模型与用户的偏好特征模型的相似度，所述偏好特征模型基于用户在所述待推荐对象的所属平台下的历史操作记录计算得到；在所述相似度达到预设阈值时，控制通信装置65将所述待推荐对象推荐给所述用户。

当相似度大于预设阈值的待推荐对象超过一个时，处理器62可以按照相似度大小依次推荐给所述用户。

处理器62计算所述待推荐对象的主题模型与用户的偏好特征模型的相似度之前还包括：基于用户在所述平台下的历史操作记录计算所述用户对各主题类型的偏好权重；并根据计算结果将所述用户对各主题类型的偏好权重组合生成该用户的偏好特征模型。

进一步地，处理器62可以从用户历史操作记录中获取该用户有效操作次数，所述用户有效操作次数为所述用户对包含有所述主题类型下至少一个元素的对象的有效操作次数；获取所述平台下的用户总数以及所述平台下包含有所述主题类型下至少一个元素的对象之对象总数；根据所述用户有效操作次数、所述用户总数以及所述对象总数计算所述用户对所述主题类型的偏好权重值。

具体的，处理器62还可以根据如下公式计算用户对主题类型的偏好权重：

其中，所述w_ij为用户Ui对主题类型t_j的偏好权重，tf_ik表示用户Ui对包含有主题类型t_j下的至少一个元素的所有对象进行的有效操作次数，分子中的 n为对包含该主题类型t_j下的至少一个元素的对象进行有效操作的用户数，分母中的n为对包含该主题类型t_k下的至少一个元素的对象进行有效操作的用户数，D_i表示用户Ui进行有效操作过的所有主题类型的集合；x大于0，且小于等于预设数值阈值。

输入输出(IO)总线61分别与自身所属的服务器的其它部件(处理器62、存储器63、内存64和通信装置65)连接，并且为其它部件提供传送线路。处理器62通常控制自身所属的服务器的总体操作。其中，处理器62可以是中央处理器(CPU)。通信装置65，通常包括一个或多个组件，其允许自身所属的服务器与无线通信系统或网络之间的无线电通信。存储器63存储处理器可读、处理器可执行的软件代码，其包含用于控制处理器62执行本文描述的功能的指令(即软件执行功能)。

本实施例提供一种网络设备50，包括模型建立模块51、权重计算模块52、相似度计算模块53以及推荐模块54；权重计算模块52能够通过用户历史操作记录计算出该用户的偏好特征模型，该偏好特征模型能够很好地反映该用户的偏好行为，因此有利于提高推荐的精确度，对于用户感兴趣的相关主题类型下的其他类型也能够进行很好地发掘并推荐给该用户，提高了用户使用体验。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本发明各个实施例所述的方法。

上面结合附图对本发明的实施例进行了描述，但是本发明并不局限于上述的具体实施方式，上述的具体实施方式仅仅是示意性的，而不是限制性的，本领域的普通技术人员在本发明的启示下，在不脱离本发明宗旨和权利要求所保护的范围情况下，还可做出很多形式，这些均属于本发明的保护之内。

Claims

1.一种推荐方法，其特征在于，包括：

2.根据权利要求1所述的推荐方法，其特征在于，所述计算所述待推荐对象的主题模型与用户的偏好特征模型的相似度包括：根据余弦相似度算法计算所述待推荐对象的主题模型与用户的偏好特征模型的相似度。

3.根据权利要求1所述的推荐方法，其特征在于，所述将所述待推荐对象推荐给所述用户包括：当相似度大于预设阈值的待推荐对象超过一个时，按照相似度大小依次推荐给所述用户。

4.根据权利要求1-3任一项所述的推荐方法，其特征在于，所述计算所述待推荐对象的主题模型与用户的偏好特征模型的相似度之前，所述方法还包括：

5.根据权利要求4所述的推荐方法，其特征在于，所述基于用户在所述平台下的历史操作记录计算所述用户对各主题类型的偏好权重包括：

6.根据权利要求5所述的推荐方法，其特征在于，所述根据所述有效操作次数、所述用户总数以及所述对象总数计算所述用户对所述主题类型的偏好权重包括通过如下公式进行计算：

<mrow> <msub> <mi>w</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mo>=</mo> <mfrac> <mrow> <msub> <mi>tf</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mo>&times;</mo> <mi>l</mi> <mi>o</mi> <mi>g</mi> <mo>&lsqb;</mo> <mi>N</mi> <mo>/</mo> <mrow> <mo>(</mo> <mi>n</mi> <mo>+</mo> <mi>x</mi> <mo>)</mo> </mrow> <mo>&rsqb;</mo> </mrow> <msqrt> <mrow> <munder> <mo>&Sigma;</mo> <mrow> <msub> <mi>t</mi> <mi>k</mi> </msub> <mo>&Element;</mo> <msub> <mi>D</mi> <mi>i</mi> </msub> </mrow> </munder> <msup> <mrow> <mo>{</mo> <msub> <mi>tf</mi> <mrow> <mi>i</mi> <mi>k</mi> </mrow> </msub> <mo>&times;</mo> <mi>l</mi> <mi>o</mi> <mi>g</mi> <mo>&lsqb;</mo> <mi>N</mi> <mo>/</mo> <mrow> <mo>(</mo> <mi>n</mi> <mo>+</mo> <mi>x</mi> <mo>)</mo> </mrow> <mo>&rsqb;</mo> <mo>}</mo> </mrow> <mn>2</mn> </msup> </mrow> </msqrt> </mfrac> <mo>;</mo> </mrow>

其中，所述w_ij为用户U_i对主题类型t_j的偏好权重，tf_ik表示用户U_i对包含有主题类型t_j下的至少一个元素的所有对象进行的有效操作次数，分子中的n为对包含该主题类型t_j下的至少一个元素的对象进行有效操作的用户数，分母中的n为对包含该主题类型t_k下的至少一个元素的对象进行有效操作的用户数，D_i表示用户U_i进行有效操作过的所有主题类型的集合；x大于0，且小于等于预设数值阈值。

7.一种网络设备，其特征在于，包括：

8.根据权利要求7所述的网络设备，其特征在于，所述推荐模块用于当相似度大于预设阈值的待推荐对象超过一个时，按照相似度大小依次推荐给所述用户。

9.根据权利要求7或8所述的网络设备，其特征在于，所述权重计算模块用于基于用户在所述平台下的历史操作记录计算所述用户对各主题类型的偏好权重；

10.根据权利要求9所述的网络设备，其特征在于，所述权重计算模块用于从所述历史操作记录中获取用户有效操作次数、所述平台下的用户总数以及所述平台下包含有所述主题类型下至少一个元素的对象之对象总数，并根据获取的所述用户有效操作次数、所述用户总数以及所述对象总数计算所述用户对所述主题类型的偏好权重，所述用户有效操作次数为所述用户对包含有所述主题类型下至少一个元素的对象的有效操作次数。