CN107103049A - 一种推荐方法及网络设备 - Google Patents

一种推荐方法及网络设备 Download PDF

Info

Publication number
CN107103049A
CN107103049A CN201710210038.5A CN201710210038A CN107103049A CN 107103049 A CN107103049 A CN 107103049A CN 201710210038 A CN201710210038 A CN 201710210038A CN 107103049 A CN107103049 A CN 107103049A
Authority
CN
China
Prior art keywords
user
recommended
theme
type
under
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710210038.5A
Other languages
English (en)
Inventor
姬晨
杨玉林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nubia Technology Co Ltd
Original Assignee
Nubia Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nubia Technology Co Ltd filed Critical Nubia Technology Co Ltd
Priority to CN201710210038.5A priority Critical patent/CN107103049A/zh
Publication of CN107103049A publication Critical patent/CN107103049A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Abstract

本发明公开了一种推荐方法及网络设备,通过主题模型算法建立待推荐对象的主题模型,该主题模型包括待推荐对象的主题类型及待推荐对象在该主题类型下的权重,主题类型包括至少两个具有语义关联关系的元素;计算待推荐对象的主题模型与用户的偏好特征模型的相似度,其中用户的偏好特征模型基于用户在该待推荐对象的所属平台下的历史操作记录计算得到;在待推荐对象的主题模型与用户的偏好特征模型的相似度达到预设阈值时,将该待推荐对象推荐给该用户。解决了现有的基于关键词进行推荐时,提取的关键词很难准确全面地反映用户行为偏好的问题,能够更加全面地契合用户需求、满足用户偏好,提升了用户体验。

Description

一种推荐方法及网络设备
技术领域
本发明涉及通信技术领域,更具体地说,涉及一种推荐方法及网络设备。
背景技术
近年来随着移动互联网、电子商务、物联网技术的蓬勃发展,各种数据平 台或者数据库中存储有海量的各种数据信息,几乎可以包括人们希望获取的各 种信息。尽管如此庞大的数据量为用户获取使用提供了可能,但如何在如此海 量的数据信息中筛选出用户真正需要的信息也是一个十分棘手且急需解决的 问题,因为用户可能需要花费大量的时间精力进行分析筛选,甚至很有可能由 于用户搜索方法不当错过用户真正需要或者感兴趣的内容信息,严重影响用户 使用体验。
为了解决上述问题,现有技术基于用户历史操作对象,通过关键词提取算 法获取这些用户浏览操作过的对象之相应的关键词,并利用这些关键词来表征 用户的行为偏好,然后通过相似度算法计算其他对象相对于该用户的偏好行为 之间的相似度,在满足一定的相似度阈值后推荐给该用户。解决了用户手动获 取筛选自己感兴趣的对象需要耗费大量时间精力的问题。但是,现有的推荐方 法由于算法本身或者其他方面的限制,导致其存在如下技术问题:
首先,由于关键词提取算法自身限制,可能导致提取的关键词并不准确;
其次,提取的关键词仅仅只是所述对象中的一小部分内容,因此提取的关 键词很有可能无法很好地反映该对象的中心思想,将其作为用户行为偏好也无 法准确反映用户行为偏好,因此推荐精度不高,盲目性大,长此以往反而增加 用户反感情绪;
以关键词的方式表征用户行为偏好,并基于此进行推荐,推荐的对象往往 是包含该关键词的相应对象,并不能有效推荐其他与用户偏好相关的其他对象, 也即推荐方式比较单一,不灵活。
下面以一则简短的新闻信息“韩国军方不顾中国及其民众反对执意与乐天 集团签署了萨德用地交换合约”为例进行简要说明,现有的关键词提取算法 (TF-IDF为例)提取出的关键词可能是“韩国”,仅仅以提取的该关键词来表 征这则新闻信息的中心思想,可能并不是十分准确;进一步的,若基于这则新 闻信息提取的关键词表示用户行为偏好时,用该关键词也很难真实反映用户行 为偏好,仅仅基于关键词“韩国”进行推荐时,推荐的对象很有可能只包含有 “韩国”相关的信息,并不会包括与“萨德”和/或“乐天集团”相关的信息, 这样将导致推荐的对象单一,无法对潜在的且用户感兴趣的对象进行有效推荐。
发明内容
本发明要解决的技术问题在于:现有的基于关键词进行推荐的方式很难真 实完整反映用户行为偏好,导致其推荐的对象单一,无法对潜在的且用户感兴 趣的对象进行有效推荐的问题,针对该技术问题,本发明提供一种推荐方法及 网络设备。
为解决上述技术问题,本发明提供一种推荐方法,所述推荐方法包括:
通过主题模型算法建立待推荐对象的主题模型,所述主题模型包括所述待 推荐对象的主题类型及所述待推荐对象在该主题类型下的权重,所述主题类型 包括至少两个具有语义关联关系的元素;
计算所述待推荐对象的主题模型与用户的偏好特征模型的相似度,所述偏 好特征模型基于用户在所述待推荐对象的所属平台下的历史操作记录计算得 到;
在所述相似度达到预设阈值时,将所述待推荐对象推荐给所述用户。
进一步地,所述计算所述待推荐对象的主题模型与用户的偏好特征模型的 相似度包括:根据余弦相似度算法计算所述待推荐对象的主题模型与用户的偏 好特征模型的相似度。
进一步地,所述将所述待推荐对象推荐给所述用户包括:当相似度大于预 设阈值的待推荐对象超过一个时,按照相似度大小依次推荐给所述用户。
进一步地,所述计算所述待推荐对象的主题模型与用户的偏好特征模型的 相似度之前,所述方法还包括:
基于用户在所述平台下的历史操作记录计算所述用户对各主题类型的偏 好权重;
根据计算结果将所述用户对各主题类型的偏好权重组合生成该用户的偏 好特征模型。
进一步地,所述基于用户在所述平台下的历史操作记录计算所述用户对各 主题类型的偏好权重包括:
从所述历史操作记录中获取用户有效操作次数,所述用户有效操作次数为 所述用户对包含有所述主题类型下至少一个元素的对象的有效操作次数;
获取所述平台下的用户总数以及所述平台下包含有所述主题类型下至少 一个元素的对象之对象总数;
根据所述用户有效操作次数、所述用户总数以及所述对象总数计算所述用 户对所述主题类型的偏好权重。
进一步地,所述根据所述有效操作次数、所述用户总数以及所述对象总数 计算所述用户对所述主题类型的偏好权重包括通过如下公式进行计算:
其中,所述wij为用户Ui对主题类型tj的偏好权重,tfik表示用户Ui对包含 有主题类型tj下的至少一个元素的所有对象进行的有效操作次数,分子中的n 为对包含该主题类型tj下的至少一个元素的对象进行有效操作的用户数,分母 中的n为对包含该主题类型tk下的至少一个元素的对象进行有效操作的用户数, Di表示用户Ui进行有效操作过的所有主题类型的集合;x大于0,且小于等于 预设数值阈值。
本发明还提供了一种网络设备,所述网络设备包括:
模型建立模块,用于建立待推荐对象的主题模型,所述主题模型包括所述 待推荐对象的主题类型及所述待推荐对象在该主题类型下的权重,所述主题类 型包括至少两个具有语义关联关系的元素;
权重计算模块,用于基于用户在所述平台下的历史操作记录计算所述用户 的偏好特征模型;
相似度计算模块,用于计算所述待推荐对象的主题模型与用户的偏好特征 模型的相似度;
推荐模块,用于根据所述相似度计算模块计算出的待推荐对象的主题模型 与用户的偏好特征模型的相似度,将相似度达到预设阈值的待推荐对象推荐给 所述用户。
进一步地,所述推荐模块用于当相似度大于预设阈值的待推荐对象超过一 个时,按照相似度大小依次推荐给所述用户。
进一步地,所述权重计算模块用于基于用户在所述平台下的历史操作记录 计算所述用户对各主题类型的偏好权重;
并根据计算结果将所述用户对各主题类型的偏好权重组合生成该用户的 偏好特征模型。
进一步地,所述权重计算模块用于从所述历史操作记录中获取用户有效操 作次数、所述平台下的用户总数以及所述平台下包含有所述主题类型下至少一 个元素的对象之对象总数,并根据获取的所述用户有效操作次数、所述用户总 数以及所述对象总数计算所述用户对所述主题类型的偏好权重,所述用户有效 操作次数为所述用户对包含有所述主题类型下至少一个元素的对象的有效操 作次数。
有益效果
本发明提供一种推荐方法及网络设备,通过主题模型算法建立待推荐对象 的主题模型,该主题模型包括待推荐对象的主题类型及待推荐对象在该主题类 型下的权重,主题类型包括至少两个具有语义关联关系的元素;计算待推荐对 象的主题模型与用户的偏好特征模型的相似度,其中用户的偏好特征模型基于 用户在该待推荐对象的所属平台下的历史操作记录计算得到;在待推荐对象的 主题模型与用户的偏好特征模型的相似度达到预设阈值时,将该待推荐对象推 荐给该用户。由于一个主题类型下的各元素具有语义关联关系,所以,当用户 对包含该主题类型下的一个或多个元素的操作对象感兴趣时,用户也极有可能 对包含该主题类型下其他至少一个元素的待推荐对象感兴趣。而本发明提供的 方案能够向用户推荐这些用户很有可能比较感兴趣的对象,相对于现有技术基 于单个的关键词进行推荐的方式,能够更加全面地契合用户需求、满足用户偏 好,解决了现有的基于关键词进行推荐时,提取的关键词很难准确全面地反映 用户行为偏好的问题,从而有效避免了现有的基于关键词进行推荐时推荐对象 单一的问题,提升了用户体验。
附图说明
下面将结合附图及实施例对本发明作进一步说明,附图中:
图1为本发明第一实施例提供的一种推荐方法的流程示意图;
图2为本发明第二实施例提供的一种推荐方法的流程示意图;
图3为本发明第二实施例提供的一种权重计算方法的流程示意图;
图4为本发明第三实施例提供的一种网络设备的结构示意图;
图5为本发明第四实施例提供的一种网络设备的结构示意图;
图6为本发明第四实施例提供的一种可选的服务器的结构示意图。
具体实施方式
以下通过具体实施例进行详细说明,应当理解,此处所描述的具体实施例 仅仅用以解释本发明,并不用于限定本发明。
第一实施例
本实施例提供一种推荐方法,请参照图1,图1为本发明第一实施例提供 的一种推荐方法的流程示意图,包括:
S11:通过主题模型算法建立待推荐对象的主题模型。
本实施例中,待推荐对象的主题模型可以通过相应的主题模型算法训练得 到,这里的主题模型算法包括但不限于PLSA(Probabilistic Latent Semantic Analysis,概率潜在语义分析)、LDA(Latent Dirichlet Allocation,隐含狄利克 雷分配)等。本实施例中,待推荐对象一般是基于同一平台下的部分或者全部 对象,应当理解的是,当不同的多个平台进行信息整合或者信息共用等时,待 推荐对象也可以是不同平台下的部分或者全部对象。当多个平台进行信息整合 或者共用时,主题模型算法应当能够针对不同平台建立所有待推荐对象的主题 模型。
待推荐对象可以是用户未操作过的对象,对于用户已经操作过的对象则可 以不必再将其作为待推荐对象。应当理解的是,针对不同的用户,其所对应的 待推荐对象可能是不同的,因为不同的用户操作过的对象一般不同,所以剩下 的其未操作过的对象也不同,也就是说待推荐对象是针对某个用户而言的,不 同的用户对应的待推荐对象可能不同。
本实施例中,对象可以是一则信息,也可以是其他能够通过信息进行描述 的物品,例如一则新闻,一片文章,一件网络商城上的物品,一部影片等等均 可以作为一个对象,这些对象可以是属于同一平台下的,也可以是属于不同平 台下的,通过相应的主题模型算法可以建立主题模型,该主题模型应当包括待 推荐对象的主题类型以及该待推荐对象在该主题类型下的权重。
应当理解的是,一个APP可以看作是一个平台,一个数据库也可以看作 一个平台,例如“网易新闻”可以看作是一个平台,应当理解的是,对于不同 应用环境的“网易新闻”(比如iOS版、Android版、windows版、网页版)可 以将其看作是一个平台,也可以看作是不同的平台。
建立的主题模型,应当包括待推荐对象的主题类型以及该待推荐对象在该 主题类型下的权重,且该主题类型包括至少两个具有语义关联关系的元素。为 了更好地理解本发明,建立的主题模型可以如下表所示:
表1
待推荐对象 主题类型以及在各主题类型下的权重
P1 t1,w11;t2,w12;…;tm,w1m
P2 t1,w21;t2,w22;…;tm,w2m
Pn t1,wn1;t2,wn2;…;tm,wnm
表1中的t1,t2,…,tm表示不同的主题类型,w11表示待推荐对象P1在 主题类型t1下的权重,w12表示待推荐对象P1在主题类型t2下的权重,…,w1m表示待推荐对象P1在主题类型tm下的权重,同样,wn1表示待推荐对象Pn在 主题类型t1下的权重,wn2表示待推荐对象Pn在主题类型t2下的权重,…,wnn表示待推荐对象Pn在主题类型tm下的权重。
应当理解的是,通常主题模型中包含多个(至少两个)不同的主题类型, 例如50、100、500甚至上千个主题类型。继续参见表1,该主题模型中包括 m个主题类型t1,t2,…,tm,通常每一个主题类型都包含至少两个(例如数 十个、数百个、数千个等)语义关联关系的元素,当然,对于其中的部分主题 类型所包括的元素少于2个时,同样适用,但至少应当保证主题模型中的至少 一个主题类型下所包含的语义关联关系的元素个数大于等于2个。
由于同一主题类型下的元素具有语义关联关系,当用户对该主题类型下的 某个元素感兴趣时,可以说明用户该主题下的其他元素也可能比较感兴趣,因 此基于主题类型进行推荐时,可以比较准确全面地反映用户行为偏好,同时解 决了现有的基于关键词进行推荐时导致推荐的对象单一的问题,对于用户可能 感兴趣的其他对象,本发明基于同一主题类型下的元素的语义关联关系,能够 对用户可能感兴趣的对象进行很好地发掘,避免用户错过或者无法搜索得到, 有效解决用户难以从海量数据中进行筛选的问题。
应当理解的是,所述语义关联关系可以是在语义相近或者相似,例如:“高 兴”、“快乐”、“愉悦”、“舒畅”,这些元素可以认为是语义关联关系的,这一 类语义关联的元素不会随着用户关注热点的变化而变化。当然,本领域技术人 员可以理解的是,具有语义关联的元素也可以是基于时事变化导致的其两者或 多者之间的语义关联关系,例如,由于近来有人对“韩国部署萨德系统的事件” 高度关注,此时,元素“韩国”、“萨德”、以及“乐天集团”之间可以导致其 语义关联关系。并将这些具有语义关联关系的元素类聚在一个主题类型中。
为了更好地理解,主题类型可以参见下表所示:
表2
一个主题模型中可以包括多个主题类型,例如表2中的Topic 1、Topic 2、…、Topic n;一个主题类型下也可以包括多个元素,例如表2中的主题类型Topic 1 下包括A1、A2、A3、…、An这些相互关联关系的元素。应当理解的是,由 于通过相应的主题模型算法将多个相互关联关系的元素类聚形成一个主题类 型,也即是一个主题类型中包含有多个元素,在计算待推荐对象的主题模型与 用户偏好特征模型时,相对于现有的基于关键词的向量模型,能够有效减少向 量维数,从而有利于减少计算量。例如,对于“乔布斯是伟大的”、“苹果公司 是令人钦佩的”这两个待推荐对象,通过主题模型算法建立得到的主题模型中所包括的主题类型可能是:T1(乔布斯,苹果公司);T2(伟大,令人钦佩) 这两个主题类型,参见下表所示:
表3
主题类型 元素
T1 乔布斯,苹果公司
T2 伟大,令人钦佩
此时形成的待推荐对象的主题模型,参见下表所示:
表4
待推荐对象 主题类型及在该主题类型下的权重
“乔布斯是伟大的” (T1,w11;T2,w12)
“苹果公司是令人请钦佩的” (T1,w21;T2,w22)
此时,这两个待推荐的主题模型(T1,w11;T2,w12)和(T1,w21; T2,w22)实质上就是一个二维向量,也即是(w11,w12)、(w21,w22)。 在计算相似度时有效减少了计算量。而现有推荐方法是基于提取的关键词进行 推荐,同样以上述“乔布斯是伟大的”、“苹果公司是令人请钦佩的”这两个待 推荐对象为例,此时根据相应的关键词提取算法,提取出的关键词可能是“乔 布斯”、“伟大”、“苹果公司”、“令人钦佩”这四个关键词,此时为了对上述两个待推荐对象进行量化表征,其必定是一个至少为四维的向量,例如对于待推 荐对象“乔布斯是伟大的”,其可能表示为(1,1,0,0),对于待推荐对象“苹果 公司是令人请钦佩的”,其可能表示为(0,0,1,1),也即是向量维数将增加,不 利于计算,特别是针对实际应用中的海量数据时,计算量更是十分庞大,因此 不利于提高更新速率。而本发明基于主题类型进行推荐,能够有效减少计算量, 因而在用户行为偏好发生改变时,也有利于对用户行为偏好进行快速更新。应 当理解的是,通过主题模型算法建立主题模型通常是基于待推荐对象所属平台 下当前所有对象进行的,并不是基于该平台下的一个或者部分对象进行的,但存在一个或者多个新的对象加入该平台时,可以对主题模型进行更新。
本实施例中,主题类型下的元素可以是一个词语,也可以是一个短语等。
应当理解的是,建立的主题模型中所包含的待推荐对象在主题类型下的权 重可以通过该主题模型算法计算得到,各主题类型下所包含的相互关联关系的 元素也可以通过该主题模型算法训练得到。
S12:计算待推荐对象的主题模型与用户的偏好特征模型之间的相似度。
用户的偏好特征模型可以基于用户历史操作记录计算得到。
以上述表3和表4所示的“乔布斯是伟大的”、“苹果公司是令人请钦佩的” 这两个待推荐对象为例,假设“乔布斯是伟大的”是用户浏览过的,此时可以 通过该浏览过的对象生成该用户的偏好特征模型(T1,w11;T2,w12),w11 和w12分别表示该用户对主题T1和主题T2的偏好权重。对象“苹果公司是 令人请钦佩的”此时可以作为待推荐对象,计算待推荐对象的主题模型(T1, w21;T2,w22)与该用户的偏好特征模型(T1,w11;T2,w12)两者之间 的相似度,所述相似度的计算方法包括但不限于采用余弦相似度算法,具体的, 这里可以通过余弦相似度算法计算(w21,w22)与(w11,w12)之间的相 似度。具体的计算过程在此不在赘述。
应当理解的是,当用户偏好特征模型发生改变时,可以对用户偏好特征模 型进行更新,例如用户浏览了其他对象时,此时用户偏好特征模型发生了一定 变化,对其偏好特征模型进行更新时,可以实时更新,也可以每间隔相应的时 间后在进行更新,例如每间隔一天、一周或者一个月等再进行更新。
S13:在所述相似度达到预设阈值时,将该待推荐对象推荐给该用户。
根据计算结果,将满足相似度预设阈值的待推荐对象推荐给该用户,预设 阈值可以根据实际情况灵活设置,例如采用余弦相似度算法时,预设阈值可以 设置为0.8,也可以设置为0.5等。
本实施例中,待推荐对象通常至少应当包括一个对象,因此,满足相似度 预设阈值的待推荐对象可能不只一个,可能包含多个,此时,可以按照相似度 大小以此推荐给该用户。例如达到相似度预设阈值的待推荐对象分别是:对象 A,相似度为0.9;对象B,相似度为0.8;对象C,相似度为0.7;对象D,相 似度为0.6;此时可以依次将对象A、对象B、对象C、对象D依次推荐给该 用户,推荐时间隔间可以灵活设置,例如可以是每间隔一个小时依次推荐给该 用户,也可以是每间隔一天依次推荐给该用户。当然,当达到预设阈值的待推 荐对象为多个时,也可以任意灵活推荐,在此并不作限制。
本实施例提供一种推荐方法,通过主题模型算法建立待推荐对象的主题模 型,计算待推荐对象的主题模型与用户偏好特征模型的相似度,将相似度达到 预设阈值时将其推荐给该用户;从而能够向用户推荐这些用户很有可能比较感 兴趣的对象,相对于现有技术基于单个的关键词进行推荐的方式,能够更加全 面地契合用户需求、满足用户偏好,有利于提高用户体验。
第二实施例
本实施例在第一实施例的基础上,提供一种推荐方法,请参照图2,图2 为本发明第二实施例提供的一种推荐方法的流程示意图,包括:
S21:通过主题模型算法建立待推荐对象的主题模型,该主题模型包括待 推荐对象的主题类型及待推荐对象在该主题类型下的权重,主题类型包括至少 两个具有语义关联关系的元素。
对于上述步骤S21,与第一实施例中的步骤S11相似,请参见第一实施例 中对步骤S11的说明,在此不再赘述。
S22:基于用户历史操作记录计算该用户对各主题类型的偏好权重。
本实施例中,用户历史操作记录可以是用户进行操作过的对象,例如用户 浏览过的一则新闻、点赞过的一片文章、购买过的一件物品、收藏过的一则信 息等。基于用户历史操作信息,也可以说基于用户操作过的对象。
基于用户操作过的对象计算该用户对各主题类型的偏好权重,应当理解的 是,一个对象中通常包含多个元素,各个元素可能对应不同的主题类型,对该 用户操作过的所有对象进行收集汇总,获取其所操作过的所有对象的不同元素, 并将各个元素通过主题模型算法类聚到不同的主题类型,从而能够基于用户操 作过的对象来计算该用户对各主题类型的偏好权重,也即是基于用户历史操作 记录计算该用户对各主题类型的偏好权重。对于某个主题类型,假设用户操作 过的对象中包含该主题的元素较多,则可以说明该用户对该主题类型的偏好权 重较高。例如,通过主题模型算法建立的待推荐对象的主题模型中,主题类型 如下表所示:
表5
主题类型 元素
主题1 X1,X2,X3,X4
主题2 Y1,Y2,Y3,Y4,Y5,Y6
主题3 Z1,Z2,Z3,Z4,Z5
而从该用户操作过的所有对象中,所提取到的元素分别是X1,Y2,Y3, Y4,Y5,也即是从用户历史操作记录中可知,该用户对主题2的偏好权重较 高,此时说明该用户对主题类型的内容更感兴趣。
应当理解的是,这里所述示例只是为了便于理解进行的一个简单的说明, 并未对其他的一些相关因素进行综合考虑,由此得出该用户对主题2的偏好权 重较高也许并不准确,下面针对用户在主题类型下的偏好权重进行详细说明。
请参见图3,图3为本发明第二实施例提供的计算偏好权重的流程示意图, 包括:
S31:从用户历史操作记录中获取该用户有效操作次数。
这里所述的有效操作次数是针对用户操作过的对象而言的,也即是对操作 过的对象的有效操作次数,进而能够表征该用户对该操作对象中的元素的有效 操作次数。例如,用户浏览了一则新闻,则表示该用户对这则新闻进行了一次 有效操作,同时,对于这则新闻中所包含的元素,也可以认为用户进行了一次 有效操作。所述有效操作包括但不限于浏览、点击、收藏、购买、点赞、阅读、 观看等。应当理解的是,当该用户对这则新闻进行相应浏览之后,若用户还对 该新闻进行了收藏,此时可以认为该用户对该新闻进行了两次有效操作,也可 以认为同一用户对同一对象最多只能进行一次有效操作,即使该用户对该对象既进行了浏览,也进行了收藏,此时也可以认为该用户对该对象进行了一次有 效操作。
S32:获取相应平台下的用户总数。
应当理解的是,当待推荐对象的主题模型是基于一个平台进行建立时,应 当获取该平台下的用户总数;当待推荐对象的主题模型是基于多个平台进行建 立的时,应当获取所述多个平台下的用户总数。这里的用户总数可以是该平台 下的注册用户总数。
S33:获取相应平台下包含有相应主题类型下至少一个元素的对象之对象 总数。
例如,一个主题类型下包括E1、E2、E3和E4这四个元素,而该平台下 的对象1包括元素E1,对象2包括E2和E3,对象3包括E4,对象4包括E3 和E4,其他对象不包括该主题类型下的任意一个或者多个元素,此时包含有 该主题类型下至少一个元素的对象之对象总数便为4(分别为对象1、对象2、 对象3和对象4)。
应当说明的是,步骤S31-S33的顺序在此并不做限制,可以根据实际应用 情况灵活执行。
S34:根据获取的用户有效操作次数、用户总数以及所述对象总数计算该 用户对该主题类型的偏好权重值。
具体的,可以通过如下公式计算用户对该主题类型的偏好权重值:
其中,wij为用户Ui对主题类型tj的偏好权重值,tfik表示用户Ui对包含 有主题类型tj下的至少一个元素的所有对象进行的有效操作次数,分子中的n 为对包含该主题类型tj下的至少一个元素的对象进行有效操作的用户数,分母 中的n为对包含该主题类型tk下的至少一个元素的对象进行有效操作的用户数, Di表示用户Ui进行有效操作过的所有主题类型的集合;x大于0,且小于等 于预设数值阈值。
公式2-1中,x大于0,且小于等于预设数值阈值,主要是为了避免(n+x) 的值为0,所述预设数值阈值可以根据实际灵活设定,例如0.1、0.01、0.001 等,保证x值远小于n值,具体的,例如当n值为100时,x值可以为1、0.1 等。
S23:根据计算结果将该用户对各主题类型的偏好权重组合生成该用户的 偏好特征模型。
例如,计算得到该用户对各主题类型的偏好权重分别是:w1、w2、w3、 w4、w5,然后将其组合生成该用户的偏好特征模型可以表示为:(w1,w2, w3,w4,w5)。
S24:计算待推荐对象的主题模型与该用户的偏好特征模型的相似度。
将步骤S21建立的待推荐对象的主题模型与该用户的偏好特征模型进行 相似度计算,应当理解的是,待推荐对象的主题模型包括主题类型以及该待推 荐对象在主题类型下的权重,为了便于进行相似度计算,可以将该待推荐对象 在各主题类型下的权重组合形成该待推荐对象的主题模型。应当理解的是,待 推荐对象在各主题类型下的权重的组合顺序应当与用户在各主题类型下的偏 好权重的组合顺序相同。例如,用户的偏好特征模型为:(T1,w1;T2,w2;T3,w 3;T4,w4;T5,w5),T1、T2、T3、T4、T5分别表示主题类型,w1、w2、w 3、w4、w5分别表示该用户在各主题类型下的偏好权重;该待推荐对象的主 题模型为:(T1,P1;T2,P2;T3,P3;T4,P4;T5,P5),P1、P2、P3、P4、P5表示该待 推荐对象该各主题类型的权重。此时,可以通过计算(w1,w2,w3,w4, w5)与(P1,P2,P3,P4,P5)之间的这两个向量之间的相似度来计算待推 荐对象的主题模型与该用户的偏好特征模型的相似度。
S25:在相似度达到预设阈值时,将待荐推对象推荐给该用户。
在待推荐对象的相似度达到预设阈值时,将其推荐给该用户。将满足预设 阈值的待推荐对象大于等于两个时,可以按照相似度大小依次推荐给该用户。
本实施例提供一种推荐方法,根据用户历史操作记录获取用户有效操作次 数,以及获取相应平台下的用户总数和该平台下包含相应主题类型下至少一个 元素的对象值对象总数,从而计算该用户对各主题模型的偏好权重,并将该用 户对各主题类型的偏好权重组合形成该用户的偏好特征模型,能够更加准确地 反映用户行为偏好,进而有利于提高推荐的精确度,对于用户感兴趣的相关主 题类型下的其他类型也能够进行很好地发掘并推荐给该用户,解决了用户需要 耗费大量的时间精力进行筛选搜索的问题,提高了用户体验。
第三实施例
请参照图4,图4为本发明第三实施例提供的一种网络设备的结构示意图,
模型建立模块41,用于建立待推荐对象的主题模型,该主题模型包括待 推荐对象的主题类型及待推荐对象在该主题类型下的权重,主题类型包括至少 两个具有语义关联关系的元素。
本实施例中,模型建立模块41可以通过相应的主题模型算法实现,包括 但不限于PLSA、LDA等。模型建立模块41可以针对一个平台建立该平台下 相应的待推荐对象的主题模型,当然,在多个平台进行信息整合或者共用时, 模型建立模块41也能够针对不同平台建立所有待推荐对象的主题模型。
待推荐对象可以是用户未操作过的对象,对于用户已经操作过的对象则可 以不必再将其作为待推荐对象。应当理解的是,针对不同的用户,其所对应的 待推荐对象可能是不同的,因为不同的用户操作过的对象一般不同,所以剩下 的其未操作过的对象也不同,也就是说待推荐对象是针对某个用户而言的,不 同的用户对应的待推荐对象可能不同。
本实施例中,对象可以是一则信息,也可以是其他能够通过信息进行描述 的物品,例如一则新闻,一片文章,一件网络商城上的物品,一部影片等等均 可以作为一个对象,这些对象可以是属于同一平台下的,也可以是属于不同平 台下的,通过模型建立模块41建立的主题模型包括括待推荐对象的主题类型 以及该待推荐对象在该主题类型下的权重,该主题类型包括至少两个具有语义 关联关系的元素。为了更好地理解本发明,模型建立模块41建立的主题模型 可以参见下表所示:
表6
待推荐对象 主题类型以及在各主题类型下的权重
P1 t1,w11;t2,w12;…;tm,w1m
P2 t1,w21;t2,w22;…;tm,w2m
Pn t1,wn1;t2,wn2;…;tm,wnm
所述表中的t1,t2,…,tm表示不同的主题类型,w11表示待推荐对象P1在主题类型t1下的权重,w12表示待推荐对象P1在主题类型t2下的权重,…, w1m表示待推荐对象P1在主题类型tm下的权重,同样,wn1表示待推荐对象Pn在主题类型t1下的权重,wn2表示待推荐对象Pn在主题类型t2下的权重,…, wnn表示待推荐对象Pn在主题类型tm下的权重。
应当理解的是,模型建立模块41建立的主题模型中可以包含多个(至少 两个)不同的主题类型,例如50、100、500甚至上千个主题类型。继续参见 表6,该主题模型中包括m个主题类型t1,t2,…,tm,通常每一个主题类型 都包含至少两个(例如数十个、数百个、数千个等)语义关联关系的元素,当 然,对于其中的部分主题类型所包括的元素少于2个时,同样适用,但模型建 立模块41所建立的主题模型中至少一个主题类型下所包含的相互关联关系的 元素个数大于等于2个。
由于同一主题类型下的元素语义关联关系,当用户对该主题类型下的某个 元素感兴趣时,可以说明用户该主题下的其他元素也可能比较感兴趣,因此基 于主题类型进行推荐时,可以比较准确全面地反映用户行为偏好,同时解决了 现有的基于关键词进行推荐时导致推荐的对象单一的问题,对于用户可能感兴 趣的其他对象,本发明基于同一主题类型下的元素的相互关联关系,能够对用 户可能感兴趣的对象进行很好地发掘,避免用户错过,有效解决用户难以从海 量数据中进行筛选的问题。
应当理解的是,所述语义关联关系可以是在语义相近或者相似,例如:“高 兴”、“快乐”、“愉悦”、“舒畅”,这些元素可以认为是语义关联关系的;也可 以是基于时事变化导致的其两者或多者之间的语义关联关系,例如,由于近来 有人对“韩国部署萨德系统的事件”高度关注,此时,元素“韩国”、“萨德”、 以及“乐天集团”之间可以导致其语义关联关系。并将这些具有语义关联关系 的元素类聚在一个主题类型中。
模型建立模块41所建立的待推荐对象的主题模型中,通常具有多个主题 类型,请参见下表所示:
表7
主题类型 元素
Topic 1 A1,A2,A3,…,An
Topic 2 B1,B2,B3,…,Bn
Topic n M1,M2,M3,…,Mn
应当理解的是,由于通过相应的主题模型算法将多个语义关联关系的元素 类聚形成一个主题类型,也即是一个主题类型中包含有多个元素,在计算待推 荐对象的主题模型与用户偏好特征模型时,相对于现有的基于关键词的向量模 型,能够有效减少向量维数,从而有利于减少计算量。
本实施例中,主题类型下的元素可以是一个词语,也可以是一个短语等。
应当理解的是,主题模型中所包含的待推荐对象在主题类型下的权重可以 通过模型建立模块41计算得到,各主题类型下所包含的相互关联关系的元素 也可以通过该模型建立模块41训练得到。
权重计算模块42,用于基于用户在所述平台下的历史操作记录计算所述 用户的偏好特征模型。本实施例中,用户历史操作记录可以是用户进行操作过 的对象,例如用户浏览过的一则新闻、点赞过的一片文章、购买过的一件物品、 收藏过的一则信息等。
权重计算模块42可以从用户历史操作记录中获取该用户有效操作次数, 并获取相应平台下的用户总数以及该平台下包含有相应主题类型下至少一个 元素的对象之对象总数。并根据前其所获取的所述有效操作次数、所述用户总 数以及所述对象总数计算该用户的偏好特征模型。
权重计算模块42所获取的有效操作次数是针对用户操作过的对象而言的, 是对操作过的对象的有效操作次数,进而能够表征该用户对该操作对象中的元 素的有效操作次数。例如,用户浏览了一则新闻,则权重计算模块42能够获 取该用户对这则新闻进行了一次有效操作,同时,对于这则新闻中所包含的元 素,也可以认为用户进行了一次有效操作。所述有效操作包括但不限于浏览、 点击、收藏、购买、点赞、阅读、观看等。应当理解的是,当该用户对这则新 闻进行相应浏览之后,若用户还对该新闻进行了收藏,此时权重计算模块42 获取到该用户对该新闻进行了两次有效操作,或者将权重计算模块42设置为 同一用户对同一对象最多只能进行一次有效操作,即使该用户对该对象既进行 了浏览,也进行了收藏,此时权重计算模块42仍然获取到的是:该用户对该 对象进行了一次有效操作。
权重计算模块42获取相应平台下的用户总数,可以是该平台下的注册用 户总数。
权重计算模块42获取相应平台下包含有相应主题类型下至少一个元素的 对象之对象总数。具体的,例如,一个主题类型下包括E1、E2、E3和E4这 四个元素,而该平台下的对象1包括元素E1,对象2包括E2,对象3包括E4, 对象4包括E3和E4,其他对象不包括该主题类型下的任意一个或者多个元素, 此时权重计算模块42可以获取到包含有该主题类型下至少一个元素的对象之 对象总数便为4(分别为对象1、对象2、对象3和对象4)。
权重计算模块42可以根据其获取的所述用户有效操作次数、所述用户总 数以及所述对象总数计算计算所述用户的偏好特征模型。
应当理解的是,当用户偏好特征模型发生改变时,权重计算模块42可以 对用户偏好特征模型进行更新,例如用户浏览了其他对象时,此时用户偏好特 征模型发生了一定变化,对其偏好特征模型进行更新时,可以实时更新,也可 以每间隔相应的时间后在进行更新,例如每间隔一天、一周或者一个月等再进 行更新。
相似度计算模块43,用于计算所述待推荐对象的主题模型与用户的偏好 特征模型的相似度;
本实施例中,相似度计算模块43可以通过相应的相似度算法实现,包括 但不限于余弦相似度算法。
推荐模块44,用于根据所述相似度计算模块43计算出的待推荐对象的主 题模型与用户的偏好特征模型的相似度,将相似度达到预设阈值的待推荐对象 推荐给所述用户。
推荐模块44根据相似度计算模块43的计算结果,将满足相似度预设阈值 的待推荐对象推荐给该用户,预设阈值可以根据实际情况灵活设置,例如采用 余弦相似度算法时,预设阈值可以设置为0.8,也可以设置为0.6等。当达到 相似度预设阈值的待推荐对象超过一个时,推荐模块44可以按照相似度大小 依次推荐给所述用户。当然,也可以将达到预设阈值的待推荐对象任意灵活推 荐,只要保证能够进行有效推荐即可。
本实施例所提供的网络设备40所包括的模型建立模块41、权重计算模块 42、相似度计算模块43以及推荐模块44包括但不限于实施于相应平台下的服 务器中,通过相应的处理器以及通信模块实现本实施例中的相应功能。
本实施例提供一种网络设备40,包括模型建立模块41、权重计算模块42、 相似度计算模块43以及推荐模块44;其中模型建立模块41用于建立待推荐 对象的主题模型,主题模型包括待推荐对象的主题类型及待推荐对象在该主题 类型下的权重,主题类型包括至少两个具有语义关联关系的元素;权重计算模 块42用于基于用户在所述平台下的历史操作记录计算该用户的偏好特征模型; 相似度计算模块43用于计算待推荐对象的主题模型与用户的偏好特征模型之 间的相似度;推荐模块44用于根据相似度计算模块43计算出的待推荐对象的 主题模型与用户的偏好特征模型的相似度,将相似度达到预设阈值的待推荐对 象推荐给该用户。能够更加准确地反映用户行为偏好,有利于提高推荐的精确 度,对于用户感兴趣的相关主题类型下的其他类型也能够进行很好地发掘并推 荐给该用户,解决了用户需要耗费大量的时间精力进行筛选搜索的问题,提高 了用户使用体验。
第四实施例
本实施例在第三实施例的基础上,提供一种网络设备,参照图5,图5为 本发明第四实施例提供的一种网络设备的结构示意图,所述网络设备50包括:
模型建立模块51,用于建立待推荐对象的主题模型,该主题模型包括待 推荐对象的主题类型及待推荐对象在该主题类型下的权重,主题类型包括至少 两个具有语义关联关系的元素。
权重计算模块52,用于基于用户在所述平台下的历史操作记录计算所述 用户的偏好特征模型。本实施例中,权重计算模块52可以从用户历史操作记 录中获取该用户有效操作次数、获取相应平台下的用户总数以及相应平台下包 含有相应主题类型下至少一个元素的对象之对象总数,并基于其所获取的所述 有效操作次数、所述用户总数以及所述对象总数计算该用户对该主题类型的偏 好权重。具体的,权重计算模块52可以通过如下公式来进行计算:
其中,wij为用户Ui对主题类型tj的偏好权重值,tfik表示用户Ui对包含 有主题类型tj下的至少一个元素的所有对象进行的有效操作次数,分子中的n 为对包含该主题类型tj下的至少一个元素的对象进行有效操作的用户数,分母 中的n为对包含该主题类型tk下的至少一个元素的对象进行有效操作的用户数, Di表示用户Ui进行有效操作过的所有主题类型的集合;x大于0,且小于等 于预设数值阈值。
公式4-1中,x大于0,且小于等于预设数值阈值,主要是为了避免(n+x) 的值为0,所述预设数值阈值可以根据实际灵活设定,例如0.1、0.01、0.001 等,保证x值远小于n值,具体的,例如当n值为100时,x值可以为1、0.1 等。
进一步地,权重计算模块52还可以根据计算结果将该用户对各主题类型 的偏好权重组合生成该用户的偏好特征模型。
相似度计算模块53,用于计算所述待推荐对象的主题模型与用户的偏好 特征模型的相似度;推荐模块54,用于根据所述相似度计算模块53计算出的 待推荐对象的主题模型与用户的偏好特征模型的相似度,将相似度达到预设阈 值的待推荐对象推荐给所述用户。
对于本实施例中的模型建立模块51、相似度计算模块53以及推荐模块54 与第三实施例中的模型建立模块41、相似度计算模块43以及推荐模块44相 似,能够实现相同或相应的功能,因此不再赘述。本实施例中的模型建立模块 51、权重计算模块52、相似度计算模块53以及推荐模块54可以实施于相应 平台下的服务器中,通过相应的处理器、存储器、内存以及通信装置实现本实 施例中的相应功能。
具体的,请参照图6,图6为本发明实施例四提供的一种可选的服务器的 结构示意图,该服务器至少包括:输入输出(IO)总线61、处理器62、存储 器63、内存64和通信装置65。其中,
本发明提供的网络设备50中,模型建立模块51、权重计算模块52、相似 度计算模块53以及推荐模块54的功能的软件代码可存储在存储器63中,并 由处理器62执行或编译后执行。
具体的,处理器62建立待推荐对象的主题模型,所述主题模型包括待推 荐对象的主题类型及待推荐对象在该主题类型下的权重,主题类型包括至少两 个具有语义关联关系的元素;计算待推荐对象的主题模型与用户的偏好特征模 型的相似度,所述偏好特征模型基于用户在所述待推荐对象的所属平台下的历 史操作记录计算得到;在所述相似度达到预设阈值时,控制通信装置65将所 述待推荐对象推荐给所述用户。
当相似度大于预设阈值的待推荐对象超过一个时,处理器62可以按照相 似度大小依次推荐给所述用户。
处理器62计算所述待推荐对象的主题模型与用户的偏好特征模型的相似 度之前还包括:基于用户在所述平台下的历史操作记录计算所述用户对各主题 类型的偏好权重;并根据计算结果将所述用户对各主题类型的偏好权重组合生 成该用户的偏好特征模型。
进一步地,处理器62可以从用户历史操作记录中获取该用户有效操作次 数,所述用户有效操作次数为所述用户对包含有所述主题类型下至少一个元素 的对象的有效操作次数;获取所述平台下的用户总数以及所述平台下包含有所 述主题类型下至少一个元素的对象之对象总数;根据所述用户有效操作次数、 所述用户总数以及所述对象总数计算所述用户对所述主题类型的偏好权重值。
具体的,处理器62还可以根据如下公式计算用户对主题类型的偏好权重:
其中,所述wij为用户Ui对主题类型tj的偏好权重,tfik表示用户Ui对包 含有主题类型tj下的至少一个元素的所有对象进行的有效操作次数,分子中的 n为对包含该主题类型tj下的至少一个元素的对象进行有效操作的用户数,分 母中的n为对包含该主题类型tk下的至少一个元素的对象进行有效操作的用户 数,Di表示用户Ui进行有效操作过的所有主题类型的集合;x大于0,且小 于等于预设数值阈值。
输入输出(IO)总线61分别与自身所属的服务器的其它部件(处理器62、 存储器63、内存64和通信装置65)连接,并且为其它部件提供传送线路。处 理器62通常控制自身所属的服务器的总体操作。其中,处理器62可以是中央 处理器(CPU)。通信装置65,通常包括一个或多个组件,其允许自身所属的 服务器与无线通信系统或网络之间的无线电通信。存储器63存储处理器可读、 处理器可执行的软件代码,其包含用于控制处理器62执行本文描述的功能的 指令(即软件执行功能)。
本实施例提供一种网络设备50,包括模型建立模块51、权重计算模块52、 相似度计算模块53以及推荐模块54;权重计算模块52能够通过用户历史操 作记录计算出该用户的偏好特征模型,该偏好特征模型能够很好地反映该用户 的偏好行为,因此有利于提高推荐的精确度,对于用户感兴趣的相关主题类型 下的其他类型也能够进行很好地发掘并推荐给该用户,提高了用户使用体验。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意 在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装 置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为 这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由 语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物 品或者装置中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实 施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬 件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方 案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来, 该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包 括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器, 或者网络设备等)执行本发明各个实施例所述的方法。
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述 的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本 领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保 护的范围情况下,还可做出很多形式,这些均属于本发明的保护之内。

Claims (10)

1.一种推荐方法,其特征在于,包括:
通过主题模型算法建立待推荐对象的主题模型,所述主题模型包括所述待推荐对象的主题类型及所述待推荐对象在该主题类型下的权重,所述主题类型包括至少两个具有语义关联关系的元素;
计算所述待推荐对象的主题模型与用户的偏好特征模型的相似度,所述偏好特征模型基于用户在所述待推荐对象的所属平台下的历史操作记录计算得到;
在所述相似度达到预设阈值时,将所述待推荐对象推荐给所述用户。
2.根据权利要求1所述的推荐方法,其特征在于,所述计算所述待推荐对象的主题模型与用户的偏好特征模型的相似度包括:根据余弦相似度算法计算所述待推荐对象的主题模型与用户的偏好特征模型的相似度。
3.根据权利要求1所述的推荐方法,其特征在于,所述将所述待推荐对象推荐给所述用户包括:当相似度大于预设阈值的待推荐对象超过一个时,按照相似度大小依次推荐给所述用户。
4.根据权利要求1-3任一项所述的推荐方法,其特征在于,所述计算所述待推荐对象的主题模型与用户的偏好特征模型的相似度之前,所述方法还包括:
基于用户在所述平台下的历史操作记录计算所述用户对各主题类型的偏好权重;
根据计算结果将所述用户对各主题类型的偏好权重组合生成该用户的偏好特征模型。
5.根据权利要求4所述的推荐方法,其特征在于,所述基于用户在所述平台下的历史操作记录计算所述用户对各主题类型的偏好权重包括:
从所述历史操作记录中获取用户有效操作次数,所述用户有效操作次数为所述用户对包含有所述主题类型下至少一个元素的对象的有效操作次数;
获取所述平台下的用户总数以及所述平台下包含有所述主题类型下至少一个元素的对象之对象总数;
根据所述用户有效操作次数、所述用户总数以及所述对象总数计算所述用户对所述主题类型的偏好权重。
6.根据权利要求5所述的推荐方法,其特征在于,所述根据所述有效操作次数、所述用户总数以及所述对象总数计算所述用户对所述主题类型的偏好权重包括通过如下公式进行计算:
<mrow> <msub> <mi>w</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mo>=</mo> <mfrac> <mrow> <msub> <mi>tf</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mo>&amp;times;</mo> <mi>l</mi> <mi>o</mi> <mi>g</mi> <mo>&amp;lsqb;</mo> <mi>N</mi> <mo>/</mo> <mrow> <mo>(</mo> <mi>n</mi> <mo>+</mo> <mi>x</mi> <mo>)</mo> </mrow> <mo>&amp;rsqb;</mo> </mrow> <msqrt> <mrow> <munder> <mo>&amp;Sigma;</mo> <mrow> <msub> <mi>t</mi> <mi>k</mi> </msub> <mo>&amp;Element;</mo> <msub> <mi>D</mi> <mi>i</mi> </msub> </mrow> </munder> <msup> <mrow> <mo>{</mo> <msub> <mi>tf</mi> <mrow> <mi>i</mi> <mi>k</mi> </mrow> </msub> <mo>&amp;times;</mo> <mi>l</mi> <mi>o</mi> <mi>g</mi> <mo>&amp;lsqb;</mo> <mi>N</mi> <mo>/</mo> <mrow> <mo>(</mo> <mi>n</mi> <mo>+</mo> <mi>x</mi> <mo>)</mo> </mrow> <mo>&amp;rsqb;</mo> <mo>}</mo> </mrow> <mn>2</mn> </msup> </mrow> </msqrt> </mfrac> <mo>;</mo> </mrow>
其中,所述wij为用户Ui对主题类型tj的偏好权重,tfik表示用户Ui对包含有主题类型tj下的至少一个元素的所有对象进行的有效操作次数,分子中的n为对包含该主题类型tj下的至少一个元素的对象进行有效操作的用户数,分母中的n为对包含该主题类型tk下的至少一个元素的对象进行有效操作的用户数,Di表示用户Ui进行有效操作过的所有主题类型的集合;x大于0,且小于等于预设数值阈值。
7.一种网络设备,其特征在于,包括:
模型建立模块,用于建立待推荐对象的主题模型,所述主题模型包括所述待推荐对象的主题类型及所述待推荐对象在该主题类型下的权重,所述主题类型包括至少两个具有语义关联关系的元素;
权重计算模块,用于基于用户在所述平台下的历史操作记录计算所述用户的偏好特征模型;
相似度计算模块,用于计算所述待推荐对象的主题模型与用户的偏好特征模型的相似度;
推荐模块,用于根据所述相似度计算模块计算出的待推荐对象的主题模型与用户的偏好特征模型的相似度,将相似度达到预设阈值的待推荐对象推荐给所述用户。
8.根据权利要求7所述的网络设备,其特征在于,所述推荐模块用于当相似度大于预设阈值的待推荐对象超过一个时,按照相似度大小依次推荐给所述用户。
9.根据权利要求7或8所述的网络设备,其特征在于,所述权重计算模块用于基于用户在所述平台下的历史操作记录计算所述用户对各主题类型的偏好权重;
并根据计算结果将所述用户对各主题类型的偏好权重组合生成该用户的偏好特征模型。
10.根据权利要求9所述的网络设备,其特征在于,所述权重计算模块用于从所述历史操作记录中获取用户有效操作次数、所述平台下的用户总数以及所述平台下包含有所述主题类型下至少一个元素的对象之对象总数,并根据获取的所述用户有效操作次数、所述用户总数以及所述对象总数计算所述用户对所述主题类型的偏好权重,所述用户有效操作次数为所述用户对包含有所述主题类型下至少一个元素的对象的有效操作次数。
CN201710210038.5A 2017-03-31 2017-03-31 一种推荐方法及网络设备 Pending CN107103049A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710210038.5A CN107103049A (zh) 2017-03-31 2017-03-31 一种推荐方法及网络设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710210038.5A CN107103049A (zh) 2017-03-31 2017-03-31 一种推荐方法及网络设备

Publications (1)

Publication Number Publication Date
CN107103049A true CN107103049A (zh) 2017-08-29

Family

ID=59674729

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710210038.5A Pending CN107103049A (zh) 2017-03-31 2017-03-31 一种推荐方法及网络设备

Country Status (1)

Country Link
CN (1) CN107103049A (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107704512A (zh) * 2017-08-31 2018-02-16 平安科技(深圳)有限公司 基于社交数据的金融产品推荐方法、电子装置及介质
CN107729488A (zh) * 2017-10-17 2018-02-23 北京搜狐新媒体信息技术有限公司 一种信息推荐方法及装置
CN107979691A (zh) * 2017-11-15 2018-05-01 维沃移动通信有限公司 一种主题推荐方法、移动终端和服务器
CN109087135A (zh) * 2018-07-25 2018-12-25 百度在线网络技术(北京)有限公司 用户意图的挖掘方法及装置、计算机设备及可读介质
CN109657153A (zh) * 2018-12-28 2019-04-19 丹翰智能科技(上海)有限公司 一种用于确定用户的关联财经信息的方法与设备
CN109726311A (zh) * 2018-12-21 2019-05-07 广州华多网络科技有限公司 一种视频推荐方法、装置及设备
CN109902252A (zh) * 2019-01-17 2019-06-18 平安城市建设科技(深圳)有限公司 用户成长体系的管理方法、装置、设备及存储介质
CN110019759A (zh) * 2017-10-27 2019-07-16 腾讯科技(深圳)有限公司 用户分群处理方法、装置、计算机设备和存储介质
CN110020171A (zh) * 2017-12-28 2019-07-16 阿里巴巴集团控股有限公司 数据处理方法、装置、设备及计算机可读存储介质
CN110110205A (zh) * 2018-01-16 2019-08-09 北京京东金融科技控股有限公司 推荐信息生成方法与装置
CN110472016A (zh) * 2019-08-16 2019-11-19 腾讯科技(北京)有限公司 文章推荐方法、装置、电子设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102929928A (zh) * 2012-09-21 2013-02-13 北京格致璞科技有限公司 基于多维相似度的个性化新闻推荐方法
JP2013089086A (ja) * 2011-10-19 2013-05-13 Nippon Telegr & Teleph Corp <Ntt> 話題推薦装置及び方法及びプログラム
CN103425710A (zh) * 2012-05-25 2013-12-04 北京百度网讯科技有限公司 一种基于主题的搜索方法和装置
CN104376058A (zh) * 2014-11-07 2015-02-25 华为技术有限公司 用户兴趣模型更新方法及相关装置
CN105224699A (zh) * 2015-11-17 2016-01-06 Tcl集团股份有限公司 一种新闻推荐方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013089086A (ja) * 2011-10-19 2013-05-13 Nippon Telegr & Teleph Corp <Ntt> 話題推薦装置及び方法及びプログラム
CN103425710A (zh) * 2012-05-25 2013-12-04 北京百度网讯科技有限公司 一种基于主题的搜索方法和装置
CN102929928A (zh) * 2012-09-21 2013-02-13 北京格致璞科技有限公司 基于多维相似度的个性化新闻推荐方法
CN104376058A (zh) * 2014-11-07 2015-02-25 华为技术有限公司 用户兴趣模型更新方法及相关装置
CN105224699A (zh) * 2015-11-17 2016-01-06 Tcl集团股份有限公司 一种新闻推荐方法及装置

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107704512B (zh) * 2017-08-31 2021-08-24 平安科技(深圳)有限公司 基于社交数据的金融产品推荐方法、电子装置及介质
CN107704512A (zh) * 2017-08-31 2018-02-16 平安科技(深圳)有限公司 基于社交数据的金融产品推荐方法、电子装置及介质
CN107729488A (zh) * 2017-10-17 2018-02-23 北京搜狐新媒体信息技术有限公司 一种信息推荐方法及装置
CN110019759A (zh) * 2017-10-27 2019-07-16 腾讯科技(深圳)有限公司 用户分群处理方法、装置、计算机设备和存储介质
CN107979691A (zh) * 2017-11-15 2018-05-01 维沃移动通信有限公司 一种主题推荐方法、移动终端和服务器
CN110020171A (zh) * 2017-12-28 2019-07-16 阿里巴巴集团控股有限公司 数据处理方法、装置、设备及计算机可读存储介质
CN110020171B (zh) * 2017-12-28 2023-05-16 阿里巴巴集团控股有限公司 数据处理方法、装置、设备及计算机可读存储介质
CN110110205A (zh) * 2018-01-16 2019-08-09 北京京东金融科技控股有限公司 推荐信息生成方法与装置
CN109087135A (zh) * 2018-07-25 2018-12-25 百度在线网络技术(北京)有限公司 用户意图的挖掘方法及装置、计算机设备及可读介质
US11138381B2 (en) 2018-07-25 2021-10-05 Baidu Online Network Technology (Beijing) Co., Ltd. Method, computer device and readable medium for user's intent mining
CN109726311A (zh) * 2018-12-21 2019-05-07 广州华多网络科技有限公司 一种视频推荐方法、装置及设备
CN109657153A (zh) * 2018-12-28 2019-04-19 丹翰智能科技(上海)有限公司 一种用于确定用户的关联财经信息的方法与设备
CN109657153B (zh) * 2018-12-28 2020-10-13 丹翰智能科技(上海)有限公司 一种用于确定用户的关联财经信息的方法与设备
CN109902252A (zh) * 2019-01-17 2019-06-18 平安城市建设科技(深圳)有限公司 用户成长体系的管理方法、装置、设备及存储介质
CN110472016A (zh) * 2019-08-16 2019-11-19 腾讯科技(北京)有限公司 文章推荐方法、装置、电子设备及存储介质
CN110472016B (zh) * 2019-08-16 2024-04-12 深圳市雅阅科技有限公司 文章推荐方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN107103049A (zh) 一种推荐方法及网络设备
CN107908740B (zh) 信息输出方法和装置
US20190108184A1 (en) System and method for providing technology assisted data review with optimizing features
Joung et al. Automated keyword filtering in latent Dirichlet allocation for identifying product attributes from online reviews
US20160285672A1 (en) Method and system for processing network media information
CN105556512A (zh) 用于分析关注实体特性的设备、系统以及方法
CN106504011A (zh) 一种业务对象的展示方法和装置
CN109582852B (zh) 一种全文检索结果的排序方法及系统
CN103455522A (zh) 应用程序扩展工具推荐方法及系统
CN104081392A (zh) 社会媒体配置文件的影响评分
CN106503209A (zh) 一种话题热度预测方法及系统
CN110009502B (zh) 理财数据分析方法、装置、计算机设备和存储介质
CN104239335B (zh) 特定用户信息获取方法及装置
CN112528007A (zh) 一种招商项目的目标企业的确认方法及确认装置
CN110910201A (zh) 信息推荐的控制方法、装置、计算机设备及存储介质
Li et al. Robust jump regressions
CN108021713B (zh) 一种文档聚类的方法和装置
CN104077288B (zh) 网页内容推荐方法和网页内容推荐设备
CN111524001A (zh) 用户授信额度的预测方法、装置和相关设备
CN106776757A (zh) 用户完成网银操作的指示方法及装置
CN111291936B (zh) 产品生命周期预估模型生成方法、装置及电子设备
CN103455938A (zh) 一种数据处理方法、装置及服务器设备
CN107644042B (zh) 软件程序点击率预估排序方法及服务器
US10853820B2 (en) Method and apparatus for recommending topic-cohesive and interactive implicit communities in social customer relationship management
CN103312584A (zh) 一种在网络社区中发布信息的方法与设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170829