CN111651678B - 一种基于知识图谱的个性化推荐方法 - Google Patents
一种基于知识图谱的个性化推荐方法 Download PDFInfo
- Publication number
- CN111651678B CN111651678B CN202010558800.0A CN202010558800A CN111651678B CN 111651678 B CN111651678 B CN 111651678B CN 202010558800 A CN202010558800 A CN 202010558800A CN 111651678 B CN111651678 B CN 111651678B
- Authority
- CN
- China
- Prior art keywords
- user
- recommendation
- item
- items
- similarity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 34
- 238000012216 screening Methods 0.000 claims abstract description 10
- 230000008092 positive effect Effects 0.000 claims abstract description 8
- 238000001914 filtration Methods 0.000 claims description 6
- 239000013598 vector Substances 0.000 claims description 6
- 230000006399 behavior Effects 0.000 description 15
- 238000005516 engineering process Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
Abstract
本发明公开了一种基于知识图谱的个性化推荐方法,针对多个用户和多个物品,所述物品具有若干物品属性,所述推荐方法包括:计算物品属性对于物品的重要程度;基于用户行为,计算用户对物品属性的偏好程度;基于用户行为,计算物品与物品之间的物品相似度;对于用户行为中积极行为所作用的物品,筛选出物品相似度最大的若干第一推荐候选物品,预估用户对第一推荐候选物品的第一偏好程度并筛选出第一偏好程度最大的若干第二推荐候选物品。本发明的有益效果为通过知识图谱,在传统推荐算法的基础上,充分展现物品的自身属性和用户的偏好、相似用户,能够给带来精准推荐;通过知识图谱,直观的展现用户的兴趣,能够直观的给出推荐理由。
Description
技术领域
本发明属于个性化推荐领域,具体涉及一种基于知识图谱的个性化推荐方法。
背景技术
随着大数据时代的到来,信息呈现指数爆炸的增长。我们在享受科学技术带来的便利的同时,也在接受、处理、消化很多的信息。然而,我们接触到的信息已远远超出我们的接受范围:新闻软件中的实时更新的新闻、电商软件里的数以百万计的商品、音乐网站的歌曲等等。在解决这种信息过载的问题时,推荐系统起着很大的作用。
推荐系统是帮助用户快速发现感兴趣的信息的工具,主要通过用户的历史行为,充分挖掘用户的兴趣,主动给用户推荐感兴趣或者有用的信息。一个好的推荐系统应当要具有较高的推荐准确率,商品覆盖率,多样性,新颖性,能够给用户带来惊喜等。
目前主流的推荐算法主要分为基于内容的推荐算法和基于协同过滤算法:基于内容的推荐算法通过分析物品自身属性,结合用户的兴趣偏好进行推荐;协同过滤算法主要通过用户对物品的行为信息,挖掘用户的兴趣进行推荐。这两种算法都很出色。随着自然语言处理技术的发展,知识图谱的应用越来越广泛。如果能够把知识图谱与个性化推荐相结合,能够更深入的挖掘用户的兴趣,就会给推荐带来很好的效果。
发明内容
针对现有技术中存在的问题,本发明提供一种基于知识图谱的个性化推荐方法,本发明部分实施例能够给用户更好的物品推荐体验。
为实现上述目的,本发明采用以下技术方案:
一种基于知识图谱的个性化推荐方法,针对多个用户和多个物品,所述物品具有若干物品属性,所述推荐方法包括:计算物品属性对于物品的重要程度;基于用户行为,计算用户对物品属性的偏好程度;基于用户行为,计算物品与物品之间的物品相似度;对于用户行为中积极行为所作用的物品,筛选出物品相似度最大的若干第一推荐候选物品,预估用户对第一推荐候选物品的第一偏好程度并筛选出第一偏好程度最大的若干第二推荐候选物品。
优选地,所述预估用户对第一推荐候选物品的第一偏好程度的方法如下:
其中bij为用户i对物品属性j的偏好程度,Tkj为物品属性j对物品k的重要程度,sk为物品k和积极行为所作用的物品的相似度,pi,k为用户i对物品k的第一偏好程度。
优选地,所述推荐方法包括:基于用户对物品属性的偏好程度,计算用户与用户之间的用户相似度;筛选出用户相似度最大的若干相似用户;获取每个所述相似用户的第二推荐候选物品,并集生成若干第三推荐候选物品;预估用户对第三推荐候选物品的第二偏好程度并筛选出第二偏好程度最大的若干第四推荐候选物品。
优选地,所述预估用户对第三推荐候选物品的第二偏好程度的方法如下:
其中,相似度最大的若干相似用户的集合为Q,相似用户为q,UTi为第三推荐候选物品,QTi={q},q∈Q,QTi为第二推荐候选物品中包括有第三推荐候选物品的相似用户的集合,suq为相似用户q的用户相似度,为相似用户q对第三推荐候选物品UTi的第一偏好程度,/>为用户对第三推荐候选物品的第二偏好程度。
优选地,所述计算用户与用户之间的用户相似度的方法包括:为每一个用户生成一个向量:ui=(bi1,bi2,…,bin)
其中ui表示第i个用户,bij表示用户ui对第j个物品属性的偏好程度;根据用户的向量,计算用户与用户间的余弦相似度:
优选地,所述推荐方法包括:将第二推荐候选物品和/或第四推荐候选物品和/或用户行为中积极行为所作用的物品加入到推荐候选集。
优选地,所述推荐方法包括:对于所述推荐候选集,过滤掉用户发生过点击行为的物品,作为最终推荐结果。
优选地,所述计算物品属性对于物品的重要程度通过tf-idf算法。
与现有技术相比,本发明的有益效果为:
1.通过知识图谱,在传统推荐算法的基础上,充分展现物品的自身属性和用户的偏好、相似用户,能够给带来精准推荐;
2.通过知识图谱,直观的展现用户的兴趣,能够直观的给出推荐理由。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例的流程示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有付出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本实施例提供本发明提出一种基于知识图谱的个性化推荐方法,主要方法如下:
1.根据物品的自身属性,构建物品实体节点。
2.按照预设周期统计用户行为数据,根据用户的行为数据构建用户实体节点。
3.根据用户与物品属性的关系图谱,计算用户与用户的关系图谱,关系为用户与用户的相似度。
4.按照预先设置好的统计周期获取用户行为数据,计算物品与物品之间的相似度,构建物品与物品的关系图谱。
5.根据用户与物品属性的关系图谱,获取推荐候选集
6.根据用户与用户的关系图谱,获取推荐候选集。
7.对推荐候选集中的物品做过滤,生成最终的推荐结果。
进一步地,具体方法包括:
S1.对物品按照自身的属性(比如新闻的类别、标题、关键词、时间等属性,音乐的流派、作曲者、演唱者、出版年代等)构建物品实体节点,具体做法为:
i.根据物品自身属性,抽取信息;
ii.通过tf-idf算法,计算物品对每一个属性的分值,该分值作为该属性对该物品的重要程度。
S2.按照预先设置好的统计周期获取用户行为数据,构建用户与物品属性的关系图谱,具体做法为:
i.根据用户对不同物品的操作行为,例如点击、喜欢、不喜欢、收藏等,按照预设的不同行为的分值,以物品的属性为单位,计算用户对不同属性的行为得分;
ii.用户对所有属性的得分归一化后,每一个得分作为用户对该属性的偏好程度;
iii.构建用户与物品属性的关系图谱,关系为偏好程度。
S3.根据用户与物品属性的关系图谱,计算用户与用户的关系图谱,具体做法为:
i.根据用户对物品属性的偏好程度,为每一个用户生成一个向量:
ui=(bi1,bi2,…,bin)
其中ui表示第i个用户,bij表示用户ui对第j个属性的偏好程度(即归一化后的得分)
ii.根据用户的向量,计算用户与用户间的余弦相似度:
iii.构建用户与用户的关系图谱,关系为余弦相似度。
S4.按照预先设置好的统计周期获取用户行为数据,计算物品与物品之间的相似度,构建物品与物品的关系图谱,具体做法为;
i.统计物品Ti被点击过的用户列表和用户数量,分别记为N(Ti)和|N(Ti)|,统计用户u点击物品Ti的时间,记为
ii.按照下面的公式计算物品间的相似度:
其中α是时间权重;
iii.构建物品与物品的关系图谱,关系为物品相似度。
S5.根据用户与物品属性的关系图谱,获取推荐候选集,具体步骤为:
i.根据物品与物品的关系图谱,对用户点击、喜欢、收藏、关注等通过积极行为作用的物品,获取与其相似的一些物品,按照相似度取前m个,记为T1,T2,…,Tm,对应的相似度记为s1,s2,…,sm;
ii.根据用户对物品属性的得分,预估用户对物品的偏好程度,计算方法如下:
其中bij为用户i对物品属性j的得分,按照S2中步骤获得,Tkj为属性j对物品k的重要程度,按照S1中步骤获得;
iii.对这m个物品,根据预估的偏好程度,进行排序,取前m1个作为推荐候选集。
S6.根据用户与用户的关系图谱,获取推荐候选集,具体步骤为:
i.根据用户与用户的关系图谱,获取与用户u最相似的前Q个用户,与这Q个用户的相似度记为su1,su2,…,suQ;
ii.获取这Q个用户在S5步中产生的推荐候选集结果{UT1,UT2,UTQ},统计每个物品UTi被推荐给的用户QTi={q},q∈Q。
比如S5步中,产生的待推荐物品集合为:
A{a,b,c}
B{a,c,d}
C{a,b,d}
D{a,d,f}
那么S6中,假设UT1是物品d,那么QT1={B,C,D},假设UT2是物品f,那么QT2={D}。
iii.按照如下方式计算用户u对这些推荐候选结果的预估用户对物品的偏好程度:
根据预估的偏好程度,进行排序,取前m2个加入到推荐候选集;
iv.获取这Q个用户的喜欢、收藏、关注等行为物品,加入到推荐候选集中。
S7.在生成的推荐候选集中,对当前用户发生过点击行为的物品做过滤,作为最终推荐结果。
尽管上述实施例已对本发明作出具体描述,但是对于本领域的普通技术人员来说,应该理解为可以在不脱离本发明的精神以及范围之内基于本发明公开的内容进行修改或改进,这些修改和改进都在本发明的精神以及范围之内。
Claims (5)
1.一种基于知识图谱的个性化推荐方法,针对多个用户和多个物品,所述物品具有若干物品属性,其特征在于,所述推荐方法包括:
计算物品属性对于物品的重要程度;
基于用户行为,计算用户对物品属性的偏好程度;
基于用户行为,计算物品与物品之间的物品相似度;
对于用户行为中积极行为所作用的物品,筛选出物品相似度最大的若干第一推荐候选物品,预估用户对第一推荐候选物品的第一偏好程度并筛选出第一偏好程度最大的若干第二推荐候选物品;
所述预估用户对第一推荐候选物品的第一偏好程度的方法如下:
其中bij为用户i对物品属性j的偏好程度,Tkj为物品属性j对物品k的重要程度,sk为物品k和积极行为所作用的物品的相似度,pi,k为用户i对物品k的第一偏好程度;
所述推荐方法包括:
基于用户对物品属性的偏好程度,计算用户与用户之间的用户相似度;筛选出用户相似度最大的若干相似用户;
获取每个所述相似用户的第二推荐候选物品,并集生成若干第三推荐候选物品;
预估用户对第三推荐候选物品的第二偏好程度并筛选出第二偏好程度最大的若干第四推荐候选物品;
所述预估用户对第三推荐候选物品的第二偏好程度的方法如下:
其中,相似度最大的若干相似用户的集合为Q,相似用户为q,UTi为第三推荐候选物品,QTi={q},q∈Q,QTi为第二推荐候选物品中包括有第三推荐候选物品的相似用户的集合,suq为相似用户q的用户相似度,为相似用户q对第三推荐候选物品UTi的第一偏好程度,/>为用户对第三推荐候选物品的第二偏好程度。
2.根据权利要求1所述的基于知识图谱的个性化推荐方法,其特征在于,所述计算用户与用户之间的用户相似度的方法包括:
为每一个用户生成一个向量:
ui=(bi1,bi2,…,bin)
其中ui表示第i个用户,bij表示用户ui对第j个物品属性的偏好程度;
根据用户的向量,计算用户与用户间的余弦相似度:
3.根据权利要求2所述的基于知识图谱的个性化推荐方法,其特征在于,所述推荐方法包括:
将第二推荐候选物品和/或第四推荐候选物品和/或用户行为中积极行为所作用的物品加入到推荐候选集。
4.根据权利要求3所述的基于知识图谱的个性化推荐方法,其特征在于,所述推荐方法包括:
对于所述推荐候选集,过滤掉用户发生过点击行为的物品,作为最终推荐结果。
5.根据权利要求1所述的基于知识图谱的个性化推荐方法,其特征在于,所述计算物品属性对于物品的重要程度通过tf-idf算法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010558800.0A CN111651678B (zh) | 2020-06-18 | 2020-06-18 | 一种基于知识图谱的个性化推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010558800.0A CN111651678B (zh) | 2020-06-18 | 2020-06-18 | 一种基于知识图谱的个性化推荐方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111651678A CN111651678A (zh) | 2020-09-11 |
CN111651678B true CN111651678B (zh) | 2023-12-22 |
Family
ID=72344168
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010558800.0A Active CN111651678B (zh) | 2020-06-18 | 2020-06-18 | 一种基于知识图谱的个性化推荐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111651678B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112035682B (zh) * | 2020-09-28 | 2021-04-20 | 上海松鼠课堂人工智能科技有限公司 | 基于知识图谱的性格模型分析处理方法及系统 |
CN113781147A (zh) * | 2020-11-17 | 2021-12-10 | 北京沃东天骏信息技术有限公司 | 物品推荐方法和装置 |
CN112818222B (zh) * | 2021-01-26 | 2024-02-23 | 吾征智能技术(北京)有限公司 | 一种基于知识图谱的个性化饮食推荐方法及系统 |
CN112950321A (zh) * | 2021-03-10 | 2021-06-11 | 北京汇钧科技有限公司 | 一种物品推荐方法和装置 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102968506A (zh) * | 2012-12-14 | 2013-03-13 | 北京理工大学 | 一种基于扩展特征向量的个性化协同过滤推荐方法 |
CN105574216A (zh) * | 2016-03-07 | 2016-05-11 | 达而观信息科技(上海)有限公司 | 基于概率模型和用户行为分析的个性化推荐方法、系统 |
CN105956146A (zh) * | 2016-05-12 | 2016-09-21 | 腾讯科技(深圳)有限公司 | 一种物品信息的推荐方法及装置 |
CN108733798A (zh) * | 2018-05-17 | 2018-11-02 | 电子科技大学 | 一种基于知识图谱的个性化推荐方法 |
CN108920527A (zh) * | 2018-06-07 | 2018-11-30 | 桂林电子科技大学 | 一种基于知识图谱的个性化推荐方法 |
CN110188208A (zh) * | 2019-06-04 | 2019-08-30 | 河海大学 | 一种基于知识图谱的信息资源查询推荐方法和系统 |
CN110275964A (zh) * | 2019-06-26 | 2019-09-24 | 程淑玉 | 基于知识图谱与循环神经网络的推荐模型 |
CN110390046A (zh) * | 2019-06-04 | 2019-10-29 | 深思考人工智能机器人科技(北京)有限公司 | 一种协同过滤推荐方法及系统 |
CN110472155A (zh) * | 2019-07-03 | 2019-11-19 | 五邑大学 | 基于知识图谱的协同推荐方法、装置、设备和存储介质 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4650541B2 (ja) * | 2008-09-08 | 2011-03-16 | ソニー株式会社 | 推薦装置および方法、プログラム、並びに記録媒体 |
JP6397704B2 (ja) * | 2014-09-19 | 2018-09-26 | 株式会社東芝 | 情報処理装置、情報処理システム、情報処理方法及びプログラム |
-
2020
- 2020-06-18 CN CN202010558800.0A patent/CN111651678B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102968506A (zh) * | 2012-12-14 | 2013-03-13 | 北京理工大学 | 一种基于扩展特征向量的个性化协同过滤推荐方法 |
CN105574216A (zh) * | 2016-03-07 | 2016-05-11 | 达而观信息科技(上海)有限公司 | 基于概率模型和用户行为分析的个性化推荐方法、系统 |
CN105956146A (zh) * | 2016-05-12 | 2016-09-21 | 腾讯科技(深圳)有限公司 | 一种物品信息的推荐方法及装置 |
CN108733798A (zh) * | 2018-05-17 | 2018-11-02 | 电子科技大学 | 一种基于知识图谱的个性化推荐方法 |
CN108920527A (zh) * | 2018-06-07 | 2018-11-30 | 桂林电子科技大学 | 一种基于知识图谱的个性化推荐方法 |
CN110188208A (zh) * | 2019-06-04 | 2019-08-30 | 河海大学 | 一种基于知识图谱的信息资源查询推荐方法和系统 |
CN110390046A (zh) * | 2019-06-04 | 2019-10-29 | 深思考人工智能机器人科技(北京)有限公司 | 一种协同过滤推荐方法及系统 |
CN110275964A (zh) * | 2019-06-26 | 2019-09-24 | 程淑玉 | 基于知识图谱与循环神经网络的推荐模型 |
CN110472155A (zh) * | 2019-07-03 | 2019-11-19 | 五邑大学 | 基于知识图谱的协同推荐方法、装置、设备和存储介质 |
Non-Patent Citations (3)
Title |
---|
基于双层相似度的协同过滤推荐算法;谢毅刚;郭卫斌;李建华;;华东理工大学学报(自然科学版)(01);第141-148页 * |
基于评分偏好和项目属性的协同过滤算法;朱磊;胡沁涵;赵雷;杨季文;;计算机科学(04);第73-79页 * |
袁泉 ; 成振华 ; 江洋 ; .基于知识图谱和协同过滤的电影推荐算法研究.计算机工程与科学.2020,(04),第714-721页. * |
Also Published As
Publication number | Publication date |
---|---|
CN111651678A (zh) | 2020-09-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111651678B (zh) | 一种基于知识图谱的个性化推荐方法 | |
Wang et al. | A sentiment-enhanced hybrid recommender system for movie recommendation: a big data analytics framework | |
Zhou et al. | Atrank: An attention-based user behavior modeling framework for recommendation | |
CN109559208B (zh) | 一种信息推荐方法、服务器及计算机可读介质 | |
Liang et al. | Connecting users and items with weighted tags for personalized item recommendations | |
JP5962926B2 (ja) | レコメンダシステム、レコメンド方法、及びプログラム | |
Zhu et al. | Online purchase decisions for tourism e-commerce | |
WO2018014759A1 (zh) | 一种聚类数据表的展现方法、装置和系统 | |
WO2018040069A1 (zh) | 信息推荐系统及方法 | |
Yin et al. | Exploring social activeness and dynamic interest in community-based recommender system | |
Stanescu et al. | A hybrid recommender system: User profiling from keywords and ratings | |
Angadi et al. | Multimodal sentiment analysis using reliefF feature selection and random forest classifier | |
Yu et al. | Complementary recommendations: A brief survey | |
Sun et al. | Opinion spam detection based on heterogeneous information network | |
CN110851694A (zh) | 基于用户记忆网络和树形结构的深度模型的个性化推荐系统 | |
Abd Rahman et al. | Classification of customer feedbacks using sentiment analysis towards mobile banking applications | |
Xin et al. | When factorization meets heterogeneous latent topics: an interpretable cross-site recommendation framework | |
Goel et al. | Modeling recommendation system for real time analysis of social media dynamics | |
CN114201680A (zh) | 一种向用户推荐营销产品内容的方法 | |
Hu et al. | Utilizing users' tipping points in E-commerce Recommender systems | |
Qiu | A predictive model for customer purchase behavior in e-commerce context | |
Trihatmaja et al. | Improving the performance of collaborative filtering using outlier labeling, clustering, and association rule mining | |
Zheng et al. | Multi-faceted distrust aware recommendation | |
Wang | Application of E-Commerce Recommendation Algorithm in Consumer Preference Prediction | |
Yu et al. | Music Recommendation System Based on Collaborative Filtering Algorithm |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Address after: 201203 rooms 301, 303 and 304, block B, 112 liangxiu Road, Pudong New Area, Shanghai Applicant after: Daguan Data Co.,Ltd. Address before: 201203 rooms 301, 303 and 304, block B, 112 liangxiu Road, Pudong New Area, Shanghai Applicant before: DATAGRAND INFORMATION TECHNOLOGY (SHANGHAI) Co.,Ltd. |
|
CB02 | Change of applicant information | ||
GR01 | Patent grant | ||
GR01 | Patent grant |