CN112528149A - 一种融合知识图谱及贝叶斯网络的智能推荐方法 - Google Patents
一种融合知识图谱及贝叶斯网络的智能推荐方法 Download PDFInfo
- Publication number
- CN112528149A CN112528149A CN202011469979.9A CN202011469979A CN112528149A CN 112528149 A CN112528149 A CN 112528149A CN 202011469979 A CN202011469979 A CN 202011469979A CN 112528149 A CN112528149 A CN 112528149A
- Authority
- CN
- China
- Prior art keywords
- knowledge graph
- bayesian network
- user
- film
- node
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/01—Probabilistic graphical models, e.g. probabilistic networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Computational Mathematics (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Algebra (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Probability & Statistics with Applications (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种融合知识图谱及贝叶斯网络的智能推荐方法,属于智能推荐技术领域。其包括以下步骤:构建专业知识图谱;通过知识图谱嵌入表示技术得到各实体表示向量,并基于实体向量表示计算相似性矩阵;构建贝叶斯网络;采用瀑布式融合方法混合知识图谱与贝叶斯网络的推荐结果。本发明通过知识图谱融合语义信息,快速筛选候选用户,并利用贝叶斯网络综合多元因素,对候选用户评分进行精准预估,有效提升了推荐的准确率和高效性。
Description
技术领域
本发明属于智能推荐技术领域,尤其涉及一种融合知识图谱及贝叶斯网络的智能推荐方法。
背景技术
在推荐系统中,最常见的问题是数据稀疏和冷启动。目前,关于智能推荐的现有技术有以下几种:
申请号为201810657522.7的中国专利公开了一种电视智能推荐方法,指出通过贝叶斯网络综合用户身份,用户使用习惯,用户表情等信息,为用户量身定制推荐,与传统的推荐方法比贝叶斯网络可以综合更多的因素,使得推理结果更加接近用户的真实意愿。该专利还提出,在数据稀疏场景下,采用单一的推荐方法是不可行的。
申请号为202010125908.0的中国专利指出,推荐系统在实际应用场景中经常遇到的用户/物品冷启动问题,如在电影、电商等领域,传统推荐算法会由于新注册用户缺乏与相应物品对应的交互信息而无法进行相关推荐。为此,该专利提出了一种基于知识图谱的冷启动解决方法,构建专业领域知识图谱,融合多源多方面信息,能够更好地表达用户特征。
但是,虽然目前已有一些针对数据稀疏和冷启动场景下智能推荐方法,但是并没有满足该场景下推荐精准性与实时性的权衡,比如贝叶斯网络预测耗时较长。此外,如果单独使用知识图谱,还存在推荐准确性较低的问题。
发明内容
本发明的目的在于克服现有技术的不足,提供一种融合知识图谱及贝叶斯网络的智能推荐方法,该方法能够满足数据稀疏和冷启动场景下,推荐精准性与实时性的需求。
为了实现上述目的,本发明采用的技术方案为:
一种融合知识图谱及贝叶斯网络的智能推荐方法,包括以下步骤:
步骤1:确定电影知识图谱节点类型,包括电影、演员以及用户,抽取电影知识图谱关系数据,包括演员-电影出演关系、用户-电影评价关系,构建专业知识图谱;
步骤2:通过知识图谱嵌入表示方法得到各节点的表示向量,并基于节点表示向量计算相似性矩阵;
步骤3:构建贝叶斯网络,将贝叶斯网络节点分为两类:一类是用于表征结果的影响节点,即用户对电影的评分,另一类是用于表征原因的特征节点,包括用户性别、用户年龄、用户职业、用户邮编、电影年份及电影风格;从电影数据集中抽取用户及项目特征,并进行离散化处理,然后进行贝叶斯网络结构学习和贝叶斯网络参数学习;
步骤4:对于待推荐电影,利用知识图谱查询节点表示向量的相似性矩阵,获取与之相似的电影,并筛选出对相似电影给予3分以上评分的用户,作为候选待推荐用户;
步骤5:基于贝叶斯网络预测候选待推荐用户对待推荐电影的评分,并选择预测评分超过4分的用户作为最终推荐用户。
进一步的,步骤2中所述的知识图谱嵌入表示方法为node2vec方法,node2vec嵌入维度通过交叉验证方法选择。
本发明相比于现有技术的有益效果在于:
1、鉴于推荐系统数据稀疏、冷启动场景下,现有方法无法同时满足准确性以及时效性要求,本发明创新性地提出了融合知识图谱及贝叶斯网络的智能推荐方法。
2、本发明通过知识图谱得到的关系语义信息实现候选用户的快速筛选,并利用瀑布式混合方式,将候选结果传递给贝叶斯网络,综合用户特征、项目特征等多元因素,提高用户评分的预测的精确性。
3、实验证明,本发明在推荐准确率以及时效性方面优于现有推荐方法。
总之,本发明通过知识图谱融合语义信息,快速筛选候选用户,并利用贝叶斯网络对候选用户评分进行精准预估,有效提升了电影推荐的准确率和高效性。
附图说明
图1为本发明实施例中推荐方法的流程图。
图2为本发明实施例中知识图谱表示学习不同嵌入维度的指标图。
具体实施方式
以下结合附图对本发明的技术方案做进一步详述。
如图1所示,一种融合知识图谱及贝叶斯网络的智能推荐方法,该方法基于电影MovieLens 1M数据集实现电影的智能推荐,具体步骤如下:
步骤1:知识抽取,构建专业知识图谱。首先确定电影知识图谱节点类型,包括电影、演员以及用户;其次抽取电影知识图谱关系数据,包括演员-电影出演关系、用户-电影评价关系。
步骤2:利用node2vec算法得到各节点表示向量,并基于节点向量计算相似性矩阵。具体的,通过交叉验证选择node2vec嵌入维度,实验结果如图2所示。可以看出随着表示向量嵌入维度的增加,指标有一定的提升,但维度达到一定的大小时,指标没有继续提升,反而有下降的趋势。这说明表示向量的嵌入维度并不是越大越好,过于复杂可能会引入噪声和干扰数据导致精度反而下降。
步骤3:在电影推荐中,贝叶斯网络选定的特征节点包括:用户性别、用户年龄、用户职业、用户邮编、电影年份及电影风格等。从原始数据中抽取用户及项目特征,并进行离散化处理;基于K2算法实现贝叶斯网络结构学习,采用极大似然估计实现贝叶斯网络参数学习。
步骤4:对于待推荐电影,查询节点向量相似性矩阵,获取与之相似的电影,并筛选出其相似电影中评分较高的用户,作为候选待推荐用户;
步骤5:基于贝叶斯网络预测候选待推荐用户的评分,并按照是否超过4分给出最终推荐列表。
步骤4和步骤5采用了瀑布式融合方法混合知识图谱与贝叶斯网络进行结果推荐。其中,瀑布式融合方式为利用知识图谱获取的TopK近邻快速缩小候选用户或电影,基于贝叶斯网络预测筛选TopK近邻的用户评分,以实现推荐效率与准确率的均衡。
最后,在电影MovieLens 1M数据集上,与推荐领域常用算法基于因子分解机的推荐、基于xgboost-lr的推荐、基于贝叶斯网络的推荐对比,评估本方法的精度与效率,实验结果表1所示。
表1推荐算法精度与效率对比
可以看出在电影MovieLens 1M数据集上,本方法在精度、召回率上都优于其他三种算法,同时计算效率相比较基于贝叶斯网络的推荐具有明显提升,验证了本方法的有效性及高效性。
需要强调的是,本发明所述的实施例是说明性的,而不是限定性的,因此本发明包括并不限于具体实施方式中所述的实施例,凡是由本领域技术人员根据本发明的技术方案得出的其他实施方式,同样属于本发明保护的范围。
Claims (2)
1.一种融合知识图谱及贝叶斯网络的智能推荐方法,其特征在于,包括以下步骤:
步骤1:确定电影知识图谱节点类型,包括电影、演员以及用户,抽取电影知识图谱关系数据,包括演员-电影出演关系、用户-电影评价关系,构建专业知识图谱;
步骤2:通过知识图谱嵌入表示方法得到各节点的表示向量,并基于节点表示向量计算相似性矩阵;
步骤3:构建贝叶斯网络,将贝叶斯网络节点分为两类:一类是用于表征结果的影响节点,即用户对电影的评分,另一类是用于表征原因的特征节点,包括用户性别、用户年龄、用户职业、用户邮编、电影年份及电影风格;从电影数据集中抽取用户及项目特征,并进行离散化处理,然后进行贝叶斯网络结构学习和贝叶斯网络参数学习;
步骤4:对于待推荐电影,利用知识图谱查询节点表示向量的相似性矩阵,获取与之相似的电影,并筛选出对相似电影给予3分以上评分的用户,作为候选待推荐用户;
步骤5:基于贝叶斯网络预测候选待推荐用户对待推荐电影的评分,并选择预测评分超过4分的用户作为最终推荐用户。
2.根据权利要求1所述的一种融合知识图谱及贝叶斯网络的智能推荐方法,其特征在于,步骤2中所述的知识图谱嵌入表示方法为node2vec方法,node2vec嵌入维度通过交叉验证方法选择。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011469979.9A CN112528149A (zh) | 2020-12-15 | 2020-12-15 | 一种融合知识图谱及贝叶斯网络的智能推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011469979.9A CN112528149A (zh) | 2020-12-15 | 2020-12-15 | 一种融合知识图谱及贝叶斯网络的智能推荐方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112528149A true CN112528149A (zh) | 2021-03-19 |
Family
ID=74999698
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011469979.9A Pending CN112528149A (zh) | 2020-12-15 | 2020-12-15 | 一种融合知识图谱及贝叶斯网络的智能推荐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112528149A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113420163A (zh) * | 2021-06-25 | 2021-09-21 | 中国人民解放军国防科技大学 | 基于矩阵融合的异构信息网知识图谱补全方法和装置 |
CN114745427A (zh) * | 2022-03-14 | 2022-07-12 | 北京科东电力控制系统有限责任公司 | 一种基于知识图谱的监控业务信息情境推送方法及装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110275964A (zh) * | 2019-06-26 | 2019-09-24 | 程淑玉 | 基于知识图谱与循环神经网络的推荐模型 |
CN110516160A (zh) * | 2019-08-30 | 2019-11-29 | 中国科学院自动化研究所 | 基于知识图谱的用户建模方法、序列推荐方法 |
-
2020
- 2020-12-15 CN CN202011469979.9A patent/CN112528149A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110275964A (zh) * | 2019-06-26 | 2019-09-24 | 程淑玉 | 基于知识图谱与循环神经网络的推荐模型 |
CN110516160A (zh) * | 2019-08-30 | 2019-11-29 | 中国科学院自动化研究所 | 基于知识图谱的用户建模方法、序列推荐方法 |
Non-Patent Citations (1)
Title |
---|
侯位昭等: "《融合知识图谱及贝叶斯网络的智能推荐方法》", 《中国电子科学研究院学报》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113420163A (zh) * | 2021-06-25 | 2021-09-21 | 中国人民解放军国防科技大学 | 基于矩阵融合的异构信息网知识图谱补全方法和装置 |
CN114745427A (zh) * | 2022-03-14 | 2022-07-12 | 北京科东电力控制系统有限责任公司 | 一种基于知识图谱的监控业务信息情境推送方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Ning et al. | A comprehensive survey of neighborhood-based recommendation methods | |
CN108776676B (zh) | 信息推荐方法、装置、计算机可读介质及电子设备 | |
CN110879864A (zh) | 一种基于图神经网络和注意力机制的上下文推荐方法 | |
CN110909182A (zh) | 多媒体资源搜索方法、装置、计算机设备及存储介质 | |
CN113792212B (zh) | 多媒体资源推荐方法、装置、设备以及存储介质 | |
CN112100489A (zh) | 对象推荐的方法、装置和计算机存储介质 | |
CN112528149A (zh) | 一种融合知识图谱及贝叶斯网络的智能推荐方法 | |
Singh et al. | A survey on the generation of recommender systems | |
Ding et al. | Geographical feature extraction for entities in location-based social networks | |
CN115168744A (zh) | 基于用户画像和知识图谱的广电技术知识推荐方法 | |
Cheung et al. | Characterizing user connections in social media through user-shared images | |
Liu et al. | Collaborative prediction for multi-entity interaction with hierarchical representation | |
KR101738809B1 (ko) | IoT 기반 스마트 홈 커뮤니티에서 소셜 매칭 및 소통 서비스를 위한 다차원매트릭스 지역화 방법 및 시스템 | |
CN111737584B (zh) | 行为预测系统的更新方法及装置 | |
CN111177570B (zh) | 对象推荐方法及系统 | |
Xinchang et al. | Movie recommendation algorithm using social network analysis to alleviate cold-start problem | |
CN108205551B (zh) | 一种歌曲推荐方法和歌曲推荐系统 | |
CN108427730A (zh) | 一种基于随机游走和条件随机场的社会标签推荐方法 | |
CN110727853B (zh) | 向用户呈现控制的异构数字内容 | |
CN109063052B (zh) | 一种基于时间熵的个性化推荐方法及装置 | |
Khalid et al. | Scalable and practical One-Pass clustering algorithm for recommender system | |
CN111125541B (zh) | 面向多用户的可持续多云服务组合的获取方法 | |
KR102323424B1 (ko) | 관측평점과 유사도 그래프를 활용한 추천 알고리즘의 평점 예측 방법 | |
CN114547440A (zh) | 基于互联网大数据的用户画像挖掘方法及人工智能云系统 | |
CN114332472A (zh) | 一种基于图神经网络的数据处理方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210319 |