CN114996490A - 电影推荐方法、系统、存储介质及设备 - Google Patents

电影推荐方法、系统、存储介质及设备 Download PDF

Info

Publication number
CN114996490A
CN114996490A CN202210919539.1A CN202210919539A CN114996490A CN 114996490 A CN114996490 A CN 114996490A CN 202210919539 A CN202210919539 A CN 202210919539A CN 114996490 A CN114996490 A CN 114996490A
Authority
CN
China
Prior art keywords
movie
movies
similarity
user
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210919539.1A
Other languages
English (en)
Inventor
李介
陶清华
张恒星
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangxi Zhongye Intelligent Technology Co ltd
Original Assignee
Jiangxi Zhongye Intelligent Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangxi Zhongye Intelligent Technology Co ltd filed Critical Jiangxi Zhongye Intelligent Technology Co ltd
Priority to CN202210919539.1A priority Critical patent/CN114996490A/zh
Publication of CN114996490A publication Critical patent/CN114996490A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/48Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • G06F16/435Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/73Querying
    • G06F16/735Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/7867Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, title and artist information, manually generated time, location and usage information, user ratings
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/761Proximity, similarity or dissimilarity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/80Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Library & Information Science (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提出一种电影推荐方法、系统、存储介质及设备,方法包括:基于电影知识图谱生成各电影的嵌入向量,计算两个电影之间的相似度以得到第一相似度,根据用户的观影评分构建用户评分矩阵,并计算任意两个电影之间的相似度以得到第二相似度;对第一相似度及第二相似度进行融合以得到最终相似度,并生成电影相似度矩阵;根据电影相似度矩阵和用户评分矩阵对用户的所有未评价的电影进行评分预测以得到用户对未评价电影的预测评分;根据用户对未评价电影的预测评分生成用户的电影推荐集并推荐给用户。本发明的电影推荐方法能够解决数据稀疏性的问题,还能对未形成足够观影数据的新电影进行有针对性的有效推荐,以解决新电影冷启动的问题。

Description

电影推荐方法、系统、存储介质及设备
技术领域
本发明涉及电影推荐领域,特别是涉及一种电影推荐方法、系统、存储介质及设备。
背景技术
随着大数据时代的到来,网络信息数据呈现指数级增长,而其中也充斥着大量的垃圾信息,从而造成了信息过载,推荐机制是一种能为用户提供有效信息筛选的技术。不需要用户提供明确的需求,是通过分析用户对物品的行为信息,挖掘出用户的个性化需求,再通过用户的兴趣模型主动向用户提供满足其需求的信息,因其能够挖掘用户兴趣的特点,已经成为了为用户提供个性化服务的一个重要研究主题,并在电影领域也得到了广泛的应用。
传统的电影推荐机制通常是采用协同过滤的方式进行,但这种推荐方式会由于用户行为过少,使得用户行为矩阵过于稀疏而导致推荐的电影无法很好的满足用户需求及偏好,推荐效果不好,并且存在无法推荐新电影的冷启动问题。因此,急需提供一种新型的电影推荐方法来更好的满足用户及市场的需求。
发明内容
本发明的目的在于提出一种电影推荐方法、系统、存储介质及设备,以解决上述背景技术中的问题。
本发明提出一种电影推荐方法,所述方法包括:
对电影数据库中电影的相关概念进行知识抽取以得到电影的各实体及对应的关系,并将电影的各实体及对应的关系填充至知识图谱的数据层中以形成电影知识图谱;
基于所述电影知识图谱将电影的实体及关系映射到多维空间以得到电影的嵌入向量,并根据各电影的嵌入向量对任意两个电影之间的相似度进行计算以得到第一相似度;
根据用户的观影评分对电影进行向量化表示以生成电影的评分向量并构建用户评分矩阵,再根据各电影的评分向量对任意两个电影之间的相似度进行计算以得到第二相似度;
对任意两个电影的所述第一相似度及所述第二相似度进行融合以得到任意两个电影的最终相似度,并根据各电影之间的最终相似度生成电影相似度矩阵;
根据所述电影相似度矩阵和用户评分矩阵对用户的所有未评价的电影进行评分预测以得到用户对未评价电影的预测评分;
根据用户对未评价电影的预测评分对用户的所有未观看的电影进行排序并生成用户的电影推荐集,将所述用户的电影推荐集中排序靠前的预设数量部电影推荐给用户。
根据本发明提出的电影推荐方法,具有以下有益效果:
本发明的电影推荐方法将基于电影知识图谱的相似度和基于用户观影行为的相似度进行融合以得到电影之间的最终相似度,能够弥补协同过滤算法忽略电影本身内容信息的缺陷,再根据电影相似度矩阵和用户评分矩阵对用户的所有未评价的电影进行评分预测以得到用户对未评价电影的预测评分,来完善补充用户对所有没看过电影的评分,再根据用户对所有没看过电影评分的排序来针对用户进行电影推荐,这种推荐机制不仅能够解决数据稀疏性的问题,还能对未形成足够观影数据的新电影进行有针对性的有效推荐,以解决新电影冷启动的问题。
另外,根据本发明提供的电影推荐方法,还可以具有如下附加的技术特征:
进一步地,所述根据所述电影相似度矩阵和用户评分矩阵对用户的所有未评价的电影进行评分预测以得到用户对未评价电影的预测评分的步骤具体包括:
从电影数据库中获取目标用户的所有未评价的电影以生成目标用户的未评价电影集并从所述目标用户的未评价电影集中提取目标电影;
从所述电影相似度矩阵中获取目标电影与其他所有电影之间的相似度并按照相似度的大小对电影进行排序;
获取排在前面的k个电影并生成所述目标电影的最相似电影集;
将所述目标电影的最相似电影集与目标用户评论过的电影集进行交集以生成目标电影的参考电影集;
对所述目标电影的参考电影集中各电影的权值进行计算;
根据所述目标电影的参考电影集从所述用户评分矩阵中获取目标用户对所述目标电影的参考电影集中各电影的评分;
根据所述目标电影的参考电影集中各电影的权值及目标用户对所述目标电影的参考电影集中各电影的评分进行评分加权和计算以得到目标用户对目标电影的预测评分;
依次计算目标用户对所述目标用户的未评价电影集中各电影的预测评分。
进一步地,所述根据用户对未评价电影的预测评分对用户的所有未观看的电影进行排序并生成用户的电影推荐集,将所述用户的电影推荐集中排序靠前的预设数量部电影推荐给用户的步骤具体包括:
从电影数据库中获取目标用户的所有已观看的电影并生成目标用户的已观看电影集;
对所述目标用户的未评价电影集与所述目标用户的已观看电影集进行交集以获得交集电影;
将所述目标用户的未评价电影集中的交集电影进行删除并按照预测评分的高低进行排序以生成目标用户的电影推荐集;
将所述目标用户的电影推荐集中排序靠前的预设数量部电影推荐给目标用户。
进一步地,所述对所述目标电影的参考电影集中各电影的权值进行计算的步骤具体包括:
获取所述目标电影的参考电影集中各电影与目标电影的相似度值;
将所述目标电影的参考电影集中各电影与目标电影的相似度值分别依次与所述目标电影的参考电影集中各电影与目标电影的相似度值之和进行相除,以得到所述目标电影的参考电影集中各电影的权值;
所述根据所述目标电影的参考电影集中各电影的权值及目标用户对所述目标电影的参考电影集中各电影的评分进行评分加权和计算以得到目标用户对目标电影的预测评分的步骤具体包括:
将所述目标电影的参考电影集中各电影的权值分别依次与目标用户对所述目标电影的参考电影集中各电影的评分进行对应相乘再累加在一起以得到目标用户对目标电影的预测评分。
进一步地,所述对任意两个电影的所述第一相似度及所述第二相似度进行融合以得到任意两个电影的最终相似度,并根据各电影之间的最终相似度生成电影相似度矩阵的步骤具体包括:
根据融合因子对任意两个电影的所述第一相似度及所述第二相似度进行加权以得到任意两个电影的最终相似度,计算公式为:
Figure 53915DEST_PATH_IMAGE001
其中,
Figure 345698DEST_PATH_IMAGE002
为电影i和电影j的最终相似度,
Figure 682002DEST_PATH_IMAGE003
为融合因子,
Figure 204250DEST_PATH_IMAGE003
的取值范围为[0,1],
Figure 247292DEST_PATH_IMAGE004
为电影i和电影j的第一相似度,
Figure 196794DEST_PATH_IMAGE005
为电影i和电影j的第二相似度;
根据各电影之间的最终相似度生成电影相似度矩阵。
进一步地,所述基于所述电影知识图谱将电影的实体及关系映射到多维空间以得到电影的嵌入向量,并根据各电影的嵌入向量对任意两个电影之间的相似度进行计算以得到第一相似度的步骤具体包括:
基于所述电影知识图谱将电影的实体及关系映射到多维空间中以得到电影的嵌入向量;
根据各电影的嵌入向量计算任意两个电影之间的欧几里得距离;
根据两个电影之间的欧几里得距离计算两个电影之间的相似度以得到两个电影的第一相似度。
进一步地,所述根据用户的观影评分对电影进行向量化表示以生成电影的评分向量并构建用户评分矩阵,再根据各电影的评分向量对任意两个电影之间的相似度进行计算以得到第二相似度的步骤具体包括:
根据各用户的观影评分对每个电影进行向量化表示以生成各电影的评分向量并构建用户评分矩阵;
根据各电影的评分向量计算任意两个电影之间的余弦相似度以得到任意两个电影的第二相似度。
本发明还提出一种电影推荐系统,包括:
知识图谱模块:用于对电影数据库中电影的相关概念进行知识抽取以得到电影的各实体及对应的关系,并将电影的各实体及对应的关系填充至知识图谱的数据层中以形成电影知识图谱;
第一计算模块:用于基于所述电影知识图谱将电影的实体及关系映射到多维空间以得到电影的嵌入向量,并根据各电影的嵌入向量对任意两个电影之间的相似度进行计算以得到第一相似度;
第二计算模块:用于根据用户的观影评分对电影进行向量化表示以生成电影的评分向量并构建用户评分矩阵,再根据各电影的评分向量对任意两个电影之间的相似度进行计算以得到第二相似度;
融合模块:用于对任意两个电影的所述第一相似度及所述第二相似度进行融合以得到任意两个电影的最终相似度,并根据各电影之间的最终相似度生成电影相似度矩阵;
预测模块:用于根据所述电影相似度矩阵和用户评分矩阵对用户的所有未评价的电影进行评分预测以得到用户对未评价电影的预测评分;
推荐模块:用于根据用户对未评价电影的预测评分对用户的所有未观看的电影进行排序并生成用户的电影推荐集,将所述用户的电影推荐集中排序靠前的预设数量部电影推荐给用户。
本发明还提出一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述的电影推荐方法。
本发明还提出一种电影推荐设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述的电影推荐方法。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1为本发明第一实施例电影推荐方法的流程图;
图2为本发明第二实施例电影推荐系统的系统框图;
图3为本发明第三实施例电影推荐设备的结构示意图。
具体实施方式
为使本发明的目的、特征和优点能够更加明显易懂,下面结合附图对本发明的具体实施方式做详细的说明。附图中给出了本发明的若干实施例。但是,本发明可以以许多不同的形式来实现,并不限于本文所描述的实施例。相反地,提供这些实施例的目的是使对本发明的公开内容更加透彻全面。
实施例1
如图1所示,本发明的实施例提供一种电影推荐方法,包括步骤S101~S106。
S101,对电影数据库中电影的相关概念进行知识抽取以得到电影的各实体及对应的关系,并将电影的各实体及对应的关系填充至知识图谱的数据层中以形成电影知识图谱,其中,所述电影知识图谱的节点为电影实体,所述电影知识图谱的边为关系。
具体的,本发明实施例使用mapping系统进行知识抽取,先将对RDF的查询转化为SQL语句并输入至关系数据库,由关系数据库使用D2R转换为RDF三元组进行知识抽取。电影的实体包括电影名、电影类型、语言、上映日期、国家、导演、演员、编剧等。
S102,基于所述电影知识图谱将电影的实体及关系映射到多维空间以得到电影的嵌入向量,并根据各电影的嵌入向量对任意两个电影之间的相似度进行计算以得到第一相似度。
进一步地,所述基于所述电影知识图谱将电影的实体及关系映射到多维空间以得到电影的嵌入向量,并根据各电影的嵌入向量对任意两个电影之间的相似度进行计算以得到第一相似度的步骤具体包括:
基于所述电影知识图谱将电影的实体及关系映射到多维空间中以得到电影的嵌入向量,具体为:通过训练后的TransE翻译模型将电影知识图谱中的结构化知识表示为无向图,以得到电影的实体向量的嵌入式表示,设为电影的嵌入向量;
根据各电影的嵌入向量计算任意两个电影之间的欧几里得距离;
根据两个电影之间的欧几里得距离计算两个电影之间的相似度以得到两个电影的第一相似度。
需要说明的是,训练TransE翻译模型时,对所有样本来说,TransE优化的目标函数为
Figure 754814DEST_PATH_IMAGE006
,其中,S表示为知识图谱中三元组集合,S'表示为对三元组(h,r,t)生成的负例三元组集合,γ表示为正负样本间距的大小,一般设置为1,h表示为正样本集中的头实体,r表示为正样本集中的关系,t表示为正样本集中的尾实体,vh表示为正样本集中的头实体向量,vt表示为正样本集中的尾实体向量,h'表示为负样本集中的头实体,r'表示为负样本集中的关系,t'表示为负样本集中的尾实体,vh'表示为负样本集中的头实体向量,vt'表示为负样本集中的尾实体向量。训练过程使得正例的评分函数趋近于0,负例的评分函数趋近于无穷大,错误三元组的抽取使用均匀抽样或伯努利抽样的方式。在对目标函数中的参数进行更新时,我们采用反向传播算法计算偏导数。算法通过不断地迭代来更新模型中的参数,直到收敛或者达到最大迭代次数,即训练完成。训练完成后,我们就通过训练后的TransE翻译模型将电影知识图谱中的结构化知识表示为无向图,以得到电影的实体向量的嵌入式表示。
本发明实施例通过上述步骤对两个电影之间的语义相似度进行计算,电影i的m维的嵌入向量表示为:
Figure 80753DEST_PATH_IMAGE007
,其中,
Figure 978302DEST_PATH_IMAGE008
表示电影i的嵌入向量在第k维上的值,电影j的m维的嵌入向量表示为:
Figure 98705DEST_PATH_IMAGE009
,其中,
Figure 409601DEST_PATH_IMAGE010
表示电影j的嵌入向量在第d维上的值。电影i与电影j之间的欧几里得距离的计算公式为
Figure 273651DEST_PATH_IMAGE011
,电影i与电影j之间的第一相似度的计算公式为
Figure 524242DEST_PATH_IMAGE012
,其中,
Figure 81125DEST_PATH_IMAGE013
的值越大,越接近于1,电影i与电影j的语义相似度越大,当
Figure 613738DEST_PATH_IMAGE014
的值接近于0时,电影i与电影j几乎完全不同。
S103,根据用户的观影评分对电影进行向量化表示以生成电影的评分向量并构建用户评分矩阵,再根据各电影的评分向量对任意两个电影之间的相似度进行计算以得到第二相似度。
进一步地,所述根据用户的观影评分对电影进行向量化表示以生成电影的评分向量并构建用户评分矩阵,再根据各电影的评分向量对任意两个电影之间的相似度进行计算以得到第二相似度的步骤具体包括:
根据各用户的观影评分对每个电影进行向量化表示以生成各电影的评分向量并构建用户评分矩阵;
根据各电影的评分向量计算任意两个电影之间的余弦相似度以得到任意两个电影的第二相似度。
需要具体说明的是,根据m个用户对电影i的观影评分,将电影i表示为一个m维的评分向量:
Figure 15900DEST_PATH_IMAGE015
,其中,
Figure 888041DEST_PATH_IMAGE016
为电影i的评分向量在第k维上的值,用来表示用户k对电影i的评分,若用户k没有对电影i进行评分,则
Figure 615826DEST_PATH_IMAGE016
的值为0;根据m个用户对电影j的观影评分,将电影j表示为一个m维的评分向量:
Figure 635734DEST_PATH_IMAGE017
,其中,
Figure 576009DEST_PATH_IMAGE018
为电影j的评分向量在第d维上的值,用来表示用户d对电影j的评分,若用户d没有对电影j进行评分,则
Figure 568235DEST_PATH_IMAGE018
的值为0。以此类推,根据各用户的观影评分构建一个用户评分矩阵,假设电影推荐系统内有m个用户及n部电影,可以构建一个mxn维的用户评分矩阵
Figure 263659DEST_PATH_IMAGE019
Figure 708547DEST_PATH_IMAGE020
。根据电影i及电影j的评分向量,并利用余弦相似度计算电影i与电影j之间的第二相似度
Figure 953977DEST_PATH_IMAGE021
S104,对任意两个电影的所述第一相似度及所述第二相似度进行融合以得到任意两个电影的最终相似度,并根据各电影之间的最终相似度生成电影相似度矩阵。
进一步地,所述对任意两个电影的所述第一相似度及所述第二相似度进行融合以得到任意两个电影的最终相似度,并根据各电影之间的最终相似度生成电影相似度矩阵的步骤具体包括:
根据融合因子对任意两个电影的所述第一相似度及所述第二相似度进行加权以得到任意两个电影的最终相似度,算法为:
Figure 66289DEST_PATH_IMAGE001
其中,
Figure 667035DEST_PATH_IMAGE002
为电影i和电影j的最终相似度,
Figure 864798DEST_PATH_IMAGE003
为融合因子,
Figure 146875DEST_PATH_IMAGE003
的取值范围为[0,1],
Figure 113694DEST_PATH_IMAGE004
为电影i和电影j的第一相似度,
Figure 885341DEST_PATH_IMAGE005
为电影i和电影j的第二相似度;
根据各电影之间的最终相似度生成电影相似度矩阵,生成的电影相似度矩阵为:
Figure 304821DEST_PATH_IMAGE022
,其中,
Figure 656168DEST_PATH_IMAGE023
表示电影i和电影j的最终相似度,且
Figure 274231DEST_PATH_IMAGE024
,当i=j时,
Figure 685620DEST_PATH_IMAGE025
S105,根据所述电影相似度矩阵和用户评分矩阵对用户的所有未评价的电影进行评分预测以得到用户对未评价电影的预测评分。
进一步地,所述根据所述电影相似度矩阵和用户评分矩阵对用户的所有未评价的电影进行评分预测以得到用户对未评价电影的预测评分的步骤具体包括:
从电影数据库中获取目标用户的所有未评价的电影以生成目标用户的未评价电影集并从所述目标用户的未评价电影集中提取目标电影;
从所述电影相似度矩阵中获取目标电影与其他所有电影之间的相似度并按照相似度的大小对电影进行排序;
获取排在前面的k个电影并生成所述目标电影的最相似电影集;
将所述目标电影的最相似电影集与目标用户评论过的电影集进行交集以生成目标电影的参考电影集;
对所述目标电影的参考电影集中各电影的权值进行计算;
根据所述目标电影的参考电影集从所述用户评分矩阵中获取目标用户对所述目标电影的参考电影集中各电影的评分;
根据所述目标电影的参考电影集中各电影的权值及目标用户对所述目标电影的参考电影集中各电影的评分进行评分加权和计算以得到目标用户对目标电影的预测评分;
依次计算目标用户对所述目标用户的未评价电影集中各电影的预测评分。
进一步地,所述对所述目标电影的参考电影集中各电影的权值进行计算的步骤具体包括:
获取所述目标电影的参考电影集中各电影与目标电影的相似度值;
将所述目标电影的参考电影集中各电影与目标电影的相似度值分别依次与所述目标电影的参考电影集中各电影与目标电影的相似度值之和进行相除,以得到所述目标电影的参考电影集中各电影的权值;
所述根据所述目标电影的参考电影集中各电影的权值及目标用户对所述目标电影的参考电影集中各电影的评分进行评分加权和计算以得到目标用户对目标电影的预测评分的步骤具体包括:
将所述目标电影的参考电影集中各电影的权值分别依次与目标用户对所述目标电影的参考电影集中各电影的评分进行对应相乘再累加在一起以得到目标用户对目标电影的预测评分。
需要具体说明的是,用户u对电影i的预测评分的计算公式为:
Figure 90932DEST_PATH_IMAGE026
,其中,
Figure 714811DEST_PATH_IMAGE027
表示为用户u对电影i的预测评分,
Figure 452960DEST_PATH_IMAGE028
表示为电影i和电影j的最终相似度,
Figure 769672DEST_PATH_IMAGE029
表示为用户评分矩阵中的用户u对电影j的评分。
本发明实施例先获取与目标电影相似度高的前k个电影,再从这些电影中提取目标用户已经评价过电影,并根据与目标电影的相似度计算这些电影所占的权重,与目标电影的相似度越高,电影所占权重越高,再将各电影的权值对应乘以目标用户的对各电影的历史评分,便得到目标用户对目标电影的预测评分,这样得到的预测评分更能反映用户的评分倾向。在以后用户做出观影评分之后,再根据用户对目标电影的真实评分来替换预测评分,以完善电影数据库中的信息,为其他电影的推荐提供更完善真实的参考数据。
S106,根据用户对未评价电影的预测评分对用户的所有未观看的电影进行排序并生成用户的电影推荐集,将所述用户的电影推荐集中排序靠前的预设数量部电影推荐给用户。
进一步地,所述根据用户对未评价电影的预测评分对用户的所有未观看的电影进行排序并生成用户的电影推荐集,将所述用户的电影推荐集中排序靠前的预设数量部电影推荐给用户的步骤具体包括:
从电影数据库中获取目标用户的所有已观看的电影并生成目标用户的已观看电影集;
对所述目标用户的未评价电影集与所述目标用户的已观看电影集进行交集以获得交集电影;
将所述目标用户的未评价电影集中的交集电影进行删除并按照预测评分的高低进行排序以生成目标用户的电影推荐集;
将所述目标用户的电影推荐集中排序靠前的预设数量部电影推荐给目标用户。
需要说明的是,对一个电影推荐系统而言其融合因子
Figure 163744DEST_PATH_IMAGE003
是定值,且可以通过启发式的方法进行调整确定,确定融合因子
Figure 591314DEST_PATH_IMAGE003
的方法为:从[0,1]的值区间任取一融合值,优选值为0.5,再根据本实施例的电影推荐方法将融合值代入计算电影的最终相似度的算法中并对融合值进行不断校验,直至确定最佳融合值并定为融合因子。融合值的具体校验步骤为:将融合值代入计算电影的最终相似度的算法中并根据融合值获取第一目标用户的电影推荐集;将所述第一目标用户的电影推荐集中排序靠前的预设数量部电影推荐给第一目标用户,并判断推荐的预设数量部电影是否大部分符合第一目标用户的真实观影喜好;若推荐的预设数量部电影大部分不符合第一目标用户的真实观影喜好,则对融合值进行调大或调小并将调整后的融合值继续代入计算电影的最终相似度的算法中,直至将最符合第一目标用户的真实观影喜好的预设数量部电影推荐给第一目标用户,这里的第一目标用户优选为校验人员。通过这种方式确定的融合因子能够大大提高该电影推荐系统的推荐的准确性及有效性。
综上,本发明提供的一种电影推荐方法,有益效果在于:本发明的电影推荐方法将基于电影知识图谱的相似度和基于用户观影行为的相似度进行融合以得到电影之间的最终相似度,能够弥补协同过滤算法忽略电影本身内容信息的缺陷,再根据电影相似度矩阵和用户评分矩阵对用户的所有未评价的电影进行评分预测以得到用户对未评价电影的预测评分,来完善补充用户对所有没看过电影的评分,再根据用户对所有没看过电影评分的排序来针对用户进行电影推荐,这种推荐机制不仅能够解决数据稀疏性的问题,还能对未形成足够观影数据的新电影进行有针对性的有效推荐,以解决新电影冷启动的问题。
实施例2
请参考图2,本实施例提供一种电影推荐系统,包括:
知识图谱模块:用于对电影数据库中电影的相关概念进行知识抽取以得到电影的各实体及对应的关系,并将电影的各实体及对应的关系填充至知识图谱的数据层中以形成电影知识图谱,其中,所述电影知识图谱的节点为电影实体,所述电影知识图谱的边为实体间的关系。
第一计算模块:用于基于所述电影知识图谱将电影的实体及关系映射到多维空间以得到电影的嵌入向量,并根据各电影的嵌入向量对任意两个电影之间的相似度进行计算以得到第一相似度。
所述第一计算模块还用于:
基于所述电影知识图谱将电影的实体及关系映射到多维空间中以得到电影的嵌入向量;
根据各电影的嵌入向量计算任意两个电影之间的欧几里得距离;
根据两个电影之间的欧几里得距离计算两个电影之间的相似度以得到两个电影的第一相似度。
第二计算模块:用于根据用户的观影评分对电影进行向量化表示以生成电影的评分向量并构建用户评分矩阵,再根据各电影的评分向量对任意两个电影之间的相似度进行计算以得到第二相似度。
所述第二计算模块还用于:
根据各用户的观影评分对每个电影进行向量化表示以生成各电影的评分向量并构建用户评分矩阵;
根据各电影的评分向量计算任意两个电影之间的余弦相似度以得到任意两个电影的第二相似度。
融合模块:用于对任意两个电影的所述第一相似度及所述第二相似度进行融合以得到任意两个电影的最终相似度,并根据各电影之间的最终相似度生成电影相似度矩阵。
所述融合模块还用于:
根据融合因子对任意两个电影的所述第一相似度及所述第二相似度进行加权以得到任意两个电影的最终相似度,计算公式为:
Figure 387232DEST_PATH_IMAGE001
其中,
Figure 937162DEST_PATH_IMAGE002
为电影i和电影j的最终相似度,
Figure 818530DEST_PATH_IMAGE003
为融合因子,
Figure 784212DEST_PATH_IMAGE003
的取值范围为[0,1],
Figure 231374DEST_PATH_IMAGE004
为电影i和电影j的第一相似度,
Figure 656933DEST_PATH_IMAGE005
为电影i和电影j的第二相似度;
根据各电影之间的最终相似度生成电影相似度矩阵,生成的电影相似度矩阵为:
Figure 760018DEST_PATH_IMAGE022
,其中,
Figure 794970DEST_PATH_IMAGE023
表示电影i和电影j的最终相似度,且
Figure 96638DEST_PATH_IMAGE024
,当i=j时,
Figure 191633DEST_PATH_IMAGE025
预测模块:用于根据所述电影相似度矩阵和用户评分矩阵对用户的所有未评价的电影进行评分预测以得到用户对未评价电影的预测评分。
所述预测模块还用于:
从电影数据库中获取目标用户的所有未评价的电影以生成目标用户的未评价电影集并从所述目标用户的未评价电影集中提取目标电影;
从所述电影相似度矩阵中获取目标电影与其他所有电影之间的相似度并按照相似度的大小对电影进行排序;
获取排在前面的k个电影并生成所述目标电影的最相似电影集;
将所述目标电影的最相似电影集与目标用户评论过的电影集进行交集以生成目标电影的参考电影集;
对所述目标电影的参考电影集中各电影的权值进行计算;
根据所述目标电影的参考电影集从所述用户评分矩阵中获取目标用户对所述目标电影的参考电影集中各电影的评分;
根据所述目标电影的参考电影集中各电影的权值及目标用户对所述目标电影的参考电影集中各电影的评分进行评分加权和计算以得到目标用户对目标电影的预测评分;
依次计算目标用户对所述目标用户的未评价电影集中各电影的预测评分。
所述预测模块还用于:
获取所述目标电影的参考电影集中各电影与目标电影的相似度值;
将所述目标电影的参考电影集中各电影与目标电影的相似度值分别依次与所述目标电影的参考电影集中各电影与目标电影的相似度值之和进行相除,以得到所述目标电影的参考电影集中各电影的权值;
所述根据所述目标电影的参考电影集中各电影的权值及目标用户对所述目标电影的参考电影集中各电影的评分进行评分加权和计算以得到目标用户对目标电影的预测评分的步骤具体包括:
将所述目标电影的参考电影集中各电影的权值分别依次与目标用户对所述目标电影的参考电影集中各电影的评分进行对应相乘再累加在一起以得到目标用户对目标电影的预测评分。
推荐模块:用于根据用户对未评价电影的预测评分对用户的所有未观看的电影进行排序并生成用户的电影推荐集,将所述用户的电影推荐集中排序靠前的预设数量部电影推荐给用户。
所述推荐模块还用于:
从电影数据库中获取目标用户的所有已观看的电影并生成目标用户的已观看电影集;
对所述目标用户的未评价电影集与所述目标用户的已观看电影集进行交集以获得交集电影;
将所述目标用户的未评价电影集中的交集电影进行删除并按照预测评分的高低进行排序以生成目标用户的电影推荐集;
将所述目标用户的电影推荐集中排序靠前的预设数量部电影推荐给目标用户。
实施例3
请参考图3,本发明还提出一种电影推荐设备,所示为本发明第三实施例当中的电影推荐设备,包括存储器20、处理器10以及存储在存储器上并可在处理器上运行的计算机程序30,所述处理器10执行所述计算机程序30时实现如上述的电影推荐方法。
其中,所述电影推荐设备具体可以为计算机、服务器、上位机等,处理器10在一些实施例中可以是中央处理器(Central Processing Unit, CPU)、控制器、微控制器、微处理器或其他数据处理芯片,用于运行存储器20中存储的程序代码或处理数据,例如执行访问限制程序等。
其中,存储器20至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、磁性存储器、磁盘、光盘等。存储器20在一些实施例中可以是电影推荐设备的内部存储单元,例如该电影推荐设备的硬盘。存储器20在另一些实施例中也可以是电影推荐设备的外部存储装置,例如电影推荐设备上配备的插接式硬盘,智能存储卡(Smart Media Card, SMC),安全数字(Secure Digital, SD)卡,闪存卡(Flash Card)等。进一步地,存储器20还可以既包括电影推荐设备的内部存储单元也包括外部存储装置。存储器20不仅可以用于存储安装于电影推荐设备的应用软件及各类数据,还可以用于暂时地存储已经输出或者将要输出的数据。
需要指出的是,图3示出的结构并不构成对电影推荐设备的限定,在其它实施例当中,该电影推荐设备可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
本发明实施例还提出一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述的电影推荐方法。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明的保护范围应以所附权利要求为准。

Claims (10)

1.一种电影推荐方法,其特征在于,所述方法包括:
对电影数据库中电影的相关概念进行知识抽取以得到电影的各实体及对应的关系,并将电影的各实体及对应的关系填充至知识图谱的数据层中以形成电影知识图谱;
基于所述电影知识图谱将电影的实体及关系映射到多维空间以得到电影的嵌入向量,并根据各电影的嵌入向量对任意两个电影之间的相似度进行计算以得到第一相似度;
根据用户的观影评分对电影进行向量化表示以生成电影的评分向量并构建用户评分矩阵,再根据各电影的评分向量对任意两个电影之间的相似度进行计算以得到第二相似度;
对任意两个电影的所述第一相似度及所述第二相似度进行融合以得到任意两个电影的最终相似度,并根据各电影之间的最终相似度生成电影相似度矩阵;
根据所述电影相似度矩阵和用户评分矩阵对用户的所有未评价的电影进行评分预测以得到用户对未评价电影的预测评分;
根据用户对未评价电影的预测评分对用户的所有未观看的电影进行排序并生成用户的电影推荐集,将所述用户的电影推荐集中排序靠前的预设数量部电影推荐给用户。
2.根据权利要求1所述的电影推荐方法,其特征在于,所述根据所述电影相似度矩阵和用户评分矩阵对用户的所有未评价的电影进行评分预测以得到用户对未评价电影的预测评分的步骤具体包括:
从电影数据库中获取目标用户的所有未评价的电影以生成目标用户的未评价电影集并从所述目标用户的未评价电影集中提取目标电影;
从所述电影相似度矩阵中获取目标电影与其他所有电影之间的相似度并按照相似度的大小对电影进行排序;
获取排在前面的k个电影并生成所述目标电影的最相似电影集;
将所述目标电影的最相似电影集与目标用户评论过的电影集进行交集以生成目标电影的参考电影集;
对所述目标电影的参考电影集中各电影的权值进行计算;
根据所述目标电影的参考电影集从所述用户评分矩阵中获取目标用户对所述目标电影的参考电影集中各电影的评分;
根据所述目标电影的参考电影集中各电影的权值及目标用户对所述目标电影的参考电影集中各电影的评分进行评分加权和计算以得到目标用户对目标电影的预测评分;
依次计算目标用户对所述目标用户的未评价电影集中各电影的预测评分。
3.根据权利要求2所述的电影推荐方法,其特征在于,所述根据用户对未评价电影的预测评分对用户的所有未观看的电影进行排序并生成用户的电影推荐集,将所述用户的电影推荐集中排序靠前的预设数量部电影推荐给用户的步骤具体包括:
从电影数据库中获取目标用户的所有已观看的电影并生成目标用户的已观看电影集;
对所述目标用户的未评价电影集与所述目标用户的已观看电影集进行交集以获得交集电影;
将所述目标用户的未评价电影集中的交集电影进行删除并按照预测评分的高低进行排序以生成目标用户的电影推荐集;
将所述目标用户的电影推荐集中排序靠前的预设数量部电影推荐给目标用户。
4.根据权利要求2所述的电影推荐方法,其特征在于,所述对所述目标电影的参考电影集中各电影的权值进行计算的步骤具体包括:
获取所述目标电影的参考电影集中各电影与目标电影的相似度值;
将所述目标电影的参考电影集中各电影与目标电影的相似度值分别依次与所述目标电影的参考电影集中各电影与目标电影的相似度值之和进行相除,以得到所述目标电影的参考电影集中各电影的权值;
所述根据所述目标电影的参考电影集中各电影的权值及目标用户对所述目标电影的参考电影集中各电影的评分进行评分加权和计算以得到目标用户对目标电影的预测评分的步骤具体包括:
将所述目标电影的参考电影集中各电影的权值分别依次与目标用户对所述目标电影的参考电影集中各电影的评分进行对应相乘再累加在一起以得到目标用户对目标电影的预测评分。
5.根据权利要求1所述的电影推荐方法,其特征在于,所述对任意两个电影的所述第一相似度及所述第二相似度进行融合以得到任意两个电影的最终相似度,并根据各电影之间的最终相似度生成电影相似度矩阵的步骤具体包括:
根据融合因子对任意两个电影的所述第一相似度及所述第二相似度进行加权以得到任意两个电影的最终相似度,计算公式为:
Figure 980847DEST_PATH_IMAGE001
其中,
Figure 161292DEST_PATH_IMAGE002
为电影i和电影j的最终相似度,
Figure 495322DEST_PATH_IMAGE003
为融合因子,
Figure 899758DEST_PATH_IMAGE003
的取值范围为[0,1],
Figure 450563DEST_PATH_IMAGE004
为电影i和电影j的第一相似度,
Figure 903541DEST_PATH_IMAGE005
为电影i和电影j的第二相似度;
根据各电影之间的最终相似度生成电影相似度矩阵。
6.根据权利要求1所述的电影推荐方法,其特征在于,所述基于所述电影知识图谱将电影的实体及关系映射到多维空间以得到电影的嵌入向量,并根据各电影的嵌入向量对任意两个电影之间的相似度进行计算以得到第一相似度的步骤具体包括:
基于所述电影知识图谱将电影的实体及关系映射到多维空间中以得到电影的嵌入向量;
根据各电影的嵌入向量计算任意两个电影之间的欧几里得距离;
根据两个电影之间的欧几里得距离计算两个电影之间的相似度以得到两个电影的第一相似度。
7.根据权利要求1所述的电影推荐方法,其特征在于,所述根据用户的观影评分对电影进行向量化表示以生成电影的评分向量并构建用户评分矩阵,再根据各电影的评分向量对任意两个电影之间的相似度进行计算以得到第二相似度的步骤具体包括:
根据各用户的观影评分对每个电影进行向量化表示以生成各电影的评分向量并构建用户评分矩阵;
根据各电影的评分向量计算任意两个电影之间的余弦相似度以得到任意两个电影的第二相似度。
8.一种电影推荐系统,其特征在于,包括:
知识图谱模块:用于对电影数据库中电影的相关概念进行知识抽取以得到电影的各实体及对应的关系,并将电影的各实体及对应的关系填充至知识图谱的数据层中以形成电影知识图谱;
第一计算模块:用于基于所述电影知识图谱将电影的实体及关系映射到多维空间以得到电影的嵌入向量,并根据各电影的嵌入向量对任意两个电影之间的相似度进行计算以得到第一相似度;
第二计算模块:用于根据用户的观影评分对电影进行向量化表示以生成电影的评分向量并构建用户评分矩阵,再根据各电影的评分向量对任意两个电影之间的相似度进行计算以得到第二相似度;
融合模块:用于对任意两个电影的所述第一相似度及所述第二相似度进行融合以得到任意两个电影的最终相似度,并根据各电影之间的最终相似度生成电影相似度矩阵;
预测模块:用于根据所述电影相似度矩阵和用户评分矩阵对用户的所有未评价的电影进行评分预测以得到用户对未评价电影的预测评分;
推荐模块:用于根据用户对未评价电影的预测评分对用户的所有未观看的电影进行排序并生成用户的电影推荐集,将所述用户的电影推荐集中排序靠前的预设数量部电影推荐给用户。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7任一项所述的电影推荐方法。
10.一种电影推荐设备,其特征在于,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如权利要求1-7任一项所述的电影推荐方法。
CN202210919539.1A 2022-08-02 2022-08-02 电影推荐方法、系统、存储介质及设备 Pending CN114996490A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210919539.1A CN114996490A (zh) 2022-08-02 2022-08-02 电影推荐方法、系统、存储介质及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210919539.1A CN114996490A (zh) 2022-08-02 2022-08-02 电影推荐方法、系统、存储介质及设备

Publications (1)

Publication Number Publication Date
CN114996490A true CN114996490A (zh) 2022-09-02

Family

ID=83022001

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210919539.1A Pending CN114996490A (zh) 2022-08-02 2022-08-02 电影推荐方法、系统、存储介质及设备

Country Status (1)

Country Link
CN (1) CN114996490A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116911693A (zh) * 2023-09-11 2023-10-20 北京赛学科技有限公司 一种基于大数据的人员推荐方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108733798A (zh) * 2018-05-17 2018-11-02 电子科技大学 一种基于知识图谱的个性化推荐方法
CN111125428A (zh) * 2019-12-17 2020-05-08 东北大学 基于评分预测函数拟合结构的时间相关电影推荐方法
CN112667877A (zh) * 2020-12-25 2021-04-16 陕西师范大学 一种基于旅游知识图谱的景点推荐方法及设备

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108733798A (zh) * 2018-05-17 2018-11-02 电子科技大学 一种基于知识图谱的个性化推荐方法
CN111125428A (zh) * 2019-12-17 2020-05-08 东北大学 基于评分预测函数拟合结构的时间相关电影推荐方法
CN112667877A (zh) * 2020-12-25 2021-04-16 陕西师范大学 一种基于旅游知识图谱的景点推荐方法及设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
袁泉等: "基于知识图谱和协同过滤的电影推荐算法研究", 《计算机工程与科学》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116911693A (zh) * 2023-09-11 2023-10-20 北京赛学科技有限公司 一种基于大数据的人员推荐方法及系统
CN116911693B (zh) * 2023-09-11 2023-12-05 北京赛学科技有限公司 一种基于大数据的人员推荐方法及系统

Similar Documents

Publication Publication Date Title
US20170039198A1 (en) Visual interactive search, scalable bandit-based visual interactive search and ranking for visual interactive search
US10606883B2 (en) Selection of initial document collection for visual interactive search
KR20200094627A (ko) 텍스트 관련도를 확정하기 위한 방법, 장치, 기기 및 매체
US20110191336A1 (en) Contextual image search
CN112464100B (zh) 信息推荐模型训练方法、信息推荐方法、装置及设备
WO2022140900A1 (zh) 个人知识图谱构建方法、装置及相关设备
CN111522886B (zh) 一种信息推荐方法、终端及存储介质
WO2020233432A1 (zh) 一种信息推荐方法及装置
CN113127632A (zh) 基于异质图的文本摘要方法及装置、存储介质和终端
CN112699667B (zh) 一种实体相似度确定方法、装置、设备和存储介质
CN111400584A (zh) 联想词的推荐方法、装置、计算机设备和存储介质
CN116975615A (zh) 基于视频多模态信息的任务预测方法和装置
CN116703531B (zh) 物品数据处理方法、装置、计算机设备和存储介质
CN115204301A (zh) 视频文本匹配模型训练、视频文本匹配方法和装置
CN118332008A (zh) 答案筛选方法、装置、计算机设备和存储介质
CN109635004B (zh) 一种数据库的对象描述提供方法、装置及设备
CN114996490A (zh) 电影推荐方法、系统、存储介质及设备
CN114637846A (zh) 视频数据处理方法、装置、计算机设备和存储介质
CN114153965A (zh) 一种结合内容和图谱的舆情事件推荐方法、系统及终端
CN114329004A (zh) 数字指纹生成、数据推送方法、装置和存储介质
Li et al. Knowledge graph representation reasoning for recommendation system
CN116975359A (zh) 资源处理方法、资源推荐方法、装置和计算机设备
CN112650869B (zh) 图像检索重排序方法、装置、电子设备及存储介质
CN110633387A (zh) 基于局部信息的图像检索方法
CN112000888B (zh) 信息推送方法、装置、服务器及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20220902

RJ01 Rejection of invention patent application after publication