CN111782934A - 一种缓解数据稀疏性的电影推荐系统和方法 - Google Patents
一种缓解数据稀疏性的电影推荐系统和方法 Download PDFInfo
- Publication number
- CN111782934A CN111782934A CN202010390652.6A CN202010390652A CN111782934A CN 111782934 A CN111782934 A CN 111782934A CN 202010390652 A CN202010390652 A CN 202010390652A CN 111782934 A CN111782934 A CN 111782934A
- Authority
- CN
- China
- Prior art keywords
- movie
- data
- module
- recommendation
- data input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及一种缓解数据稀疏性的电影推荐系统,包括初始数据输入模块和推荐列表模块;初始数据输入模块包括电影简介数据、电影评论数据、实际评分数据和剧组人员信息数据;所述的电影简介数据和实际评分数据经改进的卷积神经网络处理后传输至推荐列表模块;根据所述剧组人员信息数据建立数学模型,嵌入所述推荐列表模块;所述电影评论数据通过算法处理后,传输至推荐列表模块。本发明提供一种缓解数据稀疏性的电影推荐系统和方法,本申请收集电影简介数据、电影评论数据、实际评分数据和剧组人员信息数据,利用改进的卷积神经网络和数学模型进行电影信息的融合,生成新的推荐列表,提高了系统的准确性,缓解了用户‑评分矩阵的数据稀疏性的问题。
Description
技术领域
本发明涉及深度学习领域,更具体地,涉及一种缓解数据稀疏性的电影推荐系统和方法。
背景技术
互联网和信息技术的飞速发展,为人们提供了便利的同时,也产生了海量的数据。用户要从海量的信息中快速提取自己感兴趣的信息,最直接的方式是搜索引擎和推荐系统。搜索引擎必须要精准输入关键词,推荐系统则是根据用户与商品项目之间的特征进行相似性推荐。
目前推荐系统最常用的算法大致可分为以下几种:1.基于内容的推荐算法,即根据商品之间的相似性进行推荐;2.基于知识的推荐方法能够将用户的需求映射到产品上;3.基于关联规则的推荐算法,该方法根据已经购买的历史商品,推荐与之最具有相关性的其他商品,该方法主要瓶颈是关联规则的发现;4.协同过滤推荐算法,该方法依据对商品的评分来向用户推荐商品,是应用最广泛的推荐方法之一;其他推荐算法,比如利用聚类,形成用户簇,在簇间发现相似性。利用神经网络或贝叶斯等方法进行评分预测,从而实现推荐等。但是由于数据量太大,而用户评分的项目通常只有很少一部分,导致评分矩阵比较稀疏,推荐质量下降,所以数据稀疏性是推荐系统中比较重要的问题。
目前在推荐系统中常用的优化稀疏矩阵的方法是填补空缺值或使用新的相似性计算方法。填补空缺值常见的有均值或众数填补,或者利用神经网络等方法进行数值预测填补。相似值计算方法是在原来计算相似度基础上,考虑用户或者物品,利用用户评分数据中包含的信息计算相似度。
发明内容
本发明为解决现有的电影推荐系统准确性差,提供的数据具有稀疏性的技术缺陷,提供了一种缓解数据稀疏性的电影推荐系统和方法。
为实现以上发明目的,采用的技术方案是:
一种缓解数据稀疏性的电影推荐系统,包括初始数据输入模块、数据处理模块和推荐列表模块;初始数据输入模块包括电影简介数据输入子模块、电影评论数据输入子模块、实际评分数据输入子模块和剧组人员信息数据输入子模块;
所述的电影简介数据输入子模块和实际评分数据输入子模块在数据处理模块中与改进的卷积神经网络进行融合,之后传输至推荐列表模块;所述剧组人员信息数据输入子模块在数据处理模块中建立数学模型,之后嵌入所述推荐列表模块;所述电影评论数据输入子模块在数据处理模块中通过AFINN算法处理后,传输至推荐列表模块。
上述方案中,本申请收集电影简介数据、电影评论数据、实际评分数据和剧组人员信息数据,利用改进的卷积神经网络和数学模型进行电影信息的融合,生成新的推荐列表,提高了系统的准确性,缓解了用户-评分矩阵的数据稀疏性的问题。
所述的卷积神经网络包括嵌入层、卷积层、池化层和输出层,所述的嵌入层、卷积层、池化层和输出层依次连接,所述卷积神经网络与电影简介数据和实际评分数据融合时,其嵌入层进行改进,将每个电影的简介表示成为一个词向量矩阵作为卷积层的输入。
所述嵌入层的改进是使用googlenews-vector预训练的词向量集将每个电影的简介表示成为一个词向量矩阵作为卷积层的输入。
剧组人员信息数据输入子模块建立数学模型,找到与目标用户相似的近邻用户对导演的电影观看次数,求出近邻用户对导演所有电影的评分均值;计算近邻用户对演员主演电影的评分均值;取二者均值作为导演与演员共同影响下,用户对电影的综合评分,将此综合评分传输至所述推荐列表模块中。
所述AFINN算法为情感分析字典,所述电影评论数据输入子模块的数据输入到情感分析字典,经过情感分析字典的自然语言处理,得出分析文本,输出至推荐列表模块。
一种缓解数据稀疏性的电影推荐方法,应用于一种缓解数据稀疏性的电影推荐系统,包括以下步骤:
S1:电影简介数据输入子模块与改进后的卷积神经网络融合,得到电影特征向量矩阵;
S2:电影特征向量矩阵与实际评分数据输入子模块进行混合,得到混合评分矩阵;
S3:原推荐模型改进矩阵分解限制,形成神经网络模型;
S4:通过混合评分矩阵与神经网络模型融合,构建新的推荐列表模块。
在步骤S1中,所述的卷积神经网络包括嵌入层、卷积层、池化层和输出层,所述卷积神经网络与电影简介数据输入子模块和实际评分数据输入子模块融合时,其嵌入层进行改进,将每个电影的简介表示成为一个词向量矩阵作为卷积层的输入。
所述嵌入层的改进是使用googlenews-vector预训练的词向量集将每个电影的简介表示成为一个词向量矩阵作为卷积层的输入。
在步骤S3中,原推荐模型运用概率矩阵分解算法通过随机初始化来得到用户特征向量矩阵和电影特征向量矩阵,然后得到合适的用户特征向量矩阵和电影特征向量矩阵。
原推荐模型运用概率矩阵分解算法通过随机初始化来得到用户特征向量矩阵和电影特征向量矩阵,然后使用随机梯度下降方法多次迭代后得到合适的用户特征向量矩阵和电影特征向量矩阵。
与现有技术相比,本发明的有益效果是:
本发明提供的一种缓解数据稀疏性的电影推荐系统和方法,收集电影简介数据、电影评论数据、实际评分数据和剧组人员信息数据,利用改进的卷积神经网络和数学模型进行电影信息的融合,生成新的推荐列表,提高了系统的准确性,缓解了用户-评分矩阵的数据稀疏性的问题。
附图说明
图1为本发明的模块数据流向图;
图2为本发明的方法流程图。
具体实施方式
附图仅用于示例性说明,不能理解为对本专利的限制;
以下结合附图和实施例对本发明做进一步的阐述。
实施例1
如图1所示,一种缓解数据稀疏性的电影推荐系统,包括初始数据输入模块、数据处理模块和推荐列表模块;初始数据输入模块包括电影简介数据输入子模块、电影评论数据输入子模块、实际评分数据输入子模块和剧组人员信息数据输入子模块;
所述的电影简介数据输入子模块和实际评分数据输入子模块在数据处理模块中与改进的卷积神经网络进行融合,之后传输至推荐列表模块;所述剧组人员信息数据输入子模块在数据处理模块中建立数学模型,之后嵌入所述推荐列表模块;所述电影评论数据输入子模块在数据处理模块中通过AFINN算法处理后,传输至推荐列表模块。
上述方案中,本申请收集电影简介数据、电影评论数据、实际评分数据和剧组人员信息数据,利用改进的卷积神经网络和数学模型进行电影信息的融合,生成新的推荐列表,提高了系统的准确性,缓解了用户-评分矩阵的数据稀疏性的问题。
所述的卷积神经网络包括嵌入层、卷积层、池化层和输出层,所述的嵌入层、卷积层、池化层和输出层依次连接,所述卷积神经网络与电影简介数据和实际评分数据融合时,其嵌入层进行改进,将每个电影的简介表示成为一个词向量矩阵作为卷积层的输入。
所述嵌入层的改进是使用googlenews-vector预训练的词向量集将每个电影的简介表示成为一个词向量矩阵作为卷积层的输入。
剧组人员信息数据输入子模块建立数学模型,找到与目标用户相似的近邻用户对导演的电影观看次数,求出近邻用户对导演所有电影的评分均值;计算近邻用户对演员主演电影的评分均值;取二者均值作为导演与演员共同影响下,用户对电影的综合评分,将此综合评分传输至所述推荐列表模块中。
所述AFINN算法为情感分析字典,所述电影评论数据输入子模块的数据输入到情感分析字典,经过情感分析字典的自然语言处理,得出分析文本,输出至推荐列表模块。
实施例2
如图2所示,一种缓解数据稀疏性的电影推荐方法,应用于一种缓解数据稀疏性的电影推荐系统,包括以下步骤:
S1:电影简介数据输入子模块与改进后的卷积神经网络融合,得到电影特征向量矩阵;
S2:电影特征向量矩阵与实际评分数据输入子模块进行混合,得到混合评分矩阵;
S3:原推荐模型改进矩阵分解限制,形成神经网络模型;
S4:通过混合评分矩阵与神经网络模型融合,构建新的推荐列表模块。
在步骤S1中,所述的卷积神经网络包括嵌入层、卷积层、池化层和输出层,所述卷积神经网络与电影简介数据输入子模块和实际评分数据输入子模块融合时,其嵌入层进行改进,将每个电影的简介表示成为一个词向量矩阵作为卷积层的输入。
所述嵌入层的改进是使用googlenews-vector预训练的词向量集将每个电影的简介表示成为一个词向量矩阵作为卷积层的输入。
在步骤S3中,原推荐模型运用概率矩阵分解算法通过随机初始化来得到用户特征向量矩阵和电影特征向量矩阵,然后得到合适的用户特征向量矩阵和电影特征向量矩阵。
原推荐模型运用概率矩阵分解算法通过随机初始化来得到用户特征向量矩阵和电影特征向量矩阵,然后使用随机梯度下降方法多次迭代后得到合适的用户特征向量矩阵和电影特征向量矩阵。
显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。
Claims (10)
1.一种缓解数据稀疏性的电影推荐系统,其特征在于,包括初始数据输入模块、数据处理模块和推荐列表模块;初始数据输入模块包括电影简介数据输入子模块、电影评论数据输入子模块、实际评分数据输入子模块和剧组人员信息数据输入子模块;
所述的电影简介数据输入子模块和实际评分数据输入子模块在数据处理模块中与改进的卷积神经网络进行融合,之后传输至推荐列表模块;所述剧组人员信息数据输入子模块在数据处理模块中建立数学模型,之后嵌入所述推荐列表模块;所述电影评论数据输入子模块在数据处理模块中通过AFINN算法处理后,传输至推荐列表模块。
2.根据权利要求1所述的一种缓解数据稀疏性的电影推荐系统,其特征在于,所述的卷积神经网络包括嵌入层、卷积层、池化层和输出层,所述的嵌入层、卷积层、池化层和输出层依次连接,所述卷积神经网络与电影简介数据和实际评分数据融合时,其嵌入层进行改进,将每个电影的简介表示成为一个词向量矩阵作为卷积层的输入。
3.根据权利要求2所述的一种缓解数据稀疏性的电影推荐系统,其特征在于,所述嵌入层的改进是使用googlenews-vector预训练的词向量集将每个电影的简介表示成为一个词向量矩阵作为卷积层的输入。
4.根据权利要求1所述的一种缓解数据稀疏性的电影推荐系统,其特征在于,剧组人员信息数据输入子模块建立数学模型,找到与目标用户相似的近邻用户对导演的电影观看次数,求出近邻用户对导演所有电影的评分均值;计算近邻用户对演员主演电影的评分均值;取二者均值作为导演与演员共同影响下,用户对电影的综合评分,将此综合评分传输至所述推荐列表模块中。
5.根据权利要求1所述的一种缓解数据稀疏性的电影推荐系统,其特征在于,所述AFINN算法为情感分析字典,所述电影评论数据输入子模块的数据输入到情感分析字典,经过情感分析字典的自然语言处理,得出分析文本,输出至推荐列表模块。
6.一种缓解数据稀疏性的电影推荐方法,应用于权利要求1所述的一种缓解数据稀疏性的电影推荐系统,其特征在于,包括以下步骤:
S1:电影简介数据输入子模块与改进后的卷积神经网络融合,得到电影特征向量矩阵;
S2:电影特征向量矩阵与实际评分数据输入子模块进行混合,得到混合评分矩阵;
S3:原推荐模型改进矩阵分解限制,形成神经网络模型;
S4:通过混合评分矩阵与神经网络模型融合,构建新的推荐列表模块。
7.根据权利要求6所述的一种缓解数据稀疏性的电影推荐方法,其特征在于,在步骤S1中,所述的卷积神经网络包括嵌入层、卷积层、池化层和输出层,所述卷积神经网络与电影简介数据输入子模块和实际评分数据输入子模块融合时,其嵌入层进行改进,将每个电影的简介表示成为一个词向量矩阵作为卷积层的输入。
8.根据权利要求7所述的一种缓解数据稀疏性的电影推荐方法,其特征在于,所述嵌入层的改进是使用googlenews-vector预训练的词向量集将每个电影的简介表示成为一个词向量矩阵作为卷积层的输入。
9.根据权利要求8所述的一种缓解数据稀疏性的电影推荐方法,其特征在于,在步骤S3中,原推荐模型运用概率矩阵分解算法通过随机初始化来得到用户特征向量矩阵和电影特征向量矩阵,然后得到合适的用户特征向量矩阵和电影特征向量矩阵。
10.根据权利要求9所述的一种缓解数据稀疏性的电影推荐方法,其特征在于,原推荐模型运用概率矩阵分解算法通过随机初始化来得到用户特征向量矩阵和电影特征向量矩阵,然后使用随机梯度下降方法多次迭代后得到合适的用户特征向量矩阵和电影特征向量矩阵。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010390652.6A CN111782934A (zh) | 2020-05-11 | 2020-05-11 | 一种缓解数据稀疏性的电影推荐系统和方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010390652.6A CN111782934A (zh) | 2020-05-11 | 2020-05-11 | 一种缓解数据稀疏性的电影推荐系统和方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111782934A true CN111782934A (zh) | 2020-10-16 |
Family
ID=72753616
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010390652.6A Pending CN111782934A (zh) | 2020-05-11 | 2020-05-11 | 一种缓解数据稀疏性的电影推荐系统和方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111782934A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113220936A (zh) * | 2021-06-04 | 2021-08-06 | 黑龙江广播电视台 | 基于随机矩阵编码和简化卷积网络的视频智能推荐方法、装置及存储介质 |
DE202023104110U1 (de) | 2023-07-23 | 2023-07-28 | Upasana Adhikari | Intelligentes verschlüsselungsbasiertes System für Filmempfehlungen |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105956089A (zh) * | 2016-05-03 | 2016-09-21 | 桂林电子科技大学 | 一种针对具备项目的分类信息的推荐方法 |
CN108536856A (zh) * | 2018-04-17 | 2018-09-14 | 重庆邮电大学 | 基于双边网络结构的混合协同过滤电影推荐模型 |
CN108959429A (zh) * | 2018-06-11 | 2018-12-07 | 苏州大学 | 一种融合视觉特征端对端训练的电影推荐的方法及系统 |
US20200050677A1 (en) * | 2018-08-07 | 2020-02-13 | Disney Enterprises, Inc. | Joint understanding of actors, literary characters, and movies |
CN110807154A (zh) * | 2019-11-08 | 2020-02-18 | 内蒙古工业大学 | 一种基于混合深度学习模型的推荐方法与系统 |
-
2020
- 2020-05-11 CN CN202010390652.6A patent/CN111782934A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105956089A (zh) * | 2016-05-03 | 2016-09-21 | 桂林电子科技大学 | 一种针对具备项目的分类信息的推荐方法 |
CN108536856A (zh) * | 2018-04-17 | 2018-09-14 | 重庆邮电大学 | 基于双边网络结构的混合协同过滤电影推荐模型 |
CN108959429A (zh) * | 2018-06-11 | 2018-12-07 | 苏州大学 | 一种融合视觉特征端对端训练的电影推荐的方法及系统 |
US20200050677A1 (en) * | 2018-08-07 | 2020-02-13 | Disney Enterprises, Inc. | Joint understanding of actors, literary characters, and movies |
CN110807154A (zh) * | 2019-11-08 | 2020-02-18 | 内蒙古工业大学 | 一种基于混合深度学习模型的推荐方法与系统 |
Non-Patent Citations (1)
Title |
---|
黎丹雨: "基于多特征融合的电影推荐系统", 《计算机与现代化》, pages 121 - 125 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113220936A (zh) * | 2021-06-04 | 2021-08-06 | 黑龙江广播电视台 | 基于随机矩阵编码和简化卷积网络的视频智能推荐方法、装置及存储介质 |
CN113220936B (zh) * | 2021-06-04 | 2023-08-15 | 黑龙江广播电视台 | 基于随机矩阵编码和简化卷积网络的视频智能推荐方法、装置及存储介质 |
DE202023104110U1 (de) | 2023-07-23 | 2023-07-28 | Upasana Adhikari | Intelligentes verschlüsselungsbasiertes System für Filmempfehlungen |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109299396B (zh) | 融合注意力模型的卷积神经网络协同过滤推荐方法及系统 | |
CN106599226B (zh) | 一种内容推荐方法及内容推荐系统 | |
CN112765486A (zh) | 一种融合知识图谱的注意力机制的电影推荐方法 | |
CN109033294B (zh) | 一种融入内容信息的混合推荐方法 | |
CN110046250A (zh) | 三嵌入卷积神经网络模型及其文本多分类方法 | |
CN110909182A (zh) | 多媒体资源搜索方法、装置、计算机设备及存储介质 | |
Chaubey et al. | Sentiment analysis of image with text caption using deep learning techniques | |
CN114780831A (zh) | 基于Transformer的序列推荐方法及系统 | |
CN113239159B (zh) | 基于关系推理网络的视频和文本的跨模态检索方法 | |
CN110110220B (zh) | 融合社交网络和用户评价的推荐模型 | |
CN112632377B (zh) | 一种基于用户评论情感分析与矩阵分解的推荐方法 | |
CN111782934A (zh) | 一种缓解数据稀疏性的电影推荐系统和方法 | |
CN114332519A (zh) | 一种基于外部三元组和抽象关系的图像描述生成方法 | |
CN116680363A (zh) | 一种基于多模态评论数据的情感分析方法 | |
CN115982473A (zh) | 一种基于aigc的舆情分析编排系统 | |
Sharma et al. | Movie buzz-movie success prediction system using machine learning model | |
Lou | Deep learning-based sentiment analysis of movie reviews | |
Defit et al. | Comparative Analysis of Classification Methods in Sentiment Analysis: The Impact of Feature Selection and Ensemble Techniques Optimization | |
CN114595693A (zh) | 一种基于深度学习的文本情感分析方法 | |
CN111723302A (zh) | 一种基于协同双模型深度表示学习的推荐方法 | |
Boumhidi et al. | Leveraging Lexicon-Based and Sentiment Analysis Techniques for Online Reputation Generation. | |
US20240086311A1 (en) | Sentiment analysis using magnitude of entities | |
Zhou et al. | Category enhanced word embedding | |
Ramadhan et al. | Social Media Based Film Recommender System (Twitter) on Disney+ with Hybrid Filtering Using Support Vector Machine | |
Naskar et al. | Implementation of Movie Recommendation System Using Hybrid Filtering Methods and Sentiment Analysis of Movie Reviews |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |