CN109033240A - 基于情感分析的电影评论信息检索系统及方法 - Google Patents
基于情感分析的电影评论信息检索系统及方法 Download PDFInfo
- Publication number
- CN109033240A CN109033240A CN201810727732.9A CN201810727732A CN109033240A CN 109033240 A CN109033240 A CN 109033240A CN 201810727732 A CN201810727732 A CN 201810727732A CN 109033240 A CN109033240 A CN 109033240A
- Authority
- CN
- China
- Prior art keywords
- comment information
- module
- comment
- film
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于情感分析的电影评论信息检索系统及方法,所述系统包括:评论信息搜索模块、评论信息爬取模块、评论信息清理模块、评论信息提取模块、评论信息分析模块、评论信息推荐模块和评论信息查看模块,通过爬取网站上电影相关的评论信息,并对评论信息进行清理和提取,分析出评论的情感和质量,以达到使用户通过查看电影评论可以准确的选择优质的电影,提高用户观质量的目的。
Description
技术领域
本发明涉及电影评论信息推荐技术领域,具体涉及一种基于情感分析的电影评论信息检索系统及方法。
背景技术
随着信息技术的发展,电影在互联网上慢慢传播,信息时代也随之爆发。电影作为人们闲暇时必不可少的娱乐活动,电影的传播路径表现出不同的特征。传统电影的推荐方法虽然操作简单,精度高,但是由于有些制片方为了盈利而刷分的现象,导致评分可信度下降,使用户不能准确的选择健康、有深意且质量高的电影。
发明内容
为解决上述技术问题,本发明提出了一种基于情感分析的电影评论信息检索系统及方法,以达到使用户通过查看电影评论可以准确的选择优质的电影,提高用户观质量的目的。
为达到上述目的,本发明的技术方案如下:一种基于情感分析的电影评论信息检索系统,所述系统包括:评论信息搜索模块、评论信息爬取模块、评论信息清理模块、评论信息提取模块、评论信息分析模块、评论信息推荐模块和评论信息查看模块;
所述评论信息搜索模块,用于用户搜索电影名称或电影类别;
所述评论信息爬取模块,用于用户设置爬取的网站、评论页数和电影上映时间,并根据设置的网站、评论页数和电影上映时间对评论信息进行爬取;
所述评论信息清理模块,用于清理爬取到的数据中评论信息以外的数据;
所述评论信息提取模块,用于提取相关的评论信息并将评论信息写入到文本中;
所述评论信息分析模块,用于分析文本中评论信息的情感和质量;
所述评论信息推荐模块,用于在用户搜索的类别中为用户推荐评论信息较好的电影;
所述评论信息查看模块,用于用户查看电影的评论信息。
进一步地,所述评论信息搜索模块中的搜索方式包括精确搜索和模糊搜索。
进一步地,所述评论信息爬取模块通过网络爬虫技术爬取用户设置的网站上的电影评论信息。
一种基于情感分析的电影评论信息检索方法,所述方法步骤如下:用户设置需要爬取的网站、评论页数和电影上映时间;系统根据用户设置的条件爬取对应网站上的评论信息并将评论信息存储至本地;对存储至本地的评论信息进行清理;提取清理后的评论信息导入至文本中;分析出文本中评论信息的情感和质量供用户搜索和查看。
进一步地,所述系统根据用户设置的条件爬取对应网站上的评论信息的方法是:利用beautifulsoup4算法对设置网站上的评论信息进行爬取。
进一步地,所述提取清理后的评论信息导入至文本中的方法是:通过pymysql将评论信息导入到文本中。
进一步地,所述分析出文本中评论信息的情感和质量的方法是:通过snownlp算法判断文本中单词出现的概率,从而分析出评论信息的情感和质量。
本发明具有如下优点:
(1).本发明通过爬取网站上电影相关的评论信息,并对评论信息进行清理和提取,分析出评论的情感和质量,从而使用户准确的了解电影,提高用户选择电影的准确性和观影质量。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。
图1为本发明实施例公开的基于情感分析的电影评论信息检索系统功能模块图;
图2为本发明实施例公开的基于情感分析的电影评论信息检索方法流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。
本发明提供了一种基于情感分析的电影评论信息检索系统及方法,其工作原理是通过爬取网站上电影相关的评论信息,并对评论信息进行清理和提取,分析出评论的情感和质量,以达到使用户通过查看电影评论可以准确的选择优质的电影,提高用户观质量的目的。
下面结合实施例和具体实施方式对本发明作进一步详细的说明。
如图1和图2所示,一种基于情感分析的电影评论信息检索系统,所述系统包括:评论信息搜索模块、评论信息爬取模块、评论信息清理模块、评论信息提取模块、评论信息分析模块、评论信息推荐模块和评论信息查看模块;
所述评论信息搜索模块,用于用户搜索电影名称或电影类别;
所述评论信息爬取模块,用于用户设置爬取的网站、评论页数和电影上映时间,并根据设置的网站、评论页数和电影上映时间对评论信息进行爬取;
所述评论信息清理模块,用于清理爬取到的数据中评论信息以外的数据;
所述评论信息提取模块,用于提取相关的评论信息并将评论信息写入到文本中;
所述评论信息分析模块,用于分析文本中评论信息的情感和质量;
所述评论信息推荐模块,用于在用户搜索的类别中为用户推荐评论信息较好的电影;
所述评论信息查看模块,用于用户查看电影的评论信息。
其中,所述系统还包括:注册模块、登录模块、密码找回模块和个人信息管理模块;所述注册模块,用于用于填写相关信息注册成为本系统的用户;所述登录模块,用于客户登录系统进行搜索;所述密码找回模块,用于用户设置安全问题,从而找回密码;所述个人信息管理模块,用于管理用户信息。
其中,所述评论信息搜索模块中的搜索方式包括精确搜索和模糊搜索。
其中,所述评论信息爬取模块通过网络爬虫技术爬取用户设置的网站上的电影评论信息。
一种基于情感分析的电影评论信息检索方法,所述方法步骤如下:用户设置需要爬取的网站、评论页数和电影上映时间;系统根据用户设置的条件爬取对应网站上的评论信息并将评论信息存储至本地;对存储至本地的评论信息进行清理;提取清理后的评论信息导入至文本中;分析出文本中评论信息的情感和质量供用户搜索和查看。
其中,所述系统根据用户设置的条件爬取对应网站上的评论信息的方法是:利用beautifulsoup4算法对设置网站上的评论信息进行爬取。
其中,所述提取清理后的评论信息导入至文本中的方法是:通过pymysql将评论信息导入到.txt的文本中。
其中,所述分析出文本中评论信息的情感和质量的方法是:通过snownlp算法判断文本中单词出现的概率,从而分析出评论信息的情感和质量。
用户注册系统后,设置想要查看的网站、评论页数和电影上映时间等与电影评论信息相关的条件,系统爬取评论信息后对评论信息进行整理和提取,分析出评论信息的情感和质量,用户可在系统上查看有有价值的电影评论,客户模糊查询时,系统自动为用户推荐电影评论和相关图片的信息。
以上所述的仅是本发明所公开的一种基于情感分析的电影评论信息检索系统及方法的优选实施方式,应当指出,对于本领域的普通技术人员来说,在不脱离本发明创造构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。
Claims (7)
1.一种基于情感分析的电影评论信息检索系统,其特征在于,所述系统包括:评论信息搜索模块、评论信息爬取模块、评论信息清理模块、评论信息提取模块、评论信息分析模块、评论信息推荐模块和评论信息查看模块;
所述评论信息搜索模块,用于用户搜索电影名称或电影类别;
所述评论信息爬取模块,用于用户设置爬取的网站、评论页数和电影上映时间,并根据设置的网站、评论页数和电影上映时间对评论信息进行爬取;
所述评论信息清理模块,用于清理爬取到的数据中评论信息以外的数据;
所述评论信息提取模块,用于提取相关的评论信息并将评论信息写入到文本中;
所述评论信息分析模块,用于分析文本中评论信息的情感和质量;
所述评论信息推荐模块,用于在用户搜索的类别中为用户推荐评论信息较好的电影;
所述评论信息查看模块,用于用户查看电影的评论信息。
2.根据权利要求1所述的基于情感分析的电影评论信息检索系统,其特征在于,所述评论信息搜索模块中的搜索方式包括精确搜索和模糊搜索。
3.根据权利要求1所述的基于情感分析的电影评论信息检索系统,其特征在于,所述评论信息爬取模块通过网络爬虫技术爬取用户设置的网站上的电影评论信息。
4.一种基于情感分析的电影评论信息检索方法,其特征在于,所述方法步骤如下:用户设置需要爬取的网站、评论页数和电影上映时间;系统根据用户设置的条件爬取对应网站上的评论信息并将评论信息存储至本地;对存储至本地的评论信息进行清理;提取清理后的评论信息导入至文本中;分析出文本中评论信息的情感和质量供用户搜索和查看。
5.根据权利要求4所述的基于情感分析的电影评论信息检索方法,其特征在于,所述系统根据用户设置的条件爬取对应网站上的评论信息的方法是:利用beautifulsoup4算法对设置网站上的评论信息进行爬取。
6.根据权利要求4所述的基于情感分析的电影评论信息检索方法,其特征在于,所述提取清理后的评论信息导入至文本中的方法是:通过pymysql将评论信息导入到文本中。
7.根据权利要求4所述的基于情感分析的电影评论信息检索方法,其特征在于,所述分析出文本中评论信息的情感和质量的方法是:通过snownlp算法判断文本中单词出现的概率,从而分析出评论信息的情感和质量。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810727732.9A CN109033240A (zh) | 2018-07-05 | 2018-07-05 | 基于情感分析的电影评论信息检索系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810727732.9A CN109033240A (zh) | 2018-07-05 | 2018-07-05 | 基于情感分析的电影评论信息检索系统及方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109033240A true CN109033240A (zh) | 2018-12-18 |
Family
ID=65521789
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810727732.9A Pending CN109033240A (zh) | 2018-07-05 | 2018-07-05 | 基于情感分析的电影评论信息检索系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109033240A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115033143A (zh) * | 2022-06-13 | 2022-09-09 | 昆明理工大学 | 一种基于微信小程序的视频评论和弹幕解析系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105550269A (zh) * | 2015-12-10 | 2016-05-04 | 复旦大学 | 一种有监督学习的产品评论分析方法及系统 |
CN106156004A (zh) * | 2016-07-04 | 2016-11-23 | 中国传媒大学 | 基于词向量的针对电影评论信息的情感分析系统及方法 |
CN107404671A (zh) * | 2017-06-13 | 2017-11-28 | 中国传媒大学 | 电影内容特征获取系统及应用系统 |
CN108460010A (zh) * | 2018-01-17 | 2018-08-28 | 南京邮电大学 | 一种基于情感分析的综合评分模型实现方法 |
-
2018
- 2018-07-05 CN CN201810727732.9A patent/CN109033240A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105550269A (zh) * | 2015-12-10 | 2016-05-04 | 复旦大学 | 一种有监督学习的产品评论分析方法及系统 |
CN106156004A (zh) * | 2016-07-04 | 2016-11-23 | 中国传媒大学 | 基于词向量的针对电影评论信息的情感分析系统及方法 |
CN107404671A (zh) * | 2017-06-13 | 2017-11-28 | 中国传媒大学 | 电影内容特征获取系统及应用系统 |
CN108460010A (zh) * | 2018-01-17 | 2018-08-28 | 南京邮电大学 | 一种基于情感分析的综合评分模型实现方法 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115033143A (zh) * | 2022-06-13 | 2022-09-09 | 昆明理工大学 | 一种基于微信小程序的视频评论和弹幕解析系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8635107B2 (en) | Automatic expansion of an advertisement offer inventory | |
Li et al. | Twiner: named entity recognition in targeted twitter stream | |
McKenzie et al. | Weighted multi-attribute matching of user-generated points of interest | |
Jans et al. | Skip n-grams and ranking functions for predicting script events | |
US11048712B2 (en) | Real-time and adaptive data mining | |
US20180005117A1 (en) | Corpus Quality Analysis | |
US8291319B2 (en) | Intelligent self-enabled solution discovery | |
Popat | Assessing the credibility of claims on the web | |
US20170076206A1 (en) | Cognitive Operations Based on Empirically Constructed Knowledge Graphs | |
US20130159277A1 (en) | Target based indexing of micro-blog content | |
CN111831802B (zh) | 一种基于lda主题模型的城市领域知识检测系统及方法 | |
CN109299865B (zh) | 基于语义分析的心理测评系统及方法、信息数据处理终端 | |
CN103544255A (zh) | 基于文本语义相关的网络舆情信息分析方法 | |
US20150205580A1 (en) | Method and System for Sorting Online Videos of a Search | |
EP3189449A2 (en) | Sentiment rating system and method | |
US20170061497A1 (en) | Brand Personality Inference and Recommendation System | |
Geçkil et al. | A clickbait detection method on news sites | |
KR20150096295A (ko) | 문답 데이터베이스 구축 시스템 및 방법, 그리고 이를 이용한 검색 시스템 및 방법 | |
US20210406475A1 (en) | Fact checking based on semantic graphs | |
US10628749B2 (en) | Automatically assessing question answering system performance across possible confidence values | |
CN110287314B (zh) | 基于无监督聚类的长文本可信度评估方法及系统 | |
US20170140290A1 (en) | Automated Similarity Comparison of Model Answers Versus Question Answering System Output | |
CN113095948A (zh) | 一种基于图神经网络的多源异构网络用户对齐方法 | |
Ashraf et al. | Author profiling on bi-lingual tweets | |
Ogudo et al. | Sentiment analysis application and natural language processing for mobile network operators’ support on social media |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20181218 |