CN109033240A - 基于情感分析的电影评论信息检索系统及方法 - Google Patents

基于情感分析的电影评论信息检索系统及方法 Download PDF

Info

Publication number
CN109033240A
CN109033240A CN201810727732.9A CN201810727732A CN109033240A CN 109033240 A CN109033240 A CN 109033240A CN 201810727732 A CN201810727732 A CN 201810727732A CN 109033240 A CN109033240 A CN 109033240A
Authority
CN
China
Prior art keywords
comment information
module
comment
film
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810727732.9A
Other languages
English (en)
Inventor
李慧
张慧
张舒
施珺
戴红伟
杨玉
蔡虹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huaihai Institute of Techology
Original Assignee
Huaihai Institute of Techology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huaihai Institute of Techology filed Critical Huaihai Institute of Techology
Priority to CN201810727732.9A priority Critical patent/CN109033240A/zh
Publication of CN109033240A publication Critical patent/CN109033240A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于情感分析的电影评论信息检索系统及方法,所述系统包括:评论信息搜索模块、评论信息爬取模块、评论信息清理模块、评论信息提取模块、评论信息分析模块、评论信息推荐模块和评论信息查看模块,通过爬取网站上电影相关的评论信息,并对评论信息进行清理和提取,分析出评论的情感和质量,以达到使用户通过查看电影评论可以准确的选择优质的电影,提高用户观质量的目的。

Description

基于情感分析的电影评论信息检索系统及方法
技术领域
本发明涉及电影评论信息推荐技术领域,具体涉及一种基于情感分析的电影评论信息检索系统及方法。
背景技术
随着信息技术的发展,电影在互联网上慢慢传播,信息时代也随之爆发。电影作为人们闲暇时必不可少的娱乐活动,电影的传播路径表现出不同的特征。传统电影的推荐方法虽然操作简单,精度高,但是由于有些制片方为了盈利而刷分的现象,导致评分可信度下降,使用户不能准确的选择健康、有深意且质量高的电影。
发明内容
为解决上述技术问题,本发明提出了一种基于情感分析的电影评论信息检索系统及方法,以达到使用户通过查看电影评论可以准确的选择优质的电影,提高用户观质量的目的。
为达到上述目的,本发明的技术方案如下:一种基于情感分析的电影评论信息检索系统,所述系统包括:评论信息搜索模块、评论信息爬取模块、评论信息清理模块、评论信息提取模块、评论信息分析模块、评论信息推荐模块和评论信息查看模块;
所述评论信息搜索模块,用于用户搜索电影名称或电影类别;
所述评论信息爬取模块,用于用户设置爬取的网站、评论页数和电影上映时间,并根据设置的网站、评论页数和电影上映时间对评论信息进行爬取;
所述评论信息清理模块,用于清理爬取到的数据中评论信息以外的数据;
所述评论信息提取模块,用于提取相关的评论信息并将评论信息写入到文本中;
所述评论信息分析模块,用于分析文本中评论信息的情感和质量;
所述评论信息推荐模块,用于在用户搜索的类别中为用户推荐评论信息较好的电影;
所述评论信息查看模块,用于用户查看电影的评论信息。
进一步地,所述评论信息搜索模块中的搜索方式包括精确搜索和模糊搜索。
进一步地,所述评论信息爬取模块通过网络爬虫技术爬取用户设置的网站上的电影评论信息。
一种基于情感分析的电影评论信息检索方法,所述方法步骤如下:用户设置需要爬取的网站、评论页数和电影上映时间;系统根据用户设置的条件爬取对应网站上的评论信息并将评论信息存储至本地;对存储至本地的评论信息进行清理;提取清理后的评论信息导入至文本中;分析出文本中评论信息的情感和质量供用户搜索和查看。
进一步地,所述系统根据用户设置的条件爬取对应网站上的评论信息的方法是:利用beautifulsoup4算法对设置网站上的评论信息进行爬取。
进一步地,所述提取清理后的评论信息导入至文本中的方法是:通过pymysql将评论信息导入到文本中。
进一步地,所述分析出文本中评论信息的情感和质量的方法是:通过snownlp算法判断文本中单词出现的概率,从而分析出评论信息的情感和质量。
本发明具有如下优点:
(1).本发明通过爬取网站上电影相关的评论信息,并对评论信息进行清理和提取,分析出评论的情感和质量,从而使用户准确的了解电影,提高用户选择电影的准确性和观影质量。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。
图1为本发明实施例公开的基于情感分析的电影评论信息检索系统功能模块图;
图2为本发明实施例公开的基于情感分析的电影评论信息检索方法流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。
本发明提供了一种基于情感分析的电影评论信息检索系统及方法,其工作原理是通过爬取网站上电影相关的评论信息,并对评论信息进行清理和提取,分析出评论的情感和质量,以达到使用户通过查看电影评论可以准确的选择优质的电影,提高用户观质量的目的。
下面结合实施例和具体实施方式对本发明作进一步详细的说明。
如图1和图2所示,一种基于情感分析的电影评论信息检索系统,所述系统包括:评论信息搜索模块、评论信息爬取模块、评论信息清理模块、评论信息提取模块、评论信息分析模块、评论信息推荐模块和评论信息查看模块;
所述评论信息搜索模块,用于用户搜索电影名称或电影类别;
所述评论信息爬取模块,用于用户设置爬取的网站、评论页数和电影上映时间,并根据设置的网站、评论页数和电影上映时间对评论信息进行爬取;
所述评论信息清理模块,用于清理爬取到的数据中评论信息以外的数据;
所述评论信息提取模块,用于提取相关的评论信息并将评论信息写入到文本中;
所述评论信息分析模块,用于分析文本中评论信息的情感和质量;
所述评论信息推荐模块,用于在用户搜索的类别中为用户推荐评论信息较好的电影;
所述评论信息查看模块,用于用户查看电影的评论信息。
其中,所述系统还包括:注册模块、登录模块、密码找回模块和个人信息管理模块;所述注册模块,用于用于填写相关信息注册成为本系统的用户;所述登录模块,用于客户登录系统进行搜索;所述密码找回模块,用于用户设置安全问题,从而找回密码;所述个人信息管理模块,用于管理用户信息。
其中,所述评论信息搜索模块中的搜索方式包括精确搜索和模糊搜索。
其中,所述评论信息爬取模块通过网络爬虫技术爬取用户设置的网站上的电影评论信息。
一种基于情感分析的电影评论信息检索方法,所述方法步骤如下:用户设置需要爬取的网站、评论页数和电影上映时间;系统根据用户设置的条件爬取对应网站上的评论信息并将评论信息存储至本地;对存储至本地的评论信息进行清理;提取清理后的评论信息导入至文本中;分析出文本中评论信息的情感和质量供用户搜索和查看。
其中,所述系统根据用户设置的条件爬取对应网站上的评论信息的方法是:利用beautifulsoup4算法对设置网站上的评论信息进行爬取。
其中,所述提取清理后的评论信息导入至文本中的方法是:通过pymysql将评论信息导入到.txt的文本中。
其中,所述分析出文本中评论信息的情感和质量的方法是:通过snownlp算法判断文本中单词出现的概率,从而分析出评论信息的情感和质量。
用户注册系统后,设置想要查看的网站、评论页数和电影上映时间等与电影评论信息相关的条件,系统爬取评论信息后对评论信息进行整理和提取,分析出评论信息的情感和质量,用户可在系统上查看有有价值的电影评论,客户模糊查询时,系统自动为用户推荐电影评论和相关图片的信息。
以上所述的仅是本发明所公开的一种基于情感分析的电影评论信息检索系统及方法的优选实施方式,应当指出,对于本领域的普通技术人员来说,在不脱离本发明创造构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。

Claims (7)

1.一种基于情感分析的电影评论信息检索系统,其特征在于,所述系统包括:评论信息搜索模块、评论信息爬取模块、评论信息清理模块、评论信息提取模块、评论信息分析模块、评论信息推荐模块和评论信息查看模块;
所述评论信息搜索模块,用于用户搜索电影名称或电影类别;
所述评论信息爬取模块,用于用户设置爬取的网站、评论页数和电影上映时间,并根据设置的网站、评论页数和电影上映时间对评论信息进行爬取;
所述评论信息清理模块,用于清理爬取到的数据中评论信息以外的数据;
所述评论信息提取模块,用于提取相关的评论信息并将评论信息写入到文本中;
所述评论信息分析模块,用于分析文本中评论信息的情感和质量;
所述评论信息推荐模块,用于在用户搜索的类别中为用户推荐评论信息较好的电影;
所述评论信息查看模块,用于用户查看电影的评论信息。
2.根据权利要求1所述的基于情感分析的电影评论信息检索系统,其特征在于,所述评论信息搜索模块中的搜索方式包括精确搜索和模糊搜索。
3.根据权利要求1所述的基于情感分析的电影评论信息检索系统,其特征在于,所述评论信息爬取模块通过网络爬虫技术爬取用户设置的网站上的电影评论信息。
4.一种基于情感分析的电影评论信息检索方法,其特征在于,所述方法步骤如下:用户设置需要爬取的网站、评论页数和电影上映时间;系统根据用户设置的条件爬取对应网站上的评论信息并将评论信息存储至本地;对存储至本地的评论信息进行清理;提取清理后的评论信息导入至文本中;分析出文本中评论信息的情感和质量供用户搜索和查看。
5.根据权利要求4所述的基于情感分析的电影评论信息检索方法,其特征在于,所述系统根据用户设置的条件爬取对应网站上的评论信息的方法是:利用beautifulsoup4算法对设置网站上的评论信息进行爬取。
6.根据权利要求4所述的基于情感分析的电影评论信息检索方法,其特征在于,所述提取清理后的评论信息导入至文本中的方法是:通过pymysql将评论信息导入到文本中。
7.根据权利要求4所述的基于情感分析的电影评论信息检索方法,其特征在于,所述分析出文本中评论信息的情感和质量的方法是:通过snownlp算法判断文本中单词出现的概率,从而分析出评论信息的情感和质量。
CN201810727732.9A 2018-07-05 2018-07-05 基于情感分析的电影评论信息检索系统及方法 Pending CN109033240A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810727732.9A CN109033240A (zh) 2018-07-05 2018-07-05 基于情感分析的电影评论信息检索系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810727732.9A CN109033240A (zh) 2018-07-05 2018-07-05 基于情感分析的电影评论信息检索系统及方法

Publications (1)

Publication Number Publication Date
CN109033240A true CN109033240A (zh) 2018-12-18

Family

ID=65521789

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810727732.9A Pending CN109033240A (zh) 2018-07-05 2018-07-05 基于情感分析的电影评论信息检索系统及方法

Country Status (1)

Country Link
CN (1) CN109033240A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115033143A (zh) * 2022-06-13 2022-09-09 昆明理工大学 一种基于微信小程序的视频评论和弹幕解析系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105550269A (zh) * 2015-12-10 2016-05-04 复旦大学 一种有监督学习的产品评论分析方法及系统
CN106156004A (zh) * 2016-07-04 2016-11-23 中国传媒大学 基于词向量的针对电影评论信息的情感分析系统及方法
CN107404671A (zh) * 2017-06-13 2017-11-28 中国传媒大学 电影内容特征获取系统及应用系统
CN108460010A (zh) * 2018-01-17 2018-08-28 南京邮电大学 一种基于情感分析的综合评分模型实现方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105550269A (zh) * 2015-12-10 2016-05-04 复旦大学 一种有监督学习的产品评论分析方法及系统
CN106156004A (zh) * 2016-07-04 2016-11-23 中国传媒大学 基于词向量的针对电影评论信息的情感分析系统及方法
CN107404671A (zh) * 2017-06-13 2017-11-28 中国传媒大学 电影内容特征获取系统及应用系统
CN108460010A (zh) * 2018-01-17 2018-08-28 南京邮电大学 一种基于情感分析的综合评分模型实现方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115033143A (zh) * 2022-06-13 2022-09-09 昆明理工大学 一种基于微信小程序的视频评论和弹幕解析系统

Similar Documents

Publication Publication Date Title
US8635107B2 (en) Automatic expansion of an advertisement offer inventory
Li et al. Twiner: named entity recognition in targeted twitter stream
McKenzie et al. Weighted multi-attribute matching of user-generated points of interest
Jans et al. Skip n-grams and ranking functions for predicting script events
US11048712B2 (en) Real-time and adaptive data mining
US20180005117A1 (en) Corpus Quality Analysis
US8291319B2 (en) Intelligent self-enabled solution discovery
Popat Assessing the credibility of claims on the web
US20170076206A1 (en) Cognitive Operations Based on Empirically Constructed Knowledge Graphs
US20130159277A1 (en) Target based indexing of micro-blog content
CN111831802B (zh) 一种基于lda主题模型的城市领域知识检测系统及方法
CN109299865B (zh) 基于语义分析的心理测评系统及方法、信息数据处理终端
CN103544255A (zh) 基于文本语义相关的网络舆情信息分析方法
US20150205580A1 (en) Method and System for Sorting Online Videos of a Search
EP3189449A2 (en) Sentiment rating system and method
US20170061497A1 (en) Brand Personality Inference and Recommendation System
Geçkil et al. A clickbait detection method on news sites
KR20150096295A (ko) 문답 데이터베이스 구축 시스템 및 방법, 그리고 이를 이용한 검색 시스템 및 방법
US20210406475A1 (en) Fact checking based on semantic graphs
US10628749B2 (en) Automatically assessing question answering system performance across possible confidence values
CN110287314B (zh) 基于无监督聚类的长文本可信度评估方法及系统
US20170140290A1 (en) Automated Similarity Comparison of Model Answers Versus Question Answering System Output
CN113095948A (zh) 一种基于图神经网络的多源异构网络用户对齐方法
Ashraf et al. Author profiling on bi-lingual tweets
Ogudo et al. Sentiment analysis application and natural language processing for mobile network operators’ support on social media

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20181218