CN113591487B - 基于深度学习的旅游景点评论情感分析方法 - Google Patents
基于深度学习的旅游景点评论情感分析方法 Download PDFInfo
- Publication number
- CN113591487B CN113591487B CN202110884900.7A CN202110884900A CN113591487B CN 113591487 B CN113591487 B CN 113591487B CN 202110884900 A CN202110884900 A CN 202110884900A CN 113591487 B CN113591487 B CN 113591487B
- Authority
- CN
- China
- Prior art keywords
- emotion
- comment
- word
- text
- vocabulary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000008451 emotion Effects 0.000 title claims abstract description 71
- 238000004458 analytical method Methods 0.000 title claims abstract description 41
- 238000013135 deep learning Methods 0.000 title claims abstract description 23
- 230000011218 segmentation Effects 0.000 claims abstract description 41
- 238000000034 method Methods 0.000 claims abstract description 30
- 238000012549 training Methods 0.000 claims abstract description 16
- 239000011159 matrix material Substances 0.000 claims abstract description 14
- 230000019771 cognition Effects 0.000 claims abstract description 7
- 230000008569 process Effects 0.000 claims abstract description 5
- 238000012545 processing Methods 0.000 claims description 7
- 238000004140 cleaning Methods 0.000 claims description 5
- 230000001502 supplementing effect Effects 0.000 claims description 5
- 230000008030 elimination Effects 0.000 claims description 4
- 238000003379 elimination reaction Methods 0.000 claims description 4
- 238000012937 correction Methods 0.000 claims description 3
- 239000013589 supplement Substances 0.000 claims description 3
- 238000012795 verification Methods 0.000 claims description 3
- 238000011160 research Methods 0.000 abstract description 3
- 230000002776 aggregation Effects 0.000 description 2
- 238000004220 aggregation Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 239000000047 product Substances 0.000 description 1
- 230000000087 stabilizing effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/211—Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/14—Travel agencies
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Tourism & Hospitality (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Computation (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Databases & Information Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提出了一种基于深度学习的旅游景点评论情感分析方法,结合旅游景点作为研究对象,从游客对旅游景点的文本评论中,识别出旅游景点现状的问题和痛点。本发明利用网络公开的景点评论数据,结合文本语言的分句、分词方法,对文本语句进行语义切割,建立分析的词汇库,判断语句的情感指向,进而提取分词列表的词汇,分析情感正负面,对词汇进行基本聚类,再通过共词矩阵对分类进行补充和完善,最后形成旅游目的地认知的反馈结果。本发明利用共词矩阵对聚类结果进行矫正和重定向,降低学习成本,聚类过程中只需要认定词性无需自制训练集,无监督环境下的聚类结果高度聚合,提高了文本聚类分析的效率和精准度。
Description
技术领域
本发明涉及旅游景点评价及文本情感分析技术领域,提出了一种基于深度学习的旅游景点评论情感分析方法。
背景技术
提升景区环境和管理是旅游景区稳定客源、保持竞争优势的重要手段。游客满意度对于景区环境和管理提升紧密相关,因此掌握旅游景区游客满意度的具体影响因素,提高游客满意度,对于保证稳定客源、科学管理景区一级持续开拓市场具有重要作用。游客游览景区后发表的评论文字最为直接反映游客对于旅游目的地的游览感受和认知,与传统的问卷调查相比,网络空间更为开放和共享,旅游者游览后对旅游目的地的网络评价信息最为真实客观反映旅游景区的市场形象。
目前,利用采用网络文本探究旅游景区的市场形象逐渐被应用,但是大多以词频分析为主,分析手段较为单一,现有文本评论方法深度学习成本高,训练集量需求大,聚类时间过长且结果不够精准,随着机器学习方法的进步,在方法上可以借助新型的计算方法进行情感分析和聚类研究,分析游客对景区的旅游形象感知。
发明内容
本发明所要解决的技术问题是:为了克服现有方法的不足,进行研究方法上的创新,通过梳理所有旅游景点评论数据作为数据本底,而提出一种基于深度学习的旅游景点评论情感分析方法。
本发明为解决以上技术问题,采用以下技术手段:
本发明提出一种基于深度学习的旅游景点评论情感分析方法,包括:
步骤1、整理旅游景点评论数据,并对评论数据进行清洗;
步骤2、结合文本语言的分句、分词方法,对文本语句进行语义切割,建立用于分析的词汇库;
步骤3、判断语句的情感指向,进而提取分词列表的词汇,分析情感正负面,获取情感指向词汇;
步骤4、对情感指向词汇进行基本聚类,再通过共词矩阵对分类进行补充和完善,最后形成旅游目的地认知的反馈结果。
进一步的,本发明所提出的一种基于深度学习的旅游景点评论情感分析方法,步骤1中整理旅游景点评论数据,是将原始景点评论文本数据整理成结构化数据,包括景点名称、评论内容、评论时间、评论者昵称信息。
进一步的,本发明所提出的一种基于深度学习的旅游景点评论情感分析方法,步骤1对旅游景点评论数据进行清洗。具体如下:
(101)、通过程序语言对评论数据进行去重处理;
(102)、对原始数据进行观察判断,采用广告文本作为训练集,将景区评论信息作为验证集进行朴素贝叶斯分类,剔除掉广告类型文本。
进一步的,本发明所提出的一种基于深度学习的旅游景点评论情感分析方法,朴素贝叶斯分类的训练过程,是基于训练集来估计类鲜艳概率,并为每个属性估计条件概率;
朴素贝叶斯分类器具体公式如下:
其中P(c)为先验概率,根据以前的知识和经验得出的c类样本出现的概率,与现在无关;P(c|x)表示后验概率,相对于先验概率而言,表示x 属于c类的概率;d为属性数目;P(xi|c)为条件概率。
进一步的,本发明所提出的一种基于深度学习的旅游景点评论情感分析方法,步骤2所述对文本语句进行语义切割,是指对旅游景点评论进行分句分词处理,具体做法如下:
(201)、通过文本断点对所有景点评论进行断句,将每一句文本记录拆解为若干条记录,以尽可能保留文本记录里所有信息;
(202)、对语句进行分词,将分词结果保存进数据框架的分词列,最终将每一个分句解析成无标点、用空格间隔开的分词列表。
进一步的,本发明所提出的一种基于深度学习的旅游景点评论情感分析方法,步骤3中判断语句的情感指向,是采用SnowNLP算法对每一个分句进行语句情感指向分析,具体为:首先将景点存在的问题描述与正负面情感语言植入数据库,用其作为训练数据做出参考集并生成序列化的数据字典,用修正后的数据字典进行更精确的情感指向判断。
进一步的,本发明所提出的一种基于深度学习的旅游景点评论情感分析方法,步骤3中获取情感指向词汇,对情感为正面和负面的分词结果进行词频统计得到所有的正面和负面词汇,对单一词汇进行情感指向正负面分析,以此获取直接导致正负面的词汇。
进一步的,本发明所提出的一种基于深度学习的旅游景点评论情感分析方法,步骤4对情感指向词汇进行基本聚类,具体操作步骤如下:
(1)将每一个分词列表做TF-IDF运算,TF-IDF = TF* IDF,TF是指词频,IDF则是逆文档频率,即文档频率的倒数;
TF-IDF与一个词在文档中的出现次数成正比,与该词在整个语言中的出现次数成反比,得出全词汇在全文里的重要性排名;
(2)将已有的正负面情感指向词汇在经过TF-IDF运算后形成的向量数值空间进行比对后,保留情感指向词汇和相应的向量关系;采用DBSCAN方法对情感指向词汇进行基本聚类,得到情感指向词汇聚类初步结果;DBSCAN聚类具体公式如下:
其中Count i 为点i的邻域ε内点的数量,MintPts为簇最小点数,n为对象数量。
进一步的,本发明所提出的一种基于深度学习的旅游景点评论情感分析方法,步骤4通过共词矩阵对分类进行补充和完善,即对分类后的情感指向词汇进行重定向,具体为:
利用包括分词列表、TF-IDF的已有数据构建词频靠前的词汇共现矩阵,识别每个情感指向词汇共现频率较高的词汇分类补充,并将这些词汇去重找到共现的词汇用以补充每个分类的正负面词汇,最后经过去重和校正,得到旅游景点问题反馈的聚类清单;
将重定向后的负面词汇聚类清单,反馈到旅游景点评论中,即可得到引起游客负面评论的词汇和分类。
进一步的,本发明所提出的一种基于深度学习的旅游景点评论情感分析方法,其中共词矩阵统计公式如下:
其中,E ij 代表词对M i 和M j 在评论集合中的数量,C i 表示主题词M i 在评论集合中出现的频次,C j 表示主题词M j 在评论集合汇总出现的频次,E ij 是主题词M i 和M j 的相互包容值,取值在0-1之间。相互包容值越高,表明两个词依存度越大,即在评论中共现的几率越高。
本发明采用以上技术方案,与现有技术相比的有益效果在于:
该方法利用共词矩阵对聚类结果进行矫正和重定向,降低学习成本,聚类过程中只需要认定词性无需自制训练集,无监督环境下的聚类结果高度聚合,提高了文本聚类分析的效率和精准度,有效识别游客的景点认知,反馈景区环境提升。
附图说明
图1为本发明实施的方法流程图。
图2为本发明实施例子中旅游评论文本情感指向示意图。
图3为本发明实施例中旅游评论文本中词汇聚类结果。
具体实施方式
下面结合附图对本发明的技术方案做进一步的详细说明:
本实例是一种基于深度学习的旅游景点评论情感分析方法,流程图见图1,主要包括以下步骤:
第一步:整理旅游景点评论数据。将原始景点评论文本数据整理成结构化数据,包括景点名称、评论内容、评论时间、评论者昵称等信息。
第二步,对旅游景点评论数据进行清洗。具体做法如下:
(1)通过程序语言对评论数据进行去重处理,删除掉重复文本信息,仅保留不重复的景点评论内容。
(2)对原始数据进行观察判断,现有景点评论充斥着大量广告等无用信息,需要进行去冗余处理。因为文本里的广告内容是具有特色的文本内容,与普通的景点评论内容具有极大的差别。本发明采用机器学习算法里的朴素贝叶斯方法,采用广告文本作为训练集,将景区评论信息作为验证集进行朴素贝叶斯分类,剔除掉广告类型文本。朴素贝叶斯分类器的训练过程就是基于训练集来估计类鲜艳概率,并为每个属性估计条件概率。朴素贝叶斯分类器具体公式如下:
其中,P(c)为先验概率,根据以前的知识和经验得出的c类样本出现的概率,与现在无关;P(c|x)表示后验概率,相对于先验概率而言,表示x 属于c类的概率;d为属性数目;P(xi|c)为条件概率。
第三步,对旅游景点评论进行分句分词处理。具体做法如下:
(1)在对文本做情感分析之前,需要将每一条景点评论记录进行分句分词处理。因为中文聊天记录中往往存在多种表达意思混杂,为避免对整句进行情感分析会影响正负面情绪判断,通过文本断点对所有景点评论进行断句。通过将每一句文本记录拆解为若干条记录,以尽可能保留文本记录里所有信息。
(2)因为对文本语句的情感分析是对其构成词语的情感进行识别,进而累加之后的分析结果,因此对情感分析前需要对语句进行分词。本发明对于分句逐句采用程序语言jieba分词工具进行分词,将分词结果保存进数据框架的分词列,将每一个分句解析成无标点、用空格间隔开的分词列表。
第四步,对旅游景点评论语句情感判别。参加图2所示的旅游评论文本情感指向示意图,利用情感分析对每一个分句进行情感指向分析。采用SnowNLP算法进行语句情感指向分析,因为原有训练库不一定适用于景点评论的文本记录。首先将景点存在的问题描述与正负面情感语言植入数据库,用其作为训练数据做出参考集并生成序列化的数据字典,用修正后的数据字典进行更精确的情感指向判断。进一步借助修正数据字典后的SnowNLP算法判断文本语句的正负面指向。
第五步,获取情感指向词汇。对情感为正面和负面的分词结果进行词频统计得到所有的正面和负面词汇,对单一词汇进行情感指向正负面分析,以此获取直接导致正负面的词汇,如“不好”、“差”等情感指向词汇。
第六步,对情感指向词汇进行分类。具体操作步骤如下:
(1)将前文中的每一个分词列表做TF-IDF运算,TF是指词频,IDF则是逆文档频率,即文档频率的倒数,TF-IDF 为频(TF) 和逆文档频率(IDF)之积。
TF-IDF = 词频(TF) * 逆文档频率(IDF)
TF-IDF与一个词在文档中的出现次数成正比,与该词在整个语言中的出现次数成反比,这样就可以得出全词汇在全文里的重要性排名。
(2)将已有的正负面情感指向词汇在经过TF-IDF运算后形成的向量数值空间进行比对后保留情感指向词汇和相应的向量关系,再将其输入到DBSCAN中进行聚类运算,此时聚类出的各小类就是较为精准的带有明确情感指向词汇的集合了。采用DBSCAN方法(Density-Based Spatial Clustering of Applications with Noise,具有噪声的基于密度的聚类)对情感指向词汇进行基本聚类,得到情感指向词汇聚类初步结果。DBSCAN聚类具体公式如下:
其中,Counti为点i的邻域ε内点的数量,MintPts为簇最小点数,n为对象数量。
第七步,对分类后的情感指向词汇进行重定向。
利用分词列表、TF-IDF等已有数据构建词频靠前的词汇共现矩阵,识别每个情感指向词汇共现频率较高的词汇分类补充,并将这些词汇去重找到共现的词汇用以补充每个分类的正负面词汇,最后经过去重和校正,得到旅游景点问题反馈的聚类清单。将重定向后的负面词汇聚类清单,反馈到旅游景点评论中,即可得到引起游客负面评论的词汇和分类。参见图3所示,本发明实施例中旅游评论文本中词汇聚类结果。
其中共词矩阵统计公式如下:
其中Eij代表词对Mi和Mj在评论集合中的数量,Ci表示主题词Mi在评论集合中出现的频次,Cj表示主题词Mj在评论集合汇总出现的频次,Eij是主题词Mi和Mj的相互包容值,取值在0-1之间。相互包容值越高,表明两个词依存度越大,即在评论中共现的几率越高。
综上,本发明梳理了所有旅游景点评论数据作为数据本底,提出一种基于深度学习的旅游景点评论情感分析方法。该方法的创新之处是利用网络公开的景点评论数据,结合文本语言的分句、分词方法,对文本语句进行语义切割,建立分析的词汇库,判断语句的情感指向,进而提取分词列表的词汇,分析情感正负面,对词汇进行基本聚类,再通过共词矩阵对分类进行补充和完善,最后形成旅游目的地认知的反馈结果。该方法能够探索不同景点的游客游览情感倾向以及景点认知的分类结果,有助于进一步反馈到景区环境提升,为旅游管理部门和景区管理人员提升景区游客满意度提供决策支持。
以上所述实施仅表达了本发明可能的实施方式,但并不能因此理解为对本发明专利范围的限制。对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出相应的变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
Claims (5)
1.一种基于深度学习的旅游景点评论情感分析方法,其特征在于,包括:
步骤1、整理旅游景点评论数据,并对评论数据进行清洗;对旅游景点评论数据进行清洗,具体如下:
(101)、通过程序语言对评论数据进行去重处理;
(102)、对原始数据进行观察判断,采用广告文本作为训练集,将景区评论数据作为验证集进行朴素贝叶斯分类,剔除掉广告类型文本,朴素贝叶斯分类的训练过程,是基于训练集来估计先验概率,并为每个属性估计条件概率;
朴素贝叶斯分类器具体公式如下:
其中P(c)为先验概率,根据以前的知识和经验得出的c类样本出现的概率,与现在无关;P(c|x)表示后验概率,相对于先验概率而言,表示x属于c类的概率;d为属性数目;P(xi|c)为条件概率;
步骤2、结合文本语言的分句、分词方法,对文本语句进行语义切割,建立用于分析的词汇库;对文本语句进行语义切割,是指对旅游景点评论进行分句分词处理,具体做法如下:
(201)、通过文本断点对所有景点评论进行断句,将每一句文本记录拆解为若干条记录,以尽可能保留文本记录里所有信息;
(202)、对语句进行分词,将分词结果保存进数据框架的分词列,最终将每一个分句解析成无标点、用空格间隔开的分词列表;
步骤3、判断语句的情感指向,进而提取分词列表的词汇,分析情感正负面,获取情感指向词汇;其中判断语句的情感指向,是采用SnowNLP算法对每一个分句进行语句情感指向分析,具体为:首先将景点存在的问题描述与正负面情感语言植入数据库,用其作为训练数据做出参考集并生成序列化的数据字典,用修正后的数据字典进行更精确的情感指向判断;获取情感指向词汇,对情感为正面和负面的分词结果进行词频统计得到所有的正面和负面词汇,对单一词汇进行情感指向正负面分析,以此获取直接导致正负面的词汇;
步骤4、对情感指向词汇进行基本聚类,再通过共词矩阵对分类进行补充和完善,最后形成旅游目的地认知的反馈结果。
2.根据权利要求1所述的一种基于深度学习的旅游景点评论情感分析方法,其特征在于,步骤1中整理旅游景点评论数据,是将原始景点评论文本数据整理成结构化数据,包括景点名称、评论内容、评论时间、评论者昵称信息。
3.根据权利要求1所述的一种基于深度学习的旅游景点评论情感分析方法,其特征在于,步骤4对情感指向词汇进行基本聚类,具体操作步骤如下:
(1)将每一个分词列表做TF-IDF运算,TF-IDF=TF*IDF,TF是指词频,IDF则是逆文档频率,即文档频率的倒数;
TF-IDF与一个词在文档中的出现次数成正比,与该词在整个语言中的出现次数成反比,得出全词汇在全文里的重要性排名;
(2)将已有的正负面情感指向词汇在经过TF-IDF运算后形成的向量数值空间进行比对后,保留情感指向词汇和相应的向量关系;采用DBSCAN方法对情感指向词汇进行基本聚类,得到情感指向词汇聚类初步结果;DBSCAN聚类具体公式如下:
其中Counti为点i的邻域ε内点的数量,MintPts为簇最小点数,n为对象数量。
4.根据权利要求1所述的一种基于深度学习的旅游景点评论情感分析方法,其特征在于,步骤4通过共词矩阵对分类进行补充和完善,即对分类后的情感指向词汇进行重定向,具体为:
利用包括分词列表、TF-IDF的已有数据构建词频靠前的词汇共现矩阵,识别每个情感指向词汇共现频率较高的词汇分类补充,并将这些词汇去重找到共现的词汇用以补充每个分类的正负面词汇,最后经过去重和校正,得到旅游景点问题反馈的聚类清单;
将重定向后的负面词汇聚类清单,反馈到旅游景点评论中,即可得到引起游客负面评论的词汇和分类。
5.根据权利要求4所述的一种基于深度学习的旅游景点评论情感分析方法,其特征在于,其中共词矩阵统计公式如下:
Eij=(Cij/Ci)*(Cij/Cj)=(Cij)2/(Ci*Cj)
其中,Eij代表词对Mi和Mj在评论集合中的数量,Ci表示主题词Mi在评论集合中出现的频次,Cj表示主题词Mj在评论集合汇总出现的频次,Cij是主题词Mi和Mj的相互包容值,取值在0-1之间;相互包容值越高,表明两个词依存度越大,即在评论中共现的几率越高。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110884900.7A CN113591487B (zh) | 2021-08-03 | 2021-08-03 | 基于深度学习的旅游景点评论情感分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110884900.7A CN113591487B (zh) | 2021-08-03 | 2021-08-03 | 基于深度学习的旅游景点评论情感分析方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113591487A CN113591487A (zh) | 2021-11-02 |
CN113591487B true CN113591487B (zh) | 2024-04-26 |
Family
ID=78254149
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110884900.7A Active CN113591487B (zh) | 2021-08-03 | 2021-08-03 | 基于深度学习的旅游景点评论情感分析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113591487B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111309902B (zh) * | 2020-01-20 | 2022-09-23 | 山西大学 | 一种基于马尔科夫动力学社区检测技术的共词分析方法 |
CN114090756B (zh) * | 2022-01-11 | 2022-04-15 | 杭银消费金融股份有限公司 | 一种舆情信息的智能化处理方法、设备、存储介质 |
CN115099241B (zh) * | 2022-06-30 | 2024-04-12 | 郑州信大先进技术研究院 | 一种基于模型融合的海量旅游网络文本语义分析方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110750745A (zh) * | 2019-10-16 | 2020-02-04 | 四川大学 | 基于旅游ugc的目的地形象可视化方法 |
CN111309859A (zh) * | 2020-01-21 | 2020-06-19 | 上饶市中科院云计算中心大数据研究院 | 一种景区网络口碑情感分析方法及装置 |
CN111353044A (zh) * | 2020-03-09 | 2020-06-30 | 重庆邮电大学 | 一种基于评论的情感分析方法及系统 |
CN112836109A (zh) * | 2021-02-03 | 2021-05-25 | 长沙学院 | 一种遗产旅游地推荐方法及系统 |
-
2021
- 2021-08-03 CN CN202110884900.7A patent/CN113591487B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110750745A (zh) * | 2019-10-16 | 2020-02-04 | 四川大学 | 基于旅游ugc的目的地形象可视化方法 |
CN111309859A (zh) * | 2020-01-21 | 2020-06-19 | 上饶市中科院云计算中心大数据研究院 | 一种景区网络口碑情感分析方法及装置 |
CN111353044A (zh) * | 2020-03-09 | 2020-06-30 | 重庆邮电大学 | 一种基于评论的情感分析方法及系统 |
CN112836109A (zh) * | 2021-02-03 | 2021-05-25 | 长沙学院 | 一种遗产旅游地推荐方法及系统 |
Non-Patent Citations (2)
Title |
---|
基于微博数据的北京市热点区域意象感知;谢永俊;彭霞;黄舟;刘瑜;;地理科学进展(第09期);全文 * |
基于网络口碑的景区游客满意度研究 ——以海南蜈支洲景区为例;王晓;《中国硕士期刊全文库》;第1章、第3-5章 * |
Also Published As
Publication number | Publication date |
---|---|
CN113591487A (zh) | 2021-11-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113591487B (zh) | 基于深度学习的旅游景点评论情感分析方法 | |
CN109670039B (zh) | 基于三部图和聚类分析的半监督电商评论情感分析方法 | |
Viola et al. | Learning to extract information from semi-structured text using a discriminative context free grammar | |
KR101713558B1 (ko) | 소셜 네트워크 서비스 상의 사용자 게시글 감정 분류 방법 | |
US10540610B1 (en) | Generating and applying a trained structured machine learning model for determining a semantic label for content of a transient segment of a communication | |
CN107688630B (zh) | 一种基于语义的弱监督微博多情感词典扩充方法 | |
CN109492105B (zh) | 一种基于多特征集成学习的文本情感分类方法 | |
CN114492327A (zh) | 一种公文智能写作方法 | |
Van Durme | Streaming analysis of discourse participants | |
CN108363748B (zh) | 基于知乎的话题画像系统及话题画像方法 | |
CN112434164B (zh) | 一种兼顾话题发现和情感分析的网络舆情分析方法及系统 | |
US20200184345A1 (en) | Method and system for generating a transitory sentiment community | |
Babhulgaonkar et al. | Language identification for multilingual machine translation | |
Vora et al. | Classification of tweets based on emotions using word embedding and random forest classifiers | |
Wijesekara et al. | Source credibility analysis on Twitter users | |
CN110019720B (zh) | 一种评论的内容分获取方法及系统 | |
Sazzed | A hybrid approach of opinion mining and comparative linguistic analysis of restaurant reviews | |
CN107103093B (zh) | 一种基于用户行为和情感分析的短文本推荐方法及装置 | |
CN111754208A (zh) | 一种招聘简历自动筛选方法 | |
CN111026866B (zh) | 一种面向领域的文本信息抽取聚类方法、设备和存储介质 | |
Nugraha et al. | Typographic-based data augmentation to improve a question retrieval in short dialogue system | |
TWI734085B (zh) | 使用意圖偵測集成學習之對話系統及其方法 | |
CN117291190A (zh) | 一种基于情感词典和lda主题模型的用户需求计算方法 | |
CN112200674A (zh) | 一种证券市场情绪指数智能计算信息系统 | |
Suleymanov et al. | Text classification for Azerbaijani language using machine learning and embedding |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB03 | Change of inventor or designer information | ||
CB03 | Change of inventor or designer information |
Inventor after: Jiang Jinliang Inventor after: Xu Yunyi Inventor before: Jiang Jinliang |
|
GR01 | Patent grant | ||
GR01 | Patent grant |