CN110134765B - 一种基于情感分析的餐厅用户评论分析系统及方法 - Google Patents

一种基于情感分析的餐厅用户评论分析系统及方法 Download PDF

Info

Publication number
CN110134765B
CN110134765B CN201910369104.2A CN201910369104A CN110134765B CN 110134765 B CN110134765 B CN 110134765B CN 201910369104 A CN201910369104 A CN 201910369104A CN 110134765 B CN110134765 B CN 110134765B
Authority
CN
China
Prior art keywords
data
comment
restaurant
module
indicating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910369104.2A
Other languages
English (en)
Other versions
CN110134765A (zh
Inventor
袁丁
章剑林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Normal University
Original Assignee
Hangzhou Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Normal University filed Critical Hangzhou Normal University
Priority to CN201910369104.2A priority Critical patent/CN110134765B/zh
Publication of CN110134765A publication Critical patent/CN110134765A/zh
Application granted granted Critical
Publication of CN110134765B publication Critical patent/CN110134765B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3335Syntactic pre-processing, e.g. stopword elimination, stemming
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0282Rating or review of business operators or products
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/12Hotels or restaurants

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Strategic Management (AREA)
  • Health & Medical Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • Marketing (AREA)
  • Finance (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Human Resources & Organizations (AREA)
  • Primary Health Care (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于情感分析的餐厅用户评论分析系统及方法,其中,系统包括:用户评论获取模块,用于对不同的平台进行数据爬取;数据预处理模块,用于对数据进行预处理;特征提取模块,用于对预处理后的数据进行特征提取以得到字词特征向量和方面级向量;预训练语言模型模块,对语言模型进行训练;算法处理模块,用于将特征提取后的字词特征向量和方面级向量输入到算法模型中进行计算分析;结果展示模块,用于展示计算分析结果和系统运行状况;权限认证模块,通过不同的身份认证进入不同的界面中。本发明能够处理自带的用户评论文本数据和来自软件平台中的数据,而且提供更加简单易懂的结果呈现界面,能够有效的降低用户和商家的理解难度。

Description

一种基于情感分析的餐厅用户评论分析系统及方法
技术领域
本发明涉及自然语言处理领域,尤其是涉及一种基于情感分析的餐厅用户评论分析系统及方法。
背景技术
目前文本分类的应用场景主要有:用户评论分类、舆情监测和信息预测。用户评论分类是其中应用场景最多的。生活信息服务类、餐饮行业等平台性网站上针对不同的餐厅和服务有成千上万条评论,对于餐厅而言,完全浏览一遍评论内容成本很高,为了更好的提高餐厅自己的服务标准,构建模型学习用户评论的倾向,为餐厅明确自身的不足并找到自身的优势提供数据参考。
公开号为CN109284506A的中国专利文献公开了一种基于注意力卷积神经网络的用户评论情感分析系统及方法,主要包括四个模块,即词嵌入模块,卷积模块,注意力模块以及分类器模块。其中词嵌入模块将评论文本使用低维向量表示,卷积模块通过卷积操作提取评论的局部特征,注意力模块通过比较相似度来决定局部特征的权重,并通过加权计算评论的最终特征表达,分类器模块根据最终特征表达进行情感分类。该方法通过大量数据训练后,注意力机制可以判断评论中不同词语的重要程度,使得模型可以“注意到”评论中对情感影响最大的部分,提高模型情感分类的准确率。然而该系统存在实时性差,分析结果单一的不足。
发明内容
本发明提供了一种基于情感分析的餐厅用户评论分析系统及方法,具有更多的选择和实时性,可以得到更加全面的用户评论分析结果。
本发明的技术方案如下:
一种基于情感分析的餐厅用户评论分析系统,包括计算机系统,所述计算机系统中包含有以下模块:
用户评论获取模块,用于对不同的软件平台进行餐厅用户评论数据源的数据抓取;
数据预处理模块,用于对餐厅用户评论中的属性词进行人工标记分类,建立属性词集和评论属性结构,并且对人工标记分类后的数据进行预处理;
特征提取模块,内含特征提取模型,用于对预处理后的数据进行特征提取以得到字词特征向量和方面级向量;
预训练语言模型模块,用于对特征提取模块提取到的字词特征向量和方面级向量进行语言模型的预训练;
算法处理模块,内含算法模型,用于将预训练后的字词特征向量和方面级向量输入到算法模型中进行计算分析;
结果展示模块,用于向使用者展示当前的计算分析结果以及系统运行状况;
权限认证模块,用于给系统增加登陆时的身份认证,不同的身份进入各自的界面中,得到自己需要的界面呈现。
本发明不仅能够处理自身已有的数据集,还能够处理来自不同软件爬取的实时数据,用户评论获取模块用于对来自不同软件(美团、饿了么、大众点评)中的数据进行爬取工作。
所述用户评论获取模块针对不同的软件平台设置有对应的抓取规则,抓取的信息类别包括每条评论的ID号和评论内容。从软件平台网站上抓取所需的餐厅评论信息包括步骤:设计抓取软件平台网站的抓取规则,以及从平台网站上抓取的信息类别。
数据获取模块,用于获取评论模型所需的基本参考数据;数据集的标签化模块,用于对于原始数据进行人工标签分类。
所述数据预处理模块通过自然语言处理的方法,把从软件平台网站中获取的餐厅评论数据进行包括数据清洗、数据分词、数据去停词及过滤无用评论数据。
所述数据集的建立步骤包括:众包的方式对数据进行标签化处理,在预处理后,对筛选出的描述餐厅的位置、服务、价格、环境、菜品及其他的词语进行人工标记,并建立餐厅评论属性结构,餐厅评论属性结构表达式为:
R(L(l1,l2,l3),S(S1,S2,S3,S4),P(P1,P2,P3),E(E1,E2,E3,E4),D(D1,D2,D3,D4),O(O1,O2))
其中,L表示餐厅的位置,l1表示交通是否便利,l2表示距离商圈远近,l3表示是否容易寻找;S表示餐厅的服务,S1表示排队等候时间,S2表示服务人员态度,S3表示是否容易停车,S4表示点菜/上菜速度;P表示餐厅的价格,P1表示价格水平,P2表示性价比,P3表示折扣力度;E表示餐厅的环境,E1表示装修情况,E2表示嘈杂情况,E3表示就餐空间,E4表示卫生情况;D表示餐厅的菜品,D1表示菜的分量,D2表示菜的口感,D3表示菜的外观,D4表示菜的推荐程度;O表示其他内容,O1表示本次消费感受,O2表示再次消费的意愿。
所述特征提取模块中的特征提取模型包括GloVe、tf-idf和SVD中的至少一种。
所述预处理语言模型模块中的方法包括Word2Vec、Bert、elMo、attention机制中的至少一种。
所述算法处理模块中的算法模型包括LSTMAE、LSTM、CNN、RNN、Attention机制、Bert和GCAE中的至少一种。
作为优选,所述算法处理模块中的算法模型为LSTMAE模型,公式如下:
Figure BDA0002049264750000041
其中,ft表示会从运行中丢弃的信息,it表示确定更新的信息,gt表示更新的方面级情感信息,Ct表示Ct-1的更新,Ct-1表示细胞的旧状态,
Figure BDA0002049264750000042
表示一个tanh层创建一个新的候选值向量。
结果展示模块中,根据评论内容,餐厅的评论模型中包括的属性有:位置、服务、价格、环境、菜品及其他。
所述的权限认证模块针对不同的身份设置不同的界面,其中,若非用户登陆,只能够查看部分结果内容;对于评论用户,能够逐条对评论信息查看情感状况;对于餐厅工作人员,能够对文件式的数据输入评论信息查看情感分析;对于管理员,能够对系统功能和数据进行维护;对于游客,只能使用系统的部分功能,没有登录状态,不能展现结果内容。
所述的计算机系统中还包括交互模块,用于用户对餐厅不同方面的评论以及对不同餐厅的评论数据交互,餐厅商家对自身的餐厅评论数据以及其他餐厅的评论数据交互,以及管理员负责更新系统中的模型,完善数据中的数据。
本发明还提供了一种基于情感分析的餐厅用户评论分析方法,利用上述的基于情感分析的餐厅用户评论分析系统,包括以下步骤:
(1)对来自不同数据源的用户评论数据进行抓取;
(2)对抓取的原始数据进行人工标记使其作为训练集,再对标记好的数据进行预处理;
(3)选择特征提取模型,对预处理后的数据进行特征提取以得到字词特征向量和方面级向量;
(4)用训练集数据对语言模型进行预训练;并对预训练后的语言模型进行微调处理;
(5)利用语言模型对得到字词特征向量和方面级向量进一步处理;
(6)将处理后的字词特征向量和方面级向量输入到选择的算法模型中进行计算分析,得到分析结果进行输出展示。
与现有技术相比,本发明具有以下有益效果:
本发明情感分析的餐厅用户评论系统,不仅能够处理自身已有的数据集,还能够处理来自不同软件爬取的实时数据,具有更多的选择和实时性,而且提供不同的算法处理方式,能够通过不同的算法方式得到最优结果,为了方便用户和商家的可读性,提供了友好的界面展现交互的平台,能够有效的提高用户与餐厅商家之间有数据依据的交互。
附图说明
图1为本发明实施例一种基于情感分析的餐厅用户评论分析系统的工作流程图;
图2为本发明实施例一种基于情感分析的餐厅用户评论分析系统的模块结构图;
图3为本发明实施例一种基于情感分析的餐厅用户评论分析系统的使用示意图;
图4为本发明实施例中算法模型LSTMAE的结构示意图。
具体实施方式
下面结合附图和实施例对本发明做进一步详细描述,需要指出的是,以下所述实施例旨在便于对本发明的理解,而对其不起任何限定作用。
如图1所示,是本发明餐厅用户评论分析系统较佳实施例的作业流程图。
步骤S101,对来自不同的软件进行数据的爬取。其中,所述软件包括:饿了么、美团和大众点评等。
步骤S102,对来自不同数据源的数据进行预处理。其中所述数据包括:文本数据。所述预处理包括:对数据进行人工标注、数据清洗、数据过滤。具体而言:所述人工标注指:对餐厅用户评价中的属性词进行人工标记分类,建立属性词集和评论属性结构。
所述数据清洗指:将所有数据进行繁体转化简体,数据分词处理,删除分词后数据的停用词。
所述数据过滤指:过滤垃圾评论数据,比如文本数据中包含不相关的字段项,则直接删除该条记录。
步骤S103,对上述预处理后的数据进行特征提取。具体而言:对于所述文本数据每条记录,以条为单位进行特征提取,最终将文本数据转化为数字形式表述。
步骤S104,信息提示以及用户交互。所述信息提示指向用户展示当前数据运行结果,并提示用户进行相关的神经网络的分布表示方法:选择想要使用的语言模型。所述用户交互包括:选择内容输入。所述选择内容输入指在已有的语言模型内容中用户选择自己需求的一种即可。文本数据特征提取模型:GloVe、tf-idf和SVD三种方法。
步骤S105,用数据对语言模型进行预处理。所述数据来源于预处理和特征提取数据共同组合的数据,所述语言模型来源于上述用户选择的语言模型,语言模型包括:Word2Vec、elmo、Bert和Attention机制四种方法,通过大量的数据对语言模型进行预处理。
步骤S106,根据用户交互时的输入或选择对上述的特征提取方式进行进一步计算处理。具体而言:根据用户在交互时选择的语言模型对提取出的特征量做出进一步的处理,将语言模型处理后的字词向量和方面级向量为下一步做准备。
步骤S107,信息提示以及用户交互。所述信息提示指向用户展现出当前的数据运行结果,展现用户自选的语言模型处理后的字词向量结果,并提示用户进行相关的算法模型设置:选择想要使用的算法模型。算法模型的选择有:LSTMAE、LSTM、CNN、RNN、Attention机制、Bert和GCAE等。
步骤S108,根据用户交互时的输入或选择对上述以字词向量和方面级向量数据进行算法模型的计算处理。具体而言,根据用户选择的算法模型,系统对数据进行相对应的操作并运行数据得出结果。
步骤S109,权限认证。使得通过身份认证的用户才能够使用该系统提供的服务,从而保证了系统的安全。只有通过了身份权限的认证才能够看到结果界面,若非用户登陆,只能够查看部分结果内容,评论用户:逐条评论信息进行查看情感状况;餐厅工作人员:文件式的数据输入评论信息进行查看情感分析;管理员:对系统功能的维护和对数据的维护;游客:只能使用系统的部分功能,没有登录状态无展现结果内容。
步骤S110,将处理好的数据结果通过界面呈现。方便用户和商家更清楚的了解数据结果,通过图表的形式呈现在界面上。
如图2所示,本发明基于情感分析的餐厅用户评论分析系统主要包含了五个模块:用户评论获取模块、数据预处理模块、特征提取模块、算法处理模块以及结果展示模块。
用户评论获取模块,通过爬虫技术在不同的平台软件中获取需要的餐厅用户评论数据。
数据预处理模块用于对来自不同平台数据源的数据进行预处理。其中所述数据时文本数据。预处理包括:数据清洗和数据过滤。
特征提取模块用于对上述预处理后的数据进行特征提取以得到特征量。具体而言:对于所述文本数据每条记录,以条为单位进行特征提取,最终将文本数据转化为数字形式表述。用户根据信息提示选择自己想要使用的语言模型。所述选择内容输入指在已有的语言模型内容中用户选择自己需求的一种即可。文本数据特征提取模型:GloVe、tf-idf和SVD三种方法。文本数据语言模型:Word2Vec、elmo、Bert和Attention机制四种方法,根据用户在交互时选择的语言模型对提取出的特征量做出进一步的处理,将语言模型处理后的字词向量和方面级向量为下一步做准备。
算法处理模块用于将上述特征提取的特征量运用到模型算法中进行计算分析。用户根据用户选择的算法模型,系统对数据进行相对应的操作并运行数据得出结果。
结果展示模块用于商家和用户对结果的认识,通过不同的结果的展示,更全面的了解用户评论的分析结果内容。将处理好的数据结果通过界面呈现。方便用户和商家更清楚的了解数据结果,通过图表的形式呈现在界面上。
本发明的系统还包括权限认证模块,通过身份认证的用户才能够使用该系统提供的服务,从而保证了系统的安全。只有通过了身份权限的认证才能够看到结果界面,若非用户登陆,只能够查看部分结果内容,评论用户:逐条评论信息进行查看情感状况;餐厅工作人员:文件式的数据输入评论信息进行查看情感分析;管理员:对系统功能的维护和对数据的维护;游客:只能使用系统的部分功能,没有登录状态无展现结果内容。
本发明的系统还包括交互模块,如图3所示,用户和商家是对系统的输入和输出的反馈内容,用户对餐厅的各个方面的评论以及对不同餐厅的评论数据交互,餐厅商家对自身的餐厅评论数据以及其他餐厅的评论数据交互,后台的管理员负责更新系统中的模型,完善数据中的数据。
如图4所示,是本发明实施例中算法模型LSTMAE的结构示意图。
LSTMAE(Long Short Term with Aspect Embedding)是一种LSTM特殊的类型,可以学习长期依赖信息和方面词的嵌入,它拥有四个门,来保护和控制细胞状态。
从图中可以看出,第一步是决定丢弃信息。该门会读取ht-1和xt,输出一个在0到1之间的数值给每个在细胞状态Ct-1中的数字。1表示“完全保留”,0表示“完全舍弃”。
ft=σ(Wf·[ht-1,xt])+bf)
第二步是确定更新的信息。这里包含两个部分,第一,sigmoid层称“输入门层”决定什么值我们将要更新。然后一个tanh层创建一个新的候选值向量
Figure BDA0002049264750000091
会被加入到状态中。
Figure BDA0002049264750000092
第三步是方面词的嵌入内容。添加了对数据方面词VC·vC的嵌入更新,成为一个新的relu激活层。
gt=relu(WC·[ht-1,xt]+VC·vC+bC)
现在是更新旧细胞状态的时间,Ct-1更新为Ct。把就状态于ft相乘,丢弃掉确定需要丢弃的信息,接着加上
Figure BDA0002049264750000093
再添加上词嵌入
Figure BDA0002049264750000094
内容。这就是新的候选值,根据我们决定更新每个状态的程度进行变化。
最终,确定输出信息。这个输出是基于细胞状态,也是一个过滤后的结果。首先,运行一个sigmoid层确定细胞状态的那一部分将输出。接着把细胞状态通过tanh进行处理(得到一个在-1到1之间的值)并将它和sigmoid门的输出相乘,确定输出的部分。
ot=σ(Wo·[ht-1,xt])+bo)
ht=ot*tanh(Ct)
以上所述的实施例对本发明的技术方案和有益效果进行了详细说明,应理解的是以上所述仅为本发明的具体实施例,并不用于限制本发明,凡在本发明的原则范围内所做的任何修改、补充和等同替换,均应包含在本发明的保护范围之内。

Claims (3)

1.一种基于情感分析的餐厅用户评论分析系统,包括计算机系统,其特征在于,所述计算机系统中包含有以下模块:
用户评论获取模块,用于对不同的软件平台进行餐厅用户评论数据源的数据抓取;
数据预处理模块,用于对餐厅用户评论中的属性词进行人工标记分类,建立属性词集和评论属性结构,并且对人工标记分类后的数据进行预处理;所述数据预处理模块得到的评论属性结构表达式为:
R(L(l1,l2,l3),S(S1,S2,S3,S4),P(P1,P2,P3),E(E1,E2,E3,E4),D(D1,D2,D3,D4),O(O1,O2))
其中,L表示餐厅的位置,l1表示交通是否便利,l2表示距离商圈远近,l3表示是否容易寻找;S表示餐厅的服务,S1表示排队等候时间,S2表示服务人员态度,S3表示是否容易停车,S4表示点菜/上菜速度;P表示餐厅的价格,P1表示价格水平,P2表示性价比,P3表示折扣力度;E表示餐厅的环境,E1表示装修情况,E2表示嘈杂情况,E3表示就餐空间,E4表示卫生情况;D表示餐厅的菜品,D1表示菜的分量,D2表示菜的口感,D3表示菜的外观,D4表示菜的推荐程度;O表示其他内容,O1表示本次消费感受,O2表示再次消费的意愿;
特征提取模块,内含特征提取模型,用于对预处理后的数据进行特征提取以得到字词特征向量和方面级向量;特征提取模型包括GloVe、tf-idf和SVD中的至少一种;
预训练语言模型模块,用于对特征提取模块提取到的字词特征向量和方面级向量进行语言模型的预训练;预训练语言模型包括Word2Vec、elMo、Bert、Attention机制中的至少一种;
算法处理模块,内含算法模型,用于将预训练后的字词特征向量和方面级向量输入到算法模型中进行计算分析;所述算法处理模块中的算法模型为LSTMAE模型,公式如下:
Figure FDA0003052182610000021
其中,ft表示会从运行中丢弃的信息,it表示确定更新的信息,gt表示更新的方面级情感信息,Ct表示Ct-1的更新,Ct-1表示细胞的旧状态,
Figure FDA0003052182610000022
表示一个tanh层创建一个新的候选值向量;
结果展示模块,用于向使用者展示当前的计算分析结果以及系统运行状况;
权限认证模块,用于给系统增加登陆时的身份认证,不同的身份进入各自的界面中,得到自己需要的界面呈现;所述的权限认证模块针对不同的身份设置不同的界面,其中,若非用户登陆,只能够查看部分结果内容;对于评论用户,能够逐条对评论信息查看情感状况;对于餐厅工作人员,能够对文件式的数据输入评论信息查看情感分析;对于管理员,能够对系统功能和数据进行维护;对于游客,只能使用系统的部分功能,没有登录状态,不能展现结果内容;
交互模块,用于用户对餐厅不同方面的评论以及对不同餐厅的评论数据交互,餐厅商家对自身的餐厅评论数据以及其他餐厅的评论数据交互,以及管理员负责更新系统中的模型,完善数据中的数据。
2.根据权利要求1所述的基于情感分析的餐厅用户评论分析系统,其特征在于,所述用户评论获取模块针对不同的软件平台设置有对应的抓取规则,抓取的信息类别包括每条评论的ID号和评论内容。
3.一种基于情感分析的餐厅用户评论分析方法,其特征在于,利用权利要求1~2任一所述的基于情感分析的餐厅用户评论分析系统,包括以下步骤:
(1)对来自不同数据源的用户评论数据进行抓取;
(2)对抓取的原始数据进行人工标记使其作为训练集,再对标记好的数据进行预处理;
(3)选择特征提取模型,对预处理后的数据进行特征提取以得到字词特征向量和方面级向量;
(4)用训练集数据对语言模型进行预训练;并对预训练后的语言模型进行微调处理;
(5)利用语言模型对得到字词特征向量和方面级向量进一步处理;
(6)将处理后的字词特征向量和方面级向量输入到选择的算法模型中进行计算分析,得到分析结果进行输出展示。
CN201910369104.2A 2019-05-05 2019-05-05 一种基于情感分析的餐厅用户评论分析系统及方法 Active CN110134765B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910369104.2A CN110134765B (zh) 2019-05-05 2019-05-05 一种基于情感分析的餐厅用户评论分析系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910369104.2A CN110134765B (zh) 2019-05-05 2019-05-05 一种基于情感分析的餐厅用户评论分析系统及方法

Publications (2)

Publication Number Publication Date
CN110134765A CN110134765A (zh) 2019-08-16
CN110134765B true CN110134765B (zh) 2021-06-29

Family

ID=67576096

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910369104.2A Active CN110134765B (zh) 2019-05-05 2019-05-05 一种基于情感分析的餐厅用户评论分析系统及方法

Country Status (1)

Country Link
CN (1) CN110134765B (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110533954B (zh) * 2019-09-04 2022-09-27 河南观潮智能科技有限公司 一种城市停车位导航方法及系统
CN111008527A (zh) * 2019-12-18 2020-04-14 成都迪普曼林信息技术有限公司 一种情感分析系统及方法
CN111177380A (zh) * 2019-12-21 2020-05-19 厦门快商通科技股份有限公司 一种意图数据质检方法及系统
CN111445271A (zh) * 2020-03-31 2020-07-24 携程计算机技术(上海)有限公司 模型生成方法、作弊酒店的预测方法、系统、设备和介质
CN111507767A (zh) * 2020-04-17 2020-08-07 无锡雪浪数制科技有限公司 一种钢铁原料采购供应优化方法
CN112434161B (zh) * 2020-11-24 2023-01-03 哈尔滨工程大学 一种采用双向长短期记忆网络的方面级情感分析方法
CN112819518A (zh) * 2021-01-26 2021-05-18 山西三友和智慧信息技术股份有限公司 一种基于Bi-LSTM深度学习的餐厅评论情感分析系统
CN112966070A (zh) * 2021-02-03 2021-06-15 杭州师范大学 基于方面情感分析的公司员工评论分析系统与方法
CN112989200B (zh) * 2021-03-31 2024-06-07 珠海必要工业科技股份有限公司 商品使用信息的提供方法、基于评论信息改进关联信息方法
CN113377960A (zh) * 2021-07-20 2021-09-10 汇智数字科技控股(深圳)有限公司 用于平台商品评论的分析方法、处理器及装置
CN114519100A (zh) * 2022-02-22 2022-05-20 平安科技(深圳)有限公司 餐饮数据分析方法、装置、电子设备及存储介质

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102236646A (zh) * 2010-04-20 2011-11-09 得利在线信息技术(北京)有限公司 对象级垂直搜索引擎个性化排序算法iRank
CN102236722B (zh) * 2011-08-17 2014-08-27 广州索答信息科技有限公司 一种基于三元组的用户评论摘要的生成方法与系统
CN103207855B (zh) * 2013-04-12 2019-04-26 广东工业大学 针对产品评论信息的细粒度情感分析系统及方法
CN106294425B (zh) * 2015-05-26 2019-11-19 富泰华工业(深圳)有限公司 商品相关网络文章之自动图文摘要方法及系统
CN106127507A (zh) * 2016-06-13 2016-11-16 四川长虹电器股份有限公司 一种基于用户评价信息的商品舆情分析方法及系统
CN107330613A (zh) * 2017-06-29 2017-11-07 平安万家医疗投资管理有限责任公司 一种舆情监控方法、设备及计算机可读存储介质
CN109086357B (zh) * 2018-07-18 2021-06-22 深圳大学 基于变分自动编码器的情感分类方法、装置、设备及介质
CN109241251B (zh) * 2018-07-27 2022-05-27 众安信息技术服务有限公司 一种会话交互方法
CN109543180B (zh) * 2018-11-08 2020-12-04 中山大学 一种基于注意力机制的文本情感分析方法
CN109472031B (zh) * 2018-11-09 2021-05-04 电子科技大学 一种基于双记忆注意力的方面级别情感分类模型及方法
CN109597997B (zh) * 2018-12-07 2023-05-02 上海宏原信息科技有限公司 基于评论实体、方面级情感分类方法和装置及其模型训练
CN109684636B (zh) * 2018-12-20 2023-02-14 郑州轻工业学院 一种基于深度学习的用户情感分析方法

Also Published As

Publication number Publication date
CN110134765A (zh) 2019-08-16

Similar Documents

Publication Publication Date Title
CN110134765B (zh) 一种基于情感分析的餐厅用户评论分析系统及方法
CN108804512B (zh) 文本分类模型的生成装置、方法及计算机可读存储介质
CN111104498B (zh) 一种任务型对话系统中的语义理解方法
CN108984530B (zh) 一种网络敏感内容的检测方法及检测系统
CN109165294B (zh) 一种基于贝叶斯分类的短文本分类方法
CN110096575B (zh) 面向微博用户的心理画像方法
CN110489523B (zh) 一种基于网购评价的细粒度情感分析方法
CN108305050B (zh) 报案信息及服务需求信息的提取方法、装置、设备及介质
CN107657056A (zh) 基于人工智能展示评论信息的方法和装置
CN109919368B (zh) 一种基于关联图的法条推荐预测系统及方法
CN114238573A (zh) 基于文本对抗样例的信息推送方法及装置
CN110119849B (zh) 一种基于网络行为的人格特质预测方法及系统
CN109978020B (zh) 一种基于多维特征的社交网络账号马甲身份辨识方法
CN107886231B (zh) 客服的服务质量评价方法与系统
CN106708940A (zh) 用于处理图片的方法和装置
CN114238577B (zh) 融合多头注意力机制的多任务学习情感分类方法
CN113807103B (zh) 基于人工智能的招聘方法、装置、设备及存储介质
CN113051480A (zh) 资源推送方法、装置、电子设备及存储介质
CN113673239A (zh) 一种基于情感词典加权的酒店评论情感极性分类方法
CN107291774A (zh) 错误样本识别方法和装置
CN110569495A (zh) 一种基于用户评论的情感倾向分类方法、装置及存储介质
CN111488501A (zh) 一种基于云平台的电商统计系统
CN107609921A (zh) 一种数据处理方法及服务器
CN108073567A (zh) 一种特征词提取处理方法、系统及服务器
CN114298011B (zh) 神经网络、训练方法、方面级情感分析方法、装置及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant