CN107247702A - 一种文本情感分析处理方法和系统 - Google Patents
一种文本情感分析处理方法和系统 Download PDFInfo
- Publication number
- CN107247702A CN107247702A CN201710313628.0A CN201710313628A CN107247702A CN 107247702 A CN107247702 A CN 107247702A CN 201710313628 A CN201710313628 A CN 201710313628A CN 107247702 A CN107247702 A CN 107247702A
- Authority
- CN
- China
- Prior art keywords
- information
- text
- emotion
- term vector
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Machine Translation (AREA)
Abstract
本发明涉及一种文本情感分析处理方法和系统,方法包括:将文本进行分词处理;将文本分词进行词向量训练,得到二进制文件;从二进制文件中提取情感特征词组,并从中获取句法特征信息、情感特征信息;将句法特征信息和情感特征信息进行特征融合,得到含有句法及情感信息的文本特征;将二进制文件中的词向量与情感特征信息进行融合,得到含有情感信息的词向量;对词向量进行提取,得到含有情感信息的语义特征;将含有句法及情感信息的文本特征与含有情感信息的语义特征进行融合,从而得到文本的语法信息、语义信息、句法信息和情感信息。本发明解决了现有技术中提取的特征无法同时包含语义信息、句法信息和情感信息的问题,得到的结果准确性较高。
Description
技术领域
本发明涉及数据分析技术领域,特别涉及一种文本情感分析处理方法和系统。
背景技术
随着通信互联网技术的蓬勃发展以及web3.0时代的到来,互联网从单向传播模式逐渐转向以用户作为中心,使每给人参与的开放式架构理念。互联网用户不在仅仅读网页而是能够在网页上写自己的言论,由被动接受互联网信息转变为主动接受并传播互联网信息。微博,博客,论坛,新闻和产品评论等互联网应用产生了大量的由用户参与的,带有用户主观色彩并对人物,事件,产品等有价值的评论信息。通过分析这些评论信息的情感方向,政府可以更加了解人民的政策诉求。商家可以更加了解产品的市场需求。鉴于此,研究一种有效的文本情感分析方法有着十分重要的意义。
自2003年Nasukawa提出情感分析概念以来,大量的研究者对情感分析展开了深入而广泛的研究。Liu在2012年系统的介绍了情感分析的各个方面,按照不同的归类方式将情感分析的任务划分为不同的层次:按照处理文本的类型,可分为词或短语级别句子级别和文档级别的情感分析;按照情感分析任务的输出结果,可以将其划分为情感极性分析、情感强度测试等;按照研究方法,可以分为有监督的学习方法和无监督的学习方法等。
基于情感词典的文本情感分析方法,是一种典型的无监督学习。情感词典中,每个词或短语由专家赋予情感极性或者情感强度,研究者结合情感词典数据,构建人工规则,判断目标文本的情感极性。另一种监督学习是基于句子结构的方法。主观性文本比客观性文本使用更多的形容词和副词,而客观性文本中名词占有较大的比例。Tureny使用点互信息(PMI)方法扩展肯定和否定的种子词汇,通过研究包含情感倾向的句子结构,把极性语义(ISA)算法应用于文本的情感分析中,构造出多个固定的句式结构来分析目标文本是否含有情感倾向。
有监督的方法是使用大量的己标注的文本,通过机器学习算法,训练分类模型来预测目标文本的类别。Pang等最早将有监督的机器学习方法用于解决情感分析任务中,仅使用基本的词袋特征,取得的结果就高于基于规则的方法。
深度学习(Deep Learning)是一种多层的表征学习方法,每一层的抽象表示通过包含了很多神经元的隐层获得,抽象表示在不同隐层之间传递以使得在上一层能够获得更加抽象的信息表示。Bengio等人提出的由三层神经网络构建的n-gram模型是深度学习在自然语言处理领域的起源。他们提出的词的向量化表示(Distributed representation ofword,word embedding)取代了传统的one-hot表示。word embedding的优势在于避免了one-hot表示带来的维度灾难,提供了one-hot表示无法表达的词与词之间的相似度信息。同时该学习过程是无监督的,这意味着如果提供足够多的数据,这种方法将能够学习到语义信息更丰富的向量表示。
Bespalov利用深度神经网络构建了一个统一的有辨识能力的框架,该框架能够预测隐层空间和分类函数的参数并在在线产品评价分析中取得了出色的成果。Socher等人提出了半监督的循环自动编码机有效地预测了文本中的情感分布。Lai等人使用循环神经网络的架构来获得上下文的信息,相对于传统的基于窗口的神经网络在性能上获得了很大的提升。唐等人提出了融合了卷积神经网络和GRU单元的网络架构,成功地同时发挥出二者的优势。
现有技术在进行文本情感极性分析时,提取的特征无法同时包含语义信息、句法信息和情感信息,因此提取的结果均不够准确。
发明内容
本发明所要解决的技术问题是提供一种文本情感分析处理方法和系统。
本发明解决上述技术问题的技术方案如下:一种文本情感分析处理方法,适于在计算设备中执行,包括如下步骤:
步骤S1:根据分词工具将采集的文本进行分词处理,得到文本分词;
步骤S2:根据词向量工具将得到的文本分词进行词向量训练,得到文本分词的二进制文件,所述二进制文件中包括文本分词的词向量;
步骤S3:根据依存句法分析方法从所述二进制文件中提取情感特征词组,并从情感特征词组中获取句法特征信息,并根据情感词典获取所述情感特征词组的情感特征信息;
步骤S4:将所述句法特征信息和情感特征信息进行特征融合,得到含有句法及情感信息的文本特征;
步骤S5:将所述二进制文件中的词向量与所述情感特征信息进行融合,得到含有情感信息的词向量;
步骤S6:建立卷积神经网络,通过卷积神经网络对所述含有情感信息的词向量进行提取,得到含有情感信息的语义特征;
步骤S7:通过卷积神经网络将所述含有句法及情感信息的文本特征与所述含有情感信息的语义特征进行融合,从而得到文本的语法信息、语义信息、句法信息和情感信息。
本发明的有益效果是:利用依存句法分析方法获取句法特征信息,并根据情感词典获取情感特征信息,并进行融合得到句法及情感信息的文本特征,另外,将词向量与情感特征信息进行融合得到含有情感信息的词向量,并利用卷积神经网络提取词向量中含有情感信息的语义特征,最终将含有句法及情感信息的文本特征与含有情感信息的语义特征进行融合,经过多次融合,得到的特征能够同时包含语义信息、句法信息和情感信息,得到的结果准确性较高。
在上述技术方案的基础上,本发明还可以做如下改进。
进一步,所述步骤S1前还包括步骤:对采集的文本进行归一化处理,将文本中的非文本符号删除,得到归一化处理后的文本;所述非文本符号包括语言标识、字母、数字和非文本表情符号。
采用上述进一步方案的有益效果是:去除非文本符号,有利于对文本特征进行提取,提高准确性。
进一步,所述步骤S1具体包括:采用分词工具HanLP对归一化处理后的文本进行分词处理,再根据停用词词表在分词处理得到的文本中进行停用词删除处理,得到删除停用词的文本分词。
采用上述进一步方案的有益效果是:去除停用词,有利于对文本特征进行提取,提高准确性。
进一步,所述步骤S2具体为:根据Word2vec模型框架将得到的文本分词进行词向量训练,得到文本分词的二进制文件,所述二进制文件中包括文本分词的词向量。
进一步,所述Word2vec模型框架包括Skip-gram模型,
所述Skip-gram模型用于计算文本分词的词向量的条件概率,得到最大后验概率的文本分词,将最大后验概率的文本分词进行词向量训练,得到文本分词的二进制文件,所述二进制文件中包括文本分词的词向量。
采用上述进一步方案的有益效果是:能够最大化文本的后验概率,得到的词向量蕴含一定的语义信息。
进一步,所述步骤S4具体包括:根据SOAD算法计算情感特征信息的情感值,将所述句法特征信息的向量词与所述情感值进行融合,得到含有句法及情感信息的文本特征。
采用上述进一步方案的有益效果是:能够综合考虑词语所处的修饰位置,准确地获取情感特征词组,将所述句法特征信息的向量词与所述情感值进行融合,获取含有句法及情感信息的文本特征。
进一步,所述步骤S6具体为:建立CNN卷积神经网络,所述CNN卷积神经网络包括输入层、卷积层和池化层,
所述输入层,用于将所述含有情感信息的词向量输入CNN卷积神经网络中;
所述卷积层,用于将输入的所述含有情感信息的词向量进行卷积处理,得到含有情感信息的语义特征;
所述池化层,用于获取所述含有情感信息的语义特征的特征值,对所述特征值进行降采样,得到具有相同维度的所述含有情感信息的语义特征。
采用上述进一步方案的有益效果是:通过CNN卷积神经网络能够获取词向量中的语义特征,并对语义特征进行优化处理。
进一步,所述步骤S7具体为:所述CNN卷积神经网络还包括全连接层,
所述全连接层,用于将所述含有句法及情感信息的文本特征与所述含有情感信息的语义特征进行全连接,得到文本的语法信息、语义信息、句法信息和情感信息。
采用上述进一步方案的有益效果是:通过CNN卷积神经网络能够综合得到文本的语法信息、语义信息、句法信息和情感信息。
本发明解决上述技术问题的另一技术方案如下:一种文本情感分析处理系统,包括:
分词模块,用于根据分词工具将采集的文本进行分词处理,得到文本分词;
词向量训练模块,用于根据词向量工具将得到的文本分词进行词向量训练,得到文本分词的二进制文件,所述二进制文件中包括文本分词的词向量;
第一提取模块,用于根据依存句法分析方法从所述二进制文件中提取情感特征词组,并从情感特征词组中获取句法特征信息,并根据情感词典获取所述情感特征词组的情感特征信息;
第一融合模块,用于将所述句法特征信息和情感特征信息进行特征融合,得到含有句法及情感信息的文本特征;
第二融合模块,用于将所述二进制文件中的词向量与所述情感特征信息进行融合,得到含有情感信息的词向量;
第二提取模块,用于建立卷积神经网络,通过卷积神经网络对含有情感信息的词向量进行提取,得到含有情感信息的语义特征;
第三融合模块,用于通过卷积神经网络将所述含有句法及情感信息的文本特征与所述含有情感信息的语义特征进行融合,从而得到文本的语法信息、语义信息、句法信息和情感信息。
在上述技术方案的基础上,本发明还可以做如下改进。
进一步,所述第二提取模块中,建立CNN卷积神经网络,所述CNN卷积神经网络包括输入层、卷积层和池化层,
所述输入层,用于将所述含有情感信息的词向量输入CNN卷积神经网络中;
所述卷积层,用于将输入的所述含有情感信息的词向量进行卷积处理,得到含有情感信息的语义特征;
所述池化层,用于获取所述含有情感信息的语义特征的特征值,对所述特征值进行降采样,得到具有相同维度的所述含有情感信息的语义特征。
附图说明
图1为本发明实施例提供的文本情感分析处理方法的流程图;
图2为本发明实施例提供的文本情感分析处理系统的模块框图;
图3为本发明实施例在使用融合特征模型在不同词向量维度和是否包含情感信息在实验数据上文本分类的准确率对比;
图4为本发明实施例是语义特征和句法特征不同维度融合的情况下文本分类的准确率对比;
图5为本发明实施例在不同模型下实验文本数据分类的准确率对比。
具体实施方式
以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。
图1为本发明实施例提供的文本情感分析处理方法的流程图;
如图1所示,一种文本情感分析处理方法,适于在计算设备中执行,包括如下步骤:
步骤S1:根据分词工具将采集的文本进行分词处理,得到文本分词;
步骤S2:根据词向量工具将得到的文本分词进行词向量训练,得到文本分词的二进制文件,所述二进制文件中包括文本分词的词向量;
步骤S3:根据依存句法分析方法从所述二进制文件中提取情感特征词组,并从情感特征词组中获取句法特征信息,并根据情感词典获取所述情感特征词组的情感特征信息;
步骤S4:将所述句法特征信息和情感特征信息进行特征融合,得到含有句法及情感信息的文本特征;
步骤S5:将所述二进制文件中的词向量与所述情感特征信息进行融合,得到含有情感信息的词向量;
步骤S6:建立卷积神经网络,通过卷积神经网络对所述含有情感信息的词向量进行提取,得到含有情感信息的语义特征;
步骤S7:通过卷积神经网络将所述含有句法及情感信息的文本特征与所述含有情感信息的语义特征进行融合,从而得到文本的语法信息、语义信息、句法信息和情感信息。
上述实施例中,利用依存句法分析方法获取句法特征信息,并根据情感词典获取情感特征信息,并进行融合得到句法及情感信息的文本特征,另外,将词向量与情感特征信息进行融合得到含有情感信息的词向量,并利用卷积神经网络提取词向量中含有情感信息的语义特征,最终将含有句法及情感信息的文本特征与含有情感信息的语义特征进行融合,经过多次融合,得到的特征能够同时包含语义信息、句法信息和情感信息,得到的结果准确性较高。
可选地,作为本发明的一个实施例,所述步骤S1前还包括步骤:对采集的文本进行归一化处理,将文本中的非文本符号删除,得到归一化处理后的文本;所述非文本符号包括语言标识、字母、数字和非文本表情符号。
上述实施例中,去除非文本符号,有利于对文本特征进行提取,提高准确性。
可选地,作为本发明的一个实施例,所述步骤S1具体包括:采用分词工具HanLP对归一化处理后的文本进行分词处理,再根据停用词词表在分词处理得到的文本中进行停用词删除处理,得到删除停用词的文本分词。
应理解的,HanLP是由一系列模型与算法组成的Java工具包,目标是普及自然语言处理在生产环境中的应用。不仅仅是分词,而是提供词法分析、句法分析、语义理解等完备的功能,HanLP具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。
上述实施例中,去除停用词,有利于对文本特征进行提取,提高准确性。
可选地,作为本发明的一个实施例,所述步骤S2具体为:根据Word2vec模型框架将得到的文本分词进行词向量训练,得到文本分词的二进制文件,所述二进制文件中包括文本分词的词向量。
可选地,作为本发明的一个实施例,所述Word2vec模型框架包括Skip-gram模型,
所述Word2vec模型框架包括Skip-gram模型,
所述Skip-gram模型用于计算文本分词的词向量的条件概率,得到最大后验概率的文本分词,将最大后验概率的文本分词进行词向量训练,得到文本分词的二进制文件,所述二进制文件中包括文本分词的词向量;
具体的,Skip-gram模型的核心思想在于根据当前词预测上下文。该模型的目标在于最大化文档的后验概率:
在Skip-gram模型中,实现了两种参数训练方法(层次softmax和负采样);Word2vec模型训练得到的词向量蕴含一定的语义信息。
上述实施例中,能够最大化文本的后验概率,得到的词向量蕴含一定的语义信息。
可选地,作为本发明的一个实施例,所述步骤S4具体包括:根据SOAD算法计算情感特征信息的情感值,将所述句法特征信息的向量词与所述情感值进行融合,得到含有句法及情感信息的文本特征。
应理解的,情感词存在的依存修饰多为ADV(状中关系),情感词也多集中在这种修饰与被修饰的ADV依存关系中。因此,首先通过ADV依存关系的确定,抽取所有修饰情感关键词、与其共有依存关系的ADV关系对。在VOB(动宾关系)和CMP(动补结构)等个关系中,存在情感句法以为,需要转化为情感词语修饰的ADV关系,情感词语只是表示单个情感词的情感词性,如果只是以情感词估计在剧中的情感倾向性,将会忽略剧中修饰词的作用。因此,采用SOAD算法,认为词语间的这种修饰关系可以通过分析句法树中的基于情感词的依存关系来实现,这样便能综合考虑词语所处的修饰位置,用于准确地获取情感特征词组,同时与从情感词典的的情感信息相融合,获取含有情感信息的特征词组。
具体的,SOAD算法流程包括:
步骤1、首先用句法分析器对文本进行依存句法分析,以文本中的每一情感词为单位抽取关系对组,通过情感词典计算每个关系对组的原始情感初始值;
步骤2、针对依存句法获取的关系对组,结合程度副词情感强度和否定副词的修饰极性变化,计算其依存修饰后的情感值;
步骤3、计算所得的情感分值除了更新情感关系词的情感值,同时更新情感关系词组中包含的单个情感词、形容词、副词等词语的情感值。
上述实施例中,能够综合考虑词语所处的修饰位置,准确地获取情感特征词组,将所述句法特征信息的向量词与所述情感值进行融合,获取含有句法及情感信息的文本特征。
可选地,作为本发明的一个实施例,所述步骤S6具体为:建立CNN卷积神经网络,所述CNN卷积神经网络包括输入层Input、卷积层Convolution和池化层Pooling,
所述输入层Input,用于将所述含有情感信息的词向量输入CNN卷积神经网络中;
具体的,在输入层Input中,给定一段长度为n的文本s,其中wi为s中的第i个词所对应的词向量。因此,文本s可以表示为其中为连接操作,即wi:j表示s中第i个词对应向量的首尾连接,输入层Input即为文本s对应的词向量操作;
所述卷积层Convolution,用于将输入的所述含有情感信息的词向量进行卷积处理,得到含有情感信息的语义特征;
具体的,在卷积层Convolution中,卷积层将输入的多个词向量进行卷积操作,一个卷积操作可以解释为一个卷积滤波器
与h个词向量进行点乘操作所获取到的新的特征值,公式如下所示:
cj=f(mTwj-h+1:j+b)
其中f为非线性函数,如双曲正切激活函数、S型曲线激活函数等,b为偏置项,wj-h+1:j表示文本s中的第j-h+1个词到第i个词对应的词向量。在该操作下,我们可以将wj-h+1:j通过卷积滤波器m进行内积在和偏置项求和得到卷积为特征值cj。因此,在大小为h的滑动窗口下,我们可以得到特征值序列c([c1,c2,…,cn-h+1]),并且
所述池化层Pooling,用于获取所述含有情感信息的语义特征的特征值,对所述特征值进行降采样,得到具有相同维度的所述含有情感信息的语义特征;
具体的,在池化层Pooling中,通过卷积层中的卷积滤波器可得到特征值序列,通过池化层,我们可以得到特征其中q表示卷积滤波器的数量。但不同的文本s长度不一定相同,这就导致了c的长度也不同,并且我们只需要c中较为重要的信息。因此CNN模型中通过降采样,即添加池化层的方式来获取特征值序列中重要的信息以及控制输出的一致性。通过池化操作,可以使同一个卷积滤波器对不同文本生成相同维度的特征。
上述实施例中,通过CNN卷积神经网络能够获取词向量中的语义特征,并对语义特征进行优化处理。
可选地,作为本发明的一个实施例,所述步骤S7具体为:所述CNN卷积神经网络还包括全连接层,
所述全连接层,用于将所述含有句法及情感信息的文本特征与所述含有情感信息的语义特征进行全连接,得到文本的语法信息、语义信息、句法信息和情感信息。
上述实施例中,通过CNN卷积神经网络能够综合得到文本的语法信息、语义信息、句法信息和情感信息。
可选地,作为本发明的一个实施例,在全连接层之后还包括分类层softmax,分类层softmax用于对结果进行分析和评估,具体的,将各特征信息输入分类层softmax,可预测出该文本s的类标,得到预测类标后,与标准文本类标进行比价,通过反向传播(backpropagation)方式将误差传递给前面各个层,更新网络中的参数。Softmax函数公式如下所示:
其中符合θ表示全部的模型参数,z表示分类层的输入,Softmax损失函数中对类标记的k个可能值进行了累加,整体概率函数表示估计z分类为1的概率,本发明文本情感分析分为0和1两类,积极和消极,将情感信息和语义信息混合在同一维度空间进行训练,其中包括情感空间和语义空间,同时训练,将负面的正面的情感词分别以正值向量和负值向量进行映射,非情感词以形同维度的0向量进行映射,从而实现文本情感极性分析。
图2为本发明实施例提供的文本情感分析处理系统的模块框图;
可选地,作为本发明的另一个实施例,如图2所示,一种文本情感分析处理系统,包括:
分词模块,用于根据分词工具将采集的文本进行分词处理,得到文本分词;
词向量训练模块,用于根据词向量工具将得到的文本分词进行词向量训练,得到文本分词的二进制文件,所述二进制文件中包括文本分词的词向量;
第一提取模块,用于根据依存句法分析方法从所述二进制文件中提取情感特征词组,并从情感特征词组中获取句法特征信息,并根据情感词典获取所述情感特征词组的情感特征信息;
第一融合模块,用于将所述句法特征信息和情感特征信息进行特征融合,得到含有句法及情感信息的文本特征;
第二融合模块,用于将所述二进制文件中的词向量与所述情感特征信息进行融合,得到含有情感信息的词向量;
第二提取模块,用于建立卷积神经网络,通过卷积神经网络对含有情感信息的词向量进行提取,得到含有情感信息的语义特征;
第三融合模块,用于通过卷积神经网络将所述含有句法及情感信息的文本特征与所述含有情感信息的语义特征进行融合,从而得到文本的语法信息、语义信息、句法信息和情感信息。
可选地,作为本发明的一个实施例,所述第二提取模块中,建立CNN卷积神经网络,所述CNN卷积神经网络包括输入层、卷积层和池化层,
所述输入层,用于将所述含有情感信息的词向量输入CNN卷积神经网络中;
所述卷积层,用于将输入的所述含有情感信息的词向量进行卷积处理,得到含有情感信息的语义特征;
所述池化层,用于获取所述含有情感信息的语义特征的特征值,对所述特征值进行降采样,得到具有相同维度的所述含有情感信息的语义特征。
本发明利用依存句法分析方法获取句法特征信息,并根据情感词典获取情感特征信息,并进行融合得到句法及情感信息的文本特征,另外,将词向量与情感特征信息进行融合得到含有情感信息的词向量,并利用卷积神经网络提取词向量中含有情感信息的语义特征,最终将含有句法及情感信息的文本特征与含有情感信息的语义特征进行融合,经过多次融合,得到的特征能够同时包含语义信息、句法信息和情感信息,得到的结果准确性较高。
下面通过实验数据说明,实施例方法使用不同维度的词向量和是否含有情感信息文本分类方法准确率的评估:
在本实例中,将融合句法信息、语法信息、语义信息和情感信息的特征词向量维度取以下几个值:100,150,200,250,300,350,400,450,500。
其实验结果如图3所示,对比可知,不同维度的词向量对实验结果的影响。在词向量维度较低时,语义信息无法充分的表示,部分语义特征缺失,使得分类的结果不是很理想,随着维度的增加,语义信息表示充分,语义特征得到充分提取,分类准确率提高并趋于稳定。包含情感信息的语义特征分类准确率要比不含语义特征的准确率要高。因此,以下对比是将词向量维度为300维(词向量维度越高,训练模型时间越久,对电脑资源要求高,因此,选用300维),包含情感信息的条件下比较:
1)实施例方法在不同维度特征融合下的文本分类准确率评估:
对比词向量总维度相同(取实验一的最优实验结果300维)条件下,使得含有情感的语义特征词向量和含有情感的句法特征去不同的维度,对比分类效果。如图4所示,横坐标表示含有情感信息的句法特征所占的词向量维度。一开始0维度时,不包含句法特征,是语义特征实现的情感分类,随着句法特征的增加到50维,由于信息太少,不仅未起到提高分类效果,反而对语义特征是噪声信息,当增加到250为时,同理,文本情感分类准确率下降。只有含有情感信息的语义特征和含有情感信息的句法特征的词向量都在150维左右时,起到了互补的作用,是文本情感分类效果最好,准确率达到0.9456。
2)实施例方法在不同模型下的文本分类准确率评估:
本实施例对比卷积神经网络模型、含有情感信息和语义特征的卷神经网络模型和含有语义特征、句法特征、情感信息的最优分类结果对比。
如图5所示,柱形图1是普通卷积神经网络的文本情感分类准确率,柱形图2是使用依存句法提取句法特征并且包含情感信息的文本分类准确率,柱形图3是使用包含情感信息的语义特征进行文本情感分类的准确率,柱形图4是特征融合后的文本情感分类准确率。由实验可知,包含情感信息的语义特征,句法特征分类效果要比普通的CNN分类效果要好。而采取特征融合的方法,更加充分提取了情感特征,弥补缺失的句法特征,使得文本情感分类准确率0.9456。最终分类效果高于其它文本情感分析模型。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种文本情感分析处理方法,适于在计算设备中执行,其特征在于,包括如下步骤:
步骤S1:根据分词工具将采集的文本进行分词处理,得到文本分词;
步骤S2:根据词向量工具将得到的文本分词进行词向量训练,得到文本分词的二进制文件,所述二进制文件中包括文本分词的词向量;
步骤S3:根据依存句法分析方法从所述二进制文件中提取情感特征词组,并从情感特征词组中获取句法特征信息,并根据情感词典获取所述情感特征词组的情感特征信息;
步骤S4:将所述句法特征信息和情感特征信息进行特征融合,得到含有句法及情感信息的文本特征;
步骤S5:将所述二进制文件中的词向量与所述情感特征信息进行融合,得到含有情感信息的词向量;
步骤S6:建立卷积神经网络,通过卷积神经网络对所述含有情感信息的词向量进行提取,得到含有情感信息的语义特征;
步骤S7:通过卷积神经网络将所述含有句法及情感信息的文本特征与所述含有情感信息的语义特征进行融合,从而得到文本的语法信息、语义信息、句法信息和情感信息。
2.根据权利要求1所述一种文本情感分析处理方法,其特征在于,所述步骤S1前还包括步骤:对采集的文本进行归一化处理,将文本中的非文本符号删除,得到归一化处理后的文本;所述非文本符号包括语言标识、字母、数字和非文本表情符号。
3.根据权利要求2所述一种文本情感分析处理方法,其特征在于,所述步骤S1具体包括:采用分词工具HanLP对归一化处理后的文本进行分词处理,再根据停用词词表在分词处理得到的文本中进行停用词删除处理,得到删除停用词的文本分词。
4.根据权利要求1所述一种文本情感分析处理方法,其特征在于,所述步骤S2具体为:根据Word2vec模型框架将得到的文本分词进行词向量训练,得到文本分词的二进制文件,所述二进制文件中包括文本分词的词向量。
5.根据权利要求4所述一种文本情感分析处理方法,其特征在于,所述Word2vec模型框架包括Skip-gram模型,
所述Skip-gram模型用于计算文本分词的词向量的条件概率,得到最大后验概率的文本分词,将最大后验概率的文本分词进行词向量训练,得到文本分词的二进制文件,所述二进制文件中包括文本分词的词向量。
6.根据权利要求4所述一种文本情感分析处理方法,其特征在于,所述步骤S4具体包括:根据SOAD算法计算情感特征信息的情感值,将所述句法特征信息的向量词与所述情感值进行融合,得到含有句法及情感信息的文本特征。
7.根据权利要求1所述一种文本情感分析处理方法,其特征在于,所述步骤S6具体为:建立CNN卷积神经网络,所述CNN卷积神经网络包括输入层、卷积层和池化层,
所述输入层,用于将所述含有情感信息的词向量输入CNN卷积神经网络中;
所述卷积层,用于将输入的所述含有情感信息的词向量进行卷积处理,得到含有情感信息的语义特征;
所述池化层,用于获取所述含有情感信息的语义特征的特征值,对所述特征值进行降采样,得到具有相同维度的所述含有情感信息的语义特征。
8.根据权利要求7所述一种文本情感分析处理方法,其特征在于,所述步骤S7具体为:所述CNN卷积神经网络还包括全连接层,
所述全连接层,用于将所述含有句法及情感信息的文本特征与所述含有情感信息的语义特征进行全连接,得到文本的语法信息、语义信息、句法信息和情感信息。
9.一种文本情感分析处理系统,其特征在于,包括:
分词模块,用于根据分词工具将采集的文本进行分词处理,得到文本分词;
词向量训练模块,用于根据词向量工具将得到的文本分词进行词向量训练,得到文本分词的二进制文件,所述二进制文件中包括文本分词的词向量;
第一提取模块,用于根据依存句法分析方法从所述二进制文件中提取情感特征词组,并从情感特征词组中获取句法特征信息,并根据情感词典获取所述情感特征词组的情感特征信息;
第一融合模块,用于将所述句法特征信息和情感特征信息进行特征融合,得到含有句法及情感信息的文本特征;
第二融合模块,用于将所述二进制文件中的词向量与所述情感特征信息进行融合,得到含有情感信息的词向量;
第二提取模块,用于建立卷积神经网络,通过卷积神经网络对含有情感信息的词向量进行提取,得到含有情感信息的语义特征;
第三融合模块,用于通过卷积神经网络将所述含有句法及情感信息的文本特征与所述含有情感信息的语义特征进行融合,从而得到文本的语法信息、语义信息、句法信息和情感信息。
10.根据权利要求7所述一种文本情感分析处理系统,其特征在于,所述第二提取模块中,建立CNN卷积神经网络,所述CNN卷积神经网络包括输入层、卷积层和池化层,
所述输入层,用于将所述含有情感信息的词向量输入CNN卷积神经网络中;
所述卷积层,用于将输入的所述含有情感信息的词向量进行卷积处理,得到含有情感信息的语义特征;
所述池化层,用于获取所述含有情感信息的语义特征的特征值,对所述特征值进行降采样,得到具有相同维度的所述含有情感信息的语义特征。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710313628.0A CN107247702A (zh) | 2017-05-05 | 2017-05-05 | 一种文本情感分析处理方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710313628.0A CN107247702A (zh) | 2017-05-05 | 2017-05-05 | 一种文本情感分析处理方法和系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107247702A true CN107247702A (zh) | 2017-10-13 |
Family
ID=60017496
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710313628.0A Pending CN107247702A (zh) | 2017-05-05 | 2017-05-05 | 一种文本情感分析处理方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107247702A (zh) |
Cited By (38)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107590134A (zh) * | 2017-10-26 | 2018-01-16 | 福建亿榕信息技术有限公司 | 文本情感分类方法、存储介质及计算机 |
CN107943860A (zh) * | 2017-11-08 | 2018-04-20 | 北京奇艺世纪科技有限公司 | 模型的训练方法、文本意图的识别方法及装置 |
CN107967258A (zh) * | 2017-11-23 | 2018-04-27 | 广州艾媒数聚信息咨询股份有限公司 | 文本信息的情感分析方法和系统 |
CN108009284A (zh) * | 2017-12-22 | 2018-05-08 | 重庆邮电大学 | 采用半监督卷积神经网络的法律文本分类方法 |
CN108039181A (zh) * | 2017-11-02 | 2018-05-15 | 北京捷通华声科技股份有限公司 | 一种声音信号的情感信息分析方法和装置 |
CN108133038A (zh) * | 2018-01-10 | 2018-06-08 | 重庆邮电大学 | 一种基于动态记忆网络的实体级别情感分类系统及方法 |
CN108170681A (zh) * | 2018-01-15 | 2018-06-15 | 中南大学 | 文本情感分析方法、系统及计算机可读存储介质 |
CN108460089A (zh) * | 2018-01-23 | 2018-08-28 | 哈尔滨理工大学 | 基于Attention神经网络的多元特征融合中文文本分类方法 |
CN108614548A (zh) * | 2018-04-03 | 2018-10-02 | 北京理工大学 | 一种基于多模态融合深度学习的智能故障诊断方法 |
CN108628834A (zh) * | 2018-05-14 | 2018-10-09 | 国家计算机网络与信息安全管理中心 | 一种基于句法依存关系的词语表示学习方法 |
CN108763204A (zh) * | 2018-05-21 | 2018-11-06 | 浙江大学 | 一种多层次的文本情感特征提取方法和模型 |
CN109033089A (zh) * | 2018-09-06 | 2018-12-18 | 北京京东尚科信息技术有限公司 | 情感分析方法和装置 |
CN109145304A (zh) * | 2018-09-07 | 2019-01-04 | 中山大学 | 一种基于字的中文观点要素情感分析方法 |
CN109165387A (zh) * | 2018-09-20 | 2019-01-08 | 南京信息工程大学 | 一种基于gru神经网络的中文评论情感分析法 |
CN109325124A (zh) * | 2018-09-30 | 2019-02-12 | 武汉斗鱼网络科技有限公司 | 一种情感分类方法、装置、服务器和存储介质 |
CN109739960A (zh) * | 2018-12-11 | 2019-05-10 | 中科恒运股份有限公司 | 文本的情感分析方法、情感分析装置及终端 |
CN109918500A (zh) * | 2019-01-17 | 2019-06-21 | 平安科技(深圳)有限公司 | 基于卷积神经网络的文本分类方法及相关设备 |
CN110083825A (zh) * | 2019-03-21 | 2019-08-02 | 昆明理工大学 | 一种基于gru模型的老挝语情感分析方法 |
CN110096588A (zh) * | 2018-01-30 | 2019-08-06 | 埃森哲环球解决方案有限公司 | 跨语言文本分类 |
CN110110137A (zh) * | 2019-03-19 | 2019-08-09 | 咪咕音乐有限公司 | 一种确定音乐特征的方法、装置、电子设备及存储介质 |
CN110175325A (zh) * | 2019-04-26 | 2019-08-27 | 南京邮电大学 | 基于词向量和句法特征的评论分析方法及可视化交互界面 |
CN110348420A (zh) * | 2019-07-18 | 2019-10-18 | 腾讯科技(深圳)有限公司 | 手语识别方法、装置、计算机可读存储介质和计算机设备 |
CN110362810A (zh) * | 2018-03-26 | 2019-10-22 | 优酷网络技术(北京)有限公司 | 文本分析方法及装置 |
CN110362809A (zh) * | 2018-03-26 | 2019-10-22 | 优酷网络技术(北京)有限公司 | 文本分析方法及装置 |
CN110362808A (zh) * | 2018-03-26 | 2019-10-22 | 优酷网络技术(北京)有限公司 | 文本分析方法及装置 |
CN110472041A (zh) * | 2019-07-01 | 2019-11-19 | 浙江工业大学 | 一种面向客服在线质检的文本分类方法 |
CN110555104A (zh) * | 2018-03-26 | 2019-12-10 | 优酷网络技术(北京)有限公司 | 文本分析方法及装置 |
CN110852060A (zh) * | 2018-07-24 | 2020-02-28 | 中国科学院声学研究所 | 一种基于外部知识的情感迁移方法 |
CN110874408A (zh) * | 2018-08-29 | 2020-03-10 | 阿里巴巴集团控股有限公司 | 模型训练方法、文本识别方法、装置及计算设备 |
CN111027313A (zh) * | 2018-10-08 | 2020-04-17 | 中国科学院沈阳计算技术研究所有限公司 | 基于注意力机制的BiGRU判决结果倾向性分析方法 |
WO2020082561A1 (zh) * | 2018-10-25 | 2020-04-30 | 平安科技(深圳)有限公司 | 文本输入的预测方法、装置、计算机设备和存储介质 |
CN111339305A (zh) * | 2020-03-20 | 2020-06-26 | 北京中科模识科技有限公司 | 文本分类方法、装置、电子设备及存储介质 |
CN111462738A (zh) * | 2019-01-18 | 2020-07-28 | 阿里巴巴集团控股有限公司 | 语音识别方法及装置 |
CN112035661A (zh) * | 2020-08-24 | 2020-12-04 | 北京大学深圳研究生院 | 基于图卷积网络的文本情感分析方法、系统和电子装置 |
CN112100325A (zh) * | 2020-08-28 | 2020-12-18 | 广州探迹科技有限公司 | 一种基于分层门控循环单元的人机对话情感分析方法 |
CN112115700A (zh) * | 2020-08-19 | 2020-12-22 | 北京交通大学 | 一种基于依存句法树和深度学习的方面级情感分析方法 |
CN112364167A (zh) * | 2020-11-20 | 2021-02-12 | 携程计算机技术(上海)有限公司 | 基于深度学习的意图识别方法、系统、设备及存储介质 |
CN117350287A (zh) * | 2023-10-18 | 2024-01-05 | 重庆邮电大学 | 一种基于舆情大数据的文本情感分析方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105824922A (zh) * | 2016-03-16 | 2016-08-03 | 重庆邮电大学 | 一种融合深层特征和浅层特征的情感分类方法 |
-
2017
- 2017-05-05 CN CN201710313628.0A patent/CN107247702A/zh active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105824922A (zh) * | 2016-03-16 | 2016-08-03 | 重庆邮电大学 | 一种融合深层特征和浅层特征的情感分类方法 |
Non-Patent Citations (3)
Title |
---|
冯时 等: "《基于依存句法的博文情感倾向分析》", 《计算机研究与发展》 * |
张志华: "《基于深度学习的情感词向量及文本情感分析的研究》", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
黄文明 等: "《基于最大熵的中文短文本情感分析》", 《计算机工程与设计》 * |
Cited By (55)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107590134A (zh) * | 2017-10-26 | 2018-01-16 | 福建亿榕信息技术有限公司 | 文本情感分类方法、存储介质及计算机 |
CN108039181A (zh) * | 2017-11-02 | 2018-05-15 | 北京捷通华声科技股份有限公司 | 一种声音信号的情感信息分析方法和装置 |
CN107943860B (zh) * | 2017-11-08 | 2020-10-27 | 北京奇艺世纪科技有限公司 | 模型的训练方法、文本意图的识别方法及装置 |
CN107943860A (zh) * | 2017-11-08 | 2018-04-20 | 北京奇艺世纪科技有限公司 | 模型的训练方法、文本意图的识别方法及装置 |
CN107967258A (zh) * | 2017-11-23 | 2018-04-27 | 广州艾媒数聚信息咨询股份有限公司 | 文本信息的情感分析方法和系统 |
CN107967258B (zh) * | 2017-11-23 | 2021-09-17 | 广州艾媒数聚信息咨询股份有限公司 | 文本信息的情感分析方法和系统 |
CN108009284A (zh) * | 2017-12-22 | 2018-05-08 | 重庆邮电大学 | 采用半监督卷积神经网络的法律文本分类方法 |
CN108133038A (zh) * | 2018-01-10 | 2018-06-08 | 重庆邮电大学 | 一种基于动态记忆网络的实体级别情感分类系统及方法 |
CN108133038B (zh) * | 2018-01-10 | 2022-03-22 | 重庆邮电大学 | 一种基于动态记忆网络的实体级别情感分类系统及方法 |
CN108170681A (zh) * | 2018-01-15 | 2018-06-15 | 中南大学 | 文本情感分析方法、系统及计算机可读存储介质 |
CN108460089B (zh) * | 2018-01-23 | 2022-03-01 | 海南师范大学 | 基于Attention神经网络的多元特征融合中文文本分类方法 |
CN108460089A (zh) * | 2018-01-23 | 2018-08-28 | 哈尔滨理工大学 | 基于Attention神经网络的多元特征融合中文文本分类方法 |
CN110096588A (zh) * | 2018-01-30 | 2019-08-06 | 埃森哲环球解决方案有限公司 | 跨语言文本分类 |
CN110362809A (zh) * | 2018-03-26 | 2019-10-22 | 优酷网络技术(北京)有限公司 | 文本分析方法及装置 |
CN110362808A (zh) * | 2018-03-26 | 2019-10-22 | 优酷网络技术(北京)有限公司 | 文本分析方法及装置 |
CN110362810A (zh) * | 2018-03-26 | 2019-10-22 | 优酷网络技术(北京)有限公司 | 文本分析方法及装置 |
CN110555104A (zh) * | 2018-03-26 | 2019-12-10 | 优酷网络技术(北京)有限公司 | 文本分析方法及装置 |
CN108614548A (zh) * | 2018-04-03 | 2018-10-02 | 北京理工大学 | 一种基于多模态融合深度学习的智能故障诊断方法 |
CN108614548B (zh) * | 2018-04-03 | 2020-08-18 | 北京理工大学 | 一种基于多模态融合深度学习的智能故障诊断方法 |
CN108628834B (zh) * | 2018-05-14 | 2022-04-15 | 国家计算机网络与信息安全管理中心 | 一种基于句法依存关系的词语表示学习方法 |
CN108628834A (zh) * | 2018-05-14 | 2018-10-09 | 国家计算机网络与信息安全管理中心 | 一种基于句法依存关系的词语表示学习方法 |
CN108763204A (zh) * | 2018-05-21 | 2018-11-06 | 浙江大学 | 一种多层次的文本情感特征提取方法和模型 |
CN110852060B (zh) * | 2018-07-24 | 2021-05-18 | 中国科学院声学研究所 | 一种基于外部知识的情感迁移方法 |
CN110852060A (zh) * | 2018-07-24 | 2020-02-28 | 中国科学院声学研究所 | 一种基于外部知识的情感迁移方法 |
CN110874408B (zh) * | 2018-08-29 | 2023-05-26 | 阿里巴巴集团控股有限公司 | 模型训练方法、文本识别方法、装置及计算设备 |
CN110874408A (zh) * | 2018-08-29 | 2020-03-10 | 阿里巴巴集团控股有限公司 | 模型训练方法、文本识别方法、装置及计算设备 |
CN109033089B (zh) * | 2018-09-06 | 2021-01-26 | 北京京东尚科信息技术有限公司 | 情感分析方法和装置 |
CN109033089A (zh) * | 2018-09-06 | 2018-12-18 | 北京京东尚科信息技术有限公司 | 情感分析方法和装置 |
CN109145304B (zh) * | 2018-09-07 | 2022-09-06 | 中山大学 | 一种基于字的中文观点要素情感分析方法 |
CN109145304A (zh) * | 2018-09-07 | 2019-01-04 | 中山大学 | 一种基于字的中文观点要素情感分析方法 |
CN109165387A (zh) * | 2018-09-20 | 2019-01-08 | 南京信息工程大学 | 一种基于gru神经网络的中文评论情感分析法 |
CN109325124B (zh) * | 2018-09-30 | 2020-10-16 | 武汉斗鱼网络科技有限公司 | 一种情感分类方法、装置、服务器和存储介质 |
CN109325124A (zh) * | 2018-09-30 | 2019-02-12 | 武汉斗鱼网络科技有限公司 | 一种情感分类方法、装置、服务器和存储介质 |
CN111027313A (zh) * | 2018-10-08 | 2020-04-17 | 中国科学院沈阳计算技术研究所有限公司 | 基于注意力机制的BiGRU判决结果倾向性分析方法 |
WO2020082561A1 (zh) * | 2018-10-25 | 2020-04-30 | 平安科技(深圳)有限公司 | 文本输入的预测方法、装置、计算机设备和存储介质 |
CN109739960A (zh) * | 2018-12-11 | 2019-05-10 | 中科恒运股份有限公司 | 文本的情感分析方法、情感分析装置及终端 |
CN109918500A (zh) * | 2019-01-17 | 2019-06-21 | 平安科技(深圳)有限公司 | 基于卷积神经网络的文本分类方法及相关设备 |
CN111462738A (zh) * | 2019-01-18 | 2020-07-28 | 阿里巴巴集团控股有限公司 | 语音识别方法及装置 |
CN111462738B (zh) * | 2019-01-18 | 2024-05-03 | 阿里巴巴集团控股有限公司 | 语音识别方法及装置 |
CN110110137A (zh) * | 2019-03-19 | 2019-08-09 | 咪咕音乐有限公司 | 一种确定音乐特征的方法、装置、电子设备及存储介质 |
CN110083825A (zh) * | 2019-03-21 | 2019-08-02 | 昆明理工大学 | 一种基于gru模型的老挝语情感分析方法 |
CN110175325B (zh) * | 2019-04-26 | 2023-07-11 | 南京邮电大学 | 基于词向量和句法特征的评论分析方法及可视化交互界面 |
CN110175325A (zh) * | 2019-04-26 | 2019-08-27 | 南京邮电大学 | 基于词向量和句法特征的评论分析方法及可视化交互界面 |
CN110472041A (zh) * | 2019-07-01 | 2019-11-19 | 浙江工业大学 | 一种面向客服在线质检的文本分类方法 |
CN110348420A (zh) * | 2019-07-18 | 2019-10-18 | 腾讯科技(深圳)有限公司 | 手语识别方法、装置、计算机可读存储介质和计算机设备 |
US11749029B2 (en) | 2019-07-18 | 2023-09-05 | Tencent Technology (Shenzhen) Company Limited | Gesture language recognition method and apparatus, computer-readable storage medium, and computer device |
CN110348420B (zh) * | 2019-07-18 | 2022-03-18 | 腾讯科技(深圳)有限公司 | 手语识别方法、装置、计算机可读存储介质和计算机设备 |
CN111339305A (zh) * | 2020-03-20 | 2020-06-26 | 北京中科模识科技有限公司 | 文本分类方法、装置、电子设备及存储介质 |
CN111339305B (zh) * | 2020-03-20 | 2023-04-14 | 北京中科模识科技有限公司 | 文本分类方法、装置、电子设备及存储介质 |
CN112115700A (zh) * | 2020-08-19 | 2020-12-22 | 北京交通大学 | 一种基于依存句法树和深度学习的方面级情感分析方法 |
CN112115700B (zh) * | 2020-08-19 | 2024-03-12 | 北京交通大学 | 一种基于依存句法树和深度学习的方面级情感分析方法 |
CN112035661A (zh) * | 2020-08-24 | 2020-12-04 | 北京大学深圳研究生院 | 基于图卷积网络的文本情感分析方法、系统和电子装置 |
CN112100325A (zh) * | 2020-08-28 | 2020-12-18 | 广州探迹科技有限公司 | 一种基于分层门控循环单元的人机对话情感分析方法 |
CN112364167A (zh) * | 2020-11-20 | 2021-02-12 | 携程计算机技术(上海)有限公司 | 基于深度学习的意图识别方法、系统、设备及存储介质 |
CN117350287A (zh) * | 2023-10-18 | 2024-01-05 | 重庆邮电大学 | 一种基于舆情大数据的文本情感分析方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107247702A (zh) | 一种文本情感分析处理方法和系统 | |
Abdullah et al. | SEDAT: sentiment and emotion detection in Arabic text using CNN-LSTM deep learning | |
CN109145112B (zh) | 一种基于全局信息注意力机制的商品评论分类方法 | |
CN111444709B (zh) | 文本分类方法、装置、存储介质及设备 | |
CN109933664B (zh) | 一种基于情感词嵌入的细粒度情绪分析改进方法 | |
CN109284506A (zh) | 一种基于注意力卷积神经网络的用户评论情感分析系统及方法 | |
CN109325112B (zh) | 一种基于emoji的跨语言情感分析方法和装置 | |
CN107025284A (zh) | 网络评论文本情感倾向的识别方法及卷积神经网络模型 | |
CN108733653A (zh) | 一种基于融合词性和语义信息的Skip-gram模型的情感分析方法 | |
Wahid et al. | Cricket sentiment analysis from Bangla text using recurrent neural network with long short term memory model | |
Peng et al. | Human–machine dialogue modelling with the fusion of word-and sentence-level emotions | |
CN110362819A (zh) | 基于卷积神经网络的文本情感分析方法 | |
CN110750648A (zh) | 一种基于深度学习和特征融合的文本情感分类方法 | |
CN111950296A (zh) | 一种基于bert微调模型的评论目标情感分析 | |
CN111339772B (zh) | 俄语文本情感分析方法、电子设备和存储介质 | |
Pan et al. | Deep neural network-based classification model for Sentiment Analysis | |
CN110297986A (zh) | 一种微博热点话题的情感倾向分析方法 | |
CN112685541A (zh) | 一种基于多任务学习的社交媒体谣言检测方法 | |
Krommyda et al. | Emotion detection in Twitter posts: a rule-based algorithm for annotated data acquisition | |
Jia | Sentiment classification of microblog: A framework based on BERT and CNN with attention mechanism | |
Ullah et al. | A deep neural network-based approach for sentiment analysis of movie reviews | |
Katyayan et al. | Sarcasm detection approaches for English language | |
CN113934835B (zh) | 结合关键词和语义理解表征的检索式回复对话方法及系统 | |
Vitman et al. | Sarcasm detection framework using context, emotion and sentiment features | |
Hasnat et al. | Understanding sarcasm from reddit texts using supervised algorithms |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20171013 |
|
RJ01 | Rejection of invention patent application after publication |