CN112667818B - 融合gcn与多粒度注意力的用户评论情感分析方法及系统 - Google Patents
融合gcn与多粒度注意力的用户评论情感分析方法及系统 Download PDFInfo
- Publication number
- CN112667818B CN112667818B CN202110001581.0A CN202110001581A CN112667818B CN 112667818 B CN112667818 B CN 112667818B CN 202110001581 A CN202110001581 A CN 202110001581A CN 112667818 B CN112667818 B CN 112667818B
- Authority
- CN
- China
- Prior art keywords
- vector
- word
- user
- user comment
- comment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Machine Translation (AREA)
Abstract
本发明涉及一种融合GCN与多粒度注意力的用户评论情感分析方法,包括以下步骤:步骤A:提取用户评论、用户评论涉及的产品或服务的方面词,并标注用户评论针对产品或服务的的特定方面的情感极性,构建训练集SA;步骤B:使用训练集SA,训练融合GCN与多粒度注意力的深度学习网络模型G,用于分析用户评论对产品或服务的特定方面的情感记性;步骤C:将用户评论与用户评论涉及的产品或服务的方面词输入到训练后的深度学习网络模型G中,得到用户评论对产品或服务的特定方面的情感极性。本发明能够有效提高情感分类的准确性。
Description
技术领域
本发明涉及自然语言处理与情感分析应用领域,具体涉及一种融合GCN与多粒度注意力的用户评论情感分析方法及系统。
背景技术
情感分析(Sentiment Analysis,SA),又被称为观点挖掘,是自然语言处理中文本分类任务的一项基本任务,其基本目标是从文本中识别观点,分析其情感倾向性。随着网络购物和网络社交媒体的兴起,互联网上的评论文本数量急剧增加,人们对情感分析的分类粒度要求也越来越高,原有的文档级、句子级情感分析已经无法满足社会需要。因此,研究者们提出了细粒度的方面级情感分析任务。方面级情感分析是情感分析的一项子任务,现有的方面级情感分析模型主要分为基于传统机器学习和基于深度学习。
在深度学习兴起之前,基于传统机器学习的方面级情感分析模型依靠人为定义的规则从句子中提取语义特征,例如情感词典特征,解析特征和n-gram特征。然后,采用支持向量机(Support Vector Machine,SVM)、隐狄利克雷分布(Latent DirichletAllocation,LDA)和条件随机场(Conditional Random Field,CRF)等传统机器学习方法作为分类器,以确定评论文本的情感极性。但是,上述模型需要人工进行复杂的特征选择和特征提取工作,工作量大,并且效率较低。
近年来,深度学习方法在包括方面级情感分析在内的众多领域获得了广泛的应用。深度学习方法无需人工进行繁琐的特征提取和特征选择工作,可以自动从文本中提取上下文语义信息。循环神经网络(Recurrent Neural Network,RNN)可以对给定方面与上下文单词之间的相关性进行建模,这对于预测给定方面的情感极性至关重要。因此,RNN被广泛应用于方面级情感分析研究中。Wang等将方面向量与每个单词的词向量串联并作为长短期记忆网络(Long Short-Term Memory,LSTM)的输入,使方面向量能够参与计算每个上下文单词的注意力权重。Ma等利用LSTM和注意力机制交互学习方面及其上下文单词的注意力权重,以获得每个方面及其上下文的精确表示,从而有效地区分句子中不同方面的情感极性。相较于基于传统机器学习的方面级情感分析模型,现有的基于RNN的情感分析模型能够更有效地对方面相关的上下文情感表示进行建模,但仍存在捕获方面相关的远距离语义特征能力较弱的问题。
与传统的RNN相比,记忆网络(Memory Network)通过外部记忆模块存储文本信息,能更有效地对方面和上下文之间的远距离关系进行建模。Tang等率先将深度记忆网络引入了方面级情感分析任务,所提模型将预训练的上下文单词的词向量作为外部记忆模块,并采用了多个注意力层学习方面级上下文表示,其中每个注意力层包含一个注意力机制和一个线性变换操作。Chen等通过两层Bi-LSTM来利用输入的词向量建立外部记忆模块,并利用位置权重信息为每个方面生成特定记忆。Zhu等提出了一种带有辅助记忆的深度记忆网络。该模型包含两个记忆模块,一个是主记忆模块,用于存储上下文信息;另一个是辅助记忆模块,用于存储方面信息。通过两个记忆模块的交互,该模型可以更好地利用方面信息进行情感分类。
句法依存关系代表了句子中单词之间的依赖关系,对于正确判断方面的情感极性至关重要。RNN、记忆网络和注意力机制都无法利用句法依存关系,而图神经网络(GraphNeural Networks,GNN)能够获取句法依存关系并加以利用。因此,最近出现了一些基于GNN的方面级情感分析研究工作。Hang等使用Bi-LSTM对句子编码,然后利用图注意力网络(Graph Attention Network,GAT)提取上下文单词之间的依赖关系。Zhang等将图卷积网络(Graph Convolutional Network,GCN)与注意力机制结合在一起,以获取上下文单词与给定方面之间的语义相关性。现有基于GNN的模型没有使用注意力机制或者只是简单的使用传统的注意力机制,没有根据模型存在的问题设计具有针对性的注意力机制,因此难以精确捕捉上下文单词相对于给定方面的重要性。
发明内容
有鉴于此,本发明的目的在于提供一种融合GCN与多粒度注意力的用户评论情感分析方法及系统,有效提高情感分类的准确性。
为实现上述目的,本发明采用如下技术方案:
一种融合GCN与多粒度注意力的用户评论情感分析方法,包括以下步骤:
步骤A:提取用户评论、用户评论涉及的产品或服务的方面词,并标注用户评论针对产品或服务的的特定方面的情感极性,构建训练集SA;
步骤B:使用训练集SA,训练融合GCN与多粒度注意力的深度学习网络模型G,用于分析用户评论对产品或服务的特定方面的情感记性;
步骤C:将用户评论与用户评论涉及的产品或服务的方面词输入到训练后的深度学习网络模型G中,得到用户评论对产品或服务的特定方面的情感极性。
进一步的,所述步骤B具体包括以下步骤:
步骤B4:将表征向量g0输入到K层图卷积网络中,学习并提取句法依存关系,得到用户评论的图卷积表征向量hK;
步骤B5:对用户评论的图卷积表征向量hK进行掩膜操作,得到用户评论的图卷积掩膜表征向量hmask,将用户评论的图卷积掩膜表征向量hmask、用户评论表征向量Hs、方面表征向量Ha输入由传统注意力机制和多头注意力机制组成的多粒度注意力网络中,从用户评论中提取针对产品或服务的特定方面的多粒度上下文情感信息,得到用户评论的方面级多粒度表征向量es;
步骤B6:将es输入softmax层,根据目标损失函数loss,利用反向传播方法计算深度学习网络模型G中的各参数的梯度,并利用随机梯度下降方法更新参数;
步骤B7:当深度学习网络模型G产生的损失值迭代变化小于设定阈值不再降低或者达到最大迭代次数,终止深度学习网络模型G的训练。
进一步的,所述步骤B1具体包括以下步骤:
步骤B11:遍历训练集SA,SA中的每个训练样本表示为sa=(s,a,c),对训练样本sa中的s和a进行分词处理,去除停用词;
其中s为用户评论,a为用户评论中提取的用户评论所涉及的产品或服务的方面词或短语,c为用户评论对该方面的情感极性,情感极性包括{积极,消极,中性};
用户评论s经过分词及去除停用词后,表示为:
方面a经过分词及去除停用词后,表示为:
步骤B14:对用户评论s进行句法依存解析,得到句法依赖树T;
步骤B15:将解析得到的句法依赖树T编码为n阶邻接矩阵A,A表示为:
进一步的,所述步骤B2具体包括以下步骤:
进一步的,所述步骤B3具体包括以下步骤:
进一步的,所述步骤B4具体包括以下步骤:
步骤B41:将表征向量g0输入第一层图卷积网络,利用邻接矩阵A对每个词语的向量表示进行更新,输出h1,并生成下一层图卷积网络的输入g1;
其中,h1,g1分别表示为:
其中,为权重矩阵,为偏置项;W1、b1均为可学习的参数;relu是激活函数;图卷积网络中的节点i与用户评论中的第i个词相对应,图卷积网络中节点间的边代表用户评论中词语间的句法依赖关系,di表示节点i的度,选择di+1作为除数是为了防止节点i的度为0导致运算出错,“;”表示向量连接操作;
步骤B42:以g1代替g0输入到下一层图卷积网络,重复步骤B41,其中第k层图卷积网络的输出为根据hk生成作为第k+1层图卷积网络的输入,迭代结束后得到用户评论的图卷积表征向量其中K为图卷积网络的层数,1≤k≤K。
进一步的,所述步骤B5具体包括以下步骤:
步骤B51:对步骤B42得到的hK进行掩膜操作,屏蔽不属于方面词的图卷积输出,得到用户评论的图卷积掩膜表征向量hmask,计算过程如下:
步骤B52:将步骤B23得到的用户评论表征向量Hs和步骤B51得到的用户评论的图卷积掩膜表征向量hmask输入注意力网络,自适应选择重要的单词级信息,之后进行降维,得到用户评论的句子级表征向量ew,计算公式如下
步骤B53:将方面表征向量Ha作为多头注意力机制的输入,通过多头注意力机制从用户评论的句子级表征向量ew中自适应选择重要的句子级信息,降维后得到用户评论的多粒度表征向量es。
进一步的,所述步骤B53具体为:
接着将方面向量Ha的每个子向量和用户评论的句子级表征向量ew中对应的子向量构成一个子向量对,即对每个子向量对单独使用注意力机制进行计算,然后进行拼接与降维,N为多头注意力机制的头数,多头注意力机制的计算过程如下
其中,为多头注意力机制的输出向量,MHA表示多头注意力机制,为多头注意力机制的训练参数;为方面表征向量Ha的第h个子向量和句子级表征向量ew的第h个子向量对使用注意力机制计算得到的输出向量, 为对进行降维后得到的用户评论的多粒度表征向量;是m行,2d列的二维向量,将其划分为m个行向量,则表示的第i个行向量,其中1≤i≤m。
进一步的,所述步骤B6具体包括以下步骤:
步骤B61:产品评论的多粒度表征向量es输入到全连接层,并使用softmax归一化,计算评论者对产品方面的情感属于各类别的概率,计算公式如下:
y=W3es+b2
pc(y)=softmax(y)
步骤B62:用交叉熵作为损失函数计算损失值,通过梯度优化算法Adam进行学习率更新,利用反向传播迭代更新模型参数,以最小化损失函数来训练模型;
其中,最小化损失函数Loss的计算公式如下:
其中,λ||θ||2是L2正则化项,λ是学习率,θ包含所有参数,c为该方面对应的情感极性。
一种采用如权利要求1-8任一项所述方法的用户评论情感分析系统,包括:
数据收集模块,用于提取用户的产品评论、评论中产品方面词、产品方面词的位置信息,并对产品方面的情感极性进行标注,构建训练集;
预处理模块,用于对训练集中的训练样本进行预处理,包括分词处理、去除停用词和句法依存关系解析;
编码模块,用于在预训练的词向量矩阵中查找经过预处理的用户评论和方面中词的词向量,得到用户评论的初始表征向量和方面的初始表征向量;
网络训练模块,用于将用户评论的初始表征向量和方面的初始表征向量输入到深度学习网络中,得到用户评论的多粒度表征向量并以此训练深度学习网络,利用该表征向量属于某一类别的概率以及训练集中的标注作为损失,以最小化损失为目标来对整个深度学习网络进行训练,得到融合图卷积网络与多粒度注意力的深度学习网络模型;
情感分析模块,利用NLP工具,提取输入的用户评论中的方面,之后利用训练好的融合图卷积网络与多粒度注意力的深度学习网络模型对输入的用户评论和方面进行分析处理,输出用户评论中涉及特定方面的情感评价极性。
本发明与现有技术相比具有以下有益效果:
本发明使用两个不同的Bi-LSTM对评论句子和产品方面分别编码,然后利用位置信息对评论句子表示进行位置加权并通过GCN学习评论句子中句法依存关系,最后利用多粒度注意力机制提取不同粒度的上下文重要信息以增强情感表示的,能够有效提高情感分类的准确性。
附图说明
图1是本发明方法流程图;
图2是本发明一实施例中系统结构示意图;
图3是本发明一实施例中模型架构图。
具体实施方式
下面结合附图及实施例对本发明做进一步说明。
请参照图1,本发明提供一种融合GCN与多粒度注意力的用户评论情感分析方法,包括以下步骤:
步骤A:提取用户评论、用户评论涉及的产品或服务的方面词,并标注用户评论针对产品或服务的的特定方面的情感极性,构建训练集SA;
步骤B:使用训练集SA,训练融合GCN与多粒度注意力的深度学习网络模型G,用于分析用户评论对产品或服务的特定方面的情感记性;
步骤C:将用户评论与用户评论涉及的产品或服务的方面词输入到训练后的深度学习网络模型G中,得到用户评论对产品或服务的特定方面的情感极性。
在本实施例中,所述步骤B具体包括以下步骤:
步骤B4:将表征向量g0输入到K层图卷积网络中,学习并提取句法依存关系,得到用户评论的图卷积表征向量hK;
步骤B5:对用户评论的图卷积表征向量hK进行掩膜操作,得到用户评论的图卷积掩膜表征向量hmask,将用户评论的图卷积掩膜表征向量hmask、用户评论表征向量Hs、方面表征向量Ha输入由传统注意力机制和多头注意力机制组成的多粒度注意力网络中,从用户评论中提取针对产品或服务的特定方面的多粒度上下文情感信息,得到用户评论的方面级多粒度表征向量es;
步骤B6:将es输入softmax层,根据目标损失函数loss,利用反向传播方法计算深度学习网络模型G中的各参数的梯度,并利用随机梯度下降方法更新参数;
步骤B7:当深度学习网络模型G产生的损失值迭代变化小于设定阈值不再降低或者达到最大迭代次数,终止深度学习网络模型G的训练。
在本实施例中,所述步骤B1具体包括以下步骤:
步骤B11:遍历训练集SA,SA中的每个训练样本表示为sa=(s,a,c),对训练样本sa中的s和a进行分词处理,去除停用词;
其中s为用户评论,a为用户评论中提取的用户评论所涉及的产品或服务的方面词或短语,c为用户评论对该方面的情感极性,情感极性包括{积极,消极,中性};
用户评论s经过分词及去除停用词后,表示为:
方面a经过分词及去除停用词后,表示为:
步骤B14:对用户评论s进行句法依存解析,得到句法依赖树T;
步骤B15:将解析得到的句法依赖树T编码为n阶邻接矩阵A,A表示为:
在本实施例中,所述步骤B2具体包括以下步骤:
在本实施例中,所述步骤B3具体包括以下步骤:
在本实施例中,所述步骤B4具体包括以下步骤:
步骤B41:将表征向量g0输入第一层图卷积网络,利用邻接矩阵A对每个词语的向量表示进行更新,输出h1,并生成下一层图卷积网络的输入g1;
其中,h1,g1分别表示为:
其中,为权重矩阵,为偏置项;W1、b1均为可学习的参数;relu是激活函数;图卷积网络中的节点i与用户评论中的第i个词相对应,图卷积网络中节点间的边代表用户评论中词语间的句法依赖关系,di表示节点i的度,选择di+1作为除数是为了防止节点i的度为0导致运算出错,“;”表示向量连接操作;
步骤B42:以g1代替g0输入到下一层图卷积网络,重复步骤B41,其中第k层图卷积网络的输出为根据hk生成作为第k+1层图卷积网络的输入,迭代结束后得到用户评论的图卷积表征向量其中K为图卷积网络的层数,1≤k≤K。
在本实施例中,所述步骤B5具体包括以下步骤:
步骤B51:对步骤B42得到的hK进行掩膜操作,屏蔽不属于方面词的图卷积输出,得到用户评论的图卷积掩膜表征向量hmask,计算过程如下:
步骤B52:将步骤B23得到的用户评论表征向量Hs和步骤B51得到的用户评论的图卷积掩膜表征向量hmask输入注意力网络,自适应选择重要的单词级信息,之后进行降维,得到用户评论的句子级表征向量ew,计算公式如下
步骤B53:将方面表征向量Ha作为多头注意力机制的输入,通过多头注意力机制从用户评论的句子级表征向量ew中自适应选择重要的句子级信息,降维后得到用户评论的多粒度表征向量es。
在本实施例中,所述步骤B53具体为:
接着将方面向量Ha的每个子向量和用户评论的句子级表征向量ew中对应的子向量构成一个子向量对,即对每个子向量对单独使用注意力机制进行计算,然后进行拼接与降维,N为多头注意力机制的头数,多头注意力机制的计算过程如下
其中,为多头注意力机制的输出向量,MHA表示多头注意力机制,为多头注意力机制的训练参数;为方面表征向量Ha的第h个子向量和句子级表征向量ew的第h个子向量对使用注意力机制计算得到的输出向量, 为对进行降维后得到的用户评论的多粒度表征向量;是m行,2d列的二维向量,将其划分为m个行向量,则表示的第i个行向量,其中1≤i≤m。
在本实施例中,所述步骤B6具体包括以下步骤:
步骤B61:产品评论的多粒度表征向量es输入到全连接层,并使用softmax归一化,计算评论者对产品方面的情感属于各类别的概率,计算公式如下:
y=W3es+b2
pc(y)=softmax(y)
步骤B62:用交叉熵作为损失函数计算损失值,通过梯度优化算法Adam进行学习率更新,利用反向传播迭代更新模型参数,以最小化损失函数来训练模型;
其中,最小化损失函数Loss的计算公式如下:
其中,λ||θ||2是L2正则化项,λ是学习率,θ包含所有参数,c为该方面对应的情感极性。
本实施例,还提供一种一种采用如权利要求1-8任一项所述方法的用户评论情感分析系统,包括:
数据收集模块,用于提取用户的产品评论、评论中产品方面词、产品方面词的位置信息,并对产品方面的情感极性进行标注,构建训练集;
预处理模块,用于对训练集中的训练样本进行预处理,包括分词处理、去除停用词和句法依存关系解析;
编码模块,用于在预训练的词向量矩阵中查找经过预处理的用户评论和方面中词的词向量,得到用户评论的初始表征向量和方面的初始表征向量;
网络训练模块,用于将用户评论的初始表征向量和方面的初始表征向量输入到深度学习网络中,得到用户评论的多粒度表征向量并以此训练深度学习网络,利用该表征向量属于某一类别的概率以及训练集中的标注作为损失,以最小化损失为目标来对整个深度学习网络进行训练,得到融合图卷积网络与多粒度注意力的深度学习网络模型;
情感分析模块,利用NLP工具,提取输入的用户评论中的方面,之后利用训练好的融合图卷积网络与多粒度注意力的深度学习网络模型对输入的用户评论和方面进行分析处理,输出用户评论中涉及特定方面的情感评价极性。
以上所述仅为本发明的较佳实施例,凡依本发明申请专利范围所做的均等变化与修饰,皆应属本发明的涵盖范围。
Claims (9)
1.一种融合GCN与多粒度注意力的用户评论情感分析方法,其特征在于,包括以下步骤:
步骤A:提取用户评论、用户评论涉及的产品或服务的方面词,并标注用户评论针对产品或服务的特定方面的情感极性,构建训练集SA;
步骤B:使用训练集SA,训练融合GCN与多粒度注意力的深度学习网络模型G,用于分析用户评论对产品或服务的特定方面的情感极性;
步骤C:将用户评论与用户评论涉及的产品或服务的方面词输入到训练后的深度学习网络模型G中,得到用户评论对产品或服务的特定方面的情感极性;
所述步骤B具体包括以下步骤:
步骤B4:将表征向量g0输入到K层图卷积网络中,学习并提取句法依存关系,得到用户评论的图卷积表征向量hK;
步骤B5:对用户评论的图卷积表征向量hK进行掩膜操作,得到用户评论的图卷积掩膜表征向量hmask,将用户评论的图卷积掩膜表征向量hmask、用户评论表征向量Hs、方面表征向量Ha输入由传统注意力机制和多头注意力机制组成的多粒度注意力网络中,从用户评论中提取针对产品或服务的特定方面的多粒度上下文情感信息,得到用户评论的方面级多粒度表征向量es;
步骤B6:将es输入softmax层,根据目标损失函数loss,利用反向传播方法计算深度学习网络模型G中的各参数的梯度,并利用随机梯度下降方法更新参数;
步骤B7:当深度学习网络模型G产生的损失值迭代变化小于设定阈值不再降低或者达到最大迭代次数,终止深度学习网络模型G的训练。
2.根据权利要求1所述的融合GCN与多粒度注意力的用户评论情感分析方法,其特征在于,所述步骤B1具体包括以下步骤:
步骤B11:遍历训练集SA,SA中的每个训练样本表示为sa=(s,a,c),对训练样本sa中的s和a进行分词处理,去除停用词;
其中s为用户评论,a为用户评论中提取的用户评论所涉及的产品或服务的方面词或短语,c为用户评论对该方面的情感极性,情感极性包括{积极,消极,中性};
用户评论s经过分词及去除停用词后,表示为:
方面a经过分词及去除停用词后,表示为:
步骤B14:对用户评论s进行句法依存解析,得到句法依赖树T;
步骤B15:将解析得到的句法依赖树T编码为n阶邻接矩阵A,A表示为:
3.根据权利要求1所述的融合GCN与多粒度注意力的用户评论情感分析方法,其特征在于,所述步骤B2具体包括以下步骤:
4.根据权利要求1所述的融合GCN与多粒度注意力的用户评论情感分析方法,其特征在于,所述步骤B3具体包括以下步骤:
其中,i=1,2,...,n表示当前词在句中的位置,τ表示方面a的第一个词在用户评论s中的位置,τ+m-1表示方面a的最后一个词在用户评论s中的位置;
5.根据权利要求1所述的融合GCN与多粒度注意力的用户评论情感分析方法,其特征在于,所述步骤B4具体包括以下步骤:
步骤B41:将表征向量g0输入第一层图卷积网络,利用邻接矩阵A对每个词语的向量表示进行更新,输出h1,并生成下一层图卷积网络的输入g1;
其中,h1,g1分别表示为:
其中,为权重矩阵,为偏置项;W1、b1均为可学习的参数;relu是激活函数;图卷积网络中的节点i与用户评论中的第i个词相对应,图卷积网络中节点间的边代表用户评论中词语间的句法依赖关系,di表示节点i的度,选择di+1作为除数是为了防止节点i的度为0导致运算出错,“;”表示向量连接操作;
6.根据权利要求1所述的融合GCN与多粒度注意力的用户评论情感分析方法,其特征在于,所述步骤B5具体包括以下步骤:
步骤B51:对步骤B42得到的hK进行掩膜操作,屏蔽不属于方面词的图卷积输出,得到用户评论的图卷积掩膜表征向量hmask,计算过程如下:
步骤B52:将步骤B23得到的用户评论表征向量Hs和步骤B51得到的用户评论的图卷积掩膜表征向量hmask输入注意力网络,自适应选择重要的单词级信息,之后进行降维,得到用户评论的句子级表征向量ew,计算公式如下:
步骤B53:将方面表征向量Ha作为多头注意力机制的输入,通过多头注意力机制从用户评论的句子级表征向量ew中自适应选择重要的句子级信息,降维后得到用户评论的多粒度表征向量es。
7.根据权利要求6所述的融合GCN与多粒度注意力的用户评论情感分析方法,其特征在于,所述步骤B53具体为:
接着将方面向量Ha的每个子向量和用户评论的句子级表征向量ew中对应的子向量构成一个子向量对,即对每个子向量对单独使用注意力机制进行计算,然后进行拼接与降维,N为多头注意力机制的头数,多头注意力机制的计算过程如下:
8.根据权利要求1所述的融合GCN与多粒度注意力的用户评论情感分析方法,其特征在于,所述步骤B6具体包括以下步骤:
步骤B61:产品评论的多粒度表征向量es输入到全连接层,并使用softmax归一化,计算评论者对产品方面的情感属于各类别的概率,计算公式如下:
y=W3es+b2
pc(y)=softmax(y)
步骤B62:用交叉熵作为损失函数计算损失值,通过梯度优化算法Adam进行学习率更新,利用反向传播迭代更新模型参数,以最小化损失函数来训练模型;
其中,最小化损失函数Loss的计算公式如下:
其中,λ||θ||2是L2正则化项,λ是学习率,θ包含所有参数,c为该方面对应的情感极性。
9.一种采用如权利要求1-8任一项所述方法的用户评论情感分析系统,其特征在于,包括:
数据收集模块,用于提取用户评论、评论中方面词、方面词的位置信息,并对方面的情感极性进行标注,构建训练集;
预处理模块,用于对训练集中的训练样本进行预处理,包括分词处理、去除停用词和句法依存关系解析;
编码模块,用于在预训练的词向量矩阵中查找经过预处理的用户评论和方面中词的词向量,得到用户评论的初始表征向量和方面的初始表征向量;
网络训练模块,用于将用户评论的初始表征向量和方面的初始表征向量输入到深度学习网络中,得到用户评论的多粒度表征向量并以此训练深度学习网络,利用该表征向量属于某一类别的概率以及训练集中的标注作为损失,以最小化损失为目标来对整个深度学习网络进行训练,得到融合图卷积网络与多粒度注意力的深度学习网络模型;
情感分析模块,利用NLP工具,提取输入的用户评论中的方面,之后利用训练好的融合图卷积网络与多粒度注意力的深度学习网络模型对输入的用户评论和方面进行分析处理,输出用户评论中涉及特定方面的情感评价极性。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110001581.0A CN112667818B (zh) | 2021-01-04 | 2021-01-04 | 融合gcn与多粒度注意力的用户评论情感分析方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110001581.0A CN112667818B (zh) | 2021-01-04 | 2021-01-04 | 融合gcn与多粒度注意力的用户评论情感分析方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112667818A CN112667818A (zh) | 2021-04-16 |
CN112667818B true CN112667818B (zh) | 2022-06-14 |
Family
ID=75413970
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110001581.0A Active CN112667818B (zh) | 2021-01-04 | 2021-01-04 | 融合gcn与多粒度注意力的用户评论情感分析方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112667818B (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113326690A (zh) * | 2021-04-17 | 2021-08-31 | 上海快确信息科技有限公司 | 一种半结构文本的信息提取装置 |
CN113378047B (zh) * | 2021-06-10 | 2022-10-21 | 武汉大学 | 一种基于多方面增强的图神经网络推荐方法 |
CN113159007B (zh) * | 2021-06-24 | 2021-10-29 | 之江实验室 | 一种基于自适应图卷积的步态情感识别方法 |
CN113505240B (zh) * | 2021-07-09 | 2023-04-18 | 吉林大学 | 一种基于注意力引导图lstm关系提取方法及装置 |
CN113535904B (zh) * | 2021-07-23 | 2022-08-09 | 重庆邮电大学 | 一种基于图神经网络的方面级情感分析方法 |
CN114564967B (zh) * | 2022-04-29 | 2022-09-13 | 天津大学 | 一种面向情感语义的语义标注及语义依存分析方法及装置 |
CN117390141B (zh) * | 2023-12-11 | 2024-03-08 | 江西农业大学 | 一种农业社会化服务质量用户评价数据分析方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080249764A1 (en) * | 2007-03-01 | 2008-10-09 | Microsoft Corporation | Smart Sentiment Classifier for Product Reviews |
CN109597997B (zh) * | 2018-12-07 | 2023-05-02 | 上海宏原信息科技有限公司 | 基于评论实体、方面级情感分类方法和装置及其模型训练 |
CN111274398B (zh) * | 2020-01-20 | 2022-06-14 | 福州大学 | 一种方面级用户产品评论情感分析方法及系统 |
CN111783474B (zh) * | 2020-07-16 | 2023-04-07 | 厦门市美亚柏科信息股份有限公司 | 一种评论文本观点信息处理方法、装置及存储介质 |
CN111858945B (zh) * | 2020-08-05 | 2024-04-23 | 上海哈蜂信息科技有限公司 | 基于深度学习的评论文本方面级情感分类方法及系统 |
-
2021
- 2021-01-04 CN CN202110001581.0A patent/CN112667818B/zh active Active
Non-Patent Citations (1)
Title |
---|
张亚洲等.多模态情感分析研究综述.《模式识别与人工智能》.2020,第33卷(第5期),全文. * |
Also Published As
Publication number | Publication date |
---|---|
CN112667818A (zh) | 2021-04-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112667818B (zh) | 融合gcn与多粒度注意力的用户评论情感分析方法及系统 | |
CN111274398B (zh) | 一种方面级用户产品评论情感分析方法及系统 | |
CN109284506B (zh) | 一种基于注意力卷积神经网络的用户评论情感分析系统及方法 | |
CN111310438B (zh) | 基于多粒度融合模型的中文句子语义智能匹配方法及装置 | |
CN112001185B (zh) | 一种结合中文句法和图卷积神经网络的情感分类方法 | |
CN110059188B (zh) | 一种基于双向时间卷积网络的中文情感分析方法 | |
CN108363695B (zh) | 一种基于双向依赖语法树表征的用户评论属性抽取方法 | |
Roshanfekr et al. | Sentiment analysis using deep learning on Persian texts | |
CN111027595B (zh) | 双阶段语义词向量生成方法 | |
CN112001186A (zh) | 一种利用图卷积神经网络和中文句法的情感分类方法 | |
CN111382565A (zh) | 基于多标签的情绪-原因对抽取方法及系统 | |
CN112232087B (zh) | 一种基于Transformer的多粒度注意力模型的特定方面情感分析方法 | |
CN107688870B (zh) | 一种基于文本流输入的深度神经网络的分层因素可视化分析方法及装置 | |
CN112784532B (zh) | 用于短文本情感分类的多头注意力记忆系统 | |
CN111651974A (zh) | 一种隐式篇章关系分析方法和系统 | |
CN115858788A (zh) | 基于双重图卷积神经网络的视角级文本情感分类系统 | |
Sadr et al. | Convolutional neural network equipped with attention mechanism and transfer learning for enhancing performance of sentiment analysis | |
CN115357719A (zh) | 基于改进bert模型的电力审计文本分类方法及装置 | |
CN113255366A (zh) | 一种基于异构图神经网络的方面级文本情感分析方法 | |
CN113705238A (zh) | 基于bert和方面特征定位模型的方面级情感分析方法及模型 | |
CN114492459A (zh) | 基于知识图谱与交互图卷积的评论情感分析方法及系统 | |
CN116579347A (zh) | 一种基于动态语义特征融合的评论文本情感分析方法、系统、设备及介质 | |
CN116028604A (zh) | 一种基于知识增强图卷积网络的答案选择方法及系统 | |
CN114036298B (zh) | 一种基于图卷积神经网络与词向量的节点分类方法 | |
CN114356990A (zh) | 基于迁移学习的基地命名实体识别系统及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |