CN110457480A - 基于交互式注意力机制的细粒度情感分类模型的构建方法 - Google Patents

基于交互式注意力机制的细粒度情感分类模型的构建方法 Download PDF

Info

Publication number
CN110457480A
CN110457480A CN201910760203.3A CN201910760203A CN110457480A CN 110457480 A CN110457480 A CN 110457480A CN 201910760203 A CN201910760203 A CN 201910760203A CN 110457480 A CN110457480 A CN 110457480A
Authority
CN
China
Prior art keywords
word
context
semantic
evaluation
evaluation aspect
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910760203.3A
Other languages
English (en)
Other versions
CN110457480B (zh
Inventor
王旭强
岳顺民
王扬
何金
赵猛
杨青
刘红昌
高静
王银
刘怡
单晓怡
田雨婷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Corp of China SGCC
State Grid Tianjin Electric Power Co Ltd
Original Assignee
State Grid Corp of China SGCC
State Grid Tianjin Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Corp of China SGCC, State Grid Tianjin Electric Power Co Ltd filed Critical State Grid Corp of China SGCC
Priority to CN201910760203.3A priority Critical patent/CN110457480B/zh
Publication of CN110457480A publication Critical patent/CN110457480A/zh
Application granted granted Critical
Publication of CN110457480B publication Critical patent/CN110457480B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/355Class or cluster creation or modification
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于交互式注意力机制的细粒度情感分类模型的构建方法,该方法分别对评价方面和上下文单独地建模语义,并结合注意力机制同时对两部分的语义进行交互学习,进而得到更恰当的用于细粒度情感分类的语义表示。本发明提出的模型既考虑了给定评价方面的语义特征,又考虑了给定上下文的语义特征,并将两部分特征进行融合,可以挖掘其中对情感分析最重要的语义信息,提高了细粒度情感分类的准确率;能够准确的理解在线评论数据中包含的用户情感,帮助商家了解消费者的需求,进而为其提供有效的决策支持,帮助其对现有产品和服务进行改进。

Description

基于交互式注意力机制的细粒度情感分类模型的构建方法
技术领域
本发明属于计算机应用技术领域,具体涉及一种基于交互式注意力机制的细粒度情感分类模型的构建方法。
背景技术
随着信息技术的发展,互联网中积累了大量的用户评论数据。对这些评论数据进行语义分析和意见挖掘对各行业的发展具有重要意义,例如对电商网站中的产品评价数据进行分析,可以帮助商家了解消费者的需求,进而为其提供有效的决策支持,帮助其对现有产品和服务进行改进。由于在线评论数据具有覆盖范围广、口语化强、高噪声等特点,因此如何准确的理解在线评论数据中包含的用户情感是本发明研究的核心任务。此外,考虑到一条评论数据中可能包含用户对一个评价实体的多个方面的态度,因此细粒度情感分析逐渐受到了广泛关注,成为研究热点之一。
近年来,国内外已有很多针对在线评论数据的细粒度情感分析任务开展的相关研究,并且取得了一定的研究成果。现有的相关研究方法主要可以分为两类:基于机器学习的方法和基于神经网络的方法。
在基于机器学习的方法中,细粒度情感分类通常被视为文本分类问题。因此,诸如SVM等的文本分类方法可以在不考虑评价方面的情况下,进行情感极性的判断,这些方法主要关注于如何提取情感词典、情感特征等来训练情感分类器。尽管这些方法取得了一定的效果,但其性能在很大程度上依赖于手工特征的有效性,这极大地限制了模型的灵活性与泛化性。
近年来,随着神经网络的发展,递归神经网络、循环神经网络及层次长短期记忆网络(LSTM)等结构在情感分析领域取得了可观的效果。然而这些方法通常仅使用上下文语义进行情感分类,而没有考虑评价方面的语义对情感分类的直接影响。
本发明认为,只有同时对评价方面和上下文进行语义建模并实现语义相互增强才能真正提升情感分类的效果。例如,给定意见句“这台显示器的分辨率很高,但是价格也很高”,当“高”形容“分辨率”时,情感极性是正向,但形容“价格”时,情感极性则是负向。由此,如何联合建模评价方面和上下文的语义是本发明主要解决的问题。
发明内容
本发明的目的在于克服现有技术的不足,提供一种基于交互式注意力机制的细粒度情感分类模型的构建方法,该方法分别对评价方面和上下文单独地建模语义,并结合注意力机制同时对两部分的语义进行交互学习,进而得到更恰当的用于细粒度情感分类的语义表示。
本发明是通过以下技术方案实现的:
一种基于交互式注意力机制的细粒度情感分类模型的构建方法,包括以下步骤:
步骤1.数据表示
首先利用分词工具将在线评论数据中的评价方面和意见句拆分为词序列,输入经过分词处理后的意见句与评价方面,使用词向量的方法初始化每个词的浅层语义表示;
步骤2.学习评价方面的语义表示
根据步骤1中输出的每个词的词向量,利用双向的长短期记忆网络以序列的方式对评价方面中的词进行高层的语义编码;
步骤3.学习上下文的语义表示
根据步骤1中输出的每个词的词向量,利用双向的长短期记忆网络以序列的方式对上下文中的词进行高层的语义编码;
步骤4.评价方面和上下文的交互式语义融合
根据步骤2和步骤3中的输出,交互式地学习上下文和评价方面的语义表示,挖掘其中包含的重要信息,
该过程包含三个步骤:(1)基于步骤2和步骤3的输出,对词的语义特征进行平均池化,分别得到评价方面和上下文的整体表示;(2)使用注意力机制,利用评价方面的整体表示计算上下文中每个词的注意力权重,并基于该权重对上下文中词语的语义表示进行加权求和,得到考虑评价方面的上下文表示;(3)使用注意力机制,利用上下文的整体表示计算评价方面中每个词的注意力权重,并基于该权重对评价方面中词语的语义表示进行加权求和,得到考虑上下文的评价方面表示;
步骤5.情感分类
根据步骤4中的输出,对评价方面和上下文的语义表示进行拼接,并基于拼接后的结果构建情感分析的分类器进行情感分类。
在上述技术方案中,所述步骤1中的意见句表示为如下形式:
C={c1,c2,…,cn}
其中n表示意见句中包含的词个数,ci表示意见句中的第i个词;
评价方面表示为如下形式:
T={t1,t2,…,tk}
其中k表示评价方面中包含的词个数,ti表示评价方面中的第i个词;
为了获取词语的词向量表示,首先将输入意见句和评价方面中的每个单词映射到一个低维稠密的词向量e中,具体如公式1-1、1-2所示,其中,M∈Rv×d表示词向量的词典,v和d分别代表词典大小与词向量维数,
最终,步骤1分别输出意见句和评价方面的词向量表示序列Ec和Et作为词的浅层语义表示:
在上述技术方案中,所述的步骤2具体包含如下步骤:
步骤2.1,前向的长短期记忆网络编码(简称LSTM编码)的阶段;
利用LSTM对评价方面的词向量序列按照原始顺序进行编码得到前向的隐藏特征,对于第j个词的具体计算过程如下:
其中,分别代表输入门、遗忘门、输出门,用于控制信息的传递;σ为sigmoid激活函数,W和b为网络参数、分别代表权重矩阵和偏移量,·代表矩阵乘法,⊙代表矩阵元素乘法;
步骤2.2,反向LSTM编码的阶段;
由于一个LSTM只能从一个方向进行计算,而不能建模另一个方向的语义,因此使用一个方向相反的LSTM从另一个方向对词序列进行编码,得到反向的隐藏特征:
步骤2.3,双向编码特征结合阶段;
将步骤2.1与步骤2.2中得到的两个方向的隐藏特征向量进行拼接,得到每个词双向的隐藏特征:
在上述技术方案中,所述的步骤3具体包含如下步骤:
步骤3.1,前向LSTM编码阶段;
本阶段过程与步骤2.1类似,最终得到上下文中每个词的前向语义表示:
步骤3.2,反向LSTM编码阶段;
本阶段过程与步骤2.2类似,最终得到上下文中每个词的反向语义表示:
步骤3.3,双向编码特征结合阶段:
将步骤3.1与步骤3.2中得到的两个方向的隐藏特征向量进行拼接,得到每个词双向的隐藏特征:
在上述技术方案中,所述的步骤4具体包含如下步骤:
步骤4.1,上下文和评价方面的整体表示生成阶段;
对步骤2和步骤3得到的词的高层语义表示状态进行平均池化,分别得到上下文和评价方面的初始整体表示,分别记为cavg和tavg
步骤4.2,使用注意力机制,得到考虑评价方面的上下文表示阶段;
以评价方面的初始整体表示作为输入,利用注意力机制选择上下文中有助于判断情感极性的重要信息,给定上下文的隐藏表示表示为和评价方面的初始整体表示tavg,可通过公式4-1生成注意力向量α:
其中是用于计算上下文向量重要程度的得分函数,该函数的计算方法如公式4-2所示:
其中Wa和ba是待学习的参数,tanh是非线性激活函数,tavg T表示向量tavg的转置;
在计算注意力权重的基础上,利用公式4-3得到上下文的最终语义表示,该表示包含了有助于判断情感极性的重要信息;
步骤4.3,使用注意力机制,得到考虑上下文的评价方面表示阶段;
以上下文的初始整体表示作为输入,利用注意力机制选择评价对象中有助于判断情感极性的重要信息,给定评价方面的隐藏表示表示为和上下文的初始整体表示cavg,可通过公式4-4生成注意力向量β:
在计算注意力权重的基础上,利用公式4-5得到评价方面的最终语义表示,该表示包含了有助于判断情感极性的重要信息;
步骤4.4,对上下文和评价方面的最终语义表示进行拼接,得到:
d=[rc;rt]。
在上述技术方案中,所述的步骤5使用非线性层将语义表示d投影到一个维度与情感极性种类数相同的向量空间中:
x=tanh(Wl·d+bl)
其中,Wl和bl分别代表权重矩阵和偏置向量;最后,使用公式5-1计算情感极性的概率分布:
其中,C为情感极性的类别数。在测试过程中,模型将选取概率最大的标签作为最终的结果。
本发明的优点和有益效果为:
(1)本发明的一种基于交互式注意力机制的细粒度情感分类模型的构建方法能够准确的理解在线评论数据中包含的用户情感,帮助商家了解消费者的需求,进而为其提供有效的决策支持,帮助其对现有产品和服务进行改进。
(2)本发明的一种基于交互式注意力机制的细粒度情感分类模型的构建方法的性能不依赖于手工特征的有效性,提高了模型的灵活性与泛化性。
(3)本发明的一种基于交互式注意力机制的细粒度情感分类模型的构建方法使用双向的LSTM来总结两个方向上的词级别语义信息,从而获得对应的语义表示,实现了建模词序列不同方向上的信息的目的。
(4)本发明的一种基于交互式注意力机制的细粒度情感分类模型的构建方法提出的模型既考虑了给定评价方面的语义特征,又考虑了给定上下文的语义特征,并将两部分特征进行融合,可以挖掘其中对情感分析最重要的语义信息,提高了细粒度情感分类的准确率。
附图说明
图1是本发明整体系统结构示意图。
图2是本发明的流程图。
对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,可以根据以上附图获得其他的相关附图。
具体实施方式
下面结合附图与具体的实施例对本发明作进一步详细描述,需要说明的是:下述实施例是说明性的,不是限定性的,不能以下述实施例来限定本发明的保护范围。
在本实施例中主要采用自然语言处理相关的理论和方法对在线评论数据进行细粒度的情感分析,为了保证系统的正常运行,要求所使用的计算机平台配备不低于8G的内存,CPU核心数不低于4个且主频不低2.6GHz、Linux操作系统,并安装Python 3.6及以上版本、tensorflow框架等必备软件环境。
一种基于交互式注意力机制的细粒度情感分类模型的构建方法,包括以下步骤:
步骤1.数据表示
本实施例中涉及到的数据为在线评论数据,该数据以文本的形式进行存储,对于每个意见句,会对应若干评价方面,首先利用分词工具将评价方面和意见句拆分为词序列,输入经过分词处理后的意见句和评价方面,其中意见句表示为如下形式:
C={c1,c2,…,cn}
其中n表示意见句中包含的词个数,ci表示意见句中的第i个词;
同理,评价方面表示为如下形式:
T={t1,t2,…,tk}
其中k表示评价方面中包含的词个数,ti表示评价方面中的第i个词;
为了获取词语的词向量表示,首先将输入意见句和评价方面中的每个单词映射到一个低维稠密的词向量e中,具体如公式1-1、1-2所示,其中,M∈Rv×d表示词向量的词典,v和d分别代表词典大小与词向量维数,
最终,步骤1分别输出意见句和评价方面的词向量表示序列Ec和Et作为词的浅层语义表示:
步骤2.学习评价方面的语义表示
根据步骤1中输出的每个词的词向量,利用双向的长短期记忆网络以序列的方式对评价方面中的词进行高层的语义编码,具体包含如下步骤:
步骤2.1,前向的长短期记忆网络编码(简称LSTM编码)的阶段;
利用LSTM对评价方面的词向量序列按照原始顺序进行编码得到前向的隐藏特征,对于第j个词的具体计算过程如下:
其中,分别代表输入门、遗忘门、输出门,用于控制信息的传递;σ为sigmoid激活函数,W和b为网络参数、分别代表权重矩阵和偏移量,·代表矩阵乘法,⊙代表矩阵元素乘法;
步骤2.2,反向LSTM编码的阶段;
由于一个LSTM只能从一个方向进行计算,而不能建模另一个方向的语义,因此使用一个方向相反的LSTM从另一个方向对词序列进行编码,得到反向的隐藏特征:
步骤2.3,双向编码特征结合阶段;
将步骤2.1与步骤2.2中得到的两个方向的隐藏特征向量进行拼接,得到每个词双向的隐藏特征:
步骤3.学习上下文的语义表示
根据步骤1中输出的每个词的词向量,利用双向的长短期记忆网络以序列的方式对上下文中的词进行高层的语义编码,具体包含如下步骤:
步骤3.1,前向LSTM编码阶段;
本阶段过程与步骤2.1类似,最终得到上下文中每个词的前向语义表示:
步骤3.2,反向LSTM编码阶段;
本阶段过程与步骤2.2类似,最终得到上下文中每个词的反向语义表示:
步骤3.3,双向编码特征结合阶段:
将步骤3.1与步骤3.2中得到的两个方向的隐藏特征向量进行拼接,得到每个词双向的隐藏特征:
步骤4.评价方面和上下文的交互式语义融合
根据步骤2和步骤3中的输出,交互式地学习上下文和评价方面的语义表示,挖掘其中包含的重要信息,具体包含如下步骤:
步骤4.1,上下文和评价方面的整体表示生成阶段;
对步骤2和步骤3得到的词的高层语义表示状态进行平均池化,分别得到上下文和评价方面的初始整体表示,分别记为cavg和tavg
步骤4.2,使用注意力机制,得到考虑评价方面的上下文表示阶段;
以评价方面的初始整体表示作为输入,利用注意力机制选择上下文中有助于判断情感极性的重要信息,给定上下文的隐藏表示表示为和评价方面的初始整体表示tavg,可通过公式4-1生成注意力向量α:
其中是用于计算上下文向量重要程度的得分函数,该函数的计算方法如公式4-2所示:
其中Wa和ba是待学习的参数,tanh是非线性激活函数,tavg T表示向量tavg的转置;
在计算注意力权重的基础上,利用公式4-3得到上下文的最终语义表示,该表示包含了有助于判断情感极性的重要信息;
步骤4.3,使用注意力机制,得到考虑上下文的评价方面表示阶段;
以上下文的初始整体表示作为输入,利用注意力机制选择评价对象中有助于判断情感极性的重要信息,给定评价方面的隐藏表示表示为和上下文的初始整体表示cavg,可通过公式4-4生成注意力向量β:
在计算注意力权重的基础上,利用公式4-5得到评价方面的最终语义表示,该表示包含了有助于判断情感极性的重要信息。
步骤4.4,对上下文和评价方面的最终语义表示进行拼接,得到:
d=[rc;rt];
步骤5.情感分类
根据步骤4中的输出,对评价方面和上下文的语义表示进行拼接,并基于拼接后的结果构建情感分析的分类器进行情感分类;
本步骤使用非线性层将语义表示d投影到一个维度与情感极性种类数相同的向量空间中:
x=tanh(Wl·d+bl)
其中,Wl和bl分别代表权重矩阵和偏置向量;最后,使用公式5-1计算情感极性的概率分布:
其中,C为情感极性的类别数。在测试过程中,模型将选取概率最大的标签作为最终的结果。
本发明基于在线的评论数据并实现了对其的细粒度情感分类,提出的模型既考虑了给定评价方面的语义特征,又考虑了给定上下文的语义特征,并将两部分特征进行融合,可以挖掘其中对情感分析最重要的语义信息,提高了细粒度情感分类的准确率。
以上对本发明做了示例性的描述,应该说明的是,在不脱离本发明的核心的情况下,任何简单的变形、修改或者其他本领域技术人员能够不花费创造性劳动的等同替换均落入本发明的保护范围。

Claims (6)

1.一种基于交互式注意力机制的细粒度情感分类模型的构建方法,其特征在于,包括以下步骤:
步骤1.数据表示
首先利用分词工具将在线评论数据中的评价方面和意见句拆分为词序列,输入经过分词处理后的意见句与评价方面,使用词向量的方法初始化每个词的浅层语义表示;
步骤2.学习评价方面的语义表示
根据步骤1中输出的每个词的词向量,利用双向的长短期记忆网络以序列的方式对评价方面中的词进行高层的语义编码;
步骤3.学习上下文的语义表示
根据步骤1中输出的每个词的词向量,利用双向的长短期记忆网络以序列的方式对上下文中的词进行高层的语义编码;
步骤4.评价方面和上下文的交互式语义融合
根据步骤2和步骤3中的输出,交互式地学习上下文和评价方面的语义表示,挖掘其中包含的重要信息,
该过程包含三个步骤:(1)基于步骤2和步骤3的输出,对词的语义特征进行平均池化,分别得到评价方面和上下文的整体表示;(2)使用注意力机制,利用评价方面的整体表示计算上下文中每个词的注意力权重,并基于该权重对上下文中词语的语义表示进行加权求和,得到考虑评价方面的上下文表示;(3)使用注意力机制,利用上下文的整体表示计算评价方面中每个词的注意力权重,并基于该权重对评价方面中词语的语义表示进行加权求和,得到考虑上下文的评价方面表示;
步骤5.情感分类
根据步骤4中的输出,对评价方面和上下文的语义表示进行拼接,并基于拼接后的结果构建情感分析的分类器进行情感分类。
2.根据权利要求1所述的基于交互式注意力机制的细粒度情感分类模型的构建方法,其特征在于,所述步骤1中的意见句表示为如下形式:
C={c1,c2,…,cn}
其中n表示意见句中包含的词个数,ci表示意见句中的第i个词;
评价方面表示为如下形式:
T={t1,t2,…,tk}
其中k表示评价方面中包含的词个数,ti表示评价方面中的第i个词;
为了获取词语的词向量表示,首先将输入意见句和评价方面中的每个单词映射到一个低维稠密的词向量e中,具体如公式1-1、1-2所示,其中,M∈Rv×d表示词向量的词典,v和d分别代表词典大小与词向量维数,
最终,步骤1分别输出意见句和评价方面的词向量表示序列Ec和Et作为词的浅层语义表示:
3.根据权利要求1所述的基于交互式注意力机制的细粒度情感分类模型的构建方法,其特征在于,所述的步骤2具体包含如下步骤:
步骤2.1,前向的长短期记忆网络编码的阶段;
利用LSTM对评价方面的词向量序列按照原始顺序进行编码得到前向的隐藏特征,对于第j个词的具体计算过程如下:
其中,分别代表输入门、遗忘门、输出门,用于控制信息的传递;σ为sigmoid激活函数,W和b为网络参数、分别代表权重矩阵和偏移量,·代表矩阵乘法,⊙代表矩阵元素乘法;
步骤2.2,反向LSTM编码的阶段;
由于一个LSTM只能从一个方向进行计算,而不能建模另一个方向的语义,因此使用一个方向相反的LSTM从另一个方向对词序列进行编码,得到反向的隐藏特征:
步骤2.3,双向编码特征结合阶段;
将步骤2.1与步骤2.2中得到的两个方向的隐藏特征向量进行拼接,得到每个词双向的隐藏特征:
4.根据权利要求1所述的基于交互式注意力机制的细粒度情感分类模型的构建方法,其特征在于,所述的步骤3具体包含如下步骤:
步骤3.1,前向LSTM编码阶段;
本阶段过程与步骤2.1类似,最终得到上下文中每个词的前向语义表示:
步骤3.2,反向LSTM编码阶段;
本阶段过程与步骤2.2类似,最终得到上下文中每个词的反向语义表示:
步骤3.3,双向编码特征结合阶段:
将步骤3.1与步骤3.2中得到的两个方向的隐藏特征向量进行拼接,得到每个词双向的隐藏特征:
5.根据权利要求1所述的基于交互式注意力机制的细粒度情感分类模型的构建方法,其特征在于,所述的步骤4具体包含如下步骤:
步骤4.1,上下文和评价方面的整体表示生成阶段;
对步骤2和步骤3得到的词的高层语义表示状态进行平均池化,分别得到上下文和评价方面的初始整体表示,分别记为cavg和tavg
步骤4.2,使用注意力机制,得到考虑评价方面的上下文表示阶段;
以评价方面的初始整体表示作为输入,利用注意力机制选择上下文中有助于判断情感极性的重要信息,给定上下文的隐藏表示表示为和评价方面的初始整体表示tavg,可通过公式4-1生成注意力向量α:
其中是用于计算上下文向量重要程度的得分函数,该函数的计算方法如公式4-2所示:
其中Wa和ba是待学习的参数,tanh是非线性激活函数,tavg T表示向量tavg的转置;
在计算注意力权重的基础上,利用公式4-3得到上下文的最终语义表示,该表示包含了有助于判断情感极性的重要信息;
步骤4.3,使用注意力机制,得到考虑上下文的评价方面表示阶段;
以上下文的初始整体表示作为输入,利用注意力机制选择评价对象中有助于判断情感极性的重要信息,给定评价方面的隐藏表示表示为和上下文的初始整体表示cavg,可通过公式4-4生成注意力向量β:
在计算注意力权重的基础上,利用公式4-5得到评价方面的最终语义表示,该表示包含了有助于判断情感极性的重要信息;
步骤4.4,对上下文和评价方面的最终语义表示进行拼接,得到:
d=[rc;rt]。
6.根据权利要求1所述的基于交互式注意力机制的细粒度情感分类模型的构建方法,其特征在于,所述的步骤5使用非线性层将语义表示d投影到一个维度与情感极性种类数相同的向量空间中:
x=tanh(Wl·d+bl)
其中,Wl和bl分别代表权重矩阵和偏置向量;最后,使用公式5-1计算情感极性的概率分布:
其中,C为情感极性的类别数。在测试过程中,模型将选取概率最大的标签作为最终的结果。
CN201910760203.3A 2019-08-16 2019-08-16 基于交互式注意力机制的细粒度情感分类模型的构建方法 Active CN110457480B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910760203.3A CN110457480B (zh) 2019-08-16 2019-08-16 基于交互式注意力机制的细粒度情感分类模型的构建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910760203.3A CN110457480B (zh) 2019-08-16 2019-08-16 基于交互式注意力机制的细粒度情感分类模型的构建方法

Publications (2)

Publication Number Publication Date
CN110457480A true CN110457480A (zh) 2019-11-15
CN110457480B CN110457480B (zh) 2023-07-28

Family

ID=68487249

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910760203.3A Active CN110457480B (zh) 2019-08-16 2019-08-16 基于交互式注意力机制的细粒度情感分类模型的构建方法

Country Status (1)

Country Link
CN (1) CN110457480B (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110969014A (zh) * 2019-11-18 2020-04-07 南开大学 一种基于同步神经网络的意见二元组抽取方法
CN111160040A (zh) * 2019-12-26 2020-05-15 西安交通大学 一种基于多尺度门控均衡交互融合网络的信息可信度评估系统及方法
CN111813895A (zh) * 2020-08-07 2020-10-23 深圳职业技术学院 一种基于层次注意力机制和门机制的属性级别情感分析方法
CN112131383A (zh) * 2020-08-26 2020-12-25 华南师范大学 特定目标的情感极性分类方法
CN112380863A (zh) * 2020-10-29 2021-02-19 国网天津市电力公司 一种基于多头自注意力机制的序列标注方法
CN112417890A (zh) * 2020-11-29 2021-02-26 中国科学院电子学研究所苏州研究院 一种基于多样化语义注意力模型的细粒度实体分类方法
CN112597302A (zh) * 2020-12-18 2021-04-02 东北林业大学 基于多维评论表示的虚假评论检测方法
CN113449085A (zh) * 2021-09-02 2021-09-28 华南师范大学 多模态情感分类方法、装置以及电子设备
CN113705238A (zh) * 2021-06-17 2021-11-26 梧州学院 基于bert和方面特征定位模型的方面级情感分析方法及模型
CN113869065A (zh) * 2021-10-15 2021-12-31 梧州学院 一种基于“单词-短语”注意力机制的情感分类方法和系统
CN117390141A (zh) * 2023-12-11 2024-01-12 江西农业大学 一种农业社会化服务质量用户评价数据分析方法
US11966702B1 (en) * 2021-08-17 2024-04-23 Alphavu, Llc System and method for sentiment and misinformation analysis of digital conversations

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108446275A (zh) * 2018-03-21 2018-08-24 北京理工大学 基于注意力双层lstm的长文本情感倾向性分析方法
CN108595601A (zh) * 2018-04-20 2018-09-28 福州大学 一种融入Attention机制的长文本情感分析方法
CN108647205A (zh) * 2018-05-02 2018-10-12 深圳前海微众银行股份有限公司 细粒度情感分析模型构建方法、设备及可读存储介质
CN109145112A (zh) * 2018-08-06 2019-01-04 北京航空航天大学 一种基于全局信息注意力机制的商品评论分类方法
CN109543039A (zh) * 2018-11-23 2019-03-29 中山大学 一种基于深度网络的自然语言情感分析方法
CN109582764A (zh) * 2018-11-09 2019-04-05 华南师范大学 基于依存句法的交互注意力情感分析方法
CN109597997A (zh) * 2018-12-07 2019-04-09 上海宏原信息科技有限公司 基于评论实体、方面级情感分类方法和装置及其模型训练
CN109710761A (zh) * 2018-12-21 2019-05-03 中国标准化研究院 基于注意力增强的双向lstm模型的情感分析方法
CN109858032A (zh) * 2019-02-14 2019-06-07 程淑玉 融合Attention机制的多粒度句子交互自然语言推理模型
CN109948158A (zh) * 2019-03-15 2019-06-28 南京邮电大学 基于环境元嵌入和深度学习的情感倾向性分析方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108446275A (zh) * 2018-03-21 2018-08-24 北京理工大学 基于注意力双层lstm的长文本情感倾向性分析方法
CN108595601A (zh) * 2018-04-20 2018-09-28 福州大学 一种融入Attention机制的长文本情感分析方法
CN108647205A (zh) * 2018-05-02 2018-10-12 深圳前海微众银行股份有限公司 细粒度情感分析模型构建方法、设备及可读存储介质
CN109145112A (zh) * 2018-08-06 2019-01-04 北京航空航天大学 一种基于全局信息注意力机制的商品评论分类方法
CN109582764A (zh) * 2018-11-09 2019-04-05 华南师范大学 基于依存句法的交互注意力情感分析方法
CN109543039A (zh) * 2018-11-23 2019-03-29 中山大学 一种基于深度网络的自然语言情感分析方法
CN109597997A (zh) * 2018-12-07 2019-04-09 上海宏原信息科技有限公司 基于评论实体、方面级情感分类方法和装置及其模型训练
CN109710761A (zh) * 2018-12-21 2019-05-03 中国标准化研究院 基于注意力增强的双向lstm模型的情感分析方法
CN109858032A (zh) * 2019-02-14 2019-06-07 程淑玉 融合Attention机制的多粒度句子交互自然语言推理模型
CN109948158A (zh) * 2019-03-15 2019-06-28 南京邮电大学 基于环境元嵌入和深度学习的情感倾向性分析方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
YEQUAN WANG: "Attention-based LSTM for Aspect-level Sentiment Classification", 《PROCEEDINGS OF THE 2016 CONFERENCE ON EMPIRICAL METHODS IN NATURAL LANGUAGE PROCESSING 2016》 *
YEQUAN WANG: "Attention-based LSTM for Aspect-level Sentiment Classification", 《PROCEEDINGS OF THE 2016 CONFERENCE ON EMPIRICAL METHODS IN NATURAL LANGUAGE PROCESSING 2016》, 31 December 2016 (2016-12-31) *
关鹏飞,李宝安,吕学强,周建设: "注意力增强的双向LSTM情感分析", 《中文信息学报》 *
陈自岩: "一种利用语义相似特征提升细粒度情感分析方法", 《计算机应用与软件》 *
陈自岩: "一种利用语义相似特征提升细粒度情感分析方法", 《计算机应用与软件》, 31 March 2017 (2017-03-31) *

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110969014A (zh) * 2019-11-18 2020-04-07 南开大学 一种基于同步神经网络的意见二元组抽取方法
CN110969014B (zh) * 2019-11-18 2023-04-07 南开大学 一种基于同步神经网络的意见二元组抽取方法
CN111160040A (zh) * 2019-12-26 2020-05-15 西安交通大学 一种基于多尺度门控均衡交互融合网络的信息可信度评估系统及方法
CN111813895B (zh) * 2020-08-07 2022-06-03 深圳职业技术学院 一种基于层次注意力机制和门机制的属性级别情感分析方法
CN111813895A (zh) * 2020-08-07 2020-10-23 深圳职业技术学院 一种基于层次注意力机制和门机制的属性级别情感分析方法
CN112131383A (zh) * 2020-08-26 2020-12-25 华南师范大学 特定目标的情感极性分类方法
CN112380863A (zh) * 2020-10-29 2021-02-19 国网天津市电力公司 一种基于多头自注意力机制的序列标注方法
CN112417890A (zh) * 2020-11-29 2021-02-26 中国科学院电子学研究所苏州研究院 一种基于多样化语义注意力模型的细粒度实体分类方法
CN112417890B (zh) * 2020-11-29 2023-11-24 中国科学院电子学研究所苏州研究院 一种基于多样化语义注意力模型的细粒度实体分类方法
CN112597302B (zh) * 2020-12-18 2022-04-29 东北林业大学 基于多维评论表示的虚假评论检测方法
CN112597302A (zh) * 2020-12-18 2021-04-02 东北林业大学 基于多维评论表示的虚假评论检测方法
CN113705238A (zh) * 2021-06-17 2021-11-26 梧州学院 基于bert和方面特征定位模型的方面级情感分析方法及模型
US11966702B1 (en) * 2021-08-17 2024-04-23 Alphavu, Llc System and method for sentiment and misinformation analysis of digital conversations
CN113449085A (zh) * 2021-09-02 2021-09-28 华南师范大学 多模态情感分类方法、装置以及电子设备
CN113449085B (zh) * 2021-09-02 2021-11-26 华南师范大学 多模态情感分类方法、装置以及电子设备
CN113869065A (zh) * 2021-10-15 2021-12-31 梧州学院 一种基于“单词-短语”注意力机制的情感分类方法和系统
CN113869065B (zh) * 2021-10-15 2024-04-12 梧州学院 一种基于“单词-短语”注意力机制的情感分类方法和系统
CN117390141A (zh) * 2023-12-11 2024-01-12 江西农业大学 一种农业社会化服务质量用户评价数据分析方法
CN117390141B (zh) * 2023-12-11 2024-03-08 江西农业大学 一种农业社会化服务质量用户评价数据分析方法

Also Published As

Publication number Publication date
CN110457480B (zh) 2023-07-28

Similar Documents

Publication Publication Date Title
CN110457480A (zh) 基于交互式注意力机制的细粒度情感分类模型的构建方法
CN111444709B (zh) 文本分类方法、装置、存储介质及设备
US20220237368A1 (en) Systems and methods for machine content generation
Yi et al. Automatic poetry generation with mutual reinforcement learning
CN111414476A (zh) 一种基于多任务学习的属性级情感分析方法
CN108363695B (zh) 一种基于双向依赖语法树表征的用户评论属性抽取方法
CN110472042B (zh) 一种细粒度情感分类方法
CN108959482A (zh) 基于深度学习的单轮对话数据分类方法、装置和电子设备
CN108256968B (zh) 一种电商平台商品专家评论生成方法
CN110209789A (zh) 一种用户注意力引导的多模态对话系统及方法
CN109948158A (zh) 基于环境元嵌入和深度学习的情感倾向性分析方法
CN110096575B (zh) 面向微博用户的心理画像方法
CN113254610B (zh) 面向专利咨询的多轮对话生成方法
CN111127146A (zh) 基于卷积神经网络与降噪自编码器的信息推荐方法及系统
CN111104512A (zh) 游戏评论的处理方法及相关设备
CN113392766A (zh) 一种基于注意力机制的人脸表情识别方法
CN115310425A (zh) 基于政策文本分类和关键信息识别的政策文本分析方法
Rawat et al. Recent deep learning based nlp techniques for chatbot development: An exhaustive survey
CN112256866A (zh) 一种基于深度学习的文本细粒度情感分析方法
CN111325571A (zh) 一种多任务学习的商品评论标签自动生成方法、装置及系统
Josheski et al. Shapley-Folkman-Lyapunov theorem and asymmetric first price auctions
Pang et al. A novel syntax-aware automatic graphics code generation with attention-based deep neural network
CN114625842A (zh) 一种基于结构注意力增强机制的虚假评论识别模型
CN116467443A (zh) 基于主题识别的网络舆情文本分类方法
Hao et al. How do Mainland Chinese tourists perceive Hong Kong in turbulence? A deep learning approach to sentiment analytics

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant