CN112686034A - 一种情感分类方法、装置及设备 - Google Patents

一种情感分类方法、装置及设备 Download PDF

Info

Publication number
CN112686034A
CN112686034A CN202110301281.4A CN202110301281A CN112686034A CN 112686034 A CN112686034 A CN 112686034A CN 202110301281 A CN202110301281 A CN 202110301281A CN 112686034 A CN112686034 A CN 112686034A
Authority
CN
China
Prior art keywords
word
target
attribute word
target attribute
vector corresponding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110301281.4A
Other languages
English (en)
Other versions
CN112686034B (zh
Inventor
赵浩梁
薛云
古东宏
陈建颖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China Normal University
Original Assignee
South China Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China Normal University filed Critical South China Normal University
Priority to CN202110301281.4A priority Critical patent/CN112686034B/zh
Publication of CN112686034A publication Critical patent/CN112686034A/zh
Application granted granted Critical
Publication of CN112686034B publication Critical patent/CN112686034B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Machine Translation (AREA)

Abstract

本发明提供一种情感分类方法、装置及设备,该方法包括:获取文本内的目标句子;其中,该目标句子包括目标属性词;将目标句子对应的词向量和目标属性词对应的词向量输入特征提取模型,得到与目标属性词语义相关的特征向量和与目标属性词位置相关的特征向量;将上述特征向量输入特征融合模型,得到目标特征向量;获取邻接属性词对应的情感极性向量和连词的类别对应的连词向量;将情感极性向量和连词向量输入辅助特征融合模型,得到辅助特征向量;根据拼接后的目标特征向量和辅助特征向量以及情感极性分类函数,得到目标属性词的情感分类结果。相对于现有技术,本发明考虑了邻接属性词的情感极性以及连词对情感分类的影响,提高了情感分类的准确性。

Description

一种情感分类方法、装置及设备
技术领域
本发明涉及自然语言处理技术领域,特别是涉及一种情感分类方法、装置及设备。
背景技术
情感分析是自然语言处理(Natural Language Processing,NLP)中的重要任务,其目的在于对带有情感色彩的主观性文本进行分析。其中,对于文本内若干个属性词的情感分析属于细粒度情感分析,与传统的情感分析不同,其目的主要在于识别句子中属性词的情感分类结果。
目前,有众多神经网络与注意力机制相结合的方法用以解决属性词的情感分类问题,这些方法虽然能够克服浅层学习模型的缺陷,但是依旧不能够充分捕捉句子中上下文与属性词之间的语义关系,导致获取到的属性词的表示存在过多混杂的噪声,并且其没有考虑句子中属性词之间的关联,忽略了对情感分类的关键性线索,从而导致情感分类的准确性较低。
发明内容
为克服相关技术中存在的问题,本发明实施例提供了一种情感分类方法、装置及设备。
根据本发明实施例的第一方面,提供一种情感分类方法,包括如下步骤:
获取文本内的目标句子;其中,所述目标句子包括目标属性词、所述目标属性词对应的邻接属性词以及所述目标属性词与所述邻接属性词之间的连词,所述邻接属性词为在所述目标句子中与所述目标属性词相邻的前一个属性词;
将所述目标句子对应的词向量和所述目标属性词对应的词向量输入预设的特征提取模型,得到与所述目标属性词的语义相关的特征向量和与所述目标属性词的位置相关的特征向量;
将与所述目标属性词的语义相关的特征向量和与所述目标属性词的位置相关的特征向量输入预设的特征融合模型,得到所述目标属性词对应的目标特征向量;
获取所述邻接属性词对应的情感极性向量和所述连词的类别对应的连词向量;
将所述邻接属性词对应的情感极性向量和所述连词的类别对应的连词向量输入预设的辅助特征融合模型,得到所述目标属性词对应的辅助特征向量;
根据拼接后的所述目标特征向量和所述辅助特征向量以及预设的情感极性分类函数,得到所述目标属性词的情感分类结果。
根据本发明实施例的第二方面,提供一种情感分类装置,包括:
第一获取单元,用于获取文本内的目标句子;其中,所述目标句子包括目标属性词、所述目标属性词对应的邻接属性词以及所述目标属性词与所述邻接属性词之间的连词,所述邻接属性词为在所述目标句子中与所述目标属性词相邻的前一个属性词;
特征提取单元,用于将所述目标句子对应的词向量和所述目标属性词对应的词向量输入预设的特征提取模型,得到与所述目标属性词的语义相关的特征向量和与所述目标属性词的位置相关的特征向量;
特征融合单元,用于将与所述目标属性词的语义相关的特征向量和与所述目标属性词的位置相关的特征向量输入预设的特征融合模型,得到所述目标属性词对应的目标特征向量;
第二获取单元,用于获取所述邻接属性词对应的情感极性向量和所述连词的类别对应的连词向量;
辅助特征融合单元,用于将所述邻接属性词对应的情感极性向量和所述连词的类别对应的连词向量输入预设的辅助特征融合模型,得到所述目标属性词对应的辅助特征向量;
分类单元,用于根据拼接后的所述目标特征向量和所述辅助特征向量以及预设的情感极性分类函数,得到所述目标属性词的情感分类结果。
根据本发明实施例的第三方面,提供一种情感分类设备,包括:处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述第一方面所述方法的步骤。
在本发明实施例中,通过获取文本内的目标句子;其中,所述目标句子包括目标属性词、所述目标属性词对应的邻接属性词以及所述目标属性词与所述邻接属性词之间的连词,所述邻接属性词为在所述目标句子中与所述目标属性词相邻的前一个属性词;将所述目标句子对应的词向量和所述目标属性词对应的词向量输入预设的特征提取模型,得到与所述目标属性词的语义相关的特征向量和与所述目标属性词的位置相关的特征向量;将与所述目标属性词的语义相关的特征向量和与所述目标属性词的位置相关的特征向量输入预设的特征融合模型,得到所述目标属性词对应的目标特征向量;获取所述邻接属性词对应的情感极性向量和所述连词的类别对应的连词向量;将所述邻接属性词对应的情感极性向量和所述连词的类别对应的连词向量输入预设的辅助特征融合模型,得到所述目标属性词对应的辅助特征向量;根据拼接后的所述目标特征向量和所述辅助特征向量以及预设的情感极性分类函数,得到所述目标属性词的情感分类结果。本申请实施例考虑了目标句子中与目标属性词的语义以及位置相关的特征对情感分类的重要影响,充分地捕捉了目标句子中与目标属性词相关的特征,降低了获取的目标属性词对应的目标特征向量中的噪声,并且,还考虑了目标属性词的邻接属性词的情感极性以及连词对情感分类的影响,将其均作为情感分类的关键性线索,得到目标属性词对应的辅助特征向量,最后利用拼接后的目标特征向量和辅助特征向量获取目标属性词的情感分类结果,提高了情感分类的准确性。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。
为了更好地理解和实施,下面结合附图详细说明本发明。
附图说明
图1为本发明一个示例性实施例提供的情感分类方法的流程示意图;
图2为本发明另一个示例性实施例提供的情感分类方法的流程示意图;
图3为本发明一个示例性实施例提供的情感分类方法中S102的流程示意图;
图4为本发明一个示例性实施例提供的情感分类方法中S1021的流程示意图;
图5为本发明一个示例性实施例提供的情感分类方法中S1022的流程示意图;
图6为本发明一个示例性实施例提供的情感分类方法中S103的流程示意图;
图7为本发明一个示例性实施例提供的情感分类方法中S104的流程示意图;
图8为本发明一个示例性实施例提供的情感分类装置的结构示意图;
图9为本发明一个示例性实施例提供的情感分类设备的结构示意图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
在本发明使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本发明可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本发明范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语 “如果”/“若” 可以被解释成为 “在……时” 或“当……时” 或 “响应于确定”。
请参阅图1,图1为本发明一个示例性实施例提供的情感分类方法的流程示意图,所述方法由情感分类设备执行,包括如下步骤:
S101:获取文本内的目标句子;其中,所述目标句子包括目标属性词、所述目标属性词对应的邻接属性词以及所述目标属性词与所述邻接属性词之间的连词,所述邻接属性词为在所述目标句子中与所述目标属性词相邻的前一个属性词。
情感分类设备获取文本内的目标句子。其中,所述目标句子为用于对目标属性词进行情感分类的句子。
所述目标句子中包括目标属性词、目标属性词对应的邻接属性词以及目标属性词与邻接属性词之间的连词。
其中,所述邻接属性词为在所述目标句子中与所述目标属性词相邻的前一个属性词。
所述连词是一种虚词,不能独立担任句子成分,只能起到连接目标属性词与邻接属性词的作用。
在一个可选的实施例中,请参阅图2,步骤S101之后,包括步骤S107~S108具体如下:
S107:将所述目标句子和所述目标属性词输入预设的词嵌入表示模型,得到所述目标句子对应的词向量和所述目标属性词对应的初始词向量。
预设的词嵌入表示模型为预训练好的模型,设置在情感分类设备中,预设的词嵌入表示模型用于将单词映射到一个高维的向量中以实现对单词的表示,这个向量被称为词向量。
在本申请实施例中,预设的词嵌入表示模型可以为GloVe模型或word2vec模型等,在此不进行限定。
情感分类设备将目标句子和目标属性词输入预设的词嵌入表示模型,得到目标句 子对应的词向量
Figure 256399DEST_PATH_IMAGE001
和目标属性词对应的初始词向量
Figure 844507DEST_PATH_IMAGE002
其中,目标句子对应的词向量
Figure 830917DEST_PATH_IMAGE001
Figure 137265DEST_PATH_IMAGE003
Figure 234534DEST_PATH_IMAGE004
列的矩阵,
Figure 444192DEST_PATH_IMAGE005
Figure 601503DEST_PATH_IMAGE006
分别表示目标句子中各个单词对应的词向量,
Figure 129568DEST_PATH_IMAGE007
表示目标句子中第i个 单词对应的词向量,
Figure 30528DEST_PATH_IMAGE008
表示目标句子的长度、目标句子中单词的个数或者目标句子对应的 词向量的列数。
目标句子中包括M个属性词
Figure 593227DEST_PATH_IMAGE009
,每个属性词是目标句子中的一段 词序列,至少包括一个单词。
在本申请实施例中,目标属性词为目标句子中的第i个属性词,目标属性词对应的 初始词向量
Figure 921440DEST_PATH_IMAGE002
是一个
Figure 936801DEST_PATH_IMAGE003
Figure 375873DEST_PATH_IMAGE010
列的矩阵,
Figure 291614DEST_PATH_IMAGE011
Figure 790728DEST_PATH_IMAGE012
表示目标 属性词在目标句子中的起始位置,
Figure 293385DEST_PATH_IMAGE013
Figure 536147DEST_PATH_IMAGE014
可以理解为目标属性词的长度、目标 属性词中单词的个数或者目标属性词对应的初始词向量的列数,
Figure 73439DEST_PATH_IMAGE015
Figure 743455DEST_PATH_IMAGE016
表示目标属性词在目标句子中的终止位置。
S108:对所述目标属性词对应的初始词向量进行卷积操作,得到所述目标属性词对应的词向量。
情感分类设备对目标属性词对应的初始词向量
Figure 467828DEST_PATH_IMAGE002
进行卷积操作,得到目标属性 词对应的词向量
Figure 248703DEST_PATH_IMAGE017
所述目标属性词对应的词向量
Figure 407545DEST_PATH_IMAGE018
其中,relu函数为现有的线性整流函数;
Figure 982883DEST_PATH_IMAGE019
函数表示求取relu函数输出的最大 值;
Figure 460131DEST_PATH_IMAGE020
为卷积操作的卷积核,卷积核为
Figure 779117DEST_PATH_IMAGE021
Figure 291001DEST_PATH_IMAGE022
列的矩阵;
Figure 37240DEST_PATH_IMAGE023
表示目标属性词(也即第i 个属性词)每次卷积操作的范围,
Figure 267365DEST_PATH_IMAGE024
Figure 29522DEST_PATH_IMAGE025
Figure 520546DEST_PATH_IMAGE026
表示偏置。
S102:将所述目标句子对应的词向量和所述目标属性词对应的词向量输入预设的特征提取模型,得到与所述目标属性词的语义相关的特征向量和与所述目标属性词的位置相关的特征向量。
预设的特征提取模型是预训练好的模型,设置在情感分类设备中,预设的特征提取模型能够有效捕捉对属性词情感分类更为重要的上下文,通过注意力机制和位置信息给予上下文中不同单词不同的重要程度,得到不同的句子表示,再对不同句子表示分别进行特征提取,得到与目标属性词的语义相关的特征向量和与目标属性词的位置相关的特征向量。
在一个可选的实施例中,请参阅图3,步骤S102包括步骤S1021~S1024,具体如下:
S1021:将所述目标句子对应的词向量和所述目标属性词对应的词向量输入预设的注意力机制模型,得到第一句子表示。
情感分类设备将所述目标句子对应的词向量和所述目标属性词对应的词向量输入预设的注意力机制模型,得到第一句子表示。
其中,预设的注意力机制模型包括在预设的特征提取模型中,预设的注意力机制模型能够获取目标句子中每个单词关于目标属性词的注意力权重和基于该注意力权重的第一句子表示。
具体地,在一个可选的实施例中,请参阅图4,步骤S1021包括步骤S10211~S10212,如下所示:
S10211:根据所述目标句子对应的词向量、所述目标属性词对应的词向量以及预设的注意力权重计算公式,得到所述目标句子中每个单词对于所述目标属性词的注意力权重。
情感分类设备根据目标句子对应的词向量、目标属性词对应的词向量以及预设的注意力权重计算公式,得到所述目标句子中每个单词对于所述目标属性词的注意力权重。
其中,预设的注意力权重计算公式如下:
Figure 437687DEST_PATH_IMAGE027
Figure 889528DEST_PATH_IMAGE028
Figure 550316DEST_PATH_IMAGE029
为第j个单词对于目标属性词的注意力权重,
Figure 771213DEST_PATH_IMAGE005
目标 句子对应的词向量,
Figure 124834DEST_PATH_IMAGE030
表示目标句子中第j个单词对应的词向量;
Figure 798392DEST_PATH_IMAGE017
表示目标属性词对 应的词向量;
Figure 262871DEST_PATH_IMAGE031
表示权重矩阵,
Figure 828021DEST_PATH_IMAGE032
表示偏置;
Figure 352543DEST_PATH_IMAGE033
表示双曲正切函数;
Figure 513397DEST_PATH_IMAGE008
表示目标句 子的长度、目标句子中单词的个数或者目标句子对应的词向量的列数;k表示用于累加运算 的变量,
Figure 47147DEST_PATH_IMAGE034
表示目标句子中第k个单词对应的词向量。
S10212:根据所述目标句子中每个单词对于所述目标属性词的注意力权重和所述目标句子对应的词向量,得到所述第一句子表示。
情感分类设备根据目标句子中每个单词对于目标属性词的注意力权重和目标句 子对应的词向量,得到第一句子表示
Figure 836111DEST_PATH_IMAGE035
其中,第一句子表示,
Figure 406901DEST_PATH_IMAGE036
Figure 179685DEST_PATH_IMAGE035
是一个
Figure 126912DEST_PATH_IMAGE021
Figure 35962DEST_PATH_IMAGE008
列 的矩阵,第一句子表示中第j个单词对应的表示为
Figure 541768DEST_PATH_IMAGE037
Figure 270689DEST_PATH_IMAGE038
Figure 21608DEST_PATH_IMAGE030
为目标句子 中第j个单词对应的词向量,
Figure 785164DEST_PATH_IMAGE039
为第j个单词对于目标属性词的注意力权重。
由于目标句子中上下文词对目标属性词的情感极性判断的贡献程度不同,因而,本实施例通过注意力机制模型计算目标属性词与目标句子中上下文的交互信息,获取目标句子中每个单词关于目标属性词的注意力权重和基于该注意力权重的第一句子表示,使第一句子表示更侧重于与目标属性词语义相关的上下文词。
S1022:获取每个所述单词与所述目标属性词之间的距离所对应的位置向量,根据所述位置向量和所述目标句子对应的词向量,得到第二句子表示。
在情感分类设备中可以预先建立距离与位置向量之间的对应关系。
情感分类设备首先获取每个单词与目标属性词之间的距离,之后根据距离以及距离与位置向量之间的对应关系,获取单词对应的位置向量,最后根据单词的位置向量和目标句子对应的词向量,得到第二句子表示。
在一个可选的实施例中,请参阅图5,步骤S1022包括步骤S10221~S10223,如下所示:
S10221:根据所述目标句子中每个单词与所述目标属性词之间的距离和预设的位置索引值计算公式,获取每个所述单词对应的位置索引值。
情感分类设备根据目标句子中每个单词与目标属性词之间的距离和预设的位置索引值计算公式,获取每个单词对应的位置索引值。
其中,预设的位置索引值计算公式如下:
Figure 963336DEST_PATH_IMAGE040
Figure 445133DEST_PATH_IMAGE041
表示目标句子中第j个单词的位置索引值;
Figure 734163DEST_PATH_IMAGE042
表示目标属性词在目标句子中的 起始位置值,
Figure 352226DEST_PATH_IMAGE043
表示目标属性词在目标句子中的终止位置值,
Figure 825933DEST_PATH_IMAGE044
表示第j个单词在目标句子 中的位置值。
S10222:获取位置矩阵,根据所述位置矩阵和每个所述单词对应的位置索引值,得到每个所述单词对应的位置向量。
情感分类设备首先获取位置矩阵。
在一个可选的实施例中,所述位置矩阵在是利用均匀分布随机初始化得到的矩阵。
其中,位置矩阵
Figure 171857DEST_PATH_IMAGE045
,所述位置矩阵是一个
Figure 389211DEST_PATH_IMAGE046
Figure 2726DEST_PATH_IMAGE008
列的矩 阵。
之后,情感分类设备根据每个单词对应的位置索引值,从所述位置矩阵中提取每个单词对应的位置向量。
例如:某一个单词对应的位置索引值是j,那么就从位置矩阵中提取下标为j的列 向量
Figure 381755DEST_PATH_IMAGE047
S10223:将每个所述单词对应的位置向量与所述目标句子对应的词向量拼接,得到所述第二句子表示。
情感分类设备将每个单词对应的位置向量与目标句子对应的词向量拼接,得到第二句子表示。
其中,第二句子表示为
Figure 713511DEST_PATH_IMAGE048
Figure 468977DEST_PATH_IMAGE049
Figure 202578DEST_PATH_IMAGE050
是一个
Figure 486929DEST_PATH_IMAGE051
Figure 430614DEST_PATH_IMAGE052
列的矩阵;第二句子表示
Figure 363672DEST_PATH_IMAGE048
中第j个单词对应的表示为
Figure 76414DEST_PATH_IMAGE053
Figure 203770DEST_PATH_IMAGE054
Figure 244538DEST_PATH_IMAGE055
为目标句子中第j个单词对应的词向量,
Figure 341807DEST_PATH_IMAGE047
为第j个单词对应的 位置向量。
由于目标句子中越靠近属性词的上下文词,对属性的情感极性贡献程度越高,因而,本实施例通过根据每个单词与目标属性词的距离,得到每个单词对应的位置向量,进而再根据位置向量,得到第二句子表示,使第二句子表示更侧重于与目标属性词距离相近的上下文词。
S1023:将所述第一句子表示和所述目标属性词对应的词向量输入至预设的结合门控机制的卷积神经网络模型,得到与所述目标属性词的语义相关的特征向量。
预设的结合门控机制的卷积神经网络模型是预先训练好的模型,设置在情感分类设备中。在一个可选的实施例中,预设的结合门控机制的卷积神经网络模型为现有的GCAE模型,用于更准确地提取出目标句子中的特征。
具体地,情感分类设备将第一句子表示
Figure 50000DEST_PATH_IMAGE035
和目标属性词对应的词向量
Figure 207312DEST_PATH_IMAGE017
输入 至预设的结合门控机制的卷积神经网络模型,得到与目标属性词的语义相关的特征向量
Figure 236841DEST_PATH_IMAGE056
其中,与目标属性词的语义相关的特征向量
Figure 137801DEST_PATH_IMAGE057
Figure 559555DEST_PATH_IMAGE056
是 一个1行
Figure 763134DEST_PATH_IMAGE058
列的矩阵,
Figure 903129DEST_PATH_IMAGE059
表示GCAE模型对应的计算过程,由于其为现有模型,对于 该模型内部的计算过程不在此详细说明。
S1024:将所述第二句子表示和所述目标属性词对应的词向量输入至预设的结合门控机制的卷积神经网络模型,得到与所述目标属性词的位置相关的特征向量。
情感分类设备将第二句子表示
Figure 217566DEST_PATH_IMAGE048
和目标属性词对应的词向量目标属性词对应 的词向量输入至预设的结合门控机制的卷积神经网络模型,得到与目标属性词的位置相关 的特征向量
Figure 759406DEST_PATH_IMAGE060
其中,与目标属性词的位置相关的特征向量
Figure 133887DEST_PATH_IMAGE061
Figure 495598DEST_PATH_IMAGE062
也是一个1行
Figure 112262DEST_PATH_IMAGE058
列的矩阵。
S103:将与所述目标属性词的语义相关的特征向量和与所述目标属性词的位置相关的特征向量输入预设的特征融合模型,得到所述目标属性词对应的目标特征向量。
情感分类设备将与目标属性词的语义相关的特征向量和与目标属性词的位置相关的特征向量输入预设的特征融合模型,得到目标属性词对应的目标特征向量。
由于在注意力机制的应用过程中会引入额外的噪音,在利用预设的注意力机制模型获取第一句子表示的过程中,其会将较高的权重分配给某些领域特有的单词,而不是与目标属性词的真实情感相关的单词。并且,在面对多个属性词的复杂文本时,仅仅利用位置信息,获取第二句子表示是不可靠的。因此,最终得到的与所述目标属性词的语义相关的特征向量和与所述目标属性词的位置相关的特征向量是含有噪音,需要对其进行进一步处理的。
因此,在本实施例中提出了预设的特征融合模型,该模型为预训练好的模型,设置在情感分类设备中。
预设的特征融合模型能够降低不相关单词对情感分类的影响,得到目标属性词对应的目标特征向量。
在一个可选的实施例中,请参阅图6,步骤S103包括步骤S1031~S1032,具体如下:
S1031:根据与所述目标属性词的语义相关的特征向量、与所述目标属性词的位置相关的特征向量以及预设的特征融合计算公式,得到融合特征向量。
情感分类设备根据与目标属性词的语义相关的特征向量
Figure 508608DEST_PATH_IMAGE056
、与所述目标属性词 的位置相关的特征向量
Figure 53990DEST_PATH_IMAGE063
以及预设的特征融合计算公式,得到融合特征向量
Figure 168577DEST_PATH_IMAGE064
其中,预设的特征融合计算公式如下:
Figure 90396DEST_PATH_IMAGE065
Figure 341249DEST_PATH_IMAGE064
表示融合特征向量;
Figure 57532DEST_PATH_IMAGE066
表示双曲正切函数;
Figure 659415DEST_PATH_IMAGE056
表示与目标属性词的语 义相关的特征向量;
Figure 620811DEST_PATH_IMAGE067
表示可训练参数矩阵,其是一个
Figure 991750DEST_PATH_IMAGE068
Figure 144513DEST_PATH_IMAGE069
列的矩阵;
Figure 968113DEST_PATH_IMAGE063
表示 与所述目标属性词的位置相关的特征向量;
Figure 966156DEST_PATH_IMAGE063
表示与所述目标属性词的位置相关的特 征向量;
Figure 191601DEST_PATH_IMAGE070
表示可训练参数矩阵,其也是一个
Figure 515266DEST_PATH_IMAGE068
Figure 826162DEST_PATH_IMAGE069
列的矩阵;
Figure 126431DEST_PATH_IMAGE071
表示偏置,其是 一个1行
Figure 471961DEST_PATH_IMAGE069
列的矩阵。
S1032:根据所述融合特征向量、与所述目标属性词的语义相关的特征向量和与所述目标属性词的位置相关的特征向量,得到所述目标属性词对应的目标特征向量。
情感分类设备将融合特征向量
Figure 560003DEST_PATH_IMAGE064
、与目标属性词的语义相关的特征向量
Figure 499140DEST_PATH_IMAGE056
和 与目标属性词的位置相关的特征向量
Figure 963620DEST_PATH_IMAGE063
拼接,得到所述目标属性词对应的目标特征向 量
Figure 39023DEST_PATH_IMAGE072
其中,
Figure 563545DEST_PATH_IMAGE073
Figure 724399DEST_PATH_IMAGE074
表示拼接。
S104:获取所述邻接属性词对应的情感极性向量和所述连词的类别对应的连词向量。
在本申请实施例中,邻接属性词是指在目标句子中与目标属性词相邻的前一个属性词。其邻接属性词的情感分类结果会在上一次迭代情感分类方法对应的模型时获取到。
连词是指邻接属性词与目标属性词之间的连词,连词类别的不同,会导致邻接属性词与目标属性词之间的情感关系的不同。
情感分类设备获取邻接属性词对应的情感极性向量和连词的类别对应的连词向量。
其中,邻接属性词对应的情感极性向量是指将邻接属性词的情感分类结果转化为情感极性向量,连词的类别对应的连词向量是指将连词的类别转化为连词向量。
在一个可选的实施例中,请参阅图7,步骤S104包括步骤S1041~S1044,具体如下:
S1041:获取所述邻接属性词的情感分类结果、情感极性矩阵和连词矩阵。
情感极性矩阵和连词矩阵均是均匀分布随机初始化得到的矩阵,并在情感分类方法对应的模型迭代过程进行更新。
情感极性矩阵是一个
Figure 992570DEST_PATH_IMAGE075
Figure 435663DEST_PATH_IMAGE076
列的矩阵,其中,
Figure 396666DEST_PATH_IMAGE075
表示情感分类的类型数量,
Figure 779237DEST_PATH_IMAGE076
表 示情感极性向量的维度。
连词矩阵是一个C行
Figure 585519DEST_PATH_IMAGE077
列的矩阵,其中,C表示连词的类别的数量,
Figure 635514DEST_PATH_IMAGE077
表示连词 的类别对应的连词向量的维度。
S1042:根据所述情感分类结果对应的索引值和所述情感极性矩阵,得到所述邻接属性词对应的情感极性向量。
情感分类设备获取邻接属性词的情感分类结果对应的索引值。
在一个可选的实施例中,情感分类的类型共包括3类,分别为积极、消极和中性。情感分类结果对应的索引值分别为,0代表积极、1代表消极以及2代表中性。
基于情感分类结果对应的索引值和情感极性矩阵,得到在情感极性矩阵中索引值 对应的向量,得到邻接属性词对应的情感极性向量
Figure 501839DEST_PATH_IMAGE078
S1043:根据预设的连词与类别之间的对应关系,获取所述连词的类别。
情感分类设备根据连词以及预设的连词与类别之间的对应关系,获取连词的类别。
在一个可选的实施例中,连词的类别包括2种,分别为表示并列关系的连词和表示转折关系的连词。
例如:表示并列关系的连词有and、or、as well as、also、further和moreover。表示转折关系的连词有but、however、instead、except、while、though、although和yet。
S1044:根据所述连词的类别对应的索引值和所述连词矩阵,得到所述连词的类别对应的连词向量。
情感分类设备根据连词的类别对应的索引值和连词矩阵,得到连词的类别对应的连词向量。
在一个可选的实施例中,连词的类别包括2种,连词的类别对应的索引值分别1和2,1对应第一种连词类别,2对应第二种连词类别。
基于连词的类别对应该索引值和连词矩阵,得到连词矩阵中该索引值对应的向量,即为连词的类别对应的连词向量。
其中,当连词的类别对应的索引值为1时,连词的类别对应的连词向量为
Figure 902865DEST_PATH_IMAGE079
Figure 152318DEST_PATH_IMAGE079
是一个1行
Figure 181454DEST_PATH_IMAGE077
列的向量;当连词的类别对应的索引值为2时,连词的类别对应的连词向量 为
Figure 359626DEST_PATH_IMAGE080
Figure 44685DEST_PATH_IMAGE080
也是一个1行
Figure 333715DEST_PATH_IMAGE077
列的向量;
S105:将所述邻接属性词对应的情感极性向量和所述连词的类别对应的连词向量输入预设的辅助特征融合模型,得到所述目标属性词对应的辅助特征向量。
预设的辅助特征融合模型是一个预训练好的模型,设置在情感分类设备中,该辅助特征融合模型用于融合情感极性向量和连词向量,提供更丰富的辅助分类信息。
具体地,情感分类设备根据邻接属性词对应的情感极性向量
Figure 217357DEST_PATH_IMAGE078
、连词的类别对应 的连词向量和预设的辅助特征融合计算公式,得到目标属性词对应的辅助特征向量
Figure 333474DEST_PATH_IMAGE081
其中,预设的辅助特征融合计算公式如下:
Figure 177934DEST_PATH_IMAGE082
Figure 129709DEST_PATH_IMAGE083
表示连词的类别的索引值;如前所述
Figure 274383DEST_PATH_IMAGE084
,连词的类别对应的连词向量为
Figure 918990DEST_PATH_IMAGE079
Figure 827910DEST_PATH_IMAGE085
,连词的类别对应的连词向量为
Figure 724321DEST_PATH_IMAGE080
;relu函数为现有的线性整流函数;
Figure 316977DEST_PATH_IMAGE078
为邻 接属性词对应的情感极性向量;
Figure 509317DEST_PATH_IMAGE086
为情感极性向量的特征投影参数矩阵,
Figure 593948DEST_PATH_IMAGE086
是一个
Figure 887526DEST_PATH_IMAGE087
Figure 600267DEST_PATH_IMAGE088
列的矩阵;
Figure 196464DEST_PATH_IMAGE089
为连词向量
Figure 142293DEST_PATH_IMAGE079
的参数矩阵;
Figure 239562DEST_PATH_IMAGE090
为连词向量
Figure 947755DEST_PATH_IMAGE080
的参数矩阵,
Figure 839487DEST_PATH_IMAGE089
Figure 541120DEST_PATH_IMAGE090
均为
Figure 317446DEST_PATH_IMAGE091
Figure 739201DEST_PATH_IMAGE088
列的矩阵。
S106:根据拼接后的所述目标特征向量和所述辅助特征向量以及预设的情感极性分类函数,得到所述目标属性词的情感分类结果。
情感分类设备根据拼接后的目标特征向量和辅助特征向量以及预设的情感极性分类函数,得到目标属性词的情感分类结果。
其中,预设的情感极性分类函数如下:
Figure 942780DEST_PATH_IMAGE092
Figure 863200DEST_PATH_IMAGE093
为目标属性词的情感分类结果;
Figure 567851DEST_PATH_IMAGE094
为归一化指数函数,
Figure 250636DEST_PATH_IMAGE072
为目标属 性词对应的目标特征向量;
Figure 749751DEST_PATH_IMAGE081
为目标属性词对应的辅助特征向量;
Figure 679837DEST_PATH_IMAGE095
表示将目 标属性词对应的目标特征向量和目标属性词对应的辅助特征向量拼接后的结果;
Figure 63545DEST_PATH_IMAGE096
表示 可训练参数矩阵;
Figure 459891DEST_PATH_IMAGE097
表示偏置。
在本发明实施例中,通过获取文本内的目标句子;其中,所述目标句子包括目标属性词、所述目标属性词对应的邻接属性词以及所述目标属性词与所述邻接属性词之间的连词,所述邻接属性词为在所述目标句子中与所述目标属性词相邻的前一个属性词;将所述目标句子对应的词向量和所述目标属性词对应的词向量输入预设的特征提取模型,得到与所述目标属性词的语义相关的特征向量和与所述目标属性词的位置相关的特征向量;将与所述目标属性词的语义相关的特征向量和与所述目标属性词的位置相关的特征向量输入预设的特征融合模型,得到所述目标属性词对应的目标特征向量;获取所述邻接属性词对应的情感极性向量和所述连词的类别对应的连词向量;将所述邻接属性词对应的情感极性向量和所述连词的类别对应的连词向量输入预设的辅助特征融合模型,得到所述目标属性词对应的辅助特征向量;根据拼接后的所述目标特征向量和所述辅助特征向量以及预设的情感极性分类函数,得到所述目标属性词的情感分类结果。本申请实施例考虑了目标句子中与目标属性词的语义以及位置相关的特征对情感分类的重要影响,充分地捕捉了目标句子中与目标属性词相关的特征,降低了获取的目标属性词对应的目标特征向量中的噪声,并且,还考虑了目标属性词的邻接属性词的情感极性以及连词对情感分类的影响,将其均作为情感分类的关键性线索,得到目标属性词对应的辅助特征向量,最后利用拼接后的目标特征向量和辅助特征向量获取目标属性词的情感分类结果,提高了情感分类的准确性。
在本申请另一个实施例中,所述情感分类方法还包括迭代更新模型参数的步骤,所述模型为情感分类方法对应的情感分类模型(IARC)。
首先,情感分类设备获取用于训练情感分类模型的训练集,之后基于所述训练集、预设的模型优化算法和预设的损失函数迭代训练所述情感分类模型,更新所述情感分类模型内的训练参数,直至满足训练终止条件,得到训练好的情感分类模型。
在本申请实施例中,预设的模型优化算法为Adam优化算法,预设的损失函数为
Figure 270852DEST_PATH_IMAGE098
正则化的交叉熵函数,其中,预设的损失函数如下:
Figure 697023DEST_PATH_IMAGE099
Figure 353263DEST_PATH_IMAGE100
其中,m表示所有属性词的数量,n是情感分类的类别数量,
Figure 869695DEST_PATH_IMAGE101
表示第i个属性词 的真实情感标签;
Figure 87443DEST_PATH_IMAGE102
表示第i个属性词在第j个情感分类类别下的概率;
Figure 830272DEST_PATH_IMAGE103
表示
Figure 149257DEST_PATH_IMAGE104
正则项 的权重,
Figure 520196DEST_PATH_IMAGE105
表示学习率,
Figure 407380DEST_PATH_IMAGE106
表示情感分类模型中的可训练参数。
在本实施例中,通过训练集对情感分类模型(IARC)进行训练,能够尽可能地优化情感分类模型(IARC)中的可训练参数,提高情感分类的准确性。下面将对本申请实施例提出的情感分类方法进行实验论证,论证过程如下:
一、实验语料
为了有效的评估情感分类模型(IARC)的效果,本发明SenEval-2014 数据集和Multi-Aspect Multi-Sentiment (MAMS) 数据集上进行实验。其中 SenEval-2014 数据集包括Restaurant 和 Laptop。SemEval-2014 数据集中每个领域的数据集都分为训练数据和测试数据。MAMS 数据集同样分为训练集和测试集,而且每个句子至少包含两个具有不同情感的属性词。表格1显示三个数据集中每种情感极性下的训练集和测试集样本个数。
Figure 745827DEST_PATH_IMAGE107
实验参数设定:在所有的实验,本发明都使用300维度的Glove预训练的词向量去 初始化所有的模型。模型中所有的参数矩阵初始化通过采样均匀分布
Figure 245335DEST_PATH_IMAGE108
获得和模 型中偏置都初始化为0。模型中使用的位置向量的维度设定为150,其初始化方式为随机初 始化。模型中三个数据集使用的训练批次大小为32。模型使用的卷积核大小3,4,5。模型用 到的学习率为0.003,
Figure 205200DEST_PATH_IMAGE109
正则化为
Figure 764751DEST_PATH_IMAGE110
。模型优化方法使用Adam优化器。
二、模型对比
为了能够有效的评估模型的效果,本发明模型(IARC)将会和如下基线模型进行对 比。基线模型主要分为两类,建模过程中仅仅利用目前分类属性词信息的single-aspect模 型和在建模过程中利用多个属性词信息的inter-aspect模型。single-aspect模型包括 TextCNN, ATAE-LSTM, GCAE, IAN, MemNet, PBAN和CapsNet;inter-aspect models包括 IARM和SDGCN。
Figure 341226DEST_PATH_IMAGE111
表格2分别显示本发明提出的模型(IARC)与其他基线模型在三个数据集上的表现。本发明提出的模型在三个数据集上都取得具有竞争性的结果,并在Laptop和MAMS数据集上相比最优的模型分别提高了0.78%和1.57%。TextCNN在Restaurant 数据集和MAMS 数据集表现是最差的,这是因为它并没有利用到属性词的信息,将句子中属性词和句子中其他单词视为一致。
同样利用了注意力机制的ATAE-LSTM,MemNet,IAN和PBAN,PBAN在三个数据上的效果都要优于ATAE-LSTM,MemNet和IAN,因为PBAN不仅利用注意力机制而且也融入了位置信息,位置信息有利于获取更多与属性词的语义信息。相比于注意力机制,CapsNet利用胶囊网络捕获属性词和上下文之间的关系,在MAMS数据集上获得更加优秀的表现。GCAE与TextCNN相比,GCAE在Restaurant和MAMS数据集上都有很大优势,说明利用属性词的信息十分重要而且门机制在特征提取中起到一定作用。本发明的模型IARC在上面实验中比GCAE、PBAN和CapsNet都要表现得更好。这是因为本发明在CNN和门机制的基础上不仅引入注意力机制和位置信息,而且融入了邻接属性的情感信息使得模型分类结果准确性得到提高。
在MAMS数据集上大部分基线模型的结果并没有和SemEval-2014两个数据集的结果一样有不错表现。这是由于MAMS数据集中每个句子都包含至少两个属性词且属性词的情感极性是不全相同的。说明仅仅利用注意力机制或者加入位置信息去建模属性词和上下文信息还是不足够的。本发明的模型考虑邻接属性的情感联系,通过融入前一个属性词预测的情感信息和句子中连词信息,捕捉两个属性词之间的情感联系。无论在laptop数据集还是在MAMS数据集上都表现最优。
相比其他Inter-aspect模型,IARM和SDGCN,本发明提出的模型效果更加有竞争力,体现在利用邻接属性词的情感信息比其他模型更加有效,而IARM和SDGCN并没有深入考虑句子中邻接属性词之间的连词信息和情感信息。
三、消融实验
Figure 142960DEST_PATH_IMAGE112
为了更好的了解本发明模型不同模块的效果,本发明设计了消融分析实验。通过移除不同模块获得不同模型变体,分别在三个数据集上得到相应的实验结果,如表格3所示。其中“IARC/inter+conj”表示模型中并没有利用邻接属词情感信息和连词信息;“IARC/conj”表示模型中去除了连词信息。其中GCAE模型的结构和本发明的模型有很强的关联性,因此GCAE模型可以被认为是本发明的基础模型。GCAE模型和“IARC/inter+conj”对比,“IARC/inter+conj”在三个数据集都比GCAE模型的准确率都要高,体现加入注意力机制和位置信息能够学习更多属性词和上下文内容的语义关系,提升模型的实验效果。“IARC/inter+conj”、“IARC/conj”和 IARC 证明捕捉连词信息和上一个属性词的情感信息有利于当前目标属性词的情感预测。而模型IARC 和“IARC/conj”进行对比,能够更加细致证明加入连词信息,能够有效指导属性词的情感预测。
四、single aspect和multiple aspect的影响
Figure 488491DEST_PATH_IMAGE113
Figure 983057DEST_PATH_IMAGE114
为了更加深入的探讨邻接属性词情感和连词信息模块在处理复杂的multi-aspect句子的效果,本发明设计了如下实验。把Restaurant和Laptop测试数据集分别划分成single aspect和multi-aspect两部分样本集,如表格4所示,将训练好的“IARC/inter+conj”模型和本发明模型IARC计算在这四个子数据集的准确率,如表格5所示,其中,n=1:single aspect, n>1:multi-aspect。
根据表格5结果所示,在Restaurant和Laptop数据集上,IARC模型相比于“IARC/inter+conj”的模型变体,关于singleaspect样本集的实验效果都接近,但是在multi-aspect样本集的表现IARC模型具有相对大的优势。而且在两个数据集上,本发明提出的模型在multi-aspect样本集上的效果要比single aspect样本集要好,而“IARC/inter+conj”刚好相反。证明邻接属性词情感和连词信息模块确实能够有效提高模型应对multip-aspect情况。
相对于Laptop数据集,在Restaurant数据集上提升幅度更加高,这可能是由于有两个原因。第一个是相比于Laptop 测试集,Restaurant测试集中multi-aspect的句子数目所占的比例更高;第二原因是在Restaurant测试集中multi-aspect样本集,含有连词的句子占整个multi-aspect样本集比例为77.13%比Laptop测试集的72.82%要高。上述解释了利用邻接属性词情感信息和连词信息的模型在Restaurant数据集中multi-aspect样本集上获得更大提升。
请参见图8,图8为本发明一个示例性实施例提供的情感分类装置的结构示意图。该装置可以通过软件、硬件或两者的结合实现成为情感分类设备的全部或一部分。该装置8包括:
第一获取单元81,用于获取文本内的目标句子;其中,所述目标句子包括目标属性词、所述目标属性词对应的邻接属性词以及所述目标属性词与所述邻接属性词之间的连词,所述邻接属性词为在所述目标句子中与所述目标属性词相邻的前一个属性词;
特征提取单元82,用于将所述目标句子对应的词向量和所述目标属性词对应的词向量输入预设的特征提取模型,得到与所述目标属性词的语义相关的特征向量和与所述目标属性词的位置相关的特征向量;
特征融合单元83,用于将与所述目标属性词的语义相关的特征向量和与所述目标属性词的位置相关的特征向量输入预设的特征融合模型,得到所述目标属性词对应的目标特征向量;
第二获取单元84,用于获取所述邻接属性词对应的情感极性向量和所述连词的类别对应的连词向量;
辅助特征融合单元85,用于将所述邻接属性词对应的情感极性向量和所述连词的类别对应的连词向量输入预设的辅助特征融合模型,得到所述目标属性词对应的辅助特征向量;
分类单元86,用于根据拼接后的所述目标特征向量和所述辅助特征向量以及预设的情感极性分类函数,得到所述目标属性词的情感分类结果。
需要说明的是,上述实施例提供的情感分类装置在执行情感分类方法时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分为不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的情感分类装置与情感分类方法属于同一构思,其体现实现过程详见方法实施例,这里不再赘述。
请参见图9,为本发明一个示例性实施例提供的情感分类设备的结构示意图。如图9所示,该情感分类设备9可以包括:处理器90、存储器90以及存储在该存储器90并可以在该处理器90上运行的计算机程序92,例如:情感分类程序;该处理器90执行该计算机程序92时实现上述各方法实施例中的步骤,例如图1所示的步骤S101至S106。或者,该处理器90执行该计算机程序92时实现上述各装置实施例中各模块/单元的功能,例如图8所示模块81至86的功能。
其中,处理器90可以包括一个或多个处理核心。处理器90利用各种接口和线路连接情感分类设备9内的各个部分,通过运行或执行存储在存储器91内的指令、程序、代码集或指令集,以及调用存储器91内的数据,执行情感分类设备9的各种功能和处理数据,可选的,处理器90可以采用数字信号处理(Digital Signal Processing,DSP)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)、可编程逻辑阵列(Programble Logic Array,PLA)中的至少一个硬件形式来实现。处理器90可集成中央处理器(Central ProcessingUnit,CPU)、图像处理器(Graphics Processing Unit,GPU)和调制解调器等中的一种或几种的组合。其中,CPU主要处理操作系统、用户界面和应用程序等;GPU用于负责触摸显示屏所需要显示的内容的渲染和绘制;调制解调器用于处理无线通信。可以理解的是,上述调制解调器也可以不集成到处理器90中,单独通过一块芯片进行实现。
其中,存储器91可以包括随机存储器(Random Access Memory,RAM),也可以包括只读存储器(Read-Only Memory)。可选的,该存储器91包括非瞬时性计算机可读介质(non-transitory computer-readable storage medium)。存储器91可用于存储指令、程序、代码、代码集或指令集。存储器91可包括存储程序区和存储数据区,其中,存储程序区可存储用于实现操作系统的指令、用于至少一个功能的指令(比如触控指令等)、用于实现上述各个方法实施例的指令等;存储数据区可存储上面各个方法实施例中涉及到的数据等。存储器91可选的还可以是至少一个位于远离前述处理器90的存储装置。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的实施例中,应该理解到,所揭露的装置/终端设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/终端设备实施例仅是示意性的,例如,模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,计算机程序包括计算机程序代码,计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。
本发明并不局限于上述实施方式,如果对本发明的各种改动或变形不脱离本发明的精神和范围,倘若这些改动和变形属于本发明的权利要求和等同技术范围之内,则本发明也意图包含这些改动和变形。

Claims (10)

1.一种情感分类方法,其特征在于,包括步骤:
获取文本内的目标句子;其中,所述目标句子包括目标属性词、所述目标属性词对应的邻接属性词以及所述目标属性词与所述邻接属性词之间的连词,所述邻接属性词为在所述目标句子中与所述目标属性词相邻的前一个属性词;
将所述目标句子对应的词向量和所述目标属性词对应的词向量输入预设的特征提取模型,得到与所述目标属性词的语义相关的特征向量和与所述目标属性词的位置相关的特征向量;
将与所述目标属性词的语义相关的特征向量和与所述目标属性词的位置相关的特征向量输入预设的特征融合模型,得到所述目标属性词对应的目标特征向量;
获取所述邻接属性词对应的情感极性向量和所述连词的类别对应的连词向量;
将所述邻接属性词对应的情感极性向量和所述连词的类别对应的连词向量输入预设的辅助特征融合模型,得到所述目标属性词对应的辅助特征向量;
根据拼接后的所述目标特征向量和所述辅助特征向量以及预设的情感极性分类函数,得到所述目标属性词的情感分类结果。
2.根据权利要求1所述的情感分类方法,其特征在于,所述获取文本内的目标句子之后,包括步骤:
将所述目标句子和所述目标属性词输入预设的词嵌入表示模型,得到所述目标句子对应的词向量和所述目标属性词对应的初始词向量;
对所述目标属性词对应的初始词向量进行卷积操作,得到所述目标属性词对应的词向量。
3.根据权利要求1或2所述的情感分类方法,其特征在于,所述将所述目标句子对应的词向量和所述目标属性词对应的词向量输入预设的特征提取模型,得到与所述目标属性词的语义相关的特征向量和与所述目标属性词的位置相关的特征向量,包括步骤:
将所述目标句子对应的词向量和所述目标属性词对应的词向量输入预设的注意力机制模型,得到第一句子表示;
获取每个单词与所述目标属性词之间的距离所对应的位置向量,根据所述位置向量和所述目标句子对应的词向量,得到第二句子表示;
将所述第一句子表示和所述目标属性词对应的词向量输入至预设的结合门控机制的卷积神经网络模型,得到与所述目标属性词的语义相关的特征向量;
将所述第二句子表示和所述目标属性词对应的词向量输入至预设的结合门控机制的卷积神经网络模型,得到与所述目标属性词的位置相关的特征向量。
4.根据权利要求3所述的情感分类方法,其特征在于,所述将所述目标句子对应的词向量和所述目标属性词对应的词向量输入预设的注意力机制模型,得到第一句子表示,包括步骤:
根据所述目标句子对应的词向量、所述目标属性词对应的词向量以及预设的注意力权重计算公式,得到所述目标句子中每个单词对于所述目标属性词的注意力权重;
根据所述目标句子中每个单词对于所述目标属性词的注意力权重和所述目标句子对应的词向量,得到所述第一句子表示。
5.根据权利要求3所述的情感分类方法,其特征在于,所述获取每个所述单词与所述目标属性词之间的距离所对应的位置向量,根据所述位置向量和所述目标句子对应的词向量,得到第二句子表示,包括步骤:
根据所述目标句子中每个单词与所述目标属性词之间的距离和预设的位置索引值计算公式,获取每个所述单词对应的位置索引值;
获取位置矩阵,根据所述位置矩阵和每个所述单词对应的位置索引值,得到每个所述单词对应的位置向量;
将每个所述单词对应的位置向量与所述目标句子对应的词向量拼接,得到所述第二句子表示。
6.根据权利要求1或2所述的情感分类方法,其特征在于,所述将与所述目标属性词的语义相关的特征向量和与所述目标属性词的位置相关的特征向量输入预设的特征融合模型,得到所述目标属性词对应的目标特征向量,包括步骤:
根据与所述目标属性词的语义相关的特征向量、与所述目标属性词的位置相关的特征向量以及预设的特征融合计算公式,得到融合特征向量;
根据所述融合特征向量、与所述目标属性词的语义相关的特征向量和与所述目标属性词的位置相关的特征向量,得到所述目标属性词对应的目标特征向量。
7.根据权利要求1或2所述的情感分类方法,其特征在于,获取所述邻接属性词对应的情感极性向量和所述连词的类别对应的连词向量,包括步骤:
获取所述邻接属性词的情感分类结果、情感极性矩阵和连词矩阵;
根据所述情感分类结果对应的索引值和所述情感极性矩阵,得到所述邻接属性词对应的情感极性向量;
根据预设的连词与类别之间的对应关系,获取所述连词的类别;
根据所述连词的类别对应的索引值和所述连词矩阵,得到所述连词的类别对应的连词向量。
8.根据权利要求1或2所述的情感分类方法,其特征在于,将所述邻接属性词对应的情感极性向量和所述连词的类别对应的连词向量输入预设的辅助特征融合模型,得到所述目标属性词对应的辅助特征向量,包括步骤:
根据所述邻接属性词对应的情感极性向量、所述连词的类别对应的连词向量和预设的辅助特征融合计算公式,得到所述目标属性词对应的辅助特征向量。
9.一种情感分类装置,其特征在于,包括:
第一获取单元,用于获取文本内的目标句子;其中,所述目标句子包括目标属性词、所述目标属性词对应的邻接属性词以及所述目标属性词与所述邻接属性词之间的连词,所述邻接属性词为在所述目标句子中与所述目标属性词相邻的前一个属性词;
特征提取单元,用于将所述目标句子对应的词向量和所述目标属性词对应的词向量输入预设的特征提取模型,得到与所述目标属性词的语义相关的特征向量和与所述目标属性词的位置相关的特征向量;
特征融合单元,用于将与所述目标属性词的语义相关的特征向量和与所述目标属性词的位置相关的特征向量输入预设的特征融合模型,得到所述目标属性词对应的目标特征向量;
第二获取单元,用于获取所述邻接属性词对应的情感极性向量和所述连词的类别对应的连词向量;
辅助特征融合单元,用于将所述邻接属性词对应的情感极性向量和所述连词的类别对应的连词向量输入预设的辅助特征融合模型,得到所述目标属性词对应的辅助特征向量;
分类单元,用于根据拼接后的所述目标特征向量和所述辅助特征向量以及预设的情感极性分类函数,得到所述目标属性词的情感分类结果。
10.一种情感分类设备,其特征在于,包括:处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至8任一所述方法的步骤。
CN202110301281.4A 2021-03-22 2021-03-22 一种情感分类方法、装置及设备 Active CN112686034B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110301281.4A CN112686034B (zh) 2021-03-22 2021-03-22 一种情感分类方法、装置及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110301281.4A CN112686034B (zh) 2021-03-22 2021-03-22 一种情感分类方法、装置及设备

Publications (2)

Publication Number Publication Date
CN112686034A true CN112686034A (zh) 2021-04-20
CN112686034B CN112686034B (zh) 2021-07-13

Family

ID=75455725

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110301281.4A Active CN112686034B (zh) 2021-03-22 2021-03-22 一种情感分类方法、装置及设备

Country Status (1)

Country Link
CN (1) CN112686034B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7475007B2 (en) * 2004-02-20 2009-01-06 International Business Machines Corporation Expression extraction device, expression extraction method, and recording medium
CN102929860A (zh) * 2012-10-12 2013-02-13 浙江理工大学 一种基于上下文语境的中文分句情感极性判别方法
CN110826336A (zh) * 2019-09-18 2020-02-21 华南师范大学 一种情感分类方法、系统、存储介质及设备
CN111259142A (zh) * 2020-01-14 2020-06-09 华南师范大学 基于注意力编码和图卷积网络的特定目标情感分类方法
CN112199956A (zh) * 2020-11-02 2021-01-08 天津大学 一种基于深度表示学习的实体情感分析方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7475007B2 (en) * 2004-02-20 2009-01-06 International Business Machines Corporation Expression extraction device, expression extraction method, and recording medium
CN102929860A (zh) * 2012-10-12 2013-02-13 浙江理工大学 一种基于上下文语境的中文分句情感极性判别方法
CN110826336A (zh) * 2019-09-18 2020-02-21 华南师范大学 一种情感分类方法、系统、存储介质及设备
CN111259142A (zh) * 2020-01-14 2020-06-09 华南师范大学 基于注意力编码和图卷积网络的特定目标情感分类方法
CN112199956A (zh) * 2020-11-02 2021-01-08 天津大学 一种基于深度表示学习的实体情感分析方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
谢松县: "社交媒体中观点信息分析与应用", 《中国博士学位论文全文数据库 信息科技辑》 *

Also Published As

Publication number Publication date
CN112686034B (zh) 2021-07-13

Similar Documents

Publication Publication Date Title
CN111209384B (zh) 基于人工智能的问答数据处理方法、装置及电子设备
CN105279495B (zh) 一种基于深度学习和文本总结的视频描述方法
CN107943784B (zh) 基于生成对抗网络的关系抽取方法
CN114398961A (zh) 一种基于多模态深度特征融合的视觉问答方法及其模型
US12032906B2 (en) Method, apparatus and device for quality control and storage medium
CN108197109A (zh) 一种基于自然语言处理的多语言分析方法和装置
CN110121705A (zh) 将语用学原理应用于与可视分析交互的系统和方法
WO2023065859A1 (zh) 物品推荐方法、装置及存储介质
CN112801219B (zh) 一种多模态情感分类方法、装置及设备
WO2016205286A1 (en) Automatic entity resolution with rules detection and generation system
CN114676704B (zh) 句子情感分析方法、装置、设备以及存储介质
CN108073851B (zh) 一种抓取手势识别的方法、装置及电子设备
CN111563373B (zh) 聚焦属性相关文本的属性级情感分类方法
CN108960574A (zh) 问答的质量确定方法、装置、服务器和存储介质
CN109992676B (zh) 一种跨媒体资源检索方法及检索系统
WO2021129411A1 (zh) 文本处理方法及装置
CN117076688A (zh) 基于领域知识图谱的知识问答方法及其装置、电子设备
CN112418320A (zh) 一种企业关联关系识别方法、装置及存储介质
CN111198905B (zh) 用于理解二分网络中的缺失链路的视觉分析框架
CN108563637A (zh) 一种融合三元组知识库的句子实体补全方法
CN116306612A (zh) 一种词句生成方法及相关设备
CN112860907B (zh) 一种情感分类方法及设备
CN110069601A (zh) 情绪检测分析方法及相关装置
CN110738261B (zh) 图像分类和模型训练方法、装置、电子设备及存储介质
CN117708297A (zh) 查询语句的生成方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant