发明内容
为克服相关技术中存在的问题,本发明实施例提供了一种基于双通道图神经网络的特定目标情感分类方法、装置及设备。
根据本发明实施例的第一方面,提供一种情感分类方法,包括如下步骤:
获取目标句子对应的表示向量;其中,所述目标句子中包括特定目标,所述特定目标中至少包括一个单词;
将所述目标句子对应的表示向量输入至预设的隐藏状态提取网络,得到所述目标句子对应的隐藏状态向量;
获取所述目标句子对应的邻接矩阵和所述目标句子中单词之间的依存关系对应的依存关系向量;其中,所述邻接矩阵反映所述目标句子中具有预设的相关词性的单词之间的邻接关系;
将所述邻接矩阵、所述依存关系向量和第l-1层的输出结果输入至预设的图注意力神经网络计算公式中,得到第l层的输出结果,重复执行输入操作直至得到输出层的输出结果;其中,第1层的输出结果是将所述邻接矩阵、所述依存关系向量和所述目标句子对应的隐藏状态向量输入至预设的图注意力神经网络计算公式中得到的;
所述预设的图注意力神经网络计算公式如下:
j∈N
i表示第j个单词对应的节点在由预设的相关词性引导的句法依存图中与第i个单词对应的节点之间存在边,r
ij表示目标句子中第i个单词与第i个单词之间的依存关系对应的依存关系向量,d表示目标句子对应的隐藏状态向量的维度,S表示多头注意力的总头数,s表示多头注意力中的第s头,
表示句法特征提取图神经网络中第l层第s头中第j个单词的隐藏层状态,
表示句法特征提取图神经网络中第l层第s头中第i个单词的隐藏层状态,
和
均为权重矩阵,T表示矩阵的转置,
表示句法特征提取图神经网络中第l层第s头中第i个单词的隐藏层状态与第j个单词的隐藏层状态之间的初始关联程度,l≥1且l为整数;
j′∈Ni表示第j′个单词对应的节点在由预设的相关词性引导的句法依存图中与第i个单词对应的节点之间存在边,Ni表示由预设的相关词性引导的句法依存图中所有与第i个单词对应的节点之间存在边的节点的单词序号合集;
表示句法特征提取图神经网络中第l层第s头中第i个单词的隐藏层状态与第j′个单词的隐藏层状态之间的初始关联程度,exp表示以e为底的指数函数,
表示句法特征提取图神经网络中第l层第s头中第i个单词的隐藏层状态与第j′个单词的隐藏层状态之间的关联程度,
表示句法特征提取图神经网络中第l层第s头中第i个单词的隐藏层状态与所有序号属于N
i的单词的隐藏层状态之间的关联程度之和,
表示句法特征提取图神经网络中第l层第s头中第i个单词与第j个单词之间的注意力系数;
和
均为权重矩阵,
表示句法特征提取图神经网络中第l-1层中第j个单词对应的输出结果,
表示句法特征提取图神经网络中第l层中第i个单词对应的输出结果,||表示向量的拼接;
获取与所述特定目标相关的所述初始句法特征表示,对所述特定目标相关的所述初始句法特征表示进行平均池化操作,得到句法特征表示;
将所述目标句子对应的隐藏状态向量输入至预设的语义特征提取图神经网络,得到语义特征表示;
将所述语义特征表示和所述句法特征表示进行拼接,得到所述特定目标对应的特征表示;
根据所述特定目标对应的特征表示和预设的情感分类函数,得到所述特定目标的情感分类结果。
可选的,所述获取目标句子对应的表示向量,包括步骤:
获取所述目标句子中各个单词对应的词向量、所述目标句子中各个单词对应的词性向量以及所述目标句子中各个单词对应的位置向量;
拼接所述目标句子各个单词对应的词向量、所述目标句子中各个单词对应的词性向量以及所述目标句子中各个单词对应的位置向量,得到所述目标句子对应的表示向量。
可选的,将所述目标句子对应的表示向量输入至预设的隐藏状态提取网络,得到所述目标句子对应的隐藏状态向量,包括步骤:
将所述目标句子对应的表示向量输入至预设的双向长短期记忆网络,得到所述目标句子对应的前向隐藏状态向量和后向隐藏状态向量;
将所述前向隐藏状态向量和所述后向隐藏状态向量拼接,得到所述目标句子对应的隐藏状态向量。
可选的,所述获取所述目标句子对应的邻接矩阵,包括步骤:
获取所述目标句子对应的句法依存树;
根据所述目标句子对应的句法依存树和预设的无关词性列表,构建所述目标句子对应的由预设的相关词性引导的句法依存图;其中;所述无关词性列表之外的词性为所述相关词性;
根据所述由预设的相关词性引导的句法依存图,得到所述目标句子对应的邻接矩阵。
可选的,所述获取所述目标句子中单词之间的依存关系对应的依存关系向量,包括步骤:
获取所述目标句子对应的句法依存树;
根据所述目标句子对应的句法依存树提取所述目标句子中单词之间的依存关系;
根据所述目标句子中单词之间的依存关系和预设的各种依存关系对应的依存关系向量,得到所述目标句子中单词之间的依存关系对应的依存关系向量。
可选的,所述将所述目标句子对应的隐藏状态向量输入至预设的语义特征提取图神经网络,得到语义特征表示,包括步骤:
获取所述目标句子对应的句法依存树;
根据所述目标句子对应的句法依存树,获取所述目标句子中单词之间的句法距离;
根据所述目标句子对应的隐藏状态向量、所述目标句子中单词之间的句法距离和预设的句法距离注意力引导算法,得到若干个由句法距离引导的注意力矩阵。
将所述若干个由句法距离引导的注意力矩阵和所述目标句子对应的隐藏状态向量输入至预设的若干个密集连接的图卷积网络,得到若干个初始语义特征表示;
将所述若干个初始语义特征表示进行拼接,将拼接后的初始语义特征表示依次进行线性变换操作和最大池化操作,得到所述语义特征表示。
可选的,所述根据所述目标句子对应的隐藏状态向量、所述目标句子中单词之间的句法距离和预设的句法距离注意力引导算法,得到若干个由句法距离引导的注意力矩阵,包括步骤:
根据所述目标句子对应的隐藏状态向量和预设的多头注意力机制,构造若干个注意力矩阵;
根据所述目标句子中单词之间的句法距离、所述若干个注意力矩阵和预设的句法距离注意力引导公式,得到所述若干个由句法距离引导的注意力矩阵。
可选的,每个所述密集连接的图卷积网络均包括若干个密集连接层,
所述将所述若干个由句法距离引导的注意力矩阵和所述目标句子对应的隐藏状态向量输入至预设的若干个密集连接的图卷积网络,得到若干个初始语义特征表示,包括步骤:
将所述目标句子对应的隐藏状态向量输入至若干个密集连接层,得到所述目标句子中各个单词在各个密集连接的图卷积网络中各个密集连接层的输出;
将每个单词在同一个密集连接的图卷积网络中各个密集连接层的输出拼接,得到所述每个单词对应的若干个拼接表示;
将所述每个单词对应的若干个拼接表示输入至预设的图卷积网络计算公式中,得到所述每个单词对应的若干个初始语义特征表示;
根据所述每个单词对应的若干个初始语义特征表示,得到所述目标句子对应的若干个初始语义特征表示。
可选的,所述根据所述特定目标对应的特征表示和预设的情感分类函数,得到所述特定目标的情感分类结果,包括步骤:
根据所述特定目标对应的特征表示和预设的归一化指数函数,得到所述特定目标的情感分类结果。
在本申请实施例中,通过获取目标句子对应的表示向量;其中,所述目标句子中包括特定目标,所述特定目标中至少包括一个单词;将所述目标句子对应的表示向量输入至预设的隐藏状态提取网络,得到所述目标句子对应的隐藏状态向量;获取所述目标句子对应的邻接矩阵和所述目标句子中单词之间的依存关系对应的依存关系向量;其中,所述邻接矩阵反映所述目标句子中具有预设的相关词性的单词之间的邻接关系;将所述目标句子对应的隐藏状态向量、所述目标句子对应的邻接矩阵和所述目标句子中单词之间的依存关系对应的依存关系向量输入预设的句法特征提取图神经网络,得到所述目标句子对应的初始句法特征表示;获取与所述特定目标相关的所述初始句法特征表示,对所述特定目标相关的所述初始句法特征表示进行平均池化操作,得到句法特征表示;将所述目标句子对应的隐藏状态向量输入至预设的语义特征提取图神经网络,得到语义特征表示;将所述语义特征表示和所述句法特征表示进行拼接,得到所述特定目标对应的特征表示;根据所述特定目标对应的特征表示和预设的情感分类函数,得到所述特定目标的情感分类结果。本申请实施例充分地考虑了单词之间的依存关系和单词之间的邻接关系,基于预设的句法特征提取图神经网络提取出了更为细粒度的目标句子的句法信息,并且,基于预设的语义特征提取图神经网络更好地捕捉了单词之间的语义联系,提高了特定目标情感分类的准确性。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。
为了更好地理解和实施,下面结合附图详细说明本发明。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
在本发明使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本发明可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本发明范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”/“若”可以被解释成为“在……时”或“当……时”或“响应于确定”。
请参阅图1,图1为本发明一个实施例提供的基于双通道图神经网络的特定目标情感分类方法的流程示意图,所述方法由基于双通道图神经网络的特定目标情感分类设备(以下简称情感分类设备)执行,包括如下步骤:
S101:获取目标句子对应的表示向量;其中,所述目标句子中包括特定目标,所述特定目标中至少包括一个单词。
在本申请实施例中,情感分类设备先获取文本中的目标句子。
其中,文本中的目标句子可以为一句话,例如:目标句子为“the price isreasonable while the service is poor”。
目标句子包括特定目标,特定目标中包括至少一个单词,例如:上述句子中的“service”。
之后,情感分类设备获取目标句子对应的表示向量。其中,所述表示向量是指目标句子的一种数字化表示。
目标句子对应的表示向量中包括各个单词对应的表示向量。
在一个可选的实施例中,为更好地对目标句子进行数字化表示,请参阅图2,步骤S101包括步骤S1011~S1012,具体如下:
S1011:获取所述目标句子中各个单词对应的词向量、所述目标句子中各个单词对应的词性向量以及所述目标句子中各个单词对应的位置向量。
(1)情感分类设备获取目标句子中各个单词对应的词向量。
具体地,情感分类设备可以采用现有的词向量工具,获取目标句子中各个单词对应的词向量。例如:GloVe或word2vec等。
在本申请实施例中,目标句子中各个单词对应的词向量表示为
其中,n表示目标句子中单词的数量,e
i c表示目标句子中第i个单词对应的词向量表示。
(2)情感分类设备获取目标句子中各个单词对应的词性向量。
具体地,先统计出文本中的词性的数量,例如:文本中有100种词性,那么就随机初始化100个特定维度的词性向量,并且将其与每种词性进行匹配,该词性向量可以训练过程中是不断地优化调整。
之后,情感分类设备根据目标句子中各个单词对应的词性,查找与该词性对应的词性向量。
在本申请实施例中,目标句子中第i个单词对应的词性向量表示为posi。
(3)情感分类设备获取目标句子中各个单词对应的位置向量。
具体地,先根据各个单词与特定目标的距离,随机初始化若干个位置向量,并且将其与不同的距离进行匹配,该位置向量可以训练过程中是不断地优化调整。
之后,情感分类设备根据目标句子中各个单词与特定目标的距离,查找与该距离对应的位置向量。
在本申请实施例中,目标句子中第i个单词对应的位置向量表示为pi。
S1012:拼接所述目标句子各个单词对应的词向量、所述目标句子中各个单词对应的词性向量以及所述目标句子中各个单词对应的位置向量,得到所述目标句子对应的表示向量。
情感分类设备拼接所述目标句子各个单词对应的词向量、所述目标句子中各个单词对应的词性向量以及所述目标句子中各个单词对应的位置向量,得到所述目标句子对应的表示向量。
N表示目标句子中单词的数量,目标句子中第i个单词对应的表示向量为
“;”表示拼接。
S102:将所述目标句子对应的表示向量输入至预设的隐藏状态提取网络,得到所述目标句子对应的隐藏状态向量。
在本申请实施例中,该隐藏状态提取网络预先设置在情感分类设备中,用于提取目标对子对应的隐藏状态向量。
该预设的隐藏状态提取网络为一种深度学习网络,更具体来说其是一种循环神经网络。
所述循环神经网络(Recurrent Neural Network,RNN)是一类以序列数据为输入,在序列的演进方向进行递归且所有节点(循环单元)按链式连接的递归神经网络,常见的循环神经网络包括双向循环神经网络(Bidirectional RNN,Bi-RNN)、长短期记忆网络(LongShort-Term Memory networks,LSTM)、双向长短期记忆网络(Bidirectional Long Short-Term Memory networks,Bi-LSTM)以及双向门控循环单元网络(Bidirectional GatedRecurrent Unit,Bi-GRU)等。
情感分类设备将所述目标句子对应的表示向量输入至预设的隐藏状态提取网络,得到所述目标句子对应的隐藏状态向量。
具体地,在一个可选的实施例中,该隐藏状态提取网络是一种双向循环神经网络,请参阅图3,步骤S102包括步骤S1021~S1022,如下所示:
S1021:将所述目标句子对应的表示向量输入至预设的双向长短期记忆网络,得到所述目标句子对应的前向隐藏状态向量和后向隐藏状态向量。
情感分类设备将所述目标句子对应的表示向量输入至预设的双向长短期记忆网络,得到所述目标句子对应的前向隐藏状态向量和后向隐藏状态向量。
其中,预设的双向长短期记忆网络内的运算公式如下:
其中,
表示双向长短期记忆网络中的前向运算,
表示双向长短期记忆网络中的反向运算;
表示目标句子中第i个单词对应的表示向量,i∈[l,n,n表示目标句子中单词的数量;
表示目标句子中第i个单词对应的前向隐藏状态向量,
表示目标句子中第i个单词对应的后向隐藏状态向量。
S1022:将所述前向隐藏状态向量和所述后向隐藏状态向量拼接,得到所述目标句子对应的隐藏状态向量。
情感分类设备将所述前向隐藏状态向量和所述后向隐藏状态向量拼接,得到所述目标句子对应的隐藏状态向量。
其中,目标句子对应的隐藏状态向量表示为H
c,
“;”表示拼接。
S103:获取所述目标句子对应的邻接矩阵和所述目标句子中单词之间的依存关系对应的依存关系向量;其中,所述邻接矩阵反映所述目标句子中具有预设的相关词性的单词之间的邻接关系。
情感分类设备分别获取目标句子对应的邻接矩阵以及目标句子中单词之间的依存关系对应的依存关系向量。
其中,所述邻接矩阵反映所述目标句子中具有预设的相关词性的单词之间的邻接关系。
所述预设的相关词性是指无关词性列表此外的词性,具体地,该无关词性列表是通过大量穷举词性实验得到的。例如:在一次实验中,若将介词添加至无关词性列表后,实验结果更为优化,那么就把介词词性添加至无关词性列表中。
下面将仔细说明如何获取目标句子对应的邻接矩阵:
首先,情感分类设备先获取所述目标句子对应的句法依存树。
具体地,情感分类设备可以采用现有的句法依存树生成器,获取目标句子对应的句法依存树,例如:Spacy等,在此不进行详细限定。
在该句法依存树中包括目标句子中各个单词对应的词性以及单词之间的依存关系。
之后,情感分类设备根据所述目标句子对应的句法依存树和预设的无关词性列表,构建所述目标句子对应的由预设的相关词性引导的句法依存图;其中;所述无关词性列表之外的词性为所述相关词性。
在构建目标句子对应的预设的相关词性引导的句法依存图中过程中,情感分类设备首先判断目标句子中的单词对应的词性是否在预设的无关词性列表中。若目标句子中某一个单词对应的词性在预设的无关词性列表中,那么即使该单词对应的节点与其他单词对应的节点在句法依存树中存在依存关系,也不会在由相关词性引导的句法依存图中构建该单词对应的节点与其他单词对应的节点之间的边,这样有利于后续获取到更有用的句法信息,并减少无关词性的单词对后续情感分类的准确性的影响。
最后,情感分类设备根据所述由预设的相关词性引导的句法依存图,得到所述目标句子对应的邻接矩阵。
目标句子对应的邻接矩阵用于存储预设的相关词性引导的句法依存图中的所有信息,该目标句子对应的邻接矩阵是一个n行n列的矩阵,邻接矩阵的n行分别对应目标句子中的n个单词,同样的,邻接矩阵n列分别对应目标句子中的n个单词,邻接矩阵中第i行第j列的值,用于表示目标句子中第i个单词与第j个单词之间的邻接关系,若在由预设的相关词性引导的句法依存图第i个单词对应的节点与第j个单词对应的节点之间存在边,那么邻接矩阵中第i行第j列的值就为一个预设值,并且,邻接矩阵中第j行第i列的值也为该预设值。其中,该预设值在一个可选的实施例中为1。
目标句子对应的邻接矩阵中默认目标句子中第i个单词与自身存在邻接关系,因此,邻接矩阵中第i行第i列的值也为该预设值。
下面将仔细说明如何获取目标句子中单词之间的依存关系对应的依存关系向量:
首先,情感分类设备获取所述目标句子对应的句法依存树。
具体地,情感分类设备可以采用现有的句法依存树生成器,获取目标句子对应的句法依存树,例如:Spacy等,在此不进行详细限定。
之后,情感分类设备根据所述目标句子对应的句法依存树提取所述目标句子中单词之间的依存关系。在句法依存树中就包括目标句子中每个单词对应的词性以及单词之间的依存关系,情感分类设备直接从句法依存树中提取即可。
最后,情感分类设备根据所述目标句子中单词之间的依存关系和预设的各种依存关系对应的依存关系向量,得到所述目标句子中单词之间的依存关系对应的依存关系向量。
在情感分类设备中预先存储了多种依存关系以及多种依存关系对应的依存关系向量,单词之间的依存关系,那么依存关系对应的依存关系向量就相同。
S104:将所述目标句子对应的隐藏状态向量、所述目标句子对应的邻接矩阵和所述目标句子中单词之间的依存关系对应的依存关系向量输入预设的句法特征提取图神经网络,得到所述目标句子对应的初始句法特征表示。
在本申请实施例中,该句法特征提取图神经网络预先设置在情感分类设备中,用于进行句法特征的提取。
具体地,情感分类设备在获取到目标句子对应的隐藏状态向量、所述目标句子对应的邻接矩阵和所述目标句子中单词之间的依存关系对应的依存关系向量之后,将目标句子对应的隐藏状态向量、所述目标句子对应的邻接矩阵和所述目标句子中单词之间的依存关系对应的依存关系向量输入预设的句法特征提取图神经网络,得到所述目标句子对应的初始句法特征表示。
在一个可选的实施例中,情感分类设备将所述邻接矩阵、所述依存关系向量和第l-1层的输出结果输入至预设的图注意力神经网络计算公式中,得到第l层的输出结果,重复执行输入操作直至得到输出层的输出结果;其中,第1层的输出结果是将所述邻接矩阵、所述依存关系向量和所述目标句子对应的隐藏状态向量输入至预设的图注意力神经网络计算公式中得到的。
该预设的图注意力神经网络计算公式如下:
其中,r
ij表示目标句子中第i个单词与第j个单词之间的依存关系对应的依存关系向量,d表示输入向量的维度,也即目标句子对应的隐藏状态向量的维度,S表示多头注意力的总头数,s表示多头注意力中的第s头,
表示句法特征提取图神经网络中第l层第s头中第j个单词的隐藏层状态,
表示句法特征提取图神经网络中第l层第s头中第i个单词的隐藏层状态,
和
均为权重矩阵,T表示矩阵的转置,
表示句法特征提取图神经网络中第l层第s头中第i个单词的隐藏层状态与第j个单词的隐藏层状态之间的初始关联程度,l≥1且l为整数。
j′∈N(i)表示第j′个单词对应的节点在由预设的相关词性引导的句法依存图与第i个单词对应的节点之间存在边,Ni表示由预设的相关词性引导的句法依存图中所有与第i个单词对应的节点之间存在边的节点的单词序号合集,可以理解的是,预设的相关词性引导的句法依存图第i个单词对应的节点与第j′个单词对应的节点之间存在边,那么目标句子对应的邻接矩阵中第i行第j′列的值就为预设值,而不是空值,因此,基于目标句子对应的邻接矩阵,就能够判断j′是否属于Ni;
表示句法特征提取图神经网络中第l层第s头中第i个单词的隐藏层状态与第j′个单词的隐藏层状态之间的初始关联程度,exp表示以e为底的指数函数,
表示句法特征提取图神经网络中第l层第s头中第i个单词的隐藏层状态与第j′个单词的隐藏层状态之间的关联程度,
表示句法特征提取图神经网络中第l层第s头中第i个单词的隐藏层状态与所有序号属于N(i)的单词的隐藏层状态之间的关联程度之和,
表示句法特征提取图神经网络中第l层第s头中第i个单词与第j个单词之间的注意力系数;
和
均为权重矩阵,
表示句法特征提取图神经网络中第l-1层中第j个单词对应的输出结果,||表示向量的拼接。
情感分类设备获取句法特征提取图神经网络的输出层的输出结果,根据所述输出层的输出结果,得到目标句子对应的初始句法特征表示HL。
通过预设的句法特征提取图神经网络能够充分利用目标句子对应的句法依存树所展示出的信息,使得到的句法信息更为准确,进而有利于提高最终情感分类的准确性。
S105:获取与所述特定目标相关的所述初始句法特征表示,对所述特定目标相关的所述初始句法特征表示进行平均池化操作,得到句法特征表示。
情感分类设备先获取与所述特定目标相关的所述初始句法特征表示。
具体地,情感分类设备根据特定目标在目标句子中的位置,获取与所述特定目标相关的所述初始句法特征表示。
其中,目标句子对应的初始句法特征表示为H
L,
n表示目标句子中单词的个数,那么与所述特定目标相关的初始句法特征表示为
τ+1和τ+m分别表示特定目标在目标句子中的起始位置和终止位置,m表示特定目标中单词的个数。
之后,情感分类设备对所述特定目标相关的所述初始句法特征表示进行平均池化操作,得到句法特征表示。
其中,
ρ
avg表示平均池化操作,h
ap表示句法特征表示,L表示句法特征提取图神经网络中的隐藏层层数。
S106:将所述目标句子对应的隐藏状态向量输入至预设的语义特征提取图神经网络,得到语义特征表示。
在本申请实施例中,该语义特征提取图神经网络预先设置在情感分类设备中,用于提取目标句子对应的语义特征表示。
具体地,情感分类设备获取目标句子对应的隐藏状态向量,之后将其输入至预设的语义特征提取图神经网络,得到目标句子对应的语义特征表示。
在一个可选的实施例中,为了获取到更有效地语义特征表示,请参阅图4,步骤S106包括步骤S1061~S1065,具体如下:
S1061:获取所述目标句子对应的句法依存树。
获取目标句子对应的句法依存树与步骤S103中阐述的过程相同,在此不进行赘述。
S1062:根据所述目标句子对应的句法依存树,获取所述目标句子中单词之间的句法距离。
目标句子对应的句法依存树中包括单词之间的句法距离,因此,情感分类设备可以根据目标句子对应的句法依存树,获取目标句子中单词之间的句法距离。
S1063:根据所述目标句子对应的隐藏状态向量、所述目标句子中单词之间的句法距离和预设的句法距离注意力引导算法,得到若干个由句法距离引导的注意力矩阵。
在本申请实施例中,该句法距离注意力引导算法预先设置在情感分类设备中,情感分类设备在获取到目标句子对应的隐藏状态向量和目标句子中单词之间的句法距离之后,调用预设的句法距离注意力引导算法,获取若干个由句法距离引导的注意力矩阵。
具体地,情感分类设备先根据所述目标句子对应的隐藏状态向量和预设的多头注意力机制,构造若干个注意力矩阵。
其中,预设的多头注意力机制对应的公式如下:
其中,Q和K都是目标句子对应的隐藏状态向量,也即H
c;d表示目标句子对应的隐藏状态向量的维度,W
i Q和W
i K表示权重矩阵,T表示转置,softmax表示归一化指数函数,
表示第t个注意力矩阵。
之后,情感分类设备根据所述目标句子中单词之间的句法距离、所述若干个注意力矩阵和预设的句法距离注意力引导公式,得到所述若干个由句法距离引导的注意力矩阵。
其中,预设的句法距离注意力引导公式如下:
表示第t个由句法距离引导的注意力矩阵,
表示第t个注意力矩阵,
表示第t个注意力矩阵第i行第j列的值,
表示目标句子中第i个单词与第j个单词之间的句法距离,δ是一个超参数,用于控制引入句法距离的信息量。
S1064:将所述若干个由句法距离引导的注意力矩阵和所述目标句子对应的隐藏状态向量输入至预设的若干个密集连接的图卷积网络,得到若干个初始语义特征表示。
在本申请实施例中,若干个密集连接的图卷积网络预先设置在情感分类设备中,其能够用于初步地提取语义特征表示。
具体地,情感分类设备在获取到若干个由句法距离引导的注意力矩阵和所述目标句子对应的隐藏状态向量之后,将其输入至预设的若干个密集连接的图卷积网络,得到若干个初始语义特征表示。
在一个可选的实施例中,每个所述密集连接的图卷积网络均包括若干个密集连接层。
在获取若干个初始语义特征表示的过程中,情感分类设备先将所述目标句子对应的隐藏状态向量输入至若干个密集连接层,得到所述目标句子中各个单词在各个密集连接的图卷积网络中各个密集连接层的输出。
之后,情感分类设备将每个单词在同一个密集连接的图卷积网络中各个密集连接层的输出拼接,得到所述每个单词对应的若干个拼接表示。
其中,
表示第j个单词对应的一个拼接表示,
表示目标句子中第j个单词对应的隐藏状态向量,
表示第j个单词在其中一个密集连接的图卷积网络中的第1个密集连接层的输出,相应地,
表示第j个单词在其中一个密集连接的图卷积网络中的第z-1个密集连接层的输出,“;”表示拼接。
再后,情感分类设备将所述每个单词对应的若干个拼接表示输入至预设的图卷积网络计算公式中,得到所述每个单词对应的若干个初始语义特征表示。
其中,预设的图卷积网络计算公式如下:
W
t z为参数矩阵,
为偏置项,σ为激活函数,
表示第t个由句法距离引导的注意力矩阵,
表示第t个由句法距离引导的注意力矩阵中第i行第j列的值,也即由句法距离引导的第i个单词相对于第j个单词的注意力值,
表示第i个单词在第t个有z个密集连接层的图卷积网络的输出,也即第i个单词对应的第t个初始语义特征表示。
最后,情感分类设备根据所述每个单词对应的若干个初始语义特征表示,得到所述目标句子对应的若干个初始语义特征表示。
在本申请实施例中,若共有M个密集连接的图卷积网络,则目标句子对应的若干个初始语义特征表示也共有M个。其中,目标句子对应的第1个初始语义特征表示为h1,那么目标句子对应的第M个初始语义特征表示hM。
S1065:将所述若干个初始语义特征表示进行拼接,将拼接后的初始语义特征表示依次进行线性变换操作和最大池化操作,得到所述语义特征表示。
情感分类设备先将若干个初始语义特征表示进行拼接,得到拼接后的初始语义特征表示。其中,hdsgcn表示拼接后的初始语义特征表示,hdsgcn=[h1;...;hM],h1是目标句子对应的第1个初始语义特征表示,hM目标句子对应的第M个初始语义特征表示,“;”标表示向量拼接。
之后,情感分类设备将拼接后的初始语义特征表示依次进行线性变换操作和最大池化操作,得到语义特征表示。
其中,线性变换操作和最大池化操作对应的公式为:
hout=Wauthdsgcn+bout
hcm=ρmax(hout)
Wout是参数矩阵,bout是偏置项,hout:是线性变换操作后的结果,ρmax是最大池化函数,hxm是语义特征表示。
在本实施例中,充分考虑了目标句子中单词之间的句法距离对语义信息提取的影响,并且基于若干个密集连接的图卷积网络,能够充分地捕捉目标句子的语义信息,得到更为准确的语义特征表示,从而进一步地提高了情感分类的准确性。
S107:将所述语义特征表示和所述句法特征表示进行拼接,得到所述特定目标对应的特征表示。
情感分类设备将义特征表示和所述句法特征表示进行拼接,得到所述特定目标对应的特征表示。
其中,特定目标对应的特征表示用符号hsc表示,hsc=[hap;hcm],hcm是语义特征表示,hap是句法特征表示,“;”表示拼接。
S108:根据所述特定目标对应的特征表示和预设的情感分类函数,得到所述特定目标的情感分类结果。
在本申请实施例中,情感分类函数预先设置在情感分类设备中,情感分类设备在获取到特定目标对应的特征表示之后,调用预设的情感分类函数,获取特定目标的情感分类结果。
具体地,情感分类设备根据所述特定目标对应的特征表示和预设的归一化指数函数,得到所述特定目标的情感分类结果。
特定目标的情感分类结果表示为p(a),p(a)可以理解特定目标的情感分类结果为a类的概率,p(a)=softmax(Wphsc+bp),softmax表示归一化指数,Wp是指可学习的权重,bp表示偏置项,hsc表示特定目标对应的特征表示。
在一个可选的实施例中,情感分类的类别可以有多种,例如消极、中性以及积极等。
在本申请实施例中,通过获取目标句子对应的表示向量;其中,所述目标句子中包括特定目标,所述特定目标中至少包括一个单词;将所述目标句子对应的表示向量输入至预设的隐藏状态提取网络,得到所述目标句子对应的隐藏状态向量;获取所述目标句子对应的邻接矩阵和所述目标句子中单词之间的依存关系对应的依存关系向量;其中,所述邻接矩阵反映所述目标句子中具有预设的相关词性的单词之间的邻接关系;将所述目标句子对应的隐藏状态向量、所述目标句子对应的邻接矩阵和所述目标句子中单词之间的依存关系对应的依存关系向量输入预设的句法特征提取图神经网络,得到所述目标句子对应的初始句法特征表示;获取与所述特定目标相关的所述初始句法特征表示,对所述特定目标相关的所述初始句法特征表示进行平均池化操作,得到句法特征表示;将所述目标句子对应的隐藏状态向量输入至预设的语义特征提取图神经网络,得到语义特征表示;将所述语义特征表示和所述句法特征表示进行拼接,得到所述特定目标对应的特征表示;根据所述特定目标对应的特征表示和预设的情感分类函数,得到所述特定目标的情感分类结果。本申请实施例充分地考虑了单词之间的依存关系和单词之间的邻接关系,基于预设的句法特征提取图神经网络提取出了更为细粒度的目标句子的句法信息,并且,基于预设的语义特征提取图神经网络更好地捕捉了单词之间的语义联系,提高了特定目标情感分类的准确性。
在一个可选的实施例中,情感分类设备在基于本申请实施例提出的基于双通道图神经网络的特定目标情感分类方法对特定进行情感分类之前,需要使用训练数据对基于双通道图神经网络的特定目标情感分类方法相对应的模型(DGNN)进行整体训练。
具体地,本申请实施例采用Adam优化算法和L2正则化的交叉熵损失函数进行基于双通道图神经网络的特定目标情感分类模型(DGNN)的参数训练。该参数包括所有可训练参数。
关于Adam算法以及L2正则化的交叉熵损失函数在此不进行赘述,为现有的参数优化算法和损失函数。
在其他可选的实施例中,也可以采用其他优化算法和损失函数进行模型的训练,在此不进行限定。
本发明并不局限于上述实施方式,如果对本发明的各种改动或变形不脱离本发明的精神和范围,倘若这些改动和变形属于本发明的权利要求和等同技术范围之内,则本发明也意图包含这些改动和和变形。