CN115587597B

CN115587597B - 基于子句级关系图的方面词的情感分析方法以及装置

Info

Publication number: CN115587597B
Application number: CN202211471094.1A
Authority: CN
Inventors: 邱植勋; 薛云; 马志豪; 黄震华
Original assignee: South China Normal University
Current assignee: South China Normal University
Priority date: 2022-11-23
Filing date: 2022-11-23
Publication date: 2023-03-24
Anticipated expiration: 2042-11-23
Also published as: CN115587597A

Abstract

本发明涉及情感分析领域，特别涉及一种基于子句级关系图的方面词的情感分析方法、装置、设备以及存储介质，通过构建子句级关系图，并用图卷积网络以及关系图注意网络，分别提取待测语句中多个方面词的特征信息，利用获得的特征信息，更加全面地对多个方面词的情感极性的进行分析，提升了情感分析的准确性以及效率。

Description

基于子句级关系图的方面词的情感分析方法以及装置

技术领域

本发明涉及情感分析领域，特别涉及一种基于子句级关系图的方面词的情感分析方法、装置、设备以及存储介质。

背景技术

在自然语言处理领域，情感分析是一个活跃的研究领域，其旨在显示情感和自动发现文本中表达的情感。基本上情感分析被认为是识别对某一时间表达的积极、消极或中性情绪的意见极性。特定目标情感分析是情感分析的一个子领域，指的是预测给定文本中特定方面词的情感极性，目前的主流方法主要是采用基于句法的图神经网络从句法依赖树中提取句法信息，通过句法树缩短方面词和意见词的距离，缓解了远距离依赖问题。

语句往往包含多个方面词，其可能对用于分析的目标方面词带来额外的信息，然而，上述方法都是针对单个方面建模，忽略语句中存在多个方面词的情况，无法建模多个方面词的相互依赖关系，从而难以对方面词进行全面的情感分析，降低了情感分析的准确性。

发明内容

基于此，本发明提供一种基于子句级关系图的方面词的情感分析方法、装置、设备以及存储介质，通过构建子句级关系图，并用图卷积网络以及关系图注意网络，分别提取待测语句中多个方面词的特征信息，利用获得的特征信息，更加全面地对多个方面词的情感极性的进行分析，提升了情感分析的准确性以及效率。该技术方法如下：

第一方面，本申请实施例提供了一种基于子句级关系图的方面词的情感分析方法，包括以下步骤：

获取待测语句以及预设的情感分析模型，其中，所述待测语句包括若干个单词，所述单词包括上下文单词以及由若干个单词组合的若干个方面词，所述情感分析模型包括句子编码网络、图卷积网络、关系图注意网络以及全连接网络；

将所述待测语句输入至所述句子编码网络，获得所述待测语句的句子特征表示；

构建所述待测语句的依存句法图，根据所述依存句法图，获得所述待测语句的第一邻接矩阵；

将所述待测语句的句子特征表示以及第一邻接矩阵输入至所述图卷积网络中进行卷积处理，获得所述待测语句的第一特征表示，其中，所述第一特征表示包括所述若干个方面词的第一特征向量；

构建所述待测语句的子句级关系图，根据所述子句级关系图以及所述句子特征表示，构建所述待测语句的第二邻接矩阵，其中，所述第二邻接矩阵包括所述若干个方面词彼此的连接关系对应的特征向量；

根据所述第一特征表示，获取所述若干个方面词的第一特征向量，将所述若干个方面词的第一特征向量以及第二邻接矩阵输入至所述关系图注意网络中进行卷积处理，获得所述若干个方面词的第二特征向量；

将所述若干个方面词的第一特征向量以及第二特征向量输入至所述全连接网络进行拼接处理，获取所述若干个方面词的拼接特征向量，对所述若干个方面词的拼接特征向量进行情感分析，获得所述若干个方面词的情感分析结果。

第二方面，本申请实施例提供了一种基于子句级关系图的方面词的情感分析装置，包括：

获取模块，用于获取待测语句以及预设的情感分析模型，其中，所述待测语句包括若干个单词，所述单词包括上下文单词以及由若干个单词组合的方面词，所述情感分析模型包括句子编码网络、图卷积网络、关系图注意网络以及全连接网络；

句子编码模块，用于将所述待测语句输入至所述句子编码网络，获得所述待测语句的句子特征表示；

第一邻接矩阵计算模块，用于构建所述待测语句的依存句法图，根据所述依存句法图，获得所述待测语句的第一邻接矩阵；

第一特征计算模块，用于将所述待测语句的句子特征表示以及第一邻接矩阵输入至所述图卷积网络中进行卷积处理，获得所述待测语句的第一特征表示，其中，所述第一特征表示包括所述若干个方面词的第一特征向量；

第二邻接矩阵计算模块，用于构建所述待测语句的子句级关系图，根据所述子句级关系图以及所述句子特征表示，构建所述待测语句的第二邻接矩阵，其中，所述第二邻接矩阵包括所述若干个方面词彼此的连接关系对应的特征向量；

第二特征计算模块，用于根据所述第一特征表示，获取所述若干个方面词的第一特征向量，将所述若干个方面词的第一特征向量以及第二邻接矩阵输入至所述关系图注意网络中进行卷积处理，获得所述若干个方面词的第二特征向量；

情感分析模块，用于将所述若干个方面词的第一特征向量以及第二特征向量输入至所述全连接网络进行拼接处理，获取所述若干个方面词的拼接特征向量，对所述若干个方面词的拼接特征向量进行情感分析，获得所述若干个方面词的情感分析结果。

第三方面，本申请实施例提供了一种计算机设备，包括：处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序；所述计算机程序被所述处理器执行时实现如第一方面所述的基于子句级关系图的方面词的情感分析方法的步骤。

第四方面，本申请实施例提供了一种存储介质，所述存储介质存储有计算机程序，所述计算机程序被处理器执行时实现如第一方面所述的基于子句级关系图的方面词的情感分析方法的步骤。

在本实施例中，提供一种基于子句级关系图的方面词的情感分析方法、装置、设备以及存储介质，通过构建子句级关系图，并用图卷积网络以及关系图注意网络，分别提取待测语句中多个方面词的特征信息，利用获得的特征信息，更加全面地对多个方面词的情感极性的进行分析，提升了情感分析的准确性以及效率。

为了更好地理解和实施，下面结合附图详细说明本发明。

附图说明

图1为本申请第一实施例提供的基于子句级关系图的方面词的情感分析方法的流程示意图；

图2为本申请一个实施例提供的基于子句级关系图的方面词的情感分析方法中S4的流程示意图；

图3为本申请一个实施例提供的基于子句级关系图的方面词的情感分析方法中S5的流程示意图；

图4为本申请一个实施例提供的基于子句级关系图的方面词的情感分析方法中S6的流程示意图；

图5为本申请一个实施例提供的基于子句级关系图的方面词的情感分析方法中S7的流程示意图；

图6为本申请另一个实施例提供的基于子句级关系图的方面词的情感分析方法的流程示意图；

图7为本申请一个实施例提供的基于子句级关系图的方面词的情感分析装置的结构示意图；

图8为本申请一个实施例提供的计算机设备的结构示意图。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。

在本申请使用的术语是仅仅出于描述特定实施例的目的，而非旨在限制本申请。在本申请和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式，除非上下文清楚地表示其他含义。还应当理解，本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。

应当理解，尽管在本申请可能采用术语第一、第二、第三等来描述各种信息，但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如，在不脱离本申请范围的情况下，第一信息也可以被称为第二信息，类似地，第二信息也可以被称为第一信息。取决于语境，如在此所使用的词语“如果”/“若”可以被解释成为“在……时”或“当……时”或“响应于确定”。

请参阅图1，图1为本申请第一实施例提供的基于子句级关系图的方面词的情感分析方法的流程示意图，包括如下步骤：

S1：获取待测语句以及预设的情感分析模型。

本申请的基于子句级关系图的方面词的情感分析方法的执行主体为基于子句级关系图的方面词的情感分析方法的分析设备（以下简称分析设备）。

在一个可选的实施例中，分析设备可以是一台计算机设备，可以是服务器，或多台计算机设备联合而成的服务器机群。

在本实施例中，分析设备可以获取用户输入的待测语句，其中，所述待测语句包括若干个单词，所述单词包括上下文单词以及由若干个单词组合的若干个方面词，所述方面词为待测语句中所描述的某一实体，包括若干个方面，所述方面为单词，具体如下：

式中，W为所述待测语句的句子表示，

为第n个单词对应的词表示，n为所述单词的数目，

为第m个方面词对应的词表示，其中，

式中，

为所述第m个方面词中第

个方面，

为所述第m个方面词中方面的在所述待测语句中的起始位置，

为所述第m个方面词中方面的在所述待测语句中的终止位置，

为所述方面词数目。

分析设备获取预设的情感分析模型，其中，所述情感分析模型包括句子编码网络、图卷积网络、关系图注意网络以及全连接网络。

S2：将所述待测语句输入至所述句子编码网络，获得所述待测语句的句子特征表示。

在本实施例中，分析设备将所述待测语句分别输入至所述句子编码网络，获得所述待测语句的句子特征表示。

具体地，所述句子编码网络包括词嵌入模块以及双向门控模块，其中，所述词嵌入模块可以采用为BERT（Bidirectional Encoder Representation from Transformers）词嵌入模型，或者Word2vec词嵌入模型，所述双向门控模块可以采用BiGURE模型。分析设备将所述待测语句分别输入至所述词嵌入模型中，获得所述待测语句的若干个单词的词嵌入向量，并将所述待测语句的若干个单词的词嵌入向量输入至所述双向门控模型，将所述词嵌入向量转换为隐藏层向量，获得所述待测语句的若干个单词的隐藏层向量，并进行编码处理，获得待测语句的句子特征表示。

S3：构建所述待测语句的依存句法图，根据所述依存句法图，获得所述待测语句的第一邻接矩阵。

在本实施例中，分析设备获取初始依存句法树，所述初始依存句法树包括若干个节点，将所述待测语句的若干个单词分别设置于所述初始依存句法树的节点上，构建所述待测语句的依存句法图，获取所述待测语句的依存关系信息，所述依存关系信息用于指示所述待测语句中单词与单词之间的连接关系，根据所述待测语句的依存关系信息，将所述待测语句的初依存句法图转化为句法邻接矩阵，作为所述待测语句的第一邻接矩阵，其中，所述第一邻接矩阵包括若干个单词之间的依存关系向量。

S4：将所述待测语句的句子特征表示以及第一邻接矩阵输入至所述图卷积网络中进行卷积处理，获得所述待测语句的第一特征表示，其中，所述第一特征表示包括所述若干个方面词的第一特征向量。

在本实施例中，分析设备将所述待测语句的句子特征表示以及第一邻接矩阵输入至所述图卷积网络中进行卷积处理，获得所述待测语句的第一特征表示，其中，所述第一特征表示包括所述若干个方面词的第一特征向量。

请参阅图2，图2为本申请一个实施例提供的基于子句级关系图的方面词的情感分析方法中S4的流程示意图，包括步骤S41~S42，具体如下：

S41：将所述待测语句的句子特征表示中若干个单词的隐藏层向量作为所述图卷积网络的首层的输入信息，根据所述待测语句的第一邻接矩阵中若干个单词之间的依存关系向量以及预设的第一特征计算算法，获得所述图卷积网络的最后一层的若干个单词的初始第一特征向量。

所述第一特征计算算法为：

式中，i和j为所述单词的索引，

为所述图卷积网络的第l层的第i个单词的初始第一特征向量，

为所述图卷积网络的第l层的第j个单词的初始第一特征向量，

为非线性激活函数，

为所述第一邻接矩阵中第i个单词与第j个单词之间的依存关系向量，

为第一可训练权重参数矩阵，

为第一偏差参数，n是所述待测语句的单词数目。

在本实施例中，分析设备将所述待测语句的句子特征表示中若干个单词的隐藏层向量作为所述图卷积网络的首层的输入信息，根据所述待测语句的第一邻接矩阵中若干个单词之间的依存关系向量以及预设的第一特征计算算法，获得所述图卷积网络的最后一层的若干个单词的初始第一特征向量。

S42：根据所述待测语句的若干个单词的初始第一特征向量以及预设的加权算法，对所述若干个单词的初始第一特征向量进行加权处理，获得加权处理后的所述若干个单词的初始第一特征向量，并进行编码处理，获得加权处理后的所述待测语句的第一特征表示，并对所述加权处理后的待测语句的第一特征表示进行平均池化处理，获得平均池化处理后的第一特征表示，作为所述待测语句的第一特征表示。

所述加权算法为：

式中，τ为所述方面词的开始位置，m为所述方面词的数目，

为第i个单词的位置权重参数，

为所述加权处理后的所述第i个单词对应的第一特征向量。

在本实施例中，分析设备根据所述待测语句的若干个单词的初始第一特征向量以及预设的加权算法，对所述若干个单词的初始第一特征向量进行加权处理，获得加权处理后的所述若干个单词的初始第一特征向量，并进行编码处理，获得加权处理后的所述待测语句的第一特征表示，并对所述加权处理后的待测语句的第一特征表示进行平均池化处理，获得平均池化处理后的第一特征表示，作为所述待测语句的第一特征表示。

S5：构建所述待测语句的子句级关系图，根据所述子句级关系图以及所述句子特征表示，构建所述待测语句的第二邻接矩阵。

所述第二邻接矩阵包括所述若干个方面词彼此的连接关系对应的特征向量。

请参阅图3，图3为本申请一个实施例提供的基于子句级关系图的方面词的情感分析方法中S5的流程示意图，包括步骤S51~S53，具体如下：

S51：将所述待测语句划分为若干个子待测语句，根据所述若干个子待测语句，获取所述方面词的句子标识，根据所述方面词的句子标识，构建所述待测语句的子句级关系图。

所述子句级关系图包括所述若干个方面词彼此的连接关系。

在本实施例中，分析设备将所述待测语句划分为若干个子待测语句，根据所述若干个子待测语句，获取所述方面词的句子标识，根据所述方面词的句子标识，构建所述待测语句的子句级关系图，所述子句级关系图包括所述若干个方面词彼此的连接关系。

具体地，分析设备采用话语分割工具，其原理是在待测语句中的每个单词后面设置标记，使用一个二分类器输入语义、句法、词性等特征来决定该标记是否为EDU边界，并通过大量人工标记的数据训练提升话语分割效果。分析设备将所述待测语句分割为若干个基本话语单元（EDUs），作为所述若干个子待测语句。

分析设备根据所述若干个子待测语句中包含的方面词，设置各个方面词的的句子标识，以指示相应的方面词处于某一个子待测语句中。对所述方面词进行两两分析，根据所述方面词的句子标识，判断分析的所述方面词是否处于同一个子待测语句中，从而构建若干个方面词彼此的连接关系，构建所述待测语句的子句级关系图。

S52：根据所述若干个方面词彼此的连接关系，对所述待测语句的句子特征表示中的单词的隐藏层向量进行屏蔽处理，构建第一屏蔽句子特征表示以及第二屏蔽句子特征表示。

在本实施例中，分析设备根据所述若干个方面词彼此的连接关系，对所述待测语句的句子特征表示中的单词的隐藏层向量进行屏蔽处理，构建第一屏蔽句子特征表示以及第二屏蔽句子特征表示。

具体地，分析设备分别将所述若干个方面词作为目标方面词，其他的方面词作为相邻方面词，根据所述若干个方面词彼此的连接关系，可以获得第一连接关系以及第二连接关系，其中，所述第一连接关系用于指示连接的所述方面词处于同一个子待测语句中，所述第二连接关系用于指示连接的所述方面词不处于同一个子待测语句。

若所述连接关系为第一连接关系，对所述待测语句的句子特征表示中非相邻方面词的隐藏层向量进行屏蔽处理，获取第一屏蔽句子特征表示；将所述目标方面词所在的子待测语句作为目标语句，其他子待测语句作为非目标语句，对所述待测语句的句子特征表示中，处于所述非目标语句的单词的隐藏层向量进行屏蔽处理，获取第二屏蔽句子特征表示；

若所述连接关系为第二连接关系，将所述若干个相邻方面词所在的子待测语句作为目标语句，其他子待测语句作为非目标语句，对所述待测语句的句子特征表示中，处于所述非目标语句的单词的隐藏层向量进行屏蔽处理，获取第一屏蔽句子特征表示；对所述待测语句的句子特征表示中，不处于所述目标语句的单词的隐藏层向量进行屏蔽处理，获取第二屏蔽句子特征表示。

S53：根据所述第一屏蔽句子特征表示、第二屏蔽句子特征表示以及预设的连接关系特征计算算法，获得所述若干个方面词彼此的连接关系对应的特征向量，构建所述待测语句的第二邻接矩阵。

所述连接关系特征计算算法为：

式中，p和q为所述方面词的索引，

为所述第p个方面词与第q个方面词的连接关系对应的特征向量，i，j，k分别单词的索引，

为所述第二屏蔽句子特征表示中第k个单词的隐藏层向量，

为所述第一屏蔽句子表示第一屏蔽句子特征表示中第i个单词的隐藏层向量，

为所述第二屏蔽句子特征表示中第j个单词的隐藏层向量，T表示转置。

在本实施例中，分析设备根据所述第一屏蔽句子特征表示、第二屏蔽句子特征表示以及预设的连接关系特征计算算法，获得所述若干个方面词彼此的连接关系对应的特征向量，构建所述待测语句的第二邻接矩阵。

S6：根据所述第一特征表示，获取所述若干个方面词的第一特征向量，将所述若干个方面词的第一特征向量以及第二邻接矩阵输入至所述关系图注意网络中进行卷积处理，获得所述若干个方面词的第二特征向量。

在本实施例中，分析设备根据所述第一特征表示，获取所述若干个方面词的第一特征向量，具体地，分析设备对所述第一特征表示中，非方面词的第一特征向量进行屏蔽处理，从而获取屏蔽处理后的第一特征表示，并从所述屏蔽处理后的第一特征表示中，提取所述若干个方面词的第一特征向量。

由于普通图卷积并没有考虑到边上关系，仅使用普通图卷积会丢失大量的信息，为了避免上述情况，提高对方面词的情感分析的准确性，分析设备通过设置注意力机制，将所述若干个方面词的第一特征向量以及第二邻接矩阵输入至所述关系图注意网络中进行卷积处理，获得所述若干个方面词的第二特征向量。

请参阅图4，图4为本申请一个实施例提供的基于子句级关系图的方面词的情感分析方法中S6的流程示意图，包括步骤S61~S62，具体如下：

S61：根据所述第二邻接矩阵中若干个方面词彼此的连接关系对应的特征向量以及预设的注意力系数计算算法，获得所述关系图注意网络的若干层对应的若干个所述连接关系对应的注意力系数。

所述注意力系数计算算法为：

式中，

为所述关系图注意网络的第l层对应的所述第p个方面词与第q个方面词彼此的连接关系对应的注意力系数，

为非线性激活函数，relu（）为线性激活函数，

为第二可训练权重参数矩阵，

为第三可训练权重参数矩阵，

为第二偏差参数，

为第三偏差参数，

为所述第p个方面词连接的方面词的集合；

在本实施例中，分析设备根据所述第二邻接矩阵中若干个方面词彼此的连接关系对应的特征向量以及预设的注意力系数计算算法，获得所述关系图注意网络的若干层对应的若干个所述连接关系对应的注意力系数。

S62：将所述若干个方面词的第一特征向量作为所述关系图注意网络的首层的输入信息，根据若干个所述连接关系对应的注意力系数以及预设的第二特征计算算法，获得所述关系图注意网络的最后一层的所述若干个方面词的第二特征向量。

所述第二特征计算算法为：

式中，

为所述关系图注意网络的最后一层的所述方面词的第二特征向量，

为所述所述方面词的第一特征向量，

为第四可训练权重参数矩阵。

在本实施例中，分析设备将所述若干个方面词的第一特征向量作为所述关系图注意网络的首层的输入信息，根据若干个所述连接关系对应的注意力系数以及预设的第二特征计算算法，所述关系图注意网络通过每一层的卷积计算，每一层都能在迭代计算中聚合其相邻层的信息并更新自身的信息。最终所述关系图注意网络的最后一次迭代计算得到的输出特征，即获得所述关系图注意网络的最后一层的所述若干个方面词的第二特征向量。

S7：将所述若干个方面词的第一特征向量以及第二特征向量输入至所述全连接网络进行拼接处理，获取所述若干个方面词的拼接特征向量，对所述若干个方面词的拼接特征向量进行情感分析，获得所述若干个方面词的情感分析结果。

在本实施例中，分析设备将所述若干个方面词的第一特征向量以及第二特征向量输入至所述全连接网络进行拼接处理，获取所述若干个方面词的拼接特征向量，对所述若干个方面词的拼接特征向量进行情感分析，获得所述若干个方面词的情感分析结果。

请参阅图5，图5为本申请一个实施例提供的基于子句级关系图的方面词的情感分析方法中S7的流程示意图，包括步骤S71，具体如下：

S71：根据所述若干个方面词的拼接特征向量以及预设的情感概率分布向量计算算法，获得所述若干个方面词的拼接特征向量的预测情感概率分布向量，根据所述预测情感概率分布向量，获得概率最大的维度对应的预测情感极性，作为所述若干个方面词的情感分析结果。

所述情感概率分布向量计算算法为：

式中，pre为所述若干个方面词的预测情感概率分布向量，

为归一化函数，

为预设的第五可训练权重参数矩阵，x为所述情感分析特征向量，

为预设的预设的第五偏置参数。

在本实施例中，分析设备将根据所述若干个方面词的拼接特征向量，利用softmax函数和单层感知机构建的情感概率分布向量计算算法，将所述若干个方面词的拼接特征向量输入至所述情感概率分布向量计算算法中，获得所述若干个方面词的拼接特征向量的预测情感概率分布向量。

在本实施例中，分析设备根据所述若干个方面词的拼接特征向量的预测情感概率分布向量，获取各个方面词对应的概率最大的维度对应的情感极性，作为所述若干个方面词的情感分析结果。具体地，当计算得到pre=[pre积极，pre消极，pre中性]=[0.1，0.7，0.2]，概率最大为pre消极，其概率最大的维度对应的情感极性为消极，作为所述方面词的情感分析结果。

在另一个可选的实施例中，还包括步骤：训练所述情感分析模型，请参阅图6，图6为本申请另一个实施例提供的基于子句级关系图的方面词的情感分析方法的流程示意图，包括步骤S81~S84，具体如下：

S81：获取待训练的情感分析模型、若干个样本语句以及样本语句对应的情感标签信息。

所述样本语句包括若干个样本方面词；所述情感标签信息包括真实情感概率分布向量。

在本实施例中，分析设备获取待训练的情感分析模型、若干个样本语句以及样本语句对应的情感标签信息。

S82：获取若干个样本方面词的句子标识，根据所述若干个样本方面词的句子标识，构建连接关系集。

所述连接关系集包括若干个样本方面词彼此的连接关系。

在本实施例中，分析设备获取若干个样本方面词的句子标识，根据所述若干个样本方面词的句子标识，获取若干个样本方面词彼此的连接关系，构建连接关系集。具体实施例可以参考步骤S51中的实施例的对应过程，在此不再赘述。

S83：获得所述若干个样本方面词对应的预测情感概率分布向量以及预测情感极性，根据所述若干个样本方面词彼此的连接关系以及所述若干个样本方面词对应的预测情感极性，构建标签关系集。

所述标签关系集包括若干个样本方面词彼此的连接关系对应的标签关系信息。

在本实施例中，分析设备获得所述若干个样本方面词对应的预测情感概率分布向量以及预测情感极性，根据所述若干个样本方面词彼此的连接关系以及所述若干个样本方面词对应的预测情感极性，构建标签关系集。

具体地，分析设备设置第一标签关系信息、第二标签关系信息以及第三标签关系信息，其中，第一标签关系信息用于指示两个样本方面词位于不同的样本语句，且两个样本方面词的预测情感极性相同，表现了该两个样本方面词彼此的连接关系为协同关系。

第二标签关系信息用于指示两个样本方面词位于不同的样本语句，且两个样本方面词的预测情感极性不同，表现了该两个样本方面词彼此的连接关系为无关关系。

第三标签关系信息用于指示两个样本方面词位于相同的样本语句，表现了该两个样本方面词彼此的连接关系为协同关系。

S84：根据所述连接关系集、标签关系集以及预设的第一损失函数，获取第一损失值，根据所述若干个样本方面词对应的预测情感概率分布向量、真实情感概率分布向量以及预设的第二损失函数，获取第二损失值，根据所述第一损失值、第二损失值以及预设的总损失函数，获取总损失值，根据所述总损失值，对所述待训练的情感分析模型进行训练，获取所述情感分析模型。

在本实施例中，分析设备采用一个对比学习方法，根据所述标签关系集，把具有相同标签关系信息的所述样本方面词彼此的连接关系聚集到一起，同时将不同标签关系信息的所述样本方面词彼此的连接关系拉开，从而将所述连接关系集划分为若干个不同标签关系信息对应的连接关系子集，根据所述若干个不同标签关系信息对应的连接关系子集以及预设的第一损失函数，获取第一损失值，其中，所述第一损失函数为：

式中，

为所述第一损失值，u、v以及b为所述连接关系集中的连接关系的索引，

为所述连接关系集中第u个所述样本方面词彼此的连接关系，

为所述连接关系集中第v个所述样本方面词彼此的连接关系，

为所述连接关系集中第b个所述样本方面词彼此的连接关系，R为所述连接关系集中所述样本方面词彼此的连接关系的数目，

为所述连接关系集中第u个所述样本方面词彼此的连接关系对应的标签关系信息，

为所述连接关系集中第v个所述样本方面词彼此的连接关系对应的标签关系信息，

为所述第u个所述样本方面词彼此的连接关系对应的标签关系信息的数目，

为温度系数，sim（）为余弦相似度函数。

分析设备根据所述若干个样本方面词对应的预测情感概率分布向量、真实情感概率分布向量以及预设的第二损失函数，获取第二损失值，其中，所述第二损失函数为：

式中，L为所述第二损失值，K为所述样本方面词的数目，k表示第k个样本方面词，

为所述样本方面词对应的真实情感概率分布向量，

为所述样本方面词对应的预测情感概率分布向量；

分析设备根据所述第一损失值、第二损失值以及预设的总损失函数，获取总损失值，根据所述总损失值，对所述待训练的情感分析模型进行训练，获取所述情感分析模型，其中，所述总损失函数为：

式中，Loss为所述总损失值，

为第一衰减系数，

为第二衰减系数，

为可训练参数。

请参阅图7，图7为本申请一个实施例提供的基于子句级关系图的方面词的情感分析装置的结构示意图，该装置可以通过软件、硬件或两者的结合实现基于子句级关系图的方面词的情感分析方法的全部或一部分，该装置7包括：

获取模块71，用于获取待测语句以及预设的情感分析模型，其中，所述待测语句包括若干个单词，所述单词包括上下文单词以及由若干个单词组合的若干个方面词，所述情感分析模型包括句子编码网络、图卷积网络、关系图注意网络以及全连接网络；

句子编码模块72，用于将所述待测语句输入至所述句子编码网络，获得所述待测语句的句子特征表示；

第一邻接矩阵计算模块73，用于构建所述待测语句的依存句法图，根据所述依存句法图，获得所述待测语句的第一邻接矩阵；

第一特征计算模块74，用于将所述待测语句的句子特征表示以及第一邻接矩阵输入至所述图卷积网络中进行卷积处理，获得所述待测语句的第一特征表示，其中，所述第一特征表示包括所述若干个方面词的第一特征向量；

第二邻接矩阵计算模块75，用于构建所述待测语句的子句级关系图，根据所述子句级关系图以及所述句子特征表示，构建所述待测语句的第二邻接矩阵，其中，所述第二邻接矩阵包括所述若干个方面词彼此的连接关系对应的特征向量；

第二特征计算模块76，用于根据所述第一特征表示，获取所述若干个方面词的第一特征向量，将所述若干个方面词的第一特征向量以及第二邻接矩阵输入至所述关系图注意网络中进行卷积处理，获得所述若干个方面词的第二特征向量；

情感分析模块77，用于将所述若干个方面词的第一特征向量以及第二特征向量输入至所述全连接网络进行拼接处理，获取所述若干个方面词的拼接特征向量，对所述若干个方面词的拼接特征向量进行情感分析，获得所述若干个方面词的情感分析结果。

在本申请的实施例中，通过获取模块，获取待测语句以及预设的情感分析模型，其中，所述待测语句包括若干个单词，所述单词包括上下文单词以及由若干个单词组合的方面词，所述情感分析模型包括句子编码网络、图卷积网络、关系图注意网络以及全连接网络；通过句子编码模块，将所述待测语句输入至所述句子编码网络，获得所述待测语句的句子特征表示；通过第一邻接矩阵计算模块，构建所述待测语句的依存句法图，根据所述依存句法图，获得所述待测语句的第一邻接矩阵；通过第一特征计算模块，将所述待测语句的句子特征表示以及第一邻接矩阵输入至所述图卷积网络中进行卷积处理，获得所述待测语句的第一特征表示，其中，所述第一特征表示包括所述若干个方面词的第一特征向量；通过第二邻接矩阵计算模块，构建所述待测语句的子句级关系图，根据所述子句级关系图以及所述句子特征表示，构建所述待测语句的第二邻接矩阵，其中，所述第二邻接矩阵包括所述若干个方面词彼此的连接关系对应的特征向量；通过第二特征计算模块，根据所述第一特征表示，获取所述若干个方面词的第一特征向量，将所述若干个方面词的第一特征向量以及第二邻接矩阵输入至所述关系图注意网络中进行卷积处理，获得所述若干个方面词的第二特征向量；通过情感分析模块，将所述若干个方面词的第一特征向量以及第二特征向量输入至所述全连接网络进行拼接处理，获取所述若干个方面词的拼接特征向量，对所述若干个方面词的拼接特征向量进行情感分析，获得所述若干个方面词的情感分析结果。本申请通过构建子句级关系图，并用图卷积网络以及关系图注意网络，分别提取待测语句中多个方面词的特征信息，利用获得的特征信息，更加全面地对多个方面词的情感极性的进行分析，提升了情感分析的准确性以及效率。

请参考图8，图8为本申请一个实施例提供的计算机设备的结构示意图，计算机设备8包括：处理器81、存储器82以及存储在存储器82上并可在处理器81上运行的计算机程序83；计算机设备可以存储有多条指令，指令适用于由处理器81加载并执行上述图1至图6所述实施例的方法步骤，具体执行过程可以参见图1至图6所述实施例的具体说明，在此不进行赘述。

其中，处理器81可以包括一个或多个处理核心。处理器81利用各种接口和线路连接服务器内的各个部分，通过运行或执行存储在存储器82内的指令、程序、代码集或指令集，以及调用存储器82内的数据，执行基于子句级关系图的方面词的情感分析装置8的各种功能和处理数据，可选的，处理器81可以采用数字信号处理（Digital Signal Processing,DSP）、现场可编程门阵列（Field-Programmable Gate Array，FPGA）、可编程逻辑阵列（Programble Logic Array，PLA）中的至少一个硬件形式来实现。处理器81可集成中央处理器81（Central Processing Unit，CPU）、图像处理器81（Graphics Processing Unit，GPU）和调制解调器等中的一个或几种的组合。其中，CPU主要处理操作系统、用户界面和应用程序等；GPU用于负责触摸显示屏所需要显示的内容的渲染和绘制；调制解调器用于处理无线通信。可以理解的是，上述调制解调器也可以不集成到处理器81中，单独通过一块芯片进行实现。

其中，存储器82可以包括随机存储器82（Random Access Memory，RAM），也可以包括只读存储器82（Read-Only Memory）。可选的，该存储器82包括非瞬时性计算机可读介质（non-transitory computer-readable storage medium）。存储器82可用于存储指令、程序、代码、代码集或指令集。存储器82可包括存储程序区和存储数据区，其中，存储程序区可存储用于实现操作系统的指令、用于至少一个功能的指令（比如触控指令等）、用于实现上述各个方法实施例的指令等；存储数据区可存储上面各个方法实施例中涉及到的数据等。存储器82可选的还可以是至少一个位于远离前述处理器81的存储装置。

本申请实施例还提供了一种存储介质，所述存储介质可以存储有多条指令，所述指令适用于由处理器加载并执行所示实施例一至实施例三的方法步骤，具体执行过程可以参见所示图1至图6所述实施例的具体说明，在此不进行赘述。

所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，仅以上述各功能单元、模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能单元、模块完成，即将所述装置的内部结构划分成不同的功能单元或模块，以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中，上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。另外，各功能单元、模块的具体名称也只是为了便于相互区分，并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述或记载的部分，可以参见其它实施例的相关描述。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

在本发明所提供的实施例中，应该理解到，所揭露的装置/终端设备和方法，可以通过其它的方式实现。例如，以上所描述的装置/终端设备实施例仅是示意性的，例如，所述模块或单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口，装置或单元的间接耦合或通讯连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明实现上述实施例方法中的全部或部分流程，也可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一计算机可读存储介质中，该计算机程序在被处理器执行时，可实现上述各个方法实施例的步骤。其中，所述计算机程序包括计算机程序代码，所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。

本发明并不局限于上述实施方式，如果对本发明的各种改动或变形不脱离本发明的精神和范围，倘若这些改动和变形属于本发明的权利要求和等同技术范围之内，则本发明也意图包含这些改动和变形。

Claims

1.一种基于子句级关系图的方面词的情感分析方法，其特征在于，包括以下步骤：

构建所述待测语句的子句级关系图，所述子句级关系图包括所述若干个方面词彼此的连接关系，根据所述子句级关系图以及所述句子特征表示，构建所述待测语句的第二邻接矩阵，其中，所述第二邻接矩阵包括所述若干个方面词彼此的连接关系对应的特征向量；

2.根据权利要求1所述的基于子句级关系图的方面词的情感分析方法，其特征在于：所述句子特征表示包括若干个单词的隐藏层向量，所述第一邻接矩阵包括若干个单词之间的依存关系向量；

所述将所述待测语句的句子特征表示以及第一邻接矩阵输入至所述图卷积网络中进行卷积处理，获得所述待测语句的第一特征表示，包括步骤：

将所述待测语句的句子特征表示中若干个单词的隐藏层向量作为所述图卷积网络的首层的输入信息，根据所述待测语句的第一邻接矩阵中若干个单词之间的依存关系向量以及预设的第一特征计算算法，获得所述图卷积网络的最后一层的若干个单词的初始第一特征向量，其中，所述第一特征计算算法为：

式中，i和j为单词的索引，

为非线性激活函数，

为第一可训练权重参数矩阵，

为第一偏差参数，n是所述待测语句的单词数目；

根据所述待测语句的若干个单词的初始第一特征向量以及预设的加权算法，对所述若干个单词的初始第一特征向量进行加权处理，获得加权处理后的所述若干个单词的初始第一特征向量，并进行编码处理，获得加权处理后的所述待测语句的第一特征表示，并对所述加权处理后的待测语句的第一特征表示进行平均池化处理，获得平均池化处理后的第一特征表示，作为所述待测语句的第一特征表示，其中，所述加权算法为：

式中，τ为所述方面词的开始位置，m为所述方面词的数目，

为第i个单词的位置权重参数，

为所述加权处理后的所述第i个单词对应的第一特征向量。

3.根据权利要求2所述的基于子句级关系图的方面词的情感分析方法，其特征在于，所述构建所述待测语句的子句级关系图，根据所述子句级关系图以及所述句子特征表示，构建所述待测语句的第二邻接矩阵，包括步骤：

将所述待测语句划分为若干个子待测语句，根据所述若干个子待测语句，获取所述方面词的句子标识，根据所述方面词的句子标识，构建所述待测语句的子句级关系图；

根据所述若干个方面词彼此的连接关系，对所述待测语句的句子特征表示中的单词的隐藏层向量进行屏蔽处理，构建第一屏蔽句子特征表示以及第二屏蔽句子特征表示；

根据所述第一屏蔽句子特征表示、第二屏蔽句子特征表示以及预设的连接关系特征计算算法，获得所述若干个方面词彼此的连接关系对应的特征向量，构建所述待测语句的第二邻接矩阵，其中，所述连接关系特征计算算法为：

式中，p和q为所述方面词的索引，

为第p个方面词与第q个方面词的连接关系对应的特征向量，i，j，k分别单词的索引，

为所述第二屏蔽句子特征表示中第k个单词的隐藏层向量，

为所述第一屏蔽句子特征表示中第i个单词的隐藏层向量，

4.根据权利要求3所述的基于子句级关系图的方面词的情感分析方法，其特征在于，所述将所述若干个方面词的第一特征向量以及第二邻接矩阵输入至所述关系图注意网络中进行卷积处理，获得所述若干个方面词的第二特征向量，包括步骤：

根据所述第二邻接矩阵中若干个方面词彼此的连接关系对应的特征向量以及预设的注意力系数计算算法，获得所述关系图注意网络的若干层对应的若干个所述连接关系对应的注意力系数，其中，所述注意力系数计算算法为：

式中，

为非线性激活函数，relu（）为线性激活函数，

为第二可训练权重参数矩阵，

为第三可训练权重参数矩阵，

为第二偏差参数，

为第三偏差参数，

为所述第p个方面词连接的方面词的集合；

将所述若干个方面词的第一特征向量作为所述关系图注意网络的首层的输入信息，根据若干个所述连接关系对应的注意力系数以及预设的第二特征计算算法，获得所述关系图注意网络的最后一层的所述若干个方面词的第二特征向量，其中，所述第二特征计算算法为：

式中，

为所述方面词的第一特征向量，

为第四可训练权重参数矩阵。

5.根据权利要求4所述的基于子句级关系图的方面词的情感分析方法，其特征在于，所述对所述若干个方面词的拼接特征向量进行情感分析，获得所述若干个方面词的情感分析结果，包括步骤：

根据所述若干个方面词的拼接特征向量以及预设的情感概率分布向量计算算法，获得所述若干个方面词的拼接特征向量的预测情感概率分布向量，根据所述预测情感概率分布向量，获得概率最大的维度对应的预测情感极性，作为所述若干个方面词的情感分析结果，其中，所述情感概率分布向量计算算法为：

式中，pre为所述若干个方面词的预测情感概率分布向量，

为归一化函数，

为预设的第五偏置参数。

6.根据权利要求5所述的基于子句级关系图的方面词的情感分析方法，其特征在于，还包括训练所述情感分析模型，所述训练所述情感分析模型，包括步骤：

获取待训练的情感分析模型、若干个样本语句以及样本语句对应的情感标签信息，其中，所述样本语句包括若干个样本方面词；所述情感标签信息包括真实情感概率分布向量；

获取若干个样本方面词的句子标识，根据所述若干个样本方面词的句子标识，构建连接关系集，其中，所述连接关系集包括若干个样本方面词彼此的连接关系；

获得所述若干个样本方面词对应的预测情感概率分布向量以及预测情感极性，根据所述若干个样本方面词彼此的连接关系以及所述若干个样本方面词对应的预测情感极性，构建标签关系集，其中，所述标签关系集包括若干个样本方面词彼此的连接关系对应的标签关系信息；

根据所述连接关系集、标签关系集以及预设的第一损失函数，获取第一损失值，根据所述若干个样本方面词对应的预测情感概率分布向量、真实情感概率分布向量以及预设的第二损失函数，获取第二损失值，根据所述第一损失值、第二损失值以及预设的总损失函数，获取总损失值，根据所述总损失值，对所述待训练的情感分析模型进行训练，获取所述情感分析模型。

7.根据权利要求6所述的基于子句级关系图的方面词的情感分析方法，其特征在于：所述第一损失函数为：