CN113722439A

CN113722439A - 基于对抗性类别对齐网络的跨领域情感分类方法及系统

Info

Publication number: CN113722439A
Application number: CN202111016540.5A
Authority: CN
Inventors: 廖祥文; 郭星宇; 朱雨航; 曾梦美; 蔡鸿杰
Original assignee: Fuzhou University
Current assignee: Fuzhou University
Priority date: 2021-08-31
Filing date: 2021-08-31
Publication date: 2021-11-30
Anticipated expiration: 2041-08-31
Also published as: CN113722439B

Abstract

本发明涉及一种基于对抗性类别对齐网络的跨领域情感分类方法，包括以下步骤：从常识库中提取相关领域的知识，生成与文本相关的常识知识特征，来增强文本的语义；对历史上下文信息进行编码，生成具有上下文信息的原始句子特征；融合外部知识生成的文本相关的常识知识特征和原始句子特征，生成兼具特异性和泛化性的文本表示；基于对抗性类别对齐网络，在全局边缘对齐的先验条件下，进行类别级别的对齐；对融合的文本特征向量进行分类预测，实现情感类别的输出。该方法及系统有利于提高跨领域文本情感分类的准确性。

Description

基于对抗性类别对齐网络的跨领域情感分类方法及系统

技术领域

本发明属于文本分类预测技术领域，具体涉及一种基于对抗性类别对齐网络的跨领域情感分类方法及系统。

背景技术

跨领域文本情感分类，旨在通过迁移学习，利用源领域已标注文本来提高目标领域未标注文本情感分类性能。

目前对跨领域文本情感分类的相关研究主要可以分为三类：(1)基于实例加权的跨领域文本情感分类方法，通过在训练过程中赋予与目标领域相似样本更高的权重以此来降低源领域和目标领域之间的分布差异，但此方法在迁移过程不可避免的会产生负面迁移的问题，反而会降低目标领域情感分类性能；(2)基于特征选择的跨领域文本情感分类方法，通过对源领域和目标领域之间枢轴特征和非枢轴特征建立关系，构建一个领域共享的特征表示空间，但该方法常常使用词袋模型和N-gram特征来对文本向量化，未能充分考虑文本上下文关系以及局部关键语义特征；(3)基于特征表示学习的跨领域文本情感分类方法，通过训练网络模型参数，学习适应于源领域和目标领域的文本特征表示，此类方法通常使用领域对抗网络(DANN)、分层注意网络(HATN)、端到端对抗记忆网络(AMN)等。但此类方法并未充分考虑目标领域样本情感分类的决策边界，无法生成更具有区分性的特征。

发明内容

本发明的目的在于提供一种基于对抗性类别对齐网络的跨领域情感分类方法及系统，该方法及系统有利于提高跨领域文本情感分类的准确性。

为实现上述目的，本发明采用的技术方案是：一种基于对抗性类别对齐网络的跨领域情感分类方法，包括以下步骤：

从常识库中提取相关领域的知识，生成与文本相关的常识知识特征，来增强文本的语义；

对历史上下文信息进行编码，生成具有上下文信息的原始句子特征；

融合外部知识生成的文本相关的常识知识特征和原始句子特征，生成兼具特异性和泛化性的文本表示；

基于对抗性类别对齐网络，在全局边缘对齐的先验条件下，进行类别级别的对齐；

对融合的文本特征向量进行分类预测，实现情感类别的输出。

进一步地，采用关系图卷积网络R-GCN从常识库中提取相关领域的知识，生成与文本相关的常识知识特征，具体为：

首先从数据集中所有领域的训练文档中提取出所有唯一的名词、形容词和副词的集合，以此集合为种子来过滤原始知识图

来建立基于所有领域的知识子图

然后训练一个图形自动编码器模型来进行链接预测；所述图形自动编码器模型以来自图

中边

的不完整边

作为输入，输出边(c₁,r,c2)的可能性得分；所述图形自动编码器模型包括一个R-GCN编码器和一个DistMut评分模型；所述R-GCN编码器在给定知识图的局部区域中学习域聚合特征向量；

所述R-GCN编码器的计算公式如下：

其中，gi为初始图特征向量，

为域聚合特征向量，

表示知识图中的在关系

下的节点i，c_i,r是一个归一化常数，预先设置使得

均为可变化的学习参数；

所述DistMut评分模型用于计算三元组(c_i,r,c_j)的得分：

其中，σ是logistic函数，

是图节点c_i,c_j的域聚合特征向量，每个关系

还与一个对角矩阵

相关联；

所述图形自动编码器模型预训练所使用标准的交叉熵损失函数如下：

其中，y表示图节点c_i,c_j是否有链接，有为1，没有为0。

进一步地，对历史上下文信息进行编码，生成具有上下文信息的原始句子特征，具体为：

首先利用词袋模型将句子矢量化，再利用双向LSTM对历史上下文进行编码；

所述双向LSTM的计算公式如下：

其中，t时刻第一层，即顺时间循环层的隐藏状态

取决于前一时刻的隐藏状态

和输入值x_t；第二层，即逆时间循环层的隐藏状态也取决于前一时刻的隐藏状态和输入值x；U⁽¹⁾，W⁽¹⁾，b⁽¹⁾，U⁽²⁾，W⁽²⁾，b⁽²⁾都是可训练参数。

进一步地，融合外部知识生成的文本相关的常识知识特征和原始句子特征，具体为：

定义外部知识生成的文本相关的常识知识特征向量

和原始句子向量

对常识知识特征和原始句子通过以下公式进行融合：

其中，

表示领域i的第j个句子的常识知识特征，

表示领域i的第j个句子的原始句子特征；

b_g均为可训练权重，

经过sigmoid后得到一个权重g_j，

分别于g_j和1-g_j进行点积再拼接得到最终的融合向量u_j。

进一步地，基于对抗性类别对齐网络，在全局边缘对齐的先验条件下，进行类别级别的对齐，具体为：

构建对抗性类别对齐网络模型，所述模型先在训练阶段使得源领域和目标领域进行全局边缘对齐，再进行类别级别的对齐；

所述模型包括一个域共享编码器G，两个分类器F₁，F₂；

分类器的情感分类目标函数如下：

其中，

为样本

经过域共享编码器G，再经过分类器F₁后得到的

的情感分类概率，

为样本

经过域共享编码器G，再经过分类器F₂后得到的

的情感分类概率；

表示样本原有的情感标签，积极情感为1，消极情感为0；n_s表示训练集样本总数；K表示n分类任务；

所述模型采用KL散度来评估源领域和目标领域的数据特征分布差异，当两个领域数据分布差异越大，KL散度越大，因此通过最小化KL散度和情感分类损失来使得源领域和目标领域达到全局边缘对齐；KL散度的计算公式如下：

其中，||·||₁表示L1范数，g_s表示源领域特征分布，g_t表示目标领域特征分布；

第一步，训练G，F₁，F₂，得到全局边缘对齐；

所述模型定义了两个分类器概率输出之间的差异，其公式如下：

其中，d(p₁(y|x),p₂(y|x))为二分类平均绝对差值，当i＝1时，

表示分类器F₁对样本x预测为消极标签的概率，

表示分类器F₂对样本x预测为消极标签的概率；当i＝2时，

表示分类器F₁对样本x预测为积极标签的概率，

表示分类器F₂对样本x预测为积极标签的概率

第二步，固定G，调整F₁，F₂，通过最大化预测偏差来调整分类器参数，来定位到决策边界附近的特征；其目标函数如下：

第三步，固定F₁，F₂，调整G，生成更好的特征使得第二步中定位到的特征远离决策边界，其目标函数为：

通过不断重复上述对抗过程，实现两个领域的类别级对齐，使得特征提取网络生成领域适应的文本特征表示；

整个模型的优化策略如下：

(1)通过最小化情感分类误差和边缘分布差异实现领域的全局边缘对齐，其损失函数如下：

L1＝L_cls+λ1L_kl

(2)固定特征提取网络G的参数不变，增大F₁，F₂的差异，从而定位到具有歧义的特征，其损失函数如下：

L2＝L_cls-λ2Ld_is

(3)固定分类器F₁，F₂参数不变，减小分类器F₁，F₂的差异，优化域共享编码器G的参数，使特征尽可能远离决策边界，其损失函数为：

L3＝L_cl_s+λ3L_dis。

进一步地，在测试过程只使用F₁分类器来进行情感分类，采用softmax函数，将概率最大的类别作为对应文本表示的情感类别预测值，计算公式如下：

y＝softmax(W。ha+b。)

其中，W_o为分类器的权重参数，b_o为分类器的偏置项。

本发明还提供了一种基于对抗性类别对齐网络的跨领域情感分类系统，包括存储器、处理器以及存储于存储器上并能够被处理器运行的计算机程序指令，当处理器运行该计算机程序指令时，能够实现上述的方法步骤。

进一步地，该系统进一步包括：

外部知识模块，用于从常识库中提取相关领域的知识，生成与文本相关的常识知识特征，来增强文本的语义；

编码器模块，用于对历史上下文信息进行编码，生成具有上下文信息的原始句子特征；

动态融合模块，用于融合外部知识生成的文本相关的常识知识特征和原始句子特征，生成兼具特异性和泛化性的文本表示；

对抗性类别对齐网络模块，用于基于对抗性类别对齐网络，在全局边缘对齐的先验条件下，进行类别级别的对齐；以及

情感类别输出模块，用于对融合的文本特征向量进行分类预测，实现情感类别的输出。

与现有技术相比，本发明具有以下有益效果：提供了一种基于对抗性类别对齐网络的跨领域情感分类方法及系统，该方法能够编码文档的历史上下文信息，生成具有上下文信息的文档特征向量，并利用RGCN从外部知识库中获取有用的外部知识信息，随后二者信息融合生成特定文档的特征向量再将融合的向量送入对抗性类别对齐网络，最终对于融合的特征向量进行分类预测。该方法相较于传统的方法，有效融合了外部知识，且在全局边缘对齐的先验条件下，进行类别级别的对齐，提高了跨领域文本情感分类的准确性。

附图说明

图1是本发明实施例的实现流程示意图。

具体实施方式

下面结合附图及实施例对本发明做进一步说明。

应该指出，以下详细说明都是示例性的，旨在对本申请提供进一步的说明。除非另有指明，本文使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。

需要注意的是，这里所使用的术语仅是为了描述具体实施方式，而非意图限制根据本申请的示例性实施方式。如在这里所使用的，除非上下文另外明确指出，否则单数形式也意图包括复数形式，此外，还应当理解的是，当在本说明书中使用术语“包含”和/或“包括”时，其指明存在特征、步骤、操作、器件、组件和/或它们的组合。

如图1所示，本实施例提供了一种基于对抗性类别对齐网络的跨领域情感分类方法，包括以下步骤：

S1、采用关系图卷积网络R-GCN从常识库中提取相关领域的知识，生成与文本相关的常识知识特征，来增强文本的语义；具体为：

来建立基于所有领域的知识子图

然后训练一个图形自动编码器模型来进行链接预测。所述图形自动编码器模型以来自图

中边ε'的不完整边

作为输入，输出边(c₁,r,c₂)的可能性得分。所述图形自动编码器模型包括一个R-GCN编码器和一个DistMut评分模型。所述R-GCN编码器在给定知识图的局部区域中学习域聚合特征向量。

所述R-GCN编码器的计算公式如下：

其中，g_i为初始图特征向量，

为域聚合特征向量，

表示知识图中的在关系

下的节点i，c_ir是一个归一化常数，预先设置使得

均为可变化的学习参数。

所述DistMut评分模型用于计算三元组(c_i,r,c_j)的得分：

其中，σ是logistic函数，

是图节点c_i,c_j的域聚合特征向量，每个关系

还与一个对角矩阵

相关联。

所述图形自动编码器模型预训练所使用标准交叉熵损失函数如下：

其中，y表示图节点c_i,c_j是否有链接，有为1，没有为0。

S2、对历史上下文信息进行编码，生成具有上下文信息的原始句子特征；具体为：

首先利用词袋模型将句子矢量化，再利用双向LSTM对历史上下文进行编码。双向LSTM不仅能利用到过去的信息，还能捕捉到后续的信息，可以更好地利用上下文的信息。

所述双向LSTM的计算公式如下：

其中，t时刻第一层，即顺时间循环层的隐藏状态

取决于前一时刻的隐藏状态

S3、融合外部知识生成的文本相关的常识知识特征和原始句子特征，生成兼具特异性和泛化性的文本表示；具体为：

定义外部知识生成的文本相关的常识知识特征向量

和原始句子向量

对常识知识特征和原始句子通过以下公式进行融合：

其中，

表示领域i的第j个句子的常识知识特征，

表示领域i的第j个句子的原始句子特征；

b_g均为可训练权重，

经过sigmoid后得到一个权重g_j，

分别于g_j和1-g_j进行点积再拼接得到最终的融合向量u_j。

S4、基于对抗性类别对齐网络，在全局边缘对齐的先验条件下，进行类别级别的对齐；具体为：

构建对抗性类别对齐网络模型，所述模型先在训练阶段使得源领域和目标领域进行全局边缘对齐，再进行类别级别的对齐。

所述模型包括一个域共享编码器G，两个分类器F₁，F₂。

分类器的情感分类目标函数如下：

其中，

为样本

经过域共享编码器G，再经过分类器F₁后得到的

的情感分类概率，

为样本

经过域共享编码器G，再经过分类器F₂后得到的

的情感分类概率；

表示样本原有的情感标签，积极情感为1，消极情感为0；n_s表示训练集样本总数；K表示n分类任务，此处取值为2。

其中，||·||₁表示L1范数，g_s表示源领域特征分布，g_t表示目标领域特征分布。

第一步，训练G，F₁，F₂，得到全局边缘对齐；这一步降低了两个领域之间的距离，但在决策边界附近产生了模糊的目标特征。

其中，d(p₁(y|x),p₂(y|x))为二分类平均绝对差值，当i＝1时，

表示分类器F₁对样本x预测为消极标签的概率，

表示分类器F₂对样本x预测为消极标签的概率；当i＝2时，

表示分类器F₁对样本x预测为积极标签的概率，

表示分类器F₂对样本x预测为积极标签的概率

通过不断重复上述对抗过程，实现两个领域的类别级对齐，使得特征提取网络生成领域适应的文本特征表示。

整个模型的优化策略如下：

L₁＝L_cls+λ₁L_kl

L₂＝L_cls-λ₂L_dis

L₃＝L_cls+λ₃L_dis。

在模型的训练阶段，根据信息的前向传播和误差的后向传播将不断地对他们进行调整，逐步优化目标函数。

S5、对融合的文本特征向量进行分类预测，实现情感类别的输出。

在测试过程只使用F₁分类器来进行情感分类，采用softmax函数，将概率最大的类别作为对应文本表示的情感类别预测值，计算公式如下：

y＝softmax(W_oh_a+b_o)

其中，W_o为分类器的权重参数，b_o为分类器的偏置项。

本实施例还提供了一种基于对抗性类别对齐网络的跨领域情感分类系统，包括存储器、处理器以及存储于存储器上并能够被处理器运行的计算机程序指令，当处理器运行该计算机程序指令时，能够实现上述的方法步骤。该系统进一步包括：

本领域内的技术人员应明白，本申请的实施例可提供为方法、系统、或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

以上所述，仅是本发明的较佳实施例而已，并非是对本发明作其它形式的限制，任何熟悉本专业的技术人员可能利用上述揭示的技术内容加以变更或改型为等同变化的等效实施例。但是凡是未脱离本发明技术方案内容，依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与改型，仍属于本发明技术方案的保护范围。