CN113051916B

CN113051916B - 一种社交网络中基于情感偏移感知的交互式微博文本情感挖掘方法

Info

Publication number: CN113051916B
Application number: CN202110443368.5A
Authority: CN
Inventors: 曹玖新; 顾天韵; 赵志翔
Original assignee: Southeast University
Current assignee: Southeast University
Priority date: 2021-04-23
Filing date: 2021-04-23
Publication date: 2022-11-18
Anticipated expiration: 2041-04-23
Also published as: CN113051916A

Abstract

本发明公开了一种社交网络中基于情感偏移感知的交互式微博文本情感挖掘方法，其步骤为：首先基于单条微博语义及其交互历史的文本内容，对微博文本进行情感极性标注；其次采用自然语言处理领域中的预训练语言模型BERT，提取语句级的微博情感语义特征；接着利用长短期记忆网络LSTM，在交互式的社交网络语境下，提取语境级的情感语义特征；然后引入多任务学习的学习范式，建立情感偏移感知辅助任务，利用该情感偏移特征设计情感关联关系增强的Attention机制，从交互历史中提取出与当前微博相关的情感影响因素，再与情感语义特征融合并进行情感极性分类，构建微博文本情感识别模型。该方法大幅提高了交互式微博文本情感挖掘的准确率与模型的泛化能力。

Description

一种社交网络中基于情感偏移感知的交互式微博文本情感挖掘方法

技术领域

本发明涉及到一种社交网络中基于情感偏移感知的交互式微博文本情感挖掘方法。

背景技术

近年来，随着信息技术的飞速发展和互联网应用的普及，越来越多的人习惯通过网络平台发布个人观点并分享自己的生活，新浪微博作为拥有数亿网络用户的成熟社交网络平台，已成为中国网民日常生活中发表看法、参与讨论的重要途径，在我国网络舆情发展的进程中有着举足轻重的作用，具有巨大的社会价值。对微博文本的情感分析，主要是对带有感情色彩的主观性文本进行分析、处理、归纳然后进行推理的过程，由此可以获取网民对某个事件或事物的看法，从而感知整体舆情，因此，在社交网络中挖掘微博文本情感具有重要的现实意义。

当前关于微博文本情感的识别技术主要针对单条微博文本，或是忽略了社交网络中交互式语境下的情感动态变化过程。而在现实中由于受到开放自由的社交网络影响，微博用户所表达出的情感不仅仅由单条微博文本体现，更是经历了一个动态变化过程后所产生的结果，即舆论会随着网民的互动而逐步变化，因此，感知微博用户在参与讨论时自始至终的情感偏移过程，有助于提高交互式场景下微博文本情感识别的准确率。

发明内容

本发明所要解决的技术问题是：提供一种可以识别与分析微博文本情感的一种社交网络中基于情感偏移感知的交互式微博文本情感挖掘方法。

为解决上述技术问题，本发明采用的技术方案为：一种社交网络中基于情感偏移感知的交互式微博文本情感挖掘方法，利用社交网络中交互式场景下，微博用户的情感偏移特征可以为微博之间的情感影响关系提供显式且精确的线索，借此提取语境中情感影响因素，从而提升微博文本情感识别的表现，所述方法包括如下步骤：

步骤1)根据社交网络中每条微博文本以及其交互历史的上下文语义信息，标注微博文本的情感极性，并划分训练集、验证集与测试集；

步骤2)采用自然语言处理领域中的预训练语言模型BERT，提取语句级的微博情感语义特征；

步骤3)针对交互式的社交网络语境进行分析，基于长短期记忆网络LSTM，提取语境级的微博情感语义特征；

步骤4)将步骤2)、步骤3)得到的特征拼接为特征向量，以表示微博的基本情感语义特征；

步骤5)针对情感偏移进行分析，用户在时间维度上相邻文本之间所体现出的情感偏移感知方法，可抽象为句子对分类建模问题，将步骤4)所得的微博基本情感语义特征输入多层感知机，映射至情感偏移标签空间，进行参数学习，同时得到用户情感偏移特征；

步骤6)中在交互语境中进一步挖掘情感影响因素。由于步骤5)中的情感偏移特征可以看作是情感偏移感知任务结果的估计值。此时情感偏移程度可以看作一个已知量，那么在已知各语句与上句相比是否会发生情感变化的基础上再从语境中进一步提取信息，能够更有针对性地挖掘出交互式语境中相关情感影响因素。由此可将步骤5)所得的情感偏移特征与步骤4)所得的基本情感语义特征进行融合，设计情感关联关系增强的语境级Attention机制，进一步从交互历史中提取出与单条微博相关的情感影响因素；

步骤7)根据步骤6)所得的情感影响因素，再与步骤4)所得的基本情感语义特征融合，得到在交互式语境下单条微博文本的最终情感特征，并输入多层感知机，映射至微博文本情感极性标签空间，进行参数学习；

步骤8)引入多任务学习范式，步骤5)可看作用户情感偏移感知的辅助任务，步骤7)可看作微博文本情感识别的主任务，使两者共享隐层参数共同学习，从而完成微博文本情感识别模型的构建，并通过采用最大似然估计和梯度下降法训练学习得到模型参数；

步骤9)将待推断文本情感的任意样本输入步骤8)所得模型，最终输出各情感极性类别下的概率值，概率值最大的类别就是推断所得的微博文本情感。

所述步骤1)的数据集中对微博文本情感极性标注的具体方法为：综合考虑社交网络中单条微博文本以及其交互历史的上下文语义信息，人工标注每条微博的情感极性。

所述步骤2)中由于目前能够获取到的微博情感数据集的数据量有限，而自然语言处理领域流行的预训练语言模型BERT已通过海量语料训练出了提取句子通用语义表征的方式，因此利用BERT提取单条微博的通用语义表征，并且针对本情感分析任务，以Fine-tuning微调的方式使该部分在通用语义表征的基础上更加关注情感语义信息。具体而言，对于某一交互式场景下包含的第i条微博，首先按照BERT的标准预处理方法对该条微博文本进行分词并映射成Token Embeddings，输入经过预训练参数初始化的BERT模型，经过层层编码，使用最终输出的[CLS]对应位的隐含表示作为微博i的基本语义表征t_i。

所述步骤3)中考虑到社交网络中的单条微博文本，其历史语境是由一系列时序上连续、语义上连贯的语句所构成的语言整体，而循环神经网络作为一种建模数据之间顺序关系的标准方法被广泛用于捕捉语言序列的上下文特征，因此基于循环神经网络的某变体，长短期记忆网络LSTM，提取语境级的微博情感语义特征。

所述步骤4)中将步骤2)、步骤3)得到的特征拼接为特征向量，以表示微博的基本语义特征

所述步骤5)中将情感偏移感知抽象为句子对分类问题，并使用多层感知机进行建模，多层感知机由输入层、隐藏层和输出层依次组成，每层之间又由线性映射操作和非线性的激活函数连接，具体而言，将步骤4)所得的当前微博i语义特征

及用户在时间维度上相邻的第k条微博的语义特征

进行向量拼接操作，得到

作为多层感知机的输入层；然后通过参数矩阵

和偏置向量

将输入进行线性变换、再经过tanh函数的非线性激活后，映射至多层感知机的同一隐藏层空间

类似地，利用参数矩阵

和偏置向量

再次从隐藏层映射至输出层，即情感偏移标签空间

得到情感偏移特征m_i，该特征可以代表微博i与其上条微博k之间的情感偏移程度估计值，上述计算过程形式化如下：

m_i＝W₂tanh(W₁[h_k,h_i]+b₁)+b₂#(1)

使用softmax函数对该情感偏移特征m_i进行归一化可得微博i属于在不同情感偏移程度分类标签下概率的向量

从而完成情感偏移感知任务的建模。

所述步骤6)中进行语境情感影响因素提取。步骤5)中得到的情感偏移特征m_i是已经映射到偏移标签空间的向量，并且其下一步骤就是通过Softmax函数归一化得到各标签下概率向量，因此特征m_i可以看作是情感偏移感知任务结果的估计值。此时情感偏移程度可以看作一个已知量，那么在已知各语句与上句相比是否会发生情感变化的基础上再从语境中进一步提取信息，能够更有针对性地挖掘出交互式语境中相关情感影响因素。

具体而言，为了将步骤5)中的情感偏移特征m_i，与步骤3)所得的基本情感语义特征h_i进行融合，首先将两者拼接为

再利用参数矩阵

和偏置向量

进行线性变换，经过tanh函数的非线性激活，得到融合了情感偏移后的微博表征

计算过程如下：

x_i＝tanh(W₃[m_i,h_i]+b₃)#(3)

根据上述计算方式，为交互式场景下的所有微博逐一计算其融合表征，可将所有融合表征向量x_i组合成矩阵

N为该场景下的微博数量，然后在此基础上设计语境级自注意力机制：对于输入矩阵X，首先使用三个不同的权重矩阵W_Q、W_K和W_V对X做线性变换，获得三个不同含义的矩阵：查询(Query，

)，键(Key，

)和值(Value，

)，作为自注意力机制的输入，然后将Query和Key作点积计算相似度，再通过softmax函数对点积结果归一化得到注意力权值分布，最后对Value进行加权求和，得到输出结果，可以形式化表示如下：

Attention(Q,K,V)＝softmax(QK^T)V#(4)

由于Q、K、V均由输入X线性变换而来，因此自注意力机制的目的可以理解为对内部元素之间的关联度进行捕捉，由于此处的X表示一个交互式场景下的微博向量矩阵，那么对其进行自注意力操作的物理意义相当于计算各微博与其他所有微博之间不同程度的关联关系，根据关联度对上下文进行汇总，从而输出各微博的上下文表示，并且由于每条微博的向量表示x_i又由情感偏移特征m_i和语义特征h_i融合而来，那么此步骤的作用即考虑情感偏移，显式地建模语境中各语句之间的情感影响关系，并将重点放在关联性更强的语句上。对于微博i而言，设在经过上述自注意力计算之后，输出为x′_i。

所述步骤7)中根据步骤6)所得的上下文表示x′_i，再与步骤4)所得的基本语义特征h_i进行拼接，得到在交互式语境下当前微博文本的最终情感特征n_i，并输入多层感知机进行分类。将W_f和b_f作为权值矩阵和偏置，使用Sigmoid函数将n_i映射至多层感知机隐藏层，再通过W_M和b_M及Softmax函数进行归一化得到微博i属于在不同情感极性分类标签下概率的向量

所述步骤8)中引入多任务学习范式，其中步骤5)可看作用户情感偏移感知的辅助任务，计算交叉熵损失函数：

其中步骤7)可看作微博文本情感识别的主任务，计算交叉熵损失函数：

使两者共享隐层参数共同学习，从而完成微博文本情感识别模型的构建，总损失函数为：

L＝L₁+L₂#(8)

最后通过采用梯度下降法训练学习得到模型参数。

所述步骤9)中将待推断文本情感的任意样本输入步骤8)所得模型，最终输出各情感极性类别下的概率值，概率值最大的类别就是推断所得的微博文本情感。

本发明的有益效果为：本发明利用社交网络中交互式语境特点，基于句子对分类建模方法对微博用户在时序上相邻的微博文本对进行情感偏移感知，有效捕捉情感动态变化过程；将情感偏移特征融入情感识别过程，基于情感关联增强的注意力机制提取关键语境影响因素，有效进行情感溯因，提高微博文本情感识别准确率；引入多任务学习的学习范式，采用隐层参数硬共享的方式在主任务和辅助任务之间达到知识共享的目的，促进彼此的学习，从而引导模型识别情感动态变化的模式，提高模型的泛化性。具体地讲，本发明具有如下优点：

1、利用社交网络中交互式语境特点，基于句子对分类建模方法对微博用户在时序上相邻的微博文本对进行情感偏移感知，有效捕捉情感动态变化过程；

2、将情感偏移特征融入情感识别过程，为模型提供显式且精确的情感影响关系线索，基于情感关联增强的Attention机制提取关键语境影响因素，有效进行情感溯因，提高微博文本情感识别准确率；

3、引入多任务学习的学习范式，采用隐层参数硬共享的方式在主任务和辅助任务之间达到知识共享的目的，促进彼此的学习，从而引导模型识别情感动态变化的模式，提高模型的泛化性。

附图说明

图1为本发明的整体系统框架图。

具体实施方式

下面结合具体实施例，进一步阐明本发明，应理解这些实施例仅用于说明本发明而不用于限制本发明的范围，在阅读了本发明之后，本领域技术人员对本发明的各种等同变换均落于本申请所附权利要求所限定的范围。

实施例1：参见图1所示，本发明所述的一种社交网络中基于情感偏移感知的交互式微博文本情感挖掘方法，包括如下步骤：

步骤1：数据集中对微博文本情感极性标注的具体方法为：综合考虑社交网络中单条微博文本以及其交互历史的上下文语义信息，人工标注每条微博的情感极性。

步骤2：由于目前能够获取到的微博情感数据集的数据量有限，而自然语言处理领域流行的预训练语言模型BERT已通过海量语料训练出了提取句子通用语义表征的方式，因此利用BERT提取单条微博的通用语义表征，并且针对本情感分析任务，以Fine-tuning微调的方式使该部分在通用语义表征的基础上更加关注情感语义信息。具体而言，对于某一交互式场景下包含的第i条微博，首先按照BERT的标准预处理方法对该条微博文本进行分词并映射成Token Embeddings，输入经过预训练参数初始化的BERT模型，经过层层编码，使用最终输出的[CLS]对应位的隐含表示作为微博i的基本语义表征t_i。

步骤3：考虑到社交网络中的单条微博文本，其历史语境是由一系列时序上连续、语义上连贯的语句所构成的语言整体，而循环神经网络作为一种建模数据之间顺序关系的标准方法被广泛用于捕捉语言序列的上下文特征，因此基于循环神经网络的某变体，长短期记忆网络LSTM，提取语境级的微博情感语义特征。

步骤4：将步骤2)、步骤3)得到的特征拼接为特征向量，以表示微博的基本语义特征

步骤5：将情感偏移感知抽象为句子对分类问题，并使用多层感知机进行建模，多层感知机由输入层、隐藏层和输出层依次组成，每层之间又由线性映射操作和非线性的激活函数连接，具体而言，将步骤4)所得的当前微博i语义特征

及用户在时间维度上相邻的第k条微博的语义特征

进行向量拼接操作，得到

作为多层感知机的输入层；然后通过参数矩阵

和偏置向量

类似地，利用参数矩阵

和偏置向量

再次从隐藏层映射至输出层，即情感偏移标签空间

m_i＝W₂tanh(W₁[h_k,h_i]+b₁)+b₂#(1)

从而完成情感偏移感知任务的建模。

步骤6：步骤5)中得到的情感偏移特征m_i是已经映射到偏移标签空间的向量，并且其下一步骤就是通过Softmax函数归一化得到各标签下概率向量，因此特征m_i可以看作是情感偏移感知任务结果的估计值。此时情感偏移程度可以看作一个已知量，那么在已知各语句与上句相比是否会发生情感变化的基础上再从语境中进一步提取信息，能够更有针对性地挖掘出交互式语境中相关情感影响因素。

具体而言，为了将情感偏移特征m_i，与步骤3)所得的基本情感语义特征h_i进行融合，首先将两者拼接为

再利用参数矩阵

和偏置向量

计算过程如下：

x_i＝tanh(W₃[m_i,h_i]+b₃)#(3)

)，键(Key，

)和值(Value，

Attention(Q,K,V)＝softmax(QK^T)V#(4)

步骤7：根据步骤6)所得的上下文表示x′_i，再与步骤4)所得的基本语义特征h_i进行拼接，得到在交互式语境下当前微博文本的最终情感特征n_i，并输入多层感知机进行分类。将W_f和b_f作为权值矩阵和偏置，使用Sigmoid函数将n_i映射至多层感知机隐藏层，再通过W_M和b_M及Softmax函数进行归一化得到微博i属于在不同情感极性分类标签下概率的向量

步骤8：引入多任务学习范式，其中步骤5)可看作用户情感偏移感知的辅助任务，计算交叉熵损失函数：

L＝L₁+L₂#(8)

最后通过采用梯度下降法训练学习得到模型参数。

步骤9：将待推断文本情感的任意样本输入步骤8)所得模型，最终输出各情感极性类别下的概率值，概率值最大的类别就是推断所得的微博文本情感。

需要说明的是上述实施例仅仅是本发明的较佳实施例，并没有用来限定本发明的保护范围，在上述技术方案的基础上做出的等同替换或者替代，均属于本发明的保护范围。

Claims

1.一种社交网络中基于情感偏移感知的交互式微博文本情感挖掘方法，其特征在于，所述方法包括如下步骤：

步骤1)根据社交网络中单条微博文本以及其交互历史的上下文语义信息，标注微博文本的情感极性，并划分训练集、验证集与测试集；

步骤5)针对情感偏移进行分析，要感知微博用户在时间维度上相邻文本之间所体现出的情感偏移，可抽象为句子对分类建模问题，因此将步骤4)所得的微博基本情感语义特征输入多层感知机，映射至情感偏移标签空间，进行参数学习，同时得到用户情感偏移特征；

步骤6)针对情感影响关系进行分析，由于情感偏移能够为各条微博之间的情感交互关系提供显式且精确的线索，并且步骤5)中得到的情感偏移特征可以看作是情感偏移感知任务结果的估计值，此时情感偏移程度可以看作一个已知量，那么在已知各微博与上句相比是否会发生情感变化的基础上再从语境中进一步提取信息，能够更有针对性地挖掘出交互式语境中相关情感影响因素，由此可将步骤5)所得的情感偏移特征与步骤4)所得的基本情感语义特征进行融合，设计情感关联关系增强的语境级Attention机制，进一步从交互历史中提取出与当前微博相关的情感影响因素；

步骤7)根据步骤6)所得的情感影响因素，再与步骤4)所得的基本情感语义特征融合，得到在交互式语境下当前微博文本的最终情感特征，并输入多层感知机，映射至微博情感极性标签空间，进行参数学习；

步骤9)将待推断文本情感的新样本输入步骤8)所得模型，最终输出各情感极性类别下的概率值，概率值最大的类别就是推断所得的微博文本情感。

2.根据权利要求1所述的一种社交网络中基于情感偏移感知的交互式微博文本情感挖掘方法，其特征在于，所述步骤1)的数据集中对微博文本情感极性标注的具体方法为：综合考虑社交网络中单条微博文本以及其交互历史的上下文语义信息，人工标注每条微博的情感极性。

3.跟据权利要求1所述的一种社交网络中基于情感偏移感知的交互式微博文本情感挖掘方法，其特征在于，所述步骤2)中由于目前能够获取到的微博情感数据集的数据量有限，而自然语言处理领域流行的预训练语言模型BERT已通过海量语料训练出了提取句子通用语义表征的方式，利用BERT提取单条微博的通用语义表征，并且针对本情感分析任务，以Fine-tuning微调的方式使该部分在通用语义表征的基础上更加关注情感语义信息，具体而言，对于某一交互式场景下包含的第i条微博，首先按照BERT的标准预处理方法对该条微博文本进行分词并映射成Token Embeddings，输入经过预训练参数初始化的BERT模型，经过层层编码，使用最终输出的[CLS]对应位的隐含表示作为微博i的基本语义表征t_i。

4.跟据权利要求1所述的一种社交网络中基于情感偏移感知的交互式微博文本情感挖掘方法，其特征在于，所述步骤3)中考虑到社交网络中的单条微博文本，其历史语境是由一系列时序上连续、语义上连贯的语句所构成的语言整体，而循环神经网络作为一种建模数据之间顺序关系的标准方法被广泛用于捕捉语言序列的上下文特征，因此基于循环神经网络的某变体，长短期记忆网络LSTM，提取语境级的微博情感语义特征。

5.根据权利要求1所述的一种社交网络中基于情感偏移感知的交互式微博文本情感挖掘方法，其特征在于，所述步骤4)中将步骤2)、步骤3)得到的特征拼接为特征向量，以表示微博的基本语义特征

6.根据权利要求5所述的一种社交网络中基于情感偏移感知的交互式微博文本情感挖掘方法，其特征在于，所述步骤5)中将情感偏移感知抽象为句子对分类问题，并使用多层感知机进行建模，多层感知机由输入层、隐藏层和输出层依次组成，每层之间又由线性映射操作和非线性的激活函数连接，具体而言，将步骤4)所得的当前微博i语义特征

及用户在时间维度上相邻的第k条微博的语义特征

进行向量拼接操作，得到

作为多层感知机的输入层；然后通过参数矩阵

和偏置向量

类似地，利用参数矩阵

和偏置向量

再次从隐藏层映射至输出层，即情感偏移标签空间

m_i＝W₂tanh(W₁[h_k，h_i]+b₁)+b₂#(1)

从而完成情感偏移感知任务的建模；

7.根据权利要求1所述的一种社交网络中基于情感偏移感知的交互式微博文本情感挖掘方法，其特征在于，所述步骤6)中，由于得到的情感偏移特征m_i是已经映射到偏移标签空间的向量，并且其下一步骤就是通过Softmax函数归一化得到各标签下概率向量，因此特征m_i可以看作是情感偏移感知任务结果的估计值，此时情感偏移程度可以看作一个已知量，那么在已知各微博与上句相比是否会发生情感变化的基础上再从语境中进一步提取信息，能够更有针对性地挖掘出交互式语境中相关情感影响因素；

具体而言，为了将所述步骤5)所得的情感偏移特征m_i，与步骤4)所得的基本语义特征h_i进行融合，首先将两者拼接为

再利用参数矩阵

和偏置向量

计算过程如下：

x_i＝tanh(W₃[m_i，h_i]+b₃)#(3)

)，键(Key，

)和值(Value，

Attention(Q，K，V)＝softmax(QK^T)V#(4)

由于Q、K、V均由输入X线性变换而来，因此自注意力机制的目的可以理解为对内部元素之间的关联度进行捕捉，由于此处的X表示一个交互式场景下的微博向量矩阵，那么对其进行自注意力操作的物理意义相当于计算各微博与其他所有微博之间不同程度的关联关系，根据关联度对上下文进行汇总，从而输出各微博的上下文表示，并且由于每条微博的向量表示x_i又由情感偏移特征m_i和语义特征h_i融合而来，那么此步骤的作用即考虑情感偏移，显式地建模语境中各语句之间的情感影响关系，并将重点放在关联性更强的语句上，对于微博i而言，设在经过上述自注意力计算之后，输出为x′_i。

8.根据权利要求1所述的一种社交网络中基于情感偏移感知的交互式微博文本情感挖掘方法，其特征在于，所述步骤7)中，根据步骤6)所得的上下文表示x′_i，再与步骤4)所得的基本语义特征h_i进行拼接，得到在交互式语境下当前微博文本的最终情感特征n_i，并输入多层感知机进行分类，将W_f和b_f作为权值矩阵和偏置，使用Sigmoid函数将n_i映射至多层感知机隐藏层，再通过W_M和b_M及Softmax函数进行归一化得到微博i属于在不同情感极性分类标签下概率的向量

9.根据权利要求1所述的一种社交网络中基于情感偏移感知的交互式微博文本情感挖掘方法，其特征在于，所述步骤8)中引入多任务学习范式，其中步骤5)可看作用户情感偏移感知的辅助任务，计算交叉熵损失函数：

L＝L₁+L₂#(8)

最后通过采用梯度下降法训练学习得到模型参数。

10.根据权利要求1所述的一种社交网络中基于情感偏移感知的交互式微博文本情感挖掘方法，其特征在于，所述步骤9)中将待推断文本情感的任意样本输入步骤8)所得模型，最终输出各情感极性类别下的概率值，概率值最大的类别就是推断所得的微博文本情感。