CN113688204B

CN113688204B - 一种利用相似场景及混合注意力的多人会话情感预测方法

Info

Publication number: CN113688204B
Application number: CN202110936166.4A
Authority: CN
Inventors: 荣欢; 曹新宇
Original assignee: Nanjing University of Information Science and Technology
Current assignee: Nanjing University of Information Science and Technology
Priority date: 2021-08-16
Filing date: 2021-08-16
Publication date: 2023-04-25
Anticipated expiration: 2041-08-16
Also published as: CN113688204A

Abstract

本发明公开了一种利用相似场景及混合注意力的多人会话情感预测方法，属于文本情感预测。本发明首先从原始文本序列获得文本情感空间映射，接着使用揭示周期性和相似规律的相似场景搜索方法，通过输入序列找到与当前场景相对应的注意力序列；采用基于长短期记忆神经网络的双阶段编码‑解码结构，预测目标人物未来文本情感向量，进一步可得到未来目标人物待发布文本情感，并通过损失函数求得编码阶段和解码阶段的总损失。本发明采用文本情感空间映射和相似场景搜索方法对多人会话情感进行预测，结合相似场景搜索和混合注意力提取，通过学习有效的历史数据，可用于长期预测，并且能够加强模型学习的精确性和针对性，极大程度地提升了预测精度。

Description

一种利用相似场景及混合注意力的多人会话情感预测方法

技术领域

本发明属于文本情感预测，更具体地说，涉及一种利用相似场景及混合注意力的多人会话情感预测方法。

背景技术

互联网时代，各类社交通信软件繁多，人们利用文字进行信息互换，形成的文本往往反映了文本发布者的情感态度，这些信息都潜藏着一定社会效益和经济效益。如果能够有效预测文本发布者未来发布的情感态度，对于政府来说，可以及时了解民意导向并为下一步战略实施作出调整；对于企业来说，可以及时了解市场倾向并为新产品的投放奠定良好基础，提升经济收益。因此，针对文本类型数据，本文将研究文本情感预测问题，同时由于人们发布的文本通常以时间序列M形式出现，因此本文还将研究时间序列M预测问题。

目前，大部分文本情感预测问题基于分类思想，通过大量标注文本训练情感分类器，由训练器预测新文本情感。对于深度学习方法而言，含有记忆单元的深度神经网络被广泛应用于文本情感分类中，例如循环神经网络RNN，长短期记忆网络LSTM和双向长短期记忆网络Bi-LSTM；除此以外，卷积神经网络也被用于文本情感预测。

分类号：TP391的论文《联系人中心聊天话语中的细粒度情感检测》使用CNN从给定文本中抽取情感特征，从而对文本做情感表示，分类号：TP391的论文《文本情感：基于文本情感预测的机器学习》利用有监督机器学习模型对童话故事进行情感分类。这两种方法无法在多人会话场景下捕捉其他参与者对目标人物的情感刺激。

在真实场景中，按时间顺序发布的文本可抽象成时间序列，因此可以借鉴时间序列预测方法。具体而言包括：分类号为TP391的论文《基于混合神经网络和注意力机制的混沌时间序列预测》，它对时间序列进行重构相空间，利用CNN提取空间特征后再用LSTM提取时空特征，能够得到更完整的特征表示，存在注意力感知缺失，相似场景粒度分析不到位等问题；分类号为TP391的论文《基于深度学习模型DeepAR》，通过训练历史数据学习到一个网络参数，再利用该参数进行预测，存在对时间序列有效历史信息的学习效果差，错误传播的影响大的问题。

基于上述工作，可以发现仍存在以下不足：在现实生活中，通过训练分类器预测文本情感，通常是借鉴时间序列预测的思想，将文本以时间序列形式组装，通过已知时刻已发布文本情感来推测下一时刻待发布文本情感类别。但是从时间序列预测的角度来看，现有工作仍无法应对。例如在现实生活中多人会话情景下，无法捕捉其他参与者对目标人物的情感刺激，以及对于时间序列有效历史信息的学习效果差，相似场景粒度分析不到位，注意力感知缺失以及错误传播的影响大等。

发明内容

针对现有的文本情感预测方法无法基于时间序列预测的思想采用训练分类器进行预测，并且在多人会话情景下无法捕捉其他参与者对目标人物的情感刺激的问题，本发明提供一种利用相似场景及混合注意力的多人会话情感预测方法，采用文本情感空间映射和相似场景搜索方法对多人会话情感进行预测，能够加强模型学习的精确性和针对性，极大程度地提升了预测精度，减小误差。

为解决上述问题，本发明采用如下的技术方案。

一种利用相似场景及混合注意力的多人会话情感预测方法，包括如下步骤：

步骤一、建立情感序列：对原始文本序列D进行情感空间映射，即对原始文本序列标注情感类别并将原始文本序列D表示成n维情感向量序列D′，从情感向量序列D′中抽取其他参与者情感向量与目标人物情感向量组成时间序列M＝{{Others_ASMs_1，Target_ASM_1}，{Others_ASMs_2，Target_ASM_2}，……，{Others_ASMs_T_h，Target_ASM_T_h}}，时间序列M的长度为T_h，其中，Others_ASMs表示其他参与者情感向量，Target_ASM表示目标人物情感向量；

步骤二、选取输入序列并构建当前场景：根据步骤一中长度为T_h的时间序列M，从中选取一组长度为h的序列作为输入序列X_h，X_h＝{x_i,x_i+1,……,x_i-1+h}，其中，x_i∈M，i≤h；设定预测空间长度T_f，在长度T_f内定义一组长度为f的序列Y_f＝{y_i+h,y_i+h+1,……,y_i+h-1+f,}序列Y_f用于记录输入序列X_h的预测结果，即序列Y_f为待预测序列，即y_i+h是根据输入序列X_h预测得到的首个元素；其中，

由输入序列X_h和待预测序列Y_f组成当前场景s_p＝{X_h,Y_f}；

步骤三、建立相似场景：先设定一个容量为Top-K的候选池，并根据当前场景s_p下的输入序列X_h以及预测长度T_f，从时间序列M中搜索Top-K组和当前场景s_p有相似趋势和变化规律的序列，即相似场景s₁，根据相似场景s₁计算得到注意力序列A；

步骤四、求得编码损失：采用基于长短期记忆神经网络的双阶段编码-译码结构，在编码第一阶段，将输入序列X_h作为编码器第一阶段的输入，并通过神经网络中的损失函数进行模型训练，求得编码第一阶段的损失l₁；

步骤五、计算混合注意力：先计算解码第一阶段的原始状态，原始状态为神经网络中的隐藏层状态；

在编码第二阶段，对步骤三中得到的注意力序列A进行注意力编码，将注意力序列A作为编码器第二阶段输入，再结合原始状态计算混合注意力；

步骤六、求得第二阶段解码损失：在解码第二阶段，利用步骤五中的混合注意力和原始状态进行情感预测，求得目标人物情感序列预测值，从而得到目标人物待发布文本情感；并通过神经网络中的损失函数进行模型训练，求得第二阶段的解码损失l₂；

步骤七、计算总损失：将编码第一阶段的损失l₁和第二阶段的解码损失l₂相加计算总损失l，l＝l₁+l₂，训练模型，验证并测试模型泛化性。

进一步的，步骤三中，所述相似场景s₁＝{X′_n,Y′_m}，其中，

X′_n＝{x′_i,x′_i+1,……,x′_i+n-1}；

Y′_m＝{y′_i+h,y′_i+h+1,……,y′_i+h-1}；

X′_n≈X_h；X′_n≈X_h表示X′_n和X_h在数据表现形式上相似；

将Top-K组相似场景s₁中Y′_m部分加权平均得到注意力序列A＝{a₁,a₂,……,a_t,t∈T_f}。

进一步的，相似场景s₁搜索方法是先通过寻找与当前场景s_p下输入序列近似的序列，来找到完整的相似场景s₁；具体包括：

B1：使用时间最近邻通道搜索方法，设当前时刻t，并根据预测长度T_f确定前向搜索长度L，在t-L～t之间按照X′_n≈X_h寻找一个与X_h最相似的序列X′_n作为相似场景s₁组成候选放入候选池，当候选池含有Top-K个候选时，停止搜索；当候选池不足Top-K个候选时，执行步骤B2；

B2：使用周期通道搜索，检索时间序列M中的重要时刻数据点，按照X′_n≈X_h寻找一个与X_h最相似的序列X′_n作为相似场景s₁组成候选放入候选池，当候选池含有Top-K个候选时，停止搜索；当候选池不足Top-K个候选时，执行步骤B3；

B3：使用周期偏移搜索，通过结合时间最近邻搜索和周期通道搜索，检索时间序列M中的重要时刻数据点，并以L/8为前向和后向搜索长度，按照X′_n≈X_h寻找一个与X_h最相似的序列X′_n作为相似场景s₁组成候选放入候选池，当候选池含有Top-K个候选时，停止搜索；当候选池不足Top-K个候选时，返回执行步骤B1，直至搜索得到Top-K个相似场景s₁；

其中，重要时刻的数据点为在历史时刻与当前时刻表现相似的数据点，或根据时间序列M固有的周期性定位一周前或一个月前或一年前的数据点。

进一步的，步骤四中，利用公式

更新输入状态，t∈T_h，得到输入状态序列

进一步的，步骤五中，原始状态的计算公式为：

其中，y₀为已知值；将注意力序列A作为编码器第二阶段的输入，利用公式

更新注意力状态，t∈T_f，得到注意力状态序列

利用公式计算时间对齐注意力l_t＝σ(W_aa_t+b_t)，其中，σ表示sigmoid函数，W_a表示权重矩阵，b_t表示偏差；

时间序列M中的任意一个元素与其周围分布的多个元素存在的联系，即为该元素的上下文信息，β表示吸收上下文信息的程度，

其中W_H和W_s ^β分别对应H^a和

的权重矩阵，b_β表示偏差；

利用公式计算基于上下文的注意力c_t，

其中tanh表示激活函数；

g表示在t时刻吸收两种注意力的程度，

其中W_h和W_s ^g分别对应

和

的权重矩阵，b_g表示偏差；

利用公式计算混合注意力

进一步的，步骤六中，目标人物情感序列预测值

其中，W_s ^y和W_s ^a表示权重矩阵，b_y表示误差。

相比于现有技术，本发明的有益效果为：

(1)本发明的一种利用相似场景及混合注意力的多人会话情感预测方法，该方法中文本情感映射克服了需要在已知文本内容前提下进行情感预测的限制，并且能够捕获到其他参与者对目标人物的情感刺激。

(2)本发明的一种利用相似场景及混合注意力的多人会话情感预测方法，相似场景搜索方法从时间序列M中学习有效历史信息，极大程度地提升了预测精度。同时采用由时间对齐注意力和基于上下文的注意力组成的混合注意力，能够更好地适应时间序列M时序特征，最大限度地捕获和保持需要被关注的信息，并确保注意力权重分布在期望区域，有利于网络收敛。

(3)本发明的一种利用相似场景及混合注意力的多人会话情感预测方法，采用双阶段的处理能够加强模型学习的精确性和针对性，减小误差。

附图说明

图1为本发明的整体流程框图；

图2为本发明的文本情感空间映射的流程框图；

图3为本发明的相似场景搜索方法的流程框图；

图4为本发明的重要时刻的数据点搜索的流程图；

图5为本发明的神经网络编码器和解码器的工作流程图。

具体实施方式

下面结合具体实施例和附图对本发明进一步进行描述。

实施例1

一种利用相似场景及混合注意力的多人会话情感预测方法，如图1所示，本方法包括如下步骤：

步骤一、对给定的文本进行情感空间映射(Affective Space Mapping，ASM)，将每段文本用多维情感向量来表示，并将表示目标人物所发布文本的情感向量序列(Target_ASM)和其他参与者所发布文本的情感向量序列(Others_ASMs)组成情感序列M＝{{Others_ASMs_1，Target_ASM_1}，{Others_ASMs_2，Target_ASM_2}，……，{Others_ASMs_T_h，Target_ASM_T_h}}，情感序列M的长度为T_h，得到预处理后的数据集。

步骤二、在长度为T_h的时间序列M中选取一组长度为h的序列作为输入序列X_h，X_h＝{x_i,x_i+1,……,x_i-1+h}，其中，x_i∈M，i≤h；设定预测空间长度T_f，在长度T_f内定义一组长度为f的序列Y_f＝{y_i+h,y_i+h+1,……,y_i+h-1+f,}来承接针对输入序列X_h的预测结果，即序列Y_f为待预测序列，其中待预测序列Y_f内第一个元素y_i+h是输入序列X_h内最后一个元素x_i-1+h的后继元素，即y_i+h是根据输入序列X_h预测得到的首个元素；其中，

y_i+h＝{Others_ASMs_i+h，Target_ASM_i+h}，由输入序列X_h和待预测序列Y_f组成当前场景s_p＝{X_h，Y_f}。

步骤三、先设定一个容量为Top-K的候选池，并根据当前场景s_p下的输入序列X_h以及预测长度T_f，通过揭示周期性和相似规律的相似场景搜索方法，从时间序列M中搜索Top-K组和当前场景s_p有相似趋势和变化规律的序列，即相似场景s₁，s₁＝{X′_n，Y′_m}，当X′_n与X_h相似时，学习相似场景s_l的特征用于预测将是有意义的；将Top-K组相似场景s₁中Y′_m部分加权平均得到注意力序列A＝{a₁，a₂，……，a_t，t∈T_f}。其中，

X′_n＝{x′_i，x′_i′₊₁，……，x′_i+n-1}；

Y′_m＝{y′_i+h，y′_i+h+1，……，y′_i+h-1}；

X′_n≈X_h。

步骤四、如图5所示，采用基于长短期记忆神经网络的双阶段编码-译码结构，将输入序列X_h和注意力序列A分离。在编码第一阶段，将输入序列X_h作为编码器第一阶段的输入，利用公式

更新输入状态，t∈T_h，并通过神经网络中的损失函数进行模型训练，求得编码第一阶段的损失l₁，得到输入状态序列

步骤五、如图5所示，计算混合注意力

在解码第一阶段，根据计算公式，

求得原始状态，原始状态即为神经网络的隐藏层状态，其中t＝1时，y₀是预先设定的值。

在编码第二阶段，对注意力序列A进行注意力编码，将注意力序列A作为编码器第二阶段输入，利用公式

更新注意力状态，t∈T_f，得到注意力状态序列

利用公式计算时间对齐注意力l_t＝σ(W_aa_t+b_t)，时间对齐注意力为在不同历史时期，相同位置的元素可能存在直接联系，从而可以获取相似场景s₁和当前场景s_p在相同位置数据的联系，预测周期规律，其中，σ表示sigmoid函数，W_a表示权重矩阵，b_t表示偏差；

时间序列M中的任意一个元素与其周围分布的多个元素存在的联系，即为该元素的上下文信息，β表示吸收上下文信息的程度，利用公式计算

其中W_H和W_s ^β分别对应H^a和

的权重矩阵，b_β表示偏差；

利用公式计算基于上下文的注意力c_t，

tanh为激活函数，由此获得每个数据点在相似场景s₁中的自相关性，用于趋势预测；

接着通过门控结构，利用公式计算

g表示在t时刻吸收两种注意力的程度，其中W_h和W_s ^g分别对应

和

的权重矩阵，b_g表示偏差；

利用公式计算混合注意力

由此最大限度地捕获需要被关注的信息，并确保注意力权重分布在期望的区域。其中，偏差b_t、偏差b_β和偏差b_g取值可以相同。

步骤六、如图5所示，在解码第二阶段，利用公式

进行情感预测，求得目标人物情感序列预测值y_t，其中，混合注意力

通过修正模型预测值，减少误差对预测值的影响，W_s ^y和W_s ^a表示权重矩阵，b_y表示误差。在得到预测值后即得到目标人物待发布文本情感，并通过神经网络中的损失函数进行模型训练，在编码第二阶段求得解码第二阶段的损失l₂。其中，情感预测是通过提取多人会话情景下时间序列M的长期趋势、周期性等有效信息来对目标人物未来待发布文本进行情感预测。

步骤七、将编码第一阶段的损失l₁和解码第二阶段的损失l₂相加计算总损失l，l＝l₁+l₂，训练模型，验证并测试模型泛化性。

如图2所示，文本情感空间映射流程图如下：

A1：对原始文本序列D＝{d₁，d₂，……，d_i}；进行形如[Target_Flag，Emotion_Index]的情感类别标注，其中，Target_Flag表示当前发布文本是否由预测目标发布，Emotion_Index表示当前文本所属情感类别序号，进一步可以获得原始文本序列D的情感类别序列。

A2：根据情感类别序列计算原始文本序列D上的全局情感交互模式EIP，全局情感交互模式EIP是一个n维方正，包含了整个原始文本序列D在每个情感类别上的n维向量表示，将原始文本序列D的情感类别序列以连续的方式表示，其中，先初始化全局交互词典，设定大小为2，步长为1的时间窗口观察相邻两时刻文本情感变化，遍历情感类别序列并更新全局交互词典，获取原始文本序列D上的全局情感交互模式EIP，全局情感交互模式EIP下标最大值即代表对应情感类别。

A3：将原始文本序列D中每条文本表示为n维情感向量，首先对文本分词，将词向量维度固定为256，利用Skip-2-gram以增量方式逐步预训练原始文本序列D中每个词语的词向量，将原始文本序列D中每条文本用预训练词向量均值表示，训练Bi-LSTM作为n类情感分类器，再次计算每条文本在n类情感上的logits，并用softmax对n维logits标准化，标准化后的n维logits即为每条文本的n维情感向量D′＝{E₁，E₂，……，E_i，E_i＝(e₁，e₂，……，e_n)∈Rⁿ,e_n∈R}，其中，e_n代表情感，E_i表示n维情感向量序列。

A4：根据预先标注的Target_Flag分别从情感向量序列D′中抽取目标人物情感向量Target_ASM和其他参与者情感向量Others_ASMs，组成时间序列M＝{{Others_ASMs_1，Target_ASM_1}，{Others_ASMs_2，Target_ASM_2}，……，{Others_ASMs_T_h，Target_ASM_T_h}}，时间序列M的长度为T_h。

如图3和图4所示，相似场景搜索方法流程图如下：

本发明首先从原始文本序列D获得文本情感空间映射，即对文本标注情感类别并将文本表示成多维情感向量D′，从中抽取其他参与者的情感向量(Others_ASMs)与目标人物的情感向量(Target_ASM)组成情感序列M；接着使用揭示周期性和相似规律的相似场景搜索方法，通过选定一组输入序列X_h，找到一组与当前场景相对应的注意力序列A；采用基于长短期记忆神经网络的双阶段编码-解码结构，在编码第一阶段，输入序列X_h通过损失函数进行模型训练，并求损失l₁；在编码第二阶段借用注意力机制，从相似场景的注意力序列A中提取时间对齐注意力l_t和基于上下文的注意力c_t，并通过门控结构组成混合注意力

在解码部分通过原始状态

和混合注意力状态

预测目标人物未来文本情感向量，进一步可得到未来目标人物待发布文本情感，并通过损失函数进行模型训练，求总的损失。本发明结合相似场景搜索和混合注意力提取，通过学习有效的历史数据，可用于长期预测，并且具有较高预测精度。

本发明所述实例仅仅是对本发明的优选实施方式进行描述，并非对本发明构思和范围进行限定，在不脱离本发明设计思想的前提下，本领域工程技术人员对本发明的技术方案作出的各种变形和改进，均应落入本发明的保护范围。