CN113988048A

CN113988048A - 基于多轮机器阅读理解的情感原因对抽取方法

Info

Publication number: CN113988048A
Application number: CN202111192610.2A
Authority: CN
Inventors: 宋丹丹; 周长智
Original assignee: Beijing Institute of Technology BIT
Current assignee: Beijing Institute of Technology BIT
Priority date: 2021-10-13
Filing date: 2021-10-13
Publication date: 2022-01-28

Abstract

本发明公开的基于多轮机器阅读理解的情感原因对抽取方法，属于自然语言处理与机器学习领域。本发明利用多轮结构将情感原因对抽取任务分解，通过在子句层面而非子句对层面上处理情感原因对抽取任务，缓解子句对层面的标签稀疏性问题，提高对文档情感原因对抽取的效率；此外，利用机器阅读理解方法中的问题设计以及问题和子句之间的交互，充分建立情感子句和原因子句之间的关系，利用所述建立的关系能够抽取各种复杂关系下的情感原因对，适用性更广；基于带有反思机制的多轮机器阅读理解方法对抽取的候选文档情感原因对验证，利用显式的原因语义信息提高情感原因对抽取任务的F1值。本发明应用于自然语言处理与机器学习领域，解决相关技术问题。

Description

基于多轮机器阅读理解的情感原因对抽取方法

技术领域

本发明涉及基于多轮机器阅读理解的情感原因对抽取方法，属于自然语言处理与机器学习领域。

背景技术

情感原因对抽取ECPE任务是近几年非常流行的情感分析领域的细粒度任务，它旨在从一篇文档中抽取出所有的情感原因对，每个情感原因对都由一个情感子句和对应的一个原因子句组成。

针对ECPE任务，主流的解决方法是使用端到端的深度学习模型在子句对层面进行建模抽取。首先将一个文档中的所有子句排列组合成子句对矩阵，然后判断这些对是否是正确的情感原因对。若一个文档有N个句子，则组成N²个子句对，其中只有若干个是情感原因对(大部分文档不会超过3个情感原因对)。因此该方法存在着严重的标签稀疏性问题，N越大，标签稀疏性问题越严重。

还有一种解决方法是端到端的序列标注方法。该方法通过设计联合的序列标注模式，从子句层面进行建模预测。因为不会产生子句对矩阵，所以没有上述的标签稀疏性问题。然而，由于情感子句与原因子句之间存在一对一、一对多、多对一等的复杂关系，且情感子句和对应的原因子句在一个文档中可能距离较远，联合序列标注模式无法构建这些复杂的对应关系，因此效果不够理想。

综上所述，现有的解决ECPE任务的方法主要存在以下问题：(1)标签稀疏性；(2)无法构建情感和原因的复杂关系。

发明内容

本发明公开的基于多轮机器阅读理解的情感原因对抽取方法要解决的技术问题是：基于多轮机器阅读理解方法实现对文档情感原因对抽取，利用多轮结构将情感原因对抽取任务分解，通过在子句层面而非子句对层面上处理情感原因对抽取任务，缓解子句对层面的标签稀疏性问题，提高对文档情感原因对抽取的效率；此外，利用机器阅读理解方法中的问题设计以及问题和子句之间的交互，充分建立情感子句和原因子句之间的关系，利用所述建立的情感和原因之间的关系能够抽取各种复杂关系下的情感原因对，适用性更广；基于带有反思机制的多轮机器阅读理解方法对抽取的候选文档情感原因对进行验证，利用显式的原因语义信息进一步提高情感原因对抽取任务的F1值。本发明应用于自然语言处理与机器学习领域，解决相关技术问题。

所述各种复杂关系包括情感子句与原因子句一对一、一对多和多对一关系以及情感子句和原因子句距离较远的情况。

本发明的目的是通过如下技术方案实现的。

本发明公开的基于多轮机器阅读理解的情感原因对抽取方法，包括如下步骤：

步骤一、基于多轮机器阅读理解方法实现对文档情感原因对抽取，利用多轮结构将情感原因对抽取任务分解，在子句层面上构建问题和子句之间的交互，充分利用显式的情感和原因语义信息，通过在子句层面上处理情感原因对抽取任务，缓解子句对层面的标签稀疏性问题，提高对文档情感原因对抽取的效率，并输出初步抽取的文档情感原因对和对应的文档情感原因对的概率。

所述对应的文档情感原因对概率指该子句对是正确的情感原因对的概率，通常为对中第一个子句是情感子句的概率与第二个子句是第一个子句对应的原因子句的概率之积。

步骤1.1：基于多轮机器阅读理解方法实现对文档情感原因对抽取，利用多轮结构将情感原因对抽取任务分解为静态情感抽取任务和动态原因抽取任务。

所述静态情感抽取任务指抽取出文档中所有的情感子句，动态原因抽取任务指在静态情感抽取任务的结果基础上，在显式情感语义信息的帮助下，抽取每个情感子句对应的原因子句。

步骤1.2：静态情感抽取任务。设计静态情感问题，对文档子句编码，根据文档子句对应编码进行预测从而抽取情感子句。所述文档子句编码实现方法如下：利用预训练模型BERT对静态情感问题和文档子句进行词级别编码，得到情感问题和每个子句中每个词的词向量；利用自注意力机制聚合词向量进行句级别编码，得到情感问题和每个子句的句向量；利用图注意力网络建模文档级关系，更新子句的句向量；通过将情感问题的句向量和每个子句的句向量进行拼接再次更新子句的句向量，实现问题和子句之间的交互，使子句的句向量带有情感语义信息，即实现对文档子句编码。编码后通过一个线性分类器对子句编码进行预测，抽取情感子句，计算静态情感抽取任务损失。

所述静态情感问题指事先设计好的一个用于静态情感抽取任务的问句。

步骤1.2所述文档子句编码具体实现方法如下：

构造预训练模型BERT输入：

该输入共包含两个特殊标记[CLS]和[SEP]，还有1个问题和N个子句。

表示静态情感问题的第i个词，w_i,j表示文档中第i个子句的第j个词。将该输入送入BERT，得到BERT输出：

其中

表示静态情感问题中第i个词的向量表示，h_i,j表示文档中第i个子句的第j个词的向量表示。利用自注意力机制聚合词向量表示得到每个子句和问题的句向量表示：

H_C＝{h_c1,h_c2,...},

对子句的向量表示使用图注意力网络GAT建模文档级信息，更新子句向量表示：

H_C＝{h′_c1,h′_c2,...}，其中h′_ci＝GAT(h_ci)

将每个子句的向量表示与问题的向量表示拼接，更新子句向量表示：

H_C＝{h″_c1,h″_c2,...}，其中

步骤1.2所述线性分类器对子句编码进行预测具体实现方法如下：

将编码器输出H_C＝{h″_c1,h″_c2,...}送入单层感知机：

其中w_S,b_S是单层感知机的可学习的参数，σ()是logistic激活函数，

表示答案为True的概率。

步骤1.2所述静态情感抽取任务损失具体实现方法如下：

其中

表示第i个文档中第j个子句c_i,j是第k个静态情感问题

的答案的真实概率值，非0即1，

表示第i个文档中第j个子句c_i,j是第k个静态情感问题

的答案的预测概率值，只有大于0.5时才判定第j个子句是第k个静态情感问题的答案。

步骤1.3：动态原因抽取任务。设计动态原因问题，对文档子句编码，根据文档子句对应编码进行预测从而抽取情感子句对应的原因子句。所述文档子句编码实现方法如下：利用BERT对动态原因问题和文档子句进行词级别编码，得到原因问题和每个子句中每个词的词向量；利用自注意力机制聚合词向量进行句级别编码，得到原因问题和每个子句的句向量；利用图注意力网络建模文档级关系，更新子句的句向量；通过将原因问题的句向量和每个子句的句向量进行拼接再次更新子句的句向量，实现问题和子句之间的交互，使子句的句向量带有原因语义信息，即实现对文档子句编码。编码后通过一个线性分类器对子句编码进行预测，抽取情感子句对应的原因子句，计算动态原因抽取任务损失。

所述动态原因问题指使用问题模板，将步骤1.2抽取出的情感子句包含在问题模板中，构建出用于动态原因抽取任务的问题。

步骤1.3所述文档子句编码具体实现方法如下：

构造预训练模型BERT输入：

表示动态原因问题的第i个词，w_i,j表示文档中第i个子句的第j个词。将该输入送入BERT预训练模型，得到BERT输出：

其中

表示动态原因问题中第i个词的隐藏层向量表示，h_i,j表示文档中第i个子句的第j个词的隐藏层向量表示。随后利用自注意力机制聚合词向量表示得到每个子句和问题的句向量表示：

H_C＝{h_c1,h_c2,...},

对子句的向量表示使用图注意力网络GAT建模文档级信息，更新子句的向量表示：

H_C＝{h′_c1,h′_c2,...}，其中h′_ci＝GAT(h_ci)

将每个子句的向量表示与问题的向量表示拼接，再更新子句向量表示：

H_C＝{h″_c1,h″_c2,...}，其中

步骤1.3所述线性分类器对子句编码进行预测具体实现方法如下：

将编码器输出H_C＝{h″_c1,h″_c2,...}送入单层感知机：

表示答案为True的概率。

步骤1.3所述动态原因抽取任务损失具体实现方法如下：

其中

表示第i个文档中第j个子句c_i,j是第k个动态原因问题

的答案的真实概率值，非0即1，

表示第i个文档中第j个子句c_i,j是第k个动态原因问题

的答案的预测概率值，只有大于0.5时才判定第j个子句是第k个动态原因问题的答案。

步骤1.4：根据步骤1.1、1.2、1.3，利用多轮结构将情感原因对抽取任务分解，在子句层面上构建问题和子句之间的交互，充分利用显式的情感和原因语义信息，通过在子句层面上处理情感原因对抽取任务，缓解情感原因对标签稀疏性问题，提高对文档情感原因对抽取效率。

步骤二、基于带有反思机制的多轮机器阅读理解方法对抽取的文档情感原因对进行验证。在步骤一的基础之上，加入动态情感抽取任务作为最后一轮，抽取每个原因子句对应的情感子句，充分利用显式的原因语义信息，提高情感原因对抽取任务的F1值。

所述动态情感抽取任务指在动态原因抽取任务的结果基础上，在显式原因语义信息的帮助下，抽取每个原因子句对应的情感子句。

步骤2.1：动态情感抽取任务。设计动态情感问题，对文档子句编码，根据文档子句对应编码进行预测从而抽取原因子句对应的情感子句。所述文档子句编码实现方法如下：利用预训练模型BERT对动态情感问题和文档子句进行词级别编码，得到情感问题和每个子句中每个词的词向量；利用自注意力机制聚合词向量进行句级别编码，得到情感问题和每个子句的句向量；利用图注意力网络建模文档级关系，更新子句的句向量；通过将情感问题的句向量和每个子句的句向量进行拼接再次更新子句的句向量，实现问题和子句之间的交互，使子句的句向量带有情感语义信息，即实现对文档子句编码。编码后通过一个线性分类器对子句编码进行预测，抽取原因子句对应的情感子句。计算动态情感抽取任务损失。

所述动态情感问题指使用问题模板，将步骤1.3抽取出的原因子句包含在问题模板中，构建出用于动态情感抽取任务的问题。

步骤2.1所述文档子句编码具体实现方法如下：

构造预训练模型BERT输入：

表示动态情感问题的第i个词，w_i,j表示文档中第i个子句的第j个词。将该输入送入BERT预训练模型，得到BERT输出：

其中

表示动态情感问题中第i个词的隐藏层向量表示，h_i,j表示文档中第i个子句的第j个词的隐藏层向量表示。随后利用自注意力机制聚合词向量表示得到每个子句和问题的句向量表示：

H_C＝{h_c1,h_c2,...},

H_C＝{h_c'₁,h_c'₂,...}，其中h_c'_i＝GAT(h_ci)

H_C＝{h″_c1,h″_c2,...}，其中

步骤2.1所述线性分类器对子句编码进行预测具体实现方法如下：

将编码器输出H_C＝{h″_c1,h″_c2,...}送入单层感知机：

表示答案为True的概率。

步骤2.1所述动态情感抽取任务损失具体实现方法如下：

其中

表示第i个文档中第j个子句c_i,j是第k个动态情感问题

的答案的真实概率值，非0即1，

表示第i个文档中第j个子句c_i,j是第k个动态情感问题

的答案的预测概率值，只有大于0.5时才判定第j个子句是第k个动态情感问题的答案。

步骤2.2：在步骤一的基础之上，加入动态情感抽取任务作为最后一轮，抽取每个原因子句对应的情感子句，充分利用显式的原因语义信息，提高情感原因对抽取任务的F1值。

步骤三：将步骤1.2、1.3和2.1的三个损失L^e,L^c,L^r相加得到总损失，使用该损失训练情感原因对抽取模型直至收敛，记下模型参数用于文档情感原因对抽取任务。

步骤四：将步骤三训练后的情感原因对抽取模型输入文档，使用所述模型抽取所有的情感原因对，即基于反思机制的多轮机器阅读理解实现情感原因对抽取。

步骤四中使用步骤三训练后的情感原因对抽取模型抽取所有的情感原因对实现方法如下：

步骤4.1：静态情感抽取任务。构造静态情感问题，将静态情感问题和文档子句作为输入送入训练好的情感原因对抽取模型，抽取出文档中所有的情感子句并得到情感子句对应的概率：

E＝{e₁,e₂,...}，P_E＝{p_e1,p_e2,...}

其中e_i表示文档中第i个情感子句，p_ei表示第i个情感子句的概率。

所述情感子句的概率指该子句被认为是正确的情感子句的概率值。

步骤4.2：动态原因抽取任务。根据步骤4.1抽取出的情感子句构造动态原因问题，将动态原因问题和文档子句作为输入送入训练好的模型，抽取出文档中每个情感子句对应的原因子句和原因子句的概率，即得到候选的所有情感原因对和候选的情感原因对的概率：

Pair＝{(e₁,c₁),(e₂,c₂),...},

其中(e_i,c_i)表示第i个候选的情感原因对，

表示候选的情感原因对的概率。

所述原因子句的概率指该子句是情感子句对应的原因子句的概率值。所述候选的情感原因对的概率指第一个子句是情感子句的概率与第二个子句是第一个子句对应的原因子句的概率之积。

步骤4.3：反思验证机制，即动态情感抽取任务。根据步骤4.2抽取出的原因子句构造动态情感问题，将动态情感问题和文档子句作为输入送入训练好的模型，对每个候选的情感原因对，抽取出原因子句对应的情感子句。根据抽取结果用参数α调整候选情感原因对的概率值。若抽取出的情感子句与候选的情感原因对中的情感子句一致，则验证正确，α＝1，否则降低α的值。更新后的候选的情感原因对的概率值如下：

其中

使用阈值δ筛选出正确的情感原因对：

其中Pair^f表示筛选后的情感原因对的集合。

即基于反思机制的多轮机器阅读理解实现情感原因对抽取。

步骤五：将前四步得到的模型应用于自然语言处理与机器学习领域，解决相关技术问题。

所述相关技术问题包括智能文本挖掘与服务、社交网络信息挖掘、情绪疏导、舆情监控、工作效率预测。

将模型应用于情绪疏导，根据模型抽取的情感原因对分析目标群体情感状态以及出现这种情感状态的原因，针对影响目标群体心理健康的情感原因对，选择情绪疏导策略，消除对应原因，提高目标群体的心理健康状况。

将模型应用于网络舆情监控，根据模型抽取的情感原因对分析目标舆情的情绪状态，针对影响社会稳定的舆情中的情感原因对，消除对应原因，维持网络舆情积极向上和社会稳定。

将模型应用于工作效率预测，根据模型抽取的情感原因对分析目标工作群体的工作状态，针对影响工作状态的情感原因对消除对应原因，提升目标工作群体的工作状态，进而提高目标工作群体的工作效率。

有益效果：

1、相比于端到端生成子句对的方法，本发明公开的基于多轮机器阅读理解的情感原因对抽取方法，利用多轮结构将情感原因对抽取任务分解，通过在子句层面而非子句对层面上处理情感原因对抽取任务，缓解子句对层面的标签稀疏性问题，提高对文档情感原因对抽取的效率。

2、相比于序列标注的方法，本发明公开的基于多轮机器阅读理解的情感原因对抽取方法，利用机器阅读理解方法中的问题设计以及问题和子句之间的交互，充分建立情感子句和原因子句之间的关系，利用所述建立的情感和原因之间的关系能够抽取各种复杂关系下的情感原因对，适用性更广。

3、本发明公开的基于多轮机器阅读理解的情感原因对抽取方法，基于带有反思机制的多轮机器阅读理解方法对抽取的候选文档情感原因对进行验证，充分利用显式的原因语义信息提高情感原因对抽取任务的F1值。

4、本发明公开的基于多轮机器阅读理解的情感原因对抽取方法，应用于自然语言处理与机器学习领域，解决相关技术问题，例如解决智能文本挖掘与服务、社交网络信息挖掘、情绪疏导、舆情监控、工作效率预测等相关技术问题。

5、本发明公开的基于多轮机器阅读理解的情感原因对抽取方法，基于反思机制的多轮机器阅读理解对情感原因对抽取模型进行预先训练，使用所述训练后的模型抽取所有的情感原因对，能够在保证情感原因对抽取匹配精度的前提下，显著提升抽取效率，便于针对目标群体，实时解决上述工程技术问题。

附图说明

图1为本发明的基于多轮机器阅读理解的情感原因对抽取流程图；

图2为实施例模型结构图；

图3为本发明的编码层结构图；

具体实施方式

为了更好的说明本发明的目的和优点，下面结合附图和实例对本发明方法的实施方式做进一步详细说明。

实施例1：

本实例采用微博语料库，经整理后语料库统计信息见表1：

表1情感原因对抽取实验数据

实验采用准确率(Precision，P)、召回率(Recall，R)和F1-测度值(F1-measure，F1)对结果进行评价，采用十折交叉验证，根据实验表现确定模型的最优参数。

本次实验在一台计算机和一台服务器上进行，计算机的具体配置为：Intel(R)i5-1135G7，CPU2.40GHz，内存16GB，操作系统是windows10，64位；服务器的具体配置为：Intel(R)Xeon(R)Gold6240，CPU2.60GHz，GPUV10032GB，操作系统是Debian GNU/Linux1164位。

实施例模型具体设置如图2所示，模型采用三轮机器阅读理解抽取出文档情感原因对。

步骤1.2：静态情感抽取任务。设计静态情感问题“这是情感子句吗”，对文档子句编码，根据文档子句对应编码进行预测从而抽取情感子句。所述文档子句编码实现方法如下：利用预训练模型BERT对静态情感问题和文档子句进行词级别编码，得到情感问题和每个子句中每个词的词向量；利用自注意力机制聚合词向量进行句级别编码，得到情感问题和每个子句的句向量；利用图注意力网络建模文档级关系，更新子句的句向量；通过将情感问题的句向量和每个子句的句向量进行拼接再次更新子句的句向量，实现问题和子句之间的交互，使子句的句向量带有情感语义信息，即实现对文档子句编码。编码后通过一个线性分类器对子句编码进行预测，抽取情感子句，计算静态情感抽取任务损失。

步骤1.2所述文档子句编码具体实现方法如下：

构造预训练模型BERT输入：

其中

H_C＝{h_c1,h_c2,...},

H_C＝{h′_c1,h′_c2,...}，其中h_c'_i＝GAT(h_ci)

H_C＝{h″_c1,h″_c2,...}，其中

将编码器输出H_C＝{h″_c1,h″_c2,...}送入单层感知机：

表示答案为True的概率。

步骤1.2所述静态情感抽取任务损失具体实现方法如下：

其中

表示第i个文档中第j个子句c_i,j是第k个静态情感问题

的答案的真实概率值，非0即1，

表示第i个文档中第j个子句c_i,j是第k个静态情感问题

步骤1.3：动态原因抽取任务。设计动态原因问题模板“这是____所对应的原因子句吗”，对文档子句编码，根据文档子句对应编码进行预测从而抽取情感子句对应的原因子句。所述文档子句编码实现方法如下：利用BERT对动态原因问题和文档子句进行词级别编码，得到原因问题和每个子句中每个词的词向量；利用自注意力机制聚合词向量进行句级别编码，得到原因问题和每个子句的句向量；利用图注意力网络建模文档级关系，更新子句的句向量；通过将原因问题的句向量和每个子句的句向量进行拼接再次更新子句的句向量，实现问题和子句之间的交互，使子句的句向量带有原因语义信息，即实现对文档子句编码。编码后通过一个线性分类器对子句编码进行预测，抽取情感子句对应的原因子句，计算动态原因抽取任务损失。

步骤1.3所述文档子句编码具体实现方法如下：

构造预训练模型BERT输入：

其中

表示动态原因问题中第i个词的隐藏层向量表示，h_i,j表示文档中第i个子句的第j个词的隐藏层向量表示。随后利用自注意力机制聚合词向量表示得到每个子句和问题的向量表示：

H_C＝{h_c1,h_c2,...},

H_C＝{h′_c1,h′_c2,...}，其中h′_ci＝GAT(h_ci)

H_C＝{h″_c1,h″_c2,...}，其中

将编码器输出H_C＝{h″_c1,h″_c2,...}送入单层感知机：

表示答案为True的概率。

步骤1.3所述动态原因抽取任务损失具体实现方法如下：

其中

表示第i个文档中第j个子句c_i,j是第k个动态原因问题

的答案的真实概率值，非0即1，

表示第i个文档中第j个子句c_i,j是第k个动态原因问题

步骤2.1：动态情感抽取任务。设计动态情感问题模板“这是____所对应的情感子句吗”，对文档子句编码，根据文档子句对应编码进行预测从而抽取原因子句对应的情感子句。所述文档子句编码实现方法如下：利用预训练模型BERT对动态情感问题和文档子句进行词级别编码，得到情感问题和每个子句中每个词的词向量；利用自注意力机制聚合词向量进行句级别编码，得到情感问题和每个子句的句向量；利用图注意力网络建模文档级关系，更新子句的句向量；通过将情感问题的句向量和每个子句的句向量进行拼接再次更新子句的句向量，实现问题和子句之间的交互，使子句的句向量带有情感语义信息，即实现对文档子句编码。编码后通过一个线性分类器对子句编码进行预测，抽取原因子句对应的情感子句。计算动态情感抽取任务损失。

步骤2.1所述文档子句编码具体实现方法如下：

构造预训练模型BERT输入：

其中

H_C＝{h_c1,h_c2,...},

H_C＝{h′_c1,h′_c2,...}，其中h′_ci＝GAT(h_ci)

H_C＝{h″_c1,h″_c2,...}，其中

将编码器输出H_C＝{h″_c1,h″_c2,...}送入单层感知机：

表示答案为True的概率。

步骤2.1所述动态情感抽取任务损失具体实现方法如下：

其中

表示第i个文档中第j个子句c_i,j是第k个动态情感问题

的答案的真实概率值，非0即1，

表示第i个文档中第j个子句c_i,j是第k个动态情感问题

步骤4.1：静态情感抽取任务。构造静态情感问题“这是情感子句吗”，将静态情感问题和文档子句作为输入送入训练好的情感原因对抽取模型，抽取出文档中所有的情感子句并得到情感子句对应的概率：

E＝{e₁,e₂,...}，P_E＝{p_e1,p_e2,...}

其中e_i表示文档中第i个情感子句；p_ei表示第i个情感子句的概率，当该值>0.5时子句被认为是情感子句。

步骤4.2：动态原因抽取任务。根据步骤4.1抽取出的情感子句构造动态原因问题模板“这是____所对应的原因子句吗”，将动态原因问题和文档子句作为输入送入训练好的模型，抽取出文档中每个情感子句对应的原因子句和原因子句的概率，即得到候选的所有情感原因对和候选的情感原因对的概率：

Pair＝{(e₁,c₁),(e₂,c₂),...},

其中(e_i,c_i)表示第i个候选的情感原因对；

表示候选的情感原因对的概率。

所述原因子句的概率指该子句是情感子句对应的原因子句的概率值，当该概率值>0.5时子句被认为是原因子句。所述候选的情感原因对的概率指第一个子句是情感子句的概率与第二个子句是第一个子句对应的原因子句的概率之积。

步骤4.3：反思验证机制，即动态情感抽取任务。根据步骤4.2抽取出的原因子句构造动态情感问题模板“这是____所对应的情感子句吗”，将动态情感问题和文档子句作为输入送入训练好的模型，对每个候选的情感原因对，抽取出原因子句对应的情感子句。根据抽取结果用参数α调整候选情感原因对的概率值。若抽取出的情感子句与候选的情感原因对中的情感子句一致，则验证正确，α＝1，否则令α＝0.8。更新后的候选的情感原因对的概率值如下：

其中

使用阈值δ筛选出正确的情感原因对：

其中Pair^f表示筛选后的情感原因对的集合，δ＝0.8。

即基于反思机制的多轮机器阅读理解实现情感原因对抽取。

步骤五：将前四步得到的模型对应用于舆情监控，解决相关技术问题。

本实施例给出了在微博语料库上的表现效果，使用本发明的多轮机器阅读理解模型抽取文档的情感原因对，下表2为在该语料库上，本发明和其他方法的效果对比，可以看出本发明全面优于其他方法，能更准确的提取出情感原因对，针对提取出的情感原因对，消除消极情绪和对社会稳定产生消极影响的原因，达到舆情控制的效果。

表2各方法效果对比

方法	精确率(％)	召回率(％)	F1值(％)
				ECPE-2D	72.92	65.44	68.89
PairGCN	76.92	67.91	72.02
				RANKCP	71.19	76.30	73.60
ECPE-MLL	77.00	72.35	74.52
				SL-NTS	72.43	63.66	67.76
IE	71.49	62.79	66.86
				本发明	81.21	79.31	80.20

综上所述，本发明公开的基于多轮机器阅读理解的情感原因对抽取方法，应用在微博语料库上，分析舆情达到了很好的效果，抽取文档情感原因对的F1值超过了80％，对抽取出的情感原因对进行应用，可以有针对性的消除对社会稳定造成影响的舆情原因，具有很高的工程应用价值。

以上所述的具体描述，对发明的目的、技术方案和有益效果进行了进一步详细说明，所应理解的是，以上所述仅为本发明的具体实施例而已，并不用于限定本发明的保护范围，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.基于多轮机器阅读理解的情感原因对抽取方法，其特征在于：包括如下步骤，

步骤一、基于多轮机器阅读理解方法实现对文档情感原因对抽取，利用多轮结构将情感原因对抽取任务分解，在子句层面上构建问题和子句之间的交互，充分利用显式的情感和原因语义信息，通过在子句层面上处理情感原因对抽取任务，缓解子句对层面的标签稀疏性问题，提高对文档情感原因对抽取的效率，并输出初步抽取的文档情感原因对和对应的文档情感原因对的概率；

所述对应的文档情感原因对概率指该子句对是正确的情感原因对的概率，通常为对中第一个子句是情感子句的概率与第二个子句是第一个子句对应的原因子句的概率之积；

步骤二、基于带有反思机制的多轮机器阅读理解方法对抽取的文档情感原因对进行验证；在步骤一的基础之上，加入动态情感抽取任务作为最后一轮，抽取每个原因子句对应的情感子句，充分利用显式的原因语义信息，提高情感原因对抽取任务的F1值；

所述动态情感抽取任务指在动态原因抽取任务的结果基础上，在显式原因语义信息的帮助下，抽取每个原因子句对应的情感子句；

步骤三：将步骤1.2、1.3和2.1的三个损失L^e,L^c,L^r相加得到总损失，使用该损失训练情感原因对抽取模型直至收敛，记下模型参数用于文档情感原因对抽取任务；

2.如权利要求1所述的基于多轮机器阅读理解的情感原因对抽取方法，其特征在于：还包括步骤五，将步骤四抽取的情感原因对应用于自然语言处理与机器学习领域，解决相关技术问题；

3.如权利要求2所述的基于多轮机器阅读理解的情感原因对抽取方法，其特征在于：

将模型应用于情绪疏导，根据模型抽取的情感原因对分析目标群体情感状态以及出现这种情感状态的原因，针对影响目标群体心理健康的情感原因对，选择情绪疏导策略，消除对应原因，提高目标群体的心理健康状况；

将模型应用于网络舆情监控，根据模型抽取的情感原因对分析目标舆情的情绪状态，针对影响社会稳定的舆情中的情感原因对，消除对应原因，维持网络舆情积极向上和社会稳定；

4.如权利要求3所述的基于多轮机器阅读理解的情感原因对抽取方法，其特征在于：所述各种复杂关系包括情感子句与原因子句一对一、一对多和多对一关系以及情感子句和原因子句距离较远的情况。

5.如权利要求1、2、3或4所述的基于多轮机器阅读理解的情感原因对抽取方法，其特征在于：步骤一实现方法为，

步骤1.1：基于多轮机器阅读理解方法实现对文档情感原因对抽取，利用多轮结构将情感原因对抽取任务分解为静态情感抽取任务和动态原因抽取任务；

所述静态情感抽取任务指抽取出文档中所有的情感子句，动态原因抽取任务指在静态情感抽取任务的结果基础上，在显式情感语义信息的帮助下，抽取每个情感子句对应的原因子句；

步骤1.2：静态情感抽取任务；设计静态情感问题，对文档子句编码，根据文档子句对应编码进行预测从而抽取情感子句；所述文档子句编码实现方法如下：利用预训练模型BERT对静态情感问题和文档子句进行词级别编码，得到情感问题和每个子句中每个词的词向量；利用自注意力机制聚合词向量进行句级别编码，得到情感问题和每个子句的句向量；利用图注意力网络建模文档级关系，更新子句的句向量；通过将情感问题的句向量和每个子句的句向量进行拼接再次更新子句的句向量，实现问题和子句之间的交互，使子句的句向量带有情感语义信息，即实现对文档子句编码；编码后通过一个线性分类器对子句编码进行预测，抽取情感子句，计算静态情感抽取任务损失；

所述静态情感问题指预先设计好的一个用于静态情感抽取任务的问句；

步骤1.3：动态原因抽取任务；设计动态原因问题，对文档子句编码，根据文档子句对应编码进行预测从而抽取情感子句对应的原因子句；所述文档子句编码实现方法如下：利用BERT对动态原因问题和文档子句进行词级别编码，得到原因问题和每个子句中每个词的词向量；利用自注意力机制聚合词向量进行句级别编码，得到原因问题和每个子句的句向量；利用图注意力网络建模文档级关系，更新子句的句向量；通过将原因问题的句向量和每个子句的句向量进行拼接再次更新子句的句向量，实现问题和子句之间的交互，使子句的句向量带有原因语义信息，即实现对文档子句编码；编码后通过一个线性分类器对子句编码进行预测，抽取情感子句对应的原因子句，计算动态原因抽取任务损失；

所述动态原因问题指使用问题模板，将步骤1.2抽取出的情感子句包含在问题模板中，构建出用于动态原因抽取任务的问题；

6.如权利要求5所述的基于多轮机器阅读理解的情感原因对抽取方法，其特征在于：步骤二实现方法为，

步骤2.1：动态情感抽取任务；设计动态情感问题，对文档子句编码，根据文档子句对应编码进行预测从而抽取原因子句对应的情感子句；所述文档子句编码实现方法如下：利用预训练模型BERT对动态情感问题和文档子句进行词级别编码，得到情感问题和每个子句中每个词的词向量；利用自注意力机制聚合词向量进行句级别编码，得到情感问题和每个子句的句向量；利用图注意力网络建模文档级关系，更新子句的句向量；通过将情感问题的句向量和每个子句的句向量进行拼接再次更新子句的句向量，实现问题和子句之间的交互，使子句的句向量带有情感语义信息，即实现对文档子句编码；编码后通过一个线性分类器对子句编码进行预测，抽取原因子句对应的情感子句；计算动态情感抽取任务损失；

所述动态情感问题指使用问题模板，将步骤1.3抽取出的原因子句包含在问题模板中，构建出用于动态情感抽取任务的问题；

步骤2.1所述文档子句编码具体实现方法如下：

构造预训练模型BERT输入：

该输入共包含两个特殊标记[CLS]和[SEP]，还有1个问题和N个子句；

表示动态情感问题的第i个词，w_i,j表示文档中第i个子句的第j个词；将该输入送入BERT预训练模型，得到BERT输出：

其中

表示动态情感问题中第i个词的隐藏层向量表示，h_i,j表示文档中第i个子句的第j个词的隐藏层向量表示；随后利用自注意力机制聚合词向量表示得到每个子句和问题的句向量表示：

H_C＝{h′_c1,h′_c2,...}，其中h′_ci＝GAT(h_ci)

H_C＝{h″_c1,h″_c2,...}，其中

将编码器输出H_C＝{h″_c1,h″_c2,...}送入单层感知机：

表示答案为True的概率；

步骤2.1所述动态情感抽取任务损失具体实现方法如下：

其中

表示第i个文档中第j个子句c_i,j是第k个动态情感问题

的答案的真实概率值，非0即1，

表示第i个文档中第j个子句c_i,j是第k个动态情感问题

的答案的预测概率值，只有概率值大于0.5时才判定第j个子句是第k个动态情感问题的答案；

7.如权利要求6所述的基于多轮机器阅读理解的情感原因对抽取方法，其特征在于：

步骤1.2所述文档子句编码具体实现方法如下：

构造预训练模型BERT输入：

表示静态情感问题的第i个词，w_i,j表示文档中第i个子句的第j个词；将该输入送入BERT，得到BERT输出：

其中

表示静态情感问题中第i个词的向量表示，h_i,j表示文档中第i个子句的第j个词的向量表示；利用自注意力机制聚合词向量表示得到每个子句和问题的句向量表示：

对子句的向量表示，使用图注意力网络GAT建模文档级信息，更新子句向量表示：

H_C＝{h′_c1,h′_c2,...}，其中h′_ci＝GAT(h_ci)

H_C＝{h″_c1,h″_c2,...}，其中

将编码器输出H_C＝{h″_c1,h″_c2,...}送入单层感知机：

表示答案为True的概率；

步骤1.2所述静态情感抽取任务损失具体实现方法如下：

其中

表示第i个文档中第j个子句c_i,j是第k个静态情感问题

的答案的真实概率值，非0即1，

表示第i个文档中第j个子句c_i,j是第k个静态情感问题

8.如权利要求7所述的基于多轮机器阅读理解的情感原因对抽取方法，其特征在于：

步骤1.3所述文档子句编码具体实现方法如下：

构造预训练模型BERT输入：

表示动态原因问题的第i个词，w_i,j表示文档中第i个子句的第j个词；将该输入送入BERT预训练模型，得到BERT输出：

其中

表示动态原因问题中第i个词的隐藏层向量表示，h_i,j表示文档中第i个子句的第j个词的隐藏层向量表示；随后利用自注意力机制聚合词向量表示得到每个子句和问题的句向量表示：

H_C＝{h′_c1,h′_c2,...}，其中h′_ci＝GAT(h_ci)

H_C＝{h″_c1,h″_c2,...}，其中

将编码器输出H_C＝{h″_c1,h″_c2,...}送入单层感知机：

表示答案为True的概率；

步骤1.3所述动态原因抽取任务损失具体实现方法如下：

其中

表示第i个文档中第j个子句c_i,j是第k个动态原因问题

的答案的真实概率值，非0即1，

表示第i个文档中第j个子句c_i,j是第k个动态原因问题

9.如权利要求8所述的基于多轮机器阅读理解的情感原因对抽取方法，其特征在于：步骤四中使用步骤三训练后的情感原因对抽取模型抽取所有的情感原因对实现方法如下，

步骤4.1：静态情感抽取任务；构造静态情感问题，将静态情感问题和文档子句作为输入送入训练好的情感原因对抽取模型，抽取出文档中所有的情感子句并得到情感子句对应的概率：

E＝{e₁,e₂,...}，P_E＝{p_e1,p_e2,...}

其中e_i表示文档中第i个情感子句，p_ei表示第i个情感子句的概率；

所述情感子句的概率指该子句被认为是正确的情感子句的概率值；

步骤4.2：动态原因抽取任务；根据步骤4.1抽取出的情感子句构造动态原因问题，将动态原因问题和文档子句作为输入送入训练好的模型，抽取出文档中每个情感子句对应的原因子句和原因子句的概率，即得到候选的所有情感原因对和候选的情感原因对的概率：

其中(e_i,c_i)表示第i个候选的情感原因对，

表示候选的情感原因对的概率；

所述原因子句的概率指该子句是情感子句对应的原因子句的概率值；所述候选的情感原因对的概率指第一个子句是情感子句的概率与第二个子句是第一个子句对应的原因子句的概率之积；

步骤4.3：反思验证机制，即动态情感抽取任务；根据步骤4.2抽取出的原因子句构造动态情感问题，将动态情感问题和文档子句作为输入送入训练好的模型，对每个候选的情感原因对，抽取出原因子句对应的情感子句；根据抽取结果用参数α调整候选情感原因对的概率值；若抽取出的情感子句与候选的情感原因对中的情感子句一致，则验证正确，α＝1，否则降低α的值；更新后的候选的情感原因对的概率值如下：

其中

使用阈值δ筛选出正确的情感原因对：

其中Pair^f表示筛选后的情感原因对的集合；

即基于反思机制的多轮机器阅读理解实现情感原因对抽取。