CN111985216A

CN111985216A - 基于强化学习和卷积神经网络的情感倾向性分析方法

Info

Publication number: CN111985216A
Application number: CN202010863083.2A
Authority: CN
Inventors: 金勇�; 陈宏明; 胡林利
Original assignee: WUHAN YANGTZE COMMUNICATIONS INDUSTRY GROUP CO LTD
Current assignee: WUHAN YANGTZE COMMUNICATIONS INDUSTRY GROUP CO LTD
Priority date: 2020-08-25
Filing date: 2020-08-25
Publication date: 2020-11-24

Abstract

本发明涉及语义理解分析技术领域，具体为基于强化学习和卷积神经网络的情感倾向性分析方法，包括如下步骤：S1、单词输入：以word2vec得到的词向量作为初始向量；S2、强化学习：利用行业先验知识，构建情感词典用于强化学习的训练学习；S3、注意力机制：基于强化学习算法构建sentencelevel的注意力机制模型进一步得到局部区域的文本向量表达形式；S4、卷积神经网络：接入卷积神经网络模型用于模型的训练和验证。本发明采用强化学习的方法读入文本序列，针对不同情感特征采取相应的行动方式，不仅考虑到了文本序列的因素，也考虑了情感特征及其顺序对于结果的影响。实现从事后到事前，进行社会突发事件预警和研判，以提高突发社会情绪认知的效度。

Description

基于强化学习和卷积神经网络的情感倾向性分析方法

技术领域

本发明涉及语义理解分析技术领域，具体为基于强化学习和卷积神经网络的情感倾向性分析方法。

背景技术

当今信息技术发展迅猛，互联网海量数据中存在着大量有价值信息，其中包括大量网民对于某些商品或者事件的情感倾向(如正面倾向或者负面倾向)，研究这些信息的情感倾向对于商品决策分析、政府情绪引导等方面都存在积极影响。

虽然当前在情感计算领域已经产生了较多相关技术，但是综合考虑文本序列特征和情感特征波动的相关研究却较少。近几年深度学习在NLP领域，尤其是序列分析以及阅读理解方面，以及在文本预训练等任务上都有一定的突破。强化学习也逐步用于文本序列分析方面的任务，通过与每一个文字符号(如情感词)进行交互获取的回报指导来进行学习，以获取情感特征词的信息。

目前情感倾向性分类方法中考虑文本序列因素的相关模型如Bert、GPT、 RNN、CNN等，没有引入情感特征及其顺序对于情感结果的判断。强化学习在学习情感特征过程中也没有考虑文本局部重点段落对于全局情感的影响。为此，我们提出基于强化学习和卷积神经网络的情感倾向性分析方法。

发明内容

本发明的目的在于提供基于强化学习和卷积神经网络的情感倾向性分析方法，以解决上述背景技术中提出的问题。

为实现上述目的，本发明提供如下技术方案：基于强化学习和卷积神经网络的情感倾向性分析方法，包括如下步骤：

S1、单词输入：以word2vec得到的词向量作为初始向量；

S2、强化学习：利用行业先验知识，构建情感词典用于强化学习的训练学习；

S3、注意力机制：基于强化学习算法构建sentence level的注意力机制模型进一步得到局部区域的文本向量表达形式；

S4、卷积神经网络：接入卷积神经网络模型用于模型的训练和验证。

优选的，所述步骤S2中的情感词典包括：

(a)情感标注类别：正面、负面、中立；

(b)情感词库及对应情感得分；

(c)情感否定词库。

优选的，所述步骤S2中强化学习算法通过构建动作选择层和动作评价层结构，根据情感环境的变化确定不同的行动，利用最终有监督的情感分析结果作为强化学习的回报进行参数训练。

优选的，所述步骤S4中通过卷积神经网络的卷积层、池化层以及全连接层，进行全网络模型参数的训练。

与现有技术相比，本发明的有益效果是：采用强化学习的方法读入文本序列，针对不同情感特征采取相应的行动方式，不仅考虑到了文本序列的因素，也考虑了情感特征及其顺序对于结果的影响，从word level角度吸纳了情感特征的影响因素。同时，基于Sentence level的注意力机制也被引入到模型设计结构中，使得文章局部的重点段落部分在训练中也得到相应的关注。实验针对12000条以上的数据进行模型训练分析，模型准确率为78.6％，结果证明有一定效果的提升。

本发明通过对情感倾向性分类方法的研究，实现从事后到事前，进行社会突发事件预警和研判，以提高突发社会情绪认知的效度。

附图说明

图1为本发明基于情感特征变化的强化学习RL结构图；

图2为本发明总体流程结构图。

具体实施方式

下面对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明提供一种技术方案：基于强化学习和卷积神经网络的情感倾向性分析方法，包括如下步骤：

S1、单词输入：以word2vec得到的词向量作为初始向量；

人类理解自然语言文本的方式主要是按照序列逐步读入词语，遇到情感特征词会产生的一定的情感波动，例如“我讨厌疫情，因为它对我们整个国家影响太大了”文本中的负面情感词“讨厌”对于读入者会产生一定的情感向下的波动，反之亦然。

如图1所示，强化学习算法通过构建动作选择层和动作评价层结构,可以根据情感环境(station)的变化确定不同的行动(action)，利用最终有监督的情感分析结果作为强化学习的回报进行参数训练。

图1中，St代表t时刻的状态，At代表t时刻对应的对于环境的行为， Xt代表t时刻读入的词语，Tpos代表相应的行为，其中pos(正面)、neu(中立)、neg(负面)分别代表相应的情感倾向。分类结果中预测值与实际值的差异将作为回报用来训练强化学习单元。

如图2所示，基于上述RL结构图，由于利用最终有监督的情感结果作为回报用来训练参数，可以称之为Sentiment-specific RL cell(S-RL)，基于此单元，然后构建基于注意力机制(Attention)的sentence level向量表达方式，最后通过卷积神经网络(CNN)的卷积层、池化层以及全连接层，进行全网络模型参数的训练，最终实现强化学习与有监督学习的结合。

图2中，依次包括四个层次：单词输入层(Word level)、强化学习层(Rl layer)、注意力机制层(Attention layer)、以及卷积神经网络层(CNN： Convolution+Pooling+FullyConnected Layer)，从而实现一套完整的情感分析处理过程：以word2vec得到的词向量作为初始向量；利用行业先验知识, 构建情感词典用于强化学习的训练学习；构建sentencelevel的注意力机制模型进一步得到局部区域的文本向量表达形式；最终接入CNN模型用于模型的训练和验证。

实施例：

第一步，数据采集。基于互联网数据采集平台，对新闻、微博、论坛、微信、博客等不同数据源站点进行爬取，2019年12月份到2020年3月份所有4个月的全量数据(以及后续更新的数据)，主要关键词配置如下：肺炎、疫情、冠状病毒、胸闷、发烧等。采集的源数据需要经过数据清洗之后，进行相应的数据标注和知识整理得到如下数据：

(a)情感标注类别：正面、负面、中立；

(b)情感词库及对应情感得分；

(c)情感否定词库。

第二步，实验训练。实验过程中的数据集比例为：训练集、验证集、测试集的比例为7:2:1。情感倾向性分析实验中，Baseline为RL+CNN，在改进方案中采用强化学习与注意力机制结合的方式(RL+ATT+CNN)来提升情感的判别结果(如图2)。

第三步，结果总结。针对baseline与改进实验方案的结果比较，得到可供生产用的模型方案与参数设计。

目前情感倾向性分类方法中考虑文本序列因素的相关模型如Bert、GPT、 RNN、CNN等，没有引入情感特征及其顺序对于情感结果的判断。强化学习在学习情感特征过程中也没有考虑文本局部重点段落对于全局情感的影响。

本发明采用强化学习的方法读入文本序列，针对不同情感特征采取相应的行动方式，不仅考虑到了文本序列的因素，也考虑了情感特征及其顺序对与结果的影响，从word level角度吸纳了情感特征的影响因素。同时，基于 Sentence level的注意力机制也被引入到模型设计结构中，使得文章局部的重点段落部分(Context representation)在训练中也得到相应的关注。实验针对12000条以上的数据进行模型训练分析，基于Baseline模型的实验结果准确率为75.3％，而改进方案的模型结果为78.6％，结果证明有一定效果的提升。

尽管已经示出和描述了本发明的实施例，对于本领域的普通技术人员而言，可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型，本发明的范围由所附权利要求及其等同物限定。

Claims

1.基于强化学习和卷积神经网络的情感倾向性分析方法，其特征在于：包括如下步骤：

S1、单词输入：以word2vec得到的词向量作为初始向量；

2.根据权利要求1所述的基于强化学习和卷积神经网络的情感倾向性分析方法，其特征在于：所述步骤S2中的情感词典包括：

(a)情感标注类别：正面、负面、中立；

(b)情感词库及对应情感得分；

(c)情感否定词库。

3.根据权利要求1所述的基于强化学习和卷积神经网络的情感倾向性分析方法，其特征在于：所述步骤S2中强化学习算法通过构建动作选择层和动作评价层结构，根据情感环境的变化确定不同的行动，利用最终有监督的情感分析结果作为强化学习的回报进行参数训练。

4.根据权利要求1所述的基于强化学习和卷积神经网络的情感倾向性分析方法，其特征在于：所述步骤S4中通过卷积神经网络的卷积层、池化层以及全连接层，进行全网络模型参数的训练。