CN112784011B

CN112784011B - 一种基于cnn和lstm的情感问题处理方法、装置和介质

Info

Publication number: CN112784011B
Application number: CN202110003332.5A
Authority: CN
Inventors: 吴志雄; 吴浩泽; 高稳仁; 杨美娟
Original assignee: Fujian Weidun Science And Technology Group Co ltd; Linewell Software Co Ltd
Current assignee: Fujian Weidun Science And Technology Group Co ltd; Linewell Software Co Ltd
Priority date: 2021-01-04
Filing date: 2021-01-04
Publication date: 2023-06-30
Anticipated expiration: 2041-01-04
Also published as: CN112784011A

Abstract

本发明实施例公开了一种基于CNN和LSTM的情感问题处理方法，包括：通过训练并优化CNN模型，得到表情识别模型，实现输入人脸图片得到表情标签；通过聊天记录以及表情识别模型的识别结果构建训练集，训练LSTM模型，得到文本情感分析模型，实现通过聊天记录获得情感标签；当一用户的情感标签转变为负面时，查询设定时间段内所述用户发出和接收到的聊天记录，利用所述文本情感分析模型分析所述聊天记录的情感标签，并提取所述聊天记录中的关键信息，然后将所述聊天记录的情感标签和关键信息展示给所述聊天记录的接收或发送对象。本发明提供的一种基于CNN和LSTM的情感问题处理方法、装置和介质，使用户能及时地从与联系人的文字交流中获取情感信息及关键信息。

Description

一种基于CNN和LSTM的情感问题处理方法、装置和介质

技术领域

本发明涉及计算机技术领域，特别涉及一种基于CNN和LSTM的情感问题处理方法、装置和介质。

背景技术

情感，是人类的一个特性。当面对面交流时，人们能够根据情感来判断沟通是否有效，从而及时地变换交流策略。随着信息化时代的来临，视频聊天在一定程度上能让人面对面沟通，但是这需要一段连续的时间。而有些人没有连续的时间，倾向于用碎片化的时间来进行文字交流。而文字交流相比于视频/面对面交流，能获取的信息特别少。这其中的一个最大问题就是交流双方无法及时获取对方的情感变化来调整自己的策略，从而没有把事情处理好，最后一步错步步错。

事情没有处理好是因为没有找到事情的真正原因。为什么会找不到真正原因呢？一方面可能是一些人是第一次处理这些事情，没有考虑到太多的因素，只会线性地考虑问题。并且时间紧迫，人在焦急地状态很大概率找不到最优解；另一方面是当没有处理经验的时候，人一般会去求助身边的人，但是身边的人因为不了解当前的情况或者当事人没有描述清楚目前发生的状况，身边的人可能会给出错误的决定。

因此，如何提供一种可以让用户及时地从与联系人的文字交流中获取情感信息及关键信息的方法，成为一个亟待解决的问题。

发明内容

本发明要解决的技术问题，在于提供一种基于CNN和LSTM的情感问题处理方法、装置和介质，使用户能及时地从与联系人的文字交流中获取情感信息及关键信息。

第一方面，本发明提供了一种基于CNN和LSTM的情感问题处理方法，包括：

通过带有表情标签的人脸表情图片集训练CNN模型，得到表情识别模型；获取用户的人脸图片，输入所述表情识别模型，得到与所述人脸图片对应的表情标签，当所述表情识别模型无法识别出表情标签时，获取用户提供的表情标签，再将所述人脸图片与一一对应的表情标签作为训练集，对所述表情识别模型进行优化；

获取用户的文字聊天记录，并使用优化的表情识别模型对用户发送所述文字聊天记录的表情进行识别，得到与所述文字聊天记录对应的表情标签，然后将所述表情标签转化为情感标签，所述情感标签包括正面、负面或中性；将所述文字聊天记录与一一对应的情感标签作为训练集，对LSTM模型进行训练，得到文本情感分析模型；

当一用户的情感标签从正面转为负面或由中性转为负面时，查询设定时间段内所述用户发出和接收到的聊天记录，利用所述文本情感分析模型分析所述聊天记录的情感标签，并提取所述聊天记录中的关键信息，然后将所述聊天记录的情感标签和关键信息展示给所述聊天记录的接收或发送对象。

进一步地，提取所述聊天记录中的关键信息，包括：

步骤S1、对所述聊天记录进行分词，得到至少一个关键词；

步骤S2、按词性顺序获取关键词，当获取到关键词时，判断所述关键词所在的句子中是否包括情感表达词，若是，进入步骤S3，若否，将所述关键词的权重设置为1，然后进入步骤5；当获取不到关键词时，结束步骤；

步骤S3、判断所述情感表达词为正面还是负面，然后计算所述情感表达词的权重；

步骤S4、判断所述情感表达词与临近的词能否组成从句，若能，跳过包括所述情感表达词的从句，然后进入步骤S5，若不能，跳过所述情感表达词，然后进入步骤S5；

步骤S5、判断所述关键词与临近的词能否组成从句，若能，保存包括所述关键词的从句和权重作为关键信息，然后返回步骤S2，若不能，构建所述关键词的词向量，根据所述关键词的词向量搜索聊天记录，将搜索结果和权重作为关键信息，然后返回步骤S2。

进一步地，所述步骤S3中，计算所述情感表达词的权重，采用如下公式：

其中，当情感表达词为正面时，公式取正，当情感表达词为负面时，公式取负，T_c为代表两用户交流时长，T_r代表相同情绪的回复记录，T_d代表相同情绪的持续时间。

进一步地，所述表情标签包括：生气、厌恶、恐惧、开心、伤心、惊讶以及中性；

将所述表情标签转化为情感标签，进一步具体为：将开心转化为正面，将中性保持不变，将生气、厌恶、恐惧、伤心、惊讶转化为负面。

第二方面，本发明提供了一种基于CNN和LSTM的情感问题处理装置，包括：表情识别优化模块、文本情感分析模块以及关键信息提取模块；

所述表情识别优化模块，用于通过带有表情标签的人脸表情图片集训练CNN模型，得到表情识别模型；获取用户的人脸图片，输入所述表情识别模型，得到与所述人脸图片对应的表情标签，当所述表情识别模型无法识别出表情标签时，获取用户提供的表情标签，再将所述人脸图片与一一对应的表情标签作为训练集，对所述表情识别模型进行优化；

所述文本情感分析模块，用于获取用户的文字聊天记录，并使用优化的表情识别模型对用户发送所述文字聊天记录的表情进行识别，得到与所述文字聊天记录对应的表情标签，然后将所述表情标签转化为情感标签，所述情感标签包括正面、负面或中性；将所述文字聊天记录与一一对应的情感标签作为训练集，对LSTM模型进行训练，得到文本情感分析模型；

所述关键信息提取模块，用于当一用户的情感标签从正面转为负面或由中性转为负面时，查询设定时间段内所述用户发出和接收到的聊天记录，利用所述文本情感分析模型分析所述聊天记录的情感标签，并提取所述聊天记录中的关键信息，然后将所述聊天记录的情感标签和关键信息展示给所述聊天记录的接收或发送对象。

进一步地，所述关键信息提取模块中，提取所述聊天记录中的关键信息，具体包括：

步骤S1、对所述聊天记录进行分词，得到至少一个关键词；

第三方面，本发明提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现第一方面所述的方法。

本发明实施例中提供的一个或多个技术方案，至少具有如下技术效果或优点：

通过练并优化CNN模型，得到表情识别模型，实现输入人脸图片得到表情标签；通过聊天记录以及表情识别模型的识别结果构建训练集，训练LSTM模型，得到文本情感分析模型，实现通过聊天记录获得情感标签；使用户在文字聊天时，能及时地获取对方的情感变化和关键信息，从而能够及时改变交流策略，从而处理好矛盾，达到面对面或者视频交流的效果。

上述说明仅是本发明技术方案的概述，为了能够更清楚了解本发明的技术手段，而可依照说明书的内容予以实施，并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂，以下特举本发明的具体实施方式。

附图说明

下面参照附图结合实施例对本发明作进一步的说明。

图1为本发明实施例一中方法的流程图；

图2为本发明实施例一中采用的LSTM模型细胞的门结构示意图；

图3为本发明实施例一中关键信息的提取流程示意图；

图4为本发明实施例二中装置的结构示意图；

图5为本发明实施例三中介质的结构示意图。

具体实施方式

实施例一

本实施例提供一种基于CNN和LSTM的情感问题处理方法，如图1所示，可以包括如下步骤：

步骤一、表情识别模型的训练和优化

通过带有表情标签的人脸表情图片集(比如使用kaggle FER2013数据集，由35886张人脸表情图片组成，并且分为了7个标签，按照0-6分别是生气、厌恶、恐惧、开心、伤心、惊讶和中性)训练CNN模型，得到表情识别模型；

本实施例采用的卷积神经网络(CNN)模型主要包括三层卷积层，两层全连接层，最后通过一个softmax输出每个类别的可能性。CNN具体结构如表1-1所示。

表1-1CNN结构

类型	卷积核	步长	填充	输出	dropout
						输入			42x42x1
卷积层	5x5	1	2	42x42x32
						池化层	3x3	2	21x21x32
卷积层	4x4	1	1	20x20x32
						池化层	3x3	2	10x10x32
卷积层	5x5	1	2	10x10x64
						池化层	3x3	2	5x5x64
全连接层				1x1x2048	0.4
						全连接层			1x1x1024	0.4
输出				1x1x7

其中，输入层为42×42×1的图片，第一层卷积层中含有32个5×5的卷积核，它的步长为1，卷积层填充为2。经过卷积核扫描之后将会由一个42×42×32的输出。把这个输出放到一个含有32个尺寸为3×3步长为2的卷积核的池化层中，将会得到一个21×21×32的输出。之后经过32个尺寸为4×4步长为1的卷积核并且填充为1的卷积层得到20×20×32的输出。将这个输出放入与第一个池化层相同的池化层将会得到一个10×10×32的输出。之后将这个输出放入与第一个卷积层相同规模的卷积层得到10×10×64的输出，将这个输放入与第一个池化层相同规模的池化层进行最后一次池化，将会得到一个5×5×64的池化层。为了防止过拟合，将会在之后的两个全连接层中设置40％的dropout，最后由softmax显示出结果。

其中卷积层的激活函数使用ReLU函数，它的公式如公式1.1所示

通过人脸表情图片集训练出初步模型之后，为了得到更为准确的表情识别效果，可以对用户的人脸图片进行识别得到进一步的训练数据，对CNN模型进行优化，实现方法如下：

获取用户的人脸图片(比如，可以在用户发送消息的同时调用设备的摄像头权限获取用户的人脸图片，并且通过OpenCV将图片处理为42×42的灰度化图片)，输入所述表情识别模型来识别用户的表情，得到与所述人脸图片对应的表情标签，当所述表情识别模型无法识别出表情标签时，获取用户提供的表情标签，再将所述人脸图片与一一对应的表情标签作为训练集，对所述表情识别模型进行优化；

训练集的数据存储格式可以如表1-2所示，其中content_id字段是当前用户的聊天内容表中的id。模型无法识别出结果时，将会弹出对话框询问用户当时的表情。

表1-2人脸表情识别表结构

步骤二、文本情感分析模型的训练

LSTM模型主要用于文本情感分析，其细胞状态的门结构如图2所示。它的输入为前一层隐藏状态的信息和当前的输入，其中，pointwise multiplication是将两个向量相乘的操作，pointwise addition是将两个向量相加的操作，vector concatenation则是将两个向量结合为一个向量的操作。

最左侧是遗忘门，它接受到参数时候将使用Sigmoid函数作为激活函数，Sigmoid函数如公式1.2所示

可以看到输入将会被sigmoid函数转化为0～1之间的值。如果是0，那么这个输入将会被遗忘。中间含有sigmoid函数和tanh函数的是输入门，它用于决定更新哪些信息。其中tanh函数如公式1.3所示。

可以计算出tanh函数的值域是[-1,1]。其中sigmoid的输出决定tanh的输出中哪些重要信息需要被保留。之后将刚刚计算出来的遗忘向量与前一个细胞状态相乘，再与输入门的输出相加，就得出了最新的细胞状态。最后将前一个隐藏状态经过sigmoid函数，当前细胞状态经过tanh函数的输出相乘，将会得到新的隐藏状态。

构建好LSTM模型之后，需要用训练集来训练模型，得到可以通过聊天记录获得情感标签的文本情感分析模型。训练集是用户所发的消息及对应的情感标签，可以在用户发送消息时将聊天记录存入聊天内容训练表中，该表结构如表1-3所示，其中训练集的情感标签为CNN的识别结果转化而成，比如，将开心转化为正面，将中性保持不变，将生气、厌恶、恐惧、伤心、惊讶转化为负面。

表1-3聊天内容训练表

步骤三、关键信息捕捉

执行完步骤一和步骤二之后，将会有两个模型，CNN——用于用户表情识别，LSTM——用于文本情感分析。在本实施例中，可以调用摄像头权限捕捉用户的表情并存入表1-4所示的用户表情表中。

表1-4用户表情表

每次保存都会比较该用户的上一条记录，当发现用户的表情从正面或者中性转变到负面表情时，系统将会在如表1-5所示的聊天记录表中查询时间范围内发出者或者接收者为该用户的记录。提取这些聊天记录后，系统将提取聊天记录中的关键信息，关键信息的提取流程如图3所示，可以包括如下步骤：

步骤S1、对所述聊天记录进行分词(比如，采用THULAC进行分词)，得到至少一个关键词；

步骤S3、判断所述情感表达词为正面还是负面，然后计算所述情感表达词的权重，公式如下：

其中，当情感表达词为正面时，公式取正，当情感表达词为负面时，公式取负，T_c为代表两用户交流时长，T_r代表相同情绪的回复记录，T_d代表相同情绪的持续时间；

在一种可能的实现方式中，先把一个句子中按照动词和非动词进行分类，之后在非动词的部分中分出人称代词、人名、地名、机构名和其余词。分词完成后，将会按照设定的优先级(比如，动词>人名>地名>机构名>其余词)对第一个词进行提取，然后先判断聊天记录中是否存在情感表达词，如果不存在，则设置权重为1，如果存在情感表达词，则通过公式1.4计算出权重；得到权重值之后，即判断该词与临近的词是否能够组成从句，如果能组成从句，则保存该从句和权重，否则保存该词和权重，然后返回提取下一个词，按同样的流程得到带有权重的词或从句作为关键信息，循环往复直到没有词，结束步骤。

提取关键信息后，如果关键信息包括从句，那么将在数据库中进行like查询之后展现给用户；如果关键信包括词，则根据该词的词向量在数据库中进行多维搜索，其中，词向量的构建如公式1.5所示：

在句子中的每一个词都会被表示为两个向量。当它为中心词时向量表示为v_i，当它为背景词时向量标识为ui，其中，w_c为中心词在句子中的索引，w₀则是背景词在字典中的索引。给定中心词生成背景词的条件概率可以通过对向量内积做softmax运算而得到。之后在两边加上log进行损失函数的计算，如果损失函数最小，则这个词可以存入词向量中。

生成词向量之后，使用词向量搜索聊天记录，并且聊天记录中的关键字标红以强调情绪波动的可能原因，根据权重排序。系统将记录中的发出者或者接收者提取出来，当这两个字段非情绪变化用户本人时，系统将会向他们发送消息提示目前用户情绪变化，并且发送处理后的聊天记录。

表1-5聊天记录表

当用户接受到处理后的聊天记录后，即可从关键数据中通过关键字与相关的历史聊天记录获取表情变化的关键，以想出更好地解决方法。

基于同一发明构思，本申请还提供了与实施例一中的方法对应的装置，详见实施例二。

实施例二

在本实施例中提供了一种基于CNN和LSTM的情感问题处理装置，如图4所示，包括：表情识别优化模块、文本情感分析模块以及关键信息提取模块；

在一种可能的实现方式中，所述关键信息提取模块中，提取所述聊天记录中的关键信息，具体包括：

步骤S1、对所述聊天记录进行分词，得到至少一个关键词；

在一种可能的实现方式中，所述步骤S3中，计算所述情感表达词的权重，采用如下公式：

在一种可能的实现方式中，所述表情标签包括：生气、厌恶、恐惧、开心、伤心、惊讶以及中性；

由于本发明实施例二所介绍的装置，为实施本发明实施例一的方法所采用的装置，故而基于本发明实施例一所介绍的方法，本领域所属人员能够了解该装置的具体结构及变形，故而在此不再赘述。凡是本发明实施例一的方法所采用的装置都属于本发明所欲保护的范围。

基于同一发明构思，本申请提供了实施例一对应的存储介质，详见实施例三。

实施例三

本实施例提供一种计算机可读存储介质，如图5所示，其上存储有计算机程序，该计算机程序被处理器执行时，可以实现实施例一中任一实施方式。

本发明实施例通过练并优化CNN模型，得到表情识别模型，实现输入人脸图片得到表情标签；通过聊天记录以及表情识别模型的识别结果构建训练集，训练LSTM模型，得到文本情感分析模型，实现通过聊天记录获得情感标签；使用户在文字聊天时，能及时地获取对方的情感变化和关键信息，从而能够及时改变交流策略，从而处理好矛盾，达到面对面或者视频交流的效果。

虽然以上描述了本发明的具体实施方式，但是熟悉本技术领域的技术人员应当理解，我们所描述的具体的实施例只是说明性的，而不是用于对本发明的范围的限定，熟悉本领域的技术人员在依照本发明的精神所作的等效的修饰以及变化，都应当涵盖在本发明的权利要求所保护的范围内。

Claims

1.一种基于CNN和LSTM的情感问题处理方法，其特征在于，包括：

当一用户的情感标签从正面转为负面或由中性转为负面时，查询设定时间段内所述用户发出和接收到的聊天记录，利用所述文本情感分析模型分析所述聊天记录的情感标签，并提取所述聊天记录中的关键信息，然后将所述聊天记录的情感标签和关键信息展示给所述聊天记录的接收或发送对象；

提取所述聊天记录中的关键信息，包括：

步骤S1、对所述聊天记录进行分词，得到至少一个关键词；

2.根据权利要求1所述的方法，其特征在于：所述步骤S3中，计算所述情感表达词的权重，采用如下公式：

3.根据权利要求1所述的方法，其特征在于：

所述表情标签包括：生气、厌恶、恐惧、开心、伤心、惊讶以及中性；

4.一种基于CNN和LSTM的情感问题处理装置，其特征在于，包括：表情识别优化模块、文本情感分析模块以及关键信息提取模块；

所述关键信息提取模块，用于当一用户的情感标签从正面转为负面或由中性转为负面时，查询设定时间段内所述用户发出和接收到的聊天记录，利用所述文本情感分析模型分析所述聊天记录的情感标签，并提取所述聊天记录中的关键信息，然后将所述聊天记录的情感标签和关键信息展示给所述聊天记录的接收或发送对象；

所述关键信息提取模块中，提取所述聊天记录中的关键信息，具体包括：

步骤S1、对所述聊天记录进行分词，得到至少一个关键词；

5.根据权利要求4所述的装置，其特征在于：所述步骤S3中，计算所述情感表达词的权重，采用如下公式：

6.根据权利要求4所述的装置，其特征在于：

7.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如权利要求1至3任一项所述的方法。