WO2020253042A1

WO2020253042A1 - 情感智能判断方法、装置及计算机可读存储介质

Info

Publication number: WO2020253042A1
Application number: PCT/CN2019/117336
Authority: WO
Inventors: 金戈; 徐亮
Original assignee: 平安科技（深圳）有限公司
Priority date: 2019-06-18
Filing date: 2019-11-12
Publication date: 2020-12-24
Also published as: CN110442857B; CN110442857A

Abstract

一种情感智能判断方法，涉及人工智能领域，包括：接收语料集和标签集，将所述语料集进行预处理操作得到标准语料集；对所述标准语料集进行关键字抽取和词向量化操作得到词向量集；将所述词向量集输入至情感分析模型的卷积神经网络中，将所述标签集输入至所述情感分析模型的损失函数中，所述卷积神经网络接收所述词向量集进行训练得到训练值，所述损失函数基于所述标签集和所述训练值计算得到损失值，判断所述损失值与预设阈值的大小，直至所述卷积神经网络退出训练；对用户输入的文本数据产生情感判断结果。还提出一种情感智能判断装置以及一种计算机可读存储介质。可以实现精准的情感智能判断功能。

Description

情感智能判断方法、装置及计算机可读存储介质

本申请基于巴黎公约申明享有2019年06月18日递交的申请号为CN 201910530889.7、名称为“情感智能判断方法、装置及计算机可读存储介质”的中国专利申请的优先权，该中国专利申请的整体内容以参考的方式结合在本申请中。

技术领域

本申请涉及人工智能技术领域，尤其涉及一种情感智能判断方法、装置及计算机可读存储介质。

背景技术

随着移动互联网的迅猛发展，人们通过移动参与各类网络活动时，产生了大量具有情感倾向性的文本。如何快速从这些文本中挖掘出其情感倾向性，为政府、企业以及个人的决策提供有效地帮助，已经成为自然语言处理领域的热点问题。然而现有的情感判断大多基于人工制定的规则，其分类颗粒度较大、识别较为困难、没有判断句子的语境，即没有利用句子的上下文来判断句子的真实含义，同时，情感判断的准确率也往往在达到一定水平之后裹足不前。

发明内容

本申请提供一种情感智能判断方法、装置及计算机可读存储介质，其主要目的是当用户输入文本数据时，判断所述用户输入的文本数据的情感倾向。

为实现上述目的，本申请提供的一种情感智能判断方法，包括：

接收包括基础数据集和场景数据集的语料集和标签集，将所述语料集进行包括分词、去停用词的预处理操作得到标准语料集；

基于关键字抽取算法对所述标准语料集进行关键字抽取后得到关键字数据集，对所述关键字数据集进行词向量化操作得到词向量集；

将所述词向量集输入至情感分析模型的卷积神经网络中，将所述标签集输入至所述情感分析模型的损失函数中，所述卷积神经网络接收所述词向量集进行训练得到训练值，将所述训练值输入至所述损失函数中，所述损失函数基于所述标签集和所述训练值计算得到损失值，判断所述损失值与所述卷积神经网络的预设训练阈值的大小，直至所述损失值小于所述预设训练阈值时，所述卷积神经网络退出训练；

接收用户输入的文本数据，将所述文本数据输入至所述情感分析模型中判断情感倾向，并输出判断结果。

此外，为实现上述目的，本申请还提供一种情感智能判断装置，该装置包括存储器和处理器，所述存储器中存储有可在所述处理器上运行的情感智能判断程序，所述情感智能判断程序被所述处理器执行时实现如下步骤：

此外，为实现上述目的，本申请还提供一种计算机可读存储介质，所述计算机可读存储介质上存储有情感智能判断程序，所述情感智能判断程序可被一个或者多个处理器执行，以实现如上所述的情感智能判断方法的步骤。

本申请使用卷积神经网络进行文本的情感判断，所述卷积神经网络的参数众多，有强大的表征能力，因此可以用来提取文本中的抽象特征，且提取出来的特征比人工制定的特征具有更强的泛化性能，从而更适应本申请模型的建立，提高情感判断的准确性。因此本申请所述情感智能判断方法、装置及计算机可读存储介质可以实现高效的情感智能判断功能。

附图说明

图1为本申请一实施例提供的情感智能判断方法的流程示意图；

图2为本申请一实施例提供的情感智能判断装置的内部结构示意图；

图3为本申请一实施例提供的情感智能判断装置中情感智能判断程序的模块示意图。

本申请目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

应当理解，此处所描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

本申请提供一种情感智能判断方法。参照图1所示，为本申请一实施例提供的情感智能判断方法的流程示意图。该方法可以由一个装置执行，该装置可以由软件和/或硬件实现。

在本实施例中，情感智能判断方法包括：

S1、接收包括基础数据集和场景数据集的语料集和标签集，将所述语料集进行包括分词、去停用词的预处理操作得到标准语料集。

本申请较佳实施例中，所述基础数据集包括微博评论集、影电观后感集等。所述微博评论集包括40000条微博评论数据，其中包括高兴的情感倾向的微博评论数据15000条、难过的情感倾向的微博评论数据15000条、没有表现出明显高兴或难过的情感倾向的微博评论数据10000条。所述影电观后感集和所述微博评论集类似，不再赘述。

本申请较佳实施例中，所述场景数据集包括股票评论集、政府工作报告评论集、公司财务报表评论集，所述场景数据集与所述所述微博评论集的情感划分相同，都可以被划分成包括高兴、难过和没有表现出明显高兴或难过的情感倾向数据集。

本申请较佳实施例所述标签集包括高兴、难过、正常三种情感标签，所述正常表示没有表现出明显高兴或难过的情感倾向。

本申请较佳实施例中，所述分词包括：根据所述语料集建立概率分词模型P(S)和最大化所述概率分词模型P(S)，并利用所述最大化的所述概率分词模型P(S)，对所述语料集执行分词操作。

优选地，所述概率分词模型P(S)为：

其中，W ₁,W ₂,…,W _m为所述语料集包括的词，m为所述语料集的数量，p(W _i|W _i-1)表示在词W _i-1出现的情况下词W _i出现的概率；

所述最大化所述概率分词模型P(S)：

其中，count(W _i-1,W _i)表示词W _i-1和词W _i同时出现在所述语料集内同一篇文本的文本数量，count(W _i-1)表示词W _i-1出现在所述语料集内的文本数量，argmax表示最大化操作。

所述停用词是文本数据中没有什么实际意义的词，且对文本的情感分析没有什么影响，但出现频率高的词，所述停用词包括常用的代词、介词等。

本申请较佳实施例中，所述去停用词的方法采用停用词表过滤法，基于已构建好的停用词表和所述语料集的词进行一一匹配，若匹配成功，则该词为停用词，且将所述该词从所述语料集中删除。

S2、基于关键字抽取算法对所述标准语料集进行关键字抽取后得到关键字数据集，对所述关键字数据集进行词向量化操作得到词向量集。

本申请较佳实施例所述关键字抽取算法包括：

计算所述标准语料集中任意两词W _i,W _j之间的依存关联度Dep(W _i,W _j)：

其中，len(W _i,W _j)表示词语W _i和W _j之间的依存路径长度，b是超参数；

计算所述标准语料集中任意两词W _i,W _j之间的引力值f _grav(W _i,W _j)：

其中，tfidf(W _i)、tfidf(W _j)表示词W _i,W _j的词频-逆文本频率指数，d表示词W _i和W _j的词向量之间的欧式距离；

根据所述依存关联度Dep(W _i,W _j)和所述引力值f _grav(W _i,W _j)计算所述标准语料集中任意两词W _i,W _j之间的权重系数weight(W _i,W _j)：

weight(W _i,W _j)＝Dep(W _i,W _j)*f _grav(W _i,W _j)

对所述权重系数的大小进行排序，选择权重系数weight(W _i,W _j)最大的词，完成所述关键字抽取，得到关键字数据集。

本申请较佳实施例中，所述词向量化操作采用Word2Vec算法，所述Word2Vec算法包括输入层、投影层和输出层。其中，所述输入层接收所述关键字数据集，所述输出层输出得到所述词向量集，所述投影层ζ(ω,j)为：

其中，

表示在路径ω内，第j个结点对应的霍夫曼编码，θ为所述Word2Vec模型的迭代因子，σ表示sigmoid函数，X _ω为所述关键字数据集。

所述霍夫曼编码是根据数据通信知识使用0,1码的不同排列来表示所述关键字数据集。

S3、将所述词向量集输入至情感分析模型的卷积神经网络中，将所述标签集输入至所述情感分析模型的损失函数中，所述卷积神经网络接收所述词向量集进行训练得到训练值，将所述训练值输入至所述损失函数中，所述损失函数基于所述标签集和所述训练值计算得到损失值，判断所述损失值与所述卷积神经网络的预设训练阈值的大小，直至所述损失值小于所述预设训练阈值时，所述卷积神经网络退出训练。

在本申请较佳实施例中，所述卷积神经网络包括卷积层、池化层、全连接层。所述卷积层接收所述词向量集并对所述词向量集进行卷积操作得到卷积集。

本申请较佳实施例所述卷积操作为：

其中v′为所述卷积集，v为所述词向量集，k为卷积核的大小，s为所述卷积操作的步幅，p为数据补零矩阵。

本申请较佳实施例将所述卷积集输入至所述池化层，所述池化层寻找所述卷积集中各词向量数值最大的词向量并组成池化集。

本申请较佳实施例将所述池化集输入至全连接层，所述全连接层根据激活函数输出所述训练值。所述激活函数为：

其中y为所述训练值，e为无限不循环小数。

本申请较佳实施例所述损失值E为：

其中，x为所述训练值，μ _j为所述标签集，m为所述标签集的数量，所述预设阈值一般设定为0.01。

S4、接收用户输入的文本数据，将所述文本数据输入至所述情感分析模型中判断情感倾向，并输出判断结果。

例如，用户输入一条宠物狗突然离世的文本数据至所述情感分析模型，所述情感分析模型提取所述文本数据中出现的离世、爱宠等关键字，根据所述关键字判断出所述文本表现的是难过的情感倾向，并输出所述判断结果。

发明还提供一种情感智能判断装置。参照图2所示，为本申请一实施例提供的情感智能判断装置的内部结构示意图。

在本实施例中，所述情感智能判断装置1可以是PC(Personal Computer，个人电脑)，或者是智能手机、平板电脑、便携计算机等终端设备或者服务器等。该情感智能判断装置1至少包括存储器11、处理器12，通信总线13，以及网络接口14。

其中，存储器11至少包括一种类型的可读存储介质，所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如，SD或DX存储器等)、磁性存储器、磁盘、光盘等。存储器11在一些实施例中可以是情感智能判断装置1的内部存储单元，例如该情感智能判断装置1的硬盘。存储器11在另一些实施例中也可以是情感智能判断装置1的外部存储设备，例如情感智能判断装置1上配备的插接式硬盘，智能存储卡(Smart Media Card，SMC)，安全数字(Secure Digital，SD)卡，闪存卡(Flash Card)等。进一步地，存储器11还可以既包括情感智能判断装置1的内部存储单元也包括外部存储设备。存储器11不仅可以用于存储安装于情感智能判断装置1的应用软件及各类数据，例如情感智能判断程序01的代码等，还可以用于暂时地存储已经输出或者将要输出的数据。

处理器12在一些实施例中可以是一中央处理器(Central Processing Unit，CPU)、控制器、微控制器、微处理器或其他数据处理芯片，用于运行存储器11中存储的程序代码或处理数据，例如执行情感智能判断程序01等。

通信总线13用于实现这些组件之间的连接通信。

网络接口14可选的可以包括标准的有线接口、无线接口(如WI-FI接口)，通常用于在该装置1与其他电子设备之间建立通信连接。

可选地，该装置1还可以包括用户接口，用户接口可以包括显示器(Display)、输入单元比如键盘(Keyboard)，可选的用户接口还可以包括标准的有线接口、无线接口。可选地，在一些实施例中，显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode，有机发光二极管)触摸器等。其中，显示器也可以适当的称为显示屏或显示单元，用于显示在情感智能判断装置1中处理的信息以及用于显示可视化的用户界面。

图2仅示出了具有组件11-14以及情感智能判断程序01的情感智能判断装置1，本领域技术人员可以理解的是，图1示出的结构并不构成对情感智能判断装置1的限定，可以包括比图示更少或者更多的部件，或者组合某些部件，或者不同的部件布置。

在图2所示的装置1实施例中，存储器11中存储有情感智能判断程序01；处理器12执行存储器11中存储的情感智能判断程序01时实现如下步骤：

步骤一、接收包括基础数据集和场景数据集的语料集和标签集，将所述语料集进行包括分词、去停用词的预处理操作得到标准语料集。

本申请较佳实施例中，所述场景数据集包括股票评论集、政府工作报告评论集、公司财务报表评论集，所述场景数据集与所述所述微博评论集的情感划分相同，都划分出包括高兴、难过和没有表现出明显高兴或难过的情感倾向数据集。

本申请较佳实施例中，所述分词包括根据所述语料集建立概率分词模型P(S)和最大化所述概率分词模型P(S)，并利用所述最大化的所述概率分词模型P(S)，对所述语料集执行分词操作。

优选地，所述概率分词模型P(S)为：

所述最大化所述概率分词模型P(S)：

本申请较佳实施例，所述停用词是文本数据中没有什么实际意义的词，且对文本的情感分析没有什么影响，但出现频率高的词，所述停用词包括常用的代词、介词等。

本申请较佳实施例，所述去停用词的方法为停用词表过滤法，基于已构建好的停用词表和所述语料集的词进行一一匹配，若匹配成功，则该词为停用词，且将所述该词从所述语料集中删除。

步骤二、基于关键字抽取算法对所述标准语料集进行关键字抽取后得到关键字数据集，对所述关键字数据集进行词向量化操作得到词向量集。

本申请较佳实施例所述关键字抽取算法包括：计算所述标准语料集中任意两词W _i,W _j之间的依存关联度Dep(W _i,W _j)：

weight(W _i,W _j)＝Dep(W _i,W _j)*f _grav(W _i,W _j)

对所述权重系数的大小进行排序，选择权重系数weight(W _i,W _j)最大的词。

本申请较佳实施例所述词向量化操作采用Word2Vec算法，所述Word2Vec算法包括输入层、投影层和输出层，所述输入层接收所述关键字数据集，所述输出层输出得到所述词向量集，所述投影层ζ(ω,j)为：

其中，

步骤三、将所述词向量集输入至情感分析模型的卷积神经网络中，将所述标签集输入至所述情感分析模型的损失函数中，所述卷积神经网络接收所述词向量集进行训练得到训练值，将所述训练值输入至所述损失函数中，所述损失函数基于所述标签集和所述训练值计算得到损失值，判断所述损失值与所述卷积神经网络的预设训练阈值的大小，直至所述损失值小于所述预设训练阈值时，所述卷积神经网络退出训练。

本申请较佳实施例所述卷积操作为：

其中y为所述训练值，e为无限不循环小数。

本申请较佳实施例所述损失值E为：

步骤四、接收用户输入的文本数据，将所述文本数据输入至所述情感分析模型中判断情感倾向，并输出判断结果。

例如，用户输入一条关于自己的爱宠狗突然离世的文本数据至所述情感分析模型，所述情感分析模型提取所述文本数据中出现的离世、爱宠等关键字，根据所述关键字判断出所述文本表现的是难过的情感倾向，并输出所述判断结果。

可选地，在其他实施例中，情感智能判断程序还可以被分割为一个或者多个模块，一个或者多个模块被存储于存储器11中，并由一个或多个处理器(本实施例为处理器12)所执行以完成本申请，本申请所称的模块是指能够完成特定功能的一系列计算机程序指令段，用于描述情感智能判断程序在情感智能判断装置中的执行过程。

例如，参照图3所示，为本申请情感智能判断装置一实施例中的情感智能判断程序的程序模块示意图，该实施例中，所述情感智能判断程序可以被分割为数据接收模块10、数据处理模块20、模型训练模块30、情感判断输出模块40示例性地：

所述数据接收模块10用于：接收包括基础数据集和场景数据集的语料集和标签集，将所述语料集进行包括分词、去停用词的预处理操作得到标准语料集。

所述数据处理模块20用于：基于关键字抽取算法对所述标准语料集进行关键字抽取后得到关键字数据集，对所述关键字数据集进行词向量化操作得到词向量集。

所述模型训练模块30用于：将所述词向量集输入至情感分析模型的卷积神经网络中，将所述标签集输入至所述情感分析模型的损失函数中，所述卷积神经网络接收所述词向量集进行训练得到训练值，将所述训练值输入至所述损失函数中，所述损失函数基于所述标签集和所述训练值计算得到损失值，判断所述损失值与所述卷积神经网络的预设训练阈值的大小，直至所述损失值小于所述预设训练阈值时，所述卷积神经网络退出训练。

所述情感判断输出模块40用于：接收用户输入的文本数据，将所述文本数据输入至所述情感分析模型中判断情感倾向，并输出判断结果。

上述数据接收模块10、数据处理模块20、模型训练模块30、情感判断输出模块40等程序模块被执行时所实现的功能或操作步骤与上述实施例大体相同，在此不再赘述。

此外，本申请实施例还提出一种计算机可读存储介质，所述计算机可读存储介质上存储有情感智能判断程序，所述情感智能判断程序可被一个或多个处理器执行，以实现如下操作：

接收包括基础数据集和场景数据集的语料集和标签集，将所述语料集进行包括分词、去停用词的预处理操作得到标准语料集。

基于关键字抽取算法对所述标准语料集进行关键字抽取后得到关键字数据集，对所述关键字数据集进行词向量化操作得到词向量集。

将所述词向量集输入至情感分析模型的卷积神经网络中，将所述标签集输入至所述情感分析模型的损失函数中，所述卷积神经网络接收所述词向量集进行训练得到训练值，将所述训练值输入至所述损失函数中，所述损失函数基于所述标签集和所述训练值计算得到损失值，判断所述损失值与所述卷积神经网络的预设训练阈值的大小，直至所述损失值小于所述预设训练阈值时，所述卷积神经网络退出训练。

需要说明的是，上述本申请实施例序号仅仅为了描述，不代表实施例的优劣。并且本文中的术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，或者网络设备等)执行本申请各个实施例所述的方法。

以上仅为本申请的优选实施例，并非因此限制本申请的专利范围，凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本申请的专利保护范围内。

Claims

一种情感智能判断方法，其特征在于，所述方法包括：

接收包括基础数据集和场景数据集的语料集和标签集，将所述语料集进行包括分词、去停用词的预处理操作得到标准语料集；

基于关键字抽取算法对所述标准语料集进行关键字抽取后得到关键字数据集，对所述关键字数据集进行词向量化操作得到词向量集；

将所述词向量集输入至情感分析模型的卷积神经网络中，将所述标签集输入至所述情感分析模型的损失函数中，所述卷积神经网络接收所述词向量集进行训练得到训练值，将所述训练值输入至所述损失函数中，所述损失函数基于所述标签集和所述训练值计算得到损失值，判断所述损失值与所述卷积神经网络的预设训练阈值的大小，直至所述损失值小于所述预设训练阈值时，所述卷积神经网络退出训练；

接收用户输入的文本数据，将所述文本数据输入至所述情感分析模型中判断情感倾向，并输出判断结果。
如权利要求1所述的情感智能判断方法，其特征在于：

所述基础数据集包括微博评论集、影电观后感集；

所述场景数据集包括股票评论集、政府工作报告评论集、公司财务报表评论集；

所述标签集包括高兴、难过、正常三种情感标签。
如权利要求1所述的情感智能判断方法，其特征在于，所述分词包括：

根据所述语料集建立概率分词模型P(S)，并最大化所述概率分词模型P(S)，并利用最大化的所述概率分词模型P(S)，对所述语料集执行分词操作。
如权利要求3所述的情感智能判断方法，其特征在于，所述概率分词模型P(S)为：

其中，W ₁,W ₂,…,W _m为所述语料集包括的词，m为所述语料集包括的词的数量，p(W _i|W _i-1)表示在词W _i-1出现的情况下词W _i出现的概率。
如权利要求4所述的情感智能判断方法，其特征在于，所述最大化所述概率分词模型P(S)为：

其中，count(W _i-1,W _i)表示词W _i-1和词W _i同时出现在所述语料集内同一篇文本的文本数量，count(W _i-1)表示词W _i-1出现在所述语料集内的文本数量，argmax表示最大化操作。
如权利要求2所述的情感智能判断方法，其特征在于，所述基于关键字抽取算法对所述标准语料集进行关键字抽取后得到关键字数据集，包括：

计算所述标准语料集中任意两词W _i,W _j之间的依存关联度Dep(W _i,W _j)：

其中，len(W _i,W _j)表示词语W _i和W _j之间的依存路径长度，b是超参数；

计算所述标准语料集中任意两词W _i,W _j之间的引力值f _grav(W _i,W _j)：

其中，tfidf(W _i)、tfidf(W _j)表示词W _i,W _j的词频-逆文本频率指数，d表示词W _i和W _j的词向量之间的欧式距离；

根据所述依存关联度Dep(W _i,W _j)和所述引力值f _grav(W _i,W _j)计算所述标准语料集中任意两词W _i,W _j之间的权重系数weight(W _i,W _j)：

weight(W _i,W _j)＝Dep(W _i,W _j)*f _grav(W _i,W _j)

对所述权重系数的大小进行排序，选择权重系数weight(W _i,W _j)最大的词，完成所述关键字抽取，得到关键字数据集。
如权利要求6中的情感智能判断方法，其特征在于，所述接收所述词向量集进行训练包括对所述词向量集进行卷积操作和激活操作；

所述卷积操作为：

其中v′为所述卷积操作输出的卷积集，v为所述词向量集，k为卷积核的大小，s为所述卷积操作的步幅，p为数据补零矩阵；

所述激活函数为：

其中y为所述训练值，e为无限不循环小数。
一种情感智能判断装置，其特征在于，所述装置包括存储器和处理器，所述存储器上存储有可在所述处理器上运行的情感智能判断程序，所述情感智能判断程序被所述处理器执行时实现如下步骤：

接收包括基础数据集和场景数据集的语料集和标签集，将所述语料集进行包括分词、去停用词的预处理操作得到标准语料集；

基于关键字抽取算法对所述标准语料集进行关键字抽取后得到关键字数据集，对所述关键字数据集进行词向量化操作得到词向量集；

将所述词向量集输入至情感分析模型的卷积神经网络中，将所述标签集输入至所述情感分析模型的损失函数中，所述卷积神经网络接收所述词向量集进行训练得到训练值，将所述训练值输入至所述损失函数中，所述损失函数基于所述标签集和所述训练值计算得到损失值，判断所述损失值与所述卷积神经网络的预设训练阈值的大小，直至所述损失值小于所述预设训练阈值时，所述卷积神经网络退出训练；

接收用户输入的文本数据，将所述文本数据输入至所述情感分析模型中判断情感倾向，并输出判断结果。
如权利要求8所述的情感智能判断装置，其特征在于，

所述基础数据集包括微博评论集、影电观后感集；

所述场景数据集包括股票评论集、政府工作报告评论集、公司财务报表评论集；

所述标签集包括高兴、难过、正常三种情感标签。
如权利要求8所述的情感智能判断装置，其特征在于，所述分词包括根据所述语料集建立概率分词模型P(S)，并最大化所述概率分词模型P(S)，并利用最大化的所述概率分词模型P(S)，对所述语料集执行分词操作。
如权利要求10所述的情感智能判断装置，所述概率分词模型P(S)为：

其中，W ₁,W ₂,…,W _m为所述语料集包括的词，m为所述语料集包括的词的数量，p(W _i|W _i-1)表示在词W _i-1出现的情况下词W _i出现的概率。
如权利要求11所述的情感智能判断装置，所述最大化所述概率分词模型P(S)为：

其中，count(W _i-1,W _i)表示词W _i-1和词W _i同时出现在所述语料集内同一篇文本的文本数量，count(W _i-1)表示词W _i-1出现在所述语料集内的文本数量， argmax表示最大化操作。
如权利要求12所述的情感智能判断装置，其特征在于，所述基于关键字抽取算法对所述标准语料集进行关键字抽取后得到关键字数据集，包括：

计算所述标准语料集中任意两词W _i,W _j之间的依存关联度Dep(W _i,W _j)：

其中，len(W _i,W _j)表示词语W _i和W _j之间的依存路径长度，b是超参数；

计算所述标准语料集中任意两词W _i,W _j之间的引力值f _grav(W _i,W _j)：

其中，tfidf(W _i)、tfidf(W _j)表示词W _i,W _j的词频-逆文本频率指数，d表示词W _i和W _j的词向量之间的欧式距离；

根据所述依存关联度Dep(W _i,W _j)和所述引力值f _grav(W _i,W _j)计算所述标准语料集中任意两词W _i,W _j之间的权重系数weight(W _i,W _j)：

weight(W _i,W _j)＝Dep(W _i,W _j)*f _grav(W _i,W _j)

对所述权重系数的大小进行排序，选择权重系数weight(W _i,W _j)最大的词，完成所述关键字抽取，得到关键字数据集。
如权利要求13中的情感智能判断装置，其特征在于，所述接收所述词向量集进行训练包括对所述词向量集进行卷积操作和激活操作；

所述卷积操作为：

其中v′为所述卷积操作输出的卷积集，v为所述词向量集，k为卷积核的大小，s为所述卷积操作的步幅，p为数据补零矩阵；

所述激活函数为：

其中y为所述训练值，e为无限不循环小数。
一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有情感智能判断程序，所述情感智能判断程序可被一个或者多个处理器执行，以实现如下步骤：

接收包括基础数据集和场景数据集的语料集和标签集，将所述语料集进行包括分词、去停用词的预处理操作得到标准语料集；

基于关键字抽取算法对所述标准语料集进行关键字抽取后得到关键字数据集，对所述关键字数据集进行词向量化操作得到词向量集；

将所述词向量集输入至情感分析模型的卷积神经网络中，将所述标签集输入至所述情感分析模型的损失函数中，所述卷积神经网络接收所述词向量集进行训练得到训练值，将所述训练值输入至所述损失函数中，所述损失函数基于所述标签集和所述训练值计算得到损失值，判断所述损失值与所述卷积神经网络的预设训练阈值的大小，直至所述损失值小于所述预设训练阈值时，所述卷积神经网络退出训练；

接收用户输入的文本数据，将所述文本数据输入至所述情感分析模型中判断情感倾向，并输出判断结果。
如权利要求15所述的计算机可读存储介质，其特征在于，

所述基础数据集包括微博评论集、影电观后感集；

所述场景数据集包括股票评论集、政府工作报告评论集、公司财务报表评论集；

所述标签集包括高兴、难过、正常三种情感标签。
如权利要求15所述的计算机可读存储介质，其特征在于，所述分词包括根据所述语料集建立概率分词模型P(S)，并最大化所述概率分词模型P(S)，并利用最大化的所述概率分词模型P(S)，对所述语料集执行分词操作。
如权利要求17所述的计算机可读存储介质，所述概率分词模型P(S)为：

其中，W ₁,W ₂,…,W _m为所述语料集包括的词，m为所述语料集包括的词的数量，p(W _i|W _i-1)表示在词W _i-1出现的情况下词W _i出现的概率；

所述最大化所述概率分词模型P(S)为：

其中，count(W _i-1,W _i)表示词W _i-1和词W _i同时出现在所述语料集内同一篇文本的文本数量，count(W _i-1)表示词W _i-1出现在所述语料集内的文本数量，argmax表示最大化操作。
如权利要求18所述的计算机可读存储介质，其特征在于，所述基于关键字抽取算法对所述标准语料集进行关键字抽取后得到关键字数据集，包括：

计算所述标准语料集中任意两词W _i,W _j之间的依存关联度Dep(W _i,W _j)：

其中，len(W _i,W _j)表示词语W _i和W _j之间的依存路径长度，b是超参数；

计算所述标准语料集中任意两词W _i,W _j之间的引力值f _grav(W _i,W _j)：

其中，tfidf(W _i)、tfidf(W _j)表示词W _i,W _j的词频-逆文本频率指数，d表示词W _i和W _j的词向量之间的欧式距离；

根据所述依存关联度Dep(W _i,W _j)和所述引力值f _grav(W _i,W _j)计算所述标准语料集中任意两词W _i,W _j之间的权重系数weight(W _i,W _j)：

weight(W _i,W _j)＝Dep(W _i,W _j)*f _grav(W _i,W _j)

对所述权重系数的大小进行排序，选择权重系数weight(W _i,W _j)最大的词，完成所述关键字抽取，得到关键字数据集。
如权利要求19中的计算机可读存储介质，其特征在于，所述接收所述词向量集进行训练包括对所述词向量集进行卷积操作和激活操作；

所述卷积操作为：

其中v′为所述卷积操作输出的卷积集，v为所述词向量集，k为卷积核的大小，s为所述卷积操作的步幅，p为数据补零矩阵；

所述激活函数为：

其中y为所述训练值，e为无限不循环小数。