WO2021051598A1

WO2021051598A1 - 文本情感分析模型训练方法、装置、设备及可读存储介质

Info

Publication number: WO2021051598A1
Application number: PCT/CN2019/118268
Authority: WO
Inventors: 金戈; 徐亮
Original assignee: 平安科技（深圳）有限公司
Priority date: 2019-09-19
Filing date: 2019-11-14
Publication date: 2021-03-25
Also published as: CN110807314A

Abstract

一种文本情感分析模型训练方法、装置、设备及可读存储介质，涉及人工智能技术领域，所述方法包括：获取待训练的文本样本（S10）；通过预设的分词方法对文本样本进行分词处理，划分为若干个不同的词（S20）；基于预设的编码方法对若干个不同的词分别进行编码处理，得到词向量（S30）；将词向量输入至预设的深度神经网络中，基于嵌入层对词向量进行降维处理（S40）；基于深度神经网络中的隐藏层对降维后的词向量进行计算，得到对应的特征（S50）；通过多分类SVM支持向量机对文本样本对应的特征进行分类，确定情感类别（S60）；基于损失函数确定情感类别与正确情感类别的差异值，当差异值满足预设条件时，判定文本情感分析模型训练完成（S70）。所述方法提高了文本情感分析的准确率。

Description

文本情感分析模型训练方法、装置、设备及可读存储介质

本申请要求于2019年9月19日提交中国专利局、申请号为201910884618.1、发明名称为“文本情感分析模型训练方法、装置、设备及可读存储介质”的中国专利申请的优先权，其全部内容通过引用结合在申请中。

技术领域

本申请涉及人工智能技术领域，尤其涉及文本情感分析模型训练方法、装置、设备及可读存储介质。

背景技术

在现有技术中，通常是使用深度神经网络来处理文本情感分析问题，深度神经网络能够捕捉长程的上下文信息，具有较强的特征抽取能力。但是，深度神经网络只有一个输出，因此，发明人意识到依靠深度神经网络只能完成二分类情感分析，现有的文本情感分析方法的准确率较低。

发明内容

本申请的主要目的在于提供一种文本情感分析模型训练方法、装置、设备及可读存储介质，旨在解决现有的文本情感分析方法的准确率低的技术问题。

为实现上述目的，本申请提供一种文本情感分析模型训练方法，所述文本情感分析模型训练方法包括以下步骤：获取待训练的文本样本，其中，所述文本样本带有标注信息，所述标注信息为所述文本样本包含的正确情感类别；通过预设的分词方法对所述文本样本进行分词处理，将所述文本样本划分为若干个不同的词；基于预设的编码方法对所述若干个不同的词分别进行编码处理，得到所述文本样本对应的词向量；将所述词向量输入至预设的深度神经网络中，基于所述预设的深度神经网络中的嵌入层对所述词向量进行降维处理，得到降维后的词向量；基于所述预设的深度神经网络中的隐藏层对所述降维后的词向量进行计算，得到所述文本样本对应的特征；通过多分类SVM支持向量机对所述文本样本对应的特征进行分类，确定所述文本样本对应的情感类别；基于损失函数确定所述情感类别与所述正确情感类别的差异值，当所述差异值满足预设条件时，判定所述文本情感分析模型训练完成。

本申请第二方面提供了一种文本情感分析模型训练装置，所述文本情感分析模型训练装置包括：获取模块，用于获取待训练的文本样本，其中，所述文本样本带有标注信息，所述标注信息为所述文本样本包含的正确情感类别；分词模块，用于通过预设的分词方法对所述文本样本进行分词处理，将所述文本样本划分为若干个不同的词；编码模块，用于基于预设的编码方法对所述若干个不同的词分别进行编码处理，得到所述文本样本对应的词向量；降维模块，用于将所述词向量输入至预设的深度神经网络中，基于所述预设的深度神经网络中的嵌入层对所述词向量进行降维处理，得到降维后的词向量；特征模块，用于基于所述预设的深度神经网络中的隐藏层对所述降维后的词向量进行计算，得到所述文本样本对应的特征；分类模块，用于通过多分类SVM支持向量机对所述文本样本对应的特征进行分类，确定所述文本样本对应的情感类别；完成模块，用于基于损失函数确定所述情感类别与正确情感类别的差异值，当所述差异值满足预设条件时，判定所述文本情感分析模型训练完成。

本申请第三方面提供了一种文本情感分析模型训练设备，包括：存储器和至少一个处理器，所述存储器中存储有指令，所述存储器和所述至少一个处理器通过线路互联；所述至少一个处理器调用所述存储器中的所述指令，以使得所述文本情感分析模型训练设备执行上述第一方面所述的方法。

本申请的第四方面提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有计算机指令，当所述计算机指令在计算机上运行时，使得计算机执行上述第一方面所述的方法。

本申请提供的一种文本情感分析模型训练方法、装置、设备及可读存储介质，首先获取带有标注信息的待训练文本样本，标注信息为文本样本包含的正确情感类别，并对文本样本进行分词处理，得到若干个不同的词；对若干个不同的词分别进行编码处理，得到文本样本对应的词向量，并将词向量输入至预设的深度神经网络中，基于预设的深度神经网络中的嵌入层对词向量进行降维处理；进一步地，基于预设的深度神经网络中的隐藏层对降维后的词向量进行计算，得到文本样本对应的特征；最后，通过多分类SVM支持向量机对计算得到的特征进行分类，从而确定文本样本对应的情感类别，在文本情感分析模型训练过程中，基于损失函数确定情感类别与正确情感类别的差异值，当差异值满足预设条件时，即可判定文本情感分析模型训练完成。本申请提出的文本情感分析模型训练方法，通过深度神经网络来抽取文本样本中的情感特征，再使用多分类SVM支持向量机对提取出的特征进行多分类，达到提高分类准确率的效果。

附图说明

图1为本申请中实施例方案涉及的硬件运行环境的文本情感分析模型训练设备结构示意图；

图2为本申请中文本情感分析模型训练方法一实施例的流程示意图；

图3为本申请中文本情感分析模型训练装置一实施例的功能模块示意图；

图4为本申请中文本情感分析模型训练装置一实施例中分词模块的功能单元示意图；

图5为本申请中文本情感分析模型训练装置一实施例中特征模块的功能单元示意图；

图6为本申请中文本情感分析模型训练装置一实施例中分类模块的功能单元示意图。

具体实施方式

本申请实施例提供了一种文本情感分析模型训练方法、装置、设备及存储介质，用于通过深度神经网络来抽取文本样本中的情感特征，再使用多分类SVM支持向量机对提取出的特征进行多分类，达到提高分类准确率的效果。

为了使本技术领域的人员更好地理解本申请方案，下面将结合本申请实施例中的附图，对本申请实施例进行描述。

如图1所示，图1为本申请实施例方案涉及的硬件运行环境的文本情感分析模型训练设备结构示意图。

本申请实施例中的文本情感分析模型训练设备可以是便携计算机、服务器等具有数据处理能力的终端设备。

如图1所示，该文本情感分析模型训练设备可以包括：处理器1001，例如CPU，网络接口1004，用户接口1003，存储器1005，通信总线1002。其中，通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard)，可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选地可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器，也可以是稳定的存储器(non-volatile memory)，例如磁盘存储器。存储器1005可选地还可以是独立于前述处理器1001的存储装置。

本领域技术人员可以理解，图1中示出的文本情感分析模型训练设备结构并不构成对文本情感分析模型训练设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

如图1所示，作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及文本情感分析模型训练程序。

在图1所示的文本情感分析模型训练设备中，网络接口1004主要用于连接后台服务器，与后台服务器进行数据通信；用户接口1003主要用于连接客户端(用户端)，与客户端进行数据通信；而处理器1001可以用于调用存储器1005中存储的文本情感分析模型训练程序，并执行以下文本情感分析模型训练方法的各实施例的操作。

参照图2，图2为本申请文本情感分析模型训练方法一实施例的流程示意图，在该实施例中，文本情感分析模型训练方法包括：

步骤S10，获取待训练的文本样本，其中，文本样本带有标注信息，标注信息为文本样本包含的正确情感类别。

在本实施例中，首先，获取待训练的文本样本，以便基于文本样本对预设的文本情感分析模型进行训练。具体地，待训练的文本样本带有标注信息，其中，标注信息主要是文本样本所包含的情感类别信息，在本实施例中，情感类别信息包括但不限于乐观、悲观、愤怒及惊讶等。

步骤S20，通过预设的分词方法对文本样本进行分词处理，将文本样本划分为若干个不同的词。

进一步地，对待训练的文本样本进行预处理，预处理的过程主要是对文本样本进行分词。现代分词都是基于统计的分词，而统计的样本内容来自于一些标准的语料库，通过标准语料库，可以近似地计算出所有的词之间的二元条件概率。基于标准语料库可以计算出文本样本中包含的各个词对应的二元条件概率，通过二元条件概率确定文本样本的联合分布概率，将最大联合分布概率对应的分词方法，确定为文本样本对应的最优分词方法，以便通过最优分词方法将文本样本划分为若干个不同的词。

步骤S30，基于预设的编码方法对若干个不同的词分别进行编码处理，得到文本样本对应的词向量。

进一步地，对文本样本进行分词后，将分词得到的若干个词分别进行编码，在本实施例中，主要是采用one-hot编码。one-hot编码的目的是将类别变量转换为机器学习算法易于利用的一种形式，也就是说，one-hot编码是把文本样本分词后得到的离散变量转换为连续变量。使用one-hot编码对文本样本包含的各个词进行“二进制化”操作，提高了变量之间的距离计算的合理性。可以理解的是，在本实施例中，对文本样本分词处理后得到的各个词进行编码得到的是各个词对应的词向量。

步骤S40，将词向量输入至预设的深度神经网络中，基于预设的深度神经网络中的嵌入层对词向量进行降维处理，得到降维后的词向量。

进一步地，将编码得到的词向量输入至深度神经网络中，基于深度神经网络对编码得到的词向量进行处理，以进行文本样本的特征提取。在本实施例中，由于使用one-hot编码得到的词向量维数高且稀疏，因此，首先通过深度神经网络中的嵌入层对输入的词向量进行降维处理。

具体地，降维处理的过程如下：首先，获取嵌入层中存储的权重矩阵W，因为深度神经网络中的嵌入层本质就是一个特殊的全连接，只是输入至深度神经网络的向量都是0或1，因此，将输入的词向量与权重矩阵W相乘，就可以降低输入词向量的维度。

步骤S50，基于预设的深度神经网络中的隐藏层对降维后的词向量进行计算，得到文本样本对应的特征。

进一步地，通过深度神经网络中的隐藏层对降维后的词向量进行计算，从而对降维后的词向量进行特征提取，提取出的特征即为文本样本对应的特征。

具体地，特征提取的过程如下：

随机将第L-1段文本样本经过分词及编码后得到的词向量输入至深度神经网络中，通过嵌入层的权重矩阵W对输入的词向量进行降维处理，并将降维处理后得到的词向量作为深度神经网络提取出的第1个文本样本的特征；进一步地，获取预设的深度神经网络中第L-1层隐藏层的权重矩阵，基于非线性激活函数对第L-1层的权重矩阵及第1段文本样本的特征进行计算，得到第L段文本样本的特征，其中，基于非线性激活函数进行计算的公式如下：

其中，X _i为第i段文本样本经过分词及编码处理后得到的词向量，h _i ¹为预设的深度神经网络提取出的第1段文本样本的特征，σ为非线性激活函数，W ^L-1为预设的深度神经网络中第L-1层隐藏层的权重矩阵，h _i ^L为预设的深度神经网络提取出的第L段文本样本的特征。

步骤S60，通过多分类SVM支持向量机对文本样本对应的特征进行分类，确定文本样本对应的情感类别。

完成待训练的文本样本的特征提取后，进一步地，基于多分类SVM(Support Vector Machine，支持向量机)对提取的特征进行分类，从而确定文本样本的情感类别。

具体地，假设多分类SVM支持向量机的预设数据集中情感的种类为k种，记为y∈{1，…，K}；同时，随机初始化k个权重向量W ^y，则对于第i个文本样本，多分类SVM支持向量机的决策为：

即在k个情感种类中，预设的文本情感分析模型判别出

的最大乘积所对应的类别信息，为文本样本对应的情感类别。

步骤S70，基于损失函数确定情感类别与正确情感类别的差异值，当差异值满足预设条件时，判定文本情感分析模型训练完成。

在本实施例中，是通过损失函数来判断文本情感分析模型是否训练完成，损失函数定义如下：

s.t.对于所有i,所有y：

其中，y _i为文本样本对应的正确情感类别，在本实施例中，因为待训练的文本样本均带有正确的情感类别标注信息，因此，损失函数要求所有错误类别的得分都小于正确类别的得分。同时，在本实施例中，定义情感类别之间的差异度Δ(y,j)，同种情感类别之间的差异度Δ(y,y)＝0，不同种情感类别之间的差异可以设置为1也可以设置为不同值。损失函数要求错误类别的得分与正确类别的得分之间的间隔大于二者之间的差异Δ(y _i,y)。

在本实施例中，首先获取带有标注信息的待训练文本样本，标注信息为文本样本包含的正确情感类别，并对文本样本进行分词处理，得到若干个不同的词；对若干个不同的词分别进行编码处理，得到文本样本对应的词向量，并将词向量输入至预设的深度神经网络中，基于预设的深度神经网络中的嵌入层对词向量进行降维处理；进一步地，基于预设的深度神经网络中的隐藏层对降维后的词向量进行计算，得到文本样本对应的特征；最后，通过多分类SVM支持向量机对计算得到的特征进行分类，从而确定文本样本对应的情感类别，在文本情感分析模型训练过程中，基于损失函数确定情感类别与正确情感类别的差异值，当差异值满足预设条件时，即可判定文本情感分析模型训练完成。本申请提出的文本情感分析模型训练方法，通过深度神经网络来抽取文本样本中的情感特征，再使用多分类SVM支持向量机对提取出的特征进行多分类，达到提高分类准确率的效果。

进一步地，所述步骤S20包括：

步骤S21，基于标准语料库计算文本样本中包含的各个词对应的二元条件概率，其中，标准语料库中任意两个词W ₁和W ₂的二元条件概率分布表示为：

其中，freq(W ₁,W ₂)表示W ₁和W ₂在标准语料库中相邻一起出现的次数，freq(W ₁)和freq(W ₂)分别表示W ₁和W ₂在标准语料库中出现的统计次数；

步骤S22，基于二元条件概率确定文本样本中各个词的联合分布概率，从联合分布概率中确定最大联合分布概率，将最大联合分布概率对应的分词方法，确定为文本样本对应的最优分词方法；

步骤S23，基于最优分词方法将文本样本划分为若干个不同的词。

在本实施例中，通过标准语料库计算出文本样本中包含的各个词对应的二元条件概率，通过二元条件概率确定文本样本的联合分布概率，将最大联合分布概率对应的分词方法，确定为文本样本对应的最优分词方法。

具体地，对于任意两个词W ₁和W ₂，它们的二元条件概率分布可以近似的表示为：

其中，freq(W ₁，W ₂)表示W ₁和W ₂在标准语料库中相邻一起出现的次数，而freq(W ₁)和freq(W ₂)则分别表示W ₁和W ₂在标准语料库中出现的统计次数。

通过上述二元条件概率分布公式，计算出文本样本中包含的各个词对应的二元条件概率，根据二元条件概率确定文本样本中各个词的联合分布概率，找到最大联合分布概率对应的分词方法，即为文本样本对应的最优分词方法。通过最优分词方法对文本样本进行分词处理，即可将文本样本划分为若干个不同的词。

进一步地，在步骤S70之后，还包括：

在本实施例中，完成对预设的文本情感分析模型的训练后，当接收到文本情感分析指令时，首先获取预设的文本情感分析模型，使用预设的文本情感分析模型对待分析文本进行文本情感分析，以输出待分析文本包含的情感类别信息。

具体地，首先，对输入的待分析文本进行预处理，即对待分析文本进行分词；进一步地，基于one-hot编码方法对分词得到的若干个词进行编码，得到对应的词向量；将编码得到的词向量输入至深度神经网络中，以便通过深度神经网络提取出文本样本的特征；最后，基于多分类SVM支持向量机对提取出的特征进行情感类别分类，并最终输出待分析文本对应的情感类别信息。

参照图3，图3为本申请文本情感分析模型训练装置一实施例的功能模块示意图。

在本实施例中，文本情感分析模型训练装置包括：

获取模块10，用于获取待训练的文本样本，其中，所述文本样本带有标注信息，所述标注信息为所述文本样本包含的正确情感类别；

分词模块20，用于通过预设的分词方法对所述文本样本进行分词处理，将所述文本样本划分为若干个不同的词；

编码模块30，用于基于预设的编码方法对所述若干个不同的词分别进行编码处理，得到所述文本样本对应的词向量；

降维模块40，用于将所述词向量输入至预设的深度神经网络中，基于所述预设的深度神经网络中的嵌入层对所述词向量进行降维处理，得到降维后的词向量；

特征模块50，用于基于所述预设的深度神经网络中的隐藏层对所述降维后的词向量进行计算，得到所述文本样本对应的特征；

分类模块60，用于通过多分类SVM支持向量机对所述文本样本对应的特征进行分类，确定所述文本样本对应的情感类别；

完成模块70，用于基于损失函数确定所述情感类别与所述正确情感类别的差异值，当所述差异值满足预设条件时，判定所述文本情感分析模型训练完成。

进一步地，参照图4，所述分词模块20包括：

概率计算单元201，用于基于标准语料库计算所述文本样本中包含的各个词对应的二元条件概率，其中，标准语料库中任意两个词W ₁和W ₂的二元条件概率分布表示为：

其中，freq(W ₁，W ₂)表示W ₁和W ₂在标准语料库中相邻一起出现的次数，freq(W ₁)和freq(W ₂)分别表示W ₁和W ₂在标准语料库中出现的统计次数；

最优分词单元202，用于基于所述二元条件概率确定所述文本样本中各个词的联合分布概率，从所述联合分布概率中确定最大联合分布概率，将所述最大联合分布概率对应的分词方法，确定为所述文本样本对应的最优分词方法；

文本划分单元203，用于基于所述最优分词方法将所述文本样本划分为若干个不同的词

进一步地，参照图5，所述特征模块50包括：

特征计算单元501，用于将第L-1段文本样本对应的所述降维后的词向量作为第1段文本样本的特征，并获取所述预设的深度神经网络中第L-1层隐藏层的权重矩阵，基于非线性激活函数对所述第L-1层的权重矩阵及所述第1段文本样本的特征进行计算，得到第L段文本样本的特征，其中，基于非线性激活函数进行计算的公式如下：

其中，X _i为第i段文本样本经过分词及编码处理后得到的词向量，h _i ¹为所述预设的深度神经网络提取出的第1段文本样本的特征，σ为非线性激活函数，W ^L-1为所述预设的深度神经网络中第L-1层隐藏层的权重矩阵，h _i ^L为所述预设的深度神经网络提取出的第L段文本样本的特征。

进一步地，参照图6，所述分类模块60包括：

类别计算单元601，用于随机初始化k个权重向量W ^y，则对于第i个文本样本，所述多分类SVM支持向量机的决策为：

其中，k为所述多分类SVM支持向量机的预设数据集中的情感类别数目；

类别确定单元602，用于将

的最大乘积对应的情感类别确定为所述文本样本对应的情感类别。

进一步地，所述降维模块40具体用于：

在预设的深度神经网络中，获取权重矩阵，所述权重矩阵设置在所述预设的深度神经网络中的嵌入层中；

将所述词向量与权重矩阵相乘，得到降维后的词向量。

本申请还提供一种文本情感分析模型训练设备，包括：存储器和至少一个处理器，所述存储器中存储有指令，所述存储器和所述至少一个处理器通过线路互联；所述至少一个处理器调用所述存储器中的所述指令，以使得所述文本情感分析模型训练设备执行上述文本情感分析模型训练方法中的步骤。

本申请还提供一种计算机可读存储介质，该计算机可读存储介质可以为非易失性计算机可读存储介质，也可以为易失性计算机可读存储介质。计算机可读存储介质存储有计算机指令，当所述计算机指令在计算机上运行时，使得计算机执行如下步骤：

获取待训练的文本样本，其中，所述文本样本带有标注信息，所述标注信息为所述文本样本包含的正确情感类别；

通过预设的分词方法对所述文本样本进行分词处理，将所述文本样本划分为若干个不同的词；

基于预设的编码方法对所述若干个不同的词分别进行编码处理，得到所述文本样本对应的词向量；

将所述词向量输入至预设的深度神经网络中，基于所述预设的深度神经网络中的嵌入层对所述词向量进行降维处理，得到降维后的词向量；

基于所述预设的深度神经网络中的隐藏层对所述降维后的词向量进行计算，得到所述文本样本对应的特征；

通过多分类SVM支持向量机对所述文本样本对应的特征进行分类，确定所述文本样本对应的情感类别；

基于损失函数确定所述情感类别与所述正确情感类别的差异值，当所述差异值满足预设条件时，判定所述文本情感分析模型训练完成。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统，装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

以上所述，以上实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims

一种文本情感分析模型训练方法，所述文本情感分析模型训练方法包括以下步骤：

获取待训练的文本样本，其中，所述文本样本带有标注信息，所述标注信息为所述文本样本包含的正确情感类别；

通过预设的分词方法对所述文本样本进行分词处理，将所述文本样本划分为若干个不同的词；

基于预设的编码方法对所述若干个不同的词分别进行编码处理，得到所述文本样本对应的词向量；

将所述词向量输入至预设的深度神经网络中，基于所述预设的深度神经网络中的嵌入层对所述词向量进行降维处理，得到降维后的词向量；

基于所述预设的深度神经网络中的隐藏层对所述降维后的词向量进行计算，得到所述文本样本对应的特征；

通过多分类SVM支持向量机对所述文本样本对应的特征进行分类，确定所述文本样本对应的情感类别；

基于损失函数确定所述情感类别与所述正确情感类别的差异值，当所述差异值满足预设条件时，判定所述文本情感分析模型训练完成。
如权利要求1所述的文本情感分析模型训练方法，所述通过预设的分词方法对所述文本样本进行分词处理，将所述文本样本划分为若干个不同的词包括：

基于标准语料库计算所述文本样本中包含的各个词对应的二元条件概率，其中，标准语料库中任意两个词W ₁和W ₂的二元条件概率分布表示为：

其中，freq(W ₁,W ₂)表示W ₁和W ₂在标准语料库中相邻一起出现的次数，freq(W ₁)和freq(W ₂)分别表示W ₁和W ₂在标准语料库中出现的统计次数；

基于所述二元条件概率确定所述文本样本中各个词的联合分布概率，从所述联合分布概率中确定最大联合分布概率，将所述最大联合分布概率对应的分词方法，确定为所述文本样本对应的最优分词方法；

基于所述最优分词方法将所述文本样本划分为若干个不同的词。
如权利要求1所述的文本情感分析模型训练方法，所述基于所述预设的深度神经网络中的隐藏层对所述降维后的词向量进行计算，得到所述文本样本对应的特征包括：

将第L-1段文本样本对应的所述降维后的词向量作为第1段文本样本的特征，并获取所述预设的深度神经网络中第L-1层隐藏层的权重矩阵，基于非线性激活函数对所述第L-1层的权重矩阵及所述第1段文本样本的特征进行计算，得到第L段文本样本的特征，其中，基于非线性激活函数进行计算的公式如下：

其中，X _i为第i段文本样本经过分词及编码处理后得到的词向量，h _i ¹为所述预设的深度神经网络提取出的第1段文本样本的特征，σ为非线性激活函数，W ^L-1为所述预设的深度神经网络中第L-1层隐藏层的权重矩阵，h _i ^L为所述预设的深度神经网络提取出的第L段文本样本的特征。
如权利要求3所述的文本情感分析模型训练方法，所述通过多分类SVM支持向量机对所述文本样本对应的特征进行分类，确定所述文本样本对应的情感类别包括：

随机初始化k个权重向量W ^y，则对于第i个文本样本，所述多分类SVM支持向量机的决策为：

其中，k为所述多分类SVM支持向量机的预设数据集中的情感类别数目；

将
的最大乘积对应的情感类别确定为所述文本样本对应的情感类别。
如权利要求1所述的文本情感分析模型训练方法，所述将所述词向量输入至预设的深度神经网络中，基于所述预设的深度神经网络中的嵌入层对所述词向量进行降维处理，得到降维后的词向量包括：

在预设的深度神经网络中，获取权重矩阵，所述权重矩阵设置在所述预设的深度神经网络中的嵌入层中；

将所述词向量与权重矩阵相乘，得到降维后的词向量。
一种文本情感分析模型训练装置，所述文本情感分析模型训练装置包括：

获取模块，用于获取待训练的文本样本，其中，所述文本样本带有标注信息，所述标注信息为所述文本样本包含的正确情感类别；

分词模块，用于通过预设的分词方法对所述文本样本进行分词处理，将所述文本样本划分为若干个不同的词；

编码模块，用于基于预设的编码方法对所述若干个不同的词分别进行编码处理，得到所述文本样本对应的词向量；

降维模块，用于将所述词向量输入至预设的深度神经网络中，基于所述预设的深度神经网络中的嵌入层对所述词向量进行降维处理，得到降维后的词向量；

特征模块，用于基于所述预设的深度神经网络中的隐藏层对所述降维后的词向量进行计算，得到所述文本样本对应的特征；

分类模块，用于通过多分类SVM支持向量机对所述文本样本对应的特征进行分类，确定所述文本样本对应的情感类别；

完成模块，用于基于损失函数确定所述情感类别与所述正确情感类别的差异值，当所述差异值满足预设条件时，判定所述文本情感分析模型训练完成。
如权利要求6所述的文本情感分析模型训练装置，所述分词模块包括：

概率计算单元，用于基于标准语料库计算所述文本样本中包含的各个词对应的二元条件概率，其中，标准语料库中任意两个词W ₁和W ₂的二元条件概率分布表示为：

其中，freq(W ₁,W ₂)表示W ₁和W ₂在标准语料库中相邻一起出现的次数，freq(W ₁)和freq(W ₂)分别表示W ₁和W ₂在标准语料库中出现的统计次数；

最优分词单元，用于基于所述二元条件概率确定所述文本样本中各个词的联合分布概率，从所述联合分布概率中确定最大联合分布概率，将所述最大联合分布概率对应的分词方法，确定为所述文本样本对应的最优分词方法；

文本划分单元，用于基于所述最优分词方法将所述文本样本划分为若干个不同的词。
如权利要求6所述的文本情感分析模型训练装置，所述特征模块包括：

特征计算单元，用于将第L-1段文本样本对应的所述降维后的词向量作为第1段文本样本的特征，并获取所述预设的深度神经网络中第L-1层隐藏层的权重矩阵，基于非线性激活函数对所述第L-1层的权重矩阵及所述第1段文本样本的特征进行计算，得到第L段文本样本的特征，其中，基于非线性激活函数进行计算的公式如下：

其中，X _i为第i段文本样本经过分词及编码处理后得到的词向量，h _i ¹为所述预设的深度神经网络提取出的第1段文本样本的特征，σ为非线性激活函数，W ^L-1为所述预设的深度神经网络中第L-1层隐藏层的权重矩阵，h _i ^L为所述预设的深度神经网络提取出的第L段文本样本的特征。
如权利要求8所述的文本情感分析模型训练装置，所述分类模块包括：

类别计算单元，用于随机初始化k个权重向量W ^y，则对于第i个文本样本，所述多分类SVM支持向量机的决策为：

其中，k为所述多分类SVM支持向量机的预设数据集中的情感类别数目；

类别确定单元，用于将
的最大乘积对应的情感类别确定为所述文本样本对应的情感类别。
如权利要求6所述的文本情感分析模型训练装置，所述降维模块具体用于：

在预设的深度神经网络中，获取权重矩阵，所述权重矩阵设置在所述预设的深度神经网络中的嵌入层中；

将所述词向量与权重矩阵相乘，得到降维后的词向量。
一种文本情感分析模型训练设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现如下步骤：

获取待训练的文本样本，其中，所述文本样本带有标注信息，所述标注信息为所述文本样本包含的正确情感类别；

通过预设的分词方法对所述文本样本进行分词处理，将所述文本样本划分为若干个不同的词；

基于预设的编码方法对所述若干个不同的词分别进行编码处理，得到所述文本样本对应的词向量；

将所述词向量输入至预设的深度神经网络中，基于所述预设的深度神经网络中的嵌入层对所述词向量进行降维处理，得到降维后的词向量；

基于所述预设的深度神经网络中的隐藏层对所述降维后的词向量进行计算，得到所述文本样本对应的特征；

通过多分类SVM支持向量机对所述文本样本对应的特征进行分类，确定所述文本样本对应的情感类别；

基于损失函数确定所述情感类别与所述正确情感类别的差异值，当所述差异值满足预设条件时，判定所述文本情感分析模型训练完成。
如权利要求11所述的文本情感分析模型训练设备，所述处理器执行所述计算机程序实现所述通过预设的分词方法对所述文本样本进行分词处理，将所述文本样本划分为若干个不同的词时，包括以下步骤：

基于标准语料库计算所述文本样本中包含的各个词对应的二元条件概率，其中，标准语料库中任意两个词W ₁和W ₂的二元条件概率分布表示为：

其中，freq(W ₁,W ₂)表示W ₁和W ₂在标准语料库中相邻一起出现的次数， freq(W ₁)和freq(W ₂)分别表示W ₁和W ₂在标准语料库中出现的统计次数；

基于所述二元条件概率确定所述文本样本中各个词的联合分布概率，从所述联合分布概率中确定最大联合分布概率，将所述最大联合分布概率对应的分词方法，确定为所述文本样本对应的最优分词方法；

基于所述最优分词方法将所述文本样本划分为若干个不同的词。
如权利要求11所述的文本情感分析模型训练设备，所述处理器执行所述计算机程序实现所述基于所述预设的深度神经网络中的隐藏层对所述降维后的词向量进行计算，得到所述文本样本对应的特征时，包括以下步骤：

将第L-1段文本样本对应的所述降维后的词向量作为第1段文本样本的特征，并获取所述预设的深度神经网络中第L-1层隐藏层的权重矩阵，基于非线性激活函数对所述第L-1层的权重矩阵及所述第1段文本样本的特征进行计算，得到第L段文本样本的特征，其中，基于非线性激活函数进行计算的公式如下：

其中，X _i为第i段文本样本经过分词及编码处理后得到的词向量，h _i ¹为所述预设的深度神经网络提取出的第1段文本样本的特征，σ为非线性激活函数，W ^L-1为所述预设的深度神经网络中第L-1层隐藏层的权重矩阵，h _i ^L为所述预设的深度神经网络提取出的第L段文本样本的特征。
如权利要求13所述的文本情感分析模型训练设备，所述处理器执行所述计算机程序实现所述通过多分类SVM支持向量机对所述文本样本对应的特征进行分类，确定所述文本样本对应的情感类别时，包括以下步骤：

随机初始化k个权重向量W ^y，则对于第i个文本样本，所述多分类SVM支持向量机的决策为：

其中，k为所述多分类SVM支持向量机的预设数据集中的情感类别数目；

将
的最大乘积对应的情感类别确定为所述文本样本对应的情感类别。
如权利要求11所述的文本情感分析模型训练设备，所述处理器执行所述计算机程序实现所述将所述词向量输入至预设的深度神经网络中，基于所述预设的深度神经网络中的嵌入层对所述词向量进行降维处理，得到降维后的词向量时，包括以下步骤：

在预设的深度神经网络中，获取权重矩阵，所述权重矩阵设置在所述预设的深度神经网络中的嵌入层中；

将所述词向量与权重矩阵相乘，得到降维后的词向量。
一种计算机可读存储介质，所述计算机可读存储介质中存储计算机指令，当所述计算机指令在计算机上运行时，使得计算机执行如下步骤：

获取待训练的文本样本，其中，所述文本样本带有标注信息，所述标注信息为所述文本样本包含的正确情感类别；

通过预设的分词方法对所述文本样本进行分词处理，将所述文本样本划分为若干个不同的词；

基于预设的编码方法对所述若干个不同的词分别进行编码处理，得到所述文本样本对应的词向量；

将所述词向量输入至预设的深度神经网络中，基于所述预设的深度神经网络中的嵌入层对所述词向量进行降维处理，得到降维后的词向量；

基于所述预设的深度神经网络中的隐藏层对所述降维后的词向量进行计算，得到所述文本样本对应的特征；

通过多分类SVM支持向量机对所述文本样本对应的特征进行分类，确定所述文本样本对应的情感类别；

基于损失函数确定所述情感类别与所述正确情感类别的差异值，当所述差异值满足预设条件时，判定所述文本情感分析模型训练完成。
如权利要求16所述的计算机可读存储介质，当所述计算机指令在计算机上运行所述通过预设的分词方法对所述文本样本进行分词处理，将所述文本样本划分为若干个不同的词时，使得计算机执行如下步骤：

基于标准语料库计算所述文本样本中包含的各个词对应的二元条件概率，其中，标准语料库中任意两个词W ₁和W ₂的二元条件概率分布表示为：

其中，freq(W ₁,W ₂)表示W ₁和W ₂在标准语料库中相邻一起出现的次数，freq(W ₁)和freq(W ₂)分别表示W ₁和W ₂在标准语料库中出现的统计次数；

基于所述二元条件概率确定所述文本样本中各个词的联合分布概率，从所述联合分布概率中确定最大联合分布概率，将所述最大联合分布概率对应的分词方法，确定为所述文本样本对应的最优分词方法；

基于所述最优分词方法将所述文本样本划分为若干个不同的词。
如权利要求16所述的计算机可读存储介质，当所述计算机指令在计算机上运行所述基于所述预设的深度神经网络中的隐藏层对所述降维后的词向量进行计算，得到所述文本样本对应的特征时，使得计算机执行如下步骤：

将第L-1段文本样本对应的所述降维后的词向量作为第1段文本样本的特征，并获取所述预设的深度神经网络中第L-1层隐藏层的权重矩阵，基于非线性激活函数对所述第L-1层的权重矩阵及所述第1段文本样本的特征进行计算，得到第L段文本样本的特征，其中，基于非线性激活函数进行计算的公式如下：

其中，X _i为第i段文本样本经过分词及编码处理后得到的词向量，h _i ¹为所述预设的深度神经网络提取出的第1段文本样本的特征，σ为非线性激活函数，W ^L-1为所述预设的深度神经网络中第L-1层隐藏层的权重矩阵，h _i ^L为所述预设的深度神经网络提取出的第L段文本样本的特征。
如权利要求18所述的计算机可读存储介质，当所述计算机指令在计算机上运行所述通过多分类SVM支持向量机对所述文本样本对应的特征进行分类，确定所述文本样本对应的情感类别时，使得计算机执行如下步骤：

随机初始化k个权重向量W ^y，则对于第i个文本样本，所述多分类SVM支持向量机的决策为：

其中，k为所述多分类SVM支持向量机的预设数据集中的情感类别数目；

将
的最大乘积对应的情感类别确定为所述文本样本对应的情感类别。
如权利要求16所述的计算机可读存储介质，当所述计算机指令在计算机上运行所述将所述词向量输入至预设的深度神经网络中，基于所述预设的深度神经网络中的嵌入层对所述词向量进行降维处理，得到降维后的词向量时，使得计算机执行如下步骤：

在预设的深度神经网络中，获取权重矩阵，所述权重矩阵设置在所述预设的深度神经网络中的嵌入层中；

将所述词向量与权重矩阵相乘，得到降维后的词向量。