WO2019196208A1

WO2019196208A1 - 文本情感分析方法、可读存储介质、终端设备及装置

Info

Publication number: WO2019196208A1
Application number: PCT/CN2018/093344
Authority: WO
Inventors: 张依; 汪伟; 肖京
Original assignee: 平安科技（深圳）有限公司
Priority date: 2018-04-09
Filing date: 2018-06-28
Publication date: 2019-10-17
Also published as: CN108733644A; CN108733644B

Abstract

本申请属于计算机技术领域，尤其涉及一种文本情感分析方法、计算机可读存储介质、终端设备及装置。所述方法对待分析的语句文本进行切词处理，得到构成所述语句文本的各个分词；在预设的词向量数据库中分别查找各个所述分词的列向量，并将各个所述分词的列向量组成输入矩阵，其中，所述输入矩阵的每一列均对应一个列向量，所述词向量数据库为记录词语与列向量之间的对应关系的数据库；从所述语句文本中选取一个与预设的分析对象对应的分词作为文本情感分析的情感主体；将所述输入矩阵和输入向量输入到预设的文本情感分析神经网络模型中，得到所述情感主体在所述语句文本中的情感类型，所述输入向量为所述情感主体的列向量。

Description

文本情感分析方法、可读存储介质、终端设备及装置

本申请要求于2018年4月9日提交中国专利局、申请号为201810309676.7、发明名称为“一种文本情感分析方法、计算机可读存储介质及终端设备”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请属于计算机技术领域，尤其涉及一种文本情感分析方法、计算机可读存储介质、终端设备及装置。

背景技术

文本情感分析是指根据文本所表达的含义和情感信息将文本分为正面或负面的两种或多种情感类型的技术。目前的文本情感分析方法主要是统计文本中代表不同情感的形容词的数量，并对此进行一个定量分析，这种方法对只包含单一情感主体的语句文本进行情感分析时准确率较高，但在对包含多个情感主体的语句文本进行情感分析时，则难以反映多个情感主体的复杂情感，例如，某一语句文本为“A公司销售业绩大幅超越B公司”，其中，共包含了两个情感主体，分别为“A公司”和“B公司”，对于情感主体“A公司”而言，该语句文本应为正面情感类型，但是对于情感主体“B公司”而言，该语句文本却为负面情感类型，而目前的文本情感分析方法所得到的分析结果是与情感主体无关的，只能得到一个唯一的不区分情感主体的情感类型。

技术问题

有鉴于此，本申请实施例提供了一种文本情感分析方法、计算机可读存储介质、终端设备及装置，以解决目前的文本情感分析方法难以反映多个情感主体的复杂情感的问题。

技术解决方案

本申请实施例的第一方面提供了一种文本情感分析方法，可以包括：

对待分析的语句文本进行切词处理，得到构成所述语句文本的各个分词；

在预设的词向量数据库中分别查找各个所述分词的列向量，并将各个所述分词的列向量组成输入矩阵，其中，所述输入矩阵的每一列均对应一个列向量，所述词向量数据库为记录词语与列向量之间的对应关系的数据库；

从所述语句文本中选取一个与预设的分析对象对应的分词作为文本情感分析的情感主体；

将所述输入矩阵和输入向量输入到预设的文本情感分析神经网络模型中，得到所述情感主体在所述语句文本中的情感类型，所述输入向量为所述情感主体的列向量。

本申请实施例的第二方面提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机可读指令，所述计算机可读指令被处理器执行时实现上述文本情感分析方法的步骤。

本申请实施例的第三方面提供了一种文本情感分析终端设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机可读指令，所述处理器执行所述计算机可读指令时实现上述文本情感分析方法的步骤。

本申请实施例的第四方面提供了一种文本情感分析装置，可以包括用于实现上述文本情感分析方法的步骤的模块。

有益效果

本申请实施例与现有技术相比存在的有益效果是：本申请实施例中除了考虑整体的语句文本外，还将情感主体的列向量作为了一个单独的输入，通过神经网络模型的处理，得到的是所述情感主体在所述语句文本中的情感类型，也即将情感主体的选择作为了影响最终的情感类型的一个决定条件，这样，在对包含多个情感主体的语句文本进行情感分析时，通过对不同的情感主体的选择，可以得到与之对应的情感类型，极好地反映出多个情感主体的复杂情感。

附图说明

图1为本申请实施例中一种文本情感分析方法的一个实施例流程图；

图2为本申请实施例中在词向量数据库中查找当前分词的列向量的示意流程图；

图3为本申请实施例中文本情感分析神经网络模型的数据处理过程的示意流程图；

图4为本申请实施例中文本情感分析神经网络模型的训练过程的示意流程图；

图5为本申请实施例中一种文本情感分析装置的一个实施例结构图；

图6为本申请实施例中一种文本情感分析终端设备的示意框图。

本发明的实施方式

请参阅图1，本申请实施例中一种文本情感分析方法的一个实施例可以包括：

步骤S101，对待分析的语句文本进行切词处理，得到构成所述语句文本的各个分词。

切词处理是指将一个语句文本切分成一个一个单独的词，也即各个所述分词，在本实施例中，可以根据通用词典对语句文本进行切分，保证分出的词语都是正常词汇，如词语不在词典内则分出单字。当前后方向都可以成词时，例如“要求神”，会根据统计词频的大小划分，如“要求”词频高则分出“要求/神”，如“求神”词频高则分出“要/求神”。

在拆分出每个分词后，如考虑二元组合词的话，则可将邻近的单词两两组合，增加“庆祝大会”，“大会顺利”，“顺利闭幕”等二元组合词语。优选地，还可以再根据词频对这些二元组合词进行筛选。具体地，预先设置一个筛选的频率阈值，获取各个二元组合词出现的频率，若某个二元组合词出现的频率大于或等于该频率阈值，则保留该二元组合词，若某个二元组合词出现的频率小于该频率阈值，则剔除掉该二元组合词，也即将其视为两个独立的一元词。若我们设定的频率阈值为5，则剔除所有出现次数在5以下的二元组合词。

步骤S102，在预设的词向量数据库中分别查找各个所述分词的列向量。

所述词向量数据库为记录词语与列向量之间的对应关系的数据库。所述列向量可以是根据word2vec模型训练词语所得到对应的词向量。即根据词语的上下文信息来表示该词出现的概率。词向量的训练依然按照word2vec的思想，先将每个词表示成一个0-1向量(one-hot)形式，再用词向量进行word2vec模型训练，用n-1个词来预测第n个词，神经网络模型预测后得到的中间过程作为词向量。具体地，如“庆祝”的one-hot向量假设定为[1,0,0,0,……,0]，“大会”的one-hot向量为[0,1,0,0,……,0]，“顺利”的one-hot向量为[0,0,1,0,……,0],预测“闭幕”的向量[0,0,0,1,……,0]，模型经过训练会生成隐藏层的系数矩阵W，每个词的one-hot向量和系数矩阵的乘积为该词的词向量，最后的形式将是类似于“庆祝[-0.28,0.34,-0.02,…...,0.92]”这样的一个多维向量。

在本实施例中，所述词向量数据库可以为K级树状分片存储结构，则步骤S102可以包括如图2所示的步骤：

步骤S1021，使用多个相互独立的哈希函数对当前分词进行哈希运算。

所述当前分词为任意一个所述分词。

具体地，可以根据下式分别使用K个相互独立的哈希函数对当前分词进行哈希运算：

HashKey _k＝HASH _k(BasicWord)

其中，BasicWord为所述当前分词，HASH _k为序号为k的哈希函数，HashKey _k为运算得到的序号为k的哈希值，1≤k≤K，K为大于1的整数。

步骤S1022，计算所述当前分词所属的各级存储分片的序号。

具体地，可以根据下式计算所述当前分词所属的第k级存储分片的序号：

其中，MaxHashKey _k为哈希函数HASH _k的最大取值，FragNum _k为第k级子树的存储分片的数目，Ceil为向上取整函数，Floor为向下取整函数，WordRoute为记录存储路径的数组，WordRoute[k-1]为所述当前分词所属的第k级分片的序号，且为WordRoute 的第k个元素。

步骤S1023，在记录的存储路径下查找所述当前分词的列向量。

具体地，即在数组WordRoute所记录的存储路径下查找所述当前分词的列向量。例如，若数组WordRoute＝[1,2,1,3,5]，则存储路径为：第1级子树序号为1的存储分片—>第2级子树序号为2的存储分片—>第3级子树序号为1的存储分片—>第4级子树序号为3的存储分片—>第5级子树序号为5的存储分片，在该存储路径下查找所述当前分词的列向量。

步骤S103，将各个所述分词的列向量组成输入矩阵。

其中，所述输入矩阵的每一列均对应一个列向量，即第一个分词的列向量组成所示输入矩阵的第一列，第二个分词的列向量组成所示输入矩阵的第二列，……，第N个分词的列向量组成所示输入矩阵的第N列。N为所述分词的数目。

步骤S104，从所述语句文本中选取一个与预设的分析对象对应的分词作为文本情感分析的情感主体。

例如，某一语句文本为“A公司销售业绩大幅超越B公司”，其中，共有两个情感主体可供选择，分别为“A公司”和“B公司”，若当前想要分析“A公司”在所述语句文本中的情感类型，即所述分析对象为“A公司”，则选取“A公司”作为文本情感分析的情感主体，若当前想要分析“B公司”在所述语句文本中的情感类型，即所述分析对象为“B公司”，则选取“B公司”作为文本情感分析的情感主体。

步骤S105，将所述输入矩阵和输入向量输入到预设的文本情感分析神经网络模型中，得到所述情感主体在所述语句文本中的情感类型。

所述输入向量为所述情感主体的列向量。

所述文本情感分析神经网络模型的数据处理过程可以包括如图3所示的步骤：

步骤S1051，计算所述输入矩阵和所述输入向量之间的耦合向量。

具体地，可以根据下式计算所述输入矩阵和所述输入向量之间的耦合向量：

CoupVec＝(CoupFactor ₁,CoupFactor ₂,......,CoupFactor _n,......,CoupFactor _N) ^T，

其中，1≤n≤N，N为所述输入矩阵的列数，T为转置符号，

WordVec _n为所述输入矩阵的第n列，MainVec为所述输入向量，WeightMatrix、WeightMatrix′均为预设的权值矩阵，

CoupVec为所述耦合向量。

步骤S1052，计算所述语句文本的复合向量。

具体地，可以根据下式计算所述语句文本的复合向量：

CompVec＝WordMatrix*CoupVec，

其中，CompVec为所述复合向量，WordMatrix为所述输入矩阵，

且WordMatrix＝(WordVec ₁,WordVec ₂,......,WordVec _n,......,WordVec _N)。

步骤S1053，分别计算各个情感类型的概率值。

具体地，可以根据下式分别计算各个情感类型的概率值：

其中，1≤m≤M，M为情感类型的个数，WeightMatrix _m为预设的与第m个情感类型对应的权值矩阵，Prob _m为第m个情感类型的概率值。

具体的情感类型分类可以根据实际情况设置，例如可以将其分为正面情感类型和负面情感类型两类，也可以将其分为正面情感类型、负面情感类型和中性情感类型三类，还可以将其分为更多的类型。

步骤S1054，将概率值最大的情感类型确定为所述情感主体在所述语句文本中的情感类型。

优选地，所述文本情感分析神经网络模型的训练过程可以包括如图4所示的步骤：

步骤S401，选取预设数目的训练样本。

每个样本包括一个输入矩阵、一个输入向量和一个预期输出情感类型。

优选地，可以以训练样本对的形式成对选取训练样本，每个训练样本对包括两个训练样本，同一训练样本对中的两个训练样本的输入矩阵相同，为同一语句文本的各个分词的列向量所组成的矩阵，同一训练样本对中的两个训练样本的输入向量不同，分别为同一语句文本的两个不同情感主体的列向量，同一训练样本对中的两个训练样本的预期输出情感类型不同，一个为正面情感类型，另一个为负面情感类型。

步骤S402，将各个所述训练样本分别输入到所述文本情感分析神经网络模型中进行处理。

具体的处理过程与步骤S105类似，具体可参照步骤S105中的说明，在此不再赘述。

步骤S403，计算本轮训练的全局误差。

具体的，可以根据下式计算本轮训练的全局误差：

其中，CalcProb _l,m为第m个情感类型在第l个训练样本中的概率值，ExpProb _l,m为第m个情感类型在第l个训练样本中的预期概率值，

且

ExpSeq为第l个训练样本的预期输出情感类型的序号，1≤l≤L，L为所述训练样本的数目，1≤m≤M，M为情感类型的个数，ln为自然对数函数，LOSS _l为第l个训练样本的训练误差，LOSS为所述全局误差。

步骤S404，判断所述全局误差是否小于预设的误差阈值。

若所述全局误差大于或等于所述误差阈值，则执行步骤S405，若所述全局误差小于所述误差阈值，则执行步骤S406。

步骤S405，对所述文本情感分析神经网络模型的参数进行调整。

具体调整的参数可以包括上述的WeightMatrix、WeightMatrix′、WeightMatrix _m等参数。在完成参数调整后，返回执行步骤S402，直至所述全局误差小于所述误差阈值为止。

步骤S405，结束训练。

当所述全局误差小于所述误差阈值时，即说明所述文本情感分析神经网络模型已经达到了预期的分析精度，此时可结束对其的训练过程，使用其进行实际的文本情感分析。

综上所述，本申请实施例中除了考虑整体的语句文本外，还将情感主体的列向量作为了一个单独的输入，通过神经网络模型的处理，得到的是所述情感主体在所述语句文本中的情感类型，也即将情感主体的选择作为了影响最终的情感类型的一个决定条件，这样，在对包含多个情感主体的语句文本进行情感分析时，通过对不同的情感主体的选择，可以得到与之对应的情感类型，极好地反映出多个情感主体的复杂情感。

对应于上文实施例所述的一种文本情感分析方法，图5示出了本申请实施例提供的一种文本情感分析装置的一个实施例结构图。

本实施例中，一种文本情感分析装置可以包括：

文本切词模块501，用于对待分析的语句文本进行切词处理，得到构成所述语句文本的各个分词；

列向量查找模块502，用于在预设的词向量数据库中分别查找各个所述分词的列向量，所述词向量数据库为记录词语与列向量之间的对应关系的数据库；

输入矩阵组成模块503，用于将各个所述分词的列向量组成输入矩阵，其中，所述输入矩阵的每一列均对应一个列向量；

情感主体选取模块504，用于从所述语句文本中选取一个与预设的分析对象对应的分词作为文本情感分析的情感主体；

文本情感分析模块505，用于将所述输入矩阵和输入向量输入到预设的文本情感分析神经网络模型中，得到所述情感主体在所述语句文本中的情感类型，所述输入向量为所述情感主体的列向量。

进一步地，所述文本情感分析模块可以包括：

耦合向量计算单元，用于根据下式计算所述输入矩阵和所述输入向量之间的耦合向量：

其中，1≤n≤N，N为所述输入矩阵的列数，T为转置符号，

CoupVec为所述耦合向量；

复合向量计算单元，用于根据下式计算所述语句文本的复合向量：

CompVec＝WordMatrix*CoupVec，

其中，CompVec为所述复合向量，WordMatrix为所述输入矩阵，

且WordMatrix＝(WordVec ₁,WordVec ₂,......,WordVec _n,......,WordVec _N)；

情感类型概率值计算单元，用于根据下式分别计算各个情感类型的概率值：

其中，1≤m≤M，M为情感类型的个数，WeightMatrix _m为预设的与第m个情感类型对应的权值矩阵，Prob _m为第m个情感类型的概率值；

情感类型确定单元，用于将概率值最大的情感类型确定为所述情感主体在所述语句文本中的情感类型。

进一步地，所述文本情感分析装置还可以包括：

训练样本选取模块，用于选取预设数目的训练样本，每个样本包括一个输入矩阵、一个输入向量和一个预期输出情感类型；

全局误差计算模块，用于将各个所述训练样本分别输入到所述文本情感分析神经网络模型中进行处理，并根据下式计算本轮训练的全局误差：

且

ExpSeq为第l个训练样本的预期输出情感类型的序号，1≤l≤L，L为所述训练样本的数目，1≤m≤M，M为情感类型的个数，ln为自然对数函数，LOSS _l为第l个训练样本的训练误差，LOSS为所述全局误差；

参数调整模块，用于若所述全局误差大于或等于预设的误差阈值，则对所述文本情感分析神经网络模型的参数进行调整；

结束训练模块，用于若所述全局误差小于所述误差阈值，则结束训练。

进一步地，所述训练样本选取模块可以包括：

第一选取单元，用于以训练样本对的形式成对选取训练样本，每个训练样本对包括两个训练样本，同一训练样本对中的两个训练样本的输入矩阵相同，为同一语句文本的各个分词的列向量所组成的矩阵，同一训练样本对中的两个训练样本的输入向量不同，分别为同一语句文本的两个不同情感主体的列向量，同一训练样本对中的两个训练样本的预期输出情感类型不同，一个为正面情感类型，另一个为负面情感类型。

进一步地，所述列向量查找模块可以包括：

哈希运算单元，用于根据下式分别使用K个相互独立的哈希函数对当前分词进行哈希运算，所述当前分词为任意一个所述分词：

HashKey _k＝HASH _k(BasicWord)

其中，BasicWord为所述当前分词，HASH _k为序号为k的哈希函数，HashKey _k为运算得到的序号为k的哈希值，1≤k≤K，K为大于1的整数；

存储分片序号计算单元，用于根据下式计算所述当前分词所属的第k级存储分片的序号：

其中，MaxHashKey _k为哈希函数HASH _k的最大取值，FragNum _k为第k级子树的存储分片的数目，Ceil为向上取整函数，Floor为向下取整函数，WordRoute为记录存储路径的数组，WordRoute[k-1]为所述当前分词所属的第k级分片的序号，且为WordRoute的第k个元素；

列向量查找单元，用于在数组WordRoute所记录的存储路径下查找所述当前分词的列向量。

图6示出了本申请实施例提供的一种文本情感分析终端设备的示意框图。

在本实施例中，所述文本情感分析终端设备6可包括：处理器60、存储器61以及存储在所述存储器61中并可在所述处理器60上运行的计算机可读指令62，例如执行上述的文本情感分析方法的计算机可读指令。所述处理器60执行所述计算机可读指令62时实现上述各个文本情感分析方法实施例中的步骤。

在本申请各个实施例中的各功能单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干计算机可读指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。

Claims

一种文本情感分析方法，其特征在于，包括：

对待分析的语句文本进行切词处理，得到构成所述语句文本的各个分词；

在预设的词向量数据库中分别查找各个所述分词的列向量，并将各个所述分词的列向量组成输入矩阵，其中，所述输入矩阵的每一列均对应一个列向量，所述词向量数据库为记录词语与列向量之间的对应关系的数据库；

从所述语句文本中选取一个与预设的分析对象对应的分词作为文本情感分析的情感主体；

将所述输入矩阵和输入向量输入到预设的文本情感分析神经网络模型中，得到所述情感主体在所述语句文本中的情感类型，所述输入向量为所述情感主体的列向量。
根据权利要求1所述的文本情感分析方法，其特征在于，所述文本情感分析神经网络模型的数据处理过程包括：

根据下式计算所述输入矩阵和所述输入向量之间的耦合向量：

CoupVec＝(CoupFactor ₁,CoupFactor ₂,......,CoupFactor _n,......,CoupFactor _N) ^T，

其中，1≤n≤N，N为所述输入矩阵的列数，T为转置符号，

WordVec _n为所述输入矩阵的第n列，MainVec为所述输入向量，WeightMatrix、WeightMatrix′均为预设的权值矩阵，
CoupVec为所述耦合向量；

根据下式计算所述语句文本的复合向量：

CompVec＝WordMatrix*CoupVec，

其中，CompVec为所述复合向量，WordMatrix为所述输入矩阵，

且WordMatrix＝(WordVec ₁,WordVec ₂,......,WordVec _n,......,WordVec _N)；

根据下式分别计算各个情感类型的概率值：

其中，1≤m≤M，M为情感类型的个数，WeightMatrix _m为预设的与第m个情感类型对应的权值矩阵，Prob _m为第m个情感类型的概率值；

将概率值最大的情感类型确定为所述情感主体在所述语句文本中的情感类型。
根据权利要求1所述的文本情感分析方法，其特征在于，所述文本情感分析神经网络模型的训练过程包括：

选取预设数目的训练样本，每个样本包括一个输入矩阵、一个输入向量和一个预期输出情感类型；

将各个所述训练样本分别输入到所述文本情感分析神经网络模型中进行处理，并根据下式计算本轮训练的全局误差：

其中，CalcProb _l,m为第m个情感类型在第l个训练样本中的概率值，ExpProb _l,m为第m个情感类型在第l个训练样本中的预期概率值，

且
ExpSeq为第l个训练样本的预期输出情感类型的序号，1≤l≤L，L为所述训练样本的数目，1≤m≤M，M为情感类型的个数，ln为自然对数函数，LOSS _l为第l个训练样本的训练误差，LOSS为所述全局误差；

若所述全局误差大于或等于预设的误差阈值，则对所述文本情感分析神经网络模型的参数进行调整，并返回执行所述将各个所述训练样本分别输入到所述文本情感分析神经网络模型中进行处理的步骤，直至所述全局误差小于所述误差阈值为止；

若所述全局误差小于所述误差阈值，则结束训练。
根据权利要求3所述的文本情感分析方法，其特征在于，所述选取预设数目的训练样本包括：

以训练样本对的形式成对选取训练样本，每个训练样本对包括两个训练样本，同一训练样本对中的两个训练样本的输入矩阵相同，为同一语句文本的各个分词的列向量所组成的矩阵，同一训练样本对中的两个训练样本的输入向量不同，分别为同一语句文本的两个不同情感主体的列向量，同一训练样本对中的两个训练样本的预期输出情感类型不同，一个为正面情感类型，另一个为负面情感类型。
根据权利要求1至4中任一项所述的文本情感分析方法，其特征在于，所述词向量数据库为K级树状分片存储结构，所述在预设的词向量数据库中分别查找各个所述分词的列向量包括：

根据下式分别使用K个相互独立的哈希函数对当前分词进行哈希运算，所述当前分词为任意一个所述分词：

HashKey _k＝HASH _k(BasicWord)

其中，BasicWord为所述当前分词，HASH _k为序号为k的哈希函数，HashKey _k为运算得到的序号为k的哈希值，1≤k≤K，K为大于1的整数；

根据下式计算所述当前分词所属的第k级存储分片的序号：

其中，MaxHashKey _k为哈希函数HASH _k的最大取值，FragNum _k为第k级子树的存储分片的数目，Ceil为向上取整函数，Floor为向下取整函数，WordRoute为记录存储路径的数组，WordRoute[k-1]为所述当前分词所属的第k级分片的序号，且为WordRoute的第k个元素；

在数组WordRoute所记录的存储路径下查找所述当前分词的列向量。
一种计算机可读存储介质，所述计算机可读存储介质存储有计算机可读指令，其特征在于，所述计算机可读指令被处理器执行时实现如下步骤：

对待分析的语句文本进行切词处理，得到构成所述语句文本的各个分词；

在预设的词向量数据库中分别查找各个所述分词的列向量，并将各个所述分词的列向量组成输入矩阵，其中，所述输入矩阵的每一列均对应一个列向量，所述词向量数据库为记录词语与列向量之间的对应关系的数据库；

从所述语句文本中选取一个与预设的分析对象对应的分词作为文本情感分析的情感主体；

将所述输入矩阵和输入向量输入到预设的文本情感分析神经网络模型中，得到所述情感主体在所述语句文本中的情感类型，所述输入向量为所述情感主体的列向量。
根据权利要求6所述的计算机可读存储介质，其特征在于，所述文本情感分析神经网络模型的数据处理过程包括：

根据下式计算所述输入矩阵和所述输入向量之间的耦合向量：

CoupVec＝(CoupFactor ₁,CoupFactor ₂,......,CoupFactor _n,......,CoupFactor _N) ^T，

其中，1≤n≤N，N为所述输入矩阵的列数，T为转置符号，

WordVec _n为所述输入矩阵的第n列，MainVec为所述输入向量，WeightMatrix、WeightMatrix′均为预设的权值矩阵，
CoupVec为所述耦合向量；

根据下式计算所述语句文本的复合向量：

CompVec＝WordMatrix*CoupVec，

其中，CompVec为所述复合向量，WordMatrix为所述输入矩阵，

且WordMatrix＝(WordVec ₁,WordVec ₂,......,WordVec _n,......,WordVec _N)；

根据下式分别计算各个情感类型的概率值：

其中，1≤m≤M，M为情感类型的个数，WeightMatrix _m为预设的与第m个情感类型对应的权值矩阵，Prob _m为第m个情感类型的概率值；

将概率值最大的情感类型确定为所述情感主体在所述语句文本中的情感类型。
根据权利要求6所述的计算机可读存储介质，其特征在于，所述文本情感分析神经网络模型的训练过程包括：

选取预设数目的训练样本，每个样本包括一个输入矩阵、一个输入向量和一个预期输出情感类型；

将各个所述训练样本分别输入到所述文本情感分析神经网络模型中进行处理，并根据下式计算本轮训练的全局误差：

其中，CalcProb _l,m为第m个情感类型在第l个训练样本中的概率值，ExpProb _l,m为第m个情感类型在第l个训练样本中的预期概率值，

且
ExpSeq为第l个训练样本的预期输出情感类型的序号，1≤l≤L，L为所述训练样本的数目，1≤m≤M，M为情感类型的个数，ln为自然对数函数，LOSS _l为第l个训练样本的训练误差，LOSS为所述全局误差；

若所述全局误差大于或等于预设的误差阈值，则对所述文本情感分析神经网络模型的参数进行调整，并返回执行所述将各个所述训练样本分别输入到所述文本情感分析神经网络模型中进行处理的步骤，直至所述全局误差小于所述误差阈值为止；

若所述全局误差小于所述误差阈值，则结束训练。
根据权利要求8所述的计算机可读存储介质，其特征在于，所述选取预设数目的训练样本包括：

以训练样本对的形式成对选取训练样本，每个训练样本对包括两个训练样本，同一训练样本对中的两个训练样本的输入矩阵相同，为同一语句文本的各个分词的列向量所组成的矩阵，同一训练样本对中的两个训练样本的输入向量不同，分别为同一语句文本的两个不同情感主体的列向量，同一训练样本对中的两个训练样本的预期输出情感类型不同，一个为正面情感类型，另一个为负面情感类型。
根据权利要求6至9中任一项所述的计算机可读存储介质，其特征在于，所述词向量数据库为K级树状分片存储结构，所述在预设的词向量数据库中分别查找各个所述分词的列向量包括：

根据下式分别使用K个相互独立的哈希函数对当前分词进行哈希运算，所述当前分词为任意一个所述分词：

HashKey _k＝HASH _k(BasicWord)

其中，BasicWord为所述当前分词，HASH _k为序号为k的哈希函数，HashKey _k为运算得到的序号为k的哈希值，1≤k≤K，K为大于1的整数；

根据下式计算所述当前分词所属的第k级存储分片的序号：

其中，MaxHashKey _k为哈希函数HASH _k的最大取值，FragNum _k为第k级子树的存储分片的数目，Ceil为向上取整函数，Floor为向下取整函数，WordRoute为记录存储路径的数组，WordRoute[k-1]为所述当前分词所属的第k级分片的序号，且为WordRoute的第k个元素；

在数组WordRoute所记录的存储路径下查找所述当前分词的列向量。
一种文本情感分析终端设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机可读指令，其特征在于，所述处理器执行所述计算机可读指令时实现如下步骤：

对待分析的语句文本进行切词处理，得到构成所述语句文本的各个分词；

在预设的词向量数据库中分别查找各个所述分词的列向量，并将各个所述分词的列向量组成输入矩阵，其中，所述输入矩阵的每一列均对应一个列向量，所述词向量数据库为记录词语与列向量之间的对应关系的数据库；

从所述语句文本中选取一个与预设的分析对象对应的分词作为文本情感分析的情感主体；

将所述输入矩阵和输入向量输入到预设的文本情感分析神经网络模型中，得到所述情感主体在所述语句文本中的情感类型，所述输入向量为所述情感主体的列向量。
根据权利要求11所述的文本情感分析终端设备，其特征在于，所述文本情感分析神经网络模型的数据处理过程包括：

根据下式计算所述输入矩阵和所述输入向量之间的耦合向量：

CoupVec＝(CoupFactor ₁,CoupFactor ₂,......,CoupFactor _n,......,CoupFactor _N) ^T，

其中，1≤n≤N，N为所述输入矩阵的列数，T为转置符号，

WordVec _n为所述输入矩阵的第n列，MainVec为所述输入向量，WeightMatrix、 WeightMatrix′均为预设的权值矩阵，
CoupVec为所述耦合向量；

根据下式计算所述语句文本的复合向量：

CompVec＝WordMatrix*CoupVec，

其中，CompVec为所述复合向量，WordMatrix为所述输入矩阵，

且WordMatrix＝(WordVec ₁,WordVec ₂,......,WordVec _n,......,WordVec _N)；

根据下式分别计算各个情感类型的概率值：

其中，1≤m≤M，M为情感类型的个数，WeightMatrix _m为预设的与第m个情感类型对应的权值矩阵，Prob _m为第m个情感类型的概率值；

将概率值最大的情感类型确定为所述情感主体在所述语句文本中的情感类型。
根据权利要求11所述的文本情感分析终端设备，其特征在于，所述文本情感分析神经网络模型的训练过程包括：

选取预设数目的训练样本，每个样本包括一个输入矩阵、一个输入向量和一个预期输出情感类型；

将各个所述训练样本分别输入到所述文本情感分析神经网络模型中进行处理，并根据下式计算本轮训练的全局误差：

其中，CalcProb _l,m为第m个情感类型在第l个训练样本中的概率值，ExpProb _l,m为第m个情感类型在第l个训练样本中的预期概率值，

且
ExpSeq为第l个训练样本的预期输出情感类型的序号，1≤l≤L，L为所述训练样本的数目，1≤m≤M，M为情感类型的个数，ln为自然对数函数，LOSS _l为第l个训练样本的训练误差，LOSS为所述全局误差；

若所述全局误差大于或等于预设的误差阈值，则对所述文本情感分析神经网络模型的参数进行调整，并返回执行所述将各个所述训练样本分别输入到所述文本情感分析神经网络模型中进行处理的步骤，直至所述全局误差小于所述误差阈值为止；

若所述全局误差小于所述误差阈值，则结束训练。
根据权利要求13所述的文本情感分析终端设备，其特征在于，所述选取预设数目的训练样本包括：

以训练样本对的形式成对选取训练样本，每个训练样本对包括两个训练样本，同一训练样本对中的两个训练样本的输入矩阵相同，为同一语句文本的各个分词的列向量所组成的矩阵，同一训练样本对中的两个训练样本的输入向量不同，分别为同一语句文本的两个不同情感主体的列向量，同一训练样本对中的两个训练样本的预期输出情感类型不同，一个为正面情感类型，另一个为负面情感类型。
根据权利要求11至14中任一项所述的文本情感分析终端设备，其特征在于，所述词向量数据库为K级树状分片存储结构，所述在预设的词向量数据库中分别查找各个所述分词的列向量包括：

根据下式分别使用K个相互独立的哈希函数对当前分词进行哈希运算，所述当前分词为任意一个所述分词：

HashKey _k＝HASH _k(BasicWord)

其中，BasicWord为所述当前分词，HASH _k为序号为k的哈希函数，HashKey _k为运算得到的序号为k的哈希值，1≤k≤K，K为大于1的整数；

根据下式计算所述当前分词所属的第k级存储分片的序号：

其中，MaxHashKey _k为哈希函数HASH _k的最大取值，FragNum _k为第k级子树的存储分片的数目，Ceil为向上取整函数，Floor为向下取整函数，WordRoute为记录存储路径的数组，WordRoute[k-1]为所述当前分词所属的第k级分片的序号，且为WordRoute的第k个元素；

在数组WordRoute所记录的存储路径下查找所述当前分词的列向量。
一种文本情感分析装置，其特征在于，包括：

文本切词模块，用于对待分析的语句文本进行切词处理，得到构成所述语句文本的各个分词；

列向量查找模块，用于在预设的词向量数据库中分别查找各个所述分词的列向量，所述词向量数据库为记录词语与列向量之间的对应关系的数据库；

输入矩阵组成模块，用于将各个所述分词的列向量组成输入矩阵，其中，所述输入矩阵的每一列均对应一个列向量；

情感主体选取模块，用于从所述语句文本中选取一个与预设的分析对象对应的分词作为文本情感分析的情感主体；

文本情感分析模块，用于将所述输入矩阵和输入向量输入到预设的文本情感分析神经网络模型中，得到所述情感主体在所述语句文本中的情感类型，所述输入向量为所述情感主体的列向量。
根据权利要求16所述的文本情感分析装置，其特征在于，所述文本情感分析模块包括：

耦合向量计算单元，用于根据下式计算所述输入矩阵和所述输入向量之间的耦合向量：

CoupVec＝(CoupFactor ₁,CoupFactor ₂,......,CoupFactor _n,......,CoupFactor _N) ^T，

其中，1≤n≤N，N为所述输入矩阵的列数，T为转置符号，

WordVec _n为所述输入矩阵的第n列，MainVec为所述输入向量，WeightMatrix、WeightMatrix′均为预设的权值矩阵，
CoupVec为所述耦合向量；

复合向量计算单元，用于根据下式计算所述语句文本的复合向量：

CompVec＝WordMatrix*CoupVec，

其中，CompVec为所述复合向量，WordMatrix为所述输入矩阵，

且WordMatrix＝(WordVec ₁,WordVec ₂,......,WordVec _n,......,WordVec _N)；

情感类型概率值计算单元，用于根据下式分别计算各个情感类型的概率值：

其中，1≤m≤M，M为情感类型的个数，WeightMatrix _m为预设的与第m个情感类型对应的权值矩阵，Prob _m为第m个情感类型的概率值；

情感类型确定单元，用于将概率值最大的情感类型确定为所述情感主体在所述语句文本中的情感类型。
根据权利要求16所述的文本情感分析装置，其特征在于，所述文本情感分析装置还包括：

训练样本选取模块，用于选取预设数目的训练样本，每个样本包括一个输入矩阵、一个输入向量和一个预期输出情感类型；

全局误差计算模块，用于将各个所述训练样本分别输入到所述文本情感分析神经网络模型中进行处理，并根据下式计算本轮训练的全局误差：

其中，CalcProb _l,m为第m个情感类型在第l个训练样本中的概率值，ExpProb _l,m为第m个情感类型在第l个训练样本中的预期概率值，

且
ExpSeq为第l个训练样本的预期输出情感类型的序号，1≤l≤L，L为所述训练样本的数目，1≤m≤M，M为情感类型的个数，ln为自然对数函数，LOSS _l为第l个训练样本的训练误差，LOSS为所述全局误差；

参数调整模块，用于若所述全局误差大于或等于预设的误差阈值，则对所述文本情感分析神经网络模型的参数进行调整；

结束训练模块，用于若所述全局误差小于所述误差阈值，则结束训练。
根据权利要求18所述的文本情感分析装置，其特征在于，所述训练样本选取模块包括：

第一选取单元，用于以训练样本对的形式成对选取训练样本，每个训练样本对包括两个训练样本，同一训练样本对中的两个训练样本的输入矩阵相同，为同一语句文本的各个分词的列向量所组成的矩阵，同一训练样本对中的两个训练样本的输入向量不同，分别为同一语句文本的两个不同情感主体的列向量，同一训练样本对中的两个训练样本的预期输出情感类型不同，一个为正面情感类型，另一个为负面情感类型。
根据权利要求16至19中任一项所述的文本情感分析装置，其特征在于，所述列向量查找模块包括：

哈希运算单元，用于根据下式分别使用K个相互独立的哈希函数对当前分词进行哈希运算，所述当前分词为任意一个所述分词：

HashKey _k＝HASH _k(BasicWord)

其中，BasicWord为所述当前分词，HASH _k为序号为k的哈希函数，HashKey _k为运算得到的序号为k的哈希值，1≤k≤K，K为大于1的整数；

存储分片序号计算单元，用于根据下式计算所述当前分词所属的第k级存储分片的序号：

其中，MaxHashKey _k为哈希函数HASH _k的最大取值，FragNum _k为第k级子树的存储分片的数目，Ceil为向上取整函数，Floor为向下取整函数，WordRoute为记录存储路径的数组，WordRoute[k-1]为所述当前分词所属的第k级分片的序号，且为WordRoute的第k个元素；

列向量查找单元，用于在数组WordRoute所记录的存储路径下查找所述当前分词的列向量。