CN105260356B

CN105260356B - 基于多任务学习的中文交互文本情感与话题识别方法

Info

Publication number: CN105260356B
Application number: CN201510654583.4A
Authority: CN
Inventors: 刘均; 包洪英; 张玲玲; 杨宽
Original assignee: Xian Jiaotong University
Current assignee: Xian Jiaotong University
Priority date: 2015-10-10
Filing date: 2015-10-10
Publication date: 2018-02-06
Anticipated expiration: 2035-10-10
Also published as: CN105260356A

Abstract

本发明公开了一种基于多任务学习的中文交互文本情感与话题识别方法：在中文交互文本的特征提取阶段，本发明结合中文交互文本的交互特性提取交互文本的倾向性特征；在情感与话题识别阶段，本发明采用基于上下文的多任务分类模型构建方法对交互文本的训练样本进行多任务分类模型构建；针对e‑Learning系统中新用户或不活跃用户的倾向性特征数据缺失导致分类效果差的问题，本发明采用随机游走与多任务学习相结合的方法来识别新用户或不活跃用户情感与话题的类别。

Description

基于多任务学习的中文交互文本情感与话题识别方法

技术领域

本发明涉及对中文交互文本进行情感与话题识别的方法，具体涉及一种基于多任务学习的中文交互文本情感与话题识别方法。

背景技术

随着互联网技术的飞速发展，E-Learning凭借其“资源共享”、“随时随地”等多种优势迅速被人们接受，但同时也存在自身的缺点，由于学习者之间、师生之间时空分离，缺乏情感交流和反馈，教师无法实时掌握学生的学习动态，很难对学生给出综合全面的学习评价。在e-Learning系统中，如何发现学习者的情感并对学习者的负面情感加以调整、识别学习者感兴趣的话题已经成为当前的研究热点。

目前对文本进行情感与话题识别有多种方法，但是与传统文本相比较，交互文本具有句子长度较短、非语言符号较多等特点为交互文本的情感和话题识别带来了新的挑战，传统的识别方法已不完全适用于交互文本。同时传统的方法是将情感识别与话题识别这两个任务分开进行，比如利用SVM、决策树等单任务学习方法分别构建情感和话题的分类模型，使这两个任务之间相互独立，该方法虽然日趋成熟，但是不能挖掘并利用不同任务之间的内在联系，所以，能够对多个任务同时识别的多任务学习方法成为一种重要解决方案，该方法可以利用任务之间的相关性来提高不同任务的分类效果，从而弥补单任务学习的这点不足，同时解决了训练样本较少、模型泛化能力差等问题。

目前，与项目相关的专利，例如“一种基于情感分析在线检测微博热点事件的方法”(CN201310403005.4)已授权，它通过情感分析对在线微博文本进行情感抽取，进而实现在线实时检测出微博热点事件的目的，但是此专利并未结合e-Learning交互文本的自身特性，较为单一。

发明内容

本发明的目的在于提供一种基于多任务学习的中文交互文本情感与话题识别方法，以克服现有技术的问题，本发明利用多任务学习方法挖掘并利用交互文本中情感与话题的内在联系提高二者的识别效果。

为达到上述目的，本发明采用如下技术方案：

基于多任务学习的中文交互文本情感与话题识别方法，包括以下步骤：

1)中文交互文本的特征提取

将中文交互文本的每条话轮表示为特征项集合，根据人与人之间的交互历史数据提取交互文本的倾向性特征；

2)中文交互文本情感与话题识别

采用多任务学习方法识别中文交互文本的情感与话题，利用基于上下文的多任务分类模型构建方法识别中文交互文本的情感与话题；

3)对新用户的情感和话题识识别效果进行改进

用户的交互文本数据量分布不均匀，老用户或活跃用户交互文本的数据量大，而新用户或不活跃的用户交互文本的数据量很少，针对此问题，采用随机游走与多任务学习相结合的方法，利用历史数据丰富并且分类精度高的老用户或活跃用户的数据来协助预测新用户或不活跃用户情感与话题的类别。

在中文交互文本的特征提取阶段，提取中文交互文本的倾向性特征，将每条交互文本表示为特征项集合，倾向性特征的提取步骤为：首先基于说话者之间的交互文本构建有向图<V,E>，其中图的顶点集V＝{v_i,i＝1,2,…,M}，M表示说话者的人数，v_i表示说话者，边集(v_i,v_j)∈E表示说话者v_i回复说话者v_j，另外这里将v_i对v_j的第k次回复记为然后在说话者v_i与v_j的交互文本数据中，分别统计属于有情感、无情感、某特定话题和非某特定话题四个类别的话轮数，并计算出各个类别的概率值；最后利用这些概率值计算倾向性特征，计算公式为：

其中，表示当前话轮的倾向性特征值，label_a和label_b表示文本的类别标签，在情感识别中，label_a和label_b分别表示有情感和无情感，在话题识别中，label_a和label_b分别表示某特定话题和非某特定话题，表示在v_i对v_j的所有回复记录中，类别标签为label_a的概率值；

根据交互文本的交互顺序将话轮进行排序，将当前话轮的前一个话轮和后一个话轮所属的情感与话题的类别作为的上下文信息，将对当前话轮进行情感与话题识别作为“一级任务”；结合当前话轮上下文的类别标签对当前话轮进行情感和话题的识别，称为“二级任务”；对训练集中的交互文本进行特征提取后形成两个特征向量数据集X1和X2，其中，X1为情感识别的数据集，X2为话题识别的数据集，在X1和X2的特征向量中，包括统计特征、交互特征、词频特征和倾向性特征，分别如下：

a)统计特征F1：12维，包括句子的长度、出现最多的词语个数、单个字个数、词语个数、正面情感词个数、负面情感词个数、标点符号个数、名词频数、副词频数、字符个数、动词个数和形容词个数；

b)交互特征F2：9维，包括性别、情感符号、情感图片、特殊标点符号、拟声词、语气词、叹词、时间词语和非汉语词；

c)词频特征F3：采用基于TF‐IDF的聚集文档候选词筛选方法选取前1000维特征信息；

d)倾向性特征F₄：即由公式(1)计算得到的

y∈[-1,1]为每条样本情感与话题的类别标签，在情感识别中，-1表示负面情感，1表示正面情感；在话题识别中，-1表示某特定话题，1表示非某特定话题；构建“一级任务”的多任务分类模型过程如公式(2)所示：

其中，X∈{X1,X2}，即X是情感识别的特征向量数据集与话题识别的特征向量数据集；L个任务的未知参数w组合起来为W＝(w₁,w₂,...,w_L)；L个任务的未知偏重组合起来为κ＝(κ₁,κ₂,...,κ_L)；为当前话轮所标注的情感与话题的类别标签的似然概率密度函数，对于第l个任务，似然概率密度函数满足均值为方差为的Gaussian分布；p(W|σ,Ω)为未知参数W的先验概率密度函数，满足均值为σ，方差为Ω的Gaussian分布，通过求公式(2)的最大后验概率求解未知参数W，最大后验概率F(W)的计算公式如下：

构建“二级任务”的建模过程如下所示：

其中，P_upcontext和P_downcontext分别为当前话轮与前一个话轮和后一个话轮的的情感与话题的类别标签构建的后验概率；为“二级任务”添加权重β，与“一级任务”加和，得到整体后验概率公式：

F_MAP＝F+βF_context(β∈[0,1]) (6)

其中，F_MAP为整体后验概率，F为“一级任务”的多任务分类模型，F_context为“二级任务”的多任务分类模型；

利用高斯密度函数将公式(6)展开，得到公式(7)：

其中，Q_l是第l个任务对应的数据集中交互文本的话轮总数；是第l个任务对应的数据集中的第q个话轮对应的特征向量值，同时其对应的标签为β为设置的任务权重向量，假设：

Ω≥0

tr(Ω)＝1 (8)

得到待优化的目标函数为：

其中，

将公式(9)转换成了一个凸函数的二次规划问题，公式如下所示：

利用拉格朗日算子将公式(10)转化为无约束条件的规划问题进行最优化求解，得到整个函数取最小值时未知参数W的取值。

用户的交互文本数据量分布不均匀，针对无法提取倾向性特征的新用户或不活跃用户，采用随机游走算法利用与新用户或不活跃用户数据相似的老用户或活跃用户的数据协助预测新用户或不活跃用户情感与话题的类别，步骤为：

Step1：以所有话轮的特征向量集为顶点构建加权无向图：G＝(T,Z,H)，其中图的顶点集T＝{t_x,x＝1,2,…,N}，N表示话轮总数，t_x表示第x条话轮的特征向量，边集H＝[h_xy]_N×N，其中h_xy为连接顶点t_x，t_y的边z_xy的权重，h_xy的计算方法如公式(11)所示：

其中，dis(t_x,t_y)表示顶点t_x和顶点t_y在图上的最短路径长度；

另外，构建顶点对角矩阵D，如公式12所示:

其中:

Step2：计算顶点间的转移概率矩阵，基于图G＝(T,Z,H)中顶点集T上的随机游走的转移概率公式为：

其中，p_xy表示从顶点t_x一步转移到顶点t_y的概率，P＝[p_xy]_N×N，表示转移矩阵，其计算方法如公式(15)所示：

P＝D^-1H (15)

Step3：针对训练集中交互文本数据量大的老用户或活跃用户的样本及对应的标签集，统一利用高斯过程和贝叶斯理论构建未知参数的后验概率函数，进而对某交互文本及其上下文信息进行情感分类、话题分类，之后将任务权重向量作用于每个概率函数得到最优化目标函数，构建基于上下文的多任务分类模型；

Step4：利用转移概率矩阵预测新用户或不活跃用户情感与话题的类别，利用转移概率矩阵计算出新用户通过简单的随机游走过程能到达的前l个老用户或活跃用户的数据集合U，利用多任务分类模型求集合U中数据的预测值，利用公式(16)求新用户或不活跃用户b的类别预测值

其中，p(b,U)为待预测数据b与集合U中数据的状态转移概率向量，即为P矩阵特定行的某些分量，为集合U的类别标签向量，对于U中已有标签的数据直接用其自带的标签值：-1或1；对于无标签的数据需要利用Step3得到的多任务分类模型计算其预测值，并利用双曲正切函数g_i(x_j)＝tanh(f_i(x_j))将预测值映射到[-1,1]之间，其中函数f_i(x_j)是在任务i中对老用户j的预测值，g_i(x_j)为转换后的预测值。

与现有技术相比，本发明具有以下有益的技术效果：

本发明更加结合e-Learning交互文本的自身特性，构建基于上下文的多任务模型实现情感和话题识别，有利于在e-Learning系统中，教师实时掌握学生的学习动态以及学生对知识的掌握情况，进而对学生给出综合、全面、准确、客观的学习评价。总而言之，本发明的研究有利于识别学习者关心的话题以及对该话题所持有的情感倾向，进而实施有目的的情感调节，对e-Learning系统的自动化评估和用户学习行为分析具有重要的研究价值和实际意义。

进一步地，本发明采用多任务学习方法对情感和话题进行分类，并且提出了交互文本的四类特征提取方法，将该四类特征和多任务分类方法相结合，对情感与话题的分类效果有了很明显的提高。

进一步地，针对新用户无法提取倾向性特征的问题，本发明结合随机游走的思想利用分类精度高的老用户数据协助预测新用户的类别，有效解决了e-Learning系统中新用户或不活跃用户的倾向性特征数据缺失导致分类效果差的问题。

附图说明

图1为本发明的基于多任务学习的中文交互文本情感与话题识别框架；

图2为本发明的倾向性特征提取流程图；

图3为本发明的对新用户或不活跃用户未标注样本的类别预测过程。

具体实施方式

下面结合附图对本发明的实施方式作进一步详细描述：

基于多任务学习的中文交互文本情感与话题识别框架

参照图1所示，针对有监督学习方法，本发明基于多任务学习的中文交互文本情感与话题识别框架，包括以下四部分：

1)根据不同任务的需求对训练样本的类别进行人工标注，需要对用于情感分类的数据集进行情感类别标注，对用于话题分类的数据集进行话题类别标注；

2)根据不同任务的不同目的对每个任务的数据集进行特征提取；

3)利用标注好情感与话题类别的数据集构建多任务学习模型；

4)利用多任务学习模型预测未标注样本的类别，需要对新用户或不活跃用户采用不同方法进行预测。

在中文交互文本的特征提取阶段，本发明提取四类特征：统计特征、交互特征、词频特征、倾向性特征，四类特征的提取方法分别为：

(a).交互文本的统计特征如表1所示：

表1 交互文本统计特征

(b).交互文本的交互特征如表2所示：

表2 交互文本的交互特征

(c).在提取交互文本词频特征过程中，采用基于TF-IDF的聚集文档候选词筛选方法来筛选候选词。该特征为从语料中筛选出的词语附加一个效用值，目的是给蕴含情感强度大或与某个话题关联程度高的词语一个大的效用值。在情感识别中，表3给出根据交互文本的情感类别将词语进行聚集后的基本信息元素。对词语r，用A，B，C分别表示其在各个类别中的频数。

表3 词语在聚集文档中的基本信息元素

针对表3中三个基本元素，利用同类别聚集文档中的频次信息来筛选用于情感识别的候选词。公式(1)计算词语r的正面情感倾向的效用值

U(r,pos)＝tf(r,c_pos)*idf(r,c_pos) (1)

同理可得词语r负面情感倾向的效用值：

U(r,neg)＝tf(r,c_neg)*idf(r,c_neg) (2)

上述公式(1)和公式(2)中tf(r,c_pos)＝A/sum(c_pos)，tf(r,c_neg)＝A/sum(c_neg)，其中sum(c_pos)代表positive聚集文档中词语的个数，同理sum(c_neg)代表negative聚集文档中词语的个数。

idf(r,c_neg)＝log(count/count(r)+0.01)，其中count代表聚集文档的个数，即类别个数，对于三类的情感分类count值为3，count(r)表示出现词语r的聚集文档的个数，这里可以为1、2、3。

利用公式(1)和公式(2)分别计算在正面情感和负面情感中词语的评价量，即效用值，并按照从大到小的顺序对词语进行排序，话题的候选词筛选方法与上述方法一致。

(d).提取交互文本的倾向性特征的具体流程参照图2所示。首先对标记好类别的训练数据集进行处理：首先基于说话者之间的交互文本构建有向图<V,E>，其中图的顶点集V＝{v_i,i＝1,2,…,M}，M表示说话者的人数，v_i表示说话者，边集(v_i,v_j)∈E表示说话者v_i回复说话者v_j，另外这里将v_i对v_j的第k次回复记为然后在说话者v_i与v_j的交互文本数据中，分别统计属于有情感、无情感、某特定话题和非某特定话题四个类别的话轮数，并计算出各个类别的概率值；最后利用这些概率值计算倾向性特征，计算公式为：

其中，表示当前话轮的倾向性特征值，label_a和label_b表示文本的类别标签，在情感识别中，label_a和label_b分别表示有情感和无情感，在话题识别中，label_a和label_b分别表示某特定话题和非某特定话题；表示在v_i对v_j的所有回复记录中，类别标签为label_a的概率值；

对新用户或不活跃用户未标注样本的类别预测过程

本发明随机游走算法的思想应用到交互文本的分类中，目的是提高缺少历史数据的新用户的分类效果。给出随机游走的过程：本发明以所有话轮的特征向量集为顶点构建加权无向图：G＝(T,Z,H)，其中图的顶点集T＝{t_x,x＝1,2,…,N}，N表示话轮总数，t_x表示第x条话轮的特征向量，边集H＝[h_xy]_N×N，其中h_xy为连接顶点t_x，t_y的边z_xy的权重，h_xy的计算方法如公式(4)所示：

另外，构建顶点对角矩阵D，如公式5所示:

其中：

基于图G＝(T,Z,H)中顶点集T上的Random Walk的概率转移公式为：

其中，p_xy表示从顶点t_x一步转移到顶点t_y的概率，P＝[p_xy]_N×N，表示转移矩阵，其计算方法如公式(8)所示：

P＝D^-1H (8)

则P^t表示t步Random Walk转移矩阵。

参照图3所示，结合随机游走的方法预测无标签数据类别的形式化描述。集合A表示有标签的数据集，其标签集合为集合B表示待预测的无标签数据集，其中包括B_old：老用户的无标签数据集，B_new：新用户的无标签数据集，三者满足以下关系：

B＝B_old∪B_new (9)

首先利用训练集A构建多任务分类模型(步骤2)，然后预测无标签测试集的类别标签，对测试集中的新用户和老用户采用不同的策略进行类别预测。预测老用户时直接将其特征向量值代入到多任务分类模型中进行类别预测(步骤5、步骤6)；预测新用户时需要利用转移概率矩阵计算出该新用户通过简单的随机游走过程最可能到达的前l个老用户或活跃用户的数据集合U。步骤13中的p(b,U)为待预测数据b与集合U中数据的状态转移概率向量，为集合U的类别标签向量，对于U中已有标签的数据直接用其自带的标签值：-1或1，对于无标签的数据需要利用步骤2得到的多任务分类模型计算其预测值。

在上述算法中，对新用户的预测主要依赖于老用户的预测结果，通过本文的多任务分类模型计算得到的预测值取值范围为[-∞,∞]，为了缩小对老用户预测值的离散程度，本文利用双曲正切函数将老用户的预测结果值映射到[-1,1]之间，双曲正切函数公式如下：

g_l(x_j)＝tanh(f_l(x_j)) (10)

其中函数f_l(x_j)是在任务l中对老用户j的预测值，g_l(x_j)为转换后的预测值。公式(10)相当于对老用户的预测值进行归一化处理。

Claims

1.基于多任务学习的中文交互文本情感与话题识别方法，其特征在于，包括以下步骤：

1)中文交互文本的特征提取

倾向性特征的提取步骤为：首先基于说话者之间的交互文本构建有向图<V,E>，其中图的顶点集V＝{v_i,i＝1,2,…,M}，M表示说话者的人数，v_i表示说话者，边集(v_i,v_j)∈E表示说话者v_i回复说话者v_j，另外这里将v_i对v_j的第k次回复记为然后在说话者v_i与v_j的交互文本数据中，分别统计属于有情感、无情感、某特定话题和非某特定话题四个类别的话轮数，并计算出各个类别的概率值；最后利用这些概率值计算倾向性特征

2)中文交互文本情感与话题识别

基于上下文的多任务分类模型构建方法具体为：根据交互文本的交互顺序将话轮进行排序，将当前话轮的前一个话轮和后一个话轮所属的情感与话题的类别作为的上下文信息，将对当前话轮进行情感与话题识别作为“一级任务”；结合当前话轮上下文的类别标签对当前话轮进行情感和话题的识别，作为“二级任务”；对训练集中的交互文本进行特征提取后形成两个特征向量数据集X1和X2，其中，X1为情感识别的数据集，X2为话题识别的数据集，在X1和X2的特征向量中，包括统计特征、交互特征、词频特征和倾向性特征；

定义y∈[-1,1]为每条样本情感与话题的类别标签，在情感识别中，-1表示负面情感，1表示正面情感；在话题识别中，-1表示某特定话题，1表示非某特定话题；构建“一级任务”的多任务分类模型过程如公式(2)所示：

<mrow> <mi>P</mi> <mo>&Proportional;</mo> <mi>p</mi> <mrow> <mo>(</mo> <msubsup> <mi>y</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> <mi>k</mi> </msubsup> <mo>|</mo> <mi>X</mi> <mo>,</mo> <mi>W</mi> <mo>,</mo> <mi>&kappa;</mi> <mo>,</mo> <mi>&epsiv;</mi> <mo>)</mo> </mrow> <mi>p</mi> <mrow> <mo>(</mo> <mi>W</mi> <mo>|</mo> <mi>&sigma;</mi> <mo>,</mo> <mi>&Omega;</mi> <mo>)</mo> </mrow> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>2</mn> <mo>)</mo> </mrow> </mrow>

<mrow> <mi>F</mi> <mrow> <mo>(</mo> <mi>W</mi> <mo>)</mo> </mrow> <mo>=</mo> <mi>m</mi> <mi>a</mi> <mi>x</mi> <mrow> <mo>(</mo> <mi>p</mi> <mo>(</mo> <mrow> <msubsup> <mi>y</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> <mi>k</mi> </msubsup> <mo>|</mo> <mi>X</mi> <mo>,</mo> <mi>W</mi> <mo>,</mo> <mi>&kappa;</mi> <mo>,</mo> <mi>&epsiv;</mi> </mrow> <mo>)</mo> <mi>p</mi> <mo>(</mo> <mrow> <mi>W</mi> <mo>|</mo> <mi>&sigma;</mi> <mo>,</mo> <mi>&Omega;</mi> </mrow> <mo>)</mo> <mo>)</mo> </mrow> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>3</mn> <mo>)</mo> </mrow> </mrow>

构建“二级任务”的建模过程如下所示：

<mrow> <msub> <mi>p</mi> <mrow> <mi>u</mi> <mi>p</mi> <mi>c</mi> <mi>o</mi> <mi>n</mi> <mi>t</mi> <mi>e</mi> <mi>x</mi> <mi>t</mi> </mrow> </msub> <mo>&Proportional;</mo> <mi>p</mi> <mrow> <mo>(</mo> <msubsup> <mi>y</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </msubsup> <mo>|</mo> <mi>X</mi> <mo>,</mo> <mi>W</mi> <mo>,</mo> <mi>&kappa;</mi> <mo>,</mo> <mi>&epsiv;</mi> <mo>)</mo> </mrow> <mi>p</mi> <mrow> <mo>(</mo> <mi>W</mi> <mo>|</mo> <mi>&sigma;</mi> <mo>,</mo> <mi>&Omega;</mi> <mo>)</mo> </mrow> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>4</mn> <mo>)</mo> </mrow> </mrow>

<mrow> <msub> <mi>P</mi> <mrow> <mi>d</mi> <mi>o</mi> <mi>w</mi> <mi>n</mi> <mi>c</mi> <mi>o</mi> <mi>n</mi> <mi>t</mi> <mi>e</mi> <mi>x</mi> <mi>t</mi> </mrow> </msub> <mo>&Proportional;</mo> <mi>p</mi> <mrow> <mo>(</mo> <msubsup> <mi>y</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> <mrow> <mi>k</mi> <mo>+</mo> <mn>1</mn> </mrow> </msubsup> <mo>|</mo> <mi>X</mi> <mo>,</mo> <mi>W</mi> <mo>,</mo> <mi>&kappa;</mi> <mo>,</mo> <mi>&epsiv;</mi> <mo>)</mo> </mrow> <mi>p</mi> <mrow> <mo>(</mo> <mi>W</mi> <mo>|</mo> <mi>&sigma;</mi> <mo>,</mo> <mi>&Omega;</mi> <mo>)</mo> </mrow> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>5</mn> <mo>)</mo> </mrow> </mrow>

F_MAP＝F+βF_context(β∈[0,1]) (6)

利用高斯密度函数将公式(6)展开，得到公式(7)：

<mrow> <msub> <mi>F</mi> <mrow> <mi>M</mi> <mi>A</mi> <mi>P</mi> </mrow> </msub> <mrow> <mo>(</mo> <mi>W</mi> <mo>)</mo> </mrow> <mo>=</mo> <mi>m</mi> <mi>i</mi> <mi>n</mi> <mo>{</mo> <munderover> <mo>&Sigma;</mo> <mrow> <mi>l</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>L</mi> </munderover> <mfrac> <mi>&beta;</mi> <msup> <mi>&epsiv;</mi> <mn>2</mn> </msup> </mfrac> <munderover> <mo>&Sigma;</mo> <mrow> <mi>q</mi> <mo>=</mo> <mn>1</mn> </mrow> <msub> <mi>Q</mi> <mi>l</mi> </msub> </munderover> <msup> <mrow> <mo>(</mo> <msubsup> <mi>y</mi> <mi>q</mi> <mi>l</mi> </msubsup> <mo>-</mo> <msubsup> <mi>w</mi> <mi>l</mi> <mi>T</mi> </msubsup> <msubsup> <mi>x</mi> <mi>q</mi> <mi>l</mi> </msubsup> <mo>-</mo> <msub> <mi>&kappa;</mi> <mi>l</mi> </msub> <mo>)</mo> </mrow> <mn>2</mn> </msup> <mo>+</mo> <munderover> <mo>&Sigma;</mo> <mrow> <mi>l</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>L</mi> </munderover> <mfrac> <mn>1</mn> <msup> <mi>&sigma;</mi> <mn>2</mn> </msup> </mfrac> <msubsup> <mi>w</mi> <mi>l</mi> <mi>T</mi> </msubsup> <msub> <mi>w</mi> <mi>l</mi> </msub> <mo>+</mo> <mi>t</mi> <mi>r</mi> <mrow> <mo>(</mo> <msup> <mi>W&Omega;</mi> <mrow> <mo>-</mo> <mn>1</mn> </mrow> </msup> <msup> <mi>W</mi> <mi>T</mi> </msup> <mo>)</mo> </mrow> <mo>+</mo> <mi>d</mi> <mi>l</mi> <mi>n</mi> <mrow> <mo>(</mo> <mi>&Omega;</mi> <mo>)</mo> </mrow> <mo>}</mo> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>7</mn> <mo>)</mo> </mrow> </mrow>

<mrow> <mtable> <mtr> <mtd> <mrow> <mi>&Omega;</mi> <mo>&GreaterEqual;</mo> <mn>0</mn> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mi>t</mi> <mi>r</mi> <mrow> <mo>(</mo> <mi>&Omega;</mi> <mo>)</mo> </mrow> <mo>=</mo> <mn>1</mn> </mrow> </mtd> </mtr> </mtable> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>8</mn> <mo>)</mo> </mrow> </mrow>

得到待优化的目标函数为：

<mrow> <munder> <mrow> <mi>m</mi> <mi>i</mi> <mi>n</mi> </mrow> <mrow> <mi>W</mi> <mo>,</mo> <mi>b</mi> </mrow> </munder> <mo>{</mo> <munderover> <mo>&Sigma;</mo> <mrow> <mi>l</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>L</mi> </munderover> <mfrac> <mi>&beta;</mi> <msub> <mi>Q</mi> <mi>l</mi> </msub> </mfrac> <munderover> <mo>&Sigma;</mo> <mrow> <mi>q</mi> <mo>=</mo> <mn>1</mn> </mrow> <msub> <mi>Q</mi> <mi>l</mi> </msub> </munderover> <msup> <mrow> <mo>(</mo> <msubsup> <mi>y</mi> <mi>q</mi> <mi>l</mi> </msubsup> <mo>-</mo> <msubsup> <mi>w</mi> <mi>l</mi> <mi>T</mi> </msubsup> <msubsup> <mi>x</mi> <mi>j</mi> <mi>l</mi> </msubsup> <mo>-</mo> <msub> <mi>&kappa;</mi> <mi>l</mi> </msub> <mo>)</mo> </mrow> <mn>2</mn> </msup> <mo>+</mo> <mfrac> <msub> <mi>&lambda;</mi> <mn>1</mn> </msub> <mn>2</mn> </mfrac> <mi>t</mi> <mi>r</mi> <mrow> <mo>(</mo> <msup> <mi>WW</mi> <mi>T</mi> </msup> <mo>)</mo> </mrow> <mo>+</mo> <mfrac> <msub> <mi>&lambda;</mi> <mn>2</mn> </msub> <mn>2</mn> </mfrac> <mi>t</mi> <mi>r</mi> <mrow> <mo>(</mo> <msup> <mi>W&Omega;</mi> <mrow> <mo>-</mo> <mn>1</mn> </mrow> </msup> <msup> <mi>W</mi> <mi>T</mi> </msup> <mo>)</mo> </mrow> <mo>}</mo> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>9</mn> <mo>)</mo> </mrow> </mrow>

其中，λ₂＝2ε²

<mrow> <mtable> <mtr> <mtd> <mrow> <mi>F</mi> <mo>=</mo> <mi>min</mi> <munderover> <mo>&Sigma;</mo> <mrow> <mi>l</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>L</mi> </munderover> <mfrac> <mi>&beta;</mi> <msub> <mi>Q</mi> <mi>l</mi> </msub> </mfrac> <munderover> <mo>&Sigma;</mo> <mrow> <mi>q</mi> <mo>=</mo> <mn>1</mn> </mrow> <msub> <mi>Q</mi> <mi>l</mi> </msub> </munderover> <msup> <mrow> <mo>(</mo> <msubsup> <mi>&epsiv;</mi> <mi>q</mi> <mi>l</mi> </msubsup> <mo>)</mo> </mrow> <mn>2</mn> </msup> <mo>+</mo> <mfrac> <msub> <mi>&lambda;</mi> <mn>1</mn> </msub> <mn>2</mn> </mfrac> <mi>t</mi> <mi>r</mi> <mrow> <mo>(</mo> <msup> <mi>WW</mi> <mi>T</mi> </msup> <mo>)</mo> </mrow> <mo>+</mo> <mfrac> <msub> <mi>&lambda;</mi> <mn>2</mn> </msub> <mn>2</mn> </mfrac> <mi>t</mi> <mi>r</mi> <mrow> <mo>(</mo> <msup> <mi>W&Omega;</mi> <mrow> <mo>-</mo> <mn>1</mn> </mrow> </msup> <msup> <mi>W</mi> <mi>T</mi> </msup> <mo>)</mo> </mrow> </mrow> </mtd> </mtr> <mtr> <mtd> <mtable> <mtr> <mtd> <mrow> <mi>s</mi> <mo>.</mo> <mi>t</mi> <mo>.</mo> </mrow> </mtd> <mtd> <mrow> <msubsup> <mi>y</mi> <mi>q</mi> <mi>l</mi> </msubsup> <mo>-</mo> <mrow> <mo>(</mo> <msubsup> <mi>w</mi> <mi>l</mi> <mi>T</mi> </msubsup> <msubsup> <mi>x</mi> <mi>q</mi> <mi>l</mi> </msubsup> <mo>+</mo> <msub> <mi>&kappa;</mi> <mi>l</mi> </msub> <mo>)</mo> </mrow> <mo>=</mo> <msubsup> <mi>&epsiv;</mi> <mi>q</mi> <mi>l</mi> </msubsup> </mrow> </mtd> </mtr> </mtable> </mtd> </mtr> </mtable> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>10</mn> <mo>)</mo> </mrow> </mrow>

利用拉格朗日算子将公式(10)转化为无约束条件的规划问题进行最优化求解，得到整个函数取最小值时未知参数W的取值；

3)对新用户和不活跃用户的情感和话题识别效果进行改进

采用随机游走与多任务学习相结合的方法，利用历史数据丰富并且分类精度高的老用户或活跃用户的数据来协助预测新用户或不活跃用户情感与话题的类别。

2.根据权利要求1所述的基于多任务学习的中文交互文本情感与话题识别方法，其特征在于，倾向性特征的计算公式为：

<mrow> <mi>T</mi> <mrow> <mo>(</mo> <msubsup> <mi>s</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> <mi>k</mi> </msubsup> <mo>)</mo> </mrow> <mo>=</mo> <msub> <mi>log</mi> <mn>2</mn> </msub> <mrow> <mo>(</mo> <mfrac> <mrow> <mi>p</mi> <mrow> <mo>(</mo> <msubsup> <mi>s</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> <mi>k</mi> </msubsup> <mo>,</mo> <msub> <mi>label</mi> <mi>a</mi> </msub> <mo>)</mo> </mrow> </mrow> <mrow> <mi>p</mi> <mrow> <mo>(</mo> <msubsup> <mi>s</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> <mi>k</mi> </msubsup> <mo>,</mo> <msub> <mi>label</mi> <mi>b</mi> </msub> <mo>)</mo> </mrow> </mrow> </mfrac> <mo>*</mo> <mfrac> <mrow> <mi>p</mi> <mrow> <mo>(</mo> <msub> <mi>label</mi> <mi>b</mi> </msub> <mo>)</mo> </mrow> </mrow> <mrow> <mi>p</mi> <mrow> <mo>(</mo> <msub> <mi>label</mi> <mi>a</mi> </msub> <mo>)</mo> </mrow> </mrow> </mfrac> <mo>)</mo> </mrow> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>1</mn> <mo>)</mo> </mrow> </mrow>

其中，表示当前话轮的倾向性特征值，label_a和label_b表示文本的类别标签，在情感识别中，label_a和label_b分别表示有情感和无情感，在话题识别中，label_a和label_b分别表示某特定话题和非某特定话题，表示在v_i对v_j的所有回复记录中，类别标签为label_a的概率值。

3.根据权利要求1所述的基于多任务学习的中文交互文本情感与话题识别方法，其特征在于，统计特征、交互特征、词频特征和倾向性特征分别如下：

d)倾向性特征F4：即

4.根据权利要求1所述的基于多任务学习的中文交互文本情感与话题识别方法，其特征在于，采用随机游走与多任务学习相结合的方法，利用历史数据丰富并且分类精度高的老用户或活跃用户的数据来协助预测新用户或不活跃用户情感与话题的类别，其步骤为：

<mrow> <msub> <mi>h</mi> <mrow> <mi>x</mi> <mi>y</mi> </mrow> </msub> <mo>=</mo> <mi>exp</mi> <mrow> <mo>(</mo> <mo>-</mo> <mn>0.5</mn> <mo>*</mo> <mi>d</mi> <mi>i</mi> <mi>s</mi> <mo>(</mo> <mrow> <msub> <mi>t</mi> <mi>x</mi> </msub> <mo>,</mo> <msub> <mi>t</mi> <mi>y</mi> </msub> </mrow> <mo>)</mo> <mo>/</mo> <msubsup> <mi>&sigma;</mi> <mi>x</mi> <mn>2</mn> </msubsup> <mo>)</mo> </mrow> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>11</mn> <mo>)</mo> </mrow> </mrow>

另外，构建顶点对角矩阵D，如公式12所示:

<mrow> <mi>D</mi> <mo>=</mo> <msub> <mfenced open = "[" close = "]"> <mtable> <mtr> <mtd> <msub> <mi>d</mi> <mn>1</mn> </msub> </mtd> <mtd> <mrow></mrow> </mtd> <mtd> <mrow></mrow> </mtd> <mtd> <mrow></mrow> </mtd> </mtr> <mtr> <mtd> <mrow></mrow> </mtd> <mtd> <msub> <mi>d</mi> <mn>2</mn> </msub> </mtd> <mtd> <mrow></mrow> </mtd> <mtd> <mrow></mrow> </mtd> </mtr> <mtr> <mtd> <mrow></mrow> </mtd> <mtd> <mrow></mrow> </mtd> <mtd> <mo>...</mo> </mtd> <mtd> <mrow></mrow> </mtd> </mtr> <mtr> <mtd> <mrow></mrow> </mtd> <mtd> <mrow></mrow> </mtd> <mtd> <mrow></mrow> </mtd> <mtd> <msub> <mi>d</mi> <mi>N</mi> </msub> </mtd> </mtr> </mtable> </mfenced> <mrow> <mi>N</mi> <mo>&times;</mo> <mi>N</mi> </mrow> </msub> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>12</mn> <mo>)</mo> </mrow> </mrow>

其中:

<mrow> <msub> <mi>d</mi> <mi>x</mi> </msub> <mo>=</mo> <mi>d</mi> <mrow> <mo>(</mo> <msub> <mi>t</mi> <mi>x</mi> </msub> <mo>)</mo> </mrow> <mo>=</mo> <munderover> <mo>&Sigma;</mo> <mrow> <mi>y</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>N</mi> </munderover> <msub> <mi>h</mi> <mrow> <mi>x</mi> <mi>y</mi> </mrow> </msub> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>13</mn> <mo>)</mo> </mrow> </mrow>

<mrow> <msub> <mi>p</mi> <mrow> <mi>x</mi> <mi>y</mi> </mrow> </msub> <mo>=</mo> <mfrac> <msub> <mi>h</mi> <mrow> <mi>x</mi> <mi>y</mi> </mrow> </msub> <mrow> <munderover> <mo>&Sigma;</mo> <mrow> <mi>y</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>N</mi> </munderover> <msub> <mi>h</mi> <mrow> <mi>x</mi> <mi>y</mi> </mrow> </msub> </mrow> </mfrac> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>14</mn> <mo>)</mo> </mrow> </mrow>

其中，p_xy表示从顶点t_x一步转移到顶点t_y的概率，P＝[p_xy]_N×N，表示转移概率矩阵，其计算方法如公式(15)所示：

P＝D^-1H (15)

Step4：利用转移概率矩阵预测新用户或不活跃用户情感与话题的类别，利用转移概率矩阵计算出新用户通过简单的随机游走过程能到达的前l个老用户或活跃用户的数据集合U，利用多任务分类模型求集合U中数据的预测值，利用公式(16)求待预测数据b的类别预测值

其中，p(b,U)为待预测数据b与集合U中数据的状态转移概率向量，即为P矩阵特定行的分量，为集合U的类别标签向量。

5.根据权利要求4所述的基于多任务学习的中文交互文本情感与话题识别方法，其特征在于，对于U中已有标签的数据为其自带的标签值：-1或1；对于无标签的数据则利用Step3得到的多任务分类模型计算其预测值，并利用双曲正切函数g_i(x_j)＝tanh(f_i(x_j))将预测值映射到[-1,1]之间，其中函数f_i(x_j)是在任务i中对老用户j的预测值，g_i(x_j)为转换后的预测值。