CN107491490A - 基于情感中心的文本情感分类方法 - Google Patents
基于情感中心的文本情感分类方法 Download PDFInfo
- Publication number
- CN107491490A CN107491490A CN201710588604.6A CN201710588604A CN107491490A CN 107491490 A CN107491490 A CN 107491490A CN 201710588604 A CN201710588604 A CN 201710588604A CN 107491490 A CN107491490 A CN 107491490A
- Authority
- CN
- China
- Prior art keywords
- emotion
- center
- text
- vector
- loss function
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Abstract
本发明公开了一种基于情感中心的文本情感分类方法,该方法包括:先将文本向量与类别情感向量中心的距离加入损失函数,通过损失函数将情感中心的影响加入到分类模型中;然后使用BLSTM将文本进行初步编码,通过注意力机制改善文本表示的准确度;在文本表征之上,通过情感类别向量与文本表征的距离值引入情感中心的信息,并在模型训练的过程中不断更新情感中心的实值向量表示,使其更加精准。本发明关注改善目标函数,新的目标函数利用文本情感中心的限制改善了文本情感分类,提升了文本情感分类的准确率。
Description
技术领域
本发明属于自然语言处理技术领域,尤其涉及一种基于情感中心的文本情感分类方法。
背景技术
随着互联网技术的发展,人们越来越倾向于在社交网站上发表自己对于产品、事件等的 情感和观点。于是在这些社交网站中包含了大量富含情感的文本,对这些文本包含的情感信 息进行挖掘对研究人员或商家都大有裨益。已经有很多研究致力于挖掘这些数据信息,情感 分析的一个关键技术就是情感分类,就是将文本情感分为积极、中立和消极或者更细粒度的 分类为非常积极、积极、中立、消极和非常消极。
传统情感分类方法都是基于词典的方法或者基于机器学习的方法,现目前基于深度学习 的分类技术取得了比传统分类法更好的效果。但是之前的基于深度学习的各种神经网络主要 研究文本表征来区别不同评论文本的情感,这和正常的文本表征方法没有太大的区别,于是 目前有很少一部分研究开始关注改善目标函数去提升特征工程的性能。
发明内容
本发明的目的在于关注改善目标函数而提出的一种基于情感中心的情感分类方法,新的 目标函数利用文本情感中心的限制改善了文本情感分类,提升了文本情感分类的准确率。
实现本发明目的的具体技术方案是:
一种基于情感中心的文本情感分类方法,特点是:该方法包括以下具体步骤:
步骤1:情感中心约束的损失函数
将文本向量与类别情感向量中心的距离加入损失函数,通过损失函数将情感中心的影响 加入到分类模型中;
步骤2:文本表征和注意力(Attention)机制
使用BLSTM将文本进行初步编码,通过注意力机制改善文本表示的准确度;在文本表征 之上,通过情感类别向量与文本表征的距离值引入情感中心的信息,并在模型训练的过程中 不断更新情感中心的实值向量表示,使其更加精准。
所述将情感中心向量与文本表征的距离归入损失函数,采用学生t-分布来度量文本表征 向量和相关情感中心向量的距离;记归一化函数(Softmax)的损失函数值为Lsoft,情感中心 的损失函数值为:Lcenter;通过引入一个超参λ将所述两个损失函数值链接起来构成整个模型 的损失函数,既:L=λLsoft+(1-λ)Lcenter。
所述情感中心的损失函数值Lcenter的计算,采用随机产生的批量样本来更新情感中心向量; 其计算更新梯度为:其中△Cj为梯度,δ(condition)是条件函 数,如果条件为真,则δ=1,否则δ=0;m为批量样本大小,用i表示第i个样本;,Cyi为yi的情感中心向量,为样本属于Cyi的概率,yi为样本类别,j∈[1,k],k为分类类别。
本发明关注于改善目标函数,新的目标函数利用文本情感中心的限制改善了文本情感分 类,通过引入类别情感中心向量来约束文本自动编码结果。提升了文本情感分类准确率,并 得到了更好的文本空间表示。
附图说明
图1为基于情感中心的分层神经网络结构图。
具体实施方式
下面结合附图对本发明做详细描述。
参阅图1,本发明包括:
1、情感中心约束的文本表征分类模型
为了在文本表征中加强文本情感特征,很自然的想法就是使得文本表征更加接近情感中 心。为了达到这个目的,本发明使用一个核函数去测量文本表征和情感中心的距离,并且将 这个距离作为损失函数的一部分来训练整个神经网络。测量距离的函数有很多,本发明采用 的是学生t-分布来测量文本向量dyi和相关情感中心向量ci的相似度,公式为: 其中,ci表示和文档dyi有相同情感类别的情感中心,α 是学生-t分布的自由度。所以,情感中心的损失函数为它的softmax损失 函数为为了实现同步训练评论文本表征和更新情感中心的表征,本发明 在情感中心的softmax损失函数中引入一个超参λ:L=λLsoft+(1-λ)Lcenter。实验发现, 如果在每个样本训练时都更新情感中心,这个中心会抖动变得难以约束。为了解决这个问题, 用随机产生的mini批处理去分批更新情感中心。所以用如下公式计算Lcenter的梯度: 其中△Cj为梯度,δ(condition)是条件函数,如果条件为真, 则δ=1,否则δ=0;m为批量样本大小,用i表示第i个样本;,Cyi为yi的情感中心向量,为样本属于Cyi的概率,yi为样本类别,j∈[1,k],k为分类类别。
2、文本表征和注意力(Attention)机制
本发明采用一个分层结构(输入层、句子层和文档层)来表征评论文档,该结构通过单 词、句子和文档级别的堆栈来建模句子。它提供了一个对文档建模有效的结构。在本发明中, 用文档d来表示评论文本,它含有n个句子D={S1,S2,...,Sn}。其中每个句子由ti个单词组 成
输入层:将输入序列中的单词映射到词向量该词向量是一个低维的带情感信 息的词向量。输入层简单的讲评论中的每个单词映射到词向量空间。
句子层:LSTM是一种有效的捕捉数据特征的模型,所以本发明用这个模型对输入层中的 句子序列进行建模。LSTM通过引入记忆单元ct和三个门机制(i,o,f)能捕捉句子序列中的 长依赖问题,公式如下:
it=σ(Wixt+Uiht-1+bi)
ot=σ(Woxt+Uoht-1+bo)
ft=σ(Wfxt+Ufht-1+bf)
ht=otΘtanh(ct)
其中,σ是sigmoid函数,Θ是矩阵元素乘法运算。it,ft,ot,ct,bi,bo,bf,bc∈RH,Wi,Wo,Wf,Wc∈RH×d,和Ui,Uo,Uf,Uc∈RH×H。其中的H和d分别是隐藏层和输入层的 维度。
本发明可得到句子Si的隐藏层状态i=1,...,n并且ki代表句子长度。为 了得到更全面的句子表征,本发明还使用了attention机制去捕捉句中重要的特征,公式为: 其中,si是句子表征,是 每一个隐藏层状态的attention机制的权重,是隐藏层的表征,uw是单词级别的上 下文信息。
文档层:和句子层一样,本发明用LSTM模型对句子进行建模并用attention机制得到文 档表征d。
现存的用于情感分类的数据集都包含很多几句话组成的短段落,比如StanfordSentiment Treebank。它们都能验证分类模型的准确率。本发明在三个普遍的真实数据集上验证模型有 效性:Yelp2013、Yelp2014和IMDB。表1表明了这三个数据集的统计信息:
本发明采用准确率(Acc)和均方误差(MSE)来验证情感分类的性能。准确率是一个标准指标 来总体分类结果,均方误差用于计算预测的分类结果和真实标签两者之间的差异大小。公式 为:
本发明为验证基于情感中心的深度神经网络情感分类的有效性,将该发明的模型在各个 真实数据集进行实验,实验结果如下表所示:
数据集 | 准确率 | 均方误差 |
IMDB | 0.512 | 1.30 |
Yelp2013 | 0.648 | 0.74 |
Yelp2014 | 0.640 | 0.679 |
通过在IMDB、Yelp2013和Yelp2014三个标准数据集上的实验,本发明所提出的方法在 准确率和均方误差上获得了新的提升。相比于Tang et al.,2015b[1]中对三个数据集的实验 结果,本文获得了约2%的准确率提升,并降低了约4%的均方差。
Claims (3)
1.一种基于情感中心的文本情感分类方法,其特征在于,该方法包括以下具体步骤:
步骤1:情感中心约束的损失函数
将文本向量与类别情感向量中心的距离加入损失函数,通过损失函数将情感中心的影响加入到分类模型中;
步骤2:文本表征和注意力机制
使用BLSTM将文本进行初步编码,通过注意力机制改善文本表示的准确度;在文本表征之上,通过情感类别向量与文本表征的距离值引入情感中心的信息,并在模型训练的过程中不断更新情感中心的实值向量表示,使其更加精准。
2.根据权利要求1所述的情感分类方法,其特征在于,所述将情感中心向量与文本表征的距离归入损失函数,采用学生t-分布来度量文本表征向量和相关情感中心向量的距离;记归一化函数的损失函数值为Lsoft,情感中心的损失函数值为:Lcenter;通过引入一个超参λ将所述两个损失函数值链接起来构成整个模型的损失函数,既:L=λLsoft+(1-λ)Lcenter。
3.根据权利要求2所述的情感分类方法,其特征在于,所述情感中心的损失函数值Lcenter的计算,采用随机产生的批量样本来更新情感中心向量;其计算更新梯度为:其中△Cj为梯度,δ是条件函数,如果条件为真,则δ=1,否则δ=0;m为批量样本大小,用i表示第i个样本;为yi的情感中心向量,为样本属于的概率,yi为样本类别,j∈[1,k],k为分类类别。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710588604.6A CN107491490B (zh) | 2017-07-19 | 2017-07-19 | 基于情感中心的文本情感分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710588604.6A CN107491490B (zh) | 2017-07-19 | 2017-07-19 | 基于情感中心的文本情感分类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107491490A true CN107491490A (zh) | 2017-12-19 |
CN107491490B CN107491490B (zh) | 2020-10-13 |
Family
ID=60644551
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710588604.6A Active CN107491490B (zh) | 2017-07-19 | 2017-07-19 | 基于情感中心的文本情感分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107491490B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109522546A (zh) * | 2018-10-12 | 2019-03-26 | 浙江大学 | 基于上下文相关的医学命名实体识别方法 |
CN109992780A (zh) * | 2019-03-29 | 2019-07-09 | 哈尔滨理工大学 | 一种基于深度神经网络特定目标情感分类方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106204140A (zh) * | 2016-07-12 | 2016-12-07 | 华东师范大学 | 一种基于kl距离的群体观点迁移检测方法 |
CN107092596A (zh) * | 2017-04-24 | 2017-08-25 | 重庆邮电大学 | 基于attention CNNs和CCR的文本情感分析方法 |
CN107153642A (zh) * | 2017-05-16 | 2017-09-12 | 华北电力大学 | 一种基于神经网络识别文本评论情感倾向的分析方法 |
CN107316654A (zh) * | 2017-07-24 | 2017-11-03 | 湖南大学 | 基于dis‑nv特征的情感识别方法 |
-
2017
- 2017-07-19 CN CN201710588604.6A patent/CN107491490B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106204140A (zh) * | 2016-07-12 | 2016-12-07 | 华东师范大学 | 一种基于kl距离的群体观点迁移检测方法 |
CN107092596A (zh) * | 2017-04-24 | 2017-08-25 | 重庆邮电大学 | 基于attention CNNs和CCR的文本情感分析方法 |
CN107153642A (zh) * | 2017-05-16 | 2017-09-12 | 华北电力大学 | 一种基于神经网络识别文本评论情感倾向的分析方法 |
CN107316654A (zh) * | 2017-07-24 | 2017-11-03 | 湖南大学 | 基于dis‑nv特征的情感识别方法 |
Non-Patent Citations (3)
Title |
---|
RAY A: ""Text recognition using deep BLSTM networks"", 《2015 EIGHTH INTERNATIONAL CONFERENCE ON ADVANCES IN PATTERN RECOGNITION》 * |
Z. LIU: ""Discovering Opinion Changes in Online Reviews via Learning Fine-Grained Sentiments"", 《2016 IEEE 2ND INTERNATIONAL CONFERENCE ON COLLABORATION AND INTERNET COMPUTING》 * |
王茂全: ""深度特征学习在句子文本分类中的研究及应用"", 《中国优秀硕士学位论文全文数据库-信息科技辑》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109522546A (zh) * | 2018-10-12 | 2019-03-26 | 浙江大学 | 基于上下文相关的医学命名实体识别方法 |
CN109992780A (zh) * | 2019-03-29 | 2019-07-09 | 哈尔滨理工大学 | 一种基于深度神经网络特定目标情感分类方法 |
CN109992780B (zh) * | 2019-03-29 | 2022-07-01 | 哈尔滨理工大学 | 一种基于深度神经网络特定目标情感分类方法 |
Also Published As
Publication number | Publication date |
---|---|
CN107491490B (zh) | 2020-10-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108399163B (zh) | 结合词聚合与词组合语义特征的文本相似性度量方法 | |
Ain et al. | Sentiment analysis using deep learning techniques: a review | |
Wang et al. | Recursive neural conditional random fields for aspect-based sentiment analysis | |
Mohammad | Sentiment analysis: Automatically detecting valence, emotions, and other affectual states from text | |
CN106611375A (zh) | 一种基于文本分析的信用风险评估方法及装置 | |
CN109408823B (zh) | 一种基于多通道模型的特定目标情感分析方法 | |
Peng et al. | Phonetic-enriched text representation for Chinese sentiment analysis with reinforcement learning | |
CN104598611B (zh) | 对搜索条目进行排序的方法及系统 | |
CN106980683A (zh) | 基于深度学习的博客文本摘要生成方法 | |
CN109726745B (zh) | 一种融入描述知识的基于目标的情感分类方法 | |
CN112256866B (zh) | 一种基于深度学习的文本细粒度情感分析算法 | |
Chang et al. | Research on detection methods based on Doc2vec abnormal comments | |
CN108108468A (zh) | 一种基于概念和文本情感的短文本情感分析方法和装置 | |
CN110851593B (zh) | 一种基于位置与语义的复值词向量构建方法 | |
CN113312480A (zh) | 基于图卷积网络的科技论文层级多标签分类方法及设备 | |
CN111538841B (zh) | 基于知识互蒸馏的评论情感分析方法、装置及系统 | |
CN110008482A (zh) | 文本处理方法、装置、计算机可读存储介质和计算机设备 | |
CN104537280B (zh) | 基于文本关系相似性的蛋白质交互关系识别方法 | |
CN110569355B (zh) | 一种基于词块的观点目标抽取和目标情感分类联合方法及系统 | |
Hayatin et al. | Summarization of COVID-19 news documents deep learning-based using transformer architecture | |
CN111241271B (zh) | 文本情感分类方法、装置及电子设备 | |
Dewi et al. | Shapley additive explanations for text classification and sentiment analysis of internet movie database | |
CN107491490A (zh) | 基于情感中心的文本情感分类方法 | |
Zhang et al. | Description-Enhanced Label Embedding Contrastive Learning for Text Classification | |
CN116049349A (zh) | 基于多层次注意力和层次类别特征的小样本意图识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |