CN110222342A - 结合情感原因发现的文本情感预测学习系统 - Google Patents
结合情感原因发现的文本情感预测学习系统 Download PDFInfo
- Publication number
- CN110222342A CN110222342A CN201910511670.2A CN201910511670A CN110222342A CN 110222342 A CN110222342 A CN 110222342A CN 201910511670 A CN201910511670 A CN 201910511670A CN 110222342 A CN110222342 A CN 110222342A
- Authority
- CN
- China
- Prior art keywords
- clause
- word
- emotion
- attention
- level
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000008451 emotion Effects 0.000 title claims abstract description 83
- 238000009825 accumulation Methods 0.000 claims abstract description 4
- 230000002996 emotional effect Effects 0.000 claims description 20
- 238000004364 calculation method Methods 0.000 claims description 9
- 239000011159 matrix material Substances 0.000 claims description 7
- 230000006870 function Effects 0.000 claims description 3
- 230000007246 mechanism Effects 0.000 claims description 3
- 230000036651 mood Effects 0.000 claims description 2
- 230000000717 retained effect Effects 0.000 claims description 2
- 230000000694 effects Effects 0.000 description 3
- 238000000034 method Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000008909 emotion recognition Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Machine Translation (AREA)
Abstract
一种文本情感原因发现装置,该装置包括词‑子句层级结构,包含有四部分:词级别编码器、词级别注意力、子句级别编码器、子句级别注意力;其中,词级别编码器,将文本送入词级别编码器,用于捕获词与词之间的序列特征;词级别注意力,通过当前词语的隐状态表示和与之对应的情绪表达词之间的关系来获得词级别的注意力值,用来指示当前词在其所在的子句中所占的重要程度,然后通过权重和累加操作获得每个子句的表示;子句级别注意力,利用一个分类器来获得当前子句是情感原因的概率,并以此作为子句的注意力值,同时将当前子句距离情绪表达词的距离的分布式表示与子句表示拼接;子句级别编码器,通过子句级编码器获取不同子句之间的结构性信息更新子句表示,通过softmax来获得分类特征的概率分布。通过该装置可以帮助机器更加精准地判断人类触发情感的原因。
Description
技术领域
本发明属于情感预测技术领域,特别涉及结合情感原因发现的文本情感预测学习系统。
背景技术
在传统文本情感分析的研究中,通常采用单任务学习模型,将文本情感原因发现和文本情感预测分别看作单一任务。
由于传统的情感分析方法将情感原因发现和情感预测看作两个独立的学习任务,需要针对不同的任务设计不同的学习模型,这种方式效率低下且难以挖掘二者之间密切的联系,即情感原因驱动情感的产生,所以对文本情感原因的研究能够促进对情感本身的研究。此外,单任务学习模型在优化时,梯度的反向传播倾向于陷入局部极小值,而多任务学习中不同任务的局部极小值处于不同的位置,通过相互作用,可以帮助隐含层逃离局部极小值,找到更优解。
发明内容
为克服已有技术的不足之处,本发明提出一种结合情感原因发现的文本情感预测学习系统,可以帮助机器更加精准地判断人类的情感。
为了实现上述目的,本发明采用的技术方案为:
一种文本情感原因发现装置,其特征在于,该装置包括词-子句层级结构,包含有四部分:词级别编码器、词级别注意力、子句级别编码器、子句级别注意力;其中,
词级别编码器,将文本送入词级别编码器,用于捕获词与词之间的序列特征;
词级别注意力,通过当前词语的隐状态表示和与之对应的情绪表达之间的关系来获得词级别的注意力值,用来指示当前词在其所在的子句中所占的重要程度,然后通过权重和累加操作获得每个子句的表示;
子句级别注意力,利用一个分类器来获得当前子句是情感原因的概率以此作为子句的注意力值,在子句层级将当前子句距离情绪表达词的距离与子句表示拼接;
子句级别编码器,通过子句编码器获取不同子句之间的结构性信息更新子句表示,通过softmax来获得分类特征的概率分布。
一种结合情感原因发现的情感预测学习系统,该系统包括上述情感原因发现装置以及共享模块、情感预测模块。
相比于现有的技术,本发明的优点有:
首先针对目前情感原因发现领域中忽略文本的结构性信息及不同子句之间关系的问题,提出一种层级结构增强子句的文本表示。其次,根据情感原因对于准确识别情感的推动作用,采用联合任务模型结合情感原因对文本进行情感预测,以帮助机器更加精准地判断人类的情感。
附图说明
图1是文本情感原因发现框架图;
图2是结合情绪原因的文本分类的联合模型。
具体实施方式
下面结合附图说明及具体实施方式对本发明进一步说明。
由于目前有关情感原因发现的方法忽略了文本的结构性信息及不同子句之间的关系,这些信息可以为情感原因发现任务提供重要的线索。本发明将采用一种层级的框架结构以提取文本中的有关情感原因的结构性信息及不同子句之间的语义关系。文本中不同的词和句子会呈现不同的信息,因此本发明在每个层级增加注意力机制来捕获子句及篇章的内在语义信息以增强子句的文本表示,助于最终的分类决策。
如图1所示:框架采用词-子句层级结构,主要分为四部分:词级别编码器、词级别注意力、子句级别编码器、子句级别注意力。下面将针对以上四部分进行详细介绍。
1)词级别编码器:首先将文本送入词级别的编码器,用于捕获词与词之间的序列特征。本发明采用门限循环单元(GRU)作为最基础的词级别编码器,在每一个时间步,隐状态ht通过以下公式进行更新:
zt=σ(Wzxt+Uzht-1+bz) (1)
rt=σ(Wrxt+Urht-1+br) (2)
其中,xt是输入单词wt的向量表示,σ和tanh是激活函数,是点积操作,Wz、Wr、Wh、Uz、Ur、Uh是待学习的参数矩阵,bz、br、bh是待学习的参数向量。
由于前序、后序信息对于当前的表达都很重要,因此本发明采用双向的GRU用来作为词级别的码器并通过以下公式进行更新隐状态:
其中,xit表示第i个子句(ci)第t个单词wit的向量表示,k为ci的长度,和是公式(1-4)的抽象表示,和分别为子句ci的前向和后向隐状态表示。最后,将和连接作为最终wit的表示:
2)词级别注意力:通过当前词语的隐状态表示和与之对应的情绪表达之间的关系来获得词级别的注意力值,用来指示当前词在其所在的子句中所占的重要程度,然后通过权重和累加操作获得每个子句的表示,计算公式如下:
其中,w为参数矩阵,为情绪表达ew的向量表示,αit指示了单词wit在子句ci中的重要程度。为子句ci的输出标识。
3)子句级别注意力:不仅是词之间有这样的关系,不同的子句同样有不同的重要程度。因此,本发明利用一个分类器来获得当前子句是情感原因的概率以此作为子句的注意力值,此外,也可以表达有多少当前的信息被保留。同时,位置信息表示是很重要的信息,因此在子句层级将当前子句距离情绪表达词距离的分布式表示与子句表示拼接。计算公式如下:
其中,Wv为参数矩阵,li为位置信息向量表示,qi为子句ci是情感原因的概率,同时也表示将有多少信息被保留到
4)子句级别编码器:通过子句编码器获取不同子句之间的结构性信息更新子句表示。最后,通过softmax来获得分类特征的概率分布。
计算公式如下:
其中,和是子句GRU单元,li为位置信息向量表示,和为子句的ci前向和后向隐状态表示,Wm为参数矩阵,为不同子句的情感原因概率分布。
由于情感原因发现及文本情感预测具有很强的相关性,因此本发明利用文本情感原因对于情绪的驱动作用,来辅助文本情感预测任务的决策。本发明采用一种联合模型,如图2所示,为了保留任务本身的特征,针对文本情感原因发现任务和文本情感预测任务,增添分别提取任务特定信息的神经网络层,为了共享任务的交互信息,设置共享层,这样既能提取任务特定特征又能捕获两个任务共享的信息,达到提升情感预测任务的准确性的目的,其中情感原因发现模块即为图1中的结构。
1)共享模块:情感原因驱动情感的产生,所以对文本情感原因的研究能够促进对情感本身的研究。因此,本发明设置一个共享模块捕获两个任务间的共享信息并通过一个共享GRU单元实现,计算公式如下:
其中,和为前向和后向GRU单元,xst为情感原因发现文本或者情感预测文本,和为情感文本的前向和后向表示。hst为和的连接表示。
2)情感预测模块:该模块利用GRU单元捕获情感预测文本的序列特征,并通过注意力机制获取文本的隐状态表示,最后和共享层的输出一起用于情感预测,计算公式如下:
gpt=wp·hpt (23)
其中,和为前向和后向GRU单元,xpt为情感预测文本,和为情感文本的前向和后向表示,hpt为和的连接表示,wp为参数向量,αpt为注意力值,op为情感预测文本的输出表示。
考虑两个任务的优化目标不同,本发明将对单任务进行分别优化,将交叉熵作为损失函数,如公式(26)所示:
L=-∑D∑c∈Cyclogfc(x;θ) (26)
其中,D是训练数据,C是样例的所有类别,yc是真实类别的分布,fc(x;θ)是模型预测为c-th类别的概率分布。
综上,本发明中提出了层级结构增强子句的文本表示,并根据情感原因对于准确识别情感的推动作用,采用联合任务模型结合情感原因对文本进行情感预测,能够帮助机器更准确地判断人类的情感。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。
Claims (9)
1.一种文本情感原因发现装置,其特征在于,该装置包括词-子句层级结构,包含有四部分:词级别编码器、词级别注意力、子句级别注意力、子句级别编码器;其中,
词级别编码器,将文本送入词级别编码器,用于捕获词与词之间的序列特征;
词级别注意力,通过当前词语的隐状态表示和与之对应的情绪表达之间的关系来获得词级别的注意力值,用来指示当前词在其所在的子句中所占的重要程度,然后通过权重和累加操作获得每个子句的表示;
子句级别注意力,利用一个分类器来获得当前子句是情感原因的概率以此作为子句的注意力值,在子句层级将当前子句距离情绪表达词的距离与子句表示拼接;
子句级别编码器,通过子句级别编码器获取不同子句之间的结构性信息更新子句表示,通过softmax来获得分类特征的概率分布。
2.根据权利要求1所述的文本情感原因发现装置,其特征在于:所述词级别编码器采用门限循环单元。
3.根据权利要求1所述的文本情感原因发现装置,其特征在于:所述词级别注意力的计算公式如下:
其中,w为参数矩阵,为情绪表达ew的向量表示,αit指示单词,wit在子句ci中的重要程度,为子句ci的输出标识,git和git'为不同时间步中计算注意力值的中间值,hit为第i个子句的向量表示。
4.根据权利要求3所述的情感原因发现装置,其特征在于:子句级别注意力中,在子句层级将当前子句距离情感表达词的距离与子句表示拼接,计算公式如下:
其中,Wv为参数矩阵,li为位置信息向量表示,qi为子句ci是情感原因的概率,同时也表示将有多少信息被保留到
5.根据权利要求4所述的情感原因发现装置,其特征在于:子句级别编码器中的计算公式如下:
其中,和是子句GRU单元,li为位置信息向量表示,和为子句的ci前向和后向隐状态表示,Wm为参数矩阵,为不同子句的情感原因概率分布。
6.一种结合情感原因发现的情感预测学习系统,该系统包括如权利要求1-5任一项所述的情感原因发现装置以及共享模块、情感预测模块。
7.如权利要求6所述的情感预测学习系统,其特征在于:共享模块捕获两个任务间的共享信息,并通过一共享GRU单元实现,其计算公式如下:
其中,和为前向和后向GRU单元,xst为情感原因发现文本或者情感预测文本,和为情感文本的前向和后向表示,hst为和的连接表示。
8.如权利要求6所述的情感预测学习系统,其特征在于:所述情感预测模块利用GRU单元捕获情感预测文本的序列特征,并通过注意力机制获取文本的隐状态表示,最后和共享层的输出一起用于情感预测。
9.如权利要求6所述的情感预测学习系统,其特征在于:对情感原因发现和情感预测分别进行优化,将交叉熵作为损失函数,
L=-∑D∑c∈Cyclogfc(x;θ)
其中,D是训练数据,C是样例的所有类别,yc是真实类别的分布,fc(x;θ)是模型预测为c-th类别的概率分布。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910511670.2A CN110222342B (zh) | 2019-06-13 | 2019-06-13 | 结合情感原因发现的文本情感预测学习系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910511670.2A CN110222342B (zh) | 2019-06-13 | 2019-06-13 | 结合情感原因发现的文本情感预测学习系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110222342A true CN110222342A (zh) | 2019-09-10 |
CN110222342B CN110222342B (zh) | 2023-05-02 |
Family
ID=67817047
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910511670.2A Active CN110222342B (zh) | 2019-06-13 | 2019-06-13 | 结合情感原因发现的文本情感预测学习系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110222342B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112364127A (zh) * | 2020-10-30 | 2021-02-12 | 重庆大学 | 一种短文档情感原因对提取方法、系统、存储介质 |
CN114004220A (zh) * | 2021-07-27 | 2022-02-01 | 刘德喜 | 一种基于cpc-ann的文本情绪原因识别方法 |
CN114817566A (zh) * | 2022-04-29 | 2022-07-29 | 天津大学 | 基于情绪嵌入的情绪原因对抽取方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11272664A (ja) * | 1998-03-19 | 1999-10-08 | Sharp Corp | テキスト構造解析装置および抄録装置、並びにプログラム記録媒体 |
US20140365208A1 (en) * | 2013-06-05 | 2014-12-11 | Microsoft Corporation | Classification of affective states in social media |
CN106528528A (zh) * | 2016-10-18 | 2017-03-22 | 哈尔滨工业大学深圳研究生院 | 文本情感分析的方法及装置 |
CN108446275A (zh) * | 2018-03-21 | 2018-08-24 | 北京理工大学 | 基于注意力双层lstm的长文本情感倾向性分析方法 |
CN109472031A (zh) * | 2018-11-09 | 2019-03-15 | 电子科技大学 | 一种基于双记忆注意力的方面级别情感分类模型及方法 |
CN109800390A (zh) * | 2018-12-21 | 2019-05-24 | 北京石油化工学院 | 一种个性化情感摘要的计算方法与装置 |
-
2019
- 2019-06-13 CN CN201910511670.2A patent/CN110222342B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11272664A (ja) * | 1998-03-19 | 1999-10-08 | Sharp Corp | テキスト構造解析装置および抄録装置、並びにプログラム記録媒体 |
US20140365208A1 (en) * | 2013-06-05 | 2014-12-11 | Microsoft Corporation | Classification of affective states in social media |
CN106528528A (zh) * | 2016-10-18 | 2017-03-22 | 哈尔滨工业大学深圳研究生院 | 文本情感分析的方法及装置 |
CN108446275A (zh) * | 2018-03-21 | 2018-08-24 | 北京理工大学 | 基于注意力双层lstm的长文本情感倾向性分析方法 |
CN109472031A (zh) * | 2018-11-09 | 2019-03-15 | 电子科技大学 | 一种基于双记忆注意力的方面级别情感分类模型及方法 |
CN109800390A (zh) * | 2018-12-21 | 2019-05-24 | 北京石油化工学院 | 一种个性化情感摘要的计算方法与装置 |
Non-Patent Citations (1)
Title |
---|
陈钊: "《结合卷积神经网络和词语情感序列特征的中文情感分析》", 《中文信息学报》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112364127A (zh) * | 2020-10-30 | 2021-02-12 | 重庆大学 | 一种短文档情感原因对提取方法、系统、存储介质 |
CN114004220A (zh) * | 2021-07-27 | 2022-02-01 | 刘德喜 | 一种基于cpc-ann的文本情绪原因识别方法 |
CN114817566A (zh) * | 2022-04-29 | 2022-07-29 | 天津大学 | 基于情绪嵌入的情绪原因对抽取方法 |
CN114817566B (zh) * | 2022-04-29 | 2023-03-10 | 天津大学 | 基于情绪嵌入的情绪原因对抽取方法 |
Also Published As
Publication number | Publication date |
---|---|
CN110222342B (zh) | 2023-05-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107609009B (zh) | 文本情感分析方法、装置、存储介质和计算机设备 | |
CN108563624A (zh) | 一种基于深度学习的自然语言生成方法 | |
CN110232109A (zh) | 一种网络舆情分析方法以及系统 | |
CN110222342B (zh) | 结合情感原因发现的文本情感预测学习系统 | |
Xia et al. | Modeling gender information for emotion recognition using denoising autoencoder | |
CN106980608A (zh) | 一种中文电子病历分词和命名实体识别方法及系统 | |
CN107066464A (zh) | 语义自然语言向量空间 | |
CN114186069B (zh) | 基于多模态异构图注意力网络的深度视频理解知识图谱构建方法 | |
CN111460132B (zh) | 一种基于图卷积神经网络的生成式会议摘要方法 | |
WO2020238353A1 (zh) | 数据处理方法和装置、存储介质及电子装置 | |
CN113035311A (zh) | 一种基于多模态注意力机制的医学图像报告自动生成方法 | |
WO2021139316A1 (zh) | 建立表情识别模型方法、装置、计算机设备及存储介质 | |
Perina et al. | Free energy score spaces: Using generative information in discriminative classifiers | |
CN111311364B (zh) | 基于多模态商品评论分析的商品推荐方法及系统 | |
CN114417851B (zh) | 一种基于关键词加权信息的情感分析方法 | |
CN116564338B (zh) | 语音动画生成方法、装置、电子设备和介质 | |
CN112561718A (zh) | 基于BiLSTM权重共享的案件微博评价对象情感倾向性分析方法 | |
CN113434683A (zh) | 文本分类方法、装置、介质及电子设备 | |
Khan et al. | A deep neural framework for image caption generation using gru-based attention mechanism | |
CN110111365A (zh) | 基于深度学习的训练方法和装置以及目标跟踪方法和装置 | |
Yu et al. | Cross-Domain Slot Filling as Machine Reading Comprehension. | |
Tavella et al. | Phonology recognition in american sign language | |
Chen et al. | Weighted co-training for cross-domain image sentiment classification | |
Wang | Improved facial expression recognition method based on gan | |
CN114386412B (zh) | 一种基于不确定性感知的多模态命名实体识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |