CN110162636A - 基于d-lstm的文本情绪原因识别方法 - Google Patents

基于d-lstm的文本情绪原因识别方法 Download PDF

Info

Publication number
CN110162636A
CN110162636A CN201910460125.5A CN201910460125A CN110162636A CN 110162636 A CN110162636 A CN 110162636A CN 201910460125 A CN201910460125 A CN 201910460125A CN 110162636 A CN110162636 A CN 110162636A
Authority
CN
China
Prior art keywords
clause
mood
reason
word
lstm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910460125.5A
Other languages
English (en)
Other versions
CN110162636B (zh
Inventor
不公告发明人
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhongsen Yunchain (chengdu) Technology Co Ltd
Original Assignee
Zhongsen Yunchain (chengdu) Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhongsen Yunchain (chengdu) Technology Co Ltd filed Critical Zhongsen Yunchain (chengdu) Technology Co Ltd
Priority to CN201910460125.5A priority Critical patent/CN110162636B/zh
Publication of CN110162636A publication Critical patent/CN110162636A/zh
Application granted granted Critical
Publication of CN110162636B publication Critical patent/CN110162636B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/353Clustering; Classification into predefined classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Machine Translation (AREA)

Abstract

本发明属于自然语言处理文本情绪分析领域,涉及一种对文本情绪原因识别的方法。本发明的主要方法包括:获取包含候选情绪原因和情绪描述的文本;将子句转化为词嵌入矩阵;使用双向长短期记忆网络Bi‑LSTM编码子句上下文信息;用注意力机制学习情绪描述子句与候选原因子句间的语义关系;对情绪描述子句集,用卷积神经网络CNN抽取局部最大语义;使用Bi‑LSTM编码子句间上下文信息;情绪描述子句集与编码后的候选原因子句拼接,使用多层感知机网络MLP判定二者是否存在情绪引发关系。本方法克服了传统方法未充分考虑情绪原因子句与情绪描述子句,情绪原因子句间的语义关系的问题。因此,本发明提出融合子句上下文,句子上下文的方法,提高了情绪原因识别的准确性。

Description

基于D-LSTM的文本情绪原因识别方法
技术领域
本发明属于自然语言处理文本情绪分析领域,具体是一种对文本进行情绪原因识别的方法。
背景技术
近年来,互联网的飞速发展使得信息传播已经不再受到时间、空间的约束,而社交媒体的兴起和快速发展,更是让用户可以随时随地表达观点、交流意见。论坛、博客、微信、微博、Twitter甚至购物评论、电子邮件···人们在网络空间中无时无刻地不在互相沟通、表达观点。而文本就成了网络空间中最常用的表达方式。这些带有发表者情感信息的文本,一直吸引着研究人员的关注。获取、理解这些文本的情感信息在一些应用和决策上变得越来越重要,因此文本情感分析在自然语言处理领域一直受到广大研究人员的关注。目前文本情感分析的相关研究大都在情绪分类上,却忽略了与情绪相关的更深层次信息的挖掘和提取。往往这些深层次信息更具有商业价值,对于生产厂商与电商平台来说,绝不会止步于了解用户是否喜欢自己的产品,而是更想知道用户为什么喜欢或者讨厌自己的产品,知道了这些信息才有利于制定公司未来的规划与发展方向;
近几年来,现有工作提出了多种文本情绪原因识别方法。但是,用这些方法来识别情绪原因或多或少存在着一些问题。比如,规则方法针对语料库构建规则,无法泛化;而基于统计的方法则需要对语料库提取特征向量空间,依赖于大规模的语料库。基于规则与统计的识别方法,未充分考虑情绪原因子句与情绪描述子句之间,情绪原因子句之间的语义联系这一问题。
本发明提出一种基于D-LSTM的文本情绪归因识别的方法。为了让情绪原因识别的效果更好,本发明在如下两个方面进行了考虑:第一,利用词语级双向长短期记忆网络Bi-LSTM与子句级双向长短期记忆网络Bi-LSTM,分别融合单个子句内前后词语信息与多子句的前后语句信息,对词语、句子重新编码,对输入的情绪描述语句与待识别的子句集间的关系进行建模。第二,结合注意力机制,使得模型能够准确地判断情绪原因所在子句,能够更好地完成情绪原因识别任务。
发明内容
本发明的目的在于提供一种基于D-LSTM的文本情绪归因识别的方法。本发明考虑单个子句内上下文词语信息与多子句的上下文语句信息,对词语、句子重新编码,对输入的情绪描述语句与待识别的子句集间的关系进行建模,并结合注意力机制,使得最后的情绪原因识别更加准确。
本发明是一种基于D-LSTM的情绪归因识别方法,包括以下步骤:
步骤1:获取已标注的语料文本,得到候选情绪原因子句和情绪描述子句,所述已标注的语料文本具有情绪原因子句标签,情绪描述子句标签;
步骤2:词嵌入层,将输入句子转化为词嵌入矩阵。
步骤3:词语级网络层,使用双向长短期记忆网络Bi-LSTM 分别对各个句子进行处理,得到融合子句上下文的词向量。
步骤4:注意力网络层,使用注意力机制,增强情绪描述子句与候选原因子句间相似词语的注意力。
步骤5:卷积网络层,使用卷积神经网络CNN对经注意力计算后情绪描述子句集进行卷积,最大池化操作,抽取局部最大语义信息。
步骤6:子句级网络层,使用双向长短期记忆网络Bi-LSTM 进行子句级处理,学习子句之间的相互作用。
步骤7:输出层,卷积后的情绪描述表达向量集与相对应的经过子句级网络处理的候选原因子句拼接,通过多层感知机MLP 网络分类,判定二者是否存在情绪引发关系。
所述步骤1中获取已标注的语料文本,得到候选情绪原因子句和情绪描述子句,所述已标注的语料文本具有情绪原因子句标签,情绪描述子句标签具体为,从已标注的语料文本中,根据标注得到候选情绪原因子句,情绪描述子句,以及是否是情绪原因的标签,为输入网络模型做准备;
所述步骤2中词嵌入层,将输入句子转化为词嵌入矩阵,具体为,使用预训练好的词向量模型,将每个词语映射为长度为V的词向量。对于每一个子句Clausei,假定由M个词语组成,则每个句子可表示为维度为M*V的词向量矩阵。在具体实现中,将文档D中包含的所有句子都填充为相同的预设长度M。对情绪描述子句E执行与文档D中所有子句同样操作。
所述步骤3中短语级网络层,使用双向长短期记忆网络 Bi-LSTM分别对各个句子进行处理,得到融合子句上下文的词向量具体为,以词为单位进行处理,通过对每个子句中的词向量重新编码,使其融合该子句中上下文的信息。假设输入的第K个子句为经过词嵌入层后,为1*V 维的词向量,经过Bi-LSTM网络,分别得到对于词前向表达与后向表达则对词向量可被重新编码为:
concat为向量连接操作,均为1*h的特征向量,h 为Bi-LSTM隐藏单元大小。拼接子句ClauseK中所有词语得到的WK,得到对整个子句重新编码的结果。为了方便表示,使用CK表示对情绪原因候选子句ClauseK的重新编码结果,ED表示情绪描述子句重新编码结果。文档D可表示为:
其中,N表示子句数量
所述步骤4中注意力网络层,使用注意力机制,增强情绪描述子句与候选原因子句间相似词语的注意力具体为,使用经过词语级 Bi-LSTM重新编码后的子句表达,构建第K个子句CK,与情绪描述子句ED的词语语义相似度矩阵,可表示为:
score表示余弦距离,为M*M的二维矩阵,其中表示CK中第i个词与ED中第j个词的语义相似度。
详细说明如下:
cos(A,B)表示向量A,B间的余弦距离,即为 为CK中第i个词,为ED中第j个词,即为CK与ED间词语语义关系矩阵。
转换语义关系矩阵维度,表示CK中第i个词与ED中各个词的语义相似度,但为1*2h的特征向量,对ED中的每个词,不同的维度应当有不同的相关程度,所以在对CKi添加注意力时,对每一维度应当有不同的权值,因此通过预设权值矩阵W来自行学习每一维度的注意力大小,s通过预设权值矩阵WE来自行学习CK中的每个词对ED中每个词每一维度的注意力大小。
对于输入的每个情绪原因候选子句,都能得到一个与情绪描述子句间的注意力矩阵集合可表示为:
A={A1,A1,A1,···,AN}
将从词语级Bi-LSTM网络部分得到的经重新编码的情绪原因候选子句集与对应的注意力矩阵对应位置相乘,得到每个子句加权后的表达:
其中:
同理,对于输入的情绪描述子句,都能得到一个与情绪原因候选子句间的注意力矩阵集合,可表示为:
Q={Q1,Q2,Q3,···,QN}
用经重新编码的情绪描述子句ED与每个关系矩阵对应相乘,得到加权后的表达:
其中:
所述步骤5中卷积网络层,使用卷积神经网络CNN对经注意力计算后情绪描述子句集进行卷积,最大池化操作,抽取局部最大语义信息具体为,如图4,分别对每一个情绪描述子句进行卷积,最大池化操作。假定卷积窗口大小为c,输入句子矩阵为M*V(M表示词个数,V为词向量维度),卷积窗口个数为n,得到n个数值连接为 n*1维向量;采取最大池化操作,从卷积得到的每个(M-c+1)*1向量中选取最大值作为句子全局语义信息的有效特征。此时得到n个数值,将池化层中得到的n个数值连接为n*1维向量,作为句子语义信息输出。最终得到经CNN操作后的情绪描述子句集:
所述步骤6中句子级网络层,使用双向长短期记忆网络 Bi-LSTM进行句子级处理,学习前后子句的的相互作用具体为,使用 Bi-LSTM来进行子句间的语义融合,得到融合前后子句信息的所有子句表达集合。Si表示经注意力部分计算后的第K个候选字句。对于第i个子句,可得到两个表达:其中为前向表达,为后向表达,维度均为1*h,h为该层Bi-LSTM隐藏单元大小。则对第i个子句重新编码结果为:
其中concat表示向量拼接,Si维度为1*2h
子句集合表示为:
所述步骤7中输出层,卷积池化操作后的情绪描述表达向量集与相对应的经过子句级Bi-LSTM网络处理的候选原因子句拼接,通过多层感知机MLP网络分类,判定二者是否存在情绪引发的关系具体为,S集合中第K个句子表达SK连接,通过MLP网络得到该子句是否为原因子句的概率,使用outK表示对第K个子句的预测概率,可以得到最后的输出结果:
out={out1,out2,out3.....outN}
判定结果为“1”,则该候选原因子句是情绪原因,判断结果为“0”,则该候选原因子句不是情绪原因。
附图说明
图1为本发明的流程示意图。
图2为词嵌入层示意图。
图3为词语级Bi-LSTM网络示意图。
图4为注意力机制示意图。
图5为子句级Bi-LSTM网络示意图。
图6为ED卷积层示意图。
图7为输出层示意图。
具体实施方式
本发明是一种基于D-LSTM的情绪原因识别方法,整体流程如图1所示,包括以下步骤:
本发明的目的在于提供一种基于D-LSTM的文本情绪归因识别的方法。本发明考虑单个子句内上下文词语信息与多子句的上下文语句信息,对词语、句子重新编码,对输入的情绪描述语句与待判断的子句集间的关系进行建模,并结合注意力机制,使得最后的情绪原因识别更加准确。
本发明是一种基于D-LSTM的情绪归因识别方法,包括以下步骤:
步骤1:获取已标注的语料文本,得到候选情绪原因子句和情绪描述子句,所述已标注的语料文本具有情绪原因子句标签,情绪描述子句标签;
步骤2:词嵌入层,将输入句子转化为词嵌入矩阵。
步骤3:短语级网络层,使用双向长短期记忆网络Bi-LSTM 分别对各个句子进行处理,得到融合子句上下文的词向量。
步骤4:注意力网络层,使用注意力机制,增强情绪描述子句与候选原因子句间相似词语的注意力。
步骤5:卷积网络层,使用卷积神经网络CNN对经注意力计算后情绪描述子句集进行卷积,最大池化操作,抽取局部最大语义信息。
步骤6:子句级网络层,使用双向长短期记忆网络Bi-LSTM 进行句子级处理,学习子句之间的相互作用。
步骤7:输出层,卷积后的情绪描述表达向量集与相对应的经过子句级网络处理的候选原因子句拼接,通过多层感知机MLP 网络分类,判定二者是否存在情绪引发关系。
所述步骤1中获取已标注的语料文本,得到候选情绪原因子句和情绪描述子句,所述已标注的语料文本具有情绪原因子句标签,情绪描述子句标签具体为,从已标注的语料文本中,根据标注得到候选情绪原因子句,情绪描述子句,以及是否是情绪原因的标签,为输入网络模型做准备;
所述步骤2中词嵌入层,将输入句子转化为词嵌入矩阵,具体为,使用预训练好的词向量模型,将每个词语映射为长度为V的词向量。如图1,对于每一个子句Clausei,假定由M个词语组成,则每个句子可表示为维度为M*V的词向量矩阵。在具体实现中,将文档D中包含的所有句子都填充为相同的预设长度M。对情绪描述子句E执行与文档D中所有子句同样操作。
所述步骤3中短语级网络层,使用双向长短期记忆网络 Bi-LSTM分别对各个句子进行处理,得到融合子句上下文的词向量具体为,以词为单位进行处理,通过对每个句子中的词向量重新编码,使其融合该句子中上下文的信息。假设输入的第K个子句为经过词嵌入层后,为1*V 维的词向量,经过Bi-LSTM网络,分别得到对于词前向表达与后向表达则对词向量可被重新编码为:
concat为向量连接操作,均为1*h的特征向量,h 为Bi-LSTM隐藏单元大小。拼接子句ClauseK中所有词语得到的WK,得到对整个子句重新编码的结果,如图2。为了方便表示,使用CK表示对情绪原因候选子句ClauseK的重新编码结果,ED表示情绪描述子句重新编码结果。如图2,文档D可表示为:
其中,N表示子句数量
所述步骤4中注意力网络层,使用注意力机制,增强情绪描述子句与候选原因子句间相似词语的注意力具体为,如图3,用经过词语级Bi-LSTM重新编码后的子句表达,构建第K个子句CK与情绪描述子句ED的词语语义相似度矩阵,表示为:
score表示余弦距离,为M*M的二维矩阵,其中表示CK中第i个词与ED中第j个词的语义相似度。
详细说明如下:
cos(A,B)表示向量A,B间的余弦距离,即为 为CK中第i个词,为ED中第j个词,即为CK与ED间词语语义关系矩阵。
转换语义关系矩阵维度,表示CK中第i个词与ED中各个词的语义相似度,但为1*2h的特征向量,对ED中的每个词,不同的维度应当有不同的相关程度,所以在对CKi添加注意力时,对每一维度应当有不同的权值,因此通过预设权值矩阵W来自行学习每一维度的注意力大小,通过预设权值矩阵WE来自行学习CK中的每个词对ED中每个词每一维度的注意力大小。
对于输入的每个情绪原因候选子句,都能得到一个与情绪描述子句间的注意力矩阵集合可表示为:
A={A1,A1,A1,···,AN}
将从词语级Bi-LSTM网络部分得到的经重新编码的情绪原因候选子句集与对应的注意力矩阵对应位置相乘,得到每个子句加权后的表达:
其中:
同理,对于输入的情绪描述子句,都能得到一个与情绪原因候选子句间的注意力矩阵集合,可表示为:
Q={Q1,Q2,Q3,···,QN}
用经重新编码的情绪描述子句ED与每个关系矩阵对应相乘,得到加权后的表达:
其中:
所述步骤5中卷积网络层,对使用卷积神经网络CNN对经注意力计算后情绪描述子句集进行卷积,最大池化操作,抽取局部最大语义信息具体为,分别对每一个情绪描述子句进行卷积,最大池化操作,如图6。假定卷积窗口大小为c,输入句子矩阵为M*V(M表示词个数,V为词向量维度),卷积窗口个数为n,得到n个数值连接为 n*1维向量;采取最大池化操作,从卷积得到的每个(M-c+1)*1向量中选取最大值作为句子全局语义信息的有效特征。此时得到n个数值,将池化层中得到的n个数值连接为n*1维向量,作为句子语义信息输出。最终得到经CNN操作后的情绪描述子句集:
所述步骤6中子句级网络层,使用双向长短期记忆网络 Bi-LSTM进行子句级处理,学习前后子句的的相互作用具体为,使用 Bi-LSTM来进行子句间的语义融合,得到融合前后子句信息的所有子句表达集合。Si表示经注意力部分计算后的第K个候选字句。对于第 i个子句,可得到两个表达:其中为前向表达,为后向表达,维度均为1*h,h为该层Bi-LSTM隐藏单元大小。则对第i个子句重新编码,如图5,结果为:
其中concat表示向量拼接,Si维度为1*2h
子句集合表示为:
所述步骤7中输出层,卷积,最大池化操作后的情绪描述表达向量集与相对应的经过子句级Bi-LSTMs处理的候选原因子句拼接,通过多层感知机MLP网络分类,判定二者是否存在情绪引发的关系具体为,如图7,S集合中第K个句子表达SK连接,通过 MLP网络得到该子句是否为原因子句的概率,使用outK表示对第K 个子句的预测概率,可以得到最后的输出结果:
out={out1,out2,out3.....outN}
判定结果为“1”,则该候选原因子句是情绪原因,判断结果为“0”,则该候选原因子句不是情绪原因。
采用本发明的实施方法,有益效果如下:第一,使用词语级 Bi-LSTM与子句级Bi-LSTM网络,分别融合单个子句内前后词语信息与多子句的前后语句信息,对词语、句子重新编码,对输入的情绪描述语句与待判断的子句集间的关系进行建模。第二,结合注意力机制,使得模型能够准确地判断情绪原因所在子句,能够更好地完成情绪原因识别任务。
以上对本发明实施所提供的一种基于上D-LSTM的情绪原因识别方法进行了详细地介绍,本文对本发明的原理和实施方式进行了阐述,以上实施的说明只是用于辅助理解本发明的方法及其核心思想。

Claims (8)

1.一种基于D-LSTM的文本情绪原因识别方法,其特征在于,所述方法应用于文本情绪原因识别,包括以下步骤:
步骤1:获取已标注的语料文本,得到候选情绪原因子句和情绪描述子句,所述已标注的语料文本具有情绪原因子句标签,情绪描述子句标签;
步骤2:词嵌入层,将子句转化为词嵌入矩阵;
步骤3:词语级网络层,使用双向长短期记忆网络Bi-LSTM分别对每个子句进行处理,得到融合子句上下文的词向量;
步骤4:注意力网络层,使用注意力机制,增强情绪描述子句与候选原因子句间相似词语的注意力;
步骤5:卷积网络层,使用卷积神经网络CNN对经注意力计算后情绪描述子句集进行卷积,最大池化操作,抽取局部最大语义信息;
步骤6:子句级网络层,使用双向长短期记忆网络Bi-LSTM进行子句级处理,学习前后子句的相互作用;
步骤7:输出层,卷积后的情绪描述表达向量集与相对应的经过子句级网络处理的候选原因子句拼接,通过多层感知机MLP网络分类,得到判定概率,判定二者是否存在情绪引发的关系,判定结果为“1”,则该候选原因子句是情绪原因,判断结果为“0”,则该候选原因子句不是情绪原因。
2.根据权利要求1所述的基于D-LSTM的文本情绪原因识别方法,其特征在于:所述步骤1中获取已标注的语料文本,得到候选情绪原因子句和情绪描述子句,所述已标注的语料文本具有情绪原因子句标签,情绪描述子句标签具体为,从已标注的语料文本中,根据标注得到候选情绪原因子句,情绪描述子句以及是否是情绪原因,为输入网络模型做准备。
3.根据权利要求1所述的基于D-LSTM的文本情绪原因识别方法,其特征在于:所述步骤2中词嵌入层,将输入子句转化为词嵌入矩阵具体为,使用预训练好的词向量模型,将每个词语映射为长度为V的词向量;对于每一个子句Clausei,假定由M个词语组成,则每个子句可表示为维度为M*V的词向量矩阵;在具体实现中,将文档D中包含的所有子句都填充为相同的预设长度M,对情绪描述子句E执行与文档D中所有子句同样操作。
4.根据权利要求1所述的基于D-LSTM的文本情绪原因识别方法,其特征在于:所述步骤3中词语级网络层,使用双向长短期记忆Bi-LSTM网络分别对每个子句进行处理,得到融合子句上下文的词向量具体为,以词为单位进行处理,通过对每个子句中的词向量重新编码,使其融合该子句中上下文的信息;假设输入的第K个子句为经过词嵌入层后,Wi K为1*V维的词向量,经过Bi-LSTM网络,分别得到对于词Wi K前向表达与后向表达则对词向量Wi K可被重新编码为concat为向量连接操作;拼接子句ClauseK中所有词语得到的WK,得到对整个子句重新编码的结果;为了方便表示,使用CK表示对情绪原因候选子句ClauseK的重新编码结果,ED表示情绪描述子句重新编码结果。
5.根据权利要求1所述的基于D-LSTM的文本情绪原因识别方法,其特征在于:所述步骤4中注意力网络层,使用注意力机制,增强情绪描述子句与候选原因子句间相似词语的注意力具体为,首先,使用经过词语级Bi-LSTM网络重新编码后的子句表达,构建第K个子句CK与情绪描述子句ED的词语语义相似度矩阵其中表示CK中第i个词与ED中第j个词的语义相似度,语义相似度用余弦距离表示,详细说明如下:
即为 为CK中第i个词,为ED中第j个词,即为CK与ED间词语语义关系矩阵;然后,转换语义关系矩阵维度,通过预设权值矩阵W来自行学习ED中的每个词对CK中每个词每一维度的注意力大小,通过预设权值矩阵WE来自行学习CK中的每个词对ED中每个词每一维度的注意力大小;分别得到与情绪描述子句间的注意力矩阵,以及与情绪原因候选子句间的注意力矩阵集合;最后,将从词语级Bi-LSTM网络重新编码的情绪原因候选子句集与对应的注意力矩阵对应位置相乘,得到每个子句加权后的表达;将从词语级Bi-LSTM网络重新编码的情绪描述子句与对应的注意力矩阵对应位置相乘,得到情绪描述子句加权后的表达。
6.根据权利要求1所述的基于D-LSTM的文本情绪原因识别方法,其特征在于:所述步骤5中卷积网络层,使用卷积神经网络CNN对经注意力计算后情绪描述子句集进行卷积,最大池化操作,抽取局部最大语义信息具体为,分别对每一个情绪描述子句进行卷积,最大池化操作;假定卷积窗口大小为c,输入句子矩阵为M*V,M表示词个数,V为词向量维度,卷积窗口个数为n,得到n个数值连接为n*1维向量;采取最大池化操作,从卷积得到的每个(M-c+1)*1向量中选取最大值作为句子全局语义信息的有效特征,此时得到n个数值,将池化层中得到的n个数值连接为n*1维向量,作为句子语义信息输出,最终得到经CNN操作后的情绪描述子句集:
7.根据权利要求1所述的基于D-LSTM的文本情绪原因识别方法,其特征在于:所述步骤6中子句级网络层,使用双向长短期记忆网络Bi-LSTM进行子句级处理,学习前后子句的相互作用具体为,使用双向长短期记忆网络Bi-LSTM来进行子句间的语义融合,得到融合前后子句信息的所有子句表达集合,Si表示经注意力部分计算后的第K个候选字句;对于第i个子句,可得到两个表达:其中为前向表达,为后向表达,则对第i个子句重新编码结果为:其中concat表示向量拼接,得到子句集合,表示为:
8.根据权利要求1所述的基于D-LSTM的文本情绪原因识别方法,其特征在于:所述步骤7中输出层,卷积后的情绪描述表达向量集与相对应的经过子句级网络处理的候选原因子句拼接,通过多层感知机MLP网络分类,得到判定概率,判定二者是否存在情绪引发的关系具体为,S集合中第K个句子表达SK拼接,通过MLP网络得到该子句是否为原因子句的概率,得到最后的输出结果,判定结果为“1”,则该候选原因子句是情绪原因,判断结果为“0”,则该候选原因子句不是情绪原因。
CN201910460125.5A 2019-05-30 2019-05-30 基于d-lstm的情绪原因识别方法 Active CN110162636B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910460125.5A CN110162636B (zh) 2019-05-30 2019-05-30 基于d-lstm的情绪原因识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910460125.5A CN110162636B (zh) 2019-05-30 2019-05-30 基于d-lstm的情绪原因识别方法

Publications (2)

Publication Number Publication Date
CN110162636A true CN110162636A (zh) 2019-08-23
CN110162636B CN110162636B (zh) 2020-05-19

Family

ID=67629871

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910460125.5A Active CN110162636B (zh) 2019-05-30 2019-05-30 基于d-lstm的情绪原因识别方法

Country Status (1)

Country Link
CN (1) CN110162636B (zh)

Cited By (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110765769A (zh) * 2019-08-27 2020-02-07 电子科技大学 一种基于子句特征的实体属性依赖情感分析方法
CN110765250A (zh) * 2019-10-21 2020-02-07 拉扎斯网络科技(上海)有限公司 检索方法、装置、可读存储介质和电子设备
CN110866098A (zh) * 2019-10-29 2020-03-06 平安科技(深圳)有限公司 基于transformer和lstm的机器阅读方法、装置及可读存储介质
CN110879938A (zh) * 2019-11-14 2020-03-13 中国联合网络通信集团有限公司 文本情感分类方法、装置、设备和存储介质
CN110968692A (zh) * 2019-10-23 2020-04-07 全球能源互联网研究院有限公司 一种文本分类方法及系统
CN111144130A (zh) * 2019-12-26 2020-05-12 辽宁工程技术大学 一种基于上下文感知的混合神经网络的细粒度情感分类方法
CN111221964A (zh) * 2019-12-25 2020-06-02 西安交通大学 一种不同分面观点演化趋势引导的文本生成方法
CN111274786A (zh) * 2020-01-22 2020-06-12 中国人民大学 一种自动量刑的方法和系统
CN111325016A (zh) * 2020-02-04 2020-06-23 深圳证券信息有限公司 一种文本处理方法、系统、设备、介质
CN111382565A (zh) * 2020-03-09 2020-07-07 南京理工大学 基于多标签的情绪-原因对抽取方法及系统
CN112183064A (zh) * 2020-10-22 2021-01-05 福州大学 基于多任务联合学习的文本情绪原因识别系统
CN112580366A (zh) * 2020-11-30 2021-03-30 科大讯飞股份有限公司 情绪识别方法以及电子设备、存储装置
CN112633364A (zh) * 2020-12-21 2021-04-09 上海海事大学 一种基于Transformer-ESIM注意力机制的多模态情绪识别方法
WO2021135457A1 (zh) * 2020-08-06 2021-07-08 平安科技(深圳)有限公司 基于循环神经网络的情绪识别方法、装置及存储介质
CN113158644A (zh) * 2021-05-13 2021-07-23 山西大学 一种基于多任务学习的修辞格及隐式情绪识别方法
CN113434682A (zh) * 2021-06-30 2021-09-24 平安科技(深圳)有限公司 文本情感分析方法、电子装置及存储介质
CN113505583A (zh) * 2021-05-27 2021-10-15 山东交通学院 基于语义决策图神经网络的情感原因子句对提取方法
CN113779245A (zh) * 2021-08-24 2021-12-10 北京理工大学 一种评论情感原因三元组抽取方法
CN113836910A (zh) * 2021-09-17 2021-12-24 山东师范大学 一种基于多层次语义的文本识别方法及系统
CN114004220A (zh) * 2021-07-27 2022-02-01 刘德喜 一种基于cpc-ann的文本情绪原因识别方法
CN114639139A (zh) * 2022-02-16 2022-06-17 南京邮电大学 一种基于强化学习的情绪化图像描述方法及系统
CN114817566A (zh) * 2022-04-29 2022-07-29 天津大学 基于情绪嵌入的情绪原因对抽取方法
CN115841119A (zh) * 2023-02-21 2023-03-24 中国科学技术大学 一种基于图结构的情绪原因提取方法
CN116108836A (zh) * 2023-04-10 2023-05-12 之江实验室 文本情感识别方法、装置、计算机设备及可读存储介质
CN116910255A (zh) * 2023-07-19 2023-10-20 重庆位图信息技术有限公司 一种情感原因对提取方法、装置、计算机设备和存储介质
US11922129B2 (en) 2021-06-22 2024-03-05 International Business Machines Corporation Causal knowledge identification and extraction
CN117808011A (zh) * 2024-03-01 2024-04-02 青岛网信信息科技有限公司 一种带有模拟情绪的聊天机器人的方法、介质及系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102521220A (zh) * 2011-11-29 2012-06-27 华中师范大学 一种网络自杀遗书的识别方法
CN104102627A (zh) * 2014-07-11 2014-10-15 合肥工业大学 一种多模态的非接触情感分析记录系统
CN104536953A (zh) * 2015-01-22 2015-04-22 苏州大学 一种文本情绪极性的识别方法及装置
CN105138570A (zh) * 2015-07-26 2015-12-09 吉林大学 网络言论数据疑似犯罪度计算方法
CN109299262A (zh) * 2018-10-09 2019-02-01 中山大学 一种融合多粒度信息的文本蕴含关系识别方法
AU2019100371A4 (en) * 2019-04-05 2019-05-16 Ba, He Mr A Sentiment Analysis System Based on Deep Learning

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102521220A (zh) * 2011-11-29 2012-06-27 华中师范大学 一种网络自杀遗书的识别方法
CN104102627A (zh) * 2014-07-11 2014-10-15 合肥工业大学 一种多模态的非接触情感分析记录系统
CN104536953A (zh) * 2015-01-22 2015-04-22 苏州大学 一种文本情绪极性的识别方法及装置
CN105138570A (zh) * 2015-07-26 2015-12-09 吉林大学 网络言论数据疑似犯罪度计算方法
CN109299262A (zh) * 2018-10-09 2019-02-01 中山大学 一种融合多粒度信息的文本蕴含关系识别方法
AU2019100371A4 (en) * 2019-04-05 2019-05-16 Ba, He Mr A Sentiment Analysis System Based on Deep Learning

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
姜坤: ""基于LSTM和注意力机制的情感分析服务的设计与实现"", 《中国优秀硕士学位论文库全文数据库》 *
高成亮等: ""结合词性信息的基于注意力机制的双向 LSTM 的中文文本分类"", 《河 北 科 技 大 学 学 报》 *

Cited By (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110765769A (zh) * 2019-08-27 2020-02-07 电子科技大学 一种基于子句特征的实体属性依赖情感分析方法
CN110765769B (zh) * 2019-08-27 2023-05-02 电子科技大学 一种基于子句特征的实体属性依赖情感分析方法
CN110765250A (zh) * 2019-10-21 2020-02-07 拉扎斯网络科技(上海)有限公司 检索方法、装置、可读存储介质和电子设备
CN110968692A (zh) * 2019-10-23 2020-04-07 全球能源互联网研究院有限公司 一种文本分类方法及系统
CN110968692B (zh) * 2019-10-23 2023-04-07 全球能源互联网研究院有限公司 一种文本分类方法及系统
CN110866098A (zh) * 2019-10-29 2020-03-06 平安科技(深圳)有限公司 基于transformer和lstm的机器阅读方法、装置及可读存储介质
CN110866098B (zh) * 2019-10-29 2022-10-28 平安科技(深圳)有限公司 基于transformer和lstm的机器阅读方法、装置及可读存储介质
CN110879938A (zh) * 2019-11-14 2020-03-13 中国联合网络通信集团有限公司 文本情感分类方法、装置、设备和存储介质
CN111221964A (zh) * 2019-12-25 2020-06-02 西安交通大学 一种不同分面观点演化趋势引导的文本生成方法
CN111221964B (zh) * 2019-12-25 2023-04-14 西安交通大学 一种不同分面观点演化趋势引导的文本生成方法
CN111144130A (zh) * 2019-12-26 2020-05-12 辽宁工程技术大学 一种基于上下文感知的混合神经网络的细粒度情感分类方法
CN111274786A (zh) * 2020-01-22 2020-06-12 中国人民大学 一种自动量刑的方法和系统
CN111325016B (zh) * 2020-02-04 2024-02-02 深圳证券信息有限公司 一种文本处理方法、系统、设备、介质
CN111325016A (zh) * 2020-02-04 2020-06-23 深圳证券信息有限公司 一种文本处理方法、系统、设备、介质
CN111382565B (zh) * 2020-03-09 2023-08-11 南京理工大学 基于多标签的情绪-原因对抽取方法及系统
CN111382565A (zh) * 2020-03-09 2020-07-07 南京理工大学 基于多标签的情绪-原因对抽取方法及系统
WO2021135457A1 (zh) * 2020-08-06 2021-07-08 平安科技(深圳)有限公司 基于循环神经网络的情绪识别方法、装置及存储介质
CN112183064B (zh) * 2020-10-22 2022-06-03 福州大学 基于多任务联合学习的文本情绪原因识别系统
CN112183064A (zh) * 2020-10-22 2021-01-05 福州大学 基于多任务联合学习的文本情绪原因识别系统
CN112580366A (zh) * 2020-11-30 2021-03-30 科大讯飞股份有限公司 情绪识别方法以及电子设备、存储装置
CN112580366B (zh) * 2020-11-30 2024-02-13 科大讯飞股份有限公司 情绪识别方法以及电子设备、存储装置
CN112633364A (zh) * 2020-12-21 2021-04-09 上海海事大学 一种基于Transformer-ESIM注意力机制的多模态情绪识别方法
CN112633364B (zh) * 2020-12-21 2024-04-05 上海海事大学 一种基于Transformer-ESIM注意力机制的多模态情绪识别方法
CN113158644A (zh) * 2021-05-13 2021-07-23 山西大学 一种基于多任务学习的修辞格及隐式情绪识别方法
CN113505583A (zh) * 2021-05-27 2021-10-15 山东交通学院 基于语义决策图神经网络的情感原因子句对提取方法
CN113505583B (zh) * 2021-05-27 2023-07-18 山东交通学院 基于语义决策图神经网络的情感原因子句对提取方法
US11922129B2 (en) 2021-06-22 2024-03-05 International Business Machines Corporation Causal knowledge identification and extraction
CN113434682A (zh) * 2021-06-30 2021-09-24 平安科技(深圳)有限公司 文本情感分析方法、电子装置及存储介质
CN114004220A (zh) * 2021-07-27 2022-02-01 刘德喜 一种基于cpc-ann的文本情绪原因识别方法
CN113779245B (zh) * 2021-08-24 2024-09-10 北京理工大学 一种评论情感原因三元组抽取方法
CN113779245A (zh) * 2021-08-24 2021-12-10 北京理工大学 一种评论情感原因三元组抽取方法
CN113836910A (zh) * 2021-09-17 2021-12-24 山东师范大学 一种基于多层次语义的文本识别方法及系统
CN114639139A (zh) * 2022-02-16 2022-06-17 南京邮电大学 一种基于强化学习的情绪化图像描述方法及系统
CN114817566B (zh) * 2022-04-29 2023-03-10 天津大学 基于情绪嵌入的情绪原因对抽取方法
CN114817566A (zh) * 2022-04-29 2022-07-29 天津大学 基于情绪嵌入的情绪原因对抽取方法
CN115841119B (zh) * 2023-02-21 2023-06-16 中国科学技术大学 一种基于图结构的情绪原因提取方法
CN115841119A (zh) * 2023-02-21 2023-03-24 中国科学技术大学 一种基于图结构的情绪原因提取方法
CN116108836B (zh) * 2023-04-10 2023-07-11 之江实验室 文本情感识别方法、装置、计算机设备及可读存储介质
CN116108836A (zh) * 2023-04-10 2023-05-12 之江实验室 文本情感识别方法、装置、计算机设备及可读存储介质
CN116910255A (zh) * 2023-07-19 2023-10-20 重庆位图信息技术有限公司 一种情感原因对提取方法、装置、计算机设备和存储介质
CN117808011A (zh) * 2024-03-01 2024-04-02 青岛网信信息科技有限公司 一种带有模拟情绪的聊天机器人的方法、介质及系统
CN117808011B (zh) * 2024-03-01 2024-06-04 青岛网信信息科技有限公司 一种带有模拟情绪的聊天机器人的方法、介质及系统

Also Published As

Publication number Publication date
CN110162636B (zh) 2020-05-19

Similar Documents

Publication Publication Date Title
CN110162636A (zh) 基于d-lstm的文本情绪原因识别方法
US20220147836A1 (en) Method and device for text-enhanced knowledge graph joint representation learning
Sun et al. Sentiment analysis for Chinese microblog based on deep neural networks with convolutional extension features
CN111382565B (zh) 基于多标签的情绪-原因对抽取方法及系统
CN109558487A (zh) 基于层次性多注意力网络的文档分类方法
CN110427623A (zh) 半结构化文档知识抽取方法、装置、电子设备及存储介质
CN107832400A (zh) 一种基于位置的lstm和cnn联合模型进行关系分类的方法
CN105930368B (zh) 一种情感分类方法及系统
CN112667818A (zh) 融合gcn与多粒度注意力的用户评论情感分析方法及系统
CN110321563A (zh) 基于混合监督模型的文本情感分析方法
CN111651974A (zh) 一种隐式篇章关系分析方法和系统
CN113255320A (zh) 基于句法树和图注意力机制的实体关系抽取方法及装置
CN108509409A (zh) 一种自动生成语义相近句子样本的方法
CN111259153B (zh) 一种完全注意力机制的属性级情感分析方法
Jiang et al. An LSTM-CNN attention approach for aspect-level sentiment classification
CN113360582B (zh) 基于bert模型融合多元实体信息的关系分类方法及系统
CN115759092A (zh) 一种基于albert的网络威胁情报命名实体识别方法
CN113486645A (zh) 一种基于深度学习的文本相似度检测方法
El Desouki et al. Exploring the recent trends of paraphrase detection
CN114330338A (zh) 融合关联信息的程式语识别系统及方法
CN112445887B (zh) 基于检索的机器阅读理解系统的实现方法及装置
CN115713349A (zh) 一种小样本评论数据驱动的产品关键用户需求挖掘方法
CN116522945A (zh) 一种食品安全领域中命名实体的识别模型和方法
Shan Social Network Text Sentiment Analysis Method Based on CNN‐BiGRU in Big Data Environment
CN114626367A (zh) 基于新闻文章内容的情感分析方法、系统、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant