CN111859978B - 一种基于深度学习的情感文本生成方法 - Google Patents

一种基于深度学习的情感文本生成方法 Download PDF

Info

Publication number
CN111859978B
CN111859978B CN202010528337.5A CN202010528337A CN111859978B CN 111859978 B CN111859978 B CN 111859978B CN 202010528337 A CN202010528337 A CN 202010528337A CN 111859978 B CN111859978 B CN 111859978B
Authority
CN
China
Prior art keywords
emotion
text
vector
feature
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010528337.5A
Other languages
English (en)
Other versions
CN111859978A (zh
Inventor
张迎周
刘磊
陈宏建
傅建清
肖雁冰
黄秋月
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Posts and Telecommunications
Original Assignee
Nanjing University of Posts and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Posts and Telecommunications filed Critical Nanjing University of Posts and Telecommunications
Priority to CN202010528337.5A priority Critical patent/CN111859978B/zh
Publication of CN111859978A publication Critical patent/CN111859978A/zh
Application granted granted Critical
Publication of CN111859978B publication Critical patent/CN111859978B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开了一种基于深度学习的情感文本生成方法,将变分自编码器和辅助分类器生成对抗网络有效地结合在一起,通过变分自编码器的数据特征挖掘以及潜在空间表示的优异性能进行情感文本生成任务,并在其中添加了注意力机制,而辅助分类器生成对抗网络的判别器则设计了一种利用词频‑逆文档频率、情感注意力融合特征向量加权计算的多特征卷积神经网络与深度双向门控循环单元组成的模型进行数据判别,并在其基础上增加了集成学习模块来提供生成器额外的情感分类损失惩罚。本发明生成的情感文本一定程度上接近真实的情感文本,不仅可用于文本分析的数据增强工作,也可使人机对话生成更加感性化的内容,提高结果精确率的同时也可提升执行效率。

Description

一种基于深度学习的情感文本生成方法
技术领域
本发明属于自然语言处理领域中,具体涉及一种基于深度学习的情感文本生成方法。
背景技术
伴随着互联网不断前进的脚步,信息化社会阶段已经逐渐从满足人们的基本要求发展至利用智能化技术提供给人们更加便利化生活的阶段。现如今,无论是电商平台中智能化的导购小助手,还是金融领域中人性化的服务机器人,人机对话模式越来越受到用户群体的关注。通过产生更加感性化的对话内容来获得用户认可甚至信任是情感文本生成技术的应用方向之一。
同时,情感文本生成技术的前提是学习文本数据的真实结构与情感特征,以往文本数据的情感特征仅仅是基于情感词典的方式进行无监督式学习,后来发展为以统计学为基础的机器学习。但情感文本数据常常由于人工标注的经验性误差导致其训练数据集出现不平衡情况,因此情感文本生成技术通过生成指定情感类别的文本数据成为有效解决情感数据不平衡问题的数据增强技术之一。
发明内容
发明目的:本发明旨在提出一种基于深度学习的情感文本生成方法,利用深度学习的相关模型对真实情感文本相关句法结构和情感特征信息进行训练学习后再重建其数据分布规律,进而生成句法结构和情感特征均高度相似的重构情感文本,不但可以作为数据增强技术的有力支撑,也可以有效地提升针对文本数据内部的学习建模能力。
发明内容:本发明提供一种基于深度学习的情感文本生成方法,具体包括以下步骤:
(1)重构情感文本的词向量特征表示和字向量特征表示:将真实情感文本的词向量表示和字向量表示分别输入至编码器部分的双向长短时记忆网络中进行计算,计算出近似标准正态分布的后验分布潜在变量,将潜在变量、前一时刻的隐藏层状态和输出、情感标签向量以及当前时刻结合注意力机制得到的注意力分配权重共同输入至解码器部分的双向长短时记忆网络中进行计算,通过词向量重构表示和字向量重构表示得到真实情感文本的重构情感文本特征表示;
(2)真实情感文本和重构情感文本的真伪判定以及二者的情感判定:首先将真实情感文本和重构情感文本的词特征向量、字特征向量分别输入至深度双向门控循环单元中进行语义特征提取;再将特征向量分别与文本的词语级TF-IDF、情感注意力融合特征向量以及字符级TF-IDF、情感注意力融合特征向量进行权重计算得到的加权特征向量同时输入至多特征卷积神经网络中进行文本真伪和情感类别判定;同时将词向量表示输入至基于Stacking算法的集成情感分类模型中进行情感类别判定,最终分别得到真实情感文本和重构情感文本的真伪性、情感倾向性判定结果;
(3)对重构部分和判定部分的进行训练,获取情感文本生成模型;
(4)生成多样化的情感文本:训练完成后,将从近似后验分布潜在变量中进行循环随机采样得到的样本数据与指定的情感标签向量进行结合后输入至解码器中生成对应情感标签的情感文本。
进一步地,所述步骤(1)包括以下步骤:
(11)将真实情感文本分别通过中文领域基于转换器模型的双向编码表示和词向量转换两种预训练模型计算得到的文本词特征向量和字特征向量表示输入至编码器部分的双向长短时记忆网络中进行计算,得到每个时刻下的隐藏层状态输出以及最终的语义编码向量输出;
(12)根据编码器输出的隐藏层状态H对其每个时刻取最大值处理得到Hx后,可利用神经网络计算出其均值和对数方差,并采用重参数化的技巧对其进行转换后,将转换后的潜在变量和情感标签向量输入至解码器部分的双向长短时记忆网络结构中,并结合注意力机制进行序列的输出,输出第k个时刻隐藏层状态sk为:sk=BiLSTM(Z,sk-1,yk-1,ck,C),其中z表示潜在变量,sk-1表示前一时刻的双向隐藏层状态,yk-1表示前一时刻的输出,C表示当前目标生成所需要结合的情感标签向量,ck表示当前时刻由编码器的隐藏状态结合注意力机制生成的语义编码向量;
(13)将隐藏层状态sk通过一层神经网络即可分别获得情感文本重构的词向量输出和字向量输出。
进一步地,所述步骤(2)包括以下步骤:
(21)将真实情感文本和重构情感文本的词向量表示输入至基于Stacking算法的集成情感分类模型用于文本的情感判定,其中基分类器模型为朴素贝叶斯模型、决策树模型以及深度双向门控循环单元与多特征卷积神经网络的结合模型,元分类器模型则为支持向量机模型;深度双向门控循环单元与多特征卷积神经网络的结合模型同时接受真实和重构的词向量表示和字向量表示,分别输入至深度双向门控循环单元网络结构中进行计算,得到每个时刻下的隐藏层状态输出以及最终的语义编码向量输出;设文本数据输入X={x1,x2,...,xn},xk表示文本中通过词嵌入处理后的第k个词向量或字向量,则首层正向的第k个隐藏层状态即由门控循环单元计算得到:
Figure BDA0002534438090000031
同理反向的第k个隐藏层状态即:/>
Figure BDA0002534438090000032
随后第l层反向的第k个隐藏层状态即:/>
Figure BDA0002534438090000033
Figure BDA0002534438090000034
其正向的第k个隐藏层状态即:/>
Figure BDA0002534438090000035
最后连结两个方向的隐藏状态/>
Figure BDA0002534438090000036
和/>
Figure BDA0002534438090000037
得到最终隐藏状态/>
Figure BDA0002534438090000038
即:/>
Figure BDA0002534438090000039
Figure BDA00025344380900000310
并将其输入至输出层;对双向隐藏层状态利用注意力机制分别计算其注意力权重参数,即:/>
Figure BDA00025344380900000311
Figure BDA00025344380900000312
其中W和V分别表示权重参数,b表示偏置参数,ek表示语义特征向量,ej表示情感标签向量,αk表示语义特征对文本情感类别的权重;
(22)将各时刻的隐藏层状态输出利用其计算完成对应级别的TF-IDF特征向量和情感注意力的融合特征向量进行加权计算,得到加权特征向量,输入至多特征卷积神经网络中进行文本的真伪判定和情感判定。
进一步地,所述步骤(3)包括以下步骤:
(31)结合近似后验分布、解码器生成的损失函数并求其对于编码器的梯度来进行超参数更新训练;
(32)结合近似后验分布、解码器生成、解码器分类的损失函数并求其对于解码器的梯度来进行超参数更新训练;
(33)结合判别器生成、判别器分类的损失函数并求其对于判别器的梯度来进行超参数更新训练。
有益效果:与现有技术相比,本发明的有益效果:
1、传统的文本生成模型大多依靠于语言模型,无法生成多样化的文本,而变分自编码器与辅助分类器生成对抗网络在图像处理领域中能够生成多样化的图像数据,将二者结合并改进了相应的训练方法使其应用于文本生成领域,进而生成多样化的情感文本数据;
2、在文本语义特征提取方面,将双向门控循环单元设计为交替式方向的深度结构,让模型在学习过程中不仅能够避免时间跨度过长导致信息参数更新不合理的问题,还能够将文本每一个方向的语义信息尽可能综合地保留,充分考虑了输入词的上下文信息;同时将原始卷积神经网络设计为TF-IDF与情感注意力融合特征向量加权的多特征卷积神经网络结构,使深度双向门控循环单元提取后的语义特征在加权后融合其文本词向量表示和字向量表示,提升了对文本语义信息处理的效果;
3、辅助分类器生成对抗网络仅通过判别器同时对文本进行真伪和类别的判定,但文本类别存在特征不明显的情况,导致生成过程中模型会将注意力更加倾向于真伪性方面,因此将判别器类别判定部分通设计为集成学习来进行额外的特征学习,进而反馈给生成器更多关于文本情感特征构造的信息。
附图说明
图1为本发明的流程图。
具体实施方式
为了使本发明的目的、技术方案和有益效果更加清晰明了,下面结合附图对本发明进行更进一步的描述:
本发明提出一种基于深度学习的情感文本生成方法,将变分自编码器与辅助分类器生成对抗网络进行融合后应用于文本生成领域。通过变分自编码器的数据特征挖掘以及潜在空间表示的优异性能进行情感文本生成任务,针对其编码器和解码器的结构单元均使用了双向长短时记忆网络,并在其中添加了注意力机制,而辅助分类器生成对抗网络的判别器则设计了一种利用词频-逆文档频率、情感注意力融合特征向量加权计算的多特征卷积神经网络与深度双向门控循环单元组成的模型进行数据判别,并在其基础上增加了集成学习模块来提供生成器额外的情感分类损失惩罚,提高了生成文本的合理性。其具体实现步骤如下:
步骤1:重构情感文本的词向量特征表示和字向量特征表示。
首先将真实情感文本的词向量表示和字向量表示分别输入至编码器部分的双向长短时记忆网络中进行计算,计算出近似标准正态分布的后验分布潜在变量,将潜在变量、前一时刻的隐藏层状态和输出、情感标签向量以及当前时刻结合注意力机制得到的注意力分配权重共同输入至解码器部分的双向长短时记忆网络中进行计算,通过词向量重构表示和字向量重构表示得到真实情感文本的重构情感文本特征表示。
将真实情感文本分别通过中文领域基于转换器模型的双向编码表示(Bidirectional Encoder Representations from Transformers,BERT)和词向量转换(Word to Vector,Word2Vec)两种预训练模型计算得到的文本词特征向量和字特征向量表示输入至编码器部分的双向长短时记忆网络中进行计算,得到每个时刻下的隐藏层状态输出以及最终的语义编码向量输出。将得到的隐藏层状态通过注意力机制分别赋予不同的权重值。根据编码器输出的隐藏层状态H对其每个时刻取最大值处理得到Hx后,可利用神经网络计算出其均值和对数方差,并采用重参数化的技巧对其进行转换后,将潜在变量和情感标签向量输入至解码器部分的双向长短时记忆网络(Bidirectional Long Short-TermMemory,BiLSTM)结构中,并结合注意力机制进行序列的输出,输出第k个时刻隐藏层状态sk为:sk=BiLSTM(Z,sk-1,yk-1,ck,C),其中Z表示潜在变量,sk-1表示前一时刻的双向隐藏层状态,yk-1表示前一时刻的输出,C表示当前目标生成所需要结合的情感标签向量,ck表示当前时刻由编码器的隐藏状态结合注意力机制生成的语义编码向量,最终将隐藏层状态sk通过一层神经网络即可分别获得重构情感文本的词向量输出和字向量输出。
步骤2:真实情感文本和重构情感文本的真伪判定以及二者的情感判定:。
首先将真实情感文本和重构情感文本的词特征向量、字特征向量分别输入至深度双向门控循环单元中进行语义特征提取;再将特征向量分别与文本的词语级TF-IDF(TermFrequency-Inverse Document Frequency,词频-逆文档频率)、字符级TF-IDF以及情感注意力融合特征向量进行权重计算得到的加权特征向量同时输入至多特征卷积神经网络中进行文本真伪和情感类别判定;同时将词向量表示输入至基于Stacking算法的集成情感分类模型中进行情感类别判定,最终分别得到真实情感文本和重构情感文本的真伪性、情感倾向性判定结果。
将真实情感文本和重构情感文本的词向量表示输入至基于Stacking算法的集成情感分类模型用于文本的情感判定,其中基分类器模型为朴素贝叶斯模型、决策树模型以及深度双向门控循环单元与多特征卷积神经网络的结合模型,元分类器模型则为支持向量机模型;深度双向门控循环单元与多特征卷积神经网络的结合模型同时接受真实和重构的词向量表示和字向量表示,分别输入至深度双向门控循环单元网络结构中进行计算,得到每个时刻下的隐藏层状态输出以及最终的语义编码向量输出。
设文本数据输入X={x1,x2,...,xn},xk表示文本中通过词嵌入处理后的第k个词向量或字向量,则首层正向的第k个隐藏层状态即由门控循环单元(Gated Recurrent Unit,GRU)计算得到:
Figure BDA0002534438090000061
同理反向的第k个隐藏层状态即:/>
Figure BDA0002534438090000062
随后第l层反向的第k个隐藏层状态即:/>
Figure BDA0002534438090000063
其正向的第k个隐藏层状态即:/>
Figure BDA0002534438090000064
最后连结两个方向的隐藏状态/>
Figure BDA0002534438090000065
和/>
Figure BDA0002534438090000066
得到最终隐藏状态
Figure BDA0002534438090000067
即:/>
Figure BDA0002534438090000068
并将其输入至输出层;对双向隐藏层状态利用注意力机制分别计算其注意力权重参数,即:/>
Figure BDA0002534438090000069
Figure BDA00025344380900000610
其中W和V分别表示权重参数,b表示偏置参数,ek表示语义特征向量,ej表示情感标签向量,αk表示语义特征对文本情感类别的权重。
将各时刻的隐藏层状态输出利用其计算完成对应级别的TF-IDF特征向量和情感注意力融合特征向量分别进行加权计算,得到加权特征向量,输入至多特征卷积神经网络中进行文本的真伪判定和情感判定。
假设有文本D,其特征向量为{x1,x2,...,xn},其中xi表示经过处理后的词向量或字向量,而使用h×d格式的卷积核对其进行滑动划分后,文本D被划分成:Di:i+h-1={xi,xi+1,...,xi+h-1},对其进行卷积计算操作即:ci=f(WDi:i+h-1+b),其中,ci表示经过卷积计算后的第i个特征,W表示权重参数,b表示偏置参数,f表示非线性映射函数,当整体文本特征向量完成卷积计算后,会得到n-h+1个特征值,则特征图谱表示为:C=[c1,c2,...,cn-h+1]。对特征图谱进行数据压缩的操作,采取最大值池化的方式进行压缩计算,其计算公式为:
Figure BDA0002534438090000071
其中k表示具体要选取最大值的数量,l表示文本数据的长度,h表示卷积核滑动窗口的高度。因此最终池化后的特征向量为:/>
Figure BDA0002534438090000072
处理完所有的特征图谱后,将特征向量进行合并融合操作。将此结果输入至两个全连接网络进行传播计算,并使用Softmax分类方法进行类别判定,训练过程即:/>
Figure BDA0002534438090000073
Figure BDA0002534438090000074
其中o(x)表示全连接层计算的输出,W表示权重参数,b表示偏置参数,k表示类别数量,/>
Figure BDA0002534438090000075
则表示特征向量,p(i)表示类别为i时对应的概率,因此分类概率最大的类别即为文本数据最终的真伪性和情感判定结果。
步骤3:重构部分和判定部分的模型训练过程。
首先结合近似后验分布、解码器生成的损失函数并求其对于编码器的梯度来进行超参数更新训练,然后结合近似后验分布、解码器生成、解码器分类的损失函数并求其对于解码器的梯度来进行参数更新训练,最后结合判别器生成、判别器分类的损失函数并求其对于判别器的梯度来进行参数更新训练。其中近似后验分布的损失函数为变分自编码器中已有的损失函数,解码器生成和解码器分类的损失函数为辅助分类器生成对抗网络中已有的损失函数,并利用序列生成对抗网络中的策略梯度方法进行优化,判别器生成和判别器分类的损失函数对应于辅助分类器生成对抗网络中已有的损失函数,并且判别器分类损失函数由深度双向门控循环单元和多特征卷积神经网络结合模型中的交叉熵损失函数和基于Stacking算法的集成情感分类模型中已有的损失函数共同组成。
步骤4:生成多样化的情感文本:训练完成后,将从近似后验分布潜在变量中进行循环随机采样得到的样本数据与指定的情感标签向量进行结合后输入至解码器中生成对应情感标签的情感文本。

Claims (4)

1.一种基于深度学习的情感文本生成方法,其特征在于,包括以下步骤:
(1)重构情感文本的词向量特征表示和字向量特征表示:将真实情感文本的词向量表示和字向量表示分别输入至编码器部分的双向长短时记忆网络中进行计算,计算出近似标准正态分布的后验分布潜在变量,将潜在变量、前一时刻的隐藏层状态和输出、情感标签向量以及当前时刻结合注意力机制得到的注意力分配权重共同输入至解码器部分的双向长短时记忆网络中进行计算,通过词向量重构表示和字向量重构表示得到真实情感文本的重构情感文本特征表示;
(2)真实情感文本和重构情感文本的真伪判定以及二者的情感判定:首先将真实情感文本和重构情感文本的词特征向量、字特征向量分别输入至深度双向门控循环单元中进行语义特征提取;再将特征向量分别与文本的词语级TF-IDF、情感注意力融合特征向量以及字符级TF-IDF、情感注意力融合特征向量进行权重计算得到的加权特征向量同时输入至多特征卷积神经网络中进行文本真伪和情感类别判定;同时将词向量表示输入至基于Stacking算法的集成情感分类模型中进行情感类别判定,最终分别得到真实情感文本和重构情感文本的真伪性、情感倾向性判定结果;
(3)对重构部分和判定部分的进行训练,获取情感文本生成模型;
(4)生成多样化的情感文本:训练完成后,将从近似后验分布潜在变量中进行循环随机采样得到的样本数据与指定的情感标签向量进行结合后输入至解码器中生成对应情感标签的情感文本。
2.根据权利要求1所述的一种基于深度学习的情感文本生成方法,其特征在于,所述步骤(1)包括以下步骤:
(11)将真实情感文本分别通过中文领域基于转换器模型的双向编码表示和词向量转换两种预训练模型计算得到的文本词特征向量和字特征向量表示输入至编码器部分的双向长短时记忆网络中进行计算,得到每个时刻下的隐藏层状态输出以及最终的语义编码向量输出;
(12)根据编码器输出的隐藏层状态H对其每个时刻取最大值处理得到Hx后,可利用神经网络计算出其均值和对数方差,并采用重参数化的技巧对其进行转换后,将转换后的潜在变量和情感标签向量输入至解码器部分的双向长短时记忆网络结构中,并结合注意力机制进行序列的输出,输出第k个时刻隐藏层状态sk为:sk=BiLSTM(Z,sk-1,yk-1,ck,C),其中Z表示潜在变量,sk-1表示前一时刻的双向隐藏层状态,yk-1表示前一时刻的输出,C表示当前目标生成所需要结合的情感标签向量,ck表示当前时刻由编码器的隐藏状态结合注意力机制生成的语义编码向量;
(13)将隐藏层状态sk通过一层神经网络即可分别获得情感文本重构的词向量输出和字向量输出。
3.根据权利要求1所述的一种基于深度学习的情感文本生成方法,其特征在于,所述步骤(2)包括以下步骤:
(21)将真实情感文本和重构情感文本的词向量表示输入至基于Stacking算法的集成情感分类模型用于文本的情感判定,其中基分类器模型为朴素贝叶斯模型、决策树模型以及深度双向门控循环单元与多特征卷积神经网络的结合模型,元分类器模型则为支持向量机模型;深度双向门控循环单元与多特征卷积神经网络的结合模型同时接受真实和重构的词向量表示和字向量表示,分别输入至深度双向门控循环单元网络结构中进行计算,得到每个时刻下的隐藏层状态输出以及最终的语义编码向量输出;设文本数据输入X={x1,x2,...,xn},xk表示文本中通过词嵌入处理后的第k个词向量或字向量,则首层正向的第k个隐藏层状态即由门控循环单元计算得到:
Figure FDA0002534438080000021
同理反向的第k个隐藏层状态即:/>
Figure FDA0002534438080000022
随后第l层反向的第k个隐藏层状态即:/>
Figure FDA0002534438080000023
Figure FDA0002534438080000024
其正向的第k个隐藏层状态即:
Figure FDA0002534438080000025
最后连结两个方向的隐藏状态/>
Figure FDA0002534438080000026
和/>
Figure FDA0002534438080000027
得到最终隐藏状态/>
Figure FDA0002534438080000028
即:
Figure FDA0002534438080000029
Figure FDA00025344380800000210
并将其输入至输出层;对双向隐藏层状态利用注意力机制分别计算其注意力权重参数,即:/>
Figure FDA00025344380800000211
Figure FDA00025344380800000212
其中W和V分别表示权重参数,b表示偏置参数,ek表示语义特征向量,ej表示情感标签向量,αk表示语义特征对文本情感类别的权重;
(22)将各时刻的隐藏层状态输出利用其计算完成对应级别的TF-IDF特征向量和情感注意力的融合特征向量进行加权计算,得到加权特征向量,输入至多特征卷积神经网络中进行文本的真伪判定和情感判定。
4.根据权利要求1所述的一种基于深度学习的情感文本生成方法,其特征在于,所述步骤(3)包括以下步骤:
(31)结合近似后验分布、解码器生成的损失函数并求其对于编码器的梯度来进行超参数更新训练;
(32)结合近似后验分布、解码器生成、解码器分类的损失函数并求其对于解码器的梯度来进行超参数更新训练;
(33)结合判别器生成、判别器分类的损失函数并求其对于判别器的梯度来进行超参数更新训练。
CN202010528337.5A 2020-06-11 2020-06-11 一种基于深度学习的情感文本生成方法 Active CN111859978B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010528337.5A CN111859978B (zh) 2020-06-11 2020-06-11 一种基于深度学习的情感文本生成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010528337.5A CN111859978B (zh) 2020-06-11 2020-06-11 一种基于深度学习的情感文本生成方法

Publications (2)

Publication Number Publication Date
CN111859978A CN111859978A (zh) 2020-10-30
CN111859978B true CN111859978B (zh) 2023-06-20

Family

ID=72987239

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010528337.5A Active CN111859978B (zh) 2020-06-11 2020-06-11 一种基于深度学习的情感文本生成方法

Country Status (1)

Country Link
CN (1) CN111859978B (zh)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112232436B (zh) * 2020-11-04 2022-08-05 杭州智策略科技有限公司 一种融合集成决策树与层次注意力机制的可解释网络攻击检测方法
CN112434143B (zh) * 2020-11-20 2022-12-09 西安交通大学 基于gru单元隐藏状态约束的对话方法、存储介质及系统
CN112541340B (zh) * 2020-12-18 2021-11-23 昆明理工大学 基于变分双主题表征的弱监督涉案微博评价对象识别方法
CN112784047B (zh) * 2021-01-25 2023-02-28 重庆邮电大学 一种基于自注意力机制的可控可解释司法文本分类方法
CN112560503B (zh) * 2021-02-19 2021-07-02 中国科学院自动化研究所 融合深度特征和时序模型的语义情感分析方法
CN113032558B (zh) * 2021-03-11 2023-08-29 昆明理工大学 融合维基知识的变分半监督百度百科分类方法
CN113268599B (zh) * 2021-05-31 2024-03-19 平安国际智慧城市科技股份有限公司 文件分类模型的训练方法、装置、计算机设备及存储介质
CN113434664A (zh) * 2021-06-30 2021-09-24 平安科技(深圳)有限公司 文本摘要生成方法、装置、介质及电子设备
CN113569928B (zh) * 2021-07-13 2024-01-30 湖南工业大学 一种列车运行状态检测数据缺失处理模型及重建的方法
CN113723456B (zh) * 2021-07-28 2023-10-17 南京邮电大学 一种基于无监督机器学习的天文图像自动化分类方法及系统
CN113705678B (zh) * 2021-08-28 2023-04-28 重庆理工大学 利用词屏蔽数据增强与对抗学习的特定目标情感分析方法
CN114117453B (zh) * 2021-12-08 2022-08-12 深圳市辰星瑞腾科技有限公司 基于数据深度关联的计算机防御系统以及防御方法
CN114328927A (zh) * 2021-12-30 2022-04-12 深圳市检验检疫科学研究院 基于标签感知的门控循环采集方法
CN115712726B (zh) * 2022-11-08 2023-09-12 华南师范大学 基于双词嵌入的情感分析方法、装置以及设备
CN117668562B (zh) * 2024-01-31 2024-04-19 腾讯科技(深圳)有限公司 文本分类模型的训练和使用方法、装置、设备和介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108363753A (zh) * 2018-01-30 2018-08-03 南京邮电大学 评论文本情感分类模型训练与情感分类方法、装置及设备
CN109472031A (zh) * 2018-11-09 2019-03-15 电子科技大学 一种基于双记忆注意力的方面级别情感分类模型及方法
CN110334354A (zh) * 2019-07-11 2019-10-15 清华大学深圳研究生院 一种中文关系抽取方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108363753A (zh) * 2018-01-30 2018-08-03 南京邮电大学 评论文本情感分类模型训练与情感分类方法、装置及设备
CN109472031A (zh) * 2018-11-09 2019-03-15 电子科技大学 一种基于双记忆注意力的方面级别情感分类模型及方法
CN110334354A (zh) * 2019-07-11 2019-10-15 清华大学深圳研究生院 一种中文关系抽取方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于并行双向门控循环单元与自注意力机制的中文文本情感分类;崔昕阳;龙华;熊新;邵玉斌;杜庆治;;北京化工大学学报(自然科学版)(第02期);全文 *

Also Published As

Publication number Publication date
CN111859978A (zh) 2020-10-30

Similar Documents

Publication Publication Date Title
CN111859978B (zh) 一种基于深度学习的情感文本生成方法
US20220147836A1 (en) Method and device for text-enhanced knowledge graph joint representation learning
CN110609891B (zh) 一种基于上下文感知图神经网络的视觉对话生成方法
CN111382565B (zh) 基于多标签的情绪-原因对抽取方法及系统
CN110502753A (zh) 一种基于语义增强的深度学习情感分析模型及其分析方法
CN111506732B (zh) 一种文本多层次标签分类方法
CN112800774B (zh) 基于注意力机制的实体关系抽取方法、装置、介质和设备
CN113657115B (zh) 一种基于讽刺识别和细粒度特征融合的多模态蒙古文情感分析方法
CN113626589A (zh) 一种基于混合注意力机制的多标签文本分类方法
CN111966827A (zh) 基于异构二部图的对话情感分析方法
CN113360582B (zh) 基于bert模型融合多元实体信息的关系分类方法及系统
CN114168754A (zh) 一种基于句法依赖和融合信息的关系抽取方法
CN115630156A (zh) 一种融合Prompt和SRU的蒙古语情感分析方法与系统
CN115827954A (zh) 动态加权的跨模态融合网络检索方法、系统、电子设备
CN113837229B (zh) 一种知识驱动型的文本到图像生成方法
CN117349311A (zh) 一种基于改进RetNet的数据库自然语言查询方法
CN115828142A (zh) 一种基于双路编码器的可解释性文本分类系统
CN116167379A (zh) 一种基于bert和实体位置信息的实体关系抽取方法
CN115953779A (zh) 基于文本对抗生成网络的无监督图像描述生成方法
CN115169429A (zh) 一种轻量化方面级文本情感分析方法
CN114548117A (zh) 一种基于bert语义增强的因果关系抽取方法
CN114357166A (zh) 一种基于深度学习的文本分类方法
CN114118058A (zh) 基于句法特征和注意力机制相融合的情感分析系统及方法
CN113255360A (zh) 基于层次化自注意力网络的文档评级方法和装置
Jiang et al. Automatic Question Answering Method Based on IMGRU-Seq2seq

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant