CN107590531A - 一种基于文本生成的wgan方法 - Google Patents
一种基于文本生成的wgan方法 Download PDFInfo
- Publication number
- CN107590531A CN107590531A CN201710690198.4A CN201710690198A CN107590531A CN 107590531 A CN107590531 A CN 107590531A CN 201710690198 A CN201710690198 A CN 201710690198A CN 107590531 A CN107590531 A CN 107590531A
- Authority
- CN
- China
- Prior art keywords
- text
- mrow
- wgan
- maker
- msub
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Image Analysis (AREA)
Abstract
本发明公开了一种基于文本生成的WGAN方法,属于深度学习神经网络领域,该方法包括以下步骤:S1、构造沃瑟斯坦生成式对抗网络WGAN模型;S2、准备文本数据集进行训练;S3、利用编码器,对将文本数据进行编码;S4、构造随机噪声,获取生成器的输出文本;S5、将生成器的输出文本与数据集编码之后的文本输入判别器,进行网络训练。本方法根据生成对抗网络模型的特点,创造性地提出了深度卷积神经网络与WGAN相结合的构造方式,首次公开了生成文本的对抗网络训练方式,突破了以往的生成对抗网络模型都是完成生成图像的功能。
Description
技术领域
本发明涉及深度学习神经网络技术领域,具体涉及一种基于文本生成的WGAN方法。
背景技术
生成式对抗网络(Generative Adversarial Network,简称GAN)是由Goodfellow在2014年提出的框架,它基于“博奕论”的思想,构造生成器(generator)和判别器(discriminator)两种模型,前者通过输入(0,1)的均匀噪声或高斯随机噪声生成图像,后者对输入的图像进行判别,确定是来自数据集的图像还是由生成器产生的图像。判别器每完成一次判断,将结果误差返回给生成器。
然而,在传统的GAN模型中,多数是让生成对抗网络模型完成生成图像的功能,并未任何涉及生成文本的对抗网络训练方式。
发明内容
本发明的目的是为了解决现有技术中的上述缺陷,公开了一种基于文本生成的WGAN方法,该方法创造性地提出了深度卷积神经网络与WGAN相结合的构造方式,实现了生成文本的对抗网络训练方式。
本发明的目的可以通过采取如下技术方案达到:
一种基于文本生成的WGAN方法,所述的方法包括下列步骤:
S1、构造沃瑟斯坦生成式对抗网络WGAN模型,模型包含生成器和判别器;
S2、准备文本数据集进行训练;
S3、利用编码器,对将文本数据进行编码;
S4、构造随机噪声,获取生成器的输出文本;
S5、将生成器的输出文本与数据集编码之后的文本输入判别器,进行网络训练。
进一步地,所述的步骤S2中的文本数据集要求是属于同一类型的内容,例如均描写景物或故事等。
进一步地,所述的步骤S4中构造随机噪声,获取生成器的输出文本,具体过程如下:
S41、将随机噪声输入至生成器中;
S42、生成器对输入的随机噪声进行深度学习,从而生成文本。
进一步地,所述的步骤S5中,将生成器的输出文本与数据集编码之后的文本输入判别器,进行网络训练。具体说明如下:
数据集应该是具有同一类型或相似特征文本的集合;并且,数据集的规模应尽可能大;
在训练的过程中,判别器接收数据集经编码之后的文本和生成器的输出文本,并作出判断。
本发明相对于现有技术具有如下的优点及效果:
本发明根据Wasserstein距离的概念构造了WGAN中判别器损失函数的形式,打破了以往只能通过对抗网络进行图像生成的操作,创造性地提出了深度卷积神经网络与WGAN相结合的构造方式,实现了生成文本的对抗网络训练方式。
附图说明
图1是基于WGAN网络生成文本的整体流程示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例
本实施例公开了一种基于文本生成的WGAN方法,具体包括下列步骤:
步骤S1、构造沃瑟斯坦生成式对抗网络WGAN模型,模型包含生成器和判别器。
其中,生成器的卷积网络层数与判别器的卷积网络层数相同,并且生成器的卷积核是判别器的卷积核的转置。
步骤S2、准备文本数据集进行训练;
文本的数据集要求是属于同一类型的内容,例如均描写景物或故事等。
步骤S3、利用编码器,对将文本数据进行编码。
步骤S4、构造随机噪声,获取生成器的输出文本。具体方法如下:
S41、将随机噪声输入至生成器中;
S42、生成器对输入的随机噪声进行深度学习,从而生成文本。
步骤S5、将生成器的输出文本与数据集编码之后的文本输入判别器,进行网络训练。具体说明如下:
数据集应该是具有同一类型或相似特征文本的集合;并且,数据集的规模应尽可能大;
在训练的过程中,判别器接收数据集经编码之后的文本和生成器的输出文本,并作出判断。
在WGAN中,判别器的损失函数为:
其中,D(x)表示判别器对文本的判别,pr表示数据集文本的分布,pg表示生成文本的分布,λ为超参数,为梯度。
综上所述,本实施例公开了一种基于文本生成的WGAN方法,该模型算法在传统WGAN模型的基础上,打破了在传统方法中,只用对抗网络处理图像的方式。另外,判别器的损失函数也能够指导网络训练的方向。该方法利用准备好的文本数据集,同时构造编码器对文本进行编码,通过生成器与判别器之间的对抗训练,最终达到生成器生成新颖且符合实际内容的文本。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。
Claims (5)
1.一种基于文本生成的WGAN方法,其特征在于,所述的方法包括下列步骤:
S1、构造沃瑟斯坦生成式对抗网络WGAN模型,该模型包含生成器和判别器;
S2、准备文本数据集进行训练;
S3、利用编码器,对文本数据进行编码;
S4、构造随机噪声,获取生成器的输出文本;
S5、将生成器的输出文本与数据集编码之后的文本输入判别器,进行网络训练。
2.根据权利要求1所述的一种基于文本生成的WGAN方法,其特征在于,所述的生成器的卷积网络层数与所述的判别器的卷积网络层数相同,并且生成器的卷积核是判别器的卷积核的转置。
3.根据权利要求1所述的一种基于文本生成的WGAN方法,其特征在于,所述的文本数据集是属于同一类型的内容。
4.根据权利要求1所述的一种基于文本生成的WGAN方法,其特征在于,所述的步骤S4具体如下:
S41、将随机噪声输入至生成器中;
S42、生成器对输入的随机噪声进行深度学习,从而生成文本。
5.根据权利要求1所述的一种基于文本生成的WGAN方法,其特征在于,所述的判别器的损失函数为:
<mrow>
<mi>L</mi>
<mrow>
<mo>(</mo>
<mi>D</mi>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mo>-</mo>
<msub>
<mi>E</mi>
<mrow>
<mi>x</mi>
<mo>~</mo>
<mi>p</mi>
<mi>r</mi>
</mrow>
</msub>
<mo>&lsqb;</mo>
<mi>D</mi>
<mrow>
<mo>(</mo>
<mi>x</mi>
<mo>)</mo>
</mrow>
<mo>&rsqb;</mo>
<mo>+</mo>
<msub>
<mi>E</mi>
<mrow>
<mi>x</mi>
<mo>~</mo>
<mi>p</mi>
<mi>g</mi>
</mrow>
</msub>
<mo>&lsqb;</mo>
<mi>D</mi>
<mrow>
<mo>(</mo>
<mi>x</mi>
<mo>)</mo>
</mrow>
<mo>&rsqb;</mo>
<mo>+</mo>
<msub>
<mi>&lambda;E</mi>
<mrow>
<mi>x</mi>
<mo>~</mo>
<mi>X</mi>
</mrow>
</msub>
<msub>
<mo>&dtri;</mo>
<mi>x</mi>
</msub>
</mrow>
其中,D(x)表示判别器对文本的判别,pr表示数据集文本的分布,pg表示生成文本的分布,λ为超参数,为梯度。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710690198.4A CN107590531A (zh) | 2017-08-14 | 2017-08-14 | 一种基于文本生成的wgan方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710690198.4A CN107590531A (zh) | 2017-08-14 | 2017-08-14 | 一种基于文本生成的wgan方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107590531A true CN107590531A (zh) | 2018-01-16 |
Family
ID=61042746
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710690198.4A Pending CN107590531A (zh) | 2017-08-14 | 2017-08-14 | 一种基于文本生成的wgan方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107590531A (zh) |
Cited By (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108399422A (zh) * | 2018-02-01 | 2018-08-14 | 华南理工大学 | 一种基于wgan模型的图像通道融合方法 |
CN108470196A (zh) * | 2018-02-01 | 2018-08-31 | 华南理工大学 | 一种基于深度卷积对抗网络模型生成手写数字的方法 |
CN108491497A (zh) * | 2018-03-20 | 2018-09-04 | 苏州大学 | 基于生成式对抗网络技术的医疗文本生成方法 |
CN108846124A (zh) * | 2018-06-29 | 2018-11-20 | 北京百度网讯科技有限公司 | 训练方法、装置、计算机设备和可读存储介质 |
CN108897769A (zh) * | 2018-05-29 | 2018-11-27 | 武汉大学 | 基于生成式对抗网络实现文本分类数据集扩展方法 |
CN109120652A (zh) * | 2018-11-09 | 2019-01-01 | 重庆邮电大学 | 基于差分wgan网络安全态势预测 |
CN109271537A (zh) * | 2018-08-10 | 2019-01-25 | 北京大学 | 一种基于蒸馏学习的文本到图像生成方法和系统 |
CN109284684A (zh) * | 2018-08-21 | 2019-01-29 | Oppo广东移动通信有限公司 | 一种信息处理方法、装置以及计算机存储介质 |
CN109492764A (zh) * | 2018-10-24 | 2019-03-19 | 平安科技(深圳)有限公司 | 生成式对抗网络的训练方法、相关设备及介质 |
CN109522411A (zh) * | 2018-11-12 | 2019-03-26 | 南京德磐信息科技有限公司 | 一种基于神经网络的写作辅助方法 |
CN109547320A (zh) * | 2018-09-29 | 2019-03-29 | 阿里巴巴集团控股有限公司 | 社交方法、装置及设备 |
CN109660206A (zh) * | 2018-12-20 | 2019-04-19 | 福州大学 | 一种基于Wasserstein GAN的光伏阵列故障诊断方法 |
CN109698017A (zh) * | 2018-12-12 | 2019-04-30 | 中电健康云科技有限公司 | 医疗病历数据生成方法及装置 |
CN109947931A (zh) * | 2019-03-20 | 2019-06-28 | 华南理工大学 | 基于无监督学习的文本自动摘要方法、系统、设备及介质 |
CN109998500A (zh) * | 2019-04-30 | 2019-07-12 | 陕西师范大学 | 一种基于生成式对抗网络的脉搏信号生成方法及系统 |
CN110619535A (zh) * | 2018-06-19 | 2019-12-27 | 华为技术有限公司 | 一种数据处理方法及其装置 |
CN110619390A (zh) * | 2018-06-20 | 2019-12-27 | 上海寒武纪信息科技有限公司 | 用于执行生成对抗网络的处理装置及应用其进行机器创作的方法 |
WO2020063710A1 (en) * | 2018-09-26 | 2020-04-02 | Huawei Technologies Co., Ltd. | Systems and methods for multilingual text generation |
CN111105349A (zh) * | 2018-10-26 | 2020-05-05 | 珠海格力电器股份有限公司 | 一种图像处理方法 |
CN111966997A (zh) * | 2020-07-20 | 2020-11-20 | 华南理工大学 | 基于梯度惩罚的生成式对抗网络的密码破解方法及系统 |
US11537843B2 (en) | 2017-06-29 | 2022-12-27 | Shanghai Cambricon Information Technology Co., Ltd | Data sharing system and data sharing method therefor |
CN116108157A (zh) * | 2023-04-11 | 2023-05-12 | 阿里巴巴达摩院(杭州)科技有限公司 | 训练文本生成模型的方法、文本生成方法及装置 |
US11656910B2 (en) | 2017-08-21 | 2023-05-23 | Shanghai Cambricon Information Technology Co., Ltd | Data sharing system and data sharing method therefor |
US11687467B2 (en) | 2018-04-28 | 2023-06-27 | Shanghai Cambricon Information Technology Co., Ltd | Data sharing system and data sharing method therefor |
US11726844B2 (en) | 2017-06-26 | 2023-08-15 | Shanghai Cambricon Information Technology Co., Ltd | Data sharing system and data sharing method therefor |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106557566A (zh) * | 2016-11-18 | 2017-04-05 | 杭州费尔斯通科技有限公司 | 一种文本训练方法及装置 |
-
2017
- 2017-08-14 CN CN201710690198.4A patent/CN107590531A/zh active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106557566A (zh) * | 2016-11-18 | 2017-04-05 | 杭州费尔斯通科技有限公司 | 一种文本训练方法及装置 |
Non-Patent Citations (1)
Title |
---|
ISHAAN GULRAJANI ET AL: "Improved Training of Wasserstein GANs", 《MARCHINE LEARNING》 * |
Cited By (35)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11726844B2 (en) | 2017-06-26 | 2023-08-15 | Shanghai Cambricon Information Technology Co., Ltd | Data sharing system and data sharing method therefor |
US11537843B2 (en) | 2017-06-29 | 2022-12-27 | Shanghai Cambricon Information Technology Co., Ltd | Data sharing system and data sharing method therefor |
US11656910B2 (en) | 2017-08-21 | 2023-05-23 | Shanghai Cambricon Information Technology Co., Ltd | Data sharing system and data sharing method therefor |
CN108470196A (zh) * | 2018-02-01 | 2018-08-31 | 华南理工大学 | 一种基于深度卷积对抗网络模型生成手写数字的方法 |
CN108399422A (zh) * | 2018-02-01 | 2018-08-14 | 华南理工大学 | 一种基于wgan模型的图像通道融合方法 |
CN108491497A (zh) * | 2018-03-20 | 2018-09-04 | 苏州大学 | 基于生成式对抗网络技术的医疗文本生成方法 |
WO2019179100A1 (zh) * | 2018-03-20 | 2019-09-26 | 苏州大学张家港工业技术研究院 | 基于生成式对抗网络技术的医疗文本生成方法 |
CN108491497B (zh) * | 2018-03-20 | 2020-06-02 | 苏州大学 | 基于生成式对抗网络技术的医疗文本生成方法 |
US11687467B2 (en) | 2018-04-28 | 2023-06-27 | Shanghai Cambricon Information Technology Co., Ltd | Data sharing system and data sharing method therefor |
CN108897769A (zh) * | 2018-05-29 | 2018-11-27 | 武汉大学 | 基于生成式对抗网络实现文本分类数据集扩展方法 |
CN110619535B (zh) * | 2018-06-19 | 2023-07-14 | 华为技术有限公司 | 一种数据处理方法及其装置 |
CN110619535A (zh) * | 2018-06-19 | 2019-12-27 | 华为技术有限公司 | 一种数据处理方法及其装置 |
CN110619390A (zh) * | 2018-06-20 | 2019-12-27 | 上海寒武纪信息科技有限公司 | 用于执行生成对抗网络的处理装置及应用其进行机器创作的方法 |
CN108846124B (zh) * | 2018-06-29 | 2022-05-17 | 北京百度网讯科技有限公司 | 训练方法、装置、计算机设备和可读存储介质 |
CN108846124A (zh) * | 2018-06-29 | 2018-11-20 | 北京百度网讯科技有限公司 | 训练方法、装置、计算机设备和可读存储介质 |
CN109271537B (zh) * | 2018-08-10 | 2021-11-23 | 北京大学 | 一种基于蒸馏学习的文本到图像生成方法和系统 |
CN109271537A (zh) * | 2018-08-10 | 2019-01-25 | 北京大学 | 一种基于蒸馏学习的文本到图像生成方法和系统 |
CN109284684A (zh) * | 2018-08-21 | 2019-01-29 | Oppo广东移动通信有限公司 | 一种信息处理方法、装置以及计算机存储介质 |
CN109284684B (zh) * | 2018-08-21 | 2021-06-01 | Oppo广东移动通信有限公司 | 一种信息处理方法、装置以及计算机存储介质 |
US11151334B2 (en) | 2018-09-26 | 2021-10-19 | Huawei Technologies Co., Ltd. | Systems and methods for multilingual text generation field |
WO2020063710A1 (en) * | 2018-09-26 | 2020-04-02 | Huawei Technologies Co., Ltd. | Systems and methods for multilingual text generation |
CN109547320A (zh) * | 2018-09-29 | 2019-03-29 | 阿里巴巴集团控股有限公司 | 社交方法、装置及设备 |
CN109492764A (zh) * | 2018-10-24 | 2019-03-19 | 平安科技(深圳)有限公司 | 生成式对抗网络的训练方法、相关设备及介质 |
CN111105349A (zh) * | 2018-10-26 | 2020-05-05 | 珠海格力电器股份有限公司 | 一种图像处理方法 |
CN109120652A (zh) * | 2018-11-09 | 2019-01-01 | 重庆邮电大学 | 基于差分wgan网络安全态势预测 |
CN109522411B (zh) * | 2018-11-12 | 2022-10-28 | 南京德磐信息科技有限公司 | 一种基于神经网络的写作辅助方法 |
CN109522411A (zh) * | 2018-11-12 | 2019-03-26 | 南京德磐信息科技有限公司 | 一种基于神经网络的写作辅助方法 |
CN109698017A (zh) * | 2018-12-12 | 2019-04-30 | 中电健康云科技有限公司 | 医疗病历数据生成方法及装置 |
CN109660206A (zh) * | 2018-12-20 | 2019-04-19 | 福州大学 | 一种基于Wasserstein GAN的光伏阵列故障诊断方法 |
CN109947931A (zh) * | 2019-03-20 | 2019-06-28 | 华南理工大学 | 基于无监督学习的文本自动摘要方法、系统、设备及介质 |
CN109947931B (zh) * | 2019-03-20 | 2021-05-14 | 华南理工大学 | 基于无监督学习的文本自动摘要方法、系统、设备及介质 |
CN109998500A (zh) * | 2019-04-30 | 2019-07-12 | 陕西师范大学 | 一种基于生成式对抗网络的脉搏信号生成方法及系统 |
CN111966997A (zh) * | 2020-07-20 | 2020-11-20 | 华南理工大学 | 基于梯度惩罚的生成式对抗网络的密码破解方法及系统 |
CN116108157A (zh) * | 2023-04-11 | 2023-05-12 | 阿里巴巴达摩院(杭州)科技有限公司 | 训练文本生成模型的方法、文本生成方法及装置 |
CN116108157B (zh) * | 2023-04-11 | 2023-09-12 | 阿里巴巴达摩院(杭州)科技有限公司 | 训练文本生成模型的方法、文本生成方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107590531A (zh) | 一种基于文本生成的wgan方法 | |
CN107563510A (zh) | 一种基于深度卷积神经网络的wgan模型方法 | |
CN107862377A (zh) | 一种基于文本‑图像生成对抗网络模型的分组卷积方法 | |
CN107871142A (zh) | 一种基于深度卷积对抗网络模型的空洞卷积方法 | |
CN107590518A (zh) | 一种多特征学习的对抗网络训练方法 | |
CN107689034A (zh) | 一种神经网络的训练方法、去噪方法及装置 | |
CN107944546A (zh) | 一种基于原始生成对抗网络模型的残差网络方法 | |
CN107590532A (zh) | 一种基于wgan的超参数动态调整方法 | |
CN109543745A (zh) | 基于条件对抗自编码网络的特征学习方法及图像识别方法 | |
CN105137967A (zh) | 一种深度自动编码器与q学习算法相结合的移动机器人路径规划方法 | |
CN107392312A (zh) | 一种基于dcgan性能的动态调整算法 | |
CN105160678A (zh) | 基于卷积神经网络的无参考立体图像质量评估方法 | |
CN107080940A (zh) | 基于深度相机Kinect的体感交互转换方法及装置 | |
CN111856925B (zh) | 基于状态轨迹的对抗式模仿学习方法及装置 | |
CN110009576A (zh) | 一种壁画图像修复模型建立及修复方法 | |
CN107943750A (zh) | 一种基于wgan模型的分解卷积方法 | |
CN107734333A (zh) | 一种利用生成网络提高视频错误隐藏效果的方法 | |
CN109635927A (zh) | 一种卷积神经网络训练方法及装置 | |
CN107578062A (zh) | 一种基于属性概率向量引导注意模式的图片描述方法 | |
WO2014013227A3 (en) | Assessing performance of a system | |
CN107784360A (zh) | 步进式卷积神经网络剪枝压缩方法 | |
CN109731291A (zh) | 一种康复游戏的动态调整方法及系统 | |
CN103729871A (zh) | 云动漫制作方法 | |
CN109448039A (zh) | 一种基于深度卷积神经网络的单目视觉深度估计方法 | |
CN107943751A (zh) | 一种基于深度卷积对抗网络模型的独立通道卷积方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180116 |
|
RJ01 | Rejection of invention patent application after publication |