CN112818669A

CN112818669A - 一种基于生成对抗网络的语法错误纠正方法

Info

Publication number: CN112818669A
Application number: CN202110104829.6A
Authority: CN
Inventors: 王小华; 令狐彬; 焦璐璐; 张娜; 宋晓晨
Original assignee: Shanxi Sanyouhe Smart Information Technology Co Ltd
Current assignee: Shanxi Sanyouhe Smart Information Technology Co Ltd
Priority date: 2021-01-26
Filing date: 2021-01-26
Publication date: 2021-05-18

Abstract

本发明属于信息处理领域，具体涉及一种基于生成对抗网络的语法错误纠正方法，使用生成对抗网络进行语法错误纠正，所述生成对抗网络包括生成器G_θ与鉴别器D_φ两部分，生成器G_θ将语法错误的句子翻译成语法正确的重写句子，鉴别器D_φ评估生成器G_θ对错误输入的句子进行词汇相似、语义保留和语法进行正确重写的概率。本发明提出了一种基于句子对分类的鉴别器，通过学习直接优化目标，而不是构建或依赖n‑gram模型，可以更好地区分语法文本和非语法文本。并且本发明所提出的模型在测试中可以获得较传统方法更好的结果，并且不依赖于除训练数据之外的任何数据。本发明用于语法错误的纠正。

Description

一种基于生成对抗网络的语法错误纠正方法

技术领域

本发明属于信息处理领域，具体涉及一种基于生成对抗网络的语法错误纠正方法。

背景技术

近些年来，随着人工智能的发展，语法错误纠正(GEC)已经发展成为一个流行的自然语言处理任务，它作为单语机器翻译(MT)问题越来越受欢迎，系统学会将给定的错误文本“翻译”到正确的语法文本。基于此，有一些神经机器翻译(NMT)系统被开发出来，并取得了较好的结果。

尽管基于NMT的模型在GEC取得了成功，但一个主要的问题仍然在于评估指标的定义。理想情况下，在给定语法错误的输入句子时，该评估指标应该能够量化词汇重叠、语义相似性和生成句子的语法性。基于NMT的GEC模型试图最大化n-gram的评价指标，使得基于NM的模型生成尽可能高精度的n-gram语句，但是这不能保证GEC模型生成高质量的纠错文本。

发明内容

针对上述GEC模型不能生成高质量的纠错文本的技术问题，本发明提供了一种使用方便、准确率高、效率高的基于生成对抗网络的语法错误纠正方法。

为了解决上述技术问题，本发明采用的技术方案为：

一种基于生成对抗网络的语法错误纠正方法，使用生成对抗网络进行语法错误纠正，所述生成对抗网络包括生成器G_θ与鉴别器D_φ两部分，生成器G_θ将语法错误的句子翻译成语法正确的重写句子，鉴别器D_φ评估生成器G_θ对错误输入的句子进行词汇相似、语义保留和语法进行正确重写的概率。

所述生成对抗网络的生成方法为：包括下列步骤：

S1、使用随机权重θ、φ初始化生成器G_θ、鉴别器D_φ；

S2、采用最大似然估计方法MLE，利用真实数据D＝(X,Y)对生成器G_θ进行预训练，其中，真实数据D＝(X,Y)为正确的纠正例，X为原始输入句子，Y为纠正后的句子；

S3、使用生成器G_θ生成负面样本D'＝(X,Y')，并用来训练鉴别器D_φ；

S4、在真实数据D和负面样本D'上预训练鉴别器D_φ，直到达到交叉熵损失BCE的初始精度；

S5、开始对抗训练，直到此生成对抗网络收敛。

所述S1中的生成器G_θ采用添加注意机制的循环神经网络RNN，所述鉴别器D_φ采用卷积神经网络CNN。

所述S5中生对抗训练的方法为：包括下列步骤：

S5.1、输入(X,Y)～P_data,Y'～G_θ(·|X),ρ～[0,1],λ～[0.2,0.8]，其中，ρ和λ是用来控制交替训练的参数，所述交替训练采用最大似然估计与梯度下降策略；

S5.2、如果ρ≤λ：使用鉴别器D_φ计算(X,Y')的奖励R，并利用奖励R通过梯度策略更新生成器G_θ

如果ρ>λ：使用最大似然估计方法更新生成器G_θ；

S5.3、根据下面的目标函数和梯度下降方法在(X,Y)和(X,Y')上训练鉴别器D_φ：

其中，

为鉴别器D_φ的目标函数，所述目标函数采用标准二元交叉熵损失，P_data为训练数据的分布，

为生成器G_θ输出的分布；

S5.4、重复步骤S5.1-S5.3，直到此生成对抗网络收敛。

所述生成器G_θ与鉴别器D_φ更新参数的方法为：

其中：θ为生成器G_θ的参数，α_g为生成器的学习率；

其中：φ为鉴别器D_φ的参数，α_d为鉴别器的学习率。

本发明与现有技术相比，具有的有益效果是：

本发明提出了一种基于句子对分类的鉴别器，通过学习直接优化目标，而不是构建或依赖n-gram模型，可以更好地区分语法文本和非语法文本。并且本发明所提出的模型在测试中可以获得较传统方法更好的结果，并且不依赖于除训练数据之外的任何数据。

附图说明

图1为本发明的生成对抗网络原理图；

图2为本发明生成对抗网络训练流程框图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

一种基于生成对抗网络的语法错误纠正方法，使用生成对抗网络进行语法错误纠正，生成对抗网络包括生成器G_θ与鉴别器D_φ两部分，生成器G_θ将语法错误的句子翻译成语法正确的重写句子，鉴别器D_φ评估生成器G_θ对错误输入的句子进行词汇相似、语义保留和语法进行正确重写的概率。

进一步，如图1所示，生成对抗网络的生成方法为：包括下列步骤：

S1、使用随机权重θ、φ初始化生成器G_θ、鉴别器D_φ；

S5、开始对抗训练，直到此生成对抗网络收敛。

进一步，优选的，S1中的生成器G_θ采用添加注意机制的循环神经网络RNN，鉴别器D_φ采用卷积神经网络CNN。

进一步，如图2所示，S5中生对抗训练的方法为：包括下列步骤：

S5.1、输入(X,Y)～P_data,Y'～G_θ(·|X),ρ～[0,1],λ～[0.2,0.8]，其中，ρ和λ是用来控制交替训练的参数，交替训练采用最大似然估计与梯度下降策略；

如果ρ>λ：使用最大似然估计方法更新生成器G_θ；

其中，

为鉴别器D_φ的目标函数，目标函数采用标准二元交叉熵损失，P_dsata为训练数据的分布，

为生成器G_θ输出的分布；

S5.4、重复步骤S5.1-S5.3，直到此生成对抗网络收敛。

进一步，生成器G_θ与鉴别器D_φ更新参数的方法为：

其中：θ为生成器G_θ的参数，α_g为生成器的学习率；

其中：φ为鉴别器D_φ的参数，α_d为鉴别器的学习率。

上面仅对本发明的较佳实施例作了详细说明，但是本发明并不限于上述实施例，在本领域普通技术人员所具备的知识范围内，还可以在不脱离本发明宗旨的前提下作出各种变化，各种变化均应包含在本发明的保护范围之内。

Claims

1.一种基于生成对抗网络的语法错误纠正方法，其特征在于：使用生成对抗网络进行语法错误纠正，所述生成对抗网络包括生成器G_θ与鉴别器D_φ两部分，生成器G_θ将语法错误的句子翻译成语法正确的重写句子，鉴别器D_φ评估生成器G_θ对错误输入的句子进行词汇相似、语义保留和语法进行正确重写的概率。

2.根据权利要求1所述的一种基于生成对抗网络的语法错误纠正方法，其特征在于：所述生成对抗网络的生成方法为：包括下列步骤：

S1、使用随机权重θ、φ初始化生成器G_θ、鉴别器D_φ；

S5、开始对抗训练，直到此生成对抗网络收敛。

3.根据权利要求2所述的一种基于生成对抗网络的语法错误纠正方法，其特征在于：所述S1中的生成器G_θ采用添加注意机制的循环神经网络RNN，所述鉴别器D_φ采用卷积神经网络CNN。

4.根据权利要求2所述的一种基于生成对抗网络的语法错误纠正方法，其特征在于：所述S5中生对抗训练的方法为：包括下列步骤：

如果ρ>λ：使用最大似然估计方法更新生成器G_θ；

其中，

为生成器G_θ输出的分布；

S5.4、重复步骤S5.1-S5.3，直到此生成对抗网络收敛。

5.根据权利要求4所述的一种基于生成对抗网络的语法错误纠正方法，其特征在于：所述生成器G_θ与鉴别器D_φ更新参数的方法为：

其中：θ为生成器G_θ的参数，α_g为生成器的学习率；

其中：φ为鉴别器D_φ的参数，α_d为鉴别器的学习率。