CN108563779B

CN108563779B - 一种基于神经网络的无模板自然语言文本答案生成方法

Info

Publication number: CN108563779B
Application number: CN201810377647.4A
Authority: CN
Inventors: 杨林; 高淑敏; 张力; 蒋文婷
Original assignee: Beijing Institute of Computer Technology and Applications
Current assignee: Beijing Institute of Computer Technology and Applications
Priority date: 2018-04-25
Filing date: 2018-04-25
Publication date: 2022-03-08
Anticipated expiration: 2038-04-25
Also published as: CN108563779A

Abstract

本发明公开了一种基于神经网络的无模板自然语言文本答案生成方法，其中，步骤一，针对问答系统内部特定的语义表征形式设计一个由自然文本生成该形式表征的神经网络模型A；步骤二，使用神经网络模型A完全相反的神经网络模型B；步骤三，基于神经网络模型A构建一个自然文本识别器C；步骤四，进行训练：对给定的自然文本S，通过神经网络模型A生成内部语义表征向量X，然而向该向量X中加入服从高斯分布的噪声Z，输入到神经网络模型B中，产生伪造的自然文本T，将自然文本S输入分类器C中并给出监督反馈1，将伪造的自然文本T输入分类器C中并给出监督反馈0，如此训练分类器C并将误差反向传播到模型B中，以对自然文本生成模型B进行有监督训练。

Description

一种基于神经网络的无模板自然语言文本答案生成方法

技术领域

本发明涉及自然语言文本答案生成方法，尤其涉及用于无模板的特定语义表征形式的自言语言文本答案生成模型。

背景技术

自然语言推理技术的日渐完善使人们拥有了更加自然的人机交互方式，自动问答系统可以较为准确地理解人们自然语言形式的问题，并利用知识库检索即时地返回言简意赅的答案，有效地满足了各领域问答需求。自动问答系统能用自然语言句子提问又能为用户直接返回所需要的答案,而并不是相关的文档或者网页。

在问答系统中，首先需要通过对问题进行分解和对知识库进行查询，得到尽可能全的一系列假设，这些假设是需要进行甄别的备选答案的集合。其次需要在文本语料库中对假设进行证据收集，得到每个假设即备选答案的置信度，进而甄选出最佳的假设。然而该假设是由类似一系列具有特定含义的关键词向量进行表示的，依然属于一种算法内部的语义表达形式，用户无法直接阅读和理解该假设，因此需要借助于自然语言文本生成模型对给出的假设生成对应的可供人类阅读的自然语言文本。

目前，基于英文的自然语言生成技术在国外取得了较大的进展，但基于中文的自然语言生成技术的研究却少有人问津。加之，在特定问答场景下语义的内部表示是基于特定的研究目标即问答系统提出的特定形式语义表征形式，其他的自然语言生成模型借鉴意义不大，因此有必要研究基于问答系统中生成的假设的语义表达形式的中文自然语言文本生成模型，该研究方向是自然语言问答领域的一个难点。

发明内容

本发明的目的在于提供一种基于神经网络的无模板自然语言文本答案生成方法，用于解决现有技术的问题。

本发明一种基于神经网络的无模板自然语言文本答案生成方法，其中，步骤一，针对问答系统内部特定的语义表征形式设计一个由自然文本生成该形式表征的神经网络模型A；步骤二，使用神经网络模型A完全相反的神经网络模型B，通过反复上采样由特定语义表征形式的向量合成伪造的自然文本；步骤三，基于神经网络模型A构建一个自然文本识别器C，用于识别给定的一段文本字符串是否为自然文本抑，以及判定是否为伪造文本；步骤四，进行训练：对给定的自然文本S，通过神经网络模型A生成内部语义表征向量X，然而向该向量X中加入服从高斯分布的噪声Z，输入到神经网络模型B中，产生伪造的自然文本T，将自然文本S输入分类器C中并给出监督反馈1，将伪造的自然文本T输入分类器C中并给出监督反馈0，如此训练分类器C并将误差反向传播到模型B中，以对自然文本生成模型B进行有监督训练。

根据本发明的基于神经网络的无模板自然语言文本答案生成方法的一实施例，其中，神经网络模型A采用TextCNN模型、CNN模型或RNN模型，使用神经网络模型A进行下采样操作。

根据本发明的基于神经网络的无模板自然语言文本答案生成方法的一实施例，其中，神经网络模型B采用TextCNN模型、CNN模型或RNN模型，使用神经网络模型B进行反复上采样由特定语义表征形式的向量合成伪造的自然文本。

根据本发明的基于神经网络的无模板自然语言文本答案生成方法的一实施例，其中，自然文本识别器C为CNN+LSTM神经网络

根据本发明的基于神经网络的无模板自然语言文本答案生成方法的一实施例，其中，A表征器与B生成器的内部结构采用对称架构，以保证从自然文本由A提取文本特征转化为向量形式后能够由B尽可能还原为自然文本。

根据本发明的基于神经网络的无模板自然语言文本答案生成方法的一实施例，其中，自然文本判别器C采用CNN+LSTM神经网络提取特征，采用SVM分类器进行二分类，CNN部分为两层CNN，第一层采用9×9滤波器，第二层为4×3的滤波器，池化层采用max-pooling策略，第一层pooling size设定为3，第二层CNN不接池化层，在CNN后LSTM之前接一个线性层来降维，CNN后接2层LSTM，每个LSTM层采用832个cells，512维映射层来降维。

本发明重点设计一个对抗神经网络模型(Generative Adversarial Nets，简称为GANs)来实现该方法，它借助于一个文本生成器与一个自然文本判别器作为一对博弈的双方，通过零和博弈不断的增强文本生成器伪造自然文本的能力，最终能够使得自然文本判别器无法分辨生成器的伪造文本与真实自然文本的差异性。

附图说明

图1所示为本发明基于神经网络的无模板自然语言文本答案生成方法的流程图；

图2所示为表征提取器与文本生成器对称结构图；

图3所示为TextCNN模型的流程图；

图4所示为CNN+LSTM网络的自然文本识别器模型图。

具体实施方式

为使本发明的目的、内容、和优点更加清楚，下面结合附图和实施例，对本发明的具体实施方式作进一步详细描述。

图1所示为本发明基于神经网络的无模板自然语言文本答案生成方法的流程图，如图1所示，本发明基于神经网络的无模板自然语言文本答案生成方法的技术方案包括以下步骤：

步骤一，针对问答系统内部特定的语义表征形式设计一个由自然文本生成该形式表征的神经网络模型A，可以尝试的具体模型如卷积神经网络CNN、循环神经网络RNN以及长短时记忆神经网络LSTM等。这些模型都包含下采样操作；

步骤二，使用一个与步骤一中神经网络模型A完全相反的神经网络模型B，它可以通过反复上采样由特定语义表征形式的向量合成伪造的自然文本；

步骤三，基于神经网络模型A构建一个自然文本识别器C，它用于识别给定的一段文本字符串是否为自然文本抑或判定其为伪造文本；

步骤四，按照如下方式进行训练：对给定的自然文本S，通过步骤一中构建的网络A生成内部语义表征向量X，然而向该向量X中加入服从高斯分布的噪声Z，输入到步骤二中的神经网络模型B中，它会产生伪造的“自然文本”T。将S输入分类器C中并给出监督反馈1，将T输入分类器C中并给出监督反馈0，如此训练分类C并将误差反向传播到模型B中，就可以对自然文本生成模型B进行有监督训练。

图2所示为表征提取器与文本生成器对称结构图；图3所示为TextCNN模型的流程图；图4所示为CNN+LSTM网络的自然文本识别器模型图，如图1至图4所示，本发明基于神经网络的无模板自然语言文本答案生成方法的一实施例：

①针对问答系统内部特定的语义表征形式设计一个由自然文本生成该形式表征的TextCNN神经网络模型A(本发明设计的TextCNN网络模型见图3，也可以选择其他CNN或RNN模型作为简易实现)，使用神经网络模型A进行下采样操作；

②设计一个与神经网络模型A完全相反的TextCNN神经网络模型B(同样也可以选择其他CNN或RNN模型)，它可以通过反复上采样由特定语义表征形式的向量合成伪造的自然文本；

③基于类似于A结构的神经网络构建一个自然文本识别器C(本发明中构建一种CNN+LSTM神经网络)，它用于识别给定的一段文本字符串是否为自然文本抑或判定其为伪造文本；

④并按照如下方式训练：对给定的自然文本S，通过步骤一中构建的网络A生成内部语义表征向量X，然而向该向量X中加入服从高斯分布的噪声Z，输入到神经网络模型B中，它会产生伪造的“自然文本”T。将S输入分类器C中并给出监督反馈1，将T输入分类器C中并给出监督反馈0，如此训练分类C并将误差反向传播到模型B中，就可以对自然文本生成模型B进行有监督训练。

其中A表征器与B生成器的内部结构采用对称架构，以保证从自然文本由A提取文本特征转化为向量形式后能够由B尽可能还原为自然文本。而自然文本判别器C采用CNN+LSTM神经网络提取特征，然后采用SVM分类器进行二分类。CNN部分为两层CNN，第一层采用9×9滤波器，第二层为4×3的滤波器。池化层采用max-pooling策略，第一层pooling size设定为3，第二层CNN不接池化层。由于CNN最后一层输出维度很大，所以在CNN后LSTM之前接一个线性层来降维。CNN后接2层LSTM，每个LSTM层采用832个cells，512维映射层来降维。

文本统一表征提取器(即表征器)A和自然文本生成器B的对称结构示例如图2所示，向生成器B中添加噪声的目的是为了生成足够多样本输入，以增强样本集且同时提高训练的到模型的鲁棒性。

以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明技术原理的前提下，还可以做出若干改进和变形，这些改进和变形也应视为本发明的保护范围。

Claims

1.一种基于神经网络的无模板自然语言文本答案生成方法，其特征在于，

步骤一，针对问答系统内部特定的语义表征形式设计一个由自然文本生成该形式表征的神经网络模型A作为表征器；

步骤二，使用神经网络模型B作为生成器，通过反复上采样由特定语义表征形式的向量合成伪造的自然文本；A表征器与B生成器的内部结构采用对称架构，以保证从自然文本由A提取文本特征转化为向量形式后能够由B尽可能还原为自然文本；

步骤三，基于神经网络模型A构建一个自然文本识别器C，用于识别给定的一段文本字符串是否为自然文本抑或判定是否为伪造文本；

步骤四，进行训练：对给定的自然文本S，通过神经网络模型A生成内部语义表征向量X，然而向该向量X中加入服从高斯分布的噪声Z，输入到神经网络模型B中，产生伪造的自然文本T，将自然文本S输入分类器C中并给出监督反馈1，将伪造的自然文本T输入分类器C中并给出监督反馈0，如此训练分类器C并将误差反向传播到模型B中，以对自然文本生成模型B进行有监督训练。

2.如权利要求1所述的基于神经网络的无模板自然语言文本答案生成方法，其特征在于，神经网络模型A采用TextCNN模型、CNN模型或RNN模型，使用神经网络模型A进行下采样操作。

3.如权利要求1所述的基于神经网络的无模板自然语言文本答案生成方法，其特征在于，神经网络模型B采用TextCNN模型、CNN模型或RNN模型，使用神经网络模型B进行反复上采样由特定语义表征形式的向量合成伪造的自然文本。

4.如权利要求1所述的基于神经网络的无模板自然语言文本答案生成方法，其特征在于，自然文本识别器C为CNN+LSTM神经网络。

5.如权利要求1所述的基于神经网络的无模板自然语言文本答案生成方法，其特征在于，自然文本判别器C采用CNN+LSTM神经网络提取特征，采用SVM分类器进行二分类，CNN部分为两层CNN，第一层采用9×9滤波器，第二层为4×3的滤波器，池化层采用max-pooling策略，第一层poolingsize设定为3，第二层CNN不接池化层，在CNN后LSTM之前接一个线性层来降维，CNN后接2层LSTM，每个LSTM层采用832个cells，512维映射层来降维。