WO2021143022A1

WO2021143022A1 - 一种文本生成的方法及装置

Info

Publication number: WO2021143022A1
Application number: PCT/CN2020/093450
Authority: WO
Inventors: 陈瑞清; 许开河; 王少军
Original assignee: 平安科技（深圳）有限公司
Priority date: 2020-01-14
Filing date: 2020-05-29
Publication date: 2021-07-22
Also published as: CN111241789A

Abstract

一种文本生成的方法及装置，涉及数据处理技术领域，解决现有技术中根据已有模型生成的目标文本不准确的问题。该方法主要包括：获取初始文本数据（101）；根据预置BERT语言模型，计算所述初始文本数据的变分自编码器的隐藏空间参数（102）；以所述初始文本数据、所述隐藏空间参数和初始控制条件为输入数据，以在所述初始控制条件下与所述初始文本数据相对应的控制语句为输出数据，采用时序性倒传递算法，修正训练长短期记忆网络LSTM解码器的权重，以训练所述LSTM解码器（103）；以待测语句和目标控制条件为所述LSTM解码器的输入数据，生成所述待测语句的目标语句（104）。该方法主要应用于相似文本扩展的过程中。

Description

一种文本生成的方法及装置

本申请要求于2020年1月14日提交中国专利局、申请号为202010038172.3，发明名称为“一种文本生成的方法及装置”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及一种数据处理技术领域，特别是涉及一种文本生成的方法及装置。

背景技术

生成文本是结构化过程中的文本，结构化表现出来的形式即现象文本，通常以可读性和可控性判断生成文本的质量。其中，可读性是指生成文本具有符合人类自然语言规范的句子并且句子的意思清晰，可控性是指能够根据事先设定的参数生成想要的目标句子能够根据参数的调节来改变句子的语义。

现有的文本生成方案通常分成基于规则的文本生成和基于神经网络的文本生成。基于规则的生成方式通常是通过人工指定一些规则通过同义词替换、词性分析等方法，这样生成的文本可控性比较好但是可读性比较差且扩展性弱，需要大量的人工特征工程。基于神经网络的方式主要分为使用GAN和使用VAE的文本生成，由于文本是离散字符组成，因此是不可导的如果使用GAN常用的方法是使用强化学习来实现反向传播但是这样的问题是方差比较大影响效果，而另一种基于VAE的方法被认为在文本生成方面更友好。

VAE(Variational Auto-Encoder)和GAN(Ganerative Adversarial Networks)都是生成模型(Generative model)。所谓生成模型，即能生成样本的模型。将训练集中的数据点看作是某个随机分布抽样出来的样本，比如：MNIST手写体样本，可以将每一幅图像看作是随机分布p(x)p(x)的抽样。如果能够得到类似的随机模型，那么能够无限制地生成样本。但随机分布p(x)p(x)，需要通过对训练集的学习来得到它，或者逼近它。要逼近一个随机分布，其基本思想是：将一个已知的，可控的随机分布q(z)q(z)映射到目标随机分布p(x)p(x)上。变分自编码器是深度学习领域中典型的生成模型，属于Encoder-Decoder模型结构。

现有技术中，采用根据文本应用场景获取文本语料，生成文本语料集，然后从文本语料中获取对齐语料，将对齐语料作为seq2seq模型的训练语料，对齐语料为表达内容相同但是标识不同情感的文本语料，再将训练语料输入seq2seq模型，以对seq2seq模型进行情感风格转换训练，再根据应用场景获取目标文本，将目标文本输入已训练的seq2seq模型，得到相应情感风格的转换语料。其中seq2seq模型是Encoder-Decoder模型结构。

然而，发明人发现，现有技术中直接将应用场景获取的文本语料获取文本语料集做为训练语料，在实际应用中训练语料数据具有局限性，不能据此训练出具有一般意义的seq2seq模型，导致在转换情感风格时转换语料不能准确反映应用场景下的方案，也就是根据已有模型生成的目标文本不准确，与应用场景实际对应的情感风格差距较大。

发明内容

有鉴于此，本申请提供一种文本生成的方法及装置，主要目的在于解决现有技术中根据已有模型生成的目标文本不准确的问题。

依据本申请一个方面，提供了一种文本生成的方法，包括：

获取初始文本数据；

根据预置BERT语言模型，计算所述初始文本数据的变分自编码器的隐藏空间参数；

以所述初始文本数据、所述隐藏空间参数和初始控制条件为输入数据，以在所述初始控制条件下与所述初始文本数据相对应的控制语句为输出数据，采用时序性倒传递算法，修正训练长短期记忆网络LSTM解码器的权重，以训练所述LSTM解码器；

以待测语句和目标控制条件为所述LSTM解码器的输入数据，生成所述待测语句的目标语句。

依据本申请另一个方面，提供了一种文本生成的装置，包括：

获取模块，用于获取初始文本数据；

计算模块，用于根据预置BERT语言模型，计算所述初始文本数据的变分自编码器的隐藏空间参数；

训练模块，用于以所述初始文本数据、所述隐藏空间参数和初始控制条件为输入数据，以在所述初始控制条件下与所述初始文本数据相对应的控制语句为输出数据，采用时序性倒传递算法，修正训练长短期记忆网络LSTM解码器的权重，以训练所述LSTM解码器；

生成模块，用于以待测语句和目标控制条件为所述LSTM解码器的输入数据，生成所述待测语句的目标语句。

根据本申请的又一方面，提供了一种计算机存储介质，所述计算机存储介质中存储有至少一计算机可读指令，所述计算机可读指令使处理器执行如上述文本生成的方法对应的操作。

根据本申请的再一方面，提供了一种计算机设备，包括：处理器、存储器、通信接口和通信总线，所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信；

所述存储器用于存放至少一计算机可读指令，所述计算机可读指令使所述处理器执行上述文本生成的方法对应的操作。

借由上述技术方案，本申请实施例提供的技术方案至少具有下列优点：

本申请提供了一种文本生成的方法及装置，首先获取初始文本数据，然后根据预置BERT语言模型，计算初始文本数据的变分自编码器的隐藏空间参数，再以初始文本数据、隐藏空间参数和初始控制条件为输入数据，以在初始控制条件下与初始文本数据相对应的控制语句为输出数据，采用时序性倒传递算法，修正训练长短期记忆网络LSTM解码器的权重，以训练LSTM解码器，最后以待测语句和目标控制条件为LSTM解码器的输入数据，生成所述待测语句的目标语句。本申请实施例通过利用预置BERT语音模型抓取初始文本数据中的句子的语法特征和语义特征，以获取丰富的句子表征信息，将句子表征信息通过变分自编码器获取隐藏空间参数，并通过控制条件的方式生成待测语句的目标语句，目标语句具备较好的文本表示并具有可控制性，能准确以控制条件表达所需的情感风格、相似语义、相似句式等应用场景。

上述说明仅是本申请技术方案的概述，为了能够更清楚了解本申请的技术手段，而可依照说明书的内容予以实施，并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂，以下特举本申请的具体实施方式。

发明概述

技术问题

问题的解决方案

发明的有益效果

对附图的简要说明

附图说明

通过阅读下文优选实施方式的详细描述，各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的，而并不认为是对本申请的限制。而且在整个附图中，用相同的参考符号表示相同的部件。在附图中：

图1示出了本申请实施例提供的一种文本生成的方法流程图；

图2示出了本申请实施例提供的另一种文本生成的方法流程图；

图3示出了本申请实施例提供的一种文本生成的装置组成框图；

图4示出了本申请实施例提供的另一种文本生成的装置组成框图；

图5示出了本申请实施例提供的一种计算机设备的结构示意图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例，然而应当理解，可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本公开，并且能够将本公开的范围完整的传达给本领域的技术人员。

本申请的目的在于，以意图作为控制条件，生成给定意图的语句，可以用于扩展智能问答知识库的数据。本申请实施例提供了一种文本生成的方法，如图1所示，该方法包括：

101、获取初始文本数据。

102、根据预置BERT语言模型，计算所述初始文本数据的变分自编码器的隐藏空间参数。

变分自编码器，是一种非监督式学习的神经网络模型，采用原始数据作为输入和输出，含有一个数量小于输入输出的隐藏层，使用seq2seq结构，将文本句子编码到隐藏空间，在编码完成后能通过解码器解出文本句子。从初始文本数据到隐藏层，在神经网络模型中神经元数量下降，该过程为编码过程。隐藏层的目的是实现提取初始文本数据的主要成分，隐藏空间参数是指初始文本数据的特征参数。

在计算初始文本数据的隐藏空间参数之前，通过预置BERT语言模型将初始文本数据通过变分自编码器映射到隐藏空间，其映射过程为预置BERT语言模型的pooled_output连接两个全连接层分别学习隐藏空间的参数均值和标准差。在映射过程，可以设置较低的学习率，例如5E-5。

103、以所述初始文本数据、所述隐藏空间参数和初始控制条件为输入数据，以在所述初始控制条件下与所述初始文本数据相对应的控制语句为输出数据，采用时序性倒传递算法，修正训练长短期记忆网络LSTM解码器的权重，以训练所述LSTM解码器。

从隐藏层到输出层，神经元的数量上升，被称为解码器，也就是生成模型。在本申请实施例中生成模型是LSTM解码器，LSTM解码器是为处理自然语言处理问题而开发的。为了后续使用LSTM解码器，需要通过初始文本数据、隐藏空间参数、初始控制条件，以及在初始控制条件在初始文本数据生成的实际语句，训练LSTM解码器。在编码部分由于隐藏层数量小于输入，所以会对数据进行压缩，之后在解码部分输出神经元数量大于隐藏层，压缩后的隐藏层相互组合重现原始输出。在训练LSTM解码器的过程中，为了最小化训练误差，采用时序性倒传递算法，依据错误修改训练权重，以使得以初始文本数据、隐藏空间参数和初始控制条件通过LSTM解码器，能够生成在初始控制条件下雨初始文本数据相对应的控制语句。

控制条件是指通过设定标注文本的类别信息与变分后的特征控制文本生成的语义和风格，控制条件是指计算机能够识别的用数字化表达的意图。意图是指实际应用场景中的使用目的，比如办理业务、咨询业务、投诉业务等等。为了训练LSTM解码器，针对初始文本数据，可以认为的设置初始控制条件以及初始控制条件对应的实际语句，以使得LSTM解码器能够生成可控性较高的文本。

104、以待测语句和目标控制条件为所述LSTM解码器的输入数据，生成所述待测语句的目标语句。

在生成待测语句的目标语句的过程中，不设置隐藏空间参数，减少对目标语句的限定，使得目标语句更符合待测语句和控制条件的目标要求。目标控制条件，可以为在实际应用场景的使用目的，比如办理业务。目标控制条件是指计算机能够识别的用数字化表达的意图。

通过LSTM解码器，可以生成“12|月|份|推|荐|好|友|的|30|元|为|什|么|一|直|没|到|账”、“181|天|的|定|期|什|么|时|间|发|售”、“155|##64|##93|##15|##91|注|册|的|推|荐|人|手|机|尾|号|是|250|##1|吗”，通过生成例子可以看出本方案可以得到比较通顺的句子，通过对控制条件的训练可以在解码过程中，根据目标控制条件生成相应风格的句子。

本申请提供了一种文本生成的方法，首先获取初始文本数据，然后根据预置BERT语言模型，计算初始文本数据的变分自编码器的隐藏空间参数，再以初始文本数据、隐藏空间参数和初始控制条件为输入数据，以在初始控制条件下与初始文本数据相对应的控制语句为输出数据，采用时序性倒传递算法，修正训练长短期记忆网络LSTM解码器的权重，以训练LSTM解码器，最后以待测语句和目标控制条件为LSTM解码器的输入数据，生成所述待测语句的目标语句。本申请实施例通过利用预置BERT语音模型抓取初始文本数据中的句子的语法特征和语义特征，以获取丰富的句子表征信息，将句子表征信息通过变分自编码器获取隐藏空间参数，并通过控制条件的方式生成待测语句的目标语句，目标语句具备较好的文本表示并具有可控制性，能准确以控制条件表达所需的情感风格、相似语义、相似句式等应用场景。

本申请实施例提供了另一种文本生成的方法，如图2所示，该方法包括：

201、获取初始文本数据。

初始文本数据可以是随机获取的文本数据，也可以是与应用场景相关的文本数据，还可以是特定应用场景下的用户录入的文本数据，在本申请实施例中对初始文本数据的来源不做限定。示例性的，初始文本数据可以是智能问答知识库数据中的句子。初始文本数据中的句子数量不做限定，在每个句子中可能包括汉字、英文字母、拼音符号、或阿拉伯数字。

202、根据预置BERT语言模型，将所述初始文本数据通过所述变分自编码器映射到隐藏空间，获取所述隐藏空间的隐藏空间参数。

变分自编码器，是一种非监督式学习的神经网络模型，采用原始数据作为输入和输出，含有一个数量小于输入输出的隐藏层，使用seq2seq结构，将文本句子编码到隐藏空间，在编码完成后能通过解码器解出文本句子。获取隐藏空间参数，具体包括：以所述初始文本数据为所述预置BERT语言模型的输入，获取所述初始文本数据中各个句子的句向量，所述句向量包括字向量和位置向量；以所述句向量为变分自编码器的学习参数，将所述初始文本数据映射到隐藏空间，所述隐藏空间是正态分布空间；查找所述隐藏空间的隐藏空间参数，所述隐藏空间参数包括所述初始文本数据的参数均值和标准差。在获取初始文本数据中各个句子的句向量时，采用预置BERT语言模型中的字向量表。

变分自编码器采用神经网络结构，所以在使用之前，还需要对其进行训练，在本申请实施例中对其训练过程不再赘述。在映射过程，可以设置较低的学习率，例如5E-5。

203、在所述隐藏空间进行高斯重采样，重构所述隐藏空间参数。

重构隐藏空间参数，本质上就是在变分自编码器的基础上，对输出的隐藏空间参数加上“高斯噪声”，使得解码时能够增加对噪声的鲁棒性。在隐藏空间进行高斯重采样，重新获取隐藏空间参数，新的隐藏空间参数是后续训练LSTM解码器的输入数据。

204、获取所述隐藏空间的空间维度。

空间维度是指表征隐藏空间的数据种类，示例性的，用均值和标准差两种数据表示隐藏空间，那么其空间维度的数量就是2。

205、按照所述空间维度，拼接所述隐藏空间参数和所述初始控制条件，生成所述LSTM解码器的隐藏初始输入。

为了更好的训练LSTM解码器，在训练之前对部分训练数据进行特定处理，拼接隐藏空间参数和初始控制条件生成隐藏初始输入。生成隐藏初始输入具体包括：将所述隐藏空间参数，映射到隐藏张量；将所述初始控制条件转换为意图张量，所述意图张量的意图维度与所述隐藏张量的维度相同；拼接所述隐藏张量和所述意图张量，生成所述LSTM解码器的隐藏初始输入。

示例性的，隐藏空间的空间维度为H，初始文本数据中的句子数量为M，初始控制条件中的意图为N，随机定义一个大小为[N，H]的张量，其中每个意图对于一个H张量，将该意图的张罗和重构后的隐藏空间参数的H张量进行拼接，得到LSTM解码器的隐藏初始输入。

206、以所述隐藏初始输入和所述初始文本数据为输入数据，以在所述初始控制条件下与所述初始文本数据相对应的控制语句为输出数据，采用时序性倒传递算法，修正训练长短期记忆网络LSTM解码器的权重，以训练所述LSTM解码器。

在训练LSTM解码器的过程中，为了最小化训练误差，采用时序性倒传递算法，依据错误修改训练权重，以使得以初始文本数据、隐藏空间参数和初始控制条件通过LSTM解码器，能够生成在初始控制条件下雨初始文本数据相对应的控制语句。

为了保证编码和解码的结果处于相同的空间，在LSTM解码器中采用的字向量表，与变分自编码器中采用的字向量表相同。为了是编码和解码过程取得同步，对解码过程设置较大的学习率，以保证编码部分的尽可能存在较小的改动，与编码过程设置较低的5E-5学习率相对应，在训练LSTM解码器的过程中学习率可为0.01。

由于解码过程中设置较小的学习率，采用将KL误差系数关联到训练过程中的全局步骤中，随着全局步骤数量的增大，KL误差系数逐渐增加到1之后不再增加，以防止减小KL误差系数降低带来的KL散度下降过快，导致LSTM解码器与隐藏空间脱钩不受控制。

207、以待测语句和目标控制条件为所述LSTM解码器的输入数据，生成所述待测语句的目标语句。

当目标控制条件为待测语句的控制条件时，以待测语句和目标控制条件为所述LSTM解码器的输入数据，生成所述待测语句的相似语句，所述目标控制条件为所述待测语句的控制条件。

进一步的，作为对上述图1所示方法的实现，本申请实施例提供了一种文本生成的装置，如图3所示，该装置包括：

获取模块31，用于获取初始文本数据；

计算模块32，用于根据预置BERT语言模型，计算所述初始文本数据的变分自编码器变分自编码器的隐藏空间参数；

训练模块33，用于以所述初始文本数据、所述隐藏空间参数和初始控制条件为输入数据，以在所述初始控制条件下与所述初始文本数据相对应的控制语句为输出数据，采用时序性倒传递算法，修正训练长短期记忆网络LSTM解码器的权重，以训练所述LSTM解码器；

生成模块34，用于以待测语句和目标控制条件为所述LSTM解码器的输入数据，生成所述待测语句的目标语句。

本申请提供了一种文本生成的装置，首先获取初始文本数据，然后根据预置B ERT语言模型，计算初始文本数据的变分自编码器的隐藏空间参数，再以初始文本数据、隐藏空间参数和初始控制条件为输入数据，以在初始控制条件下与初始文本数据相对应的控制语句为输出数据，采用时序性倒传递算法，修正训练长短期记忆网络LSTM解码器的权重，以训练LSTM解码器，最后以待测语句和目标控制条件为LSTM解码器的输入数据，生成所述待测语句的目标语句。本申请实施例通过利用预置BERT语音模型抓取初始文本数据中的句子的语法特征和语义特征，以获取丰富的句子表征信息，将句子表征信息通过变分自编码器获取隐藏空间参数，并通过控制条件的方式生成待测语句的目标语句，目标语句具备较好的文本表示并具有可控制性，能准确以控制条件表达所需的情感风格、相似语义、相似句式等应用场景。

进一步的，作为对上述图2所示方法的实现，本申请实施例提供了另一种文本生成的装置，如图4所示，该装置包括：

获取模块41，用于获取初始文本数据；

计算模块42，用于根据预置BERT语言模型，计算所述初始文本数据的变分自编码器变分自编码器的隐藏空间参数；

训练模块43，用于以所述初始文本数据、所述隐藏空间参数和初始控制条件为输入数据，以在所述初始控制条件下与所述初始文本数据相对应的控制语句为输出数据，采用时序性倒传递算法，修正训练长短期记忆网络LSTM解码器的权重，以训练所述LSTM解码器；

生成模块44，用于以待测语句和目标控制条件为所述LSTM解码器的输入数据，生成所述待测语句的目标语句。

进一步地，所述计算模块42，包括：

获取单元421，用于根据预置BERT语言模型，将所述初始文本数据通过所述变分自编码器映射到隐藏空间，获取所述隐藏空间的隐藏空间参数；

重构单元422，用于在所述隐藏空间进行高斯重采样，重构所述隐藏空间参数。

进一步地，所述获取单元421，包括：

获取子单元4211，用于以所述初始文本数据为所述预置BERT语言模型的输入，获取所述初始文本数据中各个句子的句向量，所述句向量包括字向量和位置向量；

映射子单元4212，用于以所述句向量为变分自编码器的学习参数，将所述初始文本数据映射到隐藏空间，所述隐藏空间是正态分布空间；

查找子单元4213，用于查找所述隐藏空间的隐藏空间参数，所述隐藏空间参数包括所述初始文本数据的参数均值和标准差。

进一步地，所述训练模块43，包括：

获取单元431，用于获取所述隐藏空间的空间维度；

拼接单元432，用于按照所述空间维度，拼接所述隐藏空间参数和所述初始控制条件，生成所述LSTM解码器的隐藏初始输入；

训练单元433，用于以所述隐藏初始输入和所述初始文本数据为输入数据，以在所述初始控制条件下与所述初始文本数据相对应的控制语句为输出数据，采用时序性倒传递算法，修正训练长短期记忆网络LSTM解码器的权重，以训练所述LSTM解码器。

进一步地，所述拼接单元432，包括：

映射子单元4321，用于将所述隐藏空间参数，映射到隐藏张量；

转换子单元4322，用于将所述初始控制条件转换为意图张量，所述意图张量的意图维度与所述隐藏张量的维度相同；

拼接子单元4323，用于拼接所述隐藏张量和所述意图张量，生成所述LSTM解码器的隐藏初始输入。

进一步地，生成模块44，用于：

以待测语句和目标控制条件为所述LSTM解码器的输入数据，生成所述待测语句的相似语句，所述目标控制条件为所述待测语句的控制条件。

进一步地，所述变分自编码器和所述LSTM解码器采用相同的字向量表。

本申请提供了一种文本生成的装置，首先获取初始文本数据，然后根据预置BERT语言模型，计算初始文本数据的变分自编码器的隐藏空间参数，再以初始文本数据、隐藏空间参数和初始控制条件为输入数据，以在初始控制条件下与初始文本数据相对应的控制语句为输出数据，采用时序性倒传递算法，修正训练长短期记忆网络LSTM解码器的权重，以训练LSTM解码器，最后以待测语句和目标控制条件为LSTM解码器的输入数据，生成所述待测语句的目标语句。本申请实施例通过利用预置BERT语音模型抓取初始文本数据中的句子的语法特征和语义特征，以获取丰富的句子表征信息，将句子表征信息通过变分自编码器获取隐藏空间参数，并通过控制条件的方式生成待测语句的目标语句，目标语句具备较好的文本表示并具有可控制性，能准确以控制条件表达所需的情感风格、相似语义、相似句式等应用场景。

根据本申请一个实施例提供了一种计算机存储介质，所述计算机存储介质存储有至少一计算机可读指令，该计算机计算机可读指令可执行上述任意方法实施例中的文本生成的方法。计算机存储介质包括但不限于NandFlash、NorFlash、非易失性存储器(ROM、Flash memory)、寄存器、缓存和内存。

图5示出了根据本申请一个实施例提供的一种计算机设备的结构示意图，本申请具体实施例并不对计算机设备的具体实现做限定。

如图5所示，该计算机设备可以包括：处理器(processor)502、通信接口(Commu nications Interface)504、存储器(memory)506、以及通信总线508。

其中：处理器502、通信接口504、以及存储器506通过通信总线508完成相互间的通信。

通信接口504，用于与其它设备比如客户端或其它服务器等的网元通信。

处理器502，用于执行计算机可读指令510，具体可以执行上述文本生成的方法实施例中的相关步骤。

具体地，计算机可读指令510可以包括程序代码，该程序代码包括计算机操作指令。

处理器502可能是中央处理器CPU，或者是特定集成电路ASIC(Application Specific Integrated Circuit)，或者是被配置成实施本申请实施例的一个或多个集成电路。计算机设备包括的一个或多个处理器，可以是同一类型的处理器，如一个或多个CPU；也可以是不同类型的处理器，如一个或多个CPU以及一个或多个ASIC。

存储器506，用于存放计算机可读指令510。存储器506可能包含高速RAM存储器，也可能还包括非易失性存储器(non-volatile memory)，例如至少一个磁盘存储器。

计算机可读指令510具体可以用于使得处理器502执行以下操作：

获取初始文本数据；

以所述初始文本数据、所述隐藏空间参数和初始控制条件为训练数据，训练长短期记忆网络LSTM解码器；

显然，本领域的技术人员应该明白，上述的本申请的各模块或各步骤可以用通用的计算装置来实现，它们可以集中在单个的计算装置上，或者分布在多个计算装置所组成的网络上，可选地，它们可以用计算装置可执行的程序代码来实现，从而，可以将它们存储在存储装置中由计算装置来执行，并且在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤，或者将它们分别制作成各个集成电路模块，或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样，本申请不限制于任何特定的硬件和软件结合。

以上所述仅为本申请的优选实施例而已，并不用于限制本申请，对于本领域的技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包括在本申请的保护范围之内。

Claims

一种文本生成的方法，包括：

获取初始文本数据；

根据预置BERT语言模型，计算所述初始文本数据的变分自编码器的隐藏空间参数；

以所述初始文本数据、所述隐藏空间参数和初始控制条件为输入数据，以在所述初始控制条件下与所述初始文本数据相对应的控制语句为输出数据，采用时序性倒传递算法，修正训练长短期记忆网络LSTM解码器的权重，以训练所述LSTM解码器；

以待测语句和目标控制条件为所述LSTM解码器的输入数据，生成所述待测语句的目标语句。
如权利要求1所述的方法，所述根据预置BERT语言模型，计算所述初始文本数据的变分自编码器的隐藏空间参数，包括：

根据预置BERT语言模型，将所述初始文本数据通过所述变分自编码器映射到隐藏空间，获取所述隐藏空间的隐藏空间参数；

在所述隐藏空间进行高斯重采样，重构所述隐藏空间参数。
如权利要求2所述的方法，所述根据预置BERT语言模型，将所述初始文本数据通过所述变分自编码器映射到隐藏空间，获取所述隐藏空间的隐藏空间参数，包括：

以所述初始文本数据为所述预置BERT语言模型的输入，获取所述初始文本数据中各个句子的句向量，所述句向量包括字向量和位置向量；

以所述句向量为变分自编码器的学习参数，将所述初始文本数据映射到隐藏空间，所述隐藏空间是正态分布空间；

查找所述隐藏空间的隐藏空间参数，所述隐藏空间参数包括所述初始文本数据的参数均值和标准差。
如权利要求2所述的方法，所述以所述初始文本数据、所述隐藏空间参数和初始控制条件为输入数据，以在所述初始控制条件下与所述初始文本数据相对应的控制语句为输出数据，采用时序性倒传递算法，修正训练长短期记忆网络LSTM解码器的权重，以训练所述LSTM解码器，包括：

获取所述隐藏空间的空间维度；

按照所述空间维度，拼接所述隐藏空间参数和所述初始控制条件，生成所述LSTM解码器的隐藏初始输入；

以所述隐藏初始输入和所述初始文本数据为输入数据，以在所述初始控制条件下与所述初始文本数据相对应的控制语句为输出数据，采用时序性倒传递算法，修正训练长短期记忆网络LSTM解码器的权重，以训练所述LSTM解码器。
如权利要求4所述的方法，所述按照所述空间维度，拼接所述隐藏空间参数和所述初始控制条件，生成所述LSTM解码器的隐藏初始输入，包括：

将所述隐藏空间参数，映射到隐藏张量；

将所述初始控制条件转换为意图张量，所述意图张量的意图维度与所述隐藏张量的维度相同；

拼接所述隐藏张量和所述意图张量，生成所述LSTM解码器的隐藏初始输入。
如权利要求1所述的方法，以待测语句和目标控制条件为所述LSTM解码器的输入数据，生成所述待测语句的目标语句，包括：

以待测语句和目标控制条件为所述LSTM解码器的输入数据，生成所述待测语句的相似语句，所述目标控制条件为所述待测语句的控制条件。
如权利要求1所述的方法，所述变分自编码器和所述LSTM解码器采用相同的字向量表。
一种文本生成的装置，包括：

获取模块，用于获取初始文本数据；

计算模块，用于根据预置BERT语言模型，计算所述初始文本数据的变分自编码器的隐藏空间参数；

训练模块，用于以所述初始文本数据、所述隐藏空间参数和初始控制条件为输入数据，以在所述初始控制条件下与所述初始文本数据相对应的控制语句为输出数据，采用时序性倒传递算法，修正训练长短期记忆网络LSTM解码器的权重，以训练所述LSTM解码器；

生成模块，用于以待测语句和目标控制条件为所述LSTM解码器的输入数据，生成所述待测语句的目标语句。
一种计算机存储介质，所述计算机存储介质中存储有至少一计算机可读指令，所述计算机可读指令使处理器执行如下操作：

获取初始文本数据；

根据预置BERT语言模型，计算所述初始文本数据的变分自编码器的隐藏空间参数；

以所述初始文本数据、所述隐藏空间参数和初始控制条件为输入数据，以在所述初始控制条件下与所述初始文本数据相对应的控制语句为输出数据，采用时序性倒传递算法，修正训练长短期记忆网络LSTM解码器的权重，以训练所述LSTM解码器；

以待测语句和目标控制条件为所述LSTM解码器的输入数据，生成所述待测语句的目标语句。
如权利要求9所述的计算机存储介质，所述计算机可读指令还使处理器执行如下操作：

根据预置BERT语言模型，将所述初始文本数据通过所述变分自编码器映射到隐藏空间，获取所述隐藏空间的隐藏空间参数；

在所述隐藏空间进行高斯重采样，重构所述隐藏空间参数。
如权利要求10所述的计算机存储介质，所述计算机可读指令还使处理器执行如下操作：

以所述初始文本数据为所述预置BERT语言模型的输入，获取所述初始文本数据中各个句子的句向量，所述句向量包括字向量和位置向量；

以所述句向量为变分自编码器的学习参数，将所述初始文本数据映射到隐藏空间，所述隐藏空间是正态分布空间；

查找所述隐藏空间的隐藏空间参数，所述隐藏空间参数包括所述初始文本数据的参数均值和标准差。
如权利要求10所述的计算机存储介质，所述计算机可读指令还使处理器执行如下操作：

获取所述隐藏空间的空间维度；

按照所述空间维度，拼接所述隐藏空间参数和所述初始控制条件，生成所述LSTM解码器的隐藏初始输入；

以所述隐藏初始输入和所述初始文本数据为输入数据，以在所述初始控制条件下与所述初始文本数据相对应的控制语句为输出数据，采用时序性倒传递算法，修正训练长短期记忆网络LSTM解码器的权重，以训练所述LSTM解码器。
如权利要求12所述的计算机存储介质，所述计算机可读指令还使处理器执行如下操作：

将所述隐藏空间参数，映射到隐藏张量；

将所述初始控制条件转换为意图张量，所述意图张量的意图维度与所述隐藏张量的维度相同；

拼接所述隐藏张量和所述意图张量，生成所述LSTM解码器的隐藏初始输入。
如权利要求9所述的计算机存储介质，所述计算机可读指令还使处理器执行如下操作：

以待测语句和目标控制条件为所述LSTM解码器的输入数据，生成所述待测语句的相似语句，所述目标控制条件为所述待测语句的控制条件。
一种计算机设备，包括：处理器、存储器、通信接口和通信总线，所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信；

所述存储器用于存放至少一计算机可读指令，所述计算机可读指令使所述处理器执行如下操作：

获取初始文本数据；

根据预置BERT语言模型，计算所述初始文本数据的变分自编码器的隐藏空间参数；

以所述初始文本数据、所述隐藏空间参数和初始控制条件为输入数据，以在所述初始控制条件下与所述初始文本数据相对应的控制语句为输出数据，采用时序性倒传递算法，修正训练长短期记忆网络LSTM解码器的权重，以训练所述LSTM解码器；

以待测语句和目标控制条件为所述LSTM解码器的输入数据，生成所述待测语句的目标语句。
如权利要求15所述的计算机设备，所述计算机可读指令还使处理器执行如下操作：

根据预置BERT语言模型，将所述初始文本数据通过所述变分自编码器映射到隐藏空间，获取所述隐藏空间的隐藏空间参数；

在所述隐藏空间进行高斯重采样，重构所述隐藏空间参数。
如权利要求16所述的计算机设备，所述计算机可读指令还使处理器执行如下操作：

以所述初始文本数据为所述预置BERT语言模型的输入，获取所述初始文本数据中各个句子的句向量，所述句向量包括字向量和位置向量；

以所述句向量为变分自编码器的学习参数，将所述初始文本数据映射到隐藏空间，所述隐藏空间是正态分布空间；

查找所述隐藏空间的隐藏空间参数，所述隐藏空间参数包括所述初始文本数据的参数均值和标准差。
如权利要求16所述的计算机设备，所述计算机可读指令还使处理器执行如下操作：

获取所述隐藏空间的空间维度；

按照所述空间维度，拼接所述隐藏空间参数和所述初始控制条件，生成所述LSTM解码器的隐藏初始输入；

以所述隐藏初始输入和所述初始文本数据为输入数据，以在所述初始控制条件下与所述初始文本数据相对应的控制语句为输出数据，采用时序性倒传递算法，修正训练长短期记忆网络LSTM解码器的权重，以训练所述LSTM解码器。
如权利要求18所述的计算机设备，所述计算机可读指令还使处理器执行如下操作：

将所述隐藏空间参数，映射到隐藏张量；

将所述初始控制条件转换为意图张量，所述意图张量的意图维度与所述隐藏张量的维度相同；

拼接所述隐藏张量和所述意图张量，生成所述LSTM解码器的隐藏初始输入。
如权利要求15所述的计算机设备，所述计算机可读指令还使处理器执行如下操作：

以待测语句和目标控制条件为所述LSTM解码器的输入数据，生成所述待测语句的相似语句，所述目标控制条件为所述待测语句的控制条件。