WO2019052311A1

WO2019052311A1 - 风格语句的生成方法、模型训练方法、装置及计算机设备

Info

Publication number: WO2019052311A1
Application number: PCT/CN2018/101180
Authority: WO
Inventors: 刘晓江
Original assignee: 腾讯科技（深圳）有限公司
Priority date: 2017-09-12
Filing date: 2018-08-17
Publication date: 2019-03-21
Also published as: US11869485B2; CN108304436B; CN108304436A; US11348570B2; US20200035220A1; US20220262346A1

Abstract

本申请公开了一种风格语句的生成方法、模型训练方法、装置及计算机设备，属于自然语言处理领域。所述方法包括：获取待转换的自然语句；将所述自然语句输入第一编码模型对所述自然语句中的风格信息进行过滤，生成所述自然语句对应的目标内容向量；根据设置的目标语言风格，从至少一种风格向量中确定与所述目标语言风格相对应的目标风格向量，将所述目标内容向量和所述目标风格向量输入第一解码模型，生成与所述自然语句对应的风格语句；保证了每种自然语句都能较为准确的转换成具有目标语言风格的风格语句，提高了计算机设备在风格转化时的智能化程度。

Description

风格语句的生成方法、模型训练方法、装置及计算机设备

本申请要求于2017年09月12日提交中国国家知识产权局、申请号为201710817322.9、发明名称为“风格语句的生成方法、模型的训练方法、装置及设备”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请实施例涉及自然语言处理领域，特别涉及一种风格语句的生成方法、模型训练方法、装置及计算机设备。

背景技术

智能对话系统用于根据用户输入的聊天内容自动生成对应的对话语句，从而实现人与机器之间的对话。目前，智能对话系统提供有不同的语言风格供用户选择，智能对话系统根据用户选择的语言风格，可以生成具有该语言风格的风格语句。其中，语言风格用于指示表达具有某一含义的自然语句的特定表达方式，比如：语言风格为清新淡雅、明快浅显、辞藻华丽、委婉含蓄、多用口语等。

在一种生成对话语句的方法中，智能对话系统预设有平行语料库，该平行预料库中包括多组句子对，每组句子对中的不同句子是具有相同含义、且具有不同语言风格的自然语句。

当智能对话系统需要生成具有某一语言风格的风格语句时，从平行语料库中查找具有该语言风格的自然语句，通过编码函数对该语言风格的自然语句进行编码得到语句向量，通过解码函数对该语句向量进行解码，生成具有该语言风格的风格语句。比如：当输入语句是“采用语言风格1表达的语义x”，将“采用语言风格1表达的语义X”通过编码函数进行编码得到语句向量X，语句向量X是与“语义x”对应的向量；若智能对话系统需要生成具有多用口语的语言风格的风格语句，则在从平行语料库中根据语句向量X查找出具有该语言风格的自然语句即可。

平行语料库可能不能穷尽某一自然语句的所有语言风格，比如：对于具有“语义x”的自然语句，当平行语料库不存在具有含蓄委婉的语言风格的自然语句，智能对话系统只能选择其它语言风格的自然语句，或者，选择具有该语言风格的其它自然语句进行语句生成，从而导致智能对话系统生成的风格语句不符合用户期望，风格转化的效果较差的问题。

发明内容

本申请实施例提供了一种风格语句的生成方法、模型训练方法、装置及计算机设备，可以解决平行语料库中不存在具有用户选择的目标语言风格的自然语句时，导致无法准确生成具有该目标语言风格的风格语句的问题。所述技术方案如下：

根据本申请的一个方面，提供了一种风格语句的生成方法，所述方法由计算机设备执行，所述方法包括：

获取待转换的自然语句；

将所述自然语句输入第一编码模型对所述自然语句中的风格信息进行过滤，生成所述自然语句对应的目标内容向量，所述目标内容向量用于指示所述自然语句的含义，所述风格信息用于指示所述自然语句的语言风格；

根据设置的目标语言风格，从至少一种风格向量中确定与所述目标语言风格相对应的目标风格向量，其中，所述至少一种风格向量中的每种风格向量对应一种语言风格；

将所述目标内容向量和所述目标风格向量输入第一解码模型，生成与所述自然语句对应的风格语句。

根据本申请的另一方面，提供了一种模型训练方法，所述方法由计算机设备执行，所述模型包括第一编码模型和第一解码模型，所述方法包括：

将语料库中的至少两种自然训练语句输入训练模型，通过所述训练模型对第二编码模型的分类能力进行训练得到所述第一编码模型，每种所述自然训练语句对应一种语言风格，所述分类能力是指将输入的所述自然训练语句分类为对应的内容向量和风格向量的能力；

在训练得到所述第一编码模型时，获取所述第一编码模型输出的至少一种风格向量，每种所述风格向量是所述第一编码模型根据对应语言风格的所述自然训练语句进行分类得到的；

在所述至少两种自然训练语句输入所述训练模型时，通过所述训练模型对第二解码模型的还原能力进行训练得到所述第一解码模型，所述还原能力是指根据所述内容向量和所述风格向量还原出所述自然训练语句的能力；

其中，所述内容向量用于指示所述自然训练语句的含义，所述风格向量用于指示所述自然训练语句的语言风格。

根据本申请的另一方面，提供了一种风格语句的生成装置，所述装置包括：

获取模块，用于获取待转换的自然语句；

第一生成模块，用于将所述自然语句输入第一编码模型对所述自然语句中的风格信息进行过滤，生成所述自然语句对应的目标内容向量，所述目标内容向量用于指示所述自然语句的含义，所述风格信息用于指示所述自然语句的语言风格；

确定模块，用于根据设置的目标语言风格，从至少一种风格向量中确定与所述目标语言风格相对应的目标风格向量，其中，所述至少一种风格向量中的每种风格向量对应一种语言风格；

第二生成模块，用于将所述目标内容向量和所述目标风格向量输入第一解码模型，生成与所述自然语句对应的风格语句。

根据本申请的另一方面，提供了一种模型训练装置，所述模型包括第一编码模型和第一解码模型，所述装置包括：

训练模块，用于将语料库中的至少两种自然训练语句输入训练模型，通过所述训练模型对第二编码模型的分类能力进行训练得到所述第一编码模型，每种所述自然训练语句对应一种语言风格，所述分类能力是指将输入的所述自然训练语句分类为对应的内容向量和风格向量的能力；

获取模块，用于在训练得到所述第一编码模型时，获取所述第一编码模型输出的至少一种风格向量，每种所述风格向量是所述第一编码模型根据对应语言风格的所述自然训练语句进行分类得到的；

所述训练模块，还用于在所述至少两种自然训练语句输入所述训练模型时，通过所述训练模型对第二解码模型的还原能力进行训练得到所述第一解码模型，所述还原能力是指根据所述内容向量和所述风格向量还原出所述自然训练语句的能力；

根据本申请的另一方面，提供了一种计算机设备，所述计算机设备包括第一编码模型和第一解码模型；

所述第一编码模型，用于对输入的自然语句的风格信息进行过滤，得到所述自然语句对应的目标内容向量；所述目标内容向量用于指示所述自然语句的含义，所述风格信息用于指示所述自然语句的语言风格；

所述第一解码模型，用于对输入的目标风格向量和所述目标内容向量进行融合，得到所述自然语句对应的风格语句；所述目标风格向量是所述计算机设备的至少一种风格向量中，与设置的目标语言风格对应的风格向量，所述至少一种风格向量中的每种风格向量对应一种语言风格。

根据本申请的另一方面，提供了一种计算机设备，所述计算机设备包括处理器和存储器，所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如上所述的风格语句的生成方法，或者，模型训练方法。

根据本申请的另一方面，提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如上所述的风格语句的生成方法，或者，模型训练方法。

本发明实施例提供的技术方案带来的有益效果至少包括：

通过第一编码模型对自然语句进行分类，得到具有尽可能少的风格信息的内容向量；再通过第一解码模型将该内容向量与训练过程中得到的目标风格向量进行编码得到风格语句，实现了内容向量和风格向量的分离。从而解决了当平行语料库中不存在用户选择的语言风格的自然语句时，计算机设备可能无法生成符合用户期望的具有目标语言风格的风格语句的问题；由于计算机设备中存储有每种语言风格对应的风格向量，第一解码模型能够从存储的多个风格向量中确定出目标语言风格对应的目标风格向量，并根据该目标风格向量与内容向量生成风格语句，因此，保证了每种自然语句都能转换成具有目标语言风格的风格语句，提高了计算机设备在风格转化时的智能化程度。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请一个示例性实施例提供的训练模型的示意图；

图2是本申请一个示例性实施例提供的计算机设备的示意图；

图3是本申请另一个示例性实施例提供的模型训练方法的流程图；

图4是本申请另一个示例性实施例提供的模型训练方法的示意图；

图5是本申请一个示例性实施例提供的风格语句的生成方法的流程图；

图6是本申请另一个示例性实施例提供的风格语句的生成方法的流程图；

图7是本申请一个示例性实施例提供的风格语句的生成装置的框图；

图8是本申请一个示例性实施例提供的模型训练装置的框图；

图9是本申请一个示例性实施例提供的计算机设备的结构示意图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚，下面将结合附图对本发明实施方式作进一步地详细描述。

首先，对本申请涉及的若干个名词进行介绍。

语言风格：表达具有某一含义的自然语句的特定表达方式，比如：语言风格包括清新淡雅、明快浅显、辞藻华丽、委婉含蓄、多用口语等。同一含义的自然语句可以有多种特定表达方式，每种特定表达方式对应一种类型的语言风格。

比如：对于表达含义为“语义x”的自然语句，语言风格为明快浅显的自然语句为：采用语言风格1表达的语义x；语言风格为辞藻华丽的自然语句为：采用语言风格2表达的语义x；语言风格为委婉含蓄的自然语句为：采用语言风格3表达的语义x；语言风格为多用口语的自然语句为：采用语言风格4表达的语义x。

当然，语言风格的划分方式还可以为其它方式，比如：语言风格的划分为诗意、古典、文艺等，本实施例不对语言风格的划分方式作限定。

平行语料库：包括多组句子对，每组句子对中包括多个句子。每组句子对中的不同句子具有相同的含义，且具有不同的语言风格。

可选地，平行语料库也可称为对话语料库、个性化对话语料库等，本实施例不对平行语料库的具体名称作限定。

相关技术中，智能对话系统根据目标语言风格，在平行语料库中查找具有该目标语言风格的自然语句来生成风格语句。

比如：目标语言风格为委婉含蓄，智能对话系统需要生成具有“语义x”的风格语句，则语言系统在平行语料库中查找到采用委婉含蓄风格对语义x进行表达的自然语句1，根据自然语句1生成风格语句。但在平行语料库中不存在采用委婉含蓄风格对语义x进行表达的自然语句1时，则智能对话系统查找具有委婉含蓄的语言风格的其它自然语句2，或者，智能对话系统查找具有相同含义、但具有其它语言风格的自然语句3，根据这些自然语句2和自然语句3来生成风格语句。最终生成的风格语句可能脱离了原本的语义x，也可能实际语言风格与目标语言风格不符，也即无法准确生成具有目标语言风格的语句。

基于上述技术问题，本申请提供了如下技术方案，通过预先训练出每种语言风格对应的风格向量，再将语料库中的自然语句中的风格信息过滤，将过滤后得到的内容向量与风格向量进行编码得到风格语句，使得语言系统不再依赖于平行语料库中的已有风格语句来生成风格语句，并能够为所有自然语句添加目标语言风格，提高了计算机设备在风格转化时的智能化程度。

内容向量用于指示自然语句的含义(或者说语义)。可选地，内容向量通过i维数组表示，i为正整数。

风格向量用于指示自然语句的语言风格。可选地，风格向量通过j维数组表示，j为正整数。每个风格向量对应一种语言风格。本实施例对语言风格的划分方式不加以限定，每个语种和/或使用场景可以具有不同的语言风格。

可选地，本申请以各个实施例的执行主体为计算机设备为例进行说明，该计算机设备可以实现成为智能对话系统、风格转化系统、文字聊天机器人中的至少一种，本申请对该计算机设备的实际产品形式不加以限定。该计算机设备可以安装在服务器中；或者，也可以安装在终端中，本实施例对此不作限定。其中，计算机设备可以为手机、平板电脑、膝上型便携计算机和台式计算机等。在一些实施例中，本申请实施例中的风格语句的转换方法可以实现成为手机中的游戏助手，或者，游戏程序中的不同角色模型的自动聊天功能。

下面对本申请所涉及的训练模型(参考图1)和使用过程中的计算机设备(参考图2)分别进行介绍。

图1是本申请一个示例性实施例提供的训练模型的示意图。该训练模型包括：第一子模型110和第二子模型120。

第一子模型110根据监督模型111创建(或训练)得到；第二子模型120根据编码模型121和解码模型122创建(或训练)得到。

在对编码模型121和解码模型122进行训练时，将语料库中具有至少两种语言风格的自然训练语句(图1中通过x和y来表示)输入编码模型121，编码模型121对每种自然训练语句进行分类得到每种自然训练语句对应的内容向量(图1中通过e(x)和e(y)来表示)和风格向量(图1中通过v _x和v _y来表示)。

编码模型121的输出结果作为监督模型111的输入，第一子模型110通过监督模型111的监督能力判断输入的具有相同含义的至少两个内容向量是否相似。

监督能力是指判断接收到的内容向量对应的语言风格的能力。由于输入监督模型111的至少两个内容向量是根据具有相同含义、且具有不同的语言风格的自然训练语句生成的。因此，当监督模型111能够根据输入的内容向量判断出对应的语言风格时，说明该内容向量中仍然具有风格信息，而具有不同语言风格的内容向量的相似度较低。因此，监督模型111输出的监督结果差异较大。此时，第一子模型110根据监督模型111输出的监督结果的差异，能够确定出具有相同含义的至少两个内容向量是否相似。

第一子模型110将判断结果(第一结果)反馈给第二子模型120中的编码模型121。编码模型121根据判断结果调节自身的模型参数，从而提高该编码模型121的分类能力。分类能力是指将输入的自然训练语句分类为对应的内容向量和风格向量的能力。

编码模型121还将分类得到的内容向量和风格向量输入至解码模型122。解码模型122用于根据内容向量和风格向量还原出具有某种语言风格的自然训练语句。比如：在图1中，解码模型121根据内容向量e(x)和风格向量v _x还原得到自然训练语句d _x(e(x))；解码模型121根据内容向量e(y)和风格向量v _y还原得到自然训练语句d _y(e(y))。

第二子模型120根据解码模型121的输出结果与输入编码模型121的自然训练语句是否相同的概率来判断解码模型121的还原能力。解码模型122根据第二子模型120的输出结果(第二结果)调节自身的模型参数，从而提高该解码模型122的还原能力。其中，还原能力是指根据内容向量和风格向量还原出自然训练语句的能力。

比如：第二子模型120根据d _x(e(x))与自然训练语句x之间相同的概率、根据d _y(e(y))与自然训练语句y之间相同的概率确定解码模型121的还原能力。

示意性地，第一子模型110通过下述公式表示：

其中，L _critic(X，Y)是指第一子模型的输出结果，即，输入的两个内容向量的相似度；X为语料库中具有第一语言风格的自然训练语句构成的集合，|X|为具有第一语言风格的自然训练语句的数量；Y为语料库中具有第二语言风格的自然训练语句构成的集合；|Y|为具有第二语言风格的自然训练语句构成的集合数量，其中，第一语言风格与第二语言风格不同；e(x)为编码模型121输出的具有第一语言风格的自然训练语句的内容向量，e(y)为解码模型122输出的具有第二语言风格的自然训练语句的内容向量；f(e(x))为监督模型111在输入为e(x)时输出的监督结果；f(e(y))为监督模型111在输入为e(y)时输出的监督结果。

示意性地，第二子模型120通过下述公式表示：

其中，L _cycle(X，Y)是指第二子模型的输出结果，即，输入的两个自然训练语句被还原的概率；d _x(e(x))是解码模型122的输入为e(x)和风格向量v _x时输出的解码结果；d _y(e(y))是解码模型122的输入为e(y)和风格向量v _y时输出的解码结果；p(d _x(e(x))＝x)为d _x(e(x))与自然训练语句x相同的概率；p(d _y(e(y))＝y)为d _y(e(y))与自然训练语句y相同的概率。

示意性地，训练模型通过下述公式表示：

L _transfer(X,Y)＝L _cycle(X，Y)-λL _critic(X，Y)

其中，L _transfer(X，Y)是指训练模型输出的训练结果，该训练结果用于反映编码模型121的分类能力和解码模型122的还原能力。其中，L _transfer(X，Y) 的数值大小与编码模型121的分类能力呈负相关关系，即，L _transfer(X，Y)越小，编码模型121的分类能力越好；L _transfer(X，Y)的数值大小与解码模型122的还原能力呈负相关关系，即，L _transfer(X，Y)越小，编码模型121的还原能力越好。λ为平衡因子，λ为小于1的正数，比如：λ＝0.9。可选地，λ的取值固定不变；或者，λ的取值根据L _cycle(X，Y)和/或L _critic(X，Y)的取值进行调整。

需要补充说明的是，上述公式仅是示意性的，各个公式在实际实现时可进行适应性变化。比如：当输入编码模型121的自然语句为3种时，各个公式中应当添加第三种自然语句对应的输出结果。

经过上述训练模型的训练后，能够得到分类能力较高的编码模型，下文中称为第一编码模型，相应地，将得到第一编码模型之前训练的编码模型称为第二编码模型；以及，还原能力较高的解码模型，下文中称为第一解码模型，相应地，将得到第一解码模型之前训练的解码模型称为第二解码模型。

本实施例中，在训练得到第一编码模型的过程中，将最后一次训练时编码模型(即第一编码模型)输出的风格向量保存，作为在使用过程中用于为自然语句添加语言风格的风格向量。

图2是本申请一个示例性实施例提供的计算机设备的示意图。该计算机设备可以是智能对话系统，该计算机设备包括：第一编码模型210和第一解码模型220。

第一编码模型210是根据图1所示的训练模型对第二编码模型进行训练得到的。第一编码模型210用于对输入的自然语句进行分类，得到该自然语句对应的目标内容向量。第一编码模型210能够将输入的自然语句中的风格信息过滤，从而得到尽可能不包括风格信息的目标内容向量。其中，风格信息用于指示表达自然语句的语言风格。

第一编码模型210将输出的目标内容向量传递给第一解码模型220。

第一解码模型220是根据图1所示的训练模型对第二解码模型进行训练得到的。第一解码模型220从计算机设备存储的至少一种风格向量中，确定待转化的语言风格对应的目标风格向量，根据该目标风格向量和第一编码模型210传递的目标内容向量，生成与该自然语句对应的风格语句。

图3是本申请一个示例性实施例提供的模型训练方法的流程图。该模型训练方法用于图1所示的训练模型中，该模型训练方法可以由计算机设备来执行，该方法包括：

步骤301，将语料库中的至少两种自然训练语句输入训练模型，通过训练模型对第二编码模型的分类能力进行训练得到第一编码模型。

其中，至少两种自然训练语句中的每种自然训练语句对应一种语言风格。每种自然训练语句的数量为至少一句。在大部分情况下，同一种语言风格下的自然训练语句越多，则训练出的第一编码模型的分类能力越强。

示意性的，输入训练模型的自然训练语句包括：语言风格为委婉含蓄和多用口语的自然语句，其中，语言风格为委婉含蓄的自然语句的数量为5句，语言风格为多用口语的自然语句的数量也为5句。

分类能力是指将输入的自然训练语句分类为对应的内容向量和风格向量的能力。内容向量用于指示自然训练语句的含义，风格向量用于指示自然训练语句的语言风格。当第一编码模型的分类能力较强时，内容向量所携带的风格信息会尽可能地少。

步骤302，在训练得到第一编码模型时，获取第一编码模型输出的至少一种风格向量。

每种风格向量是第一编码模型根据对应语言风格的自然训练语句进行分类得到的。或者说，第i种风格向量是第一编码模型根据第i种语言风格的自然训练语句进行分类得到的。

步骤303，在至少两种自然训练语句输入训练模型时，通过训练模型对第二解码模型的还原能力进行训练得到第一解码模型。

还原能力是指根据内容向量和风格向量还原出自然训练语句的能力。

可选地，本实施例中，通过训练模型同时训练编码模型和解码模型，即，本步骤可以与步骤301同时执行。

可选地，训练模型包括第一子模型和第二子模型，第一子模型是根据预设的监督模型建立的，第一子模型用于根据监督模型的监督能力输出不同的内容向量之间的相似度，监督能力是指判断接收到的内容向量对应的语言风格的能力；第二子模型是根据第二编码模型和第二解码模型建立的，第二子模型用于根据第二解码模型和第二编码函数输出自然语句被还原的概率。

综上所述，本申请提供的模型训练方法，通过对编码模型的分类能力进行训练得到第一编码模型、对解码模型的还原能力进行训练得到第一解码模型，使得计算机设备在使用时，能够通过第一编码模型对自然语句进行分类，得到具有尽可能少的风格信息的内容向量；再通过第一解码模型将该内容向量与训练过程中得到的目标风格向量进行编码得到风格语句，解决了只能从平行语料中查找具有目标语言风格的自然语句，导致计算机设备可能无法生成符合用户期望的具有目标语言风格的风格语句的问题；由于计算机设备中存储有每种语言风格对应的风格向量，第一解码模型能够从存储的风格向量中确定出目标语言风格对应的目标风格向量，并根据该目标风格向量与内容向量生成风格语句，因此，保证了每种自然语句都能转换成具有目标语言风格的风格语句，提高了计算机设备在风格转化时的智能化程度。

下面对第一编码模型和第二编码模型的训练过程进行详细介绍。

在一些实施例中，第一编码模型和第二编码模型的训练过程包括如下几个步骤：

1、将m组第一自然训练语句和第二自然训练语句输入第一子模型，对监督模型的监督能力进行训练。

其中，每组第一自然训练语句和第二自然训练语句是具有不同语言风格、且具有相同含义的自然训练语句。

比如：输入第一子模型的m组自然训练语句包括如下一组自然训练语句：

自然训练语句1“已读”、自然训练语句2“已审核过”、自然训练语句3“已阅”和自然训练语句4“已经看过了”。

显然，该组自然训练语句的含义相同，但语言风格不同。

可选地，m组第一自然训练语句和第二自然训练语句分别来源于语料库中对应语言风格的语言集合，即，第一自然训练语句来源于第一自然训练语句对应的语言风格集合，第二自然训练语句来源于第二自然训练语句对应的语言风格集合。第一自然训练语句对应的语言风格集合与第二自然训练语句对应的语言风格集合不同。

比如：在上例中，自然训练语句1“已读”来源于明快浅显集合、自然训练语句2“已审核过”来源于辞藻华丽集合、自然训练语句3“已阅”来源于委婉含蓄集合、自然训练语句4“已经看过了”来源于多用口语集合。

需要补充说明的是，输入第一子模型的自然训练语句为至少两种，本实施例中仅以第一自然训练语句和第二自然训练语句为例进行说明，在实际实现时，若输入第一子模型的自然训练语句为至少三种，则不同的两种自然训练语句中，其中一种为第一自然训练语句，另一种为第二自然训练语句。

比如：输入第一子模型的自然训练语句包括三种不同的x、y、z，则对于x和y来说，当x为第一自然训练语句，y为第二自然训练语句；或者，当y为第一自然训练语句，x为第二自然训练语句。对于y和z来说，y为第一自然训练语句，z为第二自然训练语句；或者，当z为第一自然训练语句，y为第二自然训练语句。对于x和z来说，x为第一自然训练语句，z为第二自然训练语句；或者，当z为第一自然训练语句，x为第二自然训练语句。

其中，m为正整数。可选地，m的取值固定，比如：m为20句。

2、在训练次数达到预设次数时停止训练，得到训练后的监督模型。

可选地，训练次数由开发者设置，本实施例不对预设次数的数值作限定，比如：训练次数为10次、11次、1000次、10000次等。

可选地，在对监督模型进行训练时，监督模型会根据本次训练结果调整自身的模型参数，从而提高自身的监督能力。可选地，监督模型会根据本次训练结果按照误差反向传播算法调整自身的模型参数。

可选地，在对监督模型进行训练时，本次训练时输入的m组第一自然训练语句和第二自然训练语句与前几次训练时输入的m组第一自然训练语句和第二自然训练语句均不同。

本实施例通过对监督模型进行训练，可以提高监督模型的监督能力，从而提高第一训练模型判断不同的内容向量的相似度的准确性，从而提高了训练模型判断第二编码模型的分类能力和第二解码模型的还原能力的准确性。

3、通过训练后的监督模型更新训练模型中的第一子模型。

训练模型中的第一子模型是根据训练后的监督模型得到的。

4、将n组第三自然训练语句和第四自然训练语句输入训练模型，对第二编码模型和第二解码模型进行训练，得到模型训练结果。

每组第三自然训练语句和第四自然训练语句是具有不同语言风格、且具有相同含义的自然训练语句。

第三自然训练语句与第一自然训练语句的相关介绍类似，第四自然训练语句的相关介绍与第二自然训练语句的相关介绍类似，详见步骤1，本实施例在此不作赘述。

模型训练结果包括：更新后的第一子模型输出的第一结果和第二子模型输出的第二结果。

第一结果用于指示具有相同含义的至少两个内容向量的相似度。第一结果的数值与第二编码模型的分类能力呈负相关关系，即，第一结果的数值越大，具有相同含义的至少两个内容向量的相似度越低，第二编码模型的分类能力越弱；第一结果的数值越小，具有相同含义的至少两个内容向量的相似度越高，第二编码模型的分类能力越强。

第二结果用于指示第二解码模型的输出结果与输入第二编码模型的自然语句之间相同的概率。第二结果的数值与第二解码模型的还原能力呈正相关关系，即，第二结果的数值越大，第二解码模型的输出结果与输入第二解码模型的自然语句相同的概率越高，第二解码模型的还原能力越强；第二结果的数值越小，第二解码模型的输出结果与输入第二编码模型的自然语句之间相同的概率越小，第二解码模型的分类能力越弱。

其中，n为正整数。可选地，n的取值固定，比如：n为20句。可选地，n与m的值相同或者不同。

可选地，参考图4，本步骤包括如下几个子步骤：

41、将n组第三自然训练语句和第四自然训练语句输入第二编码模型进行分类，得到每组第三自然训练语句对应的风格向量和内容向量，每组第四自然训练语句对应的风格向量和内容向量。

第二编码模型的分类能力越强，则分类得到的内容向量中包含的风格信息越少。

42、将同组第三自然训练语句对应的内容向量和第四自然训练语句对应的内容向量输入训练后的监督模型判断相似度，得到第三自然训练语句对应的内容向量和第四自然训练语句对应的内容向量之间的相似度。

其中，第三自然训练语句对应的内容向量和第四自然训练语句对应的内容向量之间的相似度，即为第一子模型得到的第一结果。

可选地，本实施例中，以第三自然训练语句对应的内容向量的监督结果与第四自然训练语句对应的内容向量的监督结果之间的差值来表示相似度。

43、将同组第三自然训练语句对应的内容向量和风格向量、第四自然训练语句对应的内容向量和风格向量输入第二解码模型进行还原，得到还原后的第三自然训练语句和还原后的第四自然训练语句。

44、当第三自然训练语句对应的内容向量和第四自然训练语句对应的内容向量之间的相似度、还原后的第三自然训练语句与第三自然训练语句相同的概率、还原后的第四自然训练语句与第四自然训练语句相同的概率在预设训练次数内保持不变(或变化范围小于预设条件)时，确定函数收敛，停止训练，得到第一编码模型和第一解码模型。

其中，还原后的第三自然训练语句与第三自然训练语句相同的概率、还原后的第四自然训练语句与第四自然训练语句相同的概率即为第二子模型输出的第二结果。

预设训练次数为至少两次，预设训练次数可以为3次、5次、100次、1000次、10000次等，本实施例不对预设训练次数的数值作限定。

可选地，当第三自然训练语句对应的内容向量和第四自然训练语句对应的内容向量之间的相似度在预设训练次数内存在变化；和/或，还原后的第三自然训练语句与第三自然训练语句相同的概率在预设训练次数内存在变化；和/或，还原后的第四自然训练语句与第四自然训练语句相同的概率在预设训练次数内存在变化时，根据第一结果调整第二编码模型中的模型参数，得到训练后的第二编码模型，根据第二结果调整第二解码模型中的模型参数，得到训练后的第二解码模型。

可选地，在最后一次训练得到第一编码模型和第一解码模型时，将最后一次训练过程中第一编码模型输出的至少一种风格向量存储，该至少一种风格向量用于在使用语言处理系统生成风格时，对输入的自然语句进行语言风格的转换。

5、在根据模型训练结果确定出函数模型收敛时停止训练，得到第一编码模型和第一解码模型。

6、在根据模型训练结果确定出函数模型不收敛时，再次执行步骤1，即，再次执行将m组第一自然训练语句和第二自然训练语句输入第一子模型对监督模型的监督能力进行训练的步骤。

综上所述，本实施例通过对监督模型进行训练，可以提高监督模型的监督能力，从而提高第一训练模型判断不同的内容向量的相似度的准确性，从而提高了训练模型判断第二编码模型的分类能力和第二解码模型的还原能力的准确性。

可选地，语言处理系统也可以不对监督模型进行训练，即，不执行步骤1-3，本实施例对此不作限定。

可选地，在步骤1之前，计算机设备还对监督模型、第二编码模型和第二解码模型进行预训练。

对监督模型进行预训练包括：将相似度大于预设阈值的至少两个内容向量输入第一子模型；当第一子模型输出的第一结果与前p次预训练的第一结果不同时，调节监督模型中的模型参数；当第一子模型输出的第一结果与前p次预训练的第一结果相同时，得到预训练后的监督模型。此时，语言处理系统根据该预训练后的监督模型执行上述步骤1-6。

对第二编码模型和第二解码模型进行预训练包括：将至少一种预训练语句输入第二子模型；当第二子模型输出的第二结果与前q次预训练的第二结果不同时，调节第二编码模型和/或第二解码模型中的模型参数；当第二子模型输出的第二结果与前q次预训练的第二结果相同时，得到预训练后的第二编码模型和预训练后的第二解码模型。此时，语言处理系统根据该预训练后的第二编码模型和预训练后的第二解码模型执行上述步骤1-6。

综上所述，本实施例中，通过对监督模型、第二编码模型和第二解码模型进行预训练，能够得到监督模型、第二编码模型和第二解码模型中粗略的模型参数，避免了直接根据训练模型对第二编码模型和第二解码模型进行训练，训练次数过多，导致消耗过多资源的问题，提高了训练第二编码模型和第二解码模型的效率。

图5是本申请一个示例性实施例提供的风格语句的生成方法的流程图。该风格语句的生成方法用于图2所示的计算机设备中，该方法包括：

步骤501，获取待转换的自然语句。

可选地，待转换的自然语句为语言处理系统从语料库中选择的；或者，待转换的自然语句为用户输入的。

步骤502，将自然语句输入第一编码模型对自然语句中的风格信息进行过滤，生成自然语句对应的目标内容向量。

其中，第一编码模型是通过训练模型对第二编码模型进行训练得到的，训练模型用于训练第二编码模型的分类能力得到第一编码模型；分类能力是指将输入的自然语句分类为对应的内容向量和风格向量的能力。

目标内容向量用于指示自然语句的含义，风格信息用于指示自然语句的语言风格。

步骤503，根据设置的目标语言风格，从至少一种风格向量中确定与目标语言风格相对应的目标风格向量。

可选地，计算机设备提供有至少一种语言风格，计算机设备根据接收到的设置操作设置目标语言风格。可选地，设置操作是用户执行的。

其中，至少一种风格向量中的每种风格向量对应一种语言风格。此时，计算机设备提供的至少一种语言风格都存在对应的风格向量。

至少一种风格向量是在训练得到第一编码模型时，由第一编码模型对输入的具有语言风格的自然训练语句进行分类得到的，每种具有语言风格的自然训练语句对应至少一种风格向量中的一种风格向量。

步骤504，将目标内容向量和目标风格向量输入第一解码模型，生成与自然语句对应的风格语句。

其中，第一解码模型是通过训练模型对第二解码模型进行训练得到的；训练模型还用于训练第二解码模型的还原能力得到第一解码模型；还原能力是指根据内容向量和风格向量还原出自然语句的能力。

综上所述，本实施例提供的风格语句生成方法，通过第一编码模型对自然语句进行分类，得到具有尽可能少的风格信息的内容向量；再通过第一解码模型将该内容向量与训练过程中得到的目标风格向量进行编码得到风格语句，解决了只能从平行语料中查找具有目标语言风格的自然语句，导致计算机设备可能无法生成符合用户期望的具有目标语言风格的风格语句的问题；由于计算机设备中存储有每种语言风格对应的风格向量，第一解码模型能够从存储的风格向量中确定出目标语言风格对应的目标风格向量，并根据该目标风格向量与内容向量生成风格语句，因此，保证了每种自然语句都能转换成具有目标语言风格的风格语句，提高了计算机设备的智能化程度。

可选地，计算机设备还提供有由至少一种语言风格构成的语言风格的组合，比如：清新淡雅和明快浅显的语言风格的组合，若计算机设备中设置的目标语言风格为语言风格的组合时，计算机设备还能够生成语言风格融合后的风格语言。

参考图5，此时，参考图6，步骤503替换为如下几个步骤：

步骤5031，当设置的目标语言风格是至少两种语言风格的组合时，从至少一种风格向量中选择每种语言风格对应的风格向量，得到至少两种风格向量。

比如：目标语言风格为清新淡雅和明快浅显的语言风格的组合，则语言处理系统从至少一种风格向量中确定清新淡雅对应的风格向量和明快浅显对应的风格向量。

步骤5032，将至少两种风格向量进行融合得到目标风格向量。

计算机设备将至少两种风格向量进行融合得到目标风格向量，包括：确定至少两种风格向量的平均值，将平均值确定为目标风格向量。

比如：计算机设备计算清新淡雅对应的风格向量和明快浅显对应的风格向量的平均值，将该平均值确定为目标风格向量。

本实施例中，通过将不同的风格向量进行融合得到目标风格向量，扩展了语言处理系统提供的语言风格。

可选地，在上述实施例中，自然语句、自然训练语句和预训练语句均为语言处理系统的语料库中的语句。在语言处理系统的使用过程中，这些语句称为自然语句；在语言处理系统的训练过程中，这些语句称为自然训练语句；在语言处理系统的预训练过程中，这些语句称为预训练语句。

可选地，在上述实施例中，编码模型是基于时间递归(Long Short Term Memory，LSTM)神经网络创建的；或者，编码模型是基于门循环单元Gated Recurrent Unit，GRU)神经网络创建的；本实施例不对编码模型的类型作限定。其中，编码模型包括第一编码模型和第二编码模型。

可选地，在上述实施例中，解码模型是基于时间递归(Long Short Term Memory，LSTM)神经网络创建的；或者，解码模型是基于门循环单元Gated Recurrent Unit，GRU)神经网络创建的；本实施例不对解码模型的类型作限定。其中，解码模型包括第一解码模型和第二解码模型。

可选地，在上述实施例中，监督模型是基于时间递归(Long Short Term Memory，LSTM)神经网络创建的；或者，监督模型是基于门循环单元Gated Recurrent Unit，GRU)神经网络创建的；本实施例不对监督模型的类型作限定。

图7是本申请一个示例性实施例提供的风格语句的生成装置的框图。该装置可以通过软件、硬件或两者的结合实现成为计算机设备的全部或一部分。所述装置包括：获取模块710、第一生成模块720、确定模块730和第二生成模块740。

获取模块710，用于获取待转换的自然语句；

第一生成模块720，用于将所述自然语句输入第一编码模型对所述自然语句中的风格信息进行过滤，生成所述自然语句对应的目标内容向量，所述目标内容向量用于指示所述自然语句的含义，所述风格信息用于指示所述自然语句的语言风格；

确定模块730，用于根据设置的目标语言风格，从至少一种风格向量中确定与所述目标语言风格相对应的目标风格向量，其中，所述至少一种风格向量中的每种风格向量对应一种语言风格；

第二生成模块740，用于将所述目标内容向量和所述目标风格向量输入第一解码模型，生成与所述自然语句对应的风格语句。

可选地，所述至少一种风格向量是在训练得到所述第一编码模型时，由所述第一编码模型对输入的具有语言风格的自然训练语句进行分类得到的，每种具有语言风格的自然训练语句对应所述至少一种风格向量中的一种风格向量；

所述确定模块，包括：选择单元和融合单元。

选择单元，用于当设置的所述目标语言风格是至少两种语言风格的组合时，从所述至少一种风格向量中选择每种语言风格对应的风格向量，得到至少两种风格向量；

融合单元，用于将所述至少两种风格向量进行融合得到所述目标风格向量。

可选地，所述融合单元，还用于：

确定所述至少两种风格向量的平均值，将所述平均值确定为所述目标风格向量。

可选地，所述第一编码模型是通过训练模型对第二编码模型进行训练得到的；所述训练模型用于训练所述第二编码模型的分类能力得到所述第一编码模型；

所述第一解码模型是通过所述训练模型对第二解码模型进行训练得到的；所述训练模型还用于训练所述第二解码模型的还原能力得到所述第一解码模型；

其中，所述分类能力是指将输入的自然语句分类为对应的内容向量和风格向量的能力；所述还原能力是指根据所述内容向量和所述风格向量还原出所述自然语句的能力。

图8是本申请一个示例性实施例提供的模型训练装置的框图。该装置可以通过软件、硬件或两者的结合实现成为计算机设备的全部或一部分。所述模型包括第一编码模型和第一解码模型，所述装置包括：训练模块810和获取模块820。

训练模块810，用于将语料库中的至少两种自然训练语句输入训练模型，通过所述训练模型对第二编码模型的分类能力进行训练得到所述第一编码模型，每种所述自然训练语句对应一种语言风格，所述分类能力是指将输入的所述自然训练语句分类为对应的内容向量和风格向量的能力；

获取模块820，用于在训练得到所述第一编码模型时，获取所述第一编码模型输出的至少一种风格向量，每种所述风格向量是所述第一编码模型根据对应语言风格的所述自然训练语句进行分类得到的；

所述训练模块810，还用于在所述至少两种自然训练语句输入所述训练模型时，通过所述训练模型对第二解码模型的还原能力进行训练得到所述第一解码模型，所述还原能力是指根据所述内容向量和所述风格向量还原出所述自然训练语句的能力；

可选地，所述训练模型包括第一子模型和第二子模型，所述第一子模型是根据预设的监督模型建立的，所述第一子模型用于根据所述监督模型的监督能力输出不同的内容向量之间的相似度，所述监督能力是指判断接收到的内容向量对应的语言风格的能力；所述第二子模型是根据所述第二编码模型和所述第二解码模型建立的，所述第二子模型用于根据所述第二解码模型和所述第二编码函数输出所述自然语句被还原的概率。

可选地，所述训练模块810，包括：监督训练单元、第一生成单元、模型更新单元、模型训练单元和第二生成单元。

监督训练单元，用于将m组第一自然训练语句和第二自然训练语句输入所述第一子模型对所述监督模型的所述监督能力进行训练；每组所述第一自然训练语句和所述第二自然训练语句是具有不同语言风格、且具有相同含义的自然训练语句，所述m为正整数；

第一生成单元，用于在训练次数达到预设次数时停止训练，得到训练后的监督模型；

模型更新单元，用于通过所述训练后的监督模型更新所述训练模型中的所述第一子模型；

模型训练单元，用于将n组第三自然训练语句和第四自然训练语句输入所述训练模型对所述第二编码模型和所述第二解码模型进行训练，得到模型训练结果，每组所述第三自然训练语句和所述第四自然训练语句是具有不同语言风格、且具有相同含义的自然训练语句；所述模型训练结果包括更新后的第一子模型输出的第一结果和所述第二子模型输出的第二结果，所述n为正整数；

第二生成单元，用于在根据所述模型训练结果确定出函数模型收敛时停止训练，得到所述第一编码模型和所述第一解码模型，所述函数模型包括训练后的第二编码模型和训练后的第二解码模型。

可选地，所述模型训练单元，还用于：

将所述n组第三自然训练语句和第四自然训练语句输入所述第二编码模型进行分类，得到每组所述第三自然训练语句对应的风格向量和内容向量，每组所述第四自然训练语句对应的风格向量和内容向量；

将同组所述第三自然训练语句对应的内容向量和所述第四自然训练语句对应的内容向量输入所述训练后的监督模型判断相似度，得到所述第三自然训练语句对应的内容向量和所述第四自然训练语句对应的内容向量之间的相似度；

将同组所述第三自然训练语句对应的内容向量和风格向量、所述第四自然训练语句对应的内容向量和风格向量输入所述第二解码模型进行还原，得到还原后的第三自然训练语句和还原后的第四自然训练语句；

当所述第三自然训练语句对应的内容向量和所述第四自然训练语句对应的内容向量之间的相似度、所述还原后的第三自然训练语句与所述第三自然训练语句相同的概率、所述还原后的第四自然训练语句与所述第四自然训练语句相同的概率在预设训练次数内保持不变时，确定所述函数模型收敛停止训练，得到所述第一编码模型和所述第一解码模型。

可选地，所述监督训练单元，还用于：

在根据所述模型训练结果确定出所述函数模型不收敛时，继续执行所述将m组第一自然训练语句和第二自然训练语句输入所述第一子模型对所述监督模型的所述监督能力进行训练的步骤。

可选地，本申请实施例还提供了一种计算机可读存储介质，该存储介质中一种计算机可读存储介质，所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现上述各个方法实施例所述的风格语句的生成方法，或者，实现上述各个方法实施例所述的模型训练方法。

图9示出了本申请一个示例性实施例所涉及的计算机设备的结构示意图。该计算机设备安装有图1所示的训练模型和/或图2所示的第一编码模型和第一解码模型，该计算机设备包括：处理器911、存储器914和总线919。

处理器911包括一个或者一个以上处理核心，存储器914通过总线919与处理器911相连，存储器914用于存储程序指令，处理器911执行存储器914中的程序指令时实现上述各个方法实施例提供的风格语句的生成方法，或者，模型训练方法。

可选地，存储器914可以由任何类型的易失性或非易失性存储设备或者它们的组合实现，如静态随时存取存储器(SRAM)，电可擦除可编程只读存储器(EEPROM)，可擦除可编程只读存储器(EPROM)，可编程只读存储器(PROM)，只读存储器(ROM)，磁存储器，快闪存储器，磁盘或光盘。

上述结构示意仅为对计算机设备的示意性说明，计算机设备可以包括更多或更少的部件，比如计算机设备可以不包括发送器，或者，计算机设备还包括传感器、显示屏、电源等其它部件，本实施例不再赘述。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。

以上所述仅为本申请的较佳实施例，并不用以限制本申请，凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

Claims

一种风格语句的生成方法，所述方法由计算机设备执行，其特征在于，所述方法包括：

获取待转换的自然语句；

将所述自然语句输入第一编码模型对所述自然语句中的风格信息进行过滤，生成所述自然语句对应的目标内容向量，所述目标内容向量用于指示所述自然语句的含义，所述风格信息用于指示所述自然语句的语言风格；

根据设置的目标语言风格，从至少一种风格向量中确定与所述目标语言风格相对应的目标风格向量，其中，所述至少一种风格向量中的每种风格向量对应一种语言风格；

将所述目标内容向量和所述目标风格向量输入第一解码模型，生成与所述自然语句对应的风格语句。
根据权利要求1所述的方法，其特征在于，所述至少一种风格向量是在训练得到所述第一编码模型时，由所述第一编码模型对输入的具有语言风格的自然训练语句进行分类得到的，每种具有语言风格的自然训练语句对应所述至少一种风格向量中的一种风格向量；

所述根据设置的目标语言风格，从至少一种风格向量中确定与所述目标语言风格相对应的目标风格向量，包括：

当设置的所述目标语言风格是至少两种语言风格的组合时，从所述至少一种风格向量中选择每种语言风格对应的风格向量，得到至少两种风格向量；

将所述至少两种风格向量进行融合得到所述目标风格向量。
根据权利要求2所述的方法，其特征在于，所述将所述至少两种风格向量进行融合得到所述目标风格向量，包括：

确定所述至少两种风格向量的平均值，将所述平均值确定为所述目标风格向量。
根据权利要求1至3任一所述的方法，其特征在于，

所述第一编码模型是通过训练模型对第二编码模型进行训练得到的；所述训练模型用于训练所述第二编码模型的分类能力得到所述第一编码模型；

所述第一解码模型是通过所述训练模型对第二解码模型进行训练得到的；所述训练模型还用于训练所述第二解码模型的还原能力得到所述第一解码模型；

其中，所述分类能力是指将输入的自然语句分类为对应的内容向量和风格向量的能力；所述还原能力是指根据所述内容向量和所述风格向量还原出所述自然语句的能力。
一种模型训练方法，所述方法由计算机设备执行，其特征在于，所述模型包括第一编码模型和第一解码模型，所述方法包括：

将语料库中的至少两种自然训练语句输入训练模型，通过所述训练模型对第二编码模型的分类能力进行训练得到所述第一编码模型，每种所述自然训练语句对应一种语言风格，所述分类能力是指将输入的所述自然训练语句分类为对应的内容向量和风格向量的能力；

在训练得到所述第一编码模型时，获取所述第一编码模型输出的至少一种风格向量，每种所述风格向量是所述第一编码模型根据对应语言风格的所述自然训练语句进行分类得到的；

在所述至少两种自然训练语句输入所述训练模型时，通过所述训练模型对第二解码模型的还原能力进行训练得到所述第一解码模型，所述还原能力是指根据所述内容向量和所述风格向量还原出所述自然训练语句的能力；

其中，所述内容向量用于指示所述自然训练语句的含义，所述风格向量用于指示所述自然训练语句的语言风格。
根据权利要求5所述的方法，其特征在于，所述训练模型包括第一子模型和第二子模型，所述第一子模型是根据预设的监督模型建立的，所述第一子模型用于根据所述监督模型的监督能力输出不同的内容向量之间的相似度，所述监督能力是指判断接收到的内容向量对应的语言风格的能力；所述第二子模型是根据所述第二编码模型和所述第二解码模型建立的，所述第二子模型用于根据所述第二解码模型和所述第二编码函数输出所述自然语句被还原的概率。
根据权利要求6所述的方法，其特征在于，所述通过训练模型对第二编码模型进行训练得到所述第一编码模型；通过所述训练模型对第二解码模型进行训练得到所述第一解码模型，包括：

将m组第一自然训练语句和第二自然训练语句输入所述第一子模型对所述监督模型的所述监督能力进行训练；每组所述第一自然训练语句和所述第二自然训练语句是具有不同语言风格、且具有相同含义的自然训练语句，所述m为正整数；

在训练次数达到预设次数时停止训练，得到训练后的监督模型；

通过所述训练后的监督模型更新所述训练模型中的所述第一子模型；

将n组第三自然训练语句和第四自然训练语句输入所述训练模型对所述第二编码模型和所述第二解码模型进行训练，得到模型训练结果，每组所述第三自然训练语句和所述第四自然训练语句是具有不同语言风格、且具有相同含义的自然训练语句；所述模型训练结果包括更新后的第一子模型输出的第一结果和所述第二子模型输出的第二结果，所述n为正整数；

在根据所述模型训练结果确定出函数模型收敛时停止训练，得到所述第一编码模型和所述第一解码模型，所述函数模型包括训练后的第二编码模型和训练后的第二解码模型。
根据权利要求7所述的方法，其特征在于，所述将n组第三自然训练语句和第四自然训练语句输入所述训练模型对所述第二编码模型和所述第二解码模型进行训练，包括：

将所述n组第三自然训练语句和第四自然训练语句输入所述第二编码模型进行分类，得到每组所述第三自然训练语句对应的风格向量和内容向量，每组所述第四自然训练语句对应的风格向量和内容向量；

将同组所述第三自然训练语句对应的内容向量和所述第四自然训练语句对应的内容向量输入所述训练后的监督模型判断相似度，得到所述第三自然训练语句对应的内容向量和所述第四自然训练语句对应的内容向量之间的相似度；

将同组所述第三自然训练语句对应的内容向量和风格向量、所述第四自然训练语句对应的内容向量和风格向量输入所述第二解码模型进行还原，得到还原后的第三自然训练语句和还原后的第四自然训练语句；

当所述第三自然训练语句对应的内容向量和所述第四自然训练语句对应的内容向量之间的相似度、所述还原后的第三自然训练语句与所述第三自然训练语句相同的概率、所述还原后的第四自然训练语句与所述第四自然训练语句相同的概率在预设训练次数内保持不变时，确定所述函数模型收敛停止训练，得到所述第一编码模型和所述第一解码模型。
根据权利要求7所述的方法，其特征在于，所述将n组第三自然训练语句和第四自然训练语句输入所述训练模型对所述第二编码模型和所述第二解码模型进行训练之后，还包括：

在根据所述模型训练结果确定出所述函数模型不收敛时，继续执行所述将m组第一自然训练语句和第二自然训练语句输入所述第一子模型对所述监督模型的所述监督能力进行训练的步骤。
一种风格语句的生成装置，其特征在于，所述装置包括：

获取模块，用于获取待转换的自然语句；

第一生成模块，用于将所述自然语句输入第一编码模型对所述自然语句中的风格信息进行过滤，生成所述自然语句对应的目标内容向量，所述目标内容向量用于指示所述自然语句的含义，所述风格信息用于指示所述自然语句的语言风格；

确定模块，用于根据设置的目标语言风格，从至少一种风格向量中确定与所述目标语言风格相对应的目标风格向量，其中，所述至少一种风格向量中的每种风格向量对应一种语言风格；

第二生成模块，用于将所述目标内容向量和所述目标风格向量输入第一解码模型，生成与所述自然语句对应的风格语句。
根据权利要求10所述的装置，其特征在于，所述至少一种风格向量是在训练得到所述第一编码模型时，由所述第一编码模型对输入的具有语言风格的自然训练语句进行分类得到的，每种具有语言风格的自然训练语句对应所述至少一种风格向量中的一种风格向量；

所述确定模块，包括：选择单元和融合单元；

所述选择单元，用于当设置的所述目标语言风格是至少两种语言风格的组合时，从所述至少一种风格向量中选择每种语言风格对应的风格向量，得到至少两种风格向量；

所述融合单元，用于将所述至少两种风格向量进行融合得到所述目标风格向量。
根据权利要求10所述的装置，其特征在于，

所述融合单元，还用于确定所述至少两种风格向量的平均值，将所述平均值确定为所述目标风格向量。
根据权利要求10所述的装置，其特征在于，所述第一编码模型是通过训练模型对第二编码模型进行训练得到的；所述训练模型用于训练所述第二编码模型的分类能力得到所述第一编码模型；

所述第一解码模型是通过所述训练模型对第二解码模型进行训练得到的；所述训练模型还用于训练所述第二解码模型的还原能力得到所述第一解码模型；

其中，所述分类能力是指将输入的自然语句分类为对应的内容向量和风格向量的能力；所述还原能力是指根据所述内容向量和所述风格向量还原出所述自然语句的能力。
一种模型训练装置，其特征在于，所述模型包括第一编码模型和第一解码模型，所述装置包括：

训练模块，用于将语料库中的至少两种自然训练语句输入训练模型，通过所述训练模型对第二编码模型的分类能力进行训练得到所述第一编码模型，每种所述自然训练语句对应一种语言风格，所述分类能力是指将输入的所述自然训练语句分类为对应的内容向量和风格向量的能力；

获取模块，用于在训练得到所述第一编码模型时，获取所述第一编码模型输出的至少一种风格向量，每种所述风格向量是所述第一编码模型根据对应语言风格的所述自然训练语句进行分类得到的；

所述训练模块，还用于在所述至少两种自然训练语句输入所述训练模型时，通过所述训练模型对第二解码模型的还原能力进行训练得到所述第一解码模型，所述还原能力是指根据所述内容向量和所述风格向量还原出所述自然训练语句的能力；

其中，所述内容向量用于指示所述自然训练语句的含义，所述风格向量用于指示所述自然训练语句的语言风格。
根据权利要求14所述的装置，其特征在于，所述训练模型包括第一子模型和第二子模型；

所述第一子模型是根据预设的监督模型建立的，所述第一子模型用于根据所述监督模型的监督能力输出不同的内容向量之间的相似度，所述监督能力是指判断接收到的内容向量对应的语言风格的能力；

所述第二子模型是根据所述第二编码模型和所述第二解码模型建立的，所述第二子模型用于根据所述第二解码模型和所述第二编码函数输出所述自然语句被还原的概率。
根据权利要求14所述的装置，其特征在于，所述训练模块，包括：监督训练单元、第一生成单元、模型更新单元、模型训练单元和第二生成单元；

所述监督训练单元，用于将m组第一自然训练语句和第二自然训练语句输入所述第一子模型对所述监督模型的所述监督能力进行训练；每组所述第一自然训练语句和所述第二自然训练语句是具有不同语言风格、且具有相同含义的自然训练语句，所述m为正整数；

所述第一生成单元，用于在训练次数达到预设次数时停止训练，得到训练后的监督模型；

所述模型更新单元，用于通过所述训练后的监督模型更新所述训练模型中的所述第一子模型；

所述模型训练单元，用于将n组第三自然训练语句和第四自然训练语句输入所述训练模型对所述第二编码模型和所述第二解码模型进行训练，得到模型训练结果，每组所述第三自然训练语句和所述第四自然训练语句是具有不同语言风格、且具有相同含义的自然训练语句；所述模型训练结果包括更新后的第一子模型输出的第一结果和所述第二子模型输出的第二结果，所述n为正整数；

所述第二生成单元，用于在根据所述模型训练结果确定出函数模型收敛时停止训练，得到所述第一编码模型和所述第一解码模型，所述函数模型包括训练后的第二编码模型和训练后的第二解码模型。
根据权利要求16所述的装置，其特征在于，所述模型训练单元，还用于：

将所述n组第三自然训练语句和第四自然训练语句输入所述第二编码模型进行分类，得到每组所述第三自然训练语句对应的风格向量和内容向量，每组所述第四自然训练语句对应的风格向量和内容向量；

将同组所述第三自然训练语句对应的内容向量和所述第四自然训练语句对应的内容向量输入所述训练后的监督模型判断相似度，得到所述第三自然训练语句对应的内容向量和所述第四自然训练语句对应的内容向量之间的相似度；

将同组所述第三自然训练语句对应的内容向量和风格向量、所述第四自然训练语句对应的内容向量和风格向量输入所述第二解码模型进行还原，得到还原后的第三自然训练语句和还原后的第四自然训练语句；

当所述第三自然训练语句对应的内容向量和所述第四自然训练语句对应的内容向量之间的相似度、所述还原后的第三自然训练语句与所述第三自然训练语句相同的概率、所述还原后的第四自然训练语句与所述第四自然训练语句相同的概率在预设训练次数内保持不变时，确定所述函数模型收敛停止训练，得到所述第一编码模型和所述第一解码模型。
根据权利要求16所述的装置，其特征在于，所述监督训练单元，还用于：

在根据所述模型训练结果确定出所述函数模型不收敛时，继续执行所述将m组第一自然训练语句和第二自然训练语句输入所述第一子模型对所述监督模型的所述监督能力进行训练的步骤。
一种计算机设备，其特征在于，所述计算机设备包括第一编码模型和第一解码模型；

所述第一编码模型，用于对输入的自然语句的风格信息进行过滤，得到所述自然语句对应的目标内容向量；所述目标内容向量用于指示所述自然语句的含义，所述风格信息用于指示所述自然语句的语言风格；

所述第一解码模型，用于对输入的目标风格向量和所述目标内容向量进行融合，得到所述自然语句对应的风格语句；所述目标风格向量是所述计算机设备的至少一种风格向量中，与设置的目标语言风格对应的风格向量，所述至少一种风格向量中的每种风格向量对应一种语言风格。
一种计算机设备，其特征在于，所述计算机设备包括处理器和存储器，所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如如权利要求1至4任一所述的风格语句的生成方法，或者，权利要求5至9任一所述的模型训练方法。
一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如权利要求1至4任一所述的风格语句的生成方法，或者，权利要求5至9任一所述的模型训练方法。