WO2020151690A1

WO2020151690A1 - 语句生成方法、装置、设备及存储介质

Info

Publication number: WO2020151690A1
Application number: PCT/CN2020/073407
Authority: WO
Inventors: 谭翊章; 丁佳晨; 缪畅宇
Original assignee: 腾讯科技（深圳）有限公司
Priority date: 2019-01-24
Filing date: 2020-01-21
Publication date: 2020-07-30
Also published as: US20210232751A1; JP2022500808A; JP7290730B2; CN110162604B; CN110162604A

Abstract

一种语句生成方法、装置、设备及存储介质，包括：获取输入序列；对输入序列进行编码处理得到语句特征向量；对语句特征向量进行解码得到第一预定数量的候选语句序列；对第一预定数量的候选语句序列进行聚类得到至少两类语句序列集合；从至少两类语句序列集合中筛选出第二预定数量的候选语句序列，第二预定数量的候选语句序列包括至少两种语句特征类型；根据第二预定数量的候选语句序列，确定输入序列对应的输出序列。

Description

语句生成方法、装置、设备及存储介质

本申请要求于2019年01月24日提交中国专利局，申请号为2019100689873，申请名称为“语句生成方法、装置、设备及存储介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请实施例涉及人工智能领域，特别涉及一种语句生成方法、装置、设备及存储介质。

背景技术

语句生成方法可以用于任何功能的对话系统、机器翻译系统、问答系统、自动写作系统、阅读理解系统中，尤其适用于需要大信息量以及多样性的对话系统中。

基于深度学习的语句生成方法是当前发展的方向，在获取到用户输入的语句序列后，其生成输出序列的方法包括：将输入的语句序列编码成向量；对向量进行解码得到输出序列。

上述方法在生成输出序列的过程中，还不能有效的处理输入的语句序列，导致生成的语句不够准确。

发明内容

根据本申请提供的各种实施例，提供了一种语句生成方法、装置、设备及存储介质。具体技术方案如下：

一种语句生成方法，由电子设备执行，方法包括：

获取输入序列；

对输入序列进行编码处理得到语句特征向量，语句特征向量为输入序列的表示；

对语句特征向量进行解码得到第一预定数量的候选语句序列；

对第一预定数量的候选语句序列进行聚类得到至少两类语句序列集合；

从至少两类语句序列集合中筛选出第二预定数量的候选语句序列，第二预定数量的候选语句序列包括至少两种语句特征类型，第二预定数量小于第一预定数量；及

根据第二预定数量的候选语句序列，确定输入序列对应的输出序列。

一种语句生成装置，装置包括：

获取模块，用于获取输入序列；

编码模块，用于对输入序列进行编码处理得到语句特征向量，语句特征向量为输入序列的表示；

解码模块，用于对语句特征向量进行解码得到第一预定数量的候选语句序列；

聚类模块，用于对第一预定数量的候选语句序列进行聚类得到至少两类语句序列集合；

筛选模块，用于从至少两类语句序列集合中筛选出第二预定数量的候选语句序列，第二预定数量的候选语句序列包括至少两种语句特征类型，第二预定数量小于第一预定数量；及

确定模块，用于根据第二预定数量的候选语句序列，确定输入序列对应的输出序列。

一种电子设备，电子设备包括一个或多个处理器和存储器，存储器中存储有至少一条计算机可读指令、至少一段程序、代码集或计算机可读指令集，至少一条计算机可读指令、至少一段程序、代码集或计算机可读指令集由一个或多个处理器加载并执行以实现如上述第一方面的语句生成方法。

一个或多个计算机可读存储介质，计算机可读存储介质中存储有至少一条计算机可读指令、至少一段程序、代码集或计算机可读指令集，至少一条计算机可读指令、至少一段程序、代码集或计算机可读指令集由一个或多个处理器加载并执行以实现如上述第一方面的语句生成方法。

本申请的一个或多个实施例的细节在下面的附图和描述中提出。基于本申请的说明书、附图以及权利要求书，本申请的其它特征、目的和优点将变得更加明显。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请一个示意性实施例提供的应用场景的结构示意图；

图2是本申请一个示意性实施例提供的电子设备的硬件结构示意图；

图3是本申请一个示意性实施例提供的语句生成方法的流程图；

图4是本申请另一个示意性实施例提供的语句生成方法的流程图；

图5是本申请一个示意性实施例提供的语句生成方法涉及的原理示意图；

图6是本申请另一个示意性实施例提供的语句生成方法的流程图；

图7是本申请另一个示意性实施例提供的语句生成方法的流程图；

图8是本申请一个示意性实施例提供的语句生成装置的结构示意图；

图9是本申请一个示意性实施例提供的终端的结构示意图；及

图10是本申请一个示意性实施例提供的服务器的结构示意图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚，下面将结合附图对本申请实施方式作进一步地详细描述。

首先，对本申请实施例涉及到的一些名词进行解释：

解码：在自然语言处理中是根据输入数据逐字生成语句的处理过程。

聚类：是采用聚类算法将多个数据聚合成至少两个不同类别的集合的处理过程。

在一个实施例中，聚类算法包括K均值聚类算法、均值漂移聚类算法、基于密度的聚类算法、用高斯混合模型的最大期望聚类算法、凝聚层次聚类算法中的至少一种。

语句评分模型：是一种用于根据输入的语句序列确定该语句序列的语句评分的数学模型。

在一个实施例中，该语句评分模型用于衡量一个语句序列是否是自然语言。

在一个实施例中，语句评分模型包括但不限于：深度神经网络(Deep Neural Network，DNN)模型、循环神经网络(Recurrent Neural Networks，RNN)模型、嵌入(embedding)模型、梯度提升决策树(Gradient Boosting Decision Tree，GBDT)模型、逻辑回归(Logistic Regression，LR)模型中的至少一种。

DNN模型是一种深度学习框架。DNN模型包括输入层、至少一层隐层(或称，中间层)和输出层。可选地，输入层、至少一层隐层(或称，中间层)和输出层均包括至少一个神经元，神经元用于对接收到的数据进行处理。可选地，不同层之间的神经元的数量可以相同；或者，也可以不同。

RNN模型是一种具有反馈结构的神经网络。在RNN模型中，神经元的输出可以在下一个时间戳直接作用到自身，即，第i层神经元在m时刻的输入，除了(i-1)层神经元在该时刻的输出外，还包括其自身在(m-1)时刻的输出。

embedding模型是基于实体和关系分布式向量表示，将每个三元组实例中的关系看作从实体头到实体尾的翻译。其中，三元组实例包括主体、关系、客体，三元组实例可以表示成(主体，关系，客体)；主体为实体头，客体为实体尾。比如：小张的爸爸是大张，则通过三元组实例表示为(小张，爸爸，大张)。

GBDT模型是一种迭代的决策树算法，该算法由多棵决策树组成，所有树的结果累加起来作为最终结果。决策树的每个节点都会得到一个预测值，以年龄为例，预测值为属于年龄对应的节点的所有人年龄的平均值。

LR模型是指在线性回归的基础上，套用一个逻辑函数建立的模型。

集束搜索(英文：beam search)：是一种启发式图搜索算法。在自然语言解码过程中，集束搜索为搜索当前已得到的语句序列集合(也称：语句束)，来得到最终生成的输出序列的过程。

集束大小(beams size，BS)：为beam search算法中限制语句束的个数。

目前的解码技术都是基于beam search进行的，并没有体现语句内容的差异性，从而在多次解码后往往会使得所有的候选语句序列趋向于同一类别，通常都是安全的输出序列，即语句通顺但信息量缺乏的输出序列，比如“呵呵”、“说得对”等等输出序列。

而本申请实施例提供了一种语句生成方法、装置、设备及存储介质，通过对输入序列进行编码处理得到语句特征向量，对语句特征向量进行解码处理得到第一预定数量的候选语句序列，对第一预定数量的候选语句序列进行聚类和筛选得到第二预定数量的候选语句序列，使得产生的多个候选语句序列包括至少两种语句特征类型，从而使得基于第二预定数量的候选语句序列生成的输出序列存在较大的多样性，避免了相关技术中对话系统输出的输出序列均为安全的输出序列的情况，能够有效地满足用户需求，提高语句生成的准确性。

为便于对本申请实施例提供的技术方案的理解，首先结合图1介绍一下本申请一个示意性实施例提供的应用场景的结构示意图。

该应用场景包括输入对象100和基于深度学习的电子设备200(后文简称电子设备)，其中电子设备200用于执行下述语句生成过程：获取输入对象100的输入序列，然后对该输入序列进行响应，生成输出序列，并将输出序列呈现给该输入对象100。

在一个实施例中，输入序列为输入的待处理的语句序列，输出序列为输出的处理完成的语句序列。

在一个实施例中，该语句生成方法应用于对话系统、机器翻译系统、问答系统、自动写作系统或者阅读理解系统中。对话系统是从互联网或本地数据库中获取与用户输入的待回复语句所对应的回复语句。机器翻译系统是从互联网或本地数据库中获取与用户输入的待翻译语句所对应的翻译语句。问答系统是从互联网或本地数据库中获取与用户输入的问题语句所对应的答案语句。自动写作系统是在互联网或本地数据库中获取与用户输入的用于描述主题的主题语句所对应的内容语句。阅读理解系统是在用户提供的阅读材料中进行查询以获取与用户输入的题目语句所对应的答案语句。

当语句生成方法应用于对话系统中时，输入序列为待回复语句，输出序列为回复语句。

当语句生成方法应用于机器翻译系统中时，输入序列为待翻译的第一语言类型的语句，输出序列为翻译后的第二语言类型的语句，其中第一语言类型不同于第二语言类型。示意性的，第一语言类型为英文，第二语言类型为中文。

当语句生成方法应用于问答系统中时，输入序列为问题语句，输出序列为答案语句。

当语句生成方法应用于自动写作系统中时，输入序列为主题语句，输出序列为内容语句。

当语句生成方法应用于阅读理解系统中时，输入序列为题目语句，输出序列为答案语句。

在一种实现方式中，输入对象100可以是人，电子设备200可以是手机、电脑等终端，人与终端之间实现上述语句生成过程。

在一个实施例中，电子设备200中安装有第一应用程序，第一应用程序是具有语句生成功能的应用程序。示意性的，第一应用程序为具有问答、信息自动回复、机器翻译等功能的应用程序。

比如，用户通过文字或者语音输入向第一应用程序提问(输入序列)，第一应用程序根据用户的问题生成答案(输出序列)并显示出来。

在另一种实现方式中，输入对象100可以是客户端，电子设备200是服务器，客户端和服务器之间实现上述语句生成过程。其中，客户端包括但不限于手机、电脑等，服务器可以是能够提供各种不同服务的服务器，服务器包括但不限于天气查询、业务咨询、智能客服(用于机票服务或餐馆服务等)等。

图2为本申请一个示意性实施例提供的电子设备的硬件结构示意图。如图2所示，电子设备包括一个或多个处理器10、存储器20以及通信接口30。本领域技术人员可以理解，图2中示出的结构并不构成对该电子设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。其中：

一个或多个处理器10是电子设备的控制中心，利用各种接口和线路连接整个电子设备的各个部分，通过运行或执行存储在存储器20内的软件程序和/或模块，以及调用存储在存储器20内的数据，执行电子设备的各种功能和处理数据，从而对电子设备进行整体控制。一个或多个处理器10可以由CPU实现，也可以由图形一个或多个处理器(英文Graphics Processing Unit，简写GPU)实现。

存储器20可用于存储软件程序以及模块。一个或多个处理器10通过运行存储在存储器20的软件程序以及模块，从而执行各种功能应用以及数据处理。存储器20可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统21、获取模块22、编码模块23、解码模块24、聚类模块25、筛选模块26、确定模块27和至少一个功能所需的应用程序28(比如神经网络训练等)等；存储数据区可存储根据电子设备的使用所创建的数据等。存储器20可以由任何类型的易失性或非易失性存储设备或者它们的组合实现，如静态随机存取存储器(Static Random Access Memory，简称SRAM)，电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory，简称EEPROM)，可擦除可编程只读存储器(Erasable Programmable Read Only Memory，简称EPROM)，可编程只读存储器(Programmable Read-Only Memory，简称PROM)，只读存储器(Read Only Memory，简称ROM)，磁存储器，快闪存储器，磁盘或光盘。相应地，存储器20还可以包括存储器控制器，以提供一个或多个处理器10对存储器20的访问。

其中，一个或多个处理器20通过运行获取模块22执行以下功能：获取输入序列；一个或多个处理器20通过运行编码模块23执行以下功能：对输入序列进行编码处理得到语句特征向量，语句特征向量为输入序列的表示；一个或多个处理器20通过运行解码模块24执行以下功能：对语句特征向量进行解码得到第一预定数量的候选语句序列；一个或多个处理器20通过运行聚类模块25执行以下功能：对第一预定数量的候选语句序列进行聚类得到至少两类语句序列集合；一个或多个处理器20通过运行筛选模块26执行以下功能：从至少两类语句序列集合中筛选出第二预定数量的候选语句序列，第二预定数量的候选语句序列包括至少两种语句特征类型，第二预定数量小于第一预定数量；一个或多个处理器20通过运行确定模块27执行以下功能：根据第二预定数量的候选语句序列，确定输入序列对应的输出序列。

图3是本申请一个示意性实施例提供的语句生成方法的流程图，该方法可以采用前述应用场景中的电子设备实现，参见图3，该语句生成方法包括以下步骤：

步骤301，获取输入序列。

在一个实施例中，输入序列为输入的文本数据，或者是根据输入的语音数据或者图片数据识别得到的文本数据。

电子设备获取输入序列可以包括：电子设备接收文本数据(字、词语或句子)，并将文本数据确定为输入序列。或者，电子设备接收语音数据，对语音数据进行语音识别得到文本数据，并将经语音识别得到的文本数据确定为输入序列。或者，电子设备接收图片数据，对图片数据进行光学字符识别得到文本数据，并将经识别的文本数据确定为输入序列。

步骤302，对输入序列进行编码处理得到语句特征向量，语句特征向量为输入序列的表示。

在一个实施例中，语句特征向量为向量序列或者单个向量。

在一种实施例中，电子设备对输入序列进行编码处理得到语句特征向量包括：电子设备将输入序列编码成向量序列，该向量序列包括至少一个向量。

示意性的，电子设备在编码成向量序列时，先对输入序列进行分词处理，得到至少一个词；然后将分词处理得到的每个词分别编码为一个向量，组成向量序列。

在另一种实施例中，电子设备将输入序列编码成单个向量。

电子设备可以采用编码器将输入序列编码成向量，编码器编码得到的向量包含了输入序列各个方面的信息，比如意图(是确认、询问等等)和具体的命名实体(如地点时间等等)。

电子设备将输入序列编码成单个向量时，在后续对输入序列的处理即转化为对该向量的处理，相比于对一个向量序列进行处理而言，可以大大降低后续处理的复杂程度，同时采用一个向量来表示输入序列能够提高语意的完整性。

需要说明的是，电子设备在采用向量表示输入序列时，为了能够表达输入序列的意思，需要使用一个维数较高的向量，例如5000维；而采用一个向量序列表示输入序列时，向量序列中的每个向量只用表示一个词语，因此每个向量可以使用一个低维数的向量。

步骤303，对语句特征向量进行解码得到第一预定数量的候选语句序列。

在一个实施例中，电子设备对语句特征向量进行解码得到第一预定数量的候选语句序列。其中，候选语句序列包括至少一个解码词。

第一预定数量为预先设置的数值，在一个实施例中，第一预定数值为用户自定义设置的，或者是终端默认设置的。比如，第一预定数量为16或24。

需要说明的是，由于输出序列是逐词生成的，因此输出序列的生成过程包括多次解码处理，每次解码处理包括解码、聚类和筛选。

在一个实施例中，在本申请实施例中，解码也称重组扩展，即解码过程为基于第二预定数量的候选语句序列扩展解码词，将扩展出的解码词与第二预定数量的候选语句序列进行重组得到第一预定数量的候选语句序列的处理过程，第一预定数量大于第二预定数量。

聚类包括将解码后得到的第一预定数量的候选语句序列进行聚类得到至少两类语句序列集合的处理过程。

筛选包括从聚类得到的至少两类语句序列集合中选择第二预定数量的候选语句序列的处理过程。

步骤304，对第一预定数量的候选语句序列进行聚类得到至少两类语句序列集合。

在一个实施例中，电子设备对第一预定数量的候选语句序列进行聚类得到至少两类语句序列集合。其中，语句序列集合包括至少一个候选语句序列。

在一个实施例中，至少两类语句序列集合各自对应的语句特征类型是不同的。

在一个实施例中，语句特征类型用于指示候选语句序列的语句通顺度和/或候选语句序列与输入序列之间的关联度。

步骤305，从至少两类语句序列集合中筛选出第二预定数量的候选语句序列，第二预定数量的候选语句序列包括至少两种语句特征类型，第二预定数量小于第一预定数量。

在一个实施例中，电子设备从至少两类语句序列集合中筛选出第二预定数量的候选语句序列。

在一个实施例中，对于至少两类语句序列集合的每类语句序列集合，电子设备从该语句序列集合中筛选出至少一个候选语句序列，从而组成第二预定数量的候选语句序列。

步骤306，根据第二预定数量的候选语句序列，确定输入序列对应的输出序列。

在一个实施例中，电子设备从第二预定数量的候选语句序列中选择一个候选语句序列作为输入序列对应的输出序列。

在一个实施例中，电子设备从第二预定数量的候选语句序列中按照预设选择策略，或者随机选择一个候选语句序列作为输入序列对应的输出序列。本实施例对此不加以限定。

综上，本申请实施例通过对输入序列进行编码处理得到语句特征向量，对语句特征向量进行解码得到第一预定数量的候选语句序列，对第一预定数量的候选语句序列进行聚类和筛选得到第二预定数量的候选语句序列，由于经过聚类和筛选得到的第二预定数量的候选语句序列包括至少两种语句特征类型，使得根据第二预定数量的候选语句序列确定出的输出序列存在较大的多样性，能够有效地满足用户需求，提高了语句生成效果。

请参考图4，其示出了本申请另一个示意性实施例提供的语句生成方法的流程图。该方法可以采用前述应用场景中的电子设备实现，参见图4，该语句生成方法包括：

步骤401，获取输入序列。

在一个实施例中，电子设备通过第一应用程序获取输入的语句，根据输入的语句生成输入序列。

步骤402，对输入序列进行编码处理得到语句特征向量，语句特征向量为输入序列的表示。

电子设备对输入序列进行编码处理得到语句特征向量的过程可参考上述实施例中的相关细节，在此不再赘述。

步骤403，对语句特征向量进行第i次解码得到第一预定数量的候选语句序列，候选语句序列包括i个解码词，i的初始值为1。

在一个实施例中，电子设备对语句特征向量进行第1次解码得到第二预定数量的候选语句序列。每个候选语句序列包括1个解码词。

在一个实施例中，当i大于1时，电子设备对语句特征向量进行第i次解码得到第二预定数量的候选语句序列，包括：在第i次解码时，根据语句特征向量和第i-1次解码得到的第二预定数量的候选语句序列，进行重组扩展得到第一预定数量的候选语句序列，第一预定数量大于第二预定数量。

在一个实施例中，在第i次解码时，对于第i-1次解码得到的第二预定数量的候选语句序列中的至少一个候选语句序列，电子设备将该候选语句序列进行重组扩展得到扩展后的多个候选语句序列。

在一个实施例中，第一预定数量为预设的大于第二预定数量的数值，示意性的，第一预定数量为第二预定数量的m倍，m为大于1的正整数。

步骤404，对第一预定数量的候选语句序列进行聚类得到至少两类语句序列集合。

电子设备对第一预定数量的候选语句序列进行聚类得到至少两类语句序列集合之前，还可以包括：对第一预定数量的候选语句序列进行去重处理，去重处理用于去除候选语句序列中重复的字词。

在一个实施例中，电子设备对第一预定数量的候选语句序列进行聚类得到至少两类序列集，包括：对于第一预定数量的候选语句序列，采用指定聚类算法进行聚类得到至少两类语句序列集合。

其中，指定聚类算法包括K均值聚类算法、均值漂移聚类算法、基于密度的聚类算法、用高斯混合模型的最大期望聚类算法、凝聚层次聚类算法中的至少一种。

需要说明的是，本实施例对终端采用的指定聚类算法的类型不加以限定，下面仅以指定聚类算法为K均值聚类算法为例进行说明。

至少两类语句序列集合各自对应的语句特征类型是不同的。

在一个实施例中，语句特征类型包括第一语句特征类型、第二语句特征类型和第三语句特征类型中的至少一种。

第一语句特征类型用于指示候选语句序列为安全的输出序列，安全的输出序列也称通顺且安全的输出序列。即该候选语句序列的语句通顺度高于通顺阈值，而该候选语句序列与输入序列之间的关联度低于或者等于关联阈值。

第二语句特征类型用于指示候选语句序列为不通顺的输出序列，即该候选语句序列的语句通顺度低于或者等于通顺阈值。

第三语句特征类型用于指示候选语句序列为通顺且具有针对性的输出序列，即该候选语句序列的语句通顺度高于通顺阈值，且该候选语句序列与输入序列之间的关联度高于关联阈值。

在一个实施例中，通顺阈值或者关联阈值为用户自定义设置的，或者是终端默认设置的。本实施例对此不加以限定。

需要说明的是，电子设备在聚类时使用的语句特征类型，聚类得到的语句序列集合的数量均可以调整，本实施例对此不加以限定。

比如，至少两类语句序列集合包括三类语句序列集合，第一类语句序列集合包括多个第一语句特征类型的候选语句序列，第一语句特征类型用于指示候选语句序列为安全的语句序列；第二类语句序列集合包括多个第二语句特征类型的候选语句序列，第二语句特征类型用于指示候选语句序列为不通顺的语句序列；第三类语句序列集合包括多个第三语句特征类型的候选语句序列，第三语句特征类型用于指示候选语句序列为通顺且具有针对性的语句序列。

步骤405，对从至少两类语句序列集合中筛选出第二预定数量的候选语句序列，第二预定数量的候选语句序列包括至少两种语句特征类型，第二预定数量小于第一预定数量。

在一个实施例中，电子设备对从至少两类语句序列集合中筛选出第二预定数量的候选语句序列，包括：对于至少两类语句序列集合中的每类语句序列集合，将语句序列集合中的多个候选语句序列进行排序；获取语句序列集合中排序后位于前N个的候选语句序列，N为正整数。

在一个实施例中，对于至少两类语句序列集合中的每类语句序列集合，电子设备按照预设指标对该语句序列集合中的多个候选语句序列进行排序。示意性的，预设指标包括信息熵。

在一个实施例中，电子设备在聚类得到K类语句序列集合之后，从K类语句序列集合中的每类语句序列集合中获取排序后位于前N个的候选语句序列，得到K*N个候选语句序列，其中，K*N为第二预定数量。

步骤406，当第i次解码得到的解码词未包括预测的终止词时将i加1，继续执行对语句特征向量进行第i次解码得到第一预定数量的候选语句序列的步骤。

在一个实施例中，预测的终止词为设置的用于终止解码的关键词。示意性的，终止词为“end”。

当第i次解码得到的解码词未包括预测的终止词时，电子设备将在第i次得到的第二预定数量的候选语句(即，经第i次解码、聚类和筛选出的第二预定数量的候选语句序列)作为下一次(即当前次的下一次)解码的输入，并将当前的i加1作为新的第i次，继续执行上述步骤403至步骤405。

步骤407，当第i次解码得到的解码词包括预测的终止词时，获取第i次解码、聚类和筛选后的第二预定数量的候选语句序列。

当第i次解码得到的解码词包括预测的终止词时，电子设备获取第i次解码、聚类和筛选后的第二预定数量的候选语句序列，并执行步骤408。

步骤408，根据获取到的第二预定数量的候选语句序列，确定输出序列。

可以理解，步骤408中的第二预定数量的候选语句序列，即为对最后一次解码得到的第一预定数量的候选语句序列，执行步骤404和步骤405后得到。

在一个实施例中，电子设备根据获取到的第二预定数量的候选语句序列，确定输出序列包括：获取语句评分模型，语句评分模型用于表示基于样本语句序列进行训练得到的语句评价规律；对于第二预定数量的候选语句序列中的每个候选语句序列，输入语句评分模型得到语句评分，语句评分用于指示候选语句序列的语句质量；根据第二预定数量的候选语句序列各自对应的语句评分，确定输出序列。

在一个实施例中，语句评分模型为基于样本语句序列对神经网络进行训练得到的模型。该语句评分模型用于衡量一个语句序列的语句质量。示意性的，语句质量包括语句通顺度。

当电子设备为终端时，语句评分模型可以是终端预先训练好并自身存储的，也可以是服务器预先训练好后发送至终端的。

当电子设备为服务器时，语句评分模型为服务器预先训练好并存储在服务器中的。本实施例对此不加以限定。下面仅以服务器训练语句评分模型为例介绍模型训练过程。

服务器训练语句评分模型的过程包括：获取训练样本集，训练样本集包括至少一组样本数据组；对至少一组样本数据组采用误差反向传播算法进行训练，得到语句评分模型。其中，每组样本数据组包括：样本语句序列和预先标定的正确语句评分。

服务器对至少一组样本数据组采用误差反向传播算法进行训练，得到语句评分模型，包括但不限于以下几个步骤：

1、对于至少一组样本数据组中的每组样本数据组，将样本语句序列输入原始参数模型，得到训练结果。

在一个实施例中，原始参数模型是根据神经网络模型建立的，比如：原始参数模型包括但不限于：CNN模型、DNN模型、RNN模型、嵌入模型、 GBDT模型、LR模型中的至少一种。

示意性的，对于每组样本数据组，服务器创建该组样本数据组对应的输入输出对，输入输出对的输入参数为该组样本数据组中的样本语句序列，输出参数为该组样本数据组中的正确语句评分；服务器将输入参数输入原始参数模型，得到训练结果。

比如，样本数据组包括样本语句序列A和正确语句评分“语句评分1”，终端创建的输入输出对为：(样本语句序列A)->(语句评分1)；其中，(样本语句序列A)为输入参数，(语句评分1)为输出参数。

在一个实施例中，输入输出对通过特征向量表示。

2、对于每组样本数据组，将训练结果与正确语句评分进行比较，得到计算损失，计算损失用于指示训练结果与正确语句评分之间的误差。

在一个实施例中，计算损失通过交叉熵(英文：cross-entropy)来表示。

在一个实施例中，终端通过下述公式计算得到计算损失H(p，q)：

其中，p(x)和q(x)是长度相等的离散分布向量，p(x)表示表示训练结果；q(x)表示输出参数；x为训练结果或输出参数中的一个向量。

3、根据至少一组样本数据组各自对应的计算损失，采用误差反向传播算法训练得到语句评分模型。

在一个实施例中，终端通过反向传播算法根据计算损失确定语句评分模型的梯度方向，从语句评分模型的输出层逐层向前更新语句评分模型中的模型参数。

在一个实施例中，对于第二预定数量的候选语句序列中的每个候选语句序列，电子设备将候选语句序列输入至语句评分模型中计算得到语句评分。

其中，语句评分模型是根据至少一组样本数据组训练得到的，每组样本数据组包括：样本语句序列和预先标注的正确语句评分。

在一个实施例中，语句评分用于指示候选语句序列的语句质量。示意性的，语句质量包括语句流畅度。

在一个实施例中，语句评分与候选语句序列的语句质量呈负相关关系，即若语句评分越低则该候选语句序列的语句质量越高，语句流畅度越高；若语句评分越高则该候选语句序列的语句质量越低，语句流畅度越低。

在一个实施例中，当候选语句序列的语句评分低于评分阈值时，用于指示该候选语句序列为自然语句。

评分阈值为用户自定义设置的，或者是终端默认设置的，本实施例对此不加以限定。

在一个实施例中，当语句评分与候选语句序列的语句质量呈负相关关系时，电子设备确定第二预定数量的候选语句序列各自对应的语句评分中的最低语句评分；将最低语句评分对应的候选语句序列确定为输出序列。

在一个实施例中，电子设备生成输出序列之后，在电子设备上显示输入序列和对应的输出序列。

示意性的，上述实施例提供的语句生成方法对应的算法如下：

其中，BS为第二预定数量，C包括输入序列对应的语句特征向量，rsp用于表示输出序列，socre _lm(hyp)为语句评分，lm _th为评分阈值，hyp用于表示候选语句序列，K为语句序列集合的数量，R用于表示候选语句序列的集合，K-means用于表示K均值聚类算法。

在一个示意性的例子中，电子设备获取输入序列a，对输入序列a进行编码处理得到语句特征向量A，电子设备对语句特征向量A进行第1次解码得到8个候选语句序列，如图5所示，其示出了电子设备第2次解码的过程，其中，白色圆圈代表第一语句特征类型的候选语句序列(比如安全的候选语句序列)，黑色圆圈代表第二语句特征类型的候选语句序列(比如通顺且具有针对性的候选语句序列)。1、电子设备根据语句特征向量和第1次解码得到的8个候选语句序列，进行重组扩展得到16个候选语句序列。2、电子设备对16个候选语句序列进行聚类得到两类语句序列集合，即第一类语句序列集合和第二类语句序列集合，第一类语句序列集合包括8个安全的候选语句序列，第二类语句序列集合包括8个通顺且具有针对性的候选语句序列。3、电子设备从第一类语句序列集合中筛选出4个安全的候选语句序列，并从第二类语句序列集合中筛选出4个通顺且具有针对性的候选语句序列，得到8个候选语句序列。4、电子设备根据得到的8个候选语句序列，进行下一次解码，直到接收到指定结束条件。其中，下一次解码可类比参考上述第2次解码的过程。

综上，本申请实施例还通过电子设备获取语句评分模型，对于第二预定数量的候选语句序列中的每个候选语句序列，输入语句评分模型得到语句评分，基于多个候选语句序列各自对应的语句评分生成输出序列；由于语句评分模型用于表示基于样本语句序列进行训练得到的语句评价规律，使得确定出的语句评分能够准确地反应出该候选语句序列的语句质量，进而保证了生成的输出序列的语句质量。

当上述的语句生成方法应用于对话系统中时，参见图6，该语句生成方法包括：

步骤601，电子设备获取通过对话应用程序输入的待回复语句。

在一个实施例中，当对话应用程序处于前台运行时，接收以语音形式或者文本形式输入的待回复语句。

其中，对话应用程序是安装在电子设备中的具有人机对话功能的应用程序。在一个实施例中，对话应用程序用于对输入的待回复语句进行回复。

步骤602，电子设备根据待回复语句生成输入序列。

在一种实施例中，当待回复语句是以文本形式输入的时，将待回复语句确定为输入序列。

在另一种实施例中，当待回复语句是以语音形式输入的时，采用语音识别算法将待回复语句转化为文本数据，将转化后的文本数据确定为输入序列。

步骤603，电子设备对输入序列进行编码处理得到语句特征向量。

步骤604，电子设备对语句特征向量进行解码得到第一预定数量的候选语句序列。

步骤605，电子设备对第一预定数量的候选语句序列进行聚类得到至少两类语句序列集合。

步骤606，电子设备从至少两类语句序列集合中筛选出第二预定数量的候选语句序列，第二预定数量的候选语句序列包括至少两种语句特征类型，第二预定数量小于第一预定数量。

步骤607，电子设备根据第二预定数量的候选语句序列，确定输入序列对应的输出序列。

需要说明的是，电子设备执行步骤603至步骤607的过程可参考上述实施例中的相关细节，在此不再赘述。

步骤608，电子设备根据输出序列生成回复语句，通过对话应用程序展示回复语句。

在一个实施例中，电子设备将输出序列确定为回复语句，在对话应用程序的对话界面上以文本形式或者语音形式展示该回复语句。

当上述的语句生成方法应用于机器翻译系统中时，参见图7，上述步骤601和602可以被替换实现成为如下几个步骤：

步骤701，电子设备获取通过翻译应用程序输入的待翻译语句。

在一个实施例中，当翻译应用程序处于前台运行时，接收以语音形式或者文本形式输入的待翻译语句。

其中，翻译应用程序是安装在电子设备中的具有翻译功能的应用程序。在一个实施例中，翻译应用程序用于对输入的待翻译语句进行翻译。

其中，待翻译语句为待翻译的第一语言类型的语句。

步骤702，电子设备根据待翻译语句生成输入序列。

在一种实施例中，当待翻译语句是以文本形式输入的时，将待翻译语句确定为输入序列。

在另一种实施例中，当待翻译语句是以语音形式输入的时，采用语音识别算法将待翻译语句转化为文本数据，将转化后的文本数据确定为输入序列。

对应的，上述步骤608可以被替换实现成为如下步骤：

步骤708，电子设备根据输出序列生成翻译语句，通过对话应用程序展示翻译语句。

其中，翻译语句为待翻译的第一语言类型的语句所对应的翻译后的第二语言类型的语句，其中第一语言类型不同于第二语言类型。示意性的，第一语言类型为英文，第二语言类型为中文。

在一个实施例中，电子设备将输出序列确定为翻译语句，在翻译应用程序的翻译界面上以文本形式或者语音形式展示该翻译语句。

需要说明的是，当语句生成方法应用于问答系统、自动写作系统或者阅读理解系统中时，本领域技术人员可类比参考上述当语句生成方法应用于对话系统或机器翻译系统中时的相关步骤，在此不再赘述。

用于实现本申请各实施例中的语句生成方法的系统，在DSTC7(7 ^th Dialog System Technology Challenge，第七届对话系统技术挑战赛)中获得了第一名。具体数据如表1和表2所示。其中，表1是自动化评估结果。表2是人工评估结果。

(表1)

表1中，一共有2208个测试样本。DSTC7的组织者提供了三个基线(对照组)：(1)恒定：始终回答：“我不知道你的意思。”；(2)随机：从训练数据中随机选择一个答案；(3)seq2seq(序列到序列)：用Vanilla Keras序列到序列模型训练。团队C/E和团队G，是此次竞赛的其他两组队伍所使用的系统。为了进行正式评估，我们提交了两个系统，一个系统以K均值波束搜索为主要系统，另一个系统是不使用K均值波束搜索的辅助系统。此外，还加了人(Human)的响应进行对比。所有响应输出均使用以下指标进行评分，这些指标分别是NIST(Dod-dington，于2002年提出的机器翻译评价指标)，BLEU(Papineni等，于2002年提出)、Me-teor(Denkowski和Lavie，于2014年提出)、DIV-1、DIV-2(也称为distinct-1和distinct-2)(由Li等人于2016年提出)和Entropy1-4(Zhang等人于2018年提出)。

如表1所示，我们的系统使用NIST-4，BLEU-4和Meteor这些主要指标上均取得了最佳结果。此外，使用K均值波束搜索可以有效地提高几乎所有主要算法和所有分集指标的性能。就平均响应长度而言，我们的系统产生的响应比seq2seq基线更长。此外，与不使用K均值波束搜索相比，使用K均值波束搜索的系统，响应时间更长。平均而言，人的响应时间要比我们的系统长，而G团队平均使用22个令牌生成的响应时间甚至更长。就前100k词汇表未涵盖的输出OOV(集外词)的能力而言，我们的系统分别使用K均值波束搜索和传统波束搜索在提交的测试响应中生成了97和57个唯一的OOV(集外词)。与传统的波束搜索相比，K均值波束搜索可以复制更多的OOV(集外词)。

(表2)

表2中，是由DSTC7组织者精心选择了1k个测试样本进行比赛测试，进而由人工对结果进行评估。如表2所示，人工评估会从“相关性和适当性”和“兴趣和信息性”这两个类别进行评估。与seq2seq的基线相比，我们的系统在95％的置信区间水平下明显超过了基线。此外，与第二名的团队相比，我们的系统在“兴趣和信息量”类别中以95％的置信区间获得了最佳结果。总体而言，我们的系统在竞争中排名第一。

下述为本申请装置实施例，可以用于执行本申请方法实施例。对于本申请装置实施例中未披露的细节，请参照本申请方法实施例。

请参考图8，其示出了本申请一个示意性实施例提供的语句生成装置的结构示意图。该语句生成装置可以通过专用硬件电路，或者，软硬件的结合实现成为图1或图2中的电子设备的全部或一部分，该语句生成装置包括：获取模块810、编码模块820、解码模块830、聚类模块840、筛选模块850和确定模块860。

获取模块810，用于执行上述步骤301或401。

编码模块820，用于执行上述步骤302或402。

解码模块830，用于执行上述步骤303。

聚类模块840，用于执行上述步骤304或404。

筛选模块850，用于执行上述步骤305或405。

确定模块860，用于执行上述步骤306。

在一个实施例中，解码模块830，还用于执行上述步骤403。

确定模块860，还用于执行上述步骤406和步骤407中的一个，以及步骤408。

在一个实施例中，聚类模块840，还用于对于第一预定数量的候选语句序列，采用指定聚类算法进行聚类得到至少两类语句序列集合，至少两类语句序列集合各自对应的语句特征类型是不同的；

在一个实施例中，语句特征类型包括第一语句特征类型、第二语句特征类型和第三语句特征类型中的至少一种；

第一语句特征类型用于指示候选语句序列为安全的语句序列；

第二语句特征类型用于指示候选语句序列为不通顺的语句序列；

第三语句特征类型用于指示候选语句序列为通顺且具有针对性的语句序列。

在一个实施例中，确定模块860，还用于获取语句评分模型，语句评分模型用于表示基于样本语句序列进行训练得到的语句评价规律；对于第二预定数量的候选语句序列中的每个候选语句序列，输入语句评分模型得到语句评分，语句评分用于指示候选语句序列的语句质量；根据第二预定数量的候选语句序列各自对应的语句评分，确定输出序列。

在一个实施例中，语句评分与候选语句序列的语句质量呈负相关关系，确定模块860，还用于确定第二预定数量的候选语句序列各自对应的语句评分中的最低语句评分；将最低语句评分对应的候选语句序列确定为输出序列。

在一个实施例中，确定模块860，还用于获取训练样本集，训练样本集包括至少一组样本数据组，每组样本数据组包括：样本语句序列和预先标注的正确语句评分；根据至少一组样本数据组，采用误差反向传播算法对原始参数模型进行训练，得到语句评分模型。

在一个实施例中，筛选模块850，还用于对于至少两类语句序列集合中的每类语句序列集合，将语句序列集合中的多个候选语句序列进行排序；

获取语句序列集合中排序后位于前N个的候选语句序列，N为正整数。

在一个实施例中，该装置还包括：去重模块。该去重模块，用于对第一预定数量的候选语句序列进行去重处理，去重处理用于去除候选语句序列中重复的字词。

在一个实施例中，当语句生成方法应用于对话系统中时，输入序列为待回复语句，输出序列为回复语句；

当语句生成方法应用于机器翻译系统中时，输入序列为待翻译的第一语言类型的语句，输出序列为翻译后的第二语言类型的语句，其中第一语言类型不同于第二语言类型；

当语句生成方法应用于问答系统中时，输入序列为问题语句，输出序列为答案语句；

当语句生成方法应用于自动写作系统中时，输入序列为主题语句，输出序列为内容语句；

在一个实施例中，获取模块810，还用于获取通过对话应用程序输入的待回复语句；根据待回复语句生成输入序列；

该装置还包括：展示模块，展示模块用于根据输出序列生成回复语句；通过对话应用程序展示回复语句。

相关细节可结合参考图3至图7所示的方法实施例。其中，获取模块810还用于实现上述方法实施例中其他任意隐含或公开的与获取步骤相关的功能；编码模块820还用于实现上述方法实施例中其他任意隐含或公开的与编码步骤相关的功能；解码模块830还用于实现上述方法实施例中其他任意隐含或公开的与解码步骤相关的功能；聚类模块840还用于实现上述方法实施例中其他任意隐含或公开的与聚类步骤相关的功能；筛选模块850还用于实现上述方法实施例中其他任意隐含或公开的与筛选步骤相关的功能；确定模块860还用于实现上述方法实施例中其他任意隐含或公开的与确定步骤相关的功能。

需要说明的是，上述实施例提供的装置，在实现其功能时，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将设备的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的装置与方法实施例属于同一构思，其具体实现过程详见方法实施例，这里不再赘述。

图9示出了本申请一个示意性实施例提供的终端900的结构框图。该终端900可以是：智能手机、平板电脑、MP3播放器(Moving Picture Experts Group Audio Layer III，动态影像专家压缩标准音频层面3)、MP4(Moving Picture Experts Group Audio Layer IV，动态影像专家压缩标准音频层面4)播放器、笔记本电脑或台式电脑。终端900还可能被称为用户设备、便携式终端、膝上型终端、台式终端等其他名称。

通常，终端900包括有：一个或多个处理器901和存储器902。

一个或多个处理器901可以包括一个或多个处理核心，比如4核心一个或多个处理器、8核心一个或多个处理器等。一个或多个处理器901可以采用DSP(Digital Signal Processing，数字信号处理)、FPGA(Field－Programmable Gate Array，现场可编程门阵列)、PLA(Programmable Logic Array，可编程逻辑阵列)中的至少一种硬件形式来实现。一个或多个处理器901也可以包括主一个或多个处理器和协一个或多个处理器，主一个或多个处理器是用于对在唤醒状态下的数据进行处理的一个或多个处理器，也称CPU(Central Processing Unit，中央一个或多个处理器)；协一个或多个处理器是用于对在待机状态下的数据进行处理的低功耗一个或多个处理器。在一些实施例中，一个或多个处理器901可以在集成有GPU(Graphics Processing Unit，图像一个或多个处理器)，GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中，一个或多个处理器901还可以包括AI(Artificial Intelligence，人工智能)一个或多个处理器，该AI一个或多个处理器用于处理有关机器学习的计算操作。

存储器902可以包括一个或多个计算机可读存储介质，该计算机可读存储介质可以是非暂态的。存储器902还可包括高速随机存取存储器，以及非易失性存储器，比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中，存储器902中的非暂态的计算机可读存储介质用于存储至少一个计算机可读指令，该至少一个计算机可读指令用于被一个或多个处理器901所执行以实现本申请中方法实施例提供的语句生成方法。

在一些实施例中，终端900还可选包括有：外围设备接口903和至少一个外围设备。一个或多个处理器901、存储器902和外围设备接口903之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口903相连。具体地，外围设备包括：射频电路904、触摸显示屏905、摄像头906、音频电路907、定位组件908和电源909中的至少一种。

外围设备接口903可被用于将I/O(Input/Output，输入/输出)相关的至少一个外围设备连接到一个或多个处理器901和存储器902。在一些实施例中，一个或多个处理器901、存储器902和外围设备接口903被集成在同一芯片或电路板上；在一些其他实施例中，一个或多个处理器901、存储器902和外围设备接口903中的任意一个或两个可以在单独的芯片或电路板上实现，本实施例对此不加以限定。

射频电路904用于接收和发射RF(Radio Frequency，射频)信号，也称电磁信号。

显示屏905用于显示UI(User Interface，用户界面)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏905是触摸显示屏时，显示屏905还具有采集在显示屏905的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至一个或多个处理器901进行处理。此时，显示屏905还可以用于提供虚拟按钮和/或虚拟键盘，也称软按钮和/或软键盘。

摄像头组件906用于采集图像或视频。可选地，摄像头组件906包括前置摄像头和后置摄像头。通常，前置摄像头设置在终端的前面板，后置摄像头设置在终端的背面。

音频电路907可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波，并将声波转换为电信号输入至一个或多个处理器901进行处理，或者输入至射频电路904以实现语音通信。

定位组件908用于定位终端900的当前地理位置，以实现导航或LBS(Location Based Service，基于位置的服务)。

电源909用于为终端900中的各个组件进行供电。电源909可以是交流电、直流电、一次性电池或可充电电池。

在一些实施例中，终端900还包括有一个或多个传感器910。该一个或多个传感器910包括但不限于：加速度传感器911、陀螺仪传感器912、压力传感器913、指纹传感器914、光学传感器915以及接近传感器916。

加速度传感器911可以检测以终端900建立的坐标系的三个坐标轴上的加速度大小。

陀螺仪传感器912可以检测终端900的机体方向及转动角度，陀螺仪传感器912可以与加速度传感器911协同采集用户对终端900的3D动作。

压力传感器913可以设置在终端900的侧边框和/或触摸显示屏905的下层。当压力传感器913设置在终端900的侧边框时，可以检测用户对终端900的握持信号，由一个或多个处理器901根据压力传感器913采集的握持信号进行左右手识别或快捷操作。当压力传感器913设置在触摸显示屏905的下层时，由一个或多个处理器901根据用户对触摸显示屏905的压力操作，实现对UI界面上的可操作性控件进行控制。

指纹传感器914用于采集用户的指纹，由一个或多个处理器901根据指纹传感器914采集到的指纹识别用户的身份，或者，由指纹传感器914根据采集到的指纹识别用户的身份。

光学传感器915用于采集环境光强度。在一个实施例中，一个或多个处理器901可以根据光学传感器915采集的环境光强度，控制触摸显示屏905的显示亮度。

接近传感器916，也称距离传感器，通常设置在终端900的前面板。接近传感器916用于采集用户与终端900的正面之间的距离。

本领域技术人员可以理解，图9中示出的结构并不构成对终端900的限定，可以包括比图示更多或更少的组件，或者组合某些组件，或者采用不同的组件布置。

请参考图10，其示出了本申请一个示意性实施例提供的终端1000的结构示意图。具体来讲：服务器1000包括中央处理单元(CPU)1001、包括随机存取存储器(RAM)1002和只读存储器(ROM)1003的系统存储器1004，以及连接系统存储器1004和中央处理单元1001的系统总线1005。服务器1000还包括帮助计算机内的各个器件之间传输信息的基本输入/输出系统(I/O系统)1006，和用于存储操作系统1013、应用程序1014和其他程序模块1015的大容量存储设备1007。

基本输入/输出系统1006包括有用于显示信息的显示器1008和用于用户输入信息的诸如鼠标、键盘之类的输入设备1009。其中显示器1008和输入设备1009都通过连接到系统总线1005的输入输出控制器1010连接到中央处理单元1001。基本输入/输出系统1006还可以包括输入输出控制器1010以用于接收和处理来自键盘、鼠标、或电子触控笔等多个其他设备的输入。类似地，输入输出控制器1010还提供输出到显示屏、打印机或其他类型的输出设备。

大容量存储设备1007通过连接到系统总线1005的大容量存储控制器(未示出)连接到中央处理单元1001。大容量存储设备1007及其相关联的计算机可读介质为服务器1000提供非易失性存储。也就是说，大容量存储设备1007可以包括诸如硬盘或者CD-ROI驱动器之类的计算机可读介质(未示出)。

不失一般性，计算机可读介质可以包括计算机存储介质和通信介质。计算机存储介质包括以用于存储诸如计算机可读计算机可读指令、数据结构、程序模块或其他数据等信息的任何方法或技术实现的易失性和非易失性、可移动和不可移动介质。计算机存储介质包括RAM、ROM、EPROM、EEPROM、闪存或其他固态存储其技术，CD-ROM、DVD或其他光学存储、磁带盒、磁带、磁盘存储或其他磁性存储设备。当然，本领域技术人员可知计算机存储介质不局限于上述几种。上述的系统存储器1004和大容量存储设备1007可以统称为存储器。

根据本申请的各种实施例，服务器1000还可以通过诸如因特网等网络连接到网络上的远程计算机运行。也即服务器1000可以通过连接在系统总线1005上的网络接口单元1011连接到网络1012，或者说，也可以使用网络接口单元1011来连接到其他类型的网络或远程计算机系统(未示出)。

在一个实施例中，该存储器中存储有至少一条计算机可读指令、至少一段程序、代码集或计算机可读指令集，至少一条计算机可读指令、至少一段程序、代码集或计算机可读指令集由一个或多个处理器加载并执行以实现上述各个方法实施例提供的语句生成方法。

本申请实施例还提供一种电子设备，该电子设备可以是上述图9提供的终端900，也可以是上述图10提供的服务器1000。

本申请还提供一种计算机可读存储介质，该计算机可读存储介质存储有至少一条计算机可读指令，至少一条计算机可读指令用于被一个或多个处理器执行以实现上述各个方法实施例提供的语句生成方法。

上述本申请实施例序号仅仅为了描述，不代表实施例的优劣。

本领域普通技术人员可以理解实现上述实施例的语句生成方法中全部或部分步骤可以通过硬件来完成，也可以通过程序来计算机可读指令相关的硬件完成，的程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。

以上仅为本申请的较佳实施例，并不用以限制本申请，凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

Claims

一种语句生成方法，由电子设备执行，包括：

获取输入序列；

对所述输入序列进行编码处理得到语句特征向量；

对所述语句特征向量进行解码得到第一预定数量的候选语句序列；

对所述第一预定数量的候选语句序列进行聚类，得到至少两类语句序列集合；

从所述至少两类语句序列集合中筛选出第二预定数量的候选语句序列，所述第二预定数量的候选语句序列包括至少两种语句特征类型；及

根据所述第二预定数量的候选语句序列，确定所述输入序列对应的输出序列。
根据权利要求1所述的方法，其特征在于，所述对所述语句特征向量进行解码得到第一预定数量的候选语句序列，包括：

对所述语句特征向量进行第i次解码得到所述第一预定数量的候选语句序列，所述候选语句序列包括i个解码词，所述i的初始值为1；

在所述从所述至少两类语句序列集合中筛选出第二预定数量的候选语句序列之后，所述方法还包括：

当所述第i次解码得到的解码词未包括预测的终止词时，将所述第二预定数量的候选语句序列作为第i+1次解码的输入，并将所述第i+1次作为第i次，以继续执行对所述语句特征向量进行第i次解码得到所述第一预定数量的候选语句序列的步骤；

当所述第i次解码得到的解码词包括所述预测的终止词时，则执行所述根据所述第二预定数量的候选语句序列，确定所述输入序列对应的输出序列的步骤。
根据权利要求2所述的方法，其特征在于，所述将所述第二预定数量的候选语句序列作为第i+1次解码的输入，并将所述第i+1次作为第i次，以继续执行对所述语句特征向量进行第i次解码得到所述第一预定数量的候选语句序列包括：在第i次解码中，根据所述语句特征向量和第i次的上一次解码得到的所述第二预定数量的候选语句序列，进行重组扩展得到所述第一预定数量的候选语句序列。
根据权利要求3所述的方法，其特征在于，所述根据所述语句特征向量和第i次的上一次解码得到的所述第二预定数量的候选语句序列，进行重组扩展得到所述第一预定数量的候选语句序列包括：

基于第i次的上一次解码得到的所述第二预定数量的候选语句序列，扩展解码词；

将扩展出的解码词与所述第二预定数量的候选语句序列进行重组，得到第一预定数量的候选语句序列。
根据权利要求1所述的方法，其特征在于，所述对所述第一预定数量的候选语句序列进行聚类得到至少两类语句序列集合，包括：

对于所述第一预定数量的候选语句序列，进行聚类得到所述至少两类语句序列集合，所述至少两类语句序列集合各自对应的语句特征类型不同。
根据权利要求1至5中任一项所述的方法，其特征在于，所述语句特征类型包括第一语句特征类型、第二语句特征类型和第三语句特征类型中的至少一种；

所述第一语句特征类型用于指示所述候选语句序列为安全的语句序列；

所述第二语句特征类型用于指示所述候选语句序列为不通顺的语句序列；

所述第三语句特征类型用于指示所述候选语句序列为通顺且具有针对性的语句序列。
根据权利要求1所述的方法，其特征在于，所述根据所述第二预定数量的候选语句序列，确定所述输入序列对应的输出序列，包括：

获取语句评分模型，所述语句评分模型用于表示基于样本语句序列进行训练得到的语句评价规律；

将所述第二预定数量的候选语句序列中的每个所述候选语句序列，输入所述语句评分模型得到语句评分，所述语句评分用于指示所述候选语句序列的语句质量；

根据所述第二预定数量的候选语句序列各自对应的语句评分，确定所述输出序列。
根据权利要求7所述的方法，其特征在于，所述语句评分与所述候选语句序列的语句质量呈负相关关系；所述根据所述第二预定数量的候选语句序列各自对应的语句评分，确定所述输出序列，包括：

确定所述第二预定数量的候选语句序列各自对应的语句评分中的最低语句评分；

将所述最低语句评分对应的候选语句序列确定为所述输出序列。
根据权利要求7所述的方法，其特征在于，所述获取语句评分模型，包括：

获取训练样本集，所述训练样本集包括所述至少一组样本数据组，每组所述样本数据组包括：样本语句序列和预先标注的正确语句评分；

根据所述至少一组样本数据组，采用误差反向传播算法对原始参数模型进行训练，得到所述语句评分模型。
根据权利要求1所述的方法，其特征在于，所述从所述至少两类语句序列集合中筛选出第二预定数量的候选语句序列，包括：

对于所述至少两类语句序列集合中的每类所述语句序列集合，将所述语句序列集合中的多个候选语句序列进行排序；

获取所述语句序列集合中排序后位于前预设数量的候选语句序列。
根据权利要求1所述的方法，其特征在于，在所述对所述第一预定数量的候选语句序列进行聚类得到至少两类语句序列集合之前，还包括：

对所述第一预定数量的候选语句序列进行去重处理，所述去重处理用于去除所述候选语句序列中重复的字词。
根据权利要求1所述的方法，其特征在于，

当所述语句生成方法应用于对话系统中时，所述输入序列为待回复语句，所述输出序列为回复语句；

当所述语句生成方法应用于机器翻译系统中时，所述输入序列为待翻译的第一语言类型的语句，所述输出序列为翻译后的第二语言类型的语句，其中第一语言类型不同于第二语言类型；

当所述语句生成方法应用于问答系统中时，所述输入序列为问题语句，所述输出序列为答案语句；

当所述语句生成方法应用于自动写作系统中时，所述输入序列为主题语句，所述输出序列为内容语句；

当所述语句生成方法应用于阅读理解系统中时，所述输入序列为题目语句，所述输出序列为答案语句。
根据权利要求1所述的方法，其特征在于，所述获取输入序列，包括：

获取通过对话应用程序输入的待回复语句；

根据所述待回复语句生成所述输入序列；

所述方法还包括：

根据所述输出序列生成回复语句；

通过所述对话应用程序展示所述回复语句。
一种语句生成装置，设置于电子设备中，其特征在于，所述装置包括：

获取模块，用于获取输入序列；

编码模块，用于对所述输入序列进行编码处理得到语句特征向量；

解码模块，用于对所述语句特征向量进行解码得到第一预定数量的候选语句序列；

聚类模块，用于对所述第一预定数量的候选语句序列进行聚类，得到至少两类语句序列集合；

筛选模块，用于从所述至少两类语句序列集合中筛选出第二预定数量的候选语句序列，所述第二预定数量的候选语句序列包括至少两种语句特征类型；及

确定模块，用于根据所述第二预定数量的候选语句序列，确定所述输入序列对应的输出序列。
一种电子设备，其特征在于，所述电子设备包括一个或多个处理器和存储器，所述存储器中存储有至少一条计算机可读指令、至少一段程序、代码集或计算机可读指令集，所述至少一条计算机可读指令、所述至少一段程序、所述代码集或计算机可读指令集由所述一个或多个处理器加载并执行以实现如权利要求1至13任一所述的语句生成方法。
一个或多个计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有至少一条计算机可读指令、至少一段程序、代码集或计算机可读指令集，所述至少一条计算机可读指令、所述至少一段程序、所述代码集或计算机可读指令集由所述一个或多个处理器加载并执行以实现如权利要求1至13任一所述的语句生成方法。