CN114281966A

CN114281966A - 问题模板生成方法、问答方法、装置与电子设备

Info

Publication number: CN114281966A
Application number: CN202111433687.4A
Authority: CN
Inventors: 王永康; 古东宏; 杜倩云; 段纪丁
Original assignee: Iflytek South China Artificial Intelligence Research Institute Guangzhou Co ltd
Current assignee: Iflytek South China Artificial Intelligence Research Institute Guangzhou Co ltd
Priority date: 2021-11-29
Filing date: 2021-11-29
Publication date: 2022-04-05

Abstract

本发明提供一种问题模板生成方法、问答方法、装置与电子设备，包括：确定三元组信息，所述三元组信息的形式包括文本形式和/或三元组形式；将所述三元组信息输入至模板生成模型，得到所述模板生成模型输出的问题模板；其中，所述模板生成模型是基于样本三元组信息以及所述样本三元组信息对应的样本问题模板训练得到的，所述样本三元组信息的形式包括所述文本形式和所述三元组形式。本发明提供的生成方法、问答方法、装置与电子设备，通过应用模板生成模型基于输入的三元组信息进行模板生成，从而极大地提高了问题模板的生成效率，节省了人力成本，并且，保证了问题模板的高质量，提高了模板生成方法的普适性和实用性。

Description

问题模板生成方法、问答方法、装置与电子设备

技术领域

本发明涉及自然语言处理技术领域，尤其涉及一种问题模板生成方法、问答方法、装置与电子设备。

背景技术

问答系统是人机交互的门槛，是聊天机器人的重要组件。为了满足用户的各种问法，问答系统需要建立庞大的模板库。

目前，常见的问答系统中多采用基于人工编写的模板方案，虽然可以保证模板质量，但是模板的编写效率存在严重的问题，需要投入大量的人力才能完成模板库的建立。

发明内容

本发明提供一种问题模板生成方法、问答方法、装置与电子设备，用以解决现有技术中问题模板生成效率差的缺陷，实现提高问题模板的生成效率。

本发明提供一种问题模板生成方法，包括：

确定三元组信息，所述三元组信息的形式包括文本形式和/或三元组形式；

将所述三元组信息输入至模板生成模型，得到所述模板生成模型输出的问题模板；

其中，所述模板生成模型是基于样本三元组信息以及所述样本三元组信息对应的样本问题模板训练得到的，所述样本三元组信息的形式包括所述文本形式和所述三元组形式。

根据本发明提供的一种问题模板生成方法，所述模板生成模型是基于如下步骤训练得到：

对样本文本进行三元组抽取，得到所述样本文本的三元组，所述样本文本为所述文本形式的样本三元组信息；

基于所述样本文本、所述样本文本的三元组和样本问题模板，以及样本三元组和所述样本三元组的样本问题模板，训练所述模板生成模型；所述样本三元组为所述三元组形式的样本三元组信息。

根据本发明提供的一种问题模板生成方法，所述基于所述样本文本、所述样本文本的三元组和样本问题模板，以及样本三元组和所述样本三元组的样本问题模板，训练所述模板生成模型，包括：

基于所述样本文本、所述样本文本的三元组和样本问题模板，对第一生成模型进行训练，得到第二生成模型；

基于所述样本三元组和所述样本三元组的样本问题模板，对所述第二生成模型进行训练，得到所述模板生成模型。

根据本发明提供的一种问题模板生成方法，所述模板生成模型是基于样本三元组信息以及所述样本三元组信息对应的样本问题模板，联合模板判别模型对抗训练得到的；所述模板判别模型用于判别生成问题模板与所述样本问题模板的真伪，所述生成问题模板是所述模板生成模型基于所述样本三元组信息进行模板生成得到的。

根据本发明提供的一种问题模板生成方法，所述将所述三元组信息输入至模板生成模型，得到所述模板生成模型输出的问题模板，包括：

对问题文本进行三元组抽取，得到所述问题文本的三元组，所述问题文本为所述文本形式的三元组信息；

将所述问题文本的三元组和所述问题文本输入至模板生成模型，得到所述模板生成模型输出的问题模板。

根据本发明提供的一种问题模板生成方法，所述对问题文本进行三元组抽取，得到所述问题文本的三元组，包括：

对所述问题文本进行实体识别，得到实体对以及各实体的类型；

对所述实体对进行关系抽取，得到实体对间的关系；

基于所述实体对、所述各实体的类型和所述实体对间的关系，构建所述问题文本的三元组。

根据本发明提供的一种问题模板生成方法，所述问题模板包括所述三元组信息中各实体的类型，以及所述三元组信息对应问题中的非实体文本。

本发明还提供一种问答方法，包括：

获取问询文本；

基于问题模板库，获取所述问询文本的答案；

所述问题模板库包含问题模板，所述问题模板是基于如上述任一种所述的问题模板生成方法生成的。

本发明还提供一种问题模板生成装置，包括：

确定模块，用于确定三元组信息，所述三元组信息的形式包括文本形式和/或三元组形式；

生成模块，用于将所述三元组信息输入至模板生成模型，得到所述模板生成模型输出的问题模板；

本发明还提供一种问答装置，包括：

获取模块，用于获取问询文本；

回答模块，用于基于问题模板库，获取所述问询文本的答案；

本发明还提供一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如上述任一种所述问题模板生成方法或上述问答方法的步骤。

本发明还提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现如上述任一种所述问题模板生成方法或上述问答方法的步骤。

本发明提供的问题模板生成方法、问答方法、装置与电子设备，通过应用模板生成模型基于输入的三元组信息进行模板生成，从而实现了问题模板的自动生成，相对于人工编写模板，极大地提高了问题模板的生成效率，节省了人力成本，并且，模板生成模型的训练样本包括文本形式和三元组形式的样本三元组信息，从而保证了问题模板的高质量，提高了模板生成方法的普适性和实用性。

附图说明

为了更清楚地说明本发明或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明提供的问题模板生成方法的流程示意图之一；

图2是本发明提供的模板生成模型训练方法的流程示意图之一；

图3是本发明提供的模板生成模型训练方法的流程示意图之二；

图4是本发明提供的问题模板生成方法的流程示意图之二；

图5是本发明提供的三元组抽取方法的流程示意图；

图6是本发明提供的知识库子图的示例图；

图7是本发明提供的实体识别模型的训练样本标签的示例图；

图8是本发明提供的实体识别模型的结构示意图；

图9是本发明提供的关系抽取模型的结构示意图；

图10是本发明提供的模板生成模型训练方法的流程示意图之三；

图11是本发明提供的问答方法的流程示意图；

图12是本发明提供的问题模板生成装置的结构示意图；

图13是本发明提供的问答装置的结构示意图；

图14是本发明提供的电子设备的结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合本发明中的附图，对本发明中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

自然语言处理技术作为人工智能领域中最重要方向之一，一直是相关领域研究人员研究的热点。特别是近年来，随着移动互联网技术的迅速发展，信息化程度日益提高，人们越发渴望能让机器理解自然语言，从而实现减少人工投入、海量数据共享等目标。如何从海量数据中高效地分析和获取有价值的信息，成为一个迫切且需要解决的问题。

基于知识库的问答系统由于能够直接回答事实类问题，满足用户快速获取知识的需求，越来越受到重视。然而，为了满足用户的各种问法，问答系统需要建立庞大的模板库。目前常见的问答系统中多采用基于人工编写的模板方案，虽然可以保证模板质量，但是模板的编写效率存在严重的问题，需要投入大量的人力才能完成模板库的建立。

对此，本发明实施例提供了一种问题模板生成方法。图1是本发明提供的问题模板生成方法的流程示意图之一，如图1所示，该方法包括：

步骤110，确定三元组信息，三元组信息的形式包括文本形式和/或三元组形式；

步骤120，将三元组信息输入至模板生成模型，得到模板生成模型输出的问题模板；

其中，模板生成模型是基于样本三元组信息以及样本三元组信息对应的样本问题模板训练得到的，样本三元组信息的形式包括文本形式和三元组形式。

具体地，三元组信息即待生成问题模板的信息，可以是文本形式，也可以是三元组形式，还可以是文本形式和三元组形式组合的形式。此处，文本形式即具有完整文本语义的句式形式，例如，“钱学森是哪一年出生于上海的？”，三元组形式可以是由实体对、各实体所属的类型以及实体对间的关系组成的元素组合形式，例如，“实体1：类型1；实体2：类型2；关系”。

考虑到目前常见的问答系统中多采用基于人工编写的模板方案，模板的编写效率较低，并且所耗费的人力成本较大。针对这一问题，本发明实施例在确定了三元组信息之后，应用预先训练完成的模板生成模型基于输入的三元组信息进行模板生成，从而得到模板生成模型输出的高质量的问题模板。此处，问题模板即具有扩展样例的通用问题句式，可以用于问答系统中的模板匹配。

另外，在执行步骤120之前，还可以预先训练得到模板生成模型，具体可通过如下方式训练得到模板生成模型：首先，收集大量样本三元组信息，此处的样本三元组信息的形式可以包括文本形式和三元组形式，并通过标注得到样本三元组信息对应的样本问题模板。随即，采用样本三元组信息以及样本三元组信息对应的样本问题模板，对初始模板生成模型进行训练，从而得到模板生成模型。此处，初始模板生成模型可以是语言模型。

需要说明的是，在对模板生成模型进行训练时，模板生成模型的输入包括两种训练样本，分别是文本形式的样本三元组信息即样本文本，以及三元组形式的样本三元组信息即样本三元组。采用样本文本以及样本文本对应的样本问题模板训练模板生成模型，目的在于让模板生成模型学习到参考模板中的三元组信息以及整个句子的完整语义信息，从而使得训练所得的模板生成模型能够为输入的问题文本生成对应的问题模板，并且问题模板的连贯性也得以保证。

再者，采用样本三元组以及样本三元组对应的样本问题模板训练模板生成模型，主要是为了利用语言模型的优势，让模板生成模型可以在没有参考文本时，根据语言模型的知识以及输入的三元组，直接生成合理的问题模板。在上述两方面综合作用下，训练所得的模板生成模型的模板生成效果得以保证，在此基础上，当应用训练所得的模板生成模型进行模板生成时，无论输入的是哪种形式的三元组信息，都可以生成质量较高的问题模板，提高了模板生成方法的普适性和实用性。

本发明实施例提供的方法，通过应用模板生成模型基于输入的三元组信息进行模板生成，从而实现了问题模板的自动生成，相对于人工编写模板，极大地提高了问题模板的生成效率，节省了人力成本，并且，模板生成模型的训练样本包括文本形式和三元组形式的样本三元组信息，从而保证了问题模板的高质量，提高了模板生成方法的普适性和实用性。

基于上述任一实施例，图2是本发明提供的模板生成模型训练方法的流程示意图之一，如图2所示，模板生成模型是基于如下步骤训练得到：

步骤210，对样本文本进行三元组抽取，得到样本文本的三元组，样本文本为文本形式的样本三元组信息；

步骤220，基于样本文本、样本文本的三元组和样本问题模板，以及样本三元组和样本三元组的样本问题模板，训练模板生成模型；样本三元组为三元组形式的样本三元组信息。

具体地，可以通过如下方式训练得到模板生成模型：首先，收集文本形式的样本三元组信息即具有完整文本语义的样本文本，以及三元组形式的样本三元组信息即包含实体对、各实体的类型以及实体对间的关系的样本三元组，并通过标注得到样本文本的样本问题模板，以及样本三元组的样本问题模板。

随即，考虑到知识库中通常以三元组的形式进行存储，并且，由于语言形式的多样性，同一种语义可能对应多个问题文本，因此，基于三元组生成问题模板的方法更具有通用性和实用性。为了进一步提高模板生成模型针对三元组进行模板生成的质量，本发明实施例对样本文本进行三元组抽取，由此得到样本文本的三元组，再根据样本文本、样本文本的三元组和样本问题模板，以及样本三元组和样本三元组的样本问题模板，对初始模板生成模型进行训练，从而得到训练完成的模板生成模型。

此处，具体的训练方式可以是同时根据样本文本对应的训练数据，以及样本三元组对应的训练数据对初始模板生成模型进行训练，也可以是先根据样本文本对应的训练数据对初始模板生成模型进行训练，再根据样本三元组对应的训练数据对前一步训练得到的中间模板生成模型进行训练，本发明实施例对此不作具体限定。

本发明实施例提供的方法，通过根据样本文本、样本文本的三元组和样本问题模板，以及样本三元组和样本三元组的样本问题模板，训练模板生成模型，保证了模板生成模型针对三元组进行模板生成的效果，同时由于模板生成模型能够学习到样本文本的完整语义信息，保证了模板生成模型所生成模板的语义连贯性，提高了基于知识库构建问题模板库的效率和质量。

基于上述任一实施例，图3是本发明提供的模板生成模型训练方法的流程示意图之二，如图3所示，步骤220包括：

步骤221，基于样本文本、样本文本的三元组和样本问题模板，对第一生成模型进行训练，得到第二生成模型；

步骤222，基于样本三元组和样本三元组的样本问题模板，对第二生成模型进行训练，得到模板生成模型。

具体地，在获取到训练样本之后，首先，可以进行模板生成模型的初步训练，根据样本文本、样本文本的三元组和样本问题模板，对初始模板生成模型即第一生成模型进行训练，从而得到第二生成模型；可以理解的是，此处的第二生成模型已具有基于三元组生成对应的问题模板的能力，同时由于输入涵盖了具体完整文本语义的样本文本，保证了模板生成模型所生成模板的语义连贯性；

在此基础上，再加入进行三元组生成功能的训练，根据样本三元组和样本三元组的样本问题模板，对步骤221所得的第二生成模型进行训练，得到模板生成模型，从而可以进一步提高模板生成模型在没有参考文本时，仅根据三元组进行模板生成的效果。

进一步地，考虑到直接将样本文本中的实体替换为三元组中的实体类型，会影响原始样本文本的语义表达准确性，进而影响模型的训练效果，同时又考虑到充分利用语言模型的特性，对此，本发明实施例采用样本文本与样本文本的三元组的组合作为第一生成模型的输入，例如，“实体1：类型1；实体2：类型2；关系[SEP]样本文本”，而不是采用替换后的样本文本作为第一生成模型的输入。

基于上述任一实施例，模板生成模型是基于样本三元组信息以及样本三元组信息对应的样本问题模板，联合模板判别模型对抗训练得到的；模板判别模型用于判别生成问题模板与样本问题模板的真伪，生成问题模板是模板生成模型基于样本三元组信息进行模板生成得到的。

具体地，在对模板生成模型进行训练时，可以以样本三元组信息为训练样本，以样本三元组信息对应的样本问题模板为训练标签，进行监督训练，使得模板生成模型可以在训练过程中学习到样本三元组信息到样本问题模板之间的映射关系，以使得训练所得的模板生成模型可以应用上述映射关系，为输入的三元组信息生成对应的问题模板，从而实现模板生成的目的。然而，应用上述监督训练方式所得的模板生成模型进行模板生成，由此得到的问题模板可能会存在失真的问题。考虑到这一点，本发明实施例采用生成对抗网络(Generative Adversarial Networks，GAN)的思路，针对模板生成模型，联合模板判别模型进行对抗训练。

在对抗训练中，可以将模板生成模型视为生成器，将模板判别模型视为判别器，作为生成器的模板生成模型可以对输入的样本三元组信息进行模板生成，从而输出生成的模板，即生成问题模板；作为判别器的模板判别模型可以对输入的模板进行判别，即区分输入的模板是生成器生成的生成问题模板，还是真实的样本问题模板。在此过程中，生成器和判别器相互博弈，生成器以输出与样本问题模板尽可能相似的生成问题模板为手段，以期实现判别器难以区分样本问题模板和生成问题模板的目的，判别器则以输出的判别结果与输入模板实际的情况一致为手段，以期实现更加准确可靠的判别效果。

本发明实施例提供的方法，通过引入模板生成和对抗机制训练模型生成模型，模板生成模型针对三元组信息的模板生成能力得以保证，模板生成模型不仅可以实现模板生成的目的，且所输出的问题模板更加贴近真实模板，问题模板的自然度和逼真度得以保证，极大地提高了问题模板的质量。

基于上述任一实施例，图4是本发明提供的问题模板生成方法的流程示意图之二，如图4所示，步骤120包括：

步骤121，对问题文本进行三元组抽取，得到问题文本的三元组，问题文本为文本形式的三元组信息；

步骤122，将问题文本的三元组和问题文本输入至模板生成模型，得到模板生成模型输出的问题模板。

具体地，当待生成问题模板的三元组信息为文本形式的三元组信息即问题文本时，可以先对问题文本进行三元组抽取，从而得到问题文本的三元组；随即，为了进一步保证所生成问题模板的质量，可以将问题文本的三元组和问题文本一起输入到模板生成模型中，由此即可得到模板生成模型输出的问题模板。此处，模板生成模型的输入可以是问题文本与问题文本的三元组进行组合的形式，例如，“实体1：类型1；实体2：类型2；关系[SEP]问题文本”。

本发明实施例提供的方法，通过对问题文本进行三元组抽取，将问题文本的三元组和问题文本一起输入到模板生成模型中，从而实现了基于无监督问题文本的自动模板生成，同时保证了所生成问题模板的质量。

基于上述任一实施例，图5是本发明提供的三元组抽取方法的流程示意图，如图5所示，步骤121中，对问题文本进行三元组抽取，得到问题文本的三元组，包括：

步骤1211，对问题文本进行实体识别，得到实体对以及各实体的类型；

步骤1212，对实体对进行关系抽取，得到实体对间的关系；

步骤1213，基于实体对、各实体的类型和实体对间的关系，构建问题文本的三元组。

具体地，可以通过如下方式对问题文本进行三元组抽取：首先，对问题文本进行实体识别，从而识别出问题文本中的实体对，以及实体对中各个实体所属的类型，此处的类型即对具有相同特点或属性的实体集合的抽象；随即，对实体对进行关系抽取，从而得到实体对间的关系；在此基础上，对于识别得到的各个实体，可以在其位置上挂载实体所属的类型，再与实体对间的关系进行组合，由此得到问题文本的三元组。

例如，问题文本为“钱学森是哪一年出生于上海的？”，对该问题文本进行实体识别，可以得到实体对“钱学森”与“上海”，以及“钱学森”所属的类型“知名人物”、“上海”所属的类型“地区”，随即，对实体对进行关系抽取，可以得到实体对间的关系“出生地”，在此基础上，即可构建问题文本的三元组“钱学森：知名人物；上海：地区；出生地”。

本发明实施例提供的方法，通过根据实体对、各实体的类型以及实体对间的关系，构建问题文本的三元组，以使后续模板生成模型能够根据该三元组生成问题模板，可以进一步提高问题模板的质量。

基于上述任一实施例，问题模板包括三元组信息中各实体的类型，以及三元组信息对应问题中的非实体文本。

具体地，问题模板即具有扩展样例的通用问题句式。区别于现有的问题模板通常为例如“×××的×××是什么”的形式，模板质量不高，而本发明实施例中应用模板生成模型基于输入的三元组信息生成对应的问题模板，所生成的问题模板可以包括三元组信息中各实体所属的具体类型，以及三元组信息对应问题中的非实体文本，进而可以提高问答系统中模板匹配的准确率。

例如，三元组信息为“钱学森：知名人物；上海：地区；出生地”，三元组信息中各实体所属的具体类型分别为“知名人物”和“地区”，三元组信息对应问题为“钱学森是哪一年出生于上海的？”，非实体文本为“是哪一年出生于”，则问题模板可以形如“<e1：知名人物>是哪一年出生于<e2：地区>”，其中，其中e1、e2为问题模板中的待代入实体。

基于上述任一实施例，对问题文本进行实体识别具体可以通过实体识别模型实现。在此之前，可以通过如下方式预先训练得到实体识别模型：

S1.1：收集训练数据，并进行预处理；

收集样本问答对文本作为训练数据，并对每个训练数据进行标注，标注样本问题文本中的命名实体。此处，样本问答对文本例如样例一：

问题：钱学森是哪一年出生于上海的？

答案：1911年

与命名实体“钱学森”相关的知识库子图如图6所示。

以样例一为例，需要标注出命名实体“钱学森”和“上海”。图7是本发明提供的实体识别模型的训练样本标签的示例图，为了方便后面模型训练，还需按照图7形式构造训练样本标签，对于样本问题文本中的每个字符，采用两个与样本问题文本等长的0-1向量，分别标注对应字符是否命名实体的开头或结尾：

S1.2：确定模型拓扑结构；

图8是本发明提供的实体识别模型的结构示意图，如图8所示，实体识别模型的模型拓扑结构包括：输入层、编码层、输出层：

输入层：由于本发明实施例中的实体识别模型采用预训练语言模型作为编码器，故输入形式为“[CLS]+样本问题文本+[SEP]”，其中[CLS]和[SEP]是预训练语言模型标识句子和分段的符号；

编码层：主要使用预训练语言模型Bert(Bidirectional EncoderRepresentations from Transformers，双向transformer的encoder)作为编码器，对输入的样本问题文本进行语义特征的编码；Bert主要由12层的transformer encoder堆叠而成，通过在大规模通用语料上进行预训练，使得编码器具有良好的提取文本上下文信息的能力，只需经过在特定任务语料上的微调，即可取得较好效果。编码层输出原始样本问题文本中每个字符对应的深度语义表征，是一个768维的向量，假设输入“[CLS]+样本问题文本+[SEP]”的长度是30，则编码层的输出是(30，768)的二维矩阵。

输出层：输出层包含两个全连接网络，一个输出样本问题文本中每个字符作为命名实体的开头的概率s_i，另一个输出样本问题文本中每个字符作为命名实体的结尾的概率e_i：

s_i＝σ(W_sh_i+b_s)

e_i＝σ(W_eh_i+b_e)

其中，σ表示sigmoid激活函数，h_i表示Bert输出的token_i对应的隐藏表示，W_s，W_e，b_s，b_e为可学习参数。

S1.3：基于步骤S1.1收集和标注的训练数据，训练实体识别模型。

训练时，首先如步骤S1.2的方式将训练数据构造成模型输入形式，输入实体识别模型，得到样本问题文本中不同字符作为命名实体开头和结尾的概率，将模型输出与步骤S1.1构造的训练样本标签计算交叉熵损失，然后进行梯度反传和参数更新，最终即可训练得到实体识别模型。

进一步地，实体识别模型还可以包括实体类型分类层，实体类型分类层用于对识别出的实体进行实体类型的分类。具体做法为将匹配到的实体首尾位置向量[h_i,h_j]，经过全连接变换后进行类型分类：

c＝softmax(W_c[h_i；h_j]+b_c)

其中，c为实体首尾位置向量[h_i,h_j]对应的预测类型，W_c，b_c为可学习参数。

实体类型分类层对应的类型标签可以通过在步骤S1.1中对训练样本中实体的类型进行标注得到，如，“钱学森”实体所属的类型为“知名人物”。

训练完成后，即可基于训练完成的实体识别模型，对问题文本进行实体识别，从而得到问题文本中的实体对以及各实体的类型，具体实现方式可以是：首先，将问题文本按照步骤S1.2中的输入形式构造实体识别模型的模型输入；随即，将构造的模型输入送入到训练完成的实体识别模型中，从而得到识别出问题文本中的实体对以及各实体的类型。

基于上述任一实施例，对实体对进行关系抽取具体可以通过关系抽取模型实现。在此之前，可以通过如下方式预先训练得到关系抽取模型：

S2.1：收集训练数据，并进行预处理；

对于步骤S1.1中标注的命名实体，保留包含两个以上实体的样本问题文本，并对每个样本问题文本中命名实体之间的关系进行标注，以样例一为例，标注出命名实体“钱学森”和“上海”的关系是“钱学森->出生地->上海”。

S2.2：确定模型拓扑结构；

图9是本发明提供的关系抽取模型的结构示意图，如图9所示，关系抽取模型的模型拓扑结构包括：输入层、编码层、输出层。

输入层：由于本发明实施例中的实体识别模型采用预训练语言模型作为编码器，故输入形式为“[CLS]+实体1+实体2+[SEP]+样本问题文本+[SEP]”；

编码层：关系抽取模型使用Bert作为编码器，对输入的样本问题文本进行语义特征的编码；Bert的结构与步骤S1.2所用相同，不再重述。编码层输出原始样本问题文本中每个字符对应的深度语义表征，是一个768维的向量，假设输入“[CLS]+实体1+实体2+[SEP]+样本问题文本+[SEP]”的长度是35，则编码层的输出是(35，768)的二维矩阵。

输出层：输出层使用[CLS]位置的隐藏表示h_[CLS]来预测实体之间的关系类型，通过一层全连接网络和softmax分类器来将h_[CLS]映射为不同关系类型的概率r：

r＝softmax(W_rh_[CLS]+b_r)

其中，W_r，b_r是可学习参数。

S2.3：基于步骤S2.1标注的训练数据，训练关系抽取模型。

训练时，首先如步骤S2.2的方式将训练数据构造成模型输入形式，输入关系抽取模型，得到问题中实体对之间的关系的概率，将模型输出与步骤S2.1构造的正确标签计算交叉熵损失，然后进行梯度反传和参数更新，最终即可训练得到关系抽取模型。

训练完成后，即可基于训练完成的关系抽取模型，对问题文本中的实体对进行关系抽取，从而得到实体对间的关系，具体实现方式可以是：首先，对问题文本中的实体对，按照步骤S2.2中的输入形式构造关系抽取模型的模型输入；随即，将构造的模型输入送入到训练完成的关系抽取模型中，从而得到关系抽取模型输出的实体对间的关系。

基于上述任一实施例，图10是本发明提供的模板生成模型训练方法的流程示意图之三，如图10所示，模板生成模型是通过如下方式训练得到的：首先，采集样本三元组信息，包括文本形式的样本三元组信息即无监督的样本文本，以及三元组形式的样本三元组信息即样本三元组，并获取样本文本对应的样本问题模板，以及样本三元组对应的样本问题模板；

随即，将样本文本输入至预先构建的三元组抽取模型中，从而得到三元组抽取模型输出的样本文本中的三元组，此处的三元组抽取模型可以包括训练完成的实体识别模型和关系抽取模型，如果样本文本中存在多个实体对，则可以每次选取一个实体对构建三元组；然后将样本文本和样本文本的三元组进行拼接，作为模板生成模型的输入，生成假的模板，而采用真实写好的样本问题模板作为模板判别模型的输入；

例如，样本文本为“钱学森是哪一年出生于上海的？”，则通过实体识别模型和关系抽取模型可以得到两个实体及其类型，钱学森(知名人物)、上海(地区)，以及两个实体的关系，关系为“出生地”，由此即可构建样本文本对应的三元组“钱学森：知名人物；上海：地区；出生地”，将样本文本和样本文本的三元组进行拼接，得到“钱学森：知名人物；上海：地区；出生地[sep]钱学森是在哪一年出生于上海的？”作为模板生成模型的输入，而模板判别模型的输入为“<e1：知名人物>是哪一年出生于<e2：地区>”。

在此基础上，即可根据样本文本、样本文本的三元组和样本问题模板，以及样本三元组和样本三元组的样本问题模板，对模板生成模型和模板判别模型进行联合对抗训练，此处，联合对抗训练的损失函数min_Gmax_DV(D,G)为：

式中，D(x)为样本问题模板x的模板判别概率，

为针对样本问题模板x的判别损失计算函数，

为针对生成问题模板G(z)的判断损失计算函数，生成问题模板G(z)为模板生成模型基于样本三元组信息进行模板生成得到的。

模板判别模型同样采用Bert，最终通过取[cls]向量进行二分类判别，判断是否是真实模板。基于此，通过对抗优化模板生成模型的生成结果，最终得到训练完成的模板生成模型。

另外，考虑到在自然语言的模板生成模型中，如果进行梯度采样，会造成梯度无法传递到模板判别模型，为了保证连续梯度，本发明实施例采用Gumble-softmax的输出去得到模板生成模型生成的整个模板的文本编码。可以理解的是，对于模板判别模型来说，当输入为真实数据时，输入为真实模板的原始文本，当输入为模板生成模型生成的数据时，输入为生成模板的文本编码。

基于上述各实施例，考虑到现有的一些基于模型的问题模板生成方法，会利用实体关系模型去提取问题中的实体关系对，然后直接将问题中的实体关系对进行替换，从而得到问题模板，此种仅替换实体对的方法通常得不到高质量的模板。

对此，本发明实施例提供了一种基于实体识别和关系抽取模型的问题模板生成方法及系统。该系统通过将三元组信息输入至模板生成模型，得到模板生成模型输出的问题模板，三元组信息包括文本形式和/或三元组形式，从而既实现了输入文本，经过三元组抽取后得到模板，又实现了输入三元组得到模板，并且，通过引入模板生成和对抗机制训练模型生成模型，极大地提高了所生成问题模板的质量。

基于上述任一实施例，本发明实施例提供了一种问答方法。图11是本发明提供的问答方法的流程示意图，如图11所示，该方法包括：

步骤1110，获取问询文本。

具体地，问询文本即用户提出的问题对应的文本，问询文本可以是人机交互过程中产生的语料数据得到，语料数据可以是文本，也可以是语音数据，可以通过语音识别对语音数据进行转写，进而得到问询文本。

步骤1120，基于问题模板库，获取问询文本的答案；

问题模板库包含问题模板，问题模板是基于如上述各方法所提供的问题模板生成方法生成的。

具体地，当获取到问询文本之后，可以将问询文本与预先构建的问题模板库中的多个问题模板进行模板匹配，从而得到问询文本对应的目标问题模板，在此基础上，即可根据该目标问题模板，获取问询文本对应的答案，并反馈给用户。此处，具体的模板匹配的方式可以是提取问询文本中的实体对，再根据该实体对进行模板匹配，从而得到目标问题模板。

另外，在执行步骤1120之前，还可以预先构建问题模板库，问题模板库中的各个问题模板可以通过如下方式生成：

首先，确定三元组信息；三元组信息即待生成问题模板的信息，可以是文本形式，也可以是三元组形式，还可以是文本形式和三元组形式组合的形式。此处，文本形式即具有完整文本语义的句式形式，例如，“钱学森是哪一年出生于上海的？”，三元组形式可以是由实体对、各实体所属的类型以及实体对间的关系组成的元素组合形式，例如，“实体1：类型1；实体2：类型2；关系”。

随即，考虑到目前常见的问答系统中多采用基于人工编写的模板方案，模板的编写效率较低，并且所耗费的人力成本较大。针对这一问题，本发明实施例在确定了三元组信息之后，应用预先训练完成的模板生成模型基于输入的三元组信息进行模板生成，从而得到模板生成模型输出的高质量的问题模板。此处，问题模板即具有扩展样例的通用问题句式，可以用于问答系统中的模板匹配。

在此之前，还可以预先训练得到模板生成模型，具体可通过如下方式训练得到模板生成模型：首先，收集大量样本三元组信息，此处的样本三元组信息的形式可以包括文本形式和三元组形式，并通过标注得到样本三元组信息对应的样本问题模板。随即，采用样本三元组信息以及样本三元组信息对应的样本问题模板，对初始模板生成模型进行训练，从而得到模板生成模型。此处，初始模板生成模型可以是语言模型。

本发明实施例提供的方法，通过应用模板生成模型基于输入的三元组信息进行模板生成，从而实现了问题模板的自动生成，基于这些问题模板构建问题模板库，极大地提高了问题模板库的构建效率和质量，在此基础上，基于问题模板库完成问答系统的模板匹配，发现用户提问的问题，从而可以快速、准确地查询到与该问题对应的答案。

下面对本发明提供的问题模板生成装置进行描述，下文描述的问题模板生成装置与上文描述的问题模板生成方法可相互对应参照。

基于上述任一实施例，本发明实施例提供一种问题模板生成装置。图12是本发明提供的问题模板生成装置的结构示意图，如图12所示，该装置包括：

确定模块1210，用于确定三元组信息，三元组信息的形式包括文本形式和/或三元组形式；

生成模块1220，用于将三元组信息输入至模板生成模型，得到模板生成模型输出的问题模板；

本发明实施例提供的装置，通过根据样本文本、样本文本的三元组和样本问题模板，以及样本三元组和样本三元组的样本问题模板，训练模板生成模型，保证了模板生成模型针对三元组进行模板生成的效果，同时由于模板生成模型能够学习到样本文本的完整语义信息，保证了模板生成模型所生成模板的语义连贯性，提高了基于知识库构建问题模板库的效率和质量。

基于上述任一实施例，模板生成模型是基于如下步骤训练得到：

对样本文本进行三元组抽取，得到样本文本的三元组，样本文本为文本形式的样本三元组信息；

基于样本文本、样本文本的三元组和样本问题模板，以及样本三元组和样本三元组的样本问题模板，训练模板生成模型；样本三元组为三元组形式的样本三元组信息。

基于上述任一实施例，基于样本文本、样本文本的三元组和样本问题模板，以及样本三元组和样本三元组的样本问题模板，训练模板生成模型，包括：

基于样本文本、样本文本的三元组和样本问题模板，对第一生成模型进行训练，得到第二生成模型；

基于样本三元组和样本三元组的样本问题模板，对第二生成模型进行训练，得到模板生成模型。

基于上述任一实施例，生成模块1220包括：

三元组抽取子模块，用于对问题文本进行三元组抽取，得到问题文本的三元组，问题文本为文本形式的三元组信息；

模板生成子模块，用于将问题文本的三元组和问题文本输入至模板生成模型，得到模板生成模型输出的问题模板。

基于上述任一实施例，三元组抽取子模块用于：

对问题文本进行实体识别，得到实体对以及各实体的类型；

对实体对进行关系抽取，得到实体对间的关系；

基于实体对、各实体的类型和实体对间的关系，构建问题文本的三元组。

下面对本发明提供的问答装置进行描述，下文描述的问答装置与上文描述的问答方法可相互对应参照。

基于上述任一实施例，本发明实施例提供一种问答装置。图13是本发明提供的问答装置的结构示意图，如图13所示，该装置包括：

获取模块1310，用于获取问询文本；

回答模块1320，用于基于问题模板库，获取所述问询文本的答案；

所述问题模板库包含问题模板，所述问题模板是基于如上述各方法所提供的问题模板生成方法生成的。

本发明实施例提供的装置，通过应用模板生成模型基于输入的三元组信息进行模板生成，从而实现了问题模板的自动生成，基于这些问题模板构建问题模板库，极大地提高了问题模板库的构建效率和质量，在此基础上，基于问题模板库完成问答系统的模板匹配，发现用户提问的问题，从而可以快速、准确地查询到与该问题对应的答案。

图14示例了一种电子设备的实体结构示意图，如图14所示，该电子设备可以包括：处理器(processor)1410、通信接口(Communications Interface)1420、存储器(memory)1430和通信总线1440，其中，处理器1410，通信接口1420，存储器1430通过通信总线1440完成相互间的通信。处理器1410可以调用存储器1430中的逻辑指令，以执行问题模板生成方法，该方法包括：确定三元组信息，所述三元组信息的形式包括文本形式和/或三元组形式；将所述三元组信息输入至模板生成模型，得到所述模板生成模型输出的问题模板；其中，所述模板生成模型是基于样本三元组信息以及所述样本三元组信息对应的样本问题模板训练得到的，所述样本三元组信息的形式包括所述文本形式和所述三元组形式。

或者，以执行问答方法，该方法包括：获取问询文本；基于问题模板库，获取问询文本的答案；问题模板库包含问题模板，问题模板是基于如上述各方法所提供的问题模板生成方法生成的。

此外，上述的存储器1430中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

另一方面，本发明还提供一种计算机程序产品，所述计算机程序产品包括计算机程序，计算机程序可存储在非暂态计算机可读存储介质上，所述计算机程序被处理器执行时，计算机能够执行上述各方法所提供的问题模板生成方法，该方法包括：确定三元组信息，所述三元组信息的形式包括文本形式和/或三元组形式；将所述三元组信息输入至模板生成模型，得到所述模板生成模型输出的问题模板；其中，所述模板生成模型是基于样本三元组信息以及所述样本三元组信息对应的样本问题模板训练得到的，所述样本三元组信息的形式包括所述文本形式和所述三元组形式。

或者，执行上述所提供的问答方法，该方法包括：获取问询文本；基于问题模板库，获取问询文本的答案；问题模板库包含问题模板，问题模板是基于如上述各方法所提供的问题模板生成方法生成的。

又一方面，本发明还提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现以执行上述各方法提供的问题模板生成方法，该方法包括：确定三元组信息，所述三元组信息的形式包括文本形式和/或三元组形式；将所述三元组信息输入至模板生成模型，得到所述模板生成模型输出的问题模板；其中，所述模板生成模型是基于样本三元组信息以及所述样本三元组信息对应的样本问题模板训练得到的，所述样本三元组信息的形式包括所述文本形式和所述三元组形式。

或者，以执行上述所提供的问答方法，该方法包括：获取问询文本；基于问题模板库，获取问询文本的答案；问题模板库包含问题模板，问题模板是基于如上述各方法所提供的问题模板生成方法生成的。

以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下，即可以理解并实施。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种问题模板生成方法，其特征在于，包括：

2.根据权利要求1所述的问题模板生成方法，其特征在于，所述模板生成模型是基于如下步骤训练得到：

3.根据权利要求2所述的问题模板生成方法，其特征在于，所述基于所述样本文本、所述样本文本的三元组和样本问题模板，以及样本三元组和所述样本三元组的样本问题模板，训练所述模板生成模型，包括：

4.根据权利要求1至3中任一项所述的问题模板生成方法，其特征在于，所述模板生成模型是基于样本三元组信息以及所述样本三元组信息对应的样本问题模板，联合模板判别模型对抗训练得到的；所述模板判别模型用于判别生成问题模板与所述样本问题模板的真伪，所述生成问题模板是所述模板生成模型基于所述样本三元组信息进行模板生成得到的。

5.根据权利要求1至3中任一项所述的问题模板生成方法，其特征在于，所述将所述三元组信息输入至模板生成模型，得到所述模板生成模型输出的问题模板，包括：

6.根据权利要求5所述的问题模板生成方法，其特征在于，所述对问题文本进行三元组抽取，得到所述问题文本的三元组，包括：

对所述实体对进行关系抽取，得到实体对间的关系；

7.根据权利要求1至3中任一项所述的问题模板生成方法，其特征在于，所述问题模板包括所述三元组信息中各实体的类型，以及所述三元组信息对应问题中的非实体文本。

8.一种问答方法，其特征在于，包括：

获取问询文本；

基于问题模板库，获取所述问询文本的答案；

所述问题模板库包含问题模板，所述问题模板是基于如权利要求1至7中任一项所述的问题模板生成方法生成的。

9.一种问题模板生成装置，其特征在于，包括：

10.一种问答装置，其特征在于，包括：

获取模块，用于获取问询文本；

11.一种电子设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现如权利要求1至7任一项所述问题模板生成方法或如权利要求8所述问答方法的步骤。

12.一种非暂态计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至7任一项所述问题模板生成方法或如权利要求8所述问答方法的步骤。