WO2021109690A1

WO2021109690A1 - 多类型问题智能问答方法、系统、设备及可读存储介质

Info

Publication number: WO2021109690A1
Application number: PCT/CN2020/117816
Authority: WO
Inventors: 张圣
Original assignee: 平安科技（深圳）有限公司
Priority date: 2020-06-17
Filing date: 2020-09-25
Publication date: 2021-06-10
Also published as: CN111858877A

Abstract

一种人工智能技术领域的多类型问题智能问答方法、系统、设备及计算机可读存储介质。该方法包括：在接收到目标问题时，基于预设深度网络模型对所述目标问题进行意图分类，以确定所述目标问题的问题类型；在检测到所述目标问题为第一问题类型时，对第一目标问题进行实体识别与多层次语义解析，以获取所述第一目标问题的问题模板与多层次语义，并根据所述问题模板与多层次语义，生成所述第一目标问题的答复信息；在检测到所述目标问题为第二问题类型时，确定第二目标问题的关联问题集，并基于多轮问答技术接收客户端对于所述关联问题集的多重关联答复，以基于所述多重关联答复生成所述第二目标问题。

Description

多类型问题智能问答方法、系统、设备及可读存储介质

本申请要求于2020年6月17日提交中国专利局、申请号为202010558326.1，发明名称为“多类型问题智能问答方法、系统、设备及可读存储介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及人工智能技术领域，尤其涉及一种多类型问题智能问答方法、系统、设备及计算机可读存储介质。

背景技术

现有智能问答系统的核心是可以准确理解问题语义，返回高质量的答案。发明人意识到，目前疫苗等医学领域的问答系统大多是两类，一类是基于常见问题解答（FQA，Frequently Asked Questions）技术的问答系统，只能覆盖有确定性答案的问题；另一类是基于知识库问答（KB-QA，knowledge base question answering）技术的问答系统，只能覆盖部分简单的不存在唯一答案的问题，而现有智能问答系统在对其他语义更为复杂，答案更为多样，或是需要在获取多重相关信息后才可进行回答的问题进行回复时，往往难以为问题提出方提供准确的答复，因而导致了现有智能问答系统的问题回复准确性不高的技术问题。

技术解决方案

本申请的主要目的在于提供一种多类型问题智能问答方法、系统、设备及计算机可读存储介质，旨在解决现有智能问答系统的问题回复准确性不高的技术问题。

为实现上述目的，本申请提供一种多类型问题智能问答方法，所述多类型问题智能问答方法包括以下步骤：

在接收到目标问题时，基于预设深度网络模型对所述目标问题进行意图分类，以确定所述目标问题的问题类型；

在检测到所述目标问题为第一问题类型时，对第一目标问题进行实体识别与多层次语义解析，以获取所述第一目标问题的问题模板与多层次语义，并根据所述问题模板与多层次语义，生成所述第一目标问题的答复信息，所述第一目标问题为第一问题类型的目标问题；

在检测到所述目标问题为第二问题类型时，确定第二目标问题的关联问题集，并基于多轮问答技术接收客户端对于所述关联问题集的多重关联答复，以基于所述多重关联答复生成所述第二目标问题的答复信息，所述第二目标问题为第二问题类型的目标问题。

此外，为实现上述目的，本申请还提供一种多类型问题智能问答系统，所述多类型问题智能问答系统包括：

意图分类模块，用于在接收到目标问题时，基于预设深度网络模型对所述目标问题进行意图分类，以确定所述目标问题的问题类型；

第一问题答复模块，用于在检测到所述目标问题为第一问题类型时，对第一目标问题进行实体识别与多层次语义解析，以获取所述第一目标问题的问题模板与多层次语义，并根据所述问题模板与多层次语义，生成所述第一目标问题的答复信息，所述第一目标问题为第一问题类型的目标问题

第二问题答复模块，用于在检测到所述目标问题为第二问题类型时，确定第二目标问题的关联问题集，并基于多轮问答技术接收客户端对于所述关联问题集的多重关联答复，以基于所述多重关联答复生成所述第二目标问题的答复信息，所述第二目标问题为第二问题类型的目标问题。

此外，为实现上述目的，本申请还提供一种多类型问题智能问答设备，所述多类型问题智能问答设备包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的多类型问题智能问答程序，其中所述多类型问题智能问答程序被所述处理器执行时，实现如下步骤：

此外，为实现上述目的，本申请还提供一种计算机可读存储介质，所述计算机可读存储介质上存储有多类型问题智能问答程序，其中所述多类型问题智能问答程序被处理器执行时，实现如下步骤：

本申请使得能够准确回复需要获知多重相关信息的第二目标问题，从而使得系统能够对其他语义更为复杂，答案更为多样，或是需要在获取多重相关信息后才可进行回答的问题进行准确回复，解决了现有智能问答系统的问题回复准确性不高的技术问题。

附图说明

图1为本申请实施例方案中涉及的多类型问题智能问答设备的硬件结构示意图；

图2为本申请多类型问题智能问答方法第一实施例的流程示意图；

图3为本申请多类型问题智能问答方法一具体实施例中融合问题模板与多层次语义解析的KBQA技术框架示意图。

本发明的实施方式

应当理解，此处所描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

本申请实施例涉及的多类型问题智能问答方法主要应用于多类型问题智能问答设备，该多类型问题智能问答设备可以是PC、便携计算机、移动终端等具有显示和处理功能的设备。

参照图1，图1为本申请实施例方案中涉及的多类型问题智能问答设备的硬件结构示意图。本申请实施例中，多类型问题智能问答设备可以包括处理器1001（例如CPU），通信总线1002，用户接口1003，网络接口1004，存储器1005。其中，通信总线1002用于实现这些组件之间的连接通信；用户接口1003可以包括显示屏（Display）、输入单元比如键盘（Keyboard）；网络接口1004可选的可以包括标准的有线接口、无线接口（如WI-FI接口）；存储器1005可以是高速RAM存储器，也可以是稳定的存储器（non-volatile memory），例如磁盘存储器，存储器1005可选的还可以是独立于前述处理器1001的存储装置。

本领域技术人员可以理解，图1中示出的硬件结构并不构成对多类型问题智能问答设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

继续参照图1，图1中作为一种计算机可读存储介质的存储器1005可以包括操作系统、网络通信模块以及多类型问题智能问答程序。

在图1中，网络通信模块主要用于连接服务器，与服务器进行数据通信；而处理器1001可以调用存储器1005中存储的多类型问题智能问答程序，并执行以下操作：

进一步地，所述在接收到目标问题时，基于预设深度网络模型对所述目标问题进行意图分类，以确定所述目标问题的问题类型的步骤包括：

在接收到目标问题时，将所述目标问题输入预训练语言表征模型，得到所述目标问题对应词序列的序列表征向量；

将所述序列表征向量输入预设双向长短时记忆网络中，得到所述词序列的隐藏向量；

结合所述序列表征向量与所述隐藏向量，确定所述目标问题的问题类型。

进一步地，所述在检测到所述目标问题为第一问题类型时，对第一目标问题进行实体识别与多层次语义解析，以获取所述第一目标问题的问题模板与多层次语义，并根据所述问题模板与多层次语义，生成所述第一目标问题的答复信息的步骤包括：

在检测到所述目标问题为第一问题类型时，基于离线处理方式，使用预设实体识别模型识别出所述第一目标问题的实体信息，并基于所述实体信息得到所述问题模板；

基于线上处理方式，对所述第一目标问题进行多层次语义解析，得到所述第一目标问题的多层次语义；

使用预设概率图模型，并结合所述问题模板与所述多层次语义，预测所述第一目标问题对应到知识图谱中的属性类别；

根据所述属性类别与所述实体信息，将所述第一目标问题转换为知识图谱的结构化查询，以得到所述第一目标问题的答复信息，所述第一目标问题的答复信息存储于区块链中。

进一步地，所述对所述第一目标问题进行多层次语义解析，得到所述第一目标问题的多层次语义的步骤包括：

使用预设语义搜索模型对所述第一目标问题进行实体层语义解析，获取实体层语义；

使用预设动词模板对所述第一目标问题进行细粒度语义表示，获取所述第一目标问题的短语层语义；

基于所述问题模板将所述第一目标问题的实体信息进行概念映射，获取所述第一目标问题的问题层语义，以将所述实体层语义、短语层语义与问题层语义作为所述多层次语义。

进一步地，所述在检测到所述目标问题为第二问题类型时，确定第二目标问题的关联问题集，并基于多轮问答技术接收客户端对于所述关联问题集的多重关联答复，以基于所述多重关联答复生成所述第二目标问题的答复信息的步骤包括：

在检测到所述目标问题为第二问题类型时，从预设关联问题库中确定所述关联问题集，并围绕所述关联问题集与客户端进行多轮问答；

接收多轮问答中客户端发送的所述多重关联答复，并根据所述多重关联答复进行槽填充；

在检测到槽填充完成时，基于预设深度网络序列标注模型，将所述多重关联答复转化为可用信息，以使用所述可用信息生成所述第二目标问题的答复信息，所述第二目标问题的答复信息存储于区块链中。

进一步地，所述接收多轮问答中客户端发送的所述多重关联答复，并根据所述多重关联答复进行槽填充的步骤包括：

从所述多重关联答复中提取出初始槽位信息；

判断所述初始槽位信息是否符合预设有效性标准，并在所述初始槽位信息不符合预设有效性标准时，使用澄清话术进行澄清表达；

在接收到客户端发送的对于所述澄清话术的修正回复时，根据所述修正回复修正所述初始槽位信息，直至修正后的初始槽位信息符合所述有效性标准；

对修正后的初始槽位信息进行标准化处理，并将经标准化处理后的初始槽位信息作为目标槽位信息，以基于所述目标槽位信息进行槽填充。

进一步地，所述在接收到目标问题时，基于预设深度网络模型对所述目标问题进行意图分类，以确定所述目标问题的问题类型的步骤之后，还包括：

在检测到所述目标问题为第三问题类型时，将第三问题类型的目标问题作为第三目标问题，并获取所述第三目标问题与基于预设聚类算法所构建的标准问题集之间的问题相似度；

将所述第三目标问题映射在所述标准问题集中的相似标准问题上，并获取所述相似标准问题的标准回复，以基于所述标准回复生成所述第三目标问题的答复信息，所述相似标准问题在所述标准问题集中与所述目标问题之间的问题相似度最高。

基于上述硬件结构，提出本申请多类型问题智能问答方法的各个实施例。

对于传统的问答系统，主要是以机器自动回答用户所提出来的自然语言问题。目前问答系统主要覆盖的问题主要可以分为三类：事实型问题、观点型问题与任务型问题。事实型问题主要是有确定性的答案的知识型的问题，比如“麻腮风疫苗可以预防哪些疾病？”；观点型问题一般是不存在唯一标准答案的问题，比如“疫苗免费的好还是自费的好？”；而任务型问题一般需要从用户连续的对话中获取任务所需的信息，比如“预约接种疫苗”需要知道接种疫苗种类、预约接种时间、接种地点等信息才可以完成相关问题。

现有智能问答系统的核心是可以准确理解问题语义，返回高质量的答案。目前疫苗等医学领域的问答系统大多是两类，一类是基于常见问题解答（FQA，Frequently Asked Questions）技术的问答系统，只能覆盖有确定性答案的问题；另一类是基于知识库问答（KB-QA，knowledge base question answering）技术的问答系统，只能覆盖部分简单的不存在唯一答案的问题，而现有智能问答系统在对其他语义更为复杂，答案更为多样，或是需要在获取多重相关信息后才可进行回答的问题进行回复时，往往难以为问题提出方提供准确的答复，因而导致了现有智能问答系统的问题回复准确性不高的技术问题。

为解决上述问题，本申请提供一种多类型问题智能问答方法，即通过深度网络模型确定目标问题的问题类型，提升了问题定位的准确性；通过针对第一目标问题进行实体识别与多层次语义解析，有效降低了模型复杂度，实现了对于第一目标问题的语义的深层次理解，从而能够高效精准地回复具有复杂语义的第一目标问题；通过针对第二目标问题与客户端展开多轮问答，直至获取到客户端对于关联问题集的关联答复，使得能够准确回复需要获知多重相关信息的第二目标问题，从而使得系统能够对其他语义更为复杂，答案更为多样，或是需要在获取多重相关信息后才可进行回答的问题进行准确回复，从而解决了现有的智能问答系统所支持回答的问题类型不全面的技术问题。本申请应用于多类型问题智能问答系统。

参照图2，图2为本申请多类型问题智能问答方法第一实施例的流程示意图。

本申请第一实施例提供一种多类型问题智能问答方法，所述多类型问题智能问答方法包括以下步骤：

步骤S10，在接收到目标问题时，基于预设深度网络模型对所述目标问题进行意图分类，以确定所述目标问题的问题类型；

在本实施例中，目标问题通常为用户通过客户端以自然语言输入或语音输入等方式向多类型问题智能问答系统输入的需要获得回复的问题。预设深度网络模型融合了Transformer的双向编码器表征(BERT，Bidirectional Encoder Representations from Transformers)与双向长短时记忆网络(Bi-LSTM,Bi-directional Long Short-Term Memory)。意图分类旨在将用户所提出的目标问题通过深度网络模型进行分类。问题类型具体可包括常见型问题、事实性问题、任务型问题与其他无关问题。多类型问题智能问答系统（以下简称系统）在接收到用户所提出的当前需要答复的目标问题时，将目标问题作为模型输入BERT层，BERT层得到所述用户问题对应词序列的序列表征向量。系统在获取到词序列的序列表征向量后，再将序列表征向量输入Bi-LSTM层，得到目标问题的词序列的隐藏向量。系统结合序列表征向量和隐藏向量学习得到目标表征向量，并经过全连接层以及Softmax（输出层的激励函数）操作，即可得到目标问题的所属分类，也即是上述分类结果。

步骤S20，在检测到所述目标问题为第一问题类型时，对第一目标问题进行实体识别与多层次语义解析，以获取所述第一目标问题的问题模板与多层次语义，并根据所述问题模板与多层次语义，生成所述第一目标问题的答复信息，其中，所述第一目标问题为第一问题类型的目标问题；

在本实施例中，第一问题类型具体可为事实型、观点型、任务型或其他类型，优选为观点型。当系统识别出当前的目标问题属于观点型问题时，采用KBQA技术进行答复。KBQA技术即采用知识库问答（KB-QA，knowledge base question answering）技术，通过给定自然语言问题，对问题进行语义理解和解析，进而利用知识库进行查询、推理得出答案。具体的，从应用领域的角度划分，知识库问答可以分为开放域的知识问答，如百科知识问答，和特定域的知识问答，如金融领域，医疗领域，宗教领域等。系统先对第一目标问题的实体进行识别，以根据第一目标问题的实体信息得到与第一目标问题相关的问题模板，并对第一目标问题进行多层次语义识别，以深度理解第一目标问题的语义。最后结合得到的问题模板与解析出的多层次语义，进行知识图谱的结构化查询，以生成第一目标问题的答复信息。

步骤S30，在检测到所述目标问题为第二问题类型时，确定第二目标问题的关联问题集，并基于多轮问答技术接收客户端对于所述关联问题集的多重关联答复，以基于所述多重关联答复生成所述第二目标问题的答复信息，其中，所述第二目标问题为第二问题类型的目标问题。

在本实施例中，第二问题类型具体可为事实型、观点型、任务型或其他类型，优选为任务型。多轮问答技术为，先获取用户端输入的初始信息也即是第二目标问题，并对初始信息进行识别，确定出在不同条件组合下对应不同答案的预定问题，也即是关联问题集，并开始进行对于所确定的预定问题的第一轮问答。在每一轮问答中，输出对于所确定的预定问题的一个未知条件的提问，以供用户回答。在获取到用户所答复的条件，也即是多重关联答复时，根据预定的条件组合和答案之间的对应关系，判断已获取的条件的组合是否存在对应的答案。若存在，则输出已获取的条件的组合所对应的答案；若不存在，则进行下一轮问答。系统可融合了FAQ、KBQA、多轮问答等技术，按照当前目标问题所对应的实际分类结果，选择最适用于答复目标问题的目标技术类型。具体地，若系统识别出当前的目标问题为常见型问题，则可选用基于预设聚类算法的常见问题解答方式进行处理；若系统识别出当前的目标问题为事实型问题，则可采用结合问题模板生成与多层次语义解析的KBQA技术进行处理；若系统识别出当前的目标问题为任务线问题，则可选用基于槽填充的多轮问答技术进行处理，以得到针对当前目标问题的答复信息并向用户端进行输出。

在本实施例中，通过在接收到目标问题时，基于预设深度网络模型对所述目标问题进行意图分类，以确定所述目标问题的问题类型；在检测到所述目标问题为第一问题类型时，对第一目标问题进行实体识别与多层次语义解析，以获取所述第一目标问题的问题模板与多层次语义，并根据所述问题模板与多层次语义，生成所述第一目标问题的答复信息，其中，所述第一目标问题为第一问题类型的目标问题；在检测到所述目标问题为第二问题类型时，确定第二目标问题的关联问题集，并基于多轮问答技术接收客户端对于所述关联问题集的多重关联答复，以基于所述多重关联答复生成所述第二目标问题的答复信息，其中，所述第二目标问题为第二问题类型的目标问题。通过上述方式，本申请通过深度网络模型确定目标问题的问题类型，提升了问题定位的准确性；通过针对第一目标问题进行实体识别与多层次语义解析，有效降低了模型复杂度，实现了对于第一目标问题的语义的深层次理解，从而能够高效精准地回复具有复杂语义的第一目标问题；通过针对第二目标问题与客户端展开多轮问答，直至获取到客户端对于关联问题集的关联答复，使得能够准确回复需要获知多重相关信息的第二目标问题，从而使得系统能够对其他语义更为复杂，答案更为多样，或是需要在获取多重相关信息后才可进行回答的问题进行准确回复，解决了现有智能问答系统的问题回复准确性不高的技术问题。

进一步地，图中未示的，基于上述图2所示的第一实施例，提出本申请多类型问题智能问答方法的第二实施例，本实施例中，步骤S10具体包括：

本实施例中，预训练语言表征模型即为上述BERT，BERT是基于双向Transformer的自然语言预训练模型，再结合自然语言处理（NLP，Natural Language Processing)具体下游任务组合其他网络层形成适应于特定任务的模型。需要说明BERT模型中[CLS]可以对整个句子进行向量表示。BERT模型在每个句子的词序列前面加一个特殊的记号[CLS]，基于Transformer网络结构可以将整个句子的全局信息编码到每个位置，BERT模型对[CLS]进行深度表征可以学到整个句子的上层特征。

具体地，对于一句话先将句子分词得到句子的词序列 w ₁ ， w ₂ ……， w _n ，并在整个句子的输入序列开头增加[CLS]得到模型的输入序列 w _[CLS ， w ₁ ，…… w _n 。通过BERT层获取的得到词序列的表征向量 e _[CLS ， e ₁ ， e ₂ ……， e _n ，其中 e _[CLS 可以学习到整个句子的上层特征。将一句话的词向量 e ₁ ， e ₂ ……， e _n 输入Bi-LSTM层，到隐藏向量 h ₁ ， h ₂ ……， h _n 。Bi-LSTM可以很好的学习到对应词前后的语义信息，可以将更深层次的语义信息融入到模型中。然后将上一层得到的隐藏向量 h ₁ ， h ₂ ……， h _n 与BERT层[CLS]的表征向量 e _[CLS 进行Attention（注意力机制）操作，做一个近似于加权求和的操作，得到目标表征向量Vector。将学习到的目标表征向量Vector经过全连接层以及Softmax操作，得到输入句子（目标问题）的所属分类，也即是上述问题类型。

进一步地，在本实施例中，步骤S20包括：

在本实施例中，需要说明的是系统中的KBQA模块主要包含离线处理和线上输出两个部分。离线处理部分的主要功能是利用QA语料、只是图谱的信息，从中抽取模板构建问题模板库。具体地，系统中KBQA模块的离线处理部分使用基于长短时记忆（LSTM，Long Short-Term Memory）-条件随机场（CRF，conditional random field）的实体识别模型可以从自然语句中识别出实体部分，通过对QA语料中的自然语句进行实体识别操作后，可以将自然语句中的实体映射到对应的概念上，从而减少大量重复的问题，而且将问题概念化可以辅助模型学习到更精准的语义信息。通过知识图谱中的属性（关系类型）进行属性扩展获取得到更多的关系表达。通过对QA语料中的实体概念映射以及对知识图谱的属性扩展从而获取得到高质量的问题模板。

在本实施例中，线上处理部分的主要功能是对第一目标问题进行解析获取得到实体以及对应的属性类型，并将其转换成知识图谱结构化查询，最终将第一目标问题的答案返回给用户。系统中KBQA模块的线上处理部分先对第一目标问题进行多层次语义解析，再使用预设的概率图模型综合使用问题的语义解析结果，以及通过离线处理部分获取到的问题模板，预测出第一目标问题对应到知识图谱中的属性类型，也即是实现问题语义解析。模型预测与知识图谱查询的功能。线上处理部分最后根据得到的属性类型以及模型识别出的第一目标问题中的实体等信息，将第一目标问题转换成知识图谱的结构化查询，并将第一目标问题的答案返回到用户端。需要强调的是，为进一步保证上述第一目标问题的答复信息的私密和安全性，上述第一目标问题的答复信息还可以存储于一区块链的节点中。

进一步地，在本实施例中，所述对所述第一目标问题进行多层次语义解析，得到所述第一目标问题的多层次语义的步骤包括：

在本实施例中，多层次语义解析包括实体层语义解析、短语层语义解析与问题层语义解析。KBQA模块中的线上处理部分使用预设语义搜索模型，基于知识图谱的实体语义理解，为上层语义计算获取实体层语义信息；主要使用动词模板用来进行细粒度的语义表示，并综合使用上下文信息进行实体的概念化，以获取短语层语义信息；还基于问题模板的表示方法，将第一目标问题中的实体映射到概念上，进一步表示第一目标问题的语义，以获取问题层语义信息。

作为一具体实施例，第一目标问题为观点型问题。如图3所示，图3为融合问题模板与多层次语义解析的KBQA技术框架示意图。系统中的KBQA模块具体可分为离线处理与线上处理两部分。离线处理部分中离线处理模块主要是利用QA语料、知识图谱的信息从中抽取模板构建出问题模板库；而线上处理部分包括问题解析子模块、模型预测子模块与知识图谱查询子模块，基于这些子模块将观点型问题转换成知识图谱的结构化查询，以获取目标问题的答案。

在本实施例中，进一步通过融合问题模板以及多层次的语义解析技术，可以有效的降低模型的复杂度，并且可以深层次理解问题，提高了模型的精度；通过对QA语料中的自然语句进行实体识别操作后，可以将自然语句中的实体映射到对应的概念上，从而减少大量重复的问题，而且将问题概念化可以辅助模型学习到更精准的语义信息；通过知识图谱中的属性类型进行属性扩展可以获取得到更多的属性表达；通过对问答（QA，Question Answering）语料的中实体概念映射以及对知识图谱的属性扩展从而获取得到高质量的问题模板。

进一步地，图中未示的，基于上述图2所示的第一实施例，提出本申请多类型问题智能问答方法的第三实施例。本实施例中，所述步骤S30包括：

在本实施例中，预设关联问题库为预先设定的用于将第二目标问题拆分为多个子问题的问题库。

系统在检测到目标问题属于第二问题类型时，则可对第二目标问题进行语义识别，并根据语义识别结果从预设的关联问题库中确定出与用于回答第二目标问题的多个子问题，也即是上述关联问题集。可采用多轮问答技术，系统中的用于答复第二目标问题的多轮问答模块围绕关联问题集与客户端进行多轮问答，并在接收到客户端发送的针对关联问题集的多重关联回复时，根据客户端的多重关联回复进行槽填充；多轮问答模块使用预设深度网络序列标注模型，将客户端的多重关联回复转化为可用信息，以根据可用信息生成第二目标问题的答复信息。其中，预设深度网络序列标注模型即为LSTM-CRF模型。需要强调的是，为进一步保证上述第二目标问题的答复信息的私密和安全性，上述第二目标问题的答复信息还可以存储于一区块链的节点中。

进一步地，在本实施例中，所述接收多轮问答中客户端发送的所述多重关联答复，并根据所述多重关联答复进行槽填充的步骤包括：

从所述多重关联答复中提取出初始槽位信息；

在本实施例中，初始槽位信息为根据用户针对关联问题集的回复中的关键信息。例如，关于“预约疫苗接种”这一任务型问题，“预约疫苗接种”需要知道疫苗名称、疫苗种类（一类、二类）、疫苗接种点、预约接种时间等。预约疫苗接种需要知道四个信息，这四个信息即是四个槽位。预设有效性标准为，判断能否根据从客户端所发送的问题或回复消息中提取出的槽位信息来完成填槽的标准条件，可根据实际需求灵活设置，例如，对于预约疫苗接种这一任务型问题，客户端发送的回复语句当中没有关于疫苗种类的信息，则系统可判定当前仍不满足有效性标准，需要继续进行问答以获取必要信息。修正回复为用户对于系统发出的澄清表达的回复信息，例如，用户在关于预约疫苗接种这一任务型问题与系统进行多轮问答时，为说明关于疫苗种类这一槽位的信息，系统终端多轮问答模块则会向客户端发送类似于“需要预约接种哪一种类的疫苗”等的澄清表达，以便客户端用户进行明确答复。系统中的多轮问答模块从所述多重关联答复中提取出初始槽位信息，并判断初始槽位信息是否符合预设有效性标准。若初始槽位信息符合预设有效性标准，则可判定当前以完成关于第二目标问题的问答；若初始槽位信息中有一个或多个不符合预设有效性标准，则使用澄清话术机械能澄清表达。多轮问答模块在接收到客户端发送的对于澄清话术的修正回复时，根据修正回复修正初始槽位信息，并对修正后的初始槽位信息进行标准化处理，以将经标准化处理后的初始槽位信息作为目标槽位信息，此时则可判定完成槽填充，无需再进行问答。

作为一具体实施例，设定第二目标问题为任务型问题。以下以“预约疫苗接种”为例说明多轮问答的流程。“预约疫苗接种”需要知道疫苗名称、疫苗种类（一类、二类）、疫苗接种点、预约接种时间等。预约疫苗接种需要知道四个信息，这四个信息即是四个槽位，从与用户的对话中获取四个槽位的信息即是填槽（槽填充）。首先需要从用户的初始问题中获取四个槽位的信息，当检测到当前存在槽位的信息没有填写时，需要使用澄清话术进行澄清表达，比如针对疫苗接种点的澄清话术是“您想预约接种疫苗的疫苗接种点是哪个？”，并提供候选项给用户进行选择，用户也可以直接使用自然语言进行回复。槽与槽之间的是否有依赖关系可以分为依赖槽和平级槽，疫苗种类这个槽是依赖于疫苗名称的，预约的接种时间是依赖于疫苗接种点。依赖槽在澄清时需要有先后顺序，比如需要获取疫苗接种点的信息，才能澄清可预约的时间信息。当用户使用自然语言进行回复时，系统使用基于LSTM-CRF深度网络序列标注模型来获取可用信息。比如当疫苗接种点信息需要澄清时，机器提问“您想预约接种疫苗的疫苗接种点是哪个？”，并提供候选项给用户。如果用户是从候选项进行选择，则直接填槽；如果用户是使用自然语言进行回复，比如“预约某疫苗接种点”，需要使用序列标注模型可以获取到“预约【某疫苗接种点】(疫苗接种点)”，然后需要验证从对话中获取的槽位信息的合法性，这里需要验证疫苗接种点是否在可供选择的范围内。然后继续澄清其他需要填写的槽位信息。比如用户“预约明天上午10点钟去XXX疫苗接种点接种乙肝疫苗。”，使用序列标注模型可以获取到“预约【明天上午10点钟】（预约接种时间）去【XXX疫苗接种点】（疫苗接种点）接种【乙肝疫苗】（疫苗名称）”，然后将从自然语句中获取的不同槽位的信息进行标准化处理和验证信息是否合法。比如需要将明天上午10点钟映射成标准时间信息，需要验证用户提及的疫苗接种点和预约接种时间是否在可供选择的范围内等等。当获取了所有的槽位信息后，需要将所有的槽位信息与用户进行再次确认，确认无误后即可完成需要使用的信息。

进一步地，在本实施例中，在步骤S10之后，还包括：

在本实施例中，第三问题类型具体可为事实型、观点型、任务型或其他类型，优选为事实型。预设聚类算法可选用具有噪声的基于密度的聚类方法（DBSCAN，Density-Based Spatial Clustering of Applications with Noise）、期望最大化（EM，expectation maxmization）聚类算法、K均值（K-means）聚类算法等，优选为K-means聚类算法。常见问题回答方式即采用常见问题解答（FQA，Frequently Asked Questions）技术，FAQ是当前网络上提供在线帮助的主要手段，通过事先组织好一些可能的常问问答对，发布在网页上为用户提供咨询服务。

FAQ技术通过模型计算用户问题和已有的标准问题之间的相似度，将用户的问题映射到已有的标准问题上从而实现问答。系统在FAQ模块使用的模型是复用了意图分类模块中的融合BERT与BiLSTM的深度学习模型，模型的输入是用户的问题，模型的输出是与第三目标问题相似度最高的标准问题对应的答案。FAQ技术能覆盖的问题的种类数取决于设计的标准问题的多少，目前标准问题多是通过人工整理得到，能覆盖的问题的种类数比较少。而本申请中的系统基于机器学习聚类算法K-means算法从海量的领域问答语料中自动构建大量高质量的标准问题。自动构建高质量的标准问题主要包括三步：第一步，从高质量疫苗垂直型网站数据源获取初始的问题；第二步，通过聚类算法将相似的问题聚成一簇；第三步，筛选标准问题并获取答案。在实际应用中，通过该步骤可构建五千左右疫苗领域的高质量标准问题集合。

在本实施例中，进一步通过在系统中的多轮问答模块中基于槽填充、多轮对话技术，高效解决了任务型问题，尤其是针对疫苗问答相关的任务型问题；通过在FAQ模块中基于K-means聚类算法自动构建大规模高质量的标准问题集，从而减少了人工整理标注标准问题集的成本。

本申请所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain)，本质上是一个去中心化的数据库，是一串使用密码学方法相关联产生的数据块，每一个数据块中包含了一批次网络交易的信息，用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。

此外，本申请实施例还提供一种多类型问题智能问答系统。本实施例中，所述多类型问题智能问答系统包括：

上述多类型问题智能问答系统中各个模块与上述多类型问题智能问答方法实施例中各步骤相对应，其功能和实现过程在此处不再一一赘述。

本申请还提供一种多类型问题智能问答设备。

所述多类型问题智能问答设备包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的多类型问题智能问答程序，其中所述多类型问题智能问答程序被所述处理器执行时，实现如上所述的多类型问题智能问答方法的步骤。

所述多类型问题智能问答程序被执行时所实现的方法可参照本申请多类型问题智能问答方法的各个实施例，此处不再赘述。

此外，本申请实施例还提供一种计算机可读存储介质，所述计算机可读存储介质可以是非易失性的，也可以是易失性的。

本申请计算机可读存储介质上存储有多类型问题智能问答程序，其中所述多类型问题智能问答程序被处理器执行时，实现如上述的多类型问题智能问答方法的步骤。

多类型问题智能问答程序被执行时所实现的方法可参照本申请多类型问题智能问答方法的各个实施例，此处不再赘述。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。

上述本申请实施例序号仅仅为了描述，不代表实施例的优劣。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本申请各个实施例所述的方法。

以上仅为本申请的优选实施例，并非因此限制本申请的专利范围，凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本申请的专利保护范围内。

Claims

一种多类型问题智能问答方法，其中，所述多类型问题智能问答方法包括以下步骤：

在接收到目标问题时，基于预设深度网络模型对所述目标问题进行意图分类，以确定所述目标问题的问题类型；

在检测到所述目标问题为第一问题类型时，对第一目标问题进行实体识别与多层次语义解析，以获取所述第一目标问题的问题模板与多层次语义，并根据所述问题模板与多层次语义，生成所述第一目标问题的答复信息，所述第一目标问题为第一问题类型的目标问题；

在检测到所述目标问题为第二问题类型时，确定第二目标问题的关联问题集，并基于多轮问答技术接收客户端对于所述关联问题集的多重关联答复，以基于所述多重关联答复生成所述第二目标问题的答复信息，所述第二目标问题为第二问题类型的目标问题。
如权利要求1所述的多类型问题智能问答方法，其中，所述在接收到目标问题时，基于预设深度网络模型对所述目标问题进行意图分类，以确定所述目标问题的问题类型的步骤包括：

在接收到目标问题时，将所述目标问题输入预训练语言表征模型，得到所述目标问题对应词序列的序列表征向量；

将所述序列表征向量输入预设双向长短时记忆网络中，得到所述词序列的隐藏向量；

结合所述序列表征向量与所述隐藏向量，确定所述目标问题的问题类型。
如权利要求1所述的多类型问题智能问答方法，其中，所述在检测到所述目标问题为第一问题类型时，对第一目标问题进行实体识别与多层次语义解析，以获取所述第一目标问题的问题模板与多层次语义，并根据所述问题模板与多层次语义，生成所述第一目标问题的答复信息的步骤包括：

在检测到所述目标问题为第一问题类型时，基于离线处理方式，使用预设实体识别模型识别出所述第一目标问题的实体信息，并基于所述实体信息得到所述问题模板；

基于线上处理方式，对所述第一目标问题进行多层次语义解析，得到所述第一目标问题的多层次语义；

使用预设概率图模型，并结合所述问题模板与所述多层次语义，预测所述第一目标问题对应到知识图谱中的属性类别；

根据所述属性类别与所述实体信息，将所述第一目标问题转换为知识图谱的结构化查询，以得到所述第一目标问题的答复信息，所述第一目标问题的答复信息存储于区块链中。
如权利要求3所述的多类型问题智能问答方法，其中，所述对所述第一目标问题进行多层次语义解析，得到所述第一目标问题的多层次语义的步骤包括：

使用预设语义搜索模型对所述第一目标问题进行实体层语义解析，获取实体层语义；

使用预设动词模板对所述第一目标问题进行细粒度语义表示，获取所述第一目标问题的短语层语义；

基于所述问题模板将所述第一目标问题的实体信息进行概念映射，获取所述第一目标问题的问题层语义，以将所述实体层语义、短语层语义与问题层语义作为所述多层次语义。
如权利要求1所述的多类型问题智能问答方法，其中，所述在检测到所述目标问题为第二问题类型时，确定第二目标问题的关联问题集，并基于多轮问答技术接收客户端对于所述关联问题集的多重关联答复，以基于所述多重关联答复生成所述第二目标问题的答复信息的步骤包括：

在检测到所述目标问题为第二问题类型时，从预设关联问题库中确定所述关联问题集，并围绕所述关联问题集与客户端进行多轮问答；

接收多轮问答中客户端发送的所述多重关联答复，并根据所述多重关联答复进行槽填充；

在检测到槽填充完成时，基于预设深度网络序列标注模型，将所述多重关联答复转化为可用信息，以使用所述可用信息生成所述第二目标问题的答复信息，所述第二目标问题的答复信息存储于区块链中，所述第二目标问题的答复信息存储于区块链中。
如权利要求5所述的多类型问题智能问答方法，其中，所述接收多轮问答中客户端发送的所述多重关联答复，并根据所述多重关联答复进行槽填充的步骤包括：

从所述多重关联答复中提取出初始槽位信息；

判断所述初始槽位信息是否符合预设有效性标准，并在所述初始槽位信息不符合预设有效性标准时，使用澄清话术进行澄清表达；

在接收到客户端发送的对于所述澄清话术的修正回复时，根据所述修正回复修正所述初始槽位信息，直至修正后的初始槽位信息符合所述有效性标准；

对修正后的初始槽位信息进行标准化处理，并将经标准化处理后的初始槽位信息作为目标槽位信息，以基于所述目标槽位信息进行槽填充。
如权利要求1所述的多类型问题智能问答方法，其中，所述在接收到目标问题时，基于预设深度网络模型对所述目标问题进行意图分类，以确定所述目标问题的问题类型的步骤之后，还包括：

在检测到所述目标问题为第三问题类型时，将第三问题类型的目标问题作为第三目标问题，并获取所述第三目标问题与基于预设聚类算法所构建的标准问题集之间的问题相似度；

将所述第三目标问题映射在所述标准问题集中的相似标准问题上，并获取所述相似标准问题的标准回复，以基于所述标准回复生成所述第三目标问题的答复信息，所述相似标准问题在所述标准问题集中与所述目标问题之间的问题相似度最高。
一种多类型问题智能问答系统，其中，所述多类型问题智能问答系统包括：

意图分类模块，用于在接收到目标问题时，基于预设深度网络模型对所述目标问题进行意图分类，以确定所述目标问题的问题类型；

第一问题答复模块，用于在检测到所述目标问题为第一问题类型时，对第一目标问题进行实体识别与多层次语义解析，以获取所述第一目标问题的问题模板与多层次语义，并根据所述问题模板与多层次语义，生成所述第一目标问题的答复信息，所述第一目标问题为第一问题类型的目标问题；

第二问题答复模块，用于在检测到所述目标问题为第二问题类型时，确定第二目标问题的关联问题集，并基于多轮问答技术接收客户端对于所述关联问题集的多重关联答复，以基于所述多重关联答复生成所述第二目标问题的答复信息，所述第二目标问题为第二问题类型的目标问题。
一种多类型问题智能问答设备，其中，所述多类型问题智能问答设备包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的多类型问题智能问答程序，其中所述多类型问题智能问答程序被所述处理器执行时，实现如下步骤：

在接收到目标问题时，基于预设深度网络模型对所述目标问题进行意图分类，以确定所述目标问题的问题类型；

在检测到所述目标问题为第一问题类型时，对第一目标问题进行实体识别与多层次语义解析，以获取所述第一目标问题的问题模板与多层次语义，并根据所述问题模板与多层次语义，生成所述第一目标问题的答复信息，所述第一目标问题为第一问题类型的目标问题；

在检测到所述目标问题为第二问题类型时，确定第二目标问题的关联问题集，并基于多轮问答技术接收客户端对于所述关联问题集的多重关联答复，以基于所述多重关联答复生成所述第二目标问题的答复信息，所述第二目标问题为第二问题类型的目标问题。
如权利要求9所述的多类型问题智能问答设备，其中，所述在接收到目标问题时，基于预设深度网络模型对所述目标问题进行意图分类，以确定所述目标问题的问题类型的步骤包括：

在接收到目标问题时，将所述目标问题输入预训练语言表征模型，得到所述目标问题对应词序列的序列表征向量；

将所述序列表征向量输入预设双向长短时记忆网络中，得到所述词序列的隐藏向量；

结合所述序列表征向量与所述隐藏向量，确定所述目标问题的问题类型。
如权利要求9所述的多类型问题智能问答设备，其中，所述在检测到所述目标问题为第一问题类型时，对第一目标问题进行实体识别与多层次语义解析，以获取所述第一目标问题的问题模板与多层次语义，并根据所述问题模板与多层次语义，生成所述第一目标问题的答复信息的步骤包括：

在检测到所述目标问题为第一问题类型时，基于离线处理方式，使用预设实体识别模型识别出所述第一目标问题的实体信息，并基于所述实体信息得到所述问题模板；

基于线上处理方式，对所述第一目标问题进行多层次语义解析，得到所述第一目标问题的多层次语义；

使用预设概率图模型，并结合所述问题模板与所述多层次语义，预测所述第一目标问题对应到知识图谱中的属性类别；

根据所述属性类别与所述实体信息，将所述第一目标问题转换为知识图谱的结构化查询，以得到所述第一目标问题的答复信息，所述第一目标问题的答复信息存储于区块链中。
如权利要求11所述的多类型问题智能问答设备，其中，所述对所述第一目标问题进行多层次语义解析，得到所述第一目标问题的多层次语义的步骤包括：

使用预设语义搜索模型对所述第一目标问题进行实体层语义解析，获取实体层语义；

使用预设动词模板对所述第一目标问题进行细粒度语义表示，获取所述第一目标问题的短语层语义；

基于所述问题模板将所述第一目标问题的实体信息进行概念映射，获取所述第一目标问题的问题层语义，以将所述实体层语义、短语层语义与问题层语义作为所述多层次语义。
如权利要求9所述的多类型问题智能问答设备，其中，所述在检测到所述目标问题为第二问题类型时，确定第二目标问题的关联问题集，并基于多轮问答技术接收客户端对于所述关联问题集的多重关联答复，以基于所述多重关联答复生成所述第二目标问题的答复信息的步骤包括：

在检测到所述目标问题为第二问题类型时，从预设关联问题库中确定所述关联问题集，并围绕所述关联问题集与客户端进行多轮问答；

接收多轮问答中客户端发送的所述多重关联答复，并根据所述多重关联答复进行槽填充；

在检测到槽填充完成时，基于预设深度网络序列标注模型，将所述多重关联答复转化为可用信息，以使用所述可用信息生成所述第二目标问题的答复信息，所述第二目标问题的答复信息存储于区块链中，所述第二目标问题的答复信息存储于区块链中。
如权利要求13所述的多类型问题智能问答设备，其中，所述接收多轮问答中客户端发送的所述多重关联答复，并根据所述多重关联答复进行槽填充的步骤包括：

从所述多重关联答复中提取出初始槽位信息；

判断所述初始槽位信息是否符合预设有效性标准，并在所述初始槽位信息不符合预设有效性标准时，使用澄清话术进行澄清表达；

在接收到客户端发送的对于所述澄清话术的修正回复时，根据所述修正回复修正所述初始槽位信息，直至修正后的初始槽位信息符合所述有效性标准；

对修正后的初始槽位信息进行标准化处理，并将经标准化处理后的初始槽位信息作为目标槽位信息，以基于所述目标槽位信息进行槽填充。
如权利要求9所述的多类型问题智能问答设备，其中，所述在接收到目标问题时，基于预设深度网络模型对所述目标问题进行意图分类，以确定所述目标问题的问题类型的步骤之后，还包括：

在检测到所述目标问题为第三问题类型时，将第三问题类型的目标问题作为第三目标问题，并获取所述第三目标问题与基于预设聚类算法所构建的标准问题集之间的问题相似度；

将所述第三目标问题映射在所述标准问题集中的相似标准问题上，并获取所述相似标准问题的标准回复，以基于所述标准回复生成所述第三目标问题的答复信息，所述相似标准问题在所述标准问题集中与所述目标问题之间的问题相似度最高。
一种计算机可读存储介质，其中，所述计算机可读存储介质上存储有多类型问题智能问答程序，其中所述多类型问题智能问答程序被处理器执行时，实现如下步骤：

在接收到目标问题时，基于预设深度网络模型对所述目标问题进行意图分类，以确定所述目标问题的问题类型；

在检测到所述目标问题为第一问题类型时，对第一目标问题进行实体识别与多层次语义解析，以获取所述第一目标问题的问题模板与多层次语义，并根据所述问题模板与多层次语义，生成所述第一目标问题的答复信息，所述第一目标问题为第一问题类型的目标问题；

在检测到所述目标问题为第二问题类型时，确定第二目标问题的关联问题集，并基于多轮问答技术接收客户端对于所述关联问题集的多重关联答复，以基于所述多重关联答复生成所述第二目标问题的答复信息，所述第二目标问题为第二问题类型的目标问题。
如权利要求16所述的计算机可读存储介质，其中，所述在接收到目标问题时，基于预设深度网络模型对所述目标问题进行意图分类，以确定所述目标问题的问题类型的步骤包括：

在接收到目标问题时，将所述目标问题输入预训练语言表征模型，得到所述目标问题对应词序列的序列表征向量；

将所述序列表征向量输入预设双向长短时记忆网络中，得到所述词序列的隐藏向量；

结合所述序列表征向量与所述隐藏向量，确定所述目标问题的问题类型。
如权利要求16所述的计算机可读存储介质，其中，所述在检测到所述目标问题为第一问题类型时，对第一目标问题进行实体识别与多层次语义解析，以获取所述第一目标问题的问题模板与多层次语义，并根据所述问题模板与多层次语义，生成所述第一目标问题的答复信息的步骤包括：

在检测到所述目标问题为第一问题类型时，基于离线处理方式，使用预设实体识别模型识别出所述第一目标问题的实体信息，并基于所述实体信息得到所述问题模板；

基于线上处理方式，对所述第一目标问题进行多层次语义解析，得到所述第一目标问题的多层次语义；

使用预设概率图模型，并结合所述问题模板与所述多层次语义，预测所述第一目标问题对应到知识图谱中的属性类别；

根据所述属性类别与所述实体信息，将所述第一目标问题转换为知识图谱的结构化查询，以得到所述第一目标问题的答复信息，所述第一目标问题的答复信息存储于区块链中。
如权利要求18所述的计算机可读存储介质，其中，所述对所述第一目标问题进行多层次语义解析，得到所述第一目标问题的多层次语义的步骤包括：

使用预设语义搜索模型对所述第一目标问题进行实体层语义解析，获取实体层语义；

使用预设动词模板对所述第一目标问题进行细粒度语义表示，获取所述第一目标问题的短语层语义；

基于所述问题模板将所述第一目标问题的实体信息进行概念映射，获取所述第一目标问题的问题层语义，以将所述实体层语义、短语层语义与问题层语义作为所述多层次语义。
如权利要求16所述的计算机可读存储介质，其中，所述在检测到所述目标问题为第二问题类型时，确定第二目标问题的关联问题集，并基于多轮问答技术接收客户端对于所述关联问题集的多重关联答复，以基于所述多重关联答复生成所述第二目标问题的答复信息的步骤包括：

在检测到所述目标问题为第二问题类型时，从预设关联问题库中确定所述关联问题集，并围绕所述关联问题集与客户端进行多轮问答；

接收多轮问答中客户端发送的所述多重关联答复，并根据所述多重关联答复进行槽填充；

在检测到槽填充完成时，基于预设深度网络序列标注模型，将所述多重关联答复转化为可用信息，以使用所述可用信息生成所述第二目标问题的答复信息，所述第二目标问题的答复信息存储于区块链中，所述第二目标问题的答复信息存储于区块链中。