CN112380332A

CN112380332A - 交互式的知识反馈方法、装置及计算机存储介质

Info

Publication number: CN112380332A
Application number: CN202011287415.3A
Authority: CN
Inventors: 赵正锐; 孙俊; 蔡国庆
Original assignee: Shenzhen Zhuiyi Technology Co Ltd
Current assignee: Shenzhen Zhuiyi Technology Co Ltd
Priority date: 2020-11-17
Filing date: 2020-11-17
Publication date: 2021-02-19

Abstract

本申请实施例公开了一种交互式的知识反馈方法、装置及计算机存储介质，用于在人机交互过程中实现多轮交互且执行知识检索，以提高交互式问答质量，提升用户体验。本申请实施例包括：当语句要素识别的结果表示待识别语句缺少要素词槽对应的词槽信息时，向用户提示输入要素词槽对应的词槽信息，用户根据提示输入目标词槽信息，这一过程中，知识反馈装置可以根据词槽信息的缺少程度进行提示，即缺少较多的词槽信息，则进行多次提示。再根据意图识别结果以及目标词槽信息检索对应的目标知识，并向用户反馈。因此，本实施例中，实现了人机交互过程的多轮对话，同时还可以基于用户补充的词槽信息进行知识检索，方案简便易行，适用于大规模量产。

Description

交互式的知识反馈方法、装置及计算机存储介质

技术领域

本申请实施例涉及人工智能领域，具体涉及一种交互式的知识反馈方法、装置及计算机存储介质。

背景技术

在现有的交互场景问答方案中，一般都具有以下几个特点，一是交互过程仅仅通过单轮交互是无法解决的；二是交互过程涉及到知识检索；三是交互过程是可以归纳的。因此，如何在交互过程中实现多轮对话以及如何进行知识检索，是本领域亟待解决的技术问题。

交互场景的实际应用中，FAQ问答机器人可以应用在一问一答这种咨询类的交互场景中；任务型机器人可应用于任务驱动的交互场景；知识图谱问答KBQA可以很好地解决知识类问答的问题。但是，FAQ问答机器人由于自身产品能力，并不能在交互过程中执行多轮对话；任务型机器人虽然在流程化设计上比较灵活自主，但是在交互过程中缺乏基于用户输入的知识检索能力；知识图谱问答因为其依赖于图谱的本体设计和管理，因此在实际落地过程中使用门槛较高，无法大规模量产。

因此，亟需一种能够在交互过程中实现多轮交互且执行知识检索的技术方案，以提高交互问答质量，提升用户体验。

发明内容

本申请实施例提供了一种交互式的知识反馈方法、装置及计算机存储介质，用于在人机交互过程中实现多轮交互且执行知识检索，以提高交互式问答质量，提升用户体验。

本申请实施例第一方面提供了一种交互式的知识反馈方法，包括：

获取意图识别预训练模型及命名实体识别NER模型；

使用所述意图识别预训练模型对用户输入的待识别语句进行意图识别，得到意图识别结果；

基于所述意图识别结果，使用所述NER模型对所述待识别语句进行语句要素识别；

若所述语句要素识别的结果表示所述待识别语句缺少要素词槽对应的词槽信息，则向所述用户提示输入所述要素词槽对应的词槽信息，所述要素词槽为影响所述待识别语句的执行结果的要素的词槽；

根据所述意图识别结果以及所述用户输入的目标词槽信息检索对应的目标知识，并向用户反馈所述目标知识。

本申请实施例第二方面提供了一种知识反馈装置，包括：

获取单元，用于获取意图识别预训练模型及命名实体识别NER模型；

意图识别单元，用于使用所述意图识别预训练模型对用户输入的待识别语句进行意图识别，得到意图识别结果；

语句要素识别单元，用于基于所述意图识别结果，使用所述NER模型对所述待识别语句进行语句要素识别；

提示单元，用于若所述语句要素识别的结果表示所述待识别语句缺少要素词槽对应的词槽信息，则向所述用户提示输入所述要素词槽对应的词槽信息，所述要素词槽为影响所述待识别语句的执行结果的要素的词槽；

检索单元，用于根据所述意图识别结果以及所述用户输入的目标词槽信息检索对应的目标知识；

反馈单元，用于向用户反馈所述目标知识。

本申请实施例第三方面提供了一种知识反馈装置，包括：

处理器、存储器、总线、输入输出设备；

所述处理器与所述存储器、输入输出设备相连；

所述总线分别连接所述处理器、存储器以及输入输出设备；

所述处理器用于获取意图识别预训练模型及命名实体识别NER模型，使用所述意图识别预训练模型对用户输入的待识别语句进行意图识别，得到意图识别结果，基于所述意图识别结果，使用所述NER模型对所述待识别语句进行语句要素识别；

所述输入输出设备用于当所述语句要素识别的结果表示所述待识别语句缺少要素词槽对应的词槽信息时，向所述用户提示输入所述要素词槽对应的词槽信息，所述要素词槽为影响所述待识别语句的执行结果的要素的词槽；

所述处理器还用于根据所述意图识别结果以及所述用户输入的目标词槽信息检索对应的目标知识；

所述输入输出设备还用于向用户反馈所述目标知识。

本申请实施例第四方面提供了一种计算机存储介质，计算机存储介质中存储有指令，该指令在计算机上执行时，使得计算机执行前述第一方面的方法。

从以上技术方案可以看出，本申请实施例具有以下优点：

本申请实施例中，获得待识别语句的意图识别结果，使用NER模型对待识别语句进行语句要素识别，当语句要素识别的结果表示待识别语句缺少要素词槽对应的词槽信息时，向用户提示输入要素词槽对应的词槽信息，用户根据提示输入目标词槽信息，这一过程中，知识反馈装置可以根据词槽信息的缺少程度进行提示，即缺少较多的词槽信息，则进行多次提示。知识反馈装置再根据意图识别结果以及用户输入的目标词槽信息检索对应的目标知识，并向用户反馈该目标知识。因此，本实施例中，实现了人机交互过程的多轮对话，同时还可以基于用户补充的词槽信息进行知识检索，方案简便易行，适用于大规模量产。

附图说明

图1为本申请实施例中交互式的知识反馈方法的应用场景示意图；

图2为本申请实施例中交互式的知识反馈方法一个流程示意图；

图3为本申请实施例中一种待识别语句与答案的对应关系示意图；

图4为本申请实施例中基于决策树检索算法检索目标知识的流程示意图；

图5为本申请实施例中人机对话一种场景示意图；

图6为本申请实施例中人机对话另一种场景示意图；

图7为本申请实施例中树形词槽一种结构示意图；

图8为本申请实施例中知识反馈装置一个结构示意图；

图9为本申请实施例中知识反馈装置另一结构示意图。

具体实施方式

请参阅图1，本申请实施例的交互式的知识反馈方法的应用场景包括：

本申请实施例中，知识反馈装置101用于根据用户的输入向用户反馈其所需要的知识，即用户向知识反馈装置101输入语句，知识反馈装置101识别该语句并检索该语句对应的知识，以及向用户反馈检索结果。其中，用户输入语句的方式，可以是用户通过键盘、触控面板等输入设备输入文本语句，也可以通过知识反馈装置101设置的语音输入装置输入语音语句，并由知识反馈装置101识别该语音语句。本申请实施例对用户输入语句的方式不作限定。

具体的，知识反馈装置101可以是服务器、终端等能够进行数据处理的计算机设备。当知识反馈装置101为终端时，可以是个人电脑(personal computer，PC)、台式计算机等终端设备；当知识反馈装置101为服务器时，可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式系统，还可以是提供云数据库、云计算以及大数据和人工智能平台等基础云计算服务的云服务器。

此外，知识反馈装置101还配置输出设备，其类型可以是显示器、打印机、绘图仪、影像输出系统、语音输出系统、磁记录设备等输出设备，用于在获得知识反馈装置101对用户输入的语句的处理结果时向用户输出该处理结果。处理结果的输出方式可以文本、图像、声音等形式输出，具体此处不作限定。

本申请实施例提供的交互式的知识反馈方法，可以应用于如图1所示的应用环境中。知识反馈装置101可以根据本申请实施例提供的交互式的知识反馈方法来对用户的输入作出应答。下面将结合图1所示的应用场景，对本申请实施例中的交互式的知识反馈方法进行描述：

请参阅图2，本申请实施例中交互式的知识反馈方法的实施例1包括：

201、获取意图识别预训练模型及命名实体识别NER模型；

本实施例中，在对用户输入的语句进行识别以及作出应答时，依赖于意图识别预训练模型及命名实体识别NER模型(named entity recognition，NER)。因此，需要获取意图识别预训练模型及NER模型。获取模型的方式可以是利用大量的训练语料对初始模型进行训练，模型训练完成，即可得到意图识别预训练模型及NER模型；也可以是，预先在知识反馈装置部署已经训练完成的意图识别预训练模型及NER模型，从而知识反馈装置可以直接获取到该模型，而无需进行模型训练，可节省知识反馈装置的处理操作。本实施例对知识反馈装置获取意图识别预训练模型及NER模型的方式不作限定。

202、使用意图识别预训练模型对用户输入的待识别语句进行意图识别，得到意图识别结果；

在获得意图识别预训练模型之后，使用该意图识别预训练模型对用户输入的待识别语句进行意图识别，即识别出用户输入的待识别语句所表示的意图。进行意图识别之后，得到待识别语句的意图识别结果。

例如，用户输入的待识别语句为“出租个人商品房需要交多少税”，知识反馈装置对其进行意图识别，可以确定出该待识别语句所表示的意图为用户需要查询出租个人商品房缴交的税额。

203、基于意图识别结果，使用NER模型对待识别语句进行语句要素识别；

由于用户的语言表达习惯或者意图的复杂化等原因，某些语句所表示的意图可能并没有确切且具体地表达出来。因此，在获得意图识别结果之后，还需要进一步对待识别语句进行语句要素识别，即进一步识别出语句中的要素。

在获得NER模型之后，使用NER模型对待识别语句进行语句要素识别。命名实体识别NER是自然语言处理中的一项重要任务。命名实体一般指的是文本中具有特定意义或者指代性强的实体，通常包括人名、地名、组织机构名、日期时间、专有名词等。NER模型就是从非结构化的输入语句中抽取出上述实体，并且可以按照业务需要识别出更多类别的实体，比如产品名称、型号、价格等。只要是业务需要的特殊文本片段都可以称为实体。本实施例中，该实体即包括了待识别语句中的要素。

例如，沿用步骤202中所举的例子，进一步对待识别语句进行语句要素识别，由于出租个人商品房缴交的税额还因纳税人类型的不同而有所区别，因此，可以确定出该语句缺少“纳税人类型”这一要素。

204、若语句要素识别的结果表示待识别语句缺少要素词槽对应的词槽信息，则向用户提示输入要素词槽对应的词槽信息；

若语句要素识别的结果表示待识别语句缺少要素词槽对应的词槽信息，则向用户提示输入该要素词槽对应的词槽信息。其中，要素词槽是指影响待识别语句的执行结果的要素的词槽。例如，在步骤202所举的例子中，“纳税人类型”便是待识别语句的要素词槽，“纳税人类型”对应的具体值(即小规模纳税人和一般纳税人)即为要素词槽对应的词槽信息。

205、根据意图识别结果以及用户输入的目标词槽信息检索对应的目标知识，并向用户反馈目标知识；

用户根据知识反馈装置的提示输入相应的目标词槽信息，知识反馈装置接收该目标词槽信息并结合待识别语句的意图识别结果，检索该意图识别结果以及该目标词槽信息对应的目标知识，并向用户反馈该目标知识。

其中，知识反馈装置可以通过建立数据库来存储各种知识，并且建立每一项知识所分别对应的意图以及具体的词槽信息，从而在确定出用户的意图以及用户输入语句的词槽信息之后，从数据库中检索出相对应的知识。

本实施例中，获得待识别语句的意图识别结果，使用NER模型对待识别语句进行语句要素识别，当语句要素识别的结果表示待识别语句缺少要素词槽对应的词槽信息时，向用户提示输入要素词槽对应的词槽信息，用户根据提示输入目标词槽信息，这一过程中，知识反馈装置可以根据词槽信息的缺少程度进行提示，即缺少较多的词槽信息，则进行多次提示。知识反馈装置再根据意图识别结果以及用户输入的目标词槽信息检索对应的目标知识，并向用户反馈该目标知识。因此，本实施例中，实现了人机交互过程的多轮对话，同时还可以基于用户补充的词槽信息进行知识检索，方案简便易行，适用于大规模量产。

下面将在前述图2所示实施例的基础上，进一步详细地描述本申请实施例。

基于上述实施例1，本申请实施例中交互式的知识反馈方法的实施例2包括：

本实施例中，意图识别预训练模型可以是任意的预训练语言模型，具体的预训练语言模型的种类不作限定，只要能够对用户输入的语句进行意图识别的预训练语言模型即可。一种优选的实施方式是，意图识别预训练模型可以是基于Transformer的双向编码器BERT模型(BERT，bidirectional encoder representations from transformers)。BERT模型是一种预训练语言模型，使用大量无监督语料进行语言模型预训练(Pre-training)，再使用少量标注语料进行微调(Fine-tuning)，从而完成具体的自然语言处理任务，例如意图分类、序列标注、句间关系判断以及机器阅读理解等。

BERT模型的结构是一种神经网络结构，并以Transformer为文本特征提取器。因此，基于上述实施例1至实施例2，本申请的实施例3中，在对用户输入的待识别语句进行意图识别时，可以基于意图识别预训练模型的特征抽取能力，使用微调finetune方法对待识别语句进行意图识别。

BERT模型的结构的层数有12层以及24层。因此，由于BERT模型的结构复杂，BERT模型的参数量巨大，在实际应用中，处理一般的文本识别任务时每秒查询率QPS较低。其中，每秒查询率(query per second，QPS)是对一个特定的查询装置在规定时间内所处理流量多少的衡量标准。

为此，基于上述实施例1至实施例3，在本申请的实施例4中，在获得意图识别预训练模型的过程中，可以对初始语言模型进行预训练，即获取训练语料以及构建初始语言模型，并将训练语料输入该初始语言模型，对该初始语言模型进行预训练，得到目标语言模型。此时，预训练得到的目标语言模型的参数量仍然十分巨大，可能会限制处理设备的QPS。因此，可以基于模型剪枝方法以及知识蒸馏方法，构建轻量化模型，并利用目标语言模型训练该轻量化模型，轻量化模型完成训练之后即得到意图识别预训练模型。其中，轻量化模型的参数的数量少于目标语言模型的参数的数量，轻量化模型的层数少于目标语言模型的层数，即在模型剪枝和知识蒸馏之后，意图识别预训练模型的结构实现精简化，模型参数也大大地减少。

除了使用模型剪枝的方法，还可以使用其他模型压缩方法，例如采用矩阵量化、Kronecker内积、霍夫曼编码等优化方式，对结构更复杂的目标语言模型进行结构上的优化，得到更加轻量的意图识别预训练模型。在模型部署阶段，在知识反馈装置上直接部署轻量化的意图识别预训练模型，可以实现机器语言处理的提速。例如，本实施例的实际应用中，12层的BERT模型经过模型剪枝以及知识蒸馏之后，可以将12层结构压缩至2层结构，并且整体准确率损失降至3％以内，QPS也提升了9倍。

基于上述实施例1至实施例4，本申请实施例中交互式的知识反馈方法的实施例5包括：

本实施例中，NER模型可以是双向长短时记忆循环神经网络BiLSTM与条件随机场模型结合的NER模型(以下简称BiLSTM-CRF模型)。其中，CRF模型(conditional randomfield)是目前命名实体识别NER的主流模型。BiLSTM-CRF模型主要由Embedding层(主要有词向量、字向量以及一些额外特征)、双向LSTM层以及最后的CRF层构成。在特征方面，BiLSTM-CRF模型继承了深度学习方法的优势，无需特征工程，只需使用词向量以及字符向量就可以达到很好的效果。

长短期记忆网络(LSTM，long short-term memory)是一种时间循环神经网络，是为了解决一般的循环神经网络(RNN，recurrent neural network)存在的长期依赖问题而专门设计出来的，所有的RNN神经网络都具有一种重复神经网络模块的链式形式。而BiLSTM(Bi-directional long short-term memory)则是由前向LSTM神经网络与后向LSTM神经网络组合而成。

除了采用BiLSTM-CRF模型来执行命名实体识别，还可以使用长短期记忆网络与CRF模型结合的NER模型(即LSTM-CRF模型)，或者采用BERT模型与CRF模型结合的NER模型(即BERT-CRF模型)。本实施例对NER模型的具体类型不作限定。

基于上述实施例1至实施例5，本申请实施例中交互式的知识反馈方法的实施例6包括：

本实施例中，在使用NER模型对待识别语句进行语句要素识别时，基于字典和模型结合的方式对待识别语句进行语句要素识别。其中，基于字典和模型结合的方式执行命名实体识别，字典负责已有词识别，模型负责未知词识别。基于字典的命名实体识别有多种执行方式，包括字符串多模匹配及切词匹配。

基于上述实施例1至实施例6，本申请实施例中交互式的知识反馈方法的实施例7包括：

本实施例中，在根据意图识别结果以及用户输入的目标词槽信息检索对应的目标知识时，具体做法可以是，由于一种意图可能会关联多种知识，每种知识对用户的输入语句所要求的要素词槽个数也不相同，例如，对于“进项税额可以抵扣吗”这一语句，其关联了多个答案，并且每个答案所要求的要素词槽个数均不相同，有的答案只需“应税行为”及“应税类型”这两个要素词槽，而有的答案则需对应“应税行为”、“应税类型”、“计税方法”、“计税项目”这4个要素词槽，因此，在获得意图识别结果之后，根据意图识别结果生成与意图识别结果关联的多个语句结构，其中每一种语句结构包括至少一个要素词槽，也就是说，每一种语句结构会因为包括的要素词槽的个数不同而有所区别。

在生成与意图识别结果关联的多个语句结构之后，向用户依次提示用户输入的待识别语句中缺少的要素词槽，并接收用户根据提示输入的目标词槽信息。将接收到的目标词槽信息分别填充至每个语句结构中对应的要素词槽，得到多个目标语句结构。根据目标语句结构的要素词槽的填充程度对该多个目标语句结构进行排序，并根据排序的结果确定最优的目标语句结构，从而可以根据该最优的目标语句结构检索对应的目标知识。其中，该最优的目标语句结构可以是要素词槽的填充程度最高的目标语句结构。

例如，如图所示，“进项税额可以抵扣吗”这一语句关联了多个语句结构，并且每种语句结构包括的要素词槽的个数均不相同。在接收到用户输入的目标词槽信息之后，将该目标词槽信息分别填充至每一种语句结构，得到多个目标语句结构。按照要素词槽的填充程度对该多个目标语句结构进行排序，并根据排序结果确定最优的目标语句结构，并最终确定该最优的目标语句结构对应的目标知识。

基于上述实施例7，本申请实施例中交互式的知识反馈方法的实施例8包括：

本实施例中，在根据该最优的目标语句结构检索对应的目标知识时，可以基于决策树检索算法检索该最优的目标语句结构对应的目标知识。

例如，如图4所示，待识别语句为“进项税额可以抵扣吗”，由于该语句缺少要素词槽对应的词槽信息，因此，提示用户补充“纳税人类型”这一要素词槽的词槽信息。当用户输入“一般纳税人”时，将该“一般纳税人”这一词槽信息填充至语句结构中的相应位置。以此类推，根据缺少的词槽信息与用户进行多轮对话，从而逐步澄清待识别语句中的要素词槽。在完成多轮对话之后，建立语句结构对应的决策树，并基于决策树检索算法检索语句结构对应的目标知识。

其中，决策树检索算法可以是ID3算法、C4.5算法或者分类回归决策树(CART，classification and regression tree)等决策树检索算法。

基于上述实施例1至实施例8，本申请实施例中交互式的知识反馈方法的实施例9包括：

本实施例中，在向用户提示输入要素词槽对应的词槽信息之后，用户输入相应的词槽信息。但是，有时候用户输入的词槽信息并未与待识别语句的答案所要求的词槽信息准确地对应，即用户输入的是下位词槽信息，该下位词槽信息是目标词槽信息的下位概念。此时，需要根据下位词槽信息的上位概念确定出目标词槽信息。

例如，如图5所示，用户输入的待识别语句“出租个人商品房需要交多少税”缺少“纳税人类型”这一要素词槽对应的词槽信息，则提示用户输入具体的纳税人类型。但是，用户输入的“餐饮从业者”并未存在对应的答案。此时，由于餐饮从业者属于一般纳税人，即“餐饮从业者”是“一般纳税人”的下位概念，根据“餐饮从业者”的上位概念，可以确定出用户的纳税人类型即为一般纳税人。

基于上述实施例1至实施例9，本申请实施例中交互式的知识反馈方法的实施例10包括：

本实施例中，在向用户提示输入要素词槽对应的词槽信息之后，用户输入相应的词槽信息。但是，用户输入的词槽信息可能是上位词槽信息，该上位词槽信息是目标词槽信息的上位概念，而上位词槽信息并未与待识别语句的答案所要求的词槽信息准确地对应。此时，向用户提示输入该上位词槽信息的下位概念对应的词槽信息，并接收用户根据提示输入的该上位词槽信息的下位概念对应的目标词槽信息。

例如，如图6所示，用户输入的待识别语句“个体工商户销售农产品需要交多少税”的上位词槽信息包括“农产品”，该上位词槽信息不存在对应的答案。因此，继续向用户提示该上位词槽信息的下位概念，用户可以根据提示输入“农产品”的下位概念，即输入目标词槽信息。

因此，本实施例可以通过多轮交互和对话不断地对缺少的要素词槽进行澄清，使得根据待识别语句所检索到的知识更能满足用户的要求。

本申请实施例中，在对要素词槽的词槽信息进行收集的时候，采用了树形词槽这一结构来确定要素词槽，并利用树形词槽来对收集到的词槽信息进行管理。树形词槽，体现在词槽的构成不再是简单的线性结构，而是一种层级的树形结构。某种程度上，树形词槽更像是一个词网，将词与词之间通过树的结构进行建模，更好的表达了词在这个词网体系中除字面外表达的更多语义信息。一方面打破了要素词槽之间无法存在层级概念的不合理假设，增强了词槽的上下位表示能力，如图7所示，通过地区词槽我们可以将南京市隶属于江苏省，且南京市和苏州市是并列关系都建模出来。另一方面也进一步消除了歧义的表达，因为在树形词槽内，规定：兄弟节点间不允许出现重复，而对于其他节点信息则不做要求。例如，“通州区”有北京市通州区和南通市通州区，虽然二者在字面上是一样的，但两者在树形词槽中所处的位置却是不一样的，而这种位置的不同，可以很好地表达了各自的语义信息。

因此，可以通过建立树形词槽来表示交互场景中词与词之间的上下位关系，打破了传统词槽对于词槽内实例必须是对等互斥的假设，大大增强了词槽的表达能力。

本申请实施例中，还可以根据目标知识的检索结果来决定直接向用户输出答案还是进一步澄清待识别语句的要素词槽，即待识别语句当前的词槽信息与在当前的词槽信息的基础上再补充一个词槽信息，这两者之间所分别对应的答案是否有区别，如果是相同的答案，则可以无需进一步澄清，直接输出答案；如果是不同的答案，则可以进一步对要素词槽进行澄清。因此，可以使得人机问答更加智能，也有利于减少设备的处理操作，节约处理资源。

上面对本申请实施例中的交互式的知识反馈方法进行了描述，下面对本申请实施例中的知识反馈装置进行描述，请参阅图8，本申请实施例中知识反馈装置一个实施例包括：

获取单元801，用于获取意图识别预训练模型及命名实体识别NER模型；

意图识别单元802，用于使用意图识别预训练模型对用户输入的待识别语句进行意图识别，得到意图识别结果；

语句要素识别单元803，用于基于意图识别结果，使用NER模型对待识别语句进行语句要素识别；

提示单元804，用于若语句要素识别的结果表示待识别语句缺少要素词槽对应的词槽信息，则向用户提示输入要素词槽对应的词槽信息，要素词槽为影响待识别语句的执行结果的要素的词槽；

检索单元805，用于根据意图识别结果以及用户输入的目标词槽信息检索对应的目标知识；

反馈单元806，用于向用户反馈目标知识。

本实施例一种优选的实施方式中，意图识别单元802用于基于意图识别预训练模型的特征抽取能力，使用微调finetune方法对待识别语句进行意图识别。

本实施例一种优选的实施方式中，语句要素识别单元803具体用于使用NER模型以字典和模型结合的方式对待识别语句进行语句要素识别。

本实施例一种优选的实施方式中，检索单元805具体用于根据意图识别结果生成与意图识别结果关联的多个语句结构，语句结构包括至少一个要素词槽，将目标词槽信息分别填充至每个语句结构中对应的要素词槽，得到多个目标语句结构，根据目标语句结构的要素词槽的填充程度对多个目标语句结构进行排序，并根据排序的结果确定最优的目标语句结构，根据最优的目标语句结构检索对应的目标知识。

本实施例一种优选的实施方式中，在根据最优的目标语句结构检索对应的目标知识时，检索单元805具体用于基于决策树检索算法检索最优的目标语句结构对应的目标知识。

本实施例一种优选的实施方式中，知识反馈装置还包括：

第一接收单元807，用于接收用户输入的下位词槽信息，下位词槽信息为目标词槽信息的下位概念；

确定单元808，用于根据下位词槽信息的上位概念确定目标词槽信息。

本实施例一种优选的实施方式中，知识反馈装置还包括：

第二接收单元809，用于接收用户输入的上位词槽信息，上位词槽信息为目标词槽信息的上位概念；

提示单元804还用于向用户提示输入上位词槽信息的下为概念对应的词槽信息；

第二接收单元809还用于接收用户输入的上位词槽信息的下为概念对应的目标词槽信息。

本实施例一种优选的实施方式中，获取单元801具体用于获取训练语料以及初始语言模型，将训练语料输入初始语言模型，对初始语言模型进行预训练，得到目标语言模型，基于模型剪枝方法以及知识蒸馏方法，构建轻量化模型，利用目标语言模型训练轻量化模型，轻量化模型完成训练之后得到意图识别预训练模型，其中，轻量化模型的参数的数量少于目标语言模型的参数的数量，轻量化模型的层数少于目标语言模型的层数。

本实施例中，知识反馈装置中各单元所执行的操作与前述图2所示实施例中描述的类似，此处不再赘述。

本实施例中，意图识别单元802获得待识别语句的意图识别结果，语句要素识别单元803使用NER模型对待识别语句进行语句要素识别，当语句要素识别的结果表示待识别语句缺少要素词槽对应的词槽信息时，提示单元804向用户提示输入要素词槽对应的词槽信息，用户根据提示输入目标词槽信息，这一过程中，知识反馈装置可以根据词槽信息的缺少程度进行提示，即缺少较多的词槽信息，则进行多次提示。检索单元805再根据意图识别结果以及用户输入的目标词槽信息检索对应的目标知识，反馈单元806向用户反馈该目标知识。因此，本实施例中，实现了人机交互过程的多轮对话，同时还可以基于用户补充的词槽信息进行知识检索，方案简便易行，适用于大规模量产。

下面对本申请实施例中的知识反馈装置进行描述，请参阅图9，本申请实施例中知识反馈装置一个实施例包括：

该知识反馈装置900可以包括一个或一个以上中央处理器(central processingunits，CPU)901和存储器905，该存储器905中存储有一个或一个以上的应用程序或数据。

其中，存储器905可以是易失性存储或持久存储。存储在存储器905的程序可以包括一个或一个以上模块，每个模块可以包括对知识反馈装置中的一系列指令操作。更进一步地，中央处理器901可以设置为与存储器905通信，在知识反馈装置900上执行存储器905中的一系列指令操作。

知识反馈装置900还可以包括一个或一个以上电源902，一个或一个以上有线或无线网络接口903，一个或一个以上输入输出接口904，和/或，一个或一个以上操作系统，例如Windows ServerTM，Mac OS XTM，UnixTM,LinuxTM，FreeBSDTM等。

该中央处理器901可以执行前述图2所示实施例中知识反馈装置所执行的操作，具体此处不再赘述。

本申请实施例还提供了一种计算机存储介质，其中一个实施例包括：该计算机存储介质中存储有指令，该指令在计算机上执行时，使得该计算机执行前述图2所示实施例中知识反馈装置所执行的操作。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统，装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统，装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，read-onlymemory)、随机存取存储器(RAM，random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。

Claims

1.一种交互式的知识反馈方法，其特征在于，包括：

获取意图识别预训练模型及命名实体识别NER模型；

2.根据权利要求1所述的交互式的知识反馈方法，其特征在于，所述使用所述意图识别预训练模型对用户输入的待识别语句进行意图识别，包括：

基于所述意图识别预训练模型的特征抽取能力，使用微调finetune方法对所述待识别语句进行意图识别。

3.根据权利要求1所述的交互式的知识反馈方法，其特征在于，所述使用所述NER模型对所述待识别语句进行语句要素识别，包括：

使用所述NER模型以字典和模型结合的方式对所述待识别语句进行语句要素识别。

4.根据权利要求1所述的交互式的知识反馈方法，其特征在于，所述根据所述意图识别结果以及所述用户输入的目标词槽信息检索对应的目标知识，包括：

根据所述意图识别结果生成与所述意图识别结果关联的多个语句结构，所述语句结构包括至少一个所述要素词槽；

将所述目标词槽信息分别填充至每个所述语句结构中对应的要素词槽，得到多个目标语句结构；

根据所述目标语句结构的要素词槽的填充程度对所述多个目标语句结构进行排序，并根据排序的结果确定最优的目标语句结构；

根据所述最优的目标语句结构检索对应的所述目标知识。

5.根据权利要求4所述的交互式的知识反馈方法，其特征在于，所述根据所述最优的目标语句结构检索对应的所述目标知识，包括：

基于决策树检索算法检索所述最优的目标语句结构对应的所述目标知识。

6.根据权利要求1所述的交互式的知识反馈方法，其特征在于，所述向所述用户提示输入所述要素词槽对应的词槽信息之后，所述方法还包括：

接收所述用户输入的下位词槽信息，所述下位词槽信息为所述目标词槽信息的下位概念；

根据所述下位词槽信息的上位概念确定所述目标词槽信息。

7.根据权利要求1所述的交互式的知识反馈方法，其特征在于，所述向所述用户提示输入所述要素词槽对应的词槽信息之后，所述方法还包括：

接收所述用户输入的上位词槽信息，所述上位词槽信息为所述目标词槽信息的上位概念；

向所述用户提示输入所述上位词槽信息的下位概念对应的词槽信息；

接收所述用户输入的所述上位词槽信息的下位概念对应的目标词槽信息。

8.根据权利要求1至7任一项所述的交互式的知识反馈方法，其特征在于，所述获取意图识别预训练模型，包括：

获取训练语料以及初始语言模型；

将所述训练语料输入所述初始语言模型，对所述初始语言模型进行预训练，得到目标语言模型；

基于模型剪枝方法以及知识蒸馏方法，构建轻量化模型，利用所述目标语言模型训练所述轻量化模型，所述轻量化模型完成训练之后得到所述意图识别预训练模型；其中，所述轻量化模型的参数的数量少于所述目标语言模型的参数的数量，所述轻量化模型的层数少于所述目标语言模型的层数。

9.根据权利要求8所述的交互式的知识反馈方法，其特征在于，所述意图识别预训练模型为基于Transformer的双向编码器BERT模型。

10.根据权利要求8所述的交互式的知识反馈方法，其特征在于，所述NER模型为双向长短时记忆循环神经网络BiLSTM与条件随机场CRF结合的NER模型。

11.一种知识反馈装置，其特征在于，包括：

反馈单元，用于向用户反馈所述目标知识。

12.根据权利要求11所述的知识反馈装置，其特征在于，所述意图识别单元用于基于所述意图识别预训练模型的特征抽取能力，使用微调finetune方法对所述待识别语句进行意图识别。

13.根据权利要求11所述的知识反馈装置，其特征在于，所述语句要素识别单元具体用于使用所述NER模型以字典和模型结合的方式对所述待识别语句进行语句要素识别。

14.根据权利要求11所述的知识反馈装置，其特征在于，所述检索单元具体用于根据所述意图识别结果生成与所述意图识别结果关联的多个语句结构，所述语句结构包括至少一个所述要素词槽，将所述目标词槽信息分别填充至每个所述语句结构中对应的要素词槽，得到多个目标语句结构，根据所述目标语句结构的要素词槽的填充程度对所述多个目标语句结构进行排序，并根据排序的结果确定最优的目标语句结构，根据所述最优的目标语句结构检索对应的所述目标知识。

15.根据权利要求14所述的知识反馈装置，其特征在于，在根据所述最优的目标语句结构检索对应的所述目标知识时，所述检索单元具体用于基于决策树检索算法检索所述最优的目标语句结构对应的所述目标知识。

16.根据权利要求11所述的知识反馈装置，其特征在于，所述知识反馈装置还包括：

第一接收单元，用于接收所述用户输入的下位词槽信息，所述下位词槽信息为所述目标词槽信息的下位概念；

确定单元，用于根据所述下位词槽信息的上位概念确定所述目标词槽信息。

17.根据权利要求11所述的知识反馈装置，其特征在于，所述知识反馈装置还包括：

第二接收单元，用于接收所述用户输入的上位词槽信息，所述上位词槽信息为所述目标词槽信息的上位概念；

所述提示单元还用于向所述用户提示输入所述上位词槽信息的下为概念对应的词槽信息；

所述第二接收单元还用于接收所述用户输入的所述上位词槽信息的下为概念对应的目标词槽信息。

18.根据权利要求11至17任一项所述的知识反馈装置，其特征在于，所述获取单元具体用于获取训练语料以及初始语言模型，将所述训练语料输入所述初始语言模型，对所述初始语言模型进行预训练，得到目标语言模型，基于模型剪枝方法以及知识蒸馏方法，构建轻量化模型，利用所述目标语言模型训练所述轻量化模型，所述轻量化模型完成训练之后得到所述意图识别预训练模型，其中，所述轻量化模型的参数的数量少于所述目标语言模型的参数的数量，所述轻量化模型的层数少于所述目标语言模型的层数。

19.一种知识反馈装置，其特征在于，包括：

处理器、存储器、总线、输入输出设备；

所述处理器与所述存储器、输入输出设备相连；

所述总线分别连接所述处理器、存储器以及输入输出设备；

所述输入输出设备还用于向用户反馈所述目标知识。

20.一种计算机存储介质，其特征在于，所述计算机存储介质中存储有指令，所述指令在计算机上执行时，使得所述计算机执行如权利要求1至10中任一项所述的方法。