CN115878790B

CN115878790B - 一种智能问答方法、装置、存储介质及电子设备

Info

Publication number: CN115878790B
Application number: CN202210369687.0A
Authority: CN
Inventors: 王军华; 赵国庆; 李宽
Original assignee: Beijing Zhongguancun Kejin Technology Co Ltd
Current assignee: Beijing Zhongguancun Kejin Technology Co Ltd
Priority date: 2022-04-08
Filing date: 2022-04-08
Publication date: 2023-08-25
Anticipated expiration: 2042-04-08
Also published as: CN115878790A

Abstract

本发明提供一种智能问答方法、装置、存储介质及电子设备，该方法包括：对目标问句进行意图分类，得到目标问句对应的意图类别，将该意图类别对应的匹配答案作为第一粗召回答案；识别目标问句中的实体单词；对实体单词进行向量化得到实体词向量，确定与实体词向量相似度最高的N个同义词，并基于N个同义词的同义词向量与实体词向量生成联合向量；基于联合向量与目标问句的文本向量生成目标问句向量，确定与目标问句向量相似度最高的K个匹配答案作为第二粗召回答案；从第一粗召回答案与第二粗召回答案中，取与目标问句的文本向量相似度最高的M个答案作为目标问句的问答结果。本发明能够基于多维度的粗召回答案确定问答结果，满足用户预期。

Description

一种智能问答方法、装置、存储介质及电子设备

技术领域

本发明涉及智能问答领域，尤其涉及一种智能问答方法、装置、存储介质及电子设备。

背景技术

问答系统在搜索引擎、智能客服和智能助手等应用场景中都发挥着重要作用。检索式问答系统是问答系统的重要类别，它能从大量文本中检索出问题的答案。主流的检索式问答系统通常包含query(查询)理解->检索召回->相似度排序等多个串行模块，其中，query理解是能够检索出满意答案的前提条件。

然而，相关技术在进行query问句向量化进行候选集匹配召回时，未考虑问句中重要词汇的差异而易导致答案被漏召，或者导致不匹配的答案排在前面，且未出现过的单词无法精准的对问句语义表示，因此，各种问答系统(例如银行问答系统)中存在问答结果不准的问题。

发明内容

本发明提供一种智能问答方法、装置、存储介质及电子设备，能够基于多维度的粗召回答案确定问答结果，满足用户的预期。

第一方面，本发明实施例提供一种智能问答方法，包括：

获取目标问句；

对所述目标问句进行意图分类，得到所述目标问句对应的意图类别，将该意图类别对应的匹配答案作为第一粗召回答案；

识别所述目标问句中的实体单词；

对所述实体单词进行向量化得到实体词向量，确定与所述实体词向量相似度最高的N个同义词，并基于所述N个同义词的同义词向量与所述实体词向量生成联合向量；

基于所述联合向量与所述目标问句的文本向量生成目标问句向量，确定与所述目标问句向量相似度最高的K个匹配答案作为第二粗召回答案；

从所述第一粗召回答案与所述第二粗召回答案中，取与所述目标问句的文本向量相似度最高的M个答案作为所述目标问句的问答结果。

在一些实施方式中，所述对所述目标问句进行意图分类，得到所述目标问句对应的意图类别，包括：

利用预先训练的意图分类模型对所述目标问句进行意图分类，得到所述目标问句对应的意图类别；其中，所述意图分类模型是根据基于所述历史问句及相应意图知识，采用半监督学习方式训练多分类模型得到的。

在一些实施方式中，所述识别所述目标问句中的实体单词，包括：

利用预先训练的实体识别模型识别所述目标问句中的实体单词，其中，所述实体识别模型是利用预设新词发现算法及目标业务数据库识别历史问句中的实体单词，并基于所述实体单词构建实体词典，进而基于所述实体词典和所述历史问句训练得到的。

在一些实施方式中，所述实体识别模型包括BiLSTM-CRF模型。

在一些实施方式中，所述对所述实体单词进行向量化得到实体词向量，包括：

将所述实体单词输入预先训练的词向量训练模型得到实体词向量，其中，所述词向量训练模型是利用预先建立的分词列表训练得到，所述分词列表是将目标业务数据库中的实体单词导入分词工具，进而基于所述分词工具对历史问句进行分词所建立的实体单词列表。

在一些实施方式中，所述词向量训练模型包括FastText模型。

在一些实施方式中，所述确定与所述实体词向量相似度最高的N个同义词，并基于所述N个同义词的同义词向量与所述实体词向量生成联合向量，包括：

从预先建立的分词列表中确定与所述实体词向量相似度最高的N个同义词；

将所述N个同义词进行向量化得到相应的同义词向量；

将N个所述同义词向量叠加求平均得到均值向量；

将所述均值向量与所述实体词向量进行横向拼接得到联合向量。

第二方面，本发明实施例提供一种智能问答装置，包括：

问句获取模块，用于获取目标问句；

第一粗召模块，用于对所述目标问句进行意图分类，得到所述目标问句对应的意图类别，将该意图类别对应的匹配答案作为第一粗召回答案；

实体识别模块，用于识别所述目标问句中的实体单词；

向量化模块，用于对所述实体单词进行向量化得到实体词向量，确定与所述实体词向量相似度最高的N个同义词，并基于所述N个同义词的同义词向量与所述实体词向量生成联合向量；

第二粗召模块，用于基于所述联合向量与所述目标问句的文本向量生成目标问句向量，确定与所述目标问句向量相似度最高的K个匹配答案作为第二粗召回答案；

结果输出模块，用于从所述第一粗召回答案与所述第二粗召回答案中，取与所述目标问句的文本向量相似度最高的M个答案作为所述目标问句的问答结果。

第三方面，本发明实施例提供一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被一个或多个处理器执行时，实现如第一方面所述的方法。

第四方面，本发明实施例提供一种电子设备，包括存储器和一个或多个处理器，所述存储器上存储有计算机程序，所述计算机程序被所述一个或多个处理器执行时实现如第一方面所述的方法。

与现有技术相比，本发明的一个或多个实施例至少能够带来如下有益效果：

本发明技术主要从解决query理解能力角度提升检索问答效果，通过对query语句进行意图分类、对query进行实体识别、实体替换增强向量表征等手段进行效果优化。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本发明的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1是本发明实施例提供的一种智能问答方法流程图；

图2是本发明实施例提供的一种智能问答装置示意图。

具体实施方式

下面将结合本发明实施例中附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此，以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围，而是仅仅表示本发明的选定实施例。基于本发明的实施例，本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本发明保护的范围。

问答系统在搜索引擎、智能客服和智能助手等应用场景中都发挥着重要作用。检索式问答系统是问答系统的重要类别，它能从大量文本中检索出问题的答案。主流的检索式问答系统通常包含query理解->检索召回->相似度排序等多个串行模块，其中，query理解是能够检索出满意答案的前提条件。

在一些相关技术中，基于Word2Vec模型进行向量化召回匹配答案，但在进行query问句向量化进行候选集匹配召回时，未考虑问句中重要词汇的差异而易导致答案被漏召，或者导致不匹配的答案排在前面，且未出现过的单词无法精准的对问句语义表示，因此，各种问答系统(例如银行问答系统)中存在问答结果不准的问题。

为此，本发明实施例提供一种智能问答方法、装置、存储介质及电子设备，能够基于多维度的粗召回答案确定问答结果，满足用户的预期。

实施例一

图1示出了一种智能问答方法流程图，本实施例的方法可应用于银行问答系统，如图1所示，本实施例提供的智能问答方法，包括步骤S101～步骤S106：

步骤S101、获取目标问句。

在实际应用中，目标问句可以是用户通过搜索引擎、智能客服和智能助手等诸多应用场景中的问答系统提出的query问句。

步骤S102、对目标问句进行意图分类，得到目标问句对应的意图类别，将该意图类别对应的匹配答案作为第一粗召回答案。

在一些实施方式中，步骤S102对目标问句进行意图分类，得到目标问句对应的意图类别，进一步包括：

步骤S1021、利用预先训练的意图分类模型对目标问句进行意图分类，得到目标问句对应的意图类别。

其中，意图分类模型是根据基于历史问句及相应意图知识，采用半监督学习方式训练多分类模型得到的。在一些优选的实施方式中，意图分类模型包括BERT多分类模型，BERT多分类模型的主要结构是Transformer的Encoder层堆叠而成的深度神经网络。

在一些实施方式中，历史问句可以是但不限于银行问答系统中已有的用户问句数据，基于历史问句梳理出用户意图知识(例如：银行卡开户、银行卡挂失、信用卡逾期等意图分类标签)，采用半监督学习方式进行BERT多分类模型的多分类数据集构建扩充，经过多次迭代最终训练出准确率较高的BERT多分类模型，并保存该模型，用作意图分类模型。

通过预先训练的意图分类模型对目标问句进行意图分类，确定目标问句的意图分类标签，将该意图分类标签下提前梳理的匹配答案作为第一粗召回答案。

步骤S103、识别目标问句中的实体单词。

在一些实施方式中，步骤S103识别目标问句中的实体单词，包括：

利用预先训练的实体识别模型识别目标问句中的实体单词，其中，实体识别模型是利用预设新词发现算法及目标业务数据库识别历史问句中的实体单词，并基于实体单词构建实体词典，进而基于实体词典和历史问句训练得到的。实体识别模型包括但不限于BiLSTM-CRF模型。

在一些情况下，实体识别模型的训练过程如下：通过新词发现算法(例如smoothNLP)及已有DB数据集(例如某业务系统中的标准实体单词)，对历史问句中的实体单词(例如银行实体)进行识别，梳理出实体词典，基于实体词典和历史问句构建训练集，来训练实体识别模型。

步骤S104、对实体单词进行向量化得到实体词向量，确定与实体词向量相似度最高的N个同义词，并基于N个同义词的同义词向量与实体词向量生成联合向量。词向量训练模型包括但不限于FastText模型、Word2Vec模型。

在一些实施方式中，对实体单词进行向量化得到实体词向量，包括：

步骤S1041、将实体单词输入预先训练的词向量训练模型得到实体词向量，其中，词向量训练模型是利用预先建立的分词列表训练得到，分词列表是将目标业务数据库中的实体单词导入分词工具，进而基于分词工具对历史问句进行分词所建立的实体单词列表。

在一些情形中，分词工具包括jieba开源分词工具。将某业务数据库中的实体单词导入jieba开源分词工具，能够提升分词效果，解决开源分词工具切分领域词汇不准的问题。进一步地，将历史问句进行jieba分词得到实体单词列表，即分词列表，用作为词向量训练模型的训练数据集，进行词向量训练模型训练，并保存模型训练得到的词向量，供向量化时调用。

在进行对实体单词进行向量化时，将步骤S103中识别出的实体单词输入词向量训练模型进行实体单词的向量化表示，得到实体词向量。

在一些实施方式中，确定与实体词向量相似度最高的N个同义词，并基于N个同义词的同义词向量与实体词向量生成联合向量，包括：

步骤S1042、从预先建立的分词列表中确定与实体词向量相似度最高的N个同义词；

步骤S1043、将N个同义词进行向量化得到相应的同义词向量；

步骤S1044、将N个同义词向量叠加求平均得到均值向量；

步骤S1045、将均值向量与实体词向量进行横向拼接得到联合向量。

本实施例中，利用前述分词列表推理出与实体词向量相似度最高的N个同义词，一些情形中，N＝3，此处的相似度包括余弦相似度。将得到的N个同义词也分别输入前述词向量训练模型进行向量化表示，得到N个同义词向量。

在一个示例中，确定与实体词向量[0.201 0.011 0.039…]相似度最高的3个同义词，将对应的3个同义词向量叠加求平均得到均值向量[0.024 0.321…]，再将均值向量与实体词向量进行横向拼接得到联合向量：实体词向量[0.201 0.011 0.039…]+均值向量[0.024 0.321…]＝联合向量[0.201 0.011 0.039 0.024 0.321…]。

步骤S105、基于联合向量与目标问句的文本向量生成目标问句向量，确定与目标问句向量相似度最高的K个匹配答案作为第二粗召回答案。

一些情形中，此处的相似度包括余弦相似度。将联合向量与目标问句的文本向量进行横向拼接，生成最终的目标问句向量，计算目标问句向量与之前梳理好的匹配答案之间的余弦相似度，取出余弦相似度最高的K个匹配答案，即第二粗召回答案，与意图分类召回的第一粗召回答案一起作为最终的粗召回结果。

步骤S106、从第一粗召回答案与第二粗召回答案中，取与目标问句的文本向量相似度最高的M个答案作为目标问句的问答结果。

在一些情形中，对第一粗召回答案与第二粗召回答案进行向量化表示，计算目标问句的文本向量与向量化表示的所有粗召结果的余弦相似度，取出余弦相似度最高的M个答案作为目标问句的问答结果。

应当理解是的，本实施例的中的K、N、M可以根据实际需求设定，三者的取值可以相同、部分相同、不同，此处不做任何限定。

相比于特定场景下采用对query问句做统一的向量表示的方式无法精准识别出query问句的真实意图，导致被检索出的答案不能满足用户的预期，本方案采用多维度对query问句进行深度解析，将用户的意图进行深度挖掘采用深度预训练模型做多分类意图识别，使得粗召回阶段能够获取更大范围的匹配候选集，通过NER实体识别技术精准捕捉query问句中出现的实体、属性等重要词汇，通过同义词替换的策略进一步提升query中重要词汇的语义表达能力，使得最终的粗召回候选答案更加宽泛，用户的检索体验更加精准，最终获取的问答结果更加满足用户的预期。

实施例二

图2示出一种智能问答装置示意图，本实施例提供的智能问答装置，如图2所示，包括如下模块：

问句获取模块201，用于获取目标问句；

第一粗召模块202，用于对目标问句进行意图分类，得到目标问句对应的意图类别，将该意图类别对应的匹配答案作为第一粗召回答案；

实体识别模块203，用于识别目标问句中的实体单词；

向量化模块204，用于对实体单词进行向量化得到实体词向量，确定与实体词向量相似度最高的N个同义词，并基于N个同义词的同义词向量与实体词向量生成联合向量；

第二粗召模块205，用于基于联合向量与目标问句的文本向量生成目标问句向量，确定与目标问句向量相似度最高的K个匹配答案作为第二粗召回答案；

结果输出模块206，用于从第一粗召回答案与第二粗召回答案中，取与目标问句的文本向量相似度最高的M个答案作为目标问句的问答结果。

在一些实施方式中，第一粗召模块202对目标问句进行意图分类，得到目标问句对应的意图类别，进一步包括：利用预先训练的意图分类模型对目标问句进行意图分类，得到目标问句对应的意图类别。

在一些实施方式中，实体识别模块203识别目标问句中的实体单词，包括：

在一些实施方式中，向量化模块204对实体单词进行向量化得到实体词向量，包括：将实体单词输入预先训练的词向量训练模型得到实体词向量，其中，词向量训练模型是利用预先建立的分词列表训练得到，分词列表是将目标业务数据库中的实体单词导入分词工具，进而基于分词工具对历史问句进行分词所建立的实体单词列表。

在一些实施方式中，向量化模块204确定与实体词向量相似度最高的N个同义词，并基于N个同义词的同义词向量与实体词向量生成联合向量，包括：从预先建立的分词列表中确定与实体词向量相似度最高的N个同义词；将N个同义词进行向量化得到相应的同义词向量；将N个同义词向量叠加求平均得到均值向量；将均值向量与实体词向量进行横向拼接得到联合向量。

第二粗召模块205基于联合向量与目标问句的文本向量生成目标问句向量，确定与目标问句向量相似度最高的K个匹配答案作为第二粗召回答案，一些情形中，此处的相似度包括余弦相似度。将联合向量与目标问句的文本向量进行横向拼接，生成最终的目标问句向量，计算目标问句向量与之前梳理好的匹配答案之间的余弦相似度，取出余弦相似度最高的K个匹配答案，即第二粗召回答案，与意图分类召回的第一粗召回答案一起作为最终的粗召回结果。

应当理解的是，本实施例的装置具备方法实施例的全部有益效果。

本领域的技术人员应当明白，上述各模块或各步骤可以用通用的计算装置来实现，它们可以集中在单个的计算装置上，或者分布在多个计算装置所组成的网络上，可选地，它们可以用计算装置可执行的程序代码来实现，从而，可以将它们存储在存储装置中由计算装置来执行，或者将它们分别制作成各个集成电路模块，或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。本发明不限制于任何限定的硬件和软件结合。

实施例三

本实施例提供一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被一个或多个处理器执行时，实现实施例一的方法。

本实施例中，计算机可读存储介质可以由任何类型的易失性或非易失性存储设备或者它们的组合实现，例如静态随机存取存储器(Static Random Access Memory，简称SRAM)，电可擦除可编程只读存储器(Electrically Erasable Programmable Read-OnlyMemory，简称EEPROM)，可擦除可编程只读存储器(Erasable Programmable Read-OnlyMemory，简称EPROM)，可编程只读存储器(Programmable Read-Only Memory，简称PROM)，只读存储器(Read-Only Memory，简称ROM)，磁存储器，快闪存储器，磁盘或光盘。方法的内容详见实施例一，此次不再赘述。

实施例四

本实施例提供一种电子设备，包括存储器和一个或多个处理器，所述存储器上存储有计算机程序，所述计算机程序被所述一个或多个处理器执行时实现实施例一的方法。

本实施例中，处理器可以是专用集成电路(Application Specific IntegratedCircuit，简称ASIC)、数字信号处理器(Digital Signal Processor，简称DSP)、数字信号处理设备(Digital Signal Processing Device，简称DSPD)、可编程逻辑器件(ProgrammableLogic Device，简称PLD)、现场可编程门阵列(Field Programmable Gate Array，简称FPGA)、控制器、微控制器、微处理器或其他电子元件实现，用于执行上述实施例中的方法。在处理器上运行的计算机程序被执行时所实现的方法可参照本发明前述实施例提供的方法的具体实施例，此处不再赘述。

在本发明实施例所提供的几个实施例中，应该理解到，所揭露的装置和方法，也可以通过其它的方式实现。以上所描述的装置和方法实施例仅仅是示意性的。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

虽然本发明所揭露的实施方式如上，但所述的内容只是为了便于理解本发明而采用的实施方式，并非用以限定本发明。任何本发明所属技术领域内的技术人员，在不脱离本发明所揭露的精神和范围的前提下，可以在实施的形式上及细节上作任何的修改与变化，但本发明的专利保护范围，仍须以所附的权利要求书所界定的范围为准。

Claims

1.一种智能问答方法，其特征在于，包括：

获取目标问句；

识别所述目标问句中的实体单词；

从所述第一粗召回答案与所述第二粗召回答案中，取与所述目标问句的文本向量相似度最高的M个答案作为所述目标问句的问答结果；

所述确定与所述实体词向量相似度最高的N个同义词，并基于所述N个同义词的同义词向量与所述实体词向量生成联合向量，包括：

将所述N个同义词进行向量化得到相应的同义词向量；

将N个所述同义词向量叠加求平均得到均值向量；

将所述均值向量与所述实体词向量进行横向拼接得到联合向量；

所述基于所述联合向量与所述目标问句的文本向量生成目标问句向量，包括：

将所述联合向量与所述目标问句的文本向量进行横向拼接，生成所述目标问句向量。

2.根据权利要求1所述的智能问答方法，其特征在于，所述对所述目标问句进行意图分类，得到所述目标问句对应的意图类别，包括：

利用预先训练的意图分类模型对所述目标问句进行意图分类，得到所述目标问句对应的意图类别；其中，所述意图分类模型是根据基于历史问句及相应意图知识，采用半监督学习方式训练多分类模型得到的。

3.根据权利要求1所述的智能问答方法，其特征在于，所述识别所述目标问句中的实体单词，包括：

4.根据权利要求3所述的智能问答方法，其特征在于，所述实体识别模型包括BiLSTM-CRF模型。

5.根据权利要求1所述的智能问答方法，其特征在于，所述对所述实体单词进行向量化得到实体词向量，包括：

6.根据权利要求5所述的智能问答方法，其特征在于，所述词向量训练模型包括FastText模型。

7.一种智能问答装置，其特征在于，包括：

问句获取模块，用于获取目标问句；

实体识别模块，用于识别所述目标问句中的实体单词；

结果输出模块，用于从所述第一粗召回答案与所述第二粗召回答案中，取与所述目标问句的文本向量相似度最高的M个答案作为所述目标问句的问答结果；

所述向量化模块，用于从预先建立的分词列表中确定与实体词向量相似度最高的N个同义词；将N个同义词进行向量化得到相应的同义词向量；将N个同义词向量叠加求平均得到均值向量；将均值向量与实体词向量进行横向拼接得到联合向量；

所述第二粗召模块，用于基于所述联合向量与所述目标问句的文本向量生成所述目标问句向量。

8.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被一个或多个处理器执行时，实现如权利要求1至6中任一项所述的方法。

9.一种电子设备，其特征在于，包括存储器和一个或多个处理器，所述存储器上存储有计算机程序，所述计算机程序被所述一个或多个处理器执行时实现如权利要求1至6中任一项所述的方法。