CN114416927A

CN114416927A - 智能问答方法、装置、设备及存储介质

Info

Publication number: CN114416927A
Application number: CN202210078742.0A
Authority: CN
Inventors: 雷婷睿; 唐海峰; 李运松; 张澍
Original assignee: China Merchants Bank Co Ltd
Current assignee: China Merchants Bank Co Ltd
Priority date: 2022-01-24
Filing date: 2022-01-24
Publication date: 2022-04-29
Anticipated expiration: 2042-01-24
Also published as: CN114416927B

Abstract

本申请公开了一种智能问答方法、装置、设备及存储介质，包括：获取查询文本信息，将查询文本信息输入语义分类模型，获得目标问句语义向量，并基于查询文本信息以及目标问句语义向量，在预设问答知识数据库进行字词检索和语义向量检索，获得召回相似结果集，其中，语义分类模型为基于预先收集的领域无标注语料信息对BERT语言模型进行预训练，并结合AM‑softmax损失函数对预训练得到的模型进行训练获得，基于查询文本信息、目标问句语义向量、召回相似结果集和语义相似度模型，构建目标特征矩阵，基于目标特征矩阵，通过语义排序模型进行排序，获得排序评分结果，并基于所述排序评分结果，确定最终目标返回结果。本申请解决了模型识别准确性低的技术问题。

Description

智能问答方法、装置、设备及存储介质

技术领域

本申请涉及机器学习技术领域，尤其涉及一种智能问答方法、装置、设备及存储介质。

背景技术

随着互联网的发展，智能问答系统得到了快速发展，智能问答系统是从大量数据中找到最能满足用户意图的文字信息，当前，智能问答系统主要为基于字词等表层语义特征的问答系统，然而，基于表层语义的问答装置缺乏对于深度语义的识别能力，匹配准确率不高，进而导致模型识别的准确性较低。

发明内容

本申请的主要目的在于提供一种智能问答方法、装置、设备及存储介质，旨在解决现有技术中的模型识别的准确性较低的技术问题。

为实现上述目的，本申请提供一种智能问答方法，所述智能问答方法包括：

获取目标用户输入的查询文本信息；

将所述查询文本信息输入语义分类模型，获得目标问句语义向量，并基于所述查询文本信息以及所述目标问句语义向量，在预设问答知识数据库进行字词检索和语义向量检索，获得召回相似结果集，其中，所述语义分类模型为基于预先收集的领域无标注语料信息对BERT语言模型进行预训练，并结合AM-softmax损失函数对预训练得到的模型进行迭代训练获得；

基于所述查询文本信息、所述目标问句语义向量、所述召回相似结果集以及语义相似度模型，构建目标特征矩阵，其中，所述语义相似度模型为基于所述语义分类模型输出问句语义向量构建的训练三元组样本进行迭代训练获得；

基于所述目标特征矩阵，通过语义排序模型进行排序，获得排序评分结果，并基于所述排序评分结果，确定最终目标返回结果，其中，所述语义排序模型为基于不同类别问句语义向量构建的训练三元组样本进行迭代训练获得。

本申请还提供一种智能问答装置，所述智能问答装置为虚拟装置，所述智能问答装置包括：

获取模块，用于获取目标用户输入的查询文本信息；

召回模块，用于将所述查询文本信息输入语义分类模型，获得目标问句语义向量，并基于所述查询文本信息以及所述目标问句语义向量，在预设问答知识数据库进行字词检索和语义向量检索，获得召回相似结果集，其中，所述语义分类模型为基于预先收集的领域无标注语料信息对BERT语言模型进行预训练，并结合AM-softmax损失函数对预训练得到的模型进行迭代训练获得；

特征构建模块，用于基于所述查询文本信息、所述目标问句语义向量、所述召回相似结果集以及语义相似度模型，构建目标特征矩阵，其中，所述语义相似度模型为基于所述语义分类模型输出问句语义向量构建的训练三元组样本进行迭代训练获得；

排序模块，用于基于所述目标特征矩阵，通过语义排序模型进行排序，获得排序评分结果，并基于所述排序评分结果，确定最终目标返回结果，其中，所述语义排序模型为基于不同类别问句语义向量构建的训练三元组样本进行迭代训练获得。

本申请还提供一种智能问答设备，所述智能问答设备为实体设备，所述智能问答设备包括：存储器、处理器以及存储在所述存储器上的智能问答程序，所述智能问答程序被所述处理器执行实现如上述的智能问答方法的步骤。

本申请还提供一种存储介质，所述存储介质为计算机可读存储介质，所述计算机可读存储介质上存储智能问答程序，所述智能问答程序被处理器执行实现如上述的智能问答方法的步骤。

本申请提供了一种智能问答方法、装置、设备及存储介质，本申请首先获取目标用户输入的查询文本信息，进而将所述查询文本信息输入语义分类模型，获得目标问句语义向量，其中，所述语义分类模型为基于预先收集的领域无标注语料信息对BERT语言模型进行预训练，并结合AM-softmax损失函数对预训练得到的模型进行迭代训练获得，实现了通过无标注的语料信息对模型进行预训练，提高了对于领域内查询问题的识别准确率和泛化性，进一步地，采用高区分度的AM-softmax损失函数预训练得到的模型进行迭代训练，提高模型训练的效率，并且增大了句子之间的区分度，进一步提升模型识别的准确度，并基于所述查询文本信息以及所述目标问句语义向量，在预设问答知识数据库进行字词检索和语义向量检索，获得召回相似结果集，进一步地，基于所述查询文本信息、所述目标问句语义向量、所述召回相似结果集以及语义相似度模型，构建目标特征矩阵，其中，所述语义相似度模型为基于所述语义分类模型输出问句语义向量构建的训练三元组样本进行迭代训练获得，进而基于所述目标特征矩阵，通过语义排序模型进行排序，获得排序评分结果，并基于所述排序评分结果，确定最终目标返回结果，其中，所述语义排序模型为基于不同类别问句语义向量构建的训练三元组样本进行迭代训练获得，实现了通过不同类别问句语义向量构建的训练三元组样本进行迭代训练获得，克服特征样本构造阶段类别不均衡的技术缺陷，进而实现了通过字词召回以及语义向量召回方式在预设问答知识数据库中检索用户问题对应的召回相似问，以在预设问答知识数据库进行深度学习检索，进而基于所述查询文本信息、所述目标问句语义向量、所述召回相似结果集以及语义相似度模型，形成目标特征矩阵，通过基于不同类别问句语义向量构建的训练三元组样本进行迭代训练得到的语义排序模型，对目标特征矩阵进行排序，以深度学习挖掘不同类别易混淆的困难样本，实现更精细化的排序输出，提高模型识别的准确性，从而使得通过模型基于用户查询文本匹配出准确度较高的答案。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本申请的实施例，并与说明书一起用于解释本申请的原理。

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，对于本领域默认技术人员而言，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本申请智能问答方法第一实施例的流程示意图；

图2为本申请智能问答方法的模块示意图；

图3为本申请智能问答方法第二实施例的流程示意图；

图4为本申请智能问答方法第三实施例的流程示意图；

图5为本申请智能问答方法第四实施例的流程示意图；

图6为本申请实施例方案涉及的硬件运行环境的智能问答设备结构示意图；

图7为本申请智能问答装置的功能模块示意图。

本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

应当理解，此处所描述的具体实施例仅用以解释本申请，并不用于限定本申请。

本申请实施例提供一种智能问答方法，在本申请智能问答方法的第一实施例中，参照图1，所述智能问答方法包括：

步骤S10，获取目标用户输入的查询文本信息；

在本实施例中，获取目标用户输入的查询文本信息，具体地，对所述目标用户输入的问句信息进行预处理，获得所述查询文本信息，其中，所述预处理包括停用词去除，英文大小写统一，数字处理金额以及时间归一化等处理。

步骤S20，将所述查询文本信息输入语义分类模型，获得目标问句语义向量，并基于所述查询文本信息以及所述目标问句语义向量，在预设问答知识数据库进行字词检索和语义向量检索，获得召回相似结果集；

在本实施例中，需要说明的是，所述预设问答知识数据库包括多个标准问，每一个标准问对应一个答案和至少一个相似问。

具体地，首先获取领域无标注语料信息，其中，所述领域无标注语料信息为特定领域对应的语料信息，例如，医疗领域、金融领域等，并基于所述领域无标注语料信息，对待训练初始模型进行预训练，获得预训练语言模型，以提高模型对该领域文本的理解能力，进而获取待训练语料信息，并基于待训练语料信息以及AM-softmax损失函数，对预训练得到的模型进行迭代训练，进而基于所述待训练语料信息以及预设损失函数，对待训练初始模型进行迭代训练，获得所述语义分类模型，进而将所述查询文本信息输入训练好的语义分类模型，从而将查询文本信息转化为语义向量表示，获得所述目标问句语义向量，进而基于所述目标问句语义向量在预设问答知识数据库进行语义向量检索，得到语义召回结果，实现了语义向量的召回，另外地，可直接所述查询文本信息在所述预设问答知识数据库中进行字词检索，得到字词召回结果，进而将所述语义召回结果和字词召回结果进行合并，并将合并后的召回结果进行去重处理，获得最终的召回相似结果集。

其中，所述基于所述查询文本信息以及所述目标问句语义向量，在预设问答知识数据库进行字词检索和语义向量检索，获得召回相似结果集的步骤包括：

步骤S21，根据所述查询文本信息，查询所述预设问答知识数据库，获得字词召回结果；

步骤S22，根据所述目标问句语义向量，查询所述预设问答知识数据库，获得语义召回结果；

步骤S23，将所述字词召回结果和所述语义召回结果进行合并去重处理，获得所述召回相似结果集。

在本实施例中，具体地，基于所述查询文本信息，在所述预设问答知识数据库进行字词检索，得到字词召回结果，同时基于所述语义分类模型输出的目标问句语义向量，在所述预设问答知识数据库进行语义检索，得到所述语义召回结果，从而实现了根据字词、语义两路召回的结果，学习到更多的召回相似问，进而将所述字词召回结果和所述语义召回结果进行合并去重处理，获得所述召回相似结果集。

步骤S30，基于所述查询文本信息、所述目标问句语义向量、所述召回相似结果集以及语义相似度模型，构建目标特征矩阵，其中，所述语义相似度模型为基于所述语义分类模型输出问句语义向量构建的训练三元组样本进行迭代训练获得；

在本实施例中，需要说明的是，所述目标特征矩阵包括字词相似度特征以及语义相似度特征，其中，所述字词相似度特征包括查询文本信息对应的编辑距离、cosine余弦距离，tfidf统计得分和Jaccard杰卡德距离等特征，所述语义相似度特征包括语义相似度模型的相似度特征，以及目标问句语义向量的余弦相似度特征等，进一步地，所述语义相似度模型包括匹配金字塔模型、三角形相似模型等，在本申请中，优选地，选取所述匹配金字塔模型。

具体地，计算所述查询文本信息与所述召回相似结果集中各个召回数据的相似度，获得字词相似度特征，进而计算所述目标问句语义向量对应的相似度特征，并将所述目标问句语义向量输入所述语义相似度模型，输出模型相似度特征，进而基于所述字词相似度特征、所述语义相似度模型以及所述模型相似度特征，构建所述目标特征矩阵。

其中，所述基于所述查询文本信息、所述目标问句语义向量、所述召回相似结果集以及语义相似度模型，构建目标特征矩阵的步骤包括：

步骤S31，计算所述查询文本信息与所述召回相似结果集中各个召回数据的相似度，获得字词相似度特征；

在本实施例中，具体地，分别所述查询文本信息与所述召回相似结果集中各个召回数据的余弦距离、编辑距离、Jaccard杰卡德距离等相似度特征，获得所述字词相似度特征。

步骤S32，基于所述目标问句语义向量以及所述语义相似度模型，确定语义相似度特征；

在本实施例中，具体，计算所述目标问句语义向量的相似度特征，以及将所述目标问句语义向量输入所述语义相似度模型，获得模型相似度特征，并述目标问句语义向量的相似度特征以及所述模型相似度特征作为所述语义相似度特征。

步骤S33，基于所述字词相似度特征以及所述语义相似度特征，构建所述目标特征矩阵。

在本实施例中，具体地，基于所述字词相似度特征以及所述语义相似度特征，构建形成[特征a特征b特征c…是否相似]数据特征集，并将所述数据特征集作为所述目标特征矩阵。

步骤S40，基于所述目标特征矩阵，通过语义排序模型进行排序，获得排序评分结果，并基于所述排序评分结果，确定最终目标返回结果，其中，所述语义排序模型为基于不同类别问句语义向量构建的训练三元组样本进行迭代训练获得。

在本实施例中，需要说明的是，所述语义排序模型包括GBDT模型和深度排序模型等模型。

具体地，将所述目标特征矩阵输入所述语义排序模型，获得所述召回相似结果集对应的排序评分结果，进而基于所述排序评分结果，按照预设选取规则确定所述最终目标返回结果，并将所述最终目标返回结果对应的标准问以及答案返回至所述目标用户，其中，所述预设选取规则包括选取所述排序评分结果最高的结果或者基于排序评分结果选取预设数量评分排序较高的结果作为所述最终目标返回结果。

其中，在所述基于所述目标特征矩阵，通过语义排序模型进行排序，获得排序评分结果，并基于所述排序评分结果，确定最终目标返回结果的步骤之后，所述智能问答方法还包括：

步骤D10,获取新增问句信息的新增请求和/或删除问句信息的删除请求；

步骤D20,将所述新增请求对应的新增问句信息输入至所述语义分类模型，输出新增语义向量，并将所述新增语义向量更新存储至所述预设知识检索库中；

步骤D30,确定所述删除请求对应的问句标签，并基于所述问句标签，删除所述预设知识检索库对应的相似问。

在本实施例中，具体地，在模型训练完成部署上线后，当接收到用户输入的新增问句信息的新增请求时，基于所述新增问句信息，通过所述语义分类模型进行预测分类，获得新增语义向量从而基于所述新增语义向量，实时更新所述预设知识检索库，另外地，当接收到用户输入的删除问句信息的删除请求时，基于删除问句信息对应的问句标签，将存储在预设知识检索库的问句标签进行删除，从而实现系统框架的动态更新优化。

进一步地，参考图2，图2为本申请智能问答方法的模块示意图，具体地，本申请将全流程分为查询文本信息预处理，召回，特征构建和排序四个模块，在进行部署时通过基类统一为模型训练、预测，查询文本信息预处理和特征构建等模块进行构建接口，通过模块注册和配置选择，实现特征和模型的自定义插拔与扩展，使得本方案可以随不同的需求灵活调整其规模大小和复杂程度，适用于多种场景；同时，本申请的项目采用一体化框架，将程序进行pip打包，便于版本控制和功能记录，同时提升框架的复用性和易用性，从而实现全流程的一键训练，仅需要提供模型训练数据，即可完成新FAQ应用的优化部署。

本申请实施例提供了一种智能问答方法，本申请实施例首先获取目标用户输入的查询文本信息，进而将所述查询文本信息输入语义分类模型，获得目标问句语义向量，其中，所述语义分类模型为基于预先收集的领域无标注语料信息对BERT语言模型进行预训练，并结合AM-softmax损失函数对预训练得到的模型进行迭代训练获得，实现了通过无标注的语料信息对模型进行预训练，提高了对于领域内查询问题的识别准确率和泛化性，进一步地，采用高区分度的AM-softmax损失函数预训练得到的模型进行迭代训练，提高模型训练的效率，并且增大了句子之间的区分度，进一步提升模型识别的准确度，并基于所述查询文本信息以及所述目标问句语义向量，在预设问答知识数据库进行字词检索和语义向量检索，获得召回相似结果集，进一步地，基于所述查询文本信息、所述目标问句语义向量、所述召回相似结果集以及语义相似度模型，构建目标特征矩阵，其中，所述语义相似度模型为基于所述语义分类模型输出问句语义向量构建的训练三元组样本进行迭代训练获得，进而基于所述目标特征矩阵，通过语义排序模型进行排序，获得排序评分结果，并基于所述排序评分结果，确定最终目标返回结果，其中，所述语义排序模型为基于不同类别问句语义向量构建的训练三元组样本进行迭代训练获得，实现了通过不同类别问句语义向量构建的训练三元组样本进行迭代训练获得，克服特征样本构造阶段类别不均衡的技术缺陷，进而实现了通过字词召回以及语义向量召回方式在预设问答知识数据库中检索用户问题对应的召回相似问，以在预设问答知识数据库进行深度学习检索，进而基于所述查询文本信息、所述目标问句语义向量、所述召回相似结果集以及语义相似度模型，形成目标特征矩阵，通过基于不同类别问句语义向量构建的训练三元组样本进行迭代训练得到的语义排序模型，对目标特征矩阵进行排序，以深度学习挖掘不同类别易混淆的困难样本，实现更精细化的排序输出，提高模型识别的准确性，从而使得通过模型基于用户查询文本匹配出准确度较高的答案。

进一步地，参照图3，基于本申请中第一实施例，在所述获取目标用户输入的查询文本信息的步骤之前，所述智能问答方法还包括：

步骤A10，获取领域无标注语料信息，并基于所述领域无标注语料信息，对待训练初始模型进行预训练，获得预训练语言模型；

在本实施例中，需要说明的是，领域无标注语料信息为特地领域内对应的无标注的语料信息，例如，信用卡金融领域的语料信息。具体地，基于所述待训练语料信息对待训练初始模型进行迭代训练，直至达到预设训练结束条件，得到该领域内的预训练语言模型，提高了对于信用卡领域内相关问题的识别准确率和泛化性，此外，在模型训练语料信息有限的情况下，引入BERT-SimCSE方法，需要说明的是，SimCSE是一种与BERT结合的对比学习方法，使用SimCSE算法对语言模型进行无监督训练，从而增强模型语义表征能力和泛化能力。

步骤A20，获取待训练语料信息，其中，所述待训练语料信息包括不同类别的标准问集和相似问集；

在本实施例中，需要说明的是，一个类别至少对应一个标准问，一个标准问对应一个答案以及至少对应的一个相似问。

具体地，获取领域语料信息，进而将所述领域语料信息整理成预设数据的标准问以及相似问的格式，并且将所述领域语料信息进行预处理，其中，所述预处理包括停用词去除，英文大小写统一，数字处理金额以及时间归一化等处理方式，从而获得所述待训练语料信息。

步骤A30，基于预设损失函数以及所述相似问集，对所述预训练语言模型进行迭代训练，获得所述语义分类模型，并输出训练分类结果，其中，所述预设损失函数包括AM-softmax损失函数，所述训练分类结果包括问句语义向量以及分类概率信息；

在本实施例中，具体地，基于所述相似问集以及高区分度的AM-Softmax损失函数，对所述进行预训练后的预训练语言模型进行训练，获得所述语义分类模型，AM-Softmax损失函数能够把文本检索作为分类任务来进行训练，从而加快模型收敛速度，并增大句子之间的区分度，提升模型识别准确度，并输出训练分类结果，其中，所述训练分类结果包括问句语义向量以及分类概率信息。

也即，在语义分类模型的训练过程中，存在模型预训练和模型精调阶段，在模型预训练阶段，基于领域无标注语料预训练BERT模型，并且在训练语料数量有限的情况下，引入BERT-SimCSE方法进行无监督训练，增加了对于领域内相关问题的识别准确率和泛化性，在模型精调阶段，采用高区分度的AM-softmax损失函数，把文本检索任务作为分类任务来训练，显著提高训练速度，增大了句子之间的区分度，模型识别准确度得到明显提升，如表1，表1为结合不同算法进行预测的准确率：

	BERT	CMBCCD-BERT	CMBCCD-BERT-SimCSE
				top1准确率	70％	74％	76％
top5准确率	92％	95％	97％

其中，CMBCCD-BERT表示基于信用卡领域无标注语料预训练的BERT模型，CMBCCD-BERT-SimCSE表示信用卡领域无标注语料并引入SimCSE算法进行预训练的BERT模型，从表中体现出基于CMBCCD-BERT-SimCSE方法进行预测的准确率显著提升。

步骤A40，将所述相似问集每一相似问、各所述相似问对应的问句语义向量以及各所述相似问关联的标准问进行关联组合，并将组成结果存储至所述预设知识检索库中。

在本实施例中，具体地，对于每一所述相似问均执行以下步骤：

将所述相似问关联的标准问的标签、所述相似问的标签以及所述相似问的问句语义向量进行关联组合，进而将组合结果存储至所述预设知识检索库中，例如：将[标准问id,相似问id,问句语义向量]以及问句本身关联存入所述预设知识检索库，从而使得通过预设知识检索库可在预测阶段根据用户输入数据进行检索召回。

进一步地，参照图4，基于本申请中第二实施例，在所述将所述相似问集的每一相似问、各所述相似问对应的问句语义向量以及各所述相似问关联的标准问进行关联组合，并将组成结果存储至所述预设知识检索库中的步骤之后，所述智能问答方法还包括：

步骤B10，计算各所述相似问对应问句语义向量之间的相似度；

步骤B20，将所述相似度与预设相似度阈值进行比较，并基于所述相似度比较结果以及各所述相似问的真实类别标签，构建第一待训练三元组样本；

在本实施例中，将所述相似度与预设相似度阈值进行比较，并基于所述相似度比较结果以及各所述相似问的真实类别标签，构建第一待训练三元组样本，具体地，在将每一个相似问输入至所述语义分类模型后，输出每个相似度对应的问句语义向量以及类别概率信息，进而分别计算每两个所述相似问的问句语义向量之间的相似度，从而获得多个相似问组的相似度，并将每一所述相似问组的相似度和预设相似度阈值进行比较，若相似度小于预设相似度阈值，则排除该相似问组，也即，相似度小于预设相似度阈值的相似问组不用进行后续的模型训练过程，若相似度大于预设相似度阈值，则进一步判断大于所述预设相似度阈值对应的相似问组是否属于同一类别，进而将相同类别的相似问组作为正样本，以及将不同类别的相似问组作为负样本，从而得到[相似问a相似问b是否相似]格式的第一待训练三元组样本。

例如，相似问和相似问对应的问句语义向量分别为：a1-->q_a1、a2-->q_a2、b1-->q_b1和c1-->q_c1，其中，a1和a2属于同一个类别的相似问，a1、b1和c1为不同类别的相似问，假设经过比对q_a1和q_a2的相似度大于预设相似度阈值，而a1和a2属于同一类别，则获得(a1,a3,1)三元组样本，另外地，q_a1和q_b1相似度大于预设相似度阈值，而a1和b1不属于同一类别，则获得(a1,b1,0)三元组样本，最后q_a1和q_c1相似度小于预设相似度阈值，则排除相似问组(a1,c4)，也即，相似问组(a1,c4)后续不会用来训练待训练相似度模型，从而保留相似度较高的相似问组进行模型训练，以提高模型的识别准确性。

步骤B30，基于所述第一待训练三元组样本，对待训练相似度模型进行迭代训练，获得所述语义相似度模型。

在本实施例中，基于所述第一待训练三元组样本，对待训练相似度模型进行迭代训练，获得所述语义相似度模型，具体地，将所述第一待训练三元组样本输入所述待训练相似度模型，以优化所述待训练相似度模型，并判断优化后的待训练相似度模型是否满足迭代结束条件，其中，所述预设训练结束条件包括损失收敛和达到最大迭代次数阈值等，若满足，则获得所述语义相似度模型，若不满足，则返回执行步骤：将所述相似度与预设相似度阈值进行比较，并基于所述相似度比较结果以及各所述相似问的真实类别标签，构建第一待训练三元组样本。

本申请实施例提供了一种智能问答方法，也即，计算各所述相似问对应问句语义向量之间的相似度，进而将所述相似度与预设相似度阈值进行比较，并基于所述相似度比较结果以及各所述相似问的真实类别标签，构建第一待训练三元组样本，进一步地，基于所述第一待训练三元组样本，对待训练相似度模型进行迭代训练，获得所述语义相似度模型，实现了基于问句语义向量之间的相似度来筛选出相似度较高的相似问，进而将易混淆的相似问训练得到语义相似度模型，从而通过语义相似度模型学习挖掘易混淆的困难样本，提高模型识别能力。

进一步地，参照图5，基于本申请中第三实施例，在所述基于所述待训练样本，对待训练相似度模型进行迭代训练，获得所述语义相似度模型的步骤之后，所述智能问答方法还包括：

步骤C10，基于各所述相似问的分类概率信息以及所述相似度比较结果，选取不同类别的相似问，获得多类别相似问组；

在本实施例中，基于各所述相似问的分类概率信息以及所述相似度比较结果，选取不同类别的相似问，获得多类别相似问组，具体地，对每一所述相似问均执行以下步骤：

在将所述相似问输入至所述语义分类模型后，输出所述相似度对应的问句语义向量以及类别概率信息，进而在所述类别概率信息中选取预设数量的类别作为候选类别，进而分别计算所述相似问与候选类别的相似问对应问句语义向量之间的相似度，从而获得多个相似问组的相似度，并将每一所述相似问组的相似度和预设相似度阈值进行比较，选取相似度大于预设相似度阈值的相似问组，从而获得多类别相似问组。

步骤C20，基于各所述相似问的真实类别标签以及所述多类别相似问组，构建第二待训练三元组样本；

在本实施例中，需要说明的是，第二待训练三元组样本包括不同类别对应的相似问组，所述相似问组为每两个相似问组成的相似问组。

具体地，基于各所述相似问的真实类别标签，确定所述多类别相似问组中的每一相似问组是否属于同一类别，以筛选得到[相似问a相似问b是否相似]格式且包含不同类别的第二待训练三元组样本。

例如，针对相似问a1,需要抽取20组相似问组，假设经过计算不同相似问的问句语义向量之间的相似度，得到a1的问句语义向量与a2、a3...a20的问句语义向量之间的相似度最高，但是a1和a2、a3...a20属于同一个类别的相似问，因此，需要在a2、a3...a20中选取预设数量的相似度较高的相似问与a1组成(a1,a2,1)对应的三元组样本，进而基于相似问a1的分类概率信息，分别在其他类别中选取预设数量的与a1的问句语义向量q_a1之间相似度较高的相似问组成相似问组，并且按照真实类别给出标签0或1，从而得到包含不同类别的相似问组，可以理解地，第二待训练三元组样本不能是(a1,a2,1)、(a1,a2,1)...(a1,a20,1)这20条相似问全属于同一个类别的集合，从而实现了利用BERT模型的训练分类结果，挖掘出易混淆的困难样本，结合随机采样方式，构造语义排序模型训练样本，从而巧妙地解决了特征构造阶段类别不均衡问题，实现更精细化的排序输出。

步骤C30，计算所述第二待训练三元组样本对应的训练字词匹配特征，并通过所述语义分类模型和所述语义相似度模型计算所述第二待训练三元组样本的训练语义相似度特征；

在本实施例中，具体地，计算所述第二待训练三元组样本之间的训练字词匹配特征，进而将第二待训练三元组样本输入所述语义分类模型，输出模型语义匹配特征，并基于所述语义相似度模型计算所述第二待训练三元组样本的相似度特征，进而将所述模型语义匹配特征以及语义相似度模型的相似度特征作为所述训练语义相似度特征。

步骤C40，基于所述训练字词匹配特征和所述训练语义相似度特征，构建训练特征矩阵；

在本实施例中，具体地，基于所述训练字词匹配特征和所述训练语义相似度特征，形成[特征a特征b特征c…是否相似]数据特征集，并将所述特征集作为所述训练特征矩阵。

步骤C50，基于所述训练特征矩阵，对待训练语义排序模型进行迭代训练，获得所述语义排序模型。

在本实施例中，具体地，将所述训练特征矩阵输入所述待训练语义排序模型，以优化所述待训练语义排序模型，并判断优化后的待训练语义排序模型是否满足迭代结束条件，若满足，则获得所述语义排序模型，若不满足，则返回执行步骤：基于各所述相似问的分类概率信息以及所述相似度比较结果，选取不同类别的相似问，获得多类别相似问组。

本申请实施例提供了一种智能问答方法，也即，基于各所述相似问的分类概率信息以及所述相似度比较结果，选取不同类别的相似问，获得多类别相似问组，进而基于各所述相似问的真实类别标签以及所述多类别相似问组，构建第二待训练三元组样本，进一步地，计算所述第二待训练三元组样本对应的训练字词匹配特征，并通过所述语义分类模型和所述语义相似度模型计算所述第二待训练三元组样本的训练语义相似度特征，进而基于所述训练字词匹配特征和所述训练语义相似度特征，构建训练特征矩阵，进一步地，基于所述训练特征矩阵，对待训练语义排序模型进行迭代训练，获得所述语义排序模型，实现了基于各所述相似问的分类概率信息，从而以类别作为监督信号，使得构建得到的第二待训练三元组样本包含有不同类别对应的相似问组，进而基于所述第二待训练三元组样本对应的训练字词匹配特征和训练语义相似度特征构建训练特征矩阵，使得训练得到的语义排序模型能够深度挖掘不同类别易混淆的相似问。

参照图6，图6是本申请实施例方案涉及的硬件运行环境的智能问答设备结构示意图。

如图6所示，该智能问答设备可以包括：处理器1001，例如CPU，存储器1005，通信总线1002。其中，通信总线1002用于实现处理器1001和存储器1005之间的连接通信。存储器1005可以是高速RAM存储器，也可以是稳定的存储器(non-volatile memory)，例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储设备。

可选地，该智能问答设备还可以包括矩形用户接口、网络接口、相机、RF(RadioFrequency，射频)电路，传感器、音频电路、WiFi模块等等。矩形用户接口可以包括显示屏(Display)、输入子模块比如键盘(Keyboard)，可选矩形用户接口还可以包括标准的有线接口、无线接口。网络接口可选的可包括标准的有线接口、无线接口(如WIFI接口)。

本领域技术人员可以理解，图6中示出的智能问答设备结构并不构成对智能问答设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

如图6所示，作为一种计算机存储介质的存储器1005中可以包括操作装置、网络通信模块以及智能问答程序。操作装置是管理和控制智能问答设备硬件和软件资源的程序，支持智能问答程序以及其它软件和/或程序的运行。网络通信模块用于实现存储器1005内部各组件之间的通信，以及与智能问答装置中其它硬件和软件之间通信。

在图6所示的智能问答设备中，处理器1001用于执行存储器1005中存储的智能问答程序，实现上述任一项所述的智能问答方法的步骤。

本申请智能问答设备具体实施方式与上述智能问答方法各实施例基本相同，在此不再赘述。

此外，请参照图7，图7是本申请智能问答装置的功能模块示意图，本申请还提供一种智能问答装置，所述智能问答装置包括：

获取模块，用于获取目标用户输入的查询文本信息；

召回模块，用于将所述查询文本信息输入语义分类模型，获得目标问句语义向量，并基于所述查询文本信息以及所述目标问句语义向量，在预设问答知识数据库进行字词检索和语义向量检索，获得召回相似结果集；

可选地，所述召回模块还用于：

根据所述查询文本信息，查询所述预设问答知识数据库，获得字词召回结果；

根据所述目标问句语义向量，查询所述预设问答知识数据库，获得语义召回结果；

将所述字词召回结果和所述语义召回结果进行合并去重处理，获得所述召回相似结果集。

可选地，所述特征构建模块还用于：

计算所述查询文本信息与所述召回相似结果集中各个召回数据的相似度，获得字词相似度特征；

基于所述目标问句语义向量以及所述语义相似度模型，确定语义相似度特征；

基于所述字词相似度特征以及所述语义相似度特征，构建所述目标特征矩阵。

可选地，所述智能问答装置还用于：

获取待训练语料信息，其中，所述待训练语料信息包括不同类别的标准问集和相似问集；

基于预设损失函数以及所述相似问集，对待训练初始模型进行迭代训练，获得所述语义分类模型，并输出训练分类结果，其中，所述训练分类结果包括问句语义向量以及分类概率信息；

将所述相似问集的每一相似问、各所述相似问对应的问句语义向量以及各所述相似问关联的标准问进行关联组合，并将组成结果存储至所述预设知识检索库中。

可选地，所述智能问答装置还用于：

计算各所述相似问对应问句语义向量之间的相似度；

将所述相似度与预设相似度阈值进行比较，并基于所述相似度比较结果以及各所述相似问的真实类别标签，构建第一待训练三元组样本；

基于所述第一待训练三元组样本，对待训练相似度模型进行迭代训练，获得所述语义相似度模型。

可选地，所述智能问答装置还用于：

基于各所述相似问的分类概率信息以及所述相似度比较结果，选取不同类别的相似问，获得多类别相似问组；

基于各所述相似问的真实类别标签以及所述多类别相似问组，构建第二待训练三元组样本；

计算所述第二待训练三元组样本对应的训练字词匹配特征，并通过所述语义分类模型和所述语义相似度模型计算所述第二待训练三元组样本的训练语义相似度特征；

基于所述训练字词匹配特征和所述训练语义相似度特征，构建训练特征矩阵；

基于所述训练特征矩阵，对待训练语义排序模型进行迭代训练，获得所述语义排序模型。

可选地，所述智能问答装置还用于：

获取新增问句信息的新增请求和/或删除问句信息的删除请求；

将所述新增请求对应的新增问句信息输入至所述语义分类模型，以更新优化模型，并输出新增语义向量；将所述新增语义向量更新存储至所述预设知识检索库中；

将所述删除请求对应的删除问句信息输入至所述语义分类模型，获得删除语义向量，并基于所述删除语义向量，删除所述预设知识检索库对应的相似问。

本申请智能问答装置的具体实施方式与上述智能问答方法各实施例基本相同，在此不再赘述。

本申请实施例提供了一种存储介质，所述存储介质为计算机可读存储介质，且所述计算机可读存储介质存储有一个或者一个以上程序，所述一个或者一个以上程序还可被一个或者一个以上的处理器执行以用于实现上述任一项所述的智能问答方法的步骤。

本申请计算机可读存储介质具体实施方式与上述智能问答方法各实施例基本相同，在此不再赘述。

以上仅为本申请的优选实施例，并非因此限制本申请的专利范围，凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本申请的专利处理范围内。

Claims

1.一种智能问答方法，其特征在于，所述智能问答方法包括：

获取目标用户输入的查询文本信息；

2.如权利要求1所述的智能问答方法，其特征在于，所述基于所述查询文本信息以及所述目标问句语义向量，在预设问答知识数据库进行字词检索和语义向量检索，获得召回相似结果集的步骤包括：

3.如权利要求1所述的智能问答方法，其特征在于，所述基于所述查询文本信息、所述目标问句语义向量、所述召回相似结果集以及语义相似度模型，构建目标特征矩阵的步骤包括：

4.如权利要求1所述的智能问答方法，其特征在于，在所述获取目标用户输入的查询文本信息的步骤之前，所述智能问答方法还包括：

获取领域无标注语料信息，并基于所述领域无标注语料信息，对待训练初始模型进行预训练，获得预训练语言模型；

基于预设损失函数以及所述相似问集，对所述预训练语言模型进行迭代训练，获得所述语义分类模型，并输出训练分类结果，其中，所述预设损失函数包括AM-softmax损失函数，所述训练分类结果包括问句语义向量以及分类概率信息；

5.如权利要求4所述的智能问答方法，其特征在于，在所述将所述相似问集的每一相似问、各所述相似问对应的问句语义向量以及各所述相似问关联的标准问进行关联组合，并将组成结果存储至所述预设知识检索库中的步骤之后，所述智能问答方法还包括：

计算各所述相似问对应问句语义向量之间的相似度；

6.如权利要求5所述的智能问答方法，其特征在于，在所述基于所述待训练样本，对待训练相似度模型进行迭代训练，获得所述语义相似度模型的步骤之后，所述智能问答方法还包括：

7.如权利要求1所述的智能问答方法，其特征在于，在所述基于所述目标特征矩阵，通过语义排序模型进行排序，获得排序评分结果，并基于所述排序评分结果，确定最终目标返回结果的步骤之后，所述智能问答方法还包括：

将所述新增请求对应的新增问句信息输入至所述语义分类模型，输出新增语义向量，并将所述新增语义向量更新存储至所述预设知识检索库中；

确定所述删除请求对应的问句标签，并基于所述问句标签，删除所述预设知识检索库对应的相似问。

8.一种智能问答装置，其特征在于，所述智能问答装置包括：

获取模块，用于获取目标用户输入的查询文本信息；

9.一种智能问答设备，其特征在于，所述智能问答设备包括：存储器、处理器以及存储在存储器上的智能问答程序，

所述智能问答程序被所述处理器执行实现如权利要求1至7中任一项所述智能问答方法的步骤。

10.一种存储介质，所述存储介质为计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有智能问答程序，所述智能问答程序被处理器执行实现如权利要求1至7中任一项所述智能问答方法的步骤。