CN117520524A

CN117520524A - 一种用于行业的智能问答方法及系统

Info

Publication number: CN117520524A
Application number: CN202410010351.4A
Authority: CN
Inventors: 钟晓斌
Original assignee: Beijing Universal Medical Rescue Co ltd
Current assignee: Beijing Universal Medical Rescue Co ltd
Priority date: 2024-01-04
Filing date: 2024-01-04
Publication date: 2024-02-06
Anticipated expiration: 2044-01-04
Also published as: CN117520524B

Abstract

本发明涉及一种用于行业的智能问答方法及系统，通过获取用户输入的问题文本；基于预先构建的编码器将用户输入的问题文本转换为查询向量；将查询向量与预先构建的行业知识库进行匹配；在行业知识库中存在匹配度超过阈值的目标资源时，将目标资源返回至用户；在行业知识库中不存在匹配度超过阈值的目标资源时，基于查询向量与预先调整的行业大模型执行问答，得到意图信息；将与意图信息对应的资源返回至用户。本申请建立行业知识库，并在执行问答过程中，现将用户的问题文本转换为查询向量，先直接在行业知识库中进行查询，在行业知识库中无匹配资源时，再通过调整的行业大模型执行问答动作，得到符合用户意图的目标资源。本申请具有回答更加准确，且更加灵活的优点。

Description

一种用于行业的智能问答方法及系统

技术领域

本发明涉及信息技术领域，具体是一种用于行业的智能问答方法及系统。

背景技术

随着深度学习技术的不断发展，基于深度神经网络的自然语言处理技术得到了广泛应用。这些技术的发展为大模型在智能问答领域的运用提供了可能性。

目前行业问答普遍存在不智能，不准确的现象，要么回答不够灵活，采用QA匹配的方式，要么回答的不够准确，例如直接采用大模型的方式。

发明内容

有鉴于此，本发明的目的是提供一种用于行业的智能问答方法及系统，以解决现有技术中的受限于小程序的体积限制以及小程序复用率较低现状，难以进行信息精准推荐的问题。

为了实现上述目的，本发明采用了如下技术方案：

本发明的一种用于行业的智能问答方法，包括步骤：

获取用户输入的问题文本；

基于预先构建的编码器将所述用户输入的问题文本转换为查询向量；

将所述查询向量与预先构建的行业知识库进行匹配；在所述行业知识库中存在匹配度超过阈值的目标资源时，将所述目标资源返回至用户；在所述行业知识库中不存在匹配度超过阈值的目标资源时，基于所述查询向量与预先调整的行业大模型执行问答，得到意图信息，其中，所述目标资源为文字、图片和视频其中之一或者多种组合；

将与所述意图信息对应的资源返回至用户。

在本申请一实施例中，基于预先构建的编码器将所述用户输入的问题文本转换为查询向量，包括：

对所述问题文本进行分词，得到多个单词；

基于查表将所述多个单词转换为词向量，并基于指数函数提取所述多个单词的位置编码；

将所述词向量与预先构建的第一参数矩阵进行相乘，得到词向量矩阵；并将所述位置编码与预先构建的第二参数矩阵进行相乘，得到位置矩阵；

将所述词向量矩阵与所述位置矩阵进行融合，得到融合矩阵；将所述融合矩阵与预先构建的第三参数矩阵进行相乘，得到编码结果；

基于查表将所述编码结果转换为查询向量。

在本申请一实施例中，所述第一参数矩阵、所述第二参数矩阵和所述第三参数矩阵通过如下方法构建：

获取问题训练文本，其中，所述问题训练文本预先标注查询向量真实结果；

将所述问题训练文本切分为训练集、验证集和测试集；

对所述第一参数矩阵、所述第二参数矩阵和所述第三参数矩阵进行初始化，并从所述训练集中提取一个当前问题训练文本，基于预先构建的编码器将所述当前问题训练文本转换为当前查询向量；

计算所述当前查询向量与所述查询向量真实结果的损失值，并基于所述损失值生成反向传播信号，以对第一参数矩阵、第二参数矩阵和第三参数矩阵进行更新；

从所述训练集中提取下一个问题训练文本作为当前问题训练文本，并回到基于预先构建的编码器将所述当前问题训练文本转换为当前查询向量；直至达到终止训练条件，其中，所述终止训练条件包括损失值不再减小和/或达到指定的训练次数；

基于所述验证集对训练完成的第一参数矩阵、第二参数矩阵和第三参数矩阵进行验证，并基于所述测试集对训练完成的第一参数矩阵、第二参数矩阵和第三参数矩阵进行验证测试，在通过验证和测试后，得到第一参数矩阵、第二参数矩阵和第三参数矩阵。

在本申请一实施例中，所述行业知识库包括文本库，还包括如下过程构建所述文本库：

获取行业文字材料，其中，所述行业文字材料的来源为电子文档或者行业音频文件；

按照所述行业文字材料的目录对所述行业知识材料进行分割，得到多个片段；

将长度大于N的片段作为目标片段，并基于句号将所述目标片段分为m个句子；

将所述m个句子划归至多个段落；

基于所述多个段落，调用语言大模型生成多个问题文本；并基于所述多个问题文本，调用语言大模型进行问题扩展，得到问题集合；

抽取所述问题集合中的问题文本，并以所述问题文本对应的答案、答案的来源段落、段落的所属行业文字材料、以及行业文字材料的对应的行业实体为节点，构建图结构的文本库，其中，所述文本库包括节点以及节点之间的关系。

在本申请一实施例中，将所述m个句子划归至多个段落，包括：

判断前i个未被划归至任何段落的句子的总长度；

在所述前i个句子的总长度小于或者等于N时，将前i个句子划归至当前段落中；

在所述前i个句子的总长度大于N时，且前i-1个句子的总长度小于N时，基于预先构建的编码器将第i-1个句子、第i个句子以及第i+1个句子向量化，得到第一句子向量、第二句子向量和第三句子向量；计算所述第一句子向量和所述第二句子向量的第一相似度，并计算所述第二句子向量和所述第三句子向量的第二相似度；在所述第一相似度大于所述第二相似度时，将所述第i个句子划归至当前段落中，在所述第一相似度小于或者等于所述第二相似度时，将所述第i个句子作为第1个句子，并回到判断前i个未被划归至任何段落的句子的总长度，直至完成对所有句子的划归，得到多个段落。

在本申请一实施例中，所述行业知识库包括影像库，还包括如下过程构建所述影像库：

获取行业影像材料，其中，所述行业影像材料包括图片材料和视频材料；

对所述视频材料进行采样，得到采样图片材料；

将所述图片材料和所述采样图片材料作为原始图像，并通过图像描述模型对所述原始图像进行描述，得到总结文本；

将所述总结文本输入至图像生成模型中，得到生成图像；

基于CNN网络提取所述原始图像和所述生成图像的图像特征，基于双向LSTM网络提取所述总结文本的文本特征；并基于预先构建的编码器将所述文本特征进行向量化，得到文本特征向量；

将所述原始图像的图像特征与所述文本特征向量进行融合，得到第一融合向量；并将所述生成图像的图像特征与所述文本特征向量进行融合，得到第二融合向量；

将原始图像、原始图像的图像特征、原始图像的总结文本、原始图像的第一融合相邻进行格式化存储；并将总结文本、总结文本的文本特征、总结文本的生成图像、总结文本的第二融合相邻进行格式化存储；得到影像库。

在本申请一实施例中，行业大模型的调整方法包括：

获取训练数据，其中，所述训练数据包括多种参数，所述参数至少包括文本、文本标题、文本源文件、源文件位置和源文件类型，源文件类型包括文本、音频、视频和图像；在源文件为图像或者视频时，所述文本基于图像或者视频生成；

将所述训练数据与行业知识库中的参考资源进行匹配，得到每种参数与所述参考资源匹配的概率，其中，所述参考资源为其中一种问询意图的问题文本；

将概率高于预设的概率阈值的参数进行遮挡，并将概率高于预设的概率阈值的参数作为训练数据的标签；

基于遮挡后的训练数据以及训练数据的标签构建训练数据集，并基于所述训练数据集对行业大模型进行训练，完成调整。

在本申请一实施例中，基于遮挡后的训练数据以及训练数据的标签构建训练数据集，包括：

基于预先构建的编码器将遮挡后的训练数据以及训练数据的标签转换为训练向量；

基于所述训练向量构建训练数据集。

在本申请一实施例中，基于所述查询向量与预先调整的行业大模型执行问答，得到意图信息，包括：

将所述查询向量输入至预先调整的行业大模型中，得到输出向量；

将所述输出向量与所述行业知识库进行资源匹配；

在所述行业知识库中存在与所述输出向量匹配的资源时，将与所述输出向量匹配的资源作为用户的意图信息；

在所述行业知识库中不存在与所述输出向量匹配的资源时，输出问题至用户，在接收到用户的回答文本时，基于预先构建的编码器将所述回答文本转换为新的查询向量，并将新的查询向量输入至预先调整的行业大模型中，得到新的输出向量；将新的输出向量作为输出向量，并回到将所述输出向量与所述行业知识库进行资源匹配；直至得到用户的意图信息。

本申请还提供一种用于行业的智能问答系统，包括：

获取模块，用于获取用户输入的问题文本；

转换模块，用于基于预先构建的编码器将所述用户输入的问题文本转换为查询向量；

匹配和问答模块，用于将所述查询向量与预先构建的行业知识库进行匹配；在所述行业知识库中存在匹配度超过阈值的目标资源时，将所述目标资源返回至用户；在所述行业知识库中不存在匹配度超过阈值的目标资源时，基于所述查询向量与预先调整的行业大模型执行问答，得到意图信息，其中，所述目标资源为文字、图片和视频其中之一或者多种组合；

返回模块，用于将与所述意图信息时对应的资源返回至用户。本发明还提供一种存储介质，其中存储有计算机程序，所述计算机程序被处理器加载执行时，实现如上所述的一种用于行业的智能问答方法。

本发明还提供一种电子设备，包括：处理器、及存储器；其中，所述存储器用于存储计算机程序；所述处理器用于加载执行所述计算机程序，以使所述电子设备执行如上所述的一种用于行业的智能问答方法。

本发明的有益效果是：本发明的一种用于行业的智能问答方法及系统，通过获取用户输入的问题文本；基于预先构建的编码器将用户输入的问题文本转换为查询向量；将查询向量与预先构建的行业知识库进行匹配；在行业知识库中存在匹配度超过阈值的目标资源时，将目标资源返回至用户；在行业知识库中不存在匹配度超过阈值的目标资源时，基于查询向量与预先调整的行业大模型执行问答，得到意图信息；将与意图信息对应的资源返回至用户。本申请建立行业知识库，并在执行问答过程中，现将用户的问题文本转换为查询向量，先直接在行业知识库中进行查询，在行业知识库中无匹配资源时，再通过调整的行业大模型执行问答动作，得到符合用户意图的目标资源。本申请相较于现有技术，具有回答更加准确，且更加灵活的优点。

附图说明

下面结合附图和实施例对本发明作进一步描述：

图1是本申请一实施例中示出的用于行业的智能问答方法的运用场景图；

图2是本申请一实施例中示出的一种用于行业的智能问答方法的流程图；

图3为本申请一实施例中的查询向量的转换过程示意图；

图4本申请一实施例中的查询向量的转换过程实例示意图；

图5为本申请一实施例中的参数矩阵训练过程示意图；

图6为本申请一实施例中将所述m个句子划归至多个段落的流程示意图；

图7为本申请一实施例中的影像库的建立过程示意图；

图8是本申请一实施例中示出的一种用于行业的智能问答系统的结构图；

图9示出了适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。

实施方式

以下通过特定的具体实例说明本发明的实施方式，本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用，本说明书中的各项细节也可以基于不同观点与应用，在没有背离本发明的精神下进行各种修饰或改变。需说明的是，在不冲突的情况下，以下实施例及实施例中的特征可以相互组合。

需要说明的是，以下实施例中所提供的图示仅以示意方式说明本发明的基本构想，故图式中仅显示与本发明中有关的层而非按照实际实施时的层数目、形状及尺寸绘制，其实际实施时各层的型态、数量及比例可为一种随意的改变，且其层布局型态也可能更为复杂。

在下文描述中，探讨了大量细节，以提供对本发明实施例的更透彻的解释，然而，对本领域技术人员来说，可以在没有这些具体细节的情况下实施本发明的实施例是显而易见的。

图1是本申请一实施例中示出的一种用于行业的智能问答方法的运用场景图，如图1所示，本场景中，用户通过手机终端110来访问库服务器120，用户通过手机终端110输入问题，库服务器120将问题文本进行向量化处理，并与库服务器120中的行业知识库进行匹配，在匹配成功后将对应的目标资源返会给用户的手机终端110。如果行业知识库中没有匹配的目标资源，则库服务器120自动将查询向量输入至调整后的行业大模型中，利用模型服务器130中的行业大模型基于查询向量来判断用户的意图，意图判断完毕后，从行业知识库中返回与意图匹配的目标资源。从而实现更加灵活，准备的问答。

图2是本申请一实施例中示出的一种用于行业的智能问答方法的流程图，如图1所示：本实施例的一种用于行业的智能问答方法，可以包括步骤S210至步骤S240：

S210，获取用户输入的问题文本；其中，问题文本是用户通过手机或者其他终端输入的文本信息，包含文字和/或符号。

S220，基于预先构建的编码器将所述用户输入的问题文本转换为查询向量；

在本申请中，由于系统无法直接识别文字和符号，因此需要将用户输入的问题文本转换为系统可识别的查询向量。

在本实施例中，基于预先构建编码器对文本进行向量化，编码器主要包括第一参数矩阵、第二参数矩阵、第三参数矩阵；

图3为本申请一实施例中的查询向量的转换过程示意图，如图3所示，基于预先构建的编码器将所述用户输入的问题文本转换为查询向量，包括：

（1）对所述问题文本进行分词，得到多个单词；本申请采用现有的分词算法，现有的分词算法包括基于词表的正向最大匹配算法、逆向最大匹配算法、双向最大匹配算法；基于统计模型的N-gram语言模型的分词方法、HMM的分词方法、CRF的分词方法等。

例如，问题文本为：“权益卡服务流程”，通过分词算法可以分解为：“权益卡，服务，流程”三个词。

（2）基于查表将所述多个单词转换为词向量，并基于指数函数提取所述多个单词的位置编码；本实施例中的词向量，通过查表映射的方式进行转换，例如One-Hot独热编码。位置编码则是利用指数函数来标记每一个词的位置，具体如图3所示。

（3）将所述词向量与预先构建的第一参数矩阵W1进行相乘，得到词向量矩阵；并将所述位置编码与预先构建的第二参数矩阵W2进行相乘，得到位置矩阵；

（4）将所述词向量矩阵与所述位置矩阵进行融合，得到融合矩阵；

（5）将所述融合矩阵与预先构建的第三参数矩阵W3进行相乘，得到编码结果；

（6）基于查表将所述编码结果转换为查询向量。

在本实施例中，利用第一参数矩阵W1与词向量进行融合，并利用第二参数矩阵W2与位置编码进行融合，最后将得到的词向量矩阵和位置矩阵进行融合（可以是相加），得到融合矩阵，融合矩阵与第三参数矩阵W3进行相乘，得到编码结果，编码结果既包含了每个词的词向量，也包含了每个词的位置信息，因此能够保留问题文本的语义信息。最后通过查表映射的方式，将编码结果转换为查询向量，从而将语义信息转换为系统可以识别的向量。

图4本申请一实施例中的查询向量的转换过程实例示意图，如图4所示，用户输入的问题文本为：“权益卡服务流程”，通过分词算法可以分解为：“权益卡，服务，流程”三个词。一方面通过查表来将上述单词转换为词向量，另一方面提取上述三个词的位置编码，、...，然后分别与第一参数矩阵W1（[0.1，0.2，0.3][0.1，0.2，0.3][0.1，0.2， 0.3][0，0，0][0，0，0]、第二参数矩阵W2（[0.1，0.2，0.3][0.1，0.2，0.3][0.1，0.2，0.3][0， 0，0][0，0，0]相乘，得到词向量矩阵和位置矩阵；词向量矩阵与位置矩阵相加得到融合矩阵，融合矩阵与第三参数矩阵W3（[0.1，0.2，0.3][0.1，0.2，0.3][0.1，0.2，0.3][0，0，0][0， 0，0]相乘，得到编码结果，最后通过查表得到编码结果的查询向量。

上述过程中，将问题文本转换为查询向量的关键是三个参数矩阵；上述参数矩阵通过如下方法来进行训练得到，图5为本申请一实施例中的参数矩阵训练过程示意图，如图5所示，具体包括：

（1）获取问题训练文本，其中，所述问题训练文本预先标注查询向量真实结果；

（2）将所述问题训练文本切分为训练集、验证集和测试集；

（3）对所述第一参数矩阵、所述第二参数矩阵和所述第三参数矩阵进行初始化，并从所述训练集中提取一个当前问题训练文本，基于预先构建的编码器将所述当前问题训练文本转换为当前查询向量；具体地，基于预先构建的编码器将所述当前问题训练文本转换为当前查询向量的过程与前文所述的过程一样，在此不再赘述。

（4）计算所述当前查询向量与所述查询向量真实结果的损失值，并基于所述损失值生成反向传播信号，以对第一参数矩阵、第二参数矩阵和第三参数矩阵进行更新；

（5）从所述训练集中提取下一个问题训练文本作为当前问题训练文本，并回到基于预先构建的编码器将所述当前问题训练文本转换为当前查询向量；直至达到终止训练条件，其中，所述终止训练条件包括损失值不再减小和/或达到指定的训练次数；

（6）基于所述验证集对训练完成的第一参数矩阵、第二参数矩阵和第三参数矩阵进行验证，并基于所述测试集对训练完成的第一参数矩阵、第二参数矩阵和第三参数矩阵进行验证测试，在通过验证和测试后，得到第一参数矩阵、第二参数矩阵和第三参数矩阵。

本申请通过迭代训练的方法，对第一参数矩阵、第二参数矩阵和第三参数矩阵进行不断调整，从而使得通过编码器转换的查询向量为真实结果。其中，真实结果可以是自定义的结果，也可以按照现有的向量转换数据进行标注。

S230，将所述查询向量与预先构建的行业知识库进行匹配；在所述行业知识库中存在匹配度超过阈值的目标资源时，将所述目标资源返回至用户；在所述行业知识库中不存在匹配度超过阈值的目标资源时，基于所述查询向量与预先调整的行业大模型执行问答，得到意图信息，其中，所述目标资源为文字、图片和视频其中之一或者多种组合；

其中，行业知识库中的资源也是以向量的形式进行存储，进行在将查询向量与行业知识库内的资源进行匹配时，实际上是向量相似度匹配，因此可以使用余弦相似度的方式进行匹配。本实施例中，将相似度大于95%的资源作为匹配的目标资源，目标资源直接返回给用户，可以是文本、图像或者视频。

在行业知识库中不存在相似度95%的资源时，为了保证回答的准确性，本申请再利用调整后的行业大模型进行意图识别，与用户进行对话，从而进一步识别用户意图。从而更加准确地确定用户想要的目标资源。因此，本申请既保证了对话的灵活性，也提高了回答的准确性。

上述过程中所需的行业知识库和调整后的大模型，在下文中进行介绍。

在本申请一实施例中，所述行业知识库包括文本库和影像库，文本库的构建过程包括：

（1）获取行业文字材料；可以是pdf、docx、书籍等材料。

（2）按照所述行业文字材料的目录对所述行业知识材料进行分割，得到多个片段；

（3）将长度大于N的片段作为目标片段，并基于句号将所述目标片段分为m个句子；其中，长度小于或者等于N的片段直接作为一个单独的段落；

（4）将所述m个句子划归至多个段落；其中，多个段落的长度大致与N相等，以保证段落内容长度的一致性。

（5）基于所述多个段落，调用语言大模型生成多个问题文本；并基于所述多个问题文本，调用语言大模型进行问题扩展，得到问题集合；

具体地，向语言大模型输入：“请根据以下段落:[段落内容]，生成m个问题，并用“;”隔开。”，即可得到多个问题文本。然后向语言大模型输入：“请根据以下问题:[问题内容]，生成m个同样含义问题，并用“;”隔开”，即可对问题进行扩展。

最后人工对问题进行核对和校验，剔除不合适的内容，最终生成QA问题集合，内容格式为：{“question”:”问题”，“answer”：“答案”，”来源段落”：“段落内容”}。

（6）抽取所述问题集合中的问题文本，并以所述问题文本对应的答案、答案的来源段落、段落的所属行业文字材料、以及行业文字材料的对应的行业实体为节点，构建图结构的文本库，因此生成的文本库实质上为知识图谱，其中，所述文本库包括节点以及节点之间的关系。

具体地，使用实体抽取算法和行业词库，对上述内容进行行业实体抽取，得到如下内容：

{“question”:”问题”，“answer”：“答案”，”来源段落”：“段落内容”，“来源”：“[书籍名],[材料名]”，“涉及人，地点，事物”：“实体1，实体2，实体3”}

最后构建的文本库采用图结构；

节点类型:问题，答案，段落，来源，实物；

关系类型:问题---->答案，问题---->段落，答案---->段落，段落---->来源，实体---->问题。

本申请还可以也通过三元组抽取，实体-关系-实体，来对该三元组的任何一项生成问题进行提问，例如：

周某某-职业-歌手

可生成如：“周某某的职业是什么？”的问题文本。

图6为本申请一实施例中将所述m个句子划归至多个段落的流程示意图，如图6所示，在本申请一实施例中，将所述m个句子划归至多个段落，包括：

判断前i个未被划归至任何段落的句子的总长度；在第一次划归时，即判断1-i个句子的总长度。

在所述前i个句子的总长度大于N时，且前i-1个句子的总长度小于N时，基于预先构建的编码器将第i-1个句子、第i个句子以及第i+1个句子向量化，得到第一句子向量、第二句子向量和第三句子向量；具体向量化的过程与前文对问题文本的向量化的过程一致，在此不再赘述。

计算所述第一句子向量和所述第二句子向量的第一相似度，并计算所述第二句子向量和所述第三句子向量的第二相似度；在所述第一相似度大于所述第二相似度时，将所述第i个句子划归至当前段落中，在所述第一相似度小于或者等于所述第二相似度时，将所述第i个句子作为第1个未被划归句子，并回到判断前i个未被划归至任何段落的句子的总长度，直至完成对所有句子的划归，得到多个段落。

本实施例中，通过上述划归方式来保证每个段落的长度尽量与N接近，从而保证段落内容的长度一致性与内容连贯性。从而为文本库的建立提供材料基础。

图7为本申请一实施例中的影像库的建立过程示意图，如图7所示，包括如下过程构建所述影像库：

（1）获取行业影像材料，其中，所述行业影像材料包括图片材料和视频材料；

（2）对所述视频材料进行采样，得到采样图片材料；采用工具来对视频进行分割，采样间隔设置为x；

（3）将所述图片材料和所述采样图片材料作为原始图像，并通过图像描述模型对所述原始图像进行描述，得到总结文本；

具体地，图片输入大模型中进行文本对齐，然大模型描述这张图片，并输出文本总结。

（4）将所述总结文本输入至图像生成模型中，得到生成图像；

使用文本总结，输入到另外一个大模型LLM2中进行图片生成。

（5）基于CNN网络提取所述原始图像和所述生成图像的图像特征，基于双向LSTM网络提取所述总结文本的文本特征；并基于预先构建的编码器将所述文本特征进行向量化，得到文本特征向量；

（6）将所述原始图像的图像特征与所述文本特征向量进行融合，得到第一融合向量；并将所述生成图像的图像特征与所述文本特征向量进行融合，得到第二融合向量；

（7）将原始图像、原始图像的图像特征、原始图像的总结文本、原始图像的第一融合相邻进行格式化存储；并将总结文本、总结文本的文本特征、总结文本的生成图像、总结文本的第二融合相邻进行格式化存储；得到影像库。

存储格式为图片:(原始图片，图片向量，生成文本，融合向量)

存储格式为文本:(原始文本，图片向量，生成图片，融合向量)

上述过程为行业知识库的建立过程，本实施例中，还需要对现有的行业大模型进行调整。

在本申请一实施例中，行业大模型的调整方法包括：

（1）获取训练数据，其中，所述训练数据包括多种参数，所述参数至少包括文本、文本标题、文本源文件、源文件位置和源文件类型，源文件类型包括文本、视频和图像；在源文件为图像或者视频时，所述文本基于图像或者视频生成；

具体地，训练数据的格式为：{“txt”:文本，“title”：“源文件名称”，“url”:“源文件位置”，type“文本|视频|图片”}。

（2）将所述训练数据与行业知识库中的参考资源进行匹配，得到每种参数与所述参考资源匹配的概率，其中，所述参考资源为其中一种问询意图的问题文本；

（3）将概率高于预设的概率阈值的参数进行遮挡，并将概率高于预设的概率阈值的参数作为训练数据的标签；

例如，训练数据为[x1，x2，x3，x4，x5，x6，x7]，匹配的概率分别为：A1、A2、A3、A4、A5、A6、A7，将概率大于概率阈值的位置进行遮挡，得到[[M]，x2，x3，x4，[M]，x6，x7]，最终生成(prompt,anwser)的格式，如下： {[[M]，x2，x3，x4，[M]，x6，x7] ,(x1,x5)}

（4）基于遮挡后的训练数据以及训练数据的标签构建训练数据集，并基于所述训练数据集对行业大模型进行训练，完成调整。具体地，基于预先构建的编码器将遮挡后的训练数据以及训练数据的标签转换为训练向量；然后基于所述训练向量构建训练数据集。

例如，首先第一步把文字转成维度为d的向量，M的位置用0替代[[0...0]，[向量2]....[向量7]]；文字向量与第一编码矩阵相乘得到文字矩阵；

位置编码向量 [[10...0],[010...0],[001...0]...[00..10]]，位置编码与第二编码矩阵相乘，得到位置矩阵；

把文字矩阵和位置矩阵相加得到融合矩阵。融合矩阵与第三编码矩阵相乘得到输入向量，输入至大模型中训练得到输出矩阵。

输出向量也通过查表得到相应输出向量，输出非连续向量之间用E隔开，例如：[[向量1],[E],[向量5]]。

其中按比例 80%训练集，10%验证集，10%测试集进行分割。

在本申请中，基于遮挡后的训练数据以及训练数据的标签构建训练数据集，其训练意图为抽取与知识点评分类型大模型2，由大模型2生成问题，并用大模型2来监督训练本申请所需的行业大模型。

由知识库抽取生成规则集，使用规则集对相似度高单主题不同的答案进行强制限制增加训练准确度，并由人工收集标注一批数据，对模型进行评估。

本申请基于MASK进行遮挡训练，预测MASK部分，相当于监督训练下利用MASK提升模型对输入数据意图和实质与对应标签的关联。

图8为本申请一实施例中的对话过程示意图，如图8所示，在本申请一实施例中，基于所述查询向量与预先调整的行业大模型执行问答，得到意图信息，包括：

将所述输出向量与所述行业知识库进行资源匹配；

在所述行业知识库中存在与所述输出向量匹配的资源时，将与所述输出向量匹配的资源作为用户的意图信息；即一问一答。

在所述行业知识库中不存在与所述输出向量匹配的资源时，输出问题至用户，在接收到用户的回答文本时，基于预先构建的编码器将所述回答文本转换为新的查询向量，并将新的查询向量输入至预先调整的行业大模型中，得到新的输出向量；将新的输出向量作为输出向量，并回到将所述输出向量与所述行业知识库进行资源匹配；直至得到用户的意图信息。即多轮对话。

本申请中，在进行进一步查找目标资源后，还可以生产3个方案，然后通过方案评价输出最佳方法。评价方法可以是对方案进行关键词、风险点和负例匹配，包含的关键词越多，方案越佳，反之越差。包含的风险点和负例越多，方案越差，反之越佳。其中，风险点和负例可以预先进行设置，也可以根据用户的个人信息设定。例如，用户询问的对象为男性，输出的方案包含女性关键词，则可以设定为风险点或者负例。

S240，将与所述意图信息对应的资源返回至用户。

最后将目标资源返回至用户，即可完成对话。

本发明的一种用于行业的智能问答方法，通过获取用户输入的问题文本；基于预先构建的编码器将用户输入的问题文本转换为查询向量；将查询向量与预先构建的行业知识库进行匹配；在行业知识库中存在匹配度超过阈值的目标资源时，将目标资源返回至用户；在行业知识库中不存在匹配度超过阈值的目标资源时，基于查询向量与预先调整的行业大模型执行问答，得到意图信息；将与意图信息对应的资源返回至用户。本申请建立行业知识库，并在执行问答过程中，现将用户的问题文本转换为查询向量，先直接在行业知识库中进行查询，在行业知识库中无匹配资源时，再通过调整的行业大模型执行问答动作，得到符合用户意图的目标资源。本申请相较于现有技术，具有回答更加准确，且更加灵活的优点。

如图8所示，本申请还提供一种用于行业的智能问答系统，包括：

获取模块，用于获取用户输入的问题文本；

返回模块，用于将与所述意图信息对应的资源返回至用户。本发明还提供一种存储介质，其中存储有计算机程序，所述计算机程序被处理器加载执行时，实现如上所述的一种用于行业的智能问答方法。

本发明的一种用于行业的智能问答系统，通过获取用户输入的问题文本；基于预先构建的编码器将用户输入的问题文本转换为查询向量；将查询向量与预先构建的行业知识库进行匹配；在行业知识库中存在匹配度超过阈值的目标资源时，将目标资源返回至用户；在行业知识库中不存在匹配度超过阈值的目标资源时，基于查询向量与预先调整的行业大模型执行问答，得到意图信息；将与意图信息对应的资源返回至用户。本申请建立行业知识库，并在执行问答过程中，现将用户的问题文本转换为查询向量，先直接在行业知识库中进行查询，在行业知识库中无匹配资源时，再通过调整的行业大模型执行问答动作，得到符合用户意图的目标资源。本申请相较于现有技术，具有回答更加准确，且更加灵活的优点。

图9示出了适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。需要说明的是，图9示出的电子设备的计算机系统900仅是一个示例，不应对本申请实施例的功能和使用范围带来任何限制。

如图9所示，计算机系统900包括中央处理单元（Central Processing Unit，CPU）901，其可以根据存储在只读存储器（Read-Only Memory，ROM）902中的程序或者从储存部分908加载到随机访问存储器（Random Access Memory，RAM）908中的程序而执行各种适当的动作和处理，例如执行上述实施例中的方法。在RAM 908中，还存储有系统操作所需的各种程序和数据。CPU 901、ROM 902以及RAM 908通过总线904彼此相连。输入/输出（Input /Output，I/O）接口905也连接至总线904。

以下部件连接至I/O接口905：包括键盘、鼠标等的输入部分906；包括诸如阴极射线管（Cathode Ray Tube，CRT）、液晶显示器（Liquid Crystal Display，LCD）等以及扬声器等的输出部分907；包括硬盘等的储存部分908；以及包括诸如LAN（Local Area Network，局域网）卡、调制解调器等的网络接口卡的通信部分909。通信部分909经由诸如因特网的网络执行通信处理。驱动器910也根据需要连接至I/O接口905。可拆卸介质911，诸如磁盘、光盘、磁光盘、半导体存储器等等，根据需要安装在驱动器910上，以便于从其上读出的计算机程序根据需要被安装入储存部分908。

特别地，根据本申请的实施例，上文参考流程图描述的过程可以被实现为计算机软件程序。例如，本申请的实施例包括一种计算机程序产品，其包括承载在计算机可读介质上的计算机程序，该计算机程序包含用于执行流程图所示的方法的计算机程序。在这样的实施例中，该计算机程序可以通过通信部分909从网络上被下载和安装，和/或从可拆卸介质911被安装。在该计算机程序被中央处理单元（CPU）901执行时，执行本申请的系统中限定的各种功能。

需要说明的是，本申请实施例所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器（RAM）、只读存储器（ROM）、可擦式可编程只读存储器（Erasable Programmable Read Only Memory，EPROM）、闪存、光纤、便携式紧凑磁盘只读存储器（Compact Disc Read-Only Memory，CD-ROM）、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中，计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的计算机程序。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的计算机程序可以用任何适当的介质传输，包括但不限于：无线、有线等等，或者上述的任意合适的组合。

附图中的流程图和框图，图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。其中，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图或流程图中的每个方框、以及框图或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

描述于本申请实施例中所涉及到的单元可以通过软件的方式实现，也可以通过硬件的方式来实现，所描述的单元也可以设置在处理器中。其中，这些单元的名称在某种情况下并不构成对该单元本身的限定。

本申请的另一方面还提供了一种计算机可读存储介质，其上存储有计算机程序，该计算机程序被计算机的处理器执行时，使计算机执行如前的方法。该计算机可读存储介质可以是上述实施例中描述的电子设备中所包含的，也可以是单独存在，而未装配入该电子设备中。

本申请的另一方面还提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行上述各个实施例中提供的空气目标污染物组分预报模型训练和预报方法。

以上实施例仅是为充分说明本申请而所举的较佳的实施例，本申请的保护范围不限于此。本技术领域的技术人员在本申请基础上所作的等同替代或变换，均在本申请的保护范围之内。

Claims

1.一种用于行业的智能问答方法，其特征在于，包括步骤：

获取用户输入的问题文本；

将与所述意图信息对应的资源返回至用户。

2.根据权利要求 1 所述的一种用于行业的智能问答方法，其特征在于，基于预先构建的编码器将所述用户输入的问题文本转换为查询向量，包括：

对所述问题文本进行分词，得到多个单词；

将所述词向量矩阵与所述位置矩阵进行融合，得到融合矩阵；

将所述融合矩阵与预先构建的第三参数矩阵进行相乘，得到编码结果；

基于查表将所述编码结果转换为查询向量。

3.根据权利要求 2 所述的一种用于行业的智能问答方法，其特征在于，所述第一参数矩阵、所述第二参数矩阵和所述第三参数矩阵通过如下方法构建：

将所述问题训练文本切分为训练集、验证集和测试集；

4.根据权利要求 1 所述的一种用于行业的智能问答方法，其特征在于，所述行业知识库包括文本库，还包括如下过程构建所述文本库：

将所述m个句子划归至多个段落；

5.根据权利要求 4 所述的一种用于行业的智能问答方法，其特征在于，将所述m个句子划归至多个段落，包括：

判断前i个未被划归至任何段落的句子的总长度；

6.根据权利要求 1 所述的一种用于行业的智能问答方法，其特征在于，所述行业知识库包括影像库，还包括如下过程构建所述影像库：

对所述视频材料进行采样，得到采样图片材料；

将所述总结文本输入至图像生成模型中，得到生成图像；

7.根据权利要求 1 所述的一种用于行业的智能问答方法，其特征在于，行业大模型的调整方法包括：

8.根据权利要求 7 所述的一种用于行业的智能问答方法，其特征在于，基于遮挡后的训练数据以及训练数据的标签构建训练数据集，包括：

基于所述训练向量构建训练数据集。

9.根据权利要求 1 所述的一种用于行业的智能问答方法，其特征在于，基于所述查询向量与预先调整的行业大模型执行问答，得到意图信息，包括：

将所述输出向量与所述行业知识库进行资源匹配；

10.一种用于行业的智能问答系统，其特征在于，包括：

获取模块，用于获取用户输入的问题文本；

返回模块，用于将与所述意图信息对应的资源返回至用户。