CN117828057A

CN117828057A - 知识问答方法、装置、设备和存储介质

Info

Publication number: CN117828057A
Application number: CN202311872842.1A
Authority: CN
Inventors: 惠治儒; 韩宝
Original assignee: iFlytek Co Ltd
Current assignee: iFlytek Co Ltd
Priority date: 2023-12-29
Filing date: 2023-12-29
Publication date: 2024-04-05

Abstract

本发明提供一种知识问答方法、装置、设备和存储介质，该方法包括：对获取的问题文本进行分词处理，得到至少一个分词；将各所述分词和第一数据库中的各关键词进行匹配，得到匹配成功的至少一个目标分词；基于所述第一数据库中关键词和场景的对应关系，确定各所述目标分词对应的场景，并基于各所述目标分词对应的场景确定目标场景；基于所述目标场景对应的第二数据库，查找所述问题文本对应的目标答案；输出所述目标答案。本发明可以提高问答系统场景通用性。

Description

知识问答方法、装置、设备和存储介质

技术领域

本发明涉及人工智能技术领域，尤其涉及一种知识问答方法、装置、设备和存储介质。

背景技术

多轮对话系统(Multi-turn Dialogue System)是一种基于人工智能的自然交互系统，可以模拟自然语言交互过程，实现人机之间的智能对话。多轮对话系统目前已经广泛应用于许多领域，例如智能客服、教学助手等。

现有技术中，在实现多轮对话时，通常是基于自然语言处理和意图识别对话管理技术实现“流水线”式多轮问答。首先通过自然语言理解技术把自然语言转换成机器可以处理的意图(intention)和槽植对(slot-value pairs)，然后将用户意图识别结果匹配固定槽位信息，为了获取必要的槽位信息，与用户进行的有目的的多轮对话，称为“封闭域多轮对话”。识别用户意图之后，为了获取必要信息，将与用户进行有目的的多轮对话，当有槽位缺失时，需要使用澄清话术。即当用户的需求中缺乏一些必要信息时，需要对话系统主动发问，引导用户填充必要信息。

然而，上述方式中，需要提前设置问答流程，因此，需要人工提前准备好大量问题意图和词槽，才可以实现对问题的解答，当用户输入的问题超出了提前设置好的问答范围时，将会出现识别错误的情况，因此，现有技术中的多轮问答系统场景通用性较差。

发明内容

本发明提供一种知识问答方法、装置、设备和存储介质，用以解决现有技术中问答系统场景通用性较差的缺陷，实现提高问答系统场景通用性的目的。

本发明提供一种知识问答方法，包括：

对获取的问题文本进行分词处理，得到至少一个分词；

将各所述分词和第一数据库中的各关键词进行匹配，得到匹配成功的至少一个目标分词；

基于所述第一数据库中关键词和场景的对应关系，确定各所述目标分词对应的场景，并基于各所述目标分词对应的场景确定目标场景；

基于所述目标场景对应的第二数据库，查找所述问题文本对应的目标答案；

输出所述目标答案。

根据本发明提供的一种知识问答方法，所述对获取的问题文本进行分词处理，得到至少一个分词，包括：

将所述问题文本输入大语言模型，通过所述大语言模型对所述问题文本进行语义理解，得到所述大语言模型输出的所述至少一个分词。

根据本发明提供的一种知识问答方法，所述基于各所述目标分词对应的场景确定目标场景，包括：

在各所述目标分词对应的场景为同一场景的情况下，将所述场景确定为所述目标场景；

在存在至少两个所述目标分词对应的场景为不同场景的情况下，针对各所述目标分词，确定所述目标分词和匹配的关键词的相似度，并将最大相似度的目标分词对应的场景确定为所述目标场景。

根据本发明提供的一种知识问答方法，所述基于所述目标场景对应的第二数据库，查找所述问题文本对应的目标答案，包括：

将所述问题文本输入大语言模型，得到所述大语言模型输出的提示信息；所述提示信息用于表征所述问题文本中是否缺失关键查询信息；

在所述提示信息表征所述问题文本中缺失所述关键查询信息的情况下，输出所述关键查询信息的补充指令；

接收用户响应于所述补充指令输入的所述关键查询信息，基于所述问题文本和所述关键查询信息确定目标问题文本；

将所述目标问题文本输入所述大语言模型，得到所述大语言模型输出的查询语句；

基于所述查询语句和所述目标场景对应的第二数据库，查找所述目标答案。

根据本发明提供的一种知识问答方法，所述将所述问题文本输入大语言模型，得到所述大语言模型输出的提示信息，包括：

获取预配置的第一prompt格式模板，所述第一prompt格式模板包括参考信息、第一问题信息槽和第一知识信息槽，所述第一prompt格式模板用于指示大语言模型参考所述参考信息和所述第一知识信息槽内目标数据表中各字段信息，生成所述第一问题信息槽内的问题文本对应的提示信息；所述目标数据表为所述第二数据库中与所述目标场景对应的数据表；

将所述问题文本填充至所述第一问题信息槽、将所述目标数据表中的各字段信息填充至所述第一知识信息槽，得到第一提示指令prompt；

将所述第一提示指令prompt输入大语言模型，得到大语言模型输出的提示信息。

根据本发明提供的一种知识问答方法，所述将所述目标问题文本输入所述大语言模型，得到所述大语言模型输出的查询语句，包括：

获取预配置的第二prompt格式模板，所述第二prompt格式模板包括第二问题信息槽和第二知识信息槽，所述第二prompt格式模板用于指示大语言模型参考所述第二知识信息槽内的所述第二数据库的各数据表中的字段信息，生成所述第二问题信息槽内的目标问题文本对应的查询语句；

将所述目标问题文本填充至所述第二问题信息槽、将所述第二数据库的各数据表中的字段信息填充至所述第二知识信息槽，得到第二提示指令prompt；

将所述第二提示指令prompt输入大语言模型，得到大语言模型输出的查询语句。

根据本发明提供的一种知识问答方法，所述方法还包括：

获取样本问题文本和所述样本问题文本对应的样本场景；

将所述样本问题文本输入大语言模型中，通过所述大语言模型调用所述样本场景对应的样本数据库，基于所述样本数据库中各样本数据表中的样本字段信息，确定所述样本问题文本对应的初始关键词，并对所述初始关键词进行语义扩充，得到扩充关键词，输出样本关键词，所述样本关键词包括所述初始关键词和所述扩充关键词；

基于所述样本关键词和所述样本场景的对应关系，构建所述第一数据库。

从所述目标场景对应的第二数据库中查找所述问题文本对应的初始答案；

将所述初始答案输入大语言模型，得到所述大语言模型输出的润色后的目标答案。

本发明还提供一种知识问答装置，包括：

处理模块，用于对获取的问题文本进行分词处理，得到至少一个分词；

匹配模块，用于将各所述分词和第一数据库中的各关键词进行匹配，得到匹配成功的至少一个目标分词；

确定模块，用于基于所述第一数据库中关键词和场景的对应关系，确定各所述目标分词对应的场景，并基于各所述目标分词对应的场景确定目标场景；

查找模块，用于基于所述目标场景对应的第二数据库，查找所述问题文本对应的目标答案；

输出模块，用于输出所述目标答案。

本发明还提供一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如上述任一种所述知识问答方法。

本发明还提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现如上述任一种所述知识问答方法。

本发明还提供一种计算机程序产品，包括计算机程序，所述计算机程序被处理器执行时实现如上述任一种所述知识问答方法。

本发明提供的知识问答方法、装置、设备和存储介质，通过对获取的问题文本进行分词处理，得到至少一个分词，并将各分词和第一数据库中的各关键词进行匹配，得到匹配成功的至少一个目标分词后，基于第一数据库中关键词和场景的对应关系，确定各目标分词对应的场景，并基于各目标分词对应的场景确定目标场景，然后基于目标场景对应的第二数据库，查找问题文本对应的目标答案，最后输出该目标答案。由于可以对问题文本中的每个分词均与第一数据库中的各关键词进行匹配，从而可以对整个问题文本进行分析，避免了现有技术中在基于固定的问答对进行问答时，若用户输入的问题文本超出了固定问答对中的问题，系统将出现识别错误的情况，本发明实施例中由于不需要设置固定的问答对即可得到目标文本的目标答案，因此，可以提高问答系统应用场景的通用性。另外，由于可以对整个问题文本进行识别，从而可以避免现有技术中需要一步一步按照固定问答路径引导用户的现象，提高了确定目标答案的效率。

附图说明

为了更清楚地说明本发明或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的知识问答方法的流程示意图；

图2为本发明实施例提供的学生成绩场景对应的第二数据库的结构示意图；

图3为本发明实施例提供的知识问答装置的结构示意图；

图4示例了一种电子设备的实体结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合本发明中的附图，对本发明中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

目前，多轮对话系统已经广泛应用于许多领域，例如智能客服和教学助手等，其中智能客服是多轮对话系统最常见的应用场景。多轮对话系统可以更加高效、及时和精准地处理大量用户咨询，节省人力及物力成本，提高服务质量。

现有技术中，主要是通过“问答流水线”的方式，也就是“意图识别-填充词槽”的方式实现多轮问答，这种方式需要提前设置问答路径，需要人工准备好大量问题意图和词槽，在用户输入问题后，系统对该问题进行语义理解，并基于设置好的问题意图和词槽，从用户输入的问题中提取本次问答过程中需要的内容，并基于问答路径继续提问下一个问题，直到系统识别出用户的意图。

然而，上述方式需要提前设置问答路径，当用户输入的问题超出了提前设置好的问答范围时，将会出现识别错误的情况，因此，现有技术中的多轮问答系统场景通用性较差。另外，由于需要基于问答路径一步一步引导用户输入问题，因此，使得问答过程中获得答案的效率较低，基于用户提问识别用户意图受到意图识别引擎和意图词槽的限制，使得用户提问意图不清晰，问题和词槽不匹配时，无法快速回复。

本发明实施例中考虑到上述问题，提出一种知识问答方法，在该方法中，可以对获取的问题文本进行分词处理，得到至少一个分词后，将每个分词均与第一数据库中的各关键词进行匹配，并确定匹配成功的各目标分词对应的场景，从而基于各目标分词对应的场景确定目标场景，并从目标场景对应的第二数据库中查找与问题文本对应的目标答案，并输出该目标答案。由于可以对问题文本中的每个分词均与第一数据库中的各关键词进行匹配，从而可以对整个问题文本进行分析，避免了现有技术中在基于固定的问答对进行问答时，若用户输入的问题文本超出了固定问答对中的问题，系统将出现识别错误的情况，本发明实施例中由于不需要设置固定的问答对即可得到目标文本的目标答案，因此，可以提高问答系统应用场景的通用性。另外，由于可以对整个问题文本进行识别，从而可以避免现有技术中需要一步一步按照固定问答路径引导用户的现象，提高了确定目标答案的效率。

下面结合图1和图2对本发明实施例提供的知识问答方法进行描述。本发明实施例可以适用于任何可以通过人机交互进行问答的场景中，例如智能客服或者教学助手等。本方法的执行主体可以是机器人、终端设备、计算机、服务器、服务器集群或专门设计的知识问答设备等电子设备，也可以是设置在该电子设备中的知识问答装置，该知识问答装置可以通过软件、硬件或两者的结合来实现。

图1为本发明实施例提供的知识问答方法的流程示意图，如图1所示，该方法包括：

步骤101：对获取的问题文本进行分词处理，得到至少一个分词。

在本步骤中，问题文本可以理解为用户输入的需要通过问答系统回答的问题。对获取的问题文本进行分词处理后，将得到至少一个分词。在一种可能的实现方式中，可以通过分词工具对获取的问题文本进行分词，得到至少一个分词。

在另一种实现方式中，也可以将问题文本输入大语言模型，通过大语言模型对问题文本进行语义理解，得到大语言模型输出的至少一个分词。

具体地，大语言模型可以为对文本进行语义理解，并对输入的问题进行回复的模型，该大语言模型例如可以为讯飞星火大模型(IFlytek Spark)或者其他能够进行语义理解并进行分词处理的模型。

在将问题文本输入大语言模型后，通过Prompt工程的方式对输入的问题文本进行语义理解，从而得到大语言模型输出的至少一个分词。通过该方式，由于可以基于语义理解对问题文本进行分词处理，从而得到的分词与语义相关，使得分词结果更准确。

步骤102：将各分词和第一数据库中的各关键词进行匹配，得到匹配成功的至少一个目标分词。

在本步骤中，第一数据库中包括有多个关键词，该第一数据库中的多个关键词可以为预先通过大语言模型对多个样本问题进行语义理解后总结出的，也可以为用户预先设置的。第一数据库中的关键词可以是以向量的形式存储。

在得到至少一个分词之后，可以将分词转换为向量，并将转换后的向量和分别与第一数据库中存储的关键词的向量进行匹配，从而可以得到匹配成功的至少一个目标分词。

步骤103：基于第一数据库中关键词和场景的对应关系，确定各目标分词对应的场景，并基于各目标分词对应的场景确定目标场景。

在本步骤中，第一数据库中还包括有各关键词对应的场景，该场景可以理解为问题场景，也即问题文本是在什么场景下提出的。应理解，该第一数据库中可以包括多个场景，以及各场景所对应的关键词，其中，各场景可以对应有多个关键词，或者一个关键词也有可能对应多个场景。

在确定出匹配成功的至少一个目标分词之后，可以基于第一数据库中预先存储的各关键词和场景的对应关系，可以确定出每个目标分词所对应的场景。

若各目标分词对应的场景有多个时，可以按照分词和目标分词之间的匹配度进行排序，从而确定匹配度最高的场景作为目标场景，或者也可以从多个场景中随机选择一个场景作为目标场景等。

值得注意的是，若将分词和第一数据库中的各关键词进行匹配时，未匹配到成功的目标分词，或者即使匹配到了目标分词，但是未查找到目标分词对应的场景时，可以将问题文本输入至大语言模型中，直接通过大语言模型输出目标答案。

步骤104：基于目标场景对应的第二数据库，查找问题文本对应的目标答案。

在本步骤中，第二数据库中包括有目标场景下的多个知识信息，因此，该第二数据库又可以理解为目标场景下的知识库。因此，在确定出目标场景后，可以查找该目标场景对应的第二数据库，从而从该第二数据库中查找与问题文本对应的目标答案。

步骤105：输出目标答案。

在本步骤中，可以通过文本方式输出目标答案，或者可以以语音方式输出目标答案，还可以以文本和语音的方式输出目标答案等，对于目标答案的具体输出方式，本发明实施例在此不做限制。

本发明实施例提供的知识问答方法，通过对获取的问题文本进行分词处理，得到至少一个分词，并将各分词和第一数据库中的各关键词进行匹配，得到匹配成功的至少一个目标分词后，基于第一数据库中关键词和场景的对应关系，确定各目标分词对应的场景，并基于各目标分词对应的场景确定目标场景，然后基于目标场景对应的第二数据库，查找问题文本对应的目标答案，最后输出该目标答案。由于可以对问题文本中的每个分词均与第一数据库中的各关键词进行匹配，从而可以对整个问题文本进行分析，避免了现有技术中在基于固定的问答对进行问答时，若用户输入的问题文本超出了固定问答对中的问题，系统将出现识别错误的情况，本发明实施例中由于不需要设置固定的问答对即可得到目标文本的目标答案，因此，可以提高问答系统应用场景的通用性。另外，由于可以对整个问题文本进行识别，从而可以避免现有技术中需要一步一步按照固定问答路径引导用户的现象，提高了确定目标答案的效率。

另外，由于不需要提前设置固定问答路径，因此，还可以解决现有技术中问答过程中问答内容受限，以及在场景变化时可能会出现的问答路径更新不及时导致答案出错的现象。

示例性的，在上述实施例的基础上，在基于各目标分词对应的场景确定目标场景时，可以通过下述方式进行：

在各目标分词对应的场景为同一场景的情况下，将场景确定为目标场景，在存在至少两个目标分词对应的场景为不同场景的情况下，针对各目标分词，确定目标分词和匹配的关键词的相似度，并将最大相似度的目标分词对应的场景确定为目标场景。

具体地，若确定出的各目标分词对应的场景相同时，可以直接将这一相同的场景确定为目标场景，可以提高目标场景确定的效率。

若确定出多个目标分词后，各目标分词对应的场景中，存在至少两个目标分词对应的场景不同时，可以针对每个目标分词，确定在和第一数据库中的关键词进行匹配时的匹配度，也即确定各目标分词和匹配的关键词之间的相似度，从而将确定出的最大相似度的目标分词对应的场景确定为目标场景。

在具体的实现过程中，可以将问题文本中的每个分词转换为向量文本，并使用如公式(1)中所述的余弦相似度的方式确定每个分词与关键词之间的相似度：

其中，x_i表示第i个分词，y_i表示第i个关键词，n表示分词的数量。

通过公式(1)可以得到每个目标分词和其所匹配的关键词之间的相似度，从而可以将所有目标分词对应的相似度中最大相似度对应的目标分词的场景确定为目标场景。其中，该目标场景可以理解为与当前用户输入的问题文本最匹配的场景。

需要说明的是，若存在至少两个目标分词对应的场景为不同场景，且所有目标分词和与其匹配的关键词之间的相似度均小于预设值，也即所有的相似度均较小时，可以理解为此时无法匹配问题文本对应的场景，则可以采用大语言模型直接输出问题文本对应的答案。

在存在多个场景的情况下，可以基于目标分词和其所匹配的关键词的相似度，将最大相似度的目标分词对应的场景确定为目标场景，从而可以提高目标场景的准确度。

示例性的，在上述各实施例的基础上，在基于目标场景对应的第二数据库，查找问题文本对应的目标答案时，可以将问题文本输入大语言模型，得到大语言模型输出的提示信息；提示信息用于表征问题文本中是否缺失关键查询信息；在提示信息表征问题文本中缺失关键查询信息的情况下，输出关键查询信息的补充指令；接收用户响应于补充指令输入的关键查询信息，基于问题文本和关键查询信息确定目标问题文本；将目标问题文本输入大语言模型，得到大语言模型输出的查询语句；基于查询语句和目标场景对应的第二数据库，查找目标答案。

具体地，可以将获取的问题文本输入至大语言模型中，通过大语言模型输出提示信息，以提醒用户该问题文本中是否缺失了关键查询信息。其中，关键查询信息例如可以包括在查询第二数据库中的知识时，不能为空的字段或者主键信息等。

在一种可能的实现方式中，在将问题文本输入大语言模型，得到大语言模型输出的提示信息时，可以获取预配置的第一prompt格式模板，第一prompt格式模板包括参考信息、第一问题信息槽和第一知识信息槽，第一prompt格式模板用于指示大语言模型参考参考信息和第一知识信息槽内目标数据表中各字段信息，生成第一问题信息槽内的问题文本对应的提示信息；目标数据表为数据库中与目标场景对应的数据表；将问题文本填充至第一问题信息槽、将目标数据表中的各字段信息填充至第一知识信息槽，得到第一提示指令prompt；将第一提示指令prompt输入大语言模型，得到大语言模型输出的提示信息。

具体地，对于不同的场景，获取的第一prompt格式模板不同。本发明实施例中以目标场景为学生成绩场景为例进行说明，对于其他场景下的第一prompt格式模板与学生成绩场景类似，本发明实施例中不再赘述。

图2为本发明实施例提供的学生成绩场景对应的第二数据库的结构示意图，如图2所示，在该场景中，第二数据库包括有学生表、课程表、学期表和成绩表这四个数据表，其中，与学生成绩场景对应的目标数据表为成绩表。因此，获取的预配置的第一prompt格式模板例如可以为：

“请根据用户提问内容，分析用户问题中是否已经包含场景的关键字段。

要求：

1、判断提问内容中是否提供符合关键数据表数据格式要求的内容，如果格式错误时，提示：格式错误。

2、默认值字段，无需用户提供。

3、如果用户输入默认字段，则以用户输入字段为准。

4、如果用户所有信息都提供完整，则显示：success。

5、如果有缺失内容，则提示用户补充完整信息。

场景：{查询成绩}

关键字段：{学号、课程名称、学期}

数据类型：{学号：int，课程名称：string，学期：string}

默认值：{学期：2023年第2学期}

用户提问：{查询我本学期的成绩，学号张三，课程名称：计算机基础}

提示信息：

请给小助手补充以下内容，完成查询。

补充内容：”

上述的第一prompt格式模板中，“请根据用户提问内容，分析用户问题中是否已经包含场景的关键字段。要求：1、判断提问内容中是否提供符合关键数据表数据格式要求的内容，如果格式错误时，提示：格式错误。2、默认值字段，无需用户提供。3、如果用户输入默认字段，则以用户输入字段为准。4、如果用户所有信息都提供完整，则显示：success。5、如果有缺失内容，则提示用户补充完整信息。”上述内容为参考信息，该参考信息可以用于指导大语言模型进行槽位内信息的填充。

第一prompt格式模板中的“关键字段：{学号、课程名称、学期}，数据类型：{学号：int，课程名称：string，学期：string}，默认值：{学期：2023年第2学期}”中，{学号、课程名称、学期}等为第一知识信息槽，需要将目标数据表中的各字段信息填充至第一知识信息槽中。

另外，第一prompt格式模板中的“用户提问：{查询我本学期的成绩，学号张三，课程名称：计算机基础}”中需要补充的信息为第一问题信息槽，需要将问题文本填充至第一问题信息槽中，从而可以得到第一提示指令prompt。

进一步地，可以将第一提示指令prompt输入大语言模型中，即可得到大语言模型输出的提示信息。该提示信息例如可以为“success”，或者也可以为“请补充XX内容”。

在本实施例中，可以通过将问题文本输入至大语言模型中，在确定结果不唯一或者缺少查询关键信息时，如某些关键字段或者主键信息缺失时，可以通过大语言模型输出需要用户补充完整的信息，从而可以提高提示信息生成的效率。其中，在通过大语言模型生成提示信息的过程中，可以根据目标场景替换用户需要输入的关键信息，也即目标数据表中的必填字段和数据类型，当数据类型不匹配时，可以提示用户输入匹配的数据类型。

进一步地，通过截取用户在进入当前的目标场景后的上下文信息，将该截取的上下文信息作为新的提问信息，从而基于该新的提问信息从第二数据库中查找目标答案。

具体地，在提示信息表征问题文本中缺失了关键查询信息的情况下，将输出关键查询信息的补充指令，如“请补充XX信息”。用户可以基于输出的补充指令输入关键查询信息，电子设备将基于用户输入的关键查询信息补充问题文本，从而确定出目标问题文本。

在确定出目标问题文本后，可以将目标问题文本输入至大语言模型中，得到大语言模型输出的查询语句，其中，查询语句例如可以为结构化查询语言(Structured QueryLanguage，SQL)。示例性的，在将目标问题文本输入大语言模型，得到大语言模型输出的查询语句时，可以通过获取预配置的第二prompt格式模板，第二prompt格式模板包括第二问题信息槽和第二知识信息槽，第二prompt格式模板用于指示大语言模型参考第二知识信息槽内的数据库的各数据表中的字段信息，生成第二问题信息槽内的目标问题文本对应的查询语句；将目标问题文本填充至第二问题信息槽、将第二数据库的各数据表中的字段信息填充至第二知识信息槽，得到第二提示指令prompt；将第二提示指令prompt输入大语言模型，得到大语言模型输出的查询语句。

具体地，对于不同的场景，获取的第二prompt格式模板不同。本实施例中继续以目标场景为学生成绩场景为例进行说明，对于其他场景下的第二prompt格式模板与学生成绩场景类似，本发明实施例中不再赘述。

其中，获取的预配置的第二prompt格式模板例如可以为：

“你需要根据已知的数据表的表名、字段名和用户输入的问题编写SQL代码；

要求：

1、注意对问题中的中文数字(XX亿、XX千万、XX万)进行阿拉伯柱子转换。

2、SQL代码中需要使用括号内的字段名，不得使用汉字。

3、SQL代码中的字段名必须是已知字段名，不得新增字段名。

已知表名：

成绩表(Grades)字段名：[成绩ID(grade_id)、学生ID(student_id)、课程ID(course_id)、学期ID(semester_id)]；

学期表(Semesters)字段名：[学期ID(semester_id)、学期名称(semester_name)、年份(year)]；

课程表(Courses)字段名：[课程ID(course_id)、课程名称(course_name)；

学生表(Students)字段名：[学生表(Students)、姓名(name)]；

请根据以下用户输入，输出SQL代码。

用户输入“查询我本学期的成绩，学号100121321，课程名称：计算机基础，学期：2023年第2学期””

上述的第二prompt格式模板中，“你需要根据已知的数据表的表名、字段名和用户输入的问题编写SQL代码；要求：1、注意对问题中的中文数字(XX亿、XX千万、XX万)进行阿拉伯柱子转换。2、SQL代码中需要使用括号内的字段名，不得使用汉字。3、SQL代码中的字段名必须是已知字段名，不得新增字段名。”上述内容为参考信息，该参考信息可以用于指导大语言模型进行槽位内信息的填充。

第二prompt格式模板中的“成绩表(Grades)字段名：[成绩ID(grade_id)、学生ID(student_id)、课程ID(course_id)、学期ID(semester_id)]；学期表(Semesters)字段名：[学期ID(semester_id)、学期名称(semester_name)、年份(year)]；课程表(Courses)字段名：[课程ID(course_id)、课程名称(course_name)；学生表(Students)字段名：[学生表(Students)、姓名(name)]；”中需要填写的内容为第二知识信息槽，需要将如图2所示的第二数据库中各数据表中的字段信息填充至第二知识信息槽中。

另外，第二prompt格式模板中的“查询我本学期的成绩，学号100121321，课程名称：计算机基础，学期：2023年第2学期”中需要补充的信息为第二问题信息槽，需要将目标问题文本填充至第二问题信息槽中，从而可以得到第二提示指令prompt。

将第二提示指令prompt输入大语言模型，得到大语言模型输出的查询语句，具体地，如果当前的目标场景可以获取到默认值，如用户信息和学期，则直接填写在目标问题文本之后作为补充。另外，还需要将关联的第二数据库中各数据表的表名称和数据字段名称进行标记，利用大语言模型的语义理解能力将目标问题文本转换为数据库可识别的查询语句。

示例性的，在上述示例中，生成的查询语句可以为如下的SQL语句：

SELECT grade_id，student_id，course_id，semester_id

FROM Grades

WHERE student_id＝100121321AND course_id IN(

SELECT course_id

FROM Course

WHERE course_name＝“计算机基础”

)AND semester_id IN(

SELECT semester_id

FROM Semester

WHERE year＝2023AND semester_name＝“第2学期”)

在本实施例中，在确定出目标场景下的接口或者第二数据库和第二数据库中的各数据表后，可以调用大语言模型，通过第二prompt格式模板的方式改写目标问题文本，将该目标问题文本转换为数据库查询语句，使得查询语句的生成方式简单且高效。

进一步地，在生成查询语句后，可以采用该查询语句查询目标场景对应的第二数据库，从而从该第二数据库中查找到目标答案。

需要进行说明的是，若无法将目标问题文本改写为有效的查询语句时，可以直接使用大语言模型的文本生成能力输出目标答案。

在本实施例中，可以将问题文本输入至大语言模型中，以对问题文本全部的内容都进行语义理解和分析，从而可以基于分析结果确定目标答案，避免了现有技术中需要通过固定的问答对才能查找到目标答案的现象，本发明实施例中不采用固定的问答方式也能够获取到目标答案，由此可以提高问答系统场景的通用性。另外，当用户提问的意图不清晰时，可以基于大语言模型快速的确定出缺失的关键查询信息，这样用户可以补充该关键查询信息，从而基于用户补充的关键查询信息确定新的目标问题文本，并基于新的目标问题文本查找目标答案，从而可以提高目标答案查找的效率。

示例性的，在上述各实施例的基础上，在基于目标场景对应的第二数据库，查找问题文本对应的目标答案时，可以从目标场景对应的第二数据库中查找问题文本对应的初始答案，并将初始答案输入大语言模型，得到大语言模型输出的润色后的目标答案。

具体地，在从第二数据库中查找到问题文本对应的初始答案后，该初始答案可能不完整或者内容较为单薄，因此，为了提高用户的交互体验，还可以进一步将查找到的初始答案输入至大语言模型中，从而对初始答案进行润色，并输出润色后的目标答案。

在本实施例中，由于可以将初始答案通过大语言模型进行润色处理，从而可以提高最终输出的目标答案的丰富程度，进一步提升了人机交互的智能化程度。

示例性的，在上述各实施例的基础上，构造准确的第一数据库，是后续进行分词准确匹配的基础。因此，如何构造该第一数据库是非常重要的。在本发明实施例中，可以通过获取样本问题文本和样本问题文本对应的样本场景；将样本问题文本输入大语言模型中，通过大语言模型调用样本场景对应的样本数据库，基于样本数据库中各样本数据表中的样本字段信息，确定样本问题文本对应的初始关键词，并对初始关键词进行语义扩充，得到扩充关键词，输出样本关键词，样本关键词包括初始关键词和扩充关键词；基于样本关键词和样本场景的对应关系，构建第一数据库。

具体地，可以通过网络爬虫或者其他数据采集的方式，获取多个样本问题文本以及各样本问题文本对应的样本场景，该样本场景可以理解为输入或者询问样本问题文本的场景。另外，在电子设备中会预先存储有各样本场景对应的样本数据库，每个样本数据库中通常会包括多个样本数据表，各样本数据表中预先设置有样本字段信息，样本字段信息例如可以包括样本字段名称、样本字段元数据、数据类型和是否允许为空等信息。其中，样本字段元数据可以理解为数据字段的介绍信息。

应理解，一个场景中可能会包含多个数据库和数据表。

另外，由于不同的样本问题文本通常是由不同的用户输入的，因此，需要考虑不同的样本问题文本的多样化以及口语化的差异，故可以将获取到的多个样本问题文本输入至大语言模型中。对于每个样本问题文本来说，大语言模型会调用与该样本问题文本的样本场景对应的样本数据库，从而基于样本数据库的名称、样本数据库中包括的各样本数据表的名称、样本数据表中填充的各样本字段名称、样本字段元数据等，自动生成样本问题文本对应的初始关键词。

以图2中的学生成绩场景为例，若样本问题文本为“我想查一下我本学期计算机课程的成绩”，将该样本问题文本输入至大语言模型后，大语言模型通过查询如图2中的第二数据库中的数据库名称、数据表名称、各字段名称和字段元数据等确定出的关键词包括“学生成绩、学生课程表、成绩”。

进一步地，还可以利用大语言模型的语义理解能力，对初始关键词进行语义扩充，从而可以得到扩充关键词，该扩充关键词为和初始关键词语义相似的词语，例如，若初始关键词为成绩，扩充关键词可以为分数等。

大语言模型在确定出扩充关键词后，将初始关键词和扩充关键词确定为样本关键词，并将样本关键词进行内容向量化，以方便后续与问题文本中分词进行语义匹配。

在确定出样本关键词后，可以基于样本关键词和样本场景的对应关系，构建第一数据库，也即在第一数据库中存储样本关键词和样本场景的对应关系。

在本发明实施例中，可以结合大语言模型，通过查询与样本场景对应的样本数据库，并基于样本数据库中各样本数据表中的样本字段信息，提取样本问题文本中的初始关键词，并基于大语言模型对初始关键词进行语义扩充，得到扩充关键词后，将该初始关键词和扩充关键词一起确定为样本关键词，上述方式可以避免现有技术中通过人为设置第一数据库中的关键词时，关键词受限的问题，通过大语言模型结合样本问题文本中的语义信息确定出的样本关键词更为广泛，可以对不同场景下的问题文本中的分词进行匹配，从而可以提高第一数据库的适用范围，进一步提升了问答系统的应用场景的通用性。

下面对本发明提供的知识问答装置进行描述，下文描述的知识问答装置与上文描述的知识问答方法可相互对应参照。

图3为本发明实施例提供的知识问答装置的结构示意图，如图3所示，该知识问答装置300包括：

处理模块301，用于对获取的问题文本进行分词处理，得到至少一个分词；

匹配模块302，用于将各所述分词和第一数据库中的各关键词进行匹配，得到匹配成功的至少一个目标分词；

确定模块303，用于基于所述第一数据库中关键词和场景的对应关系，确定各所述目标分词对应的场景，并基于各所述目标分词对应的场景确定目标场景；

查找模块304，用于基于所述目标场景对应的第二数据库，查找所述问题文本对应的目标答案；

输出模块305，用于输出所述目标答案。

在一种示例实施例中，处理模块301，具体用于：

在一种示例实施例中，确定模块303，具体用于：

在一种示例实施例中，查找模块304，具体用于：

在一种示例实施例中，所述装置还包括：输入模块，其中：

输入模块，具体用于：

在一种示例实施例中，输入模块，具体用于：

在一种示例实施例中，所述装置还包括：获取模块和构建模块，其中：

获取模块，还用于获取样本问题文本和所述样本问题文本对应的样本场景；

输入模块，用于将所述样本问题文本输入大语言模型中，通过所述大语言模型调用所述样本场景对应的样本数据库，基于所述样本数据库中各样本数据表中的样本字段信息，确定所述样本问题文本对应的初始关键词，并对所述初始关键词进行语义扩充，得到扩充关键词，输出样本关键词，所述样本关键词包括所述初始关键词和所述扩充关键词；

构建模块，用于基于所述样本关键词和所述样本场景的对应关系，构建所述第一数据库。

在一种示例实施例中，查找模块304，具体用于：

本实施例的装置，可以用于执行知识问答方法侧实施例中任一实施例的方法，其具体实现过程与技术效果与知识问答方法侧实施例中类似，具体可以参见知识问答方法侧实施例中的详细介绍，此处不再赘述。

图4示例了一种电子设备的实体结构示意图，如图4所示，该电子设备可以包括：处理器(processor)410、通信接口(Communications Interface)420、存储器(memory)430和通信总线440，其中，处理器410，通信接口420，存储器430通过通信总线440完成相互间的通信。处理器410可以调用存储器430中的逻辑指令，以执行知识问答方法，该方法包括：对获取的问题文本进行分词处理，得到至少一个分词；将各所述分词和第一数据库中的各关键词进行匹配，得到匹配成功的至少一个目标分词；基于所述第一数据库中关键词和场景的对应关系，确定各所述目标分词对应的场景，并基于各所述目标分词对应的场景确定目标场景；基于所述目标场景对应的第二数据库，查找所述问题文本对应的目标答案；输出所述目标答案。

此外，上述的存储器430中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

另一方面，本发明还提供一种计算机程序产品，所述计算机程序产品包括计算机程序，计算机程序可存储在非暂态计算机可读存储介质上，所述计算机程序被处理器执行时，计算机能够执行上述各方法所提供的知识问答方法，该方法包括：对获取的问题文本进行分词处理，得到至少一个分词；将各所述分词和第一数据库中的各关键词进行匹配，得到匹配成功的至少一个目标分词；基于所述第一数据库中关键词和场景的对应关系，确定各所述目标分词对应的场景，并基于各所述目标分词对应的场景确定目标场景；基于所述目标场景对应的第二数据库，查找所述问题文本对应的目标答案；输出所述目标答案。

又一方面，本发明还提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现以执行上述各方法提供的知识问答方法，该方法包括：对获取的问题文本进行分词处理，得到至少一个分词；将各所述分词和第一数据库中的各关键词进行匹配，得到匹配成功的至少一个目标分词；基于所述第一数据库中关键词和场景的对应关系，确定各所述目标分词对应的场景，并基于各所述目标分词对应的场景确定目标场景；基于所述目标场景对应的第二数据库，查找所述问题文本对应的目标答案；输出所述目标答案。

以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下，即可以理解并实施。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种知识问答方法，其特征在于，包括：

对获取的问题文本进行分词处理，得到至少一个分词；

输出所述目标答案。

2.根据权利要求1所述的知识问答方法，其特征在于，所述对获取的问题文本进行分词处理，得到至少一个分词，包括：

3.根据权利要求1所述的知识问答方法，其特征在于，所述基于各所述目标分词对应的场景确定目标场景，包括：

4.根据权利要求1-3任一项所述的知识问答方法，其特征在于，所述基于所述目标场景对应的第二数据库，查找所述问题文本对应的目标答案，包括：

5.根据权利要求4所述的知识问答方法，其特征在于，所述将所述问题文本输入大语言模型，得到所述大语言模型输出的提示信息，包括：

6.根据权利要求4所述的知识问答方法，其特征在于，所述将所述目标问题文本输入所述大语言模型，得到所述大语言模型输出的查询语句，包括：

7.根据权利要求1-3任一项所述的知识问答方法，其特征在于，所述方法还包括：

获取样本问题文本和所述样本问题文本对应的样本场景；

8.根据权利要求1-3任一项所述的知识问答方法，其特征在于，所述基于所述目标场景对应的第二数据库，查找所述问题文本对应的目标答案，包括：

9.一种知识问答装置，其特征在于，包括：

输出模块，用于输出所述目标答案。

10.一种电子设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现如权利要求1至8任一项所述知识问答方法。

11.一种非暂态计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至8任一项所述知识问答方法。