CN117194646A - 问答方法、装置以及电子设备 - Google Patents
问答方法、装置以及电子设备 Download PDFInfo
- Publication number
- CN117194646A CN117194646A CN202311391440.XA CN202311391440A CN117194646A CN 117194646 A CN117194646 A CN 117194646A CN 202311391440 A CN202311391440 A CN 202311391440A CN 117194646 A CN117194646 A CN 117194646A
- Authority
- CN
- China
- Prior art keywords
- knowledge
- recall
- answered
- information
- granularity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 53
- 239000013598 vector Substances 0.000 claims description 93
- 238000004458 analytical method Methods 0.000 claims description 13
- 230000008569 process Effects 0.000 claims description 6
- 238000011156 evaluation Methods 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 12
- 238000005516 engineering process Methods 0.000 description 9
- 238000012545 processing Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 5
- 238000003058 natural language processing Methods 0.000 description 4
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- FBPFZTCFMRRESA-KVTDHHQDSA-N D-Mannitol Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-KVTDHHQDSA-N 0.000 description 2
- 206010022773 Intracranial pressure increased Diseases 0.000 description 2
- 229930195725 Mannitol Natural products 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000006399 behavior Effects 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 201000009941 intracranial hypertension Diseases 0.000 description 2
- 235000010355 mannitol Nutrition 0.000 description 2
- 239000000594 mannitol Substances 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 238000009411 base construction Methods 0.000 description 1
- 238000005266 casting Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000003750 conditioning effect Effects 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 230000004886 head movement Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000011524 similarity measure Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请实施例公开了一种问答方法、装置以及电子设备。所述方法包括:获取待回答信息;从预先构建的知识库中获取与所述待回答信息相关的召回知识,所述召回知识包括细粒度召回知识、粗粒度召回知识和个性化召回知识;基于所述待回答信息、所述细粒度召回知识、所述粗粒度召回知识、所述个性化召回知识,得到提示词;将所述提示词输入大语言模型,得到所述待回答信息对应的答案。通过上述方式使得,可以基于多维度的召回知识与待回答信息得到提示词,从而可以使提示词中可用于作为答案的参考依据更多,进而使得大语言模型可以根据包含更多参考依据的提示词得到答案,提高了答案的准确性。
Description
技术领域
本申请涉及计算机技术领域,更具体地,涉及一种问答方法、装置以及电子设备。
背景技术
随着人工智能技术的发展,人们开始依赖人工智能技术完成一些日常任务,例如,用户可以向电子设备(如电脑、手机、平板等)的语音助手进行提问,以快速获取相应的答案。在相关方式中,可以先基于自然语言处理技术的文本预处理模块理解用户的问题,并从知识库中检索相关信息,并根据用户的提问匹配相应的话术,将检索到的信息填充到相应的话术模板中得到答案,最后通过语音合成技术将文本转换为语音输出给用户。但相关方式中,答案的准确性还有待提高。
发明内容
鉴于上述问题,本申请提出了一种问答方法、装置以及电子设备,以实现改善上述问题。
第一方面,本申请提供了一种问答方法,应用于电子设备,所述方法包括:获取待回答信息;从预先构建的知识库中获取与所述待回答信息相关的召回知识,所述召回知识包括细粒度召回知识、粗粒度召回知识和个性化召回知识;基于所述待回答信息、所述细粒度召回知识、所述粗粒度召回知识、所述个性化召回知识,得到提示词;将所述提示词输入大语言模型,得到所述待回答信息对应的答案。
第二方面,本申请提供了一种问答装置,运行于电子设备,所述装置包括:待回答信息获取单元,用于获取待回答信息;知识获取单元,用于从预先构建的知识库中获取与所述待回答信息相关的知识,所述知识包括细粒度召回知识、粗粒度召回知识和个性化召回知识;提示词获取单元,用于基于所述待回答信息、所述细粒度召回知识、所述粗粒度召回知识、所述个性化召回知识,得到提示词;答案获取单元,用于将所述提示词输入大语言模型,得到所述待回答信息对应的答案。
第三方面,本申请提供了一种电子设备,包括一个或多个处理器以及存储器;一个或多个程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序配置用于执行上述的方法。
第四方面,本申请提供的一种计算机可读存储介质,所述计算机可读存储介质中存储有程序代码,其中,在所述程序代码运行时执行上述的方法。
本申请提供的一种问答方法、装置、电子设备以及存储介质,在获取待回答信息后,从预先构建的知识库中获取与所述待回答信息相关的细粒度召回知识、粗粒度召回知识和个性化召回知识,基于所述待回答信息、所述细粒度召回知识、所述粗粒度召回知识、所述个性化召回知识,得到提示词;将所述提示词输入大语言模型,得到所述待回答信息对应的答案。通过上述方式使得,可以基于多维度的召回知识与待回答信息得到提示词,从而可以使提示词中可用于作为答案的参考依据更多,进而使得大语言模型可以根据包含更多参考依据的提示词得到答案,提高了答案的准确性。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了本申请实施例提出的一种问答方法的流程图;
图2示出了本申请提出的一种获取待回答信息的示意图;
图3示出了本申请提出的一种获取细粒度召回知识的示意图;
图4示出了本申请提出的一种知识库存储结构的示意图;
图5示出了本申请提出的一种提示词的示意图;
图6示出了本申请提出的一种通过大语言模型获取答案的示意图;
图7示出了本申请提出的一种生成答案的场景示意图;
图8示出了本申请另一实施例提出的一种问答方法的流程图;
图9示出了本申请提出的一种通过大语言模型计算相似度的示意图;
图10示出了本申请实施例提出的一种问答装置的结构框图;
图11示出了本申请提出的一种电子设备的结构框图;
图12是本申请实施例的用于保存或者携带实现根据本申请实施例的问答方法的程序代码的存储单元。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
随着电子设备(如电脑、手机、平板等)的普及,人们开始依赖电子设备完成一些日常任务,例如,用户可以向电子设备的语音助手进行提问,以快速获取相应的答案。在相关方式中,可以先基于自然语言处理技术的文本预处理模块理解用户的问题,并从知识库中检索相关信息,并根据用户的提问匹配相应的话术,将检索到的信息填充到相应的话术模板中得到答案,最后通过语音合成技术将文本转换为语音输出给用户。但相关方式中,答案的准确性还有待提高。
发明人在对相关研究中发现,相关方式的答案的准确性还有待提高。例如,自然语言处理技术可能存在无法准确地理解复杂的问题的情况,再例如,通过知识库的检索信息得到答案,可能无法处理那些不在知识库中的问题。
因此,发明人提出了本申请中的一种问答方法、装置以及电子设备,在获取待回答信息后,从预先构建的知识库中获取与所述待回答信息相关的细粒度召回知识、粗粒度召回知识和个性化召回知识,基于所述待回答信息、所述细粒度召回知识、所述粗粒度召回知识、所述个性化召回知识,得到提示词;将所述提示词输入大语言模型,得到所述待回答信息对应的答案。通过上述方式使得,可以基于多维度的召回知识与待回答信息得到提示词,从而可以使提示词中可用于作为答案的参考依据更多,进而使得大语言模型可以根据包含更多参考依据的提示词得到答案,提高了答案的准确性。
为了更好地理解本申请实施例的方案,下面先对本申请实施例所使用的技术名词解释。
LLM(Large Language Model,大语言模型):可以指使用大量文本数据训练的深度学习模型,LLM可以生成自然语言文本或理解语言文本的含义,通常用于处理多种自然语言任务,如文本分类、问答、对话等。示例性的,大语言模型可以为ChatGPT(Chat GenerativePre-trained Transformer)模型。
ICL(In-Context Learning,情境学习):可以指一种使用训练完好的语言模型估计给定示例条件下的条件概率分布模型。ICL可以给语言模型一个“提示(prompt)”,该提示可以是由输入输出对组成的列表,一个输入输出对可以为一个示例,该示例可以用来描述一个任务,在提示的末尾,可以有一个测试输入,并让语言模型仅通过以提示为条件来预测对应的输出。
下面将结合附图对本申请的实施例进行介绍。
请参阅图1,本申请实施例提供的一种问答方法,应用于电子设备,所述方法包括:
S110:获取待回答信息。
其中,待回答信息(Query)可以指用于生成答案的参考依据,在待回答信息中心可以包含用户的意图,用户的意图可以指用户希望达到某种目的的打算。示例性的,当待回答信息为“甘露醇降低颅内高压的机理是什么”时,用户的意图可以为了解甘露醇降低颅内高压的机理。
作为一种方式,用户可以直接向电子设备输入待回答信息。
可选的,用户可以直接通过语音交互的方式向电子设备输入待回答信息。示例性的,电子设备可以设置有语音助手,用户可以呼唤语音助手的名字,在得到语音助手的回应后,可以直接通过语音将待回答信息告知语音助手。
可选的,用户可以直接通过文字输入的方式向电子设备输入待回答信息。示例性的,如图2左图所示,电子设备的屏幕可以显示有智慧问答、地图导航等卡片,用户可以通过点击智慧问答卡片进入图2右图所示的待回答信息输入界面,并直接通过文字输入的方式将待回答信息输入该界面。
作为另一种方式,用户可以通过其他设备间接向电子设备输入待回答信息。示例性的,用户可以佩戴VR(Virtual Reality,虚拟现实)设备(如VR眼镜等),该VR设备可以将电子设备显示的内容立体化,用户可以通过头部运动等实现对电子设备中内容的选择操作,当用户选择表征智慧问答的卡片时,可以进入待回答信息输入界面,以通过手势等方式输入待回答信息。
S120:从预先构建的知识库中获取与所述待回答信息相关的召回知识,所述召回知识包括细粒度召回知识、粗粒度召回知识和个性化召回知识。
其中,知识库可以包含专业领域的知识和私有领域的知识,专业领域的知识可以指在对应领域内统一的公知常识、真理等,私有领域的知识可以指基于用户个人的行为、生活环境等得到的因人而异的知识。知识库可以为一种向量数据库,向量数据库可以是一种键值对数据库,也就是说,在知识库中,每一条知识可以存储为原始文本、原始文本对应的原文本向量。
细粒度召回知识可以指通过非泛化手段检索到的知识,例如,基于知识中关键词的匹配;粗粒度召回知识可以指通过泛化手段检索到的知识,例如,基于知识整体的匹配;个性化召回知识可以指基于用户个人的历史查询记录得到的知识,例如,用户可以为专业的金融从业者,那么可以将与用户的待回答信息相关的金融领域知识作为个性化召回知识。
作为一种方式,可以获取待查询关键词,待查询关键词可以表征待回答信息中的重要内容;将待查询关键词与多个原始文本各自对应的关键词进行匹配,得到细粒度召回知识;将待回答信息与多个原始文本进行匹配,将匹配成功的原始文本作为粗粒度召回知识;将待回答信息与历史召回知识进行匹配,将匹配成功的历史召回知识作为个性化召回知识,历史召回知识可以表征用户的知识偏好。
可选的,可以基于传统的自然语言处理技术(如BERT模型等)获取待查询关键词以及多个原始文本各自对应的关键词。
可选的,为了加快关键词的匹配速度,可以预先获取每条知识对应的关键词并将每条知识与对应的关键词关联存储在知识库中。
作为一种获取细粒度召回知识的方式,如图3所示,可以获取待查询关键词对应的待查询向量;获取知识库中的多个关键词向量,其中,关键词向量可以与关键词一一对应;获取待查询向量分别与多个关键词向量之间的相似度,以得到多个第一相似度,第一相似度可以表征待查询向量与对应关键词的匹配程度;基于多个第一相似度得到目标关键词,目标关键词可以为按照第一相似度由高到低的顺序排在前指定位(如前K位,K为整数)的关键词向量对应的关键词;将目标关键词对应的原始文本作为细粒度召回知识。
可选的,在得到多个第一相似度时,可以直接将待查询向量逐一与每个关键词向量进行相似度度量,从而得到多个第一相似度。
可选的,可以基于向量间相似度度量方式(如欧氏距离、余弦距离等),得到多个第一相似度。
可选的,可以将待查询向量和多个关键词向量输入大语言模型,基于大语言模型的输出得到多个第一相似度。
可选的,可以将待查询关键词、多个关键词分别输入embedding(嵌入)模型得到待查询向量、多个关键词向量。其中,embedding模型可以指用于将文字转化为向量的大语言模型。
可选的,为了加快关键词的匹配速度,可以预先获取每条知识对应的关键词向量并将每条知识的关键词与对应的关键词向量关联存储在知识库中。
同时,如图4所示,知识库中的多个关键词向量可以为树状存储结构(treeindex),树状存储结构可以包括多个层次的节点,每个层次的节点对应有摘要向量(summary/featured description),摘要向量可以表征对应层次中所有节点各自对应的关键词的总结。因此,可以通过树状匹配的方式得到多个第一相似度。
可选的,树状匹配的方式可以为:获取待查询向量与根节点对应的摘要向量之间的相似度;基于该相似度确定所述根节点的下一层次的匹配节点,匹配节点为与待查询向量匹配成功的节点;继续获取待查询向量与下一层次的匹配节点的摘要向量之间的相似度,直到获取到待查询向量与多个关键词向量之间的相似度,以得到多个第一相似度。
示例性的,在访问知识库中的知识时,可以从根节点开始,一路向下搜索。例如,当待回答信息为“今天北京的天气怎么样?”时,可以从根节点开始搜索,找到与“北京”和“天气”相关的子节点,并继续向下搜索,最终,得到与待回答信息相关的知识,并将其返回。
作为一种获取粗粒度召回知识的方式,可以获取待回答信息对应的待回答向量;获取知识库中的多个原始文本向量;获取待回答向量分别与多个原始文本向量之间的相似度,以得到多个第三相似度,第三相似度可以表征待回答向量与对应原始文本的匹配程度;基于多个第三相似度得到匹配成功的原始文本,匹配成功的原始文本可以为按照第三相似度由高到低的顺序排在前指定位(如前M位,M为整数)的原始文本向量;进而得到粗粒度召回知识。
作为一种获取个性化召回知识的方式,可以将知识库中与历史反馈知识相同或相近的知识作为历史召回知识,历史反馈知识可以为历史问答过程中与历史待回答信息匹配成功的原始文本;获取待回答信息对应的待回答向量;获取知识库中的多个历史原文本向量,其中,历史原文本向量可以与历史召回知识一一对应;获取待回答向量分别与多个历史原文本向量之间的相似度,以得到多个第二相似度,第二相似度可以表征待查询向量与对应历史召回知识的匹配程度;基于多个第二相似度得到匹配成功的历史召回知识,匹配成功的历史召回知识可以为按照第二相似度由高到低的顺序排在前指定位(如前N位,N为整数)的历史原文本向量对应的历史召回知识。
其中,与历史反馈知识相近的知识可以理解为与历史反馈知识处于同一领域的知识。例如,历史反馈知识为“浓度99.5%的乙醇溶液可以被称为无水乙醇”,可以确定历史反馈知识为化学领域,则可以将化学领域的知识作为与历史反馈知识相近的知识。
在本申请实施例中,在进行向量间的相似度计算之前,可以通过query planer将待回答信息拆分为多个子待回答信息,再将待回答信息与多个子待回答信息进行拼接,基于拼接后的待回答信息与知识库进行匹配,得到细粒度召回知识、粗粒度召回知识、个性化召回知识,从而提高得到的知识的精确度。示例性的,待回答信息可以为Query,子待回答信息可以为{sub query1;sub query2;sub query3},拼接后的待回答信息可以为Query:subquery1;sub query2;sub query3。
在本申请实施例中,通过获取细粒度召回知识可以使召回的知识与待回答信息相匹配的的相关性较高,降低错误率;通过获取粗粒度召回知识可以得到与待回答信息不完全匹配但存在一定相关性的知识,提高泛化性;通过获取个性化召回知识可以得到与待回答信息相关且与用户知识偏好相关的召回知识,增强了用户在个性化方面的体验。
S130:基于所述待回答信息、所述细粒度召回知识、所述粗粒度召回知识、所述个性化召回知识,得到提示词。
作为一种方式,可以将细粒度召回知识、粗粒度召回知识和个性化召回知识中重复的知识进行删除,以得到剩余的知识;基于剩余的知识得到检索结果部分;基于待回答信息和待回答信息对应的意图分析结果,得到用户分析部分,意图分析结果为将待回答信息输入大语言模型得到;获取预先配置的背景介绍部分、任务描述部分和回答要求部分;基于背景介绍部分、任务描述部分、回答要求部分、检索结果部分和用户分析部分,得到提示词。
其中,背景介绍部分可以用于告知大语言模型当前需扮演的角色、执行的任务和任务对应的背景,如在本申请的问答方案中,背景介绍部分可以为“此刻需要扮演的角色是基于现有知识进行问答的智能问答助手,在当前电子设备为用户给出合适的答案,当前用户的地理位置为成都、且用户为未成年人”。任务描述部分用于告知大语言模型提示词中可用于作为答案推理依据的内容,如在本申请的问答方案中,任务描述部分可以为“在回答用户问题时需要参照背景介绍部分、回答要求部分、检索结果部分和用户分析部分的内容”。回答要求部分可以用于告知大语言模型答案的评估标准和答案的格式,如在本申请的问答方案中,回答要求部分可以为“回答的内容需要简洁、语气温和,生成的答案格式为JSON格式的文本”。示例性的,提示词可以如图5所示。
S140:将所述提示词输入大语言模型,得到所述待回答信息对应的答案。
作为一种方式,如图6所示,可以将提示词输入大语言模型,得到待回答信息对应的答案。得到答案的场景可以如图7所示。
在本申请实施例中,通过使用大语言模型和知识库检索技术,可以更好地理解用户的问题,并生成更准确的回答。
本实施例提供的一种问答方法,在获取待回答信息后,从预先构建的知识库中获取与所述待回答信息相关的细粒度召回知识、粗粒度召回知识和个性化召回知识,基于所述待回答信息、所述细粒度召回知识、所述粗粒度召回知识、所述个性化召回知识,得到提示词;将所述提示词输入大语言模型,得到所述待回答信息对应的答案。通过上述方式使得,可以基于多维度的召回知识与待回答信息得到提示词,从而可以使提示词中可用于作为答案的参考依据更多,进而使得大语言模型可以根据包含更多参考依据的提示词得到答案,提高了答案的准确性。
请参阅图8,本申请实施例提供的一种问答方法,应用于电子设备,所述方法包括:
S210:获取专业领域知识库和私有领域知识库中的内容作为参考内容,所述专业领域知识库和私有领域知识库中的内容为自然语言描述格式。
作为一种方式,可以通过网络获取专业领域知识库中的内容,通过获取用户对电子设备的操作行为得到私有领域知识库中的内容。
示例性的,专业领域知识库中的内容可以为“北京的在2023年1月1日的气温为10℃”,私有领域知识库中的内容可以为“我在上个月的信号与系统笔记为XXX”。
S220:基于所述大语言模型将所述参考内容转化为所述知识库中的多条知识,所述知识为应用程序编程接口格式。
作为一种方式,可以将预先设置的格式转化示例和参考内容输入大语言模型,得到知识库中的多条知识。
其中,格式转化示例可以用于指导大语言模型如何基于输入得到相应的输出。示例性的,格式转化示例可以为:“参考内容:北京的在2023年1月1日的气温为10℃,知识:获取北京气温(日期):温度内容。”,则当输入的参考内容为“我在上个月的信号与系统笔记为XXX”时,大语言模型输出的应用程序编程接口格式(Application ProgrammingInterface,API)的知识可以为“我的笔记(科目,时间范围):笔记内容”。
其中,括号内为知识的格式参数,对于陈述事实的知识,括号内的陈述参数可以为空。
S230:获取每条所述知识与所述多个层次各自对应的摘要之间的相似度。
作为一种方式,如图9所示,可以基于大语言模型计算每条知识与多个层次各自对应的摘要之间的相似度。
S240:基于每条所述知识与所述多个层次各自对应的摘要之间的相似度,确定每条所述知识所在层次。
作为一种方式,基于每条知识与多个层次各自对应的摘要之间的相似度,将相似度最高的层次作为对应知识所在层次,以存储每条知识。
可选的,如果存在知识与当前多个层次的相似度都低于预设值时,可以新建一个层次存储该知识。
可选的,如果存在与知识相似度最高的层次中已有的知识与该知识存在重叠或者冲突,可以将该知识与对应层次中已有的知识中的内容通过大语言模型进行合并,合并可以指将该知识与对应层次中已有的知识中的内容的共性进行总结,以生成对应层次新的摘要。
S250:将每条所述知识存储在对应层次的节点中,以得到所述知识库。
作为一种方式,可以将每条知识存储在对应层次的节点中,以得到知识库。
S260:获取待回答信息。
S270:从预先构建的知识库中获取与所述待回答信息相关的召回知识,所述召回知识包括细粒度召回知识、粗粒度召回知识和个性化召回知识。
S280:基于所述待回答信息、所述细粒度召回知识、所述粗粒度召回知识、所述个性化召回知识,得到提示词。
S290:将所述提示词输入大语言模型,得到所述待回答信息对应的答案。
本实施例提供的一种问答方法,通过上述方式使得,可以基于多维度的召回知识与待回答信息得到提示词,从而可以使提示词中可用于作为答案的参考依据更多,进而使得大语言模型可以根据包含更多参考依据的提示词得到答案,提高了答案的准确性。并且,在本实施例中,通过将专业领域知识库和私有领域知识库中的内容转化为API格式的知识存储至知识库中,可以更有利于大语言模型理解知识,从而生成更准确的回答。同时,通过将知识按树状结构进行存储,可以更有效地管理和组织大量知识,从而更有利于大语言模型理解知识,生成更准确的回答。
请参阅图10,本申请提供的一种问答装置600,运行于电子设备,所述装置600包括:
待回答信息获取单元610,用于获取待回答信息。
知识获取单元620,用于从预先构建的知识库中获取与所述待回答信息相关的知识,所述知识包括细粒度召回知识、粗粒度召回知识和个性化召回知识。
提示词获取单元630,用于基于所述待回答信息、所述细粒度召回知识、所述粗粒度召回知识、所述个性化召回知识,得到提示词。
答案获取单元640,用于将所述提示词输入大语言模型,得到所述待回答信息对应的答案。
作为一种方式,知识获取单元620具体用于获取待查询关键词,所述待查询关键词表征所述待回答信息中的重要内容;将所述待查询关键词与所述多个原始文本各自对应的关键词进行匹配,得到所述细粒度召回知识;将所述待回答信息与所述多个原始文本进行匹配,将匹配成功的原始文本作为所述粗粒度召回知识;将所述待回答信息与历史召回知识进行匹配,将匹配成功的历史召回知识作为所述个性化召回知识,所述历史召回知识为表征用户的知识偏好的原始文本。
可选的,知识获取单元620具体用于获取所述待查询关键词对应的待查询向量;获取所述知识库中的多个关键词向量,其中,所述关键词向量与所述关键词一一对应;获取所述待查询向量分别与所述多个关键词向量之间的相似度,以得到所述多个第一相似度,所述第一相似度表征所述待查询向量与对应关键词的匹配程度;基于所述多个第一相似度得到目标关键词,所述目标关键词为按照第一相似度由高到低的顺序排在前指定位的关键词向量对应的关键词;将所述目标关键词对应的原始文本作为所述细粒度召回知识。
可选的,所述知识库中的所述多个关键词向量为树状存储结构,所述树状存储结构包括多个层次的节点,每个层次的节点对应有摘要向量,所述摘要向量表征对应层次中所有节点各自对应的关键词的总结,知识获取单元620具体用于获取所述待查询向量与根节点对应的摘要向量之间的相似度;基于该相似度确定所述根节点的下一层次的匹配节点,所述匹配节点为与所述待查询向量匹配成功的节点;继续获取所述待查询向量与所述下一层次的匹配节点的摘要向量之间的相似度,直到获取到所述待查询向量与所述多个关键词向量之间的相似度,以得到所述多个第一相似度。
可选的,知识获取单元620具体用于将所述知识库中与历史反馈知识相同或相近的知识作为所述历史召回知识,所述历史反馈知识为历史问答过程中与历史待回答信息匹配成功的原始文本;获取所述待回答信息对应的待回答向量;获取所述知识库中的多个历史原文本向量,其中,所述历史原文本向量与所述历史召回知识一一对应;获取所述待回答向量分别与所述多个历史原文本向量之间的相似度,以得到所述多个第二相似度,所述第二相似度表征所述待查询向量与对应历史召回知识的匹配程度;基于所述多个第二相似度得到所述匹配成功的历史召回知识,所述匹配成功的历史召回知识为按照第二相似度由高到低的顺序排在前指定位的历史原文本向量对应的历史召回知识。
作为一种方式,提示词获取单元630具体用于将所述细粒度召回知识、所述粗粒度召回知识和所述个性化召回知识中重复的知识进行删除,以得到剩余的知识;基于所述剩余的知识得到检索结果部分;基于所述待回答信息和所述待回答信息对应的意图分析结果,得到用户分析部分,所述意图分析结果为将所述待回答信息输入所述大语言模型得到;获取预先配置的背景介绍部分、任务描述部分和回答要求部分,所述背景介绍部分用于告知所述大语言模型当前需扮演的角色、执行的任务和所述任务对应的背景,所述任务描述部分用于告知所述大语言模型所述提示词中可用于作为答案推理依据的内容,所述回答要求部分用于告知所述大语言模型答案的评估标准和答案的格式;基于所述背景介绍部分、所述任务描述部分、所述回答要求部分、所述检索结果部分和所述用户分析部分,得到所述提示词。
其中,所述装置600还包括:
知识库构建单元650,用于获取专业领域知识库和私有领域知识库中的内容作为参考内容,所述专业领域知识库和私有领域知识库中的内容为自然语言描述格式;基于所述大语言模型将所述参考内容转化为所述知识库中的多条知识,所述知识为应用程序编程接口格式;获取每条所述知识与所述多个层次各自对应的摘要之间的相似度;基于每条所述知识与所述多个层次各自对应的摘要之间的相似度,确定每条所述知识所在层次;将每条所述知识存储在对应层次的节点中,以得到所述知识库。
下面将结合图11对本申请提供的一种电子设备进行说明。
请参阅图11,基于上述的问答方法、装置,本申请实施例还提供的另一种可以执行前述问答方法的电子设备100。电子设备100包括处理器102、存储器104,其中,该存储器104中存储有可以执行前述实施例中内容的程序,而处理器102可以执行该存储器104中存储的程序。
其中,处理器102可以包括一个或者多个处理核。处理器102利用各种接口和线路连接整个电子设备100内的各个部分,通过运行或执行存储在存储器104内的指令、程序、代码集或指令集,以及调用存储在存储器104内的数据,执行电子设备100的各种功能和处理数据。可选地,处理器102可以采用网络处理器(Neural network Processing Unit,NPU)、数字信号处理(Digital Signal Processing,DSP)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)、可编程逻辑阵列(Programmable Logic Array,PLA)中的至少一种硬件形式来实现。处理器102可集成中央处理器(Central Processing Unit,CPU)、图像处理器(Graphics Processing Unit,GPU)、网络处理器(Neural networkProcessing Unit,NPU)和调制解调器等中的一种或几种的组合。其中,CPU主要处理操作系统、用户界面和应用程序等;GPU用于负责显示内容的渲染和绘制;NPU负责处理视频、图像类的多媒体数据;调制解调器用于处理无线通信。可以理解的是,上述调制解调器也可以不集成到处理器102中,单独通过一块通信芯片进行实现。
存储器104可以包括随机存储器(Random Access Memory,RAM),也可以包括只读存储器(Read-Only Memory)以及双倍速率同步动态随机存储器(Double DataRate,DDR)。存储器104可用于存储指令、程序、代码、代码集或指令集。存储器104可包括存储程序区和存储数据区,其中,存储程序区可存储用于实现操作系统的指令、用于实现至少一个功能的指令(比如触控功能、声音播放功能、图像播放功能等)、用于实现下述各个方法实施例的指令等。存储数据区还可以存储电子设备100在使用中所创建的数据(比如电话本、音视频数据、聊天记录数据)等。
请参考图12,其示出了本申请实施例提供的一种计算机可读存储介质的结构框图。该计算机可读存储介质800中存储有程序代码,所述程序代码可被处理器调用执行上述方法实施例中所描述的方法。
计算机可读存储介质800可以是诸如闪存、EEPROM(电可擦除可编程只读存储器)、EPROM、硬盘或者ROM之类的电子存储器。可选地,计算机可读存储介质800包括非易失性计算机可读存储介质(non-transitory computer-readable storage medium)。计算机可读存储介质800具有执行上述方法中的任何方法步骤的程序代码810的存储空间。这些程序代码可以从一个或者多个计算机程序产品中读出或者写入到这一个或者多个计算机程序产品中。程序代码810可以例如以适当形式进行压缩。
综上所述,本申请提供的一种问答方法、装置以及电子设备,在获取待回答信息后,从预先构建的知识库中获取与所述待回答信息相关的细粒度召回知识、粗粒度召回知识和个性化召回知识,基于所述待回答信息、所述细粒度召回知识、所述粗粒度召回知识、所述个性化召回知识,得到提示词;将所述提示词输入大语言模型,得到所述待回答信息对应的答案。通过上述方式使得,可以基于多维度的召回知识与待回答信息得到提示词,从而可以使提示词中可用于作为答案的参考依据更多,进而使得大语言模型可以根据包含更多参考依据的提示词得到答案,提高了答案的准确性。
最后应说明的是:以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不驱使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。
Claims (10)
1.一种问答方法,其特征在于,应用于电子设备,所述方法包括:
获取待回答信息;
从预先构建的知识库中获取与所述待回答信息相关的召回知识,所述召回知识包括细粒度召回知识、粗粒度召回知识和个性化召回知识;
基于所述待回答信息、所述细粒度召回知识、所述粗粒度召回知识、所述个性化召回知识,得到提示词;
将所述提示词输入大语言模型,得到所述待回答信息对应的答案。
2.根据权利要求1所述的方法,其特征在于,所述知识库包括多个原始文本和所述多个原始文本各自对应的关键词,所述从预先构建的知识库中获取与所述待回答信息相关的召回知识,包括:
获取待查询关键词,所述待查询关键词表征所述待回答信息中的重要内容;
将所述待查询关键词与所述多个原始文本各自对应的关键词进行匹配,得到所述细粒度召回知识;
将所述待回答信息与所述多个原始文本进行匹配,将匹配成功的原始文本作为所述粗粒度召回知识;
将所述待回答信息与历史召回知识进行匹配,将匹配成功的历史召回知识作为所述个性化召回知识,所述历史召回知识为表征用户的知识偏好的原始文本。
3.根据权利要求2所述的方法,其特征在于,所述将所述待查询关键词与所述多个原始文本各自对应的关键词进行匹配,得到所述细粒度召回知识,包括:
获取所述待查询关键词对应的待查询向量;
获取所述知识库中的多个关键词向量,其中,所述关键词向量与所述关键词一一对应;
获取所述待查询向量分别与所述多个关键词向量之间的相似度,以得到所述多个第一相似度,所述第一相似度表征所述待查询向量与对应关键词的匹配程度;
基于所述多个第一相似度得到目标关键词,所述目标关键词为按照第一相似度由高到低的顺序排在前指定位的关键词向量对应的关键词;
将所述目标关键词对应的原始文本作为所述细粒度召回知识。
4.根据权利要求3所述的方法,其特征在于,所述知识库中的所述多个关键词向量为树状存储结构,所述树状存储结构包括多个层次的节点,每个层次的节点对应有摘要向量,所述摘要向量表征对应层次中所有节点各自对应的关键词的总结,所述获取所述待查询向量分别与所述多个关键词向量之间的相似度,以得到所述多个第一相似度,包括:
获取所述待查询向量与根节点对应的摘要向量之间的相似度;
基于该相似度确定所述根节点的下一层次的匹配节点,所述匹配节点为与所述待查询向量匹配成功的节点;
继续获取所述待查询向量与所述下一层次的匹配节点的摘要向量之间的相似度,直到获取到所述待查询向量与所述多个关键词向量之间的相似度,以得到所述多个第一相似度。
5.根据权利要求2所述的方法,其特征在于,所述将所述待回答信息与历史召回知识进行匹配,将匹配成功的历史召回知识作为所述个性化召回知识,所述历史召回知识为表征用户的知识偏好的原始文本,包括:
将所述知识库中与历史反馈知识相同或相近的知识作为所述历史召回知识,所述历史反馈知识为历史问答过程中与历史待回答信息匹配成功的原始文本;
获取所述待回答信息对应的待回答向量;
获取所述知识库中的多个历史原文本向量,其中,所述历史原文本向量与所述历史召回知识一一对应;
获取所述待回答向量分别与所述多个历史原文本向量之间的相似度,以得到所述多个第二相似度,所述第二相似度表征所述待查询向量与对应历史召回知识的匹配程度;
基于所述多个第二相似度得到所述匹配成功的历史召回知识,所述匹配成功的历史召回知识为按照第二相似度由高到低的顺序排在前指定位的历史原文本向量对应的历史召回知识。
6.根据权利要求1所述的方法,其特征在于,所述基于所述待回答信息、所述细粒度召回知识、所述粗粒度召回知识、所述个性化召回知识,得到提示词,包括:
将所述细粒度召回知识、所述粗粒度召回知识和所述个性化召回知识中重复的知识进行删除,以得到剩余的知识;
基于所述剩余的知识得到检索结果部分;
基于所述待回答信息和所述待回答信息对应的意图分析结果,得到用户分析部分,所述意图分析结果为将所述待回答信息输入所述大语言模型得到;
获取预先配置的背景介绍部分、任务描述部分和回答要求部分,所述背景介绍部分用于告知所述大语言模型当前需扮演的角色、执行的任务和所述任务对应的背景,所述任务描述部分用于告知所述大语言模型所述提示词中可用于作为答案推理依据的内容,所述回答要求部分用于告知所述大语言模型答案的评估标准和答案的格式;
基于所述背景介绍部分、所述任务描述部分、所述回答要求部分、所述检索结果部分和所述用户分析部分,得到所述提示词。
7.根据权利要求1所述的方法,其特征在于,所述知识库为树状存储结构,所述树状存储结构包括多个层次的节点,每个层次的节点对应有摘要,所述摘要为对应层次中所有节点各自对应的知识的总结,所述获取待回答信息之前,还包括:
获取专业领域知识库和私有领域知识库中的内容作为参考内容,所述专业领域知识库和私有领域知识库中的内容为自然语言描述格式;
基于所述大语言模型将所述参考内容转化为所述知识库中的多条知识,所述知识为应用程序编程接口格式;
获取每条所述知识与所述多个层次各自对应的摘要之间的相似度;
基于每条所述知识与所述多个层次各自对应的摘要之间的相似度,确定每条所述知识所在层次;
将每条所述知识存储在对应层次的节点中,以得到所述知识库。
8.一种问答装置,其特征在于,运行于电子设备,所述装置包括:
待回答信息获取单元,用于获取待回答信息;
知识获取单元,用于从预先构建的知识库中获取与所述待回答信息相关的知识,所述知识包括细粒度召回知识、粗粒度召回知识和个性化召回知识;
提示词获取单元,用于基于所述待回答信息、所述细粒度召回知识、所述粗粒度召回知识、所述个性化召回知识,得到提示词;
答案获取单元,用于将所述提示词输入大语言模型,得到所述待回答信息对应的答案。
9.一种电子设备,其特征在于,包括一个或多个处理器以及存储器;
一个或多个程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序配置用于执行权利要求1-7任一所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有程序代码,其中,在所述程序代码运行时执行权利要求1-7任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311391440.XA CN117194646A (zh) | 2023-10-24 | 2023-10-24 | 问答方法、装置以及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311391440.XA CN117194646A (zh) | 2023-10-24 | 2023-10-24 | 问答方法、装置以及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117194646A true CN117194646A (zh) | 2023-12-08 |
Family
ID=88985296
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311391440.XA Pending CN117194646A (zh) | 2023-10-24 | 2023-10-24 | 问答方法、装置以及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117194646A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117725189A (zh) * | 2024-02-18 | 2024-03-19 | 国家超级计算天津中心 | 专业领域的生成式问答方法及电子设备 |
CN117874190A (zh) * | 2023-12-28 | 2024-04-12 | 暗物质(北京)智能科技有限公司 | 一种基于多源知识库的具有可溯源能力的问答方法及系统 |
CN117932012A (zh) * | 2023-12-13 | 2024-04-26 | 北京中科金财科技股份有限公司 | 一种基于人设大语言模型的对话系统在工业场景下的应用方法 |
-
2023
- 2023-10-24 CN CN202311391440.XA patent/CN117194646A/zh active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117932012A (zh) * | 2023-12-13 | 2024-04-26 | 北京中科金财科技股份有限公司 | 一种基于人设大语言模型的对话系统在工业场景下的应用方法 |
CN117932012B (zh) * | 2023-12-13 | 2024-06-07 | 北京中科金财科技股份有限公司 | 一种基于人设大语言模型的对话系统在工业场景下的应用方法 |
CN117874190A (zh) * | 2023-12-28 | 2024-04-12 | 暗物质(北京)智能科技有限公司 | 一种基于多源知识库的具有可溯源能力的问答方法及系统 |
CN117725189A (zh) * | 2024-02-18 | 2024-03-19 | 国家超级计算天津中心 | 专业领域的生成式问答方法及电子设备 |
CN117725189B (zh) * | 2024-02-18 | 2024-04-16 | 国家超级计算天津中心 | 专业领域的生成式问答方法及电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2020147428A1 (zh) | 交互内容生成方法、装置、计算机设备及存储介质 | |
CN109376222B (zh) | 问答匹配度计算方法、问答自动匹配方法及装置 | |
CN117194646A (zh) | 问答方法、装置以及电子设备 | |
CN111581229A (zh) | Sql语句的生成方法、装置、计算机设备及存储介质 | |
CN111353049A (zh) | 数据更新方法、装置、电子设备及计算机可读存储介质 | |
CN113887229A (zh) | 地址信息的识别方法、装置、计算机设备及存储介质 | |
CN117077792B (zh) | 一种基于知识图谱生成提示数据的方法及装置 | |
CN116541504B (zh) | 对话生成方法、装置、介质及计算设备 | |
CN116821324A (zh) | 模型训练方法、装置、电子设备及存储介质 | |
CN114492661B (zh) | 文本数据分类方法和装置、计算机设备、存储介质 | |
CN117453885A (zh) | 提问信息处理方法、装置、设备、存储介质及产品 | |
CN117932022A (zh) | 一种智能问答方法、装置、电子设备及存储介质 | |
CN112149424A (zh) | 语义匹配方法、装置、计算机设备和存储介质 | |
CN115481221B (zh) | 对话数据的增强方法、装置、设备、计算机存储介质 | |
CN114676237A (zh) | 语句相似度确定方法、装置、计算机设备和存储介质 | |
CN117931858B (zh) | 数据查询方法、装置、计算机设备和存储介质 | |
CN117290563B (zh) | 垂类搜索方法及装置、搜索系统、存储介质 | |
CN116842125B (zh) | 一种富媒体信息的存储方法及自然语言智能检索方法 | |
CN116757216B (zh) | 基于聚类描述的小样本实体识别方法、装置和计算机设备 | |
CN118051602B (zh) | 面向信息安全领域的智能问答方法及系统、介质、设备 | |
CN118070925B (zh) | 模型训练方法、装置、电子设备、存储介质及程序产品 | |
CN118364798A (zh) | 一种理解文本提高大语言模型工具学习的方法 | |
CN117235236B (zh) | 对话方法、装置、计算机设备和存储介质 | |
CN118606450A (zh) | 问答处理方法、表单数据的输入方法及对应装置 | |
CN117010334A (zh) | 文本信息生成方法、装置、计算机设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |