CN116561278A - 知识问答方法、装置、设备及存储介质 - Google Patents
知识问答方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN116561278A CN116561278A CN202310506346.8A CN202310506346A CN116561278A CN 116561278 A CN116561278 A CN 116561278A CN 202310506346 A CN202310506346 A CN 202310506346A CN 116561278 A CN116561278 A CN 116561278A
- Authority
- CN
- China
- Prior art keywords
- knowledge
- reasoning
- text
- prompt
- question
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 70
- 230000008569 process Effects 0.000 claims abstract description 35
- 238000012549 training Methods 0.000 claims description 57
- 238000012545 processing Methods 0.000 claims description 45
- 230000003340 mental effect Effects 0.000 claims description 7
- 230000003993 interaction Effects 0.000 claims description 6
- 230000010354 integration Effects 0.000 claims description 5
- 238000012216 screening Methods 0.000 claims description 4
- 238000004590 computer program Methods 0.000 claims description 2
- 230000008901 benefit Effects 0.000 abstract description 3
- BPYKTIZUTYGOLE-IFADSCNNSA-N Bilirubin Chemical compound N1C(=O)C(C)=C(C=C)\C1=C\C1=C(C)C(CCC(O)=O)=C(CC2=C(C(C)=C(\C=C/3C(=C(C=C)C(=O)N\3)C)N2)CCC(O)=O)N1 BPYKTIZUTYGOLE-IFADSCNNSA-N 0.000 description 32
- 238000008050 Total Bilirubin Reagent Methods 0.000 description 13
- 201000010099 disease Diseases 0.000 description 13
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 13
- 238000008789 Direct Bilirubin Methods 0.000 description 12
- 102000003929 Transaminases Human genes 0.000 description 8
- 108090000340 Transaminases Proteins 0.000 description 8
- 238000004891 communication Methods 0.000 description 7
- 239000003814 drug Substances 0.000 description 7
- 230000003908 liver function Effects 0.000 description 7
- 239000008186 active pharmaceutical agent Substances 0.000 description 6
- 229940079593 drug Drugs 0.000 description 6
- 238000013136 deep learning model Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 206010023129 Jaundice cholestatic Diseases 0.000 description 3
- 201000005267 Obstructive Jaundice Diseases 0.000 description 3
- 230000009471 action Effects 0.000 description 3
- 201000001883 cholelithiasis Diseases 0.000 description 3
- 208000001130 gallstones Diseases 0.000 description 3
- 208000001024 intrahepatic cholestasis Diseases 0.000 description 3
- 230000007872 intrahepatic cholestasis Effects 0.000 description 3
- 206010061902 Pancreatic neoplasm Diseases 0.000 description 2
- 230000001771 impaired effect Effects 0.000 description 2
- 210000004185 liver Anatomy 0.000 description 2
- 201000002528 pancreatic cancer Diseases 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 206010067125 Liver injury Diseases 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 208000032023 Signs and Symptoms Diseases 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 231100000439 acute liver injury Toxicity 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 208000009866 extrahepatic cholestasis Diseases 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 208000006454 hepatitis Diseases 0.000 description 1
- 231100000283 hepatitis Toxicity 0.000 description 1
- 210000005229 liver cell Anatomy 0.000 description 1
- 230000004060 metabolic process Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000002604 ultrasonography Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0481—Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
- G06F3/0483—Interaction with page-structured environments, e.g. book metaphor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- General Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请公开了一种知识问答方法、装置、设备及存储介质,方法包括:将输入的问题文本按照思维链式推理策略进行拆解,得到若干个推理任务,调用推理任务对应的知识插件得到推理任务对应的知识搜索结果,将问题文本和知识搜索结果拼接为提示指令送入大语言模型,得到输出的答复内容。本申请将用户的问题文本按照思维链式推理策略拆解为若干个推理任务,拆解后的各推理任务相比于原始的问题文本更加简单、易于理解,有助于大语言模型给出正确的知识答复。进一步,本申请预先配置了多个知识插件,并融入到知识问答过程,可以使得大语言模型输出更加准确的知识答复,并扩展了知识问答的应用场景。
Description
技术领域
本申请涉及大语言模型技术领域,更具体的说,是涉及一种知识问答方法、装置、设备及存储介质。
背景技术
知识问答是指,用户向机器提出指令,由机器针对用户提出的指令给出对应的答复内容的过程。
近年来,伴随着人工智能技术的发展,越来越多的企业逐步探索将知识问答与深度学习相结合,通过生成式深度学习模型来输出与用户的提问相匹配的知识答案。但是,目前的深度学习模型仅能够处理一些较为简单的用户提问,对于复杂描述问题难以理解,进而导致无法给出准确的知识答案。并且,深度学习模型对训练语料的要求较高,在一些垂直应用领域内或开放域问答场景,用户的知识问答比较专业或偏僻,这些专业知识或偏僻知识可能并未在训练过程被深度学习模型所掌握,从而导致深度学习模型无法给出准确的知识答案,这也限制了知识问答的应用场景。
发明内容
鉴于上述问题,提出了本申请以便提供一种知识问答方法、装置、设备及存储介质,以解决现有方案无法针对复杂描述问题给出准确知识答案,以及在垂直应用领域或开放域问答场景下,现有方案输出的知识答案准确性不高的问题。具体方案如下:
第一方面,提供了一种知识问答方法,包括:
获取用户输入的问题文本,所述问题文本用于描述用户提出的问题;
按照思维链式推理策略,将所述问题文本拆解为若干个推理任务;
确定与所述推理任务对应的知识插件,并调用所述知识插件得到推理任务对应的知识搜索结果,其中,所述知识插件包括若干场景下的本地化知识资源和/或搜索引擎知识资源;
将所述问题文本及所述知识搜索结果拼接为提示指令prompt,输入至预配置的大语言模型,得到大语言模型输出的针对所述问题文本的答复内容。
优选地,所述按照思维链式推理策略,将所述问题文本拆解为若干推理任务,包括:
获取预配置的问题拆解提示指令模板,所述问题拆解提示指令模板包括问题文本槽,所述问题拆解提示指令模板用于指示大语言模型将所述问题文本槽内的问题文本拆解为若干个推理任务;
将所述问题文本填充至所述问题文本槽,得到编辑后问题拆解提示指令prompt;
将所述编辑后问题拆解提示指令prompt输入至所述大语言模型,得到大语言模型输出的对所述问题文本拆解后的若干个推理任务;
其中,所述大语言模型在训练阶段,采用训练问题文本及对应的按照思维链式推理策略进行拆解后的若干个推理任务为训练数据进行训练。
优选地,确定与所述推理任务对应的知识插件,包括:
获取预配置的插件选择提示指令模板,所述插件选择提示指令模板包括推理任务槽,所述插件选择提示指令模板用于提示大语言模型给出所述推理任务槽内的推理任务所依赖的知识插件,及将输入的问题文本转换为所述知识插件对应的输入格式要求;
将拆解后的每一推理任务分别填充至所述推理任务槽,得到每一推理任务对应的编辑后插件选择提示指令prompt;
将所述编辑后插件选择提示指令prompt输入至所述大语言模型,得到大语言模型输出的每一推理任务所依赖的知识插件,及符合所述知识插件输入格式要求的检索输入文本;
其中,所述大语言模型在训练阶段所使用的训练数据包括:对训练问题文本拆解后的推理任务、各推理任务所依赖的知识插件及按照该知识插件的输入格式要求对训练问题文本转换后的搜索输入文本。
优选地,调用所述知识插件得到推理任务对应的知识搜索结果的过程,包括:
对于每一推理任务:
调用推理任务所依赖的知识插件,并将得到的符合所述知识插件输入格式要求的检索输入文本传递给所述知识插件,以便所述知识插件按照所述检索输入文本进行知识搜索,并返回知识搜索结果,作为推理任务对应的知识搜索结果。
优选地,将所述问题文本及所述知识搜索结果拼接为提示指令prompt的过程,包括:
将所述问题文本、所述问题文本之前的历史知识问答对话信息及所述知识搜索结果拼接为提示指令prompt。
优选地,还包括:
结合所述问题文本拆解后的若干个推理任务,生成所述问题文本对应的推理描述信息;
则将所述问题文本及所述知识搜索结果拼接为提示指令prompt的过程,包括:
将所述问题文本、所述推理描述信息及所述知识搜索结果拼接为提示指令prompt;
或,
将所述问题文本、所述问题文本之前的历史知识问答对话信息、所述推理描述信息及所述知识搜索结果拼接为提示指令prompt。
优选地,结合所述问题文本拆解后的若干个推理任务,生成所述问题文本对应的推理描述信息,包括:
获取预配置的推理描述提示指令模板,所述推理描述提示指令模板包括推理任务槽,所述推理描述提示指令模板用于提示大语言模型基于所述推理任务槽内的各推理任务给出输入的问题文本对应的推理描述信息;
将拆解后的各个推理任务填充至所述推理任务槽,得到编辑后推理描述提示指令prompt;
将所述编辑后推理描述提示指令prompt输入至所述大语言模型,得到大语言模型输出的所述问题文本对应的推理描述信息;
其中,所述大语言模型在训练阶段所使用的训练数据包括:对训练问题文本拆解后的推理任务,及训练问题文本对应的推理描述信息。
优选地,在将所述问题文本及所述知识搜索结果拼接为提示指令prompt之前,还包括:
若一推理任务对应的知识搜索结果包括多条知识资源,则对所述多条知识资源进行加工,得到该推理任务对应的加工后知识资源,所述加工操作包括筛选、整合中的至少一项。
优选地,对所述多条知识资源进行加工,得到该推理任务对应的加工后知识资源的过程,包括:
获取预配置的知识加工提示指令模板,所述知识加工提示指令模板包括知识资源槽,所述知识加工提示指令模板用于提示大语言模型对所述知识资源槽内的各条知识资源进行加工处理给出加工后知识资源;
将所述多条知识资源填充至所述知识资源槽,得到编辑后知识加工提示指令prompt;
将所述编辑后知识加工提示指令prompt输入至所述大语言模型,得到大语言模型输出的加工后知识资源;
其中,所述大语言模型在训练阶段所使用的训练数据包括:对于同一推理任务的多条知识资源及人工对多条知识资源加工后的知识资源。
第二方面,提供了一种知识问答装置,包括:
输入信息获取单元,用于获取用户输入的问题文本,所述问题文本用于描述用户提出的问题;
问题拆解单元,用于按照思维链式推理策略,将所述问题文本拆解为若干个推理任务;
知识搜索单元,用于确定与所述推理任务对应的知识插件,并调用所述知识插件得到推理任务对应的知识搜索结果,其中,所述知识插件包括若干场景下的本地化知识资源和/或搜索引擎知识资源;
问答交互单元,用于将所述问题文本及所述知识搜索结果拼接为提示指令prompt,输入至预配置的大语言模型,得到大语言模型输出的针对所述问题文本的答复内容。
第三方面,提供了一种知识问答设备,包括:存储器和处理器;
所述存储器,用于存储程序;
所述处理器,用于执行所述程序,实现如前所述的知识问答方法的各个步骤。
第四方面,提供了一种存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,实现如前所述的知识问答方法的各个步骤。
借由上述技术方案,本申请对于用户输入的问题文本,按照思维链式推理策略进行拆解,将问题文本拆解为若干个推理任务,进而在预配置的知识插件库中确定每一推理任务对应的知识插件,调用知识插件得到推理任务对应的知识搜索结果,其中知识插件库中的知识插件可以包括若干场景下的本地化知识资源和/或搜索引擎知识资源,进一步将问题文本和知识搜索结果拼接为提示指令送入大语言模型,得到大语言模型输出的针对问题文本的答复内容。由于本申请将用户的问题文本按照思维链式推理策略拆解为若干个推理任务,拆解后的各推理任务相比于原始的问题文本更加简单、易于理解,特别是对于复杂描述问题,通过拆解后得到的各个推理任务更加便于大语言模型理解,且该思维链式推理策略也更加符合大语言模型的处理逻辑,提升了对复杂描述问题的理解程度,进而有助于大语言模型给出正确的知识答复。
进一步地,本申请预先配置了多个知识插件,包括不同场景下的本地化知识资源和/或搜索引擎知识资源,对于一些垂直应用领域场景、开放域问答场景,通过调用相应的知识插件可以得到知识搜索结果,将该知识搜索结果与用户输入的问题文本拼接为prompt送入给大语言模型,可以使得大语言模型掌握相应的知识搜索结果,在此基础上能够输出更加准确的知识答复,使得知识问答的应用场景可以拓展到一些垂直应用领域场景及开放域应用场景。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本申请的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1为本申请实施例提供的一种知识问答方法流程示意图;
图2示例了一种医疗问答场景下,调用多个知识插件进行知识问答的流程示意图;
图3为本申请实施例提供的一种知识问答装置结构示意图;
图4为本申请实施例提供的一种知识问答设备的结构示意图。
具体实施方式
在介绍本申请方案之前,首先对本文中涉及到的英文进行解释:
Prompt:指示指令。在与AI(如大语言模型)进行对话时,需要向AI发送的指令,其可以是一段文字描述,比如你和AI对话时输入的“请帮我推荐一首流行音乐”,也可以是按照一定格式的参数描述,比如让AI按照一定格式进行绘图,需要描述相关绘图参数。
大语言模型:(Large language model,LLM)是指基于Transformer结构的生成式深度神经网络模型,其具备超强的语义理解及多轮对话能力,常见的大语言模型如GT4以及其它企业研发的大语言模型。
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请提供了一种知识问答方案,可以适用于各种形式的知识问答的场景,示例如:金融领域知识问答场景、医学领域知识问答场景等。
本申请方案可以基于具备数据处理能力的终端实现,该终端可以是手机、电脑、学习机、智能机器人等。
接下来,结合图1所述,本申请的知识问答方法可以包括如下步骤:
步骤S100、获取用户输入的问题文本。
具体地,用户在与机器进行知识问答对话过程中,每一轮对话中用户可以输入相应的问题文本,问题文本用于描述用户提出的问题。
步骤S110、按照思维链式推理策略,将所述问题文本拆解为若干个推理任务。
具体地,用户描述的问题文本的表达形式及内容复杂度都是不固定的,对于某些问题文本若直接调用大语言模型进行理解,可能会由于问题文本的表达方式不规范、问题描述过于复杂等原因,造成大语言模型难以理解该问题文本,进而无法给出准确的答复。
本步骤中,按照思维链式推理策略,将问题文本拆解为若干个推理任务,该思维链式推理策略仿照人类在遇到问题时所产生的思考、推理步骤,将问题文本拆解为若干个短句子,每个短句子对应链式推理中的一个推理任务。以数学问题的解答过程为例,将其拆解后可以得到从数据问题到最终答案之间的中间各个推理步骤。
特别是对于一些复杂描述问题文本,采用思维链式推理策略进行拆解后,可以将复杂问题拆解为若干个简单的推理任务,更易于理解。
本实施例中以医疗场景为例,示例了问题文本的拆解过程:
问题文本query为“我今天查的肝功能,总胆红素94.2ummol/L,直接胆红素68.2ummol/L,间接胆红素26ummol/L;几个转氨酶也明显升高;这个是怎么回事?可能是什么病导致的?”。对该问题文本进行拆解,可以得到拆解后的三个推理任务分别为:1、解读并搜索query中相关信息;2、分析可能疾病;3、输出总结结果。
当然,上述仅示例了一种可选的问题文本的可选拆解结果,对于不同问题文本拆解后的推理任务的数量、类型并不固定,具体视问题文本的内容而定。
步骤S120、确定与所述推理任务对应的知识插件,并调用所述知识插件得到推理任务对应的知识搜索结果。
具体地,本申请实施例中可以预先配置若干知识插件,这些知识插件可以是不同场景下的本地化知识资源,也可以是联网的搜索引擎知识资源。
对于本地化知识资源,以医疗问答场景为例,可以包括:“合理用药”知识插件、“指标解读”知识插件等,对于搜索引擎知识资源可以包括:各类型的搜索引擎插件,如Google、百度等搜索引擎,其搜索输入文本格式可以是:{关键片段&逻辑运算符}。
为了便于理解,对上述“合理用药”、“指标解读”、两个知识插件进行介绍:
“合理用药”知识插件可以包括收录的各类型药品的用药时长信息,该知识插件的搜索输入文本格式可以是:{药品名称1:{用药时长:xx,用法用量:xx}…},该知识插件用于根据输入药品,确定合理用药时长。
“指标解读”知识插件可以包括收录的各类型指标的信息,以及可能的疾病信息。该知识插件的搜索输入文本格式可以是:{指标名称1:指标值1,指标名称2:指标值2…},该知识插件用于根据输入各个指标值判断是否异常,以及可能的疾病。
当然,上述仅以医疗问答场景下的两个知识插件进行示例性说明,本申请实施例还可以预先配置其它领域场景下的各类型知识插件,以实现对不同领域场景下知识的检索,从而扩展知识问答的可应用场景。
需要说明的是,本步骤中确定的与推理任务对应的知识插件,并非限定每一推理任务均存在对应的知识插件,对于某些类型的推理任务,也可能不存在对应的插件,此时该推理任务对应的知识搜索结果为空。
以前述实施例示例的问题文本query“我今天查的肝功能,总胆红素94.2ummol/L,直接胆红素68.2ummol/L,间接胆红素26ummol/L;几个转氨酶也明显升高;这个是怎么回事?可能是什么病导致的?”为例,对其拆解后得到的三个推理任务中,第1个推理任务存在对应的知识插件“指标解读”和“Google”搜索引擎,后两个推理任务不存在对应的知识插件。以“指标解读”知识插件的调用结果为例,调用“指标解读”知识插件后得到的与第1个推理任务对应的知识搜索结果可以是:{总胆红素:明显升高,直接胆红素:明显升高,间接胆红素:轻微升高},”可能疾病“”:{梗阻性黄疸,如胆结石、胰腺肿瘤、肝内胆汁淤积等}。
步骤S130、将所述问题文本及所述知识搜索结果拼接为提示指令prompt,输入至预配置的大语言模型,得到大语言模型输出的针对所述问题文本的答复内容。
具体地,本步骤中在设计大语言模型的提示指令prompt时,同时将用户输入的问题文本以及基于拆解的各推理任务对应的知识搜索结果拼接到prompt中,进而输入给大语言模型,使得大语言模型可以掌握各推理任务对应的知识搜索结果,在此基础上可以更加准确的生成与问题文本对应的答复内容。
仍以前述实施例示例的问题文本query“我今天查的肝功能,总胆红素94.2ummol/L,直接胆红素68.2ummol/L,间接胆红素26ummol/L;几个转氨酶也明显升高;这个是怎么回事?可能是什么病导致的?”为例,将问题文本和知识搜索结果拼接为prompt:
{
“query”:“我今天查的肝功能,总胆红素94.2ummol/L,直接胆红素68.2ummol/L,间接胆红素26ummol/L;几个转氨酶也明显升高;这个是怎么回事啊,可能是什么病导致的?”,
“command”:{
“指标解读_rlt”:{“解读结果”:{总胆红素:明显升高,直接胆红素:明显升高,间接胆红素:轻微升高},”可能疾病“”:{梗阻性黄疸,如胆结石、胰腺肿瘤、肝内胆汁淤积等},
“Google_rlt”:{“搜索结果”:总胆红素和间接胆红素升高……三者都升高,可能是肝细胞受损、胆红素代谢受阻,提示有急性肝损伤等。}}
}
上述prompt中包括问题文本query部分,以及指令command部分,command部分可以包括各推理任务对应的知识搜索结果,对应上述问题文本存在两条知识搜索结果,即“指标解读”知识插件的搜索结果result(简称rlt),和“Google”知识插件的搜索结果rlt。
进一步将上述prompt输入大语言模型,得到大语言模型输出的答复内容:
“根据您提供的数据,您的总胆红素、直接胆红素均明显升高,间接胆红素轻度升高,转氨酶也有所升高。这可能表示您的肝脏功能受到了一定程度的损害,最可能的原因是出现了梗阻性黄疸,表现为直接胆红素(结合胆红素)明显升高,在总胆红素中所占比例>30%,是因为胆红素在肝内转运、排泄障碍或同时有胆红素摄取、结合和排泄障碍引起。常见的原因有肝外胆管阻塞,如胆结石、胰头肿瘤;肝内胆管阻塞,如肝内胆管结石;肝内胆汁淤积等。请尽快就诊,医生可能会进一步询问你的症状体征,并完善肝脏彩超、CT、肝炎指标等检查,以便得到确切的诊断和治疗建议。”。
本申请实施例提供的知识问答方法,对于用户输入的问题文本,按照思维链式推理策略进行拆解,将问题文本拆解为若干个推理任务,进而在预配置的知识插件库中确定每一推理任务对应的知识插件,调用知识插件得到推理任务对应的知识搜索结果,其中知识插件库中的知识插件可以包括若干场景下的本地化知识资源和/或搜索引擎知识资源,进一步将问题文本和知识搜索结果拼接为提示指令送入大语言模型,得到大语言模型输出的针对问题文本的答复内容。由于本申请将用户的问题文本按照思维链式推理策略拆解为若干个推理任务,拆解后的各推理任务相比于原始的问题文本更加简单、易于理解,特别是对于复杂描述问题,通过拆解后得到的各个推理任务更加便于大语言模型理解,且该思维链式推理策略也更加符合大语言模型的处理逻辑,提升了对复杂描述问题的理解程度,进而有助于大语言模型给出正确的知识答复。
进一步地,本申请预先配置了多个知识插件,包括不同场景下的本地化知识资源和/或搜索引擎知识资源,对于一些垂直应用领域场景、开放域问答场景,通过调用相应的知识插件可以得到知识搜索结果,将该知识搜索结果与用户输入的问题文本拼接为prompt送入给大语言模型,可以使得大语言模型掌握相应的知识搜索结果,在此基础上能够输出更加准确的知识答复,使得知识问答的应用场景可以拓展到一些垂直应用领域场景及开放域应用场景。
本申请的一些实施例中,介绍了上述步骤S110、按照思维链式推理策略,将所述问题文本拆解为若干个推理任务的一种可选实现方式。
本实施例中,可以采用大语言模型来实现上述问题文本拆解的过程,具体地:
本实施例中可以预先配置问题拆解提示指令模板,该问题拆解提示指令模板包括问题文本槽,用于填充用户输入的问题文本。
问题拆解提示指令模板用于指示大语言模型将问题文本槽内的问题文本拆解为若干个推理任务。示例性的,问题拆解提示指令模板可以是:“请将以下问题<问题文本槽>,拆解为若干个推理任务”,或者是“请给出若要回答以下问题<问题文本槽>,可以拆解为哪些推理任务”。
进一步地,可以将用户当前输入的问题文本填充至问题拆解提示指令模板中的问题文本槽内,得到编辑后问题拆解提示指令prompt,并输入至大语言模型,得到大语言模型输出的对问题文本拆解后的若干个推理任务。
进一步可选的,为了使得大语言模型能够更准确的对问题文本进行拆分,本实施例中可以预先对大语言模型进行训练,训练阶段可以采用训练问题文本及对应的按照思维链式推理策略进行拆解后的若干个推理任务为训练数据,从而让大语言模型更好的学习到该思维链式推理策略的拆解方式。
本申请的一些实施例中,介绍了上述步骤S120、确定与所述推理任务对应的知识插件一种可选实现方式。
本实施例中,可以采用大语言模型来实现上述选择知识插件的过程,具体地:
本实施例中可以预先配置插件选择提示指令模板,该插件选择提示指令模板包括推理任务槽,用于填充对问题文本拆解后的推理任务。一个插件选择提示指令模板中包含的推理任务槽的数量可以是一个,用于填充一个推理任务。或者是,一个插件选择提示指令模板中包含的推理任务槽的数量可以是多个,用于分别填充同一问题文本拆解后的各个推理任务。本实施例中仅以一个插件选择提示指令模板中包含一个推理任务槽的情况为例进行说明。
插件选择提示指令模板用于提示大语言模型给出推理任务槽内的推理任务所依赖的知识插件,及将输入的问题文本转换为知识插件对应的输入格式要求。
这里,考虑到在确定了推理任务对应的知识插件之后,后续还需要调用相应的知识插件进行知识检索,而不同知识插件对检索输入文本的格式要求可能不同,为此,在设计插件选择提示指令模板时,在指示大语言模型给出推理任务所依赖的知识插件时,同时可以指示大语言模型将输入的问题文本转换为知识插件对应的输入格式要求,便于后续直接调用知识插件进行知识检索。
示例性的,插件选择提示指令模板可以是:“请判断以下这句话<推理任务槽>需要调用的插件,并将输入问题文本query转换为插件对应的输入格式要求”。
进一步地,可以将用户当前输入的问题文本拆解后的推理任务填充至插件选择提示指令模板中的推理任务槽内,得到编辑后插件选择提示指令prompt,并输入至大语言模型,得到大语言模型输出的每一推理任务所依赖的知识插件,及符合所述知识插件输入格式要求的检索输入文本。
如前文所述,可能存在某些推理任务不依赖任何知识插件,则对于此类推理任务,大语言模型可以输出相应的推理任务不依赖任何知识插件的答复。
进一步可选的,为了使得大语言模型能够更准确的选择推理任务所依赖的知识插件,以及给出符合知识插件输入格式要求的检索输入文本,本实施例中可以预先对大语言模型进行训练,训练阶段所使用的训练数据可以包括:对训练问题文本拆解后的推理任务、各推理任务所依赖的知识插件及按照该知识插件的输入格式要求对训练问题文本转换后的搜索输入文本。
在上述实施例的基础上,步骤S120中,调用推理任务依赖的知识插件得到推理任务对应的知识搜索结果的过程,可以包括:
对于每一推理任务:
调用推理任务所依赖的知识插件,并将大语言模型输出的符合所述知识插件输入格式要求的检索输入文本传递给所述知识插件,以便所述知识插件按照所述检索输入文本进行知识搜索,并返回知识搜索结果,作为推理任务对应的知识搜索结果。
在本申请的一些实施例中,步骤S120中得到的推理任务对应的知识搜索结果可能包含多条知识资源,示例如:一推理任务所依赖的知识插件有两个或以上,如前文示例的推理任务:“解读并搜索query中相关信息”,其所依赖的知识插件可以同时包括“指标解读”知识插件,以及“搜索引擎”知识插件。每一知识插件给出的知识搜索结果均包含一条以上的知识资源,则最终该推理任务对应的知识搜索结果包含多条知识资源。再比如,一推理任务所依赖的知识插件有一个,但该知识插件给出的知识搜索结果包含至少两条知识资源。
对于这种情况,步骤S130中,可以将每一推理任务对应的多条知识资源均拼接到提示指令prompt中。除此之外,本实施例中还提供了另一种方案:
在步骤S130之前,对于存在多条知识资源的推理任务,可以对该多条知识资源进行加工,包括但不限于筛选、整合等,进而得到推理任务对应的加工后知识资源,在步骤S130中可以将该加工后知识资源拼接到提示指令prompt中。
由于增加了对多条知识资源进行加工的过程,可以有效舍弃掉低质量的知识资源,以及通过整合可以避免重复知识资源的冗余,使得生成的提示指令prompt更加合理,能够更好的激发大语言模型输出准确的答复内容。
本申请的一些实施例中,介绍了上述实施例中对同一推理任务的多条知识资源进行加工,得到该推理任务对应的加工后知识资源的一种可选实现方式。
本实施例中,可以采用大语言模型来实现上述知识资源加工的过程,具体地:
本实施例中可以预先配置知识加工提示指令模板,该知识加工提示指令模板包括知识资源槽,用于填充待加工的多条知识资源。知识资源槽的数量可以是多个,分别填充不同的知识资源,或者,知识资源槽的数量也可以是一个,用于同时填充多个不同的知识资源,多个不同的知识资源之间可以通过分隔符隔开。本实施例中以一个知识资源槽中可以包含多条知识资源的情况为例进行说明。
知识加工提示指令模板用于提示大语言模型对所述知识资源槽内的各条知识资源进行加工处理给出加工后知识资源。
示例性的,知识加工提示指令模板可以是:“请对以下各条知识资源<知识资源槽>进行加工,给出加工后知识资源”。
进一步地,对于前述步骤中得到的同一推理任务的多条知识资源,可以将该多条知识资源填充至知识加工提示指令模板中的知识资源槽内,得到编辑后知识加工提示指令prompt,并输入至大语言模型,得到大语言模型输出的推理任务对应的加工后知识资源。
进一步可选的,为了使得大语言模型能够更准确的对多条知识资源进行加工,本实施例中可以预先对大语言模型进行训练,训练阶段所使用的训练数据可以包括:对于同一推理任务的多条知识资源及人工对多条知识资源加工后的知识资源。
在本申请的一些实施例中,进一步对前述步骤S130,将所述问题文本及所述知识搜索结果拼接为提示指令prompt的过程进行说明。
一种可选的情况下,可以仅将问题文本和知识搜索结果进行拼接,组合为提示指令prompt。
另一种可选的情况下,为了增强大语言模型对历史对话信息的关注,在生成回复内容时可以参考到历史对话信息(可以包括用户的历史提问及机器的历史回复),本实施例中还可以将问题文本之前的历史知识问答对话信息也拼接到提示指令prompt中,也即:
将用户输入的问题文本、问题文本之前的历史知识问答对话信息及知识搜索结果拼接为提示指令prompt。
在本申请的一些实施例中,考虑到用户输入的问题文本可能存在描述复杂的问题,为了更好的便于大语言模型理解用户的问题,本实施例中考虑可以结合对问题文本拆解后的各个推理任务,生成与问题文本对应的推理描述信息,该推理描述信息相对于用户输入的问题文本,其表达内容更加清晰、逻辑性更强,能够指示大语言模型按照思维链式推理来生成回复内容。同时,还可以使得生成的回复内容拟人化效果更好,内容更加清晰。
以问题文本query“我今天查的肝功能,总胆红素94.2ummol/L,直接胆红素68.2ummol/L,间接胆红素26ummol/L;几个转氨酶也明显升高;这个是怎么回事啊,可能是什么病导致的?”为例:
拆解后的推理任务包括:1、解读并搜索query中相关信息;2、分析可能的疾病;3、输出总结结果。基于该三个推理任务,生成的query对应的推理描述信息reasoning为:“结合指标解读和知识搜索结果,总结可能的病因”。
在本实施例的基础上,生成提示指令prompt时可以有如下两种方式:
1、将用户输入的问题文本、生成的推理描述信息及知识搜索结果拼接为提示指令prompt。
2、将用户输入的问题文本、问题文本之前的历史知识问答对话信息、生成的推理描述信息及知识搜索结果拼接为提示指令prompt。
本申请的一些实施例中,介绍了上述生成问题文本对应的推理描述信息的一种可选实现方式。
本实施例中,可以采用大语言模型来实现上述生成问题文本对应的推理描述信息的过程,具体地:
本实施例中可以预先配置推理描述提示指令模板,该推理描述提示指令模板包括推理任务槽,用于填充对问题文本拆解后的各个推理任务。
推理描述提示指令模板用于提示大语言模型基于所述推理任务槽内的各推理任务给出输入的问题文本对应的推理描述信息。
示例性的,推理描述提示指令模板可以是:“请基于query拆解后的各条推理任务<推理任务槽>,将query转换为推理描述信息”。
进一步地,可以将问题文本对应的各条推理任务填充至推理描述提示指令模板中的推理任务槽内,得到编辑后推理描述提示指令prompt,并输入至大语言模型,得到大语言模型输出的问题文本对应的推理描述信息。
进一步可选的,为了使得大语言模型能够更准确的生成推理描述信息,本实施例中可以预先对大语言模型进行训练,训练阶段所使用的训练数据可以包括:对训练问题文本拆解后的推理任务,及训练问题文本对应的推理描述信息。
需要说明的是,本申请实施例的知识问答方案中,在生成用户的问题文本对应的答复内容时,可以是调用一个或多个知识插件,具体根据用户输入的问题文本而定。参照图2,其示例了一种医疗问答场景下,调用多个知识插件进行知识问答的流程示意图。
获取到用户的问题文本“我今天查的肝功能,总胆红素94.2ummol/L,直接胆红素68.2ummol/L,间接胆红素26ummol/L;几个转氨酶也明显升高;这个是怎么回事?可能是什么病导致的?”,与历史对话一起输入到大语言模型LLM,利用LLM对问题文本进行拆解,得到推理任务:1、解读并搜索query中相关信息;2、分析可能疾病;3、输出总结结果。
再次调用LLM,在预配置的各个知识插件中,确定每一推理任务所依赖的知识插件,选择知识插件,并调用相应知识插件得到知识搜索结果。以图2所示,第1个推理任务,通过LLM所得到的该推理任务依赖的知识插件为“指标解读”知识插件和“Google”搜索引擎知识插件,具体知识插件的名字API Name、输入参数APIParameter、描述API Description可以参照图2中所示。进一步通过LLM可以得到符合各知识插件的输入格式要求的搜索输入文本,如符合“指标解读”输入格式要求的API Parameter:{总胆红素:94.2ummol/L,直接胆红素:68.2ummol/L,间接胆红素26ummol/L};符合“Google”输入格式要求的API Parameter:{input:“总胆红素94.2ummol/L直接胆红素68.2ummol/L间接胆红素26ummol/L转氨酶升高可能病因“}。LLM可以按照API Parameter调用相应的知识插件得到知识搜索结果APIResult,如图2所示。
最后生成提示指令prompt,其组成包括以下几部分:用户输入的问题文本query、历史对话context(图2中示例的为历史对话为空的情况)、指令部分command,该指令部分command可以包括问题文本的推理描述信息reasoning,以及各推理任务对应的知识搜索结果。
下面对本申请实施例提供的知识问答装置进行描述,下文描述的知识问答装置与上文描述的知识问答方法可相互对应参照。
参见图3,图3为本申请实施例公开的一种知识问答装置结构示意图。
如图3所示,该装置可以包括:
输入信息获取单元11,用于获取用户输入的问题文本,所述问题文本用于描述用户提出的问题;
问题拆解单元12,用于按照思维链式推理策略,将所述问题文本拆解为若干个推理任务;
知识搜索单元13,用于确定与所述推理任务对应的知识插件,并调用所述知识插件得到推理任务对应的知识搜索结果,其中,所述知识插件包括若干场景下的本地化知识资源和/或搜索引擎知识资源;
问答交互单元14,用于将所述问题文本及所述知识搜索结果拼接为提示指令prompt,输入至预配置的大语言模型,得到大语言模型输出的针对所述问题文本的答复内容。
可选的,上述问题拆解单元按照思维链式推理策略,将所述问题文本拆解为若干推理任务的过程,可以包括:
获取预配置的问题拆解提示指令模板,所述问题拆解提示指令模板包括问题文本槽,所述问题拆解提示指令模板用于指示大语言模型将所述问题文本槽内的问题文本拆解为若干个推理任务;
将所述问题文本填充至所述问题文本槽,得到编辑后问题拆解提示指令prompt;
将所述编辑后问题拆解提示指令prompt输入至所述大语言模型,得到大语言模型输出的对所述问题文本拆解后的若干个推理任务;
其中,所述大语言模型在训练阶段,采用训练问题文本及对应的按照思维链式推理策略进行拆解后的若干个推理任务为训练数据进行训练。
可选的,上述知识搜索单元确定与所述推理任务对应的知识插件的过程,可以包括:
获取预配置的插件选择提示指令模板,所述插件选择提示指令模板包括推理任务槽,所述插件选择提示指令模板用于提示大语言模型给出所述推理任务槽内的推理任务所依赖的知识插件,及将输入的问题文本转换为所述知识插件对应的输入格式要求;
将拆解后的每一推理任务分别填充至所述推理任务槽,得到每一推理任务对应的编辑后插件选择提示指令prompt;
将所述编辑后插件选择提示指令prompt输入至所述大语言模型,得到大语言模型输出的每一推理任务所依赖的知识插件,及符合所述知识插件输入格式要求的检索输入文本;
其中,所述大语言模型在训练阶段所使用的训练数据包括:对训练问题文本拆解后的推理任务、各推理任务所依赖的知识插件及按照该知识插件的输入格式要求对训练问题文本转换后的搜索输入文本。
可选的,上述知识搜索单元调用所述知识插件得到推理任务对应的知识搜索结果的过程,可以包括:
对于每一推理任务:
调用推理任务所依赖的知识插件,并将得到的符合所述知识插件输入格式要求的检索输入文本传递给所述知识插件,以便所述知识插件按照所述检索输入文本进行知识搜索,并返回知识搜索结果,作为推理任务对应的知识搜索结果。
可选的,上述问答交互单元将所述问题文本及所述知识搜索结果拼接为提示指令prompt的过程,可以包括:
将所述问题文本、所述问题文本之前的历史知识问答对话信息及所述知识搜索结果拼接为提示指令prompt。
可选的,本申请的装置还可以包括:
推理描述生成单元,用于结合所述问题文本拆解后的若干个推理任务,生成所述问题文本对应的推理描述信息;在此基础上,上述问答交互单元将所述问题文本及所述知识搜索结果拼接为提示指令prompt的过程,可以包括:
将所述问题文本、所述推理描述信息及所述知识搜索结果拼接为提示指令prompt;
或,
将所述问题文本、所述问题文本之前的历史知识问答对话信息、所述推理描述信息及所述知识搜索结果拼接为提示指令prompt。
可选的,上述推理描述生成单元结合所述问题文本拆解后的若干个推理任务,生成所述问题文本对应的推理描述信息的过程,可以包括:
获取预配置的推理描述提示指令模板,所述推理描述提示指令模板包括推理任务槽,所述推理描述提示指令模板用于提示大语言模型基于所述推理任务槽内的各推理任务给出输入的问题文本对应的推理描述信息;
将拆解后的各个推理任务填充至所述推理任务槽,得到编辑后推理描述提示指令prompt;
将所述编辑后推理描述提示指令prompt输入至所述大语言模型,得到大语言模型输出的所述问题文本对应的推理描述信息;
其中,所述大语言模型在训练阶段所使用的训练数据包括:对训练问题文本拆解后的推理任务,及训练问题文本对应的推理描述信息。
可选的,本申请的装置还可以包括:
知识资源加工单元,用于在问答交互单元将所述问题文本及所述知识搜索结果拼接为提示指令prompt之前,针对同一推理任务对应的知识搜索结果包括多条知识资源的情况,对所述多条知识资源进行加工,得到该推理任务对应的加工后知识资源,所述加工操作包括筛选、整合中的至少一项。
可选的,上述知识资源加工单元对所述多条知识资源进行加工,得到该推理任务对应的加工后知识资源的过程,可以包括:
获取预配置的知识加工提示指令模板,所述知识加工提示指令模板包括知识资源槽,所述知识加工提示指令模板用于提示大语言模型对所述知识资源槽内的各条知识资源进行加工处理给出加工后知识资源;
将所述多条知识资源填充至所述知识资源槽,得到编辑后知识加工提示指令prompt;
将所述编辑后知识加工提示指令prompt输入至所述大语言模型,得到大语言模型输出的加工后知识资源;
其中,所述大语言模型在训练阶段所使用的训练数据包括:对于同一推理任务的多条知识资源及人工对多条知识资源加工后的知识资源。
本申请实施例提供的知识问答装置可应用于知识问答设备,如手机、电脑、学习机、智能机器人等。可选的,图4示出了知识问答设备的硬件结构框图,参照图4,知识问答设备的硬件结构可以包括:至少一个处理器1,至少一个通信接口2,至少一个存储器3和至少一个通信总线4;
在本申请实施例中,处理器1、通信接口2、存储器3、通信总线4的数量为至少一个,且处理器1、通信接口2、存储器3通过通信总线4完成相互间的通信;
处理器1可能是一个中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路等;
存储器3可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatilememory)等,例如至少一个磁盘存储器;
其中,存储器存储有程序,处理器可调用存储器存储的程序,所述程序用于:
获取用户输入的问题文本,所述问题文本用于描述用户提出的问题;
按照思维链式推理策略,将所述问题文本拆解为若干个推理任务;
确定与所述推理任务对应的知识插件,并调用所述知识插件得到推理任务对应的知识搜索结果,其中,所述知识插件包括若干场景下的本地化知识资源和/或搜索引擎知识资源;
将所述问题文本及所述知识搜索结果拼接为提示指令prompt,输入至预配置的大语言模型,得到大语言模型输出的针对所述问题文本的答复内容。
可选的,所述程序的细化功能和扩展功能可参照上文描述。
本申请实施例还提供一种存储介质,该存储介质可存储有适于处理器执行的程序,所述程序用于:
获取用户输入的问题文本,所述问题文本用于描述用户提出的问题;
按照思维链式推理策略,将所述问题文本拆解为若干个推理任务;
确定与所述推理任务对应的知识插件,并调用所述知识插件得到推理任务对应的知识搜索结果,其中,所述知识插件包括若干场景下的本地化知识资源和/或搜索引擎知识资源;
将所述问题文本及所述知识搜索结果拼接为提示指令prompt,输入至预配置的大语言模型,得到大语言模型输出的针对所述问题文本的答复内容。
可选的,所述程序的细化功能和扩展功能可参照上文描述。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间可以根据需要进行组合,且相同相似部分互相参见即可。
对所公开的实施例的上述说明,使本领域技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (12)
1.一种知识问答方法,其特征在于,包括:
获取用户输入的问题文本,所述问题文本用于描述用户提出的问题;
按照思维链式推理策略,将所述问题文本拆解为若干个推理任务;
确定与所述推理任务对应的知识插件,并调用所述知识插件得到推理任务对应的知识搜索结果,其中,所述知识插件包括若干场景下的本地化知识资源和/或搜索引擎知识资源;
将所述问题文本及所述知识搜索结果拼接为提示指令prompt,输入至预配置的大语言模型,得到大语言模型输出的针对所述问题文本的答复内容。
2.根据权利要求1所述的方法,其特征在于,所述按照思维链式推理策略,将所述问题文本拆解为若干推理任务,包括:
获取预配置的问题拆解提示指令模板,所述问题拆解提示指令模板包括问题文本槽,所述问题拆解提示指令模板用于指示大语言模型将所述问题文本槽内的问题文本拆解为若干个推理任务;
将所述问题文本填充至所述问题文本槽,得到编辑后问题拆解提示指令prompt;
将所述编辑后问题拆解提示指令prompt输入至所述大语言模型,得到大语言模型输出的对所述问题文本拆解后的若干个推理任务;
其中,所述大语言模型在训练阶段,采用训练问题文本及对应的按照思维链式推理策略进行拆解后的若干个推理任务为训练数据进行训练。
3.根据权利要求1所述的方法,其特征在于,确定与所述推理任务对应的知识插件,包括:
获取预配置的插件选择提示指令模板,所述插件选择提示指令模板包括推理任务槽,所述插件选择提示指令模板用于提示大语言模型给出所述推理任务槽内的推理任务所依赖的知识插件,及将输入的问题文本转换为所述知识插件对应的输入格式要求;
将拆解后的每一推理任务分别填充至所述推理任务槽,得到每一推理任务对应的编辑后插件选择提示指令prompt;
将所述编辑后插件选择提示指令prompt输入至所述大语言模型,得到大语言模型输出的每一推理任务所依赖的知识插件,及符合所述知识插件输入格式要求的检索输入文本;
其中,所述大语言模型在训练阶段所使用的训练数据包括:对训练问题文本拆解后的推理任务、各推理任务所依赖的知识插件及按照该知识插件的输入格式要求对训练问题文本转换后的搜索输入文本。
4.根据权利要求3所述的方法,其特征在于,调用所述知识插件得到推理任务对应的知识搜索结果的过程,包括:
对于每一推理任务:
调用推理任务所依赖的知识插件,并将得到的符合所述知识插件输入格式要求的检索输入文本传递给所述知识插件,以便所述知识插件按照所述检索输入文本进行知识搜索,并返回知识搜索结果,作为推理任务对应的知识搜索结果。
5.根据权利要求1所述的方法,其特征在于,将所述问题文本及所述知识搜索结果拼接为提示指令prompt的过程,包括:
将所述问题文本、所述问题文本之前的历史知识问答对话信息及所述知识搜索结果拼接为提示指令prompt。
6.根据权利要求1所述的方法,其特征在于,还包括:
结合所述问题文本拆解后的若干个推理任务,生成所述问题文本对应的推理描述信息;
则将所述问题文本及所述知识搜索结果拼接为提示指令prompt的过程,包括:
将所述问题文本、所述推理描述信息及所述知识搜索结果拼接为提示指令prompt;
或,
将所述问题文本、所述问题文本之前的历史知识问答对话信息、所述推理描述信息及所述知识搜索结果拼接为提示指令prompt。
7.根据权利要求6所述的方法,其特征在于,结合所述问题文本拆解后的若干个推理任务,生成所述问题文本对应的推理描述信息,包括:
获取预配置的推理描述提示指令模板,所述推理描述提示指令模板包括推理任务槽,所述推理描述提示指令模板用于提示大语言模型基于所述推理任务槽内的各推理任务给出输入的问题文本对应的推理描述信息;
将拆解后的各个推理任务填充至所述推理任务槽,得到编辑后推理描述提示指令prompt;
将所述编辑后推理描述提示指令prompt输入至所述大语言模型,得到大语言模型输出的所述问题文本对应的推理描述信息;
其中,所述大语言模型在训练阶段所使用的训练数据包括:对训练问题文本拆解后的推理任务,及训练问题文本对应的推理描述信息。
8.根据权利要求1所述的方法,其特征在于,在将所述问题文本及所述知识搜索结果拼接为提示指令prompt之前,还包括:
若一推理任务对应的知识搜索结果包括多条知识资源,则对所述多条知识资源进行加工,得到该推理任务对应的加工后知识资源,所述加工操作包括筛选、整合中的至少一项。
9.根据权利要求8所述的方法,其特征在于,对所述多条知识资源进行加工,得到该推理任务对应的加工后知识资源的过程,包括:
获取预配置的知识加工提示指令模板,所述知识加工提示指令模板包括知识资源槽,所述知识加工提示指令模板用于提示大语言模型对所述知识资源槽内的各条知识资源进行加工处理给出加工后知识资源;
将所述多条知识资源填充至所述知识资源槽,得到编辑后知识加工提示指令prompt;
将所述编辑后知识加工提示指令prompt输入至所述大语言模型,得到大语言模型输出的加工后知识资源;
其中,所述大语言模型在训练阶段所使用的训练数据包括:对于同一推理任务的多条知识资源及人工对多条知识资源加工后的知识资源。
10.一种知识问答装置,其特征在于,包括:
输入信息获取单元,用于获取用户输入的问题文本,所述问题文本用于描述用户提出的问题;
问题拆解单元,用于按照思维链式推理策略,将所述问题文本拆解为若干个推理任务;
知识搜索单元,用于确定与所述推理任务对应的知识插件,并调用所述知识插件得到推理任务对应的知识搜索结果,其中,所述知识插件包括若干场景下的本地化知识资源和/或搜索引擎知识资源;
问答交互单元,用于将所述问题文本及所述知识搜索结果拼接为提示指令prompt,输入至预配置的大语言模型,得到大语言模型输出的针对所述问题文本的答复内容。
11.一种知识问答设备,其特征在于,包括:存储器和处理器;
所述存储器,用于存储程序;
所述处理器,用于执行所述程序,实现如权利要求1~9中任一项所述的知识问答方法的各个步骤。
12.一种存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,实现如权利要求1~9中任一项所述的知识问答方法的各个步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310506346.8A CN116561278A (zh) | 2023-05-05 | 2023-05-05 | 知识问答方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310506346.8A CN116561278A (zh) | 2023-05-05 | 2023-05-05 | 知识问答方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116561278A true CN116561278A (zh) | 2023-08-08 |
Family
ID=87503021
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310506346.8A Pending CN116561278A (zh) | 2023-05-05 | 2023-05-05 | 知识问答方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116561278A (zh) |
Cited By (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116737912A (zh) * | 2023-08-15 | 2023-09-12 | 北京中关村科金技术有限公司 | 复杂问题处理方法、装置、设备及介质 |
CN116756178A (zh) * | 2023-08-22 | 2023-09-15 | 北京至臻云智能科技有限公司 | 一种基于大语言生成模型的审计方法、系统和审计机器人 |
CN116822633A (zh) * | 2023-08-31 | 2023-09-29 | 清华大学 | 基于自我认知的模型推理方法、装置及电子设备 |
CN116821308A (zh) * | 2023-08-22 | 2023-09-29 | 浙江口碑网络技术有限公司 | 生成方法、模型的训练方法、设备及存储介质 |
CN116992006A (zh) * | 2023-09-26 | 2023-11-03 | 武汉益模科技股份有限公司 | 一种大语言模型驱动的链式自然语言交互方法与系统 |
CN117056494A (zh) * | 2023-09-28 | 2023-11-14 | 腾讯科技(深圳)有限公司 | 开放域问答的方法、装置、电子设备和计算机存储介质 |
CN117076649A (zh) * | 2023-10-13 | 2023-11-17 | 卓世科技(海南)有限公司 | 一种基于大模型思维链的应急信息查询方法及装置 |
CN117194730A (zh) * | 2023-11-06 | 2023-12-08 | 北京枫清科技有限公司 | 一种意图识别和问答方法、装置、电子设备及存储介质 |
CN117235220A (zh) * | 2023-09-15 | 2023-12-15 | 之江实验室 | 基于图数据库知识增强的可扩展大语言模型调用方法和装置 |
CN117273868A (zh) * | 2023-11-20 | 2023-12-22 | 浙江口碑网络技术有限公司 | 店铺推荐方法、装置、电子设备与存储介质 |
CN117272941A (zh) * | 2023-09-21 | 2023-12-22 | 北京百度网讯科技有限公司 | 数据处理方法、装置、设备、计算机可读存储介质及产品 |
CN117290484A (zh) * | 2023-10-10 | 2023-12-26 | 深圳市明睿数据科技有限公司 | 一种用于汽车故障定位及维修建议的智能问答系统及方法 |
CN117370638A (zh) * | 2023-12-08 | 2024-01-09 | 中国科学院空天信息创新研究院 | 思维图提示增强的基础模型任务分解与调度方法及装置 |
CN117421415A (zh) * | 2023-12-18 | 2024-01-19 | 北京海纳数聚科技有限公司 | 数据处理方法、装置、电子设备及存储介质 |
CN117520523A (zh) * | 2023-12-29 | 2024-02-06 | 中邮消费金融有限公司 | 数据处理方法、装置、设备及存储介质 |
CN117609444A (zh) * | 2023-11-08 | 2024-02-27 | 天讯瑞达通信技术有限公司 | 一种基于大模型的搜索问答方法 |
CN117633174A (zh) * | 2023-11-22 | 2024-03-01 | 北京万物可知技术有限公司 | 一种基于多个大模型对话的表决共识系统 |
CN117763128A (zh) * | 2024-01-18 | 2024-03-26 | 杭州阿里云飞天信息技术有限公司 | 人机交互的数据处理方法、服务器、存储介质和程序产品 |
CN117763128B (zh) * | 2024-01-18 | 2024-06-04 | 杭州阿里云飞天信息技术有限公司 | 人机交互的数据处理方法、服务器、存储介质和程序产品 |
-
2023
- 2023-05-05 CN CN202310506346.8A patent/CN116561278A/zh active Pending
Cited By (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116737912A (zh) * | 2023-08-15 | 2023-09-12 | 北京中关村科金技术有限公司 | 复杂问题处理方法、装置、设备及介质 |
CN116737912B (zh) * | 2023-08-15 | 2023-10-20 | 北京中关村科金技术有限公司 | 复杂问题处理方法、装置、设备及介质 |
CN116756178A (zh) * | 2023-08-22 | 2023-09-15 | 北京至臻云智能科技有限公司 | 一种基于大语言生成模型的审计方法、系统和审计机器人 |
CN116821308A (zh) * | 2023-08-22 | 2023-09-29 | 浙江口碑网络技术有限公司 | 生成方法、模型的训练方法、设备及存储介质 |
CN116821308B (zh) * | 2023-08-22 | 2023-12-19 | 浙江口碑网络技术有限公司 | 生成方法、模型的训练方法、设备及存储介质 |
CN116822633A (zh) * | 2023-08-31 | 2023-09-29 | 清华大学 | 基于自我认知的模型推理方法、装置及电子设备 |
CN116822633B (zh) * | 2023-08-31 | 2023-12-26 | 清华大学 | 基于自我认知的模型推理方法、装置及电子设备 |
CN117235220A (zh) * | 2023-09-15 | 2023-12-15 | 之江实验室 | 基于图数据库知识增强的可扩展大语言模型调用方法和装置 |
CN117235220B (zh) * | 2023-09-15 | 2024-03-15 | 之江实验室 | 基于图数据库知识增强的可扩展大语言模型调用装置 |
CN117272941A (zh) * | 2023-09-21 | 2023-12-22 | 北京百度网讯科技有限公司 | 数据处理方法、装置、设备、计算机可读存储介质及产品 |
CN116992006B (zh) * | 2023-09-26 | 2024-01-12 | 武汉益模科技股份有限公司 | 一种大语言模型驱动的链式自然语言交互方法与系统 |
CN116992006A (zh) * | 2023-09-26 | 2023-11-03 | 武汉益模科技股份有限公司 | 一种大语言模型驱动的链式自然语言交互方法与系统 |
CN117056494A (zh) * | 2023-09-28 | 2023-11-14 | 腾讯科技(深圳)有限公司 | 开放域问答的方法、装置、电子设备和计算机存储介质 |
CN117056494B (zh) * | 2023-09-28 | 2024-01-23 | 腾讯科技(深圳)有限公司 | 开放域问答的方法、装置、电子设备和计算机存储介质 |
CN117290484A (zh) * | 2023-10-10 | 2023-12-26 | 深圳市明睿数据科技有限公司 | 一种用于汽车故障定位及维修建议的智能问答系统及方法 |
CN117076649A (zh) * | 2023-10-13 | 2023-11-17 | 卓世科技(海南)有限公司 | 一种基于大模型思维链的应急信息查询方法及装置 |
CN117076649B (zh) * | 2023-10-13 | 2024-01-26 | 卓世科技(海南)有限公司 | 一种基于大模型思维链的应急信息查询方法及装置 |
CN117194730A (zh) * | 2023-11-06 | 2023-12-08 | 北京枫清科技有限公司 | 一种意图识别和问答方法、装置、电子设备及存储介质 |
CN117194730B (zh) * | 2023-11-06 | 2024-02-20 | 北京枫清科技有限公司 | 一种意图识别和问答方法、装置、电子设备及存储介质 |
CN117609444A (zh) * | 2023-11-08 | 2024-02-27 | 天讯瑞达通信技术有限公司 | 一种基于大模型的搜索问答方法 |
CN117273868A (zh) * | 2023-11-20 | 2023-12-22 | 浙江口碑网络技术有限公司 | 店铺推荐方法、装置、电子设备与存储介质 |
CN117633174A (zh) * | 2023-11-22 | 2024-03-01 | 北京万物可知技术有限公司 | 一种基于多个大模型对话的表决共识系统 |
CN117370638A (zh) * | 2023-12-08 | 2024-01-09 | 中国科学院空天信息创新研究院 | 思维图提示增强的基础模型任务分解与调度方法及装置 |
CN117370638B (zh) * | 2023-12-08 | 2024-05-07 | 中国科学院空天信息创新研究院 | 思维图提示增强的基础模型任务分解与调度方法及装置 |
CN117421415A (zh) * | 2023-12-18 | 2024-01-19 | 北京海纳数聚科技有限公司 | 数据处理方法、装置、电子设备及存储介质 |
CN117520523A (zh) * | 2023-12-29 | 2024-02-06 | 中邮消费金融有限公司 | 数据处理方法、装置、设备及存储介质 |
CN117520523B (zh) * | 2023-12-29 | 2024-03-29 | 中邮消费金融有限公司 | 数据处理方法、装置、设备及存储介质 |
CN117763128A (zh) * | 2024-01-18 | 2024-03-26 | 杭州阿里云飞天信息技术有限公司 | 人机交互的数据处理方法、服务器、存储介质和程序产品 |
CN117763128B (zh) * | 2024-01-18 | 2024-06-04 | 杭州阿里云飞天信息技术有限公司 | 人机交互的数据处理方法、服务器、存储介质和程序产品 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN116561278A (zh) | 知识问答方法、装置、设备及存储介质 | |
Robillard et al. | On-demand developer documentation | |
Motta et al. | Ontology-driven document enrichment: principles, tools and applications | |
Braun et al. | Ontology Maturing: a Collaborative Web 2.0 Approach to Ontology Engineering. | |
Polk et al. | Cognitive modeling | |
US7860815B1 (en) | Computer knowledge representation format, system, methods, and applications | |
Coronado et al. | A cognitive assistant for learning java featuring social dialogue | |
Aghaee et al. | End-user development of mashups with naturalmash | |
US20140087356A1 (en) | Method and apparatus for providing a critical thinking exercise | |
JP2001519559A (ja) | 動的に生成される質問と回答の選択肢を用いたコンピューターによる決定管理システム | |
Brna et al. | Prolog programming techniques | |
Maruch et al. | Python for dummies | |
Turner | Understanding programming languages | |
Siikarla et al. | Transformations have to be developed ReST assured | |
Laleau et al. | A rigorous metamodel for UML static conceptual modelling of information systems | |
Rao et al. | AI for Low-Code for AI | |
Lionis | Ontology Generation with the help of Chatbot | |
Milliken | Python Projects for Beginners | |
Alshammry | Scaling the development of large ontologies: identitas and hypernormalization | |
Akrin et al. | A Natural Language Interface for Querying Linked Data | |
Håkansson et al. | The KANAL-system, an intelligent rule editor supporting the knowledge acquisition process | |
Mészáros et al. | Rapid prototyping of application-oriented natural language interfaces | |
Munarko | Smart Searching for the Physiome Project | |
Krones | A System for Rapid Development of Large-Scale Rule Bases for Template-Based NLG for Conversational Agents | |
zur Erzeugung | User aiding Web Application for the Generation, Manipulation and Aggregation of RDF Data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |