CN117787421A - 一种基于思维链确定问题答案的方法和装置、电子设备 - Google Patents

一种基于思维链确定问题答案的方法和装置、电子设备 Download PDF

Info

Publication number
CN117787421A
CN117787421A CN202410201337.2A CN202410201337A CN117787421A CN 117787421 A CN117787421 A CN 117787421A CN 202410201337 A CN202410201337 A CN 202410201337A CN 117787421 A CN117787421 A CN 117787421A
Authority
CN
China
Prior art keywords
model
sample data
plan
solving
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202410201337.2A
Other languages
English (en)
Other versions
CN117787421B (zh
Inventor
陈科海
张少卿
白雪峰
赵铁军
张民
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harbin Institute Of Technology shenzhen Shenzhen Institute Of Science And Technology Innovation Harbin Institute Of Technology
Original Assignee
Harbin Institute Of Technology shenzhen Shenzhen Institute Of Science And Technology Innovation Harbin Institute Of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harbin Institute Of Technology shenzhen Shenzhen Institute Of Science And Technology Innovation Harbin Institute Of Technology filed Critical Harbin Institute Of Technology shenzhen Shenzhen Institute Of Science And Technology Innovation Harbin Institute Of Technology
Priority to CN202410201337.2A priority Critical patent/CN117787421B/zh
Publication of CN117787421A publication Critical patent/CN117787421A/zh
Application granted granted Critical
Publication of CN117787421B publication Critical patent/CN117787421B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Electrically Operated Instructional Devices (AREA)

Abstract

本发明公开了一种基于思维链确定问题答案的方法和装置、电子设备,属于人工智能技术领域,所述方法包括:获取待解答问题以及多个样本数据,其中,每个所述样本数据包括:一个问题和所述问题对应的第一求解计划;将所述待解答问题与多个所述样本数据进行拼接后输入模型,得到待解答问题对应的第二求解计划;控制所述模型按照所述第二求解计划中的每个步骤执行求解,直至完成最后一个步骤,得到目标答案。本申请提供的基于思维链确定问题答案的方案,既能够赋予思维链纠错能力,又可以人为或者模型自动干预对第二求解计划中的第一步骤进行修正。

Description

一种基于思维链确定问题答案的方法和装置、电子设备
技术领域
本发明涉及人工智能技术领域,尤其涉及一种基于思维链确定问题答案的方法和装置、电子设备。
背景技术
思维链是通过提示的方式让模型像人类一样思考的一种形式,它会解释从结论1到结论2之间的逻辑关系。在将思维链技术应用到大型模型的推理过程中,常常会引入一些限制以增强模型的推理能力和结果的多样性。其中一种方法为如附图1中思维链应用示例所示多样生成模式,模型可产生多个可能的输出,而不是仅限于单一的答案。这种做法有助于应对复杂问题的多样性和不确定性。通过允许模型生成多个可能的结果,用户能够更全面地考虑问题,提高模型的覆盖范围和解决问题的灵活性。在这些多个输出中,可以通过各种评估标准或投票机制选择出最常见或最合适的结果作为最终答案,从而增强结果的可信度和准确性。
但思维链仍存在如下缺点:
缺点一、无纠错能力,尽管思维链能够模仿人类思维,并提供推理过程,但它仍然容易出现错误。这些错误可能在推理的某个环节产生,而模型本身可能无法察觉到这些错误。纠正这些错误需要耗费大量时间和精力,因为要逐步检查推理链的每一步,找出潜在的错误点,这对于人类来说确实是一项耗时且繁琐的任务。
缺点二:具有不可干预性,思维链的形成是一个连续的过程,一旦模型接收到输入并开始生成思维链,通常情况下是无法在中途进行外部干预的。即使在推理过程中出现了错误,由于无法实时干预,错误可能会在思维链中逐步传递,最终导致不正确的结果。这种不可干预性限制了用户对错误的及时修正,增加了错误在思维链中传播的风险。
发明内容
本发明实施例的目的是提供一种基于思维链确定问题答案的方法和装置、电子设备,能够解决现有技术中存在的思维链无纠错能力、不可干预的问题。
为解决上述技术问题,本发明提供如下技术方案:
本发明实施例提供了一种基于思维链确定问题答案的方法,其中,该方法包括:
获取待解答问题以及多个样本数据,其中,每个所述样本数据包括:一个问题和所述问题对应的第一求解计划;
将所述待解答问题与多个所述样本数据进行拼接后输入模型,得到待解答问题对应的第二求解计划;
控制所述模型按照所述第二求解计划中的每个步骤对应的修正步骤执行求解,直至完成最后一个步骤,得到目标答案。
可选地,将所述待解答问题与多个所述样本数据进行拼接后输入模型,得到待解答问题对应的第一求解计划的步骤,包括:
将所述多个样本数据中的问题、求解计划顺次拼接,得到第一文本;
将所述待解答问题拼接在所述第一文本末尾,得到第二文本;
将所述第二文本输入模型中,得到模型输出的所述待解答问题对应的第二求解计划。
可选地,获取待解答问题以及多个样本数据的步骤,包括:
从预先标注的大量历史样本数据中,确定所述待解答问题对应的候选样本数据;
从所述候选样本数据中随机选择所述多个样本数据。
可选地,所述控制所述模型按照所述第二求解计划中的每个步骤对应的修正步骤执行求解,直至完成最后一个步骤,得到目标答案的步骤,包括:
控制所述模型从所述第二求解计划中提取排序最前的未执行第一步骤;
将所述第二求解计划中所述第一步骤的各前序步骤对应的答案、各前序步骤,按序接成第三文本;
将所述第三文本拼接在所述第一步骤之后,输入所述模型得到所述第一步骤对应的第一答案;
判断所述第二求解计划中是否包含未执行的第一步骤;
若包含,返回执行所述控制所述模型从所述第二求解计划中提取排序最前的未执行第一步骤的操作;
若不包含,从所述第一答案中筛选目标答案。
可选地,将所述第三文本拼接在所述第一步骤之后,输入所述模型得到所述第一步骤对应的第一答案的步骤,包括:
依据多个所述样本数据中的问题信息和所述第二求解计划中所述第一步骤的前序步骤对应的答案信息,判断所述第一步骤是否需要修正;
若所述第一步骤需要修正,则对所述第一步骤进行修正处理,得到修正后的第一步骤;
将所述第三文本拼接在所述修正后的第一步骤之后,输入所述模型得到所述第一步骤对应的第一答案。
本发明实施例还提供了一种基于思维链确定问题答案的装置,其中,该装置包括:
获取模块,用于获取待解答问题以及多个样本数据,其中,每个所述样本数据包括:一个问题和所述问题对应的第一求解计划;
计划确定模块,用于将所述待解答问题与多个所述样本数据进行拼接后输入模型,得到待解答问题对应的第二求解计划;
控制模块,用于控制所述模型按照所述第二求解计划中的每个步骤对应的修正步骤执行求解,直至完成最后一个步骤,得到目标答案。
可选地,所述计划确定模块包括:
第一子模块,用于将所述多个样本数据中的问题、求解计划顺次拼接,得到第一文本;
第二子模块,用于将所述待解答问题拼接在所述第一文本末尾,得到第二文本;
第三子模块,用于将所述第二文本输入模型中,得到模型输出的所述待解答问题对应的第二求解计划。
可选地,所述获取模块包括:
第四子模块,用于从预先标注的大量历史样本数据中,确定所述待解答问题对应的候选样本数据;
第五子模块,用于从所述候选样本数据中随机选择所述多个样本数据。
可选地,所述控制模块包括:
第六子模块,用于控制所述模型从所述第二求解计划中提取排序最前的未执行第一步骤;
第七子模块,用于将所述第二求解计划中所述第一步骤的各前序步骤对应的答案、各前序步骤,按序接成第三文本;
第八子模块,用于将所述第三文本拼接在所述第一步骤之后,输入所述模型得到所述第一步骤对应的第一答案;
第九子模块,用于判断所述第二求解计划中是否包含未执行的第一步骤;
第十子模块,用于若包含,返回执行所述第六子模块;若不包含,从所述第一答案中筛选目标答案。
可选地,所述第八子模块具体用于:
依据多个所述样本数据中的问题信息和所述第二求解计划中所述第一步骤的前序步骤对应的答案信息,判断所述第一步骤是否需要修正;
若所述第一步骤需要修正,则对所述第一步骤进行修正处理,得到修正后的第一步骤;
将所述第三文本拼接在所述修正后的第一步骤之后,输入所述模型得到所述第一步骤对应的第一答案。
本发明实施例提供了一种电子设备,该电子设备包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现上述任意一种基于思维链确定问题答案的方法的步骤。
本发明实施例提供了一种可读存储介质,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现上述任意一种基于思维链确定问题答案的方法的步骤。
本申请实施例提供的基于思维链确定问题答案的方案,获取待解答问题以及多个样本数据,每个样本数据包括:一个问题和该问题对应的第一求解计划;
将待解答问题与多个样本数据进行拼接后输入模型,得到待解答问题对应的第二求解计划;控制模型按照第二求解计划中的每个步骤对应的修正步骤执行求解,直至完成最后一个步骤,得到目标答案。一方面,首先确定第二求解计划,按照第二求解计划逐步执行的方式可以显著提升大型模型的纠错能力,降低人工干预的复杂度,从而有效提高问题解决的准确性。不仅如此,还可以更系统地引导模型进行推理和决策,有效应对各种复杂情况,为问题求解提供更可靠的答案;第二方面,对第二求解计划种的各第一步骤进行检测修正,有助于在模型生成答案之前识别潜在的错误或不确定性,提高模型所确定的问题答案的准确性。可见,本申请实施例提供的基于思维链确定问题答案的方案,既能够赋予思维链纠错能力,又可以人为或者模型自动干预对第二求解计划中的第一步骤进行修正。
附图说明
图1是表示思维链应用示例;
图2是样本问题与答案样例;
图3是表示本申请实施例的一种基于思维链的问题答案确定方法的步骤流程图;
图4是表示本申请实施例的一种基于思维链的问题答案确定方法的步骤流程图;
图5是表示本申请实施例的一种基于思维链的问题答案确定装置的结构框图。
具体实施方式
为使本发明要解决的技术问题、技术方案和优点更加清楚,下面将结合附图及具体实施例进行详细描述。
下面结合附图,通过具体的实施例及其应用场景对本申请实施例提供的基于思维链的问题答案确定方案进行详细地说明。
Prompt是随着大模型能力涌现所提出的一种新的生成方式,是研究者在研究大模型下游任务适配所设计的一种输入模板,它能够让大模型在不微调的情况下根据预训练的学到的知识来解决下游任务。已知输入为input,有f: X->Y或Y=f: X Prompt函数,Prompt函数将input处理为:input` = f : input。
Prompt模板一般是由人为规定的,会有两个掩码输入变量,我们假设为[X]和[Y],其中[X]变量一般替换为输入,[Y]是后续模型生成的文本。以情感分类任务为例,输入为:“我爱这部电影。”,输出为:“好看”。使用的Prompt模板为:[X], 所以它是一部[Y]的电影。经过Prompt函数变换后得到的新的输入为:“我爱这部电影,所以它是一部[Y]的电影”。将新的输入输入至模型,模型会预测[Y]中的答案“好看”。一般地像上述输出[Y]在句子中间的,可将这种Prompt模板称为Cloze Prompt;如果[Y]在句末,例如:“我爱这部电影,所以这部电影是[Y]的。”,则称为Prefix Prompt。Cloze Prompt:需要预测的结果是在Prompt模板中间。Prefix Prompt:需要大模型预测的结果是在Prompt模板的后面。
而在Prompt的应用中,有一种特殊的技术手段被称为思维链。思维链归属于Prefix Prompt的一种,常常用来解决提问和回答问题,它会在问题的输入后面添加:“让我们一步一步来思考。”,提示大模型思考问题。上面这个例子的模板为“[Q]答案:让我们一步一步来思考。[Y]”。其中[Q]替换的是问题,[Y]是模型生成的结果。使用该模板可以让模型像人类一样思考从而解决问题。一种样本问题与答案样例的示意图如图2所示。
本申请实施例中,将思维链技术应用到大型模型的推理过程中,具有如下三个优点:
优点一、具备常识推理能力:一般地语言模型在很多任务上缺乏泛化性,无法做到像人类一样举一反三,而大模型通过思维链引导可以实现常识推理,大模型庞大的参数中存储了大量预训练中的知识分布,而这些知识能够被思维链触发,使大模型更像人类一样思考,利用丰富的知识来解决问题,从而提升泛化能力和解决复杂问题的能力。
优点二、具备数字逻辑推理能力:一般地解决数学问题的模型本质上是一个分类模型,它要求模型能够针对给出的问题回答出答案,而大模型在预训练中加入了部分代码数据集和数学数据集,使得大模型中有一定的数学逻辑推理能力,而思维链的应用使模型从分类问题转换为生成问题,有助于更详细地构建数学逻辑推理链路,让模型更有效地解决数学问题。
优点三:具有可解释性:一般地的模型解决问题都依托于训练阶段的数据分布,根据输入得到相应的输出,而思维链的出现让模型能够呈现从输入到输出的推理链条,这增强了模型生成结果的可解释性。这种解释性有助于用户理解模型的决策和推理过程,提高了模型的信任度和可用性。
这些优势使得思维链在许多复杂问题的求解和推理过程中发挥着重要的作用,为模型的应用和进一步研究提供了更广阔的可能性。但是思维链存在无纠错能力、具有不可干预性的缺陷,本申请实施例中为解决上述缺陷,提出了按照计划逐步提示思维链方法对问题进行求解,得到问题答案。
如附图3所示,本申请实施例的基于思维链的问题答案确定方法包括以下步骤:
步骤201:获取待解答问题以及多个样本数据。
其中,每个样本数据包括:一个问题和该问题对应的第一求解计划。
样本数据为已有的问题和计划样例,是一批通过人工或者大模型标注的文本数据。这批数据的每个样本数据都包括两个元素:一个问题和该问题对应的第一求解计划。每个问题按照计划都能够求解出最终的答案。
获取多个样本数据时,可以随机从标注的大量样本数据中选取预设数量的样本数据,也可以按照样本数据的批注时间长短选取预设数量的样本数据,还可以针对性地从待解答问题对应的同类型样本数据中选取预设数量的样本数据等,本申请实施例中对样本数据的具体获取方式不作具体限定。预设数量也可由本领域技术人员灵活设置。
在一种可选地实施例中,获取待解答问题以及多个样本数据的方式可以如下:
从预先标注的大量历史样本数据中,确定待解答问题对应的候选样本数据;从候选样本数据中随机选择多个样本数据。
该种可选地获取多个样本数据的方式,由于从待解答文图对应的同类型样本数据中提取,所提取的问题更加贴切,可借鉴度更高。
步骤202:将待解答问题与多个样本数据进行拼接后输入模型,得到待解答问题对应的第二求解计划。
本申请实施例中,基于获取的各样本数据和本次需要解答的问题,确定本次的求解计划即第二求解计划。本申请实施例中的该模型为大型语言模型(Large LanguageModels, LLM)例如ChatGPT模型。
在一种可选地实施例中,将待解答问题与多个样本数据进行拼接后输入模型,得到待解答问题对应的第二求解计划的方式可以包括如下子步骤:
S1:将多个样本数据中的问题、求解计划顺次拼接,得到第一文本;
例如:获取了三个样本数据,三个问题分别为A、B以及C,三个问题对应的第一求解计划分别为X、Y以及Z,则第一文本为A-X-B-Y-C-Z拼接成的文本。
S2:将待解答问题拼接在第一文本末尾,得到第二文本;
继续接上一举例,假设待解答问题为D,则得让文本为A-X-B-Y-C-Z-D拼接成的文本。
S3:将第二文本输入模型中,得到模型输出的待解答问题对应的第二求解计划。
所确定的第二求解计划包含多个步骤,控制模型按照第二求解计划中包含的各步骤求解问题答案。
步骤203:控制模型按照第二求解计划中的每个步骤对应的修正步骤执行求解,直至完成最后一个步骤,得到目标答案。
在执行第二求解计划中的各步骤时,有些步骤可能需要修正,有些步骤可能不需要修正,因此每执行一个步骤前均需要判定步骤是否需要修正,若需要则对步骤进行修正,执行修正后的步骤;若不需要修正,则直接执行该步骤。
在一种可选地实施例中,控制模型按照第二求解计划中的每个步骤对应的修正步骤执行求解,直至完成最后一个步骤,得到目标答案的方式可以包括如下子步骤:
S1:控制模型从第二求解计划中提取排序最前的未执行第一步骤;
S2:将第二求解计划中第一步骤的各前序步骤对应的答案、各前序步骤,按序接成第三文本;
S3:将第三文本拼接在第一步骤之后,输入模型得到第一步骤对应的第一答案;
S4:判断第二求解计划中是否包含未执行的第一步骤;
S5:若包含,返回执行控制所述模型从第二求解计划中提取排序最前的未执行第一步骤的操作;
S6:若不包含,从第一答案中筛选目标答案。
上述S1-S6为执行单个步骤的具体过程,在实际实现过程中,可重复上述流程执行第二求解计划中的各步骤,直至执行完最后一个步骤。
在一种可选地实施例中,上述子步骤S3:将第三文本拼接在第一步骤之后,输入模型得到第一步骤对应的第一答案的步骤可进一步为:
依据多个样本数据中的问题信息和第二求解计划中第一步骤的前序步骤对应的答案信息,判断第一步骤是否需要修正;若第一步骤需要修正,则对第一步骤进行修正处理,得到修正后的第一步骤;将第三文本拼接在修正后的第一步骤之后,输入模型得到第一步骤对应的第一答案。
本可选地实施例中,在执行步骤前依据前序步骤的和所得答案对待执行步骤进行判定和修正,能够提升待执行步骤的可靠性,提升所得答案的准确性。
需要说明的是,除上述可选地实施例中对待执行步骤进行修正判定、修改处理外,还可以对S3中得到的步骤对应的答案进行是否需要修正判定、以及对答案进行修正。
本申请实施例提供的基于思维链的问题答案方法,获取待解答问题以及多个样本数据,每个样本数据包括:一个问题和该问题对应的第一求解计划;
将待解答问题与多个样本数据进行拼接后输入模型,得到待解答问题对应的第二求解计划;控制模型按照第二求解计划中的每个步骤对应的修正步骤执行求解,直至完成最后一个步骤,得到目标答案。一方面,首先确定第二求解计划,按照第二求解计划逐步执行的方式可以显著提升大型模型的纠错能力,降低人工干预的复杂度,从而有效提高问题解决的准确性。不仅如此,还可以更系统地引导模型进行推理和决策,有效应对各种复杂情况,为问题求解提供更可靠的答案;第二方面,对第二求解计划种的各第一步骤进行检测修正,有助于在模型生成答案之前识别潜在的错误或不确定性,提高模型所确定的问题答案的准确性。可见,本申请实施例提供的基于思维链确定问题答案的方法,既能够赋予思维链纠错能力,又可以人为或者模型自动干预对第二求解计划中的第一步骤进行修正。
下面参照附图4以一具体实例,对本申请实施例的基于思维链确定问题答案的方法进行说明。
在当前的相关技术中,思维链提示方法存在一些限制,特别是在纠错和人为干预方面。纠错需要模型能够利用其训练过程中获得的内在知识或者外部工具来识别生成结果中的错误。而人为干预则期望在模型生成过程中允许人类进行控制和引导。因此,为解决上问题本申请实施例中提出一种新的思维链提示方法。在接收到一个新问题时,首先为问题制定一个详细的求解计划。然后,该方法控制模型按照计划执行,一步一步地解决问题,每执行完上一步骤,确保上一步骤的求解内容都被应用到下一步骤中。直至执行完计划的最后一个步骤,得出待解答问题的最终答案。
本具体实例中提出的思维链提示方法能够加强两个关键能力,它们分别是:
模型在求解问题的纠错能力:它追求模型能够快速纠错,在求解问题时能够识别并修正可能存在的错误。人为控制模型生成过程的灵活性:允许人类在模型生成过程中进行干预和引导,以确保结果的准确性和合理性。通过加强这两个能力,这种新的思维链提示方法有望提高模型生成结果的准确性和可靠性。
如附图4所示,是本具体实例提供的一种基于思维链确定问题答案的方法包括三大过程:
1、通过上下文学习得到计划。
2、控制大模型按照计划来执行每个步骤。
3、执行完计划中的所有步骤得到最后的答案。
在过程1中,通过上下文学习得到计划包含以下步骤:
步骤301,获取新的问题以及已有的问题和计划样例。
其中,已有的问题和计划样例是一批通过人工或者大模型标注的文本数据。这批数据的每个样本即上文中所述的样本数据均包括两个元素:问题和计划即上文中所述的第一求解计划。每个问题按照计划都能够求解出最终的答案。获取已有的问题和计划样例的方法有许多,在本次发明中选择从候选项中随机抽取。而新的问题指还未解决,需要输入到大模型中去求解的问题。
步骤302,将已有的问题和计划样例和新的问题进行拼接,输入到大模型中,大模型输出新的问题的计划。
新的问题的计划即上文中所述的第二求解计划。
当得到一批问题和计划后,首先将这些问题和计划拼接起来,得到拼接后的片段S。得到S后再将新的问题拼接到S之后,输入到大模型中。本具体实例中,利用大模型中强大的上下文学习能力指引大模型去解决预期的任务,而不需要额外的训练。本具体实例中所期望大模型执行的任务为得到一个问题后输出求解该问题的计划(即第二求解计划)。
在过程2中,控制大型模型按照计划执行每个步骤的方法包含以下步骤:
步骤303,得到新的问题和新的计划。
新的问题即待解答问题,对从步骤302输出的计划进行修正和处理,得到新问题对应的新的计划。
步骤304,从第1步开始执行新的计划。根据当前的需求,取出计划中的步骤,判断是否需要更改步骤内容。如果需要修改,得到新的步骤;如果不需要修改,则是原来的步骤。
首先从计划中的第一步开始执行,取出计划中的第一个步骤,根据已有的问题信息和前序步骤答案的信息,让大模型或者人工判断是否需要更改步骤内容,如果需要,则进行修改,如果不需要,则使用原来的步骤。
步骤305,将要执行的步骤和问题拼接,输入到大模型中,让大模型输出步骤的结果。
将步骤304得到的步骤与问题拼接起来,输入到大模型中,大模型会根据问题中的信息来执行步骤304得到的步骤。
步骤306,得到该步骤的答案,纠错和判断输入到下一步中,直到执行完最后一步。
执行完步骤305后,会得到计划步骤中的答案,首先对答案进行判断,是否存在错误,如果存在则进行纠错,将得到的结果与该步骤拼接起来,表示这个步骤已经执行完毕。我们将执行完毕的步骤按顺序拼接到问题之后,作为新的问题,新的问题包含了前序步骤的信息。如果后续计划还有步骤,则回到步骤304取出下一个步骤,重新顺序执行。
在过程3中,执行完计划中的所有步骤得到最终答案的方法包括:
步骤307,执行完最后一步得到问题的最终答案。
当新的计划包含的步骤均执行完成,会得到描述最终结果的文本片段,从这个片段中提取出问题的最终答案。
本具体实例提供的按计划逐步提示思维链提示问题答案的方法,通过对问题先建立总体的计划方案,控制大模型按计划逐步解决问题,并在其中加强纠错能力以及提高人工干预的灵活性。
本具体实例提供的基于思维链确定问题答案的方法还具有下述四个优点:
优点一:对问题制定计划的有效性在于预先对求解计划进行检测,这有助于在大模型生成答案之前识别潜在的错误或不确定性。这种预先的计划检测可以提高解决问题的准确性,确保模型按照设定的目标进行执行。
优点二:逐步执行计划能够提高用户控制大模型生成结果的灵活性。通过按步执行,用户能够在每个阶段检查模型的输出并根据需要进行调整或干预,确保最终结果符合预期。
优点三:逐步执行计划对大模型的纠错能力有着显著的提升作用。在每个步骤执行后,及时检测可能出现的问题,这有助于降低定位错误的难度,使模型更有效地识别并纠正潜在的错误,提高整体求解的准确性。
优点四:逐步执行计划对于研究大模型的思维链生成过程非常有益。这种方法可以更系统地分析模型在思维链生成中出现错误的位置和原因,为研究者提供了深入了解模型运作机制的途径,有助于优化和改进模型的设计与执行流程。
图5为实现本申请实施例的一种基于思维链确定问题答案的装置的结构框图。
本申请实施例提供的基于思维链确定问题答案的装置包括如下功能模块:
获取模块501,用于获取待解答问题以及多个样本数据,其中,每个所述样本数据包括:一个问题和所述问题对应的第一求解计划;
计划确定模块502,用于将所述待解答问题与多个所述样本数据进行拼接后输入模型,得到待解答问题对应的第二求解计划;
控制模块503,用于控制所述模型按照所述第二求解计划中的每个步骤对应的修正步骤执行求解,直至完成最后一个步骤,得到目标答案。
可选地,所述计划确定模块包括:
第一子模块,用于将所述多个样本数据中的问题、求解计划顺次拼接,得到第一文本;
第二子模块,用于将所述待解答问题拼接在所述第一文本末尾,得到第二文本;
第三子模块,用于将所述第二文本输入模型中,得到模型输出的所述待解答问题对应的第二求解计划。
可选地,所述获取模块包括:
第四子模块,用于从预先标注的大量历史样本数据中,确定所述待解答问题对应的候选样本数据;
第五子模块,用于从所述候选样本数据中随机选择所述多个样本数据。
可选地,所述控制模块包括:
第六子模块,用于控制所述模型从所述第二求解计划中提取排序最前的未执行第一步骤;
第七子模块,用于将所述第二求解计划中所述第一步骤的各前序步骤对应的答案、各前序步骤,按序接成第三文本;
第八子模块,用于将所述第三文本拼接在所述第一步骤之后,输入所述模型得到所述第一步骤对应的第一答案;
第九子模块,用于判断所述第二求解计划中是否包含未执行的第一步骤;
第十子模块,用于若包含,返回执行所述第六子模块;若不包含,从所述第一答案中筛选目标答案。
可选地,所述第八子模块具体用于:
依据多个所述样本数据中的问题信息和所述第二求解计划中所述第一步骤的前序步骤对应的答案信息,判断所述第一步骤是否需要修正;
若所述第一步骤需要修正,则对所述第一步骤进行修正处理,得到修正后的第一步骤;
将所述第三文本拼接在所述修正后的第一步骤之后,输入所述模型得到所述第一步骤对应的第一答案。
本申请实施例提供的基于思维链确定问题答案的装置,一方面,首先确定第一求解计划,按照第一求解计划逐步执行的方式可以显著提升大型模型的纠错能力,降低人工干预的复杂度,从而有效提高问题解决的准确性。不仅如此,还可以更系统地引导模型进行推理和决策,有效应对各种复杂情况,为问题求解提供更可靠的答案;第二方面,对第一求解计划种的各第一步骤进行检测修正,有助于在模型生成答案之前识别潜在的错误或不确定性,提高模型所确定的问题答案的准确性。可见,本申请实施例提供的基于思维链确定问题答案的方案,既能够赋予思维链纠错能力,又可以人为或者模型自动干预对第二求解计划中的第一步骤进行修正。
本申请实施例中图5所示的基于思维链确定问题答案的装置设置在电子设备或者服务器中。设置有该装置的电子设备或者服务器可以为具有操作系统的装置。该操作系统可以为安卓(Android)操作系统,可以为iOS操作系统,还可以为其他可能的操作系统,本申请实施例不作具体限定。
本申请实施例提供的图5所示的基于思维链确定问题答案的装置能够实现图3的方法实施例实现的各个过程,为避免重复,这里不再赘述。
可选地,本申请实施例还提供一种电子设备,包括处理器,存储器,存储在存储器上并可在所述处理器上运行的程序或指令,该程序或指令被处理器执行时实现上述基于思维链确定问题答案的装置执行的各过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
需要注意的是,本申请实施例中的电子设备包括上述所述的服务器。
其中,所述处理器为上述实施例中所述的电子设备中的处理器。所述可读存储介质,包括计算机可读存储介质,如计算机只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory, RAM)、磁碟或者光盘等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明所述原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (10)

1.一种基于思维链确定问题答案的方法,其特征在于,包括:
获取待解答问题以及多个样本数据,其中,每个所述样本数据包括:一个问题和所述问题对应的第一求解计划;
将所述待解答问题与多个所述样本数据进行拼接后输入模型,得到待解答问题对应的第二求解计划;
控制所述模型按照所述第二求解计划中的每个步骤对应的修正步骤执行求解,直至完成最后一个步骤,得到目标答案。
2.根据权利要求1所述的方法,其特征在于,将所述待解答问题与多个所述样本数据进行拼接后输入模型,得到待解答问题对应的第二求解计划的步骤,包括:
将所述多个样本数据中的问题、求解计划顺次拼接,得到第一文本;
将所述待解答问题拼接在所述第一文本末尾,得到第二文本;
将所述第二文本输入模型中,得到模型输出的所述待解答问题对应的第二求解计划。
3.根据权利要求1所述的方法,其特征在于,获取待解答问题以及多个样本数据的步骤,包括:
从预先标注的大量历史样本数据中,确定所述待解答问题对应的候选样本数据;
从所述候选样本数据中随机选择所述多个样本数据。
4.根据权利要求1所述的方法,其特征在于,所述控制所述模型按照所述第二求解计划中的每个步骤对应的修正步骤执行求解,直至完成最后一个步骤,得到目标答案的步骤,包括:
控制所述模型从所述第二求解计划中提取排序最前的未执行第一步骤;
将所述第二求解计划中所述第一步骤的各前序步骤对应的答案、各前序步骤,按序接成第三文本;
将所述第三文本拼接在所述第一步骤之后,输入所述模型得到所述第一步骤对应的第一答案;
判断所述第二求解计划中是否包含未执行的第一步骤;
若包含,返回执行所述控制所述模型从所述第二求解计划中提取排序最前的未执行第一步骤的操作;
若不包含,从所述第一答案中筛选目标答案。
5.根据权利要求4所述的方法,其特征在于,将所述第三文本拼接在所述第一步骤之后,输入所述模型得到所述第一步骤对应的第一答案的步骤,包括:
依据多个所述样本数据中的问题信息和所述第二求解计划中所述第一步骤的前序步骤对应的答案信息,判断所述第一步骤是否需要修正;
若所述第一步骤需要修正,则对所述第一步骤进行修正处理,得到修正后的第一步骤;
将所述第三文本拼接在所述修正后的第一步骤之后,输入所述模型得到所述第一步骤对应的第一答案。
6.一种基于思维链确定问题答案的装置,其特征在于,包括:
获取模块,用于获取待解答问题以及多个样本数据,其中,每个所述样本数据包括:一个问题和所述问题对应的第一求解计划;
计划确定模块,用于将所述待解答问题与多个所述样本数据进行拼接后输入模型,得到待解答问题对应的第二求解计划;
控制模块,用于控制所述模型按照所述第二求解计划中的每个步骤对应的修正步骤执行求解,直至完成最后一个步骤,得到目标答案。
7.根据权利要求6所述的装置,其特征在于,所述计划确定模块包括:
第一子模块,用于将所述多个样本数据中的问题、求解计划顺次拼接,得到第一文本;
第二子模块,用于将所述待解答问题拼接在所述第一文本末尾,得到第二文本;
第三子模块,用于将所述第二文本输入模型中,得到模型输出的所述待解答问题对应的第二求解计划。
8.根据权利要求6所述的装置,其特征在于,所述获取模块包括:
第四子模块,用于从预先标注的大量历史样本数据中,确定所述待解答问题对应的候选样本数据;
第五子模块,用于从所述候选样本数据中随机选择所述多个样本数据。
9.根据权利要求6所述的装置,其特征在于,所述控制模块包括:
第六子模块,用于控制所述模型从所述第二求解计划中提取排序最前的未执行第一步骤;
第七子模块,用于将所述第二求解计划中所述第一步骤的各前序步骤对应的答案、各前序步骤,按序接成第三文本;
第八子模块,用于将所述第三文本拼接在所述第一步骤之后,输入所述模型得到所述第一步骤对应的第一答案;
第九子模块,用于判断所述第二求解计划中是否包含未执行的第一步骤;
第十子模块,用于若包含,返回执行所述第六子模块;若不包含,从所述第一答案中筛选目标答案。
10.一种电子设备,其特征在于,所述电子设备包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行如权利要求1-5中任意一项所述基于思维链确定问题答案方法的步骤。
CN202410201337.2A 2024-02-23 2024-02-23 一种基于思维链确定问题答案的方法和装置、电子设备 Active CN117787421B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410201337.2A CN117787421B (zh) 2024-02-23 2024-02-23 一种基于思维链确定问题答案的方法和装置、电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410201337.2A CN117787421B (zh) 2024-02-23 2024-02-23 一种基于思维链确定问题答案的方法和装置、电子设备

Publications (2)

Publication Number Publication Date
CN117787421A true CN117787421A (zh) 2024-03-29
CN117787421B CN117787421B (zh) 2024-05-31

Family

ID=90381968

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410201337.2A Active CN117787421B (zh) 2024-02-23 2024-02-23 一种基于思维链确定问题答案的方法和装置、电子设备

Country Status (1)

Country Link
CN (1) CN117787421B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113268571A (zh) * 2021-07-21 2021-08-17 北京明略软件系统有限公司 一种确定段落中正确答案位置的方法、装置、设备及介质
CN116244418A (zh) * 2023-05-11 2023-06-09 腾讯科技(深圳)有限公司 问题解答方法、装置、电子设备及计算机可读存储介质
CN116739110A (zh) * 2023-06-21 2023-09-12 山东慧智博视数字科技有限公司 一种基于思维链的大语言模型蒸馏方法
CN116862000A (zh) * 2023-09-01 2023-10-10 浪潮电子信息产业股份有限公司 一种生成式人工智能的因果思维链生成方法、装置及设备
CN116955539A (zh) * 2023-09-15 2023-10-27 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) 一种基于思维链推理隐式生成内容合规性判定方法
CN117076653A (zh) * 2023-10-17 2023-11-17 安徽农业大学 基于思维链及可视化提升上下文学习知识库问答方法
CN117312512A (zh) * 2023-09-25 2023-12-29 星环信息科技(上海)股份有限公司 一种基于大模型的问答方法、装置、电子设备及存储介质
CN117453898A (zh) * 2023-12-25 2024-01-26 中国科学院自动化研究所 基于思维链的跨模态问答的处理方法和装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113268571A (zh) * 2021-07-21 2021-08-17 北京明略软件系统有限公司 一种确定段落中正确答案位置的方法、装置、设备及介质
CN116244418A (zh) * 2023-05-11 2023-06-09 腾讯科技(深圳)有限公司 问题解答方法、装置、电子设备及计算机可读存储介质
CN116739110A (zh) * 2023-06-21 2023-09-12 山东慧智博视数字科技有限公司 一种基于思维链的大语言模型蒸馏方法
CN116862000A (zh) * 2023-09-01 2023-10-10 浪潮电子信息产业股份有限公司 一种生成式人工智能的因果思维链生成方法、装置及设备
CN116955539A (zh) * 2023-09-15 2023-10-27 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) 一种基于思维链推理隐式生成内容合规性判定方法
CN117312512A (zh) * 2023-09-25 2023-12-29 星环信息科技(上海)股份有限公司 一种基于大模型的问答方法、装置、电子设备及存储介质
CN117076653A (zh) * 2023-10-17 2023-11-17 安徽农业大学 基于思维链及可视化提升上下文学习知识库问答方法
CN117453898A (zh) * 2023-12-25 2024-01-26 中国科学院自动化研究所 基于思维链的跨模态问答的处理方法和装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
CHUYUE ZHOU ET.AL: "INFORM : Information eNtropy based multi-step reasoning FOR large language Models", 《2023 CONFERENCE ON EMPIRICAL METHODS IN NATURAL LANGUAGE PROCESSING》, 10 December 2023 (2023-12-10), pages 3565 - 3576 *

Also Published As

Publication number Publication date
CN117787421B (zh) 2024-05-31

Similar Documents

Publication Publication Date Title
US10545733B2 (en) Code reusability
Kulesza et al. Explanatory debugging: Supporting end-user debugging of machine-learned programs
CN110471276B (zh) 用于为物理系统创建模型函数的装置
CN111309914A (zh) 基于多个模型结果对多轮对话的分类方法和装置
KR20200049273A (ko) 머신러닝을 위한 학습데이터 세트의 구성 방법 및 장치
CN110390110A (zh) 用于语义匹配的预训练生成句子向量的方法和装置
GB2604933A (en) Method of developing and using a tool and the resulting tool, for automating complex processes
Könighofer et al. Correct-by-Construction Runtime Enforcement in AI–A Survey
CN117787421B (zh) 一种基于思维链确定问题答案的方法和装置、电子设备
JP7382633B2 (ja) 学習モデル構築装置、学習モデル構築方法及びコンピュータプログラム
JP5821142B2 (ja) 自律型知能体系構築機
Wang An I-POMDP based multi-agent architecture for dialogue tutoring
Zhang et al. Intelligent adaptive learning and control for discrete-time nonlinear uncertain systems in multiple environments
CN116361138A (zh) 测试方法及设备
CN113779360A (zh) 基于多头问答模型的解题方法、装置、设备及存储介质
Krause et al. AutoGRAMS: Autonomous Graphical Agent Modeling Software
Pan et al. Asynchronous value iteration network
JP5828437B2 (ja) 自律型処理手順生成および実行機
CN116954156B (zh) 数控加工的工艺路线规划方法、装置、设备及介质
CN117724695B (zh) 大型语言模型的代码生成优化方法、装置、设备及介质
CN117216220B (zh) 一种大语言模型的使用方法及装置
Lee et al. Long short-term prediction guides human metacognitive reinforcement learning
Harode et al. An Integrated Supervised Reinforcement Machine Learning Approach for Automated Clash Resolution
CN117885082A (zh) 具身智能机器人的控制方法、系统、电子设备及存储介质
Mukhoid et al. Selection of the Optimal Software for Designing Expert Systems

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant