CN117933394A

CN117933394A - 一种基于大语言模型的Prompt自动校验优化系统及方法

Info

Publication number: CN117933394A
Application number: CN202410102132.9A
Authority: CN
Inventors: 张其来; 魏子重; 黄登蓉; 常冰心
Original assignee: Shandong Inspur Science Research Institute Co Ltd
Current assignee: Shandong Inspur Science Research Institute Co Ltd
Priority date: 2024-01-25
Filing date: 2024-01-25
Publication date: 2024-04-26

Abstract

本发明涉及大语言模型技术领域，具体为一种基于大语言模型的Prompt自动校验优化系统及方法，由主流程模块、验证模块和编辑模块组成；主流程模块，是系统执行的主体部分，接受用户的初始输入和产生最终的结果；验证模块，接收大语言模型输出和用户测试用例数据；编辑模块，要实现对Prompt的编辑优化；有益效果为：本发明提出的基于大语言模型的Prompt自动校验优化系统及方法，在提供少量测试用例和初始Prompt的前提下，进行Prompt的自动校验优化，最终生成针对该任务的合适、有效的Prompt，系统以一种比较自动化的方法实现Prompt的校验和编辑，能够极大的减少手动调试Prompt的耗时问题。

Description

一种基于大语言模型的Prompt自动校验优化系统及方法

技术领域

本发明涉及大语言模型技术领域，具体为一种基于大语言模型的Prompt自动校验优化系统及方法。

背景技术

大语言模型是近年来人工智能领域的重要突破之一。随着深度学习技术的快速发展和计算能力的增强，大语言模型的规模和性能得到了极大提升；提示在大语言模型中起着至关重要的作用。它是向模型提供任务和指导的文本或信息，指示模型所需输出的内容。提示直接影响着模型生成输出的质量和准确性。一个合理有效的提示能够引导模型产生符合预期的结果，而不恰当的提示可能导致输出不准确或无关。

现有技术中，在大语言模型中，提示工程面临一些问题和挑战。其中包括：模糊和不明确的提示：一些提示可能表达不够明确或具体，导致模型难以准确理解任务的意图，进而生成不符合预期的输出。缺乏上下文信息：有时提示提供的上下文信息不足，导致模型在理解任务背景和要求时缺乏必要的依据，影响输出的准确性和相关性。提示与任务不匹配：有时提示与任务的需求不匹配，可能过于具体或过于泛化，导致模型无法准确理解任务要求，影响输出的质量和效果。为了解决这些问题，需要对提示进行持续的研究和优化。优化的提示工程可以提高大语言模型的性能和效率，使其在各种实际应用场景中表现优异，为人工智能技术的发展和应用带来更多的创新和进步。

但是，针对提示的优化和探索大都基于专家经验，依赖专家知识实现对Prompt的调优。但这种方式对于外部知识的依赖非常大，同时需要多次反复的调优才可能获的较好的Prompt，限制性较大，对于大规模的推广使用不太现实。

发明内容

本发明的目的在于提供一种基于大语言模型的Prompt自动校验优化系统及方法，以解决上述背景技术中提出的问题。

为实现上述目的，本发明提供如下技术方案：一种基于大语言模型的Prompt自动校验优化系统，所述系统由主流程模块、验证模块和编辑模块组成；

主流程模块，是系统执行的主体部分，接受用户的初始输入和产生最终的结果；

验证模块，接收大语言模型输出和用户测试用例数据；

编辑模块，要实现对Prompt的编辑优化。

优选的，主流程模块中，用户的输入是原始的提示和几个任务相关的测试用例数据，主流程模块将用户输入通过大语言模型获取模型输出后，利用验证模块校验模型的结果，生成多维度的校验信息，根据校验信息指导编辑模块是否需要对Prompt进行编辑以及如何编辑。

优选的，验证模块中，通过多维度的对比，校验预期输出和实际结果之间的差异，包括输出结果的准确性、一致性、连贯性、相关性，同时进行多维度的校验信息。

优选的，编辑模块中，根据验证模块的结果，结合一定的专家经验，实现编辑规则集合，针对可能的情况进行Prompt的优化编辑，考虑的扩充维度有：认为描述更加的具体、上下文更加丰富、示例数据更加多样。

一种基于大语言模型的Prompt自动校验优化方法，所述方法包括以下步骤：

明确任务的目标，收集几个测试用例，例如抽取注册资本、股票价格；

针对任务诉求，书写最原始的Prompt提示词；

将Prompt输入大语言模型，获取输出结果；

将模型结果和用户带测试用例的输入一并输入到验证模块模块进行校验；

验证模块从用户输入中获取测试用例的Groundtrue，将模型的输入Output一并输入校验大语言模型，大语言模型对准确性、完整性、相关性、一致性以及连贯性进行评测，输出上述维度的评估结论；

将校验结果输入判断逻辑，如果校验结果确认无误，则直接输出当前Prompt，结束流程；

如果根据校验信息判断模型输出不足，则将校验信息输入编辑模块，进行Prompt的编辑优化；

编辑模块根据校验指标，结合一定的专家经验，生成编辑规则，根据编辑规则，指导Prompt的编辑优化方向，包括：是否需要添加更详细描述、更丰富的上下文信息以及更多的测试用例信息；

根据编辑规则指导大语言模型对Prompt进行优化，生成优化后的Prompt；

迭代循环直到满足一定条件或获得正确的Prompt为止。

优选的，还包括以下步骤：

用户的输入是原始的提示和几个任务相关的测试用例数据，主流程模块将用户输入通过大语言模型获取模型输出后，利用验证模块校验模型的结果，生成多维度的校验信息，根据校验信息指导编辑模块是否需要对Prompt进行编辑以及如何编辑。

优选的，还包括以下步骤：

通过多维度的对比，校验预期输出和实际结果之间的差异，包括输出结果的准确性、一致性、连贯性、相关性，同时进行多维度的校验信息。

优选的，还包括以下步骤：

根据验证模块的结果，结合一定的专家经验，实现编辑规则集合，针对可能的情况进行Prompt的优化编辑，考虑的扩充维度有：认为描述更加的具体、上下文更加丰富、示例数据更加多样。

与现有技术相比，本发明的有益效果是：

本发明提出的基于大语言模型的Prompt自动校验优化系统及方法，在提供少量测试用例和初始Prompt的前提下，进行Prompt的自动校验优化，最终生成针对该任务的合适、有效的Prompt，系统以一种比较自动化的方法实现Prompt的校验和编辑，能够极大的减少手动调试Prompt的耗时问题。

附图说明

图1为本发明方法流程图。

具体实施方式

为了使本发明的目的、技术方案进行清楚、完整地描述，及优点更加清楚明白，以下结合附图对本发明实施例进行进一步详细说明。应当理解，此处所描述的具体实施例是本发明一部分实施例，而不是全部的实施例，仅仅用以解释本发明实施例，并不用于限定本发明实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

实施例一

请参阅图1，本发明提供一种技术方案：一种基于大语言模型的Prompt自动校验优化系统，所述系统由主流程模块、验证模块和编辑模块组成；

通过大语言模型和部分的任务数据，实现Prompt的自动生成、调优和编辑过程，降低Prompt的书写门槛，快速、高效的获的任务相关的Prompt，该系统以自动化的方式运行，包括主流程模块(Main)、验证模块(Verify)和编辑模块(Modify)。

主流程模块是系统执行的主体部分，接受用户的初始输入和产生最终的结果。用户的输入是原始的提示(Prompt)和几个任务相关的测试用例数据。主流程将用户输入通过大语言模型获取模型输出(ModelOutput)后，利用验证模块(Verify)校验模型的结果，生成多维度的校验信息，根据校验信息指导编辑模块(Modify)是否需要对Prompt进行编辑以及如何编辑。

验证模块(Verify)主要接收模型输出(ModelOutput)和用户测试用例数据。通过多维度的对比，校验预期输出和实际结果之间的差异，包括输出结果的准确性、一致性、连贯性、相关性等，同时进行多维度的校验信息。

编辑模块(Modify)主要实现对Prompt的编辑优化，根据验证模块的结果，结合一定的专家经验，实现编辑规则集合，针对可能的情况进行Prompt的优化编辑。可以考虑的扩充维度有：认为描述更加的具体、上下文更加丰富、示例数据更加多样等。

通过该专利的Prompt自动校验优化方法，能够针对特定任务实现快速的Prompt书写，进行效果的快速验证，极大缩短调优周期，提升解决问题的效率。

本专利提供了一种基于大语言模型的提示(Prompt)自动校验优化方法和装置，能够实现Prompt的自动生成、调优和编辑，实现快速的实验和迭代，包括主流程模块、验证模块、编辑模块。

实施例二

在实施例一的基础上，提出了一种基于大语言模型的Prompt自动校验优化方法，所述方法包括以下步骤：

1)明确任务的目标，收集几个测试用例，例如抽取注册资本、股票价格等

2)针对任务诉求，书写最原始的Prompt提示词，例如：抽取下面信息的注册资本和股票价格，示例：xxxx

3)将上述Prompt输入大语言模型，获取输出结果

4)将模型结果和用户带测试用例的输入一并输入到验证模块(Verify)模块进行校验

5)验证模块从用户输入中获取测试用例的Groundtrue，将模型的输入Output一并输入校验大语言模型，大语言模型对准确性、完整性、相关性、一致性以及连贯性进行评测。输出上述维度的评估结论。

6)将校验结果输入判断逻辑，如果校验结果确认无误，则直接输出当前Prompt，结束流程

7)如果根据校验信息判断模型输出不足，则将校验信息输入编辑模块(Modify)，进行Prompt的编辑优化

8)编辑模块(Modify)根据校验指标，结合一定的专家经验，生成编辑规则，根据编辑规则，指导Prompt的编辑优化方向，包括：是否需要添加更详细描述、更丰富的上下文信息以及更多的测试用例信息等。

9)根据编辑规则指导大语言模型对Prompt进行优化，生成优化后的Prompt。

10)迭代循环直到满足一定条件或获得正确的Prompt为止。

还包括以下步骤：

用户的输入是原始的提示和几个任务相关的测试用例数据，主流程模块将用户输入通过大语言模型获取模型输出后，利用验证模块校验模型的结果，生成多维度的校验信息，根据校验信息指导编辑模块是否需要对Prompt进行编辑以及如何编辑；通过多维度的对比，校验预期输出和实际结果之间的差异，包括输出结果的准确性、一致性、连贯性、相关性，同时进行多维度的校验信息；根据验证模块的结果，结合一定的专家经验，实现编辑规则集合，针对可能的情况进行Prompt的优化编辑，考虑的扩充维度有：认为描述更加的具体、上下文更加丰富、示例数据更加多样。

该方法的主要特点是，针对不同的任务、不同的需求描述情况下，能够基于几个测试用例自动化的生成合适的Prompt，实现快速的试错、迭代和调优，节省大量的人力成本和时间成本。

实施例三

在实施例二的基础上，以信息抽取为例：

用户给定一个原始Prompt和几个测试用例作为输入

将输入给到信息抽取大语言模型，大语言模型生成测试数据的抽取结果

将抽取结果和用户输入一并给到校验大语言模型进行校验

校验模块输出校验结果

校验结果输入判断模块进行逻辑判断，如果满足需求则结束流程，退出；否则进行编辑模块

编辑模块接受校验结果，对Prompt进行编辑、调优，生成调整后的Prompt，返回给主执行流程。

主执行流程迭代，直到满足特定条件，退出执行。

尽管已经示出和描述了本发明的实施例，对于本领域的普通技术人员而言，可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型，本发明的范围由所附权利要求及其等同物限定。

Claims

1.一种基于大语言模型的Prompt自动校验优化系统，其特征在于：所述系统由主流程模块、验证模块和编辑模块组成；

验证模块，接收大语言模型输出和用户测试用例数据；

编辑模块，要实现对Prompt的编辑优化。

2.根据权利要求1所述的一种基于大语言模型的Prompt自动校验优化系统，其特征在于：主流程模块中，用户的输入是原始的提示和几个任务相关的测试用例数据，主流程模块将用户输入通过大语言模型获取模型输出后，利用验证模块校验模型的结果，生成多维度的校验信息，根据校验信息指导编辑模块是否需要对Prompt进行编辑以及如何编辑。

3.根据权利要求1所述的一种基于大语言模型的Prompt自动校验优化系统，其特征在于：验证模块中，通过多维度的对比，校验预期输出和实际结果之间的差异，包括输出结果的准确性、一致性、连贯性、相关性，同时进行多维度的校验信息。

4.根据权利要求1所述的一种基于大语言模型的Prompt自动校验优化系统，其特征在于：编辑模块中，根据验证模块的结果，结合一定的专家经验，实现编辑规则集合，针对可能的情况进行Prompt的优化编辑，考虑的扩充维度有：认为描述更加的具体、上下文更加丰富、示例数据更加多样。

5.一种根据权利要求1-4任意一项所述的基于大语言模型的Prompt自动校验优化系统的基于大语言模型的Prompt自动校验优化方法，其特征在于：所述方法包括以下步骤：

针对任务诉求，书写最原始的Prompt提示词；

将Prompt输入大语言模型，获取输出结果；

迭代循环直到满足一定条件或获得正确的Prompt为止。

6.根据权利要求5所述的一种基于大语言模型的Prompt自动校验优化方法，其特征在于：还包括以下步骤：

7.根据权利要求5所述的一种基于大语言模型的Prompt自动校验优化系统，其特征在于：还包括以下步骤：

8.根据权利要求5所述的一种基于大语言模型的Prompt自动校验优化系统，其特征在于：还包括以下步骤：