CN116992006A - 一种大语言模型驱动的链式自然语言交互方法与系统 - Google Patents
一种大语言模型驱动的链式自然语言交互方法与系统 Download PDFInfo
- Publication number
- CN116992006A CN116992006A CN202311250933.1A CN202311250933A CN116992006A CN 116992006 A CN116992006 A CN 116992006A CN 202311250933 A CN202311250933 A CN 202311250933A CN 116992006 A CN116992006 A CN 116992006A
- Authority
- CN
- China
- Prior art keywords
- language model
- task
- parameters
- user
- api
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 40
- 230000003993 interaction Effects 0.000 title claims abstract description 26
- 238000004458 analytical method Methods 0.000 claims abstract description 33
- 230000006870 function Effects 0.000 claims abstract description 29
- 238000010276 construction Methods 0.000 claims abstract description 15
- 239000008186 active pharmaceutical agent Substances 0.000 claims description 59
- 238000012545 processing Methods 0.000 claims description 22
- 230000004048 modification Effects 0.000 claims description 9
- 238000012986 modification Methods 0.000 claims description 9
- 230000002708 enhancing effect Effects 0.000 claims description 8
- 230000000694 effects Effects 0.000 claims description 7
- 238000004364 calculation method Methods 0.000 claims description 4
- 230000019771 cognition Effects 0.000 claims description 4
- 238000009795 derivation Methods 0.000 claims description 4
- 230000002452 interceptive effect Effects 0.000 claims description 4
- 230000002301 combined effect Effects 0.000 abstract description 3
- 239000000463 material Substances 0.000 description 9
- 230000008569 process Effects 0.000 description 6
- 230000008859 change Effects 0.000 description 5
- 238000004519 manufacturing process Methods 0.000 description 3
- 238000003058 natural language processing Methods 0.000 description 3
- 238000012216 screening Methods 0.000 description 3
- 229910000831 Steel Inorganic materials 0.000 description 2
- 230000006399 behavior Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 239000010959 steel Substances 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005728 strengthening Methods 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/3332—Query translation
- G06F16/3334—Selection or weighting of terms from queries, including natural language queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/338—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/08—Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
- G06Q10/087—Inventory or stock management, e.g. order filling, procurement or balancing against orders
- G06Q10/0875—Itemisation or classification of parts, supplies or services, e.g. bill of materials
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
- G06Q10/103—Workflow collaboration or project management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
- G06Q50/04—Manufacturing
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Abstract
本发明公开了一种大语言模型驱动的链式自然语言交互方法与系统,本方法包括以下步骤:初始化系统资源信息;系统资源信息至少包括:与账户关联的系统信息、与角色相关的系统信息、与时间关联的系统信息以及与登录设备所关联的系统信息;用户意图分析:根据输入参数,进行用户意图分析并查询得到MES系统中相关功能所对应的API;任务链路构建:基于用户意图分析的输出参数,通过调用大语言模型动态构建执行API查询的任务链路,并根据任务链路执行对应API;对任务链路执行对应API的结果进行输出展示。本发明将需要多步执行的操作交由大语言模型整合任务链路,并基于任务链路依次执行;实现一次提问即可得到连续操作的组合的效果。
Description
技术领域
本发明属于制造执行系统领域,具体涉及一种大语言模型驱动的链式自然语言交互方法与系统。
背景技术
制造执行系统(MES)在面对复杂的制造流程管理问题时,如何有效、准确地理解和响应用户需求,是一直困扰行业的难题。传统的MES系统主要依赖预定义的命令或图形用户界面,这在一定程度上增加了用户的学习成本,并在实际操作中存在效率低下、灵活性差等问题。
传统的MES系统主要通过界面交互和基础自然语言处理技术进行用户交互。界面交互依赖于预设的界面和命令,而基础自然语言处理技术则能理解简单的自然语言指令。但是,这两种方式在处理复杂或模糊的用户需求时,往往无法提供满意的解决方案。现有技术存在以下不足:界面交互方式需要用户熟悉复杂的操作界面和命令,这在一定程度上增加了用户的学习成本,影响了操作效率;基础自然语言处理技术虽然可以处理自然语言指令,但在理解复杂或模糊的用户需求方面,其能力相对有限;传统MES系统缺乏学习和适应用户行为的能力,系统无法适应不同用户的差异性需求,这导致系统无法根据用户行为灵活的提供服务。
发明内容
本发明的目的在于,提供一种大语言模型驱动的链式自然语言交互方法与系统,将需要多步执行的操作交由大语言模型整合任务链路,并基于任务链路依次执行;实现一次提问即可得到连续操作的组合的效果。
为解决上述技术问题,本发明的技术方案为:一种大语言模型驱动的链式自然语言交互方法,应用于MES系统中,本方法包括以下步骤:
初始化系统资源信息;系统资源信息至少包括:与账户关联的系统信息、与角色相关的系统信息、与时间关联的系统信息以及与登录设备所关联的系统信息;
用户意图分析:将用户输入的问题作为输入参数,进行用户意图分析并查询得到MES系统中相关功能所对应的API;
任务链路构建:基于用户意图分析的输出参数,通过调用大语言模型动态构建执行API查询的任务链路,并根据任务链路执行对应API;其中,输入参数中与系统资源信息中包含了API执行所需参数;
对任务链路执行对应API的结果进行输出展示。
在执行大语言模型链式调用前,通过系统查询系统资源信息时,还可进行以下操作:
①查询用户近期任务以及与其关联项目;
②根据用户角色特点通过系统内数据信息紧密度模型输出与当前任务相关联的关联任务类型、以及关联紧密程度;依据任务类型查询关联任务,并根据关联紧密度进行分级;
③查询登录设备关联的数控设备和所属工厂。
用户意图分析的具体步骤为:
对MES系统中所有页面的功能进行有效概括,并提取得到对应页面若干功能的概况关键字;
创建用于强化大语言模型对输入参数与业务关联性理解的第一提示词;
将提示词与输入参数组合,得到用户意图分析的输出参数。
任务链路构建的具体步骤为:
对MES系统中API的对应功能及所输入参数、输出参数的作用进行有效描述;
创建用于大语言模型对构建链式任务工作背景的理解并强化大语言模型对于API之间关联性的认知的第二提示词;
检视是否存在缺省参数,并将缺省参数替换为初始化的系统资源信息;向大语言模型提交请求后解析返回的执行链路;其中,缺省参数为对输入参数提取关键字并按照系统资源信息进行分类,将分类结果与完整的系统资源信息相比后缺少的信息。
在任务链路执行对应API的结果进行输出展示中:用户通过自然语言输入问题与MES系统进行交互时,存在2类操作,包括查询操作和修改操作,
当执行查询操作时,若输出参数的数据量小于系统设定值N,则直接在自然语言交互对话框展示输出;
当执行查询操作时,若输出参数的数据量大于等于系统设定值N,执行的对应页面重定向请求至用户意图分析步骤中的模块地址,并将输出参数填充至重定向请求的参数表中并在对应功能页面展示出查询结果;
当执行修改操作时,执行的对应页面重定向请求至用户意图分析中的模块地址,并将输出参数体现至页面参数输入控件中,以告知用户执行完任务链路后的效果,并提示用户进行检查后确认或取消本次操作。
在用户意图分析中,将概况关键字转换为特定格式的JSON数据,并在提示词与输入参数组合之后,解析大语言模型返回JSON数据的用户意图的输出参数。
第一提示词包括:大语言模型的角色定位;MES系统中模块清单的结构化数据;输出规则及输出样式;常规回答示例,示例中包含有助于大语言模型理解内置逻辑的推导过程;边界情况示例约束。
第二提示词包括:大语言模型角色定位;MES系统中API接口的结构化数据;MES系统中的缺省参数;用以约束AI输出样式,以供后续处理的常规回答示例;强制要求大语言模型不要过度推理,避免编造数据的情况;添加用于避免大语言模型出现理解错误的部分概念定义。
任务链路构建还包括,根据API请求和逻辑运算对输出参数进行优化,API请求和逻辑运算的具体步骤为:
1)API请求根据任务链路结构追溯输入问题的来源,并填充至请求的输入问题中,执行请求,并将返回结果填充至输出参数中;
2)逻辑运算根据大语言模型编写的逻辑代码,在后台动态创建一个临时的代码执行程序,将其中的参数替换成实际数据值,并通过该执行程序的计算结果得到逻辑运算结果并填充至输出参数中。
还提供一种大语言模型驱动的链式自然语言交互的系统,其使用如上述任一项所述的一种大语言模型驱动的链式自然语言交互方法。
与现有技术相比,本发明的有益效果为:
1、用户与系统交互时,无需深入学习即可快速使用系统;
2、将需要多步执行的操作交由大语言模型整合任务链路,并基于任务链路依次执行;实现一次提问即可得到连续操作的组合的效果。
附图说明
图1为本发明实施例的流程示意图;
图2为本发明实施例中用户意图分析执行效果的示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。
本发明的技术方案为:一种大语言模型驱动的链式自然语言交互方法,应用于MES系统中,如图1所示,本方法包括以下步骤:
初始化系统资源信息;系统资源信息至少包括:与账户关联的系统信息、与角色相关的系统信息、与时间关联的系统信息以及与登录设备所关联的系统信息;
用户意图分析:将用户输入的问题作为输入参数,进行用户意图分析并查询得到MES系统中相关功能所对应的API;
任务链路构建:基于用户意图分析的输出参数,通过调用大语言模型动态构建执行API查询的任务链路,并根据任务链路执行对应API;其中,输入参数中与系统资源信息中包含了API执行所需参数;
对任务链路执行对应API的结果进行输出展示。
在执行大语言模型链式调用前,通过系统查询系统资源信息时,还可进行以下操作:
①查询用户近期任务以及与关联项目;
②根据用户角色特点通过系统内数据信息紧密度模型输出与当前任务相关联的关任务类型、以及关联紧密程度;依据任务类型查询关联任务,并根据关联紧密度进行分级;
③查询登录设备关联的数控设备和所属工厂。
用户意图分析的具体步骤为:
对MES系统中所有页面的功能进行有效概括,并提取得到对应页面若干功能的概况关键字;
创建用于强化大语言模型对输入参数与业务关联性理解的第一提示词;
将提示词与输入参数组合,得到用户意图分析的输出参数。
任务链路构建的具体步骤为:
对MES系统中API的对应功能及所输入参数、输出参数的作用进行有效描述;
创建用于大语言模型对构建链式任务工作背景的理解并强化大语言模型对于API之间关联性的认知的第二提示词;
检视是否存在缺省参数,并将缺省参数替换为初始化的系统资源信息;向大语言模型提交请求后解析返回的执行链路;其中,缺省参数为对输入参数提取关键字并按照系统资源信息进行分类,将分类结果与完整的系统资源信息相比后缺少的信息。
在任务链路执行对应API的结果进行输出展示中:用户通过自然语言输入问题与MES系统进行交互时,存在2类操作,包括查询操作和修改操作,
当执行查询操作时,若输出参数的数据量小于系统设定值N,则直接在自然语言交互对话框中展示输出;
当执行查询操作时,若输出参数的数据量大于等于系统设定值N,执行的对应页面重定向请求至用户意图分析步骤中的模块地址,并将输出参数填充至重定向请求的参数表中并在对应功能页面展示出查询结果;
当执行修改操作时,执行的对应页面重定向请求至用户意图分析中的模块地址,并将输出参数体现至页面参数输入控件中,以告知用户执行完任务链路后的效果,并提示用户进行检查后确认或取消本次操作。
在用户意图分析中,将概况关键字转换为特定格式的JSON数据,并在提示词与输入参数组合之后,解析大语言模型返回JSON数据的用户意图的输出参数。
第一提示词包括:大语言模型的角色定位;MES系统中模块清单的结构化数据;输出规则及输出样式;常规回答示例,示例中包含有助于大语言模型理解内置逻辑的推导过程;边界情况示例约束。
第二提示词包括:大语言模型角色定位;MES系统中API接口的结构化数据;MES系统中的缺省参数;用以约束AI输出样式,以供后续处理的常规回答示例;强制要求大语言模型不要过度推理,避免编造数据的情况;添加用于避免大语言模型出现理解错误的部分概念定义。
任务链路构建还包括,根据API请求和逻辑运算对输出参数进行优化,API请求和逻辑运算的具体步骤为:
1)API请求根据任务链路结构追溯输入问题的来源,并填充至请求的输入问题中,执行请求,并将返回结果填充至输出参数中;
2)逻辑运算根据大语言模型编写的逻辑代码,在后台动态创建一个临时的代码执行程序,将其中的参数替换成实际数据值,并通过该执行程序的计算结果得到逻辑运算结果并填充至输出参数中。
还提供一种大语言模型驱动的链式自然语言交互的系统,其使用如上述任一项所述的一种大语言模型驱动的链式自然语言交互方法。
提供一种本发明的实施例:
步骤1、初始化系统资源信息
每个用户在登录后,除了用户账户信息外,还包含了许多额外的隐藏信息。
例如:
1)与账户关联的系统信息:
每个用户的系统账户内都有自己的工作任务,如设计员的任务有3D图的设计、2D图纸绘制、物料清单制作,编程员的任务有钢件编程、电极编程、加工反馈分析。
用户除了完成自身的工作任务外,还需要关注其工作链条中上下游的任务进展,以确保整体工作链条的顺畅无阻。因此,每个任务又衍生出与其相关的关联性任务。
2)与角色相关的系统信息:
每个用户有不同的角色定义,设计员、工艺员、计划员、加工组长、管理员等。
项目经理角色需要关心项目的整体进度,不仅需要关心各项工序任务是否进度正常,还需要洞察项目执行过程中的潜在风险。
而主管级别的角色则需要关注整个部门的任务进度、工作负荷、配合部门的执行情况。
3)与时间关联的系统信息:
所有任务都有起始时间、计划完成时间、实际完成时间,而用户当前操作时间则通常会作为用户进行数据查询时的一个标尺。
4)与登录设备所关联的系统信息:
加工现场进行操作时,操作工所登录的设备通常是与其控制的加工设备相关的,因此登录设备隐含了加工设备这一信息。
多工厂的企业,管理层在不同工厂登录后,隐含的系统信息则是当前工厂。
因此,我们根据用户执行操作时的账户、角色、时间、设备可以推导出执行任务的缺省信息。
在执行大语言模型链式调用前,我们通过系统查询与账户、角色、时间、设备相关的上下文:
1、查询用户近期任务以及与关联项目
2、根据用户角色特点通过系统内数据信息紧密度模型输出与当前任务相关联的关任务类型、以及关联紧密程度;依据任务类型查询关联任务,并根据关联紧密度进行分级
3、查询登录设备关联的数控设备、所属工厂
步骤2、用户意图分析,其过程如图2所示,
MES系统的功能页面展示效果可能并不直观,其操作便利性可能有待提高,但绝大多数情况下它们仍能提供用户所需的所有功能内容。
因此,用户通过自然语言与系统进行交互时,能够将结果转换为特定页面经过一系列操作后的展示效果。
通过以下步骤将能够有效的分析出用户意图:
1、对MES系统中所有页面的功能进行有效的概况,可以允许一个页面对应多项功能。并转换为下列格式的JSON数据:
{
"订单页面":["订单录入","订单查询"],
"项目管理页面":["制定项目计划","项目变更","项目进度查询"]
}
2、创建提示词,记提示词字符串为P,提示词用于强化AI对用户提问与业务关联性理解。提示词需要包含以下要素:
a.AI角色定位
b.MES系统中模块清单的结构化数据
c.约定输出规则及输出样式
d.增加常规回答示例,示例里包含推导过程将有助于AI理解内置逻辑
e.增加边界情况示例约束,如空数据的返回,避免AI出现“幻觉”
提示词示例如下:
你是MES系统AI助理,MES系统内置模块及功能会以JSON格式表达,其中key是模块名称、value是功能列表。接下来我将提出我的问题,请理解我给你的问题示例及答案示例,判断其问题属于哪个模块中的功能,回答示例的格式回复。请注意,回答应仅包含json格式的数据,并请理解返回示例中key所表达的含义,所有输出的key都应当保持与示例一致,不要增加、删除或者修改返回的key。
##模块及功能的Json格式
{“订单页面”:[”订单录入”,”订单查询”],”项目管理页面”:[“制定项目计划”,”项目变更”,”项目进度查询”]}
我想查看与我有关的项目情况
{“系统模块”:”项目管理页面”,”对应功能”:[”项目变更”,”项目进度查询”],”解释分析”:”你可以在项目进度功能中查询到与你有关的项目进展情况,也可以在项目变更功能中查看近期的变更内容,这部分可能是你所需要重点关注的”}
我想看下当前仓库里还有多少100*100的钢料
{“系统模块”:””,”对应功能”:[],”解释分析”:”所提供的模块及功能的Json格式中,没有功能模块能够与当前问题进行对应”}
3、将提示词与用户问题组合,例如用户提问:我想查看近3天内的新进订单。则系统向AI大模型的输入请求数据为:P+“/n/n我想查看近3天内的新进订单。”(/n为换行符)
4、解析用户意图,解析AI返回JSON格式数据的用户意图,查询出系统相关功能的所对应的API。
步骤3、任务链路构建
基于用户意图分析的输出参数,我们可以通过AI大模型的理解能力来动态构建执行API查询的任务链路,并根据任务链路执行对应API。用户提交问题中或系统资源信息中包含了API执行所需参数。
1、对MES系统中API的功能及所输入输出参数的作用进行有效的描述。并转换为接口名称、接口地址、接口描述、输入参数、输出参数在内的JSON数据。下面是一段示例:
{
"获取BOM数据": {
"地址": "/nem/ic/bom/list",
"接口描述":"通过项目ID或零件编号查询对应零件的物料信息、包括材料、类型、规格、重量、以及与其相关的任务编号",
"输入参数": ["项目ID","零件编号"],
"输出参数": ["材料", "零件类型", "规格", "重量","任务编号"]
},
"零件加工状态": {
"地址": "/nem/ic/processing/status",
"接口描述":"通过零件ID获取其当前加工状态:是否正在加工以及其所在的加工工序",
"输入参数": ["零件ID"],
"输出参数": ["加工状态", "加工工序", "加工设备"]
},
"获取任务数据": {
"地址": "/nem/ic/task/list",
"接口描述":"通过人员ID或项目ID获取对应的任务列表",
"输入参数": ["人员ID","项目ID"],
"输出参数": ["任务ID"]
},
"获取任务状态": {
"地址": "/nem/ic/task/status",
"接口描述":"通过任务ID返回任务状态(未开始、进行中、已完成),任务开始时间、任务完成时间",
"输入参数": ["任务ID"],
"输出参数": ["任务状态","实际开始时间","实际完成时间","计划开始时间","计划任务完成时间"]
}
}
2、创建提示词,强化AI对构建链式任务的工作背景的理解并强化其对于API之间关联性的认知,记提示词字符串为Q。提示词需要包含以下要素:
a.AI角色定位
b.MES系统中API接口的结构化数据
c.MES系统中缺省的隐含参数
d.增加常规回答示例,示例的展示用以约束AI输出样式,以供后续处理
e.强制要求AI大模型不要过度推理,避免编造数据的情况。
f.添加部分概念定义,避免AI大模型理解错误
提示词示例如下:
你是MES系统功能开发专家,你需要理解我提出来的要求,分析提问中可以转换为参数的信息,再加上我提供给你的缺省参数列表中的信息(提问中如果出现了与缺省参数类容相同的信息,则以问题中分析出的参数为准),并根据现有的API功能,制定一条API请求与逻辑运算的执行链路,依次执行后得到最终结果。制定的链路中需要明确每个参数的数据来源。请勿编造不存在于系统API清单中的接口,如果提问和缺省参数列表中都没有执行一个API所需的必要参数,请参考示例回答1返回一个错误。
##当前系统API清单
{
"获取BOM数据": {
"地址": "/nem/ic/bom/list",
"接口描述":"通过项目ID或零件编号查询对应零件的物料信息、包括材料、类型、规格、重量、以及与其相关的任务编号",
"输入参数": ["项目ID","零件编号"],
"输出参数": ["材料", "零件类型", "规格", "重量","任务编号"]
},
"零件加工状态": {
"地址": "/nem/ic/processing/status",
"接口描述":"通过零件ID获取其当前加工状态:是否正在加工以及其所在的加工工序",
"输入参数": ["零件ID"],
"输出参数": ["加工状态", "加工工序", "加工设备"]
},
"获取任务数据": {
"地址": "/nem/ic/task/list",
"接口描述":"通过人员ID或项目ID获取对应的任务列表",
"输入参数": ["人员ID","项目ID"],
"输出参数": ["任务ID"]
},
"获取任务状态": {
"地址": "/nem/ic/task/status",
"接口描述":"通过任务ID返回任务状态(未开始、进行中、已完成),任务开始时间、任务完成时间",
"输入参数": ["任务ID"],
"输出参数": ["任务状态","实际开始时间","实际完成时间","计划开始时间","计划任务完成时间"]
}
}
##常见概念
项目ID:特定项目的唯一标识,项目立项时创建。
##缺省参数列表
[“用户ID”,”当前时间”,”查找范围”]
##示例问题1
查找我们小组已即将延期的零件
##示例回答1
API请求执行链路如下:
{“状态”:”异常”,”原因”:”未识别到相关API”}
##示例问题2
我想看下最近一周内的延期任务。
##示例回答2
API请求执行链路如下:
{
"参数解析": {
"输入": [{"参数名":"当前时间","来源":"缺省参数"}],
"输出": ["起始时间","终止时间"],
"步骤": 0,
"类型":"逻辑运算",
"执行代码":"起始时间 = 当前时间-7243600; 终止时间 = 当前时间;"
},
"获取任务数据": {
"输入": [{"参数名":"用户ID","来源":"缺省参数"}],
"输出": ["任务ID"],
"步骤": 1,
"类型":"API请求",
"请求地址":"/nem/ic/task/list"
},
"获取任务状态": {
"输入": [{"参数名":"任务ID","来源":"获取任务数据"}],
"输出": ["任务状态","实际开始时间","实际完成时间","计划开始时间","计划任务完成时间"],
"类型":"API请求",
"步骤": 2,
"请求地址":"/nem/ic/task/status"
},
"延期状态判定":{
"输入":[{"参数名":"任务ID","来源":"获取任务数据"},{"参数名":"实际完成时间","来源":"获取任务状态"},{"参数名":"计划完成时间","来源":"获取任务状态"}],
"输出":["延期状态"],
"步骤": 3,
"类型":"逻辑运算",
"执行代码":"延期状态=计划完成时间<实际完成时间;"
},
"筛选数据":{
"输入[{"参数名":"任务ID","来源":"获取任务数据"},{"参数名":"实际完成时间","来源":"获取任务状态"},{"参数名":"计划完成时间","来源":"获取任务状态"}],
"输出":["筛选结果"],
"步骤": 4,
"类型":"逻辑运算",
"执行代码":"筛选结果 = 起始时间<计划完成时间 and 计划完成时间<终止时间;"
}
}
3、缺省参数换为步骤1中初始化的系统资源信息;将系统API清单中的API列表替换为步骤2中户意图分析中返回的API数据。向AI大模型提交请求后解析返回的执行链路。
4、依据执行链路中的分类,API请求、逻辑运算,分别执行以下两个步骤:
1)API请求将根据链路结构追溯输入参数的来源,并填充至请求输入参数中,执行请求,并将返回结果填充至输出参数中。
2)逻辑运算则是根据AI编写的逻辑代码在后台动态创建一个临时的代码执行程序,将其中的参数替换成实际数据值,并通过该执行程序的计算结果得到步骤的输出。
步骤4、任务链执行结果展示
用户通过自然语言与系统交互有2类操作:查询操作、修改操作(删除也属于修改操作)。查询操作的可以采用两种模式,特定页面展示、简单对话返回。修改数据一定是需要在特定页面进行确认操作的,本系统在会整理好需要修改的参数,在页面进行展示并由用户进行提交。
假定任务链路构建的输出内容为O。
1、执行查询操作时,若O的数据量小于系统设定值N,则直接在自然语言交互对话框展示输出。
2、执行查询操作时,若O的数据量大于等于系统设定值N,执行页面重定向请求至用户意图分析步骤中的模块地址,并将输出参数填充至重定向请求的参数表中。此时,将在对应功能页面展示出查询结果。
3、执行修改操作时,执行页面重定向请求至用户意图分析步骤中的模块地址,并将输出参数体现至页面参数输入控件中。以告知用户,执行完任务链路后的效果,并提示用户进行检查后确认或取消本次操作。
本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种大语言模型驱动的链式自然语言交互方法,其特征在于,应用于MES系统中,本方法包括以下步骤:
初始化系统资源信息;系统资源信息至少包括:与账户关联的系统信息、与角色相关的系统信息、与时间关联的系统信息以及与登录设备所关联的系统信息;
用户意图分析:将用户输入的问题作为输入参数,进行用户意图分析并查询得到MES系统中相关功能所对应的API;
任务链路构建:基于用户意图分析的输出参数,通过调用大语言模型动态构建执行API查询的任务链路,并根据任务链路执行对应API;其中,输入参数中与系统资源信息中包含了API执行所需参数;
对任务链路执行对应API的结果进行输出展示。
2.根据权利要求1所述的一种大语言模型驱动的链式自然语言交互方法,其特征在于,在执行大语言模型链式调用前,通过系统查询系统资源信息时,还可进行以下操作:
①查询用户近期任务以及与其关联项目;
②根据用户角色特点通过系统内数据信息紧密度模型输出与当前任务相关联的关联任务类型、以及关联紧密程度;依据任务类型查询关联任务,并根据关联紧密度进行分级;
③查询登录设备关联的数控设备和所属工厂。
3.根据权利要求2所述的一种大语言模型驱动的链式自然语言交互方法,其特征在于,用户意图分析的具体步骤为:
对MES系统中所有页面的功能进行有效概括,并提取得到对应页面若干功能的概况关键字;
创建用于强化大语言模型对输入参数与业务关联性理解的第一提示词;
将提示词与输入参数组合,得到用户意图分析的输出参数。
4.根据权利要求1所述的一种大语言模型驱动的链式自然语言交互方法,其特征在于,任务链路构建的具体步骤为:
对MES系统中API的对应功能及所输入参数、输出参数的作用进行有效描述;
创建用于大语言模型对构建链式任务工作背景的理解并强化大语言模型对于API之间关联性的认知的第二提示词;
检视是否存在缺省参数,并将缺省参数替换为初始化的系统资源信息;向大语言模型提交请求后解析返回的执行链路;其中,缺省参数为对输入参数提取关键字并按照系统资源信息进行分类,将分类结果与完整的系统资源信息相比后缺少的信息。
5.根据权利要求1所述的一种大语言模型驱动的链式自然语言交互方法,其特征在于,在任务链路执行对应API的结果进行输出展示中:用户通过自然语言输入问题与MES系统进行交互时,存在2类操作,包括查询操作和修改操作,
当执行查询操作时,若输出参数的数据量小于系统设定值N,则直接在自然语言交互对话框展示输出;
当执行查询操作时,若输出参数的数据量大于等于系统设定值N,执行的对应页面重定向请求至用户意图分析步骤中的模块地址,并将输出参数填充至重定向请求的参数表中并在对应功能页面展示出查询结果;
当执行修改操作时,执行的对应页面重定向请求至用户意图分析中的模块地址,并将输出参数体现至页面参数输入控件中,以告知用户执行完任务链路后的效果,并提示用户进行检查后确认或取消本次操作。
6.根据权利要求3所述的一种大语言模型驱动的链式自然语言交互方法,其特征在于,在用户意图分析中,将概况关键字转换为特定格式的JSON数据,并在提示词与输入参数组合之后,解析大语言模型返回JSON数据的用户意图的输出参数。
7.根据权利要求3所述的一种大语言模型驱动的链式自然语言交互方法,其特征在于,第一提示词包括:大语言模型的角色定位;MES系统中模块清单的结构化数据;输出规则及输出样式;常规回答示例,示例中包含有助于大语言模型理解内置逻辑的推导过程;边界情况示例约束。
8.根据权利要求4所述的一种大语言模型驱动的链式自然语言交互方法,其特征在于,第二提示词包括:大语言模型角色定位;MES系统中API接口的结构化数据;MES系统中的缺省参数;用以约束AI输出样式,以供后续处理的常规回答示例;强制要求大语言模型不要过度推理,避免编造数据的情况;添加用于避免大语言模型出现理解错误的部分概念定义。
9.根据权利要求4所述的一种大语言模型驱动的链式自然语言交互方法,其特征在于,任务链路构建还包括,根据API请求和逻辑运算对输出参数进行优化,API请求和逻辑运算的具体步骤为:
1)API请求根据任务链路结构追溯输入问题的来源,并填充至请求的输入问题中,执行请求,并将返回结果填充至输出参数中;
2)逻辑运算根据大语言模型编写的逻辑代码,在后台动态创建一个临时的代码执行程序,将其中的参数替换成实际数据值,并通过该执行程序的计算结果得到逻辑运算结果并填充至输出参数中。
10.一种大语言模型驱动的链式自然语言交互的系统,其特征在于,其使用如权利要求1-9任一项所述的一种大语言模型驱动的链式自然语言交互方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311250933.1A CN116992006B (zh) | 2023-09-26 | 2023-09-26 | 一种大语言模型驱动的链式自然语言交互方法与系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311250933.1A CN116992006B (zh) | 2023-09-26 | 2023-09-26 | 一种大语言模型驱动的链式自然语言交互方法与系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116992006A true CN116992006A (zh) | 2023-11-03 |
CN116992006B CN116992006B (zh) | 2024-01-12 |
Family
ID=88534121
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311250933.1A Active CN116992006B (zh) | 2023-09-26 | 2023-09-26 | 一种大语言模型驱动的链式自然语言交互方法与系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116992006B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117350825A (zh) * | 2023-12-05 | 2024-01-05 | 浙江口碑网络技术有限公司 | 基于大语言模型的导购方法和系统 |
CN117608764A (zh) * | 2024-01-18 | 2024-02-27 | 成都索贝数码科技股份有限公司 | 一种容器平台运维方法及系统 |
CN117743545B (zh) * | 2023-12-20 | 2024-05-17 | 北京橡数科技有限公司 | 一种基于toB企服项目交付系统业务数据获取方法和系统 |
Citations (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110137653A1 (en) * | 2009-12-04 | 2011-06-09 | At&T Intellectual Property I, L.P. | System and method for restricting large language models |
US20170075953A1 (en) * | 2015-09-11 | 2017-03-16 | Google Inc. | Handling failures in processing natural language queries |
WO2017041372A1 (zh) * | 2015-09-07 | 2017-03-16 | 百度在线网络技术(北京)有限公司 | 基于人工智能的人机交互方法和系统 |
CN113515616A (zh) * | 2021-07-12 | 2021-10-19 | 中国电子科技集团公司第二十八研究所 | 一种基于自然语言的任务驱动系统 |
CN115796299A (zh) * | 2021-10-01 | 2023-03-14 | 谷歌有限责任公司 | 经由机器学习语言模型的链的透明且可控的人智交互 |
CN116127020A (zh) * | 2023-03-03 | 2023-05-16 | 北京百度网讯科技有限公司 | 生成式大语言模型训练方法以及基于模型的搜索方法 |
KR20230076012A (ko) * | 2021-11-23 | 2023-05-31 | 네이버 주식회사 | 초대형 언어 모델을 이용한 페르소나 대화 데이터 생성 방법 및 시스템 |
CN116244416A (zh) * | 2023-03-03 | 2023-06-09 | 北京百度网讯科技有限公司 | 生成式大语言模型训练方法、基于模型的人机语音交互方法 |
CN116483977A (zh) * | 2023-05-05 | 2023-07-25 | 成都国佳电气工程有限公司 | 一种利用大语言模型实现移动机器人人机交互巡检的方法 |
CN116541497A (zh) * | 2023-04-25 | 2023-08-04 | 百度时代网络技术(北京)有限公司 | 任务型对话的处理方法、装置、设备和存储介质 |
CN116561278A (zh) * | 2023-05-05 | 2023-08-08 | 科大讯飞股份有限公司 | 知识问答方法、装置、设备及存储介质 |
CN116594768A (zh) * | 2023-05-05 | 2023-08-15 | 清华大学 | 面向大模型的通用工具协同和精细化学习系统及方法 |
US20230259705A1 (en) * | 2021-08-24 | 2023-08-17 | Unlikely Artificial Intelligence Limited | Computer implemented methods for the automated analysis or use of data, including use of a large language model |
CN116644145A (zh) * | 2023-07-26 | 2023-08-25 | 北京仁科互动网络技术有限公司 | 会话数据处理方法、装置、设备和存储介质 |
US20230274086A1 (en) * | 2021-08-24 | 2023-08-31 | Unlikely Artificial Intelligence Limited | Computer implemented methods for the automated analysis or use of data, including use of a large language model |
CN116680093A (zh) * | 2023-05-20 | 2023-09-01 | 数字郑州科技有限公司 | 基于LLM的web应用优化系统及服务实现方法和系统 |
CN116701662A (zh) * | 2023-08-07 | 2023-09-05 | 国网浙江浙电招标咨询有限公司 | 基于知识图谱的供应链数据管理方法、装置、设备及介质 |
CN116737129A (zh) * | 2023-08-08 | 2023-09-12 | 杭州比智科技有限公司 | 一种供应链控制塔生成式大语言模型及其构建方法 |
CN116756564A (zh) * | 2023-05-29 | 2023-09-15 | 阿波罗智联(北京)科技有限公司 | 面向任务解决的生成式大语言模型的训练方法和使用方法 |
CN116775853A (zh) * | 2023-06-28 | 2023-09-19 | 唯思电子商务(深圳)有限公司 | 一种基于大语言模型的企业内部搜索引擎方法 |
CN116775183A (zh) * | 2023-05-31 | 2023-09-19 | 腾讯科技(深圳)有限公司 | 基于大语言模型的任务生成方法、系统、设备及存储介质 |
CN116776836A (zh) * | 2023-06-13 | 2023-09-19 | 江西师范大学 | 一种基于AI-Chain的文本生成方法 |
-
2023
- 2023-09-26 CN CN202311250933.1A patent/CN116992006B/zh active Active
Patent Citations (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110137653A1 (en) * | 2009-12-04 | 2011-06-09 | At&T Intellectual Property I, L.P. | System and method for restricting large language models |
WO2017041372A1 (zh) * | 2015-09-07 | 2017-03-16 | 百度在线网络技术(北京)有限公司 | 基于人工智能的人机交互方法和系统 |
US20170075953A1 (en) * | 2015-09-11 | 2017-03-16 | Google Inc. | Handling failures in processing natural language queries |
CN113515616A (zh) * | 2021-07-12 | 2021-10-19 | 中国电子科技集团公司第二十八研究所 | 一种基于自然语言的任务驱动系统 |
US20230259705A1 (en) * | 2021-08-24 | 2023-08-17 | Unlikely Artificial Intelligence Limited | Computer implemented methods for the automated analysis or use of data, including use of a large language model |
US20230274086A1 (en) * | 2021-08-24 | 2023-08-31 | Unlikely Artificial Intelligence Limited | Computer implemented methods for the automated analysis or use of data, including use of a large language model |
US20230112921A1 (en) * | 2021-10-01 | 2023-04-13 | Google Llc | Transparent and Controllable Human-Ai Interaction Via Chaining of Machine-Learned Language Models |
CN115796299A (zh) * | 2021-10-01 | 2023-03-14 | 谷歌有限责任公司 | 经由机器学习语言模型的链的透明且可控的人智交互 |
KR20230076012A (ko) * | 2021-11-23 | 2023-05-31 | 네이버 주식회사 | 초대형 언어 모델을 이용한 페르소나 대화 데이터 생성 방법 및 시스템 |
CN116127020A (zh) * | 2023-03-03 | 2023-05-16 | 北京百度网讯科技有限公司 | 生成式大语言模型训练方法以及基于模型的搜索方法 |
CN116244416A (zh) * | 2023-03-03 | 2023-06-09 | 北京百度网讯科技有限公司 | 生成式大语言模型训练方法、基于模型的人机语音交互方法 |
CN116541497A (zh) * | 2023-04-25 | 2023-08-04 | 百度时代网络技术(北京)有限公司 | 任务型对话的处理方法、装置、设备和存储介质 |
CN116561278A (zh) * | 2023-05-05 | 2023-08-08 | 科大讯飞股份有限公司 | 知识问答方法、装置、设备及存储介质 |
CN116594768A (zh) * | 2023-05-05 | 2023-08-15 | 清华大学 | 面向大模型的通用工具协同和精细化学习系统及方法 |
CN116483977A (zh) * | 2023-05-05 | 2023-07-25 | 成都国佳电气工程有限公司 | 一种利用大语言模型实现移动机器人人机交互巡检的方法 |
CN116680093A (zh) * | 2023-05-20 | 2023-09-01 | 数字郑州科技有限公司 | 基于LLM的web应用优化系统及服务实现方法和系统 |
CN116756564A (zh) * | 2023-05-29 | 2023-09-15 | 阿波罗智联(北京)科技有限公司 | 面向任务解决的生成式大语言模型的训练方法和使用方法 |
CN116775183A (zh) * | 2023-05-31 | 2023-09-19 | 腾讯科技(深圳)有限公司 | 基于大语言模型的任务生成方法、系统、设备及存储介质 |
CN116776836A (zh) * | 2023-06-13 | 2023-09-19 | 江西师范大学 | 一种基于AI-Chain的文本生成方法 |
CN116775853A (zh) * | 2023-06-28 | 2023-09-19 | 唯思电子商务(深圳)有限公司 | 一种基于大语言模型的企业内部搜索引擎方法 |
CN116644145A (zh) * | 2023-07-26 | 2023-08-25 | 北京仁科互动网络技术有限公司 | 会话数据处理方法、装置、设备和存储介质 |
CN116701662A (zh) * | 2023-08-07 | 2023-09-05 | 国网浙江浙电招标咨询有限公司 | 基于知识图谱的供应链数据管理方法、装置、设备及介质 |
CN116737129A (zh) * | 2023-08-08 | 2023-09-12 | 杭州比智科技有限公司 | 一种供应链控制塔生成式大语言模型及其构建方法 |
Non-Patent Citations (2)
Title |
---|
JACKY LIANG ET AL.: "Code as Policies: Language Model Programs for Embodied Control", 《2023 IEEE INTERNATIONAL CONFERENCE ON ROBOTICS AND AUTOMATION(ICRA)》, pages 9493 - 9500 * |
张天杭: "基于预训练语言模型的中文知识图谱问答研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》, no. 01, pages 138 - 3340 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117350825A (zh) * | 2023-12-05 | 2024-01-05 | 浙江口碑网络技术有限公司 | 基于大语言模型的导购方法和系统 |
CN117350825B (zh) * | 2023-12-05 | 2024-03-15 | 浙江口碑网络技术有限公司 | 基于大语言模型的导购方法和系统 |
CN117743545B (zh) * | 2023-12-20 | 2024-05-17 | 北京橡数科技有限公司 | 一种基于toB企服项目交付系统业务数据获取方法和系统 |
CN117608764A (zh) * | 2024-01-18 | 2024-02-27 | 成都索贝数码科技股份有限公司 | 一种容器平台运维方法及系统 |
CN117608764B (zh) * | 2024-01-18 | 2024-04-26 | 成都索贝数码科技股份有限公司 | 一种容器平台运维方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN116992006B (zh) | 2024-01-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN116992006B (zh) | 一种大语言模型驱动的链式自然语言交互方法与系统 | |
Bangsow | Tecnomatix plant simulation | |
US8340995B2 (en) | Method and system of using artifacts to identify elements of a component business model | |
US8392013B2 (en) | Business process automation | |
US11847040B2 (en) | Systems and methods for detecting data alteration from source to target | |
US7392162B1 (en) | System and method for device developing model networks purely by modelling as meta-data in a software application | |
US20100223211A1 (en) | Decision service method and system | |
US20050066263A1 (en) | System and method for generating data validation rules | |
US20070027919A1 (en) | Dispute resolution processing method and system | |
US20060184492A1 (en) | Method, system, and program for defining and managing complex contingent rules, and exceptions thereto, in a rule-based computer system | |
Tannock et al. | Data-driven simulation of the supply-chain—Insights from the aerospace sector | |
CN110766289A (zh) | 一种风控规则动态调整方法、装置和电子设备 | |
KR102237877B1 (ko) | 실시간 협업지원 지능형 소프트웨어 자동 개발 시스템 및 그 방법 | |
US11681685B1 (en) | System for uploading information into a metadata repository | |
US20130042221A1 (en) | System and method for automatic impact variable analysis and field expansion in mainframe systems | |
US20240119225A1 (en) | Domain-specific language interpreter and interactive visual interface for rapid screening | |
US20030182303A1 (en) | System and method for automated database report definition | |
Krogstie | Capturing enterprise data integration challenges using a semiotic data quality framework | |
Ostermayer et al. | Knowledge engineering for business rules in prolog | |
KR101815561B1 (ko) | 전사적 자원관리 시스템의 클라이언트 프로그램 | |
US20090024507A1 (en) | Unique versatile axpert executor engine which can interpret and execute transaction structures and information views to build information systems | |
KR101855251B1 (ko) | 전사적 자원관리 시스템의 클라이언트 프로그램 | |
Stanev et al. | Why the standard methods, 5GL, common platforms and reusable components are the four pillars of the new computational paradigm Programming without programmers | |
Cao et al. | Data-driven simulation of the extended enterprise | |
CN114168121B (zh) | 一种基于代码工厂模式开发软件系统、终端和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |