CN116976640A - 自动化业务生成方法、装置、计算机设备及存储介质 - Google Patents
自动化业务生成方法、装置、计算机设备及存储介质 Download PDFInfo
- Publication number
- CN116976640A CN116976640A CN202311110495.9A CN202311110495A CN116976640A CN 116976640 A CN116976640 A CN 116976640A CN 202311110495 A CN202311110495 A CN 202311110495A CN 116976640 A CN116976640 A CN 116976640A
- Authority
- CN
- China
- Prior art keywords
- business
- node
- service
- generation
- preset
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 250
- 230000008569 process Effects 0.000 claims abstract description 195
- 238000012163 sequencing technique Methods 0.000 claims abstract description 14
- 238000012549 training Methods 0.000 claims description 84
- 238000011156 evaluation Methods 0.000 claims description 39
- 230000015654 memory Effects 0.000 claims description 37
- 230000003340 mental effect Effects 0.000 claims description 23
- 238000010845 search algorithm Methods 0.000 claims description 17
- 238000007781 pre-processing Methods 0.000 claims description 10
- 238000012544 monitoring process Methods 0.000 claims description 5
- 238000005516 engineering process Methods 0.000 abstract description 15
- 238000010586 diagram Methods 0.000 description 11
- 238000004891 communication Methods 0.000 description 7
- 230000008451 emotion Effects 0.000 description 7
- 238000007726 management method Methods 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 238000000354 decomposition reaction Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 238000005457 optimization Methods 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000002372 labelling Methods 0.000 description 4
- 230000007935 neutral effect Effects 0.000 description 4
- 238000013473 artificial intelligence Methods 0.000 description 3
- 238000013136 deep learning model Methods 0.000 description 3
- 230000007547 defect Effects 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 241001489523 Coregonus artedi Species 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000012790 confirmation Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000002708 enhancing effect Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 239000000047 product Substances 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000011511 automated evaluation Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000007306 functionalization reaction Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000009469 supplementation Effects 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
- 238000009966 trimming Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
- G06Q10/06315—Needs-based resource requirements planning or analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
- G06Q10/06311—Scheduling, planning or task assignment for a person or group
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0633—Workflow analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
- G06Q10/103—Workflow collaboration or project management
Landscapes
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Economics (AREA)
- Tourism & Hospitality (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Game Theory and Decision Science (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- Data Mining & Analysis (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请涉及自然语言理解技术领域,公开了自动化业务生成方法、装置、计算机设备及存储介质。本申请利用基目标大模型生成与接收的实际业务需求描述所属业务场景对应的业务步骤集合。相比于传统的自动化技术和软件系统,目标大模型具有更加优秀的自然语言理解能力,能够生成更符合实际业务需求描述的业务步骤集合,进而基于思维树进行业务步骤的自动化编排模拟了人类决策时探索不同的可能与在某个可能的节点前后进行探索的过程,提高了自动化业务编排的决策能力,能够根据不同的排序结果决策出一个自动化业务生成结果,提高了自动化业务编排的准确率。
Description
技术领域
本申请涉及自然语言理解技术领域,具体涉及自动化业务生成方法、装置、计算机设备及存储介质。
背景技术
自动化业务生成由于无需人工手动编排以及管理业务流程中业务步骤等优点,以成为业务编排中常用的方法之一。
传统的自动化业务生成的方法常常会利用自动化技术和软件系统,根据预定义的业务规则和逻辑,自动协调和编排各个业务场景下业务步骤的执行顺序和交互从而形成完整的业务流程。但是这种方法存在业务流程规划准确率不高的缺陷。
因此,如何提高自动化业务生成结果自动化业务生成结果的准确率,已成为目前亟需解决的问题。
发明内容
有鉴于此,本申请提供了一种自动化业务生成方法、装置、计算机设备及存储介质,以解决如何提高自动化业务生成结果自动化业务生成结果的准确率的问题。
第一方面,本申请提供了一种自动化业务生成方法,所述方法包括:
将接收的实际业务需求描述输入至目标大模型,生成与所述实际业务需求描述所属业务场景对应的业务步骤集合,所述目标大模型为基于不同业务场景对应的参考业务流程训练得到的大语言模型;
在当前迭代周期内,根据预设搜索算法,遍历思维树中的各个节点;
当遍历到所述思维树中的第一节点时,若所述第一节点存在对应的业务流程,对所述业务流程进行评估,所述第一节点为所述思维树中的任一节点;
当所述业务流程不符合预设条件,且所述业务流程中各个业务步骤之间的执行顺序合理时,在所述第一节点下生成预设数量的子节点,为每一个所述子节点分配剩余步骤集合以及所述第一节点对应的业务流程,所述业务步骤集合中除所述第一节点对应的业务流程中业务步骤以外的业务步骤构成所述剩余步骤集合;
根据预设排序规则,分别对每一个所述子节点各自对应的剩余步骤集合中的业务步骤进行排序,得到每一个所述子节点对应的排序结果;
根据第一子节点对应的排序结果,确定所述第一子节点对应的业务流程是否符合所述预设条件,所述第一子节点为预设数量的子节点中的任一个子节点;
当至少一个子节点对应的业务流程符合所述预设条件时,从至少一个子节点对应的业务流程中选取所述实际业务需求描述对应的自动化业务生成结果;
或者,
当所述预设数量的子节点对应的业务流程均不符合预设条件时,遍历所述思维树中的下一个节点。
在上述技术方案中,利用基于不同业务场景对应的参考业务流程训练得到的目标大模型,生成与接收的实际业务需求描述所属业务场景对应的业务步骤集合。相比于传统的自动化技术和软件系统,目标大模型具有更加优秀的自然语言理解能力,能够生成更符合实际业务需求描述的业务步骤集合,进而提高后续业务流程规划的准确率。在生成与实际业务需求描述所属业务场景对应的业务步骤集合之后,基于思维树进行业务步骤的自动化编排,根据预设搜索算法,遍历思维树中的各个节点,当遍历到对应业务流程不符合预设条件的节点,但该节点对应的业务流程中各个业务步骤之间的执行顺序合理时,就在该节点下生成预设数量的子节点,进而根据预设排序规则,分别对每一个子节点各自对应的剩余步骤集合中的业务步骤进行排序,得到每一个子节点对应的排序结果,实现从不同的分支,找到不同的排序结果的目的,进而在后续对多种可能的排序结果进行筛选,直到找到实际业务需求描述对应的自动化业务生成结果。相比于传统的自动化技术和软件系统中无法探索不同可能的缺陷,基于思维树的业务步骤的自动化编排,模拟了人类决策时探索不同的可能与在某个可能的节点前后进行探索的过程,提高了自动化业务编排的决策能力,能够根据不同的排序结果决策出一个自动化业务生成结果,提高了自动化业务编排的准确率。
在一些可选的实施例中,当第一节点并非为思维树的根节点时,当遍历到思维树中的第一节点时,若第一节点存在对应的业务流程,对业务流程进行评估,包括:
根据预获取的与实际业务需求描述所属业务场景对应的参考业务流程,评估第一节点对应的业务流程中各个业务步骤是否符合预设条件;
预设条件包括节点对应的业务流程中各个业务步骤之间的执行顺序合理,且节点对应的业务流程完整。
在上述技术方案中,根据预获取的与实际业务需求描述所属业务场景对应的参考业务流程中各个业务步骤之间的执行顺序,评估第一节点存在对应的业务流程中各个业务步骤之间的执行顺序是否合理,并判断第一节点对应的剩余业务步骤集合是否为空,如果为空则业务流程完整,否则业务流程不完整。依据与实际业务需求描述所属业务场景对应参考业务流程来判断第一节点对应的业务流程中各个业务步骤是否符合预设条件,考虑了业务场景对应业务流程的传统情况,进一步提高了节点对应业务流程中业务步骤编排的合理性与准确性。
在一些可选的实施例中,当第一节点为思维树的根节点时,当遍历到思维树中的第一节点时,若第一节点存在对应的业务流程,对业务流程进行评估,包括:
确定第一节点对应的剩余步骤集合是否为空;
当确定第一节点对应的剩余步骤集合不为空时,确定第一节点对应的业务流程不符合预设条件。
在上述技术方案中,当第一节点为根节点时,仅考虑第一节点对应的剩余步骤集合是否为空,如果不为空意味着,当前迭代周期内才刚刚开始编排业务步骤集合中的业务步骤,可以确定第一节点对应的业务流程不符合预设条件。
在一些可选的实施例中,在将接收的实际业务需求描述输入至目标大模型,生成与实际业务需求描述所属业务场景对应的业务步骤集合之前,所述方法还包括:
将预获取的不同业务场景的初始业务流程分别输入至第一生成式大模型,获取每一种业务场景对应的优化后业务流程;
对优化后业务流程进行数据预处理操作,得到处理后业务流程;
基于预设分布式训练框架、预设优化器以及处理后业务流程,对第二生成式大模型进行迭代训练后,获取目标大模型。
在上述技术方案中,第一生成式大模型能够对预获取的不同业务场景的初始业务流程进行优化,得到优化后业务流程,不再需要人为对预获取的不同业务场景的初始业务流程进行标注以及核对,大大降低了初始化业务流程的处理时间,提高了后续模型训练的效率。进而对优化后业务流程进行数据预处理操作,以便于利用预设分布式训练框架、预设优化器以及处理后业务流程,对第二生成式大模型进行迭代训练,以提高第二生成式大模型的业务步骤生成能力,从而获取的目标大模型就具有较高的业务步骤生成能力,可以在后续生成准确的业务步骤,进而提高自动化业务编排的准确性。另外,预设分布式训练框架可以将第二生成式大模型进行分布训练,加快第二生成式大模型的训练效率。预设优化器减少可以模型训练过程中的冗余内存使用,以便能够训练第二生成式大模型。
在一些可选的实施例中,将预获取的不同业务场景的初始业务流程分别输入至第一生成式大模型,获取每一种业务场景对应的优化后业务流程,包括:
获取针对不同业务场景设置的步骤生成提示条件,步骤生成提示条件用于引导第一生成式大模型生成不同业务场景对应的业务流程;
将第一业务场景的初始业务流程以及第一业务场景对应的步骤生成提示条件输入至第一生成式大模型,以便于第一生成式大模型响应于第一业务场景对应的步骤生成提示条件,基于自我指导的方式优化第一业务场景的初始业务流程,得到第一业务场景对应的优化后业务流程,第一业务场景为预获取的业务场景中的任一个业务场景。
在上述技术方案中,利用第一生成式大模型基于自我指导的方式对第一业务场景的初始业务流程进行优化,以得第一业务场景对应的优化后业务流程,自我指导的方式通常是自动生成标签或反馈来进行模型训练,不再需要人工标注不同场景的初始业务流程,进而加快了后续对第二生成式大模型的训练速度。
在一些可选的实施例中,所述方法还包括:
当第一节点对应的业务流程符合预设条件时,将第一节点对应的业务流程确定为实际业务需求描述对应的自动化业务生成结果。
在一些可选的实施例中,所述方法还包括:
监测当前迭代周期是否满足迭代停止条件,迭代停止条件包括已确定实际业务需求描述对应的自动化业务生成结果,或者已将思维树中的所有节点遍历;
若当前迭代周期是否满足迭代停止条件,将迭代次数加一,并确定迭代次数是否大于或等于预设阈值,预设阈值大于或等于2;
当迭代次数小于预设阈值时,进入下一个迭代周期,直至迭代次数大于或等于预设阈值时,停止迭代;
从所有迭代周期分别确定的实际业务需求描述对应的自动化业务生成结果中,选取实际业务需求描述对应的最优自动化业务生成结果。
在上述技术方案中,从多次迭代周期中确定的实际业务需求描述对应的自动化业务生成结果中,选出最优自动化业务生成结果,考虑到了目标大模型对于相同的输入,输出往往会不一致的不稳定的问题,保证了实际业务需求描述对应的自动化业务生成结果的可靠性,进一步提高了自动化业务编。
第二方面,本申请提供了一种自动化业务编排装置,装置包括:
第一生成模块,用于将接收的实际业务需求描述输入至目标大模型,生成与实际业务需求描述所属业务场景对应的业务步骤集合,目标大模型为基于不同业务场景对应的参考业务流程训练得到的大语言模型;
遍历模块,用于在当前迭代周期内,根据预设搜索算法,遍历思维树中的各个节点;
评估模块,用于当遍历到思维树中的第一节点时,若第一节点存在对应的业务流程,对业务流程进行评估,第一节点为思维树中的任一节点;
第二生成模块,用于当业务流程不符合预设条件,且业务流程中各个业务步骤之间的执行顺序合理时,在第一节点下生成预设数量的子节点,为每一个子节点分配剩余步骤集合以及第一节点对应的业务流程,业务步骤集合中除第一节点对应的业务流程中业务步骤以外的业务步骤构成剩余步骤集合;
排序模块,用于根据预设排序规则,分别对每一个子节点各自对应的剩余步骤集合中的业务步骤进行排序,得到每一个子节点对应的排序结果;
确定模块,用于根据第一子节点对应的排序结果,确定第一子节点对应的业务流程是否符合预设条件,第一子节点为预设数量的子节点中的任一个子节点;
选取模块,用于当至少一个子节点对应的业务流程符合预设条件时,从至少一个子节点对应的业务流程中选取实际业务需求描述对应的自动化业务生成结果;
或者,
当预设数量的子节点对应的业务流程均不符合预设条件时,遍历思维树中的下一个节点。
第三方面,本申请提供了一种计算机设备,包括:存储器和处理器,存储器和处理器之间互相通信连接,存储器中存储有计算机指令,处理器通过执行计算机指令,从而执行上述自动化业务生成方法。
第四方面,本申请提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机指令,计算机指令用于使计算机执行上述自动化业务生成方法。
附图说明
为了更清楚地说明本申请具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本申请实施例的一种自动化业务编排系统的结构示意图;
图2是根据本申请实施例的一种自动化业务生成方法的流程示意图;
图3是根据本申请实施例的一种自动化业务生成方法的总体框架图;
图4是根据本申请实施例的又一种自动化业务生成方法的流程示意图;
图5是根据本申请实施例的思维数框架中思维树的示意图;
图6是一种示例中预设搜索算法遍历思维树中部分节点的示意图;
图7是根据本申请实施例的一种自动化业务编排装置的结构示意图;
图8是根据本申请实施例的计算机设备的硬件结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
应理解,在本申请的实施例中提到的“指示”可以是直接指示,也可以是间接指示,还可以是表示具有关联关系。举例说明,A指示B,可以表示A直接指示B,例如B可以通过A获取;也可以表示A间接指示B,例如A指示C,B可以通过C获取;还可以表示A和B之间具有关联关系。
在本申请实施例的描述中,术语“对应”可表示两者之间具有直接对应或间接对应的关系,也可以表示两者之间具有关联关系,也可以是指示与被指示、配置与被配置等关系。
本申请实施例中,“预定义”可以通过在设备(例如,包括终端设备和网络设备)中预先保存相应的代码、表格或其他可用于指示相关信息的方式来实现,本申请对于其具体的实现方式不做限定。
业务服务自编排是一种自动化业务流程的方法。它涉及协调和组织多个业务服务或任务,以实现特定的业务目标。在传统的应用中,业务流程通常由手动的、人工驱动的方法来执行。但随着业务的复杂性和规模的增加,手动管理业务流程变得困难且容易出错。因此,业务服务自编排的概念出现了。业务服务自编排利用自动化技术和软件系统,根据预定义的业务规则和逻辑,自动协调和编排各个业务服务或任务的执行顺序和交互。它可以将不同的服务和任务组合起来,形成一个完整的业务流程,并确保按照特定的顺序和条件执行。但是,利用自动化技术和软件系统方式进行业务服务自编排存在业务识别,业务规划准确率不高的问题。而随着计算机性能的提高,使用神经网络构建深度学习模型同样为了服务自编排的一种选择。深度学习模型提高了业务识别,规划的准确性,但是无法识别训练中未出现的业务服务。
最近,生成式大语言模型,例如,聊天机器人(Chat Generative Pre-trainedTransformer,ChatGPT)在自然语义理解方面取得了革命性的进步。它们在处理通用任务上超越了绝大多数小模型,并且展现出小规模预训练模型所不具备的“涌现”能力,进一步增强了大语言模型的智能水平。因此,大语言模型被认为是通往通用人工智能的潜在路径之一。
综上来说,现有技术中的方案在业务步骤自编排中,存在业务步骤编排准确性低,无法识别未知业务服务的问题。而生成式大语言模型的出现,给业务服务自编排提供了一条新的思路。
图1是本申请实施例的一种自动化业务编排系统的结构示意图,该自动化业务编排系统中包括运行有目标大模型的电子设备110。
电子设备可以是服务器,目标大模型可以是任一种大语言模型,例如ChatGPT或者对话机器人(Chat Generalized Linear Model,ChatGLM),目标大模型用于根据给定的实际业务需求描述,生成与实际业务需求描述所示业务场景对应的各个业务步骤,同时使用思维树对生产的各个业务步骤进行排序,得到一个完整的与实际业务需求描述所示业务场景对应的业务流程,以满足自动化业务步骤编排中复杂的业务需求。
可选的,电子设备110可以通过传输网络(如无线通信网络)与用户终端120通信连接,电子设备110可以通过传输网络获取用户在用户终端120中输入的实际业务需求描述,并向用户终端120返回实际业务需求描述对应的自动化业务生成结果。用户还可以直接向电子设备110输入实际业务需求描述。
可选的,电子设备110中也可以运行有第一生成式大模型,第一生成式大模型可以任一种大模型,可以是任一种多模态的大模型(large multimodal model),多模态就意味着和客观世界的关联性更高,也意味着输入-输出更丰富,例如,“生成式预训练转换器4”(generative pretrained transformer 4,gpt-4)。第一生成式大模型用于基于预获取的不同业务场景的初始业务流程生成第二生成式大模型的训练集,进而对第二生成式大模型进行得到训练以得到目标大模型,第二生成式大模型为训练前的目标大模型。
可选的,服务器可以是由多个物理服务器构成的服务器集群或者是分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等技术运计算服务的云服务器。
图2是本申请实施例的一种自动化业务生成方法的流程示意图,该方法由计算机设备执行,该计算机设备可以是如图1中所示的电子设备110。如图2所示,该自动化业务生成方法可以包括如下步骤:
步骤201,将接收的实际业务需求描述输入至目标大模型,生成与实际业务需求描述所属业务场景对应的业务步骤集合。
步骤202,在当前迭代周期内,根据预设搜索算法,遍历思维树中的各个节点。
步骤203,当遍历到思维树中的第一节点时,若第一节点存在对应的业务流程,对业务流程进行评估。
步骤204,当业务流程不符合预设条件,且业务流程中各个业务步骤之间的执行顺序合理时,在第一节点下生成预设数量的子节点,为每一个子节点分配剩余步骤集合以及第一节点对应的业务流程。业务步骤集合中除第一节点对应的业务流程中业务步骤以外的业务步骤构成剩余步骤集合。
步骤205,根据预设排序规则,分别对每一个子节点各自对应的剩余步骤集合中的业务步骤进行排序,得到每一个子节点对应的排序结果。
步骤206,根据第一子节点对应的排序结果,确定第一子节点对应的业务流程是否符合预设条件。
步骤207,当至少一个子节点对应的业务流程符合预设条件时,从至少一个子节点对应的业务流程中选取实际业务需求描述对应的自动化业务生成结果;
或者,
当预设数量的子节点对应的业务流程均不符合预设条件时,遍历思维树中的下一个节点。
在步骤201中,目标大模型为基于不同业务场景对应的参考业务流程训练得到的大语言模型,不同业务场景对应的参考业务流程为经过数据处理操作后的不同业务场景的初始业务流程,具体的处理操作在后续实施例中进行介绍。在计算机设备将接收的实际业务需求描述输入至目标大模型后,目标大模型就可以自动生成实际业务需求描述所属业务场景对应的业务步骤集合。
在步骤202中,预设搜索算法可以是线性搜索、二分查找、广度优先搜索(BreadthFirst Search,BFS)、深度优先搜索(Depth First Search,DFS)或A(A-Star)算法。可以根据实际的应用选择和优化适合的搜索算法以在思维树进行搜索。思维树是思维树框架中一种用于描述问题解决过程的树形结构,其中每个节点表示一个操作或决策。在本申请实施例中,思维树中的每一个节点表示自动化业务步骤编排的一个决策结果,这个决策结果中包含了业务步骤集合中已排序的业务步骤组成的业务流程,以及业务步骤集合中未被排序的业务步骤。思维树中每生成一个节点,都意味着一次决策,计算机设备会为生成的节点分配决策结果。将思维树框架与目标大模型结合,可以利用思维框架解决自动化编排业务步骤集合中的业务步骤的问题,在解决问题的过程中会生成思维树。因此。在当前迭代周期内,计算机设备可以根据预设搜索算法,遍历思维树中已生成的各个节点。
在步骤203中,第一节点为思维树中的任一节点。计算机设备遍历到第一节点时,会读取第一节点表示的决策结果,并判断决策结果中是否存在业务流程,如果存在,则利用思维树框架中的状态评估器对第一节点对应的业务流程进行评估。
在步骤204中,业务步骤集合中除第一节点对应的业务流程中业务步骤以外的业务步骤构成剩余步骤集合。当第一节点对应的业务流程不符合预设条件,且业务流程中各个业务步骤之间的执行顺序合理时,意味着当前遍历到的第一节点对应的业务流程还不完善,应该继续利用思维树框架进行业务步骤的编排,也即需要在思维树中生成的新的节点。因此,计算机设备会在第一节点下生成预设数量的子节点,为每一个子节点分配剩余步骤集合以及第一节点对应的业务流程。预设数量可以自行设置本申请实施例不做具体限制,优选的预设数量可以为3。
在步骤205中,预设排序规则为对自动化编排业务步骤集合中的业务步骤的问题进行问题分解时,设置的排序规则。问题分解意义在于将复杂问题拆解成为小问题。由于在利用思维树框架解决自动化编排业务步骤集合中的业务步骤的问题时,会在要求目标大模型在每一节点下产生多种决策结果,因此对于问题拆解的要求较高,拆解后的问题不宜过大也不宜过小。预设排序规则可以为按照概率集合中概率取值从大到小的顺利对剩余步骤集合中的业务步骤进行排序,其中,概率集合中的概率取值与剩余步骤集合中每一个业务步骤一一对应,概率取值表示剩余步骤集合中一个业务步骤出现在已排序业务步骤之后的可能,已排序业务步骤可以是节点对应的业务流程中的任一个业务步骤。
在步骤206中,预设条件包括节点对应的业务流程中各个业务步骤之间的执行顺序合理,且节点对应的业务流程完整,第一子节点为预设数量的子节点中的任一个子节点。计算机设备将第一子节点对应的排序结果中最可能出现在已排序步骤之后的业务步骤,添加在已排序业务步骤之后,形成一个新的业务流程,并将新的业务流程确定为第一子节点对应的业务流程,进而利用思维树框架中的状态评估器判断第一子节点对应的业务流程是否符合预设条件。
在步骤207中,当第一子节点下预设数量的子节点对应的业务流程均不符合预设条件时,就继续遍历思维树中的下一个节点,当遍历到一个新节点时,对新节点的操作流程与步骤205至步骤206类似,在此不做赘述。直至找到实际业务需求描述对应的自动化业务生成结果,或者思维树中所有节点均被遍历。
当至少一个子节点对应的业务流程符合预设条件时,意味着至少一个子节点对应的业务流程已经编排完成,计算机设备会从至少一个子节点对应的业务流程中选取最符合实际业务需求描述的业务流程,并将选取出的业务流程确定为实际业务需求描述对应的自动化业务生成结果。可以理解的是,当仅有一个子节点对应的业务流程符合预设条件时,就将该子节点对应的业务流程确定为实际业务需求描述对应的自动化业务生成结果。
本申请实施例中,利用基于不同业务场景对应的参考业务流程训练得到的目标大模型,生成与接收的实际业务需求描述所属业务场景对应的业务步骤集合。相比于传统的自动化技术和软件系统,目标大模型具有更加优秀的自然语言理解能力,能够生成更符合实际业务需求描述的业务步骤集合,进而提高后续业务流程规划的准确率。在生成与实际业务需求描述所属业务场景对应的业务步骤集合之后,基于思维树进行业务步骤的自动化编排,根据预设搜索算法,遍历思维树中的各个节点,当遍历到对应业务流程不符合预设条件的节点,但该节点对应的业务流程中各个业务步骤之间的执行顺序合理时,就在该节点下生成预设数量的子节点,进而根据预设排序规则,分别对每一个子节点各自对应的剩余步骤集合中的业务步骤进行排序,得到每一个子节点对应的排序结果,实现从不同的分支,找到不同的排序结果的目的,进而在后续对多种可能的排序结果进行筛选,直到找到实际业务需求描述对应的自动化业务生成结果。相比于传统的自动化技术和软件系统中无法探索不同可能的缺陷,基于思维树的业务步骤的自动化编排,模拟了人类决策时探索不同的可能与在某个可能的节点前后进行探索的过程,提高了自动化业务编排的决策能力,能够根据不同的排序结果决策出一个自动化业务生成结果,提高了自动化业务编排的准确率。
为了进一步提高自动化业务编排的准确率,图3是本申请实施例的一种自动化业务生成方法的总体框架图,下面结合图3对图4中本申请实施例的又一种自动化业务生成方法的流程示意图,该方法由计算机设备执行,该计算机设备可以是如图1中所示的电子设备110。如图4所示,该自动化业务生成方法可以包括如下步骤:
步骤401,将接收的实际业务需求描述输入至目标大模型,生成与实际业务需求描述所属业务场景对应的业务步骤集合。
详细请参见图2所示实施例的步骤201,在此不再赘述。
可选的,计算机设备在接收到实际业务需求描述后,可以利用目标大模型识别实际业务需求所属的业务场景,并将针对该业务场景预设的第一提示条件(以下将提示条件称为Prompt)中预设的占位符(或者是特殊的标记)替换为实际业务需求描述,进而将替换后的第一预设提示描述输入至目标大模型中,目标大模型就会响应于第一Prompt,自动生成与实际业务需求描述所属业务场景对应的业务步骤,进而得到业务步骤集合。
针对不同业务场景预设的Prompt是一种指令或者问题,用于引导大模型生成特定类型的输出。为了使大模型能够生成与实际业务需求描述所属业务场景对应的业务步骤集合。首先,需要构建一个合适的Prompt,以便向目标大模型提供必要的指导。Prompt可以是一个简短的文本字符串,描述所需的业务步骤或者问题的形式。为了使Prompt能够有效地引导大模型生成合适的输出,它应该包含与业务场景相关的关键信息和约束条件。一种常用的上下文学习(in-context learning)技术是通过在Prompt中插入特定的标记或者占位符,并使用相应的实际输入数据进行替换。例如,可以在Prompt中使用"<sentence>"作为占位符表示业务需求描述,并在实际生成时将其替换为接收的实际业务需求描述。第一Prompt可以被设置为“请生成下文输入的句子的业务步骤。"<sentence>"”。
可选的,虽然目标大模型在经过训练后具有很强的通用性,但对于特定领域的业务场景对应业务步骤集合的生成中可能存在一定的限制。很多时候,由于目标大模型未在该领域的业务场景上进行过训练,导致目标大模型在该领域的业务场景表现效果不佳。因此,可以使用上下文学习(In-context learning)技术构造第一Prompt。通过In-contextlearning技术构造的第一Prompt中提供生成业务步骤时的若干示例或者指令来增强上下文,从而可以提升目标大模型的预测效果,进而生成更准确的业务步骤集合,从而提高自动化业务编排的准确率。
In-context learning是一种提升Prompt的技巧手段。很多时候,大语言模型可能无法理解,或是对给定的Prompt理解存在差错,这样导致大语言模型无法如人类设想的那样,给出相应的结果。In-context learning方法简单,仅仅只需要修改输入Prompt,即在原有Prompt下添加一些例子。比如情感分类任务,原有的Prompt如下:“请对下面输入的句子做情感分类,将其分到积极,中性,消极中的一类”。In-context learning会在Prompt之后添加几个实例,例子如下所示:
我很高兴今天考试考得很好!该句子情感为积极。
这部电影太让人失望了,情节很无聊。该句子情感为消极。
今天是6月20日。该句子情感为中性。
那么,经过In-context learning后,完整的Prompt例子如下所示:
请对下文输入的句子做情感分类,将其分到积极,中性,消极中的一类。
今天天气真不错。
以下为几个例子:
我很高兴今天考试考得很好!该句子情感为积极。
这部电影太让人失望了,情节很无聊。该句子情感为消极。
今天是6月20日。该句子情感为中性。
In-context learning技术可以对大语言模型额外训练,使大语言模型更专业化、适应特定任务,同时提高大语言模型的自然语言理解能力,并能够提供更准确、个性化的回答和解决方案。
因此,可以在针对不同的业务场景设置Prompt时,结合In-context learning技术,在不同的业务场景对应的Prompt下也添加几个该业务场景所示领域的业务步骤的例子,来帮助目标大模型更好的生成实际业务需求描述所属业务场景对应的业务步骤,从而得到业务步骤集合。
例如,以实例业务需求描述为“我想去银行贷款”为例,预设的第一Prompt如下所示:
请生成下文输入的句子的业务。
我想去银行贷款
以下为几个例子:
我想去银行存款:存款业务,储蓄账户开设,存款方式选择,存款金额确认,存款凭证发放,利息计算;
我想去银行买保险:保险咨询,保险产品选择,保险投保申请,保险费用计算,保险合同签署,保险理赔服务。
目标大模型最后会输出如下文本:
我想去银行贷款:贷款申请,信用评估,贷款审批,还款管理,贷款签约资金发放。从而计算设备得到的业务步骤集合中就包括贷款申请、信用评估、贷款审批、还款管理以及贷款签约资金发放的业务步骤。
步骤402,在当前迭代周期内,根据预设搜索算法,遍历思维树中的各个节点。
详细请参见图2所示实施例的步骤202,在此不再赘述。
步骤403,当遍历到思维树中的第一节点时,若第一节点存在对应的业务流程,对业务流程进行评估。
详细请参见图2所示实施例的步骤203,在此不再赘述。
可选的,当第一节点并非为思维树的根节点时,步骤303,当遍历到思维树中的第一节点时,若第一节点存在对应的业务流程,对业务流程进行评估,可以包括:
根据预获取的与实际业务需求描述所属业务场景对应的参考业务流程,评估第一节点对应的业务流程中各个业务步骤是否符合预设条件;
预设条件包括节点对应的业务流程中各个业务步骤之间的执行顺序合理,且节点对应的业务流程完整。
计算机设备会利用思维树框架中状态评估器,根据预获取的与实际业务需求描述所属业务场景对应的参考业务流程中各个业务步骤之间的执行顺序,评估第一节点存在对应的业务流程中各个业务步骤之间的执行顺序是否合理,并判断第一节点对应的剩余业务步骤集合是否为空,如果为空则业务流程完整,否则业务流程不完整。依据与实际业务需求描述所属业务场景对应参考业务流程来判断第一节点对应的业务流程中各个业务步骤是否符合预设条件,考虑了业务场景对应业务流程的传统情况,进一步提高了节点对应业务流程中业务步骤编排的合理性与准确性。
可选的,当第一节点为思维树的根节点时,步骤303,当遍历到思维树中的第一节点时,若第一节点存在对应的业务流程,对业务流程进行评估,可以包括:
确定第一节点对应的剩余步骤集合是否为空;
当确定第一节点对应的剩余步骤集合不为空时,确定第一节点对应的业务流程不符合预设条件。
当第一节点为根节点时,仅考虑第一节点对应的剩余步骤集合是否为空,如果不为空意味着,当前迭代周期内才刚刚开始编排业务步骤集合中的业务步骤,计算机设备会直接确定第一节点对应的业务流程不符合预设条件。当确定剩余步骤集合为空时,这结束对思维树的遍历。
可选的,当第一节点不存在业务流程时,自动化业务生成方法还可以包括:
确定第一节点对应的剩余步骤集合是否为空;
当确定第一节点对应的剩余步骤集合不为空时,在第一节点下生成预设数量的子节点,为每一个子节点分配剩余步骤集合,进入步骤305;
或者,当确定剩余步骤集合为空时,这结束对思维树的遍历。
步骤404,当业务流程不符合预设条件,且业务流程中各个业务步骤之间的执行顺序合理时,在第一节点下生成预设数量的子节点,为每一个子节点分配剩余步骤集合以及第一节点对应的业务流程。业务步骤集合中除第一节点对应的业务流程中业务步骤以外的业务步骤构成剩余步骤集合。
详细请参见图2所示实施例的步骤204,在此不再赘述。
步骤405,根据预设排序规则,分别对每一个子节点各自对应的剩余步骤集合中的业务步骤进行排序,得到每一个子节点对应的排序结果。
详细请参见图2所示实施例的步骤205,在此不再赘述。
步骤406,根据第一子节点对应的排序结果,确定第一子节点对应的业务流程是否符合预设条件。
详细请参见图2所示实施例的步骤206,在此不再赘述。
步骤407,当至少一个子节点对应的业务流程符合预设条件时,从至少一个子节点对应的业务流程中选取实际业务需求描述对应的自动化业务生成结果;
或者,
当预设数量的子节点对应的业务流程均不符合预设条件时,遍历思维树中的下一个节点。
详细请参见图2所示实施例的步骤207,在此不再赘述。
可选的,当第一节点对应的业务流程符合预设条件时,将第一节点对应的业务流程确定为实际业务需求描述对应的自动化业务生成结果。
进一步的,在步骤402至步骤407中,将思维树框架与目标大模型结合,解决自动化编排业务步骤集合中的业务步骤的问题,可以是将思维树框架与目标大模型结合后,利用搭载思维树框架的目标大模型,在当前迭代周期内对业务步骤集合中的业务步骤进行自动化编排。计算机设备将预设的第二Prompt中预设的占位符(或者是特殊的标记)替换为业务步骤集合中的业务步骤,进而将第二Prompt输入至目标大模型,使目标大模型响应于该第二Prompt,利用思维框架对业务步骤集合中的业务步骤进行自动化编排。
思维树框架使用大语言模型模拟人类的决策过程,以解决复杂问题。具体思维树框架中的思维树如图5所示。思维树框架的设计分成四个部分:问题分解,思维生成,状态评价,搜索算法。
问题分解意义在于将复杂问题拆解成为小问题。由于思维树框架要求模型在每一节点产生多种决策结果,因此对于问题拆解的要求较高,拆解后的问题不宜过大也不宜过小。在图5中,每个矩形框代表一个节点的思维,这个思维代表每一个小问题的输出结果,同时作为下一个小问题的输入。输入表示思维树的根节点,输出为思维树最终的决策结果。
思维生成的含义是对于每一个节点,都会生成多个决策结果进行评估,如图5所示,在该思维树框架中,每个节点会生成3个决策结果。
状态评估指对现有状态进行评估。每运行到一个节点时,会通过状态评估器对当前节点状态进行评估,评估该节点产生的决策结果是否合理。如果合理,会基于当前节点进行思维生成,用于后续的搜索。如果不合理,则排除,不会进行思维生成,转而搜索其他节点。
搜索算法指如何在大规模数据集或问题空间中查找特定项或解决特定问题的算法。常见的搜索算法包括线性搜索,二分查找,广度优先搜索(BFS),深度优先搜索(DFS),A算法。在思维树框架中,可以根据实际的应用选择和优化适合的算法。
在本申请实施中,利用目标大模型通过思维框架对业务步骤集合中的业务步骤进行自动化编排,以生成思维树。这要求对思维树框架的四个部分进行设计,具体设计如下:
问题分解:将对业务步骤集合中的业务步骤进行自动化编排的问题转为排序问题,每一次剩余业务步骤集合中选出最后可能出现在已排序业务步骤之后的业务步骤,并将其加入到已排序业务步骤之后。因此,第二Prompt的内容可以设置为如下表1所示的内容。
表1,第二Prompt的内容
其中,预设数量可以设置为3,已排序业务列表即为思维树中节点对应的业务流程中已排序的各个业务步骤,剩余业务列表即为思维树中节点对应的剩余业务步骤集合。可以理解的是,业务步骤集合中的业务步骤被填入第二Prompt的剩余业务列表中。
思维生成:每个节点可生成的子节点在设置为预设数量。
状态评估:使用目标大模型对每一次生成的已排序业务列表进行评估。在评估时还需要设置第三Prompt,以便计算机设备可以利用目标大模型进行评估。第三Prompt的内容可以设置为如下表2所示的内容。
表2,第三Prompt的内容
目标大模型在按编号顺序返回res中的结果时,会按照res中业务步骤的执行顺序的先后顺序,对res中业务步骤进行编号,进而将res中每一个业务步骤以及每一个业务步骤对应的编号返回。
搜索算法:预设搜索算法可以采用BFS算法进行节点搜索。广度优先搜索(BFS)是一种图搜索算法,用于在图或树数据结构中从根节点开始,逐层地向外扩展搜索,直到找到目标节点或遍历完所有可达节点。BFS算法的基本思想是通过维护一个队列(通常使用双端队列)来控制搜索的顺序。开始时,将根节点放入队列,并将其标记为已访问。然后按照先进先出的原则,逐个取出队列中的节点,并探索它们的邻居节点。具体步骤如下:
1.将根节点放入队列,并标记为已访问。
2.循环执行以下步骤,直到队列为空:
从队列中取出一个节点;
检查该节点是否为目标节点,如果是,则搜索结束,返回结果。在本申请实施例中,计算机设备会将第三Prompt输入至目标大模型,以使目标大模型基于思维树框架对遍历到的节点对应的res进行评估。计算机设备利用目标大模型将第三Prompt作为节点评判标准。如果该节点对应的目标大模型输出的内容(也即该节点对应的res)为不合理,则该节点不是目标节点,不会对该节点进行思维生成(也即不会在该节点下生成预设数量的子节点以及进行后续步骤)。如果目标大模型输出的内容合理,但addition不为空,该节点也不是目标节点,但会对该节点进行思维生成。如果输出的内容合理,且addition已经为空,则该节点为目标节点,算法终止并返回该节点内容。
当给节点不是目标节点时,获取该节点的所有未访问邻居节点,并将它们添加到队列中,并标记为已访问。
3.如果队列为空且未找到目标节点,则搜索结束,表示无法找到目标节点。
在一种示例中,如图6所示,预设搜素算法为BFS算法,使用BFS算法对思维树已生成的节点进行遍历。第一轮遍历节点1,第二轮依次遍历2,3,4。第三轮依次遍历5,6,7。第四轮依次遍历8,9,10。
思维树的总体流程就是首先将问题差分成多个小问题。图6思维树将问题拆分成3个小问题(去除根节点,有3层)。然后每个节点都会生成多个决策结果,在图6中每个节点会生成3个决策结果。之后通过BFS进行遍历。第一轮遍历节点1时,生成2,3,4,三个决策结果。第二轮遍历节点2,3,4。由于在遍历的时候会对节点对应的res进行评估,图6中3,4节点评估失败,所以不会根据3,4节点生成后续决策结果。而节点2评估成功,所以生成后续5、6以及7三个子节点。第三轮遍历节点5,6,7,只有节点5评估成功,生成后续8,9,10节点。第四轮遍历8,9,10节点,只有节点10是目标节点,最后目标大模型输出节点10对应res中的业务步骤。
在使用时,将步骤401生成的业务步骤集合中的业务步骤输入到结合了思维树框架的目标大模型上,配合第二Prompt,对业务步骤集合中的业务步骤镜像自动化编排。
由于思维树每一层只对该层中的每一个节点对应addition中的一个业务步骤进行排序,因此思维树框架的层数与步骤401生成的业务步骤数量有关。假定步骤401生成的业务服务数量为n,则最终生成的思维树的层数为n+1(包括思维树根节点)。
将思维树框架引入目标大模型中,利用思维树组织和管理业务步骤。思维树框架的根节点表示整个业务服务的起始状态或问题的初始状态。每个子节点代表一个可能的业务步骤,这些业务步骤是根据目标大模型预测得到的。在思维树框架中,节点之间通过不同的连接关系进行连接,例如顺序关系、并行关系或条件关系等。这些连接关系定义了业务步骤之间的执行顺序和条件依赖关系。通过这样的编排,可以保证生成的自动化业务生成结果在执行时具有合理的逻辑顺序和约束条件。在自编排过程中,目标大模型的生成的业务步骤集合中的业务步骤被视为思维树框架中的候选业务步骤,而思维树框架提供了结构化的方式来组织和选择这些候选业务步骤。通过遍历思维树框架的节点,可以对生成的业务步骤进行筛选、排序和组合,以得到更加合理和高效的业务编排结果。综上所述,通过结合目标大模型的生成能力和思维树框架的结构化管理能力,能够自动组织和编排生成的业务步骤,从而实现更加智能和高效的业务服务自编排。
步骤408,监测当前迭代周期是否满足迭代停止条件;
若当前迭代周期是否满足迭代停止条件,将迭代次数加一,并确定迭代次数是否大于或等于预设阈值;
当迭代次数小于预设阈值时,进入下一个迭代周期,直至迭代次数大于或等于预设阈值时,停止迭代。
迭代停止条件包括已确定实际业务需求描述对应的自动化业务生成结果,或者已将思维树中的所有节点遍历。预设阈值大于或等于2,可以自行设置,优选的,预设阈值可以为3。计算机设备会实时监测当前迭代周期中是否已经确定了实际业务需求描述对应的自动化业务生成结果,以及监测思维树中的所有节点是否已经被全部遍历。当监测到已经确定了实际业务需求描述对应的自动化业务生成结果,或者思维树中的所有节点是否已经被全部遍历,则确定当前迭代周期满足迭代停止条件。进而将迭代次数加一,并确定迭代次数是否大于或等于预设阈值,当迭代次数小于预设阈值时,进入下一个迭代周期,直至迭代次数大于或等于预设阈值时,停止迭代。
步骤409,从所有迭代周期分别确定的实际业务需求描述对应的自动化业务生成结果中,选取实际业务需求描述对应的最优自动化业务生成结果。
计算机设备会记录每一次迭代周期中确定的实际业务需求描述对应的自动化业务生成结果,并利用目标大模型对所有迭代周期记录的实际业务需求描述对应的自动化业务生成结果进行评优打分,将分数最高的自动化业务生成结果确定为实际业务需求描述对应的最优自动化业务生成结果。
进一步的,在步骤409中,计算机设备可以将预设的第四Prompt中预设的占位符(或者是特殊的标记)替换为每一次迭代周期中记录的实际业务需求描述对应的自动化业务生成结果,进而将第四Prompt输入至目标大模型,使目标大模型响应于该第四Prompt,对每一个记录的自动化业务生成结果进行评优打分,从而将分数最高的自动化业务生成结果确定为实际业务需求描述对应的最优自动化业务生成结果。第四的Prompt的内容可以如表3所示,其中<输入文本>即为实际业务需求描述,每个模型的输出即为目标大模型的输出(也即实际业务需求描述对应的自动化业务生成结果),系统1至系统3表示不用迭代周期内的目标大模型,可以理解的是第四的Prompt中系统的个数与预设阈值一致,当预设阈值为4时,第四的Prompt会包括系统1至系统4。
表3,第四的Prompt的内容
可选的,还可以输出每一个实际业务需求描述对应的自动化业务生成结果的评优打分以及打分理由,以便于用户基于每一个实际业务需求描述对应的自动化业务生成结果的评优打分以及打分理由选出最优动化业务编排结果。
至此,图3中生成策略部分的提示工程和思维框架(也即思维树框架),以及评估方案部分的人工评估与自动化评估结合介绍完毕。数据准备与微调模型在后续实施例中进行介绍。
本申请实施例中,多次进行迭代,在每一次迭代周期中,都基于思维树进行业务步骤的自动化编排,模拟了人类决策时探索不同的可能与在某个可能的节点前后进行探索的过程,提高了自动化业务编排的决策能力,能够根据不同的排序结果决策出一个自动化业务生成结果。进而从多次迭代周期中确定的实际业务需求描述对应的自动化业务生成结果中,选出最优自动化业务生成结果,考虑到了目标大模型对于相同的输入,输出往往会不一致的不稳定的问题,保证了实际业务需求描述对应的自动化业务生成结果的可靠性,进一步提高了自动化业务编。
在一种应用场景中,结合图3,以计算机设备接收到的实际业务需求描述为“我想去银行贷款”为例,对接收的实际业务需求描述进行自动化业务编排的具体工作流程可以如下所示:
步骤1,利用In-Context Learning技术构造的Prompt,以及目标大模型生成可能的业务步骤;
步骤2,利用思维树框架与目标大模型对步骤1中得到的业务步骤进行自编排;
步骤3,重复步骤1和2得到多个候选业务编排方案,候选业务编排方案即为实际业务需求描述对应的自动化业务生成结果;
步骤4,使用目标大模型对候选业务编排方案进行评估,选择最优业务编排方案。
在步骤1中,利用In-Context Learning技术构造的Prompt即为第一Prompt,其内容为:
请生成下文输入的句子的业务。
我想去银行贷款。
以下为几个例子:
我想去银行存款:存款业务,储蓄账户开设,存款方式选择,存款金额确认,存款凭证发放,利息计算;
我想去银行买保险:保险咨询,保险产品选择,保险投保申请,保险费用计算,保险合同签署,保险理赔服务。
计算机设备利用目标大模型生成并输出的文本为:我想去银行贷款:贷款申请,信用评估,贷款审批,还款管理,贷款签约资金发放。那么,与“我想去银行贷款”所属业务场景对应的可能的业务步骤为贷款申请、信用评估、贷款审批、还款管理以及贷款签约资金发放。
在步骤2中,计算机设备将预设的第二Prompt中预设的占位符(或者是特殊的标记)替换为步骤1中生成的业务步骤,进而将第二Prompt输入至目标大模型,使目标大模型响应于该第二Prompt,利用思维框架对步骤1中生成的业务步骤进行自动化编排。在自动化编排的过程中,输入目标大模型的第二Prompt可以如下表4所示。
表4业务步骤自编排部分输入文本
表4中的a的内容代表思维树框架中思维树的根节点。作为根节点,res的为空,而addition中被填入步骤1生成的业务步骤。
表4中的b的内容均代表思维树框架中思维树的中途节点,res,addition填入父节点输出的内容。
而后,计算机设备利用目标大模型对思维树中遍历到的节点进行思维生成,每个节点可生成的节点在本应用场景中设置为3得到如表5所示的输出文本。
表5业务步骤自编排部分输出文本
状态评估:计算机设备利用第三Prompt与目标大模型对每一次生成的已排序业务列表进行评估,则状态评估部分输入文本如表6所示,
表6状态评估部分输入文本
则状态评估输出文本如表7所示。
表7状态评价部分输出文本
表7中a的内容,由于输出的内容为不合理,该节点不会进行思维生成。表6的内容b,由于输出的内容合理,该节点会进行后续的思维生成。表6的内容c,由于输出的内容合理,且addition已经为空,目标大模型最后会输出已排序的业务步骤,获得与“我想去银行贷款”所属业务场景对应的自动化编排结果。
在步骤4中,会对步骤3产生的多个业务服务自编排方案进行评估进一步保证自动化编排结果的可靠性。同样采用大模型对生成的结果进行评估。评估时的Prompt为第四Prompt,只不过此时的第四Prompt中的<输入文本>为我想去银行贷款,而<自动化编排结果1>至<自动化编排结果3>分别为步骤3生成的3种自动化编排结果。最终根据大模型的评分结果,选出评分最高的一项业务服务自编排方案作为最后的输出。则最终输入至目标大模型的评估输入文本如表8所示。
表8最终输入评估文本
则计算机设备最终利用目标大模型输出的评估结果文本如表9所示。将表9评分最高的自动化编排结果作为与“我想去银行贷款”所属业务场景对应的最优自动化编排结果。
表9最终评估结果文本
本应用场景中,使用In-context learning。通过提供任务相关的若干示例或者指令来增强上下文,从而提升大语言模型预测效果。
大语言模型已经在多种任务中大显身手,甚至在数学、逻辑推理等任务上都表现出色。但是由于大语言模型从左到右的输出模式,使得大语言模型只能进行token级别的单向决策。而人类在进行复杂问题的决策时,往往会采用树状的思维方式进行规划。本应用场景中,将思维树框架与目标大模型相结合,从而模拟人类的决策过程,解决大模型不会探索不同的可能选择分支与无法在节点进行前后向的探索的问题。提高大模型决策能力。
为了能够增加目标大模型识别出未知业务步骤的能力,结合图3,在图4所示步骤401之前,还需要对目标大模型进行训练,具体步骤如下:
步骤A1,将预获取的不同业务场景的初始业务流程分别输入至第一生成式大模型,获取每一种业务场景对应的优化后业务流程。
步骤A2,对优化后业务流程进行数据预处理操作,得到处理后业务流程。
步骤A3,基于预设分布式训练框架、预设优化器以及处理后业务流程,对第二生成式大模型进行迭代训练后,获取目标大模型。
第一生成式大模型能够对预获取的不同业务场景的初始业务流程进行优化,得到优化后业务流程,不再需要人为对预获取的不同业务场景的初始业务流程进行标注以及核对,大大降低了初始化业务流程的处理时间,提高了后续模型训练的效率。进而对优化后业务流程进行数据预处理操作,以便于利用预设分布式训练框架、预设优化器以及处理后业务流程,对第二生成式大模型进行迭代训练,以提高第二生成式大模型的业务步骤生成能力,从而获取的目标大模型就具有较高的业务步骤生成能力,可以在后续生成准确的业务步骤,进而提高自动化业务编排的准确性。另外,预设分布式训练框架可以将第二生成式大模型进行分布训练,加快第二生成式大模型的训练效率。预设优化器减少可以模型训练过程中的冗余内存使用,以便能够训练第二生成式大模型。
在步骤A1中,不同业务场景的初始业务流程可来自于各个领域的开源业务流程数据中记载的业务流程、操作指南和或专家的经验知识。如图3所示,领域可以是数据准备备份中记载的金融领域以及除金融领域以外的其他领域。计算机设备向第一生成式大模型输入预获取的不同的业务场景的初始业务流程后,可以让第一生成式大模型理解需要生成什么样的数据,这样第一生成式大模型就可以基于自我指导(self-instruct)的方式对不同的业务场景的初始业务流程进行优化,进而得到优化后业务流程。
进一步的,步骤A1,将预获取的不同业务场景的初始业务流程分别输入至第一生成式大模型,获取每一种业务场景对应的优化后业务流程,可以包括如下步骤:
步骤A1.1,获取针对不同业务场景设置的步骤生成提示条件。
步骤生成提示条件用于引导第一生成式大模型生成不同业务场景对应的业务流程。步骤生成提示条件可以包括业务步骤生成任务的描述、输入数据以及期望的输出等。步骤生成提示条件为预先构建的Prompt。
步骤A1.2,将第一业务场景的初始业务流程以及第一业务场景对应的步骤生成提示条件输入至第一生成式大模型,以便于第一生成式大模型响应于第一业务场景对应的步骤生成提示条件,基于自我指导的方式优化第一业务场景的初始业务流程,得到第一业务场景对应的优化后业务流程。
在步骤A1.2中,第一业务场景为预获取的业务场景中的任一个业务场景。自我指导(self-instruct)的方式是一种基于自我指导的学习方法,通常应用于机器学习和人工智能领域。它旨在通过自动生成标签或反馈来进行模型训练,而不是依赖于人类专家的手动标注。传统的训练集构建需要由人类专家进行手工标注。然而,这种标注过程通常费时费力,并且可能存在主观性和不一致性。self-instruct试图解决这些问题,通过自动化标注或生成反馈,利用如gpt-4这样强大的生成式大模型来构建训练集。
在一个示例中,以gpt-4为第一生成式大模型为例,可以先向gpt-4展示各种业务场景和相应的步骤序列,如一些开源的工业操作流程序列,这可以让gpt-4生成更加符合我们需求的步骤。然后再要求gpt-4输出一系列特定业务场景对应的操作流程。例如,向gpt-4编写一个Prompt“输出一个银行开户流程”,则gpt-4会输出开户所需的步骤序列,如身份验证、资料收集、签署文件等。
可选的,为了得到准确率更高的业务流程,还可以通过self-instruct的方式,将第一业务场景对应的优化后业务流程重新拼接上第一业务场景对应的步骤生成提示条件,在将拼接后的结果输入至第一生成式大模型中,使第一生成式大模型再次优化第一业务场景对应的优化后业务流程,通过多次优化得到准确率更高从而得到优化后的业务流程,进而提高后续第二生成式大模型的训练的准确率,从而提高第二生成式大模型的业务步骤生成能力。在构建第二生成式大模型的训练集时,还可以考虑引入一些变化和扰动,以增加训练集中数据的多样性和鲁棒性。例如,可以对业务步骤的描述进行同义词替换、调整业务步骤的顺序或添加一些变体业务步骤,以便于后续第二生成式大模型能够处理不同的情况和变化。第二生成式大模型的训练集由不同业务场景对应的优化后业务流程构成。
计算机设备将第一业务场景的初始业务流程以及第一业务场景对应的步骤生成提示条件输入至第一生成式大模型中,第一生成式大模型就响应于第一业务场景对应的步骤生成提示条件,基于自我指导的方式生成第一业务场景对应的待优化业务流程,进而将待优化业务流程中的业务步骤与第一业务场景的初始业务流程中的业务步骤进行比较,标注出错误或不完整的部分,并对它们进行修正或补充,将修正或补充后的业务流程输出。计算机设备就会再次将修正或补充后的业务流程,以及第一业务场景对应的步骤生成提示条件输入至第一生成式大模型输入至第一生成式模型中,继续生成新的业务流程,然后再进行比较,以及后续修正或补充操作,如此重复直到训练完毕,获取第一业务场景对应的优化后业务流程。进而将第一业务场景对应的优化后业务流程纳入训练集中,以便于后续基于训练集中不同业务场景对应的优化后训练集业务流程对第二生成大模型进行训练。
在步骤A2中,数据预处理操作可以包括数据清洗、噪声去除、对数据进行标准化(或对数据进行归一化)、如图3中数据处理部分所示的空值去除以及异常去除等操作。
在步骤A3中,预设分布式训练框架可以是图3所示的深速(DeepSpeed)框架、预设优化器可以是图3所示的零冗余优化器(Zero Redundancy Optimizer,ZeRO),LOMO优化器以及大模型量化高效微调(Efficient Finetuning of Quantized LLMs,QLORA)。其中DeepSpeed框架与ZeRO优化器作为一种加速方案用于加速第二生成式模型的训练速度,LOMO优化器以及QLORA作为一种微调技术能够在模型训练过程中压缩内存,从而能够训练大型的第二生成式大模型。对第二生成式模型的训练在图3中用微调模型表示。
其中,DeepSpeed是一个由Microsoft Research开发的深度学习训练和优化系统,旨在提高训练大型模型的效率和扩展性。它提供了一系列功能和优化策略,使得在分布式环境下训练深度学习模型更加高效。
DeepSpeed引入了一种称为ZeRO的优化器,它专注于减少模型训练过程中的冗余内存使用,以便能够训练更大的模型。通常情况下,在分布式训练中,每个GPU都需要存储整个模型的副本,这会占用大量内存并限制可扩展性。ZeRO优化器通过将模型参数分解为几个不同的部分,并在训练过程中仅在每个GPU上保留一部分参数,从而大大减少了内存占用。
ZeRO优化器采用了两个关键技术来实现这一目标。首先是模型分解,将模型参数分解成不同的子集,每个子集分配给不同的GPU。这样,每个GPU只需存储自己负责的参数,大大减少了内存需求。其次是通信缩减,通过减少参数更新时的通信量,降低了分布式训练的开销。除了ZeRO优化器,DeepSpeed还提供了其他许多功能,如梯度压缩、分布式训练控制、混合精度训练等。这些功能的结合使得DeepSpeed成为一个强大的分布式深度学习训练框架,可显著提升训练速度和模型规模的可扩展性。
QLORA与LOMO优化器可以减少训练需要的内存和提示微调效果,其中QLORA通过两次对模型参数进行压缩来减少模型内存占用,LOMO优化器则通过减少中间梯度的存储来进一步减少内存。通过不断迭代微调数据集上的样本,大模型逐渐调整自身的参数和权重,以更好地适应特定的业务服务自编排需求。通过步骤A3的训练,第二生成式大模型能够逐渐掌握业务步骤生成的技巧和方法,提高其业务步骤生成的质量和准确性。
进一步的,在第二生成式大模型每一次迭代训练结束时,都需要对第二生成式大模型进行评估,以确保其在业务步骤生成方面的性能提升。评估可以采用多种指标,如生成准确度、语义一致性、流畅度等。可以通过人工评估或自动评估方法进行评估。
根据评估结果,如果第二生成式大模型的性能还不够理想,则需要继续进行迭代训练,可以对训练集、微调任务或训练超参数进行调整,再次进行训练和评估,直到第二生成式大模型的性能满足要求。
结合上述应用场景,在步骤1,利用In-Context Learning技术构造的Prompt,以及目标大模型生成可能的业务步骤之前,还可以包括如下步骤Y1以及步骤Y2:
步骤Y1,利用第一生成式大模型,通过self-instruct的方式,构建步骤生成微调数据集(也即训练第二生成式大模型时用到的训练集)。
步骤Y2,利用步骤Y1中得到的步骤生成微调数据集,提高第二生成式大模型的业务步骤生成能力,以获取目标大模型。
步骤Y1可以包括如下步骤Y1.1至步骤Y1.5:
步骤Y1.1,向第一生成式大模型展示不同的业务场景和不同的业务场景对应的业务流程,这些业务流程可以来自于各个领域的业务流程、操作指南或专家的经验知识。让第一生成式大模型理解需要生成什么样的数据。
步骤Y1.2,构建业务生成的Prompt(也即步骤生成提示条件),确定业务场景,明确第一生成式大模型中业务步骤生成任务的需求、目标和约束条件。这可以包括业务步骤生成任务的描述、输入数据、期望的输出等。
步骤Y1.3,通过第一生成式大模型得到不同的业务场景对应的待优化业务流程。
步骤Y1.4,利用生成的待优化业务流程和原始业务流程(原始业务流程即为步骤Y1.1中向第一生成式大模型展示的业务流程),采用自我指导(self-instruct)的方式来迭代待优化业务流程。具体来说,将第一生成式大模型生成某业务场景对应的待优化业务流程中的业务步骤与该业务场景对应的原始业务流程中的业务步骤进行比较,标注出错误或不完整的部分,并对它们进行修正或补充。修正后的待优化业务流程再次输入到第一生成式大模型中,继续生成新的业务流程,然后再进行比较和修正。
步骤Y1.5,将最终确定新的业务流程纳入步骤生成微调数据集。
经过以上的步骤,得到的步骤生成微调数据集中能包含业务的特定领域知识和语义,以及众多场景的操作步骤,为后续训练第二生成式大模型打下基础。
在步骤Y2中,将利用步骤Y1中得到的步骤生成微调数据集微调第二生成式大模型,提高模型的业务步骤生成能力。下面是具体的操作流程:
1.数据预处理:对步骤生成微调数据集进行数据预处理操作。
2.模型选择:根据具体的需求和问题,选择适当的生成式大模型作为第二生成式大模型来进行微调。这可以是开源的一些大模型如ChatGLM或者其他先进的生成式模型。
3.微调过程:使用处理后的步骤生成微调数据集对选定的第二生成式大模型进行微调。微调是指在预训练模型的基础上,使用自定义的数据集进行额外的训练,以使模型适应特定的业务需求。在这个过程中,需要使用分布式训练框架如DeepSpeed来加速训练,还可以应用一些微调技术来提高微调效率和效果。如ZeRO、QLORA、LOMO优化器等。
4.模型评估:完成微调后,需要对第二生成式大模型进行评估,以确保其在业务步骤生成方面的性能提升。评估可以采用多种指标,如生成准确度、语义一致性、流畅度等。可以通过人工评估或自动评估方法进行评估。
5.迭代优化:根据评估结果,如果第二生成式大模型的性能还不够理想,可以进行迭代优化,对数据集、微调任务或训练超参数进行调整,再次进行微调和评估,直到满足要求的性能水平获取目标大模型。
上述应用场景中,相比使用普通的深度网络模型进行业务服务自编排,第二生成式大模型经过了充分的数据预训练,极大增加识别出未知业务服务的能力。同时,使用生成式大模型进行服务自编排。相比传统的利用自动化技术和软件系统方式进行业务服务自编排方式,大模型具有更加优秀的自然语言理解能力,业务服务生成,编排能力更加出色。
在本实施例中还提供了一种自动化业务编排装置,该装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
本实施例提供一种自动化业务编排装置,如图7所示,包括:
第一生成模块710,用于将接收的实际业务需求描述输入至目标大模型,生成与实际业务需求描述所属业务场景对应的业务步骤集合,目标大模型为基于不同业务场景对应的参考业务流程训练得到的大语言模型;
遍历模块720,用于在当前迭代周期内,根据预设搜索算法,遍历思维树中的各个节点;
评估模块730,用于当遍历到思维树中的第一节点时,若第一节点存在对应的业务流程,对业务流程进行评估,第一节点为思维树中的任一节点;
第二生成模块740,用于当业务流程不符合预设条件,且业务流程中各个业务步骤之间的执行顺序合理时,在第一节点下生成预设数量的子节点,为每一个子节点分配剩余步骤集合以及第一节点对应的业务流程,业务步骤集合中除第一节点对应的业务流程中业务步骤以外的业务步骤构成剩余步骤集合;
排序模块750,用于根据预设排序规则,分别对每一个子节点各自对应的剩余步骤集合中的业务步骤进行排序,得到每一个子节点对应的排序结果;
确定模块760,用于根据第一子节点对应的排序结果,确定第一子节点对应的业务流程是否符合预设条件,第一子节点为预设数量的子节点中的任一个子节点;
选取模块770,用于当至少一个子节点对应的业务流程符合预设条件时,从至少一个子节点对应的业务流程中选取实际业务需求描述对应的自动化业务生成结果;
或者,
当预设数量的子节点对应的业务流程均不符合预设条件时,遍历思维树中的下一个节点。
在一些可选的实施例中,当第一节点并非为思维树的根节点时,评估模块包括:
评估单元,用于根据预获取的与实际业务需求描述所属业务场景对应的参考业务流程,评估第一节点对应的业务流程中各个业务步骤是否符合预设条件;
预设条件包括节点对应的业务流程中各个业务步骤之间的执行顺序合理,且节点对应的业务流程完整。
在一些可选的实施例中,当第一节点为思维树的根节点时,评估模块包括:
确定单元,用于确定第一节点对应的剩余步骤集合是否为空;
确定单元,还用于当确定第一节点对应的剩余步骤集合不为空时,确定第一节点对应的业务流程不符合预设条件。
在一些可选的实施例中,该自动化业务编排装置还包括:
第一获取模块,用于将预获取的不同业务场景的初始业务流程分别输入至第一生成式大模型,获取每一种业务场景对应的优化后业务流程;
数据预处理模块,用于对优化后业务流程进行数据预处理操作,得到处理后业务流程;
第二获取模块,用于基于预设分布式训练框架、预设优化器以及处理后业务流程,对第二生成式大模型进行迭代训练后,获取目标大模型。
在一些可选的实施例中,第一获取模块包括:
获取单元,用于获取针对不同业务场景设置的步骤生成提示条件,步骤生成提示条件用于引导第一生成式大模型生成不同业务场景对应的业务流程;
输入单元,用于将第一业务场景的初始业务流程以及第一业务场景对应的步骤生成提示条件输入至第一生成式大模型,以便于第一生成式大模型响应于第一业务场景对应的步骤生成提示条件,基于自我指导的方式优化第一业务场景的初始业务流程,得到第一业务场景对应的优化后业务流程,第一业务场景为预获取的业务场景中的任一个业务场景。
在一些可选的实施例中,该自动化业务编排装置还包括:
确定模块,还用于当第一节点对应的业务流程符合预设条件时,将第一节点对应的业务流程确定为实际业务需求描述对应的自动化业务生成结果。
在一些可选的实施例中,该自动化业务编排装置还包括:
监测模块,用于监测当前迭代周期是否满足迭代停止条件,迭代停止条件包括已确定实际业务需求描述对应的自动化业务生成结果,或者已将思维树中的所有节点遍历;
确定模块,还用于若当前迭代周期是否满足迭代停止条件,将迭代次数加一,并确定迭代次数是否大于或等于预设阈值,预设阈值大于或等于2;
迭代模块,用于当迭代次数小于预设阈值时,进入下一个迭代周期,直至迭代次数大于或等于预设阈值时,停止迭代;
选取模块,还用于从所有迭代周期分别确定的实际业务需求描述对应的自动化业务生成结果中,选取实际业务需求描述对应的最优自动化业务生成结果。
上述各个模块和单元的更进一步的功能描述与上述对应实施例相同,在此不再赘述。
本实施例中的自动化业务编排装置是以功能单元的形式来呈现,这里的单元是指ASIC(Application Specific Integrated Circuit,专用集成电路)电路,执行一个或多个软件或固定程序的处理器和存储器,和/或其他可以提供上述功能的器件。
本申请实施例还提供一种计算机设备,具有上述图7所示的自动化业务编排装置。
请参阅图8,图8是本申请可选实施例提供的一种计算机设备的结构示意图,如图8所示,该计算机设备包括:一个或多个处理器10、存储器20,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相通信连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在计算机设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示GUI的图形信息的指令。在一些可选的实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样,可以连接多个计算机设备,各个设备提供部分必要的操作(例如,作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图8中以一个处理器10为例。
处理器10可以是中央处理器,网络处理器或其组合。其中,处理器10还可以进一步包括硬件芯片。上述硬件芯片可以是专用集成电路,可编程逻辑器件或其组合。上述可编程逻辑器件可以是复杂可编程逻辑器件,现场可编程逻辑门阵列,通用阵列逻辑或其任意组合。
其中,所述存储器20存储有可由至少一个处理器10执行的指令,以使所述至少一个处理器10执行实现上述实施例示出的方法。
存储器20可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据计算机设备的使用所创建的数据等。此外,存储器20可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些可选的实施方式中,存储器20可选包括相对于处理器10远程设置的存储器,这些远程存储器可以通过网络连接至该计算机设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
存储器20可以包括易失性存储器,例如,随机存取存储器;存储器也可以包括非易失性存储器,例如,快闪存储器,硬盘或固态硬盘;存储器20还可以包括上述种类的存储器的组合。
该计算机设备还包括通信接口30,用于该计算机设备与其他设备或通信网络通信。
本申请实施例还提供了一种计算机可读存储介质,上述根据本申请实施例的方法可在硬件、固件中实现,或者被实现为可记录在存储介质,或者被实现通过网络下载的原始存储在远程存储介质或非暂时机器可读存储介质中并将被存储在本地存储介质中的计算机代码,从而在此描述的方法可被存储在使用通用计算机、专用处理器或者可编程或专用硬件的存储介质上的这样的软件处理。其中,存储介质可为磁碟、光盘、只读存储记忆体、随机存储记忆体、快闪存储器、硬盘或固态硬盘等;进一步地,存储介质还可以包括上述种类的存储器的组合。可以理解,计算机、处理器、微处理器控制器或可编程硬件包括可存储或接收软件或计算机代码的存储组件,当软件或计算机代码被计算机、处理器或硬件访问且执行时,实现上述实施例示出的方法。
虽然结合附图描述了本申请的实施例,但是本领域技术人员可以在不脱离本申请的精神和范围的情况下做出各种修改和变型,这样的修改和变型均落入由所附权利要求所限定的范围之内。
Claims (10)
1.一种自动化业务生成方法,其特征在于,所述方法包括:
将接收的实际业务需求描述输入至目标大模型,生成与所述实际业务需求描述所属业务场景对应的业务步骤集合,所述目标大模型为基于不同业务场景对应的参考业务流程训练得到的大语言模型;
在当前迭代周期内,根据预设搜索算法,遍历思维树中的各个节点;
当遍历到所述思维树中的第一节点时,若所述第一节点存在对应的业务流程,对所述业务流程进行评估,所述第一节点为所述思维树中的任一节点;
当所述业务流程不符合预设条件,且所述业务流程中各个业务步骤之间的执行顺序合理时,在所述第一节点下生成预设数量的子节点,为每一个所述子节点分配剩余步骤集合以及所述第一节点对应的业务流程,所述业务步骤集合中除所述第一节点对应的业务流程中业务步骤以外的业务步骤构成所述剩余步骤集合;
根据预设排序规则,分别对每一个所述子节点各自对应的剩余步骤集合中的业务步骤进行排序,得到每一个所述子节点对应的排序结果;
根据第一子节点对应的排序结果,确定所述第一子节点对应的业务流程是否符合所述预设条件,所述第一子节点为预设数量的子节点中的任一个子节点;
当至少一个子节点对应的业务流程符合所述预设条件时,从至少一个子节点对应的业务流程中选取所述实际业务需求描述对应的自动化业务生成结果;
或者,
当所述预设数量的子节点对应的业务流程均不符合预设条件时,遍历所述思维树中的下一个节点。
2.根据权利要求1所述的方法,其特征在于,当所述第一节点并非为所述思维树的根节点时,所述当遍历到所述思维树中的第一节点时,若所述第一节点存在对应的业务流程,对所述业务流程进行评估,包括:
根据预获取的与所述实际业务需求描述所属业务场景对应的参考业务流程,评估所述第一节点对应的业务流程中各个业务步骤是否符合所述预设条件;
所述预设条件包括节点对应的业务流程中各个业务步骤之间的执行顺序合理,且节点对应的业务流程完整。
3.根据权利要求1所述的方法,其特征在于,当所述第一节点为所述思维树的根节点时,所述当遍历到所述思维树中的第一节点时,若所述第一节点存在对应的业务流程,对所述业务流程进行评估,包括:
确定所述第一节点对应的剩余步骤集合是否为空;
当确定所述第一节点对应的剩余步骤集合不为空时,确定所述第一节点对应的业务流程不符合所述预设条件。
4.根据权利要求1至3任一项所述的方法,其特征在于,在将接收的实际业务需求描述输入至目标大模型,生成与所述实际业务需求描述所属业务场景对应的业务步骤集合之前,所述方法还包括:
将预获取的不同业务场景的初始业务流程分别输入至第一生成式大模型,获取每一种业务场景对应的优化后业务流程;
对所述优化后业务流程进行数据预处理操作,得到处理后业务流程;
基于预设分布式训练框架、预设优化器以及所述处理后业务流程,对第二生成式大模型进行迭代训练后,获取所述目标大模型。
5.根据权利要求4所述的方法,其特征在于,所述将预获取的不同业务场景的初始业务流程分别输入至第一生成式大模型,获取每一种业务场景对应的优化后业务流程,包括:
获取针对不同业务场景设置的步骤生成提示条件,所述步骤生成提示条件用于引导所述第一生成式大模型生成不同业务场景对应的业务流程;
将第一业务场景的初始业务流程以及所述第一业务场景对应的步骤生成提示条件输入至所述第一生成式大模型,以便于所述第一生成式大模型响应于所述第一业务场景对应的步骤生成提示条件,基于自我指导的方式优化所述第一业务场景的初始业务流程,得到所述第一业务场景对应的优化后业务流程,所述第一业务场景为预获取的业务场景中的任一个业务场景。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
当所述第一节点对应的业务流程符合所述预设条件时,将所述第一节点对应的业务流程确定为所述实际业务需求描述对应的自动化业务生成结果。
7.根据权利要求1至3以及6任一项所述的方法,其特征在于,所述方法还包括:
监测所述当前迭代周期是否满足迭代停止条件,所述迭代停止条件包括已确定所述实际业务需求描述对应的自动化业务生成结果,或者已将思维树中的所有节点遍历;
若所述当前迭代周期是否满足迭代停止条件,将迭代次数加一,并确定所述迭代次数是否大于或等于预设阈值,所述预设阈值大于或等于2;
当所述迭代次数小于所述预设阈值时,进入下一个迭代周期,直至所述迭代次数大于或等于预设阈值时,停止迭代;
从所有迭代周期分别确定的所述实际业务需求描述对应的自动化业务生成结果中,选取所述实际业务需求描述对应的最优自动化业务生成结果。
8.一种自动化业务编排装置,其特征在于,所述装置包括:
第一生成模块,用于将接收的实际业务需求描述输入至目标大模型,生成与所述实际业务需求描述所属业务场景对应的业务步骤集合,所述目标大模型为基于不同业务场景对应的参考业务流程训练得到的大语言模型;
遍历模块,用于在当前迭代周期内,根据预设搜索算法,遍历思维树中的各个节点;
评估模块,用于当遍历到所述思维树中的第一节点时,若所述第一节点存在对应的业务流程,对所述业务流程进行评估,所述第一节点为所述思维树中的任一节点;
第二生成模块,用于当所述业务流程不符合预设条件,且所述业务流程中各个业务步骤之间的执行顺序合理时,在所述第一节点下生成预设数量的子节点,为每一个所述子节点分配剩余步骤集合以及所述第一节点对应的业务流程,所述业务步骤集合中除所述第一节点对应的业务流程中业务步骤以外的业务步骤构成所述剩余步骤集合;
排序模块,用于根据预设排序规则,分别对每一个所述子节点各自对应的剩余步骤集合中的业务步骤进行排序,得到每一个所述子节点对应的排序结果;
确定模块,用于根据第一子节点对应的排序结果,确定所述第一子节点对应的业务流程是否符合所述预设条件,所述第一子节点为预设数量的子节点中的任一个子节点;
选取模块,用于当至少一个子节点对应的业务流程符合所述预设条件时,从至少一个子节点对应的业务流程中选取所述实际业务需求描述对应的自动化业务生成结果;
或者,
当所述预设数量的子节点对应的业务流程均不符合预设条件时,遍历所述思维树中的下一个节点。
9.一种计算机设备,其特征在于,包括:
存储器和处理器,所述存储器和所述处理器之间互相通信连接,所述存储器中存储有计算机指令,所述处理器通过执行所述计算机指令,从而执行权利要求1至7中任一项所述的自动化业务生成方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机指令,所述计算机指令用于使计算机执行权利要求1至7中任一项所述的自动化业务生成方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311110495.9A CN116976640B (zh) | 2023-08-30 | 自动化业务生成方法、装置、计算机设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311110495.9A CN116976640B (zh) | 2023-08-30 | 自动化业务生成方法、装置、计算机设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116976640A true CN116976640A (zh) | 2023-10-31 |
CN116976640B CN116976640B (zh) | 2024-06-04 |
Family
ID=
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117372132A (zh) * | 2023-12-08 | 2024-01-09 | 深圳竹云科技股份有限公司 | 用户信用评分的生成方法、装置、计算机设备和存储介质 |
CN117472552A (zh) * | 2023-12-28 | 2024-01-30 | 中电数据产业有限公司 | 服务场景智能编排及动态调度方法、装置、设备及介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114970444A (zh) * | 2022-04-20 | 2022-08-30 | 北京字跳网络技术有限公司 | 信息处理方法、装置、终端和存储介质 |
CN116402164A (zh) * | 2023-06-06 | 2023-07-07 | 之江实验室 | 基于预训练语言模型的机器人任务生成方法、装置及介质 |
US20230244938A1 (en) * | 2022-02-02 | 2023-08-03 | Google Llc | Using Chains of Thought to Prompt Machine-Learned Models Pre-Trained on Diversified Objectives |
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20230244938A1 (en) * | 2022-02-02 | 2023-08-03 | Google Llc | Using Chains of Thought to Prompt Machine-Learned Models Pre-Trained on Diversified Objectives |
CN114970444A (zh) * | 2022-04-20 | 2022-08-30 | 北京字跳网络技术有限公司 | 信息处理方法、装置、终端和存储介质 |
CN116402164A (zh) * | 2023-06-06 | 2023-07-07 | 之江实验室 | 基于预训练语言模型的机器人任务生成方法、装置及介质 |
Non-Patent Citations (1)
Title |
---|
SHUNYU YAO 等: "Tree of Thoughts: Deliberate Problem Solving with Large Language Models", ARXIV, pages 1 - 11 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117372132A (zh) * | 2023-12-08 | 2024-01-09 | 深圳竹云科技股份有限公司 | 用户信用评分的生成方法、装置、计算机设备和存储介质 |
CN117372132B (zh) * | 2023-12-08 | 2024-02-23 | 深圳竹云科技股份有限公司 | 用户信用评分的生成方法、装置、计算机设备和存储介质 |
CN117472552A (zh) * | 2023-12-28 | 2024-01-30 | 中电数据产业有限公司 | 服务场景智能编排及动态调度方法、装置、设备及介质 |
CN117472552B (zh) * | 2023-12-28 | 2024-05-28 | 中电数据产业有限公司 | 服务场景智能编排及动态调度方法、装置、设备及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Alzubaidi et al. | A survey on deep learning tools dealing with data scarcity: definitions, challenges, solutions, tips, and applications | |
Zabin et al. | Applications of machine learning to BIM: A systematic literature review | |
CN107480141B (zh) | 一种基于文本和开发者活跃度的软件缺陷辅助分派方法 | |
US9292599B2 (en) | Decision-tree based quantitative and qualitative record classification | |
CN115456202A (zh) | 一种提高工作机学习性能的方法、装置、设备及介质 | |
US8255423B2 (en) | Adaptive random trees integer non-linear programming | |
CN111723021B (zh) | 一种基于知识库和表示学习的缺陷报告自动分派方法 | |
CN116976640B (zh) | 自动化业务生成方法、装置、计算机设备及存储介质 | |
Rodriguez et al. | Multi-objective information retrieval-based NSGA-II optimization for requirements traceability recovery | |
CN115438190B (zh) | 一种配电网故障辅助决策知识抽取方法及系统 | |
Yang et al. | A situation-centric approach to identifying new user intentions using the mtl method | |
CN116976640A (zh) | 自动化业务生成方法、装置、计算机设备及存储介质 | |
Mostafa et al. | Application of Artificial Intelligence Tools with BIM Technology in Construction Management: Literature | |
US20220358360A1 (en) | Classifying elements and predicting properties in an infrastructure model through prototype networks and weakly supervised learning | |
CN112732889A (zh) | 一种基于合作网络的学者检索方法和装置 | |
Chetoui et al. | Course recommendation model based on Knowledge Graph Embedding | |
US11941500B2 (en) | System for engagement of human agents for decision-making in a dynamically changing environment | |
CN111667107B (zh) | 基于梯度随机森林的研发管控问题预测方法及装置 | |
CN117634617B (zh) | 知识密集型推理问答方法、装置、电子设备和存储介质 | |
CN117494908B (zh) | 基于大数据的港口货物吞吐量预测方法及系统 | |
US20230368086A1 (en) | Automated intelligence facilitation of routing operations | |
CN117892799B (zh) | 以多层次任务为导向的金融智能分析模型训练方法及系统 | |
Jiang et al. | Planning without a domain model | |
US20230368085A1 (en) | Automated intelligence facilitation of routing operations | |
US20230367303A1 (en) | Automated intelligence facilitation of routing operations |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |