CN117787668A - 一种基于大语言模型的目标分配方法、装置、电子设备、存储介质和程序产品 - Google Patents
一种基于大语言模型的目标分配方法、装置、电子设备、存储介质和程序产品 Download PDFInfo
- Publication number
- CN117787668A CN117787668A CN202410206913.2A CN202410206913A CN117787668A CN 117787668 A CN117787668 A CN 117787668A CN 202410206913 A CN202410206913 A CN 202410206913A CN 117787668 A CN117787668 A CN 117787668A
- Authority
- CN
- China
- Prior art keywords
- language model
- scheme
- large language
- target
- analysis
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 47
- 238000004458 analytical method Methods 0.000 claims abstract description 184
- 238000011156 evaluation Methods 0.000 claims abstract description 45
- 238000013210 evaluation model Methods 0.000 claims description 25
- 238000004590 computer program Methods 0.000 claims description 15
- 238000003062 neural network model Methods 0.000 claims description 4
- 238000013439 planning Methods 0.000 abstract description 3
- 238000012549 training Methods 0.000 description 10
- 238000004422 calculation algorithm Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 8
- 238000004891 communication Methods 0.000 description 6
- 238000013468 resource allocation Methods 0.000 description 4
- 238000000605 extraction Methods 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000011176 pooling Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000007670 refining Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Landscapes
- Machine Translation (AREA)
Abstract
本发明涉及任务规划技术领域,提供一种基于大语言模型的目标分配方法、装置、电子设备、存储介质和程序产品,所述方法包括:将需求分析提示文本输入至大语言模型,得到大语言模型输出的需求分析结果;基于需求分析结果,对目标任务进行分配,得到目标分配结果;基于目标分配结果,生成方案分析提示文本;将方案分析提示文本输入至大语言模型,得到大语言模型输出的方案分析结果;基于方案分析结果以及需求分析结果,生成方案描述提示文本;将方案描述提示文本输入至大语言模型,得到大语言模型输出的方案描述结果,方案描述结果用于描述目标任务的分配方案以及分配方案的评估结果。本发明能够根据用户需求精确进行目标分配。
Description
技术领域
本发明涉及任务规划技术领域,尤其涉及一种基于大语言模型的目标分配方法、装置、电子设备、存储介质和程序产品。
背景技术
大语言模型(Large Language Model,LLM)是一种通过语言进行输入输出交互的模型,具有模型规模大、训练数据多、训练和部署成本高等特点,与之前的各类模型相比,其具有更好的语义理解与处理能力,包括文本分类、问答、文档总结、文本生成等等,当前大语言模型已被广泛应用于智能助理、语言翻译、市场调研等领域。
大语言模型虽然具有广泛的通用性与易用性,但是具有一些无法克服的缺陷,其一是大语言模型会出现生成事实错误的情形,也就是俗称的大语言模型的幻觉现象,错误的内容输出包括文字描述的事实性错误、数字逻辑计算的错误等等各类情形;其二是大语言模型无法处理过于复杂而精细的任务,对于需要进行复杂精细处理的任务,大语言模型往往会输出原理性的建议以及空洞的泛泛之谈。这些问题出现的主要原因是由于大语言模型的能力高度依赖训练数据的支持,对于训练数据中涵盖较少数据的领域甚至完全不相关的领域内容,大语言模型往往无法得到令人满意的答案。
在复杂任务领域,例如目标分配任务中,需要实现使用资源提取,分配目标提取,分配要求分析等一系列的精细化的操作。传统的规划算法,例如匈牙利(Hungarian)分配算法、贝叶斯优化算法、策略遗传算法、规则评估方法等,能够有效解决使用资源提取,分配目标提取的准确性问题,但是需要将用户语言中表达的分配需求通过人工分析的方式转化为算法所需的参数,嵌入到算法实现当中,无法动态的与用户进行语言交互,也无法分析并满足用户语言中表达的分配需求。
若直接使用大语言模型生成目标分配任务相应解决方案时,则会出现输出错误或不存在的使用资源/分配目标名称、分配要求理解分析错误、分配方案泛泛而谈无法落地执行等一系列的问题。目前对于此类垂直领域的大语言模型应用方案是采用微调数据训练的方法来解决,即通过构造可能输入的问题以及对应的理想输出作为训练数据来让大语言模型学习如何进行正确的目标分配,但是采用该方法会导致大语言模型自身泛化能力的退化,边缘数据将从数据集中消失,方差将缩小,最后失去关于真实语言交互的能力;通过微调数据训练的方法也无法避免使用资源、匹配目标描述错误等精细化操作中出现的错误。
发明内容
本发明提供一种基于大语言模型的目标分配方法、装置、电子设备、存储介质和程序产品,用以解决现有技术中无法根据用户需求精确进行目标分配的缺陷。
本发明提供一种基于大语言模型的目标分配方法,包括:
将需求分析提示文本输入至大语言模型,得到所述大语言模型输出的需求分析结果,所述需求分析提示文本用于描述用户对目标任务的分配需求;
基于所述需求分析结果,对所述目标任务进行分配,得到目标分配结果;
基于所述目标分配结果,生成方案分析提示文本;
将所述方案分析提示文本输入至所述大语言模型,得到所述大语言模型输出的方案分析结果;
基于所述方案分析结果以及所述需求分析结果,生成方案描述提示文本;
将所述方案描述提示文本输入至所述大语言模型,得到所述大语言模型输出的方案描述结果,所述方案描述结果用于描述所述目标任务的分配方案以及所述分配方案的评估结果。
根据本发明提供的一种基于大语言模型的目标分配方法,所述基于所述目标分配结果,生成方案分析提示文本,包括:
将所述目标分配结果输入至评估模型,得到所述评估模型输出的所述目标分配结果对应的评估指标;
基于所述评估指标,生成方案分析提示文本。
根据本发明提供的一种基于大语言模型的目标分配方法,所述评估模型基于样本分配方案以及所述样本分配方案对应的样本评估指标训练得到。
根据本发明提供的一种基于大语言模型的目标分配方法,所述评估模型是基于自注意力机制构建的神经网络模型。
根据本发明提供的一种基于大语言模型的目标分配方法,所述评估指标包括时间权重、订单成功率、订单价值以及订单成本中的至少一种。
根据本发明提供的一种基于大语言模型的目标分配方法,所述需求分析提示文本输入至大语言模型,得到所述大语言模型输出的需求分析结果,之前还包括:
获取用户对目标任务的分配需求文本;
基于所述分配需求文本,生成所述需求分析提示文本。
本发明还提供一种基于大语言模型的目标分配装置,包括:
需求分析单元,用于将需求分析提示文本输入至大语言模型,得到所述大语言模型输出的需求分析结果,所述需求分析提示文本用于描述用户对目标任务的分配需求;
任务分配单元,用于基于所述需求分析结果,对所述目标任务进行分配,得到目标分配结果;
第一生成单元,用于基于所述目标分配结果,生成方案分析提示文本;
方案分析单元,用于将所述方案分析提示文本输入至所述大语言模型,得到所述大语言模型输出的方案分析结果;
第二生成单元,用于基于所述方案分析结果以及所述需求分析结果,生成方案描述提示文本;
方案描述单元,用于将所述方案描述提示文本输入至所述大语言模型,得到所述大语言模型输出的方案描述结果,所述方案描述结果用于描述所述目标任务的分配方案以及所述分配方案的评估结果。
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述任一种所述基于大语言模型的目标分配方法。
本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述基于大语言模型的目标分配方法。
本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述基于大语言模型的目标分配方法。
本发明提供的基于大语言模型的目标分配方法、装置、电子设备、存储介质和程序产品,基于用于描述用户对目标任务的分配需求的需求分析提示文本确定需求分析结果,从而能够动态处理用户的不同分配需求,并基于需求分析结果能够生成满足用户需求的目标分配结果。此外,基于目标分配结果生成方案分析提示文本,并基于方案分析提示文本生成方案分析结果,从而最终能够基于方案分析结果以及需求分析结果提供可落地执行的分配方案,避免出现输出错误或不存在的使用资源、分配目标名称、分配方案泛泛而谈无法落地执行等一系列的问题。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的基于大语言模型的目标分配方法的流程示意图;
图2是本发明提供的方案分析流程示意图;
图3是本发明提供的评估模型的结构示意图;
图4是本发明提供的又一基于大语言模型的目标分配方法的流程示意图;
图5是本发明提供的基于大语言模型的目标分配装置的结构示意图;
图6是本发明提供的电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明提供一种基于大语言模型的目标分配方法。图1是本发明提供的基于大语言模型的目标分配方法的流程示意图,如图1所示,该方法可以应用于不同场景,如运输资源调配场景、人力资源分配、项目管理分配等。为了便于阐述本发明的技术方案,以下实施例均以“运输资源调配场景”为示例进行说明,具体包括如下步骤:
步骤110、将需求分析提示文本输入至大语言模型,得到大语言模型输出的需求分析结果,需求分析提示文本用于描述用户对目标任务的分配需求。
具体地,需求分析提示文本用于描述用户对目标任务的分配需求,需求分析提示文本中可以包含的信息包括用户对任务的目标、期望结果、功能要求、性能要求、安全要求、可靠性要求、易用性要求等方面的描述。此处的需求分析提示文本可以为prompt文本。
其中,需求分析提示文本可以基于用户对目标任务的分配需求文本生成。例如,分配需求文本为“尽快解决当前订单、优先保证订单完成成功率”,根据该分配需求文本可知,用户需要保证订单尽快完成并且优先保证完成成功率,进而得到的需求分析提示文本可以为“优先考虑在最短时间内,将全部订单完成,适当保证订单的完成率”。
此外,需求分析结果可以理解为用户对目标任务的不同评估指标要求,例如上述需求分析提示文本为“优先考虑在最短时间内,将全部订单完成,适当保证订单的完成率”的情况下,表明用户对于评估指标中的时间权重和订单成功率要求较高,对于评估指标中订单价值和订单成本无特殊要求,此时需求分析结果可以表示为“时间权重0.8,订单成功率0.2,订单价值0,订单成本0”。
将需求分析提示文本输入至大语言模型后,大语言模型基于需求分析提示文本生成高质量的文本输出,提供有关任务需求的信息和建议。
在一些具体实施方式中,大语言模型可以基于样本需求分析提示文本以及对应的样本需求分析结果训练得到,大语言模型可以基于BERT模型(Bidirectional EncoderRepresentations from Transformers)、XLNet模型(extreme Multi-label LearningNetwork)、ROBERTa模型(Robustly Optimized BERT approach)、T5模型(Text-to-TextTransfer Transformer)等预训练模型构建得到。此处,大语言模型也可以是具有类人特性的聊天机器人中部署的大规模模型,部署有该大语言模型的聊天机器人能够通过理解和学习人类的语言从而与用户进行对话,并且,还能根据对话的上下文与用户进行互动具备真正类人的交流能力,除此之外,其还具备人类的能力,例如编辑、翻译、搜索等。
步骤120、基于需求分析结果,对目标任务进行分配,得到目标分配结果。
具体地,目标任务指待分配的任务,如待分配的运输资源调配任务。可选地,在确定需求分析结果后,结合目标任务对应的车辆清单和订单清单,对目标任务进行分配,从而可以使得得到的目标分配结果能够满足用户需求。其中,车辆清单可以包括各个车辆对应的载重、速度、成本等信息。订单清单可以包括各个订单对应的价格、地址、需求预估等信息。此处,目标分配结果可以为“车辆1负责订单x,车辆2负责订单y,车辆3负责订单z和订单h,…,车辆m负责订单k”。可选地,可以采用Hungarian分配算法对目标任务进行分配,得到目标分配结果。
步骤130、基于目标分配结果,生成方案分析提示文本。
具体地,方案分析提示文本中可以包含针对目标分配结果的各项评估指标,用户针对目标任务的分配需求,目标分配结果对应的具体方案。例如,方案分析提示文本可以为“当前方案重点考虑完成时间的要求,适度的考虑订单完成成功率的要求。当前方案经过评估能够在3.2小时内完成全部订单,订单的成功率能够达到83%,是目前满足需求的最优方案,具体地目标分配结果如下所示:车辆1负责订单x,车辆2负责订单y,车辆3负责订单z和订单h,…,车辆m负责订单k”。
步骤140、将方案分析提示文本输入至大语言模型,得到大语言模型输出的方案分析结果。
具体地,在得到方案分析提示文本后,将方案分析提示文本输入至大语言模型,由大语言模型基于方案分析提示文本生成高质量的方案分析结果,提供有关方案分析的信息和建议。在一些具体实施方式中,大语言模型可以基于样本方案分析提示文本以及对应的样本方案分析结果训练得到。其中,方案分析结果可以理解为目标分配结果中分配方案的评估结果,方案分析提示文本可以为prompt文本。
步骤150、基于方案分析结果以及需求分析结果,生成方案描述提示文本。
步骤160、将方案描述提示文本输入至大语言模型,得到大语言模型输出的方案描述结果,方案描述结果用于描述目标任务的分配方案以及分配方案的评估结果。
具体地,方案分析结果用于表征目标分配结果中分配方案的评估结果,需求分析结果用于表征用户对目标任务的分配需求,进而基于方案分析结果以及需求分析结果生成的方案描述提示文本中既包含有目标分配结果中分配方案的评估结果信息,也包含有用户对目标任务的分配需求信息。在此基础上,将方案描述提示文本输入至大语言模型,得到的方案描述结果可以理解为是返回给用户的最终方案描述,其描述的内容包括用户对目标任务的分配需求的分析和理解,具体可落地执行的分配方案以及针对该分配方案的评估结果,以供用户进行最终决策。其中,方案描述提示文本可以为prompt文本。
本发明实施例提供的基于大语言模型的目标分配方法,基于用于描述用户对目标任务的分配需求的需求分析提示文本确定需求分析结果,从而能够动态处理用户的不同分配需求,并基于需求分析结果能够生成满足用户需求的目标分配结果。此外,基于目标分配结果生成方案分析提示文本,并基于方案分析提示文本生成方案分析结果,从而最终能够基于方案分析结果以及需求分析结果提供可落地执行的分配方案,避免出现输出错误或不存在的使用资源、分配目标名称、分配方案泛泛而谈无法落地执行等一系列的问题。
基于上述实施例,基于目标分配结果,生成方案分析提示文本,包括:
将目标分配结果输入至评估模型,得到评估模型输出的目标分配结果对应的评估指标;
基于评估指标,生成方案分析提示文本。
具体地,评估模型用于评估目标分配结果中的分配方案,如确定分配方案对应的各项评估指标。在确定评估指标后,基于评估指标生成方案分析提示文本,其中方案分析提示文本中可以包含针对目标分配结果的各项评估指标,用户针对目标任务的分配需求,目标分配结果对应的具体方案。
图2是本发明提供的方案分析流程示意图,如图2所示,以运输资源调配场景为示例,用户会接收到若干来自不同地点的运输资源调配订单,用户需要根据路途时间、运输重量、订单价格、订单完成成功率等场景因素,安排不同的运输车辆前往各个订单地址。用户掌握的内容包括当前可用的全部运输车辆共计m辆,包括其对应载重、速度、成本;当前全部订单共计n个,包括其对应的价格、地址、运输需求预估等详细信息。用户根据自身需求,提出用户问题“优先考虑在最短时间内,将全部订单完成,适当保证订单的完成率”。接着,基于用户问题,得到需求分析提示文本“时间权重:0.8,订单成功率:0.2,订单价值:0,订单成本:0”。基于需求分析提示文本,对目标任务进行分配,得到目标分配结果,并将目标分配结果输入至评估模型,得到评估模型输出的目标分配结果对应的评估指标,并基于评估指标,生成方案分析提示文本。
基于上述任一实施例,评估模型基于样本分配方案以及样本分配方案对应的样本评估指标训练得到。
具体地,评估模型可以采用监督训练的方式进行,训练数据的输入为构造的各种不同规模、不同数量的车辆清单与订单清单下,各种不同的样本分配方案,各输入对应的标签为根据样本分配方案在对应场景下仿真计算后实际得到的样本评估指标,如时间权重、订单成功率、订单价值以及订单成本等。
可以理解的是,在不更换应用场景的情况下,可以无需重新训练评估模型。若更换应用场景,则需获取对应应用场景下的训练数据重新训练评估模型。
基于上述任一实施例,评估模型是基于自注意力机制(Self-Attention)构建的神经网络模型。图3是本发明提供的评估模型的结构示意图,如图3所示,评估模型包括全连接层(FC Layer),自注意力层(Self-Attention Layer)和注意力池化层(Attention-PoolingLayer)。
基于上述任一实施例,评估指标包括时间权重、订单成功率、订单价值以及订单成本中的至少一种。其中,时间权重指的是按照当前的分配方案,所有订单均被完成所经过的时间。订单成功率是指根据用户的订单派出去的车辆能够成功满足用户运输需求的数量在总订单数量中的占比。订单价值是指成功完成的所有订单的价值总和。订单成本是指根据当前的目标分配方案,需要花费的全部成本损耗。
基于上述任一实施例,需求分析提示文本输入至大语言模型,得到大语言模型输出的需求分析结果,之前还包括:
获取用户对目标任务的分配需求文本;
基于分配需求文本,生成需求分析提示文本。
具体地,分配需求文本用于表征用户对目标任务的分配需求,其可以是根据用户的语音数据转写得到的,也可以是用户自行输入的,本发明实施例对此不作具体限定。在确定分配需求文本后,基于分配需求文本生成需求分析提示文本。
基于上述任一实施例,图4是本发明提供的又一基于大语言模型的目标分配方法的流程示意图,如图4所示,该方法包括:
用户根据当前的车辆清单与订单清单,提出自身的目标分配问题(即用户问题)。接收用户问题后,基于用户问题自动生成需求分析prompt,将需求分析prompt传入大语言模型,大语言模型根据需求分析prompt的描述生成需求分析结果。其中需求分析结果暂时留存,将需求分析结果传入Hungarian分配算法,Hungarian分配算法基于当前的车辆清单、订单清单以及传入的需求分析结果,计算得到目标分配结果,并将目标分配结果按照设定的格式转化后输入训练后的评估模型。评估模型读取当前的目标分配结果,输出针对时间权重、订单成功率、订单价值、订单成本的评估值。基于评估模型输出的时间权重、订单成功率、订单价值、订单成本的评估值,自动生成方案分析的prompt,大语言模型根据方案分析prompt输出针对的当前最终方案的方案分析结果。最后,基于之前留存的需求分析结果与方案分析结果,生成方案描述prompt。大语言模型根据方案描述prompt生成回送给用户的方案描述结果,方案描述结果中可以包括根据用户问题,得出的用户需求的分析和理解,具体可执行的分配方案,以及针对该分配方案的评估结果。
下面对本发明提供的基于大语言模型的目标分配装置进行描述,下文描述的基于大语言模型的目标分配装置与上文描述的基于大语言模型的目标分配方法可相互对应参照。
基于上述任一实施例,图5是本发明提供的基于大语言模型的目标分配装置的结构示意图,如图5所示,该装置包括:
需求分析单元510,用于将需求分析提示文本输入至大语言模型,得到大语言模型输出的需求分析结果,需求分析提示文本用于描述用户对目标任务的分配需求;
任务分配单元520,用于基于需求分析结果,对目标任务进行分配,得到目标分配结果;
第一生成单元530,用于基于目标分配结果,生成方案分析提示文本;
方案分析单元540,用于将方案分析提示文本输入至大语言模型,得到大语言模型输出的方案分析结果;
第二生成单元550,用于基于方案分析结果以及需求分析结果,生成方案描述提示文本;
方案描述单元560,用于将方案描述提示文本输入至大语言模型,得到大语言模型输出的方案描述结果,方案描述结果用于描述目标任务的分配方案以及分配方案的评估结果。
基于上述任一实施例,基于目标分配结果,生成方案分析提示文本,包括:
将目标分配结果输入至评估模型,得到评估模型输出的目标分配结果对应的评估指标;
基于评估指标,生成方案分析提示文本。
基于上述任一实施例,评估模型基于样本分配方案以及样本分配方案对应的样本评估指标训练得到。
基于上述任一实施例,评估模型是基于自注意力机制构建的神经网络模型。
基于上述任一实施例,评估指标包括时间权重、订单成功率、订单价值以及订单成本中的至少一种。
基于上述任一实施例,需求分析提示文本输入至大语言模型,得到大语言模型输出的需求分析结果,之前还包括:
获取用户对目标任务的分配需求文本;
基于分配需求文本,生成需求分析提示文本。
图6是本发明提供的电子设备的结构示意图,如图6所示,该电子设备可以包括:处理器(processor)610、存储器(memory)620、通信接口(Communications Interface)630和通信总线640,其中,处理器610,存储器620,通信接口630通过通信总线640完成相互间的通信。处理器610可以调用存储器620中的逻辑指令,以执行基于大语言模型的目标分配方法,该方法包括:将需求分析提示文本输入至大语言模型,得到所述大语言模型输出的需求分析结果,所述需求分析提示文本用于描述用户对目标任务的分配需求;基于所述需求分析结果,对所述目标任务进行分配,得到目标分配结果;基于所述目标分配结果,生成方案分析提示文本;将所述方案分析提示文本输入至所述大语言模型,得到所述大语言模型输出的方案分析结果;基于所述方案分析结果以及所述需求分析结果,生成方案描述提示文本;将所述方案描述提示文本输入至所述大语言模型,得到所述大语言模型输出的方案描述结果,所述方案描述结果用于描述所述目标任务的分配方案以及所述分配方案的评估结果。
此外,上述的存储器620中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法所提供的基于大语言模型的目标分配方法,该方法包括:将需求分析提示文本输入至大语言模型,得到所述大语言模型输出的需求分析结果,所述需求分析提示文本用于描述用户对目标任务的分配需求;基于所述需求分析结果,对所述目标任务进行分配,得到目标分配结果;基于所述目标分配结果,生成方案分析提示文本;将所述方案分析提示文本输入至所述大语言模型,得到所述大语言模型输出的方案分析结果;基于所述方案分析结果以及所述需求分析结果,生成方案描述提示文本;将所述方案描述提示文本输入至所述大语言模型,得到所述大语言模型输出的方案描述结果,所述方案描述结果用于描述所述目标任务的分配方案以及所述分配方案的评估结果。
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各提供的基于大语言模型的目标分配方法,该方法包括:将需求分析提示文本输入至大语言模型,得到所述大语言模型输出的需求分析结果,所述需求分析提示文本用于描述用户对目标任务的分配需求;基于所述需求分析结果,对所述目标任务进行分配,得到目标分配结果;基于所述目标分配结果,生成方案分析提示文本;将所述方案分析提示文本输入至所述大语言模型,得到所述大语言模型输出的方案分析结果;基于所述方案分析结果以及所述需求分析结果,生成方案描述提示文本;将所述方案描述提示文本输入至所述大语言模型,得到所述大语言模型输出的方案描述结果,所述方案描述结果用于描述所述目标任务的分配方案以及所述分配方案的评估结果。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种基于大语言模型的目标分配方法,其特征在于,包括:
将需求分析提示文本输入至大语言模型,得到所述大语言模型输出的需求分析结果,所述需求分析提示文本用于描述用户对目标任务的分配需求;
基于所述需求分析结果,对所述目标任务进行分配,得到目标分配结果;
基于所述目标分配结果,生成方案分析提示文本;
将所述方案分析提示文本输入至所述大语言模型,得到所述大语言模型输出的方案分析结果;
基于所述方案分析结果以及所述需求分析结果,生成方案描述提示文本;
将所述方案描述提示文本输入至所述大语言模型,得到所述大语言模型输出的方案描述结果,所述方案描述结果用于描述所述目标任务的分配方案以及所述分配方案的评估结果。
2.根据权利要求1所述的基于大语言模型的目标分配方法,其特征在于,所述基于所述目标分配结果,生成方案分析提示文本,包括:
将所述目标分配结果输入至评估模型,得到所述评估模型输出的所述目标分配结果对应的评估指标;
基于所述评估指标,生成方案分析提示文本。
3.根据权利要求2所述的基于大语言模型的目标分配方法,其特征在于,所述评估模型基于样本分配方案以及所述样本分配方案对应的样本评估指标训练得到。
4.根据权利要求2所述的基于大语言模型的目标分配方法,其特征在于,所述评估模型是基于自注意力机制构建的神经网络模型。
5.根据权利要求2所述的基于大语言模型的目标分配方法,其特征在于,所述评估指标包括时间权重、订单成功率、订单价值以及订单成本中的至少一种。
6.根据权利要求1至5任一项所述的基于大语言模型的目标分配方法,其特征在于,所述需求分析提示文本输入至大语言模型,得到所述大语言模型输出的需求分析结果,之前还包括:
获取用户对目标任务的分配需求文本;
基于所述分配需求文本,生成所述需求分析提示文本。
7.一种基于大语言模型的目标分配装置,其特征在于,包括:
需求分析单元,用于将需求分析提示文本输入至大语言模型,得到所述大语言模型输出的需求分析结果,所述需求分析提示文本用于描述用户对目标任务的分配需求;
任务分配单元,用于基于所述需求分析结果,对所述目标任务进行分配,得到目标分配结果;
第一生成单元,用于基于所述目标分配结果,生成方案分析提示文本;
方案分析单元,用于将所述方案分析提示文本输入至所述大语言模型,得到所述大语言模型输出的方案分析结果;
第二生成单元,用于基于所述方案分析结果以及所述需求分析结果,生成方案描述提示文本;
方案描述单元,用于将所述方案描述提示文本输入至所述大语言模型,得到所述大语言模型输出的方案描述结果,所述方案描述结果用于描述所述目标任务的分配方案以及所述分配方案的评估结果。
8.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至6任一项所述基于大语言模型的目标分配方法。
9.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述基于大语言模型的目标分配方法。
10.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述基于大语言模型的目标分配方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410206913.2A CN117787668B (zh) | 2024-02-26 | 2024-02-26 | 一种基于大语言模型的目标分配方法、装置、电子设备、存储介质和程序产品 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410206913.2A CN117787668B (zh) | 2024-02-26 | 2024-02-26 | 一种基于大语言模型的目标分配方法、装置、电子设备、存储介质和程序产品 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117787668A true CN117787668A (zh) | 2024-03-29 |
CN117787668B CN117787668B (zh) | 2024-08-13 |
Family
ID=90402063
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410206913.2A Active CN117787668B (zh) | 2024-02-26 | 2024-02-26 | 一种基于大语言模型的目标分配方法、装置、电子设备、存储介质和程序产品 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117787668B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070156392A1 (en) * | 2005-12-30 | 2007-07-05 | International Business Machines Corporation | Method and system for automatically building natural language understanding models |
CN116737129A (zh) * | 2023-08-08 | 2023-09-12 | 杭州比智科技有限公司 | 一种供应链控制塔生成式大语言模型及其构建方法 |
CN117194637A (zh) * | 2023-09-18 | 2023-12-08 | 深圳市大数据研究院 | 基于大语言模型的多层级可视化评估报告生成方法、装置 |
CN117350825A (zh) * | 2023-12-05 | 2024-01-05 | 浙江口碑网络技术有限公司 | 基于大语言模型的导购方法和系统 |
CN117492743A (zh) * | 2023-10-12 | 2024-02-02 | 北京百度网讯科技有限公司 | 基于大语言模型的目标应用生成方法、装置及存储介质 |
-
2024
- 2024-02-26 CN CN202410206913.2A patent/CN117787668B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070156392A1 (en) * | 2005-12-30 | 2007-07-05 | International Business Machines Corporation | Method and system for automatically building natural language understanding models |
CN116737129A (zh) * | 2023-08-08 | 2023-09-12 | 杭州比智科技有限公司 | 一种供应链控制塔生成式大语言模型及其构建方法 |
CN117194637A (zh) * | 2023-09-18 | 2023-12-08 | 深圳市大数据研究院 | 基于大语言模型的多层级可视化评估报告生成方法、装置 |
CN117492743A (zh) * | 2023-10-12 | 2024-02-02 | 北京百度网讯科技有限公司 | 基于大语言模型的目标应用生成方法、装置及存储介质 |
CN117350825A (zh) * | 2023-12-05 | 2024-01-05 | 浙江口碑网络技术有限公司 | 基于大语言模型的导购方法和系统 |
Also Published As
Publication number | Publication date |
---|---|
CN117787668B (zh) | 2024-08-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106503236B (zh) | 基于人工智能的问题分类方法以及装置 | |
Gandomani et al. | An empirically-developed framework for Agile transition and adoption: A Grounded Theory approach | |
CN110309170B (zh) | 一种任务型多轮对话中的复杂意图识别方法 | |
CN107451230A (zh) | 一种问答方法以及问答系统 | |
CN112199477A (zh) | 对话管理方案和对话管理语料的构建方法 | |
CN111428448A (zh) | 文本生成方法、装置、计算机设备及可读存储介质 | |
CN117472552B (zh) | 服务场景智能编排及动态调度方法、装置、设备及介质 | |
CN113268610A (zh) | 基于知识图谱的意图跳转方法、装置、设备及存储介质 | |
Malode | Benchmarking public large language model | |
CN112597124A (zh) | 一种数据字段映射方法、装置及存储介质 | |
CN112667791A (zh) | 潜在事件预测方法、装置、设备及存储介质 | |
CN113988013A (zh) | 基于多任务学习和图注意力网络的icd编码方法及装置 | |
CN118035425A (zh) | 基于自然语言模型的交互方法、装置、电子设备及介质 | |
CN118133233A (zh) | 业务流程挖掘方法、装置、电子设备及介质 | |
CN117787668B (zh) | 一种基于大语言模型的目标分配方法、装置、电子设备、存储介质和程序产品 | |
CN115617974B (zh) | 一种对话处理方法、装置、设备及存储介质 | |
US10733497B1 (en) | Tailored artificial intelligence | |
CN117193738A (zh) | 应用搭建方法、装置、设备及存储介质 | |
US8752004B2 (en) | System and a method for generating a domain-specific software solution | |
CN111091011B (zh) | 领域预测方法、领域预测装置及电子设备 | |
CN115689603A (zh) | 用户反馈信息收集方法、装置及用户反馈系统 | |
Mohamed et al. | A deep learning model for an intelligent chat bot system: an application to e-learning domain | |
CN115309858A (zh) | 算术表达式的生成方法、装置、设备、介质及产品 | |
CN112328774B (zh) | 基于多文档的任务型人机对话任务的实现方法 | |
US20220300884A1 (en) | Method and system for evaluating performance of developers using artificial intelligence (ai) |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |