CN117371950A

CN117371950A - 机器人流程自动化方法、装置、一体机和存储介质

Info

Publication number: CN117371950A
Application number: CN202311384959.5A
Authority: CN
Inventors: 刘杰; 黄鹏; 李强; 马永恒; 于继栋; 汤熙; 韦邦灯; 王永超; 张龙; 陈冰川; 熊世富; 刘聪; 胡国平
Original assignee: iFlytek Co Ltd
Current assignee: iFlytek Co Ltd
Priority date: 2023-10-23
Filing date: 2023-10-23
Publication date: 2024-01-09

Abstract

本发明提供一种机器人流程自动化方法、装置、一体机和存储介质，其中方法包括：获取需求文本；对所述需求文本进行意图分类，得到意图分类结果；在所述意图分类结果为执行业务的情况下，基于机器人流程自动化RPA大模型，执行所述需求文本对应的业务。本发明提供的机器人流程自动化方法、装置、一体机和存储介质，能够提高流程自动化任务的执行效率和准确性，提升用户体验感。

Description

机器人流程自动化方法、装置、一体机和存储介质

技术领域

本发明涉及新一代信息技术领域，尤其涉及一种机器人流程自动化方法、装置、一体机和存储介质。

背景技术

随着人工智能和深度学习的不断发展，越来越多的工作可以被机器替代，例如自动点击，自动搜索，自动收集软件数据等任务，这样可以避免重复工作，提升工作效率。机器人流程自动化(Robotic Process Automation，RPA)技术，用于模拟人操控不同软件系统并自动执行规则确定、重复性高的业务流程。

相关技术中，通常是基于大型语言模型完成流程自动化任务。然而在一些应用场景下，流程自动化任务执行效率和准确性不高，影响用户体验感。

发明内容

本发明提供一种机器人流程自动化方法、装置、一体机和存储介质，用以解决现有技术中流程自动化任务执行效率和准确性不高，影响用户体验感的缺陷。

本发明提供一种机器人流程自动化方法，包括：

获取需求文本；

对所述需求文本进行意图分类，得到意图分类结果；

在所述意图分类结果为执行业务的情况下，基于机器人流程自动化RPA大模型，执行所述需求文本对应的业务。

根据本发明提供的机器人流程自动化方法，所述基于机器人流程自动化RPA大模型，执行所述需求文本对应的业务，包括：

基于所述需求文本与知识库的各知识之间的语义相似度，从所述各知识中抽取与所述需求文本相关的关联知识；

基于所述关联知识和所述需求文本，通过所述RPA大模型执行所述需求文本对应的业务。

根据本发明提供的机器人流程自动化方法，所述基于所述需求文本与知识库的各知识之间的语义相似度，从所述各知识中抽取与所述需求文本相关的关联知识，包括：

基于第一知识抽取模型，应用所述需求文本与知识库的各知识之间的语义相似度，从所述各知识中抽取与所述需求文本相关的第一数量个第一知识；

基于第二知识抽取模型，应用所述需求文本与所述第一知识之间的语义相似度，从所述第一数量个第一知识中抽取第二数量个第二知识，并将所述第二知识作为所述关联知识，所述第一数量大于所述第二数量。

根据本发明提供的机器人流程自动化方法，所述第一知识抽取模型基于第一样本需求文本及其对应的第一样本知识，在第一初始模型的基础上训练得到；

所述第二知识抽取模型基于第二样本需求文本及其对应的第二样本知识，在第二初始模型的基础上训练得到。

基于所述RPA大模型，对所述需求文本进行流程拆解，得到所述需求文本所对应的业务流程；

对所述业务流程进行原子能力的知识匹配，并基于知识匹配结果与代码生成方式之间的映射关系，生成所述业务流程的RPA流程代码；

基于所述业务流程的RPA流程代码，执行所述需求文本对应的业务。

根据本发明提供的机器人流程自动化方法，所述基于知识匹配结果与代码生成方式之间的映射关系，生成所述业务流程的RPA流程代码，包括：

在所述知识匹配结果为匹配失败的情况下，基于代码模型生成所述业务流程的RPA流程代码。

在所述知识匹配结果为匹配成功的情况下，对所述业务流程进行功能项映射，得到所述业务流程对应的功能清单；

基于所述功能清单和匹配成功的原子能力知识，生成所述业务流程的RPA流程代码。

本发明还提供一种机器人流程自动化装置，包括：

文本获取单元，用于获取需求文本；

意图分类单元，用于对所述需求文本进行意图分类，得到意图分类结果；

业务执行单元，用于在所述意图分类结果为执行业务的情况下，基于机器人流程自动化RPA大模型，执行所述需求文本对应的业务。

本发明还提供一种一体机，包括存储器、处理器，以及存储在所述存储器上的RPA大模型和存储在所述存储器上并在所述处理器上运行的计算机程序；

所述处理器执行所述计算机程序时，调用所述RPA大模型以实现所述机器人流程自动化方法。

本发明还提供一种非暂态计算机可读存储介质，其上存储有计算机程序和/或RPA大模型；

所述计算机程序被处理器执行以调用所述RPA大模型实现所述机器人流程自动化方法。

本发明还提供一种计算机程序产品，包括计算机程序，所述计算机程序被处理器执行时实现如上述任一种所述机器人流程自动化方法。

本发明提供的机器人流程自动化方法、装置、一体机和存储介质，通过对需求文本进行意图分类，得到意图分类结果；在意图分类结果为执行业务的情况下，基于机器人流程自动化RPA大模型，执行需求文本对应的业务，能够提高流程自动化任务的执行效率和准确性，提升用户体验感。

附图说明

为了更清楚地说明本发明或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明提供的机器人流程自动化方法的流程示意图之一；

图2是本发明提供的机器人流程自动化方法的流程示意图之二；

图3是本发明提供的机器人流程自动化方法的流程示意图之三；

图4是本发明提供的机器人流程自动化方法的流程示意图之四；

图5是本发明提供的机器人流程自动化方法的流程示意图之五；

图6是本发明提供的机器人流程自动化方法的流程示意图之六；

图7是本发明提供的机器人流程自动化装置的结构示意图；

图8是本发明提供的一体机的结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合本发明中的附图，对本发明中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

相关技术中，通常是基于大型语言模型完成流程自动化任务。然而在一些应用场景下，流程自动化任务执行效率不高，影响用户体验感。

针对上述问题，为了提升流程自动化任务执行效率和用户体验感，本发明的发明构思在于：通过对需求文本进行意图分类，得到意图分类结果；在意图分类结果为执行业务的情况下，基于机器人流程自动化RPA大模型，执行需求文本对应的业务。

基于上述发明构思，本发明提供一种机器人流程自动化方法、装置、一体机和存储介质，应用于人工智能技术中的机器人流程自动化场景，以提高流程自动化任务执行效率和用户体验感。

下面将结合附图详细描述本发明的技术方案。图1是本发明提供的机器人流程自动化方法的流程示意图之一，该方法中各步骤的执行主体机器人流程自动化装置，该装置可通过软件和/或硬件实现，该装置可集成在电子设备中，电子设备可以是一体机、智能手机、个人电脑，也可以是本地服务器或云端服务器，也可以为服务器集群具有各种操作系统的硬件设备。

需要说明的是，本发明实施例的执行主体，在硬件上例如可以为电子设备中的中央处理器(Central Processing Unit，CPU)，在软件上例如可以为电子设备中大模型相关的服务，对此不作限定。如图1所示，该方法可以包括如下步骤：

步骤110，获取需求文本。

具体地，需求文本是指能够表达用户需求的文本，可以是用户输入的自然语言形式的指令。

需求文本可以是用户直接输入的文本；也可以是用户输入语音，并将采集所得的音频进行语音转写后得到的；还可以是用户输入图像，并对图像进行OCR(OpticalCharacter Recognition，光学字符识别)或者意图识别得到的，本发明实施例对此不做具体限定。

此处需求文本可以是任意语种的语言，例如中文、英文、俄文和法文等。

在一个实施例中，用户可在相关客户端打开大型语言模型的人机对话界面，并通过该人机对话界面的聊天框输入需求文本，与智能对话机器人进行对话。

在用户初次打开人机对话界面时，智能对话机器人可主动发起对话，并在该人机对话界面生成提示语，例如“Hi，我是智能机器人，您可以试着通过自然语言描述需求哦”、“请问你要做什么”等，以引导用户进行对话，此时用户可通过聊天框输入需求文本。

用户可针对使用场景输入与该场景对应的指令，即需求文本。例如在数据查询场景下，需求文本可以是“打开中国移动，帮我查一下最近一个月的话费”，又例如在聊天场景下，需求文本可以是“今天天气怎么样啊？”，再例如在购物场景下，需求文本可以是“帮我去淘宝上看看，买一件儿童羽绒服”等等。用户通过聊天框输入需求文本之后，智能对话机器人即可获取该需求文本。

此处，需求文本不仅可以是用户首次打开人机对话界面输入的文本，还可以是用户针对交互过程中的多轮会话，后续每轮会话输入的文本。

步骤120，对需求文本进行意图分类，得到意图分类结果；

步骤130，在意图分类结果为执行业务的情况下，基于机器人流程自动化RPA大模型，执行需求文本对应的业务。

具体地，考虑到实际应用过程中用户需求是多元化的，例如用户需求只是单纯的想和机器人聊天，或者用户需求是想请机器人自动执行一些规则确定的业务流程，例如自动点击，自动搜索，自动收集软件数据等任务。由于现有的大型语言模型内部由不同的模型组成，有泛化能力较强的基础模型，也有专门针对用户的指令生成RPA自动化流程的RPA模型，但是在面向用户时只展示一个统一的交互界面，例如星火大模型的用户界面。因此针对需执行流程自动化任务的需求文本，如果是通过基础模型的能力进行用户回复，会导致流程自动化任务的执行效率和准确性不高，影响用户体验感。

针对此问题，在本发明实施例中，接收到用户的需求文本之后，可进一步对需求文本进行意图分类，得到意图分类结果。此处意图分类的目的是确定用户的意图，即通过对需求文本进行语义理解，以准确识别用户的意图。

针对需求文本进行意图分类，可通过已训练的意图分类模型实现。可将需求文本输入至已训练的意图分类模型中，得到意图分类模型输出的意图分类结果。在此之前，可针对意图分类模型进行训练。首先收集大量样本需求文本及其对应的意图标签，然后从样本需求文本中提取能够表征其意图的特征，例如包括样本需求文本中的分词或词向量等。随即，在初始模型的基础上，使用逻辑回归、决策树或深度学习的方法对初始模型进行训练，由此训练得到的意图分类模型能够针对需求文本进行意图分类。

意图分类结果可以包括执行业务和非执行业务，其中执行业务可理解为执行流程自动化业务，例如自动点击，自动搜索，自动收集软件数据等业务。非执行业务可理解为与流程自动化业务无关的任务，例如聊天、内容创造或知识问答等。

为了提高流程自动化任务的执行效率和准确性，提升用户体验感，在意图分类结果为执行业务的情况下，基于机器人流程自动化RPA大模型，执行需求文本对应的业务。

RPA大模型可以是预先训练好的，它可以利用自动化技术模拟人类的后台任务，如提取数据、填写表单和移动文件等等。此外，它能够将简单的工作流程自动化，并为AI提供大量的数据，使得AI能够根据RPA提供的数据进行学习和模仿，进一步改善和优化流程。这种自动化技术不仅可以提高生产效率，减少人力成本，而且可以显著提高工作效率和准确性。同时，RPA大模型还具备强大的扩展性，能够满足各种日常需要，涵盖了大部分RPA应用场景。

可理解的是，在意图分类结果为非执行业务的情况下，可基于基础模型执行需求文本对应的业务，例如通过基础模型与用户进行聊天，或调用知识库回答用户的问题。

本发明实施例提供的方法，通过对需求文本进行意图分类，得到意图分类结果；在意图分类结果为执行业务的情况下，基于机器人流程自动化RPA大模型，执行需求文本对应的业务，能够提高流程自动化任务的执行效率和准确性，提升用户体验感。

基于上述实施例，图2是本发明提供的机器人流程自动化方法的流程示意图之二，如图2所示，步骤130中基于机器人流程自动化RPA大模型，执行需求文本对应的业务，包括：

步骤131，基于需求文本与知识库的各知识之间的语义相似度，从各知识中抽取与需求文本相关的关联知识；

步骤132，基于关联知识和需求文本，通过RPA大模型执行需求文本对应的业务。

具体地，考虑到相关技术中通常是仅通过模型训练得到的知识储备和能力自动执行需求文本对应的业务，在一些场景下会导致流程自动化准确性不高，为了进一步提高流程自动化的准确性，本发明实施例首先抽取与需求文本相关的关联知识，然后将关联知识作为模型的外挂知识，外挂的知识和模型本来通过训练得到的知识储备与能力结合，自动执行需求文本对应的业务。

针对自动执行需求文本对应的业务，可通过将与需求文本相关的关联知识和需求文本同时输入至RPA大模型，由RPA大模型实现业务自动执行。

与需求文本相关的关联知识可以是与需求文本相关的软件的操作说明。例如，需求文本是“帮我在社交软件A上添加一个好友”，则其关联知识可以是社交软件A关于添加好友的操作说明。又例如，需求文本是“帮我在购物软件B上购买一件儿童羽绒服”，则其关联知识可以是购物软件B关于商品搜索和购买的操作说明。再例如，需求文本是“打开中国移动，帮我查一下最近一个月的话费”，则其关联知识可以是中国移动软件关于话费查询的操作说明。

针对关联知识的获取，可通过基于需求文本与知识库的各知识之间的语义相似度，从各知识中抽取实现。知识库可以是预先构建好的，其中存储有大量的知识，包括各类软硬件产品的使用说明，例如社交类软件A\C\D、购物类软件B\E\F、教育类软件等等。需说明的是，知识库中的知识可包括执行各个功能清单的原子能力知识、RPA设计器知识和软件元素层级知识等。

需求文本与知识库的各知识之间的语义相似度可通过分别对需求文本和各知识进行语义特征提取，并计算提取后得到的语义特征之间的相似度得到。

可理解的是，需求文本与任一知识之间的语义相似度越大，则该知识从知识库中抽取出来作为与需求文本相关的关联知识的概率越大；反之，需求文本与任一知识之间的语义相似度越小，则该知识从知识库中抽取出来作为与需求文本相关的关联知识的概率越小。

得到关联知识之后，可将关联知识和需求文本拼接在prompt中，作为RPA大模型的提示语，输入至RPA大模型中，通过RPA大模型自动执行需求文本对应的业务。

本发明实施例提供的方法，基于需求文本与知识库的各知识之间的语义相似度，从各知识中抽取与需求文本相关的关联知识，基于关联知识和需求文本，通过RPA大模型执行需求文本对应的业务，能够进一步提高流程自动化的执行准确性。

基于上述任一实施例，图3是本发明提供的机器人流程自动化方法的流程示意图之三，如图3所示，基于需求文本与知识库的各知识之间的语义相似度，从各知识中抽取与需求文本相关的关联知识，即步骤131具体包括：

步骤131-1，基于第一知识抽取模型，应用需求文本与知识库的各知识之间的语义相似度，从各知识中抽取与需求文本相关的第一数量个第一知识；

步骤131-2，基于第二知识抽取模型，应用需求文本与第一知识之间的语义相似度，从第一数量个第一知识中抽取第二数量个第二知识，并将第二知识作为关联知识，第一数量大于第二数量。

具体地，针对关联知识的获取，可通过知识抽取模型实现。同时考虑到知识库中知识数量庞大，为了获取与需求文本关联度更高的知识，降低模型的消耗，增加知识抽取的效率和准确性，可采用级联抽取的方式。

首先，通过第一知识抽取模型，应用需求文本与知识库的各知识之间的语义相似度，从各知识中抽取与需求文本相关的第一数量个第一知识。第一知识抽取模型的作用是进行一个初步抽取，即实现较粗粒度的抽取。第一数量可以是10-15个。

随即，通过第二知识抽取模型，应用需求文本与第一知识之间的语义相似度，从第一数量个第一知识中抽取第二数量个第二知识。第二知识抽取模型的作用是对第一次抽取得到的第一知识进行一个精细抽取，即实现较细粒度的抽取。以抽取出与需求文本的相关度最高的第二数量个第二知识。此处，第二数量例如可以是2个或3个。

比如针对“帮我在社交软件A上添加一个好友”的需求文本，可首先基于第一知识抽取模型，抽取得到10-15个关于社交软件A好友添加流程的知识；随即基于第二知识抽取模型，从该10-15个知识中抽取到最相关的2个知识，分别是点击添加按钮、输入好友手机号码，由此可直接将该2个知识作为与需求文本相关的关联知识。

本发明实施例提供的方法，通过级联抽取的方式从知识库中进行关联知识的抽取，能够降低模型的消耗，增加知识抽取的效率和准确性。

基于上述任一实施例，第一知识抽取模型基于第一样本需求文本及其对应的第一样本知识，在第一初始模型的基础上训练得到；

第二知识抽取模型基于第二样本需求文本及其对应的第二样本知识，在第二初始模型的基础上训练得到。

具体地，第一知识抽取模型的作用是从知识库中进行一个较粗粒度的初步抽取，第二知识抽取模型作用是对第一知识抽取模型抽取得到的第一知识进行一个较细粒度的精细抽取。为了实现两个模型各自分别对应的专注程度和精细程度，第一知识抽取模型和第二知识抽取模型的模型结构、训练样本和训练方法均有所不同。

第一知识抽取模型是采用有监督学习方法，在第一初始模型的基础上训练得到的。可预先收集大量第一样本需求文本，第一样本需求文本可包括第一样本需求文本的具体解释说明。此外，还需收集第一样本需求文本对应的第一样本知识。第一初始模型在训练过程中，不断学习第一样本需求文本与其对应的第一样本知识之间的映射关系，以使训练好的第一知识抽取模型具备较粗粒度的初步抽取能力。

第二知识抽取模型是采用有监督学习方法，在第二初始模型的基础上训练得到的。可预先收集大量第二样本需求文本，第二样本需求文本可包括第二样本需求文本的具体解释说明。此外，还需收集第二样本需求文本对应的第二样本知识。第二初始模型在训练过程中，不断学习第二样本需求文本与其对应的第二样本知识之间的映射关系，以使训练好的第二知识抽取模型具备较粗粒度的初步抽取能力。

此处的第一样本需求文本与第二样本需求文本可以是相同的，也可以是不同的，第一初始模型和第二初始模型的模型结构可以是相同的，也可以是不同的。

第一初始模型和第二初始模型具体可以是预训练语言模型，例如BERT、星火大模型等；还可以是长短期记忆模型(LSTM)或基于自注意力机制的Transformer模型等，在此不作具体限定。

基于上述任一实施例，图4是本发明提供的机器人流程自动化方法的流程示意图之四，如图4所示，基于机器人流程自动化RPA大模型，执行需求文本对应的业务，即步骤130具体包括：

步骤133，基于RPA大模型，对需求文本进行流程拆解，得到需求文本所对应的业务流程；

步骤134，对业务流程进行原子能力的知识匹配，并基于知识匹配结果与代码生成方式之间的映射关系，生成业务流程的RPA流程代码；

步骤135，基于业务流程的RPA流程代码，执行需求文本对应的业务。

具体地，针对需求文本对应业务的自动执行，可首先基于RPA大模型，对需求文本进行流程拆解，得到需求文本所对应的业务流程。此处的业务流程是指完成需求文本对应业务过程中所涉及的工作流，具体而言可以是模拟人工操控软件系统需要执行的工作流程。

以数据查询场景为例，针对需求文本“打开中国移动，帮我查一下最近一个月的话费”进行流程拆解，可拆解得到该需求文本对应的5个业务流程，分别为：

1)打开中国移动官网；

2)点击我的移动；

3)点击查询话费；

4)点击最近一个月；

5)点击查询。

针对需求文本进行流程拆解，可通过RPA大模型实现，可将需求文本输入预先训练好的RPA大模型中，由RPA大模型对于执行该需求文本对应指令所需的业务流程进行拆解，从而得到RPA大模型输出的该需求文本所对应的业务流程。

随即，为了执行该业务流程，需要生成业务流程的RPA流程代码，在得到流程代码的基础上，执行需要文本对应的业务。在生成业务流程的RPA流程代码之前，可对业务流程进行原子能力的知识匹配，此处知识匹配的目的是根据当前知识库和模型已具备的原子能力知识，是否可以完成业务流程对应的任务。

RPA原子能力具体可包括：数据提取能力，这是RPA原子能力中最基本的一项，它可以从各种格式的文件中提取数据，如Excel、PDF、数据库等。数据处理能力，可以是对提取的数据进行处理，如数据清洗、数据转换、数据合并等。数据输入能力，可以将处理后的数据输入到各种系统或文件中，如数据库、电子表格、文本文件等。数据验证能力，可以对输入的数据进行验证，确保数据的准确性和完整性。数据同步能力，可以将数据从一个系统同步到另一个系统，确保数据的一致性。数据报告能力，可以生成各种类型的报告，如汇总报告、详细报告、图表报告等。任务调度能力，可以设置任务的执行时间，确保任务在指定的时间内完成。错误处理能力，可以处理在执行任务过程中出现的错误，如重试、跳过、记录错误等。日志记录能力，可以记录任务的执行过程，方便后期的审计和问题排查。用户交互能力，可以模拟用户的交互行为，如点击按钮、填写表单、发送邮件等。

此处知识匹配结果可以是匹配成功或匹配失败，匹配成功表示知识库和/或模型已具备的原子能力知识可以完成业务流程对应的任务，匹配失败表示知识库和/或模型已具备的原子能力知识不可以完成业务流程对应的任务。

例如，需求文本所对应的业务流程包括三个，其中业务流程1)和2)是点击××按钮，其知识匹配结果可能是匹配成功，业务流程3)是需要做一个数据分析，其知识匹配结果可能是匹配失败。

不同的知识匹配结果可对应不同的代码生成方式，知识匹配结果与代码生成方式之间的映射关系可以是预先设置好的。在此基础上，根据知识匹配结果对应的代码生成方式，生成业务流程的RPA流程代码。

RPA流程代码可以是RPA脚本，根据RPA流程代码，可执行需求文本对应的业务。

以数据查询场景为例，针对需求文本“打开中国移动，帮我查一下最近一个月的话费”进行流程拆解得到的5个业务流程，进而生成该5个业务流程的RPA流程代码可以为：

1)打开中国移动官网：打开(Chrome)中的(http://www.10086.cn)，将结果输出为浏览器对象(web_open_1)；

2)点击我的移动：通过(点击)的形式点击浏览器对象(web_open_1)中的点击对象(中国移动-我的移动按钮)；

3)点击查询话费：通过(点击)的形式点击浏览器对象(web_open_1)中的点击对象(中国移动-话费查询按钮)；

4)点击最近一个月：通过(点击)的形式点击浏览器对象(web_open_1)中的点击对象(中国移动-最近一个月按钮)；

5)点击查询：通过(点击)的形式点击浏览器对象(web_open_1)中的点击对象(中国移动-查询按钮)。

本发明实施例提供的方法，通过对需求文本进行流程拆解得到需求文本所对应的业务流程，对业务流程进行原子能力的知识匹配，并基于知识匹配结果与代码生成方式之间的映射关系，生成业务流程的RPA流程代码，进而基于业务流程的RPA流程代码，执行需求文本对应的业务，实现了机器人流程自动化。

基于上述任一实施例，步骤134中基于知识匹配结果与代码生成方式之间的映射关系，生成业务流程的RPA流程代码，具体包括：

在知识匹配结果为匹配失败的情况下，基于代码模型生成业务流程的RPA流程代码。

具体地，匹配失败表示知识库和/或模型已具备的原子能力知识不可以完成该业务流程对应的任务，即不可以根据已具备的原子能力知识自动生成该业务流程的RPA流程代码。此时可以基于代码模型生成业务流程的RPA流程代码，即调用代码模型生成临时的原子能力，生成的临时原子能力可用于完成业务流程对应的业务功能。

代码模型可以在大型语言模型(Large Language Model，LLM)的基础上进行微调得到，大型语言模型例如可以是星火认知大模型。微调后得到的代码模型能够实现代码生成、代码修改等功能。

针对知识匹配失败的业务流程，可将该业务流程输入至代码模型，得到代码模型输出的业务流程的RPA流程代码。

本发明实施例提供的方法，在知识匹配结果为匹配失败的情况下，基于代码模型生成业务流程的RPA流程代码，能够进一步提高流程自动化的执行效率和准确性。

基于上述任一实施例，图5是本发明提供的机器人流程自动化方法的流程示意图之五，如图5所示，步骤134中基于知识匹配结果与代码生成方式之间的映射关系，生成业务流程的RPA流程代码，具体包括：

步骤134-1，在知识匹配结果为匹配成功的情况下，对业务流程进行功能项映射，得到业务流程对应的功能清单；

步骤134-2，基于功能清单和匹配成功的原子能力，生成业务流程的RPA流程代码。

具体地，知识匹配结果匹配成功表示知识库和/或模型已具备的原子能力知识可以完成业务流程对应的任务，在此情况下，可自动生成业务流程的RPA流程代码。

针对RPA流程代码自动生成，可首先对业务流程进行功能项映射，得到业务流程对应的功能清单。

功能清单例如可包括桌面自动化功能和网页自动化功能，其中桌面自动化功能可包括打开桌面程序；网页自动化功能可包括打开浏览器、关闭浏览器、点击网页元素、指定网页元素输入内容、鼠标悬停在网页元素上、拾取复选框、拾取下拉框、拾取滑块拖拽、拾取元素截图、全局设置、设置Cookie、获取Cookie、网页操作、停止加载网页、刷新当前网页、网页滚动条滑动、元素至于可视区域(web)、关闭当前网页、打开新网页、切换到新网页、网页截图、当前网页前进等等。

以数据查询场景为例，针对需求文本“打开中国移动，帮我查一下最近一个月的话费”进行流程拆解得到的5个业务流程，进而对业务流程进行功能项映射，得到业务流程对应的功能清单可以为：

1)“网页自动化”-“打开浏览器”(“打开中国移动官网”){“input”：{“浏览器软件”：“chrome”，“浏览器路径”：“初始网址”：“http://www.10086.cn”}，“output”：{“浏览器对象”：“web_open_1”}}；

2)“网页自动化”-“点击网页元素”(“点击我的移动”){“input”：{“浏览器对象”：“web_open_1”，“拾取点击对象”：“中国移动-我的移动按钮”，“模拟人工点击”：“否”，“辅助按键”：“无”，“是否自动滚动到该元素位置”：“是”，“点击键位”：“点击”，“等待元素出现时间(秒)”：“10”}}；

3)“网页自动化”-“点击网页元素”(“点击查询话费”){“input”：{“浏览器对象”：“web_open_1”，“拾取点击对象”：“中国移动-话费查询按钮”，“模拟人工点击”：“否”，“辅助按键”：“无”，“是否自动滚动到该元素位置”：“是”，“点击键位”：“点击”，“等待元素出现时间(秒)”：“10”}}；

4)“网页自动化”-“点击网页元素”(“点击最近一个月”){“input”：{“浏览器对象”：“web_open_1”，“拾取点击对象”：“中国移动-最近1个月按钮”，“模拟人工点击”：“否”，“辅助按键”：“无”，“是否自动滚动到该元素位置”：“是”，“点击键位”：“点击”，“等待元素出现时间(秒)”：“10”}}；

5)“网页自动化”-“点击网页元素”(“点击查询”){“input”：{“浏览器对象”：“web_open_1”，“拾取点击对象”：“中国移动-查询按钮”，“模拟人工点击”：“否”，“辅助按键”：“无”，“是否自动滚动到该元素位置”：“是”，“点击键位”：“点击”，“等待元素出现时间(秒)”：“10”}}。

功能清单可通过对业务流程进行功能项映射得到，功能项映射可通过RPA大模型实现，具体可通过RPA大模型中的功能映射子模型实现。将匹配成功的业务流程输入至功能映射子模型，得到功能映射子模型输出的该业务流程的功能清单。

得到功能清单之后，可对功能清单进行解析，对匹配成功的原子能力自动填充拾取到的元素的参数，从而自动生成业务流程的RPA流程代码。

本发明实施例提供的方法，通过对业务流程进行功能项映射，得到业务流程对应的功能清单，基于功能清单和匹配成功的原子能力，生成业务流程的RPA流程代码，从而自动实现流程自动化业务的执行。

基于上述任一实施例，图6是本发明提供的机器人流程自动化方法的流程示意图之六，如图6所示，提供一种机器人流程自动化方法，包括：

S1，获取需求文本。

S2，对需求文本进行意图分类，得到意图分类结果。

S3，在意图分类结果为执行业务的情况下，基于机器人流程自动化RPA大模型，执行需求文本对应的业务。其中S3包括：

S31，基于第一知识抽取模型，应用需求文本与知识库的各知识之间的语义相似度，从各知识中抽取与需求文本相关的第一数量个第一知识；

S32，基于第二知识抽取模型，应用需求文本与第一知识之间的语义相似度，从第一数量个第一知识中抽取第二数量个第二知识，并将第二知识作为关联知识，第一数量大于第二数量；

S33，基于RPA大模型和关联知识，对需求文本进行流程拆解，得到需求文本所对应的业务流程。

需说明的是，针对业务流程的获取，可以仅基于RPA大模型，对需求文本进行流程拆解，得到需求文本所对应的业务流程；还可以基于RPA大模型和关联知识，对需求文本进行流程拆解，得到需求文本所对应的业务流程。将关联知识作为模型的外挂知识，外挂的知识和模型本来通过训练得到的知识储备与能力结合，能够进一步提高流程自动化的准确性。

S34，对业务流程进行原子能力的知识匹配，在知识匹配结果为匹配失败的情况下，基于代码模型生成业务流程的RPA流程代码；在知识匹配结果为匹配成功的情况下，对业务流程进行功能项映射，得到业务流程对应的功能清单，基于功能清单和匹配成功的原子能力知识，生成业务流程的RPA流程代码。

S35，基于业务流程的RPA流程代码，执行需求文本对应的业务。

下面对本发明提供的机器人流程自动化装置进行描述，下文描述的机器人流程自动化装置与上文描述的机器人流程自动化方法可相互对应参照。

基于上述任一实施例，图7是本发明提供的机器人流程自动化装置的结构示意图，如图7所示，提供一种机器人流程自动化装置，该装置包括文本获取单元710、意图分类单元720和业务执行单元730，其中：

文本获取单元710，用于获取需求文本；

意图分类单元720，用于对需求文本进行意图分类，得到意图分类结果；

业务执行单元730，用于在意图分类结果为执行业务的情况下，基于机器人流程自动化RPA大模型，执行需求文本对应的业务。

本发明实施例提供的装置，通过对需求文本进行意图分类，得到意图分类结果；在意图分类结果为执行业务的情况下，基于机器人流程自动化RPA大模型，执行需求文本对应的业务，能够提高流程自动化任务的执行效率和准确性，提升用户体验感。

基于上述任一实施例，业务执行单元730具体用于：

基于上述任一实施例，所述第一知识抽取模型基于第一样本需求文本及其对应的第一样本知识，在第一初始模型的基础上训练得到；

基于上述任一实施例，业务执行单元730具体用于：

图8示例了一种一体机的实体结构示意图，如图8所示，该一体机可以包括：处理器(processor)810、通信接口(Communications Interface)820、存储器(memory)830和通信总线840，其中，处理器810，通信接口820，存储器830通过通信总线840完成相互间的通信。存储器830中存储有RPA大模型，以及可在处理器810上运行的计算机程序。处理器810可以调用存储器830中的RPA大模型和计算机程序，以执行机器人流程自动化方法，该方法包括：

获取需求文本；

对所述需求文本进行意图分类，得到意图分类结果；

此外，上述的存储器830中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

另一方面，本发明还提供一种计算机程序产品，所述计算机程序产品包括计算机程序和/或RPA大模型，计算机程序可存储在非暂态计算机可读存储介质上，所述计算机程序被处理器执行时，计算机能够执行上述各方法所提供的机器人流程自动化方法，和/或调用RPA大模型以执行上述各方法所提供的机器人流程自动化方法，该方法包括：

获取需求文本；

对所述需求文本进行意图分类，得到意图分类结果；

可以理解的是，用户可以通过模型提供商下载计算机程序产品进行安装或者更新，例如可以从云端服务器下载上述计算机程序产品并安装，从而能够在本地终端执行上述机器人流程自动化方法，以获取RPA大模型所提供的服务。

又一方面，本发明还提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现以执行上述各方法提供的机器人流程自动化方法，该方法包括：

获取需求文本；

对所述需求文本进行意图分类，得到意图分类结果；

以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下，即可以理解并实施。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种机器人流程自动化方法，其特征在于，包括：

获取需求文本；

对所述需求文本进行意图分类，得到意图分类结果；

2.根据权利要求1所述的机器人流程自动化方法，其特征在于，所述基于机器人流程自动化RPA大模型，执行所述需求文本对应的业务，包括：

3.根据权利要求2所述的机器人流程自动化方法，其特征在于，所述基于所述需求文本与知识库的各知识之间的语义相似度，从所述各知识中抽取与所述需求文本相关的关联知识，包括：

4.根据权利要求3所述的机器人流程自动化方法，其特征在于，所述第一知识抽取模型基于第一样本需求文本及其对应的第一样本知识，在第一初始模型的基础上训练得到；

5.根据权利要求1至4中任一项所述的机器人流程自动化方法，其特征在于，所述基于机器人流程自动化RPA大模型，执行所述需求文本对应的业务，包括：

6.根据权利要求5所述的机器人流程自动化方法，其特征在于，所述基于知识匹配结果与代码生成方式之间的映射关系，生成所述业务流程的RPA流程代码，包括：

7.根据权利要求5所述的机器人流程自动化方法，其特征在于，所述基于知识匹配结果与代码生成方式之间的映射关系，生成所述业务流程的RPA流程代码，包括：

8.一种机器人流程自动化装置，其特征在于，包括：

文本获取单元，用于获取需求文本；

9.一种一体机，其特征在于，包括存储器、处理器，以及存储在所述存储器上的RPA大模型和存储在所述存储器上并在所述处理器上运行的计算机程序；

所述处理器执行所述计算机程序时，调用所述RPA大模型以实现如权利要求1至7任一项所述机器人流程自动化方法。

10.一种非暂态计算机可读存储介质，其特征在于，其上存储有计算机程序和/或RPA大模型；

所述计算机程序被处理器执行以调用所述RPA大模型实现如权利要求1至7任一项所述机器人流程自动化方法。