CN117592622A

CN117592622A - 一种面向机器人流程自动化的行为序列预测方法及系统

Info

Publication number: CN117592622A
Application number: CN202410079202.3A
Authority: CN
Inventors: 张晖; 杨青松; 杨春明; 李波; 龙呤
Original assignee: Southwest University Of Science And Technology Sichuan Tianfu New Area Innovation Research Institute; Southwest University of Science and Technology
Current assignee: Southwest University Of Science And Technology Sichuan Tianfu New Area Innovation Research Institute; Southwest University of Science and Technology
Priority date: 2024-01-19
Filing date: 2024-01-19
Publication date: 2024-02-23
Anticipated expiration: 2044-01-19
Also published as: CN117592622B

Abstract

本发明公开了一种面向机器人流程自动化的行为序列预测方法及系统，方法包括：采集机器人流程自动化的行为序列数据；利用滑动窗口算法将行为序列数据划分为若干重叠的行为窗口；根据行为序列数据的特征类型划分任务并构建多任务网络模型；对采集的数据进行处理并转换为事务型数据，利用频繁项集挖掘算法从事务型数据中挖掘有效的强关联规则；实时记录用户当前的行为序列，并利用多任务网络模型滚动预测用户后续的行为序列数据；对预测的行为序列数据进行独热解码，基于有效的强关联规则集对预测的行为序列数据进行后处理。通过本发明提高了业务流程的自动化程度，降低业务流程的人工干预，提升业务流程的执行效果。

Description

一种面向机器人流程自动化的行为序列预测方法及系统

技术领域

本发明属于人工智能及自动化技术领域，尤其涉及一种面向机器人流程自动化的行为序列预测方法及系统。

背景技术

信息技术的快速发展，推动了人类进入信息化时代，计算机应用程序在各个行业中发挥着重要的作用。随着信息服务的需求量急剧上升，计算机应用程序的规模、类型和功能也不断增加。但在提供信息服务的过程中，往往会出现一些简单、重复的流程，使用户操作应用程序时多了繁琐的步骤，造成人力、时间的浪费。传统流程作业需要员工频繁地进行计算机应用程序的启闭、数据的读取输入等操作，降低了工作效率，提高了出错率。

机器人流程自动化（Robotic Process Automation，RPA）是一种根据预设的流程步骤对业务进行自动化操作的软件。随着计算机应用程序的普及，RPA技术给传统流程作业带来了新机遇，很多企业引进RPA技术改善生产流程，提升工作效率，降低作业错误率，节省人力物力。

但现有RPA技术的使用中，存在两个问题：（1）每项业务流程都需要设计专属的软件机器人，这不仅增加了RPA技术的应用成本，也限制了RPA技术的应用范围；（2）RPA技术本来是面向非计算机领域的人员，但现有的RPA软件仍要求使用者具备一定的代码基础，这增加了RPA技术的使用难度，也降低了RPA技术的使用效率。这两个问题是目前RPA技术普及度不高的主要原因，因此需要一种面向机器人流程自动化的行为序列预测方法及系统来解决这两个问题。

发明内容

本发明的目的在于：为了克服现有技术问题，公开了一种面向机器人流程自动化的行为序列预测方法及系统，本发明面向机器人流程自动化的行为序列预测方法及系统，利用用户当前的行为序列数据预测后续行为，实现机器人流程自动化，从而提高业务流程的自动化程度，降低业务流程的人工干预，提升业务流程的执行效果。解决了目前每项业务流程都需要制定专属的软件机器人以及RPA软件仍要求使用者有一定的代码基础的问题。

本发明目的通过下述技术方案来实现：

一种面向机器人流程自动化的行为序列预测方法，所述行为序列预测方法包括如下步骤：

S1：通过鼠标键盘监听系统，采集机器人流程自动化的行为序列数据，为训练网络模型和挖掘关联规则提供数据支撑；

S2：对采集的数据进行预处理，利用滑动窗口算法将行为序列数据划分为若干重叠的行为窗口，每个行为窗口包含一组连续的行为；

S3：根据行为序列数据的特征类型划分任务并构建多任务网络模型，将每个行为窗口包含的一组连续行为作为输入特征，当前行为窗口的下一行为作为目标值，训练多任务网络模型；

S4：对采集的数据进行处理并转换为事务型数据，利用频繁项集挖掘算法从事务型数据中挖掘有效的强关联规则；

S5：实时记录用户当前的行为序列，并利用多任务网络模型滚动预测用户后续的行为序列数据；

S6：对预测的行为序列数据进行独热解码，基于有效的强关联规则集对预测的行为序列数据进行后处理。

根据一个优选的实施方式，步骤S1具体包括：通过鼠标键盘监听系统，采集若干个连续行为组成机器人流程自动化的行为序列数据，每个行为包含离散型特征和连续型特征。

根据一个优选的实施方式，步骤S2包括：

S21：根据数据的特征类型，对采集的行为序列数据选择不同的预处理方式，对离散型特征进行独热编码，对连续型特征进行归一化处理；

S22：根据窗口大小和滑动大小，用滑动窗口算法将行为序列数据划分为若干重叠的行为窗口，每个行为窗口包含一组连续的行为。

根据一个优选的实施方式，步骤S3包括：

S31：构建由一个输入层、若干个共享隐藏层、若干个输出层组成的多任务网络模型；

S32：输入层接收行为窗口的一组连续行为作为输入特征；

S33：共享隐藏层由深度学习算法组成，神经元个数和共享隐藏层个数由网格搜索优化；

S34：输出层由全连接层组成，分类任务的输出层个数由离散型特征的数量决定，神经元个数由离散型特征的类别数决定，激活函数为Softmax；回归任务的输出层个数为一个，神经元个数为由连续型特征的数量决定，激活函数为ReLU。

S35：将每个行为窗口包含的一组连续行为作为输入特征，当前行为窗口的下一行为作为目标值，训练多任务网络模型。

根据一个优选的实施方式，步骤S4包括：

S41：对采集的行为序列数据中的连续型特征做归一化处理，将行为序列数据转换为事务型数据；

S42：利用频繁项集挖掘算法，从事务型数据中挖掘出频繁项集，生成关联规则，筛选出有效的强关联规则，即满足最小支持度、最小置信度并且提升度大于1的关联规则，组成有效的强关联规则集。

根据一个优选的实施方式，步骤S5中，通过鼠标键盘监听系统实时记录用户当前的行为序列数据，且行为序列长度不小于窗口大小；所述滚动预测是指：完成预测当前行为窗口的下一行为后，把该行为加入当前行为窗口作为最晚行为，并移除行为窗口中的最早行为，再预测行为窗口的下一行为，如此循环，直到预测的行为序列长度满足要求。

根据一个优选的实施方式，步骤S6包括：

S61：对预测的行为序列数据进行独热解码，还原为原始行为序列的数据格式；

S62：按照置信度从大到小将有效的强关联规则集进行排序，基于有效的强关联规则集对所预测行为序列中的每个行为依次进行后处理，实现机器人流程自动化的行为序列预测。

另一方面，本发明还公开了：

一种面向机器人流程自动化的行为序列预测系统，所述行为序列预测系统采用前述的行为序列预测方法实施；

所述行为序列预测系统包括：数据采集模块、行为窗口划分模块、模型训练模块、事务型数据转换模块、关联规则挖掘模块、行为序列预测模块、后处理模块；

其中，所述数据采集模块，用于采集机器人流程自动化的行为序列数据；

所述行为窗口划分模块，利用滑动窗口算法将行为序列数据划分为若干重叠的行为窗口，每个行为窗口包含一组连续的行为；

所述模型训练模块，用于根据行为序列数据的特征类型划分任务并构建多任务网络模型，将每个行为窗口包含的一组连续行为作为输入特征，当前行为窗口的下一行为作为目标值，训练多任务网络模型；

所述事务型数据转换模块，用于对采集的行为序列数据中的连续型特征做归一化处理，将行为序列数据转换为事务型数据；

所述关联规则挖掘模块，用于利用频繁项集挖掘算法，从事务型数据中挖掘出频繁项集，生成关联规则，筛选出有效的强关联规则集；

所述行为序列预测模块，用于实时记录用户当前的行为序列，并利用多任务网络模型滚动预测用户后续的行为序列数据；

所述后处理模块，用于对预测的行为序列数据进行独热解码，基于有效的强关联规则集对预测的行为序列数据做后处理。

根据一个优选的实施方式，所述行为窗口划分模块被配置为：根据数据的特征类型，对采集的行为序列数据选择不同的预处理方式，对离散型特征进行独热编码，对连续型特征进行归一化处理，再根据窗口大小和滑动大小，用滑动窗口算法将行为序列数据划分为若干重叠的行为窗口，每个行为窗口包含一组连续的行为。

根据一个优选的实施方式，所述行为序列预测模块，用于通过鼠标键盘监听系统实时记录用户当前的行为序列数据，要求行为序列长度不小于窗口大小。

前述本发明主方案及其各进一步选择方案可以自由组合以形成多个方案，均为本发明可采用并要求保护的方案。本领域技术人员在了解本发明方案后根据现有技术和公知常识可明了有多种组合，均为本发明所要保护的技术方案，在此不做穷举。

本发明的有益效果：

本发明提出了基于深度学习与关联规则的融合算法，用于预测机器人流程自动化（RPA）的行为序列数据。该算法首先利用深度学习模型对行为序列数据进行建模和预测，然后利用关联规则分析器对行为序列数据的特征值之间的关联性进行挖掘和评估，最后将两者的结果进行融合，得到最终的预测值。该算法能够有效地处理行为序列数据的非线性、多变量、多任务等复杂特点，同时能够利用关联规则发现行为序列数据中的潜在规律，从而提高RPA行为序列预测的准确度和鲁棒性。

本发明不同于传统的RPA软件需要技术员设计RPA业务流程的方式；而是利用神经网络模型实现机器人流程自动化，这使得用户无需具备编程能力仍可实现RPA业务流程的构建，同时进一步推动了RPA业务流程无需依赖专属的软件机器人。该模型可以根据用户当前的行为序列数据预测后续行为，从而自动化地执行业务流程，减少人工干预，提高工作效率。

附图说明

图1是本发明面向机器人流程自动化的行为序列预测方法的流程示意图；

图2是本发明BiLSTM的网络结构图；

图3是本发明面向机器人流程自动化的行为序列预测系统的结构图。

具体实施方式

以下通过特定的具体实例说明本发明的实施方式，本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用，本说明书中的各项细节也可以基于不同观点与应用，在没有背离本发明的精神下进行各种修饰或改变。需说明的是，在不冲突的情况下，以下实施例及实施例中的特征可以相互组合。

应注意到：相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步定义和解释。另外，本发明要指出的是，本发明中，如未特别写出具体涉及的结构、连接关系、位置关系、动力来源关系等，则本发明涉及的结构、连接关系、位置关系、动力来源关系等均为本领域技术人员在现有技术的基础上，可以不经过创造性劳动可以得知的。

实施例1

参考图1所示，本实施例公开了一种一种面向机器人流程自动化的行为序列预测方法，具体步骤如下：

S1、通过鼠标键盘监听系统，采集机器人流程自动化的行为序列数据，为训练网络模型和挖掘关联规则提供数据支撑。

S1具体包括以下步骤：

S1.1、通过鼠标键盘监听系统，采集了1000个连续行为，组成机器人流程自动化的行为序列数据。每个行为包含7个特征，表示为向量，其中包含5个离散型特征，2个连续型特征，表1展示了机器人流程自动化的部分行为序列数据；

其中为指令类别(label)，/>为滚轮的单次滚动值(dy)，/>为鼠标的按键键位(mouse_type)，/>为键盘的特殊按键值(special_key)，/>为键盘的常规按键值(general_key)，/>为屏幕中X轴坐标值(X)，/>为屏幕中Y轴坐标值(Y)。离散型特征为，连续型特征为/>。

表1机器人流程自动化的行为序列数据

S2、对采集的数据进行预处理，利用滑动窗口算法将行为序列数据划分为若干重叠的行为窗口，每个行为窗口包含一组连续的行为。

S2具体包括以下步骤：

S2.1、根据数据的特征类型，对采集的行为序列数据选择不同的预处理方式，对离散型特征进行独热编码，对连续型特征进行归一化处理；

离散型特征存在t种特征值，其各特征值的独热编码的如下：

其中独热编码的向量维数等于特征值的种类数，即都是t维向量。

以为例，离散型特征/>有4种特征值，分别是：None、Button.left、Button.middle、Button.right，各特征值的独热编码如下：/>、

行为序列数据T包含1000个行为，每个行为包含2个连续型特征，其归一化处理的公式如下：

式中表示第i个行为的第j个连续型特征的特征值，/>表示第j个连续型特征的所有特征值集合。

S2.2、根据窗口大小和滑动大小，用滑动窗口算法将行为序列数据划分为若干重叠的行为窗口，每个行为窗口包含一组连续的行为。

窗口大小为50、滑动大小为1，利用滑动窗口算法处理行为序列数据得到的行为窗口观测值如下：

式中表示第/>个行为窗口的一组连续行为，/>表示各个行为窗口集合。/>表示第/>个行为窗口的下一行为，/>表示各个行为窗口的下一行为集合。

S3、根据行为序列数据的特征类型划分任务并构建多任务网络模型，将每个行为窗口包含的一组连续行为作为输入特征，当前行为窗口的下一行为作为目标值，训练多任务网络模型。

S3具体包括以下步骤：

S3.1、构建由一个输入层、三个共享隐藏层、六个输出层组成的多任务网络模型；

S3.2、输入层以形状为（50，67）的二维张量为输入特征，这个张量代表行为窗口内的观测值；

S3.3、网络模型有三个共享隐藏层，每个隐藏层为一个BiLSTM-Dropout单元堆，BiLSTM 层含400个神经元，Dropout 层丢失率为 0.2，BiLSTM的网络结构如图2所示；

S3.4、输出层由全连接层组成，分类任务的输出层个数由离散型特征的数量决定，即分类任务的输出层有五个，神经元个数由离散型特征的类别数决定，激活函数为Softmax；回归任务的输出层个数为一个，神经元个数为2，激活函数为ReLU。

Softmax和ReLU的计算公式如下：

式中表示第i个节点的输出值，C为输出节点个数，即分类的总类别数。

S3.5、将每个行为窗口包含的一组连续行为作为输入特征，当前行为窗口的下一行为作为目标值，训练多任务网络模型。

S4、对采集的数据进行预处理并转换为事务型数据，利用频繁项集挖掘算法从事务型数据中挖掘有效的强关联规则；

S4具体包括以下步骤：

S4.1、对采集的行为序列数据中的连续型特征做归一化处理，将行为序列数据转换为事务型数据，即将各个特征的特征值修改为“特征_特征值”的形式，如将特征special_key的特征值Key.cmd修改为“special_key_Key.cmd”；

S4.2、利用FP-growth算法挖掘事务型数据中的频繁项集，生成关联规则，筛选出有效的强关联规则，即满足最小支持度、最小置信度并且提升度大于1的关联规则，组成有效的强关联规则集。

其中表示前件，/>表示后件，/>表示有效的强关联规则集的数量，前件和后件都是事务型数据，即都是“特征_特征值”的形式。

关于项集{A,B}的支持度、置信度、提升度的计算公式如下：

式中I表示全体项集，函数表示项集的数量。

S5、实时记录用户当前的行为序列并利用多任务网络模型滚动预测用户后续的行为序列数据。

S5具体包括以下步骤：

S5.1、通过鼠标键盘监听系统实时记录用户当前的行为序列数据，要求行为序列长度不小于50；

S5.2、通过多任务网络模型滚动预测用户后续的行为序列数据。

对于所监听的行为序列数据的滚动预测公式如下：

式中表示监听的行为序列数据长度，窗口大小为50，/>，p表示要求预测的行为序列长度，/>表示第i次滚动预测的输入特征，/>表示第i次滚动预测的目标值，即滚动预测出后续的第i个行为。

S6、对预测的行为序列数据进行独热解码，基于有效的强关联规则集对预测的行为序列数据进行后处理。

S6具体包括以下步骤：

S6.1、对预测的行为序列数据进行独热解码，还原为原始行为序列的数据格式；

S6.2、按照置信度从大到小将有效的强关联规则集进行排序，基于有效的强关联规则集对所预测行为序列中的每个行为依次进行后处理，实现机器人流程自动化的行为序列预测。

对预测的行为序列数据的后处理过程具体为：

(1)按顺序从行为序列数据中选择一个行为进行后处理。

(2)按顺序从有效的强关联规则集中选择一个关联规则，将关联规则的前件与行为对应特征的特征值进行匹配，其中/>表示前件，/>表示后件，/>表示有效的强关联规则集的数量，前件和后件都是事务型数据，即都是“特征_特征值”的形式；如果遍历完有效的强关联规则集，则返回步骤(1)，继续选择下一行为进行后处理。

(3) 前件和后件按照其内容的最后一个“_”拆分为特征和特征值；如果前件与被选择行为对应特征的特征值相同，则匹配成功，将按照后件的内容修改被选择行为对应特征的特征值；例如，选择的关联规则为,选择的行为为(310,None,Botton.left,Key.cmd,None,None,None)，此时前件为，而行为的/>特征的特征值为Key.cmd，因此匹配成功，按照后件的内容修改对应特征的特征值，后件为/>，因此将行为的/>特征的特征值修改为None，即经后处理后，该行为被预测为(310,None,None,Key.cmd,None,None,None)；如果该行为的所有特征都被匹配成功或被修改过，则进入步骤(4)，否则返回步骤(2)，继续选择下一关联规则。

(4)如果所有的行为都后处理完毕，则实现机器人流程自动化的行为序列预测；否则，返回步骤(1)，继续选择下一行为进行后处理。

实施例2

如图3所示，在实施例1的基础上，本实施例提供了一种面向机器人流程自动化的行为序列预测系统，所述行为序列预测系统按照实施例1所述的行为序列预测方法实施。

行为序列预测系统包括数据采集模块、行为窗口划分模块、模型训练模块、事务型数据转换模块、关联规则挖掘模块、行为序列预测模块、后处理模块。

其中，数据采集模块，用于通过鼠标键盘监听系统，采集机器人流程自动化的行为序列数据，为训练网络模型和挖掘关联规则提供数据支撑。

行为窗口划分模块，用于根据数据的特征类型，对采集的行为序列数据选择不同的预处理方式，对离散型特征进行独热编码，对连续型特征进行归一化处理，再根据窗口大小和滑动大小，用滑动窗口算法将行为序列数据划分为若干重叠的行为窗口，每个行为窗口包含一组连续的行为。

模型训练模块，用于根据行为序列数据的特征类型划分任务并构建多BiLSTM任务网络模型，将每个行为窗口包含的一组连续行为作为输入特征，当前行为窗口的下一行为作为目标值，训练多任务网络模型。

事务型数据转换模块，用于对采集的行为序列数据中的连续型特征做归一化处理，将行为序列数据转换为事务型数据。

关联规则挖掘模块，用于利用FP-growth算法，从事务型数据中挖掘出频繁项集，生成关联规则，筛选出有效的强关联规则集。

行为序列预测模块，用于通过鼠标键盘监听系统实时记录用户当前的行为序列数据，要求行为序列长度不小于窗口大小，再通过BiLSTM多任务网络模型滚动预测用户后续行为的行为序列数据。

后处理模块，用于对预测的行为序列数据进行独热解码，还原为原始行为序列的数据格式，基于有效的强关联规则集对预测的行为序列数据做后处理。

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明的保护范围之内。

Claims

1.一种面向机器人流程自动化的行为序列预测方法，其特征在于，所述行为序列预测方法包括如下步骤：

2.如权利要求1所述的行为序列预测方法，其特征在于，步骤S1具体包括：通过鼠标键盘监听系统，采集若干个连续行为组成机器人流程自动化的行为序列数据，每个行为包含离散型特征和连续型特征。

3.如权利要求2所述的行为序列预测方法，其特征在于，步骤S2包括：

4.如权利要求3所述的行为序列预测方法，其特征在于，步骤S3包括：

S32：输入层接收行为窗口的一组连续行为作为输入特征；

S34：输出层由全连接层组成，分类任务的输出层个数由离散型特征的数量决定，神经元个数由离散型特征的类别数决定，激活函数为Softmax；回归任务的输出层个数为一个，神经元个数为由连续型特征的数量决定，激活函数为ReLU；

5.如权利要求1所述的行为序列预测方法，其特征在于，步骤S4包括：

6.如权利要求1所述的行为序列预测方法，其特征在于，步骤S5中，通过鼠标键盘监听系统实时记录用户当前的行为序列数据，且行为序列长度不小于窗口大小；

所述滚动预测是指：完成预测当前行为窗口的下一行为后，把该行为加入当前行为窗口作为最晚行为，并移除行为窗口中的最早行为，再预测行为窗口的下一行为，如此循环，直到预测的行为序列长度满足要求。

7.如权利要求1所述的行为序列预测方法，其特征在于，步骤S6包括：

8.一种面向机器人流程自动化的行为序列预测系统，其特征在于，所述行为序列预测系统采用如权利要求1至7任一项所述的行为序列预测方法实施；

9.如权利要求8所述的行为序列预测系统，其特征在于，所述行为窗口划分模块被配置为：根据数据的特征类型，对采集的行为序列数据选择不同的预处理方式，对离散型特征进行独热编码，对连续型特征进行归一化处理，再根据窗口大小和滑动大小，用滑动窗口算法将行为序列数据划分为若干重叠的行为窗口，每个行为窗口包含一组连续的行为。

10.如权利要求8所述的行为序列预测系统，其特征在于，所述行为序列预测模块，用于通过鼠标键盘监听系统实时记录用户当前的行为序列数据，要求行为序列长度不小于窗口大小。