CN117592622A - 一种面向机器人流程自动化的行为序列预测方法及系统 - Google Patents
一种面向机器人流程自动化的行为序列预测方法及系统 Download PDFInfo
- Publication number
- CN117592622A CN117592622A CN202410079202.3A CN202410079202A CN117592622A CN 117592622 A CN117592622 A CN 117592622A CN 202410079202 A CN202410079202 A CN 202410079202A CN 117592622 A CN117592622 A CN 117592622A
- Authority
- CN
- China
- Prior art keywords
- behavior
- behavior sequence
- data
- window
- sequence data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 38
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 28
- 238000005065 mining Methods 0.000 claims abstract description 25
- 238000012805 post-processing Methods 0.000 claims abstract description 20
- 238000004801 process automation Methods 0.000 claims abstract description 16
- 238000012545 processing Methods 0.000 claims abstract description 14
- 238000005096 rolling process Methods 0.000 claims abstract description 11
- 230000006399 behavior Effects 0.000 claims description 276
- 238000012549 training Methods 0.000 claims description 19
- 238000012544 monitoring process Methods 0.000 claims description 11
- 238000010606 normalization Methods 0.000 claims description 11
- 238000007781 pre-processing Methods 0.000 claims description 10
- 210000002569 neuron Anatomy 0.000 claims description 9
- 230000006870 function Effects 0.000 claims description 7
- 238000000197 pyrolysis Methods 0.000 claims description 7
- 230000004913 activation Effects 0.000 claims description 6
- 238000006243 chemical reaction Methods 0.000 claims description 6
- 238000012216 screening Methods 0.000 claims description 6
- 230000003542 behavioural effect Effects 0.000 claims description 5
- 238000013135 deep learning Methods 0.000 claims description 3
- 238000012163 sequencing technique Methods 0.000 claims description 2
- 238000000638 solvent extraction Methods 0.000 claims description 2
- 230000008569 process Effects 0.000 abstract description 13
- 230000000694 effects Effects 0.000 abstract description 2
- 238000005516 engineering process Methods 0.000 description 10
- 230000009471 action Effects 0.000 description 5
- 238000004883 computer application Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 239000013598 vector Substances 0.000 description 3
- 238000013461 design Methods 0.000 description 2
- 241000282414 Homo sapiens Species 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 210000004027 cell Anatomy 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000011112 process operation Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/26—Discovering frequent patterns
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
- G06N5/022—Knowledge engineering; Knowledge acquisition
- G06N5/025—Extracting rules from data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Economics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- General Business, Economics & Management (AREA)
- Quality & Reliability (AREA)
- Marketing (AREA)
- Life Sciences & Earth Sciences (AREA)
- Operations Research (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Tourism & Hospitality (AREA)
- Evolutionary Biology (AREA)
- Game Theory and Decision Science (AREA)
- Development Economics (AREA)
- Computational Linguistics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种面向机器人流程自动化的行为序列预测方法及系统,方法包括:采集机器人流程自动化的行为序列数据;利用滑动窗口算法将行为序列数据划分为若干重叠的行为窗口;根据行为序列数据的特征类型划分任务并构建多任务网络模型;对采集的数据进行处理并转换为事务型数据,利用频繁项集挖掘算法从事务型数据中挖掘有效的强关联规则;实时记录用户当前的行为序列,并利用多任务网络模型滚动预测用户后续的行为序列数据;对预测的行为序列数据进行独热解码,基于有效的强关联规则集对预测的行为序列数据进行后处理。通过本发明提高了业务流程的自动化程度,降低业务流程的人工干预,提升业务流程的执行效果。
Description
技术领域
本发明属于人工智能及自动化技术领域,尤其涉及一种面向机器人流程自动化的行为序列预测方法及系统。
背景技术
信息技术的快速发展,推动了人类进入信息化时代,计算机应用程序在各个行业中发挥着重要的作用。随着信息服务的需求量急剧上升,计算机应用程序的规模、类型和功能也不断增加。但在提供信息服务的过程中,往往会出现一些简单、重复的流程,使用户操作应用程序时多了繁琐的步骤,造成人力、时间的浪费。传统流程作业需要员工频繁地进行计算机应用程序的启闭、数据的读取输入等操作,降低了工作效率,提高了出错率。
机器人流程自动化(Robotic Process Automation,RPA)是一种根据预设的流程步骤对业务进行自动化操作的软件。随着计算机应用程序的普及,RPA技术给传统流程作业带来了新机遇,很多企业引进RPA技术改善生产流程,提升工作效率,降低作业错误率,节省人力物力。
但现有RPA技术的使用中,存在两个问题:(1)每项业务流程都需要设计专属的软件机器人,这不仅增加了RPA技术的应用成本,也限制了RPA技术的应用范围;(2)RPA技术本来是面向非计算机领域的人员,但现有的RPA软件仍要求使用者具备一定的代码基础,这增加了RPA技术的使用难度,也降低了RPA技术的使用效率。这两个问题是目前RPA技术普及度不高的主要原因,因此需要一种面向机器人流程自动化的行为序列预测方法及系统来解决这两个问题。
发明内容
本发明的目的在于:为了克服现有技术问题,公开了一种面向机器人流程自动化的行为序列预测方法及系统,本发明面向机器人流程自动化的行为序列预测方法及系统,利用用户当前的行为序列数据预测后续行为,实现机器人流程自动化,从而提高业务流程的自动化程度,降低业务流程的人工干预,提升业务流程的执行效果。解决了目前每项业务流程都需要制定专属的软件机器人以及RPA软件仍要求使用者有一定的代码基础的问题。
本发明目的通过下述技术方案来实现:
一种面向机器人流程自动化的行为序列预测方法,所述行为序列预测方法包括如下步骤:
S1:通过鼠标键盘监听系统,采集机器人流程自动化的行为序列数据,为训练网络模型和挖掘关联规则提供数据支撑;
S2:对采集的数据进行预处理,利用滑动窗口算法将行为序列数据划分为若干重叠的行为窗口,每个行为窗口包含一组连续的行为;
S3:根据行为序列数据的特征类型划分任务并构建多任务网络模型,将每个行为窗口包含的一组连续行为作为输入特征,当前行为窗口的下一行为作为目标值,训练多任务网络模型;
S4:对采集的数据进行处理并转换为事务型数据,利用频繁项集挖掘算法从事务型数据中挖掘有效的强关联规则;
S5:实时记录用户当前的行为序列,并利用多任务网络模型滚动预测用户后续的行为序列数据;
S6:对预测的行为序列数据进行独热解码,基于有效的强关联规则集对预测的行为序列数据进行后处理。
根据一个优选的实施方式,步骤S1具体包括:通过鼠标键盘监听系统,采集若干个连续行为组成机器人流程自动化的行为序列数据,每个行为包含离散型特征和连续型特征。
根据一个优选的实施方式,步骤S2包括:
S21:根据数据的特征类型,对采集的行为序列数据选择不同的预处理方式,对离散型特征进行独热编码,对连续型特征进行归一化处理;
S22:根据窗口大小和滑动大小,用滑动窗口算法将行为序列数据划分为若干重叠的行为窗口,每个行为窗口包含一组连续的行为。
根据一个优选的实施方式,步骤S3包括:
S31:构建由一个输入层、若干个共享隐藏层、若干个输出层组成的多任务网络模型;
S32:输入层接收行为窗口的一组连续行为作为输入特征;
S33:共享隐藏层由深度学习算法组成,神经元个数和共享隐藏层个数由网格搜索优化;
S34:输出层由全连接层组成,分类任务的输出层个数由离散型特征的数量决定,神经元个数由离散型特征的类别数决定,激活函数为Softmax;回归任务的输出层个数为一个,神经元个数为由连续型特征的数量决定,激活函数为ReLU。
S35:将每个行为窗口包含的一组连续行为作为输入特征,当前行为窗口的下一行为作为目标值,训练多任务网络模型。
根据一个优选的实施方式,步骤S4包括:
S41:对采集的行为序列数据中的连续型特征做归一化处理,将行为序列数据转换为事务型数据;
S42:利用频繁项集挖掘算法,从事务型数据中挖掘出频繁项集,生成关联规则,筛选出有效的强关联规则,即满足最小支持度、最小置信度并且提升度大于1的关联规则,组成有效的强关联规则集。
根据一个优选的实施方式,步骤S5中,通过鼠标键盘监听系统实时记录用户当前的行为序列数据,且行为序列长度不小于窗口大小;所述滚动预测是指:完成预测当前行为窗口的下一行为后,把该行为加入当前行为窗口作为最晚行为,并移除行为窗口中的最早行为,再预测行为窗口的下一行为,如此循环,直到预测的行为序列长度满足要求。
根据一个优选的实施方式,步骤S6包括:
S61:对预测的行为序列数据进行独热解码,还原为原始行为序列的数据格式;
S62:按照置信度从大到小将有效的强关联规则集进行排序,基于有效的强关联规则集对所预测行为序列中的每个行为依次进行后处理,实现机器人流程自动化的行为序列预测。
另一方面,本发明还公开了:
一种面向机器人流程自动化的行为序列预测系统,所述行为序列预测系统采用前述的行为序列预测方法实施;
所述行为序列预测系统包括:数据采集模块、行为窗口划分模块、模型训练模块、事务型数据转换模块、关联规则挖掘模块、行为序列预测模块、后处理模块;
其中,所述数据采集模块,用于采集机器人流程自动化的行为序列数据;
所述行为窗口划分模块,利用滑动窗口算法将行为序列数据划分为若干重叠的行为窗口,每个行为窗口包含一组连续的行为;
所述模型训练模块,用于根据行为序列数据的特征类型划分任务并构建多任务网络模型,将每个行为窗口包含的一组连续行为作为输入特征,当前行为窗口的下一行为作为目标值,训练多任务网络模型;
所述事务型数据转换模块,用于对采集的行为序列数据中的连续型特征做归一化处理,将行为序列数据转换为事务型数据;
所述关联规则挖掘模块,用于利用频繁项集挖掘算法,从事务型数据中挖掘出频繁项集,生成关联规则,筛选出有效的强关联规则集;
所述行为序列预测模块,用于实时记录用户当前的行为序列,并利用多任务网络模型滚动预测用户后续的行为序列数据;
所述后处理模块,用于对预测的行为序列数据进行独热解码,基于有效的强关联规则集对预测的行为序列数据做后处理。
根据一个优选的实施方式,所述行为窗口划分模块被配置为:根据数据的特征类型,对采集的行为序列数据选择不同的预处理方式,对离散型特征进行独热编码,对连续型特征进行归一化处理,再根据窗口大小和滑动大小,用滑动窗口算法将行为序列数据划分为若干重叠的行为窗口,每个行为窗口包含一组连续的行为。
根据一个优选的实施方式,所述行为序列预测模块,用于通过鼠标键盘监听系统实时记录用户当前的行为序列数据,要求行为序列长度不小于窗口大小。
前述本发明主方案及其各进一步选择方案可以自由组合以形成多个方案,均为本发明可采用并要求保护的方案。本领域技术人员在了解本发明方案后根据现有技术和公知常识可明了有多种组合,均为本发明所要保护的技术方案,在此不做穷举。
本发明的有益效果:
本发明提出了基于深度学习与关联规则的融合算法,用于预测机器人流程自动化(RPA)的行为序列数据。该算法首先利用深度学习模型对行为序列数据进行建模和预测,然后利用关联规则分析器对行为序列数据的特征值之间的关联性进行挖掘和评估,最后将两者的结果进行融合,得到最终的预测值。该算法能够有效地处理行为序列数据的非线性、多变量、多任务等复杂特点,同时能够利用关联规则发现行为序列数据中的潜在规律,从而提高RPA行为序列预测的准确度和鲁棒性。
本发明不同于传统的RPA软件需要技术员设计RPA业务流程的方式;而是利用神经网络模型实现机器人流程自动化,这使得用户无需具备编程能力仍可实现RPA业务流程的构建,同时进一步推动了RPA业务流程无需依赖专属的软件机器人。该模型可以根据用户当前的行为序列数据预测后续行为,从而自动化地执行业务流程,减少人工干预,提高工作效率。
附图说明
图1是本发明面向机器人流程自动化的行为序列预测方法的流程示意图;
图2是本发明BiLSTM的网络结构图;
图3是本发明面向机器人流程自动化的行为序列预测系统的结构图。
具体实施方式
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。另外,本发明要指出的是,本发明中,如未特别写出具体涉及的结构、连接关系、位置关系、动力来源关系等,则本发明涉及的结构、连接关系、位置关系、动力来源关系等均为本领域技术人员在现有技术的基础上,可以不经过创造性劳动可以得知的。
实施例1
参考图1所示,本实施例公开了一种一种面向机器人流程自动化的行为序列预测方法,具体步骤如下:
S1、通过鼠标键盘监听系统,采集机器人流程自动化的行为序列数据,为训练网络模型和挖掘关联规则提供数据支撑。
S1具体包括以下步骤:
S1.1、通过鼠标键盘监听系统,采集了1000个连续行为,组成机器人流程自动化的行为序列数据。每个行为包含7个特征,表示为向量,其中包含5个离散型特征,2个连续型特征,表1展示了机器人流程自动化的部分行为序列数据;
其中为指令类别(label),/>为滚轮的单次滚动值(dy),/>为鼠标的按键键位(mouse_type),/>为键盘的特殊按键值(special_key),/>为键盘的常规按键值(general_key),/>为屏幕中X轴坐标值(X),/>为屏幕中Y轴坐标值(Y)。离散型特征为,连续型特征为/>。
表1机器人流程自动化的行为序列数据
S2、对采集的数据进行预处理,利用滑动窗口算法将行为序列数据划分为若干重叠的行为窗口,每个行为窗口包含一组连续的行为。
S2具体包括以下步骤:
S2.1、根据数据的特征类型,对采集的行为序列数据选择不同的预处理方式,对离散型特征进行独热编码,对连续型特征进行归一化处理;
离散型特征存在t种特征值,其各特征值的独热编码的如下:
其中独热编码的向量维数等于特征值的种类数,即都是t维向量。
以为例,离散型特征/>有4种特征值,分别是:None、Button.left、Button.middle、Button.right,各特征值的独热编码如下:/>、
行为序列数据T包含1000个行为,每个行为包含2个连续型特征,其归一化处理的公式如下:
式中表示第i个行为的第j个连续型特征的特征值,/>表示第j个连续型特征的所有特征值集合。
S2.2、根据窗口大小和滑动大小,用滑动窗口算法将行为序列数据划分为若干重叠的行为窗口,每个行为窗口包含一组连续的行为。
窗口大小为50、滑动大小为1,利用滑动窗口算法处理行为序列数据得到的行为窗口观测值如下:
式中表示第/>个行为窗口的一组连续行为,/>表示各个行为窗口集合。/>表示第/>个行为窗口的下一行为,/>表示各个行为窗口的下一行为集合。
S3、根据行为序列数据的特征类型划分任务并构建多任务网络模型,将每个行为窗口包含的一组连续行为作为输入特征,当前行为窗口的下一行为作为目标值,训练多任务网络模型。
S3具体包括以下步骤:
S3.1、构建由一个输入层、三个共享隐藏层、六个输出层组成的多任务网络模型;
S3.2、输入层以形状为(50,67)的二维张量为输入特征,这个张量代表行为窗口内的观测值;
S3.3、网络模型有三个共享隐藏层,每个隐藏层为一个BiLSTM-Dropout单元堆,BiLSTM 层含400个神经元,Dropout 层丢失率为 0.2,BiLSTM的网络结构如图2所示;
S3.4、输出层由全连接层组成,分类任务的输出层个数由离散型特征的数量决定,即分类任务的输出层有五个,神经元个数由离散型特征的类别数决定,激活函数为Softmax;回归任务的输出层个数为一个,神经元个数为2,激活函数为ReLU。
Softmax和ReLU的计算公式如下:
式中表示第i个节点的输出值,C为输出节点个数,即分类的总类别数。
S3.5、将每个行为窗口包含的一组连续行为作为输入特征,当前行为窗口的下一行为作为目标值,训练多任务网络模型。
S4、对采集的数据进行预处理并转换为事务型数据,利用频繁项集挖掘算法从事务型数据中挖掘有效的强关联规则;
S4具体包括以下步骤:
S4.1、对采集的行为序列数据中的连续型特征做归一化处理,将行为序列数据转换为事务型数据,即将各个特征的特征值修改为“特征_特征值”的形式,如将特征special_key的特征值Key.cmd修改为“special_key_Key.cmd”;
S4.2、利用FP-growth算法挖掘事务型数据中的频繁项集,生成关联规则,筛选出有效的强关联规则,即满足最小支持度、最小置信度并且提升度大于1的关联规则,组成有效的强关联规则集。
其中表示前件,/>表示后件,/>表示有效的强关联规则集的数量,前件和后件都是事务型数据,即都是“特征_特征值”的形式。
关于项集{A,B}的支持度、置信度、提升度的计算公式如下:
式中I表示全体项集,函数表示项集的数量。
S5、实时记录用户当前的行为序列并利用多任务网络模型滚动预测用户后续的行为序列数据。
S5具体包括以下步骤:
S5.1、通过鼠标键盘监听系统实时记录用户当前的行为序列数据,要求行为序列长度不小于50;
S5.2、通过多任务网络模型滚动预测用户后续的行为序列数据。
对于所监听的行为序列数据的滚动预测公式如下:
式中表示监听的行为序列数据长度,窗口大小为50,/>,p表示要求预测的行为序列长度,/>表示第i次滚动预测的输入特征,/>表示第i次滚动预测的目标值,即滚动预测出后续的第i个行为。
S6、对预测的行为序列数据进行独热解码,基于有效的强关联规则集对预测的行为序列数据进行后处理。
S6具体包括以下步骤:
S6.1、对预测的行为序列数据进行独热解码,还原为原始行为序列的数据格式;
S6.2、按照置信度从大到小将有效的强关联规则集进行排序,基于有效的强关联规则集对所预测行为序列中的每个行为依次进行后处理,实现机器人流程自动化的行为序列预测。
对预测的行为序列数据的后处理过程具体为:
(1)按顺序从行为序列数据中选择一个行为进行后处理。
(2)按顺序从有效的强关联规则集中选择一个关联规则,将关联规则的前件与行为对应特征的特征值进行匹配,其中/>表示前件,/>表示后件,/>表示有效的强关联规则集的数量,前件和后件都是事务型数据,即都是“特征_特征值”的形式;如果遍历完有效的强关联规则集,则返回步骤(1),继续选择下一行为进行后处理。
(3) 前件和后件按照其内容的最后一个“_”拆分为特征和特征值;如果前件与被选择行为对应特征的特征值相同,则匹配成功,将按照后件的内容修改被选择行为对应特征的特征值;例如,选择的关联规则为,选择的行为为(310,None,Botton.left,Key.cmd,None,None,None),此时前件为,而行为的/>特征的特征值为Key.cmd,因此匹配成功,按照后件的内容修改对应特征的特征值,后件为/>,因此将行为的/>特征的特征值修改为None,即经后处理后,该行为被预测为(310,None,None,Key.cmd,None,None,None);如果该行为的所有特征都被匹配成功或被修改过,则进入步骤(4),否则返回步骤(2),继续选择下一关联规则。
(4)如果所有的行为都后处理完毕,则实现机器人流程自动化的行为序列预测;否则,返回步骤(1),继续选择下一行为进行后处理。
实施例2
如图3所示,在实施例1的基础上,本实施例提供了一种面向机器人流程自动化的行为序列预测系统,所述行为序列预测系统按照实施例1所述的行为序列预测方法实施。
行为序列预测系统包括数据采集模块、行为窗口划分模块、模型训练模块、事务型数据转换模块、关联规则挖掘模块、行为序列预测模块、后处理模块。
其中,数据采集模块,用于通过鼠标键盘监听系统,采集机器人流程自动化的行为序列数据,为训练网络模型和挖掘关联规则提供数据支撑。
行为窗口划分模块,用于根据数据的特征类型,对采集的行为序列数据选择不同的预处理方式,对离散型特征进行独热编码,对连续型特征进行归一化处理,再根据窗口大小和滑动大小,用滑动窗口算法将行为序列数据划分为若干重叠的行为窗口,每个行为窗口包含一组连续的行为。
模型训练模块,用于根据行为序列数据的特征类型划分任务并构建多BiLSTM任务网络模型,将每个行为窗口包含的一组连续行为作为输入特征,当前行为窗口的下一行为作为目标值,训练多任务网络模型。
事务型数据转换模块,用于对采集的行为序列数据中的连续型特征做归一化处理,将行为序列数据转换为事务型数据。
关联规则挖掘模块,用于利用FP-growth算法,从事务型数据中挖掘出频繁项集,生成关联规则,筛选出有效的强关联规则集。
行为序列预测模块,用于通过鼠标键盘监听系统实时记录用户当前的行为序列数据,要求行为序列长度不小于窗口大小,再通过BiLSTM多任务网络模型滚动预测用户后续行为的行为序列数据。
后处理模块,用于对预测的行为序列数据进行独热解码,还原为原始行为序列的数据格式,基于有效的强关联规则集对预测的行为序列数据做后处理。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种面向机器人流程自动化的行为序列预测方法,其特征在于,所述行为序列预测方法包括如下步骤:
S1:通过鼠标键盘监听系统,采集机器人流程自动化的行为序列数据,为训练网络模型和挖掘关联规则提供数据支撑;
S2:对采集的数据进行预处理,利用滑动窗口算法将行为序列数据划分为若干重叠的行为窗口,每个行为窗口包含一组连续的行为;
S3:根据行为序列数据的特征类型划分任务并构建多任务网络模型,将每个行为窗口包含的一组连续行为作为输入特征,当前行为窗口的下一行为作为目标值,训练多任务网络模型;
S4:对采集的数据进行处理并转换为事务型数据,利用频繁项集挖掘算法从事务型数据中挖掘有效的强关联规则;
S5:实时记录用户当前的行为序列,并利用多任务网络模型滚动预测用户后续的行为序列数据;
S6:对预测的行为序列数据进行独热解码,基于有效的强关联规则集对预测的行为序列数据进行后处理。
2.如权利要求1所述的行为序列预测方法,其特征在于,步骤S1具体包括:通过鼠标键盘监听系统,采集若干个连续行为组成机器人流程自动化的行为序列数据,每个行为包含离散型特征和连续型特征。
3.如权利要求2所述的行为序列预测方法,其特征在于,步骤S2包括:
S21:根据数据的特征类型,对采集的行为序列数据选择不同的预处理方式,对离散型特征进行独热编码,对连续型特征进行归一化处理;
S22:根据窗口大小和滑动大小,用滑动窗口算法将行为序列数据划分为若干重叠的行为窗口,每个行为窗口包含一组连续的行为。
4.如权利要求3所述的行为序列预测方法,其特征在于,步骤S3包括:
S31:构建由一个输入层、若干个共享隐藏层、若干个输出层组成的多任务网络模型;
S32:输入层接收行为窗口的一组连续行为作为输入特征;
S33:共享隐藏层由深度学习算法组成,神经元个数和共享隐藏层个数由网格搜索优化;
S34:输出层由全连接层组成,分类任务的输出层个数由离散型特征的数量决定,神经元个数由离散型特征的类别数决定,激活函数为Softmax;回归任务的输出层个数为一个,神经元个数为由连续型特征的数量决定,激活函数为ReLU;
S35:将每个行为窗口包含的一组连续行为作为输入特征,当前行为窗口的下一行为作为目标值,训练多任务网络模型。
5.如权利要求1所述的行为序列预测方法,其特征在于,步骤S4包括:
S41:对采集的行为序列数据中的连续型特征做归一化处理,将行为序列数据转换为事务型数据;
S42:利用频繁项集挖掘算法,从事务型数据中挖掘出频繁项集,生成关联规则,筛选出有效的强关联规则,即满足最小支持度、最小置信度并且提升度大于1的关联规则,组成有效的强关联规则集。
6.如权利要求1所述的行为序列预测方法,其特征在于,步骤S5中,通过鼠标键盘监听系统实时记录用户当前的行为序列数据,且行为序列长度不小于窗口大小;
所述滚动预测是指:完成预测当前行为窗口的下一行为后,把该行为加入当前行为窗口作为最晚行为,并移除行为窗口中的最早行为,再预测行为窗口的下一行为,如此循环,直到预测的行为序列长度满足要求。
7.如权利要求1所述的行为序列预测方法,其特征在于,步骤S6包括:
S61:对预测的行为序列数据进行独热解码,还原为原始行为序列的数据格式;
S62:按照置信度从大到小将有效的强关联规则集进行排序,基于有效的强关联规则集对所预测行为序列中的每个行为依次进行后处理,实现机器人流程自动化的行为序列预测。
8.一种面向机器人流程自动化的行为序列预测系统,其特征在于,所述行为序列预测系统采用如权利要求1至7任一项所述的行为序列预测方法实施;
所述行为序列预测系统包括:数据采集模块、行为窗口划分模块、模型训练模块、事务型数据转换模块、关联规则挖掘模块、行为序列预测模块、后处理模块;
其中,所述数据采集模块,用于采集机器人流程自动化的行为序列数据;
所述行为窗口划分模块,利用滑动窗口算法将行为序列数据划分为若干重叠的行为窗口,每个行为窗口包含一组连续的行为;
所述模型训练模块,用于根据行为序列数据的特征类型划分任务并构建多任务网络模型,将每个行为窗口包含的一组连续行为作为输入特征,当前行为窗口的下一行为作为目标值,训练多任务网络模型;
所述事务型数据转换模块,用于对采集的行为序列数据中的连续型特征做归一化处理,将行为序列数据转换为事务型数据;
所述关联规则挖掘模块,用于利用频繁项集挖掘算法,从事务型数据中挖掘出频繁项集,生成关联规则,筛选出有效的强关联规则集;
所述行为序列预测模块,用于实时记录用户当前的行为序列,并利用多任务网络模型滚动预测用户后续的行为序列数据;
所述后处理模块,用于对预测的行为序列数据进行独热解码,基于有效的强关联规则集对预测的行为序列数据做后处理。
9.如权利要求8所述的行为序列预测系统,其特征在于,所述行为窗口划分模块被配置为:根据数据的特征类型,对采集的行为序列数据选择不同的预处理方式,对离散型特征进行独热编码,对连续型特征进行归一化处理,再根据窗口大小和滑动大小,用滑动窗口算法将行为序列数据划分为若干重叠的行为窗口,每个行为窗口包含一组连续的行为。
10.如权利要求8所述的行为序列预测系统,其特征在于,所述行为序列预测模块,用于通过鼠标键盘监听系统实时记录用户当前的行为序列数据,要求行为序列长度不小于窗口大小。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410079202.3A CN117592622B (zh) | 2024-01-19 | 2024-01-19 | 一种面向机器人流程自动化的行为序列预测方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410079202.3A CN117592622B (zh) | 2024-01-19 | 2024-01-19 | 一种面向机器人流程自动化的行为序列预测方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117592622A true CN117592622A (zh) | 2024-02-23 |
CN117592622B CN117592622B (zh) | 2024-04-30 |
Family
ID=89918798
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410079202.3A Active CN117592622B (zh) | 2024-01-19 | 2024-01-19 | 一种面向机器人流程自动化的行为序列预测方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117592622B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103676645A (zh) * | 2013-12-11 | 2014-03-26 | 广东电网公司电力科学研究院 | 一种时间序列数据流中的关联规则的挖掘方法 |
US20220414527A1 (en) * | 2021-06-24 | 2022-12-29 | Accenture Global Solutions Limited | System and method for providing automatic guidance in data flow journeys |
CN115953123A (zh) * | 2022-12-19 | 2023-04-11 | 中移信息技术有限公司 | 机器人自动化流程的生成方法、装置、设备及存储介质 |
CN116610814A (zh) * | 2023-05-29 | 2023-08-18 | 西南科技大学 | 一种基于知识图谱的rpa智能驱动方法与系统 |
CN116796043A (zh) * | 2023-08-29 | 2023-09-22 | 山东通维信息工程有限公司 | 一种智能园区数据可视化方法及系统 |
CN117151371A (zh) * | 2023-07-31 | 2023-12-01 | 上海艺赛旗软件股份有限公司 | 一种任务序列生成方法、装置、设备及存储介质 |
CN117236677A (zh) * | 2023-08-07 | 2023-12-15 | 安徽思高智能科技有限公司 | 一种基于事件抽取的rpa流程挖掘方法及装置 |
-
2024
- 2024-01-19 CN CN202410079202.3A patent/CN117592622B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103676645A (zh) * | 2013-12-11 | 2014-03-26 | 广东电网公司电力科学研究院 | 一种时间序列数据流中的关联规则的挖掘方法 |
US20220414527A1 (en) * | 2021-06-24 | 2022-12-29 | Accenture Global Solutions Limited | System and method for providing automatic guidance in data flow journeys |
CN115953123A (zh) * | 2022-12-19 | 2023-04-11 | 中移信息技术有限公司 | 机器人自动化流程的生成方法、装置、设备及存储介质 |
CN116610814A (zh) * | 2023-05-29 | 2023-08-18 | 西南科技大学 | 一种基于知识图谱的rpa智能驱动方法与系统 |
CN117151371A (zh) * | 2023-07-31 | 2023-12-01 | 上海艺赛旗软件股份有限公司 | 一种任务序列生成方法、装置、设备及存储介质 |
CN117236677A (zh) * | 2023-08-07 | 2023-12-15 | 安徽思高智能科技有限公司 | 一种基于事件抽取的rpa流程挖掘方法及装置 |
CN116796043A (zh) * | 2023-08-29 | 2023-09-22 | 山东通维信息工程有限公司 | 一种智能园区数据可视化方法及系统 |
Non-Patent Citations (2)
Title |
---|
秦亮曦, 史忠植: "多时间序列跨事务关联分析研究", 计算机工程与应用, no. 27, 1 March 2007 (2007-03-01), pages 14 - 16 * |
胡立军: "\'IS-RPA\'助力金融业快速实现业务流程自动化", 《金融电子化》, no. 8, 15 August 2018 (2018-08-15), pages 90 * |
Also Published As
Publication number | Publication date |
---|---|
CN117592622B (zh) | 2024-04-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Alsharef et al. | Review of ML and AutoML solutions to forecast time-series data | |
Hassan et al. | A hybrid of multiobjective Evolutionary Algorithm and HMM-Fuzzy model for time series prediction | |
Teng et al. | Customer credit scoring based on HMM/GMDH hybrid model | |
CN112508265A (zh) | 面向业务流程管理的时间与活动多任务预测方法及系统 | |
Stevens et al. | Quantifying explainability in outcome-oriented predictive process monitoring | |
CN110929119A (zh) | 数据标注方法、装置、设备及计算机存储介质 | |
Ribeiro et al. | Shaping graph pattern mining for financial risk | |
CN117236677A (zh) | 一种基于事件抽取的rpa流程挖掘方法及装置 | |
Pushpam et al. | Overview on data mining in social media | |
Shen et al. | An active learning-based incremental deep-broad learning algorithm for unbalanced time series prediction | |
Yamamura et al. | Forecasting new product demand using domain knowledge and machine learning | |
Chivukula et al. | Discovering granger-causal features from deep learning networks | |
Kim et al. | A deep bidirectional similarity learning model using dimensional reduction for multivariate time series clustering | |
CN117592622B (zh) | 一种面向机器人流程自动化的行为序列预测方法及系统 | |
CN114610871B (zh) | 基于人工智能算法的情报系统建模分析方法 | |
Liu et al. | An interval-valued carbon price forecasting method based on web search data and social media sentiment | |
CN111242520B (zh) | 特征合成模型的生成方法、装置及电子设备 | |
CN111242519B (zh) | 用户特征数据生成方法、装置及电子设备 | |
CN115310355A (zh) | 考虑多能耦合的综合能源系统多元负荷预测方法及系统 | |
Hidalgo et al. | Paired k-NN learners with dynamically adjusted number of neighbors for classification of drifting data streams | |
Mohindru et al. | Mining challenges in large-scale IoT data framework–a machine learning perspective | |
Zeng et al. | Prediction of stock price movement using an improved NSGA-II-RF algorithm with a three-stage feature engineering process | |
Wang et al. | A prediction method of consumer buying behavior based on attention mechanism and CNN-BiLSTM | |
Liu et al. | Time-series forecasting based on fuzzy cognitive maps and GRU-autoencoder | |
Chen et al. | Clustering-based cross-sectional regime identification for financial market forecasting |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |