CN116225513B - 一种基于概念漂移的rpa动态流程发现方法及系统 - Google Patents

一种基于概念漂移的rpa动态流程发现方法及系统 Download PDF

Info

Publication number
CN116225513B
CN116225513B CN202310512391.4A CN202310512391A CN116225513B CN 116225513 B CN116225513 B CN 116225513B CN 202310512391 A CN202310512391 A CN 202310512391A CN 116225513 B CN116225513 B CN 116225513B
Authority
CN
China
Prior art keywords
flow
track
sigma
flow model
rpa
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310512391.4A
Other languages
English (en)
Other versions
CN116225513A (zh
Inventor
龚栎鑫
蔡汝坚
郑超
袁水平
张志高
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Anhui Sigao Intelligent Technology Co ltd
Original Assignee
Anhui Sigao Intelligent Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Anhui Sigao Intelligent Technology Co ltd filed Critical Anhui Sigao Intelligent Technology Co ltd
Priority to CN202310512391.4A priority Critical patent/CN116225513B/zh
Publication of CN116225513A publication Critical patent/CN116225513A/zh
Application granted granted Critical
Publication of CN116225513B publication Critical patent/CN116225513B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/70Software maintenance or management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/302Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a software system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3065Monitoring arrangements determined by the means or processing involved in reporting the monitored data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3466Performance evaluation by tracing or monitoring
    • G06F11/3476Data logging
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3466Performance evaluation by tracing or monitoring
    • G06F11/3495Performance evaluation by tracing or monitoring for systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/30Creation or generation of source code
    • G06F8/35Creation or generation of source code model driven
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/60Software deployment
    • G06F8/65Updates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/835Timestamp
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/86Event-based monitoring
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/865Monitoring of software
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/103Workflow collaboration or project management
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Quality & Reliability (AREA)
  • Computing Systems (AREA)
  • Computer Hardware Design (AREA)
  • Mathematical Physics (AREA)
  • Computer Security & Cryptography (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明提供一种基于概念漂移的RPA动态流程发现方法及系统,包括:S1:获取RPA系统当前的流程模型生成的事件日志流Σ,通过事件日志流Σ获得活动轨迹流Σ*;若活动轨迹流Σ*到来下一个活动轨迹则进入步骤S2,否则重复步骤S1;S2:计算获得流程模型M的流程价值V,通过活动轨迹流Σ*获得高频轨迹变体多重集B’Σ*;若高频轨迹变体多重集B’Σ*出现概念漂移则进入步骤S3,否则返回步骤S1;S3:基于流程价值V设置调节参数,通过调节参数对流程模型M进行调节,获得新的流程模型M’,将新的流程模型M’作为当前的流程模型后返回步骤S1。本发明能够发现可随时间变化的RPA业务流程模型的目标,实现RPA业务流程模型的自动化调节。

Description

一种基于概念漂移的RPA动态流程发现方法及系统
技术领域
本发明涉及流程发现与自动化领域,尤其涉及一种基于概念漂移的RPA动态流程发现方法及系统。
背景技术
RPA即Robotic Process Automation(软件流程自动化),在人工智能和自动化技术的基础上,依据预设的流程模型与现有用户系统进行交互,实现业务流程自动化并完成预期任务的技术。
流程发现是流程挖掘领域的核心技术之一,旨在从实际生产活动产生的事件日志中提取业务相关的有效信息,构建流程模型,协助理解业务流程内部的运作情况,从而能够改进组织运作流程,提高组织运作效率,为 RPA流程自动化提供更多有价值的流程信息。
目前的流程发现算法大多都假设业务流程是稳定状态,可以从历史事件日志中发现出一个静态流程模型并适用于未来的业务执行。然而,实际的业务流程通常具有复杂性、可变性和缺乏稳态。由于条件的变化,业务流程可能会演变,业务实时产生的事件日志中的活动轨迹分布可能发生概念漂移。现有的业务流程没有考虑到概念漂移对于业务执行的影响,导致无法及时发现业务流程模型随时间发生的变化,无法满足RPA动态流程的自动化需求。
发明内容
为解决上述技术问题,本发明提供一种基于概念漂移的RPA动态流程发现方法,包括步骤:
S1:获取RPA系统当前的流程模型生成的事件日志流Σ,通过事件日志流Σ获得活动轨迹流Σ*;若活动轨迹流Σ*到来下一个活动轨迹则进入步骤S2,否则重复步骤S1;
S2:计算获得流程模型M的流程价值V,通过活动轨迹流Σ*获得高频轨迹变体多重集B’Σ*;若高频轨迹变体多重集B’Σ*出现概念漂移则进入步骤S3,否则返回步骤S1;
S3:基于流程价值V设置调节参数,通过调节参数对流程模型M进行调节,获得新的流程模型M’,将新的流程模型M’作为当前的流程模型后返回步骤S1。
优选的,步骤S1具体为:
S11:记录RPA系统执行业务时产生的每一个事件e=(c,a,t);
其中,c表示案例,t表示时刻,a表示活动;
S12:将记录的事件按时间先后顺序输出,生成无限的事件日志流Σ=e1,e2,...ek...,其中,k表示事件的编号,ek表示事件日志流中第k个到来的事件;
S13:当在事件日志流Σ中识别到结束活动时,提取与结束活动的案例相同的所有事件形成活动轨迹流Σ*12,...,σi,...;其中,i表示活动轨迹的编号,σi表示活动轨迹流中第i个到来的活动轨迹;
S14:若活动轨迹流Σ*到来下一个活动轨迹
Figure SMS_1
则进入步骤S2,否则重复步骤S1。
优选的,步骤S2具体为:
S21:对ti时刻的流程模型M与活动轨迹流Σ*中ti+1时刻到来的活动轨迹σi+1进行一致性检查,获得一致性检查结果(fitness,precision);其中,i表示活动轨迹的编号;
S22:设置遗忘窗口的大小为w,通过一致性检查结果和遗忘窗口计算获得流程价值V;
S23:对活动轨迹流Σ*进行不同轨迹变体分类,获得多重集BΣ*
S24:对多重集BΣ*进行遗忘修剪,再基于频率进行采样,获得高频轨迹变体多重集B’Σ*
S25:若高频轨迹变体多重集B’Σ*出现概念漂移则进入步骤S3,否则返回步骤S1。
优选的,步骤S21具体为:
S211:使用A*算法,获得ti时刻的流程模型M中从起始节点到终止节点的所有路径的集合ρ(M);
S212:检查活动轨迹σi+1是否为流程模型M中一条从起点到终点的路径,记作φ;若σi+1∈ρ(M)则φ=1,否则φ=0;
S213:计算获得流程模型M对于活动轨迹σi+1的适应度fitness和确度precision,获得一致性检查结果(fitness,precision),其中fitness=φ,precision=φ/|ρ(M)|。
优选的,步骤S22具体为:
获取最近的w个一致性检查结果:
{(fitness1,precision1),(fitness2,precision2),...(fitnessw,precisionw)}
流程价值V的计算公式为:
Figure SMS_2
优选的,步骤S23具体为:
S231:定义不同的活动轨迹为轨迹变体,当且仅当两个活动轨迹对应的活动序列完全相同时,认为它们属于同一种轨迹变体,否则认为这两个活动轨迹属于两种不同的轨迹变体;
S232:多重集BΣ*的表达式为:
Figure SMS_3
其中,σi表示轨迹变体,fi表示σi出现的频数;
S233:每当Σ*中下一个活动轨迹σi+1到来时,若其属于BΣ*中的轨迹变体σi,则将频数fi加一;否则在BΣ*中新增一项(σj,fj),其中σji+1且fj=1。
优选的,步骤S3具体为:
S31:提取高频轨迹变体多重集B’Σ*在ti时刻的最小多重集
Figure SMS_4
S32:基于流程价值V将流程模型M的遗忘窗口的大小设置为w,频率采样率设置为μ,流程发现算法参数设置为P,获得参数调整后的流程模型;
S33:将最小多重集
Figure SMS_5
输入参数调整后的流程模型,获得新的流程模型M’,将新的流程模型M’作为当前的流程模型后返回步骤S1。
一种基于概念漂移的RPA动态流程发现系统,包括:
活动轨迹流获取模块,获取RPA系统当前的流程模型生成的事件日志流Σ,通过事件日志流Σ获得活动轨迹流Σ*;若活动轨迹流Σ*到来下一个活动轨迹则进入概念漂移检测模块,否则返回活动轨迹流获取模块;
概念漂移检测模块,计算获得流程模型M的流程价值V,通过活动轨迹流Σ*获得高频轨迹变体多重集B’Σ*;若高频轨迹变体多重集B’Σ*出现概念漂移则进入流程模型更新模块,否则返回活动轨迹流获取模块;
流程模型更新模块,基于流程价值V设置调节参数,通过调节参数对流程模型M进行调节,获得新的流程模型M’,将新的流程模型M’作为当前的流程模型后返回活动轨迹流获取模块。
一种存储设备,所述存储设备存储指令及数据用于实现所述的基于概念漂移的RPA动态流程发现方法。
一种基于概念漂移的RPA动态流程发现设备,包括:处理器及存储设备;所述处理器加载并执行存储设备中的指令及数据用于实现所述的基于概念漂移的RPA动态流程发现方法。
本发明具有以下有益效果:
本发明提出了一种基于概念漂移的RPA动态流程发现方法,能够收集RPA系统内业务执行过程产生的事件并提取出活动轨迹流,生成轨迹变体多重集,采用遗忘窗口修剪不活跃的轨迹变体,基于频率采样进行概念漂移检测,在检测到活动轨迹分布发生了概念漂移时,动态启动流程发现算法,找到更符合RPA业务实时执行的动态流程模型,并对流程模型进行一致性检查和价值评估,能够发现可随时间变化的RPA业务流程模型的目标,实现RPA业务流程模型的自动化调节。
附图说明
图1为本发明实施例方法流程图;
图2为活动轨迹流的提取示意图;
图3为概念漂移判断示意图;
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
参照图1,本发明提供一种基于概念漂移的RPA动态流程发现方法,包括步骤:
S1:获取RPA系统当前的流程模型生成的事件日志流Σ,通过事件日志流Σ获得活动轨迹流Σ*;若活动轨迹流Σ*到来下一个活动轨迹则进入步骤S2,否则重复步骤S1;
S2:计算获得流程模型M的流程价值V,通过活动轨迹流Σ*获得高频轨迹变体多重集B’Σ*;若高频轨迹变体多重集B’Σ*出现概念漂移则进入步骤S3,否则返回步骤S1;
S3:基于流程价值V设置调节参数,通过调节参数对流程模型M进行调节,获得新的流程模型M’,将新的流程模型M’作为当前的流程模型后返回步骤S1。
进一步的,步骤S1具体为:
S11:记录RPA系统执行业务时产生的每一个事件e=(c,a,t);
其中,c表示案例,t表示时刻,a表示活动;
具体的,c=πcase(e)为事件的案例标识,a=πactivity(e)为执行的活动标识,t=πtime(e)为时间戳,c=πcase(e)、a=πactivity(e)和t=πtime(e)为取值函数,分别表示获取事件e中的c、a和t属性值;
S12:将记录的事件按时间先后顺序输出,生成无限的事件日志流Σ=e1,e2,...ek...,其中,k表示事件的编号,ek表示事件日志流中第k个到来的事件;即πtime(ei)≤πtime(ei+1);
S13:当在事件日志流Σ中识别到结束活动时,提取与结束活动的案例相同的所有事件形成活动轨迹流Σ*12,...,σi,...;其中,i表示活动轨迹的编号,σi表示活动轨迹流中第i个到来的活动轨迹;
具体的,提取活动轨迹流Σ*的方法包括:
定义标识业务案例执行结束的活动集合丄,当事件日志流
Figure SMS_6
中下一个到来事件e的活动类型属于结束活动即πactivity(e)=a∈丄时,从Σ中取出事件e对应案例πcase(e)=c的所有事件,
按时间顺序生成一个已完成案例
Figure SMS_7
,其中,n为已完成案例的事件数量,且满足
Figure SMS_8
对已完成的案例C,提取出案例中每个事件的活动,得到活动轨迹
Figure SMS_9
其中,
Figure SMS_10
将提取出的活动轨迹按案例完成时间即πtime(en)先后顺序输出,生成无限的活动轨迹流Σ*12,...,σi,...;
参考图2,图2中A、B、C、D、E、F表示活动,丄表示结束活动;共出现了四次属于丄的结束活动,σ1包含的是与第一个结束活动类型相同的活动,σ2包含的是与第二个结束活动类型相同的活动,σ3包含的是与第三个结束活动类型相同的活动,σ4包含的是与第四个结束活动类型相同的活动;
S14:若活动轨迹流Σ*到来下一个活动轨迹
Figure SMS_11
则进入步骤S2,否则重复步骤S1。
进一步的,步骤S2具体为:
S21:对ti时刻的流程模型M与活动轨迹流Σ*中ti+1时刻到来的活动轨迹σi+1进行一致性检查,获得一致性检查结果(fitness,precision);其中,i表示活动轨迹的编号;
S22:设置遗忘窗口的大小为w,通过一致性检查结果和遗忘窗口计算获得流程价值V;
S23:对活动轨迹流Σ*进行不同轨迹变体分类,获得多重集BΣ*
S24:对多重集BΣ*进行遗忘修剪,再基于频率进行采样,获得高频轨迹变体多重集B’Σ*
具体的,采用遗忘窗口修剪BΣ*中不活跃的轨迹变体的方法包括:
设置遗忘窗口的大小为w,如果一个轨迹变体σi在活动轨迹流Σ*中最新到来的w个活动轨迹中没有出现,则将它标记为不活跃的轨迹变体,并在多重集BΣ*中删除σi对应的项(σi,fi);
S25:若高频轨迹变体多重集B’Σ*出现概念漂移则进入步骤S3,否则返回步骤S1;
具体的,概念漂移检测的方法包括:
将修剪后的多重集BΣ*按轨迹变体的频数从大到小排序,并将排序后的元素逐个加入多重集B’Σ*中,直到满足
Figure SMS_12
,其中μ为频率采样的采样率,/>
Figure SMS_13
函数为计算多重集中记录的不同轨迹变体的频数的总和;
由此,
Figure SMS_14
为包含BΣ*中最频繁的轨迹变体的最小多重集,其中/>
Figure SMS_15
记录当前时刻ti生成的最小多重集为
Figure SMS_17
,在ti+1时刻Σ*中新到来一个活动轨迹时,将活动轨迹加入ti时刻的最小多重集/>
Figure SMS_19
生成新的多重集/>
Figure SMS_22
,然后经过遗忘窗口修剪和频率采样生成新的最小多重集/>
Figure SMS_18
;若/>
Figure SMS_20
,则称活动轨迹分布在ti+1时刻相对于ti时刻发生了概念漂移;其中,/>
Figure SMS_23
函数为对多重集进行去重,得到多重集所包含的轨迹变体种类,即若/>
Figure SMS_24
和/>
Figure SMS_16
包含了不同的轨迹变体,则认为发生了概念漂移;参考图3,例如使用采样率μ=0.8对多重集BΣ*进行频率采样,可以发现
Figure SMS_21
,故认为在ti+1时刻活动轨迹分布发生了概念漂移。
进一步的,步骤S21具体为:
S211:使用A*算法,获得ti时刻的流程模型M中从起始节点到终止节点的所有路径的集合ρ(M);
S212:检查活动轨迹σi+1是否为流程模型M中一条从起点到终点的路径,记作φ;若σi+1∈ρ(M)则φ=1,否则φ=0;
S213:计算获得流程模型M对于活动轨迹σi+1的适应度fitness和确度precision,获得一致性检查结果(fitness,precision),其中fitness=φ,precision=φ/|ρ(M)|。
进一步的,步骤S22具体为:
获取最近的w个一致性检查结果:
{(fitness1,precision1),(fitness2,precision2),...(fitnessw,precisionw)}
流程价值V的计算公式为:
Figure SMS_25
进一步的,步骤S23具体为:
S231:定义不同的活动轨迹为轨迹变体,当且仅当两个活动轨迹对应的活动序列完全相同时,认为它们属于同一种轨迹变体,否则认为这两个活动轨迹属于两种不同的轨迹变体;
S232:多重集BΣ*的表达式为:
Figure SMS_26
其中,σi表示轨迹变体,fi表示σi出现的频数;
S233:每当Σ*中下一个活动轨迹σi+1到来时,若其属于BΣ*中的轨迹变体σi,则将频数fi加一;否则在BΣ*中新增一项(σj,fj),其中σji+1且fj=1。
进一步的,步骤S3具体为:
S31:提取高频轨迹变体多重集B’Σ*在ti时刻的最小多重集
Figure SMS_27
S32:基于流程价值V将流程模型M的遗忘窗口的大小设置为w,频率采样率设置为μ,流程发现算法参数设置为P,获得参数调整后的流程模型;
S33:将最小多重集
Figure SMS_28
输入参数调整后的流程模型,获得新的流程模型M’,将新的流程模型M’作为当前的流程模型后返回步骤S1。
进一步的,流程模型M的初始化流程为:
设置初始化窗口的大小为
Figure SMS_29
,在开始监控RPA系统后,对活动轨迹流Σ*中最先到来的/>
Figure SMS_30
个活动轨迹,生成多重集BΣ*,进行频率采样得到最小多重集/>
Figure SMS_31
,然后采用传统静态流程发现算法,设置算法参数P,输入/>
Figure SMS_32
,得到初始的流程模型。
本发明提供一种基于概念漂移的RPA动态流程发现系统,包括:
活动轨迹流获取模块,获取RPA系统当前的流程模型生成的事件日志流Σ,通过事件日志流Σ获得活动轨迹流Σ*;若活动轨迹流Σ*到来下一个活动轨迹则进入概念漂移检测模块,否则返回活动轨迹流获取模块;
概念漂移检测模块,计算获得流程模型M的流程价值V,通过活动轨迹流Σ*获得高频轨迹变体多重集B’Σ*;若高频轨迹变体多重集B’Σ*出现概念漂移则进入流程模型更新模块,否则返回活动轨迹流获取模块;
流程模型更新模块,基于流程价值V设置调节参数,通过调节参数对流程模型M进行调节,获得新的流程模型M’,将新的流程模型M’作为当前的流程模型后返回活动轨迹流获取模块。
本发明提供一种存储设备,所述存储设备存储指令及数据用于实现所述的基于概念漂移的RPA动态流程发现方法。
本发明提供一种基于概念漂移的RPA动态流程发现设备,包括:处理器及存储设备;所述处理器加载并执行存储设备中的指令及数据用于实现所述的基于概念漂移的RPA动态流程发现方法。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。词语第一、第二、以及第三等的使用不表示任何顺序,可将这些词语解释为标识。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种基于概念漂移的RPA动态流程发现方法,其特征在于,包括步骤:
S1:获取RPA系统当前的流程模型生成的事件日志流Σ,通过事件日志流Σ获得活动轨迹流Σ*;若活动轨迹流Σ*到来下一个活动轨迹则进入步骤S2,否则重复步骤S1;
S2:计算获得流程模型M的流程价值V,通过活动轨迹流Σ*获得高频轨迹变体多重集B’Σ*;若高频轨迹变体多重集B’Σ*出现概念漂移则进入步骤S3,否则返回步骤S1;
S3:基于流程价值V设置调节参数,通过调节参数对流程模型M进行调节,获得新的流程模型M’,将新的流程模型M’作为当前的流程模型后返回步骤S1。
2.根据权利要求1所述的基于概念漂移的RPA动态流程发现方法,其特征在于,步骤S1具体为:
S11:记录RPA系统执行业务时产生的每一个事件e=(c,a,t);
其中,c表示案例,t表示时刻,a表示活动;
S12:将记录的事件按时间先后顺序输出,生成无限的事件日志流Σ=e1,e2,...ek...,其中,k表示事件的编号,ek表示事件日志流中第k个到来的事件;
S13:当在事件日志流Σ中识别到结束活动时,提取与结束活动的案例相同的所有事件形成活动轨迹流Σ*12,...,σi,...;其中,i表示活动轨迹的编号,σi表示活动轨迹流中第i个到来的活动轨迹;
S14:若活动轨迹流Σ*到来下一个活动轨迹
Figure QLYQS_1
则进入步骤S2,否则重复步骤S1。
3.根据权利要求1所述的基于概念漂移的RPA动态流程发现方法,其特征在于,步骤S2具体为:
S21:对ti时刻的流程模型M与活动轨迹流Σ*中ti+1时刻到来的活动轨迹σi+1进行一致性检查,获得一致性检查结果(fitness,precision);其中,i表示活动轨迹的编号;
S22:设置遗忘窗口的大小为w,通过一致性检查结果和遗忘窗口计算获得流程价值V;
S23:对活动轨迹流Σ*进行不同轨迹变体分类,获得多重集BΣ*
S24:对多重集BΣ*进行遗忘修剪,再基于频率进行采样,获得高频轨迹变体多重集B’Σ*
S25:若高频轨迹变体多重集B’Σ*出现概念漂移则进入步骤S3,否则返回步骤S1。
4.根据权利要求3所述的基于概念漂移的RPA动态流程发现方法,其特征在于,步骤S21具体为:
S211:使用A*算法,获得ti时刻的流程模型M中从起始节点到终止节点的所有路径的集合ρ(M);
S212:检查活动轨迹σi+1是否为流程模型M中一条从起点到终点的路径,记作φ;若σi+1∈ρ(M)则φ=1,否则φ=0;
S213:计算获得流程模型M对于活动轨迹σi+1的适应度fitness和确度precision,获得一致性检查结果(fitness,precision),其中fitness=φ,precision=φ/|ρ(M)|。
5.根据权利要求3所述的基于概念漂移的RPA动态流程发现方法,其特征在于,步骤S22具体为:
获取最近的w个一致性检查结果:
{(fitness1,precision1),(fitness2,precision2),...(fitnessw,precisionw)}
流程价值V的计算公式为:
Figure QLYQS_2
6.根据权利要求3所述的基于概念漂移的RPA动态流程发现方法,其特征在于,步骤S23具体为:
S231:定义不同的活动轨迹为轨迹变体,当且仅当两个活动轨迹对应的活动序列完全相同时,认为它们属于同一种轨迹变体,否则认为这两个活动轨迹属于两种不同的轨迹变体;
S232:多重集BΣ*的表达式为:
Figure QLYQS_3
其中,σi表示轨迹变体,fi表示σi出现的频数;
S233:每当Σ*中下一个活动轨迹σi+1到来时,若其属于BΣ*中的轨迹变体σi,则将频数fi加一;否则在BΣ*中新增一项(σj,fj),其中σji+1且fj=1。
7.根据权利要求1所述的基于概念漂移的RPA动态流程发现方法,其特征在于,步骤S3具体为:
S31:提取高频轨迹变体多重集B’Σ*在ti时刻的最小多重集
Figure QLYQS_4
S32:基于流程价值V将流程模型M的遗忘窗口的大小设置为w,频率采样率设置为μ,流程发现算法参数设置为P,获得参数调整后的流程模型;
S33:将最小多重集
Figure QLYQS_5
输入参数调整后的流程模型,获得新的流程模型M’,将新的流程模型M’作为当前的流程模型后返回步骤S1。
8.一种基于概念漂移的RPA动态流程发现系统,其特征在于,包括:
活动轨迹流获取模块,获取RPA系统当前的流程模型生成的事件日志流Σ,通过事件日志流Σ获得活动轨迹流Σ*;若活动轨迹流Σ*到来下一个活动轨迹则进入概念漂移检测模块,否则返回活动轨迹流获取模块;
概念漂移检测模块,计算获得流程模型M的流程价值V,通过活动轨迹流Σ*获得高频轨迹变体多重集B’Σ*;若高频轨迹变体多重集B’Σ*出现概念漂移则进入流程模型更新模块,否则返回活动轨迹流获取模块;
流程模型更新模块,基于流程价值V设置调节参数,通过调节参数对流程模型M进行调节,获得新的流程模型M’,将新的流程模型M’作为当前的流程模型后返回活动轨迹流获取模块。
9.一种存储设备,其特征在于:所述存储设备存储指令及数据用于实现权利要求1~7任一项所述的基于概念漂移的RPA动态流程发现方法。
10.一种基于概念漂移的RPA动态流程发现设备,其特征在于:包括:处理器及存储设备;所述处理器加载并执行存储设备中的指令及数据用于实现权利要求1~7任一项所述的基于概念漂移的RPA动态流程发现方法。
CN202310512391.4A 2023-05-09 2023-05-09 一种基于概念漂移的rpa动态流程发现方法及系统 Active CN116225513B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310512391.4A CN116225513B (zh) 2023-05-09 2023-05-09 一种基于概念漂移的rpa动态流程发现方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310512391.4A CN116225513B (zh) 2023-05-09 2023-05-09 一种基于概念漂移的rpa动态流程发现方法及系统

Publications (2)

Publication Number Publication Date
CN116225513A CN116225513A (zh) 2023-06-06
CN116225513B true CN116225513B (zh) 2023-07-04

Family

ID=86589554

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310512391.4A Active CN116225513B (zh) 2023-05-09 2023-05-09 一种基于概念漂移的rpa动态流程发现方法及系统

Country Status (1)

Country Link
CN (1) CN116225513B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117406972B (zh) * 2023-12-14 2024-02-13 安徽思高智能科技有限公司 基于拟合度分析的rpa高价值流程实例发现方法及系统

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104462121A (zh) * 2013-09-18 2015-03-25 腾讯科技(深圳)有限公司 数据处理方法、装置及系统
CN109460391A (zh) * 2018-09-04 2019-03-12 安徽理工大学 一种基于流程切的过程模型挖掘新方法
CN109753591A (zh) * 2018-12-11 2019-05-14 江阴逐日信息科技有限公司 业务流程预测性监控方法
WO2020227429A1 (en) * 2019-05-06 2020-11-12 Strong Force Iot Portfolio 2016, Llc Platform for facilitating development of intelligence in an industrial internet of things system
CN112612765A (zh) * 2020-12-21 2021-04-06 山东理工大学 一种基于漂移检测的流程变体差异分析方法与系统
CN114020593A (zh) * 2021-11-08 2022-02-08 山东理工大学 一种基于轨迹聚类的异质流程日志采样方法与系统
CN115345458A (zh) * 2022-08-02 2022-11-15 山东科技大学 业务流程合规性检查方法、计算机设备以及可读存储介质
CN115374595A (zh) * 2022-06-28 2022-11-22 南京大学 一种基于过程挖掘的自动化软件过程建模方法及系统
CN115408136A (zh) * 2022-11-01 2022-11-29 安徽思高智能科技有限公司 一种基于遗传算法的rpa流程调度方法
CN115758156A (zh) * 2022-11-25 2023-03-07 桂林电子科技大学 一种基于概念漂移发现的业务过程异常检测方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8321251B2 (en) * 2010-03-04 2012-11-27 Accenture Global Services Limited Evolutionary process system
WO2022221719A2 (en) * 2021-04-16 2022-10-20 Strong Force Vcn Portfolio 2019, Llc Systems, methods, kits, and apparatuses for digital product network systems and biology-based value chain networks

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104462121A (zh) * 2013-09-18 2015-03-25 腾讯科技(深圳)有限公司 数据处理方法、装置及系统
CN109460391A (zh) * 2018-09-04 2019-03-12 安徽理工大学 一种基于流程切的过程模型挖掘新方法
CN109753591A (zh) * 2018-12-11 2019-05-14 江阴逐日信息科技有限公司 业务流程预测性监控方法
WO2020227429A1 (en) * 2019-05-06 2020-11-12 Strong Force Iot Portfolio 2016, Llc Platform for facilitating development of intelligence in an industrial internet of things system
CN112612765A (zh) * 2020-12-21 2021-04-06 山东理工大学 一种基于漂移检测的流程变体差异分析方法与系统
CN114020593A (zh) * 2021-11-08 2022-02-08 山东理工大学 一种基于轨迹聚类的异质流程日志采样方法与系统
CN115374595A (zh) * 2022-06-28 2022-11-22 南京大学 一种基于过程挖掘的自动化软件过程建模方法及系统
CN115345458A (zh) * 2022-08-02 2022-11-15 山东科技大学 业务流程合规性检查方法、计算机设备以及可读存储介质
CN115408136A (zh) * 2022-11-01 2022-11-29 安徽思高智能科技有限公司 一种基于遗传算法的rpa流程调度方法
CN115758156A (zh) * 2022-11-25 2023-03-07 桂林电子科技大学 一种基于概念漂移发现的业务过程异常检测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于Artifact生命周期的业务流程一致性检查;王颖;周晓宇;王钊;张学馨;陈丽娇;;计算机集成制造系统(第04期);全文 *

Also Published As

Publication number Publication date
CN116225513A (zh) 2023-06-06

Similar Documents

Publication Publication Date Title
CN107577688B (zh) 基于媒体信息采集的原创文章影响力分析系统
Javaid et al. A deep learning approach for network intrusion detection system
Armitage et al. A comparison of supervised learning techniques in the classification of bat echolocation calls
Yu et al. Trajectory outlier detection approach based on common slices sub-sequence
CN116225513B (zh) 一种基于概念漂移的rpa动态流程发现方法及系统
Souza et al. Classification of evolving data streams with infinitely delayed labels
Olmezogullari et al. Representation of click-stream datasequences for learning user navigational behavior by using embeddings
Minegishi et al. Detection of fraud use of credit card by extended VFDT
Dymshits et al. Process monitoring on sequences of system call count vectors
Xiang et al. Finding community structure based on subgraph similarity
Ruan et al. Parallel and quantitative sequential pattern mining for large-scale interval-based temporal data
Bharti et al. Intrusion detection using clustering
Heymann et al. Outskewer: Using skewness to spot outliers in samples and time series
Gilmary et al. Detection of automated behavior on Twitter through approximate entropy and sample entropy
Touati et al. Detection of change points in underlying earthquake rates, with application to global mega-earthquakes
CN113901441A (zh) 一种用户异常请求检测方法、装置、设备及存储介质
Shafiq et al. WeChat traffic classification using machine learning algorithms and comparative analysis of datasets
Barzen et al. Quantum humanities: a first use case for quantum-ML in media science
Anand et al. Anomaly Detection and Time Series Analysis
CN113569879B (zh) 异常识别模型的训练方法、异常账号识别方法及相关装置
Zhang et al. An Algorithm for Mining Gradual Moving Object Clusters Pattern From Trajectory Streams.
Dardzinska et al. Classification algorithms in the material science and engineering data mining techniques
JP2010079325A (ja) モデルの構築方法、構築システム及び構築用プログラム
Sadik et al. In pursuit of outliers in multi-dimensional data streams
Sayed-Mouchaweh Learning from Data Streams in Evolving Environments: Methods and Applications

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20230606

Assignee: HUBEI THINGO TECHNOLOGY DEVELOPMENT Co.,Ltd.

Assignor: Anhui Sigao Intelligent Technology Co.,Ltd.

Contract record no.: X2023980039197

Denomination of invention: A Dynamic Process Discovery Method and System for RPA Based on Concept Drift

Granted publication date: 20230704

License type: Exclusive License

Record date: 20230810

EE01 Entry into force of recordation of patent licensing contract