CN116382756A - 在概念漂移下业务流程模型的自动和增量修复方法及系统 - Google Patents

在概念漂移下业务流程模型的自动和增量修复方法及系统 Download PDF

Info

Publication number
CN116382756A
CN116382756A CN202211519082.1A CN202211519082A CN116382756A CN 116382756 A CN116382756 A CN 116382756A CN 202211519082 A CN202211519082 A CN 202211519082A CN 116382756 A CN116382756 A CN 116382756A
Authority
CN
China
Prior art keywords
node
flow
drift
flow model
subpt
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211519082.1A
Other languages
English (en)
Inventor
曹健
关威
钱诗友
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Jiaotong University
Original Assignee
Shanghai Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Jiaotong University filed Critical Shanghai Jiaotong University
Priority to CN202211519082.1A priority Critical patent/CN116382756A/zh
Publication of CN116382756A publication Critical patent/CN116382756A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/70Software maintenance or management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/36Preventing errors by testing or debugging software
    • G06F11/3604Software analysis for verifying properties of programs
    • G06F11/3612Software analysis for verifying properties of programs by runtime analysis
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Stored Programmes (AREA)

Abstract

本发明提供了一种在概念漂移下业务流程模型的自动和增量修复方法及系统,包括:步骤S1:将每一个到达的轨迹在当前的流程模型上进行重放,并进行概念漂移检测;步骤S2:检测到概念漂移后,对概念漂移进行定位;步骤S3:替换流程模型的子结构修复流程模型。本发明着眼于在信息系统中存在概念漂移的情况下,自动更新业务流程模型,减少了人为修改流程模型的繁琐操作;本发明能够使用户尽早地发现并理解流程的演变,保证企业的健康运行。

Description

在概念漂移下业务流程模型的自动和增量修复方法及系统
技术领域
本发明涉及流程挖掘领域,具体地,涉及一种在概念漂移下业务流程模型的自动和增量修复方法及系统。
背景技术
流程挖掘(PM)是一个不断发展的研究领域,它提供了理解和改进不同应用领域流程的技术。大多数现有的流程挖掘技术只有在流程处于稳定状态时才有效(即事件日志中的所有轨迹都是从同一版本的流程模型中产生的)。然而,现实生活中的流程可能会随着时间的推移而改变(即业务流程概念漂移),以应对新的业务需求、市场变化、新政策或法规等。根据对100多个组织的真实信息系统的分析,我们发现业务流程随时间而变化。
显然,企业需要工具在业务流程发生变化时尽可能早地通知他们。此外,他们还想知道发生了什么样的变化。因此,近年来,检测和分析业务流程中的概念漂移已经引起学术界和工业界越来越多的关注。不幸的是,由于业务流程具有更复杂的结构,如并发、选择和循环,因此不可能使用为数据挖掘开发的概念漂移方法来处理业务流程中的概念漂移,需要新的策略和技术来处理业务流程中的概念漂移。
业务流程模型不仅是业务流程管理系统所必需的,它们还能帮助管理者了解流程是如何组织的。当检测到概念漂移时,更新的流程模型可以帮助管理者了解已经发生的概念漂移。它也为检测未来的概念漂移提供了基础。生成新流程模型的最简单方法是将流程发现技术应用于事件日志中的"变化点"(发生漂移的确切轨迹或事件)之后。不幸的是,一旦检测到变化点,事件日志通常不足以挖掘一个完整的流程模型。好消息是,一个概念漂移往往影响到流程模型的一个小区域。因此,我们提出了一种方法,在检测到概念漂移后自动增量地修复流程模型。
专利文献CN111143413A公开了一种基于数据流概念漂移的异常检测方法,并具体公开了一种能够及时对概念漂移进行检测的基于数据流概念漂移的异常检测方法。包括S1,获取待检测系统当前在不同时刻采集的真实数据形成真实数据流,根据真实数据流建立待检测系统当前的预测模型;S2,通过预测模型对后一时段的数据进行预测得到预测数据流;S3,计算真实数据流与预测数据流间的相似度数据集;S4,根据相似度数据集及待检测系统当前的概念漂移阈值判断是否出现概念漂移;S5,如果否,则重复S2至S4;S6,如果是,则更新预测模型、概念漂移阈值和异常检测阈值,根据更新后的预测模型和概念漂移阈值重复S2至S6。但该发明不能在检测到概念漂移后自动增量地修复概念漂移出现位置的流程模型。
发明内容
针对现有技术中的缺陷,本发明的目的是提供一种在概念漂移下业务流程模型的自动和增量修复方法及系统。
根据本发明提供的一种在概念漂移下业务流程模型的自动和增量修复方法,包括:
步骤S1:将每一个到达的轨迹在当前的流程模型上进行重放,并进行概念漂移检测;
步骤S2:检测到概念漂移后,对概念漂移进行定位;
步骤S3:替换流程模型的子结构修复流程模型。
优选地,在所述步骤S1中:
当流程模型的precision或fitness下降时发生概念漂移:
步骤S1.1:检测流程模型的fitness下降:
在窗口大小为WindowSize的最近轨迹序列中,将不满足当前流程模型的跟踪过滤出来;如果不满足当前流程模型的轨迹数量超过windowSize*α,流程发生概念漂移,其中α为预设数值;
步骤S1.2:检测流程模型的precision下降:
步骤S1.2.1:检测∧,
Figure BDA0003972940200000021
结构的precision的下降:
为所有∧,
Figure BDA0003972940200000022
结构中的每个不稳定的子结构subPT初始化跟随关系RsubPT;初始化过程记录所有可能出现在RsubPT中的直接跟随关系;当预设时间段后没有新的直接跟随关系加入到RsubPT中时,则subPT是稳定的;否则,新的直接跟随关系添加到RsubPT中;一旦所有结构都是稳定的,检查∧或/>
Figure BDA0003972940200000023
结构的precision是否下降;定义子结构的precision下降程度:给定一个日志L以及流网中的一个子结构subPT,RsubPT为所有可能出现在/>
Figure BDA0003972940200000031
集合中的元素所构成的集合;将下降程度定义为RsubPT中的元素没有出现在
Figure BDA0003972940200000032
中的元素的个数与RsubPT中的元素的个数比例;公式如下所示:
Figure BDA0003972940200000033
其中,DDsubPT(L)为日志L对于流图WN的子结构subPT的precision下降程度,Tσ为轨迹σ的发射序列,
Figure BDA0003972940200000034
为发射序列Tσ在变迁集合TsukPT上的投影,DFRS(T)为获取变迁集合T的直接跟随关系集合;
π为投影操作,当检测到存在至少一个子结构的DD不为0时、当结构的下降程度DD超过SP次以上不再变化并且最大的下降程度DD超过阈值时,报告检测到概念漂移;
步骤S1.2.2:检测×结构的precision的下降:
观察过去windowSize个满足流程模型的轨迹的发射序列包含的所有变迁构成的集合中,是否和流网的变迁集合T一致,如果不一致,检测到概念漂移。
优选地,在所述步骤S2中:
当流程模型的fitness下降时:
定义最终允许的变迁集对:给定一个WF-netWN=(P,T,F,W,M0,MF,l)和一个不满足WN的轨迹σ,m为满足
Figure BDA0003972940200000035
的最大整数;
其中,(P,T,F)是一个佩特里网,P是库所集合,T是变迁集合,
Figure BDA0003972940200000036
是有向弧集合,W是表示每一个有向边的权重,M0是初始状态,MF是结束状态,l是对每一个变迁指定的活动名称(标签);
enabled(Mn)为最终允许的变迁集,表示为ETWN(σ);定义最终允许的变迁集对ETpairWN(σ)=(ETWN(σ),ETR(WN)(R(σ)))为一个二元组;
其中,ETWN(σ)为轨迹σ在WF-netWN上的最终允许的变迁集,R(WN)为将WF-netWN中所有有向弧的方向反向得到的新的WF-net,R(σ)为轨迹σ的反向轨迹;ETR(WN)(R(σ)))为轨迹R(σ)在WF-net R(WN)上的最终允许的变迁集;
将ETpairWN(σ)精炼为ETpairWN(σ)=({ta},{tb});
对概念漂移进行定位:
获得集合EV={C(et)|et∈ET},为最终允许的变迁集ET中的元素对应于流程树PT中的节点构成的集合;
当|ET|>=1,并且存在节点v∈CA(EV),标签
Figure BDA0003972940200000037
此时待替换的节点v为满足如下条件的节点:v∈cA(EV)且标签/>
Figure BDA0003972940200000041
Figure BDA0003972940200000042
获得以待替换的节点v为根节点形成的子树PT<v>中包含的所有标签属于活动集合
Figure BDA0003972940200000043
的节点v′;发生概念漂移的变迁集合LT为这些节点v′对应于PN中的变迁C(v′)所构成的集合;形式化如下/>
Figure BDA0003972940200000044
CA(EV)为节点集合EV中元素的共同祖先,DOWNPT(v)为流程树PT的根节点Root(PT)到节点v的最短路径上的节点序列,l(v′)为节点v′的标签;
当|ET|=1并且
Figure BDA0003972940200000045
标签/>
Figure BDA0003972940200000046
此时待替换的节点v为ev1∈EV,为EV中的唯一一个元素,发生漂移的变迁集合为LT=ET;
当|ET|>1,并且
Figure BDA0003972940200000047
标签/>
Figure BDA0003972940200000048
并且l(LCA(EV))是∧或者×,此时待替换的节点v为LCA(EV),发生漂移的变迁集合/>
Figure BDA0003972940200000049
Figure BDA00039729402000000410
LCA(EV)为节点集合EV中元素的最近共同祖先;
当|ET|>1,并且
Figure BDA00039729402000000411
标签/>
Figure BDA00039729402000000412
并且l(LCA(EV))=→,令V′={v′|ev∈EV,DOWNPT(ev)=<…,LCA(EV),v′,…,ev>},获得孩子节点序列CV=<cv1,…,vn>←children(LCA(EV)),其中/>
Figure BDA00039729402000000413
找到最小索引minI满足cvminI∈V′,找到最大索引maxI满足cvmaxI∈V′,获得CV的子序列CV′={cvminI,cvminI+1…,cvmaxI-1,cvmaxI};
如果CV′=CV,此时待替换的节点v为LCA(EV),
Figure BDA00039729402000000414
Figure BDA00039729402000000415
如果
Figure BDA00039729402000000416
发生概念漂移的变迁集合/>
Figure BDA00039729402000000417
Figure BDA00039729402000000418
合并CV′中的所有节点为一个节点v,l(v)=τ为此时待替换的节点v。
优选地,在所述步骤S3中:
利用流程发现技术生成新的流网,对在PT中发生漂移的子结构v替换为τ-node,获得流程树tPT;获得流程树对应的流网tWN;
利用tWN获得子日志subL规则如下:
a、找到最大的m满足:
Figure BDA00039729402000000419
b、找到最大的m′满足:
Figure BDA00039729402000000420
c、subL←∪σ∈Lm+1,|σ|-m′};
subL为用于修复流程模型的相关子日志;
对subL中的异常轨迹进行过滤,使用inductive miner获得subL对应的流程树并对τ-node进行替换,得到修复后的流程模型。
优选地,在所述步骤S3中:
当流程模型的∧,
Figure BDA0003972940200000056
结构的precision的下降时,发生precision的下降的子结构可能存在多个,下降程度DD最大的子结构为发生概念漂移的子结构并修复流程模型;
当流程模型的×结构的precision的下降时,删除从来没有被发射的变迁修复流程模型。
根据本发明提供的一种在概念漂移下业务流程模型的自动和增量修复系统,包括:
模块M1:将每一个到达的轨迹在当前的流程模型上进行重放,并进行概念漂移检测;
模块M2:检测到概念漂移后,对概念漂移进行定位;
模块M3:替换流程模型的子结构修复流程模型。
优选地,在所述模块M1中:
当流程模型的precision或fitness下降时发生概念漂移:
模块M1.1:检测流程模型的fitness下降:
在窗口大小为WindowSize的最近轨迹序列中,将不满足当前流程模型的跟踪过滤出来;如果不满足当前流程模型的轨迹数量超过windowSize*α,流程发生概念漂移,其中α为预设数值;
模块M1.2:检测流程模型的precision下降:
模块M1.2.1:检测∧,
Figure BDA0003972940200000051
结构的precision的下降:
为所有∧,
Figure BDA0003972940200000052
结构中的每个不稳定的子结构subPT初始化跟随关系RsubPT;初始化过程记录所有可能出现在RsubPT中的直接跟随关系;当预设时间段后没有新的直接跟随关系加入到RsubPT中时,则subPT是稳定的;否则,新的直接跟随关系添加到RsubPT中;一旦所有结构都是稳定的,检查∧或/>
Figure BDA0003972940200000057
结构的precision是否下降;定义子结构的precision下降程度:给定一个日志L以及流网中的一个子结构subPT,RsubPT为所有可能出现在/>
Figure BDA0003972940200000053
集合中的元素所构成的集合;将下降程度定义为RsubPT中的元素没有出现在
Figure BDA0003972940200000054
中的元素的个数与RsubPT中的元素的个数比例;公式如下所示:
Figure BDA0003972940200000055
其中,DDsubPT(L)为日志L对于流图WN的子结构subPT的precision下降程度,Tσ为轨迹σ的发射序列,
Figure BDA0003972940200000061
为发射序列Tσ在变迁集合TsubPT上的投影,DFRS(T)为获取变迁集合T的直接跟随关系集合;
π为投影操作,当检测到存在至少一个子结构的DD不为0时、当结构的下降程度DD超过SP次以上不再变化并且最大的下降程度DD超过阈值时,报告检测到概念漂移;
模块M1.2.2:检测×结构的precision的下降:
观察过去windowSize个满足流程模型的轨迹的发射序列包含的所有变迁构成的集合中,是否和流网的变迁集合T一致,如果不一致,检测到概念漂移。
优选地,在所述模块M2中:
当流程模型的fitness下降时:
定义最终允许的变迁集对:给定一个WF-netWN=(P,T,F,W,M0,MF,l)和一个不满足WN的轨迹σ,m为满足
Figure BDA0003972940200000062
的最大整数;
其中,(P,T,F)是一个佩特里网,P是库所集合,T是变迁集合,
Figure BDA0003972940200000063
是有向弧集合,W是表示每一个有向边的权重,M0是初始状态,MF是结束状态,l是对每一个变迁指定的活动名称(标签);
enabled(Mn)为最终允许的变迁集,表示为ETWN(σ);定义最终允许的变迁集对ETpairWN(σ)=(ETWN(σ),ETR(WN)(R(σ)))为一个二元组;
其中,ETWN(σ)为轨迹σ在WF-netWN上的最终允许的变迁集,R(WN)为将WF-netWN中所有有向弧的方向反向得到的新的WF-net,R(σ)为轨迹σ的反向轨迹;
ETR(WN)(R(σ)))为轨迹R(σ)在WF-net R(WN)上的最终允许的变迁集;
将ETpairWN(σ)精炼为ETpairWN(σ)=({ta},{tb});
对概念漂移进行定位:
获得集合EV={C(et)|et∈ET},为最终允许的变迁集ET中的元素对应于流程树PT中的节点构成的集合;
当|ET|>=1,并且存在节点v∈CA(EV),标签
Figure BDA0003972940200000064
此时待替换的节点v为满足如下条件的节点:v∈CA(EV)且标签/>
Figure BDA0003972940200000065
Figure BDA0003972940200000066
获得以待替换的节点v为根节点形成的子树PT<v>中包含的所有标签属于活动集合
Figure BDA0003972940200000067
的节点v′;发生概念漂移的变迁集合LT为这些节点v′对应于PN中的变迁C(v′)所构成的集合;形式化如下/>
Figure BDA0003972940200000068
CA(EV)为节点集合EV中元素的共同祖先,DOWNPT(v)为流程树PT的根节点Root(PT)到节点v的最短路径上的节点序列,l(v′)为节点v′的标签;
当|ET|=1并且
Figure BDA0003972940200000071
标签/>
Figure BDA0003972940200000072
此时待替换的节点v为ev1∈EV,为EV中的唯一一个元素,发生漂移的变迁集合为LT=ET;
当|ET|>1,并且
Figure BDA0003972940200000073
标签/>
Figure BDA0003972940200000074
并且l(LCA(EV))是∧或者×,此时待替换的节点v为LCA(EV),发生漂移的变迁集合/>
Figure BDA0003972940200000075
Figure BDA0003972940200000076
LCA(EV)为节点集合EV中元素的最近共同祖先;
当|ET|>1,并且
Figure BDA0003972940200000077
标签/>
Figure BDA0003972940200000078
并且l(LCA(EV))=→,令V′={v′|ev∈EV,DOWNPT(ev)=<…,LCA(EV),v′,…,ev>},获得孩子节点序列CV=<cv1,…,cvn>←children(LCA(EV)),其中/>
Figure BDA0003972940200000079
找到最小索引minI满足cvminI∈V′,找到最大索引maxI满足cvmaxI∈V′,获得CV的子序列CV′={cvminI,cvminI+1…,cvmaxI-1,cvmaxI};
如果CV′=CV,此时待替换的节点v为LCA(EV),
Figure BDA00039729402000000710
Figure BDA00039729402000000711
如果
Figure BDA00039729402000000712
发生概念漂移的变迁集合/>
Figure BDA00039729402000000713
Figure BDA00039729402000000714
合并CV′中的所有节点为一个节点v,l(v)=τ为此时待替换的节点v。
优选地,在所述模块M3中:
利用流程发现技术生成新的流网,对在PT中发生漂移的子结构v替换为τ-node,获得流程树tPT;获得流程树对应的流网tWN;
利用tWN获得子日志subL规则如下:
a、找到最大的m满足:
Figure BDA00039729402000000715
b、找到最大的m′满足:
Figure BDA00039729402000000716
c、subL←∪σ∈Lm+1,|σ|-m′};
subL为用于修复流程模型的相关子日志;
对subL中的异常轨迹进行过滤,使用inductive miner获得subL对应的流程树并对τ-node进行替换,得到修复后的流程模型。
优选地,在所述模块M3中:
当流程模型的∧,
Figure BDA00039729402000000717
结构的precision的下降时,发生precision的下降的子结构可能存在多个,下降程度DD最大的子结构为发生概念漂移的子结构并修复流程模型;
当流程模型的×结构的precision的下降时,删除从来没有被发射的变迁修复流程模型。
与现有技术相比,本发明具有如下的有益效果:
1、本发明着眼于在信息系统中存在概念漂移的情况下,自动更新业务流程模型,减少了人为修改流程模型的繁琐操作;
2、本发明能够使用户尽早地发现并理解流程的演变,保证企业的健康运行。
附图说明
通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1为本发明的AIMED框架示意图;
图2为本发明的精炼允许的变迁集合对示意图;
图3为本发明的在流程模型的fitness下降时四种概念漂移定位的情况示意图。
图4为本发明的模型修复示意图。
具体实施方式
下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变化和改进。这些都属于本发明的保护范围。
实施例1:
根据本发明提供的一种在概念漂移下业务流程模型的自动和增量修复方法,如图1-图4所示,包括:
步骤S1:将每一个到达的轨迹在当前的流程模型上进行重放,并进行概念漂移检测;
具体地,在所述步骤S1中:
当流程模型的precision或fitness下降时发生概念漂移:
步骤S1.1:检测流程模型的fitness下降:
在窗口大小为WindowSize的最近轨迹序列中,将不满足当前流程模型的跟踪过滤出来;如果不满足当前流程模型的轨迹数量超过windowSize*α,流程发生概念漂移,其中α为预设数值;
步骤S1.2:检测流程模型的precision下降:
步骤S1.2.1:检测∧,
Figure BDA0003972940200000091
结构的precision的下降:
为所有∧,
Figure BDA0003972940200000092
结构中的每个不稳定的子结构subPT初始化跟随关系RsubPT;初始化过程记录所有可能出现在RsubPT中的直接跟随关系;当预设时间段后没有新的直接跟随关系加入到RsubPT中时,则subPT是稳定的;否则,新的直接跟随关系添加到RsubPT中;一旦所有结构都是稳定的,检查∧或/>
Figure BDA0003972940200000093
结构的precision是否下降;定义子结构的precision下降程度:给定一个日志L以及流网中的一个子结构subPT,RsubPT为所有可能出现在/>
Figure BDA0003972940200000094
集合中的元素所构成的集合;将下降程度定义为R5ubPT中的元素没有出现在
Figure BDA0003972940200000095
中的元素的个数与RsubPT中的元素的个数比例;公式如下所示:
Figure BDA0003972940200000096
其中,DDsubPT(L)为日志L对于流图WN的子结构subPT的precision下降程度,Tσ为轨迹σ的发射序列,
Figure BDA0003972940200000097
为发射序列Tσ在变迁集合TsubPT上的投影,DFRS(T)为获取变迁集合T的直接跟随关系集合;
π为投影操作,当检测到存在至少一个子结构的DD不为0时、当结构的下降程度DD超过SP次以上不再变化并且最大的下降程度DD超过阈值时,报告检测到概念漂移;
步骤S1.2.2:检测×结构的precision的下降:
观察过去windowSize个满足流程模型的轨迹的发射序列包含的所有变迁构成的集合中,是否和流网的变迁集合T一致,如果不一致,检测到概念漂移。
步骤S2:检测到概念漂移后,对概念漂移进行定位;
具体地,在所述步骤S2中:
当流程模型的fitness下降时:
定义最终允许的变迁集对:给定一个WF-netWN=(P,T,F,W,M0,MF,l)和一个不满足WN的轨迹σ,m为满足
Figure BDA0003972940200000098
的最大整数;
其中,(P,T,F)是一个佩特里网,P是库所集合,T是变迁集合,
Figure BDA0003972940200000099
是有向弧集合,W是表示每一个有向边的权重,M0是初始状态,MF是结束状态,l是对每一个变迁指定的活动名称(标签);
enabled(Mn)为最终允许的变迁集,表示为ETWN(σ);定义最终允许的变迁集对ETpairWN(σ)=(ETWN(σ),ETR(WN)(R(σ)))为一个二元组;
其中,ETWN(σ)为轨迹σ在WF-netWN上的最终允许的变迁集,R(WN)为将WF-netWN中所有有向弧的方向反向得到的新的WF-net,R(σ)为轨迹σ的反向轨迹;ETR(WN)(R(σ)))为轨迹R(σ)在WF-net R(WN)上的最终允许的变迁集;
将ETpairWN(σ)精炼为ETpairWN(σ)=({ta},{tb});
对概念漂移进行定位:
获得集合EV={C(et)|et∈ET},为最终允许的变迁集ET中的元素对应于流程树PT中的节点构成的集合;
当|ET|>=1,并且存在节点v∈CA(EV),标签
Figure BDA0003972940200000101
此时待替换的节点v为满足如下条件的节点:v∈CA(EV)且标签/>
Figure BDA0003972940200000102
Figure BDA0003972940200000103
获得以待替换的节点v为根节点形成的子树PT<v>中包含的所有标签属于活动集合
Figure BDA0003972940200000104
的节点v′;发生概念漂移的变迁集合LT为这些节点v′对应于PN中的变迁C(v′)所构成的集合;形式化如下/>
Figure BDA0003972940200000105
CA(EV)为节点集合EV中元素的共同祖先,DOWNPT(v)为流程树PT的根节点Root(PT)到节点v的最短路径上的节点序列,l(v′)为节点v′的标签;
当|ET|=1并且
Figure BDA0003972940200000106
标签/>
Figure BDA0003972940200000107
此时待替换的节点v为ev1∈EV,为EV中的唯一一个元素,发生漂移的变迁集合为LT=ET;
当|ET|>1,并且
Figure BDA0003972940200000108
标签/>
Figure BDA0003972940200000109
并且l(LCA(EV))是∧或者×,此时待替换的节点v为LCA(EV),发生漂移的变迁集合/>
Figure BDA00039729402000001010
Figure BDA00039729402000001011
LCA(EV)为节点集合EV中元素的最近共同祖先;
当|ET|>1,并且
Figure BDA00039729402000001012
标签/>
Figure BDA00039729402000001013
并且l(LCA(EV))=→,令V′={v′|ev∈EV,DOWNPT(ev)=<…,LCA(EV),v′,…,ev>},获得孩子节点序列CV=<cv1,…,cvn>←children(LCA(EV)),其中/>
Figure BDA00039729402000001014
找到最小索引minI满足cvminI∈V′,找到最大索引maxI满足cvmaxI∈V′,获得CV的子序列CV′={cvminI,cvminI+1…,cvmaxI-1,cvmaxI};
如果CV′=CV,此时待替换的节点v为LCA(EV),
Figure BDA00039729402000001015
Figure BDA00039729402000001016
如果
Figure BDA00039729402000001017
发生概念漂移的变迁集合/>
Figure BDA00039729402000001018
Figure BDA00039729402000001019
合并CV′中的所有节点为一个节点v,l(v)=τ为此时待替换的节点v。
步骤S3:替换流程模型的子结构修复流程模型。
具体地,在所述步骤S3中:
利用流程发现技术生成新的流网,对在PT中发生漂移的子结构v替换为τ-node,获得流程树tPT;获得流程树对应的流网tWN;
利用tWN获得子日志subL规则如下:
a、找到最大的m满足:
Figure BDA0003972940200000111
b、找到最大的m′满足:
Figure BDA0003972940200000112
c、subL←∪σ∈Lm+1,|σ|-m′};
subL为用于修复流程模型的相关子日志;
对subL中的异常轨迹进行过滤,使用inductive miner获得subL对应的流程树并对τ-node进行替换,得到修复后的流程模型。
具体地,在所述步骤S3中:
当流程模型的∧,
Figure BDA0003972940200000113
结构的precision的下降时,发生precision的下降的子结构可能存在多个,下降程度DD最大的子结构为发生概念漂移的子结构并修复流程模型;
当流程模型的×结构的precision的下降时,删除从来没有被发射的变迁修复流程模型。
实施例2:
实施例2为实施例1的优选例,以更为具体地对本发明进行说明。
本发明还提供一种在概念漂移下业务流程模型的自动和增量修复系统,所述在概念漂移下业务流程模型的自动和增量修复系统可以通过执行所述在概念漂移下业务流程模型的自动和增量修复方法的流程步骤予以实现,即本领域技术人员可以将所述在概念漂移下业务流程模型的自动和增量修复方法理解为所述在概念漂移下业务流程模型的自动和增量修复系统的优选实施方式。
根据本发明提供的一种在概念漂移下业务流程模型的自动和增量修复系统,包括:
模块M1:将每一个到达的轨迹在当前的流程模型上进行重放,并进行概念漂移检测;
具体地,在所述模块M1中:
当流程模型的precision或fitness下降时发生概念漂移:
模块M1.1:检测流程模型的fitness下降:
在窗口大小为WindowSize的最近轨迹序列中,将不满足当前流程模型的跟踪过滤出来;如果不满足当前流程模型的轨迹数量超过windowSize*α,流程发生概念漂移,其中α为预设数值;
模块M1.2:检测流程模型的precision下降:
模块M1.2.1:检测∧,
Figure BDA0003972940200000121
结构的precision的下降:
为所有∧,
Figure BDA0003972940200000122
结构中的每个不稳定的子结构subPT初始化跟随关系RsubPT;初始化过程记录所有可能出现在RsubPT中的直接跟随关系;当预设时间段后没有新的直接跟随关系加入到RsubPT中时,则subPT是稳定的;否则,新的直接跟随关系添加到RsubPT中;一旦所有结构都是稳定的,检查∧或/>
Figure BDA0003972940200000123
结构的precision是否下降;定义子结构的precision下降程度:给定一个日志L以及流网中的一个子结构subPT,RsubPT为所有可能出现在/>
Figure BDA0003972940200000124
集合中的元素所构成的集合;将下降程度定义为RsubPT中的元素没有出现在
Figure BDA0003972940200000125
中的元素的个数与RsubPT中的元素的个数比例;公式如下所示:
Figure BDA0003972940200000126
其中,DDsubPT(L)为日志L对于流图WN的子结构subPT的precision下降程度,Tσ为轨迹σ的发射序列,
Figure BDA0003972940200000127
为发射序列Tσ在变迁集合TsubPT上的投影,DFRS(T)为获取变迁集合T的直接跟随关系集合;
π为投影操作,当检测到存在至少一个子结构的DD不为0时、当结构的下降程度DD超过SP次以上不再变化并且最大的下降程度DD超过阈值时,报告检测到概念漂移;
模块M1.2.2:检测×结构的precision的下降:
观察过去windowSize个满足流程模型的轨迹的发射序列包含的所有变迁构成的集合中,是否和流网的变迁集合T一致,如果不一致,检测到概念漂移。
模块M2:检测到概念漂移后,对概念漂移进行定位;
具体地,在所述模块M2中:
当流程模型的fitness下降时:
定义最终允许的变迁集对:给定一个WF-netWN=(P,T,F,W,M0,MF,l)和一个不满足WN的轨迹σ,m为满足
Figure BDA0003972940200000128
的最大整数;
其中,(P,T,F)是一个佩特里网,P是库所集合,T是变迁集合,
Figure BDA0003972940200000129
是有向弧集合,W是表示每一个有向边的权重,M0是初始状态,MF是结束状态,l是对每一个变迁指定的活动名称(标签);
enabled(Mn)为最终允许的变迁集,表示为ETWN(σ);定义最终允许的变迁集对ETpairWN(σ)=(ETWN(σ),ETR(WN)(R(σ)))为一个二元组;
其中,ETWN(σ)为轨迹σ在WF-netWN上的最终允许的变迁集,R(WN)为将WF-netWN中所有有向弧的方向反向得到的新的WF-net,R(σ)为轨迹σ的反向轨迹;ETR(WN)(R(σ)))为轨迹R(σ)在WF-net R(WN)上的最终允许的变迁集;
将ETpairWN(σ)精炼为ETpairWN(σ)=({ta},{tb});
对概念漂移进行定位:
获得集合EV={C(et)|et∈ET},为最终允许的变迁集ET中的元素对应于流程树PT中的节点构成的集合;
当|ET|>=1,并且存在节点v∈CA(EV),标签
Figure BDA0003972940200000131
此时待替换的节点v为满足如下条件的节点:v∈CA(EV)且标签/>
Figure BDA0003972940200000132
Figure BDA0003972940200000133
获得以待替换的节点v为根节点形成的子树PT<v>中包含的所有标签属于活动集合
Figure BDA0003972940200000134
的节点v′;发生概念漂移的变迁集合LT为这些节点v′对应于PN中的变迁C(v′)所构成的集合;形式化如下/>
Figure BDA0003972940200000135
CA(EV)为节点集合EV中元素的共同祖先,DOWNPT(v)为流程树PT的根节点Root(PT)到节点v的最短路径上的节点序列,l(v′)为节点v′的标签;
当|ET|=1并且
Figure BDA0003972940200000136
标签/>
Figure BDA0003972940200000137
此时待替换的节点v为ev1∈EV,为EV中的唯一一个元素,发生漂移的变迁集合为LT=ET;
当|ET|>1,并且
Figure BDA0003972940200000138
标签/>
Figure BDA0003972940200000139
并且l(LCA(EV))是∧或者×,此时待替换的节点v为LCA(EV),发生漂移的变迁集合/>
Figure BDA00039729402000001310
Figure BDA00039729402000001311
LCA(EV)为节点集合EV中元素的最近共同祖先;
当|ET|>1,并且
Figure BDA00039729402000001312
标签/>
Figure BDA00039729402000001313
并且l(LCA(EV))=→,令V′={v′|ev∈EV,DOWNPT(ev)=<…,LCA(EV),v′,…,ev>},获得孩子节点序列CV=<cv1,…,cvn>←children(LCA(EV)),其中/>
Figure BDA00039729402000001314
找到最小索引minI满足cvminI∈V′,找到最大索引maxI满足cvmaxI∈V′,获得CV的子序列CV′={cvminI,cvminI+1…,cvmaxI-1,cvmaxI};
如果CV′=CV,此时待替换的节点v为LCA(EV),
Figure BDA00039729402000001315
Figure BDA00039729402000001316
如果
Figure BDA00039729402000001317
发生概念漂移的变迁集合/>
Figure BDA00039729402000001318
Figure BDA0003972940200000141
合并CV′中的所有节点为一个节点v,l(v)=τ为此时待替换的节点v。
模块M3:替换流程模型的子结构修复流程模型。
具体地,在所述模块M3中:
利用流程发现技术生成新的流网,对在PT中发生漂移的子结构v替换为τ-node,获得流程树tPT;获得流程树对应的流网tWN;
利用tWN获得子日志subL规则如下:
a、找到最大的m满足:
Figure BDA0003972940200000142
b、找到最大的m′满足:
Figure BDA0003972940200000143
c、subL←∪σ∈Lm+1,|σ|-m′};
subL为用于修复流程模型的相关子日志;
对subL中的异常轨迹进行过滤,使用inductive miner获得subL对应的流程树并对τ-node进行替换,得到修复后的流程模型。
具体地,在所述模块M3中:
当流程模型的∧,
Figure BDA0003972940200000144
结构的precision的下降时,发生precision的下降的子结构可能存在多个,下降程度DD最大的子结构为发生概念漂移的子结构并修复流程模型;
当流程模型的×结构的precision的下降时,删除从来没有被发射的变迁修复流程模型。
实施例3:
实施例3为实施例1的优选例,以更为具体地对本发明进行说明。
一种概念漂移的自动检测方法,对于流程行为和模型之间的一致性而言,当流程模型的precision或fitness显著下降时,会发生概念漂移。
一种在概念漂移下业务流程模型的自动和增量修复方法:首先,每一个到达的轨迹都将在当前的流程模型上进行重放,并进行概念漂移检测的过程。第二步,在检测到概念漂移后,我们对概念漂移进行定位(即确定受概念漂移影响的子结构),这对修复流程模型起到了关键作用。在第三步,替换流程模型的子结构以修复流程模型。我们将当前模型切换到修复后的模型,以支持对下一个概念漂移的检测。
对于流程模型fitness下降时,我们利用流程树,分为四种情况讨论得到概念漂移影响的子结构。当流程模型的precision下降时,则检测流程模型中导致precision下降的最小子结构作为概念漂移影响的子结构。
对概念漂移影响的子结构,提取相应的子日志,并使用流程发现算法发现新的流程模型,对原有子结构进行替换,得到修复后的流程模型。
定义了子结构的precision下降程度:给定一个日志L以及WF-net中的一个子结构subPT,RsubPT为所有可能出现在
Figure BDA0003972940200000151
集合中的元素所构成的集合。我们将下降程度定义为RsubPT中的元素没有出现在/>
Figure BDA0003972940200000152
中的元素的个数与RsubPT中的元素的个数比例。公式如下所示
Figure BDA0003972940200000153
实施例4:
实施例4为实施例1的优选例,以更为具体地对本发明进行说明。
本发明公开了一种在概念漂移下业务流程模型的自动和增量修复方法——AIMED。包括:AIMED简化了概念漂移的检测、定位和定性的功能。更具体地说,它通过精确地定位概念漂移所影响的流程模型的子结构并相应地更新这个子结构,及时地自动修复流程模型。特别是,AIMED可以抵抗极大地影响当前概念漂移技术性能的噪声。本发明着眼于在信息系统中存在概念飘移的情况下,自动更新业务流程模型,减少了人为修改流程模型的繁琐操作,并且能够使用户尽早地发现并理解流程的演变,保证企业的健康运行。
有鉴于此,本发明的目的是提供一种在概念漂移下业务流程模型的自动和增量修复方法,用于弥补现有技术的不足。该方法利用现有的流程模型检测系统中发生的概念漂移。当概念漂移发生时,对这个与当前实际流程不一致的模型进行修复。
为解决上述技术问题,本发明的技术方案如下:
本发明的事件日志的特征是:
Figure BDA0003972940200000154
是一组活动。一个轨迹σ=<e1,e2,…,e|σ|>是个活动序列,|σ|是轨迹的长度。轨迹σi的子轨迹是/>
Figure BDA0003972940200000155
σi的反向轨迹是
Figure BDA0003972940200000156
表示一个事件日志,它是轨迹的集合。|L|表示事件日志L中含有轨迹的个数。
本发明的流程模型:Accepting Petri net是一个七元组PN=(P,T,F,W,M0,MF,l)。其中(P,F,F)是一个petri net,P是库所集合,T是变迁集合,
Figure BDA0003972940200000157
是有向弧集合。W是表示每一个有向边的权重。M0是初始状态。MF是结束状态。l是对每一个变迁指定的活动名称(标签)。
本发明的流程模型:WF-net WN,它是特殊的Accepting Petri net。当AcceptingPetri net满足如下两个条件时,被称为WF-net:1.仅有一个开始库所并且仅有一个终止库所;2.每一个节点都在开始库所和终止库所的路径上。如果一个变迁t∈T的输入库所有足够的令牌,那么变迁将发射。enabled(M)表示状态M时所有被允许的变迁(可以被发射)。R(WN)为将WF-net WN中所有有向弧的方向反向得到的新的WF-net。
本发明的变迁的发射规则:变迁t∈T的发射产生新的状态M,它从每个输入库所消耗W(p,t)个令牌,并产生W(t,p)个令牌到输出库所。根据变迁的发射规则,我们有:
Figure BDA0003972940200000161
表示变迁t在状态M1被允许,并且变迁t发射,状态M1变为状态M2。/>
Figure BDA0003972940200000162
表示一个发射序列/>
Figure BDA0003972940200000163
的发射使状态M1变为状态Mn。发射序列的标签
Figure BDA0003972940200000164
如果有一个发射序列Tσ,l(Tσ)=σ,满足/>
Figure BDA0003972940200000165
我们称轨迹σ满足WN,表示为/>
Figure BDA0003972940200000166
否则/>
Figure BDA0003972940200000167
本发明使用的流程树的特征是:
Figure BDA0003972940200000168
是一组操作标签,流程树PT按如下方式定义:1.一个活动节点是流程树,其中活动节点的标签,满足/>
Figure BDA0003972940200000169
2.⊕(PT1,...PTn),是一个流程树,其中⊕是操作节点,满足/>
Figure BDA00039729402000001612
PTi是该流程树的节点。对于一个流程树PT,包含节点和边的集合分别用V(PT)和E(PT)表示。流程树PT的根节点用Root(PT)表示。我们用PT<v>表示以v∈V(PT)为根的PT的子树。对于PT中的每个非根节点v,让/>
Figure BDA00039729402000001613
是节点Root(PT)到v的最短路径上的节点序列,DOWNPT(v)中在v前面的节点称为PT中v的祖先。对于PT中的节点v1,…,vn,DOWNPT(v1)∩…∩DOWNPT(vn)中的任意一个节点,都是他们的共同祖先(CA)。我们将最近共同祖先(LCA)定义为最深的共同祖先,并用LCA(v1,…,vn)来表示它。节点v的父节点序列为parents(v),每个节点v∈V(PT),满足|parents(v)|<=1,|parents(root(PT))|=0。节点v的子节点序列是children(v)。具有相同父节点的节点被称为兄弟节点.
本发明中流程树和WF-net的对应关系:一个流程树对应于一个WF-net,反之亦然。给定一个WF-net,WN=(P,T,F,W,M0,MF,l)及其对应的流程树PT,每个变迁t∈T,l(t)≠τ,在V(PT)中有其相应的活动节点,表示为C(t)∈V(PT)。在V(PT)中的每个活动节点v∈V(PT),l(v)≠τ,在变迁集合T中都有其相应的变迁,表示为C(v)∈T。有以下属性成立:i)∈V(PT),l(v)一定等于l(C(v));ii)但当t∈T,v∈V(PT),l(t)=l(v):C(t)可能不等于v,C(v)可能不等于t。这是因为WN的两个或多个变迁和PT的两个或多个活动节点共享同一个标签。
本发明中的∧结构:对于一个WF-netWN以及它对应的流程树,如果存在某一节点v∈V(PT),并且l(v)=∧,此时我们称子树PT<v>为流程树的一个∧结构,也可称为相应WF-netWV的一个∧结构。同理我们有
Figure BDA0003972940200000171
结构;×结构;→结构。对于一个∧结构,定义它的变迁集合/>
Figure BDA0003972940200000172
Figure BDA0003972940200000173
结构;×结构;→结构也有相同的定义。
本发明的目标是,当信息系统中发生概念漂移时,及时报告概念漂移发生时间,并根据概念漂移后的日志修复流程模型,让用户了解的当前的实际流程,有助于企业的健康运行。
本发明的在概念漂移下业务流程模型的自动和增量修复方法如下(如图1所示):
首先需要检测出概念漂移,我们需要同时检测:1.流程模型的fitness下降;2.流程模型中∧,
Figure BDA0003972940200000174
结构的precision的下降;3.流程模型中×结构的precision的下降。当出现如上三种情况时我们认为发生了概念漂移。/>
第二步,当概念漂移发生时,我们对概念漂移进行定位(即确定受概念漂移影响的子结构)。
在第三步,替换流程模型的子结构以修复流程模型。我们将当前模型切换为修复后的模型,以支持对下一个概念漂移的检测。
实施例5:
实施例5为实施例1的优选例,以更为具体地对本发明进行说明。
本发明的在概念漂移下业务流程模型的自动和增量修复方法如下:
1.1首选需要检测出概念漂移,检测流程模型的fitness下降:在窗口大小为WindowSize的最近轨迹序列中,所有不满足当前流程模型的跟踪都被过滤出来。如果不满足当前流程模型的轨迹数量超过windowSize*α,我们认为流程发生了概念漂移。α的值对检测的性能有影响。当α取小值时,检测将更加敏感,并可能导致错误警报。相反,给α分配一个较大的值,可以确保检测算法抵御噪声的影响,但它对概念漂移的敏感度较低。
检测流程模型的precision下降:对于一个WF-net,→结构改变时,一定不会导致precision的下降,因为它只允许一种行为。
Figure BDA0003972940200000175
结构发生改变时,有可能会导致precision的下降,例如∧结构变为→结构;/>
Figure BDA0003972940200000176
结构变为→结构;×结构中某一分支被删除等。其中,→、/>
Figure BDA0003972940200000177
均为流程树中常用的操作符号。
1.2检测∧,
Figure BDA0003972940200000181
结构的precision的下降:我们需要为所有∧,/>
Figure BDA0003972940200000182
结构中的每个不稳定的子结构subPT初始化一组直接跟随关系RsubPT。初始化过程的基本思路是记录所有可能出现在RsubPT中的直接跟随关系。当一段时间后没有新的直接跟随关系加入到RsubPT中时,则subPT是稳定的,否则,新的直接跟随关系将被添加到RsubPT中。一旦所有结构都是稳定的,我们就可以检查∧或/>
Figure BDA0003972940200000183
结构的precision是否下降。我们定义子结构的precision下降程度:给定一个日志L以及WF-net中的一个子结构subPT,RsubPT为所有可能出现在
Figure BDA0003972940200000184
集合中的元素所构成的集合。我们将下降程度定义为RsubPT中的元素没有出现在/>
Figure BDA0003972940200000185
中的元素的个数与RsubPT中的元素的个数比例。公式如下所示:
Figure BDA0003972940200000186
其中,DDsubPT(L)为日志L对于流图WN的子结构subPT的precision下降程度,Tσ为轨迹σ的发射序列,
Figure BDA0003972940200000187
为发射序列Tσ在变迁集合TsubPT上的投影,DFRS(T)为获取变迁集合T的直接跟随关系集合;
其中π为投影操作。当我们检测到存在至少一个子结构的DD不为0时,我们并不是马上报告概念漂移的发生,而是当这些结构的下降程度DD超过SP次以上不再变化,并且最大的下降程度DD超过阈值时(如果下降程度过小,可能是由于模型允许的行为过多而windowSize设置较小导致的,此阈值在一定程度上能缓解这种情况造成的后果),再报告检测到概念漂移。
1.3检测×结构的precision的下降:我们为检测这种情况的发生,仅需要观察过去windowSize个满足流程模型的轨迹的发射序列包含的所有变迁构成的集合中,是否和WF-net的变迁集合T一致。如果不一致,说明存在某些×结构中某些分支被弃用,检测到概念漂移。
接下来需要修复流程模型。
2.1当流程模型的fitness下降时,修复包括三个步骤。第一步是获得最终允许的变迁集对。第二步是对概念漂移进行定位。最后,生成一个新的WF-net。
我们定义最终允许的变迁集对:给定一个WF-netWN=(P,T,F,W,M0,MF,l)和一个不满足wN的轨迹σ,让m为满足
Figure BDA0003972940200000188
的最大整数。其中,(P,T,F)是一个petrinet,P是库所集合,T是变迁集合,/>
Figure BDA0003972940200000189
是有向弧集合。W是表示每一个有向边的权重。M0是初始状态。MF是结束状态。l是对每一个变迁指定的活动名称(标签)。
此时,enabled(Mn)被称为最终允许的变迁集,表示为ETWN(σ)。那么我们也可以定义最终允许的变迁集对ETpairWN(σ)=(ETWN(σ),ETR(WN)(R(σ))),它是一个二元组。
其中,ETWN(σ)为轨迹σ在WF-netWN上的最终允许的变迁集,R(WN)为将WF-netWN中所有有向弧的方向反向得到的新的WF-net,R(σ)为轨迹σ的反向轨迹;ETR(WN)(R(σ)))为轨迹R(σ)在WF-net R(WN)上的最终允许的变迁集。
并不是所有ETpair的ET中的变迁都是有意义的。考虑图2a中的WN和ETpairWN(σ)=({ta,…,ta+k},{tb}),不难看出,轨迹σ已经选择执行了Branch 1,没有经过其他分支,如Branch k。因此,在ETWN(σ)={ta,…,ta+k}中,除了ta之外的所有变迁都是无意义的。所以我们将ETpairWN(σ)可以精炼为ETpairWN(σ)=({ta},{tb})。
ETpair精炼算法如下所示
Figure BDA0003972940200000191
第二步,我们需要对概念漂移进行定位:有4种情况需要考虑。为了完成这个任务,我们首先获得集合EV={C(et)|et∈ET},也就是最终允许的变迁集ET中的元素对应于流程树PT中的节点构成的集合。
情况1(如图3a所示):当|ET|>=1,并且存在节点v∈CA(EV)它的标签
Figure BDA0003972940200000192
此时待替换的节点v为满足如下两个条件的节点:1.v∈CA(EV)它的标签/>
Figure BDA0003972940200000193
2.
Figure BDA0003972940200000194
也就是说v是所有满足条件1的节点中最接近根节点的节点。我们获得以待替换的节点v为根节点形成的子树PT<v>中包含的所有标签属于活动集合
Figure BDA0003972940200000195
的节点v′。发生概念漂移的变迁集合LT为这些节点v′对应于PN中的变迁C(v′)所构成的集合。形式化如下/>
Figure BDA0003972940200000196
CA(EV)为节点集合EV中元素的共同祖先,DOWNPT(v)为流程树PT的根节点Root(PT)到节点v的最短路径上的节点序列,l(v′)为节点v′的标签;
情况2(如图3b所示):当|ET|=1并且
Figure BDA0003972940200000201
它的标签/>
Figure BDA0003972940200000202
此时待替换的节点v为ev1∈EV也就是说是EV中的唯一一个元素。发生漂移的变迁集合为LT=ET。
情况3(如图3c所示):当|ET|>1,并且
Figure BDA0003972940200000203
它的标签/>
Figure BDA0003972940200000204
并且l(LCA(EV))是∧或者×。此时待替换的节点v为LCA(EV)。发生漂移的变迁集合LT与情况1相同:
Figure BDA0003972940200000205
LCA(EV)为节点集合EV中元素的最近共同祖先;
情况4(如图3d所示):当|ET|>1,并且
Figure BDA0003972940200000206
它的标签/>
Figure BDA0003972940200000207
并且l(LCA(EV))=→。令V′={v′|ev∈EV,DOWNPT(ev)=<…,LCA(EV),v′,…,ev>}。我们获得孩子节点序列CV=<cv1,…,cvn>←children(LCA(EV))。很明显/>
Figure BDA0003972940200000208
找到最小索引minI满足cvminI∈V′,找到最大索引maxI满足cvmaxI∈V′,然后我们获得CV的子序列CV′={cvminI,cvminI+1…,cvmaxI-1,cvmaxI}。此时我们仍然需要分两种情况讨论:1.如果CV′=CV,此时待替换的节点v为LCA(EV),在图3d中用红色矩形标出。发生漂移的变迁集合LT与情况1相同:
Figure BDA0003972940200000209
2.如果/>
Figure BDA00039729402000002010
那么发生概念漂移的变迁集合/>
Figure BDA00039729402000002011
Figure BDA00039729402000002012
合并CV′中的所有节点(在图3d中用蓝色矩形标出)为一个节点v,让l(v)=τ作为此时待替换的节点v。
生成新的WF-net需要利用流程发现技术(具体过程如图4所示)。基本思想是对在PT中发生漂移的子结构v替换为τ-node,获得流程树tPT。获得流程树对应的WF-net tWN。利用tWN获得子日志subL规则如下:1.找到最大的m满足
Figure BDA00039729402000002013
2.找到最大的m′满足
Figure BDA00039729402000002014
3.subL←∪σ∈Lm+1,|σ|-m′}。
subL为用于修复流程模型的相关子日志
由于考虑异常轨迹的出现,可以对subL中的异常轨迹进行过滤。最后,我们使用inductive miner来获得subL对应的流程树并对τ-node进行替换,此时得到的模型即为修复后的流程模型。
2.2当流程模型的∧,
Figure BDA00039729402000002015
结构的precision的下降时,发生precision的下降的子结构可能存在多个,我们认为下降程度DD最大的子结构为发生概念漂移的子结构。接下来我们使用与2.1节介绍的生成新的WF-net的方式,即可修复流程模型。
2.3当流程模型的×结构的precision的下降时,我们仅需要删除从来没有被发射的变迁即可修复流程模型。
本领域技术人员知道,除了以纯计算机可读程序代码方式实现本发明提供的系统、装置及其各个模块以外,完全可以通过将方法步骤进行逻辑编程来使得本发明提供的系统、装置及其各个模块以逻辑门、开关、专用集成电路、可编程逻辑控制器以及嵌入式微控制器等的形式来实现相同程序。所以,本发明提供的系统、装置及其各个模块可以被认为是一种硬件部件,而对其内包括的用于实现各种程序的模块也可以视为硬件部件内的结构;也可以将用于实现各种功能的模块视为既可以是实现方法的软件程序又可以是硬件部件内的结构。
以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变化或修改,这并不影响本发明的实质内容。在不冲突的情况下,本申请的实施例和实施例中的特征可以任意相互组合。

Claims (10)

1.一种在概念漂移下业务流程模型的自动和增量修复方法,其特征在于,包括:
步骤S1:将每一个到达的轨迹在当前的流程模型上进行重放,并进行概念漂移检测;
步骤S2:检测到概念漂移后,对概念漂移进行定位;
步骤S3:替换流程模型的子结构修复流程模型。
2.根据权利要求1所述的在概念漂移下业务流程模型的自动和增量修复方法,其特征在于,在所述步骤S1中:
当流程模型的precision或fitness下降时发生概念漂移:
步骤S1.1:检测流程模型的fitness下降:
在窗口大小为WindowSize的最近轨迹序列中,将不满足当前流程模型的跟踪过滤出来;如果不满足当前流程模型的轨迹数量超过windowSize*α,流程发生概念漂移,其中α为预设数值;
步骤S1.2:检测流程模型的precision下降:
步骤S1.2.1:检测∧,
Figure QLYQS_1
结构的precision的下降:
为所有∧,
Figure QLYQS_2
结构中的每个不稳定的子结构subPT初始化跟随关系RsubPT;初始化过程记录所有可能出现在RsubPT中的直接跟随关系;当预设时间段后没有新的直接跟随关系加入到RsubPT中时,则subPT是稳定的;否则,新的直接跟随关系添加到RsubPT中;一旦所有结构都是稳定的,检查∧或/>
Figure QLYQS_3
结构的precision是否下降;定义子结构的precision下降程度:给定一个日志L以及流网中的一个子结构subPT,RsubPT为所有可能出现在/>
Figure QLYQS_4
集合中的元素所构成的集合;将下降程度定义为RsubPT中的元素没有出现在
Figure QLYQS_5
中的元素的个数与RsubPT中的元素的个数比例;公式如下所示:
Figure QLYQS_6
其中,DDsubPT(L)为日志L对于流图WN的子结构subPT的precision下降程度,Tσ为轨迹σ的发射序列,
Figure QLYQS_7
为发射序列Tσ在变迁集合TsubPT上的投影,DFRS(T)为获取变迁集合T的直接跟随关系集合;
π为投影操作,当检测到存在至少一个子结构的DD不为0时、当结构的下降程度DD超过SP次以上不再变化并且最大的下降程度DD超过阈值时,报告检测到概念漂移;
步骤S1.2.2:检测×结构的precision的下降:
观察过去windowSize个满足流程模型的轨迹的发射序列包含的所有变迁构成的集合中,是否和流网的变迁集合T一致,如果不一致,检测到概念漂移。
3.根据权利要求1所述的在概念漂移下业务流程模型的自动和增量修复方法,其特征在于,在所述步骤S2中:
当流程模型的fitness下降时:
定义最终允许的变迁集对:给定一个WF-net WN=(P,T,F,W,M0,MF,l)和一个不满足WN的轨迹σ,m为满足
Figure QLYQS_8
的最大整数;
其中,(P,T,F)是一个佩特里网,P是库所集合,T是变迁集合,
Figure QLYQS_9
是有向弧集合,W是表示每一个有向边的权重,M0是初始状态,MF是结束状态,l是对每一个变迁指定的活动名称(标签);
enabled(Mn)为最终允许的变迁集,表示为ETWN(σ);定义最终允许的变迁集对ETpairWN(σ)=(ETWN(σ),ETR(WN)(R(σ)))为一个二元组;
其中,ETWN(σ)为轨迹σ在WF-net WN上的最终允许的变迁集,R(WN)为将WF-net WN中所有有向弧的方向反向得到的新的WF-net,R(σ)为轨迹σ的反向轨迹;ETR(WN)(R(σ)))为轨迹R(σ)在WF-netR(WN)上的最终允许的变迁集;
将ETpairWN(σ)精炼为ETpairWN(σ)=({ta},{tb});
对概念漂移进行定位:
获得集合EV={C(et)|et∈ET},为最终允许的变迁集ET中的元素对应于流程树PT中的节点构成的集合;
当|ET|>=1,并且存在节点v∈CA(EV),标签
Figure QLYQS_10
此时待替换的节点v为满足如下条件的节点:v∈CA(EV)且标签/>
Figure QLYQS_11
Figure QLYQS_12
获得以待替换的节点v为根节点形成的子树PT<v>中包含的所有标签属于活动集合
Figure QLYQS_13
的节点v′;发生概念漂移的变迁集合LT为这些节点v′对应于PN中的变迁C(v′)所构成的集合;形式化如下/>
Figure QLYQS_14
CA(EV)为节点集合EV中元素的共同祖先,DOWNPT(v)为流程树PT的根节点Root(PT)到节点v的最短路径上的节点序列,l(v′)为节点v′的标签;
当|ET|=1并且
Figure QLYQS_15
标签/>
Figure QLYQS_16
此时待替换的节点v为ev1∈EV,为EV中的唯一一个元素,发生漂移的变迁集合为LT=ET;
当|ET|>1,并且
Figure QLYQS_17
标签/>
Figure QLYQS_18
并且l(LCA(EV))是∧或者×,此时待替换的节点v为LCA(EV),发生漂移的变迁集合/>
Figure QLYQS_19
Figure QLYQS_20
LCA(EV)为节点集合EV中元素的最近共同祖先;
当|ET|>1,并且
Figure QLYQS_21
标签/>
Figure QLYQS_22
并且l(LCA(EV))=→,令V′={v′|ev∈EV,DOWNPT(ev)=<…,LCA(EV),v′,...,ev>},获得孩子节点序列CV=<cv1,...,cvn>←children(LCA(EV)),其中/>
Figure QLYQS_23
找到最小索引minI满足cvminI∈V′,找到最大索引maxI满足cvmaxI∈V′,获得CV的子序列CV′={cvminI,cvminI+1…,cvmaxI-1,cvmaxI};
如果CV′=CV,此时待替换的节点v为LCA(EV),
Figure QLYQS_24
Figure QLYQS_25
如果
Figure QLYQS_26
发生概念漂移的变迁集合/>
Figure QLYQS_27
Figure QLYQS_28
合并CV′中的所有节点为一个节点v,l(v)=τ为此时待替换的节点v。
4.根据权利要求1所述的在概念漂移下业务流程模型的自动和增量修复方法,其特征在于,在所述步骤S3中:
利用流程发现技术生成新的流网,对在PT中发生漂移的子结构v替换为τ-node,获得流程树tPT;获得流程树对应的流网tWN;
利用tWN获得子日志subL规则如下:
a、找到最大的m满足:
Figure QLYQS_29
b、找到最大的m′满足:
Figure QLYQS_30
c、subL←∪σ∈Lm+1,|σ|-m′};
subL为用于修复流程模型的相关子日志;
对subL中的异常轨迹进行过滤,使用inductive miner获得subL对应的流程树并对τ-node进行替换,得到修复后的流程模型。
5.根据权利要求1所述的在概念漂移下业务流程模型的自动和增量修复方法,其特征在于,在所述步骤S3中:
当流程模型的∧,
Figure QLYQS_31
结构的precision的下降时,发生precision的下降的子结构可能存在多个,下降程度DD最大的子结构为发生概念漂移的子结构并修复流程模型;
当流程模型的×结构的precision的下降时,删除从来没有被发射的变迁修复流程模型。
6.一种在概念漂移下业务流程模型的自动和增量修复系统,其特征在于,包括:
模块M1:将每一个到达的轨迹在当前的流程模型上进行重放,并进行概念漂移检测;
模块M2:检测到概念漂移后,对概念漂移进行定位;
模块M3:替换流程模型的子结构修复流程模型。
7.根据权利要求6所述的在概念漂移下业务流程模型的自动和增量修复系统,其特征在于,在所述模块M1中:
当流程模型的precision或fitness下降时发生概念漂移:
模块M1.1:检测流程模型的fitness下降:
在窗口大小为WindowSize的最近轨迹序列中,将不满足当前流程模型的跟踪过滤出来;如果不满足当前流程模型的轨迹数量超过windowSize*α,流程发生概念漂移,其中α为预设数值;
模块M1.2:检测流程模型的precision下降:
模块M1.2.1:检测∧,
Figure QLYQS_32
结构的precision的下降:
为所有∧,
Figure QLYQS_33
结构中的每个不稳定的子结构subPT初始化跟随关系RsubPT;初始化过程记录所有可能出现在RsubPT中的直接跟随关系;当预设时间段后没有新的直接跟随关系加入到RsubPT中时,则subPT是稳定的;否则,新的直接跟随关系添加到RsubPT中;一旦所有结构都是稳定的,检查∧或/>
Figure QLYQS_34
结构的precision是否下降;定义子结构的precision下降程度:给定一个日志L以及流网中的一个子结构subPT,RsubPT为所有可能出现在/>
Figure QLYQS_35
集合中的元素所构成的集合;将下降程度定义为RsubPT中的元素没有出现在
Figure QLYQS_36
中的元素的个数与RsubPT中的元素的个数比例;公式如下所示:
Figure QLYQS_37
其中,DDsubPT(L)为日志L对于流图WN的子结构subPT的precision下降程度,Tσ为轨迹σ的发射序列,
Figure QLYQS_38
为发射序列Tσ在变迁集合TsubPT上的投影,DFRS(T)为获取变迁集合T的直接跟随关系集合;
π为投影操作,当检测到存在至少一个子结构的DD不为0时、当结构的下降程度DD超过SP次以上不再变化并且最大的下降程度DD超过阈值时,报告检测到概念漂移;
模块M1.2.2:检测×结构的precision的下降:
观察过去windowSize个满足流程模型的轨迹的发射序列包含的所有变迁构成的集合中,是否和流网的变迁集合T一致,如果不一致,检测到概念漂移。
8.根据权利要求6所述的在概念漂移下业务流程模型的自动和增量修复系统,其特征在于,在所述模块M2中:
当流程模型的fitness下降时:
定义最终允许的变迁集对:给定一个WF-net WN=(P,T,F,W,M0,MF,l)和一个不满足WN的轨迹σ,m为满足
Figure QLYQS_39
的最大整数;
其中,(P,T,F)是一个佩特里网,P是库所集合,T是变迁集合,
Figure QLYQS_40
是有向弧集合,W是表示每一个有向边的权重,M0是初始状态,MF是结束状态,l是对每一个变迁指定的活动名称(标签);
enabled(Mn)为最终允许的变迁集,表示为ETWN(σ);定义最终允许的变迁集对ETpairWN(σ)=(ETWN(σ),ETR(WN)(R(σ)))为一个二元组;
其中,ETWN(σ)为轨迹σ在WF-net WN上的最终允许的变迁集,R(WN)为将WF-net WN中所有有向弧的方向反向得到的新的WF-net,R(σ)为轨迹σ的反向轨迹;ETR(WN)(R(σ)))为轨迹R(σ)在WF-netR(WN)上的最终允许的变迁集;
将ETpairWN(σ)精炼为ETpairWN(σ)=({ta},{tb});
对概念漂移进行定位:
获得集合EV={C(et)|et∈ET},为最终允许的变迁集ET中的元素对应于流程树PT中的节点构成的集合;
当|ET|>=1,并且存在节点v∈CA(EV),标签
Figure QLYQS_41
此时待替换的节点v为满足如下条件的节点:v∈CA(EV)且标签/>
Figure QLYQS_42
Figure QLYQS_43
获得以待替换的节点v为根节点形成的子树PT<v>中包含的所有标签属于活动集合
Figure QLYQS_44
的节点v′;发生概念漂移的变迁集合LT为这些节点v′对应于PN中的变迁C(v′)所构成的集合;形式化如下/>
Figure QLYQS_45
CA(EV)为节点集合EV中元素的共同祖先,DOWNPT(v)为流程树PT的根节点Root(PT)到节点v的最短路径上的节点序列,l(v′)为节点v′的标签;
当|ET|=1并且
Figure QLYQS_46
标签/>
Figure QLYQS_47
此时待替换的节点v为ev1∈EV,为EV中的唯一一个元素,发生漂移的变迁集合为LT=ET;
当|ET|>1,并且
Figure QLYQS_48
标签/>
Figure QLYQS_49
并且l(LCA(EV))是∧或者×,此时待替换的节点v为LCA(EV),发生漂移的变迁集合/>
Figure QLYQS_50
Figure QLYQS_51
LCA(EV)为节点集合EV中元素的最近共同祖先;
当|ET|>1,并且
Figure QLYQS_52
标签/>
Figure QLYQS_53
并且l(LCA(EV))=→,令V′={v′|ev∈EV,DOWNPT(ev)=<…,LCA(EV),v′,...,ev>},获得孩子节点序列CV=<cv1,...,cvn>←children(LCA(EV)),其中/>
Figure QLYQS_54
找到最小索引minI满足cvminI∈V′,找到最大索引maxI满足cvmaxI∈V′,获得CV的子序列CV′={cvminI,cvminI+1...,cvmaxI-1,cvmaxI};
如果CV′=CV,此时待替换的节点v为LCA(EV),
Figure QLYQS_55
Figure QLYQS_56
如果
Figure QLYQS_57
发生概念漂移的变迁集合/>
Figure QLYQS_58
Figure QLYQS_59
合并CV′中的所有节点为一个节点v,l(v)=τ为此时待替换的节点v。
9.根据权利要求6所述的在概念漂移下业务流程模型的自动和增量修复系统,其特征在于,在所述模块M3中:
利用流程发现技术生成新的流网,对在PT中发生漂移的子结构v替换为τ-node,获得流程树tPT;获得流程树对应的流网tWN;
利用tWN获得子日志subL规则如下:
a、找到最大的m满足:
Figure QLYQS_60
b、找到最大的m′满足:
Figure QLYQS_61
c、subL←∪σ∈Lm+1,|σ|-m′};
subL为用于修复流程模型的相关子日志;
对subL中的异常轨迹进行过滤,使用inductive miner获得subL对应的流程树并对τ-node进行替换,得到修复后的流程模型。
10.根据权利要求6所述的在概念漂移下业务流程模型的自动和增量修复系统,其特征在于,在所述模块M3中:
当流程模型的∧,
Figure QLYQS_62
结构的precision的下降时,发生precision的下降的子结构可能存在多个,下降程度DD最大的子结构为发生概念漂移的子结构并修复流程模型;
当流程模型的×结构的precision的下降时,删除从来没有被发射的变迁修复流程模型。
CN202211519082.1A 2022-11-30 2022-11-30 在概念漂移下业务流程模型的自动和增量修复方法及系统 Pending CN116382756A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211519082.1A CN116382756A (zh) 2022-11-30 2022-11-30 在概念漂移下业务流程模型的自动和增量修复方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211519082.1A CN116382756A (zh) 2022-11-30 2022-11-30 在概念漂移下业务流程模型的自动和增量修复方法及系统

Publications (1)

Publication Number Publication Date
CN116382756A true CN116382756A (zh) 2023-07-04

Family

ID=86973673

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211519082.1A Pending CN116382756A (zh) 2022-11-30 2022-11-30 在概念漂移下业务流程模型的自动和增量修复方法及系统

Country Status (1)

Country Link
CN (1) CN116382756A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116578300A (zh) * 2023-07-13 2023-08-11 江西云眼视界科技股份有限公司 一种基于可视化组件的应用创建方法、设备及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116578300A (zh) * 2023-07-13 2023-08-11 江西云眼视界科技股份有限公司 一种基于可视化组件的应用创建方法、设备及存储介质
CN116578300B (zh) * 2023-07-13 2023-11-10 江西云眼视界科技股份有限公司 一种基于可视化组件的应用创建方法、设备及存储介质

Similar Documents

Publication Publication Date Title
KR102483025B1 (ko) 운영 유지 시스템 및 방법
CN109828869B (zh) 预测硬盘故障发生时间的方法、装置及存储介质
US20220187815A1 (en) Systems and methods for detecting and predicting faults in an industrial process automation system
US10069684B2 (en) Core network analytics system
US10079721B2 (en) Integrated digital network management platform
Chen et al. Logtransfer: Cross-system log anomaly detection for software systems with transfer learning
US7856616B2 (en) Action-based in-process software defect prediction software defect prediction techniques based on software development activities
CN109753591B (zh) 业务流程预测性监控方法
US6393387B1 (en) System and method for model mining complex information technology systems
US9799007B2 (en) Method of collaborative software development
Yin et al. Improving log-based anomaly detection with component-aware analysis
CN109726066B (zh) 用于标识存储系统中的问题部件的方法和设备
CN116382756A (zh) 在概念漂移下业务流程模型的自动和增量修复方法及系统
CN113064873B (zh) 一种高召回率的日志异常检测方法
US11704186B2 (en) Analysis of deep-level cause of fault of storage management
CN112085228A (zh) 一种核电厂缺陷维修和状态报告管理的系统
CN114615018A (zh) 一种金融业交易全链路日志的异常检测方法
Hayashi Machine learning-assisted management of a virtualized network
Misaii et al. Optimal task-driven time-dependent covariate-based maintenance policy
Govindasamy et al. Data reduction for bug triage using effective prediction of reduction order techniques
US20230011129A1 (en) Log analyzer for fault detection
Antonello et al. A novel metric to evaluate the association rules for identification of functional dependencies in complex technical infrastructures
CN114444933A (zh) 一种基于建筑工程的危险源分析方法、设备和介质
CN111552847A (zh) 一种变更对象数量的方法和装置
Adamova et al. Machine Learning in Action: An Analysis of its Application for Fault Detection in Wireless Sensor Networks

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination