CN116382756A

CN116382756A - 在概念漂移下业务流程模型的自动和增量修复方法及系统

Info

Publication number: CN116382756A
Application number: CN202211519082.1A
Authority: CN
Inventors: 曹健; 关威; 钱诗友
Original assignee: Shanghai Jiaotong University
Current assignee: Shanghai Jiaotong University
Priority date: 2022-11-30
Filing date: 2022-11-30
Publication date: 2023-07-04

Abstract

本发明提供了一种在概念漂移下业务流程模型的自动和增量修复方法及系统，包括：步骤S1：将每一个到达的轨迹在当前的流程模型上进行重放，并进行概念漂移检测；步骤S2：检测到概念漂移后，对概念漂移进行定位；步骤S3：替换流程模型的子结构修复流程模型。本发明着眼于在信息系统中存在概念漂移的情况下，自动更新业务流程模型，减少了人为修改流程模型的繁琐操作；本发明能够使用户尽早地发现并理解流程的演变，保证企业的健康运行。

Description

在概念漂移下业务流程模型的自动和增量修复方法及系统

技术领域

本发明涉及流程挖掘领域，具体地，涉及一种在概念漂移下业务流程模型的自动和增量修复方法及系统。

背景技术

流程挖掘(PM)是一个不断发展的研究领域，它提供了理解和改进不同应用领域流程的技术。大多数现有的流程挖掘技术只有在流程处于稳定状态时才有效(即事件日志中的所有轨迹都是从同一版本的流程模型中产生的)。然而，现实生活中的流程可能会随着时间的推移而改变(即业务流程概念漂移)，以应对新的业务需求、市场变化、新政策或法规等。根据对100多个组织的真实信息系统的分析，我们发现业务流程随时间而变化。

显然，企业需要工具在业务流程发生变化时尽可能早地通知他们。此外，他们还想知道发生了什么样的变化。因此，近年来，检测和分析业务流程中的概念漂移已经引起学术界和工业界越来越多的关注。不幸的是，由于业务流程具有更复杂的结构，如并发、选择和循环，因此不可能使用为数据挖掘开发的概念漂移方法来处理业务流程中的概念漂移，需要新的策略和技术来处理业务流程中的概念漂移。

业务流程模型不仅是业务流程管理系统所必需的，它们还能帮助管理者了解流程是如何组织的。当检测到概念漂移时，更新的流程模型可以帮助管理者了解已经发生的概念漂移。它也为检测未来的概念漂移提供了基础。生成新流程模型的最简单方法是将流程发现技术应用于事件日志中的"变化点"(发生漂移的确切轨迹或事件)之后。不幸的是，一旦检测到变化点，事件日志通常不足以挖掘一个完整的流程模型。好消息是，一个概念漂移往往影响到流程模型的一个小区域。因此，我们提出了一种方法，在检测到概念漂移后自动增量地修复流程模型。

专利文献CN111143413A公开了一种基于数据流概念漂移的异常检测方法，并具体公开了一种能够及时对概念漂移进行检测的基于数据流概念漂移的异常检测方法。包括S1，获取待检测系统当前在不同时刻采集的真实数据形成真实数据流，根据真实数据流建立待检测系统当前的预测模型；S2，通过预测模型对后一时段的数据进行预测得到预测数据流；S3，计算真实数据流与预测数据流间的相似度数据集；S4，根据相似度数据集及待检测系统当前的概念漂移阈值判断是否出现概念漂移；S5，如果否，则重复S2至S4；S6，如果是，则更新预测模型、概念漂移阈值和异常检测阈值，根据更新后的预测模型和概念漂移阈值重复S2至S6。但该发明不能在检测到概念漂移后自动增量地修复概念漂移出现位置的流程模型。

发明内容

针对现有技术中的缺陷，本发明的目的是提供一种在概念漂移下业务流程模型的自动和增量修复方法及系统。

根据本发明提供的一种在概念漂移下业务流程模型的自动和增量修复方法，包括：

步骤S1：将每一个到达的轨迹在当前的流程模型上进行重放，并进行概念漂移检测；

步骤S2：检测到概念漂移后，对概念漂移进行定位；

步骤S3：替换流程模型的子结构修复流程模型。

优选地，在所述步骤S1中：

当流程模型的precision或fitness下降时发生概念漂移：

步骤S1.1：检测流程模型的fitness下降：

在窗口大小为WindowSize的最近轨迹序列中，将不满足当前流程模型的跟踪过滤出来；如果不满足当前流程模型的轨迹数量超过windowSize*α，流程发生概念漂移，其中α为预设数值；

步骤S1.2：检测流程模型的precision下降：

步骤S1.2.1：检测∧，

结构的precision的下降：

为所有∧，

结构中的每个不稳定的子结构subPT初始化跟随关系R_subPT；初始化过程记录所有可能出现在R_subPT中的直接跟随关系；当预设时间段后没有新的直接跟随关系加入到R_subPT中时，则subPT是稳定的；否则，新的直接跟随关系添加到R_subPT中；一旦所有结构都是稳定的，检查∧或/>

结构的precision是否下降；定义子结构的precision下降程度：给定一个日志L以及流网中的一个子结构subPT，R_subPT为所有可能出现在/>

集合中的元素所构成的集合；将下降程度定义为R_subPT中的元素没有出现在

中的元素的个数与R_subPT中的元素的个数比例；公式如下所示：

其中，DD_subPT(L)为日志L对于流图WN的子结构subPT的precision下降程度，T_σ为轨迹σ的发射序列，

为发射序列T_σ在变迁集合T_sukPT上的投影，DFRS(T)为获取变迁集合T的直接跟随关系集合；

π为投影操作，当检测到存在至少一个子结构的DD不为0时、当结构的下降程度DD超过SP次以上不再变化并且最大的下降程度DD超过阈值时，报告检测到概念漂移；

步骤S1.2.2：检测×结构的precision的下降：

观察过去windowSize个满足流程模型的轨迹的发射序列包含的所有变迁构成的集合中，是否和流网的变迁集合T一致，如果不一致，检测到概念漂移。

优选地，在所述步骤S2中：

当流程模型的fitness下降时：

定义最终允许的变迁集对：给定一个WF-netWN＝(P,T,F,W,M₀,M_F,l)和一个不满足WN的轨迹σ，m为满足

的最大整数；

其中，(P,T,F)是一个佩特里网，P是库所集合，T是变迁集合，

是有向弧集合，W是表示每一个有向边的权重，M₀是初始状态，M_F是结束状态，l是对每一个变迁指定的活动名称(标签)；

enabled(M_n)为最终允许的变迁集，表示为ET_WN(σ)；定义最终允许的变迁集对ETpair_WN(σ)＝(ET_WN(σ),ET_R(WN)(R(σ)))为一个二元组；

其中，ET_WN(σ)为轨迹σ在WF-netWN上的最终允许的变迁集，R(WN)为将WF-netWN中所有有向弧的方向反向得到的新的WF-net，R(σ)为轨迹σ的反向轨迹；ET_R(WN)(R(σ)))为轨迹R(σ)在WF-net R(WN)上的最终允许的变迁集；

将ETpair_WN(σ)精炼为ETpair_WN(σ)＝({t_a},{t_b})；

对概念漂移进行定位：

获得集合EV＝{C(et)|et∈ET}，为最终允许的变迁集ET中的元素对应于流程树PT中的节点构成的集合；

当|ET|>＝1,并且存在节点v∈CA(EV)，标签

此时待替换的节点v为满足如下条件的节点：v∈cA(EV)且标签/>

获得以待替换的节点v为根节点形成的子树PT<v>中包含的所有标签属于活动集合

的节点v′；发生概念漂移的变迁集合LT为这些节点v′对应于PN中的变迁C(v′)所构成的集合；形式化如下/>

CA(EV)为节点集合EV中元素的共同祖先，DOWN_PT(v)为流程树PT的根节点Root(PT)到节点v的最短路径上的节点序列，l(v′)为节点v′的标签；

当|ET|＝1并且

标签/>

此时待替换的节点v为ev₁∈EV，为EV中的唯一一个元素，发生漂移的变迁集合为LT＝ET；

当|ET|>1,并且

标签/>

并且l(LCA(EV))是∧或者×，此时待替换的节点v为LCA(EV)，发生漂移的变迁集合/>

LCA(EV)为节点集合EV中元素的最近共同祖先；

当|ET|>1,并且

标签/>

并且l(LCA(EV))＝→，令V′＝{v′|ev∈EV,DOWN_PT(ev)＝<…,LCA(EV),v′,…,ev>}，获得孩子节点序列CV＝<cv₁,…,v_n>←children(LCA(EV))，其中/>

找到最小索引minI满足cv_minI∈V′，找到最大索引maxI满足cv_maxI∈V′，获得CV的子序列CV′＝{cv_minI,cv_minI+1…,cv_maxI-1,cv_maxI}；

如果CV′＝CV,此时待替换的节点v为LCA(EV)，

如果

发生概念漂移的变迁集合/>

合并CV′中的所有节点为一个节点v,l(v)＝τ为此时待替换的节点v。

优选地，在所述步骤S3中：

利用流程发现技术生成新的流网，对在PT中发生漂移的子结构v替换为τ-node，获得流程树tPT；获得流程树对应的流网tWN；

利用tWN获得子日志subL规则如下：

a、找到最大的m满足：

b、找到最大的m′满足：

c、subL←∪_σ∈L{σ^{m+1,|σ|-m′}}；

subL为用于修复流程模型的相关子日志；

对subL中的异常轨迹进行过滤，使用inductive miner获得subL对应的流程树并对τ-node进行替换，得到修复后的流程模型。

优选地，在所述步骤S3中：

当流程模型的∧，

结构的precision的下降时，发生precision的下降的子结构可能存在多个，下降程度DD最大的子结构为发生概念漂移的子结构并修复流程模型；

当流程模型的×结构的precision的下降时，删除从来没有被发射的变迁修复流程模型。

根据本发明提供的一种在概念漂移下业务流程模型的自动和增量修复系统，包括：

模块M1：将每一个到达的轨迹在当前的流程模型上进行重放，并进行概念漂移检测；

模块M2：检测到概念漂移后，对概念漂移进行定位；

模块M3：替换流程模型的子结构修复流程模型。

优选地，在所述模块M1中：

当流程模型的precision或fitness下降时发生概念漂移：

模块M1.1：检测流程模型的fitness下降：

模块M1.2：检测流程模型的precision下降：

模块M1.2.1：检测∧，

结构的precision的下降：

为所有∧，

为发射序列T_σ在变迁集合T_subPT上的投影，DFRS(T)为获取变迁集合T的直接跟随关系集合；

模块M1.2.2：检测×结构的precision的下降：

优选地，在所述模块M2中：

当流程模型的fitness下降时：

的最大整数；

其中，(P,T,F)是一个佩特里网，P是库所集合，T是变迁集合，

其中，ET_WN(σ)为轨迹σ在WF-netWN上的最终允许的变迁集，R(WN)为将WF-netWN中所有有向弧的方向反向得到的新的WF-net，R(σ)为轨迹σ的反向轨迹；

ET_R(WN)(R(σ)))为轨迹R(σ)在WF-net R(WN)上的最终允许的变迁集；

将ETpair_WN(σ)精炼为ETpair_WN(σ)＝({t_a},{t_b})；

对概念漂移进行定位：

当|ET|>＝1,并且存在节点v∈CA(EV)，标签

此时待替换的节点v为满足如下条件的节点：v∈CA(EV)且标签/>

当|ET|＝1并且

标签/>

当|ET|>1,并且

标签/>

LCA(EV)为节点集合EV中元素的最近共同祖先；

当|ET|>1,并且

标签/>

并且l(LCA(EV))＝→，令V′＝{v′|ev∈EV,DOWN_PT(ev)＝<…,LCA(EV),v′,…,ev>}，获得孩子节点序列CV＝<cv₁,…,cv_n>←children(LCA(EV))，其中/>

如果CV′＝CV,此时待替换的节点v为LCA(EV)，

如果

发生概念漂移的变迁集合/>

优选地，在所述模块M3中：

利用tWN获得子日志subL规则如下：

a、找到最大的m满足：

b、找到最大的m′满足：

c、subL←∪_σ∈L{σ^{m+1,|σ|-m′}}；

subL为用于修复流程模型的相关子日志；

优选地，在所述模块M3中：

当流程模型的∧，

与现有技术相比，本发明具有如下的有益效果：

1、本发明着眼于在信息系统中存在概念漂移的情况下，自动更新业务流程模型，减少了人为修改流程模型的繁琐操作；

2、本发明能够使用户尽早地发现并理解流程的演变，保证企业的健康运行。

附图说明

通过阅读参照以下附图对非限制性实施例所作的详细描述，本发明的其它特征、目的和优点将会变得更明显：

图1为本发明的AIMED框架示意图；

图2为本发明的精炼允许的变迁集合对示意图；

图3为本发明的在流程模型的fitness下降时四种概念漂移定位的情况示意图。

图4为本发明的模型修复示意图。

具体实施方式

下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明，但不以任何形式限制本发明。应当指出的是，对本领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干变化和改进。这些都属于本发明的保护范围。

实施例1：

根据本发明提供的一种在概念漂移下业务流程模型的自动和增量修复方法，如图1-图4所示，包括：

具体地，在所述步骤S1中：

当流程模型的precision或fitness下降时发生概念漂移：

步骤S1.1：检测流程模型的fitness下降：

步骤S1.2：检测流程模型的precision下降：

步骤S1.2.1：检测∧，

结构的precision的下降：

为所有∧，

集合中的元素所构成的集合；将下降程度定义为R_5ubPT中的元素没有出现在

步骤S1.2.2：检测×结构的precision的下降：

步骤S2：检测到概念漂移后，对概念漂移进行定位；

具体地，在所述步骤S2中：

当流程模型的fitness下降时：

的最大整数；

其中，(P,T,F)是一个佩特里网，P是库所集合，T是变迁集合，

将ETpair_WN(σ)精炼为ETpair_WN(σ)＝({t_a},{t_b})；

对概念漂移进行定位：

当|ET|>＝1,并且存在节点v∈CA(EV)，标签

此时待替换的节点v为满足如下条件的节点：v∈CA(EV)且标签/>

当|ET|＝1并且

标签/>

当|ET|>1,并且

标签/>

LCA(EV)为节点集合EV中元素的最近共同祖先；

当|ET|>1,并且

标签/>

如果CV′＝CV,此时待替换的节点v为LCA(EV)，

如果

发生概念漂移的变迁集合/>

步骤S3：替换流程模型的子结构修复流程模型。

具体地，在所述步骤S3中：

利用tWN获得子日志subL规则如下：

a、找到最大的m满足：

b、找到最大的m′满足：

c、subL←∪_σ∈L{σ^{m+1,|σ|-m′}}；

subL为用于修复流程模型的相关子日志；

具体地，在所述步骤S3中：

当流程模型的∧，

实施例2：

实施例2为实施例1的优选例，以更为具体地对本发明进行说明。

本发明还提供一种在概念漂移下业务流程模型的自动和增量修复系统，所述在概念漂移下业务流程模型的自动和增量修复系统可以通过执行所述在概念漂移下业务流程模型的自动和增量修复方法的流程步骤予以实现，即本领域技术人员可以将所述在概念漂移下业务流程模型的自动和增量修复方法理解为所述在概念漂移下业务流程模型的自动和增量修复系统的优选实施方式。

具体地，在所述模块M1中：

当流程模型的precision或fitness下降时发生概念漂移：

模块M1.1：检测流程模型的fitness下降：

模块M1.2：检测流程模型的precision下降：

模块M1.2.1：检测∧，

结构的precision的下降：

为所有∧，

模块M1.2.2：检测×结构的precision的下降：

模块M2：检测到概念漂移后，对概念漂移进行定位；

具体地，在所述模块M2中：

当流程模型的fitness下降时：

的最大整数；

其中，(P,T,F)是一个佩特里网，P是库所集合，T是变迁集合，

将ETpair_WN(σ)精炼为ETpair_WN(σ)＝({t_a},{t_b})；

对概念漂移进行定位：

当|ET|>＝1,并且存在节点v∈CA(EV)，标签

此时待替换的节点v为满足如下条件的节点：v∈CA(EV)且标签/>

当|ET|＝1并且

标签/>

当|ET|>1,并且

标签/>

LCA(EV)为节点集合EV中元素的最近共同祖先；

当|ET|>1,并且

标签/>

如果CV′＝CV,此时待替换的节点v为LCA(EV)，

如果

发生概念漂移的变迁集合/>

模块M3：替换流程模型的子结构修复流程模型。

具体地，在所述模块M3中：

利用tWN获得子日志subL规则如下：

a、找到最大的m满足：

b、找到最大的m′满足：

c、subL←∪_σ∈L{σ^{m+1,|σ|-m′}}；

subL为用于修复流程模型的相关子日志；

具体地，在所述模块M3中：

当流程模型的∧，

实施例3：

实施例3为实施例1的优选例，以更为具体地对本发明进行说明。

一种概念漂移的自动检测方法，对于流程行为和模型之间的一致性而言，当流程模型的precision或fitness显著下降时，会发生概念漂移。

一种在概念漂移下业务流程模型的自动和增量修复方法：首先，每一个到达的轨迹都将在当前的流程模型上进行重放，并进行概念漂移检测的过程。第二步，在检测到概念漂移后，我们对概念漂移进行定位(即确定受概念漂移影响的子结构)，这对修复流程模型起到了关键作用。在第三步，替换流程模型的子结构以修复流程模型。我们将当前模型切换到修复后的模型，以支持对下一个概念漂移的检测。

对于流程模型fitness下降时，我们利用流程树，分为四种情况讨论得到概念漂移影响的子结构。当流程模型的precision下降时，则检测流程模型中导致precision下降的最小子结构作为概念漂移影响的子结构。

对概念漂移影响的子结构，提取相应的子日志，并使用流程发现算法发现新的流程模型，对原有子结构进行替换，得到修复后的流程模型。

定义了子结构的precision下降程度：给定一个日志L以及WF-net中的一个子结构subPT，R_subPT为所有可能出现在

集合中的元素所构成的集合。我们将下降程度定义为R_subPT中的元素没有出现在/>

中的元素的个数与R_subPT中的元素的个数比例。公式如下所示

实施例4：

实施例4为实施例1的优选例，以更为具体地对本发明进行说明。

本发明公开了一种在概念漂移下业务流程模型的自动和增量修复方法——AIMED。包括：AIMED简化了概念漂移的检测、定位和定性的功能。更具体地说，它通过精确地定位概念漂移所影响的流程模型的子结构并相应地更新这个子结构，及时地自动修复流程模型。特别是，AIMED可以抵抗极大地影响当前概念漂移技术性能的噪声。本发明着眼于在信息系统中存在概念飘移的情况下，自动更新业务流程模型，减少了人为修改流程模型的繁琐操作，并且能够使用户尽早地发现并理解流程的演变，保证企业的健康运行。

有鉴于此，本发明的目的是提供一种在概念漂移下业务流程模型的自动和增量修复方法，用于弥补现有技术的不足。该方法利用现有的流程模型检测系统中发生的概念漂移。当概念漂移发生时，对这个与当前实际流程不一致的模型进行修复。

为解决上述技术问题，本发明的技术方案如下：

本发明的事件日志的特征是：

是一组活动。一个轨迹σ＝<e¹,e²,…,e^|σ|>是个活动序列,|σ|是轨迹的长度。轨迹σ_i的子轨迹是/>

σ_i的反向轨迹是

表示一个事件日志，它是轨迹的集合。|L|表示事件日志L中含有轨迹的个数。

本发明的流程模型：Accepting Petri net是一个七元组PN＝(P,T,F,W,M₀,M_F,l)。其中(P,F,F)是一个petri net，P是库所集合，T是变迁集合，

是有向弧集合。W是表示每一个有向边的权重。M₀是初始状态。M_F是结束状态。l是对每一个变迁指定的活动名称(标签)。

本发明的流程模型：WF-net WN，它是特殊的Accepting Petri net。当AcceptingPetri net满足如下两个条件时，被称为WF-net：1.仅有一个开始库所并且仅有一个终止库所；2.每一个节点都在开始库所和终止库所的路径上。如果一个变迁t∈T的输入库所有足够的令牌，那么变迁将发射。enabled(M)表示状态M时所有被允许的变迁(可以被发射)。R(WN)为将WF-net WN中所有有向弧的方向反向得到的新的WF-net。

本发明的变迁的发射规则：变迁t∈T的发射产生新的状态M，它从每个输入库所消耗W(p,t)个令牌，并产生W(t,p)个令牌到输出库所。根据变迁的发射规则，我们有：

表示变迁t在状态M₁被允许，并且变迁t发射，状态M₁变为状态M₂。/>

表示一个发射序列/>

的发射使状态M₁变为状态M_n。发射序列的标签

如果有一个发射序列T_σ,l(T_σ)＝σ，满足/>

我们称轨迹σ满足WN，表示为/>

否则/>

本发明使用的流程树的特征是：

是一组操作标签，流程树PT按如下方式定义：1.一个活动节点是流程树，其中活动节点的标签，满足/>

2.⊕(PT₁，...PT_n)，是一个流程树，其中⊕是操作节点，满足/>

PT_i是该流程树的节点。对于一个流程树PT，包含节点和边的集合分别用V(PT)和E(PT)表示。流程树PT的根节点用Root(PT)表示。我们用PT<v>表示以v∈V(PT)为根的PT的子树。对于PT中的每个非根节点v，让/>

是节点Root(PT)到v的最短路径上的节点序列，DOWN_PT(v)中在v前面的节点称为PT中v的祖先。对于PT中的节点v₁,…,v_n，DOWN_PT(v₁)∩…∩DOWN_PT(v_n)中的任意一个节点，都是他们的共同祖先(CA)。我们将最近共同祖先(LCA)定义为最深的共同祖先，并用LCA(v₁,…,v_n)来表示它。节点v的父节点序列为parents(v)，每个节点v∈V(PT)，满足|parents(v)|<＝1，|parents(root(PT))|＝0。节点v的子节点序列是children(v)。具有相同父节点的节点被称为兄弟节点.

本发明中流程树和WF-net的对应关系：一个流程树对应于一个WF-net，反之亦然。给定一个WF-net，WN＝(P,T,F,W,M₀,M_F,l)及其对应的流程树PT，每个变迁t∈T,l(t)≠τ，在V(PT)中有其相应的活动节点，表示为C(t)∈V(PT)。在V(PT)中的每个活动节点v∈V(PT),l(v)≠τ，在变迁集合T中都有其相应的变迁，表示为C(v)∈T。有以下属性成立：i)∈V(PT),l(v)一定等于l(C(v))；ii)但当t∈T,v∈V(PT),l(t)＝l(v):C(t)可能不等于v，C(v)可能不等于t。这是因为WN的两个或多个变迁和PT的两个或多个活动节点共享同一个标签。

本发明中的∧结构：对于一个WF-netWN以及它对应的流程树，如果存在某一节点v∈V(PT)，并且l(v)＝∧，此时我们称子树PT<v>为流程树的一个∧结构，也可称为相应WF-netWV的一个∧结构。同理我们有

结构；×结构；→结构。对于一个∧结构，定义它的变迁集合/>

结构；×结构；→结构也有相同的定义。

本发明的目标是，当信息系统中发生概念漂移时，及时报告概念漂移发生时间，并根据概念漂移后的日志修复流程模型，让用户了解的当前的实际流程，有助于企业的健康运行。

本发明的在概念漂移下业务流程模型的自动和增量修复方法如下(如图1所示)：

首先需要检测出概念漂移，我们需要同时检测：1.流程模型的fitness下降；2.流程模型中∧，

结构的precision的下降；3.流程模型中×结构的precision的下降。当出现如上三种情况时我们认为发生了概念漂移。/>

第二步，当概念漂移发生时，我们对概念漂移进行定位(即确定受概念漂移影响的子结构)。

在第三步，替换流程模型的子结构以修复流程模型。我们将当前模型切换为修复后的模型，以支持对下一个概念漂移的检测。

实施例5：

实施例5为实施例1的优选例，以更为具体地对本发明进行说明。

本发明的在概念漂移下业务流程模型的自动和增量修复方法如下：

1.1首选需要检测出概念漂移，检测流程模型的fitness下降：在窗口大小为WindowSize的最近轨迹序列中，所有不满足当前流程模型的跟踪都被过滤出来。如果不满足当前流程模型的轨迹数量超过windowSize*α，我们认为流程发生了概念漂移。α的值对检测的性能有影响。当α取小值时，检测将更加敏感，并可能导致错误警报。相反，给α分配一个较大的值，可以确保检测算法抵御噪声的影响，但它对概念漂移的敏感度较低。

检测流程模型的precision下降：对于一个WF-net,→结构改变时，一定不会导致precision的下降，因为它只允许一种行为。

结构发生改变时，有可能会导致precision的下降，例如∧结构变为→结构；/>

结构变为→结构；×结构中某一分支被删除等。其中，→、/>

均为流程树中常用的操作符号。

1.2检测∧，

结构的precision的下降：我们需要为所有∧，/>

结构中的每个不稳定的子结构subPT初始化一组直接跟随关系R_subPT。初始化过程的基本思路是记录所有可能出现在R_subPT中的直接跟随关系。当一段时间后没有新的直接跟随关系加入到R_subPT中时，则subPT是稳定的，否则，新的直接跟随关系将被添加到R_subPT中。一旦所有结构都是稳定的，我们就可以检查∧或/>

结构的precision是否下降。我们定义子结构的precision下降程度：给定一个日志L以及WF-net中的一个子结构subPT，R_subPT为所有可能出现在

中的元素的个数与R_subPT中的元素的个数比例。公式如下所示：

其中π为投影操作。当我们检测到存在至少一个子结构的DD不为0时，我们并不是马上报告概念漂移的发生，而是当这些结构的下降程度DD超过SP次以上不再变化,并且最大的下降程度DD超过阈值时(如果下降程度过小，可能是由于模型允许的行为过多而windowSize设置较小导致的，此阈值在一定程度上能缓解这种情况造成的后果)，再报告检测到概念漂移。

1.3检测×结构的precision的下降：我们为检测这种情况的发生，仅需要观察过去windowSize个满足流程模型的轨迹的发射序列包含的所有变迁构成的集合中，是否和WF-net的变迁集合T一致。如果不一致，说明存在某些×结构中某些分支被弃用，检测到概念漂移。

接下来需要修复流程模型。

2.1当流程模型的fitness下降时，修复包括三个步骤。第一步是获得最终允许的变迁集对。第二步是对概念漂移进行定位。最后，生成一个新的WF-net。

我们定义最终允许的变迁集对：给定一个WF-netWN＝(P,T,F,W,M₀,M_F,l)和一个不满足wN的轨迹σ，让m为满足

的最大整数。其中，(P,T,F)是一个petrinet，P是库所集合，T是变迁集合，/>

此时，enabled(M_n)被称为最终允许的变迁集，表示为ET_WN(σ)。那么我们也可以定义最终允许的变迁集对ETpair_WN(σ)＝(ET_WN(σ),ET_R(WN)(R(σ)))，它是一个二元组。

其中，ET_WN(σ)为轨迹σ在WF-netWN上的最终允许的变迁集，R(WN)为将WF-netWN中所有有向弧的方向反向得到的新的WF-net，R(σ)为轨迹σ的反向轨迹；ET_R(WN)(R(σ)))为轨迹R(σ)在WF-net R(WN)上的最终允许的变迁集。

并不是所有ETpair的ET中的变迁都是有意义的。考虑图2a中的WN和ETpair_WN(σ)＝({t_a,…,t_a+k},{t_b})，不难看出，轨迹σ已经选择执行了Branch 1，没有经过其他分支，如Branch k。因此，在ET_WN(σ)＝{t_a,…,t_a+k}中，除了t_a之外的所有变迁都是无意义的。所以我们将ETpair_WN(σ)可以精炼为ETpair_WN(σ)＝({t_a},{t_b})。

ETpair精炼算法如下所示

第二步，我们需要对概念漂移进行定位：有4种情况需要考虑。为了完成这个任务，我们首先获得集合EV＝{C(et)|et∈ET}，也就是最终允许的变迁集ET中的元素对应于流程树PT中的节点构成的集合。

情况1(如图3a所示)：当|ET|>＝1,并且存在节点v∈CA(EV)它的标签

此时待替换的节点v为满足如下两个条件的节点：1.v∈CA(EV)它的标签/>

2.

也就是说v是所有满足条件1的节点中最接近根节点的节点。我们获得以待替换的节点v为根节点形成的子树PT<v>中包含的所有标签属于活动集合

的节点v′。发生概念漂移的变迁集合LT为这些节点v′对应于PN中的变迁C(v′)所构成的集合。形式化如下/>

情况2(如图3b所示)：当|ET|＝1并且

它的标签/>

此时待替换的节点v为ev₁∈EV也就是说是EV中的唯一一个元素。发生漂移的变迁集合为LT＝ET。

情况3(如图3c所示)：当|ET|>1,并且

它的标签/>

并且l(LCA(EV))是∧或者×。此时待替换的节点v为LCA(EV)。发生漂移的变迁集合LT与情况1相同：

LCA(EV)为节点集合EV中元素的最近共同祖先；

情况4(如图3d所示)：当|ET|>1,并且

它的标签/>

并且l(LCA(EV))＝→。令V′＝{v′|ev∈EV,DOWN_PT(ev)＝<…,LCA(EV),v′,…,ev>}。我们获得孩子节点序列CV＝<cv₁,…,cv_n>←children(LCA(EV))。很明显/>

找到最小索引minI满足cv_minI∈V′，找到最大索引maxI满足cv_maxI∈V′，然后我们获得CV的子序列CV′＝{cv_minI,cv_minI+1…,cv_maxI-1,cv_maxI}。此时我们仍然需要分两种情况讨论：1.如果CV′＝CV,此时待替换的节点v为LCA(EV)，在图3d中用红色矩形标出。发生漂移的变迁集合LT与情况1相同：

2.如果/>

那么发生概念漂移的变迁集合/>

合并CV′中的所有节点(在图3d中用蓝色矩形标出)为一个节点v,让l(v)＝τ作为此时待替换的节点v。

生成新的WF-net需要利用流程发现技术(具体过程如图4所示)。基本思想是对在PT中发生漂移的子结构v替换为τ-node，获得流程树tPT。获得流程树对应的WF-net tWN。利用tWN获得子日志subL规则如下：1.找到最大的m满足

2.找到最大的m′满足

3.subL←∪_σ∈L{σ^{m+1,|σ|-m′}}。

subL为用于修复流程模型的相关子日志

由于考虑异常轨迹的出现，可以对subL中的异常轨迹进行过滤。最后，我们使用inductive miner来获得subL对应的流程树并对τ-node进行替换，此时得到的模型即为修复后的流程模型。

2.2当流程模型的∧，

结构的precision的下降时，发生precision的下降的子结构可能存在多个，我们认为下降程度DD最大的子结构为发生概念漂移的子结构。接下来我们使用与2.1节介绍的生成新的WF-net的方式，即可修复流程模型。

2.3当流程模型的×结构的precision的下降时，我们仅需要删除从来没有被发射的变迁即可修复流程模型。

本领域技术人员知道，除了以纯计算机可读程序代码方式实现本发明提供的系统、装置及其各个模块以外，完全可以通过将方法步骤进行逻辑编程来使得本发明提供的系统、装置及其各个模块以逻辑门、开关、专用集成电路、可编程逻辑控制器以及嵌入式微控制器等的形式来实现相同程序。所以，本发明提供的系统、装置及其各个模块可以被认为是一种硬件部件，而对其内包括的用于实现各种程序的模块也可以视为硬件部件内的结构；也可以将用于实现各种功能的模块视为既可以是实现方法的软件程序又可以是硬件部件内的结构。

以上对本发明的具体实施例进行了描述。需要理解的是，本发明并不局限于上述特定实施方式，本领域技术人员可以在权利要求的范围内做出各种变化或修改，这并不影响本发明的实质内容。在不冲突的情况下，本申请的实施例和实施例中的特征可以任意相互组合。

Claims

1.一种在概念漂移下业务流程模型的自动和增量修复方法，其特征在于，包括：

步骤S2：检测到概念漂移后，对概念漂移进行定位；

步骤S3：替换流程模型的子结构修复流程模型。

2.根据权利要求1所述的在概念漂移下业务流程模型的自动和增量修复方法，其特征在于，在所述步骤S1中：

当流程模型的precision或fitness下降时发生概念漂移：

步骤S1.1：检测流程模型的fitness下降：

步骤S1.2：检测流程模型的precision下降：

步骤S1.2.1：检测∧，

结构的precision的下降：

为所有∧，

步骤S1.2.2：检测×结构的precision的下降：

3.根据权利要求1所述的在概念漂移下业务流程模型的自动和增量修复方法，其特征在于，在所述步骤S2中：

当流程模型的fitness下降时：

定义最终允许的变迁集对：给定一个WF-net WN＝(P，T，F，W，M₀，M_F，l)和一个不满足WN的轨迹σ，m为满足

的最大整数；

其中，(P，T，F)是一个佩特里网，P是库所集合，T是变迁集合，

enabled(M_n)为最终允许的变迁集，表示为ET_WN(σ)；定义最终允许的变迁集对ETpair_WN(σ)＝(ET_WN(σ)，ET_R(WN)(R(σ)))为一个二元组；

其中，ET_WN(σ)为轨迹σ在WF-net WN上的最终允许的变迁集，R(WN)为将WF-net WN中所有有向弧的方向反向得到的新的WF-net，R(σ)为轨迹σ的反向轨迹；ET_R(WN)(R(σ)))为轨迹R(σ)在WF-netR(WN)上的最终允许的变迁集；

将ETpair_WN(σ)精炼为ETpair_WN(σ)＝({t_a}，{t_b})；

对概念漂移进行定位：

当|ET|＞＝1，并且存在节点v∈CA(EV)，标签

此时待替换的节点v为满足如下条件的节点：v∈CA(EV)且标签/>

当|ET|＝1并且

标签/>

当|ET|＞1，并且

标签/>

LCA(EV)为节点集合EV中元素的最近共同祖先；

当|ET|＞1，并且

标签/>

并且l(LCA(EV))＝→，令V′＝{v′|ev∈EV,DOWN_PT(ev)＝<…，LCA(EV)，v′，...，ev>}，获得孩子节点序列CV＝<cv₁，...，cv_n>←children(LCA(EV))，其中/>

找到最小索引minI满足cv_minI∈V′，找到最大索引maxI满足cv_maxI∈V′，获得CV的子序列CV′＝{cv_minI，cv_minI+1…，cv_maxI-1，cv_maxI}；

如果CV′＝CV，此时待替换的节点v为LCA(EV)，

如果

发生概念漂移的变迁集合/>

合并CV′中的所有节点为一个节点v，l(v)＝τ为此时待替换的节点v。

4.根据权利要求1所述的在概念漂移下业务流程模型的自动和增量修复方法，其特征在于，在所述步骤S3中：

利用tWN获得子日志subL规则如下：

a、找到最大的m满足：

b、找到最大的m′满足：

c、subL←∪_σ∈L{σ^m+1，|^σ|-m′}；

subL为用于修复流程模型的相关子日志；

5.根据权利要求1所述的在概念漂移下业务流程模型的自动和增量修复方法，其特征在于，在所述步骤S3中：

当流程模型的∧，

6.一种在概念漂移下业务流程模型的自动和增量修复系统，其特征在于，包括：

模块M2：检测到概念漂移后，对概念漂移进行定位；

模块M3：替换流程模型的子结构修复流程模型。

7.根据权利要求6所述的在概念漂移下业务流程模型的自动和增量修复系统，其特征在于，在所述模块M1中：

当流程模型的precision或fitness下降时发生概念漂移：

模块M1.1：检测流程模型的fitness下降：

模块M1.2：检测流程模型的precision下降：

模块M1.2.1：检测∧，

结构的precision的下降：

为所有∧，

模块M1.2.2：检测×结构的precision的下降：

8.根据权利要求6所述的在概念漂移下业务流程模型的自动和增量修复系统，其特征在于，在所述模块M2中：

当流程模型的fitness下降时：

的最大整数；

enabled(M_n)为最终允许的变迁集，表示为ET_WN(σ)；定义最终允许的变迁集对ETpair_WN(σ)＝(ET_WN(σ)，ETR_(WN)(R(σ)))为一个二元组；

将ETpair_WN(σ)精炼为ETpair_WN(σ)＝({t_a}，{t_b})；

对概念漂移进行定位：

当|ET|＞＝1，并且存在节点v∈CA(EV)，标签

此时待替换的节点v为满足如下条件的节点：v∈CA(EV)且标签/>

当|ET|＝1并且

标签/>

当|ET|＞1，并且

标签/>

LCA(EV)为节点集合EV中元素的最近共同祖先；

当|ET|＞1，并且

标签/>

找到最小索引minI满足cv_minI∈V′，找到最大索引maxI满足cv_maxI∈V′，获得CV的子序列CV′＝{cv_minI，cv_minI+1...，cv_maxI-1，cv_maxI}；

如果CV′＝CV，此时待替换的节点v为LCA(EV)，

如果

发生概念漂移的变迁集合/>

9.根据权利要求6所述的在概念漂移下业务流程模型的自动和增量修复系统，其特征在于，在所述模块M3中：

利用tWN获得子日志subL规则如下：

a、找到最大的m满足：

b、找到最大的m′满足：

c、subL←∪_σ∈L{σ^{m+1，|σ|-m′}}；

subL为用于修复流程模型的相关子日志；

10.根据权利要求6所述的在概念漂移下业务流程模型的自动和增量修复系统，其特征在于，在所述模块M3中：

当流程模型的∧，