CN110046820A

CN110046820A - 基于结构替换的流程模型修复方法

Info

Publication number: CN110046820A
Application number: CN201910306217.8A
Authority: CN
Inventors: 杜玉越; 徐玉华; 栾文静; 亓亮; 张福新; 王路; 田银花
Original assignee: Shandong University of Science and Technology
Current assignee: Shandong University of Science and Technology
Priority date: 2019-04-17
Filing date: 2019-04-17
Publication date: 2019-07-23
Anticipated expiration: 2039-04-17
Also published as: WO2020211295A1; US20210049147A1; CN110046820B

Abstract

本发明公开了一种基于结构替换的流程模型修复方法。首先，通过重新定义活动之间的次序关系，可以得到事件日志和模型的两个次序关系集，并得到一个记录事件日志与模型之间差异的偏差集；然后根据偏差集对模型进行修复。对于选择结构或顺序结构，本发明可以根据给定的事件日志将其更改为并发结构。用逻辑Petri网表示的修复模型能够准确反映活动之间的逻辑关系。通过仿真实验将本发明方法与其他模型修复方法进行了比较。实验结果表明，本发明方法修复的流程模型具有较高的精确度，使得流程模型能够正确地反映实际的业务流程，并提高业务流程的执行效率，用逻辑Petri网表示的模型具有较好的简洁度。

Description

基于结构替换的流程模型修复方法

技术领域

本发明涉及一种基于结构替换的流程模型修复方法。

背景技术

近年来，企业信息系统在实现业务流程方面变得越来越重要。随着企业信息系统的广泛应用，产生了大量的事件日志，事件日志中包含多条迹，每条迹对应业务流程的一次执行。流程挖掘技术可以根据事件日志来发现、检测、验证和改进实际的业务流程。流程挖掘主要有三个功能：流程发现、一致性检查和流程增强。流程发现可以根据企业信息系统中产生的事件日志，为常见的业务流程构建出相应的流程模型。近年来，许多关于流程挖掘的算法被提出。例如Aalst等人设计的α算法，根据活动之间的次序关系构建模型，然而它不能有效地获得包含重复活动、不可见转换或某些复杂结构的模型，因此出现了α算法的许多变形。判断一个流程模型的质量主要从以下四个指标来衡量：拟合度、简洁度、精确度和泛化度。其中，拟合度作为最重要的指标，意味着模型可以重演事件日志中的所有迹；精确度表示模型不允许在事件日志中无法观察到的行为出现；简洁度要求能够重演事件日志的模型尽可能简单；泛化度是指模型不局限于日志中所见的行为。一致性检查将日志在模型上进行重演来发现它们之间的差异，现有的一致性检查方法主要包括校准、托肯重演和足迹对比。流程增强将事件日志和流程模型作为输入数据，它的输出是一个扩展模型。当业务流程随着时间的推移发生改变时，与之相对的流程模型还没有得到更新，此时可以使用流程发现算法来挖掘新的模型。然而，新模型与原模型的相似度往往较低。因此，一个比较好的方法是修复原模型，使其能够重演事件日志并准确地表达实际的业务流程。现有的方法基于事件日志和模型之间的差异来修复模型。例如，Fahland方法首先根据最优校准找到事件日志和模型之间的偏差，收集出不拟合的子日志，然后挖掘相应的子流程，将其作为自环添加到原模型的适当位置，或在原模型中添加一个可以重演该子日志的循环。Goldratt方法关注的是修复流程模型所消耗的资源，该方法通过两种类型的操作来修复模型：跳过一个活动或将单个活动以自环的形式添加到原模型中。以上两种方法得到的修复模型均具有较高的拟合度，然而自环的出现降低了模型的精确度，不能正确地反映实际的业务流程。当业务流程中的部分流程发生变化时，即事件日志中某些活动之间的关系不能被相应的子模型描述时，应该使用一个正确的子模型来代替原来的子模型。此外，传统的Petri网无法表示日志中某些活动间的特殊关系。由此可见，利用现有的修复方法得到的模型较为复杂，且不能反映活动间的逻辑关系，因而实际的业务流程无法被流程模型正确地表达，因而当业务流程更新(或者发生变化)后，其被执行效率明显降低，增加了业务办理人员的时间。

发明内容

本发明的目的在于提出一种基于结构替换的流程模型修复方法，以提高流程模型的修复精确度，从而使得到的流程模型能正确表达实际的业务流程。

本发明为了实现上述目的，采用如下技术方案：

基于结构替换的流程模型修复方法，包括如下步骤：

第I步：通过重新定义活动之间的顺序关系，得到事件日志和模型的两个次序关系集，并得到一个记录事件日志与模型之间差异的偏差集：

随着实际情况的变化，业务流程会发生变化；此时，需要将原流程模型和由实际业务流程产生的事件日志进行一致性检查；

如果流程模型与事件日志不一致，则发现偏差；

下面提出一种基于扩展次关系的事件日志与流程模型之间所有偏差的收集方法；

为了准确识别事件日志中活动之间的一些关系，提出以下概念：

定义扩展的次序关系

设集合是一个事件日志，且σ∈L是的一条迹；

对于任意的活动a，b∈σ，有：

(1)跟随关系>：a>b当且仅当σ[i+1]＝b，1≤i<|σ|；

(2)因果关系→：a→b当且仅当且

其中，&(σ)表示迹σ中所有活动构成的集合；

(3)选择关系×：a×b当且仅当且或b∈&(σ)且

(4)普通并发关系||：a||b当且仅当对a,b∈&(σ₁)：a>b且对a,b∈&(σ₂)：b>a；

(5)逻辑并发关系∨：a∨b当且仅当对σ₁,σ₂∈L：a||b，对σ₃∈L：a∈&(σ₃)且或b∈&(σ₃)且其中，σ₁,σ₂,σ₃表示事件日志L中的迹；

定义日志次序集

设是一个符号集；

被称作是一个日志次序集，其中表示活动a和b之间的次序关系；

定义模型次序集

设PN＝(P,T；F,M)是一个Petri网，是一个完全触发序列集，是一个符号集；是一个模型次序集；

其中，表示t_i和t_j基于S_PN的次序关系；

定义逻辑模型次序集

设LPN＝(P,T；F,I,O,M)是一个逻辑Petri网，是一个完全触发序列集，是一个符号集；是一个逻辑模型次序集；

其中，表示t_i和t_j基于S_LPN的次序关系；

根据以上定义，下面给出从事件日志L中获取日志次序集的方法，过程如下：

方法1扩展的次序关系产生方法

步骤1：输入完备的事件日志令

其中，R表示一个集合；

步骤2：对任意的σ∈L满足：a_i∈σ，1≤i<|σ|，若R＝R∪{a_i＞a_i-1}；

步骤3：若R中的任意元素满足：且则

步骤4：若R中的任意元素满足：a∈&(σ)且或者且b∈&(σ)，则R_L＝R_L∪{a×b}；

步骤5：若R中的任意元素满足：a＞b，b＞a，且对任意的σ∈L有：a,b∈&(σ)，则R_L＝R_L∪{a||b}；

步骤6：若R中的任意元素满足：a＞b，b＞a，且存在σ∈L有：a∈&(σ)且或者且b∈&(σ)，则R_L＝R_L∪{a∨b}；

其中，a＞b，b＞a表示活动a和b是并发关系；

步骤7：得到日志次序集R_L；

其中，日志次序集R_L记录了事件日志L中所有活动间的次序关系；

按照方法1的原理，将每个步骤中的事件日志L换成完全触发序列集S_PN，即可生成Petri网的模型次序集R_M；

其中，Petri网的模型次序集R_M记录了Petri网模型PN中所有变迁间的关系；

通过比较R_L和R_M，能够发现日志L和Petri网模型PN之间的所有偏差；

定义偏差集

设R_D是一个偏差集，其中：

(1)当且仅当并且

(2)当且仅当并且

(3)当且仅当只

(4)当且仅当

其中，符号R_D(a)表示R_D中包含a的元素个数；

由以上定义可知，偏差集R_D记录的是事件日志和模型中不同的次序关系；

方法2偏差集的生成方法

步骤1：输入日志次序集R_L和模型次序集R_M，令偏差集

步骤2：对任意的若存在则

步骤3：对任意的若存在则

步骤4：对任意的若不存在且不存在则

步骤5：对任意的若不存在则

步骤6：得到日志和模型间的偏差集R_D；

第II步：基于偏差集将相应的顺序结构或选择结构修复成并发结构，完成对模型的修复；

第II.1：基于选择结构的模型修复

步骤1：输入完备事件日志L和Petri网PN＝(P,T；F,M)；定义修复后的逻辑Petri网模型LPN′＝(P′,T′；F′,I′,O′,M′)，令

步骤2：调用扩展的次序关系产生方法得到日志次序集R_L和模型次序集R_M；

步骤3：调用偏差集的生成方法得到偏差集R_D；

步骤4：对任意的a∨b|a×b∈R_D：若或则R_D′＝R_D′∪{R_D-a∨b|a×b}；

步骤5：对任意的a∨b|a×b∈R_D′，若则判断R_D(a)和R_D(b)的大小；

若R_D(a)≥R_D(b)，则此时活动a是一个偏差活动，令t_o＝^·(^·a)∩^·(^·b)为一个逻辑输出变迁，P′＝P′∪{p_o}且p_o＝^·a，F′＝F′-{^·b→a}∪{t_o→p_o,p_o→a}，O′＝O′∪{O′(t_o)＝p_o∨^·b}；

若R_D(b)≥R_D(a)，则此时活动b是一个偏差活动，令t_o＝^·(^·a)∩^·(^·b)为一个逻辑输出变迁，P′＝P′∪{p_o}且p_o＝^·b，F′＝F′-{^·a→b}∪{t_o→p_o,p_o→b}，O′＝O′∪{O′(t_o)＝p_o∨^·a}；

步骤6：对任意的a∨b|a×b∈R_D′，若则判断R_D(a)和R_D(b)的大小；

若R_D(a)≥R_D(b)，则此时活动a是一个偏差活动，令t_i＝(a^·)^·∩(b^·)^·为一个逻辑输入变迁，P′＝P′∪{p_i}且p_i＝a^·，F′＝F′-{a→b^·}∪{a→p_i,p_i→t_i}，I′＝I′∪{I′(t_i)＝p_i∨b^·}；

若R_D(b)≥R_D(a)，则此时活动b是一个偏差活动，令t_i＝(a^·)^·∩(b^·)^·为一个逻辑输入变迁，P′＝P′∪{p_i}且p_i＝b^·，F′＝F′-{b→a^·}∪{b→p_i,p_i→t_i}，I′＝I′∪{I′(t_i)＝p_i∨a^·}；

步骤7：得到基于选择结构的修复模型LPN′；

利用修复后的流程模型去执行更新后的业务流程，使得更新后的业务流程得到正确表达；

第II.2：基于顺序结构的模型修复

步骤1：输入完备事件日志L和Petri网PN＝(P,T；F,M)；定义修复后的逻辑Petri网模型LPN″＝(P″,T″；F″,I″,O″,M″)；令

步骤3：调用偏差集的生成方法得到偏差集R_D；

步骤4：对任意的a∨b|a→b∈R_D：F″＝F″-{a^·→b}；

步骤5：对任意的a→b|φ∈R_D，若存在b∨c|φ∈R_D且a＝^◆b∩^◆c，a＝^·(^·c)，则：

P″＝P″∪{p_o}(p_o＝^·b)，F″＝F″∪{a→p_o,p_o→b}，O″＝O″∪{O″(a)＝^·b∨^·c}；

步骤6：对任意的a→b|φ∈R_D，若存在a∨c|a→c∈R_D且b＝a^◆∩c^◆，b＝(c^·)^·，则：

F″＝F″∪{a^·→b}，I″＝I″∪{I″(b)＝a^·∨c^·}；

其中，a、b、c表示不同的活动名；

步骤7：得到基于顺序结构的修复后的模型LPN″；

利用修复后的流程模型去执行更新后的业务流程，使得更新后的业务流程得到正确表达。

本发明具有如下优点：

本发明方法通过重新定义活动之间的次序关系，对比了事件日志和模型的次序关系集，得到偏差集，然后根据偏差集，找到偏差发生的位置，将模型中的选择结构或顺序结构修复成并发结构，通过在模型中添加逻辑表达式，将传统的Petri网转换为逻辑Petri网，基于逻辑Petri网的修复模型可以重演事件日志，并且能够准确表达活动之间的关系，使得到的流程模型能够正确表达实际的业务流程，从而提高实际业务流程的被执行效率。

附图说明

图1为逻辑Petri网模型LPN₁示意图；

图2为Petri网模型PN₁示意图；

图3为基于本发明方法得到的修复模型LPN′示意图；

图4为Petri网模型PN₂示意图；

图5为基于本发明方法得到的修复模型LPN″示意图；

图6为肿瘤患者的治疗流程模型示意图；

图7为利用Fahland方法修复的患者治疗流程模型示意图；

图8为利用Goldratt方法修复的患者治疗流程模型示意图；

图9为利用本发明方法修复的患者治疗流程模型示意图；

图10为本发明方法与Fahland、Goldratt方法相比拟合度变化曲线图；

图11为本发明方法与Fahland、Goldratt方法相比精确度变化曲线图。

具体实施方式

本发明的基本思想为：提出一种新的模型修复方法，它以事件日志和模型作为输入，如果模型符合日志，就没有必要修复模型。如果模型不能重演事件日志，则需要根据一致性检查的结果进行模型修复。与流程发现不同，模型修复将模型中能够重演事件日志的部分保留下来，这确保了修复后的模型与原模型之间的相似性。

下面结合附图以及具体实施方式对本发明作进一步详细说明：

Petri网能够描述和分析具有并发、异步、分布和不确定性的信息系统。逻辑Petri网作为Petri网的扩展，可以提高模型拟合度和精确度。

下面简要介绍Petri网和逻辑Petri网的基本定义。

基于结构替换的流程模型修复方法，包括如下步骤：

定义多重集

S表示一个集合，集合S上的多重集D是一个映射D：S→N₊，N₊表示一个正整数集合。B(S)表示集合S上的所有多重集的集合。

定义迹、事件日志

设A是所有活动的集合，若活动序列σ∈A^*，A^*表示集合A上有限序列的集合，则称σ是一条迹。若L∈B(A^*)是迹的一个多重集，则称L为一个事件日志。

用&(σ)表示迹σ中所有活动构成的集合。

定义元素位置

设v＝(a₁,a₂,···,a_n)是一个n元组，其中a_i∈S且1≤i≤n，则v[i]＝a_i表示v的第i个元素。

例如，v＝(a,b)且a,b∈S，则v[1]＝a，v[2]＝b。

定义前活动集、后活动集

设A表示所有活动的集合，L∈B(A^*)是一个事件日志，e∈A是L的一个活动；

称^◆e为e的前活动集，e^◆为e的后活动集。其中，a表示迹σ中的一个活动。

定义前集、后集

设N＝(P,T；F)为一个网，其中，P是有限个库所的集合，T是有限个变迁的集合，是网N的有限弧集合。对于令

^·x＝{y|y∈P∪T∧(y,x)∈F}，x^·＝{y|y∈P∪T∧(x,y)∈F}；

称^·x为x的前集或输入集，x^·为x的后集或输出集。其中，y表示一个库所或变迁。

定义Petri网

一个四元组PN＝(P,T；F,M)称作Petri网，当且仅当

(1)N＝(P,T；F)为一个网；

(2)映射M：P→N₊，M称为网N的一个标识，其中，M_i为初始标识，M_f为终止标识；

(3)变迁发生规则：

1)对变迁t∈T，如果则称变迁t在标识M下使能，记为M[t>；

2)若M[t>，则在标识M下，变迁t可以发生，从标识M引发变迁t得到一个新的标识M′，记为M[t>M′，且对有：

从M可达的一切标识的集合记为R(M)，约定M∈R(M)。

定义完全触发序列

设PN＝(P,T；F,M)是一个Petri网，序列s∈T*被称作是一个完整触发序列，当且仅当M_o[s>M_f。一个完全触发序列集包含了PN中所有的触发序列。

其中，T*表示集合T上有限序列的集合；

M_o[s>M_f表示序列s中的所有变迁在标识M_o下可依次被触发，并得到最终标识M_f。

定义逻辑Petri网

一个六元组LPN＝(P,T；F,I,O,M)称作逻辑Petri网，其中：

(1)P是一个有限库所集；

(2)T＝T_I∪T_O∪T_D是一个有限变迁集，若t∈T_I∩T_O，则其中：

1)T_I表示逻辑输入变迁集，对t的输入库所^·t受逻辑表达式f_I(t)的限制；

2)T_O表示逻辑输出变迁集，对t的输出库所t^·受逻辑表达式f_O(t)的限制；

3)T_D表示传统Petri网中变迁集；

(3)是一个有限弧集；

(4)I表示逻辑输入变迁到逻辑输入函数的映射，对有I(t)＝f_I(t)；

(5)O表示逻辑输出变迁到逻辑输出函数的映射，对有O(t)＝f_O(t)；

(6)M:P→{0,1}是一个标识函数，对M(p)表示p中含有的托肯数量；

(7)变迁触发规则：

1)对若f_I(t)|_M＝_·T_·，则逻辑输入变迁t可以被触发，记做M[t>M′，且对

2)对若f_O(t)|_M＝_.T_.，则逻辑输出变迁t是使能的，记做M[t>M′，且对

3)对变迁触发规则与传统Petri网一致；

(8)若p₁，p₂是逻辑输入(出)变迁t的前(后)集，则：

1)表示当且仅当p₁和p₂中的一个含有托肯时，t是使能的；

或者当t被触发后，p₁和p₂只有一个含有托肯；

2)p₁∧p₂表示当且仅当p₁和p₂中都含有托肯时，t是使能的；

或者当t被触发后，p₁和p₂中都含有托肯；

3)p₁∨p₂表示当且仅当p₁和p₂中至少一个含有托肯时，t是使能的；

或者当t被触发后，p₁和p₂中至少一个含有托肯。

图1为一个逻辑Petri网LPN₁。

变迁a是一个逻辑输入变迁，c是一个逻辑输出变迁。其他变迁是普通变迁。是a的逻辑输入函数，表示以下五种情况均可让a使能：

(1)只有p₁中含有托肯；(2)只有p₂中含有托肯；(3)只有p₃中含有托肯；(4)p₁和p₂中都含有托肯；(5)p₁和p₃中都含有托肯。

O(c)＝p₆∨p₇是c的逻辑输出函数，表示当c被触发后，p₆和p₇中至少有一个含有托肯。

随着实际情况的变化，业务流程可能会发生变化，以适应环境的变化。此时，需要将原模型和由实际流程产生事件日志进行一致性检查。

如果模型与事件日志不一致，则发现偏差。

本发明提出了一种基于扩展次关系的事件日志与流程模型之间所有偏差的收集方法。

为了有效地分析事件日志，需要提取日志的主要信息。

定义扩展的次序关系

设集合是一个事件日志，且σ∈L是的一条迹。对于任意的a,b∈σ，有

(1)跟随关系>：a>b当且仅当σ[i+1]＝b，1≤i<|σ|；

(2)因果关系→：a→b当且仅当且

(3)选择关系×：a×b当且仅当且或b∈&(σ)且

(5)逻辑并发关系∨：a∨b当且仅当对σ₁,σ₂∈L：a||b，对σ₃∈L：a∈&(σ₃)且或b∈&(σ₃)且

定义日志次序集

设是一个事件日志，是一个符号集。被称作是一个日志次序集，其中表示活动a和b之间的次序关系。

根据日志次序集的定义，得到日志L的次序集R_L。日志次序集是事件日志的另一种表达形式，一个日志次序集能以形式化的方式表达对应事件日志中任意活动间的次序关系。

例如，对且a,b∈A，a和b之间的次序关系是a→b，a×b，a||b，或a∨b。其中：

a→b表示因果关系，即a被触发后b才能被触发；

a×b表示选择关系，即在同一条迹中a和b不能同时发生；

a||b表示普通并发关系，即在任意一条迹中，如果a发生b就一定会发生；

a∨b表示逻辑并发关系，即至少存在三条迹，由其中的两条迹可以得到a||b，在剩余的一条迹中a和b不能同时发生。

根据事件日志间扩展的次序关系得到日志次序集，根据Petri网模型能得到模型次序集。

定义模型次序集

设PN＝(P,T；F,M)是一个Petri网，是一个完全触发序列集，是一个符号集。是一个模型次序集，其中表示t_i和t_j基于S_PN的次序关系。

根据模型次序集的定义，可以得到逻辑Petri网的模型次序集。

定义逻辑模型次序集

设LPN＝(P,T；F,I,O,M)是一个逻辑Petri网，是一个完全触发序列集，是一个符号集。

是一个逻辑模型次序集，其中表示t_i和t_j基于S_LPN的次序关系。

根据以上定义，下面给出从事件日志中获取日志次序集的方法，如方法1所示。

方法1扩展的次序关系产生方法

步骤1：输入完备的事件日志输出日志次序集R_L；

令其中，R表示一个集合；

步骤3：若R中的任意元素满足：且则

步骤7：得到日志次序集R_L；

按照方法1的原理，将每个步骤中的事件日志L换成完全触发序列集S_PN，即可生成Petri网的模型次序集R_M。

例1：某业务流程的原有流程模型PN₁如图2所示。

事件日志L₁＝{σ₁,σ₂,σ₃,σ₄,σ₅,σ₆,σ₇,σ₈,σ₉,σ₁₀,σ₁₁,σ₁₂}＝{<a,b,e,g>,<a,c,f,g>,<a,d,g>,<a,b,e,c,f,g>,<a,b,c,e,f,g>,<a,b,c,f,e,g>,<a,c,b,e,f,g>,<a,c,b,f,e,g>,<a,c,f,b,e,g>,<a,b,e,d,g>,<a,b,d,e,g>,<a,d,b,e,g>}。

下面列出基于扩展的次序关系，并得到日志次序集和模型次序集。

对可以得到如下的扩展次序关系：

(1)跟随关系>：

σ₁>＝{a>b,b>e,e>g}；

σ₂>＝{a>c,c>f,f>g}；

σ₃>＝{a>d,d>g}；

σ₄>＝{a>b,b>e,e>c,c>f,f>g}；

σ₅>＝{a>b,b>c,c>e,e>f,f>g}；

σ₆>＝{a>b,b>c,c>f,f>e,e>g}；

σ₇>＝{a>c,c>b,b>e,e>f,f>g}；

σ₈>＝{a>c,c>b,b>f,f>e,e>g}；

σ₉>＝{a>c,c>f,f>b,b>e,e>g}；

σ₁₀>＝{a>b,b>e,e>d,d>g}；

σ₁₁>＝{a>b,b>d,d>e,e>g}；

σ₁₂>＝{a>d,d>b,b>e,e>g}；

R＝{a>b,a>c,a>d,b>e,b>c,c>b,b>d,d>b,b>f,f>b,c>e,e>c,c>f,d>e,e>d,e>f,f>e,d>g,e>g,f>g}；

(2)因果关系→：

R_L1＝R_L1∪{a→b,b→e,e→g,a→c,c→f,f→g,a→d,d→g}；

(3)选择关系×：

R_L1＝R_L1∪{c×d,d×f}；

(4)普通并发关系||：

(5)逻辑并发关系∨：

R_L1＝R_L1∪{b∨c,b∨d,b∨f,c∨e,d∨e,e∨f}。

由此得到L₁的次序关系集如下：

R_L1＝{a→b,b→e,e→g,a→c,c→f,f→g,a→d,d→g,c×d,d×f,b∨c,b∨d,b∨f,c∨e,d∨e,e∨f}。

PN₁中有三条完全触发序列：

s₁＝<a,b,e,g>,s₂＝<a,c,f,g>,and s₃＝<a,d,g>。PN₁中所有的次序关系如下所示：

(1)跟随关系>：

s₁>＝{a>b,b>e,e>g}；

s₂>＝{a>c,c>f,f>g}；

s₃>＝{a>d,d>g}；

R＝{a>b,a>c,a>d,b>e,c>f,d>g,e>g,f>g}；

(2)因果关系→：

R_M1＝R_M1∪{a→b,b→e,e→g,a→c,c→f,f→g,a→d,d→g}；

(3)选择关系×：

R_M1＝R_M1∪{b×c,b×d,b×f,c×d,c×e,e×f}；

(4)普通并发关系||：

(5)逻辑并发关系∨：

由此可以得到PN₁的模型次序集：

R_M1＝{a→b,b→e,e→g,a→c,c→f,f→g,a→d,d→g,b×c,b×d,b×f,c×d,c×e,d×e,e×f}。

R_L记录了事件日志L中所有活动间的次序关系，R_M记录了Petri网模型PN中所有变迁间的关系。通过比较R_L和R_M，能够发现L和PN之间的所有偏差。

为了存储二者之间的偏差，本发明提出偏差集的概念。

定义偏差集

设R_D是一个偏差集，其中：

(1)当且仅当并且

(2)当且仅当并且

(3)当且仅当只

(4)当且仅当

在本发明中，符号R_D(a)表示R_D中包含a的元素个数。

由以上定义可知，R_D记录的是事件日志和模型中不同的次序关系。

模型不能重演事件日志的原因主要有三个：

(1)日志中有一些新活动出现；

(2)日志中原有活动间的关系不能被模型中相应的子模型描述；

(3)模型中的行为在日志中没有出现。

下面给出偏差集的生成方法，如方法2所示。

方法2偏差集的生成方法

步骤1：输入日志次序集R_L和模型次序集R_M；定义日志和模型间的偏差集R_D；

令偏差集

步骤2：对任意的若存在则

步骤3：对任意的若存在则

步骤4：对任意的若不存在且不存在则

步骤5：对任意的若不存在则

步骤6：得到偏差集R_D。

例2：根据例1有R_L1＝{a→b,b→e,e→g,a→c,c→f,f→g,a→d,d→g,c×d,d×f,b∨c,b∨d,b∨f,c∨e,d∨e,e∨f}，R_M1＝{a→b,b→e,e→g,a→c,c→f,f→g,a→d,d→g,b×c,b×d,b×f,c×d,c×e,d×e,e×f}。通过比较R_L1和R_M1，利用方法2得到的偏差集如下：

R_D1＝{b∨c|b×c,b∨d|b×d,b∨f|b×f,c∨e|c×e,d∨e|d×e,e∨f|e×f}。

第II步：基于偏差集将相应的顺序结构或选择结构修复成并发结构，完成对模型的修复。

随着业务流程系统的更新，原有流程模型没有得到及时更新，使得它与实际的业务流程不匹配，因而无法正确重演流程中所反映的新的事件日志。

如果事件日志中某些活动间的次序关系不能由相应的子模型描述，则需要用一个新的子模型替换原有子模型，使得替换后的模型可以描述活动关系。例如：

原有流程模型中一些活动属于顺序结构或选择结构，而实际业务流程对应的事件日志中的这些活动具有逻辑并发关系，此时需要根据事件日志对原有流程模型中的子模型进行更改，即用并发结构替换原模型中的顺序结构或选择结构。

本发明实施例提出了两种通过构造并发结构来改变子模型的方法。

第一种是基于选择结构的模型修复

随着实际流程的更改，事件日志中的一些活动具有逻辑并发关系。

对于具有此关系的活动，可以同时执行它们，或者至少执行其中一个活动。

然而，在实际模型中只能触发其中一个活动，即这些活动属于选择结构。此时，通过将选择结构更改为并发结构来修复模型。并发结构中的所有活动在模型中可以同时被触发。

通过在模型中添加逻辑表达式，使得到的修复模型至少可以触发其中一个活动，提高了业务流程的适用性。下面给出包含选择结构的模型修复方法，如方法3所示。

方法3基于选择结构的模型修复方法

步骤1：输入完备事件日志L和Petri网PN＝(P,T；F,M)；定义修复后的逻辑Petri网模型LPN′＝(P′,T′；F′,I′,O′,M′)；令

步骤2：调用扩展的次序关系产生方法(即方法1)得到R_L和R_M；

步骤3：调用偏差集的生成方法(即方法2)得到R_D；

步骤5：对任意的a∨b|a×b∈R_D′，若则判断R_D(a)和R_D(b)的大小。

步骤7：得到基于选择结构的修复模型LPN′。

例3：某业务流程的原有流程模型PN₁如图2所示。

日志L₁＝{σ₁,σ₂,σ₃,σ₄,σ₅,σ₆,σ₇,σ₈,σ₉,σ₁₀,σ₁₁,σ₁₂}＝{<a,b,e,g>,<a,c,f,g>,<a,d,g>,<a,b,e,c,f,g>,<a,b,c,e,f,g>,<a,b,c,f,e,g>,<a,c,b,e,f,g>,<a,c,b,f,e,g>,<a,c,f,b,e,g>,<a,b,e,d,g>,<a,b,d,e,g>,<a,d,b,e,g>}。

根据方法3对模型进行修复的过程如下：

由方法3可知R_D1＝{b∨c|b×c,b∨d|b×d,b∨f|b×f,c∨e|c×e,d∨e|d×e,e∨f|e×f}，且R_D1′＝{b∨c|b×c,b∨d|b×d,d∨e|d×e,e∨f|e×f}。对b∨c|b×c∈R_D1′，有因为R_D1(b)>R_D1(c)，所以t₁＝b，t₂＝c。此时t_o＝^·(^·t₁)∩^·(^·t₂)＝a被看作是一个逻辑输出变迁。新库所p₇作为b的前集被添加到P中。下一步将p₂与b之间的弧删除，并分别添加从a到p₇和从p₇到b这两条弧。

根据现有的挖掘算法，得到变迁a的逻辑输出表达式为O′(a)＝p₂∨p₇。对d∨e|d×e∈R_D1′，有由于R_D1(e)>R_D1(d)，则t₁＝e，t₂＝d。此时t_i＝(t₁ ^·)^·∩(t₂ ^·)^·＝g被看作是一个逻辑输入变迁。新库所p₈作为e的后集被添加到P中。下一步将e与p₅之间的弧删除，并分别添加从e到p₈和从p₈到g这两条弧。根据现有的挖掘算法，可以得到变迁g的逻辑输入表达式为I′(g)＝p₅∨p₈。修复后的模型能够重演所有的迹，修正结果如图3所示。

第二种是基于顺序结构的模型修复

对于在实际流程中顺序执行的活动，它们在事件日志中具有逻辑并发关系。也就是说，这些活动不仅可以被顺序执行，还可以被并发执行。因此，需要将原模型中的顺序结构更改为并发结构，以此提高业务流程的被执行效率。

下面给出包含顺序结构的模型修复方法，如方法4所示。

方法4基于顺序结构的模型修复方法

步骤2：调用扩展的次序关系产生方法(方法1)得到R_L和R_M；

步骤3：调用偏差集的生成方法(方法2)得到R_D；

步骤4：对任意的a∨b|a→b∈R_D：F″＝F″-{a^·→b}；

步骤5：对任意的a→b|φ∈R_D，若存在b∨c|φ∈R_D(或b∨c|c→b∈R_D)且a＝^◆b∩^◆c，a＝^·(^·c)，则P″＝P″∪{p_o}(p_o＝^·b)，F″＝F″∪{a→p_o,p_o→b}，O″＝O″∪{O″(a)＝^·b∨^·c}；

步骤6：对任意的a→b|φ∈R_D，若存在a∨c|a→c∈R_D(或a∨c|φ∈R_D)且b＝a^◆∩c^◆，b＝(c^·)^·，则F″＝F″∪{a^·→b}，I″∪{I″(b)＝a^·∨c^·}；

步骤7：得到基于顺序结构的修复后的模型LPN″。

例4：某业务流程的原有流程模型PN₂如图4所示。事件日志L₂＝{σ₁,σ₂,σ₃,σ₄,σ₅}＝{<a,b,c,d,e>,<a,b,c,e>,<a,d,e>,<a,d,b,c,e>,<a,b,d,c,e>}。利用方法1可得到R_L2＝{a→b,a→d,b→c,c→e,d→e,b∨d,c∨d}和R_M2＝{a→b,b→c,c→d,d→e}，由方法2可知R_D2＝{a→d|φ,c→e|φ,b∨d|φ,c∨d|c→d}。对c∨d|c→d∈R_D2，需要删除从c^·到d的弧。对a→d|φ∈R_D2，可以发现b∨d|φ也属于R_D2。此时，a是b和d共同的前活动集，则a应当被看作是一个逻辑输出变迁。新库所p₇作为d的唯一前集被添加到模型中，同时添加两条从a到p₇和从p₇到d的弧。根据现有文献可知，a的逻辑输出表达式为O″(a)＝^·b∨^·d＝p₂∨p₇。对c→e|φ∈R_D2，有c∨d|c→d∈R_D2。由L₂可知，e是c和d共同的后活动集，同时在PN₂中，e是d^·的唯一后集，则e应当被看作是一个逻辑输入变迁。此时需要添加一条从c^·到e的弧，并计算e的逻辑输入表达式为I″(e)＝c^·∨d^·＝p₄∨p₅。最后得到的修复模型如图5所示。

下面对本发明方法与Fahland方法和Goldratt方法进行实验对比和分析。

本发明在流程挖掘工具ProM6.6中对Fahland方法进行了验证，在DOS窗口中对Goldratt方法进行了验证，本发明中的修复方法为手工模拟。

以某医院肿瘤科业务流程为例，基于原有业务流程中产生的事件日志，得到图6所示的流程模型。主要的活动流程描述如下：

首先，病人可以在去医院之前通过电话或网络预约医生，得到预约号码；病人也可以不进行预约，直接去医院挂号。对于预约的病人和挂号的病人，医院需要按顺序进行叫号，病人依照顺序找医生问诊。在询问病人的情况后，医生决定病人需要做什么样的检查。主要的检查类型有三种：血常规、生化全套和核磁共振。在诊断流程中，医生根据检查结果和患者的病情制定相应的治疗方案。如果是良性肿瘤患者，则可以在门诊治疗，根据医生的处方接受药物治疗，经过一段时间的治疗观察，病人可以离开医院；如果是非良性肿瘤患者，需要进行手术，病人要去办理住院手续，并制定相应的饮食计划，手术前医生会进行术前评估，病人依次做心电图和化验检测，根据检查结果，医生为病人制定详细的手术方案，进行手术，待病人的情况得到改善，就可以出院。

随着实际医疗业务流程的变化，出现了一些新的事件日志，但原有的流程模型无法准确地反映实际的医疗业务流程，即原有模型无法正确重演这些事件日志。也就是说，事件日志中的某些活动间的次序关系不能被模型中相应的子模型描述，需要对其进行更改。

例如，病人在进行检查的时候，有更多的选：他们可以做血常规和核磁共振，或者做生化全套和核磁共振。此外，在进行术前评估的时候，患者也先做化验检测再做心电图，或者只做其中的一种。

在以上部分的就诊流程中，传统的Petri网无法正确表达活动间的逻辑关系，需要利用逻辑Petri网进行模型修复，使修复后的模型能正确反映实际的业务流程，并且提高业务流程的被执行效率。反映在本实例中即提高医院肿瘤科业务流程的被执行效率，从而缩短病人办理相关业务的时间。

当然，本实施例中的业务流程并不限于上述医院业务流程，还可以是电力营业厅方面、移动营业厅方面以及银行业务层面等的业务流程。

通过利用本发明方法对与上面业务流程相匹配的流程模型进行修复，使得修复后的流程模型能够正确反映更新后(或变化后)的实际业务流程，从而提高业务流程的被执行效率，进而缩短办理相关业务人员的办理时间。

根据从医院系统中获得的事件日志，通过手动移除明显偏离模型的案例，得到20组事件日志(L₁-L₂₀)，这些事件日志包含上面提到的所有变化。

表1给出了这些事件日志的主要属性：迹的数量、事件的数量、活动的数量和迹的长度范围。从表1中，可以发现事件日志中的迹的数量范围为117～3215。

表1 20组事件日志的详细信息

分别用Fahland方法、Goldratt方法和基于逻辑Petri网的方法对图6中的原始流程模型进行修复。表1中的事件日志L₂₀包含的迹的数量最多，它包含的情况可能最全面。

因此，以L₂₀为实验数据对原始模型进行修复。图7-图9分别为用这三种方法得到的修复模型，这三种方法修复后的模型均可以重演事件日志L₂₀中的所有迹。

Fahland方法修复后的模型如图7所示，首先根据事件日志与原始模型之间的最优校准找到偏差，收集发生在同一位置的日志动作，构造不拟合子日志。然后挖掘出相应的子流程，并将其作为自环添加到模型中，或在原模型中添加一个可以重演该子日志的循环。对于校准中的模型动作，该方法将不可变迁添加到原始模型中。与图6中原始流程模型相比，Fahland方法修复后的模型增加1个循环返回变迁，2个不可见变迁，4个重复变迁和14条弧。

采用Goldratt方法修复的模型如图8所示，通过为每个修复操作分配成本和设置最大预算，在控制更改量的同时，寻求最大程度的拟合度。通过将不可见变迁或将单个变迁以自环的形式添加到原模型中来完成模型修复。与图6中原始模型相比，Goldratt方法修复的模型增加了3个重复的重复变迁，2个不可见的跃迁和10条弧。

本发明中基于逻辑Petri网模型修复方法得到的模型如图9所示。修正后的模型与原流程模型相比，只添加了3个库所和4条弧。根据逻辑变迁的挖掘算法，得到的逻辑输入函数为：I′(问诊)＝p₆∨p₂₁和I″(术前评估)＝p₁₂∨p₁₃，得到的逻辑输出函数为：O′(诊断)＝^·t₇∨^·t₉＝p₅∨p₂₀和O″(制定手术方案)＝p₁₅∨p₂₂。用逻辑表达式代替不可见变迁和重复变迁，不仅降低了模型的复杂度，还能正确地表示活动之间的逻辑关系，这是传统Petri网不能得到的。

在对流程模型进行修复后，将本发明方法与现有的两种方法进行了比较。根据一致性检查的准则，主要从拟合度、精确度和简洁度三个方面进行对比分析。在本发明中，使用不同数量的事件日志(如表1所示)来计算每个修复模型的拟合度和精确度。

图10为三种方法的拟合度的对比结果图。拟合度是评价模型质量好坏最重要的指标。如果事件日志中的所有迹都可以在模型中重演，则模型的拟合度值为1。

从图10中可以看出，在不同数量的事件日志下，每种方法的拟合度值始终为1。也就是说，这三种方法修复的模型可以重演所有的事件日志。

图11为三种方法的精确度对比结果图。模型的精确度值越高，意味着除了事件日志中给定的迹外，模型生成的其他迹的类型越少。

从图11中看出，本发明方法修复后的模型精确度值要高于其他两种方法。Fahland方法和Goldratt方法修复的模型中出现了自环、重复变迁和不可见变迁，降低了精确度，使得模型不能正确表达实际的医疗业务流程，从而导致实际业务流程的执行效率低。

简洁度意味着能够重演事件日志的模型应该尽可能简单。根据以下标准比较三种修复模型的简洁度：添加的库所数量、添加的变迁数量、添加的不可见变迁数量和添加的弧数。

与图10中的原始模型相比，由表2得到如下结果：

Fahlnad方法得到的修复模型增加了4个变迁，3个不可见变迁和14条弧，Goldratt方法得到的修复模型增加了3个变迁、2个不可见变迁和10条弧；本发明方法得到的修复模型增加了3个库所和4条弧，正确地反映了实际的医疗业务流程。

表2简洁度比较分析

从表2可以看出，本发明方法相对于Fahlnad方法、Goldratt方法简洁度明显提高。

综上，本发明方法修复得到的流程模型能够重演事件日志，准确表达活动之间的关系，从而能够正确表达实际的业务流程，提高实际业务流程的被执行效率。

当然，以上说明仅仅为本发明的较佳实施例，本发明并不限于列举上述实施例，应当说明的是，任何熟悉本领域的技术人员在本说明书的教导下，所做出的所有等同替代、明显变形形式，均落在本说明书的实质范围之内，理应受到本发明的保护。

Claims

1.基于结构替换的流程模型修复方法，其特征在于，包括如下步骤：

第I步：通过重新定义活动之间的次序关系，得到事件日志和模型的两个次序关系集，并得到一个记录事件日志与模型之间差异的偏差集：

如果流程模型与事件日志不一致，则发现偏差；

定义扩展的次序关系

设集合是一个事件日志，且σ∈L是的一条迹；

对于任意的活动a，b∈σ，有：

(1)跟随关系>：a>b当且仅当σ[i]＝a，σ[i+1]＝b，1≤i<|σ|；

(2)因果关系→：a→b当且仅当a，b∈&(σ)：且

其中，&(σ)表示迹σ中所有活动构成的集合；

(3)选择关系×：a×b当且仅当a∈&(σ)且或b∈&(σ)且

(4)普通并发关系||：a||b当且仅当σ₂∈L：对a,b∈&(σ₁)：a>b且对a,b∈&(σ₂)：b>a；

(5)逻辑并发关系∨：a∨b当且仅当σ₂,σ₃∈L:对σ₁,σ₂∈L：a||b，对σ₃∈L：a∈&(σ₃)且或b∈&(σ₃)且其中，σ₁,σ₂,σ₃表示事件日志L中的迹；

定义日志次序集

设是一个符号集；

定义模型次序集

其中，表示t_i和t_j基于S_PN的次序关系；

定义逻辑模型次序集

其中，表示t_i和t_j基于S_LPN的次序关系；

方法1扩展的次序关系产生方法

步骤1：输入完备的事件日志令其中，R表示一个集合；

步骤3：若R中的任意元素满足：且则R_L＝R_L∪{a→b}；

步骤6：若R中的任意元素满足：a＞b，b＞a，且存在σ∈L有：a∈&(σ)且且b∈&(σ)，则R_L＝R_L∪{a∨b}；

其中，a＞b，b＞a表示活动a和b是并发关系；

步骤7：得到日志次序集R_L；

定义偏差集

设R_D是一个偏差集，其中：

(1)当且仅当并且

(2)当且仅当并且

(3)当且仅当只

(4)当且仅当

其中，符号R_D(a)表示R_D中包含a的元素个数；

方法2偏差集的生成方法

步骤1：输入日志次序集R_L和模型次序集R_M，令偏差集

步骤2：对任意的若存在则

步骤3：对任意的若存在则

步骤4：对任意的若不存在且不存在则

步骤5：对任意的若不存在则

步骤6：得到日志和模型间的偏差集R_D；

随着业务流程的更新，原有流程模型没有得到及时更新，使得它与实际的业务流程不匹配，因而无法正确重演流程中所反映的更新后的业务流程中新的事件日志；

因而，需要对原有流程模型进行修复，以匹配更新后的业务流程；

第II.1：基于选择结构的模型修复

步骤1：输入完备事件日志L和Petri网PN＝(P,T；F,M)；定义修复后的逻辑Petri网模型LPN′＝(P′,T′；F′,I′,O′,M′)，令LPN′＝PN,

步骤3：调用偏差集的生成方法得到偏差集R_D；

若R_D(a)≥R_D(b)，则此时活动a是一个偏差活动，令t_o＝^●(^●a)∩^●(^●b)为一个逻辑输出变迁，P′＝P′∪{p_o}且p_o＝^●a，F′＝F′-{^●b→a}∪{t_o→p_o,p_o→a}，O′＝O′∪{O′(t_o)＝p_o∨^●b}；

若R_D(b)≥R_D(a)，则此时活动b是一个偏差活动，令t_o＝^●(^●a)∩^●(^●b)为一个逻辑输出变迁，P′＝P′∪{p_o}且p_o＝^●b，F′＝F′-{^●a→b}∪{t_o→p_o,p_o→b}，O′＝O′∪{O′(t_o)＝p_o∨^●a}；

若R_D(a)≥R_D(b)，则此时活动a是一个偏差活动，令t_i＝(a^●)^●∩(b^●)^●为一个逻辑输入变迁，P′＝P′∪{p_i}且p_i＝a^●，F′＝F′-{a→b^●}∪{a→p_i,p_i→t_i}，I′＝I′∪{I′(t_i)＝p_i∨b^●}；

若R_D(b)≥R_D(a)，则此时活动b是一个偏差活动，令t_i＝(a^●)^●∩(b^●)^●为一个逻辑输入变迁，P′＝P′∪{p_i}且p_i＝b^●，F′＝F′-{b→a^●}∪{b→p_i,p_i→t_i}，I′＝I′∪{I′(t_i)＝p_i∨a^●}；

步骤7：得到基于选择结构的修复模型LPN′；

第II.2：基于顺序结构的模型修复

步骤1：输入完备事件日志L和Petri网PN＝(P,T；F,M)；定义修复后的逻辑Petri网模型LPN″＝(P″,T″；F″,I″,O″,M″)；令LPN″＝PN,

步骤3：调用偏差集的生成方法得到偏差集R_D；

步骤4：对任意的a∨b|a→b∈R_D：F″＝F″-{a^●→b}；

步骤5：对任意的a→b|φ∈R_D，若存在b∨c|φ∈R_D且a＝^◆b∩^◆c，a＝^●(^●c)，则：

P″＝P″∪{p_o}(p_o＝^●b)，F″＝F″∪{a→p_o,p_o→b}，O″＝O″∪{O″(a)＝^●b∨^●c}；

步骤6：对任意的a→b|φ∈R_D，若存在a∨c|a→c∈R_D且b＝a^◆∩c^◆，b＝(c^●)^●，则：

F″＝F″∪{a^●→b}，I″＝I″∪{I″(b)＝a^●∨c^●}；

其中，a、b、c表示不同的活动名；

步骤7：得到基于顺序结构的修复后的模型LPN″；