CN112035423B - 一种基于Petri网挖掘混合多并发结构提高业务流程效率的方法 - Google Patents

一种基于Petri网挖掘混合多并发结构提高业务流程效率的方法 Download PDF

Info

Publication number
CN112035423B
CN112035423B CN202010785205.0A CN202010785205A CN112035423B CN 112035423 B CN112035423 B CN 112035423B CN 202010785205 A CN202010785205 A CN 202010785205A CN 112035423 B CN112035423 B CN 112035423B
Authority
CN
China
Prior art keywords
degree
triangle
active
activity
active set
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010785205.0A
Other languages
English (en)
Other versions
CN112035423A (zh
Inventor
刘伟
孙红伟
闫春
史晓浩
张志豪
杜玉越
蔺茂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong University of Science and Technology
Original Assignee
Shandong University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong University of Science and Technology filed Critical Shandong University of Science and Technology
Priority to CN202010785205.0A priority Critical patent/CN112035423B/zh
Publication of CN112035423A publication Critical patent/CN112035423A/zh
Application granted granted Critical
Publication of CN112035423B publication Critical patent/CN112035423B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/18File system types
    • G06F16/1805Append-only file systems, e.g. using logs or journals to store data
    • G06F16/1815Journaling file systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Databases & Information Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明属于过程挖掘技术领域,具体公开了一种基于Petri网挖掘混合多并发结构提高业务流程效率的方法,该方法针对现有的挖掘方法不能准确从不完备事件日志中挖掘出混合多并发结构的过程模型,导致业务流程效率低下的技术问题,提出了一种基于Petri网的过程挖掘方法即AlphaMining方法,其过程如下:首先在事件系统中获取不完备事件日志中所有的活动,查找出符合最简二度短循环结构的活动;分别对最简二度循环结构中的活动进行重新定义;其次根据活动在迹中的数量特征和位置特征,用数量标记矩阵和位置标记矩阵正确匹配识别同类型二度短循环结构,完成对含有混合多并发结构过程模型的挖掘;然后用挖掘出的过程模型重演实际业务流程,利于提高实际业务流程的效率。

Description

一种基于Petri网挖掘混合多并发结构提高业务流程效率的 方法
技术领域
本发明涉及一种基于Petri网挖掘混合多并发结构提高业务流程效率的方法。
背景技术
过程挖掘是一门近十年来提供全套工具来洞察事实并支持过程改进的新兴学科,它是建立在过程模型驱动方法和数据挖掘的基础上发展而来的。过程挖掘技术的快速发展和应用,得益于从现代信息系统中获取事件数据越来越容易。
过程挖掘的核心是通过从实际过程产生的事件日志中提取出知识,去发现、合规性检测和改进实际过程。发现技术是使用不包括任何先验信息的事件日志生成模型,合规性检测是用来检查记录在日志中的实际执行情况与模型的偏差,改进是利用实际过程产生的事件日志来扩展或改进一个已存在的过程。过程发现是过程挖掘中是最富有挑战性的任务之一。通常,对过程挖掘方法挖掘的过程模型,从拟合度、精确度、简化度和泛化度四个角度去评价分析。
目前,大多数的过程挖掘方法,都要求日志文件是具有全局完备性或带有附加条件的局部完备性,尤其是在过程模型中存在大量的循环或并发结构时,基本是不可能实现的。因此,如何从不完备日志文件中挖掘出正确的过程模型成为了本领域研究的重点。
针对上面的这一技术问题,学者们提出了一些挖掘方法。例如,Aalst等人第一次提出了α算法,从局部完备性日志中,根据活动间的次序依赖关系,来挖掘过程模型。α算法解决了大多数的过程挖掘遇到的问题,是目前过程挖掘中用的最多以及最成熟的算法之一。
但是,α算法也存在不足,在处理短循环,即长度为1或2的循环时存在问题。
因此,为了解决α算法存在的这一问题,A.K.A.de Medeiros等人提出了α+算法,能够从满足含有循环完备性日志(即日志文件中必须出现“aba”或“aa”等显式循环行为,其中a,b均指过程模型中的活动名)中挖掘出长度为1或2的短循环,但在实际过程模型中,由于存在并发或选择等结构的原因,循环完备性日志也很难获得。
紧接着,很多学者针对某些特定的问题,对α算法进行了扩展,其中,Wen.Et.al等人提出了α++算法,用于解决过程模型中存在非自由选择结构和活动间存在隐式依赖关系的问题;L.J.Wen等人提出了α#算法,能够有效的处理过程模型中存在不可见变迁的问题;Q.Guo等人提出了α算法,用于解决从非自由选择结构的中,发现不可见变迁问题。
通过分析发现,α算法以及目前的α扩展算法,从不含循环完备性的不完备日志中挖掘短循环结构时都存在一定的问题。随后,用来解决噪声和不完备性问题的高级挖掘算法被提出。
其中,J.E.Cook等人提出了启发式挖掘算法,该启发式挖掘算法在构建模型时考虑了事件和序列的频次,不频繁的路径不被加入到过程模型中去,消除了噪声,使得挖掘出的过程模型更加强壮,但是在不完备日志中处理短循环时,效果一般。
此外,一种模仿的自然演变的遗传过程挖掘算法被提出,主要用于处理复杂特定的结构,比如含有不可见变迁、重复变迁以及非自由选择结构等。但在处理较大的模型和日志时,尤其是含有混合多并发短循环结构的模型时,算法并不十分有效率。
基于区域的挖掘算法能清晰的表达更加复杂的过程模型,尽可能平衡过拟合和欠拟合。
LIN.L.L等人提出用紧邻度的概念来区分解决并发结构中多个同类型二度短循环相互干扰的问题,但紧邻度的概念模型是基于相关性实验的概率模型来定义的,在实际过程中,要想达到一个良好的匹配效果,就需要大量的日志文件。当日志量比较少或者相关活动紧邻行为在日志中出现频率较少,对正确发现二度短循环有很大的影响。
通过对目前常见的过程挖掘方法进行分析,在不含类似于“aba”显式循环特征的不完备日志中均不能有效的挖掘出混合多并发短循环结构,使得得到的过程模型拟合度、精确度以及简洁度较差,无法满足实际业务流程更新的需求,从而降低了实际业务流程的效率。
发明内容
本发明的目的在于提出一种基于Petri网挖掘混合多并发结构提高业务流程效率的方法,以便从不完备事件日志中准确挖掘出包含多并发短循环结构的过程模型,该模型能够反演更新后的实际业务流程,使得更新后的实际业务流程得到正确的表达。
本发明为了实现上述目的,采用如下技术方案:
一种基于Petri网挖掘混合多并发结构提高业务流程效率的方法,包括以下步骤:
I.获取事件日志中的活动,得到符合最简二度循环结构的活动,将这些活动进行重新定义,用定义的新的活动集将符合条件的活动分别收集起来;新的活动集即:
三角形二度循环的开始活动集Asta_triangle、四边形二度循环的开始活动集Asta_quad、三角形二度循环的结束活动集Aend_triangle以及四边形二度循环的结束活动集Aend_quad
定义元组;
设B是一个集合,则x=(b1,b2,···,bn)是一个n个元素组成的元组;
定义序列;
设S是一个集合,δ=<δ[1],δ[2],···δ[n]>是S上的一个序列;
其中,δ[i]∈S表示δ中的第i个元素,i∈{0,1,2,...,n},|δ|=n表示δ的长度;δ(a)表示a在δ中出现的次数,S*表示集合S上所有有限序列的集合;
对于所有的δ∈S*并且1≤i≤j≤|δ|,δij表示δ中从δ[i]到δ[j]的子序列;
定义迹和事件日志;
设A是一个活动集合;若活动序列属于δ∈A*,A*表示集合A上的所有序列集合,则δ称为一条迹;若存在L∈B(A*)是迹在集合A上的一个多重集,则称为L为一个事件日志;
定义Petri网;
满足下列条件的三元组N=(P,T;F)称作一个网;
(1)
Figure BDA0002621699280000031
(2)
Figure BDA0002621699280000032
(3)
Figure BDA0002621699280000033
其中,P表示库所,T表示变迁,F表示流关系;
定义前活动集和后活动集;
设N=(P,T;F)为一个网,对于x∈P∪T:
记·x={y|y∈P∪T∧(y,x)∈F};x·={y|y∈P∪T∧(y,x)∈F};
称·x为x前集或输入集,x·为x后集或输出集,y∈P∪T;
定义标识网;
映射M:S→{0,1,2…}成为网的一个标识;
二元组(N,M),即四元组(P,T;F,M)称为一个标识网;
定义变迁规则;
一个网系统是一个标识网∑=(P,T;F,M),并具有下面的变迁发生规则:
(1)对于变迁t∈T,如果
Figure BDA0002621699280000034
则说明变迁t在标识M有发生权,记为M[t>;
(2)若M[t>,则在标识M下,变迁t能够发生,从标识M发生变迁t得到一个新的标识M',记为M[t>M',对
Figure BDA0002621699280000035
定义工作流网;
设WFN=(PN,i,o)称为一个工作流网,当且仅当:
(1)PN=(P,T;F,M)是一个Petri网;
(2)存在一个初始库所i∈P,并且
Figure BDA0002621699280000036
(3)存在一个终止库所o∈P,并且
Figure BDA0002621699280000037
对于
Figure BDA0002621699280000038
x位于从i到o的一条路径上;
定义基于日志的活动次序关系;
令L∈B(A*)是一个基于活动集合A的事件日志,对于
Figure BDA0002621699280000041
b∈L:
(1)跟随关系:
a>L b当且仅当存在一条迹δ=<t1,t2,t3,···,tn>,i∈{1,2,···,n-1}使得δ∈L,ti=a且ti+1=b;
(2)因果关系:a→Lb当且仅当a>Lb且b≯La;
(3)并发关系:a||Lb当且仅当a>Lb且b>La;
(4)排他关系:a#Lb当且仅当a≯Lb且b≯La;
定义全局完备性日志;
令T为有限的活动集合,PN是基于T的过程模型,L是基于T的事件日志;
事件日志L是全局完备的当且仅当所有出现在日志中的轨迹与过程模型PN执行过程中产生的所有可能关于有限的活动集合T的序列都是等价的;
定义局部完备性日志
令T代表有限的活动集合,令L∈B(T)代表事件日志,则L满足局部完备性的条件是:
(1)假设δ是过程模型PN产生的任意一条可执行轨迹,则满足
Figure BDA0002621699280000042
(2)对于t∈T,必存在一条轨迹δ∈L且t∈δ;
定义三角形二度循环,用▲>L<L▲表示;
令PN=(P,T;F,M0)为一个基本Petri网模型,其中,M0表示初始标识;
活动a,b是N中的两个变迁,即a,b∈T;
则活动a,b构成三角形二度循环a▲>L b或b<L▲a当且仅当:
(1)·a=b·,a·=·b且a≠b,
Figure BDA0002621699280000043
(2)假设M1∈R(M0),使得M1[a>M2,且不存在M1[δ>M2,其中,δ为有限变迁序列,则仅存在M2[b>M1,若存在M2非最终标识且存在M2[x>M3,其中x∈T,a≠x≠b;
其中,R(M0)表示初始标识集;
M1[a>M2表示当活动a使能时,能够从标识M1到标识M2
M1[δ>M2表示当有限变迁序列δ使能时,能够从标识M1到标识M2
M2[b>M1表示当活动b使能时,能够从标识M2到标识M1
M2[x>M3表示当活动x使能时,能够从标识M2到标识M3
定义四边形二度循环,用■>L<L■表示;
令PN=(P,T;F,M0)为一个基本Petri网模型,活动a,b是N中的两个变迁,即a,b∈T,活动a,b构成四边形二度循环a■>L b或b<L■a,当且仅当:
(1)·a=b·,a·=·b且a≠b,
Figure BDA0002621699280000044
(2)假设M1∈R(M0),使得M1[a>M2,且不存在M1[δ>M2,则仅存在M2[b>M1,若存在M1非最终标识且存M1[x>M3,x∈T,a≠x≠b;
其中,M1[x>M3表示当活动x使能时,能够从标识M1到标识M3
定义混合多并发结构;
若PN中含有并发结构,并且该并发结构中至少包含两个不同种类的二度循环,即至少含有一个三角形二度循环和一个四边形二度循环,则称之为混合多并发结构;
定义开始活动和结束活动;
假设任意两个活动ai,bi能够满足构成三角形二度循环或者四边形二度循环,即满足ai>L bi或ai>L bi,则将活动ai称为二度循环的开始活动,活动bi称为二度循环的结束活动;
定义二度循环开始活动集和二度循环结束活动集;
令二度循环开始活动集为Asta,二度循环结束活动集为Aend,Asta和Aend满足:
(1)
Figure BDA0002621699280000051
(2)
Figure BDA0002621699280000052
定义并发活动对集合;
并发活动对集合A par中的元素是事件日志L中所有满足||L关系的活动组成的二元组,即:
Figure BDA0002621699280000053
其中,i∈{0,1,2,...,n};
获取并发活动对集合Apar和直接跟随活动对集合Adir的过程具体为:
I.1.1.对事件日志L中的每条迹进行遍历,获取任意一条迹中的两个活动a,b;
I.1.2.判断每条迹中的任意两个活动是不是满足直接跟随关系;若满足,则将满足直接跟随关系的两个活动组成的活动对放入到直接跟随关系对Adir_all中;
I.1.3.获取直接跟随关系对Adir_all中的并行关系对,放入并发活动对集合Apar中,同时获取除去并发关系对的直接跟随关系对,放入直接跟随活动对集合Adir中;
I.1.4.返回并发活动对集合Apar和直接跟随活动对集合Adir
获取二度循环的开始活动集Acir_sta和二度循环的结束活动集Acir_end的具体过程为:
I.2.1.分别将直接跟随活动对集合Adir拆分成两个活动集合,然后将拆分后的两个活动集合分别放入除去并发关系的直接跟随活动集Adir_set和并发关系活动集Apar_set中;
I.2.2.若直接跟随活动对集合Adir的第一个活动a属于直接跟随活动集Adir_set,第二个活动b属于并发关系活动集Apar_set,则将活动a放入并发结构前活动集Apre_concur中,将活动b放入并行初始活动集Apar_sta中;
若直接跟随活动对集合Adir中的第一个活动a属于并发关系活动集Apar_set,第二个活动b属于直接跟随活动集Adir_set,则将活动b放入并发结构后活动集Aaft_concur中;
I.2.3.将一般循环的初始活动从并行初始活动集Apar_sta中去除,得到循环并行结构的并行初始变迁,放入二度循环的开始活动集Acir_sta
I.2.4.遍历并发关系活动集Apar_set,同时将并行初始活动集Apar_sta中的活动删除,得到剩余的并发关系活动集Apar_remain
I.2.5.根据循环活动在迹中的数量特征,将在任意一条迹中出现次数大于1并且属于并发关系活动集Apar_remain的活动,放入循环结束活动集合Acir_end中;
I.2.6.返回二度循环的开始活动集Acir_sta和二度循环的结束活动集Acir_end
获取三角形二度循环的开始活动集Asta_triangle、四边形二度循环的开始活动集Asta_quad、三角形二度循环的结束活动集Aend_triangle以及四边形二度循环的结束活动集Aend_quad的过程为:
I.3.1.根据三角形二度循环和四边形二度循环的特点,分别得到三角形二度循环开始活动集Asta_triangle和四边形二度循环结束活动集Aend_quad
I.3.2.从二度循环的开始活动集Acir_sta中去掉属于三角形二度循环开始活动集Asta_triangle中的活动,得到四边形二度循环的开始活动集Asta_quad
I.3.3.从二度循环的结束活动集Acir_end中去掉属于四边形二度循环的结束活动集Aend_quad中的活动,得到三角形二度循环的结束活动集Aend_triangle
I.3.4.返回三角形二度循环的开始活动集Asta_triangle、四边形二度循环的开始活动集Asta_quad、三角形二度循环的结束活动集Aend_triangle以及四边形二度循环的结束活动集Aend_quad
II.根据活动在迹中的数量特征和位置特征,用数量标记矩阵和位置标记矩阵正确匹配识别同类型二度短循环结构,具体过程如下:
定义活动在迹中的数量;
设存在事件日志L=<δ12,…,δn>,i,j∈{1,2,…,n},活动ai∈δj,用Sum(aij)表示在迹δj中活动ai出现的总次数,Sum(ai,L)表示在整个事件日志L中活动ai出现的次数;
定义活动在迹中的位置;
设存在事件日志L=<δ12,…,δn>,i,j∈{1,2,...,n},令δn=<a1,a2,a3,...,ai,...an>,若迹δn中不含有重名活动,则称Loc(ain)=i,其中,i为活动ai在迹δn中的位置的下标;
若迹中含有重名活动,用FirstLoc(ain)表示活动ai在迹δn中第一次出现的位置;用LastLoc(ain)表示活动ai在迹δn中最后一次出现的位置;
定义数量标记矩阵;
定义集合TS=Asta_triangle∪Aend_triangle,集合QS=Asta_quad∪Aend_quad;则MTS[|L|][|TS|]称为三角形二度循环的数量标记矩阵;MQS[|L|][|QS|]称为四边二度循环的数量标记矩阵;
其中,|L|表示事件日志L的长度;|TS|表示三角形二度循环的开始活动和结束活动的集合中活动;|QS|表示四边形二度循环的开始活动和结束活动的集合中的活动;[|L|][|TS|]表示三角形二度循环的数量标记矩阵的行和列;[|L|][|QS|]表示四边二度循环的数量标记矩阵的行和列;
定义位置标记矩阵;
定义TS=Asta_triangle∪Aend_triangle,集合QS=Asta_quad∪Aend_quad,则LMTS[|L|][2|TS|]称为三角形二度循环的位置标记矩阵,LMQS[|L|][2|QS|]称为四边二度循环的位置标记矩阵;
其中,[2|TS|]表示三角形二度循环的位置标记矩阵的列是二倍的|TS|,[2|QS|]表示四边形二度循环的位置标记矩阵的列是二倍的|QS|,[|L|][2|TS|]表示三角形二度循环的位置标记矩阵的行和列,[|L|][2|QS|]表示四边二度循环的位置标记矩阵的行和列;
对LMTS[|L|][2|TS|],满足
Figure BDA0002621699280000071
aj∈TS,若0<j≤|TS|,0<i≤|L|则LMTS[i][j]=FirstLoc(aji);若|TS|<j≤2|TS|,0<i≤|L|则LMTS[i][j]=LastLoc(aji);
对LMQS[|L|][2|QS|],满足
Figure BDA0002621699280000072
aj∈TS,若0<j≤|QS|,0<i≤|L|,则LMQS[i][j]=FirstLoc(aji);若|TS|<j≤2|TS|,0<i≤|L|则LMQS[i][j]=LastLoc(aji);
当符合条件的活动不在迹中出现时,位置标记矩阵对应位置用0表示;
获取满足数量标记矩阵的三角形二度循环匹配二元组集合Tri_Mat_Set1以及四边形二度循环匹配二元组集合Quad_Mat_Set1的具体过程如下:
II.1.1.将三角形二度循环的开始活动集Asta_triangle和三角形二度循环的终止活动集Aend_triangle按顺序变成数组并存入Arr_Triangle[],将四边形二度循环的开始活动集Asta_quad和四边形二度循环的终止活动集Aend_quad按顺序变成数组并存入Arr_Quad[];
II.1.2.遍历事件日志L中的每一条迹,分别统计出二度短循环中活动的数量,并放入到对应的数量标记矩阵MTS[|L|][|TS|]和MQS[|L|][|QS|]中;
II.1.3.分别遍历三角形二度循环的数量标记矩阵MTS[|L|][|TS|]和四边形二度循环的数量标记矩阵MQS[|L|][|QS|],将符合二度循环活动数量特征的活动对集分别放入三角形二度循环匹配二元组集合Tri_Mat_Set1以及四边形二度循环匹配二元组集合Quad_Mat_Set1中;
II.1.4.返回满足数量标记矩阵的三角形二度循环匹配二元组集合Tri_Mat_Set1以及四边形二度循环匹配二元组集合Quad_Mat_Set1;
获取满足位置标记矩阵的三角形二度循环匹配二元组集合Tri_Mat_Set2和四边形二度循环匹配二元组集合Quad_Mat_Set2的具体过程为:
II.2.1.构建表示三角形二度循环的位置数组Loc_Arr_Tri[]和四边形二度循环的位置数组Loc_Arr_Quad[];
II.2.2.分别构建三角形二度循环的位置标记矩阵LMTS[|L|][2|TS|]和四边二度循环的位置标记矩阵LMQS[|L|][2|QS|],并赋相应的值;
II.2.3.遍历位置标记矩阵LMTS[|L|][2|TS|]和LMQS[|L|][2|QS|],将满足二度循环活动位置特征定理的活动对分别放入三角形二度循环匹配二元组集合Tri_Mat_Set2和四边形二度循环匹配二元组集合Quad_Mat_Set2;
II.2.4.返回满足位置标记矩阵的三角形二度循环匹配二元组集合Tri_Mat_Set2和四边形二度循环匹配二元组集合Quad_Mat_Set2的值;
获取最终二度循环匹配二元组集合Tri_Mat_Set和Quad_Mat_Set的过程具体为:
II.3.1.将三角形二度循环匹配二元组集合Tri_Mat_Set1和Tri_Mat_Set2取交集,放入最终二度循环匹配二元组集合Tri_Mat_Set中;
II.3.2.将四边形二度循环匹配二元组集合Quad_Mat_Set1和Quad_Mat_Set2取交集,放入最终二度循环匹配二元组集合Quad_Mat_Set中;
II.3.3.返回最终二度循环匹配二元组集合Tri_Mat_Set和Quad_Mat_Set;
III.根据前面获取的二度循环匹配二元组集合Tri_Mat_Set和Quad_Mat_Set,利用AlphaMining方法在不完备日志中挖掘混合多并发结构的过程模型AlphaMining(L);
具体过程如下:设L是一个基于
Figure BDA0002621699280000081
的事件日志;
(1)获取出现在事件日志L中的所有活动,即
Figure BDA0002621699280000082
其中,TL表示事件日志L中包含活动的集合;
(2)获取TI,也就是在某条迹中第一个出现的所有活动,即
Figure BDA0002621699280000083
其中,TI是开始活动集;first(δ)表示某条迹中第一个出现的所有活动;
(3)获取To,也就是在某条迹中最后出现的所有活动
Figure BDA0002621699280000084
其中,To是结束活动集;last(δ)表示某条迹中最后出现的所有活动;
(4)由步骤I.1.1-I.3.4得到三角形二度循环的开始活动集Asta_triangle三角形二度循环的结束活动集Aend_triangle,即
Figure BDA0002621699280000085
(5)由步骤I.1.1-I.3.4得到四边行二度循环的开始活动集Asta_quad三角形二度循环的结束活动集Aend_quad,即
Figure BDA0002621699280000086
其中,ci表示活动,di表示活动;
(6)由步骤II.1.1-II.3.3得到三角形二度循环匹配二元组集合Tri_Mat_Set,即Tri_Mat_Set={(a,b)|(a∈Asta_triangle)∧(b∈Aend_triangle)};其中,a,b表示活动;
(7)由步骤II.1.1-II.3.3得到四边形二度循环匹配二元组集合Quad_Mat_Set,即Quad_Mat_Set={(c,d)|(c∈Asta_quad)∧(d∈Asta_quad)};其中,c,d表示活动;
(8)获取日志中相邻的活动对集XL,即
Figure BDA0002621699280000087
Figure BDA0002621699280000088
其中,A,B均表示活动的集合,a1,a2表示活动,b1,b2表示活动;
(9)进一步缩小活动对集合的范围,获取符合条件的活动对集合YL,即
Figure BDA0002621699280000091
Figure BDA0002621699280000092
其中,A,B均表示活动的集合,A′,B′分别表示最后得到的活动的集合;
(10)获取符合条件的库所集PL,每一个库所p(A,B)连接活动A和B,其中包含唯一的开始库所iL和唯一的终止库所oL,即PL={p(A,B)|(A,B)∈YL∪{iL,oL}};
(11)获取过程模型的所有的弧FL,即FL={(a,p(A,B))|(A,B)∈YL∧a∈A}∪{(p(A,B),B)|(A,B)∈YL∧b∈B}∪{(iL,t)|t∈TI}∪{(io,t)|t∈To};其中,iL表示开始库所,io表示终止库所;
(12)得到最后的过程模型,即AlphaMining(L)=(PL,TL,FL);利用过程模型AlphaMining(L)去反演更新后的实际业务流程,使得更新后的实际业务流程得到正确的表达。
本发明具有如下优点:
本发明方法很好的弥补了现有方法不能准确挖掘出含有混合并发结构的过程模型的问题,为企业中含有混合多并发结构的流程模型提供了解决方法,进一步简化了工作流程,提高了实际业务流程的执行效率,使得挖掘出的过程模型更加准确,更符合实际的工作要求。本发明方法既能挖掘出一般挖掘方法可以挖掘出的过程模型,又能从不完备日志中挖掘出准确的过程模型,能同时解决多个挖掘问题。使用本发明方法能够更加高效,更加准确的从事件日志中挖掘出过程模型。经过实验验证,本发明方法有较高拟合度和精确度,并且能够简化过程模型,因而能够满足实际业务流程更新的需求,提高了实际业务流程的效率。
附图说明
图1为两个三角形二度循环并发模型示意图;
图2为含有一般并发结构和短循环混合并发模型示意图;
图3为含有两种短循环混合并发模型示意图;
图4为财务报账过程模型示意图;
图5为由Alpha+方法挖掘出的账务报账过程模型示意图;
图6为由IM方法挖掘出的账务报账过程模型示意图;
图7为由ILP方法挖掘出的账务报账过程模型示意图;
图8为由本发明方法挖掘出的账务报账过程模型示意图;
图9为Alpha+方法、IM方法、ILP方法以及本方法拟合度变化结构对比图;
图10为Alpha+方法、IM方法、ILP方法以及本方法精确度变化结构对比图;
图11为本发明基于Petri网挖掘混合多并发结构提高业务流程效率的方法的流程图。
具体实施方式
本发明的基本思想是:首先在实际业务流程中产生的不完备事件日志中查找出符合两种二度循环结构的活动;然后根据活动的类别构造对应的三角形二度循环集和四边形二度循环集;根据活动在迹中数量特征和位置特征,用数量标记矩阵和位置标记矩阵正确匹配识别同类型二度短循环;根据匹配好的二度循环对集,构建对应的二度循环结构,并将该结构添加到过程模型总中;根据AlphaMining方法,挖掘出最终完整的过程模型;利用得到的过程模型去反演更新后的实际业务流程,能够使得更新后的实际业务流程得到正确的表达。
在介绍本发明之前,先对一些基本概念进行说明:
定义元组;
设B是一个集合,则x=(b1,b2,···,bn)是一个n个元素组成的元组。
定义序列;
设S是一个集合,δ=<δ[1],δ[2],···δ[n]>是S上的一个序列;
其中,δ[i]∈S表示δ中的第i个元素,i∈{0,1,2,...,n},|δ|=n表示δ的长度;δ(a)表示a在δ中出现的次数,S*表示集合S上所有有限序列的集合;
对于所有的δ∈S*并且1≤i≤j≤|δ|,δij表示δ中从δ[i]到δ[j]的子序列。
定义迹和事件日志;
设A是一个活动集合;若活动序列属于δ∈A*,A*表示集合A上的所有序列集合,则δ称为一条迹;若存在L∈B(A*)是迹在集合A上的一个多重集,则称为L为一个事件日志。
定义Petri网;
满足下列条件的三元组N=(P,T;F)称作一个网;
(1)
Figure BDA0002621699280000101
(2)
Figure BDA0002621699280000102
(3)
Figure BDA0002621699280000103
其中,P表示库所,T表示变迁,F表示流关系。
定义前活动集和后活动集;
设N=(P,T;F)为一个网,对于x∈P∪T:
记·x={y|y∈P∪T∧(y,x)∈F};x·={y|y∈P∪T∧(y,x)∈F};
称·x为x前集或输入集,x·为x后集或输出集,y∈P∪T。
定义标识网;
映射M:S→{0,1,2…}成为网的一个标识;
二元组(N,M),即四元组(P,T;F,M)称为一个标识网。
定义变迁规则;
一个网系统是一个标识网∑=(P,T;F,M),并具有下面的变迁发生规则:
(1)对于变迁t∈T,如果
Figure BDA0002621699280000111
则说明变迁t在标识M有发生权,记为M[t>;
(2)若M[t>,则在标识M下,变迁t能够发生,从标识M发生变迁t得到一个新的标识M',记为M[t>M',对
Figure BDA0002621699280000112
定义工作流网;
设WFN=(PN,i,o)称为一个工作流网,当且仅当:
(1)PN=(P,T;F,M)是一个Petri网;
(2)存在一个初始库所i∈P,并且
Figure BDA0002621699280000113
(3)存在一个终止库所o∈P,并且
Figure BDA0002621699280000114
对于
Figure BDA0002621699280000115
x位于从i到o的一条路径上。
定义基于日志的活动次序关系;
令L∈B(A*)是一个基于活动集合A的事件日志,对于
Figure BDA0002621699280000116
b∈L:
(1)跟随关系:
a>L b当且仅当存在一条迹δ=<t1,t2,t3,···,tn>,i∈{1,2,···,n-1}使得δ∈L,ti=a且ti+1=b;
(2)因果关系:a→Lb当且仅当a>Lb且b≯La;
(3)并发关系:a||Lb当且仅当a>Lb且b>La;
(4)排他关系:a#Lb当且仅当a≯Lb且b≯La。
定义全局完备性日志;
令T为有限的活动集合,PN是基于T的过程模型,L是基于T的事件日志;
事件日志L是全局完备的当且仅当所有出现在日志中的轨迹与过程模型PN执行过程中产生的所有可能关于有限的活动集合T的序列都是等价的。
定义局部完备性日志
令T代表有限的活动集合,令L∈B(T)代表事件日志,则L满足局部完备性的条件是:
(1)假设δ是模型PN产生的任意一条可执行轨迹,则满足
Figure BDA0002621699280000117
(2)对于t∈T,必存在一条轨迹δ∈L且t∈δ。
下面结合附图以及具体实施方式对本发明作进一步详细的说明:
如图11示出了本发明实施例中基于Petri网挖掘混合多并发结构提高业务流程效率的方法流程示意图。由图11可知,本发明方法包括以下步骤:
I.获取事件日志中的活动,得到符合最简二度循环结构的活动,将这些活动进行重新定义,用定义的新的活动集将符合条件的活动分别收集起来;新的活动集即:
三角形二度循环的开始活动集Asta_triangle、四边形二度循环的开始活动集Asta_quad、三角形二度循环的结束活动集Aend_triangle以及四边形二度循环的结束活动集Aend_quad
定义三角形二度循环,用▲>L<L▲表示;
令PN=(P,T;F,M0)为一个基本Petri网模型,其中,M0表示初始标识。
活动a,b是N中的两个变迁,即a,b∈T。
则活动a,b构成三角形二度循环a▲>L b或b<L▲a当且仅当:
(1)·a=b·,a·=·b且a≠b,
Figure BDA0002621699280000121
(2)假设M1∈R(M0),使得M1[a>M2,且不存在M1[δ>M2,其中,δ为有限变迁序列,则仅存在M2[b>M1,若存在M2非最终标识且存在M2[x>M3,其中x∈T,a≠x≠b。
其中,R(M0)表示初始标识集;
M1[a>M2表示当活动a使能时,能够从标识M1到标识M2
M1[δ>M2表示当有限变迁序列δ使能时,能够从标识M1到标识M2
M2[b>M1表示当活动b使能时,能够从标识M2到标识M1
M2[x>M3表示当活动x使能时,能够从标识M2到标识M3
定义四边形二度循环,用■>L<L■表示;
令PN=(P,T;F,M0)为一个基本Petri网模型,活动a,b是N中的两个变迁,即a,b∈T,活动a,b构成四边形二度循环a■>L b或b<L■a,当且仅当:
(1)·a=b·,a·=·b且a≠b,
Figure BDA0002621699280000122
(2)假设M1∈R(M0),使得M1[a>M2,且不存在M1[δ>M2,则仅存在M2[b>M1,若存在M1非最终标识且存M1[x>M3,x∈T,a≠x≠b;
其中,M1[x>M3表示当活动x使能时,能够从标识M1到标识M3
定义混合多并发结构;
若PN中含有并发结构,并且该并发结构中至少包含两个不同种类的二度循环,即至少含有一个三角形二度循环和一个四边形二度循环,则称之为混合多并发结构。
定义开始活动和结束活动;
假设任意两个活动ai,bi能够满足构成三角形二度循环或者四边形二度循环,即满足ai>L bi或ai>L bi,则将活动ai称为二度循环的开始活动,活动bi称为二度循环的结束活动。
定义二度循环开始活动集和二度循环结束活动集;
令二度循环开始活动集为Asta,二度循环结束活动集为Aend,Asta和Aend满足:
(1)
Figure BDA0002621699280000131
(2)
Figure BDA0002621699280000132
定义并发活动对集合;
并发活动对集合A par中的元素是事件日志L中所有满足||L关系的活动组成的二元组,即:
Figure BDA0002621699280000133
其中,i∈{0,1,2,...,n}。
获取并发活动对集合Apar和直接跟随活动对集合Adir的过程具体为:
I.1.1.对事件日志L中的每条迹进行遍历,获取任意一条迹中的两个活动a,b;
I.1.2.判断每条迹中的任意两个活动是不是满足直接跟随关系;若满足,则将满足直接跟随关系的两个活动组成的活动对放入到直接跟随关系对Adir_all中;
I.1.3.获取直接跟随关系对Adir_all中的并行关系对,放入并发活动对集合Apar中,同时获取除去并发关系对的直接跟随关系对,放入直接跟随活动对集合Adir中;
I.1.4.返回并发活动对集合Apar和直接跟随活动对集合Adir
例如,过程模型如图1所示,执行过程模型可得到满足不含“aba”特征的局部完备日志L1={<a,b,c,d,e,b,d,f>,<a,d,b,c,e,d,b,f>,<a,b,d,c,b,e,c,d,b,f>,<a,d,e,b,d,c,b,e,d,f>};
执行步骤I.1.1-I.1.4可得:
Adir_all={(a,b),(b,c),(c,d),(d,e),(e,b),(b,d),(d,f),(a,d),(d,b),(c,e),(e,d),(b,f),(d,c),(b,e),(e,c),(c,b)};
Apar={(b,c),(c,d),(d,e),(e,b),(b,d),(c,e)},Adir={(a,b),(a,d),(b,f),(d,f)}。
Adir={(a,b),(a,d),(b,f),(d,f)}。
获取二度循环的开始活动集Acir_sta和二度循环的结束活动集Acir_end的具体过程为:
I.2.1.分别将直接跟随活动对集合Adir拆分成两个活动集合,然后将拆分后的两个活动集合分别放入除去并发关系的直接跟随活动集Adir_set和并发关系活动集Apar_set中;
例如,活动对(a,b)∈直接跟随活动对集合Adir,则Adir_set←Adir_set∪{a}∪{b};
I.2.2.若直接跟随活动对集合Adir的第一个活动a属于直接跟随活动集Adir_set,第二个活动b属于并发关系活动集Apar_set,则将活动a放入并发结构前活动集Apre_concur中,将活动b放入并行初始活动集Apar_sta中;
若直接跟随活动对集合Adir中的第一个活动a属于并发关系活动集Apar_set,第二个活动b属于直接跟随活动集Adir_set,则将活动b放入并发结构后活动集Aaft_concur中;
I.2.3.将一般循环的初始活动从并行初始活动集Apar_sta中去除,得到循环并行结构的并行初始变迁,放入二度循环的开始活动集Acir_sta
I.2.4.遍历并发关系活动集Apar_set,同时将并行初始活动集Apar_sta中的活动删除,得到剩余的并发关系活动集Apar_remain
I.2.5.根据循环活动在迹中的数量特征,将在任意一条迹中出现次数大于1并且属于并发关系活动集Apar_remain的活动,放入循环结束活动集合Acir_end中;
I.2.6.返回二度循环的开始活动集Acir_sta和二度循环的结束活动集Acir_end
例如,过程模型如图2,执行过程模型得到满足不含“aba”特征的局部完备日志L2。L2={<a,b,c,d,e,f,i,k>,<a,b,d,c,e,f,g,h,i,j,g,i,h,g,j,i,h,k>,<a,b,d,e,c,f,i,g,j,i,h,j,g,i,h,k>,<a,d,b,c,e,f,i,j,g,h,i,k>,<a,d,b,e,c,f,g,i,h,j,i,k>,<a,d,e,b,c,f,i,g,j,h,i,k>}。
通过步骤I.1.1-I.1.4,得到Apar={(b,d),(b,e),(c,d),(c,e),(g,h),(g,i),(g,j),(h,i),(h,j),(i,j)},Adir={(a,b),(a,d),(c,f),(e,f),(f,g),(h,k),(f,i),(i,k)}。
通过步骤I.2.1-I.2.6可得Acir_sta={g,i}和Acir_end={h,j}。
获取三角形二度循环的开始活动集Asta_triangle、四边形二度循环的开始活动集Asta_quad、三角形二度循环的结束活动集Aend_triangle以及四边形二度循环的结束活动集Aend_quad的过程为:
I.3.1.根据三角形二度循环和四边形二度循环的特点,分别得到三角形二度循环开始活动集Asta_triangle和四边形二度循环结束活动集Aend_quad
I.3.2.从二度循环的开始活动集Acir_sta中去掉属于三角形二度循环开始活动集Asta_triangle中的活动,得到四边形二度循环的开始活动集Asta_quad
I.3.3.从二度循环的结束活动集Acir_end中去掉属于四边形二度循环的结束活动集Aend_quad中的活动,得到三角形二度循环的结束活动集Aend_triangle
I.3.4.返回三角形二度循环的开始活动集Asta_triangle、四边形二度循环的开始活动集Asta_quad、三角形二度循环的结束活动集Aend_triangle以及四边形二度循环的结束活动集Aend_quad
例如,过程模型如图2所示,满足局部完备性的事件日志为L2
通过步骤I.2.1-I.2.6可以得到Acir_sta={g,i}和Acir_end={h,j}。
运行步骤I.3.1-I.3.4可知:
首先得到Asta_triangle={i},Aend_quad={h};
然后将Asta_triangle={i}从Acir_sta={g,i}中去除,得到Asta_quad={g};
再将Aend_quad={h}从Acir_end={h,j}中去除,得到Aend_triangle={j};
最后返回Asta_triangle={i},Aend_triangle={j},Asta_quad={g},Aend_quad={h}。
II.根据活动在迹中的数量特征和位置特征,为便于识别活动在迹中的特征,本发明用数量标记矩阵和位置标记矩阵正确匹配识别同类型二度短循环结构,下面给出了活动在迹中数量和活动在迹中位置的定义;并用数量标记矩阵和位置标记矩阵来表示。
定义活动在迹中的数量;
设存在事件日志L=<δ12,...,δn>,i,j∈{1,2,...,n},活动ai∈δj,用Sum(aij)表示在迹δj中活动ai出现的总次数,Sum(ai,L)表示在整个事件日志L中活动ai出现的次数。
定义活动在迹中的位置;
设存在事件日志L=<δ12,...,δn>,i,j∈{1,2,...,n},令δn=<a1,a2,a3,...,ai,...an>,若迹δn中不含有重名活动,则称Loc(ain)=i,其中,i为活动ai在迹δn中的位置的下标。
若迹中含有重名活动,用FirstLoc(ain)表示活动ai在迹δn中第一次出现的位置;用LastLoc(ain)表示活动ai在迹δn中最后一次出现的位置。
定义数量标记矩阵;
定义集合TS=Asta_triangle∪Aend_triangle,集合QS=Asta_quad∪Aend_quad;则MTS[|L|][|TS|]称为三角形二度循环的数量标记矩阵;MQS[|L|][|QS|]称为四边二度循环的数量标记矩阵。
其中,|L|表示事件日志L的长度;|TS|表示三角形二度循环的开始活动和结束活动的集合中活动;|QS|表示四边形二度循环的开始活动和结束活动的集合中的活动;[|L|][|TS|]表示三角形二度循环的数量标记矩阵的行和列;[|L|][|QS|]表示四边二度循环的数量标记矩阵的行和列。
例如,过程模型如图3,执行过程模型可得到满足不含“aba”特征的局部完备日志L4,L4={<a,d,h>,<a,b,c,d,e,f,g,d,e,b,c,d,f,g,e,d,h>,<a,d,b,e,c,f,d,g,f,b,c,g,h>,<a,f,d,b,g,c,e,f,b,c,g,d,f,e,g,b,d,c,h>,<a,d,b,f,g,c,b,e,d,b,f,c,g,h>}。
执行步骤I.1.1-I.1.4、步骤I.2.1-I.2.6、步骤I.3.1-I.3.4,可得到Asta_triangle={d},Aend_triangle={e},Asta_quad={b,f}和Aend_quad={c,g}。
MTS[|L|][|TS|]和MQS[|L|][|QS|]分别为5×2和5×4的矩阵,如表1和表2所示。
表1三角形2度循环数量标记矩阵MTS[5][2]
d e
δ1 1 0
δ2 4 3
δ3 2 1
δ4 3 2
δ5 2 1
表2四边形2度循环数量标记矩阵MQS[5][4]
Figure BDA0002621699280000151
Figure BDA0002621699280000161
定义位置标记矩阵;
定义TS=Asta_triangle∪Aend_triangle,集合QS=Asta_quad∪Aend_quad,则LMTS[|L|][2|TS|]称为三角形二度循环的位置标记矩阵,LMQS[|L|][2|QS|]称为四边二度循环的位置标记矩阵。
其中,|L|表示事件日志L的长度,[2|TS|]表示三角形二度循环的位置标记矩阵的列是二倍的|TS|,[2|QS|]表示四边形二度循环的位置标记矩阵的列是二倍的|QS|,[|L|][2|TS|]表示三角形二度循环的位置标记矩阵的行和列,[|L|][2|QS|]表示四边二度循环的位置标记矩阵的行和列。
对LMTS[|L|][2|TS|],满足
Figure BDA0002621699280000162
aj∈TS,若0<j≤|TS|,0<i≤|L|则LMTS[i][j]=FirstLoc(aji);若|TS|<j≤2|TS|,0<i≤|L|则LMTS[i][j]=LastLoc(aji);
对LMQS[|L|][2|QS|],满足
Figure BDA0002621699280000163
aj∈TS,若0<j≤|QS|,0<i≤|L|,则LMQS[i][j]=FirstLoc(aji);若|TS|<j≤2|TS|,0<i≤|L|则LMQS[i][j]=LastLoc(aji);
当符合条件的活动不在迹中出现时,位置标记矩阵对应位置用0表示。
例如,过程模型如图3所示,在上边的例子中,日志L4,执行步骤I.1.1-I.1.4、步骤I.2.1-I.2.6、步骤I.3.1-I.3.4,可得到Asta_quad={b,f},Aend_quad={c,g},可以得到,QS={b,f,c,g},四边形的位置标记矩阵LMQS为5×8的矩阵,具体如表3所示。
表3四边形2度循环位置标记矩阵MTS[5][8]
b f c g b f c g
δ1 0 0 0 0 0 0 0 0
δ2 2 6 3 7 10 13 11 14
δ3 3 6 5 8 10 9 11 12
δ4 4 2 6 5 16 13 18 15
δ5 3 4 6 5 10 11 12 13
获取满足数量标记矩阵的三角形二度循环匹配二元组集合Tri_Mat_Set1以及四边形二度循环匹配二元组集合Quad_Mat_Set1的具体过程如下:
II.1.1.将三角形二度循环的开始活动集Asta_triangle和三角形二度循环的终止活动集Aend_triangle按顺序变成数组并存入Arr_Triangle[],将四边形二度循环的开始活动集Asta_quad和四边形二度循环的终止活动集Aend_quad按顺序变成数组并存入Arr_Quad[];
II.1.2.遍历事件日志L中的每一条迹,分别统计出二度短循环中活动的数量,并放入到对应的数量标记矩阵MTS[|L|][|TS|]和MQS[|L|][|QS|]中;
II.1.3.分别遍历三角形二度循环的数量标记矩阵MTS[|L|][|TS|]和四边形二度循环的数量标记矩阵MQS[|L|][|QS|],将符合二度循环活动数量特征的活动对集分别放入三角形二度循环匹配二元组集合Tri_Mat_Set1以及四边形二度循环匹配二元组集合Quad_Mat_Set1中;
II.1.4.返回满足数量标记矩阵的三角形二度循环匹配二元组集合Tri_Mat_Set1以及四边形二度循环匹配二元组集合Quad_Mat_Set1。
获取满足位置标记矩阵的三角形二度循环匹配二元组集合Tri_Mat_Set2和四边形二度循环匹配二元组集合Quad_Mat_Set2的具体过程为:
II.2.1.构建表示三角形二度循环的位置数组Loc_Arr_Tri[]和四边形二度循环的位置数组Loc_Arr_Quad[];
II.2.2.分别构建三角形二度循环的位置标记矩阵LMTS[|L|][2|TS|]和四边二度循环的位置标记矩阵LMQS[|L|][2|QS|],并赋相应的值;
II.2.3.遍历位置标记矩阵LMTS[|L|][2|TS|]和LMQS[|L|][2|QS|],将满足二度循环活动位置特征定理的活动对分别放入三角形二度循环匹配二元组集合Tri_Mat_Set2和四边形二度循环匹配二元组集合Quad_Mat_Set2;
II.2.4.返回满足位置标记矩阵的三角形二度循环匹配二元组集合Tri_Mat_Set2和四边形二度循环匹配二元组集合Quad_Mat_Set2的值。
获取最终二度循环匹配二元组集合Tri_Mat_Set和Quad_Mat_Set的过程具体为:
II.3.1.将三角形二度循环匹配二元组集合Tri_Mat_Set1和Tri_Mat_Set2取交集,放入最终二度循环匹配二元组集合Tri_Mat_Set中;
II.3.2.将四边形二度循环匹配二元组集合Quad_Mat_Set1和Quad_Mat_Set2取交集,放入最终二度循环匹配二元组集合Quad_Mat_Set中;
II.3.3.返回最终二度循环匹配二元组集合Tri_Mat_Set和Quad_Mat_Set。
例如,满足条件的局部完备性日志,L5={<a,b,c,d,e,f,g,h,e,g,f,h,g,e,i,j,k,l,m,j,l,k,m,l,j,m,k,n>,<a,b,c,d,g,h,e,f,g,e,h,f,e,g,i,n>,<a,c,b,d,e,g,f,h,g,e,i,l,j,m,k,l,j,m,k,j,l,m,k,n>,<a,c,b,d,e,f,g,h,e,g,f,h,g,e,j,l,k,m,l,j,k,m,n>}。
执行步骤I.1.1-I.3.4可得,三角形二度循环开始活动集Asta_triangle={e,g},三角形二度循环结束活动集Aend_triangle={h,f},四边形二度循环开始活动集Asta_quad={j,l},四边形二度循环结束活动集Aend_quad={k,m},将步骤I.3.4得到的结果作为步骤II.1.1和II.2.2的输入。
执行步骤II.1.1-II.1.4可得到满足数量标记矩阵的三角形二度循环匹配二元组集合Tri_Mat_Set1={(e,f),(e,h),(g,h),(g,f)}和四边形二度循环匹配二元组集合Quad_Mat_Set1={(j,k),(l,m)}。执行步骤II.2.1-II.2.4,可得到满足位置标记矩阵的三角形二度循环匹配二元组集合Tri_Mat_Set2={(e,f),(g,h)}和四边形二度循环匹配二元组集合Quad_Mat_Set2={(j,k),(j,m),(l,m),(l,k)}。
执行步骤II.3.1-II.3.3可得,Tri_Mat_Set={(e,f),(g,h)},Quad_Mat_Set={(j,k),(l,m)}。
与原过程模型相比,本实施例能够得到正确的匹配结果。
Tri_Mat_Set和Quad_Mat_Set中的活动对即构成了三角形二度循环和四边形二度循环。
III.根据前面获取的二度循环匹配二元组集合Tri_Mat_Set和Quad_Mat_Set,利用AlphaMining方法在不完备日志中挖掘混合多并发结构的过程模型AlphaMining(L)。
具体过程如下:设L是一个基于
Figure BDA0002621699280000181
的事件日志;
(1)获取出现在日志L中的所有活动,即
Figure BDA0002621699280000182
其中,TL表示日志L中包含活动的集合。
(2)获取TI,也就是在某条迹中第一个出现的所有活动,即
Figure BDA0002621699280000183
其中,TI是开始活动集;first(δ)表示某条迹中第一个出现的所有活动。
(3)获取To,也就是在某条迹中最后出现的所有活动
Figure BDA0002621699280000184
其中,To是结束活动集;last(δ)表示某条迹中最后出现的所有活动。
(4)由步骤I.1.1-I.3.4得到三角形二度循环的开始活动集Asta_triangle三角形二度循环的结束活动集Aend_triangle,即
Figure BDA0002621699280000185
(5)由步骤I.1.1-I.3.4得到四边行二度循环的开始活动集Asta_quad三角形二度循环的结束活动集Aend_quad,即
Figure BDA0002621699280000186
其中,ci表示活动,di表示活动。
(6)由步骤II.1.1-II.3.3得到三角形二度循环匹配二元组集合Tri_Mat_Set,即Tri_Mat_Set={(a,b)|(a∈Asta_triangle)∧(b∈Aend_triangle)};其中,a,b表示活动。
(7)由步骤II.1.1-II.3.3得到四边形二度循环匹配二元组集合Quad_Mat_Set,即Quad_Mat_Set={(c,d)|(c∈Asta_quad)∧(d∈Asta_quad)};其中,c,d表示活动。
(8)获取日志中相邻的活动对集XL,即
Figure BDA0002621699280000187
Figure BDA0002621699280000188
其中,A,B均表示活动的集合,a1,a2表示活动,b1,b2表示活动。
(9)进一步缩小活动对集合的范围,获取符合条件的活动对集合YL,即
Figure BDA0002621699280000189
Figure BDA00026216992800001810
其中,A,B均表示活动的集合,A′,B′分别表示最后得到的活动的集合。
(10)获取符合条件的库所集PL,每一个库所p(A,B)连接活动A和B,其中包含唯一的开始库所iL和唯一的终止库所oL,即PL={p(A,B)|(A,B)∈YL∪{iL,oL}}。
(11)获取过程模型的所有的弧FL,即FL={(a,p(A,B))|(A,B)∈YL∧a∈A}∪{(p(A,B),B)|(A,B)∈YL∧b∈B}∪{(iL,t)|t∈TI}∪{(io,t)|t∈To};其中,iL表示开始库所,io表示终止库所。
(12)得到最后的过程模型,即AlphaMining(L)=(PL,TL,FL);利用得到的过程模型AlphaMining(L)去反演更新后的实际业务流程,使得更新后的实际业务流程得到正确的表达。
下面将本发明实施例中提出的方法与Alpha+方法、IM方法、ILP方法作对比分析,以验证本发明方法在过程挖掘中的正确性和有效性。
以某公司财务记账流程为例,过程中包含有混合多并发短循环结构。
具体流程可分为四个阶段:
第一阶段,由业务员收集原始凭证信息,并交由审核人员初步审核票据,将审核通过的票据给录入人员,录入原始凭证信息,形成临时凭证;第二阶段,复核人员对临时凭证的凭证信息进行复核,主要有(1)复核票据时间,若时间不对,则提交更改时间信息,然后继续复核金额;(2)复核票据金额,若金额不对,则提交更改金额信息,然后继续复核金额;(3)复核票据项目,若项目不对,则提交更改项目信息,然后继续复核项目;(4)复核非常规项目1或非常规项目2,需要与项目1或项目2相关领导签字,可重复执行,若没有该项目也可不执行。第三阶段,获得已审核凭证,记账人员汇总入账;第四阶段,账簿管理人员处理汇总表,形成各种报表和形成总账明细表,最后打印,封账,报税。具体流程如图4所示。
根据实际的过程模型,选取了八组实际的日志来进行测试本文所提方法的可行性和有效性,八组日志分别只考虑活动名称,其他属性不在考虑之内。将选取的八组日志进行处理,要求每组日志中都包含所有必要的因果跟随关系,删除包含“aba”形式的迹,获得不完备日志。日志的具体其他属性如表4所示,活动名称和符号对应表如表5所示。
表4实际模型局部完备性日志属性
迹数 事件数 活动数
L01 88 2226 20
L02 307 7167 20
L03 1457 34117 20
L04 2161 50725 20
L05 3159 77553 20
L06 4383 114796 20
L07 5097 122195 20
L08 6293 149243 20
表5活动和符号对应表
Figure BDA0002621699280000201
正确性在过程挖掘过程中是放在第一位的,首先应该得到有效的证明,下面给出基于表4中的日志,分别用不同的方法对日志进行挖掘,得到的过程模型如图5-8所示。
图5是由Alpha+方法挖掘的得到的过程模型示意图。其中存在三个独立的节点,都是三角形二度循环中结束活动,破坏了三角形二度循环的结构,缺少必要的弧来连接四边形二度循环中的活动,因此,Alpha+方法不能正确挖掘出混合多并发短循环结构。
图6是由IM方法挖掘得到的过程模型示意图,由图6可知,该IM方法通过添加大量的不可见变迁和弧来把二度循环结构拆分开来,破坏了原来的循环结构,让过程模型结构变得更加复杂,得到的过程模型也是不合理的。
图7是通过ILP方法得到的过程模型示意图。由图7可知,ILP方法在发现二度短循环时出现了问题,特别是对四边形二度循环结构的挖掘,得到的过程模型是不合理的。
图8是利用本发明方法(即AlphaMining方法)得到的过程模型示意图,由图8可知,本发明方法挖掘出的过程模型能够正确的发现二度短循环结构,挖掘出的过程模型和给定的真实模型是一致的,从而验证了AlphaMining方法的正确性。
拟合度表示日志中的迹在过程模型中重演的能力,拟合度越高,表示迹在过程模型中的重演的能力就越强。将表4中的给定的日志L01-L08作为输入,用不同的方法挖掘出日志对应的过程模型,获得每组日志和模型之间的拟合度,具体如图9所示
从图9可以看出,由于Alpha+方法挖掘得到的过程模型含有独立的节点,同时缺少必要的弧,因此Alpha+的拟合度是比较低的,范围大约在0.68-0.79之间。另外的三种方法得到的拟合度都为1,说明表4中的事件日志都能够在这三种方法挖掘出的过程模型中重演。
精确度表示模型重演日志的能力,精确度越高,过程模型重演日志的能力越强。将不同过程挖掘方法得到的过程模型和日志L00-L07作为测量精确度的输入,可以得到四种不同方法对应的过程模型和日志之间的精确度,具体如图10所示。
如图10所示,在Alpha+方法挖掘出的过程模型中,二度循环中的活动变成了独立的节点,不能正确表示二度循环结构,导致精确度是最低的,得到的过程模型是不合理的。IM方法得到的过程模型,精确度在0.25左右,由于过程模型中添加了大量的不可见变迁,会产生更加复杂多样的迹,导致精确度不高。ILP方法挖掘得到的过程模型,精确度在0.2附近。本文提出的AlphMining方法得到的精确度是这几种方法中最高的。简洁度,在能够正确反映过程模型结构的情况下,使用的变迁数和弧数越少,说明该模型的间接程度越高。
图5是Alpha+方法挖掘出的过程模型,由于日志中不包含“aba”模式的迹,导致活动之间的因果关系缺失,缺少必要的弧,来连接独立的节点。
图6是执行方法IM得到的挖掘结果,该模型中出现了大量的不可见变迁和弧,不能清晰表示出过程模型中存在的混合多并发短循环结构,导致过程模型变得复杂。
图7表示的过程模型是由ILP方法挖出的,该模型中由于没有挖掘出四边形二度短循环,形成了一些孤立的节点,并增加了一些弧,这些都不利于过程模型的简洁性。
图8表示由本发明方法挖掘得到的过程模型示意图,由图8能够看出,经过本发明方法挖掘的过程模型和真实过程模型一样,没有多余的节点和弧,简洁度较高。
综上所述,本发明提出的AlphaMining方法,相比于比Alpha+、IM、ILP等方法在正确性、拟合度、精确度、简洁度等方面都表现出良好的竞争力,并且对含有多并发短循环结构的实际过程模型的挖掘有很好的表达,使得业务流程执行效率明显提高。
当然,以上说明仅仅为本发明的较佳实施例,本发明并不限于列举上述实施例,应当说明的是,任何熟悉本领域的技术人员在本说明书的教导下,所做出的所有等同替代、明显变形形式,均落在本说明书的实质范围之内,理应受到本发明的保护。

Claims (1)

1.一种基于Petri网挖掘混合多并发结构提高业务流程效率的方法,其特征在于:
包括以下步骤:
I.获取事件日志中的活动,得到符合最简二度循环结构的活动,将这些活动进行重新定义,用定义的新的活动集将符合条件的活动分别收集起来;新的活动集即:
三角形二度循环的开始活动集Asta_triangle、四边形二度循环的开始活动集Asta_quad、三角形二度循环的结束活动集Aend_triangle以及四边形二度循环的结束活动集Aend_quad
定义元组;
设B是一个集合,则x=(b1,b2,···,bn)是一个n个元素组成的元组;
定义序列;
设S是一个集合,δ=<δ[1],δ[2],···δ[n]>是S上的一个序列;
其中,δ[i]∈S表示δ中的第i个元素,i∈{0,1,2,...,n},|δ|=n表示δ的长度;δ(a)表示a在δ中出现的次数,S*表示集合S上所有有限序列的集合;
对于所有的δ∈S*并且1≤i≤j≤|δ|,δij表示δ中从δ[i]到δ[j]的子序列;
定义迹和事件日志;
设A是一个活动集合;若活动序列属于δ∈A*,A*表示集合A上的所有序列集合,则δ称为一条迹;若存在L∈B(A*)是迹在集合A上的一个多重集,则称为L为一个事件日志;
定义Petri网;
满足下列条件的三元组N=(P,T;F)称作一个网;
(1)
Figure FDA0002621699270000011
(2)
Figure FDA0002621699270000012
(3)
Figure FDA0002621699270000013
其中,P表示库所,T表示变迁,F表示流关系;
定义前活动集和后活动集;
设N=(P,T;F)为一个网,对于x∈P∪T:
·x={y|y∈P∪T∧(y,x)∈F};x·={y|y∈P∪T∧(y,x)∈F};
·x为x前集或输入集,x·为x后集或输出集,y∈P∪T;
定义标识网;
映射M:S→{0,1,2…}成为网的一个标识;
二元组(N,M),即四元组(P,T;F,M)称为一个标识网;
定义变迁规则;
一个网系统是一个标识网∑=(P,T;F,M),并具有下面的变迁发生规则:
(1)对于变迁t∈T,如果
Figure FDA0002621699270000021
则说明变迁t在标识M有发生权,记为M[t>;
(2)若M[t>,则在标识M下,变迁t能够发生,从标识M发生变迁t得到一个新的标识M',记为M[t>M',对
Figure FDA0002621699270000022
Figure FDA0002621699270000023
定义工作流网;
设WFN=(PN,i,o)称为一个工作流网,当且仅当:
(1)PN=(P,T;F,M)是一个Petri网;
(2)存在一个初始库所i∈P,并且
Figure FDA0002621699270000024
(3)存在一个终止库所o∈P,并且
Figure FDA0002621699270000025
对于
Figure FDA0002621699270000026
x位于从i到o的一条路径上;
定义基于日志的活动次序关系;
令L∈B(A*)是一个基于活动集合A的事件日志,对于
Figure FDA0002621699270000027
b∈L:
(1)跟随关系:
a>Lb当且仅当存在一条迹δ=<t1,t2,t3,···,tn>,i∈{1,2,···,n-1}使得δ∈L,ti=a且ti+1=b;
(2)因果关系:a→Lb当且仅当a>Lb且b≯La;
(3)并发关系:a||Lb当且仅当a>Lb且b>La;
(4)排他关系:a#Lb当且仅当a≯Lb且b≯La;
定义全局完备性日志;
令T为有限的活动集合,PN是基于T的过程模型,L是基于T的事件日志;
事件日志L是全局完备的当且仅当所有出现在日志中的轨迹与过程模型PN执行过程中产生的所有可能关于有限的活动集合T的序列都是等价的;
定义局部完备性日志
令T代表有限的活动集合,令L∈B(T)代表事件日志,则L满足局部完备性的条件是:
(1)假设δ是过程模型PN产生的任意一条可执行轨迹,则满足
Figure FDA0002621699270000028
(2)对于t∈T,必存在一条轨迹δ∈L且t∈δ;
定义三角形二度循环,用▲>L<L▲表示;
令PN=(P,T;F,M0)为一个基本Petri网模型,其中,M0表示初始标识;
活动a,b是N中的两个变迁,即a,b∈T;
则活动a,b构成三角形二度循环a▲>Lb或b<L▲a当且仅当:
(1)·a=b·,a·=·b且a≠b,
Figure FDA0002621699270000031
(2)假设M1∈R(M0),使得M1[a>M2,且不存在M1[δ>M2,其中,δ为有限变迁序列,则仅存在M2[b>M1,若存在M2非最终标识且存在M2[x>M3,其中x∈T,a≠x≠b;
其中,R(M0)表示初始标识集;
M1[a>M2表示当活动a使能时,能够从标识M1到标识M2
M1[δ>M2表示当有限变迁序列δ使能时,能够从标识M1到标识M2
M2[b>M1表示当活动b使能时,能够从标识M2到标识M1
M2[x>M3表示当活动x使能时,能够从标识M2到标识M3
定义四边形二度循环,用■>L<L■表示;
令PN=(P,T;F,M0)为一个基本Petri网模型,活动a,b是N中的两个变迁,即a,b∈T,活动a,b构成四边形二度循环a■>Lb或b<L■a,当且仅当:
(1)·a=b·,a·=·b且a≠b,
Figure FDA0002621699270000032
(2)假设M1∈R(M0),使得M1[a>M2,且不存在M1[δ>M2,则仅存在M2[b>M1,若存在M1非最终标识且存M1[x>M3,x∈T,a≠x≠b;
其中,M1[x>M3表示当活动x使能时,能够从标识M1到标识M3
定义混合多并发结构;
若PN中含有并发结构,并且该并发结构中至少包含两个不同种类的二度循环,即至少含有一个三角形二度循环和一个四边形二度循环,则称之为混合多并发结构;
定义开始活动和结束活动;
假设任意两个活动ai,bi能够满足构成三角形二度循环或者四边形二度循环,即满足ai>Lbi或ai>Lbi,则将活动ai称为二度循环的开始活动,活动bi称为二度循环的结束活动;
定义二度循环开始活动集和二度循环结束活动集;
令二度循环开始活动集为Asta,二度循环结束活动集为Aend,Asta和Aend满足:
(1)
Figure FDA0002621699270000033
(2)
Figure FDA0002621699270000034
定义并发活动对集合;
并发活动对集合Apar中的元素是事件日志L中所有满足||L关系的活动组成的二元组,即:
Figure FDA0002621699270000035
其中,i∈{0,1,2,...,n};
获取并发活动对集合Apar和直接跟随活动对集合Adir的过程具体为:
I.1.1.对事件日志L中的每条迹进行遍历,获取任意一条迹中的两个活动a,b;
I.1.2.判断每条迹中的任意两个活动是不是满足直接跟随关系;若满足,则将满足直接跟随关系的两个活动组成的活动对放入到直接跟随关系对Adir_all中;
I.1.3.获取直接跟随关系对Adir_all中的并行关系对,放入并发活动对集合Apar中,同时获取除去并发关系对的直接跟随关系对,放入直接跟随活动对集合Adir中;
I.1.4.返回并发活动对集合Apar和直接跟随活动对集合Adir
获取二度循环的开始活动集Acir_sta和二度循环的结束活动集Acir_end的具体过程为:
I.2.1.分别将直接跟随活动对集合Adir拆分成两个活动集合,然后将拆分后的两个活动集合分别放入除去并发关系的直接跟随活动集Adir_set和并发关系活动集Apar_set中;
I.2.2.若直接跟随活动对集合Adir的第一个活动a属于直接跟随活动集Adir_set,第二个活动b属于并发关系活动集Apar_set,则将活动a放入并发结构前活动集Apre_concur中,将活动b放入并行初始活动集Apar_sta中;
若直接跟随活动对集合Adir中的第一个活动a属于并发关系活动集Apar_set,第二个活动b属于直接跟随活动集Adir_set,则将活动b放入并发结构后活动集Aaft_concur中;
I.2.3.将一般循环的初始活动从并行初始活动集Apar_sta中去除,得到循环并行结构的并行初始变迁,放入二度循环的开始活动集Acir_sta
I.2.4.遍历并发关系活动集Apar_set,同时将并行初始活动集Apar_sta中的活动删除,得到剩余的并发关系活动集Apar_remain
I.2.5.根据循环活动在迹中的数量特征,将在任意一条迹中出现次数大于1并且属于并发关系活动集Apar_remain的活动,放入循环结束活动集合Acir_end中;
I.2.6.返回二度循环的开始活动集Acir_sta和二度循环的结束活动集Acir_end
获取三角形二度循环的开始活动集Asta_triangle、四边形二度循环的开始活动集Asta_quad、三角形二度循环的结束活动集Aend_triangle以及四边形二度循环的结束活动集Aend_quad的过程为:
I.3.1.根据三角形二度循环和四边形二度循环的特点,分别得到三角形二度循环开始活动集Asta_triangle和四边形二度循环结束活动集Aend_quad
I.3.2.从二度循环的开始活动集Acir_sta中去掉属于三角形二度循环开始活动集Asta_triangle中的活动,得到四边形二度循环的开始活动集Asta_quad
I.3.3.从二度循环的结束活动集Acir_end中去掉属于四边形二度循环的结束活动集Aend_quad中的活动,得到三角形二度循环的结束活动集Aend_triangle
I.3.4.返回三角形二度循环的开始活动集Asta_triangle、四边形二度循环的开始活动集Asta_quad、三角形二度循环的结束活动集Aend_triangle以及四边形二度循环的结束活动集Aend_quad
II.根据活动在迹中的数量特征和位置特征,用数量标记矩阵和位置标记矩阵正确匹配识别同类型二度短循环结构,具体过程如下:
定义活动在迹中的数量;
设存在事件日志L=<δ12,...,δn>,i,j∈{1,2,...,n},活动ai∈δj,用Sum(aij)表示在迹δj中活动ai出现的总次数,Sum(ai,L)表示在整个事件日志L中活动ai出现的次数;
定义活动在迹中的位置;
设存在事件日志L=<δ12,...,δn>,i,j∈{1,2,...,n},令δn=<a1,a2,a3,...,ai,…an>,若迹δn中不含有重名活动,则称Loc(ain)=i,其中,i为活动ai在迹δn中的位置的下标;
若迹中含有重名活动,用FirstLoc(ain)表示活动ai在迹δn中第一次出现的位置;用LastLoc(ain)表示活动ai在迹δn中最后一次出现的位置;
定义数量标记矩阵;
定义集合TS=Asta_triangle∪Aend_triangle,集合QS=Asta_quad∪Aend_quad;则MTS[|L|][|TS|]称为三角形二度循环的数量标记矩阵;MQS[|L|][|QS|]称为四边二度循环的数量标记矩阵;
其中,|L|表示事件日志L的长度;|TS|表示三角形二度循环的开始活动和结束活动的集合中活动;|QS|表示四边形二度循环的开始活动和结束活动的集合中的活动;[|L|][|TS|]表示三角形二度循环的数量标记矩阵的行和列;[|L|][|QS|]表示四边二度循环的数量标记矩阵的行和列;
定义位置标记矩阵;
定义TS=Asta_triangle∪Aend_triangle,集合QS=Asta_quad∪Aend_quad,则LMTS[|L|][2|TS|]称为三角形二度循环的位置标记矩阵,LMQS[|L|][2|QS|]称为四边二度循环的位置标记矩阵;
其中,[2|TS|]表示三角形二度循环的位置标记矩阵的列是二倍的|TS|,[2|QS|]表示四边形二度循环的位置标记矩阵的列是二倍的|QS|,[|L|][2|TS|]表示三角形二度循环的位置标记矩阵的行和列,[|L|][2|QS|]表示四边二度循环的位置标记矩阵的行和列;
对LMTS[|L|][2|TS|],满足
Figure FDA0002621699270000051
aj∈TS,若0<j≤|TS|,0<i≤|L|则LMTS[i][j]=FirstLoc(aji);若|TS|<j≤2|TS|,0<i≤|L|则LMTS[i][j]=LastLoc(aji);
对LMQS[|L|][2|QS|],满足
Figure FDA0002621699270000052
aj∈TS,若0<j≤|QS|,0<i≤|L|,则LMQS[i][j]=FirstLoc(aji);若|TS|<j≤2|TS|,0<i≤|L|则LMQS[i][j]=LastLoc(aji);
当符合条件的活动不在迹中出现时,位置标记矩阵对应位置用0表示;
获取满足数量标记矩阵的三角形二度循环匹配二元组集合Tri_Mat_Set1以及四边形二度循环匹配二元组集合Quad_Mat_Set1的具体过程如下:
II.1.1.将三角形二度循环的开始活动集Asta_triangle和三角形二度循环的终止活动集Aend_triangle按顺序变成数组并存入Arr_Triangle[],将四边形二度循环的开始活动集Asta_quad和四边形二度循环的终止活动集Aend_quad按顺序变成数组并存入Arr_Quad[];
II.1.2.遍历事件日志L中的每一条迹,分别统计出二度短循环中活动的数量,并放入到对应的数量标记矩阵MTS[|L|][|TS|]和MQS[|L|][|QS|]中;
II.1.3.分别遍历三角形二度循环的数量标记矩阵MTS[|L|][|TS|]和四边形二度循环的数量标记矩阵MQS[|L|][|QS|],将符合二度循环活动数量特征的活动对集分别放入三角形二度循环匹配二元组集合Tri_Mat_Set1以及四边形二度循环匹配二元组集合Quad_Mat_Set1中;
II.1.4.返回满足数量标记矩阵的三角形二度循环匹配二元组集合Tri_Mat_Set1以及四边形二度循环匹配二元组集合Quad_Mat_Set1;
获取满足位置标记矩阵的三角形二度循环匹配二元组集合Tri_Mat_Set2和四边形二度循环匹配二元组集合Quad_Mat_Set2的具体过程为:
II.2.1.构建表示三角形二度循环的位置数组Loc_Arr_Tri[]和四边形二度循环的位置数组Loc_Arr_Quad[];
II.2.2.分别构建三角形二度循环的位置标记矩阵LMTS[|L|][2|TS|]和四边二度循环的位置标记矩阵LMQS[|L|][2|QS|],并赋相应的值;
II.2.3.遍历位置标记矩阵LMTS[|L|][2|TS|]和LMQS[|L|][2|QS|],将满足二度循环活动位置特征定理的活动对分别放入三角形二度循环匹配二元组集合Tri_Mat_Set2和四边形二度循环匹配二元组集合Quad_Mat_Set2;
II.2.4.返回满足位置标记矩阵的三角形二度循环匹配二元组集合Tri_Mat_Set2和四边形二度循环匹配二元组集合Quad_Mat_Set2的值;
获取最终二度循环匹配二元组集合Tri_Mat_Set和Quad_Mat_Set的过程具体为:
II.3.1.将三角形二度循环匹配二元组集合Tri_Mat_Set1和Tri_Mat_Set2取交集,放入最终二度循环匹配二元组集合Tri_Mat_Set中;
II.3.2.将四边形二度循环匹配二元组集合Quad_Mat_Set1和Quad_Mat_Set2取交集,放入最终二度循环匹配二元组集合Quad_Mat_Set中;
II.3.3.返回最终二度循环匹配二元组集合Tri_Mat_Set和Quad_Mat_Set;
III.根据前面获取的二度循环匹配二元组集合Tri_Mat_Set和Quad_Mat_Set,利用AlphaMining方法在不完备日志中挖掘混合多并发结构的过程模型AlphaMining(L);
具体过程如下:设L是一个基于
Figure FDA0002621699270000061
的事件日志;
(1)获取出现在事件日志L中的所有活动,即
Figure FDA0002621699270000062
其中,TL表示事件日志L中包含活动的集合;
(2)获取TI,也就是在某条迹中第一个出现的所有活动,即
Figure FDA0002621699270000063
其中,TI是开始活动集;first(δ)表示某条迹中第一个出现的所有活动;
(3)获取To,也就是在某条迹中最后出现的所有活动
Figure FDA0002621699270000064
其中,To是结束活动集;last(δ)表示某条迹中最后出现的所有活动;
(4)由步骤I.1.1-I.3.4得到三角形二度循环的开始活动集Asta_triangle三角形二度循环的结束活动集Aend_triangle,即
Figure FDA0002621699270000071
(5)由步骤I.1.1-I.3.4得到四边行二度循环的开始活动集Asta_quad三角形二度循环的结束活动集Aend_quad,即
Figure FDA0002621699270000072
其中,ci表示活动,di表示活动;
(6)由步骤II.1.1-II.3.3得到三角形二度循环匹配二元组集合Tri_Mat_Set,即Tri_Mat_Set={(a,b)|(a∈Asta_triangle)∧(b∈Aend_triangle)};其中,a,b表示活动;
(7)由步骤II.1.1-II.3.3得到四边形二度循环匹配二元组集合Quad_Mat_Set,即Quad_Mat_Set={(c,d)|(c∈Asta_quad)∧(d∈Asta_quad)};其中,c,d表示活动;
(8)获取日志中相邻的活动对集XL,即
Figure FDA0002621699270000073
Figure FDA0002621699270000074
其中,A,B均表示活动的集合,a1,a2表示活动,b1,b2表示活动;
(9)进一步缩小活动对集合的范围,获取符合条件的活动对集合YL,即
Figure FDA0002621699270000075
Figure FDA0002621699270000076
其中,A,B均表示活动的集合,A′,B′分别表示最后得到的活动的集合;
(10)获取符合条件的库所集PL,每一个库所p(A,B)连接活动A和B,其中包含唯一的开始库所iL和唯一的终止库所oL,即PL={p(A,B)|(A,B)∈YL∪{iL,oL}};
(11)获取过程模型的所有的弧FL,即FL={(a,p(A,B))|(A,B)∈YL∧a∈A}∪{(p(A,B),B)|(A,B)∈YL∧b∈B}∪{(iL,t)|t∈TI}∪{(io,t)|t∈To};其中,iL表示开始库所,io表示终止库所;
(12)得到最后的过程模型,即AlphaMining(L)=(PL,TL,FL);利用过程模型AlphaMining(L)去反演更新后的实际业务流程,使得更新后的实际业务流程得到正确的表达。
CN202010785205.0A 2020-08-06 2020-08-06 一种基于Petri网挖掘混合多并发结构提高业务流程效率的方法 Active CN112035423B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010785205.0A CN112035423B (zh) 2020-08-06 2020-08-06 一种基于Petri网挖掘混合多并发结构提高业务流程效率的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010785205.0A CN112035423B (zh) 2020-08-06 2020-08-06 一种基于Petri网挖掘混合多并发结构提高业务流程效率的方法

Publications (2)

Publication Number Publication Date
CN112035423A CN112035423A (zh) 2020-12-04
CN112035423B true CN112035423B (zh) 2023-06-06

Family

ID=73582690

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010785205.0A Active CN112035423B (zh) 2020-08-06 2020-08-06 一种基于Petri网挖掘混合多并发结构提高业务流程效率的方法

Country Status (1)

Country Link
CN (1) CN112035423B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113342495B (zh) * 2021-06-24 2023-11-24 北京杰成合力科技有限公司 一种跨组织多实例子过程模型挖掘方法与系统
CN114880379B (zh) * 2022-05-25 2024-10-11 山东理工大学 基于Petri网保性化简规则的精简流程模型挖掘方法与系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101923672A (zh) * 2010-03-23 2010-12-22 湖南科技大学 一种工作流实例方面成批处理模式的挖掘方法
CA2784572A1 (en) * 2011-08-05 2013-02-05 National Research Council Of Canada Process mining for anomalous cases
CN105069306A (zh) * 2015-08-18 2015-11-18 山东科技大学 基于工作流网模型的事件日志审计方法
CN108984746A (zh) * 2018-07-17 2018-12-11 山东科技大学 一种多并发三角形2度循环的过程模型挖掘方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101923672A (zh) * 2010-03-23 2010-12-22 湖南科技大学 一种工作流实例方面成批处理模式的挖掘方法
CA2784572A1 (en) * 2011-08-05 2013-02-05 National Research Council Of Canada Process mining for anomalous cases
CN105069306A (zh) * 2015-08-18 2015-11-18 山东科技大学 基于工作流网模型的事件日志审计方法
CN108984746A (zh) * 2018-07-17 2018-12-11 山东科技大学 一种多并发三角形2度循环的过程模型挖掘方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
an algorithm for mining indirect dependencies from loop choice driven loop structure via petri nets;Hongwei Sun等;IEEE transactions on systems,man,and cybernitics:systems;第第52卷卷(第第9期期);5411-5423 *
一种从无"aba"模式的日志中挖掘2度循环的方法;林雷蕾;周华;代飞;朱锐;李彤;;软件学报;第29卷(第11期);3278-3294 *
基于Petri网的分层业务过程挖掘方法;刘聪;程龙;曾庆田;闻立杰;欧阳春;;计算机集成制造系统;第26卷(第06期);1525-1537 *

Also Published As

Publication number Publication date
CN112035423A (zh) 2020-12-04

Similar Documents

Publication Publication Date Title
Ferreira et al. Approaching process mining with sequence clustering: Experiments and findings
CN112035423B (zh) 一种基于Petri网挖掘混合多并发结构提高业务流程效率的方法
CN111694963B (zh) 一种基于事项关联网络的关键政务流程识别方法与装置
CN106897285A (zh) 数据要素抽取分析系统及数据要素抽取分析方法
CN114281809B (zh) 一种多源异构数据清洗方法及装置
CN102541736A (zh) 一种软件可靠性执行过程加速测试方法
CN107797916A (zh) Ddl语句审核方法和装置
CN114880379B (zh) 基于Petri网保性化简规则的精简流程模型挖掘方法与系统
CN109325062A (zh) 一种基于分布式计算的数据依赖挖掘方法及系统
CN106294139B (zh) 一种软件代码中重复片段的检测提取方法
Angeline Association rule generation using apriori mend algorithm for student's placement
CN110609901B (zh) 一种基于向量化特征的用户网络行为预测方法
CN115687599B (zh) 业务数据处理方法、装置、电子设备及存储介质
CN109685453B (zh) 智能识别工作流有效路径的方法
CN106021978A (zh) 基于光学图谱平台Irys的一种de novo测序数据组装方法
CN115858219A (zh) 一种基于令牌转换的多序列日志解析方法和系统
Alpuente et al. A tool for computing the visual similarity of web pages
Guo et al. Behavior differentiation of process variants with invisible tasks
Yi et al. Novel Approach to Discover Precise Process Model by Filtering out Log Chaotic Activities
Guo et al. A FP-tree-based method for inverse frequent set mining
Giammarresi et al. Decremental 2-and 3-connectivity on planar graphs
CN106776607A (zh) 搜索引擎操作行为处理方法和装置
Lichev et al. On the modularity of 3-regular random graphs and random graphs with given degree sequences
Bano et al. Database-Less Extraction of Event Logs from Redo Logs
Wu et al. A spectral based goodness-of-fit test for stochastic block models

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant