CN109033368A

CN109033368A - 一种基于活动划分和日志划分的块结构过程挖掘方法

Info

Publication number: CN109033368A
Application number: CN201810840017.6A
Authority: CN
Inventors: 方欢; 段瑞; 詹悦; 方贤文
Original assignee: Anhui University of Science and Technology
Current assignee: Anhui University of Science and Technology
Priority date: 2018-07-27
Filing date: 2018-07-27
Publication date: 2018-12-18

Abstract

本发明公开一种基于活动划分和日志划分的块结构过程挖掘方法。本发明依据共同变迁的概念计算日志的共同变迁集，根据共同变迁的数量，用不同但相互交错的方法划分日志的活动集，进而划分模块和纵向划分日志，达到简化日志的目的。不同于以往的挖掘方法，本发明致力于简化复杂日志，以便从复杂日志中挖掘出精确的过程模型，本发明简化日志的方法是纵向划分日志，既减少日志的数量，又缩短迹的长度，使得每个日志划分都充分简单。每个日志划分对应一个块结构，组合所有块结构得到合理且满足人们需求的Petri网模型。构造了基于日志划分的块结构过程挖掘算法，该算法是递归算法，共分为五个步骤，可以化复杂日志为简单日志，从简单日志中发现块结构，进而从复杂日志中获得精确的过程模型。

Description

一种基于活动划分和日志划分的块结构过程挖掘方法

技术领域

本发明属于过程挖掘领域，涉及基于共同变迁的活动划分及基于活动划分的纵向日志划分，通过纵向划分日志处理复杂日志，从复杂日志中挖掘出精确的过程模型。

背景技术

高效的企业管理可以提高企业竞争力，业务流程是企业管理的重要组成部分，因此，如何从业务系统所记录的日志中获取准确的系统参考模型成为关键。过程挖掘的主要任务就是从事件日志中挖掘业务模型，主要包括分析日志，构建模型，实例重演等，挖掘到的模型应包含日志的所有行为。随着社会和企业的发展，可得到的日志越来越复杂，本发明即是从复杂日志中获取精确的过程模型。

在已有的研究结论中，如第一个过程挖掘算法α-算法，利用遗传算法的过程挖掘算法 AGNES⁺-miner，使用分治策略的Inductive-miner算法。可以处理稍复杂日志的通用分解方法，它把具有挑战性的过程挖掘问题分解成更小更容易分析的问题，把这些小问题的解决方案组合成原问题的解决方案。

发明内容

基于背景技术存在的技术问题，本发明提出一种基于活动划分和日志划分的块结构过程挖掘方法。

主要包括以下步骤：

S1、计算日志的共同变迁、输入变迁、输出变迁。

S2、基于共同变迁的数量，划分事件日志的活动集。

S3、基于活动划分，产生模块划分和日志划分，其中，日志划分是利用映射纵向划分日志，简化日志，用以处理复杂日志。

S4、从每个日志划分里挖掘出对应的块结构，组合这些块结构得到最终模型。

附图说明

图1是本发明的实施模型图。

图2是本发明挖掘到的一种含有共同变迁的Petri网模型。

图3是本发明挖掘到的一种无共同变迁的Petri网模型。

图4是基于活动划分和日志划分的块结构过程挖掘算法步骤图。

具体实施方式

本发明提出共同变迁的概念，并基于共同变迁的数量划分活动，再基于活动划分划分模块和日志，其中日志划分是纵向划分，以最大程度的简化日志，提高挖掘的精确度和处理复杂日志的能力。每个日志划分仍可以继续划分，这是一个递归过程，从日志划分里发现块结构，组合所有块结构得到模型。

以下结合附图对本发明作进一步的说明。

图1是本发明的实施流程，包括计算共同变迁集、活动划分、模块划分、日志划分，组合所有块结构得到模型。

图2是Σ_t\(Σ_i∪Σ_o)≠φ时，本发明挖掘到的Petri网模型，其中，蓝色虚线和黑色虚线内分别为一个块结构。挖掘方法如下：

共同变迁集Σ_t：②Σ_t是一个有序的集合，即σ↑{Σ_t(j),Σ_t(j′)}＝＜Σ_t(j),Σ_t(j′)＞，Σ_t(j)表示Σ_t中第j个元素。

输入、输出变迁集：σ(1)是开始变迁，σ(|σ|)是结束变迁，L_N可能含有多个开始和结束变迁，它们的集合分别记为Σ_i和Σ_o。

活动划分：当Σ_t\(Σ_i∪Σ_o)≠φ时，划分活动集Σ_L，j＝1,2,...,|Σ_t|，必有Σ_t(j)＝σ(j′)，Σ_t(j+1)＝σ(j″)，则Σ_L的第j个划分为Σ_j＝{σ(j′+1),...,σ(j″-1)}。若σ(j′+1)＝σ(j″)，Σ_j＝φ。

模块划分：若Σ_j＝φ，Σ_t(j)和Σ_t(j+1)组成一个顺序模块。类似地，若有连续的Σ_j＝φ，Σ_j+1＝φ，...，则Σ_t(j)，Σ_t(j+1)，...组成一个顺序模块。若Σ_j≠φ，对j≥1，划分对应的模块M_j的活动集合记为

日志划分：第j个日志划分

图3是Σ_t\(Σ_i∪Σ_o)＝φ时，本发明挖掘到的Petri网模型，它共有六个模块。挖掘方法如下：

活动划分：若Σ_t\(Σ_i∪Σ_o)＝φ，对按条件挑选L_N的所有条件子日志它们的活动集合为称活动集为Σ_L的一个活动划分，j′≠j″。每个活动划分对应了一个日志划分，每个日志划分对应一个模块，其中，由某两个条件子日志的活动集产生的两个活动划分是排它选择的。

图4基于活动划分和日志划分的块结构过程挖掘算法步骤图，具体步骤如下：

算法：基于日志划分的块结构挖掘

输入：日志L_N

输出：工作流网W

步骤1：计算日志L_N的共同变迁集Σ_t，输入变迁集Σ_i，输出变迁集Σ_o及所有活动集Σ_L；

步骤2：依据Σ_t\(Σ_i∪Σ_o)，|Σ_i|，|Σ_o|的大小及它们之间的关系，调用对应的函数处理日志 L_N，输出日志划分L₁，L₂，...。注意，在执行函数2时应记录互相排它的模块；

步骤3：若某一日志划分L_j仍较复杂不能高效精确地挖掘出对应的块结构，则把L_j作为输入日志执行步骤1和2，输出L_j的日志划分；

步骤4：重复步骤3，直到所有日志划分足够简单；

步骤5：日志足够简单时，使用已有成熟的挖掘方法挖掘出日志划分对应的精确模型，即块结构，组合所有块结构，得到合理且满足需求的工作流网。

其中日志划分函数如下：

Function 1基于共同变迁的日志划分函数

Σ_t≠Σ_L∧Σ_t\(Σ_i∪Σ_o)≠φ；//函数执行条件

对有Σ_t(j)＝σ(j′)，Σ_t(j+1)＝σ(j″)，划分Σ_j＝{σ(j′+1),...,σ(j″-1)}；

//活动划分

模块它的活动集为模块划分

日志划分日志划分

Return L₁,L₂,...//输出日志划分

END FUNCTION

Function 2无任何共同变迁的日志划分函数

Σ_t\(Σ_i∪Σ_o)＝φ∧|Σ_i|＞1∧|Σ_o|＞1；//函数执行条件

条件子日志满足：活动集为挑选日志的所有条件子日志

活动划分活动划分

日志划分L_j＝L_N↑Σ_j；//两个条件子日志产生的划分对应的模块是排它的

Return L₁,L₂,...

END FUNCTION

Function 3存在共同的输入或输出变迁的日志划分函数

Σ_t\(Σ_i∪Σ_o)＝φ；//函数执行条件

If|Σ_i|＝|Σ_o|＝1

划分Σ_L为：Σ_i，Σ_L\(Σ_i∪Σ_o)，Σ_o，对应的日志划分为：L_i，L_m，L_o，令L_N＝L_m,执行Function 2；//日志L_m满足函数2的执行条件

Else if|Σ_i|＝1∧|Σ_o|＞1

划分Σ_L为：Σ_i，Σ_L\(Σ_i∪Σ_o)，对应的日志划分为：L_i，L_m，令L_N＝L_m,执行Function 2；//日志L_m满足函数2的执行条件

Else if|Σ_i|＞1∧|Σ_o|＝1

划分Σ_L为：Σ_L\(Σ_i∪Σ_o)，Σ_o，对应的日志划分为：L_m，L_o，令L_N＝L_m,执行Function 2；//日志L_m满足函数2的执行条件。

Claims

1.基于活动划分和日志划分的块结构过程挖掘方法，包括计算共同变迁的方法、基于共同变迁数量划分活动的方法、划分模块和纵向划分日志的方法，其特征在于：通过共同变迁的概念计算日志的共同变迁集，基于共同变迁的数量，使用不同但相互交错的方法划分活动，进而划分日志，每个日志划分对应一个块结构。

2.根据权利要求1所述的计算共同变迁的方法，其特征在于：共同变迁是出现在日志所有迹中的变迁，且满足一定的出现顺序，共同变迁集是有序的。

3.根据权利要求1所述的基于共同变迁数量划分活动的方法，其特征在于：共同变迁包含除输入和输出变迁之外的变迁时，依据共同变迁可以把活动划分成不同的活动集，即活动划分。共同变迁只包含输入和输出变迁时，取具有共同的输入和输出变迁的迹为一个条件子日志，依据不同的条件子日志的活动集划分活动。

4.根据权利要求1所述的划分模块和纵向划分日志的方法，其特征在于：依据活动划分可以把模型划分成若干不同的模块，把日志划分成不同的日志划分，每个日志划分对应一个块结构。

5.根据权利要求4所述的依据活动划分可以把模型划分成若干不同的模块及把日志划分成不同的日志划分，其特征在于：共同变迁间的变迁组成模块，原日志在活动划分上的映射对应一个日志划分。