CN109033368A - 一种基于活动划分和日志划分的块结构过程挖掘方法 - Google Patents
一种基于活动划分和日志划分的块结构过程挖掘方法 Download PDFInfo
- Publication number
- CN109033368A CN109033368A CN201810840017.6A CN201810840017A CN109033368A CN 109033368 A CN109033368 A CN 109033368A CN 201810840017 A CN201810840017 A CN 201810840017A CN 109033368 A CN109033368 A CN 109033368A
- Authority
- CN
- China
- Prior art keywords
- log
- divided
- transition
- activity
- block structure
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2216/00—Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
- G06F2216/03—Data mining
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开一种基于活动划分和日志划分的块结构过程挖掘方法。本发明依据共同变迁的概念计算日志的共同变迁集,根据共同变迁的数量,用不同但相互交错的方法划分日志的活动集,进而划分模块和纵向划分日志,达到简化日志的目的。不同于以往的挖掘方法,本发明致力于简化复杂日志,以便从复杂日志中挖掘出精确的过程模型,本发明简化日志的方法是纵向划分日志,既减少日志的数量,又缩短迹的长度,使得每个日志划分都充分简单。每个日志划分对应一个块结构,组合所有块结构得到合理且满足人们需求的Petri网模型。构造了基于日志划分的块结构过程挖掘算法,该算法是递归算法,共分为五个步骤,可以化复杂日志为简单日志,从简单日志中发现块结构,进而从复杂日志中获得精确的过程模型。
Description
技术领域
本发明属于过程挖掘领域,涉及基于共同变迁的活动划分及基于活动划分的纵向日志划分,通过纵向划分日志处理复杂日志,从复杂日志中挖掘出精确的过程模型。
背景技术
高效的企业管理可以提高企业竞争力,业务流程是企业管理的重要组成部分,因此,如何从业务系统所记录的日志中获取准确的系统参考模型成为关键。过程挖掘的主要任务就是从事件日志中挖掘业务模型,主要包括分析日志,构建模型,实例重演等,挖掘到的模型应包含日志的所有行为。随着社会和企业的发展,可得到的日志越来越复杂,本发明即是从复杂日志中获取精确的过程模型。
在已有的研究结论中,如第一个过程挖掘算法α-算法,利用遗传算法的过程挖掘算法 AGNES+-miner,使用分治策略的Inductive-miner算法。可以处理稍复杂日志的通用分解方法,它把具有挑战性的过程挖掘问题分解成更小更容易分析的问题,把这些小问题的解决方案组合成原问题的解决方案。
发明内容
基于背景技术存在的技术问题,本发明提出一种基于活动划分和日志划分的块结构过程挖掘方法。
主要包括以下步骤:
S1、计算日志的共同变迁、输入变迁、输出变迁。
S2、基于共同变迁的数量,划分事件日志的活动集。
S3、基于活动划分,产生模块划分和日志划分,其中,日志划分是利用映射纵向划分日志,简化日志,用以处理复杂日志。
S4、从每个日志划分里挖掘出对应的块结构,组合这些块结构得到最终模型。
附图说明
图1是本发明的实施模型图。
图2是本发明挖掘到的一种含有共同变迁的Petri网模型。
图3是本发明挖掘到的一种无共同变迁的Petri网模型。
图4是基于活动划分和日志划分的块结构过程挖掘算法步骤图。
具体实施方式
本发明提出共同变迁的概念,并基于共同变迁的数量划分活动,再基于活动划分划分模块和日志,其中日志划分是纵向划分,以最大程度的简化日志,提高挖掘的精确度和处理复杂日志的能力。每个日志划分仍可以继续划分,这是一个递归过程,从日志划分里发现块结构,组合所有块结构得到模型。
以下结合附图对本发明作进一步的说明。
图1是本发明的实施流程,包括计算共同变迁集、活动划分、模块划分、日志划分,组合所有块结构得到模型。
图2是Σt\(Σi∪Σo)≠φ时,本发明挖掘到的Petri网模型,其中,蓝色虚线和黑色虚线内分别为一个块结构。挖掘方法如下:
共同变迁集Σt:②Σt是一个有序的集合,即σ↑{Σt(j),Σt(j′)}=<Σt(j),Σt(j′)>,Σt(j)表示Σt中第j个元素。
输入、输出变迁集:σ(1)是开始变迁,σ(|σ|)是结束变迁,LN可能含有多个开始和结束变迁,它们的集合分别记为Σi和Σo。
活动划分:当Σt\(Σi∪Σo)≠φ时,划分活动集ΣL,j=1,2,...,|Σt|,必有Σt(j)=σ(j′),Σt(j+1)=σ(j″),则ΣL的第j个划分为Σj={σ(j′+1),...,σ(j″-1)}。若σ(j′+1)=σ(j″),Σj=φ。
模块划分:若Σj=φ,Σt(j)和Σt(j+1)组成一个顺序模块。类似地,若有连续的Σj=φ,Σj+1=φ,...,则Σt(j),Σt(j+1),...组成一个顺序模块。若Σj≠φ,对j≥1,划分对应的模块Mj的活动集合记为
日志划分:第j个日志划分
图3是Σt\(Σi∪Σo)=φ时,本发明挖掘到的Petri网模型,它共有六个模块。挖掘方法如下:
活动划分:若Σt\(Σi∪Σo)=φ,对按条件挑选LN的所有条件子日志它们的活动集合为称活动集为ΣL的一个活动划分,j′≠j″。每个活动划分对应了一个日志划分,每个日志划分对应一个模块,其中,由某两个条件子日志的活动集产生的两个活动划分是排它选择的。
图4基于活动划分和日志划分的块结构过程挖掘算法步骤图,具体步骤如下:
算法:基于日志划分的块结构挖掘
输入:日志LN
输出:工作流网W
步骤1:计算日志LN的共同变迁集Σt,输入变迁集Σi,输出变迁集Σo及所有活动集ΣL;
步骤2:依据Σt\(Σi∪Σo),|Σi|,|Σo|的大小及它们之间的关系,调用对应的函数处理日志 LN,输出日志划分L1,L2,...。注意,在执行函数2时应记录互相排它的模块;
步骤3:若某一日志划分Lj仍较复杂不能高效精确地挖掘出对应的块结构,则把Lj作为输入日志执行步骤1和2,输出Lj的日志划分;
步骤4:重复步骤3,直到所有日志划分足够简单;
步骤5:日志足够简单时,使用已有成熟的挖掘方法挖掘出日志划分对应的精确模型,即块结构,组合所有块结构,得到合理且满足需求的工作流网。
其中日志划分函数如下:
Function 1基于共同变迁的日志划分函数
Σt≠ΣL∧Σt\(Σi∪Σo)≠φ;//函数执行条件
对有Σt(j)=σ(j′),Σt(j+1)=σ(j″),划分Σj={σ(j′+1),...,σ(j″-1)};
//活动划分
模块它的活动集为模块划分
日志划分日志划分
Return L1,L2,...//输出日志划分
END FUNCTION
Function 2无任何共同变迁的日志划分函数
Σt\(Σi∪Σo)=φ∧|Σi|>1∧|Σo|>1;//函数执行条件
条件子日志满足:活动集为挑选日志的所有条件子日志
活动划分活动划分
日志划分Lj=LN↑Σj;//两个条件子日志产生的划分对应的模块是排它的
Return L1,L2,...
END FUNCTION
Function 3存在共同的输入或输出变迁的日志划分函数
Σt\(Σi∪Σo)=φ;//函数执行条件
If|Σi|=|Σo|=1
划分ΣL为:Σi,ΣL\(Σi∪Σo),Σo,对应的日志划分为:Li,Lm,Lo,令LN=Lm,执行Function 2;//日志Lm满足函数2的执行条件
Else if|Σi|=1∧|Σo|>1
划分ΣL为:Σi,ΣL\(Σi∪Σo),对应的日志划分为:Li,Lm,令LN=Lm,执行Function 2;//日志Lm满足函数2的执行条件
Else if|Σi|>1∧|Σo|=1
划分ΣL为:ΣL\(Σi∪Σo),Σo,对应的日志划分为:Lm,Lo,令LN=Lm,执行Function 2;//日志Lm满足函数2的执行条件。
Claims (5)
1.基于活动划分和日志划分的块结构过程挖掘方法,包括计算共同变迁的方法、基于共同变迁数量划分活动的方法、划分模块和纵向划分日志的方法,其特征在于:通过共同变迁的概念计算日志的共同变迁集,基于共同变迁的数量,使用不同但相互交错的方法划分活动,进而划分日志,每个日志划分对应一个块结构。
2.根据权利要求1所述的计算共同变迁的方法,其特征在于:共同变迁是出现在日志所有迹中的变迁,且满足一定的出现顺序,共同变迁集是有序的。
3.根据权利要求1所述的基于共同变迁数量划分活动的方法,其特征在于:共同变迁包含除输入和输出变迁之外的变迁时,依据共同变迁可以把活动划分成不同的活动集,即活动划分。共同变迁只包含输入和输出变迁时,取具有共同的输入和输出变迁的迹为一个条件子日志,依据不同的条件子日志的活动集划分活动。
4.根据权利要求1所述的划分模块和纵向划分日志的方法,其特征在于:依据活动划分可以把模型划分成若干不同的模块,把日志划分成不同的日志划分,每个日志划分对应一个块结构。
5.根据权利要求4所述的依据活动划分可以把模型划分成若干不同的模块及把日志划分成不同的日志划分,其特征在于:共同变迁间的变迁组成模块,原日志在活动划分上的映射对应一个日志划分。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810840017.6A CN109033368A (zh) | 2018-07-27 | 2018-07-27 | 一种基于活动划分和日志划分的块结构过程挖掘方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810840017.6A CN109033368A (zh) | 2018-07-27 | 2018-07-27 | 一种基于活动划分和日志划分的块结构过程挖掘方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109033368A true CN109033368A (zh) | 2018-12-18 |
Family
ID=64646787
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810840017.6A Pending CN109033368A (zh) | 2018-07-27 | 2018-07-27 | 一种基于活动划分和日志划分的块结构过程挖掘方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109033368A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11500756B2 (en) | 2020-09-06 | 2022-11-15 | UiPath, Inc. | Process tree discovery using a probabilistic inductive miner |
US11521088B2 (en) | 2020-09-06 | 2022-12-06 | UiPath, Inc. | Process tree discovery using a probabilistic inductive miner |
US11892934B2 (en) | 2020-09-06 | 2024-02-06 | UiPath, Inc. | Process tree discovery using a probabilistic inductive miner |
-
2018
- 2018-07-27 CN CN201810840017.6A patent/CN109033368A/zh active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11500756B2 (en) | 2020-09-06 | 2022-11-15 | UiPath, Inc. | Process tree discovery using a probabilistic inductive miner |
US11521088B2 (en) | 2020-09-06 | 2022-12-06 | UiPath, Inc. | Process tree discovery using a probabilistic inductive miner |
US11892934B2 (en) | 2020-09-06 | 2024-02-06 | UiPath, Inc. | Process tree discovery using a probabilistic inductive miner |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Liu et al. | Decentralized federated learning: Balancing communication and computing costs | |
CN109033368A (zh) | 一种基于活动划分和日志划分的块结构过程挖掘方法 | |
Ji et al. | Improved zeroth-order variance reduced algorithms and analysis for nonconvex optimization | |
CN104021460B (zh) | 一种工作流程管理系统及工作流程处理方法 | |
CN103558959B (zh) | 一种应用于Android平台的显示窗口的方法和装置 | |
CN102880684B (zh) | 基于日志记录挖掘与组合验证的工作流建模方法 | |
CN103400227B (zh) | 基于图挖掘和图距离的流程推荐方法 | |
CN102332125A (zh) | 基于后继任务的工作流挖掘方法 | |
CN109976735A (zh) | 一种基于web可视化的知识图谱算法应用平台 | |
CN106294715A (zh) | 一种基于属性约简的关联规则挖掘方法及装置 | |
CN106202430A (zh) | 基于关联规则的直播平台用户兴趣度挖掘系统及挖掘方法 | |
CN101236511A (zh) | 用于优化全局归约处理的方法和系统 | |
CN104834709B (zh) | 一种基于负载均衡的并行余弦模式挖掘方法 | |
CN103488683A (zh) | 一种微博数据管理系统及其实现方法 | |
CN105069290A (zh) | 一种面向寄递数据的并行化关键节点发现方法 | |
Tang et al. | A feasible SQP-GS algorithm for nonconvex, nonsmooth constrained optimization | |
CN101872361A (zh) | 一种面向关联规则挖掘的隐私数据保护方法 | |
Burattin et al. | A framework for semi-automated process instance discovery from decorative attributes | |
CN106056299A (zh) | 一种基于流程挖掘的决策支持方法及装置 | |
Chao | An incremental approach to extracting minimal bad siphons | |
CN104765810B (zh) | 基于布尔矩阵的诊疗规则挖掘方法 | |
CN107943935A (zh) | 数据的处理方法、装置和计算机可读存储介质 | |
CN101866355A (zh) | 基于云计算的社会网络划分方法及系统 | |
You et al. | Multi-source data stream online frequent episode mining | |
CN105608160A (zh) | 一种分布式大数据分析方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20181218 |