CN103559588A - 基于Petri网行为轮廓的日志挖掘方法 - Google Patents

基于Petri网行为轮廓的日志挖掘方法 Download PDF

Info

Publication number
CN103559588A
CN103559588A CN201310574153.2A CN201310574153A CN103559588A CN 103559588 A CN103559588 A CN 103559588A CN 201310574153 A CN201310574153 A CN 201310574153A CN 103559588 A CN103559588 A CN 103559588A
Authority
CN
China
Prior art keywords
model
behavior profile
log
logged sequence
procedure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201310574153.2A
Other languages
English (en)
Inventor
方贤文
吴俊枝
刘璐
刘祥伟
方新建
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Anhui University of Science and Technology
Original Assignee
Anhui University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Anhui University of Science and Technology filed Critical Anhui University of Science and Technology
Priority to CN201310574153.2A priority Critical patent/CN103559588A/zh
Publication of CN103559588A publication Critical patent/CN103559588A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种基于Petri网行为轮廓的日志挖掘方法,属于流程挖掘领域。其目的是通过挖掘技术的实施来改进业务流程模型,从而提高流程运行效率和服务质量。首先从程序运行产生的轨迹中提取日志序列,然后进行预处理;分析相邻两个活动间的行为关系,建立行为轮廓,依据直接依赖关系构建初始模型;然后重放出现频数最大的日志序列,根据各项指标寻找出优于初始模型的两个流程模型;利用行为轮廓一致性分别比较这两个模型与初始模型的一致性度,选择较优的模型;重复上述最后两个步骤直到日志重放完毕,得到最优业务流程模型。该挖掘方法不仅能够保证业务流程满足功能性,而且使得流程的行为简洁,减少程序运行时间。

Description

基于Petri网行为轮廓的日志挖掘方法
技术领域
本发明涉及业务流程管理领域的业务流程挖掘方法,它适用于从程序运行产生的轨迹中提取日志序列,进行业务流程的优化挖掘,属于流程挖掘领域。
背景技术
业务流程管理是企业运行越来越重要的一部分,业务流程管理的优劣直接影响着企业的效益,而业务流程的优劣又直接影响着业务流程管理的效率。在这种情况下,企业总想拥有更好的业务流程,而业务流程挖掘就是一种能够改进业务流程的一种方法。业务流程挖掘是一种数据挖掘在业务流程管理领域的一种较新应用,通过对业务流程运作产生的日志进行分析,还原业务流程的真实过程,利用日志对业务流程进行分析和优化等。
对于流程挖掘问题,现有的挖掘方法主要从行为语义学和过程行为方法进行的,基于行为语义学的流程挖掘已有大量的研究,而基于过程行为的流程挖掘的研究相对较少,特别是针对业务流程的挖掘,而且大多数未对挖掘方法的优劣程度从过程行为方面进行一致性测量,并且在以往的挖掘中,从未加入行为轮廓的概念。
发明内容
本发明为了改进现有的挖掘方法,提出了一种基于执行日志的业务流程优化挖掘方法,能够有效地提高流程运行效率和服务质量。该方法在挖掘的过程中为了更加明确地说明活动间的关系加入了行为轮廓的概念,不仅能够保证模型的功能性得到满足,而且还可以使得模型拥有较为简洁的行为,最终得到行为合理、结构得当的业务流程模型。
在挖掘过程中,首先,从程序运行产生的轨迹中提取日志序列,将所有的日志序列进行合并,避免出现重复操作,再将合并后的日志序列按照频数大小顺序排列,即优先考虑频数大的序列,以保证这些序列能被模型接受;选择频数较大的几个日志序列,建立活动关系表,确定相邻两个活动间的行为轮廓关系,根据活动间的直接依赖关系构建初始模型;通过日志的重放分析剩余日志序列与初始模型的合理性,再分析剩余日志序列与初始模型的合理性、行为适当性、结构适当性,调整初始模型,可得到初步的优化模型;然后经过计算行为轮廓一致性度,可得到本次循环的优化模型;重复以上操作直到日志重放完毕,得到最优模型。
值得注意的是,在计算行为轮廓一致性度的时候,应该有两个初步优化模型,要分别计算他们与初始模型的一致性度,所以在第一次循环的时候,要选择出两个初步优化模型。
本发明的优点是在挖掘的过程中加入了行为轮廓的概念,用行为轮廓一致性评价模型的优劣,有效地降低了模型的冗余度,提高程序的运行效率。
附图说明
图1是本发明实施方式的结构示意图。
图2是本发明日志序列处理的结构示意图。
图3是本发明优化挖掘算法的结构示意图。
具体实施方式
以下结合附图所述实施例对本发明作进一步的说明。
图1为本发明的整个流程系统的主要部分的示意图。如图所示,整个系统是以提取日志为开始,经过预处理,然后进行业务流程的挖掘。它主要包括两部分分别是日志序列的处理和优化挖掘算法。实际模型是否已知并不重要,我们只是想从运行的日志序列中挖掘出更加有效的模型。
图2是本发明日志序列处理的结构示意图。如图所示,首先,从程序运行产生的轨迹中提取日志序列,将所有的日志序列进行预处理使之满足两个条件:一是没有相同的日志序列,可避免重复操作;二是日志序列应按照频数大小顺序排列,以方便优先考虑频数大的序列,以保证这些序列能被模型接受;选择频数较大的几个日志序列,建立活动关系表,确定相邻两个活动间的行为轮廓关系,根据活动间的直接依赖关系构建初始模型。
图3是本发明优化挖掘算法的结构示意图。如图所示,从初始模型开始,通过日志的重放分析剩余日志序列与初始模型的合理性,再分析日志序列与初始模型的行为适当性和结构适当性,选择较优的模型;分别计算初始模型与初步优化模型的行为轮廓一致性度;选择较优的一个作为初始模型,另外一个作为初步优化模型;重复以上操作直到日志重放完毕,得到最优模型。(注:在第一次循环中分析日志与模型间的一致性时需找到两个初步优化模型)附:1)合理性:
fitness = 1 2 ( 1 - Σ i = 1 k n i m i Σ i = 1 k n i c i ) + 1 2 ( 1 - Σ i = 1 k n i r i Σ i = 1 k n i p i )
其中k为给定日志中的不同轨迹数,ni为第i类轨迹中所含的实例数,mi为第i类轨迹中缺少的托肯数,ri为第i类轨迹中遗留的托肯数,ci为第i类轨迹中消耗的托肯数,pi为第i类轨迹中产生的托肯数。
2)行为适当性:
a B = 1 - Σ i = 1 k n i ( x i - 1 ) ( m - 1 ) Σ i = 1 k n i
其中,其中,k为给定日志中的不同轨迹数,ni表示日志轨迹i中包含的过程实例数,xi表示在轨迹i中日志重放时就绪变迁的平均个数,m表示模型中可见任务的个数(不包含不可见任务,假设m>1)。
3)结构适当性:
a S = | T | + 2 | T | + | P |
其中,T为变迁集,P为库所集,2指的是初始库所与结束库所的个数。
4)行为轮廓一致性度:设S1=(P1,T1;F1,M1)和S2=(P2,T2;F2,M2)是两个Petri网系统,他们关于~匹配,
Figure BDA0000414884480000032
是他们一致的变迁对集,则~的基于变迁集的行为轮廓的一致性度定义为:
MBP ( S 1 , S 2 ) = | CT 1 ~ | + | CT 2 ~ | | ( T 1 ~ × T 1 ~ ) | + | ( T 2 ~ × T 2 ~ ) |

Claims (3)

1.基于Petri网行为轮廓的日志挖掘方法,该方法由日志序列的提取和处理、业务流程的优化挖掘方法两部分组成,其特征在于,日志序列的提取和处理实现对日志序列的规范化要求,即满足能够从日志序列进行挖掘的条件;业务流程的挖掘方法实现对处理过的日志序列逐个进行重放,根据各个指标建立模型、调整模型和选择模型。
2.根据权利要求1所述的业务流程挖掘方法,其特征在于:在分析日志序列的活动时,采用了行为轮廓的概念,利用活动间的关系表构建了各个相邻活动间的行为轮廓关系。
3.根据权利要求1所属的业务流程挖掘方法,其特征在于:在优化挖掘过程中,不仅利用了日志与模型的一致性分析,而且还利用了模型与模型的一致性分析,在评价模型与模型的一致性时,采用评价标准是行为轮廓一致性度。
CN201310574153.2A 2013-11-15 2013-11-15 基于Petri网行为轮廓的日志挖掘方法 Pending CN103559588A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310574153.2A CN103559588A (zh) 2013-11-15 2013-11-15 基于Petri网行为轮廓的日志挖掘方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310574153.2A CN103559588A (zh) 2013-11-15 2013-11-15 基于Petri网行为轮廓的日志挖掘方法

Publications (1)

Publication Number Publication Date
CN103559588A true CN103559588A (zh) 2014-02-05

Family

ID=50013828

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310574153.2A Pending CN103559588A (zh) 2013-11-15 2013-11-15 基于Petri网行为轮廓的日志挖掘方法

Country Status (1)

Country Link
CN (1) CN103559588A (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104462329A (zh) * 2014-12-03 2015-03-25 复旦大学 一种适用于多样性环境的业务流程挖掘方法
CN105045706A (zh) * 2015-07-22 2015-11-11 安徽理工大学 基于行为轮廓挖掘业务流程中不可见任务的方法
CN105069044A (zh) * 2015-07-22 2015-11-18 安徽理工大学 基于拟间接依赖的过程模型挖掘的新方法
CN105095491A (zh) * 2015-08-18 2015-11-25 山东科技大学 基于Petri网基本结构的过程模型修复方法
CN105138445A (zh) * 2015-08-17 2015-12-09 安徽理工大学 基于概率行为关系挖掘业务流程中不可见任务的新方法
CN105159244A (zh) * 2015-07-29 2015-12-16 安徽理工大学 一种基于Petri网的事件协调控制方法
WO2016004744A1 (zh) * 2014-07-10 2016-01-14 同济大学 基于复杂对应系统的用户行为一致性度测量方法
CN106503872A (zh) * 2016-11-29 2017-03-15 中国人民解放军国防科学技术大学 一种基于基础业务活动集的业务流程系统构建方法
CN106936812A (zh) * 2017-01-10 2017-07-07 南京邮电大学 一种云环境下基于Petri网的文件隐私泄露检测方法
CN117910788A (zh) * 2024-03-18 2024-04-19 山东科技大学 一种面向含重复任务业务流程的模型挖掘方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11328259A (ja) * 1998-05-08 1999-11-30 Nippon Steel Corp ペトリネットによるモデル化方法
CN102509171A (zh) * 2011-10-24 2012-06-20 浙江大学 一种面向规则执行日志的流程挖掘方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11328259A (ja) * 1998-05-08 1999-11-30 Nippon Steel Corp ペトリネットによるモデル化方法
CN102509171A (zh) * 2011-10-24 2012-06-20 浙江大学 一种面向规则执行日志的流程挖掘方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
方贤文 等: "基于Petri网行为轮廓的业务流程挖掘优化方法", 《第十四届全国PETRI网理论与应用学术年会论文集》 *

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016004744A1 (zh) * 2014-07-10 2016-01-14 同济大学 基于复杂对应系统的用户行为一致性度测量方法
CN104133808B (zh) * 2014-07-10 2017-06-13 同济大学 基于复杂对应系统的用户行为一致性度测量方法
CN104462329A (zh) * 2014-12-03 2015-03-25 复旦大学 一种适用于多样性环境的业务流程挖掘方法
CN104462329B (zh) * 2014-12-03 2018-06-26 复旦大学 一种适用于多样性环境的业务流程挖掘方法
CN105045706A (zh) * 2015-07-22 2015-11-11 安徽理工大学 基于行为轮廓挖掘业务流程中不可见任务的方法
CN105069044A (zh) * 2015-07-22 2015-11-18 安徽理工大学 基于拟间接依赖的过程模型挖掘的新方法
CN105159244B (zh) * 2015-07-29 2017-10-27 安徽理工大学 一种基于Petri网的事件协调控制方法
CN105159244A (zh) * 2015-07-29 2015-12-16 安徽理工大学 一种基于Petri网的事件协调控制方法
CN105138445A (zh) * 2015-08-17 2015-12-09 安徽理工大学 基于概率行为关系挖掘业务流程中不可见任务的新方法
CN105095491A (zh) * 2015-08-18 2015-11-25 山东科技大学 基于Petri网基本结构的过程模型修复方法
CN106503872A (zh) * 2016-11-29 2017-03-15 中国人民解放军国防科学技术大学 一种基于基础业务活动集的业务流程系统构建方法
CN106503872B (zh) * 2016-11-29 2019-07-12 中国人民解放军国防科学技术大学 一种基于基础业务活动集的业务流程系统构建方法
CN106936812A (zh) * 2017-01-10 2017-07-07 南京邮电大学 一种云环境下基于Petri网的文件隐私泄露检测方法
CN106936812B (zh) * 2017-01-10 2019-12-20 南京邮电大学 一种云环境下基于Petri网的文件隐私泄露检测方法
CN117910788A (zh) * 2024-03-18 2024-04-19 山东科技大学 一种面向含重复任务业务流程的模型挖掘方法

Similar Documents

Publication Publication Date Title
CN103559588A (zh) 基于Petri网行为轮廓的日志挖掘方法
CN105574730A (zh) 基于物联网大数据平台的智能用户画像方法及装置
CN103778051A (zh) 基于l*算法的业务流程增量挖掘方法
CN104133866A (zh) 一种面向智能电网的缺失数据填充方法
CN104133857A (zh) 一种基于配置约束的业务流程模型挖掘的新方法
CN106599230A (zh) 一种分布式数据挖掘模型评估的方法与系统
CN104834826A (zh) 基于数据挖掘和图论技术的临床路径建立和优化方法及系统
CN101105841A (zh) 由大规模基因芯片表达谱数据构建基因调控亚网络的方法
CN103150163A (zh) 一种基于MapReduce模型的并行关联方法
CN102880684A (zh) 基于日志记录挖掘与组合验证的工作流建模方法
CN105117588A (zh) 一种基于医院海量业务数据的医疗质量分析方法
CN105631033A (zh) 一种视频数据的挖掘方法和装置
CN110727670B (zh) 基于流程图的数据结构预测传递及自动化数据处理方法
Dammers Making territorial scenarios for Europe
CN104317794A (zh) 基于动态项权值的中文特征词关联模式挖掘方法及其系统
CN102737743A (zh) 一种核电站主控室盘台布局的方法和系统
CN106056299A (zh) 一种基于流程挖掘的决策支持方法及装置
CN113254517A (zh) 一种基于互联网大数据的服务提供方法
CN105069044A (zh) 基于拟间接依赖的过程模型挖掘的新方法
CN108897680B (zh) 一种基于soa的软件系统操作剖面构造方法
CN106127405A (zh) 一种基于流程树切的业务流程隐变迁挖掘方法
KR101545998B1 (ko) 유출-수리모형 데이터 통합 관리 방법 및 그 시스템
CN104239430A (zh) 基于项权值变化的教育数据关联规则挖掘方法及其系统
CN105138445A (zh) 基于概率行为关系挖掘业务流程中不可见任务的新方法
CN113704215B (zh) 业务过程事件日志采样方法、系统、存储介质及计算设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20140205