CN117573460A - 一种基于行为特征网的流程模型分解挖掘方法 - Google Patents

一种基于行为特征网的流程模型分解挖掘方法 Download PDF

Info

Publication number
CN117573460A
CN117573460A CN202311077215.9A CN202311077215A CN117573460A CN 117573460 A CN117573460 A CN 117573460A CN 202311077215 A CN202311077215 A CN 202311077215A CN 117573460 A CN117573460 A CN 117573460A
Authority
CN
China
Prior art keywords
behavior
mining
sub
network
relation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311077215.9A
Other languages
English (en)
Inventor
崔磊
沈伍强
钱正浩
裴求根
姚潮生
李波
张小陆
张金波
梁哲恒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Information Center of Guangdong Power Grid Co Ltd
Original Assignee
Information Center of Guangdong Power Grid Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Information Center of Guangdong Power Grid Co Ltd filed Critical Information Center of Guangdong Power Grid Co Ltd
Priority to CN202311077215.9A priority Critical patent/CN117573460A/zh
Publication of CN117573460A publication Critical patent/CN117573460A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3065Monitoring arrangements determined by the means or processing involved in reporting the monitored data
    • G06F11/3072Monitoring arrangements determined by the means or processing involved in reporting the monitored data where the reporting involves data filtering, e.g. pattern matching, time or event triggered, adaptive or policy-based reporting
    • G06F11/3082Monitoring arrangements determined by the means or processing involved in reporting the monitored data where the reporting involves data filtering, e.g. pattern matching, time or event triggered, adaptive or policy-based reporting the data filtering being achieved by aggregating or compressing the monitored data

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于行为特征网的流程模型分解挖掘方法,属于业务流程模型挖掘技术领域,该方法包括:S1:基于事件日志确定各活动间的行为足迹关系BF,推得相应的行为矩阵M;S2:基于所述行为矩阵M结合零值转换规则R计算行为关系图;S3:划分所述行为关系图中的等价弧产生活动聚类;S4:基于所述活动聚类过滤出子日志,将所述子日志使用混合ILP挖掘算法挖掘子网;S5:运用归纳挖掘算法对所述子网添加接口库所形成子网行为特征网,运用开放Petri网将所有子网行为特征网合成整网,输出完整的流程模型。本发明中将现有的挖掘算法运用于子日志集,而不是整个系统的完整日志,使得现存的挖掘算法可以更高效地用于流程模型挖掘,降低了挖掘过程中的计算复杂度。

Description

一种基于行为特征网的流程模型分解挖掘方法
技术领域
本发明涉及业务流程模型挖掘技术领域,特别涉及一种基于行为特征网的流程模型分解挖掘方法。
背景技术
流程模型挖掘的目的是基于各种信息系统记录的事件日志挖掘流程模型。通常,流程模型的挖掘领域可以被分为3个子领域:流程挖掘、流程一致性检测和流程优化。目前在流程挖掘领域存在一些挖掘算法,-算法、整数线性问题(ILP)挖掘算法、归纳挖掘算法等。
但是这些挖掘算法主要是针对包含活动数目较少的事件日志(日志中包含大约50个不同的活动)进行挖掘,对于包含活动数目较多的事件日志(日志中包含大约200个不同的活动)这些挖掘算法具有一定的局限性。
发明内容
为了使得现存挖掘算法可以更加高效地处理包含活动数目多的事件日志,以及降低挖掘过程的计算复杂度并扩大挖掘算法的适用范围,本发明提供了一种基于行为特征网的流程模型分解挖掘方法,所述方法包括:
S1:基于事件日志确定各活动间的行为足迹关系BF,推得相应的行为矩阵M;
S2:基于所述行为矩阵M结合零值转换规则R计算行为关系图;
S3:划分所述行为关系图中的等价弧产生活动聚类;
S4:基于所述活动聚类过滤出子日志,将所述子日志使用混合ILP挖掘算法挖掘子网;
S5:运用归纳挖掘算法对所述子网添加接口库所形成子网行为特征网,运用开放Petri网将所有所述子网行为特征网合成整网,输出完整的流程模型。
进一步地,所述S1具体包括:
对任意的变迁对(x,y)∈(T×T),运用直接跟随关系,α算法定义三种行为足迹关系BF={→,+,||},其中→表示严格行为关系,+表示排他行为关系,||表示交叉行为关系;
对活动间三种行为足迹关系的估计强度进行映射(BF(x,y)→M(x,y))定义行为矩阵M;
所述映射分为四个类型:(1)若x→y,则M(x,y)∈[0.75,1.00],(2)若x||y,则M(x,y)∈[-0.30,0.30],(3)若x+y,则M(x,y)∈[-1.00,-0.30],(4)若x←y或者则M(x,y)=-1.00。
进一步地,所述S2具体包括:
给定一个零值z∈(-1.00,1.00),若M(x,y)=1.00,则Mz(x,y)=1.00;若M(x,y)∈[z,1.00),则若M(x,y)∈(-1.00,z),则/>若M(x,y)=-1.00,则Mz(x,y)=-1.00;
基于行为矩阵M,结合零值转换规则R移除行为足迹关系强度小于阈值z的关系,得到所述行为关系图。
进一步地,所述S4具体包括:
根据所述活动聚类中的活动保留日志中的对应活动,得到所述子日志;
基于所述子日志通过混合ILP挖掘算法,按照所述三种行为足迹关系BF={→,+,||},得到四类映射挖掘出所述子网。
进一步地,所述S5具体包括:
在挖掘的所述子网添加开始活动和终止活动ε,之后映射所有活动到具体的特征上;
将子日志活动根据所述足迹关系BF={→,+,||}分解为子活动过程,在每个所述子活动过程中添加接口库所挖掘出所述子网行为特征网;
将所述子网行为特征网通过开放Petri网合成整网后移除开始活动和终止活动ε,输出完整的流程模型。
本发明实施例提供的技术方案带来的有益效果是:本发明中,通过行为特征网处理事件日志,从而分解挖掘流程模型,首先基于活动日志确定日志中各活动间的行为足迹关系,推得相应的行为矩阵,然后,结合行为矩阵计算推得行为关系图,从而产生活动聚类,其次,通过现存挖掘算法过滤子日志挖掘出子网,并对子网添加接口库所形成子网行为特征网,接着,在行为特征网的基础上,运用开放Petri网合成网的观点合成整网,以此挖掘流程模型;从而将现有的挖掘算法运用于子日志集,而不是整个系统的完整日志,其中子日志包含的活动数远小于完整日志中的活动数,这就使得现存的挖掘算法可以更高效地用于流程模型挖掘,在一定程度上降低了挖掘过程中的计算复杂度。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的一种基于行为特征网的流程模型分解挖掘方法的流程图;
图2是本发明提供的一种挖掘活动聚类的流程图;
图3是本发明提供的一种挖掘完整流程模型的流程图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
参见图1,一种基于行为特征网的流程模型分解挖掘方法,适合处理包含活动数目较多的事件日志(日志中包含大约200个不同的活动),具体包括以下步骤:
步骤(1):基于事件日志L确定各活动间的行为足迹关系BF,推得相应的行为矩阵M。
需要说明的是,参见图2,步骤(1)中对任意的变迁对(x,y)∈(T×T),运用直接跟随关系,α算法定义三种行为足迹关系BF={→,+,||},其中→表示严格行为关系,+表示排他行为关系,||表示交叉行为关系;
对活动间三种行为足迹关系的估计强度进行映射(BF(x,y)→M(x,y))定义行为矩阵M;映射分为四个类型:(1)若x→y,则M(x,y)∈[0.75,1.00],(2)若x||y,则M(x,y)∈[-0.30,0.30],(3)若x+y,则M(x,y)∈[-1.00,-0.30],(4)若x←y或者则M(x,y)=-1.00。
步骤(2):基于行为矩阵M结合零值转换规则R计算行为关系图。
需要说明的是,参见图2,步骤(2)中R为一个零值转换规则,给定一个零值z∈(-1.00,1.00),若M(x,y)=1.00,则Mz(x,y)=1.00;若M(x,y)∈[z,1.00),则若M(x,y)∈(-1.00,z),则/>若M(x,y)=-1.00,则Mz(x,y)=-1.00;
基于行为矩阵M,结合零值转换规则R移除行为足迹关系强度小于阈值z的关系,即,保留大于阈值z的行为足迹关系,否则将被删除,得到行为关系图。
步骤(3):划分行为关系图中的等价弧产生活动聚类。
需要说明的是,从一个行为矩阵中挖掘一个初始活动聚类,要求这些活动聚类通过在行为关系图的弧上分配一个等价类产生,对于这个等价类,任意两条弧等价当满足以下条件之一时:(1)同输入弧:两条弧有相同的开始节点;(2)同输出弧:两条弧有相同的终止节点。
步骤(4):基于活动聚类过滤出子日志,将子日志使用混合ILP挖掘算法挖掘子网。
需要说明的是,参见图3,步骤(4)中,根据活动聚类中的活动保留日志中的对应活动,得到子日志;基于子日志通过混合ILP(混合归纳逻辑)挖掘算法,按照上述述三种行为足迹关系BF={→,+,||},得到四类映射挖掘出子网。
步骤(5):运用归纳挖掘算法对子网添加接口库所形成子网行为特征网,运用开放Petri网将所有子网行为特征网合成整网,输出完整的流程模型。
需要说明的是,参见图3,步骤(5)中,在挖掘的子网添加开始活动和终止活动ε,接着对各个子网中的活动分配具体特征,通过归纳挖掘算法,将子日志活动根据足迹关系BF={→,+,||}分解为子活动过程,在每个子活动过程中添加接口库所I∪O挖掘出子网行为特征网;然后将行为特征网所对应的接口库所通过开放Petri网进行两两匹配合成,然后移除开始活动/>和终止活动ε,输出完整的流程模型。
值得说明的是,本发明中,通过行为特征网处理事件日志,从而分解挖掘流程模型,首先基于活动日志确定日志中各活动间的行为足迹关系,推得相应的行为矩阵,然后,结合行为矩阵计算推得行为关系图,从而产生活动聚类,其次,通过现存挖掘算法过滤子日志挖掘出子网,并对子网添加接口库所形成子网行为特征网,接着,在行为特征网的基础上,运用开放Petri网合成网的观点合成整网,以此挖掘流程模型;从而将现有的挖掘算法运用于子日志集,而不是整个系统的完整日志,其中子日志包含的活动数远小于完整日志中的活动数,这就使得现存的挖掘算法可以更高效地用于流程模型挖掘,在一定程度上降低了挖掘过程中的计算复杂度。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (5)

1.一种基于行为特征网的流程模型分解挖掘方法,其特征在于,所述方法包括:
S1:基于事件日志确定各活动间的行为足迹关系BF,推得相应的行为矩阵M;
S2:基于所述行为矩阵M结合零值转换规则R计算行为关系图;
S3:划分所述行为关系图中的等价弧产生活动聚类;
S4:基于所述活动聚类过滤出子日志,将所述子日志使用混合ILP挖掘算法挖掘子网;
S5:运用归纳挖掘算法对所述子网添加接口库所形成子网行为特征网,运用开放Petri网将所有所述子网行为特征网合成整网,输出完整的流程模型。
2.根据权利要求1所述的一种基于行为特征网的流程模型分解挖掘方法,其特征在于,所述S1具体包括:
对任意的变迁对(x,y)∈(T×T),运用直接跟随关系,α算法定义三种行为足迹关系BF={→,+,||},其中→表示严格行为关系,+表示排他行为关系,||表示交叉行为关系;
对活动间三种行为足迹关系的估计强度进行映射(BF(x,y)→M(x,y))定义行为矩阵M;
所述映射分为四个类型:(1)若x→y,则M(x,y)∈[0.75,1.00],(2)若x||y,则M(x,y)∈[-0.30,0.30],(3)若x+y,则M(x,y)∈[-1.00,-0.30],(4)若x←y或者则M(x,y)=-1.00。
3.根据权利要求2所述的一种基于行为特征网的流程模型分解挖掘方法,其特征在于,所述S2具体包括:
给定一个零值z∈(-1.00,1.00),若M(x,y)=1.00,则Mz(x,y)=1.00;若M(x,y)∈[z,1.00),则若M(x,y)∈(-1.00,z),则/>若M(x,y)=-1.00,则Mz(x,y)=-1.00;
基于行为矩阵M,结合零值转换规则R移除行为足迹关系强度小于阈值z的关系,得到所述行为关系图。
4.根据权利要求3所述的一种基于行为特征网的流程模型分解挖掘方法,其特征在于,所述S4具体包括:
根据所述活动聚类中的活动保留日志中的对应活动,得到所述子日志;
基于所述子日志通过混合ILP挖掘算法,按照所述三种行为足迹关系BF={→,+,||},得到四类映射挖掘出所述子网。
5.根据权利要求4所述的一种基于行为特征网的流程模型分解挖掘方法,其特征在于,所述S5具体包括:
在挖掘的所述子网添加开始活动和终止活动ε,之后映射所有活动到具体的特征上;
将子日志活动根据所述足迹关系BF={→,+,||}分解为子活动过程,在每个所述子活动过程中添加接口库所挖掘出所述子网行为特征网;
将所述子网行为特征网通过开放Petri网合成整网后移除开始活动和终止活动ε,输出完整的流程模型。
CN202311077215.9A 2023-08-24 2023-08-24 一种基于行为特征网的流程模型分解挖掘方法 Pending CN117573460A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311077215.9A CN117573460A (zh) 2023-08-24 2023-08-24 一种基于行为特征网的流程模型分解挖掘方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311077215.9A CN117573460A (zh) 2023-08-24 2023-08-24 一种基于行为特征网的流程模型分解挖掘方法

Publications (1)

Publication Number Publication Date
CN117573460A true CN117573460A (zh) 2024-02-20

Family

ID=89888722

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311077215.9A Pending CN117573460A (zh) 2023-08-24 2023-08-24 一种基于行为特征网的流程模型分解挖掘方法

Country Status (1)

Country Link
CN (1) CN117573460A (zh)

Similar Documents

Publication Publication Date Title
Becker et al. Approximation algorithms for the loop cutset problem
CN102915423B (zh) 一种基于粗糙集和基因表达式的电力业务数据过滤系统及方法
Sumin et al. Determining the reliability of network information systems
Hirata et al. Dimensionless embedding for nonlinear time series analysis
CN107766076B (zh) 一种概率选择的软件模块聚类方法
CN117573460A (zh) 一种基于行为特征网的流程模型分解挖掘方法
Wang et al. Bipartite encoding: a new binary encoding for solving non-binary CSPs
Laszlo et al. Optimal univariate microaggregation with data suppression
CN114239831B (zh) 基于跨实体属性关联的卫星频轨资源信息向量表示方法
CN115827996A (zh) 一种具有共享约束的社区查询方法及系统
CN115376309A (zh) 一种基于多视角时间矩阵分解的缺失交通数据修复方法
Fry et al. On hierarchical structure adaptation and systems identification
Miao et al. Simplification, merging and division of fuzzy cognitive maps
Bogun Almost sure asymptotic expansions for profiles of simply generated random trees
CN101312424B (zh) Vpn结构还原方法和装置
Kruzick et al. Spectral statistics of lattice graph structured, non-uniform percolations
JP3092550B2 (ja) 処理フロー進捗管理システム及び処理フロー進捗管理方法
CN111796868A (zh) 一种实现CAD增强属性块和Excel数据交互的方法
CN112667751A (zh) 一种基于路径张量分解的知识图谱表示学习方法
CN114186691B (zh) 一种网络社区挖掘方法及其在零件加工区域识别中的应用
CN117313135B (zh) 一种基于属性划分的可高效重构的个人隐私保护方法
CN113824802B (zh) 一种去中心化分布式训练拓扑结构、训练系统及方法
CN118690982B (zh) 基于量子近似优化的关键输电断面搜索方法、系统和可读介质
CN112765661B (zh) 一种保持工作流拓扑特征的隐私保护方法
CN116582152B (zh) 一种长周期宽间隔跳频序列集的构造方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination