CN109271606B - 考虑并发的业务过程事件序列间编辑距离的求解方法 - Google Patents
考虑并发的业务过程事件序列间编辑距离的求解方法 Download PDFInfo
- Publication number
- CN109271606B CN109271606B CN201810966487.7A CN201810966487A CN109271606B CN 109271606 B CN109271606 B CN 109271606B CN 201810966487 A CN201810966487 A CN 201810966487A CN 109271606 B CN109271606 B CN 109271606B
- Authority
- CN
- China
- Prior art keywords
- sigma
- event
- events
- sequence
- business process
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/466—Transaction processing
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Computational Mathematics (AREA)
- Algebra (AREA)
- Databases & Information Systems (AREA)
- Computing Systems (AREA)
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种考虑并发的业务过程事件序列间编辑距离的求解方法,本发明以XES格式描述的业务过程事件日志和待求的两条事件序列为输入,以这两条事件序列间的编辑距离为输出;为了计算事件序列间的编辑距离,首先通过解析XES日志文件获得所有事件序列集合;然后从所得到的事件序列集合中挖掘出所有事件之间的并发关系集合;最后根据所有事件之间的并发关系集合,计算出待求的两条事件序列间的编辑距离。相较于传统的编辑距离计算方法,本发明可以处理含有并发的业务过程事件序列间编辑距离计算。
Description
技术领域
本发明属于业务过程领域,具体涉及一种考虑并发的业务过程事件序列间编辑距离的求解方法。
背景技术
20世纪90年代早期,美国企业为寻回它们在上一个十年间丢掉的竞争力,广泛开展了称为“再造工程”(Reengineering)的企业改造活动。再造工程的倡导者们明确地对亚当·斯密的劳动分工论做出了反思,并提出了以过程为中心这一新的组织原则。再造工程的实践和思想在短短几年传遍全世界,“业务过程”这一概念被明确地界定和广泛地接受,以业务过程为中心已经取代了“职能分工”,成为管理的首要原则。在新的业务过程理念基础上,进一步形成了“以过程为中心”的理念,以此打破传统组织常见的部门隔阂、僵化迟钝等弊端。而围绕着过程所建立的组织,具有更高的敏捷性、效率和效益。传统的办公自动化系统、科学工作流到最近的Web服务和在线事务处理,这些都属于业务过程领域。
为了支持管理决策,业务过程日志记录了过程实例的执行,通过分析过程日志数据可以了解业务过程的执行,实现业务过程的管理、改进、再造。在分析过程日志数据的过程中,不可避免地要对过程日志中的事件序列进行比较。其中,研究事件序列间的编辑距离是比较两条事件序列相异性的常用方法之一。
现有的方法采用传统的计算字符串间编辑距离计算方法来求得业务过程日志中事件序列间的编辑距离,但这种方法并不能有效的处理含有并发的业务过程事件序列。在考虑了并发的业务过程事件序列中,交换两个相邻的并发关系事件不应该产生编辑距离,但利用传统的计算字符串编辑距离方法却会产生影响,最后导致研究结果不准确。
发明内容
本发明的目的在于提供一种考虑并发的业务过程事件序列间编辑距离的求解方法。
实现本发明目的的技术解决方案为:一种考虑并发的业务过程事件序列间编辑距离的求解方法,具体步骤如下:
步骤1,解析XES描述的业务过程事件日志,获得所有事件序列集合L;
步骤2,从所得到的事件序列集合L中挖掘出所有事件之间的并发关系集合;
步骤3,根据所有事件之间的并发关系集合,计算出待求的两条事件序列间的编辑距离。
进一步的,步骤1具体为:
解析业务过程事件日志XES文件,依次读取每一条日志信息,获得所有事件序列集合L,任意一条事件序列σ={t1,t2,t3,…,tr}包含r个事件,t1……tr代表事件,这r个事件按照事件先后发生顺序排列。
进一步的,步骤2具体为:
步骤2-1,遍历事件序列集合L,挖掘获得所有事件之间的直接先于关系,符号表示为>,即对于任意一条事件序列σ={t1,t2,t3,…,tr},当a=ts,b=ts+1,则a>b;
步骤2-2,遍历根据步骤2-1得到的直接先于关系集合,挖掘获得事件之间的并发关系,符号表示为‖,当且仅当p>q,并且q>p时,p∥q,p、q为事件序列集合L中任意两个事件。
进一步的,步骤3具体为:
步骤3-1,根据两条待求事件序列σA和σB,其中σA的长度表示为lA,σB的长度表示为lB,构建一个距离矩阵其中矩阵中的值D(m,n)表示σA的子序列σA={t1,t2,t3,…,tm}和σB的子序列σB={t1,t2,t3,…,tn}之间的编辑距离;
步骤3-2,初始化矩阵中的第一行与第一列为对应的行号和列号;
步骤3-3,依次计算矩阵中的值,用i表示当前所求矩阵值对应的行号,用j表示当前所求矩阵值对应的列号,l表示i所指向的序列σA中的事件σA(i)在事件序列σB中的离j最近的位置,k表示j所指向的序列σB中的事件σB(j)在事件序列σA中的离i最近的位置,即l和k为满足{l,k|σA(k)=σB(j),σB(l)=σA(i),l∈[1,j],k∈[1,i]}条件的最大的行列号。从D(1,1)开始,根据如下规则计算距离矩阵D中剩下的值:
(1)D1(i,j)=D(i-1,j)+1;
(2)D2(i,j)=D(i,j-1)+1;
(3)当A(i)与B(j)相同时,D3(i,j)=D(i-1,j-1);
(4)当l与k存在时,D4(i,j)=D(i-1,j-1)-Δ(k)-Δ(l)+Anum(k,i,j)+Bnum(l,j,i)+{0,1};
Δ(k)=D(k-1,j-1)-D(k,j-1);
Δ(l)=D(i-1,l-1)-D(i-1,l);
(5)D(i,j)=min{D1(i,j),D2(i,j),D3(i,j),D4(i,j)}
其中Δ(k)=D(k,j-1)-D(k-1,j-1)表示删除事件σA(k)后σA{1…k}与σB{1…j-1}之间的编辑距离的变化,Δ(l)=D(i-1,l)-D(i-1,l-1)表示删除事件σB(l)后σA{1…i-1}与σB{1…l}之间的编辑距离的变化,D(i-1,j-1)-Δ(k)-Δ(l)表示删除事件σA(k)和σB(k)后σA{1…i-1}与σB{1…j-1}之间的编辑距离,Anum(k,i,j)表示σA(k)与σA(i)之间的所有不与σA(k)并发且在序列σB{1…j}中包含的事件数量,Bnum(l,j,i)表示σB(l)与σB(j)之间的所有不与σB(l)并发且在序列σA{1…i}中包含的事件数量;
步骤3-4,取矩阵D(lA+1,lB+1)为事件序列σA与σB间的编辑距离。
与现有技术相比,本发明的显著优点为:对现实世界业务流程的事件日志进行的大量实验表明,我们的方法能够准确地计算考虑并发的业务过程事件序列间编辑距离。
附图说明
图1为本发明的流程图。
图2为初始化的距离矩阵形式示意图。
图3为解析业务过程事件日志XES文件得到的事件序列集合L示意图。
图4为所有事件之间的直接先于关系矩阵示意图。
图5为所有事件之间的并发关系矩阵示意图。
图6为两条待求事件序列间的编辑距离矩阵示意图。
具体实施方式
本发明公开了一种考虑并发的业务过程事件序列间编辑距离的求解方法,以XES格式描述的业务过程事件日志和待求的两条事件序列为输入,以这两条事件序列间的编辑距离为输出,具体流程如附图1所示,图2为初始化的距离矩阵形式示意图。
其具体实现如下:
步骤1,解析业务过程事件日志XES文件,依次读取每一条日志信息,获得所有事件序列集合L,任意一条事件序列σ={t1,t2,t3,…,tn}包含n个事件,t1……tn代表事件,这n个事件按照事件先后发生顺序排列;
步骤2,遍历事件序列集合L中的每条事件序列,挖掘所有事件之间的并发关系,具体步骤如下:
步骤2-1,遍历事件序列集合L,运用算法1挖掘获得所有事件之间的直接先于关系。
步骤2-2,遍历事件序列集合L中的事件集合,根据步骤2-1得到的直接先于关系集合,运用算法2挖掘获得所有事件之间的并发关系。
算法1:Get direct relation
算法2:Get concurrent relation
步骤3,根据步骤2-2中得到的所有事件的并发关系集合,运用算法3计算事件序列间编辑距离。
算法3:Edit distance
下面结合实施例对本发明做进一步说明。
实施例
一种考虑并发的业务过程事件序列间编辑距离的求解方法,具体步骤如下:
步骤1,通过解析XES日志文件获得如图3所示的所有事件序列集合L。
步骤2,遍历事件序列集合L,运用算法1挖掘获得所有事件之间的直接先于关系矩阵,如图4所示,存在直接先于关系的两个事件,如A、B,其直接先于关系矩阵值Rd(A,B)=1,不存在直接先于关系的两个事件,如B、A,其直接先于关系矩阵值Rd(B,A)=0,遍历通过算法1得到的直接先于关系集合,运用算法2挖掘获得所有事件之间的并发关系矩阵,如图5所示,我们选择σA={X,D,A,B,C,E,Y}和σB={X,A,D,E,B,C,Y}这两条事件序列进行编辑距离的计算。
步骤3,对两条待求的事件序列σA={X,D,A,B,C,E,Y}、σB={X,A,D,E,B,C,Y}执行算法3,得到如图6所示的距离矩阵,矩阵中的最后一项数据就是σA={X,D,A,B,C,E,Y}与σB={X,A,D,E,B,C,Y}间编辑距离,即0,通过验证发现,本发明的计算结果是正确的。
Claims (3)
1.一种考虑并发的业务过程事件序列间编辑距离的求解方法,其特征在于,具体步骤如下:
步骤1,解析XES描述的业务过程事件日志,获得所有事件序列集合L;
步骤2,从所得到的事件序列集合L中挖掘出所有事件之间的并发关系集合;
步骤3,根据所有事件之间的并发关系集合,计算出待求的两条事件序列间的编辑距离;具体为:
步骤3-1,根据两条待求事件序列σA和σB,其中σA的长度表示为lA,σB的长度表示为lB,构建一个距离矩阵其中矩阵中的值D(m,n)表示σA的子序列σA={t1,t2,t3,...,tm}和σB的子序列σB={t1,t2,t3,...,tn}之间的编辑距离;
步骤3-2,初始化矩阵中的第一行与第一列为对应的行号和列号;
步骤3-3,依次计算矩阵中的值,用i表示当前所求矩阵值对应的行号,用j表示当前所求矩阵值对应的列号,l表示i所指向的序列σA中的事件σA(i)在事件序列σB中的离j最近的位置,k表示j所指向的序列σB中的事件σB(j)在事件序列σA中的离i最近的位置,即l和k为满足{l,k|σA(k)=σB(j),σB(l)=σA(i),l∈[1,j],k∈[1,i]}条件的最大的行列号;从D(1,1)开始,根据如下规则计算距离矩阵D中剩下的值:
(1)D1(i,j)=D(i-1,j)+1;
(2)D2(i,j)=D(i,j-1)+1;
(3)当A(i)与B(j)相同时,D3(i,j)=D(i-1,j-1);
(4)当l与k存在时,
D4(i,j)=D(i-1,j-1)-Δ(k)-Δ(l)+Anum(k,i,j)+Bnum(l,j,i)+{0,1};
Δ(k)=D(k-1,j-1)-D(k,j-1);
Δ(l)=D(i-1,l-1)-D(i-1,l);
(5)D(i,j)=min{D1(i,j),D2(i,j),D3(i,j),D4(i,j)}
其中Δ(k)=D(k,j-1)-D(k-1,j-1)表示删除事件σA(k)后σA{1...k}与σB{1...j-1}之间的编辑距离的变化,Δ(l)=D(i-1,l)-D(i-1,l-1)表示删除事件σB(l)后σA{1...i-1}与σB{1...l}之间的编辑距离的变化,D(i-1,j-1)-Δ(k)-Δ(l)表示删除事件σA(k)和σB(l)后σA{1...i-1}与σB{1...j-1}之间的编辑距离,Anum(k,i,j)表示σA(k)与σA(i)之间的所有不与σA(k)并发且在序列σB{1...j}中包含的事件数量,Bnum(l,j,i)表示σB(l)与σB(j)之间的所有不与σB(l)并发且在序列σA{1...i}中包含的事件数量;
步骤3-4,取矩阵D(lA+1,lB+1)为事件序列σA与σB间的编辑距离。
2.根据权利要求1所述的考虑并发的业务过程事件序列间编辑距离的求解方法,其特征在于,步骤1具体为:
解析业务过程事件日志XES文件,依次读取每一条日志信息,获得所有事件序列集合L,任意一条事件序列σ={t1,t2,t3,...,tr}包含r个事件,t1......tr代表事件,这r个事件按照事件先后发生顺序排列。
3.根据权利要求1所述的考虑并发的业务过程事件序列间编辑距离的求解方法,其特征在于,步骤2具体为:
步骤2-1,遍历事件序列集合L,挖掘获得所有事件之间的直接先于关系,符号表示为>,即对于任意一条事件序列σ={t1,t2,t3,...,tr},当a=ts,b=ts+1,则a>b;
步骤2-2,遍历根据步骤2-1得到的直接先于关系集合,挖掘获得事件之间的并发关系,符号表示为||,当且仅当p>q,并且q>p时,p||q,p、q为事件序列集合L中任意两个事件。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810966487.7A CN109271606B (zh) | 2018-08-23 | 2018-08-23 | 考虑并发的业务过程事件序列间编辑距离的求解方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810966487.7A CN109271606B (zh) | 2018-08-23 | 2018-08-23 | 考虑并发的业务过程事件序列间编辑距离的求解方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109271606A CN109271606A (zh) | 2019-01-25 |
CN109271606B true CN109271606B (zh) | 2023-05-26 |
Family
ID=65154125
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810966487.7A Active CN109271606B (zh) | 2018-08-23 | 2018-08-23 | 考虑并发的业务过程事件序列间编辑距离的求解方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109271606B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101261705A (zh) * | 2008-03-19 | 2008-09-10 | 北京航空航天大学 | 业务建模驱动的erp软件需求获取方法 |
CN102257487A (zh) * | 2008-10-07 | 2011-11-23 | 惠普开发有限公司 | 分析事件 |
CN104316801A (zh) * | 2014-10-31 | 2015-01-28 | 国家电网公司 | 基于时间序列相似性匹配的电力系统故障诊断方法 |
CN106327153A (zh) * | 2016-08-21 | 2017-01-11 | 南京理工大学 | 基于事件直接先于关系的云间科学工作流挖掘方法 |
-
2018
- 2018-08-23 CN CN201810966487.7A patent/CN109271606B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101261705A (zh) * | 2008-03-19 | 2008-09-10 | 北京航空航天大学 | 业务建模驱动的erp软件需求获取方法 |
CN102257487A (zh) * | 2008-10-07 | 2011-11-23 | 惠普开发有限公司 | 分析事件 |
CN104316801A (zh) * | 2014-10-31 | 2015-01-28 | 国家电网公司 | 基于时间序列相似性匹配的电力系统故障诊断方法 |
CN106327153A (zh) * | 2016-08-21 | 2017-01-11 | 南京理工大学 | 基于事件直接先于关系的云间科学工作流挖掘方法 |
Also Published As
Publication number | Publication date |
---|---|
CN109271606A (zh) | 2019-01-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102332125B (zh) | 基于后继任务的工作流挖掘方法 | |
CN104715073B (zh) | 基于改进Apriori算法的关联规则挖掘系统 | |
CN106339274A (zh) | 一种数据快照获取的方法及系统 | |
WO2016192126A1 (zh) | 在im沟通界面生成沟通事项的待办任务和结论的方法 | |
CN107909344A (zh) | 基于关系矩阵的工作流日志重复任务识别方法 | |
CN105786595B (zh) | 一种两段式提交的事务控制方法 | |
CN103559588A (zh) | 基于Petri网行为轮廓的日志挖掘方法 | |
CN107315763A (zh) | 一种针对Oracle数据库跨平台数据迁移方法 | |
CN109460391A (zh) | 一种基于流程切的过程模型挖掘新方法 | |
CN109271606B (zh) | 考虑并发的业务过程事件序列间编辑距离的求解方法 | |
CN115525693A (zh) | 面向增量事件日志的流程模型挖掘方法与系统 | |
CN106557881B (zh) | 一种基于业务活动执行顺序的业务流程系统构建方法 | |
CN107808258B (zh) | 基于业务流程日志和协作模式的工作流最优员工分配方法 | |
CN113867909A (zh) | 一种原子式实时清算方法 | |
CN106327153B (zh) | 基于事件直接先于关系的云间科学工作流挖掘方法 | |
CN116227907B (zh) | 基于对齐的多维度rpa流程相似度计算方法 | |
CN108897680B (zh) | 一种基于soa的软件系统操作剖面构造方法 | |
CN104462705A (zh) | 一种基于微粒群算法的夹具装配序列规划方法 | |
CN105447605A (zh) | 一种面向aps生产模型的动态建模方法 | |
CN116126929A (zh) | 对象为中心的协同式流程挖掘方法与系统 | |
Sarno et al. | Workflow common fragments extraction based on WSDL similarity and graph dependency | |
CN106250549A (zh) | 一种基于内存的频繁模式挖掘方法 | |
Saller et al. | Easy, adaptable and high-quality Modelling with domain-specific Constraint Patterns | |
CN112381228B (zh) | 一种基于业务的知识体系构建和应用方法 | |
CN103901819A (zh) | 基于特征标识的加工操作快速查找方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |