CN108647220A - 基于事件间接先于关系的科学工作流挖掘方法 - Google Patents
基于事件间接先于关系的科学工作流挖掘方法 Download PDFInfo
- Publication number
- CN108647220A CN108647220A CN201810226551.8A CN201810226551A CN108647220A CN 108647220 A CN108647220 A CN 108647220A CN 201810226551 A CN201810226551 A CN 201810226551A CN 108647220 A CN108647220 A CN 108647220A
- Authority
- CN
- China
- Prior art keywords
- event
- relationship
- prior
- indirectly
- scientific workflow
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0633—Workflow analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2216/00—Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
- G06F2216/03—Data mining
Landscapes
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Economics (AREA)
- Operations Research (AREA)
- Game Theory and Decision Science (AREA)
- Development Economics (AREA)
- Marketing (AREA)
- Educational Administration (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于事件间接先于关系的科学工作流挖掘方法,该方法以XES格式描述的事件日志作为输入,以SVG格式描述的标准科学工作流文件为输出结果;首先,通过解析XES日志文件,获取所有事件序列集合,遍历事件序列集合,获得所有基于间接先于关系的事件关系对;其次,根据事件关系对进行分析,确定事件相互关系,包括事件先于关系、事件后于关系、事件并行关系,并根据所有事件关系对生成科学工作流;最后,通过传递规约操作,保证事件之间可达关系不变的情况下,获得最终精简的标准科学工作流模型。本发明挖掘的科学工作流是可靠的、完备的,即使在日志信息不完备的情况下,挖掘尽可能接近于实际的标准科学工作流。
Description
技术领域
本发明属于数据挖掘领域,具体涉及一种基于事件间接先于关系的科学工作流挖掘方法。
背景技术
近年来,随着计算机技术的不断发展,科学工作流或业务过程模型在云计算、云服务中起着越来越重要的作用。科学工作流是以有向无环图建模的工作流模型,科学工作流技术以其动态性和灵活性,为Web服务组合提供优秀的解决方案。通过创建业务流程实现业务逻辑,把工作流中的活动或事件捆绑为具体的Web服务形式,生成可执行的Web服务序列,通过工作流引擎执行业务逻辑,完成整个业务流程。这种基于工作流的Web服务组合成为未来进行事件处理的发展趋势。
事件日志,作为计算机网络安全的重要组成部分,记录活动事件发生的日期、具体时间、操作者、动作、控制流流向等相关信息,具有巨大的价值。事件日志是由事件序列组成,通过计算机不断重复记录整个工作流中的事件发生的顺序,具有客观性和真实性的特点,通过事件日志挖掘生成的科学工作流也因此更贴近、符合实际业务事件执行的先后次序。
所谓工作流的挖掘是指通过事件日志,挖掘有用的过程知识。挖掘生成的科学工作流模型更符合实际,具有重要的意义。一方面能根据事件日志的反馈,及时地调整运营中的工作流,对业务流程重构、优化提供参考意见;另一方面,基于事件日志的科学工作流挖掘方法对于计算机相关技术的推动有着重要的作用,例如为软件回归测试提供新的解决思路等。
现有的工作流挖掘方法主要采用ALPHA算法进行挖掘,该方法时间效率较低,且当日志不完备时,挖掘生成的工作流与真实科学工作流模型准确度较低。
发明内容
本发明的目的在于提供一种基于事件间接先于关系的科学工作流挖掘方法,该方法即使在日志信息不完备的情况下,也尽可能挖掘并生成接近事实的科学工作流模型,具有高效性、完备性以及灵活性的特点。
实现本发明目的的技术方案为:一种基于事件间接先于关系的科学工作流挖掘方法,根据事件日志信息,挖掘标准科学工作流模型,以XES格式描述的事件日志作为输入,以SVG格式描述的标准科学工作流模型作为输出,具体步骤为:
步骤1,解析XES描述的事件日志文件,读取所有事件序列,将事件序列转化为所有基于间接先于关系的事件关系对,所述事件序列指一系列事件按照发生时间的先后次序所记录的排列组合,所述基于间接先于关系的事件关系对是指事件与事件之间发生的先后关系;
步骤2,遍历所有基于间接先于关系的事件关系对,挖掘所有事件之间相互关系,包括先于关系,后于关系以及并发关系,并根据挖掘后的事件关系生成初步科学工作流;
步骤3,对初步生成的科学工作流进行传递规约操作,生成标准科学工作流。
进一步的,步骤1具体为:
步骤1-1,解析事件日志文件,依次读取每一条日志信息,获取所有事件序列集合;
步骤1-2,遍历事件序列集合,根据每一条事件序列,获取所有基于间接先于关系的事件关系对;具体为:
任意一条事件序列{a1,a2,a3,a4,……,aN-1,aN}包含N个事件,其中ai代表事件,这N个事件按照事件发生先后顺序排列,获得N*(N-1)/2组的时间关系对:a1→L a2、a1→La3、……、a1→L aN、a2→L a3、a2→L a4、……、a2→L aN、……、aN-1→L aN;其中,ai→L aj代表事件ai间接发生在事件aj之前。
进一步的,步骤2具体为:
步骤2-1,遍历在步骤1-2中产生的所有基于间接先于关系的事件关系对,删除重复的事件关系对;
步骤2-2,遍历步骤2-1中剩下的基于间接先于关系的事件关系对,删除并发关系的事件关系对,即删除同时存在ai→L aj以及aj→L ai的事件关系对;
步骤2-3,根据步骤2-2中剩余的事件关系对,连结并生成初步的科学工作流模型。
进一步的,步骤3具体步骤为:
对于初步形成的科学工作流进行传递规约操作,通过该操作,删除事件与事件之间冗余的路径,保证科学工作流中,事件与事件之间的可达关系不变,并得到最终的标准科学工作流。
本发明与现有技术相比,其显著优点为:(1)本发明能够根据日志信息,挖掘生成科学工作流模型,较传统科学工作流的挖掘方法,本发明挖掘生成的科学工作流更具有完备性以及可靠性的特点,更接近于真实、实际的科学工作流模型;(2)当事件日志信息不充分、不完备的情况下,本发明较传统的科学工作流挖掘方法,具有更强的挖掘能力,挖掘出的标准科学工作流模型具有更高的准确性。
附图说明
图1是本发明基于事件间接先于关系的科学工作流挖掘方法流程图。
图2是以XES格式描述的事件日志文件示意图。
图3是初步挖掘的科学工作流模型图。
图4(a)和图4(b)是传递规约操作前后对比图。
图5是最终挖掘并生成的科学工作流模型图。
具体实施方式
结合图1,一张基于事件间接先于关系的科学工作流挖掘方法,根据本地事件日志信息,挖掘科学工作流模型,以XES格式描述的事件日志作为输入,以SVG为格式描述的标准科学工作流作为输出结果,该方法具体包括以下步骤:
步骤1,输入以XES格式描述的事件日志,解析事件日志,获得所有事件序列,遍历事件序列,获得所有基于间接先于关系的事件关系对,具体步骤如下:
步骤1-1,解析日志,将格式为XES的事件日志转化为事件序列集合;
步骤1-2,遍历事件序列集合中的每一条事件序列,获得事件关系对,具体操作包括:任意一条事件序列为{a1,a2,a3,a4,……,aN-1,aN},代表有N个事件,该N个事件发生的先后顺序为a1,a2,……,aN-1,aN,根据该事件序列,每一条事件序列可以获得N*(N-1)/2对基于间接先于关系的事件关系对:a1→L a2、a1→L a3、……、a1→L aN、a2→L a3、a2→L a4、……、a2→L aN、……、aN-1→L aN,其中ai→L aj代表事件ai间接发生在事件aj之前;
步骤2,根据所有基于间接先于关系的事件对,进行科学工作流的挖掘,具体包括以下步骤:
步骤2-1,事件关系对中存在多个重复的事件对时,删除重复的事件关系对,仅保留相同的、单个基于间接先于关系的事件关系对;
步骤2-2,遍历基于间接先于关系的事件关系对,当同时存在具有并发关系的事件关系对时,即同时存在ai→L aj和aj→L ai的事件关系对时,同时删除这两个基于间接先于关系的事件对;
步骤2-3,根据所有剩余的基于间接先于关系的事件关系对,挖掘并生成初步的科学工作流模型;
步骤3,对于初步形成的科学工作流模型,进一步整理、简化,通过传递规约的操作,获得最终精简、可靠的标准科学工作流模型。
下面结合具体实施例对本发明作进一步说明。
实施例
本发明为基于事件间接先于关系的科学工作流挖掘方法。该发明是基于事件间接先于关系的科学工作流挖掘方法,依赖于事件日志中,各个事件发生的先后顺序,称之为事件序列,这个序列称之为Trace,遍历Trace集合,挖掘所有基于间接先于关系的事件关系对,通过进一步的分析、计算挖掘并生成初步的科学工作流模型;最后,通过传递规约的操作,对科学工作流进一步精简、整理,挖掘生成最终的标准科学工作流模型。
结合实例,具体的操作步骤为:
步骤1,图2为某一事件日志的部分展示,由XES文件格式描述,该日志通过标签经过解析,其中Trace标签代表事件序列,Event代表事件,该事件日志共读取9个事件,产生的3条事件序列,所得到的事件序列集合为{{A,B,C,D,E,F,G,H,I},{B,C,A,D,E,G,F,H,I},{C,A,B,D,G,E,F,H,I}}遍历Trace集合,根据每一条Trace获得所有基于间接先于关系的事件关系对。其中,该事件日志共包含9个事件,每条Trace可获得9*(9-1)/2=36组基于间接先于关系的事件关系对:如事件A间接发生在事件B之前,记为A→L B。根据第一条Trace{A,B,C,D,E,F,G,H,I},可以获得该条Trace下所有基于间接先于关系:A→L B、A→L C、A→L D、A→L E、A→L F、A→L G、A→L H、A→L I、B→L C、B→L D、B→L E、B→L F、B→L G、B→L H、B→LI、C→L D、C→L E、C→L F、C→L G、C→L H、C→L I、D→L E、D→L F、D→L G、D→L H、D→L I、E→L F、E→L G、E→L H、E→L I、F→L G、F→L H、F→L I、G→L H、G→L I、H→L I。
步骤2,步骤1中,遍历Trace集合后,获得所有基于间接先于关系的事件关系对,开始挖掘科学工作流模型,首先,去掉所有重复的事件关系对,仅保留单个、不重复的基于间接先于关系的事件关系对:A→L B、A→L C、A→L D、A→L E、A→L F、A→L G、A→L H、A→L I、B→L C、B→L D、B→L E、B→L F、B→L G、B→L H、B→L I、C→L D、C→L E、C→L F、C→L G、C→LH、C→L I、D→L E、D→L F、D→L G、D→L H、D→L I、E→L F、E→L G、E→L H、E→L I、F→L G、F→L H、F→L I、G→L H、G→L I、H→L I、B→L A、C→L A、C→L B、G→L E、G→L F。当事件关系对中同时存在ai→L aj以及aj→L ai的事件关系对时,说明事件ai和aj为存在并发关系的事件,同时删除这两个基于间接先于关系的事件关系对,即删除A→L B和B→L A,A→L C和C→L A,B→L C和C→L B,E→L G和G→L E,F→L G和G→L F,共10组基于间接先于关系的事件关系对。对于剩余的事件关系对,进行组合,完成初步的科学工作流模型的挖掘,如图3所示。
步骤3,如图3所示的,该科学工作流模型较为冗余。如图4(a)所示,当事件A通过事件B,可以到达事件C时,事件A直接到达事件C的这条路径,认为该路径可以省略,即可通过传递规约操作获得图4(b)所示的科学工作流。所谓传递规约是指对于科学工作流中,保证所有事件之间的可达关系不变的情况,删除冗余的边,简化科学工作流,完成准确、精简的科学工作流挖掘。对于步骤2所挖掘生成的初步科学工作流模型,进行传递规约操作,获得接近于实际的、可靠的标准科学工作流模型,如图5所示。
Claims (4)
1.一种基于事件间接先于关系的科学工作流挖掘方法,其特征在于,根据事件日志信息,挖掘标准科学工作流模型,以XES格式描述的事件日志作为输入,以SVG格式描述的标准科学工作流模型作为输出,具体步骤为:
步骤1,解析XES描述的事件日志文件,读取所有事件序列,将事件序列转化为所有基于间接先于关系的事件关系对,所述事件序列指一系列事件按照发生时间的先后次序所记录的排列组合,所述基于间接先于关系的事件关系对是指事件与事件之间发生的先后关系;
步骤2,遍历所有基于间接先于关系的事件关系对,挖掘所有事件之间相互关系,包括先于关系,后于关系以及并发关系,并根据挖掘后的事件关系生成初步科学工作流;
步骤3,对初步生成的科学工作流进行传递规约操作,生成标准科学工作流。
2.根据权利要求1所述的基于事件间接先于关系的科学工作流挖掘方法,其特征在于,步骤1具体为:
步骤1-1,解析事件日志文件,依次读取每一条日志信息,获取所有事件序列集合;
步骤1-2,遍历事件序列集合,根据每一条事件序列,获取所有基于间接先于关系的事件关系对;具体为:
任意一条事件序列{a1,a2,a3,a4,…,ai,…,aN-1,aN}包含N个事件,其中ai代表事件,这N个事件按照事件发生先后顺序排列,获得N*(N-1)/2组的时间关系对:a1→L a2、a1→La3、……、a1→L aN、a2→L a3、a2→L a4、……、a2→L aN、……、aN-1→L aN;其中,ai→L aj代表事件ai间接发生在事件aj之前。
3.根据权利要求2所述的基于事件间接先于关系的科学工作流挖掘方法,其特征在于,步骤2具体为:
步骤2-1,遍历在步骤1-2中产生的所有基于间接先于关系的事件关系对,删除重复的事件关系对;
步骤2-2,遍历步骤2-1中剩下的基于间接先于关系的事件关系对,删除并发关系的事件关系对,即删除同时存在ai→L aj以及aj→L ai的事件关系对;
步骤2-3,根据步骤2-2中剩余的事件关系对,连结并生成初步的科学工作流模型。
4.根据权利要求1所述的基于事件间接先于关系的科学工作流挖掘方法,其特征在于,步骤3中初步的科学工作流模型进一步优化、整理,通过传递规约,得到最终标准科学工作流模型;具体步骤为:
对于初步形成的科学工作流进行传递规约操作,通过该操作,删除事件与事件之间冗余的路径,保证科学工作流中,事件与事件之间的可达关系不变,并得到最终的标准科学工作流。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810226551.8A CN108647220B (zh) | 2018-03-19 | 2018-03-19 | 基于事件间接先于关系的科学工作流挖掘方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810226551.8A CN108647220B (zh) | 2018-03-19 | 2018-03-19 | 基于事件间接先于关系的科学工作流挖掘方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108647220A true CN108647220A (zh) | 2018-10-12 |
CN108647220B CN108647220B (zh) | 2022-04-08 |
Family
ID=63744325
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810226551.8A Active CN108647220B (zh) | 2018-03-19 | 2018-03-19 | 基于事件间接先于关系的科学工作流挖掘方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108647220B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110597686A (zh) * | 2019-08-18 | 2019-12-20 | 南京理工大学 | 基于混合型事件日志的容噪过程挖掘方法 |
CN113342495A (zh) * | 2021-06-24 | 2021-09-03 | 山东理工大学 | 一种跨组织多实例子过程模型挖掘方法与系统 |
CN114629949A (zh) * | 2021-12-13 | 2022-06-14 | 美的网络信息服务(深圳)有限公司 | 业务监控方法、电子设备及计算机存储介质 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102332125B (zh) * | 2011-11-08 | 2014-03-19 | 南京大学 | 基于后继任务的工作流挖掘方法 |
CN103218692B (zh) * | 2013-04-27 | 2017-03-15 | 南京理工大学 | 基于活动间依赖关系分析的工作流挖掘方法 |
CN105095491B (zh) * | 2015-08-18 | 2018-05-08 | 山东科技大学 | 基于Petri网基本结构的过程模型修复方法 |
CN106327153B (zh) * | 2016-08-21 | 2019-11-15 | 南京理工大学 | 基于事件直接先于关系的云间科学工作流挖掘方法 |
-
2018
- 2018-03-19 CN CN201810226551.8A patent/CN108647220B/zh active Active
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110597686A (zh) * | 2019-08-18 | 2019-12-20 | 南京理工大学 | 基于混合型事件日志的容噪过程挖掘方法 |
CN110597686B (zh) * | 2019-08-18 | 2022-10-18 | 南京理工大学 | 基于混合型事件日志的容噪过程挖掘方法 |
CN113342495A (zh) * | 2021-06-24 | 2021-09-03 | 山东理工大学 | 一种跨组织多实例子过程模型挖掘方法与系统 |
CN113342495B (zh) * | 2021-06-24 | 2023-11-24 | 北京杰成合力科技有限公司 | 一种跨组织多实例子过程模型挖掘方法与系统 |
CN114629949A (zh) * | 2021-12-13 | 2022-06-14 | 美的网络信息服务(深圳)有限公司 | 业务监控方法、电子设备及计算机存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN108647220B (zh) | 2022-04-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102880684B (zh) | 基于日志记录挖掘与组合验证的工作流建模方法 | |
CN108647220A (zh) | 基于事件间接先于关系的科学工作流挖掘方法 | |
Salaün et al. | Realizability of choreographies using process algebra encodings | |
CN106503872B (zh) | 一种基于基础业务活动集的业务流程系统构建方法 | |
Kumar et al. | Mining message sequence graphs | |
CN112270550A (zh) | 一种基于区块链的新能源电力溯源方法及系统 | |
CN111367871B (zh) | 一种基于sapci可变长分块的文件间增量同步方法 | |
CN111984706A (zh) | 一种突发事件应急联动处置流程模型挖掘方法 | |
CN106327153B (zh) | 基于事件直接先于关系的云间科学工作流挖掘方法 | |
CN111427869A (zh) | 一种基于区块链的日志系统 | |
CN115374595A (zh) | 一种基于过程挖掘的自动化软件过程建模方法及系统 | |
CN109086385A (zh) | 一种基于Petri网的业务流程低频行为挖掘方法 | |
CN112435017A (zh) | 一种跨组织业务过程交互的建模与构建方法 | |
Conforti et al. | Analysis of business process variants in apromore | |
CN108647253B (zh) | 一种含时间约束工作流的挖掘算法 | |
CN108897680A (zh) | 一种基于soa的软件系统操作剖面构造方法 | |
CN108710645B (zh) | 基于混合型事件日志的过程挖掘方法 | |
Ackermann et al. | Towards behavioral reflexion models | |
CN108573043B (zh) | 业务过程死锁与缺乏同步错误的挖掘方法 | |
CN110597686B (zh) | 基于混合型事件日志的容噪过程挖掘方法 | |
Kouhestani et al. | Towards level 3 BIM process maps with IFC & XES process mining | |
CN113204811A (zh) | 一种关联或追溯bim模型修改前后信息的方法 | |
AlSaadi et al. | Unlocking Value From Data is Key to Successful Digital Transformation | |
CN110351750A (zh) | 物业移动端在弱网环境下的数据协同方法 | |
Ruzhnikov et al. | Digitalization and automation of the planning and execution of well construction process |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |