CN112612765A - 一种基于漂移检测的流程变体差异分析方法与系统 - Google Patents
一种基于漂移检测的流程变体差异分析方法与系统 Download PDFInfo
- Publication number
- CN112612765A CN112612765A CN202011518121.7A CN202011518121A CN112612765A CN 112612765 A CN112612765 A CN 112612765A CN 202011518121 A CN202011518121 A CN 202011518121A CN 112612765 A CN112612765 A CN 112612765A
- Authority
- CN
- China
- Prior art keywords
- activity
- drift
- node
- event log
- flow
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 44
- 238000004458 analytical method Methods 0.000 title claims abstract description 30
- 230000000694 effects Effects 0.000 claims abstract description 142
- 238000000034 method Methods 0.000 claims abstract description 89
- 238000007794 visualization technique Methods 0.000 claims abstract description 12
- 238000012800 visualization Methods 0.000 claims abstract description 8
- 239000011159 matrix material Substances 0.000 claims description 34
- 238000010586 diagram Methods 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 2
- 238000005065 mining Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000001364 causal effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 235000013402 health food Nutrition 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/18—File system types
- G06F16/1805—Append-only file systems, e.g. using logs or journals to store data
- G06F16/1815—Journaling file systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/34—Browsing; Visualisation therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于漂移检测的流程变体差异分析方法与系统,包括步骤:1)获取标准化事件日志,包括活动名称和活动时间的属性信息;2)以事件日志为输入进行漂移检测;3)根据漂移检测的结果对事件日志进行分割;4)采用可视化的方法将分割后的两个连续子日志的流程呈现出来;5)根据可视化的结果对两个连续子日志生成的有向图中相对应结点的前驱结点和后继结点的一致性进行比较分析。本发明基于漂移检测对流程变体之间的差异进行分析,检测流程是否符合预期的设计或者偏离设计,以帮助管理人员和流程分析人员感知流程变更行为,从而有效改进项目流程模型。
Description
技术领域
本发明涉及流程挖掘中的概念漂移和流程变体分析的技术领域,尤其是指一种基于漂移检测的流程变体差异分析方法与系统。
背景技术
近几年,随着大数据技术的发展,业务流程管理方法得到了进一步完善,企业信息系统已经成为支持业务流程的重要工具;同时,来自这些系统的实时数据的增长使得提取和分析有价值的信息成为可能。
传统的流程挖掘方法是为固定的环境而设计的,假定其中的基本概念不会随着时间而改变,但实际上,由于多方面的因素如客户需求改变、结构优化、突发情况等的影响,会导致相应业务流程的更改,这种流程的动态变更被称为概念漂移。概念漂移的分析涉及到研究业务流程如何变化,包括检测和定位变化以及研究后者的影响,流程变体分析的目的则是识别和解决由同一流程模型制定的一组流程执行序列所存在的差异。
目前现有方法分别侧重于漂移检测和流程变体分析这两个任务,在这种情况下,从业务分析师的角度来看,将两个孤立的解决方案一起使用既不可行,也没有用处,因此迫切的需要一种集漂移检测和流程变体差异分析于一体的综合方法与系统。
发明内容
本发明的第一目的在于克服现有技术的缺点与不足,提供了一种基于漂移检测的流程变体差异分析方法,突破了现有工作只侧重漂移检测或流程变体差异分析任一孤立任务而缺乏全局观念的局限性,在不增加计算成本的情况下既可以精确地检测到漂移又能对漂移后的流程行为进行准确描述。
本发明的第二目的在于提供一种基于漂移检测的流程变体差异分析系统。
本发明的第一目的通过下述技术方案实现:一种基于漂移检测的流程变体差异分析方法,包括以下步骤:
1)获取标准化事件日志,包括活动名称和活动时间的属性信息;其中,所述事件日志本质上是一组活动序列的有限集合,记录了业务操作的执行情况;
2)以事件日志为输入进行漂移检测,得到多个流程漂移点;
3)根据漂移检测的结果对事件日志进行分割;
4)采用可视化的方法将分割后的两个连续子日志的流程呈现出来;
5)根据步骤4)的结果对两个连续子日志生成的有向图中相对应结点的前驱结点和后继结点的一致性进行比较分析;其中,所述前驱结点为当前结点的上一个结点,后继结点为当前结点的下一个结点。
在步骤2)中,以事件日志为输入进行漂移检测,通过对事件日志中因果活动关系的抽取生成活动关系矩阵,判断活动关系矩阵中相邻窗口关系的变化情况来检测漂移,最终得到一系列流程漂移点,包括以下步骤:
2.1)对事件日志进行活动关系抽取得到一个活动关系矩阵,矩阵的行代表所有的活动关系,矩阵的列代表事件日志中所有轨迹,研究某个具体的活动关系只需要关注矩阵的某一行,研究某条轨迹只需要关注矩阵的某一列,其中所述轨迹表示流程的一次执行,所述活动关系是活动间的因果关系,用→表示:
设轨迹σ∈L,a,b∈σ,a>b成立,b>a不成立,其中轨迹σ=e1,e2,...,en是一个非空序列,事件e1、e2、en分别是第1次、第2次和第n次活动的执行;L为一个事件日志,是轨迹σ1,σ2,...,σn的集合,其中,σ1、σ2、σn分别是事件日志中的第1条轨迹、第2条轨迹和第n条轨迹;a,b分别表示一个活动,a>b表示活动a执行完后下一个活动b紧接着发生,若a=e1,则b=e2;
2.2)结合每个活动关系在活动关系矩阵中相邻窗口的变化情况检测候选漂移点,其中活动关系矩阵的每一行代表一种活动关系在所有轨迹上的成立情况;若同一活动关系在相邻两个窗口上总是存在或者从不存在,表明此关系在两个窗口上具有不变性;若同一活动关系在相邻两个窗口成立的情况不同,即在给定的窗口内从一个值变为另一个值,则说明流程可能在两个窗口的交点处发生了漂移,该点成为候选漂移点;
2.3)候选漂移点并不一定与流程漂移点相同,但往往分布在流程漂移点附近,因此根据检测到的候选漂移点进行密度聚类,以获得大概率事件下整个流程的漂移点;将检测到的候选漂移点划分为若干点簇,按照簇中点的数量大小进行排序,簇中点的数量越多,则该点簇越有可能代表最终的流程漂移点;通过对簇内所有数据点进行聚合平均,用每个点簇的平均值来表示流程漂移点。
在步骤3)中,根据步骤2)中漂移检测方法得到多个流程漂移点,将事件日志按照流程漂移点划分成多个连续的子日志。
在步骤4)中,采用可视化的方法将分割后的两个连续子日志的流程呈现出来;其中,所述可视化的方法是指将分割后的两个连续子日志中的活动跟随关系用基于有向图的形式来表示,所述活动跟随关系依赖活动间发生的先后顺序,在有向图中用有向箭头来表示,其中,箭头的始端表示先发生的活动,箭头的尾端表示后发生的活动。
在步骤5)中,根据步骤4)的可视化结果对两个连续子日志生成的有向图中相对应结点的前驱结点和后继结点的一致性进行比较分析,有以下三种情况:
第一种:若两个有向图中相对应结点的前驱结点和后继结点完全一致,则表示漂移后的流程变体在此处的活动关系未发生变更,不输出任何结点;
第二种:若两个有向图中相对应结点的前驱结点和后继结点至少有一项不一致,则表示漂移后的流程变体在此处的活动关系发生了变更,标记并输出此结点;
第三种:若对两个有向图遍历后找不到对应结点,则表示漂移后的流程变体的活动关系发生了彻底改变,未有相同结构,标记并输出所有变更的活动结点。
本发明的第二目的通过下述技术方案实现:一种基于漂移检测的流程变体差异分析系统,包括:
日志获取模块,用于获取标准化事件日志,包括活动名称和活动时间的属性信息;其中,所述事件日志本质上是一组活动序列的有限集合,记录了业务操作的执行情况;
漂移检测模块,根据获取的事件日志为输入进行漂移检测,通过对事件日志中因果活动关系的抽取生成活动关系矩阵,判断活动关系矩阵中相邻窗口关系的变化情况来检测漂移;
流程可视化模块,根据检测到的漂移点,将事件日志划分为若干子日志,进而对两个连续子日志的流程进行可视化;其中,所述可视化的方法是指将子日志中的活动跟随关系用基于有向图的形式来表示,所述活动跟随关系依赖活动间发生的先后顺序,在有向图中用有向箭头来表示;
差异分析模块,对两个连续子日志生成的有向图中相对应结点的前驱结点和后继结点的一致性进行比较分析,若两个有向图中相对应结点的前驱结点和后继结点至少有一项不一致,则表示漂移后的流程变体在此处发生了变更,标记并输出此结点,其中,所述前驱结点为当前结点的上一个结点,后继结点为当前结点的下一个结点。
本发明与现有技术相比,具有如下优点与有益效果:
1、本发明打破了传统方法抽取大量特征的局限性,仅通过抽取事件日志中的因果关系,便能够有效的检测到漂移,提高了程序效率。
2、本发明对漂移后的连续子日志的流程进行可视化,有利于对漂移后的流程的差异进行直观理解,便于准确描述。
3、本发明提出了一种综合漂移检测和漂移后流程变体差异分析的方法与系统,不需要额外的数据结构和过程模型,简化了处理流程。
4、本发明在不增加计算成本的情况下,能够帮助业务分析人员提取有用的知识,从而更好地理解流程行为。
5、本发明在漂移检测及流程变体差异分析方面具有广泛的使用空间,操作简单,适应性强,在检测和定位分析漂移方面有广阔前景。
附图说明
图1为本发明方法的逻辑流程示意图。
图2为本发明系统的架构图。
图3为本发明漂移检测算法的框架图。
图4为本发明流程变体2的可视化示意图。
图5为本发明流程变体3的可视化示意图
图6为本发明流程变体差异的分析结果示例图。
具体实施方式
下面结合实施例及附图对本发明作进一步详细的描述,但本发明的实施方式不限于此。
实施例1
如图1所示,本实施例公开了一种基于漂移检测的流程变体差异分析方法,包括以下步骤:
1)获取标准化事件日志,包括活动名称和活动时间的属性信息,其中,所述事件日志本质上是一组活动序列的有限集合,记录了业务操作的执行情况。
在本步骤中,获取的标准事件日志是一个贷款申请的业务流程。选取了不同规模的数据来进行测试,具体而言,分别选取了包含2500条,5000条,7500条和10000条轨迹的事件日志来进行实验,其中,所述轨迹表示业务流程的一次执行过程,所示案例是由一组以时间排序的活动组成的。
获取的事件日志信息如表1所示。
表1数据描述
规模 | 2500(条) | 5000(条) | 7500(条) | 10000(条) |
案例 | 2500(个) | 5000(个) | 7500(个) | 10000(个) |
事件 | 53890(个) | 107294(个) | 161242(个) | 214994(个) |
2)以事件日志为输入进行漂移检测,通过对事件日志中因果活动关系的抽取生成活动关系矩阵,判断活动关系矩阵中相邻窗口关系的变化情况来检测漂移,最终得到一系列流程漂移点,漂移检测算法框架图如附图3所示,具体包括以下步骤:
2.1)对事件日志进行活动关系抽取得到一个活动关系矩阵,矩阵的行代表所有的活动关系,矩阵的列代表事件日志中所有轨迹,研究某个具体的活动关系只需要关注矩阵的某一行,研究某条轨迹只需要关注矩阵的某一列,其中所述轨迹表示流程的一次执行,所述活动关系是活动间的因果关系,用→表示:
设轨迹σ∈L,a,b∈σ,a>b成立,b>a不成立,其中轨迹σ=e1,e2,...,en是一个非空序列,事件e1,e2,en分别是第1次、第2次和第n次活动的执行;L为一个事件日志,是轨迹σ1,σ2,...,σn的集合,其中,σ1,σ2,σn分别是事件日志中的第1条轨迹、第2条轨迹和第n条轨迹;a,b分别表示一个活动,a>b表示活动a执行完后下一个活动b紧接着发生,若a=e1,则b=e2。
2.2)结合每个活动关系在活动关系矩阵中相邻窗口的变化情况检测候选漂移点,其中活动关系矩阵的每一行代表一种活动关系在所有轨迹上的成立情况。若同一活动关系在相邻两个窗口上总是存在或者从不存在,表明此关系在两个窗口上具有不变性;若同一活动关系在相邻两个窗口成立的情况不同,即在给定的窗口内从一个值变为另一个值,则说明流程可能在两个窗口的交点处发生了变化,该点成为候选漂移点。
采用上述步骤逐行分析活动关系矩阵中每种活动关系的变化情况,得可到一系列候选漂移点。
2.3)候选漂移点并不一定与流程漂移点相同,但往往分布在流程漂移点附近,因此根据检测到的候选漂移点进行密度聚类,以获得大概率事件下整个流程的漂移点。将检测到的候选漂移点划分为若干点簇,按照簇中点的数量大小进行排序,簇中点的数量越多,则该点簇越有可能代表最终的流程漂移点。通过对簇内所有数据点进行聚合平均,用每个点簇的平均值来表示流程漂移点。
采用上述步骤,对包含2500条,5000条,7500条和10000条轨迹的事件日志进行实验,检测到的一系列流程漂移点如表2所示。
表2漂移点检测结果
3)根据步骤2)中漂移检测方法得到多个流程漂移点,将事件日志按照流程漂移点划分成多个连续的子日志。
采用上述步骤,以包含2500条轨迹的贷款申请的业务流程为例,由漂移检测方法得到0、250、499、749、880、998、1249、1500、1750、2000、2252共11个漂移点,则整个贷款申请流程的事件日志可分割为12个子日志区间:第1个子日志[0,0),第2个子日志[0,250),第3个子日志[250,499),第4个子日志[499,749),第5个子日志[749,880),第6个子日志[880,998),第7个子日志[998,1249),第8个子日志[1249,1500),第9个子日志[1500,1750),第10个子日志[1750,2000),第11个子日志[2200,2252),第12个子日志[2252,2500)。
4)采用可视化的方法将分割后的两个连续子日志的流程呈现出来,其中,所述可视化的方法是指将分割后的两个连续子日志中的活动跟随关系用基于有向图的形式来表示;所述活动跟随关系依赖活动间发生的先后顺序,在有向图中用有向箭头来表示,其中,箭头的始端表示先发生的活动,箭头的尾端表示后发生的活动,根据有向图能够更直观地分辨相邻变体之间行为的变化。
采用上述步骤,本案例中以包含2500条轨迹的贷款申请的业务流程为例,对分割后的第2个子日志(变体2)和第3个子日志(变体3)进行可视化,输出其可视化流程图分别如附图4和附图5所示,其中,附图4和附图5中结点之间的有向箭头代表活动结点的先后发生关系,即接受贷款申请活动发生后检查申请表的完整性这一活动才发生。
5)根据步骤4)的可视化结果对两个连续子日志生成的有向图中相对应结点的前驱结点(当前结点的上一个结点)和后继结点(当前结点的下一个结点)的一致性进行比较分析,有以下三种情况:
第一种:若两个有向图中相对应结点的前驱结点和后继结点完全一致,则表示漂移后的流程变体在此处的活动关系未发生变更,不输出任何结点;
第二种:若两个有向图中相对应结点的前驱结点和后继结点至少有一项不一致,则表示漂移后的流程变体在此处的活动关系发生了变更,标记并输出此结点;
第三种:若对两个有向图遍历后找不到对应结点,则表示漂移后的流程变体的活动关系发生了彻底改变,未有相同结构,标记并输出所有变更的活动结点。
采用上述步骤,对本案例中选取的两个连续子日志(变体2和变体3)生成的有向图的差异进行比较分析后的部分结果如附图6所示,分析结果表明,变体2与变体3中的增加活动结点、资产评估结点、批准申请结点、检查申请表的完整性结点、查询信用记录结点、准备接受结点、核实还款协议结点、批准贷款申请结点和评估贷款风险结点皆存在差异。
实施例2
如图2所示,本实施例公开了一种基于漂移检测的流程变体差异分析系统,包括:
日志获取模块,用于获取标准化事件日志,包括活动名称和活动时间的属性信息;其中,所述事件日志本质上是一组活动序列的有限集合,记录了业务操作的执行情况;
漂移检测模块,根据获取的事件日志为输入进行漂移检测,通过对事件日志中因果活动关系的抽取生成活动关系矩阵,判断活动关系矩阵中相邻窗口关系的变化情况来检测漂移;若相邻两个窗口关于同一活动关系成立的情况不同,则流程可能在两个窗口的交点处发生了漂移,该点成为候选漂移点。根据检测到的候选漂移点进行密度聚类,可将候选漂移点划分为若干点簇,点簇中包含的候选漂移点越多,则该点簇越有可能为流程的一个最终漂移点,故根据点簇从大到小的顺序进行排序以生成最终的流程漂移点,此处用每个点簇的平均值来表示流程漂移点。
流程可视化模块,根据检测到的漂移点,将事件日志划分为若干子日志,进而对两个连续子日志的流程进行可视化;其中,所述可视化的方法是指将子日志中的活动跟随关系用基于有向图的形式来表示,所述活动跟随关系依赖活动间的发生顺序,在有向图中用有向箭头来表示。
差异分析模块,对两个连续子日志生成的有向图中相对应结点的前驱结点和后继结点的一致性进行比较分析,若两个有向图中相对应结点的前驱结点和后继结点至少有一项不一致,则表示漂移后的流程变体在此处发生了变更,标记并输出此结点,其中,所述前驱结点为当前结点的上一个结点,后继结点为当前结点的下一个结点。
综上所述,在采用以上方案后,本发明提出了一种综合漂移检测和漂移后流程变体差异分析的方法与系统,以事件日志为输入,在检测到漂移后,以漂移后的子日志为基础,对子流程进行可视化,能直观地比较分析相邻变体间发生差异的行为,在不增加计算成本的前提下,能够为业务分析人员提供有价值的见解和帮助,具有实际推广价值,值得推广。
以上所述实施例只为本发明之较佳实施例,并非以此限制本发明的实施范围,故凡依本发明之形状、原理所作的变化,均应涵盖在本发明的保护范围内。
Claims (6)
1.一种基于漂移检测的流程变体差异分析方法,其特征在于,包括以下步骤:
1)获取标准化事件日志,包括活动名称和活动时间的属性信息;其中,所述事件日志本质上是一组活动序列的有限集合,记录了业务操作的执行情况;
2)以事件日志为输入进行漂移检测,得到多个流程漂移点;
3)根据漂移检测的结果对事件日志进行分割;
4)采用可视化的方法将分割后的两个连续子日志的流程呈现出来;
5)根据步骤4)的结果对两个连续子日志生成的有向图中相对应结点的前驱结点和后继结点的一致性进行比较分析;其中,所述前驱结点为当前结点的上一个结点,后继结点为当前结点的下一个结点。
2.根据权利要求1所述的一种基于漂移检测的流程变体差异分析方法,其特征在于:在步骤2)中,以事件日志为输入进行漂移检测,通过对事件日志中因果活动关系的抽取生成活动关系矩阵,判断活动关系矩阵中相邻窗口关系的变化情况来检测漂移,最终得到一系列流程漂移点,包括以下步骤:
2.1)对事件日志进行活动关系抽取得到一个活动关系矩阵,矩阵的行代表所有的活动关系,矩阵的列代表事件日志中所有轨迹,研究某个具体的活动关系只需要关注矩阵的某一行,研究某条轨迹只需要关注矩阵的某一列,其中所述轨迹表示流程的一次执行,所述活动关系是活动间的因果关系,用→表示:
设轨迹σ∈L,a,b∈σ,a>b成立,b>a不成立,其中轨迹σ=e1,e2,...,en是一个非空序列,事件e1、e2、en分别是第1次、第2次和第n次活动的执行;L为一个事件日志,是轨迹σ1,σ2,...,σn的集合,其中,σ1、σ2、σn分别是事件日志中的第1条轨迹、第2条轨迹和第n条轨迹;a,b分别表示一个活动,a>b表示活动a执行完后下一个活动b紧接着发生,若a=e1,则b=e2;
2.2)结合每个活动关系在活动关系矩阵中相邻窗口的变化情况检测候选漂移点,其中活动关系矩阵的每一行代表一种活动关系在所有轨迹上的成立情况;若同一活动关系在相邻两个窗口上总是存在或者从不存在,表明此关系在两个窗口上具有不变性;若同一活动关系在相邻两个窗口成立的情况不同,即在给定的窗口内从一个值变为另一个值,则说明流程可能在两个窗口的交点处发生了漂移,该点成为候选漂移点;
2.3)候选漂移点并不一定与流程漂移点相同,但往往分布在流程漂移点附近,因此根据检测到的候选漂移点进行密度聚类,以获得大概率事件下整个流程的漂移点;将检测到的候选漂移点划分为若干点簇,按照簇中点的数量大小进行排序,簇中点的数量越多,则该点簇越有可能代表最终的流程漂移点;通过对簇内所有数据点进行聚合平均,用每个点簇的平均值来表示流程漂移点。
3.根据权利要求1所述的一种基于漂移检测的流程变体差异分析方法,其特征在于:在步骤3)中,根据步骤2)中漂移检测方法得到多个流程漂移点,将事件日志按照流程漂移点划分成多个连续的子日志。
4.根据权利要求1所述的一种基于漂移检测的流程变体差异分析方法,其特征在于:在步骤4)中,采用可视化的方法将分割后的两个连续子日志的流程呈现出来;其中,所述可视化的方法是指将分割后的两个连续子日志中的活动跟随关系用基于有向图的形式来表示,所述活动跟随关系依赖活动间发生的先后顺序,在有向图中用有向箭头来表示,其中,箭头的始端表示先发生的活动,箭头的尾端表示后发生的活动。
5.根据权利要求1所述的一种基于漂移检测的流程变体差异分析方法,其特征在于:在步骤5)中,根据步骤4)的可视化结果对两个连续子日志生成的有向图中相对应结点的前驱结点和后继结点的一致性进行比较分析,有以下三种情况:
第一种:若两个有向图中相对应结点的前驱结点和后继结点完全一致,则表示漂移后的流程变体在此处的活动关系未发生变更,不输出任何结点;
第二种:若两个有向图中相对应结点的前驱结点和后继结点至少有一项不一致,则表示漂移后的流程变体在此处的活动关系发生了变更,标记并输出此结点;
第三种:若对两个有向图遍历后找不到对应结点,则表示漂移后的流程变体的活动关系发生了彻底改变,未有相同结构,标记并输出所有变更的活动结点。
6.一种基于漂移检测的流程变体差异分析系统,其特征在于,包括:
日志获取模块,用于获取标准化事件日志,包括活动名称和活动时间的属性信息;其中,所述事件日志本质上是一组活动序列的有限集合,记录了业务操作的执行情况;
漂移检测模块,根据获取的事件日志为输入进行漂移检测,通过对事件日志中因果活动关系的抽取生成活动关系矩阵,判断活动关系矩阵中相邻窗口关系的变化情况来检测漂移;
流程可视化模块,根据检测到的漂移点,将事件日志划分为若干子日志,进而对两个连续子日志的流程进行可视化;其中,所述可视化的方法是指将子日志中的活动跟随关系用基于有向图的形式来表示,所述活动跟随关系依赖活动间发生的先后顺序,在有向图中用有向箭头来表示;
差异分析模块,对两个连续子日志生成的有向图中相对应结点的前驱结点和后继结点的一致性进行比较分析,若两个有向图中相对应结点的前驱结点和后继结点至少有一项不一致,则表示漂移后的流程变体在此处发生了变更,标记并输出此结点,其中,所述前驱结点为当前结点的上一个结点,后继结点为当前结点的下一个结点。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011518121.7A CN112612765A (zh) | 2020-12-21 | 2020-12-21 | 一种基于漂移检测的流程变体差异分析方法与系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011518121.7A CN112612765A (zh) | 2020-12-21 | 2020-12-21 | 一种基于漂移检测的流程变体差异分析方法与系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112612765A true CN112612765A (zh) | 2021-04-06 |
Family
ID=75244318
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011518121.7A Pending CN112612765A (zh) | 2020-12-21 | 2020-12-21 | 一种基于漂移检测的流程变体差异分析方法与系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112612765A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116225513A (zh) * | 2023-05-09 | 2023-06-06 | 安徽思高智能科技有限公司 | 一种基于概念漂移的rpa动态流程发现方法及系统 |
CN117473346A (zh) * | 2023-12-27 | 2024-01-30 | 安徽思高智能科技有限公司 | 一种基于轨迹聚类的流程漂移定位方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105808923A (zh) * | 2016-02-29 | 2016-07-27 | 北京航空航天大学 | 一种数据序列的异常检测方法和装置 |
US20160350165A1 (en) * | 2015-05-28 | 2016-12-01 | Microsoft Technology Licensing, Llc | Detecting anomalous accounts using event logs |
CN107909344A (zh) * | 2017-11-21 | 2018-04-13 | 杭州电子科技大学 | 基于关系矩阵的工作流日志重复任务识别方法 |
CN109753591A (zh) * | 2018-12-11 | 2019-05-14 | 江阴逐日信息科技有限公司 | 业务流程预测性监控方法 |
CN111104383A (zh) * | 2019-05-10 | 2020-05-05 | 清华大学 | 一种检测事件日志突发漂移变化的方法及装置 |
-
2020
- 2020-12-21 CN CN202011518121.7A patent/CN112612765A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160350165A1 (en) * | 2015-05-28 | 2016-12-01 | Microsoft Technology Licensing, Llc | Detecting anomalous accounts using event logs |
CN105808923A (zh) * | 2016-02-29 | 2016-07-27 | 北京航空航天大学 | 一种数据序列的异常检测方法和装置 |
CN107909344A (zh) * | 2017-11-21 | 2018-04-13 | 杭州电子科技大学 | 基于关系矩阵的工作流日志重复任务识别方法 |
CN109753591A (zh) * | 2018-12-11 | 2019-05-14 | 江阴逐日信息科技有限公司 | 业务流程预测性监控方法 |
CN111104383A (zh) * | 2019-05-10 | 2020-05-05 | 清华大学 | 一种检测事件日志突发漂移变化的方法及装置 |
Non-Patent Citations (1)
Title |
---|
郑灿彬等: ""基于可扩展活动关系的过程概念漂移检测"", 《计算机集成制造系统》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116225513A (zh) * | 2023-05-09 | 2023-06-06 | 安徽思高智能科技有限公司 | 一种基于概念漂移的rpa动态流程发现方法及系统 |
CN116225513B (zh) * | 2023-05-09 | 2023-07-04 | 安徽思高智能科技有限公司 | 一种基于概念漂移的rpa动态流程发现方法及系统 |
CN117473346A (zh) * | 2023-12-27 | 2024-01-30 | 安徽思高智能科技有限公司 | 一种基于轨迹聚类的流程漂移定位方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9354867B2 (en) | System and method for identifying, analyzing and integrating risks associated with source code | |
CN111324602A (zh) | 一种实现面向金融大数据分析可视化方法 | |
JPH10510385A (ja) | ソフトウエア品質のアーキテクチャに基づく分析のための方法およびシステム | |
Pathak et al. | Minimizing cost of continuous audit: Counting and time dependent strategies | |
CN112612765A (zh) | 一种基于漂移检测的流程变体差异分析方法与系统 | |
CN109308225B (zh) | 一种虚拟机异常检测方法、装置、设备及存储介质 | |
Shankar et al. | Towards observability for production machine learning pipelines | |
Kitchenham et al. | Design metrics in practice | |
CN118489116A (zh) | 异常检测方法、装置、计算机可读介质和电子装置 | |
CN112836719A (zh) | 一种融合二分类和三元组的示功图相似性检测方法 | |
CN118297444A (zh) | 一种面向人工智能的数据集质量通用评估方法 | |
CN115657890A (zh) | 一种pra机器人可定制方法 | |
CN115982655A (zh) | 一种基于决策树的缺失数据流程异常预测方法 | |
CN113393169B (zh) | 基于大数据技术的金融行业交易系统性能指标分析方法 | |
Vijaya et al. | Monitoring the stability of the processes in defined level software companies using control charts with three sigma limits | |
CN115587333A (zh) | 一种基于多分类模型的失效分析故障点预测方法及系统 | |
CN115328866A (zh) | 一种基于日志采样的流程实例下一事件预测方法与系统 | |
CN109685453B (zh) | 智能识别工作流有效路径的方法 | |
CN111984515A (zh) | 多源异构日志分析方法 | |
Salhi et al. | Data Preprocessing Using AutoML: A Survey | |
CN111626586B (zh) | 数据质量检测方法、装置、计算机设备和存储介质 | |
CN113918623B (zh) | 风控相关行为的次数计算方法及其装置 | |
CN115410718B (zh) | 一种评估大型面对面调查中调查员误差的方法 | |
CN114297729A (zh) | 一种配置管理数据库的审计方法、系统及相关装置 | |
CN118838834A (zh) | 软件缺陷定位方法、装置、设备、存储介质和计算机程序 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20211222 Address after: 518000 Room 201, building A, No. 1, Qian Wan Road, Qianhai Shenzhen Hong Kong cooperation zone, Shenzhen, Guangdong (Shenzhen Qianhai business secretary Co., Ltd.) Applicant after: Shenzhen Jiecheng Software Co.,Ltd. Address before: 266 Xincun West Road, Zhangdian District, Zibo City, Shandong Province Applicant before: Shandong University of Technology |
|
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210406 |