CN106096644B - 基于概率工作流的相似度度量方法及装置 - Google Patents

基于概率工作流的相似度度量方法及装置 Download PDF

Info

Publication number
CN106096644B
CN106096644B CN201610402067.7A CN201610402067A CN106096644B CN 106096644 B CN106096644 B CN 106096644B CN 201610402067 A CN201610402067 A CN 201610402067A CN 106096644 B CN106096644 B CN 106096644B
Authority
CN
China
Prior art keywords
probability
node
task
mark
workflow
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610402067.7A
Other languages
English (en)
Other versions
CN106096644A (zh
Inventor
胡华
胡海洋
乔静
卢科帆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Dianzi University
Original Assignee
Hangzhou Dianzi University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Dianzi University filed Critical Hangzhou Dianzi University
Priority to CN201610402067.7A priority Critical patent/CN106096644B/zh
Publication of CN106096644A publication Critical patent/CN106096644A/zh
Application granted granted Critical
Publication of CN106096644B publication Critical patent/CN106096644B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/103Workflow collaboration or project management

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Artificial Intelligence (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于概率工作流的相似度度量方法及其装置。本发明首先分析公司的业务流程,得到公司的任务集合;然后根据工作日志为每个任务分配发生的概率;并根据任务之间的关系和概率集合P画出结构化概率工作流;其次将结构化概率工作流转换成概率结构树;再进一步将概率结构树简化成概率有向无环图;导出概率有向无环图PAD的迹分布,根据概率有向无环图的迹分布,从而得到每一条迹对应的动作路径映射与概率路径映射;计算两个工作流WFN1和WFN2之间的相似度。本发明将数据流考虑进来,通过分析数据的走向,统计任务节点发生的频率,计算任务节点发生的概率,结合文本相似度和行为相似度方法计算流程之间的相似度,可以提高比较结果的准确度。

Description

基于概率工作流的相似度度量方法及装置
技术领域
本发明涉及一种基于概率工作流的相似度度量方法及装置。本发明在流程检索,流程重组,流程合并等方面有着广泛的应用。用于在已有日志的环境下比较工作流之间的相似度,通过将概率考虑进来,可以提高比较结果的准确度,为业务过程的在线检索提供技术支持。
背景技术
在现在这个高度数字化的时代,业务流程模型成为了分析企业或者公共组织业务的主要手段。对于大型的模型库的使用要求能够访问和管理模型,特别是快速的检索出需要的模型。现实中,检索信息都是通过简单的搜索特征来完成的。比如,基于文件导航或者文本搜索等。但是由于业务流程模型的语言,标准和用词的异构性,所以不能用简单的搜索文本的方法来实现。
现有的流程模型之间的相似度的度量方法大概从三个方面来考虑:即流程的文本,流程的结构和流程的行为。流程文本内容相似度指的是通过流程模型中节点对应标签文本的相似度来度量流程的相似度;流程的结构相似度是通过将工作流抽象成图,然后比较图的结构的相似度;流程的行为相似度是通过导出流程的所有可能的执行路径,然后比较流程的路径集合的相似度。这些方法都是把流程当做一个静态的对象来研究的,只考虑了流程的控制流维度的信息,而忽略了业务流程的其他两个维度的信息,即数据流维度,资源维度。这就导致了结果不准确。
发明内容
本发明针对目前的研究现状,提出了一种基于概率工作流的相似度度量方法。
本发明解决其技术问题所采用的技术方案包括如下步骤:
步骤(1)分析公司的业务流程,得到公司的任务集合;T={T1,T2,......,Tn}。
具体的:根据公司的历史记录归纳出公司涉及的任务名称,统计任务发生的次数,分析任务之间的依赖关系,得出每一个任务发生的概率,最终得到任务集合T和每一个任务对应的概率集合P。
步骤(2)根据工作日志为每个任务分配发生的概率;P={P1,P2,......,Pn}:概率集合P中的每个元素分别对应任务集合中每个任务发生的概率;
步骤(3)根据任务之间的关系和概率集合P画出结构化概率工作流WFN=(T,S,E,P)。其中代表边的集合;S为状态集合;所述的结构化包括顺序、并行和选择三种基本的结构表示;
步骤(4)将结构化概率工作流转换成概率结构树;TR=(T,C,E,P),其中代表边的集合;C为控制节点集合;具体的转换过程如下:
4-1.提取结构化概率工作流中的所有任务节点,并将所有任务节点看成是只有一个叶子节点的树,组成一个子树集合;
4-2.对子树集合中的每个任务节点进行访问,具体如下:
对于子树集合中每一组顺序执行的任务节点(如图1(a)所示),首先构造一个Sequence控制节点,然后从Sequence控制节点出发,向它对应的任务节点画出一条带箭头的有向边,从而代表该组的节点是顺序执行关系,然后在每一个Sequence控制节点和它对应的任务节点之间添加概率节点,代表任务节点发生的概率,从而构造出一颗Sequence子树,将已访问过的任务节点标记为已访问,然后将整个子树作为一个任务节点,加入子树集合,并从子树集合中删除已访问的节点;
对于子树集合中每一组并行执行的任务节点(如图1(b)所示),首先构造一个Parallel控制节点,然后从Parallel控制节点出发,向它对应的任务节点画出一条带箭头的有向边,从而代表该组的节点是并行执行关系,然后在每一个Parallel控制节点和它对应的任务节点之间添加概率节点,代表任务节点发生的概率,从而构造出一颗Parallel子树,将已访问过的任务节点标记为已访问,然后将整个子树作为一个任务节点,加入子树集合,并从子树集合中删除已访问的节点;
对于子树集合中每一组选择执行的任务节点(如图1(c)所示),首先构造一个Exclusive-choice控制节点,然后从Exclusive-choice控制节点出发,向它对应的任务节点画出一条带箭头的有向边,从而代表该组的节点是选择执行关系,然后在每一个Exclusive-choice控制节点和它对应的任务节点之间添加概率节点,代表任务节点发
生的概率,从而构造出成一颗Exclusive-choice子树,将已访问过的任务节点标记为已访问,然后将整个子树作为一个任务节点,加入子树集合,并从子树集合中删除已访问的节点;
4-3.重复步骤4-2,直到子树集合只剩一颗树为止;
步骤(5)进一步将概率结构树简化成概率有向无环图;PAD<●,○,→,●={S,P,E-C}表示结构控制节点,○表示活动节点, 表示有向边,□是概率节点,代表任务节点发生的概率;将概率结构树简化成概率有向无环图PAD(Probabilistic Acyclic Directed),PAD<●,○,→,□>,简化方法如下:将结构控制节点{Sequence,Parallel,Exclusive-choice}用●={S,P,E-C}集合中对应的元素来表示;
步骤(6)将步骤(5)所述的概率有向无环图看作一系列从根节点到叶节点的字符串集合,将每条从根节点到叶节点的最大路径记为一个迹,所有的迹的集合组成了该概率有向无环图的迹分布;导出概率有向无环图PAD的迹分布,根据概率有向无环图的迹分布,从而得到每一条迹对应的动作路径映射与概率路径映射;
给定一个具体的概率有向无环图PAD:则图的迹分布的构建方法如下:
看作一系列从根节点到叶节点的字符串集合,将每条从根节点到叶节点的最大路径记为一个迹x=<a0,p0,a1,p1,a2,p2,......,an>,这些迹组成的集合就是迹分布,表示为
步骤(7)计算两个工作流WFN1和WFN2之间的相似度:首先将WFN1和WFN2转换成对应的概率有向无环图PAD:具体步骤如下:
7-1.首先根据步骤(6)导出对应的迹分布
7-2.将迹分布中的每个迹分解为动作路径映射φ(x)和概率路径映射对于任意的一个迹有如下的动作路径映射和概率路径映射:
其中,n表示迹分布中迹x中的活动节点数,Φ表示空,根据概率路径映射计算出对应的动作路径映射φ(x)发生的概率,用σ来代表φ(x),则计算σ发生的概率的方法如下:
中所有的迹对应的动作路径映射分别构成了集合所有的迹对应的概率路径映射分别构成了根据计算出对应动作路径映射发生的概率。
7-3.对取交集,得出代表两个动作路径映射集合的交集部分。然后对于交集部分中的每个元素(即动作路径映射)根据每个元素在两个概率有向无环图中对应的概率路径映射,分别计算每个元素在中发生的概率prob(σ)和prob′(σ);
7-4.计算工作流之间的相似度具体计算如下:
基于概率工作流的相似度度量方法使用的装置,具体包括任务挖掘模块、构建概率工作流模块、构建概率结构树模块、构建有向无环图模块,导出迹分布模块及计算相似度模块。
任务挖掘模块:负责分析公司的工作流程,定义公司的任务集合,并且根据工作日志为每一个任务分配相应的符合实际的发生概率。
构建概率工作流模块:首先分析企业的工作流程,然后用三种最基本的结构:顺序、并行和选择来连接企业中的任务,根据箭头所指的任务,在连接箭头上添加概率因子,最后添加开始和结束节点,构成一个完整的概率工作流。
构建概率结构树模块:用椭圆表示控制节点,用矩形表示基本的任务节点,用较小的矩形来表示相关的概率。引入Sequence,Parallel,Exclusive-choice三个控制节点,分别代表顺序,并行,选择结构。首先,用这三种控制节点分别连接工作流中的节点之间关系分别是顺序,并行和选择关系的任务;然后根据这些控制节点之间的关系(顺序,并行和选择),添加新的控制节点将它们连接起来,直到将所有的节点连接为一棵树为止;最后添加概率节点,完成概率工作流到概率结构树的转换。
构建有向无环图模块:将概率结构树中的三个控制节点Sequence,Parallel和Exclusive-choice分别简化为S,P,E-C,将结构树中的任务节点简化为任务的首字母,从而构建出与之相对应的有向无环图(PAD),这样有利于后面的相似度比较。
导出迹分布模块:将PAD图看作一系列从根节点到叶节点的字符串集合,将每条从根节点到叶节点的最大路径记为一个迹,遍历PAD图,求得从根节点到每一个叶子节点的路径,构成迹的集合,即迹分布。
计算相似度模块:对于两个工作流,首先得到它们对应的迹分布,将每一个迹分解,得到对应的动作路径映射与概率路径映射集合。对动作路径集合取交集。对于集合中的每一个元素,根据它对应的概率路径集合求得它发生的概率,根据交集中每一个路径发生的概率,计算两个工作流的相似度距离。
本发明能够提高公司的工作效率,减少公司的开发成本。
本发明将数据流考虑进来,通过分析数据的走向,统计任务节点发生的频率,计算任务节点发生的概率,结合文本相似度和行为相似度方法计算流程之间的相似度,可以提高比较结果的准确度。
本发明在前人的基础上定义了一种概率式有向无环(probabilistic acyclicdirected)PAD图的结构,通过增加概率因子来将工作流模型定义为相关的概率式结构树,并通过引入迹的概念来进一步细化与区分带有选择结构的工作流模型。在此情形下,当两个工作流过程模型用现有方法不能区分差异性时,运用本文所提的方法可以捕捉到这种差异性。
附图说明
图1为本发明结构化概率工作流图;
图2为本发明概率结构树图;
图3为本发明的概率有向无环图;
图4为本发明的迹分布图;
图5为本发明实施例中对应的图;
图6为本发明实施例中对应的图;
具体实施方式
下面结合附图和实施例对本发明作进一步说明。
本发明需要的相关概念定义及符号说明如下:
T={T1,T2,......,Tn}:任务集合;
S={S1,S2,......,Sm}:状态集合;
P={P1,P2,......,Pn}:概率集合,对应于每一个任务发生的概率;
WFN=(T,S,E,P):概率工作流,其中代表边的集合;
TR=(T,C,E,P):概率结构树,其中代表边的集合;
PAD<●,○,→,有向无环图,其中●={S,P,E-C}表示结构控制节点,○表示活动节点集合,表示边,□是概率节点集合,代表任务节点发生的概率。
x=<a0,p0,a1,p1,a2,p2,......,an>:PAD的一条迹,其中ai∈(●∪○),pi∈□;
任意一个PAD的迹分布;
φ(x)=(a1,a2,......an):动作路径映射,其中ai∈●∪○;
概率路径映射,其中pi∈□;
任意一个PAD对应的动作路径映射集合;
任意一个PAD对应的概率路径映射集合;
实施例:
(1)根据公司的历史记录,归纳出公司涉及到的任务名称,统计任务发生的次数,分析任务之间的依赖关系,得出每一个任务发生的概率,最终得到任务集合T和每一个任务对应的概率集合P。
(2)根据任务之间的关系和概率集合P画出结构化概率工作流WFN=(T,S,E,P)。
具体的,图1中:正方形代表具体的任务节点,圆形代表状态节点,数字代表,所指向的任务发生的概率。
(3)将结构化概率工作流转换成概率结构树TR=(T,C,E,P),具体的转化方法如下:
3-1.提取结构化概率工作流中的所有任务节点,并将所有任务节点看成是只有一个叶子节点的树,组成一个子树集合;
3-2.对子树集合中的每个任务节点进行访问,具体如下:
对于子树集合中每一组顺序执行的任务节点,首先构造一个Sequence控制节点,然后从Sequence控制节点出发,向它对应的任务节点画出一条带箭头的有向边,从而代表该组的节点是顺序执行关系,然后在每一个Sequence控制节点和它对应的任务节点之间添加概率节点,代表任务节点发生的概率,从而构造出一颗Sequence子树,将已访问过的任务节点标记为已访问,然后将整个子树作为一个任务节点,加入子树集合,并从子树集合中删除已访问的节点;
对于子树集合中每一组并行执行的任务节点,首先构造一个Parallel控制节点,然后从Parallel控制节点出发,向它对应的任务节点画出一条带箭头的有向边,从而代表该组的节点是并行执行关系,然后在每一个Parallel控制节点和它对应的任务节点之间添加概率节点,代表任务节点发生的概率,从而构造出一颗Parallel子树,将已访问过的任务节点标记为已访问,然后将整个子树作为一个任务节点,加入子树集合,并从子树集合中删除已访问的节点;
对于子树集合中每一组选择执行的任务节点,首先构造一个Exclusive-choice控制节点,然后从Exclusive-choice控制节点出发,向它对应的任务节点画出一条带箭头的有向边,从而代表该组的节点是选择执行关系,然后在每一个Exclusive-choice控制节点和它对应的任务节点之间添加概率节点,代表任务节点发生的概率,从而构造出一颗Exclusive-choice子树,将已访问的任务节点标记为已访问,然后将整个子树作为一个任务节点,加入子树集合,并从子树集合中删除已访问的节点;
3-3.重复步骤3-2,直到子树集合只剩一颗树为止;
具体的,图2中:Sequence节点指向的节点是顺序关系,Parallel节点所指向的节点是并行关系,Exclusive-choice节点所指向的节点是选择关系,图中的数字代表所指向的节点的发生的概率。
(4)如图1所示,将概率结构树简化成概率有向无环图PAD(ProbabilisticAcyclic Directed),PAD<●,○,→,□>,简化方法如下:将结构控制节点{Sequence,Parallel,Exclusive-choice}用●={S,P,E-C}集合中对应的元素来表示;
具体的,图3中:S,P,E-C分别代表结构控制节点Sequence,Parallel,Exclusive-choice,a,b,c,d,e,f,g分别代表任务节点,数字代表所指向的节点发生的概率。
(5)导出概率有向无环图PAD的迹分布,给定一个具体的概率有向无环图PAD:则图的迹分布的构建方法如下:
看作一系列从根节点到叶节点的字符串集合,将每条从根节点到叶节点的最大路径记为一个迹x=<a0,p0,a1,p1,a2,p2,......,an>,这些迹组成的集合就是迹分布,表示为
具体的,图4中:{S,1,a}就是一条迹。
(6)计算两个工作流WFN1和WFN2之间的相似度:首先将WFN1和WFN2转换成对应的概率有向无环图PAD:具体步骤如下:
6-1.首先根据步骤(5)导出对应的迹分布
6-2.将迹分布中的每个迹分解为动作路径映射φ(x)和概率路径映射对于任意的一个迹有如下的动作路径映射和概率路径映射:
其中,n表示迹分布中迹x中的活动节点数,Φ表示空,根据概率路径映射计算出对应的动作路径映射φ(x)发生的概率,用σ来代表φ(x),则计算σ发生的概率的方法如下:
中所有的迹对应的动作路径映射分别构成了集合所有的迹对应的概率路径映射分别构成了根据计算出对应动作路径映射发生的概率。
6-3.对取交集,得出代表两个动作路径映射集合的交集部分。然后对于交集部分中的每个元素(即动作路径映射)根据每个元素在两个概率有向无环图中对应的概率路径映射,分别计算每个元素在中发生的概率prob(σ)和prob′(σ);
6-4.计算工作流之间的相似度具体计算如下:
具体的,图5和图6中:两个图分别代表两个工作流WFN1和WFN2对应的概率有向无环图。

Claims (6)

1.基于概率工作流的相似度度量方法,其特征在于包括如下步骤:
步骤(1)分析公司的业务流程,得到公司的任务集合;T={T1,T2,......,Tn};
步骤(2)根据工作日志为每个任务分配发生的概率;P={P1,P2,......,Pn}:概率集合P中的每个元素分别对应任务集合中每个任务发生的概率;
步骤(3)根据任务之间的关系和概率集合P画出结构化概率工作流WFN=(T,S,E,P);其中代表边的集合;S为状态集合;
步骤(4)将结构化概率工作流转换成概率结构树;TR=(T,C,E,P),其中代表边的集合;C为控制节点集合;
步骤(5)进一步将概率结构树简化成概率有向无环图; ●={S,P,E-C}表示结构控制节点,○表示活动节点, 表示有向边,□是概率节点,代表任务节点发生的概率;
步骤(6)将步骤(5)所述的概率有向无环图看作一系列从根节点到叶节点的字符串集合,将每条从根节点到叶节点的最大路径记为一个迹,所有的迹的集合组成了该概率有向无环图的迹分布;导出概率有向无环图PAD的迹分布,根据概率有向无环图的迹分布,从而得到每一条迹对应的动作路径映射与概率路径映射;
步骤(7)计算两个工作流WFN1和WFN2之间的相似度,通过将WFN1和WFN2转换成对应的概率有向无环图PAD后再计算。
2.根据权利要求1所述的基于概率工作流的相似度度量方法,其特征在于步骤(4)所述的转换过程具体如下:
4-1.提取结构化概率工作流中的所有任务节点,并将所有任务节点看成是只有一个叶子节点的树,组成一个子树集合;
4-2.对子树集合中的每个任务节点进行访问,具体如下:
对于子树集合中每一组顺序执行的任务节点,首先构造一个Sequence控制节点,然后从Sequence控制节点出发,向它对应的任务节点画出一条带箭头的有向边,从而代表该组的节点是顺序执行关系,然后在每一个Sequence控制节点和它对应的任务节点之间添加概率节点,代表任务节点发生的概率,从而构造出一颗Sequence子树,将已访问过的任务节点标记为已访问,然后将整个子树作为一个任务节点,加入子树集合,并从子树集合中删除已访问的节点;
对于子树集合中每一组并行执行的任务节点,首先构造一个Parallel控制节点,然后从Parallel控制节点出发,向它对应的任务节点画出一条带箭头的有向边,从而代表该组的节点是并行执行关系,然后在每一个Parallel控制节点和它对应的任务节点之间添加概率节点,代表任务节点发生的概率,从而构造出一颗Parallel子树,将已访问过的任务节点标记为已访问,然后将整个子树作为一个任务节点,加入子树集合,并从子树集合中删除已访问的节点;
对于子树集合中每一组选择执行的任务节点,首先构造一个Exclusive-choice控制节点,然后从Exclusive-choice控制节点出发,向它对应的任务节点画出一条带箭头的有向边,从而代表该组的节点是选择执行关系,然后在每一个Exclusive-choice控制节点和它对应的任务节点之间添加概率节点,代表任务节点发生的概率,从而构造出成一颗Exclusive-choice子树,将已访问过的任务节点标记为已访问,然后将整个子树作为一个任务节点,加入子树集合,并从子树集合中删除已访问的节点;
4-3.重复步骤4-2,直到子树集合只剩一颗树为止。
3.根据权利要求1所述的基于概率工作流的相似度度量方法,其特征在于步骤(5)所述的将概率结构树简化成概率有向无环图PAD<●,○,→,□>,简化方法如下:将结构控制节点{Sequence,Parallel,Exclusive-choice}用●={S,P,E-C}集合中对应的元素来表示。
4.根据权利要求1所述的基于概率工作流的相似度度量方法,其特征在于步骤(6)中迹分布的构建方法如下:
给定一个具体的概率有向无环图PAD:则图的迹分布的构建如下:
看作一系列从根节点到叶节点的字符串集合,将每条从根节点到叶节点的最大路径记为一个迹x=<a0,p0,a1,p1,a2,p2,......,an>,这些迹组成的集合就是迹分布,表示为
5.根据权利要求1所述的基于概率工作流的相似度度量方法,其特征在于步骤(7)所述的计算具体步骤如下:
7-1.首先将WFN1和WFN2转换成对应的概率有向无环图PAD:然后步骤(6)导出对应的迹分布
7-2.将迹分布中的每个迹分解为动作路径映射φ(x)和概率路径映射对于任意的一个迹有如下的动作路径映射和概率路径映射:
其中,n表示迹分布中迹x中的活动节点数,Φ表示空,根据概率路径映射计算出对应的动作路径映射φ(x)发生的概率,用σ来代表φ(x),则计算σ发生的概率的方法如下:
中所有的迹对应的动作路径映射分别构成了集合所有的迹对应的概率路径映射分别构成了根据计算出对应动作路径映射发生的概率;
7-3.对取交集,得出代表两个动作路径映射集合的交集部分;然后对于交集部分中的每个元素(即动作路径映射)根据每个元素在两个概率有向无环图中对应的概率路径映射,分别计算每个元素在中发生的概率prob(σ)和prob′(σ);
7-4.计算工作流之间的相似度具体计算如下:
6.根据权利要求1所述的基于概率工作流的相似度度量方法使用的装置,其特征在于包括任务挖掘模块、构建概率工作流模块、构建概率结构树模块、构建有向无环图模块,导出迹分布模块及计算相似度模块;
任务挖掘模块:负责分析公司的工作流程,定义公司的任务集合,并且根据工作日志为每一个任务分配相应的符合实际的发生概率;
构建概率工作流模块:首先分析企业的工作流程,然后用三种最基本的结构:顺序、并行和选择来连接企业中的任务,根据箭头所指的任务,在连接箭头上添加概率因子,最后添加开始和结束节点,构成一个完整的概率工作流;
构建概率结构树模块:用椭圆表示控制节点,用矩形表示基本的任务节点,用较小的矩形来表示相关的概率;引入Sequence,Parallel,Exclusive-choice三个控制节点,分别代表顺序,并行,选择结构;首先,用这三种控制节点分别连接工作流中的节点之间关系分别是顺序,并行和选择关系的任务;然后根据这些控制节点之间的关系,添加新的控制节点将它们连接起来,直到将所有的节点连接为一棵树为止;最后添加概率节点,完成概率工作流到概率结构树的转换;
构建有向无环图模块:将概率结构树中的三个控制节点Sequence,Parallel和Exclusive-choice分别简化为S,P,E-C,将结构树中的任务节点简化为任务的首字母,从而构建出与之相对应的有向无环图,这样有利于后面的相似度比较;
导出迹分布模块:将PAD图看作一系列从根节点到叶节点的字符串集合,将每条从根节点到叶节点的最大路径记为一个迹,遍历PAD图,求得从根节点到每一个叶子节点的路径,构成迹的集合,即迹分布;
计算相似度模块:对于两个工作流,首先得到它们对应的迹分布,将每一个迹分解,得到对应的动作路径映射与概率路径映射集合;对动作路径集合取交集;对于集合中的每一个元素,根据它对应的概率路径集合求得它发生的概率,根据交集中每一个路径发生的概率,计算两个工作流的相似度距离。
CN201610402067.7A 2016-06-08 2016-06-08 基于概率工作流的相似度度量方法及装置 Active CN106096644B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610402067.7A CN106096644B (zh) 2016-06-08 2016-06-08 基于概率工作流的相似度度量方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610402067.7A CN106096644B (zh) 2016-06-08 2016-06-08 基于概率工作流的相似度度量方法及装置

Publications (2)

Publication Number Publication Date
CN106096644A CN106096644A (zh) 2016-11-09
CN106096644B true CN106096644B (zh) 2019-04-02

Family

ID=57228196

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610402067.7A Active CN106096644B (zh) 2016-06-08 2016-06-08 基于概率工作流的相似度度量方法及装置

Country Status (1)

Country Link
CN (1) CN106096644B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108241534A (zh) * 2016-12-27 2018-07-03 阿里巴巴集团控股有限公司 一种任务处理、分配、管理、计算的方法以及装置
CN107121969B (zh) * 2017-03-22 2019-04-09 浙江工业大学 基于邻接矩阵的工厂制造流程模型差别检测方法
CN110751404A (zh) * 2019-10-24 2020-02-04 云南大学 一种支持结构与行为融合的过程模型索引构建与检索方法
EP3855313B1 (en) * 2020-01-21 2023-08-16 Hexagon Technology Center GmbH Os optimized workflow allocation
CN115174251B (zh) * 2022-07-19 2023-09-05 深信服科技股份有限公司 一种安全告警的误报识别方法、装置以及存储介质
CN116227907B (zh) * 2023-05-06 2023-07-28 安徽思高智能科技有限公司 基于对齐的多维度rpa流程相似度计算方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6986138B1 (en) * 1999-04-08 2006-01-10 Hitachi, Ltd. Virtual work flow management method
CN101894325A (zh) * 2010-07-13 2010-11-24 华南理工大学 一种基于工作流网的语义web服务行为匹配方法
CN102073918A (zh) * 2010-11-19 2011-05-25 南京大学 工作流执行中基于服务质量的异常处理方法
CN102880684A (zh) * 2012-09-13 2013-01-16 杭州电子科技大学 基于日志记录挖掘与组合验证的工作流建模方法
CN104834995A (zh) * 2015-04-20 2015-08-12 安徽师范大学 基于云计算的工作流双向调度方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6986138B1 (en) * 1999-04-08 2006-01-10 Hitachi, Ltd. Virtual work flow management method
CN101894325A (zh) * 2010-07-13 2010-11-24 华南理工大学 一种基于工作流网的语义web服务行为匹配方法
CN102073918A (zh) * 2010-11-19 2011-05-25 南京大学 工作流执行中基于服务质量的异常处理方法
CN102880684A (zh) * 2012-09-13 2013-01-16 杭州电子科技大学 基于日志记录挖掘与组合验证的工作流建模方法
CN104834995A (zh) * 2015-04-20 2015-08-12 安徽师范大学 基于云计算的工作流双向调度方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
一种面向工作流的相似性度量方法;卢科帆等;《计算机集成制造系统》;20160229;第22卷(第2期);第355-357页 *

Also Published As

Publication number Publication date
CN106096644A (zh) 2016-11-09

Similar Documents

Publication Publication Date Title
CN106096644B (zh) 基于概率工作流的相似度度量方法及装置
Yao et al. Sensing spatial distribution of urban land use by integrating points-of-interest and Google Word2Vec model
Gregory et al. A place in history: A guide to using GIS in historical research
CN102662930B (zh) 一种语料标注方法及装置
US10459939B1 (en) Parallel coordinates chart visualization for machine data search and analysis system
CN108183927A (zh) 一种分布式系统中链路调用的监控方法及系统
TWI290698B (en) System and method for updating and displaying patent citation information
Ye et al. Development of a highly flexible mobile GIS-based system for collecting arable land quality data
JP2013542478A (ja) 地理空間データベース統合方法、およびデバイス
CN104679827A (zh) 一种基于大数据的公开信息关联方法及挖掘引擎
CN100354865C (zh) 仿人工细粒度网页信息采集方法
CN111708774B (zh) 一种基于大数据的产业分析系统
CN110334169A (zh) 一种新型地理计算模式
Pettit et al. An online platform for conducting spatial-statistical analyses of national census data across Australia
CN108446262A (zh) 一种表单生成、分析方法及装置
Petermann et al. Graph mining for complex data analytics
CN107704504A (zh) 一种rinex文件溯源信息提取方法及系统
McCord et al. The ARM data system and archive
CN104142952A (zh) 报表展示方法和装置
CN112231380A (zh) 采集数据的综合处理方法、系统、存储介质及电子设备
Lee et al. The integration, analysis and visualization of sensor data from dispersed wireless sensor network systems using the SWE framework
Goel et al. Data governance for managing data quality in process mining
Mohammed Free and Open Source GIS: an overview on the recent evolution of projects, standards and communities
Shi et al. Automated geoprocessing mechanism, processes and workflow for seamless online integration of geodata services and creating geoprocessing services
Richard Geologic map database implementation in the ESRI Geodatabase environment

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant