CN103927613A - 流程检索系统及其使用方法 - Google Patents

流程检索系统及其使用方法 Download PDF

Info

Publication number
CN103927613A
CN103927613A CN201410090120.5A CN201410090120A CN103927613A CN 103927613 A CN103927613 A CN 103927613A CN 201410090120 A CN201410090120 A CN 201410090120A CN 103927613 A CN103927613 A CN 103927613A
Authority
CN
China
Prior art keywords
flow process
flow
fragment
bfs
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410090120.5A
Other languages
English (en)
Inventor
叶岩明
尹建伟
徐悦甡
吴朝晖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN201410090120.5A priority Critical patent/CN103927613A/zh
Publication of CN103927613A publication Critical patent/CN103927613A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种流程检索系统,包括用于将流程转换为扩展标准BFS序列并排除重复流程的形成流程集合的流程预处理模块、用于供用户输入流程片段的查询模块、用于比较流程片段与流程集合中流程的相似度计算模块,实现了带循环结构的复杂流程的检索,避免了流程子图同构问题,大大提高了系统的构建成本和总的检索效率。

Description

流程检索系统及其使用方法
技术领域
本发明涉及一种流程检索系统及其使用方法。
背景技术
作为企业中广泛使用的用于规范业务逻辑和处理业务流程的方法,工作流技术多年一直随着企业信息化建设的持续而不断发展。对于信息化建设较早和较成熟的企业单位,已经制定了各种各样的公司业务流程,这些流程规范着企业活动行为并能够促进工作效率。同时,随着业务的发展和环境的变化,大多数公司需要修改一些流程来适应频繁的需求变更。公司在多年信息化建设后产生了大量的业务流程。为了有效管理业务流程,许多企业建立了业务流程库。并将它们作为重要的知识仓库应用在业务流程管理和公司运作中。很多大公司的业务流程库中的流程数量庞大。对流程或流程片段的检索是流程库各项活动的基础。因此,能有效地从业务流程库中检索相关信息对企业来说是非常重要的。
已有的流程检索技术基本上都是将流程构建为流程图,然后以图挖掘的方式从流程库中找出所有包含待检索流程片断的流程。判断的标准是待挖掘流程片断是否是当前流程的流程子图。因此,大多数文献中提到的方法都涉及到流程子图的同构判断问题。例如,DFS Code-SED方法就是将流程库中每一个流程对应的流程图的子图挖掘出来。将所有的子图和待查询流程片断转化为DFS编码,然后分别计算它们之间的Levenshtein距离以获得相似度值,并根据相似度值判断是否返回检索结果。然而,很遗憾的是,发现所有的子图同构已经被证明为是困难问题,因此这些方法在效率和可行性方面存在诸多问题。
因此,有必要设计一种便捷有效的流程检索系统及其使用方法。
发明内容
针对现有技术存在的缺陷,本发明的目的在于提供便捷有效的流程检索系统及其使用方法。本发明提供一种流程检索系统,包括用于将流程转换为扩展标准BFS序列并排除重复流程的形成流程集合的流程预处理模块、用于供用户输入流程片段的查询模块、用于比较流程片段与流程集合中流程的相似度计算模块。
优选的,所述查询模块以图形或xml代码的形式输入待查询的流程片段。
优选的,所述流程片段经过流程预处理模块处理转化为扩展标准BFS序列。
优选的,所述查询模块从流程库中查找包含待查询流程片段所有节点的流程,作为流程候选子集。
优选的,所述流程的扩展标准BFS序列为该流程对应的流程图在广度优先遍历时产生的线性序。
优选的,一种流程检索系统的使用方法,包括以下步骤:流程预处理、待检索的流程片段输入、流程相似度计算、检索结果输出。
与现有技术相比,本发明至少具有如下技术效果:流程预处理模块将流程转换为扩展标准BFS序列并排除重复流程实现了带循环结构的复杂流程的检索,避免了流程子图同构问题,大大提高了系统的构建成本和总的检索效率。
附图说明
图1本发明流程检索系统示意图。
图2本发明流程检索系统的流程样本P。
图3本发明流程检索系统的精确检索和模糊检索的时间性能示意图。
图4本发明流程检索系统的精确精索和模糊检索在不同参数下的结果数示意图。
具体实施方式
在下面的描述中阐述了很多具体细节以便于充分理解本发明。但是本发明能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似推广,因此本发明不受下面公开的具体实施例的限制。
如图1所示,本发明所涉及的流程检索系统,主要包括:用于将流程转换为扩展标准BFS序列的形成流程集合的流程预处理模块、用于供用户输入流程片段的查询模块、用于比较流程片段与流程集合中流程的相似度计算模块。
流程预处理模块主要负责将所有流程转变为扩展标准BFS序列,并排除重复流程。
用户通过查询模块以图形或xml代码的形式输入待查询的流程片段。流程片段经过流程预处理模块处理转化为扩展标准BFS序列。接着,查询模块从流程库中查找包含待查询流程片段所有节点的流程,作为流程候选子集。从而,避免流程库中的流程集合参与流程相似度的计算,大大提高了检索效率。最后调用流程相似度计算模块的接口,计算待查询流程片段与流程候选子集中的每一个流程的相似度,最后根据要求返回检索结果。
流程相似度计算模块利用扩展标准BFS序列,构建待查询流程片段与流程候候子集之间的流程规整矩阵,并在此基础上计算流程相似度。
本发明与现有技术相比,具有以下优势:
一、能够实现带循环结构的复杂流程的检索。
二、避免了流程子图同构问题,大大提高了系统的构建成本和总的检索效率。
三、能够实现模糊查询。
本发明提供上述检索系统的使用方法,包括以下步骤:
1)流程预处理。
对于已有的流程库中的流程,从流程库中提取每一个流程然后转化为扩展标准BFS序列,并加入标准流程库。当一个流程新加入流程库时,将其转化为扩展标准BFS序列形式加入标准流程库,形成流程集合。
同时,为了提高检索效率,本发明剔除其中的重复流程以保证流程库中的每一个流程都是不同的。在标准流程库中,每一个流程都是扩展标准BFS序列的形式,因此可以通过比较两个流程的扩展标准BFS序列的字符串是否为完全相同来判断是否存在重复流程。其中,一个流程的扩展标准BFS序列为该流程对应的流程图在广度优先遍历时产生的线性序。例如对于图2中的流程样本P,其流程BFS序列可以表示为:
s#sX#XY,XZ#YW,ZW#We#e或s#sX#XZ,XY#ZW,YW#We#e两种形式。其中#代表遍历层次的分割符。
由上例可见流程的BFS序列可能存在多种形式。为了规范化流程标记,使得每一个流程都唯一对应一个标记,可以限定每一个遍历层次的标记严格按一定顺序(例如字母顺序)出现,则在上例中只有满足该规定,则为标准BFS序列。标准BFS序列对于带循环结构的流程表示不够,因此本发明提出扩展标准BFS序列以解决循环结构问题。假定一个流程拥有N的节点,若该流程不带循环结构,则其扩展标准BFS序列与标准BFS序列完全一样;若该流程带循环结构,则其扩展标准BFS序列共有N+2个层次,其中前N个层次为正常广度优先遍历产生的结果,第N+1个层次是所有循环部分在N层遍历后的再一次遍历结果,而第N+2个层次是第N+1个层次循环未结束的连接层次。
例如对于带循环的流程其扩展标准BFS序列表示为:。s#sX#XY#YZ#ZX,Ze#XY,e#4
2)待检索的流程片段输入。
本发明的查询接口提供一种图形化的流程检索窗口,用户可以输入代表检索精度要求的参数θ,同时输入待检索的流程片段。待检索的流程片段将被转化成扩展标准BFS序列,然后根据用户输入的流程片段的节点情况从标准流程库中查找到所有的包含待检索流程片段的所有节点的流程,接着将查询得到的这些流程组织成候选流程子集。最后,对于候选流程子集中的每一个流程和待查询流程片段以扩展标准BFS序列的形式组成流程调整矩阵。
其中流程调整矩阵遵循如下定义:给定两个流程,其扩展标准BFS序列分别为{p1,p2,...,pM}和{q1,q2,...,qN},其中pi和qi分别为两个流程扩展标准BFS序列的第i个层次,则不同层次间的比较函数可由下式得出:
ψ ( i , j ) = ψ ( p i , q j ) = 0 , ( p i ⊆ q j , where , i ≤ j ) or ( q j ⊆ p i , where , i > j ) 1 / 2 ( p i ⊆ ‾ q j ) or ( p i ⊆ ‾ q j ) , where ( i ≤ j ) and ( M - i ) ≤ ( N - j ) or ( q j ⊆ ‾ p i ) or ( q j ⊆ ‾ p i ) , where ( i > j ) and ( M - i ) > ( N - j ) 1 , other
上式中,表示集合的包含关系,表示集合的后包含关系而表示集合的前包含关系。那么流程调整矩阵可定义为:
PWM ( M , N ) = ψ ( M , 1 ) . . . ψ ( M , N ) . . . . . . . . . ψ ( 1,1 ) . . . ψ ( 1 , N )
3)流程相似度计算
应用流程相似度计算方法对每个矩阵计算流程相似度,并返回符合相似度要求的所有流程。要计算流程相似度,首先要根据2)中定义的流程调整矩阵找到最大匹配路径。一般来说,流程匹配路径是两个流程之间一种映射关系,对应到流程调整矩阵中,则是由矩阵相邻元素组成的一条连续的路径。如果将流程匹配路径记为W,W的第v个元素记为wv=(i,j)v,则W可表示为w1,w2,…,wV其中,max(M,N)≤V<M+N-1。流程匹配路径满足如下条件:
边界条件:w1=(1,1)且wV=(M,N),也就是说流程匹配路径的起点和终点分别对应流程调整矩阵的对角元素。
连续性:给定wv=(a,b)且wv-1=(a',b')则一定有a–a'≤1且b-b'≤1。这限定了流程匹配路径中的相邻元素一定是在流程调整矩阵中连续的。
单调性:给定wv=(a,b)且wv-1=(a',b')则一定有a–a'≥0且b-b'≥0。这限定了流程匹配路径在流程调整矩阵中是单调递增的。
由上述定义可以看出,满足条件的流程匹配路径可能存在多条,而本发明关心的主要是最大匹配路径。上面定义中可以看出,流程调整矩阵中一个元素(对应一个矩阵中单元格)的值(代表两个流程对应节点的距离)为ψ(i,j),我们定义d(i,j)为该元素表示的两个流程对应节点的累积距离,则相邻元素的最小累积距离可由下式计算获得:
d(i,j)=ψ(i,j)+min{d(i-1,j-1),d(i-1,j),d(i,j-1)}
两个流程的距离最小,说明两个流程的匹配度最大;则本发明的最大流程相似度可由下式计算:
MatchDegree ( P , Q ) = 1 - d ( M , N ) max ( M , N )
4)检索结果输出
查询模块将符合相似度要求的所有流程输出。
此外。本发明在构建数据集基础上完成了系统验证过程,验证结果如表1和图3、图4所示。
表1检索结果
本发明提出了流程的扩展标准BFS序列规范化标注形式和流程相似度计算方法,通过该方法不仅能够进行实现流程的精确检索而且也能实现流程的模糊检索,同时还支持对带有循环等复杂结构的流程的检索。同时,避免了其他方法的子图同构判断问题。未来随着BFS序列的自动构建的智能化,很发明方法的效率将会进一步得到提高。
本发明虽然以较佳实施例公开如上,但其并不是用来限定本发明,任何本领域技术人员在不脱离本发明的精神和范围内,都可以做出可能的变动和修改,因此本发明的保护范围应当以本发明权利要求所界定的范围为准。

Claims (6)

1.一种流程检索系统,包括用于将流程转换为扩展标准BFS序列并排除重复流程的形成流程集合的流程预处理模块、用于供用户输入流程片段的查询模块、用于比较流程片段与流程集合中流程的相似度计算模块。
2.根据权利要求1所述的流程检索系统,其特征在于:所述查询模块以图形或xml代码的形式输入待查询的流程片段。
3.根据权利要求1所述的流程检索系统,其特征在于:所述流程片段经过流程预处理模块处理转化为扩展标准BFS序列。
4.根据权利要求1所述的流程检索系统,其特征在于:所述查询模块从流程库中查找包含待查询流程片段所有节点的流程,作为流程候选子集。
5.根据权利要求1所述的流程检索系统,其特征在于:所述流程的扩展标准BFS序列为该流程对应的流程图在广度优先遍历时产生的线性序。
6.一种如权利要求1中所述的流程检索系统的使用方法,包括以下步骤:流程预处理、待检索的流程片段输入、流程相似度计算、检索结果输出。
CN201410090120.5A 2014-03-13 2014-03-13 流程检索系统及其使用方法 Pending CN103927613A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410090120.5A CN103927613A (zh) 2014-03-13 2014-03-13 流程检索系统及其使用方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410090120.5A CN103927613A (zh) 2014-03-13 2014-03-13 流程检索系统及其使用方法

Publications (1)

Publication Number Publication Date
CN103927613A true CN103927613A (zh) 2014-07-16

Family

ID=51145829

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410090120.5A Pending CN103927613A (zh) 2014-03-13 2014-03-13 流程检索系统及其使用方法

Country Status (1)

Country Link
CN (1) CN103927613A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104462414A (zh) * 2014-12-12 2015-03-25 中山大学深圳研究院 一种基于拓扑结构的流程图相似性方法
CN106651317A (zh) * 2016-12-28 2017-05-10 浙江省公众信息产业有限公司 一种业务流程相关性的判别方法和装置
CN113706111A (zh) * 2021-08-30 2021-11-26 平安国际智慧城市科技股份有限公司 医疗机构流程数据的处理方法、装置、设备及介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
叶岩明,尹建伟,曹斌: "基于流程规整矩阵的流程推荐技术", 《计算机集成制造系统》 *
曹斌,尹建伟,陈慧蕊: "基于Levenshtein距离的流程检索方法", 《计算机集成制造系统》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104462414A (zh) * 2014-12-12 2015-03-25 中山大学深圳研究院 一种基于拓扑结构的流程图相似性方法
CN106651317A (zh) * 2016-12-28 2017-05-10 浙江省公众信息产业有限公司 一种业务流程相关性的判别方法和装置
CN113706111A (zh) * 2021-08-30 2021-11-26 平安国际智慧城市科技股份有限公司 医疗机构流程数据的处理方法、装置、设备及介质
CN113706111B (zh) * 2021-08-30 2024-09-17 深圳平安智慧医健科技有限公司 医疗机构流程数据的处理方法、装置、设备及介质

Similar Documents

Publication Publication Date Title
CN104199965B (zh) 一种语义信息检索方法
CN104036023B (zh) 一种融合上下文的树形视频语义索引建立方法
CN109635296A (zh) 新词挖掘方法、装置计算机设备和存储介质
CN101667197A (zh) 基于滑动窗口的数据流关联规则挖掘方法
CN103970733B (zh) 一种基于图结构的中文新词识别方法
KR20210092698A (ko) Spo의 추출 방법, 장치, 전자기기 및 저장 매체
CN109190051B (zh) 一种用户行为分析方法和基于该分析方法的资源推荐方法
CN105335415A (zh) 基于输入预测的搜索方法和输入法系统
CN105183710A (zh) 一种文档摘要自动生成的方法
CN106713273A (zh) 一种基于字典树剪枝搜索的协议关键字识别方法
CN106570166B (zh) 一种基于多个局部敏感哈希表的视频检索方法及装置
CN103927613A (zh) 流程检索系统及其使用方法
CN113705099A (zh) 基于对比学习的社交平台谣言检测模型构建方法及检测方法
CN109902143A (zh) 一种基于密文的多关键字扩展检索方法
EP4445293A1 (en) Systems and methods to search for digital twins
CN103646035A (zh) 一种基于启发式方法的信息搜索方法
CN112509644B (zh) 一种分子优化方法、系统、终端设备及可读存储介质
CN111008196A (zh) 基于深度优先搜索的频繁模式挖掘方法
CN103929804A (zh) 一种基于用户移动规则的位置预测方法
CN105930358B (zh) 基于关联度的案例检索方法及其系统
CN109828785B (zh) 一种采用gpu加速的近似代码克隆检测方法
CN114708424B (zh) 输入为具有去重预处理的密集查询的端到端检测器
CN110807061A (zh) 一种基于分层搜索不确定图的频繁子图的方法
CN106126618A (zh) 基于人名的邮箱地址推荐方法及系统
CN104602206A (zh) 一种垃圾短信识别方法与系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20140716

RJ01 Rejection of invention patent application after publication