CN110838105A - 一种业务流程模型图像识别与再构方法 - Google Patents

一种业务流程模型图像识别与再构方法 Download PDF

Info

Publication number
CN110838105A
CN110838105A CN201911048985.4A CN201911048985A CN110838105A CN 110838105 A CN110838105 A CN 110838105A CN 201911048985 A CN201911048985 A CN 201911048985A CN 110838105 A CN110838105 A CN 110838105A
Authority
CN
China
Prior art keywords
business process
image
process model
elements
picture
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911048985.4A
Other languages
English (en)
Other versions
CN110838105B (zh
Inventor
葛季栋
李传艺
潘凌伟
周筱羽
骆斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University
Original Assignee
Nanjing University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University filed Critical Nanjing University
Priority to CN201911048985.4A priority Critical patent/CN110838105B/zh
Publication of CN110838105A publication Critical patent/CN110838105A/zh
Application granted granted Critical
Publication of CN110838105B publication Critical patent/CN110838105B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/60Editing figures and text; Combining figures or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/20Image enhancement or restoration by the use of local operators
    • G06T5/30Erosion or dilatation, e.g. thinning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/12Edge-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/194Segmentation; Edge detection involving foreground-background segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Abstract

本发明公开了一种基于图像轮廓识别及图像分类的从BPMN图片中提取业务流程模型信息并再构的方法,步骤包括使用形态学操作对图片进行分割,快速而准确地将业务流程模型图片分割成独立的部分;使用轮廓检测算法替代主流的目标检测深度神经网络算法,在保证准确率的前提下提升元素检测的效率,确定图片中元素的位置和大小;使用霍夫变换来检测图片中的直线,从而完成连接关系的检测,使用特殊递归算法保证复杂的连接关系也能被正确检测;使用光学字符识别技术,识别流元素中的文本信息,使得模型更加完整;能够自动从BPMN图片中构建业务流程模型并导出模型定义文件,便于修改与编辑,大大节省了人工绘制业务流程模型所需要耗费的时间。

Description

一种业务流程模型图像识别与再构方法
技术领域
本发明涉及一种图像信息识别与抽取的方法,具体涉及一种基于图像轮廓识别及图像分类的从BPMN图片中提取业务流程模型信息并再构的方法,属于业务流程管理及计算机视觉技术领域。
背景技术
业务流程建模标记(BPMN)是一种标准化的软件过程建模标记,包含多种图形元素,包括事件,活动,网关,子过程,数据对象,顺序流,消息流,泳池等。使用业务流程建模标记能简洁清晰地描述一个软件过程中的控制流和数据流。这些元素有序地组合之后,可以描述非常复杂的活动执行过程。
和一般的图形化建模标记类似,使用业务流程建模标记绘制的业务流程模型都是用XML格式的文件记录其定义,常以bpmn作为文件后缀名。业务流程图中元素的嵌套关系,相对位置,类型大小,标注文本等具体信息都记录在bpmn文件中。借助主流的BPMN建模工具例如Activiti Designer,Camunda Modeler,GenMyModel等可以方便快捷地绘制业务流程图并导出相应的bpmn文件。
正是由于业务流程建模标记强大的表达能力以及多种成熟建模工具的支持,促使业务流程建模标记在业务流程建模、业务流程管理等多个方面具有非常广泛的应用。有关BPMN的科学研究也有很多,例如H.Leopold 2014提出了一种将业务流程模型转换为自然语言描述的方法,从而促进软件开发人员与客户之间就业务流程快速达成共识;C.DECHSUPA2018提出了一种将BPMN模型转化为着色Petri网的方法,从而使得对业务流程的形式化检验更加便捷。这些应用与研究都是基于业务流程模型的定义文件的。
但是在日常生活和工作中,业务流程模型往往都是以图片的形式展示出来,主流的建模工具也都没有从业务流程模型图片中提取模型,并转换为可编辑形式的功能。如果我们需要借鉴已有的业务流程模型创建新的模型或者是对已有的业务流程模型进行更新与修改,都必须要依照图片,重新绘制和构建业务流程模型。当一个业务流程图比较复杂的时候,即使有建模工具的支持,绘制工作也还是十分繁琐的。在这种情况下,如果需要处理和搜集大批量的业务流程模型,单单靠手工绘制将是十分耗时与低效的。
所以我提出了一种基于图像轮廓识别及图像分类的从BPMN图片中提取业务流程模型信息并再构的方法,借助BPMN建模工具就可以实现自动化地将业务流程模型图片转化为可编辑的模型。首先,该方法提升了人工构建和修改业务流程模型的效率,为业务流程模型提供了新的管理方式。其次,它也拓宽了业务流程模型的应用场景,使得现有对BPMN的研究与理论更加的普适。最后,它使得对业务流程模型数据的处理和搜集更加的便利与快速。快速地搜集和处理数据在当今大数据的时代是十分重要的,有了大量的数据,机器学习等数据分析技术也能更好地在业务流程管理领域的研究中得到应用。
发明内容
本发明是一种业务流程模型图像识别与再构方法,提供一种BPMN图像信息识别和抽取的方法,包括识别图片中的业务流程建模标记,区分其所属的类型以及在图片中的相对位置和嵌套关系;识别图片中元素的连接关系,确定每条连接线的起点、终点和路径;识别图片中的文本信息,将文本信息与元素类别相结合,得到完整的建模标记及其相关信息,从而构建整个业务流程模型;将业务流程模型转换为XML格式定义文件并导出。该方法能有效地识别图片中的元素对象,准确地抽取并复原原始模型,能够提升人工构建和管理业务流程模型的效率,促进业务流程模型的推广与应用,为业务流程管理的研究提供了新的方法。
1.本发明所述的一种业务流程模型图像识别与再构方法,其特征在于包含以下步骤:
步骤(1)对业务流程模型图片进行分割;
步骤(2)识别图片中的轮廓;
步骤(3)对轮廓进行筛选,筛选出流元素并构建模型基本框架;
步骤(4)识别业务流程建模标记流元素间的连接关系;
步骤(5)识别业务流程建模标记流元素的类型与相关文本;
步骤(6)构建业务流程模型;
步骤(7)输出业务流程模型定义文件。
2.根据权利要求1所述的一种业务流程模型图像识别与再构方法,其特征在于步骤(1)中将用业务流程模型标记(BPMN)绘制的业务流程模型图像进行分割,独立每个图形元素,具体子步骤包括:
步骤(1.1)对输入图像进行预处理,将其转换为二值图像,背景为白色,业务流程图元素为黑色;
步骤(1.2)对图像进行膨胀的形态学操作,背景白色区域会膨胀;
步骤(1.3)对图像进行侵蚀的形态学操作,前景黑色区域会膨胀;
步骤(1.4)计算形态学操作后的图像与原始二值图像的差,得到割裂的业务流程图像,每个图元素都是一个独立的部分
3.根据权利要求1所述的一种业务流程模型图像识别与再构方法,其特征在于步骤(2)中识别步骤(1)中分割图像各个部分的轮廓,具体子步骤包括:
步骤(2.1)对分割后的图像进行预处理,使得图像背景为黑色,前景色为白色,即业务流程图中的元素为白色;
步骤(2.2)对图像进行轮廓检测,检测出图像中所有白色区域的轮廓;
步骤(2.3)计算每个轮廓的最小包围矩形,以该矩形来表示轮廓的位置和大小;
步骤(2.4)把所有轮廓按照拓扑嵌套关系以树的形式组织起来,图像中属于单个独立部分的所有轮廓构成了表示该独立部分的一棵子树。
4.根据权利要求1所述的一种业务流程模型图像识别与再构方法,其特征在于步骤(3)中对提取出来的元素轮廓进行筛选,筛选出流元素并构建模型基本框架,具体子步骤包括:
步骤(3.1)对步骤(2)中的轮廓树进行层次遍历;
步骤(3.2)筛选出业务流程图中泳池轮廓;
步骤(3.3)筛选出属于一个泳池的所有泳道轮廓;
步骤(3.4)筛选出属于一个泳道的所有流元素轮廓和子过程轮廓;
步骤(3.5)将筛选出的轮廓构建成只有泳池与流元素(包括子过程)的业务流程基本模型。
5.根据权利要求1所述的一种业务流程模型图像识别与再构方法,其特征在于基于步骤(4)识别业务流程模型图中流元素间的连接关系,识别出每条连接线首部连接的元素,尾部连接的元素以及连接线的路径。具体子步骤包括:
步骤(4.1)对输入图像进行预处理,将其转换为二值图像,背景为黑色,前景为白色;
步骤(4.2)将步骤(3)中我们检测出的所有流元素,从图像中去除,将每个元素的包围矩形所覆盖的部分变为黑色;
步骤(4.3)去除图片中的所有文字,使得图片中仅剩连接元素;
步骤(4.4)识别轮廓中的连接对象。使用霍夫变换,检测出图像中的直线。
步骤(4.5)使用形态学操作,确定图片中箭头的位置,将与箭头直接连接的直线作为初始顺序流,然后不断将与顺序流连接的线段加入顺序流,直到顺序流找到一个起始元素。
6.根据权利要求1所述的一种业务流程模型图像识别与再构方法,其特征在于步骤(5)中对所有检测出的流元素进行分类,同时识别出每个流元素中的文本文字,作为流元素的标签。具体子步骤包括:
步骤(5.1)使用VGG16卷积神经网络架构训练流元素分类器。将标记好的流元素数据集分为训练集和测试集,使用训练集进行VGG16架构的卷积神经网络分类器的训练,使用测试集进行分类器分类效果的评估。训练目标是选择出最优的模型参数来对图片进行特征提取与特征分类。使用RMSProp优化算法来调整参数,使得模型在训练集上的预测误差最小,从而获得训练集上的最优模型参数,构建分类模型。
步骤(5.2)依据检测出的所有元素位置,从原始图像中截取相应元素的图像,使用训练好的分类器识别流元素的类别。
步骤(5.3)将元素图像输入Tesseract文字识别引擎,识别流元素中的文本信息;
7.根据权利要求1所述的一种业务流程模型图像识别与再构方法,其特征在于步骤(6)中将识别出的文本与业务流程建模标记进行匹配,得到所有的模型元素,按照元素嵌套关系及连接关系构建业务流程模型。具体子步骤包括:
步骤(6.1)依据连接对象的起始位置与终止位置,找到其连接的流对象元素,从而将所有流对象元素连接起来,构成连通图;
步骤(6.2)依据连通图,重新构建业务流程模型;
步骤(6.3)将业务流程模型记录成符合BPMN2.0规范的XML格式的定义文件。
8.根据权利要求1所述的一种业务流程模型图像识别与再构方法,其特征在于步骤(7)输出从BPMN图像中提取的业务流程模型定义文件。提取效果通对比生成的业务流程模型定义文件与原图片对应定义文件的一致程度从而进行评估。一致程度从识别出的泳池数量,流对象数量及类型,连接对象数量及连接关系等多个角度进行评价。
本发明与现有技术相比,其显著优点是:现有的建模工具和平台都未提供本发明所实现的功能。本发明所述方法使用了形态学操作对图片进行分割,快速而准确地将业务流程模型图片分割成独立的部分;使用轮廓检测算法替代主流的目标检测深度神经网络算法,在保证准确率的前提下提升元素检测的效率,确定图片中元素的位置和大小;使用霍夫变换来检测图片中的直线,从而完成连接关系的检测,使用特殊递归算法保证复杂的连接关系也能被正确检测;使用光学字符识别技术,识别流元素中的文本信息,使得模型更加完整;能够自动从BPMN图片中构建业务流程模型并导出模型定义文件,便于修改与编辑,大大节省了人工绘制业务流程模型所需要耗费的时间。
附图说明
图1业务流程模型图像识别与再构方法流程图
图2业务流程模型图片示意图
图3 VGG16模型结构图
具体实施方式
为使本发明的目的、技术方案和优点更加清晰,下面将结合附图及具体实施例对本发明进行详细描述。
本发明的目的在于解决业务流程模型图片不可编辑的问题,提出了一种基于图像轮廓识别及图像分类的从BPMN图片中提取业务流程模型信息并再构的方法。通过使用形态学操作对图片进行分割,快速而准确地将业务流程模型图片分割成独立的部分;使用轮廓检测算法替代主流的目标检测深度神经网络算法,在保证准确率的前提下提升元素检测的效率,确定图片中元素的位置和大小;使用霍夫变换来检测图片中的直线,从而完成连接关系的检测,使用特殊递归算法保证复杂的连接关系也能被正确检测;使用光学字符识别技术,识别流元素中的文本信息,使得模型更加完整;能够自动从BPMN图片中构建业务流程模型并导出模型定义文件,便于修改与编辑,大大节省了人工绘制业务流程模型所需要耗费的时间。本发明概括来说主要包括以下步骤:
步骤(1)对业务流程模型图片进行分割;
步骤(2)识别图片中的轮廓;
步骤(3)对轮廓进行筛选,筛选出流元素并构建模型基本框架;
步骤(4)识别业务流程建模标记流元素间的连接关系;
步骤(5)识别业务流程建模标记流元素的类型与相关文本;
步骤(6)构建业务流程模型;
步骤(7)输出业务流程模型定义文件。
上述一种基于图像轮廓识别及图像分类的从BPMN图片中提取业务流程模型信息并再构的方法的详细工作流程如图1所示。这里将对上述步骤进行详细描述。
2.根据权利要求1所述的一种业务流程模型图像识别与再构方法,其特征在于步骤(1)中将用业务流程模型标记(BPMN)绘制的业务流程模型图像(如图2所示)进行分割,独立每个图形元素,具体子步骤包括:
步骤(1.1)对输入图像进行预处理。图像以三维矩阵的方式存储,包含红黄绿三个通道,通过公式计算,将彩色三通道图像变为黑色单通道图像,黑白图像以二维矩阵的方式表示,矩阵中的每个值表示一个像素点。黑色部分矩阵值为0,白色部分矩阵值为255,背景为白色,业务流程图元素为黑色。
步骤(1.2)对图像进行膨胀的形态学操作,背景白色区域会膨胀。在形态学操作中我们需要使用结构元素对步骤(1.1)中的黑白二维图像进行类似卷积的操作。结构元素是一个较小的矩阵,我们选择合适大小的矩形结构元素,遍历图像中的每一个像素。结构元素的中心点称为锚点,锚点的坐标为(0,0),对于3×3的结构元素,左上角坐标为(-1,-1),右下角坐标为(1,1)。在操作过程中,锚点覆盖像素点(x,y)时,我们计算图像中被结构元素非零位置覆盖的像素点的最大值,将最大值赋予图像(x,y)像素点。膨胀操作的计算公式是:
dst(x,y)=max(src(x+x′,y+y′)){(x′,y′)|element(x′,y′)≠0}
步骤(1.3)对图像进行侵蚀的形态学操作,前景黑色区域会膨胀;类似步骤(1.2)我们对步骤(1.2)操作后的黑白二维图像进行侵蚀的形态学操作,我们仍然选择和步骤(1.2)相同的矩形结构元素。侵蚀操作的计算公式是:
dst(x,y)=min(src(x+x′,y+y′)){(x′,y′)|element(x′,y′)≠0}
步骤(1.4)计算形态学操作后的图像与原始二值图像的差,得到割裂的业务流程图像,每个图元素都是一个独立的部分。计算公式是:
dst=erode(dilate(src,element)-src
3.根据权利要求1所述的一种业务流程模型图像识别与再构方法,其特征在于步骤(2)中识别步骤(1)中分割图像各个部分的轮廓,具体子步骤包括:
步骤(2.1)对分割后的图像进行预处理,使得图像背景为黑色,前景色为白色,即业务流程图中的元素为白色;
步骤(2.2)对图像进行轮廓检测,检测出图像中所有白色区域的轮廓;
步骤(2.3)计算每个轮廓的最小包围矩形,以该矩形来表示轮廓的位置和大小;
步骤(2.4)把所有轮廓按照拓扑嵌套关系以树的形式组织起来,图像中属于单个独立部分的所有轮廓构成了表示该独立部分的一棵子树。
4.根据权利要求1所述的一种业务流程模型图像识别与再构方法,其特征在于步骤(3)中对提取出来的元素轮廓进行筛选,筛选出流元素并构建模型基本框架,具体子步骤包括:
步骤(3.1)对步骤(2)中的轮廓树进行层次遍历;
步骤(3.2)筛选出业务流程图中泳池轮廓。遍历轮廓树的第一层,筛选是否有泳池轮廓,若有则记录下其位置和大小作为可能的泳池轮廓。若无可能的泳池轮廓,则创建一个可能的泳池轮廓,将轮廓树第一层中的所有轮廓都包含在内
步骤(3.3)筛选出属于一个泳池的所有泳道轮廓。对每一个可能的泳池轮廓,遍历其直接子轮廓,搜寻泳道轮廓,记录其位置和大小。若无泳道轮廓,则将该泳池轮廓作为泳道轮廓,添加泳池头,构成一个泳池。
步骤(3.4)筛选出属于一个泳道的所有流元素轮廓和子过程轮廓。对于每一个泳池中的每一个泳道,遍历其所有的子轮廓,筛选出属于该泳道的流元素的轮廓和子过程轮廓。
步骤(3.5)将筛选出的轮廓构建成只有泳池与流元素(包括子过程)的业务流程基本模型。
5.根据权利要求1所述的一种业务流程模型图像识别与再构方法,其特征在于基于步骤(4)识别业务流程模型图中流元素间的连接关系,识别出每条连接线首部连接的元素,尾部连接的元素以及连接线的路径。具体子步骤包括:
步骤(4.1)对输入图像进行预处理,将其转换为二值图像,背景为黑色,前景为白色。
步骤(4.2)将步骤(3)中我们检测出的所有流元素,从图像中去除,将每个元素的包围矩形所覆盖的部分变为黑色。
步骤(4.3)去除图片中的所有文字,使得图片中仅剩连接元素。对步骤(4.2)处理后的图像进行形态学操作,使得图像中仅剩文字区域,通过轮廓检测,获得文字区域的大小和位置,将其从图片中去除。形态学操作包括:
temp=erode(dilate(src,element1)-src
dst=erode(dilate(temp,element2)
步骤(4.4)识别轮廓中的连接对象。使用霍夫直线变换,检测出图像中的直线。在图像空间中一条直线可以用两个参数来表示,在笛卡尔坐标系中我们用参数(k,b)来表示直线,k是直线的斜率,b是直线的偏移量。在极坐标系中我们使用参数(r,theta)来表示直线,r是直线上的点到原点的距离,theta是该点到原点的直线与x轴正方向所成的角度。使用斜率表示直线有一定的局限性,不能表示垂直的直线,所以我们使用极坐标系的形式来表示直线。在检测过程中,我们使用概率霍夫直线变换,得出检测出线段的两个端点。
步骤(4.5)使用形态学操作,确定图片中箭头的位置,将与箭头直接连接的线段作为初始顺序流,然后不断将与顺序流连接的线段加入顺序流,直到顺序流扩展到一个起始元素。若一个箭头没有找到相应的直连线段,则检测箭头的方向。为了检测箭头的方向,将箭头从图片中截取出来,计算其凸包,接着使用旋转卡壳算法计算凸包的直径,获取箭头的轴向,接着分别查找凸包离直径最远的两个点,直径两边个一个,连接这两个点,计算其与直线的交点,通过交点与直径中点的位置关系,判断箭头的方向。
6.根据权利要求1所述的一种业务流程模型图像识别与再构方法,其特征在于步骤(5)中对所有检测出的流元素进行分类,同时识别出每个流元素中的文本文字,作为流元素的标签。具体子步骤包括:
步骤(5.1)使用VGG16卷积神经网络架构(如图3所示)训练流元素分类器。将标记好的流元素数据集分为训练集和测试集,使用训练集进行VGG16架构的卷积神经网络分类器的训练,使用测试集进行分类器分类效果的评估。训练目标是选择出最优的模型参数来对图片进行特征提取与特征分类。使用RMSProp优化算法来调整参数,使得模型在训练集上的预测误差最小,从而获得训练集上的最优模型参数,构建分类模型。
VGG16共包含13个卷积层,3个全连接层,5个池化层,其中卷积层和全连接层具有权重系数。卷积层均采用相同的卷积核尺寸,卷积核宽高均为3。池化层均采用相同的池化核参数,池化层均是减半最大池化。在训练的时候我们将每张图片都放大成150*150的大小,输入VGG16模型进行训练。
步骤(5.2)依据检测出的所有元素位置,从原始图像中截取相应元素的图像,使用训练好的分类器识别流元素的类别。
步骤(5.3)将元素图像输入Tesseract文字识别引擎,识别流元素中的文本信息;
7.根据权利要求1所述的一种业务流程模型图像识别与再构方法,其特征在于步骤(6)中将识别出的文本与业务流程建模标记进行匹配,得到所有的模型元素,按照元素嵌套关系及连接关系构建业务流程模型。具体子步骤包括:
步骤(6.1)依据连接对象的起始位置与终止位置,找到其连接的流对象元素,从而将所有流对象元素连接起来,构成连通图;
步骤(6.2)依据连通图,重新构建业务流程模型;
步骤(6.3)将业务流程模型记录成符合BPMN2.0规范的XML格式的定义文件。
8.根据权利要求1所述的一种业务流程模型图像识别与再构方法,其特征在于步骤(7)输出从BPMN图像中提取的业务流程模型定义文件。提取效果通对比生成的业务流程模型定义文件与原图片对应定义文件的一致程度从而进行评估。一致程度从识别出的泳池数量,流对象数量及类型,连接对象数量及连接关系等多个角度进行评价。
上面已经参考附图对根据本发明实施的一种业务流程模型图像识别与再构方法进行了详细描述。本发明具有如下优点:现有的建模工具和平台都未提供本发明所实现的功能。本发明所述方法使用了形态学操作对图片进行分割,快速而准确地将业务流程模型图片分割成独立的部分;使用轮廓检测算法替代主流的目标检测深度神经网络算法,在保证准确率的前提下提升元素检测的效率,确定图片中元素的位置和大小;使用霍夫变换来检测图片中的直线,从而完成连接关系的检测,使用特殊递归算法保证复杂的连接关系也能被正确检测;使用光学字符识别技术,识别流元素中的文本信息,使得模型更加完整;能够自动从BPMN图片中构建业务流程模型并导出模型定义文件,便于修改与编辑,大大节省了人工绘制业务流程模型所需要耗费的时间。首先,该方法提升了人工构建和修改业务流程模型的效率,为业务流程模型提供了新的管理方式。其次,它也拓宽了业务流程模型的应用场景,使得现有对BPMN的研究与理论更加的普适。最后,它使得对业务流程模型数据的处理和搜集更加的便利与快速。快速地搜集和处理数据在当今大数据的时代是十分重要的,有了大量的数据,机器学习等数据分析技术也能更好地在业务流程管理领域的研究中得到应用。
需要明确,本发明并不局限于上文所描述并在图中示出的特定配置和处理。并且,为了简明起见,这里省略对已知方法技术的详细描述。当前的实例在所有方面都被看作是示例性的而非限定性的,本发明的范围由所附权利要求而非上述描述定义,并且,落入权利要求的含义和等同物的范围内的全部改变从而都被包括在本发明的范围之中。

Claims (8)

1.一种业务流程模型图像识别与再构方法,其特征在于包含以下步骤:
步骤(1)对业务流程模型图片进行分割;
步骤(2)识别图片中的轮廓;
步骤(3)对轮廓进行筛选,筛选出流元素并构建模型基本框架;
步骤(4)识别业务流程建模标记流元素间的连接关系;
步骤(5)识别业务流程建模标记流元素的类型与相关文本;
步骤(6)构建业务流程模型;
步骤(7)输出业务流程模型定义文件。
2.根据权利要求1所述的一种业务流程模型图像识别与再构方法,其特征在于步骤(1)中将用业务流程模型标记(BPMN)绘制的业务流程模型图像进行分割,独立每个图形元素,具体子步骤包括:
步骤(1.1)对输入图像进行预处理,将其转换为二值图像,背景为白色,业务流程图元素为黑色;
步骤(1.2)对图像进行膨胀的形态学操作,背景白色区域会膨胀;
步骤(1.3)对图像进行侵蚀的形态学操作,前景黑色区域会膨胀;
步骤(1.4)计算形态学操作后的图像与原始二值图像的差,得到割裂的业务流程图像,每个图元素都是一个独立的部分。
3.根据权利要求1所述的一种业务流程模型图像识别与再构方法,其特征在于步骤(2)中识别步骤(1)中分割图像各个部分的轮廓,具体子步骤包括:
步骤(2.1)对分割后的图像进行预处理,使得图像背景为黑色,前景色为白色,即业务流程图中的元素为白色;
步骤(2.2)对图像进行轮廓检测,检测出图像中所有白色区域的轮廓;
步骤(2.3)计算每个轮廓的最小包围矩形,以该矩形来表示轮廓的位置和大小;
步骤(2.4)把所有轮廓按照拓扑嵌套关系以树的形式组织起来,图像中属于单个独立部分的所有轮廓构成了表示该独立部分的一棵子树。
4.根据权利要求1所述的一种业务流程模型图像识别与再构方法,其特征在于步骤(3)中对提取出来的元素轮廓进行筛选,筛选出流元素并构建模型基本框架,具体子步骤包括:
步骤(3.1)对步骤(2)中的轮廓树进行层次遍历;
步骤(3.2)筛选出业务流程图中泳池轮廓;
步骤(3.3)筛选出属于一个泳池的所有泳道轮廓;
步骤(3.4)筛选出属于一个泳道的所有流元素轮廓和子过程轮廓;
步骤(3.5)将筛选出的轮廓构建成只有泳池与流元素(包括子过程)的业务流程基本模型。
5.根据权利要求1所述的一种业务流程模型图像识别与再构方法,其特征在于基于步骤(4)识别业务流程模型图中流元素间的连接关系,识别出每条连接线首部连接的元素,尾部连接的元素以及连接线的路径。具体子步骤包括:
步骤(4.1)对输入图像进行预处理,将其转换为二值图像,背景为黑色,前景为白色;
步骤(4.2)将步骤(3)中我们检测出的所有流元素,从图像中去除,将每个元素的包围矩形所覆盖的部分变为黑色;
步骤(4.3)去除图片中的所有文字,使得图片中仅剩连接元素;
步骤(4.4)识别轮廓中的连接对象。使用霍夫变换,检测出图像中的直线。
步骤(4.5)使用形态学操作,确定图片中箭头的位置,将与箭头直接连接的直线作为初始顺序流,然后不断将与顺序流连接的线段加入顺序流,直到顺序流找到一个起始元素。
6.根据权利要求1所述的一种业务流程模型图像识别与再构方法,其特征在于步骤(5)中对所有检测出的流元素进行分类,同时识别出每个流元素中的文本文字,作为流元素的标签。具体子步骤包括:
步骤(5.1)使用VGG16卷积神经网络架构训练流元素分类器。将标记好的流元素数据集分为训练集和测试集,使用训练集进行VGG16架构的卷积神经网络分类器的训练,使用测试集进行分类器分类效果的评估。训练目标是选择出最优的模型参数来对图片进行特征提取与特征分类。使用RMSProp优化算法来调整参数,使得模型在训练集上的预测误差最小,从而获得训练集上的最优模型参数,构建分类模型。
步骤(5.2)依据检测出的所有元素位置,从原始图像中截取相应元素的图像,使用训练好的分类器识别流元素的类别。
步骤(5.3)将元素图像输入Tesseract文字识别引擎,识别流元素中的文本信息。
7.根据权利要求1所述的一种业务流程模型图像识别与再构方法,其特征在于步骤(6)中将识别出的文本与业务流程建模标记进行匹配,得到所有的模型元素,按照元素嵌套关系及连接关系构建业务流程模型。具体子步骤包括:
步骤(6.1)依据连接对象的起始位置与终止位置,找到其连接的流对象元素,从而将所有流对象元素连接起来,构成连通图;
步骤(6.2)依据连通图,重新构建业务流程模型;
步骤(6.3)将业务流程模型记录成符合BPMN2.0规范的XML格式的定义文件。
8.根据权利要求1所述的一种业务流程模型图像识别与再构方法,其特征在于步骤(7)输出从BPMN图像中提取的业务流程模型定义文件。提取效果通对比生成的业务流程模型定义文件与原图片对应定义文件的一致程度从而进行评估。一致程度从识别出的泳池数量,流对象数量及类型,连接对象数量及连接关系等多个角度进行评价。
CN201911048985.4A 2019-10-30 2019-10-30 一种业务流程模型图像识别与再构方法 Active CN110838105B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911048985.4A CN110838105B (zh) 2019-10-30 2019-10-30 一种业务流程模型图像识别与再构方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911048985.4A CN110838105B (zh) 2019-10-30 2019-10-30 一种业务流程模型图像识别与再构方法

Publications (2)

Publication Number Publication Date
CN110838105A true CN110838105A (zh) 2020-02-25
CN110838105B CN110838105B (zh) 2023-09-15

Family

ID=69575982

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911048985.4A Active CN110838105B (zh) 2019-10-30 2019-10-30 一种业务流程模型图像识别与再构方法

Country Status (1)

Country Link
CN (1) CN110838105B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111461066A (zh) * 2020-04-24 2020-07-28 北京联合普肯工程技术股份有限公司 过程工业流程图的识别方法及装置、电子设备
CN111507352A (zh) * 2020-04-16 2020-08-07 腾讯科技(深圳)有限公司 一种图像处理方法、装置、计算机设备以及存储介质
CN111753108A (zh) * 2020-06-28 2020-10-09 平安科技(深圳)有限公司 演示文稿生成方法、装置、设备及介质
CN112287742A (zh) * 2020-06-22 2021-01-29 上海柯林布瑞信息技术有限公司 文件中的流程图解析方法及装置、计算设备、存储介质
CN113392819A (zh) * 2021-08-17 2021-09-14 北京航空航天大学 一种批量化学术图像自动分割标注装置和方法
CN113554012A (zh) * 2021-09-22 2021-10-26 江西博微新技术有限公司 三维工程中图元模型分类方法、系统、设备及存储介质
CN113723230A (zh) * 2021-08-17 2021-11-30 山东科技大学 业务流程抽取领域过程性视频的过程模型抽取方法
CN115147096A (zh) * 2022-09-06 2022-10-04 京华信息科技股份有限公司 一种基于ocr的流程快速建模方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5287275A (en) * 1988-08-20 1994-02-15 Fujitsu Limited Image recognition apparatus and method for recognizing a pattern within an image
CN104361312A (zh) * 2014-10-16 2015-02-18 北京捷通华声语音技术有限公司 一种对图像进行字符识别的方法和装置
CN108280430A (zh) * 2018-01-24 2018-07-13 陕西科技大学 一种流程图像识别方法
CN109389050A (zh) * 2018-09-19 2019-02-26 陕西科技大学 一种流程图连接关系识别方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5287275A (en) * 1988-08-20 1994-02-15 Fujitsu Limited Image recognition apparatus and method for recognizing a pattern within an image
CN104361312A (zh) * 2014-10-16 2015-02-18 北京捷通华声语音技术有限公司 一种对图像进行字符识别的方法和装置
CN108280430A (zh) * 2018-01-24 2018-07-13 陕西科技大学 一种流程图像识别方法
CN109389050A (zh) * 2018-09-19 2019-02-26 陕西科技大学 一种流程图连接关系识别方法

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111507352A (zh) * 2020-04-16 2020-08-07 腾讯科技(深圳)有限公司 一种图像处理方法、装置、计算机设备以及存储介质
CN111461066A (zh) * 2020-04-24 2020-07-28 北京联合普肯工程技术股份有限公司 过程工业流程图的识别方法及装置、电子设备
CN112287742A (zh) * 2020-06-22 2021-01-29 上海柯林布瑞信息技术有限公司 文件中的流程图解析方法及装置、计算设备、存储介质
CN112287742B (zh) * 2020-06-22 2023-12-26 上海柯林布瑞信息技术有限公司 文件中的流程图解析方法及装置、计算设备、存储介质
CN111753108A (zh) * 2020-06-28 2020-10-09 平安科技(深圳)有限公司 演示文稿生成方法、装置、设备及介质
CN111753108B (zh) * 2020-06-28 2023-08-25 平安科技(深圳)有限公司 演示文稿生成方法、装置、设备及介质
CN113392819A (zh) * 2021-08-17 2021-09-14 北京航空航天大学 一种批量化学术图像自动分割标注装置和方法
CN113723230A (zh) * 2021-08-17 2021-11-30 山东科技大学 业务流程抽取领域过程性视频的过程模型抽取方法
CN113554012A (zh) * 2021-09-22 2021-10-26 江西博微新技术有限公司 三维工程中图元模型分类方法、系统、设备及存储介质
CN115147096A (zh) * 2022-09-06 2022-10-04 京华信息科技股份有限公司 一种基于ocr的流程快速建模方法及系统

Also Published As

Publication number Publication date
CN110838105B (zh) 2023-09-15

Similar Documents

Publication Publication Date Title
CN110838105B (zh) 一种业务流程模型图像识别与再构方法
US11830246B2 (en) Systems and methods for extracting and vectorizing features of satellite imagery
CN110738207B (zh) 一种融合文字图像中文字区域边缘信息的文字检测方法
CN111626146B (zh) 一种基于模板匹配的合并单元格表格分割识别方法
Brown et al. Handprinted symbol recognition system
CN113673338B (zh) 自然场景文本图像字符像素弱监督自动标注方法、系统及介质
Jiao et al. A survey of road feature extraction methods from raster maps
CN112507876A (zh) 一种基于语义分割的有线表格图片解析方法和装置
CN112241730A (zh) 一种基于机器学习的表格提取方法和系统
Geng et al. An improved helmet detection method for YOLOv3 on an unbalanced dataset
CN113158977B (zh) 改进FANnet生成网络的图像字符编辑方法
CN111414907A (zh) 数据集标注方法、数据集标注装置和计算机可读存储介质
Heitzler et al. A modular process to improve the georeferencing of the Siegfried map
Mao et al. City object detection from airborne Lidar data with OpenStreetMap‐tagged superpixels
CN108898188A (zh) 一种图像数据集辅助标记系统及方法
CN114639013A (zh) 基于改进Orient RCNN模型的遥感图像飞机目标检测识别方法
CN112330659A (zh) 结合lsd直线检测和连通域标记法的几何公差符号分割方法
CN117437647B (zh) 基于深度学习和计算机视觉的甲骨文字检测方法
CN111126513A (zh) 一种通用物体实时学习、识别系统及其学习、识别方法
CN117593648B (zh) 基于弱监督学习的遥感目标建筑物提取方法
Shon et al. Identifying the exterior image of buildings on a 3D map and extracting elevation information using deep learning and digital image processing
CN112861603B (zh) 一种有限表格自动识别与解析方法
CN116403132B (zh) 一种基于图像和机器算法生成征地拆迁表的地物识别方法
Fatty et al. Instance segmentation based building extraction in a dense urban area using multispectral aerial imagery data
Muhs Computational Delineation of Built-up Area at Urban Block Level from Topographic Maps: A Contribution to Retrospective Monitoring of Urban Dynamics

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant