CN109389050B - 一种流程图连接关系识别方法 - Google Patents

一种流程图连接关系识别方法 Download PDF

Info

Publication number
CN109389050B
CN109389050B CN201811096199.7A CN201811096199A CN109389050B CN 109389050 B CN109389050 B CN 109389050B CN 201811096199 A CN201811096199 A CN 201811096199A CN 109389050 B CN109389050 B CN 109389050B
Authority
CN
China
Prior art keywords
corner
point
points
corner point
angular
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811096199.7A
Other languages
English (en)
Other versions
CN109389050A (zh
Inventor
孙连山
杜翰超
侯涛
李昕妍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shaanxi University of Science and Technology
Original Assignee
Shaanxi University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shaanxi University of Science and Technology filed Critical Shaanxi University of Science and Technology
Priority to CN201811096199.7A priority Critical patent/CN109389050B/zh
Publication of CN109389050A publication Critical patent/CN109389050A/zh
Application granted granted Critical
Publication of CN109389050B publication Critical patent/CN109389050B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines

Abstract

本发明提出了一种流程图连接关系识别方法,其技术特征在于:首先依据流程图中连接线的局部特征形式地定义角点分类;其次针对流程图图元间连接规范定义连接关系的角点组合规则;然后提取并识别流程图像中连接关系上的角点,并基于角点组合识别连接关系;最后将识别结果以文本形式输出。本发明基于角点特征识别流程图像中的连接关系,为准确识别流程图结构提供了新技术支撑。

Description

一种流程图连接关系识别方法
技术领域
本发明属于图像识别技术领域,特别涉及一种流程图连接关系识别方法。
背景技术
现有计算机信息检索系统主要采用基于文本匹配的检索技术,但化工、制药、机械、信息技术等领域中的文档往往还包含大量流程图像,这些图像蕴含丰富的信息,对于检索和查新至关重要。
流程图可以直观地描述一个工作过程的具体步骤,具有重要的语义。目前对于流程图连接关系的识别主要基于直线的提取来识别,但过度依赖图像轮廓特征很难理解图像语义。由于流程图像特征和语义之间存在着明显的语义鸿沟,这种“鸿沟”主要体现在流程图中连接关系的多样使得结构的一种语义有多种表现形式,为了尽能地缩小语义鸿沟对流程图像检索的影响,需要一种新的流程图结构中连接关系识别方法。
发明内容
本发明的目的在于提供一种流程图连接关系的识别方法,首先将与连接线相关的角点进行分类定义,然后对然后针对图元之间的连接规范与逻辑定义角点连接组合规则;最后基于角点连接组合规则设计连接关系识别算法,实现流程图中连接关系的识别,识别结果以文本形式输出。
为了实现上述目的,本发明采用的技术方案是:
一种流程图连接关系的识别方法步骤包括:
S1分类定义连接线相关角点;
S2定义连接关系角点组合规则;
S3提取并识别输入流程图中与连接关系相关的角点,具体步骤如下:
S31流程图像预处理及结构层提取;
对原始流程图像进行二值化、降噪处理,通过连通域提取方法进行图文分割得到原始流程图像中结构层,对提取的流程图结构进行单像素化处理。
S32流程图像角点检测;
通过CSS算法利用曲率检测出与直线型元素相关的角点,过滤掉曲线型结构元素上的圆角点和虚假角点。
不同尺度σ下的曲率计算公式为:
Figure BDA0001805605470000021
其中t是弧长参数,σ是尺度参数,
Figure BDA0001805605470000022
分别为曲线l上一点的坐标x(t)和y(t)与一维高斯核函数g(μ,σ)的一阶导数和二阶导数的卷积;
圆角点判定方法为:
Figure BDA0001805605470000023
其中u为候选角点的位置参数,K(u)是候选角点的曲率,T(u)为与角点支持域自适应的动态局部阈值,与候选角点u处的局部平均曲率成正比,当Rc=1时表示角点为圆角点,给予滤除。
Figure BDA0001805605470000024
其中Cc为需要判定的候选角点,∠Cc为角点Cc的角,θobtuse为真角点的最大钝角值,θobtuse的经验取值为162°,当Ccobtuse时,Cc为虚假角点。
通过Harris算法检测与曲线型元素相关的角点,首先求输入图像I对应的x和y轴方向的一阶偏导Ix和Iy,利用高斯核Gx,y对其平滑,并构造自相关矩阵M,
Figure BDA0001805605470000025
其中,
Figure BDA0001805605470000026
Figure BDA0001805605470000027
是卷积算子。通过自相关矩阵的特征值α、β(α≥β)来构造角点响应R并判决角点,R=αβ-k(α+β)2,其中,k(k=0.04)是错误角点响应抑制常数。
采用距离筛选法对检测出的冗余角点进行筛选。计算指定范围内所有点之间的欧式距离,在欧几里得空间中,如点x=(x1,…,xn)和y=(y1,…,yn)之间的距离为:
Figure BDA0001805605470000031
当角点间的距离小于指定阈值时,可删掉其中之一以减少冗余。
S33流程图角点的分类;
得到步骤S32中角点的邻域特征并进行角点分类器的训练,对流程图中角点进行分类:
以检测到的每个角点为中心截取41×41像素的角点邻域图像,提取角点邻域图像的网格特征和外围特征并将角点样本分类标注;
使用支持向量机SVM分类器训练样本集,采用径向基核函数(Radial BasisFunction,RBF)作为SVM分类核函数;利用MATLAB中的LIBSVM工具箱来实现SVM多分类,引入惩罚因子c对其进行惩罚,通过参数调优设置惩罚因子c,使得数据在高维特征空间中的线性可分度最大。
采用K-折交叉验证(K-fold CrossValidation,K-CV)将原始数据分成均分为K组,将每个子集数据分别做一次验证集,其余的K-1组子集数据作为训练集,用这K个模型最终验证集的分类准确率的平均数作为此K-CV下分类器的性能指标。
S4基于角点组合识别流程图连接关系;
S5输出描述图元间连接关系的文本信息。
与现有技术相比,本发明从角点这一直观稳定的局部特征去分析流程图结构中的连接关系,通过角点组合来描述图元之间存在的连接关系,减少了识别的工作量,为流程图连接关系的识别提供了新的思路。
附图说明
图1是本发明的流程示意图。
图2是本发明流程S2组合规则示意图。
图3是本发明流程S2连接关系举例示意图。
图4是本发明流程S3角点检测的结果。
图5是本发明流程S3中实验获取得到的角点示意图。
图6是本发明流程S5连接关系识别结果。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面结合实施例、附图对本发明作进一步描述。显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本发明的识别方法的步骤包括:
S1分类定义连接线相关角点
S2定义连接关系角点组合规则
S3提取并识别输入流程图中与连接关系相关的角点
S4基于角点组合识别流程图连接关系
S5输出描述图元间连接关系的文本信息
其中步骤S1包括:
将流程图中与连接线相关的角点分为三类:
一是位于图元与连接线相接处的连接型角点①型,包括
Figure BDA0001805605470000041
Figure BDA0001805605470000042
等10种类型;
二是位于连接线与连接线相接处的连接型角点②型,包括
Figure BDA0001805605470000043
Figure BDA0001805605470000044
等4种类型;
三是连接线折线处的独立型角点③型,包括
Figure BDA0001805605470000045
等4种类型。
上述角点按形态具体命名如下:
Rb:
Figure BDA0001805605470000046
(Rb-1)、
Figure BDA0001805605470000047
(Rb-2)、
Figure BDA0001805605470000048
(Rb-3)、
Figure BDA0001805605470000049
(Rb-4)、
Figure BDA00018056054700000410
(Rb-5)、
Figure BDA00018056054700000411
(Rb-6)
Db:
Figure BDA00018056054700000412
(Db-1)、
Figure BDA00018056054700000413
(Db-2)、
Figure BDA00018056054700000414
(Db-3)、
Figure BDA00018056054700000415
(Db-4)
R:
Figure BDA00018056054700000416
(R-1)、
Figure BDA00018056054700000417
(R-2)、
Figure BDA00018056054700000418
(R-3)、
Figure BDA00018056054700000419
(R-4)
将角点中连接线部分称为角点连接线,角点连接线具有不同的输入/输出语义和流向。例如,对于①型角点
Figure BDA00018056054700000420
短竖线为角点连接线,可能代表向角点输入或从角点输出,方向分别为向上(up)和向下(down);对于②型
Figure BDA0001805605470000051
长竖线与短横线均为角点连接线,短竖线表示输入,方向为向右(right)、而长竖线则表示输出,方向可能为向上(up)或向下(down);对于③型角点
Figure BDA0001805605470000052
横线和竖线均为角点连接线,分别表示输入或输出,如可能横线表示输入,方向为向左(left),则竖线表示输出,方向为向下(down);或竖线表示输入,方向为向上(up),则横线表示输出,方向为向右(right)。
根据角点连接线表示的输入/输出语义以及流向,对角点归类如下。
当竖向角点连接线表示输出(Out)时角点归类如下:
down:①
Figure BDA0001805605470000053
Figure BDA0001805605470000054
Figure BDA0001805605470000055
up:①
Figure BDA0001805605470000056
Figure BDA0001805605470000057
Figure BDA0001805605470000058
当横向角点连接线表示输出(Out)时,角点归类如下:
right:①
Figure BDA0001805605470000059
Figure BDA00018056054700000510
Figure BDA00018056054700000511
left:①
Figure BDA00018056054700000512
Figure BDA00018056054700000513
Figure BDA00018056054700000514
当竖向角点连接线表示输入(In)时角点归类如下:
down:①
Figure BDA00018056054700000515
Figure BDA00018056054700000516
Figure BDA00018056054700000517
up:①
Figure BDA00018056054700000518
Figure BDA00018056054700000519
Figure BDA00018056054700000520
当横向角点连接线表示输入(In)时角点归类如下:
right:①
Figure BDA00018056054700000521
Figure BDA00018056054700000522
Figure BDA00018056054700000523
left:①
Figure BDA00018056054700000524
Figure BDA00018056054700000525
Figure BDA00018056054700000526
步骤S2包括:
总结流程图绘制规范如下:
(1)流程图的流程方向由高至低、由左至右。
(2)使用统一的标记符号,图形尽可能简单,文字描述简洁。
(3)一个矩形符号(执行框)一般应为一件独立的动作或事件。
(4)流程图以开始符号开始,且在图中只能出现一次;以结束符号结束,但结束符号次数不限。
(5)一个菱形符号(判断框)有一个入口,至少两个出口,结合连接线上文本标注有且仅有一个出口被激活。
(6)路径符号尽量避免交叉,以连接线合并形式减少线路的数量。
(7)相同流程图符号大小尽量一致。
(8)同一路径符号之指示箭头应只有一个。
(9)若有条件判断符,需检查回馈校正流程是否有遗漏,以避免悬而未决状况,反馈的流程要形成闭环。
(10)尽最大的可能便于读者阅读。
在以上先验知识的分析基础上,结合角点类型定义连接关系的角点组合规则。
角点组合与图元连接之间的映射关系主要依据角点所属的图元编号。将所有角点图元编号这一属性值初始化为0,表示无所属图元。对于①型角点,图元编号即为所连接的图元编号;对于②型角点和③型角点图元编号为0。角点组合中起始和结束角点所属的图元即为当前连接关系连接的一对图元。
角点组合中起始和结束角点所属的图元即为连接关系所连接的一对图元。构成连接关系的角点组合{C1,C2,…,Cn}须满足如下规则。
规则1:起始角点为C1为①型角点,中间角点C2~Cn-1为②或③型角点或不存在,结束角点Cn为①型角点。
规则2:设起始角点的角点连接线语义为输出,结束角点得角点连接线语义为输入,则连接关系上相邻角点Ci,Cj须满足下述Out-In关系,即相邻角点得的角点连接线的输入输出语义及走向必须匹配,即:
<Ci,Cj>:=Out(Ci)∧In(Cj)∧(OutTrend(Ci)=InTrend(Cj)),down,up,right,left∈trend。
规则3:满足Out-In关系的两个角点之间的连接线必须真实存在于流程图像之中。验证方法是,根据已知两角点坐标,计算角点之间的距离Dij,通过两个角点的坐标位置确定一段直线区间W,然后统计图像中在W区间内目标像素的累积长度或高度D'ij,最后判断
Figure BDA0001805605470000071
是否存在区间内,若存在则存在条件成立,否则不成立。Dij、D'ij如下式所示:
Figure BDA0001805605470000072
D'ij=∑p(x,y),p(x,y)∈W,其中,
Figure BDA0001805605470000073
流程图图元之间连接关系如图3中的三条连接关系示例。
图3中L1,L2,L3为图元之间连接线关系示例。首先通过角点组合识别图元后,将其角点进行所属图元标号,然后选定起始角点,寻找符合要求的角点组合,最后由角点组合与图元连接之间的映射关系得出图元的连接关系,其角点组合以及与图元映射关系语法描述如下:
L1:Rb-1,Rb-2;→(1,2)
L2:Db-4,R-2,Rb-2;→(3,4)
L3:Rb-1,R-4,Rb-4;→(5,6)
L1的角点组合中起始和结束角点均为①型角点,所属图元标号为已被识别的图元标号,通过映射关系得出L1为图元1与图元2之间的连接;L2的角点组合中首先是①型起始角点,然后根据角点连接线的走向寻找到②型角点,②型角点为中间角点,无所属图元,仅作为寻找结束角点的“纽带”,接着根据走向寻找到①型角点,确定其所属图元,通过映射关系得出L2为图元3与图元4之间的连接;L3中根据①型起始角点走向找到③型转折角点,继续寻找得到②型角点,其输出连接线有两种可能,按照每种走向寻找与之可连接的角点进而得到所属图元标号,其中向上走向的图元和相关角点已经被识别,不再参与计算,向下走向找到①型角点以及所属图元6,因此L3表示图元5分别与图元6的连接。
步骤S3包括:
S31流程图像预处理及结构层提取;
对原始流程图像进行二值化、降噪处理,通过连通域提取方法进行图文分割得到原始流程图像中结构层,对提取的流程图结构进行单像素化处理。
S32流程图像角点检测;
将流程图中结构元素分为直线型和曲线型结构元素,采用曲率尺度空间(Curvature Scale Space,CSS)和Harris结合的角点检测方案进行角点检测。
采用CSS算法利用曲率检测出与直线型元素相关的角点,过滤掉曲线型结构元素上的圆角点和虚假角点。
不同尺度σ下的曲率计算公式为:
Figure BDA0001805605470000081
其中t是弧长参数,σ是尺度参数,
Figure BDA0001805605470000082
分别为曲线l上一点的坐标x(t)和y(t)与一维高斯核函数g(μ,σ)的一阶导数和二阶导数的卷积;
圆角点判定方法为:
Figure BDA0001805605470000083
其中u为候选角点的位置参数,K(u)是候选角点的曲率,T(u)为与角点支持域自适应的动态局部阈值,与候选角点u处的局部平均曲率成正比,当Rc=1时表示角点为圆角点,给予滤除。
Figure BDA0001805605470000084
其中Cc为需要判定的候选角点,∠Cc为角点Cc的角,θobtuse为真角点的最大钝角值,θobtuse的经验取值为162°,当Ccobtuse时,Cc为虚假角点。
对采用CSS算法检测得到的角点进行边界搜索并剪裁掉边界包围的区域,得到曲线型结构元素所在的区域,然后采用Harris角点检测算法对该区域进行再次检测,得到曲线型结构元素上的角点。
通过Harris算法检测与曲线型元素相关的角点,首先求输入图像I对应的x和y轴方向的一阶偏导Ix和Iy,利用高斯核Gx,y对其平滑,并构造自相关矩阵M,
Figure BDA0001805605470000091
其中,
Figure BDA0001805605470000092
Figure BDA0001805605470000093
是卷积算子。通过自相关矩阵的特征值α、β(α≥β)来构造角点响应R并判决角点,R=αβ-k(α+β)2,其中,k(k=0.04)是错误角点响应抑制常数。
采用距离筛选法对检测出的冗余角点进行筛选。计算指定范围内所有点之间的欧式距离,在欧几里得空间中,如点x=(x1,…,xn)和y=(y1,…,yn)之间的距离为:
Figure BDA0001805605470000094
当角点间的距离小于指定阈值时,可删掉其中之一以减少冗余。
图4中(a)为流程图原图,(b)为实验中结合CSS和Harris方法的角点检测与筛选结果。
S33流程图角点的分类;
得到步骤S32中角点的邻域特征并进行角点分类器的训练,对流程图中角点进行分类:
以检测到的每个角点为中心截取41×41像素的角点邻域图像,提取角点邻域图像的网格特征和外围特征并将角点样本分类标注;
使用支持向量机SVM分类器训练样本集,采用径向基核函数(Radial BasisFunction,RBF)作为SVM分类核函数;利用MATLAB中的LIBSVM工具箱来实现SVM多分类,引入惩罚因子c对其进行惩罚,通过参数调优设置惩罚因子c,使得数据在高维特征空间中的线性可分度最大。
采用K-折交叉验证(K-fold CrossValidation,K-CV)将原始数据分成均分为K组,将每个子集数据分别做一次验证集,其余的K-1组子集数据作为训练集,用这K个模型最终验证集的分类准确率的平均数作为此K-CV下分类器的性能指标。
图5为对流程图中角点进行分类标注后获取到的角点种类。从实验流程图中截取2600张角点作为角点样本,采用LIBSVM进行角点的多分类,对于SVM参数的优化,最终统计其中与连接线相关的角点的分类准确率。其中,分类结果如表2所示。
表2角点分类结果
Figure BDA0001805605470000101
步骤S4包括:
图元间的连接关系根据角点输出走向去寻找角点组合,通过起始和结束角点所属图元映射图元之间的连接关系,连接关系的识别算法如下。
输入:流程图像以及角点集合,集合中包括角点类型,位置以及所属图元标号
输出:描述图元间连接关系的文本信息
S41判断角点集合中①型角点个数是否大于1,若大于1,则寻找连接关系角点集合为空的①型角点作为起始角点,存入以该角点为起点的连接关系角点集合中,进入S42;否则,不存在连接关系,退出。
S42选择最后加入连接关系角点集合中的角点作为当前角点,根据当前角点的输出方向寻找与之连接的角点,若找到候选角点且候选角点与当前角点满足Out-In规则且共线,则进行S43;若否,则证明当前角点没有可连接的角点,退出当前遍历。
S43,判断候选角点的类型,若候选角点为②型角点或③型角点,则将该角点加入连接关系角点集合,返回S42;若候选角点为①型角点,则将该角点作为结束角点加入连接关系的角点集合,输出起始角点和结束角点所属的图元标号,返回S41。
步骤S5包括:
图5是实施例流程图识别结果形式化描述。图中RELATION代表指定图元所属标号构成连接关系,TEXT代表连接关系的文本信息。对于连接关系上的文本信息的识别,需定位到每组构成连接关系的角点组合附近区域,根据定位的区域采用现已成熟的OCR技术,对流程图中文本内容识别,提取文字即可。
例如:执行活动A与执行活动B通过一条直线相连的简单连接关系,可以描述为<
Figure BDA0001805605470000111
(A)、
Figure BDA0001805605470000112
(B)>的角点组合。表示属于A图元上的角点
Figure BDA0001805605470000113
与B图元上的角点
Figure BDA0001805605470000114
之间有连接线相连,构成了图元A和B的连接关系。最终的文本信息为:
RELATION====TEXT====
[A,B]‘’
以上表示A与B之间有连接线,连接线上无文本标注。A与B相连这一语义描述可以有多种形式的连接情况,语义结果与流程图结构之间不可逆,一种连接关系对应一个描述结果,一个描述结果可以对应多种连接关系。

Claims (8)

1.一种流程图连接关系识别方法,其特征在于,包括如下步骤:
S1分类定义连接线相关角点,将流程图中与连接线相关的角点分为三类:
一是位于图元与连接线相接处的连接型角点①型,包括
Figure FDA0003198299560000011
Figure FDA0003198299560000012
共10种类型;
二是位于连接线与连接线相接处的连接型角点②型,包括
Figure FDA0003198299560000013
Figure FDA0003198299560000014
共4种类型;
三是连接线折线处的独立型角点③型,包括
Figure FDA0003198299560000015
共4种类型;
以Rb表示直线与矩形或圆角矩形连接处的角点;Db表示菱形相关的角点;R表示仅与矩形相关的角点;则上述角点按形态具体命名如下:
Rb:
Figure FDA0003198299560000016
Db:
Figure FDA0003198299560000017
R:
Figure FDA0003198299560000018
将角点中连接线部分称为角点连接线,角点连接线具有不同的输入/输出语义和流向,根据角点连接线表示的输入/输出语义以及流向,对角点归类如下:
当竖向角点连接线表示输出(Out)时:
向下(down):①
Figure FDA0003198299560000019
Figure FDA00031982995600000110
Figure FDA00031982995600000111
向上(up):①
Figure FDA00031982995600000112
Figure FDA00031982995600000113
Figure FDA00031982995600000114
当横向角点连接线表示输出(Out)时:
向右(right):①
Figure FDA00031982995600000115
Figure FDA00031982995600000116
Figure FDA00031982995600000117
向左(left):①
Figure FDA00031982995600000118
Figure FDA00031982995600000119
Figure FDA00031982995600000120
当竖向角点连接线表示输入(In)时:
向下(down):①
Figure FDA00031982995600000121
Figure FDA00031982995600000122
Figure FDA00031982995600000123
向上(up):①
Figure FDA00031982995600000124
Figure FDA00031982995600000125
Figure FDA00031982995600000126
当横向角点连接线表示输入(In)时:
向右(right):①
Figure FDA0003198299560000021
Figure FDA0003198299560000022
Figure FDA0003198299560000023
向左(left):①
Figure FDA0003198299560000024
Figure FDA0003198299560000025
Figure FDA0003198299560000026
S2结合先验知识和流程图中图元之间的连接逻辑,定义连接关系角点组合规则,具体如下:
角点组合与连接线之间的映射关系主要依据角点所属的图元编号,①型角点的图元编号即为所连接的图元编号;②型和③型角点图元编号为0,表示无所属图元;
角点组合中起始和结束角点所属的图元即为连接关系所连接的一对图元,构成连接关系的角点组合{C1,C2,…,Cn}须满足如下规则:
规则1:起始角点为C1为①型角点,中间角点C2~Cn-1为②或③型角点或不存在,结束角点Cn为①型角点;
规则2:设起始角点的角点连接线语义为输出,结束角点的角点连接线语义为输入,则连接关系上相邻角点Ci,Cj须满足下述Out-In关系,即相邻角点得的角点连接线的输入输出语义及走向必须匹配,即:
<Ci,Cj>:=Out(Ci)∧In(Cj)∧(OutTrend(Ci)=InTrend(Cj)),down,up,right,left∈trend;
规则3:满足Out-In关系的两个角点之间的连接线必须真实存在于流程图像之中;
其中,n是构成连接关系的角点的个数,OutTrend(Ci)表示Ci角点的输出端角点连接线的走向;InTrend(Cj)表示Cj角点的输入端角点连接线的走向,Trend是四个走向构成的集合;
S3提取并识别输入流程图中与连接关系相关的角点;
S4基于角点组合识别流程图连接关系;
S5输出描述图元间连接关系的文本信息。
2.根据权利要求1所述流程图连接关系识别方法,其特征在于,所述规则3的验证方法是,根据已知两角点坐标,计算角点之间的距离Dij,通过两个角点的坐标位置确定一段直线区间W,然后统计图像中在W区间内目标像素的累积长度或高度D'ij,最后判断
Figure FDA0003198299560000031
是否存在于区间内,若存在则存在条件成立,否则不成立,Dij、D'ij如下式所示:
Figure FDA0003198299560000032
D′ij=Σp(x,y),p(x,y)∈W,其中,
Figure FDA0003198299560000036
Figure FDA0003198299560000037
3.根据权利要求1所述流程图连接关系识别方法,其特征在于,所述步骤S3中提取并识别输入流程图中与连接关系相关的角点,具体如下:
流程图结构中,结合包括点、交叉点以及拐点在内的关键局部信息,采用经典的Harris和CSS角点检测算法进行定位,并采用基于SVM的分类器对角点进行分类,执行步骤如下:
S31流程图像预处理及结构层提取;
S32流程图像角点检测;
S33流程图连接关系角点分类。
4.根据权利要求3所述流程图连接关系识别方法,其特征在于,所述步骤S31中,对原始流程图像进行二值化、降噪处理,通过连通域提取方法进行图文分割得到原始流程图像中结构层,对提取的流程图结构进行单像素化处理。
5.根据权利要求3所述流程图连接关系识别方法,其特征在于,所述步骤S32中,通过CSS算法利用曲率检测出与直线型元素相关的角点,过滤掉曲线型结构元素上的圆角点和虚假角点,其中不同尺度σ下的曲率计算公式为:
Figure FDA0003198299560000034
其中t是弧长参数,σ是尺度参数,
Figure FDA0003198299560000035
分别为曲线l上一点的坐标x(t)和y(t)与一维高斯核函数g(μ,σ)的一阶导数和二阶导数的卷积;
圆角点判定方法为:
Figure FDA0003198299560000041
其中u为候选角点的位置参数,K(u)是候选角点的曲率,T(u)为与角点支持域自适应的动态局部阈值,与候选角点u处的局部平均曲率成正比,当Rc=1时表示角点为圆角点,给予滤除;
Figure FDA0003198299560000042
其中Cc为需要判定的候选角点,∠Cc为角点Cc的角,θobtuse为真角点的最大钝角值,θobtuse的经验取值为162°,当Ccobtuse时,Cc为虚假角点;
通过Harris算法检测与曲线型元素相关的角点,首先求输入图像I对应的x和y轴方向的一阶偏导Ix和Iy,利用高斯核Gx,y对其平滑,并构造自相关矩阵M,
Figure FDA0003198299560000043
其中,
Figure FDA0003198299560000044
Figure FDA0003198299560000045
是卷积算子,通过自相关矩阵的特征值α、β(α≥β)来构造角点响应R并判决角点,R=αβ-k(α+β)2,其中,k(k=0.04)是错误角点响应抑制常数;
采用距离筛选法对检测出的冗余角点进行筛选,计算指定范围内所有点之间的欧式距离,在欧几里得空间中,点x=(x1,…,xn)和y=(y1,…,yn)之间的距离为:
Figure FDA0003198299560000046
当角点间的距离小于指定阈值时,删掉其中之一以减少冗余。
6.根据权利要求3所述流程图连接关系识别方法,其特征在于,所述步骤S33中,得到步骤S32中角点的邻域特征并进行角点分类器的训练,对流程图中角点进行分类:
以检测到的每个角点为中心截取41×41像素的角点邻域图像,提取角点邻域图像的网格特征和外围特征并将角点样本分类标注;
使用支持向量机SVM分类器训练样本集,采用径向基核函数(Radial Basis Function,RBF)作为SVM分类核函数;利用MATLAB中的LIBSVM工具箱来实现SVM多分类,引入惩罚因子c对其进行惩罚,通过参数调优设置惩罚因子c,使得数据在高维特征空间中的线性可分度最大;
采用K-折交叉验证(K-fold CrossValidation,K-CV)将原始数据分成均分为K组,将每个子集数据分别做一次验证集,其余的K-1组子集数据作为训练集,用这K个模型最终验证集的分类准确率的平均数作为此K-CV下分类器的性能指标。
7.根据权利要求3所述流程图连接关系识别方法,其特征在于,所述步骤S4中识别流程图连接关系,具体如下:
输入:流程图像以及S4中得到的角点集合,集合中包括角点类型,位置以及所属图元标号;
输出:描述图元间连接关系的文本信息;
S41判断角点集合中①型角点个数是否大于1,若大于1,则寻找连接关系角点集合为空的①型角点作为起始角点,存入以该角点为起点的连接关系角点集合中,进入S42;否则,不存在连接关系,退出;
S42选择最后加入连接关系角点集合中的角点作为当前角点,根据当前角点的输出方向寻找与之连接的角点,若找到候选角点且候选角点与当前角点满足Out-In规则且共线,则进行S43;若否,则证明当前角点没有可连接的角点,退出当前遍历;
S43,判断候选角点的类型,若候选角点为②型角点或③型角点,则将该角点加入连接关系角点集合,返回S42;若候选角点为①型角点,则将该角点作为结束角点加入连接关系的角点集合,输出起始角点和结束角点所属的图元标号,返回S41。
8.根据权利要求7所述流程图连接关系识别方法,其特征在于,所述步骤S5中,输出描述图元间连接关系的文本描述,具体如下:
对流程图中角点信息按照图像从上到下,从左右的顺序进行遍历,基于连接关系识别算法对得到的角点及角点组合进行判断,将识别的连接关系以文本形式描述。
CN201811096199.7A 2018-09-19 2018-09-19 一种流程图连接关系识别方法 Active CN109389050B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811096199.7A CN109389050B (zh) 2018-09-19 2018-09-19 一种流程图连接关系识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811096199.7A CN109389050B (zh) 2018-09-19 2018-09-19 一种流程图连接关系识别方法

Publications (2)

Publication Number Publication Date
CN109389050A CN109389050A (zh) 2019-02-26
CN109389050B true CN109389050B (zh) 2021-11-09

Family

ID=65418927

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811096199.7A Active CN109389050B (zh) 2018-09-19 2018-09-19 一种流程图连接关系识别方法

Country Status (1)

Country Link
CN (1) CN109389050B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11151372B2 (en) 2019-10-09 2021-10-19 Elsevier, Inc. Systems, methods and computer program products for automatically extracting information from a flowchart image
CN110838105B (zh) * 2019-10-30 2023-09-15 南京大学 一种业务流程模型图像识别与再构方法
CN111079766A (zh) * 2019-12-19 2020-04-28 青岛科技大学 一种p&id图的智能化方法
CN113554012B (zh) * 2021-09-22 2022-01-11 江西博微新技术有限公司 三维工程中图元模型分类方法、系统、设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101127085A (zh) * 2006-07-28 2008-02-20 索尼株式会社 图像处理方法和图像处理设备
CN101551861A (zh) * 2008-03-31 2009-10-07 富士通先端科技株式会社 字符识别装置
CN103208046A (zh) * 2012-12-31 2013-07-17 广州奥凯信息咨询有限公司 基于交互式动态流程图的工作流引擎架构方法和系统
CN107123188A (zh) * 2016-12-20 2017-09-01 北京联合众为科技发展有限公司 基于模板匹配算法和边缘特征的伤票识别与定位方法
CN108280430A (zh) * 2018-01-24 2018-07-13 陕西科技大学 一种流程图像识别方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4636064B2 (ja) * 2007-09-18 2011-02-23 ソニー株式会社 画像処理装置および画像処理方法、並びにプログラム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101127085A (zh) * 2006-07-28 2008-02-20 索尼株式会社 图像处理方法和图像处理设备
CN101551861A (zh) * 2008-03-31 2009-10-07 富士通先端科技株式会社 字符识别装置
CN103208046A (zh) * 2012-12-31 2013-07-17 广州奥凯信息咨询有限公司 基于交互式动态流程图的工作流引擎架构方法和系统
CN107123188A (zh) * 2016-12-20 2017-09-01 北京联合众为科技发展有限公司 基于模板匹配算法和边缘特征的伤票识别与定位方法
CN108280430A (zh) * 2018-01-24 2018-07-13 陕西科技大学 一种流程图像识别方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
基于SVM的流程图像角点分类;孙连山等;《陕西科技大学学报》;20180420;第36卷(第2期);147-153 *
基于交叉点提取的工程图表图像识别系统研究;陈明星;《中国优秀博硕士学位论文全文数据库 (硕士) 信息科技辑》;20041215(第04期);I138-928 *

Also Published As

Publication number Publication date
CN109389050A (zh) 2019-02-26

Similar Documents

Publication Publication Date Title
Gao et al. ICDAR 2019 competition on table detection and recognition (cTDaR)
US10853638B2 (en) System and method for extracting structured information from image documents
CN109389050B (zh) 一种流程图连接关系识别方法
US20210365678A1 (en) Apparatus and methods for extracting data from lineless table using delaunay triangulation and excess edge removal
Pal et al. Touching numeral segmentation using water reservoir concept
Bhowmik et al. Text and non-text separation in offline document images: a survey
KR100248917B1 (ko) 패턴인식장치및방법
US20220318224A1 (en) Automated document processing for detecting, extracting, and analyzing tables and tabular data
Antonacopoulos et al. ICDAR2015 competition on recognition of documents with complex layouts-RDCL2015
US20110007366A1 (en) System and method for classifying connected groups of foreground pixels in scanned document images according to the type of marking
JP2012500428A (ja) 印刷媒体ページの記事へのセグメント化
JP6055297B2 (ja) 文字認識装置及び方法、文字認識プログラム
CN108280430B (zh) 一种流程图像识别方法
CN111460927A (zh) 对房产证图像进行结构化信息提取的方法
JP7396568B2 (ja) 帳票レイアウト解析装置、その解析プログラムおよびその解析方法
CN115240178A (zh) 一种票据图像的结构化信息提取方法及系统
Sahoo et al. Handwritten Bangla word recognition using negative refraction based shape transformation
CN111652117A (zh) 一种对多文档图像分割的方法及介质
CN114971294A (zh) 数据采集方法、装置、设备及存储介质
CN112949455B (zh) 一种增值税发票识别系统及方法
Sharma et al. Primitive feature-based optical character recognition of the Devanagari script
CN112200789A (zh) 一种图像识别的方法及装置、电子设备和存储介质
Lue et al. A novel character segmentation method for text images captured by cameras
Kamola et al. Image-based logical document structure recognition
Tran et al. A deep learning-based system for document layout analysis

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information

Inventor after: Sun Lianshan

Inventor after: Du Hanchao

Inventor after: Hou Tao

Inventor after: Li Xinyan

Inventor before: Sun Lianshan

Inventor before: Li Xinyan

Inventor before: Hou Tao

Inventor before: Du Hanchao

CB03 Change of inventor or designer information
GR01 Patent grant
GR01 Patent grant