CN108280430A - 一种流程图像识别方法 - Google Patents
一种流程图像识别方法 Download PDFInfo
- Publication number
- CN108280430A CN108280430A CN201810070349.0A CN201810070349A CN108280430A CN 108280430 A CN108280430 A CN 108280430A CN 201810070349 A CN201810070349 A CN 201810070349A CN 108280430 A CN108280430 A CN 108280430A
- Authority
- CN
- China
- Prior art keywords
- angle point
- pels
- angle
- point
- pel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/42—Document-oriented image-based pattern recognition based on the type of document
- G06V30/422—Technical drawings; Geographical maps
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
Abstract
本发明提出了一种流程图像识别方法,其技术特征在于:首先建立一个基于角点的流程图结构模型(CBSM),形式地定义用于描述流程图结构元素的各种角点类型、组合规则及约束;然后进行文图分割提取流程图结构,检测流程图结构的角点并提取角点邻域的网格特征和外围特征,采用SVM分类器实现角点分类;基于CBSM识别流程图结构;最后将流程图像识别结果以文本形式输出。本发明基于角点特征识别流程图结构元素,能够解决现有流程图像识别技术未能处理好的文图粘连及断边问题,为流程图像识别提供新方法。
Description
技术领域
本发明属于图像识别技术领域,特别涉及一种流程图像识别方法。
背景技术
现有计算机信息检索系统主要采用基于文本匹配的检索技术,但化工、 制药、机械、信息技术等领域中的文档往往还包含大量流程图像,这些图像 蕴含丰富的信息,对于检索和查新至关重要。
流程图可以直观地描述一个工作过程的具体步骤,具有重要的语义。由 于现存文档中的流程图存在文图粘连和断边等情况导致流程图像识别效率不 高,因此需要一种能够新的流程图像识别方法,解决以上问题。
发明内容
本发明的目的在于提供一种流程图像识别方法,通过基于角点特征的结 构模型来识别流程图像。本方法包括建立一个基于角点的流程图结构模型 (CBSM),然后对流程图结构进行角点检测与角点分类,依据角点组合规 则和组合约束来识别流程图结构元素。
为了实现上述目的,本发明采用的技术方案是:
一种流程图像识别方法能够基于角点特征描述和识别流程图结构,步骤包 括:
S1建立CBSM,定义角点类型、描述流程图结构元素的角点组合规则以 及角点组合约束包括:
S11将描述流程图结构元素的角点分为独立型和连接型两大类,命名各 类角点并建立流程图像角点分类表;
S12建立角点组合规则;
S13建立角点组合约束。
S2提取流程图像结构;
对原始流程图像进行二值化、降噪处理,通过图文分割提取原始流程图像 中的结构图层,对提取的流程图结构进行单像素化。
S3对流程图结构进行角点检测和筛选,步骤为:
S31通过CSS算法利用曲率检测出与直线型元素相关的角点,过滤掉曲线 型结构元素上的圆角点和虚假角点。
不同尺度σ下的曲率计算公式为:
其中t是弧长参数,σ是尺度参数,分别为曲线l上一点的坐标x(t)和y(t)与一维 高斯核函数g(μ,σ)的一阶导数和二阶导数的卷积;
圆角点判定方法为:
其中u为候选角点的位置参数,K(u)是候选角点 的曲率,T(u)为与角点支持域自适应的动态局部阈值,与候选角点u处的局部 平均曲率成正比,当Rc=1时表示角点为圆角点,给予滤除。
其中Cc为需要判定的候选角点, ∠Cc为角点Cc的角,θobtuse为真角点的最大钝角值,θobtuse的经验取值为 162°,当Cc>θobtuse时,Cc为虚假角点。
S32通过Harris算法检测与曲线型元素相关的角点,首先求输入图像I对 应的x和y轴方向的一阶偏导Ix和Iy,利用高斯核Gx,y对其平滑,并构造自相 关矩阵M,其中,是卷积算子, σ是高斯平滑尺度。通过自相关矩阵的特征值α、β(α≥β)来构造角点响应R 并判决角点,R=αβ-k(α+β)2,其中,k(k=0.04)是错误角点响应抑制常数。
S33采用距离筛选法对检测出的冗余角点进行筛选。计算指定范围内所有 点之间的欧式距离,在欧几里得空间中,如点x=(x1,…,xn)和y=(y1,…,yn) 之间的距离为:
当角点间的距离小于指定阈值时,可删掉其中之一以减少冗余。
S4得到步骤S3中角点的邻域特征并进行角点分类器的训练,对流程图中 角点进行分类:
S41以检测到的每个角点为中心截取41×41像素的角点邻域图像,提取角 点邻域图像的网格特征和外围特征并将角点样本分类标注;
S42使用支持向量机SVM分类器训练样本集,采用径向基核函数(Radial BasisFunction,RBF)作为SVM分类核函数;利用MATLAB中的LIBSVM工具 箱来实现SVM多分类,引入惩罚因子c对其进行惩罚,通过参数调优设置惩 罚因子c,使得数据在高维特征空间中的线性可分度最大。
S43采用K-折交叉验证(K-fold Cross Validation,K-CV)将原始数据分成均 分为K组,将每个子集数据分别做一次验证集,其余的K-1组子集数据作为训 练集,用这K个模型最终验证集的分类准确率的平均数作为此K-CV下分类器 的性能指标。
S5采用基于CBSM结构元素识别算法对流程图像图元识别,步骤为:
S51按照起始角点选择的优先级,在流程图中查找第一个未标注所属图 元编号且未处理的角点作为起始角点,并将其标注为已处理角点;
起始角点的选择包括:R-1,El-1,D*-1,R-2,Er-1,D*-3以及D*-4。
起始角点的优先级为:
不同类型间优先级:R-1=El-1=D*-1>R-2=Er-1=D*-3=D*-4;
优先级相同时:按照从上到下,从左到右的位置顺序选择起始角点。
S52从起始角点出发,按照CBSM中的角点组合规则,寻找可能构成图 元的角点组合,若未找到满足条件的角点组合则返回S51;
S53验证所获角点组合是否满足CBSM中给定的角点组合约束,若满足 则在识别结果中添加新图元并对其进行编号,标注与相关角点的所属图元编 号,若不满足返回S52;
S54采用OCR(Optical Character Recognition)技术识别图元对应位置处 的文本信息,生成流程图的文本描述;
S55检测未标注的角点集合是否可能构成新图元,若可能构成新图元则 返回S51。
与现有技术相比,本发明采用基于角点特征的结构模型的流程图像识别 方法,对流程图结构元素提供了基于角点的新的定义方式,可以有效解决文 图粘连和断边对专利流程图识别的影响,对整体流程图的识别快速有效。
附图说明
图1是本发明的流程示意图。
图2是本发明流程S3示意图。
图3是本发明流程S5示意图。
图4是本发明实验获取到的36种角点示意图。
图5是本发明流程S6示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面结合实施例、附图对 本发明作进一步描述。显然,所描述的实施例仅仅是本发明一部分实施例,而 不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出 创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本发明的识别方法的步骤包括:
S1建立一个基于角点的流程图结构模型(CBSM),定义描述流程图结 构元素的角点组合规则以及角点组合约束;
S2提取流程图结构;
S3对流程图结构进行角点检测和筛选;
S4得到步骤S3中角点的邻域特征并进行角点分类器的训练,对角点进 行分类;
S5基于CBSM对流程图结构元素进行识别;
S6文本识别以及结构描述生成。
其中步骤S1包括:
S11将流程图结构元素分为两大类,命名各个独立型角点和连接型角点, 建立如表1所示流程图像角点分类表,表1中上半部分为独立型角点,表1下 半部分为连接型角点;
表1流程图像角点分类
S12根据图元与角点组合之间的关系,建立组合规则。
将基本图元的角点组合规则定义为三类关系:角点组合关系,角点间相 对位置关系,角点的几何关系。通过角点组合判断得到结构图元的识别结果。
角点组合关系定义为确定类型角点的并集。
角点间相对位置关系的定义为:假设Ci,Cj(i≠j)表示两个不同类型的角 点,x(Ci)表示角点Ci横坐标,y(Ci)表示角点Ci纵坐标。定义角点Cj相对于 角点Ci的相对位置可以有8种表示,分别为左上(ul),左(l),左下 (dl),下(d),右下(dr),右(r),右上(ur),上(u),每种位置 关系对应一个判定表达式。
例如,r(Ci,Cj)表示Cj在Ci的右方位置,满足x(Ci)<x(Cj);d(Ci,Cj) 表示Cj在Ci下方位置,满足y(Ci)<y(Cj);dl(Ci,Cj)表示Cj在Ci的左下方位 置,满足(x(Ci)>x(Cj))∧(y(Ci)<y(Cj))。其中,r(Ci,Cj)等价于l(Cj,Ci), d(Ci,Cj)等价于u(Cj,Ci),dr(Ci,Cj)等价于ul(Cj,Ci),dl(Ci,Cj)等价于 ur(Cj,Ci),d(Ci,Cj)等价于u(Cj,Ci),r(Ci,Cj)等价于l(Cj,Ci)。
在流程图结构元素中,角点间几何关系定义为水平关系(H)或者垂直 (V)关系。H(Ci,Cj)表示Ci与Cj处于同一条水平线上,满足y(Ci)=y(Cj); V(Ci,Cj)表示Ci与Cj处于同一条垂直线上,满足x(Ci)=y(Cj)。其中,H(Ci, Cj)等价于H(Cj,Ci),V(Ci,Cj)等价于V(Cj,Ci)。
R图元的角点组合表示为R-1∧R-2∧R-3∧R-4。
R图元的角点相对位置表示如下:
r(R-1,R-2)∧d(R-1,R-3)∧dr(R-1,R-4)∧dl(R-2,R-3)∧d(R-2, R-4)∧r(R-3,R-4)
R图元的角点间几何关系表示如下:
H(R-1,R-2)∧V(R-1,R-3)∧H(R-3,R-4)∧V(R-2,R-4)
E图元的角点组合表示为El-1∧El-2∧Er-1∧Er-2。
E图元的角点之间相对位置表示如下:
r(El-1,Er-1)∧d(El-1,El-2)∧dr(El-1,Er-2)∧dl(Er-1,El-2)∧d (Er-1,Er-2)∧r(El-2,Er-2)
E图元的角点间几何关系表示如下:
H(El-1,Er-1)∧V(El-1,El-2)∧H(El-2,Er-2)∧V(Er-1,Er-2)
D图元的角点组合表示为D*-1∧D*-2∧D*-3∧D*-4,D*-表示D-型 (独立型)角点或Db-型(连接型)角点。
D图元的角点相对位置表示如下:
d(D*-1,D*-2)∧dl(D*-1,D*-3)∧dr(D*-1,D*-4)∧ul(D*-2,D*-3) ∧ur(D*-2,D*-4)∧r(D*-3,D*-4)
D图元的角点间几何关系表示如下:
H(D*-3,D*-4)∧V(D*-1,D*-2)
定义描述流程图结构元素的角点组合所满足的约束,具体包括角点类型 和数量约束、角点间的几何约束以及角点组合构成的图元的宽高约束。分别 定义如下。
各图元的角点组合中角点类型和数量的约束如下:
角点组合中的角点间几何约束指的是两个角点在一定像素范围内呈水平 关系(H)或者垂直关系(V)。分别定义为:H(Ci,Cj)::|y(Ci)–y(Cj)|<d, V(Ci,Cj)::|x(Ci)–y(Cj)|<d,d为修正在角点检测过程中出现的位置偏差所 设置的松弛因子,经验取值为5px。
角点组合所构成图元的宽和高约束如下所述,若流程图像的整体宽和高 分别为W,H,Rwidth表示R图元的宽,Rheight表示R图元的高,则:
R图元:
Ewidth表示E图元的宽,Eheight表示E图元的高,则:
E图元:
Dwidth表示D图元的宽,Dheight表示D图元的高,则:
D图元:
其中步骤S5包括:
S51按照起始角点选择的优先级,在流程图中查找第一个未标注所属图 元编号且未处理的角点作为起始角点,并将其标注为已处理角点;
起始角点的选择包括:R-1,El-1,D*-1,R-2,Er-1,D*-3以及D*-4。
起始角点的优先级为:
不同类型间优先级:R-1=El-1=D*-1>R-2=Er-1=D*-3=D*-4;
优先级相同时:按照从上到下,从左到右的位置顺序选择起始角点。
S52从起始角点出发,按照CBSM中的角点组合规则,寻找可能构成图 元的角点组合,若未找到满足条件的角点组合则返回S51;
S53验证所获角点组合是否满足CBSM中给定的角点组合约束,若满足 则在识别结果中添加新图元并对其进行编号,标注与相关角点的所属图元编 号,若不满足返回S52;
S54采用OCR(Optical Character Recognition)技术识别图元对应位置处 的文本信息,生成流程图的文本描述;
S55检测未标注的角点集合是否可能构成新图元,若可能构成新图元则 返回S51。
图2中空心角点为对流程图像进行检测得到的直线型角点;实心角点为对 流程图像进行检测并经过距离筛选得到的曲线型角点;其中右下方矩形由于文 字超出形成断边情况,断边处的角点同样被识别。
图3是采用本发明使用从CLEP-IP 2012公开数据集中获取的50张流程图 和从网络爬取的50张流程图共100张作为实验对象,对专利流程图中角点进行 分类标注后获取到的角点种类,其中上部分对应表1中所定义的流程图像中20 种角点,下部分为是实际情况中出现其他角点种类。
采用本发明,从实验流程图中截取2600张角点作为角点样本,采用 LIBSVM进行角点的多分类,对于SVM参数的优化,本实验选择网络搜索优 化方式,利用LIBSVM中grid.py参数工具,可以自动进行参数寻优,最终得 到最佳参数。
利用参数工具得到的c,g值在SVM中建模,对角点类型进行预测。将实 验数据集均分为5组,每组角点520张。各类角点识别率统计如表3所示,实 验中可分为8类角点,N代表每一类角点的个数,P为角点的查准率,R为查 全率。根据每一组训练集来进行测试集角点类型的检测,并计算查全率和查准 率以及每一角点类型的平均值。从实验结果总结分析,对测试集角点分类结果 较理想,对5组中8类角点的实验结果求均值得到查准率为89.1%,查全率为 91.6%。
表3各组角点分类结果
图4为流程图中被识别的基本图元,如图的实施例中,流程图基本图元矩 形、菱形、圆角矩形均被识别;对于右下角出现断边情况的矩形也被准确识别。 将实验所得流程图的文本结果和CLEP-IP 2012公开数据集中提供的ground truth进行对比验证。在分类过程中,根据图元本身类型(真/假)以及识别结果 (真/假),可能出现以下几种情况:本身是真,识别结果也为真(TP);本 身是真,识别结果为假(FN);本身是假,识别结果为真(FP)。统计E、D、 R图元的数量、误识别率、查全率(R)以及查准率(P),如表4所示。
表4图元识别率统计
图5是实施例流程图最终识别结果的形式描述。
Claims (8)
1.一种流程图像识别方法,其特征在于,包括如下步骤:
S1建立一个基于角点的流程图结构模型(CBSM),定义描述流程图结构元素的角点类型、角点组合规则以及角点组合约束;
S2提取流程图结构;
S3对流程图结构进行角点检测和筛选;
S4得到步骤S3中角点的邻域特征并训练角点分类器,对角点进行分类;
S5基于CBSM对流程图结构元素进行识别;
S6文本识别以及结构描述生成。
2.根据权利要求1所述流程图像识别方法,其特征在于,所述步骤S1中建立CBSM,定义描述流程图结构元素的角点类型、角点组合规则以及角点组合约束包括:
S11将描述流程图结构元素的角点分为独立型和连接型两大类,命名各角点类型并建立流程图像角点分类表;
S12建立角点组合规则;
S13建立角点组合约束。
3.根据权利要求2所述流程图像识别方法,其特征在于,所述步骤S11中,经典图元包括矩形、菱形和椭圆形,定义矩形为R图元,菱形为D图元,椭圆形为E图元,则描述经典图元的角点及其命名规则如下:
将仅属于单个图元或连接线的角点定义为独立型角点,其中对R图元的四个角点和折线的角点,分别命名为:
┌:R-1、┐:R-2、└:R-3、┘:R-4;
将位于图元与连接线或连接线与连接线相接处的角点定义为连接型角点,其中对R图元和连接线相接处以及连接线与连接线相接处的角点,分别命名为:
┴:Rb-1、┬:Rb-2、┤:Rb-3、├:Rb-4;
将E图元的独立型角点根据位置分别命名为:
El-1、Er-1、El-2、Er-2;
将组成E图元的连接型角点分别命名为:
┴:Rb-1、┬:Rb-2;
将D图元的独立型角点按照上下左右的顺序依次命名为D-1、D-2、D-3、D-4;
将D图元的连接型角点按照上下左右的顺序依次命名为Db-1、Db-2、Db-3、Db-4;
所述步骤S12中,根据图元几何关系和角点相对位置关系,定义组合规则如下:
角点相对位置关系:以Ci,Cj(i≠j)表示两个不同角点,x(Ci)表示角点Ci横坐标,y(Ci)表示角点Ci纵坐标,角点Cj相对于角点Ci的位置关系有8种,分别为左上、左、左下、下、右下、右、右上、上,依次分别表示为ul、l、dl、d、dr、r、ur、u,每种位置关系对应一个判定表达式;
以r(Ci,Cj)表示Cj在Ci的右方位置,满足x(Ci)<x(Cj);d(Ci,Cj)表示Cj在Ci下方位置,满足y(Ci)<y(Cj);dl(Ci,Cj)表示Cj在Ci的左下方位置,满足(x(Ci)>x(Cj))∧(y(Ci)<y(Cj));其中,r(Ci,Cj)等价于l(Cj,Ci),d(Ci,Cj)等价于u(Cj,Ci),dr(Ci,Cj)等价于ul(Cj,Ci),dl(Ci,Cj)等价于ur(Cj,Ci),d(Ci,Cj)等价于u(Cj,Ci),r(Ci,Cj)等价于l(Cj,Ci);
在流程图结构元素中,角点间几何关系描述为水平关系H或者垂直关系V,H(Ci,Cj)表示Ci与Cj处于同一条水平线上,满足y(Ci)=y(Cj);V(Ci,Cj)表示Ci与Cj处于同一条垂直线上,满足x(Ci)=y(Cj);其中,H(Ci,Cj)等价于H(Cj,Ci),V(Ci,Cj)等价于V(Cj,Ci);
R图元的角点组合为R-1∧R-2∧R-3∧R-4;
R图元的角点相对位置关系表示如下:
r(R-1,R-2)∧d(R-1,R-3)∧dr(R-1,R-4)∧dl(R-2,R-3)∧d(R- 2,R-4)∧r(R-3,R-4);
R图元的角点间几何关系表示如下:
H(R-1,R-2)∧V(R-1,R-3)∧H(R-3,R-4)∧V(R-2,R-4);
E图元的角点组合表示为El-1∧El-2∧Er-1∧Er-2;
E图元的角点之间相对位置表示如下:
r(El-1,Er-1)∧d(El-1,El-2)∧dr(El-1,Er-2)∧dl(Er-1,El-2)∧d(Er-1,Er-2)∧r(El-2,Er-2);
E图元的角点间几何关系表示如下:
H(El-1,Er-1)∧V(El-1,El-2)∧H(El-2,Er-2)∧V(Er-1,Er-2);
D图元的角点组合表示为D*-1∧D*-2∧D*-3∧D*-4,D*-表示D-型角点或Db-型角点,D-型角点为独立型角点,Db-型角点为连接型角点;
D图元的角点相对位置关系表示如下:
d(D*-1,D*-2)∧dl(D*-1,D*-3)∧dr(D*-1,D*-4)∧ul(D*-2,D*-3)∧ur(D*-2,D*-4)∧r(D*-3,D*-4);
D图元的角点间几何关系表示如下:H(D*-3,D*-4)∧V(D*-1,D*-2);
所述步骤S13中,定义描述流程图结构元素的角点组合所满足的约束,具体包括角点类型和数量约束、角点间的几何约束以及由角点组合所确定的图元的宽高约束,分别定义如下:
各图元的角点组合中角点类型和数量的约束如下:
角点组合中的角点间几何约束指的是两个角点在一定像素范围内呈水平关系H或者垂直关系V,分别定义为:H(Ci,Cj)::|y(Ci)–y(Cj)|<d,V(Ci,Cj)::|x(Ci)–y(Cj)|<d,d为修正在角点检测过程中出现的位置偏差所设置的松弛因子,经验取值为5px;
角点组合所构成图元的宽和高约束如下所述,若流程图像的整体宽和高分别为W,H,Rwidth表示R图元的宽,Rheight表示R图元的高,则:
R图元:
Ewidth表示E图元的宽,Eheight表示E图元的高,则:
E图元:
Dwidth表示D图元的宽,Dheight表示D图元的高,则:
D图元:
4.根据权利要求1所述流程图像识别方法,其特征在于,所述步骤S2中提取流程图结构的方法:
对原始流程图像进行二值化、降噪处理,通过连通域提取方法进行图文分割得到原始流程图像中结构层,对提取的流程图结构进行单像素化处理。
5.根据权利要求1所述流程图像识别方法,其特征在于,所述步骤S3中对流程图结构进行角点检测和筛选的步骤为:
S31采用曲率尺度空间(Curvature Scale Space,CSS)算法利用曲率检测出与直线型元素相关的角点,过滤掉曲线型结构元素上的圆角点和虚假角点;
S32对采用CSS算法检测得到的角点进行边界搜索并剪裁掉边界包围的区域,得到曲线型结构元素所在的区域,然后采用Harris角点检测算法对该区域进行再次检测,得到曲线型结构元素上的角点;
S33在检测过程中,曲线上容易产生角点聚簇现象,采用基于欧式距离的冗余角点筛选方法,计算所有点之间的欧式距离,当角点间的距离小于指定阈值时,删掉其中之一以减少冗余。
6.根据权利要求5所述流程图像识别方法,其特征在于,所述步骤S31中,直线型元素包括矩形、菱形和直线连接线,其边缘轮廓局部曲率变化明显;曲线型元素多指圆、椭圆和曲线连接线,其边缘轮廓局部曲率变化不明显;采用CSS算法在同一尺度不同曲率下对流程图结构进行角点检测,可以得到直线型结构元素上的绝大多数角点、曲线型结构元素上的部分角点以及部分虚假角点,将曲线型结构元素上的角点视为圆角点并同虚假角点一起过滤掉,圆角点及虚假角点的判定方法如下:
其中u为候选角点的位置参数,K(u)是候选角点的曲率,T(u)为与角点支持域自适应的动态局部阈值,与候选角点处的局部平均曲率成正比,当Rc=1时表示角点为圆角点,给予滤除;
其中Cc为需要判定的候选角点,∠Cc为角点Cc的角,θobtuse为真角点的最大钝角值,θobtuse的经验取值为162°,当Cc>θobtuse时,Cc为虚假角点。
7.根据权利要求1所述流程图像识别方法,其特征在于,所述步骤S4具体步骤如下:
S41以检测到的每个角点为中心截取41×41像素的角点邻域图像,形成角点样本集合,根据CBSM模型对部分角点样本进行人工分类标注,构造训练样本集和测试样本集;
S42提取角点邻域图像的网格特征和外围特征共128维特征,构造具有径向基核函数(Radial Basis Function,RBF)的SVM分类器,使用训练样本集对其进行训练并通过K折交叉验证选择最优SVM分类器参数。
8.根据权利要求1所述流程图像识别方法,其特征在于,所述步骤S5流程图像识别分别如下:
S51按照起始角点选择的优先级,在流程图中查找第一个未标注所属图元编号且未处理的角点作为起始角点,并将其标注为已处理角点;
起始角点的选择包括:R-1,El-1,D*-1,R-2,Er-1,D*-3以及D*-4;
起始角点的优先级为:
不同类型间优先级:R-1=El-1=D*-1>R-2=Er-1=D*-3=D*-4;
优先级相同时:按照从上到下,从左到右的位置顺序选择起始角点;
S52从起始角点出发,按照CBSM中的角点组合规则,寻找可能构成图元的角点组合,若未找到满足条件的角点组合则返回S51;
S53验证所获角点组合是否满足CBSM中给定的角点组合约束,若满足则在识别结果中添加新图元并对其进行编号,标注与相关角点的所属图元编号,若不满足返回S52;
S54采用OCR(Optical Character Recognition)技术识别图元对应位置处的文本信息,生成流程图的文本描述;
S55检测未标注的角点集合是否可能构成新图元,若可能构成新图元则返回S51。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810070349.0A CN108280430B (zh) | 2018-01-24 | 2018-01-24 | 一种流程图像识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810070349.0A CN108280430B (zh) | 2018-01-24 | 2018-01-24 | 一种流程图像识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108280430A true CN108280430A (zh) | 2018-07-13 |
CN108280430B CN108280430B (zh) | 2021-07-06 |
Family
ID=62805122
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810070349.0A Active CN108280430B (zh) | 2018-01-24 | 2018-01-24 | 一种流程图像识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108280430B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109389050A (zh) * | 2018-09-19 | 2019-02-26 | 陕西科技大学 | 一种流程图连接关系识别方法 |
CN110838105A (zh) * | 2019-10-30 | 2020-02-25 | 南京大学 | 一种业务流程模型图像识别与再构方法 |
WO2021068987A1 (en) * | 2019-10-09 | 2021-04-15 | Elsevier, Inc. | Systems, methods and computer program products for automatically extracting information from a flowchart image |
CN113554012A (zh) * | 2021-09-22 | 2021-10-26 | 江西博微新技术有限公司 | 三维工程中图元模型分类方法、系统、设备及存储介质 |
CN116310765A (zh) * | 2023-05-23 | 2023-06-23 | 华雁智能科技(集团)股份有限公司 | 一种电气接线图图元识别方法 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0355748A2 (en) * | 1988-08-20 | 1990-02-28 | Fujitsu Limited | A pattern recognition apparatus and method for doing the same |
CN101901354A (zh) * | 2010-07-09 | 2010-12-01 | 浙江大学 | 基于特征点分类的监控录像中实时多目标检测与跟踪方法 |
CN103440261A (zh) * | 2013-07-31 | 2013-12-11 | 东莞中山大学研究院 | 基于内容和结构的生物医疗流程图检索的系统及方法 |
CN106056649A (zh) * | 2016-05-31 | 2016-10-26 | 深圳市永兴元科技有限公司 | 流程图的生成方法和装置 |
CN106570888A (zh) * | 2016-11-10 | 2017-04-19 | 河海大学 | 一种基于fast角点和金字塔klt的目标跟踪方法 |
CN106682678A (zh) * | 2016-06-24 | 2017-05-17 | 西安电子科技大学 | 一种基于支撑域的图像角点检测和分类方法 |
CN107122783A (zh) * | 2017-04-19 | 2017-09-01 | 华南理工大学 | 一种基于角点检测的装配连接件快速识别方法 |
US20180005028A1 (en) * | 2016-06-29 | 2018-01-04 | Konica Minolta Laboratory U.S.A., Inc. | Method for recognizing table and flowchart in document images |
-
2018
- 2018-01-24 CN CN201810070349.0A patent/CN108280430B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0355748A2 (en) * | 1988-08-20 | 1990-02-28 | Fujitsu Limited | A pattern recognition apparatus and method for doing the same |
CN101901354A (zh) * | 2010-07-09 | 2010-12-01 | 浙江大学 | 基于特征点分类的监控录像中实时多目标检测与跟踪方法 |
CN103440261A (zh) * | 2013-07-31 | 2013-12-11 | 东莞中山大学研究院 | 基于内容和结构的生物医疗流程图检索的系统及方法 |
CN106056649A (zh) * | 2016-05-31 | 2016-10-26 | 深圳市永兴元科技有限公司 | 流程图的生成方法和装置 |
CN106682678A (zh) * | 2016-06-24 | 2017-05-17 | 西安电子科技大学 | 一种基于支撑域的图像角点检测和分类方法 |
US20180005028A1 (en) * | 2016-06-29 | 2018-01-04 | Konica Minolta Laboratory U.S.A., Inc. | Method for recognizing table and flowchart in document images |
CN106570888A (zh) * | 2016-11-10 | 2017-04-19 | 河海大学 | 一种基于fast角点和金字塔klt的目标跟踪方法 |
CN107122783A (zh) * | 2017-04-19 | 2017-09-01 | 华南理工大学 | 一种基于角点检测的装配连接件快速识别方法 |
Non-Patent Citations (4)
Title |
---|
CARLOS FILIPE PAULO等: "Automatic Detection and Classification of Traffic Signs", 《EIGHTH INTERNATIONAL WORKSHOP ON IMAGE ANALYSIS FOR MULTIMEDIA INTERACTIVE SERVICES (WIAMIS "07)》 * |
HIDETOSHI MIYAO 等: "On-Line Handwritten flowchart Recognition, Beautification and Editing System", 《2012 INTERNATIONAL CONFERENCE ON FRONTIERS IN HANDWRITING RECOGNITION》 * |
诸彬 等: "基于草图的程序流程图自动识别翻译系统", 《计算机应用与软件》 * |
陈霄阁: "几何图形识别与测量图像技术研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109389050A (zh) * | 2018-09-19 | 2019-02-26 | 陕西科技大学 | 一种流程图连接关系识别方法 |
CN109389050B (zh) * | 2018-09-19 | 2021-11-09 | 陕西科技大学 | 一种流程图连接关系识别方法 |
WO2021068987A1 (en) * | 2019-10-09 | 2021-04-15 | Elsevier, Inc. | Systems, methods and computer program products for automatically extracting information from a flowchart image |
US11151372B2 (en) | 2019-10-09 | 2021-10-19 | Elsevier, Inc. | Systems, methods and computer program products for automatically extracting information from a flowchart image |
US11704922B2 (en) | 2019-10-09 | 2023-07-18 | Elsevier, Inc. | Systems, methods and computer program products for automatically extracting information from a flowchart image |
CN110838105A (zh) * | 2019-10-30 | 2020-02-25 | 南京大学 | 一种业务流程模型图像识别与再构方法 |
CN113554012A (zh) * | 2021-09-22 | 2021-10-26 | 江西博微新技术有限公司 | 三维工程中图元模型分类方法、系统、设备及存储介质 |
CN116310765A (zh) * | 2023-05-23 | 2023-06-23 | 华雁智能科技(集团)股份有限公司 | 一种电气接线图图元识别方法 |
CN116310765B (zh) * | 2023-05-23 | 2023-09-01 | 华雁智能科技(集团)股份有限公司 | 一种电气接线图图元识别方法 |
Also Published As
Publication number | Publication date |
---|---|
CN108280430B (zh) | 2021-07-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108280430A (zh) | 一种流程图像识别方法 | |
US9824294B2 (en) | Saliency information acquisition device and saliency information acquisition method | |
CN103824053B (zh) | 一种人脸图像的性别标注方法及人脸性别检测方法 | |
TWI281126B (en) | Image detection method based on region | |
CN109214360A (zh) | 一种基于ParaSoftMax损失函数的人脸识别模型的构建方法及应用 | |
CN109784166A (zh) | 行人重识别的方法及装置 | |
CN110163114A (zh) | 一种人脸角度及人脸模糊度分析方法、系统和计算机设备 | |
JP4745207B2 (ja) | 顔特徴点検出装置及びその方法 | |
US20070058856A1 (en) | Character recoginition in video data | |
CN108268838A (zh) | 人脸表情识别方法及人脸表情识别系统 | |
CN103473545B (zh) | 一种基于多特征的文本图像相似度度量方法 | |
CN101681432A (zh) | 图片文档分割方法和系统 | |
WO1994027251A1 (en) | Automated reading system and method | |
CN106971130A (zh) | 一种以人脸为参照的手势识别方法 | |
CN110069989B (zh) | 人脸图像处理方法及装置、计算机可读存储介质 | |
CN109859164A (zh) | 一种通过快速型卷积神经网络对pcba外观检验的方法 | |
CN106022223B (zh) | 一种高维局部二值模式人脸识别方法及系统 | |
CN110263731B (zh) | 一种单步人脸检测系统 | |
Salvi et al. | Handwritten text segmentation using average longest path algorithm | |
JP2016099835A (ja) | 画像処理装置、画像処理方法、及びプログラム | |
CN109389050A (zh) | 一种流程图连接关系识别方法 | |
CN111444817B (zh) | 一种人物图像识别方法、装置、电子设备和存储介质 | |
US9135562B2 (en) | Method for gender verification of individuals based on multimodal data analysis utilizing an individual's expression prompted by a greeting | |
CN111339932A (zh) | 一种掌纹图像预处理方法和系统 | |
Cao et al. | Automatic latent value determination |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |