CN111310579A - 一种图像骨架节点特征描述符获取方法及装置 - Google Patents

一种图像骨架节点特征描述符获取方法及装置 Download PDF

Info

Publication number
CN111310579A
CN111310579A CN202010057374.2A CN202010057374A CN111310579A CN 111310579 A CN111310579 A CN 111310579A CN 202010057374 A CN202010057374 A CN 202010057374A CN 111310579 A CN111310579 A CN 111310579A
Authority
CN
China
Prior art keywords
skeleton
line
point
line segment
skeleton line
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010057374.2A
Other languages
English (en)
Other versions
CN111310579B (zh
Inventor
徐庆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Foshan Guofang Identification Technology Co Ltd
Original Assignee
Foshan Guofang Identification Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Foshan Guofang Identification Technology Co Ltd filed Critical Foshan Guofang Identification Technology Co Ltd
Priority to CN202010057374.2A priority Critical patent/CN111310579B/zh
Publication of CN111310579A publication Critical patent/CN111310579A/zh
Application granted granted Critical
Publication of CN111310579B publication Critical patent/CN111310579B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/34Smoothing or thinning of the pattern; Morphological operations; Skeletonisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/478Contour-based spectral representations or scale-space representations, e.g. by Fourier analysis, wavelet analysis or curvature scale-space [CSS]
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供了一种图像骨架节点特征描述符获取方法及装置。其中方法包括步骤S1,提取输入图像的骨架线,获得主要色块骨架线像素点和次要色块骨架线像素点;S2,提取骨架线的笔画线段的笔画线型;S3,确定骨架线的笔画线段的节点数据,节点包括:端点、折点;S4,对节点数据进行编码,按照预设的节点排列顺序规则对节点编码进行排序组合,将排序组合的结果作为图像骨架节点特征描述符。装置包括获取模块、提取模块、确定模块、生成模块。该方法及装置可有效克服使用传统方法提取图像骨架线易导致相同或近似的图像的图像共同性特征描述错误、文字图像骨架线笔划与文字本身的笔划不对应、相同文字图像检索时造成图像骨架特征匹配困难的问题。

Description

一种图像骨架节点特征描述符获取方法及装置
技术领域
本发明涉及图像识别领域,特别涉及一种图像骨架节点特征描述符获取方法及装置。
背景技术
图像骨架是对物体形状特征的一种简化描述方式,正确获得图像骨架特征在图像识别技术应用方面具有重要意义。简洁准确的图像骨架能够突出图像所描述的物体的整体结构,反映物体的形状构成信息,因而在数字图像分析中具有重要的地位,图像骨架提取是进行图像识别、线条类图像目标分析的重要手段。
骨架线现有的提取方法有很多,但主要有迭代和非迭代两大类。在迭代算法中,又分为并行迭代和顺序迭代两种。这两种方法都是对二值图像操作的,基本思想都是从目标外围往目标中心,利用以待检测像素为中心3*3像素窗口的特征,对目标不断腐蚀细化,直至腐蚀到不能再腐蚀(单层像素宽度),就得到了图像的骨架。
虽然图像骨架可以有效描述图像的稳定特征,消除多种因素造成的图像轮廓失真影响,但明显存在如下局限或缺陷:
1)、在文字类图像的骨架提取时,同一文字不同的字体所提取出的骨架线存在差异,以使相同文字的图像骨架特征不同,在相同文字图像检索时造成图像骨架特征匹配困难。
2)、传统方法提取的文字图像骨架线笔划与文字本身的笔划不对应,导致骨架线失真。
3)、使用传统方法提取图像骨架线,即使视觉认为相同或近似的图像,也很难使图像骨架线重合,导致相同或近似的图像的图像共同性特征描述错误。
发明内容
鉴于上述现有技术的不足之处,本发明的目的在于提供一种图像骨架节点特征描述符获取方法及装置。
为了达到上述目的,本发明采取了以下技术方案:
一种图像骨架节点特征描述符获取方法,包括步骤:
S1,提取输入图像的骨架线,获得主要色块骨架线像素点和次要色块骨架线像素点;
S2,提取骨架线的笔画线段的笔画线型;
S3,确定骨架线的笔画线段的节点数据,节点包括:端点、折点;
S4,对节点数据进行编码,按照预设的节点排列顺序规则对节点编码进行排序组合,将排序组合的结果作为图像骨架节点特征描述符。
所述的图像骨架节点特征描述符获取方法中,步骤S1包括步骤:
S11,提取输入图像色块连通域多方向色段线和轮廓线;
S12,在方向对上提取色块连通域色段线的中点,将色段线的中点连线中较长的线段作为色块骨架线;
S13, 提取色块骨架线的线长、端点、交折点和小值中轮线,对输入图像的类型进行识别;
S14,对色块骨架线上的像素点进行分类,获取主要色块骨架线像素点和次要色块骨架线像素点,将主要色块骨架线像素点的集合作为文字图像的骨架线,将主要和次要色块骨架线像素点的集合作为非文字图像的骨架线。
所述的图像骨架节点特征描述符获取方法中,步骤S2包括步骤:
S201,对骨架线进行定位处理,获取正位后图像骨架线;
S202,对骨架线进行笔画线段划分;
S203,确定笔画线段的标准偏差;
S204,对骨架线的笔画线段进行笔画线型划分,获取该笔画线段的笔画线型。
所述的图像骨架节点特征描述符获取方法中,步骤S201中,对骨架线进行定位处理的方法包括:旋转修正后图像骨架线,获取各种角度下修正后图像骨架线的有效区域大小尺寸,选择旋转角度最小且有效区域大小尺寸为最小状态时的图像骨架线作为正位后图像骨架线,其中,所述的图像骨架线的有效区域是指由图像骨架线的外接矩形所围成的内部区域。
所述的图像骨架节点特征描述符获取方法中,步骤S202中,对骨架线进行笔画线段划分的方法包括:根据步骤S13得到的色块骨架线的端点、交折点,将每一端点与其相邻的端点或交折点的色块骨架线的像素点连线划分为笔画线段。
所述的图像骨架节点特征描述符获取方法中,步骤S203中,所述笔画线段的标准偏差包括骨架线的笔画线段的像素点的x坐标值的标准偏差和y坐标值的标准偏差,确定笔画线段的标准偏差的方法包括:
按下式计算正位后图像骨架线上每骨架线的笔画线段像素点的x坐标值的标准偏差和y坐标值的标准偏差:
Figure 100002_DEST_PATH_IMAGE001
Figure 669888DEST_PATH_IMAGE002
其中,
Figure 100002_DEST_PATH_IMAGE003
表示骨架线线段像素点的x坐标值的标准偏差,
Figure 446083DEST_PATH_IMAGE004
表示骨架线线段像素点的y坐标值的标准偏差,xi表示骨架线线段上第i个像素点的x坐标值,yi表示骨架线线段上第i个像素点的y坐标值,n表示骨架线线段上全部像素点的个数,
Figure 100002_DEST_PATH_IMAGE005
表示骨架线线段全部像素点的平均x坐标值,
Figure 756978DEST_PATH_IMAGE006
表示骨架线线段全部像素点的平均y坐标值。
所述的图像骨架节点特征描述符获取方法中,步骤S204中,按如下规则对骨架线的笔画线段进行笔画线型划分,获取该笔画线段的笔画线型:
1)当骨架线线段上像素点的y坐标值的标准偏差小于或等于预设的第一标准偏差阈值时,该正位后图像骨架线线段的笔画线型确认为横骨架线线段;
2)当骨架线线段上像素点的x坐标值的标准偏差小于或等于预设的第二标准偏差阈值时,该正位后图像骨架线线段的笔画线型确认为竖骨架线线段;
3)当骨架线线段上像素点的x坐标值的标准偏差大于预设的第二标准偏差阈值,或当骨架线线段上像素点的y坐标值的标准偏差大于预设的第一标准偏差阈值标准偏差阈值时,若该骨架线线段的端点的y轴坐标最大值的像素点处在该线段右侧,则将该骨架线线段的笔画线型确认为撇骨架线线段;
4)当骨架线线段上像素点的x坐标值的标准偏差大于预设的第二标准偏差阈值,或当骨架线线段上像素点的y坐标值的标准偏差大于预设的第一标准偏差阈值时,若该骨架线线段的端点的y轴坐标最大值的像素点处在该线段左侧,则将该骨架线线段的笔画线型确认为捺骨架线线段。
所述的图像骨架节点特征描述符获取方法中,步骤S3中,按预设的确认规则对节点进行分类;把端点分为横起点、横止点、竖起点、竖止点、撇起点、撇止点、捺起点或捺止点;把折点分为横竖交点、横撇交点、横捺交点、竖撇交点、竖捺交点、撇捺交点或多线交点。
所述的图像骨架节点特征描述符获取方法中,所述预设的确认规则包括:
1)将笔画线型为横骨架线线段上x坐标值最小的像素点确认为该横骨架线线段的起始端点,当在横骨架线线段上的像素点仅为该横骨架线线段的起始端点且与其他骨架线线段不相交时,将该像素点最终确认为横起点;
2)将笔画线型为横骨架线线段上x坐标值最大的像素点确认为该横骨架线线段的终止端点,当在横骨架线线段上的像素点仅为该横骨架线线段的终止端点且与其他骨架线线段不相交时,将该像素点最终确认为横止点;
3)将笔画线型为竖骨架线线段上y坐标值最大的像素点确认为该竖骨架线线段的起始端点,当在竖骨架线线段上的像素点仅为该竖骨架线线段的起始端点且与其他骨架线线段不相交时,将该像素点最终确认为竖起点;
4)将笔画线型为竖骨架线线段上y坐标值最小的像素点确认为该竖骨架线线段的终止端点,当在竖骨架线线段上的像素点仅为该竖骨架线线段的终止端点且与其他骨架线线段不相交时,将该像素点最终确认为竖止点;
5)将笔画线型为撇骨架线线段上y坐标值最大的像素点确认为该撇骨架线线段的起始端点,当在撇骨架线线段上的像素点仅为该撇骨架线线段的起始端点且与其他骨架线线段不相交时,将该像素点最终确认为撇起点;
6)将笔画线型为撇骨架线线段上y坐标值最小的像素点确认为该撇骨架线线段的终止端点,当在撇骨架线线段上的像素点仅为该撇骨架线线段的终止端点且与其他骨架线线段不相交时,将该像素点最终确认为撇止点;
7)将笔画线型为捺骨架线线段上y坐标值最大的像素点确认为该捺骨架线线段的起始端点,当在捺骨架线线段上的像素点仅为该捺骨架线线段的起始端点且与其他骨架线线段不相交时,将该像素点最终确认为捺起点;
8)将笔画线型为捺骨架线线段上y坐标值最小的像素点确认为该捺骨架线线段的终止端点,当在捺骨架线线段上的像素点仅为该捺骨架线线段的终止端点且与其他骨架线线段不相交时,将该像素点最终确认为捺止点;
9)当某一像素点标记有二个及以上的笔画线型时,该像素点确认为骨架线的笔画线段的折点,如骨架线上某一像素点标记有横骨架线线段和竖骨架线线段的笔画线型时,将该折点最终确认为横竖交点;
10)当某一像素点标记有二个及以上的笔画线型时,该像素点确认为骨架线的笔画线段的折点,如当骨架线上某一像素点标记有横骨架线线段和撇骨架线线段的笔画线型时,将该折点最终确认为横撇交点;
11)当某一像素点标记有二个及以上的笔画线型时,该像素点确认为骨架线的笔画线段的折点,如骨架线上某一像素点标记有横骨架线线段和捺骨架线线段的笔画线型时,将该折点最终确认为横捺交点;
12)当某一像素点标记有二个及以上的笔画线型时,该像素点确认为骨架线的笔画线段的折点,如骨架线上某一像素点标记有竖骨架线线段和撇骨架线线段的笔画线型时,将该折点最终确认为竖撇交点;
13)当某一像素点标记有二个及以上的笔画线型时,该像素点确认为骨架线的笔画线段的折点,如骨架线上某一像素点标记有竖骨架线线段和捺骨架线线段的笔画线型时,将该折点最终确认为竖捺交点;
14)当某一像素点标记有二个及以上的笔画线型时,该像素点确认为骨架线的笔画线段的折点,如骨架线上某一像素点标记有撇骨架线线段和捺骨架线线段的笔画线型时,将该折点最终确认为撇捺交点;
15)当某一像素点标记有二个及以上的笔画线型时,该像素点确认为骨架线的笔画线段的折点,如骨架线上某一像素点标记有三条及以上的笔画线型时,将该折点最终确认为多线交点。
所述的图像骨架节点特征描述符获取方法中,步骤S4中,所述对节点数据进行编码是将骨架节点采用数字、字母或符号进行表示。
所述的图像骨架节点特征描述符获取方法中,步骤S4中,所述预设的节点排列顺序规则包括:
1)当识别为文字图像的骨架线时,以每一文字的骨架线作为一组排序单位;当识别为非文字图像的骨架线时,以整体骨架线作为一组排序单位;
2)每组排序单位按不区分骨架线的笔画线段自上往下逐行设定折点排列的位置顺序,但当该折点与其他折点为同一横骨架线线段时,同一横骨架线线段的一组折点自左往右来设定折点排列的位置顺序。
一种图像骨架节点特征描述符获取装置,包括:
获取模块,用于提取输入图像的骨架线,获得主要色块骨架线像素点;
提取模块,用于提取骨架线的笔画线段的笔画线型;
确定模块,用于确定骨架线的笔画线段的节点数据,节点包括:端点、折点;
生成模块,用于对节点数据进行编码,按照预设的节点排列顺序规则对节点编码进行排序组合,将排序组合的结果作为图像骨架节点特征描述符。
有益效果:
本发明提供的一种图像骨架节点特征描述符获取方法及装置,与现有技术相比具有以下优点:
1、可以有效描述图像的稳定骨架节点特征,提高各种图像检索的匹配效果;
2、有效解决相同或近似图像所提取出的骨架特征存在差异的技术难题,使不形效的相同或近似图像所获得的图像骨架特征相同,有效改进相同或近似图像的图像骨架特征匹配性;
3、克服传统方法提取的文字图像骨架线笔划与文字本身的笔划不对应,导致骨架线失真的缺陷,本方案获得的文字图像骨架线笔划与文字本身的笔划相对应;
4、本技术方案采用文字图像和非文字图像不同的处理来提取输入图像骨架节点特征,与现行从单一方面进行图像骨架特征提取的方法相比,具有图像骨架特征信息描述更全面更稳定的优点,避免图像关键骨架特征信息的遗漏或失真。
附图说明
图1为本发明提供的图像骨架节点特征描述符获取方法的流程图。
图2为随机给出三款示例性文字图像。
图3为随机给出一款示例性非文字图像。
图4为两个像素点之间线长的示意图。
图5为示例性的各小值中轮线线长值与对应的小值中轮线数量的示意图。
图6为与图2对应的图像骨架线示意图。
图7为节点编码与骨架线节点的对应位置的示意图。
图8为本发明提供的图像骨架节点特征描述符获取装置的结构示意图。
图9为本发明提供的图像骨架节点特征描述符获取装置中,获取模块的结构示意图。
图10为本发明提供的图像骨架节点特征描述符获取装置中,提取模块的结构示意图。
图11为本发明提供的图像骨架节点特征描述符获取装置中,生成模块的结构示意图。
具体实施方式
下面详细描述本发明的实施方式,所述实施方式的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施方式是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
请参阅图1-7,本发明提供的一种图像骨架节点特征描述符获取方法,包括步骤:
S1,提取输入图像的骨架线,获得主要色块骨架线像素点和次要色块骨架线像素点;
S2,提取骨架线的笔画线段的笔画线型;
S3,确定骨架线的笔画线段的节点数据,节点包括:端点、折点;
S4,对节点数据进行编码,按照预设的节点排列顺序规则对节点编码进行排序组合,将排序组合的结果作为图像骨架节点特征描述符。
以下具体对各步骤进行详述:
S1,提取输入图像的骨架线,获得主要色块骨架线像素点和次要色块骨架线像素点。
获取输入图像的方式可以包括:通过电脑设备、摄像功能的手机、照相机、摄像头或集合有摄像头或存储图像的其他设备所获取的图像均可作为本技术方法的输入图像。
为了便于说明,图2随机给出三款示例性文字图像,其中,a是宋体字“五星”的文字图像, b是黑体字“五星”的文字图像, c是圆体字“五星”的文字图像。这些文字图像的具有不同的字体形状,但字面含义是相同的。图3随机给出一款示例性非文字图像,图像中没有文字,等等,均可作为本技术方案的处理对象。
提取输入图像的骨架线的方法包括步骤S11、S12、S13、S14:
S11,提取输入图像色块连通域多方向色段线和轮廓线
提取输入图像色块连通域多方向色段线和轮廓线的具体方法包括:
第一,提取输入图像每一像素点的颜色值,对输入图像进行色块连通域的划分,获得像素点色块连通域数据表;
第二,在像素点色块连通域数据表中,逐行标记每个色块连通域色段线号,获得水平向的色块连通域色段线;逐列标记每个色块连通域色段线号,获得垂直向的色块连通域色段线;
和/或逐左斜向标记每个色块连通域色段线号,获得左斜向的色块连通域色段线;逐右斜向标记每个色块连通域色段线号,获得右斜向的色块连通域色段线;
第三,将色块连通域各色段线的端点作为输入图像色块连通域轮廓线。
其中,色块连通域色段线是指在同一色块连通域内在同一方向上连续相连的像素点所构成的线段。
每一幅图像是由许许多多的像素点组合构成的,在同一色块连通域中,每一像素点与另一相邻的像素点存在着水平向、垂直向、右斜向、左斜向的连接关系,同一方向相连接的像素点形成了一条直线线段,因而,输入图像具有由许许多多的水平向色段线、垂直向色段线、右斜向色段线、左斜向色段线组合构成的特征。
因此,色块连通域色段线具体的形成方法:
水平向是指水平方向,水平向色段线是指由二个或二个以上像素点在水平方向上构成的连接线段;
垂直向是指垂直方向,垂直向色段线是指由二个或二个以上像素点在垂直方向上构成的连接线段;
右斜向是指斜向右方45度角的方向,右斜向色段线是指由二个或二个以上像素点在自右上方至左下方沿45度角方向上构成的连接线段;
左斜向是指斜向左方45度角的方向,左斜向色段线是指由二个或二个以上像素点在自左上方至右下方沿45度角方向上构成的连接线段。
色块连通域色段线的端点包括起始像素点和终止像素点,所有色块连通域色段线的端点的集合构成该色块连通域轮廓线。
色块连通域色段线按方向分至少包含:水平向色段线、垂直向色段线、右斜向色段线、左斜向色段线。
各方向的色块连通域色段线的端点的获取方法如下:
1、水平向色段线的端点可按如下公式检查计算获取:
U11=x-a,U12=x-b,
其中,U11为水平方向左侧两相邻像素点的灰度值差,U12为水平方向右侧两相邻像素点的灰度值差,x检测的像素点的灰度值,a为左侧相邻像素点的灰度值,b为右侧相邻像素点的灰度值;
当U11或U12的值不为0时,该点为水平向色段线的端点,其中,当U11的值不为0时,该点为水平向色段线的左侧起点;当U12的值不为0时,该点为水平向色段线的右侧终点。
2、垂直向色段线的端点可按如下公式检查计算获取:
U21=x-c,U22=x-d,
其中,U21为垂直方向上侧两相邻像素点的灰度值差,U22为垂直方向下侧两相邻像素点的灰度值差,X检测的像素点的灰度值,c为上侧相邻像素点的灰度值,d为下侧相邻像素点的灰度值;
当U21或U22的值不为0时,该点为垂直向色段线的端点,其中,当U21的值不为0时,该点为垂直向色段线的上侧起点;当U22的值不为0时,该点为垂直向色段线的下侧终点。
3、右斜向色段线的端点可按如下公式检查计算获取:
U31=x-e,U32=x-f,
其中,U31为右斜方向右上侧两相邻像素点的灰度值差,U32为右斜方向左下侧两相邻像素点的灰度值差,X检测的像素点的灰度值,e为右上侧相邻像素点的灰度值,f为左下侧相邻像素点的灰度值;
当U31或U32的值不为0时,该点为右斜向色段线的端点,其中,当U31的值不为0时,该点为右斜向色段线的右上侧起点;当U32的值不为0时,该点为右斜向色段线的左下侧终点。
4、左斜向色段线的端点可按如下公式检查计算获取:
U41=x-g,U42=x-h,
其中,U41为左斜方向左上侧两相邻像素点的灰度值差,U42为左斜方向右下侧两相邻像素点的灰度值差,X检测的像素点的灰度值,g为左上侧相邻像素点的灰度值,h为右下侧相邻像素点的灰度值;
当U41或U42的值不为0时,该点为左斜向色段线的端点,其中,当U41的值不为0时,该点为左斜向色段线的左上侧起点;当U42的值不为0时,该点为左斜向色段线的右下侧终点。
S12,在方向对上提取色块连通域色段线的中点,将色段线的中点连线较长的线段作为色块骨架线
本技术方案所述的方向对是指由两个方向所构成的方向组合,且该组合中的某一方向与另一方向互为90度角相交。本方案的方向对取水平方向和垂直方向的组合。在实际应用中,最常用的方向是水平向与垂直向,实际上,也可以取左斜方向和右斜方向的组合,或其他方向的组合,但每一组合的方向相交角应为90度。
在方向对上提取色块连通域的色段线的中点,将色段线的中点连线较长的线段作为色块骨架线的具体步骤包括:步骤S121、S122 、S123;
S121,在方向对上提取色块连通域色段线的中点
根据前述步骤所获取的色块连通域色段线信息,在方向对上提取色块连通域色段线的中点的方法包括:
统计该色块连通域色段线的像素点总数,将该像素点总数作为色块连通域色段线的线长;
当线长数为奇数时,位于该色块连通域色段线中间位置的1个像素点为色块连通域色段线的中点;
当线长数为偶数时,位于该色块连通域色段线中间位置的2个像素点共同为色段线的中点。
线长数为偶数时,该色块连通域色段线中间位置并不落入某一个像素点,为了表示中点的位置,本方案取该色块连通域色段线中间位置的2个像素点共同为色段线的中点,能客观反映该色段线中点的原始特征。
各色块连通域色段线的中点反映了图像色块的中心线特征,因此,将在方向对上各色段线的中点的集合作为色块骨架线。
S122,计算色块连通域色段线中点连线长度
色块连通域色段线的中点的连线是指色块连通域色段线的各中点相互相连的线段,其长度可以该线段的像素点总数作为计量值。
S123,将该色段线中点连线中较长的线段作为色块骨架线
在一个色块连通域中,在方向对的任一方向上色块连通域色段线中点连线至少有一条,两个方向至少有两条,根据上步计算出的各色块连通域色段线中点连线长度,将该色段线中点连线较长的线段作为色块骨架线,去除去其他色段线中点连线。
虽然各条色段线中点连线均反映了色块连通域的骨架特征,但色段线中点连线较长的线段更反映色块连通域的主要骨架特征,因此,将色段线中点连线较长的线段作为色块骨架线,并对色块骨架线进行线段编号。
各色块连通域的色块骨架线反映了图像色块的骨架特征,因此,将色块骨架线的集合可作为图像骨架线。
S13, 提取色块骨架线的线长、端点、交折点和小值中轮线,对输入图像的类型进行识别
色块骨架线在一定程度上反映了图像的基本骨架特征,但在一些字体的文字图像中,存在着同一文字不同的字体所提取出的骨架线并不相同,以使相同文字的图像骨架特征不同,文字图像骨架线笔划与文字本身的笔划不对应,导致骨架线失真,在相同文字图像检索时造成图像骨架特征匹配困难。
为解决此问题,需要对色块骨架线作进一步的处理,处理步骤具体包括:
1、计算色块骨架线线长
色块骨架线的线长可通过统计该色块骨架线的像素点总数,将该像素点总数作为色块骨架线的线长。
2、获取色块骨架线的端点
色块骨架线的端点是指该色块骨架线中的首尾像素点;
水平方向色块骨架线的端点可以通过检查色块骨架线中像素点x轴的最小值和最大值获得;
垂直方向色块骨架线的端点可以通过检查色块骨架线中像素点y轴的最小值和最大值获得。
3、获取色块骨架线的交折点
色块骨架线的交折点是指两个及以上方向不同的色块骨架线相交的点;
色块骨架线的交折点可以通过检查色块骨架线中像素点是否具有两个及以上色块骨架线的线号,如果有,将该像素点确认为色块骨架线的交折点;
色块骨架线的交折点又细分为:交点和折点;
交点的确认规则:当色块骨架线的交折点仅具有两个及以上色块骨架线的线号且不是色块骨架线的端点时,该色块骨架线的交折点为色块骨架线的交点;
折点的确认规则:当色块骨架线的交折点不仅具有两个及以上色块骨架线的线号,且该色块骨架线的交折点还是色块骨架线的端点时,该色块骨架线的交折点为色块骨架线的折点。
4、获取小值中轮线
中轮线是指色块骨架线像素点至该色块轮廓线上像素点的连线;
小值中轮线是指色块骨架线像素点至该色块轮廓线上距离最短的像素点的连线;
小值中轮线获取的步骤:
第一,计算色块骨架线上每一像素点的中轮线的线长
参考图4,中轮线的线长计算公式为
Figure DEST_PATH_IMAGE007
其中,P1P2表示色块骨架线上像素点至该色块轮廓线上像素点的连线的线长,即中轮线的线长,x2表示色块骨架线上像素点的x轴坐标值,x1表示轮廓线上像素点的x轴坐标值,y2表示色块骨架线上像素点的y轴坐标值,y1表示轮廓线上像素点的y轴坐标值;
将所获取色块骨架线上像素点至该色块轮廓线上像素点的连线的线长,记入中轮线数据表;
第二,找出并标记色块骨架线上每一像素点的中轮线的最短线长,该最短线长的中轮线作为小值中轮线。
5、对输入图像的类型进行识别
一般来说,输入图像并没有直接的区分文字图像或非文字图像的标记信息;
本技术方案考虑实际应用的需要,针对文字图像和非文字图像采用不同的图像骨架线提取方法,以克服针对文字图像采用传统骨架线提取方法而造成文字特征失真的缺陷;
对输入图像的类型进行识别的具体方法是:
第一,获取各小值中轮线线长值对应的值中轮线数量
根据前述获取的中轮线数据表记录的数据,找出小值中轮线数据,统计小值中轮线的线长(P1P2)的每一值所拥有的条数,记入小值中轮线数据表;
举例说明:假设某图像的小值中轮线线长值与对应的小值中轮线数量如下表和图5所示:
序号 线长(P<sub>1</sub>P<sub>2</sub>) 条数
1 1 106
2 2 98
3 3 10
4 4 4
5 5 4
6 6 2
合计 224
从上表和图5显示:线长值(P1P2)为1的条数有106条,线长值P1P2)为2的条数有98条,线长值(P1P2)为1、2是图像的小值中轮线线长的主要特征,而线长值(P1P2)为3、4、5、6是图像小值中轮线线长的次要特征;
第二,根据预设的小值中轮线线长值拥有中轮线条数的阈值对色块骨架线上的小值中轮线进行分类
文字图像的主要笔画一般具有厚度大小一致的特征,如果某一中轮线线长值拥有中轮线条数较多,反映了该色块连通域具有厚度大小一致的特征,即具有文字图像的笔画特征。预设的小值中轮线线长值拥有中轮线条数的阈值可根据应用需求设定,其取值范围一般为大于色块连通域内中轮线总条数的10%。
当某一个小值中轮线线长值(P1P2)拥有的小值中轮线数量大于预设的小值中轮线线长值拥有中轮线条数的阈值时,该小值中轮线为主要中轮线,否则,为次要中轮线;
第三,对输入图像的类型进行识别判定
当输入图像中主要中轮线数量大于等于次要中轮线数量时,判定该输入图像为文字图像,当输入图像中主要中轮线数量小于次要中轮线数量时,判定该输入图像为非文字图像。
通过判断主要中轮线与次要中轮线的占比,可以较有效地对图像类型进行判定,准确率较高。
S14,对色块骨架线上的像素点进行分类,获取主要色块骨架线像素点和次要色块骨架线像素点,将主要色块骨架线像素点的集合作为文字图像的骨架线,将主要和次要色块骨架线像素点的集合作为非文字图像的骨架线
对输入图像中的文字图像和非文字图像进行区分,分别采用不同的图像骨架线形成方法,有利于更好地准确反映图像骨架特征,解决传统骨架线提取方法造成的文字特征失真的缺陷。
为实现输入图像中的文字图像和非文字图像的区分,本技术方案采用的方法是:对色块骨架线上的像素点进行分类,获取主要色块骨架线像素点和次要色块骨架线像素点,将主要色块骨架线像素点的集合作为文字图像的骨架线,将主要和次要色块骨架线像素点的集合作为非文字图像的骨架线。
获取文字图像的骨架线和非文字图像的骨架线的具体方法:
第一,根据小值中轮线分类结果对色块骨架线上的像素点进行分类
根据小值中轮线分类结果,将色块骨架线上与主要中轮线相连接的像素点作为主要色块骨架线像素点,将色块骨架线上与次要中轮线相连接的像素点作为次要色块骨架线像素点;
第二,根据分类结果生成图像的骨架线
将主要色块骨架线像素点的集合作为文字图像的骨架线,将主要和次要色块骨架线像素点的集合作为非文字图像的骨架线。
图2中的示例经过上述处理,获得的文字图像的骨架线,如图6所示。
S2,提取骨架线的笔画线段的笔画线型。
步骤S2包括步骤S201、S202、S203、S204:
S201,对骨架线进行定位处理,获取正位后图像骨架线
对骨架线进行定位处理的方法包括:旋转修正后图像骨架线,获取各种角度下修正后图像骨架线的有效区域大小尺寸,选择旋转角度最小且有效区域大小尺寸为最小状态时的图像骨架线作为正位后图像骨架线,其中,所述的图像骨架线的有效区域是指由图像骨架线的外接矩形所围成的内部区域。
S202,对骨架线进行笔画线段划分
对骨架线进行笔画线段划分的方法包括:根据步骤S13得到的色块骨架线的端点、交折点,将每一端点与其相邻的端点或交折点的色块骨架线的像素点连线划分为笔画线段。笔画线段为组成骨架线的基本单元。
S203,确定笔画线段的标准偏差
笔画线段的标准偏差包括:骨架线的笔画线段的像素点的x坐标值的标准偏差和y坐标值的标准偏差。
确定笔画线段的标准偏差的方法包括:
按下式计算正位后图像骨架线上每骨架线的笔画线段像素点的x坐标值的标准偏差和y坐标值的标准偏差:
Figure 807980DEST_PATH_IMAGE001
Figure 410301DEST_PATH_IMAGE002
其中,
Figure 560659DEST_PATH_IMAGE003
表示骨架线线段像素点的x坐标值的标准偏差,
Figure 155589DEST_PATH_IMAGE004
表示骨架线线段像素点的y坐标值的标准偏差,xi表示骨架线线段上第i个像素点的x坐标值,yi表示骨架线线段上第i个像素点的y坐标值,n表示骨架线线段上全部像素点的个数,
Figure 416806DEST_PATH_IMAGE005
表示骨架线线段全部像素点的平均x坐标值,
Figure 288947DEST_PATH_IMAGE006
表示骨架线线段全部像素点的平均y坐标值。
S204,对骨架线的笔画线段进行笔画线型划分,获取该笔画线段的笔画线型
按如下规则对骨架线的笔画线段进行笔画线型划分,获取该笔画线段的笔画线型:
1)当骨架线线段上像素点的y坐标值的标准偏差小于或等于预设的第一标准偏差阈值时,该正位后图像骨架线线段的笔画线型确认为横骨架线线段;
2)当骨架线线段上像素点的x坐标值的标准偏差小于或等于预设的第二标准偏差阈值时,该正位后图像骨架线线段的笔画线型确认为竖骨架线线段;
3)当骨架线线段上像素点的x坐标值的标准偏差大于预设的第二标准偏差阈值,或当骨架线线段上像素点的y坐标值的标准偏差大于预设的第一标准偏差阈值标准偏差阈值时,若该骨架线线段的端点的y轴坐标最大值的像素点处在该线段右侧,则将该骨架线线段的笔画线型确认为撇骨架线线段;
4)当骨架线线段上像素点的x坐标值的标准偏差大于预设的第二标准偏差阈值,或当骨架线线段上像素点的y坐标值的标准偏差大于预设的第一标准偏差阈值时,若该骨架线线段的端点的y轴坐标最大值的像素点处在该线段左侧,则将该骨架线线段的笔画线型确认为捺骨架线线段;
其中,所述第一标准偏差为y坐标值的标准偏差,预设的第一标准偏差阈值可根据应用需求确定,一般在该骨架线线段的线长的20%以内取值(即第一标准偏差阈值不大于该骨架线线段的线长的20%)。所述第二标准偏差为x坐标值的标准偏差,预设的第二标准偏差阈值可根据应用需求确定,一般在该骨架线线段的线长的20%以内取值(即第二标准偏差阈值不大于该骨架线线段的线长的20%)。
S3,确定骨架线的笔画线段的节点数据,节点包括:端点、折点。
骨架线的笔画线段的节点是指在骨架线的笔画线段具有起始、终止、或与其他不同笔画线型的笔画线段相交位置属性的像素点。
节点可以按该节点在骨架线的笔画线段中的位置关系进行分类,以获取节点的明细分类。
此处,按预设的确认规则对节点进行分类;把端点分为横起点、横止点、竖起点、竖止点、撇起点、撇止点、捺起点或捺止点;把折点分为横竖交点、横撇交点、横捺交点、竖撇交点、竖捺交点、撇捺交点或多线交点。
上述的预设的确认规则包括:规则1)-15),其中规则1)-8)用于对笔画线段的端点进行确定,规则9)-15)用于对笔画线段的折点进行确定;
1)将笔画线型为横骨架线线段上x坐标值最小的像素点确认为该横骨架线线段的起始端点,当在横骨架线线段上的像素点仅为该横骨架线线段的起始端点且与其他骨架线线段不相交时,将该像素点最终确认为横起点;
2)将笔画线型为横骨架线线段上x坐标值最大的像素点确认为该横骨架线线段的终止端点,当在横骨架线线段上的像素点仅为该横骨架线线段的终止端点且与其他骨架线线段不相交时,将该像素点最终确认为横止点;
3)将笔画线型为竖骨架线线段上y坐标值最大的像素点确认为该竖骨架线线段的起始端点,当在竖骨架线线段上的像素点仅为该竖骨架线线段的起始端点且与其他骨架线线段不相交时,将该像素点最终确认为竖起点;
4)将笔画线型为竖骨架线线段上y坐标值最小的像素点确认为该竖骨架线线段的终止端点,当在竖骨架线线段上的像素点仅为该竖骨架线线段的终止端点且与其他骨架线线段不相交时,将该像素点最终确认为竖止点;
5)将笔画线型为撇骨架线线段上y坐标值最大的像素点确认为该撇骨架线线段的起始端点,当在撇骨架线线段上的像素点仅为该撇骨架线线段的起始端点且与其他骨架线线段不相交时,将该像素点最终确认为撇起点;
6)将笔画线型为撇骨架线线段上y坐标值最小的像素点确认为该撇骨架线线段的终止端点,当在撇骨架线线段上的像素点仅为该撇骨架线线段的终止端点且与其他骨架线线段不相交时,将该像素点最终确认为撇止点;
7)将笔画线型为捺骨架线线段上y坐标值最大的像素点确认为该捺骨架线线段的起始端点,当在捺骨架线线段上的像素点仅为该捺骨架线线段的起始端点且与其他骨架线线段不相交时,将该像素点最终确认为捺起点;
8)将笔画线型为捺骨架线线段上y坐标值最小的像素点确认为该捺骨架线线段的终止端点,当在捺骨架线线段上的像素点仅为该捺骨架线线段的终止端点且与其他骨架线线段不相交时,将该像素点最终确认为捺止点;
9)当某一像素点标记有二个及以上的笔画线型时,该像素点确认为骨架线的笔画线段的折点,如骨架线上某一像素点标记有横骨架线线段和竖骨架线线段的笔画线型时,将该折点最终确认为横竖交点;
10)当某一像素点标记有二个及以上的笔画线型时,该像素点确认为骨架线的笔画线段的折点,如当骨架线上某一像素点标记有横骨架线线段和撇骨架线线段的笔画线型时,将该折点最终确认为横撇交点;
11)当某一像素点标记有二个及以上的笔画线型时,该像素点确认为骨架线的笔画线段的折点,如骨架线上某一像素点标记有横骨架线线段和捺骨架线线段的笔画线型时,将该折点最终确认为横捺交点;
12)当某一像素点标记有二个及以上的笔画线型时,该像素点确认为骨架线的笔画线段的折点,如骨架线上某一像素点标记有竖骨架线线段和撇骨架线线段的笔画线型时,将该折点最终确认为竖撇交点;
13)当某一像素点标记有二个及以上的笔画线型时,该像素点确认为骨架线的笔画线段的折点,如骨架线上某一像素点标记有竖骨架线线段和捺骨架线线段的笔画线型时,将该折点最终确认为竖捺交点;
14)当某一像素点标记有二个及以上的笔画线型时,该像素点确认为骨架线的笔画线段的折点,如骨架线上某一像素点标记有撇骨架线线段和捺骨架线线段的笔画线型时,将该折点最终确认为撇捺交点;
15)当某一像素点标记有二个及以上的笔画线型时,该像素点确认为骨架线的笔画线段的折点,如骨架线上某一像素点标记有三条及以上的笔画线型时,将该折点最终确认为多线交点。
S4,对节点数据进行编码,按照预设的节点排列顺序规则对节点编码进行排序组合,将排序组合的结果作为图像骨架节点特征描述符。
步骤S4包括步骤S401、S402:
S401,对节点数据进行编码
笔画线段的节点包括:横起点、横止点、竖起点、竖止点、撇起点、撇止点、捺起点、捺止点、横竖交点、横撇交点、横捺交点、竖撇交点、竖捺交点、撇捺交点、多线交点。
实际应用中,为了方便计算机的识别与运算,可以将横起点、横止点、竖起点、竖止点、撇起点、撇止点、捺起点、捺止点、横竖交点、横撇交点、横捺交点、竖撇交点、竖捺交点、撇捺交点、多线交点等骨架节点采用数字、或字母、或符号等进行表示。
为了说明方便,具体应用时,本方案实施例可以将横起点、横止点、竖起点、竖止点、撇起点、撇止点、捺起点、捺止点、横竖交点、横撇交点、横捺交点、竖撇交点、竖捺交点、撇捺交点、多线交点分别以“a、b、c、d、e、f、g、h、i、j、k、l、m、n、o”编码表示,即:横起点a、横止点b、竖起点c、竖止点d、撇起点e、撇止点f、捺起点g、捺止点h、横竖交点i、横撇交点j、横捺交点k、竖撇交点l、竖捺交点m、撇捺交点n、多线交点o;但不限于此。
S402,按照预设的节点排列顺序规则对节点编码进行排序组合,将排序组合的结果作为图像骨架节点特征描述符
上述的预设的节点排列顺序规则包括:
1)当识别为文字图像的骨架线时,以每一文字的骨架线作为一组排序单位;当识别为非文字图像的骨架线时,以整体骨架线作为一组排序单位;
2)每组排序单位按不区分骨架线的笔画线段自上往下逐行设定折点排列的位置顺序,但当该折点与其他折点为同一横骨架线线段时,同一横骨架线线段的一组折点自左往右来设定折点排列的位置顺序。
其中,同一横骨架线线段包括中间含有折点的连续相连的多条横骨架线线段,即,将骨架线笔画线段中间含有折点的连续相连的多条横骨架线笔画线段组合确认为同一横骨架线线段。
节点排列顺序规则也可以根据应用的需要按照其他的位置顺序规则进行设置,只要建立了统一标准的位置顺序规则,就能准确描述图像骨架的节点特征。
按照预设节点排列的位置顺序规则对骨架线的笔画线段中的节点编码进行排序组合后,可得如下形式的字符串:
|Z1Z2Z3…Zi|
其中,i表示骨架线上第i个节点,Z1表示骨架线上第1个节点的节点编码,Z2表示骨架线上第2个节点的节点编码,Z3表示骨架线上第3个节点的节点编码,Zi表示骨架线上第i个节点的节点编码,以此类推。
经上述按预设节点排列顺序规则对节点编码进行排序组合后,可以将排序组合的结果作为图像骨架节点特征描述符。
以图2的“五星”文字图像为例,经上述处理,按预设节点排列顺序规则1)可得到两组排序单位,第一组的节点数为10个,第二组的节点数为18个,对这些节点进行编码后获得节点编码,再根据预设节点排列顺序规则2)进行排序组合后的两组字符串分别是:
|aibaiiaiib|
|iiiiiiccoibfaibaib|
将上述该两组字符串作为图像骨架节点特征描述符。每一字符所对应的节点位置如图7所示。
在相同或近似的图像中,图像的拉伸变形或其他图素造成的变形时,图像骨架节点的属性和排序不会有明显的不同,所以图像骨架节点具有良好的稳定性特征。
通过上述处理的图像骨架节点特征描述符,可以应用于图像的检索。通过图像骨架节点特征描述符的匹配检索,能实现相同或近似图像的较好检索效果。
由上可知,该图像骨架节点特征描述符获取方法,通过提取输入图像的骨架线,获得主要色块骨架线像素点和次要色块骨架线像素点;提取骨架线的笔画线段的笔画线型;确定骨架线的笔画线段的节点数据,节点包括:端点、折点;对节点数据进行编码,按照预设的节点排列顺序规则对节点编码进行排序组合,将排序组合的结果作为图像骨架节点特征描述符;以获得图像骨架节点特征描述符,具有以下优点:
1、可以有效描述图像的稳定骨架节点特征,提高各种图像检索的匹配效果;
2、有效解决相同或近似图像所提取出的骨架特征存在差异的技术难题,使不形效的相同或近似图像所获得的图像骨架特征相同,有效改进相同或近似图像的图像骨架特征匹配性;
3、克服传统方法提取的文字图像骨架线笔划与文字本身的笔划不对应,导致骨架线失真的缺陷,本方案获得的文字图像骨架线笔划与文字本身的笔划相对应;
4、本技术方案采用文字图像和非文字图像不同的处理来提取输入图像骨架节点特征,与现行从单一方面进行图像骨架特征提取的方法相比,具有图像骨架特征信息描述更全面更稳定的优点,避免图像关键骨架特征信息的遗漏或失真。
请参阅图8-11,本发明提供一种图像骨架节点特征描述符获取装置,包括获取模块1、提取模块2、确定模块3、生成模块4;
其中,获取模块1,用于提取输入图像的骨架线;
其中,提取模块2,用于提取骨架线的笔画线段的笔画线型;
其中,确定模块3,用于确定骨架线的笔画线段的节点数据,节点包括:端点、折点;
其中,生成模块4,用于对节点数据进行编码,按照预设的节点排列顺序规则对节点编码进行排序组合,将排序组合的结果作为图像骨架节点特征描述符 。
进一步的,见图9,获取模块1包括第一提取单元1.1、第二提取单元1.2、识别单元1.3、第一获取单元1.4;
其中,第一提取单元1.1,用于提取输入图像色块连通域多方向色段线和轮廓线;
其中,第二提取单元1.2,用于在方向对上提取色块连通域色段线的中点,将色段线的中点连线较长的线段作为色块骨架线;
其中,识别单元1.3, 用于提取色块骨架线的线长、端点、交折点和小值中轮线,对输入图像的类型进行识别;
其中,第一获取单元1.4,用于对色块骨架线上的小值中轮线和色块骨架线上的像素点进行分类,获取主要色块骨架线像素点和次要色块骨架线像素点,将主要色块骨架线像素点的集合作为文字图像的骨架线,将主要和次要色块骨架线像素点的集合作为非文字图像的骨架线。
在一些实施方式中,见图10,提取模块2包括定位单元2.1、第一划分单元2.2、确定单元2.3、第二获取单元2.4;
其中,定位单元2.1,用于对骨架线进行定位处理,获取正位后图像骨架线;
其中,第一划分单元2.2,用于对骨架线进行笔画线段划分;
其中,确定单元2.3,用于确定笔画线段的标准偏差;
其中,第二获取单元2.4,用于对骨架线的笔画线段进行笔画线型划分,获取该笔画线段的笔画线型。
本实施例中,见图11,生成模块4包括编码单元4.1、排序单元4.2;
其中,编码单元4.1,用于对节点数据进行编码;
其中,排序单元4.2,用于按照预设的节点排列顺序规则对节点编码进行排序组合,将排序组合的结果作为图像骨架节点特征描述符。
由上可知,该图像骨架节点特征描述符获取装置,通过提取输入图像的骨架线,获得主要色块骨架线像素点和次要色块骨架线像素点;提取骨架线的笔画线段的笔画线型;确定骨架线的笔画线段的节点数据,节点包括:端点、折点;对节点数据进行编码,按照预设的节点排列顺序规则对节点编码进行排序组合,将排序组合的结果作为图像骨架节点特征描述符;以获得图像骨架节点特征描述符,具有以下优点:
1、可以有效描述图像的稳定骨架节点特征,提高各种图像检索的匹配效果;
2、有效解决相同或近似图像所提取出的骨架特征存在差异的技术难题,使不形效的相同或近似图像所获得的图像骨架特征相同,有效改进相同或近似图像的图像骨架特征匹配性;
3、克服传统方法提取的文字图像骨架线笔划与文字本身的笔划不对应,导致骨架线失真的缺陷,本方案获得的文字图像骨架线笔划与文字本身的笔划相对应;
4、本技术方案采用文字图像和非文字图像不同的处理来提取输入图像骨架节点特征,与现行从单一方面进行图像骨架特征提取的方法相比,具有图像骨架特征信息描述更全面更稳定的优点,避免图像关键骨架特征信息的遗漏或失真。
综上所述,虽然本发明已以优选实施例揭露如上,但上述优选实施例并非用以限制本发明,本领域的普通技术人员,在不脱离本发明的精神和范围内,均可作各种更动与润饰,其方案与本发明实质上相同。

Claims (12)

1.一种图像骨架节点特征描述符获取方法,其特征在于,包括步骤:
S1,提取输入图像的骨架线,获得主要色块骨架线像素点和次要色块骨架线像素点;
S2,提取骨架线的笔画线段的笔画线型;
S3,确定骨架线的笔画线段的节点数据,节点包括:端点、折点;
S4,对节点数据进行编码,按照预设的节点排列顺序规则对节点编码进行排序组合,将排序组合的结果作为图像骨架节点特征描述符。
2.根据权利要求1所述的图像骨架节点特征描述符获取方法,其特征在于,步骤S1包括步骤:
S11,提取输入图像色块连通域多方向色段线和轮廓线;
S12,在方向对上提取色块连通域色段线的中点,将色段线的中点连线中较长的线段作为色块骨架线;
S13, 提取色块骨架线的线长、端点、交折点和小值中轮线,对输入图像的类型进行识别;
S14,对色块骨架线上的像素点进行分类,获取主要色块骨架线像素点和次要色块骨架线像素点,将主要色块骨架线像素点的集合作为文字图像的骨架线,将主要和次要色块骨架线像素点的集合作为非文字图像的骨架线。
3.根据权利要求2所述的图像骨架节点特征描述符获取方法,其特征在于,步骤S2包括步骤:
S201,对骨架线进行定位处理,获取正位后图像骨架线;
S202,对骨架线进行笔画线段划分;
S203,确定笔画线段的标准偏差;
S204,对骨架线的笔画线段进行笔画线型划分,获取该笔画线段的笔画线型。
4.根据权利要求3所述的图像骨架节点特征描述符获取方法,其特征在于,步骤S201中,对骨架线进行定位处理的方法包括:旋转修正后图像骨架线,获取各种角度下修正后图像骨架线的有效区域大小尺寸,选择旋转角度最小且有效区域大小尺寸为最小状态时的图像骨架线作为正位后图像骨架线,其中,所述的图像骨架线的有效区域是指由图像骨架线的外接矩形所围成的内部区域。
5.根据权利要求3所述的图像骨架节点特征描述符获取方法,其特征在于,步骤S202中,对骨架线进行笔画线段划分的方法包括:根据步骤S13得到的色块骨架线的端点、交折点,将每一端点与其相邻的端点或交折点的色块骨架线的像素点连线划分为笔画线段。
6.根据权利要求3所述的图像骨架节点特征描述符获取方法,其特征在于,步骤S203中,所述笔画线段的标准偏差包括骨架线的笔画线段的像素点的x坐标值的标准偏差和y坐标值的标准偏差,确定笔画线段的标准偏差的方法包括:
按下式计算正位后图像骨架线上每骨架线的笔画线段像素点的x坐标值的标准偏差和y坐标值的标准偏差:
Figure DEST_PATH_IMAGE001
Figure 859324DEST_PATH_IMAGE002
其中,
Figure DEST_PATH_IMAGE003
表示骨架线线段像素点的x坐标值的标准偏差,
Figure 933590DEST_PATH_IMAGE004
表示骨架线线段像素点的y坐标值的标准偏差,xi表示骨架线线段上第i个像素点的x坐标值,yi表示骨架线线段上第i个像素点的y坐标值,n表示骨架线线段上全部像素点的个数,
Figure DEST_PATH_IMAGE005
表示骨架线线段全部像素点的平均x坐标值,
Figure 477835DEST_PATH_IMAGE006
表示骨架线线段全部像素点的平均y坐标值。
7.根据权利要求3所述的图像骨架节点特征描述符获取方法,其特征在于,步骤S204中,按如下规则对骨架线的笔画线段进行笔画线型划分,获取该笔画线段的笔画线型:
1)当骨架线线段上像素点的y坐标值的标准偏差小于或等于预设的第一标准偏差阈值时,该正位后图像骨架线线段的笔画线型确认为横骨架线线段;
2)当骨架线线段上像素点的x坐标值的标准偏差小于或等于预设的第二标准偏差阈值时,该正位后图像骨架线线段的笔画线型确认为竖骨架线线段;
3)当骨架线线段上像素点的x坐标值的标准偏差大于预设的第二标准偏差阈值,或当骨架线线段上像素点的y坐标值的标准偏差大于预设的第一标准偏差阈值标准偏差阈值时,若该骨架线线段的端点的y轴坐标最大值的像素点处在该线段右侧,则将该骨架线线段的笔画线型确认为撇骨架线线段;
4)当骨架线线段上像素点的x坐标值的标准偏差大于预设的第二标准偏差阈值,或当骨架线线段上像素点的y坐标值的标准偏差大于预设的第一标准偏差阈值时,若该骨架线线段的端点的y轴坐标最大值的像素点处在该线段左侧,则将该骨架线线段的笔画线型确认为捺骨架线线段。
8.根据权利要求1所述的图像骨架节点特征描述符获取方法,其特征在于,步骤S3中,按预设的确认规则对节点进行分类;把端点分为横起点、横止点、竖起点、竖止点、撇起点、撇止点、捺起点或捺止点;把折点分为横竖交点、横撇交点、横捺交点、竖撇交点、竖捺交点、撇捺交点或多线交点。
9.根据权利要求8所述的图像骨架节点特征描述符获取方法,其特征在于,所述预设的确认规则包括:
1)将笔画线型为横骨架线线段上x坐标值最小的像素点确认为该横骨架线线段的起始端点,当在横骨架线线段上的像素点仅为该横骨架线线段的起始端点且与其他骨架线线段不相交时,将该像素点最终确认为横起点;
2)将笔画线型为横骨架线线段上x坐标值最大的像素点确认为该横骨架线线段的终止端点,当在横骨架线线段上的像素点仅为该横骨架线线段的终止端点且与其他骨架线线段不相交时,将该像素点最终确认为横止点;
3)将笔画线型为竖骨架线线段上y坐标值最大的像素点确认为该竖骨架线线段的起始端点,当在竖骨架线线段上的像素点仅为该竖骨架线线段的起始端点且与其他骨架线线段不相交时,将该像素点最终确认为竖起点;
4)将笔画线型为竖骨架线线段上y坐标值最小的像素点确认为该竖骨架线线段的终止端点,当在竖骨架线线段上的像素点仅为该竖骨架线线段的终止端点且与其他骨架线线段不相交时,将该像素点最终确认为竖止点;
5)将笔画线型为撇骨架线线段上y坐标值最大的像素点确认为该撇骨架线线段的起始端点,当在撇骨架线线段上的像素点仅为该撇骨架线线段的起始端点且与其他骨架线线段不相交时,将该像素点最终确认为撇起点;
6)将笔画线型为撇骨架线线段上y坐标值最小的像素点确认为该撇骨架线线段的终止端点,当在撇骨架线线段上的像素点仅为该撇骨架线线段的终止端点且与其他骨架线线段不相交时,将该像素点最终确认为撇止点;
7)将笔画线型为捺骨架线线段上y坐标值最大的像素点确认为该捺骨架线线段的起始端点,当在捺骨架线线段上的像素点仅为该捺骨架线线段的起始端点且与其他骨架线线段不相交时,将该像素点最终确认为捺起点;
8)将笔画线型为捺骨架线线段上y坐标值最小的像素点确认为该捺骨架线线段的终止端点,当在捺骨架线线段上的像素点仅为该捺骨架线线段的终止端点且与其他骨架线线段不相交时,将该像素点最终确认为捺止点;
9)当某一像素点标记有二个及以上的笔画线型时,该像素点确认为骨架线的笔画线段的折点,如骨架线上某一像素点标记有横骨架线线段和竖骨架线线段的笔画线型时,将该折点最终确认为横竖交点;
10)当某一像素点标记有二个及以上的笔画线型时,该像素点确认为骨架线的笔画线段的折点,如当骨架线上某一像素点标记有横骨架线线段和撇骨架线线段的笔画线型时,将该折点最终确认为横撇交点;
11)当某一像素点标记有二个及以上的笔画线型时,该像素点确认为骨架线的笔画线段的折点,如骨架线上某一像素点标记有横骨架线线段和捺骨架线线段的笔画线型时,将该折点最终确认为横捺交点;
12)当某一像素点标记有二个及以上的笔画线型时,该像素点确认为骨架线的笔画线段的折点,如骨架线上某一像素点标记有竖骨架线线段和撇骨架线线段的笔画线型时,将该折点最终确认为竖撇交点;
13)当某一像素点标记有二个及以上的笔画线型时,该像素点确认为骨架线的笔画线段的折点,如骨架线上某一像素点标记有竖骨架线线段和捺骨架线线段的笔画线型时,将该折点最终确认为竖捺交点;
14)当某一像素点标记有二个及以上的笔画线型时,该像素点确认为骨架线的笔画线段的折点,如骨架线上某一像素点标记有撇骨架线线段和捺骨架线线段的笔画线型时,将该折点最终确认为撇捺交点;
15)当某一像素点标记有二个及以上的笔画线型时,该像素点确认为骨架线的笔画线段的折点,如骨架线上某一像素点标记有三条及以上的笔画线型时,将该折点最终确认为多线交点。
10.根据权利要求1所述的图像骨架节点特征描述符获取方法,其特征在于,步骤S4中,所述对节点数据进行编码是将骨架节点采用数字、字母或符号进行表示。
11.根据权利要求1所述的图像骨架节点特征描述符获取方法,其特征在于,步骤S4中,所述预设的节点排列顺序规则包括:
1)当识别为文字图像的骨架线时,以每一文字的骨架线作为一组排序单位;当识别为非文字图像的骨架线时,以整体骨架线作为一组排序单位;
2)每组排序单位按不区分骨架线的笔画线段自上往下逐行设定折点排列的位置顺序,但当该折点与其他折点为同一横骨架线线段时,同一横骨架线线段的一组折点自左往右来设定折点排列的位置顺序。
12.一种图像骨架节点特征描述符获取装置,其特征在于,包括:
获取模块,用于提取输入图像的骨架线,获得主要色块骨架线像素点;
提取模块,用于提取骨架线的笔画线段的笔画线型;
确定模块,用于确定骨架线的笔画线段的节点数据,节点包括:端点、折点;
生成模块,用于对节点数据进行编码,按照预设的节点排列顺序规则对节点编码进行排序组合,将排序组合的结果作为图像骨架节点特征描述符。
CN202010057374.2A 2020-01-19 2020-01-19 一种图像骨架节点特征描述符获取方法及装置 Active CN111310579B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010057374.2A CN111310579B (zh) 2020-01-19 2020-01-19 一种图像骨架节点特征描述符获取方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010057374.2A CN111310579B (zh) 2020-01-19 2020-01-19 一种图像骨架节点特征描述符获取方法及装置

Publications (2)

Publication Number Publication Date
CN111310579A true CN111310579A (zh) 2020-06-19
CN111310579B CN111310579B (zh) 2023-06-23

Family

ID=71161416

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010057374.2A Active CN111310579B (zh) 2020-01-19 2020-01-19 一种图像骨架节点特征描述符获取方法及装置

Country Status (1)

Country Link
CN (1) CN111310579B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112765935A (zh) * 2021-01-18 2021-05-07 上海锐线创意设计有限公司 一种文字外形个性化处理方法及系统

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1125337A (zh) * 1994-12-31 1996-06-26 黄文� 交点式汉字编码法及其键盘
US5588072A (en) * 1993-12-22 1996-12-24 Canon Kabushiki Kaisha Method and apparatus for selecting blocks of image data from image data having both horizontally- and vertically-oriented blocks
JP2005182660A (ja) * 2003-12-22 2005-07-07 Matsushita Electric Works Ltd 文字・図形の認識方法
CN101034438A (zh) * 2006-11-17 2007-09-12 东华大学 一种面向微流控芯片的智能定位方法
CN101727189A (zh) * 2008-10-16 2010-06-09 李永庚 一种用手机和电脑数字键盘输入的汉字笔位码输入法
CN104063723A (zh) * 2014-06-25 2014-09-24 北京语言大学 脱机手写汉字的笔画还原方法及装置
JP2016118909A (ja) * 2014-12-19 2016-06-30 コニカミノルタ株式会社 文字画像処理システム、文字画像処理システムの制御プログラム、情報処理装置、および情報処理装置の制御プログラム
CN106845542A (zh) * 2017-01-18 2017-06-13 江苏阿瑞斯智能设备有限公司 基于dsp的纸币冠字号智能识别方法
CN108875720A (zh) * 2017-05-12 2018-11-23 北大方正集团有限公司 矢量字体的骨架线提取方法及装置
CN109635679A (zh) * 2018-11-26 2019-04-16 深圳深知未来智能有限公司 一种实时的靶纸定位及环线识别方法
CN110427989A (zh) * 2019-07-18 2019-11-08 北京大学 汉字骨架自动合成方法及大规模中文字库自动生成方法

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5588072A (en) * 1993-12-22 1996-12-24 Canon Kabushiki Kaisha Method and apparatus for selecting blocks of image data from image data having both horizontally- and vertically-oriented blocks
CN1125337A (zh) * 1994-12-31 1996-06-26 黄文� 交点式汉字编码法及其键盘
JP2005182660A (ja) * 2003-12-22 2005-07-07 Matsushita Electric Works Ltd 文字・図形の認識方法
CN101034438A (zh) * 2006-11-17 2007-09-12 东华大学 一种面向微流控芯片的智能定位方法
CN101727189A (zh) * 2008-10-16 2010-06-09 李永庚 一种用手机和电脑数字键盘输入的汉字笔位码输入法
CN104063723A (zh) * 2014-06-25 2014-09-24 北京语言大学 脱机手写汉字的笔画还原方法及装置
JP2016118909A (ja) * 2014-12-19 2016-06-30 コニカミノルタ株式会社 文字画像処理システム、文字画像処理システムの制御プログラム、情報処理装置、および情報処理装置の制御プログラム
CN106845542A (zh) * 2017-01-18 2017-06-13 江苏阿瑞斯智能设备有限公司 基于dsp的纸币冠字号智能识别方法
CN108875720A (zh) * 2017-05-12 2018-11-23 北大方正集团有限公司 矢量字体的骨架线提取方法及装置
CN109635679A (zh) * 2018-11-26 2019-04-16 深圳深知未来智能有限公司 一种实时的靶纸定位及环线识别方法
CN110427989A (zh) * 2019-07-18 2019-11-08 北京大学 汉字骨架自动合成方法及大规模中文字库自动生成方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
李波;王江晴;魏红昀;孙阳光;王新年;徐凌;: "一种女书手写字符规范字形自动生成方法" *
李波;王江晴;魏红昀;孙阳光;王新年;徐凌;: "一种女书手写字符规范字形自动生成方法", 中文信息学报, no. 02 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112765935A (zh) * 2021-01-18 2021-05-07 上海锐线创意设计有限公司 一种文字外形个性化处理方法及系统
CN112765935B (zh) * 2021-01-18 2024-04-26 上海锐线创意设计有限公司 一种文字外形个性化处理方法及系统

Also Published As

Publication number Publication date
CN111310579B (zh) 2023-06-23

Similar Documents

Publication Publication Date Title
JP3842006B2 (ja) 帳票類判別装置、帳票類判別方法、およびこれらの方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
US7106904B2 (en) Form identification method
WO2017101224A1 (zh) 一种商标检索方法、装置、系统以及计算机存储介质
WO2010092952A1 (ja) パターン認識装置
EP0757326A1 (en) Skin pattern and fingerprint classification system
US20040096105A1 (en) Method, device and computer program for recognition of a handwritten character
CN113723330B (zh) 一种图表文档信息理解的方法及系统
CN111275049B (zh) 一种文字图像骨架特征描述符获取的方法及装置
CN112016481B (zh) 基于ocr的财务报表信息检测和识别方法
JP3228938B2 (ja) 分布マップを用いる画像の分類方法及び装置
JPS63182793A (ja) 文字切り出し方式
CN104794485A (zh) 一种识别书写字的方法及装置
CN111310579B (zh) 一种图像骨架节点特征描述符获取方法及装置
CN110378337B (zh) 金属切削刀具图纸标识信息视觉输入方法及系统
JP4541995B2 (ja) 図形認識方法
Tian et al. Table frame line detection in low quality document images based on hough transform
US20030123730A1 (en) Document recognition system and method using vertical line adjacency graphs
CN111275050B (zh) 一种图像骨架线提取处理方法及装置
Chiou et al. Recognition of Chinese business cards
Fermanian et al. Deep recognition-based character segmentation in handwritten syriac manuscripts
Suleyman et al. The Design and Implementation of Chinese-Uyghur Printed Document Retrieval System Based on OCR
JPH0147835B2 (zh)
Babczyński et al. Direct Tensor Voting in line segmentation of handwritten documents
JP2578768B2 (ja) 画像処理方法
Aouadi et al. Localization Of Touching Letters In Arabic Handwritten Documents

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant