CN111275049B - 一种文字图像骨架特征描述符获取的方法及装置 - Google Patents
一种文字图像骨架特征描述符获取的方法及装置 Download PDFInfo
- Publication number
- CN111275049B CN111275049B CN202010060275.XA CN202010060275A CN111275049B CN 111275049 B CN111275049 B CN 111275049B CN 202010060275 A CN202010060275 A CN 202010060275A CN 111275049 B CN111275049 B CN 111275049B
- Authority
- CN
- China
- Prior art keywords
- skeleton
- line
- segment
- color
- line segment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
- G06V10/267—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/136—Segmentation; Edge detection involving thresholding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/90—Determination of colour characteristics
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Character Input (AREA)
- Image Analysis (AREA)
Abstract
本发明提供了一种文字图像骨架特征描述符获取的方法及装置。其中方法包括步骤S1,对输入图像进行色块分割,获取色块连通域的水平向和垂直向色段线及其端点,获得水平向和垂直向的色段线的中点;S2,对水平向和垂直向色段线的中点进行判断,找出骨架点并划分骨架点类型,获取修正后骨架线;S3,在正位后的骨架线中找出最长水平线段和最长垂直线段,对骨架线线段的笔画线型进行划分和编码;S4,按照预设顺序对骨架线线段的笔画线型编码进行排序,将排序后的骨架线线段的笔画线型编码的集合作为文字图像骨架特征描述符。装置包括第一获取模块、第二获取模块、处理模块、生成模块。该方法及装置可提高文字的笔画提取准确率,提高文字图像识别检索中相同或近似图像的匹配效果。
Description
技术领域
本发明涉及图像识别领域,特别涉及一种文字图像骨架特征描述符获取的方法及装置。
背景技术
图像骨架是对物体形状特征的一种简化描述方式,正确获得图像骨架特征在图像识别技术应用方面具有重要意义。简洁准确的图像骨架能够突出图像所描述的物体的整体结构,反映物体的形状构成信息,因而在数字图像分析中具有重要的地位,图像骨架提取是进行图像识别、线条类图像目标分析的重要手段。
对文字图像的识别主要是通过识别获取图像内的文字内容,最常用的手段是OCR文字图像识别。
OCR文字图像识别虽能将许多种情形下的文字图像中识别出文字信息,但当文字图像具有一定的图形化,或文字按弧形排列或其他非常规的行排时,则很困难完成文字信息的识别或造成文字识别的错误、文字的遗漏等缺陷。
现有技术方法所提取的图像骨架可以有效描述图像的稳定特征,消除多种因素造成的图像轮廓失真影响,但在文字类图像的骨架提取时,明显存在如下局限或缺陷:
1)传统方法提取的文字图像骨架线笔划与文字本身的笔划不对应,横竖笔画的骨架线常出现“枝丫”的线段,导致骨架线失真;
2)同一文字不同的字体所提取出的骨架线存在差异,以使相同文字的图像骨架特征不同,在相同文字图像检索时造成图像骨架特征匹配困难。
发明内容
鉴于上述现有技术的不足之处,本发明的目的在于提供一种文字图像骨架特征描述符获取的方法及装置。
为了达到上述目的,本发明采取了以下技术方案:
一种文字图像骨架特征描述符获取的方法,包括步骤:
S1,对输入图像进行色块分割,提取色块连通域的水平向和垂直向色段线及其端点,获得水平向和垂直向色段线的中点;
S2,对水平向和垂直向色段线的中点进行判断,找出骨架点并划分a类骨架点和b类骨架点,并对骨架点进行修正处理,获得修正后骨架线;
S3,获取正位后的图像骨架线,找出骨架线段上最长水平线段和最长垂直线段,对骨架线线段的笔画线型进行划分和编码;
S4,按照预设顺序对骨架线线段的笔画线型编码进行排序,将排序后的骨架线线段的笔画线型编码的集合作为文字图像骨架特征描述符。
所述的文字图像骨架特征描述符获取的方法中,步骤S1包括:
S101,对输入图像进行色块分割;
S102,提取色块连通域的色段线及其端点;
S103,获取水平向和垂直向色段线的中点;
其中,色块连通域的色段线包括水平向色段线和垂直向色段线。
所述的文字图像骨架特征描述符获取的方法中,所述对输入图像进行色块分割的方法包括:
提取输入图像每一像素点的颜色值,计算多色级的二值化自适应阈值,对输入图像进行色块连通域的分割,获得像素点色块连通域;
所述提取色块连通域的色段线及其端点的方法包括:
第一,将归入同一色块连通域在水平方向连续相连的像素点连线作为水平向色段线,将归入同一色块连通域在垂直方向连续相连的像素点连线作为垂直向色段线;
第二,将水平向色段线中像素点x坐标值最大和最小的像素点作为水平向色段线的端点,将垂直向色段线中像素点y坐标值最大和最小的像素点作为垂直向色段线的端点。
所述的文字图像骨架特征描述符获取的方法中,步骤S2包括:
S201,对水平向色段线的中点进行判断,找出骨架点并划分a类骨架点和b类骨架点;
S202,对垂直向色段线的中点进行判断,找出骨架点并划分a类骨架点和b类骨架点;
S203,对骨架点进行修正处理,获得修正后图像骨架线。
所述的文字图像骨架特征描述符获取的方法中,所述对水平向色段线的中点进行判断,找出骨架点并划分a类骨架点和b类骨架点的方法包括:
第一,根据步骤S1所获得的水平向色段线的中点,对水平向色段线的中点与色块连通域轮廓线的距离进行判断,如果该色段线的中点沿水平方向至该色块连通域轮廓线的最近距离小于沿垂直方向至该色块连通域轮廓线的最近距离,则该色段线的中点标记为骨架点,否则,该色段线的中点标记为非骨架点;
第二,对骨架点进行分类:判断该骨架点是否处于连续相连的水平向色段线上,如果是,则标记为a类骨架点;如果不是,则标记为b类骨架点;将a类骨架点的集合组成的线段作为主要骨架线段,将b类骨架点的集合组成的线段作为次要骨架线段;
重复上述步骤,直至所有水平向色段线的像素点遍历完成;
所述对垂直向色段线的中点进行判断,找出骨架点并划分a类骨架点和b类骨架点的方法包括:
第一,根据步骤S1所获得的垂直向色段线的中点,对垂直向色段线的中点与色块连通域轮廓线的距离进行判断,如果该色段线的中点沿垂直方向至该色块连通域轮廓线的最近距离小于沿水平方向至该色块连通域轮廓线的最近距离,则该色段线的中点标记为骨架点,否则,该色段线的中点标记为非骨架点;
第二,对骨架点进行分类:判断该骨架点是否处于连续相连的垂直向色段线上,如果是,则标记为a类骨架点;如果不是,则标记为b类骨架点;将a类骨架点的集合组成的线段作为主要骨架线段,将b类骨架点的集合组成的线段作为次要骨架线段;
重复上述步骤,直至所有垂直向色段线的像素点遍历完成;
所述对骨架点进行修正处理,获得修正后图像骨架线的方法包括:
首先,测量每条主要骨架线段的线长;
然后,对主要骨架线段进行稳定主要骨架线段和非稳定主要骨架线段的分类:当主要骨架线段的线长大于或等于预设阈值时,将该主要骨架线段作为稳定主要骨架线段,否则,作为非稳定主要骨架线段;
最后,将非稳定主要骨架线段作为离散骨架点或离散骨架线段,将稳定主要骨架线段作为修正后的骨架线。
所述的文字图像骨架特征描述符获取的方法中,步骤S3包括:
S301,获取正位后图像骨架线;
S302,找出骨架线段上最长水平线段和最长垂直线段;
S303,对骨架线线段的笔画线型进行划分;
S304,对骨架线线段的笔画线型划分结果进行编码。
所述的文字图像骨架特征描述符获取的方法中,
所述获取正位后图像骨架线的方法包括:
旋转修正后图像骨架线,获取各种角度下修正后图像骨架线的有效区域大小尺寸,选择旋转角度最小且为有效区域大小尺寸最小时的图像骨架线状态,获取正位后图像骨架线,其中,所述的图像骨架线的有效区域是指由图像骨架线的内接矩形所围成的内部区域;
所述找出骨架线段上最长水平线段和最长垂直线段的方法包括:
分别统计正位后图像骨架线上每骨架线线段每一x坐标值所拥有的像素点数和每一y坐标值所拥有的像素点数,并找出骨架线线段中拥有像素点数最多的x坐标值或y坐标值,该y坐标值所拥有的像素点所组成的线段即为最长水平线段,该x坐标值所拥有的像素点所组成的线段即为最长垂直线段;
所述对骨架线线段的笔画线型进行划分的方法包括:
将骨架线线段的笔画线型划分为横骨架线线段、竖骨架线线段、撇骨架线线段、捺骨架线线段,并按预设的笔画线型划分规则确认骨架线线段的笔画线型;
所述对骨架线线段的笔画线型划分结果进行编码的方法包括:
将横骨架线线段、竖骨架线线段、撇骨架线线段、捺骨架线线段采用数字、字母或符号进行表示,将该数字、字母或符号的集合作为骨架线线段的笔画线型编码。
所述的文字图像骨架特征描述符获取的方法中,所述预设的笔画线型划分规则包括:
1)当骨架线段上最长水平线段的像素点数大于或等于预设的水平骨架线线长阈值时,该正位后图像骨架线线段确认为横骨架线线段;
2)当骨架线段上最长垂直线段的像素点数大于或等于预设的垂直骨架线线长阈值时,该正位后图像骨架线线段确认为竖骨架线线段;
3)当骨架线段上最长水平线段的像素点数小于预设的水平骨架线线长阈值,且不满足规则2)所述条件,但该骨架线线段的两端点y轴坐标值的差与该线段两端点x轴坐标值的差之比小于或等于预设坡度比阈值时,该正位后图像骨架线线段仍确认为横骨架线线段;
4)当骨架线段上最长垂直线段的像素点数小于预设的垂直骨架线线长阈值,且不满足规则1)所述条件,但该骨架线线段的两端点x轴坐标值的差与该线段两端点y轴坐标值的差之比小于或等于预设坡度比阈值时,该正位后图像骨架线线段仍确认为竖骨架线线段;
5)当骨架线段上最长水平线段的像素点数小于预设的水平骨架线线长阈值且不满足规则3)所述条件,或骨架线段上最长垂直线段的像素点数小于预设的垂直骨架线线长阈值且不满足规则4)所述条件时,将该正位后图像骨架线线段的端点的y轴坐标最大值的像素点处在该线段右侧的骨架线线段确认为撇骨架线线段;
6)当骨架线段上最长水平线段的像素点数小于预设的水平骨架线线长阈值且不满足规则3)所述条件,或骨架线段上最长垂直线段的像素点数小于预设的垂直骨架线线长阈值且不满足规则4)所述条件时,将该正位后图像骨架线线段的端点的y轴坐标最大值的像素点处在该线段左侧的骨架线线段确认为捺骨架线线段。
所述的文字图像骨架特征描述符获取的方法中,步骤S4中,所述预设顺序为从左往右并从上到下地进行排序。
一种文字图像骨架特征描述符获取装置,包括:
第一获取模块,用于对输入图像进行色块分割,提取色块连通域的水平向和垂直向色段线及其端点,获得水平向和垂直向色段线的中点;
第二获取模块,用于对水平向和垂直向色段线的中点进行判断,找出骨架点并划分a类骨架点和b类骨架点,并对骨架点进行修正处理,获得修正后骨架线;
处理模块,用于获取正位后的图像骨架线,找出骨架线段上最长水平线段和最长垂直线段,对骨架线线段的笔画线型进行划分和编码;
生成模块,用于按照预设顺序对骨架线线段的笔画线型编码进行排序,将排序后的骨架线线段的笔画线型编码的集合作为文字图像骨架特征描述符。
有益效果:
本发明提供的一种文字图像骨架特征描述符获取的方法及装置,与现有技术相比具有以下优点:
1、可以实现相同文字的图像骨架特征描述符相同的描述,能有效克服使用传统方法提取的文字图像骨架线笔划与文字本身的笔划不对应,横竖笔画的骨架线常出现“枝丫”的线段,导致骨架线失真的缺陷;
2、解决了骨架线提取中骨架线线段笔画粘连的问题,提高文字的笔画提取准确率;
3、可以解决复杂的交叉区域的提取,将交叉区域的提取直接转为简单的横竖撇捺的字形笔划提取;
4、能有效实现同一文字不同的字体所提取出的图像骨架特征描述符基本相同,提高文字图像识别检索中相同或近似图像的匹配效果;
5、提取的文字图像骨架特征描述符是对图像轮廓特征描述符的补充完善,两者的结合运用可以更完整更精准实现图像特征的识别和描述,有效提高了图像识别检索中相同或近似图像的匹配效果。
附图说明
图1为本发明提供的文字图像骨架特征描述符获取的方法的流程图。
图2为随机给出两款示例性文字图像。
图3为从图2的a提取的水平向色段线端点的集合的示意图。
图4为从图2的b提取的垂直向色段线端点的集合的示意图。
图5为是笔画线型编码与骨架线线段的对应位置的示意图。
图6为本发明提供的文字图像骨架特征描述符获取装置的结构示意图。
图7为本发明提供的文字图像骨架特征描述符获取装置中,第一获取模块的结构示意图。
图8为本发明提供的文字图像骨架特征描述符获取装置中,第二获取模块的结构示意图。
图9为本发明提供的文字图像骨架特征描述符获取装置中,处理模块的结构示意图。
具体实施方式
下面详细描述本发明的实施方式,所述实施方式的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施方式是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
请参阅图1-5,本发明提供的一种文字图像骨架特征描述符获取的方法,包括步骤S1、S2、S3、S4;
S1,对输入图像进行色块分割,提取色块连通域的水平向和垂直向色段线及其端点,获得水平向和垂直向色段线的中点。
本技术方案的输入图像是含有文字的图像,这些输入图像可以通过电脑设备、摄像功能的手机、照相机、摄像头或集合有摄像头或存储图像的其他设备所获取,这些输入图像均可用于本技术方法的文字图像骨架特征描述符的获取处理。
为了便于说明,图2随机给出两款示例性文字图像,图中a是的黑体字“星”的文字图像、b是宋体字“星”的文字图像,均可作为本技术方案的处理对象。
该步骤S1包括步骤S101、S102、S103。
S101,对输入图像进行色块分割
对输入图像进行色块分割的方法包括:
提取输入图像每一像素点的颜色值,计算多色级的二值化自适应阈值,对输入图像进行色块连通域的分割,获得像素点色块连通域。
S102,提取色块连通域的色段线及其端点
色块连通域的色段线包括水平向色段线和垂直向色段线,提取色块连通域的色段线及其端点的方法包括:
第一,将归入同一色块连通域在水平方向连续相连的像素点连线作为水平向色段线,将归入同一色块连通域在垂直方向连续相连的像素点连线作为垂直向色段线;
第二,将水平向色段线中像素点x坐标值最大和最小的像素点作为水平向色段线的端点,将垂直向色段线中像素点y坐标值最大和最小的像素点作为垂直向色段线的端点;
如图3所示,图3是图2的a提取的水平向色段线端点的集合的示意图;如图4所示,图4是图2的b提取的垂直向色段线端点的集合的示意图。
S103,获取水平向和垂直向色段线的中点
根据前步所获得的水平向色段线的像素点数据中,按从左到右的方向逐行遍历水平向色段线的像素点,以获取水平向色段线的中点。具体地,提取水平向和垂直向色段线的中点具体方法包括:
第一,统计该水平向或垂直向色段线的像素点总数,将该像素点总数作为水平向或垂直向色段线的线长;
第二,当线长数为奇数时,以位于该水平向或垂直向色段线中间位置的1个像素点为水平向或垂直向色段线的中点;
第三,当线长数为偶数时,以位于该水平向或垂直向色段线中间位置的2个像素点共同为水平向或垂直向色段线的中点。
S2,对水平向和垂直向色段线的中点进行判断,找出骨架点并划分a类骨架点和b类骨架点,并对骨架点进行修正处理,获得修正后骨架线。
该步骤S2包括步骤S201、S202、S203。
S201,对水平向色段线的中点进行判断,找出骨架点并划分a类骨架点和b类骨架点对水平向色段线的中点进行判断,找出骨架点并划分a类骨架点和b类骨架点的方法包括:第一,根据前述步骤S1(具体为S103)所获得的水平向色段线的中点;对水平向色段线的中点与色块连通域轮廓线的距离进行判断,如果该色段线的中点沿水平方向至该色块连通域轮廓线的最近距离小于沿垂直方向至该色块连通域轮廓线的最近距离,则该色段线的中点标记为骨架点,否则,该色段线的中点标记为非骨架点;
第二,对骨架点进行分类:判断该骨架点是否处于连续相连的水平向色段线上,如果是,则标记为a类骨架点;如果不是,则标记为b类骨架点;将a类骨架点的集合组成的线段作为主要骨架线段,将b类骨架点的集合组成的线段作为次要骨架线段;
重复上述步骤,直至所有水平向色段线的像素点遍历完成。
S202,对垂直向色段线的中点进行判断,找出骨架点并划分a类骨架点和b类骨架点对垂直向色段线的中点进行判断,找出骨架点并划分a类骨架点和b类骨架点的方法包括:第一,根据前述步骤S1(具体为S103)所获得的垂直向色段线的中点,对垂直向色段线的中点与色块连通域轮廓线的距离进行判断,如果该色段线的中点沿垂直方向至该色块连通域轮廓线的最近距离小于沿水平方向至该色块连通域轮廓线的最近距离,则该色段线的中点标记为骨架点,否则,该色段线的中点标记为非骨架点;
第二,对骨架点进行分类:判断该骨架点是否处于连续相连的垂直向色段线上,如果是,则标记为a类骨架点;如果不是,则标记为b类骨架点;将a类骨架点的集合组成的线段作为主要骨架线段,将b类骨架点的集合组成的线段作为次要骨架线段;
重复上述步骤,直至所有垂直向色段线的像素点遍历完成。
S203,对骨架点进行修正处理,获得修正后图像骨架线
在实际应用中,一些文字图像可能会因书写或拍摄等图素的影响,导致文字的边缘线不平滑,从而产生个别一些骨架点呈现离散状态,这些离散状态的骨架点不是文字图像的主要特征,所以,有必要对他进行去除处理。
对骨架点进行修正处理,获得修正后图像骨架线的方法包括:
首先,测量每条主要骨架线段的线长;
然后,对主要骨架线段进行稳定主要骨架线段和非稳定主要骨架线段的分类:当主要骨架线段的线长大于或等于预设阈值a时,将该主要骨架线段作为稳定主要骨架线段,否则,作为非稳定主要骨架线段;其中,预设阈值a可在大于主要骨架线段线长最大值L的2%范围内取值(即a>2%L);
最后,将非稳定主要骨架线段作为离散骨架点或离散骨架线段,将稳定主要骨架线段作为修正后的骨架线。如图5所示,图5是经过修正处理后得到的图像骨架线示意图。
S3,获取正位后的图像骨架线,找出骨架线段上最长水平线段和最长垂直线段,对骨架线线段的笔画线型进行划分和编码。
本技术方案处理的输入图像为文字图像,文字具有笔画的特征,将骨架线的线段转换为笔画能更好地反映文字的特征。
本技术方案由于经前述处理,所产生的骨架线线段均是不相交的,与传统方法所提取的骨架线基本会存在骨架线相交的问题明显不同,因此,本方案所产生的骨架线线段可以归为横、竖、撇、捺四种,不会出现笔画折的情形。
该步骤S3包括步骤S301、S302、S303、S304。
S301,获取正位后图像骨架线
获取正位后图像骨架线的方法包括:
旋转修正后图像骨架线,获取各种角度下修正后图像骨架线的有效区域大小尺寸,选择旋转角度最小且为有效区域大小尺寸最小时的图像骨架线状态,获取正位后图像骨架线,其中,所述的图像骨架线的有效区域是指由图像骨架线的外接矩形所围成的内部区域。
S302,找出骨架线段上最长水平线段和最长垂直线段
找出骨架线段上最长水平线段和最长垂直线段的方法包括:
分别统计正位后图像骨架线上每骨架线线段每一x坐标值所拥有的像素点数和每一y坐标值所拥有的像素点数,并找出骨架线线段中拥有像素点数最多的x坐标值或y坐标值,该y坐标值所拥有的像素点所组成的线段即为最长水平线段(该线段可以是连续的,也可以是不连续的),该x坐标值所拥有的像素点所组成的线段即为最长垂直线段(该线段可以是连续的,也可以是不连续的)。
S303,对骨架线线段的笔画线型进行划分
对骨架线线段的笔画线型进行划分的方法包括:
将骨架线线段的笔画线型划分为横骨架线线段、竖骨架线线段、撇骨架线线段、捺骨架线线段,并按预设的笔画线型划分规则确认骨架线线段的笔画线型;
上述的预设的笔画线型划分规则包括:
1)当骨架线段上最长水平线段的像素点数大于或等于预设的水平骨架线线长阈值时,该正位后图像骨架线线段确认为横骨架线线段;
2)当骨架线段上最长垂直线段的像素点数大于或等于预设的垂直骨架线线长阈值时,该正位后图像骨架线线段确认为竖骨架线线段;
3)当骨架线段上最长水平线段的像素点数小于预设的水平骨架线线长阈值,且不满足规则2)条件,但该骨架线线段的两端点y轴坐标值的差与该线段两端点x轴坐标值的差之比小于或等于预设坡度比阈值时,该正位后图像骨架线线段仍确认为横骨架线线段;
4)当骨架线段上最长垂直线段的像素点数小于预设的垂直骨架线线长阈值,且不满足规则1)条件,但该骨架线线段的两端点x轴坐标值的差与该线段两端点y轴坐标值的差之比小于或等于预设坡度比阈值时,该正位后图像骨架线线段仍确认为竖骨架线线段;
5)当骨架线段上最长水平线段的像素点数小于预设的水平骨架线线长阈值且不满足规则3)条件,或骨架线段上最长垂直线段的像素点数小于预设的垂直骨架线线长阈值且不满足规则4)条件时,将该正位后图像骨架线线段的端点的y轴坐标最大值的像素点处在该线段右侧的骨架线线段确认为撇骨架线线段;
6)当骨架线段上最长水平线段的像素点数小于预设的水平骨架线线长阈值且不满足规则3)条件,或骨架线段上最长垂直线段的像素点数小于预设的垂直骨架线线长阈值且不满足规则4)条件时,将该正位后图像骨架线线段的端点的y轴坐标最大值的像素点处在该线段左侧的骨架线线段确认为捺骨架线线段。
S304,对骨架线线段的笔画线型划分结果进行编码
骨架线线段的笔画线型划分结果包括:横骨架线线段、竖骨架线线段、撇骨架线线段、捺骨架线线段。
实际应用中,为了方便计算机的识别与运算,对骨架线线段的笔画线型划分结果进行编码的方法包括:
将横骨架线线段、竖骨架线线段、撇骨架线线段、捺骨架线线段采用数字、字母或符号进行表示,将该数字、字母或符号的集合作为骨架线线段的笔画线型编码。
举例说明:
假设某一文字由“横、横、竖、撇、捺”的笔画类型构成,骨架线线段的笔画线型采用数字进行表示,求该文字的笔画编码。
解得:假设将横骨架线线段用1表示,将竖骨架线线段用2表示,将撇骨架线线段用3表示,将捺骨架线线段用4表示,该文字的笔画编码为:11234。
S4,按照预设顺序对骨架线线段的笔画线型编码进行排序,将排序后的骨架线线段的笔画线型编码的集合作为文字图像骨架特征描述符。
可以根据应用的需要设定上述的预设顺序,例如:从左往右并从上到下地进行排序。
按照预设顺序对骨架线线段的笔画线型编码进行排序后,可得每一骨架线线段的序号,沿该序号的顺序,将每一骨架线线段的序号目换为每一骨架线线段的笔画线型编码就可得如下形式的字符串:
|X1,X2,X3,…,Xi|
其中i表示第i条骨架线线段,X1表示第1条骨架线段的笔画线型编码,X2表示第2条骨架线段的笔画线型编码,X3表示第3条骨架线段的笔画线型编码,Xi表示第i条骨架线段的笔画线型编码,以此类推。
以图2的“星”字图像为例,经上述处理可得到按照骨架线线段的位置顺序对该图像的骨架线段的笔画线型编码排序后的一组字符串“12212212113211211”,将该一组字符串作为文字图像骨架特征描述符。每一字符所对应的位置如图5所示,图5是笔画线型编码与骨架线线段的对应位置的示意图。
通过上述处理的文字图像骨架特征描述符,可以应用于文字图像的检索。通过文字图像骨架特征描述符的匹配检索,能实现相同或近似文字图像的较好检索效果。
由上所述,该文字图像骨架特征描述符获取的方法,通过对输入图像进行色块分割,提取色块连通域的水平向和垂直向色段线及其端点,获得水平向和垂直向色段线的中点;对水平向和垂直向色段线的中点进行判断,找出骨架点并划分a类骨架点和b类骨架点,并对骨架点进行修正处理,获得修正后骨架线;获取正位后的图像骨架线,找出骨架线段上最长水平线段和最长垂直线段,对骨架线线段的笔画线型进行划分和编码;按照预设顺序对骨架线线段的笔画线型编码进行排序,将排序后的骨架线线段的笔画线型编码的集合作为文字图像骨架特征描述符;从而得到文字图像骨架特征描述符,具有以下优点:
1、可以实现相同文字的图像骨架特征描述符相同的描述,能有效克服使用传统方法提取的文字图像骨架线笔划与文字本身的笔划不对应,横竖笔画的骨架线常出现“枝丫”的线段,导致骨架线失真的缺陷;
2、解决了骨架线提取中骨架线线段笔画粘连的问题,提高文字的笔画提取准确率;
3、可以解决复杂的交叉区域的提取,将交叉区域的提取直接转为简单的横竖撇捺的字形笔划提取;
4、能有效实现同一文字不同的字体所提取出的图像骨架特征描述符基本相同,提高文字图像识别检索中相同或近似图像的匹配效果;
5、提取的文字图像骨架特征描述符是对图像轮廓特征描述符的补充完善,两者的结合运用可以更完整更精准实现图像特征的识别和描述,有效提高了图像识别检索中相同或近似图像的匹配效果。
请参阅图6-9,本发明提供还一种文字图像骨架特征描述符获取装置,包括第一获取模块1、第二获取模块2、处理模块3、生成模块4;
其中,第一获取模块1,用于对输入图像进行色块分割,提取色块连通域的水平向和垂直向色段线及其端点,获得水平向和垂直向色段线的中点;
其中,第二获取模块2,用于对水平向和垂直向色段线的中点进行判断,找出骨架点并划分a类骨架点和b类骨架点,并对骨架点进行修正处理,获得修正后骨架线;
其中,处理模块3,用于获取正位后的图像骨架线,找出骨架线段上最长水平线段和最长垂直线段,对骨架线线段的笔画线型进行划分和编码;
其中,生成模块4,用于按照预设顺序对骨架线线段的笔画线型编码进行排序,将排序后的骨架线线段的笔画线型编码的集合作为文字图像骨架特征描述符。
进一步的,见图7,第一获取模块1包括分割单元1.1、提取单元1.2、第一获取单元1.3;
其中,分割单元1.1,用于对输入图像进行色块分割;
其中,提取单元1.2,用于提取色块连通域的色段线及其端点;
其中,第一获取单元1.3,用于获取水平向和垂直向色段线的中点。
在一些实施方式中,见图8,第二获取模块2包括第一划分单元2.1、第二划分单元2.2、修正单元2.3;
其中,第一划分单元2.1,用于对水平向色段线的中点进行判断,找出骨架点并划分a类骨架点和b类骨架点;
其中,第二划分单元2.2,用于对垂直向色段线的中点进行判断,找出骨架点并划分a类骨架点和b类骨架点;
其中,修正单元2.3,用于对骨架点进行修正处理,获得修正后图像骨架线。
本实施例中,见图9,处理模块3包括第二获取单元3.1、第三获取单元3.2、第三划分单元3.3、编码单元3.4;
其中,第二获取单元3.1,用于获取正位后图像骨架线;
其中,第三获取单元3.2,用于找出骨架线段上最长水平线段和最长垂直线段;
其中,第三划分单元3.3,用于对骨架线线段的笔画线型进行划分;
其中,编码单元3.4,用于对骨架线线段的笔画线型划分结果进行编码。
由上所述,该文字图像骨架特征描述符获取装置,通过对输入图像进行色块分割,提取色块连通域的水平向和垂直向色段线及其端点,获得水平向和垂直向色段线的中点;对水平向和垂直向色段线的中点进行判断,找出骨架点并划分a类骨架点和b类骨架点,并对骨架点进行修正处理,获得修正后骨架线;获取正位后的图像骨架线,找出骨架线段上最长水平线段和最长垂直线段,对骨架线线段的笔画线型进行划分和编码;按照预设顺序对骨架线线段的笔画线型编码进行排序,将排序后的骨架线线段的笔画线型编码的集合作为文字图像骨架特征描述符;从而得到文字图像骨架特征描述符,具有以下优点:
1、可以实现相同文字的图像骨架特征描述符相同的描述,能有效克服使用传统方法提取的文字图像骨架线笔划与文字本身的笔划不对应,横竖笔画的骨架线常出现“枝丫”的线段,导致骨架线失真的缺陷;
2、解决了骨架线提取中骨架线线段笔画粘连的问题,提高文字的笔画提取准确率;
3、可以解决复杂的交叉区域的提取,将交叉区域的提取直接转为简单的横竖撇捺的字形笔划提取;
4、能有效实现同一文字不同的字体所提取出的图像骨架特征描述符基本相同,提高文字图像识别检索中相同或近似图像的匹配效果;
5、提取的文字图像骨架特征描述符是对图像轮廓特征描述符的补充完善,两者的结合运用可以更完整更精准实现图像特征的识别和描述,有效提高了图像识别检索中相同或近似图像的匹配效果。
综上所述,虽然本发明已以优选实施例揭露如上,但上述优选实施例并非用以限制本发明,本领域的普通技术人员,在不脱离本发明的精神和范围内,均可作各种更动与润饰,其方案与本发明实质上相同。
Claims (7)
1.一种文字图像骨架特征描述符获取的方法,其特征在于,包括步骤:
S1,对输入图像进行色块分割,提取色块连通域的水平向色段线和垂直向色段线及其端点,获得水平向色段线和垂直向色段线的中点;
S2,对水平向色段线和垂直向色段线的中点进行判断,找出骨架点并划分a类骨架点和b类骨架点,并对骨架点进行修正处理,获得修正后图像骨架线;
S3,获取正位后图像骨架线,找出正位后图像骨架线线段上最长水平线段和最长垂直线段,对正位后图像骨架线线段的笔画线型进行划分和编码;
S4,按照预设顺序对正位后图像骨架线线段的笔画线型编码进行排序,将排序后的正位后图像骨架线线段的笔画线型编码的集合作为文字图像骨架特征描述符;步骤S2中,所述对水平向色段线的中点进行判断,找出骨架点并划分a类骨架点和b类骨架点的方法包括:
第一,根据步骤S1所获得的水平向色段线的中点,对水平向色段线的中点与色块连通域轮廓线的距离进行判断,如果该色段线的中点沿水平方向至该色块连通域轮廓线的最近距离小于沿垂直方向至该色块连通域轮廓线的最近距离,则该色段线的中点标记为骨架点,否则,该色段线的中点标记为非骨架点;
第二,对骨架点进行分类:判断该骨架点是否处于连续相连的水平向色段线上,如果是,则标记为a类骨架点;如果不是,则标记为b类骨架点;将a类骨架点的集合组成的线段作为主要骨架线段,将b类骨架点的集合组成的线段作为次要骨架线段;
重复上述步骤,直至所有水平向色段线的像素点遍历完成;
步骤S2中,所述对垂直向色段线的中点进行判断,找出骨架点并划分a类骨架点和b类骨架点的方法包括:
第一,根据步骤S1所获得的垂直向色段线的中点,对垂直向色段线的中点与色块连通域轮廓线的距离进行判断,如果该色段线的中点沿垂直方向至该色块连通域轮廓线的最近距离小于沿水平方向至该色块连通域轮廓线的最近距离,则该色段线的中点标记为骨架点,否则,该色段线的中点标记为非骨架点;
第二,对骨架点进行分类:判断该骨架点是否处于连续相连的垂直向色段线上,如果是,则标记为a类骨架点;如果不是,则标记为b类骨架点;将a类骨架点的集合组成的线段作为主要骨架线段,将b类骨架点的集合组成的线段作为次要骨架线段;
重复上述步骤,直至所有垂直向色段线的像素点遍历完成;
步骤S2中,所述对骨架点进行修正处理,获得修正后图像骨架线的方法包括:首先,测量每条主要骨架线段的线长;
然后,对主要骨架线段进行稳定主要骨架线段和非稳定主要骨架线段的分类:当主要骨架线段的线长大于或等于预设阈值时,将该主要骨架线段作为稳定主要骨架线段,否则,作为非稳定主要骨架线段;
最后,将非稳定主要骨架线段作为离散骨架点或离散骨架线段,将稳定主要骨架线段作为修正后图像骨架线;
步骤S3中,所述获取正位后图像骨架线的方法包括:
旋转修正后图像骨架线,获取各种角度下修正后图像骨架线的有效区域大小尺寸,选择旋转角度最小且为有效区域大小尺寸最小时的修正后图像骨架线状态,获取正位后图像骨架线,其中,所述的修正后图像骨架线的有效区域是指由修正后图像骨架线的内接矩形所围成的内部区域。
2.根据权利要求1所述的文字图像骨架特征描述符获取的方法,其特征在于,步骤S1包括:
S101,对输入图像进行色块分割;
S102,提取色块连通域的色段线及其端点;
S103,获取水平向色段线和垂直向色段线的中点;
其中,色块连通域的色段线包括水平向色段线和垂直向色段线。
3.根据权利要求2所述的文字图像骨架特征描述符获取的方法,其特征在于,所述对输入图像进行色块分割的方法包括:
提取输入图像每一像素点的颜色值,计算多色级的二值化自适应阈值,对输入图像进行色块连通域的分割,获得像素点色块连通域;
所述提取色块连通域的色段线及其端点的方法包括:
第一,将归入同一色块连通域在水平方向连续相连的像素点连线作为水平向色段线,将归入同一色块连通域在垂直方向连续相连的像素点连线作为垂直向色段线;第二,将水平向色段线中像素点x坐标值最大和最小的像素点作为水平向色段线的端点,将垂直向色段线中像素点y坐标值最大和最小的像素点作为垂直向色段线的端点。
4.根据权利要求1所述的文字图像骨架特征描述符获取的方法,其特征在于,所述找出正位后图像骨架线段上最长水平线段和最长垂直线段的方法包括:
分别统计正位后图像骨架线上每正位后图像骨架线线段每一x坐标值所拥有的像素点数和每一y坐标值所拥有的像素点数,并找出正位后图像骨架线线段中拥有像素点数最多的x坐标值或y坐标值,该y坐标值所拥有的像素点所组成的线段即为最长水平线段,该x坐标值所拥有的像素点所组成的线段即为最长垂直线段;
所述对正位后图像骨架线线段的笔画线型进行划分的方法包括:
将正位后图像骨架线线段的笔画线型划分为横骨架线线段、竖骨架线线段、撇骨架线线段、捺骨架线线段,并按预设的笔画线型划分规则确认正位后图像骨架线线段的笔画线型;
所述对正位后图像骨架线线段的笔画线型划分结果进行编码的方法包括:
将横骨架线线段、竖骨架线线段、撇骨架线线段、捺骨架线线段采用数字、字母或符号进行表示,将该数字、字母或符号的集合作为正位后图像骨架线线段的笔画线型编码。
5.根据权利要求4所述的文字图像骨架特征描述符获取的方法,其特征在于,所述预设的笔画线型划分规则包括:
1)当正位后图像骨架线线段上最长水平线段的像素点数大于或等于预设的水平骨架线线长阈值时,该正位后图像骨架线线段确认为横骨架线线段;
2)当正位后图像骨架线线段上最长垂直线段的像素点数大于或等于预设的垂直骨架线线长阈值时,该正位后图像骨架线线段确认为竖骨架线线段;
3)当正位后图像骨架线线段上最长水平线段的像素点数小于预设的水平骨架线线长阈值,且该正位后图像骨架线线段上最长垂直线段的像素点数小于预设的垂直骨架线线长阈值,但该正位后图像骨架线线段的两端点y轴坐标值的差与该线段两端点x轴坐标值的差之比小于或等于预设坡度比阈值时,该正位后图像骨架线线段仍确认为横骨架线线段;
4)当正位后图像骨架线线段上最长垂直线段的像素点数小于预设的垂直骨架线线长阈值,且该正位后图像骨架线线段上最长水平线段的像素点数小于预设的水平骨架线线长阈值,但该正位后图像骨架线线段的两端点x轴坐标值的差与该线段两端点y轴坐标值的差之比小于或等于预设坡度比阈值时,该正位后图像骨架线线段仍确认为竖骨架线线段;
5)当正位后图像骨架线线段上最长水平线段的像素点数小于预设的水平骨架线线长阈值且该正位后图像骨架线线段不确认为横骨架线线段,或正位后图像骨架线线段上最长垂直线段的像素点数小于预设的垂直骨架线线长阈值且该正位后图像骨架线线段不确认为竖骨架线线段时,将该正位后图像骨架线线段的端点的y轴坐标最大值的像素点处在该线段右侧的正位后图像骨架线线段确认为撇骨架线线段;
6)当正位后图像骨架线线段上最长水平线段的像素点数小于预设的水平骨架线线长阈值且该正位后图像骨架线线段不确认为横骨架线线段,或正位后图像骨架线线段上最长垂直线段的像素点数小于预设的垂直骨架线线长阈值且该正位后图像骨架线线段不确认为竖骨架线线段时,将该正位后图像骨架线线段的端点的y轴坐标最大值的像素点处在该线段左侧的正位后图像骨架线线段确认为捺骨架线线段。
6.根据权利要求1所述的文字图像骨架特征描述符获取的方法,其特征在于,步骤S4中,所述预设顺序为从左往右并从上到下地进行排序。
7.一种文字图像骨架特征描述符获取装置,其特征在于,包括:
第一获取模块,用于对输入图像进行色块分割,提取色块连通域的水平向色段线和垂直向色段线及其端点,获得水平向色段线和垂直向色段线的中点;
第二获取模块,用于对水平向色段线和垂直向色段线的中点进行判断,找出骨架点并划分a类骨架点和b类骨架点,并对骨架点进行修正处理,获得修正后图像骨架线;
处理模块,用于获取正位后图像骨架线,找出正位后图像骨架线线段上最长水平线段和最长垂直线段,对正位后图像骨架线线段的笔画线型进行划分和编码;
生成模块,用于按照预设顺序对正位后图像骨架线线段的笔画线型编码进行排序,将排序后的正位后图像骨架线线段的笔画线型编码的集合作为文字图像骨架特征描述符;
第二获取模块包括:
第一划分单元,用于对水平向色段线的中点进行判断,找出骨架点并划分a类骨架点和b类骨架点;
第二划分单元,用于对垂直向色段线的中点进行判断,找出骨架点并划分a类骨架点和b类骨架点;
修正单元,用于对骨架点进行修正处理,获得修正后图像骨架线;
所述对水平向色段线的中点进行判断,找出骨架点并划分a类骨架点和b类骨架点的方法包括:
第一,根据第一获取模块所获得的水平向色段线的中点,对水平向色段线的中点与色块连通域轮廓线的距离进行判断,如果该色段线的中点沿水平方向至该色块连通域轮廓线的最近距离小于沿垂直方向至该色块连通域轮廓线的最近距离,则该色段线的中点标记为骨架点,否则,该色段线的中点标记为非骨架点;
第二,对骨架点进行分类:判断该骨架点是否处于连续相连的水平向色段线上,如果是,则标记为a类骨架点;如果不是,则标记为b类骨架点;将a类骨架点的集合组成的线段作为主要骨架线段,将b类骨架点的集合组成的线段作为次要骨架线段;
重复上述步骤,直至所有水平向色段线的像素点遍历完成;
所述对垂直向色段线的中点进行判断,找出骨架点并划分a类骨架点和b类骨架点的方法包括:
第一,根据第一获取模块所获得的垂直向色段线的中点,对垂直向色段线的中点与色块连通域轮廓线的距离进行判断,如果该色段线的中点沿垂直方向至该色块连通域轮廓线的最近距离小于沿水平方向至该色块连通域轮廓线的最近距离,则该色段线的中点标记为骨架点,否则,该色段线的中点标记为非骨架点;
第二,对骨架点进行分类:判断该骨架点是否处于连续相连的垂直向色段线上,如果是,则标记为a类骨架点;如果不是,则标记为b类骨架点;将a类骨架点的集合组成的线段作为主要骨架线段,将b类骨架点的集合组成的线段作为次要骨架线段;
重复上述步骤,直至所有垂直向色段线的像素点遍历完成;
所述对骨架点进行修正处理,获得修正后图像骨架线的方法包括:
首先,测量每条主要骨架线段的线长;
然后,对主要骨架线段进行稳定主要骨架线段和非稳定主要骨架线段的分类:当主要骨架线段的线长大于或等于预设阈值时,将该主要骨架线段作为稳定主要骨架线段,否则,作为非稳定主要骨架线段;
最后,将非稳定主要骨架线段作为离散骨架点或离散骨架线段,将稳定主要骨架线段作为修正后的骨架线;
处理模块包括:
第二获取单元,用于获取正位后图像骨架线;
第三获取单元,用于找出正位后图像骨架线线段上最长水平线段和最长垂直线段;第三划分单元,用于对正位后图像骨架线线段的笔画线型进行划分;
编码单元,用于对正位后图像骨架线线段的笔画线型划分结果进行编码;
所述获取正位后图像骨架线的方法包括:
旋转修正后图像骨架线,获取各种角度下修正后图像骨架线的有效区域大小尺寸,选择旋转角度最小且为有效区域大小尺寸最小时的修正后图像骨架线状态,获取正位后图像骨架线,其中,所述的修正后图像骨架线的有效区域是指由修正后图像骨架线的内接矩形所围成的内部区域。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010060275.XA CN111275049B (zh) | 2020-01-19 | 2020-01-19 | 一种文字图像骨架特征描述符获取的方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010060275.XA CN111275049B (zh) | 2020-01-19 | 2020-01-19 | 一种文字图像骨架特征描述符获取的方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111275049A CN111275049A (zh) | 2020-06-12 |
CN111275049B true CN111275049B (zh) | 2023-07-21 |
Family
ID=71003068
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010060275.XA Active CN111275049B (zh) | 2020-01-19 | 2020-01-19 | 一种文字图像骨架特征描述符获取的方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111275049B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112765935B (zh) * | 2021-01-18 | 2024-04-26 | 上海锐线创意设计有限公司 | 一种文字外形个性化处理方法及系统 |
CN113838198B (zh) * | 2021-08-17 | 2023-12-05 | 上海师范大学 | 一种电子地图中文字的自动标注方法、装置及电子设备 |
CN114915788B (zh) * | 2022-07-19 | 2022-09-13 | 中科金勃信(山东)科技有限公司 | 一种用于档案的图像压缩方法、系统及介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08123904A (ja) * | 1994-10-21 | 1996-05-17 | Matsushita Electric Ind Co Ltd | 書体種類処理装置 |
CN1172981A (zh) * | 1997-06-27 | 1998-02-11 | 郭熙凡 | 可手写的数字图形编码及其识别方法 |
CN103942552A (zh) * | 2014-02-11 | 2014-07-23 | 北京大学 | 一种基于骨架指导的文字图像矢量化方法及系统 |
CN106295656A (zh) * | 2016-08-03 | 2017-01-04 | 徐庆 | 基于图像色块内容的图像轮廓特征提取方法和装置 |
CN106529543A (zh) * | 2016-11-02 | 2017-03-22 | 徐庆 | 一种动态计算多色级二值化自适应阈值的方法及其系统 |
WO2018149250A1 (zh) * | 2017-02-15 | 2018-08-23 | 宗刚 | 带屏幕提示界面的汉字骨架码输入法及系统 |
AU2017225022A1 (en) * | 2017-09-05 | 2019-03-21 | Canon Kabushiki Kaisha | Method, system and apparatus for processing image data |
WO2019192149A1 (zh) * | 2018-04-04 | 2019-10-10 | 南京阿凡达机器人科技有限公司 | 一种基于机器视觉的绘图方法及系统 |
-
2020
- 2020-01-19 CN CN202010060275.XA patent/CN111275049B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08123904A (ja) * | 1994-10-21 | 1996-05-17 | Matsushita Electric Ind Co Ltd | 書体種類処理装置 |
CN1172981A (zh) * | 1997-06-27 | 1998-02-11 | 郭熙凡 | 可手写的数字图形编码及其识别方法 |
CN103942552A (zh) * | 2014-02-11 | 2014-07-23 | 北京大学 | 一种基于骨架指导的文字图像矢量化方法及系统 |
CN106295656A (zh) * | 2016-08-03 | 2017-01-04 | 徐庆 | 基于图像色块内容的图像轮廓特征提取方法和装置 |
CN106529543A (zh) * | 2016-11-02 | 2017-03-22 | 徐庆 | 一种动态计算多色级二值化自适应阈值的方法及其系统 |
WO2018149250A1 (zh) * | 2017-02-15 | 2018-08-23 | 宗刚 | 带屏幕提示界面的汉字骨架码输入法及系统 |
AU2017225022A1 (en) * | 2017-09-05 | 2019-03-21 | Canon Kabushiki Kaisha | Method, system and apparatus for processing image data |
WO2019192149A1 (zh) * | 2018-04-04 | 2019-10-10 | 南京阿凡达机器人科技有限公司 | 一种基于机器视觉的绘图方法及系统 |
Non-Patent Citations (4)
Title |
---|
A FEATURE EXTRACTION TECHNIQUE BASED ON CHARACTER GEOMETRY FOR CHARACTER RECOGNITION;Dinesh Dileep;《https://arxiv.org/pdf/1202.3884.pdf》;20120228;第1-4页 * |
一种改进的图像骨架提取算法;叶福玲;《西昌学院学报(自然科学版)》;20180930;第32卷(第3期);第91-93页 * |
基于骨架化、骨架划分获取书法汉字结构特征方法;苗晋诚;《昆明理工大学学报(理工版)》;20080615(第3期);第53-61页 * |
用于粘连手写体汉字切分的二次寻点算法;吴越等;《计算机工程与应用》;20040801(第08期);第31-34页 * |
Also Published As
Publication number | Publication date |
---|---|
CN111275049A (zh) | 2020-06-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111275049B (zh) | 一种文字图像骨架特征描述符获取的方法及装置 | |
CN111814722B (zh) | 一种图像中的表格识别方法、装置、电子设备及存储介质 | |
EP3309704B1 (en) | Two-dimensional code partitioning and decoding method and system | |
Dave | Segmentation methods for hand written character recognition | |
JP2001092919A (ja) | 2次元バーコードのねじれ角決定法 | |
WO2017016448A1 (zh) | 一种qr码特征检测方法及系统 | |
WO2017041600A1 (zh) | 一种汉信码特征图形检测方法及系统 | |
CN103258201A (zh) | 一种融合全局和局部信息的表格线提取方法 | |
CN110598566A (zh) | 图像处理方法、装置、终端和计算机可读存储介质 | |
CN107944451B (zh) | 一种藏文古籍文档的行切分方法及系统 | |
CN113903024A (zh) | 一种手写票据数值信息识别方法、系统、介质及装置 | |
CN112364834A (zh) | 一种基于深度学习和图像处理的表格识别的还原方法 | |
CN112801088A (zh) | 一种扭曲文本行图像矫正的方法和相关装置 | |
US20190266431A1 (en) | Method, apparatus, and computer-readable medium for processing an image with horizontal and vertical text | |
CN108256518B (zh) | 文字区域检测方法及装置 | |
CN113723410B (zh) | 一种数码管数字识别方法及装置 | |
CN110378337B (zh) | 金属切削刀具图纸标识信息视觉输入方法及系统 | |
JP4541995B2 (ja) | 図形認識方法 | |
CN111310579B (zh) | 一种图像骨架节点特征描述符获取方法及装置 | |
CN113378847B (zh) | 字符分割方法、系统、计算机设备和存储介质 | |
CN113537216B (zh) | 一种点阵字体文本行倾斜校正方法及装置 | |
Mostafa | An adaptive algorithm for the automatic segmentation of printed Arabic text | |
Besekar et al. | A chain code approach for recognising modi script numerals | |
JP3303246B2 (ja) | 画像処理装置 | |
Tian et al. | Table frame line detection in low quality document images based on hough transform |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |