CN111275049B

CN111275049B - 一种文字图像骨架特征描述符获取的方法及装置

Info

Publication number: CN111275049B
Application number: CN202010060275.XA
Authority: CN
Inventors: 徐庆; 钟莉
Original assignee: Foshan Guofang Identification Technology Co Ltd
Current assignee: Foshan Guofang Identification Technology Co Ltd
Priority date: 2020-01-19
Filing date: 2020-01-19
Publication date: 2023-07-21
Anticipated expiration: 2040-01-19
Also published as: CN111275049A

Abstract

本发明提供了一种文字图像骨架特征描述符获取的方法及装置。其中方法包括步骤S1，对输入图像进行色块分割，获取色块连通域的水平向和垂直向色段线及其端点，获得水平向和垂直向的色段线的中点；S2，对水平向和垂直向色段线的中点进行判断，找出骨架点并划分骨架点类型，获取修正后骨架线；S3，在正位后的骨架线中找出最长水平线段和最长垂直线段，对骨架线线段的笔画线型进行划分和编码；S4，按照预设顺序对骨架线线段的笔画线型编码进行排序，将排序后的骨架线线段的笔画线型编码的集合作为文字图像骨架特征描述符。装置包括第一获取模块、第二获取模块、处理模块、生成模块。该方法及装置可提高文字的笔画提取准确率，提高文字图像识别检索中相同或近似图像的匹配效果。

Description

一种文字图像骨架特征描述符获取的方法及装置

技术领域

本发明涉及图像识别领域，特别涉及一种文字图像骨架特征描述符获取的方法及装置。

背景技术

图像骨架是对物体形状特征的一种简化描述方式，正确获得图像骨架特征在图像识别技术应用方面具有重要意义。简洁准确的图像骨架能够突出图像所描述的物体的整体结构，反映物体的形状构成信息，因而在数字图像分析中具有重要的地位，图像骨架提取是进行图像识别、线条类图像目标分析的重要手段。

对文字图像的识别主要是通过识别获取图像内的文字内容，最常用的手段是OCR文字图像识别。

OCR文字图像识别虽能将许多种情形下的文字图像中识别出文字信息，但当文字图像具有一定的图形化，或文字按弧形排列或其他非常规的行排时，则很困难完成文字信息的识别或造成文字识别的错误、文字的遗漏等缺陷。

现有技术方法所提取的图像骨架可以有效描述图像的稳定特征，消除多种因素造成的图像轮廓失真影响，但在文字类图像的骨架提取时，明显存在如下局限或缺陷：

1)传统方法提取的文字图像骨架线笔划与文字本身的笔划不对应，横竖笔画的骨架线常出现“枝丫”的线段，导致骨架线失真；

2)同一文字不同的字体所提取出的骨架线存在差异，以使相同文字的图像骨架特征不同，在相同文字图像检索时造成图像骨架特征匹配困难。

发明内容

鉴于上述现有技术的不足之处，本发明的目的在于提供一种文字图像骨架特征描述符获取的方法及装置。

为了达到上述目的，本发明采取了以下技术方案：

一种文字图像骨架特征描述符获取的方法，包括步骤：

S1，对输入图像进行色块分割，提取色块连通域的水平向和垂直向色段线及其端点，获得水平向和垂直向色段线的中点；

S2，对水平向和垂直向色段线的中点进行判断，找出骨架点并划分a类骨架点和b类骨架点，并对骨架点进行修正处理，获得修正后骨架线；

S3，获取正位后的图像骨架线，找出骨架线段上最长水平线段和最长垂直线段，对骨架线线段的笔画线型进行划分和编码；

S4，按照预设顺序对骨架线线段的笔画线型编码进行排序，将排序后的骨架线线段的笔画线型编码的集合作为文字图像骨架特征描述符。

所述的文字图像骨架特征描述符获取的方法中，步骤S1包括：

S101，对输入图像进行色块分割；

S102，提取色块连通域的色段线及其端点；

S103，获取水平向和垂直向色段线的中点；

其中，色块连通域的色段线包括水平向色段线和垂直向色段线。

所述的文字图像骨架特征描述符获取的方法中，所述对输入图像进行色块分割的方法包括：

提取输入图像每一像素点的颜色值，计算多色级的二值化自适应阈值，对输入图像进行色块连通域的分割，获得像素点色块连通域；

所述提取色块连通域的色段线及其端点的方法包括：

第一，将归入同一色块连通域在水平方向连续相连的像素点连线作为水平向色段线，将归入同一色块连通域在垂直方向连续相连的像素点连线作为垂直向色段线；

第二，将水平向色段线中像素点x坐标值最大和最小的像素点作为水平向色段线的端点，将垂直向色段线中像素点y坐标值最大和最小的像素点作为垂直向色段线的端点。

所述的文字图像骨架特征描述符获取的方法中，步骤S2包括：

S201,对水平向色段线的中点进行判断,找出骨架点并划分a类骨架点和b类骨架点；

S202,对垂直向色段线的中点进行判断，找出骨架点并划分a类骨架点和b类骨架点；

S203,对骨架点进行修正处理，获得修正后图像骨架线。

所述的文字图像骨架特征描述符获取的方法中，所述对水平向色段线的中点进行判断，找出骨架点并划分a类骨架点和b类骨架点的方法包括：

第一，根据步骤S1所获得的水平向色段线的中点，对水平向色段线的中点与色块连通域轮廓线的距离进行判断，如果该色段线的中点沿水平方向至该色块连通域轮廓线的最近距离小于沿垂直方向至该色块连通域轮廓线的最近距离，则该色段线的中点标记为骨架点，否则，该色段线的中点标记为非骨架点；

第二，对骨架点进行分类：判断该骨架点是否处于连续相连的水平向色段线上，如果是，则标记为a类骨架点；如果不是，则标记为b类骨架点；将a类骨架点的集合组成的线段作为主要骨架线段，将b类骨架点的集合组成的线段作为次要骨架线段；

重复上述步骤，直至所有水平向色段线的像素点遍历完成；

所述对垂直向色段线的中点进行判断，找出骨架点并划分a类骨架点和b类骨架点的方法包括：

第一，根据步骤S1所获得的垂直向色段线的中点，对垂直向色段线的中点与色块连通域轮廓线的距离进行判断，如果该色段线的中点沿垂直方向至该色块连通域轮廓线的最近距离小于沿水平方向至该色块连通域轮廓线的最近距离，则该色段线的中点标记为骨架点，否则，该色段线的中点标记为非骨架点；

第二，对骨架点进行分类：判断该骨架点是否处于连续相连的垂直向色段线上，如果是，则标记为a类骨架点；如果不是，则标记为b类骨架点；将a类骨架点的集合组成的线段作为主要骨架线段，将b类骨架点的集合组成的线段作为次要骨架线段；

重复上述步骤，直至所有垂直向色段线的像素点遍历完成；

所述对骨架点进行修正处理，获得修正后图像骨架线的方法包括：

首先，测量每条主要骨架线段的线长；

然后，对主要骨架线段进行稳定主要骨架线段和非稳定主要骨架线段的分类：当主要骨架线段的线长大于或等于预设阈值时，将该主要骨架线段作为稳定主要骨架线段，否则，作为非稳定主要骨架线段；

最后，将非稳定主要骨架线段作为离散骨架点或离散骨架线段，将稳定主要骨架线段作为修正后的骨架线。

所述的文字图像骨架特征描述符获取的方法中，步骤S3包括：

S301，获取正位后图像骨架线；

S302，找出骨架线段上最长水平线段和最长垂直线段；

S303，对骨架线线段的笔画线型进行划分；

S304，对骨架线线段的笔画线型划分结果进行编码。

所述的文字图像骨架特征描述符获取的方法中，

所述获取正位后图像骨架线的方法包括：

旋转修正后图像骨架线，获取各种角度下修正后图像骨架线的有效区域大小尺寸，选择旋转角度最小且为有效区域大小尺寸最小时的图像骨架线状态，获取正位后图像骨架线,其中，所述的图像骨架线的有效区域是指由图像骨架线的内接矩形所围成的内部区域；

所述找出骨架线段上最长水平线段和最长垂直线段的方法包括：

分别统计正位后图像骨架线上每骨架线线段每一x坐标值所拥有的像素点数和每一y坐标值所拥有的像素点数，并找出骨架线线段中拥有像素点数最多的x坐标值或y坐标值，该y坐标值所拥有的像素点所组成的线段即为最长水平线段，该x坐标值所拥有的像素点所组成的线段即为最长垂直线段；

所述对骨架线线段的笔画线型进行划分的方法包括：

将骨架线线段的笔画线型划分为横骨架线线段、竖骨架线线段、撇骨架线线段、捺骨架线线段，并按预设的笔画线型划分规则确认骨架线线段的笔画线型；

所述对骨架线线段的笔画线型划分结果进行编码的方法包括：

将横骨架线线段、竖骨架线线段、撇骨架线线段、捺骨架线线段采用数字、字母或符号进行表示，将该数字、字母或符号的集合作为骨架线线段的笔画线型编码。

所述的文字图像骨架特征描述符获取的方法中，所述预设的笔画线型划分规则包括：

1)当骨架线段上最长水平线段的像素点数大于或等于预设的水平骨架线线长阈值时，该正位后图像骨架线线段确认为横骨架线线段；

2)当骨架线段上最长垂直线段的像素点数大于或等于预设的垂直骨架线线长阈值时，该正位后图像骨架线线段确认为竖骨架线线段；

3)当骨架线段上最长水平线段的像素点数小于预设的水平骨架线线长阈值，且不满足规则2)所述条件，但该骨架线线段的两端点y轴坐标值的差与该线段两端点x轴坐标值的差之比小于或等于预设坡度比阈值时，该正位后图像骨架线线段仍确认为横骨架线线段；

4)当骨架线段上最长垂直线段的像素点数小于预设的垂直骨架线线长阈值，且不满足规则1)所述条件，但该骨架线线段的两端点x轴坐标值的差与该线段两端点y轴坐标值的差之比小于或等于预设坡度比阈值时，该正位后图像骨架线线段仍确认为竖骨架线线段；

5)当骨架线段上最长水平线段的像素点数小于预设的水平骨架线线长阈值且不满足规则3)所述条件，或骨架线段上最长垂直线段的像素点数小于预设的垂直骨架线线长阈值且不满足规则4)所述条件时，将该正位后图像骨架线线段的端点的y轴坐标最大值的像素点处在该线段右侧的骨架线线段确认为撇骨架线线段；

6)当骨架线段上最长水平线段的像素点数小于预设的水平骨架线线长阈值且不满足规则3)所述条件，或骨架线段上最长垂直线段的像素点数小于预设的垂直骨架线线长阈值且不满足规则4)所述条件时，将该正位后图像骨架线线段的端点的y轴坐标最大值的像素点处在该线段左侧的骨架线线段确认为捺骨架线线段。

所述的文字图像骨架特征描述符获取的方法中，步骤S4中，所述预设顺序为从左往右并从上到下地进行排序。

一种文字图像骨架特征描述符获取装置，包括：

第一获取模块，用于对输入图像进行色块分割，提取色块连通域的水平向和垂直向色段线及其端点，获得水平向和垂直向色段线的中点；

第二获取模块，用于对水平向和垂直向色段线的中点进行判断，找出骨架点并划分a类骨架点和b类骨架点，并对骨架点进行修正处理，获得修正后骨架线；

处理模块，用于获取正位后的图像骨架线，找出骨架线段上最长水平线段和最长垂直线段，对骨架线线段的笔画线型进行划分和编码；

生成模块，用于按照预设顺序对骨架线线段的笔画线型编码进行排序，将排序后的骨架线线段的笔画线型编码的集合作为文字图像骨架特征描述符。

有益效果：

本发明提供的一种文字图像骨架特征描述符获取的方法及装置，与现有技术相比具有以下优点：

1、可以实现相同文字的图像骨架特征描述符相同的描述，能有效克服使用传统方法提取的文字图像骨架线笔划与文字本身的笔划不对应，横竖笔画的骨架线常出现“枝丫”的线段，导致骨架线失真的缺陷；

2、解决了骨架线提取中骨架线线段笔画粘连的问题，提高文字的笔画提取准确率；

3、可以解决复杂的交叉区域的提取，将交叉区域的提取直接转为简单的横竖撇捺的字形笔划提取；

4、能有效实现同一文字不同的字体所提取出的图像骨架特征描述符基本相同，提高文字图像识别检索中相同或近似图像的匹配效果；

5、提取的文字图像骨架特征描述符是对图像轮廓特征描述符的补充完善，两者的结合运用可以更完整更精准实现图像特征的识别和描述，有效提高了图像识别检索中相同或近似图像的匹配效果。

附图说明

图1为本发明提供的文字图像骨架特征描述符获取的方法的流程图。

图2为随机给出两款示例性文字图像。

图3为从图2的a提取的水平向色段线端点的集合的示意图。

图4为从图2的b提取的垂直向色段线端点的集合的示意图。

图5为是笔画线型编码与骨架线线段的对应位置的示意图。

图6为本发明提供的文字图像骨架特征描述符获取装置的结构示意图。

图7为本发明提供的文字图像骨架特征描述符获取装置中，第一获取模块的结构示意图。

图8为本发明提供的文字图像骨架特征描述符获取装置中，第二获取模块的结构示意图。

图9为本发明提供的文字图像骨架特征描述符获取装置中，处理模块的结构示意图。

具体实施方式

下面详细描述本发明的实施方式，所述实施方式的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施方式是示例性的，仅用于解释本发明，而不能理解为对本发明的限制。

请参阅图1-5，本发明提供的一种文字图像骨架特征描述符获取的方法，包括步骤S1、S2、S3、S4；

S1，对输入图像进行色块分割，提取色块连通域的水平向和垂直向色段线及其端点，获得水平向和垂直向色段线的中点。

本技术方案的输入图像是含有文字的图像，这些输入图像可以通过电脑设备、摄像功能的手机、照相机、摄像头或集合有摄像头或存储图像的其他设备所获取，这些输入图像均可用于本技术方法的文字图像骨架特征描述符的获取处理。

为了便于说明，图2随机给出两款示例性文字图像，图中a是的黑体字“星”的文字图像、b是宋体字“星”的文字图像，均可作为本技术方案的处理对象。

该步骤S1包括步骤S101、S102、S103。

S101，对输入图像进行色块分割

对输入图像进行色块分割的方法包括：

提取输入图像每一像素点的颜色值，计算多色级的二值化自适应阈值，对输入图像进行色块连通域的分割，获得像素点色块连通域。

S102，提取色块连通域的色段线及其端点

色块连通域的色段线包括水平向色段线和垂直向色段线,提取色块连通域的色段线及其端点的方法包括：

第二，将水平向色段线中像素点x坐标值最大和最小的像素点作为水平向色段线的端点，将垂直向色段线中像素点y坐标值最大和最小的像素点作为垂直向色段线的端点；

如图3所示，图3是图2的a提取的水平向色段线端点的集合的示意图；如图4所示，图4是图2的b提取的垂直向色段线端点的集合的示意图。

S103，获取水平向和垂直向色段线的中点

根据前步所获得的水平向色段线的像素点数据中，按从左到右的方向逐行遍历水平向色段线的像素点，以获取水平向色段线的中点。具体地，提取水平向和垂直向色段线的中点具体方法包括：

第一，统计该水平向或垂直向色段线的像素点总数，将该像素点总数作为水平向或垂直向色段线的线长；

第二，当线长数为奇数时，以位于该水平向或垂直向色段线中间位置的1个像素点为水平向或垂直向色段线的中点；

第三，当线长数为偶数时，以位于该水平向或垂直向色段线中间位置的2个像素点共同为水平向或垂直向色段线的中点。

S2，对水平向和垂直向色段线的中点进行判断，找出骨架点并划分a类骨架点和b类骨架点，并对骨架点进行修正处理，获得修正后骨架线。

该步骤S2包括步骤S201、S202、S203。

S201，对水平向色段线的中点进行判断,找出骨架点并划分a类骨架点和b类骨架点对水平向色段线的中点进行判断,找出骨架点并划分a类骨架点和b类骨架点的方法包括：第一，根据前述步骤S1(具体为S103)所获得的水平向色段线的中点；对水平向色段线的中点与色块连通域轮廓线的距离进行判断，如果该色段线的中点沿水平方向至该色块连通域轮廓线的最近距离小于沿垂直方向至该色块连通域轮廓线的最近距离，则该色段线的中点标记为骨架点，否则，该色段线的中点标记为非骨架点；

重复上述步骤，直至所有水平向色段线的像素点遍历完成。

S202，对垂直向色段线的中点进行判断，找出骨架点并划分a类骨架点和b类骨架点对垂直向色段线的中点进行判断，找出骨架点并划分a类骨架点和b类骨架点的方法包括：第一，根据前述步骤S1(具体为S103)所获得的垂直向色段线的中点，对垂直向色段线的中点与色块连通域轮廓线的距离进行判断，如果该色段线的中点沿垂直方向至该色块连通域轮廓线的最近距离小于沿水平方向至该色块连通域轮廓线的最近距离，则该色段线的中点标记为骨架点，否则，该色段线的中点标记为非骨架点；

重复上述步骤，直至所有垂直向色段线的像素点遍历完成。

S203，对骨架点进行修正处理，获得修正后图像骨架线

在实际应用中，一些文字图像可能会因书写或拍摄等图素的影响，导致文字的边缘线不平滑，从而产生个别一些骨架点呈现离散状态，这些离散状态的骨架点不是文字图像的主要特征，所以，有必要对他进行去除处理。

对骨架点进行修正处理，获得修正后图像骨架线的方法包括：

首先，测量每条主要骨架线段的线长；

然后，对主要骨架线段进行稳定主要骨架线段和非稳定主要骨架线段的分类：当主要骨架线段的线长大于或等于预设阈值a时，将该主要骨架线段作为稳定主要骨架线段，否则，作为非稳定主要骨架线段；其中，预设阈值a可在大于主要骨架线段线长最大值L的2％范围内取值(即a>2％L)；

最后，将非稳定主要骨架线段作为离散骨架点或离散骨架线段，将稳定主要骨架线段作为修正后的骨架线。如图5所示，图5是经过修正处理后得到的图像骨架线示意图。

S3，获取正位后的图像骨架线，找出骨架线段上最长水平线段和最长垂直线段，对骨架线线段的笔画线型进行划分和编码。

本技术方案处理的输入图像为文字图像，文字具有笔画的特征，将骨架线的线段转换为笔画能更好地反映文字的特征。

本技术方案由于经前述处理，所产生的骨架线线段均是不相交的，与传统方法所提取的骨架线基本会存在骨架线相交的问题明显不同，因此，本方案所产生的骨架线线段可以归为横、竖、撇、捺四种，不会出现笔画折的情形。

该步骤S3包括步骤S301、S302、S303、S304。

S301，获取正位后图像骨架线

获取正位后图像骨架线的方法包括：

旋转修正后图像骨架线，获取各种角度下修正后图像骨架线的有效区域大小尺寸，选择旋转角度最小且为有效区域大小尺寸最小时的图像骨架线状态，获取正位后图像骨架线，其中，所述的图像骨架线的有效区域是指由图像骨架线的外接矩形所围成的内部区域。

S302，找出骨架线段上最长水平线段和最长垂直线段

找出骨架线段上最长水平线段和最长垂直线段的方法包括：

分别统计正位后图像骨架线上每骨架线线段每一x坐标值所拥有的像素点数和每一y坐标值所拥有的像素点数，并找出骨架线线段中拥有像素点数最多的x坐标值或y坐标值，该y坐标值所拥有的像素点所组成的线段即为最长水平线段(该线段可以是连续的，也可以是不连续的)，该x坐标值所拥有的像素点所组成的线段即为最长垂直线段(该线段可以是连续的，也可以是不连续的)。

S303，对骨架线线段的笔画线型进行划分

对骨架线线段的笔画线型进行划分的方法包括：

上述的预设的笔画线型划分规则包括：

3)当骨架线段上最长水平线段的像素点数小于预设的水平骨架线线长阈值，且不满足规则2)条件，但该骨架线线段的两端点y轴坐标值的差与该线段两端点x轴坐标值的差之比小于或等于预设坡度比阈值时，该正位后图像骨架线线段仍确认为横骨架线线段；

4)当骨架线段上最长垂直线段的像素点数小于预设的垂直骨架线线长阈值，且不满足规则1)条件，但该骨架线线段的两端点x轴坐标值的差与该线段两端点y轴坐标值的差之比小于或等于预设坡度比阈值时，该正位后图像骨架线线段仍确认为竖骨架线线段；

5)当骨架线段上最长水平线段的像素点数小于预设的水平骨架线线长阈值且不满足规则3)条件，或骨架线段上最长垂直线段的像素点数小于预设的垂直骨架线线长阈值且不满足规则4)条件时，将该正位后图像骨架线线段的端点的y轴坐标最大值的像素点处在该线段右侧的骨架线线段确认为撇骨架线线段；

6)当骨架线段上最长水平线段的像素点数小于预设的水平骨架线线长阈值且不满足规则3)条件，或骨架线段上最长垂直线段的像素点数小于预设的垂直骨架线线长阈值且不满足规则4)条件时，将该正位后图像骨架线线段的端点的y轴坐标最大值的像素点处在该线段左侧的骨架线线段确认为捺骨架线线段。

S304，对骨架线线段的笔画线型划分结果进行编码

骨架线线段的笔画线型划分结果包括：横骨架线线段、竖骨架线线段、撇骨架线线段、捺骨架线线段。

实际应用中，为了方便计算机的识别与运算，对骨架线线段的笔画线型划分结果进行编码的方法包括：

举例说明：

假设某一文字由“横、横、竖、撇、捺”的笔画类型构成，骨架线线段的笔画线型采用数字进行表示，求该文字的笔画编码。

解得：假设将横骨架线线段用1表示，将竖骨架线线段用2表示，将撇骨架线线段用3表示，将捺骨架线线段用4表示，该文字的笔画编码为：11234。

可以根据应用的需要设定上述的预设顺序,例如：从左往右并从上到下地进行排序。

按照预设顺序对骨架线线段的笔画线型编码进行排序后，可得每一骨架线线段的序号，沿该序号的顺序，将每一骨架线线段的序号目换为每一骨架线线段的笔画线型编码就可得如下形式的字符串:

|X₁,X₂,X_3,…,X_i|

其中i表示第i条骨架线线段，X₁表示第1条骨架线段的笔画线型编码，X₂表示第2条骨架线段的笔画线型编码，X₃表示第3条骨架线段的笔画线型编码，X_i表示第i条骨架线段的笔画线型编码，以此类推。

以图2的“星”字图像为例，经上述处理可得到按照骨架线线段的位置顺序对该图像的骨架线段的笔画线型编码排序后的一组字符串“12212212113211211”，将该一组字符串作为文字图像骨架特征描述符。每一字符所对应的位置如图5所示，图5是笔画线型编码与骨架线线段的对应位置的示意图。

通过上述处理的文字图像骨架特征描述符，可以应用于文字图像的检索。通过文字图像骨架特征描述符的匹配检索，能实现相同或近似文字图像的较好检索效果。

由上所述，该文字图像骨架特征描述符获取的方法，通过对输入图像进行色块分割，提取色块连通域的水平向和垂直向色段线及其端点，获得水平向和垂直向色段线的中点；对水平向和垂直向色段线的中点进行判断，找出骨架点并划分a类骨架点和b类骨架点，并对骨架点进行修正处理，获得修正后骨架线；获取正位后的图像骨架线，找出骨架线段上最长水平线段和最长垂直线段，对骨架线线段的笔画线型进行划分和编码；按照预设顺序对骨架线线段的笔画线型编码进行排序，将排序后的骨架线线段的笔画线型编码的集合作为文字图像骨架特征描述符；从而得到文字图像骨架特征描述符，具有以下优点：

请参阅图6-9，本发明提供还一种文字图像骨架特征描述符获取装置，包括第一获取模块1、第二获取模块2、处理模块3、生成模块4；

其中，第一获取模块1，用于对输入图像进行色块分割，提取色块连通域的水平向和垂直向色段线及其端点，获得水平向和垂直向色段线的中点；

其中，第二获取模块2，用于对水平向和垂直向色段线的中点进行判断，找出骨架点并划分a类骨架点和b类骨架点，并对骨架点进行修正处理，获得修正后骨架线；

其中，处理模块3，用于获取正位后的图像骨架线，找出骨架线段上最长水平线段和最长垂直线段，对骨架线线段的笔画线型进行划分和编码；

其中，生成模块4，用于按照预设顺序对骨架线线段的笔画线型编码进行排序，将排序后的骨架线线段的笔画线型编码的集合作为文字图像骨架特征描述符。

进一步的，见图7，第一获取模块1包括分割单元1.1、提取单元1.2、第一获取单元1.3；

其中，分割单元1.1，用于对输入图像进行色块分割；

其中，提取单元1.2，用于提取色块连通域的色段线及其端点；

其中，第一获取单元1.3，用于获取水平向和垂直向色段线的中点。

在一些实施方式中，见图8，第二获取模块2包括第一划分单元2.1、第二划分单元2.2、修正单元2.3；

其中，第一划分单元2.1，用于对水平向色段线的中点进行判断,找出骨架点并划分a类骨架点和b类骨架点；

其中，第二划分单元2.2，用于对垂直向色段线的中点进行判断，找出骨架点并划分a类骨架点和b类骨架点；

其中，修正单元2.3，用于对骨架点进行修正处理，获得修正后图像骨架线。

本实施例中，见图9，处理模块3包括第二获取单元3.1、第三获取单元3.2、第三划分单元3.3、编码单元3.4；

其中，第二获取单元3.1，用于获取正位后图像骨架线；

其中，第三获取单元3.2，用于找出骨架线段上最长水平线段和最长垂直线段；

其中，第三划分单元3.3，用于对骨架线线段的笔画线型进行划分；

其中，编码单元3.4，用于对骨架线线段的笔画线型划分结果进行编码。

由上所述，该文字图像骨架特征描述符获取装置，通过对输入图像进行色块分割，提取色块连通域的水平向和垂直向色段线及其端点，获得水平向和垂直向色段线的中点；对水平向和垂直向色段线的中点进行判断，找出骨架点并划分a类骨架点和b类骨架点，并对骨架点进行修正处理，获得修正后骨架线；获取正位后的图像骨架线，找出骨架线段上最长水平线段和最长垂直线段，对骨架线线段的笔画线型进行划分和编码；按照预设顺序对骨架线线段的笔画线型编码进行排序，将排序后的骨架线线段的笔画线型编码的集合作为文字图像骨架特征描述符；从而得到文字图像骨架特征描述符，具有以下优点：

综上所述，虽然本发明已以优选实施例揭露如上，但上述优选实施例并非用以限制本发明，本领域的普通技术人员，在不脱离本发明的精神和范围内，均可作各种更动与润饰，其方案与本发明实质上相同。

Claims

1.一种文字图像骨架特征描述符获取的方法，其特征在于，包括步骤：

S1，对输入图像进行色块分割，提取色块连通域的水平向色段线和垂直向色段线及其端点，获得水平向色段线和垂直向色段线的中点；

S2，对水平向色段线和垂直向色段线的中点进行判断，找出骨架点并划分a类骨架点和b类骨架点，并对骨架点进行修正处理，获得修正后图像骨架线；

S3，获取正位后图像骨架线，找出正位后图像骨架线线段上最长水平线段和最长垂直线段，对正位后图像骨架线线段的笔画线型进行划分和编码；

S4，按照预设顺序对正位后图像骨架线线段的笔画线型编码进行排序，将排序后的正位后图像骨架线线段的笔画线型编码的集合作为文字图像骨架特征描述符；步骤S2中，所述对水平向色段线的中点进行判断，找出骨架点并划分a类骨架点和b类骨架点的方法包括：

重复上述步骤，直至所有水平向色段线的像素点遍历完成；

步骤S2中，所述对垂直向色段线的中点进行判断，找出骨架点并划分a类骨架点和b类骨架点的方法包括：

重复上述步骤，直至所有垂直向色段线的像素点遍历完成；

步骤S2中，所述对骨架点进行修正处理，获得修正后图像骨架线的方法包括：首先，测量每条主要骨架线段的线长；

最后，将非稳定主要骨架线段作为离散骨架点或离散骨架线段，将稳定主要骨架线段作为修正后图像骨架线；

步骤S3中，所述获取正位后图像骨架线的方法包括：

旋转修正后图像骨架线，获取各种角度下修正后图像骨架线的有效区域大小尺寸，选择旋转角度最小且为有效区域大小尺寸最小时的修正后图像骨架线状态，获取正位后图像骨架线,其中，所述的修正后图像骨架线的有效区域是指由修正后图像骨架线的内接矩形所围成的内部区域。

2.根据权利要求1所述的文字图像骨架特征描述符获取的方法，其特征在于，步骤S1包括：

S101，对输入图像进行色块分割；

S102，提取色块连通域的色段线及其端点；

S103，获取水平向色段线和垂直向色段线的中点；

3.根据权利要求2所述的文字图像骨架特征描述符获取的方法，其特征在于，所述对输入图像进行色块分割的方法包括：

所述提取色块连通域的色段线及其端点的方法包括：

第一，将归入同一色块连通域在水平方向连续相连的像素点连线作为水平向色段线，将归入同一色块连通域在垂直方向连续相连的像素点连线作为垂直向色段线；第二，将水平向色段线中像素点x坐标值最大和最小的像素点作为水平向色段线的端点，将垂直向色段线中像素点y坐标值最大和最小的像素点作为垂直向色段线的端点。

4.根据权利要求1所述的文字图像骨架特征描述符获取的方法，其特征在于，所述找出正位后图像骨架线段上最长水平线段和最长垂直线段的方法包括：

分别统计正位后图像骨架线上每正位后图像骨架线线段每一x坐标值所拥有的像素点数和每一y坐标值所拥有的像素点数，并找出正位后图像骨架线线段中拥有像素点数最多的x坐标值或y坐标值，该y坐标值所拥有的像素点所组成的线段即为最长水平线段，该x坐标值所拥有的像素点所组成的线段即为最长垂直线段；

所述对正位后图像骨架线线段的笔画线型进行划分的方法包括：

将正位后图像骨架线线段的笔画线型划分为横骨架线线段、竖骨架线线段、撇骨架线线段、捺骨架线线段，并按预设的笔画线型划分规则确认正位后图像骨架线线段的笔画线型；

所述对正位后图像骨架线线段的笔画线型划分结果进行编码的方法包括：

将横骨架线线段、竖骨架线线段、撇骨架线线段、捺骨架线线段采用数字、字母或符号进行表示，将该数字、字母或符号的集合作为正位后图像骨架线线段的笔画线型编码。

5.根据权利要求4所述的文字图像骨架特征描述符获取的方法，其特征在于，所述预设的笔画线型划分规则包括：

1)当正位后图像骨架线线段上最长水平线段的像素点数大于或等于预设的水平骨架线线长阈值时，该正位后图像骨架线线段确认为横骨架线线段；

2)当正位后图像骨架线线段上最长垂直线段的像素点数大于或等于预设的垂直骨架线线长阈值时，该正位后图像骨架线线段确认为竖骨架线线段；

3)当正位后图像骨架线线段上最长水平线段的像素点数小于预设的水平骨架线线长阈值，且该正位后图像骨架线线段上最长垂直线段的像素点数小于预设的垂直骨架线线长阈值，但该正位后图像骨架线线段的两端点y轴坐标值的差与该线段两端点x轴坐标值的差之比小于或等于预设坡度比阈值时，该正位后图像骨架线线段仍确认为横骨架线线段；

4)当正位后图像骨架线线段上最长垂直线段的像素点数小于预设的垂直骨架线线长阈值，且该正位后图像骨架线线段上最长水平线段的像素点数小于预设的水平骨架线线长阈值，但该正位后图像骨架线线段的两端点x轴坐标值的差与该线段两端点y轴坐标值的差之比小于或等于预设坡度比阈值时，该正位后图像骨架线线段仍确认为竖骨架线线段；

5)当正位后图像骨架线线段上最长水平线段的像素点数小于预设的水平骨架线线长阈值且该正位后图像骨架线线段不确认为横骨架线线段，或正位后图像骨架线线段上最长垂直线段的像素点数小于预设的垂直骨架线线长阈值且该正位后图像骨架线线段不确认为竖骨架线线段时，将该正位后图像骨架线线段的端点的y轴坐标最大值的像素点处在该线段右侧的正位后图像骨架线线段确认为撇骨架线线段；

6)当正位后图像骨架线线段上最长水平线段的像素点数小于预设的水平骨架线线长阈值且该正位后图像骨架线线段不确认为横骨架线线段，或正位后图像骨架线线段上最长垂直线段的像素点数小于预设的垂直骨架线线长阈值且该正位后图像骨架线线段不确认为竖骨架线线段时，将该正位后图像骨架线线段的端点的y轴坐标最大值的像素点处在该线段左侧的正位后图像骨架线线段确认为捺骨架线线段。

6.根据权利要求1所述的文字图像骨架特征描述符获取的方法，其特征在于，步骤S4中，所述预设顺序为从左往右并从上到下地进行排序。

7.一种文字图像骨架特征描述符获取装置，其特征在于，包括：

第一获取模块，用于对输入图像进行色块分割，提取色块连通域的水平向色段线和垂直向色段线及其端点，获得水平向色段线和垂直向色段线的中点；

第二获取模块，用于对水平向色段线和垂直向色段线的中点进行判断，找出骨架点并划分a类骨架点和b类骨架点，并对骨架点进行修正处理，获得修正后图像骨架线；

处理模块，用于获取正位后图像骨架线，找出正位后图像骨架线线段上最长水平线段和最长垂直线段，对正位后图像骨架线线段的笔画线型进行划分和编码；

生成模块，用于按照预设顺序对正位后图像骨架线线段的笔画线型编码进行排序，将排序后的正位后图像骨架线线段的笔画线型编码的集合作为文字图像骨架特征描述符；

第二获取模块包括：

第一划分单元，用于对水平向色段线的中点进行判断,找出骨架点并划分a类骨架点和b类骨架点；

第二划分单元，用于对垂直向色段线的中点进行判断，找出骨架点并划分a类骨架点和b类骨架点；

修正单元，用于对骨架点进行修正处理，获得修正后图像骨架线；

所述对水平向色段线的中点进行判断，找出骨架点并划分a类骨架点和b类骨架点的方法包括：

第一，根据第一获取模块所获得的水平向色段线的中点，对水平向色段线的中点与色块连通域轮廓线的距离进行判断，如果该色段线的中点沿水平方向至该色块连通域轮廓线的最近距离小于沿垂直方向至该色块连通域轮廓线的最近距离，则该色段线的中点标记为骨架点，否则，该色段线的中点标记为非骨架点；

重复上述步骤，直至所有水平向色段线的像素点遍历完成；

第一，根据第一获取模块所获得的垂直向色段线的中点，对垂直向色段线的中点与色块连通域轮廓线的距离进行判断，如果该色段线的中点沿垂直方向至该色块连通域轮廓线的最近距离小于沿水平方向至该色块连通域轮廓线的最近距离，则该色段线的中点标记为骨架点，否则，该色段线的中点标记为非骨架点；

重复上述步骤，直至所有垂直向色段线的像素点遍历完成；

首先，测量每条主要骨架线段的线长；

最后，将非稳定主要骨架线段作为离散骨架点或离散骨架线段，将稳定主要骨架线段作为修正后的骨架线；

处理模块包括：

第二获取单元，用于获取正位后图像骨架线；

第三获取单元，用于找出正位后图像骨架线线段上最长水平线段和最长垂直线段；第三划分单元，用于对正位后图像骨架线线段的笔画线型进行划分；

编码单元，用于对正位后图像骨架线线段的笔画线型划分结果进行编码；

所述获取正位后图像骨架线的方法包括：