CN109241973A

CN109241973A - 一种纹理背景下的字符全自动软分割方法

Info

Publication number: CN109241973A
Application number: CN201810952887.2A
Authority: CN
Inventors: 林忠; 黄陈蓉; 卢阿丽; 周静波
Original assignee: Nanjing Institute of Technology
Current assignee: Jiangsu Quanfeng Electric Co.,Ltd.
Priority date: 2018-08-21
Filing date: 2018-08-21
Publication date: 2019-01-18
Anticipated expiration: 2038-08-21
Also published as: CN109241973B

Abstract

本发明公开了一种纹理背景下的字符全自动软分割方法，首先对输入的字符图像I₁通过灰度化预处理后得到灰度图像I₂，采用双阈值OTSU分割算法得到灰度图像I₂的两个分割阈值，使用波谷搜索策略并基于较低阈值寻找灰度图像I₂直方图的波谷位置，以波谷位置为阈值对直方图进行阈值化得到图像I₃；然后利用形态学对图像I₃的前景部做腐蚀操作得到图像I₄，做膨胀操作得到图像I₅，将图像I₅前景部分去除图像I₄的前景部分标识为未知区域，标识图像I₄的前景部分为前景区域，将图像I₃范围内除去未知区域和前景区域的区域标识为背景区域，由未知区域、前景区域和背景区域构成三分图；最后使用抠像算法和连通域分析方法得到每个字符区域，实现软分割操作；本发明有效提升了字符分割的准确率。

Description

一种纹理背景下的字符全自动软分割方法

技术领域

本发明属于图像处理领域，尤其涉及一种纹理背景下的字符全自动软分割方法。

背景技术

字符分割是字符识别任务中的一个步骤。字符识别任务是从一幅包含字符的图像到输出识别的字符，该任务可以分解为多个步骤，包含：字符区域检测，倾斜校正，字符分割，字符识别等几个步骤。字符分割在字符识别任务中是一个核心关键步骤，在证件、票据、车牌等对象的字符识别任务中字符分割的准确性往往决定着相关产品的性能。常用的字符分割方式主要有阈值法、连通域法、投影法和基于纹理特征的方法。阈值法简单快速，但是当背景与前景之间的灰度值相近时，很容易失效；连通域法可以得到每个字符的所在矩形，通过连通域面积可以过滤掉一些噪声，但是当图像背景中有较多纹理时，该方法性能会显著下降；投影法是目前使用较多的一种方法，该法巧妙地利用了字符区域在水平和垂直方向上的投影的分布特征，从而找到字符在水平和垂直方向上的分割位置，但是该法需要将背景噪声或者纹理完全去除后才能正常运行；基于纹理特征的方法的思想是提取文字的纹理特征，然后通过分类器对文字和背景进行分类，该方法的问题在于文字的纹理特征往往不太稳定，较难描述和提取。

如果不考虑由于光照，运动等造成的图像质量问题和文字粘连、单个文字有多个分离部分等文字本身的问题，而仅仅考虑将文字的形状(单个文字或者单个文字中的独立连通部分)从背景中提取出来，字符分割任务中的难点主要有两点。首先背景纹理或噪声是影响字符分割准确性的一大因素，阈值法、连通域法和投影法都需要在背景相对比较干净的前提条件下才能运行良好。其次，在字符图像中，单个字符的像素个数较少，而由于成像过程中不可避免的边缘模糊效应，会造成字符边缘与背景纹理相互融合，在字符边缘部分较难判定某个像素是属于背景还是字符，如果字符笔画本身较细，则边缘部分像素的判定对于字符的形状的影响将变得较大。

例如，在印刷品中通常背景部分有若干底纹，有些情况下底纹的灰度值和前景字符的灰度值差异不大，用传统的阈值分割法较难将背景与字符较好分割出来。再者，由于成像过程中不可避免的边缘模糊效应，字符边缘与背景纹理过度较为平缓，而有些字符图像中，字符的笔画较细，像素尺寸较少，此时字符边缘部分在字符笔画中占比较大。这些难以确定前景还是背景的边缘像素值的归属对于分割后的字符形状的影响较大：较难设计一个算法自动找到一个合适的阈值将正确的字符形状分割出来，阈值稍微偏高可能造成字符笔画过粗，甚至在字符轮廓中包含一些背景纹理，阈值稍微偏低又可能造成字符笔画或细，甚至可能造成某些笔画断裂。

发明内容

本发明的主要目的在于提供了一种纹理背景下的字符全自动软分割方法，用以解决现有技术中在印刷品中存在的底纹灰度值与字符灰度值相近导致难以分割背景与字符和对字符边缘较大的字符图形分割过程中可能导致字符断裂的问题；具体技术方案如下：

一种纹理背景下的字符全自动软分割方法，所述方法利用双阈值OTSU分割算法和波谷搜索策略，并同时结合形态学、抠像算法和连通域分析方法实现对纹理背景下的字符分割，所述方法包括步骤：

S1、输入字符图像I₁，并对所述字符图像I₁经过灰度化预处理后得到灰度图像I₂；

S2、对所述灰度图像I₂应用双阈值OTSU分割算法，得到第一分割阈值和大于所述第一分割阈值的第二分割阈值，记录所述第一分割阈值为t₁；

S3、获取所述灰度图像I₂对应的直方图，并在所述直方图中以t₁为初始位置采用波谷搜索策略寻找所述直方图的波谷位置T；

S4、以T为阈值对所述灰度图像I₂阈值化，得到图像I₃；

S5、对所述图像I₃的前景部分进行形态学腐蚀操作得到图像I₄；对所述图像I₃的前景部分进行形态学膨胀操作得到图像I₅；

S6、将所述图像I₄的前景部分标识为前景区域R_f，使用形态学将所述图像I₅的前景部分去除所述图像I₄的前景部分得到未知区域R_u，并将所述图像I₃除去所述前景区域R_f和未知区域R_u的区域标识为背景区域R_b，由所述前景区域R_f、未知区域R_u和背景区域R_b组成三分图；

S7、采用抠像算法对所述字符图像I₁和所述三分图进行抠像操作，得到alpha抠像图，并将所述alpha抠像图作为字符序列的软分割结果图像S；

S8、将所述软分割结果图像S中像素值大于127的像素设置为白色，其余像素设置为黑色，得到二值图像I₆，并求取所述二值图像I₆中黑色像素的连通域；

S9、设定一连通域面积阈值，滤除面积小于所述连通域面积阈值的所有所述连通域，并求取面积大于所述连通域面积阈值的每一所述连通域各自的包围矩形；

S10、设定一拓展率，按照所述拓展率拓展所述包围矩形，得到n个与所述包围矩形相对应的拓展矩形区域，并依次标记所述拓展矩形区域为R₁,R₂,...,R_n；

S11、提取所述软分割结果图像S在所述拓展矩形区域R₁,...,R₂,R_n的子图像S₁,...,S₂,S_n，实现对纹理背景下字符的全自动软分割操作。

作为优选，在步骤S1中，若所述灰度图像I₂中背景的整体亮度暗于前景字符，则对所述灰度图像I₂做灰度反转操作。

作为优选，所述灰度反转操作可通过公式s＝L-1-r，其中，s表示经过所述灰度反转操作后所述灰度图像I₂的灰度值，L表示所述灰度图像I₂的灰度等级数，r表示所述灰度图像I₂的原始灰度值。

作为优选，所述alpha抠像图为八位灰度图像，所述alpha抠像图的前景像素隶属度越高，则所述alpha抠像图的像素越黑。

与现有技术相比，本发明的纹理背景下的字符全自动软分割方法有益效果为：

(1)本发明先采用双阈值OTSU分割算法得到第一分割阈值和大于第一分割阈值的第二分割阈值，并在字符图像I₁灰度化的灰度图像I₂对应的直方图中寻找第一分割阈值附近的波谷位置作为分割阈值；在此基础上再通过形态学腐蚀处理、软分割结果的隶属度阈值化处理、连通域分析排除可能留下的一些底纹残迹区域，以达到对字符图像的背景纹理的有效去除。

(2)本发明采用抠图算法得到alpha抠像图后，一方面，最终得到的软分割图像可以根据alpha抠像图中alpha取值大小实现通过软分割方法得到传统硬分割方法可以得到效果；另一方面，本发明还可以由alpha抠像图中的隶属度与设定不同阈值比较后实现对字符不同粗细的分割结果，由此可以为后续的识别操作提供不同分割结果，从而实现对字符更加准确的识别。

(3)本发明利用抠像算法能够找出字符边缘附近与背景的融合程度，用该融合程度来反映边缘像素的归属是属于字符图像I₁中的字符还是背景纹理，从而可以有效避免由于成像过程中的边缘模糊效应导致的字符图像I₁中字符边缘与背景纹理基本融合在一起的情况，可得到边缘较自然的字符；而且可避免传统硬分割方法可能造成的字符笔画过粗、字符与背景纹理粘连或者字符笔画过细以及出现字符笔画断裂的现象。

附图说明

图1为本发明实施例中所述纹理背景下的字符全自动软分割方法的流程框图示意；

图2为本发明实施例中所述字符图像I₁得到的灰度图像I₂示意；

图3为本发明实施例中所述灰度图像I₂的直方图图形化示意；

图4为本发明实施例中所述双阈值OTSU分割算法得到的阈值和波谷搜索策略得到的阈值图示意；

图5为本发明实施例中所述灰度图像I₂用双阈值OTSU分割算法得到的第二分割阈值进行阈值化的结果示意图；

图6为本发明实施例中采用所述波谷搜索策略以波谷T为阈值进行阈值化后得到图像I₃的结果示意图；

图7为本发明实施例中所述图像I₃的黑色像素进行3*3腐蚀以后的结果示意图；

图8为本发明实施例中所述图像I₃的黑色像素进行5*5膨胀运算的结果示意图；

图9为本发明实施例中所述三分图示意；

图10为本发明实施例中所述alpha抠像图示意；

图11为本发明实施例中所述alpha抠像图中像素值大于127的像素设为白色，其余像素设置为黑色的结果图像示意；

图12为本发明实施例中经过对图像I₆过滤操作后所述拓展矩形区域与所述字符之间的位置图示意；

图13为采用本发明纹理背景下的字符全自动软分割方法的实施例字符分割结果图示意。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述。

实施例一

本发明提供了一种纹理背景下的字符全自动软分割方法，所述方法的具体过程为：

首先，对输入字符图像I₁进行灰度化，得到灰度图像I₂，本发明需要保证灰度图像I₂中背景的整体亮度亮于前景字符，有利于后续对前景字符的分割操作；若灰度图像I₂存在背景的整体亮度暗于前景字符的情况，本发明需要对灰度图像I₂做灰度反转操作，具体通过公式s＝L-1-r实现，使得灰度图像I₂经过灰度反转操作后符合字符亮度暗于背景的整体亮度；公式s＝L-1-r中，s表示灰度图像I₂处理后的灰度值，L表示灰度图像I₂的灰度等级数，r表示灰度图像I₂的原始灰度值；优选的，在具体实施例中，灰度化方法可采用RGB三通道取平均值法、YUV的Y通道、或者采用YCbCr的Y通道等，对此本发明并不进行限制和固定，可根据实际情况进行选择。

随后，采用双阈值OTSU分割算法和波谷搜索策略求取所述灰度图像I₂的分割阈值，假设灰度图像I₂的灰度值取值范围为[0,1,...,L-1]，先由双阈值OTSU分割算法可以求得灰度图像I₂的第一分割阈值t₁和第二分割阈值t₂两个阈值，其中，第二分割阈值t₂大于第一分割阈值t₁，此时，第一分割阈值t₁和第二分割阈值t₂将灰度图像I₂的灰度值分为三类阈值区间，分别为[0,t₁-1]，[t₁,t₂-1]和[t₂,L-1]；此时，可以由公式来表示双阈值OTSU分割算法的目标函数，式中，w_k,u_k,u_t分别表示在三类阈值区间[0,t₁-1]、[t₁,t₂-1]和[t₂,L-1]中字符出现的概率、均值和图像的总的均值；并且由于对于一特定图像而言，u_t为一常数，所以可将公式简化为公式同时由于前景字符的灰度值较暗，所以只需要第一分割阈值t₁就可以对灰度图像I₂进行二值化而实现对前景字符的分割操作；随后采用波谷搜索策略修正第一分割阈值t₁，具体的，波谷搜索策略利用双阈值OTSU分割算法以第一分割阈值t₁为起点搜索一个所述直方图的波谷位置T，同时，假设直方图的数据为h₀,h₁,h₂,...,h_L-1，其中，L为所述灰度图像I₂的灰度等级；设定一波谷搜索策略参数p_num，则波谷搜索策略的具体过程描述如下：

(1)将当前波谷位置T设置为双阈值OTSU求得的第一分割阈值t₁的具体值。

(2)设置候选波谷位置T_valley的初始值为T，设置候选波谷位置的直方图数据H_valley为h_T。

(3)以第一分割阈值t₁的具体值为初始位置往直方图数据下标变大的方向逐个访问直方图数据，满足以下两个条件之一时停止访问：

(a)连续p_num+1个直方图数据大于直方图数据H_valley；

(b)访问到了最后一个直方图数据。

(4)在访问直方图数据过程中，按照以下规则修改直方图数据T_valley和直方图数据H_valley的值；小于h_T的连续直方图数据个数大于p_num个，且该连续直方图数据中的最小值小于直方图数据H_valley，则修改H_valley为该连续直方图数据中的最小值且修改直方图数据T_valley为该最小值在直方图中所对应的灰度值。

(5)以第一分割阈值t₁为初始位置往直方图数据下标变小的方向逐个访问直方图数据，满足以下两个条件之一时停止访问：

(a)连续p_num+1个直方图数据大于直方图数据H_valley；

(b)访问到了第一直方图数据。

(6)在访问直方图数据过程中，按照以下规则修改直方图数据T_valley和直方图数据H_valley的值：小于h_T的连续直方图数据个数大于p_num个，且该连续直方图数据中的最小值小于直方图数据H_valley，则修改直方图数据H_valley为该连续直方图数据中的最小值且修改直方图数据T_valley为该最小值在直方图中所对应的灰度值。

(7)两个方向的访问都停止后，将T修改为直方图数据T_valley，即为该策略求得的最终波谷位置。

接着，利用形态学获取三分图和使用抠像算法得到alpha抠像图，其中，利用形态学获取三分图的过程中形态学腐蚀操作过程中的结构元素设为H₁，形态学膨胀操作过程中的结构元素设为H₂两个参数，具体过程步骤为：

(1)以波谷位置T为阈值将灰度图像I₂阈值化得到图像I₃。

(2)将图像I₃的前景部分用结构元素H₁进行形态学腐蚀得到图像I₄。

(3)将图像I₃的前景部分用结构元素H₂进行形态学膨胀得到图像I₅。

(4)将图像I₅的前景部分去除图像I₄的前景部分的区域标识为未知区域R_u。

(5)将图像I₄的前景部分标识为前景区域R_f。

(6)将图像I₃范围内除去未知区域R_u和前景区域R_f部分的区域标识为背景区域R_b。

(7)最后由未知区域R_u、前景区域R_f和背景区域R_b组成三分图。

抠像算法可通过公式I_i＝α_iF_i+(1-α_i)B_i，α_i∈[0,1]构建的数学模型表示，其中I表示输入所述数学模型的图像，α表示图像I的透明度，F表示图像I的前景颜色，B表示图像I的背景颜色；常见的抠像算法有closed-form抠像、KNN抠像、Spectral抠像、Shared Sampling抠像、基于学习的抠像等；但是在应用这些抠像技术前，均需要一个先验指导信息，本发明以三分图为先验指导信息；因此，本发明根据由未知区域R_u、前景区域R_f和背景区域R_b组成三分图和字符图像I₁可以通过抠像算法得到与字符图像I₁对应的alpha抠像图，并将所述alpha抠像图作为本发明中字符序列的软分割结果图像S，软分割结果图像S为八位灰度图像，且满足前景像素隶属度越高像素越黑的特征。

在本发明的具体实施例中，并不对抠像算法的选取进行限制和固定，可根据实际操作以及各种抠像算法的效果和计算速度进行选择。

最后，为了获取字符图像I₁中每个字符的分割结果，本发明采用连通域分析方法获取每个字符的区域位置，进而实现对每个字符的分割操作；具体过程为：

(1)将字符图像I₁中字符序列的软分割结果图像S中像素值大于127的像素设置白色，其余像素设置为黑色，得到一幅二值图像I₆。

(2)对二值图像I₆求取黑色像素的连通域，遍历所有连通域，若连通域的面积大于设定的面积a则记录该连通域，假设共包括n个连通域，则记为：L₁,L₂,...,L_n。

(3)分别求n个连通域L₁,L₂,...,L_n的包围矩形，并将各个包围矩形的范围往上下左右四个方向扩展设定的b个像素得到n个对应的拓展矩形区域R₁,R₂,...,R_n。

(4)提取软分割结果图像S的拓展矩形区域R₁,R₂,...,R_n区域的子图像S₁,S₂,...,S_n作为字符图像I₁中每个字符的分割结果，得到每个字符所在的区域位置。

在证件、票据等应用场合中，为了突出前景字符，这些被检测物的字符的灰度值通常与底纹会有一些差异，除了字符边缘以外的位置，一般用自动阈值分割方法可以将前景字符与背景分开；但是考虑到背景有两部分：底纹和背景色，所以传统的自动阈值分割方法实现的前景字符与背景的分割并不是严格意义上的两分类问题；而且在前景字符边缘位置使用传统的自动阈值分割方法不能得到有效结果。本发明的纹理背景下的字符全自动软分割方法采用双阈值OTSU与波谷搜索策略结合的方式求取分割阈值，实现前景字符与背景的有效分割；具体将结合图1～图13进行实际说明，包括：

实施例二

假设某证件的字符图像为I₁，字符图像I₁灰度化后得到灰度图像I₂如图2所示，灰度图像I₂的灰度直方图如图3所示，采用双阈值OTSU分割算法得到的第一分割阈值t₁为53，第一分割阈值t₁与修正后的阈值在直方图中的位置如图4所示，图中三条竖线从左往右分别表示修正后的阈值、第一分割阈值和第二分割阈值的位置，则采用波谷搜索策略修正该第一分割阈值t₁的实施方式如下：

(1)设定波谷搜索策略的参数p_num为7。

(2)统计灰度图像I₂的灰度直方图，h₃₄～h₆₁的值分别为70,69,…,219,如表1所示。

(3)设定波谷位置T的值设置为53，h_T等于h₅₃即113，即T_valley的值为53，H_valley的值为113。

(4)以53为初始位置往直方图数据下标变大的方向逐个访问直方图数据；访问到h₆₁时发现有连续八个灰度直方图数据大于H_valley(值为113)，停止继续向灰度值变大的方向逐个访问直方图数据。

(5)以53为初始位置往直方图数据下标变小的方向逐个访问直方图数据；访问到h43时发现有连续八个灰度直方图数据小于h_T(值为113)且该连续直方图数据中的最小值(86)小于H_valley(113)，修改H_valley为86且修改T_valley为45。

(6)访问到h₄₂时发现有连续9个灰度直方图数据小于h_T(值为113)且该连续直方图数据中的最小值(67)小于H_valley(86)，修改H_valley为67且修改T_valley为42。

(7)访问到h₃₄时发现有连续8个灰度直方图数据大于H_valley(值为67)，停止继续向灰度值变小的方向逐个访问直方图数据。

(8)将T修改为T_valley(42)，即为该策略求得的最终波谷位置。

表1

实施列三

假设某证件的字符图像为I₁，该字符图像I₁中的字符分割的实施方式如下：

(1)灰度化字符图像I₁，得到灰度图像I₂如图2所示。

(2)采用双阈值OTSU分割算法得到第一分割阈值t₁为53，其所对应的阈值分割结果如图5所示

(3)用波谷搜索策略修正第一分割阈值为42。其所对应的阈值分割结果图像I₃如图6所示；并设定波谷搜素策略的参数p_num为7。

(4)对图像I₃的前景部分做形态学腐蚀操作得到如图7所示的图像I₄，其中结构元素H₁设置为3*3矩形；对图像I₃的前景部分做形态学膨胀操作得到如图8所示的图像I₅，其中结构元素H₂设置为5*5矩形。

(5)将图像I₅的前景部分去除图像I₄的前景部分的区域标识为未知区域R_u，其中的像素设置为灰色；将图像I₄的前景部分标识为前景区域R_f，其中的像素设置为白色；将图像I₃范围内除去未知区域R_u和前景区域R_f部分的区域标识为背景区域R_b，其中的像素设置为黑色；由未知区域R_u、前景区域R_f和背景区域R_b组成如图9所示的三分图。

(6)根据字符图像I₁和三分图，采用Shared Sampling抠像算法得到alpha抠像图，将alpha抠像图作为如图10所示的字符序列的软分割结果图像S。

(7)将字符序列的软分割结果图像S中大于127的像素设为白色，其余像素设置为黑色，得到如图11所示的二值图像I₆。

(8)对二值图像I₆求取黑色像素的连通域，若连通域的面积大于20则将该连通域记录下来；若一共记录了30个连通域，则记为：L₁,L₂,...,L₃₀。

(9)求30个连通域L₁,L₂,...,L₃₀中每个连通域对应的的包围矩形，并将各个包围矩形的范围往上下左右四个方向扩展2个像素得到30个对应的拓展矩形区域R₁,R₂,...,R₃₀；即可得到如图12所示的拓展矩形区域R₁,R₂,...,R₃₀在软分割结果图像S中的位置。

(10)提取软分割结果图像S的拓展矩形区域R₁,R₂,...,R₃₀区域的子图像S₁,S₂,...,S₃₀，具体可参阅图13所示，图中每个字符的在软分割结果图像S中的位置即是通过本发明对字符图像I₁所有字符分割操作的实现。

本发明先采用双阈值OTSU分割算法得到第一分割阈值和大于第一分割阈值的第二分割阈值，并在字符图像I₁灰度化的灰度图像I₂对应的直方图中寻找第一分割阈值附近的波谷位置作为分割阈值；在此基础上再通过形态学腐蚀处理、软分割结果的隶属度阈值化处理、连通域分析排除可能留下的一些底纹残迹区域，以达到对字符图像的背景纹理的有效去除；本发明采用抠图算法得到alpha抠像图后，一方面，最终得到的软分割图像可以根据alpha抠像图中alpha取值大小实现通过软分割方法得到传统硬分割方法可以得到效果；另一方面，本发明还可以由alpha抠像图中的隶属度与设定不同阈值比较后实现对字符不同粗细的分割结果，由此可以为后续的识别操作提供不同分割结果，从而实现对字符更加准确的识别；本发明利用抠像算法能够找出字符边缘附近前背景的融合程度，用该融合程度来反映边缘像素的归属是属于字符图像I₁中的字符还是背景纹理，从而可以有效避免由于成像过程中的边缘模糊效应导致的字符图像I₁中字符边缘与背景纹理基本融合在一起的情况，得到的字符边缘较自然；而且可以避免传统硬分割方法可能造成的字符笔画过粗、字符与背景纹理粘连或者字符笔画过细以及出现字符笔画断裂的现象。

以上仅为本发明的较佳实施例，但并不限制本发明的专利范围，尽管参照前述实施例对本发明进行了详细的说明，对于本领域的技术人员来而言，其依然可以对前述各具体实施方式所记载的技术方案进行修改，或者对其中部分技术特征进行等效替换。凡是利用本发明说明书及附图内容所做的等效结构，直接或间接运用在其他相关的技术领域，均同理在本发明专利保护范围之内。

Claims

1.一种纹理背景下的字符全自动软分割方法，其特征在于，所述方法利用双阈值OTSU分割算法和波谷搜索策略，并同时结合形态学、抠像算法和连通域分析方法实现对纹理背景下的字符分割，所述方法包括步骤：

S4、以T为阈值对所述灰度图像I₂阈值化，得到图像I₃；

2.根据权利要求1所述的一种纹理背景下的字符全自动软分割方法，其特征在于，在步骤S1中，若所述灰度图像I₂中背景的整体亮度暗于前景字符，则对所述灰度图像I₂做灰度反转操作。

3.根据权利要求2所述的一种纹理背景下的字符全自动软分割方法，其特征在于，所述灰度反转操作可通过公式s＝L-1-r，其中，s表示经过所述灰度反转操作后所述灰度图像I₂的灰度值，L表示所述灰度图像I₂的灰度等级数，r表示所述灰度图像I₂的原始灰度值。

4.根据权利要求1～3任一项所述的一种纹理背景下的字符全自动软分割方法，其特征在于，所述alpha抠像图为八位灰度图像，所述alpha抠像图的前景像素隶属度越高，则所述alpha抠像图的像素越黑。