CN109241973A - 一种纹理背景下的字符全自动软分割方法 - Google Patents
一种纹理背景下的字符全自动软分割方法 Download PDFInfo
- Publication number
- CN109241973A CN109241973A CN201810952887.2A CN201810952887A CN109241973A CN 109241973 A CN109241973 A CN 109241973A CN 201810952887 A CN201810952887 A CN 201810952887A CN 109241973 A CN109241973 A CN 109241973A
- Authority
- CN
- China
- Prior art keywords
- image
- character
- area
- threshold
- gray level
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 55
- 230000011218 segmentation Effects 0.000 claims abstract description 82
- 230000009977 dual effect Effects 0.000 claims abstract description 17
- 238000000638 solvent extraction Methods 0.000 claims abstract description 16
- 238000012545 processing Methods 0.000 claims abstract description 11
- 238000005520 cutting process Methods 0.000 claims abstract description 8
- 238000004458 analytical method Methods 0.000 claims abstract description 6
- 230000000877 morphologic effect Effects 0.000 claims description 11
- 230000010339 dilation Effects 0.000 claims description 6
- 230000003628 erosive effect Effects 0.000 claims description 6
- 238000006748 scratching Methods 0.000 abstract description 7
- 230000002393 scratching effect Effects 0.000 abstract description 7
- 238000005530 etching Methods 0.000 abstract description 2
- 238000007781 pre-processing Methods 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 12
- 230000000694 effects Effects 0.000 description 7
- 238000012986 modification Methods 0.000 description 6
- 230000004048 modification Effects 0.000 description 6
- 241001269238 Data Species 0.000 description 4
- 230000004927 fusion Effects 0.000 description 4
- 238000003384 imaging method Methods 0.000 description 3
- 235000013399 edible fruits Nutrition 0.000 description 2
- 238000013178 mathematical model Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
- G06V10/267—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Input (AREA)
Abstract
本发明公开了一种纹理背景下的字符全自动软分割方法,首先对输入的字符图像I1通过灰度化预处理后得到灰度图像I2,采用双阈值OTSU分割算法得到灰度图像I2的两个分割阈值,使用波谷搜索策略并基于较低阈值寻找灰度图像I2直方图的波谷位置,以波谷位置为阈值对直方图进行阈值化得到图像I3;然后利用形态学对图像I3的前景部做腐蚀操作得到图像I4,做膨胀操作得到图像I5,将图像I5前景部分去除图像I4的前景部分标识为未知区域,标识图像I4的前景部分为前景区域,将图像I3范围内除去未知区域和前景区域的区域标识为背景区域,由未知区域、前景区域和背景区域构成三分图;最后使用抠像算法和连通域分析方法得到每个字符区域,实现软分割操作;本发明有效提升了字符分割的准确率。
Description
技术领域
本发明属于图像处理领域,尤其涉及一种纹理背景下的字符全自动软分割方法。
背景技术
字符分割是字符识别任务中的一个步骤。字符识别任务是从一幅包含字符的图像到输出识别的字符,该任务可以分解为多个步骤,包含:字符区域检测,倾斜校正,字符分割,字符识别等几个步骤。字符分割在字符识别任务中是一个核心关键步骤,在证件、票据、车牌等对象的字符识别任务中字符分割的准确性往往决定着相关产品的性能。常用的字符分割方式主要有阈值法、连通域法、投影法和基于纹理特征的方法。阈值法简单快速,但是当背景与前景之间的灰度值相近时,很容易失效;连通域法可以得到每个字符的所在矩形,通过连通域面积可以过滤掉一些噪声,但是当图像背景中有较多纹理时,该方法性能会显著下降;投影法是目前使用较多的一种方法,该法巧妙地利用了字符区域在水平和垂直方向上的投影的分布特征,从而找到字符在水平和垂直方向上的分割位置,但是该法需要将背景噪声或者纹理完全去除后才能正常运行;基于纹理特征的方法的思想是提取文字的纹理特征,然后通过分类器对文字和背景进行分类,该方法的问题在于文字的纹理特征往往不太稳定,较难描述和提取。
如果不考虑由于光照,运动等造成的图像质量问题和文字粘连、单个文字有多个分离部分等文字本身的问题,而仅仅考虑将文字的形状(单个文字或者单个文字中的独立连通部分)从背景中提取出来,字符分割任务中的难点主要有两点。首先背景纹理或噪声是影响字符分割准确性的一大因素,阈值法、连通域法和投影法都需要在背景相对比较干净的前提条件下才能运行良好。其次,在字符图像中,单个字符的像素个数较少,而由于成像过程中不可避免的边缘模糊效应,会造成字符边缘与背景纹理相互融合,在字符边缘部分较难判定某个像素是属于背景还是字符,如果字符笔画本身较细,则边缘部分像素的判定对于字符的形状的影响将变得较大。
例如,在印刷品中通常背景部分有若干底纹,有些情况下底纹的灰度值和前景字符的灰度值差异不大,用传统的阈值分割法较难将背景与字符较好分割出来。再者,由于成像过程中不可避免的边缘模糊效应,字符边缘与背景纹理过度较为平缓,而有些字符图像中,字符的笔画较细,像素尺寸较少,此时字符边缘部分在字符笔画中占比较大。这些难以确定前景还是背景的边缘像素值的归属对于分割后的字符形状的影响较大:较难设计一个算法自动找到一个合适的阈值将正确的字符形状分割出来,阈值稍微偏高可能造成字符笔画过粗,甚至在字符轮廓中包含一些背景纹理,阈值稍微偏低又可能造成字符笔画或细,甚至可能造成某些笔画断裂。
发明内容
本发明的主要目的在于提供了一种纹理背景下的字符全自动软分割方法,用以解决现有技术中在印刷品中存在的底纹灰度值与字符灰度值相近导致难以分割背景与字符和对字符边缘较大的字符图形分割过程中可能导致字符断裂的问题;具体技术方案如下:
一种纹理背景下的字符全自动软分割方法,所述方法利用双阈值OTSU分割算法和波谷搜索策略,并同时结合形态学、抠像算法和连通域分析方法实现对纹理背景下的字符分割,所述方法包括步骤:
S1、输入字符图像I1,并对所述字符图像I1经过灰度化预处理后得到灰度图像I2;
S2、对所述灰度图像I2应用双阈值OTSU分割算法,得到第一分割阈值和大于所述第一分割阈值的第二分割阈值,记录所述第一分割阈值为t1;
S3、获取所述灰度图像I2对应的直方图,并在所述直方图中以t1为初始位置采用波谷搜索策略寻找所述直方图的波谷位置T;
S4、以T为阈值对所述灰度图像I2阈值化,得到图像I3;
S5、对所述图像I3的前景部分进行形态学腐蚀操作得到图像I4;对所述图像I3的前景部分进行形态学膨胀操作得到图像I5;
S6、将所述图像I4的前景部分标识为前景区域Rf,使用形态学将所述图像I5的前景部分去除所述图像I4的前景部分得到未知区域Ru,并将所述图像I3除去所述前景区域Rf和未知区域Ru的区域标识为背景区域Rb,由所述前景区域Rf、未知区域Ru和背景区域Rb组成三分图;
S7、采用抠像算法对所述字符图像I1和所述三分图进行抠像操作,得到alpha抠像图,并将所述alpha抠像图作为字符序列的软分割结果图像S;
S8、将所述软分割结果图像S中像素值大于127的像素设置为白色,其余像素设置为黑色,得到二值图像I6,并求取所述二值图像I6中黑色像素的连通域;
S9、设定一连通域面积阈值,滤除面积小于所述连通域面积阈值的所有所述连通域,并求取面积大于所述连通域面积阈值的每一所述连通域各自的包围矩形;
S10、设定一拓展率,按照所述拓展率拓展所述包围矩形,得到n个与所述包围矩形相对应的拓展矩形区域,并依次标记所述拓展矩形区域为R1,R2,...,Rn;
S11、提取所述软分割结果图像S在所述拓展矩形区域R1,...,R2,Rn的子图像S1,...,S2,Sn,实现对纹理背景下字符的全自动软分割操作。
作为优选,在步骤S1中,若所述灰度图像I2中背景的整体亮度暗于前景字符,则对所述灰度图像I2做灰度反转操作。
作为优选,所述灰度反转操作可通过公式s=L-1-r,其中,s表示经过所述灰度反转操作后所述灰度图像I2的灰度值,L表示所述灰度图像I2的灰度等级数,r表示所述灰度图像I2的原始灰度值。
作为优选,所述alpha抠像图为八位灰度图像,所述alpha抠像图的前景像素隶属度越高,则所述alpha抠像图的像素越黑。
与现有技术相比,本发明的纹理背景下的字符全自动软分割方法有益效果为:
(1)本发明先采用双阈值OTSU分割算法得到第一分割阈值和大于第一分割阈值的第二分割阈值,并在字符图像I1灰度化的灰度图像I2对应的直方图中寻找第一分割阈值附近的波谷位置作为分割阈值;在此基础上再通过形态学腐蚀处理、软分割结果的隶属度阈值化处理、连通域分析排除可能留下的一些底纹残迹区域,以达到对字符图像的背景纹理的有效去除。
(2)本发明采用抠图算法得到alpha抠像图后,一方面,最终得到的软分割图像可以根据alpha抠像图中alpha取值大小实现通过软分割方法得到传统硬分割方法可以得到效果;另一方面,本发明还可以由alpha抠像图中的隶属度与设定不同阈值比较后实现对字符不同粗细的分割结果,由此可以为后续的识别操作提供不同分割结果,从而实现对字符更加准确的识别。
(3)本发明利用抠像算法能够找出字符边缘附近与背景的融合程度,用该融合程度来反映边缘像素的归属是属于字符图像I1中的字符还是背景纹理,从而可以有效避免由于成像过程中的边缘模糊效应导致的字符图像I1中字符边缘与背景纹理基本融合在一起的情况,可得到边缘较自然的字符;而且可避免传统硬分割方法可能造成的字符笔画过粗、字符与背景纹理粘连或者字符笔画过细以及出现字符笔画断裂的现象。
附图说明
图1为本发明实施例中所述纹理背景下的字符全自动软分割方法的流程框图示意;
图2为本发明实施例中所述字符图像I1得到的灰度图像I2示意;
图3为本发明实施例中所述灰度图像I2的直方图图形化示意;
图4为本发明实施例中所述双阈值OTSU分割算法得到的阈值和波谷搜索策略得到的阈值图示意;
图5为本发明实施例中所述灰度图像I2用双阈值OTSU分割算法得到的第二分割阈值进行阈值化的结果示意图;
图6为本发明实施例中采用所述波谷搜索策略以波谷T为阈值进行阈值化后得到图像I3的结果示意图;
图7为本发明实施例中所述图像I3的黑色像素进行3*3腐蚀以后的结果示意图;
图8为本发明实施例中所述图像I3的黑色像素进行5*5膨胀运算的结果示意图;
图9为本发明实施例中所述三分图示意;
图10为本发明实施例中所述alpha抠像图示意;
图11为本发明实施例中所述alpha抠像图中像素值大于127的像素设为白色,其余像素设置为黑色的结果图像示意;
图12为本发明实施例中经过对图像I6过滤操作后所述拓展矩形区域与所述字符之间的位置图示意;
图13为采用本发明纹理背景下的字符全自动软分割方法的实施例字符分割结果图示意。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。
实施例一
本发明提供了一种纹理背景下的字符全自动软分割方法,所述方法的具体过程为:
首先,对输入字符图像I1进行灰度化,得到灰度图像I2,本发明需要保证灰度图像I2中背景的整体亮度亮于前景字符,有利于后续对前景字符的分割操作;若灰度图像I2存在背景的整体亮度暗于前景字符的情况,本发明需要对灰度图像I2做灰度反转操作,具体通过公式s=L-1-r实现,使得灰度图像I2经过灰度反转操作后符合字符亮度暗于背景的整体亮度;公式s=L-1-r中,s表示灰度图像I2处理后的灰度值,L表示灰度图像I2的灰度等级数,r表示灰度图像I2的原始灰度值;优选的,在具体实施例中,灰度化方法可采用RGB三通道取平均值法、YUV的Y通道、或者采用YCbCr的Y通道等,对此本发明并不进行限制和固定,可根据实际情况进行选择。
随后,采用双阈值OTSU分割算法和波谷搜索策略求取所述灰度图像I2的分割阈值,假设灰度图像I2的灰度值取值范围为[0,1,...,L-1],先由双阈值OTSU分割算法可以求得灰度图像I2的第一分割阈值t1和第二分割阈值t2两个阈值,其中,第二分割阈值t2大于第一分割阈值t1,此时,第一分割阈值t1和第二分割阈值t2将灰度图像I2的灰度值分为三类阈值区间,分别为[0,t1-1],[t1,t2-1]和[t2,L-1];此时,可以由公式来表示双阈值OTSU分割算法的目标函数,式中,wk,uk,ut分别表示在三类阈值区间[0,t1-1]、[t1,t2-1]和[t2,L-1]中字符出现的概率、均值和图像的总的均值;并且由于对于一特定图像而言,ut为一常数,所以可将公式简化为公式同时由于前景字符的灰度值较暗,所以只需要第一分割阈值t1就可以对灰度图像I2进行二值化而实现对前景字符的分割操作;随后采用波谷搜索策略修正第一分割阈值t1,具体的,波谷搜索策略利用双阈值OTSU分割算法以第一分割阈值t1为起点搜索一个所述直方图的波谷位置T,同时,假设直方图的数据为h0,h1,h2,...,hL-1,其中,L为所述灰度图像I2的灰度等级;设定一波谷搜索策略参数pnum,则波谷搜索策略的具体过程描述如下:
(1)将当前波谷位置T设置为双阈值OTSU求得的第一分割阈值t1的具体值。
(2)设置候选波谷位置Tvalley的初始值为T,设置候选波谷位置的直方图数据Hvalley为hT。
(3)以第一分割阈值t1的具体值为初始位置往直方图数据下标变大的方向逐个访问直方图数据,满足以下两个条件之一时停止访问:
(a)连续pnum+1个直方图数据大于直方图数据Hvalley;
(b)访问到了最后一个直方图数据。
(4)在访问直方图数据过程中,按照以下规则修改直方图数据Tvalley和直方图数据Hvalley的值;小于hT的连续直方图数据个数大于pnum个,且该连续直方图数据中的最小值小于直方图数据Hvalley,则修改Hvalley为该连续直方图数据中的最小值且修改直方图数据Tvalley为该最小值在直方图中所对应的灰度值。
(5)以第一分割阈值t1为初始位置往直方图数据下标变小的方向逐个访问直方图数据,满足以下两个条件之一时停止访问:
(a)连续pnum+1个直方图数据大于直方图数据Hvalley;
(b)访问到了第一直方图数据。
(6)在访问直方图数据过程中,按照以下规则修改直方图数据Tvalley和直方图数据Hvalley的值:小于hT的连续直方图数据个数大于pnum个,且该连续直方图数据中的最小值小于直方图数据Hvalley,则修改直方图数据Hvalley为该连续直方图数据中的最小值且修改直方图数据Tvalley为该最小值在直方图中所对应的灰度值。
(7)两个方向的访问都停止后,将T修改为直方图数据Tvalley,即为该策略求得的最终波谷位置。
接着,利用形态学获取三分图和使用抠像算法得到alpha抠像图,其中,利用形态学获取三分图的过程中形态学腐蚀操作过程中的结构元素设为H1,形态学膨胀操作过程中的结构元素设为H2两个参数,具体过程步骤为:
(1)以波谷位置T为阈值将灰度图像I2阈值化得到图像I3。
(2)将图像I3的前景部分用结构元素H1进行形态学腐蚀得到图像I4。
(3)将图像I3的前景部分用结构元素H2进行形态学膨胀得到图像I5。
(4)将图像I5的前景部分去除图像I4的前景部分的区域标识为未知区域Ru。
(5)将图像I4的前景部分标识为前景区域Rf。
(6)将图像I3范围内除去未知区域Ru和前景区域Rf部分的区域标识为背景区域Rb。
(7)最后由未知区域Ru、前景区域Rf和背景区域Rb组成三分图。
抠像算法可通过公式Ii=αiFi+(1-αi)Bi,αi∈[0,1]构建的数学模型表示,其中I表示输入所述数学模型的图像,α表示图像I的透明度,F表示图像I的前景颜色,B表示图像I的背景颜色;常见的抠像算法有closed-form抠像、KNN抠像、Spectral抠像、Shared Sampling抠像、基于学习的抠像等;但是在应用这些抠像技术前,均需要一个先验指导信息,本发明以三分图为先验指导信息;因此,本发明根据由未知区域Ru、前景区域Rf和背景区域Rb组成三分图和字符图像I1可以通过抠像算法得到与字符图像I1对应的alpha抠像图,并将所述alpha抠像图作为本发明中字符序列的软分割结果图像S,软分割结果图像S为八位灰度图像,且满足前景像素隶属度越高像素越黑的特征。
在本发明的具体实施例中,并不对抠像算法的选取进行限制和固定,可根据实际操作以及各种抠像算法的效果和计算速度进行选择。
最后,为了获取字符图像I1中每个字符的分割结果,本发明采用连通域分析方法获取每个字符的区域位置,进而实现对每个字符的分割操作;具体过程为:
(1)将字符图像I1中字符序列的软分割结果图像S中像素值大于127的像素设置白色,其余像素设置为黑色,得到一幅二值图像I6。
(2)对二值图像I6求取黑色像素的连通域,遍历所有连通域,若连通域的面积大于设定的面积a则记录该连通域,假设共包括n个连通域,则记为:L1,L2,...,Ln。
(3)分别求n个连通域L1,L2,...,Ln的包围矩形,并将各个包围矩形的范围往上下左右四个方向扩展设定的b个像素得到n个对应的拓展矩形区域R1,R2,...,Rn。
(4)提取软分割结果图像S的拓展矩形区域R1,R2,...,Rn区域的子图像S1,S2,...,Sn作为字符图像I1中每个字符的分割结果,得到每个字符所在的区域位置。
在证件、票据等应用场合中,为了突出前景字符,这些被检测物的字符的灰度值通常与底纹会有一些差异,除了字符边缘以外的位置,一般用自动阈值分割方法可以将前景字符与背景分开;但是考虑到背景有两部分:底纹和背景色,所以传统的自动阈值分割方法实现的前景字符与背景的分割并不是严格意义上的两分类问题;而且在前景字符边缘位置使用传统的自动阈值分割方法不能得到有效结果。本发明的纹理背景下的字符全自动软分割方法采用双阈值OTSU与波谷搜索策略结合的方式求取分割阈值,实现前景字符与背景的有效分割;具体将结合图1~图13进行实际说明,包括:
实施例二
假设某证件的字符图像为I1,字符图像I1灰度化后得到灰度图像I2如图2所示,灰度图像I2的灰度直方图如图3所示,采用双阈值OTSU分割算法得到的第一分割阈值t1为53,第一分割阈值t1与修正后的阈值在直方图中的位置如图4所示,图中三条竖线从左往右分别表示修正后的阈值、第一分割阈值和第二分割阈值的位置,则采用波谷搜索策略修正该第一分割阈值t1的实施方式如下:
(1)设定波谷搜索策略的参数pnum为7。
(2)统计灰度图像I2的灰度直方图,h34~h61的值分别为70,69,…,219,如表1所示。
(3)设定波谷位置T的值设置为53,hT等于h53即113,即Tvalley的值为53,Hvalley的值为113。
(4)以53为初始位置往直方图数据下标变大的方向逐个访问直方图数据;访问到h61时发现有连续八个灰度直方图数据大于Hvalley(值为113),停止继续向灰度值变大的方向逐个访问直方图数据。
(5)以53为初始位置往直方图数据下标变小的方向逐个访问直方图数据;访问到h43时发现有连续八个灰度直方图数据小于hT(值为113)且该连续直方图数据中的最小值(86)小于Hvalley(113),修改Hvalley为86且修改Tvalley为45。
(6)访问到h42时发现有连续9个灰度直方图数据小于hT(值为113)且该连续直方图数据中的最小值(67)小于Hvalley(86),修改Hvalley为67且修改Tvalley为42。
(7)访问到h34时发现有连续8个灰度直方图数据大于Hvalley(值为67),停止继续向灰度值变小的方向逐个访问直方图数据。
(8)将T修改为Tvalley(42),即为该策略求得的最终波谷位置。
表1
实施列三
假设某证件的字符图像为I1,该字符图像I1中的字符分割的实施方式如下:
(1)灰度化字符图像I1,得到灰度图像I2如图2所示。
(2)采用双阈值OTSU分割算法得到第一分割阈值t1为53,其所对应的阈值分割结果如图5所示
(3)用波谷搜索策略修正第一分割阈值为42。其所对应的阈值分割结果图像I3如图6所示;并设定波谷搜素策略的参数pnum为7。
(4)对图像I3的前景部分做形态学腐蚀操作得到如图7所示的图像I4,其中结构元素H1设置为3*3矩形;对图像I3的前景部分做形态学膨胀操作得到如图8所示的图像I5,其中结构元素H2设置为5*5矩形。
(5)将图像I5的前景部分去除图像I4的前景部分的区域标识为未知区域Ru,其中的像素设置为灰色;将图像I4的前景部分标识为前景区域Rf,其中的像素设置为白色;将图像I3范围内除去未知区域Ru和前景区域Rf部分的区域标识为背景区域Rb,其中的像素设置为黑色;由未知区域Ru、前景区域Rf和背景区域Rb组成如图9所示的三分图。
(6)根据字符图像I1和三分图,采用Shared Sampling抠像算法得到alpha抠像图,将alpha抠像图作为如图10所示的字符序列的软分割结果图像S。
(7)将字符序列的软分割结果图像S中大于127的像素设为白色,其余像素设置为黑色,得到如图11所示的二值图像I6。
(8)对二值图像I6求取黑色像素的连通域,若连通域的面积大于20则将该连通域记录下来;若一共记录了30个连通域,则记为:L1,L2,...,L30。
(9)求30个连通域L1,L2,...,L30中每个连通域对应的的包围矩形,并将各个包围矩形的范围往上下左右四个方向扩展2个像素得到30个对应的拓展矩形区域R1,R2,...,R30;即可得到如图12所示的拓展矩形区域R1,R2,...,R30在软分割结果图像S中的位置。
(10)提取软分割结果图像S的拓展矩形区域R1,R2,...,R30区域的子图像S1,S2,...,S30,具体可参阅图13所示,图中每个字符的在软分割结果图像S中的位置即是通过本发明对字符图像I1所有字符分割操作的实现。
本发明先采用双阈值OTSU分割算法得到第一分割阈值和大于第一分割阈值的第二分割阈值,并在字符图像I1灰度化的灰度图像I2对应的直方图中寻找第一分割阈值附近的波谷位置作为分割阈值;在此基础上再通过形态学腐蚀处理、软分割结果的隶属度阈值化处理、连通域分析排除可能留下的一些底纹残迹区域,以达到对字符图像的背景纹理的有效去除;本发明采用抠图算法得到alpha抠像图后,一方面,最终得到的软分割图像可以根据alpha抠像图中alpha取值大小实现通过软分割方法得到传统硬分割方法可以得到效果;另一方面,本发明还可以由alpha抠像图中的隶属度与设定不同阈值比较后实现对字符不同粗细的分割结果,由此可以为后续的识别操作提供不同分割结果,从而实现对字符更加准确的识别;本发明利用抠像算法能够找出字符边缘附近前背景的融合程度,用该融合程度来反映边缘像素的归属是属于字符图像I1中的字符还是背景纹理,从而可以有效避免由于成像过程中的边缘模糊效应导致的字符图像I1中字符边缘与背景纹理基本融合在一起的情况,得到的字符边缘较自然;而且可以避免传统硬分割方法可能造成的字符笔画过粗、字符与背景纹理粘连或者字符笔画过细以及出现字符笔画断裂的现象。
以上仅为本发明的较佳实施例,但并不限制本发明的专利范围,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来而言,其依然可以对前述各具体实施方式所记载的技术方案进行修改,或者对其中部分技术特征进行等效替换。凡是利用本发明说明书及附图内容所做的等效结构,直接或间接运用在其他相关的技术领域,均同理在本发明专利保护范围之内。
Claims (4)
1.一种纹理背景下的字符全自动软分割方法,其特征在于,所述方法利用双阈值OTSU分割算法和波谷搜索策略,并同时结合形态学、抠像算法和连通域分析方法实现对纹理背景下的字符分割,所述方法包括步骤:
S1、输入字符图像I1,并对所述字符图像I1经过灰度化预处理后得到灰度图像I2;
S2、对所述灰度图像I2应用双阈值OTSU分割算法,得到第一分割阈值和大于所述第一分割阈值的第二分割阈值,记录所述第一分割阈值为t1;
S3、获取所述灰度图像I2对应的直方图,并在所述直方图中以t1为初始位置采用波谷搜索策略寻找所述直方图的波谷位置T;
S4、以T为阈值对所述灰度图像I2阈值化,得到图像I3;
S5、对所述图像I3的前景部分进行形态学腐蚀操作得到图像I4;对所述图像I3的前景部分进行形态学膨胀操作得到图像I5;
S6、将所述图像I4的前景部分标识为前景区域Rf,使用形态学将所述图像I5的前景部分去除所述图像I4的前景部分得到未知区域Ru,并将所述图像I3除去所述前景区域Rf和未知区域Ru的区域标识为背景区域Rb,由所述前景区域Rf、未知区域Ru和背景区域Rb组成三分图;
S7、采用抠像算法对所述字符图像I1和所述三分图进行抠像操作,得到alpha抠像图,并将所述alpha抠像图作为字符序列的软分割结果图像S;
S8、将所述软分割结果图像S中像素值大于127的像素设置为白色,其余像素设置为黑色,得到二值图像I6,并求取所述二值图像I6中黑色像素的连通域;
S9、设定一连通域面积阈值,滤除面积小于所述连通域面积阈值的所有所述连通域,并求取面积大于所述连通域面积阈值的每一所述连通域各自的包围矩形;
S10、设定一拓展率,按照所述拓展率拓展所述包围矩形,得到n个与所述包围矩形相对应的拓展矩形区域,并依次标记所述拓展矩形区域为R1,R2,...,Rn;
S11、提取所述软分割结果图像S在所述拓展矩形区域R1,...,R2,Rn的子图像S1,...,S2,Sn,实现对纹理背景下字符的全自动软分割操作。
2.根据权利要求1所述的一种纹理背景下的字符全自动软分割方法,其特征在于,在步骤S1中,若所述灰度图像I2中背景的整体亮度暗于前景字符,则对所述灰度图像I2做灰度反转操作。
3.根据权利要求2所述的一种纹理背景下的字符全自动软分割方法,其特征在于,所述灰度反转操作可通过公式s=L-1-r,其中,s表示经过所述灰度反转操作后所述灰度图像I2的灰度值,L表示所述灰度图像I2的灰度等级数,r表示所述灰度图像I2的原始灰度值。
4.根据权利要求1~3任一项所述的一种纹理背景下的字符全自动软分割方法,其特征在于,所述alpha抠像图为八位灰度图像,所述alpha抠像图的前景像素隶属度越高,则所述alpha抠像图的像素越黑。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810952887.2A CN109241973B (zh) | 2018-08-21 | 2018-08-21 | 一种纹理背景下的字符全自动软分割方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810952887.2A CN109241973B (zh) | 2018-08-21 | 2018-08-21 | 一种纹理背景下的字符全自动软分割方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109241973A true CN109241973A (zh) | 2019-01-18 |
CN109241973B CN109241973B (zh) | 2022-02-08 |
Family
ID=65071670
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810952887.2A Active CN109241973B (zh) | 2018-08-21 | 2018-08-21 | 一种纹理背景下的字符全自动软分割方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109241973B (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110033463A (zh) * | 2019-04-12 | 2019-07-19 | 腾讯科技(深圳)有限公司 | 一种前景数据生成及其应用方法、相关装置和系统 |
CN110728687A (zh) * | 2019-10-15 | 2020-01-24 | 卓尔智联(武汉)研究院有限公司 | 文件图像分割方法、装置、计算机设备和存储介质 |
CN111784726A (zh) * | 2019-09-25 | 2020-10-16 | 北京沃东天骏信息技术有限公司 | 人像抠图方法和装置 |
CN112613512A (zh) * | 2020-12-29 | 2021-04-06 | 西北民族大学 | 基于结构属性的乌金体藏文古籍字符切分方法及系统 |
CN112634240A (zh) * | 2020-12-25 | 2021-04-09 | 南京邮电大学 | 基于阈值分割的甲状腺超声图像干扰界面自动识别去除方法 |
CN113255684A (zh) * | 2021-06-28 | 2021-08-13 | 恒银金融科技股份有限公司 | 一种基于灰度图溢出的背景分离方法 |
CN114119722A (zh) * | 2020-08-26 | 2022-03-01 | 武汉高德智感科技有限公司 | 一种黑体光标自动定位方法及装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101789080A (zh) * | 2010-01-21 | 2010-07-28 | 上海交通大学 | 车辆车牌实时定位字符分割的检测方法 |
CN103077384A (zh) * | 2013-01-10 | 2013-05-01 | 北京万集科技股份有限公司 | 一种车标定位识别的方法与系统 |
CN103116751A (zh) * | 2013-01-24 | 2013-05-22 | 河海大学 | 一种车牌字符自动识别方法 |
CN106338520A (zh) * | 2016-09-18 | 2017-01-18 | 南京林业大学 | 一种表板为拼板的多层实木复合地板表面缺陷的识别方法 |
WO2017031716A1 (zh) * | 2015-08-26 | 2017-03-02 | 北京云江科技有限公司 | 自然场景图像中手写体数学公式结构分析与识别方法 |
-
2018
- 2018-08-21 CN CN201810952887.2A patent/CN109241973B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101789080A (zh) * | 2010-01-21 | 2010-07-28 | 上海交通大学 | 车辆车牌实时定位字符分割的检测方法 |
CN103077384A (zh) * | 2013-01-10 | 2013-05-01 | 北京万集科技股份有限公司 | 一种车标定位识别的方法与系统 |
CN103116751A (zh) * | 2013-01-24 | 2013-05-22 | 河海大学 | 一种车牌字符自动识别方法 |
WO2017031716A1 (zh) * | 2015-08-26 | 2017-03-02 | 北京云江科技有限公司 | 自然场景图像中手写体数学公式结构分析与识别方法 |
CN106338520A (zh) * | 2016-09-18 | 2017-01-18 | 南京林业大学 | 一种表板为拼板的多层实木复合地板表面缺陷的识别方法 |
Non-Patent Citations (1)
Title |
---|
朱春满等: "复杂背景下的多车牌定位技术研究", 《公路交通科技》 * |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110033463A (zh) * | 2019-04-12 | 2019-07-19 | 腾讯科技(深圳)有限公司 | 一种前景数据生成及其应用方法、相关装置和系统 |
CN110033463B (zh) * | 2019-04-12 | 2021-06-04 | 腾讯科技(深圳)有限公司 | 一种前景数据生成及其应用方法、相关装置和系统 |
US11961237B2 (en) | 2019-04-12 | 2024-04-16 | Tencent Technology (Shenzhen) Company Limited | Foreground data generation method and method for applying same, related apparatus, and system |
CN111784726A (zh) * | 2019-09-25 | 2020-10-16 | 北京沃东天骏信息技术有限公司 | 人像抠图方法和装置 |
CN110728687A (zh) * | 2019-10-15 | 2020-01-24 | 卓尔智联(武汉)研究院有限公司 | 文件图像分割方法、装置、计算机设备和存储介质 |
CN110728687B (zh) * | 2019-10-15 | 2022-08-02 | 卓尔智联(武汉)研究院有限公司 | 文件图像分割方法、装置、计算机设备和存储介质 |
CN114119722B (zh) * | 2020-08-26 | 2022-12-13 | 武汉高德智感科技有限公司 | 一种黑体光标自动定位方法及装置 |
CN114119722A (zh) * | 2020-08-26 | 2022-03-01 | 武汉高德智感科技有限公司 | 一种黑体光标自动定位方法及装置 |
CN112634240B (zh) * | 2020-12-25 | 2022-09-23 | 南京邮电大学 | 基于阈值分割的甲状腺超声图像干扰界面自动识别去除方法 |
CN112634240A (zh) * | 2020-12-25 | 2021-04-09 | 南京邮电大学 | 基于阈值分割的甲状腺超声图像干扰界面自动识别去除方法 |
CN112613512A (zh) * | 2020-12-29 | 2021-04-06 | 西北民族大学 | 基于结构属性的乌金体藏文古籍字符切分方法及系统 |
CN113255684B (zh) * | 2021-06-28 | 2021-10-26 | 恒银金融科技股份有限公司 | 一种基于灰度图溢出的背景分离方法 |
CN113255684A (zh) * | 2021-06-28 | 2021-08-13 | 恒银金融科技股份有限公司 | 一种基于灰度图溢出的背景分离方法 |
Also Published As
Publication number | Publication date |
---|---|
CN109241973B (zh) | 2022-02-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109241973A (zh) | 一种纹理背景下的字符全自动软分割方法 | |
US9251614B1 (en) | Background removal for document images | |
Flores et al. | Application of convolutional neural networks for static hand gestures recognition under different invariant features | |
US9971929B2 (en) | Fingerprint classification system and method using regular expression machines | |
TW201732651A (zh) | 一種單詞的分割方法和裝置 | |
CN104408449B (zh) | 智能移动终端场景文字处理方法 | |
CN108830857B (zh) | 一种自适应的汉字碑帖图像二值化分割方法 | |
CN113158977B (zh) | 改进FANnet生成网络的图像字符编辑方法 | |
Boiangiu et al. | Voting-based OCR system | |
CN104834890B (zh) | 一种对书法作品中文字神采信息的提取方法 | |
CN111681198A (zh) | 一种形态学属性滤波多模融合成像方法、系统及介质 | |
CN106331746B (zh) | 用于识别视频文件中的水印位置的方法和装置 | |
CN104794693A (zh) | 一种人脸关键区域自动检测蒙版的人像优化方法 | |
CN110309830A (zh) | 基于数学形态学和区域连通性的甲骨文字自动分割方法 | |
Janani et al. | Recognition and analysis of Tamil inscriptions and mapping using image processing techniques | |
CN114359538A (zh) | 一种水表读数定位与识别方法 | |
CN111539980A (zh) | 一种基于可见光的多目标追踪方法 | |
CN111310868A (zh) | 一种基于卷积神经网络的水书手写文字识别方法 | |
CN112686265A (zh) | 一种基于层级轮廓提取的象形文字分割方法 | |
CN109741273A (zh) | 一种手机拍照低质图像的自动处理与评分方法 | |
CN112070684B (zh) | 基于形态先验特征的甲骨刻辞文字修复方法 | |
CN112200789B (zh) | 一种图像识别的方法及装置、电子设备和存储介质 | |
CN108205678B (zh) | 一种含有亮斑干扰的铭牌文字识别处理方法 | |
Shi et al. | Image enhancement for degraded binary document images | |
Qin et al. | Robust and accurate text stroke segmentation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20231026 Address after: No. 2, Lifa Avenue, Chengdong Town, Hai'an City, Nantong City, Jiangsu Province, 226600 Patentee after: Jiangsu Quanfeng Electric Co.,Ltd. Address before: 1 No. 211167 Jiangsu city of Nanjing province Jiangning Science Park Hongjing Road Patentee before: NANJING INSTITUTE OF TECHNOLOGY |
|
TR01 | Transfer of patent right |