CN101447027A - 磁码字符区域的二值化方法及其应用 - Google Patents
磁码字符区域的二值化方法及其应用 Download PDFInfo
- Publication number
- CN101447027A CN101447027A CNA2008102203823A CN200810220382A CN101447027A CN 101447027 A CN101447027 A CN 101447027A CN A2008102203823 A CNA2008102203823 A CN A2008102203823A CN 200810220382 A CN200810220382 A CN 200810220382A CN 101447027 A CN101447027 A CN 101447027A
- Authority
- CN
- China
- Prior art keywords
- magnetic code
- color
- code character
- seed point
- gray
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 79
- 238000010586 diagram Methods 0.000 claims abstract description 9
- 238000013139 quantization Methods 0.000 claims description 18
- 238000007621 cluster analysis Methods 0.000 claims description 12
- 241001632427 Radiola Species 0.000 claims description 8
- 238000004458 analytical method Methods 0.000 claims description 6
- 230000000694 effects Effects 0.000 description 8
- 238000012015 optical character recognition Methods 0.000 description 5
- 238000000605 extraction Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 238000009877 rendering Methods 0.000 description 3
- 230000011218 segmentation Effects 0.000 description 3
- 238000000926 separation method Methods 0.000 description 3
- WUSAVCGXMSWMQM-UHFFFAOYSA-N ambucetamide Chemical compound CCCCN(CCCC)C(C(N)=O)C1=CC=C(OC)C=C1 WUSAVCGXMSWMQM-UHFFFAOYSA-N 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000016776 visual perception Effects 0.000 description 1
Images
Landscapes
- Character Input (AREA)
- Facsimile Image Signal Circuits (AREA)
Abstract
本发明公开一种磁码字符区域的二值化方法,包括下述步骤:(1)输入磁码字符区域图;(2)对所述磁码字符区域图中所有像素的灰度值或色彩值进行量化,然后作直方图统计;(3)基于直方图统计信息寻找目标像素的种子点;(4)基于种子点自身的灰度或色彩信息,在种子点空间邻域内寻找目标像素,并将新发现的目标像素也视为种子点像素;(5)将找到的所有种子点像素视为前景像素,非种子点像素视为背景像素,完成二值化。本发明具有极佳的抗背景干扰能力,稳定性好,手动设定的参数少,方便控制,速度快,计算量小等优点,可较好地应用于票据磁码识别系统、钞票金额识别系统。
Description
技术领域
本发明涉及一种磁码光学字符识别技术,特别涉及一种磁码字符区域的二值化方法及其应用。
背景技术
目前,一个完整的票据磁码光学字符识别(OCR)系统的实现方法如图1所示,通常包括:磁码字符区域二值化、定位、切分、特征提取、识别等几个重要步骤。磁码字符区域二值化是整个识别系统中最具决定性的一步,对后续的定位、切分、特征提取乃至识别的精度都有着至关重要的影响。
传统的图像二值化方法主要包括两种:全局阈值方法与局部阈值方法。其中,全局阈值方法的思路是基于某种最优化准则,对图像中的每个像素使用一个全局阈值来分离出目标区域;其特点在于实现简单,速度快,对前景(目标)与背景有较大区分度的图像有良好的分割效果。全局阈值方法中最著名也应用最为广泛的是上世界七十年代提出的大津法(Otsu)(N.Otsu,A threshold selection method from gray-level histograms,IEEE Transactions on Systems,Man,and Cybernetics,vol.9,no.1,pp.62-66,1979.),该方法是基于直方图最大类间方差的判别准则,计算出最优的全局阈值。但全局阈值方法由于没有考虑到目标区域的空间纹理分布等特点,所以当前景和背景的可分性不佳时,不能有效地把前景从复杂的背景中剥离出来。票据磁码字符区域中往往不仅有磁码和票据底纹,而且还可能存在大量灰度值相近的干扰字符与背景图案。这些因素都严重限制了全局阈值方法的使用。
局部阈值方法采用考察像素邻域的思路,基于邻域内的最值、均值、方差等统计信息,为每个像素估算阈值。著名的方法有:Niblack方法(Anintroduction to digital image processing.W Niblack-1985)、Bernsen方法(J.Bernsen,“Dynamic thresholding of gray level images,”ICPR’86:Proc.Intl.Conf.Patt.Recog.,pp.1251-1255(1986))、Gatos方法(B.Gatos,I.Pratikakis,and S.J.Perantonis,Adaptive degradeddocument image binarization,Pattern Recognition 39(2006),317-327)、Stroke Mode方法(Stroke-model-based character extractionfrom gray-level document images.by Xiangyun Ye,Mohamed Cheriet,Senior Member,Ching Y.Suen IEEE Trans.Image Process)等,局部阈值方法的优势在于能较准确地把握目标区域的空间分布特点,对前景与背景的区分能力较全局阈值方法有了很大提高。但不足之处在于局部窗口的大小较难把握,参数难调节,且计算量非常大。
发明内容
本发明的目的在于克服现有技术的缺点与不足,提供一种运算速度快,计算量小,具有较强的抗背景干扰能力,稳定性好的磁码字符区域的二值化方法。
本发明的另一目的在于提供上述磁码字符区域的二值化方法的应用。
本发明的目的通过下述技术方案实现:一种磁码字符区域的二值化方法,包括下述步骤:
(1)输入磁码字符区域图;
(2)对所述磁码字符区域图中所有像素的灰度值或色彩值进行量化,然后作直方图统计;
(3)基于直方图统计信息寻找目标像素的种子点;
(4)基于种子点自身的灰度或色彩信息,在种子点空间邻域内寻找目标像素,并将新发现的目标像素也视为种子点像素;
(5)将找到的所有种子点像素视为前景像素,非种子点像素视为背景像素,完成二值化。
步骤(1)中,所述磁码字符区域图可为灰度磁码字符区域图或彩色磁码字符区域图。
步骤(2)具体可为:对灰度磁码字符区域图中所有像素的灰度值进行量化,并计算灰度分布数组;或对彩色磁码字符区域所有像素的RGB(红、绿、蓝)三个通道的色彩值进行量化,并计算三通道的色彩联合分布数组。
步骤(2)中,对于灰度磁码字符区域图的情况,所述灰度值量化的系数Bin值取2的幂次方,如2、4、8、16、32等;但实验证明,一般取8、16、32较为理想;所述量化的过程是将输入像素的灰度值整除量化系数Bin,得到量化结果;量化后的灰度分布区间为[0,N-1]其中,N=256/Bin;对量化后的区域所有像素灰度值作直方图分析,得到灰度分布数组hist[i],i=0,1,2...15(hist[i],i=0,1,2...N-1);其中i值表示量化后的灰度级别,hist[i]为对应灰度级别上像素的个数。
步骤(2)中,对于彩色磁码字符区域的情况,所述色彩值量化系数Bin值取2的幂次方,如2、4、8、16、32等;一般取8、16、32较为理想;分别对红绿蓝(RGB)三个色彩通道进行量化,量化后的色彩联合分布区间为[0,N-1]∪[0,N-1]∪[0,N-1],色彩联合分布数组为hist[i][j][k],其中i,j,k=0,1,2,...N-1。
步骤(3)具体可为:对灰度分布数组或色彩联合分布数组进行聚类分析,在聚类分析结果中寻找种子点。
步骤(3)中,对灰度分布数组进行聚类分析具体可包括下述步骤:对灰度分布数组hist[i]进行聚类。令C(i)为第i个灰度级别所隶属的类别,那么对每个灰度级别i,考察其邻近灰度级别i-1与i+1,比较hist[i-1],hist[i],hist[i+1]三者的值。若hist[i-1]最大,则C(i)=C(i-1);若hist[i+1]最大,则C(i)=C(i+1);若hist[i]最大,则说明灰度级别i是波峰,此时产生一个新的类别。
步骤(3)中,对色彩联合分布数组进行聚类分析具体可包括下述步骤:对色彩联合分布数组hist[i][j][k]进行聚类。我们称(i,j,k)为一个色彩级别。令C(i,j,k)为第(i,j,k)个色彩级别所隶属的类别,那么对每个色彩级别(i,j,k),考察其邻域内的色彩级别集合:
Φ={(l,m,n)|l=i-1,i,i+1;m=j-1,j,j+1;n=k-1,k,k+1},
找出色彩级别(i*,j*,k*)使得对任意(l,m,n)∈Φ,有hist[i*][j*][k*])≥hist[l][m][n];
若(i*,j*,k*)恰巧等于(i,j,k),则当前级别在直方图上对应波峰,此时产生一个新的类别。否则,令C(i,j,k)=C(i*,j*,k*)。
不难看出,对色彩分布数组的聚类处理是对灰度情况的高维拓展。
步骤(3)中,对于灰度分布数组的情况,在聚类分析结果中寻找种子点具体可包括下述步骤:经过处理得到的类别中所包含的灰度级别是逐级上升的;绝大部分情况下,大部分磁码字符像素均处于第一类所包含的灰度级别中,即灰度级别集合{i}={i|C(i)=1},少数情况下,由于噪声的影响,在灰度级别i=0上会形成一个干扰波峰,此时{0}={i|C(i)=1},因此需要设定一个判别条件,若第一个类别包含的灰度级别个数Num({i|C(i)=1})>1,则取灰度级别范围{i|C(i)=1}中的像素作为磁码字符的种子点,否则,种子点的设定范围扩大到{i|C(i)≤2}。
步骤(3)中,对于色彩联合分布数组的情况,在聚类分析结果中寻找种子点具体可包括下述步骤:经过处理得到的类别中所包含的色彩级别是逐级上升的;绝大部分情况下,大部分磁码字符像素均处于第一类所包含的色彩级别中,即色彩级别集合:{(i,j,k)}={(i,j,k)|C(i,j,k)=1},少数情况下,由于噪声的影响,在色彩级别(0,0,0)上会形成一个干扰波峰,此时{(0,0,0)}={(i,j,k)|C(i,j,k)=1},因此需要设定一个判别条件,若第一个类别包含的色彩级别个数Num({(i,j,k)|C(i,j,k)=1})>1,则取色彩级别范围{(i,j,k)|C(i,j,k)=1}中的像素作为磁码字符的种子点,否则,种子点的设定范围扩大到{(i,j,k)|C(i,j,k)≤2}。
步骤(4)具体可为:对磁码字符区域图作二值化,所有的种子点像素置黑,其它的点置白,得到初始二值图,在初始二值图上作基于种子点的区域生长,更新,得到生长后的二值图。
步骤(4)中,更新初始二值图具体步骤可为:在初始二值图上作基于种子点的区域生长:对于每个种子点,考察其邻域内的像素点,若该点为种子点,则不作处理;否则,从初始二值图上获取其灰度值或者色彩值f,若满足:f<m+r×σ且f>m-r×σ;其中m和σ分别是磁码字符区域种子点像素灰度值或色彩值的均值和方差;则将该点视为种子点,像素置黑(r为控制系数值,一般取值为1.0~1.5之间)。这样生长下去,一直到所有的种子点邻域中没有符合种子条件的像素点为止。
所述区域生长的方式亦可为:考察每个种子点像素固定尺寸大小的邻域窗口内所有像素,若其像素灰度与种子点像素灰度偏差小于某个固定阈值T,则认为该像素也是种子点像素。
上述磁码字符区域的二值化方法可应用于票据磁码识别系统、钞票金额识别系统等领域。
本发明的作用原理是:从视觉感官上看,磁码字符行在其邻近区域中一般是亮度值“最低”的那部分;反映在灰度直方图上看,磁码行字符像素大部分均集中在原点附近第一个波段内,分别如图2和图3所示。基于以上特点,本发明提出了一种基于直方图聚类来寻找磁码字符种子点,并结合区域生长分离出磁码行字符的二值化方法。本发明方法也同样适用于彩色区域,与灰度区域不同的是,聚类的空间为三维(RGB)色彩空间,其它操作与灰度区域的情况类似。
本发明相对于现有技术具有如下的优点及效果:
(1)本发明基于目标(磁码字符)像素在灰度空间或RGB色彩空间整体分布特点,即总存在一定数量的目标像素,与背景像素在灰度空间或RGB色彩空间上具有良好的可分离性,通过直方图统计的方法先将这些与背景分离程度较高的目标像素提取出来作为种子点,由于剩余的目标像素在空间上与种子点邻近,因此结合邻域分析的方法可完整地提取出剩余的目标像素。在背景干扰程度较大的情况下,上述方法仍然能够有效地提取出目标像素,具有极佳的抗背景干扰能力。
(2)本发明方法具有良好的可操控性,仅需设定的参数为控制区域增长的条件系数r(r取值越高,则区域增长的程度越大,反之则越小)。
(3)本发明方法计算量小,处理速度快,可较好地适用于票据磁码识别系统、钞票金额识别系统等识别精度要求较高的技术邻域。
附图说明
图1是票据磁码光学字符识别(OCR)系统实现方法的流程图。
图2是磁码字符行区域示例图。
图3是对应图2的区域灰度直方图。
图4是本发明方法对于灰度磁码字符区域图情况的流程框图。
图5是图4所示方法的效果图;其中,(A)是原图;(B)是生长前的种子点图;(C)是生长后的种子点图。
图6是图4所示方法与其它方法的效果比较图;其中(A)是原图;(B)是Otsu方法的效果图;(C)是Bernsen方法的效果图;(D)是StrokeMode方法的效果图;(E)是Gatos方法的效果图;(F)是本发明方法的效果图。
图7是本发明方法对于彩色磁码字符区域图情况的处理效果与其它方法的效果比较图。
具体实施方式
下面结合实施例及附图对本发明作进一步详细的描述,但本发明的实施方式不限于此。
实施例1
本发明磁码字符区域的灰度二值化方法具体步骤如图4所示,包括下述步骤:
(1)对输入的灰度磁码字符区域图F0(即图5(A)的原图)所有像素的灰度值进行量化,量化系数量化系数Bin值取Bin=16,量化后原灰度分布区间[0,255]转化为[0,15]。
(2)对量化后的区域所有像素灰度值作直方图分析,得到灰度分布数组hist[i],i=0,1,2...15。其中i值表示量化后的灰度级别,hist[i]为对应灰度级别上像素的个数。
(3)对灰度分布数组hist[i]进行聚类。令C(i)为第i个灰度级别所隶属的类别,那么对每个灰度级别i,考察其邻近灰度级别i-1与i+1,比较hist[i-1],hist[i],hist[i+1]三者的值。若hist[i-1]最大,则C(i)=C(i-1);若hist[i+1]最大,则C(i)=C(i+1);若hist[i]最大,则说明灰度级别i是波峰,此时产生一个新的类别。
(4)在聚类结果寻找种子点。显然经过步骤(3)聚类得到的类别中所包含的灰度级别是逐级上升的。绝大部分情况下,大部分磁码字符像素均处于第一类所包含的灰度级别中,即灰度级别集合:{i}={i|C(i)=1},少数情况下,由于噪声的影响,在灰度级别i=0上会形成一个干扰波峰,此时{0}={i|C(i)=1},因此需要设定一个判别条件,若第一个类别包含的灰度级别个数Num({i|C(i)=1})>1,则取灰度级别范围{i|C(i)=1}中的像素作为磁码字符的种子点,否则,种子点的搜索范围扩大到{i|C(i)≤2}。
(5)统计所有种子点在F0图上像素灰度值的均值m和方差σ,然后对F0图作二值化,所有的种子点像素置黑,其它的点置白,得到F1图(如图5(B)所示)。在F1图上作基于种子点的区域生长:对于每个种子点,考察其邻域内的像素点,若该点为种子点,不变;否则,从F0图上获取其灰度值f,若满足:f<m+r×σ且f>m-r×σ;其中m和σ分别是所有种子点在灰度磁码字符区域图上像素值的均值和方差;则将该点视为种子点,并置黑(r为一系数值,一般取值为1.0~1.5之间)。这样生长下去,一直到所有的种子点邻域中没有符合种子条件的像素点为止。
(6)输出中值滤波去噪后的F1图作为二值化结果,如图5(C)所示。
将本实施例处理结果与现有多种方法的处理结果作比较,如图6所示,图6(B)—(F)中显示了对图6(A)采用不同二值化方法的算法对比效果。
(1)图6(B)采用的是Otsu方法,Otsu法是在灰度空间把待处理图像整体上简单看作是两类对象(目标和背景)的分离问题。
(2)图6(C)采用的是Bersen方法,Bersen法通过计算图像中每个像素的窗口邻域内的统计量(最大值max与最小值min),自适应决定该像素位置的阈值T。
(3)图6(D)采用的是基于Stroke Mode的方法,该方法较适合提取具有笔划特征的目标。
(4)图6(E)采用的是基于Gatos的方法,该方法基于某种初始二值化方法的结果(一般用Niblack法)估计背景平面,进而自适应确定阈值平面。
(5)图6(F)采用的是本发明给出的基于种子点提取的方法。不难看出,虽然图6(A)的背景图案相当复杂,但待提取的目标对象(磁码字符),大部分像素在原图中属于“偏暗”的部分,通过将这些“偏暗”的目标像素提取出来作为种子点,然后结合邻域分析“补充”上剩余的目标像素,即可提取出“完整”、“干净”的目标对象。
上述磁码字符区域的二值化方法可较好地适用于票据磁码识别系统、钞票金额识别系统等识别精度要求较高的技术邻域。
实施例2
本发明磁码字符区域的色彩二值化方法具体包括下述步骤:
(1)输入彩色磁码字符区域图,对彩色磁码字符区域图所有像素的RGB三个通道的色彩值进行量化,量化系数Bin值(Bin=8或Bin=16),量化后的色彩联合分布区间为[0,N-1]∪[0,N-1]∪[0,N-1],其中N=256/Bin。色彩联合分布数组为hist[i][j][k],其中i,j,k=0,1,2,...N-1。
(2)对色彩联合分布数组进行聚类分析具体可包括下述步骤:对色彩联合分布数组hist[i][j][k]进行聚类。我们称(i,j,k)为一个色彩级别。令C(i,j,k)为第(i,j,k)个色彩级别所隶属的类别,那么对每个色彩级别(i,j,k),考察其邻域内的色彩级别集合:
Φ={(l,m,n)|l=i-1,i,i+1;m=j-1,j,j+1;n=k-1,k,k+1},
找出色彩级别(i*,j*,k*)使得对任意(l,m,n)∈Φ,有hist[i*][j*][k*])≥hist[l][m][n];
若(i*,j*,k*)恰巧等于(i,j,k),则当前级别在直方图上对应波峰,此时产生一个新的类别。否则,令C(i,j,k)=C(i*,j*,k*);
(3)在聚类结果寻找种子点。显然经过处理得到的类别中所包含的色彩级别是逐级上升的;绝大部分情况下,大部分磁码字符像素均处于第一类所包含的色彩级别中,即色彩级别集合:{(i,j,k)}={(i,j,k)|C(i,j,k)=1},少数情况下,由于噪声的影响,在色彩级别(0,0,0)上会形成一个干扰波峰,此时{(0,0,0)}={(i,j,k)|C(i,j,k)=1},因此需要设定一个判别条件,若第一个类别包含的色彩级别个数Num({(i,j,k)|C(i,j,k)=1})>1,则取色彩级别范围{(i,j,k)|C(i,j,k)=1}中的像素作为磁码字符的种子点,否则,种子点的设定范围扩大到{(i,j,k)|C(i,j,k)≤2}。
(4)对磁码字符区域图作二值化,所有的种子点像素置黑,其它的点置白,得到初始二值图,在初始二值图上作基于种子点的区域生长,更新,得到生长后的二值图;更新初始二值图具体步骤为:在初始二值图上作基于种子点的区域生长:对于每个种子点,考察其邻域内的像素点,若该点为种子点,则不作处理;否则,从初始二值图上获取其色彩值f,若满足:f<m+r×σ且f>m-r×σ;其中m和σ分别是磁码字符区域种子点像素色彩值的均值和方差;则将该点视为种子点,像素置黑(r为控制系数值,一般取值为1.0~1.5之间)。这样生长下去,一直到所有的种子点邻域中没有符合种子条件的像素点为止。
(5)输出中值滤波去噪后的二值化图作为二值化结果,如图7(F)所示。
将本实施例处理结果与现有多种方法的处理结果作比较,如图7所示,比较结果与实施例1相类似。
上述磁码字符区域的二值化方法可较好地适用于票据磁码识别系统、钞票金额识别系统等识别精度要求较高的技术邻域。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。
Claims (10)
1、一种磁码字符区域的二值化方法,其特征在于包括下述步骤:
(1)输入磁码字符区域图;
(2)对所述磁码字符区域图中所有像素的灰度值或色彩值进行量化,然后作直方图统计;
(3)基于直方图统计信息寻找目标像素的种子点;
(4)基于种子点自身的灰度或色彩信息,在种子点空间邻域内寻找目标像素,并将新发现的目标像素也视为种子点像素;
(5)将找到的所有种子点像素视为前景像素,非种子点像素视为背景像素,完成二值化。
2、根据权利要求1所述的磁码字符区域的二值化方法,其特征在于:步骤(1)中,所述磁码字符区域图为灰度磁码字符区域图或彩色磁码字符区域图。
3、根据权利要求1所述的磁码字符区域的二值化方法,其特征在于:步骤(2)具体为:对灰度磁码字符区域图中所有像素的灰度值进行量化,并计算灰度分布数组;或对彩色磁码字符区域所有像素的RGB三个通道的色彩值进行量化,并计算三通道的色彩联合分布数组。
4、根据权利要求3所述的磁码字符区域的二值化方法,其特征在于:步骤(2)中,对于灰度磁码字符区域图的情况,所述灰度值量化的系数Bin值取2的幂次方;所述量化的过程是将输入像素的灰度值整除量化系数Bin,得到量化结果;量化后的灰度分布区间为[0,N-1]其中,N=256/Bin;对量化后的区域所有像素灰度值作直方图分析,得到灰度分布数组hist[i],i=0,1,2...15(hist[i],i=0,1,2...N-1);其中i值表示量化后的灰度级别,hist[i]为对应灰度级别上像素的个数;对于彩色磁码字符区域的情况,所述色彩值量化系数Bin值取2的幂次方;分别对RGB三个色彩通道进行量化,量化后的色彩联合分布区间为[0,N-1]∪[0,N-1]∪[0,N-1],色彩联合分布数组为hist[i][j][k],其中i,j,k=0,1,2,...N-1。
5、根据权利要求1所述的磁码字符区域的二值化方法,其特征在于:步骤(3)具体为:对灰度分布数组或色彩联合分布数组进行聚类分析,在聚类分析结果中寻找种子点。
6、根据权利要求5所述的磁码字符区域的二值化方法,其特征在于:步骤(3)中,对灰度分布数组进行聚类分析具体包括下述步骤:对灰度分布数组hist[i]进行聚类;令C(i)为第i个灰度级别所隶属的类别,那么对每个灰度级别i,考察其邻近灰度级别i-1与i+1,比较hist[i-1],hist[i],hist[i+1]三者的值;若hist[i-1]最大,则C(i)=C(i-1);若hist[i+1]最大,则C(i)=C(i+1);若hist[i]最大,则说明灰度级别i是波峰,此时产生一个新的类别;对色彩联合分布数组进行聚类分析具体包括下述步骤:对色彩联合分布数组hist[i][j][k]进行聚类;(i,j,k)为一个色彩级别;令C(i,j,k)为第(i,j,k)个色彩级别所隶属的类别,那么对每个色彩级别(i,j,k),考察其邻域内的色彩级别集合:
Φ={(l,m,n)|l=i-1,i,i+1;m=j-1,j,j+1;n=k-1,k,k+1},
找出色彩级别(i*,j*,k*)使得对任意(l,m,n)∈Φ,有hist[i*][j*][k*])≥hist[l][m][n];
若(i*,j*,k*)恰巧等于(i,j,k),则当前级别在直方图上对应波峰,此时产生一个新的类别;否则,令C(i,j,k)=C(i*,j*,k*)。
7、根据权利要求5所述的磁码字符区域的二值化方法,其特征在于:步骤(3)中,对于灰度分布数组的情况,在聚类分析结果中寻找种子点具体包括下述步骤:经过处理得到的类别中所包含的灰度级别是逐级上升的;绝大部分情况下,大部分磁码字符像素均处于第一类所包含的灰度级别中,即灰度级别集合{i}={i|C(i)=1},少数情况下,由于噪声的影响,在灰度级别i=0上会形成一个干扰波峰,此时{0}={i|C(i)=1},设定一个判别条件,若第一个类别包含的灰度级别个数Num({i|C(i)=1})>1,则取灰度级别范围{i|C(i)=1}中的像素作为磁码字符的种子点,否则,种子点的设定范围扩大到{i|C(i)≤2};对于色彩联合分布数组的情况,在聚类分析结果中寻找种子点具体包括下述步骤:经过处理得到的类别中所包含的色彩级别是逐级上升的;绝大部分情况下,大部分磁码字符像素均处于第一类所包含的色彩级别中,即色彩级别集合:{(i,j,k)}={(i,j,k)|C(i,j,k)=1},少数情况下,由于噪声的影响,在色彩级别(0,0,0)上会形成一个干扰波峰,此时{(0,0,0)}={(i,j,k)|C(i,j,k)=1},设定一个判别条件,若第一个类别包含的色彩级别个数Num({(i,j,k)|C(i,j,k)=1})>1,则取色彩级别范围{(i,j,k)|C(i,j,k)=1}中的像素作为磁码字符的种子点,否则,种子点的设定范围扩大到{(i,j,k)|C(i,j,k)≤2}。
8、根据权利要求1所述的磁码字符区域的二值化方法,其特征在于:步骤(4)具体为:对磁码字符区域图作二值化,所有的种子点像素置黑,其它的点置白,得到初始二值图,在初始二值图上作基于种子点的区域生长,更新,得到生长后的二值图。
9、根据权利要求8所述的磁码字符区域的二值化方法,其特征在于:步骤(4)中,更新初始二值图具体步骤为:在初始二值图上作基于种子点的区域生长:对于每个种子点,考察其邻域内的像素点,若该点为种子点,则不作处理;否则,从初始二值图上获取其灰度值或者色彩值f,若满足:f<m+r×σ且f>m-r×σ;其中m和σ分别是磁码字符区域种子点像素灰度值或色彩值的均值和方差;则将该点视为种子点,像素置黑;r为控制系数值;这样生长下去,一直到所有的种子点邻域中没有符合种子条件的像素点为止;所述区域生长的方式为:考察每个种子点像素固定尺寸大小的邻域窗口内所有像素,若其像素灰度与种子点像素灰度偏差小于某个固定阈值T,则认为该像素也是种子点像素。
10、根据权利要求1~9任一项所述磁码字符区域的二值化方法的应用,其特征在于:用于票据磁码识别系统、钞票金额识别系统对票据或钞票进行识别。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2008102203823A CN101447027B (zh) | 2008-12-25 | 2008-12-25 | 磁码字符区域的二值化方法及其应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2008102203823A CN101447027B (zh) | 2008-12-25 | 2008-12-25 | 磁码字符区域的二值化方法及其应用 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101447027A true CN101447027A (zh) | 2009-06-03 |
CN101447027B CN101447027B (zh) | 2011-12-28 |
Family
ID=40742699
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2008102203823A Active CN101447027B (zh) | 2008-12-25 | 2008-12-25 | 磁码字符区域的二值化方法及其应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101447027B (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103578108A (zh) * | 2013-11-07 | 2014-02-12 | 北京京东尚科信息技术有限公司 | 一种图像背景的去除方法 |
CN104050472A (zh) * | 2014-06-12 | 2014-09-17 | 浙江工业大学 | 一种灰度图像二值化的自适应全局阈值方法 |
CN104091388A (zh) * | 2014-07-22 | 2014-10-08 | 新达通科技股份有限公司 | 一种基于磁图像的纸币鉴伪方法及装置 |
CN105184953A (zh) * | 2015-08-03 | 2015-12-23 | 深圳怡化电脑股份有限公司 | 一种纸币处理的方法及装置 |
CN106295630A (zh) * | 2016-07-21 | 2017-01-04 | 北京小米移动软件有限公司 | 字符识别方法及装置 |
CN106920318A (zh) * | 2017-03-07 | 2017-07-04 | 深圳怡化电脑股份有限公司 | 一种纸币的鉴别方法及装置 |
CN107093172A (zh) * | 2016-02-18 | 2017-08-25 | 清华大学 | 文字检测方法及系统 |
CN112581398A (zh) * | 2020-12-22 | 2021-03-30 | 上海电机学院 | 基于区域生长标号的图像降噪方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6941013B1 (en) * | 2002-04-22 | 2005-09-06 | The United States Of America As Represented By The National Security Agency | Method of image binarization using histogram modeling |
US7333656B2 (en) * | 2003-11-26 | 2008-02-19 | Matsushita Electric Industrial Co., Ltd. | Image processing method and image processing apparatus |
-
2008
- 2008-12-25 CN CN2008102203823A patent/CN101447027B/zh active Active
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103578108A (zh) * | 2013-11-07 | 2014-02-12 | 北京京东尚科信息技术有限公司 | 一种图像背景的去除方法 |
CN104050472B (zh) * | 2014-06-12 | 2018-02-27 | 浙江工业大学 | 一种灰度图像二值化的自适应全局阈值方法 |
CN104050472A (zh) * | 2014-06-12 | 2014-09-17 | 浙江工业大学 | 一种灰度图像二值化的自适应全局阈值方法 |
CN104091388A (zh) * | 2014-07-22 | 2014-10-08 | 新达通科技股份有限公司 | 一种基于磁图像的纸币鉴伪方法及装置 |
CN104091388B (zh) * | 2014-07-22 | 2016-06-22 | 新达通科技股份有限公司 | 一种基于磁图像的纸币鉴伪方法及装置 |
CN105184953A (zh) * | 2015-08-03 | 2015-12-23 | 深圳怡化电脑股份有限公司 | 一种纸币处理的方法及装置 |
CN105184953B (zh) * | 2015-08-03 | 2017-12-08 | 深圳怡化电脑股份有限公司 | 一种纸币处理的方法及装置 |
CN107093172A (zh) * | 2016-02-18 | 2017-08-25 | 清华大学 | 文字检测方法及系统 |
CN107093172B (zh) * | 2016-02-18 | 2020-03-17 | 清华大学 | 文字检测方法及系统 |
CN106295630A (zh) * | 2016-07-21 | 2017-01-04 | 北京小米移动软件有限公司 | 字符识别方法及装置 |
CN106295630B (zh) * | 2016-07-21 | 2019-10-15 | 北京小米移动软件有限公司 | 字符识别方法及装置 |
CN106920318A (zh) * | 2017-03-07 | 2017-07-04 | 深圳怡化电脑股份有限公司 | 一种纸币的鉴别方法及装置 |
CN112581398A (zh) * | 2020-12-22 | 2021-03-30 | 上海电机学院 | 基于区域生长标号的图像降噪方法 |
Also Published As
Publication number | Publication date |
---|---|
CN101447027B (zh) | 2011-12-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101447027B (zh) | 磁码字符区域的二值化方法及其应用 | |
CN109154978B (zh) | 用于检测植物疾病的系统和方法 | |
CN111340824B (zh) | 一种基于数据挖掘的图像特征分割方法 | |
CN109636784B (zh) | 基于最大邻域和超像素分割的图像显著性目标检测方法 | |
CN101944233B (zh) | 高分辨遥感图像中快速提取机场目标的方法 | |
CN107038416B (zh) | 一种基于二值图像改进型hog特征的行人检测方法 | |
CN109241973B (zh) | 一种纹理背景下的字符全自动软分割方法 | |
CN112861654B (zh) | 一种基于机器视觉的名优茶采摘点位置信息获取方法 | |
CN104376551A (zh) | 一种融合区域生长和边缘检测的彩色图像分割方法 | |
CN111145209A (zh) | 一种医学图像分割方法、装置、设备及存储介质 | |
Niu et al. | Image segmentation algorithm for disease detection of wheat leaves | |
CN109190632A (zh) | 一种古籍文档图像的二值化方法 | |
CN106127735B (zh) | 一种设施蔬菜边缘清晰类叶面病斑分割方法及装置 | |
CN103218833B (zh) | 边缘加强型的彩色空间最稳极值区域检测方法 | |
CN109446984A (zh) | 自然场景中道路交通标志识别方法 | |
CN103020953A (zh) | 一种指纹图像的分割方法 | |
CN114299051A (zh) | 基于特征建模显著性检测的皮革材料表面缺陷检测方法 | |
Jiang et al. | Skin detection using color, texture and space information | |
US7620246B2 (en) | Method and apparatus for image processing | |
Shambhu et al. | Edge-based segmentation for accurate detection of malaria parasites in microscopic blood smear images: a novel approach using FCM and MPP algorithms | |
CN105205485B (zh) | 基于多类类间最大方差算法的大尺度图像分割算法 | |
CN108205678B (zh) | 一种含有亮斑干扰的铭牌文字识别处理方法 | |
Akther et al. | Detection of vehicle's number plate at nighttime using iterative threshold segmentation (ITS) algorithm | |
CN107239761A (zh) | 基于骨架角点检测的果树拉枝效果评价方法 | |
Kumuda et al. | Human fingernail segmentation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C56 | Change in the name or address of the patentee | ||
CP03 | Change of name, title or address |
Address after: 312, building 6, 310, 311 and 3, South Industrial Road, Songshan hi tech Industrial Development Zone, Guangdong, Dongguan, 523000 Patentee after: GUANGDONG MICROPATTERN SOFTWARE CO., LTD. Address before: 523808, Guangdong province Dongguan Songshan Lake Science and Technology Industrial Park study abroad Pioneer Park No. 18, 509 Patentee before: Dongguan MicroPattern Corporation |