CN102122347B - 判别图像中文本颜色极性的方法及装置 - Google Patents

判别图像中文本颜色极性的方法及装置 Download PDF

Info

Publication number
CN102122347B
CN102122347B CN 201110080923 CN201110080923A CN102122347B CN 102122347 B CN102122347 B CN 102122347B CN 201110080923 CN201110080923 CN 201110080923 CN 201110080923 A CN201110080923 A CN 201110080923A CN 102122347 B CN102122347 B CN 102122347B
Authority
CN
China
Prior art keywords
stroke
stroke pattern
value
uproar
making
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN 201110080923
Other languages
English (en)
Other versions
CN102122347A (zh
Inventor
黄磊
王修飞
刘昌平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Hanwang Zhiyuan Technology Co ltd
Original Assignee
Hanwang Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hanwang Technology Co Ltd filed Critical Hanwang Technology Co Ltd
Priority to CN 201110080923 priority Critical patent/CN102122347B/zh
Publication of CN102122347A publication Critical patent/CN102122347A/zh
Application granted granted Critical
Publication of CN102122347B publication Critical patent/CN102122347B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Discrimination (AREA)
  • Character Input (AREA)

Abstract

本发明公开了一种判别图像中文本颜色极性的方法,属于图像处理领域。该方法包括:对原始图像进行预处理,得到预处理后的文本图像;从预处理后的文本图像中提取字符笔画特征,获得笔画图;对获得的笔画图进行二值化和噪声过滤处理,得到滤噪二值笔画图;根据获得的笔画图和滤噪二值笔画图计算原始图像的笔画强度,根据笔画强度判别原始图像中文本颜色的极性。本发明还公开了一种判别图像中文本颜色极性的装置。本发明的方法及装置利用文本的笔画信息,可有效地消除复杂背景所带来的干扰,利用文本正向、负向笔画图中的笔画强度来度量图像中文本的颜色极性,可以有效地判断出图像的文本颜色的极性,且计算简单方便。

Description

判别图像中文本颜色极性的方法及装置
技术领域
本发明涉及图像处理领域,特别涉及一种判别图像中文本颜色极性的方法及装置。
背景技术
所谓文本的极性,可以分为正向文本和负向文本,其中,正向文本的图像即表示亮底暗字的情形,负向文本的图像即表示暗底亮字的情形。图像中文本颜色极性的判别是视频和文本图像中字符识别处理过程中比较关键的一步,目前的OCR引擎大部分是针对暗底亮字(即背景为黑色,字符为白色)的文本图像进行识别,若文本图像的颜色极性判断错误,则将直接导致错误的识别结果。
已有的文本图像颜色极性判别方法主要是基于文本的边缘特征。如现有技术中的方法(参见参考文献【1】),通过计算白边缘和黑边缘点的数目,并结合四个统计分类结果构造的分类器进行判断的。现有技术中还有的方法(参见参考文献【2】),通过先计算文字区域中间0.35h行像素的平均值m1,再计算上下边缘共0.35h行像素的平均值m2,如果m1>m2,则文本颜色极性为亮文本,否则为暗文本。基于边缘的方法的一个主要问题是难以克服复杂背景的干扰,对于所处背景比较复杂的文本图像,由于背景中的非文本噪声也具有较强的边缘信息,这会给文本颜色极性的判别带来极大的干扰。
发明内容
本发明解决的技术问题是提供一种能克服复杂背景的干扰,迅速有效判别图像中文本颜色极性的方法及装置。
根据本发明的一个方面,提供一种判别图像中文本颜色极性的方法包括:对原始图像T进行预处理,得到预处理后的文本图像TP
从预处理后的文本图像TP中提取字符笔画特征,获得笔画图;
对获得的笔画图进行二值化和噪声过滤处理,得到滤噪二值笔画图;
根据笔画图和滤噪二值笔画图计算原始图像T的笔画强度,根据笔画强度判别原始图像T中文本颜色的极性。
进一步地说,所述笔画图包括:正向笔画图和负向笔画图,所述从预处理后的文本图像中提取字符笔画特征,获得笔画图,包括:从预处理后的文本图像TP中提取笔画特征,获得原始图像的正向笔画图;
将预处理后的图像TP进行反色,得到其反色图像TP,并从中提取笔画特征,获得原始图像的负向笔画图SN
进一步地说,所述滤噪二值笔画图包括:滤噪正向二值笔画图和滤噪负向二值笔画图,所述对获得的笔画图进行二值化和噪声过滤处理,得到滤噪二值笔画图,包括:对笔画图进行二值化处理,获得包括正向二值笔画图和负向二值笔画图的二值笔画图;
根据笔画图,通过不断迭代筛选的方法对二值笔画图进行噪声过滤,得到滤噪二值笔画图。
进一步地说,所述根据笔画图,通过不断迭代筛选的方法对二值笔画图进行噪声过滤,得到滤噪二值笔画图,包括:
第一步,确定迭代公式
Figure BDA0000053354980000021
所述迭代公式包括:迭代变量i、第i步滤噪二值笔画图的筛选结果
Figure BDA0000053354980000022
中点p的像素值
Figure BDA0000053354980000023
第i-1步滤噪二值笔画图的筛选结果
Figure BDA0000053354980000024
中点p的像素值
Figure BDA0000053354980000025
笔画图s及其中点p的像素值S(p)、μi和δi,其中:
μi为第i步迭代过程中,所述笔画图S中与第i-1步滤噪二值笔画图
Figure BDA0000053354980000026
中像素值为255的点所对应区域的均值,其计算公式为:
μ i = 1 N Σ B i - 1 * ( p ) = 255 S ( p ) ;
δi为第i步迭代过程中,所述笔画图S中与第i-1步滤噪二值笔画图
Figure BDA0000053354980000032
中像素值为255的点所对应区域的标准差,其计算公式为:
δ i = 1 N Σ B i - 1 * ( p ) = 255 ( S ( p ) - μ i ) 2 ;
所述,N为第i-1步滤噪二值笔画图
Figure BDA0000053354980000034
中像素值为255的点的个数;
第二步,初始化迭代变量;
第三步,计算并判断所述均值和标准差是否满足|μii-1|小于第一给定阈值T1,并且|δii-1|小于第二给定阈值T2的迭代终止条件,若满足,则迭代完成;否则,更新迭代变量,循环迭代;
第四步,得到滤噪二值笔画图。
进一步地说,所述笔画强度包括:正向笔画强度和负向笔画强度,所述根据笔画图和滤噪二值笔画图计算原始图像T的笔画强度,根据笔画强度判别原始图像T中文本颜色的极性,包括:
通过公式计算原始图像T的正向笔画强度,其中SP为原始图像T的正向笔画图,
Figure BDA0000053354980000036
为所述SP对应的滤噪正向二值笔画图;
通过公式
Figure BDA0000053354980000037
计算原始图像T的负向笔画强度,其中SN为原始图像T的负向笔画图,
Figure BDA0000053354980000038
为所述SN对应的滤噪负向二值笔画图;
如果正向笔画强度EP大于负向笔画强度EN,则判定原始文本图像T中字符为亮底暗字;否则,判定原始文本图像T中字符为暗底亮字。
进一步地说,所述对原始图像T进行预处理,得到预处理后的文本图像TP,包括:当原始图像T的原始宽度大于原始高度的二倍时,确定原始图像T中的文本为横向排列文本,将原始图像T的原始高度归一化为预定尺寸,将原始宽度按照原始高度和原始宽度的比值等比例缩放,得到预处理后的文本图像TP
当原始图像T的原始宽度不大于原始高度的二倍时,确定原始图像T中的文本为纵向排列文本,将原始图像T的原始宽度归一化为预定尺寸,将原始高度按原始高度和原始宽度的比值等比例缩放,得到预处理后的文本图像TP
根据本发明的另一个方面,提供一种判别图像中文本颜色极性的装置包括:预处理模块,用于对原始图像T进行预处理,得到预处理后的文本图像TP
提取模块,用于从预处理后的文本图像TP中提取字符笔画特征,获得笔画图;
笔画图处理模块,用于对获得的笔画图进行二值化和噪声过滤处理,得到滤噪二值笔画图;
颜色极性判断模块,用于根据笔画图和滤噪二值笔画图计算原始图像T的笔画强度,根据笔画强度判别原始图像T中文本颜色的极性。
进一步地说,所述笔画图处理模块进一步包括二值化单元,用于对笔画图进行二值化处理,获得包括正向二值笔画图和负向二值笔画图的二值笔画图;
噪声过滤单元,用于根据笔画图,通过不断迭代筛选的方法对二值笔画图进行噪声过滤,得到滤噪二值笔画图。
进一步地说,所述噪声过滤单元进一步包括:
公式确定子单元,用于确定迭代公式
所述迭代公式包括:迭代变量i、第i步滤噪二值笔画图的筛选结果
Figure BDA0000053354980000042
中点p的像素值
Figure BDA0000053354980000043
第i-1步滤噪二值笔画图的筛选结果
Figure BDA0000053354980000044
中点p的像素值
Figure BDA0000053354980000045
笔画图S及其中点p的像素值S(p)、μi和δi,其中:
μi为第i步迭代过程中,所述笔画图S中与第i-1步滤噪二值笔画图
Figure BDA0000053354980000051
中像素值为255的点所对应区域的均值,其计算公式为:
μ i = 1 N Σ B i - 1 * ( p ) = 255 S ( p ) ;
δi为第i步迭代过程中,所述笔画图S中与第i-1步滤噪二值笔画图
Figure BDA0000053354980000053
中像素值为255的点所对应区域的标准差,其计算公式为:
δ i = 1 N Σ B i - 1 * ( p ) = 255 ( S ( p ) - μ i ) 2 ;
所述,N为第i-1步滤噪二值笔画图
Figure BDA0000053354980000055
中像素值为255的点的个数;
初始化子单元,用于初始化迭代变量;
迭代判断子单元,用于计算并判断所述均值和标准差是否满足|μii-1|小于第一给定阈值T1,并且|δii-1|小于第二给定阈值T2的迭代终止条件,若满足,则迭代完成;否则,更新迭代变量,循环迭代;
生成子单元,用于得到滤噪二值笔画图。
进一步地说,所述颜色极性判断模块进一步包括:
笔画强度计算单元,用于通过公式
Figure BDA0000053354980000056
计算原始图像T的正向笔画强度,其中SP为原始图像T的正向笔画图,为所述SP对应的滤噪正向二值笔画图;通过公式
Figure BDA0000053354980000058
计算原始图像T的负向笔画强度,其中SN为原始图像T的负向笔画图,
Figure BDA0000053354980000059
为所述SN对应的滤噪负向二值笔画图;
颜色极性判断单元,用于当正向笔画强度Ep大于负向笔画强度EN,则判定原始文本图像T中字符为亮底暗字;否则,判定原始文本图像T中字符为暗底亮字。
本发明利用文本的笔画信息,可有效地消除复杂背景所带来的干扰,利用文本正向、负向笔画图中的笔画强度来度量图像中文本的颜色极性,可以有效地判断出图像的文本颜色的极性,且计算简单方便。
附图说明
图1是本发明实施例提供的一种图像中文本颜色极性的判别方法的流程示意图;
图2是图1所示方法中对原始图像T的尺寸进行预处理,得到预处理后的文本图像TP的流程示意图;
图3是图1所示方法中对预处理后的文本图像TP进行笔画提取,得到正向笔画图SP和负向笔画图SN的流程示意图;
图4是图1所示方法中对笔画图进行二值化处理、噪声过滤处理后得到滤噪二值笔画图的流程示意图;
图5是本发明实施例提供的对预处理后的文本图像进行笔画提取后得到正向笔画图的示意图;
图6是本发明实施例提供的对预处理后的文本图像进行笔画提取后得到负向笔画图的示意图;
图7是本发明实施例提供的对图5所示正笔画图进行二值化处理后得到的正向二值笔画图的示意图;
图8是本发明实施例提供的对图6所示负笔画图进行二值化处理后得到的负向二值笔画图的示意图;
图9是本发明实施例提供的对图7所示的正向二值笔画图进行噪声过滤处理后得到的噪声滤出后的滤噪正向二值笔画图的示意图;
图10是本发明实施例提供的对图8所示的负向笔画二值图进行噪声过滤处理后得到的噪声滤出后的滤噪负向二值笔画图的示意图;
图11是本发明实施例提供的一种判别图像中文本颜色极性的装置的结构框图;
图12是图11所示装置中笔画图处理模块的结构框图;
图13是图12所示笔画图处理模块中噪声过滤单元的结构框图;
图14是图11所示装置中颜色极性判断模块的结构框图。
具体实施方式
参见图1,本发明实施例提供了一种判别图像中文本颜色极性的方法包括:
步骤10、对原始图像T进行预处理,得到预处理后的文本图像TP
本步骤所述的原始图像是指包含文本信息的灰度文本图像T,对原始图像进行预处理主要是对其尺寸进行归一化。进行归一化的目的是将输入的原始图像T归一化到一个标准的尺寸,得到文本图像TP,以便于处理和比较。
由于文本的排列方式可以为横向和纵向,需要对这两种情况分别予以处理,设原始图像T的原始高度为H,原始宽度为W。如图2所示,本发明实施例提供的对原始图像T的尺寸进行归一化,得到预处理后的文本图像Tp包括:
步骤101、当原始图像T的原始宽度W大于原始高度H的二倍时,即W>2H,确定原始图像T中的文本为横向排列文本,将原始图像T的原始高度H归一化为预定尺寸,将原始宽度W按照原始高度和原始宽度的比值(H/W)等比例缩放,得到预处理后的文本图像TP
步骤102、当原始图像T的原始宽度W不大于原始高度H的二倍时,即W≤2H,确定原始图像T中的文本为纵向排列文本,将原始图像T的原始宽度W归一化为预定尺寸,将原始高度H按原始高度和原始宽度的比值(H/W)等比例缩放,得到预处理后的文本图像TP
具体将原始图像T的原始高度或原始宽度归一化为多大尺寸取决于使用本发明的方法的系统采集的原始图像的分辨率,本例中预定尺寸为64个像素点。但本发明的方法预定的归一化尺寸不局限于此。
步骤20、从预处理后的文本图像TP中提取字符笔画特征,获得笔画图。
文字一般是由不同方向的笔画规则排列组成,文本的笔画一般包括如下特性:
(1)为了方便阅读,字符笔画颜色与背景颜色通常存在较大的色差;
(2)字符笔画可以视为小于某一宽度上限的双边结构;
(3)字符的笔画以0,π/4,π/2,3π/4四个方向为主。
基于字符笔画的上述特性,可采用笔画提取算子(参见参考文献【3】)对文本图像TP进行笔画特征提取,具体计算公式如下:
DE d * ( p ) = ma x i - 1 W - 1 { min { f d ( p - i ) , f d ( p + W - i ) } } - f ( p ) - - - ( 1 )
DE d ( p ) = DE d * ( p ) , if DE d * ( p ) > 0 0 , otherwise - - - ( 2 )
其中,d=0,1,2,3,分别代表笔画的0,π/4,π/2,3π/4四个方向,W为笔画宽度上限;fd(p+i)表示文本图像TP在d方向上与点p距离为i的点的像素灰度值。
提取上述四个方向笔画特征的最大值,生成笔画特征图,即笔画图,可以采用以下计算公式表示:
S p ( p ) = max d = 0 3 { DE d ( p ) } - - - ( 3 )
其中,S(p)为笔画图中点p的笔画特征值。
本发明的方法需要获得原始图像的正向笔画图Sp和负向笔画图SN。根据上述公式(1)、(2)和(3),分别得到原始图像的正向笔画图Sp和负向笔画图SN,所述负向笔画图是将经过预处理后的文本图像经反色处理后,从中提取的笔画图。如图3所示,本发明实施例提供的从预处理后的文本图像TP中提取笔画特征,获得笔画图包括:
步骤201、从预处理后的文本图像TP中提取笔画特征,获得原始图像的正向笔画图SP,计算公式为:
DE d * ( p ) = ma x i - 1 W - 1 { min { f d ( p - i ) , f d ( p + W - i ) } } - f ( p )
DE d ( p ) = DE d * ( p ) , if DE d * ( p ) > 0 0 , otherwise
S p ( p ) = max d = 0 3 { DE d ( p ) }
其中,p表示文本图像TP上的点,Sp(p)为文本图像TP上的点p的笔画特征值,得到的正向笔画图SP如图5所示。
步骤202、将预处理后的图像TP进行反色,得到其反色图像TP ,并从中提取笔画特征,获得原始图像的负向笔画图SN
通过公式Tp (p)=255-Tp(p)可以得到经预处理后的图像TP的反色图像TP ,利用公式(1)、(2)和(3),提取反色图像TP 的笔画特征,得到原始图像的负向笔画图SN。具体计算公式为:
DE d * ( p ) = ma x i - 1 W - 1 { min { f d ( p - i ) , f d ( p + W - i ) } } - f ( p )
DE d ( p ) = DE d * ( p ) , if DE d * ( p ) > 0 0 , otherwise
S p ( p ) = max d = 0 3 { DE d ( p ) }
其中,p表示文本图像TP 上的点,SN(p)为文本图像TP 上的点p的笔画特征值,得到的负向笔画图SN如图6所示。
步骤30、对获得的笔画图进行二值化和噪声过滤处理,得到滤噪二值笔画图。
上一步获得的笔画图包括:正向笔画图SP和负向笔画图SN
如图4所示,本发明实施例提供的分别对所述正向笔画图SP和负向笔画图SN进行二值化和噪声过滤处理,得到滤噪正向二值笔画图和滤噪负向二值笔画图
Figure BDA00000533549800000911
具体包括:
步骤301、对笔画图进行二值化处理,获得二值笔画图。
所谓二值化(Binarization)是指,一幅图像包括目标物体、背景还有噪声,要想从多值的数字图像中直接提取出目标物体,最常用的方法就是设定一个阈值t,用t将图像的数据分成两部分:大于t的像素群和小于t的像素群。这是研究灰度变换的最特殊的方法。在本发明中,本领域技术人员采用任一种二值化处理的方法都可行的,例如,采用大津法(参见参考文献【4】)求得最佳阈值,获得二值笔画图;或者,采用灰度直方图法或改进的灰度直方图等,本发明对此不需要进行限定。
本实施例中采用大津法分别对正向笔画图SP和负向笔画图SN进行二值化处理,分别得到正向二值笔画图BP和负向二值笔画图BN。获得二值笔画图具体公式如下:
B ( p ) = 255 , ifS ( p ) ≥ t 0 otherwise
其中,t为自适应选择的最优分割阈值,计算公式为:
t=max{i|ω1(i)×ω2(i)×(μ1(i)-μ2(i))2,0≤i≤255}
式中ω1(i)为原始图像T中像素值小于i的点的个数,所述ω2(i)分别为原始图像T中像素值大于i的点的个数,所述μ1(i)为原始图像T中像素值小于i的点的均值,所述μ2(i)为原始图像T中像素值大于i的点的均值。
按照上述方法,可以分别获得正向二值笔画图Bp和负向二值笔画图BN
步骤302、根据笔画图,通过不断迭代筛选的方法对二值笔画图进行噪声过滤,得到滤噪二值笔画图。
正向二值笔画图SP和负向二值笔画图SN中像素值为255的点对应的区域应为文本区域,但由于一些具有类似笔画特性的非文本噪声干扰,正向二值笔画图Sp和负向二值笔画图SN中还包含有一些噪声,因此还需要进行噪声过滤。噪声过滤的基本原理是利用文本图像中字符区域具有相似颜色的这一特性,通过不断的迭代筛选,滤除其中颜色差异较大的点(即噪声点),保留颜色差异较小的点。
对二值笔画图进行噪声过滤,得到滤噪二值笔画图,包括:
第一步,确定迭代公式。
令i为迭代变量,
Figure BDA0000053354980000102
为对二值笔画图B进行第i步噪声过滤的结果,
Figure BDA0000053354980000103
是第i步滤噪二值笔画图的筛选结果
Figure BDA0000053354980000104
中点p的像素值,
Figure BDA0000053354980000105
是第i-1步滤噪二值笔画图的筛选结果中点p的像素值,S(p)是二值笔画图B中点p的像素值,
Figure BDA0000053354980000107
的计算公式为:
Figure BDA0000053354980000108
其中,μi为第i步迭代过程中,笔画图S中与第i-1步滤噪二值笔画图
Figure BDA0000053354980000109
中像素值为255的点所对应区域的均值;δi为第i步迭代过程中,笔画图S中与第i-1步滤噪二值笔画图
Figure BDA0000053354980000111
中像素值为255的点所对应区域的标准差,其计算公式分别为:
μ i = 1 N Σ B i - 1 * ( p ) = 255 S ( p ) - - - ( 5 )
δ i = 1 N Σ B i - 1 * ( p ) = 255 ( S ( p ) - μ i ) 2 - - - ( 6 )
式中,S(p)和
Figure BDA0000053354980000114
分别为笔画图S和其对应的第i-1步滤噪二值笔画图
Figure BDA0000053354980000115
中点p的像素值,N为第i-1步滤噪二值笔画图
Figure BDA0000053354980000116
中像素值为255的点的个数。
第二步,初始化迭代变量。
迭代变量i初始化为1,设置初始比对模板
Figure BDA0000053354980000117
均值μ0=0,方差δ0=0。
第三步,计算并判断所述均值和标准差是否满足终止迭代条件,若满足,则迭代筛选完成;否则,更新迭代变量,循环迭代。
根据公式(4)、(5)和(6)计算μi、δi和Bi *。若为第一步迭代,则i=1。判断第i步迭代过程和上一步中笔画图S中与第i-1步滤噪二值笔画图
Figure BDA0000053354980000119
中像素值为255的点所对应区域的均值和标准差,若满足|μii-1|小于第一给定阈值T1,并且满足|δii-1|小于第二给定阈值T2的条件,说明当前点颜色差异很小,则循环迭代终止,转至第三步;否则,更新迭代变量i=i+1,循环执行第三步,利用公式(4)~(6)更新计算μi+1、δi+1和Bi+1 *,继续迭代。所述第一给定阈值T1的均值的迭代终止条件,所述第二给定阈值T2是标准差的迭代终止条件,本例中给定T1为0.001,T2为0.01,若噪声过滤的精确度要求不高,可以适当放宽第一给定阈值和第二给定阈值。
第四步,得到滤噪二值笔画图。
以上公式(4)~(6)对正向二值笔画图和负向二值笔画图通用,针对正向二值笔画图BP,式中的S为SP,Bi *=Bp *,进行噪声过滤后得到滤噪正向二值图
Figure BDA0000053354980000122
针对负向二值笔画图BN,式中的S为SN,Bi *=BN *,进行噪声过滤后得到滤噪负向二值笔画图
Figure BDA0000053354980000124
经过噪声过滤处理,可将图7所示的正向二值笔画图处理成如图9所示的滤噪正向二值笔画图,可将图8所示的负向二值笔画图处理成如图10所示的滤噪负向二值笔画图。
步骤40、根据笔画图和滤噪二值笔画图计算原始图像的笔画强度,根据笔画强度判别原始图像中文本颜色的极性。
上一步骤获得的滤噪二值笔画图包括滤噪正向二值笔画图和滤噪负向二值笔画图
Figure BDA0000053354980000126
滤噪正向二值笔画图
Figure BDA0000053354980000127
的笔画强度即为原始图像T的正向笔画强度,滤噪负向二值笔画图
Figure BDA0000053354980000128
的笔画强度即为原始图像T的负向笔画强度。
根据原始图像T的正向笔画图SP及所述SP对应的滤噪正向二值笔画图
Figure BDA0000053354980000129
通过下述公式(7)计算原始图像T的正向笔画强度,得到:
E P = Σ B P * ( p ) = 255 S P ( p ) - - - ( 7 )
根据原始图像T的负向笔画图SN及所述SN对应的滤噪负向二值笔画图
Figure BDA00000533549800001211
通过下述公式(8)计算原始图像T的负向笔画强度,得到:
E N = Σ B N * ( p ) = 255 S N ( p ) - - - ( 8 )
根据笔画强度判别原始图像中文本颜色的极性,包括:如果正向笔画强度Ep大于负向笔画强度EN,则判定原始图像T中字符为亮底暗字;否则,判定原始文本图像T中字符为暗底亮字。
本发明提供的方法利用文本的笔画信息,可有效地消除复杂背景所带来的干扰,利用文本正向、负向笔画图中的笔画强度来度量图像中文本的颜色极性,可以有效地判断出图像的文本颜色的极性,且计算简单方便。
如图11所示,本发明实施例还提供一种判别图像中文本颜色极性的装置,包括预处理模块1、提取模块2、笔画图处理模块3及颜色极性判断模块4。其中:
预处理模块1用于对原始图像T进行预处理,得到预处理后的文本图像TP,具体如何进行预处理,参见图2及其说明,不再赘述;
提取模块2用于从预处理后的文本图像TP中提取字符笔画特征,获得笔画图,具体如何获得笔画图,参见图3及其说明;
笔画图处理模块3用于对获得的笔画图进行二值化和噪声过滤处理,得到滤噪二值笔画图;
颜色极性判断模块4用于根据笔画图和滤噪二值笔画图计算原始图像T的笔画强度,根据笔画强度判别原始图像T中文本颜色的极性。
如图12所示,笔画图处理模块3进一步包括:二值化单元31和噪声过滤单元32。二值化单元31用于对笔画图进行二值化处理,获得包括正向二值笔画图和负向二值笔画图的二值笔画图。具体如何获得包括正向二值笔画图和负向二值笔画图的二值笔画图参见步骤301。噪声过滤单元32用于根据笔画图,通过不断迭代筛选的方法对二值笔画图进行噪声过滤,得到滤噪二值笔画图。如图13所示,噪声过滤单元32进一步包括公式确定子单元321、初始化子单元322、迭代判断子单元323及生成子单元324。其中,
公式确定子单元321,用于确定迭代公式
所述迭代公式包括:迭代变量i、第i步滤噪二值笔画图的结果
Figure BDA0000053354980000132
笔画图S中点p的像素值S(p)和所述笔画图S对应的第i-1步滤噪二值笔画图
Figure BDA0000053354980000133
中点p的像素值μi和δi,其中:
μi为第i步迭代过程中,所述笔画图S中与滤噪二值笔画图中像素值为255的点所对应区域的均值,其计算公式为:
μ i = 1 N Σ B i - 1 * ( p ) = 255 S ( p ) ;
δi为第i步迭代过程中,所述笔画图S中与滤噪二值笔画图
Figure BDA0000053354980000137
中像素值为255的点所对应区域的标准差,其计算公式为:
δ i = 1 N Σ B i - 1 * ( p ) = 255 ( S ( p ) - μ i ) 2 ;
所述,N为第i-1步滤噪二值笔画图中像素值为255的点的个数;
初始化子单元322,用于初始化迭代变量;
迭代判断子单元323,用于计算并判断所述均值和标准差是否满足|μii-1|小于第一给定阈值T1,并且|δii-1|小于第二给定阈值T2的迭代终止条件,若满足,则迭代完成;否则,更新迭代变量,循环迭代;
生成子单元324,用于得到滤噪二值笔画图。
如图14所示,颜色极性判断模块4进一步包括笔画强度计算单元41和颜色极性判断单元42。其中,笔画强度计算单元41用于通过公式
Figure BDA0000053354980000143
计算原始图像T的正向笔画强度,其中SP为原始图像T的正向笔画图,
Figure BDA0000053354980000144
为所述SP对应的滤噪正向二值笔画图;通过公式
Figure BDA0000053354980000145
计算原始图像T的负向笔画强度,其中SN为原始图像T的负向笔画图,为所述SN对应的滤噪负向二值笔画图。颜色极性判断单元42用于当正向笔画强度Ep大于负向笔画强度EN时,判定原始图像T中字符为亮底暗字;否则,判定原始图像T中字符为暗底亮字。
本发明提供的装置利用文本的笔画信息,可有效地消除复杂背景所带来的干扰,利用文本正向、负向笔画图中的笔画强度来度量图像中文本的颜色极性,可以有效地判断出图像的文本颜色的极性,且计算简单方便。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。
参考文献列表
【1】Jiqiang Song,Min Cai,Micheal R.Lyu.A Robust StatisticMethod for Classifying Color Polarity of Video Text.ICME,vol.2,pp.385-388,2003
【2】Jie Xi,Xiansheng Hua,Xiangrong Chen,Wenyin Liu,Hongjiang Zhang.A Video Text Detection and Recognition System.ICME,vol.1,pp.873-876,2001
【3】X.Ye,M.Cheriet,C Y.Suen.Stroke-model-based characterextraction from gray-level document images.IEEE Transaction ImageProcessing,vol.10,pp.1152-1161,2001
【4】OTSU N.A threshold selection method from gray-levelhistograms[M].IEEE Transactions on Systems,Man and Cybernetics,vol.9,NO.1,pp.62-66,1979

Claims (8)

1.一种判别图像中文本颜色极性的方法,其特征在于,包括:
对原始图像进行预处理,得到预处理后的文本图像;
采用笔画提取算子从预处理后的文本图像中提取字符笔画特征,获得笔画图,所述笔画图包括正向笔画图和负向笔画图;
对获得的笔画图进行二值化和噪声过滤处理,得到滤噪二值笔画图,所述滤噪二值笔画图包括滤噪正向二值笔画图和滤噪负向二值笔画图;
根据笔画图和滤噪二值笔画图计算原始图像的笔画强度,根据笔画强度判别原始图像中文本颜色的极性;具体包括:
通过公式
Figure FDA00002154160200011
计算原始图像的正向笔画强度,其中SP为原始图像的正向笔画图,
Figure FDA00002154160200012
为所述SP对应的滤噪正向二值笔画图;
通过公式计算原始图像的负向笔画强度,其中SN为原始图像的负向笔画图,
Figure FDA00002154160200014
为所述SN对应的滤噪负向二值笔画图;
如果正向笔画强度EP大于负向笔画强度EN,则判定原始图像中字符为亮底暗字;否则,判定原始图像中字符为暗底亮字。
2.根据权利要求1所述的方法,其特征在于,所述采用笔画提取算子从预处理后的文本图像中提取字符笔画特征,获得笔画图,包括:
从预处理后的文本图像中提取笔画特征,获得原始图像的正向笔画图;
将预处理后的图像进行反色,得到其反色图像,并从中提取笔画特征,获得原始图像的负向笔画图。
3.根据权利要求1所述的方法,其特征在于,所述对获得的笔画图进行二值化和噪声过滤处理,得到滤噪二值笔画图,包括:
对笔画图进行二值化处理,获得包括正向二值笔画图和负向二值笔画图的二值笔画图;
根据笔画图,通过不断迭代筛选的方法对二值笔画图进行噪声过滤,得到滤噪二值笔画图。
4.根据权利要求3所述的方法,其特征在于,所述根据笔画图,通过不断迭代筛选的方法对二值笔画图进行噪声过滤,得到滤噪二值笔画图,包括:
第一步,确定迭代公式
B i * ( p ) = 255 , if B i - 1 * ( p ) = 255 & | S ( p ) - &mu; i - 1 | < &delta; i - 1 0 , otherwise ;
所述迭代公式包括:迭代变量i、第i步滤噪二值笔画图的筛选结果
Figure FDA00002154160200022
中点p的像素值
Figure FDA00002154160200023
第i-1步滤噪二值笔画图的筛选结果
Figure FDA00002154160200024
中点p的像素值笔画图S及其中点p的像素值S(p)、μi和δi,其中:
μi为第i步迭代过程中,所述笔画图S中与第i-1步滤噪二值笔画图
Figure FDA00002154160200026
中像素值为255的点所对应区域的均值,其计算公式为: &mu; i = 1 N &Sigma; B i-1 * ( p ) = 255 S ( p ) ;
δi为第i步迭代过程中,所述笔画图S中与第i-1步滤噪二值笔画图
Figure FDA00002154160200028
中像素值为255的点所对应区域的标准差,其计算公式为: &delta; i = 1 N &Sigma; B i - 1 * ( p ) = 255 ( S ( p ) - &mu; i ) 2 ;
所述,N为第i-1步滤噪二值笔画图
Figure FDA000021541602000210
中像素值为255的点的个数;
第二步,初始化迭代变量;
第三步,计算并判断所述均值和标准差是否满足|μii-1|小于第一给定阈值,并且|δii-1|小于第二给定阈值的迭代终止条件,若满足,则迭代完成;否则,更新迭代变量,循环迭代;
第四步,得到滤噪二值笔画图。
5.根据权利要求1所述的方法,其特征在于,所述对原始图像进行预处理,得到预处理后的文本图像,包括:
当原始图像的原始宽度大于原始高度的二倍时,确定原始图像中的文本为横向排列文本,将原始图像的原始高度归一化为预定尺寸,将原始宽度按照原始高度和原始宽度的比值等比例缩放,得到预处理后的文本图像;
当原始图像的原始宽度不大于原始高度的二倍时,确定原始图像中的文本为纵向排列文本,将原始图像的原始宽度归一化为预定尺寸,将原始高度按原始高度和原始宽度的比值等比例缩放,得到预处理后的文本图像。
6.一种判别图像中文本颜色极性的装置,其特征在于,包括:
预处理模块,用于对原始图像进行预处理,得到预处理后的文本图像;
提取模块,用于采用笔画提取算子从预处理后的文本图像中提取字符笔画特征,获得笔画图,所述笔画图包括正向笔画图和负向笔画图;
笔画图处理模块,用于对获得的笔画图进行二值化和噪声过滤处理,得到滤噪二值笔画图,所述滤噪二值笔画图包括滤噪正向二值笔画图和滤噪负向二值笔画图;
颜色极性判断模块,用于根据笔画图和滤噪二值笔画图计算原始图像的笔画强度,根据笔画强度判别原始图像中文本颜色的极性;所述颜色极性判断模块进一步包括:
笔画强度计算单元,用于通过公式
Figure FDA00002154160200031
计算原始图像的正向笔画强度,其中SP为原始图像的正向笔画图,为所述SP对应的滤噪正向二值笔画图;通过公式
Figure FDA00002154160200033
计算原始图像的负向笔画强度,其中SN为原始图像的负向笔画图,
Figure FDA00002154160200034
为所述SN对应的滤噪负向二值笔画图;
颜色极性判断单元,用于当正向笔画强度EP大于负向笔画强度EN,则判定原始图像中字符为亮底暗字;否则,判定原始图像中字符为暗底亮字。
7.根据权利要求6所述的装置,其特征在于,所述笔画图处理模块进一步包括:
二值化单元,用于对笔画图进行二值化处理,获得包括正向二值笔画图和负向二值笔画图的二值笔画图;
噪声过滤单元,用于根据笔画图,通过不断迭代筛选的方法对二值笔画图进行噪声过滤,得到滤噪二值笔画图。
8.根据权利要求7所述的装置,其特征在于,所述噪声过滤单元进一步包括:
公式确定子单元,用于确定迭代公式
B i * ( p ) = 255 , if B i - 1 * ( p ) = 255 & | S ( p ) - &mu; i - 1 | < &delta; i - 1 0 , otherwise ;
所述迭代公式包括:迭代变量i、第i步滤噪二值笔画图的筛选结果
Figure FDA00002154160200042
中点p的像素值
Figure FDA00002154160200043
第i-1步滤噪二值笔画图的筛选结果
Figure FDA00002154160200044
中点p的像素值
Figure FDA00002154160200045
笔画图S及其中点p的像素值S(p)、μi和δi,其中:
μi为第i步迭代过程中,所述笔画图S中与第i-1步滤噪二值笔画图
Figure FDA00002154160200046
中像素值为255的点所对应区域的均值,其计算公式为: &mu; i = 1 N &Sigma; B i-1 * ( p ) = 255 S ( p ) ;
δi为第i步迭代过程中,所述笔画图S中与第i-1步滤噪二值笔画图
Figure FDA00002154160200048
中像素值为255的点所对应区域的标准差,其计算公式为: &delta; i = 1 N &Sigma; B i - 1 * ( p ) = 255 ( S ( p ) - &mu; i ) 2 ;
所述,N为第i-1步滤噪二值笔画图
Figure FDA000021541602000410
中像素值为255的点的个数;
初始化子单元,用于初始化迭代变量;
迭代判断子单元,用于计算并判断所述均值和标准差是否满足|μii-1|小于第一给定阈值,并且|δii-1|小于第二给定阈值的迭代终止条件,若满足,则迭代完成;否则,更新迭代变量,循环迭代;
生成子单元,用于得到滤噪二值笔画图。
CN 201110080923 2011-03-31 2011-03-31 判别图像中文本颜色极性的方法及装置 Expired - Fee Related CN102122347B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 201110080923 CN102122347B (zh) 2011-03-31 2011-03-31 判别图像中文本颜色极性的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 201110080923 CN102122347B (zh) 2011-03-31 2011-03-31 判别图像中文本颜色极性的方法及装置

Publications (2)

Publication Number Publication Date
CN102122347A CN102122347A (zh) 2011-07-13
CN102122347B true CN102122347B (zh) 2013-01-09

Family

ID=44250901

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 201110080923 Expired - Fee Related CN102122347B (zh) 2011-03-31 2011-03-31 判别图像中文本颜色极性的方法及装置

Country Status (1)

Country Link
CN (1) CN102122347B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102915438B (zh) * 2012-08-21 2016-11-23 北京捷成世纪科技股份有限公司 一种视频字幕的提取方法及装置
KR102208893B1 (ko) * 2013-12-30 2021-01-28 삼성전자주식회사 디스플레이 장치 및 디스플레이 장치의 채널 맵 관리 방법
CN108805126B (zh) * 2017-04-28 2021-09-10 上海斯睿德信息技术有限公司 一种文本图像的长干扰线去除方法
CN107423055A (zh) * 2017-06-30 2017-12-01 百度在线网络技术(北京)有限公司 适配终端设备分辨率的方法、装置、设备及存储介质

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1315090C (zh) * 2005-02-08 2007-05-09 华南理工大学 一种手写文字的识别方法
KR20060096208A (ko) * 2005-03-03 2006-09-11 엘지전자 주식회사 문자인식 시스템의 필기체 표시방법
CN101593276B (zh) * 2008-05-29 2011-10-12 汉王科技股份有限公司 一种视频ocr图文分离方法及系统

Also Published As

Publication number Publication date
CN102122347A (zh) 2011-07-13

Similar Documents

Publication Publication Date Title
CN107545239B (zh) 一种基于车牌识别与车辆特征匹配的套牌检测方法
Yousif et al. Toward an optimized neutrosophic K-means with genetic algorithm for automatic vehicle license plate recognition (ONKM-AVLPR)
CN101122953B (zh) 一种图片文字分割的方法
CN110378310B (zh) 一种基于答案库的手写样本集的自动生成方法
CN101593276B (zh) 一种视频ocr图文分离方法及系统
CN107103317A (zh) 基于图像融合和盲反卷积的模糊车牌图像识别算法
Paunwala et al. A novel multiple license plate extraction technique for complex background in Indian traffic conditions
CN104361336A (zh) 一种水下视频图像的文字识别方法
CN107563380A (zh) 一种基于mser和swt相结合的车辆车牌检测识别方法
CN105760842A (zh) 一种基于边缘和纹理特征结合的台标识别方法
CN110555382A (zh) 一种基于深度学习和Wasserstein距离度量的指静脉识别方法
CN111382704A (zh) 基于深度学习的车辆压线违章判断方法、装置及存储介质
CN103903018A (zh) 一种复杂场景中对车牌进行定位的方法和系统
CN105447503A (zh) 基于稀疏表示lbp和hog融合的行人检测方法
CN103310211A (zh) 一种基于图像处理的填注标记识别方法
CN102122347B (zh) 判别图像中文本颜色极性的方法及装置
CN110659649A (zh) 一种基于近红外光成像的图像处理与字符识别算法
CN113688838B (zh) 红色笔迹提取方法、系统、可读存储介质及计算机设备
CN111739058B (zh) 一种基于高斯滤波的分水岭算法的自由液面识别和提取的方法
CN109460722A (zh) 一种车牌智能识别方法
CN105787475A (zh) 一种复杂环境下的交通标志检测与识别方法
CN100561504C (zh) 文档的自适应二值化方法和设备
CN103886319A (zh) 一种基于机器视觉的举牌智能识别方法
CN105512662A (zh) 一种无牌车辆检测方法及装置
Chang Intelligent text detection and extraction from natural scene images

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20181207

Address after: Room 356, Room 3, Building 5, 8 Wangxi Road, Haidian District, Beijing, 100193

Patentee after: BEIJING HANWANG ZHIYUAN TECHNOLOGY CO.,LTD.

Address before: 100193 three, 5 Building 8, northeast Wang Xi Road, Haidian District, Beijing.

Patentee before: HANWANG TECHNOLOGY Co.,Ltd.

TR01 Transfer of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20130109

CF01 Termination of patent right due to non-payment of annual fee