CN101615252A - 一种自适应图像文本信息提取方法 - Google Patents
一种自适应图像文本信息提取方法 Download PDFInfo
- Publication number
- CN101615252A CN101615252A CN200810115615A CN200810115615A CN101615252A CN 101615252 A CN101615252 A CN 101615252A CN 200810115615 A CN200810115615 A CN 200810115615A CN 200810115615 A CN200810115615 A CN 200810115615A CN 101615252 A CN101615252 A CN 101615252A
- Authority
- CN
- China
- Prior art keywords
- image
- text
- complexity
- edge
- background
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 94
- 230000003044 adaptive effect Effects 0.000 title claims abstract description 10
- 239000000284 extract Substances 0.000 claims abstract description 40
- 238000001514 detection method Methods 0.000 claims abstract description 12
- 238000004458 analytical method Methods 0.000 claims abstract description 7
- 238000004364 calculation method Methods 0.000 claims abstract description 5
- 238000003708 edge detection Methods 0.000 claims description 14
- 230000002596 correlated effect Effects 0.000 claims description 6
- 230000000877 morphologic effect Effects 0.000 claims description 6
- 238000007688 edging Methods 0.000 claims description 3
- 238000013179 statistical model Methods 0.000 claims description 3
- 238000000605 extraction Methods 0.000 abstract description 11
- 238000010586 diagram Methods 0.000 description 6
- 230000000875 corresponding effect Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 239000004744 fabric Substances 0.000 description 3
- 238000005260 corrosion Methods 0.000 description 2
- 230000007797 corrosion Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000010339 dilation Effects 0.000 description 1
- 230000003628 erosive effect Effects 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000012797 qualification Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Abstract
本发明一种自适应图像文本信息提取方法,涉及图像中的文本信息提取技术,其包括步骤:1)图像预处理;2)图像背景复杂度分析;3)文本初检测;4)文本验证;5)文本抽取;6)文本信息输出或显示。本发明方法,通过计算图像背景复杂度,对不同复杂度背景的图像采用不同的文本检测方法,减少了采用单一文本检测方法中的漏检,误检现象,提高了文本提取系统的整体性能。本发明方法中图像背景复杂度的计算方法简单,有效,不仅能够检测出不同背景复杂度的图像中的文字信息,而且检测出的文本信息不受字体,大小及语言的影响,具有很强的通用性。
Description
技术领域
本发明涉及模式识别与机器视觉领域中的文本信息提取技术领域,具体地是一种自适应图像文本信息提取方法。
背景技术
随着数码相机、摄像头、超高速扫描仪等图像获取设备的广泛应用,图像中信息越来越引起人们的关注,然而计算机理解图像的内容,目前还很困难。图像中嵌入的文字能够提供一些人们所要的重要信息,如书的封面、视频、自然风景图片www网页的彩图等等,它对理解图像中的内容有着重要的帮助。让计算机像人类一样识别图像中的文字,即文字的自动检测系统,近年来越来越引起了人们的关注,它对于图像的存储、分类和检索等来说具有极其重要的意义,有着广泛的应用前景和商业价值。在许多情况下,图像中的场景文字甚至成为图像最主要、最关键的信息,例如对于车牌的识别,对于路牌的识别和翻译等。这些场景文字被抽取后,送入OCR模块,转换成计算机可理解的内码,可以方便的进行后续的各种处理。
国内外的研究人员是在近几年内才开始对图像中的文本信息提取技术进行研究的,由于文本信息提取受到语种、文字分辨率、文字间距、分布情况、文字的背景、光照、颜色之类因素的影响,并且某些图案、纹理的背景很难与文字区分开来,因此图像中的文本信息提取技术目前还没有一个很好的解决办法。
目前对这个问题提出一些解决的方法,大致可以分为四类:基于边缘的方法,基于纹理的方法,基于颜色的方法和基于连通区域的方法。基于边缘的方法主要是利用图像中文字和背景通常存在较大的颜色差,因而在文字和背景存在明显的边缘。基于边缘的方法就是通过寻找排列规则的边缘,从而寻找文字区域;基于纹理的方法是把文字当成一种特殊的纹理,根据文字纹理具有的某种特定频率和方向信息来确定图像中可能的文字区域;基于颜色的文本信息提取方法利用了大多数图像文字具有均匀颜色这一事实,通过颜色约减的方法可以将原图分解成属于若干个不同颜色的子图,然后在各个子图上独立进行文字提取工作;基于连通区域的方法主要是在图像上通过寻找一致性区域来寻找文字区域,基于连通域的方法利用了文字的排列特性,即绝大多数情况下文字是成组出现的,例如多个字母组成一个单词,或者多个汉字组成一个句子。属于同一组的文字会具有比较统一的几何尺寸和排列规则。
上述现有的研究方法,基于边缘的文本提取方法计算简单,但由于采用单一的边缘检测方法,当文字和背景对比度相差不大的情况下检测效果并不理想;而且,倘若背景轮廓和字符粘连,也容易得到错误结果。这就需要结合其它的信息来扩大检测范围;基于纹理的文本提取方法需要抽取有效的纹理特征,虽然可有效地检测出文字所在区域,但是也会提取出具有类似纹理的背景区域,需要结合其它特征;基于颜色聚类方法的主要难点在于无法预知文字和背景的颜色,因而也就难以确定颜色子图的个数,聚类数过多或者过少都会影响提取性能,而且计算量很大;基于连通区域的方法大多数情况下不能单独使用,一般用在边缘、纹理和颜色等方法之后。
上述各种方法进行文字信息提取时,都没有考虑到图像背景的复杂度和文字、背景的对比度情况,对不同背景复杂度的图像,都采用单一的提取方法,容易漏掉一些对比度弱的文本区域或者将似文本区域错误提取出来,造成整体提取效果不好。
发明内容
本发明的目的是提供一种自适应图像文本信息提取方法,根据图像背景复杂程度,采用不同的图像文本检测技术,快捷、准确、有效的检测出不同背景复杂度图像中的文字信息,而且检测出的文本信息不受字体,字体大小及语言的影响,具有很强的通用性。
为达到上述目的,本发明的技术解决方案如下:
一种自适应图像文本信息提取方法,其包括步骤:1)图像预处理;2)图像背景复杂度分析;3)文本初检测;4)文本验证;5)文本抽取;6)文本信息输出或显示;
其具体步骤为:
A)首先,从选定的路径中读取图像,并将彩色图像转换为灰色图像;
B)根据灰色图像所有象素点的灰度变化密度,计算出整幅图像的背景复杂度,计算方法为:某一象素点P0的灰度强度S′按照下式计算:
S′=MAX{|P1-P8|,|P2-P7|,|P3-P6|,|P4-P5|} (1)
则图像的背景复杂度为:
其中,S′为图像中像素点P0的灰度强度,S按照(2)式将S′归一化为(0,1)范围内的数,T为归一化的阈值,D为图像的背景复杂度值,n为图像中的像素数目,P1~P8为P0的八邻域;
按照计算的D值对图像背景复杂度进行分级;
C)根据图像复杂度级别决定采用何种文字边缘检测方法,对于复杂度较低的图像,采用较简单的边缘文本检测方法,对于复杂度较高的图像,采用较复杂的边缘文本检测方法;
D)根据采用的文本检测方法,找出图像中的候选文本区域,对文本信息区域进行初始定位;
E)对从图像中找到的候选文本区域,抽取相关特征进行文本区域验证,通过验证的候选文本区域,即判定为文本块,将在后续的步骤中抽取文本信息,未通过验证的候选文本区域,即判定为非文本区域,将其从候选文本中去除;
F)对确定的文本块,去除文本块中的背景,将所有文本信息抽取出来;
G)将图像中抽取出来的所有文本信息输出给下一级处理,或在计算机上显示出来。
所述的方法,其所述B)步中,对图像背景复杂度进行分级,是分为低、中、高三级:如果0≤D≤0.15,则图像背景复杂度为低级;如果0.15<D≤0.3,则图像背景复杂度为中级;如果0.3<D≤1则图像背景复杂度为高级。
所述的方法,其所述C)步中,对于复杂度较低的图像,采用较简单的边缘检测方法,对于复杂度较高的图像,采用较复杂的边缘检测方法,是:
如果图像背景复杂度判定为低,则采用边缘特征抽取方法1:在灰度图像上用Sobel四方向算子求取边缘并抽取特征;如果图像背景复杂度判定为中,则采用边缘特征抽取方法2:基于形态学的方法在灰度图象上求取形态边缘并抽取特征;如果图像背景复杂度判定为高,则采用边缘特征抽取方法3:用基于形态学的彩色边缘抽取方法,分别对三个颜色通道提取形态梯度,然后将三个颜色通道合并得到边缘并抽取特征。
所述的方法,其所述D)步中,找出图像中的候选文本区域,是:
a)提取图像的边缘并抽取特征后,在边缘图像上进行连通域分析,获得图像上所有的连通元;
b)利用边缘特征和几何特征对连通元进行筛选,剔除非文本连通元;
c)对每个文本连通元的位置和尺寸进行分析,将在同一行或同一列的文本连通元组合,形成候选文本区域。
所述的方法,其所述E)步中的相关特征,为文本区域中字符宽度的均值和方差,通过将文本行或文本列的二值图像向水平方向和竖直方向投影,投影曲线上有明显的波峰和波谷,通过统计相邻波谷之间的距离,计算字符的平均宽度和方差。
所述的方法,其所述F)步中,将所有文本信息抽取出来,是采用二值化的方法、颜色聚类的方法或统计模型的方法抽取所有文本信息。
所述的方法,其所述b)步中的边缘特征和几何特征,其中,边缘特征是边缘密度特征和边缘方向特征,几何特征是连通以元的长,宽,宽高比,占空比。
本发明,通过计算图像背景复杂度,对不同复杂度背景的图像采用不同的边缘检测方法,减少了采用单一边缘检测方法中的漏检,误检现象,提高了文本提取系统的整体性能。该发明中图像背景复杂度的计算方法简单,有效,不仅能够检测出不同背景复杂度图像中的文本信息,而且当图像中文本和背景对比度不同时,同样有效。检测出的文本信息不受图象字体,大小,及语言的影响,具有很强的通用性。
附图说明
图1是本发明一种自适应图像文本信息提取方法的示意图;
图2是本发明一种自适应图像文本信息提取方法的实施例流程图;
图3是本发明实例结果示意图。
具体实施方式
参照图1、图2和图3,为本发明的一种自适应图像文本信息提取方法,其包括步骤:1)图像预处理;2)图像背景复杂度分析;3)文本初检测;4)文本验证;5)文本抽取;6)文本信息输出或显示;
其具体步骤为:
A)首先,从选定的路径中读取图像,并将彩色图像转换为灰色图像;
B)根据灰色图像所有象素点的灰度变化密度,计算出整幅图像的背景复杂度,对图像背景复杂度进行分级。图像背景复杂度计算方法如下:
某一像素点P0的灰度强度S′按照下式计算:
S′=MAX{|P1-P8|,|P2-P7|,|P3-P6|,|P4-P5|} (1)
则图像的灰度变化密度为
其中,S′为图像中像素点P0的灰度强度,S按照(2)式将S′归一化为(0,1)范围内的数,T为归一化的阈值。D为图像的背景复杂度值,n为图像中的像素数目,P1~P8为P0的八邻域,如表1所示:
P1 | P2 | P3 |
P4 | P0 | P5 |
P6 | P7 | P8 |
表1P0的八邻域
通过计算图像的灰度变化密度值,将图像背景复杂度分为不同的等级,本发明中,将图像背景复杂度分为低,中,高3级;
C)根据图像复杂度级别决定采用何种文字边缘检测方法,对于复杂度较低的图像,采用较简单的边缘文本检测方法,对于复杂度较高的图像,采用较复杂的边缘文本检测方法;
D)根据采用的文本检测方法,找出图像中的候选文本区域,对文本信息区域进行初始定位;
E)对从图像中找到的候选文本区域,抽取相关特征进行文本区域验证,通过验证的候选文本区域,即判定为文本块,将在后续的步骤中抽取文本信息,未通过验证的候选文本区域,即判定为非文本区域,将其从候选文本中去除。用到的特征为:文本区域中字符宽度的均值和方差。该特征的抽取方法为,分别将文本行或文本列的二值图像向水平方向和竖直方向投影,文本行或文本列中字符与字符之间存在一定的间隔,反映在投影曲线上有明显的波峰和波谷,波峰对应字符的笔画,波谷对应字符间隙,而非文本行或文本列的投影曲线相对平滑,没有明显的波峰或波谷。通过统计相邻波谷之间的距离,可以统计出文本行或文本列中字符的平均宽度和方差。
F)对确定的文本块,去除文本块中的背景,将所有文本信息抽取出来;
G)将图像中抽取出来的所有文本信息输出给下一级处理,或在计算机上显示出来。
在B)步中,对图像背景复杂度进行分级,是分为低、中、高三级,图像的背景复杂度值作为分级的依据,如果0≤D≤0.15,则图像背景复杂度为低级;如果0.15<D≤0.3,则图像背景复杂度为中级;如果0.3<D≤1则图像背景复杂度为高级。
在C)步中,对于复杂度较低的图像,采用较简单的边缘检测方法,对于复杂度较高的图像,采用较复杂的边缘检测方法,是:
如果图像背景复杂度判定为低,则按照边缘特征抽取方法1,在灰度图像上采用Sobel算子求取边缘并抽取特征;具体方法为:采用表2所示的,0°,45°,90°,135°四个方向的梯度算子,然后按照公式(4)计算图像的边缘。
G(x,y)=max{G0°(x,y),G45°(x,y),G90°(x,y),G135°(x,y)} (4)
其中,G0°(x,y),G45°(x,y),G90°(x,y),G135°(x,y)分别为图像在0°,45°,90°,135°方向上的梯度图像,G(x,y)为求得的边缘图像。
-1 | -2 | -1 |
0 | 0 | 0 |
1 | 2 | 1 |
2 | 1 | 0 |
1 | 0 | -1 |
0 | -1 | 2 |
1 | 0 | -1 |
2 | 0 | -2 |
1 | 0 | -1 |
0 | -1 | -2 |
1 | 0 | -1 |
2 | 1 | 0 |
表2 Sobel 0°,45°,90°,135°四个方向梯度算子
如果图像背景复杂度判定为中等,则按照边缘特征抽取方法2,采用基于形态学的方法在灰度图像上求取边缘并抽取特征,具体方法为:首先选用3*3的结构算子,按照公式(5)对灰度图像进行膨胀运算得到膨胀图像,然后按照公式(6)对灰度图像进行腐蚀运算得到腐蚀图像,最后按照公式(7)对膨胀图像和腐蚀图像求差分得到边缘图像。
其中Sm,n(x,y)为进行形态学的结构元素,I(x-i,y-j)为与结构元素对应的图像中的点。
;如果图像背景复杂度判定为高等,则按照边缘特征抽取方法3,采用彩色形态学边缘检测方法求取边缘并抽取特征,具体的求取方法为:首先按照公式7,分别对彩色图像的R,G,B三个颜色通道求取梯度图像,然后按照公式(8)求取边缘图像。
其中,Gj(x,y)为在第j通道求得的梯度图象,ωj为第j通道对应的权重,E(x,y)为最后求得的边缘图象。
在D)步中,找出图像中的候选文本区域,是:
a)提取图像的边缘并抽取特征后,在边缘图像上进行连通域分析,获得图像上所有的连通元;
b)利用边缘特征和几何特征对连通元进行筛选,所述的边缘特征主要是边缘密度特征和边缘方向特征,几何特征主要为连通以元的长,宽,宽高比,占空比;
c)对每个文本连通元的位置和尺寸进行分析,将在同一行或同一列的文本连通元组合,形成候选文本区域。
在E)步中的相关特征,为文本区域中字符宽度的均值和方差,通过将文本行或文本列的二值图像向水平方向和竖直方向投影,投影曲线上有明显的波峰和波谷,通过统计相邻波谷之间的距离,计算字符的平均宽度和方差。
在F)步中,将所有文本信息抽取出来,是采用二值化的方法、颜色聚类的方法或统计模型的方法抽取所有文本信息。
下面结合附图详细说明本发明技术方案中所涉及的各个细节问题。应指出的是,所描述的实施例仅旨在便于对本发明的理解,而对其不起任何限定作用。
图2是本发明所述方法的实施例流程图。下面以图2和图3中的三幅图像1,2,3,为例来说明本发明中一些具体的实现流程。按照图2,首先在步骤1启动系统,从指定路径中读取要处理的3幅图像,并在计算机上进行显示;步骤2,分别将3幅图像转换为灰度图像,并在计算机上显示;步骤3,在灰度图像上按照图像背景复杂度计算公式1,2,3分别计算出图像背景复杂度值。本实施例中,计算出的图1的背景复杂度为0.04,图2的背景复杂度为0.18,图3的背景复杂度为0.35;步骤4,根据图像背景复杂度的计算值,将图像背景复杂度等级判定为低、中、高三级,按照发明内容中的复杂度等级标准,图1的背景复杂度应为低,图2的背景复杂度应为中,图3的背景复杂度应为高。图像1背景复杂度判定为低则进入步骤5;图2像背景复杂度判定为中则进入步骤6;图像3背景复杂度判定为高则进入步骤7;步骤5,图像1背景复杂度为低,则按照基于Sobel算子的边缘抽取方法提取边缘图像4,并抽取边缘密度特征和边缘方向分布特征,然后进入步骤8;步骤6,图像2背景复杂度为中,则按照基于数学形态学的边缘抽取方法,在灰度图像上提取边缘图象5,并抽取边缘密度特征和边缘方向分布特征,然后进入步骤8;步骤7,图像3背景复杂度为高,则在彩色图像上按照基于形态学的的彩色边缘抽取方法对图像提取边缘图象6,并抽取边缘密度特征和边缘方向分布特征,然后进入步骤8;步骤8,得到图像的边缘图象并抽取特征后,分别在边缘图像4,5和6上进行8方向连通区域标定,找出图像上所有的连通元;步骤9,对边缘图像4,5,6上对所有的连通元进行分析,将所有连通元分为文本连通元和非文本连通元,主要按照连通元的几何特征和边缘特征采用级联分类器分别对单个连通元进行筛选,对于不满足规则的连通元,确定为非文本连通元,满足规则的连通元为文本连通元;步骤10,对所有的文本连通元的位置和尺寸进行分析,将在同一行或同一列的尺寸大小相似的文本连通元组合,形成候选文本行或文本列;步骤11,对所有候选文本行或文本列,进行水平方向或竖直方向投影,抽取字符宽度特征进行验证,如果文本行(列)未通过验证,则进入步骤12,如果文本行(列)通过验证,则进入步骤13;步骤12,对于未通过文本块验证的候选文本块,将其从候选文本行或列中去除,不再进行后续操作;步骤13,如果候选文本行(列)通过验证,则确定该候选文本行(列)为文本信息行(列),并根据文本行或文本列的投影信息确定该文本行(列)的准确位置信息,在原图上用方框标定出来,标定图象为7,8,9,然后进入步骤14;步骤14,抽取文本行(列)中的文本信息,对于每一个文本行(列),采用Ostu二值化方法将其中的背景去除,以白色像素显示,抽取相应的文本信息以黑色像素显示;步骤15,抽取出的图像中所有的文本信息以白底黑字的形式在计算机上进行显示,进行文本块抽取后的图象为10,11,12,文本信息提取结束。
总之,本发明充分考虑图像背景的复杂度,能够根据图像背景的复杂度采用不同的边缘检测方法对图像中的文本信息进行准确定位和抽取。该发明中图像背景复杂度的计算方法简单,有效,不仅能够提取出不同背景复杂度图像中的文本信息,而且提取出的文本信息不受字体,大小及语言的影响,具有很强的通用性。提高了文本提取系统的总体性能,为图像的分类、检索提供了有利的支持工具。
以上所述,仅为本发明中的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉该技术的人在本发明所揭露的技术范围内,可理解想到的变换或替换,都应涵盖在本发明的包含范围之内,因此,本发明的保护范围应该以权利要求书的保护范围为准。
Claims (7)
1、一种自适应图像文本信息提取方法,其特征在于,包括步骤:1)图像预处理;2)图像背景复杂度分析;3)文本初检测;4)文本验证;5)文本抽取;6)文本信息输出或显示;
其具体步骤为:
A)首先,从选定的路径中读取图像,并将彩色图像转换为灰色图像;
B)根据灰色图像所有像素点的灰度变化密度,计算出整幅图像的背景复杂度,计算方法为:某一像素点P0的灰度强度S′按照下式计算:
S′=MAX{|P1-P8|,|P2-P7|,|P3-P6|,|P4-P5|} (1)
则图像的背景复杂度为:
其中,S′为图像中像素点P0的灰度强度,S按照(2)式将S′归一化为(0,1)范围内的数,T为归一化的阈值,D为图像的背景复杂度值,n为图像中的像素数目,P1~P8为P0的八邻域;
按照计算的D值对图像背景复杂度进行分级;
C)根据图像复杂度级别决定采用何种文字边缘检测方法,对于复杂度较低的图像,采用较简单的边缘文本检测方法,对于复杂度较高的图像,采用较复杂的边缘文本检测方法;
D)根据采用的文本检测方法,找出图像中的候选文本区域,对文本信息区域进行初始定位;
E)对从图像中找到的候选文本区域,抽取相关特征进行文本区域验证,通过验证的候选文本区域,即判定为文本块,将在后续的步骤中抽取文本信息,未通过验证的候选文本区域,即判定为非文本区域,将其从候选文本中去除;
F)对确定的文本块,去除文本块中的背景,将所有文本信息抽取出来;
G)将图像中抽取出来的所有文本信息输出给下一级处理,或在计算机上显示出来。
2、如权利要求1所述的方法,其特征在于,所述B)步中,对图像背景复杂度进行分级,是分为低、中、高三级:如果0≤D≤0.15,则图像背景复杂度为低级;如果0.15<D≤0.3,则图像背景复杂度为中级;如果0.3<D≤1则图像背景复杂度为高级。
3、如权利要求1或2所述的方法,其特征在于,所述C)步中,对于复杂度较低的图像,采用较简单的边缘检测方法,对于复杂度较高的图像,采用较复杂的边缘检测方法,是:
如果图像背景复杂度判定为低,则采用边缘特征抽取方法1:在灰度图像上用Sobel四方向算子求取边缘并抽取特征;如果图像背景复杂度判定为中,则采用边缘特征抽取方法2:基于形态学的方法在灰度图像上求取形态边缘并抽取特征;如果图像背景复杂度判定为高,则采用边缘特征抽取方法3:用基于形态学的彩色边缘抽取方法,分别对三个颜色通道提取形态梯度,然后将三个颜色通道合并得到边缘并抽取特征。
4、如权利要求1所述的方法,其特征在于,所述D)步中,找出图像中的候选文本区域,是:
a)提取图像的边缘并抽取特征后,在边缘图像上进行连通域分析,获得图像上所有的连通元;
b)利用边缘特征和几何特征对连通元进行筛选,剔除非文本连通元;
c)对每个文本连通元的位置和尺寸进行分析,将在同一行或同一列的文本连通元组合,形成候选文本区域。
5、如权利要求1所述的方法,其特征在于,所述E)步中的相关特征,为文本区域中字符宽度的均值和方差,通过将文本行或文本列的二值图像向水平方向和竖直方向投影,投影曲线上有明显的波峰和波谷,通过统计相邻波谷之间的距离,计算字符的平均宽度和方差。
6、如权利要求1所述的方法,其特征在于,所述F)步中,将所有文本信息抽取出来,是采用二值化的方法、颜色聚类的方法或统计模型的方法抽取所有文本信息。
7、如权利要求4所述的方法,其特征在于,所述b)步中的边缘特征和几何特征,其中,边缘特征是边缘密度特征和边缘方向特征,几何特征是连通以元的长,宽,宽高比,占空比。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2008101156153A CN101615252B (zh) | 2008-06-25 | 2008-06-25 | 一种自适应图像文本信息提取方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2008101156153A CN101615252B (zh) | 2008-06-25 | 2008-06-25 | 一种自适应图像文本信息提取方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101615252A true CN101615252A (zh) | 2009-12-30 |
CN101615252B CN101615252B (zh) | 2012-07-04 |
Family
ID=41494882
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2008101156153A Expired - Fee Related CN101615252B (zh) | 2008-06-25 | 2008-06-25 | 一种自适应图像文本信息提取方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101615252B (zh) |
Cited By (36)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102163284A (zh) * | 2011-04-11 | 2011-08-24 | 西安电子科技大学 | 面向中文环境的复杂场景文本定位方法 |
CN102194118A (zh) * | 2010-03-02 | 2011-09-21 | 方正国际软件(北京)有限公司 | 一种从图像中抽取信息的方法及装置 |
CN102411707A (zh) * | 2011-10-31 | 2012-04-11 | 世纪龙信息网络有限责任公司 | 一种图片中文本的识别方法及识别装置 |
CN102799879A (zh) * | 2012-07-12 | 2012-11-28 | 中国科学技术大学 | 从自然场景图像中识别多言语、多字体文字的方法 |
CN102810155A (zh) * | 2011-05-31 | 2012-12-05 | 富士通株式会社 | 用于从图像中提取文本笔划图像的方法和装置 |
CN103336961A (zh) * | 2013-07-22 | 2013-10-02 | 中国科学院自动化研究所 | 一种交互式的自然场景文本检测方法 |
CN103493067A (zh) * | 2011-12-26 | 2014-01-01 | 华为技术有限公司 | 识别视频的字符的方法和装置 |
CN103854020A (zh) * | 2012-11-29 | 2014-06-11 | 北京千橡网景科技发展有限公司 | 文字识别方法及装置 |
CN103946866A (zh) * | 2011-11-21 | 2014-07-23 | 诺基亚公司 | 与直方图一起使用多层连接分量的文本检测 |
CN104408449A (zh) * | 2014-10-27 | 2015-03-11 | 西安电子科技大学宁波信息技术研究院 | 智能移动终端场景文字处理方法 |
CN104751153A (zh) * | 2013-12-31 | 2015-07-01 | 中国科学院深圳先进技术研究院 | 一种识别场景文字的方法及装置 |
CN104809481A (zh) * | 2015-05-21 | 2015-07-29 | 中南大学 | 一种基于自适应色彩聚类的自然场景文本检测的方法 |
WO2015142473A1 (en) * | 2014-03-19 | 2015-09-24 | Qualcomm Incorporated | Language identification for text in an object image |
CN104978565A (zh) * | 2015-05-11 | 2015-10-14 | 厦门翼歌软件科技有限公司 | 一种普适性的图像文字提取方法 |
CN106250831A (zh) * | 2016-07-22 | 2016-12-21 | 北京小米移动软件有限公司 | 图像检测方法、装置和用于图像检测的装置 |
CN106296629A (zh) * | 2015-05-18 | 2017-01-04 | 富士通株式会社 | 图像处理装置和方法 |
CN106339661A (zh) * | 2015-07-17 | 2017-01-18 | 阿里巴巴集团控股有限公司 | 一种用于检测图像中文本区域的方法及装置 |
CN106407919A (zh) * | 2016-09-05 | 2017-02-15 | 珠海赛纳打印科技股份有限公司 | 基于图像处理的文本分离方法及装置和图像形成设备 |
CN106874905A (zh) * | 2017-01-12 | 2017-06-20 | 中南大学 | 一种基于自学习色彩聚类的自然场景文本检测的方法 |
CN107067397A (zh) * | 2017-04-27 | 2017-08-18 | 北京环境特性研究所 | 一种基于红外图像复杂度的图像分级方法 |
WO2017140233A1 (zh) * | 2016-02-18 | 2017-08-24 | 腾讯科技(深圳)有限公司 | 文字检测方法及系统、设备、存储介质 |
CN107798674A (zh) * | 2017-09-15 | 2018-03-13 | 华南理工大学 | 一种金属工件表面结构误检结果的排除方法 |
CN108171104A (zh) * | 2016-12-08 | 2018-06-15 | 腾讯科技(深圳)有限公司 | 一种文字检测方法及装置 |
CN108171098A (zh) * | 2016-12-07 | 2018-06-15 | 杭州海康威视数字技术股份有限公司 | 一种条码检测方法及设备 |
CN108229437A (zh) * | 2018-02-02 | 2018-06-29 | 王辉 | 基于云计算的图像分析系统 |
CN108256833A (zh) * | 2018-04-09 | 2018-07-06 | 南京晓庄学院 | 一种in time日程安排处理系统 |
CN108305284A (zh) * | 2018-02-28 | 2018-07-20 | 北京奇艺世纪科技有限公司 | 一种文字笔画宽度的确定方法及装置 |
CN109062403A (zh) * | 2017-11-24 | 2018-12-21 | 漳州龙文区炼盛合信息技术有限公司 | 一种pad设备 |
CN110853065A (zh) * | 2019-10-21 | 2020-02-28 | 天津大学 | 一种应用于光电跟踪系统的边缘提取方法 |
CN111639639A (zh) * | 2019-03-01 | 2020-09-08 | 杭州海康威视数字技术股份有限公司 | 检测文本区域的方法、装置、设备及存储介质 |
CN112395450A (zh) * | 2020-11-17 | 2021-02-23 | 平安科技(深圳)有限公司 | 图片文字检测方法、装置、计算机设备及存储介质 |
CN112767304A (zh) * | 2020-12-04 | 2021-05-07 | 浙江大学山东工业技术研究院 | 一种基于视觉的太阳花模组位置和方向检测方法 |
CN113298829A (zh) * | 2021-06-15 | 2021-08-24 | Oppo广东移动通信有限公司 | 图像处理方法、装置、电子设备及计算机可读存储介质 |
WO2023045721A1 (zh) * | 2021-09-27 | 2023-03-30 | 北京有竹居网络技术有限公司 | 一种图像语种识别方法及其相关设备 |
CN116152818A (zh) * | 2023-02-16 | 2023-05-23 | 中国工业互联网研究院 | 一种提高旋转图像文本行的识别准确率的方法及系统 |
CN117171384A (zh) * | 2023-11-02 | 2023-12-05 | 广州翼拍联盟网络技术有限公司 | 高精度纹理路径检索方法、装置、计算机设备及存储介质 |
-
2008
- 2008-06-25 CN CN2008101156153A patent/CN101615252B/zh not_active Expired - Fee Related
Cited By (58)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102194118A (zh) * | 2010-03-02 | 2011-09-21 | 方正国际软件(北京)有限公司 | 一种从图像中抽取信息的方法及装置 |
CN102194118B (zh) * | 2010-03-02 | 2013-04-10 | 方正国际软件(北京)有限公司 | 一种从图像中抽取信息的方法及装置 |
CN102163284A (zh) * | 2011-04-11 | 2011-08-24 | 西安电子科技大学 | 面向中文环境的复杂场景文本定位方法 |
CN102810155B (zh) * | 2011-05-31 | 2015-04-15 | 富士通株式会社 | 用于从图像中提取文本笔划图像的方法和装置 |
CN102810155A (zh) * | 2011-05-31 | 2012-12-05 | 富士通株式会社 | 用于从图像中提取文本笔划图像的方法和装置 |
CN102411707A (zh) * | 2011-10-31 | 2012-04-11 | 世纪龙信息网络有限责任公司 | 一种图片中文本的识别方法及识别装置 |
CN103946866A (zh) * | 2011-11-21 | 2014-07-23 | 诺基亚公司 | 与直方图一起使用多层连接分量的文本检测 |
CN103493067B (zh) * | 2011-12-26 | 2018-01-02 | 华为技术有限公司 | 识别视频的字符的方法和装置 |
CN103493067A (zh) * | 2011-12-26 | 2014-01-01 | 华为技术有限公司 | 识别视频的字符的方法和装置 |
CN102799879B (zh) * | 2012-07-12 | 2014-04-02 | 中国科学技术大学 | 从自然场景图像中识别多言语、多字体文字的方法 |
CN102799879A (zh) * | 2012-07-12 | 2012-11-28 | 中国科学技术大学 | 从自然场景图像中识别多言语、多字体文字的方法 |
CN103854020A (zh) * | 2012-11-29 | 2014-06-11 | 北京千橡网景科技发展有限公司 | 文字识别方法及装置 |
CN103854020B (zh) * | 2012-11-29 | 2018-11-30 | 捷讯平和(北京)科技发展有限公司 | 文字识别方法及装置 |
CN103336961B (zh) * | 2013-07-22 | 2016-06-29 | 中国科学院自动化研究所 | 一种交互式的自然场景文本检测方法 |
CN103336961A (zh) * | 2013-07-22 | 2013-10-02 | 中国科学院自动化研究所 | 一种交互式的自然场景文本检测方法 |
CN104751153A (zh) * | 2013-12-31 | 2015-07-01 | 中国科学院深圳先进技术研究院 | 一种识别场景文字的方法及装置 |
CN104751153B (zh) * | 2013-12-31 | 2018-08-14 | 中国科学院深圳先进技术研究院 | 一种识别场景文字的方法及装置 |
WO2015142473A1 (en) * | 2014-03-19 | 2015-09-24 | Qualcomm Incorporated | Language identification for text in an object image |
CN104408449A (zh) * | 2014-10-27 | 2015-03-11 | 西安电子科技大学宁波信息技术研究院 | 智能移动终端场景文字处理方法 |
CN104408449B (zh) * | 2014-10-27 | 2018-01-30 | 西安电子科技大学宁波信息技术研究院 | 智能移动终端场景文字处理方法 |
CN104978565A (zh) * | 2015-05-11 | 2015-10-14 | 厦门翼歌软件科技有限公司 | 一种普适性的图像文字提取方法 |
CN104978565B (zh) * | 2015-05-11 | 2019-06-28 | 厦门翼歌软件科技有限公司 | 一种普适性的图像文字提取方法 |
CN106296629A (zh) * | 2015-05-18 | 2017-01-04 | 富士通株式会社 | 图像处理装置和方法 |
CN106296629B (zh) * | 2015-05-18 | 2019-01-22 | 富士通株式会社 | 图像处理装置和方法 |
CN104809481B (zh) * | 2015-05-21 | 2017-10-20 | 中南大学 | 一种基于自适应色彩聚类的自然场景文本检测方法 |
CN104809481A (zh) * | 2015-05-21 | 2015-07-29 | 中南大学 | 一种基于自适应色彩聚类的自然场景文本检测的方法 |
CN106339661A (zh) * | 2015-07-17 | 2017-01-18 | 阿里巴巴集团控股有限公司 | 一种用于检测图像中文本区域的方法及装置 |
WO2017140233A1 (zh) * | 2016-02-18 | 2017-08-24 | 腾讯科技(深圳)有限公司 | 文字检测方法及系统、设备、存储介质 |
CN106250831A (zh) * | 2016-07-22 | 2016-12-21 | 北京小米移动软件有限公司 | 图像检测方法、装置和用于图像检测的装置 |
CN106407919A (zh) * | 2016-09-05 | 2017-02-15 | 珠海赛纳打印科技股份有限公司 | 基于图像处理的文本分离方法及装置和图像形成设备 |
CN106407919B (zh) * | 2016-09-05 | 2019-09-10 | 珠海赛纳打印科技股份有限公司 | 基于图像处理的文本分离方法及装置和图像形成设备 |
CN108171098A (zh) * | 2016-12-07 | 2018-06-15 | 杭州海康威视数字技术股份有限公司 | 一种条码检测方法及设备 |
CN108171104A (zh) * | 2016-12-08 | 2018-06-15 | 腾讯科技(深圳)有限公司 | 一种文字检测方法及装置 |
CN108171104B (zh) * | 2016-12-08 | 2022-05-10 | 腾讯科技(深圳)有限公司 | 一种文字检测方法及装置 |
CN106874905B (zh) * | 2017-01-12 | 2019-06-11 | 中南大学 | 一种基于自学习色彩聚类的自然场景文本检测的方法 |
CN106874905A (zh) * | 2017-01-12 | 2017-06-20 | 中南大学 | 一种基于自学习色彩聚类的自然场景文本检测的方法 |
CN107067397A (zh) * | 2017-04-27 | 2017-08-18 | 北京环境特性研究所 | 一种基于红外图像复杂度的图像分级方法 |
CN107798674B (zh) * | 2017-09-15 | 2021-04-23 | 华南理工大学 | 一种金属工件表面结构误检结果的排除方法 |
CN107798674A (zh) * | 2017-09-15 | 2018-03-13 | 华南理工大学 | 一种金属工件表面结构误检结果的排除方法 |
CN109062403A (zh) * | 2017-11-24 | 2018-12-21 | 漳州龙文区炼盛合信息技术有限公司 | 一种pad设备 |
CN109062403B (zh) * | 2017-11-24 | 2021-12-14 | 莆田市宏铭贸易有限公司 | 一种pda设备 |
CN108229437A (zh) * | 2018-02-02 | 2018-06-29 | 王辉 | 基于云计算的图像分析系统 |
CN108305284A (zh) * | 2018-02-28 | 2018-07-20 | 北京奇艺世纪科技有限公司 | 一种文字笔画宽度的确定方法及装置 |
CN108256833A (zh) * | 2018-04-09 | 2018-07-06 | 南京晓庄学院 | 一种in time日程安排处理系统 |
CN111639639A (zh) * | 2019-03-01 | 2020-09-08 | 杭州海康威视数字技术股份有限公司 | 检测文本区域的方法、装置、设备及存储介质 |
CN111639639B (zh) * | 2019-03-01 | 2023-05-02 | 杭州海康威视数字技术股份有限公司 | 检测文本区域的方法、装置、设备及存储介质 |
CN110853065A (zh) * | 2019-10-21 | 2020-02-28 | 天津大学 | 一种应用于光电跟踪系统的边缘提取方法 |
CN112395450A (zh) * | 2020-11-17 | 2021-02-23 | 平安科技(深圳)有限公司 | 图片文字检测方法、装置、计算机设备及存储介质 |
CN112395450B (zh) * | 2020-11-17 | 2024-03-19 | 平安科技(深圳)有限公司 | 图片文字检测方法、装置、计算机设备及存储介质 |
WO2022105120A1 (zh) * | 2020-11-17 | 2022-05-27 | 平安科技(深圳)有限公司 | 图片文字检测方法、装置、计算机设备及存储介质 |
CN112767304A (zh) * | 2020-12-04 | 2021-05-07 | 浙江大学山东工业技术研究院 | 一种基于视觉的太阳花模组位置和方向检测方法 |
CN112767304B (zh) * | 2020-12-04 | 2023-02-28 | 浙江大学山东工业技术研究院 | 一种基于视觉的太阳花模组位置和方向检测方法 |
CN113298829B (zh) * | 2021-06-15 | 2024-01-23 | Oppo广东移动通信有限公司 | 图像处理方法、装置、电子设备及计算机可读存储介质 |
CN113298829A (zh) * | 2021-06-15 | 2021-08-24 | Oppo广东移动通信有限公司 | 图像处理方法、装置、电子设备及计算机可读存储介质 |
WO2023045721A1 (zh) * | 2021-09-27 | 2023-03-30 | 北京有竹居网络技术有限公司 | 一种图像语种识别方法及其相关设备 |
CN116152818A (zh) * | 2023-02-16 | 2023-05-23 | 中国工业互联网研究院 | 一种提高旋转图像文本行的识别准确率的方法及系统 |
CN117171384A (zh) * | 2023-11-02 | 2023-12-05 | 广州翼拍联盟网络技术有限公司 | 高精度纹理路径检索方法、装置、计算机设备及存储介质 |
CN117171384B (zh) * | 2023-11-02 | 2024-02-23 | 广州翼拍联盟网络技术有限公司 | 高精度纹理路径检索方法、装置、计算机设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN101615252B (zh) | 2012-07-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101615252B (zh) | 一种自适应图像文本信息提取方法 | |
CN100527156C (zh) | 一种图片文字检测的方法 | |
Babu et al. | Vehicle number plate detection and recognition using bounding box method | |
CN108596166A (zh) | 一种基于卷积神经网络分类的集装箱箱号识别方法 | |
CN101122953B (zh) | 一种图片文字分割的方法 | |
CN102332096B (zh) | 一种视频字幕文本提取和识别的方法 | |
LeBourgeois | Robust multifont OCR system from gray level images | |
CN102915438A (zh) | 一种视频字幕的提取方法及装置 | |
CN103034848B (zh) | 一种表单类型的识别方法 | |
CN106875546A (zh) | 一种增值税发票的识别方法 | |
CN101520841A (zh) | 一种高清视频中的实时抗干扰车牌定位方法 | |
CN102629322B (zh) | 一种基于边界点笔画形状的字符特征提取方法及应用 | |
CN106650553A (zh) | 车牌识别方法及系统 | |
CN104361336A (zh) | 一种水下视频图像的文字识别方法 | |
CN102024144A (zh) | 集装箱箱号自动识别方法 | |
CN101777124A (zh) | 一种提取视频文本信息的方法及装置 | |
CN101593276A (zh) | 一种视频ocr图文分离方法及系统 | |
CN103336961A (zh) | 一种交互式的自然场景文本检测方法 | |
CN106778717A (zh) | 一种基于图像识别和k近邻的测评表识别方法 | |
CN102332097A (zh) | 一种基于图割的复杂背景文本图像分割方法 | |
Kobchaisawat et al. | Thai text localization in natural scene images using convolutional neural network | |
CN116824608A (zh) | 基于目标检测技术的答题卡版面分析方法 | |
Zhan et al. | A robust split-and-merge text segmentation approach for images | |
Choi et al. | Localizing slab identification numbers in factory scene images | |
Kumar et al. | An efficient algorithm for text localization and extraction in complex video text images |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20120704 Termination date: 20170625 |
|
CF01 | Termination of patent right due to non-payment of annual fee |