CN101770576A - 字符提取方法和装置 - Google Patents

字符提取方法和装置 Download PDF

Info

Publication number
CN101770576A
CN101770576A CN200810246654A CN200810246654A CN101770576A CN 101770576 A CN101770576 A CN 101770576A CN 200810246654 A CN200810246654 A CN 200810246654A CN 200810246654 A CN200810246654 A CN 200810246654A CN 101770576 A CN101770576 A CN 101770576A
Authority
CN
China
Prior art keywords
mrow
seg
segmentation
msub
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN200810246654A
Other languages
English (en)
Inventor
周景超
苗广艺
徐成华
鲍东山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BEIJING NUFRONT SOFTWARE TECHNOLOGY Co Ltd
Original Assignee
BEIJING NUFRONT SOFTWARE TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BEIJING NUFRONT SOFTWARE TECHNOLOGY Co Ltd filed Critical BEIJING NUFRONT SOFTWARE TECHNOLOGY Co Ltd
Priority to CN200810246654A priority Critical patent/CN101770576A/zh
Publication of CN101770576A publication Critical patent/CN101770576A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Character Input (AREA)

Abstract

一种提取图像中的字符的方法,包括:针对候选文本区域图像中同一行中的所有字符,建立候选分割点集合,该集合包括左分割点的集合和右分割点的集合;以每个左分割点为基准,在一个估计区间内查找相应的右分割点,产生候选分割组;对候选分割组进行文字识别;根据候选分割组的位置,利用识别代价对候选分割组的识别结果进行过滤。本发明还公开一种提取图像中的字符的装置。

Description

字符提取方法和装置
技术领域
本发明涉及对图像中的文字进行处理的技术,尤其涉及一种对图像中的字符进行提取的方法和装置。
背景技术
在基于内容的视频检索中,文本是一种易于提取且和视频图像内容紧密相关的信息,为视频内容理解提供了重要线索。视频文本提取的过程分为三部分:定位、分割和识别。定位是利用文本区域的边缘、纹理等特征,在视频图像中准确标识出它的位置,分割是在候选文本区域中准确标识出单个字符的边界,识别是对分割得到的单个字符图像进行正确分类。
在视频文本提取系统中,如果分割时出现错误,就得不到正确的识别结果。并且,由于目前的OCR(光学字符识别)引擎多采用网格特征,字符边界上的微小偏差也会影响识别结果。因此,分割是整个系统中的重要环节。
一种字符分割算法是:在生成候选分割路径时,首先对候选文本区域进行二值化和滤噪,然后对二值图像进行连通域标定和合并,通过对连通域进行轮廓分析提取候选分割点。分割路径为位于候选分割点上的直线。在确定分割序列时,采用定向搜索的方法对分割点进行组合,得到多组分割结果。随着搜索深度的增加,根据分割结果的识别代价和字典不断对分割结果进行评估,利用规则对其进行剪枝,最后得到可信度最高的分割序列。
另一种字符分割算法是:首先对候选文本区域进行二值化、连通域标定和滤噪,然后对二值图像进行投影,在投影图中选取数值较小的局部极小值点作为候选分割点。在确定分割序列时,首先利用中位数估计字符宽度,然后结合候选分割点和字符宽度的估计值生成候选分割,对字符串进行识别,最后根据字典和语义规则对识别结果进行筛选。
上述两种字符分割方法的不足之处在于:在生成候选分割点时,考虑的情况不完备,并且没有对候选分割点进行筛选,保留了许多错误的分割结果,影响后续字符特征的估计。这两个缺点都降低了字符分割、提取的准确性。
发明内容
有鉴于此,本发明所要解决的技术问题是提供一种字符提取方法,以提高字符分割、提取的准确性,降低字符分割、提取的计算量和难度。
在一些可选的实施例中,所述字符提取方法包括:针对候选文本区域图像中同一行中的所有字符,建立候选分割点集合,该集合包括左分割点的集合和右分割点的集合;以每个左分割点为基准,在一个估计区间内查找相应的右分割点,产生候选分割组;对候选分割组进行文字识别;根据候选分割组的位置,利用识别代价对候选分割组的识别结果进行过滤。
本发明所要解决的另一个技术问题是提供一种字符提取装置。
在一些可选的实施例中,所述字符提取装置包括:第一单元,用于针对候选文本区域图像中同一行中的所有字符,建立候选分割点集合;其中,该集合包括左分割点的集合和右分割点的集合;第二单元,用于以每个左分割点为基准,在一个估计区间内查找相应的右分割点,产生候选分割组;字符识别单元,用于对候选分割组进行文字识别;和第三单元,用于根据候选分割组的位置,利用识别代价对候选分割组的识别结果进行过滤。
采用上述实施例所述的技术方案进行字符分割、识别时,综合考虑了投影和连通域分析这两种途径生成候选分割点,相互补充,完整地包含了正确的字符分割点;同时,又对识别获得的字符进行筛选,以免包含错误的字符分割点而影响对字符特性的估计。另外,根据视频文本的特点,结合识别代价和位置关系对候选分割进行过滤,明显减少了组合分割序列时的分枝数目,提高了查全率。
说明书附图
图1是合并连通域的示意图;
图2是利用直方图统计字符上下边界的示意图;
图3是提取图像中的字符的一个方法实施例流程图;
图4是对二值图像进行垂直投影获得第一类左右分割点的示意图;
图5是生成候选分割组的示意图;
图6是识别结果示意图;
图7是相邻两个候选分割组之间位置关系的一个示意图;
图8是对字符过滤的示意图;
图9是提取图像中的字符的一个装置实施例示意图。
具体实施方式
在对字符进行分割、识别之前,需要对图像进行预处理。一种可选的预处理过程是:
首先,对接收到的图像进行二值化处理,获得二值图像。这样既能够刻画字符笔画附近的亮度变化,又不至于保留太多的背景噪声。
然后,标记二值图像中的连通域。经过标定后,能够得到二值图像中每一个连通区域的位置、尺寸和像素点个数等信息。
然后,根据各连通域的尺寸和位置关系进行合并,形成完整的接近字符特征的连通域,如图1所示。
在文本区域的二值图像中,字符个数较多,适宜用统计的方法估计字符特性。但是,每个字符都是由多个分散的笔画构成,如果不对连通域进行合理的合并,就会使统计数据中包含过多的干扰信息,影响字符识别的正确性。因此,需要进行连通域的合并。
后文提及的任何有关对连通域的操作,都是针对合并后的连通域进行的。
最后,采用直方图统计的方法估计出字符的上下边界。一种可选的方式是根据视频文本中字符的排列规则,通过统计获得字符的上下边界。具体步骤包括:
(1)分别对连通域的上下边界进行直方图统计,如图2所示。
由于字符的边界不是严格统一,而是在真实值附近聚集,利用这个特点,在统计时对直方图进行模糊,能够在字符边界的位置上得到一个稳定的极大值。
(2)分别从连通域的上下边界直方图中找出最大值,该值对应的坐标即为字符上下边界的估计值。
获得字符上下边界的估计值之后,也就可以得到字符高度的估计值。
对图像进行预处理后,可以直接开始进行字符分割,也可以先做进一步的滤噪处理,以去除连通域中的噪声和干扰,然后再开始进行字符分割。对图像进行预处理后先做滤噪处理再进行字符分割,可以进一步提高字符分割的准确性,降低字符分割的计算量和难度。
图3示出了一种可选的字符提取流程。
步骤11,针对候选文本区域图像中同一行中的所有字符,建立候选分割点集合。
该候选分割点集合包括左分割点的集合和右分割点的集合。
步骤12,以每个左分割点为基准,在一个估计区间内查找相应的右分割点,产生候选分割组。
步骤13,对候选分割组进行文字识别。
步骤14,根据候选分割组的位置,利用识别代价对候选分割组的识别结果进行过滤。
进行字符分割时,需要一系列的候选分割点。确定候选分割点的方式有很多,一种可选的方式是:分别通过两种方式确定分割点。例如:可以通过对二值图像进行垂直投影,以二值图像的垂直投影的左、右边界作为一系列的左、右分割点,称为第一类分割点;以每个合并后的字符连通域的左、右边界作为一系列的左、右分割点,称为第二类分割点。这两类分割点之间有重叠但相互补充。
在视频文本中,为了便于辨识,字符之间有一定间隔,反映在其二值图像的垂直投影上,就是一系列投影值很小的波谷,如图4所示,这些波谷的边界构成第一类分割点。
在实际情况中,字符之间可能会存在噪声,此时虽然两个相邻的字符没有粘连,但在投影图中却看不到对应的明显的波谷,如图4中方框内的区域。如果只在投影图上提取候选分割点,会漏掉一些正确的分割点。在这种情况下,字符连通域的左右边界能够作为有益的补充。但是,即使在合并之后,一个连通域并不一定是一个完整的字符,并且,连通域中仍有可能含有噪声,如果不加筛选的将连通域的边界全部考虑进去,会引入较多的错误分割点,影响对字符宽度的估计,因此,不考虑那些尺寸不合理的连通域的边界。这些边界构成第二类分割点。
为减少运算量,将候选分割点划分为两类:左分割点和右分割点。用PL、PR分别表示左、右分割点的集合,则
PL={PL11,PL21,PL12,PL22,...,PL1m,PL2n}
PR={PR11,PR21,PR12,PR22,...,PR1m,PR2n}
其中,m表示二值图像的垂直投影的个数,n表示字符连通域的个数;PL1l、PR1l表示第一类左、右分割点,l∈[1,m];PL2k、PR2k表示第二类左、右分割点,k∈[1,n]。
可以用PLi、PRj分别表示PL和PR中任意一个左、右分割点,每个左分割点PLi和特定区间内的每一个右分割点PRj都可以组成一个候选分割seg(PLi,PRj)。所述特定区间应视具体情况设置,一种可选的方式是将特定区间设置为[PLi+b1×H′,PLi+b2×H′],其中,H′表示字符高度的估计值,b1、b2为设定的加权系数。
对所有候选分割的宽度进行直方图统计,得到直方图H(k)并估计字符的宽度。
1、在所有的统计值H(k)中选取最大的值所对应的宽度k0。则k0是出现频率最高的字符宽度估计值,有可能是真正的字符宽度。
为避免受到噪声干扰,可以更进一步地对k0进行验证,具体的验证步骤为:
2、判断的值是否处于合适的字符宽高比的范围内。如果是,则以k0作为字符宽度估计值。否则,将最大的统计值H(k0)置零并丢弃k0,然后重新执行步骤1。
重复执行步骤1和2,直到可以确定字符宽度或者超出搜索次数限制为止。
根据直方图H(k)对字符宽度进行统计,并以统计出现次数最多的字符宽度作为字符宽度估计值,这是一种获得字符宽度估计值的方式。另一种可选的方式是直接以b×H′作为字符宽度估计值,其中,b为预先配置的加权系数。
获得字符宽度估计值后,可以每个左分割点为基准,在一个字符宽度的附近查找相应的右分割点,产生候选分割组。生成候选分割组的过程如图3所示。
在图5中,A0、B0和C0都是左分割点。以左分割点A0为例,在右分割点集合PR中查找位于范围[A0+a1×W,A0+a2×W]内的右分割点,即查找位于[A1,A2]内的右分割点。如果查找到对应的右分割点,如右分割点E,则将[A0,E]作为候选分割组保存起来;如果未找到,则从下一个左分割点,如左分割点B0,继续寻找。这样,获得候选分割组seg1=[A0,E],seg2=[B0,F],seg3=[C0,G]。
其中,W为字符宽度估计值,a1、a2为设定的加权系数。
得到候选分割组之后,即可确定单个字符的左右边界,然后根据在灰度图像上分割出单个字符的图像,送给OCR引擎进行识别。可以根据对某一个候选分割组的识别情况衡量该候选分割组的可信度。在OCR单字识别时,输出与未知字符的正确识别结果s0最近邻的N个未知字符的实际识别结果sj根据s0和各sj之间的距离对识别情况进行评估。
如图6所示,左图是一个正确的分割结果,右图是一个勉强识别的错误的分割结果。“?”表示未知字符,各字符表示对未知字符的实际识别结果sj,线段表示实际识别结果sj和正确识别结果s0之间的距离dist(s0,sj)。
从图6可以看出,在正确分割时,正确识别结果s0与实际识别结果s1之间的距离很小,与其他的实际识别结果sj之间的距离差别较大,此时识别结果的可信度较高。在错误分割时,s0到各sj之间的距离都很大,即使识别,识别结果也比较勉强。这两种情况可以用s0与sj之间的距离和s0与各sj之间的距离的一致性来描述。
对于每个候选分割组segi,计算其识别代价CST(segi)的公式如下:
CST ( seg i ) = α × mD ( seg i ) + β × 1 coh ( seg i ) ;
其中,α、β为加权系数,N表示对未知字符的实际识别结果的个数;
mD(segi)=min{dist(s0,s1),dist(s0,s2),......,dist(s0,sN)};
coh ( seg i ) = Σ j = 1 N prob ( j ) 2 ;
prob ( j ) = dist ( s 0 , s j ) Σ k = 1 N dist ( s 0 , s k ) ;
在生成的候选分割组中,由于字符自身笔画分散和背景噪声的影响,可能存在错误的分割结果,需要结合候选分割组之间的位置关系和识别代价,进行字符串过滤。
图7示出了相邻两个候选分割组之间的一种位置关系。
根据候选分割组的位置关系决定是否对识别获得的字符进行过滤,如果需要过滤,则利用识别代价对字符进行过滤,过滤后即可得到正确的字符串。具体的步骤包括:
判断min{part1,part2}是否大于设定的阈值θ1,从而获得相邻两个候选分割组的位置重叠程度。
如果min{part1,part2}≤θ1,则无需对识别获得的字符过滤。
如果min{part1,part2}>θ1,则需要对字符过滤。在这种情况下,判断max{part1,part2}是否大于设定的阈值θ2
如果max{part1,part2}>θ2且|width(seg1)-width(seg2)|>θ3,则保留宽度更接近字符宽度估计值的候选分割组的字符识别结果;
否则,保留识别代价较小的候选分割组的字符识别结果。
按下式计算part1和part2
part 1 = Overlap ( seg 1 , seg 2 ) width ( seg 1 )
part 2 = Overlap ( seg 1 , seg 2 ) width ( seg 2 )
其中,Overlap(seg1,seg2)表示相邻两个候选分割组seg1和seg2重叠部分的宽度,width(seg1)和width(seg2)分别表示候选分割组seg1和seg2的宽度。
图8是字符过滤的示意图,左图是含有错误分割的情况,右边是较为理想的情况。各行图像从上到下依次是:灰度图像、二值图像、二值图像的垂直投影、连通域合并后的结果和各候选分割组的字符识别结果。
采用上述实施例所述的方法进行字符分割、识别时,综合考虑了投影和连通域分析这两种途径生成候选分割点,相互补充,完整地包含了正确的字符分割点;然后,对候选分割组进行筛选,以免包含错误的字符分割点而影响对字符特性的估计。另外,根据视频文本的特点,结合识别代价和位置关系对候选分割进行过滤,得到正确的字符串识别结果。
图9示出了一种提取图像中的字符的装置,该装置包括第一单元S71、第二单元S72、第三单元S73和字符识别单元S74。
第一单元S71用于针对候选文本区域图像中同一行中的所有字符,建立候选分割点集合。其中,该集合包括左分割点的集合和右分割点的集合;
第二单元S72用于以每个左分割点为基准,在一个估计区间内查找相应的右分割点,产生候选分割组。
字符识别单元S74,用于对候选分割组进行文字识别。
第三单元S73用于根据候选分割组的位置,利用识别代价对候选分割组的识别结果进行过滤。
第一单元S71、第二单元S72、第三单元S73和字符识别单元S74的具体工作流程与前文的相关说明相同,此不赘述。
本领域技术人员可以明白,这里结合所公开的实施例描述的各种示例性的方法步骤和装置单元均可以电子硬件、软件或二者的结合来实现。为了清楚地示出硬件和软件之间的可交换性,以上对各种示例性的步骤和单元均以其功能性的形式进行总体上的描述。这种功能性是以硬件实现还是以软件实现依赖于特定的应用和整个系统所实现的设计约束。本领域技术人员能够针对每个特定的应用,以多种方式来实现所描述的功能性,但是这种实现的结果不应解释为背离本发明的范围。
利用通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或者其它可编程的逻辑器件、分立门或者晶体管逻辑、分立硬件组件或者他们之中的任意组合,可以实现或执行结合这里公开的实施例描述的各种示例性的单元。通用处理器可能是微处理器,但是在另一种情况中,该处理器可能是任何常规的处理器、控制器、微控制器或者状态机。处理器也可能被实现为计算设备的组合,例如,DSP和微处理器的组合、多个微处理器、一个或者更多结合DSP核心的微处理器或者任何其他此种结构。
结合上述公开的实施例所描述的方法的步骤可直接体现为硬件、由处理器执行的软件模块或者这二者的组合。软件模块可能存在于RAM存储器、闪存、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、移动磁盘、CD-ROM或者本领域熟知的任何其他形式的存储媒质中。一种典型存储媒质与处理器耦合,从而使得处理器能够从该存储媒质中读信息,且可向该存储媒质写信息。在替换实例中,存储媒质是处理器的组成部分。处理器和存储媒质可能存在于一个ASIC中。该ASIC可能存在于一个用户站中。在一个替换实例中,处理器和存储媒质可以作为用户站中的分立组件存在。
根据所述公开的实施例,可以使得本领域技术人员能够实现或者使用本发明。对于本领域技术人员来说,这些实施例的各种修改是显而易见的,并且这里定义的总体原理也可以在不脱离本发明的范围和主旨的基础上应用于其他实施例。以上所述的实施例仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (21)

1.一种提取图像中的字符的方法,其特征在于,包括:
针对候选文本区域图像中同一行中的所有字符,建立候选分割点集合,该集合包括左分割点的集合和右分割点的集合;
以每个左分割点为基准,在一个估计区间内查找相应的右分割点,产生候选分割组;
对候选分割组进行文字识别;
根据候选分割组的位置,利用识别代价对候选分割组的识别结果进行过滤。
2.如权利要求1所述的方法,其特征在于,对于位置的重叠程度大于第一阈值θ1的相邻两个候选分割组,利用识别代价对候选分割组的识别结果进行过滤。
3.如权利要求2所述的方法,其特征在于,通过计算min{part1,part2}获得两个候选分割组的位置的重叠程度;
其中, part 1 = Overlap ( seg 1 , seg 2 ) width ( seg 1 ) , part 2 = Overlap ( seg 1 , seg 2 ) width ( seg 2 ) ;
Overlap(seg1,seg2)表示相邻两个候选分割组seg1和seg2重叠部分的宽度,width(seg1)和width(seg2)分别表示候选分割组seg1和seg2的宽度。
4.如权利要求3所述的方法,其特征在于,如果max{part1,part2}>θ2且|width(seg1)-width(seg2)|>θ3,则保留宽度更接近字符估计宽度的候选分割组的识别结果;否则,保留识别代价较小的候选分割组的识别结果;
其中,θ2是第二阈值,θ3是第三阈值。
5.如权利要求4所述的方法,其特征在于,按下式计算候选分割组segi的识别代价CST(segi):
CST ( seg i ) = α × mD ( seg i ) + β × 1 coh ( seg i ) ; 其中,
mD(segi)=min{dist(s0,s1),dist(s0,s2),......,dist(s0,sN)};
coh ( seg i ) = Σ j = 1 N prob ( j ) 2 ;
prob ( j ) = dist ( s 0 , s j ) Σ k = 1 N dist ( s 0 , s k ) ;
α、β为加权系数;s0表示未知字符的正确识别结果;sj表示未知字符的实际识别结果,dist(s0,sj)表示sj到s0的距离。
6.如权利要求1至5任一项所述的方法,其特征在于,所述左分割点集合由第一类左分割点和第二类左分割点构成;所述右分割点集合由第一类右分割点和第二类右分割点构成。
7.如权利要求6所述的方法,其特征在于,以二值图像的垂直投影的左、右边界作为第一类左、右分割点。
8.如权利要求7所述的方法,其特征在于,对二值图像中的连通域进行标定、合并,以每个合并后的连通域的左、右边界作为第二类左、右分割点。
9.如权利要求1至5任一项所述的方法,其特征在于,以左分割点为基准,在距离左分割点[a1×W,a2×W]的范围内查找相应的右分割点;
其中,W为字符估计宽度,a1、a2为加权系数。
10.如权利要求9所述的方法,其特征在于,
a、每个左分割点和设定区间内的每一个右分割点组成一个候选分割;
b、对所有候选分割的宽度进行直方图统计;
c、在所有的统计值中选取最大的值所对应的宽度;
d、以所述宽度作为字符估计宽度。
11.如权利要求10所述的方法,其特征在于,在步骤c、d之间进一步包括:
e、判断的值是否处于设定范围内;
如果是,则执行步骤d;
如果不是,则将所述最大的统计值置零并丢弃k0,转步骤c;
其中,k0表示最大的统计值所对应的宽度,H′表示字符高度的估计值。
12.一种提取图像中的字符的装置,其特征在于,包括:
第一单元,用于针对候选文本区域图像中同一行中的所有字符,建立候选分割点集合;其中,该集合包括左分割点的集合和右分割点的集合;
第二单元,用于以每个左分割点为基准,在一个估计区间内查找相应的右分割点,产生候选分割组;
字符识别单元,用于对候选分割组进行文字识别;和
第三单元,用于根据候选分割组的位置,利用识别代价对候选分割组的识别结果进行过滤。
13.如权利要求12所述的装置,其特征在于,第三单元对于位置的重叠程度大于第一阈值的相邻两个候选分割组,利用识别代价对候选分割组的识别结果进行过滤。
14.如权利要求13所述的装置,其特征在于,第三单元通过计算min{part1,part2}获得两个候选分割组的位置的重叠程度;
其中, part 1 = Overlap ( seg 1 , seg 2 ) width ( seg 1 ) , part 2 = Overlap ( seg 1 , seg 2 ) width ( seg 2 ) ;
Overlap(seg1,seg2)表示相邻两个候选分割组seg1和seg2重叠部分的宽度,width(seg1)和width(seg2)分别表示候选分割组seg1和seg2的宽度。
15.如权利要求14所述的装置,其特征在于,如果max{part1,part2}>θ2且|width(seg1)-width(seg2)|>θ3,则保留宽度更接近字符估计宽度的候选分割组的识别结果;否则,保留识别代价较小的候选分割组的识别结果;
其中,θ2是第二阈值,θ3是第三阈值。
16.如权利要求15所述的装置,其特征在于,按下式计算候选分割组segi的识别代价CST(segi):
CST ( seg i ) = α × mD ( seg i ) + β × 1 coh ( seg i ) ; 其中,
mD(segi)=min{dist(s0,s1),dist(s0,s2),......,dist(s0,sN)};
coh ( seg i ) = Σ j = 1 N prob ( j ) 2 ;
prob ( j ) = dist ( s 0 , s j ) Σ k = 1 N dist ( s 0 , s k ) ;
α、β为加权系数;s0表示未知字符的正确识别结果;sj表示未知字符的实际识别结果,dist(s0,sj)表示sj到s0的距离。
17.如权利要求12至16任一项所述的装置,其特征在于,所述左分割点集合由第一类左分割点和第二类左分割点构成;所述右分割点集合由第一类右分割点和第二类右分割点构成。
18.如权利要求17所述的装置,其特征在于,第一单元以二值图像的垂直投影的左、右边界作为第一类左、右分割点。
19.如权利要求18所述的装置,其特征在于,第一单元以二值图像中每个合并后的连通域的左、右边界作为第二类左、右分割点。
20.如权利要求12至16任一项所述的装置,其特征在于,第二单元以左分割点为基准,在距离左分割点[a1×W,a2×W]的范围内查找相应的右分割点;
其中,W为字符估计宽度,a1、a2为加权系数。
21.如权利要求20所述的装置,其特征在于,
每个左分割点和设定区间内的每一个右分割点组成一个候选分割;
对所有候选分割的宽度进行直方图统计;
确定出现次数最多的字符宽度;
以所述字符宽度作为字符估计宽度。
CN200810246654A 2008-12-31 2008-12-31 字符提取方法和装置 Pending CN101770576A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN200810246654A CN101770576A (zh) 2008-12-31 2008-12-31 字符提取方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN200810246654A CN101770576A (zh) 2008-12-31 2008-12-31 字符提取方法和装置

Publications (1)

Publication Number Publication Date
CN101770576A true CN101770576A (zh) 2010-07-07

Family

ID=42503428

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200810246654A Pending CN101770576A (zh) 2008-12-31 2008-12-31 字符提取方法和装置

Country Status (1)

Country Link
CN (1) CN101770576A (zh)

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102915440A (zh) * 2011-08-03 2013-02-06 汉王科技股份有限公司 一种字符切分的方法及装置
CN103577818A (zh) * 2012-08-07 2014-02-12 北京百度网讯科技有限公司 一种图像文字识别的方法和装置
CN104715233A (zh) * 2014-12-30 2015-06-17 上海孩子国科教设备有限公司 字符转换的方法及系统
CN104715497A (zh) * 2014-12-30 2015-06-17 上海孩子国科教设备有限公司 数据替换的方法及系统
CN106255979A (zh) * 2014-04-16 2016-12-21 工业研究与信息服务处 行分割方法
WO2017020723A1 (zh) * 2015-08-04 2017-02-09 阿里巴巴集团控股有限公司 一种字符分割方法、装置及电子设备
CN107067005A (zh) * 2017-04-10 2017-08-18 深圳爱拼信息科技有限公司 一种中英混合ocr字符切割的方法及装置
CN107341429A (zh) * 2016-04-28 2017-11-10 富士通株式会社 手写粘连字符串的切分方法、切分装置和电子设备
CN108108734A (zh) * 2016-11-24 2018-06-01 杭州海康威视数字技术股份有限公司 一种车牌识别方法及装置
CN108805128A (zh) * 2017-05-05 2018-11-13 北京京东金融科技控股有限公司 一种字符分割方法和装置
CN108960239A (zh) * 2018-07-10 2018-12-07 武汉科技大学 一种基于图像处理的激光蚀刻金属雷管编码字符分割方法
CN109389150A (zh) * 2018-08-28 2019-02-26 东软集团股份有限公司 图像一致性比对方法、装置、存储介质及电子设备
WO2019085971A1 (zh) * 2017-11-03 2019-05-09 腾讯科技(深圳)有限公司 图像中定位文本的方法、装置、电子设备和存储介质
CN111709464A (zh) * 2020-06-02 2020-09-25 中科九度(北京)空间信息技术有限责任公司 基于数据字典配置和印章图像识别技术的系统及筛选方法
CN114219946A (zh) * 2021-12-29 2022-03-22 北京百度网讯科技有限公司 文本图像的二值化方法及装置、电子设备和介质
CN114445819A (zh) * 2020-10-19 2022-05-06 武汉斗鱼网络科技有限公司 一种字符过滤处理方法、系统、电子设备及存储介质

Cited By (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102915440A (zh) * 2011-08-03 2013-02-06 汉王科技股份有限公司 一种字符切分的方法及装置
CN103577818B (zh) * 2012-08-07 2018-09-04 北京百度网讯科技有限公司 一种图像文字识别的方法和装置
CN103577818A (zh) * 2012-08-07 2014-02-12 北京百度网讯科技有限公司 一种图像文字识别的方法和装置
CN106255979A (zh) * 2014-04-16 2016-12-21 工业研究与信息服务处 行分割方法
CN106255979B (zh) * 2014-04-16 2019-07-12 工业研究与信息服务处 行分割方法
CN104715497A (zh) * 2014-12-30 2015-06-17 上海孩子国科教设备有限公司 数据替换的方法及系统
CN104715233A (zh) * 2014-12-30 2015-06-17 上海孩子国科教设备有限公司 字符转换的方法及系统
WO2017020723A1 (zh) * 2015-08-04 2017-02-09 阿里巴巴集团控股有限公司 一种字符分割方法、装置及电子设备
CN106446896A (zh) * 2015-08-04 2017-02-22 阿里巴巴集团控股有限公司 一种字符分割方法、装置及电子设备
CN106446896B (zh) * 2015-08-04 2020-02-18 阿里巴巴集团控股有限公司 一种字符分割方法、装置及电子设备
US10552705B2 (en) 2015-08-04 2020-02-04 Alibaba Group Holding Limited Character segmentation method, apparatus and electronic device
CN107341429A (zh) * 2016-04-28 2017-11-10 富士通株式会社 手写粘连字符串的切分方法、切分装置和电子设备
CN108108734B (zh) * 2016-11-24 2021-09-24 杭州海康威视数字技术股份有限公司 一种车牌识别方法及装置
CN108108734A (zh) * 2016-11-24 2018-06-01 杭州海康威视数字技术股份有限公司 一种车牌识别方法及装置
CN107067005A (zh) * 2017-04-10 2017-08-18 深圳爱拼信息科技有限公司 一种中英混合ocr字符切割的方法及装置
CN108805128B (zh) * 2017-05-05 2023-11-07 京东科技控股股份有限公司 一种字符分割方法和装置
CN108805128A (zh) * 2017-05-05 2018-11-13 北京京东金融科技控股有限公司 一种字符分割方法和装置
WO2019085971A1 (zh) * 2017-11-03 2019-05-09 腾讯科技(深圳)有限公司 图像中定位文本的方法、装置、电子设备和存储介质
US11087168B2 (en) 2017-11-03 2021-08-10 Tencent Technology (Shenzhen) Company Ltd Method and apparatus for positioning text over image, electronic apparatus, and storage medium
CN108960239A (zh) * 2018-07-10 2018-12-07 武汉科技大学 一种基于图像处理的激光蚀刻金属雷管编码字符分割方法
CN108960239B (zh) * 2018-07-10 2021-02-19 武汉科技大学 一种基于图像处理的激光蚀刻金属雷管编码字符分割方法
CN109389150A (zh) * 2018-08-28 2019-02-26 东软集团股份有限公司 图像一致性比对方法、装置、存储介质及电子设备
CN111709464A (zh) * 2020-06-02 2020-09-25 中科九度(北京)空间信息技术有限责任公司 基于数据字典配置和印章图像识别技术的系统及筛选方法
CN111709464B (zh) * 2020-06-02 2023-06-20 中科九度(北京)空间信息技术有限责任公司 基于数据字典配置和印章图像识别技术的系统及筛选方法
CN114445819A (zh) * 2020-10-19 2022-05-06 武汉斗鱼网络科技有限公司 一种字符过滤处理方法、系统、电子设备及存储介质
CN114219946A (zh) * 2021-12-29 2022-03-22 北京百度网讯科技有限公司 文本图像的二值化方法及装置、电子设备和介质

Similar Documents

Publication Publication Date Title
CN101770576A (zh) 字符提取方法和装置
CN110443128B (zh) 一种基于surf特征点精确匹配的指静脉识别方法
US9971929B2 (en) Fingerprint classification system and method using regular expression machines
Li et al. SAR image change detection using PCANet guided by saliency detection
Wang et al. iVAT and aVAT: enhanced visual analysis for cluster tendency assessment
WO2018019194A1 (zh) 图像识别方法、终端及非易失性存储介质
TWI435234B (zh) Plant disease identification method, system and record media
Gatos et al. ICFHR 2010 handwriting segmentation contest
JP2021180309A (ja) 深層学習に基づく2次元pcb外観欠陥のリアルタイム自動検出方法
CN102426649A (zh) 一种简单的高准确率的钢印数字自动识别方法
CN111583180B (zh) 一种图像的篡改识别方法、装置、计算机设备及存储介质
CN109410238A (zh) 一种基于PointNet++网络的枸杞识别计数方法
CN106557740A (zh) 一种遥感图像中油库目标的识别方法
CN113936181B (zh) 一种粘连手写英文字符的识别方法
Zhu et al. River channel extraction from SAR images by combining gray and morphological features
CN113781391A (zh) 图像缺陷检测方法以及相关设备
CN111753775B (zh) 鱼的生长评估方法、装置、设备及存储介质
CN114820625A (zh) 一种汽车顶块缺陷检测方法
Lee et al. Adaptive local binarization method for recognition of vehicle license plates
Liu et al. Splicing forgery exposure in digital image by detecting noise discrepancies
CN111723852A (zh) 针对目标检测网络的鲁棒训练方法
CN109544614B (zh) 一种基于图像低频信息相似度的匹配图像对识别的方法
CN108520252B (zh) 基于广义霍夫变换和小波变换的路标识别方法
CN112560856B (zh) 车牌检测识别方法、装置、设备及存储介质
CN117237371A (zh) 基于实例感知扩散模型的结肠组织学图像腺体分割方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20100707