CN101957919A - 基于图像局部特征检索的文字识别方法 - Google Patents
基于图像局部特征检索的文字识别方法 Download PDFInfo
- Publication number
- CN101957919A CN101957919A CN 201010289545 CN201010289545A CN101957919A CN 101957919 A CN101957919 A CN 101957919A CN 201010289545 CN201010289545 CN 201010289545 CN 201010289545 A CN201010289545 A CN 201010289545A CN 101957919 A CN101957919 A CN 101957919A
- Authority
- CN
- China
- Prior art keywords
- subwindow
- character
- individual character
- local feature
- recognition method
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Character Discrimination (AREA)
Abstract
一种图像处理技术领域的基于图像局部特征检索的文字识别方法,首先建立汉字模板图库并提取其中每个汉字所对应图片的特征值作为特征匹配库;然后计算待识别汉字所对应图片的特征值,与特征匹配库进行特征点匹配,得到局部特征点坐标;再对待识别汉字所对应图片进行单字子窗口提取;最后构建识别最大堆并进行单字子窗口识别和合并处理,实现文字识别。本发明利用文字关键区域的局部特征来描述文字,并利用检索技术来实现复杂背景和自然拍摄的图片文字的识别。
Description
技术领域
本发明涉及的是一种图像处理技术领域的方法,具体是一种基于图像局部特征检索的文字识别方法。
背景技术
图像文字识别在许多领域有着广泛的需求,例如书本/CD封面识别、车牌识别、图像和视频搜索引擎和网络数据挖掘等。而针对复杂背景和自然拍摄的图像文字的识别,由于该类图像背景复杂,包括多样的语种、字体、字符大小、位置、排列、字形,加之自然拍摄图像中存在的光度不均、视角变换、几何变形、噪声干扰等,使得文本分析和识别面临着极大的困难。
传统的方法一般包括了文本定位、预处理(一般包括归一化、增强、二值化)和OCR文字识别这些步骤。其中的每一步都涉及了许多其它的复杂方法,每一步方法都将影响了最终识别结果的准确性。Chen的论文《Automatic detection and recognition of signs from naturalscenes(自然场景信号的自动检测和识别)》提出了一种从自然场景的图像中检测和识别信号的方法。其中利用LoG(Laplacian of Gaussian,高斯拉普拉斯)边缘检测、颜色建模、版面分析和仿射校来检测文本,然后对文本进行归一化处理,最后用基于灰度的OCR进行文本识别。Koga的论文《Camera-based Kanji OCR for mobile-phones:practical issues(用于手机实际使用的基于相机的汉字OCR)》针对手机提出了一种基于相机的汉字识别方法。该方法的第一部分包括了四个步骤:预二值化、粗略的版面分析、行方向检测、行分割。而后一部分也包括了四个步骤:精细二值化、预分割、汉字识别和后处理。由于这类基于OCR方法,其识别的准确率与文本定位、以及增强后的图像质量有着密切的关系。
由于对噪声、复杂背景和许多种几何变形、光度变换的鲁棒性,局部特征被成功运用到了计算机视觉的诸多领域之中,诸如图像匹配、物体识别、图像检索、建筑全景图和视频数据挖掘等。因此局部特征也可以被运用到文字识别中来。
经过对现有技术的检索发现,Campos的论文《Character recognition in natural images(自然图像中的文字识别)》利用局部特征和BoW(bag ofvisual words,视觉字)的模型来识别英语和印度单个字母。在陈凯的《基于SIFT特征与灰度差值直方图特征的文字识别方法》专利中,提出了新的局部特征来识别文字。该方法利用SIFT特征和灰度差值直方图特征来对图片中分割的文字进行描述,然后和模板库中的特征进行匹配,选择最接近的作为识别结果。这些方法都是针对分割之后的单字进行识别,需要文字定位和分割,无法直接运用到复杂背景和自然拍摄的图像中。
发明内容
本发明针对现有技术存在的上述不足,提供一种基于图像局部特征检索的文字识别方法,利用文字关键区域的局部特征来描述文字,并利用检索技术来实现复杂背景和自然拍摄的图片文字的识别。
本发明是通过以下技术方案实现的,本发明包括以下步骤:
第一步、建立汉字模板图库并提取其中每个汉字所对应图片的特征值作为特征匹配库;
所述的提取是指:采用尺度不变特征变换算法提取特征值。
所述的特征值包括特征点的位置信息、临域尺度信息、主方向信息,以及SIFT特征点的128维向量。
第二步、计算待识别汉字所对应图片的特征值,与特征匹配库进行特征点匹配,得到局部特征点坐标。
所述的特征点匹配是指:采用MPLSH(Multi-Probe Local Sensitive Hashing)多指针区域敏感哈希算法来进行快速的特征匹配。
第三步、对待识别汉字所对应图片进行单字子窗口提取;
所述的单字子窗口是指:图片中的一个正方形的区域,区域中包括了匹配所用的局部特征点;
所述的单字子窗口提取是指:统计待识别汉字所对应图片的局部特征点的位置的范围和临域尺度的范围,并根据临域尺度的范围计算出单字子窗口尺寸的范围。
第四步、构建识别最大堆并进行单字子窗口识别和合并处理,实现文字识别。
所述的构建识别最大堆是指:统计所有单字子窗口中匹配的特征点的个数,将个数小于阈值的单字子窗口删除,将剩余的单字子窗口组成一个识别最大堆,每次从堆中选择点数最多的单字子窗口进行识别,当该单字子窗口中识别出了文字则删除该文字上匹配的特征点并重新统计相关单字子窗口中特征点的个数,同时删除点数小于阈值的单字子窗口;否则直接删除该单字子窗口并重新进行构建,直至识别最大堆中不存在单字子窗口为止。
所述的单字子窗口识别是指:统计单字子窗口中与每个模板字匹配上点的个数,然后通过几何校验筛选掉不符合几何约束的特征点匹配对,最终得到一个特征点一一对应的匹配关系,当单字子窗口识别出了汉字,根据几何校验后匹配的点对,得到单字子窗口文字和模板图片的映射变换关系,从而得到单字子窗口文字的实际区域;
所述的合并是指:基于单字子窗口识别处理后得到的同一区域会提取出许多不同的单字子窗口,对于两个重叠面积大于较小文字面积一半的两个文字进行合并。
与现有技术相比,本发明的有益效果在于:利用了局部特征来提取图像信息的鲁棒性,从而解决了光度不均、视角变换、几何变形、噪声干扰等文字图像识别上的问题。同时,本发明也改进了图像检索技术,利用全新的单字子窗口提取和筛选方法以及投票方法,解决了复杂背景和多语种、字体、字符大小、位置、排列不同的场景下图像文字识别的问题。同时本方法也省去了传统基于OCR方法的所需要的大量的文本定位和预处理的工作,也无需做离线的文字特征的机器学习的工作,提高了识别的效率和精度。
附图说明
图1是本发明的流程图。
图2是模板图片的例图。
图3是投票和几何校验的例图。
图4是复杂背景图片的识别例图。
具体实施方式
下面对本发明的实施例作详细说明,本实施例在以本发明技术方案为前提下进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。
如图1所示,本实施例包括以下步骤:
1.建立汉字模板图库。模板图库有多种字体组成,每个字体的每种文字包括了黑底白字和白底黑字两个模板字。每个字都是一张单独的图片。模板图片都是不包括任何光度变换和几何变换、噪声的机器生成图片。图2(a)是模板图片的样例。黑底白字的模板是用来识别文字颜色浅于背景颜色的文字图片,白底黑字则用来识别文字颜色深于背景颜色的文字图片。没有背景、光度变换和几何变换可以保证在下一步的局部特征中,不会在非文字区域产生误匹配。
2.提取模板图片局部特征,建立模板特征数据库。在计算机视觉中,局部特征以其良好的几何不变性和光度不变性被广泛运用在图像特征提取和匹配上。本实施例在实现中采用了SIFT(Scale Invariant Feature Transform,尺度不变特征变换)提取特征。
3.提取待识别图片的局部特征,局部特征的选择与步骤2中相同。
4.局部特征匹配。由于模板特征库数据量巨大,本实施例在实现中采用MPLSH(Multi-Probe Local Sensitive Hashing)来进行快速的特征匹配。图2(b)是待匹配图片与模板图片的匹配效果。每条连线代表了一对匹配的点对。因为文字的局部相似性,该步仍然会产生许多误匹配的发生,图3(a)就是误匹配的例图。
5.对待识别图片进行单字子窗口的提取。单字子窗口是一个正方形的区域,区域中包括了匹配所用的局部特征点。可以用哈希表的形式来保存图片中的局部特征,这样可以方便地根据单字子窗口的位置来检索其中的局部特征。图4b是图4(a)中提取的单字子窗口,黄色的箭头表示其中的特征点。提取单字识别窗口的步骤包括:
5.1统计待匹配图片上匹配上的特征点的位置的范围和临域尺度的范围,包括最大横坐标Xmax、最小横坐标Xmin、最大纵坐标Ymax、最小纵坐标Ymin、最大尺度Smax和最小尺度Smin。
5.2根据临域尺度的范围计算出单字子窗口尺寸的范围,单字子窗口是正方形,最大单字子窗口边长Wmax=Smaxk,最小单字子窗口边长Wmin=Smink。单字子窗口的尺寸从Wmin开始,以系数Δl为倍数增加。对于每个尺寸,在特征点位置范围之内,沿着x和y方向上每隔WΔd取一个单字子窗口。对于边长是W的单字子窗口,只保留其窗口内临域尺度在(W/k,WΔs/k)范围之内的特征点。单字子窗口的大小最大不能超过Wmax。k是单字子窗口系数,Δl是增长系数,Δd是移动系数,Δs是尺度范围系数。
6.统计所有单字子窗口中匹配的特征点的个数。个数小于阈值t的单字子窗口被删除。剩余的单字子窗口组成一个最大堆。每次从堆中选择点数最多的单字子窗口,识别该单字子窗口。如果该单字子窗口中识别出了文字,删除该文字上匹配的特征点,重新统计相关单字子窗口中特征点的个数,删除那些点数小于阈值t的单字子窗口。否则,直接删除该单字子窗口。这样反复识别,直到堆中不存在单字子窗口为止。以下是单字子窗口识别方法的步骤:
6.1投票:统计单字子窗口中与每个模板字匹配上点的个数。假设字C匹配上的点数是Ca。统计每个模板字与单字子窗口匹配上点的个数。假设字C匹配上的点数是Cb。对于模板字,最终的投票结果是Ca和Cb的最小值Cn。对Cn进行从大到小的排序,取前N个字为候选字。图4(b)是投票之后的匹配结果,可以看到仍然有误匹配的存在。
6.2几何校验:通过几何校验可以筛选掉那些不符合几何约束的特征点匹配对,最终得到一个特征点一一对应的匹配关系。假设此时字C匹配上的点数是Cg。对Cg进行从大到小的排序,排在最前面的字就是最终识别的字。如果识别出的字的Cg小于阈值t(同权利要求1),则认为该识别无效,该单字子窗口没有识别出汉字。图4(c)是几何校验之后的匹配结果,可以看到对于字形不同的字,已经不存在误匹配了。
6.3如果单字子窗口识别出了汉字,根据几何校验后匹配的点对,得到单字子窗口文字和模板图片的映射变换关系,从而得到单字子窗口文字的实际区域,这个区域可以是一个矩形。
7.后处理,合并重叠的文字。由于在同一区域会提取出许多不同的单字子窗口,因此也会存在在同一区域识别出许多文字的情况。对于两个重叠面积大于较小文字面积一半的两个文字,进行合并。比较两个文字匹配的特征点的个数,保留特征点个数较多的文字,删除另一个文字。
本实施实例利用了局部特征检索的方法识别复杂背景和自然拍摄的图片中的文字,并加上了我们提出的投票和单字子窗口提取和筛选方法,实验结果表明大大提高了识别的效率和精度。
Claims (9)
1.一种基于图像局部特征检索的文字识别方法,其特征在于,包括以下步骤:
第一步、建立汉字模板图库并提取其中每个汉字所对应图片的特征值作为特征匹配库;
第二步、计算待识别汉字所对应图片的特征值,与特征匹配库进行特征点匹配,得到局部特征点坐标;
第三步、对待识别汉字所对应图片进行单字子窗口提取;
第四步、构建识别最大堆并进行单字子窗口识别和合并处理,实现文字识别。
2.根据权利要求1所述的基于图像局部特征检索的文字识别方法,其特征是,所述的提取是指:采用尺度不变特征变换算法提取特征值。
3.根据权利要求1所述的基于图像局部特征检索的文字识别方法,其特征是,所述的特征值包括特征点的位置信息、临域尺度信息、主方向信息,以及SIFT特征点的128维向量。
4.根据权利要求1所述的基于图像局部特征检索的文字识别方法,其特征是,所述的特征点匹配是指:采用多指针区域敏感哈希算法来进行快速的特征匹配。
5.根据权利要求1所述的基于图像局部特征检索的文字识别方法,其特征是,所述的单字子窗口是指:图片中的一个正方形的区域,区域中包括了匹配所用的局部特征点。
6.根据权利要求1所述的基于图像局部特征检索的文字识别方法,其特征是,所述的单字子窗口提取是指:统计待识别汉字所对应图片的局部特征点的位置的范围和临域尺度的范围,并根据临域尺度的范围计算出单字子窗口尺寸的范围。
7.根据权利要求1所述的基于图像局部特征检索的文字识别方法,其特征是,所述的构建识别最大堆是指:统计所有单字子窗口中匹配的特征点的个数,将个数小于阈值的单字子窗口删除,将剩余的单字子窗口组成一个识别最大堆,每次从堆中选择点数最多的单字子窗口进行识别,当该单字子窗口中识别出了文字则删除该文字上匹配的特征点并重新统计相关单字子窗口中特征点的个数,同时删除点数小于阈值的单字子窗口;否则直接删除该单字子窗口并重新进行构建,直至识别最大堆中不存在单字子窗口为止。
8.根据权利要求1所述的基于图像局部特征检索的文字识别方法,其特征是,所述的单字子窗口识别是指:统计单字子窗口中与每个模板字匹配上点的个数,然后通过几何校验筛选掉不符合几何约束的特征点匹配对,最终得到一个特征点一一对应的匹配关系,当单字子窗口识别出了汉字,根据几何校验后匹配的点对,得到单字子窗口文字和模板图片的映射变换关系,从而得到单字子窗口文字的实际区域。
9.根据权利要求1所述的基于图像局部特征检索的文字识别方法,其特征是,所述的合并是指:基于单字子窗口识别处理后得到的同一区域会提取出许多不同的单字子窗口,对于两个重叠面积大于较小文字面积一半的两个文字进行合并。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201010289545A CN101957919B (zh) | 2010-09-22 | 2010-09-22 | 基于图像局部特征检索的文字识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201010289545A CN101957919B (zh) | 2010-09-22 | 2010-09-22 | 基于图像局部特征检索的文字识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101957919A true CN101957919A (zh) | 2011-01-26 |
CN101957919B CN101957919B (zh) | 2012-10-10 |
Family
ID=43485241
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201010289545A Expired - Fee Related CN101957919B (zh) | 2010-09-22 | 2010-09-22 | 基于图像局部特征检索的文字识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101957919B (zh) |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102779157A (zh) * | 2012-06-06 | 2012-11-14 | 北京京东世纪贸易有限公司 | 搜索图像的方法和装置 |
CN103500332A (zh) * | 2013-09-06 | 2014-01-08 | 优视科技有限公司 | 图片内文字显示方法及装置 |
CN104112151A (zh) * | 2013-04-18 | 2014-10-22 | 航天信息股份有限公司 | 卡片信息的验证方法和装置 |
CN105096244A (zh) * | 2015-07-02 | 2015-11-25 | 北京旷视科技有限公司 | 图像变换方法及其装置以及图像识别方法及其装置 |
CN105260733A (zh) * | 2015-09-11 | 2016-01-20 | 北京百度网讯科技有限公司 | 用于处理图像信息的方法和装置 |
CN106599940A (zh) * | 2016-11-25 | 2017-04-26 | 东软集团股份有限公司 | 图片文字的识别方法及装置 |
CN107909075A (zh) * | 2017-11-28 | 2018-04-13 | 上海电科智能系统股份有限公司 | 一种基于Laplacian扩展算子的车牌图像二值化方法 |
CN108021913A (zh) * | 2016-10-28 | 2018-05-11 | 北京嘀嘀无限科技发展有限公司 | 证件照片信息识别方法及装置 |
CN108491876A (zh) * | 2018-03-20 | 2018-09-04 | 西安电子科技大学 | 基于二次拟合光度变换的群体图像编码方法 |
CN109635808A (zh) * | 2018-11-01 | 2019-04-16 | 中国科学院信息工程研究所 | 一种在自然场景图像中对中文关键词及上下文的提取方法 |
CN109961553A (zh) * | 2017-12-26 | 2019-07-02 | 航天信息股份有限公司 | 发票号码识别方法、装置及税务自助终端系统 |
CN103294667B (zh) * | 2012-02-27 | 2019-07-16 | 深圳市腾讯计算机系统有限公司 | 通过水印进行同源图片追踪的方法及系统 |
CN110119733A (zh) * | 2019-05-15 | 2019-08-13 | 广东小天才科技有限公司 | 书页识别方法及装置、终端设备、计算机可读存储介质 |
CN110458170A (zh) * | 2019-08-06 | 2019-11-15 | 汕头大学 | 一种强噪声复杂背景图像中的汉字定位及识别方法 |
CN110580298A (zh) * | 2017-07-04 | 2019-12-17 | 艾朝君 | 一种汉字与华文繁体字的同步互通互识技术方法 |
CN112101324A (zh) * | 2020-11-18 | 2020-12-18 | 鹏城实验室 | 多视角图像共存文字检测方法、设备及计算机存储介质 |
CN116740374A (zh) * | 2022-10-31 | 2023-09-12 | 荣耀终端有限公司 | 重复纹理识别方法及装置 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106951893A (zh) * | 2017-05-08 | 2017-07-14 | 奇酷互联网络科技(深圳)有限公司 | 文字信息获取方法、装置及移动终端 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070269107A1 (en) * | 2006-03-31 | 2007-11-22 | Yoshiaki Iwai | Object Recognition Device, Object Recognition Method, Object Recognition Program, Feature Registration Device, Feature Registration Method, and Feature Registration Program |
CN101561866A (zh) * | 2009-05-27 | 2009-10-21 | 上海交通大学 | 基于sift特征与灰度差值直方图特征的文字识别方法 |
-
2010
- 2010-09-22 CN CN201010289545A patent/CN101957919B/zh not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070269107A1 (en) * | 2006-03-31 | 2007-11-22 | Yoshiaki Iwai | Object Recognition Device, Object Recognition Method, Object Recognition Program, Feature Registration Device, Feature Registration Method, and Feature Registration Program |
CN101561866A (zh) * | 2009-05-27 | 2009-10-21 | 上海交通大学 | 基于sift特征与灰度差值直方图特征的文字识别方法 |
Cited By (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103294667B (zh) * | 2012-02-27 | 2019-07-16 | 深圳市腾讯计算机系统有限公司 | 通过水印进行同源图片追踪的方法及系统 |
CN102779157B (zh) * | 2012-06-06 | 2015-05-06 | 北京京东世纪贸易有限公司 | 搜索图像的方法和装置 |
CN102779157A (zh) * | 2012-06-06 | 2012-11-14 | 北京京东世纪贸易有限公司 | 搜索图像的方法和装置 |
CN104112151A (zh) * | 2013-04-18 | 2014-10-22 | 航天信息股份有限公司 | 卡片信息的验证方法和装置 |
CN103500332B (zh) * | 2013-09-06 | 2017-03-15 | 优视科技有限公司 | 图片内文字显示方法及装置 |
CN103500332A (zh) * | 2013-09-06 | 2014-01-08 | 优视科技有限公司 | 图片内文字显示方法及装置 |
CN105096244B (zh) * | 2015-07-02 | 2019-02-22 | 北京旷视科技有限公司 | 图像变换方法及其装置以及图像识别方法及其装置 |
CN105096244A (zh) * | 2015-07-02 | 2015-11-25 | 北京旷视科技有限公司 | 图像变换方法及其装置以及图像识别方法及其装置 |
CN105260733A (zh) * | 2015-09-11 | 2016-01-20 | 北京百度网讯科技有限公司 | 用于处理图像信息的方法和装置 |
WO2017041365A1 (zh) * | 2015-09-11 | 2017-03-16 | 北京百度网讯科技有限公司 | 用于处理图像信息的方法和装置 |
US10303968B2 (en) | 2015-09-11 | 2019-05-28 | Beijing Baidu Netcom Science And Technology Co., Ltd. | Method and apparatus for image recognition |
CN108021913A (zh) * | 2016-10-28 | 2018-05-11 | 北京嘀嘀无限科技发展有限公司 | 证件照片信息识别方法及装置 |
CN106599940A (zh) * | 2016-11-25 | 2017-04-26 | 东软集团股份有限公司 | 图片文字的识别方法及装置 |
CN106599940B (zh) * | 2016-11-25 | 2020-04-17 | 东软集团股份有限公司 | 图片文字的识别方法及装置 |
CN110580298A (zh) * | 2017-07-04 | 2019-12-17 | 艾朝君 | 一种汉字与华文繁体字的同步互通互识技术方法 |
CN107909075A (zh) * | 2017-11-28 | 2018-04-13 | 上海电科智能系统股份有限公司 | 一种基于Laplacian扩展算子的车牌图像二值化方法 |
CN109961553A (zh) * | 2017-12-26 | 2019-07-02 | 航天信息股份有限公司 | 发票号码识别方法、装置及税务自助终端系统 |
CN108491876A (zh) * | 2018-03-20 | 2018-09-04 | 西安电子科技大学 | 基于二次拟合光度变换的群体图像编码方法 |
CN108491876B (zh) * | 2018-03-20 | 2021-10-29 | 西安电子科技大学 | 基于二次拟合光度变换的群体图像编码方法 |
CN109635808A (zh) * | 2018-11-01 | 2019-04-16 | 中国科学院信息工程研究所 | 一种在自然场景图像中对中文关键词及上下文的提取方法 |
CN109635808B (zh) * | 2018-11-01 | 2023-01-17 | 中国科学院信息工程研究所 | 一种在自然场景图像中对中文关键词及上下文的提取方法 |
CN110119733A (zh) * | 2019-05-15 | 2019-08-13 | 广东小天才科技有限公司 | 书页识别方法及装置、终端设备、计算机可读存储介质 |
CN110119733B (zh) * | 2019-05-15 | 2022-10-28 | 广东小天才科技有限公司 | 书页识别方法及装置、终端设备、计算机可读存储介质 |
CN110458170A (zh) * | 2019-08-06 | 2019-11-15 | 汕头大学 | 一种强噪声复杂背景图像中的汉字定位及识别方法 |
CN112101324B (zh) * | 2020-11-18 | 2021-03-16 | 鹏城实验室 | 多视角图像共存文字检测方法、设备及计算机存储介质 |
CN112101324A (zh) * | 2020-11-18 | 2020-12-18 | 鹏城实验室 | 多视角图像共存文字检测方法、设备及计算机存储介质 |
CN116740374A (zh) * | 2022-10-31 | 2023-09-12 | 荣耀终端有限公司 | 重复纹理识别方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN101957919B (zh) | 2012-10-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101957919B (zh) | 基于图像局部特征检索的文字识别方法 | |
Ye et al. | Text detection and recognition in imagery: A survey | |
Zhou et al. | Bangla/English script identification based on analysis of connected component profiles | |
CN101561866B (zh) | 基于sift特征与灰度差值直方图特征的文字识别方法 | |
CN104751142B (zh) | 一种基于笔划特征的自然场景文本检测方法 | |
CN101615251B (zh) | 字符识别设备中用于识别字符的方法和设备 | |
CN103577818A (zh) | 一种图像文字识别的方法和装置 | |
CN105468732A (zh) | 一种图像关键词检查方法及装置 | |
Li et al. | Recognizing planar symbols with severe perspective deformation | |
Karanje et al. | Survey on text detection, segmentation and recognition from a natural scene images | |
Jeong et al. | Multi language text detection using fast stroke width transform | |
Lue et al. | A novel character segmentation method for text images captured by cameras | |
CN101901344B (zh) | 基于腐蚀方法和DoG算子检测文字图像局部特征的方法 | |
Jain et al. | Visualdiff: Document image verification and change detection | |
Tsai et al. | Recognition of Vehicle License Plates from a Video Sequence. | |
Tran et al. | A novel approach for text detection in images using structural features | |
Huang et al. | A new video text extraction approach | |
Nakai et al. | A method of annotation extraction from paper documents using alignment based on local arrangements of feature points | |
Huang et al. | Scene character detection and recognition based on multiple hypotheses framework | |
Qiu et al. | A Post-processing method for text detection based on geometric features | |
CN112100630A (zh) | 一种针对保密文件的识别方法 | |
Ganesh et al. | Extraction of Text from Images of Big Data | |
Islam et al. | An Effective Method for the Recognition and Verification of Bangladeshi Vehicle Digital Number Plates | |
Kurdy et al. | Omnifont Arabic optical character recognition system | |
Padma et al. | Script identification of text words from a tri lingual document using voting technique |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20121010 Termination date: 20150922 |
|
EXPY | Termination of patent right or utility model |