CN1316418C - 门牌号自动识别系统及方法 - Google Patents

门牌号自动识别系统及方法 Download PDF

Info

Publication number
CN1316418C
CN1316418C CNB2004100348660A CN200410034866A CN1316418C CN 1316418 C CN1316418 C CN 1316418C CN B2004100348660 A CNB2004100348660 A CN B2004100348660A CN 200410034866 A CN200410034866 A CN 200410034866A CN 1316418 C CN1316418 C CN 1316418C
Authority
CN
China
Prior art keywords
character
classification
threshold value
identification
doorplate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB2004100348660A
Other languages
English (en)
Other versions
CN1684096A (zh
Inventor
易建强
洪义平
赵冬斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Automation of Chinese Academy of Science
Original Assignee
Institute of Automation of Chinese Academy of Science
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Automation of Chinese Academy of Science filed Critical Institute of Automation of Chinese Academy of Science
Priority to CNB2004100348660A priority Critical patent/CN1316418C/zh
Publication of CN1684096A publication Critical patent/CN1684096A/zh
Application granted granted Critical
Publication of CN1316418C publication Critical patent/CN1316418C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Character Discrimination (AREA)
  • Character Input (AREA)

Abstract

本发明涉及字符自动识别系统技术领域的门牌号自动识别系统及方法。系统由五部分组成:预处理、分割、特征提取、分类和后处理。方法包括:S1,由图象采集卡采集一帧灰度图象到内存;S2,根据门牌的形状大小先验知识确定门牌的位置,确定门牌上的字符区域;S3,用基于推测的方法确定每一个待识别字符候选区域位置和大小;S4,从第一个字符开始识别,选择一个阈值提取该字符并二值化、字符特征、进行字符分类;S5,如果分类被拒识,则重新选择一个阈值提取字符再分类;S6,如果分类没被拒识,则选择下一个字符进行识别;S7,输出识别结果。由于门牌号自动识别系统考虑了噪声的抑止,因此对于车牌字符识别及一些噪声环境下的字符识别也有参考价值。

Description

门牌号自动识别系统及方法
技术领域
本发明涉及字符自动识别系统技术领域,特别是一种门牌号自动识别系统及方法。
门牌号自动识别系统是噪声环境下的OCR(光学字符识别)技术在实际中的应用。正如汽车牌照的识别,字符的分割提取是整个系统的主要任务,字符分类则由于待识别的字符数较少而变得相对容易一些。因此,门牌号自动识别系统属于图象分割和字符识别技术的综合应用,在移动机器人的视觉导航中具有重要的实际价值。
背景技术
一般的字符自动识别系统包含以下几个阶段:预处理、字符分割、特征提取、字符分类和后处理。在无噪声环境下的字符识别过程中,预处理包括对原始图象的去噪、倾斜校正或各种滤波处理。字符分割是将大幅的图象先切割为行,再从图象行中分离出单个字符的过程。特征提取是整个环节中最重要的一环,它是从单个字符图象上提取统计特征或结构特征的过程,包括为此而做的细化(Thinning)、归一化(Normalization)等步骤。提取的特征的稳定性及有效性,直接决定了识别的性能。字符分类即从学习得到的特征库中找到与待识字符相似度最高的字符类的过程。然而在噪声环境下,字符难以提取,字符分割成为字符识别的重要一步。由于门牌号数字字符标记类别数较小,分类器的设计主要考虑的也是抗噪声能力。噪声环境下的门牌号码不能识别的主要原因是不能成功提取门牌号数字字符。所以噪声环境下的字符识别是一个图象分割和字符识别相结合的过程,如何提高噪声环境下字符提取的稳定性是门牌号自动识别系统的关键。
无噪声印刷体字符的自动识别早已相当成熟,但是在噪声环境下的字符识别的国内外研究主要在车牌识别、基于字符识别的机器人导航和一些工业检测中。已实用化的噪声环境下有限字符集识别的代表性例子是车牌自动识别系统。目前国内外已有一些具有车牌识别功能的系统,如德国西门子公司的ARTEM7S系统。移动机器人门牌号识别也是噪声环境下的有限集字符识别的一个例子。已有的一个比较好的门牌号识别系统(M.Tomono,and S.Yuta,“Mobile Robot Navigation in IndoorEnvironments using Object and Character Recognition,”Preceedingsof the 2000 IEEE International Conference on Robotics & Automation,2000,Vol.1,p313-320)实验结果显示,门的识别率是74%,成功提取门牌的概率是75%,门牌号数字字符的识别率是80%。以上试验结果还不能满足实际应用的需要。
另外,已有的噪声环境下的字符自动识别系统,还难以达到门牌号自动识别的以下一些要求:
允许门牌本身有一定程度的倾斜、扭曲,门牌在图像中的形状允许有一定的畸变。
Figure C20041003486600042
能将门牌汉字字符和数字字符区分开来。
Figure C20041003486600043
门牌号数字字符可能出现在图像中的任何位置,算法必须适应这种情况,不能对门牌号数字字符的出现位置提出要求。
Figure C20041003486600044
在门牌号数字字符出现一定程度的模糊、笔画断裂的情况下仍能够正确识别。
Figure C20041003486600045
算法必须适应外界光线强度和图像对比度的变化。
图象采集的角度可以是俯视或侧视。
Figure C20041003486600047
识别算法的速度要快,以满足实时性的要求。
发明内容
本发明的目的在于提供一种门牌号自动识别系统及方法。
门牌号自动识别系统就是能自动识别门牌号数字字符的系统,其主要任务之一是噪声的抑止。然而在噪声的干扰下,门牌图象的形状和亮度都是不稳定的。噪声对门牌号识别的影响主要表现在:一是经门牌提取处理后找不到门牌号数字字符区域;一是门牌号数字字符分割不够准确导致分类错误。噪声导致的图象预处理、门牌号数字字符分割和字符特征提取的误差最终将反映在分类置信度上。因此要有效地抑止噪声,就要建立一个能有效抑止噪声的门牌号自动识别系统,把预处理、分割、目标特征提取、匹配和分类看作一个整体。据此,我们通过字符位置推测和基于识别的分割方法,提出了图1所示的具有抗噪声能力的门牌号自动识别系统。
门牌号自动识别系统由五部分组成:预处理、分割、特征提取、分类和后处理。一般系统的输入为灰度图象,预处理用来确定输入的灰度图象中门牌号的字符区域。分割主要包含两部分:一是基于已知规则的字符候选区域推测;一是基于识别的字符分割。分割后如果字符出现倾斜,则先对字符进行校正归一化。分割阶段的输入是字符区域,输出是归一化的二值字符图象。然后对归一化后的字符提取特征,用分类器将字符样本分类到相应的模式类中。
本发明提出的门牌号自动识别系统主要采用了对噪声具有鲁棒性的数字字符分割方法:基于已知规则的字符区域推测和基于识别的字符分割方法。如图1所示,门牌号自动识别系统的预处理输出是一个只包含门牌号数字字符和背景的字符区域。然而在噪声条件下,预处理之后不一定能提取到准确的数字字符区域,或者在数字字符区域提取之后不一定能在同一个全局阈值下提取到所有的数字字符候选区域,这就需要通过已提取的数字字符候选区域推测未能提取的数字字符候选区域,以提高系统的抗噪声能力。通常,门牌号数字字符的个数已知,在门牌上的相对位置也是固定的,因此在分割出一个或者数个数字字符之后就可以推测出其他数字字符的大概位置。
假设所有的字符候选区域都已确定,那么接着就需要在每一候选区域内找到一个合适的阈值来提取相应的数字字符。根据字符与背景的像素灰度值,设定一个初始阈值。在噪声影响不大的情况下,通过初始阈值可以将各个数字字符提取出来。但如果噪声比较大,那么通过初始阈值并不能正确提取出各个字符。对此,我们提出的识别系统采用了基于识别的分割的方法,即将分类结果反馈回分割,用分类结果来指导选择阈值,并重新进行字符的提取,提高系统的鲁棒性。
特征提取和分类策略也是抑止噪声的有效环节,在识别系统中,采用了基于多分类器融合的方法。设计每个分类器所用的数据都来自实际的门牌图象,而拒识阈值是通过实验确定的,使门牌识别系统能较好地接近实际使用条件。反馈环节的反馈次数则根据门牌识别系统的计算时间代价和对识别结果的改善情况得出的。
综上所述,与其他噪声环境下的字符识别研究相比,本发明提出的门牌号自动识别系统具有以下不同之处:
●采用了基于已知规则推测未知字符候选区域的方法,提高了门牌号自动识别系统的抗噪声能力。
●采用了基于识别的字符分割方法,用分类结果来指导字符候选区域内的阈值选取,使系统在不同光照条件下仍具有较好的识别准确性。
●用实际图象采集的带有噪声的数据来设计分类器,根据计算时间代价和识别效果的改善情况来确定反馈次数,使整个门牌号自动识别系统接近实际使用条件,具有很好的实用价值。
附图说明
图1是本发明的门牌号自动识别系统图。
图2为本发明的门牌号识别系统中的预处理图。
图3为本发明的数字字符候选区域推测示意图。
图4是本发明的门牌号自动识别方法流程图。
具体实施方式
门牌号自动识别系统框图如图1所示。整个系统由五部分组成:预处理、分割、特征提取、分类和后处理。
首先,由图象采集卡采集一帧灰度图象到内存。在不同光照、成像角度和成像距离下,采集到的门牌图象亮度会相差很多,门牌的部分区域会由于光照的干扰而变得很亮,这就对处理提出了较高的要求。在本发明提出的识别系统中,门牌的提取采用了基于边缘检测的图象分解与融合的方法。首先用Sobel算子提取出门牌边缘,然后用4×4的模板对边缘二值图象进行分解,在分解后的图象中确定门牌的位置,采用边缘融合的方法得到门牌的位置。之后,根据门牌的形状尺寸确定门牌号数字码字符区域的大概位置,滤除干扰对象,通过区域分割的方法提取门牌号数字字符区域。门牌号数字字符区域就是图1中的预处理的输出。
图2显示了一例预处理结果。首先确定门牌的位置,然后确定预选字符区域的位置,最后找出数字字符区域。
在预处理之后,需要找到每个数字字符的候选区域并提取每个候选区域内的数字字符,这就是门牌号自动识别系统中的分割,也是本发明的主要贡献之处。字符区域一般包括所有的待识别数字字符,如果部分数字字符由于光照等原因不能提取的或者不在字符区域内,就根据已知的规则进行推测,确定出所有数字字符的候选区域。
当门牌号码由3个数字字符组成时,其推测过程如图3所示。门牌号码由3个数字字符组成。当只有一个数字字符的候选区域已得到时,需要推测其他两个数字字符的候选区域,如图3(a),(b),(c)。当两个数字字符的候选区域已得到时,则只要推测另外一个数字字符的候选区域即可,如图3(e),(d),(f)。如果存在某些字符候选区域不能确定的,就对这一副门牌图象拒识。如果所有的字符候选区域都已确定,就继续进行下一步操作——基于识别的分割。首先对候选区域采用默认的阈值提取数字字符。如果提取的数字字符经分类后不被拒识,则这个数字字符的识别就算完成。如果提取的数字字符被拒识,则反馈回分割,改变候选区域内的阈值重新提取数字字符,再进行识别。在经过以上处理之后,就可以得到一个最终的识别结果。
图4的门牌号自动识别方法流程图。其具体步骤包括:
步骤S1:由图象采集卡采集一帧灰度图象到内存,用Sobel算子对图象进行边缘提取;
步骤S2:根据门牌的形状大小等先验知识确定门牌的位置,并进一步确定门牌上的字符区域;
步骤S3:用基于推测的方法确定出每一个待识别字符候选区域的位置和大小;
步骤S4:从第一个字符开始识别,选择一个阈值提取该字符并二值化,然后提取字符特征、进行字符分类;
步骤S5:如果分类结果被拒识,但阈值的选择次数不超过给定次数时,则重新选择一个阈值提取字符再分类;
步骤S6:如果分类结果没被拒识,或者被拒识且阈值的选择次数超过给定次数,但尚有其他字符需要识别时,则选择下一个字符进行识别,直到所有字符识别完毕;
步骤S7:最后输出识别结果。
本发明的特点与效果有:
1)具有较好的抗噪声能力。由于引入了两个反馈环节,使得一些在噪声条件下不能提取的数字字符能通过推测而得到,一些可能被错误地拒识的数字字符能够被正确的识别出来。本发明中的门牌号自动识别系统是针对实际应用环境设计的,在门牌图象出现一定的倾斜、模糊、不同的成像距离下也能识别出来。它的抗噪声能力使得该系统具有有效的实际应用价值,我们已经把它用于移动机器人的视觉导航之中。
2)具有较好的实时性。我们对整个系统用软件实现,在VC环境下进行了实验,实验表明该系统虽然引入了反馈环节,但完全能满足实时性的要求。
3)本发明提出的门牌号自动识别系统具有可推广性。由于门牌号识别识别系统主要考虑了噪声的抑止,因此对于车牌字符识别及其他一些噪声环境下的字符识别也有参考价值。

Claims (2)

1、一种门牌号自动识别系统,其特征在于,由五部分组成:预处理、分割、特征提取、分类和后处理,其连接关系为预处理、分割、特征提取、分类和后处理,五个部分依次串联连接,分类部分反馈回分割部分,分割部分自反馈。
2、一种门牌号自动识别方法,其具体步骤如下:
步骤S1,由图象采集卡采集一帧灰度图象到内存,用Sobel算子对图象进行边缘提取;
步骤S2,根据门牌的形状大小先验知识确定门牌的位置,并进一步确定门牌上的字符区域;
步骤S3,用基于推测的方法确定出每一个待识别字符候选区域的位置和大小;
步骤S4,从第一个字符开始识别,选择一个阈值提取该字符并二值化,然后提取字符特征、进行字符分类;
步骤S5,如果分类结果被拒识,但阈值的选择次数不超过给定次数时,则重新选择一个阈值提取字符再分类;
步骤S6,如果分类结果没被拒识,或者被拒识且阈值的选择次数超过给定次数,但尚有其他字符需要识别时,则选择下一个字符进行识别,直到所有字符识别完毕;
步骤S7,最后输出识别结果。
CNB2004100348660A 2004-04-16 2004-04-16 门牌号自动识别系统及方法 Expired - Fee Related CN1316418C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB2004100348660A CN1316418C (zh) 2004-04-16 2004-04-16 门牌号自动识别系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB2004100348660A CN1316418C (zh) 2004-04-16 2004-04-16 门牌号自动识别系统及方法

Publications (2)

Publication Number Publication Date
CN1684096A CN1684096A (zh) 2005-10-19
CN1316418C true CN1316418C (zh) 2007-05-16

Family

ID=35263421

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2004100348660A Expired - Fee Related CN1316418C (zh) 2004-04-16 2004-04-16 门牌号自动识别系统及方法

Country Status (1)

Country Link
CN (1) CN1316418C (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100385452C (zh) * 2006-05-25 2008-04-30 电子科技大学 一种车牌字符分割方法
CN101377811B (zh) * 2007-08-31 2010-06-30 北京万集科技有限责任公司 一种车牌识别的方法与系统
CN101673338B (zh) * 2009-10-09 2011-11-16 南京树声科技有限公司 基于多角度投影的模糊车牌识别方法
CN102184412B (zh) * 2011-05-09 2013-05-01 东南大学 基于最小错误率贝叶斯分类器的车牌数字及字母识别方法
CN103810486B (zh) * 2014-02-13 2017-11-21 广东小天才科技有限公司 一种处理文字的方法和装置
US9684842B2 (en) * 2015-10-29 2017-06-20 The Nielsen Company (Us), Llc Methods and apparatus to extract text from imaged documents
CN105930844A (zh) * 2016-04-20 2016-09-07 西北工业大学 提高纸质医疗化验单手机扫描识别率的方法
CN108229483A (zh) * 2018-01-11 2018-06-29 中国计量大学 基于caffe与软触发下的门牌压印字符识别装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10143612A (ja) * 1996-11-06 1998-05-29 Matsushita Electric Ind Co Ltd 文字認識装置
JP2002056357A (ja) * 2000-08-10 2002-02-20 Ricoh Co Ltd 文字認識装置、その方法および記録媒体
CN1339775A (zh) * 2000-08-22 2002-03-13 英业达集团(上海)电子技术有限公司 名片自动识别方法与系统
US6553131B1 (en) * 1999-09-15 2003-04-22 Siemens Corporate Research, Inc. License plate recognition with an intelligent camera

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10143612A (ja) * 1996-11-06 1998-05-29 Matsushita Electric Ind Co Ltd 文字認識装置
US6553131B1 (en) * 1999-09-15 2003-04-22 Siemens Corporate Research, Inc. License plate recognition with an intelligent camera
JP2002056357A (ja) * 2000-08-10 2002-02-20 Ricoh Co Ltd 文字認識装置、その方法および記録媒体
CN1339775A (zh) * 2000-08-22 2002-03-13 英业达集团(上海)电子技术有限公司 名片自动识别方法与系统

Also Published As

Publication number Publication date
CN1684096A (zh) 2005-10-19

Similar Documents

Publication Publication Date Title
CN101122953B (zh) 一种图片文字分割的方法
CN110941594B (zh) 一种视频文件的拆分方法、装置、电子设备及存储介质
US6473517B1 (en) Character segmentation method for vehicle license plate recognition
CN102509112A (zh) 车牌识别方法及其识别系统
CN1561503A (zh) 通过模型集合体的对象分类
US10438083B1 (en) Method and system for processing candidate strings generated by an optical character recognition process
US20080273769A1 (en) Print matching method and system using direction images
Björklund et al. Automatic license plate recognition with convolutional neural networks trained on synthetic data
CN111695453B (zh) 绘本识别方法、装置及机器人
CN1316418C (zh) 门牌号自动识别系统及方法
US7769235B2 (en) Text recognition method using a trainable classifier
Huvanandana et al. Reliable and fast fingerprint identification for security applications
JP2000113103A (ja) 文書画像の方向判定方法、装置および記録媒体
CN113743443B (zh) 一种图像证据分类和识别方法及装置
CN111104826A (zh) 一种车牌字符识别方法、装置及电子设备
US11960531B2 (en) Content analysis
US8472719B2 (en) Method of stricken-out character recognition in handwritten text
CN115359302A (zh) 硬币识别方法、系统及存储介质
JP2003216953A (ja) 画像から対象物を抽出する方法およびその装置
Bittencourt et al. A binary decision tree classifier implementing logistic regression as a feature selection and classification method and its comparison with maximum likelihood
JP3956625B2 (ja) 領域切り出しプログラムおよび装置
JP2005250786A (ja) 画像認識方法
US8194943B2 (en) Method for automatically recognizing fingerprints
KR20200065907A (ko) 소나영상에서 사전형상 판별을 통한 표적식별 고속화 방법
Yonekura et al. Postal envelope segmentation by 2-d histogram clustering through watershed transform

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20070516

Termination date: 20170416

CF01 Termination of patent right due to non-payment of annual fee