CN1684097A - 一种实时ic卡数字字符识别与校验系统及方法 - Google Patents
一种实时ic卡数字字符识别与校验系统及方法 Download PDFInfo
- Publication number
- CN1684097A CN1684097A CN 200410034867 CN200410034867A CN1684097A CN 1684097 A CN1684097 A CN 1684097A CN 200410034867 CN200410034867 CN 200410034867 CN 200410034867 A CN200410034867 A CN 200410034867A CN 1684097 A CN1684097 A CN 1684097A
- Authority
- CN
- China
- Prior art keywords
- character
- card
- real
- card number
- verification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 27
- 238000000605 extraction Methods 0.000 claims description 30
- 238000012795 verification Methods 0.000 claims description 30
- 230000004927 fusion Effects 0.000 claims description 12
- 230000011218 segmentation Effects 0.000 claims description 12
- 239000000284 extract Substances 0.000 claims description 7
- 230000008569 process Effects 0.000 claims description 5
- 239000011159 matrix material Substances 0.000 claims description 2
- 230000009466 transformation Effects 0.000 claims description 2
- 238000005516 engineering process Methods 0.000 abstract description 4
- 238000004519 manufacturing process Methods 0.000 abstract description 2
- 238000002474 experimental method Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 230000000052 comparative effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Images
Landscapes
- Character Discrimination (AREA)
Abstract
本发明涉及IC卡数字字符识别与校验技术领域的一种实时IC卡数字字符识别与校验系统及方法。系统包括:预处理、字符提取、特征提取、分类、融合和校验;方法包括:步骤S1,由图象采集卡采集一帧灰度图象到内存;步骤S2,根据卡片上印刷字符的位置几何关系,确定出数字字符的区域;步骤S3,提取出每一个字符,并对字符进行分类;步骤S4,对待识别字符的不同分类结果进行融合;步骤S5,根据给定卡号进行校验。实时IC卡数字字符识别与校验系统及方法用于IC卡印刷生产线上,对IC卡上的印刷字符进行实时识别校验,把印刷错误的卡片挑选出来,达到用机器取代人工操作以及提高印刷生产效率的目的。
Description
技术领域
本发明涉及IC卡数字字符识别与校验技术领域,特别是一种实时IC卡数字字符识别与校验系统及方法。
背景技术
目前印刷体字符识别的研究比较成熟,已在实际生活中得到广泛的应用。但是大多OCR系统都基于这样的假定:待识别字符能容易地从背景图像中提取出来。比如汉字字符识别主要考虑的是大字符集分类问题,而不是字符的提取问题。IC卡印刷字符实时检测的目的是要根据已知的参考数字(打印时给定的数字字符),检测在卡片上打印的数字字符是否正确。然而由于待识别数字字符较小,难以清晰提取字符的轮廓,要实时识别出卡片上的数字字符,就要综合考虑字符提取、分类策略等多种问题。
需要检测的IC卡数字字符有卡号、密码等,一般由多个阿拉伯数字组合而成,在同一卡片中卡号或者密码的字体和大小固定。由于放置卡片的传送带以一定的速度匀速运动,如果要在运动的传送带上捕捉到每一张卡片,除了要求在卡片运动方向上采集的图像宽度应大于实际卡片宽度以外,还要求字符识别在很短的时间内完成。由于待识别字符在卡片上的位置是任意的,图象采集时要求把整张卡片都采集到图象中,因此采集到的卡片数字字符的高度往往只有几个象素点,字符较小。由于成像时光的干扰,使得字符图象轮廓不够清晰。校验参考字符(如给定卡号)由上位机给定,校验的准确率要求大于99.9%。
因此,IC卡数字字符的识别与校验不仅仅是一个字符识别问题,而且也是一个校验问题。在工业上也有其他一些类似的字符识别应用的例子,如产品的编号识别,生产线上一些特定字符的识别等。一般在这些字符识别中,字符较容易提取,字符尺寸足够大,和IC卡数字字符的识别与校验有一定的差异。
发明内容
本发明的目的在于提供一种实时IC卡数字字符识别与校验系统及方法。
实时IC卡数字字符识别与校验系统是OCR(光学字符识别)技术在IC卡印刷字符实时检测中的应用。在检测时采集到的IC卡数字字符具有以下特点:字符小,提取到的字符轮廓不稳定;实时性要求高;用于校验的参考字符(如卡号)可以事先给定;校验的准确率要求大于99.9%。因此本发明是一个识别校验系统,目的上和一般OCR系统有所区别。
一般的字符识别系统包括以下几个步骤:预处理、字符分割、特征提取、分类和后处理等,是一个顺序结构的系统,如图1所示。这种系统的缺点在于字符分割的结果将直接影响到分类的可靠性。一般的字符识别系统采用单阈值对图象进行分割,由于字符轮廓的不稳定性容易导致字符误识别。为此,我们使用多个阈值对字符同时进行分割,并将分类后的结果进行融合求平均的方法,消除偶然出现的误识别,以达到提高识别稳定性的目的。在这一方法的基础上,我们提出了实时IC卡数字字符识别与校验系统,如图2所示。
在图2中,整个系统包含以下部分:预处理、字符提取、特征提取、分类、融合和校验。字符提取、特征提取和分类是个并行的过程,在多阈值分割的情况下,这三个过程并行执行。预处理包括数字字符位置的确定和字符二值化。当采集到一帧图象以后,首先检测出图象中卡片的位置,然后确定待识别数字字符区域的位置,并在字符区域内选取多个合适的阈值。对应每一个阈值对字符分别进行二值化。字符提取是在二值化的基础上提取出每一个字符,并把每个字符变换到约定的尺寸。特征提取就是把字符中的特征信息提取出来进行分类。由于待识别字符小且轮廓不稳定,这里采用了基于多分类器融合的分类策略。校验就是在给定的参考数字字符、分类结果和分类权值矩阵已获得的基础上,根据相似性规则判断待识别的字符是否与已知字符相似。
取多次分割结果进行分类融合可以消除某一个阈值可能引起的误识别。在分类融合时采用多次分类结果求平均值的方法,则偶然出现的误识别就会被过滤,提高了系统的鲁棒性。在参考数字字符和数字字符识别结果已经得到的前提下,检验打印的数字字符是否正确是本文识别与校验系统的最终目的。我们基于参考数字字符、识别结果和分类权向量,提出了一种相似规则来校验打印的数字字符是否正确。
经实验得出,单阈值分割和多阈值分割下识别校验的计算时间相差很小,但是多阈值分割能明显的提高识别校验准确率。实验结果显示,选择6个阈值进行分割字符已经能满足实时性要求也能满足识别校验准确性的要求。我们在实验中使用的卡片字符之间的间隙比较小,而实际中的卡片字符间隔要大一些,一般不会出现字符粘连的现象,因此实际效果可能要好于实验效果。
综上所述,与一般的OCR系统相比,本发明具有以下不同之处:
●采用了多阈值下的字符分割并通过对所有不同阈值下的分类权值取平均的方法,来消除提取的字符轮廓不稳定带来的影响,使系统具有更好的鲁棒性。
●通过已识别的数字字符和已知的参考数字字符之间的相似性判断来确定打印的数字字符是否错误。
●本发明提出的IC卡数字字符识别和校验系统不但能满足校验准确性的要求,而且还满足实时性的要求。
发明技术方案
一种实时IC卡数字字符识别与校验系统,包含以下部分:预处理、字符提取、特征提取、分类、融合和校验;字符提取、特征提取、分类串联再并联连接在预处理和融合之间,字符提取、特征提取和分类是个并行的过程。
附图说明:
图1是一般的字符识别系统。
图2是本发明的IC卡数字字符识别与校验系统。
图3是本发明的IC卡数字字符识别与校验的方法流程图。
具体实施方式
图1的一般的字符识别系统整个系统包括5个部分:预处理、字符分割、特征提取、分类和后处理。
本发明系统框图如图2所示。整个系统包含六个部分:预处理、字符提取、特征提取、分类、融合和后处理。
以下结合附图3对本发明的流程做进一步的描述。
首先,步骤S1,由图象采集卡采集一帧灰度图象到计算机内存,根据区域分割的方法找到卡片区域;由于卡片在图象中的位置可能移动,这就需要首先提取出图象中的卡片。一般卡片和背景颜色灰度相差都很明显,可以根据区域分割的方法找到卡片区域。然后,步骤S2,根据卡片上印刷字符的位置几何关系,先确定数字字符的预选区域,进一步确定出数字字符的区域。步骤S3,字符区域确定以后,需要提取出每一个字符。选择阈值Tn分割字符区域,切分字符,提取字符特征,对所有待识别字符进行分类。由于字符都是等宽的,因此我们可以采用平均切分的方法,按平均比例切分字符。在提取单个字符时,首先从左到右和从右到左分别提出那些不粘连的字符,然后对那些粘连的字符用等分的方法切分。步骤S4,对待识别字符的不同分类结果进行融合。为了提高识别效果,我们采用了能反应字符内外部结构的二次粗外围特征,以及将每个字符标准化为同一尺寸并以整个字符作为特征。在每一个阈值下对每一个字符分别用两组特征进行分类融合。分类器融合包括两组:一组是每一个阈值下基于两组特征分类的融合;另一组是不同阈值下分类结果的融合。步骤S5,根据给定卡号进行校验。经多分类器融合,可以得到一个识别结果和一个参考分类权向量。在参考数字字符已知和卡号识别结果已经得到的前提下,就可以基于已知的参考数字字符、识别结果和参考分类权向量,采用本发明提出的相似规则来校验打印的卡号是否正确。如果校验的卡号不正确,则记录结果并剔除卡片。如果校验的结果正确,则同样记录结果,并选择是否结束任务。
本发明的特点与效果有:
1)使IC卡数字字符识别与校验系统具有较好的鲁棒性。由于IC卡数字字符小,提取的字符轮廓不稳定,会出现偶然的识别错误,通过多阈值下的字符分割识别,并对分类结果取平均的方法可以消除偶然识别错误的影响,使系统能在实际环境中使用。
2)使IC卡数字字符识别与校验系统的校验准确率达到了实际应用的要求。在实验的基础上,给出了IC卡数字字符校验规则,对5000张卡片实验的结果显示,系统已能达到99.98%的校验正确率。
3)本发明提出的IC卡数字字符识别与校验系统已达到了实际应用对实时性的要求。实际要求每秒钟需要处理6张卡片,在采用已有的实验设备的情况下,每张卡片的处理时间(包括采集和识别校验)在110毫秒以内,完全能满足实际使用的要求。
Claims (8)
1、一种实时IC卡数字字符识别与校验系统,包含以下部分:预处理、字符提取、特征提取、分类、融合和校验;字符提取、特征提取、分类串联再并联连接在预处理和融合之间,字符提取、特征提取和分类是个并行的过程。
2、根据权利要求1的实时IC卡数字字符识别与校验系统,其特征在于,字符提取、特征提取、分类串联再并联连接在预处理和融合之间,字符提取、特征提取、分类串联可以是多个。
3、根据权利要求1的实时IC卡数字字符识别与校验系统,其特征在于,预处理包括数字字符位置的确定和字符二值化。
4、根据权利要求1的实时IC卡数字字符识别与校验系统,其特征在于,字符提取部分是在二值化的基础上提取出每一个字符,并把每个字符变换到约定的尺寸。
5、根据权利要求1的实时IC卡数字字符识别与校验系统,其特征在于,特征提取部分就是把字符中的特征信息提取出来进行分类。
6、一种实时IC卡数字字符识别与校验的方法,其步骤如下:
步骤S1,由图象采集卡采集一帧灰度图象到计算机内存,根据区域分割的方法找到卡片区域;
步骤S2,根据卡片上印刷字符的位置几何关系,先确定数字字符的预选区域,进一步确定出数字字符的区域;
步骤S3,选择阈值Tn分割字符区域,切分字符,提取字符特征,对所有待识别字符进行分类;
步骤S4,对待识别字符的不同分类结果进行融合,在每一个阈值下对每一个字符分别用两组特征进行分类融合;
步骤S5,根据给定卡号进行校验。
7、根据权利要求6的实时IC卡数字字符识别与校验的方法,其特征在于,在提取单个字符时,首先从左到右和从右到左分别提出那些不粘连的字符,然后对那些粘连的字符用等分的方法切分。
8、根据权利要求6的实时IC卡数字字符识别与校验的方法,其特征在于,包括融合和校验,校验就是在给定的参考数字字符、分类结果和分类权值矩阵已获得的基础上,根据相似性规则判断待识别的字符是否与已知字符相似。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 200410034867 CN1684097A (zh) | 2004-04-16 | 2004-04-16 | 一种实时ic卡数字字符识别与校验系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 200410034867 CN1684097A (zh) | 2004-04-16 | 2004-04-16 | 一种实时ic卡数字字符识别与校验系统及方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN1684097A true CN1684097A (zh) | 2005-10-19 |
Family
ID=35263422
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 200410034867 Pending CN1684097A (zh) | 2004-04-16 | 2004-04-16 | 一种实时ic卡数字字符识别与校验系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN1684097A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100421066C (zh) * | 2006-05-24 | 2008-09-24 | 上海印钞厂 | 一种提高数字喷码标签字符识别率的方法 |
CN104217202A (zh) * | 2013-06-03 | 2014-12-17 | 支付宝(中国)网络技术有限公司 | 信息识别方法、设备和系统 |
-
2004
- 2004-04-16 CN CN 200410034867 patent/CN1684097A/zh active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100421066C (zh) * | 2006-05-24 | 2008-09-24 | 上海印钞厂 | 一种提高数字喷码标签字符识别率的方法 |
CN104217202A (zh) * | 2013-06-03 | 2014-12-17 | 支付宝(中国)网络技术有限公司 | 信息识别方法、设备和系统 |
WO2014195802A3 (en) * | 2013-06-03 | 2015-04-23 | Alipay.Com Co., Ltd | Method and system for recognizing information |
US9367753B2 (en) | 2013-06-03 | 2016-06-14 | Alipay.Com Co., Ltd | Method and system for recognizing information on a card |
US10210415B2 (en) | 2013-06-03 | 2019-02-19 | Alipay.Com Co., Ltd | Method and system for recognizing information on a card |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Kashyap et al. | Automatic number plate recognition | |
US6301386B1 (en) | Methods and apparatus for gray image based text identification | |
Blumenstein et al. | A novel feature extraction technique for the recognition of segmented handwritten characters | |
Shi et al. | A steerable directional local profile technique for extraction of handwritten arabic text lines | |
Ashwin et al. | A font and size-independent OCR system for printed Kannada documents using support vector machines | |
US4028674A (en) | Automated signature verification system | |
KR100249055B1 (ko) | 문자인식장치및방법 | |
CN106203539B (zh) | 识别集装箱箱号的方法和装置 | |
US20030130992A1 (en) | Automatic document reading system for technical drawings | |
CN101038686A (zh) | 一种基于信息融合的机读旅行证件识别方法 | |
CN110458093B (zh) | 一种基于驾驶员监控系统的安全带检测方法以及相应的设备 | |
CN101221623A (zh) | 一种物体类型的在线训练和识别方法及其系统 | |
Chamchong et al. | Character segmentation from ancient palm leaf manuscripts in Thailand | |
Saba et al. | Language independent rule based classification of printed & handwritten text | |
CN111091124A (zh) | 一种书脊文字识别方法 | |
Abdullah et al. | License plate recognition using multi-cluster and multilayer neural networks | |
Celar et al. | Classification of test documents based on handwritten student ID's characteristics | |
Shitole et al. | Recognition of handwritten Devanagari characters using linear discriminant analysis | |
Haboubi et al. | Discrimination between Arabic and Latin from bilingual documents | |
CN111340032A (zh) | 一种基于金融领域应用场景的字符识别方法 | |
Thumthong et al. | Automatic detection and recognition of Thai vehicle license plate from CCTV images | |
Anjum et al. | Design and Simulation of Handwritten Gurumukhi and Devanagri Numerals Recognition | |
Cüceloğlu et al. | Detecting handwritten signatures in scanned documents | |
Agrawal et al. | Machine learning algorithms for handwritten Devanagari character recognition: a systematic review | |
Banerjee et al. | A system for handwritten and machine-printed text separation in Bangla document images |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C12 | Rejection of a patent application after its publication | ||
RJ01 | Rejection of invention patent application after publication |