CN103679209B - 基于稀疏理论的字符识别方法 - Google Patents

基于稀疏理论的字符识别方法 Download PDF

Info

Publication number
CN103679209B
CN103679209B CN201310618572.1A CN201310618572A CN103679209B CN 103679209 B CN103679209 B CN 103679209B CN 201310618572 A CN201310618572 A CN 201310618572A CN 103679209 B CN103679209 B CN 103679209B
Authority
CN
China
Prior art keywords
data
test
sample
training
train
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201310618572.1A
Other languages
English (en)
Other versions
CN103679209A (zh
Inventor
李阳根
方秀敏
应李勇
马海
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Leawin Group Co., Ltd.
Original Assignee
GUANGDONG LEAWIN SECURITY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by GUANGDONG LEAWIN SECURITY Co Ltd filed Critical GUANGDONG LEAWIN SECURITY Co Ltd
Priority to CN201310618572.1A priority Critical patent/CN103679209B/zh
Publication of CN103679209A publication Critical patent/CN103679209A/zh
Application granted granted Critical
Publication of CN103679209B publication Critical patent/CN103679209B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明公开了一种基于稀疏理论的字符识别方法,通过建立测试样本和训练样本,利用训练样本灰度归一化计算得出测试数据、训练数据和系数向量S之间的关系,通过S值寻找训练项,得出所有类别差异矩阵gap的值,比对gap最小值对应的识别类别与人工划分类别是否相同,确定识别是否正确,完成识别过程。其过程避免了以往二值化对图像信息产生的损失和失真,对输入数据优化选择,训练样本少而精,有效减少了无效数据的影响,基于稀疏理论的识别方法识别速度快、识别效率高、抗干扰能力强,单个字符的识别率可以达到99.2%。

Description

基于稀疏理论的字符识别方法
技术领域
本发明涉及一种标牌字符的自动识别方法,特别涉及一种基于稀疏理论的字符识别方法,属于字符识别技术领域。
背景技术
标牌字符自动识别是现代社会发展和进步的表现,也是信息化、智能化管理的一个方向。其中,车牌自动识别是标牌字符识别的一个重要领域,也是现代交通智能化管理的重要手段。
车牌识别技术是指:能够自动检测受控路面车辆并提取车辆牌照信息的处理技术,包括汉字字符、英文字母和阿拉伯数字的区分以及号牌颜色的识别。其以数字图像处理、模式识别、计算机视觉等技术为基础,对摄像机所拍摄的车辆图像或者视频序列进行分析,得到每一辆汽车唯一的车牌号码,从而完成识别过程。识别后的车牌通过一些后续处理手段不仅可以实现停车场或高速公路收费管理、车辆出入管理、交通流量指标控制测量、公路超速自动化监管、违章处罚管理等,还可以实现车辆定位、汽车防盗等防控技术管理,保证了车辆使用安全性,对于维护交通安全和城市治安,防止交通堵塞,实现交通自动化管理有着现实的意义。
车牌自动识别是一项利用车辆的动态视频或静态图像进行牌照号码、牌照颜色自动识别的模式识别技术。其硬件基础一般包括触发设备、摄像设备、照明设备、图像采集设备、识别车牌号码的处理机等,其软件核心包括车牌定位算法、车牌字符分割算法和光学字符识别算法等。
当前,国内做车牌识别的厂商有几十家,其中字符识别部分基本上都是基于两类技术:一类是模板匹配;另一类是基于神经网络的分类器技术。模板匹配技术算法简单,但运算量大,抗干扰能力较弱,对二值化的要求较高,综合识别率不高;神经网络技术的优点是运算量小,但对字符特征的选取很敏感,鲁棒性并不高,同样存在抗干扰能力弱等缺陷。
如何改善相关字符识别技术,基于现有硬件设备的基础上,提高字符识别速度和准确性,就成为本发明想要解决的主要问题。
发明内容
鉴于上述现有识别技术的不足,本发明旨在提供一种基于稀疏理论算法,直接训练灰度图像,省去了二值化图像的过程,避免了二值化对图像信息产生的损失和失真,从而达到提高字符识别率的目的。
本发明是通过以下技术方案来实现的:
一种基于稀疏理论的字符识别方法,具体步骤包括:
步骤一:建立测试样本集,人工区分并假设测试样本集中含有n个类,每个样本中的数据为1位以上。
步骤二:从测试样本集中每个类里抽出一个样本(D1,D2,D3.....,Dn)作为训练样本train_data,Train_data=[D1D2D3.....Dn];随机挑选一个测试样本Dt作为测试样本Test_data,Test_data=[Dt]。
步骤三:将训练样本灰度归一化为一个训练矩阵train_lab,计算得出训练矩阵的秩x2x,x2x平方和再开方后生成Y2Y,Y2Y的逆矩阵和训练矩阵的转置矩阵相乘得到一个新的矩阵Proj_M。
步骤四:将Test_data的灰度值归一化后生成Test_data2,将Test_data2中的样本逐一跟这个新的矩阵Proj_M计算,得到一组值S,S为系数向量,测试数据、训练数据与S的关系为:
Test_data=Train_data*S
步骤五:按照S寻找train_data中相应的训练项,求出train_data中所有类训练项与测试数据的差异矩阵gap,gap中各项为train_data中与S值对应的相同类所有数据与测试样本的误差总和除以此类对应的S值的平方;得出所有类的gap值后,其最小值所对应的就是测试样本所应归属的类。
步骤六:对比步骤五中测试样本所应归属的类是否与步骤一中的人工分类相同,如相同,则识别正确;否则,为识别错误,将测试样本加入到训练样本中。
步骤七:依次循环上述步骤二至步骤六,直到所有测试样本都能识别正确为止。
本发明所述的基于稀疏理论的字符识别方法,通过训练灰度图像,省去了二值化图像的过程,避免了二值化对图像信息产生的损失和失真,同时,对输入数据优化选择,选择差异性较大的个体作为训练样本,训练样本少而精,训练样本中具有大部分有效数据,较少的冗余数据,有效减少了无效数据的影响,提高了识别率。其基于稀疏理论的识别方法具有识别速度快,识别效率高,抗干扰能力强的特点,单个字符的识别率可以达到99.2%。
具体实施方式
本发明所述的基于稀疏理论的字符识别方法,具体步骤包括:
步骤1:建立测试样本集,人工区分并假设测试样本集中含有n个类,每个样本中的数据为128位;
步骤2:从测试样本集中每个类里抽出一个样本(D1,D2,D3......,Dn)作为训练样本train_data,Train_data=[D1D2D3.....Dn]。随机挑选一个测试样本Dt作为测试样本Test_data,Test_data=[Dt],则train_data大小为128*n,Test_data的大小为128*1。
步骤3:将训练样本集灰度归一化为一个训练矩阵train_lab,计算得出训练矩阵的秩x2x,x2x平方和再开方后生成Y2Y,Y2Y的逆矩阵和训练矩阵的转置矩阵相乘得到一个新的矩阵Proj_M。
步骤4:将测试集Test_data灰度值归一化后生成Test_data2,将Test_data2中的样本逐一跟这个新的矩阵Proj_M计算,得到一组值S。
测试数据、训练数据与S的关系为:
Test_data=Train_data*S
S为系数向量,其中,按照稀疏理论的原理可以直观理解为:若测试数据与训练数据的类相同,那相应的系数向量S应该接近1;反之,应该接近0。
步骤5:按照系数向量S寻找train_data中相应的训练项,求出train_data中所有类训练项与测试数据的差异矩阵gap。其中,gap中各项为train_data中与S值对应的相同类所有数据与测试样本的误差总和除以此类对应的S值的平方,得出所有类的gap值后,其最小值所对应的就是测试样本所应归属的类。
如:假设人工分类有4类,第1类在Train_data中的样本有三个数据D1D2D3,则,gap(1,1)=(sum(D1-Dt)+sum(D2-Dt)+sum(D3-Dt))/S(1,1)^2
如gap={0 8.4*10^23 0.6*10^23 2.2*10^23},其中最小值‘0’所对应的第1类就是输入Test_data后的识别结果。
步骤6:对比步骤5中测试样本所应归属的类是否与步骤1中的人工分类相同。如果相同,则识别正确;否则,为识别错误,将测试样本加入到训练样本中。
如:识别字符信息时,Test_data已经经过人工识别为第1类,若最终判断结果也是第1类,则识别正确。若系统自动识别判断不为第1类,则识别错误,代表识别系统训练数据不充足,要将Test_data的数据加入到Train_data中,这样训练样本才能包含所有样本的大部分特征信息。
步骤7:重新获取新的Test_data,依次循环上述步骤2至步骤6,直到所有测试样本都能识别正确为止。
按照上述方法挑选出来的样本,可以保证当前测试样本全部识别正确,只要测试样本有足够的代表性,单个字符的识别率可以达到99.2%。

Claims (1)

1.一种基于稀疏理论的字符识别方法,其特征在于,具体步骤包括:
步骤一:建立测试样本集,人工区分并假设测试样本集中含有n个类,每个样本中的数据为1位以上;
步骤二:从测试样本集中每个类里分别抽出一个样本D1,D2,D3......,Dn,将这n个样本组合后作为训练样本集Train_data,Train_data=[D1 D2 D3.....Dn];从除训练样本集外的测试样本集中随机挑选一个测试样本Dt作为测试样本Test_data,Test_data=[Dt];
步骤三:将训练样本集灰度归一化为一个训练矩阵train_lab,计算得出训练矩阵的秩x2x,x2x平方和再开方后生成Y2Y,Y2Y的逆矩阵和训练矩阵的转置矩阵相乘得到一个新的矩阵Proj_M;
步骤四;将Test_data的灰度值归一化后生成Test_data2,将Test_data2中的样本跟这个新的矩阵Proj_M逐一计算,得到一组值S,S为系数向量,测试样本、训练样本集与S的关系为:
Test_data=Train_data*S
步骤五:按照S寻找Train_data中相应的训练项,求出Train_data中所有类训练项与测试样本的差异矩阵gap,gap中各项为Train_data中与S值对应的相同类所有数据与测试样本的误差总和除以此类对应的S值的平方;得出所有类的gap值后,其最小值所对应的就是测试样本所应归属的类;
步骤六:对比步骤五中测试样本所应归属的类是否与步骤一中的人工分类相同,如相同,则识别正确;否则,为识别错误,将测试样本加入到训练样本集中;
步骤七:依次循环上述步骤二至步骤六,直到所有测试样本都能识别正确为止。
CN201310618572.1A 2013-11-29 2013-11-29 基于稀疏理论的字符识别方法 Expired - Fee Related CN103679209B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310618572.1A CN103679209B (zh) 2013-11-29 2013-11-29 基于稀疏理论的字符识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310618572.1A CN103679209B (zh) 2013-11-29 2013-11-29 基于稀疏理论的字符识别方法

Publications (2)

Publication Number Publication Date
CN103679209A CN103679209A (zh) 2014-03-26
CN103679209B true CN103679209B (zh) 2017-03-29

Family

ID=50316697

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310618572.1A Expired - Fee Related CN103679209B (zh) 2013-11-29 2013-11-29 基于稀疏理论的字符识别方法

Country Status (1)

Country Link
CN (1) CN103679209B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104298976B (zh) * 2014-10-16 2017-09-26 电子科技大学 基于卷积神经网络的车牌检测方法
CN108154072A (zh) * 2016-12-02 2018-06-12 天津工业大学 基于深度卷积神经网络的航拍绝缘子故障自动检测
CN106874950A (zh) * 2017-02-13 2017-06-20 云南电网有限责任公司电力科学研究院 一种暂态电能质量录波数据的识别分类方法
CN107909034A (zh) * 2017-11-15 2018-04-13 清华大学深圳研究生院 一种人脸检测方法、装置和计算机可读存储介质
CN109558892A (zh) * 2018-10-30 2019-04-02 银河水滴科技(北京)有限公司 一种基于神经网络的目标识别方法及系统

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103324923A (zh) * 2013-07-11 2013-09-25 上海理工大学 基于稀疏表示的手写字符识别方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070156471A1 (en) * 2005-11-29 2007-07-05 Baback Moghaddam Spectral method for sparse principal component analysis

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103324923A (zh) * 2013-07-11 2013-09-25 上海理工大学 基于稀疏表示的手写字符识别方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
"Robust Face Recognition via Sparse Representation";John Wright 等;《IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE》;20090228;第31卷(第2期);全文 *
"Sparse Representation or Collaborative Representation: Which Helps Face";Lei Zhang 等;《IEEE International Conference on Computer Vision》;20111231;全文 *
"基于压缩传感的手写字符识别方法";刘长红 等;《计算机应用》;20090831;第29卷(第8期);全文 *
"基于稀疏表征的可见光和近红外光人脸图像融合快速识别算法";赵英楠;《计算机科学》;20120630;第39卷(第6期);全文 *

Also Published As

Publication number Publication date
CN103679209A (zh) 2014-03-26

Similar Documents

Publication Publication Date Title
CN110969160B (zh) 一种基于深度学习的车牌图像校正、识别方法及系统
CN103679209B (zh) 基于稀疏理论的字符识别方法
CN104063712B (zh) 一种车辆信息提取方法和系统
CN112016605B (zh) 一种基于边界框角点对齐和边界匹配的目标检测方法
CN104766042A (zh) 交通标志板识别方法及装置
CN101221623B (zh) 一种物体类型的在线训练和识别方法及其系统
CN113435546B (zh) 基于区分置信度水平的可迁移图像识别方法及系统
CN101937508A (zh) 一种基于高清图像的车牌定位与识别方法
CN103279738B (zh) 车标自动识别方法及系统
CN103279756A (zh) 基于集成分类器的车辆检测分析系统及其检测分析方法
CN102968646A (zh) 一种基于机器学习的车牌检测方法
CN103824091A (zh) 一种用于智能交通系统的车牌识别方法
CN108960175A (zh) 一种基于深度学习的车牌识别方法
CN111914911B (zh) 一种基于改进深度相对距离学习模型的车辆再识别方法
CN110009058A (zh) 一种停车场车牌识别系统及方法
CN103679214A (zh) 基于在线面积估计和多特征决策融合的车辆检测方法
CN107358231B (zh) 一种基于sift算子和混沌遗传算法的车牌字符识别方法
Lin et al. Automatic vehicle license plate recognition system for smart transportation
CN108537223A (zh) 一种车牌检测方法、系统及设备和存储介质
CN105512662A (zh) 一种无牌车辆检测方法及装置
CN105469099B (zh) 基于稀疏表示分类的路面裂缝检测和识别方法
KR100942409B1 (ko) 고속 이동 차량 검지 방법
CN106778765B (zh) 一种车牌识别的方法及装置
CN106446929B (zh) 基于边缘梯度势能的车辆类型检测方法
CN111832463A (zh) 一种基于深度学习的交通标志检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20190111

Address after: 515000 11, building 8, science and Technology East Road, hi tech Zone, Shantou, Guangdong.

Patentee after: Guangdong Leawin Group Co., Ltd.

Address before: Guangdong District, Shantou City, Shantou hi tech Zone, 8 East Road, science and technology, building No. 10, on the east side of the C area and the east side of the building on the 3

Patentee before: GUANGDONG LEAWIN SECURITY CO., LTD.

CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20170329

Termination date: 20201129