CN103679178A - 彩色印刷纸张人工填涂信息的一种识别方法 - Google Patents

彩色印刷纸张人工填涂信息的一种识别方法 Download PDF

Info

Publication number
CN103679178A
CN103679178A CN201210314041.9A CN201210314041A CN103679178A CN 103679178 A CN103679178 A CN 103679178A CN 201210314041 A CN201210314041 A CN 201210314041A CN 103679178 A CN103679178 A CN 103679178A
Authority
CN
China
Prior art keywords
image
line
identification
colorful
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201210314041.9A
Other languages
English (en)
Inventor
汪法兵
黄姗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BEIJING PHILISENSE TECHNOLOGY Co Ltd
Original Assignee
BEIJING PHILISENSE TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BEIJING PHILISENSE TECHNOLOGY Co Ltd filed Critical BEIJING PHILISENSE TECHNOLOGY Co Ltd
Priority to CN201210314041.9A priority Critical patent/CN103679178A/zh
Publication of CN103679178A publication Critical patent/CN103679178A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Character Input (AREA)

Abstract

本发明提供了彩色选票图像识别问题的一个解决方法,能快速,准确,智能的定位出彩色扫描选票上的识别目标的位置,并对识别目标内部填涂信息作出判断,同时,对于椭圆及菱形这种形状不规则候选框也能正确识别。本算法适用于彩色答题卡填涂识别。

Description

彩色印刷纸张人工填涂信息的一种识别方法
技术领域
本发明涉及彩色印刷纸张上人工填涂信息识别,例如彩色扫描头电子票箱扫描的彩色选票的图像识别,彩色答题卡的填涂答案识别,属于智能化图像识别系统。 
背景技术
传统的电子票箱多为黑白扫描头,扫描的选票为灰度图,存在图像质量不佳,识别不准确等问题。彩色扫描图数据量大,数据处理需要更高的技巧。而且,票箱组成结构为机械部件,电机转速不均,或者人工投票过程中手部拉扯选票,都会造成选票扫描图像存在拉伸。电子票箱进票口大于选票尺寸,会造成选票扫描头像存在倾斜,拉伸和倾斜给选票的定位识别带来困难。传统的识别算法基于模板匹配,在数据库记录的坐标附近移动模板,匹配搜索候选框区域,这种处理方法使得运算次数过多执行时间过长。传统的选票设计多为矩形选项框,椭圆,菱形等选项框的曲线形状很复杂,涉及复杂的图像识别算法,难以处理。现有的答题卡图像识别算法多是利用模板匹配根据相似度计算做答题结果识别,这种方法运算时间较长。 
本发明提出了一种新的处理方法,解决了上述问题。 
发明内容
针对选票识别,本发明提出了一种新的解决方法。先对选票图像做噪声处理,然后进行目标搜索识别,最后与数据库记录的坐标信息进行匹配,解决了图像随机拉伸问题,同时减少了算法执行时间,提高了识别准确性。 
本方法利用R/G/B三个颜色通道的颜色差值对彩色图像二值化,二值化函数为 
〔|R[i]-mean[i]|+|G[i]-mean[i]|+|B[i]-mean[i]|〕<Threshold 
其中,mean[i]=〔R[i]+G[i]+B[i]〕/3,是第i个像素点的灰度均值。逐个像素点判断三个RGB差值,大于设定阈值Threshold时判定为彩色像素点,二值化为0,小于设定阈值时判定为黑白像素点,二值化为1,后续的图像基于二值图像做处理。为了增强算法的容错能力,这里的二值化阈值Threshold通过对整张图像做光栅扫描统计计算得到。逐点计算三通道颜色差值: 
RGBDiff[i]=〔|R[i]-mean[i]|+|G[i]-mean[i]|+|B[i]-mean[i]|〕 
整张图像的像素点数为Length,对Length个RGBDiff求均值Ave和标准差Var,图像二值化阈值可由下式得到: 
Threshold=Ave-3*Var 
扫描头扫描图像的R/G/B灰度值通常偏离标准色卡的灰度值,其涨落近似为高斯分布。理论上,当阈值取得小于均值三倍标准差时,二值化误差小于0.2%,能得到较好的二值图像。 
根据数据库记录的候选框坐标,在选票扫描图像上进行模板匹配搜索定位,运算次数正比于模板大小乘以整张图像大小。对于A4纸张大小的选票,100DPI扫描头扫描的图像约有830*1170个像素点,候选框模板约有500个像素点,模板匹配的运算次数为 
K*830*1170*500 
其中K为依赖于具体匹配方法的一个常数,这个数值一般在十亿次以上。 
为了减少运算次数,本发明提出了基于直线的选票图像处理方法,先对图像的点与线判断并作做去噪声处理。对于标准选票,其定位框,信息框及另选框都是标准的矩形,设矩形框宽高的最小尺寸为Width*Height。首先对整张二值图像逐行扫描,搜索行内连续的值为1像素点,若其点数大于Width-5,则保留这些像素点,否则将其值改为0,这么做就去掉了短于Width-5的直线。然后,对二值图像逐列扫描,搜索列内连续值为1的像素点,若其点数大于Height-5,则保留,否则将这些像素点的值改为0,这么做就去掉了内短于Height-5的直线。最后结果是去掉了图像噪声,只留下需要识别的目标客体,即定位框,信息框,候选框,另选框。 
对图像做噪声处理,然后搜索识别目标,所需要的运算总次数约为: 
L*830*1170 
其中,L为一常数,依赖于具体的去噪方法。这个运算次数远小于模板匹配算法的运算次数,缩短了算法执行时间。 
对选票图像先做噪声处理,再做目标识别,在另一个角度减少了噪声对识别的干扰。噪声处理去掉了二值化图像中的汉字,灰度起伏噪声点,不规则填涂笔迹,小的图像印刷污染等,最后选票图像上面只留下需要识别的目标(包括定位框,信息框,候选框,另选框),提高了识别准确度。 
先识别再匹配的处理方法则从根本上解决了选票图像扫描拉伸的问题。电子票箱的选票图像生成由传动电机及扫描头等机械部件完成,原则上不能保证扫描图像与电脑设计的数字图像精确匹配。识别目标如候选框被随机拉伸后,其大小与高度发生了变化,并且偏离了数据库记录位置。本方法先集体识别出目标客体的中心位置以及宽高信息,之后逐行与数据库对比匹配横向坐标, 
|RecX-DBX|<D 
其中RecX是识别出目标框横向坐标,DBX是数据库记录的目标框横向坐标,D是一个大小约为10个像素的常值,这个匹配范围用以适应印刷导致的图像横向偏移。最后将匹配结果写入数据库,避免了图像的随机拉伸造成的识别困难。 
对于椭圆,菱形这样不规则的形状,运用模板匹配方法识别计算量大,处理复杂。本方法利用类似上述矩形选项框的噪声处理方法,保留下椭圆或菱形中心宽高大于设定参数的部分,识别出其中心坐标,然后根据中心坐标取外切于椭圆或菱形选框的矩形方块区域进行识别。这种方法能巧妙的避开不规则形状曲线带来的算法复杂度,找到椭圆和菱形候选框的位置并作出填涂识别。 
填涂识别部分,算法提取空白信息框,自动计算白色阈值。票箱处于不同的亮度环境下,扫描的图像灰度不一致,针对每张选票动态的调整白色阈值,能更准确的对填涂作出判定识别。 
对于当前通用的彩色答题卡,矩形填涂框,上述方法同样适用。
附图说明
附图1为识别算法流程示意图。 

Claims (3)

1.彩色扫描图像的RGB三通道颜色取差值对图像二值化。
2.基于直线处理图像噪声,
本方法逐行逐列扫描图像,对短于特定长度的直线作为噪声去掉,缩短图像处理时间。
3.识别算法能应对扫描图像的随机拉伸,
先识别出图像中的选项框,再将识别结果逐行与数据库匹配,解决了扫描图像随机拉伸时的识别问题。 
CN201210314041.9A 2012-08-30 2012-08-30 彩色印刷纸张人工填涂信息的一种识别方法 Pending CN103679178A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210314041.9A CN103679178A (zh) 2012-08-30 2012-08-30 彩色印刷纸张人工填涂信息的一种识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210314041.9A CN103679178A (zh) 2012-08-30 2012-08-30 彩色印刷纸张人工填涂信息的一种识别方法

Publications (1)

Publication Number Publication Date
CN103679178A true CN103679178A (zh) 2014-03-26

Family

ID=50316667

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210314041.9A Pending CN103679178A (zh) 2012-08-30 2012-08-30 彩色印刷纸张人工填涂信息的一种识别方法

Country Status (1)

Country Link
CN (1) CN103679178A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106778750A (zh) * 2017-01-17 2017-05-31 深圳市海云天科技股份有限公司 一种答题卡识别点精确定位方法及系统
CN112560729A (zh) * 2020-12-22 2021-03-26 成都中科信息技术有限公司 一种选票处理方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101334836A (zh) * 2008-07-30 2008-12-31 电子科技大学 一种融合色彩、尺寸和纹理特征的车牌定位方法
CN101436321A (zh) * 2008-12-12 2009-05-20 中科院成都信息技术有限公司 选票信息处理方法
CN102375982A (zh) * 2011-10-18 2012-03-14 华中科技大学 一种融合多字符特征的车牌定位方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101334836A (zh) * 2008-07-30 2008-12-31 电子科技大学 一种融合色彩、尺寸和纹理特征的车牌定位方法
CN101436321A (zh) * 2008-12-12 2009-05-20 中科院成都信息技术有限公司 选票信息处理方法
CN102375982A (zh) * 2011-10-18 2012-03-14 华中科技大学 一种融合多字符特征的车牌定位方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
陈树人,沈宝国,毛罕平,尹建军,杨运克,肖伟中: "基于颜色特征的棉田中铁苋菜识别技术", 《农业机械学报》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106778750A (zh) * 2017-01-17 2017-05-31 深圳市海云天科技股份有限公司 一种答题卡识别点精确定位方法及系统
CN106778750B (zh) * 2017-01-17 2020-02-04 深圳市海云天科技股份有限公司 一种答题卡识别点精确定位方法及系统
CN112560729A (zh) * 2020-12-22 2021-03-26 成都中科信息技术有限公司 一种选票处理方法及系统
CN112560729B (zh) * 2020-12-22 2023-12-26 成都中科信息技术有限公司 一种选票处理方法及系统

Similar Documents

Publication Publication Date Title
CN109409374B (zh) 一种基于联合的同批次试卷答案区域切割方法
CN102375982B (zh) 一种融合多字符特征的车牌定位方法
CN103310211B (zh) 一种基于图像处理的填注标记识别方法
CN110619327A (zh) 一种复杂场景下基于深度学习的实时车牌识别方法
CN103198315B (zh) 基于字符轮廓和模板匹配的车牌字符分割算法
CN102360419B (zh) 计算机扫描阅读管理方法及系统
CN102629322B (zh) 一种基于边界点笔画形状的字符特征提取方法及应用
LeBourgeois Robust multifont OCR system from gray level images
US9489561B2 (en) Method and system for estimating fingerprint pose
WO2018086233A1 (zh) 一种字符分割方法和装置、及元件检测方法和装置
CN105374015A (zh) 基于局部对比度和笔画宽度估计的低质量文档图像二值化方法
Feng et al. An efficient detection method for rare colored capsule based on RGB and HSV color space
CN107067000B (zh) 一种纸币污损程度的识别方法及装置
CN107256547A (zh) 一种基于显著性检测的表面裂纹识别方法
CN107679479A (zh) 一种基于图像形态学处理的客观填涂识别方法
CN107122775A (zh) 一种基于特征匹配的安卓手机身份证字符识别方法
CN113077392B (zh) 一种针对指针表模糊照片的高准确度自动读数方法
CN110210316B (zh) 基于灰度图像的交通信号灯数字识别方法
CN108171157A (zh) 基于多尺度局部块LBP直方图特征与Co-HOG特征相结合的人眼检测算法
CN114511704B (zh) 一种基于高速产线的喷印码识别检测方法
CN107310173A (zh) 膜厚控制系统及薄膜剖面图像的字符提取与膜厚采集方法
CN110689003A (zh) 低照度成像车牌识别方法、系统、计算机设备及存储介质
CN107038401B (zh) 一种嘴唇轮廓的分割及特征提取方法
CN105760869B (zh) 一种基于图像灰度识别及处理的阅卷方法
CN115082776A (zh) 一种基于图像识别的电能表自动检测系统及方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20140326

RJ01 Rejection of invention patent application after publication