CN104866847A - 一种快速的鲁棒答题卡识别方法 - Google Patents
一种快速的鲁棒答题卡识别方法 Download PDFInfo
- Publication number
- CN104866847A CN104866847A CN201510261081.5A CN201510261081A CN104866847A CN 104866847 A CN104866847 A CN 104866847A CN 201510261081 A CN201510261081 A CN 201510261081A CN 104866847 A CN104866847 A CN 104866847A
- Authority
- CN
- China
- Prior art keywords
- full
- image
- answer sheet
- filling
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/22—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
- G06V10/225—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition based on a marking or identifier characterising the area
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/09—Recognition of logos
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
一种快速的鲁棒答题卡识别方法包括如下步骤:对输入的图像进行灰度处理;并对灰度处理后的图像进行自适应二值化处理,得到自适应图像;在所述自适应图像中获取答题卡区域;并对答题卡区域进行校正及局部调整,得到校正答题卡;根据所述校正答题卡属于的答题卡类型计算所述灰度图像的填涂区域与所述灰度图像的填涂区域周围的差异值;根据计算后的填涂比例和计算后的差异值,判断填涂区域是否已被填涂。本发明解决光照不均匀导致答题卡识别不均的问题;减少了与标准模板的偏移。通过本发明克服了因拍摄的图像模糊可能导致误识的问题。通过本发明,在填涂不完全的情况下,解决了填涂不完整导致判断不明确的问题,使之达到良好的识别效果。
Description
技术领域
本发明属于图像处理识别的技术领域,具体涉及一种快速的鲁棒答题卡识别方法。
背景技术
答题卡识别技术主要包含基于图像识别的方法和基于光标阅读机的方法。
基于光标阅读机的方法由于其需要专业的设备、特制的答题卡等问题导致其价格昂贵,使用复杂,不适用于答题卡识别技术的广泛应用。
随着移动智能终端的发展,基于图像识别的答题卡识别技术得到了广泛的关注,可安装到各种带摄像头的设备中,方便老师阅卷,解放教师的时间。目前,这方面的应用主要是美国的Quick Key。
但是,将基于图像的答题卡识别技术应用到移动环境中,存在以下问题:
1、光照复杂,用户使用拍摄或扫描时可能在不同的光照环境下,可能导致答题卡区域的光照不均匀。
2、拍照视角及距离随机,用户拍照时的视角及距离可能随时变化,从而导致普通的形状校正不能够满足要求,因为单纯的形状校正后的答题卡会与标准模板有较大的偏移。
3、拍照抖动导致图像模糊,用户在使用移动设备进行拍照时,由于抖动会导致拍摄的图像模糊,从而使得答题区域模糊,可能导致误识。
4、试卷容易弯曲,用户的答题卡可能由于某些情况弯曲或者折叠,也可能导致校正的偏差。
5、填涂不完全,不同笔(铅笔、钢笔、签字笔)的在快速填涂答案时,可能会导致填涂不完整,这样通过普通的比例去判断答案不能够达到较好的效果。
6、识别的模板单一,目前现有的答题卡算法一般都要针对单一的模板进行识别,并不能支持多种答题卡的自动判断与识别。
发明内容
为了提高基于图像的答题卡识别的准确率和鲁棒性,本发明提供了一种快速的鲁棒答题卡识别方法,解决现有技术存在的上述问题。
本发明所采用的技术方案为:
一种快速的鲁棒答题卡识别方法,包括如下步骤:
S11,获取输入的图像,并对输入的图像进行灰度处理;并对灰度处理后的图像进行自适应二值化处理,得到自适应图像;
S12,在所述自适应图像中获取答题卡区域;并对答题卡区域进行校正及局部调整,得到校正答题卡;
S13,判断所述校正答题卡是否为预设答题卡类型;
若为预设答题卡类型,则执行S14;
若不为预设答题卡类型,则返回S11;
S14,根据所述校正答题卡属于的答题卡类型,获取所述校正答题卡的二值图像填涂区域;并计算所述二值图像填涂区域的填涂比例;
S15,根据所述校正答题卡所属的答题卡类型,获取所述校正答题卡的灰度图像的填涂区域;并计算所述灰度图像的填涂区域与所述灰度图像的填涂区域周围的差异值;
S16,根据S14计算后的填涂比例和S15计算后的差异值,判断填涂区域是否已被填涂。
优选的,S11,对灰度处理后的图像进行自适应二值化处理的方法具体为:
设灰度处理后的图像为I,灰度处理后的图像的均值滤波核为K,滤波图像为I′,矩阵为Isub,T为矩阵阈值;B为二值化处理结果;
S21,对灰度处理后的图像与灰度处理后的图像的均值滤波核进行卷积运算,得到滤波图像;I′=I×K;
S22,通过灰度处理后的图像减去滤波图像,得到矩阵;Isub=I-I′;
S23,对矩阵进行二值化处理,得到二值化处理结果;
S24,将二值化处理结果构成的图像作为自适应图像。
优选的,S12,在所述自适应图像中获取答题卡区域;并对答题卡区域进行校正及局部调整,得到校正答题卡的方法为:
S31,获取所述自适应图像的外轮廓,并对所述自适应图像进行过滤处理;获取所述外轮廓时,判断所述外轮廓是否位于所述自适应图像的中间位置;
若所述外轮廓不位于所述自适应图像的中间位置,则返回S11;
若所述外轮廓位于所述自适应图像的中间位置,则判断所述外轮廓是否大于预设的外轮廓阈值;
若所述外轮廓小于等于预设的外轮廓阈值时,则所述自适应图像作为取值图像;
若所述外轮廓大于预设的外轮廓阈值时,则取所述自适应图像的1/4作为取值图像;所述自适应图像的1/4具体为所述自适应图像的中心向四周均匀的取值所构成的图像;
S32,依次判断所述取值图像的轮廓中四个边角是否均为直角;如果不是直角点,则判断下一个边角,直到配对到四个直角构成矩形为止,所述取值图像中构成矩形的区域作为待校正图像;
S33,对所述待校正图像的高度和宽度进行校正,得到校正答题卡。
优选的,S32,判断所述取值图像的轮廓中四个边角是否均为直角的方法具体为:
如果存在点(xi,yi)使得上式成立则认为此坐标点是直角。
优选的,S33,对所述待校正图像的高度和宽度进行校正的方法为:
统计所述待校正图像的高度方向轮廓的宽度坐标的最小值和最大值,得到向量H;设H[i].minX表示第i行的最小宽度坐标,H[i].maxX表示第i行的最大宽度坐标;
判断所述待校正图像的高度方向轮廓的两边的值是否连续;具体为:判断高度方向轮廓的两边中间部分行与行之间的最小坐标之差或者最大坐标之差是否小于阈值minSubValue;如果小于阈值minSubValue,则认为轮廓的左边线连续;否则认为轮廓的左边线不连续;任意选取轮廓高度方向上的一行k作为参照行,则将轮廓高度除去k以外的其他行校正到参照行的宽度;具体公式为:
x=H[1].minX+x′*coff
Ih(i,x′)=I(i,x)
其中coff是校正系数,x’为校正后的新坐标,x为输入图像的坐标;
对宽度进行校正的同时计算高度增量:
其中η为高度校正系数;
高度增量用于调整轮廓区域的高度;
根据校正系数及高度增量实现所述待校正图像的校正。
优选的,S13,判断所述校正答题卡是否为预设答题卡类型的具体方法为:
S61,将所述校正答题卡的大小调整为预设答题卡的尺寸大小;
S62,随机选取所述预设答题卡中n个不重复的填涂区域;并判断调整大小后的所述校正答题卡是否与n个不重复的填涂区域中的任意一个匹配,如果不匹配,则返回S11;
如果匹配,则为预设的答题卡类型,进入S14。
优选的,S62,判断调整大小后的所述校正答题卡是否与n个不重复的填涂区域中的任意一个匹配与否的方法为:
其中adjust_bw为二值图像,R.y表示填涂区域在模板中的纵坐标,R.x表示填涂区域在模板中的横坐标,R.h表示填涂区域在模板中的高度,R.w表示填涂区域在模板中的纵坐标;addValue表示填涂区域被填涂的个数,Percent表示填涂的百分比;isContain表示调整大小后的所述校正答题卡是否与当前填涂区域匹配。
优选的,判断调整大小后的所述校正答题卡是否与n个不重复的填涂区域中的任意一个匹配与否时,计算S14中二值图像填涂区域的填涂比例;计算S15中灰度图像的填涂区域与灰度图像的填涂区域周围的差异值;设填涂区域为R,校正后的灰度图像为adjust_src;
其中,sumRect表示填涂区域点的像素值的总和,avgRect表示填涂区域像素的平均值,sumAround表示填涂区域周围背景的像素值总和,avgAround表示周围像素的均值,Difference表示填涂区域与周围背景的差异。
优选的,S16,根据计算后的填涂比例和计算后的差异值,判断填涂区域是否已被填涂的方法具体为:
Percent大于预设的阈值threshold_percent_max,则认为已填涂;
Pecent小于预设的阈值threshold_percent_min,则认为未填涂;
设模板中填涂区域的差异值为(i),i为填涂区域的索引,j为自然数;如果存在Difference(i)–Difference(j)大于0.15则认为索引为i的区域对应的选项已填涂;对不确定的选项,根据其差异值与已确定选项的差异值来判断是否已填涂,如果靠近已填涂区域的差异值则认为已经填涂,如果靠近未填涂区域的差异值则认为未填涂。
优选的,threshold_percent_max的值为0.9;threshold_percent_min的值为0.5。
本发明的有益效果为:
本发明综合考虑移动环境下可能遇到的各种问题,并提供了相应的解决方案,实现了移动环境下的答题卡识别,用户只需随意的对准答题区域进行拍摄就可以很好的得到准确的答案,无需刻意的保持着固定的姿势;本发明解决光照不均匀导致答题卡识别不均的问题;通过本发明的算法校正答题卡,减少了与标准模板的偏移。通过本发明克服了因拍摄的图像模糊可能导致误识的问题。通过本发明,在填涂不完全的情况下,解决了填涂不完整导致判断不明确的问题,使之达到良好的识别效果。
附图说明
图1为本发明的流程示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施方式仅仅用以解释本发明,并不用于限定本发明。
在本实施例中,一种快速的鲁棒答题卡识别方法,主要过程如下:
对输入的图像进行自适应的二值化处理,尽量的减少光照不均带来的影响;
再对二值化的图像进行消噪处理,平滑图像中的边缘信息,使其可适应一些成本较低的纸张;
然后,寻找二值图像的外轮廓信息,直接针对轮廓信息区域进行校正,并调整弯曲的边缘和拍摄偏差,这样无需对整副图像进行全局校正,提高了处理速度;
寻找二值图像的外轮廓信息后,再对校正后的答题卡区域进行判断,识别系统是否支持此种模板,并判断此答题卡是否为系统支持的答题卡模板;
判断完毕答题卡模板支持与否后,计算答案区域的填涂比例,此种特征有一定的辨识度,但容易受光照及模糊的影响;
最后,根据韦伯定律计算答题区域与周边区域的差异值,此种特征能够在光照及模糊的情况下具有良好的鲁棒性。
下面,参照附图对本发明的实施方式进行进一步的说明。
S11,获取输入的图像,并对输入的图像进行灰度处理;并对灰度处理后的图像进行自适应二值化处理,得到自适应图像;
S12,在所述自适应图像中获取答题卡区域;并对答题卡区域进行校正及局部调整,得到校正答题卡;
S13,判断所述校正答题卡是否为预设答题卡类型;
若为预设答题卡类型,则执行S14;
若不为预设答题卡类型,则返回S11;
S14,根据所述校正答题卡属于的答题卡类型,获取所述校正答题卡的二值图像填涂区域;并计算所述二值图像填涂区域的填涂比例;
S15,根据所述校正答题卡所属的答题卡类型,获取所述校正答题卡的灰度图像的填涂区域;并计算所述灰度图像的填涂区域与所述灰度图像的填涂区域周围的差异值;
S16,根据S14计算后的填涂比例和S15计算后的差异值,判断填涂区域是否已被填涂。
针对输入的图像,进行灰度化及自适应的二值化处理;输入的图像,支持任意格式的图像,对其进行标准灰度化处理后,进行自适应的二值化处理,自适应的二值化算法,可以极大的消除光照不均匀对二值化;
寻找答题卡区域,并对答题卡区域进行校正及宽高的局部调整,以减少误差;如果未寻找到答题卡区域,返回错误,则提示错误,并返回第一步;
识别系统是否支持此类型答题卡;如果不支持此类型答题卡,返回错误,则提示错误,并返回第一步;
根据模板获取具体的二值图像填涂区域,并计算填涂区域的填涂比例;
根据模板获取具体的灰度图像的填涂区域,并计算填涂区域与周围的差异值;
根据两种特征来识别,填涂区域是否已被填涂。
S11,对灰度处理后的图像进行自适应二值化处理的方法具体为:
设灰度处理后的图像为I,灰度处理后的图像的均值滤波核为K,滤波图像为I′,矩阵为Isub,T为矩阵阈值,一般取值-10或-10左右的值;B为二值化处理结果;
S21,对灰度处理后的图像与灰度处理后的图像的均值滤波核进行卷积运算,得到滤波图像;I′=I×K;
S22,通过灰度处理后的图像减去滤波图像,得到矩阵;Isub=I-I′;
S23,对矩阵进行二值化处理,得到二值化处理结果;
S24,将二值化处理结果构成的图像作为自适应图像。
S12,在所述自适应图像中获取答题卡区域;并对答题卡区域进行校正及局部调整,得到校正答题卡的方法为:
S31,获取所述自适应图像的外轮廓,并对所述自适应图像进行过滤处理;获取所述外轮廓时,判断所述外轮廓是否位于所述自适应图像的中间位置;
若所述外轮廓不位于所述自适应图像的中间位置,则返回S11;
若所述外轮廓位于所述自适应图像的中间位置,则判断所述外轮廓是否大于预设的外轮廓阈值;
若所述外轮廓小于等于预设的外轮廓阈值时,则所述自适应图像作为取值图像;
若所述外轮廓大于预设的外轮廓阈值时,则取所述自适应图像的1/4作为取值图像;所述自适应图像的1/4具体为所述自适应图像的中心向四周均匀的取值所构成的图像;
S32,依次判断所述取值图像的轮廓中四个边角是否均为直角;如果不是直角点,则判断下一个边角,直到配对到四个直角构成矩形为止,所述取值图像中构成矩形的区域作为待校正图像;
S33,对所述待校正图像的高度和宽度进行校正,得到校正答题卡。
上述过程中,判断剩余的轮廓是否大致为矩形,并判断包含四个配对的直角点,如果包含,则进入校正流程,否则判断下一个轮廓;
S32,判断所述取值图像的轮廓中四个边角是否均为直角的方法具体为:
S33,对所述待校正图像的高度和宽度进行校正的方法为:
统计所述待校正图像的高度方向轮廓的宽度坐标的最小值和最大值,得到向量H;设H[i].minX表示第i行的最小宽度坐标,H[i].maxX表示第i行的最大宽度坐标;
判断所述待校正图像的高度方向轮廓的两边的值是否连续;具体为:判断高度方向轮廓的两边中间部分行与行之间的最小坐标之差或者最大坐标之差是否小于阈值minSubValue(一般取3个值即可,允许一定程度的弯曲或者倾斜);如果小于阈值minSubValue,则认为轮廓的左边线连续;否则认为轮廓的左边线不连续;由于图像中,轮廓可能倾斜或者弯曲,所以两端部分的最小与最大坐标较难出现连续特性,因此可以根据中间部分连续的曲线,计算高度方向两端的最大最小坐标。任意选取轮廓高度方向上的一行k作为参照行,则将轮廓高度除去k以外的其他行校正到参照行的宽度;具体公式为:
x=H[i].minX+x′*coff
Ih(i,x′)=I(i,x)
其中coff是校正系数,x′为校正后的新坐标,x为输入图像的坐标;由此可知在进行校正时,只对轮廓区域进行了校正,这样可以大量减少运算量;
对宽度进行校正的同时计算高度增量:
其中η为高度校正系数;一般η的值为2;根据高度增量▽h[i]用于调整轮廓区域的高度;
根据校正系数及高度增量实现所述待校正图像的校正。
由此方法可以很好的解决背景技术中第2条导致普通的形状校正不能够满足要求的问题和背景技术中第4条用户的答题卡弯曲或者折叠的问题;
S13,判断所述校正答题卡是否为预设答题卡类型的具体方法为:
S61,将所述校正答题卡的大小调整为预设答题卡的尺寸大小;
S62,随机选取所述预设答题卡中n个不重复的填涂区域;并判断调整大小后的所述校正答题卡是否与n个不重复的填涂区域中的任意一个匹配,其中n为6-10之间的任意数值;如果匹配则直接进入S14,如果不匹配,则依次采用该方法遍历所有的模板直到最后一个模板后,返回S11,并返回不支持此模板的消息。
S62,判断调整大小后的所述校正答题卡是否与n个不重复的填涂区域中的任意一个匹配与否的方法为:
其中adjust_bw为二值图像,R.y表示填涂区域在模板中的纵坐标,R.x表示填涂区域在模板中的横坐标,R.h表示填涂区域在模板中的高度,R.w表示填涂区域在模板中的纵坐标;addValue表示填涂区域被填涂的个数,Percent表示填涂的百分比;isContain表示调整大小后的所述校正答题卡是否与当前填涂区域匹配。
由于单独的根据Percent的大小来判断是否已填涂,容易受模糊、填涂大小(快速填涂时可能填充不完整)、笔的类型等情况的影响(例如:模糊会导致未进行填涂的区域的Percent值较大,甚至超过一些已填涂的区域),从而导致误识或者漏识。因此不能够很好的满足移动环境的要求。故此判断调整大小后的所述校正答题卡是否与n个不重复的填涂区域中的任意一个匹配与否时,计算S14中二值图像填涂区域的填涂比例;计算S15中灰度图像的填涂区域与灰度图像的填涂区域周围的差异值;设填涂区域为R,校正后的灰度图像为adjust_src;此时二值图像adjust_bw值为0时,则表示为未有背景,值为1时,则表示被填涂);
在计算填涂区域与周围背景的差异值时,根据韦伯定律,人的视觉随着刺激信号的变化而变化,在答题卡中这个刺激信号即填涂区域与背景的差异。因此,根据校正后的灰度图像adjust_src和模板,计算填涂区域R与周围背景的差异值。
其中,sumRect表示填涂区域点的像素值的总和,avgRect表示填涂区域像素的平均值,sumAround表示填涂区域周围背景的像素值总和,由于填涂不均匀或者光照等因素,取单一的一个点的值无法代表整个区域,故此avgAround表示周围像素的均值,Difference表示填涂区域与周围背景的差异。
在得到多个填涂区域与周围背景的差异时,则填涂了的区域其差异值(设为Difference_1)和其周围未进行填涂区域的差异值(设为Difference_2),其中Difference_1一定大于Difference_2,这个特征的特性不受光照、模糊、填涂大小及笔的种类的影响,具有较好的差异性和良好的可识别性。
S16,根据计算后的填涂比例和计算后的差异值,判断填涂区域是否已被填涂的方法具体为:
Percent大于预设的阈值threshold_percent_max,则认为已填涂;
Pecent小于预设的阈值threshold_percent_min,则认为未填涂;
设模板中填涂区域的差异值为(i),i为填涂区域的索引,j为自然数;如果存在Difference(i)–Difference(j)大于0.15则认为索引为i的区域对应的选项已填涂;对不确定的选项,根据其差异值与已确定选项的差异值来判断是否已填涂,如果靠近已填涂区域的差异值则认为已经填涂,如果靠近未填涂区域的差异值则认为未填涂。
对于不确定的选项,则具体的判断方法为:
Distance_To_Choose=|Difference-Avg_Choose_Difference|
Distance_To_UNChoose=|Difference-Avg_Choose_UNDifference|
其中Avg_Choose_Difference表示已填涂(选择)的选项的平均差异值,Avg_Choose_UNDifference表示未填涂(选择)的选项的平均价差异值。如果待确定的选项距离Avg_Choose_Difference较近,则认为是已填涂(选择)的选项,否则认为是未填涂(选择)的选项。
由上述过程可知,一副模糊图像的处理仅仅用填涂比例来判断,则将会造成很多误判,如果结果填涂区域与周围背景的差异值来判断,则可以很好的识别结果。
综上,本发明综合考虑移动环境下可能遇到的各种问题,并提供了相应的解决方案,实现了移动环境下的答题卡识别,用户只需随意的对准答题区域进行拍摄就可以很好的得到准确的答案,无需刻意的保持着固定的姿势;本发明解决光照不均匀导致答题卡识别不均的问题;通过本发明的算法校正答题卡,减少了与标准模板的偏移。通过本发明克服了因拍摄的图像模糊可能导致误识的问题。通过本发明,在填涂不完全的情况下,解决了填涂不完整导致判断不明确的问题,使之达到良好的识别效果。通过本实施例,本发明可以应用到任何与填涂相关的失败方法,并不局限于答题卡的识别。
本领域普通技术人员可以理解实现上述实施例方法中的全部或者部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于计算机可读存储介质中,所述存储介质可以是ROM/RAM,磁盘或光盘等。
本发明不局限于上述最佳实施方式,任何人在本发明的启示下都可得出其他各种形式的产品,但不论在其形状或结构上作任何变化,凡是具有与本申请相同或相近似的技术方案,均落在本发明的保护范围之内。
Claims (10)
1.一种快速的鲁棒答题卡识别方法,其特征在于,包括如下步骤:
S11,获取输入的图像,并对输入的图像进行灰度处理;并对灰度处理后的图像进行自适应二值化处理,得到自适应图像;
S12,在所述自适应图像中获取答题卡区域;并对答题卡区域进行校正及局部调整,得到校正答题卡;
S13,判断所述校正答题卡是否为预设答题卡类型;
若为预设答题卡类型,则执行S14;
若不为预设答题卡类型,则返回S11;
S14,根据所述校正答题卡属于的答题卡类型,获取所述校正答题卡的二值图像填涂区域;并计算所述二值图像填涂区域的填涂比例;
S15,根据所述校正答题卡所属的答题卡类型,获取所述校正答题卡的灰度图像的填涂区域;并计算所述灰度图像的填涂区域与所述灰度图像的填涂区域周围的差异值;
S16,根据S14计算后的填涂比例和S15计算后的差异值,判断填涂区域是否已被填涂。
2.根据权利要求1所述的快速的鲁棒答题卡识别方法,其特征在于:S11,对灰度处理后的图像进行自适应二值化处理的方法具体为:
设灰度处理后的图像为I,灰度处理后的图像的均值滤波核为K,滤波图像为I′,矩阵为Isub,T为矩阵阈值;B为二值化处理结果;
S21,对灰度处理后的图像与灰度处理后的图像的均值滤波核进行卷积运算,得到滤波图像;I′=I×K;
S22,通过灰度处理后的图像减去滤波图像,得到矩阵;Isub=I-I′;
S23,对矩阵进行二值化处理,得到二值化处理结果;
S24,将二值化处理结果构成的图像作为自适应图像。
3.根据权利要求1所述的快速的鲁棒答题卡识别方法,其特征在于:S12,在所述自适应图像中获取答题卡区域;并对答题卡区域进行校正及局部调整,得到校正答题卡的方法为:
S31,获取所述自适应图像的外轮廓,并对所述自适应图像进行过滤处理;获取所述外轮廓时,判断所述外轮廓是否位于所述自适应图像的中间位置;
若所述外轮廓不位于所述自适应图像的中间位置,则返回S11;
若所述外轮廓位于所述自适应图像的中间位置,则判断所述外轮廓是否大于预设的外轮廓阈值;
若所述外轮廓小于等于预设的外轮廓阈值时,则所述自适应图像作为取值图像;
若所述外轮廓大于预设的外轮廓阈值时,则取所述自适应图像的1/4作为取值图像;所述自适应图像的1/4具体为所述自适应图像的中心向四周均匀的取值所构成的图像;
S32,依次判断所述取值图像的轮廓中四个边角是否均为直角;如果不是直角点,则判断下一个边角,直到配对到四个直角构成矩形为止,所述取值图像中构成矩形的区域作为待校正图像;
S33,对所述待校正图像的高度和宽度进行校正,得到校正答题卡。
4.根据权利要求3所述的快速的鲁棒答题卡识别方法,其特征在于:S32,判断所述取值图像的轮廓中四个边角是否均为直角的方法具体为:
如果存在点(xi,yi)使得上式成立则认为此坐标点是直角。
5.根据权利要求3所述的快速的鲁棒答题卡识别方法,其特征在于:S33,对所述待校正图像的高度和宽度进行校正的方法为:
统计所述待校正图像的高度方向轮廓的宽度坐标的最小值和最大值,得到向量H;设H[i].minX表示第i行的最小宽度坐标,H[i].maxX表示第i行的最大宽度坐标;
判断所述待校正图像的高度方向轮廓的两边的值是否连续;具体为:判断高度方向轮廓的两边中间部分行与行之间的最小坐标之差或者最大坐标之差是否小于阈值minSubValue;如果小于阈值minSubValue,则认为轮廓的左边线连续;否则认为轮廓的左边线不连续;任意选取轮廓高度方向上的一行k作为参照行,则将轮廓高度除去k以外的其他行校正到参照行的宽度;具体公式为:
x=H[i].minX+x′*coff
Ih(i,x′)=I(i,x)
其中coff是校正系数,x’为校正后的新坐标,x为输入图像的坐标;
对宽度进行校正的同时计算高度增量:
其中η为高度校正系数;
高度增量用于调整轮廓区域的高度;
根据校正系数及高度增量实现所述待校正图像的校正。
6.根据权利要求1所述的快速的鲁棒答题卡识别方法,其特征在于:S13,判断所述校正答题卡是否为预设答题卡类型的具体方法为:
S61,将所述校正答题卡的大小调整为预设答题卡的尺寸大小;
S62,随机选取所述预设答题卡中n个不重复的填涂区域;并判断调整大小后的所述校正答题卡是否与n个不重复的填涂区域中的任意一个匹配,如果不匹配,则返回S11;
如果匹配,则为预设的答题卡类型,进入S14。
7.根据权利要求6所述的快速的鲁棒答题卡识别方法,其特征在于:S62,判断调整大小后的所述校正答题卡是否与n个不重复的填涂区域中的任意一个匹配与否的方法为:
其中adjust_bw为二值图像,R.y表示填涂区域在模板中的纵坐标,R.x表示填涂区域在模板中的横坐标,R.h表示填涂区域在模板中的高度,R.w表示填涂区域在模板中的纵坐标;addValue表示填涂区域被填涂的个数,Percent表示填涂的百分比;isContain表示调整大小后的所述校正答题卡是否与当前填涂区域匹配。
8.根据权利要求7所述的快速的鲁棒答题卡识别方法,其特征在于:判断调整大小后的所述校正答题卡是否与n个不重复的填涂区域中的任意一个匹配与否时,计算S14中二值图像填涂区域的填涂比例;计算S15中灰度图像的填涂区域与灰度图像的填涂区域周围的差异值;设填涂区域为R,校正后的灰度图像为adjust_src;
其中,sumRect表示填涂区域点的像素值的总和,avgRect表示填涂区域像素的平均值,sumAround表示填涂区域周围背景的像素值总和,avgAround表示周围像素的均值,Difference表示填涂区域与周围背景的差异。
9.根据权利要求8所述的快速的鲁棒答题卡识别方法,其特征在于:S16,根据计算后的填涂比例和计算后的差异值,判断填涂区域是否已被填涂的方法具体为:
Percent大于预设的阈值threshold_percent_max,则认为已填涂;
Pecent小于预设的阈值threshold_percent_min,则认为未填涂;
设模板中填涂区域的差异值为(i),i为填涂区域的索引,j为自然数;如果存在Difference(i)–Difference(j)大于0.15则认为索引为i的区域对应的选项已填涂;对不确定的选项,根据其差异值与已确定选项的差异值来判断是否已填涂,如果靠近已填涂区域的差异值则认为已经填涂,如果靠近未填涂区域的差异值则认为未填涂。
10.根据权利要求9所述的快速的鲁棒答题卡识别方法,其特征在于:threshold_percent_max的值为0.9;threshold_percent_min的值为0.5。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510261081.5A CN104866847B (zh) | 2015-05-20 | 2015-05-20 | 一种快速的鲁棒答题卡识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510261081.5A CN104866847B (zh) | 2015-05-20 | 2015-05-20 | 一种快速的鲁棒答题卡识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104866847A true CN104866847A (zh) | 2015-08-26 |
CN104866847B CN104866847B (zh) | 2018-03-16 |
Family
ID=53912668
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510261081.5A Active CN104866847B (zh) | 2015-05-20 | 2015-05-20 | 一种快速的鲁棒答题卡识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104866847B (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105426844A (zh) * | 2015-11-20 | 2016-03-23 | 广州未名中智教育科技有限公司 | 一种答题卡识别方法 |
CN106599887A (zh) * | 2016-11-16 | 2017-04-26 | 东莞优闪电子科技有限公司 | 试卷答题区域识别及试题评阅方法、系统 |
CN106778750A (zh) * | 2017-01-17 | 2017-05-31 | 深圳市海云天科技股份有限公司 | 一种答题卡识别点精确定位方法及系统 |
CN107506764A (zh) * | 2017-09-27 | 2017-12-22 | 武汉天量数据技术有限公司 | 一种答题卡填涂识别方法及系统 |
CN109165642A (zh) * | 2018-06-13 | 2019-01-08 | 泉州市雄蓝教育科技有限公司 | 一种基于深度学习的增强型答题卡智能识别方法 |
CN110555375A (zh) * | 2019-07-24 | 2019-12-10 | 武汉天喻教育科技有限公司 | 答题卡填涂信息的识别方法 |
CN112686143A (zh) * | 2020-12-29 | 2021-04-20 | 科大讯飞股份有限公司 | 客观题填涂的识别方法、电子设备和存储介质 |
CN113033535A (zh) * | 2021-03-11 | 2021-06-25 | 山东智多分教育科技有限公司 | 一种计算机网络阅卷系统及阅卷方法 |
CN113283431A (zh) * | 2021-07-26 | 2021-08-20 | 江西风向标教育科技有限公司 | 一种融合深度学习与逻辑判断的智能方法及系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100034484A1 (en) * | 2008-08-09 | 2010-02-11 | Keyence Corporation | Pattern Model Positioning Method In Image Processing, Image Processing Apparatus, Image Processing Program, and Computer Readable Recording Medium |
CN101901338A (zh) * | 2010-07-09 | 2010-12-01 | 北京商纳科技有限公司 | 一种试卷分数统计方法及系统 |
CN102760225A (zh) * | 2011-04-29 | 2012-10-31 | 贵州师范大学 | 一种基于矩形包围框的试卷客观题答题卡定位方法 |
CN103559490A (zh) * | 2013-10-11 | 2014-02-05 | 华南理工大学 | 基于二值图像连通域统计的答题卡自动评分方法 |
-
2015
- 2015-05-20 CN CN201510261081.5A patent/CN104866847B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100034484A1 (en) * | 2008-08-09 | 2010-02-11 | Keyence Corporation | Pattern Model Positioning Method In Image Processing, Image Processing Apparatus, Image Processing Program, and Computer Readable Recording Medium |
CN101901338A (zh) * | 2010-07-09 | 2010-12-01 | 北京商纳科技有限公司 | 一种试卷分数统计方法及系统 |
CN102760225A (zh) * | 2011-04-29 | 2012-10-31 | 贵州师范大学 | 一种基于矩形包围框的试卷客观题答题卡定位方法 |
CN103559490A (zh) * | 2013-10-11 | 2014-02-05 | 华南理工大学 | 基于二值图像连通域统计的答题卡自动评分方法 |
Non-Patent Citations (1)
Title |
---|
李晓峰: "C++对图片内容的读取与识别", 《计算机与信息技术》 * |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105426844B (zh) * | 2015-11-20 | 2018-09-18 | 广州未名中智教育科技有限公司 | 一种答题卡识别方法 |
CN105426844A (zh) * | 2015-11-20 | 2016-03-23 | 广州未名中智教育科技有限公司 | 一种答题卡识别方法 |
CN106599887A (zh) * | 2016-11-16 | 2017-04-26 | 东莞优闪电子科技有限公司 | 试卷答题区域识别及试题评阅方法、系统 |
CN106599887B (zh) * | 2016-11-16 | 2019-10-18 | 广东墨痕教育科技有限公司 | 试卷答题区域识别及试题评阅方法、系统 |
CN106778750B (zh) * | 2017-01-17 | 2020-02-04 | 深圳市海云天科技股份有限公司 | 一种答题卡识别点精确定位方法及系统 |
CN106778750A (zh) * | 2017-01-17 | 2017-05-31 | 深圳市海云天科技股份有限公司 | 一种答题卡识别点精确定位方法及系统 |
CN107506764A (zh) * | 2017-09-27 | 2017-12-22 | 武汉天量数据技术有限公司 | 一种答题卡填涂识别方法及系统 |
CN107506764B (zh) * | 2017-09-27 | 2021-07-13 | 武汉天量数据技术有限公司 | 一种答题卡填涂识别方法及系统 |
CN109165642A (zh) * | 2018-06-13 | 2019-01-08 | 泉州市雄蓝教育科技有限公司 | 一种基于深度学习的增强型答题卡智能识别方法 |
CN109165642B (zh) * | 2018-06-13 | 2022-06-07 | 泉州市雄蓝教育科技有限公司 | 一种基于深度学习的增强型答题卡智能识别方法 |
CN110555375A (zh) * | 2019-07-24 | 2019-12-10 | 武汉天喻教育科技有限公司 | 答题卡填涂信息的识别方法 |
CN110555375B (zh) * | 2019-07-24 | 2022-09-23 | 武汉天喻教育科技有限公司 | 答题卡填涂信息的识别方法 |
CN112686143A (zh) * | 2020-12-29 | 2021-04-20 | 科大讯飞股份有限公司 | 客观题填涂的识别方法、电子设备和存储介质 |
CN112686143B (zh) * | 2020-12-29 | 2023-12-01 | 科大讯飞股份有限公司 | 客观题填涂的识别方法、电子设备和存储介质 |
CN113033535A (zh) * | 2021-03-11 | 2021-06-25 | 山东智多分教育科技有限公司 | 一种计算机网络阅卷系统及阅卷方法 |
CN113283431A (zh) * | 2021-07-26 | 2021-08-20 | 江西风向标教育科技有限公司 | 一种融合深度学习与逻辑判断的智能方法及系统 |
CN113283431B (zh) * | 2021-07-26 | 2021-11-26 | 江西风向标教育科技有限公司 | 一种答题卡选项区域识别方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN104866847B (zh) | 2018-03-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104866847A (zh) | 一种快速的鲁棒答题卡识别方法 | |
CN109409366B (zh) | 基于角点检测的畸变图像校正方法及装置 | |
CN111353497B (zh) | 一种身份证信息的识别方法和装置 | |
CN105184957B (zh) | 一种纸币鉴伪方法和系统 | |
US8509536B2 (en) | Character recognition device and method and computer-readable medium controlling the same | |
US20110085732A1 (en) | Qr code processing method and apparatus thereof | |
CN111507181B (zh) | 票据图像的矫正方法、装置及计算机设备 | |
US10504215B2 (en) | Method of correcting a captured image, method of selecting a drawing sketched on a page or on two adjacent pages of a notebook, a relative app for smartphone, a hardback notebook and a hardback agenda | |
US20110228124A1 (en) | Character recognition preprocessing method and apparatus | |
CN111985465A (zh) | 文本识别方法、装置、设备及存储介质 | |
CN101887521A (zh) | 一种实现文件纠偏的方法及终端 | |
CN109063704A (zh) | 基于投影法的两阶段文档图像非线性失真校正方法 | |
CN110490886B (zh) | 一种针对倾斜视角下证件图像的自动纠正方法及系统 | |
CN110443245A (zh) | 一种非限制场景下的车牌区域的定位方法、装置及设备 | |
CN110838086A (zh) | 一种基于相关性模板匹配的室外图像拼接方法 | |
CN109741273A (zh) | 一种手机拍照低质图像的自动处理与评分方法 | |
CN115713556A (zh) | 二维码定位方法、装置及计算机可读存储介质 | |
CN114037992A (zh) | 仪表示数识别方法、装置、电子设备及存储介质 | |
US20050036706A1 (en) | Better picture for inexpensive cameras | |
CN109165642B (zh) | 一种基于深度学习的增强型答题卡智能识别方法 | |
US20170352170A1 (en) | Nearsighted camera object detection | |
CN114998347B (zh) | 一种半导体面板角点定位方法及装置 | |
US20210281742A1 (en) | Document detections from video images | |
CN104933430A (zh) | 一种用于移动终端的交互式图像处理方法及系统 | |
CN111899189A (zh) | 一种基于自适应分类拟合鱼眼图像校正方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
EXSB | Decision made by sipo to initiate substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |