CN110555375A - 答题卡填涂信息的识别方法 - Google Patents

答题卡填涂信息的识别方法 Download PDF

Info

Publication number
CN110555375A
CN110555375A CN201910679278.9A CN201910679278A CN110555375A CN 110555375 A CN110555375 A CN 110555375A CN 201910679278 A CN201910679278 A CN 201910679278A CN 110555375 A CN110555375 A CN 110555375A
Authority
CN
China
Prior art keywords
option
gray
gray level
pictures
answer sheet
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910679278.9A
Other languages
English (en)
Other versions
CN110555375B (zh
Inventor
韦阳
熊峰
黄�俊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan Tianyu Education Technology Co Ltd
Wuhan Tianyu Information Industry Co Ltd
Original Assignee
Wuhan Tianyu Education Technology Co Ltd
Wuhan Tianyu Information Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan Tianyu Education Technology Co Ltd, Wuhan Tianyu Information Industry Co Ltd filed Critical Wuhan Tianyu Education Technology Co Ltd
Priority to CN201910679278.9A priority Critical patent/CN110555375B/zh
Publication of CN110555375A publication Critical patent/CN110555375A/zh
Application granted granted Critical
Publication of CN110555375B publication Critical patent/CN110555375B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/40Image enhancement or restoration using histogram techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/136Segmentation; Edge detection involving thresholding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

图像识别技术领域,本发明公开了一种答题卡填涂信息的识别方法,包括以下步骤:S1:对所有选项图片进行灰度处理,得到所有选项图片的灰度参数;S2:根据所有选项图片灰度值的标准差,判断所述标准差是否大于标准差设定阈值,若是,则执行步骤S3,若否,则执行步骤S4;S3:确定灰度值最大的选项图片m和灰度值最小的选项图片b,计算m与该题所有选项图片的灰度参数的相似度mi,计算b与该题所有选项图片的灰度参数的相似度bi;根据mi和bi的大小关系确定该选项图片是否为填涂项;S4:判断灰度均值是否大于第一灰度设定阈值,若是,则全部为填涂项,若否,则全部为非填涂项。本发明有效地解决现有技术无法准确识别答题卡填图信息的问题。

Description

答题卡填涂信息的识别方法
技术领域
本发明涉及图像识别技术领域,具体涉及答题卡填涂信息的识别方法。
背景技术
随着信息技术的不断升级发展,计算机处理的数据量越来越大,在海量数据的采集、识别和录入问题中,发挥着越来越重要的作用。在传统的教育领域,已逐渐开展新一代的教育信息化升级。在基础教育阶段,学生学习状况的主要考察形式仍然是各种类型的考试,大至高考、中考,小至基层教师日常家庭作业、单元考试,以及各类期中期末考试、会考、联考、模考等。在此状况下,教师背负着很大的批改作业和试卷的工作量压力。因而各类标准化辅助考试方法已逐渐在各类考试中使用。
光标阅读机(Optical Mark Reader,OMR)进行答题卡自动阅卷处理的方式。光标阅读机用光学扫描的方法来识别按一定格式印刷或书写的标记,并将其转换为计算机能接受的电信号,从而实现自动阅卷。但是光标阅读机存在整套设备价格昂贵,图像不能保存待查的问题。
利用图像处理技术对经过扫描的答题卡的数据进行识别的方式,这种方式也是模拟光学标记阅读机的原理来实现的。基本方法是:对于选项填涂区域进行二值化处理,即设定阈值,图像中大于阈值的像素点的像素值设为255,小于阈值的像素点的像素值设为0。现有技术通过固定阈值和大津法(OTSU)来设定该阈值,然后统计选项区域内像素点的数量,若大于某一个阈值即认为已填涂,否则就是未填涂。
但是这种方式往往对填涂的要求比较苛刻,如必须将选项区域完全涂满,且笔的颜色灰度必须足够深。如果用户在一次考试中有的选项填涂程度较重,有的填涂程度较轻,在二值化的过程中容易漏掉一些填涂区域,从而降低整个阅卷系统的识别准确率。所以对于高考、中考、四六级等标准化考试而言,这种方法是可行的,但对于单元考试,期末考试这样的就不是很适合,因为答题卡的纸质各异,填涂铅笔的质量不一,考生的重视程度都会与标准化考试有一定差距,造成填涂不完整、不规范的概率很大,同样的阈值无法适应各种因素的影响,需要不断的在线或离线地调整系统阈值,才能达到一定的准确率,如果不对阈值进行调整,就无法准确反映考生的考试成绩。
发明内容
针对现有技术中存在的缺陷,本发明的目的在于提供一种答题卡填涂信息的识别方法,能有效地解决无法准确识别答题卡填图信息的问题。
为达到以上目的,本发明采取的技术方案是:
一种答题卡填涂信息的识别方法,包括以下步骤:
S1:对一道题的所有选项图片进行灰度处理,得到所有选项图片的灰度参数,所述灰度参数包括灰度值;
S2:根据该题对应的所有选项图片灰度值,计算标准差,判断所述标准差是否大于标准差设定阈值,若是,则执行步骤S3,若否,则执行步骤S4;
S3:根据所有选项图片的灰度参数,确定灰度值最大的选项图片m和灰度值最小的选项图片b,计算m与该题所有选项图片的灰度参数的相似度mi,计算b与该题所有选项图片的灰度参数的相似度bi;根据mi和bi的大小关系确定该选项图片是否为填涂项;
S4:判断所有选项的灰度均值是否大于第一灰度设定阈值,若是,则全部为填涂项,若否,则全部为非填涂项。
在上述技术方案的基础上,当步骤S3中判断存在多个填涂项时,则判断该题所有选项图片的灰度值均值与各个填涂项的灰度值的差是否大于第二灰度设定阈值,若是,则为有效填涂项,若否,则为非填涂项。
在上述技术方案的基础上,根据mi和bi的大小关系确定该选项是否为填涂项,具体包括:
若相似度越高,mi和bi的值越小,当mi大于bi时,该选项图片为填涂项。
在上述技术方案的基础上,根据mi和bi的大小关系确定该选项是否为填涂项,具体包括:
若相似度越高,mi和bi的值越大,当bi大于mi时,该选项图片为填涂项。
在上述技术方案的基础上,所述灰度参数还包括灰度直方图,将选项m的灰度直方图分别与每个选项的灰度直方图对比得到与每个选项的相似度mi,将选项b的灰度直方图分别与每个选项的灰度直方图对比得到与每个选项的相似度bi
在上述技术方案的基础上,将选项a和选项b的灰度直方图分别与每个选项的灰度直方图对比采用开源计算机视觉库Opencv的库函数。
在上述技术方案的基础上,开源计算机视觉库Opencv的库函数包括相关性比较Correlation、卡方比较Chi-Square、十字交叉性Intersection或巴氏距离Bhattacharyyadistance。
在上述技术方案的基础上,在进行S1步骤之前,还包括对答题卡图像的预处理,包括答题卡图像的图像分割和图像校正,得到每一道题的所有选项图片。
与现有技术相比,本发明的优点在于:先通过标准差初步确认是否存在填涂项或者均填涂和非填涂项;在确认有填涂项进一步通过引入灰度值最大的选项图片和灰度值最小的选项图片与各个选项图片的相似度对比,确定填涂项。进一步地,通过判断各个填涂项的灰度值与该题所有选项图片的灰度值均值的差是否大于第二灰度设定阈值,确定有效的填涂项,克服现有识别算法兼容性较差和识别效率较低的问题,可以兼容不同纸张的答题卡,选项区域有半框、全框或者字母等类型,对浅填涂,擦除能够进行有效区分且具有很快的识别速度和较高的鲁棒性的方法。
附图说明
图1为本发明实施例中答题卡填涂信息的识别方法的流程图。
具体实施方式
以下结合附图及实施例对本发明作进一步详细说明。
参见图1所示,本发明实施例提供一种答题卡填涂信息的识别方法,包括以下步骤:
S1:对一道题的所有选项图片进行灰度处理,得到所有选项图片的灰度参数,所述灰度参数包括灰度值。
优选地,在进行S1步骤之前,还包括对答题卡图像的预处理,包括答题卡图像的图像分割和图像校正,得到每一道题的所有选项图片。
S2:根据该题对应的所有选项图片灰度值,计算标准差,判断所述标准差是否大于标准差设定阈值,若是,则执行步骤S3,若否,则执行步骤S4。在本实施例中,通过该题所有选项图片的灰度值,计算其标准差。在本实施例中,标准差设定阈值为10,实际计算时标准差的结果保留小数点后三位有效数字,等于10.000的概率不高,若出现标准差等于设定阈值,需要将该题作为怀疑项输出,由人工进行判定。
S3:根据所有选项图片的灰度参数,确定灰度值最大的选项图片m和灰度值最小的选项图片b,计算m与该题所有选项图片的灰度参数的相似度mi,计算b与该题所有选项图片的灰度参数的相似度bi;根据mi和bi的大小关系确定该选项图片是否为填涂项。
在本实施例中,mi为灰度值最大的选项图片m与第i个选项图片的灰度参数的相似度;bi为灰度值最小的选项图片b与第i个选项图片的灰度参数的相似度。
优选地,当步骤S3中判断存在多个填涂项时,则判断该题所有选项图片的灰度值均值与各个填涂项的灰度值的差是否大于第二灰度设定阈值,若是,则为有效填涂项,若否,则为非填涂项。其中各个填涂项为步骤S3中判断出存在的多个填涂项。该步骤可以排除擦除项的影响。
在本实施例中,该题所有选项图片的灰度值均值与各个填涂项的灰度值的差即为该题所有选项图片的灰度值均值减去各个填涂项的灰度值的差。在本实施例中,第二灰度设定阈值设为10。即该题所有选项图片的灰度值均值与各个填涂项的灰度值的差大于10时,则为有效填涂项,否则,则为非填涂项。
优选地,在一种实施例中,根据mi和bi的大小关系确定该选项是否为填涂项,具体包括:
若相似度越高,mi和bi的值越小,即mi值越小,说明该选项与未填涂的选项越接近,bi越小,说明该选项与填涂选项约接近,当mi大于bi时,该选项图片为填涂项。在本实施例中,mi等于bi,mi等于bi之间做差之后的小数点后三位有效数字,三位有效数字都相同的概率不高,若出现这种情况,需要将该题作为怀疑项输出,由人工进行判定。
优选地,在另一种实施例中,根据mi和bi的大小关系确定该选项是否为填涂项,具体包括:
若相似度越高,mi和bi的值越大,即mi值越大,说明该选项与未填涂的选项越接近,bi越大,说明该选项与填涂选项约接近,当bi大于mi时,该选项图片为填涂项。在本实施例中,mi等于bi,mi等于bi之间做差之后的小数点后三位有效数字,三位有效数字都相同的概率不高,若出现这种情况,需要将该题作为怀疑项输出,由人工进行判定。
在计算灰度值最大的选项图片m和灰度值最小的选项图片b和各个选项图片的相似度,优选地,所述灰度参数还包括灰度直方图,将选项m的灰度直方图分别与每个选项的灰度直方图对比得到与每个选项的相似度mi,将选项b的灰度直方图分别与每个选项的灰度直方图对比得到与每个选项的相似度bi
进一步地,将选项a和选项b的灰度直方图分别与每个选项的灰度直方图对比采用开源计算机视觉库Opencv的库函数。
进一步地,开源计算机视觉库Opencv的库函数包括相关性比较Correlation、卡方比较Chi-Square、十字交叉性Intersection或巴氏距离Bhattacharyya distance。
S4:判断所有选项的灰度均值是否大于第一灰度设定阈值,若是,则全部为填涂项,若否,则全部为非填涂项。
在本实施例中,第一灰度设定阈值为156.5,即所有选项的灰度均值大于156.5时,则全部为填涂项,否则,则全部为非填涂项。
综上所述,先通过标准差初步确认是否存在填涂项或者均填涂和非填涂项;在确认有填涂项进一步通过引入灰度值最大的选项图片和灰度值最小的选项图片与各个选项图片的相似度对比,确定填涂项。进一步地,通过判断各个填涂项的灰度值与该题所有选项图片的灰度值均值的差是否大于第二灰度设定阈值,确定有效的填涂项,克服现有识别算法兼容性较差和识别效率较低的问题,可以兼容不同纸张的答题卡,选项区域有半框、全框或者字母等类型,对浅填涂,擦除能够进行有效区分且具有很快的识别速度和较高的鲁棒性的方法。
本发明不局限于上述实施方式,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围之内。本说明书中未作详细描述的内容属于本领域专业技术人员公知的现有技术。

Claims (8)

1.一种答题卡填涂信息的识别方法,其特征在于,包括以下步骤:
S1:对一道题的所有选项图片进行灰度处理,得到所有选项图片的灰度参数,所述灰度参数包括灰度值;
S2:根据该题对应的所有选项图片灰度值,计算标准差,判断所述标准差是否大于标准差设定阈值,若是,则执行步骤S3,若否,则执行步骤S4;
S3:根据所有选项图片的灰度参数,确定灰度值最大的选项图片m和灰度值最小的选项图片b,计算m与该题所有选项图片的灰度参数的相似度mi,计算b与该题所有选项图片的灰度参数的相似度bi;根据mi和bi的大小关系确定该选项图片是否为填涂项;
S4:判断所有选项的灰度均值是否大于第一灰度设定阈值,若是,则全部为填涂项,若否,则全部为非填涂项。
2.如权利要求1所述的答题卡填涂信息的识别方法,其特征在于:当步骤S3中判断存在多个填涂项时,则判断该题所有选项图片的灰度值均值与各个填涂项的灰度值的差是否大于第二灰度设定阈值,若是,则为有效填涂项,若否,则为非填涂项。
3.如权利要求1所述的答题卡填涂信息的识别方法,其特征在于,根据mi和bi的大小关系确定该选项是否为填涂项,具体包括:
若相似度越高,mi和bi的值越小,当mi大于bi时,该选项图片为填涂项。
4.如权利要求1所述的答题卡填涂信息的识别方法,其特征在于,根据mi和bi的大小关系确定该选项是否为填涂项,具体包括:
若相似度越高,mi和bi的值越大,当bi大于mi时,该选项图片为填涂项。
5.如权利要求1所述的答题卡填涂信息的识别方法,其特征在于:所述灰度参数还包括灰度直方图,将选项m的灰度直方图分别与每个选项的灰度直方图对比得到与每个选项的相似度mi,将选项b的灰度直方图分别与每个选项的灰度直方图对比得到与每个选项的相似度bi
6.如权利要求7所述的答题卡填涂信息的识别方法,其特征在于:将选项a和选项b的灰度直方图分别与每个选项的灰度直方图对比采用开源计算机视觉库Opencv的库函数。
7.如权利要求8所述的答题卡填涂信息的识别方法,其特征在于:开源计算机视觉库Opencv的库函数包括相关性比较Correlation、卡方比较Chi-Square、十字交叉性Intersection或巴氏距离Bhattacharyya distance。
8.如权利要求1所述的答题卡填涂信息的识别方法,其特征在于:在进行S1步骤之前,还包括对答题卡图像的预处理,包括答题卡图像的图像分割和图像校正,得到每一道题的所有选项图片。
CN201910679278.9A 2019-07-24 2019-07-24 答题卡填涂信息的识别方法 Active CN110555375B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910679278.9A CN110555375B (zh) 2019-07-24 2019-07-24 答题卡填涂信息的识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910679278.9A CN110555375B (zh) 2019-07-24 2019-07-24 答题卡填涂信息的识别方法

Publications (2)

Publication Number Publication Date
CN110555375A true CN110555375A (zh) 2019-12-10
CN110555375B CN110555375B (zh) 2022-09-23

Family

ID=68736398

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910679278.9A Active CN110555375B (zh) 2019-07-24 2019-07-24 答题卡填涂信息的识别方法

Country Status (1)

Country Link
CN (1) CN110555375B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112528930A (zh) * 2020-12-22 2021-03-19 山东山大鸥玛软件股份有限公司 一种光学标记异常填涂识别方法、系统、终端及存储介质
CN112818765A (zh) * 2021-01-18 2021-05-18 中科院成都信息技术股份有限公司 一种图像填涂识别方法、装置、系统、以及存储介质
CN113408521A (zh) * 2021-07-16 2021-09-17 北京南昊科技股份有限公司 答题图片识别方法、批阅装置及存储介质
CN113743294A (zh) * 2021-09-02 2021-12-03 科大讯飞股份有限公司 客观题答题识别方法和阅卷系统、设备、介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104239850A (zh) * 2014-07-16 2014-12-24 华南理工大学 基于图像综合特征的答题卡填涂信息自动识别方法
CN104866847A (zh) * 2015-05-20 2015-08-26 李宇 一种快速的鲁棒答题卡识别方法
CN108537218A (zh) * 2018-04-12 2018-09-14 湖南诚壹文化产业有限公司 一种答题卡的识别处理方法及装置
US20180286263A1 (en) * 2017-03-30 2018-10-04 Kyocera Document Solutions Inc. Image reading device and image forming apparatus

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104239850A (zh) * 2014-07-16 2014-12-24 华南理工大学 基于图像综合特征的答题卡填涂信息自动识别方法
CN104866847A (zh) * 2015-05-20 2015-08-26 李宇 一种快速的鲁棒答题卡识别方法
US20180286263A1 (en) * 2017-03-30 2018-10-04 Kyocera Document Solutions Inc. Image reading device and image forming apparatus
CN108537218A (zh) * 2018-04-12 2018-09-14 湖南诚壹文化产业有限公司 一种答题卡的识别处理方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
宋帅杨: "人脸识别在平台下的研究与实现", 《中国优秀博硕士学位论文全文数据库(硕士) 信息科技辑》 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112528930A (zh) * 2020-12-22 2021-03-19 山东山大鸥玛软件股份有限公司 一种光学标记异常填涂识别方法、系统、终端及存储介质
CN112528930B (zh) * 2020-12-22 2022-10-14 山东山大鸥玛软件股份有限公司 一种光学标记异常填涂识别方法、系统、终端及存储介质
CN112818765A (zh) * 2021-01-18 2021-05-18 中科院成都信息技术股份有限公司 一种图像填涂识别方法、装置、系统、以及存储介质
CN112818765B (zh) * 2021-01-18 2023-09-19 中科院成都信息技术股份有限公司 一种图像填涂识别方法、装置、系统、以及存储介质
CN113408521A (zh) * 2021-07-16 2021-09-17 北京南昊科技股份有限公司 答题图片识别方法、批阅装置及存储介质
CN113408521B (zh) * 2021-07-16 2023-09-05 北京南昊科技股份有限公司 答题图片识别方法、批阅装置及存储介质
CN113743294A (zh) * 2021-09-02 2021-12-03 科大讯飞股份有限公司 客观题答题识别方法和阅卷系统、设备、介质
CN113743294B (zh) * 2021-09-02 2024-06-04 科大讯飞股份有限公司 客观题答题识别方法和阅卷系统、设备、介质

Also Published As

Publication number Publication date
CN110555375B (zh) 2022-09-23

Similar Documents

Publication Publication Date Title
CN110555375B (zh) 答题卡填涂信息的识别方法
CN110008933B (zh) 一种通用智能阅卷系统和方法
US11790641B2 (en) Answer evaluation method, answer evaluation system, electronic device, and medium
US8600165B2 (en) Optical mark classification system and method
CN108171297A (zh) 一种答题卡识别方法及装置
CN108764352B (zh) 重复页面内容检测方法和装置
CN111597908A (zh) 试卷批改方法和试卷批改装置
CN110597806A (zh) 一种基于批阅识别的错题集生成与答题统计系统及方法
CN110956138B (zh) 一种基于家教设备的辅助学习方法及家教设备
CN109242856A (zh) 一种纸质作业电子化批阅方法及装置
CN110135225B (zh) 样本标注方法及计算机存储介质
CN114549993B (zh) 实验中线段图像的评分方法、系统、设备及可读存储介质
CN106815814B (zh) 一种应用于阅卷系统的图像污染处理方法
CN111814616A (zh) 一种无需答题卡的试卷自动阅卷处理系统及其实现方法
CN111915635A (zh) 支持自阅卷的试题解析信息生成方法及系统
CN115393861B (zh) 一种手写体文本精准分割方法
CN110929562A (zh) 一种基于改进Hough变换的答题卡识别方法
CN115880566A (zh) 一种基于视觉分析的智能阅卷系统
CN111008594B (zh) 改错题评阅方法、相关设备及可读存储介质
CN113762274B (zh) 一种答题卡目标区域检测方法、系统、存储介质及设备
CN104077562B (zh) 一种答卷的扫描方向判断方法
CN112926571A (zh) 一种基于深度学习的公式图片识别判题系统
CN108681713A (zh) 一种用于教师教学质量评价的系统
CN110298236B (zh) 一种基于深度学习的盲文图像自动识别方法和系统
CN116012860B (zh) 一种基于图像识别的教师板书设计水平诊断方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant