CN110414563A - 考试成绩统计方法、系统及计算机可读存储介质 - Google Patents
考试成绩统计方法、系统及计算机可读存储介质 Download PDFInfo
- Publication number
- CN110414563A CN110414563A CN201910565045.6A CN201910565045A CN110414563A CN 110414563 A CN110414563 A CN 110414563A CN 201910565045 A CN201910565045 A CN 201910565045A CN 110414563 A CN110414563 A CN 110414563A
- Authority
- CN
- China
- Prior art keywords
- examination
- image
- information
- correcting
- score
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000007619 statistical method Methods 0.000 title claims abstract description 39
- 238000003860 storage Methods 0.000 title claims abstract description 8
- 238000012360 testing method Methods 0.000 claims abstract description 42
- 238000012545 processing Methods 0.000 claims abstract description 18
- 238000006243 chemical reaction Methods 0.000 claims abstract description 16
- 238000010276 construction Methods 0.000 claims abstract description 11
- 238000004590 computer program Methods 0.000 claims description 10
- 238000013527 convolutional neural network Methods 0.000 claims description 7
- 238000000605 extraction Methods 0.000 claims description 6
- 230000008859 change Effects 0.000 claims description 5
- 238000012216 screening Methods 0.000 claims description 4
- 238000000034 method Methods 0.000 abstract description 15
- 238000013095 identification testing Methods 0.000 abstract description 8
- 238000012549 training Methods 0.000 abstract description 6
- 238000010586 diagram Methods 0.000 description 11
- 239000000284 extract Substances 0.000 description 11
- 238000004458 analytical method Methods 0.000 description 9
- 230000008569 process Effects 0.000 description 8
- 230000009286 beneficial effect Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000007596 consolidation process Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 230000007306 turnover Effects 0.000 description 3
- 238000004040 coloring Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000010191 image analysis Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
- 238000003892 spreading Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
Abstract
本发明提出了一种考试成绩统计方法、系统及计算机可读存储介质,其中,方法包括:获取答卷图像;对答卷图像进行颜色空间变换处理,得到子图像;根据预设分量范围确定子图像中批改位置信息;获取子图像中的批改图像;根据批改图像构建识别模型;匹配答卷图像与识别模型,识别答卷图像的批改信息;根据批改信息、批改位置信息、试题位置信息和分值信息生成试题分数;根据试题分数统计考试成绩。一方面,实现了在传统的纸质批改基础上智能化的批改信息识别,另一方面,能够准确定位至具体题目,判断单个题目的批改结果以及得分并完成得分汇总,在保留了传统批改形式的同时实现了成绩统计,无需复杂的操作和专业的培训,容易上手。
Description
技术领域
本发明涉及图像处理技术领域,具体而言,涉及一种考试成绩统计方法、一种考试成绩统计系统及一种计算机可读存储介质。
背景技术
现有的初中、高中日常试卷的题目类型一般包括选择题、填空题以及问答大题。对于日常小考而言一般步骤是学生直接在试卷或者答题卡上作答,老师在试卷或者答题纸上使用红笔批改,最后老师需要人工统计试卷卷面总分、学生考试成绩排名以及考试题目错误类型统计等。
对纸质类型的试卷,老师需要花费大量的时间以及人力进行分数统计、错题统计、得分排名等任务。现有一些技术如专利CN107665474A、专利CN106934767A针对这些问题提出的电子化的试卷系统避开了纸质试卷或者答题卡的处理,电子化的批改过程需要人工操作电脑完成批改,虽然也能保证结果准确但要求电脑录入各种试卷数据,操作较为繁琐,不易上手,并不符合老师的日常批改习惯,并且考生收到电子批改后的答卷与交上去的相同,没有任何老师的批阅痕迹,老师和考生均无法通过答卷了解哪道题做错了,对于老师和考生来说电子化判卷并不比传统方式直观高效,使得试卷得分统计过程变得复杂。
发明内容
本发明旨在至少解决现有技术或相关技术中存在的技术问题之一。
为此,本发明第一方面在于提出了一种考试成绩统计方法。
本发明的第二方面在于提出了一种考试成绩统计系统。
本发明的第三方面在于提出了一种计算机可读存储介质。
有鉴于此,根据本发明的第一方面,提出了一种考试成绩统计方法,包括:获取答卷图像;对答卷图像进行颜色空间变换处理,得到子图像;根据预设分量范围确定子图像中批改位置信息;获取子图像中的批改图像;根据批改图像构建识别模型;匹配答卷图像与识别模型,识别答卷图像的批改信息;根据批改信息、批改位置信息、试题位置信息和分值信息生成试题分数;根据试题分数统计考试成绩。
本发明提供的考试成绩统计方法,学生完成考试后由老师手工用彩笔完成试卷答题对错的批改并给出得分,获取老师批改完成的试卷彩色图像,将批改后的答卷图像由RGB(色彩标准)空间变换为HSV(色调、饱和度、明度)颜色空间,得到子图像,根据预设分量范围去除非批改颜色部分的信息,确定子图像中批改颜色信息的位置,即批改位置信息,根据批改位置信息提取出子图像中的批改图像,根据批改图像构建识别模型并与答卷图像匹配,识别答卷图像的批改信息,根据批改信息、批改位置信息、试题位置信息和分值信息生成试题分数,根据试题分数完成考试成绩统计。通过上述考试成绩统计方法,一方面,对批改试卷或者答题纸上的答题和得分区域内给出“√”和“×”的对错判定以及得分进行识别,实现了在传统的纸质批改基础上智能化识别批改信息,另一方面,根据已有的试题位置信息、分值信息结合识别出的批改信息、批改位置信息能够准确定位至具体题目,判断单个题目的批改结果以及得分并完成得分汇总,在保留了传统批改形式的同时实现了成绩统计,无需复杂的操作和专业的培训,容易上手。
具体地,预设分量范围包括色调(H)分量范围、饱和度(S)分量范围、明度(V)分量的范围,其中H分量范围根据老师批改时采用的痕迹颜色进行设置,对S和V分量范围设置为大于20的合理值,从而在进行颜色空间变换后保留HSV颜色空间中批改时所用颜色表示范围内的部分。
另外,根据本发明提供的上述技术方案中考试成绩统计方法,还可以具有如下附加技术特征:
在上述技术方案中,优选地,获取子图像中的批改图像的步骤,具体包括:对子图像进行预处理,得到二值图像;识别二值图像的轮廓点集;根据轮廓点集确定批改文本轮廓和批改矩形框;对批改文本轮廓进行平滑处理,得到文本模版;根据文本模版、批改矩形框和子图像提取批改图像。
在该技术方案中,识别二值图像中的轮廓点集,填充轮廓点集得到批改文本轮廓,即彩色批改痕迹,轮廓点集的最大外接矩形作为批改矩形框,对批改文本轮廓进行平滑处理,得到文本模版,通过将彩色文本模版与子图像中的信息进行对比,重合的部分即为有效的批改痕迹,在按照批改矩形框提取该重合的部分,得到批改图像。通过上述技术方案,能够对老师批改痕迹进行提取、过滤、合并,有效去除图像当中的干扰信息,以便于后续准确提取出有效信息,增强有效信息的可检测行并最大限度简化数据,提升后续匹配、识别的可靠性,解决了由于老师批改时多样的书写习惯造成的提升识别试卷批改结果难度的问题,有效降低误识别的情况。
具体地,预处理包括:灰度处理和二值化处理,其中,二值化处理的步骤包括:确定灰度处理后图像的像素点的灰度值,若灰度值小于或等于二值化阈值,灰度值设置为0,若灰度值大于二值化阈值,灰度值设置为255。
在上述任一技术方案中,优选地,根据轮廓点集确定批改文本轮廓的步骤,具体包括:根据轮廓点集识别二值图像的文本骨架;检测文本骨架的端点;若文本骨架的端点与除文本骨架的端点以外的任一端点之间的距离小于距离阈值,合并文本骨架的端点和除文本骨架的端点以外的任一端点,得到目标轮廓点集;填充目标轮廓点集,得到批改文本轮廓。
在该技术方案中,获取二值图像的文本骨架端点,若同一个文本骨架上的任意两个端点之间的距离小于距离阈值,说明这两个端点距离较近,此时合并这两个端点,得到目标轮廓点集,填充目标轮廓点集,得到批改文本轮廓,从而避免了因书写和彩色批改痕迹与黑色答题痕迹重叠造成的批改痕迹笔画断裂情况,并解决了数字“5”、数字“10”及以上的这类多笔画数字轮廓点集的合并问题,优化提取图像过程中笔画合并算法,进而增加后续识别批改信息的准确度。其中,端点为笔画的起始点、笔画转折或相交的点,在批改过程中出现的笔迹断点往往从这些点开始或者结束,距离阈值可根据实际书写经验合理设置。
在上述任一技术方案中,优选地,根据轮廓点集确定批改文本轮廓和批改矩形框的步骤之后,还包括:根据预设尺寸范围筛选批改矩形框。
在该技术方案中,根据预设尺寸范围筛选批改矩形框,从而去除过大或过小的批改文本轮廓,以便于后续准确提取出有效信息,增强有效信息的可检测行并最大限度简化数据,有效降低误识别的情况。
在上述任一技术方案中,优选地,根据所述批改图像构建识别模型的步骤之前,还包括:对批改图像进行扩充处理,以使批改图像的高度等于批改图像的宽度。
在该技术方案中,考虑到构建识别模型时的图像要求,批改图像需要进行缩放处理,但这种直接缩放方式产生的图像形变会导致一些字符形态特征变化,影响识别精度,如数字“1”、“7”、“9”等的特征辨识度会降低,所以当批改图像的宽度W和高度H不相等时,通过对批改图像的短边缘进行扩充处理,以使批改图像的高度等于批改图像的宽度,即使进行图像缩放,也不会影响字符特征,保证了识别的准确度。
在上述任一技术方案中,优选地,根据批改信息、批改位置信息、试题位置信息和分值信息生成试题分数的步骤之前,还包括:获取空白试卷图像;分析并识别空白试卷图像的版面信息;根据版面信息确定试题位置信息和分值信息。
在该技术方案中,对空白试卷图像进行试题版面分析,根据版面信息确定试题位置信息和分值信息,包括单个试题的设置分数、试题的位置、有效得分区域的位置信息等,再结合识别出的批改信息和批改位置信息,实现了批改信息的定位,从而准确判断出单个题目的批改结果和得分,汇总所有单个题目得分得到单张试卷的卷面总分。
在上述任一技术方案中,优选地,还包括:根据试题分数确定错题信息;根据错题信息和考试成绩生成考试报告。
在该技术方案中,根据试题分数确定错题信息,根据错题信息分析单个题目的错误率等信息,根据考试成绩分析考生的平均得分等信息,并生成考试报告,使老师能够直观的了解到考生知识点的掌握情况,从而进行精准的教学任务。
在上述任一技术方案中,优选地,识别模型为多层卷积神经网络识别模型。
在该技术方案中,采用传统的多层卷积神经网络的识别模型,而不是深层的识别模型,若使用深层的识别模型如VGGNet(VGG网络结构模型)、GoogleNet(谷歌网络结构模型)、ResNet(深度残差网络模型)等虽然能达到相似的效果,但会消耗更多的计算资源影响判别速度,从而造成资源的浪费。
根据本发明的第二方面,提出了一种考试成绩统计系统,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述任一技术方案中考试成绩统计方法。因此具有上述任一技术方案中考试成绩统计方法的全部有益效果,在此不再赘述。
根据本发明的第三方面,提出了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现如上述任一技术方案中考试成绩统计方法的步骤。因此具有上述任一技术方案中考试成绩统计方法的全部有益效果,在此不再赘述。
本发明的附加方面和优点将在下面的描述部分中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1示出了本发明的一个实施例的考试成绩统计方法流程示意图;
图2示出了本发明又一个实施例的考试成绩统计方法流程示意图;
图3示出了本发明又一个实施例的考试成绩统计方法流程示意图;
图4示出了本发明又一个实施例的考试成绩统计方法流程示意图;
图5示出了本发明一个具体实施例的考试成绩统计方法流程示意图;
图6示出了本发明一个具体实施例的文本骨架端点检测结果图像;
图7示出了本发明的一个具体实施例的批改文本轮廓图像;
图8示出了本发明的一个具体实施例的批改图像;
图9示出了图8扩展处理后的批改图像;
图10示出了本发明的一个实施例的考试成绩统计系统示意框图。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是,在不冲突的情况下,本发明的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述的其他方式来实施,因此,本发明的保护范围并不限于下面公开的具体实施例的限制。
本发明第一方面的实施例,提出一种考试成绩统计方法,图1示出了本发明的一个实施例的考试成绩统计方法流程示意图。其中,该方法包括:
步骤102,获取答卷图像;
步骤104,对答卷图像进行颜色空间变换处理,得到子图像;
步骤106,根据预设分量范围确定子图像中批改位置信息;
步骤108,获取子图像中的批改图像;
步骤110,根据批改图像构建识别模型;
步骤112,匹配答卷图像与识别模型,识别答卷图像的批改信息;
步骤114,根据批改信息、批改位置信息、试题位置信息和分值信息生成试题分数;
步骤116,根据试题分数统计考试成绩。
本实施例提供的考试成绩统计方法,学生完成考试后由老师手工用彩笔完成试卷答题对错的批改并给出得分,获取老师批改完成的试卷彩色图像,将批改后的答卷图像由RGB(色彩标准)空间变换为HSV(色调、饱和度、明度)颜色空间,得到子图像,根据预设分量范围去除非批改颜色部分的信息,确定子图像中批改颜色信息的位置,即批改位置信息,根据批改位置信息提取出子图像中的批改图像,根据批改图像构建识别模型并与答卷图像匹配,识别答卷图像的批改信息,根据批改信息、批改位置信息、试题位置信息和分值信息生成试题分数,根据试题分数完成考试成绩统计。通过上述考试成绩统计方法,一方面,对批改试卷或者答题纸上的答题和得分区域内给出“√”和“×”的对错判定以及得分进行识别,实现了在传统的纸质批改基础上智能化识别批改信息,另一方面,根据已有的试题位置信息、分值信息结合识别出的批改信息、批改位置信息能够准确定位至具体题目,判断单个题目的批改结果以及得分并完成得分汇总,在保留了传统批改形式的同时实现了成绩统计,无需复杂的操作和专业的培训,容易上手。
具体实施例中,识别模型为多层卷积神经网络识别模型,预设分量范围包括色调(H)分量范围、饱和度(S)分量范围、明度(V)分量范围,其中H分量根据老师批改时采用的痕迹颜色进行设置,对S和V分量的范围值设置为大于20的合理值,从而在进行颜色空间变换后保留HSV颜色空间中批改时所用颜色表示范围内的部分。
图2示出了本发明又一个实施例的考试成绩统计方法流程示意图。其中,该方法包括:
步骤202,获取答卷图像;
步骤204,对答卷图像进行颜色空间变换处理,得到子图像;
步骤206,根据预设分量范围确定子图像中批改位置信息;
步骤208,对子图像进行预处理,得到二值图像;
步骤210,识别二值图像的轮廓点集;
步骤212,根据轮廓点集确定批改文本轮廓和批改矩形框;
步骤214,根据预设尺寸范围筛选批改矩形框;
步骤216,对批改文本轮廓进行平滑处理,得到文本模版;
步骤218,根据文本模版、批改矩形框和子图像提取批改图像;
步骤220,根据批改图像构建识别模型;
步骤222,匹配答卷图像与识别模型,识别答卷图像的批改信息;
步骤224,根据批改信息、批改位置信息、试题位置信息和分值信息生成试题分数;
步骤226,根据试题分数统计考试成绩。
在该实施例中,识别二值图像中的轮廓点集,填充轮廓点集得到批改文本轮廓,即彩色批改痕迹,文本轮廓的最大外接矩形作为批改矩形框,对批改文本轮廓进行平滑处理,得到文本模版,通过将彩色文本模版与子图像中的信息进行对比,重合的部分即为有效的批改痕迹,在按照批改矩形框提取该重合的部分,得到批改图像。通过上述实施例,能够对老师批改痕迹进行提取、过滤、合并,有效去除图像当中的干扰信息,以便于后续准确提取出有效信息,增强有效信息的可检测行并最大限度简化数据,提升后续匹配、识别的可靠性,解决了由于老师批改时多样的书写习惯造成的提升识别试卷批改结果难度的问题,有效降低误识别的情况。
具体实施例中,预处理包括:灰度处理和二值化处理,其中,二值化处理的步骤包括:确定灰度处理后图像的像素点的灰度值,若灰度值小于或等于二值化阈值,灰度值设置为0,若灰度值大于二值化阈值,灰度值设置为255。
在本发明的一个实施例中,优选地,根据轮廓点集确定批改文本轮廓的步骤,具体包括:根据轮廓点集识别二值图像的文本骨架;检测文本骨架的端点;若文本骨架的端点与除文本骨架的端点以外的任一端点之间的距离小于距离阈值,合并文本骨架的端点和除文本骨架的端点以外的任一端点,得到目标轮廓点集;填充目标轮廓点集,得到批改文本轮廓。
在该实施例中,获取二值图像的文本骨架端点,若同一个文本骨架上的任意两个端点之间的距离小于距离阈值,说明这两个端点距离较近,此时合并这两个端点,得到目标轮廓点集,填充目标轮廓点集,得到批改文本轮廓,从而避免了因书写和彩色批改痕迹与黑色答题痕迹重叠造成的批改痕迹笔画断裂情况,并解决了数字“5”、数字“10”及以上的这类多笔画数字轮廓点集的合并问题,优化提取图像过程中笔画合并算法,进而增加后续识别批改信息的准确度。其中,端点为笔画的起始点、笔画转折或相交的点,在批改过程中出现的笔迹断点往往从这些点开始或者结束,距离阈值可根据实际书写经验合理设置。
图3示出了本发明又一个实施例的考试成绩统计方法流程示意图。其中,该方法包括:
步骤302,获取答卷图像和空白试卷图像;
步骤304,对答卷图像进行颜色空间变换处理,得到子图像;
步骤306,根据预设分量范围确定子图像中批改位置信息;
步骤308,获取子图像中的批改图像;
步骤310,对批改图像进行扩充处理;
步骤312,根据批改图像构建识别模型;
步骤314,匹配答卷图像与识别模型,识别答卷图像的批改信息;
步骤316,分析并识别空白试卷图像的版面信息;
步骤318,根据版面信息确定试题位置信息和分值信息;
步骤320,根据批改信息、批改位置信息、试题位置信息和分值信息生成试题分数;
步骤322,根据试题分数统计考试成绩。
在该实施例中,考虑到匹配识别模型时的图像要求,批改图像需要进行缩放处理,但这种直接缩放方式产生的图像形变会导致一些字符形态特征变化,影响识别精度,如数字“1”、“7”、“9”等的特征辨识度会降低,所以当批改图像的宽度W和高度H不相等时,通过对批改图像的短边缘进行扩充处理,以使批改图像的高度等于批改图像的宽度,即使进行图像缩放,也不会影响字符特征,保证了识别的准确度,并且对空白试卷图像进行试题版面分析,根据版面信息确定试题位置信息和分值信息,包括单个试题的设置分数、试题的位置、有效得分区域的位置信息等,再结合识别出的批改信息和批改位置信息,实现了批改信息的定位,从而准确判断出单个题目的批改结果和得分,汇总所有单个题目得分得到单张试卷的卷面总分。
图4示出了本发明又一个实施例的考试成绩统计方法流程示意图。其中,该方法包括:
步骤402,获取答卷图像;
步骤404,对答卷图像进行颜色空间变换处理,得到子图像;
步骤406,根据预设分量范围确定子图像中批改位置信息;
步骤408,获取子图像中的批改图像;
步骤410,根据批改图像构建识别模型;
步骤412,匹配答卷图像与识别模型,识别答卷图像的批改信息;
步骤414,根据批改信息、批改位置信息、试题位置信息和分值信息生成试题分数;
步骤416,根据试题分数统计考试成绩;
步骤418,根据试题分数确定错题信息;
步骤420,根据错题信息和考试成绩生成考试报告。
在该实施例中,根据试题分数确定错题信息,在根据错题信息分析单个题目的错误率等信息,并生成考试报告,使老师能够直观的了解到考生知识点的掌握情况,从而进行精准的教学任务。
图5示出了本发明一个具体实施例的考试成绩统计方法流程示意图。其中,该方法包括:
步骤502,上传试卷扫描和空白试卷扫描;
步骤504,提取红笔目标;
步骤506,识别模型训练;
步骤508,试卷批改识别;
步骤510,试卷题目定位分析;
步骤512,生成统计结果。
在该实施例中,根据题目或者答题区域的定位信息,结合批改的识别结果和位置信息,判断单个题目的批改结果以及得分,汇总所有单个题目得分得到单张试卷的卷面总分,汇总不同试卷的某一题目具体得分和错误情况得到,学习该题目的错误率、得分均值等信息。
以试卷的扫描图像为例,考试成绩统计详细步骤如下:
1.学生完成考试后由老师手工用红笔完成试卷答题对错的批改并给出得分;
2.老师批改完成试卷后扫描一张空白试卷图像;
3.老师扫描上传所有批改的试卷彩色图片;
4.在试卷系统中使用版面分析完成试卷的题目版面分析,提取各个题目的版面分析信息,包括单个题目的设置分数、答题区域或者得分区域的位置信息等;
5.对图像进行颜色空间变换,将图像由RGB空间变换为HSV颜色空间,提取试卷中的红色信息,去除非红色部分的信息;
6.过滤掉多余信息,并提取出有效的单个红色目标图片以及目标的位置信息;
7.根据上述步骤5和步骤6的处理过程提取单个待检测红色目标的图片制作成为卷积神经网络模型的训练数据集,并训练对错识别模型;
8.识别考试批改试卷,得到试卷中批改识别结果和识别的目标的位置信息;
9.根据步骤4中的信息以及步骤8中的信息得到考试成绩、某题目的错误率等信息,生成分析报告。
上述步骤5中:将答卷图像从RGB颜色空间变换至HSV颜色空间,然后提取保留HSV颜色空间中H分量的红色表示范围内的部分,并将S分量和V分量的值设置为大于20的合理值。
上述步骤6包括:
(1)将颜色空间变换后得到的图像灰度化,然后二值化处理分割变为二值图;
(2)提取二值图轮廓信息,过滤掉过大和过小的轮廓信息;
(3)根据二值图像使用图像处理方法,取笔画的骨架图像,然后检测骨架图像中的端点,如图6所示,这些端点为笔画的起始点或者是笔画转折和相交的点,在批改过程中出现的笔迹断点往往从这些点开始或者结束。此时设置合理的阈值判断这些绿色端点的距离决定是否合并不同的轮廓点集,合并后的轮廓点集填充生成文本轮廓,如图7所示,由此解决因书写的红色批改痕迹与黑色答题痕迹重叠造成的批改痕迹笔画断裂情况以及数字“5”、数字“10”及以上的这类多笔画数字点集的合并问题;
(4)根据上述(3)中得到的合并后的轮廓点,提取各个轮廓点集对应的坐标矩形框位置,对文本轮廓进行图像形态学处理,根据文本轮廓生成文本模版,根据文本模版以及颜色空间变换后得到的图像,利用图像处理算法提取有效的笔画区域,得到有效的红色笔画区域图像,即批改图像,如图8所示;
(5)对于上述步骤中(4)得到的红色笔画区域图像,如果图像宽度W和图像的高度H不相等,则需要对图像短边缘进行扩充,得到最终待分类目标图像,这种扩展方式能有效避免图像中字符特征在图像缩放过程中的形变,扩展之后的图像,如图9所示,若不采用上述的图像扩展,也可采用图像直接缩放的方式来对待分类图片进行处理,但这种直接缩放方式产生的图像形变会导致一些字符形态特征变化,影响识别分类精度,如数字“1”、“7”、“9”等的特征辨识度会降低;
上述步骤7中,采用多层卷积神经网络的识别模型,未使用深层的识别模型,具体地,使用了三个卷积层的、以及两个全连接层的这种传统的卷积神经网络已经能达到很高的识别率,若使用其它分类模型如VGGNet、GoogleNet、ResNet等也能达到相似的效果,但会消耗更多的计算资源影响判别速度。
上述步骤9中,根据题目或者答题区域的定位信息,结合批改的识别结果和位置信息,判断单个题目的批改结果以及得分。汇总所有单个题目得分得到单张试卷的卷面总分。汇总不同试卷的某一题目具体得分和错误情况得到,学习该题目的错误率、得分均值等信息。
在该实施例中,实现了老师批改痕迹的提取、过滤、合并以及提取图像过程中笔画合并算法的优化,使用识别模型得到识别结果,结合提取目标的坐标信息以及题目区域信息得到单个题目的得分以及批改信息。利用这些信息完成教师批改试卷的卷面分数统计、批改对错识别、某题的错误率统计等功能。
根据本发明的第二方面的实施例,如图10所示,提出了一种考试成绩统计系统600,包括存储器602、处理器604及存储在存储器602上并可在处理器604上运行的计算机程序,处理器604执行计算机程序时实现上述任一实施例中考试成绩统计方法。因此具有上述任一实施例中考试成绩统计方法的全部有益效果,在此不再赘述。
根据本发明的第三方面的实施例,提出了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现如上述任一实施例中图像的处理的步骤。因此具有上述任一实施例中考试成绩统计方法的全部有益效果,在此不再赘述。
在本说明书的描述中,术语“第一”、“第二”仅用于描述的目的,而不能理解为指示或暗示相对重要性,除非另有明确的规定和限定;术语“连接”、“安装”、“固定”等均应做广义理解,例如,“连接”可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是直接相连,也可以通过中间媒介间接相连。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
在本说明书的描述中,术语“一个实施例”、“一些实施例”、“具体实施例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或实例。而且,描述的具体特征、结构、材料或特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种考试成绩统计方法,其特征在于,包括:
获取答卷图像;
对所述答卷图像进行颜色空间变换处理,得到子图像;
根据预设分量范围确定所述子图像中批改位置信息;
获取所述子图像中的批改图像;
根据所述批改图像构建识别模型;
匹配所述答卷图像与所述识别模型,识别所述答卷图像的批改信息;
根据所述批改信息、所述批改位置信息、试题位置信息和分值信息生成试题分数;
根据所述试题分数统计考试成绩。
2.根据权利要求1所述的考试成绩统计方法,其特征在于,所述获取所述子图像中的批改图像的步骤,具体包括:
对所述子图像进行预处理,得到二值图像;
识别所述二值图像的轮廓点集;
根据所述轮廓点集确定批改文本轮廓和批改矩形框;
对所述批改文本轮廓进行平滑处理,得到文本模版;
根据所述文本模版、所述批改矩形框和所述子图像提取所述批改图像。
3.根据权利要求2所述的考试成绩统计方法,其特征在于,所述根据所述轮廓点集确定批改文本轮廓的步骤,具体包括:
根据所述轮廓点集识别所述二值图像的文本骨架;
检测所述文本骨架的端点;
若所述文本骨架的端点与除所述文本骨架的端点以外的任一端点之间的距离小于距离阈值,合并所述文本骨架的端点和除所述文本骨架的端点以外的任一端点,得到目标轮廓点集;
填充所述目标轮廓点集,得到批改文本轮廓。
4.根据权利要求2所述的考试成绩统计方法,其特征在于,所述根据所述轮廓点集确定批改文本轮廓和批改矩形框的步骤之后,还包括:
根据预设尺寸范围筛选所述批改矩形框。
5.根据权利要求1所述的考试成绩统计方法,其特征在于,所述根据所述批改图像构建识别模型的步骤之前,还包括:
对所述批改图像进行扩充处理,以使所述批改图像的高度等于所述批改图像的宽度。
6.根据权利要求1所述的考试成绩统计方法,其特征在于,所述根据所述批改信息、所述批改位置信息、试题位置信息和分值信息生成试题分数的步骤之前,还包括:
获取空白试卷图像;
分析并识别所述空白试卷图像的版面信息;
根据所述版面信息确定所述试题位置信息和所述分值信息。
7.根据权利要求1所述的考试成绩统计方法,其特征在于,还包括:
根据所述试题分数确定错题信息;
根据所述错题信息和所述考试成绩生成考试报告。
8.根据权利要求1至7中任一项所述的考试成绩统计方法,其特征在于,
所述识别模型为多层卷积神经网络识别模型。
9.一种考试成绩统计系统,其特征在于,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至8中任一项所述的考试成绩统计方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至8中任一项所述的考试成绩统计方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910565045.6A CN110414563A (zh) | 2019-06-27 | 2019-06-27 | 考试成绩统计方法、系统及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910565045.6A CN110414563A (zh) | 2019-06-27 | 2019-06-27 | 考试成绩统计方法、系统及计算机可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110414563A true CN110414563A (zh) | 2019-11-05 |
Family
ID=68359738
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910565045.6A Pending CN110414563A (zh) | 2019-06-27 | 2019-06-27 | 考试成绩统计方法、系统及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110414563A (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111639630A (zh) * | 2020-06-23 | 2020-09-08 | 北京字节跳动网络技术有限公司 | 一种作业批改方法及装置 |
CN111767883A (zh) * | 2020-07-07 | 2020-10-13 | 北京猿力未来科技有限公司 | 一种题目批改方法及装置 |
CN112906499A (zh) * | 2021-01-29 | 2021-06-04 | 联想(北京)有限公司 | 文本信息识别方法及装置 |
CN113596418A (zh) * | 2021-07-06 | 2021-11-02 | 作业帮教育科技(北京)有限公司 | 辅助批改的投影方法、装置、系统和计算机程序产品 |
CN113688838A (zh) * | 2021-10-25 | 2021-11-23 | 江西软云科技股份有限公司 | 红色笔迹提取方法、系统、可读存储介质及计算机设备 |
CN113971805A (zh) * | 2021-12-22 | 2022-01-25 | 深圳市迪博企业风险管理技术有限公司 | 一种结合机器视觉和语义分析的智能阅卷评分方法 |
CN114299523A (zh) * | 2021-11-18 | 2022-04-08 | 珠海读书郎软件科技有限公司 | 一种教辅作业识别批改分析方法和分析系统 |
CN114550180A (zh) * | 2022-02-10 | 2022-05-27 | 珠海读书郎软件科技有限公司 | 一种智能识别统分方法、系统及智能台灯 |
CN114881541A (zh) * | 2022-07-06 | 2022-08-09 | 成都西交智汇大数据科技有限公司 | 一种考生成绩的评定方法、装置、设备及可读存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107506762A (zh) * | 2017-09-01 | 2017-12-22 | 昆山中骏博研互联网科技有限公司 | 一种基于图像分析的成绩自动录入方法 |
CN107798321A (zh) * | 2017-12-04 | 2018-03-13 | 海南云江科技有限公司 | 一种试卷分析方法和计算设备 |
-
2019
- 2019-06-27 CN CN201910565045.6A patent/CN110414563A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107506762A (zh) * | 2017-09-01 | 2017-12-22 | 昆山中骏博研互联网科技有限公司 | 一种基于图像分析的成绩自动录入方法 |
CN107798321A (zh) * | 2017-12-04 | 2018-03-13 | 海南云江科技有限公司 | 一种试卷分析方法和计算设备 |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111639630A (zh) * | 2020-06-23 | 2020-09-08 | 北京字节跳动网络技术有限公司 | 一种作业批改方法及装置 |
CN111767883A (zh) * | 2020-07-07 | 2020-10-13 | 北京猿力未来科技有限公司 | 一种题目批改方法及装置 |
CN111767883B (zh) * | 2020-07-07 | 2024-04-12 | 北京猿力未来科技有限公司 | 一种题目批改方法及装置 |
CN112906499A (zh) * | 2021-01-29 | 2021-06-04 | 联想(北京)有限公司 | 文本信息识别方法及装置 |
CN113596418A (zh) * | 2021-07-06 | 2021-11-02 | 作业帮教育科技(北京)有限公司 | 辅助批改的投影方法、装置、系统和计算机程序产品 |
CN113688838A (zh) * | 2021-10-25 | 2021-11-23 | 江西软云科技股份有限公司 | 红色笔迹提取方法、系统、可读存储介质及计算机设备 |
CN113688838B (zh) * | 2021-10-25 | 2022-03-22 | 江西软云科技股份有限公司 | 红色笔迹提取方法、系统、可读存储介质及计算机设备 |
CN114299523A (zh) * | 2021-11-18 | 2022-04-08 | 珠海读书郎软件科技有限公司 | 一种教辅作业识别批改分析方法和分析系统 |
CN113971805A (zh) * | 2021-12-22 | 2022-01-25 | 深圳市迪博企业风险管理技术有限公司 | 一种结合机器视觉和语义分析的智能阅卷评分方法 |
CN114550180A (zh) * | 2022-02-10 | 2022-05-27 | 珠海读书郎软件科技有限公司 | 一种智能识别统分方法、系统及智能台灯 |
CN114881541A (zh) * | 2022-07-06 | 2022-08-09 | 成都西交智汇大数据科技有限公司 | 一种考生成绩的评定方法、装置、设备及可读存储介质 |
CN114881541B (zh) * | 2022-07-06 | 2022-11-11 | 成都西交智汇大数据科技有限公司 | 一种考生成绩的评定方法、装置、设备及可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110414563A (zh) | 考试成绩统计方法、系统及计算机可读存储介质 | |
CN107506762B (zh) | 一种基于图像分析的成绩自动录入方法 | |
WO2019075820A1 (zh) | 一种试卷批阅系统 | |
CN111597908A (zh) | 试卷批改方法和试卷批改装置 | |
CN110597806A (zh) | 一种基于批阅识别的错题集生成与答题统计系统及方法 | |
CN110503054B (zh) | 文本图像的处理方法及装置 | |
CN105095892A (zh) | 基于图像处理的学生文档管理系统 | |
CN105913093A (zh) | 一种用于文字识别处理的模板匹配方法 | |
CN110619326B (zh) | 一种基于扫描的英语试卷作文检测识别系统及方法 | |
CN105787522A (zh) | 基于手写笔迹的书写态度评价方法及系统 | |
CN112507758A (zh) | 答题卡字符串识别方法、装置、终端和计算机存储介质 | |
CN112446259A (zh) | 图像处理方法、装置、终端和计算机可读存储介质 | |
CN110796131A (zh) | 一种汉字书写评价系统 | |
CN112446262A (zh) | 文本分析方法、装置、终端和计算机可读存储介质 | |
CN112241730A (zh) | 一种基于机器学习的表格提取方法和系统 | |
CN113191309A (zh) | 一种手写汉字的识别、评分、纠错方法及系统 | |
CN111008594B (zh) | 改错题评阅方法、相关设备及可读存储介质 | |
CN115880566A (zh) | 一种基于视觉分析的智能阅卷系统 | |
CN107220610A (zh) | 一种应用于阅卷系统的主观题分数识别方法 | |
CN109147002B (zh) | 一种图像处理方法和装置 | |
JP4756447B2 (ja) | 教材処理装置、教材処理方法および教材処理プログラム | |
CN109284702A (zh) | 一种基于图像模式的答题卷给分及阅卷系统 | |
CN112926571A (zh) | 一种基于深度学习的公式图片识别判题系统 | |
Likforman-Sulem et al. | An expert vision system for analysis of Hebrew characters and authentication of manuscripts | |
CN117095414A (zh) | 一种基于点阵纸笔的手写识别系统及识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20191105 |
|
WD01 | Invention patent application deemed withdrawn after publication |