CN114550176A - 基于深度学习的试卷批改方法 - Google Patents
基于深度学习的试卷批改方法 Download PDFInfo
- Publication number
- CN114550176A CN114550176A CN202210160582.4A CN202210160582A CN114550176A CN 114550176 A CN114550176 A CN 114550176A CN 202210160582 A CN202210160582 A CN 202210160582A CN 114550176 A CN114550176 A CN 114550176A
- Authority
- CN
- China
- Prior art keywords
- test paper
- data
- straight line
- question
- answer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 41
- 238000013135 deep learning Methods 0.000 title claims abstract description 21
- 238000012360 testing method Methods 0.000 claims abstract description 96
- 238000012795 verification Methods 0.000 claims abstract description 45
- 238000001514 detection method Methods 0.000 claims abstract description 16
- 238000007781 pre-processing Methods 0.000 claims abstract description 8
- 230000009466 transformation Effects 0.000 claims description 15
- 238000013461 design Methods 0.000 claims description 9
- 230000008569 process Effects 0.000 claims description 8
- 230000009191 jumping Effects 0.000 claims description 4
- 230000011218 segmentation Effects 0.000 claims description 4
- 238000011282 treatment Methods 0.000 claims description 4
- 238000012549 training Methods 0.000 claims description 3
- 238000002715 modification method Methods 0.000 claims description 2
- 238000012937 correction Methods 0.000 description 16
- 238000012545 processing Methods 0.000 description 13
- 230000000694 effects Effects 0.000 description 6
- 238000000605 extraction Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000003709 image segmentation Methods 0.000 description 4
- 230000004913 activation Effects 0.000 description 3
- 238000006073 displacement reaction Methods 0.000 description 3
- 238000003708 edge detection Methods 0.000 description 3
- 230000000007 visual effect Effects 0.000 description 3
- 206010063385 Intellectualisation Diseases 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 1
- 235000017166 Bambusa arundinacea Nutrition 0.000 description 1
- 235000017491 Bambusa tulda Nutrition 0.000 description 1
- 241001330002 Bambuseae Species 0.000 description 1
- 235000015334 Phyllostachys viridis Nutrition 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 239000011425 bamboo Substances 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/20—Education
- G06Q50/205—Education administration or guidance
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Strategic Management (AREA)
- General Physics & Mathematics (AREA)
- Tourism & Hospitality (AREA)
- Health & Medical Sciences (AREA)
- Educational Technology (AREA)
- Educational Administration (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了基于深度学习的试卷批改方法,包括:获取写有标准答案的试卷图像P1,采集需要批改的试卷图像P2,并进行预处理;对预处理后的P1和P2分别进行霍夫直线检测,得到答题水平直线位置,进而得到单个题目的答题区域;利用YOLO v3网络提取答题区域中每个验证框的坐标信息及验证框内的数据,进而计算相邻两个验证框之间的距离;对两幅试卷图像中同一个题目序号对应的答题区域中每个数据信息进行比对,统计需要批改的试卷图像中正确题目与错误题目数量;根据需要批改的试卷坐标信息,提取需要批改的试卷对应的学号,将学号与相应试卷上所有题目正确与否存入数据库中。本发明可运用于试卷或者答题卡的选择题、填空题,不受题型以及答题卡格式的限制。
Description
技术领域
本发明涉及基于深度学习的试卷批改方法,属于深度学习技术领域。
背景技术
在二十一世纪初期,Hinton等人就提出了深度学习技术,从此之后,深度学习逐渐被重视。近年来,随着计算机视觉技术的快速发展,自动批改试卷的研究如雨后春笋般出现,帮助老师对部分题型进行快速批改,降低人力成本,提高老师的工作效率。
智能批改试卷能有效利用计算机视觉技术代替人来完成部分试题的批阅,省略了传统阅卷过程中的装订、运输、传递、翻阅等工作,不用专门统一安排所有的阅卷老师到具体的阅卷教室,提高了工作效率,减少了多次传输中带来的丢失、撕毁等意外;从节约成本上看,智能批改试卷节省了大量人力物力,智能批改试卷使得所有的试卷信息都能够储存在计算机硬盘中,所有的评卷环节的统计工作都能够用计算机来完成,使得试卷的保密管理更方便;从阅卷评分的公平性上看,智能批改试卷代替人工阅卷提高了评卷质量,最大限度的实现了阅卷的公平性。
胡翰等人于2019年在论文《试卷智能辅助批阅系统的设计与实现》提到通过图像预处理处理采集试卷图像过程中出现的噪声,采用的图像分割方法对试卷进行题型的切片处理,图像识别方案对试卷中学生个人信息、非答题卡形式选择题、判断题的手写体识别,但该方法处理能力有限,只能完成选择题和一般简答题的批改。程建邦等人于2020年在论文《基于机器视觉的试卷自动批改系统设计》提出通过数字图像的处理,提取试卷中的作答信息,并将答题字符转换成归一的二值化图像。字符特征的提取方式,从归一化的二值图像中寻找最能区别不同字符的特征,以实现不同字符的区分和识别。通过机器学习得到一种输入输出模型,利用该模型进行手写字符的识别。设计了交互式的答题框选取方式,用户只需用鼠标在试卷上依次画出每题的识别区,该系统可以使用在多种类型的试卷中。但此系统需要通过人工干涉才能进行试卷的批改,对人存在一定的依耐性。卓天天等人于2021年在论文《基于深度学习的英语阅卷系统设计与实现》中设计了一款针对英语全国卷题型的阅卷系统,该系统主要包含图像处理模块、字符识别模块以及单词识别模块。首先,对输入图片进行边缘提取、透视变换获取到答题纸主体,接着,再次对答题纸主体进行边缘提取,定位出学号区域和答案填写区域,然后,按题型裁剪出供模型识别区域,加载单字符识别模型或单词识别模型对其进行端到端的识别,判断答案正误。但此系统局限于选择题,且速度较慢。
目前的智能试卷批改采用图像分割与模板匹配等方法,依然需要人为干预圈画出所需批改区域,对人存在依耐性;并且精确度较低,速度较慢。
发明内容
本发明所要解决的技术问题是:提供基于深度学习的试卷批改方法,对答题卡或试卷中的答案直线进行提取,并得到直线的坐标,进一步的提取出答题区域,用以进行脱机时自动圈画出答案区域,从而进行答案识别批改,实现批改智能化,同时提高工作效率。
本发明为解决上述技术问题采用以下技术方案:
基于深度学习的试卷批改方法,包括如下步骤:
步骤1,获取写有标准答案的试卷图像,记为P1,并通过摄像头采集需要批改的试卷图像,记为P2;
步骤2,分别对试卷图像P1和P2进行预处理,所述预处理包括透视变换、灰度化、二值化以及边缘分割;
步骤3,对预处理后的试卷图像P1和P2分别进行霍夫直线检测,得到每幅试卷图像中的答题水平直线位置以及对应的题目序号;
步骤4,根据上下相邻的两条水平直线位置,得到单个题目的答题区域;
步骤5,利用预先训练好的YOLO v3网络提取各答题区域中的每个数据信息包括验证框的坐标信息以及验证框内的数据,所述验证框的坐标信息包括验证框左上角X的位置和验证框的宽度;
步骤6,针对单个题目的答题区域,根据步骤5得到的验证框的坐标信息,计算相邻两个验证框之间的距离;
步骤7,对两幅试卷图像中同一个题目序号对应的答题区域中每个数据信息进行比对,统计需要批改的试卷图像中的正确题目与错误题目数量;
步骤8,根据需要批改的试卷坐标信息,提取需要批改的试卷对应的学号,将学号与相应的试卷上所有题目正确与否存入数据库中;继续进行下一个P2的处理,直至所有的P2均处理完成;
步骤9,设计窗口显示出学号对应的正确与错误题目数量,并将所有P2的正确与错误的个数通过柱状图或曲线图表现出来。
作为本发明的一种优选方案,所述步骤1中,摄像头的采集频率设置为2s。
作为本发明的一种优选方案,所述步骤2中,灰度化的具体公式为:
其中,Gray为灰度化后的值,R为红色像素点的分量的值,G为绿色像素点的分量的值,B为蓝色像素点的分量的值。
作为本发明的一种优选方案,步骤3所述霍夫直线检测中,对于每幅试卷图像,将其左下角像素点设置为坐标原点,则沿着试卷图像底部边缘水平向右方向为X轴正方向,沿着试卷图像左侧边缘垂直向上方向为Y轴正方向,通过霍夫直线检测提取试卷图像中的直线,即答题位置,在提取直线的过程中得到若干对坐标,每对坐标包括直线的左端点(xi1,yi1)和右端点(xi2,yi2),i=1,2,3...n,n为题目总数量,根据直线在Y轴上坐标值,由高至低进行排序,Y坐标最大时i=1,即此直线对应第一题;其中,霍夫直线检测的参数公式为:
ry=x*cosθ+y*sinθ
其中,ry为坐标原点至某一个像素点(x,y)之间的纵坐标距离,θ为ry与X轴正方向的夹角,当且仅当θ为90度且x为0,所有的ry一致时,检测到的所有满足条件的像素点(x,y)组成的直线即为所求的水平直线。
作为本发明的一种优选方案,所述步骤4中,根据步骤3得到的水平直线左、右两端点的坐标,求出上下相邻的两条水平直线之间的距离:
Hj=y(i-1)1-yi1
其中,Hj为第i题的水平直线与第i-1题的水平直线在Y轴上的距离,j=i,且当j=i=1时,H1=H2;
由此计算出第i题的答题区域的四个顶点坐标分别为:左下端点(xi1,yi1)、右下端点(xi2,yi2)、左上端点(xi1,yi1+Hj)以及右上端点(xi2,yi2+Hj);之后提取每个题目的答题区域ROI。
作为本发明的一种优选方案,所述步骤5中,利用ORACLE字符数据集和MNIST数字数据集预先在YOLO v3网络中进行训练,得到训练好的YOLO v3网络。
作为本发明的一种优选方案,所述步骤6中,单个题目的答题区域中,相邻两个验证框之间的距离如下:
Sk=bx(k+1)-bw-bxk
其中,Sk为第k+1、k个验证框之间的距离,bx(k+1)、bxk分别为第k+1、k个验证框左上角X的位置,bw为第k个验证框的宽度,k=2,3...。
作为本发明的一种优选方案,所述步骤7中,采用正则表达式对两幅试卷图像中同一个题目序号对应的答题区域中每个数据进行比对,对于同一个题目序号,首先提取出P1中对应的答题区域中的第一个数据,与P2中对应的答题区域中的第一个数据相比较,具体分为三种情况:
第一种情况:若两者不一致,则记一次F,并跳到下一题;
第二种情况:若两者一致,则比较第二个数据,同时判断第二个数据与第一个数据之间的距离是否小于等于10,若大于10,则记一次F,并跳到下一题;
第三种情况:若两者一致,且第二个数据与第一个数据之间的距离小于等于10,则对比第三个数据信息,以此类推,当P1对应的答题区域中所有数据与P2对应的答题区域中所有数据均一致,且相邻两个数据之间的距离均小于等于10,则记一次T;
对其他所有题目,均进行上述的比较操作,并统计出T和F数量。
作为本发明的一种优选方案,所述步骤8中,设定组成学号的数字个数为m,设定Y轴阈值,对于需要批改的试卷图像,对Y值大于阈值的区域进行扫描,并计算相邻两个数字之间的距离,若出现连续m-1个距离均小于10,则判定为学号,并将其提取出,将学号与相应的试卷上所有题目T或F信息存储进数据库中。
作为本发明的一种优选方案,所述步骤9中,通过TKinter设计窗口显示出学号对应的所有题目T或F信息,通过MySQL将需要批改的试卷图像上T与F的个数转化成柱状图和曲线图表现出来。
本发明采用以上技术方案与现有技术相比,具有以下技术效果:
1、本发明利用霍夫直线检测和ROI提取,得到单个题目答案区域,使批改试卷脱离人为干预,实现了智能化。
2、本发明采用YOLO v3对数据集进行训练,得出所需的信息,最终和标准答案一一比对判断出对错。相比于其他技术,此技术的训练速度更快,精准度更高。
3、本发明采用上位机以及可视化柱状图与曲线图将数据信息表现出来,更加的直观,有益于节省老师的时间和精力,减轻老师的负担。
4、本发明方法提高了工作效率,解决了现有技术中数度慢、依耐性、实现困难等问题。
5、本发明采用答题区域直线检测,可运用于试卷或者答题卡的选择题、填空题,不受题型以及答题卡格式的限制。
附图说明
图1是本发明基于深度学习的试卷批改方法的工作流程图;
图2是本发明使用的原图及透视变换的效果图;
图3是本发明提取出的ROI效果图;
图4是本发明的上位机界面图;
图5是本发明的结果柱状图;
图6是本发明的结果曲线图。
具体实施方式
下面详细描述本发明的实施方式,所述实施方式的示例在附图中示出。下面通过参考附图描述的实施方式是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。
在现有的智能试卷批改的大多数方法中,使用的是图像分割、手动定位单个题目答案区域等技术方法。本发明将在图像预处理中对答题卡或试卷中的答案直线进行提取,并得到直线的坐标,进一步的提取出答题区域ROI,并用YOLO v3对数据集进行训练,得出所需的数字信息,最终对数字信息比较得出每个人的对错信息,并通过上位机、柱状图和曲线图表现出来。图1是本发明的工作流程图,结合图1,本发明的主要步骤如下:
步骤一:使用手动输入写有标准答案的试卷图像,记作P1,并且利用摄像头采集需要批改的试卷图像,记作P2;
其中处理图像的方式采用opencv与python语言,摄像头采集频率为t,由于所需批改试卷的放置与拍摄速度,采集频率t设置为2s左右。
步骤二:对P1和P2进行预处理,包括透视变换、灰度化、二值化与边缘分割;如图2所示为本发明的原图与透视变换的效果图,左边为原图,右边为透视变换图。首先对图像的位置进行矫正,利用透视变换,对图像的四个顶点坐标进行重新定位。然后进行灰度化,从而去除彩色图像中夹杂的干扰信息。之后进行图像二值化,从而将灰度处理的图像中文字与背景区分开来。最终对二值化图像进行边缘检测并进行边缘分割得出去除边框的图像。主要有以下几个步骤:
a.对图像透视变换
为了纠正在扫描或者采集过程中不可避免的出现的目标在图像中发生的倾斜现象,本发明采用透明变换,透视变换又称投影映射、投射变换等,是三维空间上的非线性变换,可看作是仿射变换的更一般形式,简单讲即通过一个3x3的变换矩阵将原图投影到一个新的视平面,在视觉上的直观表现就是产生或消除了远近感。
b.对图像灰度化、二值化
为了去除彩色图像中夹杂的干扰信息,本发明采用灰度化的方法,即在RGB模型中,如果R=G=B时,则彩色表示一种灰度颜色,其中R=G=B的值叫灰度值。为了将灰度处理的图像中文字与背景区分开来,本发明采用二值化的方法。其中灰度化的具体公式为:
其中R为红色的像素点的分量的值,G为绿色的像素点的分量的值,B为蓝色的像素点的分量的值。
c.对图像边缘分割
为了减少霍夫直线检测的误差,本发明采用边缘检测的图像分割法,分割掉图像灰度在整体图像中显著变化的地方,而图像边缘检测中经常使用到各类边缘算子。通过边缘算子可以是图像的边缘效果增强,使得目标区域和边缘的像素灰度差更大,然后根据图像边界从中分割出目标图像。
步骤三:将预处理完的两幅图像进行霍夫直线检测得出答题水平直线位置,并对得到答案题号;
将坐标的原点是设置在P1、P2的左下角,沿着底部水平向右为X轴正方向,沿着左侧垂直向上为Y轴正方向,试卷图像的分辨率为1980*1080,即Y轴最大为1980,X轴最大为1280。通过霍夫直线检测提取试卷图像中的直线,也就是答题位置,在提取直线的过程中可以得到两对坐标,分别为直线的左端点(xi1,yi1)与右端点(xi2,yi2),其中i=1,2,3...n,i的取值为答案个数,根据直线在Y轴上坐标值,由高至低排序,当Y坐标最大时i=1,即此直线对应第一题,由此来判断答案个数,避免重复识别数字判断答案个数造成误差。其中霍夫直线检测的参数公式为:
ry=x*cosθ+y*sinθ
其中,ry为原点至某一个边缘的像素点(x,y)之间的纵坐标距离,θ为ry与X正轴的夹角,当且仅当θ为90度且x为0,所有的ry一致时,检测到的经过边缘的像素点(x,y)直线为所求的水平直线。
步骤四:根据相邻的两条水平直线位置,得到单个题目答案区域(ROI);
根据步骤三中所得直线左、右端点的坐标,求出上下直线之间的距离Hj:
Hj=y(i-1)1-yi1
其中的i=1,2,3...n,i的取值为题号,根据直线在y轴上坐标值,由高至低排序,Hj为第i题的直线与第i-1题的直线在y轴上的距离,j=i。当j=i=1时,H1等于H2。
由此可以计算出所需的单个题目答案区域的四个顶点坐标左下端点(xi1,yi1)、右下端点(xi2,yi2)、左上端点(xi1,yi1+Hj)与右上端点(xi2,yi2+Hj)。之后提取单个题目答案区域(ROI即感兴趣区域),且答案区域序号为i。如图3所示为提取出的ROI效果图,灰色边框为所求的单个题目答案区域。
步骤五:利用YOLO v3对数据集进行训练得到对单个题目答案区域中每个数据信息(包括数字、字母等)。最终得到数据所在验证框的坐标信息以及验证框内的数据。验证框的坐标信息包括验证框左上角x的位置bxk和验证框的宽度bw,k=1,2,3...n,k的取值为同一个ROI区域中各个验证框的序号,其根据每个验证框左上角x的大小决定,具体为由小到大,k的取值随着x的增大而增大。
A.提取3个特征层进行目标检测,这些特征层位于主特征提取网络Darknet53的不同位置,分别为中间层,中下层和底层,三个特征层的大小分别为(52,52,256)、(26,26,512)、(13,13,1024),这三个特征层用来与上采样后的其他特征层进行堆叠拼接。其中Darknet53主要使用残差网络,每一个卷积部分使用特有的arknetConv2D结构,每一次卷积的时候进行l2正则化,完成卷积后进行BatchNormalization标准化与LeakyReLU激活函数。
B.对(13,13,1024)的特征层特征提取进行5次卷积处理,处理后一部分用于卷积上采样得到(26,26,256)的特征层,另一部分用于输出对应的预测结果(13,13,75),使用Conv2D 3*3和Conv2D 1*1两个卷积来调整通道,使得输出的大小符合需求。
C.将B中得到的(26,26,256)的特征层,然后与Darknet53网络中的特征层(26,26,512)进行拼接,得到维度为(26,26,768)的特征层,再进行5次卷积,处理完后一部分用于卷积上采样,另一部分用于输出对应的预测结果(26,26,75),Conv2D 3×3和Conv2D1×1同上为通道调整。
D.将C中卷积+上采样的特征层与(52,52,256)的特征层拼接,再进行卷积得到维度为(52,52,128)的特征层,最后再Conv2D 3×3和Conv2D1×1两个卷积,得到(52,52,75)特征层。若预测结果并不对应最终预测框,则需要运用损失函数解码,使用sum-squareerror损失计算方法,运用差方相加的方法计算,计算公式为:
其中,loss表示损失度,∑表示累加,S2为栅格数量,B为框体数量,σ为激活函数使用的是sigmoid函数为[0,1]之间概率,表示第i个栅格第j个框体,classes表示类别总数,表示识别数字的概率,C表示框体的置信度,tx表示相对x的位移,ty表示相对y的位移,tw表示宽度位移,th表示高度位移,^符号为均值。
E.解码过程即是计算验证框位置的过程,使用13*13、26*26、52*52的网格,对每一个负责区域进行检测,计算显示验证框坐标x、y以及宽weight和高high,最后找到验证框位置:
bxk=σ(px)+cx
by=σ(py)+cy
Pr(object)*IOU(b,Object)=σ(to)
其中,cx表示该字符所在网格的左上角相对x轴的偏移量,cy表示该字符所在网络的左上角相对于y轴的偏移量,pw表示预测时验证框体的宽度,ph表示预测时验证框的高度,px表示网格中心点相对于该点所在网格的左上角x的偏移量,py表示网格中心点相对于该点所在网格左上角的y偏移量,by为验证框左上角y的位置,bw为验证框的宽度,bh为验证框的高度大小,IOU(b,Object)为交并比,表示验证框与真实边框的交集和并集的比值,A、B为选定的验证框,表示数字的期望值,σ为激活函数,是求得的预测计算函数。其中验证框左上角x的位置bxk,k=1,2,3...,k的取值为同一个单个题目答案区域中各个验证框的序号,其根据每个验证框左上角x的大小决定,具体为由小到大,k的取值随着x的增大而增大。
步骤六:对单个题目答案区域中的每个数据的坐标信息进行比对,得到数据之间的距离信息;
由于一串数字之间的距离是小于10,需要根据步骤五中得出的验证框左上角x的位置与验证框的宽度,求前后两个字符之间的距离Sk:
Sk=bx(k+1)-bw-bxk
其中bxk为验证框左上角x的位置,bw为验证框的宽度,k=2,3...。
步骤七:对两幅图像中每个题目答案区域中的数据信息进行比对,统计正确题目与错误题目数量;
根据步骤五中所得P1、P2中同一组单个题目答案区域中的数据,对这些数据一一比较,所用算法为正则表达式,首先提取出P1中同一个单个题目答案区域中的第一个数据,与P2中同一个单个题目答案区域中的数据相比较,具体分为以下三种可能:
1、如若无一样的数字,则记一次F,且不再往下比对。
2、如若出现一样的数字,则比较第二个数字信息,且第一个数字与第二数字之间的距离S1要求小于10,如若大于10,则记F,且不再往下比对。
3、如若S1不大于10,则对比第三个字符,以此类推,直到所有数据都相同且Sk也相同,则记T。
完成以上操作之后,对其他组的单个题目答案区域中的数据信息进行比较。
步骤八:根据试卷坐标信息,得出学号,并且统计答案错误与正确数量,之后开始下一张P2的处理,步骤同步骤二至步骤八,直至所有的P2处理完成;
对P2的y轴值为1780以上的区域进行扫描,若出现连续五个以上的数字距离Sk小于10,则判定为学号,并将其提取出,计算步骤七中的F和T的个数,将所有学号对应的所有题号T与F信息写入数据库中。并将P1的各题目所对应的答案存入数据库中,之后开始下一张P2的处理,步骤同步骤二至步骤八,直至所有的P2处理完成。
步骤九:设计窗口显示出学号对应F和T的数量,并将所有P2的T与F的个数通过柱状图或者曲线图表现出来。
通过TKinter设计出窗口显示出学号对应的所有题号F和T的信息如图4上位机界面图,显示为所需批改试卷的结果,所需批改试卷总数为10张,每张的题目为10题,其中点击“输入”按钮则可在电脑文件夹中选择写有标准答案的试卷,点击“开始”按钮之后摄像头采集所需批改试卷图像,采并且自动进行批改,最终显示每个学号所对应的所有的T与F数据信息。
分别点击“饼状图”和“曲线图”按钮之后,所有所需批改试卷的T与F的个数将通过MySQL转化成柱状图和曲线图表现出来。
如图5结果饼状图所示,展示每题T的个数占总个数的比值,目的为展示每个题目的得分情况。
如图6结果曲线图所示,横坐标为显示为T的题目个数,轴坐标为人数,显示各个分数段的分布情况,目的为让老师更加直观的观察分数是否符合正态分布。
以上实施例仅为说明本发明的技术思想,不能以此限定本发明的保护范围,凡是按照本发明提出的技术思想,在技术方案基础上所做的任何改动,均落入本发明保护范围之内。
Claims (10)
1.基于深度学习的试卷批改方法,其特征在于,包括如下步骤:
步骤1,获取写有标准答案的试卷图像,记为P1,并通过摄像头采集需要批改的试卷图像,记为P2;
步骤2,分别对试卷图像P1和P2进行预处理,所述预处理包括透视变换、灰度化、二值化以及边缘分割;
步骤3,对预处理后的试卷图像P1和P2分别进行霍夫直线检测,得到每幅试卷图像中的答题水平直线位置以及对应的题目序号;
步骤4,根据上下相邻的两条水平直线位置,得到单个题目的答题区域;
步骤5,利用预先训练好的YOLO v3网络提取各答题区域中的每个数据信息包括验证框的坐标信息以及验证框内的数据,所述验证框的坐标信息包括验证框左上角X的位置和验证框的宽度;
步骤6,针对单个题目的答题区域,根据步骤5得到的验证框的坐标信息,计算相邻两个验证框之间的距离;
步骤7,对两幅试卷图像中同一个题目序号对应的答题区域中每个数据信息进行比对,统计需要批改的试卷图像中的正确题目与错误题目数量;
步骤8,根据需要批改的试卷坐标信息,提取需要批改的试卷对应的学号,将学号与相应的试卷上所有题目正确与否存入数据库中;继续进行下一个P2的处理,直至所有的P2均处理完成;
步骤9,设计窗口显示出学号对应的正确与错误题目数量,并将所有P2的正确与错误的个数通过柱状图或曲线图表现出来。
2.根据权利要求1所述的基于深度学习的试卷批改方法,其特征在于,所述步骤1中,摄像头的采集频率设置为2s。
4.根据权利要求1所述的基于深度学习的试卷批改方法,其特征在于,步骤3所述霍夫直线检测中,对于每幅试卷图像,将其左下角像素点设置为坐标原点,则沿着试卷图像底部边缘水平向右方向为X轴正方向,沿着试卷图像左侧边缘垂直向上方向为Y轴正方向,通过霍夫直线检测提取试卷图像中的直线,即答题位置,在提取直线的过程中得到若干对坐标,每对坐标包括直线的左端点(xi1,yi1)和右端点(xi2,yi2),i=1,2,3…n,n为题目总数量,根据直线在Y轴上坐标值,由高至低进行排序,Y坐标最大时i=1,即此直线对应第一题;其中,霍夫直线检测的参数公式为:
ry=x*cosθ+y*sinθ
其中,ry为坐标原点至某一个像素点(x,y)之间的纵坐标距离,θ为ry与X轴正方向的夹角,当且仅当θ为90度且x为0,所有的ry一致时,检测到的所有满足条件的像素点(x,y)组成的直线即为所求的水平直线。
5.根据权利要求1所述的基于深度学习的试卷批改方法,其特征在于,所述步骤4中,根据步骤3得到的水平直线左、右两端点的坐标,求出上下相邻的两条水平直线之间的距离:
Hj=y(i-1)1-yi1
其中,Hj为第i题的水平直线与第i-1题的水平直线在Y轴上的距离,j=i,且当j=i=1时,H1=H2;
由此计算出第i题的答题区域的四个顶点坐标分别为:左下端点(xi1,yi1)、右下端点(xi2,yi2)、左上端点(xi1,yi1+Hj)以及右上端点(xi2,yi2+Hj);之后提取每个题目的答题区域ROI。
6.根据权利要求1所述的基于深度学习的试卷批改方法,其特征在于,所述步骤5中,利用ORACLE字符数据集和MNIST数字数据集预先在YOLO v3中网络进行训练,得到训练好的YOLO v3网络。
7.根据权利要求1所述的基于深度学习的试卷批改方法,其特征在于,所述步骤6中,单个题目的答题区域中,相邻两个验证框之间的距离如下:
Sk=bx(k+1)-bw-bxk
其中,Sk为第k+1、k个验证框之间的距离,bx(k+1)、bxk分别为第k+1、k个验证框左上角X的位置,bw为第k个验证框的宽度,k=2,3…。
8.根据权利要求4所述的基于深度学习的试卷批改方法,其特征在于,所述步骤7中,采用正则表达式对两幅试卷图像中同一个题目序号对应的答题区域中每个数据的坐标信息进行比对,对于同一个题目序号,首先提取出P1中对应的答题区域中的第一个数据,与P2中对应的答题区域中的第一个数据相比较,具体分为三种情况:
第一种情况:若两者不一致,则记一次F,并跳到下一题;
第二种情况:若两者一致,则比较第二个数据的坐标信息,同时判断第二个数据与第一个数据之间的距离是否小于等于10,若大于10,则记一次F,并跳到下一题;
第三种情况:若两者一致,且第二个数据与第一个数据之间的距离小于等于10,则对比第三个数据,以此类推,当P1对应的答题区域中所有数据与P2对应的答题区域中所有数据均一致,且相邻两个数据之间的距离均小于等于10,则记一次T;
对其他所有题目,均进行上述的比较操作,并统计出T和F数量。
9.根据权利要求8所述的基于深度学习的试卷批改方法,其特征在于,所述步骤8中,设定组成学号的数字个数为m,设定Y轴阈值,对于需要批改的试卷图像,对Y值大于阈值的区域进行扫描,并计算相邻两个数字之间的距离,若出现连续m-1个距离均小于10,则判定为学号,并将其提取出,将学号与相应的试卷上所有题目T或F信息存储进数据库中。
10.根据权利要求9所述的基于深度学习的试卷批改方法,其特征在于,所述步骤9中,通过TKinter设计窗口显示出学号对应的所有题目T或F信息,通过MySQL将需要批改的试卷图像上T与F的个数转化成柱状图和曲线图表现出来。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210160582.4A CN114550176A (zh) | 2022-02-22 | 2022-02-22 | 基于深度学习的试卷批改方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210160582.4A CN114550176A (zh) | 2022-02-22 | 2022-02-22 | 基于深度学习的试卷批改方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114550176A true CN114550176A (zh) | 2022-05-27 |
Family
ID=81677397
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210160582.4A Pending CN114550176A (zh) | 2022-02-22 | 2022-02-22 | 基于深度学习的试卷批改方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114550176A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115620333A (zh) * | 2022-12-05 | 2023-01-17 | 蓝舰信息科技南京有限公司 | 基于人工智能的试卷自动纠错方法 |
-
2022
- 2022-02-22 CN CN202210160582.4A patent/CN114550176A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115620333A (zh) * | 2022-12-05 | 2023-01-17 | 蓝舰信息科技南京有限公司 | 基于人工智能的试卷自动纠错方法 |
CN115620333B (zh) * | 2022-12-05 | 2023-03-10 | 蓝舰信息科技南京有限公司 | 基于人工智能的试卷自动纠错方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108171297B (zh) | 一种答题卡识别方法 | |
CN110619326B (zh) | 一种基于扫描的英语试卷作文检测识别系统及方法 | |
CN113159014B (zh) | 基于手写题号的客观题批阅方法、装置、设备及存储介质 | |
CN105095892A (zh) | 基于图像处理的学生文档管理系统 | |
CN112434699A (zh) | 手写汉字或偏旁、笔划的自动提取及智能评分系统 | |
CN110414563A (zh) | 考试成绩统计方法、系统及计算机可读存储介质 | |
CN105046200B (zh) | 基于直线检测的电子阅卷方法 | |
CN101266654A (zh) | 基于连通分量和支持向量机的图像文本定位方法和装置 | |
CN110443235B (zh) | 一种智能纸质试卷总分识别方法及系统 | |
CN112446259A (zh) | 图像处理方法、装置、终端和计算机可读存储介质 | |
CN112712273B (zh) | 一种基于骨架相似度的手写体汉字美观度评判方法 | |
CN101615244A (zh) | 手写板坯号自动识别方法及识别装置 | |
CN111626292B (zh) | 一种基于深度学习技术的楼宇指示标识的文字识别方法 | |
CN107122775A (zh) | 一种基于特征匹配的安卓手机身份证字符识别方法 | |
CN113033558B (zh) | 一种用于自然场景的文本检测方法及装置、存储介质 | |
CN105740857A (zh) | 一种基于ocr的快速纸笔投票结果自动采集与识别系统 | |
CN112446262A (zh) | 文本分析方法、装置、终端和计算机可读存储介质 | |
CN108052936B (zh) | 一种盲文图像自动倾斜校正方法及系统 | |
CN116612478A (zh) | 一种脱机手写汉字的评分方法、装置及存储介质 | |
CN115880566A (zh) | 一种基于视觉分析的智能阅卷系统 | |
CN114241492A (zh) | 一种识别作文稿纸的手写文本识别并复现文本结构的方法 | |
CN114550176A (zh) | 基于深度学习的试卷批改方法 | |
CN107958261B (zh) | 一种盲文点检测方法及系统 | |
CN110298236B (zh) | 一种基于深度学习的盲文图像自动识别方法和系统 | |
CN110766001B (zh) | 基于cnn和rnn的银行卡卡号定位与端到端识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |