CN111553211A - 试卷答案识别方法、系统、装置和计算机可读存储介质 - Google Patents

试卷答案识别方法、系统、装置和计算机可读存储介质 Download PDF

Info

Publication number
CN111553211A
CN111553211A CN202010300106.9A CN202010300106A CN111553211A CN 111553211 A CN111553211 A CN 111553211A CN 202010300106 A CN202010300106 A CN 202010300106A CN 111553211 A CN111553211 A CN 111553211A
Authority
CN
China
Prior art keywords
answer
area
test paper
acquiring
boundary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010300106.9A
Other languages
English (en)
Inventor
陈瑞斌
罗英群
吕令广
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZTE ICT Technologies Co Ltd
Original Assignee
ZTE ICT Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE ICT Technologies Co Ltd filed Critical ZTE ICT Technologies Co Ltd
Priority to CN202010300106.9A priority Critical patent/CN111553211A/zh
Publication of CN111553211A publication Critical patent/CN111553211A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/20Education
    • G06Q50/205Education administration or guidance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • G06V20/63Scene text, e.g. street names

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Software Systems (AREA)
  • Educational Administration (AREA)
  • Educational Technology (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • General Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Economics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Electrically Operated Instructional Devices (AREA)

Abstract

本发明提供了一种试卷答案识别方法、系统、装置和计算机可读存储介质,用于识别试卷中选择题的答案。试卷答案识别方法包括如下步骤:获取空白试卷的含有坐标的文本信息;根据文本信息,获取空白试卷中的选择题整体区域;根据选择题整体区域,获取答题试卷中每个选择题对应的答案区域;根据答案区域识别每个选择题对应的答案。通过本发明含有坐标的文本信息,从而可以通过坐标对选择题的答案进行定位,可以较为快捷和准确地识别出答案内容,能够提高识别效率和准确性。

Description

试卷答案识别方法、系统、装置和计算机可读存储介质
技术领域
本发明涉及教育信息化系统技术领域,具体而言,涉及试卷答案识别方法、系统、装置和计算机可读存储介质。
背景技术
单元测验、考试等会出现在多种场景中,尤其是在学校。通常考试完成后产生的大量试卷需要教师进行批改。绝大部分学校依旧是通过教师人工批改完成,所以通过计算机智能阅卷的技术能够节省教师的阅卷时间。
现有的阅卷系统仅能够对自身系统定义的试卷板式进行制模(制作试卷模板)和阅卷,而无法兼容其他厂商的试卷。如果在原卷上面进行作答,也无法识别,局限性大,而通过教师手动批改完成阅卷,就占用了教师较多工作时间,形成了一定的工作量,增加了教师的工作负担。
发明内容
本发明旨在解决上述技术问题中的至少之一。
本发明的第一目的在于提供一种试卷答案识别方法。
本发明的第二目的在于提供一种试卷答案识别系统。
本发明的第三目的在于提供一种试卷答案识别装置。
本发明的第四目的在于提供一种计算机可读存储介质。
为实现本发明的第一目的,本发明的实施例提供了一种试卷答案识别方法,用于识别试卷中选择题的答案,试卷答案识别方法包括如下步骤:获取空白试卷的含有坐标的文本信息;根据文本信息,获取空白试卷中的选择题整体区域;根据选择题整体区域,获取答题试卷中每个选择题对应的答案区域;根据答案区域识别每个选择题对应的答案。
在该技术方案中,空白试卷中的选择题往往作为一道大题,例如:题号为一.单选题,下面会出现1、2、4、5、6等多个单选题。获取空白试卷的文本信息,该文本信息含有坐标,获取坐标就能够对文本信息进行定位,当获取到选择题的文本信息,就可以对一个题号后面所有的选择题区域进行定位,从而判断出选择题的位置,以能够获取到选择题整体区域,进一步可以获取到该选择题整体区域内的答案选项,从而可以获取答案区域,在此答案区域内的作答就是答案,在答案区域内识别答案,缩小了对答案识别的范围,因此可以较为快捷和准确地识别出答案内容。通过获取含有坐标的文本信息、根据文本信息获取选择题区域、根据带有坐标的选择题区域获取答案区域,根据答案区域识别出答案,这种逐渐缩小识别范围的识别方式,能够提高识别效率和准确性。
另外,本发明提供的技术方案还可以具有如下附加技术特征:
上述技术方案中,根据选择题整体区域,获取答题试卷中每个选择题对应的答案区域的步骤包括:获取每个选择题的第一矩形边界;根据第一矩形边界确定预答案区域;对预答案区域的右边界进行扩展,以获取第二矩形边界;获取第二矩形边界作为答案区域的边界。
在该技术方案中,获取的文本信息是以行的形式呈现出来的,因此,通过获取行的边界,就可以获取行的区域,而边界的获取方式简单,易于实现,从而可以较为容易地获取到每个选择题的第一矩形边界,也就是,将选择题的文本信息的第一矩形边界作为选择题区域。根据第一矩形边界提供的坐标信息,可以确定出预答案区域的矩形边界。在空白试卷做答时,可能有的答案和题干出现交错,也就是,把答案写到了题目里面了,所以右扩答案区域的像素点,尽可能保障答案完整。因此,为了防止获取的第一矩形边界不完整,可对预答案区域的右边界进行扩展,得到第二矩形边界,将扩展后的第二矩形边界作为答案区域的边界,以保证能够获取到完整的答案区域。例如,可以根据右边界得到答案区域,再向右扩展30个像素点,就能够防止选择题区域的截取不完整。
上述任一技术方案中,获取每个选择题的第一矩形边界的步骤包括:遍历文本信息;获取每个选择题中每行文本信息的左边界、右边界、上边界和下边界;根据每行文本信息的左边界、右边界、上边界和下边界计算出每个选择题的第一矩形边界。
在该技术方案中,为了避免遗漏,通过遍历的方式获取选择题的每行的文本信息,这样就可以得到每行文本信息的左边界,上边界、下边界和右边界,因为有的选择题不止一行,当选择题有多行时,通过获取每行文本信息的左边界,上边界、下边界和右边界的坐标,就可以计算出该到选择题边界的坐标,从而获取到每个选择题的第一矩形边界。
上述任一技术方案中,根据选择题区域,获取答题试卷中每个选择题对应的答案区域的步骤包括:获取答题试卷的答题试卷图像;根据答题试卷图像获取答案区域中含有答案的子区域;对子区域进行二值化处理,适于获取二值图;根据二值图获取选择题文字和答案文字的所在行坐标;根据水平投影和行坐标获取每个案的上边界和下边界;根据答案的上边界和下边界获取答案区域。
在该技术方案中,获取选择题区域,旨在确定的答案区域的右边界,答案区域的右边界即为选择题区域的左边界,取左边界坐标的最小值作为答案区域的右边界,就能够快速得到答案区域的右边界。整个选择题区域的上边界和下边界分别为答案区域的上边界和下边界,从而可以得到所有的选择题的答案区域。通过投影方法可以得到每个选择题的答案区域的矩形坐标,从而可以得到每个选择题对应的答案区域。
上述任一技术方案中,通过建立深度学习模型来实现根据答案区域识别每个选择题对应的答案的步骤,建立深度学习模型的步骤包括:获取模型数据;根据模型数据建立网络模型;对网络模型进行模型训练。
在该技术方案中,通过建立深度学习模型来实现对切割出的答案进行识别。通过输入尽可能多的模型数据建立起深度学习的网络模型,再通过对网络模型进行模型训练,可以提高深度学习模型的识别效率和准确率
上述任一技术方案中,获取模型数据的步骤包括:获取多张不同手写习惯的第一答案子图;通过投影删除每个答案子图中除答案内容的空白部分;获取含有答案内容的第二答案子图;对第二答案子图进行白色扩充;获取含有答案内容的第三答案子图。
在该技术方案中,获取的模型数据越多,越有利于建立起稳固的深度学习模型,每张图片数据的选择题答案就均包含了一种手写习惯,多张图片数据就包含了不同的手写习惯,从而进一步提高了深度学习模型的结构稳定性。为了便于描述,将获取的原始的数据图片设定为第一答案子图。然后通过投影的方式,将每个第一答案子图的空白部分抛去,只保留答案内容部分,从而获取到了第二答案子图,能够提高识别倾斜度。然后对第二答案子图进行扩充白色底图,并统一处理为预设的尺寸,获取到第三答案子图。第三答案子图的尺寸是根据预设尺寸的相对固定的尺寸,能够提高识别效率。
上述任一技术方案中,根据模型数据建立网络模型的步骤包括:构建自下而上的卷积神经网络结构;构建自上而下的过程结构;构建特征与特征之间的侧边连接结构;构建训练模型。
在该技术方案中,通过算法结构实现网络模型的建立,算法结构可以分为三个部分,其中,自下而上的部分是卷积神经网络的前向过程。在前向过程中,特征图的大小在经过某些层后会改变,而在经过其他一些层的时候不会改变,不改变特征图大小的层归为一个阶段,因此每次抽取的特征都是每个阶段的最后一个层的输出,这样就能构成特征金字塔。通过该方法步骤建立起的网络模型结构稳定,具有较高的辨识率,能够提高识别效率和准确率。
为实现本发明的第二目的,本发明的实施例提供了一种试卷的答案识别系统,用于实现任一实施例中的试卷答案识别方法,包括:文本获取模块,适于获取空白试卷的含有坐标的文本信息;第一区域模块,与文本获取模块信号连接,适于根据文本获取模块获取的文本信息,获取空白试卷中的选择题区域;第二区域模块,与第一区域模块信号连接,适于根据第一区域模块获取的选择题区域,获取答题试卷中每个选择题的答案区域;答案识别模块,与第二区域模块信号连接,适于根据第二区域模块获取的答案区域,获取每个选择题的答案。
在该技术方案中,通过文本获取模块获取空白试卷的文本信息,该文本信息含有坐标,获取坐标就能够对文本信息进行定位,当获取到选择题的文本信息,就可以通过第一区域模块对选择题的选择题区域进行定位,从而判断出选择题的位置,以能够获取到选择题区域,进一步可以获取到该选择题区域内的答案选项,从而通过第二区域模块可以获取答案区域,在此答案区域内的作答就是答案,在答案区域内通过答案识别模块识别出答案,缩小了对答案识别的范围,因此可以较为快捷和准确地识别出答案内容。通过获取含有坐标的文本信息、根据文本信息获取选择题区域、根据选择题区域获取答案区域,根据答案区域识别出答案,这种逐渐缩小识别范围的识别方式,能够提高识别效率和准确性。
为实现本发明的第三目的,本发明的实施例提供了一种试卷答案识别装置,包括:存储器,存储有计算机程序;处理器,执行计算机程序;
其中,处理器在执行计算机程序时,实现本发明任一实施例中的试卷答案识别方法的步骤。
在该技术方案中,本发明的实施例提供的试卷答案识别装置实现如本发明任一实施例中试卷答案识别方法的步骤,因此其具有本发明任一实施例中试卷答案识别方法的全部有益效果。
为实现本发明的第四目的,本发明的实施例提供了一种计算机可读存储介质,包括:计算机可读存储介质存储有计算机程序,计算机程序被执行时,实现本发明任一实施例中试卷答案识别方法的步骤。
本发明的实施例提供的计算机可读存储介质实现如本发明任一实施例中试卷答案识别方法的步骤,因此其具有本发明任一实施例中试卷答案识别方法的全部有益效果。
本发明的附加方面和优点将在下面的描述部分中变得明显,或通过本发明的实践了解到。
附图说明
图1为本发明一个实施例的试卷答案识别方法的流程图之一;
图2为本发明一个实施例的试卷答案识别方法的流程图之二;
图3为本发明一个实施例的试卷答案识别方法的流程图之三;
图4为本发明一个实施例的试卷答案识别方法的流程图之四;
图5为本发明一个实施例的试卷答案识别方法的流程图之五;
图6为本发明一个实施例的试卷答案识别方法的流程图之六;
图7为本发明一个实施例的试卷答案识别方法的流程图之七;
图8为本发明一个实施例的试卷答案识别方法的流程图之八;
图9为本发明一个实施例的试卷答案识别方法的空白试卷图;
图10为本发明一个实施例的试卷答案识别方法的建立网络模型的原理图;
图11为本发明一个实施例的试卷答案识别方法的实施步骤中显示结果图之一;
图12为本发明一个实施例的试卷答案识别方法的实施步骤中显示结果图之二;
图13为本发明一个实施例的试卷答案识别方法的实施步骤中显示结果图之三;
图14为本发明一个实施例的试卷答案识别方法的实施步骤中显示结果图之四;
图15为本发明一个实施例的试卷答案识别方法的实施步骤中显示结果图之六;
图16为本发明一个实施例的试卷答案识别方法的具体操作过程中显示结果图之一;
图17为本发明一个实施例的试卷答案识别方法的具体操作过程中显示结果图之二;
图18为本发明一个实施例的试卷答案识别方法的具体操作过程中显示结果图之三;
图19为本发明一个实施例的试卷答案识别方法的具体操作过程中显示结果图之四;
图20为本发明一个实施例的试卷答案识别方法的具体操作过程中显示结果图之六;
图21为本发明一个实施例的试卷答案识别系统的组成示意图;
图22为本发明一个实施例的试卷答案识别装置的组成示意图。
其中,图1至图22中的附图标记与部件名称之间的对应关系为:
100:试卷答案识别系统,110:文本获取模块,120:第一区域模块,130:第二区域模块,140:答案识别模块,200:试卷答案识别装置,210:存储器,220:处理器。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述的其他方式来实施,因此,本发明的保护范围并不受下面公开的具体实施例的限制。
在教学过程中存在很多的小型考试,教师一般手动批改卷子,现有技术中网络阅卷系统存在局限性。因此,提供一种能够简单便捷的选择题智能阅卷方法,是本领域亟待解决的技术问题。
目前,在选择题识别技术上,主要是通过提取答题卡图像信息,进行识别。现有方法主要有以下几方面的缺陷:
1.为了能够统计学生选择题的测试情况,学生在测试时,需要提交作答情况,采用填涂答题卡然后通过光标阅读机进行阅卷。填涂答题卡花费的时间通常要比原卷作答多,部分学生存在“先原卷作答,后填涂答题卡”的习惯,所以填涂试卷会占用学生的测试时间。
2.如果答题卡涂抹错误,在需要修改答案时却没有擦拭干净,那么,错误填涂的选项会导致机器误判情况。同时,也可能发生答案填涂错位的情况。
下面参照图1至图22描述本发明一些实施例的技术方案。
实施例1
如图1所示,本实施例提供了一种试卷答案识别方法,用于识别试卷中选择题的答案,试卷答案识别方法包括如下步骤:
步骤S102,获取空白试卷的含有坐标的文本信息。
步骤S104,根据文本信息,获取空白试卷中的选择题整体区域。
步骤S106,根据选择题整体区域,获取答题试卷中每个选择题对应的答案区域。
步骤S108,根据答案区域识别每个选择题对应的答案。
本实施例中,空白试卷中的选择题往往作为一道大题,例如:题号为一.单选题,下面会出现序号为1、2、4、5、6的等多个单选题。获取空白试卷的文本信息,该文本信息含有坐标,获取坐标就能够对文本信息进行定位,当获取到选择题的文本信息,就可以对一个题号后面所有的选择题区域进行定位,从而判断出选择题的位置,以能够获取到选择题整体区域,进一步可以获取到该选择题整体区域内的答案选项,从而可以获取答案区域,在此答案区域内的作答就是答案,在答案区域内识别答案,缩小了对答案识别的范围,因此可以较为快捷和准确地识别出答案内容。通过获取含有坐标的文本信息、根据文本信息获取选择题区域、根据带有坐标的选择题区域获取答案区域,根据答案区域识别出答案,这种逐渐缩小识别范围的识别方式,能够提高识别效率和准确性。
实施例2
如图2所示,本实施例提供了一种试卷答案识别方法。除上述实施例的技术特征之外,本实施例还包括以下技术特征:
根据选择题区域,获取答题试卷中每个选择题对应的答案区域的步骤包括:
步骤S202,获取每个选择题区域的第一矩形边界。
步骤S204,根据第一矩形边界确定预答案区域。
步骤S206,对预答案区域的右边界进行扩展,以获取第二矩形边界。
步骤S208,获取第二矩形边界作为答案区域的边界。
本实施例中,获取的文本信息是以行的形式呈现出来的,因此,通过获取行的边界,就可以获取行的区域,而边界的获取方式简单,易于实现,从而可以较为容易地获取到每个选择题的第一矩形边界,也就是,将选择题的文本信息的第一矩形边界作为选择题区域。根据第一矩形边界提供的坐标信息,可以确定出预答案区域的矩形边界。
在空白试卷做答时,可能有的答案和题干出现交错,也就是,把答案写到了题目里面了,所以右扩答案区域的像素点,尽可能保障答案完整。因此,为了防止获取的第一矩形边界不完整,可对预答案区域的右边界进行扩展,得到第二矩形边界,将扩展后的第二矩形边界作为答案区域的边界,以保证能够获取到完整的答案区域。例如,可以根据右边界得到答案区域,再向右扩展30个像素点,就能够防止选择题区域的截取不完整。
实施例3
如图3所示,本实施例提供了一种试卷答案识别方法。除上述实施例的技术特征之外,本实施例还包括以下技术特征:
获取每个选择题的第一矩形边界的步骤包括:
步骤S302,遍历文本信息。
步骤S304,获取每个选择题中每行文本信息的左边界、右边界、上边界和下边界。
步骤S306,根据每行文本信息的左边界、右边界、上边界和下边界计算出每个选择题的第一矩形边界。
本实施例中,为了避免遗漏,通过遍历的方式获取选择题的每行的文本信息,这样就可以得到每行文本信息的左边界,上边界、下边界和右边界,因为有的选择题不止一行,当选择题有多行时,通过获取每行文本信息的左边界,上边界、下边界和右边界的坐标,就可以计算出该到选择题边界的坐标,从而获取到每个选择题的第一矩形边界。
实施例4
如图4所示,本实施例提供了一种试卷答案识别方法。除上述实施例的技术特征之外,本实施例还包括以下技术特征:
根据选择题区域,获取答题试卷中每个选择题对应的答案区域的步骤包括:
步骤S402,获取答题试卷的答题试卷图像。
步骤S404,根据答题试卷图像获取答案区域中含有答案的子区域。
步骤S406,对子区域进行二值化处理,适于获取二值图。
步骤S408,根据二值图获取选择题文字和答案文字的所在行坐标。
步骤S410,根据水平投影和行坐标获取每个案的上边界和下边界。
步骤S412,根据答案的上边界和下边界获取答案区域。
在本实施例中,在试卷上作答时,有可能会将答案写在选择题区域的选择题的括号里;也有可能会将答案写在整个题目的左边,此时答案不在选择题区域,因此,需要根据答题试卷图像,通过投影方法可得到每个选择题的答案的坐标,以通过对选择题区域进行定位,来获取答案区域的位置,从而获得答案区域子区域。获取选择题区域,旨在确定的答案区域的右边界,答案区域的右边界即为选择题区域的左边界,取左边界坐标的最小值作为答案区域的右边界,就能够快速得到答案区域的右边界。整个选择题区域的上边界和下边界分别为答案区域的上边界和下边界,从而可以得到所有的选择题的答案区域。
通过投影方法可以得到每个选择题的答案区域的矩形坐标,从而可以得到每个选择题对应的答案区域。在进行水平投影时,可能存在非答案的噪声投影,这就要根据噪声投影的大小来区分,然后截取每道题目的答案。
截取选择题答案区域时,可能有的手写答案会与题目交错。通过OCR识别出的答题区域右边界取值x,可能做出调整。
具体过程如下:输入学生作答了的答题试卷图像,以获取前三个选择题的答案为例。截取选择题区域中含有答案的子区域student_id_img,结果如图12所示。
对student_id_img进行二值化处理,得到二值图binary_img,结果如图13所示。
对binary_img进行水平投影。通过得到恶的投影数组horizontal_p rojection,结果如图14所示。
从图14中可以得出选择题文字和答案文字的所在行坐标。
切割答案。根据水平投影可以得出三个答案的水平投影,然后截取出每个答案的上边界和下边界y,结果如图15所示。
实施例5
如图5所示,本实施例提供了一种试卷答案识别方法。除上述实施例的技术特征之外,本实施例还包括以下技术特征:
通过建立深度学习模型来实现根据答案区域识别每个选择题对应的答案的步骤,建立深度学习模型的步骤包括:
步骤S502,获取模型数据。
步骤S504,根据模型数据建立网络模型。
步骤S506,对网络模型进行模型训练。
本实施例中,通过建立深度学习模型来实现对切割出的答案进行识别。通过输入尽可能多的模型数据建立起深度学习的网络模型,再通过对网络模型进行模型训练,可以提高深度学习模型的识别效率和准确率。数字识别模型也可以使用其他的CNN模型搭建,比如DeNet、GoogLeNet、VGG等。
实施例6
如图6所示,本实施例提供了一种试卷答案识别方法。除上述实施例的技术特征之外,本实施例还包括以下技术特征:
获取模型数据的步骤包括:
步骤S602,获取多张不同手写习惯的第一答案子图。
步骤S604,通过投影删除每个答案子图中除答案内容的空白部分。
步骤S606,获取含有答案内容的第二答案子图。
步骤S608,对第二答案子图进行白色扩充。
步骤S610,获取含有答案内容的第三答案子图。
本实施例中,获取的模型数据越多,越有利于建立起稳固的深度学习模型,例如,可以获取真实标注的图片数据20000张,每张图片数据的选择题答案就均包含了一种手写习惯,多张图片数据就包含了不同的手写习惯,从而进一步提高了深度学习模型的结构稳定性。为了便于描述,将获取的原始的数据图片设定为第一答案子图。另外,在保证答题位置正确的前提下,也可以通过手写的ttf(TrueTypeFont)这种字体文件格式合成部分图片数据。然后通过投影的方式,将每个第一答案子图的空白部分抛去,只保留答案内容部分,从而获取到了第二答案子图,能够提高识别倾斜度。然后对第二答案子图进行扩充白色底图,并统一处理为预设的尺寸,获取到第三答案子图。第三答案子图的尺寸是根据预设尺寸的相对固定的尺寸,能够提高识别效率。
实施例7
如图7、图10和图11所示,本实施例提供了一种试卷答案识别方法。除上述实施例的技术特征之外,本实施例还包括以下技术特征:
根据模型数据建立网络模型的步骤包括:
步骤S702,构建自下而上的卷积神经网络结构。
步骤S704,构建自上而下的过程结构。
步骤S706,构建特征与特征之间的侧边连接结构。
步骤S708,构建训练模型。
本实施例中,如图10所示,通过构建金字塔算法结构(feature pyramidnetworks,简称FPN),可以实现网络模型的建立,金字塔算法结构可以分为三个部分:自下而上的卷积神经网络结构,具体参见如图10中的图左部分;自上而下过程结构,具体参见如图10中的图右部分;以及特征与特征之间的侧边连接结构。其中,自下而上的部分是卷积神经网络的前向过程。在前向过程中,特征图的大小在经过某些层后会改变,而在经过其他一些层的时候不会改变,不改变特征图大小的层归为一个阶段,因此每次抽取的特征都是每个阶段的最后一个层的输出,这样就能构成特征金字塔。具体来说,对于ResNet,对每个阶段的最后一个残差结构的特征激活输出。将这些残差模块输出表示为{C2,C3,C4,C5},对应于conv2,conv3,conv4和conv5的输出。ResNet结构见4.2.2。
然后再构建ResNet101网络,如图11所示,ResNet101首先有个输入7x7x64的卷积,然后经过3+4+23+3=33个building block,每个block为3层,所以有33x 3=99层,最后有个fc层(用于分类),总共1+99+1=101层,具体可参见第6列。
通过模型训练在训练模型迭代训练20000次,训练准确率0.9847,验证集准确率0.9743。
通过该方法步骤建立起的网络模型结构稳定,具有较高的辨识率,能够提高识别效率和准确率。
实施例8
如图8所示,本实施例提供了一种试卷答案识别方法。除上述实施例的技术特征之外,本实施例还包括以下技术特征:
试卷答案识别方法包括如下步骤:
步骤S802,输入一张空白试卷图像。
步骤S804,进行光学字符识别。
步骤S806,定位选择题区域及答题区域。
步骤S808,带入作答试卷,截取答案区域。
步骤S810,水平投影,分割答案。
步骤S812,深度学习模型识别选择题答案。
本实施例中,通过OCR对图9中的空白试卷图像进行识别,得到带有坐标的文本信息如下:
['2018届高三学业能力综合评估语文试题',[193,0,525,26]]
['试卷编号十一',[328,52,119,25]]
['2018.1.13',[495,54,91,20]]
['命题单位:宜兴中学、泰州中学命题人:高三语文备课組审核人:',[91,94,620,27]]
['语文I试题',[393,146,129,29]]
['一、语畜文字运用(15分).',[63,195,237,23]]
['1.在下面一段话空缺处依次填入成语,最恰当的一组是(3分)(,)',[63,222,622,26]]
[',与其他作品相比绝对是卓尔不群,这部不朽的文学巨作,',[332,250,508,24]]
['《紅楼梦》',[120,254,87,23]]
['经曹雪芹_',[64,283,79,23]]
['“披阅十载,增删五次”才完成了前80回。我们在拜读时要认真研',[263,280,585,25]]
['究,多方探讨,还要多读读红学家的言论,多看看其中的诗词歌赋的解读,多想一想才能',[65,310,783,27]]
['明白其中的主旨,对的就接受,不对的就抛弃,',[65,343,405,22]]
['是要不得的。',[594,341,110,23]]
['A.脍炙人口',[83,374,112,23]]
['呕心沥血囫囧吞枣',[216,373,181,22]]
['B.耳熬能详惨淡经营生吞活剿',[486,370,311,23]]
['C.耳熬能详呕心沥血阂囵吞枣',[84,404,311,22]]
['D.脍炙人口惨淡经营生吞活剥',[485,401,315,22]]
['2.下列诗句中,没有运用比喻的是哪-句(3分)()',[63,432,500,25]]
['A.浮云游子意,落日故人情。',[83,464,264,21]]
['B.总为浮云能蔽日,长安不见使人愁。.',[84,493,341,22]]
['c.吊影分为千里雁,辞根散作九秋篷。',[84,523,340,22]]
['D.似花还似非花,也无人惜从教坠。',[85,552,322,24]]
['3.依次填入下面一段文字横线处的语句,衔接最恰当的一-组是(3分)()',[63,580,683,25]]
['当代艺术博物馆今日举办名为“风物”的展览,展出了几位画家、摄影师的作品。',[136,609,709,25]]
['能启发我们发现身边的奇景和诗意。',[427,639,308,24]]
['①因此无论多么微不足道的事物都可变成艺术主题',[85,672,439,22]]
['②展出的作品大部分都体现出细节带出重点的风格特点',[85,701,480,23]]
['③彰显出艺术独具的神奇力量',[85,732,261,22]]
['④作品展示的都是他们在美国南部腹地、新西兰北岛旅行时留下的记录',[85,761,622,22]]
['国内容从自然环境、建筑、各类标志,到人物、室内布置,覆盖面很广',[85,789,622,25]]
['⑥而且带有叙事意味,每件作品都像B常世界的-一个短篇故事',[85,820,541,23]]
['A.②⑥⑤④③①',[85,852,138,22]]
['B.②③①④⑥⑤⑥',[303,851,147,22]]
['C.④⑤②①⑥⑧',[85,883,137,21]]
['D.④⑥⑤①⑧②',[302,881,147,22]]
['4.根据诗句表明的时间,将下列诗句排序(3分)()',[28,909,537,31]]
['①众黑寻他千百度,蓦然回酋,那人却在,灯火阑珊处。',[86,940,490,21]]
['②但将酩酊酬佳节,不用登临恨落晖。',[86,970,332,22]]
['③不效艾符趋习俗,但祈蒲酒话升平。',[86,1000,331,22]]
['④纤云弄巧,飞星传恨,银汉迢迢暗度。',[85,1030,351,23]]
['A.①⑧④②',[85,1061,107,22]]
['B.④②⑨①',[385,1059,106,22]]
['C.①④②③',[87,1090,104,22]]
['D.⑧④②①',[384,1089,106,22]]
['5.王教授书斋落成,同事老李要送-一联诗句给他,以下最合适的是(3分)()',[17,1116,772,29]]
['A.旧时王谢堂前燕,飞入寻常百姓家。',[66,1149,341,23]]
['B.纸上得来终觉浅,绝知此事娶躬行。',[66,1178,339,23]]
['c.问槊那得清如许,为有源头活水来。',[67,1207,339,24]]
['D.正是江南好风景,落花时节又逢君。',[66,1239,342,21]]
可以看出,上述文本信息中的定位选择题区域和答题区域,其中答题区域即为答案区域。
然后带入作答后的答题试卷,通过从空白试卷得出的坐标截取答题试卷中的答案子图,获取的含有答案的子区域结果如图16所示,得到A、B、C、B、D的答案。
对上述含有答案的子区域的进行二值化处理,得到二值图,结果如图17所示。可见,进过二值化处理之后的子区域的清晰度提高了很多。
然后再经过水平投影,获取的结果如图18所示。
再对上述的结构进行分割,然后删除空白部分,获取的结果如图19所示。
最后调整子区域的大小,结果如图20所示。
可见,调整之后的子区域所显示出来的结果更加清晰。
通过深度学习模型对5张答案子区域进行识别,得出:ABCBD。
实施例9
如图21所示,本实施例提供了一种试卷的答案识别系统100,用于实现任一实施例中的试卷答案识别方法,包括:文本获取模块110、第一区域模块120、第二区域模块130和答案识别模块140,文本获取模块110适于获取空白试卷的含有坐标的文本信息;第一区域模块120与文本获取模块110信号连接,适于根据文本获取模块110获取的文本信息,获取空白试卷中的选择题区域;第二区域模块130与第一区域模块120信号连接,适于根据第一区域模块120获取的选择题区域,获取答题试卷中每个选择题的答案区域;答案识别模块140与第二区域模块130信号连接,适于根据第二区域模块130获取的答案区域,获取每个选择题的答案。
本实施例中,文本获取模块110获取空白试卷,并对空白试卷进行字符识别。例如,可以将光学字符识别(Optical Character Recognition,简称OCR)模块作为文本获取模块110。OCR是指通过电子设备,例如扫描仪或数码相机,检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。
第一区域模块120可以通过编程来实现,用于根据文本获取模块110获取的文本信息,获取文本信息的矩形边界,例如,可以获取选择题的文本信息的矩形边界,从而获取选择题区域。然后根据选择题区域再获取答案区域,也是先通过获取答案的边界,从而获取答案区域,在答案区域内识别出答案,缩小了识别区域的范围,更有利于快速、准确地识别出答案。获取答题试卷的答题试卷图像也可以通过OCR模块来实现,能够获取较为清晰的文本信息。
实施例10
如图22所示,本实施例提供了一种试卷答案识别装置200,包括:存储器210和处理器220,存储器210,存储有计算机程序;处理器220,执行计算机程序;其中,处理器220在执行计算机程序时,实现任一项实施例试卷答案识别方法的步骤。
本实施例中,试卷答案识别装置实现如本发明任一实施例中试卷答案识别方法的步骤,因此其具有本发明任一实施例中试卷答案识别方法的全部有益效果。
实施例11
本实施例提供了一种计算机可读存储介质,包括:计算机可读存储介质存储有计算机程序,计算机程序被执行时,实现任一实施例中试卷答案识别方法的步骤。
本实施例中提供的计算机可读存储介质实现如本发明任一实施例中试卷答案识别方法的步骤,因此其具有本发明任一实施例中试卷答案识别方法的全部有益效果。
综上,本发明实施例的有益效果为:
1.通过获取空白试卷的带有坐标的文本信息,通过坐标获取答题试卷中的答案,能够快速识别选择题的答案,省去了人工阅卷带来的时间的浪费,也节省了因填涂答题卡带来的时间浪费。
2.直接对试卷进行答题试卷进行识别,无需制作答题卡,减少答题流程,使用方便。
3.结合OCR与投影定位选择题区域和答题区域,无需定位块,定位精准。
4.通过深度学习模型识别手写选择题答案,实用性强。
在本发明中,术语“第一”、“第二”、“第三”仅用于描述的目的,而不能理解为指示或暗示相对重要性;术语“多个”则指两个或两个以上,除非另有明确的限定。术语“安装”、“相连”、“连接”、“固定”等术语均应做广义理解,例如,“连接”可以是固定连接,也可以是可拆卸连接,或一体地连接;“相连”可以是直接相连,也可以通过中间媒介间接相连。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
本发明的描述中,需要理解的是,术语“上”、“下”、“左”、“右”、“前”、“后”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或单元必须具有特定的方向、以特定的方位构造和操作,因此,不能理解为对本发明的限制。
在本说明书的描述中,术语“一个实施例”、“一些实施例”、“具体实施例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或实例。而且,描述的具体特征、结构、材料或特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
以上仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种试卷答案识别方法,用于识别试卷中选择题的答案,其特征在于,所述试卷答案识别方法包括如下步骤:
获取空白试卷的含有坐标的文本信息;
根据所述文本信息,获取所述空白试卷中的选择题整体区域;
根据所述选择题整体区域,获取答题试卷中每个所述选择题对应的答案区域;
根据所述答案区域识别每个所述选择题对应的所述答案。
2.根据权利要求1所述的试卷答案识别方法,其特征在于,所述根据所述选择题整体区域,获取答题试卷中每个所述选择题对应的答案区域的步骤包括:
获取每个所述选择题的第一矩形边界;
根据所述第一矩形边界确定预答案区域;
对所述预答案区域的右边界进行扩展,以获取第二矩形边界;
获取所述第二矩形边界作为所述答案区域的边界。
3.根据权利要求2所述的试卷答案识别方法,其特征在于,所述获取每个所述选择题的第一矩形边界的步骤包括:
遍历所述文本信息;
获取每个所述选择题中每行所述文本信息的左边界、右边界、上边界和下边界;
根据所述每行所述文本信息的左边界、右边界、上边界和下边界计算出每个所述选择题的所述第一矩形边界。
4.根据权利要求1所述的试卷答案识别方法,其特征在于,所述根据所述选择题区域,获取答题试卷中每个所述选择题对应的答案区域的步骤包括:
获取所述答题试卷的答题试卷图像;
根据所述答题试卷图像获取所述答案区域中含有答案的子区域;
对所述子区域进行二值化处理,适于获取二值图;
根据所述二值图获取选择题文字和答案文字的所在行坐标;
根据水平投影和所述行坐标获取每个所述案的上边界和下边界;
根据所述答案的所述上边界和所述下边界获取所述答案区域。
5.根据权利要求1至4中任一项所述的试卷答案识别方法,其特征在于,
通过建立深度学习模型来实现根据所述答案区域识别每个所述选择题对应的所述答案的步骤,建立所述深度学习模型的步骤包括:
获取模型数据;
根据所述模型数据建立网络模型;
对所述网络模型进行模型训练。
6.根据权利要求5所述的试卷答案识别方法,其特征在于,所述获取模型数据的步骤包括:
获取多张不同手写习惯的第一答案子图;
通过投影删除每个所述答案子图中除答案内容的空白部分;
获取含有所述答案内容的第二答案子图;
对所述第二答案子图进行白色扩充;
获取含有所述答案内容的第三答案子图。
7.根据权利要求5所述的试卷答案识别方法,其特征在于,所述根据所述模型数据建立网络模型的步骤包括:
构建自下而上的卷积神经网络结构;
构建自上而下的过程结构;
构建特征与特征之间的侧边连接结构;
构建训练模型。
8.一种试卷答案识别系统,用于实现权利要求1至7中任一项所述的试卷答案识别方法,其特征在于,包括:
文本获取模块,适于获取空白试卷的含有坐标的文本信息;
第一区域模块,与所述文本获取模块信号连接,适于根据所述文本获取模块获取的所述文本信息,获取所述空白试卷中的选择题区域;
第二区域模块,与所述第一区域模块信号连接,适于根据所述第一区域模块获取的所述选择题区域,获取答题试卷中每个所述选择题的答案区域;
答案识别模块,与所述第二区域模块信号连接,适于根据所述第二区域模块获取的所述答案区域,获取每个所述选择题的答案。
9.一种试卷答案识别装置,其特征在于,包括:
存储器,存储有计算机程序;
处理器,执行所述计算机程序;
其中,所述处理器在执行所述计算机程序时,实现如权利要求1至7中任一项所述的试卷答案识别方法的步骤。
10.一种计算机可读存储介质,其特征在于,包括:
所述计算机可读存储介质存储有计算机程序,所述计算机程序被执行时,实现如权利要求1至7中任一项所述的试卷答案识别方法的步骤。
CN202010300106.9A 2020-04-16 2020-04-16 试卷答案识别方法、系统、装置和计算机可读存储介质 Pending CN111553211A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010300106.9A CN111553211A (zh) 2020-04-16 2020-04-16 试卷答案识别方法、系统、装置和计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010300106.9A CN111553211A (zh) 2020-04-16 2020-04-16 试卷答案识别方法、系统、装置和计算机可读存储介质

Publications (1)

Publication Number Publication Date
CN111553211A true CN111553211A (zh) 2020-08-18

Family

ID=72000006

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010300106.9A Pending CN111553211A (zh) 2020-04-16 2020-04-16 试卷答案识别方法、系统、装置和计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN111553211A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111950557A (zh) * 2020-08-21 2020-11-17 珠海奔图电子有限公司 错题处理方法、图像形成装置及电子设备
CN112200058A (zh) * 2020-09-30 2021-01-08 珠海读书郎网络教育有限公司 一种教辅资料智能批改的系统及方法
CN112288058A (zh) * 2020-11-05 2021-01-29 杭州师范大学 一种基于增强现实的答案智能填写方法
CN112749696A (zh) * 2020-09-01 2021-05-04 腾讯科技(深圳)有限公司 一种文本检测方法及装置
CN114299274A (zh) * 2021-12-29 2022-04-08 湖北博盛数字教育服务有限公司 一种问卷调查识别方法及系统
CN117894033A (zh) * 2024-03-14 2024-04-16 山东山大鸥玛软件股份有限公司 一种基于ocr识别的答卷一致性校验方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109634961A (zh) * 2018-12-05 2019-04-16 杭州大拿科技股份有限公司 一种试卷样本生成方法、装置、电子设备和存储介质
CN109740473A (zh) * 2018-12-25 2019-05-10 东莞市七宝树教育科技有限公司 一种基于阅卷系统的图片内容自动标记方法及系统
CN110008933A (zh) * 2019-04-18 2019-07-12 江苏曲速教育科技有限公司 一种通用智能阅卷系统和方法
CN110458014A (zh) * 2019-07-05 2019-11-15 深圳中兴网信科技有限公司 答题卡识读方法、装置和计算机可读存储介质
CN110879965A (zh) * 2019-10-12 2020-03-13 中国平安财产保险股份有限公司 试卷客观题的自动批阅方法、电子装置、设备及存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109634961A (zh) * 2018-12-05 2019-04-16 杭州大拿科技股份有限公司 一种试卷样本生成方法、装置、电子设备和存储介质
CN109740473A (zh) * 2018-12-25 2019-05-10 东莞市七宝树教育科技有限公司 一种基于阅卷系统的图片内容自动标记方法及系统
CN110008933A (zh) * 2019-04-18 2019-07-12 江苏曲速教育科技有限公司 一种通用智能阅卷系统和方法
CN110458014A (zh) * 2019-07-05 2019-11-15 深圳中兴网信科技有限公司 答题卡识读方法、装置和计算机可读存储介质
CN110879965A (zh) * 2019-10-12 2020-03-13 中国平安财产保险股份有限公司 试卷客观题的自动批阅方法、电子装置、设备及存储介质

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111950557A (zh) * 2020-08-21 2020-11-17 珠海奔图电子有限公司 错题处理方法、图像形成装置及电子设备
CN112749696A (zh) * 2020-09-01 2021-05-04 腾讯科技(深圳)有限公司 一种文本检测方法及装置
CN112200058A (zh) * 2020-09-30 2021-01-08 珠海读书郎网络教育有限公司 一种教辅资料智能批改的系统及方法
CN112200058B (zh) * 2020-09-30 2021-07-06 珠海读书郎网络教育有限公司 一种教辅资料智能批改的系统及方法
CN112288058A (zh) * 2020-11-05 2021-01-29 杭州师范大学 一种基于增强现实的答案智能填写方法
CN114299274A (zh) * 2021-12-29 2022-04-08 湖北博盛数字教育服务有限公司 一种问卷调查识别方法及系统
CN117894033A (zh) * 2024-03-14 2024-04-16 山东山大鸥玛软件股份有限公司 一种基于ocr识别的答卷一致性校验方法及系统
CN117894033B (zh) * 2024-03-14 2024-05-28 山东山大鸥玛软件股份有限公司 一种基于ocr识别的答卷一致性校验方法及系统

Similar Documents

Publication Publication Date Title
CN111553211A (zh) 试卷答案识别方法、系统、装置和计算机可读存储介质
CN103646582B (zh) 一种提示书写错误的方法及装置
CN111507251B (zh) 试题图像中作答区域的定位方法、装置、电子设备及计算机存储介质
CN109472014A (zh) 一种错题集自动识别生成方法及其装置
CN202939608U (zh) 阅卷系统
CN110110581B (zh) 一种基于人工智能的试卷批改方法和系统
CN108648757A (zh) 一种基于多维度课堂信息的分析方法
CN101901338A (zh) 一种试卷分数统计方法及系统
CN110705534B (zh) 一种适用于电子助视器的错题本生成方法
CN109243215B (zh) 一种基于智能装置的交互方法、智能装置及系统
CN110414563A (zh) 考试成绩统计方法、系统及计算机可读存储介质
CN110956138A (zh) 一种基于家教设备的辅助学习方法及家教设备
CN108805519A (zh) 纸质日程表电子化生成方法、装置及电子日程表生成方法
CN111753120A (zh) 一种搜题的方法、装置、电子设备和存储介质
CN113762269A (zh) 基于神经网络的中文字符ocr识别方法、系统、介质及应用
CN112347997A (zh) 一种试题检测识别方法、装置、电子设备及介质
CN111008594A (zh) 改错题评阅方法、相关设备及可读存储介质
CN107507161A (zh) 一种书写整洁度的评价方法及系统
KR102344144B1 (ko) 손글씨 인식을 통한 유아 학습 시스템
CN111738177B (zh) 一种基于姿态信息提取的学生课堂行为识别方法
CN113159014A (zh) 基于手写题号的客观题批阅方法、装置、设备及存储介质
CN108009537A (zh) 一种识别问卷批改得分的方法
Budig Extracting spatial information from historical maps: algorithms and interaction
CN110298236A (zh) 一种基于深度学习的盲文图像自动识别方法和系统
CN110705610A (zh) 一种基于检测书法临写能力的评估系统和方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20200818

WD01 Invention patent application deemed withdrawn after publication