CN115620333B - 基于人工智能的试卷自动纠错方法 - Google Patents

基于人工智能的试卷自动纠错方法 Download PDF

Info

Publication number
CN115620333B
CN115620333B CN202211545774.3A CN202211545774A CN115620333B CN 115620333 B CN115620333 B CN 115620333B CN 202211545774 A CN202211545774 A CN 202211545774A CN 115620333 B CN115620333 B CN 115620333B
Authority
CN
China
Prior art keywords
area
probability
column
line
underline
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211545774.3A
Other languages
English (en)
Other versions
CN115620333A (zh
Inventor
余海涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lanking Information Technology Nanjing Co ltd
Original Assignee
Lanking Information Technology Nanjing Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lanking Information Technology Nanjing Co ltd filed Critical Lanking Information Technology Nanjing Co ltd
Priority to CN202211545774.3A priority Critical patent/CN115620333B/zh
Publication of CN115620333A publication Critical patent/CN115620333A/zh
Application granted granted Critical
Publication of CN115620333B publication Critical patent/CN115620333B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/418Document matching, e.g. of document images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/12Detection or correction of errors, e.g. by rescanning the pattern
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • G06V30/1465Aligning or centring of the image pick-up or image-field by locating a pattern
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/16Image preprocessing
    • G06V30/162Quantising the image signal

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及数据处理领域,具体涉及基于人工智能的试卷自动纠错方法,获取未答题的试卷二值图,根据每一行含有的非零像素点个数得到每一行文字区域,每一列上的非零像素点个数得到一个印刷字的宽度,根据每一列上的非零像素点的纵坐标和该行文字区域的纵向分布范围得到每一行文字区域的每一列属于下划线的概率,根据概率得到每一段下划线,根据一段下划线和该行文字区域的纵向分布范围得到每行文字区域的初始答题区域,获取已答题的试卷图像,根据图像中的行列像素点分布得到横向超出概率和纵向超出概率,判断答题内容是否超出答题区域,若超出,则进行调整得到实际答题区域,并识别内容,进行试卷纠错,方法纠错精度高。

Description

基于人工智能的试卷自动纠错方法
技术领域
本申请涉及数据处理领域,具体涉及基于人工智能的试卷自动纠错方法。
背景技术
学校每年都会组织各种科目不同阶段的考试,尤其在期末备考阶段,考试频率急剧增加,面对堆积如山的试卷,采用人工阅卷的方式效率较低,主观性强,数据分析难,并且增大了老师的工作强度,耗费大量人力。
自动阅卷技术的出现改变了这一现状,自动阅卷是一种基于计算机的智能化阅卷技术,通过对试卷进行图像识别,获取答题区域内容,将答题区域内容与标准答案进行匹配,判断答题结果,具有智能,精准,高效的特点。
在自动阅卷获取答题区域内容时,对于填空题而言,是先利用霍夫直线检测获取到填空题的下划线,再根据下划线确定出固定的答题区域,识别出答题区域中的内容,并与标准答案进行对比,当二者相似度较高时,认为其答题正确,否则,认为答题错误。
但是,由于根据下划线确定的答题区域为固定区域,在学生的实际答题过程中,会出现答题内容超出固定的答题区域,或则答题内容与下划线存在交叠,若利用霍夫直线检测填空题的下划线,检测效果较差,会造成答题区域不够精准,导致超出答题区域的答题内容,或者与下划线交叠的答题内容无法被准确识别,导致试卷判断结果存在误差。
发明内容
针对自动阅卷中填空题的超出答题区域的答题内容,或者与下划线交叠的答题内容无法被准确识别,导致试卷判断结果存在误差的问题,本发明提供基于人工智能的试卷自动纠错方法,采用如下技术方案:
获取未答题的试卷图像的二值图,作为第一图像;
获取第一图像中的下划线,根据下划线得到初始答题区域;
获取已答题的试卷图像的二值图,作为第二图像;
将第二图像中的初始答题区域中每一列非零像素点长度减去下划线宽度,剩余的非零像素点构成第一序列,并获取初始答题区域中每一行含有的非零像素点个数构成的第二序列;
根据第一序列中非零像素点的最大列号、初始答题区域的最大列号得到答题内容横向超出概率;
根据第二序列中非零像素点的最小纵坐标和最大坐标值、每一行文字区域的纵向分布范围得到答题内容纵向超出概率;
根据横向超出概率和纵向超出概率判断答题内容是否超出初始答题区域,若超出,则对初始答题区域进行扩展,得到实际答题区域;
利用字符识别技术识别实际答题区域的内容,与标准答案进行对比,进行试卷纠错。
所述获取第一图像中的下划线,根据下划线得到初始答题区域的方法为:
获取第一图像中每行的非零像素点个数,将含有非零元素的连续行作为一行文字区域;
获取每行文字区域的每列的非零像素点个数,根据含有非零像素点的列和不含非零像素点的列之间的宽度得到印刷字宽度;
根据每行文字区域的每列上的非零像素点的纵坐标和该行文字区域的纵向分布范围得到每列属于下划线的概率,并根据概率确定出下划线;
根据每行文字区域的纵向分布范围和下划线得到第一图像每行文字区域的初始答题区域。
所述获取每行文字区域的每列的非零像素点个数,根据含有非零像素点的列和不含非零像素点的列之间的宽度得到印刷字宽度的方法为:
遍历每列的非零像素点个数,记录首次出现含有非零像素点的列,即非零像素点个数不为0的列的列号,将该列作为第一个目标列;
继续遍历,当遍历过程中遇到不含有非零像素点的列,即非零像素点个数为0的列时,重新记录下一个首次出现含有非零像素点的列的列号,即非零像素点个数不为0的列的列号,将该列作为第二个目标列;
当遍历完成时,可得到多个目标列;
获取相邻目标列的列号的差值,将相邻目标列号的差值作为相邻目标列之间的宽度,将所有相邻目标列之间的宽度的众数,作为印刷字的宽度。
所述根据每行文字区域的每列上的非零像素点的纵坐标和该行文字区域的纵向分布范围得到每列属于下划线的概率,并根据概率确定出下划线的方法为:
每列属于下划线的概率的计算方法为:
将每一列上每个像素点的纵坐标,减去当前行文字区域中像素点的最小纵坐标,得到的差值作为该列上每个像素点对应的第一差值;
将当前行文字区域中像素点的最大纵坐标和最小纵坐标的差值作为第二差值;
获取每个像素点对应的第一差值和第二差值的比值,并计算出所有像素点对应的第一差值和第二差值的比值的平均值;
将该平均值作为该列属于下划线的概率。
所述根据概率确定出下划线的方法为:
获取文字区域中的每一列属于下划线的概率的概率序列;
遍历概率序列,将连续的、概率值相同的概率归为一组,直到概率不相同时结束该组概率的划分;
将划分后的每一组概率,对应的连续的列作为一段疑似下划线,将连续列的长度作为该段疑似下划线的长度;
利用每一段疑似下划线的长度和一个印刷字的宽度将每一列属于下划线的概率修正为精准概率;
将精准概率大于概率阈值的列所属的一段疑似下划线作为下划线。
所述利用每一段疑似下划线的长度和一个印刷字的宽度将每一列属于下划线的概率修正为精准概率的方法为:
Figure 660214DEST_PATH_IMAGE001
式中,
Figure 780616DEST_PATH_IMAGE002
为第k列属于下划线的概率修正后得到的精准概率,
Figure 763616DEST_PATH_IMAGE003
为第k列所属的疑似下划线段的长度,
Figure 627667DEST_PATH_IMAGE004
为一个印刷字的宽度,
Figure 409416DEST_PATH_IMAGE005
为第k列属于下划线的概率。
所述根据每行文字区域的纵向分布范围和下划线得到第一图像每行文字区域的初始答题区域的方法为:
将下划线的最小列号到最大列号所围成的矩形区域作为横向分布范围;
将上一行文字区域的最大纵坐标与当前行文字区域的最小纵坐标的均值,和当前行文字区域的最大纵坐标与下一行文字区域的最小纵坐标的均值,之间的区域作为纵向分布范围;
根据横向分布范围和纵向分布范围得到第一图像中每行文字区域的初始答题区域。
所述根据第一序列中非零像素点的最大列号、初始答题区域的最大列号得到答题内容横向超出概率的方法为:
构建临近程度函数;
获取第一序列中非零像素点的最大列号和初始答题区域的最大列号的比值;
将1减去该比值得到的差值作为自变量代入临近程度函数,求出的函数值作为答题内容横向超出概率。
所述根据第二序列中非零像素点的最小纵坐标和最大坐标值、每一行文字区域的纵向分布范围得到答题内容纵向超出概率,根据横向超出概率和纵向超出概率判断答题内容是否超出初始答题区域的具体方法为:
根据第二序列中非零像素点的最小纵坐标、上一行文字区域的最大纵坐标与本行文字区域的最小纵坐标的均值得到向上临近程度;
根据第二序列中非零像素点的最大纵坐标、本行文字区域的最大纵坐标与下一行文字区域的最小纵坐标的均值得到向下临近程度;
根据向上临近程度和向下临近程度得到纵向超出概率;
根据横向超出概率和纵向超出概率得到答题内容超出初始答题区域的概率;
若答题内容超出初始答题区域的概率大于概率阈值,则答题内容超出初始答题区域,否则,未超出。
所述对初始答题区域进行扩展,得到实际答题区域的方法为:
使用高斯模糊对答题区域内容进行多次模糊;
根据向上临近程度与向下临近程度的相对大小,确定纵向调整方向,即当向上临近程度大于向下临近程度时,向上扩展到上一行的最大纵坐标位置,否则向下扩展到下一行的最小纵坐标位置;
使用K3M算法对模糊后的初始答题区域进行骨架提取,得到初始答题区域中的文字的中轴像素点序列;
设置斜率阈值,计算中轴像素点序列之间的斜率,将相邻的中轴像素点的斜率差值小于斜率阈值的像素点划分为一组,将横向每次扩展一个印刷字宽度;
根据中轴像素点的最大列号与当前答题区域的最大列号计算横向超出概率,当横向超出概率小于超出概率阈值时,不再进行扩展;
停止扩展时,形成答题内容的中轴像素点序列的所有像素点即为实际答题区域。
本发明的有益效果是:
(1)获取未答题的试卷图像的二值图,根据每一行含有的非零像素点个数构成的第一序列中含有非零元素的连续行得到一行文字区域,根据每行文字区域的每列上的非零像素点个数构成的第二序列,根据第二序列得到印刷字宽度,根据每一行文字区域的每一列上的非零像素点的纵坐标和该行文字区域的纵向分布范围得到下划线,根据下划线和该行文字区域的纵向分布范围得到每行文字区域的初始答题区域;该方法充分考虑到下划线的特征,即下划线处于一行文字的最下方,且宽度一致,因此其在纵向上会表现为集中分布在整行的下方,且在横向上存在一定的连续性,而其他文字无法同时满足这两个特征,因此根据横向连续以及纵向集中的像素点的分布情况确定下划线及初始答题区域,避免汉字结构的干扰,提高了获取答题区域的准确性;
(2)对已答题的已答题试卷中的行列进行分析,得到初始答题区域中像素点的横向超出概率和纵向超出概率,根据概率判断答题内容是否超出答题范围,并根据答题的中行列像素点分布得到横向接近程度和纵向接近程度,根据横向接近程度和纵向接近程度对超出的范围进行调整,得到实际的答题区域,并根据实际的答题区域进行纠错;该方法实现了对实际答题区域的自适应性匹配,提高试卷纠错过程中的灵活性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明的基于人工智能的试卷自动纠错方法流程示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的基于人工智能的试卷自动纠错方法的实施例,如图1所示,包括:
步骤一:获取未答题的试卷图像的二值图,作为第一图像,获取第一图像中的下划线,根据下划线得到初始答题区域。
需要说明的是,整张试卷上存在多种题型,而本发明只针对填空题的答题内容进行判断,文中所述的下划线即为填空题的下划线,答题区域即为填空题对应的答题区域。
本发明所针对的主要场景为:使用相机采集待检测试卷图像,由于试卷同时存在手写字与印刷字,且受填空区域范围大小的限制,填空题的实际答题内容可能超出下划线区域范围的现象,需要根据填空题初始答题区域中的灰度变化情况确定实际答题内容,再将其与标准答案进行对比判断正误,从而实现试卷的自动纠错。
其中,获取未答题的试卷图像的二值图的方法为:
获取未答题的空白试卷图像,对其进行反向二值化,得到未答题的试卷图像的二值图,该图像中每一个像素值不为0的点均为一个印刷像素点,即非零像素点。
其中,获取第一图像中的下划线,根据下划线得到初始答题区域的方法为:
(1)获取第一图像中每行的非零像素点个数,将含有非零元素的连续行作为一行文字区域,具体方法如下:
统计试卷二值图像中每一行像素中包含的像素值非0点的个数,得到该试卷二值图像中像素值非0点的个数波动序列,该个数序列中的每个数据均为每一行的行号及该行像素值非0点的个数;
将该个数序列中连续分布的(行号之间的差值为1)且个数值不为0的行划分为一组,则每一组即为一行文字区域;
其中,第
Figure 435140DEST_PATH_IMAGE006
行文字区域的纵向分布范围为
Figure 171015DEST_PATH_IMAGE007
Figure 573178DEST_PATH_IMAGE008
为第i行文字区域所有像素点纵坐标的最小值,
Figure 710898DEST_PATH_IMAGE009
为第i行文字区域所有像素点纵坐标的最大值。
(2)获取每行文字区域的每列的非零像素点个数,根据含有非零像素点的列和不含非零像素点的列之间的宽度得到印刷字宽度,具体方法如下:
获取每一行文字区域中每一列上像素值非0的像素点的个数,由此得到每一列的非0像素点个数序列,该序列中的第
Figure 907524DEST_PATH_IMAGE010
个数据为该行文字区域中第
Figure 130695DEST_PATH_IMAGE010
列像素点中非0像素点的个数
Figure 835084DEST_PATH_IMAGE011
例如:若序列为{3,5,0,7,8,0,0,2,0},第1个元素3表示第1列像素点中有3个非零像素点,第2个元素5表示第2列像素点中有5个非零像素点,第3个元素0表示第3列像素点中不含有非零像素点,第4个元素7表示第4列像素点中有7个非零像素点,第5个元素8表示第5列像素点中有8个非零像素点,第6个元素0表示第6列像素点中不含有非零像素点,第7个元素0表示第7列像素点中不含有非零像素点,第8个元素2表示第8列像素点中有2个非零像素点,第9个元素0表示第9列像素点中不含有0个非零像素点;
其中,根据含有非零像素点的列和不含非零像素点的列之间的宽度得到印刷字宽度的方法为:
a.遍历该序列,记录该序列中首次出现含有非零像素点的列的列号,即非零像素点个数不为0的列,将该列作为第一个目标列;
例如,{3,5,0,7,8,0,0,2,0}中,首次出现含有非零的列为3对应的列,即第1列,记录列号1,目标列为1;
b.继续遍历,当遍历过程中遇到不含有非零像素点的列,即非零像素点个数为0的列时,重新记录下一个首次出现含有非零像素点的列,即非零像素点个数不为0的列,将该列作为第二个目标列;
例如,{3,5,0,7,8,0,0,2,0}中,在记录列号1之和继续遍历,遍历到第3列的0时,重新记录下一个首次出现含有非零像素的列,即7的所在列,记录列号4,目标列为4;继续遍历,到第6列的0时,重新记录下一个首次出现含有非零像素的列,为第8列的2,此时,记录列号8,目标列为8;
c.当遍历完第二序列时,可得到多个目标列;
例如,{3,5,0,7,8,0,0,2,0}经过(1)、(2)的方法步骤,记录到的目标列的列号依次为{1,4,8};
d.获取相邻目标列的列号的差值,将相邻目标列号的差值作为相邻目标列之间的宽度,将所有相邻目标列之间的宽度的众数,作为一个印刷字的宽度。
例如,{1,4,8}中目标列号1和目标列号4相邻,二者之间的宽度为3;目标列号4和目标列号8相邻,二者之间的宽度为4;若存在目标列为{1,4,8,12},则相邻目标列号的差值,即相邻目标列之间的宽度依次为3,4,4,因此选择宽度中的众数4,作为一个印刷字的宽度,用W表示。
(3)根据每行文字区域的每列上的非零像素点的纵坐标和该行文字区域的纵向分布范围得到每列属于下划线的概率,并根据概率确定出下划线,具体如下:
首先,根据每行文字区域的每列上的非零像素点的纵坐标和该行文字区域的纵向分布范围得到每列属于下划线的概率,方法如下:
a.将每一列上每个像素点的纵坐标,减去当前行文字区域中像素点的最小纵坐标,得到的差值作为该列上每个像素点对应的第一差值;
b.将当前行文字区域中像素点的最大纵坐标和最小纵坐标的差值作为第二差值;
c.获取每个像素点对应的第一差值和第二差值的比值,并计算出所有像素点对应的第一差值和第二差值的比值的平均值;
d.将该平均值作为该列属于下划线的概率:
Figure 561731DEST_PATH_IMAGE012
式中,
Figure 194838DEST_PATH_IMAGE013
为当前行即第i行文字区域中第
Figure 639726DEST_PATH_IMAGE010
列属于下划线的概率,
Figure 118112DEST_PATH_IMAGE011
为第
Figure 230424DEST_PATH_IMAGE010
含有的像素点个数,
Figure 267388DEST_PATH_IMAGE014
为第k列上第
Figure 465151DEST_PATH_IMAGE014
个像素点,
Figure 747228DEST_PATH_IMAGE015
为第k列上第
Figure 714047DEST_PATH_IMAGE014
个像素点的纵坐标,
Figure 688956DEST_PATH_IMAGE008
为第i行文字区域中像素点的最小纵坐标,
Figure 108436DEST_PATH_IMAGE009
为第i行文字区域中像素点的最大纵坐标,
Figure 692739DEST_PATH_IMAGE016
为该文字区域的纵向分布范围,
Figure 248485DEST_PATH_IMAGE017
表示第
Figure 659875DEST_PATH_IMAGE014
个像素点相对于整个文字区域的相对位置,越靠近文字区域的底部该值越大,对应该列属于下划线的概率越大;
其中,
Figure 566651DEST_PATH_IMAGE018
为第一差值,
Figure 190531DEST_PATH_IMAGE016
为第二差值,
Figure 131942DEST_PATH_IMAGE019
为所有像素点对应的第一差值和第二差值的比值的平均值;
需要说明的是,由于下划线表现为直线,传统的对下划线的检测方法为霍夫直线检测,但是由于霍夫直线检测丢失了处于同一条直线上的像素点的位置信息,而印刷字是整齐排列的,由印刷字的同一行像素点也是呈直线分布的,因此印刷字像素点往往会干扰下划线的检测,考虑到下划线处于一行文字的最下方,且宽度一致,因此其在纵向上会表现为集中分布在整行的下方,且在横向上存在一定的连续性,而其他文字无法同时满足这两个特征,因此本发明根据各个像素点的横向连续性以及纵向集中性判断各个像素点属于下划线的概率。
然后,根据概率确定出下划线的方法为:
a.获取文字区域中的每一列属于下划线的概率的概率序列;
b.遍历概率序列,将连续的、概率值相同的概率归为一组,直到概率不相同时结束该组概率的划分;
c. 将划分后的每一组概率,对应的连续的列作为一段疑似下划线,将连续列的长度作为该段疑似下划线的长度,从而实现对该行文字区域中所有列的“分段”操作,并记录每段疑似下划线的最小列号与最大列号;
d.利用每一段疑似下划线的长度和一个印刷字的宽度将每一列属于下划线的概率修正为精准概率,具体方法为:
Figure 714233DEST_PATH_IMAGE020
式中,
Figure 341261DEST_PATH_IMAGE021
为第k列属于下划线的概率修正后得到的精准概率,
Figure 34410DEST_PATH_IMAGE003
为第k列所属的疑似下划线段的长度,
Figure 564749DEST_PATH_IMAGE022
为一个印刷字的宽度,
Figure 52362DEST_PATH_IMAGE005
为第k列属于下划线的概率,公式中,其中
Figure 933730DEST_PATH_IMAGE023
为连续长度相对于单个印刷字宽度的差异程度,由于填空题一般要填写多个字,划线区域也需要大于多个印刷字的宽度,因此当
Figure 164992DEST_PATH_IMAGE023
远大于1时,该列像素属于下划线的概率较高;而当
Figure 48372DEST_PATH_IMAGE023
小于等于1时,表示此时连续长度不足一个印刷字的宽度,则该列像素属于下划线的概率较低,由于连续长度越长,
Figure 706886DEST_PATH_IMAGE023
的值越大,则该列像素属于下划线的概率越大,因此连续长度与下划线长度存在正相关关系,因此本发明使用
Figure 75551DEST_PATH_IMAGE024
建立连续长度与下划线概率的正相关关系,x为自变量;
e.将精准概率大于概率阈值的列所属的一段疑似下划线作为下划线,具体为:设置概率阈值
Figure 110503DEST_PATH_IMAGE025
,当第i行文字区域中第k列属于下划线的概率修正后得到的精准概率
Figure 615433DEST_PATH_IMAGE026
时,认为第k列像素属于下划线,该列像素所属疑似下划线即为一段下划线。
需要说明的是,由于一些标点符号也会存在纵向聚集性,和下划线一样像素点聚集在纵向,如英文句号,但是标点符号与下划线的区别在于,下划线在横向上存在一定的连续性,因此本发明再次根据横向连续性对文字区域中各列像素属于下划线的概率进行修正。
(4)根据每行文字区域的纵向分布范围和下划线得到第一图像每行文字区域的初始答题区域的方法为:
a.横向分布范围为:该段下划线的最小列号
Figure 444849DEST_PATH_IMAGE027
到最大列号
Figure 35230DEST_PATH_IMAGE028
所围成的矩形区域;
b.纵向分布范围为:从上一行文字区域的最大纵坐标
Figure 372409DEST_PATH_IMAGE029
与本行文字区域的最小纵坐标
Figure 731846DEST_PATH_IMAGE008
的均值,到本行文字区域的最大纵坐标
Figure 732163DEST_PATH_IMAGE030
与下一行文字区域的最小纵坐标
Figure 809840DEST_PATH_IMAGE031
的均值之间的区域,即
Figure 186595DEST_PATH_IMAGE032
之间的纵向分布范围,记录每一段下划线的列像素点的个数为
Figure 666118DEST_PATH_IMAGE033
,该值也可以表示下划线的宽度;
c.将横向分布范围和纵向分布范围构成的区域作为该段下划线对应的初始答题区域,可按照本步骤的方法得到整张试卷上所有填空题的初始答题区域。
需要说明的是,考虑到一道填空题的划线位置并不是固定的,且可能存在多个划线区域,故需要判断每一行中是否存在划线区域,本发明首先根据印刷文字线性分布的特点,提取试卷上每一行文字区域,再对每一行文字区域进行划线像素点的判断,从而确定初始答题区域。
步骤二:获取已答题的试卷图像的二值图,作为第二图像;将第二图像中的初始答题区域中每一列非零像素点长度减去下划线宽度,剩余的非零像素点构成第一序列,并获取初始答题区域中每一行含有的非零像素点个数构成的第二序列;
该步骤是获取到已经答题的试卷图像进行初步处理,得到不含有下划线的行、列像素点。
其中,获取已答题的试卷图像的二值图的获取方法为:
(1)使用相机采集已答题试卷图像,根据试卷的长轴方向与纵轴方向对试卷进行校正,对图像进行反向二值化处理,得到已答题试卷二值图像;由于待检测试卷与空白试卷在图像采集时的摆放角度存在差异,因此在进行答题内容提取时,并不能直接将待检测的试卷图像与空白试卷图像进行模板匹配,即将两张图像直接相减,且由于采集时光照环境存在差异,直接相减后的图像会存在较多的噪声点,影响检测结果的准确性,因此先根据试卷的长轴方向与纵轴方向对试卷进行校正;
(2)根据各个初始答题区域的分布范围确定在当前待检测的二值图像中的位置;
以第
Figure 359309DEST_PATH_IMAGE034
个初始答题区域为例进行分析:
当学生填写上答案后,初始答题区域中每一列上非0像素点的个数会增加,一般情况下,初始答题区域中存在两种类型:未答题以及答题完成,由于本发明需要根据非0像素点的分布情况确定答题内容之间存在一定的连续性;
因此,统计各个初始答题区域中每一列上非0像素点的个数,由于初始答题区域中包含下划线,使得整个初始答题区域上的每个位置均存在非0像素点;
为了避免下划线对答题内容检测的干扰,本发明首先将每一列上非0像素点的个数减去下划线宽度
Figure 924282DEST_PATH_IMAGE035
,所得结果构成第一序列;同理,获取初始答题区域中每一行上的非0像素点的个数,得到第二序列。
步骤三:根据第一序列中非零像素点的最大列号、初始答题区域的最大列号得到答题内容横向超出概率;根据第二序列中非零像素点的最小纵坐标和最大坐标值、每一行文字区域的纵向分布范围得到答题内容纵向超出概率;根据横向超出概率和纵向超出概率判断答题内容是否超出初始答题区域;
该步骤的目的是,根据已经答题的答题区域中的像素点分布,判断学生的答题内容是否超出答题区域。
需要说明的是,考虑到答题区域长度不足时,学生一般会向上或向下沿着行与行之间的间隙继续填写,因此判断答题内容是否超出答题区域时,需要从横向超出概率与纵向超出概率两个方面综合判断,故根据第二序列中像素点的分布范围判断答题内容超出初始答题区域的概率。
其中,根据第一序列中非零像素点的最大列号、初始答题区域的最大列号得到答题内容横向超出概率的方法为:
(1)构建临近程度函数
Figure 104728DEST_PATH_IMAGE036
Figure 173178DEST_PATH_IMAGE037
公式中,
Figure 780877DEST_PATH_IMAGE038
为自然常数,
Figure 567567DEST_PATH_IMAGE039
为自变量;
(2)获取第一序列中非零像素点的最大列号
Figure 286125DEST_PATH_IMAGE040
和初始答题区域的最大列号
Figure 238775DEST_PATH_IMAGE028
的比值
Figure 751796DEST_PATH_IMAGE041
(3)将1减去该比值得到的差值作为自变量代入临近程度函数,求出的函数值作为答题内容横向超出概率:
Figure 25782DEST_PATH_IMAGE042
公式中,
Figure 548031DEST_PATH_IMAGE043
为非0像素点的最大列号相对于整个初始答题区域的横向超出概率,答题内容越接近初始答题区域的最右侧,
Figure 591073DEST_PATH_IMAGE041
的比值越接近于1,
Figure 540574DEST_PATH_IMAGE044
越接近于0,对应
Figure 301857DEST_PATH_IMAGE045
的值越大,此时横向超出概率越高,对应的横向超出概率越大。
其中,根据第二序列中非零像素点的最小纵坐标和最大坐标值、每一行文字区域的纵向分布范围得到答题内容纵向超出概率的具体方法为:
根据第二序列中非零像素点的最小纵坐标和最大坐标值、每一行文字区域的纵向分布范围得到答题内容纵向超出概率,方法为:
(1)根据第二序列中非零像素点的最小纵坐标
Figure 860752DEST_PATH_IMAGE046
、上一行文字区域的最大纵坐标
Figure 23880DEST_PATH_IMAGE029
与本行文字区域的最小纵坐标
Figure 878704DEST_PATH_IMAGE008
的均值得到向上临近程度:
Figure 392862DEST_PATH_IMAGE047
公式中,
Figure 256912DEST_PATH_IMAGE048
为向上临近程度,该值越大说明答题内容越接近初始答题区域上方。
(2)根据第二序列中非零像素点的最大纵坐标
Figure 8968DEST_PATH_IMAGE049
、本行文字区域的最大纵坐标
Figure 64386DEST_PATH_IMAGE009
与下一行文字区域的最小纵坐标
Figure 534682DEST_PATH_IMAGE031
的均值得到向下临近程度:
Figure 936844DEST_PATH_IMAGE050
公式中,
Figure 808985DEST_PATH_IMAGE051
为向下临近程度,该值越大说明答题内容越接近初始答题区域下方
(3)根据向上临近程度和向下临近程度得到纵向超出概率:
由于一般情况下,学生在沿着行与行之间的继续填写时,为了语言的连贯性,往往只会选择向上或向下中的一个方向,因此只需要选择向上临近程度与向下临近程度中的最大值作为纵向超出概率即可,即将
Figure 536770DEST_PATH_IMAGE048
Figure 759941DEST_PATH_IMAGE051
中的最大值作为纵向超出概率,纵向超出概率越高则纵向超出概率越高。
其中,根据横向超出概率和纵向超出概率判断答题内容是否超出初始答题区域的方法为:
(1)根据横向超出概率和纵向超出概率得到答题内容超出初始答题区域的概率:
Figure 700215DEST_PATH_IMAGE052
公式中,
Figure 190977DEST_PATH_IMAGE053
为第t个初始答题区域的答题内容超出初始答题区域的概率,
Figure 824084DEST_PATH_IMAGE054
为选出
Figure 268972DEST_PATH_IMAGE055
中的最大值,即纵向超出概率;
(2)若概率大于超出概率阈值,则答题内容超出初始答题区域,否则,未超出:
设置概率阈值为
Figure 278516DEST_PATH_IMAGE056
,当
Figure 125249DEST_PATH_IMAGE053
小于概率阈值时,认为该初始答题区域中不存在答题内容超出初始区域的现象,不对其进行调整;否则需要对初始答题区域进行调整,继续执行后续操作,得到最终的答题区域。
步骤四:对初始答题区域进行扩展,得到实际答题区域。
该步骤的目的是,对答题内容超出答题区域的情况进行适应性调整,得到实际的答题内容。
其中,对初始答题区域进行扩展,得到实际答题区域的具体方法为:
(1)使用高斯模糊对答题区域内容进行多次模糊,本发明中对答题区域的模糊次数设置为3次;
(2)根据向上临近程度与向下临近程度的相对大小,确定纵向调整方向,即当
Figure 663678DEST_PATH_IMAGE057
时,向上扩展到上一行的最大纵坐标位置,否则向下扩展到下一行的最小纵坐标位置;
(3)使用K3M算法对模糊后的初始答题区域进行骨架提取,得到初始答题区域中的文字的中轴像素点序列;
(4)设置斜率阈值
Figure 359976DEST_PATH_IMAGE058
,计算中轴像素点序列之间的斜率,将相邻的中轴像素点的斜率差值小于
Figure 907632DEST_PATH_IMAGE059
的像素点划分为一组,将横向每次扩展一个印刷字宽度,重复操作(1)至(3)获取扩展后的答题区域中答题内容的中轴像素点序列;
根据中轴像素点的最大列号与当前答题区域的最大列号计算横向超出概率,当横向超出概率小于第一阈值时,不再进行扩展;由此得到最终答题区域,形成答题内容的中轴像素点序列的所有像素点即为实际答题内容。
步骤五:利用字符识别技术识别实际答题区域的内容,与标准答案进行对比,进行试卷纠错。
该步骤的目的是,将实际答题内容与对应的标准答案进行对比,判断正误。
使用光学字符识别技术对答题区域的实际答题内容进行识别,将识别的文本信息与数据库中的对应顺序的标准答案进行比对,从而判断文本内容是否准确,当认为答题内容不准确时,认为答题内容存在错误,否则认为答题正确。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (6)

1.一种基于人工智能的试卷自动纠错方法,其特征在于,该方法包括:
获取未答题的试卷图像的二值图,作为第一图像;
获取第一图像中的下划线,根据下划线得到初始答题区域;
所述获取第一图像中的下划线,根据下划线得到初始答题区域的方法为:
获取第一图像中每行的非零像素点个数,将含有非零元素的连续行作为一行文字区域;
获取每行文字区域的每列的非零像素点个数,根据含有非零像素点的列和不含非零像素点的列之间的宽度得到印刷字宽度;
根据每行文字区域的每列上的非零像素点的纵坐标和该行文字区域的纵向分布范围得到每列属于下划线的概率,并根据概率确定出下划线;
根据每行文字区域的纵向分布范围和下划线得到第一图像每行文字区域的初始答题区域;
获取已答题的试卷图像的二值图,作为第二图像;
将第二图像中的初始答题区域中每一列非零像素点长度减去下划线宽度,剩余的非零像素点构成第一序列,并获取初始答题区域中每一行含有的非零像素点个数构成的第二序列;
根据第一序列中非零像素点的最大列号、初始答题区域的最大列号得到答题内容横向超出概率;
所述根据第一序列中非零像素点的最大列号、初始答题区域的最大列号得到答题内容横向超出概率的方法为:
构建临近程度函数;
获取第一序列中非零像素点的最大列号和初始答题区域的最大列号的比值;
将1减去该比值得到的差值作为自变量代入临近程度函数,求出的函数值作为答题内容横向超出概率;
根据第二序列中非零像素点的最小纵坐标和最大坐标值、每一行文字区域的纵向分布范围得到答题内容纵向超出概率;
根据横向超出概率和纵向超出概率判断答题内容是否超出初始答题区域,若超出,则对初始答题区域进行扩展,得到实际答题区域;
所述根据第二序列中非零像素点的最小纵坐标和最大坐标值、每一行文字区域的纵向分布范围得到答题内容纵向超出概率,根据横向超出概率和纵向超出概率判断答题内容是否超出初始答题区域的具体方法为:
根据第二序列中非零像素点的最小纵坐标、上一行文字区域的最大纵坐标与本行文字区域的最小纵坐标的均值得到向上临近程度;
根据第二序列中非零像素点的最大纵坐标、本行文字区域的最大纵坐标与下一行文字区域的最小纵坐标的均值得到向下临近程度;
根据向上临近程度和向下临近程度得到纵向超出概率;
根据横向超出概率和纵向超出概率得到答题内容超出初始答题区域的概率;
若答题内容超出初始答题区域的概率大于概率阈值,则答题内容超出初始答题区域,否则,未超出;
所述对初始答题区域进行扩展,得到实际答题区域的方法为:
使用高斯模糊对答题区域内容进行多次模糊;
根据向上临近程度与向下临近程度的相对大小,确定纵向调整方向,即当向上临近程度大于向下临近程度时,向上扩展到上一行的最大纵坐标位置,否则向下扩展到下一行的最小纵坐标位置;
使用K3M算法对模糊后的初始答题区域进行骨架提取,得到初始答题区域中的文字的中轴像素点序列;
设置斜率阈值,计算中轴像素点序列之间的斜率,将相邻的中轴像素点的斜率差值小于斜率阈值的像素点划分为一组,将横向每次扩展一个印刷字宽度;
根据中轴像素点的最大列号与当前答题区域的最大列号计算横向超出概率,当横向超出概率小于超出概率阈值时,不再进行扩展;
停止扩展时,形成答题内容的中轴像素点序列的所有像素点即为实际答题区域;
利用字符识别技术识别实际答题区域的内容,与标准答案进行对比,进行试卷纠错。
2.根据权利要求1所述的基于人工智能的试卷自动纠错方法,其特征在于,所述获取每行文字区域的每列的非零像素点个数,根据含有非零像素点的列和不含非零像素点的列之间的宽度得到印刷字宽度的方法为:
遍历每列的非零像素点个数,记录首次出现含有非零像素点的列,即非零像素点个数不为0的列的列号,将该列作为第一个目标列;
继续遍历,当遍历过程中遇到不含有非零像素点的列,即非零像素点个数为0的列时,重新记录下一个首次出现含有非零像素点的列的列号,即非零像素点个数不为0的列的列号,将该列作为第二个目标列;
当遍历完成时,可得到多个目标列;
获取相邻目标列的列号的差值,将相邻目标列号的差值作为相邻目标列之间的宽度,将所有相邻目标列之间的宽度的众数,作为印刷字的宽度。
3.根据权利要求1所述的基于人工智能的试卷自动纠错方法,其特征在于,所述根据每行文字区域的每列上的非零像素点的纵坐标和该行文字区域的纵向分布范围得到每列属于下划线的概率,并根据概率确定出下划线的方法为:
每列属于下划线的概率的计算方法为:
将每一列上每个像素点的纵坐标,减去当前行文字区域中像素点的最小纵坐标,得到的差值作为该列上每个像素点对应的第一差值;
将当前行文字区域中像素点的最大纵坐标和最小纵坐标的差值作为第二差值;
获取每个像素点对应的第一差值和第二差值的比值,并计算出所有像素点对应的第一差值和第二差值的比值的平均值;
将该平均值作为该列属于下划线的概率。
4.根据权利要求1所述的基于人工智能的试卷自动纠错方法,其特征在于,所述根据概率确定出下划线的方法为:
获取文字区域中的每一列属于下划线的概率的概率序列;
遍历概率序列,将连续的、概率值相同的概率归为一组,直到概率不相同时结束该组概率的划分;
将划分后的每一组概率,对应的连续的列作为一段疑似下划线,将连续列的长度作为该段疑似下划线的长度;
利用每一段疑似下划线的长度和一个印刷字的宽度将每一列属于下划线的概率修正为精准概率;
将精准概率大于概率阈值的列所属的一段疑似下划线作为下划线。
5.根据权利要求4所述的基于人工智能的试卷自动纠错方法,其特征在于,所述利用每一段疑似下划线的长度和一个印刷字的宽度将每一列属于下划线的概率修正为精准概率的方法为:
Figure QLYQS_1
式中,p’k为第k列属于下划线的概率修正后得到的精准概率,Nk为第k列所属的疑似下划线段的长度,W为一个印刷字的宽度,pk为第k列属于下划线的概率。
6.根据权利要求1所述的基于人工智能的试卷自动纠错方法,其特征在于,所述根据每行文字区域的纵向分布范围和下划线得到第一图像每行文字区域的初始答题区域的方法为:
将下划线的最小列号到最大列号所围成的矩形区域作为横向分布范围;
将上一行文字区域的最大纵坐标与当前行文字区域的最小纵坐标的均值,和当前行文字区域的最大纵坐标与下一行文字区域的最小纵坐标的均值,之间的区域作为纵向分布范围;
根据横向分布范围和纵向分布范围得到第一图像中每行文字区域的初始答题区域。
CN202211545774.3A 2022-12-05 2022-12-05 基于人工智能的试卷自动纠错方法 Active CN115620333B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211545774.3A CN115620333B (zh) 2022-12-05 2022-12-05 基于人工智能的试卷自动纠错方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211545774.3A CN115620333B (zh) 2022-12-05 2022-12-05 基于人工智能的试卷自动纠错方法

Publications (2)

Publication Number Publication Date
CN115620333A CN115620333A (zh) 2023-01-17
CN115620333B true CN115620333B (zh) 2023-03-10

Family

ID=84880924

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211545774.3A Active CN115620333B (zh) 2022-12-05 2022-12-05 基于人工智能的试卷自动纠错方法

Country Status (1)

Country Link
CN (1) CN115620333B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115880699B (zh) * 2023-03-03 2023-05-09 济南市莱芜区综合检验检测中心 一种食品包装袋检测方法及系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020016871A (ja) * 2018-07-17 2020-01-30 大日本印刷株式会社 情報処理装置及びプログラム
CN111597908A (zh) * 2020-04-22 2020-08-28 深圳中兴网信科技有限公司 试卷批改方法和试卷批改装置
CN111738249A (zh) * 2020-08-26 2020-10-02 北京易真学思教育科技有限公司 图像检测方法、装置、电子设备及存储介质
CN114283425A (zh) * 2021-11-23 2022-04-05 广州市博雅信息科技有限公司 一种答题本制作方法、识别方法、装置及存储介质
CN114463770A (zh) * 2021-12-13 2022-05-10 黑盒科技(广州)有限公司 一种用于普遍试卷题目的智能切题方法
CN114550176A (zh) * 2022-02-22 2022-05-27 无锡学院 基于深度学习的试卷批改方法
CN115393861A (zh) * 2022-10-31 2022-11-25 蓝舰信息科技南京有限公司 一种手写体文本精准分割方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020016871A (ja) * 2018-07-17 2020-01-30 大日本印刷株式会社 情報処理装置及びプログラム
CN111597908A (zh) * 2020-04-22 2020-08-28 深圳中兴网信科技有限公司 试卷批改方法和试卷批改装置
CN111738249A (zh) * 2020-08-26 2020-10-02 北京易真学思教育科技有限公司 图像检测方法、装置、电子设备及存储介质
CN114283425A (zh) * 2021-11-23 2022-04-05 广州市博雅信息科技有限公司 一种答题本制作方法、识别方法、装置及存储介质
CN114463770A (zh) * 2021-12-13 2022-05-10 黑盒科技(广州)有限公司 一种用于普遍试卷题目的智能切题方法
CN114550176A (zh) * 2022-02-22 2022-05-27 无锡学院 基于深度学习的试卷批改方法
CN115393861A (zh) * 2022-10-31 2022-11-25 蓝舰信息科技南京有限公司 一种手写体文本精准分割方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
方慧琴 ; 程永强 ; .阅卷系统中的答题区域快速智能分割算法研究.2018,(第20期),全文. *

Also Published As

Publication number Publication date
CN115620333A (zh) 2023-01-17

Similar Documents

Publication Publication Date Title
US5229589A (en) Questionnaire scanning system employing expandable answer mark areas for efficient scanning and mark detection
US8358852B2 (en) Automatic forms identification systems and methods
CN103310211B (zh) 一种基于图像处理的填注标记识别方法
Lee et al. Binary segmentation algorithm for English cursive handwriting recognition
CN115620333B (zh) 基于人工智能的试卷自动纠错方法
CN106682629A (zh) 一种复杂背景下身份证号识别算法
US9324001B2 (en) Character recognition device and character segmentation method
CN111598104B (zh) 一种车牌字符识别方法及其系统
CN110211048A (zh) 一种基于卷积神经网络的复杂档案图像倾斜矫正方法
CN115393861B (zh) 一种手写体文本精准分割方法
CN112446262A (zh) 文本分析方法、装置、终端和计算机可读存储介质
US8787702B1 (en) Methods and apparatus for determining and/or modifying image orientation
CN110647879B (zh) 一种答题卡客观题识别方法
CN111339797A (zh) 一种能够准确识别受损一维条码的解码方法及终端
Boudraa et al. An improved skew angle detection and correction technique for historical scanned documents using morphological skeleton and progressive probabilistic hough transform
CN109284702B (zh) 一种基于图像模式的答题卷给分及阅卷系统
CN112016566B (zh) 一种金融票据大写金额处手写汉字的分割方法
CN107798355B (zh) 一种基于文档图像版式自动分析与判断的方法
CN109472257A (zh) 一种字符版面确定方法及装置
CN109726722B (zh) 一种字符分割方法及装置
CN113486786B (zh) 一种自动作业批改系统
CN113837119A (zh) 一种基于灰度图像识别易混淆字符的方法及设备
CN114299516A (zh) 表格或文本行的处理方法、票据处理方法、装置及存储介质
CN117292381B (zh) 一种印刷电路板的序列号读取方法
CN117237585B (zh) 答题卡的光学标记定位识别方法、系统、设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant