CN115620333A

CN115620333A - 基于人工智能的试卷自动纠错方法

Info

Publication number: CN115620333A
Application number: CN202211545774.3A
Authority: CN
Inventors: 余海涛
Original assignee: Lanking Information Technology Nanjing Co ltd
Current assignee: Lanking Information Technology Nanjing Co ltd
Priority date: 2022-12-05
Filing date: 2022-12-05
Publication date: 2023-01-17
Anticipated expiration: 2042-12-05
Also published as: CN115620333B

Abstract

本发明涉及数据处理领域，具体涉及基于人工智能的试卷自动纠错方法，获取未答题的试卷二值图，根据每一行含有的非零像素点个数得到每一行文字区域，每一列上的非零像素点个数得到一个印刷字的宽度，根据每一列上的非零像素点的纵坐标和该行文字区域的纵向分布范围得到每一行文字区域的每一列属于下划线的概率，根据概率得到每一段下划线，根据一段下划线和该行文字区域的纵向分布范围得到每行文字区域的初始答题区域，获取已答题的试卷图像，根据图像中的行列像素点分布得到横向超出概率和纵向超出概率，判断答题内容是否超出答题区域，若超出，则进行调整得到实际答题区域，并识别内容，进行试卷纠错，方法纠错精度高。

Description

基于人工智能的试卷自动纠错方法

技术领域

本申请涉及数据处理领域，具体涉及基于人工智能的试卷自动纠错方法。

背景技术

学校每年都会组织各种科目不同阶段的考试，尤其在期末备考阶段，考试频率急剧增加，面对堆积如山的试卷，采用人工阅卷的方式效率较低，主观性强，数据分析难，并且增大了老师的工作强度，耗费大量人力。

自动阅卷技术的出现改变了这一现状，自动阅卷是一种基于计算机的智能化阅卷技术，通过对试卷进行图像识别，获取答题区域内容，将答题区域内容与标准答案进行匹配，判断答题结果，具有智能，精准，高效的特点。

在自动阅卷获取答题区域内容时，对于填空题而言，是先利用霍夫直线检测获取到填空题的下划线，再根据下划线确定出固定的答题区域，识别出答题区域中的内容，并与标准答案进行对比，当二者相似度较高时，认为其答题正确，否则，认为答题错误。

但是，由于根据下划线确定的答题区域为固定区域，在学生的实际答题过程中，会出现答题内容超出固定的答题区域，或则答题内容与下划线存在交叠，若利用霍夫直线检测填空题的下划线，检测效果较差，会造成答题区域不够精准，导致超出答题区域的答题内容，或者与下划线交叠的答题内容无法被准确识别，导致试卷判断结果存在误差。

发明内容

针对自动阅卷中填空题的超出答题区域的答题内容，或者与下划线交叠的答题内容无法被准确识别，导致试卷判断结果存在误差的问题，本发明提供基于人工智能的试卷自动纠错方法，采用如下技术方案：

获取未答题的试卷图像的二值图，作为第一图像；

获取第一图像中的下划线，根据下划线得到初始答题区域；

获取已答题的试卷图像的二值图，作为第二图像；

将第二图像中的初始答题区域中每一列非零像素点长度减去下划线宽度，剩余的非零像素点构成第一序列，并获取初始答题区域中每一行含有的非零像素点个数构成的第二序列；

根据第一序列中非零像素点的最大列号、初始答题区域的最大列号得到答题内容横向超出概率；

根据第二序列中非零像素点的最小纵坐标和最大坐标值、每一行文字区域的纵向分布范围得到答题内容纵向超出概率；

根据横向超出概率和纵向超出概率判断答题内容是否超出初始答题区域，若超出，则对初始答题区域进行扩展，得到实际答题区域；

利用字符识别技术识别实际答题区域的内容，与标准答案进行对比，进行试卷纠错。

所述获取第一图像中的下划线，根据下划线得到初始答题区域的方法为：

获取第一图像中每行的非零像素点个数，将含有非零元素的连续行作为一行文字区域；

获取每行文字区域的每列的非零像素点个数，根据含有非零像素点的列和不含非零像素点的列之间的宽度得到印刷字宽度；

根据每行文字区域的每列上的非零像素点的纵坐标和该行文字区域的纵向分布范围得到每列属于下划线的概率，并根据概率确定出下划线；

根据每行文字区域的纵向分布范围和下划线得到第一图像每行文字区域的初始答题区域。

所述获取每行文字区域的每列的非零像素点个数，根据含有非零像素点的列和不含非零像素点的列之间的宽度得到印刷字宽度的方法为：

遍历每列的非零像素点个数，记录首次出现含有非零像素点的列，即非零像素点个数不为0的列的列号，将该列作为第一个目标列；

继续遍历，当遍历过程中遇到不含有非零像素点的列，即非零像素点个数为0的列时，重新记录下一个首次出现含有非零像素点的列的列号，即非零像素点个数不为0的列的列号，将该列作为第二个目标列；

当遍历完成时，可得到多个目标列；

获取相邻目标列的列号的差值，将相邻目标列号的差值作为相邻目标列之间的宽度，将所有相邻目标列之间的宽度的众数，作为印刷字的宽度。

所述根据每行文字区域的每列上的非零像素点的纵坐标和该行文字区域的纵向分布范围得到每列属于下划线的概率，并根据概率确定出下划线的方法为：

每列属于下划线的概率的计算方法为：

将每一列上每个像素点的纵坐标，减去当前行文字区域中像素点的最小纵坐标，得到的差值作为该列上每个像素点对应的第一差值；

将当前行文字区域中像素点的最大纵坐标和最小纵坐标的差值作为第二差值；

获取每个像素点对应的第一差值和第二差值的比值，并计算出所有像素点对应的第一差值和第二差值的比值的平均值；

将该平均值作为该列属于下划线的概率。

所述根据概率确定出下划线的方法为：

获取文字区域中的每一列属于下划线的概率的概率序列；

遍历概率序列，将连续的、概率值相同的概率归为一组，直到概率不相同时结束该组概率的划分；

将划分后的每一组概率，对应的连续的列作为一段疑似下划线，将连续列的长度作为该段疑似下划线的长度；

利用每一段疑似下划线的长度和一个印刷字的宽度将每一列属于下划线的概率修正为精准概率；

将精准概率大于概率阈值的列所属的一段疑似下划线作为下划线。

所述利用每一段疑似下划线的长度和一个印刷字的宽度将每一列属于下划线的概率修正为精准概率的方法为：

式中，

为第k列属于下划线的概率修正后得到的精准概率，

为第k列所属的疑似下划线段的长度，

为一个印刷字的宽度，

为第k列属于下划线的概率。

所述根据每行文字区域的纵向分布范围和下划线得到第一图像每行文字区域的初始答题区域的方法为：

将下划线的最小列号到最大列号所围成的矩形区域作为横向分布范围；

将上一行文字区域的最大纵坐标与当前行文字区域的最小纵坐标的均值，和当前行文字区域的最大纵坐标与下一行文字区域的最小纵坐标的均值，之间的区域作为纵向分布范围；

根据横向分布范围和纵向分布范围得到第一图像中每行文字区域的初始答题区域。

所述根据第一序列中非零像素点的最大列号、初始答题区域的最大列号得到答题内容横向超出概率的方法为：

构建临近程度函数；

获取第一序列中非零像素点的最大列号和初始答题区域的最大列号的比值；

将1减去该比值得到的差值作为自变量代入临近程度函数，求出的函数值作为答题内容横向超出概率。

所述根据第二序列中非零像素点的最小纵坐标和最大坐标值、每一行文字区域的纵向分布范围得到答题内容纵向超出概率，根据横向超出概率和纵向超出概率判断答题内容是否超出初始答题区域的具体方法为：

根据第二序列中非零像素点的最小纵坐标、上一行文字区域的最大纵坐标与本行文字区域的最小纵坐标的均值得到向上临近程度；

根据第二序列中非零像素点的最大纵坐标、本行文字区域的最大纵坐标与下一行文字区域的最小纵坐标的均值得到向下临近程度；

根据向上临近程度和向下临近程度得到纵向超出概率；

根据横向超出概率和纵向超出概率得到答题内容超出初始答题区域的概率；

若答题内容超出初始答题区域的概率大于概率阈值，则答题内容超出初始答题区域，否则，未超出。

所述对初始答题区域进行扩展，得到实际答题区域的方法为：

使用高斯模糊对答题区域内容进行多次模糊；

根据向上临近程度与向下临近程度的相对大小，确定纵向调整方向，即当向上临近程度大于向下临近程度时，向上扩展到上一行的最大纵坐标位置，否则向下扩展到下一行的最小纵坐标位置；

使用K3M算法对模糊后的初始答题区域进行骨架提取，得到初始答题区域中的文字的中轴像素点序列；

设置斜率阈值，计算中轴像素点序列之间的斜率，将相邻的中轴像素点的斜率差值小于斜率阈值的像素点划分为一组，将横向每次扩展一个印刷字宽度；

根据中轴像素点的最大列号与当前答题区域的最大列号计算横向超出概率，当横向超出概率小于超出概率阈值时，不再进行扩展；

停止扩展时，形成答题内容的中轴像素点序列的所有像素点即为实际答题区域。

本发明的有益效果是：

（1）获取未答题的试卷图像的二值图，根据每一行含有的非零像素点个数构成的第一序列中含有非零元素的连续行得到一行文字区域，根据每行文字区域的每列上的非零像素点个数构成的第二序列，根据第二序列得到印刷字宽度，根据每一行文字区域的每一列上的非零像素点的纵坐标和该行文字区域的纵向分布范围得到下划线，根据下划线和该行文字区域的纵向分布范围得到每行文字区域的初始答题区域；该方法充分考虑到下划线的特征，即下划线处于一行文字的最下方，且宽度一致，因此其在纵向上会表现为集中分布在整行的下方，且在横向上存在一定的连续性，而其他文字无法同时满足这两个特征，因此根据横向连续以及纵向集中的像素点的分布情况确定下划线及初始答题区域，避免汉字结构的干扰，提高了获取答题区域的准确性；

（2）对已答题的已答题试卷中的行列进行分析，得到初始答题区域中像素点的横向超出概率和纵向超出概率，根据概率判断答题内容是否超出答题范围，并根据答题的中行列像素点分布得到横向接近程度和纵向接近程度，根据横向接近程度和纵向接近程度对超出的范围进行调整，得到实际的答题区域，并根据实际的答题区域进行纠错；该方法实现了对实际答题区域的自适应性匹配，提高试卷纠错过程中的灵活性。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本发明的基于人工智能的试卷自动纠错方法流程示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明的基于人工智能的试卷自动纠错方法的实施例，如图1所示，包括：

步骤一：获取未答题的试卷图像的二值图，作为第一图像，获取第一图像中的下划线，根据下划线得到初始答题区域。

需要说明的是，整张试卷上存在多种题型，而本发明只针对填空题的答题内容进行判断，文中所述的下划线即为填空题的下划线，答题区域即为填空题对应的答题区域。

本发明所针对的主要场景为：使用相机采集待检测试卷图像，由于试卷同时存在手写字与印刷字，且受填空区域范围大小的限制，填空题的实际答题内容可能超出下划线区域范围的现象，需要根据填空题初始答题区域中的灰度变化情况确定实际答题内容，再将其与标准答案进行对比判断正误，从而实现试卷的自动纠错。

其中，获取未答题的试卷图像的二值图的方法为：

获取未答题的空白试卷图像，对其进行反向二值化，得到未答题的试卷图像的二值图，该图像中每一个像素值不为0的点均为一个印刷像素点，即非零像素点。

其中，获取第一图像中的下划线，根据下划线得到初始答题区域的方法为：

（1）获取第一图像中每行的非零像素点个数，将含有非零元素的连续行作为一行文字区域，具体方法如下：

统计试卷二值图像中每一行像素中包含的像素值非0点的个数，得到该试卷二值图像中像素值非0点的个数波动序列，该个数序列中的每个数据均为每一行的行号及该行像素值非0点的个数；

将该个数序列中连续分布的（行号之间的差值为1）且个数值不为0的行划分为一组，则每一组即为一行文字区域；

其中，第

行文字区域的纵向分布范围为

，

为第i行文字区域所有像素点纵坐标的最小值，

为第i行文字区域所有像素点纵坐标的最大值。

（2）获取每行文字区域的每列的非零像素点个数，根据含有非零像素点的列和不含非零像素点的列之间的宽度得到印刷字宽度，具体方法如下：

获取每一行文字区域中每一列上像素值非0的像素点的个数，由此得到每一列的非0像素点个数序列，该序列中的第

个数据为该行文字区域中第

列像素点中非0像素点的个数

；

例如：若序列为{3，5，0，7，8，0，0，2，0}，第1个元素3表示第1列像素点中有3个非零像素点，第2个元素5表示第2列像素点中有5个非零像素点，第3个元素0表示第3列像素点中不含有非零像素点，第4个元素7表示第4列像素点中有7个非零像素点，第5个元素8表示第5列像素点中有8个非零像素点，第6个元素0表示第6列像素点中不含有非零像素点，第7个元素0表示第7列像素点中不含有非零像素点，第8个元素2表示第8列像素点中有2个非零像素点，第9个元素0表示第9列像素点中不含有0个非零像素点；

其中，根据含有非零像素点的列和不含非零像素点的列之间的宽度得到印刷字宽度的方法为：

a.遍历该序列，记录该序列中首次出现含有非零像素点的列的列号，即非零像素点个数不为0的列，将该列作为第一个目标列；

例如，{3，5，0，7，8，0，0，2，0}中，首次出现含有非零的列为3对应的列，即第1列，记录列号1，目标列为1；

b.继续遍历，当遍历过程中遇到不含有非零像素点的列，即非零像素点个数为0的列时，重新记录下一个首次出现含有非零像素点的列，即非零像素点个数不为0的列，将该列作为第二个目标列；

例如，{3，5，0，7，8，0，0，2，0}中，在记录列号1之和继续遍历，遍历到第3列的0时，重新记录下一个首次出现含有非零像素的列，即7的所在列，记录列号4，目标列为4；继续遍历，到第6列的0时，重新记录下一个首次出现含有非零像素的列，为第8列的2，此时，记录列号8，目标列为8；

c.当遍历完第二序列时，可得到多个目标列；

例如，{3，5，0，7，8，0，0，2，0}经过（1）、（2）的方法步骤，记录到的目标列的列号依次为{1，4，8}；

d.获取相邻目标列的列号的差值，将相邻目标列号的差值作为相邻目标列之间的宽度，将所有相邻目标列之间的宽度的众数，作为一个印刷字的宽度。

例如，{1，4，8}中目标列号1和目标列号4相邻，二者之间的宽度为3；目标列号4和目标列号8相邻，二者之间的宽度为4；若存在目标列为{1，4，8，12}，则相邻目标列号的差值，即相邻目标列之间的宽度依次为3，4，4，因此选择宽度中的众数4，作为一个印刷字的宽度，用W表示。

(3)根据每行文字区域的每列上的非零像素点的纵坐标和该行文字区域的纵向分布范围得到每列属于下划线的概率，并根据概率确定出下划线，具体如下：

首先，根据每行文字区域的每列上的非零像素点的纵坐标和该行文字区域的纵向分布范围得到每列属于下划线的概率，方法如下：

a.将每一列上每个像素点的纵坐标，减去当前行文字区域中像素点的最小纵坐标，得到的差值作为该列上每个像素点对应的第一差值；

b.将当前行文字区域中像素点的最大纵坐标和最小纵坐标的差值作为第二差值；

c.获取每个像素点对应的第一差值和第二差值的比值，并计算出所有像素点对应的第一差值和第二差值的比值的平均值；

d.将该平均值作为该列属于下划线的概率：

式中，

为当前行即第i行文字区域中第

列属于下划线的概率，

为第

含有的像素点个数，

为第k列上第

个像素点，

为第k列上第

个像素点的纵坐标，

为第i行文字区域中像素点的最小纵坐标，

为第i行文字区域中像素点的最大纵坐标，

为该文字区域的纵向分布范围，

表示第

个像素点相对于整个文字区域的相对位置，越靠近文字区域的底部该值越大，对应该列属于下划线的概率越大；

其中，

为第一差值，

为第二差值，

为所有像素点对应的第一差值和第二差值的比值的平均值；

需要说明的是，由于下划线表现为直线，传统的对下划线的检测方法为霍夫直线检测，但是由于霍夫直线检测丢失了处于同一条直线上的像素点的位置信息，而印刷字是整齐排列的，由印刷字的同一行像素点也是呈直线分布的，因此印刷字像素点往往会干扰下划线的检测，考虑到下划线处于一行文字的最下方，且宽度一致，因此其在纵向上会表现为集中分布在整行的下方，且在横向上存在一定的连续性，而其他文字无法同时满足这两个特征，因此本发明根据各个像素点的横向连续性以及纵向集中性判断各个像素点属于下划线的概率。

然后，根据概率确定出下划线的方法为：

a.获取文字区域中的每一列属于下划线的概率的概率序列；

b.遍历概率序列，将连续的、概率值相同的概率归为一组，直到概率不相同时结束该组概率的划分；

c. 将划分后的每一组概率，对应的连续的列作为一段疑似下划线，将连续列的长度作为该段疑似下划线的长度，从而实现对该行文字区域中所有列的“分段”操作，并记录每段疑似下划线的最小列号与最大列号；

d.利用每一段疑似下划线的长度和一个印刷字的宽度将每一列属于下划线的概率修正为精准概率，具体方法为：

式中，

为第k列属于下划线的概率修正后得到的精准概率，

为第k列所属的疑似下划线段的长度，

为一个印刷字的宽度，

为第k列属于下划线的概率，公式中，其中

为连续长度相对于单个印刷字宽度的差异程度，由于填空题一般要填写多个字，划线区域也需要大于多个印刷字的宽度，因此当

远大于1时，该列像素属于下划线的概率较高；而当

小于等于1时，表示此时连续长度不足一个印刷字的宽度，则该列像素属于下划线的概率较低，由于连续长度越长，

的值越大，则该列像素属于下划线的概率越大，因此连续长度与下划线长度存在正相关关系，因此本发明使用

建立连续长度与下划线概率的正相关关系，x为自变量；

e.将精准概率大于概率阈值的列所属的一段疑似下划线作为下划线，具体为：设置概率阈值

，当第i行文字区域中第k列属于下划线的概率修正后得到的精准概率

时，认为第k列像素属于下划线，该列像素所属疑似下划线即为一段下划线。

需要说明的是，由于一些标点符号也会存在纵向聚集性，和下划线一样像素点聚集在纵向，如英文句号，但是标点符号与下划线的区别在于，下划线在横向上存在一定的连续性，因此本发明再次根据横向连续性对文字区域中各列像素属于下划线的概率进行修正。

（4）根据每行文字区域的纵向分布范围和下划线得到第一图像每行文字区域的初始答题区域的方法为：

a.横向分布范围为：该段下划线的最小列号

到最大列号

所围成的矩形区域；

b.纵向分布范围为：从上一行文字区域的最大纵坐标

与本行文字区域的最小纵坐标

的均值，到本行文字区域的最大纵坐标

与下一行文字区域的最小纵坐标

的均值之间的区域，即

之间的纵向分布范围，记录每一段下划线的列像素点的个数为

，该值也可以表示下划线的宽度；

c.将横向分布范围和纵向分布范围构成的区域作为该段下划线对应的初始答题区域，可按照本步骤的方法得到整张试卷上所有填空题的初始答题区域。

需要说明的是，考虑到一道填空题的划线位置并不是固定的，且可能存在多个划线区域，故需要判断每一行中是否存在划线区域，本发明首先根据印刷文字线性分布的特点，提取试卷上每一行文字区域，再对每一行文字区域进行划线像素点的判断，从而确定初始答题区域。

步骤二：获取已答题的试卷图像的二值图，作为第二图像；将第二图像中的初始答题区域中每一列非零像素点长度减去下划线宽度，剩余的非零像素点构成第一序列，并获取初始答题区域中每一行含有的非零像素点个数构成的第二序列；

该步骤是获取到已经答题的试卷图像进行初步处理，得到不含有下划线的行、列像素点。

其中，获取已答题的试卷图像的二值图的获取方法为：

（1）使用相机采集已答题试卷图像，根据试卷的长轴方向与纵轴方向对试卷进行校正，对图像进行反向二值化处理，得到已答题试卷二值图像；由于待检测试卷与空白试卷在图像采集时的摆放角度存在差异，因此在进行答题内容提取时，并不能直接将待检测的试卷图像与空白试卷图像进行模板匹配，即将两张图像直接相减，且由于采集时光照环境存在差异，直接相减后的图像会存在较多的噪声点，影响检测结果的准确性，因此先根据试卷的长轴方向与纵轴方向对试卷进行校正；

（2）根据各个初始答题区域的分布范围确定在当前待检测的二值图像中的位置；

以第

个初始答题区域为例进行分析：

当学生填写上答案后，初始答题区域中每一列上非0像素点的个数会增加，一般情况下，初始答题区域中存在两种类型：未答题以及答题完成，由于本发明需要根据非0像素点的分布情况确定答题内容之间存在一定的连续性；

因此，统计各个初始答题区域中每一列上非0像素点的个数，由于初始答题区域中包含下划线，使得整个初始答题区域上的每个位置均存在非0像素点；

为了避免下划线对答题内容检测的干扰，本发明首先将每一列上非0像素点的个数减去下划线宽度

，所得结果构成第一序列；同理，获取初始答题区域中每一行上的非0像素点的个数，得到第二序列。

步骤三：根据第一序列中非零像素点的最大列号、初始答题区域的最大列号得到答题内容横向超出概率；根据第二序列中非零像素点的最小纵坐标和最大坐标值、每一行文字区域的纵向分布范围得到答题内容纵向超出概率；根据横向超出概率和纵向超出概率判断答题内容是否超出初始答题区域；

该步骤的目的是，根据已经答题的答题区域中的像素点分布，判断学生的答题内容是否超出答题区域。

需要说明的是，考虑到答题区域长度不足时，学生一般会向上或向下沿着行与行之间的间隙继续填写，因此判断答题内容是否超出答题区域时，需要从横向超出概率与纵向超出概率两个方面综合判断，故根据第二序列中像素点的分布范围判断答题内容超出初始答题区域的概率。

其中，根据第一序列中非零像素点的最大列号、初始答题区域的最大列号得到答题内容横向超出概率的方法为：

（1）构建临近程度函数

：

公式中，

为自然常数，

为自变量；

（2）获取第一序列中非零像素点的最大列号

和初始答题区域的最大列号

的比值

；

（3）将1减去该比值得到的差值作为自变量代入临近程度函数，求出的函数值作为答题内容横向超出概率：

公式中，

为非0像素点的最大列号相对于整个初始答题区域的横向超出概率，答题内容越接近初始答题区域的最右侧，

的比值越接近于1，

越接近于0，对应

的值越大，此时横向超出概率越高，对应的横向超出概率越大。

其中，根据第二序列中非零像素点的最小纵坐标和最大坐标值、每一行文字区域的纵向分布范围得到答题内容纵向超出概率的具体方法为：

根据第二序列中非零像素点的最小纵坐标和最大坐标值、每一行文字区域的纵向分布范围得到答题内容纵向超出概率，方法为：

（1）根据第二序列中非零像素点的最小纵坐标

、上一行文字区域的最大纵坐标

与本行文字区域的最小纵坐标

的均值得到向上临近程度：

公式中，

为向上临近程度，该值越大说明答题内容越接近初始答题区域上方。

（2）根据第二序列中非零像素点的最大纵坐标

、本行文字区域的最大纵坐标

与下一行文字区域的最小纵坐标

的均值得到向下临近程度：

公式中，

为向下临近程度，该值越大说明答题内容越接近初始答题区域下方

（3）根据向上临近程度和向下临近程度得到纵向超出概率：

由于一般情况下，学生在沿着行与行之间的继续填写时，为了语言的连贯性，往往只会选择向上或向下中的一个方向，因此只需要选择向上临近程度与向下临近程度中的最大值作为纵向超出概率即可，即将

和

中的最大值作为纵向超出概率，纵向超出概率越高则纵向超出概率越高。

其中，根据横向超出概率和纵向超出概率判断答题内容是否超出初始答题区域的方法为：

（1）根据横向超出概率和纵向超出概率得到答题内容超出初始答题区域的概率：

公式中，

为第t个初始答题区域的答题内容超出初始答题区域的概率，

为选出

中的最大值，即纵向超出概率；

（2）若概率大于超出概率阈值，则答题内容超出初始答题区域，否则，未超出：

设置概率阈值为

，当

小于概率阈值时，认为该初始答题区域中不存在答题内容超出初始区域的现象，不对其进行调整；否则需要对初始答题区域进行调整，继续执行后续操作，得到最终的答题区域。

步骤四：对初始答题区域进行扩展，得到实际答题区域。

该步骤的目的是，对答题内容超出答题区域的情况进行适应性调整，得到实际的答题内容。

其中，对初始答题区域进行扩展，得到实际答题区域的具体方法为：

（1）使用高斯模糊对答题区域内容进行多次模糊，本发明中对答题区域的模糊次数设置为3次；

（2）根据向上临近程度与向下临近程度的相对大小，确定纵向调整方向，即当

时，向上扩展到上一行的最大纵坐标位置，否则向下扩展到下一行的最小纵坐标位置；

（3）使用K3M算法对模糊后的初始答题区域进行骨架提取，得到初始答题区域中的文字的中轴像素点序列；

（4）设置斜率阈值

，计算中轴像素点序列之间的斜率，将相邻的中轴像素点的斜率差值小于

的像素点划分为一组，将横向每次扩展一个印刷字宽度，重复操作（1）至（3）获取扩展后的答题区域中答题内容的中轴像素点序列；

根据中轴像素点的最大列号与当前答题区域的最大列号计算横向超出概率，当横向超出概率小于第一阈值时，不再进行扩展；由此得到最终答题区域，形成答题内容的中轴像素点序列的所有像素点即为实际答题内容。

步骤五：利用字符识别技术识别实际答题区域的内容，与标准答案进行对比，进行试卷纠错。

该步骤的目的是，将实际答题内容与对应的标准答案进行对比，判断正误。

使用光学字符识别技术对答题区域的实际答题内容进行识别，将识别的文本信息与数据库中的对应顺序的标准答案进行比对，从而判断文本内容是否准确，当认为答题内容不准确时，认为答题内容存在错误，否则认为答题正确。

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于人工智能的试卷自动纠错方法，其特征在于，该方法包括：

获取未答题的试卷图像的二值图，作为第一图像；

获取第一图像中的下划线，根据下划线得到初始答题区域；

获取已答题的试卷图像的二值图，作为第二图像；

2.根据权利要求1所述的基于人工智能的试卷自动纠错方法，其特征在于，所述获取第一图像中的下划线，根据下划线得到初始答题区域的方法为：

3.根据权利要求2所述的基于人工智能的试卷自动纠错方法，其特征在于，所述获取每行文字区域的每列的非零像素点个数，根据含有非零像素点的列和不含非零像素点的列之间的宽度得到印刷字宽度的方法为：

当遍历完成时，可得到多个目标列；

4.根据权利要求2所述的基于人工智能的试卷自动纠错方法，其特征在于，所述根据每行文字区域的每列上的非零像素点的纵坐标和该行文字区域的纵向分布范围得到每列属于下划线的概率，并根据概率确定出下划线的方法为：

每列属于下划线的概率的计算方法为：

将该平均值作为该列属于下划线的概率。

5.根据权利要求2所述的基于人工智能的试卷自动纠错方法，其特征在于，所述根据概率确定出下划线的方法为：

获取文字区域中的每一列属于下划线的概率的概率序列；

6.根据权利要求5所述的基于人工智能的试卷自动纠错方法，其特征在于，所述利用每一段疑似下划线的长度和一个印刷字的宽度将每一列属于下划线的概率修正为精准概率的方法为：

式中，p^’ _k为第k列属于下划线的概率修正后得到的精准概率，N_k为第k列所属的疑似下划线段的长度，W为一个印刷字的宽度，p_k为第k列属于下划线的概率。

7.根据权利要求1所述的基于人工智能的试卷自动纠错方法，其特征在于，所述根据每行文字区域的纵向分布范围和下划线得到第一图像每行文字区域的初始答题区域的方法为：

8.根据权利要求1所述的基于人工智能的试卷自动纠错方法，其特征在于，所述根据第一序列中非零像素点的最大列号、初始答题区域的最大列号得到答题内容横向超出概率的方法为：

构建临近程度函数；

9.根据权利要求1所述的基于人工智能的试卷自动纠错方法，其特征在于，所述根据第二序列中非零像素点的最小纵坐标和最大坐标值、每一行文字区域的纵向分布范围得到答题内容纵向超出概率，根据横向超出概率和纵向超出概率判断答题内容是否超出初始答题区域的具体方法为：

根据向上临近程度和向下临近程度得到纵向超出概率；

10.根据权利要求1所述的基于人工智能的试卷自动纠错方法，其特征在于，所述对初始答题区域进行扩展，得到实际答题区域的方法为：

使用高斯模糊对答题区域内容进行多次模糊；