CN112200058B

CN112200058B - 一种教辅资料智能批改的系统及方法

Info

Publication number: CN112200058B
Application number: CN202011064280.4A
Authority: CN
Inventors: 荆全齐; 李书兵; 陈家峰
Original assignee: Zhuhai Dulang Online Education Co ltd
Current assignee: Zhuhai Dulang Online Education Co ltd
Priority date: 2020-09-30
Filing date: 2020-09-30
Publication date: 2021-07-06
Anticipated expiration: 2040-09-30
Also published as: CN112200058A

Abstract

本发明公开了一种教辅资料智能批改的系统及方法，系统包括基础数据模块、拍摄模块、图像解析模块、区域分割识别模块、OCR批改模块、显示模块。本发明针对已经印刷好的教辅资料(可以是出版的教辅资料，也可以是教师已经完成录入、编辑并打印好的教辅资料)，提出一种智能批改的方案，不要求教辅资料上作任何标记，因此也不需要对教辅资料进行重新的编辑、打印，因此适应性强，不会增加额外的工作负担。利用本发明，老师布置教辅作业后，学生也可以提前实现批改，从而达到提前预习，及时备课的目的。另外，本发明可以实现教辅资料的智能批改，将极大地减少教师检查教辅作业的工作量，也可方便教师统计教辅作业完成情况。

Description

一种教辅资料智能批改的系统及方法

技术领域

本发明涉及图像处理技术领域，具体涉及一种教辅资料智能批改的系统及方法。

背景技术

考试和作业都是学习中必要的环节，目前针对考试有多种阅卷系统和方法来提升阅卷效率，而针对课后作业的智能批阅方法和系统则相对缺乏。

当前老师布置作业有多种形式，其中比较主流的包含有以下两种：

1.现有的出版好的“作业本”，这种是已经出版的书籍，其内容和作答区域已经固定。

2.老师用MS－Word等软件编辑作业纸，打印后分发给学生。这种排版是按照老师习惯的方式进行编辑的。

在这样的作业布置形式下，现有的批改方法具有如下缺点：

1)现有方案需要在纸上印刷特定的标记，这就要求老师重新编辑现有的题目，重新打印。而录入编辑是很复杂的工作，反而不利于提高老师的效率。

2)拍照识别划分区域不智能，需要手指点击分割题目或采用模糊匹配方法自动分割，模糊匹配方法识别度不高且可能搜到多题。

发明内容

针对现有技术的不足，本发明旨在提供一种教辅资料智能批改的系统及方法。

为了实现上述目的，本发明采用如下技术方案：

一种教辅资料智能批改的系统，包括基础数据模块、拍摄模块、图像解析模块、区域分割识别模块、OCR批改模块、显示模块；

所述基础数据模块用于存储教辅资料的基础数据，包括教辅资料的页宽Wbook、页高Hbook、题目数据、各个题目对应的答案数据及解析数据，以及每个题目所在页的页码及其在所在页的题目区域坐标数据和答题区域坐标数据；

所述拍摄模块用于对需要批改的教辅资料的页面进行图像拍摄；

所述图像解析模块用于对拍摄模块拍摄得到的原图进行解析处理，检测出页面的边缘图像；

区域分割识别模块用于根据图像解析模块得到的页面的边缘图像，识别和分割出原图的批改区；具体过程为：

①通过边缘提取算法获得图像解析模块最终得到的边缘图像的轮廓数组，并按照最小面积及周长剔除干扰；

②当页面为正面时，按照页面右上角和右下角点的特征，即可锁定页面的右上角坐标(Brtx，Brty)以及右下角坐标(Brbx，Brby)，同时根据边缘图像提取的页面的上边缘线和下边缘线，获取上边缘线和下边缘线的相对于水平线的斜率K；

当页面为反面时，按照页面左上角和左上角点的特征，即可锁定页面的左上角坐标(Bltx，Blty)以及左下角坐标(Blbx，Blby)，同时根据边缘图像提取的页面的上边缘线和下边缘线，获取上边缘线和下边缘线的相对于水平线的斜率K；

③当页面为正面时，根据②获取的右上角坐标、右下角坐标以及斜率K获得页面的左上角坐标(Bltx，Blty)及左下角坐标 (Blbx，Blby)；具体通过下式(1)－(8)获取：

Ratio＝Wbook/Hbook (1)；

Wtop＝Wbottom＝Ratio*Hright (3)；

θ＝arctan k (4)；

Bltx＝Brtx-Wtop*cosθ (5)；

Blty＝Brty+Wtop*sinθ (6)；

Blbx＝Brbx-Wbottom*cosθ (7)；

Blby＝Brby+Wbottom*sinθ (8)；

其中，Ratio为页面的宽高比，Hright为原图中页面右边缘的高度，Wtop为原图中页面的上边缘的宽度，Wbottom为原图中页面的下边缘的宽度，θ为原图中页面的上边缘或下边缘与水平线的夹角；

当页面为反面时，根据②获取的左上角坐标、左下角坐标以及斜率K获得页面的右上角坐标(Brtx，Brty)及右下角坐标(Brbx，Brby)；具体通过下式(9)－(16)获取：

Ratio＝Wbook/Hbook (9)；

Wtop＝Wbottom＝Ratio*Hleft (11)；

θ＝arctan k (12)；

Brtx＝Bltx+Wtop*cosθ (13)；

Brty＝Blty-Wtop*sinθ (14)；

Brbx＝Blbx+Wbottom*cosθ (15)；

Brby＝Blby-Wbottom*sinθ (16)；

④通过③计算出来的页面在原图中的左上角、左下角、右上角和右下角四个角点的坐标，即可获取到对应四个角点的最小外接矩形，利用该最小外接矩形对原图进行仿射变换，将原图矫正，并将原图中矫正后的四个角点的矩形区域截取出来，记为矩形批改区；

OCR批改模块用于根据区域分割识别模块得到的矩形批改区的宽和高、基础数据模块中存储的页宽和页高，计算得到矩形批改区的宽高比和基于基础数据模块的宽高比，并计算得到矩形批改区的宽高比和基于基础数据模块的宽高比的比值关系；根据所述比值关系，对基础数据模块中存储的对应页的题目区域坐标数据和答题区域坐标数据进行换算，计算得到矩形批改区中的题目区域坐标数据和答题区域坐标数据，然后据此准确分割页面的题目区域和答题区域并进行OCR 识别，得到矩形批改区中的题目数据及对应的答题数据；根据基础数据模块中存储的对应的题目数据及答案数据，对识别到的答题数据进行对比，完成智能批改；

所述显示模块用于将智能批改后的结果以及基础数据模块中存储的相应解析数据，展示给用户查阅。

进一步地，上述系统中，还包括有纯黑色背景底板，用于进行图像拍摄时，将需要批改的教辅资料放置在纯黑色背景底板上，为拍摄提供纯黑色背景。

进一步地，上述系统中，还包括有纠偏模块，所述纠偏模块用于将识别错误的题目反馈至教师端或后台，教师端或后台验证后进行纠偏反馈。

进一步地，上述系统中，当题目是一个包含多个小题的大题时，该题目的题目区域坐标数据和答题区域坐标数据包括大题的题目区域坐标数据、大题下的各个小题的题目区域坐标数据以及各个小题的答题区域坐标数据。

进一步地，上述系统中，题目区域坐标数据包括题目区域的左上角坐标点和右下角坐标点，答题区域坐标数据包括答题区域的左上角坐标点和右下角坐标点，题目区域和答题区域均为由对应的左上角坐标点和右下角坐标点围成的矩形区域。

进一步地，上述系统中，图像解析模块对图像解析处理的具体过程如下：

1)保存原图，并复制一份原图Pcopy进行图像处理；

2)对Pcopy进行灰度处理后，使用自适应阈值法对图像进行二值化；

3)对2)中所获得的图像依次进行膨胀、腐蚀、膨胀三次操作，将图像中的题目内容和答题内容及其他噪点去除掉，只留下页面的边缘线条；

4)对3)中所获得的图像通过canny算法对图像进行边缘检测，检测出页面的边缘图像以供所述区域分割识别模块进行边缘提取。

本发明还提供一种利用上述系统的方法，包括如下步骤：

S1、完成教辅资料上的题目的答题后，将拍摄模块对准需要批改的页面并进行拍摄；

S2、图像解析模块对拍摄模块拍摄得到的原图进行解析处理，检测出页面的边缘图像；

S3、区域分割识别模块用于根据图像解析模块得到的页面的边缘图像，识别和分割出原图的批改区；具体过程为：

S3.1、通过边缘提取算法获得图像解析模块最终得到的边缘图像的轮廓数组，并按照最小面积及周长剔除干扰；

S3.2、当页面为正面时，按照页面右上角和右下角点的特征，即可锁定页面的右上角坐标(Brtx，Brty)以及右下角坐标(Brbx，Brby)，同时根据边缘图像提取的页面的上边缘线和下边缘线，获取上边缘线和下边缘线的斜率K；

当页面为反面时，按照页面左上角和左上角点的特征，即可锁定页面的左上角坐标(Bltx，Blty)以及左下角坐标(Blbx，Blby)，同时根据边缘图像提取的页面的上边缘线和下边缘线，获取上边缘线和下边缘线的斜率K；

S3.3、当页面为正面时，根据步骤S3.2获取的右上角坐标、右下角坐标以及斜率K获得页面的左上角坐标(Bltx，Blty)及左下角坐标(Blbx，Blby)；具体通过下式(1)－(8)获取：

Ratio＝Wbook/Hbook (1)；

Wtop＝Wbottom＝Ratio*Hright (3)；

θ＝arctan k (4)；

Bltx＝Brtx-Wtop*cosθ (5)；

Blty＝Brty+Wtop*sinθ (6)；

Blbx＝Brbx-Wbottom*cosθ (7)；

Blby＝Brby+Wbottom*sinθ (8)；

当页面为反面时，根据步骤S3.2获取的左上角坐标、左下角坐标以及斜率K获得页面的右上角坐标(Brtx，Brty)及右下角坐标 (Brbx，Brby)；具体通过下式(9)－(16)获取：

Ratio＝Wbook/Hbook (9)；

Wtop＝Wbottom＝Ratio*Hleft (11)；

θ＝arctan k (12)；

Brtx＝Bltx+Wtop*cosθ (13)；

Brty＝Blty-Wtop*sinθ (14)；

Brbx＝Blbx+Wbottom*cosθ (15)；

Brby＝Blby-Wbottom*sinθ (16)；

S3.4、通过步骤S3.3计算出来的页面在原图中的左上角、左下角、右上角和右下角四个角点的坐标，即可获取到对应四个角点的最小外接矩形，利用该最小外接矩形对原图进行仿射变换，将原图矫正，并将原图中矫正后的四个角点的矩形区域截取出来，记为矩形批改区；

S4、OCR批改模块根据区域分割识别模块得到的矩形批改区的宽和高、基础数据模块中存储的页宽和页高，计算得到矩形批改区的宽高比和基于基础数据模块的宽高比，并计算得到矩形批改区的宽高比和基于基础数据模块的宽高比的比值关系；根据所述比值关系，对基础数据模块中存储的对应页的题目区域坐标数据和答题区域坐标数据进行换算，计算得到矩形批改区中的题目区域坐标数据和答题区域坐标数据，然后据此准确分割页面的题目区域和答题区域并进行OCR 识别，得到矩形批改区中的题目数据及对应的答题数据；根据基础数据模块中存储的对应的题目数据及答案数据，对识别到的答题数据进行对比，完成智能批改；

S5、所述显示模块将智能批改后的结果以及基础数据模块中存储的相应解析数据，展示给用户查阅。

进一步地，上述方法中，步骤S1中，拍摄时按照显示模块上显示的照片限定边框的引导，将需要拍摄的页面内容限定在所述照片限定边框内。

进一步地，上述方法中，当发生有识别错误的情况时，用户利用纠偏模块将识别错误的题目反馈至教师端或后台，教师端或后台验证后进行纠偏反馈。

进一步地，上述方法中，步骤S2的具体过程为：

S2.1、保存原图，并复制一份原图Pcopy进行图像处理；

S2.2、对Pcopy进行灰度处理后，使用自适应阈值法对图像进行二值化；

S2.3、对步骤S2.2中所获得的图像依次进行膨胀、腐蚀、膨胀三次操作，将图像中的题目内容和答题内容及其他噪点去除掉，只留下页面的边缘线条；

S2.4、对步骤S2.3中所获得的图像通过canny算法对图像进行边缘检测，检测出页面的边缘图像以供所述区域分割识别模块进行边缘提取。

本发明的有益效果在于：

1、本发明针对已经印刷好的教辅资料(可以是出版的教辅资料，也可以是教师已经完成录入、编辑并打印好的教辅资料)，提出一种智能批改方案，不要求教辅资料上作任何标记，因此也不需要对教辅资料进行重新的编辑、打印，因此适应性强，不会增加额外的工作负担。

2、利用本发明，老师布置教辅作业后，学生也可以提前实现批改，从而达到提前预习，及时备课的目的。

3、本发明可以实现教辅资料的智能批改，将极大地减少教师检查教辅作业的工作量，也可方便教师统计教辅作业完成情况。

具体实施方式

以下将对本发明作进一步的描述，需要说明的是，本实施例以本技术方案为前提，给出了详细的实施方式和具体的操作过程，但本发明的保护范围并不限于本实施例。

实施例1

一种教辅资料智能批改的系统，包括基础数据模块、拍摄模块、图像解析模块、区域分割识别模块、OCR批改模块、显示模块、纠偏模块、纯黑色背景底板；

其中，当题目是一个包含多个小题的大题时，该题目的题目区域坐标数据和答题区域坐标数据包括大题的题目区域坐标数据、大题下的各个小题的题目区域坐标数据以及各个小题的答题区域坐标数据。

题目区域坐标数据包括题目区域的左上角坐标点和右下角坐标点，答题区域坐标数据包括答题区域的左上角坐标点和右下角坐标点，题目区域和答题区域均为由对应的左上角坐标点和右下角坐标点围成的矩形区域。

需要说明的是，一般教辅资料每一页均包括正面和反面，正面和反面的坐标相对值不同，正面需要以右上角作为坐标参考原点，反面需要以左上角作为坐标的参考原点。

所述拍摄模块用于对需要批改的教辅资料的页面进行图像拍摄；拍摄时，显示模块上显示有照片限定边框，用于引导用户将需要拍摄的页面内容限定在所述照片限定边框内；显示模块可以采用触控屏。

进行图像拍摄时，将需要批改的教辅资料放置在纯黑色背景底板上，为拍摄提供纯黑色背景；

所述图像解析模块用于对拍摄模块拍摄得到的原图进行解析处理，检测出页面的边缘图像；具体过程如下：

1)保存原图，并复制一份原图Pcopy进行图像处理；

4)对3)中所获得的图像通过canny算法对图像进行边缘检测，检测出页面的边缘图像以供所述区域分割识别模块进行边缘提取；

Ratio＝Wbook/Hbook (1)；

Wtop＝Wbottom＝Ratio*Hright (3)；

θ＝arctan k (4)；

Bltx＝Brtx-Wtop*cosθ (5)；

Blty＝Brty+Wtop*sinθ (6)；

Blbx＝Brbx-Wbottom*cosθ (7)；

Blby＝Brby+Wbottom*sinθ (8)；

其中，Ratio为页面的宽高比，Hright为原图中页面右边缘的高度，Wtop为原图中页面的上边缘的宽度，Wbottom为原图中页面的下边缘的宽度，θ为原图中页面的上边缘或下边缘与水平线的夹角。

Ratio＝Wbook/Hbook (9)；

Wtop＝Wbottom＝Ratio*Hleft (11)；

θ＝arctan k (12)；

Brtx＝Bltx+Wtop*cosθ (13)；

Brty＝Blty-Wtop*sinθ (14)；

Brbx＝Blbx+Wbottom*cosθ (15)；

Brby＝Blby-Wbottom*sinθ (16)。

所述系统还包括有纠偏模块，所述纠偏模块用于将识别错误的题目反馈至教师端或后台，教师端或后台验证后进行纠偏反馈。

需要说明的是，所述教辅资料智能批改的系统可以集成在一个电子设备上实现，例如手机、平板电脑等。

实施例2

本实施例提供一种利用实施例1所述系统的方法，包括如下步骤：

S1、完成教辅资料上的题目的答题后，将教辅资料放在纯黑色背景底板上，将拍摄模块对准需要批改的页面并进行拍摄；拍摄时按照显示模块上显示的照片限定边框的引导，将需要拍摄的页面内容限定在所述照片限定边框内；

S2、图像解析模块对拍摄模块拍摄得到的原图进行解析处理，检测出页面的边缘图像：

S2.1、保存原图，并复制一份原图Pcopy进行图像处理；

S2.4、对步骤S2.3中所获得的图像通过canny算法对图像进行边缘检测，检测出页面的边缘图像以供所述区域分割识别模块进行边缘提取；

S3.2、当页面为正面时，按照页面右上角和右下角点的特征，即可锁定页面的右上角坐标(Brtx，Brty)以及右下角坐标(Brbx，Brby)，同时根据边缘图像提取的页面的上边缘线和下边缘线，获取上边缘线和下边缘线的相对于水平线的斜率K；

Ratio＝Wbook/Hbook (1)；

Wtop＝Wbottom＝Ratio*Hright (3)；

θ＝arctan k (4)；

Bltx＝Brtx-Wtop*cosθ (5)；

Blty＝Brty+Wtop*sinθ (6)；

Blbx＝Brbx-Wbottom*cosθ (7)；

Blby＝Brby+Wbottom*sinθ (8)；

Ratio＝Wbook/Hbook (9)；

Wtop＝Wbottom＝Ratio*Hleft (11)；

θ＝arctan k (12)；

Brtx＝Bltx+Wtop*cosθ (13)；

Brty＝Blty-Wtop*sinθ (14)；

Brbx＝Blbx+Wbottom*cosθ (15)；

Brby＝Blby-Wbottom*sinθ (16)。

④通过③计算出来的页面在原图中的左上角、左下角、右上角和右下角四个角点的坐标，即可获取到对应四个角点的最小外接矩形，利用该最小外接矩形对原图(步骤S2.1中保存)进行仿射变换，将原图矫正，并将原图中矫正后的四个角点的矩形区域截取出来，记为矩形批改区；

上述方法中，当发生有识别错误的情况时，用户利用纠偏模块将识别错误的题目反馈至教师端或后台，教师端或后台验证后进行纠偏反馈。

上述方法中，页面的页码以及页面为正面或反面，可以在用户拍摄图像后手动输入。

对于本领域的技术人员来说，可以根据以上的技术方案和构思，给出各种相应的改变和变形，而所有的这些改变和变形，都应该包括在本发明权利要求的保护范围之内。

Claims

1.一种教辅资料智能批改的系统，其特征在于，包括基础数据模块、拍摄模块、图像解析模块、区域分割识别模块、OCR批改模块、显示模块；

③当页面为正面时，根据②获取的右上角坐标、右下角坐标以及斜率K获得页面的左上角坐标(Bltx，Blty)及左下角坐标(Blbx，Blby)；具体通过下式(1)－(8)获取：

Ratio＝Wbook/Hbook (1)；

Wtop＝Wbottom＝Ratio*Hright (3)；

θ＝arctank (4)；

Bltx＝Brtx-Wtop*cosθ (5)；

Blty＝Brty+Wtop*sinθ (6)；

Blbx＝Brbx-Wbottom*cosθ (7)；

Blby＝Brby+Wbottom*sinθ (8)；

Ratio＝Wbook/Hbook (9)；

Wtop＝Wbottom＝Ratio*Hleft (11)；

θ＝arctank (12)；

Brtx＝Bltx+Wtop*cosθ (13)；

Brty＝Blty-Wtop*sinθ (14)；

Brbx＝Blbx+Wbottom*cosθ (15)；

Brby＝Blby-Wbottom*sinθ (16)；

OCR批改模块用于根据区域分割识别模块得到的矩形批改区的宽和高、基础数据模块中存储的页宽和页高，计算得到矩形批改区的宽高比和基于基础数据模块的宽高比，并计算得到矩形批改区的宽高比和基于基础数据模块的宽高比的比值关系；根据所述比值关系，对基础数据模块中存储的对应页的题目区域坐标数据和答题区域坐标数据进行换算，计算得到矩形批改区中的题目区域坐标数据和答题区域坐标数据，然后据此准确分割页面的题目区域和答题区域并进行OCR识别，得到矩形批改区中的题目数据及对应的答题数据；根据基础数据模块中存储的对应的题目数据及答案数据，对识别到的答题数据进行对比，完成智能批改；

2.根据权利要求1所述的系统，其特征在于，还包括有纯黑色背景底板，用于进行图像拍摄时，将需要批改的教辅资料放置在纯黑色背景底板上，为拍摄提供纯黑色背景。

3.根据权利要求1所述的系统，其特征在于，还包括有纠偏模块，所述纠偏模块用于将识别错误的题目反馈至教师端或后台，教师端或后台验证后进行纠偏反馈。

4.根据权利要求1所述的系统，其特征在于，当题目是一个包含多个小题的大题时，该题目的题目区域坐标数据和答题区域坐标数据包括大题的题目区域坐标数据、大题下的各个小题的题目区域坐标数据以及各个小题的答题区域坐标数据。

5.根据权利要求1所述的系统，其特征在于，题目区域坐标数据包括题目区域的左上角坐标点和右下角坐标点，答题区域坐标数据包括答题区域的左上角坐标点和右下角坐标点，题目区域和答题区域均为由对应的左上角坐标点和右下角坐标点围成的矩形区域。

6.根据权利要求1所述的系统，其特征在于，图像解析模块对图像进行解析处理的过程为：

1)保存原图，并复制一份原图Pcopy进行图像处理；

7.一种利用上述任一权利要求所述系统的方法，其特征在于，包括如下步骤：

Ratio＝Wbook/Hbook (1)；

Wtop＝Wbottom＝Ratio*Hright (3)；

θ＝arctank (4)；

Bltx＝Brtx-Wtop*cosθ (5)；

Blty＝Brty+Wtop*sinθ (6)；

Blbx＝Brbx-Wbottom*cosθ (7)；

Blby＝Brby+Wbottom*sinθ (8)；

当页面为反面时，根据步骤S3.2获取的左上角坐标、左下角坐标以及斜率K获得页面的右上角坐标(Brtx，Brty)及右下角坐标(Brbx，Brby)；具体通过下式(9)－(16)获取：

Ratio＝Wbook/Hbook (9)；

Wtop＝Wbottom＝Ratio*Hleft (11)；

θ＝arctank (12)；

Brtx＝Bltx+Wtop*cosθ (13)；

Brty＝Blty-Wtop*sinθ (14)；

Brbx＝Blbx+Wbottom*cosθ (15)；

Brby＝Blby-Wbottom*sinθ (16)；

S4、OCR批改模块根据区域分割识别模块得到的矩形批改区的宽和高、基础数据模块中存储的页宽和页高，计算得到矩形批改区的宽高比和基于基础数据模块的宽高比，并计算得到矩形批改区的宽高比和基于基础数据模块的宽高比的比值关系；根据所述比值关系，对基础数据模块中存储的对应页的题目区域坐标数据和答题区域坐标数据进行换算，计算得到矩形批改区中的题目区域坐标数据和答题区域坐标数据，然后据此准确分割页面的题目区域和答题区域并进行OCR识别，得到矩形批改区中的题目数据及对应的答题数据；根据基础数据模块中存储的对应的题目数据及答案数据，对识别到的答题数据进行对比，完成智能批改；

8.根据权利要求7所述的方法，其特征在于，步骤S1中，拍摄时按照显示模块上显示的照片限定边框的引导，将需要拍摄的页面内容限定在所述照片限定边框内。

9.根据权利要求7所述的方法，其特征在于，当发生有识别错误的情况时，用户利用纠偏模块将识别错误的题目反馈至教师端或后台，教师端或后台验证后进行纠偏反馈。

10.根据权利要求7所述的方法，其特征在于，步骤S2的具体过程为：

S2.1、保存原图，并复制一份原图Pcopy进行图像处理；