CN112200058B - 一种教辅资料智能批改的系统及方法 - Google Patents

一种教辅资料智能批改的系统及方法 Download PDF

Info

Publication number
CN112200058B
CN112200058B CN202011064280.4A CN202011064280A CN112200058B CN 112200058 B CN112200058 B CN 112200058B CN 202011064280 A CN202011064280 A CN 202011064280A CN 112200058 B CN112200058 B CN 112200058B
Authority
CN
China
Prior art keywords
page
module
image
edge
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011064280.4A
Other languages
English (en)
Other versions
CN112200058A (zh
Inventor
荆全齐
李书兵
陈家峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhuhai Dulang Online Education Co ltd
Original Assignee
Zhuhai Dulang Online Education Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhuhai Dulang Online Education Co ltd filed Critical Zhuhai Dulang Online Education Co ltd
Priority to CN202011064280.4A priority Critical patent/CN112200058B/zh
Publication of CN112200058A publication Critical patent/CN112200058A/zh
Application granted granted Critical
Publication of CN112200058B publication Critical patent/CN112200058B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/13Edge detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B7/00Electrically-operated teaching apparatus or devices working with questions and answers
    • G09B7/02Electrically-operated teaching apparatus or devices working with questions and answers of the type wherein the student is expected to construct an answer to the question which is presented or wherein the machine gives an answer to the question presented by a student
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Business, Economics & Management (AREA)
  • Educational Administration (AREA)
  • Educational Technology (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本发明公开了一种教辅资料智能批改的系统及方法,系统包括基础数据模块、拍摄模块、图像解析模块、区域分割识别模块、OCR批改模块、显示模块。本发明针对已经印刷好的教辅资料(可以是出版的教辅资料,也可以是教师已经完成录入、编辑并打印好的教辅资料),提出一种智能批改的方案,不要求教辅资料上作任何标记,因此也不需要对教辅资料进行重新的编辑、打印,因此适应性强,不会增加额外的工作负担。利用本发明,老师布置教辅作业后,学生也可以提前实现批改,从而达到提前预习,及时备课的目的。另外,本发明可以实现教辅资料的智能批改,将极大地减少教师检查教辅作业的工作量,也可方便教师统计教辅作业完成情况。

Description

一种教辅资料智能批改的系统及方法
技术领域
本发明涉及图像处理技术领域,具体涉及一种教辅资料智能批改的系统及方法。
背景技术
考试和作业都是学习中必要的环节,目前针对考试有多种阅卷系统和方法来提升阅卷效率,而针对课后作业的智能批阅方法和系统则相对缺乏。
当前老师布置作业有多种形式,其中比较主流的包含有以下两种:
1.现有的出版好的“作业本”,这种是已经出版的书籍,其内容和作答区域已经固定。
2.老师用MS-Word等软件编辑作业纸,打印后分发给学生。这种排版是按照老师习惯的方式进行编辑的。
在这样的作业布置形式下,现有的批改方法具有如下缺点:
1)现有方案需要在纸上印刷特定的标记,这就要求老师重新编辑现有的题目,重新打印。而录入编辑是很复杂的工作,反而不利于提高老师的效率。
2)拍照识别划分区域不智能,需要手指点击分割题目或采用模糊匹配方法自动分割,模糊匹配方法识别度不高且可能搜到多题。
发明内容
针对现有技术的不足,本发明旨在提供一种教辅资料智能批改的系统及方法。
为了实现上述目的,本发明采用如下技术方案:
一种教辅资料智能批改的系统,包括基础数据模块、拍摄模块、图像解析模块、区域分割识别模块、OCR批改模块、显示模块;
所述基础数据模块用于存储教辅资料的基础数据,包括教辅资料的页宽Wbook、页高Hbook、题目数据、各个题目对应的答案数据及解析数据,以及每个题目所在页的页码及其在所在页的题目区域坐标数据和答题区域坐标数据;
所述拍摄模块用于对需要批改的教辅资料的页面进行图像拍摄;
所述图像解析模块用于对拍摄模块拍摄得到的原图进行解析处理,检测出页面的边缘图像;
区域分割识别模块用于根据图像解析模块得到的页面的边缘图像,识别和分割出原图的批改区;具体过程为:
①通过边缘提取算法获得图像解析模块最终得到的边缘图像的轮廓数组,并按照最小面积及周长剔除干扰;
②当页面为正面时,按照页面右上角和右下角点的特征,即可锁定页面的右上角坐标(Brtx,Brty)以及右下角坐标(Brbx,Brby),同时根据边缘图像提取的页面的上边缘线和下边缘线,获取上边缘线和下边缘线的相对于水平线的斜率K;
当页面为反面时,按照页面左上角和左上角点的特征,即可锁定页面的左上角坐标(Bltx,Blty)以及左下角坐标(Blbx,Blby),同时根据边缘图像提取的页面的上边缘线和下边缘线,获取上边缘线和下边缘线的相对于水平线的斜率K;
③当页面为正面时,根据②获取的右上角坐标、右下角坐标以及斜率K获得页面的左上角坐标(Bltx,Blty)及左下角坐标 (Blbx,Blby);具体通过下式(1)-(8)获取:
Ratio=Wbook/Hbook (1);
Figure BDA0002713296530000031
Wtop=Wbottom=Ratio*Hright (3);
θ=arctan k (4);
Bltx=Brtx-Wtop*cosθ (5);
Blty=Brty+Wtop*sinθ (6);
Blbx=Brbx-Wbottom*cosθ (7);
Blby=Brby+Wbottom*sinθ (8);
其中,Ratio为页面的宽高比,Hright为原图中页面右边缘的高度,Wtop为原图中页面的上边缘的宽度,Wbottom为原图中页面的下边缘的宽度,θ为原图中页面的上边缘或下边缘与水平线的夹角;
当页面为反面时,根据②获取的左上角坐标、左下角坐标以及斜率K获得页面的右上角坐标(Brtx,Brty)及右下角坐标(Brbx,Brby);具体通过下式(9)-(16)获取:
Ratio=Wbook/Hbook (9);
Figure BDA0002713296530000032
Wtop=Wbottom=Ratio*Hleft (11);
θ=arctan k (12);
Brtx=Bltx+Wtop*cosθ (13);
Brty=Blty-Wtop*sinθ (14);
Brbx=Blbx+Wbottom*cosθ (15);
Brby=Blby-Wbottom*sinθ (16);
④通过③计算出来的页面在原图中的左上角、左下角、右上角和右下角四个角点的坐标,即可获取到对应四个角点的最小外接矩形,利用该最小外接矩形对原图进行仿射变换,将原图矫正,并将原图中矫正后的四个角点的矩形区域截取出来,记为矩形批改区;
OCR批改模块用于根据区域分割识别模块得到的矩形批改区的宽和高、基础数据模块中存储的页宽和页高,计算得到矩形批改区的宽高比和基于基础数据模块的宽高比,并计算得到矩形批改区的宽高比和基于基础数据模块的宽高比的比值关系;根据所述比值关系,对基础数据模块中存储的对应页的题目区域坐标数据和答题区域坐标数据进行换算,计算得到矩形批改区中的题目区域坐标数据和答题区域坐标数据,然后据此准确分割页面的题目区域和答题区域并进行OCR 识别,得到矩形批改区中的题目数据及对应的答题数据;根据基础数据模块中存储的对应的题目数据及答案数据,对识别到的答题数据进行对比,完成智能批改;
所述显示模块用于将智能批改后的结果以及基础数据模块中存储的相应解析数据,展示给用户查阅。
进一步地,上述系统中,还包括有纯黑色背景底板,用于进行图像拍摄时,将需要批改的教辅资料放置在纯黑色背景底板上,为拍摄提供纯黑色背景。
进一步地,上述系统中,还包括有纠偏模块,所述纠偏模块用于将识别错误的题目反馈至教师端或后台,教师端或后台验证后进行纠偏反馈。
进一步地,上述系统中,当题目是一个包含多个小题的大题时,该题目的题目区域坐标数据和答题区域坐标数据包括大题的题目区域坐标数据、大题下的各个小题的题目区域坐标数据以及各个小题的答题区域坐标数据。
进一步地,上述系统中,题目区域坐标数据包括题目区域的左上角坐标点和右下角坐标点,答题区域坐标数据包括答题区域的左上角坐标点和右下角坐标点,题目区域和答题区域均为由对应的左上角坐标点和右下角坐标点围成的矩形区域。
进一步地,上述系统中,图像解析模块对图像解析处理的具体过程如下:
1)保存原图,并复制一份原图Pcopy进行图像处理;
2)对Pcopy进行灰度处理后,使用自适应阈值法对图像进行二值化;
3)对2)中所获得的图像依次进行膨胀、腐蚀、膨胀三次操作,将图像中的题目内容和答题内容及其他噪点去除掉,只留下页面的边缘线条;
4)对3)中所获得的图像通过canny算法对图像进行边缘检测,检测出页面的边缘图像以供所述区域分割识别模块进行边缘提取。
本发明还提供一种利用上述系统的方法,包括如下步骤:
S1、完成教辅资料上的题目的答题后,将拍摄模块对准需要批改的页面并进行拍摄;
S2、图像解析模块对拍摄模块拍摄得到的原图进行解析处理,检测出页面的边缘图像;
S3、区域分割识别模块用于根据图像解析模块得到的页面的边缘图像,识别和分割出原图的批改区;具体过程为:
S3.1、通过边缘提取算法获得图像解析模块最终得到的边缘图像的轮廓数组,并按照最小面积及周长剔除干扰;
S3.2、当页面为正面时,按照页面右上角和右下角点的特征,即可锁定页面的右上角坐标(Brtx,Brty)以及右下角坐标(Brbx,Brby),同时根据边缘图像提取的页面的上边缘线和下边缘线,获取上边缘线和下边缘线的斜率K;
当页面为反面时,按照页面左上角和左上角点的特征,即可锁定页面的左上角坐标(Bltx,Blty)以及左下角坐标(Blbx,Blby),同时根据边缘图像提取的页面的上边缘线和下边缘线,获取上边缘线和下边缘线的斜率K;
S3.3、当页面为正面时,根据步骤S3.2获取的右上角坐标、右下角坐标以及斜率K获得页面的左上角坐标(Bltx,Blty)及左下角坐标(Blbx,Blby);具体通过下式(1)-(8)获取:
Ratio=Wbook/Hbook (1);
Figure BDA0002713296530000071
Wtop=Wbottom=Ratio*Hright (3);
θ=arctan k (4);
Bltx=Brtx-Wtop*cosθ (5);
Blty=Brty+Wtop*sinθ (6);
Blbx=Brbx-Wbottom*cosθ (7);
Blby=Brby+Wbottom*sinθ (8);
其中,Ratio为页面的宽高比,Hright为原图中页面右边缘的高度,Wtop为原图中页面的上边缘的宽度,Wbottom为原图中页面的下边缘的宽度,θ为原图中页面的上边缘或下边缘与水平线的夹角;
当页面为反面时,根据步骤S3.2获取的左上角坐标、左下角坐标以及斜率K获得页面的右上角坐标(Brtx,Brty)及右下角坐标 (Brbx,Brby);具体通过下式(9)-(16)获取:
Ratio=Wbook/Hbook (9);
Figure BDA0002713296530000072
Wtop=Wbottom=Ratio*Hleft (11);
θ=arctan k (12);
Brtx=Bltx+Wtop*cosθ (13);
Brty=Blty-Wtop*sinθ (14);
Brbx=Blbx+Wbottom*cosθ (15);
Brby=Blby-Wbottom*sinθ (16);
S3.4、通过步骤S3.3计算出来的页面在原图中的左上角、左下角、右上角和右下角四个角点的坐标,即可获取到对应四个角点的最小外接矩形,利用该最小外接矩形对原图进行仿射变换,将原图矫正,并将原图中矫正后的四个角点的矩形区域截取出来,记为矩形批改区;
S4、OCR批改模块根据区域分割识别模块得到的矩形批改区的宽和高、基础数据模块中存储的页宽和页高,计算得到矩形批改区的宽高比和基于基础数据模块的宽高比,并计算得到矩形批改区的宽高比和基于基础数据模块的宽高比的比值关系;根据所述比值关系,对基础数据模块中存储的对应页的题目区域坐标数据和答题区域坐标数据进行换算,计算得到矩形批改区中的题目区域坐标数据和答题区域坐标数据,然后据此准确分割页面的题目区域和答题区域并进行OCR 识别,得到矩形批改区中的题目数据及对应的答题数据;根据基础数据模块中存储的对应的题目数据及答案数据,对识别到的答题数据进行对比,完成智能批改;
S5、所述显示模块将智能批改后的结果以及基础数据模块中存储的相应解析数据,展示给用户查阅。
进一步地,上述方法中,步骤S1中,拍摄时按照显示模块上显示的照片限定边框的引导,将需要拍摄的页面内容限定在所述照片限定边框内。
进一步地,上述方法中,当发生有识别错误的情况时,用户利用纠偏模块将识别错误的题目反馈至教师端或后台,教师端或后台验证后进行纠偏反馈。
进一步地,上述方法中,步骤S2的具体过程为:
S2.1、保存原图,并复制一份原图Pcopy进行图像处理;
S2.2、对Pcopy进行灰度处理后,使用自适应阈值法对图像进行二值化;
S2.3、对步骤S2.2中所获得的图像依次进行膨胀、腐蚀、膨胀三次操作,将图像中的题目内容和答题内容及其他噪点去除掉,只留下页面的边缘线条;
S2.4、对步骤S2.3中所获得的图像通过canny算法对图像进行边缘检测,检测出页面的边缘图像以供所述区域分割识别模块进行边缘提取。
本发明的有益效果在于:
1、本发明针对已经印刷好的教辅资料(可以是出版的教辅资料,也可以是教师已经完成录入、编辑并打印好的教辅资料),提出一种智能批改方案,不要求教辅资料上作任何标记,因此也不需要对教辅资料进行重新的编辑、打印,因此适应性强,不会增加额外的工作负担。
2、利用本发明,老师布置教辅作业后,学生也可以提前实现批改,从而达到提前预习,及时备课的目的。
3、本发明可以实现教辅资料的智能批改,将极大地减少教师检查教辅作业的工作量,也可方便教师统计教辅作业完成情况。
具体实施方式
以下将对本发明作进一步的描述,需要说明的是,本实施例以本技术方案为前提,给出了详细的实施方式和具体的操作过程,但本发明的保护范围并不限于本实施例。
实施例1
一种教辅资料智能批改的系统,包括基础数据模块、拍摄模块、图像解析模块、区域分割识别模块、OCR批改模块、显示模块、纠偏模块、纯黑色背景底板;
所述基础数据模块用于存储教辅资料的基础数据,包括教辅资料的页宽Wbook、页高Hbook、题目数据、各个题目对应的答案数据及解析数据,以及每个题目所在页的页码及其在所在页的题目区域坐标数据和答题区域坐标数据;
其中,当题目是一个包含多个小题的大题时,该题目的题目区域坐标数据和答题区域坐标数据包括大题的题目区域坐标数据、大题下的各个小题的题目区域坐标数据以及各个小题的答题区域坐标数据。
题目区域坐标数据包括题目区域的左上角坐标点和右下角坐标点,答题区域坐标数据包括答题区域的左上角坐标点和右下角坐标点,题目区域和答题区域均为由对应的左上角坐标点和右下角坐标点围成的矩形区域。
需要说明的是,一般教辅资料每一页均包括正面和反面,正面和反面的坐标相对值不同,正面需要以右上角作为坐标参考原点,反面需要以左上角作为坐标的参考原点。
所述拍摄模块用于对需要批改的教辅资料的页面进行图像拍摄;拍摄时,显示模块上显示有照片限定边框,用于引导用户将需要拍摄的页面内容限定在所述照片限定边框内;显示模块可以采用触控屏。
进行图像拍摄时,将需要批改的教辅资料放置在纯黑色背景底板上,为拍摄提供纯黑色背景;
所述图像解析模块用于对拍摄模块拍摄得到的原图进行解析处理,检测出页面的边缘图像;具体过程如下:
1)保存原图,并复制一份原图Pcopy进行图像处理;
2)对Pcopy进行灰度处理后,使用自适应阈值法对图像进行二值化;
3)对2)中所获得的图像依次进行膨胀、腐蚀、膨胀三次操作,将图像中的题目内容和答题内容及其他噪点去除掉,只留下页面的边缘线条;
4)对3)中所获得的图像通过canny算法对图像进行边缘检测,检测出页面的边缘图像以供所述区域分割识别模块进行边缘提取;
区域分割识别模块用于根据图像解析模块得到的页面的边缘图像,识别和分割出原图的批改区;具体过程为:
①通过边缘提取算法获得图像解析模块最终得到的边缘图像的轮廓数组,并按照最小面积及周长剔除干扰;
②当页面为正面时,按照页面右上角和右下角点的特征,即可锁定页面的右上角坐标(Brtx,Brty)以及右下角坐标(Brbx,Brby),同时根据边缘图像提取的页面的上边缘线和下边缘线,获取上边缘线和下边缘线的相对于水平线的斜率K;
当页面为反面时,按照页面左上角和左上角点的特征,即可锁定页面的左上角坐标(Bltx,Blty)以及左下角坐标(Blbx,Blby),同时根据边缘图像提取的页面的上边缘线和下边缘线,获取上边缘线和下边缘线的相对于水平线的斜率K;
③当页面为正面时,根据②获取的右上角坐标、右下角坐标以及斜率K获得页面的左上角坐标(Bltx,Blty)及左下角坐标 (Blbx,Blby);具体通过下式(1)-(8)获取:
Ratio=Wbook/Hbook (1);
Figure BDA0002713296530000121
Wtop=Wbottom=Ratio*Hright (3);
θ=arctan k (4);
Bltx=Brtx-Wtop*cosθ (5);
Blty=Brty+Wtop*sinθ (6);
Blbx=Brbx-Wbottom*cosθ (7);
Blby=Brby+Wbottom*sinθ (8);
其中,Ratio为页面的宽高比,Hright为原图中页面右边缘的高度,Wtop为原图中页面的上边缘的宽度,Wbottom为原图中页面的下边缘的宽度,θ为原图中页面的上边缘或下边缘与水平线的夹角。
当页面为反面时,根据②获取的左上角坐标、左下角坐标以及斜率K获得页面的右上角坐标(Brtx,Brty)及右下角坐标(Brbx,Brby);具体通过下式(9)-(16)获取:
Ratio=Wbook/Hbook (9);
Figure BDA0002713296530000131
Wtop=Wbottom=Ratio*Hleft (11);
θ=arctan k (12);
Brtx=Bltx+Wtop*cosθ (13);
Brty=Blty-Wtop*sinθ (14);
Brbx=Blbx+Wbottom*cosθ (15);
Brby=Blby-Wbottom*sinθ (16)。
④通过③计算出来的页面在原图中的左上角、左下角、右上角和右下角四个角点的坐标,即可获取到对应四个角点的最小外接矩形,利用该最小外接矩形对原图进行仿射变换,将原图矫正,并将原图中矫正后的四个角点的矩形区域截取出来,记为矩形批改区;
OCR批改模块用于根据区域分割识别模块得到的矩形批改区的宽和高、基础数据模块中存储的页宽和页高,计算得到矩形批改区的宽高比和基于基础数据模块的宽高比,并计算得到矩形批改区的宽高比和基于基础数据模块的宽高比的比值关系;根据所述比值关系,对基础数据模块中存储的对应页的题目区域坐标数据和答题区域坐标数据进行换算,计算得到矩形批改区中的题目区域坐标数据和答题区域坐标数据,然后据此准确分割页面的题目区域和答题区域并进行OCR 识别,得到矩形批改区中的题目数据及对应的答题数据;根据基础数据模块中存储的对应的题目数据及答案数据,对识别到的答题数据进行对比,完成智能批改;
所述显示模块用于将智能批改后的结果以及基础数据模块中存储的相应解析数据,展示给用户查阅。
所述系统还包括有纠偏模块,所述纠偏模块用于将识别错误的题目反馈至教师端或后台,教师端或后台验证后进行纠偏反馈。
需要说明的是,所述教辅资料智能批改的系统可以集成在一个电子设备上实现,例如手机、平板电脑等。
实施例2
本实施例提供一种利用实施例1所述系统的方法,包括如下步骤:
S1、完成教辅资料上的题目的答题后,将教辅资料放在纯黑色背景底板上,将拍摄模块对准需要批改的页面并进行拍摄;拍摄时按照显示模块上显示的照片限定边框的引导,将需要拍摄的页面内容限定在所述照片限定边框内;
S2、图像解析模块对拍摄模块拍摄得到的原图进行解析处理,检测出页面的边缘图像:
S2.1、保存原图,并复制一份原图Pcopy进行图像处理;
S2.2、对Pcopy进行灰度处理后,使用自适应阈值法对图像进行二值化;
S2.3、对步骤S2.2中所获得的图像依次进行膨胀、腐蚀、膨胀三次操作,将图像中的题目内容和答题内容及其他噪点去除掉,只留下页面的边缘线条;
S2.4、对步骤S2.3中所获得的图像通过canny算法对图像进行边缘检测,检测出页面的边缘图像以供所述区域分割识别模块进行边缘提取;
S3、区域分割识别模块用于根据图像解析模块得到的页面的边缘图像,识别和分割出原图的批改区;具体过程为:
S3.1、通过边缘提取算法获得图像解析模块最终得到的边缘图像的轮廓数组,并按照最小面积及周长剔除干扰;
S3.2、当页面为正面时,按照页面右上角和右下角点的特征,即可锁定页面的右上角坐标(Brtx,Brty)以及右下角坐标(Brbx,Brby),同时根据边缘图像提取的页面的上边缘线和下边缘线,获取上边缘线和下边缘线的相对于水平线的斜率K;
当页面为反面时,按照页面左上角和左上角点的特征,即可锁定页面的左上角坐标(Bltx,Blty)以及左下角坐标(Blbx,Blby),同时根据边缘图像提取的页面的上边缘线和下边缘线,获取上边缘线和下边缘线的相对于水平线的斜率K;
S3.3、当页面为正面时,根据步骤S3.2获取的右上角坐标、右下角坐标以及斜率K获得页面的左上角坐标(Bltx,Blty)及左下角坐标(Blbx,Blby);具体通过下式(1)-(8)获取:
Ratio=Wbook/Hbook (1);
Figure BDA0002713296530000151
Wtop=Wbottom=Ratio*Hright (3);
θ=arctan k (4);
Bltx=Brtx-Wtop*cosθ (5);
Blty=Brty+Wtop*sinθ (6);
Blbx=Brbx-Wbottom*cosθ (7);
Blby=Brby+Wbottom*sinθ (8);
其中,Ratio为页面的宽高比,Hright为原图中页面右边缘的高度,Wtop为原图中页面的上边缘的宽度,Wbottom为原图中页面的下边缘的宽度,θ为原图中页面的上边缘或下边缘与水平线的夹角。
当页面为反面时,根据步骤S3.2获取的左上角坐标、左下角坐标以及斜率K获得页面的右上角坐标(Brtx,Brty)及右下角坐标 (Brbx,Brby);具体通过下式(9)-(16)获取:
Ratio=Wbook/Hbook (9);
Figure BDA0002713296530000161
Wtop=Wbottom=Ratio*Hleft (11);
θ=arctan k (12);
Brtx=Bltx+Wtop*cosθ (13);
Brty=Blty-Wtop*sinθ (14);
Brbx=Blbx+Wbottom*cosθ (15);
Brby=Blby-Wbottom*sinθ (16)。
④通过③计算出来的页面在原图中的左上角、左下角、右上角和右下角四个角点的坐标,即可获取到对应四个角点的最小外接矩形,利用该最小外接矩形对原图(步骤S2.1中保存)进行仿射变换,将原图矫正,并将原图中矫正后的四个角点的矩形区域截取出来,记为矩形批改区;
S4、OCR批改模块根据区域分割识别模块得到的矩形批改区的宽和高、基础数据模块中存储的页宽和页高,计算得到矩形批改区的宽高比和基于基础数据模块的宽高比,并计算得到矩形批改区的宽高比和基于基础数据模块的宽高比的比值关系;根据所述比值关系,对基础数据模块中存储的对应页的题目区域坐标数据和答题区域坐标数据进行换算,计算得到矩形批改区中的题目区域坐标数据和答题区域坐标数据,然后据此准确分割页面的题目区域和答题区域并进行OCR 识别,得到矩形批改区中的题目数据及对应的答题数据;根据基础数据模块中存储的对应的题目数据及答案数据,对识别到的答题数据进行对比,完成智能批改;
S5、所述显示模块将智能批改后的结果以及基础数据模块中存储的相应解析数据,展示给用户查阅。
上述方法中,当发生有识别错误的情况时,用户利用纠偏模块将识别错误的题目反馈至教师端或后台,教师端或后台验证后进行纠偏反馈。
上述方法中,页面的页码以及页面为正面或反面,可以在用户拍摄图像后手动输入。
对于本领域的技术人员来说,可以根据以上的技术方案和构思,给出各种相应的改变和变形,而所有的这些改变和变形,都应该包括在本发明权利要求的保护范围之内。

Claims (10)

1.一种教辅资料智能批改的系统,其特征在于,包括基础数据模块、拍摄模块、图像解析模块、区域分割识别模块、OCR批改模块、显示模块;
所述基础数据模块用于存储教辅资料的基础数据,包括教辅资料的页宽Wbook、页高Hbook、题目数据、各个题目对应的答案数据及解析数据,以及每个题目所在页的页码及其在所在页的题目区域坐标数据和答题区域坐标数据;
所述拍摄模块用于对需要批改的教辅资料的页面进行图像拍摄;
所述图像解析模块用于对拍摄模块拍摄得到的原图进行解析处理,检测出页面的边缘图像;
区域分割识别模块用于根据图像解析模块得到的页面的边缘图像,识别和分割出原图的批改区;具体过程为:
①通过边缘提取算法获得图像解析模块最终得到的边缘图像的轮廓数组,并按照最小面积及周长剔除干扰;
②当页面为正面时,按照页面右上角和右下角点的特征,即可锁定页面的右上角坐标(Brtx,Brty)以及右下角坐标(Brbx,Brby),同时根据边缘图像提取的页面的上边缘线和下边缘线,获取上边缘线和下边缘线的相对于水平线的斜率K;
当页面为反面时,按照页面左上角和左上角点的特征,即可锁定页面的左上角坐标(Bltx,Blty)以及左下角坐标(Blbx,Blby),同时根据边缘图像提取的页面的上边缘线和下边缘线,获取上边缘线和下边缘线的相对于水平线的斜率K;
③当页面为正面时,根据②获取的右上角坐标、右下角坐标以及斜率K获得页面的左上角坐标(Bltx,Blty)及左下角坐标(Blbx,Blby);具体通过下式(1)-(8)获取:
Ratio=Wbook/Hbook (1);
Figure FDA0002713296520000021
Wtop=Wbottom=Ratio*Hright (3);
θ=arctank (4);
Bltx=Brtx-Wtop*cosθ (5);
Blty=Brty+Wtop*sinθ (6);
Blbx=Brbx-Wbottom*cosθ (7);
Blby=Brby+Wbottom*sinθ (8);
其中,Ratio为页面的宽高比,Hright为原图中页面右边缘的高度,Wtop为原图中页面的上边缘的宽度,Wbottom为原图中页面的下边缘的宽度,θ为原图中页面的上边缘或下边缘与水平线的夹角;
当页面为反面时,根据②获取的左上角坐标、左下角坐标以及斜率K获得页面的右上角坐标(Brtx,Brty)及右下角坐标(Brbx,Brby);具体通过下式(9)-(16)获取:
Ratio=Wbook/Hbook (9);
Figure FDA0002713296520000022
Wtop=Wbottom=Ratio*Hleft (11);
θ=arctank (12);
Brtx=Bltx+Wtop*cosθ (13);
Brty=Blty-Wtop*sinθ (14);
Brbx=Blbx+Wbottom*cosθ (15);
Brby=Blby-Wbottom*sinθ (16);
④通过③计算出来的页面在原图中的左上角、左下角、右上角和右下角四个角点的坐标,即可获取到对应四个角点的最小外接矩形,利用该最小外接矩形对原图进行仿射变换,将原图矫正,并将原图中矫正后的四个角点的矩形区域截取出来,记为矩形批改区;
OCR批改模块用于根据区域分割识别模块得到的矩形批改区的宽和高、基础数据模块中存储的页宽和页高,计算得到矩形批改区的宽高比和基于基础数据模块的宽高比,并计算得到矩形批改区的宽高比和基于基础数据模块的宽高比的比值关系;根据所述比值关系,对基础数据模块中存储的对应页的题目区域坐标数据和答题区域坐标数据进行换算,计算得到矩形批改区中的题目区域坐标数据和答题区域坐标数据,然后据此准确分割页面的题目区域和答题区域并进行OCR识别,得到矩形批改区中的题目数据及对应的答题数据;根据基础数据模块中存储的对应的题目数据及答案数据,对识别到的答题数据进行对比,完成智能批改;
所述显示模块用于将智能批改后的结果以及基础数据模块中存储的相应解析数据,展示给用户查阅。
2.根据权利要求1所述的系统,其特征在于,还包括有纯黑色背景底板,用于进行图像拍摄时,将需要批改的教辅资料放置在纯黑色背景底板上,为拍摄提供纯黑色背景。
3.根据权利要求1所述的系统,其特征在于,还包括有纠偏模块,所述纠偏模块用于将识别错误的题目反馈至教师端或后台,教师端或后台验证后进行纠偏反馈。
4.根据权利要求1所述的系统,其特征在于,当题目是一个包含多个小题的大题时,该题目的题目区域坐标数据和答题区域坐标数据包括大题的题目区域坐标数据、大题下的各个小题的题目区域坐标数据以及各个小题的答题区域坐标数据。
5.根据权利要求1所述的系统,其特征在于,题目区域坐标数据包括题目区域的左上角坐标点和右下角坐标点,答题区域坐标数据包括答题区域的左上角坐标点和右下角坐标点,题目区域和答题区域均为由对应的左上角坐标点和右下角坐标点围成的矩形区域。
6.根据权利要求1所述的系统,其特征在于,图像解析模块对图像进行解析处理的过程为:
1)保存原图,并复制一份原图Pcopy进行图像处理;
2)对Pcopy进行灰度处理后,使用自适应阈值法对图像进行二值化;
3)对2)中所获得的图像依次进行膨胀、腐蚀、膨胀三次操作,将图像中的题目内容和答题内容及其他噪点去除掉,只留下页面的边缘线条;
4)对3)中所获得的图像通过canny算法对图像进行边缘检测,检测出页面的边缘图像以供所述区域分割识别模块进行边缘提取。
7.一种利用上述任一权利要求所述系统的方法,其特征在于,包括如下步骤:
S1、完成教辅资料上的题目的答题后,将拍摄模块对准需要批改的页面并进行拍摄;
S2、图像解析模块对拍摄模块拍摄得到的原图进行解析处理,检测出页面的边缘图像;
S3、区域分割识别模块用于根据图像解析模块得到的页面的边缘图像,识别和分割出原图的批改区;具体过程为:
S3.1、通过边缘提取算法获得图像解析模块最终得到的边缘图像的轮廓数组,并按照最小面积及周长剔除干扰;
S3.2、当页面为正面时,按照页面右上角和右下角点的特征,即可锁定页面的右上角坐标(Brtx,Brty)以及右下角坐标(Brbx,Brby),同时根据边缘图像提取的页面的上边缘线和下边缘线,获取上边缘线和下边缘线的相对于水平线的斜率K;
当页面为反面时,按照页面左上角和左上角点的特征,即可锁定页面的左上角坐标(Bltx,Blty)以及左下角坐标(Blbx,Blby),同时根据边缘图像提取的页面的上边缘线和下边缘线,获取上边缘线和下边缘线的相对于水平线的斜率K;
S3.3、当页面为正面时,根据步骤S3.2获取的右上角坐标、右下角坐标以及斜率K获得页面的左上角坐标(Bltx,Blty)及左下角坐标(Blbx,Blby);具体通过下式(1)-(8)获取:
Ratio=Wbook/Hbook (1);
Figure FDA0002713296520000051
Wtop=Wbottom=Ratio*Hright (3);
θ=arctank (4);
Bltx=Brtx-Wtop*cosθ (5);
Blty=Brty+Wtop*sinθ (6);
Blbx=Brbx-Wbottom*cosθ (7);
Blby=Brby+Wbottom*sinθ (8);
其中,Ratio为页面的宽高比,Hright为原图中页面右边缘的高度,Wtop为原图中页面的上边缘的宽度,Wbottom为原图中页面的下边缘的宽度,θ为原图中页面的上边缘或下边缘与水平线的夹角;
当页面为反面时,根据步骤S3.2获取的左上角坐标、左下角坐标以及斜率K获得页面的右上角坐标(Brtx,Brty)及右下角坐标(Brbx,Brby);具体通过下式(9)-(16)获取:
Ratio=Wbook/Hbook (9);
Figure FDA0002713296520000061
Wtop=Wbottom=Ratio*Hleft (11);
θ=arctank (12);
Brtx=Bltx+Wtop*cosθ (13);
Brty=Blty-Wtop*sinθ (14);
Brbx=Blbx+Wbottom*cosθ (15);
Brby=Blby-Wbottom*sinθ (16);
S3.4、通过步骤S3.3计算出来的页面在原图中的左上角、左下角、右上角和右下角四个角点的坐标,即可获取到对应四个角点的最小外接矩形,利用该最小外接矩形对原图进行仿射变换,将原图矫正,并将原图中矫正后的四个角点的矩形区域截取出来,记为矩形批改区;
S4、OCR批改模块根据区域分割识别模块得到的矩形批改区的宽和高、基础数据模块中存储的页宽和页高,计算得到矩形批改区的宽高比和基于基础数据模块的宽高比,并计算得到矩形批改区的宽高比和基于基础数据模块的宽高比的比值关系;根据所述比值关系,对基础数据模块中存储的对应页的题目区域坐标数据和答题区域坐标数据进行换算,计算得到矩形批改区中的题目区域坐标数据和答题区域坐标数据,然后据此准确分割页面的题目区域和答题区域并进行OCR识别,得到矩形批改区中的题目数据及对应的答题数据;根据基础数据模块中存储的对应的题目数据及答案数据,对识别到的答题数据进行对比,完成智能批改;
S5、所述显示模块将智能批改后的结果以及基础数据模块中存储的相应解析数据,展示给用户查阅。
8.根据权利要求7所述的方法,其特征在于,步骤S1中,拍摄时按照显示模块上显示的照片限定边框的引导,将需要拍摄的页面内容限定在所述照片限定边框内。
9.根据权利要求7所述的方法,其特征在于,当发生有识别错误的情况时,用户利用纠偏模块将识别错误的题目反馈至教师端或后台,教师端或后台验证后进行纠偏反馈。
10.根据权利要求7所述的方法,其特征在于,步骤S2的具体过程为:
S2.1、保存原图,并复制一份原图Pcopy进行图像处理;
S2.2、对Pcopy进行灰度处理后,使用自适应阈值法对图像进行二值化;
S2.3、对步骤S2.2中所获得的图像依次进行膨胀、腐蚀、膨胀三次操作,将图像中的题目内容和答题内容及其他噪点去除掉,只留下页面的边缘线条;
S2.4、对步骤S2.3中所获得的图像通过canny算法对图像进行边缘检测,检测出页面的边缘图像以供所述区域分割识别模块进行边缘提取。
CN202011064280.4A 2020-09-30 2020-09-30 一种教辅资料智能批改的系统及方法 Active CN112200058B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011064280.4A CN112200058B (zh) 2020-09-30 2020-09-30 一种教辅资料智能批改的系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011064280.4A CN112200058B (zh) 2020-09-30 2020-09-30 一种教辅资料智能批改的系统及方法

Publications (2)

Publication Number Publication Date
CN112200058A CN112200058A (zh) 2021-01-08
CN112200058B true CN112200058B (zh) 2021-07-06

Family

ID=74013141

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011064280.4A Active CN112200058B (zh) 2020-09-30 2020-09-30 一种教辅资料智能批改的系统及方法

Country Status (1)

Country Link
CN (1) CN112200058B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113065477B (zh) * 2021-04-08 2023-04-18 读书郎教育科技有限公司 一种智慧课堂课本内容识别方法
CN113065554B (zh) * 2021-04-08 2023-05-02 读书郎教育科技有限公司 一种用于智慧课堂智能批阅的批改区域自动识别方法
CN113793538B (zh) * 2021-09-18 2022-09-20 珠海读书郎软件科技有限公司 一种教辅作业错题收集的方法及系统
CN114049805A (zh) * 2021-10-29 2022-02-15 珠海读书郎软件科技有限公司 一种基于墨水屏的智慧课堂智能批改及数据采集方法
CN114550181B (zh) * 2022-02-10 2023-01-10 珠海读书郎软件科技有限公司 一种小题识别方法、装置及介质

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104134072A (zh) * 2014-07-04 2014-11-05 北京学信速达科技有限公司 一种答题卡识别方法
CN104143082A (zh) * 2014-07-08 2014-11-12 北京彩云动力教育科技有限公司 一种基于图像模糊识别的试卷信息定位方法及系统
CN104143094A (zh) * 2014-07-08 2014-11-12 北京彩云动力教育科技有限公司 一种无需答题卡的试卷自动阅卷处理方法及系统
JP2014219949A (ja) * 2013-04-30 2014-11-20 良信 小村 テスト採点システム
CN105046200A (zh) * 2015-06-19 2015-11-11 成都理想境界科技有限公司 基于直线检测的电子阅卷方法
CN109409374A (zh) * 2018-10-11 2019-03-01 东莞市七宝树教育科技有限公司 一种基于联合的同批次试卷答案区域切割方法
CN110008933A (zh) * 2019-04-18 2019-07-12 江苏曲速教育科技有限公司 一种通用智能阅卷系统和方法
CN110659584A (zh) * 2019-08-30 2020-01-07 石家庄云松信息科技有限公司 一种基于图像识别的智能留痕阅卷系统
CN111461030A (zh) * 2020-04-03 2020-07-28 南京红松信息技术有限公司 一种基于仿射迭代变换的模板匹配对齐方法
CN111553211A (zh) * 2020-04-16 2020-08-18 深圳中兴网信科技有限公司 试卷答案识别方法、系统、装置和计算机可读存储介质

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100935913B1 (ko) * 2007-07-16 2010-01-06 이종민 시험문제 생성장치 및 방법
CN101662581B (zh) * 2009-09-09 2011-06-01 谭洪舟 多功能证件信息采集系统
CN106650608B (zh) * 2016-10-31 2019-11-26 广东工业大学 一种无定位点试卷中矩形定位框的识别方法
CN106897749A (zh) * 2017-03-03 2017-06-27 盐城工学院 自动阅卷方法及系统
CN110647885B (zh) * 2019-09-17 2022-10-28 广州光大教育软件科技股份有限公司 基于图片识别的试卷拆分方法、装置、设备以及介质
CN111401372B (zh) * 2019-12-20 2024-04-16 国家电网有限公司 一种扫描文档图文信息提取与鉴别的方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014219949A (ja) * 2013-04-30 2014-11-20 良信 小村 テスト採点システム
CN104134072A (zh) * 2014-07-04 2014-11-05 北京学信速达科技有限公司 一种答题卡识别方法
CN104143082A (zh) * 2014-07-08 2014-11-12 北京彩云动力教育科技有限公司 一种基于图像模糊识别的试卷信息定位方法及系统
CN104143094A (zh) * 2014-07-08 2014-11-12 北京彩云动力教育科技有限公司 一种无需答题卡的试卷自动阅卷处理方法及系统
CN105046200A (zh) * 2015-06-19 2015-11-11 成都理想境界科技有限公司 基于直线检测的电子阅卷方法
CN109409374A (zh) * 2018-10-11 2019-03-01 东莞市七宝树教育科技有限公司 一种基于联合的同批次试卷答案区域切割方法
CN110008933A (zh) * 2019-04-18 2019-07-12 江苏曲速教育科技有限公司 一种通用智能阅卷系统和方法
CN110659584A (zh) * 2019-08-30 2020-01-07 石家庄云松信息科技有限公司 一种基于图像识别的智能留痕阅卷系统
CN111461030A (zh) * 2020-04-03 2020-07-28 南京红松信息技术有限公司 一种基于仿射迭代变换的模板匹配对齐方法
CN111553211A (zh) * 2020-04-16 2020-08-18 深圳中兴网信科技有限公司 试卷答案识别方法、系统、装置和计算机可读存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
大比例尺地形图图廓替换程序的设计与实现;王友昆 等;《城市勘测》;20101231;第2.4节 *

Also Published As

Publication number Publication date
CN112200058A (zh) 2021-01-08

Similar Documents

Publication Publication Date Title
CN112200058B (zh) 一种教辅资料智能批改的系统及方法
CN109840519B (zh) 一种自适应的智能单据识别录入装置及其使用方法
CN107633239A (zh) 基于深度学习和ocr的票据分类及票据字段提取方法
CN105913093A (zh) 一种用于文字识别处理的模板匹配方法
CN106960208A (zh) 一种仪表液晶数字自动切分和识别的方法及系统
US6411732B1 (en) Method for interpreting hand drawn diagrammatic user interface commands
CN111860527A (zh) 图像校正方法、图像校正装置、计算机设备及存储介质
CN112348019B (zh) 一种答题卡矫正方法、装置、电子设备及存储介质
CN105243383A (zh) 答题卡处理方法及系统
CN107067399A (zh) 一种试卷图像分割处理方法
CN112419260A (zh) 一种pcb文字区域缺陷检测方法
CN106934411A (zh) 基于模板匹配的电子阅卷方法
CN112163529A (zh) 一种试卷统分的系统及方法
JP4655824B2 (ja) 画像認識装置、画像認識方法および画像認識プログラム
CN115100657A (zh) 电气cad图纸扫描图的字符与带宽度的线条识别方法
CN114463770A (zh) 一种用于普遍试卷题目的智能切题方法
CN114187253A (zh) 一种电路板零件安装检测方法
CN113673428A (zh) 一种答题卡图片中自动识别的方法
CN113159029A (zh) 一种图片中局部信息精准抓取的方法和系统
CN113486786B (zh) 一种自动作业批改系统
CN113065477B (zh) 一种智慧课堂课本内容识别方法
CN113705157B (zh) 一种纸质作业拍照批改的方法
KR101766787B1 (ko) Gpu장치를 기반으로 하는 딥러닝 분석을 이용한 영상 보정 방법
CN115482535A (zh) 一种试卷自动批改方法、存储介质及设备
CN113378824A (zh) 一种将试卷信息录入自动批改系统的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant