CN115880566A - 一种基于视觉分析的智能阅卷系统 - Google Patents
一种基于视觉分析的智能阅卷系统 Download PDFInfo
- Publication number
- CN115880566A CN115880566A CN202211623078.XA CN202211623078A CN115880566A CN 115880566 A CN115880566 A CN 115880566A CN 202211623078 A CN202211623078 A CN 202211623078A CN 115880566 A CN115880566 A CN 115880566A
- Authority
- CN
- China
- Prior art keywords
- image
- text
- test paper
- character
- paper
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Character Input (AREA)
Abstract
本发明涉及一种基于视觉分析的智能阅卷系统,包括:图像获取模块:用于获取卷面图像;预处理模块:用于对所述卷面图像进行预处理,获得标准图像;区域识别模块:用于对所述标准图像中的不同区域进行识别;文本识别模块:用于对识别出的文本作答区域通过卷积神经网络进行文本识别与审阅,得到审阅结果。本发明系统实现了高效的试卷批阅,能进行试卷质量的分析与统计,能够将教师从繁重的重复性劳动中解脱出来,提高了教师的教学效率,降低了教师教学备案的劳动强度。
Description
技术领域
本发明涉及智能阅卷技术领域,特别是涉及一种基于视觉分析的智能阅卷系统。
背景技术
教育一直以来都是大家最关心的问题之一,教育的成败关乎一个国家的发展与兴衰,当今世界文明和科技的进步以及国家的繁荣昌盛都离不开人才的培养,这正是教育所发挥的力量。考试作为教育教学中的一种重要评估方式已被大众所普遍接受,阅卷工作作为考试环节中的重要一步直接影响着考试的公平性与可靠性,并且阅卷方式也随着考试形式的变化和科学技术的进步在发生着巨大的改变。
目前,针对学校考试阅卷批改已经逐渐推广和采用了各类阅卷系统,这类系统能够一定程度上减轻教师阅卷的工作量。然而,在现有的阅卷系统中,完全由计算机完成阅卷的部分多是对填涂性客观题的阅卷,而对于文字性试题,如填空题、简答题、计算题的阅卷,仍主要是由教师手工批改,批改完成后,需要手工输入或受过培训的专业人士集中进行。
随着计算机和人工智能的高速发展,其逐渐应用到工作和生活的多个领域,因此出现了计算机智能阅卷的相关技术,通过这种阅卷方式能够大大节省教师的阅卷时间。智能阅卷凭借其快速的批阅处理、客观公正的评分以及更加直观方便的管理等特点,成为当今考试阅卷的主要发展方向。
发明内容
本发明的目的是提供一种基于视觉分析的智能阅卷系统,通过扫描设备将纸质试卷转换成数字图像,对试卷进行区域分割,实现试卷信息的客观题的自动识别。
为实现上述目的,本发明提供了如下方案:
一种基于视觉分析的智能阅卷系统,包括:
图像获取模块:用于获取卷面图像;
预处理模块:用于对所述卷面图像进行预处理,获得标准图像;
区域识别模块:用于对所述标准图像中的不同区域进行识别;
文本识别模块:用于对识别出的文本作答区域通过卷积神经网络进行文本识别与审阅,得到审阅结果。
优选地,所述图像获取模块通过扫描装置将纸质试卷扫描为数字图像试卷,获取所述卷面图像。
优选地,所述预处理模块包括:
图像灰度化单元:用于将所述卷面图像装换成单通道图像;
二值化处理单元:用于通过均值滤波方法区分卷面图像的前景和背景;
图像去噪单元:用于去除卷面图像中的噪声,增强感兴趣部分,保留所述卷面图像中的有效信息;
倾斜矫正单元:用于通过Radon变化法利用图像空间中的线与参数空间中的点所存在的对应关系,对倾斜图像进行校正。
优选地,所述区域识别模块包括:
学号区域识别单元:用于对填写学号的区域进行识别;
题目区域识别单元:用于对试卷中的题目区域进行识别;
其中,所述学号区域识别单元、所述题目区域识别单元分别与所述预处理模块连接。
优选地,所述学号区域识别单元基于深度学习的图像检测技术,检测出学号填涂区域,然后基于OCR的选项检测技术,识别出学号中不同数字的选择位置,并保存各数字位置坐标及选项位置坐标。
优选地,所述题目区域识别单元通过CPTN模型进行优化及训练,获得试卷题目检测模型,基于所述试卷题目检测模型对试卷题目进行识别,获得目标框,根据所述目标框的位置对题目区域进行分割。
优选地,根据所述目标框位置对题目区域进行分割,包括:
记录题目检测框的左上角坐标对(x,y),然后以x值对所述坐标对进行排序,得到排序结果,再将所述排序结果以y值对坐标对进行排序;
计算相邻坐标点的x值之间的距离d,即d=|xt-xt-1|,若所述距离d大于预设阈值,则将xt-1之前的坐标和xt之后的坐标分开,表示分栏,依此类推,直至计算完毕;
根据划分找出每一栏坐标x的最小值进行竖直分割,分割为若干栏,再对每一栏中的坐标以y值进行水平分割,完成对所述题目区域的分割。
优选地,所述文本识别模块包括手写文本检测单元,所述手写文本检测单元用于通过全卷积神经网络对试卷作答文本进行识别并提取。
优选地,通过所述全卷积神经网络对试卷作答文本进行识别并提取,包括:
基于所述全卷积神经网络对手写体进行特征提取,将分割成多个手写体单字符图像的试卷扫描图像输入至全卷积神经网络中,全卷积神经网络将计算全连接层向量,输出手写体文字分类置信度,并通过训练样本训练全卷积神经网络,手写体文字分类置信度用于与训练样本的标签值进行比较,修正网络权重;
提取全卷积神经网络中全连接层向量作为特征向量,采用K近邻算法与训练样本逐一比较,得到手写体中文字符,进而得到单字符文本;
基于所述单字符文本中手写体中文字符的上下文条件转移概率,并进行判断,若概率小于阈值,则所述手写体中文字符为异常字符,并将所述异常字符修正为手写体中文字符的上下文条件转移概率最大的字符;若概率大于阈值,则所述手写体中文字符为正常字符;根据异常字符修正后的字符、以及正常字符,得到所述试卷作答文本。
本发明的有益效果为:
本发明系统实现了高效的试卷批阅,能进行试卷质量的分析与统计,能够将教师从繁重的重复性劳动中解脱出来,提高了教师的教学效率,降低了教师教学备案的劳动强度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例中基于视觉分析的智能阅卷系统结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
一种基于视觉分析的智能阅卷系统,如图1,包括:
图像获取模块:用于获取卷面图像;
预处理模块:用于对所述卷面图像进行预处理,获得标准图像;
区域识别模块:用于对所述标准图像中的不同区域进行识别;
文本识别模块:用于对识别出的文本作答区域通过卷积神经网络进行文本识别与审阅,得到审阅结果。
图像获取模块通过扫描装置将纸质试卷扫描为数字图像试卷,获取所述卷面图像。
进一步优化方案,所述预处理模块包括:
图像灰度化单元:用于将所述卷面图像装换成单通道图像;
图像灰度化是图像预处理过程中的第一步,将扫描得到的24位彩色图像转换成8位的单通道图像,可以减少图像的数据量,从而有效提高程序的处理速度和运行效率。
二值化处理单元:用于通过均值滤波方法区分图像的前景和背景;
二值图像就是仅用两个值来表示整幅图像中的像素值,通常使用的值是0或255,图像的颜色也只有两种,即黑和白。图像二值化的转换过程中,关键是确定一个阈值T,然后对整个图像的像素点进行遍历,大于T的像素值赋值255,小于T的像素值赋值0。
图像去噪单元:用于去除卷面图像中的噪声,增强感兴趣部分,保留所述卷面图像中的有效信息;
在使用扫描仪扫描试卷图像的过程中,扫描效果会受到试卷纸张的厚薄分布程度、光照均匀程度、扫描仪质量以及油墨颜色深浅等因素影响,导致扫描得到的试卷图像存在较多噪点,这将影响下一步的阅卷效果。因此,有效的去除试卷图像中的噪声是试卷图像预处理过程的第一步。数字图像的滤波处理可以有效的滤除符合某种规律的噪声,同时增强图像中感兴趣的部分,保留图像中的有效信息。均值滤波能够在保证字体笔画连续性的前提下滤除噪声,因此在本实施例中使用均值滤波进行处理。
倾斜矫正单元:用于通过Radon变化法利用图像空间中的线与参数空间中的点所存在的对应关系,对倾斜图像进行校正。
Radon变换其基本原理就是利用图像空间中的线与参数空间中的点所存在的对应关系,经过Radon变换后将图像转换到参数空间中表示,变换过程就是把图像沿着某一特定方向的直线做线积分。将图像进行Radon变换后,参数空间中比较明亮的点对应图像中像素值较大的直线,而且直线线段越长,对应的点就越亮;相反,参数空间中比较暗的点对应图像中的像素值较低的直线。Radon变换直接在灰度图像上进行变换结果更加精致和准确。
进一步优化方案,所述区域识别模块包括:
学号区域识别单元:用于对填写学号的区域进行识别;
题目区域识别单元:用于对试卷中的题目区域进行识别。
所述学号区域识别单元基于深度学习的图像检测技术,检测出学号填涂区域,然后基于OCR的选项检测技术,识别出学号中不同数字的选择位置,并保存各数字位置坐标及选项位置坐标。
所述题目区域识别单元通过CPTN模型进行优化及训练,获得试卷题目检测模型,基于所述试卷题目检测模型对试卷题目进行识别,获得目标框,根据所述目标框位置对题目区域进行分割。
CTPN是从FasterR-CNN改进而来的一种文本检测算法,是在Faster R-CNN框架的基础上加入了双向LSTM(Long Short-Term Memory)层。本发明优化CTPN特征提取网络,首先使用ResNet50模型的前5层卷积层对图像进行卷积操作;在第五层基础上应用一个3×3的窗口密集地进行滑动,在滑动过程中分别与特征图对应位置进行卷积产生一个256维的特征向量;每滑动一行产生一个元素维度为256维的序列特征,将其输入到BLSTM中,所有行与BLSTM循环连接;然后将BLSTM的输出连接到全连接层中,接着使用Softmax预测输出候选框的文本/用文本分数、y轴坐标以及侧向细化偏移量。
根据目标框位置对题目区域进行分割,包括:
记录题目检测框的左上角坐标对(x,y),然后以x值对所述坐标对进行排序,得到排序结果,再将所述排序结果以y值对坐标对进行排序;
计算相邻坐标点的x值之间的距离d,即d=|xt-xt-1|,若所述距离d大于预设阈值,则将xt-1之前的坐标和xt之后的坐标分开,表示分栏,依此类推,直至计算完毕;
根据划分找出每一栏坐标x的最小值进行竖直分割,分割为若干栏,再对每一栏中的坐标以y值进行水平分割,完成对所述题目区域的分割。
进一步优化方案,所述文本识别模块包括手写文本检测单元,所述手写文本检测单元用于通过全卷积神经网络对试卷作答文本进行识别并提取。
基于所述全卷积神经网络对手写体进行特征提取,将分割成多个手写体单字符图像的试卷扫描图像输入至全卷积神经网络中,全卷积神经网络将计算全连接层向量,输出手写体文字分类置信度,并通过训练样本训练全卷积神经网络,手写体文字分类置信度用于与训练样本的标签值进行比较,修正网络权重;
全卷积神经网络包括一个输入层、两个卷积层、两个池化层、一个全连接层和一个输出层,输入缩放后的420*300试卷扫描图像至输入层,卷积层提取局部视野权重共享特征,卷积核是数量为10的5*5的随机卷积核,池化层对缩放后的试卷扫描图像进行降维处理,池化核是数量为10的2*2的最大值池化核,全连接层的激活函数采用Softmax函数,损失函数采用交叉熵损失函数,全连接层是全卷积神经网络中的隐含层,是全卷积神经网络组成部分,当输入分割成多个手写体单字符图像的试卷扫描图像至全卷积神经网络中时,全卷积神经网络将计算全连接层向量,用于对手写体文字进行分类,输出层输出分类置信度。
提取全卷积神经网络中全连接层向量作为特征向量,采用K近邻算法与训练样本逐一比较,得到手写体中文字符,进而得到单字符文本;
基于所述单字符文本中手写体中文字符的上下文条件转移概率,并进行判断,若概率小于阈值,则所述手写体中文字符为异常字符,并将所述异常字符修正为手写体中文字符的上下文条件转移概率最大的字符;若概率大于阈值,则所述手写体中文字符为正常字符;根据异常字符修正后的字符、以及正常字符,得到所述试卷作答文本。
本发明系统还包括汇总模块,汇总模块分别通过区域识别模块和文本识别模块获取客观题分数、主观题分数及考生信息,计算考生的总分并存储考生信息、考生总分至存储器中。通过汇总模块计算生总分并存储考生总分、考生信息至存储器,提高考试阅卷过程的安全性。
对于手写文本检测,为了解决检测过程中手写体和印刷体容易发生混淆的问题,本发明通过全卷积神经网络对手写文本进行预测,能够较好的检测出试卷上的手写文本。
本发明系统实现了高效的试卷批阅,能进行试卷质量的分析与统计,能够将教师从繁重的重复性劳动中解脱出来,提高了教师的教学效率,降低了教师教学备案的劳动强度。
以上所述的实施例仅是对本发明优选方式进行的描述,并非对本发明的范围进行限定,在不脱离本发明设计精神的前提下,本领域普通技术人员对本发明的技术方案做出的各种变形和改进,均应落入本发明权利要求书确定的保护范围内。
Claims (9)
1.一种基于视觉分析的智能阅卷系统,其特征在于,包括:
图像获取模块:用于获取卷面图像;
预处理模块:用于对所述卷面图像进行预处理,获得标准图像;
区域识别模块:用于对所述标准图像中的不同区域进行识别;
文本识别模块:用于对识别出的文本作答区域通过卷积神经网络进行文本识别与审阅,得到审阅结果。
2.根据权利要求1所述的基于视觉分析的智能阅卷系统,其特征在于,所述图像获取模块通过扫描装置将纸质试卷扫描为数字图像试卷,获取所述卷面图像。
3.根据权利要求1所述的基于视觉分析的智能阅卷系统,其特征在于,所述预处理模块包括:
图像灰度化单元:用于将所述卷面图像装换成单通道图像;
二值化处理单元:用于通过均值滤波方法区分卷面图像的前景和背景;
图像去噪单元:用于去除卷面图像中的噪声,增强感兴趣部分,保留所述卷面图像中的有效信息;
倾斜矫正单元:用于通过Radon变化法利用图像空间中的线与参数空间中的点所存在的对应关系,对倾斜图像进行校正。
4.根据权利要求3所述的基于视觉分析的智能阅卷系统,其特征在于,所述区域识别模块包括:
学号区域识别单元:用于对填写学号的区域进行识别;
题目区域识别单元:用于对试卷中的题目区域进行识别;
其中,所述学号区域识别单元、所述题目区域识别单元分别与所述预处理模块连接。
5.根据权利要求4所述的基于视觉分析的智能阅卷系统,其特征在于,所述学号区域识别单元基于深度学习的图像检测技术,检测出学号填涂区域,然后基于OCR的选项检测技术,识别出学号中不同数字的选择位置,并保存各数字位置坐标及选项位置坐标。
6.根据权利要求4所述的基于视觉分析的智能阅卷系统,其特征在于,所述题目区域识别单元通过CPTN模型进行优化及训练,获得试卷题目检测模型,基于所述试卷题目检测模型对试卷题目进行识别,获得目标框,根据所述目标框的位置对题目区域进行分割。
7.根据权利要求6所述的基于视觉分析的智能阅卷系统,其特征在于,根据所述目标框位置对题目区域进行分割,包括:
记录题目检测框的左上角坐标对(x,y),然后以x值对所述坐标对进行排序,得到排序结果,再将所述排序结果以y值对坐标对进行排序;
计算相邻坐标点的x值之间的距离d,即d=|xt-xt-1|,若所述距离d大于预设阈值,则将xt-1之前的坐标和xt之后的坐标分开,表示分栏,依此类推,直至计算完毕;
根据划分找出每一栏坐标x的最小值进行竖直分割,分割为若干栏,再对每一栏中的坐标以y值进行水平分割,完成对所述题目区域的分割。
8.根据权利要求1所述的基于视觉分析的智能阅卷系统,其特征在于,所述文本识别模块包括手写文本检测单元,所述手写文本检测单元用于通过全卷积神经网络对试卷作答文本进行识别并提取。
9.根据权利要求8所述的基于视觉分析的智能阅卷系统,其特征在于,通过所述全卷积神经网络对试卷作答文本进行识别并提取,包括:
基于所述全卷积神经网络对手写体进行特征提取,将分割成多个手写体单字符图像的试卷扫描图像输入至全卷积神经网络中,全卷积神经网络将计算全连接层向量,输出手写体文字分类置信度,并通过训练样本训练全卷积神经网络,手写体文字分类置信度用于与训练样本的标签值进行比较,修正网络权重;
提取全卷积神经网络中全连接层向量作为特征向量,采用K近邻算法与训练样本逐一比较,得到手写体中文字符,进而得到单字符文本;
基于所述单字符文本中手写体中文字符的上下文条件转移概率,并进行判断,若概率小于阈值,则所述手写体中文字符为异常字符,并将所述异常字符修正为手写体中文字符的上下文条件转移概率最大的字符;若概率大于阈值,则所述手写体中文字符为正常字符;根据异常字符修正后的字符、以及正常字符,得到所述试卷作答文本。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211623078.XA CN115880566A (zh) | 2022-12-16 | 2022-12-16 | 一种基于视觉分析的智能阅卷系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211623078.XA CN115880566A (zh) | 2022-12-16 | 2022-12-16 | 一种基于视觉分析的智能阅卷系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115880566A true CN115880566A (zh) | 2023-03-31 |
Family
ID=85755094
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211623078.XA Pending CN115880566A (zh) | 2022-12-16 | 2022-12-16 | 一种基于视觉分析的智能阅卷系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115880566A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116912845A (zh) * | 2023-06-16 | 2023-10-20 | 广东电网有限责任公司佛山供电局 | 一种基于nlp与ai的智能内容识别与分析方法及装置 |
CN117894033A (zh) * | 2024-03-14 | 2024-04-16 | 山东山大鸥玛软件股份有限公司 | 一种基于ocr识别的答卷一致性校验方法及系统 |
-
2022
- 2022-12-16 CN CN202211623078.XA patent/CN115880566A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116912845A (zh) * | 2023-06-16 | 2023-10-20 | 广东电网有限责任公司佛山供电局 | 一种基于nlp与ai的智能内容识别与分析方法及装置 |
CN116912845B (zh) * | 2023-06-16 | 2024-03-19 | 广东电网有限责任公司佛山供电局 | 一种基于nlp与ai的智能内容识别与分析方法及装置 |
CN117894033A (zh) * | 2024-03-14 | 2024-04-16 | 山东山大鸥玛软件股份有限公司 | 一种基于ocr识别的答卷一致性校验方法及系统 |
CN117894033B (zh) * | 2024-03-14 | 2024-05-28 | 山东山大鸥玛软件股份有限公司 | 一种基于ocr识别的答卷一致性校验方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111401372B (zh) | 一种扫描文档图文信息提取与鉴别的方法 | |
CN107609549B (zh) | 一种自然场景下证件图像的文本检测方法 | |
Gatos et al. | Automatic table detection in document images | |
CN110210413A (zh) | 一种基于深度学习的多学科试卷内容检测与识别系统及方法 | |
Parker et al. | An approach to license plate recognition | |
CN109784342B (zh) | 一种基于深度学习模型的ocr识别方法及终端 | |
LeBourgeois | Robust multifont OCR system from gray level images | |
CN111626190A (zh) | 基于聚类分区进行刻度识别的水位监测方法 | |
CN115880566A (zh) | 一种基于视觉分析的智能阅卷系统 | |
CN113128442B (zh) | 基于卷积神经网络的汉字书法风格识别方法和评分方法 | |
CN103310211B (zh) | 一种基于图像处理的填注标记识别方法 | |
CN110766017B (zh) | 基于深度学习的移动终端文字识别方法及系统 | |
CN110619326B (zh) | 一种基于扫描的英语试卷作文检测识别系统及方法 | |
CN112836650B (zh) | 一种质量检验报告扫描图像表格语义解析方法与系统 | |
CN112307919B (zh) | 一种基于改进YOLOv3的单证图像中数字信息区域识别方法 | |
CN111626292B (zh) | 一种基于深度学习技术的楼宇指示标识的文字识别方法 | |
CN111626249B (zh) | 题目图像中几何图形的识别方法、装置和计算机存储介质 | |
CN116468640B (zh) | 一种用于互联网教学的视频图像增强方法 | |
CN110689003A (zh) | 低照度成像车牌识别方法、系统、计算机设备及存储介质 | |
CN107609482B (zh) | 一种基于汉字笔画特征的中文文本图像倒置判别方法 | |
CN111832497B (zh) | 一种基于几何特征的文本检测后处理方法 | |
CN112926571A (zh) | 一种基于深度学习的公式图片识别判题系统 | |
CN110766001B (zh) | 基于cnn和rnn的银行卡卡号定位与端到端识别方法 | |
CN113139535A (zh) | 一种ocr文档识别方法 | |
CN110298236B (zh) | 一种基于深度学习的盲文图像自动识别方法和系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |