CN111898545B - 一种基于机器学习的智能阅卷系统及方法 - Google Patents

一种基于机器学习的智能阅卷系统及方法 Download PDF

Info

Publication number
CN111898545B
CN111898545B CN202010758021.5A CN202010758021A CN111898545B CN 111898545 B CN111898545 B CN 111898545B CN 202010758021 A CN202010758021 A CN 202010758021A CN 111898545 B CN111898545 B CN 111898545B
Authority
CN
China
Prior art keywords
marking
image
positioning
card
area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010758021.5A
Other languages
English (en)
Other versions
CN111898545A (zh
Inventor
李剑
赵春波
谢真珍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
New Three Technologies Co ltd
Original Assignee
New Three Technologies Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by New Three Technologies Co ltd filed Critical New Three Technologies Co ltd
Priority to CN202010758021.5A priority Critical patent/CN111898545B/zh
Publication of CN111898545A publication Critical patent/CN111898545A/zh
Application granted granted Critical
Publication of CN111898545B publication Critical patent/CN111898545B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/30Writer recognition; Reading and verifying signatures
    • G06V40/33Writer recognition; Reading and verifying signatures based only on signature image, e.g. static signature recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Medical Informatics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

一种基于机器学习的智能阅卷系统,其特征在于:该智能阅卷系统包括:学生端、服务器端和教师端;服务器端和学生端以及教师端通过网络连接,实现双向数据传输。其中,服务器端包括:图像处理模块、文字识别模块、训练模块、存储模块、中央控制模块和通讯模块。

Description

一种基于机器学习的智能阅卷系统及方法
技术领域
本发明涉及教育服务领域,是一种基于机器学习的智能阅卷系统及方法。
背景技术
随者教育事业的不断发展,数据应用技术不断进步,社会对教育变革的需求增大,家长越来越关注孩子的有效学习,作业是有效学习的载体。目前家校沟通的方式基本依靠电话或微信、QQ等通信应用软件,这只能完成简单的通知下发、布置、批改作业功能,难以留下有效的数据链,进行学生学情分析。然而,学生的学习评价数据可以有效量化学生的学习过程,有效对学情进行诊断与预警。而作业是学生日常的学习数据的一部分,对作业数据的分析能够提前发现学生存在的知识点和能力点上的问题,并给予纠正,从而更有效提升学业成绩。日常作业纸质化,教师花费大量时间批阅却无法形成数据链,更无法精准对学生进行量化分析,了解错因的逻辑关系。
随者智能阅卷系统的需求逐渐增加,市场上出现了一些智能阅卷系统。专利CN1598845A公开了一种用于主观题的网上阅卷方法,其包括以下步骤:答题卡扫描录入、图像切割与分发、主观题计算机辅助评分及误差控制、分数合成与转换。效地控制了主观题的阅卷误差,从而最大程度地实现阅卷过程的公平、公正;且对于问题卷采取特殊的处理方式,因此可避免误判,从而保障了考生的利益。专利CN106296513A公开了一种网上扫描评阅系统,其包括:接收模块,用于接收以图片形式显示的考生答卷信息;在线阅卷模块,至少用于根据所述考生答卷信息对所述考生答卷进行阅卷处理以及用于对已经过阅卷处理的所述考生答卷信息进行分类统计分析,并生成相应的数据分析报告。基于评卷的公正性要求,准确性要求,高效率要求,教学管理信息化要求,将教师从繁重的考试阅卷与统计分析工作中解脱出来,并有效地确保阅卷质量,大幅度地减轻了教师的负担,提高3-5倍的工作效率。
但是,目前市面上出现的都是考试阅卷系统,其存在以下问题:1)标准化程度过高,过程繁杂,无疑给繁杂的课业负担继续增负,因而无法实现常态化。2)现有的考试阅卷系统都是通过条形码进行学生身份等识别,从环保条形码不很难在短时间内降解,不利于我们的环境保护,从经济的角度看,条形码的印制增加了学校的日常开支。3)对于文字识别的准确率较低,造成全自动阅卷的误差几率高;4)对于采集的答题纸图像质量无法进行预先和准确的判断,造成上传至服务器或者教师端后无法进行判卷,而反馈,造成了系统的负担。
综上所述,需要提供一种学生填写方便,适合常态化应用,节约阅卷过程中物资(如条码,作业纸),有较高的文字识别准确性的便于实现,并且能够节约系统间图像传送通讯资源的自动化或者半自动化阅卷的基于机器学习的智能阅卷系统及方法。
发明内容
本发明所要解决的技术问题是目前市面上出现的考试阅卷系统,存在以下问题:1)标准化程度过高,过程繁杂,无疑给繁杂的课业负担继续增负,因而无法实现常态化。2)现有的考试阅卷系统都是通过条形码进行学生身份等识别,从环保条形码不很难在短时间内降解,不利于我们的环境保护,从经济的角度看,条形码的印制增加了学校的日常开支。3)对于文字识别的准确率较低,造成全自动阅卷的误差几率高;4)对于采集的答题纸图像质量无法进行预先和准确的判断,造成上传至服务器或者教师端后无法进行判卷,而反馈,造成了系统的负担。
本发明解决其技术问题所采取的技术方案是:
一种基于机器学习的智能阅卷系统,该智能阅卷系统包括:学生端、服务器端和教师端;服务器端和学生端以及教师端通过网络连接,实现双向数据传输。其中,服务器端包括:图像处理模块、文字识别模块、训练模块、存储模块、中央控制模块和通讯模块。
进一步的,学生端包括作业卡、图像采集模块、图像质量判断模块和通讯模块。
进一步的,教师端包括图像展示模块、评分模块和通讯模块。
进一步的,作业卡包括定位块、阅卷区域定位、学生身份代码、学生姓名填写区、答案填涂区、答案填写区、教师批改区、作业卡识别区。
进一步的,该图像展示模块为显示屏或者触摸屏。
进一步的,中央控制模块,用于接受其他各个模块的操作信息,并控制各个模块进行相应的必要操作,并根据教师评分的图像进行作业卡得分的计算。
根据所述的基于机器学习的智能阅卷系统的智能阅卷方法,该方法包括:
第一步,通过学生端的图像采集模块对于作业卡图像进行采集;
第二步,利用学生端的图像质量判断模块对于缓存中存入的作业卡图像进行质量判断;
第三步,作业卡图像处理;
第四步,学生身份识别;
第五步,确定作业卡名称以及判卷类型;
第六步,进行作业卡的区域分割;
第七步,进行自动判卷区的文字识别;
第八步,进行人工判卷区的阅卷;
第九步,提取成绩。
本发明提供的一种基于机器学习的智能阅卷系统及方法,具有适合常态化应用,节约阅卷过程中物资(如条码,作业纸),有较高的文字识别准确性的便于实现,并且能够节约系统间图像传送通讯资源的优点。
附图说明
图1为本发明提供的一种基于机器学习的智能阅卷系统的架构示意图。
图2为本发明提供的一种基于机器学习的智能阅卷系统所使用的作业卡的样式图。
具体实施方式
以下将对本发明的一种基于机器学习的智能阅卷系统及方法作进一步的详细描述。
下面将参照附图对本发明进行更详细的描述,其中表示了本发明的优选实施例,应该理解本领域技术人员可以修改在此描述的本发明而仍然实现本发明的有益效果。因此,下列描述应当被理解为对于本领域技术人员的广泛知道,而并不作为对本发明的限制。
为了清楚,不描述实际实施例的全部特征。在下列描述中,不详细描述公知的功能和结构,因为它们会使本发明由于不必要的细节而混乱。应当认为在任何实际实施例的开发中,必须作出大量实施细节以实现开发者的特定目标。
如图1所示,本申请提供的一种机器学习的智能阅卷系统包括:学生端、服务器端和教师端;服务器端和学生端以及教师端通过网络连接,实现了数据的双向传输。
其中,学生端包括配套使用的作业卡、图像采集模块、图像质量判断模块和通讯模块。
其中,配套使用的作用卡如图2所示,该作业卡包括定位块1,用于定位试卷图像的方位;阅卷区域定位2,用于系统智能切分阅卷区域;学生身份代码3,用于通过人工智能技术,自动识别出学生的信息;学生姓名填写区,用于方便二次校对学生身份;答案填涂区5,用于机器自动识别;而且不需要额外的答题卡,更加环保节约;答案填写区6,用于学生利用文字填写答案,并利用机器自动切割后,提交给相应的老师批改;教师批改区7,用于老师也可以直接在相应区域进行标识,如打勾、叉等标记,服务器根据既定规则机器自动识别结果,并自动统计数据;作业卡识别区,其包括定位块以及作业卡名称,用于服务器根据定位块定位该作业卡名称区域,并通过机器识别方式确定该作业卡的名称,从而方便查找相关信息,例如:于该作业卡对应的预存的答案等。
图像采集模块,包括摄像头等设备,用于在学生进行作业卡答卷后,通过摄像头采集该作业卡的信息,并存入缓存。
图像质量判断模块,用于判断本次采集的作业卡图像是否符合采集标准,如果符合采集标准,则将图像通过通讯模块发送到服务器端,如果不符合采集标准,则反馈重新采集图像。
通讯模块,用于将图像采集模块采集的作业卡的图像文件,上传至服务器端,准备进行批改。
服务器端包括图像处理模块、文字识别模块快、训练模块、存储模块、中央控制模块和通讯模块。
其中,图像处理模块用于将通过通讯模块接受的图像文件信息导入后,通过定位块进行作业卡图像的方位定位,即将作业卡图像调整至适当的位置和方向后,通过作业卡上的各个定位标记,采集学生身份、答题结果和作业卡名称等信息,并将其传送给存储模块,并通知中央控制模块图像处理完成。
文字识别模块是在中央控制模块的控制下读取存储模块中的由图像处理模块存入的学生身份、答题结果和作业卡名称等文字信息,并根据训练模块中提供的相应的文字识别训练模型来识别学生身份、答题结果和作业卡名称等文字信息。
训练模块,用于通过收集大量的中国人的数字手写笔迹,对文字识别模块需要的识别训练模型进行训练。该训练包括两部分,一部分为通用训练模型,即对于大量中文手写数据进行通用的普适的文字识别训练,第二部分为针对用于的文字识别训练,这部分训练通过用户单体使用本申请提供的基于机器学习的智能阅卷系统时进行采集,并存入存储模块,作为针对特定用于的针对性文字识别训练。通过上述训练,训练模块,建立多种针对性的文字识别训练模型,包括:通用文字识别训练模型以及针对各个已创建的用户的训练模型。通过针对性的训练,提高了本申请文字识别的准确性。
存储模块,包括图像缓存部分,文字识别素材库和作业卡信息存储部分。其中,图像缓存部分用于缓存通讯模块接受的作业卡图像信息或者教师批改作业卡图像信息,以及经由图像处理模块处理后的各个图像信息。文字识别素材用于存储通用的中文手写笔迹训练素材以及已创建的用户的手写笔迹训练素材,并将上述已创建的用户的手写笔迹训练素材按照不同所属用户进行分类存储。作业卡信息存储部用于存储已知的作业卡名称以及相应的答案。
中央控制模块,用于接受其他各个模块的操作信息,并控制各个模块进行相应的必要操作,并根据教师评分的图像进行作业卡得分的计算。
通讯模块用于接受学生端或教师端发送的图像信息等。
教师端包括图像展示模块、评分模块和通讯模块。其中,图像展示模块,用于将接受到的学生作业卡向教师提供展示,该图像展示模块可以显示屏或者触摸屏。评分模块,用于作业卡图像以及合成教师在图像展示模块展示的作业开图像的基础上在教师批改区7进行批改的结果。通讯模块用于将带有教师批改结果的合成图像发送给服务器端。
本申请根据上述基于机器学习的智能阅卷系统,还提供了一种基于机器学习的智能阅卷方法,该方法包括:
第一步,通过学生端的图像采集模块对于作业卡图像进行采集。
具体包括:学生在学生端填涂、填写作业卡后,通过图像采集模块采集上述作业卡图像,将上述作业卡图像存入学生端的缓存中。
第二步,利用学生端的图像质量判断模块对于缓存中存入的作业卡图像进行质量判断。具体包括如下步骤:
1)建立作业卡图像的二维坐标,例如:可以将一张作业卡的几何中心设定为0点,横向定义为x轴,纵向定义为y轴,作业卡图像的任何一点的坐标为(x,y)。x轴,y轴的一个单位长度为一个像素的在相应方向的尺寸。
2)捕捉作业卡图像的焦点数据,通过图像的后台数据获取作业卡图像的拍摄的至少一个焦点位置,并且将该上述至少一个焦点位置映射到作业卡图像的坐标系中,并获得该焦点位置在坐标系中相应的坐标(xfi,yfi),其中,i表示焦点的编号,在多焦点拍摄模式中i根据多焦点的编号取值1,2,……。如果为单一焦点拍摄模式,i=1。
3)在作业卡图像中识别作业卡图像中的多个阅卷区域定位2标志,并确定至少一个焦点位置距离最近的至少一个阅卷区域定位2标志和与至少一个焦点位置距离最远的至少一个阅卷区域定位2标志图像覆盖的像素的坐标位置。
具体包括:首先二值化处理作业卡图像,采用全局阈值方法来提取作业卡的粗处理图像,将作业卡图像转换为粗处理以后的黑白二元图像。在作业卡图像转换为粗处理以后的黑白二元图像内,通过图形识别方法识别多个阅卷区域定位2标志。
针对多个被识别的阅卷区域定位2标志,确定该被识别的阅卷区域定位2标志的坐标位置,该坐标定义为该阅卷区域定位2标志的几何中心的坐标。提取多个被识别的阅卷区域定位2标志的几何中心坐标。
在原始作业卡图像中找到相应的多个识别的阅卷区域定位2标志几何中心坐标,即在原始作业卡图像中查询到多个识别的阅卷区域定位2标志的坐标。根据多个识别的阅卷区域定位2标志的坐标,在原始作业卡图像中获得与至少一个焦点位置距离最近的至少一个阅卷区域定位2标志和与至少一个焦点位置距离最远的至少一个阅卷区域定位2标志。
以至少一个焦点位置距离最近的至少一个阅卷区域定位2标志和与至少一个焦点位置距离最远的至少一个阅卷区域定位2标志几何中心坐标出发,识别该几何中心周围的连续排布的灰度不为0的像素(即阅卷区域定位2标志图像覆盖的所有像素),并确定至少一个焦点位置距离最近的至少一个阅卷区域定位2标志和与至少一个焦点位置距离最远的至少一个阅卷区域定位2标志图像覆盖的像素的坐标位置。
4)判断该作业卡图像是否符合图像采集标准,如果不符合图像采集标准则在学生端提示重新采集图像,并随后执行步骤1),如果符合图像采集标准,则将该符合图像采集标准的作业卡图像传送至服务器端。
针对至少一个焦点位置距离最近的至少一个阅卷区域定位2标志和与至少一个焦点位置距离最远的至少一个阅卷区域定位2标志中的每一个,提取该阅卷区域定位2标志图像覆盖的像素的坐标和灰度值。分别形成灰度函数G(x,y),并且根据该灰度函数计算灰度梯度函数g(x,y)。其中,
Figure BDA0002612208770000071
根据该阅卷区域定位2标志图像覆盖的像素的坐标位置,确定该覆盖的像素的坐标的中心区域和边缘区域,其中边缘区域为在一个阅卷区域定位2标志图像覆盖的像素中,周边存在无像素区域的临界像素,以及从该临界像素坐标到该阅卷区域定位2标志图像的几何中心坐标连线经过的像素中,从最靠近临界像素出发向几何中心方向上顺序排列的w个边缘像素,w通常取值为10-20,由临界像素和边缘像素一同构成了边缘区域。其余像素为中心区域像素。当在该覆盖的像素的中心区域像素的灰度梯度大于第一预定阈值并且边缘区域像素的灰度梯度函数的值小于第二阈值时,判定该阅卷区域定位2标志不符合图像采集标准,否则判定该该阅卷区域定位2标志符合图像采集标准。
当图像采集焦点为一个时,如果与该焦点距离最近的至少一个阅卷区域定位2标志和与该焦点位置距离最远的至少一个阅卷区域定位2标志至少一个不符合图像采集标准,则判定该作业卡图像不符合采集标准,否则判定该作业卡图像为符合标准。当图像采集焦点为多个时,如果与任意一个焦点距离最近的至少一个阅卷区域定位2标志和与该焦点位置距离最远的至少一个阅卷区域定位2标志均不符合图像采集标准或者存在两个或者两个以上的焦点,与上述两个或者两个以上焦点距离最近的阅卷区域定位2标志均不符合采集标准,则判定该作业卡图像不符合采集标准,否则判定为符合标准。
具体的,针对至少一个焦点位置距离最近的至少一个阅卷区域定位2标志第一预定阈值取值在150-180灰度单位之间,第二预定阈值取值在15-25灰度单位之间;而针对与至少一个焦点位置距离最远的至少一个阅卷区域定位2标志,其第一预定阈值与至少一个焦点位置距离最近的至少一个阅卷区域定位2标志的第一预定阈值取值相同,即也为150-180灰度单位之间,而其第二预定阈值是至少一个焦点位置距离最远的至少一个阅卷区域定位2标志的第二预定阈值的1/2-1/3,即取值为75-60灰度单位之间。
通过上述图像采集质量判断过程,能够在学生端预先判断采集的图像是否存在识别缺陷,避免不满足识别质量的图片在系统间往复传送,造成系统通讯资源的浪费。此外,上述质量判断的过程设计合理,首先通过原始图像的二值化处理图像确定特定标记位置,在将上述位置对应到原始图像中,并采集相应位置的连续灰度非零像素,获得了原始图像中的相应标记的原始图像。并且计算该原始图像的灰度变化情况,随后判断原始图像内部的灰度变化没有明显突变,即判断标记内部无由于图像采集不佳、虚影造成的图像内部灰度突然降低的情况,并且判断在原始图像边缘的灰度变化是否锐利,不够锐利即灰度变化过小。当边缘判断和内部判断条件均不满足的情况下判定该图像不符合标准。并且上述计算方法考虑到了图像采集是焦点位置对于图像的影响,在计算时对于焦点距离以及焦点个数的影响都进行了考虑提高了判断的准确性。
第三步,作业卡图像处理。
具体包括:服务器端的通讯模块接受到作业卡图像,并将上述图像存储存储模块。中央控制模块控制图像处理模块对于上述作业卡图像进行处理,包括:
1)通过定位块进行作业卡图像的方位定位,即通过图像识别技术识别正方形定位块,通过计算该定位块各条边的倾斜角度,计算作业卡图像的倾斜调度,并通过旋转进行补偿,将作业卡图像调整至适当的方向;
2)通过作业卡上的各个定位标记,将学生身份图像、答题结果图像和作业卡名称图像进行裁剪,并将其传送给存储模块,并通知中央控制模块图像处理完成。
第四步,学生身份识别。
文字识别模块通过图像采集模块处理的学生信息内容(包括学生编码和学生姓名),进行文字识别,通过分别识别学生编码和学生姓名,再将两个信息的关联正确性进行判断后,最终确定学生身份。具体包括:1)文字识别模块识别学生编码,2)文字识别模块识别学生姓名,3)发送至中央控制器判断学生编码和学生姓名是否在存储模块的学生预存信息中是关联的(即归属于同一个用户);4)如果是关联的,则成功辨别用户身份;如果不是关联的,通过通讯模块反馈给学生端,用于确认学生身份。
第五步,确定作业卡名称以及判卷类型。
文字识别模块通过图像采集模块处理的作业卡名称信息,进行文字识别识该作业卡的名称,中央控制模块根据该作业卡名称在存储器的作业卡信息存储部分进行查找,如果该存储器的作业卡信息存储部分存储了该答题卡的全部或者部分标准化答案,则将该作业卡判卷类型设定为全部或者部分自动化判卷,如果该存储器的作业卡信息存储部分没有存储该答题卡的全部或者部分标准化答案,则将该作业卡的判卷类型设定为人工判卷。
第六步,进行作业卡的区域分割。
中央控制模块根据作业卡的判卷类型控制图像处理模块对于作业卡的图像进行区域分割,对于全部自动化或者人工判卷的情况,图像处理模块对于作业卡的区域分割仅仅进行题目部分和答案部分的分割。而对于半自动化判卷的情况,图像处理模块根据阅卷区域定位2首先将自动阅卷的区域和人工阅卷的区域进行分割后,在分别对自动阅卷的区域和人工阅卷的区域进行题目和答案部分的分割。
第七步,进行自动判卷区的文字识别。
中央控制模块根据判断的用户身份在存储模块中查询与该用户对应的文字识别训练模型或者通用文字识别训练模型,如果存储模块中存在与用户对应的文字库,如果存在则根据通用文字素材和用户自身的文字素材对于文字识别进行训练,通过搭建卷积神经网络实现针对特定用户的文字识别训练。如果不存在与用户对应的文字库,则直接按照通用文字识别训练模型来识别文字。下面分别介绍两种文字识别的模型。
对于通用文字识别训练模型,通过搭建卷积神经网络来实现。其卷积神经网络由六个层卷积组成,其中每个卷积层后接着激活层、池化层、全连接层和输出层。其中,对于通用文字识别训练模型的训练数据为通用的中文手写笔迹训练素材,其神经网络的激活函数为F(x)。
Figure BDA0002612208770000101
采用上述神经网络训练方法能够降低通用文字识别训练的计算量,并解决了训练的梯度问题。
对于针对特定用户的文字识别训练模型,其训练素材为通用文字素材和用户自身的文字素材。该训练通过卷积神经网络实现,该卷积神经网络由六个层卷积组成,其中每个卷积层后接着激活层、池化层、全连接层和输出层。其神经网络的激活函数为F‘(x)。
Figure BDA0002612208770000102
采用上述激活函数的神经网络模型具有较好的非线性的学习能力,适于针对文本量并不庞大的针对特定用户的文本数据训练。
通过上述再训练模型对于自动判卷区的文字进行识别。中央控制模块通过答题填涂区域的填涂标志以及答案填写区域中经由文字识别的答案进行自动判卷区域的判卷,并计算,记录分数。
中央控制器将该用户的本次文字采集数据,存入存储器中相应的位置,本次采集的文字数据作为下一次该用户对应的文字识别训练模型的部分训练素材。
第八步,进行人工判卷区的阅卷。
通过通讯模块将人工判卷区域的图像发送给教师端,并提醒教师端进行判卷。教师通过教师端的图像展示模块获得上述人工判卷区域的图像,并通过评分模块在教师批改区7进行对人工判卷区域内题目答案的批改,具体批改方式可以进行特定的标记,例如正确标记,错误标记等。
第九步,提取成绩
评分模块将批改标记和作业卡图像结合后,通过通讯模块发送给服务器端。服务器端的图像处理模块提取上述师批改区7的相应标记,并由中央控制模块进行批改结果的汇总和成绩的计算。并通过通讯模块,将上述批改结果和成绩发送给学生端和教师端。
本申请提供的基于机器学习的智能阅卷系统及方法具有以下优势:
(1)采集大量的中国人的数字手写笔迹,通过机器学习的方法,准确识别学生手写的身份代码(学号、准考证号等),解决现有技术中的考试阅卷系统通过条形码进行学生身份等识别,从环保上,条形码很难在短时间内降解,不利于环境保护;从经济的角度看,条形码的印制增加了学校的日常开支。
(2)将作业与答题卡的二合一,学生直接在作业上填涂,机器自动识别。而且不需要额外的答题卡,更加环保节约,便于直观对照题目与答案,解决现有技术中将题目部分纸张与答题部分纸张分开,浪费纸张与不便直观看到每一道题的题面。
(3)对于特定用户进行文字识别训练模型的再训练,提高了文字识别的准确性以及判卷结论的准确性。
(4)通过学生端对于作业卡图像质量的预判断,降低了向系统内部传送不符合识别标准的作业卡图像造成的系统通讯负担。此外,通过坐标化作业卡图像,并通过坐标位置判断图像边缘区域和中心区域,并根据中心区域和边缘区域的灰度变化率来进行质量的判断。不仅简化了边缘识别和质量判断的计算方法,而且也提高了判断的准确性。
本发明提供的一种基于机器学习的智能阅卷系统及方法,具有适合常态化应用,节约阅卷过程中物资(如条码,作业纸),有较高的文字识别准确性的便于实现,并且能够节约系统间图像传送通讯资源的优点。
为使本发明的目的、特征更明显易懂,下面结合附图对本发明的具体实施方式作进一步的说明。需要说明的是,附图均采用非常简化的形式且均使用非精准的比率,仅用一方便、清晰地辅助说明本发明实施例的目的。
以上显示和描述了本发明的基本原理、主要特征和优点,因此以上所述仅为本发明的实施例。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是本发明的原理,在不脱离本发明精神和范围的前提下,本发明还包括各种等效变化和改进,这些变化和改进都将落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其效物界定。

Claims (6)

1.一种基于机器学习的智能阅卷系统,其特征在于:该智能阅卷系统包括:学生端、服务器端和教师端;服务器端和学生端以及教师端通过网络连接,实现双向数据传输;其中,服务器端包括:图像处理模块、文字识别模块、训练模块、存储模块、中央控制模块和通讯模块,该系统的智能阅卷方法,包括:
第一步,通过学生端的图像采集模块对于作业卡图像进行采集;
第二步,利用学生端的图像质量判断模块对于缓存中存入的作业卡图像进行质量判断;具体包括如下步骤:
1)建立作业卡图像的二维坐标,将一张作业卡的几何中心设定为0点,横向定义为x轴,纵向定义为y轴,作业卡图像的任何一点的坐标为(x,y),x轴,y轴的一个单位长度为一个像素的在相应方向的尺寸;
2)捕捉作业卡图像的焦点数据,通过图像的后台数据获取作业卡图像的拍摄的至少一个焦点位置,并且将该上述至少一个焦点位置映射到作业卡图像的坐标系中,并获得该焦点位置在坐标系中相应的坐标(xfi ,yfi ),其中,i表示焦点的编号,在多焦点拍摄模式中i根据多焦点的编号取值1,2,……,如果为单一焦点拍摄模式,i=1;
3)在作业卡图像中识别作业卡图像中的多个阅卷区域定位2标志,阅卷区域定位2标志为作业卡边缘定位标志,并确定至少一个焦点位置距离最近的至少一个阅卷区域定位2标志和与至少一个焦点位置距离最远的至少一个阅卷区域定位2标志图像覆盖的像素的坐标位置;
具体包括:首先二值化处理作业卡图像,采用全局阈值方法来提取作业卡的粗处理图像,将作业卡图像转换为粗处理以后的黑白二元图像,在作业卡图像转换为粗处理以后的黑白二元图像内,通过图形识别方法识别多个阅卷区域定位2标志;
针对多个被识别的阅卷区域定位2标志,确定该被识别的阅卷区域定位2标志的坐标位置,该坐标定义为该阅卷区域定位2标志的几何中心的坐标,提取多个被识别的阅卷区域定位2标志的几何中心坐标;
在原始作业卡图像中找到相应的多个识别的阅卷区域定位2标志几何中心坐标,即在原始作业卡图像中查询到多个识别的阅卷区域定位2标志的坐标,根据多个识别的阅卷区域定位2标志的坐标,在原始作业卡图像中获得与至少一个焦点位置距离最近的至少一个阅卷区域定位2标志和与至少一个焦点位置距离最远的至少一个阅卷区域定位2标志;
以至少一个焦点位置距离最近的至少一个阅卷区域定位2标志和与至少一个焦点位置距离最远的至少一个阅卷区域定位2标志几何中心坐标出发,识别该几何中心周围的连续排布的灰度不为0的像素,并确定至少一个焦点位置距离最近的至少一个阅卷区域定位2标志和与至少一个焦点位置距离最远的至少一个阅卷区域定位2标志图像覆盖的像素的坐标位置;
4)判断该作业卡图像是否符合图像采集标准,如果不符合图像采集标准则在学生端提示重新采集图像,并随后执行步骤1)-4),如果符合图像采集标准,则将该符合图像采集标准的作业卡图像传送至服务器端;
判断该作业卡图像是否符合图像采集标准,具体包括:针对至少一个焦点位置距离最近的至少一个阅卷区域定位2标志和与至少一个焦点位置距离最远的至少一个阅卷区域定位2标志,提取该阅卷区域定位2标志图像覆盖的像素的坐标和灰度值,形成灰度函数G(x,y),并且根据该灰度函数计算灰度梯度函数g(x,y),其中,
Figure DEST_PATH_IMAGE002
根据该阅卷区域定位2标志图像覆盖的像素的坐标位置,确定该覆盖的像素的坐标的中心区域和边缘区域,其中边缘区域为在一个阅卷区域定位2标志图像覆盖的像素中,周边存在无像素区域的临界像素,以及从该临界像素坐标到该阅卷区域定位2标志图像的几何中心坐标连线经过的像素中,从最靠近临界像素出发向几何中心方向上顺序排列的w个边缘像素,w取值为10-20,由临界像素和边缘像素一同构成了边缘区域,其余像素为中心区域像素,当在该覆盖的像素的中心区域像素的灰度梯度大于第一梯度预定阈值并且边缘区域像素的灰度梯度函数的值小于第二梯度预定阈值时,判定该阅卷区域定位2标志不符合图像采集标准,否则判定该阅卷区域定位2标志符合图像采集标准;
当图像采集焦点为一个时,如果与该焦点距离最近的至少一个阅卷区域定位2标志和与该焦点位置距离最远的至少一个阅卷区域定位2标志至少一个不符合图像采集标准,则判定该作业卡图像不符合采集标准,否则判定该作业卡图像为符合标准,当图像采集焦点为多个时,如果与任意一个焦点距离最近的至少一个阅卷区域定位2标志和与该焦点位置距离最远的至少一个阅卷区域定位2标志均不符合图像采集标准或者存在两个或者两个以上的焦点,与上述两个或者两个以上焦点距离最近的阅卷区域定位2标志均不符合采集标准,则判定该作业卡图像不符合采集标准,否则判定为符合标准;
具体的,针对至少一个焦点位置距离最近的至少一个阅卷区域定位2标志第一距离预定阈值取值在150-180灰度单位之间,第二距离预定阈值取值在15-25灰度单位之间;而针对与至少一个焦点位置距离最远的至少一个阅卷区域定位2标志,其第一预定阈值与至少一个焦点位置距离最近的至少一个阅卷区域定位2标志的第一预定阈值取值相同,即也为150-180灰度单位之间,而其第二预定阈值取值为75-60灰度单位之间;
第三步,作业卡图像处理;
第四步,学生身份识别;
第五步,确定作业卡名称以及判卷类型;
第六步,进行作业卡的区域分割;
第七步,进行自动判卷区的文字识别;
第八步,进行人工判卷区的阅卷;
第九步,提取成绩。
2.根据权利要求1所述基于机器学习的智能阅卷系统,其特征在于:学生端包括作业卡、图像采集模块、图像质量判断模块和通讯模块。
3.根据权利要求2所述基于机器学习的智能阅卷系统,其特征在于:教师端包括图像展示模块、评分模块和通讯模块。
4.根据权利要求2所述基于机器学习的智能阅卷系统,其特征在于:作业卡包括定位块、阅卷区域定位、学生身份代码、学生姓名填写区、答案填涂区、答案填写区、教师批改区、作业卡识别区。
5.根据权利要求3所述基于机器学习的智能阅卷系统,其特征在于:该图像展示模块为显示屏或者触摸屏。
6.根据权利要求1所述基于机器学习的智能阅卷系统,其特征在于:中央控制模块,用于接受其他各个模块的操作信息,并控制各个模块进行相应的必要操作,并根据教师评分的图像进行作业卡得分的计算。
CN202010758021.5A 2020-07-31 2020-07-31 一种基于机器学习的智能阅卷系统及方法 Active CN111898545B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010758021.5A CN111898545B (zh) 2020-07-31 2020-07-31 一种基于机器学习的智能阅卷系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010758021.5A CN111898545B (zh) 2020-07-31 2020-07-31 一种基于机器学习的智能阅卷系统及方法

Publications (2)

Publication Number Publication Date
CN111898545A CN111898545A (zh) 2020-11-06
CN111898545B true CN111898545B (zh) 2021-10-22

Family

ID=73182776

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010758021.5A Active CN111898545B (zh) 2020-07-31 2020-07-31 一种基于机器学习的智能阅卷系统及方法

Country Status (1)

Country Link
CN (1) CN111898545B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113807308A (zh) * 2021-09-28 2021-12-17 腾讯科技(深圳)有限公司 作业批改方法、装置、设备、存储介质和计算机程序产品

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106781784A (zh) * 2017-01-04 2017-05-31 王骁乾 一种智能批改系统
CN107886794A (zh) * 2017-11-12 2018-04-06 天津祎智教育科技有限公司 一种可实现在线辅导的学生作业批改系统
CN109669264A (zh) * 2019-01-08 2019-04-23 哈尔滨理工大学 基于灰度梯度值的自适应自动聚焦方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105224920A (zh) * 2015-09-16 2016-01-06 华中师范大学 一种将线下转入线上的学习测试诊断系统
CN105374246A (zh) * 2015-12-15 2016-03-02 闫健 一种基于互联网的互动式全景作业系统的实现方法
CN108734613A (zh) * 2018-06-08 2018-11-02 江苏昕宁数字科技有限公司 多端线下及线上互动教育系统、方法及装置
US10554914B1 (en) * 2018-08-10 2020-02-04 Apple Inc. Adjusting confidence values for correcting pixel defects
CN110277000A (zh) * 2019-07-03 2019-09-24 南京红松信息技术有限公司 一种作业或试卷的在线手工批阅和订正系统及方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106781784A (zh) * 2017-01-04 2017-05-31 王骁乾 一种智能批改系统
CN107886794A (zh) * 2017-11-12 2018-04-06 天津祎智教育科技有限公司 一种可实现在线辅导的学生作业批改系统
CN109669264A (zh) * 2019-01-08 2019-04-23 哈尔滨理工大学 基于灰度梯度值的自适应自动聚焦方法

Also Published As

Publication number Publication date
CN111898545A (zh) 2020-11-06

Similar Documents

Publication Publication Date Title
CN108171297B (zh) 一种答题卡识别方法
CN109271945A (zh) 一种在线实现作业批改的方法和系统
CN110705534B (zh) 一种适用于电子助视器的错题本生成方法
CN110659584B (zh) 一种基于图像识别的智能留痕阅卷系统
CN104239866A (zh) 答题卡信息采集方法及设备
CN110085068A (zh) 一种基于图像识别的学习辅导方法及装置
CN111258433A (zh) 基于虚拟场景的教学互动系统
KR20190052410A (ko) 답안 일체형 시험지 및 답안 일체형 교재를 이용하는 자동 채점 시스템 및 그 방법
CN110490141A (zh) 一种填涂信息的识别方法、装置、终端及存储介质
CN111898545B (zh) 一种基于机器学习的智能阅卷系统及方法
KR20160139786A (ko) 증강현실을 이용한 학습문제풀이 시스템 및 그 제어방법
CN115546692A (zh) 一种远程教育数据采集分析方法、设备及计算机存储介质
CN108428073A (zh) 一种用于教师教学质量的智能评价系统
CN109284702B (zh) 一种基于图像模式的答题卷给分及阅卷系统
CN111126243A (zh) 一种图像数据检测方法、装置以及计算机可读存储介质
CN113159014A (zh) 基于手写题号的客观题批阅方法、装置、设备及存储介质
CN108681713A (zh) 一种用于教师教学质量评价的系统
CN116403218A (zh) 基于远程音视频互动的线上线下混合式教学管理系统
CN111563407B (zh) 模型训练方法、图片方向纠正方法及装置
CN111046883B (zh) 一种基于古钱币图像的智能评估方法及系统
CN113705438A (zh) 一种基于多种数据采集形式的考评、阅卷方法及系统
CN110555396A (zh) 智能练习册的阅卷方法、计算机可读存储介质和电子设备
CN114882504B (zh) 一种评分方法、装置、设备及可读存储介质
CN115620332B (zh) 一种基于纸质作业的自动批阅方法及设备
CN115273102A (zh) 手写文本工整度的评分方法、装置、设备和介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant