CN108764074A

CN108764074A - 基于深度学习的主观题智能阅卷方法、系统及存储介质

Info

Publication number: CN108764074A
Application number: CN201810455795.3A
Authority: CN
Inventors: 吕蕾; 胡克军; 刘良; 刘一良; 刘弘
Original assignee: Shandong Normal University
Current assignee: Shandong Normal University
Priority date: 2018-05-14
Filing date: 2018-05-14
Publication date: 2018-11-06
Anticipated expiration: 2038-05-14
Also published as: CN108764074B

Abstract

本发明公开了基于深度学习的主观题智能阅卷方法、系统及存储介质，包括：获取答题卡的图像；对所获取的图像进行预处理；利用OpenCV的图像分割处理对答题卡图像进行切分，切分为客观题的答题区域和主观题的答题区域；然后，采用OMR方式对客观题的答题区域进行识别；采用OCR方式对主观题的答题区域进行识别；将客观题和主观题的标准答案均录入到数据库中；所述主观题，包括：设有标准答案的主观题和没有标准答案的主观题；依次统计出客观题和主观题的分值。如果在阅卷过程中发现异常分值的试卷，则需要人工评阅干预，实现对异常试卷的纠偏处理。

Description

基于深度学习的主观题智能阅卷方法、系统及存储介质

技术领域

本发明涉及计算机辅助阅卷领域，尤其涉及基于深度学习的主观题智能阅卷方法、系统及存储介质。

背景技术

近年来，答题卡识别系统以及被社会熟知多年，一直在发展进步，随着大数据时代和云计算的到来，网上阅卷也根据需求逐渐改进和完善。目前主要包括传统的光学字符识别OCR(Optical Character Recognition)和光学标记识别OMR(Optical MarkRecognition)，它们是目前解决录入数据信息最有效的良好总手段，通过光学成像的方法，将图像中的数据信息输入到计算机中，并对图像中的信息进行有效识的识别过程。

OCR(Optical Character Recognition)方法：首先通过采集工具将待处理的信息或其他文档扫描录入；然后在此基础之上进行一定的图像处理；其次，根据相应的字符特征进行相应的识别；最后，生成计算机系统可以识别和处理的信息。在整个过程中，图像划分是一个关键的技术，文字识别及处理是该技术主要的应用对象。其优点是，在进行数据录入的时候，OCR被当作首选方案，OCR亦随着其应用范围的越来越广和计算机技术的快速发展越来越成熟。但是，虽然其在该领域有着广泛的应用，但其字符特征抽取步骤却很耗时，对于实时性要求高的场景来说，很难满足用户的实时性需求。

OMR(Optical Mark Recognition)方法：标记的识别是通过光学扫描的方式实现的，该技术要求标记必须以一定的形式呈现；然后，通过一系列的模/数转换将其所需表达的数据生成得到计算机系统可识别和处理的信息。在此流程中精确迅速的录入信息是其鲜明的特点。同时，OMR在实际应用中也有一些限制，信息卡上的“涂点”如果与电眼没有完全对齐的话，不能精确的识别，即在倾斜信息卡时不能精确的识别；折皱的信息卡不能识别；低印刷质量的纸张以及纸张本身质量不高的信息卡也不能识别；一定要按照规范填涂标记，否则识别效果会受到很大的影响。故在实际应用环境下，信息卡在扫描仪扫描成像，有倾斜时会出现识别出错的情况。

发明内容

针对现有技术中存在的不足，本发明提供了基于深度学习的主观题智能阅卷方法、系统及存储介质，依托互联网和云计算技术，通过大数据分析，为学校用户提供更加真实的考试分析数据、为学生家庭用户提供更具有参考价值的个性化考试分析报告，最终达到提高学生学业水平、减轻教师负担、提高教师学生教与学效率。

作为本发明的第一方面，提供了基于深度学习的主观题智能阅卷方法；

基于深度学习的主观题智能阅卷方法，包括：

步骤(1)：获取答题卡的图像；

步骤(2)：对所获取的图像进行预处理；利用OpenCV的图像分割处理对答题卡图像进行切分，切分为客观题的答题区域和主观题的答题区域；然后，采用OMR方式对客观题的答题区域进行识别；采用OCR方式对主观题的答题区域进行识别；

步骤(3)：将客观题和主观题的标准答案均录入到数据库中；所述主观题，包括：设有标准答案的主观题和没有标准答案的主观题；

针对客观题，利用客观题的答题内容与客观题标准答案的匹配结果，实现对客观题的评阅，统计出客观题的分值；

针对设有标准答案的主观题，利用OCR文字识别方法对图像中的文字进行识别，利用关键词匹配方式将答题区域的文字与标准答案进行匹配，实现对设有标准答案的主观题的评阅，统计出设有标准答案的主观题的分值；

针对没有标准答案的主观题，先通过人工设置试卷特征，再通过深度学习训练好一个卷积神经网络模型，利用训练好的卷积神经网络模型，实现对没有标准答案的主观题的评阅，统计出没有标准答案的主观题的分值范围；

步骤(4)：如果在阅卷过程中发现异常分值的试卷，则需要人工评阅干预，实现对异常试卷的纠偏处理。

作为本发明的进一步改进，所述步骤(1)的答题卡为通用答题卡或自制的统一模板答题卡；获取答题卡的图像的方式为扫描或拍照。

作为本发明的进一步改进，所述步骤(2)的采用OMR方式对客观题的答题区域进行识别，包括：

步骤(201)：对客观题的答题区域进行灰度和二值化处理；

步骤(202)：对二值化处理的结果，采用双边滤波算法进行平滑处理；

步骤(203)：对经过平滑处理的图像，进行图像位置矫正处理。

作为本发明的进一步改进，所述步骤(2)的采用OCR方式对主观题的答题区域进行识别，包括：

步骤(211)：对主观题的答题区域进行灰度和二值化处理；

步骤(212)：对二值化处理结果进行图像位置矫正处理。

所述图像位置矫正处理：将经过平滑处理的图像进行投影，经过平滑处理的图像的边缘位置标记会在所投影的图像上生成相应的标记，根据标记确定待矫正图像的位置，根据待矫正图像边缘与标准水平方向或标准垂直方向相差的角度，将待矫正图像的位置进行旋转实现图像矫正。

作为本发明的进一步改进，所述步骤(3)的针对设有标准答案的主观题，利用关键词匹配方式将答题区域的内容与标准答案进行匹配，实现对设有标准答案的主观题的评阅，统计出设有标准答案的主观题的分值，是指：

步骤(301)：针对主观题标准答案，利用词库生成算法对长字符串进行切分处理，切分成若干个短字符串，然后，再将短字符串进行分割，生成标准词库；所述长字符串是指字符串长度超过设定阈值的字符串；所述短字符串是指字符串长度不超过设定阈值的字符串；

步骤(302)：针对答题区域的内容，首先去除空格和去除空行，然后，再以标点符号为依据，实现分句处理；

步骤(303)：对步骤(302)得到的分句处理结果，采用正向最大分词算法，将待分析的句子与专业名词库进行匹配，得到第一分词结果；然后再将与专业名词库匹配失败的内容与普通词典库进行匹配，得到第二分词结果；第一分词结果和第二分词结果合并为总的分词结果；

步骤(304)：关键词提取：将提取的关键词与标准词库进行匹配；计算匹配相似度；若匹配相似度大于设定阈值，则匹配成功；否则匹配失败，根据匹配结果，计算主观题答题区域的得分。

作为本发明的进一步改进，所述步骤(301)的具体步骤为：

步骤(3011)：针对标准答案，把长字符串分解成若干短字符串；

步骤(3012)：将标准答案依据单字字典，将得到的短字符串分割为单个的词序列；

步骤(3013)：若有新的标准答案录入，则返回步骤(3011)，否则，输出标准词库。

作为本发明的进一步改进，所述步骤(302)的具体步骤为：

步骤(3021)：判断待处理的字符串是否为空，如果字符串不为空，跳转到步骤(3022)；如果为空，直接结束；

步骤(3022)：提取字符串里最左边的一个字符，判断其是否为标点符号字符，如果不是跳转到步骤(3023)；如果是，跳转到步骤(3024)；

步骤(3023)：遍历下一个字符是否为标点符号字符，如果是，跳转到步骤(3024)；如果不是，重复执行步骤(3023)；

步骤(3024)：把当前字符串里的标点符号删除，将被删除的标点符号前面的字符串输出到指定数组，索引值加1，然后跳转到步骤(3021)。

作为本发明的进一步改进，所述步骤(303)的具体步骤为：

步骤(3031)：获取专业名词库中最长词的长度，设为n；

步骤(3032)：从步骤(302)得到的分句处理结果中的第一个字开始，从左到右提取n个字；

步骤(3033)：将提取的n个字，在专业名词库中进行匹配，若匹配成功，就将提取的n个字从分句处理结果中分割出来；

步骤(3034)：若匹配不成功，就将最后面的一个字去掉，再用余下的字重新在专业名词词库里匹配，若匹配成功，就将提取的字从分句处理结果中分割出来，否则，重复步骤(3034)，直到n＝0，转入步骤(3035)；

步骤(3035)：当n＝0时，取出没有在专业名词库中匹配成功的词，在普通词库中继续匹配；

步骤(3036)：当在普通词库中匹配成功时，将匹配成功的词从文本中分离出来，从文本里的第n+1字开始向后再取n个字，返回步骤(3033)；

步骤(3037)：当最后剩余字数不足n个时，就将剩余字里的最后面的一个字去除掉，再将剩余的字重新在普通词典库里匹配，重复步骤(3037)，直到剩余字数为1，查找结束，输出词串。

所述关键词提取的步骤如下：

步骤(3041)：遍历词串中的各个词，如果遍历至词的尾部，就结束；否则进入步骤(3042)；

步骤(3042)：判断待提取的词是否是实词，如果不是，返回至(3041)；如果是，进入步骤(3043)；

步骤(3043)：把待提取的词提取出来，返回步骤(3041)。

所述计算匹配相似度的步骤如下：

步骤(3044)：将考生答案关键词S₁分割成单个的字符，分割后的字符为u₁，u₂，…,u_n

步骤(3045)：查找首字符u₁是否在标准答案关键词S₂里出现，若没有出现就标记为0；若出现就标记为l，然后将S₂中出现的u₁去掉，继续判断下一个字符，直到将字符u₁，u₂，…,u_n全部判断完；

步骤(3046)：计算出u₁，u₂，…,u_n在S₂里总共出现的次数m，得到的就是S₁与S₂的贴近度N(S₁,S₂)＝m/n，其中，n表示S₁中字符个数。

作为本发明的进一步改进，所述步骤(3)的针对没有标准答案的主观题，先通过人工设置试卷特征，再通过深度学习训练好一个卷积神经网络模型，利用训练好的卷积神经网络模型，实现对没有标准答案的主观题的评阅，统计出没有标准答案的主观题的分值范围。

针对没有标准答案的主观题，设置三个特征：词汇数量、段落数量和涂改区域个数，

从训练试卷样本中提取词汇数量特征、段落数量特征、涂改区域个数特征；

建立词汇数量特征、段落数量特征、涂改区域个数特征与分值范围之间的对应关系；

将每个训练试卷样本的词汇数量特征、段落数量特征、涂改区域个数特征和对应的分值范围均输入到卷积神经网络模型中，对卷积神经网络模型进行训练，输出训练好的卷积神经网络模型；

然后从测试试卷样本中提取词汇数量特征、段落数量特征和涂改区域个数特征；

将所提取的测试试卷样本的词汇数量特征、段落数量特征和涂改区域个数特征输入到训练好的卷积神经网络模型中，输出测试样本的分值范围。

所述词汇数量特征的获取方式为：

利用OCR文字识别方法对图像中的文字进行识别，将识别结果通过分词字典进行分词，然后对分词结果进行数量统计，得到词汇数量特征。

所述段落数量特征的获取方式为：

步骤(a)：利用OCR文字识别方法对图像中的字符进行识别，初始段落数量为零；设定指针的位置，指针的位置指向第一个字符；

步骤(b)：判断指针指向的当前字符是否为文字；

若不是，则指针的位置加一，返回步骤(b)继续判断；

若是，则指针的位置加一，判断下一个字符是否是空格，如果下一个字符是空格，则表明当前字符与之前的若干个字符构成一个段落，累计段落数量加一；

如果下一个字符不是空格，则指针的位置加一，继续寻找下一个字符，直至找到字符是空格为止，累积段落数量加一；

指针位置加一，返回步骤(b)继续判断，直至所有字符被判断完为止，输出段落数量。

所述涂改区域个数特征的获取方式为：

针对没有标准答案的主观题进行拍照，然后，进行图像灰度化处理；

然后，将图像平均划分为若干个区域，计算每个区域内的灰度平均值，如果灰度平均值超过设定阈值，则认为当前区域为涂改区域，累计涂改区域的个数。

表1词汇数量特征、段落数量特征、涂改区域个数特征与分值范围之间的对应关系

词汇数量(单位：个)	段落数量(单位：个)	涂改区域个数(单位：个)	分值范围
				800及其以上	8及其以上	1、2	81到100
601到800	6、7	3、4	61到80
				401到600	4、5	5、6	41到60
201到400	3、4	7、8	21到40
				0到200	1、2	9及其以上	0到20

模型的每一次训练，阅卷老师都可以进行人工的干预，保证模型的准确度，避免因模型的不成熟出现异常分值。

作为本发明的第二方面，提供了基于深度学习的主观题智能阅卷系统；

基于深度学习的主观题智能阅卷系统，包括：存储器、处理器以及存储在存储器上并在处理器上运行的计算机指令，所述计算机指令被处理器运行时，完成上述任一方法所述的步骤。

作为本发明的第三方面，提供了一种计算机可读存储介质；

一种计算机可读存储介质，其上存储有计算机指令，所述计算机指令被处理器运行时，完成上述任一方法所述的步骤。

专业名词库与普通词典库解释：专业名词库为某个专业的专用术语或技术术语，除去专用术语的词库为普通词典库。比如“等边三角形的三个角相等”这句话，专业名词库词表为：等边三角形；普通词典库词表为：的、相等。

与现有技术相比，本发明的有益效果是：

深度学习技术在智能阅卷过程中发挥了巨大作用，具体表现在以下四个方面:

1.本发明将OMR识别用于客观题评阅，OCR识别用于主观题，并结合深度学习的神经网络进行模型的训练，达到对客观题和主观题的快速评阅，旨在提升阅卷的数量、质量、效率。

2.随着训练样本和卷积层数的增加，模型性能也在逐渐的提升，评阅的准确度也会越来越高。对于评阅人来说，在阅卷的前期需要干预的程度较高；越是到了后期，人工干预的越少。对于大批量的主观题评阅能在很大程度上减少阅卷人的工作量。

3.对于利用深度学习的CNN卷积神经网络训练的模型进行试卷评判后会有一些异常的试卷，比如某篇写作分值很低，可以通过人工干预修正结果。

4.训练好的模型应用场景广泛。

附图说明

构成本申请的一部分的说明书附图用来提供对本申请的进一步理解，本申请的示意性实施例及其说明用于解释本申请，并不构成对本申请的不当限定。

图1为本发明中的方法流程图；

图2为本发明中的名词解释及简答题自动阅卷过程流程图；

图3为本发明中的分句算法流程图；

图4为本发明中的正向最大匹配算法改进的分词算法流程图；

图5为本发明中的关键词提取流程图；

图6为本发明中的相似度计算流程图。

具体实施方式

应该指出，以下详细说明都是例示性的，旨在对本申请提供进一步的说明。除非另有指明，本文使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。

需要注意的是，这里所使用的术语仅是为了描述具体实施方式，而非意图限制根据本申请的示例性实施方式。如在这里所使用的，除非上下文另外明确指出，否则单数形式也意图包括复数形式，此外，还应当理解的是，当在本说明书中使用术语“包含”和/或“包括”时，其指明存在特征、步骤、操作、器件、组件和/或它们的组合。

本发明中首先通过专用的高速扫描设备将考生试卷扫描成图片，客观题用OMR识别处理，首先经过灰度处理，然后进行二值化处理，这样图像就剩下两个维度，背景是黑色，前景为白色，其次通过平滑和矫正处理，对扫描成像后有偏差的图像进行一个矫正，方便后期的处理。

对于主观题，我们使用OCR识别。首先将图像进行二值化处理，然后进行倾斜矫正，其次进行特征的提取，再次进行特征数据比对。我们使用线图(Chart)对句子进行分析，保证分割后句子语义的完整性。在分析的过程中我们需要使用本发明中提到的分句算法进行句子的切割处理，然后使用正向最大匹配算法改进分词算法，其次通过关键词的提取以方便后续相似度的计算。最后通过相似度的计算就可以得出本题目考生所得分值。

深度学习模型的训练，将试卷通过专用扫描仪器，把试卷扫面成图片。利用OpenCV的图像分割处理，将整张试卷进行切分；教师设置一套通用的多层次的综合评估一篇作文质量的解决方案；让机器学习这套方案，由阅卷老师进行一定数量的试卷评阅，具体的阅卷份数由此次考试回收的试卷数决定，训练样本过少会导致后期机器自主阅卷出现评分误差，训练样本过多又会增加人工耗时；然后通过深度学习算法，利用CNN卷积神经训练好一个模型，并保存到系统数据库，使机器利用训练好的模型，自动对剩下的试卷进行智能打分；智能评分结束，对于评分异常的试卷，通过人工干预的方法，修改评分。

该方法在大数据背景下通过深度学习的卷积神经网络针对有标准答案的主观题的评阅以及无标准答案的主观题评阅进行了改进和优化，使用该方法可以加快网上阅卷的速度、效率、质量，使人工成本大大降低，减少了人工阅卷的时间，避免因为长时间的阅卷导致阅卷人出现疲劳状态。该方法的在进行试卷批阅的过程中，可以进行批处理，且处理速度快，准确率高。

本发明适用于任何可扫描的标准化试卷，不需要单独印刷标准制式的答题卡。在以下实施例中主要是针对主观题的评阅进行详细的阐述。

实施例：

本实施例的目的是提供一种深度学习的智能阅卷方法。

为了实现上述目的，本发明采用如下一种技术方案：

如图1所示，该方法包括：

基于深度学习的主观题智能阅卷方法，包括：

步骤(1)：获取答题卡的图像；

针对设有标准答案的主观题，利用OCR文字识别方法对图像中的文字进行识别，利用关键词匹配方式将答题区域的文字与标准答案进行匹配，实现对设有标准答案的主观题的评阅，统计出设有标准答案的主观题的分值；如图2所示；

所述步骤(1)的答题卡为通用答题卡或自制的统一模板答题卡；获取答题卡的图像的方式为扫描或拍照。

步骤(201)：对客观题的答题区域进行灰度和二值化处理；

步骤(211)：对主观题的答题区域进行灰度和二值化处理；

步骤(212)：对二值化处理结果进行图像位置矫正处理。

在本发明中，使用最大类间方差(Otsu)算法实现图像二值化处理具体步骤为：

步骤(2-1)：获取图像包含的像素个数n，其灰度级的范围[0，t-1](0≤t≤255)，f_i代表灰度级是i的像素点的数量，P_i代表图像里灰度级是i的像素点存在的概率。

步骤(2-2)：通过使用阈值T将图像的像素按照灰度值划分为目标类与前景类(G₀,G₁)，所以可以得到G₀＝{0,1,2,...,T},G₁＝{T+1,T+2,...,t-1}。

即G₀,G₁的概率用W₀与W₁表示

G₀,G₁的平均灰度用u₀,u₁表示

其中

即类间方差为：

通过上述公式决定σ²大小的是T的取值，T的取值范围是[0，t-1]，T在该范围内取值，只有σ²最大的时候所带入的T值才是Otsu算法的最佳阈值。

步骤(2-3)：只要被检测的像素点的灰度值大于T就将其设置成255，小于等于T就设值成0。

按照此方法处理过的图像只包含黑白两个颜色，这样把灰度级分为目标类与背景类，实现了图像的二值化处理。

所述步骤(3)中将带有标准答案的客观题和主观题录入到系统中，针对客观题，由系统自定判别考生答案正确与否；而对于主观题，我们这里需要用词库生成算法对原始语料进行预处理，用分句算法对答案文本进行分句，最后利用“线图分析法”进行句法分析，保证分割后，句子在语义上保持通顺。

在本实例中，步骤(3)中的词库生成算法步骤(301)的具体步骤为：

如图3所示，所述步骤(302)的具体步骤为：

由于在很多考试中，专有名词占有一定的比例，如果只是通过普通的词库对句子进行分词处理，那么在提取词语时会出现不同程度的分词错误。为了解决这个问题，采用正向最大分词算法，先将待分析的句子与专业名词库进行匹配，然后再与普通词典库重新比对一次，这样，在很大程度上增大了分词的准确度。

如图4所示，所述步骤(303)的具体步骤为：

步骤(3031)：获取专业名词库中最长词的长度，设为n；

句法分析实际是对句子里的词语语法性能实行处理分析，用来确定句子中各组成部分之间的关系，形成关系明确，层次分明的句法结构树。线图分析法在机器翻译、文本自动分析和自动生成中得到了广泛的应用，是自然语言处理中广泛使用的一种方法。

在本实例中，步骤(3)中的提取关键词流程图如图5，所述关键词提取的步骤如下：

步骤(3043)：把待提取的词提取出来，返回步骤(3041)。

如图6所示，所述计算匹配相似度的步骤如下：

经过上述几个阶段的处理，接下来计算成绩。

对于没有标准答案的主观题，比如作文的批改，以及一些开放性是试题。通常情况下，我们需要进行人工评阅，人工评阅工作量大，任务繁重，而且经过长时间的阅卷，可能会出现视觉疲劳，以至于会出现错判或者误判的情形。

以上所述仅为本申请的优选实施例而已，并不用于限制本申请，对于本领域的技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

Claims

1.基于深度学习的主观题智能阅卷方法，其特征是，包括：

步骤(1)：获取答题卡的图像；

2.如权利要求1所述的基于深度学习的主观题智能阅卷方法，其特征是，

所述步骤(3)的针对设有标准答案的主观题，利用关键词匹配方式将答题区域的内容与标准答案进行匹配，实现对设有标准答案的主观题的评阅，统计出设有标准答案的主观题的分值，是指：

3.如权利要求2所述的基于深度学习的主观题智能阅卷方法，其特征是，

所述步骤(301)的具体步骤为：

4.如权利要求2所述的基于深度学习的主观题智能阅卷方法，其特征是，

所述步骤(302)的具体步骤为：

5.如权利要求2所述的基于深度学习的主观题智能阅卷方法，其特征是，

所述步骤(303)的具体步骤为：

步骤(3031)：获取专业名词库中最长词的长度，设为n；

6.如权利要求2所述的基于深度学习的主观题智能阅卷方法，其特征是，

所述关键词提取的步骤如下：

步骤(3043)：把待提取的词提取出来，返回步骤(3041)；

所述计算匹配相似度的步骤如下：

7.如权利要求1所述的基于深度学习的主观题智能阅卷方法，其特征是，

8.如权利要求7所述的基于深度学习的主观题智能阅卷方法，其特征是，

所述词汇数量特征的获取方式为：

利用OCR文字识别方法对图像中的文字进行识别，将识别结果通过分词字典进行分词，然后对分词结果进行数量统计，得到词汇数量特征；

所述段落数量特征的获取方式为：

步骤(b)：判断指针指向的当前字符是否为文字；

若不是，则指针的位置加一，返回步骤(b)继续判断；

指针位置加一，返回步骤(b)继续判断，直至所有字符被判断完为止，输出段落数量；

所述涂改区域个数特征的获取方式为：

9.基于深度学习的主观题智能阅卷系统，包括：存储器、处理器以及存储在存储器上并在处理器上运行的计算机指令，所述计算机指令被处理器运行时，完成上述权利要求1-8任一方法所述的步骤。

10.一种计算机可读存储介质，其上存储有计算机指令，所述计算机指令被处理器运行时，完成上述权利要求1-8任一方法所述的步骤。