CN113971805A

CN113971805A - 一种结合机器视觉和语义分析的智能阅卷评分方法

Info

Publication number: CN113971805A
Application number: CN202111578858.2A
Authority: CN
Inventors: 胡为民; 郑喜
Original assignee: Shenzhen Dib Enterprise Risk Management Technology Co ltd
Current assignee: Shenzhen Dib Enterprise Risk Management Technology Co ltd
Priority date: 2021-12-22
Filing date: 2021-12-22
Publication date: 2022-01-25

Abstract

本发明公开了一种结合机器视觉和语义分析的智能阅卷评分方法，包括：手写体识别阶段；对输入的试卷扫描图像进行缩放；对缩放后的试卷扫描图像进行预处理，得到缩放后的试卷图像手写体文字的连通域；根据连通域中的手写体文字，得到单字符文本；对所有单字符文本进行校验和修正，得到试卷作答文本；智能评分阶段；根据试卷作答文本和标准答案文本，得到试卷作答文本向量和标准答案文本向量；计算试卷作答文本向量和标准答案文本向量之间的相似度，得到试卷作答文本和标准答案文本之间的匹配程度，匹配程度为最终题目作答得分；该方法提升了手写体文字识别的准确性，实现了智能阅卷评分，提高了教学事务中主观题阅卷评分的工作效率。

Description

一种结合机器视觉和语义分析的智能阅卷评分方法

技术领域

本发明属于智能阅卷评分技术领域，尤其涉及一种结合机器视觉和语义分析的智能阅卷评分方法。

背景技术

阅卷评分作为教学事务中的关键环节一直以来耗费阅卷人大量的时间和精力，特别是当试卷数量较大时。传统通过答题卡等方式仅能支持客观题阅卷评分，难以支持主观题，特别是主观题手写体阅卷评分，不同于客观题阅卷评分，主观题存在考试人作答内容多样性、不统一的问题，需要阅卷人理解标准答案和主观题作答内容的语境语义才能给出合理的评分，类似客观题作答和答案匹配的方式不再有效。不仅如此，当前试卷作答仍以纸质手写体作答为主，考试人作答时的笔迹形态各异，传统手写体识别技术受限于训练样本规模和泛化性，容易出现手写体识别错误的现象，而一旦关键作答内容识别错误，会造成语义偏差较大使得阅卷评分不准确的问题。

发明内容

本发明的目的在于克服上述现有技术中主观题手写体难以阅卷评分的不足，提供了一种针对主观题手写体阅卷评分的方法，具体为一种结合机器视觉和语义分析的智能阅卷评分方法。

本发明提供了一种结合机器视觉和语义分析的智能阅卷评分方法，包括：

手写体识别阶段；

S1：对输入的试卷扫描图像进行缩放；

S2：对缩放后的试卷扫描图像进行预处理，得到缩放后的试卷图像手写体文字的连通域；

S3：根据连通域中的手写体文字，得到单字符文本；

S4：对所有单字符文本进行校验和修正，得到试卷作答文本；

智能评分阶段；

S5：根据试卷作答文本和标准答案文本，得到试卷作答文本向量和标准答案文本向量；

S6：计算试卷作答文本向量和标准答案文本向量之间的相似度，得到试卷作答文本和标准答案文本之间的匹配程度，匹配程度为最终题目作答得分。

优选的，S1中，采用双线性插值法对输入的试卷扫描图像进行缩放。

优选的，S2中，试卷扫描图像包括试卷作答区图像，采用阈值分割法对缩放后的试卷作答区图像进行二值化处理，采用区域自增长算法得到缩放后的试卷图像手写体文字的连通域，并根据连通域将试卷作答区图像分割成多个手写体单字符图像。

优选的，S2中，还包括剔除噪点，噪点为连通域面积小于10的缩放后的试卷作答区图像。

优选的，S3中，包括步骤：

S3.1：基于全卷积神经网络对连通域中的手写体进行特征提取，将分割成多个手写体单字符图像的试卷扫描图像输入至全卷积神经网络中，全卷积神经网络将计算全连接层向量，输出手写体文字分类置信度，并通过训练样本训练全卷积神经网络，手写体文字分类置信度用于与训练样本的标签值进行比较，修正网络权重；

S3.2：提取全卷积神经网络中全连接层向量作为特征向量，采用K近邻算法与训练样本逐一比较，得到手写体中文字符，进而得到单字符文本。

优选的，S4中，基于马尔科夫矩阵，提取单字符文本中手写体中文字符的上下文条件转移概率，并进行判断，若概率小于阈值，则手写体中文字符为异常字符，并将异常字符修正为手写体中文字符的上下文条件转移概率最大的字符；若概率大于阈值，则手写体中文字符为正常字符；根据异常字符修正后的字符、以及正常字符，构建试卷作答文本。

优选的，S5中，包括：

S5.1：采用分词法对试卷作答文本、以及给定的标准答案文本进行中文分词，分别得到试卷作答文本词语集和标准答案文本词语集；

S5.2：采用词向量模型提取试卷作答文本词语集中所有分词的词向量，得到试卷作答词向量；采用加权方法对试卷作答文本词语集中所有分词进行统一加权，得到试卷作答词权；根据试卷作答词向量和试卷作答词权，得到试卷作答文本向量；

采用词向量模型提取标准答案文本词语集中所有分词的词向量，得到标准答案词向量；采用加权方法对标准答案文本词语集中所有分词进行统一加权，得到标准答案词权；根据标准答案词向量和标准答案词权，得到标准答案文本向量。

优选的，S6中，包括：

S6.1：将试卷作答文本向量与标准答案文本向量代入欧氏距离计算方法中，得到两向量之间的欧氏距离；

将试卷作答文本向量与标准答案文本向量代入余弦相似度计算方法中，得到两向量之间的余弦相似度；

S6.2：将两向量之间的欧氏距离和两向量之间的余弦相似度进行加权求和，得到试卷作答文本与标准答案文本之间的匹配程度，匹配程度即为最终题目作答得分。

优选的，S3.1中，全卷积神经网络包括输入层、卷积层、池化层、全连接层和输出层，输入分割成多个手写体单字符图像的试卷扫描图像至输入层；卷积层提取局部视野权重共享特征；池化层对缩放后的试卷扫描图像进行降维处理；全连接层是全卷积神经网络中的隐含层，当输入分割成多个手写体单字符图像的试卷扫描图像至全卷积神经网络中时，全卷积神经网络将计算全连接层向量，全连接层用于对手写体文字进行分类，输出层输出分类置信度。

有益效果：本发明提供的这种方法针对主观题手写体阅卷评分，采用马尔科夫矩阵校验和修正手写体文字识别中的错误信息，提升了手写体文字识别的准确性；采用欧式距离和余弦相似度计算试卷作答文本与标准答案文本之间的匹配程度，以匹配程度作为最终题目作答得分；实现了智能阅卷评分，提高了教学事务中主观题阅卷评分的工作效率。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施中方法的流程图。

图2为本发明实施中全卷积神经网络的架构图。

具体实施方式

下面将结合本发明的实施例中的附图，对本发明的实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明的一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

如图1所示，本实施例提供了一种结合机器视觉和语义分析的智能阅卷评分方法，包括：

手写体识别阶段；

S1：对输入的试卷扫描图像进行缩放；

在本实施例中，对于输入m*n尺寸的试卷扫描图像

，采用双线性插值法

对输入的试卷扫描图像进行缩放，缩放至420*300尺寸的

，如下公式所示：

其中，x、y为420*300尺寸缩放的试卷扫描图像中对应横坐标和纵坐标位置，取值如下公式所示：

其中，x_img、y_img为原试卷扫描图像中横纵坐标位置；x₁、x₂、y₁、y₂为原试卷扫描图像中插值范围对应横纵坐标位置，

表示图像中对应x、y坐标位置的像素灰度值；x₁、x₂、y₁、y₂取值如下公式所示：

。

具体的，试卷扫描图像包括试卷作答区图像，采用阈值分割法（阈值分割法中阈值设定为128）对缩放后的试卷作答区图像进行二值化处理，采用区域自增长算法（深度优先遍历所有连通的像素）得到缩放后的试卷图像手写体文字的连通域，剔除噪点，噪点为连通域面积小于10的缩放后的试卷作答区图像，并根据连通域将试卷作答区图像分割成多个手写体单字符图像，后续采用全卷机神经网络识别手写体单字符图像，再将识别出的单字符文本合并为试卷作答文本。

S3：根据连通域中的手写体文字，得到单字符文本；

具体的，包括步骤：

S3.1：基于全卷积神经网络对连通域中的手写体进行特征提取，将分割成多个手写体单字符图像的试卷扫描图像输入至全卷积神经网络中，全卷积神经网络将计算全连接层向量，输出手写体文字分类置信度。通过训练样本训练全卷积神经网络，以识别试卷扫描图像中的手写体文字，其中训练方法采用梯度下降法；手写体文字分类置信度用于与训练样本的标签值进行比较，修正网络权重。

S3.2：因为手写体中文的字符数量较多，全卷积神经网络的全连接层分类函数在处理超多类分类时准确性会随着分类数量增加而下降，故本实施例提取全卷积神经网络中全连接层向量作为特征向量，采用K近邻算法（K=1，余弦距离）与训练样本逐一比较，得到手写体中文字符，进而得到单字符文本。

如图2所示，全卷积神经网络包括一个输入层、两个卷积层、两个池化层、一个全连接层和一个输出层，输入缩放后的420*300试卷扫描图像至输入层，卷积层提取局部视野权重共享特征，卷积核是数量为10的5*5的随机卷积核，池化层对缩放后的试卷扫描图像进行降维处理，池化核是数量为10的2*2的最大值池化核，全连接层的激活函数采用Softmax函数，损失函数采用交叉熵损失函数，全连接层是全卷积神经网络中的隐含层，是全卷积神经网络组成部分，当输入分割成多个手写体单字符图像的试卷扫描图像至全卷积神经网络中时，全卷积神经网络将计算全连接层向量，用于对手写体文字进行分类，输出层输出分类置信度。

具体的，由于受限于训练样本的规模和泛化性，容易出现手写体文字识别错误的现象，而一旦关键作答内容识别错误，会造成语义偏差较大使得阅卷评分不准确的问题，故本实施例采用马尔科夫矩阵验证并自适应修正手写体文字识别中的错误信息，提升手写体文字识别的准确性，利用常用中文词库基于马尔科夫矩阵，提取单字符文本中手写体中文字符的上下文条件转移概率，并进行判断，若概率小于阈值（阈值设定为0.0001），则手写体中文字符为异常字符，并将异常字符修正为手写体中文字符的上下文条件转移概率最大的字符；若概率大于阈值，则手写体中文字符为正常字符；实现手写体文字是识别中错误信息的验证并自适应修正，根据异常字符修正后的字符、以及正常字符，构建试卷作答文本；

马尔科夫矩阵中i、j分别表示两相邻前、后连续中文字符

在词库中的索引，矩阵元素表示两相邻前、后连续中文字符在词库汇总的条件转移概率，记为：

，其计算公式如下：

表示两相邻前、后连续中文字符

的联合概率，

表示两相邻前连续中文字在词库中出现的概率。

手写体中文字符的上下文条件转移概率记为：

，

手写体中文字符的上下文条件转移概率最大的字符记为：

其中，

表示手写体中文字符的上文字符，

表示手写体中文字符，

表示手写体中文字符的下文字符，a表示上文字符在词库中的索引，x表示手写体中文字符在词库中的索引，b表示下文字符在词库中的索引。

智能评分阶段；

具体的，包括：

S5.1：采用jieba分词法对试卷作答文本

、以及给定的标准答案文本

进行中文分词，分别得到试卷作答文本词语集和标准答案文本词语集，试卷作答文本词语集记为：

；标准答案文本词语集记为：

；

S5.2：采用word2vec词向量模型提取试卷作答文本词语集中所有分词的词向量，得到试卷作答词向量；采用TFIDF加权方法对试卷作答文本词语集中所有分词进行统一加权，得到试卷作答词权；根据试卷作答词向量和试卷作答词权，得到试卷作答文本向量；试卷作答文本向量记为：

；计算公式为：

其中，

表示试卷作答词权，

表示试卷作答词向量，g表示试卷作答文本词语集中分词的总数，

，

，

表示试卷作答文本词语集中所有的分词；

采用词向量模型提取标准答案文本词语集中所有分词的词向量，得到标准答案词向量；采用加权方法对标准答案文本词语集中所有分词进行统一加权，得到标准答案词权；根据标准答案词向量和标准答案词权，得到标准答案文本向量；标准答案文本向量记为：

；计算公式为：

其中，

表示标准答案词权，

表示标准答案词向量，h表示标准答案文本词语集中分词的总数，

，

，

表示标准答案文本词语集中所有的分词。

具体的，包括：

S6.1：将试卷作答文本向量与标准答案文本向量代入欧氏距离计算方法中，得到两向量之间的欧氏距离，两向量之间的欧式距离记为：

；

将试卷作答文本向量与标准答案文本向量代入余弦相似度计算方法中，得到两向量之间的余弦相似度，两向量之间的余弦相似度记为：

；

S6.2：将两向量之间的欧氏距离和两向量之间的余弦相似度按照0.4比0.6的比例进行加权求和，得到试卷作答文本与标准答案文本之间的匹配程度，匹配程度即为最终题目作答得分；加权求和公式如下：

其中，

表示试卷作答文本与标准答案文本之间的匹配程度，

表示试卷作答文本向量，

表示标准答案文本向量。

本实施例提供的这种结合机器视觉和语义分析的智能阅卷评分方法具有以下有益效果：

针对主观题手写体阅卷评分，采用马尔科夫矩阵校验和修正手写体文字识别中的错误信息，提升了手写体文字识别的准确性；采用欧式距离和余弦相似度计算试卷作答文本与标准答案文本之间的匹配程度，以匹配程度作为最终题目作答得分；实现了智能阅卷评分，提高了教学事务中主观题阅卷评分的工作效率。

以上仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内所作的任何修改、等同替换或改进等，均应包含在本发明的保护范围之内。

Claims

1.一种结合机器视觉和语义分析的智能阅卷评分方法，其特征在于，包括：

手写体识别阶段；

S1：对输入的试卷扫描图像进行缩放；

S3：根据连通域中的手写体文字，得到单字符文本；

智能评分阶段；

S6：计算试卷作答文本向量和标准答案文本向量之间的相似度，得到试卷作答文本和标准答案文本之间的匹配程度，所述匹配程度为最终题目作答得分。

2.根据权利要求1所述的一种结合机器视觉和语义分析的智能阅卷评分方法，其特征在于，S1中，采用双线性插值法对输入的试卷扫描图像进行缩放。

3.根据权利要求2所述的一种结合机器视觉和语义分析的智能阅卷评分方法，其特征在于，S2中，所述试卷扫描图像包括试卷作答区图像，采用阈值分割法对缩放后的试卷作答区图像进行二值化处理，采用区域自增长算法得到缩放后的试卷图像手写体文字的连通域，并根据连通域将试卷作答区图像分割成多个手写体单字符图像。

4.根据权利要求3所述的一种结合机器视觉和语义分析的智能阅卷评分方法，其特征在于，S2中，还包括剔除噪点，所述噪点为连通域面积小于10的缩放后的试卷作答区图像。

5.根据权利要求4所述的一种结合机器视觉和语义分析的智能阅卷评分方法，其特征在于，S3中，包括步骤：

6.根据权利要求5所述的一种结合机器视觉和语义分析的智能阅卷评分方法，其特征在于，S4中，基于马尔科夫矩阵，提取单字符文本中手写体中文字符的上下文条件转移概率，并进行判断，若概率小于阈值，则所述手写体中文字符为异常字符，并将所述异常字符修正为手写体中文字符的上下文条件转移概率最大的字符；若概率大于阈值，则所述手写体中文字符为正常字符；根据异常字符修正后的字符、以及正常字符，构建试卷作答文本。

7.根据权利要求6所述的一种结合机器视觉和语义分析的智能阅卷评分方法，其特征在于，S5中，包括：

8.根据权利要求7所述的一种结合机器视觉和语义分析的智能阅卷评分方法，其特征在于，S6中，包括：

9.根据权利要求5所述的一种结合机器视觉和语义分析的智能阅卷评分方法，其特征在于，S3.1中，所述全卷积神经网络包括输入层、卷积层、池化层、全连接层和输出层，输入分割成多个手写体单字符图像的试卷扫描图像至输入层；卷积层提取局部视野权重共享特征；池化层对缩放后的试卷扫描图像进行降维处理；全连接层是全卷积神经网络中的隐含层，当输入分割成多个手写体单字符图像的试卷扫描图像至全卷积神经网络中时，全卷积神经网络将计算全连接层向量，全连接层用于对手写体文字进行分类，输出层输出分类置信度。