CN113112511B

CN113112511B - 试卷批改的方法、装置、存储介质及电子设备

Info

Publication number: CN113112511B
Application number: CN202110419242.4A
Authority: CN
Inventors: 尹成浩; 马志国; 张飞飞; 杜竹君; 阚海鹏; 刘腾龙; 麻凯利; 张明
Original assignee: New Oriental Education Technology Group Co ltd
Current assignee: New Oriental Education Technology Group Co ltd
Priority date: 2021-04-19
Filing date: 2021-04-19
Publication date: 2024-01-05
Anticipated expiration: 2041-04-19
Also published as: CN113112511A

Abstract

本公开涉及一种试卷批改方法、装置、存储介质及电子设备，可以获取待批改试卷的原始图像，原始图像包括背景区域图像以及待批改试卷的试卷区域图像；将原始图像输入预先训练得到的边缘检测模型，得到多个尺度分别对应的边缘特征点，边缘检测模型的模型结构包括主干网络和与所述主干网络连接的侧边网络，针对每个尺度对应的边缘特征点，采用非极大抑制算法剔除该尺度的边缘特征点中的非目标边缘特征点，得到该尺度的目标边缘特征点；根据多个尺度分别对应的目标边缘特征点确定待批改试卷的边缘特征图像；从边缘特征图像中获取待批改试卷的边缘信息，并根据边缘信息从原始图像中提取出试卷区域图像；根据试卷区域图像对待批改试卷进行批改。

Description

试卷批改的方法、装置、存储介质及电子设备

技术领域

本公开涉及图像识别领域中的试卷批改，具体地，涉及一种试卷批改的方法、装置、存储介质及电子设备。

背景技术

随着互联网的发展，出现了以信息科技和互联网技术为基础的智能教学方式，在智能教学中也实现了学生试卷的自动批改。

现有的自动批改方式大都是基于扫描试卷的图像信息进行识别批改的，但扫描的试卷图像信息中一般没有背景区域图像，而在拍照上传这种场景下，待批改试卷对应的原始图像包括背景图像信息，并且试卷背景图像复杂，边缘信息较弱，现有的自动批改方式无法准确识别试卷图像的边缘信息，这会影响识别的准确率，进而会影响试卷批改结果的准确程度。

发明内容

本公开的目的是提供一种试卷批改的方法、装置、存储介质及电子设备。

第一方面，提供一种试卷批改的方法，所述方法包括：获取待批改试卷对应的原始图像，所述原始图像包括背景区域图像以及所述待批改试卷的试卷区域图像；将所述原始图像输入预先训练得到的边缘检测模型，得到多个尺度分别对应的边缘特征点，所述边缘检测模型的模型结构包括主干网络和与所述主干网络连接的侧边网络，所述主干网络为在VGG网络的基础上去掉全连接层以及最后N层池化层得到的网络，或者所述主干网络包括残差网络ResNet网络，所述N为预设数量；针对每个尺度对应的所述边缘特征点，采用非极大抑制算法剔除该尺度对应的边缘特征点中的非目标边缘特征点，得到该尺度对应的目标边缘特征点，所述非目标边缘特征点包括所述边缘特征点中除局部像素最大值以外的其它特征点；根据多个尺度分别对应的所述目标边缘特征点确定所述待批改试卷的边缘特征图像；从所述边缘特征图像中获取所述待批改试卷的边缘信息，并根据所述边缘信息从所述原始图像中提取出所述试卷区域图像；根据所述试卷区域图像对所述待批改试卷进行批改。

可选地，所述主干网络包括多个依次连接的第一网络层和多个依次连接的第二网络层，所述侧边网络包括多个第三网络层，其中，最后一个所述第一网络层与第一个所述第二网络层连接，每个所述第一网络层和每个所述第二网络层后均连接有一个所述第三网络层；所述将所述原始图像输入预先训练得到的边缘检测模型，得到多个尺度分别对应的边缘特征点包括：将所述原始图像输入所述边缘检测模型后，通过每个所述第三网络层输出不同尺度的所述边缘特征点，不同的第三网络层输出不同尺度的边缘特征点。

可选地，所述采用非极大抑制算法剔除该尺度对应的边缘特征点中的非目标边缘特征点，得到该尺度对应的目标边缘特征点包括：

针对该尺度对应的每个边缘特征点，确定该边缘特征点的概率值是否小于相邻特征点的概率值，所述相邻特征点为在该边缘特征点对应的梯度方向上与该边缘特征点位置相邻的两个像素点，所述概率值用于表征该边缘特征点是否为所述待批改试卷的边缘像素点的概率值；若该边缘特征点的概率值小于所述相邻特征点的概率值，将该边缘特征点作为所述非目标边缘特征点；将该尺度对应的边缘特征点中的全部所述非目标边缘特征点剔除，得到该尺度对应的所述目标边缘特征点。

可选地，所述根据多个尺度分别对应的所述目标边缘特征点确定所述待批改试卷的边缘特征图像包括：针对每个尺度，获取该尺度对应的预设权重；针对每个所述目标边缘特征点，根据该目标边缘特征点在每个尺度对应的所述预设权重以及概率值进行加权求和，得到该目标边缘特征点对应的目标概率值；根据预设概率阈值和每个所述目标边缘特征点对应的所述目标概率值确定所述边缘特征图像。

可选地，所述根据所述边缘信息从所述原始图像中提取出所述试卷区域图像包括：根据所述边缘信息对所述原始图像进行透视变换，得到所述试卷区域图像。

可选地，在所述根据所述试卷区域图像对所述待批改试卷进行批改之前，所述方法还包括：对所述试卷区域图像进行直线检测，得到所述试卷区域图像中的试卷文本对应的文本行直线；根据所述文本行直线与预设水平直线之间的夹角确定所述试卷文本的倾斜角度；根据所述倾斜角度对所述试卷区域图像进行文本倾斜矫正，得到矫正图像；所述根据所述试卷区域图像对所述待批改试卷进行批改包括：根据所述矫正图像对所述待批改试卷进行批改。

可选地，在所述根据所述试卷区域图像对所述待批改试卷进行批改之前，所述方法还包括：将所述试卷区域图像输入预先训练得到的第一定位模型，得到所述待批改试卷中每个试题分别对应的试题起始标识位置信息以及作答区域位置信息；将所述试卷区域图像输入预先训练得到的第二定位模型，得到每个所述试题分别对应的题目识别信息，所述题目识别信息包括题目位置信息；根据所述试题起始标识位置信息、所述作答区域位置信息以及所述题目位置信息确定每个所述试题分别对应的区域位置，并根据所述区域位置对所述试卷区域图像进行区域划分，得到每个所述试题分别对应的子区域图像；所述根据所述试卷区域图像对所述待批改试卷进行批改包括：针对所述待批改试卷中的多个待批改的试题中的每个试题，根据该试题对应的所述子区域图像对该试题进行批改。

可选地，所述根据该试题对应的所述子区域图像对该试题进行批改包括：对所述子区域图像中的作答区域进行文字识别，得到该试题对应的识别答案；获取预先设置的该试题对应的标准答案；将所述识别答案与所述标准答案进行字符匹配，得到字符匹配度；获取该试题对应的预设匹配度阈值；根据所述字符匹配度和所述预设匹配度阈值对该试题进行批改。

可选地，所述题目识别信息还包括所述试题分别对应的题目类型；所述获取该试题对应的预设匹配度阈值包括：根据该试题对应的所述题目类型获取该试题对应的所述预设匹配度阈值。

可选地，所述第一定位模型包括Cascade-rcnn网络模型，所述第二定位模型包括Mask-rcnn网络模型，所述Cascade-rcnn网络模型中的anchor生成时的缩放尺度参数为M·scales，其中，0<M<1，scales为所述Cascade-rcnn网络模型的预设初始anchor尺度控制参数。

可选地，所述Cascade-rcnn网络模型中的anchor生成时的缩放尺度参数为

第二方面，提供一种试卷批改装置，所述装置包括：

获取模块，用于获取待批改试卷对应的原始图像，所述原始图像包括背景区域图像以及所述待批改试卷的试卷区域图像；第一确定模块，用于将所述原始图像输入预先训练得到的边缘检测模型，得到多个尺度分别对应的边缘特征点，所述边缘检测模型的模型结构包括主干网络和与所述主干网络连接的侧边网络，所述主干网络为在VGG网络的基础上去掉全连接层以及最后N层池化层得到的网络，或者所述主干网络包括残差网络ResNet网络，所述N为预设数量；特征点筛选模块，用于针对每个尺度对应的所述边缘特征点，采用非极大抑制算法剔除该尺度对应的边缘特征点中的非目标边缘特征点，得到该尺度对应的目标边缘特征点，所述非目标边缘特征点包括所述边缘特征点中除局部像素最大值以外的其它特征点；第二确定模块，用于根据多个尺度分别对应的所述目标边缘特征点确定所述待批改试卷的边缘特征图像；提取模块，用于从所述边缘特征图像中获取所述待批改试卷的边缘信息，并根据所述边缘信息从所述原始图像中提取出所述试卷区域图像；批改模块，用于根据所述试卷区域图像对所述待批改试卷进行批改。

第三方面，提供一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现本公开第一方面所述方法的步骤。

第四方面，提供一种电子设备，包括：存储器，其上存储有计算机程序；处理器，用于执行所述存储器中的所述计算机程序，以实现本公开第一方面所述方法的步骤。

通过上述技术方案，获取待批改试卷对应的原始图像，所述原始图像包括背景区域图像以及所述待批改试卷的试卷区域图像；将所述原始图像输入预先训练得到的边缘检测模型，得到多个尺度分别对应的边缘特征点，所述边缘检测模型的模型结构包括主干网络和与所述主干网络连接的侧边网络，所述主干网络为在VGG网络的基础上去掉全连接层以及最后N层池化层得到的网络，或者所述主干网络包括残差网络ResNet网络，所述N为预设数量；针对每个尺度对应的所述边缘特征点，采用非极大抑制算法剔除该尺度对应的边缘特征点中的非目标边缘特征点，得到该尺度对应的目标边缘特征点，所述非目标边缘特征点包括所述边缘特征点中除局部像素最大值以外的其它特征点；根据多个尺度分别对应的所述目标边缘特征点确定所述待批改试卷的边缘特征图像；从所述边缘特征图像中获取所述待批改试卷的边缘信息，并根据所述边缘信息从所述原始图像中提取出所述试卷区域图像；根据所述试卷区域图像对所述待批改试卷进行批改，这样，可以通过对边缘检测模型进行改进，主干网络采用去掉全连接层以及最后N层池化层的VGG网络，或者主干网络选用残差网络，以此强化网络对弱边缘信息的提取能力，并且可以采用非极大抑制算法对边缘检测模型得到的边缘特征点进行筛选，保留主要的边缘特征点，进一步提高了对试卷图像的边缘检测能力，进而提高了模型对背景复杂或者背景与试卷融合度较高的试卷图像的识别准确率。

本公开的其他特征和优点将在随后的具体实施方式部分予以详细说明。

附图说明

附图是用来提供对本公开的进一步理解，并且构成说明书的一部分，与下面的具体实施方式一起用于解释本公开，但并不构成对本公开的限制。在附图中：

图1是根据一示例性实施例示出的第一种试卷批改的方法的流程图；

图2是根据一示例性实施例示出的一种边缘检测模型的结构示意图；

图3a-3b是根据一示例性实施例示出的一种采用Sobel算子计算梯度值的过程示意图；

图4是根据一示例性实施例示出的第二种试卷批改的方法的流程图；

图5是根据一示例性实施例示出的第三种试卷批改的方法的流程图；

图6是根据一示例性实施例示出的一种试卷批改的装置的框图；

图7是根据一示例性实施例示出的一种电子设备的结构框图。

具体实施方式

以下结合附图对本公开的具体实施方式进行详细说明。应当理解的是，此处所描述的具体实施方式仅用于说明和解释本公开，并不用于限制本公开。

首先，对本公开的应用场景进行介绍，本公开主要应用于对采用拍照方式采集的试卷图像进行图像识别后实现试卷的自动批改的场景中，现有的自动批改方式多为答题卡自动批改或者扫描试卷后自动批改，但答题卡自动批改对学生填涂答案的要求较高，需要按照标准的方式来，且答题卡版式十分固定，每一个扫描批改程序只能支持唯一的答题卡版式，操作难度系数高，成本高，对于扫描试卷后自动批改的方式，扫描的试卷图像信息中一般没有背景区域图像，因此，通过对扫描后的试卷图像进行图像识别无需识别试卷之外的背景区域图像，但随着智能设备、互联网的不断发展，在当前的智能教学中大都采用拍照的方式将待批改试卷上传至智能教学系统进行批改，但拍照上传的试卷图像中不仅包括试卷区域图像，还包括背景区域图像，并且试卷背景图像复杂，边缘信息较弱，现有的自动批改方式无法准确识别试卷图像的边缘信息，这会影响识别的准确率，进而会影响试卷批改结果的准确程度。

另外，针对拍照上传这种场景下，由于拍照角度的问题试卷中的文本难免会出现倾斜或者扭曲的现象，这也会影响试卷识别的准确性。

为解决上述存在的问题，本公开提供一种试卷批改的方法、装置、存储介质及电子设备，可以通过对边缘检测模型进行改进，主干网络采用去掉全连接层以及最后N层池化层的VGG网络，或者主干网络选用残差网络，以此强化网络对弱边缘信息的提取能力，并且可以采用非极大抑制算法对边缘检测模型得到的边缘特征点进行筛选，保留主要的边缘特征点，进一步提高了对试卷图像的边缘检测能力，进而提高了模型对背景复杂或者背景与试卷融合度较高的试卷图像的识别准确率；另外，针对拍照上传的试卷图像中存在文本倾斜扭曲的现象，可以通过对试卷区域图像进行直线检测，得到试卷区域图像中的试卷文本对应的文本行直线；然后根据该文本行直线与预设水平直线之间的夹角确定该试卷文本的倾斜角度；以便根据该倾斜角度对该试卷区域图像进行文本倾斜矫正，这样基于矫正后的试卷图像进行试卷的批改，可以明显提高试卷批改结果的准确率。

下面结合附图对本公开的具体实施方式进行详细说明。

图1是根据一示例性实施例示出的一种试卷批改的方法的流程图，该方法可以应用于试卷自动批改系统所在的终端，如图1所示，该方法包括以下步骤：

在步骤S101中，获取待批改试卷对应的原始图像，该原始图像包括背景区域图像以及该待批改试卷的试卷区域图像。

在实际的应用场景中，可以通过拍照的方式获取该待批改试卷对应的该原始图像，然后上传至试卷自动批改系统中，使得终端获取到该原始图像，该背景区域图像是指该原始图像中除该试卷区域图像之外的其它区域的图像。

在步骤S102中，将该原始图像输入预先训练得到的边缘检测模型，得到多个尺度分别对应的边缘特征点。

其中，该边缘检测模型的模型结构包括主干网络和与该主干网络连接的侧边网络，该主干网络为在VGG网络的基础上去掉全连接层以及最后N层池化层得到的网络，或者该主干网络包括残差网络ResNet网络，该N为预设数量，这样，在去掉N层池化层后，可以使得网络在最后N层提取的特征的特征尺度增加一倍，从而可以保留更多的边缘信息，增强了模型对边缘特征的提取能力。

另外，当训练样本足够大，场景足够多时，还可以更换骨干网络为网络结构更深的ResNet网络，并增加侧边网络的数量，随着网络层数的递增，捕捉图像特征的能力也更强，在大量数据的支持下，可以适应更多的场景需求。

这里，主干网络可以包括多个依次连接的第一网络层和多个依次连接的第二网络层，该侧边网络包括多个第三网络层，其中，最后一个该第一网络层与第一个该第二网络层连接，每个该第一网络层和每个该第二网络层后均连接有一个该第三网络层，这样，可以将该原始图像输入该边缘检测模型(该边缘检测模型的输入层与第一个该第一网络层连接)后，通过每个该第三网络层输出不同尺度的该边缘特征点，不同的第三网络层输出不同尺度的边缘特征点。

示例地，图2是根据一示例性实施例示出的一种边缘检测模型的结构示意图，如图2所示，在一种可能的实现方式中，该边缘检测模型中的第一网络层可以包括多个依次连接的卷积层以及与最后一个卷积层相连的池化层，该第二网络层可以包括多个依次连接的卷积层，该第三网络层可以包括至少一个卷积层和与该卷积层连接的至少一个反卷积层。

另外，该边缘特征点可以包括侧边网络中每个第三网络层输出的边缘特征图中的多个像素点，并且该边缘特征图是一个概率图，该边缘特征图中的每个像素点均对应有该像素点为该待批改试卷的边缘像素点的概率值。

需要说明的是，在本公开提供的该边缘检测模型中，侧边网络中的每一个第三网络层都可以输出检测到的边缘信息，并且低层网络善于捕捉图像的局部纹理特征，因此，低层网络输出的边缘信息往往具有较多的纹理，而高层网络善于捕捉图像的语义信息，这样可以得到多个尺度的边缘信息，进一步增强了模型对边缘特征的提取能力。

在步骤S103中，针对每个尺度对应的该边缘特征点，采用非极大抑制算法剔除该尺度对应的边缘特征点中的非目标边缘特征点，得到该尺度对应的目标边缘特征点。

其中，非极大抑制算法的原理在于搜索局部最大值，然后抑制该局部最大值，在本步骤中，该非目标边缘特征点包括该边缘特征点中除局部像素最大值以外的其它特征点，该目标边缘特征点包括该边缘特征点中的局部像素最大值对应的边缘特征点，因此，在执行本步骤的过程中，需要依次确定每个该边缘特征点是否为该局部像素最大值对应的像素点。

在本步骤中，可以针对该尺度对应的每个边缘特征点，确定该边缘特征点的概率值是否小于相邻特征点的概率值，该相邻特征点为在该边缘特征点对应的梯度方向上与该边缘特征点位置相邻的两个像素点，该概率值用于表征该边缘特征点是否为该待批改试卷的边缘像素点的概率值；若该边缘特征点的概率值小于该相邻特征点的概率值，将该边缘特征点作为该非目标边缘特征点；将该尺度对应的边缘特征点中的全部该非目标边缘特征点剔除，得到该尺度对应的该目标边缘特征点。

具体地，可以针对该尺度对应的每个边缘特征点，确定该边缘特征点的梯度方向，在一种可能的实现方式中，可以将梯度方向近似为0度、45度、90度和135度，然后针对每个梯度方向，在该边缘特征点对应的八邻域范围内沿当前的梯度方向将该边缘特征点的概率值与相邻特征点的概率值进行比较，例如，若该梯度方向为0度，该相邻特征点即为该边缘特征点的左边和右边的两个特征点，若该梯度方向为45度，该相邻特征点即为该边缘特征点的左上方和右下方的两个特征点，若该梯度方向为90度，该相邻特征点即为该边缘特征点的上方和下方的两个特征点，若该梯度方向为135度，该相邻特征点即为该边缘特征点的右上方和左下方的两个特征点，这样，若该边缘特征点的概率值小于该相邻特征点的概率值，确定该边缘特征点为该非目标边缘特征点。

这样，可以针对每个尺度对应的边缘特征点，将该尺度对应的边缘特征点中的全部该非目标边缘特征点剔除，得到该尺度对应的该目标边缘特征点，在一种可能的实现方式中，针对每个边缘特征点，可以将该目标边缘特征点的像素值置为1，将该非目标边缘特征点的像素值置为0，从而实现了只保留该目标边缘特征点，此处仅是举例说明，本公开对此不作限定。

下面对确定每个该边缘特征点的梯度方向的具体实现方式进行说明。

示例地，图3a-3b是根据一示例性实施例示出的一种采用Sobel算子计算梯度值的过程示意图，针对每一个边缘特征点，可以在以该边缘特征点为中心的八邻域范围，计算水平方向和垂直方向的梯度值，如图3a所示，以3×3的卷积核为例，利用局部差分寻找边缘，计算得到水平方向(x方向)和垂直方向(y方向)的sobel算子，如图3b所示，可以针对该边缘特征点，计算水平方向的梯度Gx和垂直方向的梯度Gy，然后根据以下公式计算该边缘特征点的梯度方向：

θ＝arctan(G_y/G_x)

其中，θ表示该梯度方向。

上述示例仅是举例说明，本公开对此不作限定。

在步骤S104中，根据多个尺度分别对应的该目标边缘特征点确定该待批改试卷的边缘特征图像。

在本步骤中，可以针对每个尺度，获取该尺度对应的预设权重；针对每个该目标边缘特征点，根据该目标边缘特征点在每个尺度对应的该预设权重以及概率值进行加权求和，得到该目标边缘特征点对应的目标概率值；根据预设概率阈值和每个该目标边缘特征点对应的该目标概率值确定该边缘特征图像。

其中，该边缘特征图像可以为包含待批改试卷的试卷边缘信息的二值图，在该二值图中，可以将试卷边缘区域的像素点的像素设置为1，将非试卷边缘区域的像素点的像素设置为0，或者反过来设置也可以，本公开对此不作限定。

示例地，假设边缘检测模型的侧边网络包括5个第三网络层，那么可以输出5个尺度的试卷边缘特征，为便于描述，可以将5个尺度分别对应的该预设权重表示为W1，W2，W3，W4，W5，对于每个该目标边缘特征点，基于上述5个第三网络层，可以分别确定出不同尺度对应的概率值，例如，对于目标边缘特征点A来说，基于第一个第三网络层输出的边缘信息中，目标边缘特征点A对应的概率值为，基于第二个第三网络层输出的边缘信息中，目标边缘特征点A对应的概率值为A2，基于第三个第三网络层输出的边缘信息中，目标边缘特征点A对应的概率值为A3，基于第四个第三网络层输出的边缘信息中，目标边缘特征点A对应的概率值为A4，基于第五个第三网络层输出的边缘信息中，目标边缘特征点A对应的概率值为A5，这样，可以按照加权求和的方式计算得到目标边缘特征点A对应的该目标概率值为W1*A1+W2*A2+W3*A3+W4*A4+W5*A5，这样，可以按照类似的方法计算出每个该目标边缘特征点对应的该目标概率值，上述示例仅是举例说明，本公开对此不作限定。

这样，在根据预设概率阈值和每个该目标边缘特征点对应的该目标概率值确定该边缘特征图像的过程中，针对每个该目标边缘特征点，若该目标边缘特征点的该目标概率值大于或者等于对应的该预设概率阈值，可以将该目标边缘特征点对应的像素值置为1，否则将该目标边缘特征点对应的像素值置为0，从而可以得到包含待批改试卷的试卷边缘信息的该边缘特征图像。

在步骤S105中，从该边缘特征图像中获取该待批改试卷的边缘信息，并根据该边缘信息从该原始图像中提取出该试卷区域图像。

其中，该边缘信息可以为边缘特征图像中像素值为预设值(如0或者1)的像素点的位置信息，若在步骤S104中用1表示试卷边缘像素点的像素值，用0表示非试卷边缘像素点的像素值，那么可以从该边缘特征图像中获取像素值为1的像素点的位置信息作为该边缘信息，此处仅是举例，本公开对此不作限定。

这样，在本步骤中，可以根据该边缘信息对该原始图像进行透视变换，得到该试卷区域图像，即根据试卷边缘像素点的位置信息对该原始图像进行透视变换，得到去掉背景图像的该试卷区域图像，该试卷区域图像可以视为近似于通过扫描的方式获取到的试卷图像，从而方便后续基于该试卷区域图像进行试卷的自动批改。

在步骤S106中，根据该试卷区域图像对该待批改试卷进行批改。

其中，本公开主要是对该待批改试卷中的客观题(如选择题、判断题以及填空题)进行批改。

考虑到实际的应用场景中，由于用户拍照角度的问题，试卷中的文本往往具有一定的倾斜角度，若基于倾斜的文本直接进行图像识别后进行判卷，势必会影响试卷批改结果的准确性，因此，在执行本步骤之前，可以先对试卷中的文本倾斜问题进行矫正。

图4是根据图1所示实施例示出的一种试卷批改的方法的流程图，如图4所示，在执行S106之前，该方法还包括以下步骤：

在步骤S107中，对该试卷区域图像进行直线检测，得到该试卷区域图像中的试卷文本对应的文本行直线；根据该文本行直线与预设水平直线之间的夹角确定该试卷文本的倾斜角度；根据该倾斜角度对该试卷区域图像进行文本倾斜矫正，得到矫正图像。

其中，对该试卷区域图像进行直线检测的具体实现方式，以及根据该倾斜角度对该试卷区域图像进行文本倾斜矫正，得到矫正图像的具体实现方式，可以参考相关文献中的描述，在此不作限定。

这样，在执行步骤S106时，可以根据该矫正图像对该待批改试卷进行批改，从而提高试卷批改的准确率。

另外，可以理解的是，在对试卷中的每道题目进行批改之前，需要先识别出每个题目的区域位置，然后根据区域位置对该试卷区域图像进行区域划分，得到每个试题分别对应的子区域图像，这样可以针对每个待批改的试题，根据该试题对应的该子区域图像对该试题进行批改，因此，图5是根据图4所示实施例示出的一种试卷批改的方法的流程图，如图5所示，该执行步骤S106之前，该方法还包括以下步骤：

在步骤S108中，将该矫正图像输入预先训练得到的第一定位模型，得到该待批改试卷中每个试题分别对应的试题起始标识位置信息以及作答区域位置信息。

其中，该第一定位模型可以包括Cascade-rcnn网络模型，该试题起始标识位置信息可以包括每个试题的题号的位置信息，并且可以用该题号所在位置的矩形区域的顶点坐标(四个顶点坐标或者矩形的对角线上的两个顶点的坐标)表示该题号的位置信息，同样的，可以用该作答区域对应的矩形区域的顶点坐标表示该作答区域的位置信息。

该题号可以为汉字、数字、括号+数字等方式构成，对于客观题的作答区域来说，作答区域一般为手写+括号或者手写+下划线的样式，选择题一般为ABCD等手写选项，判断题一般为手写对错号，填空题一般为手写答案+下划线或者手写+括号，这些都有相对明显的形状和位置特征，因此，可以根据该形状和位置特征预先训练该第一定位模型，从而基于该第一定位模型实现对试卷中客观题的题号以及作答区域的位置的识别。

考虑到针对客观题来说，题号和作答区域均为多为小目标或者细长条区域，与通用的目标不同，原有Cascade-rcnn网络模型中，网络生成的anchor过大，导致生成的anchor包含过多的背景，对网络的目标检测性能以及坐标回归精度都会产生较大影响，因此，为提高模型的识别准确率，可以对网络结构进行调整，改变网络anchor的生成方式，该Cascade-rcnn网络模型中的anchor生成时的缩放尺度参数为M·scales，在本公开中可以设置0<M<1，scales为该Cascade-rcnn网络模型的预设初始anchor尺度控制参数，这样可以缩小anchor的尺寸，提高目标检测的准确率及坐标回归的精度。

在一种可能的实现方式中，该Cascade-rcnn网络模型中的anchor生成时的缩放尺度参数为

在步骤S109中，将该矫正图像输入预先训练得到的第二定位模型，得到每个该试题分别对应的题目识别信息，该题目识别信息包括题目位置信息。

其中，该第二定位模型包括Mask-rcnn网络模型，该题目位置信息可以包括包含整个试题在内的矩形区域的顶点坐标。

考虑到在客观题题目区域检测上，由于题目题干相邻较为紧密，题与题之间不具备明显的分割特征，因此采用纯检测回归的方式很难取得较好的切割效果，Mask-rcnn是在表现优秀的目标检测网络Faster R-cnn的基础上增加一个分支，用输出物体的掩膜(Mask)，即实现对目标的分割任务，语义分割通过对图像像素级别进行分类，对图像有着比目标检测更为精细的理解，而Mask-Rcnn在语义分割的基础上实现了对Mask类别的判断，完成了图像的实力分割任务，通过将Mask和检测框进行组合，能够得到更为精确的分割结果。

在步骤S110中，根据该试题起始标识位置信息、该作答区域位置信息以及该题目位置信息确定每个该试题分别对应的区域位置，并根据该区域位置对该试卷区域图像进行区域划分，得到每个该试题分别对应的子区域图像。

在本步骤一种可能的实现方式中，可以针对每个试题的该题目位置信息，将包含在该题目位置信息对应的位置范围内的该起始标识位置信息和该作答区域位置信息视为对应同一个试题的位置信息，然后根据该试题对应的三类位置信息确定出该试题对应的最小外接矩形的顶点坐标，并将该最小外接矩形的顶点坐标作为该试题对应的区域位置。

这样，在执行步骤S106时，可以针对该待批改试卷中的多个待批改的试题中的每个试题，根据该试题对应的该子区域图像对该试题进行批改。

进一步地，考虑到实际的试卷批改场景中，不同的题目类型对应的试卷批改策略也不相同，例如，对于选择题和判断题来说，一般是答案标准答案完全一致，才视为该试题答案正确，对于填空题来说，答案与标准答案的匹配度较高的情况下，即可视为答案正确，因此，在对每个试题进行批改之前，有必要识别每个试题的题目类型，然后基于题目类型的不同，选择对应的批改策略，提高试卷批改的准确程度。

在本公开中，在基于该第二定位模型，得到每个该试题分别对应的题目位置信息的同时，还可以基于该第二定位模型得到每个该试题分别对应的题目类型(该第二定位模型在预先训练过程中，可以将题目类型和题目位置信息一起作为训练标签训练该第二定位模型)，也就是说，该题目识别信息还包括该试题分别对应的题目类型。

这样，在根据该试题对应的该子区域图像对该试题进行批改的过程中，可以对该子区域图像中的作答区域进行文字识别，得到该试题对应的识别答案；获取预先设置的该试题对应的标准答案；将该识别答案与该标准答案进行字符匹配，得到字符匹配度；获取该试题对应的预设匹配度阈值；根据该字符匹配度和该预设匹配度阈值对该试题进行批改。

其中，可以根据该试题对应的该题目类型获取该试题对应的该预设匹配度阈值，例如，对于题目类型为选择题和判断题来说，该预设匹配度阈值可以设置为100％，对于题目类型为选填空来说，该预设匹配度阈值可以设置为90％，此处仅是举例说明，本公开对此不作限定。

采用上述方法，可以通过对边缘检测模型进行改进，主干网络采用去掉全连接层以及最后N层池化层的VGG网络，或者主干网络选用残差网络，以此强化网络对弱边缘信息的提取能力，并且可以采用非极大抑制算法对边缘检测模型得到的边缘特征点进行筛选，保留主要的边缘特征点，进一步提高了对试卷图像的边缘检测能力，进而提高了模型对背景复杂或者背景与试卷融合度较高的试卷图像的识别准确率；另外，针对拍照上传的试卷图像中存在文本倾斜扭曲的现象，可以通过对试卷区域图像进行直线检测，得到试卷区域图像中的试卷文本对应的文本行直线；然后根据该文本行直线与预设水平直线之间的夹角确定该试卷文本的倾斜角度；以便根据该倾斜角度对该试卷区域图像进行文本倾斜矫正，这样基于矫正后的试卷图像进行试卷的批改，可以明显提高试卷批改结果的准确率。

图6是根据一示例性实施例示出的一种试卷批改的装置的框图，如图5所示，该装置包括：

获取模块601，用于获取待批改试卷对应的原始图像，该原始图像包括背景区域图像以及该待批改试卷的试卷区域图像；

第一确定模块602，用于将该原始图像输入预先训练得到的边缘检测模型，得到多个尺度分别对应的边缘特征点，该边缘检测模型的模型结构包括主干网络和与该主干网络连接的侧边网络，该主干网络为在VGG网络的基础上去掉全连接层以及最后N层池化层得到的网络，或者该主干网络包括残差网络ResNet网络，该N为预设数量；

特征点筛选模块603，用于针对每个尺度对应的该边缘特征点，采用非极大抑制算法剔除该尺度对应的边缘特征点中的非目标边缘特征点，得到该尺度对应的目标边缘特征点，该非目标边缘特征点包括该边缘特征点中除局部像素最大值以外的其它特征点；

第二确定模块604，用于根据多个尺度分别对应的该目标边缘特征点确定该待批改试卷的边缘特征图像；

提取模块605，用于从该边缘特征图像中获取该待批改试卷的边缘信息，并根据该边缘信息从该原始图像中提取出该试卷区域图像；

批改模块606，用于根据该试卷区域图像对该待批改试卷进行批改。

关于上述实施例中的装置，其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

采用上述装置，可以通过对边缘检测模型进行改进，主干网络采用去掉全连接层以及最后N层池化层的VGG网络，或者主干网络选用残差网络，以此强化网络对弱边缘信息的提取能力，并且可以采用非极大抑制算法对边缘检测模型得到的边缘特征点进行筛选，保留主要的边缘特征点，进一步提高了对试卷图像的边缘检测能力，进而提高了模型对背景复杂或者背景与试卷融合度较高的试卷图像的识别准确率。

图7是根据一示例性实施例示出的一种电子设备700的框图。如图7所示，该电子设备700可以包括：处理器701，存储器702。该电子设备700还可以包括多媒体组件703，输入/输出(I/O)接口704，以及通信组件705中的一者或多者。

其中，处理器701用于控制该电子设备700的整体操作，以完成上述的试卷批改方法中的全部或部分步骤。存储器702用于存储各种类型的数据以支持在该电子设备700的操作，这些数据例如可以包括用于在该电子设备700上操作的任何应用程序或方法的指令，以及应用程序相关的数据，例如联系人数据、收发的消息、图片、音频、视频等等。该存储器702可以由任何类型的易失性或非易失性存储设备或者它们的组合实现，例如静态随机存取存储器(Static Random Access Memory，简称SRAM)，电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory，简称EEPROM)，可擦除可编程只读存储器(Erasable Programmable Read-Only Memory，简称EPROM)，可编程只读存储器(Programmable Read-Only Memory，简称PROM)，只读存储器(Read-Only Memory，简称ROM)，磁存储器，快闪存储器，磁盘或光盘。多媒体组件703可以包括屏幕和音频组件。其中屏幕例如可以是触摸屏，音频组件用于输出和/或输入音频信号。例如，音频组件可以包括一个麦克风，麦克风用于接收外部音频信号。所接收的音频信号可以被进一步存储在存储器702或通过通信组件705发送。音频组件还包括至少一个扬声器，用于输出音频信号。I/O接口704为处理器701和其他接口模块之间提供接口，上述其他接口模块可以是键盘，鼠标，按钮等。这些按钮可以是虚拟按钮或者实体按钮。通信组件705用于该电子设备700与其他设备之间进行有线或无线通信。无线通信，例如Wi-Fi，蓝牙，近场通信(Near FieldCommunication，简称NFC)，2G、3G、4G、NB-IOT、eMTC、或其他5G等等，或它们中的一种或几种的组合，在此不做限定。因此相应的该通信组件705可以包括：Wi-Fi模块，蓝牙模块，NFC模块等等。

在一示例性实施例中，电子设备700可以被一个或多个应用专用集成电路(Application Specific Integrated Circuit，简称ASIC)、数字信号处理器(DigitalSignal Processor，简称DSP)、数字信号处理设备(Digital Signal Processing Device，简称DSPD)、可编程逻辑器件(Programmable Logic Device，简称PLD)、现场可编程门阵列(Field Programmable Gate Array，简称FPGA)、控制器、微控制器、微处理器或其他电子元件实现，用于执行上述的试卷批改方法。

在另一示例性实施例中，还提供了一种包括程序指令的计算机可读存储介质，该程序指令被处理器执行时实现上述的试卷批改方法的步骤。例如，该计算机可读存储介质可以为上述包括程序指令的存储器702，上述程序指令可由电子设备700的处理器701执行以完成上述的试卷批改方法。

以上结合附图详细描述了本公开的优选实施方式，但是，本公开并不限于上述实施方式中的具体细节，在本公开的技术构思范围内，可以对本公开的技术方案进行多种简单变型，这些简单变型均属于本公开的保护范围。

另外需要说明的是，在上述具体实施方式中所描述的各个具体技术特征，在不矛盾的情况下，可以通过任何合适的方式进行组合，为了避免不必要的重复，本公开对各种可能的组合方式不再另行说明。

此外，本公开的各种不同的实施方式之间也可以进行任意组合，只要其不违背本公开的思想，其同样应当视为本公开所公开的内容。

Claims

1.一种试卷批改方法，其特征在于，所述方法包括：

获取待批改试卷对应的原始图像，所述原始图像包括背景区域图像以及所述待批改试卷的试卷区域图像；

将所述原始图像输入预先训练得到的边缘检测模型，得到多个尺度分别对应的边缘特征点，所述边缘检测模型的模型结构包括主干网络和与所述主干网络连接的侧边网络，所述主干网络为在VGG网络的基础上去掉全连接层以及最后N层池化层得到的网络，或者所述主干网络包括残差网络ResNet网络，所述N为预设数量；

针对每个尺度对应的所述边缘特征点，采用非极大抑制算法剔除该尺度对应的边缘特征点中的非目标边缘特征点，得到该尺度对应的目标边缘特征点，所述非目标边缘特征点包括所述边缘特征点中除局部像素最大值以外的其它特征点；

根据多个尺度分别对应的所述目标边缘特征点确定所述待批改试卷的边缘特征图像；

从所述边缘特征图像中获取所述待批改试卷的边缘信息，并根据所述边缘信息从所述原始图像中提取出所述试卷区域图像；

根据所述试卷区域图像对所述待批改试卷进行批改；

所述根据多个尺度分别对应的所述目标边缘特征点确定所述待批改试卷的边缘特征图像包括：

针对每个尺度，获取该尺度对应的预设权重；

针对每个所述目标边缘特征点，根据该目标边缘特征点在每个尺度对应的所述预设权重以及概率值进行加权求和，得到该目标边缘特征点对应的目标概率值；

根据预设概率阈值和每个所述目标边缘特征点对应的所述目标概率值确定所述边缘特征图像。

2.根据权利要求1所述的方法，其特征在于，所述主干网络包括多个依次连接的第一网络层和多个依次连接的第二网络层，所述侧边网络包括多个第三网络层，其中，最后一个所述第一网络层与第一个所述第二网络层连接，每个所述第一网络层和每个所述第二网络层后均连接有一个所述第三网络层；所述将所述原始图像输入预先训练得到的边缘检测模型，得到多个尺度分别对应的边缘特征点包括：

将所述原始图像输入所述边缘检测模型后，通过每个所述第三网络层输出不同尺度的所述边缘特征点，不同的第三网络层输出不同尺度的边缘特征点。

3.根据权利要求1所述的方法，其特征在于，所述采用非极大抑制算法剔除该尺度对应的边缘特征点中的非目标边缘特征点，得到该尺度对应的目标边缘特征点包括：

针对该尺度对应的每个边缘特征点，确定该边缘特征点的概率值是否小于相邻特征点的概率值，所述相邻特征点为在该边缘特征点对应的梯度方向上与该边缘特征点位置相邻的两个像素点，所述概率值用于表征该边缘特征点是否为所述待批改试卷的边缘像素点的概率值；

若该边缘特征点的概率值小于所述相邻特征点的概率值，将该边缘特征点作为所述非目标边缘特征点；

将该尺度对应的边缘特征点中的全部所述非目标边缘特征点剔除，得到该尺度对应的所述目标边缘特征点。

4.根据权利要求1所述的方法，其特征在于，所述根据所述边缘信息从所述原始图像中提取出所述试卷区域图像包括：

根据所述边缘信息对所述原始图像进行透视变换，得到所述试卷区域图像。

5.根据权利要求1所述的方法，其特征在于，在所述根据所述试卷区域图像对所述待批改试卷进行批改之前，所述方法还包括：

对所述试卷区域图像进行直线检测，得到所述试卷区域图像中的试卷文本对应的文本行直线；

根据所述文本行直线与预设水平直线之间的夹角确定所述试卷文本的倾斜角度；

根据所述倾斜角度对所述试卷区域图像进行文本倾斜矫正，得到矫正图像；

所述根据所述试卷区域图像对所述待批改试卷进行批改包括：

根据所述矫正图像对所述待批改试卷进行批改。

6.根据权利要求1-5任一项所述的方法，其特征在于，在所述根据所述试卷区域图像对所述待批改试卷进行批改之前，所述方法还包括：

将所述试卷区域图像输入预先训练得到的第一定位模型，得到所述待批改试卷中每个试题分别对应的试题起始标识位置信息以及作答区域位置信息；

将所述试卷区域图像输入预先训练得到的第二定位模型，得到每个所述试题分别对应的题目识别信息，所述题目识别信息包括题目位置信息；

根据所述试题起始标识位置信息、所述作答区域位置信息以及所述题目位置信息确定每个所述试题分别对应的区域位置，并根据所述区域位置对所述试卷区域图像进行区域划分，得到每个所述试题分别对应的子区域图像；

针对所述待批改试卷中的多个待批改的试题中的每个试题，根据该试题对应的所述子区域图像对该试题进行批改。

7.根据权利要求6所述的方法，其特征在于，所述根据该试题对应的所述子区域图像对该试题进行批改包括：

对所述子区域图像中的作答区域进行文字识别，得到该试题对应的识别答案；

获取预先设置的该试题对应的标准答案；

将所述识别答案与所述标准答案进行字符匹配，得到字符匹配度；

获取该试题对应的预设匹配度阈值；

根据所述字符匹配度和所述预设匹配度阈值对该试题进行批改。

8.根据权利要求7所述的方法，其特征在于，所述题目识别信息还包括所述试题分别对应的题目类型；所述获取该试题对应的预设匹配度阈值包括：

根据该试题对应的所述题目类型获取该试题对应的所述预设匹配度阈值。

9.根据权利要求6所述的方法，其特征在于，所述第一定位模型包括Cascade-rcnn网络模型，所述第二定位模型包括Mask-rcnn网络模型，所述Cascade-rcnn网络模型中的anchor生成时的缩放尺度参数为M·scales，其中，0<M<1，scales为所述Cascade-rcnn网络模型的预设初始anchor尺度控制参数。

10.根据权利要求9所述的方法，其特征在于，所述Cascade-rcnn网络模型中的anchor生成时的缩放尺度参数为

11.一种试卷批改装置，其特征在于，所述装置包括：

获取模块，用于获取待批改试卷对应的原始图像，所述原始图像包括背景区域图像以及所述待批改试卷的试卷区域图像；

第一确定模块，用于将所述原始图像输入预先训练得到的边缘检测模型，得到多个尺度分别对应的边缘特征点，所述边缘检测模型的模型结构包括主干网络和与所述主干网络连接的侧边网络，所述主干网络为在VGG网络的基础上去掉全连接层以及最后N层池化层得到的网络，或者所述主干网络包括残差网络ResNet网络，所述N为预设数量；

特征点筛选模块，用于针对每个尺度对应的所述边缘特征点，采用非极大抑制算法剔除该尺度对应的边缘特征点中的非目标边缘特征点，得到该尺度对应的目标边缘特征点，所述非目标边缘特征点包括所述边缘特征点中除局部像素最大值以外的其它特征点；

第二确定模块，用于根据多个尺度分别对应的所述目标边缘特征点确定所述待批改试卷的边缘特征图像；

提取模块，用于从所述边缘特征图像中获取所述待批改试卷的边缘信息，并根据所述边缘信息从所述原始图像中提取出所述试卷区域图像；

批改模块，用于根据所述试卷区域图像对所述待批改试卷进行批改；

所述第二确定模块，用于针对每个尺度，获取该尺度对应的预设权重；针对每个所述目标边缘特征点，根据该目标边缘特征点在每个尺度对应的所述预设权重以及概率值进行加权求和，得到该目标边缘特征点对应的目标概率值；根据预设概率阈值和每个所述目标边缘特征点对应的所述目标概率值确定所述边缘特征图像。

12.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现权利要求1-10中任一项所述方法的步骤。

13.一种电子设备，其特征在于，包括：

存储器，其上存储有计算机程序；

处理器，用于执行所述存储器中的所述计算机程序，以实现权利要求1-10中任一项所述方法的步骤。