CN112541922A

CN112541922A - 基于数字图像的试卷布局分割方法、电子设备及存储介质

Info

Publication number: CN112541922A
Application number: CN202011403765.1A
Authority: CN
Inventors: 胡四泉; 张木良; 石志国
Original assignee: University of Science and Technology Beijing USTB; Shunde Graduate School of USTB
Current assignee: University of Science and Technology Beijing USTB; Shunde Graduate School of USTB
Priority date: 2020-12-04
Filing date: 2020-12-04
Publication date: 2021-03-23

Abstract

本发明公开了一种基于数字图像的试卷布局分割方法、电子设备及存储介质。所述方法包括：构建样本图像集和标注图像集；构建深度学习模型并进行训练；将待分割试卷的数字图像作为训练好的深度学习模型的输入，得到分割结果图像；对分割结果图像中的各颜色区域进行定位，得到其轮廓坐标，并基于轮廓坐标计算得到相应的待分割试卷的数字图像中的各区域的分割坐标；根据分割坐标提取待分割试卷的各区域，完成待分割试卷的布局分割。本发明解决了试卷智能分析中面临的卷面布局复杂问题，将各种区域进行分割，准确高效地定位试卷中的内容，使得后续的识别和整理等智能分析过程能够顺利进行。

Description

基于数字图像的试卷布局分割方法、电子设备及存储介质

技术领域

本发明涉及计算机视觉技术领域，特别涉及一种基于数字图像的试卷布局分割方法、电子设备及存储介质。

背景技术

分析试卷可以使学生总结和整理知识点，准确地找到薄弱点进行具有针对性的学习。在整理试卷的过程中，一些学生将题目抄写到笔记本中，这种方法费时费力，并且纸质材料也难以保存和修改。

因此寻求电子化、智能化的试卷分析方法显得非常重要。在试卷分析的智能化研究中，基于图像的试卷布局分割是进行试卷中各部分内容处理的关键步骤。试卷布局是指在试卷图像中，可以划分出题号、题干、图片、答题、表格等多个区域，只有准确地分割出各个区域才能做到对试卷内容的进一步的处理。

但现实情况中各种试卷结构不同，题目变化多样成为准确分割试卷布局的重点和难点。而目前提出的模板或标记的试卷布局分割方法需要为每份试卷提供特定的模板或标记信息，即在试卷的各个位置提前留下标记图像，但是实际应用中，由于学生所接触到的试卷往往来自全国各地，难以在每一张试卷的印刷中都具有规范且统一的额外标记信息，因此，现有的这种方法适用范围有限。

发明内容

本发明提供了一种基于数字图像的试卷布局分割方法，以解决现有技术在试卷分割中需要提前做好模板或标记信息，其应用具有一定局限的技术问题。

为解决上述技术问题，本发明提供了如下技术方案：

一方面，本发明提供了一种基于数字图像的试卷布局分割方法，包括：

构建样本图像集和标注图像集；其中，所述样本图像集中的图像为试卷的数字图像，所述标注图像集中的图像为与所述数字图像对应的标注图像，且所述标注图像中与所述数字图像的不同区域对应的部分被填充为不同的颜色；

构建深度学习模型，并采用所述样本图像集和标注图像集对模型进行训练；

将待分割试卷的数字图像作为训练好的深度学习模型的输入，基于训练好的深度学习模型，得到与所述标注图像形式相同的分割结果图像；

对所述分割结果图像中的各颜色区域进行定位，得到其轮廓坐标，并基于所述轮廓坐标计算得到相应的待分割试卷的数字图像中的各区域的分割坐标；

根据所述分割坐标提取待分割试卷的各区域，完成待分割试卷的布局分割。

进一步地，构建样本图像集和标注图像集，包括：

对纸质试卷进行拍摄，对拍摄到的图像进行二值化运算，得到黑白图像，对所述黑白图像进行缩放操作，得到预设大小的数字图像，以构建样本图像集；

构建与缩放后的数字图像大小相同的纯色图像，根据所述数字图像的布局和分割需要，为所述纯色图像中与所述数字图像的各区域对应的坐标范围内分别赋予不同的颜色，其余部分保留背景色，得到标注图像，以构建标注图像集。

进一步地，所述数字图像的区域包括题号、题干、图片和表格中的任意一种或多种的组合。

进一步地，构建深度学习模型并采用所述样本图像集和标注图像集对模型进行训练，包括：

以U-NET语义分割模型作为基础模型，结合生成对抗网络的对抗思想，构建基于生成对抗网络的深度学习模型；

以所述样本图像集和标注图像集构建图像集，将所述图像集按照8：2的比例划分为训练集和测试集；基于所述训练集和测试集，对构建的模型进行训练。

进一步地，对所述分割结果图像中的各颜色区域进行定位，得到其轮廓坐标，并基于所述轮廓坐标计算得到相应的待分割试卷的数字图像中的各区域的分割坐标，包括：

通过预设轮廓检测算法检测所述分割结果图像中的各颜色区域轮廓坐标；

基于所述轮廓坐标，计算各颜色区域的最小外接矩形，得到矩形坐标；

将各颜色区域对应的矩形坐标与待分割试卷的数字图像进行坐标对应，得到相应的待分割试卷的数字图像中的各区域的矩形分割坐标。

进一步地，对所述分割结果图像中的各颜色区域进行定位，得到其轮廓坐标，并基于轮廓坐标计算得到相应的待分割试卷的数字图像中的各区域的分割坐标，还包括：

将所述分割结果图像转变为HSV图像，根据HSV颜色空间的颜色范围定义，识别所述分割结果图像中的各区域的颜色；

根据预设的颜色与区域类型的对应关系，识别各区域的类型。

当识别的区域类型为题号时，根据两个题号的纵坐标，向上方取预设数量的像素点作为题目分割线的偏移量，得到每一道的题目的区域；

其余区域只需将纵坐标与题目区域进行对比即可得到题目区域划分结果；

当识别的区域类型为题干或图片时，记录其矩形坐标以及所属区域类别。

进一步地，根据分割坐标提取待分割试卷的各区域，完成待分割试卷的布局分割，包括：

根据各矩形分割坐标剪裁待分割试卷的数字图像，得到各矩形分割坐标对应的内容，根据所属的类别记录分别将各内容保存至对应的文件夹中，根据题目区域划分以及矩形坐标在文件命名中记录各内容所属题号区域和坐标信息。

另一方面，本发明还提供了一种电子设备，其包括处理器和存储器，存储器中存储有至少一条指令，当所述指令由处理器加载并执行时，实现上述方法。

再一方面，本发明还提供了一种存储介质，所述存储介质中存储有至少一条指令，当所述指令由处理器加载并执行时，实现上述方法。

本发明提供的技术方案带来的有益效果至少包括：

本发明提供了一种仅基于试卷的数字图像，即可得到对试卷布局进行高精度的定位和分割的方法，本发明的方法不依赖模板和标记，仅基于手机等设备拍摄的试卷的数字图像，即可对试卷布局进行分割，得到高精度的区域定位，为试卷后续的进一步智能分析打下了基础，降低了学生工作量。且由于本发明的方法无需事先在试卷中进行模板搭建或标记，因此，具有更加广泛的适用性。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的基于数字图像的试卷布局分割方法的流程图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合附图对本发明实施方式作进一步地详细描述。

第一实施例

本实施例提供了一种基于数字图像的试卷布局分割方法，该基于数字图像的试卷布局分割方法的执行流程如图1所示，包括以下步骤：

S1，构建样本图像集和标注图像集；其中，样本图像集中的图像为试卷的数字图像，标注图像集中的图像为与数字图像对应的标注图像，且标注图像中与数字图像的不同区域对应的部分被填充为不同的颜色；

具体地，在本实施例中，上述步骤的实现过程如下：

由手机或其他拍摄设备对收集的纸质试卷样本分别进行拍摄，得到每一页试卷的数字图像，图像宽高比为3：4。对拍摄到的图像进行二值化运算，得到黑白图像，接着对得到的黑白图像进行缩放操作，将图像缩放到768*1024的大小，目的是节省存储空间、在提高运算速度的同时，保留试卷布局特征不丢失。将试卷每一页视为一张数字图像样本，从而得到样本图像集。

构建同样768*1024大小的纯黑图像，根据相应的样本图像的布局和分割需要，为纯黑图像中与样本图像的题号、题干、图片、表格等区域的坐标范围内分别赋予不同颜色，其余区域保留背景色，得到标注图像，以构建标注图像集。

具体地，在本实施例中，将题号对应的部分填充为红色，题干对应的部分填充为蓝色，图片对应的部分填充为黄色，其余区域与背景为黑色；当然，可以理解的是，对于各区域的表示颜色可根据需求设置，本实施例对此不作限定。

S2，构建深度学习模型，并采用样本图像集和标注图像集对模型进行训练；

具体地，在本实施例中，是将语义分割技术与对抗网络技术相结合，基于少量的试卷数字图像数据集，利用平滑平均绝对误差和对抗损失函数相结合，通过学习试卷布局特征来构建深度学习模型。具体实现过程如下：

以样本图像集和标注图像集共同构成数据集，随后将数据集按照8:2的比例划分为训练集和测试集。

以U-NET语义分割模型作为基础模型，结合生成对抗网络的对抗思想，构建基于对抗网络的语义分割模型。将数据集中的样本图像作为模型的输入，通过卷积、池化、激活函数以及反卷积等计算操作。计算得到的生成结果与标注图像的平滑平均绝对误差(公式1)，结合针对生成结果计算对抗损失(公式2)得到损失函数(公式3)。

V_c(D,G)＝E_x[lnD(x|y)]+E_z[ln(1-D(G(z|y)))] (2)

L_G＝αL_1smooth-β(lnD(G(y))) (3)

其中，G是生成器，D是判别器，x是样本图像，y是标注图像。D(x|y)表示判别器判断样本图像为样本图像的概率，而D(G(z|y))是判别器判断生成结果为样本图像的概率。

通过以上构建方法，基于上述S1构建的数据集，经过离线学习，得到深度学习语义分割模型，实现对试卷数字图像的语义分割。

S3，将待分割试卷的数字图像作为训练好的深度学习模型的输入，基于训练好的深度学习模型，得到与标注图像形式相同的分割结果图像；

具体地，在本实施例中，上述步骤为：通过模型的卷积、池化等运算操作，将规范化的输入图像转变得到带有多种颜色的分割结果图像。实现过程如下：

将S2训练得到的生成器模型提取出来，按照S1的方法获取新的待分割试卷的数字图像，经过预处理运算(自适应二值化和缩放处理)和深度学习模型运算，得到生成的分割结果图像。分割结果图像的形式与标注图像相同，由背景色和各区域的代表颜色构成，对应输入的试卷数字图像的各区域。

S4，对分割结果图像中的各颜色区域进行定位，得到其轮廓坐标，并基于轮廓坐标计算得到相应的待分割试卷的数字图像中的各区域的分割坐标；

具体地，在本实施例中，上述步骤的实现过程如下：

通过OpenCV轮廓检测得到S3中分割结果图像的各颜色区域轮廓坐标，随后计算其最小外接矩形，得到矩形坐标。同时通过将RGB图像转变为HSV图像，根据HSV颜色空间的颜色范围定义，识别其颜色。当颜色识别为题号对应颜色时，根据两个题号的纵坐标，向上方取少量像素点作为题目分割线的偏移量避免与题干区域坐标相交叉，得到y1和y2，计算出每一道的题目的区域(y1至y2之间)，其余区域只需将纵坐标与题目区域进行对比即可得到题目区域划分结果。当颜色识别为题干、图片等布局对应颜色时，记录其矩形坐标以及所属类别。从而达到智能划分整页中各题的目的。

S5，根据分割坐标提取待分割试卷的各区域，完成待分割试卷的布局分割。

具体地，在本实施例中，上述步骤的实现过程如下：

根据S4计算所得到的各项坐标。将待分割试卷的数字图像进行坐标对应，得到各区域的分割坐标。根据各矩形坐标剪裁待分割试卷的数字图像，将题号、题干、图片、答题、表格等多个区域在图像中进行提取。得到各矩形坐标对应的内容，根据各内容所属的类别记录分别将其保存至题干文件夹、图片文件夹等分类文件夹中；并根据题目区域划分以及矩形坐标信息在文件命名中记录其所属题号区域和坐标信息。由此得到详细且分类清晰的试卷布局分割结果。为进一步试卷题目识别、知识点分类等智能分析打下基础。

综上，本实施例提供了一种基于数字图像的，利用基于深度学习模型的语义分割技术完成试卷布局分割的方法，该方法利用深度学习模型对试卷中的各项特征进行学习，针对数字图像进行处理，依靠深度学习模型中的语义分割技术来高效准确地实现试卷布局分割。而且本实施例结合卷积神经网络技术和对抗网络技术，减少出现不合理分割结果，提升了方法的准确性。该方法无需依赖传统的模板和标记定位，依靠的核心是试卷布局中的常见显著特征，如题号、印刷体、手写体以及图片等内容进行布局分割，由于这些内容都具有明显不同的特征，且对于大部分试卷而言都具备这些基础布局特征，因此，本实施例的方法可以适用于更多试卷图像，具有成本低，适用范围广，且精度较高等优点。

第二实施例

本实施例提供一种电子设备，其包括处理器和存储器；其中，存储器中存储有至少一条指令，所述指令由处理器加载并执行，以实现第一实施例的方法。

该电子设备可因配置或性能不同而产生较大差异，可以包括一个或一个以上处理器(central processing units，CPU)和一个或一个以上存储器，其中，存储器中存储有至少一条指令，所述指令由处理器加载并执行，以实现上述方法。

第三实施例

本实施例提供一种存储介质，该存储介质中存储有至少一条指令，所述指令由处理器加载并执行，以实现上述第一实施例的方法。其中，该存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。其内存储的指令可由终端中的处理器加载并执行，以实现上述方法。

此外，需要说明的是，本发明可提供为方法、装置或计算机程序产品。因此，本发明实施例可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且，本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质上实施的计算机程序产品的形式。

本发明实施例是参照根据本发明实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上，使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

还需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。

最后需要说明的是，以上所述是本发明优选实施方式，应当指出，尽管已描述了本发明优选实施例，但对于本技术领域的技术人员来说，一旦得知了本发明的基本创造性概念，在不脱离本发明所述原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。所以，所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。

Claims

1.一种基于数字图像的试卷布局分割方法，其特征在于，所述方法包括：

2.如权利要求1所述的基于数字图像的试卷布局分割方法，其特征在于，构建样本图像集和标注图像集，包括：

3.如权利要求2所述的基于数字图像的试卷布局分割方法，其特征在于，所述数字图像的区域包括题号、题干、图片和表格中的任意一种或多种的组合。

4.如权利要求1所述的基于数字图像的试卷布局分割方法，其特征在于，构建深度学习模型并采用所述样本图像集和标注图像集对模型进行训练，包括：

5.如权利要求1所述的基于数字图像的试卷布局分割方法，其特征在于，对所述分割结果图像中的各颜色区域进行定位，得到其轮廓坐标，并基于所述轮廓坐标计算得到相应的待分割试卷的数字图像中的各区域的分割坐标，包括：

6.如权利要求5所述的基于数字图像的试卷布局分割方法，其特征在于，对所述分割结果图像中的各颜色区域进行定位，得到其轮廓坐标，并基于轮廓坐标计算得到相应的待分割试卷的数字图像中的各区域的分割坐标，还包括：

7.如权利要求6所述的基于数字图像的试卷布局分割方法，其特征在于，对所述分割结果图像中的各颜色区域进行定位，得到其轮廓坐标，并基于轮廓坐标计算得到相应的待分割试卷的数字图像中的各区域的分割坐标，还包括：

8.如权利要求7所述的基于数字图像的试卷布局分割方法，其特征在于，根据分割坐标提取待分割试卷的各区域，完成待分割试卷的布局分割，包括：

9.一种电子设备，包括处理器和存储器，所述存储器中存储有至少一条指令，其特征在于，当所述指令由所述处理器加载并执行时，实现如权利要求1-8任一项所述的方法。

10.一种存储介质，所述存储介质中存储有至少一条指令，其特征在于，当所述指令由处理器加载并执行时，实现如权利要求1-8任一项所述的方法。