CN114332901A

CN114332901A - 一种自动组卷方法及装置

Info

Publication number: CN114332901A
Application number: CN202111682938.2A
Authority: CN
Inventors: 曹超阳; 郭辉辉; 郭丰俊; 丁凯; 张驰; 李旭阳; 刘文亮; 郑齐; 陆大公; 龙腾
Original assignee: Shanghai Shengteng Data Technology Co ltd; Shanghai Yingwuchu Data Technology Co ltd; Shanghai Linguan Data Technology Co ltd; Shanghai Hehe Information Technology Development Co Ltd
Current assignee: Shanghai Shengteng Data Technology Co ltd; Shanghai Yingwuchu Data Technology Co ltd; Shanghai Linguan Data Technology Co ltd; Shanghai Hehe Information Technology Development Co Ltd
Priority date: 2021-12-31
Filing date: 2021-12-31
Publication date: 2022-04-12

Abstract

本申请公开了一种自动组卷方法。对图像进行裁剪，仅保留所述图像中的文档区域，去除所述图像中的非文档区域。通过神经网络方法对所述图像的文档区域进行检测，将所述图像的文档区域划分为印刷体子区域、印刷体手写体重叠子区域、手写体子区域。在所述图像的文档区域中，运用背景色填充手写体子区域；对于印刷体手写体重叠子区域，运用背景色填充手写内容，同时保留印刷内容的完整性。基于已训练的基于神经网络的目标检测算法并结合印刷体的形态特征，将所述图像的文档区域分割成一个或多个题目区域。将用户选择的、无手写内容、仅有完整印刷内容的题目区域组合生成为试卷。本申请能够将各题目缩放为统一的文字大小后再进行组卷排版。

Description

一种自动组卷方法及装置

技术领域

本申请涉及一种基于神经网络(Neural Network，NN)的组卷方法。

背景技术

在教育场景中，老师、学生等常常需要整理做过的作业、习题、试卷，并选择其中的部分题目——例如容易出错的题目——组合生成试卷，这被称为组卷。

现有的自动组卷方法中，如果将试卷一上的习题一和试卷二上的习题二组合生成新的试卷，试卷一与试卷二这两张图像上的字体类型和文字大小可能不一致，因此直接将习题一和习题二进行拼接会导致新的试卷的页面排版非常混乱。

发明内容

本申请所要解决的技术问题是提出一种自动组卷方法，可以显著提高组卷的灵活性和效率。

为解决上述技术问题，本申请提出了一种自动组卷方法，包括如下步骤。步骤S10：将做过的题目拍摄为图像，或者输入做过的题目的图像；对所述图像进行裁剪，仅保留所述图像中的文档区域，去除所述图像中的非文档区域。步骤S20：通过神经网络方法对所述图像的文档区域进行检测，将所述图像的文档区域划分为多个子区域，这些子区域分为三类：印刷体子区域、印刷体手写体重叠子区域、手写体子区域。步骤S30：在所述图像的文档区域中，运用背景色填充手写体子区域；对于印刷体手写体重叠子区域，运用背景色填充手写内容，同时保留印刷内容的完整性。步骤S40：基于已训练的基于神经网络的目标检测算法并结合印刷体的形态特征，将所述图像的文档区域分割成一个或多个题目区域，同时得到每个题目区域的位置信息；每个题目区域中仅包含题目内容。步骤S50：将所有题目区域列出，每个题目区域是一个小图片；这些题目区域均无手写内容、仅有完整印刷内容，供用户选择其中的部分或全部题目区域组合生成为试卷。

进一步地，所述步骤S10中，所述图像中的文档区域是指图像中有字符或图形的区域，仅有一个；所述图像中的非文档区域是指图像中的空白区域，分布在所述图像中的文档区域的四周。

进一步地，所述步骤S30中，采用图像修复方法通过判断缺失像素点对应周围像素点的信息依次修复缺失像素点，通过像素点分类结果来保留印刷内容的完整性。

优选地，所述步骤S40中，所述基于神经网络的目标检测算法采用无锚框的目标检测算法，所述印刷体的形态特征是指印刷体的边特征和一致性特征，所述图像的文档区域、印刷体的形态特征共同作为神经网络的输入。

进一步地，所述步骤S40中，所述基于神经网络的目标检测算法的训练是基于数据驱动完成的；数据驱动是指采集大量数据并将数据进行组织形成信息，之后对相关的信息进行整合和提炼，在数据的基础上经过训练和拟合形成自动化的决策模型。

优选地，所述步骤S50中，组合时允许编辑题目内容；首先通过光学字符识别的方法将题目由图片转换为可编辑的文本，然后编辑题目内容。

优选地，所述步骤S50中，组合时允许删除题目。

优选地，所述步骤S50中，组合时允许移动题目位置。

优选地，所述步骤S50中，组合时自动识别每个题目区域中的字体大小，并缩放为相同的字体大小。

本申请还提出了一种自动组卷装置，包括裁剪单元、子区域划分单元、手写填充单元、题目分割单元、以及组卷单元。所述裁剪单元用于将做过的题目拍摄为图像，或者输入做过的题目的图像；对所述图像进行裁剪，仅保留所述图像中的文档区域，去除所述图像中的非文档区域。所述子区域划分单元用来通过神经网络方法对所述图像的文档区域进行检测，将所述图像的文档区域划分为多个子区域，这些子区域分为三类：印刷体子区域、印刷体手写体重叠子区域、手写体子区域。所述手写填充单元用来在所述图像的文档区域中，运用背景色填充手写体子区域；对于印刷体手写体重叠子区域，运用背景色填充手写内容，同时保留印刷内容的完整性。所述题目分割单元用来基于已训练的基于神经网络的目标检测算法并结合印刷体的形态特征，将所述图像的文档区域分割成一个或多个题目区域，同时得到每个题目区域的位置信息；每个题目区域中仅包含题目内容。所述组卷单元用来将用户选择的、无手写内容、仅有完整印刷内容的题目区域组合生成为试卷。

本申请取得的技术效果是：通过数据驱动方法，实现了对输入图像的智能裁剪、三类子区域识别、手写内容填充、题目区域分割等，能够智能识别各题目在来源图片上的文字大小，统一缩放为相同的文字大小后再进行所组成试卷的排版，最终组卷出来的文字大小相对统一、排版精美。

附图说明

图1是本申请提出的自动组卷方法的流程示意图。

图2是本申请提出的自动组卷装置的结构示意图。

图中附图标记说明：10为裁剪单元、20为子区域划分单元、30为手写填充单元、40为题目分割单元、50为组卷单元。

具体实施方式

请参阅图1，本申请提出的自动组卷方法包括如下步骤。

步骤S10：将做过的题目(例如作业、习题、试卷等)拍摄为图像，或者输入做过的题目的图像；通过算法定位所述图像中的文档区域的边缘，自动地对所述图像进行裁剪，仅保留所述图像中的文档区域，去除所述图像中的非文档区域。

所述图像通常为矩形。所述图像中的文档区域是指图像中有字符或图形的区域，仅有一个，通常也为矩形，并且比整个图像的矩形更小。所述图像中的非文档区域是指图像中的空白区域，通常分布在文档区域的四周也就是整个图像的边缘。

步骤S20：通过神经网络方法对所述图像的文档区域进行检测，将所述图像的文档区域划分为多个子区域，这些子区域分为三类：印刷体子区域、印刷体手写体重叠子区域、手写体子区域。例如采用U-Net图像分割(image segmentation)算法对所述图像的文档区域的像素进行分类。U-Net是一种卷积神经网络(convolutional neural network)，最初用于对生物医学的图像分割。U-Net算法分为两个部分——特征提取部分和上采样部分，每次上采样部分和特征提取部分对应的特征融合，实现像素级别分类。

步骤S30：在所述图像的文档区域中，运用背景色填充手写体子区域，填充后的手写体子区域恢复到未书写时的初始状态；对于印刷体手写体重叠子区域，运用背景色填充手写内容，同时保留印刷内容的完整性。例如，采用图像修复(inpainting)方法通过判断缺失像素点对应周围像素点的信息依次修复缺失像素点，通过像素点分类结果来保留印刷内容的完整性。

步骤S40：基于已训练的基于神经网络的目标检测(object detection)算法并结合印刷体的形态特征，将所述图像的文档区域分割成一个或多个题目区域，同时得到每个题目区域的位置信息(例如坐标)。由于在步骤S30中去除了手写内容，因此每个题目区域中仅包含题目内容。

所述基于神经网络的目标检测算法例如采用无锚框(Anchor free)的目标检测算法，所述图像的文档区域、印刷体的形态特征共同作为神经网络的输入。所述印刷体的形态特征是指印刷体的边特征和一致性特征。所述形态特征用于协助提高目标检测算法的准确性，单纯靠目标检测算法或者形态特征均难以准确判断每个题目区域。所述基于神经网络的目标检测算法的训练例如是基于数据驱动(data driven)完成的。数据驱动是指采集大量数据并将数据进行组织形成信息，之后对相关的信息进行整合和提炼，在数据的基础上经过训练和拟合形成自动化的决策模型。简单来说，数据驱动就是以数据为中心依据进行决策和行动。

步骤S50：将所有题目区域列出，每个题目区域是一个小图片。这些题目区域均无手写内容、仅有完整印刷内容(为题目内容)，供用户选择其中的部分或全部题目区域组合生成为试卷。组合时允许编辑题目内容、删除题目、移动题目位置。如需在组合时编辑题目内容，则首先通过光学字符识别(Optical character recognition，OCR)的方法将题目由图片转换为可编辑的文本，然后编辑题目内容。优选地，组合时自动识别每个题目区域中的字体类型、字体大小，并替换为相同的字体类型和/或缩放为相同的字体大小。

请参阅图2，本申请提出的自动组卷装置包括裁剪单元10、子区域划分单元20、手写填充单元30、题目分割单元40、以及组卷单元50。

所述裁剪单元10用于将做过的题目拍摄为图像，或者输入做过的题目的图像；通过算法定位所述图像中的文档区域的边缘，自动地对所述图像进行裁剪，仅保留所述图像中的文档区域，去除所述图像中的非文档区域。

所述子区域划分单元20用来通过神经网络方法对所述图像的文档区域进行检测，将所述图像的文档区域划分为多个子区域，这些子区域分为三类：印刷体子区域、印刷体手写体重叠子区域、手写体子区域。

所述手写填充单元30用来在所述图像的文档区域中，运用背景色填充手写体子区域，填充后的手写体子区域恢复到未书写时的初始状态；对于印刷体手写体重叠子区域，运用背景色填充手写内容，同时保留印刷内容的完整性。

所述题目分割单元40用来基于已训练的基于神经网络的目标检测算法并结合印刷体的形态特征，将所述图像的文档区域分割成一个或多个题目区域，同时得到每个题目区域的位置信息。每个题目区域中仅包含内容。

所述组卷单元50用来将用户选择的、无手写内容、仅有完整印刷内容的题目区域组合生成为试卷。

本申请提出的自动组卷方法及装置能够智能识别各题目在来源图片上的文字大小，缩放为统一的文字大小后再进行所组成试卷的排版，最终组卷出来的文字大小相对统一、排版精美。

以上仅为本申请的优选实施例，并不用于限定本申请。对于本领域的技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

Claims

1.一种自动组卷方法，其特征是，包括如下步骤；

步骤S10：将做过的题目拍摄为图像，或者输入做过的题目的图像；对所述图像进行裁剪，仅保留所述图像中的文档区域，去除所述图像中的非文档区域；

步骤S20：通过神经网络方法对所述图像的文档区域进行检测，将所述图像的文档区域划分为多个子区域，这些子区域分为三类：印刷体子区域、印刷体手写体重叠子区域、手写体子区域；

步骤S30：在所述图像的文档区域中，运用背景色填充手写体子区域；对于印刷体手写体重叠子区域，运用背景色填充手写内容，同时保留印刷内容的完整性；

步骤S40：基于已训练的基于神经网络的目标检测算法并结合印刷体的形态特征，将所述图像的文档区域分割成一个或多个题目区域，同时得到每个题目区域的位置信息；每个题目区域中仅包含题目内容；

步骤S50：将所有题目区域列出，每个题目区域是一个小图片；这些题目区域均无手写内容、仅有完整印刷内容，供用户选择其中的部分或全部题目区域组合生成为试卷。

2.根据权利要求1所述的自动组卷方法，其特征是，所述步骤S10中，所述图像中的文档区域是指图像中有字符或图形的区域，仅有一个；所述图像中的非文档区域是指图像中的空白区域，分布在所述图像中的文档区域的四周。

3.根据权利要求1所述的自动组卷方法，其特征是，所述步骤S30中，采用图像修复方法通过判断缺失像素点对应周围像素点的信息依次修复缺失像素点，通过像素点分类结果来保留印刷内容的完整性。

4.根据权利要求1所述的自动组卷方法，其特征是，所述步骤S40中，所述基于神经网络的目标检测算法采用无锚框的目标检测算法，所述印刷体的形态特征是指印刷体的边特征和一致性特征，所述图像的文档区域、印刷体的形态特征共同作为神经网络的输入。

5.根据权利要求1所述的自动组卷方法，其特征是，所述步骤S40中，所述基于神经网络的目标检测算法的训练是基于数据驱动完成的；数据驱动是指采集大量数据并将数据进行组织形成信息，之后对相关的信息进行整合和提炼，在数据的基础上经过训练和拟合形成自动化的决策模型。

6.根据权利要求1所述的自动组卷方法，其特征是，所述步骤S50中，组合时允许编辑题目内容；首先通过光学字符识别的方法将题目由图片转换为可编辑的文本，然后编辑题目内容。

7.根据权利要求1所述的自动组卷方法，其特征是，所述步骤S50中，组合时允许删除题目。

8.根据权利要求1所述的自动组卷方法，其特征是，所述步骤S50中，组合时允许移动题目位置。

9.根据权利要求1所述的自动组卷方法，其特征是，所述步骤S50中，组合时自动识别每个题目区域中的字体大小，并缩放为相同的字体大小。

10.一种自动组卷装置，其特征是，包括裁剪单元、子区域划分单元、手写填充单元、题目分割单元、以及组卷单元；

所述裁剪单元用于将做过的题目拍摄为图像，或者输入做过的题目的图像；对所述图像进行裁剪，仅保留所述图像中的文档区域，去除所述图像中的非文档区域；

所述子区域划分单元用来通过神经网络方法对所述图像的文档区域进行检测，将所述图像的文档区域划分为多个子区域，这些子区域分为三类：印刷体子区域、印刷体手写体重叠子区域、手写体子区域；

所述手写填充单元用来在所述图像的文档区域中，运用背景色填充手写体子区域；对于印刷体手写体重叠子区域，运用背景色填充手写内容，同时保留印刷内容的完整性；

所述题目分割单元用来基于已训练的基于神经网络的目标检测算法并结合印刷体的形态特征，将所述图像的文档区域分割成一个或多个题目区域，同时得到每个题目区域的位置信息；每个题目区域中仅包含题目内容；

所述组卷单元用来将用户选择的、无手写内容、仅有完整印刷内容的题目区域组合生成为试卷。