CN109389061A

CN109389061A - 试卷识别方法和系统

Info

Publication number: CN109389061A
Application number: CN201811125184.9A
Authority: CN
Inventors: 李可佳; 张超; 郭晨阳
Original assignee: Suzhou Friends Education Also Education Technology Co Ltd
Current assignee: Suzhou Friends Education Also Education Technology Co Ltd
Priority date: 2018-09-26
Filing date: 2018-09-26
Publication date: 2019-02-26

Abstract

本发明公开了一种试卷识别方法和系统，所述方法包括步骤：采集纸质试卷的图像，并处理成图片格式的试卷图片；对试卷图片进行分区，处理后试卷图片上的每个试题对应一个子区域；对试题进行识别，对子区域中的文字采用文字识别算法进行识别，对子区域中的公式采用公式识别算法进行识别；对试卷图片上所述子区域内或靠近所述子区域内的分数进行识别得到分数识别结果；对分数识别结果进行修正得到修正结果；对修正结果进行二次编译，形成结构化的试题数据。本发明中对图片化的试卷进行了智能化分区域处理，对文字内容和公式内容分别进行识别，对待识别的试卷没有格式化的要求、适应范围广。

Description

试卷识别方法和系统

技术领域

本发明涉及计算机数据处理技术领域，更具体地，涉及一种试卷识别方法和系统。

背景技术

现有技术公开了一种试卷识别分析实现方法及装置，包括:扫描学生的答案页；从扫描的答案页上获取学生编号及答案页所包括的每道题目的得分；判断每道题目的得分是否小于该题目的标准满分，如果是，将该得分小于标准满分的题目作为错题示例存储在与学生编号对应的错题文件夹中；根据所有学生的答案页上所包括的题目得分生成出错统计表，其中所述出错统计表包括:题目编号、题型、考察知识点及出错学生信息。

现有技术需要针对一种标准的答案页进行处理，但实际考试或作业中，不设置答案页，学生只在试卷上进行作答，或者，各个学校、班级的答案页结构并不相同，现有技术的试卷识别分析实现方法对待识别试卷具有一定的局限性。

发明内容

有鉴于此，本发明提供了一种试卷识别方法，包括步骤：

采集纸质试卷的图像，并处理成图片格式的试卷图片；

对试卷图片进行分区，处理后试卷图片上的每个试题对应一个子区域；

对试题进行识别，对所述子区域中的文字采用文字识别算法进行识别，对所述子区域中的公式采用公式识别算法进行识别；

对所述试卷图片上所述子区域内或靠近所述子区域内的分数进行识别得到分数识别结果，包括步骤识别模型构建过程、所述识别模型训练的过程、以及所述识别模型使用的过程，其中，

所述识别模型构建过程为基于神经网络的模型构建过程；

所述识别模型训练的过程为：获取一定数据量的手写得分作为识别样本，识别样本的输入向量为包括手写分数的图片，输出向量为对应的具体分值；将输入向量作为识别模型的输入，将输出向量作为识别模型的输出，对识别模型进行训练，得到训练后的识别模型；

所述识别模型使用的过程为：在进行试卷识别时，将待识别的包括手写分数的试题图片输入到所述训练后的识别模型中，得到的分值即为分数识别结果；

对所述分数识别结果进行修正得到修正结果；

对所述修正结果进行二次编译，形成结构化的试题数据，其中结构化的试题数据包括：识别的试题题干、试题答案以及试题得分。

优选地，所述图片格式进一步为JPEG格式、JPEG2000格式、PNG格式、或TIFF格式。

优选地，所述文字识别算法，进一步包括步骤：

获取子区域的文字图片；

对文字图片进行预处理，首先进行二值化处理，将文字图片的灰度图像转换为二值图像，对图像上的像素点的灰度值设置为0或255；

将每个汉字从整块文字图片中分割出来，利用最大宽度回归时字切分法，在行切分时获得汉字高度信息估计字的宽度，预测下一个汉字的位置；

提取汉字特征，利用汉字的网格特征和方向特征进行识别汉字。

优选地，所述公式识别算法，进一步包括步骤：

预先构建公式识别模型，首先收集包含公式的文本数据作为训练数据，提取训练数据中各字符的公式识别特征及公式标注特征，然后利用公式识别特征及公式标注特征训练公式识别模型；

接收待识别文本；

提取待识别文本中各字符的公式识别特征；

利用提取的公式识别特征及预先构建的公示识别模型对待识别文本进行公式识别，得到识别出的公式。

优选地，所述识别模型构建过程为基于神经网络的模型构建过程，进一步包括：包括输入层、与所述输入层连接的多个共享卷积层、与所述多个共享卷积层连接的多个目标区域池化层、与所述多个共享卷积层和所述多个目标区域池化层连接的多个深层特征卷积层以及与所述多个深层特征卷积层连接的输出层，其中：

所述输入层，用于接收输入的试卷图片；

所述多个共享卷积层，用于对所述试卷图片进行特征提取，得到多个目标全局特征图；

对所述多个目标全局特征图进行特征提取，得到多个基础属性；

所述多个目标区域池化层，用于对所述多个目标全局特征图进行图像分割，得到多个目标局部特征图；

所述多个深层特征卷积层，用于根据所述多个基础属性对所述多个目标全局特征图和所述多个目标局部特征图进行特征提取，得到多个目标全局属性和多个目标局部属性；

所述输出层，用于根据所述多个目标全局属性和所述多个目标局部属性确定所述目标图像中的分数。

本发明还公开了一种试卷识别系统，包括试卷录入装置、处理器、显示器，其中，

所述试卷录入装置为扫描仪或摄像头，与所述处理器相耦接，用于采集纸质试卷的图像，并处理成图片格式的试卷图片后发送至处理器；

所述处理器包括试卷分区装置、试题识别装置、分数结果识别装置、分数结果修正装置以及试题数据结构化装置，其中，

所述试卷分区装置，分别与所述试卷录入装置和试题识别装置相耦接，用于对试卷图片进行分区，处理后试卷图片上的每个试题对应一个子区域；

所述试题识别装置，分别与所述试卷分区装置和分数结果识别装置相耦接，用于对试题进行识别，对所述试卷分区装置的子区域中的文字采用文字识别算法进行识别，对所述试卷分区装置的子区域中的公式采用公式识别算法进行识别；

所述分数结果识别装置，分别与所述试题识别装置和分数结果修正装置相耦接，用于对所述试卷图片上所述子区域内或靠近所述子区域内的分数进行识别得到分数识别结果，包括识别模型构建模块、识别模型训练模块、以及识别模型使用模块，其中，

所述识别模型构建模块，与所述识别模型训练模块相耦接，用于基于神经网络构建识别模型；

所述识别模型训练模块，分别与所述识别模型构建模块和识别模型使用模块相耦接，用于获取一定数据量的手写得分作为识别样本，识别样本的输入向量为包括手写分数的图片，输出向量为对应的具体分值；将输入向量作为识别模型的输入，将输出向量作为识别模型的输出，对识别模型进行训练，得到训练后的识别模型；

所述识别模型使用模块，分别与所述识别模型训练模块和分数结果修正装置相耦接，用于将待识别的包括手写分数的试题图片输入到所述训练后的识别模型中，得到的分值即为分数识别结果，发送至分数结果修正装置；

所述分数结果修正装置，分别与所述处理器中的识别模型使用模块和试题数据结构化装置相耦接，用于对所述分数识别结果进行修正得到修正结果，发送至试题数据结构化装置；

所述试题数据结构化装置，分别与所述分数结果修正装置相耦接，用于对所述分数结果修正装置发送的修正结果进行二次编译，形成结构化的试题数据发送至显示器进行显示，其中结构化的试题数据包括：识别的试题题干、试题答案以及试题得分；

所述显示器，与所述处理器的试题数据结构化装置相耦接，用于显示出所述试题数据结构化装置发送的结构化的试题数据。

优选地，所述文字识别算法，进一步包括：

获取子区域的文字图片；

优选地，所述公式识别算法，进一步包括：预先构建公式识别模型，首先收集包含公式的文本数据作为训练数据，提取训练数据中各字符的公式识别特征及公式标注特征，然后利用公式识别特征及公式标注特征训练公式识别模型；

接收待识别文本；

提取待识别文本中各字符的公式识别特征；

所述输入层，用于接收输入的试卷图片；

与现有技术相比，本发明提供的试卷识别方法和系统，至少实现了如下的有益效果：

本发明中对图片化的试卷进行了智能化分区域处理，对文字内容和公式内容分别进行识别，对待识别的试卷没有格式化的要求、适应范围广。

当然，实施本发明的任一产品必不特定需要同时达到以上所述的所有技术效果。

通过以下参照附图对本发明的示例性实施例的详细描述，本发明的其它特征及其优点将会变得清楚。

附图说明

被结合在说明书中并构成说明书的一部分的附图示出了本发明的实施例，并且连同其说明一起用于解释本发明的原理。

图1是实施例1中试卷识别方法的流程图；

图2是实施例3中试卷识别系统结构示意图。

具体实施方式

现在将参照附图来详细描述本发明的各种示例性实施例。应注意到：除非另外具体说明，否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本发明的范围。

以下对至少一个示例性实施例的描述实际上仅仅是说明性的，决不作为对本发明及其应用或使用的任何限制。

对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论，但在适当情况下，所述技术、方法和设备应当被视为说明书的一部分。

在这里示出和讨论的所有例子中，任何具体值应被解释为仅仅是示例性的，而不是作为限制。因此，示例性实施例的其它例子可以具有不同的值。

应注意到：相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步讨论。

实施例1：

结合图1，本申请提供了一种试卷识别方法，具体包括以下步骤：

步骤101：采集纸质试卷的图像，并处理成图片格式的试卷图片；

采集的过程可以使用扫描仪，或者使用摄像头，只要能够将纸质试卷处理成图片格式即可。

步骤102：对试卷图片进行分区，处理后试卷图片上的每个试题对应一个子区域；

一张试卷中包含了很多试题，采集到电子版的试卷后，对试卷图片进行智能分区。

步骤103：对试题进行识别，对所述子区域中的文字采用文字识别算法进行识别，对所述子区域中的公式采用公式识别算法进行识别；

这里的子区域包含了试题题干和试题解答的全部内容。

所述文字识别算法，进一步包括：

获取子区域的文字图片；

该方法采用现有技术中的方法，这里不做具体限定。

所述公式识别算法，进一步包括步骤：预先构建公式识别模型，首先收集包含公式的文本数据作为训练数据，提取训练数据中各字符的公式识别特征及公式标注特征，然后利用公式识别特征及公式标注特征训练公式识别模型；

接收待识别文本；

提取待识别文本中各字符的公式识别特征；

步骤104：对所述试卷图片上所述子区域内或靠近所述子区域内的分数进行识别得到分数识别结果，该步骤中还包含了以下几个步骤：识别模型构建过程、所述识别模型训练的过程、以及所述识别模型使用的过程：

(1)所述识别模型构建过程为基于神经网络的模型构建过程；

所述识别模型构建过程为基于神经网络的模型构建过程，进一步包括：包括输入层、与所述输入层连接的多个共享卷积层、与所述多个共享卷积层连接的多个目标区域池化层、与所述多个共享卷积层和所述多个目标区域池化层连接的多个深层特征卷积层以及与所述多个深层特征卷积层连接的输出层，其中：

所述输入层，用于接收输入的试卷图片；

该方法采用现有技术中的方法，这里不做具体。

(2)所述识别模型训练的过程为：获取一定数据量的手写得分作为识别样本，识别样本的输入向量为包括手写分数的图片，输出向量为对应的具体分值；将输入向量作为识别模型的输入，将输出向量作为识别模型的输出，对识别模型进行训练，得到训练后的识别模型；

(3)所述识别模型使用的过程为：在进行试卷识别时，将待识别的包括手写分数的试题图片输入到所述训练后的识别模型中，得到的分值即为分数识别结果；

步骤105：对所述分数识别结果进行修正得到修正结果；

步骤106：对所述修正结果进行二次编译，形成结构化的试题数据，其中结构化的试题数据包括：识别的试题题干、试题答案以及试题得分。

所述图片格式进一步为JPEG格式、JPEG2000格式、PNG格式、或TIFF格式。

实施例2：

在实施例1的基础上本实施例为应用实施例：

步骤201：将纸质试卷处理为图片格式的试卷；

步骤202：对图片格式的试卷进行智能分区域，每个区域为一个试题；

例如，可在试卷上设置分区标识点，这种设置分区标识点的方法，在进行区域划分是比较简单，但仍然对试卷有了一定限定，相当于没有分区标识点的试卷就不能划分了，所以，优选的采用一种图像识别或处理的方法，例如，试题的提干一般是打印的文字，试题的解答一般是书写的文字，这两种文字所表现出来的图像存在差异，因而，能够从内容的角度进行区域划分，将一段打印文字+一段书写文字(或者下一段打印文字之前)所在的区域作为一个区域。

步骤203：对试题进行识别，具体文字采用文字识别算法进行识别，对公式采用公式识别算法进行识别；

分区域以后，对试题的题干、试题解答的内容中的文字采用文字识别算法进行识别，公式单独采用公式识别算法进行识别，提高识别准确率。

步骤204：对试卷上的分数进行深度学习和识别。

分区域以后，对每个区域内或靠近这个区域内的分数进行识别，这个分数可以为教师手写的、针对该区域内的试题的得分。

在进行识别时，具体可以采用以下过程：

(1)模型构建的过程：具体可构建基于神经网络的识别模型；

(2)模型训练的过程(也即深度学习)：获取一定数据量的手写得分作为识别样本，识别样本的输入向量为包括手写分数的图片，输出向量为对应的具体分值；将输入向量作为识别模型的输入，将输出向量作为识别模型的输出，对识别模型进行训练，训练好的识别模型进行实际使用过程中要使用的识别模型。

(3)模型使用的过程：在进行试卷识别时，将待识别的包括手写分数的图片输入到上述训练好的模型，得到的具体分值就是识别结果。

步骤205：识别完成后，基于题自身的特点；

识别到分数以后要进行纠错，包括基于题的特点的判断，例如一个题的满分是6分，识别出9分来一定是错的。

在发现错误之后，可以在体现识别结果时通过特殊的方式体现，以告知工作人员进行手动修正。

步骤206：纠错完成后进行二次编译，形成结构化的试卷数据。

结构化的试题数据包括识别好的试题题干、试题答案以及试题得分。

实施例3：

结合图2，本实施例提供了一种试卷识别系统，包括试卷录入装置31、处理器32、显示器33。

所述试卷录入装置31为扫描仪或摄像头，与所述处理器32相耦接，用于采集纸质试卷的图像，并处理成图片格式的试卷图片后发送至处理器32；

所述处理器32包括试卷分区装置321、试题识别装置322、分数结果识别装置323、分数结果修正装置324以及试题数据结构化装置325。

所述试卷分区装置321，分别与所述试卷录入装置31和试题识别装置322相耦接，用于对试卷图片进行分区，处理后试卷图片上的每个试题对应一个子区域；

所述试题识别装置322，分别与所述试卷分区装置321和分数结果识别装置323相耦接，用于对试题进行识别，对所述试卷分区装置321的子区域中的文字采用文字识别算法进行识别，对所述试卷分区装置321的子区域中的公式采用公式识别算法进行识别；

所述分数结果识别装置323，分别与所述试题识别装置322和分数结果修正装置324相耦接，用于对所述试卷图片上所述子区域内或靠近所述子区域内的分数进行识别得到分数识别结果，包括识别模型构建模块、识别模型训练模块、以及识别模型使用模块，其中，

所述识别模型使用模块，分别与所述识别模型训练模块和分数结果修正装置324相耦接，用于将待识别的包括手写分数的试题图片输入到所述训练后的识别模型中，得到的分值即为分数识别结果，发送至分数结果修正装置324；

所述分数结果修正装置324，分别与所述处理器32中的识别模型使用模块和试题数据结构化装置325相耦接，用于对所述分数识别结果进行修正得到修正结果，发送至试题数据结构化装置325；

所述试题数据结构化装置325，分别与所述分数结果修正装置324相耦接，用于对所述分数结果修正装置324发送的修正结果进行二次编译，形成结构化的试题数据发送至显示器33进行显示，其中结构化的试题数据包括：识别的试题题干、试题答案以及试题得分；

所述显示器33，与所述处理器32的试题数据结构化装置325相耦接，用于显示出所述试题数据结构化装置325发送的结构化的试题数据。

所述文字识别算法，进一步包括：获取子区域的文字图片；

该方法采用现有技术中的方法，这里不做具体限定。

所述公式识别算法，进一步包括：预先构建公式识别模型，首先收集包含公式的文本数据作为训练数据，提取训练数据中各字符的公式识别特征及公式标注特征，然后利用公式识别特征及公式标注特征训练公式识别模型；

接收待识别文本；

提取待识别文本中各字符的公式识别特征；

所述输入层，用于接收输入的试卷图片；

该方法采用现有技术中的方法，这里不做具体限定。

虽然已经通过例子对本发明的一些特定实施例进行了详细说明，但是本领域的技术人员应该理解，以上例子仅是为了进行说明，而不是为了限制本发明的范围。本领域的技术人员应该理解，可在不脱离本发明的范围和精神的情况下，对以上实施例进行修改。本发明的范围由所附权利要求来限定。

Claims

1.一种试卷识别方法，其特征在于，包括步骤：

采集纸质试卷的图像，并处理成图片格式的试卷图片；

所述识别模型构建过程为基于神经网络的模型构建过程；

对所述分数识别结果进行修正得到修正结果；

2.根据权利要求1所述的试卷识别方法，其特征在于，所述图片格式进一步为JPEG格式、JPEG2000格式、PNG格式、或TIFF格式。

3.根据权利要求1所述的试卷识别方法，其特征在于，所述文字识别算法，进一步包括步骤：

获取子区域的文字图片；

4.根据权利要求1所述的试卷识别方法，其特征在于，所述公式识别算法，进一步包括步骤：

接收待识别文本；

提取待识别文本中各字符的公式识别特征；

5.根据权利要求1所述的试卷识别方法，其特征在于，所述识别模型构建过程为基于神经网络的模型构建过程，进一步包括：包括输入层、与所述输入层连接的多个共享卷积层、与所述多个共享卷积层连接的多个目标区域池化层、与所述多个共享卷积层和所述多个目标区域池化层连接的多个深层特征卷积层以及与所述多个深层特征卷积层连接的输出层，其中：

所述输入层，用于接收输入的试卷图片；

6.一种试卷识别系统，其特征在于，包括试卷录入装置、处理器、显示器，其中，

7.根据权利要求6所述的试卷识别系统，其特征在于，所述图片格式进一步为JPEG格式、JPEG2000格式、PNG格式、或TIFF格式。

8.根据权利要求6所述的试卷识别系统，其特征在于，所述文字识别算法，进一步包括：

获取子区域的文字图片；

9.根据权利要求6所述的试卷识别系统，其特征在于，所述公式识别算法，进一步包括：预先构建公式识别模型，首先收集包含公式的文本数据作为训练数据，提取训练数据中各字符的公式识别特征及公式标注特征，然后利用公式识别特征及公式标注特征训练公式识别模型；

接收待识别文本；

提取待识别文本中各字符的公式识别特征；

10.根据权利要求6所述的试卷识别系统，其特征在于，所述识别模型构建过程为基于神经网络的模型构建过程，进一步包括：包括输入层、与所述输入层连接的多个共享卷积层、与所述多个共享卷积层连接的多个目标区域池化层、与所述多个共享卷积层和所述多个目标区域池化层连接的多个深层特征卷积层以及与所述多个深层特征卷积层连接的输出层，其中：

所述输入层，用于接收输入的试卷图片；