CN109389173A - 一种基于m-cnn的试卷分数自动统计分析方法和装置 - Google Patents
一种基于m-cnn的试卷分数自动统计分析方法和装置 Download PDFInfo
- Publication number
- CN109389173A CN109389173A CN201811192679.3A CN201811192679A CN109389173A CN 109389173 A CN109389173 A CN 109389173A CN 201811192679 A CN201811192679 A CN 201811192679A CN 109389173 A CN109389173 A CN 109389173A
- Authority
- CN
- China
- Prior art keywords
- double
- single digital
- identification model
- cnn
- pixel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/24—Character recognition characterised by the processing or recognition method
- G06V30/242—Division of the character sequences into groups prior to recognition; Selection of dictionaries
- G06V30/244—Division of the character sequences into groups prior to recognition; Selection of dictionaries using graphical properties, e.g. alphabet type or font
- G06V30/2455—Discrimination between machine-print, hand-print and cursive writing
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于M‑CNN的试卷分数自动统计分析方法,其包括以下步骤:步骤1、创建单数字手写数字库和双数字库;步骤2、获取每个单数字Mask区域和双数字Mask区域的像素点位置;步骤3、创建单数字CNN识别模型和双数字CNN识别模型;步骤4、对所述单数字CNN识别模型和双数字CNN识别模型进行训练;步骤5、获取目标图像;步骤6、对所述目标图像进行切割,确定待识别图像;步骤7、获取每个待识别图像的数值;步骤8、得到所述试卷图像的总分数。本发明还提供了一种基于M‑CNN的试卷分数自动统计分析装置。本发明可有效的降低部分计算负担,同时引入SPP网络有效的解决了输入图像尺寸固定的问题。
Description
技术领域
本发明涉及图像处理技术领域,具体为一种基于M-CNN的试卷分数自动统计分析方法和装置。
背景技术
考试是一种有效的教学效果评价手段,也是一种教学活动改进的有效参考手段。因此,考试试题中分数的统计分析就显得格外重要。随着基于卷积神经网络手写数字识别算法的不断涌现,识别精度的不断提高,基于CNN(Convolutional Neural Network)的手写数字应用也越来越广泛。LeNet-5作为手写数字识别的经典算法,识别精度高,模型简单,在实际的应用中具有一定的优势。但是,LeNet-5模型同样具有卷积神经网络的局限性:要求输入的图像大小固定,只能识别单个手写数字。直接应用LeNet-5模型实现试卷分数的统计显然不能满足要求,同时在模型中卷积层的运算时针对整帧图像,对手写数字区域中像素值非零的区域卷积是有意义的,非零区域的卷积显然浪费了计算资源。鉴于此,本发明提出了一种Mask-CNN的试卷分数统计方法。该方法可有效的降低部分计算负担,同时引入SPP(Spatial Pyramid Pooling)有效的解决了输入图像尺寸固定的问题。
发明内容
为了克服现有技术的不足,本发明的目的之一在于提供一种基于M-CNN的试卷分数自动统计分析方法,其通过对数字区域依据Mask进行卷积、池化,等操作,将最终SPP(Spatial Pyramid Pooling)网络池化的结果输入全连接层,最终实现对数字的快速准确的识别,统计最终的识别结果,可有效的降低部分计算负担,同时引入SPP网络有效的解决了输入图像尺寸固定的问题。
本发明的目的之二在于提供一种基于M-CNN的试卷分数自动统计分析装置,其通过对数字区域依据Mask进行卷积、池化,等操作,将最终SPP(Spatial Pyramid Pooling)网络池化的结果输入全连接层,最终实现对数字的快速准确的识别,统计最终的识别结果,可有效的降低部分计算负担,同时引入SPP网络有效的解决了输入图像尺寸固定的问题。
为实现上述目的之一,本发明提供如下技术方案:
一种基于M-CNN的试卷分数自动统计分析方法,包括以下步骤:
步骤1、依据Mnist手写数字库创建单数字手写数字库,应用NIST SD19数据集创建双数字库;每个单数字手写数字库的单数字图像称为单数字手写样本,每个双数字库中的双数字图像称为双数字手写样本;
步骤2、提取每个单数字手写样本和双数字手写样本中的非零像素,每个单数字手写样本的非零像素组成单数字Mask区域,每个双数字手写样本的非零像素组成双数字Mask区域,获取每个单数字Mask区域和双数字Mask区域的像素点位置;
步骤3、创建单数字CNN识别模型和双数字CNN识别模型,所述单数字CNN识别模型和双数字CNN识别模型均包括输入层、第一卷积层、池化层、第二卷积层、SPPNET层、全连接层和输出层;
步骤4、将所述单数字手写样本输入单数字CNN识别模型中对所述单数字CNN识别模型进行训练,生成单数字识别模型;将所述双数字手写样本输入双数字CNN识别模型中对所述双数字CNN识别模型进行训练,生成双数字识别模型;其中,单数字手写样本在单数字CNN识别模型的第一卷积层参与运算的像素点为所述单数字手写样本对应的单数字Mask区域的像素点,单数字手写样本在单数字CNN识别模型的第二卷积层参与运算的像素点为所述单数字手写样本对应的单数字Mask区域同比例缩小后的像素点;双数字手写样本在双数字CNN识别模型的第一卷积层参与运算的像素点为所述双数字手写样本对应的双数字Mask区域的像素点,双数字手写样本在双数字CNN识别模型的第二卷积层参与运算的像素点为所述双数字手写样本对应的双数字Mask区域同比例缩小后的像素点;
步骤5、对包含有分数的试卷图像进行处理,获取目标图像,所述目标图像为分数区域的图像;
步骤6、获取目标图像的所有非零像素区域坐标,依据投影的非零像素区域坐标对所述目标图像进行切割;应用分解聚类算法,对所有非零像素区域进行分解聚类,确定每个聚类区域,所述聚类区域称为待识别图像;
步骤7、将每个待识别图像分别输入单数字识别模型和双数字识别模型,获取每个待识别图像的数值;
步骤8、将所有待识别图像的数值进行求和,得到所述试卷图像的总分数。
进一步地,在步骤1之后还包括:对每个单数字手写样本和双数字手写样本分别进行腐蚀和膨胀处理。
进一步地,步骤4中,单数字手写样本在单数字CNN识别模型的第二卷积层参与运算的像素点为所述单数字手写样本对应的单数字Mask区域同比例缩小后的像素点,包括:
根据单数字手写样本对应的单数字Mask区域的像素点以及单数字CNN识别模型的第一卷积层运算后的图像尺寸获取所述单数字手写样本对应的单数字Mask区域的像素点的位置,称为第一变换位置;
根据单数字CNN识别模型的第一卷积层运算后的图像尺寸输入单数字CNN识别模型的池化层输出的图像尺寸获取所述单数字手写样本对应的单数字Mask区域的像素点的位置,称为第二变换位置;
单数字手写样本在单数字CNN识别模型的第二卷积层参与运算的像素点为第二变换位置的像素点;
步骤4中,双数字手写样本在双数字CNN识别模型的第二卷积层参与运算的像素点为所述双数字手写样本对应的双数字Mask区域同比例缩小后的像素点,包括:
根据双数字手写样本对应的双数字Mask区域的像素点以及双数字CNN识别模型的第一卷积层运算后的图像尺寸获取所述双数字手写样本对应的双数字Mask区域的像素点的位置,称为第三变换位置;
根据双数字CNN识别模型的第一卷积层运算后的图像尺寸输入双数字CNN识别模型的池化层输出的图像尺寸获取所述双数字手写样本对应的双数字Mask区域的像素点的位置,称为第四变换位置;
双数字手写样本在双数字CNN识别模型的第二卷积层参与运算的像素点为第四变换位置的像素点。
进一步地,步骤5包括:
将所述试卷图像的灰度图像;
应用试卷图像的RGB三通道中的R通道图像减去所述灰度图像,记为目标图像。
进一步地,在步骤5之后还包括对所述目标图像进行腐蚀和膨胀处理。
进一步地,步骤7包括:
将所述待识别图像输入单数字识别模型中,如果单数字识别模型的输出层输入的数据最大值小于对应的设定阈值,即如果单数字识别模型的输出层输入的数据最大值为第i位的当所述小于第i位的设定阈值T1 i,则将所述待识别图像输入至双数字识别模型,反之,所述待识别图像的数值为单数字,通过单数字识别模型的输出层输出一个单数字;
将所述待识别图像输入双数字识别模型中,如果双数字识别模型的输出层输入的数据最大值小于对应的设定阈值,即如果双数字识别模型的输出层输入的数据最大值为第j位的当所述小于第j位的设定阈值则重新对所述目标图像进行切割,反之,所述待识别图像的数值为双数字,通过双数字识别模型的输出层输出一个双数字。
为实现上述目的之二,本发明提供如下技术方案:
一种基于M-CNN的试卷分数自动统计分析装置,其包括:
第一创建模块,用于依据Mnist手写数字库创建单数字手写数字库,应用NISTSD19数据集创建双数字库;每个单数字手写数字库的单数字图像称为单数字手写样本,每个双数字库中的双数字图像称为双数字手写样本;
提取模块,用于提取每个单数字手写样本和双数字手写样本中的非零像素,每个单数字手写样本的非零像素组成单数字Mask区域,每个双数字手写样本的非零像素组成双数字Mask区域,获取每个单数字Mask区域和双数字Mask区域的像素点位置;
第二创建模块,用于创建单数字CNN识别模型和双数字CNN识别模型,所述单数字CNN识别模型和双数字CNN识别模型均包括输入层、第一卷积层、池化层、第二卷积层、SPPNET层、全连接层和输出层;
训练模块,用于将所述单数字手写样本输入单数字CNN识别模型中对所述单数字CNN识别模型进行训练,生成单数字识别模型;将所述双数字手写样本输入双数字CNN识别模型中对所述双数字CNN识别模型进行训练,生成双数字识别模型;其中,单数字手写样本在单数字CNN识别模型的第一卷积层参与运算的像素点为所述单数字手写样本对应的单数字Mask区域的像素点,单数字手写样本在单数字CNN识别模型的第二卷积层参与运算的像素点为所述单数字手写样本对应的单数字Mask区域同比例缩小后的像素点;双数字手写样本在双数字CNN识别模型的第一卷积层参与运算的像素点为所述双数字手写样本对应的双数字Mask区域的像素点,双数字手写样本在双数字CNN识别模型的第二卷积层参与运算的像素点为所述双数字手写样本对应的双数字Mask区域同比例缩小后的像素点;
处理模块,用于对包含有分数的试卷图像进行处理,获取目标图像,所述目标图像为分数区域的图像;
切割模块,用于获取目标图像的所有非零像素区域坐标,依据投影的非零像素区域坐标对所述目标图像进行切割;应用分解聚类算法,对所有非零像素区域进行分解聚类,确定每个聚类区域,所述聚类区域称为待识别图像;
获取模块,用于将每个待识别图像分别输入单数字识别模型和双数字识别模型,获取每个待识别图像的数值;
计算模块,用于将所有待识别图像的数值进行求和,得到所述试卷图像的总分数。
进一步地,训练模块中,单数字手写样本在单数字CNN识别模型的第二卷积层参与运算的像素点为所述单数字手写样本对应的单数字Mask区域同比例缩小后的像素点,包括:
根据单数字手写样本对应的单数字Mask区域的像素点以及单数字CNN识别模型的第一卷积层运算后的图像尺寸获取所述单数字手写样本对应的单数字Mask区域的像素点的位置,称为第一变换位置;
根据单数字CNN识别模型的第一卷积层运算后的图像尺寸输入单数字CNN识别模型的池化层输出的图像尺寸获取所述单数字手写样本对应的单数字Mask区域的像素点的位置,称为第二变换位置;
单数字手写样本在单数字CNN识别模型的第二卷积层参与运算的像素点为第二变换位置的像素点;
训练模块中,双数字手写样本在双数字CNN识别模型的第二卷积层参与运算的像素点为所述双数字手写样本对应的双数字Mask区域同比例缩小后的像素点,包括:
根据双数字手写样本对应的双数字Mask区域的像素点以及双数字CNN识别模型的第一卷积层运算后的图像尺寸获取所述双数字手写样本对应的双数字Mask区域的像素点的位置,称为第三变换位置;
根据双数字CNN识别模型的第一卷积层运算后的图像尺寸输入双数字CNN识别模型的池化层输出的图像尺寸获取所述双数字手写样本对应的双数字Mask区域的像素点的位置,称为第四变换位置;
双数字手写样本在双数字CNN识别模型的第二卷积层参与运算的像素点为第四变换位置的像素点。
进一步地,所述处理模块包括:
将所述试卷图像的灰度图像;
应用试卷图像的RGB三通道中的R通道图像减去所述灰度图像,记为目标图像。
进一步地,所述获取模块包括:
将所述待识别图像输入单数字识别模型中,如果单数字识别模型的输出层输入的数据最大值小于对应的设定阈值,即如果单数字识别模型的输出层输入的数据最大值为第i位的当所述小于第i位的设定阈值T1 i,则将所述待识别图像输入至双数字识别模型,反之,所述待识别图像的数值为单数字,通过单数字识别模型的输出层输出一个单数字;
将所述待识别图像输入双数字识别模型中,如果双数字识别模型的输出层输入的数据最大值小于对应的设定阈值,即如果双数字识别模型的输出层输入的数据最大值为第j位的当所述小于第j位的设定阈值则重新对所述目标图像进行切割,反之,所述待识别图像的数值为双数字,通过双数字识别模型的输出层输出一个双数字。
与现有技术相比,本发明基于M-CNN的试卷分数自动统计分析方法和装置,其有益效果在于:通过对数字区域依据Mask进行卷积、池化,等操作,将最终SPP网络层池化的结果输入全连接层,最终实现对数字的快速准确的识别,统计最终的识别结果,可有效的降低部分计算负担,同时引入SPP网络(SPPNET层)有效的解决了输入图像尺寸固定的问题。
附图说明
图1为本发明实施例一基于M-CNN的试卷分数自动统计分析方法的流程图;
图2为单数字图像的示意图;
图3为图2对应的经过腐蚀和膨胀处理后的示意图;
图4为图2对应的Mask区域的示意图;
图5为双数字图像的示意图;
图6为图5对应的经过腐蚀和膨胀处理后的示意图;
图7为图5对应的Mask区域的示意图;
图8为对单数字手写样本进行训练的示意图;
图9为对双数字手写样本进行训练的示意图;
图10为SPPNET层的结构示意图;
图11为试卷图像的示意图;
图12为目标图像的示意图;
图13为目标图像非零像素区域的坐标向x轴和y轴进行投影的结果示意图;
图14为目标图像的分割示意图;
图15为目标图像的错误分割示意图;
图16为本发明实施例二基于M-CNN的试卷分数自动统计分析系统的结构示意图。
具体实施方式
下面,结合附图以及具体实施方式,对本发明做进一步描述,需要说明的是,在不相冲突的前提下,以下描述的各实施例之间或各技术特征之间可以任意组合形成新的实施例。
实施例一
为了解决试卷分数的高效自动统计问题,本发明提供一种基于M-CNN(Mask-CNN)的试卷分数自动统计方法,其通过对数字区域依据Mask进行卷积、池化,等操作,将最终池化结果输入SPP网络,最终实现对数字的快速准确的识别,统计最终的识别结果。系统整体流程如图1所示,包括以下步骤:
110、依据Mnist手写数字库创建单数字手写数字库,应用NIST SD19数据集创建双数字库;每个单数字手写数字库的单数字图像称为单数字手写样本,每个双数字库中的双数字图像称为双数字手写样本。
应用Mnist手写数字库创建单数字手写数字库,总共创建6万张单数字手写样本,即6万张单数字图像,对每个单数字手写样本进行3×3腐蚀,5×5膨胀处理。图2示出了6、7、8、1、2、9的单数字图像的示意图,对应地,将图2进行3×3腐蚀,5×5膨胀处理后,得到多个对应的处理图像如图3所示。
应用NIST SD19数据集的hsf_0,hsf_1,hsf_2,hsf_3,hsf_4等数据集创建双数字库,总共创建4万张双数字手写样本,即4万张双数字图像。具体是对NIST SD19数据集中的hsf_0,hsf_1,hsf_2,hsf_3,hsf_4等图像库中的图像进行切割,切割出对应的两位数字。对每个双数字手写样本进行3×3腐蚀,5×5膨胀处理。图5示出了36、39和42的双数字图像的示意图,对应地,将图5进行3×3腐蚀,5×5膨胀处理后,得到多个对应的处理图像如图6所示。
120、提取每个单数字手写样本和双数字手写样本中的非零像素,每个单数字手写样本的非零像素组成单数字Mask区域,每个双数字手写样本的非零像素组成双数字Mask区域,获取每个单数字Mask区域和双数字Mask区域的像素点位置。
创建单数字手写样本标签,单数字手写样本标签为10×1的向量,分别对应0~9十位数字,10×1向量为1的位置则对应相应的单个数字,向量中第k行为1,则表示十进制数为k-1。同样的创建双数字手写样本标签,双数字手写样本标签的为90×1的向量,分别对应10~99的90个数字,90×1的向量为1的位置则对应相应的双位数字,向量中第m行为1,则表示的双位数字为m+9。
提取每个单数字手写样本和双数字手写样本中的非零像素,每个单数字手写样本的非零像素组成单数字Mask区域,分别如图4和图7所示。
以图2的单数字图像得到的图4的Mask区域为例,其Mask区域占相应图2中整帧单数字图像的最大比率为41.07%。因此,在确定Mask区域后,对样本的训练以及待测试图像的输出近计算非零像素的区域即可。根据单数字Mask区域和双数字Mask区域确定其所在对应的单数字图像或双数字图像中的位置,通过x、y坐标呈现,每个单数字Mask区域和双数字Mask区域均构建一个位置向量。
所以单数字手写数字库均包括单数字手写样本、样本标签以及每个单数字手写样本的Mask区域的位置,同理每个双数字库中均包括双数字手写样本、样本标签以及每个双数字手写样本的Mask区域的位置。
130、创建单数字CNN识别模型和双数字CNN识别模型,所述单数字CNN识别模型和双数字CNN识别模型均包括输入层、第一卷积层、池化层、第二卷积层、SPPNET层、全连接层和输出层。
140、将所述单数字手写样本输入单数字CNN识别模型中对所述单数字CNN识别模型进行训练,生成单数字识别模型;将所述双数字手写样本输入双数字CNN识别模型中对所述双数字CNN识别模型进行训练,生成双数字识别模型;其中,单数字手写样本在单数字CNN识别模型的第一卷积层参与运算的像素点为所述单数字手写样本对应的单数字Mask区域的像素点,单数字手写样本在单数字CNN识别模型的第二卷积层参与运算的像素点为所述单数字手写样本对应的单数字Mask区域同比例缩小后的像素点;双数字手写样本在双数字CNN识别模型的第一卷积层参与运算的像素点为所述双数字手写样本对应的双数字Mask区域的像素点,双数字手写样本在双数字CNN识别模型的第二卷积层参与运算的像素点为所述双数字手写样本对应的双数字Mask区域同比例缩小后的像素点。
对于单数字CNN识别模型的训练,请参照图8所示,将6万张中的五万张0~9单数字手写样本每50个样本为一组输入对单数字CNN识别模型进行训练。在第一卷积层中,5×5的卷积核在单数字手写样本中运算的像素点位置由该单数字手写样本的Mask区域的位置确定,也即是只在单数字手写样本中Mask中存储的像素点位置进行卷积运算。其余的单数字手写样本中没有经过卷积运算的位置用零填充。最终第一卷积层输出6个Featuremap,然后进行池化。以单数字手写样本28×28大小为例,经过第一次卷积后的图像尺寸大小为(28-5+1)×(28-5+1),此时,Mask区域的位置随之变换,称为第一变换位置,然后通过池化层赤化后得到的图像尺寸12×12,此时,Mask区域的位置又随之变换,称为第二变换位置。因此,第二次卷积时的Mask的位置即为将单数字手写样本Mask区域的位置进行同比例缩小后获得的第二变换位置。由于单数字手写样本中Mask区域占整个图像区域的比率较小,因此,应Mask区域对卷积层进行处理可有效的降低计算量,SPPNET层的结构示意图如图10所示,通过引入SPPNET层,可以有效的解决了输入图像(单数字手写样本)尺寸固定的问题。应用5万张单数字样本对整个模型进行训练,最终完成模型的训练,测试过程中,应用剩余1万张样本对训练好的模型进行测试,最终得到单数字识别模型。
同理,请参照图9所示,采用4万张双数字手写样本中的3万张对双数字CNN识别模型进行训练,剩余1万张双数字手写样本进行测试,最终得到双数字识别模型。双数字手写样本在双数字CNN识别模型的第二卷积层参与运算的像素点为所述双数字手写样本对应的双数字Mask区域同比例缩小后的像素点,包括:根据双数字手写样本对应的双数字Mask区域的像素点以及双数字CNN识别模型的第一卷积层运算后的图像尺寸获取所述双数字手写样本对应的双数字Mask区域的像素点的位置,称为第三变换位置;根据双数字CNN识别模型的第一卷积层运算后的图像尺寸输入双数字CNN识别模型的池化层输出的图像尺寸获取所述双数字手写样本对应的双数字Mask区域的像素点的位置,称为第四变换位置;双数字手写样本在双数字CNN识别模型的第二卷积层参与运算的像素点为第四变换位置的像素点。
根据测试结果,选择能够精确识别的样本,计算能够精确识别的P个第i类样本的输入到输出层的数据的最小值,如式1所示,以此作为该类样本能够准确识别的判定条件。在识别过程中,以单数字识别模型,如果第i类样本的输入到输出层的数据小于阈值,说明单数字识别模型输入的测试图像中不存在单数字,或者可以认为该单数字识别模型不能识别此图像中的内容,同理可以创建双数字识别模型。
150、对包含有分数的试卷图像进行处理,获取目标图像,所述目标图像为分数区域的图像。
图11示出了试卷图像的示意图,将所述试卷图像的灰度图像,由于一般试卷的批改分数都是红色,因此,应用试卷图像的RGB三通道中的R通道图像减去所述灰度图像(灰度图像像素范围为0~255)获得的图像记为目标图像,如图12所示,目标图像即为数字区域图像。
160、获取目标图像的所有非零像素区域坐标,依据投影的非零像素区域坐标对所述目标图像进行切割;应用分解聚类算法,对所有非零像素区域进行分解聚类,确定每个聚类区域,所述聚类区域称为待识别图像。
对目标图像进行3×3腐蚀,5×5膨胀处理。统计经过处理后的目标图像中非零像素区域的坐标,并向x轴和y轴进行投影,投影结果如图13所示。依据投影的非零区域对数字区域进行切割。具体是通过分解聚类的方法(K均值分类法)对所有的非零像素区域进行分解聚类,确定聚类区域。依据类别对分解聚类区域进行切割,切割为矩形区域,每个矩形区域即为待识别图像,获取每个待识别图像的Mask区域。切割结果的实例如图14所示。确定待识别图像的Mask区域后,将Mask区域中的非零像素的坐标存储为Mask向量,此向量作为识别算法卷积过程中需要进行卷积的像素点。同时按照从大到小(或者从小到大)排列分类结果的中心点的位置坐标(沿x轴或y轴)。排列后依顺序对数字区域和Mask区域进行标记。
为了约束K均值分类的情况,在K均值分类结果中,会得到类间所有点与该类质心点距离之和,采用增量统计的方式,对于能够准确识别的图像帧中计算每一类质心与所有点之和,设定该距离为正确分类的一个依据。如图15中数字“6”和“5”被划为了一类,两个数字一个质心,因此,所有像素到质心的距离之和会超出设定的阈值。图15中分类结果区域从左到右的距离之和的数量级分别为[105 105 104 106 105 104 104]。针对图14中能够准确识别的数字质心和像素距离之和的数量级分别为[105 105 105 104 105 104 104]。因此,设定质心与像素距离之和的数量级阈值为ET=105,如果有超过阈值的,需要对整个数据区进行重新分类。对于正确切割、识别的图像区域,存储其对应的识别结果。对于质心与像素间距离之和满足要求的分类结果中,切割图像在单数字和双数字算法中仍然不能全部识别的,仍然需要对检测到的图像区域进行K均值分类。
170、将每个待识别图像分别输入单数字识别模型和双数字识别模型,获取每个待识别图像的数值。
将所述待识别图像输入单数字识别模型中,如果单数字识别模型的输出层输入的数据最大值小于对应的设定阈值,即如果单数字识别模型的输出层输入的数据最大值为第i位的当所述小于第i位的设定阈值T1 i,则将所述待识别图像输入至双数字识别模型,反之,所述待识别图像的数值为单数字,通过单数字识别模型的输出层输出一个单数字;
将所述待识别图像输入双数字识别模型中,如果双数字识别模型的输出层输入的数据最大值小于对应的设定阈值,即如果双数字识别模型的输出层输入的数据最大值为第j位的当所述小于第j位的设定阈值则重新对所述目标图像进行切割,反之,所述待识别图像的数值为双数字,通过双数字识别模型的输出层输出一个双数字。
180、将所有待识别图像的数值进行求和,得到所述试卷图像的总分数。
上述仅是对一份试卷图像进行分数自动统计,即可以得到该试卷图像的总分数,当然,在同一类多个试卷图像进行分数自动统计过程中,还可以统计该多个试卷图像的均值、方差,以及该多个试卷图像对应的每个题目(即待识别图像)的均值、方差等,例如可以得到某班每个学生数学考试的总成绩、平均成绩、方差,以及每个学生第一大题的均值和方差等,从而便于教师及时掌控每个学生的情况以及班级的平均水平等。
实施例二
一种基于M-CNN的试卷分数自动统计分析装置,其为实施例的虚拟装置,请参照图16所示,其包括:
第一创建模块210,用于依据Mnist手写数字库创建单数字手写数字库,应用NISTSD19数据集创建双数字库;每个单数字手写数字库的单数字图像称为单数字手写样本,每个双数字库中的双数字图像称为双数字手写样本;
提取模块220,用于提取每个单数字手写样本和双数字手写样本中的非零像素,每个单数字手写样本的非零像素组成单数字Mask区域,每个双数字手写样本的非零像素组成双数字Mask区域,获取每个单数字Mask区域和双数字Mask区域的像素点位置;
第二创建模块230,用于创建单数字CNN识别模型和双数字CNN识别模型,所述单数字CNN识别模型和双数字CNN识别模型均包括输入层、第一卷积层、池化层、第二卷积层、SPPNET层、全连接层和输出层;
训练模块240,用于将所述单数字手写样本输入单数字CNN识别模型中对所述单数字CNN识别模型进行训练,生成单数字识别模型;将所述双数字手写样本输入双数字CNN识别模型中对所述双数字CNN识别模型进行训练,生成双数字识别模型;其中,单数字手写样本在单数字CNN识别模型的第一卷积层参与运算的像素点为所述单数字手写样本对应的单数字Mask区域的像素点,单数字手写样本在单数字CNN识别模型的第二卷积层参与运算的像素点为所述单数字手写样本对应的单数字Mask区域同比例缩小后的像素点;双数字手写样本在双数字CNN识别模型的第一卷积层参与运算的像素点为所述双数字手写样本对应的双数字Mask区域的像素点,双数字手写样本在双数字CNN识别模型的第二卷积层参与运算的像素点为所述双数字手写样本对应的双数字Mask区域同比例缩小后的像素点;
处理模块250,用于对包含有分数的试卷图像进行处理,获取目标图像,所述目标图像为分数区域的图像;
切割模块260,用于获取目标图像的所有非零像素区域坐标,依据投影的非零像素区域坐标对所述目标图像进行切割;应用分解聚类算法,对所有非零像素区域进行分解聚类,确定每个聚类区域,所述聚类区域称为待识别图像;
获取模块270,用于将每个待识别图像分别输入单数字识别模型和双数字识别模型,获取每个待识别图像的数值;
计算模块280,用于将所有待识别图像的数值进行求和,得到所述试卷图像的总分数。
优选地,训练模块240中,单数字手写样本在单数字CNN识别模型的第二卷积层参与运算的像素点为所述单数字手写样本对应的单数字Mask区域同比例缩小后的像素点,包括:根据单数字手写样本对应的单数字Mask区域的像素点以及单数字CNN识别模型的第一卷积层运算后的图像尺寸获取所述单数字手写样本对应的单数字Mask区域的像素点的位置,称为第一变换位置;根据单数字CNN识别模型的第一卷积层运算后的图像尺寸输入单数字CNN识别模型的池化层输出的图像尺寸获取所述单数字手写样本对应的单数字Mask区域的像素点的位置,称为第二变换位置;单数字手写样本在单数字CNN识别模型的第二卷积层参与运算的像素点为第二变换位置的像素点;
优选地,训练模块240中,双数字手写样本在双数字CNN识别模型的第二卷积层参与运算的像素点为所述双数字手写样本对应的双数字Mask区域同比例缩小后的像素点,包括:根据双数字手写样本对应的双数字Mask区域的像素点以及双数字CNN识别模型的第一卷积层运算后的图像尺寸获取所述双数字手写样本对应的双数字Mask区域的像素点的位置,称为第三变换位置;根据双数字CNN识别模型的第一卷积层运算后的图像尺寸输入双数字CNN识别模型的池化层输出的图像尺寸获取所述双数字手写样本对应的双数字Mask区域的像素点的位置,称为第四变换位置;双数字手写样本在双数字CNN识别模型的第二卷积层参与运算的像素点为第四变换位置的像素点。
优选地,处理模块250包括:将所述试卷图像的灰度图像;应用试卷图像的RGB三通道中的R通道图像减去所述灰度图像,记为目标图像。
优选地,所述获取模块270包括:将所述待识别图像输入单数字识别模型中,如果单数字识别模型的输出层输入的数据最大值小于对应的设定阈值,即如果单数字识别模型的输出层输入的数据最大值为第i位的当所述小于第i位的设定阈值T1 i,则将所述待识别图像输入至双数字识别模型,反之,所述待识别图像的数值为单数字,通过单数字识别模型的输出层输出一个单数字;将所述待识别图像输入双数字识别模型中,如果双数字识别模型的输出层输入的数据最大值小于对应的设定阈值,即如果双数字识别模型的输出层输入的数据最大值为第j位的当所述小于第j位的设定阈值T2 j,则重新对所述目标图像进行切割,反之,所述待识别图像的数值为双数字,通过双数字识别模型的输出层输出一个双数字。
上述实施方式仅为本发明的优选实施方式,不能以此来限定本发明保护的范围,本领域的技术人员在本发明的基础上所做的任何非实质性的变化及替换均属于本发明所要求保护的范围。
Claims (10)
1.一种基于M-CNN的试卷分数自动统计分析方法,其特征在于,包括以下步骤:
步骤1、依据Mnist手写数字库创建单数字手写数字库,应用NIST SD19数据集创建双数字库;每个单数字手写数字库的单数字图像称为单数字手写样本,每个双数字库中的双数字图像称为双数字手写样本;
步骤2、提取每个单数字手写样本和双数字手写样本中的非零像素,每个单数字手写样本的非零像素组成单数字Mask区域,每个双数字手写样本的非零像素组成双数字Mask区域,获取每个单数字Mask区域和双数字Mask区域的像素点位置;
步骤3、创建单数字CNN识别模型和双数字CNN识别模型,所述单数字CNN识别模型和双数字CNN识别模型均包括输入层、第一卷积层、池化层、第二卷积层、SPPNET层、全连接层和输出层;
步骤4、将所述单数字手写样本输入单数字CNN识别模型中对所述单数字CNN识别模型进行训练,生成单数字识别模型;将所述双数字手写样本输入双数字CNN识别模型中对所述双数字CNN识别模型进行训练,生成双数字识别模型;其中,单数字手写样本在单数字CNN识别模型的第一卷积层参与运算的像素点为所述单数字手写样本对应的单数字Mask区域的像素点,单数字手写样本在单数字CNN识别模型的第二卷积层参与运算的像素点为所述单数字手写样本对应的单数字Mask区域同比例缩小后的像素点;双数字手写样本在双数字CNN识别模型的第一卷积层参与运算的像素点为所述双数字手写样本对应的双数字Mask区域的像素点,双数字手写样本在双数字CNN识别模型的第二卷积层参与运算的像素点为所述双数字手写样本对应的双数字Mask区域同比例缩小后的像素点;
步骤5、对包含有分数的试卷图像进行处理,获取目标图像,所述目标图像为分数区域的图像;
步骤6、获取目标图像的所有非零像素区域坐标,依据投影的非零像素区域坐标对所述目标图像进行切割;应用分解聚类算法,对所有非零像素区域进行分解聚类,确定每个聚类区域,所述聚类区域称为待识别图像;
步骤7、将每个待识别图像分别输入单数字识别模型和双数字识别模型,获取每个待识别图像的数值;
步骤8、将所有待识别图像的数值进行求和,得到所述试卷图像的总分数。
2.根据权利要求1所述的基于M-CNN的试卷分数自动统计分析方法,其特征在于,在步骤1之后还包括:
对每个单数字手写样本和双数字手写样本分别进行腐蚀和膨胀处理。
3.根据权利要求1所述的基于M-CNN的试卷分数自动统计分析方法,其特征在于,
步骤4中,单数字手写样本在单数字CNN识别模型的第二卷积层参与运算的像素点为所述单数字手写样本对应的单数字Mask区域同比例缩小后的像素点,包括:
根据单数字手写样本对应的单数字Mask区域的像素点以及单数字CNN识别模型的第一卷积层运算后的图像尺寸获取所述单数字手写样本对应的单数字Mask区域的像素点的位置,称为第一变换位置;
根据单数字CNN识别模型的第一卷积层运算后的图像尺寸输入单数字CNN识别模型的池化层输出的图像尺寸获取所述单数字手写样本对应的单数字Mask区域的像素点的位置,称为第二变换位置;
单数字手写样本在单数字CNN识别模型的第二卷积层参与运算的像素点为第二变换位置的像素点;
步骤4中,双数字手写样本在双数字CNN识别模型的第二卷积层参与运算的像素点为所述双数字手写样本对应的双数字Mask区域同比例缩小后的像素点,包括:
根据双数字手写样本对应的双数字Mask区域的像素点以及双数字CNN识别模型的第一卷积层运算后的图像尺寸获取所述双数字手写样本对应的双数字Mask区域的像素点的位置,称为第三变换位置;
根据双数字CNN识别模型的第一卷积层运算后的图像尺寸输入双数字CNN识别模型的池化层输出的图像尺寸获取所述双数字手写样本对应的双数字Mask区域的像素点的位置,称为第四变换位置;
双数字手写样本在双数字CNN识别模型的第二卷积层参与运算的像素点为第四变换位置的像素点。
4.根据权利要求1所述的基于M-CNN的试卷分数自动统计分析方法,其特征在于,步骤5包括:
将所述试卷图像的灰度图像;
应用试卷图像的RGB三通道中的R通道图像减去所述灰度图像,记为目标图像。
5.根据权利要求1或4所述的基于M-CNN的试卷分数自动统计分析方法,其特征在于,在步骤5之后还包括对所述目标图像进行腐蚀和膨胀处理。
6.根据权利要求1所述的基于M-CNN的试卷分数自动统计分析方法,其特征在于,步骤7包括:
将所述待识别图像输入单数字识别模型中,如果单数字识别模型的输出层输入的数据最大值小于对应的设定阈值,即如果单数字识别模型的输出层输入的数据最大值为第i位的当所述小于第i位的设定阈值则将所述待识别图像输入至双数字识别模型,反之,所述待识别图像的数值为单数字,通过单数字识别模型的输出层输出一个单数字;
将所述待识别图像输入双数字识别模型中,如果双数字识别模型的输出层输入的数据最大值小于对应的设定阈值,即如果双数字识别模型的输出层输入的数据最大值为第j位的当所述小于第j位的设定阈值则重新对所述目标图像进行切割,反之,所述待识别图像的数值为双数字,通过双数字识别模型的输出层输出一个双数字。
7.一种基于M-CNN的试卷分数自动统计分析装置,其特征在于,其包括:
第一创建模块,用于依据Mnist手写数字库创建单数字手写数字库,应用NIST SD19数据集创建双数字库;每个单数字手写数字库的单数字图像称为单数字手写样本,每个双数字库中的双数字图像称为双数字手写样本;
提取模块,用于提取每个单数字手写样本和双数字手写样本中的非零像素,每个单数字手写样本的非零像素组成单数字Mask区域,每个双数字手写样本的非零像素组成双数字Mask区域,获取每个单数字Mask区域和双数字Mask区域的像素点位置;
第二创建模块,用于创建单数字CNN识别模型和双数字CNN识别模型,所述单数字CNN识别模型和双数字CNN识别模型均包括输入层、第一卷积层、池化层、第二卷积层、SPPNET层、全连接层和输出层;
训练模块,用于将所述单数字手写样本输入单数字CNN识别模型中对所述单数字CNN识别模型进行训练,生成单数字识别模型;将所述双数字手写样本输入双数字CNN识别模型中对所述双数字CNN识别模型进行训练,生成双数字识别模型;其中,单数字手写样本在单数字CNN识别模型的第一卷积层参与运算的像素点为所述单数字手写样本对应的单数字Mask区域的像素点,单数字手写样本在单数字CNN识别模型的第二卷积层参与运算的像素点为所述单数字手写样本对应的单数字Mask区域同比例缩小后的像素点;双数字手写样本在双数字CNN识别模型的第一卷积层参与运算的像素点为所述双数字手写样本对应的双数字Mask区域的像素点,双数字手写样本在双数字CNN识别模型的第二卷积层参与运算的像素点为所述双数字手写样本对应的双数字Mask区域同比例缩小后的像素点;
处理模块,用于对包含有分数的试卷图像进行处理,获取目标图像,所述目标图像为分数区域的图像;
切割模块,用于获取目标图像的所有非零像素区域坐标,依据投影的非零像素区域坐标对所述目标图像进行切割;应用分解聚类算法,对所有非零像素区域进行分解聚类,确定每个聚类区域,所述聚类区域称为待识别图像;
获取模块,用于将每个待识别图像分别输入单数字识别模型和双数字识别模型,获取每个待识别图像的数值;
计算模块,用于将所有待识别图像的数值进行求和,得到所述试卷图像的总分数。
8.根据权利要求7所述的基于M-CNN的试卷分数自动统计分析装置,其特征在于,
训练模块中,单数字手写样本在单数字CNN识别模型的第二卷积层参与运算的像素点为所述单数字手写样本对应的单数字Mask区域同比例缩小后的像素点,包括:
根据单数字手写样本对应的单数字Mask区域的像素点以及单数字CNN识别模型的第一卷积层运算后的图像尺寸获取所述单数字手写样本对应的单数字Mask区域的像素点的位置,称为第一变换位置;
根据单数字CNN识别模型的第一卷积层运算后的图像尺寸输入单数字CNN识别模型的池化层输出的图像尺寸获取所述单数字手写样本对应的单数字Mask区域的像素点的位置,称为第二变换位置;
单数字手写样本在单数字CNN识别模型的第二卷积层参与运算的像素点为第二变换位置的像素点;
训练模块中,双数字手写样本在双数字CNN识别模型的第二卷积层参与运算的像素点为所述双数字手写样本对应的双数字Mask区域同比例缩小后的像素点,包括:
根据双数字手写样本对应的双数字Mask区域的像素点以及双数字CNN识别模型的第一卷积层运算后的图像尺寸获取所述双数字手写样本对应的双数字Mask区域的像素点的位置,称为第三变换位置;
根据双数字CNN识别模型的第一卷积层运算后的图像尺寸输入双数字CNN识别模型的池化层输出的图像尺寸获取所述双数字手写样本对应的双数字Mask区域的像素点的位置,称为第四变换位置;
双数字手写样本在双数字CNN识别模型的第二卷积层参与运算的像素点为第四变换位置的像素点。
9.根据权利要求7所述的基于M-CNN的试卷分数自动统计分析装置,其特征在于,所述处理模块包括:
将所述试卷图像的灰度图像;
应用试卷图像的RGB三通道中的R通道图像减去所述灰度图像,记为目标图像。
10.根据权利要求7所述的基于M-CNN的试卷分数自动统计分析装置,其特征在于,所述获取模块包括:
将所述待识别图像输入单数字识别模型中,如果单数字识别模型的输出层输入的数据最大值小于对应的设定阈值,即如果单数字识别模型的输出层输入的数据最大值为第i位的当所述小于第i位的设定阈值则将所述待识别图像输入至双数字识别模型,反之,所述待识别图像的数值为单数字,通过单数字识别模型的输出层输出一个单数字;
将所述待识别图像输入双数字识别模型中,如果双数字识别模型的输出层输入的数据最大值小于对应的设定阈值,即如果双数字识别模型的输出层输入的数据最大值为第j位的当所述小于第j位的设定阈值则重新对所述目标图像进行切割,反之,所述待识别图像的数值为双数字,通过双数字识别模型的输出层输出一个双数字。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811192679.3A CN109389173B (zh) | 2018-10-13 | 2018-10-13 | 一种基于m-cnn的试卷分数自动统计分析方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811192679.3A CN109389173B (zh) | 2018-10-13 | 2018-10-13 | 一种基于m-cnn的试卷分数自动统计分析方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109389173A true CN109389173A (zh) | 2019-02-26 |
CN109389173B CN109389173B (zh) | 2021-10-12 |
Family
ID=65426655
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811192679.3A Active CN109389173B (zh) | 2018-10-13 | 2018-10-13 | 一种基于m-cnn的试卷分数自动统计分析方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109389173B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110163256A (zh) * | 2019-04-23 | 2019-08-23 | 南京邮电大学 | 基于联合概率矩阵的试卷图像自动核分方法 |
CN110443235A (zh) * | 2019-07-01 | 2019-11-12 | 佛山科学技术学院 | 一种智能纸质试卷总分识别方法及系统 |
CN118447046A (zh) * | 2024-07-08 | 2024-08-06 | 季华实验室 | 试卷区域的识别方法、装置、设备及存储介质 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100329562A1 (en) * | 2009-06-30 | 2010-12-30 | Feng Drake Zhu | Statistical Online Character Recognition |
US20110078191A1 (en) * | 2009-09-28 | 2011-03-31 | Xerox Corporation | Handwritten document categorizer and method of training |
CN105260736A (zh) * | 2015-09-08 | 2016-01-20 | 西安交通大学 | 基于归一化非负稀疏编码器的图像快速特征表示方法 |
CN105868774A (zh) * | 2016-03-24 | 2016-08-17 | 西安电子科技大学 | 基于选择性搜索和卷积神经网络的车标识别方法 |
CN106557743A (zh) * | 2016-10-26 | 2017-04-05 | 桂林电子科技大学 | 一种基于fecnn的人脸特征提取系统及方法 |
CN107153810A (zh) * | 2016-03-04 | 2017-09-12 | 中国矿业大学 | 一种基于深度学习的手写体数字识别方法及系统 |
CN107451552A (zh) * | 2017-07-25 | 2017-12-08 | 北京联合大学 | 一种基于3d‑cnn和卷积lstm的手势识别方法 |
CN107992792A (zh) * | 2017-10-16 | 2018-05-04 | 华南理工大学 | 一种基于加速度传感器的空中手写汉字识别系统及方法 |
KR101882743B1 (ko) * | 2017-04-17 | 2018-08-30 | 인하대학교 산학협력단 | 콘볼루션 신경망 기반-계층적 특징 모델링을 이용한 효율적인 객체 검출 방법 |
CN108509988A (zh) * | 2018-03-23 | 2018-09-07 | 河南理工大学 | 一种试卷分数自动统计方法、装置、电子设备及存储介质 |
-
2018
- 2018-10-13 CN CN201811192679.3A patent/CN109389173B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100329562A1 (en) * | 2009-06-30 | 2010-12-30 | Feng Drake Zhu | Statistical Online Character Recognition |
US20110078191A1 (en) * | 2009-09-28 | 2011-03-31 | Xerox Corporation | Handwritten document categorizer and method of training |
CN105260736A (zh) * | 2015-09-08 | 2016-01-20 | 西安交通大学 | 基于归一化非负稀疏编码器的图像快速特征表示方法 |
CN107153810A (zh) * | 2016-03-04 | 2017-09-12 | 中国矿业大学 | 一种基于深度学习的手写体数字识别方法及系统 |
CN105868774A (zh) * | 2016-03-24 | 2016-08-17 | 西安电子科技大学 | 基于选择性搜索和卷积神经网络的车标识别方法 |
CN106557743A (zh) * | 2016-10-26 | 2017-04-05 | 桂林电子科技大学 | 一种基于fecnn的人脸特征提取系统及方法 |
KR101882743B1 (ko) * | 2017-04-17 | 2018-08-30 | 인하대학교 산학협력단 | 콘볼루션 신경망 기반-계층적 특징 모델링을 이용한 효율적인 객체 검출 방법 |
CN107451552A (zh) * | 2017-07-25 | 2017-12-08 | 北京联合大学 | 一种基于3d‑cnn和卷积lstm的手势识别方法 |
CN107992792A (zh) * | 2017-10-16 | 2018-05-04 | 华南理工大学 | 一种基于加速度传感器的空中手写汉字识别系统及方法 |
CN108509988A (zh) * | 2018-03-23 | 2018-09-07 | 河南理工大学 | 一种试卷分数自动统计方法、装置、电子设备及存储介质 |
Non-Patent Citations (3)
Title |
---|
LIANG-CHIEH CHEN ET AL: "DeepLab: Semantic Image Segmentation with Deep Convolutional Nets, Atrous Convolution, and Fully Connected CRFs", 《IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE》 * |
刘阳阳等: "基于卷积递归神经网络和核超限学习机的3D目标识别", 《模式识别与人工智能》 * |
栗科峰著: "《人脸图像处理与识别技术》", 31 August 2018 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110163256A (zh) * | 2019-04-23 | 2019-08-23 | 南京邮电大学 | 基于联合概率矩阵的试卷图像自动核分方法 |
CN110163256B (zh) * | 2019-04-23 | 2022-11-15 | 南京邮电大学 | 基于联合概率矩阵的试卷图像自动核分方法 |
CN110443235A (zh) * | 2019-07-01 | 2019-11-12 | 佛山科学技术学院 | 一种智能纸质试卷总分识别方法及系统 |
CN118447046A (zh) * | 2024-07-08 | 2024-08-06 | 季华实验室 | 试卷区域的识别方法、装置、设备及存储介质 |
CN118447046B (zh) * | 2024-07-08 | 2024-10-18 | 季华实验室 | 试卷区域的识别方法、装置、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN109389173B (zh) | 2021-10-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107123117B (zh) | 一种基于深度学习的ic引脚焊点质量检测方法及装置 | |
CN103971102B (zh) | 基于手指轮廓和决策树的静态手势识别方法 | |
CN107563385A (zh) | 基于深度卷积生成式对抗网络的车牌字符识别方法 | |
CN109389173A (zh) | 一种基于m-cnn的试卷分数自动统计分析方法和装置 | |
CN109934826A (zh) | 一种基于图卷积网络的图像特征分割方法 | |
CN107516316A (zh) | 一种在fcn中引入聚焦机制对静态人体图像进行分割的方法 | |
CN106980856A (zh) | 公式识别方法及系统和符号推理计算方法及系统 | |
CN108108751A (zh) | 一种基于卷积多特征和深度随机森林的场景识别方法 | |
CN109858327B (zh) | 一种基于深度学习的字符分割方法 | |
CN110516554A (zh) | 一种多场景多字体中文文字检测识别方法 | |
CN110443235B (zh) | 一种智能纸质试卷总分识别方法及系统 | |
CN109544564A (zh) | 一种医疗图像分割方法 | |
CN110751606B (zh) | 一种基于神经网络算法的泡沫图像处理方法及系统 | |
CN111210402A (zh) | 人脸图像质量评分方法、装置、计算机设备及存储介质 | |
CN113159014A (zh) | 基于手写题号的客观题批阅方法、装置、设备及存储介质 | |
CN109711326A (zh) | 一种基于浅层残差网络的视频目标检测方法 | |
CN106874913A (zh) | 一种菜品检测方法 | |
CN112070793A (zh) | 一种目标提取方法及装置 | |
CN116740528A (zh) | 一种基于阴影特征的侧扫声呐图像目标检测方法及系统 | |
CN111986117A (zh) | 一种算术作业批改系统及方法 | |
CN110659702A (zh) | 基于生成式对抗网络模型书法字帖评价系统及方法 | |
CN105786957A (zh) | 一种基于单元格邻接关系与深度优先遍历的表格排序方法 | |
CN111783737B (zh) | 一种数学公式的识别方法和识别装置 | |
CN104063874B (zh) | 基于权值模型的灰度图像二值化算法定量评估方法 | |
CN110443277A (zh) | 基于注意力模型的少量样本分类方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |