CN111242131B - 一种智能阅卷中图像识别的方法、存储介质及装置 - Google Patents
一种智能阅卷中图像识别的方法、存储介质及装置 Download PDFInfo
- Publication number
- CN111242131B CN111242131B CN202010011295.8A CN202010011295A CN111242131B CN 111242131 B CN111242131 B CN 111242131B CN 202010011295 A CN202010011295 A CN 202010011295A CN 111242131 B CN111242131 B CN 111242131B
- Authority
- CN
- China
- Prior art keywords
- neural network
- convolutional neural
- data set
- image
- result
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 65
- 238000012360 testing method Methods 0.000 claims abstract description 104
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 88
- 238000012549 training Methods 0.000 claims abstract description 45
- 238000004088 simulation Methods 0.000 claims description 64
- 238000012545 processing Methods 0.000 claims description 22
- 230000009467 reduction Effects 0.000 claims description 20
- 238000005457 optimization Methods 0.000 claims description 18
- 238000004422 calculation algorithm Methods 0.000 claims description 8
- 206010028980 Neoplasm Diseases 0.000 claims description 4
- 201000011510 cancer Diseases 0.000 claims description 4
- 238000004590 computer program Methods 0.000 claims description 4
- 238000012216 screening Methods 0.000 claims description 4
- 238000013461 design Methods 0.000 claims description 3
- 230000008569 process Effects 0.000 abstract description 27
- 238000004364 calculation method Methods 0.000 abstract description 21
- 230000006870 function Effects 0.000 description 51
- 238000009826 distribution Methods 0.000 description 16
- 238000011156 evaluation Methods 0.000 description 16
- 238000005315 distribution function Methods 0.000 description 9
- 230000004913 activation Effects 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 6
- 230000035945 sensitivity Effects 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000011478 gradient descent method Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
- G06V10/267—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/217—Validation; Performance evaluation; Active pattern learning techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computational Linguistics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明提供了一种智能阅卷中图像识别的方法,包括以下步骤:构建数据集;设计卷积神经网络结构;训练卷积神经网络;通过测试得到最优卷积神经网络模型;添加识别前序,将图像在使用模型预测前增加分类标签属性。首先,本发明能够通过优化处理图像,突出内容显示减少无关细节,大大提升图像识别的精度;其次,本发明通过使用可自学习的卷积神经网络,可以得到高识别率的计算网络模型,大大提升了识别效率;其三,本发明在预测图像分类时添加的识别前序方法,进一步提升了卷积神经网络的识别精度;其四,本发明通过大量采集现有图像数据集,对答题卡纸张没有特殊的印刷要求,便于大规模应用。
Description
技术领域:
本发明涉及图像识别领域,具体的,涉及一种智能阅卷中图像识别的方法、存储介质及装置。
背景技术:
教育是与测试、作业相关联的,智能阅卷系统中无论是班级学情分析、个人学情分析等各种可视化的分析报告、还是分层教学、分组教学、错题本等功能的实现都必须依赖于批改的准确性。
智能阅卷系统集高速扫描技术、图像处理与压缩技术、数据库及网络技术、试卷的自动采集、图像识别等技术为一体。其中图像识别的准确性是智能阅卷系统的关键技术。
传统的识别方法对于纸张、学生的操作规范、做答用笔都有严格要求。学生如果填涂不规范、错误率高,也无法做到有痕阅卷。
发明内容:
有鉴于此,本发明的目的在于提供一种智能阅卷中图像识别的方法、存储介质及装置,以解决现有技术中的至少一项技术问题。
具体的,本发明的第一方面,提供了一种智能阅卷中图像识别的方法,包括以下步骤:
构建数据集;
设计卷积神经网络结构;
训练卷积神经网络;
测试卷积神经网络模型;
添加识别前序,将图像在使用模型预测前增加分类标签属性。
优选地,所述构建数据集步骤中,包括以下步骤:
收集现有图像数据集,通过现有图像数据集构建图像分类表;
通过人工记录现有图像数据集中所有数据的图像分类数据,得到原始分类数据集;
将现有图像数据集分为训练数据集、测试数据集和仿真数据集;
将现有图像数据集通过图像优化处理算法进行优化处理,得到优化数据集。
优选地,所述设计卷积神经网络结构步骤,为根据优化数据集内的数据特征设计相对应的卷积神经网络结构。
优选地,所述训练卷积神经网络步骤,为使用训练数据集对卷积神经网络进行训练,得到卷积神经网络模型。
优选地,所述测试卷积神经网络模型步骤中,包括以下步骤:
使用测试数据集对卷积神经网络模型进行测试,得到测试结果指标;
使用仿真数据集对卷积神经网络模型进行测试,得到仿真结果指标;
根据测试结果指标和仿真结果指标判断是否完成训练,所述判断结果为是否达到目标要求,并输出当前卷积神经网络模型为最优的卷积神经网络模型;当判断结果为否时未达到目标要求,返回训练卷积神经网络步骤继续进行训练。
优选地,所述优化处理操作所用到的操作方法为减均值操作、减方差操作、双线性插值操作。
优选地,根据现有图像数据集中数据的数量、特征复杂度等因素,所述卷积神经网络的计算层数能够为多个,进一步地,所述构建卷积神经结构的计算层数设置为12个计算层。
优选地,所述卷积神经网络包括激活函数、分类计算函数、参数更新函数。
优选地,所述激活函数为ReLU函数(即线性整流函数),ReLU函数可以有效地防止梯度消失效应(在两端接近1或者-1部分时,变换太缓慢,导数趋于0,这种情况会造成信息丢失)的发生;设x为任意实数,y为目标值,所述线性整流函数公式为:
通过上述函数,能够激活网络,使其运行。
优选地,所述分类计算函数包括概率分布函数和对比函数。
所述概率分布函数为Softmax函数;假设经卷积神经网络计算后的输出为y1,y2,y3,...,yn},设f(y)为概率分布,e为欧拉数,所述概率分布函数为:
所述对比函数为交叉熵函数;设原始数据概率分布函数处理后的概率分布P={p(1),p(2),…,p(n)}(其中n为正整数),通过卷积神经网络得到的各个概率分布为Q={q(1),q(2),…,q(n)}(其中n为正整数),两个概率分布的交叉熵H(P,Q),所述交叉熵函数为:
通过上述函数,得到两个概率的交叉熵。
优选地,所述参数更新函数由损失函数和更新函数组成,所述卷积神经网络中参数的更新依赖于损失函数,参数更新则主要是通过梯度下降法来实现。设y是输入样本的实际值,y’是计算出来的概率值,损失为Loss,则所述损失函数为:
设网络参数为w,学习率为η,则更新函数为:
优选地,将测试数据集导入卷积神经网络模型,经运算得到测试结果集,根据原始分类数据集中的对应值与测试结果的对应值对比,将结果分为4种状态,所述第一测试状态、第二测试状态、第三测试状态及第四测试状态,所述第一测试状态为测试结果与实际相同且正确;所述第二测试状态为测试结果与实际不相同,且测试结果不正确,实际正确;所述第三测试状态为测试结果与实际不相同,且测试结果正确,实际不正确;所述第四测试状态为测试结果与实际相同,且测试结果及实际均不正确。
优选地,所述测试结果集评价指标为Precision(也可称为精确率指标),其计算方法为:Precision=TP/(TP+FP)。
优选地,将仿真数据集导入卷积神经网络模型,经运算得到仿真结果集,根据原始分类数据集中的对应值与测试结果的对应值对比,将结果分为4种状态,所述第一仿真状态、第二仿真状态、第三仿真状态及第四仿真状态,所述第一仿真状态为仿真结果与实际相同且正确;所述第二仿真状态为仿真结果与实际不相同,且仿真结果不正确,实际正确;所述第三仿真状态为仿真结果与实际不相同,且仿真结果正确,实际不正确;所述第四仿真状态为仿真结果与实际相同,且仿真结果及实际均不正确。
优选地,所述仿真结果集评价指标为Accuracy(也可称为准确率指标),其计算方法为:Accuracy=(TP+TN)/(TP+TN+FP+FN)。
优选地,所述测试结果集中还包括第一阈值,所述第一阈值用于判断精确率指标是否达到目标要求。
进一步地,所述准确率指标大于等于第一阈值时,判断精确率指标达到目标要求,反之判断精确率指标未达到目标要求。
优选地,所述仿真结果集中还包括第二阈值,所述第二阈值用于判断准确率指标是否达到目标要求。
进一步地,所述准确率指标大于等于第二阈值时,判断准确率指标达到目标要求,反之判断准确率指标未达到目标要求。
根据测试结果指标和仿真结果指标判断是否完成训练,所述判断结果为是否达到目标要求,并输出当前卷积神经网络模型为最优的卷积神经网络模型;当判断结果为否时未达到目标要求,返回训练卷积神经网络步骤继续进行训练。
优选地,所述添加识别前序步骤,为扫描待识别试卷,分割出多个图像数据,并将每个图像数据添加分类标签,所述分类标签包括有多类。
在实际使用中,将试卷图像集中的选择框部分单独分割出来,构成现有图像数据集;将现有图像数据集通过图像优化处理算法进行优化处理,并将每个图像数据添加分类标签,得到优化数据集,所述优化处理所用到的操作方法为减均值操作、减方差操作、双线性插值操作;将优化数据集导入最优的卷积神经网络模型得到预测结果;将结果中的数据通过分类标签进行筛选,得到最终结果集,所述分类标签能够将结果集分为不同子集;将最终结果集中的数据跟试卷姓名结合,得到所有试卷得分。
本发明的另一方面,提供了一种存储介质,所述存储介质中储存有用于实现上述智能阅卷中图像识别方法的程序。
本发明的另一方面,提供了一种装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述智能阅卷中图像识别的方法。
综上所述,本发明具有以下有益效果:
1.本发明提出的一种智能阅卷中图像识别的方法,通过优化处理图像,突出内容显示减少无关细节,大大提升图像识别的精度。
2.本发明提出的一种智能阅卷中图像识别的方法,通过使用可自学习的卷积神经网络,可以得到高识别率的计算网络模型,大大提升了识别效率。
3.本发明提出的一种智能阅卷中图像识别的方法,通过大量采集现有图像数据集,对答题卡纸张没有特殊的印刷要求,可以节约纸张。
4.本发明提出的一种智能阅卷中图像识别的方法,通过大量采集现有图像数据集,可以不改变教师评阅试卷的教学习惯,不改变学生的测试作答习惯,做到真正意义上的有痕阅卷。
5.本发明提出的一种智能阅卷中图像识别的方法,通过设置特定分类标签,能够有效提高数据识别的精度。
附图说明:
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为一种智能阅卷中图像识别方法的流程图;
图2为原始分类数据集的示意图;
图3为预测图像的步骤简图;
图4为一种智能阅卷中图像识别方法的流程示意图。
具体实施方式:
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有付出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
本申请实施例通过提供一种智能阅卷中图像识别的方法、存储介质及装置,解决了现有技术中所述的至少一项技术问题,达到识别精度高、不限制纸张等技术效果。
本申请实施例的技术方案为解决上述技术问题,总体思路如下:
收集现有图像数据集,通过现有图像数据集构建图像分类表;
通过人工记录现有图像数据集中所有数据的图像分类数据,得到原始分类数据集;
将现有图像数据集分为训练数据集、测试数据集和仿真数据集;
将现有图像数据集通过图像优化处理算法进行优化处理,得到优化数据集;
根据优化数据集内的数据特征设计相对应的卷积神经网络结构;
使用训练数据集对卷积神经网络进行训练,得到卷积神经网络模型;
使用测试数据集对卷积神经网络模型进行测试,得到测试结果指标;
使用仿真数据集对卷积神经网络模型进行测试,得到仿真结果指标;
根据测试结果指标和仿真结果指标判断是否完成训练,所述判断结果为是否达到目标要求,并输出当前卷积神经网络模型为最优的卷积神经网络模型;当判断结果为否时未达到目标要求,返回训练卷积神经网络步骤继续进行训练;
添加识别前序,提高得到的卷积神经网络模型的精度。
采用上述方案,首先,通过优化处理图像,突出内容显示减少无关细节,优化对图像识别的效率,其次,通过识别前序的添加,能够对目标数据进行一次分类,提高卷积神经网络模型对目标数据的抓取精度,进而显著提升图像识别的精度,其三,通过使用可自学习的卷积神经网络,能够得到高识别率的计算网络模型,提升了识别效率。
为了更好的理解上述技术方案,下面将结合说明书附图以及具体的实施方式对上述技术方案进行详细的说明。
在本发明的一些实施例中,如图1所示,本发明提供了一种智能阅卷中图像识别的方法,包括如下步骤:
S101收集现有图像数据集,通过现有图像数据集构建图像分类表;
在具体实施过程中,如图2所示,所述现有图像数据集可以为有一定相似性的任意图像集合,本实施例中所选用的图像为试卷判定框类图像集合;再如图3所示,结果标签总共有13种,即Tick1、Tick2、Cancel、Blank、JudgeTick、JudgeCross、JudgeCross2、JudgeCancel、JudgeBlank、NumberTick、NumberTick2、NumberCancel、NumberBlank。
S102通过人工记录现有图像数据集中所有数据的图像分类数据,得到原始分类数据集;
通过人工记录数据集中所有单个数据的图像分类数据,若该图像属于某一类,则将该对应数值设置为1,其余设置为0。
在本发明的一优选实施方式中,所述现有图像数据集的第一个图像数据属于Tick2,则该数据为(0,1,0,0,0,0,0,0,0,0,0,0,0)并记录入原始分类数据集;按照顺序将所有数据记录至原始分类数据集。
S103将现有图像数据集分为训练数据集、测试数据集和仿真数据集;
在具体实施过程中,所述训练数据集是用来做训练计算网络用,测试数据集用来做第一次测试,仿真数据集用来做第二次测试;在本实施例中,所述现有图像数据集中图像数据量为101万,所述训练数据集中图像数据的数量为10万,所述测试数据集中图像数据的数量为1万,所述仿真数据集中图像数据的数量为90万。
S104将现有图像数据集通过图像优化处理算法进行优化处理,得到优化数据集;
在具体实施过程中,所述优化处理算法将图像中目的内容突出,减少或删除不必要的图像减少图像数据信息复杂度。
S105根据优化数据集内的数据特征设计相对应的卷积神经网络结构;
在具体实施过程中,根据优化数据集内的特征,设计多个算法集合对优化数据集进行分析和运算训练,设计卷积神经网络结构。
S106使用训练数据集对卷积神经网络进行训练,得到卷积神经网络模型;
在具体实施过程中,将训练数据导入卷积神经网络,进行数据训练,经过一定数量epoch(时钟周期)的运算训练,将卷积神经网络中的相关参数调整至本时间段内最佳状态;所述epoch的数量可以为100个,也可以为200个或其他数值,本实施例中epoch的数量为150,经过训练,得到卷积神经网络模型。
S107使用测试数据集对卷积神经网络模型进行测试,得到测试结果指标;
在具体实施过程中,将测试数据集导入卷积神经网络模型模型中,按照某种评价指标来得到测试结果集,所述评价指标可以为正确率(accuracy)、错误率(error rate)、灵敏度(sensitive)、特效度(specificity)、精度(precision)、召回率(recall)或其他常用评价指标,本实施例中测试结果集的评价指标为精度(precision)。
S108使用仿真数据集对卷积神经网络模型进行测试,得到仿真结果指标;
在具体实施过程中,将仿真数据集导入卷积神经网络模型模型中,按照某种评价指标来得到仿真结果集,所述评价指标可以为正确率(accuracy)、错误率(error rate)、灵敏度(sensitive)、特效度(specificity)、精度(precision)、召回率(recall)或其他常用评价指标,本实施例中仿真结果集的评价指标为正确率(accuracy)。
S109根据测试结果指标和仿真结果指标判断是否完成训练,所述判断结果为是否达到目标要求,并输出当前卷积神经网络模型为最优的卷积神经网络模型;当判断结果为否时未达到目标要求,返回训练卷积神经网络步骤继续进行训练。
在具体实施过程中,根据测试结果指标和仿真结果指标来判断是否达到目标要求,若2项指标不满足目标要求,则需要调整参数继续训练150个epoch,然后继续进行上述2个指标测试并判断是否达到目标要求,达到目标要求后,记录相关参数,得到最优的卷积神经网络模型。
在本发明的一个优选实施方案中,所述优化处理操作所用到的操作方法为减均值操作、减方差操作、双线性插值操作。
在具体实施过程中,所述优化处理操作可以为减均值操作、减方差操作、双线性插值操作或任意1个或者任意多个的组合,本实施例中,操作方式为减均值操作、减方差操作和双线性插值操作一起使用;减均值操作可以移除像素的均值,突出图片内容;减方差操作可以减去差异化数值,将数据标准化;双线性插值可以将图像较好的转换为目标图像大小;
在本发明的一个优选实施方案中,所述卷积神经网络选择多层卷积神经网络作为基础网络结构。
根据现有图像数据集中数据的数量、特征复杂度等因素,所述卷积神经网络的计算层数能够为多个,进一步地,所述卷积神经网络的计算层数设置为12个计算层。
在具体实施过程中,数据的数量决定了需要运算量的大小,数据越多所需运算量越大,数据特征是指每个数据单元包含的数据复杂度,数据越复杂,需要的运算量越大,计算资源是指处理器的运算效率,效率越高,单位时间内能处理的数据量越大;根据上述数量、特征复杂度、计算资源的情况,确定第一神经网络模型需要多少层运算,在本实施例中,所述卷积神经网络的计算层数设置为12。
在本发明的一个优选实施方案中,所述卷积神经网络包括激活函数、分类计算函数、参数更新函数。
在具体实施过程中,激活函数可以将非线性输出值进行归类;分类计算函数通过识别计算得到数据中的分类值集合并形成概率分布,跟训练数据集中初始分类值集合形成的概率分布进行对比,经过多次运算训练,得到最接近的概率分布;参数更新函数根据识别计算得到数据中的数据值集合,跟结果集中的初始结果数据值进行对比并计算差值,经过多次运算训练,得到最好的网络参数。
在本发明的一个优选实施方案中,所述激活函数为ReLU函数(即线性整流函数),ReLU函数可以有效地防止梯度消失效应(在两端接近1或者-1部分时,变换太缓慢,导数趋于0,这种情况会造成信息丢失)的发生;设x为任意实数,y为目标值,所述线性整流函数公式为:
通过上述函数,激活计算网络的运行。
在具体实施过程中,所述激活函数可以为Sigmoid函数或Tanh函数等,但是ReLU不仅具有非线性的特点,在一定范围内又具有线性的特点,这些特性使得ReLU在随机梯度下降过程中能够明显加快收敛速度,能有效地防止梯度消失的发生。
在具体实施过程中,所述分类计算函数包括概率分布函数和对比函数。
在具体实施过程中,所述概率分布函数为Softmax函数;假设经卷积神经网络计算后的输出为y1,y2,y3,...,yn},设f(y)为概率分布,e为欧拉数,所述概率分布函数为:
在具体实施过程中,所述对比函数为交叉熵函数;设原始数据概率分布函数处理后的概率分布P={p(1),p(2),…,p(n)}(其中n为正整数),通过卷积神经网络得到的各个概率分布为Q={q(1),q(2),…,q(n)}(其中n为正整数),两个概率分布的交叉熵H(P,Q),所述交叉熵函数为:
通过上述函数,得到两个概率的交叉熵。
在具体实施过程中,分类计算函数通过两步运算来得到相应结果,第一步将多个数据值进行概率分布化,随后通过概率来计算区别,由于所述卷积神经网络的输出只是一个值,需要将其处理数值处理为概率分布,因此需要用到概率分布函数;第二部使用交叉熵损失函数,交叉熵刻画的是两个概率分布之间的距离,交叉熵的值越小,表明这两个概率分布就越接近,则数值准确率越高,经过运算训练,当交叉熵的值最小时,得到最优参数。
在本发明的一个优选实施方案中,所述参数更新函数由损失函数和更新函数组成,卷积神经网络中参数的更新依赖于损失函数,参数更新则主要是通过梯度下降法来实现。设y是输入样本的初始结果值,y’是计算出来的数据值,损失为Loss,则所述损失函数为:
设网络参数为w,学习率为η,则更新函数为:
在具体实施过程中,η作为超参数用来控制步长,学习率对卷积神经网络的调优非常重要。学习率选取的好坏会影响卷积神经网络的训练以及性能表现,在本实施例中,η初始值是0.01,每迭代15个epoch调整一次,最小值是0.0001。
在本发明的一个优选实施方案中,将测试数据集导入卷积神经网络模型,经运算得到测试结果,根据原始分类数据集中的对应值与测试结果的对应值对比,将结果分为4种状态,即:
TP:测试结果为1(Positive),实际也为1,测试结果正确(True);
TN:测试结果为0(Negative),实际也为0,测试结果正确(True);
FP:测试结果为1(Positive),实际为0,测试结果错误(False);
FN:测试结果为0(Negative),实际为1,测试结果错误(False)。
所述测试结果集评价指标为Precision(也可称为精确率指标),其计算方法为:Precision=TP/(TP+FP)。
在具体实施过程中,所述Precision指标计算的是所有被检索到的结果中,应该被检索到的结果占的比例,主要考察的是能正确识别到该特征的能力;在本发明的一个实施例中,测试结果集中的一个测试结果为(0.01,0.9,0.02,0,0.01,0,0.01,0,0.03,0,0.01,0.01,0),其最大概率为0.9,则此数据的最终分类结果为1,记录并计算下一个测试结果数据,将所有测试结果数据测试完以后,将所有数据求平均数,即得到相应结果指标。
在本发明的一个优选实施方案中,将仿真数据集导入卷积神经网络模型,经运算得到仿真结果,根据原始分类数据集中的对应值与仿真结果的对应值对比,将结果分为4种状态,即:
TP:仿真结果为1(Positive),实际也为1,仿真结果正确(True);
TN:仿真结果为0(Negative),实际也为0,仿真结果正确(True);
FP:仿真结果为1(Positive),实际为0,仿真结果错误(False);
FN:仿真结果为0(Negative),实际为1,仿真结果错误(False)。
所述仿真结果集评价指标为Accuracy(也可称为准确率指标),其计算方法为:Accuracy=(TP+TN)/(TP+TN+FP+FN)。
在具体实施过程中,所述Accuracy指标计算的是分类器正确分类的样本数与总样本数之比,主要考察的是将特征识别正确的能力;在本发明的一个实施例中,测试结果集中的一个测试结果为(0.01,0.02,0.9,0,0.01,0,0.01,0,0.03,0,0.01,0.01,0),其最大概率为0.9,则此数据的最终分类结果为2,记录并计算下一个测试结果数据,将所有测试结果数据测试完以后,将所有数据求平均数,即得到相应结果指标。
根据测试结果指标和仿真结果指标来综合判断是否达到目标要求,从而选择继续训练或终止训练并得到最优的卷积神经网络模型。
在具体实施过程中,所述第一阈值为99.4%,所述第二阈值为99.6%,当测试结果集评价指标和仿真结果集评价指标同时满足时,修改超参数,返回训练步骤重新训练;当测试结果集评价指标和仿真结果集评价指标同时满足时,记录相关参数,得到最优的卷积神经网络模型。
在本发明的一个优选的实施方式中,如图3所示,所述添加识别前序步骤,为扫描待识别试卷,分割出多个图像数据,并将每个图像数据添加分类标签,所述分类标签包括有多类。
在具体实施过程中,所述添加识别前序步骤,为扫描整个待识别试卷页面,将需要处理的选择框图像数据部分单独分割出来,并将每个图像数据添加特定分类标签,得到优化数据集;所述特定分类标签可以为choice、number、judge;判断图像所属标签并将分类标签赋予相对应图像,按照顺序将所有数据记录至优化数据集;其中choice标签可以对应结果标签Tick1、Tick2、Cancel、Blank,judge标签可以对应结果标签JudgeTick、JudgeCross、JudgeCross2、JudgeCancel、JudgeBlank,number标签可以对应结果标签NumberTick、NumberTick2、NumberCancel、NumberBlank;将优化数据集导入最优的卷积神经网络模型得到结果数据集;将结果数据集中的数据通过特定分类标签进行筛选,得到最终结果集;
在具体实施过程中,所述结果数据集中第一个数据值为(0.01,0.29,0,0,0.3,0.05,0.01,0,0.29,0,0.04,0.01,0),其对应的最大概率值为0.3,对应的结果标签为Tick2,由于choice标签可以对应结果标签Tick1、Tick2、Cancel、Blank,judge标签可以对应结果标签JudgeTick、JudgeCross、JudgeCross2、JudgeCancel、JudgeBlank,number标签可以对应结果标签NumberTick、NumberTick2、NumberCancel、NumberBlank,所以所述数据值对应choice标签,只保留choice标签包含的数据位即Tick1、Tick2、Cancel、Blank,也即数据前四位,所以数据筛选后为(0.01,0.29,0,0),若只按照概率值来计算,述所结果数据会被误认为0.3即JudgeTick,但是由于有分类标签,所以可以正确识别为Tick2,从而增加识别精度。
在具体实施过程中,将最终结果集中的数据跟试卷、姓名结合,得到所有试卷得分。
在具体实施过程中,所有的识别结果导出,将得出每个人的判断部分得分,将判断部分得分和其它部分得分加合后可得到总成绩,从而得到试卷得分。
在本发明的一个优选实施方案中,所述优化处理操作所用到的操作方法为减均值操作、减方差操作、双线性插值操作。
在具体实施过程中,所述优化处理操作可以为减均值操作、减方差操作、双线性插值操作或任意一个或者任意多个的组合,本实施例中,操作方式为减均值操作、减方差操作和双线性插值操作一起使用;减均值操作可以移除像素的均值,突出图片内容;减方差操作可以减去差异化数值,将数据标准化;双线性插值可以将图像较好的转换为目标图像大小。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本申请所提供的这些实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (7)
1.一种智能阅卷中图像识别的方法,其特征在于:所述智能阅卷中图像识别的方法包括以下步骤:
构建数据集:
收集现有图像数据集,通过现有图像数据集构建图像分类表;
通过记录现有图像数据集中所有数据的图像分类数据,得到原始分类数据集;
将现有图像数据集分为训练数据集、测试数据集和仿真数据集;
将现有图像数据集通过图像优化处理算法进行优化处理,得到优化数据集,
其中优化处理操作所用的的操作方法为减均值操作、减方差操作或双线性插值操作;
设计卷积神经网络结构;
训练卷积神经网络;
测试卷积神经网络模型;
添加识别前序;
所述添加识别前序步骤,为扫描待识别试卷,分割出多个图像数据,并将每个图像数据添加分类标签,所述分类标签包括有多类,包括choice、number、judge,判断图像所属标签并将分类标签赋予相对应图像,按照顺序将所有数据记录至优化数据集,choice标签对应结果标签Tick1、Tick2、Cancel、Blank,judge标签对应结果标签JudgeTick、JudgeCross、JudgeCross2、JudgeCancel、JudgeBlank,number标签对应结果标签NumberTick、NumberTick2、NumberCancel、NumberBlank,将优化数据集导入最优的卷积神经网络模型得到结果数据集;将结果数据集中的数据通过分类标签进行筛选,得到最终结果集。
2.根据权利要求1所述智能阅卷中图像识别的方法,其特征在于:所述设计卷积神经网络结构步骤,为根据优化数据集内的数据特征设计相对应的卷积神经网络结构。
3.根据权利要求2所述智能阅卷中图像识别的方法,其特征在于:所述训练卷积神经网络步骤,使用训练数据集对卷积神经网络进行训练,得到卷积神经网络模型。
4.根据权利要求3所述智能阅卷中图像识别的方法,其特征在于:所述测试卷积神经网络模型步骤中,包括以下步骤:
使用测试数据集对卷积神经网络模型进行测试,得到测试结果指标;
使用仿真数据集对卷积神经网络模型进行测试,得到仿真结果指标;
根据测试结果指标和仿真结果指标判断是否完成训练,所述判断结果为是否达到目标要求,并输出当前卷积神经网络模型为最优的卷积神经网络模型;当判断结果为否时未达到目标要求,返回训练卷积神经网络步骤继续进行训练。
5.根据权利要求1所述智能阅卷中图像识别的方法,其特征在于:所述优化处理操作所用到的操作方法为减均值操作、减方差操作、双线性插值操作。
6.一种存储介质,其特征在于:所述存储介质中储存有用于实现如权利要求1-5任一种所述的智能阅卷中图像识别方法的程序。
7.一种装置,其特征在于:所述装置包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1-5任一种所述的智能阅卷中图像识别的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010011295.8A CN111242131B (zh) | 2020-01-06 | 2020-01-06 | 一种智能阅卷中图像识别的方法、存储介质及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010011295.8A CN111242131B (zh) | 2020-01-06 | 2020-01-06 | 一种智能阅卷中图像识别的方法、存储介质及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111242131A CN111242131A (zh) | 2020-06-05 |
CN111242131B true CN111242131B (zh) | 2024-05-10 |
Family
ID=70874326
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010011295.8A Active CN111242131B (zh) | 2020-01-06 | 2020-01-06 | 一种智能阅卷中图像识别的方法、存储介质及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111242131B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112085634A (zh) * | 2020-09-28 | 2020-12-15 | 北京十六进制科技有限公司 | 一种基于人工智能的智能卡及教学系统 |
Citations (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105184226A (zh) * | 2015-08-11 | 2015-12-23 | 北京新晨阳光科技有限公司 | 数字识别方法和装置及神经网络训练方法和装置 |
CN107145898A (zh) * | 2017-04-14 | 2017-09-08 | 北京航星机器制造有限公司 | 一种基于神经网络的射线图像分类方法 |
CN108009537A (zh) * | 2017-12-14 | 2018-05-08 | 北京慧辰资道资讯股份有限公司 | 一种识别问卷批改得分的方法 |
CN108038517A (zh) * | 2018-01-02 | 2018-05-15 | 东北农业大学 | 基于改进卷积神经网络模型Cifar10的玉米叶片病害识别方法 |
CN108364006A (zh) * | 2018-01-17 | 2018-08-03 | 超凡影像科技股份有限公司 | 基于多模式深度学习的医学图像分类装置及其构建方法 |
CN108509988A (zh) * | 2018-03-23 | 2018-09-07 | 河南理工大学 | 一种试卷分数自动统计方法、装置、电子设备及存储介质 |
CN108764074A (zh) * | 2018-05-14 | 2018-11-06 | 山东师范大学 | 基于深度学习的主观题智能阅卷方法、系统及存储介质 |
CN109376777A (zh) * | 2018-10-18 | 2019-02-22 | 四川木牛流马智能科技有限公司 | 基于深度学习的宫颈癌组织病理学图像分析方法及设备 |
CN109460769A (zh) * | 2018-11-16 | 2019-03-12 | 湖南大学 | 一种基于表格字符检测与识别的移动端系统与方法 |
WO2019082202A1 (en) * | 2017-10-23 | 2019-05-02 | Artificial Learning Systems India Private Limited | EARTHQUAKE IMAGE QUALITY ASSESSMENT SYSTEM |
CN109800754A (zh) * | 2018-12-06 | 2019-05-24 | 杭州电子科技大学 | 一种基于卷积神经网络的古字体分类方法 |
CN109886161A (zh) * | 2019-01-30 | 2019-06-14 | 江南大学 | 一种基于可能性聚类和卷积神经网络的道路交通标识识别方法 |
CN109948609A (zh) * | 2019-03-06 | 2019-06-28 | 南京邮电大学 | 基于深度学习的智能阅卷定位方法 |
CN110110585A (zh) * | 2019-03-15 | 2019-08-09 | 西安电子科技大学 | 基于深度学习的智能阅卷实现方法及系统、计算机程序 |
CN110110780A (zh) * | 2019-04-30 | 2019-08-09 | 南开大学 | 一种基于对抗神经网络和海量噪声数据的图片分类方法 |
CN110136693A (zh) * | 2018-02-09 | 2019-08-16 | 百度(美国)有限责任公司 | 用于使用少量样本进行神经话音克隆的系统和方法 |
CN110163246A (zh) * | 2019-04-08 | 2019-08-23 | 杭州电子科技大学 | 基于卷积神经网络的单目光场图像无监督深度估计方法 |
CN110163256A (zh) * | 2019-04-23 | 2019-08-23 | 南京邮电大学 | 基于联合概率矩阵的试卷图像自动核分方法 |
CN110414529A (zh) * | 2019-06-26 | 2019-11-05 | 深圳中兴网信科技有限公司 | 试卷信息提取方法、系统及计算机可读存储介质 |
CN110443235A (zh) * | 2019-07-01 | 2019-11-12 | 佛山科学技术学院 | 一种智能纸质试卷总分识别方法及系统 |
KR20190139539A (ko) * | 2018-06-08 | 2019-12-18 | 광운대학교 산학협력단 | 저사양 임베디드 환경에서의 합성곱 신경망 연산을 위한 역 잔여 블록의 채널 확장 매개변수 설정 시스템 및 방법 |
-
2020
- 2020-01-06 CN CN202010011295.8A patent/CN111242131B/zh active Active
Patent Citations (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105184226A (zh) * | 2015-08-11 | 2015-12-23 | 北京新晨阳光科技有限公司 | 数字识别方法和装置及神经网络训练方法和装置 |
CN107145898A (zh) * | 2017-04-14 | 2017-09-08 | 北京航星机器制造有限公司 | 一种基于神经网络的射线图像分类方法 |
WO2019082202A1 (en) * | 2017-10-23 | 2019-05-02 | Artificial Learning Systems India Private Limited | EARTHQUAKE IMAGE QUALITY ASSESSMENT SYSTEM |
CN108009537A (zh) * | 2017-12-14 | 2018-05-08 | 北京慧辰资道资讯股份有限公司 | 一种识别问卷批改得分的方法 |
CN108038517A (zh) * | 2018-01-02 | 2018-05-15 | 东北农业大学 | 基于改进卷积神经网络模型Cifar10的玉米叶片病害识别方法 |
CN108364006A (zh) * | 2018-01-17 | 2018-08-03 | 超凡影像科技股份有限公司 | 基于多模式深度学习的医学图像分类装置及其构建方法 |
CN110136693A (zh) * | 2018-02-09 | 2019-08-16 | 百度(美国)有限责任公司 | 用于使用少量样本进行神经话音克隆的系统和方法 |
CN108509988A (zh) * | 2018-03-23 | 2018-09-07 | 河南理工大学 | 一种试卷分数自动统计方法、装置、电子设备及存储介质 |
CN108764074A (zh) * | 2018-05-14 | 2018-11-06 | 山东师范大学 | 基于深度学习的主观题智能阅卷方法、系统及存储介质 |
KR20190139539A (ko) * | 2018-06-08 | 2019-12-18 | 광운대학교 산학협력단 | 저사양 임베디드 환경에서의 합성곱 신경망 연산을 위한 역 잔여 블록의 채널 확장 매개변수 설정 시스템 및 방법 |
CN109376777A (zh) * | 2018-10-18 | 2019-02-22 | 四川木牛流马智能科技有限公司 | 基于深度学习的宫颈癌组织病理学图像分析方法及设备 |
CN109460769A (zh) * | 2018-11-16 | 2019-03-12 | 湖南大学 | 一种基于表格字符检测与识别的移动端系统与方法 |
CN109800754A (zh) * | 2018-12-06 | 2019-05-24 | 杭州电子科技大学 | 一种基于卷积神经网络的古字体分类方法 |
CN109886161A (zh) * | 2019-01-30 | 2019-06-14 | 江南大学 | 一种基于可能性聚类和卷积神经网络的道路交通标识识别方法 |
CN109948609A (zh) * | 2019-03-06 | 2019-06-28 | 南京邮电大学 | 基于深度学习的智能阅卷定位方法 |
CN110110585A (zh) * | 2019-03-15 | 2019-08-09 | 西安电子科技大学 | 基于深度学习的智能阅卷实现方法及系统、计算机程序 |
CN110163246A (zh) * | 2019-04-08 | 2019-08-23 | 杭州电子科技大学 | 基于卷积神经网络的单目光场图像无监督深度估计方法 |
CN110163256A (zh) * | 2019-04-23 | 2019-08-23 | 南京邮电大学 | 基于联合概率矩阵的试卷图像自动核分方法 |
CN110110780A (zh) * | 2019-04-30 | 2019-08-09 | 南开大学 | 一种基于对抗神经网络和海量噪声数据的图片分类方法 |
CN110414529A (zh) * | 2019-06-26 | 2019-11-05 | 深圳中兴网信科技有限公司 | 试卷信息提取方法、系统及计算机可读存储介质 |
CN110443235A (zh) * | 2019-07-01 | 2019-11-12 | 佛山科学技术学院 | 一种智能纸质试卷总分识别方法及系统 |
Non-Patent Citations (2)
Title |
---|
SCUT-EPT: New Dataset and Benchmark for Offline Chinese Text Recognition in Examination Paper;zhu yz等;IEEE ACCESS;第7卷;第370-382页 * |
基于改进卷积神经网络的手写数字识别;杜洋;王展青;;计算机测量与控制(07);第265-270页 * |
Also Published As
Publication number | Publication date |
---|---|
CN111242131A (zh) | 2020-06-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111126386B (zh) | 场景文本识别中基于对抗学习的序列领域适应方法 | |
CN109189767B (zh) | 数据处理方法、装置、电子设备及存储介质 | |
CN110717431A (zh) | 一种结合多视角注意力机制的细粒度视觉问答方法 | |
CN113011357B (zh) | 基于时空融合的深度伪造人脸视频定位方法 | |
CN111209384A (zh) | 基于人工智能的问答数据处理方法、装置及电子设备 | |
CN104966097A (zh) | 一种基于深度学习的复杂文字识别方法 | |
CN104463101A (zh) | 用于文字性试题的答案识别方法及系统 | |
CN112687374B (zh) | 一种基于文本和图像信息联合计算的心理危机预警方法 | |
CN107491729B (zh) | 基于余弦相似度激活的卷积神经网络的手写数字识别方法 | |
CN110689523A (zh) | 基于元学习个性化图像信息评价方法、信息数据处理终端 | |
CN110046264A (zh) | 一种面向手机文档的自动分类方法 | |
CN111932418B (zh) | 一种学生学习情况识别方法、系统、教学终端及存储介质 | |
CN110993102A (zh) | 一种基于校园大数据的学生行为与心理检测结果的精准分析方法及系统 | |
CN110634060A (zh) | 一种用户信用风险的评估方法、系统、装置及存储介质 | |
CN109800309A (zh) | 课堂话语类型分类方法及装置 | |
CN110765285A (zh) | 基于视觉特征的多媒体信息内容管控方法及系统 | |
CN109523514A (zh) | 对逆合成孔径雷达isar的批量成像质量评估方法 | |
CN111242131B (zh) | 一种智能阅卷中图像识别的方法、存储介质及装置 | |
CN111984790B (zh) | 一种实体关系抽取方法 | |
CN112131354A (zh) | 答案筛选方法、装置、终端设备和计算机可读存储介质 | |
CN114860922B (zh) | 心理测评量表的分类模型获取方法、筛查方法及系统 | |
CN115147432A (zh) | 一种基于深度残差语义分割网络的初至拾取方法 | |
CN110427973B (zh) | 一种面向歧义标注样本的分类方法 | |
CN114022698A (zh) | 一种基于二叉树结构的多标签行为识别方法及装置 | |
CN111222463A (zh) | 一种基于级联式卷积网络的机动车人脸检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |