发明内容
本公开旨在至少在一定程度上解决相关技术中的技术问题之一。
本公开第一方面实施例提出了一种用于识别和校验答题卡客观题识别结果的方法,包括:
获取对答题卡的客观题答题区域拍摄所得的第一图像,并对所述第一图像进行图像分割和预处理,以得到包含所述客观题答题区域的第二图像;
对所述第二图像进行处理,以确定所述客观题答题区域中的每个作答子区域所对应的各个第三图像,其中,每个所述第三图像对应一个所述作答子区域;
比较各个所述第三图像,并根据比较结果确定答题考生对应的书写特征;
基于所述书写特征,获取所述答题考生对应的第一填涂类型;
将每个所述第三图像分别输入至预先训练生成的第二神经网络模型,以得到每个所述第三图像对应的第二填涂类型;
根据每个所述第三图像对应的第二填涂类型,所述第一填涂类型和所述书写特征,判断每个所述作答子区域的作答结果是否合格;
在所述作答结果为合格的情况下,判断所述作答结果是否正确。
本公开第二方面实施例提出了一种用于识别和校验答题卡客观题识别结果的装置,包括:
第一获取模块,用于获取对答题卡的客观题答题区域拍摄所得的第一图像,并对所述第一图像进行图像分割和预处理,以得到包含所述客观题答题区域的第二图像;
处理模块,用于对所述第二图像进行处理,以确定所述客观题答题区域中的每个作答子区域所对应的各个第三图像,其中,每个所述第三图像对应一个所述作答子区域;
比较模块,用于比较各个所述第三图像,并根据比较结果确定答题考生对应的书写特征;
第二获取模块,用于基于所述书写特征,获取所述答题考生对应的第一填涂类型;
第三获取模块,用于将每个所述第三图像分别输入至预先训练生成的第二神经网络模型,以得到每个所述第三图像对应的第二填涂类型;
第一判断模块,用于根据每个所述第三图像对应的第二填涂类型,所述第一填涂类型和所述书写特征,判断每个所述作答子区域的作答结果是否合格;
第二判断模块,用于在所述作答结果为合格的情况下,判断所述作答结果是否正确。
本公开第三方面实施例提出了一种电子设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时,实现如本公开第一方面实施例提出的用于识别和校验答题卡客观题识别结果的方法。
本公开第四方面实施例提出了一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,实现如本公开第一方面实施例提出的用于识别和校验答题卡客观题识别结果的方法。
本公开提供的用于识别和校验答题卡客观题识别结果的方法及装置,存在如下有益效果:
本公开实施例中,首先获取对答题卡的客观题答题区域拍摄所得的第一图像,并对第一图像进行图像分割和预处理,以得到包含客观题答题区域的第二图像,之后对第二图像进行处理,以确定客观题答题区域中的每个作答子区域所对应的各个第三图像,其中,每个第三图像对应一个作答子区域,然后比较各个第三图像,并根据比较结果确定答题考生对应的书写特征,之后基于书写特征,获取答题考生对应的第一填涂类型,然后将每个第三图像分别输入至预先训练生成的第二神经网络模型,以得到每个第三图像对应的第二填涂类型,之后根据每个第三图像对应的第二填涂类型,第一填涂类型和书写特征,判断每个作答子区域的作答结果是否合格,最后在作答结果为合格的情况下,判断作答结果是否正确。由此,可以结合考生的书写特征来对作答结果是否合格进行判断,从而结合考试的填涂习惯,精确的识别考生的答题情况,可以快速适应不同的填涂结果,降低了识别的错误率,避免了由于填涂不规范造成的识别错误,可以将一部分符合考生书写习惯的填涂结果作为合格的填涂结果。降低了由于考生填涂的多样性和不规则性,填涂方式的不规范,甚至题目类型、填涂工具等因素的不同而引起的识别错误的结果,智能化计算填涂的规范程度并形成记录能协助人工快速定位需要处理的数据。
本公开附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本公开的实践了解到。
实施方式
下面详细描述本公开的实施例,实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本公开,而不能理解为对本公开的限制。
下面参考附图描述本公开实施例的用于识别和校验答题卡客观题识别结果的方法、装置、电子设备和存储介质。
图1为本公开实施例所提供的一种用于识别和校验答题卡客观题识别结果的方法的流程示意图。
本公开实施例以该用于识别和校验答题卡客观题识别结果的方法被配置于用于识别和校验答题卡客观题识别结果的装置中来举例说明,该用于识别和校验答题卡客观题识别结果的装置可以应用于任一电子设备中,比如电脑、计算机,以使该电子设备可以执行用于识别和校验答题卡客观题识别结果的方法,或者也可以是服务器,在此不做限定。
如图1所示,该用于识别和校验答题卡客观题识别结果的方法可以包括以下步骤:
步骤101,获取对答题卡的客观题答题区域拍摄所得的第一图像,并对第一图像进行图像分割和预处理,以得到包含客观题答题区域的第二图像。
其中,答题卡为考生作答的答题卷,答题卡中有主观题答题区域和客观题答题区域。
其中,第一图像可以是图像采集设备对客观题答题区域拍摄所得的图像。为了获取目标感兴趣区域图像,还需要进行图像分割。图像分割可以采用传统的阈值分割方法、基于边缘检测的分割方法、基于区域生长的分割方法、深度学习模型(如语义分割网络)等方法来完成。之后可以根据图像分割所得到的结果,选择包含客观题答题区域的子区域,并将这一区域单独提出来,得到包含客观题答题区域的第二图像。
需要说明的是,需要首先对第一图像进行预处理以提高识别精度和减少误差,比如灰度化、二值化、去噪等。可选的,还可以在第二图像上进一步做一些图像增强处理,如矫正、旋转等,以提高后续处理的准确性和稳定性。
其中,在二值化之前,可以用去噪技术去掉一些不必要的小斑点,避免斑点被错误地视作客观题的填涂体。
可选的,还可以进行尺寸统一化处理,由于采集答题卡图片的设备和角度都可能不同,所拍摄到的图像尺寸大小可能也各不相同。为了使处理更加容易并便于后续处理,通常需要先将所有图像缩放成相同的大小。如果答题卡上存在边框或有较多无用区域,可以使用Canny算法进行边缘检测,进而统计和移除非有效区域的像素。如果答题卡采集角度有较大倾斜,还可以通过透视变形校正可以得到平整的图像使得后续计算更容易。
步骤102,对第二图像进行处理,以确定客观题答题区域中的每个作答子区域所对应的各个第三图像,其中,每个第三图像对应一个作答子区域。
具体的,第三图像可以为每个题目对应的图像。举例来说,对于选择题,每个题目对应有四个方格需要填涂,则可以将这四个方格所在区域作为一个作答子区域。如图2所示,图2示出了一种作答子区域的示意图。
在图2中,有三个作答子区域A、B、C,其中,A、B、C分别对应题目1、题目2、题目3。作答子区域A、B、C分别对应一个第三图像。
因而,可以对第二图像进行分割处理,从而得到每个题目对应的作答子区域所对应的第三图像。
步骤103,比较各个第三图像,并根据比较结果确定答题考生对应的书写特征。
具体的,可以首先比较各个第三图像,以确定相似度大于第一阈值的第四图像的数量,之后在数量大于第二阈值的情况下,确定答题考生对应的书写特征为连续特征,或者在数量小于或者等于第二阈值的情况下,确定答题考生的书写特征为非连续特征。
可选的,在比较各个第三图像时,可以是比较各个第三图像中的填涂区域。需要说明的是,每个第三图像中都包含一块填涂区域,可以将该填涂区域作为与第三图像对应的目标区域。需要说明的是,各个第三图像中的填涂区域所在方框的面积为相同的。
在比较相似度时,可以利用均方误差(MSE)、峰值信噪比(PSNR)、结构相似性(SSIM)等方法,在此不做限定。
举例来说,若第三图像有5个,分别为U1、U2、U3、U4、U5,则可以两两比较各个第三图像之间的相似度,也即U1和U2的相似度、U1和U3的相似度、U1和U4的相似度、U1和U5的相似度、U2和U3的相似度、U2和U4的相似度、U2和U5的相似度、U3和U4的相似度、U3和U5的相似度、U4和U5的相似度。由此,可以知道每个第三图像和其余的第三图像之间的相似度。
其中,第一阈值可以为相似度阈值,本公开实施例中可以为0.85。第二阈值为相似度高于第一阈值的第三图像的数量的阈值。
举例来说,若第二阈值为3。若U1和U2、U3、U4、U5之间的相似度分别为0.7、0.88、0.9、0.96、0.86,也即是说U1和U3、U4、U5之间的相似度均大于第一阈值,则可以将其作为第四图像。且U1和U3、U4、U5一共有4张图像,大于第二阈值3,则可以确定答题考生对应的书写特征为连续特征。
需要说明的是,由于考生的书写习惯,在填涂各个客观题的答题卡的时候,通常会按照一定的填涂习惯进行填涂,比如有的考生喜欢全部填满,有的考生填涂的时候会留一个空白角,有的考生填涂颜色比较浅,有的考生填涂的时候是打对号,或者打叉号。本公开实施例中,可以利用考生的书写习惯特点,来确定考生的书写特征。其中,连续特征是说明考生在填涂客观题时是按照一定的习惯多次填涂的,比如连续按照同样的填涂深浅程度进行填涂,因而不管填涂的是否规范,对答题卡的填涂特点是相同的,易于辨认。举例来说,若考生的书写特征为连续特征,则说明有多个填涂区域的图像填涂的相似度比较高。若考生的书写特征为非连续特征,则说明各个填涂区域的填涂相似度低,可能均不相似,或者仅有个别为相似的。
需要说明的是,若考生的书写特征为连续特征,则可以根据考生的书写特征之后对考生的填涂结果进行准确的识别。
步骤104,基于书写特征,获取答题考生对应的第一填涂类型。
可选的,在书写特征为连续特征的情况下,将各个第四图像输入至预先训练完成的第二神经网络模型中,以确定答题考生对应的第一填涂类型。
其中,第二神经网络模型用于对多个第四图像进行分析,以得到第一填涂类型。
其中,第一填涂类型可以为与书写特征对应的填涂类型,用于表征本次答题考生在填涂答题卡的时候的参考填涂类型,也即可以用于表征答题考生在本次考试中填涂情况的填涂类型。
需要说明的是,由于各个第四图像为相似度比较高,也即相似度大于第一阈值的图像,因而在根据各个第四图像确定第一填涂类型的时候,可以使得第一填涂类型的确定更加准确,更加能够反映考生的书写情况。
可选的,可以首先进行数据准备,比如可以首先收集大量的相似度比较高的图像数据,并对其进行预处理和标注。预处理包括图像缩放、灰度化、去噪等操作,标注则关键信息的定位和标记。同时,可以使用一些数据增强技巧,如旋转、翻转、缩放等,增加模型的鲁棒性和泛化能力。之后建立模型:在深度学习框架下建立卷积神经网络模型,如ResNet、VGG、Inception等,用于提取图像的特征。可以从预训练好的模型开始,根据具体任务对模型结构进行微调或重新训练整个网络。然后训练模型:将准备好的数据集分为训练集和验证集,并使用交叉验证等方法进行模型训练和测试。
在训练过程中,可以使用ImageDataGenerator工具集,直接从文件夹中读取并处理图像数据。最后可以进行模型评估:通过测试集评估模型性能,例如准确率、召回率等指标,也可以采用kappa系数、F1得分等代替评价超级因变量预测结果的指标,以找到最优模型。最后,可以使用训练好的模型对新数据进行预测,输出相应置信度或概率最高的类别即为最优的图像。此外,可以通过可视化方式根据特征图和热力图等方式分析判断模型在图像分类任务上的表现。
其中,第二神经网络模型可以用于从各个相似度比较高的第四图像中获取一张质量最高,且最能表征各个第四图像特征的图像,并确定该图像对应的第一填涂类型。需要说明的是,此处该图像所对应的第一填涂类型是第三子类型中的其中一种类型。
或者,在书写特征为非连续特征的情况下,对各个第三图像进行均值融合,以得到第五图像,并确定第五图像对应的第一填涂类型。
其中,第五图像可以是将各个第三图像中的填涂区域图像进行均值融合所得到的图像。
其中,均值融合可以是将所有图像中填涂区域的像素点对应位置上的数值求平均,得到每个像素点的平均值,使用生成的每个像素点的平均值来创建一个平均图像。此外还有其他一些融合算法,如加权平均融合、中值融合等。
步骤105,将每个第三图像分别输入至预先训练生成的第一神经网络模型,以得到每个第三图像对应的第二填涂类型。
其中,第二填涂类型可以是第三图像中的填涂区域所对应的填涂类型。
可选的,可以首先获取第一训练样本集,其中,第一训练样本集中包含有多个客观题填涂图像,以及客观题填涂图像所对应的第二填涂类型,之后基于第一训练样本集对第一初始模型进行训练直至第一初始模型对客观题填涂图像的检测结果达到预设条件,将训练完成的第一初始模型作为第一神经网络模型。
首先收集具有代表性的填涂类型数据样本作为第一训练样本集,以及一些具有挑战性的边界情况等。对于每个样本,需要将其标记为相应的第二填涂类型。
需要说明的是,有些第二填涂类型是符合预设的规范填涂类型,有些是不满足预设的规范填涂类型。举例来说,不同的题目对应的填涂要求也是不相同的,比如说单选题需要在同一题中填一个选项,因而若在同一题中填涂了多个空格,则视为不规范的填涂。有的多选题要求在同一题中填涂多个选项,则没有填涂任何选项,或者填涂一个则视为不规范的填涂。另外,在非填涂区进行注释、涂抹和标记也可以视为不规范的填涂。
因而可以将第二填涂类型进行分类。举例来说,可以将第二填涂类型分为三类,分别为第一子类型、第二子类型和第三子类型。一种是完全正确的填涂,可以便于机器进行识别的,可以视为第一子类型的第二填涂类型。一种是完全错误的填涂,也即完全不规范的填涂类型,比如单选题中填了多个,多选题中填了一个,或者未填涂,或者在填涂区域外进行不规范的书写,注释或者涂抹,可以视为第二子类型的第二填涂类型。第三子类型是在填涂区域中进行填涂但是不够规范,比如没有填满,颜色深度不够、填成“√”或者“×”或者“/”,或者只涂了部分区域,但还留有空白。需要说明的是,第三子类型的填涂方式在现有的技术进行识别时可能出现错误甚至漏题,也即格式不规范带来的扫描错误和扫描失误问题。本公开中,可以将对第三子类型的识别结果进行更进一步的判断,从而可以利用一些规范程度不够的书写方式来防止扫描失误。
其中,在第一训练样本集中可以考虑到第二子类型这种错误边界类型,以及第一子类型这种完全正确的填涂类型,以及第三子类型中的多个类型。也即,可以预先根据这些类型对训练图像进行打标。需要说明的是,还需要对第一训练样本集进行数据预处理,例如图像尺寸归一化、灰度化、二值化、去噪等。之后可以建立第一初始模型,其中,第一初始模型可以为如卷积神经网络(CNN),循环神经网络(RNN),长短时记忆神经网络模型,在此不做限定。其中,长短时记忆神经网络(Long Short-Term Memory,LSTM)是一种循环神经网络(Recurrent Neural Network,RNN)模型。相对于基本循环神经网络,LSTM通过添加“门”机制来控制信息的输入和输出,从而增强了网络的记忆能力,并解决了一定程度上的梯度消失问题。
使用标注好的第一训练样本集对第一初始模型进行训练。在训练过程中,需要控制过拟合现象的出现,设置透明正则项、drop out等技术来避免模型过拟合。可以通过调整超参数、迭代次数和优化器等参数来提高模型的训练效率。
可选的,还可以通过交叉验证等方法对训练得到的模型进行验证,确保其准确性和鲁棒性。以及,对模型的性能进行评估,包括准确率、精度、召回率等指标,以及混淆矩阵等可视化工具,来判断模型是否能够满足业务需求,也即使得第一初始模型可以满足预设条件。
需要说明的是,如果模型存在一些问题或不足,需要根据评估结果来进行参数调节或改进,重新训练和验证模型。重复以上步骤,直到满足设计的目标。长短时记忆神经网络模型需要在大量其他数据上积累基础的特征提取能力。在此基础上,再少量标注样本上获得迁移能力。
其中,第一神经网络模型可以为训练完成的第一初始模型,其中,第一神经网络模型对客观题填涂图像的检测结果的检测精度是足够高的。
步骤106,根据每个第三图像对应的第二填涂类型,第一填涂类型和书写特征,判断每个作答子区域的作答结果是否合格。
可选的,在书写特征为连续特征的情况下,判断各个第三图像对应的第二填涂类型是否属于预设的规范填涂类型,若在各个第二填涂类型均属于预设的规范填涂类型的情况下,确定各个所述作答结果为合格。
其中,预设的规范填涂类型可以为上述的第一子类型的第二填涂类型,若各个第三图像对应的第二填涂类型是否属于预设的规范填涂类型,则可以认为各个作答结果为合格。
可选的,若部分第三图像对应的第二填涂类型不属于预设的规范填涂类型的情况下,将不属于预设的规范填涂类型的所述第三图像确定为第六图像,之后可以判断每个第六图像的第二填涂类型是否与所述答题考生对应的第一填涂类型相同,然后将所述第二填涂类型属于预设的规范填涂类型的各个所述第三图像,以及所述第二填涂类型是否与所述答题考生对应的第一填涂类型相同的各个所述第六图像确定为目标图像,最后确定所述目标图像对应的所述作答结果为合格。
需要说明的是,若部分第三图像对应的第二填涂类型不属于预设的规范填涂类型,则说明部分第三图像对应的第二填涂类型为第二子类型或者第三子类型。
举例来说,若当前第三图像有8个,分别为y1、y2、y3、y4、y5、y6、y7、y8,其中,y2、y3、y4、y5、y6、y7、y8对应的第二填涂类型不属于预设的规范填涂类型,y1对应的第二填涂类型不属于预设的规范填涂类型,则y1对应的作答结果为合格。比如,若y2、y3、y4、y5、y6、y7、y8分别对应的第二填涂类型为K1、K2、K2、K2、K3、K4、K5,其中答题考生对应的第一填涂类型为K2,则可以将y3、y4、y5对应的作答结果为合格。
由此,可以结合考生的作答习惯,若考生的书写特征为连续特征,则可以根据考生的第一填涂类型来对当前的各个第三图像进行筛选,将与第一填涂类型相同的答题结果作为合格的答题结果,也即可以作为规范的答题结果。
需要说明的是,在书写特征为非连续特征的情况下,判断各个第三图像对应的第二填涂类型是否属于预设的规范填涂类型,将各个第二填涂类型均属于预设的规范填涂类型的各个第三图像的作答结果确定为合格。
可选的,在书写特征为非连续特征的情况下,可以从各个第二填涂类型的第三图像中,确定与第一填涂类型对应的第三图像和第三填涂类型对应的第三图像,并将其作为目标图像,确定对应的作答结果为合格。
其中,第三填涂类型的第三图像可以为不够规范,但是接近规范,也即接近第一子类型的第三图像。比如,少涂了一个角,或者颜色深浅度较接近参考深浅程度,以及填涂面积大于95%的第三图像,等等,在此不做限定。其中,第三填涂类型为预设的填涂类型。需要说明的是,由于非连续特征的各个第三图像中,能满足第一填涂类型的第三图像比较少,因而可以将满足第三填涂类型的第三图像作为目标图像。
步骤107,在作答结果为合格的情况下,判断作答结果是否正确。
需要说明的是,可以比较每个作答结果与对应题目的参考答案,判断作答结果是否正确。其中,不同作答结果对应的参考答案可能相同,也可能不同。若作答结果与参考答案相同,则说明作答结果为正确的。
本公开实施例中,首先获取对答题卡的客观题答题区域拍摄所得的第一图像,并对第一图像进行图像分割和预处理,以得到包含客观题答题区域的第二图像,之后对第二图像进行处理,以确定客观题答题区域中的每个作答子区域所对应的各个第三图像,其中,每个第三图像对应一个作答子区域,然后比较各个第三图像,并根据比较结果确定答题考生对应的书写特征,之后基于书写特征,获取答题考生对应的第一填涂类型,然后将每个第三图像分别输入至预先训练生成的第二神经网络模型,以得到每个第三图像对应的第二填涂类型,之后根据每个第三图像对应的第二填涂类型,第一填涂类型和书写特征,判断每个作答子区域的作答结果是否合格,最后在作答结果为合格的情况下,判断作答结果是否正确。由此,可以结合考生的书写特征来对作答结果是否合格进行判断,从而结合考试的填涂习惯,精确的识别考生的答题情况,可以快速适应不同的填涂结果,降低了识别的错误率,避免了由于填涂不规范造成的识别错误,可以将一部分符合考生书写习惯的填涂结果作为合格的填涂结果。降低了由于考生填涂的多样性和不规则性,填涂方式的不规范,甚至题目类型、填涂工具等因素的不同而引起的识别错误的结果,智能化计算填涂的规范程度并形成记录能协助人工快速定位需要处理的数据。
为了实现上述实施例,本公开还提出一种用于识别和校验答题卡客观题识别结果的装置。
图3为本公开实施例所提供的用于识别和校验答题卡客观题识别结果的装置的结构示意图。
如图3所示,该用于识别和校验答题卡客观题识别结果的装置300可以包括:
第一获取模块310,用于获取对答题卡的客观题答题区域拍摄所得的第一图像,并对所述第一图像进行图像分割和预处理,以得到包含所述客观题答题区域的第二图像;
处理模块320,用于对所述第二图像进行处理,以确定所述客观题答题区域中的每个作答子区域所对应的各个第三图像,其中,每个所述第三图像对应一个所述作答子区域;
比较模块330,用于比较各个所述第三图像,并根据比较结果确定答题考生对应的书写特征;
第二获取模块340,用于基于所述书写特征,获取所述答题考生对应的第一填涂类型;
第三获取模块350,用于将每个所述第三图像分别输入至预先训练生成的第二神经网络模型,以得到每个所述第三图像对应的第二填涂类型;
第一判断模块360,用于根据每个所述第三图像对应的第二填涂类型,所述第一填涂类型和所述书写特征,判断每个所述作答子区域的作答结果是否合格;
第二判断模块370,用于在所述作答结果为合格的情况下,判断所述作答结果是否正确。
可选的,所述第三获取模块,还用于:
获取第一训练样本集,其中,所述第一训练样本集中包含有多个客观题填涂图像,以及所述客观题填涂图像所对应的第二填涂类型;
基于所述第一训练样本集对第一初始模型进行训练直至所述第一初始模型对所述客观题填涂图像的检测结果达到预设条件,将训练完成的所述第一初始模型作为第二神经网络模型。
可选的,所述比较模块,具体用于:
比较各个所述第三图像,以确定相似度大于第一阈值的第四图像的数量;
在所述数量大于第二阈值的情况下,确定所述答题考生对应的书写特征为连续特征;
在所述数量小于或者等于所述第二阈值的情况下,确定所述答题考生的书写特征为非连续特征。
可选的,所述第二获取模块,具体用于:
在所述书写特征为连续特征的情况下,将各个所述第四图像输入至预先训练完成的第二神经网络模型中,以确定所述答题考生对应的第一填涂类型;
或者,
在所述书写特征为非连续特征的情况下,对各个所述第三图像进行均值融合,以得到第五图像,并确定所述第五图像对应的所述第一填涂类型。
可选的,所述第一判断模块,具体用于:
在所述书写特征为连续特征的情况下,判断各个所述第三图像对应的第二填涂类型是否属于预设的规范填涂类型;
在各个所述第二填涂类型均属于预设的规范填涂类型的情况下,确定各个所述作答结果为合格。
可选的,所述第一判断模块,具体用于:
若部分所述第三图像对应的第二填涂类型不属于预设的规范填涂类型的情况下,将不属于预设的规范填涂类型的所述第三图像确定为第六图像;
判断每个所述第六图像的所述第二填涂类型是否与所述答题考生对应的第一填涂类型相同;
将所述第二填涂类型属于预设的规范填涂类型的各个所述第三图像,以及所述第二填涂类型是否与所述答题考生对应的第一填涂类型相同的各个所述第六图像确定为目标图像;
确定所述目标图像对应的所述作答结果为合格。
本公开实施例中,首先获取对答题卡的客观题答题区域拍摄所得的第一图像,并对第一图像进行图像分割和预处理,以得到包含客观题答题区域的第二图像,之后对第二图像进行处理,以确定客观题答题区域中的每个作答子区域所对应的各个第三图像,其中,每个第三图像对应一个作答子区域,然后比较各个第三图像,并根据比较结果确定答题考生对应的书写特征,之后基于书写特征,获取答题考生对应的第一填涂类型,然后将每个第三图像分别输入至预先训练生成的第二神经网络模型,以得到每个第三图像对应的第二填涂类型,之后根据每个第三图像对应的第二填涂类型,第一填涂类型和书写特征,判断每个作答子区域的作答结果是否合格,最后在作答结果为合格的情况下,判断作答结果是否正确。由此,可以结合考生的书写特征来对作答结果是否合格进行判断,从而结合考试的填涂习惯,精确的识别考生的答题情况,可以快速适应不同的填涂结果,降低了识别的错误率,避免了由于填涂不规范造成的识别错误,可以将一部分符合考生书写习惯的填涂结果作为合格的填涂结果。降低了由于考生填涂的多样性和不规则性,填涂方式的不规范,甚至题目类型、填涂工具等因素的不同而引起的识别错误的结果,智能化计算填涂的规范程度并形成记录能协助人工快速定位需要处理的数据。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本公开的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本公开各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本公开的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本公开的限制,本领域的普通技术人员在本公开的范围内可以对上述实施例进行变化、修改、替换和变型。