CN113642550B

CN113642550B - 一种基于像素概率分布统计的熵最大化涂卡识别方法

Info

Publication number: CN113642550B
Application number: CN202110819557.8A
Authority: CN
Inventors: 田博帆
Original assignee: Nanjing Hongsong Information Technology Co ltd
Current assignee: Nanjing Hongsong Information Technology Co ltd
Priority date: 2021-07-20
Filing date: 2021-07-20
Publication date: 2024-03-12
Anticipated expiration: 2041-07-20
Also published as: CN113642550A

Abstract

本发明涉及一种基于像素概率分布统计的熵最大化涂卡识别方法，具体包括以下步骤：步骤S1答题卡对齐：将已涂答题卡与空白答题卡对齐；步骤S2试卷模板相减：将读入的空白答题卡和已涂答题卡的数字化矩阵图像保存，再对空白答题卡和已涂答题卡的数字化矩阵做减法操作，得到像素差值集合矩阵；步骤S3涂卡答案区定位；步骤S4裁剪获取答案区：根据步骤S3获得每道小题所对应的填涂答案区坐标，利用填涂答案区坐标对每道小题分别裁剪获取空白答题卡答案裁剪区域和已涂答题卡答案裁剪区域；步骤S5区域像素灰度统计；步骤S6计算空白答题卡答案裁剪区域和已涂答题卡答案裁剪区域的图像的最大化熵；步骤S7识别结果判断获得涂卡结果。

Description

一种基于像素概率分布统计的熵最大化涂卡识别方法

技术领域

本发明涉及计算机应用技术领域，尤其涉及一种基于像素概率分布统计的熵最大化涂卡识别方法。

背景技术

随着技术的不断迭代更新，在自动化批阅领域诞生了许多新的技术方法，如某些自动识别方法可以一改过去传统方法的弊端，带来更多的便捷性和最佳的用户体验感，从而得到广泛应用。

在答题卡涂卡识别方面，传统的涂卡识别方法存在着较多的局限性，通常需要必备一台特定的扫描阅卡机。由于传统涂卡识别方法是基于涂卡颜料中所含的碳含量做为填涂识别的参考标准，导致对识别场景的要求和填涂的规范都较为苛刻，同时对使用的涂卡纸张也有较高的要求。传统涂卡识别方法不仅受限于纸张的厚度、涂卡铅笔的类型等，甚至需要有固定的答题卡规范设计形式。正是这些必要的条件因素，导致其不便于通用化地使用，对考生的填涂规范也提出了更高的要求。

现有技术中关于答题卡的识别是基于规范格式的扫描系统所得到的图像数据，而对于智能手机移动终端而言，其对于答题卡的拍照存在种客观因素的影响，使得不同手机不同环境得到的图像互不相同，给正确识别答题卡内容带来严重干扰，另一方面，答题卡种类多样，格式各不相同现有的识别系统不能灵活根据答题卡的样式选择相对应的识别规则，造成应用上的限制。

发明内容

本发明要解决的技术问题是，提供一种基基于像素概率分布统计的熵最大化涂卡识别方法，能够不受限于答题卡的涂卡形式和答题卡的纸张样式，实现达到答题卡涂卡识别的目的，主要用于解决传统方法所带来的不足问题，摆脱更多的条件束缚，有着更加合理且人性化的识别转变。

为了解决上述技术问题，本发明采用的技术方案是：该基于像素概率分布统计的熵最大化涂卡识别方法，具体包括以下步骤：

步骤S1答题卡对齐：将已涂答题卡与空白答题卡对齐；

步骤S2试卷模板相减：将读入的空白答题卡和已涂答题卡的数字化矩阵图像保存，分别记作：I₀和I₁；再对空白答题卡和已涂答题卡的数字化矩阵做减法操作，得到像素差值集合矩阵I_d，记作：I_d＝I₁-I₀；

步骤S3涂卡答案区定位：首先对每道小题的题号进行识别，得到题号字符的坐标；再结合题号次序对题号次序坐标进行排序分析，获得每道小题的横纵分布并记录每个题号所对应的字符的坐标位置，再经过处理和分析后统计获得每道小题对应的填涂答案区的坐标和答案总个数并对答案总个数进行编号；

步骤S4裁剪获取答案区：根据步骤S3获得每道小题所对应的填涂答案区坐标，利用填涂答案区坐标对每道小题分别裁剪获取空白答题卡答案裁剪区域和已涂答题卡答案裁剪区域；

步骤S5区域像素灰度统计：根据步骤S2得到的像素差值集合矩阵I_d，统计不同像素灰度值的分布D(X)，再结合像素差值集合矩阵Id，获得已填涂且近似黑色像素的概率密度函数F_X(x)；

步骤S6图像最大化熵计算：根据步骤S5的概率密度函数F_X(x)和像素差值集合矩阵I_d，计算空白答题卡答案裁剪区域和已涂答题卡答案裁剪区域的图像的最大化熵；

步骤S7识别结果判断：根据步骤S1～步骤S6完成空白答题卡答案裁剪区域和已涂答题卡答案裁剪区域的图像最大化熵的计算，再计算已填涂且近似黑色像素的占比大小P，再判断获得涂卡结果。

采用上述技术方案，首先采用图像定位技术获取空白答题卡和已涂答题卡对应的答案区进行裁剪；接着，将裁剪得到的答案区域图像做像素灰度值的概率分布统计并计算出对应的最大熵；最后，根据对应答案区的关系做答案结果的进行判断，实现答题卡的涂卡识别，该识别方法能够不受限于答题卡的涂卡形式和答题卡的纸张样式，实现达到答题卡涂卡识别的目的，解决了传统方法所带来的不足问题，摆脱更多的条件束缚，有着更加合理且人性化的识别转变。

作为本发明的优选技术方案，所述步骤S1答题卡对齐的具体包括以下步骤：

步骤S11：选定两张答题卡分别为空白答题卡和已涂答题卡，且空白答题卡和已涂答题卡都存在背景色，空白答题卡背景色为非纯白色；

步骤S12：选择从空白答题卡和已涂答题卡的左上角点(0,0)开始，随机裁剪一个固定大小的图像区域，分别得到空白答题卡区域图像和已涂答题卡区域图像，再通过仿射变换算法计算出空白答题卡区域图像的和已涂答题卡区域图像坐标偏移量offset和缩放比例s；其中放射变换算法是通过引入含有平移特性的齐次变换矩阵做s倍缩放，作用于待矫正的图像将其变换至矫正后的图像矩阵以获得矫正的图像，具体变换如公式1-1所示；

通过公式的变换矩阵得知，仿射变换的变换矩阵有6个自由度，表示为：(scos(θ)，-s sin(θ)，t_x，s sin(θ)，s cos(θ)，t_y）；其中s为缩放倍数即缩放比例；θ为仿射迭代的限定角度；t为平移自由度，t_x为水平方向的平移自由度，t_y为垂直方向的平移自由度。

步骤S13：将空白答题卡区域图像的坐标偏移量offset和缩放比例s的大小作用至已涂答题卡图像上，使空白答题卡和已涂答题卡达到近似对齐的状态。

作为本发明的优选技术方案，所述步骤S3涂卡答案区定位具体步骤为：

步骤S31：采用Yolo v3目标识别网络对空白答题卡中的题号做识别和检测，它将输入图像分为13x13、26x26、52x52的网格，每个格子负责预测中心在此格子中的题号字符；每个格子预测出3个bounding box，每个bounding box预测内容包括：字符的具体坐标、置信度和所属的类别概率；最终获得每个题号字符的具体坐标，再结合题号次序对题号字符坐标进行上下左右排序分析，得出每道小题的横纵分布情形，并记录所有题号对应的字符的坐标位置；

步骤S32：采用目标检测算法和水平投影算法对空白答题卡的图像字符作进一步的处理和分析，用于识别和定位答案的坐标位置；其中水平投影算法目的是对目标识别遗漏的答案做补充，若目标识别丢失了字符B，水平投影根据每个字符在水平方向投影的间隔相等原则，依次排序并分析确认丢失的答案为字符B；

步骤S33：根据记录的题号字符的坐标，统计每道小题对应的填涂答案区的答案的总个数，并依次对答案总个数进行编号；其中对答案总个数依次编号为：1，2，3，4，...；对应的结果分别为：A，B，C，D，...。

作为本发明的优选技术方案，所述步骤S32中的目标检测算法采用faster rcnn算法或SSD算法。

作为本发明的优选技术方案，所述步骤S5具体步骤为：

步骤S51：根据步骤S2得到的像素差值集合矩阵I_d，统计不同像素灰度值的分布，记作：D(X)；其中，X为像素灰度值的连续随机变量；

步骤S52：根据像素灰度值的分布统计，设定自定义的像素灰度值区域的范围R_i，记作：R_i＝[v₁，v₂](v₁＜v₂；v₁∈[0，255)，v₂∈(0，255])；

其中，v₁和v₂均为像素灰度值大小；

步骤S53：再根据像素差值集合矩阵I_d和像素灰度值分布D(X)，得到已填涂且近似黑色像素的概率密度函数F_X(x)，记作：

作为本发明的优选技术方案，所述步骤S6中的计算公式为(1-2)所示；

其中，x_i为像素差值集合矩阵I_d中的随机像素值，n为不大于零的像素值个数。

作为本发明的优选技术方案，所述步骤S7中的占比大小的计算公式为(1-3)所示：

其中I_d是像素差值集合矩阵。

作为本发明的优选技术方案，所述步骤S7中判断获得涂卡结果的方法具体为：结合已涂答题卡的规范性要求，自定义符合占比的最大值和最大化熵的设置经验值分别为：70％和70；若不满足此条件，则表示该区域未被填涂，否则为已填涂。

与现有技术相比，本发明具有的有益效果是：首先采用图像定位技术获取空白答题卡和已涂答题卡对应的答案区进行裁剪；接着，将裁剪得到的答案区域图像做像素灰度值的概率分布统计并计算出对应的最大熵；最后，根据对应答案区的关系做答案结果的进行判断，实现答题卡的涂卡识别，该识别方法能够不受限于答题卡的涂卡形式和答题卡的纸张样式，实现达到答题卡涂卡识别的目的，解决了传统方法所带来的不足问题，摆脱更多的条件束缚，有着更加合理且人性化的识别转变。

附图说明

下面结合附图进一步描述本发明的技术方案：

图1是本发明的基于像素概率分布统计的熵最大化涂卡识别方法的流程图；

图2是采用本发明的基于像素概率分布统计的熵最大化涂卡识别方法进行识别的效果图。

具体实施方式

为了加深对本发明的理解，下面将结合附图和实施例对本发明做进一步详细描述，该实施例仅用于解释本发明，并不对本发明的保护范围构成限定。

实施例：如图1所示，该基于像素概率分布统计的熵最大化涂卡识别方法，具体包括以下步骤：

步骤S1答题卡对齐：将已涂答题卡与空白答题卡对齐；

所述步骤S1答题卡对齐的具体包括以下步骤：

步骤S12：选择从空白答题卡和已涂答题卡的左上角点(0,0)开始，随机裁剪一个固定大小的图像区域，分别得到空白答题卡区域图像和已涂答题卡区域图像，再通过仿射变换算法计算出空白答题卡区域图像的和已涂答题卡区域图像坐标偏移量offset和缩放比例s；放射变换算法是通过引入含有平移特性的齐次变换矩阵做s倍缩放，作用于待矫正的图像将其变换至矫正后的图像矩阵以获得矫正的图像，具体变换如公式1-1所示：

通过公式的变换矩阵得知，仿射变换的变换矩阵有6个自由度，表示为：(s cos(θ)，-s sin(θ)，t_x，s sin(θ)，s cos(θ)，t_y)；其中s为缩放倍数即缩放比例；θ为仿射迭代的限定角度；t为平移自由度，t_x为水平方向的平移自由度，t_y为垂直方向的平移自由度；

步骤S13：将空白答题卡区域图像的坐标偏移量offset和缩放比例s的大小作用至已涂答题卡图像上，使空白答题卡和已涂答题卡达到近似对齐的状态；

所述步骤S3涂卡答案区定位具体步骤为：

步骤S32：采用目标检测算法和水平投影算法对空白答题卡的图像字符作进一步的处理和分析，用于识别和定位答案的坐标位置；其中水平投影算法目的是对目标识别遗漏的答案做补充，若目标识别丢失了字符B，水平投影根据每个字符在水平方向投影的间隔相等原则，依次排序并分析确认丢失的答案为字符B；其中目标检测算法采用faster rcnn算法或SSD算法；

S33：根据记录的题号字符的坐标，统计每道小题对应的填涂答案区的答案的总个数，并依次对答案总个数进行编号；其中对答案总个数依次编号为：1，2，3，4，...；对应的结果分别为：A，B，C，D，...；

步骤S5区域像素灰度统计：根据步骤S2得到的像素差值集合矩阵I_d，统计不同像素灰度值的分布D(X)，再结合像素差值集合矩阵I_d，获得已填涂且近似黑色像素的概率密度函数F_X(x)；

所述步骤S5的具体步骤为：

其中，v₁和v₂均为像素灰度值大小；

步骤S53：根据像素差值集合矩阵I_d和像素灰度值分布D(X)，得到已填涂且近似黑色像素的概率密度函数F_X(x)，记作：

所述步骤S6中的计算公式为(1-2)所示；

其中，x_i为像素差值集合矩阵I_d中的随机像素值，n为不大于零的像素值个数；

步骤S7识别结果判断：根据步骤S1～步骤S6完成空白答题卡答案裁剪区域和已涂答题卡答案裁剪区域的图像最大化熵的计算，再计算已填涂且近似黑色像素的占比大小P，再结合已涂答题卡的规范性要求，自定义符合占比的最大值和最大化熵的设置经验值分别为：70％和70；若不满足此条件，则表示该区域未被填涂，否则为已填涂，从而获得涂卡结果，如图2所示。

所述步骤S7中的占比大小的计算公式为(1-3)所示：

其中I_d是像素差值集合矩阵。

对于本领域的普通技术人员而言，具体实施例只是对本发明进行了示例性描述，显然本发明具体实现并不受上述方式的限制，只要采用了本发明的方法构思和技术方案进行的各种非实质性的改进，或未经改进将本发明的构思和技术方案直接应用于其它场合的，均在本发明的保护范围之内。

Claims

1.一种基于像素概率分布统计的熵最大化涂卡识别方法，其特征在于，具体包括以下步骤：

步骤S1答题卡对齐：将己涂答题卡与空白答题卡对齐；

步骤S2试卷模板相减：将读入的空白答题卡和己涂答题卡的数字化矩阵图像保存，分别记作：I₀和I₁；再对空白答题卡和己涂答题卡的数字化矩阵做减法操作，得到像素差值集合矩阵I_d；

步骤S4裁剪获取答案区：根据步骤S3获得每道小题所对应的填涂答案区坐标，利用填涂答案区坐标对每道小题分别裁剪获取空白答题卡答案裁剪区域和己涂答题卡答案裁剪区域；

步骤S5区域像素灰度统计：根据步骤S2得到的像素差值集合矩阵I_d，统计不同像素灰度值的分布D(X)，再结合像素差值集合矩阵I_d，获得己填涂且近似黑色像素的概率密度函数F_X(x)；

步骤S6图像最大化熵计算：根据步骤S5的概率密度函数F_X(x)和像素差值集合矩阵I_d，计算空白答题卡答案裁剪区域和己涂答题卡答案裁剪区域的图像的最大化熵；

步骤S7识别结果判断：根据步骤S1～步骤S6完成空白答题卡答案裁剪区域和己涂答题卡答案裁剪区域的图像最大化熵的计算，再计算己填涂且近似黑色像素的占比大小P，再判断获得涂卡结果；

所述步骤S5具体步骤为：

步骤S51：根据步骤S2得到的像素差值集合矩阵I_d，统计不同像素灰度值的分布D(X)；其中，X为像素灰度值的连续随机变量；

其中，v₁和v₂均为像素灰度值大小；

步骤S53：再根据像素差值集合矩阵I_d和像素灰度值分布D(X)，得到己填涂且近似黑色像素的概率密度函数F_X(x)，记作：

所述步骤S6中的计算公式为(1-2)所示；

2.根据权利要求1所述的基于像素概率分布统计的熵最大化涂卡识别方法，其特征在于，所述步骤S1答题卡对齐具体包括以下步骤：

步骤S11：选定两张答题卡分别为空白答题卡和己涂答题卡，且空白答题卡和己涂答题卡都存在背景色，空白答题卡背景色为非纯白色；

步骤S12：选择从空白答题卡和己涂答题卡的左上角点(0,0)开始，随机裁剪一个固定大小的图像区域，分别得到空白答题卡区域图像和己涂答题卡区域图像，再通过仿射变换算法计算出空白答题卡区域图像的和己涂答题卡区域图像坐标偏移量offset和缩放比例s；放射变换算法是通过引入含有平移特性的齐次变换矩阵做s倍缩放，作用于待矫正的图像将其变换至矫正后的图像矩阵以获得矫正的图像，具体变换如公式1-1所示：

通过公式的变换矩阵得知，仿射变换的变换矩阵有6个自由度，表示为：(s cos(θ)，ssin(θ)，t_x，s sin(θ)，s cos(θ)，t_y)；其中s为缩放倍数即缩放比例；θ为仿射迭代的限定角度；t为平移自由度，t_x为水平方向的平移自由度，t_y为垂直方向的平移自由度；

3.根据权利要求2所述的基于像素概率分布统计的熵最大化涂卡识别方法，其特征在于，所述步骤S3涂卡答案区定位具体步骤为：

步骤S31：采用Yolo v3目标识别网络对空白答题卡中的题号做识别检测，获得每个题号字符的具体坐标，再结合题号次序对题号字符坐标进行上下左右排序分析，得出每道小题的横纵分布情形，并记录所有题号对应的字符的坐标位置；

步骤S32：采用目标检测算法和水平投影算法对空白答题卡的图像字符作进一步的处理和分析，用于识别和定位答案的坐标位置；

步骤S33：根据记录的题号字符的坐标，统计每道小题对应的填涂答案区的答案的总个数，并依次对答案总个数进行编号。

4.根据权利要求3所述的基于像素概率分布统计的熵最大化涂卡识别方法，其特征在于，所述步骤S32中的目标检测算法采用faster rcnn算法或SSD算法。

5.根据权利要求1所述的基于像素概率分布统计的熵最大化涂卡识别方法，其特征在于，所述步骤S7中的占比大小的计算公式为(1-3)所示：

其中I_d是像素差值集合矩阵。

6.根据权利要求5所述的基于像素概率分布统计的熵最大化涂卡识别方法，其特征在于，所述步骤S7中判断获得涂卡结果的方法具体为：结合已涂答题卡的规范性要求，自定义符合占比的最大值和最大化熵的设置经验值分别为：70％和70；若不满足此条件，则表示该区域未被填涂，否则为已填涂。