CN113642550B - 一种基于像素概率分布统计的熵最大化涂卡识别方法 - Google Patents
一种基于像素概率分布统计的熵最大化涂卡识别方法 Download PDFInfo
- Publication number
- CN113642550B CN113642550B CN202110819557.8A CN202110819557A CN113642550B CN 113642550 B CN113642550 B CN 113642550B CN 202110819557 A CN202110819557 A CN 202110819557A CN 113642550 B CN113642550 B CN 113642550B
- Authority
- CN
- China
- Prior art keywords
- answer
- answer sheet
- area
- blank
- coated
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 46
- 239000011248 coating agent Substances 0.000 title claims abstract description 32
- 238000000576 coating method Methods 0.000 title claims abstract description 32
- 239000011159 matrix material Substances 0.000 claims abstract description 45
- 238000012360 testing method Methods 0.000 claims abstract description 5
- 238000004422 calculation algorithm Methods 0.000 claims description 23
- 230000009466 transformation Effects 0.000 claims description 21
- 238000004364 calculation method Methods 0.000 claims description 12
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 claims description 9
- 238000004458 analytical method Methods 0.000 claims description 9
- 238000001514 detection method Methods 0.000 claims description 7
- 238000012545 processing Methods 0.000 claims description 6
- 239000003086 colorant Substances 0.000 claims description 3
- 238000010606 normalization Methods 0.000 claims description 3
- 230000005855 radiation Effects 0.000 claims description 3
- 238000013519 translation Methods 0.000 claims description 3
- 238000010422 painting Methods 0.000 claims 1
- 230000007547 defect Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 230000007704 transition Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 239000013589 supplement Substances 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 238000004883 computer application Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000049 pigment Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G06T3/02—
Abstract
本发明涉及一种基于像素概率分布统计的熵最大化涂卡识别方法,具体包括以下步骤:步骤S1答题卡对齐:将已涂答题卡与空白答题卡对齐;步骤S2试卷模板相减:将读入的空白答题卡和已涂答题卡的数字化矩阵图像保存,再对空白答题卡和已涂答题卡的数字化矩阵做减法操作,得到像素差值集合矩阵;步骤S3涂卡答案区定位;步骤S4裁剪获取答案区:根据步骤S3获得每道小题所对应的填涂答案区坐标,利用填涂答案区坐标对每道小题分别裁剪获取空白答题卡答案裁剪区域和已涂答题卡答案裁剪区域;步骤S5区域像素灰度统计;步骤S6计算空白答题卡答案裁剪区域和已涂答题卡答案裁剪区域的图像的最大化熵;步骤S7识别结果判断获得涂卡结果。
Description
技术领域
本发明涉及计算机应用技术领域,尤其涉及一种基于像素概率分布统计的熵最大化涂卡识别方法。
背景技术
随着技术的不断迭代更新,在自动化批阅领域诞生了许多新的技术方法,如某些自动识别方法可以一改过去传统方法的弊端,带来更多的便捷性和最佳的用户体验感,从而得到广泛应用。
在答题卡涂卡识别方面,传统的涂卡识别方法存在着较多的局限性,通常需要必备一台特定的扫描阅卡机。由于传统涂卡识别方法是基于涂卡颜料中所含的碳含量做为填涂识别的参考标准,导致对识别场景的要求和填涂的规范都较为苛刻,同时对使用的涂卡纸张也有较高的要求。传统涂卡识别方法不仅受限于纸张的厚度、涂卡铅笔的类型等,甚至需要有固定的答题卡规范设计形式。正是这些必要的条件因素,导致其不便于通用化地使用,对考生的填涂规范也提出了更高的要求。
现有技术中关于答题卡的识别是基于规范格式的扫描系统所得到的图像数据,而对于智能手机移动终端而言,其对于答题卡的拍照存在种客观因素的影响,使得不同手机不同环境得到的图像互不相同,给正确识别答题卡内容带来严重干扰,另一方面,答题卡种类多样,格式各不相同现有的识别系统不能灵活根据答题卡的样式选择相对应的识别规则,造成应用上的限制。
发明内容
本发明要解决的技术问题是,提供一种基基于像素概率分布统计的熵最大化涂卡识别方法,能够不受限于答题卡的涂卡形式和答题卡的纸张样式,实现达到答题卡涂卡识别的目的,主要用于解决传统方法所带来的不足问题,摆脱更多的条件束缚,有着更加合理且人性化的识别转变。
为了解决上述技术问题,本发明采用的技术方案是:该基于像素概率分布统计的熵最大化涂卡识别方法,具体包括以下步骤:
步骤S1答题卡对齐:将已涂答题卡与空白答题卡对齐;
步骤S2试卷模板相减:将读入的空白答题卡和已涂答题卡的数字化矩阵图像保存,分别记作:I0和I1;再对空白答题卡和已涂答题卡的数字化矩阵做减法操作,得到像素差值集合矩阵Id,记作:Id=I1-I0;
步骤S3涂卡答案区定位:首先对每道小题的题号进行识别,得到题号字符的坐标;再结合题号次序对题号次序坐标进行排序分析,获得每道小题的横纵分布并记录每个题号所对应的字符的坐标位置,再经过处理和分析后统计获得每道小题对应的填涂答案区的坐标和答案总个数并对答案总个数进行编号;
步骤S4裁剪获取答案区:根据步骤S3获得每道小题所对应的填涂答案区坐标,利用填涂答案区坐标对每道小题分别裁剪获取空白答题卡答案裁剪区域和已涂答题卡答案裁剪区域;
步骤S5区域像素灰度统计:根据步骤S2得到的像素差值集合矩阵Id,统计不同像素灰度值的分布D(X),再结合像素差值集合矩阵Id,获得已填涂且近似黑色像素的概率密度函数FX(x);
步骤S6图像最大化熵计算:根据步骤S5的概率密度函数FX(x)和像素差值集合矩阵Id,计算空白答题卡答案裁剪区域和已涂答题卡答案裁剪区域的图像的最大化熵;
步骤S7识别结果判断:根据步骤S1~步骤S6完成空白答题卡答案裁剪区域和已涂答题卡答案裁剪区域的图像最大化熵的计算,再计算已填涂且近似黑色像素的占比大小P,再判断获得涂卡结果。
采用上述技术方案,首先采用图像定位技术获取空白答题卡和已涂答题卡对应的答案区进行裁剪;接着,将裁剪得到的答案区域图像做像素灰度值的概率分布统计并计算出对应的最大熵;最后,根据对应答案区的关系做答案结果的进行判断,实现答题卡的涂卡识别,该识别方法能够不受限于答题卡的涂卡形式和答题卡的纸张样式,实现达到答题卡涂卡识别的目的,解决了传统方法所带来的不足问题,摆脱更多的条件束缚,有着更加合理且人性化的识别转变。
作为本发明的优选技术方案,所述步骤S1答题卡对齐的具体包括以下步骤:
步骤S11:选定两张答题卡分别为空白答题卡和已涂答题卡,且空白答题卡和已涂答题卡都存在背景色,空白答题卡背景色为非纯白色;
步骤S12:选择从空白答题卡和已涂答题卡的左上角点(0,0)开始,随机裁剪一个固定大小的图像区域,分别得到空白答题卡区域图像和已涂答题卡区域图像,再通过仿射变换算法计算出空白答题卡区域图像的和已涂答题卡区域图像坐标偏移量offset和缩放比例s;其中放射变换算法是通过引入含有平移特性的齐次变换矩阵做s倍缩放,作用于待矫正的图像将其变换至矫正后的图像矩阵以获得矫正的图像,具体变换如公式1-1所示;
通过公式的变换矩阵得知,仿射变换的变换矩阵有6个自由度,表示为:(scos(θ),-s sin(θ),tx,s sin(θ),s cos(θ),ty);其中s为缩放倍数即缩放比例;θ为仿射迭代的限定角度;t为平移自由度,tx为水平方向的平移自由度,ty为垂直方向的平移自由度。
步骤S13:将空白答题卡区域图像的坐标偏移量offset和缩放比例s的大小作用至已涂答题卡图像上,使空白答题卡和已涂答题卡达到近似对齐的状态。
作为本发明的优选技术方案,所述步骤S3涂卡答案区定位具体步骤为:
步骤S31:采用Yolo v3目标识别网络对空白答题卡中的题号做识别和检测,它将输入图像分为13x13、26x26、52x52的网格,每个格子负责预测中心在此格子中的题号字符;每个格子预测出3个bounding box,每个bounding box预测内容包括:字符的具体坐标、置信度和所属的类别概率;最终获得每个题号字符的具体坐标,再结合题号次序对题号字符坐标进行上下左右排序分析,得出每道小题的横纵分布情形,并记录所有题号对应的字符的坐标位置;
步骤S32:采用目标检测算法和水平投影算法对空白答题卡的图像字符作进一步的处理和分析,用于识别和定位答案的坐标位置;其中水平投影算法目的是对目标识别遗漏的答案做补充,若目标识别丢失了字符B,水平投影根据每个字符在水平方向投影的间隔相等原则,依次排序并分析确认丢失的答案为字符B;
步骤S33:根据记录的题号字符的坐标,统计每道小题对应的填涂答案区的答案的总个数,并依次对答案总个数进行编号;其中对答案总个数依次编号为:1,2,3,4,...;对应的结果分别为:A,B,C,D,...。
作为本发明的优选技术方案,所述步骤S32中的目标检测算法采用faster rcnn算法或SSD算法。
作为本发明的优选技术方案,所述步骤S5具体步骤为:
步骤S51:根据步骤S2得到的像素差值集合矩阵Id,统计不同像素灰度值的分布,记作:D(X);其中,X为像素灰度值的连续随机变量;
步骤S52:根据像素灰度值的分布统计,设定自定义的像素灰度值区域的范围Ri,记作:Ri=[v1,v2](v1<v2;v1∈[0,255),v2∈(0,255]);
其中,v1和v2均为像素灰度值大小;
步骤S53:再根据像素差值集合矩阵Id和像素灰度值分布D(X),得到已填涂且近似黑色像素的概率密度函数FX(x),记作:
作为本发明的优选技术方案,所述步骤S6中的计算公式为(1-2)所示;
其中,xi为像素差值集合矩阵Id中的随机像素值,n为不大于零的像素值个数。
作为本发明的优选技术方案,所述步骤S7中的占比大小的计算公式为(1-3)所示:
其中Id是像素差值集合矩阵。
作为本发明的优选技术方案,所述步骤S7中判断获得涂卡结果的方法具体为:结合已涂答题卡的规范性要求,自定义符合占比的最大值和最大化熵的设置经验值分别为:70%和70;若不满足此条件,则表示该区域未被填涂,否则为已填涂。
与现有技术相比,本发明具有的有益效果是:首先采用图像定位技术获取空白答题卡和已涂答题卡对应的答案区进行裁剪;接着,将裁剪得到的答案区域图像做像素灰度值的概率分布统计并计算出对应的最大熵;最后,根据对应答案区的关系做答案结果的进行判断,实现答题卡的涂卡识别,该识别方法能够不受限于答题卡的涂卡形式和答题卡的纸张样式,实现达到答题卡涂卡识别的目的,解决了传统方法所带来的不足问题,摆脱更多的条件束缚,有着更加合理且人性化的识别转变。
附图说明
下面结合附图进一步描述本发明的技术方案:
图1是本发明的基于像素概率分布统计的熵最大化涂卡识别方法的流程图;
图2是采用本发明的基于像素概率分布统计的熵最大化涂卡识别方法进行识别的效果图。
具体实施方式
为了加深对本发明的理解,下面将结合附图和实施例对本发明做进一步详细描述,该实施例仅用于解释本发明,并不对本发明的保护范围构成限定。
实施例:如图1所示,该基于像素概率分布统计的熵最大化涂卡识别方法,具体包括以下步骤:
步骤S1答题卡对齐:将已涂答题卡与空白答题卡对齐;
所述步骤S1答题卡对齐的具体包括以下步骤:
步骤S11:选定两张答题卡分别为空白答题卡和已涂答题卡,且空白答题卡和已涂答题卡都存在背景色,空白答题卡背景色为非纯白色;
步骤S12:选择从空白答题卡和已涂答题卡的左上角点(0,0)开始,随机裁剪一个固定大小的图像区域,分别得到空白答题卡区域图像和已涂答题卡区域图像,再通过仿射变换算法计算出空白答题卡区域图像的和已涂答题卡区域图像坐标偏移量offset和缩放比例s;放射变换算法是通过引入含有平移特性的齐次变换矩阵做s倍缩放,作用于待矫正的图像将其变换至矫正后的图像矩阵以获得矫正的图像,具体变换如公式1-1所示:
通过公式的变换矩阵得知,仿射变换的变换矩阵有6个自由度,表示为:(s cos(θ),-s sin(θ),tx,s sin(θ),s cos(θ),ty);其中s为缩放倍数即缩放比例;θ为仿射迭代的限定角度;t为平移自由度,tx为水平方向的平移自由度,ty为垂直方向的平移自由度;
步骤S13:将空白答题卡区域图像的坐标偏移量offset和缩放比例s的大小作用至已涂答题卡图像上,使空白答题卡和已涂答题卡达到近似对齐的状态;
步骤S2试卷模板相减:将读入的空白答题卡和已涂答题卡的数字化矩阵图像保存,分别记作:I0和I1;再对空白答题卡和已涂答题卡的数字化矩阵做减法操作,得到像素差值集合矩阵Id,记作:Id=I1-I0;
步骤S3涂卡答案区定位:首先对每道小题的题号进行识别,得到题号字符的坐标;再结合题号次序对题号次序坐标进行排序分析,获得每道小题的横纵分布并记录每个题号所对应的字符的坐标位置,再经过处理和分析后统计获得每道小题对应的填涂答案区的坐标和答案总个数并对答案总个数进行编号;
所述步骤S3涂卡答案区定位具体步骤为:
步骤S31:采用Yolo v3目标识别网络对空白答题卡中的题号做识别和检测,它将输入图像分为13x13、26x26、52x52的网格,每个格子负责预测中心在此格子中的题号字符;每个格子预测出3个bounding box,每个bounding box预测内容包括:字符的具体坐标、置信度和所属的类别概率;最终获得每个题号字符的具体坐标,再结合题号次序对题号字符坐标进行上下左右排序分析,得出每道小题的横纵分布情形,并记录所有题号对应的字符的坐标位置;
步骤S32:采用目标检测算法和水平投影算法对空白答题卡的图像字符作进一步的处理和分析,用于识别和定位答案的坐标位置;其中水平投影算法目的是对目标识别遗漏的答案做补充,若目标识别丢失了字符B,水平投影根据每个字符在水平方向投影的间隔相等原则,依次排序并分析确认丢失的答案为字符B;其中目标检测算法采用faster rcnn算法或SSD算法;
S33:根据记录的题号字符的坐标,统计每道小题对应的填涂答案区的答案的总个数,并依次对答案总个数进行编号;其中对答案总个数依次编号为:1,2,3,4,...;对应的结果分别为:A,B,C,D,...;
步骤S4裁剪获取答案区:根据步骤S3获得每道小题所对应的填涂答案区坐标,利用填涂答案区坐标对每道小题分别裁剪获取空白答题卡答案裁剪区域和已涂答题卡答案裁剪区域;
步骤S5区域像素灰度统计:根据步骤S2得到的像素差值集合矩阵Id,统计不同像素灰度值的分布D(X),再结合像素差值集合矩阵Id,获得已填涂且近似黑色像素的概率密度函数FX(x);
所述步骤S5的具体步骤为:
步骤S51:根据步骤S2得到的像素差值集合矩阵Id,统计不同像素灰度值的分布,记作:D(X);其中,X为像素灰度值的连续随机变量;
步骤S52:根据像素灰度值的分布统计,设定自定义的像素灰度值区域的范围Ri,记作:Ri=[v1,v2](v1<v2;v1∈[0,255),v2∈(0,255]);
其中,v1和v2均为像素灰度值大小;
步骤S53:根据像素差值集合矩阵Id和像素灰度值分布D(X),得到已填涂且近似黑色像素的概率密度函数FX(x),记作:
步骤S6图像最大化熵计算:根据步骤S5的概率密度函数FX(x)和像素差值集合矩阵Id,计算空白答题卡答案裁剪区域和已涂答题卡答案裁剪区域的图像的最大化熵;
所述步骤S6中的计算公式为(1-2)所示;
其中,xi为像素差值集合矩阵Id中的随机像素值,n为不大于零的像素值个数;
步骤S7识别结果判断:根据步骤S1~步骤S6完成空白答题卡答案裁剪区域和已涂答题卡答案裁剪区域的图像最大化熵的计算,再计算已填涂且近似黑色像素的占比大小P,再结合已涂答题卡的规范性要求,自定义符合占比的最大值和最大化熵的设置经验值分别为:70%和70;若不满足此条件,则表示该区域未被填涂,否则为已填涂,从而获得涂卡结果,如图2所示。
所述步骤S7中的占比大小的计算公式为(1-3)所示:
其中Id是像素差值集合矩阵。
对于本领域的普通技术人员而言,具体实施例只是对本发明进行了示例性描述,显然本发明具体实现并不受上述方式的限制,只要采用了本发明的方法构思和技术方案进行的各种非实质性的改进,或未经改进将本发明的构思和技术方案直接应用于其它场合的,均在本发明的保护范围之内。
Claims (6)
1.一种基于像素概率分布统计的熵最大化涂卡识别方法,其特征在于,具体包括以下步骤:
步骤S1答题卡对齐:将己涂答题卡与空白答题卡对齐;
步骤S2试卷模板相减:将读入的空白答题卡和己涂答题卡的数字化矩阵图像保存,分别记作:I0和I1;再对空白答题卡和己涂答题卡的数字化矩阵做减法操作,得到像素差值集合矩阵Id;
步骤S3涂卡答案区定位:首先对每道小题的题号进行识别,得到题号字符的坐标;再结合题号次序对题号次序坐标进行排序分析,获得每道小题的横纵分布并记录每个题号所对应的字符的坐标位置,再经过处理和分析后统计获得每道小题对应的填涂答案区的坐标和答案总个数并对答案总个数进行编号;
步骤S4裁剪获取答案区:根据步骤S3获得每道小题所对应的填涂答案区坐标,利用填涂答案区坐标对每道小题分别裁剪获取空白答题卡答案裁剪区域和己涂答题卡答案裁剪区域;
步骤S5区域像素灰度统计:根据步骤S2得到的像素差值集合矩阵Id,统计不同像素灰度值的分布D(X),再结合像素差值集合矩阵Id,获得己填涂且近似黑色像素的概率密度函数FX(x);
步骤S6图像最大化熵计算:根据步骤S5的概率密度函数FX(x)和像素差值集合矩阵Id,计算空白答题卡答案裁剪区域和己涂答题卡答案裁剪区域的图像的最大化熵;
步骤S7识别结果判断:根据步骤S1~步骤S6完成空白答题卡答案裁剪区域和己涂答题卡答案裁剪区域的图像最大化熵的计算,再计算己填涂且近似黑色像素的占比大小P,再判断获得涂卡结果;
所述步骤S5具体步骤为:
步骤S51:根据步骤S2得到的像素差值集合矩阵Id,统计不同像素灰度值的分布D(X);其中,X为像素灰度值的连续随机变量;
步骤S52:根据像素灰度值的分布统计,设定自定义的像素灰度值区域的范围Ri,记作:Ri=[v1,v2](v1<v2;v1∈[0,255),v2∈(0,255]);
其中,v1和v2均为像素灰度值大小;
步骤S53:再根据像素差值集合矩阵Id和像素灰度值分布D(X),得到己填涂且近似黑色像素的概率密度函数FX(x),记作:
所述步骤S6中的计算公式为(1-2)所示;
其中,xi为像素差值集合矩阵Id中的随机像素值,n为不大于零的像素值个数。
2.根据权利要求1所述的基于像素概率分布统计的熵最大化涂卡识别方法,其特征在于,所述步骤S1答题卡对齐具体包括以下步骤:
步骤S11:选定两张答题卡分别为空白答题卡和己涂答题卡,且空白答题卡和己涂答题卡都存在背景色,空白答题卡背景色为非纯白色;
步骤S12:选择从空白答题卡和己涂答题卡的左上角点(0,0)开始,随机裁剪一个固定大小的图像区域,分别得到空白答题卡区域图像和己涂答题卡区域图像,再通过仿射变换算法计算出空白答题卡区域图像的和己涂答题卡区域图像坐标偏移量offset和缩放比例s;放射变换算法是通过引入含有平移特性的齐次变换矩阵做s倍缩放,作用于待矫正的图像将其变换至矫正后的图像矩阵以获得矫正的图像,具体变换如公式1-1所示:
通过公式的变换矩阵得知,仿射变换的变换矩阵有6个自由度,表示为:(s cos(θ),ssin(θ),tx,s sin(θ),s cos(θ),ty);其中s为缩放倍数即缩放比例;θ为仿射迭代的限定角度;t为平移自由度,tx为水平方向的平移自由度,ty为垂直方向的平移自由度;
步骤S13:将空白答题卡区域图像的坐标偏移量offset和缩放比例s的大小作用至已涂答题卡图像上,使空白答题卡和已涂答题卡达到近似对齐的状态。
3.根据权利要求2所述的基于像素概率分布统计的熵最大化涂卡识别方法,其特征在于,所述步骤S3涂卡答案区定位具体步骤为:
步骤S31:采用Yolo v3目标识别网络对空白答题卡中的题号做识别检测,获得每个题号字符的具体坐标,再结合题号次序对题号字符坐标进行上下左右排序分析,得出每道小题的横纵分布情形,并记录所有题号对应的字符的坐标位置;
步骤S32:采用目标检测算法和水平投影算法对空白答题卡的图像字符作进一步的处理和分析,用于识别和定位答案的坐标位置;
步骤S33:根据记录的题号字符的坐标,统计每道小题对应的填涂答案区的答案的总个数,并依次对答案总个数进行编号。
4.根据权利要求3所述的基于像素概率分布统计的熵最大化涂卡识别方法,其特征在于,所述步骤S32中的目标检测算法采用faster rcnn算法或SSD算法。
5.根据权利要求1所述的基于像素概率分布统计的熵最大化涂卡识别方法,其特征在于,所述步骤S7中的占比大小的计算公式为(1-3)所示:
其中Id是像素差值集合矩阵。
6.根据权利要求5所述的基于像素概率分布统计的熵最大化涂卡识别方法,其特征在于,所述步骤S7中判断获得涂卡结果的方法具体为:结合已涂答题卡的规范性要求,自定义符合占比的最大值和最大化熵的设置经验值分别为:70%和70;若不满足此条件,则表示该区域未被填涂,否则为已填涂。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110819557.8A CN113642550B (zh) | 2021-07-20 | 2021-07-20 | 一种基于像素概率分布统计的熵最大化涂卡识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110819557.8A CN113642550B (zh) | 2021-07-20 | 2021-07-20 | 一种基于像素概率分布统计的熵最大化涂卡识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113642550A CN113642550A (zh) | 2021-11-12 |
CN113642550B true CN113642550B (zh) | 2024-03-12 |
Family
ID=78417781
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110819557.8A Active CN113642550B (zh) | 2021-07-20 | 2021-07-20 | 一种基于像素概率分布统计的熵最大化涂卡识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113642550B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115131296B (zh) * | 2022-06-08 | 2024-02-27 | 广州东朝智能科技有限公司 | 一种用于图像识别的分布式计算方法及系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105844275A (zh) * | 2016-03-25 | 2016-08-10 | 北京云江科技有限公司 | 文本图像中文本行的定位方法 |
CN109711284A (zh) * | 2018-12-11 | 2019-05-03 | 江苏博墨教育科技有限公司 | 一种考试答题卡系统智能识别分析方法 |
CN111553423A (zh) * | 2020-04-29 | 2020-08-18 | 河北地质大学 | 基于深度卷积神经网络图像处理技术的手写体识别方法 |
CN111696020A (zh) * | 2020-06-08 | 2020-09-22 | 重庆渝抗医药科技有限公司 | 一种基于区块链药品封装图像合成加密信息的工作方法 |
-
2021
- 2021-07-20 CN CN202110819557.8A patent/CN113642550B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105844275A (zh) * | 2016-03-25 | 2016-08-10 | 北京云江科技有限公司 | 文本图像中文本行的定位方法 |
CN109711284A (zh) * | 2018-12-11 | 2019-05-03 | 江苏博墨教育科技有限公司 | 一种考试答题卡系统智能识别分析方法 |
CN111553423A (zh) * | 2020-04-29 | 2020-08-18 | 河北地质大学 | 基于深度卷积神经网络图像处理技术的手写体识别方法 |
CN111696020A (zh) * | 2020-06-08 | 2020-09-22 | 重庆渝抗医药科技有限公司 | 一种基于区块链药品封装图像合成加密信息的工作方法 |
Also Published As
Publication number | Publication date |
---|---|
CN113642550A (zh) | 2021-11-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106096610B (zh) | 一种基于支持向量机的文档图像二值化方法 | |
CN111476109A (zh) | 票据处理方法、票据处理装置和计算机可读存储介质 | |
US20110085732A1 (en) | Qr code processing method and apparatus thereof | |
CN104568986A (zh) | 基于surf算法的遥控器面板印刷缺陷自动检测方法 | |
CN110400278B (zh) | 一种图像颜色和几何畸变的全自动校正方法、装置及设备 | |
CN109784342A (zh) | 一种基于深度学习模型的ocr识别方法及终端 | |
CN109460762A (zh) | 一种基于图像识别的答题卡评分方法 | |
CN111284154A (zh) | 一种基于图像识别的印控机盖章控制方法、装置及系统 | |
CN102360419A (zh) | 计算机扫描阅读管理方法及系统 | |
CN109784341A (zh) | 一种基于lstm神经网络的医疗单据识别方法 | |
CN108334955A (zh) | 基于Faster-RCNN的身份证复印件检测方法 | |
CN113642550B (zh) | 一种基于像素概率分布统计的熵最大化涂卡识别方法 | |
CN106790898B (zh) | 一种基于显著性分析的手机屏幕坏点自动检测方法和系统 | |
CN116704516A (zh) | 一种用于水溶肥料包装的视觉检测方法 | |
CN110909772B (zh) | 一种高精度实时多尺度表盘指针检测方法和系统 | |
CN113159014A (zh) | 基于手写题号的客观题批阅方法、装置、设备及存储介质 | |
CN112348018A (zh) | 基于巡检机器人的数显式仪表读数识别方法 | |
CN108197624A (zh) | 证书图像校正识别方法及装置、计算机存储介质 | |
CN110263784A (zh) | 智能的英语试卷成绩识别录入方法 | |
CN110705442A (zh) | 一种试卷答案自动获取方法、终端设备及存储介质 | |
CN104077562B (zh) | 一种答卷的扫描方向判断方法 | |
CN117496518A (zh) | 基于文本检测和表格检测的电子卷宗图像智能矫正方法 | |
CN110766001B (zh) | 基于cnn和rnn的银行卡卡号定位与端到端识别方法 | |
CN113610940B (zh) | 基于海洋矢量文件和影像通道阈值的临海区域匀色方法 | |
CN115588208A (zh) | 一种基于数字图像处理技术的全线表结构识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |