CN117237585A - 答题卡的光学标记定位识别方法、系统、设备和存储介质 - Google Patents

答题卡的光学标记定位识别方法、系统、设备和存储介质 Download PDF

Info

Publication number
CN117237585A
CN117237585A CN202311489614.6A CN202311489614A CN117237585A CN 117237585 A CN117237585 A CN 117237585A CN 202311489614 A CN202311489614 A CN 202311489614A CN 117237585 A CN117237585 A CN 117237585A
Authority
CN
China
Prior art keywords
pixel
confidence coefficient
optical mark
optical
confidence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202311489614.6A
Other languages
English (en)
Other versions
CN117237585B (zh
Inventor
施陈博
王晨太
于丁
张俊生
张�杰
祝长生
张淳
卢衡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Heqili Education Technology Co ltd
Shandong University of Science and Technology
Original Assignee
Guangzhou Heqili Education Technology Co ltd
Shandong University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Heqili Education Technology Co ltd, Shandong University of Science and Technology filed Critical Guangzhou Heqili Education Technology Co ltd
Priority to CN202311489614.6A priority Critical patent/CN117237585B/zh
Publication of CN117237585A publication Critical patent/CN117237585A/zh
Application granted granted Critical
Publication of CN117237585B publication Critical patent/CN117237585B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Length Measuring Devices By Optical Means (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及图像数据识别处理技术领域,具体为答题卡的光学标记定位识别方法、系统、设备和存储介质,该定位识别方法利用滑动窗口自主定位答题卡上的光学标记,并根据光学标记的像素分布置信度,确定光学标记位置,并基于光学标记之间的间距特性,划分光学标记题组,最后获取每个光学标记的填涂像素值,确定光学标记填涂结果,该定位识别方法能够有效处理不同类型答题卡,局部变形答题卡和噪声答题卡识别难,识别通用性弱、灵活性低,识别准确率低的问题,还具有节省成本,提高计算效率的优势。

Description

答题卡的光学标记定位识别方法、系统、设备和存储介质
技术领域
本发明涉及图像数据识别技术领域,具体为答题卡的光学标记定位识别方法、系统、设备和存储介质。
背景技术
随着数字图像处理的发展,传统的自动光学标记识别机器被数码相机或扫描仪替代,大大降低了识别成本,通过扫描不同的模板和模板副本,可以识别多种类型的答题卡,相比于传统机器去改变光学标记的布局变得更容易,只需要在软件中调整即可。
光学标记的形状和排列多样,以矩形和圆形居多,迄今为止的研究使用固定的光学标记种类和排列,一般先求取模板光学标记的位置或由系统记录模板光学标记的位置,再定位识别模板的副本,这种方法缺乏灵活性。在权威性考试中,自动光学标记识别阅读器往往采用高质量的纸张,这些纸张比普通的纸张成本高,这不仅不适合小型机构使用,并且普通纸张在扫描中往往会产生意想不到的变形和噪声。使用者在使用模板副本时由于操作不规范,也会使纸张出现各种噪声,这都会影响光学标记的精确定位和识别。
当前答题卡的光学标记定位识别存在以下问题:一是需要先验信息,如模板光学标记的位置、光学标记的形状等,导致系统操作繁琐,不能完全实现自动定位识别。二是需要特制光学标记阵列,导致智能识别系统适用的光学标记类型单一、适用的光学标记排列规则单一,使其通用性不强。三是对扫描印刷过程中出现的污点噪声、横线噪声、填涂噪声等较敏感,使得识别系统抗噪能力不强,识别效果差。
发明内容
本发明的目的是提供了一种答题卡的光学标记定位识别方法、系统、设备和存储介质。
本发明技术方案如下:
一种答题卡的光学标记定位识别方法,包括如下操作:
S1、预设滑动窗口,所述滑动窗口遍历答题卡,得到像素分布置信度集;基于所述像素分布置信度集,得到像素置信度曲线;获取所述置信度曲线中的峰值点对应的位置,得到光学标记位置集;所述像素分布置信度集包括:滑动窗口内部像素分布置信度和滑动窗口两侧像素分布置信度;
S2、获取所述光学标记位置集中,不同光学标记之间的间距,得到间距平均值和间距最大值;基于所述不同光学标记之间的间距,以及间距平均值和间距最大值,得到间距置信度集;基于所述间距置信度集,得到光学标记题组集;
S3、获取所述光学标记题组集中,每个题组中每个光学标记的填涂像素置信度,得到填涂像素置信度集;基于所述填涂像素置信度集,得到光学标记填涂结果。
作为一种优选的实施方案,获取所述答题卡的像素占比置信度集,所述像素占比置信度集与所述S1中像素分布置信度集进行对应位置相乘后,得到的优化像素置信度曲线用于执行所述S1中获取峰值点对应位置的操作;像素占比置信度包括:滑动窗口内部像素占比置信度、滑动窗口外部像素占比置信度、滑动窗口内部两边像素占比置信度和滑动窗口内部中间像素占比置信度。
作为另一种优选的实施方案,获取所述答题卡的高宽比置信度集,所述高宽比置信度集与像素占比置信度集、像素分布置信度集进行对应位置相乘后,得到的最优像素置信度曲线用于执行所述S1中获取峰值点对应位置的操作;高宽比置信度是基于滑动窗口的宽高比和滑动窗口内非白色像素的宽高比得到的。
其中,所述像素分布置信度集中,像素分布置信度是由所述滑动窗口内部像素分布置信度和滑动窗口两侧像素分布置信度的和,经归一化处理得到的;所述像素占比置信度集中,像素占比置信度是由所述滑动窗口内部像素占比置信度、滑动窗口外部像素占比置信度、滑动窗口内部两边像素占比置信度和滑动窗口内部中间像素占比置信度的乘积,经归一化处理得到的。
所述S2中基于间距置信度集,得到所述光学标记题组集的操作具体为:基于间距置信度集和滑动窗口遍历位置集,得到间距置信度曲线;获取所述间距置信度曲线中斜率处于预设范围的线段,相邻且连接的所述线段中对应的光学标记组成一个光学标记题组,多个所述光学标记题组组成光学标记题组集。
所述S3中的基于所述光学标记填涂像素值集,得到所述光学标记填涂结果的操作具体为:获取所述填涂像素置信度集中,每个题组中每个光学标记的填涂像素置信度,判断当前填涂像素置信度是否处于填涂像素置信度范围内;若处于,当前填涂像素置信度对应光学标记为已填涂光学标记;若不处于,当前填涂像素置信度对应光学标记为未填涂光学标记。
所述S1中的答题卡进行灰度化处理,得到的灰度化答题卡用于执行所述遍历的操作。
一种答题卡的光学标记定位识别系统,包括:
光学标记位置集生成模块,用于预设滑动窗口,所述滑动窗口遍历答题卡,得到像素分布置信度集;基于所述像素分布置信度集,得到像素置信度曲线;获取所述置信度曲线中的峰值点对应的位置,得到光学标记位置集;所述像素分布置信度包括:滑动窗口内部像素分布置信度和滑动窗口两侧像素分布置信度;
光学标记题组集生成模块,用于获取所述光学标记位置集中,不同光学标记之间的间距,得到间距平均值和间距最大值;基于所述不同光学标记之间的间距,以及间距平均值和间距最大值,得到间距置信度集;基于所述间距置信度集,得到光学标记题组集;
光学标记填涂结果生成模块,用于获取所述光学标记题组集中,每个题组中每个光学标记的填涂像素置信度,得到填涂像素置信度集;基于所述填涂像素置信度集,得到光学标记填涂结果。
一种答题卡的光学标记定位识别设备,包括处理器和存储器,其中,所述处理器执行所述存储器中保存的计算机程序时实现上述的答题卡的光学标记定位识别方法。
一种计算机可读存储介质,其特征在于,用于存储计算机程序,其中,所述计算机程序被处理器执行时实现上述的答题卡的光学标记定位识别方法。
本发明的有益效果在于:
本发明提供的一种答题卡的光学标记定位识别方法,利用滑动窗口自主定位答题卡上的光学标记,并根据光学标记的像素分布置信度,确定光学标记位置,并基于光学标记之间的间距特性,划分光学标记题组,最后获取每个光学标记的填涂像素值,确定光学标记填涂结果,该定位识别方法能够有效处理不同类型答题卡,局部变形答题卡和噪声答题卡识别难,识别通用性弱、灵活性低,识别准确率低的问题,还具有节省成本,提高计算效率的优势;
本发明提供的一种答题卡的光学标记定位识别方法,该方法的光学标记位置定位的精确率、查全率,以及光学标记题组划分的精确率、查全率分别能够达到97.07%、96.99%、97.86%、97.64%,且光学标记填涂准确率也能达到97.80%,具有较高的准确度。
附图说明
通过阅读下文优选实施方式的详细描述,本申请的方案和优点对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。
在附图中:
图1为实施例中,光学标记像素分布区域划分示意图,其中,(a)为半封闭式矩形光学标记的区域划分示意图;(b)为全封闭式矩形光学标记的区域划分示意图;(c)为全封闭式圆形光学标记的区域划分示意图;
图2为实施例中,光学标记像素占比区域划分示意图,其中,(a)为半封闭式矩形光学标记、全封闭式矩形光学标记、全封闭式圆形光学标记(从左至右)的区域划分示意图;(b)为的半封闭式矩形光学标记、全封闭式矩形光学标记、全封闭式圆形光学标记(从左至右)的内部区域划分示意图;
图3为实施例中光学标记题组间距示意图;
图4为实施例中光学标记题组的间距置信度曲线图;
图5为实施例中不同空间分布类型答题卡的光学标记定位识别结果图,其中,(a)为第一类型的答题卡的光学标记定位识别结果图;(b)为第二类型的答题卡的光学标记定位识别结果图;(c)为第三类型的答题卡的光学标记定位识别结果图;(d)为第四类型的答题卡的光学标记定位识别结果图;
图6为实施例中不同空间分布类型答题卡的光学标记划分指标示意图;
图7为实施例中光学标记定位的精准率、查全率以及光学标记题组划分的精准率、查全率曲线图,其中,(a)为光学标记定位的精准率曲线图,(b)为光学标记定位的查全率曲线图,(c)为光学标记题组划分的精准率曲线图,(d)为光学标记题组划分的查全率曲线图;
图8为实施例中噪声光学标记的最优像素置信度图;
图9为实施例中投影方法和本实施例方法的定位结果对比图;
图10为实施例中霍夫圆方法和本实施例方法的定位结果对比图;
图11为实施例中局部形变答题卡的光学标记定位识别效果图,其中,(a)为局部形变答题卡样例图,(b)为光学标记定位的最优像素置信度图,(c)为光学标记位置的识别结果图,(d)为光学标记题组的间距置信度图,(e)为光学标记题组的识别结果图,(f)为光学标记的填涂像素置信度图,(g)为光学标记填涂的识别结果图;
图12为实施例中噪声答题卡的光学标记定位识别效果图,其中,(a)为噪声答题卡样例图,(b)为光学标记定位的最优像素置信度图,(c)为光学标记位置的识别结果图,(d)为光学标记题组的间距置信度图,(e)为光学标记题组的识别结果图,(f)为光学标记的填涂像素置信度图,(g)为光学标记填涂的识别结果图。
具体实施方式
下面将结合附图更详细地描述本公开的示例性实施方式。
本实施例提供一种答题卡光学标记填涂的定位方法,包括如下操作:
S1、预设滑动窗口,所述滑动窗口遍历答题卡,得到像素分布置信度集;基于所述像素分布置信度集,得到像素置信度曲线;获取所述置信度曲线中的峰值点对应的位置,得到光学标记位置集;所述像素分布置信度包括:滑动窗口内部像素分布置信度和滑动窗口两侧像素分布置信度;
S2、获取所述光学标记位置集中,不同光学标记之间的间距,得到间距平均值和间距最大值;基于所述不同光学标记之间的间距,以及间距平均值和间距最大值,得到间距置信度集;基于所述间距置信度集,得到光学标记题组集;
S3、获取所述光学标记题组集中,每个题组中每个光学标记的填涂像素置信度,得到填涂像素置信度集;基于所述填涂像素置信度集,得到光学标记填涂结果。
S1、预设滑动窗口,滑动窗口遍历答题卡,得到像素分布置信度集;基于像素分布置信度集,得到像素置信度曲线;获取置信度曲线中的峰值点对应的位置,得到光学标记位置集;像素分布置信度集包括:滑动窗口内部像素分布置信度和滑动窗口两侧像素分布置信度。
光学标记的像素排布具有一定的对称性,光学标记一定范围内的外部区域和内部区域为对称的白色像素和非白色像素(非彩色答题卡中,一般为黑色像素),而中间部分为对称的非白色像素。为便于统计像素特征,提高计算效率,将S1中的答题卡进行灰度化处理,得到的灰度化答题卡用于执行遍历的操作。彩色答题卡的颜色较多,提取像素特征时耗费能量较大,因此将其灰度化处理后,能够大大提高计算效率。
根据答题卡光学标记的尺寸、形状和位置的统计信息,统计获得与标准光学标记形状相等,能够匹配的滑动窗口,并利用滑动窗口在答题卡上遍历,遍历过程中获得的像素置信度(计算得到的光学标记像素特征与实际光学标记像素特征的相似度),来确定光学标记的位置,能够耗费较少的计算能量,并得到准确的识别结果。
像素分布置信度集是所有的像素分布置信度组成的集合。像素分布置信度可以为滑动窗口内部像素分布置信度和滑动窗口两侧像素分布置信度的乘积,也可以为滑动窗口内部像素分布置信度和滑动窗口两侧像素分布置信度的和。滑动窗口两侧像素分布置信度,是指滑动窗口左右两端向外扩展第一宽度后,组成的滑动窗口两侧区域的像素分布置信度。本实施例中,为提高计算效率,减少能量消耗,优先选择像素分布置信度是由滑动窗口内部像素分布置信度和滑动窗口两侧像素分布置信度的和,经归一化处理得到的。
像素分布置信度描述了位置L处滑动窗口的像素分布特点,本实施例将光学标记像素分布区域划分为三个区域,参见图1。其中,第一区域为滑动窗口左右两端外侧,宽为第一宽度,高和滑动窗口高度相等的①号区域,对应的像素分布置信度为滑动窗口两侧像素分布置信度;第二区域为滑动窗口左右两端内侧,宽为第二宽度,高度和滑动窗口高度相等的②号区域,第三区域为滑动窗口内部中间,宽为第三宽度,高度和滑动窗口高度相等的③号区域;第二区域和第三区域的像素分布置信度之和为滑动窗口内部像素分布置信度,为了防止发生上下偏移,将每个区域又分为h等份,典型的h=H,W,H为滑动窗口的宽、高。
以黑白色光学标记答题卡为例,L位置处像素分布置信度,Normalization()为归一化操作,/>为滑动窗口内部像素分布置信度,/>为为滑动窗口两侧像素分布置信度。滑动窗口内部像素分布置信度和滑动窗口两侧像素分布置信度可通过如下公式得到:/>
Ck为滑动窗口内部k号区域的权重系数,S1(k,i,j)为左侧k号区域的第i行j列区域,S2(k,i,j)为右侧k号区域的第i行j列区域,Wk为k号区域的宽度,h为水平划分的h份,NB(S1(k,i,j),S2(k,i,j))表示左右k号区域的第i行j列同时为黑色像素的数量,NW(S1(k,i,j),S2(k,i,j))表示左右号区域的第i行j列同时为白色像素的数量。同一区域,左右侧(边)的计算用坐标原点对称。
基于上述公式得到的像素分布置信度集,与滑动窗口遍历位置集(滑动窗口遍历位置集是所有的滑动窗口遍历位置组成的集合)结合,可以得到像素分布置信度曲线,获取像素分布置信度曲线中的峰值点(预设区域内,像素分布置信度最大的点为峰值点)对应的位置,即为光学标记位置。具体为,基于所有滑动窗口遍历位置处的像素分布置信度,将像素分布置信度作为y轴,滑动窗口遍历位置作为x轴,得到像素分布置信度曲线,预设区域内,像素分布置信度曲线中像素置信度最大值,是与模板光学标记像素最为接近的值,其对应的位置,为计算得到的光学标记位置。
为进一步提高光学标记位置识别的准确度,引用像素占比置信度与上述像素分布置信度结合的方法,确定光学标记位置。获取答题卡的像素占比置信度集,像素占比置信度集与S1中像素分布置信度集进行对应位置相乘后,得到的优化像素置信度曲线用于执行S1中获取峰值点对应的位置的操作;像素占比置信度集是所有的像素占比置信度组成的集合。像素占比置信度包括:滑动窗口内部像素占比置信度、滑动窗口外部像素占比置信度、滑动窗口内部两边像素占比置信度和滑动窗口内部中间像素占比置信度。像素占比置信度是由滑动窗口内部像素占比置信度、滑动窗口外部像素占比置信度、滑动窗口内部两边像素占比置信度和滑动窗口内部中间像素占比置信度的乘积,经归一化处理得到的。
像素占比可区分答题卡中的空白区域、题号区域和光学标记区域(目标区域),因此本实施例利用滑动窗口遍历答题卡,来获取像素占比置信度,光学标记像素占比区域分为内外两个区域,参见图2。图2中,内部区域(图2中a图的白色区域)由滑动窗口围成,对应的像素占比置信度为滑动窗口内部像素占比置信度;另外,内部区域包括两个小区域,第一区域为滑动窗口内部左右两边,宽为第二宽度,高度和滑动窗口高度相等的区域①,对应的像素占比置信度为像素滑动窗口内部两边像素分布置信度;第二区域为滑动窗口内部中间,宽为第三宽度,高度和滑动窗口高度相等的区域②,对应的像素占比置信度为像素滑动窗口内部中间像素占比置信度;图2中b图的区域①的像素占比可区别光学标记和题号,区域②的像素占比可排除滑动窗口位于目标间隙的情况;外部区域(图2中a图的灰色区域)是由滑动窗口向外扩展b距离得到,对应的像素占比置信度为滑动窗口外部像素占比置信度。内部像素占比可以平衡未填涂光学标记和填涂光学标记,外部像素占比可区别噪声和光学标记。
L位置处像素占比置信度可通过如下计算公式得到:
分别为L位置的滑动窗口内部像素占比置信度、滑动窗口外部像素占比置信度、滑动窗口内部两边像素占比置信度和滑动窗口内部中间像素占比置信度,可通过如下计算公式得到:
其中,分别表示位置L处内部区域白色像素比例和外部区域白色像素比例,表示位置L处左侧区域①白色像素比例,/>表示位置L处右侧区域①白色像素比例,/>表示位置L处区域②白色像素比例。
基于上述公式得到的像素占比置信度集和像素分布置信度集进行对应位置相乘后,与滑动窗口遍历位置集结合,可以得到优化像素置信度曲线,获取优化像素置信度曲线中的峰值点(预设区域内,优化像素置信度最大的点为峰值点)对应的位置,即为光学标记位置。具体为,当前滑动窗口遍历位置处的像素占比置信度和像素分布置信度相乘后,得到当前位置的优化像素置信度;基于所有滑动窗口遍历位置处的优化像素置信度,将优化像素置信度作为y轴,滑动窗口遍历位置作为x轴,得到优化像素置信度曲线,预设区域内,优化像素置信度曲线中像素置信度最大值,是与模板光学标记像素最为接近的值,其对应的位置,为计算得到的光学标记位置。
为更进一步提高光学标记位置识别的准确度,引用高宽比置信度集,与上述像素占比置信度与像素分布置信度结合的方法,确定光学标记位置。具体为,获取答题卡的高宽比置信度集,高宽比置信度集与像素占比置信度集、像素分布置信度集进行对应位置相乘后,得到的最优像素置信度曲线用于执行S1中获取峰值点对应的位置的操作;高宽比置信度是基于滑动窗口的宽高比和滑动窗口内非白色像素的宽高比得到的。高宽比置信度集是所有的高宽比置信度组成的集合。
题号、噪声与光学标记的宽高比存在一定的差异,因此宽高比可以对题号和噪声的置信度起到抑制作用,对光学标记的识别有一定的促进作用。本实施例利用滑动窗口遍历答题卡,来获取高宽比置信度集。滑动窗口内的目标宽高比应当与真实宽高比越接近越好,即当两者差异越小,置信度越大。
L位置处高宽比置信度,AR是由统计得出的真实宽高比,它 随着输入的答题卡变化而变化,arL为位置L处滑动窗口内的宽高比,以黑白色光学标记答 题卡为例,arL为滑动窗口内黑色像素点的最大水平距离与滑动窗口的高的比值,典型为
基于上述公式得到的高宽比置信度集与像素占比置信度集、像素分布置信度集进行对应位置的相乘后,与滑动窗口遍历位置集结合,可以得到最优像素置信度曲线,获取最优像素置信度曲线中的峰值点(像素置信度为预设区域内最大的点)对应的位置,即为光学标记位置。具体为,当前滑动窗口遍历位置处的高宽比置信度、与像素占比置信度和像素分布置信度相乘后,得到当前位置的最优像素置信度;基于所有滑动窗口遍历位置处的最优像素置信度集,将最优像素置信度作为y轴,滑动窗口遍历位置作为x轴,得到最优像素置信度曲线,预设区域内,最优像素置信度曲线中像素置信度最大值,是与模板光学标记像素最为接近的值,其对应的位置,为计算得到的光学标记位置。
S2、获取光学标记位置集中,相邻光学标记之间的间距,得到间距平均值和间距最大值;基于间距平均值和间距最大值,与相邻光学标记之间的间距,得到间距置信度集;基于间距置信度集,得到光学标记题组集。
不同题组间的光学标记间距,与同一题组不同光学标记的间距存在差异,如光学标记题组间距示意图(图3)所示,不同题组之间的光学标记间距长度,明显不同于同一题组之间(间距1-间距4)光学标记间距长度。因此将光学标记之间间距的均值和最大值作为先验条件,设计如下计算公式:
,
其中,为为光学标记位置l的权重系数,g l 表示光学标记位置l处和前一处光学 标记的间距,mean(G)表示间距平均值,max(G)表示间距最大值。
间距置信度F 1 (l)为光学标记位置l处的像素分布置信度,或像素分布置信度和像 素占比置信度的乘积、或像素分布置信度、像素占比置信度和高宽比置信度的乘积,与前一 个光学标记位置l-1处间距置信度F 1 (l-1)的乘积,可通过如下计算公式得到:
基于间距置信度集,得到光学标记题组集的操作为:基于间距置信度集和滑动窗口遍历位置集,得到间距置信度曲线;获取间距置信度曲线中斜率处于预设范围的线段,相邻且连接的线段中对应的光学标记组成一个光学标记题组,多个光学标记题组组成光学标记题组集。间距置信度集是所有间距置信度的集合。具体为,参见图4的光学标记题组的间距置信度曲线图,曲线图中的x轴为滑动窗口遍历位置,y轴为间距置信度,当间距置信度曲线当中的线段斜率大于0时,表明前后两个光学标记间距与间距平均值接近,为同一题组,相邻且相互连接的线段所对应的光学标记处于同一个题组。
基于间距置信度集,得到光学标记题组集的操作还可以为:基于间距置信度集和滑动窗口遍历位置集,得到间距置信度曲线;获取间距置信度曲线中的峰值点,峰值点对应的光学标记,为一个光学标记题组的最后一个光学标记,以此类推得到光学标记题组集。
S3、获取光学标记题组集中,每个题组中每个光学标记的填涂像素置信度,得到填涂像素置信度集;基于填涂像素置信度集,得到光学标记填涂结果。
基于填涂像素置信度集,得到答题卡填涂结果的操作为:获取填涂像素置信度集中,每个题组中每个光学标记的填涂像素置信度,判断当前填涂像素置信度是否处于填涂像素置信度范围内;若处于,当前填涂像素置信度对应光学标记为已填涂光学标记;若不处于,当前填涂像素置信度对应光学标记为未填涂光学标记。
基于填涂像素置信度集,得到光学标记填涂结果的操作还可以为:获取填涂像素置信度集中,每个题组中的填涂像素置信度最大值,填涂像素置信度最大值对应的光学标记为已填涂光学标记,得到答题卡填涂结果。
本实施例利用滑动窗口遍历答题卡,来获取填涂像素置信度集,以黑白色光学标记答题卡为例,填涂像素值可通过如下公式实现:
表示题组/>中光学标记l处的黑色像素面积占滑动窗口面积的比值。
为验证本实施例提供的光学标记定位识别方法(以下简称本实施例方法)的效果,做了如下实验。
实验中选用目标检测的评价指标来验证本实施例方法的定位识别能力。为了验证光学标记定位识别的准确性,将定位识别方法得到的位置与存储在系统中的标准位置进行对比,计算它们的交并比(IoU),IoU越高,表示定位精度越高。另外,还与以下参数结合进行评价。
精准率(Precision):精准率主要计算预测的正样本中,实际也是正样本的概率。在光学标记定位中,通过设定IoU阈值,在得到的光学标记中,满足阈值的光学标记为真阳性TP,没有满足阈值的为假阳性FP,光学标记定位的精准率如下公式得到:
召回率(Recall):召回率也称为查全率,主要评价实际为正样本中被预测为正样本的概率。在光学标记定位中,光学标记的数目是确定的,部分光学标记可能因为噪声等原因未被定位到。将满足IoU阈值的光学标记,与系统预存数据对比,满足阈值的光学标记作为真阳性TP,不满足的光学标记作为假阴性FN,光学标记定位的召回率可由如下公式得到:
准确率(Accuracy):通过准确率验证方法的定位能力,准确率可由如下公式得到:
,
其中CQN表示识别正确的题目数量,WQN表示识别错误的题目数量。
实验中,设计了110套不同形状和排列的答题卡,将其分发给经过训练的志愿者模拟学生填涂,并将该数据集发表在{github网址}上,为自动光学标记识别研究提供数据支撑。数据包含了各种噪声、不同的答题卡数量、题目数量和光学标记数量,同一个答题卡可包含不同光学标记数量的题组。对全部数据进行了统计,半包围光学标记和全包围光学标记各占一半。相同数量的光学标记组成一道题的数据占总数据的95.4%,多种数量光学标记组成一道题的数据占总数据的4.6%。矩形光学标记和圆形光学标记的占比分别为81.8%和18.2%。
在题组划分中,考虑到光学标记阵列的空间分布具有差异性,以图5中的四种空间分布类型为例,计算了本实施例题组划分结果的评价指标,简称划分指标(包括精准率和召回率),来说明本实施例提供方法的灵活性,结果如图6所示,可见本实施例提供的方法能够自动准确划分不同分布的题组。
在光学标记的位置定位中,IoU的精度越高意味着所识别的光学标记位置越贴合真实的光学标记的位置,通过计算了IoU=0.7下的光学标记位置定位的精准率、召回率,以及光学标记题组划分的精准率、召回率,参见图7。在IoU=0.7这一阈值下,本实施例方法的光学标记位置定位精准率、召回率,以及光学标记题组划分的光学标记、召回率分别达到了97.07%、96.99%、97.86%、97.64%,110套数据的精准率和查全率如图7,可以看出各项指标都在90%以上。同时,实验中将本实施例方法的定位识别结果与系统预存答案进行对比,正确个数764598个,错误个数17185个,正确率为97.80%,由以上数据可见本实施例方法具有较高的准确度。
与现有技术的效果对比。另外,实验中将本实施例S1中提供的方法(将高宽比置信度集与像素占比置信度集、像素分布置信度集进行对应位置相乘后,得到最优像素置信度)应用到带有噪声的光学标记数据集,得到的最优像素置信度图都取得了如图8所示的局部最大值,可见本实施例S1中提供的方法可以很好的描述光学标记的像素特点。另外,实验中将本实施例S1中提供的方法与现有的投影方法和霍夫圆方法(也可称为Hough圆方法)进行了光学标记位置定位识别效果对比。图9和图10分别展示了本实施例S1中提供的方法,分别与投影方法和霍夫圆方法在测试集上的对比结果,可以看出,受噪声的影响,投影方法和霍夫圆方法的光学标记位置识别结果(圈定光学标记范围),与真实光学标记位置之间存在较大的差距。例如图9和图10中箭头所指的位置处的光学标记位置圈定范围(对应图中的光学标记位置圈定框),明显大于真实光学标记所在的范围,因此两种现有技术在噪声处无法得到精确的光学标记宽高数据和位置数据,而本实施例S1中提供的方法,得到的宽高数据与实际宽高数据更为接近,圈定的光学标记位置与实际光学标记的位置重合了,可以证明本实施例S1中提供的方法能够得到更准确的光学标记位置。
多场景分析。实际中的光学标记排列多样,并且可能会出现纸张变形和噪声,在没有预先设定的模板和特殊标记的情况下,定位识别这类的光学标记非常困难。目前的方法大部分只针对特定排列方式的光学标记,即使通过软件更换模板,但也只能适用当前模板的排列方式,无法自适应定位识别未知复杂排列方式的光学标记。为验证本实施例方法的灵活性,选取了不同排列的光学标记(如图5),图5展示了本实施例方法处理不同空间分布类型答题卡的光学标记定位识别结果图,可见本实施例方法能够灵活自动定位识别不同空间分布的光学标记的位置、光学标记题组位置和光学标记填涂位置。
由于答题卡是柔性纸制品,在使用和扫描过程中可能会使纸张发生局部变形,现有技术通过在答题卡上设置特殊的形状或标记生成仿射矩阵矫正到模板的位置,但这种方法难以对局部形变起作用。为验证本实施例方法的定位识别效果,实验中选取了局部形变导致光学标记的位置和间距不统一的答题卡。实验结果显示,本实施例S1中提供的方法,即使在光学标记的位置发生偏移时,其对像素特点的描述也能准确定位光学标记的位置(参见图11的(c)图和图11的(d)图),本实施例S2中提供的方法基于光学标记间距的分析,即使答题卡中光学标记的距离不同,也能划分出题组(参见图11的(e)图和图11的(f)图),且最终获得了准确的填涂结果(参见图11的(g)图)。
实际应用中的扫描仪质量残次不齐,使用者的填涂习惯也多种多样,这会导致答题卡光学标记上出现斑点、填涂等噪声,由于其存在众多干扰,使用投影方法和霍夫圆方法无法取得好的阈值,定位和识别这种低质量的光学标记非常困难。实验中,选取了带有斑点和填涂不规范的答题卡,统称为噪声答题卡,来验证本实施例方法对这种情况的处理能力。本实施例S1中提供的方法对于光学标记的像素表达可以区分光学标记和其他噪声,如图12的(b)图所示,噪声的像素置信度明显低于光学标记的像素置信度。对比图12的(f)图可以看出,填涂像素值的表示方法能够使得填涂光学标记和未填涂光学标记的置信度产生明显差别,便于识别出正确答案。
整个实验中给出了一些复杂场景下的定位识别样例,本实施例方法在通过设计不同的置信度函数,来实现对光学标记的定位识别,从图5、图11和图12中可以看出本实施例方法在复杂排列的场景、变形场景和噪声场景下均取得了局部最大的置信度,同时能量取得局部最小值,得到了准确度较高的定位识别结果。
本实施例为解决答题卡光学标记填涂识别目前存在的难题,通过对光学标记特征和分布的分析,提出了一种答题卡的光学标记定位识别方法,该方法的光学标记位置定位的精确率、查全率,以及光学标记题组划分的精确率、查全率分为达到了 97.07%、96.99%、97.86%、97.64%,最后的光学标记填涂准确率也达到了97.80%,具有较高的准确度。
本实施例还提供一种答题卡的光学标记定位识别系统,包括:
光学标记位置集生成模块,用于预设滑动窗口,滑动窗口遍历答题卡,得到像素分布置信度集;基于像素分布置信度集,得到像素置信度曲线;获取置信度曲线中的峰值点对应的位置,得到光学标记位置集;像素分布置信度包括:滑动窗口内部像素分布置信度和滑动窗口两侧像素分布置信度;
光学标记题组集生成模块,用于获取光学标记位置集中,不同光学标记之间的间距,得到间距平均值和间距最大值;基于不同光学标记之间的间距,以及间距平均值和间距最大值,得到间距置信度集;基于间距置信度集,得到光学标记题组集;
光学标记填涂结果生成模块,用于获取光学标记题组集中,每个题组中每个光学标记的填涂像素置信度,得到填涂像素置信度集;基于填涂像素置信度集,得到光学标记填涂结果。
本实施例还提供一种答题卡的光学标记定位识别设备,包括处理器和存储器,其中,处理器执行存储器中保存的计算机程序时实现上述的答题卡的光学标记定位识别方法。
本实施例还提供一种计算机可读存储介质,其特征在于,用于存储计算机程序,其中,计算机程序被处理器执行时实现上述的答题卡的光学标记定位识别方法。
本实施例提供的一种答题卡的光学标记定位识别方法,利用滑动窗口自主定位答题卡上的光学标记,并根据光学标记的像素分布置信度,确定光学标记位置,并基于光学标记之间的间距特性,划分光学标记题组,最后获取每个光学标记的填涂像素值,确定光学标记填涂结果,该定位识别方法能够有效处理不同类型答题卡,局部变形答题卡和噪声答题卡识别难,识别通用性弱、灵活性低,识别准确率低的问题,还具有节省成本,提高计算效率的优势。

Claims (10)

1.一种答题卡的光学标记定位识别方法,其特征在于,包括如下操作:
S1、预设滑动窗口,所述滑动窗口遍历答题卡,得到像素分布置信度集;基于所述像素分布置信度集,得到像素置信度曲线;获取所述置信度曲线中的峰值点对应的位置,得到光学标记位置集;所述像素分布置信度集包括:滑动窗口内部像素分布置信度和滑动窗口两侧像素分布置信度;
S2、获取所述光学标记位置集中,不同光学标记之间的间距,得到间距平均值和间距最大值;基于所述不同光学标记之间的间距,以及间距平均值和间距最大值,得到间距置信度集;基于所述间距置信度集,得到光学标记题组集;
S3、获取所述光学标记题组集中,每个题组中每个光学标记的填涂像素置信度,得到填涂像素置信度集;基于所述填涂像素置信度集,得到光学标记填涂结果。
2.根据权利要求1所述的光学标记定位识别方法,其特征在于,获取所述答题卡的像素占比置信度集,所述像素占比置信度集与所述S1中像素分布置信度集进行对应位置相乘后,得到的优化像素置信度曲线用于执行所述S1中获取峰值点对应位置的操作;
像素占比置信度包括:滑动窗口内部像素占比置信度、滑动窗口外部像素占比置信度、滑动窗口内部两边像素占比置信度和滑动窗口内部中间像素占比置信度。
3.根据权利要求2所述的光学标记定位识别方法,其特征在于,获取所述答题卡的高宽比置信度集,所述高宽比置信度集与像素占比置信度集、像素分布置信度集进行对应位置相乘后,得到的最优像素置信度曲线用于执行所述S1中获取峰值点对应位置的操作;
高宽比置信度是基于滑动窗口的宽高比和滑动窗口内非白色像素的宽高比得到的。
4.根据权利要求3所述的光学标记定位识别方法,其特征在于,
所述像素分布置信度集中,像素分布置信度是由所述滑动窗口内部像素分布置信度和滑动窗口两侧像素分布置信度的和,经归一化处理得到的;
所述像素占比置信度集中,像素占比置信度是由所述滑动窗口内部像素占比置信度、滑动窗口外部像素占比置信度、滑动窗口内部两边像素占比置信度和滑动窗口内部中间像素占比置信度的乘积,经归一化处理得到的。
5.根据权利要求1所述的光学标记定位识别方法,其特征在于,所述S2中基于间距置信度集,得到所述光学标记题组集的操作具体为:
基于间距置信度集和滑动窗口遍历位置集,得到间距置信度曲线;
获取所述间距置信度曲线中斜率处于预设范围的线段,相邻且连接的所述线段中对应的光学标记组成一个光学标记题组,多个所述光学标记题组组成光学标记题组集。
6.根据权利要求1所述的光学标记定位识别方法,其特征在于,所述S3中的基于所述光学标记填涂像素值集,得到所述光学标记填涂结果的操作具体为:
获取所述填涂像素置信度集中,每个题组中每个光学标记的填涂像素置信度,判断当前填涂像素置信度是否处于填涂像素置信度范围内;
若处于,当前填涂像素置信度对应光学标记为已填涂光学标记;
若不处于,当前填涂像素置信度对应光学标记为未填涂光学标记。
7.根据权利要求1所述的光学标记定位识别方法,其特征在于,将所述S1中的答题卡进行灰度化处理,得到的灰度化答题卡用于执行所述遍历的操作。
8.一种答题卡的光学标记定位识别系统,其特征在于,包括:
光学标记位置集生成模块,用于预设滑动窗口,所述滑动窗口遍历答题卡,得到像素分布置信度集;基于所述像素分布置信度集,得到像素置信度曲线;获取所述置信度曲线中的峰值点对应的位置,得到光学标记位置集;所述像素分布置信度包括:滑动窗口内部像素分布置信度和滑动窗口两侧像素分布置信度;
光学标记题组集生成模块,用于获取所述光学标记位置集中,不同光学标记之间的间距,得到间距平均值和间距最大值;基于所述不同光学标记之间的间距,以及间距平均值和间距最大值,得到间距置信度集;基于所述间距置信度集,得到光学标记题组集;
光学标记填涂结果生成模块,用于获取所述光学标记题组集中,每个题组中每个光学标记的填涂像素置信度,得到填涂像素置信度集;基于所述填涂像素置信度集,得到光学标记填涂结果。
9.一种答题卡的光学标记定位识别设备,其特征在于,包括处理器和存储器,其中,所述处理器执行所述存储器中保存的计算机程序时实现如权利要求1-7任一项所述的答题卡的光学标记定位识别方法。
10.一种计算机可读存储介质,其特征在于,用于存储计算机程序,其中,所述计算机程序被处理器执行时实现如权利要求1-7中任一项所述的答题卡的光学标记定位识别方法。
CN202311489614.6A 2023-11-10 2023-11-10 答题卡的光学标记定位识别方法、系统、设备和存储介质 Active CN117237585B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311489614.6A CN117237585B (zh) 2023-11-10 2023-11-10 答题卡的光学标记定位识别方法、系统、设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311489614.6A CN117237585B (zh) 2023-11-10 2023-11-10 答题卡的光学标记定位识别方法、系统、设备和存储介质

Publications (2)

Publication Number Publication Date
CN117237585A true CN117237585A (zh) 2023-12-15
CN117237585B CN117237585B (zh) 2024-01-30

Family

ID=89086373

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311489614.6A Active CN117237585B (zh) 2023-11-10 2023-11-10 答题卡的光学标记定位识别方法、系统、设备和存储介质

Country Status (1)

Country Link
CN (1) CN117237585B (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140247965A1 (en) * 2013-03-04 2014-09-04 Design By Educators, Inc. Indicator mark recognition
CN104134072A (zh) * 2014-07-04 2014-11-05 北京学信速达科技有限公司 一种答题卡识别方法
CN108388895A (zh) * 2018-03-04 2018-08-10 南京理工大学 一种基于机器学习的试卷答题卡自动处理方法
CN108537218A (zh) * 2018-04-12 2018-09-14 湖南诚壹文化产业有限公司 一种答题卡的识别处理方法及装置
CN110458014A (zh) * 2019-07-05 2019-11-15 深圳中兴网信科技有限公司 答题卡识读方法、装置和计算机可读存储介质
CN113822267A (zh) * 2021-09-14 2021-12-21 广东德诚科教有限公司 一种基于权重分布的扫描填涂点识别方法及系统
CN114283434A (zh) * 2021-11-17 2022-04-05 淮阴工学院 一种基于机器视觉的答题卡识别方法
KR20220116818A (ko) * 2021-02-15 2022-08-23 엔에이치엔클라우드 주식회사 딥러닝 기반의 답안지 스캔을 통한 정보 추출 방법 및 그 장치
KR102544129B1 (ko) * 2022-07-11 2023-06-16 주식회사 엠엔씨에이프로 Omr 기반 답안 채점 서비스 제공 시스템
CN116824608A (zh) * 2023-06-07 2023-09-29 北京工业大学 基于目标检测技术的答题卡版面分析方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140247965A1 (en) * 2013-03-04 2014-09-04 Design By Educators, Inc. Indicator mark recognition
CN104134072A (zh) * 2014-07-04 2014-11-05 北京学信速达科技有限公司 一种答题卡识别方法
CN108388895A (zh) * 2018-03-04 2018-08-10 南京理工大学 一种基于机器学习的试卷答题卡自动处理方法
CN108537218A (zh) * 2018-04-12 2018-09-14 湖南诚壹文化产业有限公司 一种答题卡的识别处理方法及装置
CN110458014A (zh) * 2019-07-05 2019-11-15 深圳中兴网信科技有限公司 答题卡识读方法、装置和计算机可读存储介质
KR20220116818A (ko) * 2021-02-15 2022-08-23 엔에이치엔클라우드 주식회사 딥러닝 기반의 답안지 스캔을 통한 정보 추출 방법 및 그 장치
CN113822267A (zh) * 2021-09-14 2021-12-21 广东德诚科教有限公司 一种基于权重分布的扫描填涂点识别方法及系统
CN114283434A (zh) * 2021-11-17 2022-04-05 淮阴工学院 一种基于机器视觉的答题卡识别方法
KR102544129B1 (ko) * 2022-07-11 2023-06-16 주식회사 엠엔씨에이프로 Omr 기반 답안 채점 서비스 제공 시스템
CN116824608A (zh) * 2023-06-07 2023-09-29 北京工业大学 基于目标检测技术的答题卡版面分析方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
CHENBO SHI 等: "Unsupervised Optical Mark Localization for Answer Sheet Based on Energy Optimization", 《 2023 IEEE 9TH INTERNATIONAL CONFERENCE ON CLOUD COMPUTING AND INTELLIGENT SYSTEMS (CCIS)》, pages 386 - 392 *
GANGA SANUVALA 等: "A Study of Automated Evaluation of Student’s Examination Paper using Machine Learning Techniques", 《2021 INTERNATIONAL CONFERENCE ON COMPUTING, COMMUNICATION, AND INTELLIGENT SYSTEMS (ICCCIS)》, pages 1049 - 1054 *
孙琳 等: "一种适用于移动设备在线阅卷的答题卡自动识别算法", 《计算机测量与控制》, vol. 26, no. 10, pages 255 - 259 *
梁勇勇: "光标阅读机阅卷原理与信息卡填涂", 《今日科技》, no. 5, pages 45 - 47 *

Also Published As

Publication number Publication date
CN117237585B (zh) 2024-01-30

Similar Documents

Publication Publication Date Title
CN109784342B (zh) 一种基于深度学习模型的ocr识别方法及终端
US20020106112A1 (en) Digital image processing method and computer program product for detecting human irises in an image
CN104700062A (zh) 一种识别二维码的方法及设备
CN108960235B (zh) 一种用于识别答题卡填涂块的方法
CN103559490A (zh) 基于二值图像连通域统计的答题卡自动评分方法
CN110490141B (zh) 一种填涂信息的识别方法、装置、终端及存储介质
CN103489254B (zh) 彩票的识别方法及系统
CN109886978B (zh) 一种基于深度学习的端到端告警信息识别方法
CN112446262A (zh) 文本分析方法、装置、终端和计算机可读存储介质
CN108734161B (zh) 冠字号区域的识别方法、装置、设备及存储介质
CN111626941A (zh) 一种基于深度学习语义分割的文档矫正方法
CN113449536B (zh) 条码图像修复方法、装置、计算机设备和存储介质
CN112115913B (zh) 图像处理方法、装置及设备、存储介质
US8787702B1 (en) Methods and apparatus for determining and/or modifying image orientation
CN116798036B (zh) 用于识别和校验答题卡客观题识别结果的方法及装置
CN113076872A (zh) 一种智能试卷批改方法
CN104992173A (zh) 用于医学报告单的符号识别方法及系统
CN117237585B (zh) 答题卡的光学标记定位识别方法、系统、设备和存储介质
CN113159014A (zh) 基于手写题号的客观题批阅方法、装置、设备及存储介质
CN117333893A (zh) 基于ocr的自定义模板图像识别方法、系统及存储介质
CN111027474B (zh) 人脸区域获取方法、装置、终端设备和存储介质
CN112348019A (zh) 一种答题卡矫正方法、装置、电子设备及存储介质
CN111666864A (zh) 一种基于计算机视觉的自动阅卷方法
CN115620333B (zh) 基于人工智能的试卷自动纠错方法
CN111126286A (zh) 车辆动态检测方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant