CN117894033B - 一种基于ocr识别的答卷一致性校验方法及系统 - Google Patents
一种基于ocr识别的答卷一致性校验方法及系统 Download PDFInfo
- Publication number
- CN117894033B CN117894033B CN202410289128.8A CN202410289128A CN117894033B CN 117894033 B CN117894033 B CN 117894033B CN 202410289128 A CN202410289128 A CN 202410289128A CN 117894033 B CN117894033 B CN 117894033B
- Authority
- CN
- China
- Prior art keywords
- image
- character image
- single character
- preset
- initial single
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012015 optical character recognition Methods 0.000 title claims abstract description 38
- 238000000034 method Methods 0.000 title claims abstract description 36
- 238000012795 verification Methods 0.000 claims abstract description 17
- 238000003062 neural network model Methods 0.000 claims abstract description 15
- 238000012545 processing Methods 0.000 claims description 12
- 238000004891 communication Methods 0.000 claims description 6
- 238000005516 engineering process Methods 0.000 claims description 6
- 230000000694 effects Effects 0.000 abstract description 5
- 238000012360 testing method Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 101100328886 Caenorhabditis elegans col-2 gene Proteins 0.000 description 1
- 101100328884 Caenorhabditis elegans sqt-3 gene Proteins 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000005429 filling process Methods 0.000 description 1
- 101150013335 img1 gene Proteins 0.000 description 1
- 101150071665 img2 gene Proteins 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000001681 protective effect Effects 0.000 description 1
- 238000012797 qualification Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/42—Document-oriented image-based pattern recognition based on the type of document
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/19007—Matching; Proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/22—Character recognition characterised by the type of writing
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Character Input (AREA)
Abstract
本申请公开了一种基于OCR识别的答卷一致性校验方法及系统,主要涉及答卷一致性校验技术领域,用以解决当考生书写不规范或存在涂抹时,无法对OCR识别区域内每个字符进行精准定位或处理,进而影响识别效果的问题。包括:获得预设数量个准确率大于预设准确率阈值的神经网络模型为识别模型;扫描待处理答卷中预设识别区域,获得字符图像对应的单字符图像集;将单字符图像集分别传入识别模型,确定输出值置信度高的作为识别结果;拼接答卷对应的识别结果,获得答卷对应的第一考生信息;扫描答卷二维码,进而从数据库中获取答卷二维码对应的第二考生信息;对第一考生信息与第二考生信息进行比对校验,以确定第一考生信息与第二考生信息是否一致。
Description
技术领域
本申请涉及答卷一致性校验技术领域,尤其涉及一种基于OCR识别的答卷一致性校验方法及系统。
背景技术
在考试项目的答卷扫描阅卷过程中,一般需要对考生答卷信息进行一致性校验,即通过比对答卷所贴条码对应的数据库考生信息与考生所写的考号等信息是否一致,若不一致则可能存在答卷上贴错考生条形码或考生多张答卷归属不同考生等意外情况,此时应根据相应规定进行及时处理。
现有的涉及答卷信息一致性校验的方案有:一种用于识别检查的扫描校验系统、方法及电子设备(CN202311291815.5),包括:生成模板坐标信息,根据校验规则设定指令生成对应的校验规则,根据模板坐标信息获取每一个已作答答卷扫描图像中对应的定位标志点、考生信息填写区、客观题填涂区、每个客观题的填涂点的位置,识别考生信息填写区中的考生信息以及每个客观题的填涂点,得到作答结果,根据校验规则对每一个已作答答卷扫描图像对应的作答结果进行校验,并得到对应的校验结果。
但是,现有的涉及答卷信息一致性校验的方案主要侧重点在于考生已作答答卷的内容的识别,对答卷信息一致性校验的方案主要为直接使用现有的扫描方法,获得考生考号座位号,当考生书写不规范或存在涂抹时,往往导致无法对OCR识别区域内每个字符进行精准定位或处理,进而影响识别效果。
发明内容
针对现有技术的上述不足,本申请提供一种基于OCR识别的答卷一致性校验方法及系统,以解决当考生书写不规范或存在涂抹时,无法对OCR识别区域内每个字符进行精准定位或处理,进而影响识别效果的问题。
第一方面,本申请提供了一种基于OCR识别的答卷一致性校验方法,方法包括:获取若干手写单字符样本图像,将手写单字符样本图像和样本实际字符导入神经网络模型,以获得预设数量个准确率大于预设准确率阈值的神经网络模型为识别模型;扫描待处理答卷中预设识别区域,获取预设识别区域内的字符图像,进而获得字符图像对应的单字符图像集;将单字符图像集分别传入识别模型,确定输出值置信度高的作为识别结果;拼接答卷对应的识别结果,获得答卷对应的第一考生信息;扫描答卷二维码,进而从数据库中获取答卷二维码对应的第二考生信息;对第一考生信息与第二考生信息进行比对校验,以确定第一考生信息与第二考生信息是否一致。
进一步地,获取预设识别区域内的字符图像,进而字符图像对应的单字符图像集,具体包括:通过OCR识别技术,将字符图像二值化处理,以将字符图像构造为灰度图;基于灰度图中的像素数据,从灰度图中分割若干初始单字符图像;基于预设最小字符像素面积,确定初始单字符图像是否为空图像或污渍图像,以在为空图像或污渍图像时,删除初始单字符图像;在初始单字符图像不为空图像和污渍图像时,确定初始单字符图像是否存在答卷预设辅助线,以在存在答卷预设辅助线时,去除当前灰度图中的答卷预设辅助线;获取初始单字符图像中字符的边界,进而基于边界,剪裁掉初始单字符图像中字符的背景;基于预设最小字符像素面积,获取初始单字符图像在灰度图中的相邻最小图像;其中,相邻最小图像至少分为:左最小字符像素面积图像、右最小字符像素面积图像、上最小字符像素面积图像和下最小字符像素面积图像;获取初始单字符图像的和相邻最小图像的主体部分;基于预设比对顺序,将初始单字符图像的主体部分依次与相邻最小图像的主体部分进行图像尺寸比对;确定初始单字符图像的主体部分与当前相邻最小图像的主体部分的图像尺寸比对结果是否满足预设拼接条件;当图像尺寸比对结果满足预设拼接条件时,将初始单字符图像与满足预设拼接条件的相邻最小图像拼接为最终单字符图像,并将满足预设拼接条件的相邻最小图像从对应的初始单字符图像中去除;当获取到满足预设拼接条件的相邻最小图像或依次比对完毕时,结束当前初始单字符图像的图像尺寸比对,获得最终单字符图像;对最终单字符图像进行背景填充处理,以将最终单字符图像的尺寸统一为预设标准规格,进而获得字符图像对应的单字符图像集。
进一步地,确定初始单字符图像是否存在答卷预设辅助线,具体包括:在初始单字符图像中存在横向或纵向贯穿整个初始单字符图像识别区域,且为宽度小于预设宽度阈值的连通区域时,确定连通区域为答卷预设辅助线。
进一步地,获取初始单字符图像中字符的边界,进而基于边界,剪裁掉初始单字符图像中字符的背景,具体包括:对初始单字符图像按列分割,以获得初始单字符图像中字符的左边界、右边界;基于左边界、右边界,剪切掉左右两侧背景;对初始单字符图像按行分割,以获得初始单字符图像中字符的上边界、下边界;基于上边界、下边界,剪切掉上下两侧背景。
进一步地,确定初始单字符图像的主体部分与当前相邻最小图像的主体部分的图像尺寸比对结果是否满足预设拼接条件,具体包括:获取初始单字符图像的主体部分A与相邻最小图像的主体部分B之间的字符间隔以及主体部分B的连通域形状区域和面积,当字符间隔小于主体部分A的高度或宽度的二分之一、主体部分B连通域形状区域的宽与高之比大于等于1.5且主体部分B的面积介于2/3*minsize与3*minsize之间时,确定满足预设拼接条件;其中,minsize表示预设最小字符像素面积。
进一步地,对最终单字符图像进行背景填充处理,具体包括:获取最终单字符图像的长宽比,以在最终单字符图像四周填充预设背景色,以将最终单字符图像的尺寸修正为预设尺寸。
进一步地,方法还包括:确定当前单字符图像集中的单字符图像数量是否小于预设图像数量阈值;当小于预设图像数量阈值时,遍历获取单字符图像集中的每个单字符图像对应的字符宽度,将字符宽度超过预设宽度阈值的单字符图像拆分为两个字符,并更新单字符图像集。
第二方面,本申请提供了一种基于OCR识别的答卷一致性校验系统,系统包括:获得模型模块,用于获取若干手写单字符样本图像,将手写单字符样本图像和样本实际字符导入神经网络模型,以获得预设数量个准确率大于预设准确率阈值的神经网络模型为识别模型;获得信息模块,用于扫描待处理答卷中预设识别区域,获取预设识别区域内的字符图像,进而获得字符图像对应的单字符图像集;将单字符图像集分别传入识别模型,确定输出值置信度高的作为识别结果;拼接答卷对应的识别结果,获得答卷对应的第一考生信息;扫描答卷二维码,进而从数据库中获取答卷二维码对应的第二考生信息;校验信息模块,用于对第一考生信息与第二考生信息进行比对校验,以确定第一考生信息与第二考生信息是否一致。
进一步地,获得信息模块包括图像集获取单元,用于通过OCR识别技术,将字符图像二值化处理,以将字符图像构造为灰度图;基于灰度图中的像素数据,从灰度图中分割若干初始单字符图像;基于预设最小字符像素面积,确定初始单字符图像是否为空图像或污渍图像,以在为空图像或污渍图像时,删除初始单字符图像;在初始单字符图像不为空图像和污渍图像时,确定初始单字符图像是否存在答卷预设辅助线,以在存在答卷预设辅助线时,去除当前灰度图中的答卷预设辅助线;获取初始单字符图像中字符的边界,进而基于边界,剪裁掉初始单字符图像中字符的背景;基于预设最小字符像素面积,获取初始单字符图像在灰度图中的相邻最小图像;其中,相邻最小图像至少分为:左最小字符像素面积图像、右最小字符像素面积图像、上最小字符像素面积图像和下最小字符像素面积图像;获取初始单字符图像的和相邻最小图像的主体部分;基于预设比对顺序,将初始单字符图像的主体部分依次与相邻最小图像的主体部分进行图像尺寸比对;确定初始单字符图像的主体部分与当前相邻最小图像的主体部分的图像尺寸比对结果是否满足预设拼接条件;当图像尺寸比对结果满足预设拼接条件时,将初始单字符图像与满足预设拼接条件的相邻最小图像拼接为最终单字符图像,并将满足预设拼接条件的相邻最小图像从对应的初始单字符图像中去除;当获取到满足预设拼接条件的相邻最小图像或依次比对完毕时,结束当前初始单字符图像的图像尺寸比对,获得最终单字符图像;对最终单字符图像进行背景填充处理,以将最终单字符图像的尺寸统一为预设标准规格,进而获得字符图像对应的单字符图像集。
进一步地,图像集获取单元包括辅助线确定单元,用于在初始单字符图像中存在横向或纵向贯穿整个初始单字符图像识别区域,且为宽度小于预设宽度阈值的连通区域时,确定连通区域为答卷预设辅助线。
本领域技术人员能够理解的是,本申请至少具有如下有益效果:
在答卷考生信息一致性校验过程中,能够对考生手写字符进行有效的拆分获得易识别单字符图像,并在OCR识别过程中聚合双神经网络模型进而提高识别效果。本发明实现的答卷手写信息OCR识别具有较高的准确率,能够降低一致性校验所需的人力物力,更好地服务于考试与测评行业。解决了当考生书写不规范或存在涂抹时,无法对OCR识别区域内每个字符进行精准定位或处理,进而影响识别效果的问题。
附图说明
下面参照附图来描述本公开的部分实施例,附图中:
图1是本申请实施例提供的一种基于OCR识别的答卷一致性校验方法流程图。
图2是本申请实施例提供的一种基于OCR识别的答卷一致性校验系统内部结构示意图。
具体实施方式
本领域技术人员应当理解的是,下文所描述的实施例仅仅是本公开的优选实施例,并不表示本公开仅能通过该优选实施例实现,该优选实施例仅仅是用于解释本公开的技术原理,并非用于限制本公开的保护范围。基于本公开提供的优选实施例,本领域普通技术人员在没有付出创造性劳动的情况下所获得的其它所有实施例,仍应落入到本公开的保护范围之内。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
下面通过附图对本申请实施例提出的技术方案进行详细的说明。
本申请实施例提供了一种基于OCR识别的答卷一致性校验方法,如图1所示,本申请实施例提供的方法,主要包括以下步骤:
步骤110、获取若干手写单字符样本图像,将手写单字符样本图像和样本实际字符导入神经网络模型,以获得预设数量个准确率大于预设准确率阈值的神经网络模型为识别模型。
需要说明的是,获取若干手写单字符样本图像的过程可以为步骤120中获取预设识别区域内的字符图像,进而获得字符图像对应的单字符图像集的方法。另外,OCR识别是对考生手写的包含个人信息的座号或考生号中一个或多个连续数字进行识别。
步骤120、扫描待处理答卷中预设识别区域,获取预设识别区域内的字符图像,进而获得字符图像对应的单字符图像集;将单字符图像集分别传入识别模型,确定输出值置信度高的作为识别结果;拼接答卷对应的识别结果,获得答卷对应的第一考生信息;扫描答卷二维码,进而从数据库中获取答卷二维码对应的第二考生信息。
需要说明的是,答卷可以为资格类或教育类考试答卷。
其中,获取预设识别区域内的字符图像,进而字符图像对应的单字符图像集,具体可以为:
(1)通过OCR识别技术,将字符图像二值化处理,以将字符图像构造为灰度图;基于灰度图中的像素数据,从灰度图中分割若干初始单字符图像;基于预设最小字符像素面积,确定初始单字符图像是否为空图像或污渍图像,以在为空图像或污渍图像时,删除初始单字符图像;在初始单字符图像不为空图像和污渍图像时,确定初始单字符图像是否存在答卷预设辅助线,以在存在答卷预设辅助线时,去除当前灰度图中的答卷预设辅助线(清除可能存在的扫描污线)。
需要补充说明的是,初始单字符图像的面积大于预设最小字符像素面积。计算二值化后图像中白色区域的像素值,即考生笔迹的面积,若小于预设最小字符像素面积,则认为图像为空或存在的仅仅是污渍点,从数据集中删除该图像;否则,对答卷图像上可能存在的答卷预设辅助线进行判断与清除。
作为示例地,上述,确定初始单字符图像是否存在答卷预设辅助线,具体过程可以为:
在初始单字符图像中存在横向或纵向贯穿整个初始单字符图像识别区域,且为宽度小于预设宽度阈值的连通区域时,确定连通区域为答卷预设辅助线。
上述从灰度图中分割若干初始单字符图中,“若干”的数量,可以预设考号位数或座号位数确定。
(2)获取初始单字符图像中字符的边界,进而基于边界,剪裁掉初始单字符图像中字符的背景;基于预设最小字符像素面积,获取初始单字符图像在灰度图中的相邻最小图像;获取初始单字符图像的和相邻最小图像的主体部分;基于预设比对顺序,将初始单字符图像的主体部分依次与相邻最小图像的主体部分进行图像尺寸比对;确定初始单字符图像的主体部分与当前相邻最小图像的主体部分的图像尺寸比对结果是否满足预设拼接条件;当图像尺寸比对结果满足预设拼接条件时,将初始单字符图像与满足预设拼接条件的相邻最小图像拼接为最终单字符图像,并将满足预设拼接条件的相邻最小图像从对应的初始单字符图像中去除。
需要补充说明的是,相邻最小图像至少分为:左(侧)最小字符像素面积图像、右(侧)最小字符像素面积图像、上(侧)最小字符像素面积图像和下(侧)最小字符像素面积图像。
作为示例地,上述,获取初始单字符图像中字符的边界,进而基于边界,剪裁掉初始单字符图像中字符的背景,具体过程可以为:
对初始单字符图像按列分割,以获得初始单字符图像中字符的左边界、右边界;基于左边界、右边界,剪切掉左右两侧背景;对初始单字符图像按行分割,以获得初始单字符图像中字符的上边界、下边界;基于上边界、下边界,剪切掉上下两侧背景。(具体地,若初始单字符图像的高度和宽度分别为h、w,将图像按列分割为column =[col1,col2,…,colw],计算每列中包含的白色像素值数目为column_area=[col_area1,col_area2,…,col_areaw],若第i列像素值coli>0,则认为该列属于图像内字符轮廓的一部分。当col_areai=0且col_areai+1>0时,coli为手写字符轮廓的左边界;当col_areaj>0且col_areaj+1=0时,colj为字符轮廓的右边界,以此依次找到图像内字符的左右边界。)
(3)当获取到满足预设拼接条件的相邻最小图像或依次比对完毕时,结束当前初始单字符图像的图像尺寸比对,获得最终单字符图像;对最终单字符图像进行背景填充处理,以将最终单字符图像的尺寸统一为预设标准规格,进而获得字符图像对应的单字符图像集。
作为示例地,上述,确定初始单字符图像的主体部分与当前相邻最小图像的主体部分的图像尺寸比对结果是否满足预设拼接条件,具体过程可以为:
获取初始单字符图像的主体部分A与相邻最小图像的主体部分B之间的字符间隔以及主体部分B的连通域形状区域和面积,当字符间隔小于主体部分A的高度或宽度的二分之一、主体部分B连通域形状区域的宽与高之比大于等于1.5且主体部分B的面积介于2/3*minsize与3*minsize之间时,确定满足预设拼接条件;其中,minsize表示预设最小字符像素面积。
具体过程可以为:设图像按行分割完成后有p个字符轮廓区域,即IMG=[img1,img2,…,imgp],分别计算每块所含的白色像素值即笔迹面积,为AREA=[area1,area2, …,areap],设其中第i块轮廓区域的笔迹面积最大,即max(AREA)= areai,则第i块区域imgi为该图像手写字符的主体部分。若i≠0,选取imgi-1,调用OpenCV的图像轮廓检测函数得到包覆imgi-1的最小外接矩形,若外接矩形宽与高之比大于等于1.5并且(2/3*minsize)<areai-1<(3*minsize)以及imgi-1与imgi的上下间隔小于imgi高度的二分之一,此时认为imgi-1与imgi为手写字符(例如,5)的上下两部分,将其纵向拼接的结果作为最终单字符图像;其他情况则认为imgi之外其他区域内的轮廓为污渍点并舍去。
作为示例地,上述,对最终单字符图像进行背景填充处理,具体过程可以为:
获取最终单字符图像的长宽比,以在最终单字符图像四周填充预设背景色,以将最终单字符图像的尺寸修正为预设尺寸。其中,预设尺寸可以为28*28像素,得到手写字符最小外接矩形图像,计算其长宽比,在左右或上下方填充背景色,使其成为标准正方形,以确保后续规范尺寸时不变形。在字符图像四周填充4个像素值的边界框,使手写字符处于图像中央且不紧贴边界。将字符图像统一处理成28*28的标准规格,进行后续神经网络模型训练。
另外,为了避免将连写的字符识别为单字符,本申请还包括:
确定当前单字符图像集中的单字符图像数量是否小于预设图像数量阈值;当小于预设图像数量阈值时,遍历获取单字符图像集中的每个单字符图像对应的字符宽度,将字符宽度超过预设宽度阈值的单字符图像拆分为两个字符,并更新单字符图像集。
步骤130、对第一考生信息与第二考生信息进行比对校验,以确定第一考生信息与第二考生信息是否一致。
除此之外,图2为本申请实施例提供的一种基于OCR识别的答卷一致性校验系统。如图2所示,本申请实施例提供的系统,主要包括:
获得模型模块210,用于获取若干手写单字符样本图像,将手写单字符样本图像和样本实际字符导入神经网络模型,以获得预设数量个准确率大于预设准确率阈值的神经网络模型为识别模型。
获得信息模块220,用于扫描待处理答卷中预设识别区域,获取预设识别区域内的字符图像,进而获得字符图像对应的单字符图像集;将单字符图像集分别传入识别模型,确定输出值置信度高的作为识别结果;拼接答卷对应的识别结果,获得答卷对应的第一考生信息;扫描答卷二维码,进而从数据库中获取答卷二维码对应的第二考生信息。
获得信息模块220包括图像集获取单元,用于通过OCR识别技术,将字符图像二值化处理,以将字符图像构造为灰度图;基于灰度图中的像素数据,从灰度图中分割若干初始单字符图像;基于预设最小字符像素面积,确定初始单字符图像是否为空图像或污渍图像,以在为空图像或污渍图像时,删除初始单字符图像;在初始单字符图像不为空图像和污渍图像时,确定初始单字符图像是否存在答卷预设辅助线,以在存在答卷预设辅助线时,去除当前灰度图中的答卷预设辅助线;获取初始单字符图像中字符的边界,进而基于边界,剪裁掉初始单字符图像中字符的背景;基于预设最小字符像素面积,获取初始单字符图像在灰度图中的相邻最小图像;其中,相邻最小图像至少分为:左最小字符像素面积图像、右最小字符像素面积图像、上最小字符像素面积图像和下最小字符像素面积图像;获取初始单字符图像的和相邻最小图像的主体部分;基于预设比对顺序,将初始单字符图像的主体部分依次与相邻最小图像的主体部分进行图像尺寸比对;确定初始单字符图像的主体部分与当前相邻最小图像的主体部分的图像尺寸比对结果是否满足预设拼接条件;当图像尺寸比对结果满足预设拼接条件时,将初始单字符图像与满足预设拼接条件的相邻最小图像拼接为最终单字符图像,并将满足预设拼接条件的相邻最小图像从对应的初始单字符图像中去除;当获取到满足预设拼接条件的相邻最小图像或依次比对完毕时,结束当前初始单字符图像的图像尺寸比对,获得最终单字符图像;对最终单字符图像进行背景填充处理,以将最终单字符图像的尺寸统一为预设标准规格,进而获得字符图像对应的单字符图像集。
另外,图像集获取单元包括辅助线确定单元,用于在初始单字符图像中存在横向或纵向贯穿整个初始单字符图像识别区域,且为宽度小于预设宽度阈值的连通区域时,确定连通区域为答卷预设辅助线。
校验信息模块230,用于对第一考生信息与第二考生信息进行比对校验,以确定第一考生信息与第二考生信息是否一致。
至此,已经结合前文的多个实施例描述了本公开的技术方案,但是,本领域技术人员容易理解的是,本公开的保护范围并不仅限于这些具体实施例。在不偏离本公开技术原理的前提下,本领域技术人员可以对上述各个实施例中的技术方案进行拆分和组合,也可以对相关技术特征作出等同的更改或替换,凡在本公开的技术构思和/或技术原理之内所做的任何更改、等同替换、改进等都将落入本公开的保护范围之内。
Claims (8)
1.一种基于OCR识别的答卷一致性校验方法,其特征在于,所述方法包括:
获取若干手写单字符样本图像,将手写单字符样本图像和样本实际字符导入神经网络模型,以获得预设数量个准确率大于预设准确率阈值的神经网络模型为识别模型;
扫描待处理答卷中预设识别区域,获取预设识别区域内的字符图像,进而获得字符图像对应的单字符图像集;具体包括:
通过OCR识别技术,将字符图像二值化处理,以将字符图像构造为灰度图;基于灰度图中的像素数据,从灰度图中分割若干初始单字符图像;基于预设最小字符像素面积,确定初始单字符图像是否为空图像或污渍图像,以在为空图像或污渍图像时,删除初始单字符图像;在初始单字符图像不为空图像和污渍图像时,确定初始单字符图像是否存在答卷预设辅助线,以在存在答卷预设辅助线时,去除当前灰度图中的答卷预设辅助线;获取初始单字符图像中字符的边界,进而基于边界,剪裁掉初始单字符图像中字符的背景;基于预设最小字符像素面积,获取初始单字符图像在灰度图中的相邻最小图像;其中,相邻最小图像至少分为:左最小字符像素面积图像、右最小字符像素面积图像、上最小字符像素面积图像和下最小字符像素面积图像;获取初始单字符图像的和相邻最小图像的主体部分;基于预设比对顺序,将初始单字符图像的主体部分依次与相邻最小图像的主体部分进行图像尺寸比对;确定初始单字符图像的主体部分与当前相邻最小图像的主体部分的图像尺寸比对结果是否满足预设拼接条件;当图像尺寸比对结果满足预设拼接条件时,将初始单字符图像与满足预设拼接条件的相邻最小图像拼接为最终单字符图像,并将满足预设拼接条件的相邻最小图像从对应的初始单字符图像中去除;当获取到满足预设拼接条件的相邻最小图像或依次比对完毕时,结束当前初始单字符图像的图像尺寸比对,获得最终单字符图像;对最终单字符图像进行背景填充处理,以将最终单字符图像的尺寸统一为预设标准规格,进而获得字符图像对应的单字符图像集;
将单字符图像集分别传入识别模型,确定输出值置信度高的作为识别结果;拼接答卷对应的识别结果,获得答卷对应的第一考生信息;扫描答卷二维码,进而从数据库中获取答卷二维码对应的第二考生信息;
对第一考生信息与第二考生信息进行比对校验,以确定第一考生信息与第二考生信息是否一致。
2.根据权利要求1所述的基于OCR识别的答卷一致性校验方法,其特征在于,确定初始单字符图像是否存在答卷预设辅助线,具体包括:
在初始单字符图像中存在横向或纵向贯穿整个初始单字符图像识别区域,且为宽度小于预设宽度阈值的连通区域时,确定连通区域为答卷预设辅助线。
3.根据权利要求1所述的基于OCR识别的答卷一致性校验方法,其特征在于,获取初始单字符图像中字符的边界,进而基于边界,剪裁掉初始单字符图像中字符的背景,具体包括:
对初始单字符图像按列分割,以获得初始单字符图像中字符的左边界、右边界;基于左边界、右边界,剪切掉左右两侧背景;
对初始单字符图像按行分割,以获得初始单字符图像中字符的上边界、下边界;基于上边界、下边界,剪切掉上下两侧背景。
4.根据权利要求1所述的基于OCR识别的答卷一致性校验方法,其特征在于,确定初始单字符图像的主体部分与当前相邻最小图像的主体部分的图像尺寸比对结果是否满足预设拼接条件,具体包括:
获取初始单字符图像的主体部分A与相邻最小图像的主体部分B之间的字符间隔以及主体部分B的连通域形状区域和面积,当字符间隔小于主体部分A的高度或宽度的二分之一、主体部分B连通域形状区域的宽与高之比大于等于1.5且主体部分B的面积介于2/3*minsize与3*minsize之间时,确定满足预设拼接条件;其中,minsize表示预设最小字符像素面积。
5.根据权利要求1所述的基于OCR识别的答卷一致性校验方法,其特征在于,对最终单字符图像进行背景填充处理,具体包括:
获取最终单字符图像的长宽比,以在最终单字符图像四周填充预设背景色,以将最终单字符图像的尺寸修正为预设尺寸。
6.根据权利要求1所述的基于OCR识别的答卷一致性校验方法,其特征在于,所述方法还包括:
确定当前单字符图像集中的单字符图像数量是否小于预设图像数量阈值;
当小于预设图像数量阈值时,遍历获取单字符图像集中的每个单字符图像对应的字符宽度,将字符宽度超过预设宽度阈值的单字符图像拆分为两个字符,并更新单字符图像集。
7.一种基于OCR识别的答卷一致性校验系统,其特征在于,所述系统包括:
获得模型模块,用于获取若干手写单字符样本图像,将手写单字符样本图像和样本实际字符导入神经网络模型,以获得预设数量个准确率大于预设准确率阈值的神经网络模型为识别模型;
获得信息模块,用于扫描待处理答卷中预设识别区域,获取预设识别区域内的字符图像,进而获得字符图像对应的单字符图像集;将单字符图像集分别传入识别模型,确定输出值置信度高的作为识别结果;拼接答卷对应的识别结果,获得答卷对应的第一考生信息;扫描答卷二维码,进而从数据库中获取答卷二维码对应的第二考生信息;
其中,获得信息模块包括图像集获取单元,
用于通过OCR识别技术,将字符图像二值化处理,以将字符图像构造为灰度图;基于灰度图中的像素数据,从灰度图中分割若干初始单字符图像;基于预设最小字符像素面积,确定初始单字符图像是否为空图像或污渍图像,以在为空图像或污渍图像时,删除初始单字符图像;在初始单字符图像不为空图像和污渍图像时,确定初始单字符图像是否存在答卷预设辅助线,以在存在答卷预设辅助线时,去除当前灰度图中的答卷预设辅助线;获取初始单字符图像中字符的边界,进而基于边界,剪裁掉初始单字符图像中字符的背景;基于预设最小字符像素面积,获取初始单字符图像在灰度图中的相邻最小图像;其中,相邻最小图像至少分为:左最小字符像素面积图像、右最小字符像素面积图像、上最小字符像素面积图像和下最小字符像素面积图像;获取初始单字符图像的和相邻最小图像的主体部分;基于预设比对顺序,将初始单字符图像的主体部分依次与相邻最小图像的主体部分进行图像尺寸比对;确定初始单字符图像的主体部分与当前相邻最小图像的主体部分的图像尺寸比对结果是否满足预设拼接条件;当图像尺寸比对结果满足预设拼接条件时,将初始单字符图像与满足预设拼接条件的相邻最小图像拼接为最终单字符图像,并将满足预设拼接条件的相邻最小图像从对应的初始单字符图像中去除;当获取到满足预设拼接条件的相邻最小图像或依次比对完毕时,结束当前初始单字符图像的图像尺寸比对,获得最终单字符图像;对最终单字符图像进行背景填充处理,以将最终单字符图像的尺寸统一为预设标准规格,进而获得字符图像对应的单字符图像集;
校验信息模块,用于对第一考生信息与第二考生信息进行比对校验,以确定第一考生信息与第二考生信息是否一致。
8.根据权利要求7所述的基于OCR识别的答卷一致性校验系统,其特征在于,图像集获取单元包括辅助线确定单元,
用于在初始单字符图像中存在横向或纵向贯穿整个初始单字符图像识别区域,且为宽度小于预设宽度阈值的连通区域时,确定连通区域为答卷预设辅助线。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410289128.8A CN117894033B (zh) | 2024-03-14 | 2024-03-14 | 一种基于ocr识别的答卷一致性校验方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410289128.8A CN117894033B (zh) | 2024-03-14 | 2024-03-14 | 一种基于ocr识别的答卷一致性校验方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117894033A CN117894033A (zh) | 2024-04-16 |
CN117894033B true CN117894033B (zh) | 2024-05-28 |
Family
ID=90642799
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410289128.8A Active CN117894033B (zh) | 2024-03-14 | 2024-03-14 | 一种基于ocr识别的答卷一致性校验方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117894033B (zh) |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013039063A1 (ja) * | 2011-09-15 | 2013-03-21 | 国立大学法人大阪教育大学 | 答案処理装置、答案処理方法、記録媒体、およびシール |
CN107506762A (zh) * | 2017-09-01 | 2017-12-22 | 昆山中骏博研互联网科技有限公司 | 一种基于图像分析的成绩自动录入方法 |
CN109871525A (zh) * | 2019-02-18 | 2019-06-11 | 南京红松信息技术有限公司 | 一种易于ocr识别的印刷排版的批阅系统及实现方法 |
JP2019133289A (ja) * | 2018-01-30 | 2019-08-08 | 富士通株式会社 | 画像処理プログラム、画像処理方法および画像処理装置 |
CN110458014A (zh) * | 2019-07-05 | 2019-11-15 | 深圳中兴网信科技有限公司 | 答题卡识读方法、装置和计算机可读存储介质 |
CN111291591A (zh) * | 2018-12-07 | 2020-06-16 | 绍兴凯迪德斯光电科技有限公司 | 一种试卷智能批阅打印方法及装置 |
CN111553211A (zh) * | 2020-04-16 | 2020-08-18 | 深圳中兴网信科技有限公司 | 试卷答案识别方法、系统、装置和计算机可读存储介质 |
CN112651323A (zh) * | 2020-12-22 | 2021-04-13 | 山东山大鸥玛软件股份有限公司 | 一种基于文本行检测的中文手写体识别方法及系统 |
CN115880566A (zh) * | 2022-12-16 | 2023-03-31 | 李宜义 | 一种基于视觉分析的智能阅卷系统 |
KR102544129B1 (ko) * | 2022-07-11 | 2023-06-16 | 주식회사 엠엔씨에이프로 | Omr 기반 답안 채점 서비스 제공 시스템 |
CN116798036A (zh) * | 2023-06-27 | 2023-09-22 | 广州市南方人力资源评价中心有限公司 | 用于识别和校验答题卡客观题识别结果的方法及装置 |
CN117275027A (zh) * | 2023-10-07 | 2023-12-22 | 广东德诚科教有限公司 | 一种用于识别检查的扫描校验系统、方法及电子设备 |
-
2024
- 2024-03-14 CN CN202410289128.8A patent/CN117894033B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013039063A1 (ja) * | 2011-09-15 | 2013-03-21 | 国立大学法人大阪教育大学 | 答案処理装置、答案処理方法、記録媒体、およびシール |
CN107506762A (zh) * | 2017-09-01 | 2017-12-22 | 昆山中骏博研互联网科技有限公司 | 一种基于图像分析的成绩自动录入方法 |
JP2019133289A (ja) * | 2018-01-30 | 2019-08-08 | 富士通株式会社 | 画像処理プログラム、画像処理方法および画像処理装置 |
CN111291591A (zh) * | 2018-12-07 | 2020-06-16 | 绍兴凯迪德斯光电科技有限公司 | 一种试卷智能批阅打印方法及装置 |
CN109871525A (zh) * | 2019-02-18 | 2019-06-11 | 南京红松信息技术有限公司 | 一种易于ocr识别的印刷排版的批阅系统及实现方法 |
CN110458014A (zh) * | 2019-07-05 | 2019-11-15 | 深圳中兴网信科技有限公司 | 答题卡识读方法、装置和计算机可读存储介质 |
CN111553211A (zh) * | 2020-04-16 | 2020-08-18 | 深圳中兴网信科技有限公司 | 试卷答案识别方法、系统、装置和计算机可读存储介质 |
CN112651323A (zh) * | 2020-12-22 | 2021-04-13 | 山东山大鸥玛软件股份有限公司 | 一种基于文本行检测的中文手写体识别方法及系统 |
KR102544129B1 (ko) * | 2022-07-11 | 2023-06-16 | 주식회사 엠엔씨에이프로 | Omr 기반 답안 채점 서비스 제공 시스템 |
CN115880566A (zh) * | 2022-12-16 | 2023-03-31 | 李宜义 | 一种基于视觉分析的智能阅卷系统 |
CN116798036A (zh) * | 2023-06-27 | 2023-09-22 | 广州市南方人力资源评价中心有限公司 | 用于识别和校验答题卡客观题识别结果的方法及装置 |
CN117275027A (zh) * | 2023-10-07 | 2023-12-22 | 广东德诚科教有限公司 | 一种用于识别检查的扫描校验系统、方法及电子设备 |
Non-Patent Citations (4)
Title |
---|
Mahesh Jangid.Accuracy Enhancement of Devanagari Character Recognition by Gray level Normalization.ICCCNT '16: Proceedings of the 7th International Conference on Computing Communication and Networking Technologies.2016,全文. * |
基于文字识别并拓展多种功能的app设计;侯铮云;;中国新通信;20181020(第20期);全文 * |
基于视觉的答题卡自动判分系统设计;程淑红;尚果超;;计量学报;20181122(第06期);全文 * |
手写识别技术在网上阅卷系统中的应用;杜文龙;毛学军;;电脑学习;20100201(第01期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN117894033A (zh) | 2024-04-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110766014B (zh) | 票据信息定位方法、系统及计算机可读存储介质 | |
CN110008933B (zh) | 一种通用智能阅卷系统和方法 | |
CN105913093A (zh) | 一种用于文字识别处理的模板匹配方法 | |
CN110728687B (zh) | 文件图像分割方法、装置、计算机设备和存储介质 | |
CN111737478B (zh) | 文本检测方法、电子设备及计算机可读介质 | |
CN110414563A (zh) | 考试成绩统计方法、系统及计算机可读存储介质 | |
CN112507758A (zh) | 答题卡字符串识别方法、装置、终端和计算机存储介质 | |
CN110647885B (zh) | 基于图片识别的试卷拆分方法、装置、设备以及介质 | |
CN113762274B (zh) | 一种答题卡目标区域检测方法、系统、存储介质及设备 | |
CN112446259A (zh) | 图像处理方法、装置、终端和计算机可读存储介质 | |
CN111046644A (zh) | 一种答题卡模板生成方法、识别方法、装置及存储介质 | |
CN111126266B (zh) | 文本处理方法、文本处理系统、设备及介质 | |
CN111008594A (zh) | 改错题评阅方法、相关设备及可读存储介质 | |
CN112836541B (zh) | 一种香烟32位条码的自动采集及识别方法及装置 | |
CA2109002C (en) | Method and apparatus for verifying a container code | |
CN117894033B (zh) | 一种基于ocr识别的答卷一致性校验方法及系统 | |
CN109635798B (zh) | 一种信息提取方法及装置 | |
WO1994010654A9 (en) | A method and apparatus for verifying a container code | |
KR100957508B1 (ko) | 광학 문자 인식 시스템 및 방법 | |
CN113239893B (zh) | 一种文档录入复核方法、系统、电子设备及介质 | |
CN110895849A (zh) | 冠字号切割定位方法、装置、计算机设备及存储介质 | |
CN113837119A (zh) | 一种基于灰度图像识别易混淆字符的方法及设备 | |
JP4492258B2 (ja) | 文字・図形の認識方法および検査方法 | |
CN110826400B (zh) | 图片表格用户交互增强识别的方法 | |
CN118279923B (zh) | 基于深度学习训练的图片文字识别方法、系统及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |