CN117495950B - 一种基于密度聚类的试卷密封线定位方法及系统 - Google Patents
一种基于密度聚类的试卷密封线定位方法及系统 Download PDFInfo
- Publication number
- CN117495950B CN117495950B CN202311839463.2A CN202311839463A CN117495950B CN 117495950 B CN117495950 B CN 117495950B CN 202311839463 A CN202311839463 A CN 202311839463A CN 117495950 B CN117495950 B CN 117495950B
- Authority
- CN
- China
- Prior art keywords
- coordinate
- picture
- test paper
- line
- sealing line
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000007789 sealing Methods 0.000 title claims abstract description 170
- 238000012360 testing method Methods 0.000 title claims abstract description 159
- 238000000034 method Methods 0.000 title claims abstract description 42
- 238000012937 correction Methods 0.000 claims abstract description 23
- 238000012935 Averaging Methods 0.000 claims abstract description 14
- 238000012216 screening Methods 0.000 claims description 10
- 238000004364 calculation method Methods 0.000 claims description 4
- 238000001514 detection method Methods 0.000 claims description 4
- 238000013450 outlier detection Methods 0.000 claims description 4
- 239000006185 dispersion Substances 0.000 description 2
- 238000012552 review Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/761—Proximity, similarity or dissimilarity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/762—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using clustering, e.g. of similar faces in social networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于密度聚类的试卷密封线定位方法及系统,涉及密封线识别技术领域,包括:获取原始试卷图片;对原始试卷图片进行倾斜校正,得到校正试卷图片;设定一识别间距;纵向划分出若干个Y向待识别图片;对每个Y向待识别图片进行相似度匹配,获得试卷密封线初步定位图片;在试卷密封线初步定位图片中随机横向分散切割出多个X坐标校验区域;获得X坐标集合;剔除X坐标集合中的离群点,得到有效X坐标集合;对有效X坐标集合中的所有X坐标值求平均值获得密封线X坐标。本发明的优点在于:有效的保证密封线X坐标定位精准度,进行裁切或遮挡考生信息区域时,可有效的在隐去考生信息的同时不遮挡考生答案,提高阅卷效率。
Description
技术领域
本发明涉及密封线识别技术领域,具体是涉及一种基于密度聚类的试卷密封线定位方法及系统。
背景技术
电子阅卷系统是指在考生答卷之后,通过高速扫描仪将考生答卷扫描到系统中,并进行试卷分割进行阅卷,为保证阅卷的公正,需要识别答题纸上密封线的位置,根据位置自动裁切或遮挡密封线区域,隐去考生信息,方便评卷老师评卷。
现有的试卷密封线识别方法为通过试卷标准设定一确定的坐标值,进行密封线区域的裁切或遮挡,但是试卷由于试卷印刷质量的参差不齐,在实际的阅卷过程中,存在着试卷密封线印刷误差,导致密封线区域的裁切或遮挡时易出现泄露考生信息或遮挡考生答案的问题。
发明内容
为解决上述技术问题,提供一种基于密度聚类的试卷密封线定位方法及系统,本技术方案解决了上述的现有技术在进行密封线区域的裁切或遮挡时易出现泄露考生信息或遮挡考生答案的问题。
为达到以上目的,本发明采用的技术方案为:
一种基于密度聚类的试卷密封线定位方法,包括:
获取扫描仪扫描的试卷图片,记为原始试卷图片;
基于基准坐标系,对原始试卷图片进行倾斜校正,得到校正试卷图片;
设定一识别间距;
在密封线识别区间内,按照识别间距,纵向划分出若干个Y向待识别图片;
设定一试卷密封线标准图片;
对每个Y向待识别图片与试卷密封线标准图片进行相似度匹配,获得试卷密封线初步定位图片;
在试卷密封线初步定位图片中随机横向分散切割出多个区域,记为X坐标校验区域;
针对每个X坐标校验区域逐像素检测密封线点位X坐标值,所有区域内密封线X坐标值组成X坐标集合;
针对X坐标集合基于Grubbs检验算法计算点位集合中各点位的密集程度及离群点位,剔除X坐标集合中的离群点,得到有效X坐标集合;
对有效X坐标集合中的所有X坐标值求平均值获得密封线X坐标;
在校正试卷图片中将密封线X坐标左侧或右侧的区域裁切或遮挡。
优选的,所述对每个Y向待识别图片与试卷密封线标准图片进行相似度匹配,获得试卷密封线初步定位图片具体包括:
基于所有识别出的历史密封线X坐标求平均值,获得密封线初始识别坐标;
获取每个Y向待识别图片中心线的X坐标;
采用密封线相似匹配算法,确定每个Y向待识别图片与试卷密封线标准图片之间的图片相似指标;
基于图片相似指标、密封线初始识别坐标和Y向待识别图片中心线的X坐标,通过综合拟合公式,计算Y向待识别图片的密封线综合拟合指标;
筛选出密封线综合拟合指标最小的Y向待识别图片,作为试卷密封线初步定位图片;
其中,所述综合拟合公式具体为:
式中, 为第i个Y向待识别图片的密封线综合拟合指标, />为第i个Y向待识别图片与试卷密封线标准图片之间的图片相似指标, />为第i个Y向待识别图片中心线的X坐标,/>为密封线初始识别坐标,/>为距离修正权重。
优选的,所述密封线相似匹配算法具体为:
将Y向待识别图片和试卷密封线标准图片按照相同的划分逻辑,划分出若干个相似匹配区域;
分别计算每个相似匹配区域内,Y向待识别图片中的疑似试卷密封线像素点和试卷密封线标准图片中的试卷密封线像素点之间的X坐标差;
将所有的X坐标差求取标准差,以该标准差作为Y向待识别图片与试卷密封线标准图片之间的图片相似指标。
优选的,所述在试卷密封线初步定位图片中随机横向分散切割出多个区域,记为X坐标校验区域具体包括:
将试卷密封线初步定位图片反面横向分散切割出多个区域,所述区域数量至少为10个,所述区域的截取高度为20像素。
优选的,所述针对X坐标集合基于Grubbs检验算法计算点位集合中各点位的密集程度及离群点位,剔除X坐标集合中的离群点,得到有效X坐标集合具体包括:
对于X坐标集合中的每个密封线X坐标值,计算Z分数;
构建离群点判定公式;
判定X坐标集合中的密封线X坐标值的Z分数是否满足离群点判定公式,若是,则判定该密封线X坐标值为X坐标集合中的离群点,若否,则判定该密封线X坐标值不是X坐标集合中的离群点;
将所有离群点剔除,得到有效X坐标集合;
其中,所述离群点判定公式为:
式中, 为X坐标集合中的密封线X坐标值的Z分数,/>是显著水平/>下的t-分布的值,N是X坐标集合中的密封线X坐标值总数量。
优选的,所述Z分数的计算公式为:
式中, 为X坐标集合中的第j个密封线X坐标值的Z分数, />为X坐标集合中的第j个密封线X坐标值, />为X坐标集合中的所有密封线X坐标值的平均值, />为X坐标集合中的所有密封线X坐标值的标准差。
进一步的,提出一种基于密度聚类的试卷密封线定位系统,用于实现如上述的基于密度聚类的试卷密封线定位方法,包括:
扫描仪,所述扫描仪用于扫描试卷图片,获得原始试卷图片;
倾斜校正模块,所述倾斜校正模块与所述扫描仪电性连接,所述倾斜校正模块用于基于基准坐标系,对原始试卷图片进行倾斜校正,得到校正试卷图片;
初定位模块,所述初定位模块与所述倾斜校正模块电性连接,所述初定位模块用于设定一识别间距,在密封线识别区间内,按照识别间距,纵向划分出若干个Y向待识别图片,并对每个Y向待识别图片与试卷密封线标准图片进行相似度匹配,获得试卷密封线初步定位图片;
密封线坐标定位模块,所述密封线坐标定位模块与所述初定位模块电性连接,所述密封线坐标定位模块用于在试卷密封线初步定位图片中随机横向分散切割出多个区域,记为X坐标校验区域,针对每个X坐标校验区域逐像素检测密封线点位X坐标值,所有区域内密封线X坐标值组成X坐标集合,针对X坐标集合基于Grubbs检验算法计算点位集合中各点位的密集程度及离群点位,剔除X坐标集合中的离群点,得到有效X坐标集合,对有效X坐标集合中的所有X坐标值求平均值获得密封线X坐标;
裁切模块,所述裁切模块与所述密封线坐标定位模块电性连接,所述裁切模块用于在校正试卷图片中将密封线X坐标左侧或右侧的区域裁切或遮挡。
可选的,所述初定位模块包括:
第一划分单元,所述第一划分单元用于设定一识别间距,并在密封线识别区间内,按照识别间距,纵向划分出若干个Y向待识别图片;
历史分析单元,所述历史分析单元用于基于所有识别出的历史密封线X坐标求平均值,获得密封线初始识别坐标;
图片定位单元,所述图片定位单元用于获取每个Y向待识别图片中心线的X坐标;
图片相似匹配单元,所述图片相似匹配单元用于采用密封线相似匹配算法,确定每个Y向待识别图片与试卷密封线标准图片之间的图片相似指标;
综合拟合单元,所述综合拟合单元用于基于图片相似指标、密封线初始识别坐标和Y向待识别图片中心线的X坐标,通过综合拟合公式,计算Y向待识别图片的密封线综合拟合指标;
筛选单元,所述筛选单元用于筛选出密封线综合拟合指标最小的Y向待识别图片,作为试卷密封线初步定位图片。
可选的,所述密封线坐标定位模块包括:
第二划分单元,所述第二划分单元用于在试卷密封线初步定位图片中随机横向分散切割出多个区域,记为X坐标校验区域;
坐标采集单元,所述坐标采集单元用于针对每个X坐标校验区域逐像素检测密封线点位X坐标值,所有区域内密封线X坐标值组成X坐标集合;
离群检测单元,所述离群检测单元用于针对X坐标集合基于Grubbs检验算法计算点位集合中各点位的密集程度及离群点位,剔除X坐标集合中的离群点,得到有效X坐标集合;
坐标确定单元,所述坐标确定单元用于对有效X坐标集合中的所有X坐标值求平均值获得密封线X坐标。
与现有技术相比,本发明的有益效果在于:
本发明提出一种基于密度聚类的试卷密封线定位方法,通过图像拟合结合坐标距离进行综合确定试卷中的密封线大致位置,之后基于密度聚类识别算法,剔除出密封线X坐标值中的离群点,得到有效X坐标集合,以所有有效X坐标的平均值作为识别出的密封线X坐标,有效的保证密封线X坐标定位精准度,以该密封线X坐标进行裁切或遮挡密封线X坐标左侧或右侧的区域,可有效的在隐去考生信息的同时不遮挡考生答案,提高阅卷效率。
附图说明
图1为本发明提出的基于密度聚类的试卷密封线定位方法流程图;
图2为本发明中的获得试卷密封线初步定位图片的方法流程图;
图3为本发明中的密封线相似匹配算法的方法流程图;
图4为本发明中的得到有效X坐标集合的方法流程图;
图5为本发明提出的基于密度聚类的试卷密封线定位系统结构框图。
具体实施方式
以下描述用于揭露本发明以使本领域技术人员能够实现本发明。以下描述中的优选实施例只作为举例,本领域技术人员可以想到其他显而易见的变型。
参照图1所示,一种基于密度聚类的试卷密封线定位方法,包括:
获取扫描仪扫描的试卷图片,记为原始试卷图片;
基于基准坐标系,对原始试卷图片进行倾斜校正,得到校正试卷图片;
设定一识别间距;
在密封线识别区间内,按照识别间距,纵向划分出若干个Y向待识别图片,其中密封线识别区间由密封线的历史印刷精准度决定,根据密封线的印刷设计位置,向右或向左偏移最大历史印刷误差值,该区间为密封线识别区间;
设定一试卷密封线标准图片;
对每个Y向待识别图片与试卷密封线标准图片进行相似度匹配,获得试卷密封线初步定位图片;
在试卷密封线初步定位图片中随机横向分散切割出多个区域,记为X坐标校验区域;
针对每个X坐标校验区域逐像素检测密封线点位X坐标值,所有区域内密封线X坐标值组成X坐标集合;
针对X坐标集合基于Grubbs检验算法计算点位集合中各点位的密集程度及离群点位,剔除X坐标集合中的离群点,得到有效X坐标集合;
对有效X坐标集合中的所有X坐标值求平均值获得密封线X坐标;
在校正试卷图片中将密封线X坐标左侧或右侧的区域裁切或遮挡。
本方案通过图像拟合结合坐标距离进行综合确定试卷中的密封线大致位置,之后基于密度聚类识别算法,剔除出密封线X坐标值中的离群点,得到有效X坐标集合,以所有有效X坐标的平均值作为识别出的密封线X坐标,有效的保证密封线X坐标定位精准度。
参照图2所示,对每个Y向待识别图片与试卷密封线标准图片进行相似度匹配,获得试卷密封线初步定位图片具体包括:
基于所有识别出的历史密封线X坐标求平均值,获得密封线初始识别坐标;
获取每个Y向待识别图片中心线的X坐标;
采用密封线相似匹配算法,确定每个Y向待识别图片与试卷密封线标准图片之间的图片相似指标;
基于图片相似指标、密封线初始识别坐标和Y向待识别图片中心线的X坐标,通过综合拟合公式,计算Y向待识别图片的密封线综合拟合指标;
筛选出密封线综合拟合指标最小的Y向待识别图片,作为试卷密封线初步定位图片;
其中,综合拟合公式具体为:
式中, 为第i个Y向待识别图片的密封线综合拟合指标, />为第i个Y向待识别图片与试卷密封线标准图片之间的图片相似指标, />为第i个Y向待识别图片中心线的X坐标,/>为密封线初始识别坐标, />为距离修正权重,/>由印刷机印刷精度确定,印刷机印刷精度越高,则密封线的印刷误差越小,密封线的位置偏差对于密封线的识别影响度越大, />越大。
可以理解的是,虽然因为试卷的印刷质量问题难以保证密封线的精准印刷位置,但是密封线的印刷范围是在一定误差之类的,基于此,本方案中通过结合基于图片相似指标、密封线初始识别坐标和Y向待识别图片中心线的X坐标进行综合筛选出,位置以及相似度与试卷密封线标准最接近的Y向待识别图片作为试卷密封线初步定位图片,可有效的保证密封线识别精准度。
参照图3所示,密封线相似匹配算法具体为:
将Y向待识别图片和试卷密封线标准图片按照相同的划分逻辑,划分出若干个相似匹配区域;
分别计算每个相似匹配区域内,Y向待识别图片中的疑似试卷密封线像素点和试卷密封线标准图片中的试卷密封线像素点之间的X坐标差;
将所有的X坐标差求取标准差,以该标准差作为Y向待识别图片与试卷密封线标准图片之间的图片相似指标。
可以理解的是,由于印刷误差,试卷密封线往往难以保证在Y向待识别图片的正中心,本方案中,通过计算Y向待识别图片中的疑似试卷密封线像素点和试卷密封线标准图片中的试卷密封线像素点之间的X坐标差的离散程度作为图片相似指标,该图片相似指标越小,则说明Y向待识别图片中的疑似试卷密封线与试卷密封线的平行度越高,该Y向待识别图片中的疑似试卷密封线实际为试卷密封线的概率越大。
在一些实施例中,在试卷密封线初步定位图片中随机横向分散切割出多个区域,记为X坐标校验区域具体为:
将试卷密封线初步定位图片反面横向分散切割出多个区域,区域数量至少为10个,区域的截取高度为20像素。
本领域的技术人员可以理解的是,X坐标校验区域的数量越多,则进行定位时的数据样本越大,定位精准度越高,但是定位耗时越长,基于本方案的具体实施情况,将X坐标校验区域设定为10个可基本满足定位需求,因此,在本方案的一些优选实施例中,将X坐标校验区域设定为15个,可有效的兼顾定位精准度和定位效率。
参照图4所示,针对X坐标集合基于Grubbs检验算法计算点位集合中各点位的密集程度及离群点位,剔除X坐标集合中的离群点,得到有效X坐标集合具体包括:
对于X坐标集合中的每个密封线X坐标值,计算Z分数;
构建离群点判定公式;
判定X坐标集合中的密封线X坐标值的Z分数是否满足离群点判定公式,若是,则判定该密封线X坐标值为X坐标集合中的离群点,若否,则判定该密封线X坐标值不是X坐标集合中的离群点;
将所有离群点剔除,得到有效X坐标集合;
其中,离群点判定公式为:
式中,为X坐标集合中的密封线X坐标值的Z分数, />是显著水平 下的t-分布的值,N是X坐标集合中的密封线X坐标值总数量。
Z分数的计算公式为:
式中, 为X坐标集合中的第j个密封线X坐标值的Z分数,/>为X坐标集合中的第j个密封线X坐标值, />为X坐标集合中的所有密封线X坐标值的平均值, />为X坐标集合中的所有密封线X坐标值的标准差。
可以理解的是,在密封线印刷过程中,由于受印刷机印刷精度的影响,往往会导致密封线印刷出现偏差点,这些偏差点在进行密封线定位计算时会对密封线的X坐标产生较大的误差影响,为剔除这些偏差点,本方案中基于Grubbs检验算法,对X坐标集合中的点位的密集程度及离群点位进行识别计算,对X坐标集合中的离群点进行剔除,进而降低偏差点对于密封线定位的影响,进而有效的提高密封线X坐标定位精准度,可有效的在隐去考生信息的同时不遮挡考生答案,提高阅卷效率。
进一步的,参照图5所示,基于与上述基于密度聚类的试卷密封线定位方法相同的发明构思,本方案提出一种基于密度聚类的试卷密封线定位系统,包括:
扫描仪,扫描仪用于扫描试卷图片,获得原始试卷图片;
倾斜校正模块,倾斜校正模块与扫描仪电性连接,倾斜校正模块用于基于基准坐标系,对原始试卷图片进行倾斜校正,得到校正试卷图片;
初定位模块,初定位模块与倾斜校正模块电性连接,初定位模块用于设定一识别间距,在密封线识别区间内,按照识别间距,纵向划分出若干个Y向待识别图片,并对每个Y向待识别图片与试卷密封线标准图片进行相似度匹配,获得试卷密封线初步定位图片;
密封线坐标定位模块,密封线坐标定位模块与初定位模块电性连接,密封线坐标定位模块用于在试卷密封线初步定位图片中随机横向分散切割出多个区域,记为X坐标校验区域,针对每个X坐标校验区域逐像素检测密封线点位X坐标值,所有区域内密封线X坐标值组成X坐标集合,针对X坐标集合基于Grubbs检验算法计算点位集合中各点位的密集程度及离群点位,剔除X坐标集合中的离群点,得到有效X坐标集合,对有效X坐标集合中的所有X坐标值求平均值获得密封线X坐标;
裁切模块,裁切模块与密封线坐标定位模块电性连接,裁切模块用于在校正试卷图片中将密封线X坐标左侧或右侧的区域裁切或遮挡。
初定位模块包括:
第一划分单元,第一划分单元用于设定一识别间距,并在密封线识别区间内,按照识别间距,纵向划分出若干个Y向待识别图片;
历史分析单元,历史分析单元用于基于所有识别出的历史密封线X坐标求平均值,获得密封线初始识别坐标;
图片定位单元,图片定位单元用于获取每个Y向待识别图片中心线的X坐标;
图片相似匹配单元,图片相似匹配单元用于采用密封线相似匹配算法,确定每个Y向待识别图片与试卷密封线标准图片之间的图片相似指标;
综合拟合单元,综合拟合单元用于基于图片相似指标、密封线初始识别坐标和Y向待识别图片中心线的X坐标,通过综合拟合公式,计算Y向待识别图片的密封线综合拟合指标;
筛选单元,筛选单元用于筛选出密封线综合拟合指标最小的Y向待识别图片,作为试卷密封线初步定位图片。
密封线坐标定位模块包括:
第二划分单元,第二划分单元用于在试卷密封线初步定位图片中随机横向分散切割出多个区域,记为X坐标校验区域;
坐标采集单元,坐标采集单元用于针对每个X坐标校验区域逐像素检测密封线点位X坐标值,所有区域内密封线X坐标值组成X坐标集合;
离群检测单元,离群检测单元用于针对X坐标集合基于Grubbs检验算法计算点位集合中各点位的密集程度及离群点位,剔除X坐标集合中的离群点,得到有效X坐标集合;
坐标确定单元,坐标确定单元用于对有效X坐标集合中的所有X坐标值求平均值获得密封线X坐标。
上述基于密度聚类的试卷密封线定位系统的使用过程为:
步骤一:扫描仪扫描试卷图片,获得原始试卷图片;
步骤二:倾斜校正模块基于基准坐标系,对原始试卷图片进行倾斜校正,得到校正试卷图片;
步骤三:第一划分单元设定一识别间距,并在密封线识别区间内,按照识别间距,纵向划分出若干个Y向待识别图片;
步骤四:历史分析单元基于所有识别出的历史密封线X坐标求平均值,获得密封线初始识别坐标;
步骤五:图片定位单元获取每个Y向待识别图片中心线的X坐标;
步骤六:图片相似匹配单元采用密封线相似匹配算法,确定每个Y向待识别图片与试卷密封线标准图片之间的图片相似指标;
步骤七:综合拟合单元基于图片相似指标、密封线初始识别坐标和Y向待识别图片中心线的X坐标,通过综合拟合公式,计算Y向待识别图片的密封线综合拟合指标;
步骤八:筛选单元筛选出密封线综合拟合指标最小的Y向待识别图片,作为试卷密封线初步定位图片;
步骤九:第二划分单元在试卷密封线初步定位图片中随机横向分散切割出多个区域,记为X坐标校验区域;
步骤十:坐标采集单元针对每个X坐标校验区域逐像素检测密封线点位X坐标值,所有区域内密封线X坐标值组成X坐标集合;
步骤十一:离群检测单元针对X坐标集合基于Grubbs检验算法计算点位集合中各点位的密集程度及离群点位,剔除X坐标集合中的离群点,得到有效X坐标集合;
步骤十二:坐标确定单元对有效X坐标集合中的所有X坐标值求平均值获得密封线X坐标;
步骤十三:裁切模块在校正试卷图片中将密封线X坐标左侧或右侧的区域裁切或遮挡。
综上所述,本发明的优点在于:有效的保证密封线X坐标定位精准度,以该密封线X坐标进行裁切或遮挡密封线X坐标左侧或右侧的区域,可有效的在隐去考生信息的同时不遮挡考生答案,提高阅卷效率。
以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是本发明的原理,在不脱离本发明精神和范围的前提下本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明的范围内。本发明要求的保护范围由所附的权利要求书及其等同物界定。
Claims (7)
1.一种基于密度聚类的试卷密封线定位方法,其特征在于,包括:
获取扫描仪扫描的试卷图片,记为原始试卷图片;
基于基准坐标系,对原始试卷图片进行倾斜校正,得到校正试卷图片;
设定一识别间距;
在密封线识别区间内,按照识别间距,纵向划分出若干个Y向待识别图片;
设定一试卷密封线标准图片;
对每个Y向待识别图片与试卷密封线标准图片进行相似度匹配,获得试卷密封线初步定位图片;
在试卷密封线初步定位图片中随机横向分散切割出多个区域,记为X坐标校验区域;
针对每个X坐标校验区域逐像素检测密封线点位X坐标值,所有区域内密封线X坐标值组成X坐标集合;
针对X坐标集合基于Grubbs检验算法计算点位集合中各点位的密集程度及离群点位,剔除X坐标集合中的离群点,得到有效X坐标集合;
对有效X坐标集合中的所有X坐标值求平均值获得密封线X坐标;
在校正试卷图片中将密封线X坐标左侧或右侧的区域裁切或遮挡;
其中,所述对每个Y向待识别图片与试卷密封线标准图片进行相似度匹配,获得试卷密封线初步定位图片具体包括:
基于所有识别出的历史密封线X坐标求平均值,获得密封线初始识别坐标;
获取每个Y向待识别图片中心线的X坐标;
采用密封线相似匹配算法,确定每个Y向待识别图片与试卷密封线标准图片之间的图片相似指标;
基于图片相似指标、密封线初始识别坐标和Y向待识别图片中心线的X坐标,通过综合拟合公式,计算Y向待识别图片的密封线综合拟合指标;
筛选出密封线综合拟合指标最小的Y向待识别图片,作为试卷密封线初步定位图片;
其中,所述综合拟合公式具体为:
式中,为第i个Y向待识别图片的密封线综合拟合指标,/>为第i个Y向待识别图片与试卷密封线标准图片之间的图片相似指标,/>为第i个Y向待识别图片中心线的X坐标,/>为密封线初始识别坐标,/>为距离修正权重;
所述密封线相似匹配算法具体为:
将Y向待识别图片和试卷密封线标准图片按照相同的划分逻辑,划分出若干个相似匹配区域;
分别计算每个相似匹配区域内,Y向待识别图片中的疑似试卷密封线像素点和试卷密封线标准图片中的试卷密封线像素点之间的X坐标差;
将所有的X坐标差求取标准差,以该标准差作为Y向待识别图片与试卷密封线标准图片之间的图片相似指标。
2.根据权利要求1所述的一种基于密度聚类的试卷密封线定位方法,其特征在于,所述在试卷密封线初步定位图片中随机横向分散切割出多个区域,记为X坐标校验区域具体包括:
将试卷密封线初步定位图片反面横向分散切割出多个区域,所述区域数量至少为10个,所述区域的截取高度为20像素。
3.根据权利要求2所述的一种基于密度聚类的试卷密封线定位方法,其特征在于,所述针对X坐标集合基于Grubbs检验算法计算点位集合中各点位的密集程度及离群点位,剔除X坐标集合中的离群点,得到有效X坐标集合具体包括:
对于X坐标集合中的每个密封线X坐标值,计算Z分数;
构建离群点判定公式;
判定X坐标集合中的密封线X坐标值的Z分数是否满足离群点判定公式,若是,则判定该密封线X坐标值为X坐标集合中的离群点,若否,则判定该密封线X坐标值不是X坐标集合中的离群点;
将所有离群点剔除,得到有效X坐标集合;
其中,所述离群点判定公式为:
式中,为X坐标集合中的密封线X坐标值的Z分数,/>是显著水平/> 下的t-分布的值,N是X坐标集合中的密封线X坐标值总数量。
4.根据权利要求3所述的一种基于密度聚类的试卷密封线定位方法,其特征在于,所述Z分数的计算公式为:
式中,为X坐标集合中的第j个密封线X坐标值的Z分数,/>为X坐标集合中的第j个密封线X坐标值,/>为X坐标集合中的所有密封线X坐标值的平均值,/>为X坐标集合中的所有密封线X坐标值的标准差。
5.一种基于密度聚类的试卷密封线定位系统,其特征在于,用于实现如权利要求1-4任一项所述的基于密度聚类的试卷密封线定位方法,包括:
扫描仪,所述扫描仪用于扫描试卷图片,获得原始试卷图片;
倾斜校正模块,所述倾斜校正模块与所述扫描仪电性连接,所述倾斜校正模块用于基于基准坐标系,对原始试卷图片进行倾斜校正,得到校正试卷图片;
初定位模块,所述初定位模块与所述倾斜校正模块电性连接,所述初定位模块用于设定一识别间距,在密封线识别区间内,按照识别间距,纵向划分出若干个Y向待识别图片,并对每个Y向待识别图片与试卷密封线标准图片进行相似度匹配,获得试卷密封线初步定位图片;
密封线坐标定位模块,所述密封线坐标定位模块与所述初定位模块电性连接,所述密封线坐标定位模块用于在试卷密封线初步定位图片中随机横向分散切割出多个区域,记为X坐标校验区域,针对每个X坐标校验区域逐像素检测密封线点位X坐标值,所有区域内密封线X坐标值组成X坐标集合,针对X坐标集合基于Grubbs检验算法计算点位集合中各点位的密集程度及离群点位,剔除X坐标集合中的离群点,得到有效X坐标集合,对有效X坐标集合中的所有X坐标值求平均值获得密封线X坐标;
裁切模块,所述裁切模块与所述密封线坐标定位模块电性连接,所述裁切模块用于在校正试卷图片中将密封线X坐标左侧或右侧的区域裁切或遮挡。
6.根据权利要求5所述的一种基于密度聚类的试卷密封线定位系统,其特征在于,所述初定位模块包括:
第一划分单元,所述第一划分单元用于设定一识别间距,并在密封线识别区间内,按照识别间距,纵向划分出若干个Y向待识别图片;
历史分析单元,所述历史分析单元用于基于所有识别出的历史密封线X坐标求平均值,获得密封线初始识别坐标;
图片定位单元,所述图片定位单元用于获取每个Y向待识别图片中心线的X坐标;
图片相似匹配单元,所述图片相似匹配单元用于采用密封线相似匹配算法,确定每个Y向待识别图片与试卷密封线标准图片之间的图片相似指标;
综合拟合单元,所述综合拟合单元用于基于图片相似指标、密封线初始识别坐标和Y向待识别图片中心线的X坐标,通过综合拟合公式,计算Y向待识别图片的密封线综合拟合指标;
筛选单元,所述筛选单元用于筛选出密封线综合拟合指标最小的Y向待识别图片,作为试卷密封线初步定位图片。
7.根据权利要求6所述的一种基于密度聚类的试卷密封线定位系统,其特征在于,所述密封线坐标定位模块包括:
第二划分单元,所述第二划分单元用于在试卷密封线初步定位图片中随机横向分散切割出多个区域,记为X坐标校验区域;
坐标采集单元,所述坐标采集单元用于针对每个X坐标校验区域逐像素检测密封线点位X坐标值,所有区域内密封线X坐标值组成X坐标集合;
离群检测单元,所述离群检测单元用于针对X坐标集合基于Grubbs检验算法计算点位集合中各点位的密集程度及离群点位,剔除X坐标集合中的离群点,得到有效X坐标集合;
坐标确定单元,所述坐标确定单元用于对有效X坐标集合中的所有X坐标值求平均值获得密封线X坐标。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311839463.2A CN117495950B (zh) | 2023-12-29 | 2023-12-29 | 一种基于密度聚类的试卷密封线定位方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311839463.2A CN117495950B (zh) | 2023-12-29 | 2023-12-29 | 一种基于密度聚类的试卷密封线定位方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117495950A CN117495950A (zh) | 2024-02-02 |
CN117495950B true CN117495950B (zh) | 2024-03-26 |
Family
ID=89669285
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311839463.2A Active CN117495950B (zh) | 2023-12-29 | 2023-12-29 | 一种基于密度聚类的试卷密封线定位方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117495950B (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003030584A (ja) * | 2001-07-12 | 2003-01-31 | Ricoh Co Ltd | 文書認識装置、文書画像の領域識別方法、プログラム及び記憶媒体 |
CN108388892A (zh) * | 2018-05-04 | 2018-08-10 | 苏州大学 | 基于OpenCV的试卷自动处理系统及方法 |
CN109409374A (zh) * | 2018-10-11 | 2019-03-01 | 东莞市七宝树教育科技有限公司 | 一种基于联合的同批次试卷答案区域切割方法 |
CN112541922A (zh) * | 2020-12-04 | 2021-03-23 | 北京科技大学 | 基于数字图像的试卷布局分割方法、电子设备及存储介质 |
CN112597868A (zh) * | 2020-12-17 | 2021-04-02 | 四川才子软件信息网络有限公司 | 基于无定位点的试卷识别和矫正方法 |
CN113076872A (zh) * | 2021-04-01 | 2021-07-06 | 杭州云梯科技有限公司 | 一种智能试卷批改方法 |
CN114821222A (zh) * | 2022-03-28 | 2022-07-29 | 北京鼎事兴教育咨询有限公司 | 试卷图像生成方法、装置、存储介质及电子设备 |
CN115205562A (zh) * | 2022-07-22 | 2022-10-18 | 四川云数赋智教育科技有限公司 | 一种基于特征点的任意试卷配准方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112132163B (zh) * | 2020-09-21 | 2024-04-02 | 杭州睿琪软件有限公司 | 识别对象边缘的方法、系统及计算机可读存储介质 |
-
2023
- 2023-12-29 CN CN202311839463.2A patent/CN117495950B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003030584A (ja) * | 2001-07-12 | 2003-01-31 | Ricoh Co Ltd | 文書認識装置、文書画像の領域識別方法、プログラム及び記憶媒体 |
CN108388892A (zh) * | 2018-05-04 | 2018-08-10 | 苏州大学 | 基于OpenCV的试卷自动处理系统及方法 |
CN109409374A (zh) * | 2018-10-11 | 2019-03-01 | 东莞市七宝树教育科技有限公司 | 一种基于联合的同批次试卷答案区域切割方法 |
CN112541922A (zh) * | 2020-12-04 | 2021-03-23 | 北京科技大学 | 基于数字图像的试卷布局分割方法、电子设备及存储介质 |
CN112597868A (zh) * | 2020-12-17 | 2021-04-02 | 四川才子软件信息网络有限公司 | 基于无定位点的试卷识别和矫正方法 |
CN113076872A (zh) * | 2021-04-01 | 2021-07-06 | 杭州云梯科技有限公司 | 一种智能试卷批改方法 |
CN114821222A (zh) * | 2022-03-28 | 2022-07-29 | 北京鼎事兴教育咨询有限公司 | 试卷图像生成方法、装置、存储介质及电子设备 |
CN115205562A (zh) * | 2022-07-22 | 2022-10-18 | 四川云数赋智教育科技有限公司 | 一种基于特征点的任意试卷配准方法 |
Non-Patent Citations (2)
Title |
---|
Georgios Louloudis 等.Word Segmentation Using the Student's-t Distribution.《2016 12th IAPR Workshop on Document Analysis Systems (DAS)》.2016,第78-83页. * |
试卷答题卡模板信息提取关键技术研究;张沐阳;《中国优秀硕士学位论文全文数据库 信息科技辑》;20210115(第01期);第I138-1601页 * |
Also Published As
Publication number | Publication date |
---|---|
CN117495950A (zh) | 2024-02-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108764257B (zh) | 一种多视角的指针式仪表识别方法 | |
EP3933771A1 (en) | Positioning method and apparatus, and storage medium | |
CN109460762B (zh) | 一种基于图像识别的答题卡评分方法 | |
EP3309703A1 (en) | Method and system for decoding qr code based on weighted average grey method | |
CN106033535B (zh) | 电子阅卷方法 | |
WO2022110219A1 (zh) | 一种显示面板的检测方法、装置及系统 | |
CN103207987A (zh) | 一种指针式仪表的示数识别方法 | |
CN116559183B (zh) | 一种提高缺陷判定效率的方法及系统 | |
CN107730521B (zh) | 一种图像中屋脊型边缘的快速检测方法 | |
JP2002508069A (ja) | 測定マークおよび測定マークの検出方法並びに物体測量方法 | |
CN115184380B (zh) | 基于机器视觉的印刷电路板焊点异常检测方法 | |
CN104331695A (zh) | 一种鲁棒的圆形标志符形状质量检测方法 | |
CN111179362A (zh) | 一种基于动态光照校正算法的试纸颜色均匀性检测方法 | |
CN110322428A (zh) | 检测隧道病害的方法、装置及电子设备 | |
CN114972531B (zh) | 一种角点检测方法、设备及可读存储介质 | |
CN117495950B (zh) | 一种基于密度聚类的试卷密封线定位方法及系统 | |
CN104077562B (zh) | 一种答卷的扫描方向判断方法 | |
CN116542998B (zh) | 用于光刻薄膜电感的轮廓检测方法、装置、设备及介质 | |
CN116563298A (zh) | 基于高斯拟合的十字线中心亚像素检测方法 | |
CN115452845B (zh) | 一种基于机器视觉的led屏幕表面损伤检测方法 | |
CN115375679B (zh) | 一种缺陷芯片寻边寻点定位方法及装置 | |
CN111341686A (zh) | 一种检测晶圆缺陷的方法及装置 | |
CN115457563A (zh) | 一种零漏检兼低误识的船体水尺读取方法 | |
CN112837285B (zh) | 一种板面图像的边缘检测方法及装置 | |
CN111231530B (zh) | 一种双色打印机质量检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |