CN103996022A - 一种扫描答卷图像的边界定位方法 - Google Patents
一种扫描答卷图像的边界定位方法 Download PDFInfo
- Publication number
- CN103996022A CN103996022A CN201410197780.3A CN201410197780A CN103996022A CN 103996022 A CN103996022 A CN 103996022A CN 201410197780 A CN201410197780 A CN 201410197780A CN 103996022 A CN103996022 A CN 103996022A
- Authority
- CN
- China
- Prior art keywords
- angle
- image
- feature point
- btlr
- edge feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Image Analysis (AREA)
- Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
Abstract
本发明提出一种依据背景灰度与前景的灰度差别特征的图像边界定位方法,根据扫描答卷图像先计算图像的边界特征点,根据这些边界特征点可以计算图像边界对应的直线方程,根据直线方程之间的交点可以获取扫描图像的边界,最终完成把扫描图像从扫描背景中分割出来。本发明提出了边界特征点计算方法和边界特征点对应的直线方程估计算法;边界特征点计算时,提出了边界特征点的自适应调整算法;设计了扫描答卷图像的倾斜角度的估计算法,倾斜角度估计精度可达0.01角度。该扫描答卷图像边界定位方法具有准确率高、算法时间复杂度低且易于实现的优点,广泛应用于扫描答卷图像的扫描、分析、识别等领域。
Description
技术领域
本发明涉及图像处理领域,具体地讲,涉及一种扫描答卷图像的边界定位方法。
背景技术
答卷图像是一类文档图像,答卷经采集设备扫描得到答卷图像,这些图像一般存储在计算机中,答卷图像广泛应用于教育领域的数字化网上阅卷工程。
本发明研究的领域是答卷图像的自动边界定位问题,属图像预处理领域,目的是把扫描答卷图像从原始扫描图像中分割出来,因此扫描答卷图像的边界定位问题也可以理解为扫描答卷图像的分割问题。
常用的答卷图像边界定位方法使用投影方法,通过统计方法得到扫描答卷图像的边界,这种方法对扫描图像的质量要求较高,不能处理噪声相对复杂的情况(例如扫描图像边界破损或者扫描图像发生了倾斜),而且边界定位的精度不够,为此本发明研究了在复杂噪声环境下的扫描答卷边界定位方法,该方法具备更好的适应性,设计了高精度图像倾斜角度估计算法,提出了图像倾斜角度的可信度计算指标,从而在扫描图像的边界不规则时给出量化指标,提高了扫描图像数据处理的质量。
如图1所示,原始扫描答卷图像(图1a)包含大量的背景区域,一般需要将答卷图像从原始图像中分割出来,原始图像背景区域含有一些白色直线噪声,同时答卷图像中含有一些黑色直线,这些特点使得基于水平投影和垂直的投影的方法变得不稳定,如果扫描图像发生倾斜或者扫描答卷的尺寸发生变化,会 加剧该算法的不稳定性。
发明内容
本发明要解决的技术问题是提供一种扫描答卷图像的边界定位方法,提高扫描答卷图像边界定位的精确度和自适应能力。
本发明采用如下技术方案实现发明目的:
一种扫描答卷图像的边界定位方法,其特征在于,包括如下步骤:
(1)根据扫描答卷图像计算图像的边界特征点;
(2)估计扫描答卷图像的倾斜角度;
(3)根据边界特征点和倾斜角度计算扫描答卷图像边界对应的直线方程;
(4)根据获取的直线方程之间的交点可以获取扫描图像的边界,完成将扫描图像从扫描背景中分割出来。
作为对本技术方案的进一步限定,所述步骤(1)包括如下步骤:
(1.1)检测底边边界特征点;
(1.2)检测顶边边界特征点;
(1.3)检测左边边界特征点;
(1.4)检测右边边界特征点。
作为对本技术方案的进一步限定,所述步骤(1.1)包括如下步骤:
(1)记底边边界特征点检测的图像列的位置总数为Nh,取Nh=32,图像的宽度表示为W,图像高度表示为H,则图像列的位置的步长Sh可表示为:
Sh=W/Nh (3)
(2)所有的图像列的位置的集合表示为:
Ph={pi|i*Sh},i=0,1,2,...(Nh-1) (4)
(3)依次判断每个图像列位置上对应的像素位置是否满足底边边界特征点检测条件,每个图像列最多检测一个特征点,当检测到一个特征点时,该列的检测停止,边界特征点判断位置最大到图像的高度H的一半,并且总是从底向上的顺序依次判断;
(4)按照步长检测得到的底边边界特征点的总数Dh,如果(Dh/Nh)<Rh成立,取Rh=0.80,重新调整步长Sh为Sh'如下:
Sh'=Sh*(Dh/Nh) (5)
经过列的步长调整后,根据公式(6)调整列位置的总数Nh为Nh':
Nh'=W/Sh' (6)
(5)输出所有的底边边界特征点坐标。
作为对本技术方案的进一步限定,所述步骤(3)底边边界特征点的检测条件为:
(3.1)特征点对应的像素灰度大于给定的灰度阈值Tg,灰度阈值取值为128;
(3.2)特征点位置对应的答卷图像区域在TC范围内大于灰度Tg的像素个数WT满足以下条件:
WT/TC≥RC (1)
其中RC为比例控制参数,取RC=0.80,TC表示特征点检测时的阈值参数,典型值设置为32;
(3.3)特征点位置对应的背景区域在TC范围内小于灰度Tg的像素个数BT满足以下条件:
BT/TC≥RC (2)
其中RC为比例控制参数,取RC=0.80。
作为对本技术方案的进一步限定,所述步骤(2)包括如下步骤:
(2.1)计算底边边界特征点对应的倾斜角度;
(2.2)计算顶边边界特征点对应的倾斜角度;
(2.3)计算左边边界特征点对应的倾斜角度;
(2.4)计算右边边界特征点对应的倾斜角度;
(2.5)计算扫描答卷图像的倾斜角度。
作为对本技术方案进一步限定,所述步骤(2.1)包括如下步骤:
(1)初值A、F、Dp设置,其中A表示倾斜角度的估计范围,F表示倾斜角度检测的精度,设置初值Dp用以描述两个点之间的最小距离;
(2)根据倾斜角度检测精度,每隔F为一个累加器,总共有NF个累加器,工程上采用数组实现,每个累加器初值设置为0;
NF=(max(A)-min(A))/F (9)
(3)从集合LB中任意取两个点pi,pj,集合LB表示底边边界特征点位置对应的坐标集合,如果两个点之间的距离di,j满足:
di,j=|pi-pj|≥Dp (10)
则计算两个点所决定的直线的角度θi,j:
(4)根据直线角度θi,j计算倾斜角度αi,j,如果θi,j对应顶边边界特征点或者底边边界特征点,则:
αi,j=θi,j (12)
否则,如果θi,j对应左边边界特征点或者右边边界特征点,则:
αi,j=θi,j-90.0 (13)
如果αi,j满足:
min(A)≤αi,j≤max(A) (14)
则累加器NI处加1,其中NI按如下方式计算,
如果αi,j不满足公式(14),转步骤(5);
(5)重复执行步骤(3),直到没有可选的点对,NF个累加器实际上是倾斜角度的统计信号,记为HA;
(6)HA信号与高斯函数G(t)卷积得到HG,卷积窗口的选择与F有关,设置为32,平滑器的目的有两个:一是获取精确的峰值点位置,二是有利于峰值检测;
(7)对HG执行峰值检测算子,得到峰值点的位置PC和幅值VP,同时获取峰值点对应的左非零位置PL和右非零位置PR;峰值点对应了信号HG中的最大值,峰值点对应的角度累加器下标记为PC,则有如下关系成立:
VP=max(HG) (17)
以角度累加器下标PC开始,向左依次遍历角度累加器下标,直到HG对应的幅值小于等于0或者到达原点;以角度累加器下标PC开始,向右依次遍历角度累加器下标,直到HG对应的幅值小于等于0或者到达角度累加器下标的最大值Pmax;
(8)按如下方式计算特征点对应的倾斜角度θB:
θB=PC*F-min(A) (18)
(9)按如下方式得到倾斜角度θB的可信度:
作为对本技术方案的进一步限定,所述步骤(2.5)包括如下步骤:
(1)计算上、下和左、右边界特征点对应的倾斜角度之间的夹角θBT,θLR:
θBT=|θB-θT| (20)
θLR=|θL-θR|
(2)如果θBT≤θLR,说明底边边界和顶边边界平行度较好,转步骤(3),否则,说明左边边界和右边边界平行度较好,转步骤(5);
(3)如果RB≥TR并且RT≥TR,则扫描图像的倾斜角度θBTLR、可信度RBTLR计算为:
θBTLR=(θB+θT)/2.0 (21)
RBTLR=(RB+RT)/2.0
否则,转步骤(4);
(4)如果RB≥RT,则扫描图像的倾斜角度θBTLR、可信度RBTLR计算为:
θBTLR=θB (22)
RBTLR=RB
否则:
θBTLR=θT (23)
RBTLR=RT
(5)如果RL≥TR并且RR≥TR,则扫描图像的倾斜角度θBTLR、可信度RBTLR计算为:
θBTLR=(θL+θR)/2.0 (24)
RBTLR=(RL+RR)/2.0
否则,转步骤(6);
(6)如果RL≥RR,则扫描图像的倾斜角度θBTLR、可信度RBTLR计算为:
θBTLR=θL (25)
RBTLR=RL
否则:
θBTLR=θR (26)
RBTLR=RR
作为对本技术方案的进一步限定,所述步骤(3)包括如下步骤:
(1)计算底边特征点对应的直线方程;
(2)计算顶边特征点对应的直线方程;
(3)计算左边特征点对应的直线方程;
(4)计算右边特征点对应的直线方程。
作为对本技术方案的进一步限定,所述步骤(1)包括如下步骤:根据底边特征点集合LB和对应的倾斜角度θB,计算对应直线的斜率kB如下:
kB=tan(θB) (27)
直线的方程表示为:
y=kBx+bB (28)
其中kB由公式(27)确定,bB是需要确定的参数,根据最小二乘法直线拟合设计原理,bB满足的条件为:
公式(29)只需要确定bB,对F(bB)求导得:
解公式(30)得到参数bB:
至此,已经完成了底边边界特征点对应的直线方程的估计。
与现有技术相比,本发明的优点和积极效果是:本发明针对扫描答卷图像提出了边界特征点检测模型,该模型简单、容易计算,给出了边界特征点满足的基本条件;提出了特征点检测的具体算法,该算法具有一定的自适应能力,相 邻特征点之间的距离可随着扫描答卷幅面大小自适应调整;设计了基于边界特征点的扫描答卷倾斜角度估计方法,该倾斜角度检测精度可达0.01角度,并设计了该倾斜角度的可信度指标计算方法,该可信度指标反映了扫描答卷图像边界的质量,可信度越高,边界质量越好,反之,可信度越低,边界质量越差;基于倾斜角度估计,结合最小二乘直线拟合方法,提出了边界特征点对应的直线方程估计方法,用于确定扫描答卷图像在原始图像中的最小坐标和最大坐标,从而完成扫描答卷图像的定位(分割)。
附图说明
图1(a)为本发明含有背景图像的扫描答卷图像,图1(b)为采用现有技术去除背景图像后的扫描答卷图像。
图2(a)为底边边界特征点检测模型,图2(b)为顶边边界特征点检测模型,图2(c)为左边边界特征点检测模型,图2(d)为右边边界特征点检测模型。
图3为底边边界特征点检测流程图。
图4为峰值点跟踪算子示意图。
图5为答卷图像边界定位示意图。
图6(a)为A3答卷扫描图像边界特征点检测效果图,图6(b)为A4答卷扫描图像边界特征点检测效果图。
图7(a)为顶边边界特征点倾斜角度的统计信号HA计算结果,图7(b)为顶边边界特征点倾斜角度的统计信号HG计算结果。
图8为扫描较差的答卷图像。
图9(a)为扫描较差答卷图像顶边边界特征点倾斜角度的统计信号HA计算结果,图9(b)为扫描较差答卷图像顶边边界特征点倾斜角度的统计信号HG计算结果
图10(a)为扫描效果较差的原始扫描图像,图10(b)为扫描效果较差的原始扫描图像分割后的效果图。
具体实施方式
下面结合附图和优选实施例对本发明作更进一步的详细描述。
1、边界特征点检测算法
1.1边界特征点检测模型
本发明研究的扫描答卷图像采用100dpi扫描,扫描灰度位深为8,扫描背景对应答卷图像的四周亮度比较暗的区域,答卷图像中包含了空白区域和文字、直线等信息。
首先建立边界特征点检测模型:
如图2(a)、图2(b)、图2(c)、图2(d)、所示,特征点检测模型中每个方块表示一个像素位置,其中“*”分别表示底边边界特征点检测位置、顶边边界特征点检测位置、左边边界特征点检测位置和右边边界特征点检测位置,TC表示特征点检测时的阈值参数,典型值设置为32,灰色方块表示四个边界位置对应的背景区域,白色方块表示四个边界位置对应的答卷图像区域。
边界特征点的位置满足以下3个条件:
a、特征点对应的像素灰度大于给定的灰度阈值Tg,灰度阈值一般取值为128;
b、特征点位置对应的答卷图像区域在TC范围内大于灰度Tg的像素个数WT满足以下条件:
WT/TC≥RC (1)
其中RC为比例控制参数,考虑到图像的边界噪声、答卷图像噪声等因素,一般取RC=0.80。
c、特征点位置对应的背景区域在TC范围内小于灰度Tg的像素个数BT满足以下条件:
BT/TC≥RC (2)
其中RC为比例控制参数,考虑到图像的边界噪声、背景区直线噪声等因素,一般取RC=0.80。
1.2边界特征点检测算法
为了能够快速地检测到答卷图像边界对应的特征点,尽可能少的检测可能的边界特征点,同时又保证检测算法适应不同幅面大小的答卷图像。
为了叙述上的方便性,以检测底边边界特征点为例,记底边边界特征点检测的图像列的位置总数为Nh,一般取Nh=32,假设图像的宽度表示为W,图像高度表示为H,则图像列的位置的间隔(步长)Sh可表示为:
Sh=W/Nh (3)
因此所有的图像列的位置的集合可以表示为:
Ph={pi|i*Sh},i=0,1,2,...(Nh-1) (4)
依次判断每个图像列位置上对应的像素位置是否满足底边边界特征点检测条件,每个图像列最多检测一个特征点,当检测到一个特征点时,该列的检测停止,边界特征点判断位置最大到图像的高度H的一半,并且总是从底向上的顺序依次判断。
一般来说,扫描答卷图像不会覆盖图像整个宽度空间,因此按照步长Sh检测得到的底边边界特征点的总数Dh一般会小于Nh,如果Dh太小,会影响倾斜角度的估计精度和后期的直线方程估计,因此规定一个初值Rh,如果(Dh/Nh)<Rh(一般取Rh=0.80)成立,则重新调整Sh为Sh'如下:
Sh'=Sh*(Dh/Nh) (5)
经过列的步长调整后,调整列位置的总数Nh为Nh'(公式6),检测每个列位置上的底边边界特征点,输出所有的底边边界特征点。
Nh'=W/Sh' (6)
如图3所示,计算底边边界特征点时,边界特征点需满足边界特征点条件(1)、条件(2)、条件(3)。边界点检测总数Dh一般是需要调整的(调整列的步长),发生在以下两种情况之一:
条件(1):扫描答卷图像的宽度不足以覆盖扫描原始图像的宽度;
条件(2):扫描答卷图像的宽度接近或者超过(例如覆盖90%以上)原始扫描图像的宽度,但是扫描图像噪声较大或者边界破损,以至于部分底边边界特征点没有检测出来。
根据底边边界特征点检测算法的描述,同理可以检测顶边边界特征点、左边边界特征点和右边边界特征点。
2.扫描答卷图像的倾斜角度估计算法
边界特征点检测完成后,输出边界特征点的坐标。为了叙述的方便性,使用集合LB表示底边边界特征点位置对应的坐标集合。
LB={(xi,yi)|i=0,1,2,...,(m-1)}={pi|i=0,1,2,...,(m-1)} (7)
表达式(7)表示在底边检测到了m个边界特征点,根据底边边界特征点检测算法的描述,这些边界特征点的水平坐标满足如下关系:
x0<x1<x2<...<xm-1 (8)
倾斜角度的估计比较常见的是最小二乘直线拟合方法,虽然这种方法具有比较高的估算精度,但是无法从复杂的边界点集合中发现主倾斜角度,在工程实践中受到一定的限制和约束。
本发明使用投票方法统计边界特征点集合中的点对所构成的直线对应的倾斜角度,精度可以达到0.01角度,而且可以充分保证计算速度。
与倾斜角度估计有关的几个参数表述如下:
(1)倾斜角度的估计范围A,用于检测一定范围内倾斜角度,工程实践上,答卷图像的倾斜角度一般在[-10,+10]度之间,对于超过此范围的倾斜角度,不在统计范围,这样将大幅度提高主倾斜角度估计的稳定性,而且特别有利于降低存储空间,提高主倾斜角度搜索效率;
(2)倾斜角度检测的精度F,默认F=0.01角度,精度越高,存储空间开销越大,不利于嵌入式、实时处理应用环境,可根据计算的具体需求调整,精度的最小值设计为0.001,精度的最大值设置为1.0;
(3)基于点对所对应的直线角度的计算方法也会产生误差,一般来说点对之间的距离越小,误差也就越大,因此工程实践上设置初值Dp用以描述两个点之间的最小距离,这样做的好处有两个:一是精度提高了,二是速度提高了。
底边边界特征点对应的倾斜角度和可信度估计算法的步骤如下:
(1)初值A、F、Dp设置;
(2)根据倾斜角度检测精度,每隔F为一个累加器,总共有NF个累加器(工程上采用数组实现),每个累加器初值设置为0;
NF=(max(A)-min(A))/F (9)
(3)从集合LB中任意取两个点pi,pj,如果两个点之间的距离di,j满足:
di,j=|pi-pj|≥Dp (10)
则计算两个点所决定的直线的角度θi,j:
(4)根据直线角度θi,j计算倾斜角度αi,j:
如果θi,j对应顶边边界特征点或者底边边界特征点,则:
αi,j=θi,j (12)
否则,如果θi,j对应左边边界特征点或者右边边界特征点,则:
αi,j=θi,j-90.0 (13)
如果αi,j满足:
min(A)≤αi,j≤max(A) (14)
则累加器NI处加1,其中NI按如下方式计算,
如果αi,j不满足公式(14),转步骤(5);
(5)重复执行步骤(3),直到没有可选的点对,NF个累加器实际上是倾斜角度的统计信号,记为HA;
(6)HA信号与高斯函数G(t)卷积得到HG,卷积窗口的选择与F有关,一般设置为32,平滑器的目的有两个:一是获取精确的峰值点位置,二是有利于峰值检测;
(7)对HG执行峰值检测算子,得到峰值点的位置PC和幅值VP,同时获取峰值点对应的左非零位置PL和右非零位置PR;
如图4所示,峰值点对应了信号HG中的最大值,峰值点对应的角度累加器 下标记为PC,则有如下关系成立:
VP=max(HG) (17)
以角度累加器下标PC开始,向左依次遍历角度累加器下标,直到HG对应的幅值小于等于0或者到达原点;以角度累加器下标PC开始,向右依次遍历角度累加器下标,直到HG对应的幅值小于等于0或者到达角度累加器下标的最大值Pmax;
(8)按如下方式计算特征点对应的倾斜角度θB:
θB=PC*F-min(A) (18)
(9)按如下方式得到倾斜角度θB的可信度:
至此,我们已经完成了底边边界特征点对应的倾斜角度的估计和可信度的计算,同理,我们可以得到顶边边界特征点对应的倾斜角度θT、可信度RT,左边边界特征点对应的倾斜角度θL、可信度RL,右边边界特征点对应的倾斜角度θR、可信度RR。
一般来说,扫描图像都会发生微小的几何畸变,为了能够较好的估计扫描图像的倾斜角度,我们使用平行度较好的边界特征点对应的倾斜角度作为图像的倾斜角度,同时考虑可信度计算指标,当平行度较好的边界特征点如果其可信度都较高时(大于给定的阈值TR∈[0,1],一般取值为0.90),使用它们的平均值作为扫描答卷图像的倾斜角度,具体计算步骤如下:
(7)计算上、下和左、右边界特征点对应的倾斜角度之间的夹角θBT,θLR:
θBT=|θB-θT| (20)
θLR=|θL-θR|
(8)如果θBT≤θLR,说明底边边界和顶边边界平行度较好,转步骤(3),否则,说明左边边界和右边边界平行度较好,转步骤(5);
(9)如果RB≥TR并且RT≥TR,则扫描图像的倾斜角度θBTLR、可信度RBTLR计算为:
θBTLR=(θB+θT)/2.0 (21)
RBTLR=(RB+RT)/2.0
否则,转步骤(4);
(10)如果RB≥RT,则扫描图像的倾斜角度θBTLR、可信度RBTLR计算为:
θBTLR=θB (22)
RBTLR=RB
否则:
θBTLR=θT (23)
RBTLR=RT
(11)如果RL≥TR并且RR≥TR,则扫描图像的倾斜角度θBTLR、可信度RBTLR计算为:
θBTLR=(θL+θR)/2.0 (24)
RBTLR=(RL+RR)/2.0
否则,转步骤(6);
(12)如果RL≥RR,则扫描图像的倾斜角度θBTLR、可信度RBTLR计算为:
θBTLR=θL (25)
RBTLR=RL
否则:
θBTLR=θR(26)
RBTLR=RR
3.边界特征点对应的直线方程估计
前面我们已经计算出了底边、顶边、左边和右边的边界特征点的位置及其对应的倾斜角度,这样可以很方便的计算出这些边界特征点对应的直线方程。为 了叙述的方便性,以计算底边边界特征点对应的直线方程为例进行叙述。
底边特征点集合由公式(7)给出,对应的倾斜角度θB由公式(18)给出,直线的斜率kB计算如下:
kB=tan(θB) (27)
假设直线的方程表示为:
y=kBx+bB (28)
其中kB由公式(27)确定,bB是需要确定的参数,根据最小二乘法直线拟合设计原理,bB满足的条件为:
公式(29)只需要确定bB,对F(bB)求导得:
解公式(30)得到参数bB:
至此,已经完成了底边边界特征点对应的直线方程的估计,同理,我们可以估计出顶边、左边、右边边界特征点对应的直线方程,直线斜率依次表示为:
kT=tan(θT)
kL=tan(θL+90.0) (32)
kR=tan(θR+90.0)
这些直线方程分别表示如下:
y=kTx+bT
y=kLx+bL (33)
y=kRx+bR
4.扫描答卷图像边界定位方法
根据边界点对应的直线方程(由公式(28)公式(33)给出),可以非常方便的计算得到扫描图像的边界。
如图5所示,扫描图像的背景区域灰度较暗,白色的四条线对应边界点对应的直线方程,答卷图像区域为白色区域所示,并且扫描图像发生了倾斜,四条直线方程的交点分别表示为pBL、pBR、pTL、pTR,答卷图像边界如图5黑色矩形所示,两条直线的交点计算比较简单,在此不再赘述,假设交点的坐标有如下形式:
pBL(x0,y0)
pBR(x1,y1) (34)
pTL(x2,y2)
pTR(x3,y3)
如果扫描图像的倾斜角度估计θBTLR≥0,则答卷图像边界的最小坐标pmin、最大坐标pmax表示如下:
pmin(x2,y0) (35)
pmax(x1,y3)
否则,答卷图像的最小坐标pmin、最大坐标pmax表示如下:
pmin(x0,y1) (36)
pmax(x3,y2)
至此,我们已经计算出答卷图像边界,根据θBTLR角度使用最小坐标pmin和最大坐标pmax表示。
5.边界特征点检测效果
如图6(a)、图6(b)所示,初值Nh=32,图像中的“□”表示检测到的边界特征点位置,默认Rh=0.80,扫描幅面较大时(图6(a)),相邻边界特征点之间的距离也就越大,扫描幅面较小时(图6(b)),相邻边界特征点之间的距离也就越小,体现了算法的自适应能力,使得对于不同幅面的扫描答卷 图像其边界特征点在数量上保持一致。
6.扫描图像的倾斜角度的估计
答卷图像的倾斜角度的检测范围设置为[-10,+10]角度,检测精度设置为0.01角度,图6(b)所示顶边边界特征点对应的倾斜角度的统计信号记为HA,根据公式(16)得到平滑信号HG,计算结果图7所示,
如图7所示,该扫描图像质量较高,信号HG比信号HA更加平滑,非常有利于峰值点的计算,根据公式(18)和公式(19)可得到倾斜角度θT=2.92角度,可信度RT=0.9963,说明该倾斜角度的可信度非常高,同理可以得到θB=3.07,RB=0.9963,θL=3.04,RL=0.9687,θR=3.04,RR=0.9433,最终得到扫描图像的倾斜角度θBTLR=3.04,RBTLR=0.9560。
对于扫描图像噪声较大、边界破损等情形,该算法体现出非常好的适应能力,可信度指标可反映出边界点破损的程度。
如图8所示,该扫描答卷图像质量较差,其中“□”表示边界特征点计算结果,初值Nh=32,Rh=0.80,顶边边界特征点对应的倾斜角角度统计信号计算结果如图8所示。
进一步计算可得图8对应的扫描图像的倾斜角度和可信度,计算结果如下:
θB=7.93,RB=0.8545
θT=8.30,RT=0.7673
θL=7.87,RL=0.8402
θR=7.99,RR=0.7406
θBTLR=7.87,RBTLR=0.8402
7.扫描答卷图像分割效果
根据扫描答卷图像边界定位方法,可以得到扫描答卷图像在原始扫描图像中的最小坐标和最大坐标,因此可以非常方便的把答卷图像从原始扫描图像中 分割出来,如图10(a)和图10(b)。
本发明未经描述的技术特征可以通过或采用现有技术实现,在此不再赘述,当然,上述说明并非是对本发明的限制,本发明也并不仅限于上述举例,本技术领域的普通技术人员在本发明的实质范围内所做出的变化、改型、添加或替换,也应属于本发明的保护范围。
Claims (9)
1.一种扫描答卷图像的边界定位方法,其特征在于,包括如下步骤:
(1)根据扫描答卷图像计算图像的边界特征点;
(2)估计扫描答卷图像的倾斜角度;
(3)根据边界特征点和倾斜角度计算扫描答卷图像边界对应的直线方程;
(4)根据获取的直线方程之间的交点可以获取扫描图像的边界,完成将扫描图像从扫描背景中分割出来。
2.根据权利要求1所述的扫描答卷图像的边界定位方法,其特征在于,所述步骤(1)包括如下步骤:
(1.1)检测底边边界特征点;
(1.2)检测顶边边界特征点;
(1.3)检测左边边界特征点;
(1.4)检测右边边界特征点。
3.根据权利要求2所述的扫描答卷图像的边界定位方法,其特征在于,所述步骤(1.1)包括如下步骤:
(1)记底边边界特征点检测的图像列的位置总数为Nh,取Nh=32,图像的宽度表示为W,图像高度表示为H,则图像列的位置的步长Sh可表示为:
Sh=W/Nh (3)
(2)所有的图像列的位置的集合表示为:
Ph={pi|i*Sh},i=0,1,2,...(Nh-1) (4)
(3)依次判断每个图像列位置上对应的像素位置是否满足底边边界特征点检测条件,每个图像列最多检测一个特征点,当检测到一个特征点时,该列的检测停 止,边界特征点判断位置最大到图像的高度H的一半,并且总是从底向上的顺序依次判断;
(4)按照步长检测得到的底边边界特征点的总数Dh,如果(Dh/Nh)<Rh成立,取Rh=0.80,重新调整步长Sh为Sh'如下:
Sh'=Sh*(Dh/Nh) (5)
经过列的步长调整后,根据公式(6)调整列位置的总数Nh为Nh':
Nh'=W/Sh' (6)
(5)输出所有的底边边界特征点坐标。
4.根据权利要求3所述的扫描答卷图像的边界定位方法,其特征在于,所述步骤(3)底边边界特征点的检测条件为:
(3.1)特征点对应的像素灰度大于给定的灰度阈值Tg,灰度阈值取值为128;
(3.2)特征点位置对应的答卷图像区域在TC范围内大于灰度Tg的像素个数WT满足以下条件:
WT/TC≥RC (1)
其中RC为比例控制参数,取RC=0.80,TC表示特征点检测时的阈值参数,典型值设置为32;
(3.3)特征点位置对应的背景区域在TC范围内小于灰度Tg的像素个数BT满足以下条件:
BT/TC≥RC (2)
其中RC为比例控制参数,取RC=0.80。
5.根据权利要求1所述的扫描答卷图像的边界定位方法,其特征在于,所述步骤(2)包括如下步骤:
(2.1)计算底边边界特征点对应的倾斜角度;
(2.2)计算顶边边界特征点对应的倾斜角度;
(2.3)计算左边边界特征点对应的倾斜角度;
(2.4)计算右边边界特征点对应的倾斜角度;
(2.5)计算扫描答卷图像的倾斜角度。
6.根据权利要求5所述的扫描答卷图像的边界定位方法,其特征在于,所述步骤(2.1)包括如下步骤:
(1)初值A、F、Dp设置,其中A表示倾斜角度的估计范围,F表示倾斜角度检测的精度,设置初值Dp用以描述两个点之间的最小距离;
(2)根据倾斜角度检测精度,每隔F为一个累加器,总共有NF个累加器,工程上采用数组实现,每个累加器初值设置为0;
NF=(max(A)-min(A))/F (9)
(3)从集合LB中任意取两个点pi,pj,集合LB表示底边边界特征点位置对应的坐标集合,如果两个点之间的距离di,j满足:
di,j=|pi-pj|≥Dp (10)
则计算两个点所决定的直线的角度θi,j:
(4)根据直线角度θi,j计算倾斜角度αi,j,如果θi,j对应顶边边界特征点或者底边
边界特征点,则:
αi,j=θi,j(12)
否则,如果θi,j对应左边边界特征点或者右边边界特征点,则:
αi,j=θi,j-90.0 (13)
如果αi,j满足:
min(A)≤αi,j≤max(A)(14)
则累加器NI处加1,其中NI按如下方式计算,
如果αi,j不满足公式(14),转步骤(5);
(5)重复执行步骤(3),直到没有可选的点对,NF个累加器实际上是倾斜角度的统计信号,记为HA;
(6)HA信号与高斯函数G(t)卷积得到HG,卷积窗口的选择与F有关,设置为32,平滑器的目的有两个:一是获取精确的峰值点位置,二是有利于峰值检测;
(7)对HG执行峰值检测算子,得到峰值点的位置PC和幅值VP,同时获取峰值点对应的左非零位置PL和右非零位置PR;峰值点对应了信号HG中的最大值,峰值点对应的角度累加器下标记为PC,则有如下关系成立:
VP=max(HG) (17)
以角度累加器下标PC开始,向左依次遍历角度累加器下标,直到HG对应的幅值小于等于0或者到达原点;以角度累加器下标PC开始,向右依次遍历角度累加器下标,直到HG对应的幅值小于等于0或者到达角度累加器下标的最大值Pmax;
(8)按如下方式计算特征点对应的倾斜角度θB:
θB=PC*F-min(A) (18)
(9)按如下方式得到倾斜角度θB的可信度:
7.根据权利要求5所述的扫描答卷图像的边界定位方法,其特征在于,所述步 骤(2.5)包括如下步骤:
(1)计算上、下和左、右边界特征点对应的倾斜角度之间的夹角θBT,θLR:
θBT=|θB-θT| (20)
θLR=|θL-θR|
(2)如果θBT≤θLR,说明底边边界和顶边边界平行度较好,转步骤(3),否则,说明左边边界和右边边界平行度较好,转步骤(5);
(3)如果RB≥TR并且RT≥TR,则扫描图像的倾斜角度θBTLR、可信度RBTLR计算为:
θBTLR=(θB+θT)/2.0 (21)
RBTLR=(RB+RT)/2.0
否则,转步骤(4);
(4)如果RB≥RT,则扫描图像的倾斜角度θBTLR、可信度RBTLR计算为:
θBTLR=θB (22)
RBTLR=RB
否则:
θBTLR=θT (23)
RBTLR=RT
(5)如果RL≥TR并且RR≥TR,则扫描图像的倾斜角度θBTLR、可信度RBTLR计算为:
θBTLR=(θL+θR)/2.0 (24)
RBTLR=(RL+RR)/2.0
否则,转步骤(6);
(6)如果RL≥RR,则扫描图像的倾斜角度θBTLR、可信度RBTLR计算为:
θBTLR=θL (25)
RBTLR=RL
否则:
θBTLR=θR (26)
RBTLR=RR。
8.根据权利要求1所述的扫描答卷图像的边界定位方法,其特征在于,所述步骤(3)包括如下步骤:
(1)计算底边特征点对应的直线方程;
(2)计算顶边特征点对应的直线方程;
(3)计算左边特征点对应的直线方程;
(4)计算右边特征点对应的直线方程。
9.根据权利要求8所述的扫描答卷图像的边界定位方法,其特征在于,所述步骤(1)包括如下步骤:
根据底边特征点集合LB和对应的倾斜角度θB,计算对应直线的斜率kB如下:
kB=tan(θB) (27)
直线的方程表示为:
y=kBx+bB (28)
其中kB由公式(27)确定,bB是需要确定的参数,根据最小二乘法直线拟合设计原理,bB满足的条件为:
公式(29)只需要确定bB,对F(bB)求导得:
解公式(30)得到参数bB:
至此,已经完成了底边边界特征点对应的直线方程的估计。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410197780.3A CN103996022B (zh) | 2014-05-12 | 2014-05-12 | 一种扫描答卷图像的边界定位方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410197780.3A CN103996022B (zh) | 2014-05-12 | 2014-05-12 | 一种扫描答卷图像的边界定位方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103996022A true CN103996022A (zh) | 2014-08-20 |
CN103996022B CN103996022B (zh) | 2017-11-24 |
Family
ID=51310183
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410197780.3A Active CN103996022B (zh) | 2014-05-12 | 2014-05-12 | 一种扫描答卷图像的边界定位方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103996022B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106503637A (zh) * | 2016-10-12 | 2017-03-15 | 北京新晨阳光科技有限公司 | 答卷处理系统 |
CN106846320A (zh) * | 2015-12-03 | 2017-06-13 | 山大鲁能信息科技有限公司 | 一种基于三点定位和直线定位的图片分割方法及系统 |
CN112215756A (zh) * | 2020-10-19 | 2021-01-12 | 珠海奔图电子有限公司 | 扫描纠偏方法、装置、存储介质及计算机设备 |
CN117830303A (zh) * | 2024-03-04 | 2024-04-05 | 山东山大鸥玛软件股份有限公司 | 一种网评图像检测方法、系统、电子设备及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101930594A (zh) * | 2010-04-14 | 2010-12-29 | 山东山大鸥玛软件有限公司 | 一种扫描文档图像的快速纠偏方法 |
CN102938062A (zh) * | 2012-10-16 | 2013-02-20 | 山东山大鸥玛软件有限公司 | 一种基于内容的文档图像倾斜角估计方法 |
US8693740B1 (en) * | 2012-11-07 | 2014-04-08 | Ittiam Systems (P) Ltd. | System and method for face detection in digital images |
-
2014
- 2014-05-12 CN CN201410197780.3A patent/CN103996022B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101930594A (zh) * | 2010-04-14 | 2010-12-29 | 山东山大鸥玛软件有限公司 | 一种扫描文档图像的快速纠偏方法 |
CN102938062A (zh) * | 2012-10-16 | 2013-02-20 | 山东山大鸥玛软件有限公司 | 一种基于内容的文档图像倾斜角估计方法 |
US8693740B1 (en) * | 2012-11-07 | 2014-04-08 | Ittiam Systems (P) Ltd. | System and method for face detection in digital images |
Non-Patent Citations (2)
Title |
---|
李清: "基于图像识别的网上阅卷系统的设计实现与优化", 《中国优秀硕士学位论文全文数据库 信息科技辑 》 * |
王希常等: "一种扫描文档图像的快速纠偏算法设计", 《PROCEEDINGS OF 2010 THIRD INTERNATIONAL CONFERENCE ON EDUCATION TECHNOLOGY AND TRAINING》 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106846320A (zh) * | 2015-12-03 | 2017-06-13 | 山大鲁能信息科技有限公司 | 一种基于三点定位和直线定位的图片分割方法及系统 |
CN106503637A (zh) * | 2016-10-12 | 2017-03-15 | 北京新晨阳光科技有限公司 | 答卷处理系统 |
CN112215756A (zh) * | 2020-10-19 | 2021-01-12 | 珠海奔图电子有限公司 | 扫描纠偏方法、装置、存储介质及计算机设备 |
CN112215756B (zh) * | 2020-10-19 | 2024-05-03 | 珠海奔图电子有限公司 | 扫描纠偏方法、装置、存储介质及计算机设备 |
CN117830303A (zh) * | 2024-03-04 | 2024-04-05 | 山东山大鸥玛软件股份有限公司 | 一种网评图像检测方法、系统、电子设备及存储介质 |
CN117830303B (zh) * | 2024-03-04 | 2024-05-28 | 山东山大鸥玛软件股份有限公司 | 一种网评图像检测方法、系统、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN103996022B (zh) | 2017-11-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106557764B (zh) | 一种基于二进制编码字符水尺和图像处理的水位识别方法 | |
CN107014294B (zh) | 一种基于红外图像的接触网几何参数检测方法及系统 | |
CN102790841B (zh) | 书籍的书脊区域中数字图像的检测和校正方法 | |
CN103324936B (zh) | 一种基于多传感器融合的车辆下边界检测方法 | |
CN104536009B (zh) | 一种激光红外复合的地面建筑物识别及导航方法 | |
CN107808386A (zh) | 一种基于图像语义分割的海天线检测方法 | |
CN106936964A (zh) | 一种基于霍夫变换模板匹配的手机屏幕角点检测方法 | |
CN109443480A (zh) | 基于图像处理的水位标尺定位及水位测量方法 | |
CN105488501A (zh) | 基于旋转投影的车牌倾斜矫正的方法 | |
CN101727666A (zh) | 图像分割方法及装置、图像倒置判断及胸片前后区分方法 | |
CN103996022A (zh) | 一种扫描答卷图像的边界定位方法 | |
CN103679638A (zh) | 残缺或变形的四边形图像的校正方法 | |
CN106097254A (zh) | 一种扫描文档图像纠偏方法 | |
CN103729655A (zh) | 一种用于片式元件视觉定位的检测方法 | |
CN101315668A (zh) | 试卷卷面表格自动检测方法 | |
KR20200071853A (ko) | 차량 번호판 검출 및 인식 시스템 및 방법 | |
CN106709952B (zh) | 一种显示屏幕的自动标定方法 | |
CN113624225B (zh) | 一种用于发动机定位销安装的位姿解算方法 | |
Elias et al. | JUDOCA: Junction detection operator based on circumferential anchors | |
CN113689429A (zh) | 一种基于计算机视觉的木板缺陷检测方法 | |
CN107679479A (zh) | 一种基于图像形态学处理的客观填涂识别方法 | |
CN102750531A (zh) | 用于票据文档定位格的手写体标记符号检测方法 | |
CN100492396C (zh) | 一种面向摄像整纬器的织物纹理图像识别方法 | |
CN102831578B (zh) | 图像处理方法和图像处理设备 | |
JP2004178229A (ja) | 人の存在位置検出装置とその検出方法及び同検出装置を用いた自律移動装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Address after: 250101, Bole Road, hi tech Zone, Shandong, Ji'nan, 128 Applicant after: SHANDONG SHANDA OUMA SOFTWARE CO., LTD. Address before: 250101, Bole Road, hi tech Zone, Shandong, Ji'nan, 128 Applicant before: Shandong Shanda Ouma Software Co., Ltd. |
|
COR | Change of bibliographic data | ||
GR01 | Patent grant | ||
GR01 | Patent grant |