CN104077562B - 一种答卷的扫描方向判断方法 - Google Patents

一种答卷的扫描方向判断方法 Download PDF

Info

Publication number
CN104077562B
CN104077562B CN201410218996.3A CN201410218996A CN104077562B CN 104077562 B CN104077562 B CN 104077562B CN 201410218996 A CN201410218996 A CN 201410218996A CN 104077562 B CN104077562 B CN 104077562B
Authority
CN
China
Prior art keywords
matching
image
scanning direction
horizontal linear
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410218996.3A
Other languages
English (en)
Other versions
CN104077562A (zh
Inventor
马磊
刘江
张华英
张杉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHANDONG SHANDA OUMA SOFTWARE CO Ltd
Original Assignee
SHANDONG SHANDA OUMA SOFTWARE CO Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHANDONG SHANDA OUMA SOFTWARE CO Ltd filed Critical SHANDONG SHANDA OUMA SOFTWARE CO Ltd
Priority to CN201410218996.3A priority Critical patent/CN104077562B/zh
Publication of CN104077562A publication Critical patent/CN104077562A/zh
Application granted granted Critical
Publication of CN104077562B publication Critical patent/CN104077562B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Analysis (AREA)

Abstract

本发明公开了一种答卷的扫描方向判断方法,其特征在于,包括如下步骤:(1)扫描答卷,获得答卷图像;(2)计算答卷图像的最佳分割阈值;(3)检测水平直线特征点;(4)检测垂直直线特征点;(5)水平直线特征点和垂直直线特征点进行匹配;(6)生成模板数据;(7)判断扫描方向。本发明设计了一种直线特征点之间的相似度指标计算方法,该方法考虑了匹配率和匹配精度两种因素,具有准确率高、算法时间复杂度低且易于实现的优点;在扫描方向判断算法的设计上,使用水平直线检测或者垂直直线检测的多个直线模式与模板数据做匹配算法,因此算法具有非常高的稳定性。该方法广泛应用于答卷图像的扫描、分析、识别等领域。

Description

一种答卷的扫描方向判断方法
技术领域
本发明涉及电子化阅卷领域,具体地讲,涉及一种答卷的扫描方向判断方法。
背景技术
答卷在教育领域中仍然发挥着非常重要的作用,答卷经高速采集设备扫描得到答卷图像,这些图像一般存储于计算机,提供给数字化网上阅卷系统使用。
常用的答卷扫描方向判断方法使用特殊标记点的识别方法,例如缺角识别方法和方块标记点识别方法,这些方法具有识别速度快、准确性高的特点,非常适合于标准化考试领域。对于普通中学领域,缺乏足够的信息卡设计专业人员,因此基于特殊标记点识别的扫描方向判断受到很大的限制。为此本发明研究了基于答卷直线结构的扫描方向判断方法,该方法不受标记点识别方法的限制条件,具有更广泛的应用性。
常用的直线检测包括Hough变换检测方法和有向单连通链检测方法,Hough变换检测方法具有几何解析性简单、鲁棒性好、易于实现的特点,但也有很多缺点,比如时间复杂性高、存储空间要求较高、不能判断线段的端点和长度等。基于有向单连通链的方法虽然可以定位线段的端点和长度,但是通常需要估计连通链的最小长度、连通链的合并和伪连通链的消除等方法,时间复杂度较高,不适合实时图像处理的应用场合。
本发明提出了一种快速的水平直线和垂直直线特征点检测方法,使用直线特征之间的匹配方法定量分析直线特征之间的相似性,给出相似性评价指标。
2.扫描答卷图像的特点
答卷图像是一种特殊的文档图像,具有一定的版面结构特征。一般答卷图像都含有直线信息,并且包含部分文字内容,考生作答后,字符在尺寸、颜色等方面差别加大,使得答卷图像的分析工作变得相对复杂。
常用的答卷图像方向判别使用标记点识别方法,一般是一些容易识别的标记块。
如图1所示,是典型的带标记点的答卷图像(图像左下方的黑色矩形),仅通过识别这些黑色矩形就可以确定答卷的扫描方向,这种方法具有识别快速、准确性高的特点。
但是随着数字化网上阅卷技术的普及,大量的普通中学开始自行组织数字化网上阅卷项目,答卷的制作、学生考试、答卷扫描、网上阅卷不在依赖专业的技术公司人员,同时给答卷图像的分析工作提出了更高的要求,其中出现了大量的不规范的答卷,标记点的尺寸也缺乏统一的标准,因此研究基于直线特征的扫描方向判别显得尤其重要。
如图2所示,图像中不存在用于判断扫描方向的标记点,一般通过图像的直线特征分析图像的扫描方向。该答卷图像较复杂,直线特征比较明显,并且直线对应的线段在颜色深浅、粗细、长短方面变化比较大,而且字符包含了中文、英文字符,字符的排列方向上有横排、竖排,字符尺寸变化较大,这些因素增加了直线分析的难度。
发明内容
本发明要解决的技术问题是提供一种答卷的扫描方向判断方法,具有较高的准确性和稳定性,时间复杂度低易于实现。
本发明采用如下技术手段实现发明目的:
与现有技术相比,本发明的优点和积极效果是:本发明的直线特征点检测算法计算稳定、高效,并且具有一定的自适应能力,检测行步长或者列步长具有自适应能力;直线的特征点检测算法可处理图像偏斜、直线断裂等复杂情况;直线特征点之间的匹配算法计算稳定、可靠,扫描方向判定方法计算简单、高效,实际计算结果表明该算法可以非常稳定地确定答卷图像的扫描方向;该直线特征点检测、匹配方法可用于其他图像处理领域,例如基于直线检测的文档图像倾斜角估计、表格分析、表格识别等领域。
附图说明
图1为典型的标记点识别方法判断答卷扫描方向示意图。
图2为典型的无标记点的答卷图像。
图3为像素灰度增强邻域选择标识图。
图4为水平直线左边、右边连续像素标识图。
图5为水平直线特征点检测流程图。
图6为水平直线上面、下面连续像素标识图。
图7为垂直直线特征点检测流程图。
图8(a)为水平直线长度较短的特征点检测效果图;图8(b)为水平直线长度较长的特征点检测效果图。
图9(a)为扫描效果较差的原始表格图像;图9(b)为垂直直线特征点检测标记结果图。
图10(a)为水平直线倾斜的原始扫描图像;图10(b)倾斜图像的水平特征点检测标记结果图。
图11为图10(a)的水平直线模板数据计算结果。
图12为图10(a)的垂直直线模板数据计算结果。
图13(a)为普通答卷模板图像;图13(b)为扫描方向为0时的扫描图像;图13(c)为扫描方向为1时的扫描图像;图13(d)为扫描方向为3时的扫描图像。
具体实施方式
下面结合附图和优选实施例对本发明作更进一步的详细描述。
1.快速直线特征点检测算法
1.1答卷图像的最佳分割阈值计算方法
本发明研究的扫描答卷图像采用100dpi扫描,扫描灰度位深为8,本发明使用k均值聚类方法实现答卷图像的二值化,(k=2:前景为直线文字等、背景为空白区域,分割阈值初值设置为128),使用迭代方法得到最优分割阈值。这种全局聚类方法在一致的图像区域保证全局最优,是一种非常有效的最佳分割阈值计算方法,该算法的核心思想是找出k个聚类中心,使得每一个样本数据点与其最近的聚类中心的平方距离和最小化,计算步骤:
(1)计算图像的直方图H,满足
(2)根据灰度分割阈值T0(初值为128),计算两个聚类中心(前景聚类中心C0、背景聚类中心C1),满足:
(3)根据前景、背景的聚类中心,得到分割阈值T1,满足条件:
(4)若T0==T1,迭代停止,转步骤(5),否则令T0=T1,重复执行步骤(2);(5)输出最佳灰度分割阈值T1。
1.2水平直线特征点检测算法
为了能够快速地检测到直线对应的特征点,记水平直线检测的列位置总数为Nh,一般取Nh=32,假设图像的宽度表示为W,则列位置的间隔(步长)Sh表示为:
Sh=W/Nh (5)
因此所有的列位置的集合可以表示为:
Ph={pi|i*Sh},i=0,1,2,...(Nh-1) (6)
依次判断每个列位置上的行位置处像素灰度是否满足水平直线的特征点,水平直线的特征点满足两个基本条件:
条件(1):该位置处的像素灰度小于最佳灰度分割阈值T1,如果该位置处的像素灰度大于等于T1,则增强该位置处的像素灰度,增强后的像素灰度如果小于固定灰度阈值TD=128,则仍认为该位置处的原始像素灰度小于最佳分割阈值T1,选择在该位置处增强灰度,将大大提高直线检测的稳定性,同时又保证了水平直线特征点检测的速度(大大减少了需要灰度增强的像素位置)。
如图3所示,“*”标识当前需要灰度增强的像素位置,水平和垂直方向上的邻域选择为{-2,-1,0,1,2},首先计算该邻域内所有像素的平均灰度M,当前像素的灰度为g,增强因子记为σ,则增强后的灰度g'计算为:
g'=g+σ*(g-M) (7)
增强相关的邻域尺寸与检测直线的宽度(粗细)有关,经大量样本反复实验,一般设置为待检测直线的宽度(图3所示邻域尺寸为2),增强因子一般设置为6.0,该值越大,越能够从极低质量的图像中检测出特征点,但是会增加伪特征点被检测出来的概率。
条件(2):该位置处左边至少有连续Lh(根据水平直线的特点和检测要求,一般取32即可满足要求)个像素位置满足条件(1),或者该位置处右边至少有连续Lh个像素位置满足条件(1),或者该位置处左边与右边总共至少有连续Lh个像素位置满足条件(1)。
如图4所示,“*”表示当前需要判断的像素位置,左边连续像素判断位置为0,1,2表示的位置,右边连续像素判断位置为3,4,5表示的位置,“X”表示不需要判断的位置。
假设水平直线的最大宽度(粗细)为wh,如果找到了一个水平特征点位置(i,j)后,下一个特征点检测位置为(i+wh,j),这样实际上检测了直线的下边缘位置,这样将大大提高直线检测的效率。
一般来说,水平的直线的长度不会覆盖图像整个宽度空间,因此每个列上至少检测到一个直线特征点的列的总数Dh一般会小于Nh,如果Dh太小,会影响直线检测精度和后期的匹配算法,因此规定一个初值Rh,如果(Dh/Nh)<Rh(一般取Rh=0.90)成立,则重新调整Sh为Sh'如下:
Sh'=Sh*(Dh/Nh) (8)
经过列的步长调整后,重新检测特征点,输出所有列位置上的水平直线特征点,列位置的总数Nh'
Nh'=W/Sh' (9)
水平直线特征点检测流程图如图5所示.水平直线特征点需满足上述水平直线特征点条件(1)和条件(2),所有列的检测总数Dh一般是需要调整的(调整列的步长),发生在以下两种情况之一:
条件(1):水平直线的长度不足以覆盖待检测图像的宽度;
条件(2):尽管水平直线的长度接近(例如覆盖90%的图像宽度)待检测图像的宽度,但是水平直线的质量较差,以至于部分水平直线特征点没有检测出来。
1.3垂直直线特征点检测算法
垂直直线特征点的检测算法与水平直线特征点的检测算法在思路上是一致的,记垂直直线检测的行位置总数为Nv,一般取Nv=32,假设图像的高度表示为H,则行位置的间隔(步长)Sv表示为:
Sv=H/Nv (10)
因此所有的行位置的集合可以表示为:
Pv={pi|i*Sv},i=0,1,2,...(Nv-1) (11)
依次判断每个行位置上的列位置处像素灰度是否满足垂直直线的特征点,垂直直线的特征点满足两个基本条件:
条件(1):该位置处的像素灰度小于最佳灰度分割阈值T1,如果该位置处的像素灰度大于等于T1,则增强该位置处的像素灰度,增强后的像素灰度如果小于固定灰度阈值TD=128,则仍认为该位置处的原始像素灰度小于最佳分割阈值T1,选择在该位置处增强灰度(增强算法按照公式(7)计算),将大大提高直线检测的稳定性,同时又保证了垂直直线特征点检测的速度(大大减少了需要灰度增强的像素位置)。
条件(2):该位置处上面至少有连续Lv(根据垂直直线的特点和检测要求,一般取32即可满足要求)个像素位置满足条件(1),或者该位置处下面至少有连续Lv个像素位置满足条件(1),或者该位置处上面与下面总共至少有连续Lv个像素位置满足条件(1)。
如图6所示,“*”表示当前需要判断的像素位置,上面连续像素判断位置为0,1,2表示的位置,下面边连续像素判断位置为3,4,5表示的位置,“X”表示不需要判断的位置。
假设垂直直线的最大宽度(粗细)为wv,如果找到了一个垂直特征点位置(i,j)后,下一个特征点检测位置为(i,j+wv),这样实际上检测了直线的左边缘位置,这样将大大提高直线检测的效率。
一般来说,垂直直线的长度不会覆盖图像整个高度空间,因此每个行上至少检测到一个直线特征点的行的总数Dv一般会小于Nv,如果Dv太小,会影响直线检测精度和后期的匹配算法,因此规定一个初值Rv,如果(Dv/Nv)<Rv(一般取Rv=0.90)成立,则重新调整Sv为Sv'如下:
Sv'=Sv*(Dv/Nv) (12)
经过行的步长调整后,重新检测特征点,输出所有行位置上的垂直直线特征点,行位置的总数Nv'
Nv'=H/Sv' (13)
垂直直线特征点检测流程图:如图7所示,垂直直线特征点需满足上述垂直直线特征点条件(1)和条件(2),所有行的检测总数Dv一般是需要调整的(调整行的步长),发生在以下两种情况之一:
条件(1):垂直直线的长度不足以覆盖待检测图像的高度;
条件(2):尽管垂直直线的长度接近(例如覆盖90%的图像高度)待检测图像的高度,但是垂直直线的质量较差,以至于部分垂直直线特征点没有检测出来。
2.直线特征点之间的匹配算法
水平或者垂直直线特征点检测完成后,输出直线对应的特征点的坐标,这些坐标构成了图像中的水平直线或者垂直直线的模式。为了讨论的方便性,使用两个集合表示某两个行或者某两个列检测到的直线特征点的位置(直线特征点的位置构成直线模式)。
Li={p0,p1,...pm-1}
Lj={q0,q1,...qn-1} (14)
i≠j
公式(14)表示在第i个位置检测到了m个直线特征点的坐标,在第j个位置检测到了n个直线特征点的坐标,因为直线检测是按照坐标从小到大顺序检测的,因此满足下列不等式:
p0<p1<p2<,...<pm-1 (15)
q0<q1<q2<,...<qn-1
这样直线特征点之间的匹配问题等价于两个位置集合之间的最佳匹配问题,并且两个集合中的坐标满足公式(15)的要求,所有可能的匹配模式总数C=m*n,假定集合Li中的第α个位置和集合Lj中的第β个位置是匹配的,定义该匹配模式的相似度Sα,β为:
Sα,β=RM*EM
RM∈[0,1] (16)
EM∈[0,1]
其中RM表示匹配率,EM表示匹配精度,匹配率和匹配精度越大越好,集合Li中的第α个位置和集合Lj中的第β个位置匹配时,按下列方式判断是否匹配:
其中T表示系统容许的最大匹配误差参数,一般设置为6,越大表示越容易匹配,越小表示系统要求的匹配精度越高,f(pα,qβ)=1表示两个点是匹配的,否则两个点不匹配(不匹配时匹配误差记为0),匹配的两个点按如下方式计算两个点位置的匹配误差:
e(pα,qβ)=|pα-qβ|/T (18)
计算Sα,β时,先按如下方式调整集合Li和Lj
Li={p0-pα,p1-pα,...pm-1-pα}={p'0,p1',...p'm-1}
Lj={q0-qβ,q1-qβ,...qn-1-qβ}={q'0,q1',...q'm-1} (19)
i≠j
按公式(19)调整后,集合Li中第α个位置处的坐标为0,同理集合Lj中第β个位置处的坐标为0。下面计算集合Li中第k个点的坐标在集合Lj中的匹配点对应的下标k',该下标满足条件:
min(|p'k-qkk'|),kk=0,1,2...m-1 (20)
根据公式(20)可以计算出集合Li中每个点的下标ui在集合Lj中匹配的下标vi,记匹配对应关系为:
M={(ui,vi)|i=0,1,2,...(m-1)} (21)
根据匹配对应关系,计算匹配率和匹配精度如下:
将公式(22)带入公式(16)即可得到Sα,β,因此直线特征点之间的匹配问题等价于如下最大值问题:
maxSα,β
α=0,1,2,...(m-1) (23)
β=0,1,2,...(n-1)
3.模板数据生成方法
在扫描方向判断时,首先选取一张质量较好的扫描图像(用于生成模板数据,用于生成模板数据的图像称为模板图像),执行水平直线特征点检测或者垂直直线特征点检测步骤,为了叙述的方便性,假设该扫描图像只含有水平直线,经水平直线检测步骤,最终得到Dh个列检测位置,每个列检测位置对应一个水平直线模式,按如下方式选择最佳直线模式:
(1)每个水平直线模式都记录了水平直线的位置,计算每个水平直线模式中水平直线位置的个数,如果Dh个水平直线模式中水平直线位置的个数的最大值只有一个,那么直接给出直线模式对应的特征点数据作为模板数据,同时可信度标记为0,这时需要人工确认模板数据正确性以免发生错误;否则转步骤(2)。
(2)如果Dh个水平直线模式中水平直线位置的个数的最大值大于1个,那么根据直线特征点之间的匹配算法两两计算它们之间的匹配相似度,把匹配相似度最大的两个直线模式之一作为模板数据输出,可信度即为这两个直线模式之间的匹配相似度,相似度小于给定的阈值(例如0.95),则需要人工确认模板数据的正确性。
4.扫描方向判断方法
一般来说,扫描图像的宽度和高度是不相等的,而且差别比较大,因此扫描方向判断时,可以根据宽度和高度的大小关系确定答卷是横向扫描的还是纵向扫描的,为了叙述的方便性,假设只用图1所示的水平直线特征点判定扫描方向,并且规定扫描图像正常(如图1所示)用方向0表示,扫描图像(图1所示)顺时针旋转90度、180度、270度时,依次用方向1、方向2、方向3表示,则某个待确定图像的扫描方向按如下步骤确定:
(1)对模板图像执行水平直线特征点检测并生成模板数据η0(如图1所示,扫描方向为方向0),记录图像的宽度W0和高度H0之间的大小关系Ω0,根据模板数据η0(模板数据中有m个水平直线特征点坐标)生成数据η2:
η0={pi|i=0,1,2,...(m-1)} (24)
η2={H0-pi|i=0,1,2,...(m-1)}
(2)输入待确定扫描方向的图像I;
(3)图像I的宽度W1和高度H1之间的大小关系Ω1如果与Ω一致,则图像I的扫描方向为方向0或者方向2,转步骤(4),否则图像I的扫描方向为方向1或者方向3,转步骤(7);
(4)检测图像I的水平直线特征点,输出所有列位置上的水平直线特征点,假设最终输出了N个水平直线模式Ψ={ψ012...ψN-1},根据直线特征点之间的匹配算法计算模板数据η0与N个水平直线模式Ψ之间的相似度,得到N个相似度Sη0,Ψ,同理计算模板数据η2与N个水平直线模式Ψ之间的相似度,得到N个相似度Sη2,Ψ
Sη0,Ψ={sη0,i|i=0,1,2...(N-1)} (25)
Sη2,Ψ={sη2,i|i=0,1,2...(N-1)}
(5)计算Sη0,Ψ中最大的相似度,记为sη,0,计算Sη2,Ψ中最大的相似度,记为sη,2;(6)如果sη,0>(sη,2+δ),则图像I的扫描方向为方向0,其中δ为可靠性控制参数,一般取值为0.1(当sη,0与sη,2很接近时需要人工确认扫描方向),如果(sη,0+δ)<sη,2,图像I的扫描方向为方向2,否则图像I的扫描方向不能确定,给出提示信息,人工确认扫描方向。
(7)检测图像I的垂直直线特征点,输出所有行位置上的垂直直线特征点,假设最终输出了K个垂直直线模式根据直线特征点之间的匹配算法计算模板数据η0与K个垂直直线模式之间的相似度,得到K个相似度同理计算模板数据η2与K个垂直直线模式之间的相似度,得到K个相似度
(8)计算中最大的相似度,记为sη,1,计算中最大的相似度,记为sη,3
(9)如果sη,1>(sη,3+δ),则图像I的扫描方向为方向1,如果(sη,1+δ)<sη,3,图像I的扫描方向为方向3,否则图像I的扫描方向不能确定,给出提示信息,人工确认扫描方向。
如图8(a)、图8(b)所示,初值Nh=32,图像中的“□”表示检测到的水平直线特征点的位置,水平直线的长度较短时,列的检测步长也较小(图8(a)),水平直线的长度较大(图8(b)),列的检测步长较大,算法具有一定的自适应能力,从而保证检测到的水平直线的特征点在数量上保持一致,图8(a)检测到了29个水平直线特征点,图8(b)检测到了31个水平直线特征点,均与Nh接近。
4.2垂直直线特征点检测效果
垂直直线特征点的检测算法具有一定的自适应能力,为了观察垂直直线特征点检测的稳定性,使用结构比较复杂的表格图像做测试。
如图9(a)、图9(b)所示,初值Nv=32,图像中的“□”表示检测到的垂直直线特征点的位置,可有效检测图像中的倾斜直线。
4.3倾斜图像直线特征点检测效果
如图10所示,初值Nh=32,图像中的“□”表示检测到的水平直线特征点的位置,直线特征点检测算法对倾斜角度不敏感,可正确定位水平直线特征点的位置。
4.4模板数据生成效果
如图11所示,Nh=32,图像中的“□”表示检测到的水平直线特征点的位置,对应的模板数据可信度为0.9722,总共有39个水平直线特征点,他们代表39条水平直线。
如图11所示,Nv=32,图像中的“□”表示检测到的垂直直线特征点的位置,对应的模板数据可信度为1.0,总共有5个垂直直线特征点,他们代表5条垂直直线。
4.5扫描方向判断实验效果
如图13所示,普通答卷扫描图像,其中(a)作为模板图像,使用水平直线特征点判断扫描方向,计算结果如下:
表1扫描方向判断计算结果
如表1所示,根据计算结果,可以判定图13(b)的扫描方向为方向0,图13(c)的扫描方向为方向1,图13(d)的扫描方向为方向3。

Claims (4)

1.一种答卷的扫描方向判断方法,其特征在于,包括如下步骤:
(1)扫描答卷,获得答卷图像;
(2)计算答卷图像的最佳分割阈值;
(3)检测水平直线特征点;
(4)检测垂直直线特征点;
(5)水平直线特征点和垂直直线特征点进行匹配;
(6)生成模板数据;
(7)判断扫描方向;
所述步骤(3)包括如下步骤:
(3.1)记水平直线检测的列位置总数为Nh,一般取Nh=32,假设图像的宽度表示为W,则列位置的间隔步长Sh表示为:
Sh=W/Nh (5)
因此所有的列位置的集合可以表示为:
Ph={pi|i*Sh},i=0,1,2,...(Nh-1) (6)
依次判断每个列位置上的行位置处像素灰度是否满足水平直线的特征点;
(3.2)设定一个初值Rh,如果(Dh/Nh)<Rh成立,取Rh=0.90,则重新调整Sh为Sh'如下:
Sh'=Sh*(Dh/Nh) (8)
(3.3)输出所有列位置上的水平直线特征点,列位置的总数Nh'
Nh'=W/Sh'
经过列的步长调整后,重新检测特征点Dh
所述步骤(4)包括如下步骤:
使用两个集合表示某两个行或者某两个列检测到的直线特征点的位置,直线特征点的位置构成直线模式,
Li={p0,p1,...pm-1}
Lj={q0,q1,...qn-1} (14)
i≠j
公式(14)表示在第i个位置检测到了m个直线特征点的坐标,在第j个位置检测到了n个直线特征点的坐标,因为直线检测是按照坐标从小到大顺序检测的,因此满足下列不等式:
p0<p1<p2<,...<pm-1 (15)
q0<q1<q2<,...<qn-1
这样直线特征点之间的匹配问题等价于两个位置集合之间的最佳匹配问题,并且两个集合中的坐标满足公式(15)的要求,所有可能的匹配模式总数C=m*n,假定集合Li中的第α个位置和集合Lj中的第β个位置是匹配的,定义该匹配模式的相似度Sα,β为:
Sα,β=RM*EM
RM∈[0,1] (16)
EM∈[0,1]
其中RM表示匹配率,EM表示匹配精度,匹配率和匹配精度越大越好,集合Li中的第α个位置和集合Lj中的第β个位置匹配时,按下列方式判断是否匹配:
其中T表示系统容许的最大匹配误差参数,一般设置为6,越大表示越容易匹配,越小表示系统要求的匹配精度越高,f(pα,qβ)=1表示两个点是匹配的,否则两个点不匹配,不匹配时匹配误差记为0,匹配的两个点按如下方式计算两个点位置的匹配误差:
e(pα,qβ)=|pα-qβ|/T (18)
计算Sα,β时,先按如下方式调整集合Li和Lj
Li={p0-pα,p1-pα,...pm-1-pα}={p'0,p′1,...p'm-1}
Lj={q0-qβ,q1-qβ,...qn-1-qβ}={q'0,q′1,...q'm-1} (19)
i≠j
按公式(19)调整后,集合Li中第α个位置处的坐标为0,同理集合Lj中第β个位置处的坐标为0,下面计算集合Li中第k个点的坐标在集合Lj中的匹配点对应的下标k',该下标满足条件:
min(|p'k-q′kk|),kk=0,1,2...m-1 (20)
根据公式(20)可以计算出集合Li中每个点的下标ui在集合Lj中匹配的下标vi,记匹配对应关系为:
M={(ui,vi)|i=0,1,2,...(m-1)} (21)
根据匹配对应关系,计算匹配率和匹配精度如下:
将公式(21)、公式(22)带入公式(16)即可得到Sα,β,因此直线特征点之间的匹配问题等价于如下最大值问题:
max Sα,β
α=0,1,2,...(m-1) (23)
β=0,1,2,...(n-1)
所述步骤(6)包括如下步骤:
(6.1)对模板图像执行水平直线特征点检测并生成模板数据η0,扫描方向为方向0,记录图像的宽度W0和高度H0之间的大小关系Ω0,根据模板数据η0生成数据η2,模板数据中有m个水平直线特征点坐标:
(6.2)输入待确定扫描方向的图像I;
(6.3)图像I的宽度W1和高度H1之间的大小关系Ω1如果与Ω一致,则图像I的扫描方向为方向0或者方向2,转步骤(6.4),否则图像I的扫描方向为方向1或者方向3,转步骤(6.7);
(6.4)检测图像I的水平直线特征点,输出所有列位置上的水平直线特征点,假设最终输出了N个水平直线模式Ψ={ψ012...ψN-1},根据直线特征点之间的匹配算法计算模板数据η0与N个水平直线模式Ψ之间的相似度,得到N个相似度Sη0,Ψ,同理计算模板数据η2与N个水平直线模式Ψ之间的相似度,得到N个相似度Sη2,Ψ
(6.5)计算Sη0,Ψ中最大的相似度,记为sη,0,计算Sη2,Ψ中最大的相似度,记为sη,2
(6.6)如果sη,0>(sη,2+δ),则图像I的扫描方向为方向0,其中δ为可靠性控制参数,一般取值为0.1,如果(sη,0+δ)<sη,2,图像I的扫描方向为方向2,否则图像I的扫描方向不能确定,给出提示信息,人工确认扫描方向,
(6.7)检测图像I的垂直直线特征点,输出所有行位置上的垂直直线特征点,假设最终输出了K个垂直直线模式根据直线特征点之间的匹配算法计算模板数据η0与K个垂直直线模式之间的相似度,得到K个相似度同理计算模板数据η2与K个垂直直线模式之间的相似度,得到K个相似度
(6.8)计算中最大的相似度,记为sη,1,计算中最大的相似度,记为sη,3
(6.9)如果sη,1>(sη,3+δ),则图像I的扫描方向为方向1,如果(sη,1+δ)<sη,3,图像I的扫描方向为方向3,否则图像I的扫描方向不能确定,给出提示信息,人工确认扫描方向。
2.根据权利要求1所述的答卷扫描方向判断方法,其特征在于,所述步骤(2)包括如下步骤:
(2.1)计算图像的直方图H,满足
(2.2)根据灰度分割阈值T0初值为128,计算两个聚类中心,前景聚类中心C0、背景聚类中心C1,满足:
(2.3)根据前景、背景的聚类中心,得到分割阈值T1,满足条件:
(2.4)若T0==T1,迭代停止,转步骤(5),否则令T0=T1,重复执行步骤(2);
(2.5)输出最佳灰度分割阈值T1。
3.根据权利要求1所述的答卷扫描方向判断方法,其特征是:所述步骤(3.1)的水平直线的特征点满足两个基本条件:
条件(1):该位置处的像素灰度小于最佳灰度分割阈值T1,如果该位置处的像素灰度大于等于T1,则增强该位置处的像素灰度,增强后的像素灰度如果小于固定灰度阈值TD=128,则仍认为该位置处的原始像素灰度小于最佳分割阈值T1,选择在该位置处增强灰度,将大大提高直线检测的稳定性,同时又保证了水平直线特征点检测的速度;首先计算选择增强灰度位置邻域内所有像素的平均灰度M,当前像素的灰度为g,增强因子记为σ,则增强后的灰度g'计算为:
g'=g+σ*(g-M) (7)
增强相关的邻域尺寸与检测直线的宽度(粗细)有关,经大量样本反复实验,一般设置为待检测直线的宽度,增强因子一般设置为6.0,该值越大,越能够从极低质量的图像中检测出特征点,但是会增加伪特征点被检测出来的概率;
条件(2):该位置处左边至少有连续Lh个像素位置满足条件(1),或者该位置处右边至少有连续Lh个像素位置满足条件(1),或者该位置处左边与右边总共至少有连续Lh个像素位置满足条件(1)。
4.根据权利要求1所述的答卷扫描方向判断方法,其特征在于,所述步骤(5)包括如下步骤:
(5.1)每个水平直线模式都记录了水平直线的位置,计算每个水平直线模式中水平直线位置的个数,如果Dh个水平直线模式中水平直线位置的个数的最大值只有一个,那么直接给出直线模式对应的特征点数据作为模板数据,同时可信度标记为0,这时需要人工确认模板数据正确性以免发生错误;否则转步骤(5.2);
(5.2)如果Dh个水平直线模式中水平直线位置的个数的最大值大于1个,那么根据直线特征点之间的匹配算法两两计算它们之间的匹配相似度,把匹配相似度最大的两个直线模式之一作为模板数据输出,可信度即为这两个直线模式之间的匹配相似度,相似度小于给定的阈值,则需要人工确认模板数据的正确性。
CN201410218996.3A 2014-05-22 2014-05-22 一种答卷的扫描方向判断方法 Active CN104077562B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410218996.3A CN104077562B (zh) 2014-05-22 2014-05-22 一种答卷的扫描方向判断方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410218996.3A CN104077562B (zh) 2014-05-22 2014-05-22 一种答卷的扫描方向判断方法

Publications (2)

Publication Number Publication Date
CN104077562A CN104077562A (zh) 2014-10-01
CN104077562B true CN104077562B (zh) 2017-08-08

Family

ID=51598810

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410218996.3A Active CN104077562B (zh) 2014-05-22 2014-05-22 一种答卷的扫描方向判断方法

Country Status (1)

Country Link
CN (1) CN104077562B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106033534B (zh) * 2015-03-18 2020-01-31 成都理想境界科技有限公司 基于直线检测的电子阅卷方法
CN106503637A (zh) * 2016-10-12 2017-03-15 北京新晨阳光科技有限公司 答卷处理系统
CN111582153B (zh) * 2020-05-07 2023-06-30 北京百度网讯科技有限公司 确定文档朝向的方法和装置
CN113177433A (zh) * 2021-03-17 2021-07-27 北京焦耳科技有限公司 一种试卷扫描识别方法、设备及介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101882215A (zh) * 2009-05-25 2010-11-10 汉王科技股份有限公司 判断文本区域排版方向的方法
CN102567302A (zh) * 2010-12-27 2012-07-11 北大方正集团有限公司 排版方式识别方法和装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4404095B2 (ja) * 2005-01-11 2010-01-27 日本電気株式会社 テンプレートマッチングのための方法、その装置及びそのためのプログラムを記録した記録媒体

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101882215A (zh) * 2009-05-25 2010-11-10 汉王科技股份有限公司 判断文本区域排版方向的方法
CN102567302A (zh) * 2010-12-27 2012-07-11 北大方正集团有限公司 排版方式识别方法和装置

Also Published As

Publication number Publication date
CN104077562A (zh) 2014-10-01

Similar Documents

Publication Publication Date Title
CN105913093B (zh) 一种用于文字识别处理的模板匹配方法
CN111161243B (zh) 基于样本增强的工业产品表面缺陷检测方法
US7590275B2 (en) Method and system for recognizing a candidate character in a captured image
CN106096610B (zh) 一种基于支持向量机的文档图像二值化方法
CN104239850B (zh) 基于图像综合特征的答题卡填涂信息自动识别方法
Gebhardt et al. Document authentication using printing technique features and unsupervised anomaly detection
CN109460762B (zh) 一种基于图像识别的答题卡评分方法
CN103310211B (zh) 一种基于图像处理的填注标记识别方法
CN104143094A (zh) 一种无需答题卡的试卷自动阅卷处理方法及系统
CN103559490A (zh) 基于二值图像连通域统计的答题卡自动评分方法
CN110211048A (zh) 一种基于卷积神经网络的复杂档案图像倾斜矫正方法
CN104077562B (zh) 一种答卷的扫描方向判断方法
CN109738450B (zh) 笔记本键盘的检测方法和装置
CN108734235A (zh) 一种用于电子处方的身份识别方法及系统
US20140301608A1 (en) Chemical structure recognition tool
CN115184380B (zh) 基于机器视觉的印刷电路板焊点异常检测方法
CN106033535A (zh) 电子阅卷方法
Wah et al. Analysis on feature extraction and classification of rice kernels for Myanmar rice using image processing techniques
CN110689003A (zh) 低照度成像车牌识别方法、系统、计算机设备及存储介质
CN115393861B (zh) 一种手写体文本精准分割方法
CN112734729A (zh) 适用于夜间补光条件的水尺水位线图像检测方法、装置及存储介质
CN114998293A (zh) 水位检测方法、装置及电子设备
CN113139535A (zh) 一种ocr文档识别方法
CN109741273A (zh) 一种手机拍照低质图像的自动处理与评分方法
CN115880566A (zh) 一种基于视觉分析的智能阅卷系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 250101, Bole Road, hi tech Zone, Shandong, Ji'nan, 128

Applicant after: SHANDONG SHANDA OUMA SOFTWARE CO., LTD.

Address before: 250101, Bole Road, hi tech Zone, Shandong, Ji'nan, 128

Applicant before: Shandong Shanda Ouma Software Co., Ltd.

COR Change of bibliographic data
GR01 Patent grant
GR01 Patent grant