CN107766854B - 一种基于模板匹配实现快速页码识别的方法 - Google Patents

一种基于模板匹配实现快速页码识别的方法 Download PDF

Info

Publication number
CN107766854B
CN107766854B CN201710899531.2A CN201710899531A CN107766854B CN 107766854 B CN107766854 B CN 107766854B CN 201710899531 A CN201710899531 A CN 201710899531A CN 107766854 B CN107766854 B CN 107766854B
Authority
CN
China
Prior art keywords
image
page
gray
page number
point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710899531.2A
Other languages
English (en)
Other versions
CN107766854A (zh
Inventor
陶冰洁
王酉祥
黄景雨
刘勇
李美惠
廖龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
Original Assignee
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China filed Critical University of Electronic Science and Technology of China
Priority to CN201710899531.2A priority Critical patent/CN107766854B/zh
Publication of CN107766854A publication Critical patent/CN107766854A/zh
Application granted granted Critical
Publication of CN107766854B publication Critical patent/CN107766854B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Character Input (AREA)

Abstract

本发明公开了一种基于模板匹配实现快速页码识别的方法,旨在现有技术中无法解决页码识别中数字沾连的问题而导致页码识别扫描准确率低的问题;本申请中巧妙进行页码分割和图像归一化处理,能够简单迅速解决页码粘连问题及提升页码识别的准确性,提高了整个扫描准确率,同时克服了现有技术解决页码粘连问题而浪费大量扫描时间影响扫描效率以及扫描准确性的技术难题,同时将模版与待检测页码图像均进行归一化处理,提升了后期两者之间的匹配效率从而提升扫描效率;同时本申请巧妙将后一页的页码与前一页的页码进行对比,避免了翻错和漏扫的情况,克服了现有技术书籍连续性扫描的技术难点;本申请适用于机器视觉工业应用中的智能识别领域。

Description

一种基于模板匹配实现快速页码识别的方法
技术领域
本发明属于机器视觉工业应用中的智能识别领域,具体来说,涉及一种基于模板匹配实现快速页码识别的方法。
背景技术
随着计算机和网络技术的普及,电子版文档凭借其易于储存利用、传播快捷简便的优势被越来越多的人们所接受。因此,将原来以纸作为载体的资料转化为电子版文档,也就是纸质文档的数字化无论是在日常办公中,还是在图书馆资料管理中的应用都日益增加。
非接触式扫描作为一种新型的纸质文档数字化方式,相对于接触式扫描,可以避免拆原件以及避免对原件造成损害的问题,得到了越来越多的应用,但它存在的问题也阻碍了其进一步普及。非接触式扫描采用翻页的方式来进行扫描,导致可能出现翻错和漏扫的情况,降低整个页码扫描的准确率,如在图书编辑等工作量大的情况下将会带来严重的损失;页码识别算法只是整个非接触式扫描处理的一小步,而整个处理流程是要实现人机交互的实时处理的,不能有延时,因此页码识别算法速度要求极高;低质量的印刷和打码机生成的页码可能会有数字粘连的情况,会干扰页码的识别,需要检测粘连并进行分割;对于不同字体的数字的识别,不同字体的数字会有一定的差异,不能按照单一某一种字体来处理,增加了检测的复杂度。
本申请可以通过检测书页页码连续性的方式来解决这种问题。本发明的方法就是应对这种需求,通过快速地自动识别当前书页的页码,来判断是否出现了多翻和漏扫的现象,减少人的工作量,进一步提升非接触式扫描的实用性和稳定性。该方法不仅高效快捷,而且能够保证较好的识别精度,具有实用价值。
发明内容
本发明的目的在于:针对现有技术中无法解决页码识别中数字粘连的问题而导致页码扫描准确率低的问题,本发明提供一种基于模板匹配实现快速页码识别的方法。
本发明的技术方案为:
本申请提供了一种基于模板匹配实现快速页码识别的方法,包括以下步骤:
步骤1:待检测的页码图像f′(x,y)预处理得到待匹配页码图像fi′(x,y),判断是否存在页码数字模板,如存在页码数字模板,则跳过步骤2直接执行步骤3,如不存在页码数字模板,先执行步骤2再执行步骤3;
步骤2:所需的数字0-9的模版图像经过步骤1中所述的预处理得到M×N大小的页码数字模板gjk(x,y);
具体地,先找到所需字体的字符0-9的图像作为材料,按照前面的步骤依次进行处理(不需要进行分割),得到每个数字的页码数字模板gjk(x,y)(j是该模板对应的数字,k表示图像是该图像的第k个模板),模板越多,识别的准确率越高,速度越慢。可考虑加入不同字体、不同书页倾斜度、不同光照条件等多种情况的原图像生成更多模板;
因模板匹配的方式是要将待匹配图和模板每个对应点进行对比,若原图和匹配图的字符位置一旦没有对齐,则匹配结果误差很大。为尽可能的实现对齐,将每个模板加入一定的上下或左右的位移量,生成多个模板,模板只需要生成一次;
步骤3:判断待匹配页码图像fi′(x,y)是否存在粘连情况,如存在粘连情况,则将待检测页码图像fi′(x,y)高度拉伸至M宽度等比例拉伸再进行分割并排序并宽度加宽至N大小的分割后序列图像g′i(x,y)再继续执行步骤4,如没有存在粘连情况,则直接归一化处理得到M×N大小的待匹配页码图像fi′(x,y)再执行步骤4;
步骤4:将经过步骤3处理后的分割后序列图像或待匹配页码图像fi′(x,y)与页码数字模板gjk(x,y)进行匹配,得到对应数字xi,将对应数字xi依次排列得到页码图像f′(x,y)最终的页码值x1x2…xi
具体地,还包括步骤5,具体为:
将页码图像f′(x,y)最终的页码值x1x2…xi与其前一页页码值x1′x2′…xi′进行对比验证:
x1x2…xi-x1′x2′…xi′=1
如满足上式,则说明页码识别正确。
具体地,所述步骤3具体为:
检测待匹配页码图像fi′(x,y)的宽度和高度,得到宽度与高度的比例值a,若a<1,则没有发生页码数字粘连,待匹配页码图像fi′(x,y)直接归一化处理得到M×N大小再执行步骤4;
若a>1,则存在页码数字粘连的情况,则将待匹配页码图像fi′(x,y)图像高度拉伸到统一的高度为M,宽度等比例拉伸,再将其从宽度方向正中间进行分割并从左到右进行排序并宽度增加至N得到分割后序列图像g′i(x,y),再继续执行步骤4。
具体地,所述步骤1的预处理具体为:
步骤1.1:选取页码位置符合要求的待检测书页原始图像读入初始图像f(x,y),将初始图像f(x,y)中的页码部分分割出来为页码图像f′(x,y),再转化为灰度图像f′gray(x,y);
步骤1.2:将步骤1处理得到的灰度图像f′gray(x,y)进行最小值滤波得到滤波后图像f′pre(x,y);
步骤1.3:将步骤2处理得到的滤波后图像f′pre(x,y)使用OTSU自动阈值分割法进行二值化得到二值化图像f′binary(x,y);
步骤1.4:将二值化图像f′binary(x,y)进行取反操作,提取单个数字字符的最小包含矩形得到待检测页码图像fi′(x,y)。
具体地,所述步骤1.1中转化为灰度图像f′gray(x,y)的具体步骤为:
将页码图像f′(x,y)转换成灰度图像f′gray(x,y),其中灰度图像f′gray(x,y)的每个像素点的灰度值的公式如下:
Figure GDA0002944102410000031
其中,Rf(x,y)表示页码图像f′(x,y)红色通道每个像素点的像素值;Gf(x,y)表示页码图像f′(x,y)绿色通道每个像素点的像素值;Bf(x,y)表示页码图像f′(x,y)蓝色通道每个像素点的像素值,(x,y)表示初始图像的每个像素点。
具体地,所述步骤1.2中灰度图像f′gray(x,y)进行最小值滤波得到滤波后图像d′pre(x,y)的具体步骤为:
将灰度图像f′gray(x,y)以一个1×2的横向模板以及一个2×1的纵向模板进行两次最小值滤波:
遍历f′gray(x,y)中的每一个像素(x0,y0),比较f′gray(x0,y0)和f′gray(x0,y0+1),若不存在(x0,y0+1),则认为f′gray(x0,y0+1)=255,令:
f′gray(x0,y0)=min(f′gray(x0,y0),f′gray(x0,y0+1))
遍历f′gray(x,y)中的每一个像素(x0,y0),比较像素值f′gray(x0,y0)和f′gray(x0+1,y0),若不存在(x0+1,y0),则认为f′gray(x0+1,y0)=255,令:
f′gray(x0,y0)=min((f′gray(x0,y0),f′gray(x0+1,y0))。
具体地,所述步骤1.3的具体为:
计算灰度图像f′gray(x,y)的灰度平均值,设为
Figure GDA0002944102410000032
对于灰度值t(0≤t≤255),遍历f′gray(x,y)的所有像素点,将所有点分成两部分,分别为灰度值小于等于t的像素点集合A和灰度值大于t的像素点集合B;
分别计算A和B中的点占所有像素点的数目占所有像素点的数目的比例,记为PA和PB,再计算A和B像素点的平均像素值,记为
Figure GDA0002944102410000041
Figure GDA0002944102410000042
计算类间方差ICVt
Figure GDA0002944102410000043
依次令t=1,2,3…255,得到所有的ICVt,比较其结果,当
Figure GDA0002944102410000045
时,t0就是得到的最佳灰度阈值,以t0为阈值,将灰度图像f′gray(x,y)转化为灰度图像二值化图像f′binary(x,y)。
具体地,所述步骤1.4具体为:
从二值化图像f′binary(x,y)中提取连通分量:从二值化图像f′binary(x,y)左上方开始遍历像素点,寻找连通分量,遍历像素点的顺序是从左往右遍历每一列,每一列中则从上往下遍历,完成一列后跳到下一列的最上方,直到遍历完所有像素;
对于像素点,若该点像素值为0,则完成该点的访问,若该点像素值不为0,则依次访问该点的8邻域,寻找是否有像素值不为0的点,对于像素值不为0的点,则进一步访问该点的8邻域,不断访问该点扩散出来的像素不为0的点的8邻域,直到所有点像素值为0,标记所有访问过的点,完成对该点的搜索,若该点扩散出来的像素为0的点数超过50个,则判断该点属于某个数字字符连通分量,记录该点为Pi,i从1开始递增,Pi表示第i个连通分量的种子点;
对于Pi,记录连通分量中的点的高度方向的上的最大坐标最小坐标,宽度方向的最大坐标最小坐标,生成一个包围该连通分量的最小矩形并记录为待匹配页码图像f′i(x,y)。
具体地,所述步骤4具体为:
将分割后序列图像g′i(x,y)或待匹配页码图像fi(x,y)与数字模板gjk(x,y)进行匹配(若进行了分割,则使用分割后序列图像g′i(x,y),若没有进行分割,则使用待匹配页码图像f′i(x,y)),对gjk(x,y)和分割后序列图像g′i(x,y)或待匹配页码图像fi(x,y)的对应点做相与,结果为1的点数目为A,再对gjk(x,y)和分割后序列图像g′i(x,y)或待匹配页码图像fi′(x,y)的点做或运算,得到的值为0的点数目为B,最后得到gjk(x,y)和分割后序列图像g′i(x,y)或待匹配页码图像fi′(x,y)的匹配度ljk
ljk=A+B
Figure GDA0002944102410000044
匹配成功,则将fi′(x,y)识别为j0,分割后序列图像或待匹配页码图像fi′(x,y)页码对应数字xi=j0
具体地,M取值为90,N取值为50。
综上所述,由于采用了上述技术方案,本发明的有益效果是:
1.本申请中巧妙进行页码分割和图像归一化处理,能够简单迅速解决页码粘连问题及提升页码识别的准确性,提高了整个扫描准确率,同时克服了现有技术解决页码粘连问题而浪费大量扫描时间影响扫描效率的技术难题,同时将模版也待检测页码图像均进行取反归一化处理,提升了后期两者之间的匹配效率从而提升扫描效率;
2.本申请主要基于模板匹配实现快速识别,在预处理,检测粘连与分割等步骤中,实现简单但快速有效的处理,耗时极少,实现了页码识别的高效快捷,而且能够保证较好的识别精度,是一种行之有效、简洁实用的方法;
3.本申请中针对页码识别中可能出现的页码倾斜,偏移,数字边缘有毛刺,多种字体等情况,提供了不同状况的对应模板,能够实现在有一定干扰条件下的识别;
4.本申请巧妙将后一页的页码与前一页的页码进行对比,避免了翻错和漏扫的情况,保证了后一页页码与前一页页码的连续性,从而提升了整个扫描过程的连续性,克服了现有技术书籍连续性准确扫描的技术难点;
5.本申请M取值90,N取值50,既不会因过大会降低扫描识别速度,也不会因为太小会导致图像不能完全表征字符特征降低识别精度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。通过附图所示,本发明的上述及其它目的、特征和优势将更加清晰。在全部附图中相同的附图标记指示相同的部分。并未刻意按实际尺寸等比例缩放绘制附图,重点在于示出本发明的主旨。
图1为本发明的流程示意图;
图2为待识别页码的的初始图像;
图3为从原图中切割出来的页码图像;
图4是最小值滤波后的页码图像;
图5是二值化后的页码图像;
图6为处理后的待匹配页码图像;
图7是制作模板的材料图像;
图8为字符0的模板。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面结合图1-图8对本发明作详细说明。
步骤1:选取页码位置符合要求的书页原始图像,读入初始图像f(x,y),将初始图像f(x,y)中的页码部分分割出来为页码图像f′(x,y),再转化为灰度图像f′gray(x,y),具体步骤如下:
步骤1.1:选取页码都固定在书页特定位置的原始图像,读入初始图像f(x,y);
步骤1.2:找出书页图像f(x,y)中的页码所在位置,切割出该部分为页码图像f′(x,y);
步骤1.3:将页码图像f′(x,y)转换成灰度图像f′gray(x,y),其中灰度图像f′gray(x,y)的每个像素点的灰度值的公式如下:
Figure GDA0002944102410000061
其中,Rf(x,y)表示初始图像页码图像f′(x,y)红色通道每个像素点的像素值;Gf(x,y)表示页码图像f′(x,y)绿色通道每个像素点的像素值;Bf(x,y)表示页码图像f′(x,y)蓝色通道每个像素点的像素值,(x,y)表示初始图像的每个像素点;
步骤2:将灰度图像f′gray(x,y)进行最小值滤波以防止字符断裂,得到f′pre(x,y);具体步骤如下:
将灰度图像f′gray(x,y)以一个1×2的横向模板以及一个2×1的纵向模板进行两次最小值滤波,以防止字符断裂,具体方法如下:
步骤2.1:遍历灰度图像f′gray(x,y)中的每一个像素(x0,y0),比较该像素值f′gray(x0,y0)和f′gray(x0,y0+1)(若不存在(x0,y0+1),则认为f′gray(x0,y0+1)=255),令
f′gray(x0,y0)=min(f′gray(x0,y0),f′gray(x0,y0+1))
步骤2.2:遍历灰度图像f′gray(x,y)中中的每一个像素(x0,y0),比较f′gray(x0,y0)和f′gray(x0+1,y0)(若不存在(x0+1,y0),则认为f′gray(x0+1,y0)=255),令
f′gray(x0,y0)=min(f′gray(x0,y0),f′gray(x0+1,y0))
步骤3:将预处理后的图像f′pre(x,y)使用OTSU自动阈值分割法进行二值化得到二值化图像f′binary(x,y);具体步骤如下:
步骤3.1:计算灰度图像f′gray(x,y)的灰度平均值,设为
Figure GDA0002944102410000075
步骤3.2:对于灰度值t(0≤t≤255),遍历f′gray(x,y)的所有像素点,将所有点分成两部分,分别为灰度值小于等于t的像素点集合A和灰度值大于t的像素点集合B;
步骤3.3:分别计算A和B中的点占所有像素点的数目占所有像素点的数目的比例,记为PA和PB,再计算A和B像素点的平均像素值,记为
Figure GDA0002944102410000071
Figure GDA0002944102410000072
步骤3.4:计算
Figure GDA0002944102410000073
依次令t=1,2,3…255,得到所有的ICVt,比较其结果,当:
Figure GDA0002944102410000074
t0就是该方法得到的最佳阈值。
步骤3.5:以t0为阈值,将灰度图像f′gray(x,y)转化为灰度图像二值化图像f′binary(x,y);
步骤4:将二值化图像f′binary(x,y)进行取反操作,提取单个数字字符的最小包含矩形,令其为fi′(x,y)。具体步骤如下:
步骤4.1:将二值化图像f′binary(x,y)进行取反操作;
步骤4.2:从二值化图像f′binary(x,y)中提取连通分量,具体方法如下:
步骤4.3:从f′binary(x,y)左上方开始遍历像素点,寻找连通分量,遍历像素点的顺序是从左往右遍历每一列,每一列中则从上往下遍历,完成一列后跳到下一列的最上方(如果遇到已经标记的点则跳过),直到遍历完所有像素;
步骤4.4:对于像素点,若该点像素值为0,则完成该点的访问;若该点像素值不为0,则依次访问该点的8邻域,寻找是否有像素值不为0的点,对于像素值不为0的点,则进一步访问该点的8邻域,不断访问该点扩散出来的像素不为0的点的8邻域,直到不存在像素不为0的点。标记所有访问过的点,完成对该点的搜索,进入下一点,若该点扩散出来的像素为0的点数超过50个,则认为该点属于某个数字字符连通分量,记录该点为Pi(i从1开始递增,Pi表示第i个连通分量的种子点);
步骤4.5:对于Pi,按照上一个步骤重新寻找该连通分量并记录连通分量中的所有点。根据这些点中高度方向的最大、最小坐标和宽度方向的最大、最小坐标,就可以找到一个包围该连通分量的最小矩形记录为矩形图像;
步骤4.6:将矩形图像在高度方向上以线性插值的方法拉伸到M(M=90)个像素长度,在宽度方向也以相同的方式进行拉伸得到待检测页码图像fi′(x,y),使长宽比例保持不变。
检查字符的可能存在的粘连情况并分割,具体方法如下:
步骤4.7:检测待匹配页码图像fi′(x,y)的宽度和高度,得到比例值a,若a<1,则认为没有发生字符粘连,待匹配页码图像fi′(x,y)直接执行步骤5;若α>1,则存在页码数字粘连的情况,则将待匹配页码图像fi′(x,y)图像高度拉伸到统一的高度为M,将待匹配页码图像fi′(x,y)(按i从小到大分别是页码中数字从左到右的图像排列)从宽度方向正中间进行分割并从左到右进行排序并沿宽度方向进行等比例拉伸再加宽到N(N=50)个像素宽度得到分割后序列图像g′i(x,y),在左右两边进行等比例加宽,新的像素点与字符的背景色相同,即像素为0,新序列图像大小变成M×N个像素点,此时就完成了对页码的提取和增强;
步骤5:建立页码模板(若模板已经存在则跳过),具体步骤如下:
步骤5.1:先找到所需字体的字符0-9的图像作为材料,按照前面的步骤依次进行处理(不需要进行分割),得到每个数字的页码数字模板gjk(x,y)(j是该模板对应的数字,k表示图像是该图像的第k个模板),模板越多,识别的准确率越高,速度越慢。可考虑加入不同字体、不同书页倾斜度、不同光照条件等多种情况的原图像生成更多模板。
步骤5.2:因模板匹配的方式是要将待匹配图和模板每个对应点进行对比,若原图和匹配图的字符位置一旦没有对齐,则匹配结果误差很大。为尽可能的实现对齐,将每个模板加入一定的上下或左右的位移量,生成多个模板,模板只需要生成一次;
步骤6:将待检测页码fi′(x,y)或者新序列图像与模板进行匹配,得到对应页码数字xi,具体步骤如下:
步骤6.1:将待匹配页码图像fi′(x,y)或者分割后序列图像g′i(x,y)与模板进行匹配,匹配方式如下:
步骤6.2:对于页码数字模板gjk(x,y),待匹配页码图像fi′(x,y)或者分割后图像gi′(x,y)(若进行了分割,则使用分割后序列图像gi′(x,y),若没有进行分割,则使用待匹配图像fi′(x,y))与其具有相同的尺寸,对gjk(x,y)和待匹配页码图像fi′(x,y)或者分割后序列图像g′i(x,y)的对应点做相与,结果为1的点数目为A,再对gjk(x,y)和待匹配页码图像fi′(x,y)或者分割后序列图像g′i(x,y)的点做或运算,得到的值为0的点数目为B,最后得到gjk(x,y)和待匹配页码图像fi′(x,y)或者分割后序列图像g′i(x,y)的匹配度ljk
ljk=A+B
Figure GDA0002944102410000081
则将fi′(x,y)识别为j0
步骤6.3:待匹配页码图像fi′(x,y)或者分割后序列图像g′i(x,y)的对应数字xi=j0
步骤7:将待匹配页码图像fi′(x,y)或者分割后序列图像g′i(x,y)的对应字符依次排列,就得到了该书页图像f(x,y)最终的页码值x1x2…xi,若存在前页,可与前页对比验证识别是否正确;具体步骤如下:
步骤7.1:将书页图像f(x,y)的对应字符依次排列,就得到了该书页图像f(x,y)最终的页码值x1x2…xi
步骤7.2:若存在前一页,可将页码值x1x2…xi与前页页码值x′1x′2…xi′进行对比验证。
x1x2…xi-x1 x2…xi=1
则说明两页都识别正确。
反之,则当前页与前一页至少有一页识别错误,需要重新识别。
如附图2-6所示,经过本方法一步步处理后,页码逐渐变得清晰容易识别,最终实现快速识别。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何属于本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。

Claims (6)

1.一种基于模板匹配实现快速页码识别的方法,其特征在于,包括以下步骤:
步骤1:待检测的页码图像f′(x,y)预处理得到待匹配页码图像fi′(x,y),判断是否存在页码数字模板,如存在页码数字模板,则跳过步骤2直接执行步骤3,如不存在页码数字模板,先执行步骤2再执行步骤3;
步骤2:所需的数字0-9的模版图像经过步骤1中所述的预处理得到M×N大小的页码数字模板gjk(x,y);
步骤3:判断待匹配页码图像fi′(x,y)是否存在粘连情况,如存在粘连情况,则将待检测页码图像fi′(x,y)高度拉伸至M同时宽度等比例拉伸后再进行分割,并经过排序后宽度加宽至N,得到分割后序列图像g′i(x,y)再继续执行步骤4,如没有存在粘连情况,则直接归一化处理得到M×N大小的待匹配页码图像fi′(x,y)再执行步骤4;
步骤4:将经过步骤3处理后的分割后序列图像g′i(x,y)或待匹配页码图像fi′(x,y)与页码数字模板gjk(x,y)进行匹配,得到对应数字xi,将对应数字xi依次排列得到页码图像f′(x,y)最终的页码值x1 x2 … xi
步骤5:将页码图像f′(x,y)最终的页码值x1 x2 … xi与其前一页页码值x′1 x′2 …xi′进行对比验证:
x1 x2 … xi-x1′ x2′ … xi′=1
如满足上式,则说明页码识别正确;
所述步骤3具体为:
检测待匹配页码图像fi′(x,y)的宽度和高度,得到宽度与高度的比例值α,若α<1,则没有发生页码数字粘连,待匹配页码图像fi′(x,y)直接归一化处理得到M×N大小再执行步骤4;
若α>1,则存在页码数字粘连的情况,则将待匹配页码图像fi′(x,y)图像高度拉伸到统一的高度为M,宽度等比例拉伸,再将其从宽度方向正中间进行分割后从左到右进行排序,并宽度增加至N,最终得到分割后序列图像gi′(x,y),再继续执行步骤4;
所述步骤1的预处理具体为:
步骤1.1:选取页码位置符合要求的待检测书页原始图像读入初始图像f(x,y),将初始图像f(x,y)中的页码部分分割出来为页码图像f′(x,y),再转化为灰度图像f′gray(x,y);
步骤1.2:将步骤1处理得到的灰度图像f′gray(x,y)进行最小值滤波得到滤波后图像f′pre(x,y);
步骤1.3:将步骤2处理得到的滤波后图像f′pre(x,y)使用OTSU自动阈值分割法进行二值化得到二值化图像f′binary(x,y);
步骤1.4:将二值化图像f′binary(x,y)进行取反操作,提取单个数字字符的最小包含矩形得到待检测页码图像fi′(x,y);
所述步骤4具体为:
将分割后序列图像g′i(x,y)或待匹配页码图像fi(x,y)与数字模板gjk(x,y)进行匹配,对gjk(x,y)和分割后序列图像g′i(x,y)或待匹配页码图像fi(x,y)的对应点做相与,结果为1的点数目为A,再对gjk(x,y)和分割后序列图像g′i(x,y)或待匹配页码图像fi(x,y)的点做或运算,得到的值为0的点数目为B,最后得到gjk(x,y)和分割后序列图像g′i(x,y)或待匹配页码图像fi′(x,y)的匹配度ljk
ljk=A+B
Figure FDA0002944102400000022
匹配成功,则将fi′(x,y)识别为j0,分割后序列图像g′i(x,y)或待匹配页码图像fi′(x,y)页码对应数字xi=j0
2.如权利要求1所述的一种基于模板匹配实现快速页码识别的方法,其特征在于,所述步骤1.1中转化为灰度图像f′gray(x,y)的具体步骤为:
将页码图像f′(x,y)转换成灰度图像f′gray(x,y),其中灰度图像f′gray(x,y)的每个像素点的灰度值的公式如下:
Figure FDA0002944102400000021
其中,Rf(x,y)表示页码图像f′(x,y)红色通道每个像素点的像素值;Gf(x,y)表示页码图像f′(x,y)绿色通道每个像素点的像素值;Bf(x,y)表示页码图像f′(x,y)蓝色通道每个像素点的像素值,(x,y)表示初始图像的每个像素点。
3.如权利要求1所述的一种基于模板匹配实现快速页码识别的方法,其特征在于,所述步骤1.2中灰度图像f′gray(x,y)进行最小值滤波得到滤波后图像f′pre(x,y)的具体步骤为:
将灰度图像f′gray(x,y)以一个1×2的横向模板以及一个2×1的纵向模板进行两次最小值滤波:
遍历f′gray(x,y)中的每一个像素(x0,y0),比较f′gray(x0,y0)和f′gray(x0,y0+1),若不存在(x0,y0+1),则认为f′gray(x0,y0+1)=255,令:
f′gray(x0,y0)=min(f′gray(x0,y0),f′gray(x0,y0+1))。
4.如权利要求1所述的一种基于模板匹配实现快速页码识别的方法,其特征在于,所述步骤1.3的具体为:
计算灰度图像f′gray(x,y)的灰度平均值,设为
Figure FDA0002944102400000034
对于灰度值t,遍历f′gray(x,y)的所有像素点,将所有点分成两部分,分别为灰度值小于等于t的像素点集合A和灰度值大于t的像素点集合B;
分别计算A和B中的点占所有像素点数目的比例,记为PA和PB,再计算A和B像素点的平均像素值,记为
Figure FDA0002944102400000031
Figure FDA0002944102400000032
计算类间方差ICVt
Figure FDA0002944102400000033
依次令t=1,2,3…255,得到所有的ICVt,比较其结果,当
Figure FDA0002944102400000035
时,t0就是得到的最佳灰度阈值,以t0为阈值,将灰度图像f′gray(x,y)转化为灰度图像二值化图像f′binary(x,y)。
5.如权利要求1所述的一种基于模板匹配实现快速页码识别的方法,其特征在于,所述步骤1.4具体为:
从二值化图像f′binary(x,y)中提取连通分量:从二值化图像f′binary(x,y)左上方开始遍历像素点,寻找连通分量,遍历像素点的顺序是从左往右遍历每一列,每一列中则从上往下遍历,完成一列后跳到下一列的最上方,直到遍历完所有像素;
对于像素点,若该点像素值为0,则完成该点的访问,若该点像素值不为0,则依次访问该点的8邻域,寻找是否有像素值不为0的点,对于像素值不为0的点,则进一步访问该点的8邻域,不断访问该点扩散出来的像素不为0的点的8邻域,直到所有点像素值为0,标记所有访问过的点,完成对该点的搜索,若该点扩散出来的像素为0的点数超过50个,则判断该点属于某个数字字符连通分量,记录该点为Pi,i从1开始递增,Pi表示第i个连通分量的种子点;
对于Pi,记录连通分量中的点的高度方向的上的最大坐标最小坐标,宽度方向的最大坐标最小坐标,生成一个包围该连通分量的最小矩形并记录为待匹配页码图像fi′(x,y)。
6.如权利要求1-5任一所述的一种基于模板匹配实现快速页码识别的方法,其特征在于,M取值为90,N取值为50。
CN201710899531.2A 2017-09-28 2017-09-28 一种基于模板匹配实现快速页码识别的方法 Active CN107766854B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710899531.2A CN107766854B (zh) 2017-09-28 2017-09-28 一种基于模板匹配实现快速页码识别的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710899531.2A CN107766854B (zh) 2017-09-28 2017-09-28 一种基于模板匹配实现快速页码识别的方法

Publications (2)

Publication Number Publication Date
CN107766854A CN107766854A (zh) 2018-03-06
CN107766854B true CN107766854B (zh) 2021-07-06

Family

ID=61267334

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710899531.2A Active CN107766854B (zh) 2017-09-28 2017-09-28 一种基于模板匹配实现快速页码识别的方法

Country Status (1)

Country Link
CN (1) CN107766854B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110175550B (zh) * 2019-05-20 2021-04-09 青岛罗博智慧教育技术有限公司 页码识别容错编码的方法
CN110533035B (zh) * 2019-08-28 2022-02-15 海南阿凡题科技有限公司 基于文本匹配的学生作业页码识别方法
CN111899195A (zh) * 2020-07-31 2020-11-06 深圳算子科技有限公司 一种基于图像的最大值或最小值的快速滤波方法
CN112230866A (zh) * 2020-09-28 2021-01-15 深圳圣德京粤科技有限公司 书籍印刷正反页号的检测与校正方法、装置、设备和介质
CN114299524A (zh) * 2021-11-18 2022-04-08 珠海读书郎软件科技有限公司 基于页面图像的页码识别方法、存储介质和计算机设备
CN114708262A (zh) * 2022-06-02 2022-07-05 深圳市海蓝智能科技有限公司 一种连接器针脚的视觉检测方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101179639A (zh) * 2006-11-07 2008-05-14 汉王科技股份有限公司 可自动翻页的数码照相装置
CN102169542A (zh) * 2010-02-25 2011-08-31 汉王科技股份有限公司 文字识别中粘连字符的切分方法和装置
CN102496013A (zh) * 2011-11-11 2012-06-13 苏州大学 用于脱机手写汉字识别的汉字字符切分方法
CN102521588A (zh) * 2011-12-30 2012-06-27 四川九洲电器集团有限责任公司 一种车牌字符分割方法
CN102663380A (zh) * 2012-03-30 2012-09-12 中南大学 一种钢铁板坯编码图像中的字符识别方法
CN102938061A (zh) * 2012-12-05 2013-02-20 上海合合信息科技发展有限公司 方便电子化的专业笔记本及其页码自动识别方法
CN104639791A (zh) * 2013-11-12 2015-05-20 国家电网公司 一种可识别页码的扫描仪及其使用方法
EP2963584A1 (en) * 2013-02-28 2016-01-06 Glory Ltd. Character recognition method and character recognition system

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101179639A (zh) * 2006-11-07 2008-05-14 汉王科技股份有限公司 可自动翻页的数码照相装置
CN102169542A (zh) * 2010-02-25 2011-08-31 汉王科技股份有限公司 文字识别中粘连字符的切分方法和装置
CN102496013A (zh) * 2011-11-11 2012-06-13 苏州大学 用于脱机手写汉字识别的汉字字符切分方法
CN102521588A (zh) * 2011-12-30 2012-06-27 四川九洲电器集团有限责任公司 一种车牌字符分割方法
CN102663380A (zh) * 2012-03-30 2012-09-12 中南大学 一种钢铁板坯编码图像中的字符识别方法
CN102938061A (zh) * 2012-12-05 2013-02-20 上海合合信息科技发展有限公司 方便电子化的专业笔记本及其页码自动识别方法
EP2963584A1 (en) * 2013-02-28 2016-01-06 Glory Ltd. Character recognition method and character recognition system
CN104639791A (zh) * 2013-11-12 2015-05-20 国家电网公司 一种可识别页码的扫描仪及其使用方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Template-based online character recognition;Scott D. Connell et al.;《Pattern Recognition》;20010131;第1-14页 *
数字识别及其应用;邬建瓴;《中国优秀硕士学位论文全文数据库 信息科技辑》;20080315;第2008年卷(第3期);第I138-513页 *
粘连字符检测与识别技术的研究;李丽宏 等;《人工智能》;20061231;第22卷(第4-2期);第265-267页 *

Also Published As

Publication number Publication date
CN107766854A (zh) 2018-03-06

Similar Documents

Publication Publication Date Title
CN107766854B (zh) 一种基于模板匹配实现快速页码识别的方法
CN104751142B (zh) 一种基于笔划特征的自然场景文本检测方法
Gatos et al. Automatic table detection in document images
US8965127B2 (en) Method for segmenting text words in document images
US9104940B2 (en) Line segmentation method applicable to document images containing handwriting and printed text characters or skewed text lines
CN105654072A (zh) 一种低分辨率医疗票据图像的文字自动提取和识别系统与方法
US9965695B1 (en) Document image binarization method based on content type separation
US20120099792A1 (en) Adaptive optical character recognition on a document with distorted characters
EP2395453A2 (en) Method and system for preprocessing an image for optical character recognition
CN103258198A (zh) 一种表格文档图像中字符提取方法
CN101515325A (zh) 基于字符切分和颜色聚类的数字视频中的字符提取方法
CN104809481A (zh) 一种基于自适应色彩聚类的自然场景文本检测的方法
Boiangiu et al. Voting-based OCR system
Ali et al. An efficient character segmentation algorithm for recognition of Arabic handwritten script
CN113139535A (zh) 一种ocr文档识别方法
CN109741273A (zh) 一种手机拍照低质图像的自动处理与评分方法
CN116824608A (zh) 基于目标检测技术的答题卡版面分析方法
Grover et al. Text extraction from document images using edge information
Fateh et al. Enhancing optical character recognition: Efficient techniques for document layout analysis and text line detection
Mangla et al. An end detection algorithm for segmentation of broken and touching characters in handwritten Gurumukhi word
CN117058182A (zh) 一种用于视觉测距的目标检测边框优化方法
CN113033562A (zh) 一种图像处理方法、装置、设备及存储介质
Kaur et al. Page segmentation in OCR system-a review
Pan et al. Document layout analysis and reading order determination for a reading robot
CN110807348A (zh) 基于贪婪算法的文档图像中干扰线的去除方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant