CN107766854B

CN107766854B - 一种基于模板匹配实现快速页码识别的方法

Info

Publication number: CN107766854B
Application number: CN201710899531.2A
Authority: CN
Inventors: 陶冰洁; 王酉祥; 黄景雨; 刘勇; 李美惠; 廖龙
Original assignee: University of Electronic Science and Technology of China
Current assignee: University of Electronic Science and Technology of China
Priority date: 2017-09-28
Filing date: 2017-09-28
Publication date: 2021-07-06
Anticipated expiration: 2037-09-28
Also published as: CN107766854A

Abstract

本发明公开了一种基于模板匹配实现快速页码识别的方法，旨在现有技术中无法解决页码识别中数字沾连的问题而导致页码识别扫描准确率低的问题；本申请中巧妙进行页码分割和图像归一化处理，能够简单迅速解决页码粘连问题及提升页码识别的准确性，提高了整个扫描准确率，同时克服了现有技术解决页码粘连问题而浪费大量扫描时间影响扫描效率以及扫描准确性的技术难题，同时将模版与待检测页码图像均进行归一化处理，提升了后期两者之间的匹配效率从而提升扫描效率；同时本申请巧妙将后一页的页码与前一页的页码进行对比，避免了翻错和漏扫的情况，克服了现有技术书籍连续性扫描的技术难点；本申请适用于机器视觉工业应用中的智能识别领域。

Description

一种基于模板匹配实现快速页码识别的方法

技术领域

本发明属于机器视觉工业应用中的智能识别领域，具体来说，涉及一种基于模板匹配实现快速页码识别的方法。

背景技术

随着计算机和网络技术的普及,电子版文档凭借其易于储存利用、传播快捷简便的优势被越来越多的人们所接受。因此,将原来以纸作为载体的资料转化为电子版文档,也就是纸质文档的数字化无论是在日常办公中,还是在图书馆资料管理中的应用都日益增加。

非接触式扫描作为一种新型的纸质文档数字化方式，相对于接触式扫描，可以避免拆原件以及避免对原件造成损害的问题，得到了越来越多的应用，但它存在的问题也阻碍了其进一步普及。非接触式扫描采用翻页的方式来进行扫描，导致可能出现翻错和漏扫的情况，降低整个页码扫描的准确率，如在图书编辑等工作量大的情况下将会带来严重的损失；页码识别算法只是整个非接触式扫描处理的一小步，而整个处理流程是要实现人机交互的实时处理的，不能有延时，因此页码识别算法速度要求极高；低质量的印刷和打码机生成的页码可能会有数字粘连的情况，会干扰页码的识别，需要检测粘连并进行分割；对于不同字体的数字的识别，不同字体的数字会有一定的差异，不能按照单一某一种字体来处理，增加了检测的复杂度。

本申请可以通过检测书页页码连续性的方式来解决这种问题。本发明的方法就是应对这种需求，通过快速地自动识别当前书页的页码，来判断是否出现了多翻和漏扫的现象，减少人的工作量，进一步提升非接触式扫描的实用性和稳定性。该方法不仅高效快捷,而且能够保证较好的识别精度,具有实用价值。

发明内容

本发明的目的在于：针对现有技术中无法解决页码识别中数字粘连的问题而导致页码扫描准确率低的问题，本发明提供一种基于模板匹配实现快速页码识别的方法。

本发明的技术方案为：

本申请提供了一种基于模板匹配实现快速页码识别的方法，包括以下步骤：

步骤1:待检测的页码图像f′(x,y)预处理得到待匹配页码图像f_i′(x,y)，判断是否存在页码数字模板，如存在页码数字模板，则跳过步骤2直接执行步骤3，如不存在页码数字模板，先执行步骤2再执行步骤3；

步骤2：所需的数字0-9的模版图像经过步骤1中所述的预处理得到M×N大小的页码数字模板g_jk(x，y)；

具体地，先找到所需字体的字符0-9的图像作为材料，按照前面的步骤依次进行处理(不需要进行分割)，得到每个数字的页码数字模板g_jk(x，y)(j是该模板对应的数字，k表示图像是该图像的第k个模板)，模板越多，识别的准确率越高，速度越慢。可考虑加入不同字体、不同书页倾斜度、不同光照条件等多种情况的原图像生成更多模板；

因模板匹配的方式是要将待匹配图和模板每个对应点进行对比，若原图和匹配图的字符位置一旦没有对齐，则匹配结果误差很大。为尽可能的实现对齐，将每个模板加入一定的上下或左右的位移量，生成多个模板，模板只需要生成一次；

步骤3：判断待匹配页码图像f_i′(x，y)是否存在粘连情况，如存在粘连情况，则将待检测页码图像f_i′(x，y)高度拉伸至M宽度等比例拉伸再进行分割并排序并宽度加宽至N大小的分割后序列图像g′_i(x，y)再继续执行步骤4，如没有存在粘连情况，则直接归一化处理得到M×N大小的待匹配页码图像f_i′(x，y)再执行步骤4；

步骤4：将经过步骤3处理后的分割后序列图像或待匹配页码图像f_i′(x，y)与页码数字模板g_jk(x，y)进行匹配，得到对应数字x_i，将对应数字x_i依次排列得到页码图像f′(x，y)最终的页码值x₁x₂…x_i。

具体地，还包括步骤5，具体为：

将页码图像f′(x，y)最终的页码值x₁x₂…x_i与其前一页页码值x₁′x₂′…x_i′进行对比验证：

x₁x₂…x_i-x₁′x₂′…x_i′＝1

如满足上式，则说明页码识别正确。

具体地，所述步骤3具体为：

检测待匹配页码图像f_i′(x，y)的宽度和高度，得到宽度与高度的比例值a，若a＜1，则没有发生页码数字粘连，待匹配页码图像f_i′(x，y)直接归一化处理得到M×N大小再执行步骤4；

若a＞1，则存在页码数字粘连的情况，则将待匹配页码图像f_i′(x，y)图像高度拉伸到统一的高度为M，宽度等比例拉伸，再将其从宽度方向正中间进行分割并从左到右进行排序并宽度增加至N得到分割后序列图像g′_i(x，y)，再继续执行步骤4。

具体地，所述步骤1的预处理具体为：

步骤1.1：选取页码位置符合要求的待检测书页原始图像读入初始图像f(x，y)，将初始图像f(x，y)中的页码部分分割出来为页码图像f′(x，y)，再转化为灰度图像f′_gray(x，y)；

步骤1.2：将步骤1处理得到的灰度图像f′_gray(x，y)进行最小值滤波得到滤波后图像f′_pre(x，y)；

步骤1.3：将步骤2处理得到的滤波后图像f′_pre(x，y)使用OTSU自动阈值分割法进行二值化得到二值化图像f′_binary(x，y)；

步骤1.4：将二值化图像f′_binary(x，y)进行取反操作，提取单个数字字符的最小包含矩形得到待检测页码图像f_i′(x，y)。

具体地，所述步骤1.1中转化为灰度图像f′_gray(x，y)的具体步骤为：

将页码图像f′(x，y)转换成灰度图像f′_gray(x，y)，其中灰度图像f′_gray(x，y)的每个像素点的灰度值的公式如下：

其中，R_f(x，y)表示页码图像f′(x，y)红色通道每个像素点的像素值；G_f(x，y)表示页码图像f′(x，y)绿色通道每个像素点的像素值；B_f(x，y)表示页码图像f′(x，y)蓝色通道每个像素点的像素值，(x，y)表示初始图像的每个像素点。

具体地，所述步骤1.2中灰度图像f′_gray(x，y)进行最小值滤波得到滤波后图像d′_pre(x，y)的具体步骤为：

将灰度图像f′_gray(x，y)以一个1×2的横向模板以及一个2×1的纵向模板进行两次最小值滤波：

遍历f′_gray(x，y)中的每一个像素(x₀，y₀)，比较f′_gray(x₀，y₀)和f′_gray(x₀，y₀+1)，若不存在(x₀，y₀+1)，则认为f′_gray(x₀，y₀+1)＝255，令：

f′_gray(x₀，y₀)＝min(f′_gray(x₀，y₀)，f′_gray(x₀，y₀+1))

遍历f′_gray(x，y)中的每一个像素(x₀，y₀)，比较像素值f′_gray(x₀，y₀)和f′_gray(x₀+1，y₀)，若不存在(x₀+1，y₀)，则认为f′_gray(x₀+1，y₀)＝255，令：

f′_gray(x₀，y₀)＝min((f′_gray(x₀，y₀)，f′_gray(x₀+1，y₀))。

具体地，所述步骤1.3的具体为：

计算灰度图像f′_gray(x，y)的灰度平均值，设为

对于灰度值t(0≤t≤255)，遍历f′_gray(x，y)的所有像素点，将所有点分成两部分，分别为灰度值小于等于t的像素点集合A和灰度值大于t的像素点集合B；

分别计算A和B中的点占所有像素点的数目占所有像素点的数目的比例，记为P_A和P_B，再计算A和B像素点的平均像素值，记为

和

计算类间方差ICV_t：

依次令t＝1，2，3…255，得到所有的ICV_t，比较其结果，当

时，t₀就是得到的最佳灰度阈值，以t₀为阈值，将灰度图像f′_gray(x，y)转化为灰度图像二值化图像f′_binary(x，y)。

具体地，所述步骤1.4具体为：

从二值化图像f′_binary(x，y)中提取连通分量：从二值化图像f′_binary(x，y)左上方开始遍历像素点，寻找连通分量，遍历像素点的顺序是从左往右遍历每一列，每一列中则从上往下遍历，完成一列后跳到下一列的最上方，直到遍历完所有像素；

对于像素点，若该点像素值为0，则完成该点的访问，若该点像素值不为0，则依次访问该点的8邻域，寻找是否有像素值不为0的点，对于像素值不为0的点，则进一步访问该点的8邻域，不断访问该点扩散出来的像素不为0的点的8邻域，直到所有点像素值为0，标记所有访问过的点，完成对该点的搜索，若该点扩散出来的像素为0的点数超过50个，则判断该点属于某个数字字符连通分量，记录该点为P_i，i从1开始递增，P_i表示第i个连通分量的种子点；

对于P_i，记录连通分量中的点的高度方向的上的最大坐标最小坐标，宽度方向的最大坐标最小坐标，生成一个包围该连通分量的最小矩形并记录为待匹配页码图像f′_i(x，y)。

具体地，所述步骤4具体为：

将分割后序列图像g′_i(x，y)或待匹配页码图像f_i(x，y)与数字模板g_jk(x，y)进行匹配(若进行了分割，则使用分割后序列图像g′_i(x，y)，若没有进行分割，则使用待匹配页码图像f′_i(x，y))，对g_jk(x，y)和分割后序列图像g′_i(x，y)或待匹配页码图像f_i(x，y)的对应点做相与，结果为1的点数目为A，再对g_jk(x，y)和分割后序列图像g′_i(x，y)或待匹配页码图像f_i′(x，y)的点做或运算，得到的值为0的点数目为B，最后得到g_jk(x，y)和分割后序列图像g′_i(x，y)或待匹配页码图像f_i′(x，y)的匹配度l_jk；

l_jk＝A+B

当

匹配成功，则将f_i′(x，y)识别为j₀，分割后序列图像或待匹配页码图像f_i′(x，y)页码对应数字x_i＝j₀。

具体地，M取值为90，N取值为50。

综上所述，由于采用了上述技术方案，本发明的有益效果是：

1.本申请中巧妙进行页码分割和图像归一化处理，能够简单迅速解决页码粘连问题及提升页码识别的准确性，提高了整个扫描准确率，同时克服了现有技术解决页码粘连问题而浪费大量扫描时间影响扫描效率的技术难题，同时将模版也待检测页码图像均进行取反归一化处理，提升了后期两者之间的匹配效率从而提升扫描效率；

2.本申请主要基于模板匹配实现快速识别，在预处理，检测粘连与分割等步骤中，实现简单但快速有效的处理，耗时极少，实现了页码识别的高效快捷,而且能够保证较好的识别精度,是一种行之有效、简洁实用的方法；

3.本申请中针对页码识别中可能出现的页码倾斜，偏移，数字边缘有毛刺，多种字体等情况，提供了不同状况的对应模板，能够实现在有一定干扰条件下的识别；

4.本申请巧妙将后一页的页码与前一页的页码进行对比，避免了翻错和漏扫的情况，保证了后一页页码与前一页页码的连续性，从而提升了整个扫描过程的连续性，克服了现有技术书籍连续性准确扫描的技术难点；

5.本申请M取值90，N取值50，既不会因过大会降低扫描识别速度，也不会因为太小会导致图像不能完全表征字符特征降低识别精度。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。通过附图所示，本发明的上述及其它目的、特征和优势将更加清晰。在全部附图中相同的附图标记指示相同的部分。并未刻意按实际尺寸等比例缩放绘制附图，重点在于示出本发明的主旨。

图1为本发明的流程示意图；

图2为待识别页码的的初始图像；

图3为从原图中切割出来的页码图像；

图4是最小值滤波后的页码图像；

图5是二值化后的页码图像；

图6为处理后的待匹配页码图像；

图7是制作模板的材料图像；

图8为字符0的模板。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

下面结合图1-图8对本发明作详细说明。

步骤1：选取页码位置符合要求的书页原始图像，读入初始图像f(x，y)，将初始图像f(x，y)中的页码部分分割出来为页码图像f′(x，y)，再转化为灰度图像f′_gray(x，y)，具体步骤如下：

步骤1.1：选取页码都固定在书页特定位置的原始图像，读入初始图像f(x，y)；

步骤1.2：找出书页图像f(x，y)中的页码所在位置，切割出该部分为页码图像f′(x，y)；

步骤1.3：将页码图像f′(x，y)转换成灰度图像f′_gray(x，y)，其中灰度图像f′_gray(x，y)的每个像素点的灰度值的公式如下：

其中，R_f(x，y)表示初始图像页码图像f′(x，y)红色通道每个像素点的像素值；G_f(x，y)表示页码图像f′(x，y)绿色通道每个像素点的像素值；B_f(x，y)表示页码图像f′(x，y)蓝色通道每个像素点的像素值，(x，y)表示初始图像的每个像素点；

步骤2：将灰度图像f′_gray(x，y)进行最小值滤波以防止字符断裂，得到f′_pre(x，y)；具体步骤如下：

将灰度图像f′_gray(x，y)以一个1×2的横向模板以及一个2×1的纵向模板进行两次最小值滤波，以防止字符断裂，具体方法如下：

步骤2.1：遍历灰度图像f′_gray(x，y)中的每一个像素(x₀，y₀)，比较该像素值f′_gray(x₀，y₀)和f′_gray(x₀，y₀+1)(若不存在(x₀，y₀+1)，则认为f′_gray(x₀，y₀+1)＝255)，令

f′_gray(x₀，y₀)＝min(f′_gray(x₀，y₀)，f′_gray(x₀，y₀+1))

步骤2.2：遍历灰度图像f′_gray(x，y)中中的每一个像素(x₀，y₀)，比较f′_gray(x₀，y₀)和f′_gray(x₀+1，y₀)(若不存在(x₀+1，y₀)，则认为f′_gray(x₀+1，y₀)＝255)，令

f′_gray(x₀，y₀)＝min(f′_gray(x₀，y₀)，f′_gray(x₀+1，y₀))

步骤3：将预处理后的图像f′_pre(x，y)使用OTSU自动阈值分割法进行二值化得到二值化图像f′_binary(x，y)；具体步骤如下：

步骤3.1：计算灰度图像f′_gray(x，y)的灰度平均值，设为

步骤3.2：对于灰度值t(0≤t≤255)，遍历f′_gray(x，y)的所有像素点，将所有点分成两部分，分别为灰度值小于等于t的像素点集合A和灰度值大于t的像素点集合B；

步骤3.3：分别计算A和B中的点占所有像素点的数目占所有像素点的数目的比例，记为P_A和P_B，再计算A和B像素点的平均像素值，记为

和

步骤3.4：计算

依次令t＝1，2，3…255，得到所有的ICV_t，比较其结果，当：

t₀就是该方法得到的最佳阈值。

步骤3.5：以t₀为阈值，将灰度图像f′_gray(x，y)转化为灰度图像二值化图像f′_binary(x，y)；

步骤4：将二值化图像f′_binary(x，y)进行取反操作，提取单个数字字符的最小包含矩形，令其为f_i′(x，y)。具体步骤如下：

步骤4.1：将二值化图像f′_binary(x，y)进行取反操作；

步骤4.2：从二值化图像f′_binary(x，y)中提取连通分量，具体方法如下：

步骤4.3：从f′_binary(x，y)左上方开始遍历像素点，寻找连通分量，遍历像素点的顺序是从左往右遍历每一列，每一列中则从上往下遍历，完成一列后跳到下一列的最上方(如果遇到已经标记的点则跳过)，直到遍历完所有像素；

步骤4.4：对于像素点，若该点像素值为0，则完成该点的访问；若该点像素值不为0，则依次访问该点的8邻域，寻找是否有像素值不为0的点，对于像素值不为0的点，则进一步访问该点的8邻域，不断访问该点扩散出来的像素不为0的点的8邻域，直到不存在像素不为0的点。标记所有访问过的点，完成对该点的搜索，进入下一点，若该点扩散出来的像素为0的点数超过50个，则认为该点属于某个数字字符连通分量，记录该点为P_i(i从1开始递增，P_i表示第i个连通分量的种子点)；

步骤4.5：对于P_i，按照上一个步骤重新寻找该连通分量并记录连通分量中的所有点。根据这些点中高度方向的最大、最小坐标和宽度方向的最大、最小坐标，就可以找到一个包围该连通分量的最小矩形记录为矩形图像；

步骤4.6：将矩形图像在高度方向上以线性插值的方法拉伸到M(M＝90)个像素长度，在宽度方向也以相同的方式进行拉伸得到待检测页码图像f_i′(x，y)，使长宽比例保持不变。

检查字符的可能存在的粘连情况并分割，具体方法如下：

步骤4.7：检测待匹配页码图像f_i′(x，y)的宽度和高度，得到比例值a，若a＜1，则认为没有发生字符粘连，待匹配页码图像f_i′(x，y)直接执行步骤5；若α＞1，则存在页码数字粘连的情况，则将待匹配页码图像f_i′(x，y)图像高度拉伸到统一的高度为M，将待匹配页码图像f_i′(x，y)(按i从小到大分别是页码中数字从左到右的图像排列)从宽度方向正中间进行分割并从左到右进行排序并沿宽度方向进行等比例拉伸再加宽到N(N＝50)个像素宽度得到分割后序列图像g′_i(x，y)，在左右两边进行等比例加宽，新的像素点与字符的背景色相同，即像素为0，新序列图像大小变成M×N个像素点，此时就完成了对页码的提取和增强；

步骤5：建立页码模板(若模板已经存在则跳过)，具体步骤如下：

步骤5.1：先找到所需字体的字符0-9的图像作为材料，按照前面的步骤依次进行处理(不需要进行分割)，得到每个数字的页码数字模板g_jk(x，y)(j是该模板对应的数字，k表示图像是该图像的第k个模板)，模板越多，识别的准确率越高，速度越慢。可考虑加入不同字体、不同书页倾斜度、不同光照条件等多种情况的原图像生成更多模板。

步骤5.2：因模板匹配的方式是要将待匹配图和模板每个对应点进行对比，若原图和匹配图的字符位置一旦没有对齐，则匹配结果误差很大。为尽可能的实现对齐，将每个模板加入一定的上下或左右的位移量，生成多个模板，模板只需要生成一次；

步骤6：将待检测页码f_i′(x，y)或者新序列图像与模板进行匹配，得到对应页码数字x_i，具体步骤如下：

步骤6.1：将待匹配页码图像f_i′(x，y)或者分割后序列图像g′_i(x，y)与模板进行匹配，匹配方式如下：

步骤6.2：对于页码数字模板g_jk(x，y)，待匹配页码图像f_i′(x，y)或者分割后图像g_i′(x，y)(若进行了分割，则使用分割后序列图像g_i′(x，y)，若没有进行分割，则使用待匹配图像f_i′(x，y))与其具有相同的尺寸，对g_jk(x，y)和待匹配页码图像f_i′(x，y)或者分割后序列图像g′_i(x，y)的对应点做相与，结果为1的点数目为A，再对g_jk(x，y)和待匹配页码图像f_i′(x，y)或者分割后序列图像g′_i(x，y)的点做或运算，得到的值为0的点数目为B，最后得到g_jk(x，y)和待匹配页码图像f_i′(x，y)或者分割后序列图像g′_i(x，y)的匹配度l_jk：

l_jk＝A+B

当

则将f_i′(x，y)识别为j₀；

步骤6.3：待匹配页码图像f_i′(x，y)或者分割后序列图像g′_i(x，y)的对应数字x_i＝j₀；

步骤7：将待匹配页码图像f_i′(x，y)或者分割后序列图像g′_i(x，y)的对应字符依次排列，就得到了该书页图像f(x，y)最终的页码值x₁x₂…x_i，若存在前页，可与前页对比验证识别是否正确；具体步骤如下：

步骤7.1：将书页图像f(x，y)的对应字符依次排列，就得到了该书页图像f(x，y)最终的页码值x₁x₂…x_i；

步骤7.2：若存在前一页，可将页码值x₁x₂…x_i与前页页码值x′₁x′₂…x_i′进行对比验证。

若

x₁x₂…x_i-x₁ x₂…x_i＝1

则说明两页都识别正确。

反之，则当前页与前一页至少有一页识别错误，需要重新识别。

如附图2-6所示，经过本方法一步步处理后，页码逐渐变得清晰容易识别，最终实现快速识别。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何属于本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到的变化或替换，都应涵盖在本发明的保护范围之内。

Claims

1.一种基于模板匹配实现快速页码识别的方法，其特征在于，包括以下步骤：

步骤1：待检测的页码图像f′(x，y)预处理得到待匹配页码图像f_i′(x，y)，判断是否存在页码数字模板，如存在页码数字模板，则跳过步骤2直接执行步骤3，如不存在页码数字模板，先执行步骤2再执行步骤3；

步骤3：判断待匹配页码图像f_i′(x，y)是否存在粘连情况，如存在粘连情况，则将待检测页码图像f_i′(x，y)高度拉伸至M同时宽度等比例拉伸后再进行分割，并经过排序后宽度加宽至N，得到分割后序列图像g′_i(x，y)再继续执行步骤4，如没有存在粘连情况，则直接归一化处理得到M×N大小的待匹配页码图像f_i′(x，y)再执行步骤4；

步骤4：将经过步骤3处理后的分割后序列图像g′_i(x，y)或待匹配页码图像f_i′(x，y)与页码数字模板g_jk(x，y)进行匹配，得到对应数字x_i，将对应数字x_i依次排列得到页码图像f′(x，y)最终的页码值x₁ x₂ … x_i；

步骤5：将页码图像f′(x，y)最终的页码值x₁ x₂ … x_i与其前一页页码值x′₁ x′₂ …x_i′进行对比验证：

x₁ x₂ … x_i-x₁′ x₂′ … x_i′＝1

如满足上式，则说明页码识别正确；

所述步骤3具体为：

检测待匹配页码图像f_i′(x，y)的宽度和高度，得到宽度与高度的比例值α，若α＜1，则没有发生页码数字粘连，待匹配页码图像f_i′(x，y)直接归一化处理得到M×N大小再执行步骤4；

若α＞1，则存在页码数字粘连的情况，则将待匹配页码图像f_i′(x，y)图像高度拉伸到统一的高度为M，宽度等比例拉伸，再将其从宽度方向正中间进行分割后从左到右进行排序，并宽度增加至N，最终得到分割后序列图像g_i′(x，y)，再继续执行步骤4；

所述步骤1的预处理具体为：

步骤1.4：将二值化图像f′_binary(x，y)进行取反操作，提取单个数字字符的最小包含矩形得到待检测页码图像f_i′(x，y)；

所述步骤4具体为：

将分割后序列图像g′_i(x，y)或待匹配页码图像f_i(x，y)与数字模板g_jk(x，y)进行匹配，对g_jk(x，y)和分割后序列图像g′_i(x，y)或待匹配页码图像f_i(x，y)的对应点做相与，结果为1的点数目为A，再对g_jk(x，y)和分割后序列图像g′_i(x，y)或待匹配页码图像f_i(x，y)的点做或运算，得到的值为0的点数目为B，最后得到g_jk(x，y)和分割后序列图像g′_i(x，y)或待匹配页码图像f_i′(x，y)的匹配度l_jk；

l_jk＝A+B

当