CN107563377A

CN107563377A - 一种利用边缘和文字区域的证件关键区域检测定位方法

Info

Publication number: CN107563377A
Application number: CN201710759360.3A
Authority: CN
Inventors: 林涵阳; 池生友; 王力军; 张生生; 刘国辉
Original assignee: JIANGSU STARTDIMA DATA PROCESSING CO Ltd
Current assignee: JIANGSU STARTDIMA DATA PROCESSING CO Ltd
Priority date: 2017-08-30
Filing date: 2017-08-30
Publication date: 2018-01-09

Abstract

本发明涉及模式识别与计算机视觉技术领域，特别是一种利用边缘和文字区域的证件关键区域检测定位方法，通过对证件图像进行预处理，得到证件图像的灰度图，并获取证件区域图像，利用最大稳定极值区域算法从证件区域图像中提取候选区域，并对候选区域进行过滤，保留文字区域，将过滤后的文字区域组合成文字块，比较文字块的相对位置，确定文字块所代表的字段内容，从而对各类证件上的信息都能有效提取，具有较好的通用性和实用性，能广泛应用于不同场合、不同载体的图像识别，识别度更高，效率更快，能快速鲁棒。

Description

一种利用边缘和文字区域的证件关键区域检测定位方法

技术领域

本发明涉及模式识别与计算机视觉技术领域，特别是一种利用边缘和文字区域的证件关键区域检测定位方法。

背景技术

如今越来越多的行业，如通信行业、酒店、网吧等，都需要对身份证件信息进行采集和登记，以进行实名制，传统的证件识别分类器不仅费时费力，效率低下，且对于大多数的行业的证件采集过程中，在对第二代居民身份证进行采集的基础上，还需要对护照、驾驶证、行驶证等有效证件上的信息进行采集，所以单纯的二代身份证读卡器，已经远远不能满足证件采集的需求，在如今在互联网大数据背景下，利用现代信息技术开展高效快捷便民服务工作，已是大势所趋，也正是在这种大背景下，各类证件识别软件应运而生。

证件识别软件是基于模式识别的基础对证件素材进行加工处理，属于计算机视觉的范畴，而证件识别软件多是通过各种证件识别方法以达到证件识别的目的，证件的识别方法是各类证件识别软件的基础，因此，提供一种可靠、准确的证件的关键区域的定位和检测方法，是整个证件识别技术中的重中之重。

发明内容

本发明的目的在于提供一种利用边缘和文字区域的证件关键区域检测定位方法，该方法能够快速、准确地提取证件图像中的关键区域。

为了实现上述目的，本发明采用的技术方案是：一种利用边缘和文字区域的证件关键区域检测定位方法，包括以下步骤：

S1.对证件图像进行预处理，得到证件图像的灰度图；

S2.对步骤S1得到的灰度图进行处理，获得证件图像的边缘，利用证件图像的边缘信息进行透视变换，获取证件区域图像；

S3.通过最大稳定极值区域算法从证件区域图像中提取候选区域，并对候选区域进行过滤，保留文字区域；

S4.将过滤后的文字区域组合成文字块；

S5.通过比较文字块的相对位置，确定文字块所代表的字段内容。

进一步地，在所述步骤S1中，按如下步骤对证件图像进行预处理：

S11.使用双线性插值对证件图像进行缩放，使证件图像的尺寸标准化，具体方法为：对于一个目的像素设置坐标，通过反向变换得到浮点坐标(i+u,j+v)，其中i、j分别为浮点坐标的整数部分，u、v分别为浮点坐标的小数部分，是取值[0,1)区间的浮点数，则这个像素的值为：

f(i+u,j+v)＝(1-u)(1-v)f(i,j)+(1-u)vf(i,j+1)+u(1-v)f(i+1,j)+uvf(i+1,j+1)；

其中f(i,j)表示源图像(i,j)处的像素值；

S12.对步骤S11处理后的标准化的证件图像使用灰度世界法进行自动白平衡处理，具体方法为：取图像的RGB通道分别计算出三通道各自的平均值avgR、avgG、avgB，然后通过下式计算得到灰度平均值avgGray：

通过下式计算三通道各自的增益系数Kr、Kg、Kb：

通过下式调整每个像素的RGB分量R’、G’、B’：

S13.将三通道的RGB图转化为单通道的灰度图，按下式对RGB三分量进行加权平均得到灰度图像：

Y＝0.299R+0.587G+0.114B；

其中，Y为灰度图像素值，R为源图像RGB中R通道的像素值，G为源图像RGB中G通道的像素值，B为源图像RGB中B通道的像素值。

进一步地，在所述步骤S2中，按如下步骤获取证件区域图像：

S21.对步骤S1得到的灰度图使用高斯滤波器平滑图像，采用二维高斯分布公式算出归一化的高斯模版h，其中x₀、y₀分别为核中心坐标，σ为标准差，在对高斯模版进行归一化后使用以下公式进行卷积得到平滑图像：

其中p、q分别为平滑图像的横、纵坐标，k为高斯滤波器的核大小，c为核中心坐标偏移量，m、n为高斯模版的横、纵坐标；

S22.使用一阶有限差分计算偏导数的两个阵列P与Q：

通过下式计算梯度幅值M和方位角θ：

S23.在各方位角上的梯度幅值进行非极大值抑制，搜索局部极大值；

S24.使用双阈值算法检测并连接边缘，对每个像素点首先判断该点是否超过高阈值，然后在该点的邻域点中寻找满足超过低阈值的点，再根据超过低阈值的点收集新的边缘，直到整个图像边缘闭合，在整个图像中查找完边缘后，将非边缘点剔除，即灰度值置为0；

S25.在边缘图像中寻找所有轮廓，并对寻找到的边缘轮廓进行多边形逼近，获取最大面积的四边形边缘的四个顶点；

S26.通过检测到的四边形边缘的四个顶点和目标图像的四个顶点按下式子得到透视矩阵T：

其中，a_ef表示透视矩阵T中第e行f列的元素，x、y分别表示变换前的横、纵坐标，x’、y’分别表示变换后的横、纵坐标；

利用下式的透视矩阵获取证件区域图像：

其中x’、y’、z’为源图像坐标，x、y、z为目标图像坐标。

进一步地，在所述步骤S3中，通过最大稳定极值区域算法从证件区域图像中提取候选区域的具体方法为：对证件区域图像取阈值，进行二值化处理，阈值从0到255依次递增，在得到的所有二值图像中，将连通区域变化最小的区域定义为最大稳定极值区域，并将所述最大稳定极值区域用公式表示为：

其中表示阈值为时对应的连通域的面积，Δ表示灰度阈值的微小变化量，表示阈值为时的面积变化率，当为局部极小值时则认为该区域为候选区域。

进一步地，在提取候选区域之后，对候选区域进行过滤之前，对候选区域进行Canny边缘检测，按照边缘点应满足的信噪比准则、定位精度准则、单边缘响应准则，提取Canny边缘点：

信噪比准则基于：

其中，f(x)表示边界为[-w w]滤波器的脉冲响应，G(x)表示边缘，n_o表示高斯噪声的均方根；

定位精度准则基于：

其中，G’(-x)、f’(x)分别表示G(-x)、f(x)的一阶导数；

单边缘响应准则要求f对噪声的响应中两个相邻最大值间距离为x_max(f)，f的零交叉点平均距离为x_zc，两者关系为：

x_max(f)＝2x_zc-kw

其中k为小于1的系数，

进一步地，在提取候选区域后，利用Canny边缘点检测单个候选区域的边缘图像，并通过笔画宽度变换和AdaBoost分类器过滤候选区域中的非文字区域。

进一步地，对提取的候选区域中的每一个Canny边缘点做笔画宽度变换的方法为：

假设p为边缘图像上的一个像素点，d_p是利用Sobel算子得到的该点的梯度方向，从p点开始沿着d_p方向作射线r＝p+n·d_p，n>0，并对射线进行延长，直到第一次寻找到另一个边缘像素点q，则终止查找，终止点q的梯度方向为d_q，若d_p和d_q方向大致相反，即满足则该射线为有效笔画，记录候选区域中有效笔画的数量，当超过设定的阈值时，则认定该候选区域为候选文字区域。

进一步地，将候选文字区域放入AdaBoost分类器中，AdaBoost分类器基于计算，其中F_T(x)为强分类器，T为弱分类器的数量，f_t为弱分类器，每一弱分类器分别由特征值f(x)和阈值f_θ组成，分类过程如下：

其中，j为弱分类器索引值，h_j(x)为分类结果，p_j为方向向量，f_j(x)为特征值函数；将弱分类器进行级联得到强分类器：

其中a_t＝log[(1-x_t)/x_t]；

其中，H(x)为强分类器分类结果，h(t)为弱分类器分类结果，x_t为每个弱分类器的加权错误率；

使用双阈值，分别得到强候选区域和弱候选区域，保留强候选区域为文字区域，对于弱候选区域，将各弱候选区域组成候选区域集合{A₁，A₂，……A_n},对于弱候选区域A_i，计算其与其他区域的交并比t，若t大于阈值，则A_i的出现频率加1，得到最终的频率；若弱候选区域的出现频率大，则认为该区域也是文字区域。

进一步地，在所述步骤S4中，按如下步骤将文字区域组合成文字块：

S41.考虑到文字块以水平文字块为主，计算文字区域与其右边相邻的文字区域中心点之间的间距，若最小间距大于阈值，则该文字区域没有与其连接的文字区域，否则选取其相邻区域作为候选连接区域；

S42.遍历所有的文字区域，通过链式连接组合各个文字区域，即对于文字区域A₁，找到其候选连接区域A₂，再找到A₂的候选连接区域A₃，……，直到A_i没有候选连接区域，组合A₁到A_i文字区域形成文字块；

S43.通过评估算法对定位结果进行评估，使用匹配值来描述定位的准确性，匹配值定义如下：

其中，m_a(r₁,r₂)为矩形框r₁和r₂的匹配值，a(r)为矩形框r的面积，当两个矩形框不相交时匹配值为0，当两个矩形框完全重合时匹配值为1，采用匹配值描述的准确率为召回率为其中r_t表示真实文本框，T是真实文本框集合，|T|为真实文本框的个数，r_e为算法输出的文本框，E是输出文本框集合，|E|表示输出文本框个数。

进一步地，在所述步骤S5中，按如下步骤确定文字块所代表的字段内容：

S51.统计各个文字块所在位置，初始化各个文字块的标号；

S52.根据证件不同的位置规则，确定首个文字块的位置，再根据相对位置，依次对文字块进行标号，最终得到文字块所表示的字段内容。

相较于现有技术，本发明的有益效果是：

1、本发明在文字定位的基础上，利用边缘和文字区域来检测、定位、提取证件关键区域，从各类图像处理算法中定位分割出证件文字有效区域，对各类证件上的信息都能有效提取，具有较好的通用性和实用性，能广泛应用于不同场合、不同载体的图像识别；

2、本发明先利用证件的边缘信息检测到证件区域的四个顶点，对图像进行使用透视变换后截取纯证件部分，再通过MSER算法提取候选区域，并使用SWT和AdaBoost分类器过滤得到文字区域，最后通过连接文字区域，以获得证件各个字段所在的位置，识别度更高，效率更快，能快速鲁棒。

附图说明

图1是本发明实施例的实现流程图。

具体实施方式

以下结合附图和具体实施例对本发明提出的技术方案进一步详细说明。根据下面说明和权利要求书，本发明的优点和特征将更清楚。需说明的是，附图均采用非常简化的形式且均使用非精准的比率，仅用于方便、明晰地辅助说明本发明实施例的目的。

本发明通过研究不同自动化的文字定位识别过程，提出一种利用边缘和稳定文字区域信息的证件关键区域检测与定位的方法，一方面，本发明是在文字定位这个大方向分离出的创新方法，符合实际需求，并且能落实后期实际识别应用，对各类证件都能准确、高效地提取，通用性好，有较好的实例效果，能得以广泛应用；另一方面，对于关键区域定位上，本方法是在各类图像处理算法定位分割出证件文字有效区域，在证件识别以外，也为文字识别打下了重要的基础。现结合附图和具体实施例对本发明进行具体说明。

图1是本发明实施例的实现流程图。本发明利用边缘和文字区域对证件关键区域进行检测定位的方法，如图1所示，包括以下步骤：

步骤S1.对证件图像进行预处理，得到证件图像的灰度图。预处理主要是通过一系列操作后改善图像数据，抑制不需要的变形，增强某些对于后续处理来说比较重要的图像特征，得到单通道的图像数据，具体步骤如下：

步骤S11.使用双线性插值对证件图像进行缩放，使证件图像的尺寸标准化，具体方法为：对于一个目的像素设置坐标，通过反向变换得到浮点坐标(i+u,j+v)，其中i、j分别为浮点坐标的整数部分，u、v分别为浮点坐标的小数部分，是取值[0,1)区间的浮点数，则这个像素的值为：

f(i+u,j+v)＝(1-u)(1-v)f(i,j)+(1-u)vf(i,j+1)+u(1-v)f(i+1,j)+uvf(i+1,j+1)；

其中f(i,j)表示源图像(i,j)处的像素值；

步骤S12.对步骤S11处理后的标准化的证件图像使用灰度世界法进行自动白平衡处理，具体方法为：取图像的RGB通道分别计算出三通道各自的平均值avgR、avgG、avgB，然后通过下式计算得到灰度平均值avgGray：

通过下式计算三通道各自的增益系数Kr、Kg、Kb：

通过下式调整每个像素的RGB分量R’、G’、B’：

步骤S13.将三通道的RGB图转化为单通道的灰度图，按下式对RGB三分量进行加权平均得到灰度图像：

Y＝0.299R+0.587G+0.114B；

步骤S2.对步骤S1得到的灰度图进行处理，获得证件图像的边缘，然后利用证件图像的边缘信息进行透视变换，获取证件区域图像。具体包括如下步骤：

步骤S21.对步骤S1得到的灰度图使用高斯滤波器平滑图像，采用二维高斯分布公式算出归一化的高斯模版h，其中x₀、y₀分别为核中心坐标，σ为标准差，在对高斯模版进行归一化后使用以下公式进行卷积得到平滑图像：

步骤S22.使用一阶有限差分计算偏导数的两个阵列P与Q：

通过下式计算梯度幅值M和方位角θ：

步骤S23.在各方位角上的梯度幅值进行非极大值抑制，搜索局部极大值；

步骤S24.使用双阈值算法检测并连接边缘，对每个像素点首先判断该点是否超过高阈值，然后在该点的邻域点中寻找满足超过低阈值的点，再根据超过低阈值的点收集新的边缘，直到整个图像边缘闭合，在整个图像中查找完边缘后，将非边缘点剔除，即灰度值置为0；

步骤S25.在边缘图像中寻找所有轮廓，并对寻找到的边缘轮廓进行多边形逼近，获取最大面积的四边形边缘的四个顶点；

步骤S26.通过检测到的四边形边缘的四个顶点和目标图像的四个顶点按下式子得到透视矩阵T：

利用下式的透视矩阵获取证件区域图像：

其中x’、y’、z’为源图像坐标，x、y、z为目标图像坐标。

在获得证件区域后，需要提取其中的文字区域，即：

步骤S3.通过最大稳定极值区域算法(MSER)从透视变换后的证件区域图像中提取最大稳定极值区域作为候选区域，再通过笔画宽度变换和AdaBoost分类器过滤掉非文字区域，保留文字区域。具体包括以下步骤：

步骤S31.使用最大稳定极值区域算法从图像中提取大量的候选区域，其中，最大稳定极值区域(MSER)基于分水岭，对证件区域图像取阈值，进行二值化处理，阈值从0到255依次递增，在得到的所有二值图像中，有些连通区域变化很小，将连通区域变化最小的区域定义为最大稳定极值区域，并将所述最大稳定极值区域用公式表示为：

步骤S32.对候选区域进行Canny边缘检测，按照边缘点应满足的信噪比准则、定位精度准则、单边缘响应准则，提取Canny边缘点：

信噪比准则基于：

定位精度准则基于：

其中，G’(-x)、f’(x)分别表示G(-x)、f(x)的一阶导数；

x_max(f)＝2x_zc-kw

其中k为小于1的系数，若满足此准则，就能保证单边缘只有一个响应。

步骤S33.对提取的候选区域中的每一个Canny边缘点做笔画宽度变换(SWT)：

步骤S34.将候选文字区域放入AdaBoost分类器中，AdaBoost分类器基于计算，其中F_T(x)为强分类器，T为弱分类器的数量，f_t为弱分类器，每一弱分类器分别由特征值f(x)和阈值f_θ组成，分类过程如下：

其中，j为弱分类器索引值，h_j(x)为分类结果，p_j为方向向量，f_j(x)为特征值函数。

将弱分类器进行级联得到强分类器：

其中a_t＝log[(1-x_t)/x_t]；

其中，H(x)为强分类器分类结果，h(t)为弱分类器分类结果，x_t为每个弱分类器的加权错误率。

在提取、过滤文字区域后，需对文本区域进行组合，最终形成文本块，实现证件的关键区域的检测与定位，文字区域处理过程为：

步骤S4.将过滤后的文字区域组合成文字块。具体包括如下步骤：

步骤S41.考虑到文字块以水平文字块为主，计算文字区域与其右边相邻的文字区域中心点之间的间距，若最小间距大于阈值，则该文字区域没有与其连接的文字区域，否则选取其相邻区域作为候选连接区域；

步骤S42.遍历所有的文字区域，通过链式连接组合各个文字区域，即对于文字区域A₁，找到其候选连接区域A₂，再找到A₂的候选连接区域A₃，……，直到A_i没有候选连接区域，组合A₁到A_i文字区域形成文字块；

步骤S43.通过评估算法对定位结果进行评估，使用匹配值来描述定位的准确性，匹配值定义如下：

步骤S5.通过比较文字块的相对位置，确定文字块所代表的字段内容。具体包括如下步骤：

步骤S51.统计各个文字块所在位置，初始化各个文字块的标号；

步骤S52.根据证件不同的位置规则，确定首个文字块的位置，再根据相对位置，依次对文字块进行标号，最终得到文字块所表示的字段内容。

通过以上的处理步骤，本发明先利用证件的边缘信息检测到证件区域的四个顶点，对图像进行使用透视变换后截取纯证件部分，再通过MSER算法提取候选区域，并使用SWT和AdaBoost分类器过滤得到文字区域，最后通过连接文字区域，以获得证件各个字段所在的位置，识别度更高，效率更快，能快速鲁棒。

显然，本领域的技术人员可以对发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

Claims

1.一种利用边缘和文字区域的证件关键区域检测定位方法，其特征在于，包括以下步骤：

S1.对证件图像进行预处理，得到证件图像的灰度图；

S4.将过滤后的文字区域组合成文字块；

2.根据权利要求1所述的一种利用边缘和文字区域的证件关键区域检测定位方法，其特征在于，在所述步骤S1中，按如下步骤对证件图像进行预处理：

f(i+u,j+v)＝(1-u)(1-v)f(i,j)+(1-u)vf(i,j+1)+u(1-v)f(i+1,j)+uvf(i+1,j+1)；

其中f(i,j)表示源图像(i,j)处的像素值；

通过下式计算三通道各自的增益系数Kr、Kg、Kb：

通过下式调整每个像素的RGB分量R’、G’、B’：

<mrow> <mfenced open = "{" close = "}"> <mtable> <mtr> <mtd> <msup> <mi>R</mi> <mo>&prime;</mo> </msup> <mo>=</mo> <mi>R</mi> <mo>*</mo> <mi>K</mi> <mi>r</mi> </mtd> </mtr> <mtr> <mtd> <msup> <mi>G</mi> <mo>&prime;</mo> </msup> <mo>=</mo> <mi>G</mi> <mo>*</mo> <mi>K</mi> <mi>g</mi> </mtd> </mtr> <mtr> <mtd> <msup> <mi>B</mi> <mo>&prime;</mo> </msup> <mo>=</mo> <mi>B</mi> <mo>*</mo> <mi>K</mi> <mi>b</mi> </mtd> </mtr> </mtable> </mfenced> <mo>;</mo> </mrow>

Y＝0.299R+0.587G+0.114B；

3.根据权利要求1所述的一种利用边缘和文字区域的证件关键区域检测定位方法，其特征在于，在所述步骤S2中，按如下步骤获取证件区域图像：

<mrow> <mfenced open = "{" close = "}"> <mtable> <mtr> <mtd> <mi>I</mi> <mo>(</mo> <mi>p</mi> <mo>,</mo> <mi>q</mi> <mo>)</mo> <mo>=</mo> <mstyle> <munderover> <mo>&Sigma;</mo> <mrow> <mi>m</mi> <mo>=</mo> <mn>0</mn> </mrow> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </munderover> </mstyle> <mstyle> <munderover> <mo>&Sigma;</mo> <mrow> <mi>n</mi> <mo>=</mo> <mn>0</mn> </mrow> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </munderover> </mstyle> <mi>f</mi> <mo>(</mo> <mi>p</mi> <mo>-</mo> <mi>c</mi> <mo>-</mo> <mi>m</mi> <mo>,</mo> <mi>q</mi> <mo>-</mo> <mi>c</mi> <mo>-</mo> <mi>n</mi> <mo>)</mo> <mi>h</mi> <mo>(</mo> <mi>m</mi> <mo>,</mo> <mi>n</mi> <mo>)</mo> </mtd> </mtr> <mtr> <mtd> <mi>c</mi> <mo>=</mo> <mfrac> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> <mn>2</mn> </mfrac> </mtd> </mtr> </mtable> </mfenced> <mo>;</mo> </mrow>

S22.使用一阶有限差分计算偏导数的两个阵列P与Q：

通过下式计算梯度幅值M和方位角θ：

<mrow> <mfenced open = "{" close = "}"> <mtable> <mtr> <mtd> <mi>M</mi> <mo>(</mo> <mi>p</mi> <mo>,</mo> <mi>q</mi> <mo>)</mo> <mo>=</mo> <msqrt> <mrow> <mi>P</mi> <msup> <mrow> <mo>(</mo> <mi>p</mi> <mo>+</mo> <mi>q</mi> <mo>)</mo> </mrow> <mn>2</mn> </msup> <mo>+</mo> <mi>Q</mi> <msup> <mrow> <mo>(</mo> <mi>p</mi> <mo>,</mo> <mi>q</mi> <mo>)</mo> </mrow> <mn>2</mn> </msup> </mrow> </msqrt> </mtd> </mtr> <mtr> <mtd> <mrow> <mi>&theta;</mi> <mrow> <mo>(</mo> <mi>p</mi> <mo>,</mo> <mi>q</mi> <mo>)</mo> </mrow> <mo>=</mo> <mi>a</mi> <mi>r</mi> <mi>c</mi> <mi>t</mi> <mi>a</mi> <mi>n</mi> <mrow> <mo>(</mo> <mfrac> <mrow> <mi>Q</mi> <mrow> <mo>(</mo> <mi>p</mi> <mo>,</mo> <mi>q</mi> <mo>)</mo> </mrow> </mrow> <mrow> <mi>P</mi> <mrow> <mo>(</mo> <mi>p</mi> <mo>,</mo> <mi>q</mi> <mo>)</mo> </mrow> </mrow> </mfrac> <mo>)</mo> </mrow> </mrow> </mtd> </mtr> </mtable> </mfenced> <mo>;</mo> </mrow>

<mrow> <mfenced open = "{" close = "}"> <mtable> <mtr> <mtd> <mi>T</mi> <mo>=</mo> <mfenced open = "[" close = "]"> <mtable> <mtr> <mtd> <msub> <mi>a</mi> <mn>11</mn> </msub> </mtd> <mtd> <msub> <mi>a</mi> <mn>12</mn> </msub> </mtd> <mtd> <msub> <mi>a</mi> <mn>13</mn> </msub> </mtd> </mtr> <mtr> <mtd> <msub> <mi>a</mi> <mn>21</mn> </msub> </mtd> <mtd> <msub> <mi>a</mi> <mn>22</mn> </msub> </mtd> <mtd> <msub> <mi>a</mi> <mn>23</mn> </msub> </mtd> </mtr> <mtr> <mtd> <msub> <mi>a</mi> <mn>31</mn> </msub> </mtd> <mtd> <msub> <mi>a</mi> <mn>32</mn> </msub> </mtd> <mtd> <msub> <mi>a</mi> <mn>33</mn> </msub> </mtd> </mtr> </mtable> </mfenced> </mtd> </mtr> <mtr> <mtd> <mrow> <msup> <mi>x</mi> <mo>&prime;</mo> </msup> <mo>=</mo> <mfrac> <mrow> <msub> <mi>a</mi> <mn>11</mn> </msub> <mi>x</mi> <mo>+</mo> <msub> <mi>a</mi> <mn>21</mn> </msub> <mi>y</mi> <mo>+</mo> <msub> <mi>a</mi> <mn>31</mn> </msub> </mrow> <mrow> <msub> <mi>a</mi> <mn>13</mn> </msub> <mi>x</mi> <mo>+</mo> <msub> <mi>a</mi> <mn>23</mn> </msub> <mi>y</mi> <mo>+</mo> <msub> <mi>a</mi> <mn>33</mn> </msub> </mrow> </mfrac> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <msup> <mi>y</mi> <mo>&prime;</mo> </msup> <mo>=</mo> <mfrac> <mrow> <msub> <mi>a</mi> <mn>12</mn> </msub> <mi>x</mi> <mo>+</mo> <msub> <mi>a</mi> <mn>22</mn> </msub> <msub> <mi>y</mi> <mi>i</mi> </msub> <mo>+</mo> <msub> <mi>a</mi> <mn>32</mn> </msub> </mrow> <mrow> <msub> <mi>a</mi> <mn>13</mn> </msub> <mi>x</mi> <mo>+</mo> <msub> <mi>a</mi> <mn>23</mn> </msub> <mi>y</mi> <mo>+</mo> <msub> <mi>a</mi> <mn>33</mn> </msub> </mrow> </mfrac> </mrow> </mtd> </mtr> </mtable> </mfenced> <mo>;</mo> </mrow>

利用下式的透视矩阵获取证件区域图像：

<mrow> <mo>&lsqb;</mo> <msup> <mi>x</mi> <mo>&prime;</mo> </msup> <mo>,</mo> <msup> <mi>y</mi> <mo>&prime;</mo> </msup> <mo>,</mo> <msup> <mi>z</mi> <mo>&prime;</mo> </msup> <mo>&rsqb;</mo> <mo>=</mo> <mo>&lsqb;</mo> <mi>x</mi> <mo>,</mo> <mi>y</mi> <mo>,</mo> <mi>z</mi> <mo>&rsqb;</mo> <mfenced open = "[" close = "]"> <mtable> <mtr> <mtd> <msub> <mi>a</mi> <mn>11</mn> </msub> </mtd> <mtd> <msub> <mi>a</mi> <mn>12</mn> </msub> </mtd> <mtd> <msub> <mi>a</mi> <mn>13</mn> </msub> </mtd> </mtr> <mtr> <mtd> <msub> <mi>a</mi> <mn>21</mn> </msub> </mtd> <mtd> <msub> <mi>a</mi> <mn>22</mn> </msub> </mtd> <mtd> <msub> <mi>a</mi> <mn>23</mn> </msub> </mtd> </mtr> <mtr> <mtd> <msub> <mi>a</mi> <mn>31</mn> </msub> </mtd> <mtd> <msub> <mi>a</mi> <mn>32</mn> </msub> </mtd> <mtd> <msub> <mi>a</mi> <mn>33</mn> </msub> </mtd> </mtr> </mtable> </mfenced> <mo>;</mo> </mrow>

其中x’、y’、z’为源图像坐标，x、y、z为目标图像坐标。

4.根据权利要求1所述的一种利用边缘和文字区域的证件关键区域检测定位方法，其特征在于，在所述步骤S3中，通过最大稳定极值区域算法从证件区域图像中提取候选区域的具体方法为：对证件区域图像取阈值，进行二值化处理，阈值从0到255依次递增，在得到的所有二值图像中，将连通区域变化最小的区域定义为最大稳定极值区域，并将所述最大稳定极值区域用公式表示为：

5.根据权利要求1或4所述的一种利用边缘和文字区域的证件关键区域检测定位方法，其特征在于，在提取候选区域之后，对候选区域进行过滤之前，对候选区域进行Canny边缘检测，按照边缘点应满足的信噪比准则、定位精度准则、单边缘响应准则，提取Canny边缘点：

信噪比准则基于：

<mrow> <mi>S</mi> <mi>N</mi> <mi>R</mi> <mrow> <mo>(</mo> <mi>f</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mrow> <mo>|</mo> <msubsup> <mo>&Integral;</mo> <mrow> <mo>-</mo> <mi>w</mi> </mrow> <mi>w</mi> </msubsup> <mi>G</mi> <mrow> <mo>(</mo> <mo>-</mo> <mi>x</mi> <mo>)</mo> </mrow> <mi>f</mi> <mrow> <mo>(</mo> <mi>x</mi> <mo>)</mo> </mrow> <mi>d</mi> <mi>x</mi> <mo>|</mo> </mrow> <mrow> <msub> <mi>n</mi> <mi>o</mi> </msub> <msup> <mrow> <mo>&lsqb;</mo> <msubsup> <mo>&Integral;</mo> <mrow> <mo>-</mo> <mi>w</mi> </mrow> <mi>w</mi> </msubsup> <msup> <mi>f</mi> <mn>2</mn> </msup> <mrow> <mo>(</mo> <mi>x</mi> <mo>)</mo> </mrow> <mi>d</mi> <mi>x</mi> <mo>&rsqb;</mo> </mrow> <mfrac> <mn>1</mn> <mn>2</mn> </mfrac> </msup> </mrow> </mfrac> </mrow>

定位精度准则基于：

<mrow> <mi>l</mi> <mi>o</mi> <mi>c</mi> <mi>a</mi> <mi>l</mi> <mi>i</mi> <mi>z</mi> <mi>a</mi> <mi>t</mi> <mi>i</mi> <mi>o</mi> <mi>n</mi> <mo>=</mo> <mfrac> <mrow> <mo>|</mo> <msubsup> <mo>&Integral;</mo> <mrow> <mo>-</mo> <mi>w</mi> </mrow> <mrow> <mo>+</mo> <mi>w</mi> </mrow> </msubsup> <msup> <mi>G</mi> <mo>&prime;</mo> </msup> <mrow> <mo>(</mo> <mo>-</mo> <mi>x</mi> <mo>)</mo> </mrow> <msup> <mi>f</mi> <mo>&prime;</mo> </msup> <mrow> <mo>(</mo> <mi>x</mi> <mo>)</mo> </mrow> <mi>d</mi> <mi>x</mi> <mo>|</mo> </mrow> <mrow> <msub> <mi>n</mi> <mn>0</mn> </msub> <mo>&lsqb;</mo> <msubsup> <mo>&Integral;</mo> <mrow> <mo>-</mo> <mi>w</mi> </mrow> <mrow> <mo>+</mo> <mi>w</mi> </mrow> </msubsup> <msup> <mi>f</mi> <mrow> <mo>&prime;</mo> <mn>2</mn> </mrow> </msup> <mrow> <mo>(</mo> <mi>x</mi> <mo>)</mo> </mrow> <mi>d</mi> <mi>x</mi> <mo>&rsqb;</mo> </mrow> </mfrac> </mrow>

其中，G’(-x)、f’(x)分别表示G(-x)、f(x)的一阶导数；

x_max(f)＝2x_zc-kw

其中k为小于1的系数，

6.根据权利要求5所述的一种利用边缘和文字区域的证件关键区域检测定位方法，其特征在于，在提取候选区域后，利用Canny边缘点检测单个候选区域的边缘图像，并通过笔画宽度变换和AdaBoost分类器过滤候选区域中的非文字区域。

7.根据权利要求6所述的一种利用边缘和文字区域的证件关键区域检测定位方法，其特征在于，对提取的候选区域中的每一个Canny边缘点做笔画宽度变换的方法为：

8.根据权利要求7所述的一种利用边缘和文字区域的证件关键区域检测定位方法，其特征在于，将候选文字区域放入AdaBoost分类器中，AdaBoost分类器基于计算，其中F_T(x)为强分类器，T为弱分类器的数量，f_t为弱分类器，每一弱分类器分别由特征值f(x)和阈值f_θ组成，分类过程如下：

<mrow> <msub> <mi>h</mi> <mi>j</mi> </msub> <mrow> <mo>(</mo> <mi>x</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mrow> <mn>1</mn> <mo>,</mo> <msub> <mi>p</mi> <mi>j</mi> </msub> <msub> <mi>f</mi> <mi>j</mi> </msub> <mrow> <mo>(</mo> <mi>x</mi> <mo>)</mo> </mrow> <mo><</mo> <msub> <mi>p</mi> <mi>j</mi> </msub> <msub> <mi>f</mi> <mi>&theta;</mi> </msub> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mn>0</mn> <mo>,</mo> <mi>o</mi> <mi>t</mi> <mi>h</mi> <mi>e</mi> <mi>r</mi> <mi>s</mi> </mrow> </mtd> </mtr> </mtable> </mfenced> <mo>;</mo> </mrow>

其中a_t＝log[(1-x_t)/x_t]；

9.根据权利要求1所述的一种利用边缘和文字区域的证件关键区域检测定位方法，其特征在于，在所述步骤S4中，按如下步骤将文字区域组合成文字块：

10.根据权利要求1所述的一种利用边缘和文字区域的证件关键区域检测定位方法，其特征在于，在所述步骤S5中，按如下步骤确定文字块所代表的字段内容：

S51.统计各个文字块所在位置，初始化各个文字块的标号；