CN100568264C

CN100568264C - 印章鉴别控制方法

Info

Publication number: CN100568264C
Application number: CNB2007100482894A
Authority: CN
Inventors: 章毅; 吕建成; 张权昉; 尚利峰; 毛华; 陈盈科
Original assignee: Individual
Current assignee: Individual
Priority date: 2007-01-18
Filing date: 2007-01-18
Publication date: 2009-12-09
Anticipated expiration: 2027-01-18
Also published as: CN101008985A

Abstract

本发明公开了一种印章鉴别控制方法，包括以下步骤：模版印文采集：通过CCD或者扫描仪将待识别的印文图像采集到数据库中，以图片格式存储，作为模版印文；待识别印文提取：利用二值化、骨架提取、边框提取和印文提取四个操作步骤提取待识别印文；印文配准：印文配准操作分为两个步骤，粗略配准和精细配准，粗略配准首先将待识别印文与模版印文调整到大致相同的位置和方向，精细配准进一步将两幅印文调整到几乎相同的位置和方向；印文鉴别：采用了多级识别策略及多特征分类融合决策方法对待识别印文和模版印文进行鉴别。该控制方法克服了现有技术中存在的缺点，能大大提高印章识别可靠性以及可识别效率。

Description

印章鉴别控制方法

技术领域

本发明涉及印章识别技术领域，具体涉及一种印章鉴别系统及其控制方法。

背景技术

随着我国市场经济的发展，几乎事事不离印，项项都需章，印章以其不可替代的身份信用功能参与我国的政治、经济和文化生活。然而，在现实生活中，由于我国现行各种印章的防伪性能差并且识别监管手段落后，长时间以来我们一直遭受着假冒印章的侵扰。正是这些假冒印章，繁衍出了一个又一个假合同、假票据、假证件、假产品，滋生了一个又一个违规违纪以至违法的大小案件。有资料显示，每年我国经济领域发生的数以千万计不讲信用、违规、违纪、违法的案件中，80％与假冒印章有关。由此可见假冒印章的泛滥，已经严重的危害到了社会的公平性和稳定性，给国家、社会、个人带来了巨大的损失。因此现在非常迫切的需要一套精确而高效的印章识别系统，来解决这一严重的问题。

印章识别工作就是将待识别的印章图像与留底的原始合法印章图像进行比较，判断待识别印章的合法性。其中主要包含的步骤有印文提取、印文配准和印文识别。当前印章识别工作采用的主要方式为人工识别方式和计算机自动识别方式。

在目前普遍采用的人工识别方式中，工作人员将待识别印章图像与留底印章图像相互重叠，并且通过人眼对两幅图像进行配准，然后通过肉眼观测其区别，最后按照一定的标准和经验来判断待识别印章是否合法。待识别印章通常都加盖在有一定背景的介质上，而人工识别无法将这些背景去除，加上一些图像噪声，会对人的观察和判断造成一些影响。加之现在印章制作已从人工制作转向了更精确的机器制作，使得人的肉眼更难以分辨出假冒印章来。

计算机自动识别方式中，通过将待识别印文的图像输入到计算机中，由识别程序进行分割、配准、识别操作。但是当前计算机识别系统存在一些尚未有效克服的难点：1)识别准确率不高。由于真假印章的相似程度通常比较高，且现有系统采用的通常都是比较传统的模式识别和图像处理方法，虽然获得了一定的效果，但是并没有找到一种广泛的、行之有效的鉴别真假印章的依据或者说区分真假印章间的特征，来准确的区分出那些差别非常细微的假冒印章与合法印章。2)限制条件多、适应性不强。由于人们在加盖印章时用力大小的不均匀，背景图案的多样化、复杂程度所带来的待识别印文的残缺，纹理粗细不一致以及背景噪声等因素所造成的印文提取失真给识别操作带来了很大的干扰，而当前尚没有一种可以在普遍情况下能够将这些干扰降低到最低的方法，通常只在符合某系统所采用的识别方法所需要的条件下，才能取得相对较好的结果。因此现有的系统通常对目标图像的质量有较多的限制。3)使用不够简便。很多现有系统中需要用户手工对印章进行配准，而人工配准所存在的问题是无法将印章图像精确的对齐，因此会对最终的识别结果造成较大的误差，同时也降低了工作人员的工作效率。中国专利CN00104581.4公开了一种印章真伪的鉴别方法包括如下步骤：a、在印章上设置由若干字符组成的查证码；b、建立与设有查证码的印章有关的印章管理数据库，并将该数据库上网(或与电话系统联网)；c、由持章人按照一定规则设定与所述查证码对应的印章验证密码，并将该验证密码输入所述印章管理数据库；d、通过电话(或电脑)接通所述印章管理数据库，输入欲鉴别印章的查证码后，由持章人向印章管理数据库输入印章验证密码，并由印章管理数据库对密码与查证码是否相符做出判断；若密码与查证码相符，则可判断该印章是真实的，持章人是合法的；反之，印章的真实性及持章人的合法性则可能有问题，有待进一步核实。该方法确实行之有效，但增加了许多附带工作，不能提高工作效率。

目前，模式识别和图像处理研究已经向着更加智能化的方向发展了，特别是与生物智能领域的结合。人工神经网络研究在最近20多年中发展非常迅速，已经取得了丰硕的成果，在实际应用中得到了充分的体现，已被应用到了经济、军事、工程等众多的领域，并在模式识别、知识处理、目标识别等领域取得了重要的成果。由于人工神经网络是在人们对人类大脑的生物神经网络的研究基础上，建立的一种对生物神经网络的抽象模型来实现生物神经网络所具有的某些功能。因此人工神经网络可以具有生物神经网络所具有的高容错性、泛化和适应能力强、强大的学习能力等显著的特点。

神经网络出色的容错能力使得目标印章在残缺、线条不均匀或不清晰的情况下不会对印章的识别带来严重的影响。较强的泛化和适应能力，使得在印文图案背景较为复杂，目标与背景图案颜色或形状相似的情况下能够被精确的分离出来而不损失信息。而强大的学习能力使得神经网络能够将每次的识别过程中所获得的高价值信息作为知识管理起来，并能通过学习到的知识对识别工作起到重要的作用，同时也可以在下一次的印章识别过程中使用学习到的知识。通过知识的累积，对印章的识别将会越来越精确，效率越来越高。由于这些显著的特点，神经网络具有跟人的大脑类似的有点，同时由于出色的计算能力，克服了人工印章识别中人的视觉所存在的部分缺陷，比如人眼无法区分出十分接近的目标。因此，通过采用神经网络这一新型的方法，它将能有效的克服采用传统方法在印章识别中所遇到的多种难题，获得相当理想的结果。神经网络技术目前在印章识别系统中尚未得到充分的运用。

当前由于社会经济不断飞速的发展，新制作的印章也越来越多，假冒伪劣印章出现的数量也越来越多，其仿冒的质量也越来越高。因此采用人工识别方式将会出现效率低、识别率低的情况。而现有的计算机识别系统也因其存在着难以克服的种种难题，越来越不适应当前印章识别的需要。新的更智能化的印章识别方法的研究与实现将有非常重大的现实意义和迫切性。

发明内容

本发明所要解决的技术问题是如何提供一种印章鉴别控制方法及其系统，该控制方法以及系统克服了现有技术中存在的缺点，能大大提高印章识别可靠性以及可识别效率。

本发明所提出的第一个技术问题是这样解决的：提供一种印章鉴别控制方法，包括模版印文采集、待识别印文提取、印文配准和印文鉴别四个步骤，其特征在于：

(1)、模版印文采集：通过CCD或者扫描仪将待识别的印文图像采集到数据库中，以图片格式存储，作为模版印文；

(2)、待识别印文提取：利用二值化、骨架提取、边框提取和印文提取四个操作步骤提取待识别印文；

(3)、印文配准：印文配准操作分为两个步骤，粗略配准和精细配准，粗略配准首先将待识别印文与模版印文调整到大致相同的位置和方向，精细配准进一步将两幅印文调整到几乎相同的位置和方向；

(4)、印文鉴别：采用了多级识别策略及多特征分类融合决策方法对待识别印文和模版印文进行鉴别。

按照本发明所提供的印章鉴别控制方法，其特征在于，待识别印文提取步骤中，具体提取方法如下：

(1)、二值化：将待识别印文的原始图像通过全局阈值法转化为二值图像，再采用数学形态学方法滤除图像中的空洞；

(2)、骨架提取：

A、采用填充算法分别得到图像Image-Inner和Image-Outer；

B、将Image-Inner和Image-Outer分别作为神经网络PCNN1和PCNN2的输入，然后这两个网络同时运行，其中，它们在第n次的输出分别为O₁(n)和O₂(n)；

C、将这两个网络第n次的输出做如下运算：

R(n)＝R(n-1)∨((O₁(n)∧O₂(n))∨(O₁(n-1)∧O₂(n)))

得到第n次的骨架结果，其中R(n-1)是第n-1次的骨架化结果；

D、如果满足网络设定停止条件，则网络停止运行，这时的骨架就是最终的结果；否则，网络继续运行，直到满足停止条件；

(3)、边框提取：对上一步骤所得的骨架进行三次膨胀操作，然后取反图，在乘以二值化步骤中所得到的二值化图像，即完成边框提取；

(4)、印文提取：将原RGB空间表示的彩色图像转化为HSV空间表示的图像，再转化为灰度图，然后利用阈值分割方法完成印文提取。

按照本发明所提供的印章鉴别控制方法，其特征在于，所述印文提取步骤中的阈值分割方法包括以下步骤：

(1)、从灰度直方图的最大值开始向左找第一个小于平均值的值对应得灰度值记为T_l；

(2)、从灰度直方图的最大值开始向右找第一个小于平均值的值对应得灰度值记为T_r；

(3)、所有灰度值落在[T_l，T_r]内的即为提取结果。

按照本发明所提供的印章鉴别控制方法，其特征在于，所述印文配准步骤中：

粗略配准包括以下步骤：首先通过PCA神经网络获得两幅印文各自的方向参数，然后根据这些方向参数进行角度调整，在方向基本配准的情况下，再采用外接矩形法，计算出印文四个方向的位置参数，以确定印文在图片中的位置，并采用这些参数进行位置上的配准，最后使得两幅印文的方向和位置基本一致；

精细配准包括以下步骤：在通过粗配准基础上获得的方向及位置参数基础上，进行小范围的平移和旋转，定义一个代价函数来描述变换过后的印文图像之间的关联度，最终找到一个关联度最大的位置和方向，达到精确配准结果。

按照本发明所提供的印章鉴别控制方法，其特征在于，所述多级识别策略方法包括以下步骤：首先进行的是差图像识别，通过将两幅配准后的印文图像重合后，得到它们差别图像，通过分析差图像进行判别，当分析结果可以明显的判断出待识别印文的真伪时，处理将退出，如果无法确定时，将进入下一级识别处理步骤，这些步骤包括：不变矩识别、环投影识别、特征融合识别、模拟人工识别等识别方式。

按照本发明所提供的印章鉴别控制方法，其特征在于，所述多特征分类融合决策方法包括以下步骤：首先获得印文的N种特征，然后通过对应的特征分类器对特征进行分类，以获得对应特征所能够分类的结果，然后将该结果输入到特征融合决策模块，该模块利用颗粒群优化方法对每一类特征经由对应分类器分类后的结果进行加权计算，最终得到印文的真伪结果，其中所述分类器是基于神经网络进行设计，在本系统中采用矢量量化方法(VQ方法)、支持向量机(SVM)、Fisher分类器和径向基神经网络(RBF)等分类器。

一种印章鉴别系统，其特征在于，包括数据库、识别服务器和若干用户终端，三者之间通过网络连接；其中用户终端，进行印文图像采集，请求服务器进行印文识别和显示识别结果；数据库，存储用户终端采集的模版印文和操作数据；识别服务器包括以下控制模块：印文提取模块、印章配准模块和印章识别模块。

本发明的有益效果如下：

1、基于脉冲耦合神经网络的印文提取算法，可以将印文从复杂背景中提取出来；

2、在印文配准部分采用两步配准策略，首先采用PCA神经网络进行粗配准，然后用启发式搜索的方法得到精确配准结果。该方法具有速度快，精度高特点。

3、采用多特征融合分类方法，避免了单一特征不稳定的缺点。

4、将已经识别的印文作为知识保存到数据库，为分类器的训练提供更多的样本。该方法可以得到更好的分类器参数，最终可以使得系统有较高的识别率。

附图说明

图1是本发明的工作流程图；

图2是本发明中待识别印文提取流程图；

图3是本发明的硬件结构图；

图4是本发明的印章鉴别流程图；

图5是本发明的多特征分类融合决策模块结构图(图5a，图5b)；

图6是本发明的骨架提取流程图；

图7是腐蚀操作原理图；

图8是膨胀操作原理图；

图9是脉冲耦合神经网络神经元模型图；

图10是PCA神经网络模型图；

图11是RBF神经网络结构图。

具体实施方式

下面结合附图对本发明作进一步的说明。

如图1、图3所示，本发明所提供的印章鉴别系统，主要包括数据库、识别服务器和若干用户终端，三者之间通过网络连接，其中用户终端，进行印文图像采集，请求服务器进行印文识别和显示识别结果，数据库，存储用户终端采集的模版印文和操作数据，识别服务器包括以下控制模块：印文提取模块，它包括二值化、骨架提取、边框提取和印文提取四个操作装置，印章配准模块，它包括粗略配准和精细配准两个装置，印章识别模块，它包括多级识别策略装置及多特征分类融合决策识别装置。本发明的工作流程描述如下：通过CCD或者扫描仪将待识别的印文图像采集到系统中，以图片格式存储，与此同时，与待识别印文相对应的原始合法印文图像即模版印文将从数据库中读出；当两幅相对应的印文准备就绪后，通过与识别服务器的连接提交到服务器请求识别服务；当流程进入到识别服务器中时，首先对待识别印文进行分割处理。分割处理的目的是将有效印文图像从背景中提取出来，只保留印文本身的部分，由于分割处理过程中，必定会有图像的损失或者印文本身的残缺，这将影响到后续处理，因此系统还将对分割出的待识别印文图像进行平滑、锐化和填充处理，使得印文图像更加清晰完整，以减少对后续处理的干扰。

本发明所提供的印章鉴别控制方法，包括模版印文采集、待识别印文提取、印文配准和印文鉴别四个步骤：

(2)、待识别印文提取：利用二值化、骨架提取、边框提取和印文提取四个操作步骤提取待识别印文。二值化：将待识别印文的原始图像通过全局阈值法转化为二值图像，再采用数学形态学方法(该方法是一种应用于图像处理和模式识别的领域的新的方法，基本思想是用具有一定形态的结构元素去度量和提取图像中的对应形状以达到对图像分析和识别的目的)滤除图像中的空洞，再将所得图像进行三次膨胀操作，然后进行三次腐蚀操作，最终得到图像。骨架提取具体操作步骤如图6所示：采用填充算法分别得到图像Image-Inner和Image-Outer；将Image-Inner和Image-Outer分别作为神经网络PCNN1和PCNN2的输入，然后这两个网络同时运行，其中，它们在第n次的输出分别为O₁(n)和O₂(n)；将这两个网络第n次的输出做如下运算：

R(n)＝R(n-1)∨((O₁(n)∧O₂(n))∨(O₁(n-1)∧O₂(n)))

得到第n次的骨架结果，其中R(n-1)是第n-1次的骨架化结果；如果满足网络设定停止条件，则网络停止运行，这时的骨架就是最终的结果；否则，网络继续运行，直到满足停止条件。边框提取：对上一步骤所得的骨架进行三次膨胀操作，然后取反图，在乘以二值化步骤中所得到的二值化图像，即完成边框提取。其中腐蚀操作原理如图7所示，左边是被处理的图像X(二值图象，针对的是黑点)，中间是结构元素B，标有origin的点是中心点，即当前处理元素的位置，腐蚀的方法是，拿B的中心点和X上的点一个一个地对比，如果B上的所有点都在X的范围内，则该点保留，否则将该点去掉；右边是腐蚀后的结果。可以看出，它仍在原来X的范围内，且比X包含的点要少，就像X被腐蚀掉了一层。膨胀操作原理如图8所示，左边是被处理的图像X(二值图象，针对的是黑点)，中间是结构元素B，膨胀的方法是，拿B的中心点和X上的点及X周围的点一个一个地对，如果B上有一个点落在X的范围内，则该点就为黑；右边是膨胀后的结果。可以看出，它包括X的所有范围，就像X膨胀了一圈似的。印文提取是将原RGB空间表示的彩色图像转化为HSV空间表示的图像，再转化为灰度图，然后利用阈值分割方法完成印文提取，而阈值分割方法包括以下步骤：从灰度直方图的最大值开始向左找第一个小于平均值的值对应得灰度值记为T_l；从灰度直方图的最大值开始向右找第一个小于平均值的值对应得灰度值记为T_r；所有灰度值落在[T_l，T_r]内的即为提取结果。

(3)、印文配准：印文配准操作分为两个步骤，粗略配准和精细配准，粗略配准首先将待识别印文与模版印文调整到大致相同的位置和方向，精细配准进一步将两幅印文调整到几乎相同的位置和方向；粗略配准包括以下步骤：首先通过PCA神经网络获得两幅印文各自的方向参数，然后根据这些方向参数进行角度调整，在方向基本配准的情况下，再采用外接矩形法，计算出印文四个方向的位置参数，以确定印文在图片中的位置，并采用这些参数进行位置上的配准，最后使得两幅印文的方向和位置基本一致；精细配准包括以下步骤：在通过粗配准基础上获得的方向及位置参数基础上，进行小范围的平移和旋转，定义一个代价函数来描述变换过后的印文图像之间的关联度，最终找到一个关联度最大的位置和方向，达到精确配准结果。其中PCA神经网络方向配准：主成分分析(PCA)是种通用数据降维方法，在多元统计分析中，不同变量的背后可能存在相同的驱动因素，主成分分析通过将分散在一组变量上的信息集中到某几个综合指标(主成分)上，每一个主成分都是原始变量的线性组合，主成分之间互为正交关系，从而达到剔除冗余信息的目的。通过PCA，我们可以得到印文图像的全局分布情况，亦即印文图像在某一个方向上有最大的投影，用此方向作为印文方向。由于其采用全局分布的特性，因此可以克服通过几何方式对圆形或者完全对称图形无法较好处理的缺陷。处理流程如下：1.将印文图像二值化为黑白两色，背景为白色，印文为黑色；2.定义黑色像素序列：

{s(k)＝[x(k)，y(k)]^T|s(k)∈R²(k＝0，1，...)}

其中，s(k)表示第k个印文像素，x(k)和y(k)表示该像素的x与y坐标，且x(k)与y(k)均0均值化；3.通过方程

C_k＝s(k)×s^T(k)

求得其协方差矩阵C_k，将其带入网络描述方程：

w(k+1)＝w(k)+η[C_kw(k)-w^T(k)C_kw(k)w(k)]

进行计算，其中w(k)＝[w₁(k)，w₂(k)]^T；4.当计算结束时，得到的w(k+1)将为表示印文方向的向量；5.通过计算出模版印文与待鉴印文的方向向量，就可以获得其角度差，然后通过旋转即可将其配准到大致相同的方向。PCA神经网络模型如图10所示。

(4)、印文鉴别：采用了多级识别策略及多特征分类融合决策方法对待识别印文和模版印文进行鉴别。配准操作完成后将进行特征提取和基于特征的印文识别操作，系统将采用一种新的方式进行，如图4所示，本系统采用了多级识别策略及多特征分类融合决策方法。多级识别策略可根据业务需求进行优化组合，同时引入了神经网络方法拥有的强大学习能力，使得识别过程的准确度可以不断提高。多级识别处理模块实现了多级识别策略。此模块中的流程如上所述可根据实际业务(如银行支票验印)和新算法模块的引入以及根据神经网络学习的结果进行步骤的调整，每个步骤被设计为单一模块，可根据需要进行组合及改进以达到快速和准确的识别。在上图所示的流程中，首先进行的是差图像识别，通过将两幅配准后的印文图像重合后，得到它们差别图像，通过分析差图像进行判别。当分析结果可以明显的判断出待识别印文的真伪时，处理将退出，如果无法确定时，将进入下一级识别处理步骤，这些步骤包括：不变矩识别、可变矩识别、环投影识别、特征融合识别、模拟人工识别等识别方式。

其中不变矩识别模式：基于不变矩的印鉴识别方法是考虑印鉴笔划分布的一些最重要的统计特征，而不考虑笔划在空间分布的具体结构特征。印文图像的矩不变量是一种具有平移、旋转、缩放不变特性的特征量，其与印文图像是一一对应的。同一印章所形成的印文图像，其矩不变量应该保持恒定的值。基于不变矩的这一特性，可选用印鉴图像的七个不变矩量作为特征，在特征空间中计算出待验印鉴与预留印鉴之间的欧氏距离，选择适当阈值对待验印鉴进行识别。其流程如下：

1.分别计算出模版印文和待识别印文的矩不变量组，其计算方法由下所述：

设f(x，y)为印文数字图像的函数，定义此图像的p+q阶矩m_pq为：

m_{pq} = \underset{x}{Σ} \underset{y}{Σ} x^{p} y^{q} f (x, y)

定义其p+q阶中心矩μ_pq为：

μ_{pq} = \underset{x}{Σ} \underset{y}{Σ} {(x - \overset{&OverBar;}{x})}^{p} {(y - \overset{&OverBar;}{y})}^{q} f (x, y)

其中：x＝m₁₀/m₀₀，y＝m₀₁/m₀₀

定义其p+q阶归一化中心矩η_pq为：

η_pq＝μ_pq/μ₀₀′

式中：r＝(p+q)/2+1，p+q＝2、3、L...

由归一化的二阶和三阶中心矩可得到以下七个具有对平移、旋转和尺度变换不变特性的矩：

(3 η_{21} - η_{03}) (η_{21} + η_{03}) [3 {(η_{30} + η_{12})}^{2} - {(η_{21} + η_{03})}^{2}]

(3 η_{12} - η_{30}) (η_{21} + η_{03}) [3 {(η_{30} + η_{12})}^{2} - {(η_{21} + η_{03})}^{2}]

2.在获得了待验印鉴和预留印鉴不变矩组后，采用以下方法计算出它们相对的欧氏距离：

由于不变矩组中每个矩的量纲不完全一致，为使每个不变矩的贡献均等，需要对其转化为同一量纲，转化公式如下：

3.通过统计得到同一合法印章所盖出印文图像与模版印文的欧式距离平均值D1作为为真章阈值，同样方法得到D2为假章阈值。在实际识别过程中得到的模版印文与待识别印文的据不变量组的欧式距离D＜D1时，待鉴印章为真；当D1≤D≤D2时为可疑，进入下一级识别；当D＞D2时为假章，拒绝通过。

其中环投影识别模式：基于环投影的印鉴识别方法[67-69]采用反映印鉴笔划分布统计特征的环投影作为特征向量，构造反映匹配程度的相关函数，根据待验印鉴与模板印鉴之间的相关性对印鉴进行鉴别。其方法为：以印鉴图像的形心为圆心，将其分成若干个区域环，统计每个区域环上属于印鉴的点的数目，则这些区域环构成一个矢量，计算其与模板印鉴的相关性，根据设定的相关性测度值对其进行真伪判决。流程如下：

1.以印鉴图像的形心为原点，以最大半径R为极坐标轴，将印鉴图像由直角坐标系转化为极坐标系：

式中：0≤r≤R 0≤θ≤2π

2.在极坐标系下，以形心为原点，以不大于最大半径R的整数为半径，做一系列圆环，统计每个圆环上包含印鉴图像点的数目，R_ri即该圆环上的投影值，记为P_ri

P_{ri} = Σ_{θ = 0}^{2 π} f (r_{i}, θ), 1 \leq r_{i} \leq R

这一系列圆环上的投影值构成一特征向量，记为S

S＝[P_r1，P_r2，L，P_ri，L，P_rm]′

式中：n为不大于R的最大整数。

3.在得到印鉴的环投影矢量后，需要确定相关性测度函数来确定其真伪，本系统采用一维模板匹配法确定待验印鉴和模板印鉴的相关性。

设两个图像为f(x)和g(x)，假设失配的测度为：

∫_L[f(x)-g(x)]²dx

则由柯西不等式：

{&Integral;}_{L} f (x) g (x) dx \leq \sqrt{{&Integral;}_{L} f {(x)}^{2} dx {&Integral;}_{L} g {(x)}^{2} dx}

∫_Lf(x)²dx和∫_Lg(x)²dx分别是模板的总能量和模板覆盖下那块图像子图的能量，∫_Lf(x)g(x)dx是子图与模板的互相关。∫_Lf(x)g(x)dx越小，∫_L[f(x)-g(x)]²dx就越大，因此∫_Lf(x)g(x)dx可用作失配的测度。

对于离散的数字图像则有：

D (i) = Σ_{i = 1}^{n} {[f (i) - g (i)]}^{2}

可得归一化相关函数为：

R (i) = \frac{Σ_{i = 1}^{n} f (i) \times g (i)}{\sqrt{Σ_{i = 1}^{n} f {(i)}^{2}} \times \sqrt{Σ_{i = 1}^{n} g {(i)}^{2}}}

4.采用统计方法获得R1为真章阈值，R2为假章阈值。当实际识别中的待鉴印文与模版印文图像的R＞R1时，待鉴印章为真；当R2≤R≤R1时为可疑，进入下一级识别；当R＜R2时为假章，拒绝通过。

其中模拟人工识别模式主要流程如下：

1.将模版印文与待识别印文进行重叠，然后通过平移和旋转进行人工配准；

2.在配准的情况下，通过肉眼观测两幅印文的相差部分的分布情况判断或者通过模拟折角比对进行判断；

3.根据以上观察的结果判断印章真伪。

其中多特征融合识别策略：可变换组合处理模块中的每一步识别处理都是根据印文图像的某一种特征来进行处理，通常在针对某一种具体业务采用的单一特征处理过后，应该能够获得满意结果，但系统仍然提供了一种新的处理方式作为自动识别的最后步骤，这就是多特征分类融合识别。多特征分类融合决策模块结构图如图5a所示，模块首先获得印文的N种特征，然后通过对应的特征分类器对特征进行分类，以获得对应特征所能够分类的结果(真或假)，然后这些结果将输入到分类融合决策模块。在此模块中，系统设计了一种类似于权值的规则，对每一类特征经由对应分类器分类后的结果进行加权计算，最终得到印文的真伪结果。分类器将基于神经网络进行设计。此流程中进行分类和融合决策的过程也同时是系统所设计的神经网络进行训练学习的过程。当分类和融合决策结束后，系统将把分类及决策结果和网络训练获得的知识以及描述特征的数据存储到数据库中，以提高下一次处理的准确度，这是由于随着处理次数的增加，样本空间随之增加，而基于更大样本空间的网络在学习后所得到的能力更强，因而判断印文真伪的能力越强。当分类融合决策仍然不能得到正确结果时，系统最后提供了模拟人工比对流程。在此流程中，用户可以通过系统提供的一系列功能来模拟人工比对的工作，由用户自己来判断印文的真伪。具体如图5b所示，该策略主要由三个部分构成：1、特征提取；2、分类器；3、融合策略；本系统采用的特征提取方法有：1、描述图像全局特征的矩不变量；2、奇异值；3、主元；4、非负矩阵分解(NMF)提取特征；5、LDA方法提取的特征。在分类器部分，系统主要采用神经网络分类器，主要有矢量量化方法(VQ方法)、支持向量机(SVM)、Fisher分类器、自组织映射网络(SOM)和径向基神经网络(RBF)。最后，采用粒子群优化(PSO)方法对多种分类结果进行融合。该模块的控制流程如下：首先，用特征提取方法将输入印文的特征提取出来，作为分类器的训练样本；其次，以上一步提取的特征作为样本，对分类器进行训练，并且将训练好的分类器用来对新输入的印文进行识别；最后，对不同分类器给出的识别结果采用颗粒群优化方法进行融合。将融合后的结果作为系统的最终识别结果。

所述颗粒群优化方法(粒子群优化方法)同遗传算法一样都是一种进化计算技术，它源于对鸟群捕食行为的研究，系统初始化为一组随机解，然后粒子在解空间追随最优的粒子进行搜索，直到满足停止条件。最优是通过待优化函数来度量的。该方法的优点在于，实现简单并且没有许多参数需要调整。目前已经广泛应用于函数优化，神经网络训练，模糊系统控制等应用领域。在本系统中，主要是用改方法对各个分类器在融合策略中所占的权重进行优化，使得融合后的方法具有更高的识别率。

其中矢量量化方法是一种重要的有导师的分类工具，本方法的目的在于在每一类训练样本中找到一些特征矢量，然后将待识别的样本和每类的特征矢量进行相关性计算，最终找到改样本所属的类。学习矢量量化神经网络由三层神经元组成，即输入转换层、隐含层和输出层。其中输入层与隐含层之间为完全连接，而隐含层与输出层之间为部分连接，每个输出神经元与隐含神经元的不同组相连接。隐含-输出神经元间连接的权值固定为1。输入-隐含神经元间连接的权值建立特征矢量的分量。在网络训练过程中，这些权值被修改。隐含神经元和输出神经元都具有二进制输出值。当训练好的LVQ神经网络用来进行分类时，将待识别的模式输入网络，参考矢量最接近输入模式的隐含神经元因获得激发而赢得竞争，因而允许它产生一个“1”。其它隐含神经元都被迫产生“0”。与包含获胜神经元的隐含神经元组相连接的输出神经元也发出“1”，而其它输出神经元均发出“0”。产生“1”的输出神经元给出输入模式的类，每个输出神经元被表示为不同的类。一般采用的LVQ训练步骤如下：1、预置参考矢量初始权值；2、供给网络一个训练输入模式；3、计算输入模式与每个参考矢量间的欧氏距离；4、更新最接近输入模式的参考矢量(即获胜隐含神经元的参考矢量)的权值，如果获胜隐含神经元以输入模式一样的类属于连接至输出神经元的缓冲器，那么参考矢量应更接近输入模式。否则，参考矢量就离开输入模式；5、转至步骤2，以某个新的训练输入模式重复本过程，直至全部训练模式被正确地分类或者满足某个终止准则为止，在该识别系统中，是将提取的印文特征作为识别模式的。

其中Fisher分类器是指FLDA分类器(Fisher Linear Discriminant Analysis，FLDA)：Fisher方法实际上也是涉及维数压缩问题，即将高维空间解析和计算都难以实现的“维数灾难”问题，变为解析和计算上都较为方便的低维空间的问题。其思想是通过需要一种线性变化，使得输入向量经过该变换后，在某种意义上类间分离性最大，类内相异性最小。当FLDA用来做印章识别时步骤如下：通过FLDA将高维的留底印文特征降到低维的空间上；找到低维数据的特征向量；将待识别的印文特征根据训练好的FLDA进行降维；计算上一步得到的低维数据和样本类的特征向量的相关性，最终决定所属类别。

其中径向基函数神经网络(RBF)是一种局部逼近的神经网络，它的输出与连接权之间呈线性关系，因此可采用保证全局收敛的线性优化算法。近年来，RBF神经网络已成功地用于处理非线性函数逼近和数据分类问题。RBF神经网络是含有单个隐含层的前向三层神经网络，其拓扑结构如图11所示：输入层由信号源结点构成；第二层为隐含层，结点数视需要而定；第三层是输出层，它对输入模式做出响应。其中，从输入空间到输出层空间的变化是非线性的，隐含层空间到输出层空间是线性的，而隐含结点的激活函数是RBF函数，一种局部分布的关于中心点对称的非线性函数。事实上，RBF神经网络可看作从特征子空间到类的映射，每类对应于网络一个输出结点的响应。一般来说，输入层的结点数与输入特征矢量的维数相等，输出层的结点数就是待分类模式类别数。RBF神经网络的学习算法包括两部分，一部分是网络隐含层结点的个数，以及径向基函数的中心和宽度等参数的确定，简称中心学习算法；另一部分是隐含层到输出层连接权值的确定。因为网络输出与连接权之间呈线性关系，所以对于连接权值的训练可以采用一些线性优化算法。径向基函数神经网络学习算法的关键在于隐含结点的数量和相关的确定，该确定的好坏直接影响到网络的泛化特性。

其中支持向量机是基于统计学习理论的一种新的机器学习方法.统计学习理论是一种专门研究小样本情况下机器学习规律的理论，基于此理论发展的SVM通用学习方法，由于基于结构风险最小化(SRM)原理，对实际应用中有限训练样本的问题，表现出很多优于已有方法的性能，取得了大量的研究成果，推动了各领域的发展。

本发明在实施过程中，重点是基于神经网络原理，如图像边缘提取、骨架提取和空洞填充等诸多步骤，都利用了神经网络原理及其相关模型。下面重点阐述一下脉冲耦合神经网络模型，如图9所示的脉冲耦合神经元N_i，j的基本模型。其中Y_k(1≤k≤4)来自其它神经元的输入和I_i，j是外部输入，F_i，j和L_i，j分别是神经元N_i，j的馈送输入和连接输入，内步行为U_i，j的计算公式为U_i，j＝F_i，j(1+β_i，jL_i，j)，其中β_i，j是神经元i，j之间的连接强度。在脉冲产生器部分，U_i，j和阈值θ_i，j比较。如果U_i，j大于θ_i，j，神经元N_i，j产生脉冲，然后它的阈值变成一个很大的值，以阻止该神经元再次点火。下面结合该网络在图像处理中的应用，详细描述该网络的模型。当脉冲耦合神经网络用在图像处理中时，每一个神经元和图像中的一个象素对应。图像的灰度值作为神经元的馈送输入。阈值θ_i，j初始化为T_A ^h，然后由公式

θ_{i, j} &LeftArrow; θ_{i, j} + Y_{i, j} (T_{B}^{h} - T_{A}^{h})

进行调整，下面介绍参数的设定。

与传统人工神经网络不同，脉冲耦合神经网络不需要进行训练，但是需要进行参数的设定。在本文中主要设定三个参数T_A ^h、T_B ^h和β。考虑一个二值图由两部分组成：物体R和背景B。我们分别用T_B和T_R表示背景和物体的灰度值。为了方便参数的设定，不妨将T_B设定为2将T_R设定为1。一般来说，只要点火特性确定了，网络的参数也就可以给出了，该网络具有如下点火特点：1、最开始只有背景神经元(背景象素对应的神经元)点火，物体神经元(物体象素对应的神经元)不会点火；2、物体神经元只有在收到来自其它神经元的输入就会点火。结合特点1容易知道，第二次只有物体的边框会点火；点火后的神经元不会再次点火，因此容易得到如下不等式组：

\{\begin{matrix} T_{R} = 1 < T_{A}^{h} < T_{B} = 2, \\ T_{R} (1 + β) = 1 + β > T_{A}^{h}, \\ T_{B} (1 + 4 β) = 2 + 8 β < T_{B}^{h} \end{matrix}

很明显，解

\{\begin{matrix} T_{A}^{h} = (T_{R} + T_{B}) / 2 = 1.5, \\ β = T_{A}^{h} / T_{R} = 1.5, \\ T_{B}^{h} = T_{B} (1 + 4 β) + 1 = 15, \end{matrix}

时不等式组的一个解。这就给出了一个确定参数的一般方法。

脉冲耦合神经网络在图像处理中的应用，如空洞填充，空洞填充是图像处理中的一个基本操作，采用脉冲耦合神经网络很容易实现这一操作。对于一个二值图像F，用F(i，j)表示第(i，j)个象素的灰度值。然后对该图像做如下简单变换：

M (F (i, j)) = \{\begin{matrix} F (i, j), 1 < i < m, 1 < j < n \\ 2, otherwise, \end{matrix}

将变换后的图像作为脉冲耦合神经网络的输入，当没有新的神经元点火时停止运行。那么这个时候网络的输出就是填充的结果。如骨架提取，具体如图6所示。

Claims

1、一种印章鉴别控制方法，包括模版印文采集、待识别印文提取、印文配准和印文鉴别四个步骤，其特征在于：

(2)、待识别印文提取：利用二值化、骨架提取、边框提取和印文提取四个操作步骤提取待识别印文：

①二值化：将待识别印文的原始图像通过全局阈值法转化为二值图像，再采用数学形态学方法滤除图像中的空洞；

②骨架提取：

A、采用填充算法分别得到图像Image-Inner和Image-Outer；

C、将这两个网络第n次的输出做如下运算：

R(n)＝R(n-1)∨((O₁(n)∧O₂(n))∨(O₁(n-1)∧O₂(n)))

得到第n次的骨架结果，其中R(n-1)是第n-1次的骨架化结果；

③边框提取：对上一步骤所得的骨架进行三次膨胀操作，然后取反图，再乘以二值化步骤中所得到的二值化图像，即完成边框提取；

④印文提取：将原RGB空间表示的彩色图像转化为HSV空间表示的图像，再转化为灰度图，然后利用阈值分割方法完成印文提取；

2、根据权利要求1所述的印章鉴别控制方法，其特征在于，所述印文提取步骤中的阈值分割方法包括以下步骤：

(3)、所有灰度值落在[T_l，T_r]内的即为提取结果。

3、根据权利要求1所述的印章鉴别控制方法，其特征在于，所述印文配准步骤中：粗略配准包括以下步骤：首先通过PCA神经网络获得两幅印文各自的方向参数，然后根据这些方向参数进行角度调整，在方向基本配准的情况下，再采用外接矩形法，计算出印文四个方向的位置参数，以确定印文在图片中的位置，并采用这些参数进行位置上的配准，最后使得两幅印文的方向和位置基本一致；精细配准包括以下步骤：在通过粗配准基础上获得的方向及位置参数基础上，进行小范围的平移和旋转，定义一个代价函数来描述变换过后的印文图像之间的关联度，最终找到一个关联度最大的位置和方向，达到精细配准结果。

4、根据权利要求1所述的印章鉴别控制方法，其特征在于，所述多级识别策略方法包括以下步骤：首先进行的是差图像识别，通过将两幅配准后的印文图像重合后，得到它们差别图像，通过分析差图像进行判别，当分析结果可以明显的判断出待识别印文的真伪时，处理将退出，如果无法确定时，将进入下一级识别处理步骤，这些步骤包括：不变矩识别、可变矩识别、环投影识别、特征融合识别和模拟人工识别。

5、根据权利要求1所述的印章鉴别控制方法，其特征在于，所述多特征分类融合决策方法包括以下步骤：首先获得印文的N种特征，然后通过对应的特征分类器对特征进行分类，以获得对应特征所能够分类的结果，然后将该结果输入到特征融合决策模块，该模块利用颗粒群优化方法，对每一类特征经由对应分类器分类后的结果进行加权计算，最终得到印文的真伪结果，其中所述分类器是基于神经网络进行设计，包括矢量量化方法、支持向量机、Fisher分类器、自组织映射网络和径向基神经网络分类器。