CN101464951B

CN101464951B - 图像识别方法及系统

Info

Publication number: CN101464951B
Application number: CN2007103019508A
Authority: CN
Inventors: 曾培祥
Original assignee: Founder International Beijing Co Ltd; Peking University Founder Group Co Ltd
Current assignee: New Founder Holdings Development Co ltd; Founder International Beijing Co Ltd
Priority date: 2007-12-21
Filing date: 2007-12-21
Publication date: 2012-05-30
Anticipated expiration: 2027-12-21
Also published as: CN101464951A

Abstract

本发明公开了一种图像识别方法及系统，涉及采用模式识别技术对静态的目标图像进行识别的方法及系统。解决了现有图像识别技术中速度相对较慢问题。该图像识别方法及系统将图像的标识区域信息和标识区域内的特征信息保存为模板信息，然后利用标识区域确定待识别图像中的待识别区域，然后比较标识区域和待识别区域内的特征信息，当两者的相似度在误差范围时，认为待识别图像和目标图像相匹配，实现图像识别，在识别过程中，只需要比较待识别区域的特征信息，数据量较少，并且不需要对特征信息进行逻辑推理和数学运算，从而加快了图像识别速度。本发明主要用于寻找相匹配的图像，例如：票据识别、印章识别等。

Description

图像识别方法及系统

技术领域

本发明涉及图像识别的技术领域，特别涉及采用模式识别技术对静态的目标图像进行识别的方法及系统。

背景技术

图像识别作为办公自动化中一个高端技术，正随着模式识别技术的发展而不断发展，并被积极推广应用。例如：部分机场采用指纹识别技术进行身份确认。模式识别是一种从大量信息和数据出发，在专家经验和已有认识的基础上，利用计算机和数学推理的方法对形状、模式、曲线、数字、字符格式和图形自动完成识别的过程。模式识别包括相互关联的两个阶段，即学习阶段和实现阶段；学习阶段是对样本进行特征选择，寻找分类的规律；实现阶段是根据分类规律对未知样本集进行分类和识别。

在模式识别技术的目标图像的识别问题中，目标搜索、特征信息提取、逻辑判别是三个主要技术环节。目标图像的识别技术需要通过对图像信息的多重数据处理，获得目标图像的边界信息，通过边界信息和其它图像信息提取或计算得到目标图像的特征信息，然后对特征信息进行逻辑判断，以获得目标图像的识别结果。

上述特征信息的提取目前尚无通用的提取方法，只能通过分析具体识别对象来决定选取何种特征信息，然后针对选择特征信息的特点来设计提取方法，不具有通用性。目前所选择的特征信息除了图像的形象信息外，其他特征信息都包含基于逻辑思维的，或者需要经过图像信息处理、数学变换、演绎推理、统计计算才能得到的特征信息。现有技术中逻辑判断是通过获得的多个特征信息不同取值的组合来判断，以获得目标图像的识别结果。在很多场合，这种特征信息取值组合与目标图像之间的关系，都需要大量的实验获得经验数据，或者通过专家系统技术来获得，经验数据是保证逻辑判断准确因数之一。

在上述目标图像的识别技术中，图像特征信息提取和目标识别过程要完成大量的图像信息处理和数学统计计算，另外还包括复杂的数学变换、演绎推理，使图像目标识别的过程速度相对较慢、技术复杂、识别准确率不高；由于特征信息取值组合与目标图像之间的关系，都需要大量的实验获得经验数据，或者通过专家系统技术来获得，每次遇到一个新的识别领域，就需要重新获取大量的经验数据，并建立一套特征信息取值组合与目标图像之间的关系，所以，通过现有识别方法构成的识别系统的通用性很差。

具有视觉能力的动物对图像信息都有快速分析、判断的能力，这种能力来源于形象思维。形象思维是通过感知表象信息，调用大脑中的形象知识(表象、意象、经验等)，通过分析、比较、归纳、想象等思维活动，完成对事物本质的认识。这一思维活动并没有经过复杂严密的逻辑推理过程，但却是简洁、快速、有效的。对于图像静态目标识别问题，形象思维的思维活动相对来说是很简单的。目前简化图像识别的主要问题，是如何模拟形象思维方法来完成识别过程。

发明内容

一方面，本发明的目的在于提供一种图像识别方法，以提高识别速度、识别准确度，且该图像识别方法的通用性较好。

为达到上述目的，本发明采用如下技术方案：该图像识别方法步骤如下：

(1)获取待识别图像的信息；

(2)在模板信息库中选择目标图像，并将选中目标图像的模板信息导入识别系统，所述模板信息至少包括目标图像中标识区域的信息、以及标识区域内标志像素的特征信息；

(3)根据标识区域的信息确定待识别图像中的待识别区域；

(4)在待识别区域中查找与标识区域中标志像素对应的像素；计算查找到的像素的特征信息与标识区域中标志像素的特征信息的最大相似度；

(5)判断所述最大相似度是否在误差范围内，若在误差范围内，则所述待识别图像与所述目标图像相匹配；否则所述待识别图像与所述目标图像不匹配。

上述技术方案所描述的图像识别方法，通过选择图像的局部，以模板方式记忆目标图像中标识区域内的形与像的特征信息，在确定待识别图像中与标识区域相对应的待识别区域后，计算待识别区域内的特征信息和标识区域内的特征信息的相似度，当相似度符合误差要求时，表示找到与待识别图像相匹配的目标图像，即实现了图像的识别。

由于上述方法中只需要比较标识区域内和待识别区域的特征信息，所需要的信息量比现有技术要少很多，并且所比较的特征信息是像素的特征信息，没有经过任何预处理，不需要大量的图像信息处理和数学统计计算，也没有复杂的数学变换、演绎推理，使图像识别的过程相对于现有识别技术而言较快，实现也较为简单。

由于上述图像识别方法中以模板方式记忆目标图像的形与像的特征信息，这些形与像的特征信息相当于动物大脑中的形象知识，所有的模板信息都是在识别之前就保存完成的，这样在识别过程中不需要对新的目标图像进行特征分析、识别策略分析等复杂工作；也不需要做大数据量的图像处理，通过对比这些特征信息来模拟动物大脑的形象思维以完成图像识别。所以本发明图像识别方法相对于现有的图像识别技术而言，其识别速度快，识别效率得到了提高。

由于上述图像识别方法中不需要获取大量的经验数据，只是提取像素的特征信息，对其中标志像素的特征信息进行比较，计算出相似度就可以完成识别过程。在遇到一个新的静态图像识别的问题时，可以采用本发明提供的技术方案，故而本发明图像识别方法具有较好的通用性。

另一方面，本发明的目的还在于提供一种图像识别系统，以提高识别速度和识别准确度，且该图像识别系统的通用性较好。

为达到上述目的，本发明采用如下技术方案：该图像识别系统包括：

图像输入模块，用于导入待识别图像的信息；

模板信息选择模块，用于在模板信息库选择目标图像，并读取模板信息库中目标图像的模板信息，所述模板信息包括目标图像中标识区域的信息、以及标识区域内标志像素的特征信息；

扫描模块，连接到图像输入模块和模板信息选择模块，依据标识区域的信息在待识别图像上确定待识别区域，在待识别区域中查找与标识区域中标志像素对应的像素；并计算查找到的像素的特征信息与标识区域中标志像素的特征信息的最大相似度；

判断模块，连接到扫描模块，依据计算出的最大相似度，输出所述待识别图像与所述目标图像相匹配；或者输出所述待识别图像与所述目标图像不匹配。

由上述技术方案所描述的图像识别系统，由图像输入模块导入待识别图像的信息，并通过对比待识别图像的待识别区域内特征信息与目标图像的标识区域内特征信息，当两者的相似度符合误差要求时，表示找到与待识别图像相匹配的目标图像，即实现了图像的识别。

由于上述图像识别系统在识别过程中，只需要比较标识区域内和待识别区域的特征信息，所需要的信息量比现有技术要少很多，并且所比较的特征信息是像素的特征信息，没有经过任何预处理，不需要大量的图像信息处理和数学统计计算，也没有复杂的数学变换、演绎推理，使图像识别相对于现有识别技术而言较快，实现也较为简单。

由于上述图像识别系统中以模板信息方式保存目标图像的形与像的特征信息，这些形与像的特征信息相当于动物大脑中的形象知识，并且在识别过程中不需要对新的目标图像进行特征分析、识别策略分析等复杂工作；也不需要做大数据量的图像处理，通过对比这些特征信息来模拟动物大脑的形象思维以完成图像识别。所以本发明图像识别系统相对于现有的图像识别技术而言，其识别速度快，识别效率得到了提高。

由于上述图像识别系统不需要获取大量的经验数据，只是提取像素的特征信息，对其中标志像素的特征信息进行比较，计算出相似度就可以完成识别过程。在遇到一个新的静态图像识别的问题时，可以采用本发明提供的技术方案，故而本发明图像识别系统具有较好的通用性。

附图说明

图1是本发明图像识别方法实施例的流程图；

图2是本发明图像识别方法实施例中精确识别的流程图；

图3是本发明图像识别系统实施例的结构图；

图4是本发明图像识别系统实施例的内部结构图；

图5是本发明图像识别方法在票据版面识别中应用的流程图；

图6是票据版面识别中第一目标票据图像标识示意图；

图7是票据版面识别中第二目标票据图像标识示意图；

图8是票据版面识别中第三目标票据图像标识示意图；

图9是票据版面识别中提取的特征信息的几何参数示意图。

具体实施方式

本发明图像识别方法及系统是一种模仿形象思维的模板式组合标识图像识别。在现有基于逻辑思维方式的图像识别技术中，需要提取完整的信息、经过严密的推理与计算、以及有序的处理过程，才能最后完成图像识别。而模仿形象思维方式的图像识别技术，完全基于图像中形与像的特征信息，所记忆的信息仅是表征其特征的很少一部分，并且对特征信息的处理是并行的，没有大量复杂的数学计算和逻辑推理，就可以完成图像识别。比较上述两种基于不同思维方式的图像识别技术，可知基于形象思维方式的图像识别具有特征信息量小，处理过程简约、高效的优势。

就目前对形象思维的认知程度，还不能完全模拟形象思维的高级思维活动来解决图像识别问题。但对于图像静态识别问题，分析形象思维的高级思维活动特点，模拟特征目标识别过程的主要特点及方法是可以实现的，这也是本发明的核心思想。

形象思维对图像的识别过程最主要的是：直接利用记忆的形与象的特征信息搜索匹配的目标图像，根据相似程度获得识别结果。这种方法有三个主要特点：第一、直接利用形与像的特征信息搜索匹配的目标图像，不对原始图像信息作各种预处理；第二、根据不同的识别目标集合及不同的识别准确率要求，调整参与图像识别的特征信息元素数量；第三、根据统一的相似程度指标判定识别结果。本发明图像识别方法及系统模拟这三个特点，实现了一种简洁、高效的图像识别方法，通过使用少量的特征信息，直接匹配目标图像使识别的速度大大提高；通过使用相似程度指标使该方法可应用于各种静态图像目标的识别，具有较好的通用性。

下面结合附图对本发明图像识别方法及系统进行详细描述。

如图1所示，为本发明图像识别方法的流程图，该过程包括目标图像的模板信息准备，以及后续的识别过程，其中步骤101至步骤103为目标图像的模板信息准备，其后为具体的识别过程。图1所示的具体过程如下：

101、调入作为识别目标的图像并将其转换为24位RGB图像，即获取图像的基本信息和特征信息，所述基本信息至少包含目标图像以像素为单位的宽度Bw、高度Bh和图像分辨率Bf；特征信息是指像素的坐标、亮度和颜色。用鼠标圈定该RGB图像的局部区域，并将该局部区域作为该目标图像的标识区域。

记录标识区域的信息主要包括：标识区域中心坐标偏移P_c(x，y)、标识区域参数Re_b(l，t，r，b)、搜索区域参数Re_s(l，t，r，b)。通过这些标识区域的信息可以准确定位标识区域，然后就可确定标识区域内的特征信息元素个数N_a和区别特征级级特征信息元素个数N_m。

其中，标识区域中心坐标偏移表示标识区域中心与它的基准坐标点的偏移量，为了能够更精确地进行图像识别，可以设置主要标识区域和辅助标识区域，其中主要标识区域的基准坐标点规定为图像左上角(0，0)坐标点；辅助标识区域的基准坐标点规定为主要标识区域的中心点。

当所选定的标识区域在实际图像中的位置不会变化时，该标识区域称为定位标识区域，当所选定的标识区域在实际图像中的位置会发生变化时，该标识区域称为非定位标识区域，本发明中通过表示区域的中心坐标偏移来区分定位标识和非定位标识，当中心坐标偏移P_c为(0，0)时，该标识区域为非定位标识，否则为定位标识。

一般情况下需要人工选择图像中的主要标识区域，对于定位标识，如果不进行人工选择标识区域，则自动生成默认的标识区域。根据目标图像的具体情况可选择或不选择若干个辅助标识区域，辅助标识区域固定为定位标识，其中心坐标偏移表示以主要标识区域的中心为参考点的坐标偏移。

标识区域参数Re_b、搜索区域参数Re_s与矩形参数定义相同，即：l(left)表示矩形区域左上角x坐标(中心点的左偏移)，t(top)表示矩形区域左上角y坐标(中心点的上偏移)，r(right)表示矩形区域右下角x坐标(中心点的右偏移)，b(bottom)表示矩形区域右下角y坐标(中心点的下偏移)，这样就构成一个向中心点四周偏移的矩形。

特征信息的元素以T_y(x，y，s，l)表示，其中x、y表示特征信息像素点以标识图像中心为原点的相对几何坐标；s表示特征信息像素点的颜色标记代码；l表示特征信息像素点的亮度标记代码。

通过上述的步骤101即可提取到目标图像标识区域内的特征信息，完成了对静态目标图像的特征描述。

102、利用上述目标图像的基本信息、标识区域的信息、以及标识区域内标志像素的特征信息构成描述目标图像的完整模板信息，然后为模板信息记录项添加名称和检索标识代码，并保存该模板信息记录项。所述基本信息至少包含目标图像以像素为单位的宽度Bw、高度Bh和图像分辨率Bf。本步骤完成了对静态目标图像的特征记忆。

103、将至少一个目标图像的模板信息构建成模板信息库。

104、在识别图像之前，首先在目标模板信息库中选择所需的目标模板信息，并将其导入图像识别系统。

105、调入待识别图像，并将其转换为RGB图像。

106、根据待识别图像的分辨率与目标模板基本信息分辨率，按下式计算各标识特征信息元素的几何坐标缩放比值F_k＝Df/Bf，其中Df是待识别图像的分辨率，Bf是目标图像的分辨率。

当待识别图像的中心坐标偏移P_c为(0，0)时，标识为非定位标识，否则为定位标识。对于非定位标识的识别问题直接转向步骤107。对于定位标识的识别问题，按如下公式顺序计算与各模板信息的相似指标Xj_w、Xj_h。

Xj_w＝(F_k*Bw-Dw)/Dw；Xj_h＝(F_k*Bh-Dh)/Dh；

其中，Bw、Bh分别是目标图像的宽度和高度；Dw、Dh分别是待识别图像的宽度和高度。设定一个判定指标R_a、R_b，R_a的取值范围为大于5％小于等于15％；R_b取值范围为大于-15％小于等于-5％；若R_b＜Xj_w＜R_a并且R_b＜Xj_h＜R_a，则待识别图像符合目标图像的外形尺寸，转向步骤107，否则重新选择一个目标图像，并执行步骤106，当待识别图像与所有的目标图像都不符合外形尺寸时，判定结束，并给出没有找到与待识别图像匹配的目标图像的识别结果。

107、利用模板信息中主要标识区域的搜索区域参数、标识区域的中心坐标偏移，在待识别图像中确定待识别区域，并计算主要标识区域内标志像素的特征信息和待识别区域内像素的特征信息的相似度，设定一个判定指标R_c，R_c的取值范围为大于90％小于等于100％。当找到的待识别区域中计算出的最大相似度满足Xs_sm＞R_c时，则粗略判定待识别图像与目标图像匹配，由于是粗略识别，所以在本步骤中只需要利用部分标志像素(即区别特征级的标志像素)的特征信息来计算相似度。

对于定位标识的识别问题，具体过程如下：

(1)设定粗略识别X、Y平面的默认搜索邻域R_d、R_e。R_d是对应200dpi分辨率的参数，R_d取值范围为大于50小于等于200。R_e是对应待识别图像分辨率的参数R_e＝R_d*(Df/200)。根据标识区域的信息中标识区域中心坐标偏移P_c、标识区域参数Re_b、搜索区域参数Re_s，计算搜索区域Re_zs。

如果Re_s是人工选择的，按下面公式计算搜索区域Re_zs：

Re_zs.l＝(P_c.x-(Re_b.l-Re_s.l))*F_k；Re_zs.r＝(P_c.x+(Re_s.r-Re_b.r))*F_k；

Re_zs.t＝(P_c.y-(Re_b.t-Re_s.t))*F_k；Re_zs.b＝(P_c.y+(Re_s.b-Re_b.b))*F_k；

如果Re_s是自动选择的，按下面公式计算搜索过程中心坐标的搜索区域Re_zs：

Re_zs.l＝P_c.x*F_k-R_e；Re_zs.r＝P_c.x*F_k+R_e；

Re_zs.t＝P_c.y*F_k-R_e；Re_zs.b＝P_c.y*F_k+R_e；

其中，Re_zs.l表示以搜索中心坐标为准向左的偏移量，Re_zs.r表示以搜索中心坐标为准向右的偏移量，Re_zs.t表示以搜索中心坐标为准向上的偏移量，Re_zs.b表示以搜索中心坐标为准向下的偏移量；搜索中心有标识区域的中心坐标偏移P_c确定。

设置粗略搜索过程X、Y方向的增量d_sx、d_sy。d_sx＝R_f*(Df/200)；d_sy＝R_f*(Df/200)。R_f是对应200dpi分辨率的参数，R_f取值范围为大于1小于等于6。

(2)由于是针对定位标识的图像识别，可以设定粗略识别最大搜索的偏斜角度取值范围为大于5小于等于20，记为alf_s。旋转角度的搜索范围是(-R_alf～R_alf)。设置搜索过程旋转角度的增量d_salf取值范围为大于1小于等于3。

(3)对区别特征级标志像素的特征信息，按照步骤(2)中的旋转角度以及旋转角度的步进量d_salf，按照旋转角度的增量变化待识别图像的偏斜角度，在待识别图像上按照步骤(1)中界定的搜索范围内，按照X、Y方向的增量d_sx、d_sy，搜索待识别区域，将待识别区域中的像素逐步与目标图像中的主要标识区域内的像素比较，计算出一个相似度Xs_s。当找到的待识别区域中计算出的最大相似度满足Xs_sm＞R_c时，返回最大相似度Xs_sm、当前映射的旋转角度alf_js和当前标识区域的搜索中心点坐标P_cs，并转向步骤108。如果所有偏斜角度都搜索完成之后还不能找到满足Xs_sm＞R_c的最大相似度，则返回步骤106。

对于非定位标识的识别问题，其具体过程如下：

1)将标识区域参数Re_s设置为待识别图像的整个区域。即：Re_s.l＝0；Re_s.t＝0；Re_s.r＝Dw；Re_s.b＝Dh；其中Dw表示待识别图像的宽度；Dh表示待识别图像的高度。按下面公式计算搜索区域Re_zs：

Re_zs.l＝Re_s.l+Cw*F_k/2；Re_zs.t＝Re_s.t+Ch*F_k/2；

Re_zs.r＝Re_s.r-Cw*F_k/2；Re_zs.b＝Re_s.b-Ch*F_k/2；

其中，Cw表示目标图像中标识区域的宽度；Ch表示目标图像中标识区域的高度。搜索过程X、Y方向的增量与定位标识粗略搜索过程X、Y方向的增量相同，即：d_sx＝R_f*(Df/200)；d_sy＝R_f*(Df/200)。R_f是对应200dpi分辨率的参数，R_f取值范围为大于1小于等于6。

2)对于非定位标识的图像识别，可以设定粗略识别最大搜索的偏斜角度R_alf取值范围为180度，记为alf_s。旋转角度的搜索范围(-R_alf～R_alf)，设置搜索过程旋转角度的增量d_salf取值范围为大于1小于等于3。

3)对区别特征级标志像素的特征信息，按照步骤(2)中的旋转角度以及旋转角度的步进量d_salf，按照旋转角度的增量变化待识别图像的偏斜角度，并在偏斜后的待识别图像中，按照步骤(1)中界定的搜索范围内，沿X、Y方向的增量d_sx、d_sy，搜索待识别区域，并将待识别区域内的像素逐步与目标图像中主要标志区域内的像素比较，计算出一个相似度Xs_s。当找到的待识别区域中计算出的最大相似度满足Xs_sm＞R_c时，返回最大相似度Xs_sm、当前映射的旋转角度alf_js和当前标识区域的搜索中心点坐标P_cs，并转向步骤108。如果所有偏斜角度都搜索完成之后还不能找到满足Xs_sm＞R_c的最大相似度，则返回步骤106。

通过上述步骤106和107即可完成对图像的粗选匹配。

108、对通过粗选匹配的目标图像进行进一步的精确识别，精确识别也需要计算特征信息的相似程度指标，返回最大相似程度指标Xs_sm。设定一个判定指标R_c，R_c的取值范围为大于90％小于等于100％。如果最大相似程度指标Xs_sm＞R_c，则判定待识别图像与目标图像匹配；否则判定待识别图像与目标图像不匹配。

该精确识别的具体流程如图2所示：

S1、设定精确识别中X、Y平面的搜索邻域R_g、R_h。R_g是对应200dpi分辨率的参数，R_g取值范围为大于5小于等于20。R_h是对应待识别图像分辨率的参数，R_h＝R_g*(Df/200)。根据粗略识别过程返回的旋转角度alf_js和搜索中心点坐标P_cs，按下面公式确定精确搜索过程中心坐标的搜索区域Re_zjs。

Re_zjs.l＝P_cs.x-R_h；Re_zjs.r＝P_cs.x+R_h；

Re_zjs.t＝P_cs.y-R_h；Re_zjs.b＝P_cs.y+R_h；

当前映射的旋转角度采用粗略识别过程返回的旋转角度alf_js，还需要设置搜索过程X、Y方向的增量d_sjx＝1；d_sjy＝1，设定精确识别最大搜索的偏斜角度R_alfj，R_alfj取值范围为大于0小于等于5。旋转角度的搜索范围是(alf_js-R_alfj～alf_js+R_alfj)。设置搜索过程旋转角度的增量d_sjalf＝1。

S2、对所有标志像素的特征信息，在上述旋转角度的变换范围内，按照旋转角度的增量变化待识别图像的偏转角度，然后按照X、Y方向的增量，搜索待识别区域，并将待识别区域内的像素逐个与主要标识区域内的像素比较，并计算出相似度Xs_js。当找到的待识别区域中计算出的最大相似度满足Xs_sm＞R_c时，返回最大相似度Xs_jsm、当前映射的旋转角度alf_jzs和当前标识图像的搜索中心点坐标P_cs；并执行步骤S3。如果不能找到满足Xs_jsm＞R_c的最大相似度，则输出所述待识别图像与当前的目标图像不匹配，并返回执行步骤107(返回后，按照步骤107中返回当前映射的旋转角度和当前标识区域的搜索中心点坐标，继续进行搜索)，直到系统中的所有模板信息全都被匹配比较完成。

S3、判断目标图像是否设定有辅助标识区域，若设定有辅助标识区域，则执行步骤S4；否则输出所述待识别图像与当前的目标图像相匹配。

S4、根据精确识别过程返回主要标识的旋转角度alf_jzs和搜索中心点坐标P_cs，按下面公式确定辅助标识搜索过程中心坐标P_cfs和搜索区域Re_fjs，并设置搜索过程X、Y方向的增量d_sjx＝1；d_sjy＝1。

P_cfs.x＝P_cs.x+(P_cf.x*cos(alf_jzs)+P_cf.y*sin(alf_jzs))*F_k；

P_cfs.y＝P_cs.y+(P_cf.x*sin(alf_jzs)+P_cf.y*cos(alf_jzs))*F_k；

Re_fjs.l＝P_cfs.x-R_h；Re_fjs.r＝P_cfs.x+R_h；

Re_fjs.t＝P_cfs.y-R_h；Re_fjs.b＝P_cfs.y+R_h；

其中P_cf是辅助标识区域相对于主要标识中心坐标的偏移。

按下面公式对辅助标识的N_f个特征信息元素作初始旋转映射变换：

T_yi.x＝((T_fi.x+P_cf.x)*cos(alf_jzs)+(T_fi.y+P_cf.y)*sin(alf_jzs))*F_k-P_cfs.x；

T_yi.y＝((T_fi.x+P_cf.x)*sin(alf_jzs)+(T_fi.y+P_cf.y)*cos(alf_jzs))*F_k-P_cfs.y；

其中，T_yi是第i个辅助标识特征信息元素T_fi作初始旋转映射变换后的元素。经变换后，旋转映射变换的初始旋转角度alf_js＝0，最大搜索的偏斜角度与精确识别最大搜索的偏斜角度相同，R_alfj取值范围为大于0小于等于5，旋转角度的搜索范围是(-R_alfj～R_alfj)，并设置搜索过程旋转角度的增量d_sjalf＝1。

S5、对辅助标识区域中全部标志像素的特征信息，按照S2中同样的方法计算相似度，并获取最大相似度Xs_jsm。

当最大相似度Xs_jsm＞R_c时，返回最大相似程度指标Xs_jsm、当前映射的旋转角度alf_jfs和当前标识图像的搜索中心点坐标P_cfs，并输出所述待识别图像与当前的目标图像相匹配；当没有找到满足Xs_jam＞R_c的最大相似度时，则输出所述待识别图像与当前的目标图像不匹配，并返回执行步骤106，直到系统中的所有模板信息全都被匹配比较完成。

上述技术方案所描述的图像识别方法，通过选择图像的局部，以模板方式记忆目标图像中标识区域内的形与像的特征信息，在查找到待识别图像中与标识区域相对应的待识别区域后，计算待识别区域内的特征信息和标识区域内的特征信息的相似度，当相似度符合误差要求时，表示找到与待识别图像相匹配的目标图像，即实现了图像的识别。

由于上述方法中采用了主要标识区域和辅助标识区域，通过辅助标识区域内的识别过程可以更进一步地提高识别的准确性。

对应于上述方法构建一个图像识别系统，如图3所示，为本发明图像识别系统的原理图，该系统至少包含目标图像模板信息生成工具、目标图像模板信息库和目标图像识别系统三部分，其中模板信息生成工具负责前期目标图像的模板信息准备，目标图像模板信息库中保存了已准备好的模板信息，目标图像识别系统主要负责图像的识别。

该图像识别系统包括图像输入模块、模板信息选择模块、扫描模块、判断模块和外形扫描模块，其中各个模块的连接关系和实现的功能如下：

如图4所示，图像输入模块，用于导入待识别图像的信息，主要读取图像的RGB信息。

模板信息选择模块，用于在模板信息库选择目标图像，并读取模板信息库中目标图像的模板信息，可以根据需要选择不同的模版信息库，所述模板信息包括目标图像的基本信息、标识区域的信息、以及标识区域内标志像素的特征信息。扫描模块，连接到图像输入模块和模板信息选择模块，依据标识区域的信息在待识别图像上确定待识别区域，待识别区域的查找过程和上述图像识别方法中完全相同，并且查找后需要按照旋转角度来计算待识别区域内特征信息与标识区域内特征信息的相似度，返回其中最大相似度。判断模块，连接到扫描模块，依据计算出的相似度，输出所述待识别图像与所述目标图像相匹配；或者输出所述待识别图像与所述目标图像不匹配。

上述判断模块的具体工作过程如下：在存储器中事先保存了特征信息的相似度判定指标；当扫描模块输出最大相似度时，将该最大相似度与相似度判定指标比较，若计算出的最大相似度大于相似度判定指标，则输出目标图像与待识别图像匹配；否则输出目标图像与待识别图像不匹配。

上述的标识区域具有如下特点：

1、人为选定的具有明显视觉效果，反映目标图像特征的局部图像。

2、分为主要标识区域和辅助标识区域。主要标识只有一个，辅助标识可以有多个。辅助标识与主要标识的几何位置关系是固定不变的。主要标识用于区别目标之间的明显差别，多个辅助标识逐级精确区分目标之间的细微差别。

3、分为定位标识和非定位标识，定位标识是指标识区域在图像的指定区域内；非定位标识是指不能确定标识在图像中的位置。

对于采用定位标识进行图像识别的情况，在确定待识别区域之前，先要粗略判断该图像在大小上是否相似，为了选择外形相符的目标图像，本发明图像识别系统还包括外形扫描模块，连接到模板信息选择模块、图像输入模块和扫描模块，对选择的目标图像进行外形尺寸的比较，用于查找与待识别图像外形尺寸相符的目标图像，并将所述目标图像的特征信息传送到扫描模块。这样所有进入扫描模块进行识别的目标图像都是在尺寸上符合要求的，不必要对尺寸不符合的目标图像进行识别，加快了图像识别的过程。

用户通过图像输入模块输入待识别图像后，再通过模板信息选择模块将目标图像的信息选择，通过外形扫描模块过滤掉外形尺寸不相符的目标图像，然后通过扫描模块将外形尺寸相符的目标图像和待识别图像进行图像识别。扫描模块找到待识别区域后，在待识别区域内进行特征信息的比较，计算出相似度，最后由判断模块利用相似度得出匹配结果。在整个识别过程中只需要比较待识别区域内的特征信息，所比较的信息相对于现有识别技术要少，并且不需要对特征信息进行逻辑运算，加快了识别过程。

下面介绍一个采用本发明的票据版面的图像识别过程，票据版面识别是票据自动处理首先要解决的关键问题。各行各业的票据种类不计其数，新的票据不断地出现，可用于识别的票面信息千变万化。构建能适应这种变化的票据版面识别系统是实现票据自动处理的基础。

本发明所述的方法非常有效的解决这一票面信息千变万化票据版面识别问题。为票据版面识别提供了一种通用的、快速记忆、识别方法。按照本发明所述的方法构建的票据版面识别系统与图3所示是一致的。只需根据票据版面识别的要求对界面做相应的改动。包括三部分：一、描述票据图像特征的模板信息生成的工具软件；二、记忆票据图像特征的模板信息库；三、实现票据版面识别的图像静态目标识别系统。按照本发明所述的方法实现票据版面识别的流程如图4所示，这一流程又分为两大部分。第一部分是识别前的准备工作，包括票据图像特征的描述、记忆，识别目标的选择，识别目标集特征信息的优化。第二部分是在线的识别过程。本发明这种通过模板与标识组合，模拟形象思维对图像信息进行记忆与识别的方法以及上述的流程设计，使得本发明的实施例具有如下优点：

通过简单人工参与，选择标识区域，实现票据图像特征描述与记忆。

通过简单人工参与，选择目标票据模板信息，实现有限票据类型识别系统的快速构成。

按照本发明的方法，不对待识别图像进行预处理，直接利用少量特征信息，通过搜索与匹配，实现图像的快速准确识别。

如图5所示：包括目标图像的模板信息准备过程，本发明图像识别方法用于票据版面的识别通过以下步骤实现：

401、在模板工具软件中，按先后顺序打开三个目标票据图像。前两个目标票据图像如图6、图7所示，票面图像信息基本是一样的。其差别是：目标票据图像1标有“(壹)”字样；目标票据图像2标有“(贰)”字样；第三个目标票据图像与前两个具有不同图像特征的，如图8所示。

402、按先后顺序分别为三个目标票据图像选择作为主要标识区域的局部图像，并提取该主要标识区域内标志像素的特征信息，其选择标识类型为定位标识。特征信息的几何参数示意如图9所示。白点表示标识图像信息点；深色点表示背景信息点；将主要标识的信息加入到模板中。

根据本发明方法，本实施例中分别选择图6中的A1、图7中的A2和图8中的A3三个区域的局部图像，作为三个目标票据图像的主要标识区域。

403、按先后顺序分别为前两个目标票据图像选择作为辅助标识区域的局部图像，并提取该辅助标识区域内标志像素的特征信息，其选择标识类型为定位标识。计算以主要标识中心坐标为参考点的辅助标识中心坐标偏移，同时将辅助标识的信息加入到模板中。

图5中的B1和图7中的B2两个区域的局部图像作为目标票据图像1、目标票据图像2的辅助标识区域。

404、将目标图像的基本信息、主要标识区域的信息、以及主要标识区域内的提取出的特征信息加入模板，构成描述目标图像特征的完整模板信息，当设定了辅助标识区域时，还需要将辅助标识区域信息以及其内特取出的特征信息加入模板。其中，基本信息设置如下：对目标票据图像1设置Bw＝1365；Bh＝645；Bf＝200；对目标票据图像2设置Bw＝1368；Bh＝643；Bf＝200；对目标票据图像3设置Bw＝1840；Bh＝920；Bf＝200。

405、为模板信息记录项添加票据图像得名称和检索标识代码，并将该模板记录项保存于模板信息库。

在本实施例中，对目标票据图像1添加票据图像名称为“方正奥德业务档案综合管理系统转账支票测试样张(壹)”和检索标识代码为011001。对目标票据图像2添加票据图像目标名称为“方正奥德业务档案综合管理系统转账支票测试样张(贰)”和检索标识代码为011002。对目标票据图像3添加票据图像目标名称为“中国工商银行转账支票(京)”和检索标识代码为011101。

406、根据目标图像出现的频率高低，从模板信息库中为票据版面识别系统选择所需的目标模板。在票据类型目标识别系统，通过检索，显示相关业务票据模板信息的列表。点击票据模板记录项，可观察对应的目标票据图像和所选择标识图像。在本实施例中，为本系统选择此前录入的3个目标票据图像的模板信息，并将其导入票据版面识别系统。

以上步骤就完成了对目标图像的准备工作。

407、将一个待识别票据图像转换为RGB的24位图像并加载。

408、根据当前待识别票据图像的分辨率Df与目标模板基本信息分辨率Bf，计算各标识票据图像和目标票据图像的缩放比值F_k＝Df/Bf。

例如当前待识别图像分辨率＝300dpi；目标模板基本信息分辨率＝200dpi，F_k＝300/200＝1.5。

409、本实施例为定位标识的识别问题，按如下公式顺序计算与各模板基本信息的相似指标Xj_w、Xj_h：

Xj_w＝(F_k*Bw-Dw)/Dw；Xj_h＝(F_k*Bh-Dh)/Dh；

其中Bw、Bh分别是目标票据图像模板信息中的宽度和高度；Dw、Dh分别是待识别图像的宽度和高度。设定判定指标R_a＝10％、R_b＝-10％。如果R_b＜Xj_w＜R_a并且R_b＜Xj_h＜R_a判定该图像符合该目标的外形尺寸，转向步骤411，否则重新选择一个目标图像，并执行步骤410，当待识别图像与所有的目标图像都不符合外形尺寸时，判定结束，并给出没有找到与待识别图像匹配的目标图像的识别结果。

在本实施例中的外形尺寸都能够相符。

410、调用该模板主要标识区域内的标志像素信息，在定位区域内进行粗略识别的定位标识特征信息的搜索与匹配，

本实施例中粗略识别中计算相似度的过程具体如下：

(1)设定粗略识别X、Y平面的默认搜索邻域R_d＝100。

R_e＝R_d*(Df/200)＝100*(300/200)＝150。

根据主要标识区域的信息中，主要标识区域中心坐标偏移P_c、标识区域参数Re_b、搜索区域参数Re_s计算搜索区域，由于Re_s是人工选择的，按下面公式计算搜索过程中心坐标的搜索区域Re_zs：

设定R_f＝2；那么粗略搜索过程X、Y方向的增量如下：

d_sx＝R_f*(Df/200)＝2*(300/200)＝3；d_sy＝d_sx。

(2)对定位标识的待识别票据图像，设定粗略识别最大搜索的偏斜角度R_alf＝15，偏斜角度记为alf_s。旋转角度的搜索范围是(-15～15)。设置搜索过程旋转角度的增量d_salf＝2。

(3)并在待识别图像内按X、Y方向的增量，确定待识别区域；在偏斜角度变化一个增量d_salf＝2时，将标识区域中的标志像素的坐标按照偏斜角度旋转，然后将待识别区域内的像素逐个和变换后的区分级标志像素比较，计算特征信息相似度Xs_s。当找到的待识别区域中计算出的最大相似度满足Xs_sm＞R_c时，返回最大相似度Xs_sm、当前映射的旋转角度alf_js和当前搜索中心点坐标P_cs，并执行步骤411，如果按照所有偏斜角度将待识别图像搜索完成后，还没找到满足Xs_sm＞R_c的相似度，则输出目标图像与待识别图像不匹配，并返回执行步骤409。

411、设定精确识别X、Y平面的搜索邻域R_g、R_h。R_g＝10，R_h＝R_g*(Df/200)＝R_g*(300/200)＝15。根据粗略识别过程返回的旋转角度alf_js和搜索中心点坐标P_cs，按下面公式确定精确搜索过程中心坐标的搜索区域Re_zjs。

Re_zjs.l＝P_cs.x-R_h；Re_zjs.r＝P_cs.x+R_h；

Re_zjs.t＝P_cs.y-R_h；Re_zjs.b＝P_cs.y+R_h；

由于需要进行精确识别，设置搜索过程X、Y方向的增量和旋转角度的增量要比较小，一般设定d_sjx＝1；d_sjy＝1。当前映射的旋转角度是alf_js，设定精确识别最大搜索的偏斜角度R_alfj＝5，旋转角度的搜索范围是(alf_js-R_alfj～alf_js+R_alfj)，设置搜索过程旋转角度的增量d_sjalf＝1。

偏斜角度按照旋转角度的增量d_sjalf＝1变化，将标识区域中的标志像素的坐标按照偏斜角度进行旋转变换，在待识别图像的待识别区域内按X、Y方向的增量d_sjx＝1；d_sjy＝1，并计算待识别区域中特征信息和所有变换后的标志像素的特征信息的相似度Xs_js，当找到最大相似度满足Xs_jsm＞R_c时，退出搜索匹配过程，返回最大相似程度指标Xs_jsm、当前映射的旋转角度alf_jzs和当前搜索中心点坐标P_cs。当没有找到满足Xs_jsm＞R_c的最大相似度，并返回执行步骤410(按照410中返回的当前映射的旋转角度和当前搜索中心点坐标，继续搜索)，直到系统中的所有模板信息全都被匹配比较完成。

判断目标图像是否设定有辅助标识区域，若没有辅助标识区域，则输出所述待识别图像与当前的目标图像相匹配。若设定有辅助标识区域，根据精确识别过程返回主要标识的旋转角度alf_jzs和搜索中心点坐标P_cs，按下面公式确定辅助标识区域搜索过程中心坐标P_cfs和搜索区域Re_fjs。

P_cfs.x＝P_cs.x+(P_cf.x*cos(alf_jzs)+P_cf.y*sin(alf_jzs))*F_k；

P_cfs.y＝P_cs.y+(P_cf.x*sin(alf_jzs)+P_cf.y*cos(alf_jzs))*F_k；

Re_fjs.l＝P_cfs.x-R_h；Re_fjs.r＝P_cfs.x+R_h；

Re_fjs.t＝P_cfs.y-R_h；Re_fjs.b＝P_cfs.y+R_h；

其中P_cf是辅助标识与主要标识中心坐标的偏移。设置搜索过程X、Y方向的增量d_sjx＝1；d_sjy＝1。

其中T_yi是第i个辅助标识区域内的特征信息元素T_fi作初始旋转映射变换后的元素。经变换后，设置旋转映射变换的初始旋转角度alf_is＝0。最大搜索的偏斜角度R_alfj＝2，旋转角度的搜索范围是(-R_alfj～R_alfj)，设置搜索过程旋转角度的增量d_sialf＝1。

对辅助标识区域中所有标志像素的特征信息，当偏斜角度变化一个旋转角度的增量d_sjalf＝1时，将辅助标识区域中的标志像素的坐标按照偏斜角度进行旋转变换，并计算变换后的标志像素的特征信息和搜索区域内像素的相似度Xs_js。如果如果找到最大相似度Xs_jsm＞R_c，返回最大相似程度指标Xs_jsm、当前映射的旋转角度alf_jfs和当前搜索中心点坐标P_cfs，并输出所述待识别图像与当前的目标图像相匹配；如果没有找到满足Xs_jsm＞R_c的最大相似度，则输出所述待识别图像与当前的目标图像不匹配，并返回执行步骤408，直到系统中的所有模板信息全都被匹配比较完成。

上述粗略识别和精确识别过程都需要通过映射变换并计算相似度，该过程具体包括如下步骤：

①按下面公式，对N₀个特征信息元素作旋转映射变换。

T_yti.x＝T_yi.x*cos(alf₀)+T_yi.y*sin(alf₀)；

T_yti.y＝T_yi.x*sin(alf₀)+T_yi.y*cos(alf₀)；

其中N₀是特征信息中参与搜索匹配的特征信息元素个数，alf₀是三维搜索空间中一个离散点的旋转角度。T_yti是第i个特征信息元素T_yi作旋转映射变换后的元素。

②每作一次旋转映射变换后，在三维搜索空间的X、Y平面，顺序作平移的映射变换。

对于主要标识按下面公式计算：

T_yyi.x＝T_yti.x*F_k+M_x0；T_yyi.y＝T_yti.y*F_k+M_y0；

对于辅助标识按下面公式计算：

T_yyi.x＝T_yti.x+M_x0；T_yyi.y＝T_yti.y+M_y0；

其中M_x0、M_y0是三维搜索空间中旋转角度，等于alf₀的平面上一个离散点的X和Y的坐标。T_yyi是第i个特征信息元素T_yi作旋转、平移映射变换后的元素。①、②两步骤并不改变特征信息元素的光学参数。

③设定亮度偏差指标R_m。R_m取值范围为大于5％小于等于20％。对第i个变换后的特征信息元素，根据其几何坐标参数，直接提取待识别图像中对应像素的光学参数D_si(第i个像素点的颜色值)、D_li(第i个像素点的亮度值)，如果T_yyi.s(第i个特征信息元素的颜色值)等于D_si并且(T_yyi.1-D_li)/255的绝对值小于R_m，判定该特征信息元素相似，否则判定该特征信息元素不相似。设相似特征信息元素计数变量N_x记录判定特征信息元素相似的个数。对N₀个特征信息元素判定相似性，相似程度指标Xs_s按下面公式求取Xs_s＝N_x/N₀。

按上述的流程步骤，通过粗略快速搜索和精确细致匹配实现对票据类型的快速准确识别。

本发明主要用于寻找相匹配的图像，例如：票据识别、印章识别等。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应该以权利要求的保护范围为准。

Claims

1.一种图像识别方法，包括：

(1)获取待识别图像的信息；

其特征在于还包括以下步骤：

(3)根据标识区域的信息确定待识别图像中的待识别区域；

2.根据权利要求1所述的图像识别方法，其特征在于，所述目标图像的模板信息按如下步骤提取：

获取目标图像的宽度、高度和分辨率；

输入标识区域的信息；

根据标识区域的信息在所述目标图像中确定标识区域；

获取所述标识区域内标志像素的特征信息，所述特征信息包括该像素的坐标、亮度和颜色；

将图像的宽度、高度和分辨率，标识区域的信息，以及标识区域内标志像素的特征信息保存为模板信息，并为所述模板信息添加名称和检索码。

3.根据权利要求1所述的图像识别方法，其特征在于，所述标识区域的信息包括主要标识区域的信息和/或辅助标识区域的信息。

4.根据权利要求3所述的图像识别方法，其特征在于，

所述主要标识区域的信息至少包括主要标识区域参数、中心偏移坐标和搜索区域参数，根据所述主要标识区域参数和中心偏移坐标在目标图像中确定主要标识区域，根据所述主要标识区域参数、中心偏移坐标和搜索区域参数在待识别图像中确定搜索区域，从而在所述搜索区域内搜索待识别区域，在待识别区域中查找与所述主要标识区域中标志像素对应的像素；

所述辅助标识区域的信息至少包括辅助标识区域相对于主要标识区域的中心偏移坐标，以及辅助标识区域参数、搜索区域参数，根据所述辅助标识区域相对于主要标识区域的中心偏移坐标和辅助标识区域参数在目标图像中确定辅助标识区域，根据所述辅助标识区域相对于主要标识区域的中心偏移坐标、辅助标识区域参数和搜索区域参数在待识别图像中确定搜索区域，从而在所述搜索区域内搜索待识别区域，在待识别区域中查找与所述辅助标识区域中标志像素对应的像素。

5.根据权利要求1所述的图像识别方法，其特征在于，所述待识别图像的信息包括待识别图像的分辨率，所述目标图像的模板信息包括目标图像的分辨率；所述步骤(2)之后还包括如下步骤：

按如下公式计算待识别图像和目标图像的缩放比值：Fk＝Df/Bf，其中，Df为待识别图像的分辨率，Bf为目标图像的分辨率，以在步骤(3)中使用所述Fk确定待识别图像中的待识别区域。

6.根据权利要求1所述的图像识别方法，其特征在于，所述待识别图像的信息包括待识别图像的宽度和高度，所述目标图像的模板信息包括目标图像的宽度和高度；若所述标识区域为在图像中位置不会变化的定位标识区域，则所述步骤(2)之后还包括：查找与待识别图像外形尺寸相符的目标图像，具体方法如下：

计算待识别图像和目标图像的相似指标，公式为：

Xj_w＝(F_k*Bw-Dw)/Dw，Xj_h＝(F_k*Bh-Dh)/Dh，

其中，Bw为目标图像的宽度，Bh为目标图像的高度，Dw为待识别图像的宽度，Dh为待识别图像的高度，F_k为几何坐标缩放比值；所述F_k的计算方法为：F_k＝Df/Bf，其中Df是待识别图像的分辨率，Bf是目标图像的分辨率；

判断Xj_w和Xj_h是否在误差范围内，如果在误差范围内，则该目标图像的外形尺寸与待识别图像的外形尺寸相符，执行步骤(3)；

否则该目标图像的外形尺寸与待识别图像的外形尺寸不相符，重新选择一个目标图像，返回至所述计算待识别图像和目标图像的相似指标的步骤，当待识别图像与所有的目标图像都不符合外形尺寸时，判定结束，并给出没有找到与待识别图像匹配的目标图像的识别结果。

7.根据权利要求1所述的图像识别方法，其特征在于所述步骤(4)具体包括：

设定偏转角度范围和偏转角度的增量；

在偏转角度范围内，按照偏转角度的增量确定偏转角度；

将目标图像中标识区域内的标志像素坐标按照偏转角度进行变换；

在待识别区域中查找与变换后的标志像素相对应的像素；

计算查找到的像素的特征信息与标识区域中标志像素的特征信息的最大相似度。

8.一种图像识别系统，包括：

图像输入模块，用于获取待识别图像的信息；

其特征在于还包括：

模板信息选择模块，用于在模板信息库选择目标图像，并将选中目标图像的模板信息导入识别系统，所述模板信息至少包括目标图像中标识区域的信息、以及标识区域内标志像素的特征信息；

扫描模块，连接到图像输入模块和模板信息选择模块，根据标识区域的信息确定待识别图像中的待识别区域；

计算模块，用于在待识别区域中查找与标识区域中标志像素对应的像素，计算查找到的像素的特征信息与标识区域中标志像素的特征信息的最大相似度；

判断模块，连接到计算模块，判断所述最大相似度是否在误差范围内，若在误差范围内，则所述待识别图像与所述目标图像相匹配；否则所述待识别图像与所述目标图像不匹配。

9.根据权利要求8所述的图像识别系统，其特征在于，所述判断模块包括：

存储器，用于保存目标图像与待识别图像匹配的相似度判定指标；

比较器，连接到计算模块和存储器，用于比较计算出的最大相似度与存储器中的相似度判定指标，若计算出的最大相似度大于相似度判定指标，则输出所述待识别图像与所述目标图像匹配；否则输出所述待识别图像与所述目标图像不匹配。

10.根据权利要求8所述的图像识别系统，其特征在于还包括：

外形扫描模块，连接到模板信息选择模块、图像输入模块和扫描模块，用于查找与待识别图像外形尺寸相符的目标图像，并将所述目标图像的模板信息传送到扫描模块和计算模块。