CN101464951B - 图像识别方法及系统 - Google Patents

图像识别方法及系统 Download PDF

Info

Publication number
CN101464951B
CN101464951B CN2007103019508A CN200710301950A CN101464951B CN 101464951 B CN101464951 B CN 101464951B CN 2007103019508 A CN2007103019508 A CN 2007103019508A CN 200710301950 A CN200710301950 A CN 200710301950A CN 101464951 B CN101464951 B CN 101464951B
Authority
CN
China
Prior art keywords
image
identified
information
target image
zone
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2007103019508A
Other languages
English (en)
Other versions
CN101464951A (zh
Inventor
曾培祥
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
New Founder Holdings Development Co ltd
Founder International Beijing Co Ltd
Original Assignee
Founder International Beijing Co Ltd
Peking University Founder Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Founder International Beijing Co Ltd, Peking University Founder Group Co Ltd filed Critical Founder International Beijing Co Ltd
Priority to CN2007103019508A priority Critical patent/CN101464951B/zh
Publication of CN101464951A publication Critical patent/CN101464951A/zh
Application granted granted Critical
Publication of CN101464951B publication Critical patent/CN101464951B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

本发明公开了一种图像识别方法及系统,涉及采用模式识别技术对静态的目标图像进行识别的方法及系统。解决了现有图像识别技术中速度相对较慢问题。该图像识别方法及系统将图像的标识区域信息和标识区域内的特征信息保存为模板信息,然后利用标识区域确定待识别图像中的待识别区域,然后比较标识区域和待识别区域内的特征信息,当两者的相似度在误差范围时,认为待识别图像和目标图像相匹配,实现图像识别,在识别过程中,只需要比较待识别区域的特征信息,数据量较少,并且不需要对特征信息进行逻辑推理和数学运算,从而加快了图像识别速度。本发明主要用于寻找相匹配的图像,例如:票据识别、印章识别等。

Description

图像识别方法及系统
技术领域
本发明涉及图像识别的技术领域,特别涉及采用模式识别技术对静态的目标图像进行识别的方法及系统。
背景技术
图像识别作为办公自动化中一个高端技术,正随着模式识别技术的发展而不断发展,并被积极推广应用。例如:部分机场采用指纹识别技术进行身份确认。模式识别是一种从大量信息和数据出发,在专家经验和已有认识的基础上,利用计算机和数学推理的方法对形状、模式、曲线、数字、字符格式和图形自动完成识别的过程。模式识别包括相互关联的两个阶段,即学习阶段和实现阶段;学习阶段是对样本进行特征选择,寻找分类的规律;实现阶段是根据分类规律对未知样本集进行分类和识别。
在模式识别技术的目标图像的识别问题中,目标搜索、特征信息提取、逻辑判别是三个主要技术环节。目标图像的识别技术需要通过对图像信息的多重数据处理,获得目标图像的边界信息,通过边界信息和其它图像信息提取或计算得到目标图像的特征信息,然后对特征信息进行逻辑判断,以获得目标图像的识别结果。
上述特征信息的提取目前尚无通用的提取方法,只能通过分析具体识别对象来决定选取何种特征信息,然后针对选择特征信息的特点来设计提取方法,不具有通用性。目前所选择的特征信息除了图像的形象信息外,其他特征信息都包含基于逻辑思维的,或者需要经过图像信息处理、数学变换、演绎推理、统计计算才能得到的特征信息。现有技术中逻辑判断是通过获得的多个特征信息不同取值的组合来判断,以获得目标图像的识别结果。在很多场合,这种特征信息取值组合与目标图像之间的关系,都需要大量的实验获得经验数据,或者通过专家系统技术来获得,经验数据是保证逻辑判断准确因数之一。
在上述目标图像的识别技术中,图像特征信息提取和目标识别过程要完成大量的图像信息处理和数学统计计算,另外还包括复杂的数学变换、演绎推理,使图像目标识别的过程速度相对较慢、技术复杂、识别准确率不高;由于特征信息取值组合与目标图像之间的关系,都需要大量的实验获得经验数据,或者通过专家系统技术来获得,每次遇到一个新的识别领域,就需要重新获取大量的经验数据,并建立一套特征信息取值组合与目标图像之间的关系,所以,通过现有识别方法构成的识别系统的通用性很差。
具有视觉能力的动物对图像信息都有快速分析、判断的能力,这种能力来源于形象思维。形象思维是通过感知表象信息,调用大脑中的形象知识(表象、意象、经验等),通过分析、比较、归纳、想象等思维活动,完成对事物本质的认识。这一思维活动并没有经过复杂严密的逻辑推理过程,但却是简洁、快速、有效的。对于图像静态目标识别问题,形象思维的思维活动相对来说是很简单的。目前简化图像识别的主要问题,是如何模拟形象思维方法来完成识别过程。
发明内容
一方面,本发明的目的在于提供一种图像识别方法,以提高识别速度、识别准确度,且该图像识别方法的通用性较好。
为达到上述目的,本发明采用如下技术方案:该图像识别方法步骤如下:
(1)获取待识别图像的信息;
(2)在模板信息库中选择目标图像,并将选中目标图像的模板信息导入识别系统,所述模板信息至少包括目标图像中标识区域的信息、以及标识区域内标志像素的特征信息;
(3)根据标识区域的信息确定待识别图像中的待识别区域;
(4)在待识别区域中查找与标识区域中标志像素对应的像素;计算查找到的像素的特征信息与标识区域中标志像素的特征信息的最大相似度;
(5)判断所述最大相似度是否在误差范围内,若在误差范围内,则所述待识别图像与所述目标图像相匹配;否则所述待识别图像与所述目标图像不匹配。
上述技术方案所描述的图像识别方法,通过选择图像的局部,以模板方式记忆目标图像中标识区域内的形与像的特征信息,在确定待识别图像中与标识区域相对应的待识别区域后,计算待识别区域内的特征信息和标识区域内的特征信息的相似度,当相似度符合误差要求时,表示找到与待识别图像相匹配的目标图像,即实现了图像的识别。
由于上述方法中只需要比较标识区域内和待识别区域的特征信息,所需要的信息量比现有技术要少很多,并且所比较的特征信息是像素的特征信息,没有经过任何预处理,不需要大量的图像信息处理和数学统计计算,也没有复杂的数学变换、演绎推理,使图像识别的过程相对于现有识别技术而言较快,实现也较为简单。
由于上述图像识别方法中以模板方式记忆目标图像的形与像的特征信息,这些形与像的特征信息相当于动物大脑中的形象知识,所有的模板信息都是在识别之前就保存完成的,这样在识别过程中不需要对新的目标图像进行特征分析、识别策略分析等复杂工作;也不需要做大数据量的图像处理,通过对比这些特征信息来模拟动物大脑的形象思维以完成图像识别。所以本发明图像识别方法相对于现有的图像识别技术而言,其识别速度快,识别效率得到了提高。
由于上述图像识别方法中不需要获取大量的经验数据,只是提取像素的特征信息,对其中标志像素的特征信息进行比较,计算出相似度就可以完成识别过程。在遇到一个新的静态图像识别的问题时,可以采用本发明提供的技术方案,故而本发明图像识别方法具有较好的通用性。
另一方面,本发明的目的还在于提供一种图像识别系统,以提高识别速度和识别准确度,且该图像识别系统的通用性较好。
为达到上述目的,本发明采用如下技术方案:该图像识别系统包括:
图像输入模块,用于导入待识别图像的信息;
模板信息选择模块,用于在模板信息库选择目标图像,并读取模板信息库中目标图像的模板信息,所述模板信息包括目标图像中标识区域的信息、以及标识区域内标志像素的特征信息;
扫描模块,连接到图像输入模块和模板信息选择模块,依据标识区域的信息在待识别图像上确定待识别区域,在待识别区域中查找与标识区域中标志像素对应的像素;并计算查找到的像素的特征信息与标识区域中标志像素的特征信息的最大相似度;
判断模块,连接到扫描模块,依据计算出的最大相似度,输出所述待识别图像与所述目标图像相匹配;或者输出所述待识别图像与所述目标图像不匹配。
由上述技术方案所描述的图像识别系统,由图像输入模块导入待识别图像的信息,并通过对比待识别图像的待识别区域内特征信息与目标图像的标识区域内特征信息,当两者的相似度符合误差要求时,表示找到与待识别图像相匹配的目标图像,即实现了图像的识别。
由于上述图像识别系统在识别过程中,只需要比较标识区域内和待识别区域的特征信息,所需要的信息量比现有技术要少很多,并且所比较的特征信息是像素的特征信息,没有经过任何预处理,不需要大量的图像信息处理和数学统计计算,也没有复杂的数学变换、演绎推理,使图像识别相对于现有识别技术而言较快,实现也较为简单。
由于上述图像识别系统中以模板信息方式保存目标图像的形与像的特征信息,这些形与像的特征信息相当于动物大脑中的形象知识,并且在识别过程中不需要对新的目标图像进行特征分析、识别策略分析等复杂工作;也不需要做大数据量的图像处理,通过对比这些特征信息来模拟动物大脑的形象思维以完成图像识别。所以本发明图像识别系统相对于现有的图像识别技术而言,其识别速度快,识别效率得到了提高。
由于上述图像识别系统不需要获取大量的经验数据,只是提取像素的特征信息,对其中标志像素的特征信息进行比较,计算出相似度就可以完成识别过程。在遇到一个新的静态图像识别的问题时,可以采用本发明提供的技术方案,故而本发明图像识别系统具有较好的通用性。
附图说明
图1是本发明图像识别方法实施例的流程图;
图2是本发明图像识别方法实施例中精确识别的流程图;
图3是本发明图像识别系统实施例的结构图;
图4是本发明图像识别系统实施例的内部结构图;
图5是本发明图像识别方法在票据版面识别中应用的流程图;
图6是票据版面识别中第一目标票据图像标识示意图;
图7是票据版面识别中第二目标票据图像标识示意图;
图8是票据版面识别中第三目标票据图像标识示意图;
图9是票据版面识别中提取的特征信息的几何参数示意图。
具体实施方式
本发明图像识别方法及系统是一种模仿形象思维的模板式组合标识图像识别。在现有基于逻辑思维方式的图像识别技术中,需要提取完整的信息、经过严密的推理与计算、以及有序的处理过程,才能最后完成图像识别。而模仿形象思维方式的图像识别技术,完全基于图像中形与像的特征信息,所记忆的信息仅是表征其特征的很少一部分,并且对特征信息的处理是并行的,没有大量复杂的数学计算和逻辑推理,就可以完成图像识别。比较上述两种基于不同思维方式的图像识别技术,可知基于形象思维方式的图像识别具有特征信息量小,处理过程简约、高效的优势。
就目前对形象思维的认知程度,还不能完全模拟形象思维的高级思维活动来解决图像识别问题。但对于图像静态识别问题,分析形象思维的高级思维活动特点,模拟特征目标识别过程的主要特点及方法是可以实现的,这也是本发明的核心思想。
形象思维对图像的识别过程最主要的是:直接利用记忆的形与象的特征信息搜索匹配的目标图像,根据相似程度获得识别结果。这种方法有三个主要特点:第一、直接利用形与像的特征信息搜索匹配的目标图像,不对原始图像信息作各种预处理;第二、根据不同的识别目标集合及不同的识别准确率要求,调整参与图像识别的特征信息元素数量;第三、根据统一的相似程度指标判定识别结果。本发明图像识别方法及系统模拟这三个特点,实现了一种简洁、高效的图像识别方法,通过使用少量的特征信息,直接匹配目标图像使识别的速度大大提高;通过使用相似程度指标使该方法可应用于各种静态图像目标的识别,具有较好的通用性。
下面结合附图对本发明图像识别方法及系统进行详细描述。
如图1所示,为本发明图像识别方法的流程图,该过程包括目标图像的模板信息准备,以及后续的识别过程,其中步骤101至步骤103为目标图像的模板信息准备,其后为具体的识别过程。图1所示的具体过程如下:
101、调入作为识别目标的图像并将其转换为24位RGB图像,即获取图像的基本信息和特征信息,所述基本信息至少包含目标图像以像素为单位的宽度Bw、高度Bh和图像分辨率Bf;特征信息是指像素的坐标、亮度和颜色。用鼠标圈定该RGB图像的局部区域,并将该局部区域作为该目标图像的标识区域。
记录标识区域的信息主要包括:标识区域中心坐标偏移Pc(x,y)、标识区域参数Reb(l,t,r,b)、搜索区域参数Res(l,t,r,b)。通过这些标识区域的信息可以准确定位标识区域,然后就可确定标识区域内的特征信息元素个数Na和区别特征级级特征信息元素个数Nm
其中,标识区域中心坐标偏移表示标识区域中心与它的基准坐标点的偏移量,为了能够更精确地进行图像识别,可以设置主要标识区域和辅助标识区域,其中主要标识区域的基准坐标点规定为图像左上角(0,0)坐标点;辅助标识区域的基准坐标点规定为主要标识区域的中心点。
当所选定的标识区域在实际图像中的位置不会变化时,该标识区域称为定位标识区域,当所选定的标识区域在实际图像中的位置会发生变化时,该标识区域称为非定位标识区域,本发明中通过表示区域的中心坐标偏移来区分定位标识和非定位标识,当中心坐标偏移Pc为(0,0)时,该标识区域为非定位标识,否则为定位标识。
一般情况下需要人工选择图像中的主要标识区域,对于定位标识,如果不进行人工选择标识区域,则自动生成默认的标识区域。根据目标图像的具体情况可选择或不选择若干个辅助标识区域,辅助标识区域固定为定位标识,其中心坐标偏移表示以主要标识区域的中心为参考点的坐标偏移。
标识区域参数Reb、搜索区域参数Res与矩形参数定义相同,即:l(left)表示矩形区域左上角x坐标(中心点的左偏移),t(top)表示矩形区域左上角y坐标(中心点的上偏移),r(right)表示矩形区域右下角x坐标(中心点的右偏移),b(bottom)表示矩形区域右下角y坐标(中心点的下偏移),这样就构成一个向中心点四周偏移的矩形。
特征信息的元素以Ty(x,y,s,l)表示,其中x、y表示特征信息像素点以标识图像中心为原点的相对几何坐标;s表示特征信息像素点的颜色标记代码;l表示特征信息像素点的亮度标记代码。
通过上述的步骤101即可提取到目标图像标识区域内的特征信息,完成了对静态目标图像的特征描述。
102、利用上述目标图像的基本信息、标识区域的信息、以及标识区域内标志像素的特征信息构成描述目标图像的完整模板信息,然后为模板信息记录项添加名称和检索标识代码,并保存该模板信息记录项。所述基本信息至少包含目标图像以像素为单位的宽度Bw、高度Bh和图像分辨率Bf。本步骤完成了对静态目标图像的特征记忆。
103、将至少一个目标图像的模板信息构建成模板信息库。
104、在识别图像之前,首先在目标模板信息库中选择所需的目标模板信息,并将其导入图像识别系统。
105、调入待识别图像,并将其转换为RGB图像。
106、根据待识别图像的分辨率与目标模板基本信息分辨率,按下式计算各标识特征信息元素的几何坐标缩放比值Fk=Df/Bf,其中Df是待识别图像的分辨率,Bf是目标图像的分辨率。
当待识别图像的中心坐标偏移Pc为(0,0)时,标识为非定位标识,否则为定位标识。对于非定位标识的识别问题直接转向步骤107。对于定位标识的识别问题,按如下公式顺序计算与各模板信息的相似指标Xjw、Xjh
Xjw=(Fk*Bw-Dw)/Dw;Xjh=(Fk*Bh-Dh)/Dh;
其中,Bw、Bh分别是目标图像的宽度和高度;Dw、Dh分别是待识别图像的宽度和高度。设定一个判定指标Ra、Rb,Ra的取值范围为大于5%小于等于15%;Rb取值范围为大于-15%小于等于-5%;若Rb<Xjw<Ra并且Rb<Xjh<Ra,则待识别图像符合目标图像的外形尺寸,转向步骤107,否则重新选择一个目标图像,并执行步骤106,当待识别图像与所有的目标图像都不符合外形尺寸时,判定结束,并给出没有找到与待识别图像匹配的目标图像的识别结果。
107、利用模板信息中主要标识区域的搜索区域参数、标识区域的中心坐标偏移,在待识别图像中确定待识别区域,并计算主要标识区域内标志像素的特征信息和待识别区域内像素的特征信息的相似度,设定一个判定指标Rc,Rc的取值范围为大于90%小于等于100%。当找到的待识别区域中计算出的最大相似度满足Xssm>Rc时,则粗略判定待识别图像与目标图像匹配,由于是粗略识别,所以在本步骤中只需要利用部分标志像素(即区别特征级的标志像素)的特征信息来计算相似度。
对于定位标识的识别问题,具体过程如下:
(1)设定粗略识别X、Y平面的默认搜索邻域Rd、Re。Rd是对应200dpi分辨率的参数,Rd取值范围为大于50小于等于200。Re是对应待识别图像分辨率的参数Re=Rd*(Df/200)。根据标识区域的信息中标识区域中心坐标偏移Pc、标识区域参数Reb、搜索区域参数Res,计算搜索区域Rezs
如果Res是人工选择的,按下面公式计算搜索区域Rezs
Rezs.l=(Pc.x-(Reb.l-Res.l))*Fk;Rezs.r=(Pc.x+(Res.r-Reb.r))*Fk
Rezs.t=(Pc.y-(Reb.t-Res.t))*Fk;Rezs.b=(Pc.y+(Res.b-Reb.b))*Fk
如果Res是自动选择的,按下面公式计算搜索过程中心坐标的搜索区域Rezs
Rezs.l=Pc.x*Fk-Re;Rezs.r=Pc.x*Fk+Re
Rezs.t=Pc.y*Fk-Re;Rezs.b=Pc.y*Fk+Re
其中,Rezs.l表示以搜索中心坐标为准向左的偏移量,Rezs.r表示以搜索中心坐标为准向右的偏移量,Rezs.t表示以搜索中心坐标为准向上的偏移量,Rezs.b表示以搜索中心坐标为准向下的偏移量;搜索中心有标识区域的中心坐标偏移Pc确定。
设置粗略搜索过程X、Y方向的增量dsx、dsy。dsx=Rf*(Df/200);dsy=Rf*(Df/200)。Rf是对应200dpi分辨率的参数,Rf取值范围为大于1小于等于6。
(2)由于是针对定位标识的图像识别,可以设定粗略识别最大搜索的偏斜角度取值范围为大于5小于等于20,记为alfs。旋转角度的搜索范围是(-Ralf~Ralf)。设置搜索过程旋转角度的增量dsalf取值范围为大于1小于等于3。
(3)对区别特征级标志像素的特征信息,按照步骤(2)中的旋转角度以及旋转角度的步进量dsalf,按照旋转角度的增量变化待识别图像的偏斜角度,在待识别图像上按照步骤(1)中界定的搜索范围内,按照X、Y方向的增量dsx、dsy,搜索待识别区域,将待识别区域中的像素逐步与目标图像中的主要标识区域内的像素比较,计算出一个相似度Xss。当找到的待识别区域中计算出的最大相似度满足Xssm>Rc时,返回最大相似度Xssm、当前映射的旋转角度alfjs和当前标识区域的搜索中心点坐标Pcs,并转向步骤108。如果所有偏斜角度都搜索完成之后还不能找到满足Xssm>Rc的最大相似度,则返回步骤106。
对于非定位标识的识别问题,其具体过程如下:
1)将标识区域参数Res设置为待识别图像的整个区域。即:Res.l=0;Res.t=0;Res.r=Dw;Res.b=Dh;其中Dw表示待识别图像的宽度;Dh表示待识别图像的高度。按下面公式计算搜索区域Rezs
Rezs.l=Res.l+Cw*Fk/2;Rezs.t=Res.t+Ch*Fk/2;
Rezs.r=Res.r-Cw*Fk/2;Rezs.b=Res.b-Ch*Fk/2;
其中,Cw表示目标图像中标识区域的宽度;Ch表示目标图像中标识区域的高度。搜索过程X、Y方向的增量与定位标识粗略搜索过程X、Y方向的增量相同,即:dsx=Rf*(Df/200);dsy=Rf*(Df/200)。Rf是对应200dpi分辨率的参数,Rf取值范围为大于1小于等于6。
2)对于非定位标识的图像识别,可以设定粗略识别最大搜索的偏斜角度Ralf取值范围为180度,记为alfs。旋转角度的搜索范围(-Ralf~Ralf),设置搜索过程旋转角度的增量dsalf取值范围为大于1小于等于3。
3)对区别特征级标志像素的特征信息,按照步骤(2)中的旋转角度以及旋转角度的步进量dsalf,按照旋转角度的增量变化待识别图像的偏斜角度,并在偏斜后的待识别图像中,按照步骤(1)中界定的搜索范围内,沿X、Y方向的增量dsx、dsy,搜索待识别区域,并将待识别区域内的像素逐步与目标图像中主要标志区域内的像素比较,计算出一个相似度Xss。当找到的待识别区域中计算出的最大相似度满足Xssm>Rc时,返回最大相似度Xssm、当前映射的旋转角度alfjs和当前标识区域的搜索中心点坐标Pcs,并转向步骤108。如果所有偏斜角度都搜索完成之后还不能找到满足Xssm>Rc的最大相似度,则返回步骤106。
通过上述步骤106和107即可完成对图像的粗选匹配。
108、对通过粗选匹配的目标图像进行进一步的精确识别,精确识别也需要计算特征信息的相似程度指标,返回最大相似程度指标Xssm。设定一个判定指标Rc,Rc的取值范围为大于90%小于等于100%。如果最大相似程度指标Xssm>Rc,则判定待识别图像与目标图像匹配;否则判定待识别图像与目标图像不匹配。
该精确识别的具体流程如图2所示:
S1、设定精确识别中X、Y平面的搜索邻域Rg、Rh。Rg是对应200dpi分辨率的参数,Rg取值范围为大于5小于等于20。Rh是对应待识别图像分辨率的参数,Rh=Rg*(Df/200)。根据粗略识别过程返回的旋转角度alfjs和搜索中心点坐标Pcs,按下面公式确定精确搜索过程中心坐标的搜索区域Rezjs
Rezjs.l=Pcs.x-Rh;Rezjs.r=Pcs.x+Rh
Rezjs.t=Pcs.y-Rh;Rezjs.b=Pcs.y+Rh
当前映射的旋转角度采用粗略识别过程返回的旋转角度alfjs,还需要设置搜索过程X、Y方向的增量dsjx=1;dsjy=1,设定精确识别最大搜索的偏斜角度Ralfj,Ralfj取值范围为大于0小于等于5。旋转角度的搜索范围是(alfjs-Ralfj~alfjs+Ralfj)。设置搜索过程旋转角度的增量dsjalf=1。
S2、对所有标志像素的特征信息,在上述旋转角度的变换范围内,按照旋转角度的增量变化待识别图像的偏转角度,然后按照X、Y方向的增量,搜索待识别区域,并将待识别区域内的像素逐个与主要标识区域内的像素比较,并计算出相似度Xsjs。当找到的待识别区域中计算出的最大相似度满足Xssm>Rc时,返回最大相似度Xsjsm、当前映射的旋转角度alfjzs和当前标识图像的搜索中心点坐标Pcs;并执行步骤S3。如果不能找到满足Xsjsm>Rc的最大相似度,则输出所述待识别图像与当前的目标图像不匹配,并返回执行步骤107(返回后,按照步骤107中返回当前映射的旋转角度和当前标识区域的搜索中心点坐标,继续进行搜索),直到系统中的所有模板信息全都被匹配比较完成。
S3、判断目标图像是否设定有辅助标识区域,若设定有辅助标识区域,则执行步骤S4;否则输出所述待识别图像与当前的目标图像相匹配。
S4、根据精确识别过程返回主要标识的旋转角度alfjzs和搜索中心点坐标Pcs,按下面公式确定辅助标识搜索过程中心坐标Pcfs和搜索区域Refjs,并设置搜索过程X、Y方向的增量dsjx=1;dsjy=1。
Pcfs.x=Pcs.x+(Pcf.x*cos(alfjzs)+Pcf.y*sin(alfjzs))*Fk
Pcfs.y=Pcs.y+(Pcf.x*sin(alfjzs)+Pcf.y*cos(alfjzs))*Fk
Refjs.l=Pcfs.x-Rh;Refjs.r=Pcfs.x+Rh
Refjs.t=Pcfs.y-Rh;Refjs.b=Pcfs.y+Rh
其中Pcf是辅助标识区域相对于主要标识中心坐标的偏移。
按下面公式对辅助标识的Nf个特征信息元素作初始旋转映射变换:
Tyi.x=((Tfi.x+Pcf.x)*cos(alfjzs)+(Tfi.y+Pcf.y)*sin(alfjzs))*Fk-Pcfs.x;
Tyi.y=((Tfi.x+Pcf.x)*sin(alfjzs)+(Tfi.y+Pcf.y)*cos(alfjzs))*Fk-Pcfs.y;
其中,Tyi是第i个辅助标识特征信息元素Tfi作初始旋转映射变换后的元素。经变换后,旋转映射变换的初始旋转角度alfjs=0,最大搜索的偏斜角度与精确识别最大搜索的偏斜角度相同,Ralfj取值范围为大于0小于等于5,旋转角度的搜索范围是(-Ralfj~Ralfj),并设置搜索过程旋转角度的增量dsjalf=1。
S5、对辅助标识区域中全部标志像素的特征信息,按照S2中同样的方法计算相似度,并获取最大相似度Xsjsm
当最大相似度Xsjsm>Rc时,返回最大相似程度指标Xsjsm、当前映射的旋转角度alfjfs和当前标识图像的搜索中心点坐标Pcfs,并输出所述待识别图像与当前的目标图像相匹配;当没有找到满足Xsjam>Rc的最大相似度时,则输出所述待识别图像与当前的目标图像不匹配,并返回执行步骤106,直到系统中的所有模板信息全都被匹配比较完成。
上述技术方案所描述的图像识别方法,通过选择图像的局部,以模板方式记忆目标图像中标识区域内的形与像的特征信息,在查找到待识别图像中与标识区域相对应的待识别区域后,计算待识别区域内的特征信息和标识区域内的特征信息的相似度,当相似度符合误差要求时,表示找到与待识别图像相匹配的目标图像,即实现了图像的识别。
由于上述方法中只需要比较标识区域内和待识别区域的特征信息,所需要的信息量比现有技术要少很多,并且所比较的特征信息是像素的特征信息,没有经过任何预处理,不需要大量的图像信息处理和数学统计计算,也没有复杂的数学变换、演绎推理,使图像识别的过程相对于现有识别技术而言较快,实现也较为简单。
由于上述方法中采用了主要标识区域和辅助标识区域,通过辅助标识区域内的识别过程可以更进一步地提高识别的准确性。
对应于上述方法构建一个图像识别系统,如图3所示,为本发明图像识别系统的原理图,该系统至少包含目标图像模板信息生成工具、目标图像模板信息库和目标图像识别系统三部分,其中模板信息生成工具负责前期目标图像的模板信息准备,目标图像模板信息库中保存了已准备好的模板信息,目标图像识别系统主要负责图像的识别。
该图像识别系统包括图像输入模块、模板信息选择模块、扫描模块、判断模块和外形扫描模块,其中各个模块的连接关系和实现的功能如下:
如图4所示,图像输入模块,用于导入待识别图像的信息,主要读取图像的RGB信息。
模板信息选择模块,用于在模板信息库选择目标图像,并读取模板信息库中目标图像的模板信息,可以根据需要选择不同的模版信息库,所述模板信息包括目标图像的基本信息、标识区域的信息、以及标识区域内标志像素的特征信息。扫描模块,连接到图像输入模块和模板信息选择模块,依据标识区域的信息在待识别图像上确定待识别区域,待识别区域的查找过程和上述图像识别方法中完全相同,并且查找后需要按照旋转角度来计算待识别区域内特征信息与标识区域内特征信息的相似度,返回其中最大相似度。判断模块,连接到扫描模块,依据计算出的相似度,输出所述待识别图像与所述目标图像相匹配;或者输出所述待识别图像与所述目标图像不匹配。
上述判断模块的具体工作过程如下:在存储器中事先保存了特征信息的相似度判定指标;当扫描模块输出最大相似度时,将该最大相似度与相似度判定指标比较,若计算出的最大相似度大于相似度判定指标,则输出目标图像与待识别图像匹配;否则输出目标图像与待识别图像不匹配。
上述的标识区域具有如下特点:
1、人为选定的具有明显视觉效果,反映目标图像特征的局部图像。
2、分为主要标识区域和辅助标识区域。主要标识只有一个,辅助标识可以有多个。辅助标识与主要标识的几何位置关系是固定不变的。主要标识用于区别目标之间的明显差别,多个辅助标识逐级精确区分目标之间的细微差别。
3、分为定位标识和非定位标识,定位标识是指标识区域在图像的指定区域内;非定位标识是指不能确定标识在图像中的位置。
对于采用定位标识进行图像识别的情况,在确定待识别区域之前,先要粗略判断该图像在大小上是否相似,为了选择外形相符的目标图像,本发明图像识别系统还包括外形扫描模块,连接到模板信息选择模块、图像输入模块和扫描模块,对选择的目标图像进行外形尺寸的比较,用于查找与待识别图像外形尺寸相符的目标图像,并将所述目标图像的特征信息传送到扫描模块。这样所有进入扫描模块进行识别的目标图像都是在尺寸上符合要求的,不必要对尺寸不符合的目标图像进行识别,加快了图像识别的过程。
用户通过图像输入模块输入待识别图像后,再通过模板信息选择模块将目标图像的信息选择,通过外形扫描模块过滤掉外形尺寸不相符的目标图像,然后通过扫描模块将外形尺寸相符的目标图像和待识别图像进行图像识别。扫描模块找到待识别区域后,在待识别区域内进行特征信息的比较,计算出相似度,最后由判断模块利用相似度得出匹配结果。在整个识别过程中只需要比较待识别区域内的特征信息,所比较的信息相对于现有识别技术要少,并且不需要对特征信息进行逻辑运算,加快了识别过程。
下面介绍一个采用本发明的票据版面的图像识别过程,票据版面识别是票据自动处理首先要解决的关键问题。各行各业的票据种类不计其数,新的票据不断地出现,可用于识别的票面信息千变万化。构建能适应这种变化的票据版面识别系统是实现票据自动处理的基础。
本发明所述的方法非常有效的解决这一票面信息千变万化票据版面识别问题。为票据版面识别提供了一种通用的、快速记忆、识别方法。按照本发明所述的方法构建的票据版面识别系统与图3所示是一致的。只需根据票据版面识别的要求对界面做相应的改动。包括三部分:一、描述票据图像特征的模板信息生成的工具软件;二、记忆票据图像特征的模板信息库;三、实现票据版面识别的图像静态目标识别系统。按照本发明所述的方法实现票据版面识别的流程如图4所示,这一流程又分为两大部分。第一部分是识别前的准备工作,包括票据图像特征的描述、记忆,识别目标的选择,识别目标集特征信息的优化。第二部分是在线的识别过程。本发明这种通过模板与标识组合,模拟形象思维对图像信息进行记忆与识别的方法以及上述的流程设计,使得本发明的实施例具有如下优点:
通过简单人工参与,选择标识区域,实现票据图像特征描述与记忆。
通过简单人工参与,选择目标票据模板信息,实现有限票据类型识别系统的快速构成。
按照本发明的方法,不对待识别图像进行预处理,直接利用少量特征信息,通过搜索与匹配,实现图像的快速准确识别。
如图5所示:包括目标图像的模板信息准备过程,本发明图像识别方法用于票据版面的识别通过以下步骤实现:
401、在模板工具软件中,按先后顺序打开三个目标票据图像。前两个目标票据图像如图6、图7所示,票面图像信息基本是一样的。其差别是:目标票据图像1标有“(壹)”字样;目标票据图像2标有“(贰)”字样;第三个目标票据图像与前两个具有不同图像特征的,如图8所示。
402、按先后顺序分别为三个目标票据图像选择作为主要标识区域的局部图像,并提取该主要标识区域内标志像素的特征信息,其选择标识类型为定位标识。特征信息的几何参数示意如图9所示。白点表示标识图像信息点;深色点表示背景信息点;将主要标识的信息加入到模板中。
根据本发明方法,本实施例中分别选择图6中的A1、图7中的A2和图8中的A3三个区域的局部图像,作为三个目标票据图像的主要标识区域。
403、按先后顺序分别为前两个目标票据图像选择作为辅助标识区域的局部图像,并提取该辅助标识区域内标志像素的特征信息,其选择标识类型为定位标识。计算以主要标识中心坐标为参考点的辅助标识中心坐标偏移,同时将辅助标识的信息加入到模板中。
图5中的B1和图7中的B2两个区域的局部图像作为目标票据图像1、目标票据图像2的辅助标识区域。
404、将目标图像的基本信息、主要标识区域的信息、以及主要标识区域内的提取出的特征信息加入模板,构成描述目标图像特征的完整模板信息,当设定了辅助标识区域时,还需要将辅助标识区域信息以及其内特取出的特征信息加入模板。其中,基本信息设置如下:对目标票据图像1设置Bw=1365;Bh=645;Bf=200;对目标票据图像2设置Bw=1368;Bh=643;Bf=200;对目标票据图像3设置Bw=1840;Bh=920;Bf=200。
405、为模板信息记录项添加票据图像得名称和检索标识代码,并将该模板记录项保存于模板信息库。
在本实施例中,对目标票据图像1添加票据图像名称为“方正奥德业务档案综合管理系统转账支票测试样张(壹)”和检索标识代码为011001。对目标票据图像2添加票据图像目标名称为“方正奥德业务档案综合管理系统转账支票测试样张(贰)”和检索标识代码为011002。对目标票据图像3添加票据图像目标名称为“中国工商银行转账支票(京)”和检索标识代码为011101。
406、根据目标图像出现的频率高低,从模板信息库中为票据版面识别系统选择所需的目标模板。在票据类型目标识别系统,通过检索,显示相关业务票据模板信息的列表。点击票据模板记录项,可观察对应的目标票据图像和所选择标识图像。在本实施例中,为本系统选择此前录入的3个目标票据图像的模板信息,并将其导入票据版面识别系统。
以上步骤就完成了对目标图像的准备工作。
407、将一个待识别票据图像转换为RGB的24位图像并加载。
408、根据当前待识别票据图像的分辨率Df与目标模板基本信息分辨率Bf,计算各标识票据图像和目标票据图像的缩放比值Fk=Df/Bf。
例如当前待识别图像分辨率=300dpi;目标模板基本信息分辨率=200dpi,Fk=300/200=1.5。
409、本实施例为定位标识的识别问题,按如下公式顺序计算与各模板基本信息的相似指标Xjw、Xjh
Xjw=(Fk*Bw-Dw)/Dw;Xjh=(Fk*Bh-Dh)/Dh;
其中Bw、Bh分别是目标票据图像模板信息中的宽度和高度;Dw、Dh分别是待识别图像的宽度和高度。设定判定指标Ra=10%、Rb=-10%。如果Rb<Xjw<Ra并且Rb<Xjh<Ra判定该图像符合该目标的外形尺寸,转向步骤411,否则重新选择一个目标图像,并执行步骤410,当待识别图像与所有的目标图像都不符合外形尺寸时,判定结束,并给出没有找到与待识别图像匹配的目标图像的识别结果。
在本实施例中的外形尺寸都能够相符。
410、调用该模板主要标识区域内的标志像素信息,在定位区域内进行粗略识别的定位标识特征信息的搜索与匹配,
本实施例中粗略识别中计算相似度的过程具体如下:
(1)设定粗略识别X、Y平面的默认搜索邻域Rd=100。
Re=Rd*(Df/200)=100*(300/200)=150。
根据主要标识区域的信息中,主要标识区域中心坐标偏移Pc、标识区域参数Reb、搜索区域参数Res计算搜索区域,由于Res是人工选择的,按下面公式计算搜索过程中心坐标的搜索区域Rezs
Rezs.l=(Pc.x-(Reb.l-Res.l))*Fk;Rezs.r=(Pc.x+(Res.r-Reb.r))*Fk
Rezs.t=(Pc.y-(Reb.t-Res.t))*Fk;Rezs.b=(Pc.y+(Res.b-Reb.b))*Fk
设定Rf=2;那么粗略搜索过程X、Y方向的增量如下:
dsx=Rf*(Df/200)=2*(300/200)=3;dsy=dsx
(2)对定位标识的待识别票据图像,设定粗略识别最大搜索的偏斜角度Ralf=15,偏斜角度记为alfs。旋转角度的搜索范围是(-15~15)。设置搜索过程旋转角度的增量dsalf=2。
(3)并在待识别图像内按X、Y方向的增量,确定待识别区域;在偏斜角度变化一个增量dsalf=2时,将标识区域中的标志像素的坐标按照偏斜角度旋转,然后将待识别区域内的像素逐个和变换后的区分级标志像素比较,计算特征信息相似度Xss。当找到的待识别区域中计算出的最大相似度满足Xssm>Rc时,返回最大相似度Xssm、当前映射的旋转角度alfjs和当前搜索中心点坐标Pcs,并执行步骤411,如果按照所有偏斜角度将待识别图像搜索完成后,还没找到满足Xssm>Rc的相似度,则输出目标图像与待识别图像不匹配,并返回执行步骤409。
411、设定精确识别X、Y平面的搜索邻域Rg、Rh。Rg=10,Rh=Rg*(Df/200)=Rg*(300/200)=15。根据粗略识别过程返回的旋转角度alfjs和搜索中心点坐标Pcs,按下面公式确定精确搜索过程中心坐标的搜索区域Rezjs
Rezjs.l=Pcs.x-Rh;Rezjs.r=Pcs.x+Rh
Rezjs.t=Pcs.y-Rh;Rezjs.b=Pcs.y+Rh
由于需要进行精确识别,设置搜索过程X、Y方向的增量和旋转角度的增量要比较小,一般设定dsjx=1;dsjy=1。当前映射的旋转角度是alfjs,设定精确识别最大搜索的偏斜角度Ralfj=5,旋转角度的搜索范围是(alfjs-Ralfj~alfjs+Ralfj),设置搜索过程旋转角度的增量dsjalf=1。
偏斜角度按照旋转角度的增量dsjalf=1变化,将标识区域中的标志像素的坐标按照偏斜角度进行旋转变换,在待识别图像的待识别区域内按X、Y方向的增量dsjx=1;dsjy=1,并计算待识别区域中特征信息和所有变换后的标志像素的特征信息的相似度Xsjs,当找到最大相似度满足Xsjsm>Rc时,退出搜索匹配过程,返回最大相似程度指标Xsjsm、当前映射的旋转角度alfjzs和当前搜索中心点坐标Pcs。当没有找到满足Xsjsm>Rc的最大相似度,并返回执行步骤410(按照410中返回的当前映射的旋转角度和当前搜索中心点坐标,继续搜索),直到系统中的所有模板信息全都被匹配比较完成。
判断目标图像是否设定有辅助标识区域,若没有辅助标识区域,则输出所述待识别图像与当前的目标图像相匹配。若设定有辅助标识区域,根据精确识别过程返回主要标识的旋转角度alfjzs和搜索中心点坐标Pcs,按下面公式确定辅助标识区域搜索过程中心坐标Pcfs和搜索区域Refjs
Pcfs.x=Pcs.x+(Pcf.x*cos(alfjzs)+Pcf.y*sin(alfjzs))*Fk
Pcfs.y=Pcs.y+(Pcf.x*sin(alfjzs)+Pcf.y*cos(alfjzs))*Fk
Refjs.l=Pcfs.x-Rh;Refjs.r=Pcfs.x+Rh
Refjs.t=Pcfs.y-Rh;Refjs.b=Pcfs.y+Rh
其中Pcf是辅助标识与主要标识中心坐标的偏移。设置搜索过程X、Y方向的增量dsjx=1;dsjy=1。
按下面公式对辅助标识的Nf个特征信息元素作初始旋转映射变换:
Tyi.x=((Tfi.x+Pcf.x)*cos(alfjzs)+(Tfi.y+Pcf.y)*sin(alfjzs))*Fk-Pcfs.x;
Tyi.y=((Tfi.x+Pcf.x)*sin(alfjzs)+(Tfi.y+Pcf.y)*cos(alfjzs))*Fk-Pcfs.y;
其中Tyi是第i个辅助标识区域内的特征信息元素Tfi作初始旋转映射变换后的元素。经变换后,设置旋转映射变换的初始旋转角度alfis=0。最大搜索的偏斜角度Ralfj=2,旋转角度的搜索范围是(-Ralfj~Ralfj),设置搜索过程旋转角度的增量dsialf=1。
对辅助标识区域中所有标志像素的特征信息,当偏斜角度变化一个旋转角度的增量dsjalf=1时,将辅助标识区域中的标志像素的坐标按照偏斜角度进行旋转变换,并计算变换后的标志像素的特征信息和搜索区域内像素的相似度Xsjs。如果如果找到最大相似度Xsjsm>Rc,返回最大相似程度指标Xsjsm、当前映射的旋转角度alfjfs和当前搜索中心点坐标Pcfs,并输出所述待识别图像与当前的目标图像相匹配;如果没有找到满足Xsjsm>Rc的最大相似度,则输出所述待识别图像与当前的目标图像不匹配,并返回执行步骤408,直到系统中的所有模板信息全都被匹配比较完成。
上述粗略识别和精确识别过程都需要通过映射变换并计算相似度,该过程具体包括如下步骤:
①按下面公式,对N0个特征信息元素作旋转映射变换。
    Tyti.x=Tyi.x*cos(alf0)+Tyi.y*sin(alf0);
    Tyti.y=Tyi.x*sin(alf0)+Tyi.y*cos(alf0);
其中N0是特征信息中参与搜索匹配的特征信息元素个数,alf0是三维搜索空间中一个离散点的旋转角度。Tyti是第i个特征信息元素Tyi作旋转映射变换后的元素。
②每作一次旋转映射变换后,在三维搜索空间的X、Y平面,顺序作平移的映射变换。
对于主要标识按下面公式计算:
        Tyyi.x=Tyti.x*Fk+Mx0;Tyyi.y=Tyti.y*Fk+My0
对于辅助标识按下面公式计算:
        Tyyi.x=Tyti.x+Mx0;Tyyi.y=Tyti.y+My0
其中Mx0、My0是三维搜索空间中旋转角度,等于alf0的平面上一个离散点的X和Y的坐标。Tyyi是第i个特征信息元素Tyi作旋转、平移映射变换后的元素。①、②两步骤并不改变特征信息元素的光学参数。
③设定亮度偏差指标Rm。Rm取值范围为大于5%小于等于20%。对第i个变换后的特征信息元素,根据其几何坐标参数,直接提取待识别图像中对应像素的光学参数Dsi(第i个像素点的颜色值)、Dli(第i个像素点的亮度值),如果Tyyi.s(第i个特征信息元素的颜色值)等于Dsi并且(Tyyi.1-Dli)/255的绝对值小于Rm,判定该特征信息元素相似,否则判定该特征信息元素不相似。设相似特征信息元素计数变量Nx记录判定特征信息元素相似的个数。对N0个特征信息元素判定相似性,相似程度指标Xss按下面公式求取Xss=Nx/N0
按上述的流程步骤,通过粗略快速搜索和精确细致匹配实现对票据类型的快速准确识别。
本发明主要用于寻找相匹配的图像,例如:票据识别、印章识别等。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。

Claims (10)

1.一种图像识别方法,包括:
(1)获取待识别图像的信息;
其特征在于还包括以下步骤:
(2)在模板信息库中选择目标图像,并将选中目标图像的模板信息导入识别系统,所述模板信息至少包括目标图像中标识区域的信息、以及标识区域内标志像素的特征信息;
(3)根据标识区域的信息确定待识别图像中的待识别区域;
(4)在待识别区域中查找与标识区域中标志像素对应的像素;计算查找到的像素的特征信息与标识区域中标志像素的特征信息的最大相似度;
(5)判断所述最大相似度是否在误差范围内,若在误差范围内,则所述待识别图像与所述目标图像相匹配;否则所述待识别图像与所述目标图像不匹配。
2.根据权利要求1所述的图像识别方法,其特征在于,所述目标图像的模板信息按如下步骤提取:
获取目标图像的宽度、高度和分辨率;
输入标识区域的信息;
根据标识区域的信息在所述目标图像中确定标识区域;
获取所述标识区域内标志像素的特征信息,所述特征信息包括该像素的坐标、亮度和颜色;
将图像的宽度、高度和分辨率,标识区域的信息,以及标识区域内标志像素的特征信息保存为模板信息,并为所述模板信息添加名称和检索码。
3.根据权利要求1所述的图像识别方法,其特征在于,所述标识区域的信息包括主要标识区域的信息和/或辅助标识区域的信息。
4.根据权利要求3所述的图像识别方法,其特征在于,
所述主要标识区域的信息至少包括主要标识区域参数、中心偏移坐标和搜索区域参数,根据所述主要标识区域参数和中心偏移坐标在目标图像中确定主要标识区域,根据所述主要标识区域参数、中心偏移坐标和搜索区域参数在待识别图像中确定搜索区域,从而在所述搜索区域内搜索待识别区域,在待识别区域中查找与所述主要标识区域中标志像素对应的像素;
所述辅助标识区域的信息至少包括辅助标识区域相对于主要标识区域的中心偏移坐标,以及辅助标识区域参数、搜索区域参数,根据所述辅助标识区域相对于主要标识区域的中心偏移坐标和辅助标识区域参数在目标图像中确定辅助标识区域,根据所述辅助标识区域相对于主要标识区域的中心偏移坐标、辅助标识区域参数和搜索区域参数在待识别图像中确定搜索区域,从而在所述搜索区域内搜索待识别区域,在待识别区域中查找与所述辅助标识区域中标志像素对应的像素。
5.根据权利要求1所述的图像识别方法,其特征在于,所述待识别图像的信息包括待识别图像的分辨率,所述目标图像的模板信息包括目标图像的分辨率;所述步骤(2)之后还包括如下步骤:
按如下公式计算待识别图像和目标图像的缩放比值:Fk=Df/Bf,其中,Df为待识别图像的分辨率,Bf为目标图像的分辨率,以在步骤(3)中使用所述Fk确定待识别图像中的待识别区域。
6.根据权利要求1所述的图像识别方法,其特征在于,所述待识别图像的信息包括待识别图像的宽度和高度,所述目标图像的模板信息包括目标图像的宽度和高度;若所述标识区域为在图像中位置不会变化的定位标识区域,则所述步骤(2)之后还包括:查找与待识别图像外形尺寸相符的目标图像,具体方法如下:
计算待识别图像和目标图像的相似指标,公式为:
Xjw=(Fk*Bw-Dw)/Dw,Xjh=(Fk*Bh-Dh)/Dh,
其中,Bw为目标图像的宽度,Bh为目标图像的高度,Dw为待识别图像的宽度,Dh为待识别图像的高度,Fk为几何坐标缩放比值;所述Fk的计算方法为:Fk=Df/Bf,其中Df是待识别图像的分辨率,Bf是目标图像的分辨率;
判断Xjw和Xjh是否在误差范围内,如果在误差范围内,则该目标图像的外形尺寸与待识别图像的外形尺寸相符,执行步骤(3);
否则该目标图像的外形尺寸与待识别图像的外形尺寸不相符,重新选择一个目标图像,返回至所述计算待识别图像和目标图像的相似指标的步骤,当待识别图像与所有的目标图像都不符合外形尺寸时,判定结束,并给出没有找到与待识别图像匹配的目标图像的识别结果。
7.根据权利要求1所述的图像识别方法,其特征在于所述步骤(4)具体包括:
设定偏转角度范围和偏转角度的增量;
在偏转角度范围内,按照偏转角度的增量确定偏转角度;
将目标图像中标识区域内的标志像素坐标按照偏转角度进行变换;
在待识别区域中查找与变换后的标志像素相对应的像素;
计算查找到的像素的特征信息与标识区域中标志像素的特征信息的最大相似度。
8.一种图像识别系统,包括:
图像输入模块,用于获取待识别图像的信息;
其特征在于还包括:
模板信息选择模块,用于在模板信息库选择目标图像,并将选中目标图像的模板信息导入识别系统,所述模板信息至少包括目标图像中标识区域的信息、以及标识区域内标志像素的特征信息;
扫描模块,连接到图像输入模块和模板信息选择模块,根据标识区域的信息确定待识别图像中的待识别区域;
计算模块,用于在待识别区域中查找与标识区域中标志像素对应的像素,计算查找到的像素的特征信息与标识区域中标志像素的特征信息的最大相似度;
判断模块,连接到计算模块,判断所述最大相似度是否在误差范围内,若在误差范围内,则所述待识别图像与所述目标图像相匹配;否则所述待识别图像与所述目标图像不匹配。
9.根据权利要求8所述的图像识别系统,其特征在于,所述判断模块包括:
存储器,用于保存目标图像与待识别图像匹配的相似度判定指标;
比较器,连接到计算模块和存储器,用于比较计算出的最大相似度与存储器中的相似度判定指标,若计算出的最大相似度大于相似度判定指标,则输出所述待识别图像与所述目标图像匹配;否则输出所述待识别图像与所述目标图像不匹配。
10.根据权利要求8所述的图像识别系统,其特征在于还包括:
外形扫描模块,连接到模板信息选择模块、图像输入模块和扫描模块,用于查找与待识别图像外形尺寸相符的目标图像,并将所述目标图像的模板信息传送到扫描模块和计算模块。
CN2007103019508A 2007-12-21 2007-12-21 图像识别方法及系统 Expired - Fee Related CN101464951B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2007103019508A CN101464951B (zh) 2007-12-21 2007-12-21 图像识别方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2007103019508A CN101464951B (zh) 2007-12-21 2007-12-21 图像识别方法及系统

Publications (2)

Publication Number Publication Date
CN101464951A CN101464951A (zh) 2009-06-24
CN101464951B true CN101464951B (zh) 2012-05-30

Family

ID=40805523

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2007103019508A Expired - Fee Related CN101464951B (zh) 2007-12-21 2007-12-21 图像识别方法及系统

Country Status (1)

Country Link
CN (1) CN101464951B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104780362A (zh) * 2015-04-24 2015-07-15 宏祐图像科技(上海)有限公司 基于局部特征描述的视频静止logo检测方法
CN107481232A (zh) * 2017-08-17 2017-12-15 上海华力微电子有限公司 图形匹配方法

Families Citing this family (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101923643B (zh) * 2010-08-11 2012-11-21 中科院成都信息技术有限公司 通用表格识别方法
CN102567711A (zh) * 2010-12-29 2012-07-11 方正国际软件(北京)有限公司 一种扫描识别模板制作和使用方法及系统
CN102156855A (zh) * 2011-03-30 2011-08-17 信雅达系统工程股份有限公司 基于影像切割的银行凭证数据采集方法
CN102955834A (zh) * 2011-08-31 2013-03-06 上海夏尔软件有限公司 基于条码位置识别的精确图像切分方法
CN102968627A (zh) * 2011-08-31 2013-03-13 上海夏尔软件有限公司 基于区域关键字位置识别的精确图像切分方法
US9147178B2 (en) 2012-01-16 2015-09-29 International Business Machines Corporation De-identification in visual media data
US20130328760A1 (en) * 2012-06-08 2013-12-12 Qualcomm Incorporated Fast feature detection by reducing an area of a camera image
CN103065163B (zh) * 2013-02-04 2015-10-14 成都神州数码索贝科技有限公司 一种基于静态图片的快速目标检测识别系统及方法
CN103353992B (zh) * 2013-07-19 2019-06-04 北京中康联医疗器械开发有限公司 一种胶片无标记点自动定位方法
CN103699843A (zh) * 2013-12-30 2014-04-02 珠海市君天电子科技有限公司 一种恶意行为检测方法及装置
CN105095842B (zh) * 2014-05-22 2018-12-11 口碑控股有限公司 一种单据的信息识别的方法和装置
CN104298991B (zh) * 2014-10-09 2017-08-25 中国石油集团工程设计有限责任公司 一种角图章信息提取方法
CN104537339B (zh) * 2014-12-19 2018-04-10 汉王科技股份有限公司 信息识别方法和信息识别系统
CN104680128B (zh) * 2014-12-31 2022-10-25 北京释码大华科技有限公司 一种基于四维分析的生物特征识别方法和系统
CN104766082B (zh) * 2015-03-20 2018-08-14 福建天晴数码有限公司 基于安卓系统的图像识别方法和装置
CN104916034A (zh) * 2015-06-09 2015-09-16 普联软件股份有限公司 一种基于可干预模板的票据识别系统及识别方法
CN107085722A (zh) * 2015-09-25 2017-08-22 阿里巴巴集团控股有限公司 在图像中定位指定信息的方法及装置
CN106599010B (zh) * 2015-10-14 2021-12-07 魏立江 图码搜索法
CN105574161B (zh) * 2015-12-15 2017-09-26 徐庆 一种商标图形要素识别方法、装置和系统
CN105678778B (zh) * 2016-01-13 2019-02-26 北京大学深圳研究生院 一种图像匹配方法和装置
CN105975937A (zh) * 2016-05-05 2016-09-28 南京学安网络科技有限公司 基于无监督学习的道路检测方法及系统
CN106127199A (zh) * 2016-06-21 2016-11-16 深圳市乐乐趣文化科技有限公司 一种图像处理方法和设备
CN106548181A (zh) * 2016-10-31 2017-03-29 黄建文 一种图像识别方法及系统
CN106776950B (zh) * 2016-12-02 2020-05-05 大连海事大学 一种基于专家经验引导的现场鞋印痕迹花纹图像检索方法
CN108460899A (zh) * 2017-02-20 2018-08-28 深圳怡化电脑股份有限公司 一种图像特征识别方法和装置
CN108205684B (zh) * 2017-04-25 2022-02-11 北京市商汤科技开发有限公司 图像消歧方法、装置、存储介质和电子设备
CN107368800B (zh) * 2017-07-13 2020-02-21 上海携程商务有限公司 基于传真识别的订单确认方法、系统、设备及存储介质
CN109426814B (zh) * 2017-08-22 2023-02-24 顺丰科技有限公司 一种发票图片特定板块的定位、识别方法、系统、设备
CN107808154B (zh) * 2017-12-08 2021-03-30 上海慧银信息科技有限公司 提取收银票据信息的方法和装置
CN108381690B (zh) * 2018-03-28 2020-06-02 梧州学院 一种胶合板层板高效率自动排版的方法
CN109145904A (zh) * 2018-08-24 2019-01-04 讯飞智元信息科技有限公司 一种字符识别方法及装置
CN109272000B (zh) * 2018-09-10 2022-01-25 南方电网电力科技股份有限公司 一种机器人仪表对准和调焦方法及装置
CN111091499B (zh) * 2018-10-24 2023-05-23 方正国际软件(北京)有限公司 一种移动终端图像修正的方法及装置
CN109658584B (zh) * 2018-12-14 2021-01-12 泰康保险集团股份有限公司 一种票据信息识别方法及装置
CN110110115B (zh) * 2019-03-28 2023-05-23 西南电子技术研究所(中国电子科技集团公司第十研究所) 人机交互筛选识别机载目标图像的方法
CN110532964A (zh) * 2019-08-30 2019-12-03 广东小天才科技有限公司 页码识别方法及装置、阅读机器人、计算机可读存储介质
CN113034427B (zh) * 2019-12-25 2024-01-23 合肥欣奕华智能机器股份有限公司 图像识别方法及图像识别装置
CN111474184B (zh) * 2020-04-17 2022-08-16 河海大学常州校区 基于工业机器视觉的aoi字符缺陷检测方法和装置
CN111524189A (zh) * 2020-05-09 2020-08-11 浙江大华技术股份有限公司 门开关状态检测方法、装置及计算机存储介质
CN112258881B (zh) * 2020-10-21 2021-07-16 贵州汇联通电子商务服务有限公司 基于智慧交通的车辆管理方法
CN112465050B (zh) * 2020-12-04 2024-02-09 广东拓斯达科技股份有限公司 一种图像模板选择方法、装置、设备及存储介质
CN112613513A (zh) * 2020-12-31 2021-04-06 北京市商汤科技开发有限公司 图像识别方法、装置和系统
CN113283324B (zh) * 2021-05-14 2022-03-25 成都鸿钰网络科技有限公司 一种基于动态图像的森林防火预警方法及系统
CN113781552A (zh) * 2021-09-06 2021-12-10 天津爱旭太阳能科技有限公司 一种se激光工艺中偏移机台的查找方法和查找系统
CN114648715A (zh) * 2021-11-03 2022-06-21 深圳友朋智能商业科技有限公司 多视角图像对比检测的订单生成方法及智能售货机
CN114495136A (zh) * 2022-04-14 2022-05-13 滨州市社会保险事业中心 财务数据存储方法、系统、计算机设备和存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1164902A (zh) * 1995-07-31 1997-11-12 富士通株式会社 数据媒体处理装置及数据媒体处理方法
US5890808A (en) * 1996-01-05 1999-04-06 Mcdonnell Douglas Corporation Image processing method and apparatus for correlating a test image with a template
JP2003123080A (ja) * 2001-10-11 2003-04-25 Seiko Epson Corp 画像認識方法及び画像認識装置
CN1525378A (zh) * 2003-02-24 2004-09-01 株式会社日立制作所 票据定义数据生成方法以及票据处理装置
US20060233430A1 (en) * 2005-04-15 2006-10-19 Kabushiki Kaisha Toshiba Medical image processing apparatus

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1164902A (zh) * 1995-07-31 1997-11-12 富士通株式会社 数据媒体处理装置及数据媒体处理方法
US5890808A (en) * 1996-01-05 1999-04-06 Mcdonnell Douglas Corporation Image processing method and apparatus for correlating a test image with a template
JP2003123080A (ja) * 2001-10-11 2003-04-25 Seiko Epson Corp 画像認識方法及び画像認識装置
CN1525378A (zh) * 2003-02-24 2004-09-01 株式会社日立制作所 票据定义数据生成方法以及票据处理装置
US20060233430A1 (en) * 2005-04-15 2006-10-19 Kabushiki Kaisha Toshiba Medical image processing apparatus

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
黄涛.模板匹配在图像识别中的应用.《云南大学学报( 自然科学版)》.2005,第27卷(第5A期),第327-332页. *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104780362A (zh) * 2015-04-24 2015-07-15 宏祐图像科技(上海)有限公司 基于局部特征描述的视频静止logo检测方法
CN107481232A (zh) * 2017-08-17 2017-12-15 上海华力微电子有限公司 图形匹配方法

Also Published As

Publication number Publication date
CN101464951A (zh) 2009-06-24

Similar Documents

Publication Publication Date Title
CN101464951B (zh) 图像识别方法及系统
CN108171297B (zh) 一种答题卡识别方法
CN102704215B (zh) 基于dst文件解析与机器视觉结合的绣布自动切割方法
CN101576956B (zh) 基于机器视觉的在线字符检测方法和系统
CN105701766B (zh) 图像匹配方法和装置
CN109800689A (zh) 一种基于时空特征融合学习的目标跟踪方法
CN104751187A (zh) 抄表图像自动识别方法
US20180232400A1 (en) Sketch-based image searching system using cell-orientation histograms and outline extraction based on medium-level features
CN105260751A (zh) 一种文字识别方法及其系统
CN105068918A (zh) 一种页面测试方法及装置
CN102930251A (zh) 两维收藏品数据收录与甄别的装置和方法
CN112541922A (zh) 基于数字图像的试卷布局分割方法、电子设备及存储介质
CN103743750B (zh) 一种大口径光学元件表面损伤分布图的生成方法
CN107633201B (zh) 一种答题卡智能识别方法和系统
CN107194402A (zh) 一种并行细化骨架提取方法
Pondenkandath et al. Identifying cross-depicted historical motifs
EP1791089A2 (en) Method and apparatus for the graphical operation of real-time image processing systems
RU2361273C2 (ru) Способ и устройство для распознавания изображений объектов
CN113704111A (zh) 页面自动化测试方法、装置、设备及存储介质
US20220108433A1 (en) Information processing apparatus, information processing program, and information processing method
CN109784331A (zh) 基于标志点的棒材端面标记方案及字符图像矫正方法
CN109840522A (zh) 一种大棒端面标记方案及字符图像矫正方法
CN108090396A (zh) 一种指纹匹配方法和装置
JPH07121713A (ja) パターン認識方法
CN112183485A (zh) 基于深度学习的交通锥桶检测定位方法、系统及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
ASS Succession or assignment of patent right

Owner name: FOUNDER INTERNATIONAL CO., LTD.

Free format text: FORMER OWNER: BEIJING FANGZHENG AODE COMPUTER SYSTEM CO., LTD.

C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20110615

Address after: 100871 Beijing, Haidian District into the house road, founder of the building on the 5 floor, No. 298

Applicant after: PEKING UNIVERSITY FOUNDER GROUP Co.,Ltd.

Co-applicant after: Founder International Co.,Ltd. (Beijing)

Address before: 100871 Beijing, Haidian District into the house road, founder of the building on the 5 floor, No. 298

Applicant before: PEKING UNIVERSITY FOUNDER GROUP Co.,Ltd.

Co-applicant before: Beijing Founder Order Computer System Co.,Ltd.

C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20220913

Address after: 3007, Hengqin international financial center building, No. 58, Huajin street, Hengqin new area, Zhuhai, Guangdong 519031

Patentee after: New founder holdings development Co.,Ltd.

Patentee after: Founder International Co.,Ltd. (Beijing)

Address before: 100871, Beijing, Haidian District Cheng Fu Road 298, founder building, 5 floor

Patentee before: PEKING UNIVERSITY FOUNDER GROUP Co.,Ltd.

Patentee before: Founder International Co.,Ltd. (Beijing)

TR01 Transfer of patent right
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20120530