CN108875549A

CN108875549A - 图像识别方法、装置、系统及计算机存储介质

Info

Publication number: CN108875549A
Application number: CN201810362486.1A
Authority: CN
Inventors: 刘宇
Original assignee: Beijing Megvii Technology Co Ltd
Current assignee: Beijing Megvii Technology Co Ltd
Priority date: 2018-04-20
Filing date: 2018-04-20
Publication date: 2018-11-23
Anticipated expiration: 2038-04-20
Also published as: CN108875549B

Abstract

本发明提供了一种图像识别方法、装置、系统及计算机存储介质。所述方法包括：获取待识别图像和目标图像，执行全图识别步骤，对待识别图像和目标图像进行比对，当全图比对结果不满足预设条件时，执行特征位置比对，对待识别图像的特征位置和目标图像的特征位置进行比对，当特征位置比对结果满足预设条件时，输出所述特征位置比对得到的比对结果。所述方法极大地提高了有效信息的提取效率。

Description

图像识别方法、装置、系统及计算机存储介质

技术领域

本发明涉及图像识别领域，更具体地涉及一种图像识别的方法、装置、系统及计算机存储介质。

背景技术

当前，图像识别系统尤其是人脸识别系统越来越多地应用于安防、金融领域需要身份验证的场景，如银行远程开户、门禁系统、远程交易操作验证等。在这些高安全级别的应用领域，除了确保被验证者的人脸相似度符合数据库中存储的底库，首先需要验证被验证者是一个合法的生物活体。也就是说，人脸识别系统需要能够防范攻击者使用照片、视频、3D人脸模型、或者面具等方式进行攻击。

在图像识别尤其是人脸识别技术中，存在多种识别方法。例如，基于主成分分析或判别式分析等利用特征人脸的方法。

然而，上述技术中的人脸识别都是基于单张人脸图片提取特征，然后基于人脸特征进行比较，用于比较的两张图在抽取特征时并没有交互。如此，将导致提取特征时无法根据实际情况判定脸部特征的重要性，如其中一张图片为戴着口罩的人，另一张图片为不戴口罩的人，那么在特征提取时，如果对两张图片分别提取嘴部特征，那么该特征的比对将没有意义，如此，将降低有效特征的提取效率。

发明内容

考虑到上述问题而提出了本发明。本发明提供了一种图像识别方法、装置、系统及计算机存储介质，通过全图识别及特征位置比对识别，实现了图像识别抽取特征时的交互，极大地提高了有效信息的提取效率。

根据本发明的一方面，提供了一种图像识别方法，其特征在于，所述方法包括：获取待识别图像和目标图像，执行全图识别步骤，对待识别图像和目标图像进行比对，当全图比对结果不满足预设条件时，执行特征位置比对，对待识别图像的特征位置和目标图像的特征位置进行比对，当特征位置比对结果满足预设条件时，输出所述特征位置比对得到的比对结果。

在本发明的一个实施例中，所述全图比对结果包括相似度、置信度、中间状态，坐标(X_1，Y_1)，(X_2，Y_2)和输出标志，其中X_1，Y_1分别为待识别图像上一个特征点的横纵坐标，X_2，Y_2分别为目标图像上一个特征点的横纵坐标。

在本发明的一个实施例中，根据权利要求2所述的方法，其特征在于，所述特征比对结果包括相似度、置信度、中间状态，坐标(X_1’，Y_1’)，(X_2’，Y_2’)和输出标志，其中X_1’，Y_1’分别为待识别图像上一个特征点的横纵坐标，X_2’，Y_2’分别为目标图像上一个特征点的横纵坐标。

在本发明的一个实施例中，当全图比对结果满足预设条件时，输出所述全图比对结果中的相似度和置信度；当所述特征位置比对结果不满足预设条件时，执行下一个特征位置的比对。

在本发明的一个实施例中，当所述特征位置比对的执行时间超出预设阈值时，输出最近一次特征位置比对结果中的相似度和置信度。

在本发明的一个实施例中，首次执行特征位置比对时，分别选取所述全图比对结果中的坐标(X_1，Y_1)，(X_2，Y_2)为中心，以一定尺寸为边长在待识别图像和目标图像上抠图作为特征位置。

在本发明的一个实施例中，所述下一个特征位置的中心选择为当前特征位置比对结果中的坐标。

在本发明的一个实施例中，所述全图比对结果的预设条件和所述特征位置比对结果的预设条件均为输出标志F，所述输出标志F由如下两种方式之一获得，1)将相似度和置信度与预设阈值范围ΔS(S₀，S₁)和ΔC(C₀，C₁)相比较，如果相似度和置信度均在ΔS，ΔC的范围内，那么F＝1，如果相似度和置信度均不在ΔS，ΔC的范围内，或者相似度和置信度中有任意一个值不在ΔS，ΔC的范围内，那么F≠1；2)所述神经网络直接输出该F值，其中，F＝1，表明该阶段为最终阶段，不需要进行下一阶段，F≠1表明该阶段不是最终阶段，需要进行下一阶段。根据本发明的另一方面，一种图像识别的装置，其特征在于，所述装置包括：图像获取模块，用于获取待识别图像和目标图像，全图比对模块，用于执行全图识别步骤，对待识别图像和目标图像进行比对，全图比对结果判定模块，用于对全图比对结果进行判定，特征位置比对模块，用于执行特征位置比对，对待识别图像的特征位置和目标图像的特征位置进行比对，特征位置比对结果判定模块，用于对特征位置的比对结果进行判定，输出模块，用于输出所述特征位置比对得到的相似度和置信度。

根据本发明的又一方面，提供了一种图像识别的系统，包括存储器、处理器及存储在所述存储器上且在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现前述方面及各个示例所述的图像识别的方法的步骤。

根据本发明的再一方面，提供了一种计算机存储介质，其上存储有计算机程序，所述计算机程序被计算机执行时实现前述方面及各个示例所述的图像识别的方法的步骤。

由此，根据本发明实施例的图像识别方法，通过全图识别步骤以及特征位置比对，进行图像识别，实现了待识别图像和目标图像之间信息交互来最大化提取的特征的有效信息，从而极大地提高了有效信息的提取效率。

附图说明

通过结合附图对本发明实施例进行更详细的描述，本发明的上述以及其它目的、特征和优势将变得更加明显。附图用来提供对本发明实施例的进一步理解，并且构成说明书的一部分，与本发明实施例一起用于解释本发明，并不构成对本发明的限制。在附图中，相同的参考标号通常代表相同部件或步骤。

图1是本发明实施例的电子设备的一个示意性框图；

图2是本发明第一实施例的图像识别方法的的示意性的流程图；

图3是本发明第二实施例的图像识别方法的示意性的流程图；

图4是本发明第三实施例的图像识别方法的示意性的流程图；

图5是本发明第四实施例的图像识别方法的示意性的流程图；

图6是本发明实施例的图像识别装置的示意性框图；

图7是本发明实施例的图像识别系统的一个示意性框图。

具体实施方式

为了使得本发明的目的、技术方案和优点更为明显，下面将参照附图详细描述根据本发明的示例实施例。显然，所描述的实施例仅仅是本发明的一部分实施例，而不是本发明的全部实施例，应理解，本发明不受这里描述的示例实施例的限制。基于本发明中描述的本发明实施例，本领域技术人员在没有付出创造性劳动的情况下所得到的所有其它实施例都应落入本发明的保护范围之内。

本发明实施例可以应用于电子设备，图1所示为本发明实施例的电子设备的一个示意性框图。电子设备100包括一个或多个处理器102、一个或多个存储装置104、输入装置106、输出装置108、图像传感器110以及一个或多个非图像传感器114，这些组件通过总线系统112和/或其它形式的连接机构(未示出)互连。应当注意，图1所示的电子设备100的组件和结构只是示例性的，而非限制性的，根据需要，所述电子设备也可以具有其他组件和结构。

所述处理器102可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其它形式的处理单元，并且可以控制所述电子设备100中的其它组件以执行期望的功能。

所述存储装置104可以包括一个或多个计算机程序产品，所述计算机程序产品可以包括各种形式的计算机可读存储介质，例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令，处理器102可以运行所述程序指令，以实现下文所述的本发明实施例中(由处理器实现)的客户端功能以及/或者其它期望的功能。在所述计算机可读存储介质中还可以存储各种应用程序和各种数据，例如所述应用程序使用和/或产生的各种数据等。

所述输入装置106可以是用户用来输入指令的装置，并且可以包括键盘、鼠标、麦克风和触摸屏等中的一个或多个。

所述输出装置108可以向外部(例如用户)输出各种信息(例如图像或声音)，并且可以包括显示器、扬声器等中的一个或多个。

所述图像传感器110可以拍摄用户期望的图像(例如照片、视频等)，并且将所拍摄的图像存储在所述存储装置104中以供其它组件使用。

图2所示为本发明图像识别方法的第一实施例的示意性流程图。

S210，获取待识别图像和目标图像，是所述图像识别方法的输入步骤，在图像识别流程中，首先获取两张图像，分别为待识别图像和目标图像，可以分别是图像A，图像B，待识别图像A可以通过图1中的输入装置106获得，目标图像B可以是存储在图1中的存储装置104中；

S220，执行全图识别步骤，对待识别图像A和目标图像B进行比对，具体的全图识别步骤包括如下步骤，将待识别图像A和目标图像B缩放到输入大小为W*W的图像，示例性的，为512*512大小的图像，也可以为1024*1024等等大小的图像，具体缩放尺寸可以根据实际情况进行选择，然后，缩放后的图像A，图像B作为输入送进神经网络，得到相似度S，置信度C，中间状态H，坐标(X_1，Y_1)，(X_2，Y_2)，其中，相似度S是指两幅图像的相似程度，是根据特定算法计算得出的具体程度，置信度C也称为可靠度，或置信水平、置信系数，即在抽样对总体参数作出估计时，由于样本的随机性，其结论总是不确定的。因此，采用一种概率的陈述方法，也就是数理统计中的区间估计法，即估计值与总体参数在一定允许的误差范围以内，其相应的概率有多大，这个相应的概率称作置信度。置信度C表明了相似度S所得的计算数值的可信程度，中间状态H，是指当前阶段对之前图片等输入的一个压缩编码，表征了部分已知信息，可用于下一个阶段的信息提取，起到了不同阶段之间的信息传递的作用，(X_1，Y_1)(X_2，Y_2)分别为待识别图像A和目标图像B上的坐标，所述坐标的具体值可以是图A，图B的原点坐标，也可以是由神经网络输出或指定的坐标，需要说明的是，前述图像的缩放步骤是可选的实施方式，在本发明的另一个实施例中，全图识别步骤中可以不包含待识别图像A和目标图像B的缩放步骤，直接将待识别图像A和目标图像B作为输入送进神经网络，在本发明的另一个实施例中，待识别图像A和目标图像B被送进神经网络之前，还可以分别包括灰度处理步骤和/或亮度处理步骤等等，在本发明的另一个实施例中，前述全图识别步骤中神经网络输出的可以仅包含相似度和/或置信度和/或中间状态和/或坐标，其具体输出的内容可以根据实际需求进行选择；

S230，当全图比对结果不满足预设条件时，执行特征位置比对，对待识别图像A和目标图像B的特征位置进行比对，所述预设条件可以由输出标志F进行表达，F值表示当前阶段是否为最终阶段，用于判定是否需要进行下一阶段，F＝1，表明该阶段为最终阶段，不需要进行下一阶段，F≠1表明该阶段不是最终阶段，需要进行下一阶段，所述输出标志F的获得至少有如下两种方式，1)将相似度S和置信度C与预设阈值范围ΔS(S₀，S₁)和ΔC(C₀，C₁)相比较，如果相似度S’和置信度C’均在ΔS，ΔC的范围内，那么F＝1，如果相似度S’和置信度C’均不在ΔS，ΔC的范围内，或者相似度S’和置信度C’中有任意一个值不在ΔS，ΔC的范围内，那么F≠1；2)神经网络直接输出该F值，神经网络通过预设算法获得该输出标志F值，根据实际应用领域和领域情况，可以对获得输出标志F值的预定算法进行选择。需要说明的是，F值的获得方式包括但不限于前述两种获得方式。在S230中，是指输出标志F≠1时，执行待识别图像A和目标图像B的特征位置识别，所述待识别图像A和目标图像B的特征位置识别是指，以(X_1，Y_1)为中心从待识别图像A中抠出大小为W*W的图像相关部分a，以(X_2，Y_2)为中心从目标图像B中抠出大小为W*W的图像相关部分b，将a，b作为输入送进神经网络，得到相似度S’，置信度C’，中间状态H’，(X_1’，Y_1’)，(X_2’，Y_2’)，如前文中所说，所述坐标的具体值可以是待识别图像A，目标图像B的原点坐标，也可以是由神经网络输出或指定的坐标；

S240步骤，当特征位置比对结果满足预设条件时，输出所述特征位置比对得到的相似度S’和置信度C’，该步骤内的预设条件仍然是以输出标志F为判断标准，在该步骤中，F＝1，输出相似度S’，置信度C’，需要指出的是，特征位置比对过程的输出标志F值的获得方式可以与全图识别步骤中的输出标志F的获得方法相同，也可以与全图识别步骤中输出标志F的获得方式不同，即使两者均由前文所述的方式1)获得，两者所分别涉及的预设阈值范围ΔS(S₀，S₁)和ΔC(C₀，C₁)也可以相同或不同，即对于全图识别和特征位置比对来说，其相似度和置信度的预设阈值范围可以是相同的，也可以分别设置不同的预设阈值范围，比如，在特征位置比对过程中，可以采用更加高的相似度和置信度范围，在特征位置比对时，要求待识别图像的特征位置和目标图像的特征位置具有更高的相似度并且所计算得到的相似度具有更高的可信度。上述方案只是示例性说明，不作为对发明保护范围的限定。

前述识别方法所用的神经网络包括但不限于循环神经网络RNN(RecurrentNeural Network)，例如时间递归神经网络LSTM(Long Short-Term Memory),深度卷积神经网络，如深度残差网络ResNet(Deep Residual Network),VGG等。

图3所示为图像识别方法的第二实施例的示意性流程图，

第二实施例中与第一实施例相同的步骤，在此不再赘述，下文仅对两个实施例不同的部分进行介绍。对应图2在第一实施例的S210，S220等步骤，图3中的相应步骤分别对应表示为S310，S320等等，以此类推。步骤S330是全图比对结果不满足预设条件，即F≠1时的执行步骤，那么当全图比对结果满足预设条件，即F＝1时，执行S350步骤，输出全图比对得到的相似度S和置信度C。

图4所示为图像识别方法的第三实施例的示意性流程图，

第三实施例中与第一实施例和第二实施例相同的步骤，在此不再赘述，下文仅对各个实施例不同的部分进行介绍。对应图2在第一实施例的S210，S220等步骤，图3在第二实施例的S310，S320等步骤，图4中的相应步骤分别对应表示为S410，S420等等，以此类推。步骤S340是特征位置比对结果满足预设条件，即F＝1时，所执行的步骤，然而当特征比对结果不满足预设条件，即F≠1时，返回重新执行S330步骤，继续执行特征位置比对步骤，将该判断过程统一称为步骤S460，然而，再次执行步骤S330时，所计算的特征位置的中心的坐标要发生变化，而特征位置中心坐标变化的规则一般有以下几种方式，1)直接由神经网络输出决定；2)预设了一些参考中心的位置，特征位置中心的变化以参考中心的位置为准；3)结合神经网络输出与参考中心的位置决定特征位置中心位置；4)不做特殊规则限定。其中第1)种特征位置中心变化的规则是指，下一个特征位置的中心选择为当前特征位置比对结果中的坐标。上述多次执行S330步骤是多阶段地对图像进行特征位置的变化，每次更变特征位置后，进行输出标志判断，是多阶段地识别。

图5所示为图像识别方法的第四实施例的示意性流程图，

第四实施例中与第一实施例至第三实施例相同的步骤，在此不再赘述，下文仅对各个实施例不同的部分进行介绍。对应图2在第一实施例中的S210，S220等步骤，对应图3在第二实施例的S310，S320等步骤，图4中的相应步骤分别对应表示为S410，S420等等，以此类推。在该实施例中，每次执行S460后，均执行S570步骤，记录特征位置比对的执行时间，随后执行S580步骤，判断是否超出预定阈值，当执行时间超出预定阈值时，F＝1，执行S590，输出最后一次特征位置比对得到的相似度和置信度，当执行时间没有超出预定阈值时，F≠1，返回S330步骤，进行下一个特征位置比对步骤。

人脸图像的处理作为图像处理的一种具体应用，有其特殊的应用方式，人脸识别本质上是三维塑性物体二维投影图像的匹配问题,它的困难体现在人脸模式的多样性(如胡须、发型、眼镜、化妆、戴帽、戴口罩等)，根据图2-5中所示的图像识别方法解决，以戴口罩为例，现有技术中的人脸识别都是基于单张人脸图片提取特征，然后基于人脸特征进行比较，用于比较的两张图像在抽取特征时并没有交互。如一个人一张人脸图像没有戴口罩，另一张人脸图像为戴着口罩的图像，那么在特征提取时，如果对两张图片分别提取嘴部特征，那么该特征的比对将没有意义，如此，不仅会降低有效特征的提取效率，甚至有可能输出错误的对比结果，误认为两张人脸不属于同一人。

而本发明的各个实施例中，将上述图像识别方法应用于人脸识别时，在两张人脸图像比对时，当全图识别过程的全图比对无法确认两张人脸图像属于同一人时，使用多个特征位置进行比对，相当于对全图进行了多次特征位置比对，即，在多个特征点进行抠图，并对每一次得到的抠图进行比对，最终输出判断结果与置信度，在多个特征位置比对时，两张图像进行了充分的信息交互，因此，通过两张图像件的信息交互来最大化提取出特征的有效信息，极大地提高了有效信息的提取效率。

例如，当识别的人脸图像戴口罩时，对两张图像的眼睛的特征位置进行识别，从而判断戴口罩的人脸图像是否是目标人的人脸图像，如此，避免了对嘴部特征的没有意义的比较，既提高了有效信息的提取效率，又避免了误判断的产生。

在另一个实施例中，特征位置还包括鼻子位置、耳朵位置、嘴巴位置等，比如，待识别人脸图像戴着墨镜，那么多阶段抠图过程中无需对眼睛进行识别，直接识别鼻子位置和嘴巴位置等特征，如此，通过两张图像件的信息交互来最大化提取出特征的有效信息，极大地提高了有效信息的提取效率。

当然，待识别的图像还可能包含其他情况，因此，上述特征位置比对不限定于对五官的位置执行多个特征位置比对，特征位置的具体内容可以根据实际情况进行调整，尤其是在对非人脸的图像进行识别，可以根据图像的种类进行特别的设定，比如对于地理位置图像识别时，可以对图像中的树进行特征位置比对等等。

识别人脸主要依据人脸上的特征,也就是说依据那些在不同个体之间存在较大差异而对于同一个人则比较稳定的度量。由于人脸变化复杂,因此特征表述和特征提取十分困难。在对人脸图像进行特征提取和分类之前一般需要做几何归一化和灰度归一化。几何归一化是指根据人脸定位结果将图像中人脸变换到同一位置和同样大小，即上述实施例中所述方法中将人脸图像大小归一化为W*W大小，灰度归一化是指对图像进行光照补偿等处理，光照补偿能够一定程度地克服光照变化的影响而提高识别率，在上述各实施例中所述的图像识别方法中虽然没有具体描述是否对图像进行了灰度归一化处理，然而，应当理解的是，其中可以包含在各个步骤中，然而，根据本领域技术人员的设定，图像比对之前的步骤中均可以包含该灰度归一化步骤。

上述关于上述各个实施例的图像识别方法中，也可以跳过全图识别步骤，直接执行特征位置比对步骤，如此，可以进行提高有效信息的提取效率，提高运算速度，更快地获得有效结果。

另外，本发明实施例还提供了另一种图像识别的装置，能够实现前述图2所示的图像识别的方法，为避免重复，这里不再赘述。

图6是根据本发明实施例的图像识别装置的示意性框图。

如图6所示，根据本发明实施例的图像识别装置600包括图像获取模块601、全图比对模块602、全图比对结果判定模块603、特征位置比对模块604，特征位置比对结果判定模块605、输出模块606。

图像获取模块601，用于获取待识别图像和目标图像。待识别图像可以通过图1中的输入装置106获得，目标图像B可以位于图1中的存储装置104中。

全图比对模块602，用于执行全图识别步骤，对待识别图像和目标图像进行比对。全文比对模块602可以由图1所示的电子设备中的处理器102运行存储装置104中存储的程序指令来实现。

全图比对结果判定模块603，用于对全图比对结果进行判定。全文比对结果判定模块603可以由图1所示的电子设备中的处理器102运行存储装置104中存储的程序指令来实现。

特征位置比对模块604，用于执行特征位置比对，对待识别图像的特征位置和目标图像的特征位置进行比对。特征位置比对模块604可以由图1所示的电子设备中的处理器102运行存储装置104中存储的程序指令来实现。

特征位置比对结果判定模块605，用于对特征位置的比对结果进行判定。特征位置比对结果判定模块605可以由图1所示的电子设备中的处理器102运行存储装置104中存储的程序指令来实现。

输出模块606，用于输出所述特征位置比对得到的相似度和置信度。输出模块606可以图1所示的电子设备中的输出装置108来实现。

图7是本发明实施例的图像识别系统中存储装置模块连接关系的一个示意性框图。

图像检测系统包括图像传感器、存储装置、以及处理器。

所述图像传感器用于采集图像。

所述存储装置存储用于实现根据本发明实施例的活体检测方法中的相应步骤的程序代码。

所述处理器用于运行所述存储装置中存储的程序代码，以执行根据本发明实施例的图像识别方法的相应步骤。

在一个实施例中，在所述程序代码被所述处理器运行时执行以下步骤：获取待识别图像和目标图像，执行全图识别步骤，对待识别图像和目标图像进行比对，当全图比对结果不满足预设条件时，执行特征位置比对，对待识别图像的特征位置和目标图像的特征位置进行比对，当特征位置比对结果满足预设条件时，输出所述特征位置比对得到的相似度和置信度。

此外，在所述程序代码被所述处理器运行时还执行以下步骤：当全图比对结果满足预设条件时，输出所述全图比对得到的相似度和置信度；当所述特征位置比对结果不满足预设条件时，执行下一个特征位置比对；当所述特征位置比对的执行时间超出预设阈值时，输出最近一次特征位置比对得到的相似度和置信度；相似度、置信度由神经网络计算得出，所述神经网络包括循环神经网络和/或深度卷积神经网络；特征位置是预先指定的特征位置或者由神经网络自动得出；所述特征位置包括，眼睛、眉毛、鼻子、耳朵、嘴巴或其组合等等。

另外，本发明实施例还提供了一种计算机存储介质，其上存储有计算机程序。当所述计算机程序由计算机执行时，可以实现前述方法的步骤。例如，该计算机存储介质为计算机可读存储介质。所述存储介质例如可以包括智能电话的存储卡、平板电脑的存储部件、个人计算机的硬盘、只读存储器(ROM)、可擦除可编程只读存储器(EPROM)、便携式紧致盘只读存储器(CD-ROM)、USB存储器、或者上述存储介质的任意组合。所述计算机可读存储介质可以是一个或多个计算机可读存储介质的任意组合，例如一个计算机可读存储介质包含用于随机地生成动作指令序列的计算机可读的程序代码，另一个计算机可读存储介质包含用于进行人脸活动识别的计算机可读的程序代码。

在一个实施例中，所述计算机程序指令在被计算机运行时可以实现根据本发明实施例的图像识别的各个功能模块，并且/或者可以执行根据本发明实施例的图像识别方法。

尽管这里已经参考附图描述了示例实施例，应理解上述示例实施例仅仅是示例性的，并且不意图将本发明的范围限制于此。本领域普通技术人员可以在其中进行各种改变和修改，而不偏离本发明的范围和精神。所有这些改变和修改意在被包括在所附权利要求所要求的本发明的范围之内。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

在本申请所提供的几个实施例中，应该理解到，所揭露的设备和方法，可以通过其它的方式实现。例如，以上所描述的设备实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个设备，或一些特征可以忽略，或不执行。

在此处所提供的说明书中，说明了大量具体细节。然而，能够理解，本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中，并未详细示出公知的方法、结构和技术，以便不模糊对本说明书的理解。

类似地，应当理解，为了精简本发明并帮助理解各个发明方面中的一个或多个，在对本发明的示例性实施例的描述中，本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而，并不应将该本发明的方法解释成反映如下意图：即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说，如相应的权利要求书所反映的那样，其发明点在于可以用少于某个公开的单个实施例的所有特征的特征来解决相应的技术问题。因此，遵循具体实施方式的权利要求书由此明确地并入该具体实施方式，其中每个权利要求本身都作为本发明的单独实施例。

本领域的技术人员可以理解，除了特征之间相互排斥之外，可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述，本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。

此外，本领域的技术人员能够理解，尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征，但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如，在权利要求书中，所要求保护的实施例的任意之一都可以以任意的组合方式来使用。

本发明的各个部件实施例可以以硬件实现，或者以在一个或者多个处理器上运行的软件模块实现，或者以它们的组合实现。本领域的技术人员应当理解，可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的物品分析设备中的一些模块的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的装置程序(例如，计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上，或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到，或者在载体信号上提供，或者以任何其他形式提供。

应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制，并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中，不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中，这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

以上所述，仅为本发明的具体实施方式或对具体实施方式的说明，本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本发明的保护范围之内。本发明的保护范围应以权利要求的保护范围为准。

Claims

1.一种图像识别方法，其特征在于，所述方法包括：

获取待识别图像和目标图像，

执行全图识别步骤，对待识别图像和目标图像进行比对，

当全图比对结果不满足预设条件时，

执行特征位置比对，对待识别图像的特征位置和目标图像的特征位置进行比对，

当特征位置比对结果满足预设条件时，

输出所述特征位置比对得到的比对结果。

2.根据权利要求1所述的方法，其特征在于，所述全图比对结果包括相似度、置信度、中间状态，坐标(X_1，Y_1)，(X_2，Y_2)和输出标志，其中X_1，Y_1分别为待识别图像上一个特征点的横纵坐标，X_2，Y_2分别为目标图像上一个特征点的横纵坐标。

3.根据权利要求2所述的方法，其特征在于，所述特征比对结果包括相似度、置信度、中间状态，坐标(X_1’，Y_1’)，(X_2’，Y_2’)和输出标志，其中X_1’，Y_1’分别为待识别图像上一个特征点的横纵坐标，X_2’，Y_2’分别为目标图像上一个特征点的横纵坐标。

4.根据权利要求3所述的方法，其特征在于，还包括：当全图比对结果满足预设条件时，输出所述全图比对结果中的相似度和置信度；当所述特征位置比对结果不满足预设条件时，执行下一个特征位置的比对。

5.根据权利要求4所述的方法，其特征在于，还包括：

当所述特征位置比对的执行时间超出预设阈值时，输出最近一次特征位置比对结果中的相似度和置信度。

6.根据权利要求3所述的方法，其特征在于，还包括：

首次执行特征位置比对时，分别选取所述全图比对结果中的坐标(X_1，Y_1)，(X_2，Y_2)为中心，以一定尺寸为边长在待识别图像和目标图像上抠图作为特征位置。

7.根据权利要求4所述的方法，其特征在于，所述下一个特征位置的中心选择为当前特征位置比对结果中的坐标。

8.根据权利要求4所述的方法，其特征在于，所述全图比对结果的预设条件和所述特征位置比对结果的预设条件均为输出标志F，所述输出标志F由如下两种方式之一获得，1)将相似度和置信度与预设阈值范围ΔS(S₀，S₁)和ΔC(C₀，C₁)相比较，如果相似度和置信度均在ΔS，ΔC的范围内，那么F＝1，如果相似度和置信度均不在ΔS，ΔC的范围内，或者相似度和置信度中有任意一个值不在ΔS，ΔC的范围内，那么F≠1；2)所述神经网络直接输出该F值；其中，F＝1，表明该阶段为最终阶段，不需要进行下一阶段，F≠1表明该阶段不是最终阶段，需要进行下一阶段。

9.一种图像识别的装置，其特征在于，所述装置包括：

图像获取模块，用于获取待识别图像和目标图像，

全图比对模块，用于执行全图识别步骤，对待识别图像和目标图像进行比对，

全图比对结果判定模块，用于对全图比对结果进行判定，

特征位置比对模块，用于执行特征位置比对，对待识别图像的特征位置和目标图像的特征位置进行比对，

特征位置比对结果判定模块，用于对特征位置的比对结果进行判定，

输出模块，用于输出所述特征位置比对得到的相似度和置信度。

10.一种图像识别的系统，包括存储器、处理器及存储在所述存储器上且在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至8中任一项所述方法的步骤。

11.一种计算机存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被计算机执行时实现权利要求1至8中任一项所述方法的步骤。