CN108920580A

CN108920580A - 图像匹配方法、装置、存储介质及终端

Info

Publication number: CN108920580A
Application number: CN201810660654.5A
Authority: CN
Inventors: 付丹青; 徐浩
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2018-06-25
Filing date: 2018-06-25
Publication date: 2018-11-30
Anticipated expiration: 2038-06-25
Also published as: CN108920580B

Abstract

本发明实施例公开了一种图像匹配方法、装置、存储介质及终端，其中，方法包括：获取查询图像及候选图像；从所述查询图像中获取与所述候选图像存在映射关系的关键点集合，所述关键点集合包含一个或一个以上的关键点；对所述关键点集合中的各关键点进行聚类处理得到至少一个映射区域；根据所述至少一个映射区域确定所述查询图像与所述候选图像之间的匹配度，可提高图像匹配的精确度。

Description

图像匹配方法、装置、存储介质及终端

技术领域

本发明涉及计算机技术领域，尤其涉及一种图像匹配方法、一种图像匹配装置、一种计算机存储介质及一种终端。

背景技术

在图像处理领域中，图像匹配是指一种搜索出与查询图像相同或者相似的图像的方法，该方法广泛应用于目标跟踪、人脸识别或自动驾驶或质量检测等领域，给用户的生活及工作带来极大便利。但是，目前的图像匹配方法存在图像匹配的精确度较低等问题，不能满足用户对图像匹配的需求，因此，如何能够较好的实现图像匹配是当前亟待解决的问题。

发明内容

本发明实施例所要解决的技术问题在于，提供一种图像匹配方法、装置、存储介质及终端，可提高图像匹配的精确度。

为了解决上述技术问题，本发明实施例提供了一种图像匹配方法，包括：

获取查询图像及候选图像；

从所述查询图像中获取与所述候选图像存在映射关系的关键点集合，所述关键点集合包含一个或一个以上的关键点；

对所述关键点集合中的各关键点进行聚类处理得到至少一个映射区域；

根据所述至少一个映射区域确定所述查询图像与所述候选图像之间的匹配度。

一方面，本发明实施例提供了一种图像匹配装置，该装置包括：

获取单元，用于获取查询图像及候选图像；从所述查询图像中获取与所述候选图像存在映射关系的关键点集合，所述关键点集合包含一个或一个以上的关键点；

聚类单元，用于对所述关键点集合中的各关键点进行聚类处理得到至少一个映射区域；

确定单元，用于根据所述至少一个映射区域确定所述查询图像与所述候选图像之间的匹配度。

一方面，本发明实施例提供一种计算机存储介质，所述计算机存储介质存储有一条或一条以上指令，所述一条或一条以上指令适于由处理器加载并执行图像匹配方法，所述图像匹配方法包括：

获取查询图像及候选图像；

一方面，本发明实施例提供了一种终端，该终端包括：

处理器，适于实现一条或一条以上指令；以及，

计算机存储介质，所述计算机存储介质存储有一条或一条以上指令，所述一条或一条以上指令适于由处理器加载并执行所述的图像匹配方法，所述图像匹配方法包括：

获取查询图像及候选图像；

本发明实施例中，终端获取查询图像及候选图像；从查询图像中获取与候选图像存在映射关系的关键点集合，关键点集合包含一个或一个以上的关键点；对关键点集合中各关键点进行聚类处理得到至少一个映射区域；根据至少一个映射区域确定查询图像与候选图像之间的匹配度。由于映射区域不仅包括关键点，即具备映射关系的特征点，这些特征点能够反映图像的本质特征，并且能够标识图像所包含的对象；与此同时，映射区域还包括关键点附近的像素点，这些像素点能够反映查询图像中的对象的更多细节特征；因此基于映射区域的图像匹配方法可以发掘出更为精细的图像匹配区域，实现更精细地图像匹配，提高图像匹配的精确度。另外，映射区域与关键集合中各个关键点在查询图像的位置有关，不易受其他外在因素的影响，因此稳定性较好。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的一种图像匹配方法的流程示意图；

图2是本发明实施例提供的另一种图像匹配方法的流程示意图；

图3是本发明实施例提供的一种查询图像的示意图；

图4是本发明实施例提供的一种候选图像的示意图；

图5是本发明实施例提供的另一种查询图像的示意图；

图6是本发明实施例提供的一种查询图像的特征点的示意图；

图7是本发明实施例提供的一种候选图像的特征点的示意图；

图8是本发明实施例提供的另一种候选图像的特征点的示意图；

图9是本发明实施例提供的一种查询图像的映射区域的示意图；

图10是本发明实施例提供的另一种查询图像的映射区域的示意图；

图11是本发明实施例提供的一种获取图像匹配度的流程示意图；

图12是本发明实施例提供的又一种图像匹配方法的流程示意图；

图13是本发明实施例提供的一种图像识别应用程序的界面示意图；

图14是本发明实施例提供的一种获取查询图像的示意图；

图15是本发明实施例提供的一种输出识别结果的示意图；

图16是本发明实施例提供的一种图像匹配装置的结构示意图；

图17是本发明实施例提供的一种终端的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明实施例的图像匹配方法可以应用于多种互联网场景中，该互联网场景可包括但不限于：图像检索场景、对象识别场景等等，其中，图像检索是指从数据库中检索出与查询图像具有相同或相似特征的候选图像，例如：从数据库中检索出与查询图像包括同一个人物的候选图像，或从数据库中检索出与查询图像包括同一建筑物的候选图像；等等。对象识别是指从查询图像中识别出各种对象的过程，这些对象包括：交通信号灯、花草、汽车、红酒、水果、图书封面、瓶饮(即瓶装饮料)、名画、人脸、手势或宠物等等。其中，图像检索场景又可进一步细分为：对图像进行分类的场景、或在应用程序(如浏览器)中进行图像搜索的场景等；对象识别场景又可进一步细分为：终端解锁场景、支付应用场景、无人驾驶场景、质量检测场景等等。

目前，图像匹配方法主要包括：基于关键点的数量的图像匹配方法、基于文本的图像匹配方法及基于深度学习的图像匹配方法，下面将对几种方法进行简要介绍：

(1)基于关键点的数量的图像匹配方法。

该方法的工作原理是：首先，针对查询图像和候选图像分别提取传统局部特征，此处的传统局部特征包含多个特征点；特征点是指图像的灰度值发生较大变化的点或者在图像边缘上曲率较大的点(如两个边缘的交点等)；特征点能够反映图像的本质特征，并且能够标识图像所包含的诸如文本、建筑物、植物、人物、交通工具、各种零部件、食物等的对象；然后，对两张图像的局部特征进行两两比较，从查询图像中的特征点中找到与候选图像的特征点具有映射关系的关键点；最后，根据具有映射关系的关键点的数量来衡量两张图像之间的匹配程度，具体为：具有映射关系的关键点的数量越多，则判定查询图像与候选图像之间的匹配度越高；否则越低。实践中发现，关键点数量的确定会受很多外在因素的影响，例如：由于候选图像受拍摄光线、角度或图像的大小等因素的影响，会存在即使在查询图像相同的情况下，与该查询图像进行匹配的多张相似候选图像仅因图案大小的差异所得到的关键点的数量也会有较大差异。因此，此方法无法有效的衡量图像之间的匹配度，导致图像匹配的精确度较低。

(2)基于文本的图像匹配方法。

此方法的工作原理在于：首先，针对查询图像及候选图像中的文本分别进行文本定位与内容识别；其次，对识别到的文本进行校正；然后，通过自然语言处理技术对校正后的文本进行分析得到两张图像之间的相似度，通过文本间的相似度来衡量两张图像的匹配度。此方法在文本相似性上能够达到比较好的效果，但在许多的应用场景中图像匹配的精确度较低，譬如查询图像及候选图像均为图书的封面，通常同一科目(如数学)的图书的不同版本的封面上的文本基本相同，但是同一科目的图书的版本不同会使得封面上的图案相差较大，此时如果采用基于文本的图像匹配方法会直接将两张不同版本的封面图像判定为匹配，而实际情况这两张不同版本的封面图像相差较大；可见，此情况并不适用于基于文本的图像匹配方案，会导致图像匹配的精确度较低。通常在一张图像中，图案的占比远大于文本的占比，且纹理比文本更为丰富，因此文本特征极易被图案特征淹没，导致文本特征不易被识别或无法在图像匹配的过程中发挥作用，从而使得基于文本的图像匹配方案的精确度较低，并且适用的应用场景也比较有限制。

(3)基于深度学习的图像匹配方法。

此方法的工作原理是：首先，通过卷积神经网络分别提取查询图像和候选图像的表征向量；其次，对表征向量加以分类监督信号或者度量监督信号，并构造排序网络来对两张图像进行特征训练与提取；最后通过计算两张图像的表征向量之间的距离来衡量图像之间的匹配程度。通过排序网络学习到的特征更多的是图案轮廓、局部语义上的相似性，无法识别出比较细节的特征点，因此基于深度学习的图像匹配方案并不能够实现精细匹配，匹配精确度较低。

为了提升图像匹配的精确度，本发明实施例提出一种图像匹配方案，具体为：获取查询图像及候选图像；从查询图像中获取与候选图像存在映射关系的关键点集合，关键点集合包含一个或一个以上的关键点；对关键点集合中各关键点进行聚类处理得到至少一个映射区域；根据至少一个映射区域确定查询图像与候选图像之间的匹配度。由于映射区域不仅包括关键点，即具备映射关系的特征点，这些特征点能够反映图像的本质特征，并且能够标识图像所包含的对象；与此同时，映射区域还包括关键点附近的像素点，这些像素点能够反映查询图像中的对象的更多细节特征；因此基于映射区域的图像匹配方法可以发掘出更为精细的图像匹配区域，实现更精细地图像匹配，提高图像匹配的精确度。另外，映射区域与关键集合中各个关键点在查询图像的位置有关，不易受其他外在因素(如图像的大小、尺寸等)的影响，因此稳定性较好。

基于上述描述，本发明实施例提供一种图像匹配方法，请参见图1，该图像匹配方法包括以下步骤S101-S104：

S101、获取查询图像及候选图像。

查询图像可以是在图像检索或对象识别的场景中由用户实时拍摄的一张图像；也可以是预先存储在终端的存储空间中，并根据用户的需求从存储空间中调取的一张图像；还可以是从互联网中下载的一张图像。候选图像是从数据库中获取的任一张图像，此处的数据库包含预先保存的多张已经被识别过的图像，这些图像的属性信息一并保存在数据库中，此处的属性信息可包括但不限于：图像的名称、大小、包含的对象名称、包含的文本内容等等。

S102、从查询图像中获取与候选图像存在映射关系的关键点集合，关键点集合包含一个或一个以上的关键点。

本步骤描述的是查询图像与候选图像之间的粗匹配过程。由于图像的特征点能够标识图像中的对象，因此可以通过获取两张图像中的特征点来实现两张图像之间的粗略匹配。进一步，终端可以通过从查询图像中获取与候选图像存在映射关系的关键点集合来实现两张图像之间的粗略匹配，此处关键点是指位于查询图像中且与候选图像中的特征点存在映射关系的特征点；两个特征点之间存在映射关系是指两个特征点的相似度大于预设相似度阈值。具体的，终端可以利用图像特征匹配算法从查询图像中获取与候选图像存在映射关系的关键点集合，图像特征匹配算法可以包括尺度不变特征变换算法(scale-invariant feature transform，SIFT)、加速稳健特征算法(speeded up robustfeatures，SURF)或角点检测算法(features from accelerated segment test，FAST)等等。

S103、对关键点集合中各关键点进行聚类处理得到至少一个映射区域。

S104、根据至少一个映射区域确定查询图像与候选图像之间的匹配度。

步骤S103-S104描述的是查询图像与候选图像之间的精细匹配过程。为了实现更加精细的图像匹配，终端可以对关键点集合中各关键点进行聚类处理得到至少一个映射区域。具体的，终端可以根据关键点的位置进行聚类得到至少一个映射区域，例如：将位于查询图像中的位置距离差值小于预设距离值的两个关键点聚类到同一映射区域；或者，终端也可以根据关键点的能量值进行聚类得到至少一个映射区域，例如，将关键点集合中能量值位于某个能量值范围的关键点聚类到同一个映射区域。能量值是指一种反映特征点的颜色深度的度量。映射区域不仅包括能够标识查询图像中的对象的关键点，还包括关键点附近的像素点，该像素点能够反映查询图像中的对象的更多细节特征，这样，可以发掘出查询图像与候选图像之间较为精细的匹配区域，从而可根据至少一个映射区域确定查询图像与候选图像之间的较为精确的匹配度。

在步骤S104获得查询图像与候选图像之间的匹配度之后，可以根据匹配度及应用场景输出相应的信息，例如在对象识别的应用场景中，在获得查询图像与候选图像之间的匹配度之后，比较匹配度与预设匹配阈值之间的大小，若匹配度大于预设匹配阈值，表明查询图像包括的对象与候选图像包括的对象极为相近，可认为二者包括的对象属于同一对象，因此终端可以从数据库中获取该候选图像包括的对象的名称、文本内容等属性信息，将此属性信息作为查询图像的识别结果进行输出；可以理解的是，如果匹配度小于预设匹配阈值，表明查询图像包括的对象与候选图像包括的对象极为不相似，可认为二者包括的对象完全不同，此时可从数据库中选取另一候选图像与查询图像执行上述匹配过程，如果数据库中所有候选图像与查询图像之间的匹配度均小于预设匹配阈值，终端可以出输出识别失败的提示信息。

本发明实施例中，终端获取查询图像及候选图像；从查询图像中获取与候选图像存在映射关系的关键点集合，关键点集合包含一个或一个以上的关键点；对关键点集合中各关键点进行聚类处理得到至少一个映射区域；根据至少一个映射区域确定查询图像与候选图像之间的匹配度。由于映射区域不仅包括关键点，即具备映射关系的特征点，这些特征点能够反映图像的本质特征，并且能够标识图像所包含的对象；与此同时，映射区域还包括关键点附近的像素点，这些像素点能够反映查询图像中的对象的更多细节特征；因此基于映射区域的图像匹配方法可以发掘出更为精细的图像匹配区域，实现更精细地图像匹配，提高图像匹配的精确度。另外，映射区域与关键集合中各个关键点在查询图像的位置有关，不易受其他外在因素(如图像的大小、尺寸等)的影响，因此稳定性较好。

本发明实施例提供另一种图像匹配方法，请参见图2，该图像匹配方法包括：

S201、获取查询图像及候选图像。

终端获取查询图像及候选图像包括：若检测到对目标对象的识别请求，调用终端的摄像装置对目标对象进行拍摄得到查询图像，获取目标对象的类型，并从目标对象的类型对应的数据库中获取任一个图像作为候选图像。

若检测到对目标对象的识别请求，调用终端的摄像装置对目标对象进行拍摄得到查询图像。在目标对象识别的应用场景中，为了提高获取候选图像的效率，终端可以预先为目标对象的类型设置一个对应的数据库，目标对象的类型对应的数据库可包括多张与目标对象的类型匹配的图像，例如，该目标对象为红酒，红酒对应的数据库包括不同种类的红酒的酒标图像，酒标图像中包括红酒的名称或红酒的商标图案等信息；因此终端可以通过目标对象的类型对应的数据库获取候选图像；具体的，终端获取目标对象的类型，并从目标对象的类型对应的数据库中获取任一个图像作为候选图像，终端也可以将数据库中的多张图像依次作为候选图像；例如，在红酒识别的场景中，若检测到对红酒的识别请求，调用终端的摄像装置对红酒进行拍摄得到如图3所示的查询图像，获取红酒的类型，并从红酒的类型对应的数据库中获取到如图4和图5所示的候选图像，将图4所示的候选图像标记标为候选图像a，将图5所示的候选图像标记为候选图像b。

S202、从查询图像中获取与候选图像存在映射关系的关键点集合，关键点集合包含一个或一个以上的关键点。

在一个实施例中，为了获取提高获取关键点的精度，在获取到关键点集合后，终端可以通过过滤算法对关键点集合中的关键点进行过滤处理，以滤掉关键点集合中无效的关键点，无效的关键点是指由于误操作将不具备映射关系的特征点作为具备映射关系的特征点，过滤算法包括随机抽样一致算法(random sample consensus，RANSAC)等等。步骤S202具体包括如下步骤s11～s12：

s11、获取查询图像的特征信息及获取候选图像的特征信息，特征信息包括至少一个特征点。

s12、将查询图像的特征信息与候选图像的特征信息进行映射比对，从查询图像的特征信息中获取与候选图像的特征点存在映射关系的一个或一个以上的关键点，一个或一个以上的关键点构成查询图像的关键点集合。

在步骤s11～s12中，为了实现图像的粗略匹配，终端可以获取查询图像的特征信息及候选图像的特征信息，具体的，终端可以获取查询图像的全局特征信息及候选图像的全局特征信息，全局特征信息包括图像的背景特征信息和前景特征信息；在一个实施例中，为了提高图像匹配的效率，及降低终端资源消耗，终端可以获取查询图像的局部特征信息及候选图像的局部特征信息，局部特征信息包括前景特征信息。在获取特征信息后，终端可以将查询图像的特征信息与候选图像的特征信息进行映射比对，从查询图像的特征信息中获取与候选图像的特征点存在映射关系的一个或一个以上的关键点，映射比对是指将查询图像中的特征点与候选图中对应位置的特征点进行一一比对。

举例来说，终端可以获取图3所示的查询图像的局部特征信息，该查询图像的局部特征信息所包括的特征点如图6所示；并分别获取图4和图5所示的候选图像的局部特征信息，图4中的候选图像a的局部特征信息所包括的特征点如图7所示，图5中的候选图像b的局部特征信息所包括的特征点如图8所示。图6、图7及图8中均以白色点表示特征点，从图6、图7及图8中可以看出，图像的特征点可以反映图像中的对象的轮廓信息。进一步，终端可以将查询图像的特征信息与候选图像a的特征信息进行映射比对，从查询图像的特征信息中获取与候选图像a的特征点存在映射关系的一个或一个以上的关键点；将查询图像的特征信息与候选图像b的特征信息进行映射比对，从查询图像的特征信息中获取与候选图像b的特征点存在映射关系的一个或一个以上的关键点。

在一个实施例中，终端可以将查询图像中的特征信息作为至少一个特征向量，及将候选图像的特征信息作为至少一个特征向量，计算查询图像的特征向量与候选图像中的特征向量的距离，若查询图像中的第一特征向量与候选图像中的第二特征向量的距离小于预设距离阈值，将第一特征向量中的特征点作为存在映射关系的关键点，第一特征向量为查询图像中的任一特征向量。

S203、对关键点集合中各关键点进行聚类处理得到至少一个映射区域。

例如，将图6的查询图像的特征信息与图7的候选图像a的特征信息进行映射对比，从查询图像的特征信息中获取与候选图像a的特征点存在映射关系的一个或一个以上的关键点，根据各个关键点进行聚类处理得到如图9所示的两个映射区域。将图6的查询图像的特征信息与图8的候选图像b的特征信息进行映射对比，从查询图像的特征信息中获取与候选图像b的特征点存在映射关系的一个或一个以上的关键点，根据各个关键点进行聚类处理得到如图10所示两个映射区域。

步骤S203具体包括如下步骤s21～s23：

s21、获取所述关键点集合中各关键点在查询图像中的位置。

s22、根据各个关键点的位置密度将各关键点归类至少一个点簇。

s23、将至少一个点簇中各个点簇构成的多边形所对应的区域确定为映射区域。

在步骤s21～s23中，为了实现图像的精细匹配，终端可以获取映射区域，具体的，终端可以获取关键点集合中各关键点在查询图像中的位置，此处关键点在查询图像中的位置可以是指关键点在查询图像中的像素坐标，因此，终端可以以查询图像中的任一特征点为中心点建立像素坐标系，根据像素坐标系获取各个关键点在查询图像中的位置。在获取关键点的位置后，终端可以根据各个关键点的位置密度将各关键点归类到至少一个点簇，如可以根据聚类算法及各个关键点的位置密度将各个关键点归类到至少一个点簇，聚类算法包括密度聚类算法(Density-based spatial clustering of applications withnoise，DBSCAN)等等。获取至少一个点簇后，终端可以将至少一个点簇中各个点簇构成的多边形所对应的区域确定为映射区域，此处的点簇可以是指根据位置密度对关键点进行划分形成的集合。

步骤s22可以包括：根据关键点集合中各关键点的位置，获取任意两个关键点之间的距离，将距离小于预设阈值的任意两个关键点归类至同一个点簇，以将所述关键点集合中各关键点归类为至少一个点簇。

通常距离较近的关键点属于同一个对象的特征点，或者距离较近的关键点的具有相似的特征，如距离较近的关键点的能量或像素值等差别不大，因此，终端可以将距离较近的两个特征点归类至同一个点簇，具体的，根据关键点集合中各关键点的位置，获取任意两个关键点之间的距离，将距离小于预设阈值的任意两个关键点归类至同一个点簇，以将关键点集合中各关键点归类为至少一个点簇，此处的预设阈值可以是根据关键点的分布密集程度设置的，如，关键点分布比较密集，将预设阈值设置为一个较小值，关键点分布比较分散，将预设阈值设置为一个较大值，或者预设阈值是用户手动设置的。

步骤s23可以包括：将目标点簇构成的外接多边形所对应的区域确定为所述映射区域，目点簇为至少一个点簇中的任意点簇，或者，将目标点簇形成的面积小于预设值的内接多边形所对应的区域确定为映射区域。

为了避免映射区域包括无效的区域，如图像的背景区域，导致图像匹配的精确度不高的问题，终端可以根据点簇的凸包确定映射区域，具体的，终端可以将目标点簇构成的外接多边形所对应的区域确定为映射区域。此处外接多边形是指点簇的凸包，外接多边形的边上包括至少一个关键点，目标点簇构成的外接多边形可以有多个，终端可以根据外接多边形的面积从多个外接多边形中选择一个外接多边形作为映射区域，如选择面积最小的外接多边形作为映射区域。在一个实施例中，终端可以根据点簇的凹包确定映射区域，具体的，将目标点簇形成的面积小于预设值的内接多边形所对应的区域确定为映射区域，此处内接多边形是指点簇的凹包，外接多边形的边上包括至少一个关键点。

S204、获取至少一个映射区域的面积总和及查询图像的面积。

S205、将面积总和与查询图像的面积之间的比值确定为查询图像与候选图像的图像相似度。

在步骤S204-S205中，终端可以根据映射区域的面积确定查询图像与候选图像的图像相似度，具体的，获取至少一个映射区域的面积总和及查询图像的面积，将面积总和与查询图像的面积之间的比值确定为查询图像与候选图像的图像相似度，此处，面积总和与查询图像的面积的比值越大，表明查询图像与候选图像的图像相似度越大，反之，面积总和与查询图像的面积的比值越小，表明查询图像与候选图像的图像相似度越小。例如，在图3所示的查询图像与图4所示的候选图像a进行匹配时，终端计算图9所示的查询图像的两个映射区域的面积总和，并获取查询图像的面积，将面积总和与查询图像的面积之间的比值确定为查询图像与候选图像a的图像相似度。同理，在图3所示的查询图像与图5所示的候选图像b进行匹配时，终端计算图10所示的查询图像的两个映射区域的面积总和，并获取查询图像的面积，将面积总和与查询图像的面积之间的比值确定为查询图像与候选图像b的图像相似度。从图9和图10可知查询图像与候选图像a的图像相似度小于查询图像与候选图像b的图像相似度，也就是说，候选图像b与查询图像更相似。

S206、获取查询图像与候选图像的文本相似度。

为了进一步提高图像匹配的精确度，终端可以根据图像相似度及文本相似度确定查询图像与候选图像的匹配度，因此，在获取到图像相似度后，终端可以获取查询图像与候选图像的文本相似度，在一个实施例中，终端也可以先获取查询图像与候选图像的文本相似度，然后获取图像相似度，本发明实施中对获取图像相似度及文本相似度的先后顺序不限定。

步骤S206包括如下步骤s31～s34：

s31、获取查询图像的文本信息及候选图像的文本信息，文本信息包括至少一个字符。

s32、将查询图像的文本信息与候选图像的文本信息进行比对，从查询图像的文本信息中确定与候选图像的字符存在相似关系的字符。

s33、统计存在相似关系的字符的数量及查询图像中的总字符数量。

s34、将存在相似关系的字符的数量与总字符数量的比值确定为文本相似度。

在步骤s31～s34中，由于每张图像中的总字符数量存在差别，如果仅根据两张图中存在相似关系的字符数量确定文本相似度，会导致获取图像的文本相似度的准确度较低，因此，终端可以根据查询图像的总字符数量及存在相似关系的字符数量确定文本相似度。具体的，终端可以通过文本识别算法获取查询图像的文本信息，及候选图像的文本信息，文本识别算法包括光学字符识别(Optical Character Recognition，OCR)等等，文本信息可以包括至少一个字符，字符可以是指文本、符号、数字或字母中的一种或多种。获取到文本信息后，终端可以将查询图像的文本信息与候选图像的文本信息进行比对，从查询图像的文本信息中确定与候选图像的字符存在相似关系的字符，并统计存在相似关系的字符的数量及查询图像中的总字符数量，将存在相似关系的字符的数量与总字符数量的比值确定为文本相似度。

步骤s34包括如下步骤s41～s43：

s41、对查询图像的文本信息进行纠正处理，得到查询图像的有效文本信息。

s42、获取查询图像中的第一字符与候选图像中第二字符之间的编辑距离，第一字符为查询图像的有效文本信息中的任一字符，第二字符在候选图像的位置信息与第一字符在所述查询图像中的位置信息相同。

s43、若第一字符与第二字符之间的编辑距离小于第一预设编辑距离，则确定第一字符与第二字符存在相似关系。

在步骤s41～s43中，为了提高文本识别的准确度，终端可以对查询图像的文本信息进行纠正处理，得到查询图像的有效文本信息，以滤掉查询图像的文本信息中的无效字符，并更改文本信息中错误的字符，无效字符是指多余的字符。进一步，终端可以获取查询图像中的第一字符与候选图像中第二字符之间的编辑距离，若第一字符与第二字符之间的编辑距离小于第一预设编辑距离，表明第一字符与第二字符为同一个字符的概率较大，则确定第一字符与第二字符存在相似关系。

步骤s41包括:将查询图像的文本信息的中字符所组成的文本段与模版库中文本段进行比较，若模板库中存在目标文本段与所组成的文本段之间的编辑距离小于第二预设编辑距离，采用目标文本段对所组成的文本段中的字符进行纠正，得到查询图像的有效文本信息。

为了避免识别到的文本中出现错误，导致获得的文本相似度的准确性较低的问题，终端可以对查询图像的文本信息进行纠正，具体的，终端可以将查询图像的文本信息的中字符所组成的文本段与模板库中文本段进行比较，若模板库中存在目标文本段与所组成的文本段之间的编辑距离小于第二预设编辑距离，采用目标文本段对所组成的文本段中的字符进行纠正，得到查询图像的有效文本信息。举例来说，终端识别出的查询图像的文本信息中包括w、a、r、l及d，查询图像的文本字符所组成的文本段为warld，将所组成的文本段warld与模板库中的文本段进行比较，若所组成的文本段与模板库中目标文本段(如world)的编辑距离小于第二预设编辑距离，则采用目标文本段对所组成的文本段中的字符进行纠正，得到查询图像的有效文本信息。即将查询图像中的文本段中的字符a替换为目标文本段中的字符o，得到查询图像的有效文本信息为w、o、r、l。此处的第二预设编辑距离可以根据识别字符的精度，如识别字符的精度较高，则将第二预设编辑距离设置为一个较小值，反之，将第二预设编辑距离设置为一个较大值；在一个实施例中，第二预设编辑距离可以根据查询图像中的文本的长短设置，如查询图像中的文本的长度较大，则将第二预设编辑距离设置为一个较大值，反之，将第二预设编辑距离设置为一个较小值。

S207、为图像相似度设置第一权值，并为文本相似度设置第二权值。

S208、根据第一权值及第二权值对图像相似度及文本相似度进行加权求和计算，得到匹配度。

在步骤S207～S208中，终端可以通过文本相似度及文本相似度确定查询图像与候选图像的匹配度，具体的，终端可以为图像相似度设置第一权值，并为文本相似度设置第二权值，根据第一权值及第二权值对图像相似度及文本相似度进行加权求和计算，得到所述匹配度。此处第一权值和第二权值可以是根据图案和文本在查询图像中的占比设置的，例如，图案在查询图像中的占比大于文本的占比，可以将第一权值设置为一个较大值(如0.8)，将第二权值位置为一个较小值(如0.2)；在一个实施例中，第一权值和第二权值可以是根据图案和文本在查询图像中的重要程度设置的，图案与文本在查询图像中的重要程度可以根据图像匹配的应用场景设置，例如，在红酒识别的场景中，查询图像的图案与候选图像中的图案的差异性较小，而文本上存在较大差异，则文本相似度的大小在一定程度上决定了查询图像与候选图像的匹配度大小，因此在该场景中文本相似度的重要程度大于图像的相似程度，可以将第一权值设置为一个较小值(如0.2)，将第二权值位置为一个较大值(如0.7)。

举例来说，如图11所示，终端可以根据图像相似度及文本相似度确定匹配，具体的，终端可以将图像相似度及文本相似度输入到逻辑回归网络，逻辑回归网络可以根据图像相似度及文本相似度的重要程度为图像相似度设置第一权值，及为文本相似度设置第二权值，并根据第一权值及第二权值对图像相似度及文本相似度进行加权计算，得到匹配度。若匹配度大于预设匹配阈值，确定候选图像与查询图像相匹配，输出匹配的提示信息；若匹配度小于或等于预设匹配阈值，确定候选图像与查询图像不匹配，并输出不匹配的提示信息，此处的逻辑回归网络是指用于对查询图像的图像相似度和文本相似度设置权重，并根据权重、图像相似度和文本相似度进行加权求和计算得到匹配度的网络。

进一步，步骤S208之后，还包括以下步骤s51～s53：

s51、若匹配度大于预设匹配阈值，确定候选图像与查询图像相匹配。

s52、从数据库中获取候选图像的候选对象信息。

s53、将候选对象信息确定为目标对象的识别结果，输出目标对象的识别结果。

在步骤s51～s53中，在目标对象识别的应用场景下，若查询图像与候选图像的匹配度大于预设匹配阈值，终端可以确定候选图像与查询图像相匹配，从数据库中获取候选图像的候选对象信息，候选对象可以是指红酒、水果、植物、人物、车辆或工具等，候选对象信息可以是指候选对象的名称、状态或性质等，将候选对象信息确定为目标对象的识别结果，输出目标对象的识别结果。

在一些实施例中，终端可以根据图像相似度确定查询图像与候选图像的匹配度，在另一些实施例中，终端可以根据图像相似度和文本相似度确定查询图像与候选图像的匹配度，具体的，终端可以对查询图像进行检测，若检测到查询图像中存在文本信息，则根据图像相似度和文本相似度确定查询图像与候选图像的匹配度，否则根据图像相似度确定查询图像与候选图像的匹配度。

本发明实施例提供的图像匹配方法用于图像检索或对象识别等场景，请参见图12，以对象识别场景为例进行说明，该场景包括终端，终端包括摄像装置及图像识别应用程序，该图像识别应用程序可以是指具备图像识别功能的浏览器应用程序，或者是指具备图像识别功能的社交应用程序，该图像识别应用程序也可以是指主要用于图像识别的应用程序。该图像识别应用程序可以通过图像匹配来识别图像中的花草、红酒或水果等对象，以识别红酒为例进行说明。该图像识别应用程序包括多个识别选项，如图13所示，该图像识别应用程序包括识别花草、识别红酒或识别水果等的选项，每个选项包括图标和文本中的至少一种，用户可以点击选项的图标或文本来启动相应的功能，该图像匹配方法包括以下步骤S301-S308：

S301、若检测到对红酒的识别请求，调用终端的摄像装置对该红酒进行拍摄得到查询图像。

在需要对红酒的质量进行检测，或为了解红酒的详细信息的场景下，用户可以通过点击图像识别应用程序上的红酒识别选项的图标，向终端发送对红酒识别请求，终端启动红酒识别功能，并调用终端的摄像装置对该红酒进行拍摄得到查询图像，具体的，终端调用终端的摄像装置对该红酒的酒标进行拍摄得到如图14所示的查询图像。

S302、获取该红酒的类型，并从红酒的类型对应的数据库中获取任一个图像作为候选图像。

终端可以获取该红酒的类型，该红酒的类型可以是指酒类或红酒类等，并从红酒的类型对应的数据库中获取任一个图像作为候选图像，该红酒类型对应的数据库中包括多种酒类的酒标图像或多种红酒类的酒标图像，酒标图像中包括红酒的名称或红酒的商标图案等信息。

S303、从查询图像中获取与候选图像存在映射关系的关键点集合，关键点集合包含一个或一个以上的关键点。

S304、对关键点集合中各关键点进行聚类处理得到至少一个映射区域。

S305、根据至少一个映射区域确定查询图像与候选图像之间的匹配度。

S306、若匹配度大于预设匹配阈值，确定候选图像与查询图像相匹配。

在步骤S303～S306中，终端可以通过映射区域来确定查询图像与候选图像的匹配度，若匹配度大于预设匹配阈值，表明查询图像中的酒标与候选图像中的酒标相同，确定候选图像与查询图像相匹配，并执行步骤S307；若匹配度小于或等于预设匹配阈值，表明查询图像中的酒标与候选图像中的酒标不同，确定候选图像与查询图像不匹配，并获取下一个候选图像，将下一个候选图像与查询图像进行比对，若查询图像与数据库中的图像都不匹配，输出匹配失败的提示信息。

S307、从数据库中获取候选图像的候选对象信息。

在确定查询图像与候选图像匹配时，终端可以从数据库中获取候选图像的候选对象信息，该候选对象信息包括候选图像中的红酒的酒标信息，如包括红酒的名称、商标、生产年份、生产地或生产商等等。

S308、将候选对象信息确定为红酒的识别结果，输出红酒的识别结果。

终端可以将候选对象信息确定为红酒的识别结果，输出红酒的识别结果，具体的，终端可以文本或图像的形式显示识别结果，或者如图15所示以文本及图像结合的形式显示识别结果。进一步，在输出识别结果后，终端可以显示定制卡片分享选项及继续识别选项，若检测到用户点击定制卡片分享选项，终端可以根据识别结果生成卡片，并将生成的卡片分享至图像识别应用程序或其他应用程序(如微信或QQ等)；若检测到用户点击继续识别选项，终端可以跳转至如图13所示的界面，供用户选择识别选项。

本发明实施例提供一种图像匹配装置，请参见图16，该装置应用于终端，终端可以是指智能手机、智能手表、机器人或电脑等具备实现图像匹配功能的设备，该图像匹配装置包括：

获取单元401，用于获取查询图像及候选图像；从所述查询图像中获取与所述候选图像存在映射关系的关键点集合，所述关键点集合包含一个或一个以上的关键点。

聚类单元402，用于对所述关键点集合中的各关键点进行聚类处理得到至少一个映射区域。

确定单元403，用于根据所述至少一个映射区域确定所述查询图像与所述候选图像之间的匹配度。

可选的，获取单元401，具体用于若检测到对目标对象的识别请求，调用终端的摄像装置对所述目标对象进行拍摄得到查询图像；获取所述目标对象的类型，并从所述目标对象的类型对应的数据库中获取任一个图像作为候选图像。

可选的，获取单元401，具体用于获取所述查询图像的特征信息及所述候选图像的特征信息，所述特征信息包括至少一个特征点；将所述查询图像的特征信息与所述候选图像的特征信息进行映射比对，从所述查询图像的特征信息中获取与所述候选图像的特征点存在映射关系的一个或一个以上的关键点，所述一个或一个以上的关键点构成所述查询图像的关键点集合。

可选的，聚类单元402，具体用于获取所述关键点集合中的各关键点在所述查询图像中的位置；根据所述各个关键点的位置密度将所述各关键点归类到至少一个点簇；将所述至少一个点簇中各个点簇构成的多边形所对应的区域确定为所述映射区域。

可选的，聚类单元402，具体用于根据所述关键点集合中各关键点的位置，获取任意两个关键点之间的距离；将距离小于预设阈值的任意两个关键点归类至同一个点簇，以将所述关键点集合中各关键点归类为至少一个点簇。

可选的，聚类单元402，具体用于将目标点簇构成的外接多边形所对应的区域确定为所述映射区域，所述目点簇为所述至少一个点簇中的任意点簇，或者，将目标点簇形成的面积小于预设值的内接多边形所对应的区域确定为映射区域。

可选的，所述匹配度包括图像相似度；确定单元403，具体用于获取所述至少一个映射区域的面积总和及所述查询图像的面积；将所述面积总和与所述查询图像的面积之间的比值确定为所述查询图像与所述候选图像的图像相似度。

可选的，所述匹配度包括图像相似度和文本相似度；获取单元401，还用于获取所述至少一个映射区域的面积总和及所述查询图像的面积。

可选的，确定单元402，还用于将所述面积总和与所述查询图像的面积之间的比值确定为所述查询图像与所述候选图像的图像相似度。

可选的，获取单元401，还用于获取所述查询图像与所述候选图像的文本相似度。

可选的，设置单元404，用于为所述图像相似度设置第一权值，并为所述文本相似度设置第二权值。

可选的，计算单元405，用于根据所述第一权值及所述第二权值对所述图像相似度及所述文本相似度进行加权求和计算，得到所述匹配度。

可选的，所述获取单元401，具体用于获取所述查询图像的文本信息及所述候选图像的文本信息，所述文本信息包括至少一个字符；将所述查询图像的文本信息与所述候选图像的文本信息进行比对，从所述查询图像的文本信息中确定与所述候选图像的字符存在相似关系的字符；统计存在相似关系的字符的数量及所述查询图像中的总字符数量；将所述存在相似关系的字符的数量与所述总字符数量之间的比值确定为文本相似度。

可选的，获取单元401，具体用于对所述查询图像的文本信息进行纠正处理，得到所述查询图像的有效文本信息；获取所述查询图像中的第一字符与所述候选图像中第二字符之间的编辑距离，所述第一字符为所述查询图像的有效文本信息中的任一字符，所述第二字符在候选图像的位置信息与所述第一字符在所述查询图像中的位置信息相同；若所述第一字符与所述第二字符之间的编辑距离小于第一预设编辑距离，则确定所述第一字符与所述第二字符存在相似关系。

可选的，获取单元401，具体用于将所述查询图像的文本信息中的字符所组成的文本段与模板库中的文本段进行比较；若所述模板库中存在目标文本段与所组成的文本段之间的编辑距离小于第二预设编辑距离，采用所述目标文本段对所组成的文本段中的字符进行纠正，得到所述查询图像的有效文本信息。

可选的，确定单元402，还用于若所述匹配度大于预设匹配阈值，确定所述候选图像与所述查询图像相匹配。

可选的，获取单元401，还用于从所述数据库中获取所述候选图像的候选对象信息。

可选的，确定单元402，还用于将所述候选对象信息确定为所述目标对象的识别结果。

可选的，输出单元406，用于输出所述目标对象的识别结果。

基于上述图像匹配方法的实施例的描述，本发明实施例提供一种终端，请参见图17，该终端包括：处理器101、输入接口102、输出接口103以及计算机存储介质104。

所述计算机存储介质104可以表示存储装置，包括易失性计算机存储介质(volatile memory)，例如随机存取计算机存储介质(random-access memory，RAM)；计算机存储介质也可以包括非易失性计算机存储介质(non-volatile memory)，例如快闪计算机存储介质(flash memory)，硬盘(hard disk drive，HDD)或固态硬盘(solid-state drive，SSD)；计算机存储介质104还可以包括上述种类的计算机存储介质的组合。

所述输入接口102可用于输入等待进行处理的待处理数据至处理器101。在一个实施例中，输入接口102可以包括多个独立的接口，例如以太网接口、LCD(Liquid CrystalDisplay，液晶显示器)接口等，分别负责不同外围设备向处理器101输入数据的通信。

所述输出接口103可用于输出数据至其他与终端相连的外围设备，可以向外输出处理器101的处理结果。输出接口103还可以包括多个独立的接口，例如以太网接口、camera接口等，负责处理器101向不同外围设备输出数据的通信。

在一个实施例中，输出接口103以及输入接口102可以是通用输入输出(GeneralPurpose Input Output，GPIO)接口。

所述处理器101可用于读取和执行计算机指令。在一个实施例中，处理器701还可以进一步包括硬件芯片。上述硬件芯片可以是专用集成电路(application-specificintegrated circuit，ASIC)，可编程逻辑器件(programmable logic device，PLD)或其组合。上述PLD可以是复杂可编程逻辑器件(complex programmable logic device，CPLD)，现场可编程逻辑门阵列(field-programmable gate array，FPGA)，通用阵列逻辑(genericarray logic,GAL)或其任意组合。

所述计算机存储介质104还用于存储一条或一条以上的程序指令；所述处理器101可以调用所述一条或一条以上的程序指令时能够执图像匹配方法以实现图像匹配，具体地，所述处理器101调用程序指令执行如下步骤：

获取查询图像及候选图像；

可选的，所述处理器101可以调用所述程序指令，执行如下步骤：

若检测到对目标对象的识别请求，调用终端的摄像装置对所述目标对象进行拍摄得到查询图像；

获取所述目标对象的类型，并从所述目标对象的类型对应的数据库中获取任一个图像作为候选图像。

获取所述查询图像的特征信息及所述候选图像的特征信息，所述特征信息包括至少一个特征点；

将所述查询图像的特征信息与所述候选图像的特征信息进行映射比对，从所述查询图像的特征信息中获取与所述候选图像的特征点存在映射关系的一个或一个以上的关键点，所述一个或一个以上的关键点构成所述查询图像的关键点集合。

获取所述关键点集合中的各关键点在所述查询图像中的位置；

根据所述各个关键点的位置密度将所述各关键点归类到至少一个点簇；

将所述至少一个点簇中各个点簇构成的多边形所对应的区域确定为所述映射区域。

可选的，执行如下步骤：

根据所述关键点集合中各关键点的位置，获取任意两个关键点之间的距离；

将距离小于预设阈值的任意两个关键点归类至同一个点簇，以将所述关键点集合中各关键点归类为至少一个点簇。

将目标点簇构成的外接多边形所对应的区域确定为所述映射区域，所述目点簇为所述至少一个点簇中的任意点簇，或者，

将目标点簇形成的面积小于预设值的内接多边形所对应的区域确定为映射区域。

可选的，所述匹配度包括图像相似度；所述处理器101可以调用所述程序指令，执行如下步骤：

获取所述至少一个映射区域的面积总和及所述查询图像的面积；

将所述面积总和与所述查询图像的面积之间的比值确定为所述查询图像与所述候选图像的图像相似度。

可选的，所述匹配度包括图像相似度和文本相似度；所述处理器101可以调用所述程序指令，执行如下步骤：

将所述面积总和与所述查询图像的面积之间的比值确定为所述查询图像与所述候选图像的图像相似度；

获取所述查询图像与所述候选图像的文本相似度；

为所述图像相似度设置第一权值，并为所述文本相似度设置第二权值；

根据所述第一权值及所述第二权值对所述图像相似度及所述文本相似度进行加权求和计算，得到所述匹配度。

获取所述查询图像的文本信息及所述候选图像的文本信息，所述文本信息包括至少一个字符；

将所述查询图像的文本信息与所述候选图像的文本信息进行比对，从所述查询图像的文本信息中确定与所述候选图像的字符存在相似关系的字符；

统计存在相似关系的字符的数量及所述查询图像中的总字符数量；

将所述存在相似关系的字符的数量与所述总字符数量之间的比值确定为文本相似度。

对所述查询图像的文本信息进行纠正处理，得到所述查询图像的有效文本信息；

获取所述查询图像中的第一字符与所述候选图像中第二字符之间的编辑距离，所述第一字符为所述查询图像的有效文本信息中的任一字符，所述第二字符在候选图像的位置信息与所述第一字符在所述查询图像中的位置信息相同；

若所述第一字符与所述第二字符之间的编辑距离小于第一预设编辑距离，则确定所述第一字符与所述第二字符存在相似关系。

将所述查询图像的文本信息中的字符所组成的文本段与模板库中的文本段进行比较；

若所述模板库中存在目标文本段与所组成的文本段之间的编辑距离小于第二预设编辑距离，采用所述目标文本段对所组成的文本段中的字符进行纠正，得到所述查询图像的有效文本信息。

若所述匹配度大于预设匹配阈值，确定所述候选图像与所述查询图像相匹配；

从所述数据库中获取所述候选图像的候选对象信息；

将所述候选对象信息确定为所述目标对象的识别结果；

输出所述目标对象的识别结果。

还需要说明的是，本发明的终端对应的功能既可以通过硬件设计实现，也可以通过软件设计来实现，还可以通过软硬件结合的方式来实现，在此不作限制。本发明实施例还提供一种计算机程序产品，所述计算机程序产品包括存储了计算机程序的计算机存储介质，当其在计算机上运行时，所述计算机执行如上述方法实施例中记载的任何一种图像匹配方法的部分或全部步骤。在一个实施例中，该计算机程序产品可以为一个软件安装包。

以上所揭露的仅为本发明部分实施例而已，当然不能以此来限定本发明之权利范围，因此依本发明权利要求所作的等同变化，仍属本发明所涵盖的范围。

Claims

1.一种图像匹配方法，其特征在于，包括：

获取查询图像及候选图像；

2.如权利要求1所述的方法，其特征在于，所述获取查询图像及候选图像，包括：

3.如权利要求1所述的方法，其特征在于，所述从所述查询图像中获取与所述候选图像存在映射关系的关键点集合，包括：

4.如权利要求3所述的方法，其特征在于，所述对所述关键点集合中的各关键点进行聚类处理得到至少一个映射区域，包括：

5.如权利要求4所述的方法，其特征在于，所述根据所述各个关键点的位置密度将所述各关键点归类到至少一个点簇，包括：

6.如权利要求4所述的方法，其特征在于，所述将所述至少一个点簇中各个点簇构成的多边形所对应的区域确定为所述映射区域，包括：

7.如权利要求1-6任一项所述的方法，其特征在于，所述匹配度包括图像相似度；所述根据所述至少一个映射区域确定所述查询图像与所述候选图像之间的匹配度，包括：

8.如权利要求1-6任一项所述的方法，其特征在于，所述匹配度包括图像相似度和文本相似度；还包括：

获取所述查询图像与所述候选图像的文本相似度；

9.如权利要求8所述的方法，其特征在于，所述获取所述查询图像与所述候选图像的文本相似度，包括：

10.如权利要求9所述的方法，其特征在于，所述从所述查询图像的文本信息中确定与所述候选图像的字符存在相似关系的字符，包括：

11.如权利要求10所述的方法，其特征在于，所述对所述查询图像的文本信息进行纠正处理，得到所述查询图像的有效文本信息，包括：

12.如权利要求2所述的方法，其特征在于，还包括：

从所述数据库中获取所述候选图像的候选对象信息；

将所述候选对象信息确定为所述目标对象的识别结果；

输出所述目标对象的识别结果。

13.一种图像匹配装置，其特征在于，包括：

14.一种计算机存储介质，其特征在于，所述计算机存储介质存储有一条或一条以上指令，所述一条或一条以上指令适于由处理器加载并执行如权利要求1-12任一项所述的图像匹配方法。

15.一种终端，其特征在于，包括：

处理器，适于实现一条或一条以上指令；以及，

计算机存储介质，所述计算机存储介质存储有一条或一条以上指令，所述一条或一条以上指令适于由处理器加载并执行如权利要求1-12任一项所述的图像匹配方法。