CN111522986B

CN111522986B - 图像检索方法、装置、设备和介质

Info

Publication number: CN111522986B
Application number: CN202010327963.8A
Authority: CN
Inventors: 任晖; 杨敏; 薛学通
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2020-04-23
Filing date: 2020-04-23
Publication date: 2023-10-10
Anticipated expiration: 2040-04-23
Also published as: KR20210040307A; EP3825916A3; JP2021103570A; US20210209408A1; CN111522986A; EP3825916A2; US11836186B2

Abstract

本申请实施例公开了一种图像检索方法、装置、设备和介质，涉及智能搜索技术。其中，该方法包括：利用预设神经网络模型，提取待检索图像的全局特征和局部特征，以及提取待召回图像的全局特征和局部特征；通过待检索图像和待召回图像之间的全局特征匹配和局部特征匹配，确定候选图像集合；通过对待检索图像和候选图像集合中的候选图像进行局部特征验证，从候选图像集合中确定检索结果。本申请实施例可以提高针对大量数据库图像的情况下图像检索的准确率，同时保证检索效率。

Description

图像检索方法、装置、设备和介质

技术领域

本申请实施例涉及计算机技术，具体涉及智能搜索技术，尤其涉及一种图像检索方法、装置、设备和介质。

背景技术

图像检索是指在一定数据量的图像库中，找到和用户请求图像(或称为待检索图像)上的物体完全相同的图像结果，或者找到和用户请求图像完全相同的图像。目前，图像检索比较常见的方案包括：基于图像特征描述子提取图像特征的检索方法，以及利用卷积神经网络模型提取图像的全局特征，用于图像检索的方法。

然而，利用图像特征描述子提取图像特征，通常适用于图像之间的角度和光照变化不是非常大的情况，并且当图像数量较大时，检索效率以及准确率均得不到保证；基于卷积神经网络模型的现有图像检索方法，虽然检索效率比较高，但是检索准确性并不理想。

发明内容

本申请实施例公开一种图像检索方法、装置、设备和介质，以提高针对大量数据库图像的情况下图像检索的准确率，同时保证检索效率。

第一方面，本申请实施例公开了一种图像检索方法，包括：

利用预设神经网络模型，提取待检索图像的全局特征和局部特征，以及提取待召回图像的全局特征和局部特征；

通过所述待检索图像和所述待召回图像之间的全局特征匹配和局部特征匹配，确定候选图像集合；

通过对所述待检索图像和所述候选图像集合中的候选图像进行局部特征验证，从所述候选图像集合中确定检索结果。

第二方面，本申请实施例还公开了一种图像检索装置，包括：

特征提取模块，用于利用预设神经网络模型，提取待检索图像的全局特征和局部特征，以及提取待召回图像的全局特征和局部特征；

特征匹配模块，用于通过所述待检索图像和所述待召回图像之间的全局特征匹配和局部特征匹配，确定候选图像集合；

检索结果确定模块，用于通过对所述待检索图像和所述候选图像集合中的候选图像进行局部特征验证，从所述候选图像集合中确定检索结果。

第三方面，本申请实施例还公开了一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行如本申请实施例任一所述的图像检索方法。

第四方面，本申请实施例还公开了一种存储有计算机指令的非瞬时计算机可读存储介质，所述计算机指令用于使所述计算机执行如本申请实施例任一所述的图像检索方法。

根据本申请实施例的技术方案，通过在图像检索过程中，利用预设神经网络模型同时提取图像的全局特征和局部特征，根据图像全局特征和局部特征得到初步的图像检索结果，然后通过引入图像局部特征校验，得到最终的图像检索结果，解决了现有图像检索的准确率较低的问题，提高了针对大量数据库图像的情况下图像检索的准确率，同时保证了检索效率。

应当理解，本部分所描述的内容并非旨在标识本申请的实施例的关键或重要特征，也不用于限制本申请的范围。本申请的其它特征将通过以下的说明书而变得容易理解。

附图说明

附图用于更好地理解本方案，不构成对本申请的限定。其中：

图1是根据本申请实施例公开的一种图像检索方法的流程图；

图2是根据本申请实施例公开的一种图像检索方法的架构示意图；

图3是根据本申请实施例公开的另一种图像检索方法的流程图；

图4是根据本申请实施例公开的又一种图像检索方法的流程图；

图5是根据本申请实施例公开的一种图像检索装置的结构示意图；

图6是根据本申请实施例公开的一种电子设备的框图。

具体实施方式

以下结合附图对本申请的示范性实施例做出说明，其中包括本申请实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本申请的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。

图1是根据本申请实施例公开的一种图像检索方法的流程图，本申请实施例可以适用于基于用户输入的请求图像进行图像检索或搜索的情况，该方法可以由图像检索装置来执行，该装置可以采用软件和/或硬件实现，并可集成在任意的具有计算能力的电子设备上，例如服务器等。

示例性的，存在相同或相似图像检索需求的场景可以包括但不限于：

1)特定单位或公司的重复图片审核。例如保险公司的不同客户使用相同的图像，通过图像编辑处理替换上不同的车辆，从而达到骗取保险金额的目的，保险公司便存在检索出包含相同车辆的图像的需求。

2)高清原图替换。使用检索系统，检索出数据库中低分辨率图像对应的高清图像，从而利用高清图像替换掉低分辨率图像。

如图1所示，本申请实施例公开的图像检索方法可以包括：

S101、利用预设神经网络模型，提取待检索图像的全局特征和局部特征，以及提取待召回图像的全局特征和局部特征。

其中，预设神经网络模型是预先训练的用于提取图像的全局特征和局部特征的网络模型，具体可以基于卷积神经网络(Convolutional Neural Networks，CNN)实现。关于具有图像特征提取功能的网络模型的具体训练过程，本申请实施例不作限定，可以参照图像处理领域中现有模型训练原理实现。

本申请实施例中利用相同的神经网络模型对待检索图像和待召回图像进行特征处理，待召回图像即指数据库中的图像资源。任意图像的全局特征可以使用一个定长的向量来表示，例如任一张图像对应一个256维度的向量。任意图像的局部特征可以使用预设数量的特征点来表示，例如任一张图像对应600个点以内的特征点，每个点是64bit的描述空间，所以图像的局部特征可以表示为维度为[600，64]的一个矩阵。具体的，局部特征对应图像上存在的特定物体对象，例如，一张包含红酒杯的图像，该图像的局部特征可以用于表征该红酒杯在图像上的位置。

S102、通过待检索图像和待召回图像之间的全局特征匹配和局部特征匹配，确定候选图像集合。

具体的，可以首先通过全局特征匹配，对待召回图像进行初步筛选，然后通过局部特征匹配，对初步筛选的图像集合进一步进行筛选，即精细化对比图像的相似性，从而得到候选图像集合。示例性的，通过待检索图像和待召回图像之间的全局特征匹配和局部特征匹配，确定候选图像集合，可以包括：通过待检索图像和待召回图像之间的全局特征匹配，确定召回图像集合；通过待检索图像和召回图像集合中召回图像之间的局部特征匹配，确定候选图像集合。候选图像集合即相当于本申请实施例中初步确定的图像检索结果。

不同图像之间的全局特征匹配可以通过计算向量之间的距离实现，例如余弦距离计算等，如果两个向量之间距离小于第一距离阈值，则可以认为对应的两张图像之间的全局特征匹配成功，如果两个向量之间距离大于或等于第一距离阈值，则可以认为对应的两张图像之间的全局特征匹配不成功。不同图像的之间的局部特征匹配也可以通过特征点之间的距离计算来实现，例如满足特征距离小于第二距离阈值的特征点对的数量大于或等于数量阈值，则可以认为两张图像之间的局部特征匹配成功，否则，局部特征不匹配。其中，第一距离阈值、第二距离阈值以及数量阈值均可以根据需求进行灵活设置。在图像检索过程中，通过综合考虑图像的全局特征和精细化的局部特征，有助于提高图像检索的准确率。

可选的，在通过待检索图像和待召回图像之间的全局特征匹配，确定召回图像集合之前，本申请实施例公开的方法还可以包括：对待检索图像和待召回图像的全局特征进行压缩处理。例如，现有方案中图像的全局特征通常采用浮点(float)类型进行存储，并用于余弦距离计算中；本申请实施例通过特征压缩处理，将浮点类型的全局特征压缩为字符(char)类型，例如可以把每一个float表达空间，量化压缩到[-127，128]的表达空间，把原本float大小的特征，压缩到每一位特征占有1byte的大小，使得特征存储空间占用大小为原来的1/4，即特征压缩处理后，全局特征的存储空间只需要原来的1/4。尤其在超大规模(千万量级以上)检索系统中，通过图像特征压缩处理，可以减少特征占用的存储空间，减少特征匹配的耗时，有助于提高图像检索的速度，优化检索性能。

S103、通过对待检索图像和候选图像集合中的候选图像进行局部特征验证，从候选图像集合中确定检索结果。

局部特征校验旨在对候选图像集合中的候选图像和待检索图像是否显示相同的物体，或者候选图像和待检索图像是否属于相同图像进行进一步的验证。局部特征校验可以采用区别于图像局部特征匹配时采用的局部特征匹配方式来实现，例如，可以基于待检索图像和待召回图像上特征点之间的几何一致性校验思想来实现。

在现有检索系统中，通常为了确保较高的图像召回率，便选择牺牲检索准确率而忽略局部特征的进一步验证，本申请实施例则是首选考虑图像检索准确性，在确保检索准确率的基础上提升图像检索的召回率。

图2是根据本申请实施例公开的一种图像检索方法的架构示意图，不应理解为对本申请实施例的具体限定。如图2所示，在图像检索之前，需要进行图像的全局特征训练和局部特征训练，得到图像特征提取模型(即前述预设神经网络模型)，将数据库图像(即待召回图像)和用户请求图像(即待检索图像)作为输入，经模型处理，得到数据库图像和用户请求图像的全局特征以及局部特征，然后结合图像几何校验，得到与用户请求图像相匹配的检索结果，进而将检索结果反馈给用户。

根据本申请实施例的技术方案，通过在图像检索过程中，利用预设神经网络模型同时提取图像的全局特征和局部特征，相比于利用图像特征描述子提取图像特征，例如规则的SIFT描述子等，利用神经网络模型提取图像全局特征和局部特征，适用的图像类型更加广泛，即使图像在拍摄光照和拍摄角度上存在较大差异，神经网络模型也可以有效地提取出图像特征，为后续实现较高性能的图像检索奠定基础；通过同时考虑图像全局特征和局部特征得到初步的图像检索结果，然后通过引入图像局部特征校验，得到最终的图像检索结果，解决了现有图像检索的准确率较低的问题，提高了针对大量数据库图像的情况下图像检索的准确率，同时保证了检索效率，进而实现了较高的检索性能。

在上述技术方案的基础上，可选的，利用预设神经网络模型，提取待检索图像的全局特征和局部特征，以及提取待召回图像的全局特征和局部特征，包括：

利用残差神经网络模型，分别提取待检索图像和待召回图像的全局特征；

利用残差神经网络模型和注意力(attention)模型，分别提取待检索图像和待召回图像的局部特征。

示例性的，在提取图像全局特征的过程中，可以利用深度残差网络ResNet50_vd模型来实现，在该模型训练过程中，使用的损失(Loss)函数是arcmargin损失函数。相比于现有检索系统中，一般使用Softmax训练模型，使用交差熵损失函数无法拉开特征类间距离，无法缩小类内距离，通过采用arcmargin损失函数，在特征分类之间加入一定的类间距离(margin)，可以提高全局卷积神经网络模型的训练精度，进而确保特征提取的准确性。

进一步的，在提取待检索图像和待召回图像的局部特征的过程中，残差神经网络模型的输出层作为注意力模型的输入层。例如，可以在固定resnet50 backbone基础之上，利用conv3层的输入，接上attention层次，从而在特征图(feature map)上达到选择特征点的目的。区别于现有方案中利用图像上框选出的特定兴趣区域提取局部特征，本申请实施例直接基于完整图像对应的特征图选择局部特征点，确保了局部特征提取的准确性、可靠性。

在针对提取图像局部特征的模型训练过程中，本申请实施例采用特征分类信息，指导残差神经网络的特征输出层自动学习每个特征类别的聚焦区域，然后利用注意力模型，自动从残差神经网络的输出层提取响应高的特征点。关于注意力模型的具体实现，可以参考现有注意力模型的实现原理，本申请实施例对此不作赘述。

此外，需要说明的是，待检索图像和待召回图像的全局特征以及局部特征，可以同时提取得到，也可以不同时提取，本申请实施例不作具体限定。例如，可以在通过待检索图像和待召回图像之间的全局特征匹配，确定召回图像集合之后，再提取召回图像集合中的图像和待检索图像的局部特征。

图3是根据本申请实施例公开的另一种图像检索方法的流程图，基于上述技术方案进一步优化与扩展，并可以与上述各个可选实施方式进行结合。如图3所示，该方法可以包括：

S301、利用预设神经网络模型，提取待检索图像的全局特征和局部特征，以及提取待召回图像的全局特征和局部特征。

S302、通过待检索图像和待召回图像之间的全局特征匹配和局部特征匹配，确定候选图像集合。

其中，候选图像集合即相当于本申请实施例中初步确定的图像检索结果。

S303、确定待检索图像的局部特征和候选图像集合中候选图像的局部特征之间的特征匹配点。

示例性的，可以利用任意可用的特征点距离计算公式，计算待检索图像的局部特征点和候选图像集合中候选图像的局部特征点之间的距离，将距离小于第二距离阈值的特征点对确定为待检索图像和待召回图像的特征匹配点。该第二距离阈值的具体取值可以适应性设置。

S304、根据待检索图像和候选图像之间局部特征的相对位置关系，确定待检索图像和候选图像之间的特征变换矩阵。

即可以利用统计思想，根据待检索图像和候选图像之间局部特征的相对位置关系，确定待检索图像和候选图像上大部分局部特征点满足的特征变换矩阵，然后确定满足该特征变换矩阵的匹配特征点的数量。示例性的，可以基于随机抽样一致算法(RandomSample Consensus，RANSAC)，利用findHomography函数确定待检索图像和候选图像之间的特征变换矩阵。

S305、根据候选图像的特征匹配点中满足特征变换矩阵的匹配点数量，从候选图像集合中确定检索结果。

候选图像上满足特征变换矩阵的匹配点越多，则该候选图像与待检索图像存在相同物体，或者该候选图像与待检索图像属于相同图像的概率越大。示例性的，在确定各候选图像的特征匹配点中满足特征变换矩阵的匹配点数量之后，按照数量由大到小进行排序，将排序在前的预设数量的候选图像确定为检索结果；或者，将满足特征变换矩阵的匹配点的数量大于数量阈值的候选图像，确定为检索结果。

根据本申请实施例的技术方案，通过在图像检索过程中，利用预设神经网络模型同时提取图像的全局特征和局部特征，相比于利用图像特征描述子提取图像特征，适用的图像类型更加广泛，可以有效地提取出图像特征，为后续实现较高性能的图像检索奠定基础；通过同时考虑图像全局特征和局部特征确定候选图像集合，然后根据候选图像的特征匹配点中满足特征变换矩阵的匹配点数量，得到最终的图像检索结果，解决了现有图像检索的准确率较低的问题，提高了针对大量数据库图像的情况下图像检索的准确率，同时保证了检索效率，进而实现了较高检索性能。

图4是根据本申请实施例公开的又一种图像检索方法的流程图，基于上述技术方案进一步优化与扩展，并可以与上述各个可选实施方式进行结合。如图4所示，该方法可以包括：

S401、利用预设神经网络模型，提取待检索图像的全局特征和局部特征，以及提取待召回图像的全局特征和局部特征。

S402、根据待召回图像的全局特征，对待召回图像进行层次聚类处理，得到至少一个图像聚类集合。

层次聚类处理是指对待召回图像的全局特征分布进行多层级的聚类，这有助于提高图像检索的速度。层次聚类处理包括但不限于利用两级k均值聚类算法(kmeans)进行聚类处理，通过两级kmeans聚类，可以使得图像聚类的结果更均匀，可以加速检索效果和效率。例如，依据待召回图像的全局特征，利用两级kmeans算法对大量待召回图像进行聚类，首先聚类出200个初级码本中心，在各个初级码本中心中各有200个次级中心用于第二级聚类。

S403、根据图像聚类集合对应的聚类中心特征与待检索图像的全局特征之间的特征距离，从至少一个图像聚类集合中确定目标聚类集合。

例如，可以将聚类中心特征与待检索图像的全局特征之间的特征距离小于特征距离阈值的图像聚类集合，确定为目标聚类集合，优选聚类中心与待检索图像的特征距离最近邻的图像聚类集合作为目标聚类集合。聚类中心特征与待检索图像的特征距离越近，图像聚类集合中图像与待检索图像相同或相似的概率越大。

S404、通过目标聚类集合中图像与待检索图像之间的全局特征匹配，确定召回图像集合。

筛选出目标聚类集合之后，便可以只对该集合中的图像与待检索图像进行全局特征匹配，从而减少了参与全局特征匹配的图像数量，提高了图像检索速度，保证了检索实时性。

并且，在对待召回图像进行层次聚类处理之前，可以对待召回图像的全局图像进行压缩处理，减小全局特征的存储空间，减少特征匹配耗时，达到进一步提高检索速度、优化检索性能的效果。

S405、通过待检索图像和召回图像集合中召回图像之间的局部特征匹配，确定候选图像集合。

S406、通过对待检索图像和候选图像集合中的候选图像进行局部特征验证，从候选图像集合中确定检索结果。

根据本申请实施例的技术方案，在图像检索过程中，利用预设神经网络模型同时提取图像的全局特征和局部特征，并依据全局特征对待召回图像进行层次聚类处理，然后基于聚类结果，同时考虑图像全局特征和局部特征得到初步的图像检索结果，最后通过引入图像局部特征校验，得到最终的图像检索结果，解决了现有图像检索的准确率较低的问题，提高了针对大量数据库图像的情况下图像检索的准确率，同时通过聚类处理进一步加速了检索速度，保证了检索实时性，进而实现了较高检索性能。

图5是根据本申请实施例公开的一种图像检索装置的结构示意图，本申请实施例可以适用于基于用户输入的请求图像进行图像检索或搜索的情况。该装置可以采用软件和/或硬件实现，并可集成在任意的具有计算能力的电子设备上，例如服务器等。

如图5所示，本申请实施例公开的图像检索装置500可以包括特征提取模块501、特征匹配模块502和检索结果确定模块503，其中：

特征提取模块501，用于利用预设神经网络模型，提取待检索图像的全局特征和局部特征，以及提取待召回图像的全局特征和局部特征；

特征匹配模块502，用于通过待检索图像和待召回图像之间的全局特征匹配和局部特征匹配，确定候选图像集合；

检索结果确定模块503，用于通过对待检索图像和候选图像集合中的候选图像进行局部特征验证，从候选图像集合中确定检索结果。

可选的，特征提取模块501包括：

全局特征提取单元，用于利用残差神经网络模型，分别提取待检索图像和待召回图像的全局特征；

局部特征提取单元，用于利用残差神经网络模型和注意力模型，分别提取待检索图像和待召回图像的局部特征。

可选的，在提取待检索图像和待召回图像的局部特征的过程中，残差神经网络模型的输出层作为注意力模型的输入层。

可选的，检索结果确定模块503包括：

匹配点确定单元，用于确定待检索图像的局部特征和候选图像集合中候选图像的局部特征之间的特征匹配点；

变换矩阵确定单元，用于根据待检索图像和候选图像之间局部特征的相对位置关系，确定待检索图像和候选图像之间的特征变换矩阵；

检索结果确定单元，用于根据候选图像的特征匹配点中满足特征变换矩阵的匹配点数量，从候选图像集合中确定检索结果。

可选的，特征匹配模块502包括：

召回图像集合确定单元，用于通过待检索图像和待召回图像之间的全局特征匹配，确定召回图像集合；

候选图像集合确定单元，用于通过待检索图像和召回图像集合中召回图像之间的局部特征匹配，确定候选图像集合。

可选的，召回图像集合确定单元包括：

聚类处理子单元，用于根据待召回图像的全局特征，对待召回图像进行层次聚类处理，得到至少一个图像聚类集合；

目标聚类集合确定子单元，用于根据图像聚类集合对应的聚类中心特征与待检索图像的全局特征之间的特征距离，从至少一个图像聚类集合中确定目标聚类集合；

召回图像集合确定子单元，用于通过目标聚类集合中图像与待检索图像之间的全局特征匹配，确定召回图像集合。

可选的，特征匹配模块502还包括：

特征压缩单元，用于在召回图像集合确定单元执行通过待检索图像和待召回图像之间的全局特征匹配，确定召回图像集合的操作之前，对待检索图像和待召回图像的全局特征进行压缩处理。

本申请实施例所公开的图像检索装置500可执行本申请实施例所公开的任一图像检索方法，具备执行方法相应的功能模块和有益效果。本申请装置实施例中未详尽描述的内容可以参考本申请任意方法实施例中的描述。

根据本申请的实施例，本申请实施例还提供了一种电子设备和一种可读存储介质。

如图6所示，图6是用于实现本申请实施例中图像检索方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本申请实施例的实现。

如图6所示，该电子设备包括：一个或多个处理器601、存储器602，以及用于连接各部件的接口，包括高速接口和低速接口。各个部件利用不同的总线互相连接，并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理，包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如，耦合至接口的显示设备)上显示图形用户界面(Graphical User Interface，GUI)的图形信息的指令。在其它实施方式中，若需要，可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样，可以连接多个电子设备，各个设备提供部分必要的操作，例如，作为服务器阵列、一组刀片式服务器、或者多处理器系统。图6中以一个处理器601为例。

存储器602即为本申请实施例所提供的非瞬时计算机可读存储介质。其中，所述存储器存储有可由至少一个处理器执行的指令，以使所述至少一个处理器执行本申请实施例所提供的图像检索方法。本申请实施例的非瞬时计算机可读存储介质存储计算机指令，该计算机指令用于使计算机执行本申请实施例所提供的图像检索方法。

存储器602作为一种非瞬时计算机可读存储介质，可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块，如本申请实施例中图像检索方法对应的程序指令/模块，例如，附图5所示的特征提取模块501、特征匹配模块502和检索结果确定模块503。处理器601通过运行存储在存储器602中的非瞬时软件程序、指令以及模块，从而执行电子设备的各种功能应用以及数据处理，即实现上述方法实施例中的图像检索方法。

存储器602可以包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需要的应用程序；存储数据区可存储根据电子设备的使用所创建的数据等。此外，存储器602可以包括高速随机存取存储器，还可以包括非瞬时存储器，例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中，存储器602可选包括相对于处理器601远程设置的存储器，这些远程存储器可以通过网络连接至用于实现本实施例中图像检索方法的电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

用于实现本申请实施例中图像检索方法的电子设备还可以包括：输入装置603和输出装置604。处理器601、存储器602、输入装置603和输出装置604可以通过总线或者其他方式连接，图6中以通过总线连接为例。

输入装置603可接收输入的数字或字符信息，以及产生与用于实现本实施例中图像检索方法的电子设备的用户设置以及功能控制有关的键信号输入，例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置604可以包括显示设备、辅助照明装置和触觉反馈装置等，其中，辅助照明装置例如发光二极管(Light Emitting Diode，LED)；触觉反馈装置例如，振动电机等。该显示设备可以包括但不限于，液晶显示器(Liquid Crystal Display，LCD)、LED显示器和等离子体显示器。在一些实施方式中，显示设备可以是触摸屏。

此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用集成电路(Application Specific Integrated Circuit，ASIC)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

这些计算程序，也称作程序、软件、软件应用、或者代码，包括可编程处理器的机器指令，并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的，术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置，例如，磁盘、光盘、存储器、可编程逻辑装置(Programmable Logic Device，PLD)，包括，接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。

为了提供与用户的交互，可以在计算机上实施此处描述的系统和技术，该计算机具有：用于向用户显示信息的显示装置，例如，阴极射线管(Cathode Ray Tube，CRT)或者LCD监视器；以及键盘和指向装置，例如，鼠标或者轨迹球，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈，例如，视觉反馈、听觉反馈、或者触觉反馈；并且可以用任何形式，包括声输入、语音输入或者、触觉输入，来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统，例如，作为数据服务器，或者实施在包括中间件部件的计算系统，例如，应用服务器，或者实施在包括前端部件的计算系统，例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互，或者实施在包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信，例如通信网络，来将系统的部件相互连接。通信网络的示例包括：局域网(Local Area Network，LAN)、广域网(Wide Area Network，WAN)、和互联网。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本申请公开的技术方案所期望的结果，本文在此不进行限制。

上述具体实施方式，并不构成对本申请保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等，均应包含在本申请保护范围之内。

Claims

1.一种图像检索方法，其特征在于，包括：

其中，所述全局特征匹配通过计算向量之间的距离实现，如果两个向量之间距离小于第一距离阈值，则认为对应的两张图像之间的全局特征匹配成功；

所述局部特征匹配通过特征点之间的距离计算来实现，满足特征距离小于第二距离阈值的特征点对的数量大于或等于数量阈值，则认为两张图像之间的局部特征匹配成功；

2.根据权利要求1所述的方法，其特征在于，利用预设神经网络模型，提取待检索图像的全局特征和局部特征，以及提取待召回图像的全局特征和局部特征，包括：

利用残差神经网络模型，分别提取所述待检索图像和所述待召回图像的全局特征；

利用所述残差神经网络模型和注意力模型，分别提取所述待检索图像和所述待召回图像的局部特征。

3.根据权利要求2所述的方法，其特征在于，在提取所述待检索图像和所述待召回图像的局部特征的过程中，所述残差神经网络模型的输出层作为所述注意力模型的输入层。

4.根据权利要求1所述的方法，其特征在于，通过对所述待检索图像和所述候选图像集合中的候选图像进行局部特征验证，从所述候选图像集合中确定检索结果，包括：

确定所述待检索图像的局部特征和所述候选图像集合中候选图像的局部特征之间的特征匹配点；

根据所述待检索图像和所述候选图像之间局部特征的相对位置关系，确定所述待检索图像和所述候选图像之间的特征变换矩阵；

根据所述候选图像的特征匹配点中满足所述特征变换矩阵的匹配点数量，从所述候选图像集合中确定所述检索结果。

5.根据权利要求1所述的方法，其特征在于，通过所述待检索图像和所述待召回图像之间的全局特征匹配和局部特征匹配，确定候选图像集合，包括：

通过所述待检索图像和所述待召回图像之间的全局特征匹配，确定召回图像集合；

通过所述待检索图像和所述召回图像集合中召回图像之间的局部特征匹配，确定所述候选图像集合。

6.根据权利要求5所述的方法，其特征在于，通过所述待检索图像和所述待召回图像之间的全局特征匹配，确定召回图像集合，包括：

根据所述待召回图像的全局特征，对所述待召回图像进行层次聚类处理，得到至少一个图像聚类集合；

根据所述图像聚类集合对应的聚类中心特征与所述待检索图像的全局特征之间的特征距离，从所述至少一个图像聚类集合中确定目标聚类集合；

通过所述目标聚类集合中图像与所述待检索图像之间的全局特征匹配，确定所述召回图像集合。

7.根据权利要求5所述的方法，其特征在于，在通过所述待检索图像和所述待召回图像之间的全局特征匹配，确定召回图像集合之前，所述方法还包括：

对所述待检索图像和所述待召回图像的全局特征进行压缩处理。

8.一种图像检索装置，其特征在于，包括：

所述特征匹配模块，具体用于通过计算向量之间的距离实现所述全局特征匹配，如果两个向量之间距离小于第一距离阈值，则认为对应的两张图像之间的全局特征匹配成功；

通过特征点之间的距离计算来实现所述局部特征匹配，满足特征距离小于第二距离阈值的特征点对的数量大于或等于数量阈值，则认为两张图像之间的局部特征匹配成功；

9.根据权利要求8所述的装置，其特征在于，所述特征提取模块包括：

全局特征提取单元，用于利用残差神经网络模型，分别提取所述待检索图像和所述待召回图像的全局特征；

局部特征提取单元，用于利用所述残差神经网络模型和注意力模型，分别提取所述待检索图像和所述待召回图像的局部特征。

10.根据权利要求9所述的装置，其特征在于，在提取所述待检索图像和所述待召回图像的局部特征的过程中，所述残差神经网络模型的输出层作为所述注意力模型的输入层。

11.根据权利要求8所述的装置，其特征在于，所述检索结果确定模块包括：

匹配点确定单元，用于确定所述待检索图像的局部特征和所述候选图像集合中候选图像的局部特征之间的特征匹配点；

变换矩阵确定单元，用于根据所述待检索图像和所述候选图像之间局部特征的相对位置关系，确定所述待检索图像和所述候选图像之间的特征变换矩阵；

检索结果确定单元，用于根据所述候选图像的特征匹配点中满足所述特征变换矩阵的匹配点数量，从所述候选图像集合中确定所述检索结果。

12.根据权利要求8所述的装置，其特征在于，所述特征匹配模块包括：

召回图像集合确定单元，用于通过所述待检索图像和所述待召回图像之间的全局特征匹配，确定召回图像集合；

候选图像集合确定单元，用于通过所述待检索图像和所述召回图像集合中召回图像之间的局部特征匹配，确定所述候选图像集合。

13.根据权利要求12所述的装置，其特征在于，所述召回图像集合确定单元包括：

聚类处理子单元，用于根据所述待召回图像的全局特征，对所述待召回图像进行层次聚类处理，得到至少一个图像聚类集合；

目标聚类集合确定子单元，用于根据所述图像聚类集合对应的聚类中心特征与所述待检索图像的全局特征之间的特征距离，从所述至少一个图像聚类集合中确定目标聚类集合；

召回图像集合确定子单元，用于通过所述目标聚类集合中图像与所述待检索图像之间的全局特征匹配，确定所述召回图像集合。

14.根据权利要求12所述的装置，其特征在于，所述特征匹配模块还包括：

特征压缩单元，用于在所述召回图像集合确定单元执行通过所述待检索图像和所述待召回图像之间的全局特征匹配，确定召回图像集合的操作之前，对所述待检索图像和所述待召回图像的全局特征进行压缩处理。

15.一种电子设备，其特征在于，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-7中任一项所述的图像检索方法。

16.一种存储有计算机指令的非瞬时计算机可读存储介质，其特征在于，所述计算机指令用于使所述计算机执行权利要求1-7中任一项所述的图像检索方法。