CN112307239B

CN112307239B - 一种图像检索方法、装置、介质和设备

Info

Publication number: CN112307239B
Application number: CN202011179266.9A
Authority: CN
Inventors: 韩森尧; 侯博严; 于吉鹏; 李驰; 刘岩
Original assignee: Taikang Insurance Group Co Ltd
Current assignee: Taikang Insurance Group Co Ltd
Priority date: 2020-10-29
Filing date: 2020-10-29
Publication date: 2024-02-02
Anticipated expiration: 2040-10-29
Also published as: CN112307239A

Abstract

本发明涉及一种图像检索方法、装置、介质和设备。根据本发明实施例提供的方案，可以首先基于特征向量之间的欧式距离，针对待查询图像数据库中的每张图像，确定与待检索图像的相似度，从而筛选出一部分与待检索图像相似的图像，并可以进一步基于特征向量之间的特征向量差，针对筛选出的相似图像，进一步确定与待检索图像的相似度，进而可以基于两次相似度确定结果，来输出与待检索图像相似的图像，提高图像检索的准确性。

Description

一种图像检索方法、装置、介质和设备

技术领域

本发明涉及图像检索技术领域，特别涉及一种图像检索方法、装置、介质和设备。

背景技术

本部分旨在为权利要求书中陈述的本发明的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。

在很多领域，例如，医疗影像审核整理和财务稽核等领域，都会涉及到对图像的审核。传统方法是相关人员采用肉眼排查的方式进行审核，当图像数量非常大的时候，甚至可能会采取抽查的方式进行审核，以便查找出问题图像，由此导致图像审核非常低效，且准确性较低。

尤其是随着涉及到的图像数量上百万、上千万量级，用人力方式进行审核耗时耗力、人力成本高企，也无法有效的从如此巨量的图像中查找到问题图像。

至少针对上述问题，图像检索方法应运而生，可以通过检索相似图像的方式，从待审核图像中查找出问题图像。但是现有的图像检索方法无法有效保证检索的准确性。

发明内容

本发明实施例提供一种图像检索方法、装置、介质和设备，用于解决图像检索的准确性较差的问题。

第一方面，本发明提供了一种图像检索方法，所述方法包括：

确定待检索图像；

基于待查询图像数据库中的每张图像，与所述待检索图像分别对应的第一指定特征向量之间的欧式距离，确定待查询图像数据库中的每张图像与所述待检索图像的第一相似度，并确定第一相似度满足第一设定要求的第一图像集；

基于所述第一图像集中每张图像与所述待检索图像分别对应的第二指定特征向量之间的特征向量差，确定所述第一图像集中每张图像与所述待检索图像的第二相似度；

确定所述第一相似度和所述第二相似度满足第二设定要求的第二图像集，并输出所述第二图像集中的图像。

可选的，所述第二指定特征向量与所述第一指定特征向量相同，针对所述第一图像集中每张图像，该图像与所述待检索图像分别对应的第二指定特征向量之间的特征向量差为第一特征向量差；

或者所述第二指定特征向量为尺度不变特征变换SIFT特征向量，针对所述第一图像集中每张图像，该图像与所述待检索图像分别对应的第二指定特征向量之间的特征向量差为第二特征向量差；

或者所述第二指定特征向量包括所述第一指定特征向量和SIFT特征向量，针对所述第一图像集中每张图像，该图像与所述待检索图像分别对应的第二指定特征向量之间的特征向量差，为第一特征向量差与第二特征向量差融合得到的融合特征向量差；

其中，所述第一特征向量差为第一指定特征向量之间的特征向量差，所述第二特征向量差为SIFT特征向量之间的特征向量差。

可选的，基于所述第一图像集中每张图像与所述待检索图像分别对应的第二指定特征向量之间的特征向量差，确定所述第一图像集中每张图像与所述待检索图像的第二相似度，包括：

通过采用XGBoost模型的分类器，基于所述第一图像集中每张图像与所述待检索图像分别对应的第二指定特征向量之间的特征向量差，确定所述第一图像集中每张图像与所述待检索图像的第二相似度。

可选的，确定所述第一相似度和所述第二相似度满足第二设定要求的第二图像集，包括：

确定所述第一图像集中，对应的第一相似度和第二相似度的加权平均值满足第二设定要求的图像；

将确定出的对应的第一相似度和第二相似度的加权平均值满足第二设定要求的图像，作为第二图像集中的图像。

可选的，基于待查询图像数据库中的每张图像，与所述待检索图像的分别对应的第一指定特征向量之间的欧式距离，确定待查询图像数据库中的每张图像与所述待检索图像的第一相似度，并确定第一相似度满足第一设定要求的第一图像集，包括：

通过Milvus向量相似度搜索引擎，基于待查询图像数据库中的每张图像，与所述待检索图像的分别对应的第一指定特征向量之间的欧式距离，确定待查询图像数据库中的每张图像与所述待检索图像的第一相似度，并确定第一相似度满足第一设定要求的第一图像集。

可选的，通过集群分布式远程字典服务redis数据库保存所述待查询图像数据库中每张图像对应的第一指定特征向量。

可选的，所述待查询图像数据库中每张图像对应的第一指定特征向量通过以下方式获得：

通过指定特征向量提取模型，针对一张图像进行指定维数的特征向量提取；

通过指定的特征向量聚合方法，针对提取出的特征向量进行特征向量聚合；

通过指定的特征向量降维方法，针对聚合后的特征向量进行特征向量降维，将降维后得到的特征向量作为第一指定特征向量。

第二方面，本发明还提供了一种图像检索装置，所述装置包括：

确定模块，用于确定待检索图像；

第一检索模块，用于基于待查询图像数据库中的每张图像，与所述待检索图像分别对应的第一指定特征向量之间的欧式距离，确定待查询图像数据库中的每张图像与所述待检索图像的第一相似度，并确定第一相似度满足第一设定要求的第一图像集；

第二检索模块，用于基于所述第一图像集中每张图像与所述待检索图像分别对应的第二指定特征向量之间的特征向量差，确定所述第一图像集中每张图像与所述待检索图像的第二相似度；

输出模块，用于确定所述第一相似度和所述第二相似度满足第二设定要求的第二图像集，并输出所述第二图像集中的图像。

第三方面，本发明还提供了一种非易失性计算机存储介质，所述计算机存储介质存储有可执行程序，该可执行程序被处理器执行实现如上所述的方法。

第四方面，本发明还提供了一种图像检索设备，包括处理器、通信接口、存储器和通信总线，其中，所述处理器，所述通信接口，所述存储器通过所述通信总线完成相互间的通信；

所述存储器，用于存放计算机程序；

所述处理器，用于执行所述存储器上所存储的程序时，实现如上所述的方法步骤。

根据本发明实施例提供的方案，可以首先基于特征向量之间的欧式距离，针对待查询图像数据库中的每张图像，确定与待检索图像的相似度，从而筛选出一部分与待检索图像相似的图像，并可以进一步基于特征向量之间的特征向量差，针对筛选出的相似图像，进一步确定与待检索图像的相似度，进而可以基于两次相似度确定结果，来输出与待检索图像相似的图像，提高图像检索的准确性。

本发明的其它特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的图像检索方法的流程示意图；

图2为本发明实施例提供的redis节点部署的示意图；

图3为本发明实施例提供的数据流向示意图；

图4为本发明实施例提供的数据流向示意图；

图5为本发明实施例提供的数据流向示意图；

图6为本发明实施例提供的图像检索装置的结构示意图；

图7为本发明实施例提供的图像检索设备的结构示意图。

具体实施方式

为了使本发明的目的、技术方案和优点更加清楚，下面将结合附图对本发明作进一步地详细描述，显然，所描述的实施例仅仅是本发明的一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

需要说明的是，在本文中提及的“多个或者若干个”是指两个或两个以上。“和/或”，描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。

本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。

此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

针对目前图像检索的准确性较低的问题，本申请提供了一种通过两次相似度比较来实现图像检索的方案。其中，可以通过特征向量之间的欧式距离，从待查询图像数据库中筛选出一部分与待检索图像相似的图像，并可以进一步通过特征向量之间的特征向量差，针对筛选出的相似图像进行待检索图像的相似图像输出，从而通过两次相似度比较，来有效提高图像检索的准确性。

需要说明的是，从待查询图像数据库中筛选出的一部分相似图像，可以按照与待检索图像的相似度进行排序，例如，按照相似度由高到低的顺序进行排序，进一步通过特征向量之间的特征向量差，针对筛选出的相似图像进行待检索图像的相似图像输出，可以理解为对相似度进行重新排序后，进行相似图像输出。

基于上述说明，本发明实施例提供一种图像检索方法，该方法的步骤流程可以如图1所示，包括：

步骤101、确定待检索图像。

在本步骤中，可以确定需要进行相似图像检索的待检索图像。

确定出的需要进行相似图像检索的待检索图像，可以是待查询图像数据库中的一张图像，也可以是不属于待查询图像数据库的一张图像，例如用户输入的一张图像。

即在本实施例中，既可以针对待查询图像数据库中的一张图像，从待查询图像数据库中进行相似图像查找，也可以是针对不属于待查询图像数据库的一张图像，从待查询图像数据库中进行相似图像查找。

当然，需要进行相似图像检索的待检索图像也可能为至少两张。如果需要进行相似图像检索的待检索图像为多张，可以针对每张待检索图像，分别执行本流程，实现多张待检索图像的相似图像的并行或串行查找。

步骤102、确定待查询图像数据库中的每张图像与待检索图像的第一相似度，并确定第一相似度满足第一设定要求的第一图像集。

在本步骤中，可以基于待查询图像数据库中的每张图像，与待检索图像分别对应的第一指定特征向量之间的欧式距离，确定待查询图像数据库中的每张图像与待检索图像的第一相似度，并确定第一相似度满足第一设定要求的第一图像集，例如，确定第一相似度最高的指定数量的图像组成的第一图像集，又如，确定第一相似度不低于指定值的图像组成的第一图像集。

在本实施例中，可以通过向量相似度搜索引擎，基于待查询图像数据库中的每张图像，与待检索图像分别对应的第一指定特征向量之间的欧式距离，确定待查询图像数据库中的每张图像与待检索图像的第一相似度，并确定第一相似度满足第一设定要求的第一图像集。

Milvus是一个开源的向量相似度搜索引擎，它集成了成熟的向量搜索技术如Faiss和SPTAG，同时针对Faiss IVF索引进行了深度优化，实现了中央处理器(CPU)与多图形处理器(GPU)的融合计算，大幅提高了向量搜索性能，可以在秒内完成十亿级的向量搜索。此外，Milvus能够有效地管理向量数据，提供针对向量和非向量数据的增删改查的能力。

正是基于Milvus向量相似度搜索引擎的各种优点，在本实施例中，在一种可能的实现方式中，可以通过Milvus向量相似度搜索引擎，基于待查询图像数据库中的每张图像，与待检索图像分别对应的第一指定特征向量之间的欧式距离，确定待查询图像数据库中的每张图像与待检索图像的第一相似度，并确定第一相似度满足第一设定要求的第一图像集。从而在通过特征向量之间的欧式距离实现第一相似度的准确确定的基础上，通过Milvus向量相似度搜索引擎实现第一相似度和第一图像集的快速确定。

通过Milvus向量相似度搜索引擎确定第一相似度满足第一设定要求的第一图像集，可以预先对待查询数据库所有图像进行特征提取得到第一指定特征向量，并将提取得到的第一指定特征向量注册到Milvus向量相似度搜索引擎中建立索引。确定出待检索图像之后，Milvus向量相似度搜索引擎可以针对待检索图像对应的第一指定特征向量(如果待检索图像为待查询图像数据库中的一张图像，可以直接获取已经提取得到的待检索图像的第一指定特征向量，如果待检索图像不是待查询图像数据库中的一张图像，那么需要针对待检索图像进行特征提取，得到第一指定特征向量)进行向量搜索，采用欧式距离作为相似度量，得到第一图像集。第一图像集中的图像可以按照相似度由高到低的顺序进行排序，即，可以得到按照相似度由高到低的顺序进行排序的N张图像(Top N张图像)。

另外需要说明的是，为了实现第一图像集的快速确定，在一种可能的实现方式中，可以通过特征向量数据库，例如，集群分布式远程字典服务(redis)数据库(可以记为redis集群)保存待查询图像数据库中每张图像对应的第一指定特征向量，即可以通过集群分布方式部署的非关系型(NoSQL)数据库redis保存待查询图像数据库中每张图像对应的第一指定特征向量。

其中，可以预先对待查询图像数据库中每张图像进行处理得到统一格式的第一指定特征向量，并将图像名称和第一指定特征向量以key-value方式作为缓存存入redis集群对应的服务器内存中，从而可以通过redis集群，快速地提供待查询图像数据库中每张图像对应的第一指定特征向量。

在一种可能的实现方式中，为了保证redis集群的高可用性，可以将redis节点分为主从节点，主节点负责写入数据，从节点负责读出数据，并可以将主从节点部署在不同服务器上。

以redis集群包括12个redis节点，部署在六台服务器为例，可以将12个redis节点分为6个主节点(可以分别记为8001，8003，8005，8007，8009，8011)和6个从节点(可以分别记为8002，8004，8006，8008，8010，8012)，主从节点交叉且均匀分布在六台服务器上，12个redis节点在六台服务器上的部署示意图可以如图2所示。

若待查询图像数据库中每张图像对应的第一指定特征向量保存在特征向量数据库(例如，redis集群)，以待检索图像为待查询图像数据库中的一张图像为例，Milvus向量相似度搜索引擎确定第一相似度满足第一设定要求的第一图像集的数据流向示意图可以如图3所示：针对输入到待查询图像数据库中的每张图像进行特征提取得到的第一指定特征向量，保存至特征向量数据库中，并注册到Milvus向量相似度搜索引擎中建立索引。Milvus向量相似度搜索引擎可以根据从特征向量数据库中获取的待检索图像的第一指定特征向量，以及从特征向量数据库中获取的待查询图像数据库中非待检索图像的每张图像的第一指定特征向量，通过确定待查询图像数据库中非待检索图像的每张图像与待检索图像的第一相似度，确定出第一图像集。

步骤103、确定第一图像集中每张图像与待检索图像的第二相似度。

在本步骤中，可以基于第一图像集中每张图像与待检索图像分别对应的第二指定特征向量之间的特征向量差，确定第一图像集中每张图像与待检索图像的第二相似度。

基于特征向量之间的欧式距离进行相似性判断，每个特征向量在相似性判断过程中的权重是相同的，考虑到理论上相同图像的特征向量差应该为零，相似图像的特征向量差应该趋近于零，因此，本实施例考虑结合特征向量差，进一步进行相似性判断，从而在相似性判断过程中，除了进行特征向量之间距离的考量，还进行特征向量分布的考量，对基于特征向量之间的欧式距离进行相似性判断得到的图像检索结果进行优化。

用于确定特征向量差的第二指定特征向量可以根据需要进行选择。

在一种可能的实现方式中，用于确定特征向量差的第二指定特征向量可以与第一指定特征向量相同，此时，针对第一图像集中每张图像，该图像与待检索图像分别对应的第二指定特征向量之间的特征向量差，即为第一指定特征向量之间的特征向量差(可以记为第一特征向量差)。

需要指出的是，若第二指定特征向量与第一指定特征向量相同，那么只需要针对图像提取一次特征向量，即可以实现针对待检索图像的图像检索。

用于确定特征向量差的第二指定特征向量也可以为尺度不变特征变换(SIFT)特征向量，以通过SIFT特征向量分布的考量，对图像检索结果进行优化。

此时，针对第一图像集中每张图像，该图像与待检索图像分别对应的第二指定特征向量之间的特征向量差，即为SIFT特征向量之间的特征向量差(可以记为第二特征向量差)。

用于确定特征向量差的第二指定特征向量还可以包括第一指定特征向量和SIFT特征向量，以综合对第一指定特征向量分布以及SIFT特征向量分布的考量，进一步保证对图像检索结果的优化效果。

此时，针对第一图像集中每张图像，该图像与待检索图像分别对应的第二指定特征向量之间的特征向量差，为第一特征向量差与第二特征向量差融合得到的融合特征向量差。

在本实施例中，可以通过分类器，该分类器可以但不限于根据图像性质和/或图像数据量大小来决定采用的模型，例如，采用svm模型、XGBoost模型、LightGBM模型或多种机器学习集合模型，基于第一图像集中每张图像与待检索图像分别对应的第二指定特征向量之间的特征向量差，确定第一图像集中每张图像与待检索图像的第二相似度。从而实现重新分配特征向量在相似性判断过程中的权重，从特征向量分布的角度进行相似性判断。

本案发明人通过实验发现，通过XGBoost算法对特征向量差进行训练优化获得的采用XGBoost模型的分类器，针对室内图像或发票等文字图像进行图像检索时，获得的图像检索结果的准确性较佳。

因此优选的，针对室内图像或发票等文字图像进行图像检索时，可以通过采用XGBoost模型的分类器，基于第一图像集中每张图像与待检索图像分别对应的第二指定特征向量之间的特征向量差，确定第一图像集中每张图像与待检索图像的第二相似度。

步骤104、确定第一相似度和第二相似度满足第二设定要求的第二图像集，并输出第二图像集中的图像。

在一种可能的实现方式中，在本步骤中，可以确定第一图像集中，对应的第一相似度和第二相似度的加权平均值满足第二设定要求的图像，例如，加权平均值最大的指定数量的图像，或者加权平均值不小于指定值的图像，将确定出的对应的第一相似度和第二相似度的加权平均值满足第二设定要求的图像，作为第二图像集中的图像。进而可以输出第二图像集中的图像。

以第二指定特征向量包括第一指定特征向量和SIFT特征向量，通过分类器确定第二相似度为例，分类器可以根据第一指定特征向量之间的特征向量差、以及SIFT特征向量之间的特征向量差，获得融合特征向量差，并基于融合特征向量差确定出第一图像集中每张图像与待检索图像的第二相似度。若假设通过Milvus向量相似度搜索引擎确定第一相似度和第一图像集，可以将基于Milvus向量相似度搜索引擎确定出的第一图像集中每张图像对应的第一相似度，与分类器确定出的第二相似度进行加权平均，从而确定属于第二图像集的图像并输出。此时，对应的数据流向示意图可以如图4所示。

需要说明的是，如果第二指定特征向量为第一指定特征向量，或者包括第一指定特征向量，那么，可以针对第一图像集中每张图像以及待检索图像，直接获取已经得到的第一指定特征向量。以第一相似度和第一图像集通过Milvus向量相似度搜索引擎来确定为例，可以由Milvus向量相似度搜索引擎输出第一图像集中每张图像以及待检索图像对应的第一指定特征向量，使得后续可以基于第一指定特征向量确定第二相似度。

需要说明的是，在一种可能的实现方式中，待查询图像数据库中每张图像对应的第一指定特征向量可以但不限于通过以下方式获得，以进一步保证图像检索的准确性：

在本实施例中，可以基于ResNet50，Inception_v3，VGG16等网络模型，针对一张图像进行指定维数的特征向量提取。

本案发明人通过实验发现，如果需要针对室内图像或发票等文字图像进行图像检索，基于ResNet50进行特征向量提取的效果较佳。因此优选的，针对室内图像或发票等文字图像进行图像检索时，可以采用基于ImageNet数据预训练的ResNet50网络模型，作为提取图像特征向量的核心(backbone)网络。

进一步的，本案发明人通过实验比对了单独提取ResNet50网络不同层的特征向量，或者混合提取ResNet50网络不同层的特征向量，发现提取ResNet50网络的第三个卷积结构后的1024维的特征向量时，获得的图像检索结果的准确性较佳。因此优选的，可以提取ResNet50网络的第三个卷积结构后的1024维的特征向量。

另外，在本实施例中，可以采用全局平均池化、全局最大池化、广义最大期望、SCDA、SPoC等特征向量聚合方法。

本案发明人通过实验比对发现，针对室内图像或发票等文字图像进行图像检索时，采用广义最大期望方法时，获得的图像检索结果的准确性较佳。因此优选的，针对室内图像或发票等文字图像进行图像检索时，可以采用广义最大期望方法实现特征向量聚合。

此外，在本实施例中，可以采用主成分分析和奇异值分解等特征向量降维方法。

本案发明人通过实验比对发现，针对室内图像或发票等文字图像进行图像检索时，采用主成分分析方法时，获得的图像检索结果的准确性较佳。因此优选的，针对室内图像或发票等文字图像进行图像检索时，可以采用主成分分析方法实现特征向量降维。同时，可以在降维前和降维后进行L2正则化，降维得到512维的特征向量，进一步提高获得的图像检索结果的准确性。

针对待查询图像数据库中的每张图像，获得第一指定特征向量的数据流向示意图可以如图5所示，其中，针对输入待查询图像数据库中的每张图像，可以依次经特征向量提取、特征向量聚合和特征向量降维，得到第一指定特征向量并输出。

当然，如果待检索图像不是待查询图像数据库中的一张，那么待检索图像对应的第一指定特征向量也可以通过相同方式获得。

在一种可能的实现方式中，一张图像对应的SIFT特征向量可以但不限于通过以下方式获得：

针对一张图像提取SIFT特征点，假设提取的SIFT特征点数量为N个，每个SIFT特征点对应M维的特征向量；

将所有SIFT特征点对应的特征向量进行K均值(K-means)聚类，产生K个聚类中心；

利用产生的K个聚类中心，将所有SIFT特征点对应的特征向量量化为一个K维的特征向量，将该特征向量作为所述图像对应的SIFT特征向量。

针对医疗影像的保存，医疗影像可以理解为包括医疗发票图像、住院首页图像、病历图像等等，常常需要剔除重复的医疗影像，其中，可以保留最清晰的一张医疗影像，此时，需要通过图像检索，查找出保存的相似图像，以进行重复图像删除。该应用场景中，可以理解为待检索图像是待查询图像数据库中的图像，下面结合该应用场景，通过一个具体的实施例对本发明方案进行说明。

在本实施例中，针对输入待查询图像数据库中的每张医疗影像，可以将图像缩放到指定大小，例如1024x1024，提取ResNet50网络的第三个卷积结构后的1024维的特征向量，针对提取出的特征向量，采用广义最大期望方法实现特征向量聚合，并针对聚合后的特征向量采用主成分分析方法实现特征向量降维，并在降维前和降维后进行L2正则化，降维得到512维的特征向量，该特征向量即可以理解为第一指定特征向量。

进一步的，可以将输入到待查询图像数据库中的每张医疗影像对应的第一指定特征向量保存至redis集群，并注册到Milvus向量相似度搜索引擎中建立索引。

确定出待查询图像数据库中保存的一张待检索图像(即待检索医疗影像)之后，可以通过Milvus向量相似度搜索引擎，基于待查询图像数据库中非待检索图像的每张图像，与待检索图像分别对应的第一指定特征向量之间的欧式距离，确定待查询图像数据库中非待检索图像的每张图像与待检索图像的第一相似度，并确定第一相似度最高的20张图像组成的第一图像集。

进而可以通过采用XGBoost模型的分类器，基于第一图像集中每张图像与待检索图像分别对应的第二指定特征向量之间的特征向量差，确定第一图像集中每张图像与待检索图像的第二相似度。确定第一相似度和第二相似度的加权平均值不小于指定值，例如，0.6的图像组成的第二图像集并输出，从而可以直接界定出相似图像。

可以根据本发明实施例提供的方案，从第二图像集中，准确地检索出与待检索图像相似的图像，图像检索的准确性较高。可选的，检索出与待检索图像相似的图像后，可以进一步运用图像质检方法，得到两张图像的清晰度，保留清晰度更高的图像，例如，假设第二图像集中与待检索图像相似的那张图像更清晰，而待检索图像的清晰度较低，则可以在待查询图像数据库中仅保留第二图像集中与待检索图像相似的那张图像，而删除待检索图像。

需要说明的是，在本实施例中，对分类器进行训练时，可以将两张图像的特征向量差作为训练数据，相似(或相同)图像的特征向量差标签为1，不相似图像的特征向量差标签为0，利用分类器可以计算出图像之间的相似概率。

以第二指定特征向量包括第一指定特征向量和SIFT特征向量为例，训练数据可以包括以下两部分数据。

第一部分、待检索图像与第一图像集中的每张图像针对第一指定特征向量的特征向量差。

在本实施例中，可以将针对每张待检索图像(可以记为图像1、2……)，通过Milvus向量相似度搜索引擎确定出的第一相似度最高的20张图像(TOP20张图像)，与对应的待检索图像之间针对第一指定特征向量的特征向量差，作为分类器的训练数据来源。

例如，可以将针对图像1，通过Milvus向量相似度搜索引擎确定出的TOP20张图像，与图像1之间针对第一指定特征向量的特征向量差，作为分类器的训练数据来源。

对于TOP20张图像中与图像1相似或相同的图像，可以确定其与图像1针对第一指定特征向量的特征向量差，并将该部分特征向量差标注为1。对于TOP20张图像中与图像1不相似的图像，也可以确定其与图像1针对第一指定特征向量的特征向量差，并将该部分特征向量差标注为0。

这样，有多少张待检索图像，就有20倍的针对第一指定特征向量的特征向量差作为分类器的训练数据来源。

第二部分、待检索图像与第一图像集中的每张图像针对SIFT特征向量的特征向量差。

在本实施例中，可以将针对每张待检索图像(可以记为图像1、2……)，通过Milvus向量相似度搜索引擎确定出的第一相似度最高的20张图像(TOP20张图像)，与对应的待检索图像之间针对SIFT特征向量的特征向量差，也作为分类器的训练数据来源。

例如，可以分别针对图像1，以及确定出的TOP20张图像提取SIFT特征向量，并确定TOP20张图像中的每张图像与图像1之间针对SIFT特征向量的特征向量差。这样，有多少张待检索图像，就有20倍的针对SIFT特征向量的特征向量差作为分类器的训练数据来源。

此时，针对一张待检索图像，对于TOP20张图像中的每张图像，均确定出一个针对第一指定特征向量的特征向量差，以及一个针对SIFT特征向量的特征向量差。

可以进一步将两个特征向量差进行融合可以得到融合特征向量差，作为分类器的训练数据。例如，假设针对第一指定特征向量的特征向量差为512维，针对SIFT特征向量的特征向量差也为512维，那么可以将两个特征向量差合并(融合)得到一个1024维的特征向量差。

这样，有多少张待检索图像，就有20倍的融合特征向量差作为分类器的训练数据。

融合特征向量差的标注可以理解为与针对第一指定特征向量的特征向量差的标注相同，即，如果待检索图像与TOP20张图像中的图像相似或相同，那么对应的融合特征向量差标注为1，否则，对应的融合特征向量差标注为0。进而可以将融合特征向量差作为训练数据，对分类器进行训练，得到训练好的分类器。

根据本发明实施例提供的方案，可以在通过milvus向量相似度搜索引擎进行图像检索的基础上，引入新的图像相似度重排算法，建立分类器对图像相似度进行重新排序，提高图像检索的准确性。其中，可以基于深度学习模型提取图像特征向量，将milvus向量相似度搜索引擎给出的特征向量之间的欧式距离映射到图像之间的相似概率，并可以基于深度学习模型提取图像特征向量，计算特征向量差，并基于SIFT特征向量，计算特征向量差，根据两个特征向量差融合得到的融合特征向量差，通过分类器得到图像之间的相似概率。通过两次得到的相似概率的加权平均值，对milvus向量相似度搜索引擎给出的相似概率进行重新排序，得到图像之间的相似概率。

另外，在本发明实施例提供的方案中，可以通过组合第一指定特征向量的获取方法，milvus向量相似度搜索引擎的使用、特征向量数据库的设置以及分类器模型的选择，使得图像检索的速度更快，检索更加稳定且检索的准确性和精度更高。

本发明实施例提供的方案适用于医疗影像的审核，可以通过图像检索找到相似的医疗影像，删除重复的、清晰度较低的医疗影像，提升保存的医疗影像的质量，便于医疗影像的后续使用。

另外，本发明实施例提供的方案同样适用于其它应用场景，例如，财务影像的审核，以通过图像检索找到相似的财务影像，为重复报销等欺诈行为提供证据和线索。又如，产品说明会图像或培训活动图像的审核等，可以通过图像检索找到相似的图像，有效稽核出重复提交的图像。

与提供的方法对应的，进一步提供以下的装置。

本发明实施例提供一种图像检索装置，该装置的结构可以如图6所示，包括：

确定模块11用于确定待检索图像；

第一检索模块12用于基于待查询图像数据库中的每张图像，与所述待检索图像分别对应的第一指定特征向量之间的欧式距离，确定待查询图像数据库中的每张图像与所述待检索图像的第一相似度，并确定第一相似度满足第一设定要求的第一图像集；

第二检索模块13用于基于所述第一图像集中每张图像与所述待检索图像分别对应的第二指定特征向量之间的特征向量差，确定所述第一图像集中每张图像与所述待检索图像的第二相似度；

输出模块14用于确定所述第一相似度和所述第二相似度满足第二设定要求的第二图像集，并输出所述第二图像集中的图像。

可选的，所述第二检索模块13具体用于通过采用XGBoost模型的分类器，基于所述第一图像集中每张图像与所述待检索图像分别对应的第二指定特征向量之间的特征向量差，确定所述第一图像集中每张图像与所述待检索图像的第二相似度。

可选的，所述输出模块14用于确定所述第一相似度和所述第二相似度满足第二设定要求的第二图像集，包括：

可选的，所述第一检索模块12具体用于通过Milvus向量相似度搜索引擎，基于待查询图像数据库中的每张图像，与所述待检索图像的分别对应的第一指定特征向量之间的欧式距离，确定待查询图像数据库中的每张图像与所述待检索图像的第一相似度，并确定第一相似度满足第一设定要求的第一图像集。

本发明上述实施例提供的各装置的各功能单元的功能，可以通过上述对应的各方法的步骤来实现，因此，本发明实施例提供的各装置中的各个功能单元的具体工作过程和有益效果，在此不复赘述。

基于同一发明构思，本发明实施例提供以下的设备和介质。

本发明实施例提供一种图像检索设备，该设备的结构可以如图7所示，包括处理器21、通信接口22、存储器23和通信总线24，其中，所述处理器21，所述通信接口22，所述存储器23通过所述通信总线24完成相互间的通信；

所述存储器23，用于存放计算机程序；

所述处理器21，用于执行所述存储器上所存储的程序时，实现本发明上述方法实施例所述的步骤。

可选的，所述处理器21具体可以包括中央处理器(CPU)、特定应用集成电路(ASIC，Application Specific Integrated Circuit)，可以是一个或多个用于控制程序执行的集成电路，可以是使用现场可编程门阵列(FPGA，Field Programmable Gate Array)开发的硬件电路，可以是基带处理器。

可选的，所述处理器21可以包括至少一个处理核心。

可选的，所述存储器23可以包括只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)和磁盘存储器。存储器23用于存储至少一个处理器21运行时所需的数据。存储器23的数量可以为一个或多个。

本发明实施例还提供一种非易失性计算机存储介质，所述计算机存储介质存储有可执行程序，当可执行程序被处理器执行时，实现本发明上述方法实施例提供的方法。

在具体的实施过程中，计算机存储介质可以包括：通用串行总线闪存盘(USB，Universal Serial Bus Flash Drive)、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的存储介质。

在本发明实施例中，应该理解到，所揭露的设备和方法，可以通过其它的方式实现。例如，以上所描述的设备实施例仅仅是示意性的，例如，所述单元或单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，设备或单元的间接耦合或通信连接，可以是电性或其它的形式。

在本发明实施例中的各功能单元可以集成在一个处理单元中，或者各个单元也可以均是独立的物理模块。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明实施例的技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备，例如可以是个人计算机，服务器，或者网络设备等，或处理器(processor)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：通用串行总线闪存盘(Universal Serial Bus Flash Drive)、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、装置(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本发明的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例作出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。

显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

Claims

1.一种图像检索方法，其特征在于，所述方法包括：

确定待检索图像；

基于待查询图像数据库中的每张图像，与所述待检索图像分别对应的第一指定特征向量之间的欧式距离，确定待查询图像数据库中的每张图像与所述待检索图像的第一相似度，并确定第一相似度满足第一设定要求的第一图像集，其中，基于特征向量之间的欧式距离进行相似度判断时，每个特征向量在相似度判断中的权重是相同的；

通过分类器，基于所述第一图像集中每张图像与所述待检索图像分别对应的第二指定特征向量之间的特征向量差，确定所述第一图像集中每张图像与所述待检索图像的第二相似度，以重新分配每个特征向量在相似度判断过程中的权重；其中，若所述第二指定特征向量包括所述第一指定特征向量和SIFT特征向量，针对所述第一图像集中每张图像，该图像与所述待检索图像分别对应的第二指定特征向量之间的特征向量差，为第一特征向量差与第二特征向量差融合得到的融合特征向量差；其中，所述待查询图像数据库中每张图像对应的第一指定特征向量的获得过程包括：针对每张图像，将该图像缩放到第一设定维数大小，通过ResNet50网络模型对该图像进行设定维数的特征向量提取；针对提取出的特征向量，采用广义最大期望方法，对提取出的特征向量进行特征向量聚合；针对聚合后的特征向量，采用主成分分析方法对聚合后的特征向量进行降维，将降维后得到的第二设定维度的特征向量确定为第一指定特征向量；其中，所述待检索图像和所述待查询图像数据库中的图像包括医疗影像；

确定所述第一相似度和所述第二相似度满足第二设定要求的第二图像集，并输出所述第二图像集中的图像；

通过图像质检方法，确定所述待检索图像和所述第二图像集中的图像的清晰度；基于所述清晰度，确定所述待检索图像和所述第二图像集中的图像中待删除的目标图像，删除所述目标图像。

2.如权利要求1所述的方法，其特征在于，若所述第二指定特征向量与所述第一指定特征向量相同，针对所述第一图像集中每张图像，该图像与所述待检索图像分别对应的第二指定特征向量之间的特征向量差为第一特征向量差；

或者若所述第二指定特征向量为尺度不变特征变换SIFT特征向量，针对所述第一图像集中每张图像，该图像与所述待检索图像分别对应的第二指定特征向量之间的特征向量差为第二特征向量差；

3.如权利要求1所述的方法，其特征在于，基于所述第一图像集中每张图像与所述待检索图像分别对应的第二指定特征向量之间的特征向量差，确定所述第一图像集中每张图像与所述待检索图像的第二相似度，包括：

4.如权利要求1所述的方法，其特征在于，确定所述第一相似度和所述第二相似度满足第二设定要求的第二图像集，包括：

5.如权利要求1所述的方法，其特征在于，基于待查询图像数据库中的每张图像，与所述待检索图像的分别对应的第一指定特征向量之间的欧式距离，确定待查询图像数据库中的每张图像与所述待检索图像的第一相似度，并确定第一相似度满足第一设定要求的第一图像集，包括：

6.如权利要求5所述的方法，其特征在于，通过集群分布式远程字典服务redis数据库保存所述待查询图像数据库中每张图像对应的第一指定特征向量。

7.一种图像检索装置，其特征在于，所述装置包括：

确定模块，用于确定待检索图像；

第一检索模块，用于基于待查询图像数据库中的每张图像，与所述待检索图像分别对应的第一指定特征向量之间的欧式距离，确定待查询图像数据库中的每张图像与所述待检索图像的第一相似度，并确定第一相似度满足第一设定要求的第一图像集，其中，基于特征向量之间的欧式距离进行相似度判断时，每个特征向量在相似度判断中的权重是相同的；

第二检索模块，用于通过分类器，基于所述第一图像集中每张图像与所述待检索图像分别对应的第二指定特征向量之间的特征向量差，确定所述第一图像集中每张图像与所述待检索图像的第二相似度，以重新分配每个特征向量在相似度判断过程中的权重；其中，若所述第二指定特征向量包括所述第一指定特征向量和SIFT特征向量，针对所述第一图像集中每张图像，该图像与所述待检索图像分别对应的第二指定特征向量之间的特征向量差，为第一特征向量差与第二特征向量差融合得到的融合特征向量差；其中，所述待查询图像数据库中每张图像对应的第一指定特征向量的获得过程包括：针对每张图像，将该图像缩放到第一设定维数大小，通过ResNet50网络模型对该图像进行设定维数的特征向量提取；针对提取出的特征向量，采用广义最大期望方法，对提取出的特征向量进行特征向量聚合；针对聚合后的特征向量，采用主成分分析方法对聚合后的特征向量进行降维，将降维后得到的第二设定维度的特征向量确定为第一指定特征向量；其中，所述待检索图像和所述待查询图像数据库中的图像包括医疗影像；

输出模块，用于确定所述第一相似度和所述第二相似度满足第二设定要求的第二图像集，并输出所述第二图像集中的图像；通过图像质检方法，确定所述待检索图像和所述第二图像集中的图像的清晰度；基于所述清晰度，确定所述待检索图像和所述第二图像集中的图像中待删除的目标图像，删除所述目标图像。

8.一种非易失性计算机存储介质，其特征在于，所述计算机存储介质存储有可执行程序，该可执行程序被处理器执行实现权利要求1～6任一所述的方法。

9.一种图像检索设备，其特征在于，所述设备包括处理器、通信接口、存储器和通信总线，其中，所述处理器，所述通信接口，所述存储器通过所述通信总线完成相互间的通信；

所述存储器，用于存放计算机程序；

所述处理器，用于执行所述存储器上所存储的程序时，实现权利要求1～6任一所述的方法步骤。