CN111324760A

CN111324760A - 一种图像检索方法及装置

Info

Publication number: CN111324760A
Application number: CN202010102212.6A
Authority: CN
Inventors: 杨德升
Original assignee: Miniso Hengqin Enterprise Management Co ltd
Current assignee: Chuangyou Digital Technology Guangdong Co Ltd
Priority date: 2020-02-19
Filing date: 2020-02-19
Publication date: 2020-06-23
Anticipated expiration: 2040-02-19
Also published as: CN111324760B

Abstract

本申请公开了一种图像检索方法及装置，方法包括：采用预置特征提取模型提取预置图像数据集中的每个图像的特征向量，得到特征向量集；将每个特征向量划分为M段，得到M个特征向量子集，特征向量子集包括段特征向量；逐段将所有的段特征向量进行无监督聚类，得到收敛后的多个类别中心，类别中心包括索引号；根据每个段特征向量与类别中心的最小距离对段特征向量进行分类，得到索引特征库；将检索图像对应的不同的检索段特征向量根据索引号和索引特征库逐段进行目标匹配，并将匹配得到的段特征向量组合得到目标匹配结果。本申请解决了现有的以图搜图的检索技术效率低且精度差，无法满足用户的实际需求，降低了用户体验感的技术问题。

Description

一种图像检索方法及装置

技术领域

本申请涉及图像识别技术领域，尤其涉及一种图像检索方法及装置。

背景技术

以图搜图，是通过搜索图像文本或者视觉特征，为用户提供互联网上相关图形图像资料检索服务的专业搜索引擎系统，是搜索引擎的一种细分。通过输入与图片名称或内容相似的关键字来进行检索，另一种通过上传与搜索结果相似的图片或图片URL进行搜索。

互联网上图像的数据信息日渐庞大，用户对网上图像搜索的要求也在不断提高，使各种图像搜索技术应运而生。图像搜索技术的出现，使我们对网上图像信息的搜索变得非常简单，尽管还不很完美，却已经可以满足我们的大多数需求。

目前的以图搜图的技术检索效率和检索精度都较低，无法高效地满足用户的需求，还会降低用户的体验感。

发明内容

本申请提供了一种图像检索方法及装置，用于解决现有的以图搜图的检索技术效率低且精度差，无法满足用户的实际需求，降低了用户体验感的技术问题。

有鉴于此，本申请第一方面提供了一种图像检索方法，包括：

采用预置特征提取模型提取预置图像数据集中的每个图像的特征向量，得到特征向量集，所述特征向量集以二进制文件保存；

将每个所述特征向量划分为M段，得到M个特征向量子集，所述特征向量子集包括段特征向量；

逐段将所有的所述段特征向量进行无监督聚类，得到收敛后的多个类别中心，所述类别中心包括索引号；

根据所述每个段特征向量与所述类别中心的最小距离对所述段特征向量进行分类，得到索引特征库；

将检索图像对应的不同的检索段特征向量根据所述索引号和所述索引特征库逐段进行目标匹配，并将匹配得到的所述段特征向量组合得到目标匹配结果。

优选地，所述采用预置特征提取模型提取预置图像数据集中的每个图像的特征向量，得到特征向量集，之前还包括：

将获取到的图像数据集进行清洗操作，得到所述预置图像数据集，所述清洗操作包括去重操作和去损坏操作。

采用预训练图像数据集对神经网络模型进行预训练，得到所述预置特征提取模型。

优选地，所述采用预置特征提取模型提取预置图像数据集中的每个图像的特征向量，得到特征向量集，还包括：

计算所有所述特征向量两两之间的特征距离，并按所述特征距离对所述特征向量进行升序排列。

优选地，所述根据所述每个段特征向量与所述类别中心的最小距离对所述段特征向量进行分类，得到索引特征库，包括：

分别计算每个所述段特征向量与所有所述类别中心的距离；

将所述段特征向量分配到最小距离对应的所述类别中心的类别中；

根据所有所述段特征向量的分类建立索引特征库。

本申请第二方面提供了一种图像检索装置，包括：

特征提取模块，用于采用预置特征提取模型提取预置图像数据集中的每个图像的特征向量，得到特征向量集，所述特征向量集以二进制文件保存；

分段模块，用于将每个所述特征向量划分为M段，得到M个特征向量子集，所述特征向量子集包括段特征向量；

聚类模块，用于逐段将所有的所述段特征向量进行无监督聚类，得到收敛后的多个类别中心，所述类别中心包括索引号；

分类模块，用于根据所述每个段特征向量与所述类别中心的最小距离对所述段特征向量进行分类，得到索引特征库；

匹配模块，用于将检索图像对应的不同的检索段特征向量根据所述索引号和所述索引特征库逐段进行目标匹配，并将匹配得到的所述段特征向量组合得到目标匹配结果。

优选地，还包括：

清洗模块，用于将获取到的图像数据集进行清洗操作，得到所述预置图像数据集，所述清洗操作包括去重操作和去损坏操作。

优选地，还包括：

预训练模块，用于采用预训练图像数据集对神经网络模型进行预训练，得到所述预置特征提取模型。

优选地，还包括：

排序模块，用于计算所有所述特征向量两两之间的特征距离，并按所述特征距离对所述特征向量进行升序排列。

优选地，所述分类模块包括：

分类子模块，用于分别计算每个所述段特征向量与所有所述类别中心的距离；

根据所有所述段特征向量的分类建立索引特征库。

从以上技术方案可以看出，本申请具有以下优点：

本申请中，提供了一种图像检索方法，包括：采用预置特征提取模型提取预置图像数据集中的每个图像的特征向量，得到特征向量集，特征向量集以二进制文件保存；将每个特征向量划分为M段，得到M个特征向量子集，特征向量子集包括段特征向量；逐段将所有的段特征向量进行无监督聚类，得到收敛后的多个类别中心，类别中心包括索引号；根据每个段特征向量与类别中心的最小距离对段特征向量进行分类，得到索引特征库；将检索图像对应的不同的检索段特征向量根据索引号和索引特征库逐段进行目标匹配，并将匹配得到的段特征向量组合得到目标匹配结果。

本申请提供的图像检索方法，采用特征提取模型提取图像的特征向量，能够根据图像的特征趋势得到最具代表性的深层图像特征，使得检索的结果的精确度更高；将模型提取的特征向量再次进行加工处理，即将每个特征向量进行分段，高维的特征向量在分段后，可以得到多个较低维度的段特征向量，以降维的方式降低的计算复杂度，从而提高了检索效率；通过段特征向量进行聚类，使得每个特征向量子集都可以得到该段对应的类别库，有M个段，所以索引特征库是由M个类别库组成，将特征向量库进行分段的好处在于可以将图像分段检索，这样大大提高计算速度，减少检索时间。在匹配的过程中，将输入的检索图像进行以上相应的处理就可以得到M段特征向量，将第一段输入进行匹配就可以明确索引特征库中索引号对应的第一段中是否有相似度较高的段特征向量或者直接匹配到目标，由于分段后的特征向量降低了计算量，所以匹配速度快，由于而段与端之间存在特征关联，只要发现一段没有匹配的段特征向量就不必往下继续检索，这样从匹配方式上提高了检索的效率；最后将所有的匹配的段特征向量按照索引号快速组合就能得到最终的目标匹配结果。因此，本申请提供的图像检索方法能够解决现有的以图搜图的检索技术效率低且精度差，无法满足用户的实际需求，降低了用户体验感的技术问题。

附图说明

图1为本申请实施例提供的一种图像检索方法的一个流程示意图；

图2为本申请实施例提供的一种图像检索方法的另一个程示意图；

图3为本申请实施例提供的一种图像检索装置的一个结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本申请方案，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

为了便于理解，请参阅图1，本申请提供的一种图像检索方法的实施例一，包括：

步骤101、采用预置特征提取模型提取预置图像数据集中的每个图像的特征向量，得到特征向量集。

其中，特征向量集以二进制文件保存。

需要说明的是，预置特征提取模型是经过训练得到的，专用于图像的特征提取，能够解析到图像深层的特征，更能反映出图像的不同特点；进行特征提取之前的图像数据集需要进行预处理操作，使得图像更便于特征提取，将所有的图像都用预置特征提取模型提取得到各自对应向特征向量，得到特征向量集，将特征向量集与图像一一对应起来存储为二进制文件。

步骤102、将每个特征向量划分为M段，得到M个特征向量子集，特征向量子集包括段特征向量。

需要说明的是，每个特征向量均划分为M段，如果有N个特征向量，那么可以得到N×M个段特征向量，每一段仍然有N个段特征向量，且段特征向量的维度比特征向量的维度低，这是一个降维的过程，能够很好的降低计算的复杂度。

步骤103、逐段将所有的段特征向量进行无监督聚类，得到收敛后的多个类别中心。

其中，类别中心包括索引号。

需要说明的是，每一段有N个特征向量，将这些特征向量进行无监督的K均值聚类，定义初始的类别数，不断更新聚类参数，使得聚类达到收敛，将得到的结果作为聚类结果，即收敛后的类别，可以得到多个类别中心。索引号用于后续的段特征向量的分类。

步骤104、根据每个段特征向量与类别中心的最小距离对段特征向量进行分类，得到索引特征库。

需要说明的是，每个段特征向量与所有的类别中心均可以计算得到距离值，找到最小的距离，说明二者的相似度最高，就把段特征向量分配到最小的距离对应的类别中心的所属类别中，完成分类。类别中心的索引号即成为了该段特征向量的类别索引号，完成全部段特征向量的分类，即可建立索引特征库。

步骤105、将检索图像对应的不同的检索段特征向量根据索引号和索引特征库逐段进行目标匹配，并将匹配得到的段特征向量组合得到目标匹配结果。

需要说明的是，对于输入的检索图像，同样需要进行以上操作，得到M段不同的段向量，然后进行逐段的匹配，逐段匹配一般从第一段开始，对应的需要找到索引特征库中的第一段的所有类别的段特征向量，然后进行距离的计算，根据预置距离值就可以判定索引特征库中是否存在检索图像的第一段信息，如果存在，则继续进行第二段匹配，完成全部M段的匹配操作，将检索到的所有段特征限量按照索引号进行组合，得到一个完整的特征向量；如果不存在，则马上终止匹配，说明索引特征库中没有与检索图像相关的图像信息。逐段检索能够将图像分成几个独立的部分进行匹配计算，相比于整个特征向量的匹配计算更加简单、快速，从而提高了检索的效率。

本实施例提供的图像检索方法，采用特征提取模型提取图像的特征向量，能够根据图像的特征趋势得到最具代表性的深层图像特征，使得检索的结果的精确度更高；将模型提取的特征向量再次进行加工处理，即将每个特征向量进行分段，高维的特征向量在分段后，可以得到多个较低维度的段特征向量，以降维的方式降低的计算复杂度，从而提高了检索效率；通过段特征向量进行聚类，使得每个特征向量子集都可以得到该段对应的类别库，有M个段，所以索引特征库是由M个类别库组成，将特征向量库进行分段的好处在于可以将图像分段检索，这样大大提高计算速度，减少检索时间。在匹配的过程中，将输入的检索图像进行以上相应的处理就可以得到M段特征向量，将第一段输入进行匹配就可以明确索引特征库中索引号对应的第一段中是否有相似度较高的段特征向量或者直接匹配到目标，由于分段后的特征向量降低了计算量，所以匹配速度快，由于而段与端之间存在特征关联，只要发现一段没有匹配的段特征向量就不必往下继续检索，这样从匹配方式上提高了检索的效率；最后将所有的匹配的段特征向量按照索引号快速组合就能得到最终的目标匹配结果。因此，本实施例提供的图像检索方法能够解决现有的以图搜图的检索技术效率低且精度差，无法满足用户的实际需求，降低了用户体验感的技术问题。

为了便于理解，请参阅图2，本申请实施例中提供了一种图像检索方法的实施例二，包括：

步骤201、将获取到的图像数据集进行清洗操作，得到预置图像数据集，清洗操作包括去重操作和去损坏操作。

需要说明的是，采集的到图像数据并非直接进行特征提取，需要进行清洗操作，去除一种重复的图像，或者一些损坏严重，不便于提取特征的图像，亦或是提取特征效果不好的图像。如果是获取的图像SKU信息，那么可以对图像进行分级操作，SKU信息作为最底层图像信息，按照图像类容逐级往上排序，得到不同层次的图像数据集。

步骤202、采用预训练图像数据集对神经网络模型进行预训练，得到预置特征提取模型。

需要说明的是，预训练图像数据集为预置图像数据集的相关类图像，但是数据量相比于预置图像数据集更大，更加复杂，预训练后得到的预置特征提取模型之所以对图像的深层特征更加敏感就是预训练的图像量更多，复杂度更高，所以得到的模型的泛化能力更强。神经网络中的卷积神经网络是一种前馈神经网络，它的人工神经元可以响应一部分覆盖范围内的周围单元，对于大型图像处理有出色表现；它包括卷积层和池化层。卷积神经网络对于图像处理具有的平移和尺度不变性，因此可以应用于图像特征提取。

步骤203、采用预置特征提取模型提取预置图像数据集中的每个图像的特征向量，得到特征向量集。

其中，特征向量集以二进制文件保存。

需要说明的是，由于预置特征提取模型是卷积神经网络，所以可以定义卷积神经网络中的损失函数为三元组损失函数；在提取图像的特征向量的过程中，特征向量到达损失函数时，每张图像会选择n个特征作为正样本，另外在该图像的上一级别中随机选取n个负样本，共同进行反复的迭代训练，加快模型的收敛速度，尽快得到特征提取结果，将所有图像特征提取得到的特征向量两两计算特征距离，将特征向量按照距离大小进行升序排序，距离越小说明特征向量的相似度越大，在取用以及后续计算过程中，经过排序的特征向量能够加速计算速度，提高计算效率。

步骤204、将每个特征向量划分为M段，得到M个特征向量子集，特征向量子集包括段特征向量。

需要说明的是，假设获取的特征向量为N个，每一个特征向量为D维，将每一个特征向量划分为M段，此处可以令M＝8，那么每一段为N*D/8。

步骤205、逐段将所有的段特征向量进行无监督聚类，得到收敛后的多个类别中心，类别中心包括索引号。

需要说明的是，将N*D/8个段特征向量进行聚类操作，设置初始类别数为C，一般初始的C＝256，不断根据聚类结果优化聚类中心，直到聚类收敛，得到稳定的类别中心，即完成了聚类，记完成聚类的类别中心数量为C’，每个类别中心包括一个类别的索引号，供查询。每个段都根据这样的聚类方法进行聚类，得到M段的聚类，得到M*C’个类别中心。

步骤206、分别计算每个段特征向量与所有类别中心的距离。

步骤207、将段特征向量分配到最小距离对应的类别中心的类别中。

需要说明的是，将以上进行聚类的所有段特征向量进行分类，分类的依据是将段特征向量分配到距离其最近的分类中心对应的类别中，将类别中心的索引号作为该段特征向量的类别号，这里的距离最近是根据求取段特征向量与类别中心之间的距离确定的，距离最小的即为最近的，完成所有的段特征限量的类别划分。同样的，其他段的段特征向量以同样的方式，均可以完成相应的分类操作。

步骤208、根据所有段特征向量的分类建立索引特征库。

需要说明的是，统计所有的段的不同分类，可以根据8段分类结果建立索引特征库。8段分类结果存储了图像的8段不同特征，也就是原始的D维特征根据索引编号表示只有M＝8个维度，分开表达，后续也会分开匹配，从而提高匹配效率。

步骤209、将检索图像对应的不同的检索段特征向量根据索引号和索引特征库逐段进行目标匹配，并将匹配得到的段特征向量组合得到目标匹配结果。

需要说明的是，当用户上传检索图像时，需要以上述步骤获取检索图像对应的段特征向量，即8段，逐段输入段特征向量，将第一段与索引特征库中的段特征向量进行比对，或者直接计算与该段对应的类别中心计算距离，验证是否存在匹配的段特征向量，或者距离值是否在该类别的范围内，如果是，则继续下一段的检索匹配，由于将图像的特征向量分段了，很大程度上降低了计算的复杂度，所以逐段匹配的速度较快；如果在第一段的检索中无法查到对应的图像的段特征向量，就不必继续检索了，说明其他段也不存在该图像对应的段特征向量，如果某一段存在该图像的段特征向量，其他段也必然存在对应的段特征向量；在检索过程中提高检索的效率。需要注意的是，如果是直接匹配对应的段特征向量，可以准确的找到某一个与之匹配的目标，但是，如果是直接计算与类别中心的距离，得到的就是一些相似度较高的段特征向量，那就需要继续计算别的段与其他类别中心的距离，得到其他的相似度较高的段特征向量，最后在这些不同段的段特征向量中取关联的索引号的部分拼接，就可以得到完整的特征向量，其他的无法关联的就不是检索目标，可以去除。

为了便于理解，本实施例提供一种应用例，在商品图片检索过程中，用户需要根据输入的图片搜索相应的图片信息，一般后台存在大量的SKU商品图片，建立相应的图像数据库后，提取每一个SKU图片的特征向量，求取特征向量两两之间的特征距离，进行特征向量的升序排序；然后将特征向量分段聚类，建立索引图片特征库；最后，当用户输入检索的图片时，计算图片对应的段特征向量，直接计算出各段与对应的类别中心的距离，筛选出负荷条件的段特征向量，组合这些段特征向量，就可以得到检索的图片特征向量，完成检索。由于将特征向量分段处理，检索过程也以优化的方式计算，加快了计算的速度，增强了用户的体验感。

为了便于理解，请参与图3，本申请中还提供了一种图像检索装置的实施例，包括：

特征提取模块301，用于采用预置特征提取模型提取预置图像数据集中的每个图像的特征向量，得到特征向量集，特征向量集以二进制文件保存；

分段模块302，用于将每个特征向量划分为M段，得到M个特征向量子集，特征向量子集包括段特征向量；

聚类模块303，用于逐段将所有的段特征向量进行无监督聚类，得到收敛后的多个类别中心，类别中心包括索引号；

分类模块304，用于根据每个段特征向量与类别中心的最小距离对段特征向量进行分类，得到索引特征库；

匹配模块305，用于将检索图像对应的不同的检索段特征向量根据索引号和索引特征库逐段进行目标匹配，并将匹配得到的段特征向量组合得到目标匹配结果。

进一步地，还包括：

清洗模块306，用于将获取到的图像数据集进行清洗操作，得到预置图像数据集，清洗操作包括去重操作和去损坏操作.

进一步地，还包括：

预训练模块307，用于采用预训练图像数据集对神经网络模型进行预训练，得到预置特征提取模型。

进一步地，还包括：

排序模块308，用于计算所有特征向量两两之间的特征距离，并按特征距离对特征向量进行升序排列。

进一步地，分类模块304包括：

分类子模块3041，用于分别计算每个段特征向量与所有类别中心的距离；

将段特征向量分配到最小距离对应的类别中心的类别中；

根据所有段特征向量的分类建立索引特征库。

在本申请所提供的几个实施例中，应该理解到，所揭露的装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以通过一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(英文全称：Read-OnlyMemory，英文缩写：ROM)、随机存取存储器(英文全称：Random Access Memory，英文缩写：RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，以上实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims

1.一种图像检索方法，其特征在于，包括：

2.根据权利要求1所述的图像检索方法，其特征在于，所述采用预置特征提取模型提取预置图像数据集中的每个图像的特征向量，得到特征向量集，之前还包括：

3.根据权利要求1所述的图像检索方法，其特征在于，所述采用预置特征提取模型提取预置图像数据集中的每个图像的特征向量，得到特征向量集，之前还包括：

4.根据权利要求1所述的图像检索方法，其特征在于，所述采用预置特征提取模型提取预置图像数据集中的每个图像的特征向量，得到特征向量集，还包括：

5.根据权利要求1所述的图像检索方法，其特征在于，所述根据所述每个段特征向量与所述类别中心的最小距离对所述段特征向量进行分类，得到索引特征库，包括：

分别计算每个所述段特征向量与所有所述类别中心的距离；

根据所有所述段特征向量的分类建立索引特征库。

6.一种图像检索装置，其特征在于，包括：

7.根据权利要求6中所述的图像检索装置，其特征在于，还包括：

8.根据权利要求6中所述的图像检索装置，其特征在于，还包括：

9.根据权利要求6中所述的图像检索装置，其特征在于，还包括：

10.根据权利要求6中所述的图像检索装置，其特征在于，所述分类模块包括：

根据所有所述段特征向量的分类建立索引特征库。