CN106682233B - 一种基于深度学习与局部特征融合的哈希图像检索方法 - Google Patents
一种基于深度学习与局部特征融合的哈希图像检索方法 Download PDFInfo
- Publication number
- CN106682233B CN106682233B CN201710029935.6A CN201710029935A CN106682233B CN 106682233 B CN106682233 B CN 106682233B CN 201710029935 A CN201710029935 A CN 201710029935A CN 106682233 B CN106682233 B CN 106682233B
- Authority
- CN
- China
- Prior art keywords
- image
- hash
- retrieval
- vector
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 29
- 238000013135 deep learning Methods 0.000 title claims abstract description 18
- 230000004927 fusion Effects 0.000 title claims abstract description 15
- 239000013598 vector Substances 0.000 claims abstract description 54
- 230000002776 aggregation Effects 0.000 claims abstract description 24
- 238000004220 aggregation Methods 0.000 claims abstract description 24
- 238000012549 training Methods 0.000 claims abstract description 19
- 238000007781 pre-processing Methods 0.000 claims abstract description 4
- 238000011176 pooling Methods 0.000 claims description 21
- 230000006870 function Effects 0.000 claims description 11
- 238000004364 calculation method Methods 0.000 claims description 9
- 238000010606 normalization Methods 0.000 claims description 8
- 238000013507 mapping Methods 0.000 claims description 7
- 230000008707 rearrangement Effects 0.000 claims description 6
- 238000012545 processing Methods 0.000 claims description 4
- 230000001174 ascending effect Effects 0.000 claims description 2
- 238000010276 construction Methods 0.000 claims description 2
- 238000005457 optimization Methods 0.000 claims description 2
- 238000012935 Averaging Methods 0.000 claims 1
- 238000009825 accumulation Methods 0.000 claims 1
- 239000000126 substance Substances 0.000 claims 1
- 239000000284 extract Substances 0.000 abstract description 4
- 238000013527 convolutional neural network Methods 0.000 abstract description 3
- 238000006116 polymerization reaction Methods 0.000 abstract description 2
- 230000000875 corresponding effect Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 241000196324 Embryophyta Species 0.000 description 5
- 230000000007 visual effect Effects 0.000 description 5
- 230000008569 process Effects 0.000 description 4
- 238000002474 experimental method Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 230000001186 cumulative effect Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000000691 measurement method Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000003416 augmentation Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000007500 overflow downdraw method Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Library & Information Science (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明的一种基于深度学习与局部特征融合的哈希图像检索方法,所述方法包括五个部分:(1)图像的预处理;(2)用卷积神经网络对含有分类标签的图像进行训练;(3)用二值化方式生成图像的哈希码并提取1024维浮点型局部聚合向量;(4)用哈希码进行粗检索;(5)用局部聚合向量进行精检索。本发明的一种基于深度学习与局部特征融合的哈希图像检索方法提取两种特征后用近似最近邻搜索策略来进行图像检索,检索精确度高、检索速度快。
Description
技术领域
本发明涉及基于内容的图像检索领域,特别是一种基于深度学习与局部特征融合的哈希图像检索方法。
背景技术
如何将大规模图像数据进行高效检索以满足用户需求是一个亟待解决的问题,传统的方式是视觉词袋模型的图像检索,就是先使用尺度不变特征变换描述子对图像进行特征提取,然后使用硬聚类算法(K-Means)进行局部特征聚类得到视觉词典,最后统计每个视觉词出现的频率生成视觉单词直方图,进而匹配计算图像相似度,由于视觉词袋模型最初提取的特征是传统手工描述子,所以抽取的特征比较低级,无法很好的描述图像的高层语义信息,导致返回的图像可能完全不是用户所需要的,造成很差的用户体验。
近些年,深度学习在各种计算机视觉任务中都取得了重大的突破,其中包括基于内容的图像检索任务,其目的是直接通过分析图像内容来检索图像,在检索任务中图像的特征表达与相似性的度量成为了图像检索中的关键任务。随着基于内容的图像检索的发展,一个具有挑战性的问题是从相关联的像素级信息去抽象出便于人类感知的语义信息。尽管已经有很多手工描述子被研究出来用于提取图像特征,如尺度不变特征变换描述子,曾经在人脸识别广泛应用的局部二值模式高效算子,还有行人检测中的方向梯度直方图特征描述子等,由于它们是浅层特征,所以视觉特征的描述能力非常有限。随着深度学习的发展,卷积神经网络可以提取含有高层语义信息级别的特征,并渐渐应用到图像检索领域,如直接用训练好的AlexNet网络的最后一个全连接层特征进行图像检索,可获得不错的精度。然而,卷积神经网络提取的特征虽然语义丰富,但对于大规模图像集而言所需要的匹配计算量,内存占用以及时间开销显然是用户不可接受的。而图像特征经过哈希编码后,相似度的度量从高维浮点型的欧式距离计算转化为低维哈希码的汉明距离计算,极大的减少了计算成本和时间开销。另外,基于深度学习的图像检索一般是提取最后一个卷积层或全连接层的特征直接进行相似度计算,导致最后检索出的结果虽然是语义同类的图像,但是图像间的局部细节并不相似,因为高层的特征已经损失了很多细节信息,例如在电商中进行纹饰服装箱包搜索、工业精密器件搜索以及植物叶片搜索时,图像在整体轮廓上相似而细节差距却很大,导致检索结果可能与用户所期望的结果不一致。
发明内容
本发明的主要目的在于克服现有技术中的上述缺陷,提出一种基于深度学习与局部特征融合的哈希图像检索方法,通过使用局部特征融合的方法将网络中不同层的特征图谱进行融合,使得到的特征同时含有高层的抽象语义信息和低层的局部细节信息;同时,为了加快图像检索速度,使用了近似最近邻搜索策略,相较于目前主流方法,这种基于深度学习与局部特征融合的哈希图像检索方法具有精确度高、检索速度快的特点。
本发明采用如下技术方案:
一种基于深度学习与局部特征融合的哈希图像检索方法,包括如下步骤:
1)将输入的图像进行预处理,依次对每张图像进行去均值化、裁剪和镜像;
2)将预处理后的图像构建成三元组的形式输入到深度卷积网络进行训练;
3)将GoogLeNet模型中inception 4b层、inception 4e层和inception 5b层输出的特征图分别进行最大值池化和卷积处理,然后使用合并层将处理后的特征图进行拼接;
4)将合并层输出的特征图进行卷积核大小为1×1的卷积操作,得到大小为128×5×5的特征图;
5)将1×1卷积操作后的特征图进行总和池化处理,即对每一个特征图的所有元素值进行累加,并将128个特征图连接成一个128维的向量,向量每个维度上的值对应单个特征图的所有元素总和值;
6)将输出的大小为128×1×1的特征图经过一个结点个数为1024的全连接层映射,得到1个1024维的局部聚合向量;
7)将得到的局部聚合向量输入到哈希映射层,并利用感知哈希算法计算得到哈希码;
8)将得到的局部聚合向量进行L2范数归一化,归一化后的向量使用三元组损失形成约束优化,并与交叉熵损失函数同时进行训练。
步骤1)中所述预处理,包括:将输入的图像重置大小为256×256,对每一个图像进行裁剪,裁剪的是图片中央、4个角以及镜像共10张图片并去均值化,依次处理所有输入的训练图像,从而得到的每一个图像大小为224×224。
步骤2)中所述构建三元组的形式,包括:首先从训练数据集中随机选一个样本锚点,然后再随机选取一个和锚点属于同一类的正样本和不同类的负样本,由此构成三元组(锚点,正样本,负样本),则对应的损失函数L可表示为:
步骤3)中,将GoogLeNet网络中的inception 4b、inception 4e和inception 5b输出的特征图进行最大值池化和卷积处理,分别得到3个尺度为256×5×5的特征图,采用合并层对这些特征图进行合并,生成大小为768×5×5的特征图。
步骤5)中,所述将1×1卷积操作后的特征图进行总和池化处理,其表达式如下:
其中H、W分别为特征图的高度与宽度,x、y为特征图的空间坐标,I是输入的特征图,则f(x,y)表示特征图I上对应点(x,y)的值,总和池化实际上是对得到的每一个特征图I进行累加求和,如果有n个特征图,最终会生成一个n×1×1的特征向量。
步骤7)中,所述利用感知哈希算法计算得到哈希码,包括:定义哈希映射层的输出特征向量V(v1,v2,...,vm),通过均值感知哈希算法计算阈值得到二进制哈希码特征向量H(h1,h2,...,hm),表示式如下:
其中,1≤j≤m。
步骤8)中,所述将得到的局部聚合向量进行L2范数归一化,包括:定义局部聚合向量Y(y1,y2,...,yp),将归一化后的向量表示为Y'(y′1,y′2,...,y′p),归一化操作的表达式如下:
其中,1≤k≤p。
本发明具有如下有益效果:
本发明使用深度学习模型训练并进行特征提取,将不同层的局部特征进行融合,使提取的特征不仅含有高层语义信息还具有局部细节信息,并用近似最近邻搜索策略进行图像检索,实现快速高效的图像检索任务。
以下结合附图及实施例对本发明作进一步详细说明,但本发明的一种基于深度学习与局部特征融合的哈希图像检索方法不局限于实施例。
附图说明
图1是本发明的深度学习网络结构示意图;
图2是局部特征融合操作示意图;
图3是图像检索框架流程图;
图4是基于深度学习的两步快速分层图像检索示意图;
图5是在CIFAR-10数据集上48位哈希码图像检索精度图;
图6是在CIFAR-10数据集上Top10的图像检索结果图;
图7是在LEAVESDATA-85数据集上植物叶片图像检索结果图。
具体实施方式
以下通过具体实施方式对本发明作进一步的描述。
图1是本发明的深度学习网络结构示意图。本发明的网络模型框架是基于GoogLeNet网络结构改进而来的深度卷积网络,深度卷积网络结构如图1所示,网络包含五个部分:输入部分、卷积子网络部分、局部特征融合部分、哈希层编码部分以及损失函数部分。输入部分包含图像和对应的标签,且图像以三元组的形式输入;卷积子网络部分使用GoogLeNet网络的卷积部分,同时包含原有的3个损失层;局部特征融合模块主要由卷积层和池化层以及一个合并层与全连接层组成;哈希层编码部分由一个全连接层和阈值分割模块组成,全连接层个数为哈希码位数;损失函数部分主要由一个三元组损失函数与交叉熵函数组成并一起训练。
其中,哈希层中全连接层采用随机初始化,此时哈希层类似于局部敏感哈希思想,使用随机映射来构建哈希码,全连接层的节点个数代表哈希码的位数,每个节点可以类似看做一个超平面。经过哈希映射层的输出特征向量V(v1,v2,...,vm),通过均值感知哈希算法计算阈值得到二进制哈希码特征向量H(h1,h2,...,hm),表示式如下:
其中,1≤j≤m。
损失层通过同时优化三元组损失函数和交叉熵损失函数来端到端的学习局部融合特征与哈希层的特征。三元组损失度量方法可在训练过程中尽可能缩小两个相同类物体之间的距离,并扩大两个不同类物体之间的距离。三元组的生成首先从训练数据集中随机选一个样本锚点,然后再随机选取一个和锚点属于同一类的正样本和不同类的负样本,由此构成三元组(锚点,正样本,负样本),则对应的损失函数L可表示为:
这里损失用欧式距离进行度量,与分别表示锚点、正样本与负样本的特征向量,N表示网络训练的批大小,式子最后的正号表示括号内式子的值大于零的时候取该值为损失,反之则损失为零,其中α表示为可接受的不同类样本间的距离间隔。
图2是局部特征融合操作示意图,即将GoogLeNet网络中不同层得到的特征图谱进行融合,这样不仅利用了高层特征的抽象语义信息,还考虑到了低层特征的细节纹理信息,是检索结果更加精确,包含如下步骤:
1)将GoogLeNet网络中3个inception层(inception 4b、inception 4e、inception5b)的特征图谱提取出来分别使用最大池化层进行最大值池化,其中inception 4b和inception 4e层后的最大池化层的大小为3×3,步长为2,扩充边缘为0,输出的特征图大小分别为512×7×7和832×7×7;inception 5b使用大小为3×3,步长为1,扩充边缘为1的最大池化层计算,输出大小为1024×7×7的特征图。
2)将池化后的特征图分别使用卷积层进行卷积操作,其中卷积核的大小为3×3,步长为1,输出3个大小为256×5×5的特征图。
3)用合并层将卷积处理后的3个相同个数和尺度特征图进行拼接,得到大小为768×5×5的特征图。
4)使用大小为1×1的卷积核对拼接后的特征图进行卷积操作,生成大小为128×5×5的特征图,其中卷积层的步长为1,扩充边缘为0,卷积核个数为128。
5)使用总和池化层对上步得到的特征图进行池化操作,池化层大小为5×5,步长为1,扩充边缘为0,生成大小为128×1×1的特征向量,其表达式如下:
其中H、W分别为特征图的高度与宽度,x、y为特征图的空间坐标,I是输入的特征图,则f(x,y)表示特征图I上对应点(x,y)的值,总和池化实际上是对得到的每一个特征图I进行累加求和,如果有n个特征图,最终会生成一个n×1×1的特征向量。这里H和W取值为5,n为128,得到一个128×1×1维的向量。
6)在上步得到的128×1×1特征向量后紧接一个结点个数为1024的全连接层,得到1024维局部聚合向量并对其进行L2范数归一化,定义局部聚合向量为Y(y1,y2,...,yp),将归一化后的向量表示为Y'(y′1,y'2,...,y'p),归一化操作的表达式如下:
其中,1≤k≤p。
图3是图像检索框架流程图。图像的检索过程就是先对图像数据库的图像进行去均值预处理操作,然后抽取每张图像的哈希码与局部聚合特征,存储与数据库中。对于待检索的图像,先去均值然后用同样的方式抽取哈希码与特征向量。在进行相似度匹配时,先找出哈希码相同或相近的图像进行粗检索,然后利用局部聚合向量进行精检索并重排,最终返回重排结果。
图4是基于深度学习的两步快速分层图像检索示意图。第一步,在对指定图像进行检索之前,需要先使用准备的数据集对网络进行微调,微调前应更改网络中对应4个分类层的结点数为数据集的类别个数,然后提取所有数据集的哈希码与局部聚合特征。第二步,利用微调好的网络对需要检索的图像进行前向计算,取出哈希码与局部聚合特征。在粗检索阶段,利用二进制哈希码计算图像相似度时使用汉明距离,给定一个检索图像Ir和它的二进制哈希码H(h1,h2,...,hm),定义一共有m个候选类,即有m个哈希桶,将汉明距离低于阈值的图像归到一个哈希桶里面。在精检索阶段,给定检索图像Ir与粗检索阶段生成的哈希码,将哈希桶内所有图像的高维局部聚合向量提取出来。计算查询图像的局部聚合向量Y与哈希桶内所有图像的欧氏距离Disti,表示为:
Disti=||Y-Yi K|| (5)
其中K表示返回给用户的图像个数,Yi表示哈希桶内前K个图像特征的局部聚合向量,最后对距离Disti进行升序重排,返回的前K个图像即为检索结果。
一实施例之中,分别在CIFAR-10,NUS-WIDE和LEAVESDATA-85三个数据集上进行实验并评估。CIFAR-10数据集包含了马、飞机、船等10个类别,每个类别包含6000张图像,共有60000张图像,每张图像的大小是32×32像素,其中训练集有50000张图像,测试集有10000张图像。NUS-WIDE是一个网络图像数据集,包含269648张图像,每张图像会从81个类别中选择一个或多个类别进行标记,其中训练集包含161789张图像,测试集包含张107859图像。LEAVESDATA-85是一个植物叶片数据集,一共有38067张图像共85类植物叶片,其中训练集包含33817张图片,测试集包含4250张图片。
为了评估图像检索性能并与已有的方法作比较,采用了MAP(Mean AveragePrecision)平均精度均值度量方法,计算过程主要分为两步,第一步计算AP(AveragePrecision)平均准确度,对不同召回率上的正确值进行平均。定义检索有N个相关结果,经过检索系统返回K个相关图像,其位置分别为x1,x2,...xK,则单个类别的平均准确度APi表示为:第二步对AP进行算术平均,定义图像类别数为M,则平均精度均值MAP为:
图5给出不同哈希方法在CIFAR-10数据集上的检索精度图,实验统一使用48位哈希码,并利用汉明距离度量图像间的相似性。从图5中可看出检索精度稳定在0.92附近,比核监督哈希方法(KSH)提高了47%,比主流的基于深度学习的哈希方法(CNNH+)提高了32%,比目前最优的快速二值哈希方法(DLBHC)提高了3%,本发明方法明显优于其他哈希方法。
图6给出了在CIFAR-10数据集上两张查询图像的Top10检索结果,由图6可看出48位哈希码成功检索出了类别和语义相似的图像,当哈希码从48位变成128位时,更倾向于检索出外观上更相似的图像,最后一行是利用1024维的局部聚合向量进行重排序得到更加精确的结果。
图7展示了在LEAVESDATA-85数据集上检索植物叶片返回的结果。实验证明,本发明方法在图像细粒度分类与检索上也具有很好的效果。
表1给出了本发明方法分别在CIFAR-10与NUS-WIDE数据集上不同哈希位检索得到的平均检索精度值。由表可知,与其他现有方法相比,发明算法在CIFAR-10数据集上检索精度达到最优,各个哈希位的平均检索精度值都达到了0.92以上。另外在NUS-WIDE数据集上采用81个概念类别图像进行训练,本发明方法的平均检索精度同样高于其他算法。
表1
本实施例中,在GPU为Tesla K40c的机器上提取单张图像卷积特征花费0.072s,检索过程使用CPU进行计算,利用1024维特征向量直接检索需要0.614s。若使用48位哈希码进行粗检索耗时为0.023s,在粗检索之后进行精检索的耗时约为0.009s,可得使用本发明方法检索图像总耗时约为0.032s,相比于其他方法,检索质量和速度都有很大的提高,可以满足用户的日常需求,并且随着图像集的增大,近似最近邻搜索策略的高效性会更加突出。
上述仅为本发明的具体实施方式,但本发明的设计构思并不局限于此,凡利用此构思对本发明进行非实质性的改动,均应属于侵犯本发明保护范围的行为。
Claims (1)
1.一种基于深度学习与局部特征融合的哈希图像检索方法,其特征在于,包括如下步骤:
1)将输入的图像进行预处理,依次对每张图像进行去均值化、裁剪和镜像;
2)将预处理后的图像构建成三元组的形式输入到深度卷积网络进行训练;
3)将深度卷积网络GoogLeNet中inception 4b层、inception 4e层和inception 5b层输出的特征图分别进行最大值池化和卷积处理,然后使用合并层将处理后的特征图进行拼接;
4)将合并层输出的特征图进行卷积核大小为1×1的卷积操作,得到大小为128×5×5的特征图;
5)将1×1卷积操作后的特征图进行总和池化处理,并将128个特征图连接成一个128维的向量,向量每个维度上的值对应单个特征图的所有元素总和值;
6)将输出的大小为128×1×1的特征图经过一个结点个数为1024的全连接层映射,得到1个1024维的局部聚合向量;
7)将得到的局部聚合向量输入到哈希映射层,并利用感知哈希算法计算得到哈希码;
8)将得到的局部聚合向量进行L2范数归一化,归一化后的向量使用三元组损失形成约束优化,并与交叉熵损失函数同时进行训练;
9)对检索图像进行步骤1)~步骤8)的处理,将步骤7)中计算得到的检索图像的哈希码与图像数据库中已存储的多张图像的哈希码进行比对,找出哈希码相同或相近的图像进行粗检索;
10)利用步骤6)获得的检索图像的局部聚合向量进行精检索并重排,最终返回重排结果;
步骤1)中所述预处理,包括:将输入的图像重置大小为256×256,对每一个图像进行裁剪,裁剪的是图片中央、4个角以及镜像共10张图片并去均值化,依次处理所有输入的训练图像,从而得到的每一个图像大小为224×224;
步骤2)中所述构建三元组的形式,包括:
从训练数据集中随机选一个样本锚点;
随机选取一个和锚点属于同一类的正样本和不同类的负样本,构成三元组;
对应的损失函数L表示为:
步骤3)中,将GoogLeNet模型中的inception 4b、inception 4e和inception 5b输出的特征图进行最大值池化和卷积处理后,分别得到3个尺度为256×5×5的特征图,采用合并层对这些特征图进行合并,生成大小为768×5×5的特征图;
步骤5)中,所述将1×1卷积操作后的特征图进行总和池化处理,其表达式如下:
其中,H和W分别为特征图的高度与宽度,x、y为特征图的空间坐标,I是输入的特征图,则f(x,y)表示特征图I上对应点(x,y)的值,总和池化实际上是对得到的每一个特征图I进行累加求和,如果有n个特征图,最终生成一个n×1×1的特征向量;
步骤7)中,所述利用感知哈希算法计算得到哈希码,包括:定义哈希映射层的输出特征向量V(v1,v2,...,vm),通过均值感知哈希算法计算阈值得到二进制哈希码特征向量H(h1,h2,...,hm),表示式如下:
其中,1≤j≤m;m表示哈希映射层的输出特征向量个数及对应的哈希码特征向量个数;
步骤8)中,所述将得到的局部聚合向量进行L2范数归一化,包括:定义局部聚合向量Y(y1,y2,...,yp),将归一化后的向量表示为Y′(y′1,y′2,...,y′p),归一化操作的表达式如下:
其中,1≤k≤p;p表示局部聚合向量个数;
步骤9)中,在粗检索阶段,利用二进制哈希码计算检索图像与存储的多张图像的相似度时使用汉明距离,将汉明距离低于阈值的图像归到一个哈希桶里面;
步骤10)中,在精检索阶段,将哈希桶内所有图像的高维局部聚合向量提取出来;计算检索图像的局部聚合向量Y与哈希桶内所有图像的欧氏距离Disti,表示为:
Disti=||Y-Yi K||
其中K表示返回给用户的图像个数,Yi表示哈希桶内前K个图像特征的局部聚合向量,最后对距离Disti进行升序重排,返回的前K个图像即为检索结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710029935.6A CN106682233B (zh) | 2017-01-16 | 2017-01-16 | 一种基于深度学习与局部特征融合的哈希图像检索方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710029935.6A CN106682233B (zh) | 2017-01-16 | 2017-01-16 | 一种基于深度学习与局部特征融合的哈希图像检索方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106682233A CN106682233A (zh) | 2017-05-17 |
CN106682233B true CN106682233B (zh) | 2020-03-10 |
Family
ID=58859057
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710029935.6A Expired - Fee Related CN106682233B (zh) | 2017-01-16 | 2017-01-16 | 一种基于深度学习与局部特征融合的哈希图像检索方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106682233B (zh) |
Families Citing this family (67)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107169106B (zh) * | 2017-05-18 | 2023-08-18 | 珠海习悦信息技术有限公司 | 视频检索方法、装置、存储介质及处理器 |
CN107220325A (zh) * | 2017-05-22 | 2017-09-29 | 华中科技大学 | 一种基于卷积神经网络的app相似图标检索方法和系统 |
CN107239535A (zh) * | 2017-05-31 | 2017-10-10 | 北京小米移动软件有限公司 | 相似图片检索方法及装置 |
CN107256246B (zh) * | 2017-06-06 | 2019-12-10 | 西安工程大学 | 基于卷积神经网络的印花织物图像检索方法 |
CN107220368B (zh) * | 2017-06-09 | 2020-12-04 | 北京邮电大学 | 图像检索方法及装置 |
CN107273872B (zh) * | 2017-07-13 | 2020-05-05 | 北京大学深圳研究生院 | 用于图像或视频中行人重识别的深度判别网络模型方法 |
WO2019014649A1 (en) * | 2017-07-14 | 2019-01-17 | Memorial Sloan Kettering Cancer Center | LOW SUPERVISED IMAGE CLASSIFIER |
CN107480261B (zh) * | 2017-08-16 | 2020-06-16 | 上海荷福人工智能科技(集团)有限公司 | 一种基于深度学习细粒度人脸图像快速检索方法 |
CN107729290B (zh) * | 2017-09-21 | 2021-05-11 | 北京大学深圳研究生院 | 一种利用局部敏感哈希优化的超大规模图的表示学习方法 |
CN109711422B (zh) * | 2017-10-26 | 2023-06-30 | 北京邮电大学 | 图像数据处理、模型的建立方法、装置、计算机设备和存储介质 |
CN107808394B (zh) * | 2017-11-16 | 2020-05-15 | 厦门美图之家科技有限公司 | 一种基于卷积神经网络的图像处理方法及移动终端 |
CN107886474B (zh) * | 2017-11-22 | 2019-04-23 | 北京达佳互联信息技术有限公司 | 图像处理方法、装置及服务器 |
CN107958247A (zh) * | 2018-01-17 | 2018-04-24 | 百度在线网络技术(北京)有限公司 | 用于人脸图像识别的方法和装置 |
CN108197591A (zh) * | 2018-01-22 | 2018-06-22 | 北京林业大学 | 一种基于多特征融合迁移学习的鸟类个体识别方法 |
CN108280187B (zh) * | 2018-01-24 | 2021-06-01 | 湖南省瞬渺通信技术有限公司 | 一种基于卷积神经网络深度特征的分级图像检索方法 |
CN108446312B (zh) * | 2018-02-06 | 2020-04-21 | 西安电子科技大学 | 基于深度卷积语义网的光学遥感图像检索方法 |
CN108595474B (zh) * | 2018-03-09 | 2022-04-12 | 中山大学 | 一种带有物体位置感知的多标签图片哈希方法 |
CN108647295B (zh) * | 2018-05-08 | 2022-09-23 | 南京大学 | 一种基于深度协同哈希的图片标注方法 |
CN108830201B (zh) * | 2018-06-01 | 2020-06-23 | 平安科技(深圳)有限公司 | 样例三元组的获取方法、装置、计算机设备以及存储介质 |
CN109034044B (zh) * | 2018-06-14 | 2022-04-05 | 天津师范大学 | 一种基于融合卷积神经网络的行人再识别方法 |
CN108932314A (zh) * | 2018-06-21 | 2018-12-04 | 南京农业大学 | 一种基于深度哈希学习的菊花图像内容检索方法 |
CN109190446A (zh) * | 2018-07-06 | 2019-01-11 | 西北工业大学 | 基于三元组聚焦损失函数的行人再识别方法 |
CN108596163A (zh) * | 2018-07-10 | 2018-09-28 | 中国矿业大学(北京) | 一种基于cnn和vlad的煤岩识别方法 |
CN108986091A (zh) * | 2018-07-12 | 2018-12-11 | 太原科技大学 | 基于深度哈希网络的铸件缺陷图像检测方法 |
CN109284767B (zh) * | 2018-07-23 | 2021-04-06 | 天津师范大学 | 一种基于增广样本和多流层的行人检索方法 |
CN109165306B (zh) * | 2018-08-09 | 2021-11-23 | 长沙理工大学 | 基于多任务哈希学习的图像检索方法 |
CN109472282B (zh) * | 2018-09-10 | 2022-05-06 | 中山大学 | 一种基于极少训练样本的深度图像哈希方法 |
CN109241317B (zh) * | 2018-09-13 | 2022-01-11 | 北京工商大学 | 基于深度学习网络中度量损失的行人哈希检索方法 |
CN109685115B (zh) * | 2018-11-30 | 2022-10-14 | 西北大学 | 一种双线性特征融合的细粒度概念模型及学习方法 |
CN109583507B (zh) * | 2018-12-07 | 2023-04-18 | 浙江工商大学 | 一种基于深度卷积神经网络的猪体识别方法 |
CN109784366A (zh) * | 2018-12-07 | 2019-05-21 | 北京飞搜科技有限公司 | 目标物体的细粒度分类方法、装置与电子设备 |
CN109558512B (zh) * | 2019-01-24 | 2020-07-14 | 广州荔支网络技术有限公司 | 一种基于音频的个性化推荐方法、装置和移动终端 |
CN109635141B (zh) * | 2019-01-29 | 2021-04-27 | 京东方科技集团股份有限公司 | 用于检索图像的方法、电子设备和计算机可读存储介质 |
CN110083762B (zh) * | 2019-03-15 | 2023-01-24 | 平安科技(深圳)有限公司 | 房源搜索方法、装置、设备及计算机可读存储介质 |
CN109948585A (zh) * | 2019-03-29 | 2019-06-28 | 湖北工业大学 | 一种基于高精度哈希图像检索技术的行人检测方法及系统 |
CN110059616A (zh) * | 2019-04-17 | 2019-07-26 | 南京邮电大学 | 基于融合损失函数的行人重识别模型优化方法 |
CN110046579B (zh) * | 2019-04-18 | 2023-04-07 | 重庆大学 | 一种深度哈希的行人再识别方法 |
CN110149541B (zh) * | 2019-04-23 | 2021-08-03 | 腾讯科技(深圳)有限公司 | 视频推荐方法、装置、计算机设备及存储介质 |
CN110297931B (zh) * | 2019-04-23 | 2021-12-03 | 西北大学 | 一种图像检索方法 |
CN110222559A (zh) * | 2019-04-24 | 2019-09-10 | 深圳市微纳集成电路与系统应用研究院 | 基于卷积神经网络的烟雾图像检测方法及装置 |
CN110134803B (zh) * | 2019-05-17 | 2020-12-11 | 哈尔滨工程大学 | 基于哈希学习的图像数据快速检索方法 |
CN110110113A (zh) * | 2019-05-20 | 2019-08-09 | 重庆紫光华山智安科技有限公司 | 图像搜索方法、系统及电子装置 |
CN110263252B (zh) * | 2019-06-19 | 2023-02-03 | 华东师范大学 | 一种基于深度学习的服装检索方法 |
CN110457515B (zh) * | 2019-07-19 | 2021-08-24 | 天津理工大学 | 基于全局特征捕捉聚合的多视角神经网络的三维模型检索方法 |
CN110580503A (zh) * | 2019-08-22 | 2019-12-17 | 江苏和正特种装备有限公司 | 一种基于ai的双光谱目标自动识别方法 |
CN110781902A (zh) * | 2019-10-28 | 2020-02-11 | 山东浪潮人工智能研究院有限公司 | 一种鲁棒二值属性学习方法及系统 |
CN111125396B (zh) * | 2019-12-07 | 2023-06-30 | 复旦大学 | 一种单模型多分支结构的图像检索方法 |
CN111078940B (zh) * | 2019-12-16 | 2023-05-23 | 腾讯科技(深圳)有限公司 | 图像处理方法、装置、计算机存储介质及电子设备 |
CN111078914B (zh) * | 2019-12-18 | 2023-04-18 | 书行科技(北京)有限公司 | 重复图片检测方法与装置 |
CN111274430A (zh) * | 2020-01-19 | 2020-06-12 | 易拍全球(北京)科贸有限公司 | 一种基于特征重建监督的瓷器领域图像检索算法 |
CN111325243B (zh) * | 2020-02-03 | 2023-06-16 | 天津大学 | 一种基于区域注意力学习机制的视觉关系检测方法 |
CN111680176B (zh) * | 2020-04-20 | 2023-10-10 | 武汉大学 | 基于注意力与双向特征融合的遥感图像检索方法及系统 |
CN111522985B (zh) * | 2020-04-21 | 2023-04-07 | 易拍全球(北京)科贸有限公司 | 基于深浅层特征提取与融合的古董艺术品图像检索方法 |
CN112257662A (zh) * | 2020-11-12 | 2021-01-22 | 安徽大学 | 一种基于深度学习的压力足迹图像检索系统 |
TWI765422B (zh) * | 2020-11-20 | 2022-05-21 | 全友電腦股份有限公司 | 資料擷取方法、樣板生成方法及非暫態電腦可讀取記錄媒體 |
CN112307248B (zh) * | 2020-11-26 | 2023-11-03 | 国网数字科技控股有限公司 | 一种图像检索方法及装置 |
CN112615974A (zh) * | 2020-12-14 | 2021-04-06 | 中国科学院信息工程研究所 | 一种基于深度判别器的无载体隐蔽通信方法及系统 |
CN112685580A (zh) * | 2020-12-25 | 2021-04-20 | 公安部第三研究所 | 基于深度学习的社交网络头像比对的分布式检测系统、方法、装置、处理器及其存储介质 |
CN112818859B (zh) * | 2021-02-02 | 2022-06-24 | 电子科技大学 | 一种基于深度哈希的多级检索行人重识别方法 |
CN112967296B (zh) * | 2021-03-10 | 2022-11-15 | 重庆理工大学 | 一种点云动态区域图卷积方法、分类方法及分割方法 |
CN113051417B (zh) * | 2021-04-20 | 2021-11-16 | 南京理工大学 | 一种细粒度图像检索方法及系统 |
CN112991187B (zh) * | 2021-04-28 | 2021-07-27 | 四川大学 | 基于多空间相似度的卷积双胞胎点网络叶片轮廓拼接系统 |
CN113190699B (zh) * | 2021-05-14 | 2023-04-18 | 华中科技大学 | 一种基于类别级语义哈希的遥感图像检索方法及装置 |
CN114581686B (zh) * | 2022-01-26 | 2023-04-07 | 南京富岛油气智控科技有限公司 | 一种基于示功图哈希查找的抽油工况融合推理识别方法 |
CN114972506B (zh) * | 2022-05-05 | 2024-04-30 | 武汉大学 | 一种基于深度学习和街景图像的图像定位方法 |
CN116401396A (zh) * | 2023-06-09 | 2023-07-07 | 吉林大学 | 一种类内排序辅助的深度度量学习图像检索方法及系统 |
CN117456561B (zh) * | 2023-12-22 | 2024-03-12 | 华侨大学 | 一种基于部件量子学习的行人再辨识方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105574215A (zh) * | 2016-03-04 | 2016-05-11 | 哈尔滨工业大学深圳研究生院 | 一种基于多层特征表示的实例级图像搜索方法 |
CN105912611A (zh) * | 2016-04-05 | 2016-08-31 | 中国科学技术大学 | 一种基于cnn的快速图像检索方法 |
CN106227851A (zh) * | 2016-07-29 | 2016-12-14 | 汤平 | 基于深度卷积神经网络端对端的通过分层深度搜索的图像检索方法 |
CN106250423A (zh) * | 2016-07-25 | 2016-12-21 | 上海交通大学 | 基于部分参数共享的深度卷积神经网络跨域服装检索方法 |
-
2017
- 2017-01-16 CN CN201710029935.6A patent/CN106682233B/zh not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105574215A (zh) * | 2016-03-04 | 2016-05-11 | 哈尔滨工业大学深圳研究生院 | 一种基于多层特征表示的实例级图像搜索方法 |
CN105912611A (zh) * | 2016-04-05 | 2016-08-31 | 中国科学技术大学 | 一种基于cnn的快速图像检索方法 |
CN106250423A (zh) * | 2016-07-25 | 2016-12-21 | 上海交通大学 | 基于部分参数共享的深度卷积神经网络跨域服装检索方法 |
CN106227851A (zh) * | 2016-07-29 | 2016-12-14 | 汤平 | 基于深度卷积神经网络端对端的通过分层深度搜索的图像检索方法 |
Non-Patent Citations (4)
Title |
---|
"A Hashing Image Retrieval Method Based on Deep Learning and Local Feature Fusion";Yi-Liang Nie;《ICIC 2017:Intelligent Computer Theories and Application》;20170720;200-211 * |
"Fine-grained Categorization and Dataset Bootstrapping using Deep Metric Learning with Humans in the Loop";Yin Cui 等;《2016 IEEE Conference on Computer Vision and Pattern Recognition》;20160630;1153-1162 * |
"Going Deeper with Convolutions";Christian Szegedy 等;《IEEE Conference on Computer Vision and Pattern Recognition》;20151231;1-9 * |
"基于深度学习与特征融合的图像检索方法研究";聂一亮;《CNKI数据库》;20180317;1-59 * |
Also Published As
Publication number | Publication date |
---|---|
CN106682233A (zh) | 2017-05-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106682233B (zh) | 一种基于深度学习与局部特征融合的哈希图像检索方法 | |
CN107679250B (zh) | 一种基于深度自编码卷积神经网络的多任务分层图像检索方法 | |
Sharif et al. | Scene analysis and search using local features and support vector machine for effective content-based image retrieval | |
CN107256262B (zh) | 一种基于物体检测的图像检索方法 | |
Jain et al. | Content based image retrieval | |
EP2054855B1 (en) | Automatic classification of objects within images | |
CN107833213B (zh) | 一种基于伪真值自适应法的弱监督物体检测方法 | |
CN108038122B (zh) | 一种商标图像检索的方法 | |
CN104778242B (zh) | 基于图像动态分割的手绘草图图像检索方法及系统 | |
WO2017012277A1 (zh) | 一种图像中目标的检索方法和装置 | |
Niu et al. | A novel image retrieval method based on multi-features fusion | |
Zhu et al. | Deep residual text detection network for scene text | |
CN112163114B (zh) | 一种基于特征融合的图像检索方法 | |
CN104281572A (zh) | 一种基于互信息的目标匹配方法及其系统 | |
CN114860991A (zh) | 一种短视频去重方法及计算机可读存储介质 | |
JPH11203415A (ja) | 類似パターンカテゴリ識別辞書作成装置および方法 | |
Al-Jubouri | Content-based image retrieval: Survey | |
CN110674334B (zh) | 基于一致性区域深度学习特征的近重复图像检索方法 | |
CN115203408A (zh) | 一种多模态试验数据智能标注方法 | |
Amuthavalli et al. | Notice of Violation of IEEE Publication Principles: Sketch Based Image Retrieval System Using ExHoG | |
Zhu et al. | Content-based design patent image retrieval using structured features and multiple feature fusion | |
Kumar et al. | Automatic feature weight determination using indexing and pseudo-relevance feedback for multi-feature content-based image retrieval | |
Gupta et al. | A new approach for cbir feedback based image classifier | |
Hong et al. | Hybrid content-based trademark retrieval using region and contour features | |
Nayef et al. | Efficient symbol retrieval by building a symbol index from a collection of line drawings |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20200310 |