CN106503106B - 一种基于深度学习的图像哈希索引构建方法 - Google Patents

一种基于深度学习的图像哈希索引构建方法 Download PDF

Info

Publication number
CN106503106B
CN106503106B CN201610905518.9A CN201610905518A CN106503106B CN 106503106 B CN106503106 B CN 106503106B CN 201610905518 A CN201610905518 A CN 201610905518A CN 106503106 B CN106503106 B CN 106503106B
Authority
CN
China
Prior art keywords
hash
image
depth
network model
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610905518.9A
Other languages
English (en)
Other versions
CN106503106A (zh
Inventor
段立娟
赵重阳
陈军成
杨震
杜雯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Technology
Original Assignee
Beijing University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Technology filed Critical Beijing University of Technology
Priority to CN201610905518.9A priority Critical patent/CN106503106B/zh
Publication of CN106503106A publication Critical patent/CN106503106A/zh
Application granted granted Critical
Publication of CN106503106B publication Critical patent/CN106503106B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content

Landscapes

  • Engineering & Computer Science (AREA)
  • Library & Information Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于深度学习的图像哈希索引构建方法,属于图像检索技术领域。该方法首先划分图像数据集得到测试样本集、训练样本集和图像库,然后充分利用深度学习模型提取出的深度特征对图像语义具有很好表达能力这一特点,构建出两个深度卷积网络结构不同的深度哈希网络模型,然后将测试样本集合图像库中的每幅图像分别经两个模型的前向传播计算出对应的两组初始哈希码,再对同一幅图像的两组初始哈希码拼接融合后作为该图的融合哈希码,通过计算查询图像和图像库中每幅图像的融合哈希码间的汉明距离,并将距离按从小到大的顺序排列,得到相似图像检索结果。本发明使得对大规模图像的检索更准确有效。

Description

一种基于深度学习的图像哈希索引构建方法
技术领域
本发明涉及机器学习和图像检索技术领域,尤其是涉及到图像检索中的图像哈希索引构建方法,该方法以期能在大规模图像数据集上快速准确的检索到相似图像。
背景技术
随着计算机、互联网以及多媒体技术的高速发展和广泛应用及普及,社会正在向信息化社会发展。与此同时,互联网上的图像数据正在成几何式的增长,如何从包含有丰富信息的海量图像中快速、准确地找到自己想要的信息是图像检索技术的研究重点。自上世纪九十年代初,最常用的图像检索方法是基于内容的图像检索,该类方法一直备受研究人员的关注,其研究热点主要集中在图像特征表示、相似度度量及人工反馈等方面。现有的检索方法是通过提取图像的底层特征对图像进行描述,然后利用特征向量间的距离计算来判断两幅图像是否相似,为了提高检索的准确率,图像特征通常由高维向量表示,图像检索就成了在高维空间中的搜索,因此图像检索应用常常遇到“维度灾难”问题。同时,当图像库规模大到几十万或者海量时,必然要求有非常大的存储空间来保存图像的特征库,为此,当面向海量图像数据的检索任务时,需要一种行之有效的索引机制来加速检索过程,以达到实时性的需求。
为了提高检索速度,降低存储空间,有很多研究人员提出了不同的哈希方法,哈希法由于其快速查询能力和低内存耗费,成为了目前最流行、最有效的技术之一。该方法是将图像内容表达为二值化哈希序列,用该序列作为图像的特征,或者说是以哈希序列作为图像的索引进行近似最近邻搜索。现有的哈希方法可以分为两种:数据独立的方法和数据依赖的方法。数据独立的哈希法中,哈希函数是独立于训练数据随机生成的,具有代表性的数据独立哈希法有局部敏感哈希(locality-sensitive hashing,LSH)方法及其变种。而数据依赖哈希法尝试从训练数据中学习哈希函数,所以也叫作基于学习的哈希方法。和数据独立哈希法相比,数据依赖哈希法可以使用很短的哈希序列达到相当好的检索精度。
基于学习的哈希法可以被分为两类:无监督的哈希方法和有监督的方法。无监督的哈希方法仅仅利用图像的特征信息来进行训练,有代表性的无监督哈希法有迭代量化法(Iterative Quantization,ITQ),锚点图哈希(Anchor Graph Hashing,AGH)和离散图哈希(Discrete Graph Hahing,DGH)等。有监督的哈希方法尝试利用标签信息来学习哈希码。该类方法又可细分为三种不同的形式:基于单标签信息的,如离散哈希法(SupervisedDiscrete hashing,SDH);基于成对标签信息的,如最小化损失哈希法(Minimal LossHashing,MLH),有监督的核哈希法(Supervised Hashing with Kernels,KSH)和卷积神经网络哈希(Convolutional Neural Network Hashing,CNNH);以及基于排序标签信息的,如基于排序的有监督哈希法(Ranking-based Supervised hashing,RSH)。尽管目前有很多的哈希方法被提出,但大部分的哈希方法都是基于手工特征的,由于这些方法中手工特征和哈希函数的学习过程是独立的,因此手工特征和哈希过程不太适配,使得这些哈希方法达不到较满意的效果。为了解决特征不匹配问题,有很多研究人员提出将深度神经网络提取出的图像深度特征作为哈希函数的输入,提高检索效果,如CNNH方法,但该方法是一个两阶段哈希方法,不能对深度特征和哈希码进行同时学习,使得学习到的哈希函数有一定的局限性,该方法的提出者已对此作出了改进。还有研究人员提出了深度成对监督哈希法(DeepPairwise Supervised Hashing,DPSH),该方法能够同时对图像特征和哈希函数同时进行学习,提升了检索准确率。
发明内容
本发明的目的在于,针对上述传统的哈希方法的不足,提出一种基于深度学习的图像哈希索引构建方法。该方法充分利用深度学习的优势,使用不同结构的深度哈希网络同时对图像特征和哈希函数进行学习,然后融合从不同结构的深度哈希网络学习得到的哈希序列,使用融合后的哈希序列对图像库进行索引,提高图像检索的准确率。
实现本发明方法的主要思路是:选择两种不同结构的已训练的深度卷积网络模型,在每一种模型的最后一层添加一个与之全连接的哈希层,构建一个双路的深度哈希网络模型,再基于训练图像的标签信息,利用反向传播(BP)更新这两种网络模型各层的权值,训练得到两个不同结构的深度哈希网络模型,然后利用这两个模型分别计算出每幅图像的一对初始哈希码,之后将每幅图像的一对初始哈希码拼接融合后作为其最后的融合哈希码,通过计算并比较查询图像的融合哈希码与图像库中每幅图像的融合哈希码间的汉明距离,最终快速准确的检索得到查询图像的相似图像结果。
根据上述主要思路,本发明方法的具体实现包括如下步骤:
步骤1:划分数据集
将图像数据集分成两部分,一部分作为测试样本集,另一部分作为图像数据库,另外从图像库中取出一部分作为训练样本集。每个样本均包括一张图像及对应的类别标签;
步骤2:构建两个不同的深度哈希网络模型
深度哈希网络模型的结构是双路结构,每一路包含一个深度卷积网络和全连接的哈希层,两路结构完全相同,最后同时连接到损失层。构建两个这样的卷积结构不同的深度哈希网络模型;
步骤3:训练深度哈希网络模型
对其中一个深度哈希网络模型,利用训练样本集,将训练图像的任意两幅图像分别前向传播经过该模型的两路,然后将经过该网络计算后得到的损失用反向传播算法调整网络权重,同时对哈希网络的深度卷积网络和哈希层的参数进行学习,迭代一定次数后得到训练后的深度哈希模型。然后对另一个不同结构的深度哈希网络模型进行同样的操作,经训练得到另一个结构不同的深度哈希模型;
步骤4:计算哈希码并融合
从步骤三中训练得到的两个结构不同的深度哈希网络模型后,将测试样本集中的每张图像分别作为两个深度哈希网络模型的输入,经前向传播得到测试样本集的初始哈希码矩阵Htest1、Htest2,将Htest1和Htest2中相同图像对应的两个哈希码以维度拼接的方式融合得到测试样本集融合后的哈希码Htest。然后对图像图像库中的每幅图像做相同的操作,得到图像库的初始哈希码矩阵Hbase1、Hbase2,及最后融合后的哈希码Hbase;
步骤5:计算汉明距离
从Htest取出任意一幅测试图像的哈希码Ht,计算该哈希码Ht与图像库的哈希码矩阵Hbase每一行之间的汉明距离,然后将汉明距离以行向量的形式组合起来得到一个汉明距离列向量;
步骤6:排序输出检索结果
将步骤5中得到的汉明距离向量的数值依照从小到大的顺序进行排序,顺序输出对应的原始图像,得到图像检索结果。
本发明与现有技术相比,具有以下明显的优势和有益效果:本发明提出一种基于深度学习的图像哈希索引构建方法,采用不同的深度卷积网络,训练出两个结构不同的深度哈希网络模型,每个模型都能够同时对图像特征和哈希码进行学习,实现端到端的学习和哈希码计算。将从不同结构的深度哈希网络模型中学习到的不同哈希码进行融合后,能够更有效的对图像进行哈希表达,解决了基于单一深度卷积网络学习到的哈希码判别力不足的问题,从而提高了图像检索的准确率。
附图说明
图1为本发明所涉及方法总流程框图;
图2为本发明所涉及深度哈希网络模型的架构图;
图3为本发明不同模型相同哈希比特位对应的MAP曲线图;
图4为本发明不同模型相同哈希比特位对应的recall-precision曲线图;
具体实施方式
下面结合附图对本发明的技术方案做进一步的描述,附图1为本发明所涉及方法整体流程图。
步骤1,划分数据集
本发明所述方法实施过程中的数据库来源于公开标准数据集CIFAR-10,该数据集包含有60000张32*32像素的彩色图片,该数据集共有10类,每一类6000张图像,该数据集是一个单标签数据集,亦即每一张图片只属于十类中的一类。将图像数据集分成两部分,一部分作为测试样本集,另一部分作为图像数据库,另外从图像库中随机选取一部分作为训练深度哈希网络模型的训练集。具体实施时,从数据集的每类中随机选取了100张,共计1000张作为测试样本集I={I1,I2,……,I1000},剩余的图像集作为图像库,并从图像库的每类中随机选取了500张,共计5000张作为训练样本集T={T1,T2,……,T5000},每个样本均包括一张图像及对应的类别标签,根据训练图像样本的类别标签信息计算得出一个相似矩阵S={sij},如果图像xi和图像xj相似,那么sij=1,否则sij=0。
步骤2:构建深度哈希网络模型
深度哈希网络模型的结构是双路结构,每一路包含一个深度卷积网络和全连接的哈希层,两路结构完全相同,最后同时连接到损失层。构建两个这样的卷积结构不同的深度哈希网络模型。在具体实施过程中,采用的深度卷积网络是已训练的模型VGG-F和Alexnet模型,这两个已训练模型可以从http://www.vlfeat.org/matconvnet/pretrained/下载得到。由于两个深度哈希网络模型的不同之处主要在于深度卷积网络部分的结构不同,现以深度哈希网络模型其中之一作为说明,模型架构图如附图2所示,深度哈希网络模型的前七层是深度卷积网络,第八层是与深度卷积网络最后一层全连接的哈希层,该层包含有c个结点,图像经过深度哈希网络模型前向传播后输出为c位的二值哈希码bi∈{-1,1}c,在实施过程中设置c为32,即最后拼接融合后得到的二值哈希码的长度为64位。哈希码可通过下面公式计算得到。
bi=h(xi)=sgn(WTφ(xi;θ)+v)=sgn(ui)
其中sgn(·)是符号函数,W∈R4096×c为第七层与哈希层间的权值矩阵,φ(xi;θ)表示的是样本xi的输出,v∈Rc为一个偏置向量,其中ui=WT(φ(Xi;θ)+v),表示深度哈希网络模型前七层的输出。
图像经过深度哈希网络模型前向传播后得到二值哈希编码,然后基于该哈希编码和图像的标签信息,计算哈希编码的损失,然后反向传播调整网络参数。定义深度哈希网络模型损失层的损失函数为:
其中通过最小化这个损失函数可使得两幅相似图像哈希码间的汉明距离尽可能的小,同时使得两幅不相似的图像哈希码间的汉明距离尽可能的大。
步骤3:训练深度哈希网络模型
根据步骤2构建的深度哈希网络模型,训练两个深度卷积网络结构不同的深度哈希网络模型。两个模型各层结构配置分别如表1、表2所示。在训练过程中,将训练数据集中的任意两幅图像分别经前向传播通过两个深度哈希网络模型后,得到ui,然后用随机梯度下降方法来学习深度哈希网络模型各层的参数,但是由于sgn(·)函数是不连续的,可把损失函数中的θij替换为然后用下面的公式计算出损失的导数。
计算得到每幅训练图像的损失的导数后,将其用反向传播算法反向传播到网络各层,更新调整深度哈希网络模型各层间的连接权值,如此循环迭代n次,最终得到两个训练后的不同结构的深度哈希网络模型M1和M2。在实施例中,设置n的值为200。
步骤4:计算哈希码并融合
从步骤三中训练得到的两个结构不同的深度哈希网络模型后,将测试样本集中的每张图像分别作为两个深度哈希网络模型的输入,经前向传播得到测试样本集的初始哈希码矩阵Htest1、Htest2,将Htest1和Htest2中相同图像对应的两个哈希码以维度拼接的方式融合得到测试样本集融合后的哈希码Htest。然后对图像图像库中的每幅图像做相同的操作,得到图像库的初始哈希码矩阵Hbase1、Hbase2,及最后融合后的哈希码Hbase。其中Hbase1、Hbase2、Htest1和Htest2中的每一行代表一幅图像的初始哈希码,Htrain和Hbase中的每一行代表一幅图像的融合后的哈希码。
步骤5:计算融合哈希码的汉明距离
对于1000幅查询图像中的任意一副图像,从Htest取出与查询图像相对应的融合后的哈希码Ht,分别计算哈希码Ht与数据库中每一幅图像的融合哈希码间的汉明距离,得到查询图像与数据库中每幅图像的汉明距离,将查询图像的汉明距离的集合表示为一个汉明距离向量。
步骤6:排序输出检索结果
由于汉明距离的数值越小,两幅图像越相似,将步骤5中得到的查询图像的汉明距离向量的数值依照从小到大的顺序进行排序,按照顺序输出指定个数的相似图像,即可得到top k幅相似图像的检索结果。最后,根据检索结果中每幅图像的类别标签和查询图像的类别标签是否相同,计算出查询图像的检索MAP值和recall-precision值。
从附图3、附图4可以看出,以相同哈希编码位数进行检索时本发明提出的方法比使用单一深度哈希网络模型的检索结果有更高的准确度。
表1深度哈希模型M1各层结构配置表
Layer Configuration
conv1 filter 64×11×11,stride 4×4,pad 0,LRN,pool 2×2
conv1 filter 256×5×5,stride 1×1,pad 2,LRN,pool 2×2
conv1 filter 256×3×3,stride 1×1,pad 1
conv1 filter 256×3×3,stride 1×1,pad 1
conv1 filter 256×3×3,stride 1×1,pad 1,pool 2×2
full6 4096
full7 4096
full8 哈希码长度c
表2深度哈希模型M2各层结构配置表
Layer Configuration
conv1 filter 96×11×11,stride 4×4,pad 0,LRN,pool 2×2
conv1 filter 256×5×5,stride 1×1,pad 2,LRN,pool 2×2
conv1 filter 384×3×3,stride 1×1,pad 1
conv1 filter 384×3×3,stride 1×1,pad 1
conv1 filter 256×3×3,stride 1×1,pad 1,pool 2×2
full6 4096
full7 4096
full8 哈希码长度c

Claims (2)

1.一种基于深度学习的图像哈希索引构建方法,其特征在于:本方法选择两种不同结构的已训练的深度卷积网络模型,在每一种模型的最后一层添加一个与之全连接的哈希层,构建一个双路的深度哈希网络模型,再基于训练图像的标签信息,利用反向传播更新这两种网络模型各层的权值,训练得到两个不同结构的深度哈希网络模型,然后利用这两个模型分别计算出每幅图像的一对初始哈希码,之后将每幅图像的一对初始哈希码拼接融合后作为其最后的融合哈希码,通过计算并比较查询图像的融合哈希码与图像库中每幅图像的融合哈希码间的汉明距离,最终快速准确的检索得到查询图像的相似图像结果;
本方法的具体实现包括如下步骤:
步骤1:划分数据集
将图像数据集分成两部分,一部分作为测试样本集,另一部分作为图像数据库,另外从图像库中取出一部分作为训练样本集;每个样本均包括一张图像及对应的类别标签;
步骤2:构建两个不同的深度哈希网络模型
深度哈希网络模型的结构是双路结构,每一路包含一个深度卷积网络和全连接的哈希层,两路结构完全相同,最后同时连接到损失层;构建两个这样的卷积结构不同的深度哈希网络模型;
步骤3:训练深度哈希网络模型
对其中一个深度哈希网络模型,利用训练样本集,将训练图像的任意两幅图像分别前向传播经过该模型的两路,然后将经过该网络计算后得到的损失用反向传播算法调整网络权重,同时对哈希网络的深度卷积网络和哈希层的参数进行学习,迭代一定次数后得到训练后的深度哈希模型;然后对另一个不同结构的深度哈希网络模型进行同样的操作,经训练得到另一个结构不同的深度哈希模型;
步骤4:计算哈希码并融合
从步骤三中训练得到的两个结构不同的深度哈希网络模型后,将测试样本集中的每张图像分别作为两个深度哈希网络模型的输入,经前向传播得到测试样本集的初始哈希码矩阵Htest1、Htest2,将Htest1和Htest2中相同图像对应的两个哈希码以维度拼接的方式融合得到测试样本集融合后的哈希码Htest;然后对图像图像库中的每幅图像做相同的操作,得到图像库的初始哈希码矩阵Hbase1、Hbase2,及最后融合后的哈希码Hbase;
步骤5:计算汉明距离
从Htest取出任意一幅测试图像的哈希码Ht,计算该哈希码Ht与图像库的哈希码矩阵Hbase每一行之间的汉明距离,然后将汉明距离以行向量的形式组合起来得到一个汉明距离列向量;
步骤6:排序输出检索结果
将步骤5中得到的汉明距离向量的数值依照从小到大的顺序进行排序,顺序输出对应的原始图像,得到图像检索结果。
2.根据权利要求1所述的一种基于深度学习的图像哈希索引构建方法,其特征在于:
步骤1,划分数据集
本方法实施过程中的数据库来源于公开标准数据集,该数据集包含有60000张32*32像素的彩色图片,该数据集共有10类,每一类6000张图像,该数据集是一个单标签数据集,亦即每一张图片只属于十类中的一类;将图像数据集分成两部分,一部分作为测试样本集,另一部分作为图像数据库,另外从图像库中随机选取一部分作为训练深度哈希网络模型的训练集;具体实施时,从数据集的每类中随机选取了100张,共计1000张作为测试样本集I={I1,I2,……,I1000},剩余的图像集作为图像库,并从图像库的每类中随机选取了500张,共计5000张作为训练样本集T={T1,T2,……,T5000},每个样本均包括一张图像及对应的类别标签,根据训练图像样本的类别标签信息计算得出一个相似矩阵S={sij},如果图像xi和图像xj相似,那么sij=1,否则sij=0;
步骤2:构建深度哈希网络模型
深度哈希网络模型的结构是双路结构,每一路包含一个深度卷积网络和全连接的哈希层,两路结构完全相同,最后同时连接到损失层;构建两个这样的卷积结构不同的深度哈希网络模型;在具体实施过程中,采用的深度卷积网络是已训练的模型VGG-F和Alexnet模型,这两个已训练模型能够下载得到;由于两个深度哈希网络模型的不同之处主要在于深度卷积网络部分的结构不同,深度哈希网络模型的前七层是深度卷积网络,第八层是与深度卷积网络最后一层全连接的哈希层,该层包含有c个结点,图像经过深度哈希网络模型前向传播后输出为c位的二值哈希码bi∈{-1,1}c,在实施过程中设置c为32,即最后拼接融合后得到的二值哈希码的长度为64位;哈希码通过下面公式计算得到;
bi=h(xi)=sgn(WTφ(xi;θ)+v)=sgn(ui)
其中sgn(·)是符号函数,W∈R4096×c为第七层与哈希层间的权值矩阵,φ(xi;θ)表示的是样本xi的输出,v∈Rc为一个偏置向量,其中ui=WT(φ(Xi;θ)+v),表示深度哈希网络模型前七层的输出;
图像经过深度哈希网络模型前向传播后得到二值哈希编码,然后基于该哈希编码和图像的标签信息,计算哈希编码的损失,然后反向传播调整网络参数;定义深度哈希网络模型损失层的损失函数为:
其中通过最小化这个损失函数可使得两幅相似图像哈希码间的汉明距离尽可能的小,同时使得两幅不相似的图像哈希码间的汉明距离尽可能的大;
步骤3:训练深度哈希网络模型
根据步骤2构建的深度哈希网络模型,训练两个深度卷积网络结构不同的深度哈希网络模型;在训练过程中,将训练数据集中的任意两幅图像分别经前向传播通过两个深度哈希网络模型后,得到ui,然后用随机梯度下降方法来学习深度哈希网络模型各层的参数,但是由于sgn(·)函数是不连续的,可把损失函数中的θij替换为然后用下面的公式计算出损失的导数;
计算得到每幅训练图像的损失的导数后,将其用反向传播算法反向传播到网络各层,更新调整深度哈希网络模型各层间的连接权值,如此循环迭代n次,最终得到两个训练后的不同结构的深度哈希网络模型M1和M2
步骤4:计算哈希码并融合
从步骤三中训练得到的两个结构不同的深度哈希网络模型后,将测试样本集中的每张图像分别作为两个深度哈希网络模型的输入,经前向传播得到测试样本集的初始哈希码矩阵Htest1、Htest2,将Htest1和Htest2中相同图像对应的两个哈希码以维度拼接的方式融合得到测试样本集融合后的哈希码Htest;然后对图像图像库中的每幅图像做相同的操作,得到图像库的初始哈希码矩阵Hbase1、Hbase2,及最后融合后的哈希码Hbase;其中Hbase1、Hbase2、Htest1和Htest2中的每一行代表一幅图像的初始哈希码,Htrain和Hbase中的每一行代表一幅图像的融合后的哈希码;
步骤5:计算融合哈希码的汉明距离
对于1000幅查询图像中的任意一副图像,从Htest取出与查询图像相对应的融合后的哈希码Ht,分别计算哈希码Ht与数据库中每一幅图像的融合哈希码间的汉明距离,得到查询图像与数据库中每幅图像的汉明距离,将查询图像的汉明距离的集合表示为一个汉明距离向量;
步骤6:排序输出检索结果
由于汉明距离的数值越小,两幅图像越相似,将步骤5中得到的查询图像的汉明距离向量的数值依照从小到大的顺序进行排序,按照顺序输出指定个数的相似图像,即可得到topk幅相似图像的检索结果;最后,根据检索结果中每幅图像的类别标签和查询图像的类别标签是否相同,计算出查询图像的检索MAP值和召回准确率recall-precision值。
CN201610905518.9A 2016-10-17 2016-10-17 一种基于深度学习的图像哈希索引构建方法 Active CN106503106B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610905518.9A CN106503106B (zh) 2016-10-17 2016-10-17 一种基于深度学习的图像哈希索引构建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610905518.9A CN106503106B (zh) 2016-10-17 2016-10-17 一种基于深度学习的图像哈希索引构建方法

Publications (2)

Publication Number Publication Date
CN106503106A CN106503106A (zh) 2017-03-15
CN106503106B true CN106503106B (zh) 2019-10-18

Family

ID=58294490

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610905518.9A Active CN106503106B (zh) 2016-10-17 2016-10-17 一种基于深度学习的图像哈希索引构建方法

Country Status (1)

Country Link
CN (1) CN106503106B (zh)

Families Citing this family (47)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107016708B (zh) * 2017-03-24 2020-06-05 杭州电子科技大学 一种基于深度学习的图像哈希编码方法
CN107402947B (zh) * 2017-03-29 2020-12-08 北京猿力教育科技有限公司 图片检索模型建立方法和装置、图片检索方法和装置
CN108805280B (zh) * 2017-04-26 2020-11-03 深圳荆虹科技有限公司 一种图像检索的方法和装置
CN107169425A (zh) * 2017-04-26 2017-09-15 深圳美云智数科技有限公司 一种商品属性的识别方法及装置
CN107180079B (zh) * 2017-04-28 2020-04-28 华南理工大学 基于卷积神经网络以及树与哈希结合索引的图像检索方法
CN107291813B (zh) * 2017-05-19 2021-01-01 南京邮电大学 基于语义分割场景的示例搜索方法
WO2019010640A1 (zh) * 2017-07-12 2019-01-17 中国科学院自动化研究所 图像美感评估方法及装置
CN107480261B (zh) * 2017-08-16 2020-06-16 上海荷福人工智能科技(集团)有限公司 一种基于深度学习细粒度人脸图像快速检索方法
CN107871014A (zh) * 2017-11-23 2018-04-03 清华大学 一种基于深度融合哈希的大数据跨模态检索方法及系统
CN107992611B (zh) * 2017-12-15 2018-12-28 清华大学 基于柯西分布哈希方法的高维数据检索方法与系统
CN108154182A (zh) * 2017-12-25 2018-06-12 合肥阿巴赛信息科技有限公司 基于成对比较网络的珠宝相似性度量方法
CN108491430B (zh) * 2018-02-09 2021-10-15 北京邮电大学 一种基于对特征方向进行聚类的无监督哈希检索方法
CN108304573A (zh) * 2018-02-24 2018-07-20 江苏测联空间大数据应用研究中心有限公司 基于卷积神经网络和监督核哈希的目标检索方法
CN108427738B (zh) * 2018-03-01 2022-03-25 中山大学 一种基于深度学习的快速图像检索方法
CN108536769B (zh) * 2018-03-22 2023-01-03 深圳市安软慧视科技有限公司 图像分析方法、搜索方法及装置、计算机装置及存储介质
CN108491528B (zh) * 2018-03-28 2021-09-21 苏州大学 一种图像检索方法、系统及装置
CN108959522B (zh) * 2018-04-26 2022-06-17 浙江工业大学 基于半监督对抗生成网络的迁移检索方法
CN108932314A (zh) * 2018-06-21 2018-12-04 南京农业大学 一种基于深度哈希学习的菊花图像内容检索方法
CN109086866B (zh) * 2018-07-02 2021-07-30 重庆大学 一种适用于嵌入式设备的部分二值卷积方法
CN109166615B (zh) * 2018-07-11 2021-09-10 重庆邮电大学 一种随机森林哈希的医学ct图像存储与检索方法
CN109165306B (zh) * 2018-08-09 2021-11-23 长沙理工大学 基于多任务哈希学习的图像检索方法
CN109241313B (zh) * 2018-08-14 2021-11-02 大连大学 一种基于高阶深度哈希学习的图像检索方法
CN109241322B (zh) * 2018-08-28 2020-09-11 北京地平线机器人技术研发有限公司 代码生成方法、代码生成装置和电子设备
CN111127509B (zh) * 2018-10-31 2023-09-01 杭州海康威视数字技术股份有限公司 目标跟踪方法、装置和计算机可读存储介质
GB2580171B (en) * 2018-12-21 2021-02-17 Imagination Tech Ltd Methods and systems for selecting quantisation parameters for deep neural networks using back-propagation
CN109800314A (zh) * 2019-01-03 2019-05-24 上海大学 一种利用深度卷积网络生成用于图像检索的哈希码的方法
CN109766463B (zh) * 2019-01-10 2021-03-12 清华大学 应用于图像检索的半监督哈希学习方法及装置
CN109933682B (zh) * 2019-01-11 2022-01-04 上海交通大学 一种基于语义与内容信息结合的图像哈希检索方法及系统
CN109960738B (zh) * 2019-03-15 2020-12-08 西安电子科技大学 基于深度对抗哈希学习的大规模遥感影像内容检索方法
CN109960737B (zh) * 2019-03-15 2020-12-08 西安电子科技大学 半监督深度对抗自编码哈希学习的遥感影像内容检索方法
CN113808062A (zh) * 2019-04-28 2021-12-17 深圳市商汤科技有限公司 一种图像处理方法及装置
CN110390352A (zh) * 2019-06-26 2019-10-29 华中科技大学 一种基于相似性哈希的图像暗数据价值评估方法
CN110766065A (zh) * 2019-10-18 2020-02-07 山东浪潮人工智能研究院有限公司 一种基于深度超信息的哈希学习方法
CN110781902A (zh) * 2019-10-28 2020-02-11 山东浪潮人工智能研究院有限公司 一种鲁棒二值属性学习方法及系统
CN111177432B (zh) * 2019-12-23 2020-11-03 北京航空航天大学 一种基于分层深度哈希的大规模图像检索方法
CN111563180A (zh) * 2020-04-08 2020-08-21 西北工业大学 一种基于深度哈希方法的商标图像检索方法
CN111723220B (zh) * 2020-06-18 2023-03-10 中南大学 基于注意力机制和哈希的图像检索方法、装置及存储介质
CN111914944B (zh) * 2020-08-18 2022-11-08 中国科学院自动化研究所 基于动态样本选择和损失一致性的物体检测方法和系统
CN112269854B (zh) * 2020-11-18 2022-06-10 浙江大学 基于倒排索引的大规模数据相似特征检测方法
CN112446431B (zh) * 2020-11-27 2024-08-27 鹏城实验室 特征点提取与匹配方法、网络、设备及计算机存储介质
CN112597324A (zh) * 2020-12-15 2021-04-02 武汉工程大学 一种基于相关滤波的图像哈希索引构建方法、系统及设备
CN113032612B (zh) * 2021-03-12 2023-04-11 西北大学 一种多目标图像检索模型的构建方法及检索方法和装置
CN113282775B (zh) * 2021-05-27 2023-10-03 上海焱祺华伟信息系统技术有限公司 一种基于局部敏感哈希算法的相似人群的扩展方法
CN113326393B (zh) * 2021-05-31 2023-04-07 深圳前瞻资讯股份有限公司 一种基于深度哈希特征和异构并行处理的图像检索方法
CN113761262B (zh) * 2021-09-03 2024-02-20 奇安信科技集团股份有限公司 图像的检索类别确定方法、系统以及图像检索方法
CN114003635B (zh) * 2021-09-27 2023-01-31 中国科学院自动化研究所 一种推荐信息获取方法、装置、设备及产品
CN116303473B (zh) * 2023-05-11 2024-04-19 长鹰恒容电磁科技(成都)有限公司 一种数据库的构建方法、装置、设备及可读存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104794504A (zh) * 2015-04-28 2015-07-22 浙江大学 基于深度学习的图形图案文字检测方法
CN105512289A (zh) * 2015-12-07 2016-04-20 郑州金惠计算机系统工程有限公司 基于深度学习和哈希的图像检索方法
CN105512273A (zh) * 2015-12-03 2016-04-20 中山大学 一种基于可变长深度哈希学习的图像检索方法
US9424533B1 (en) * 2011-09-24 2016-08-23 Z Advanced Computing, Inc. Method and system for predicting an outcome of an event

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11221990B2 (en) * 2015-04-03 2022-01-11 The Mitre Corporation Ultra-high compression of images based on deep learning

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9424533B1 (en) * 2011-09-24 2016-08-23 Z Advanced Computing, Inc. Method and system for predicting an outcome of an event
CN104794504A (zh) * 2015-04-28 2015-07-22 浙江大学 基于深度学习的图形图案文字检测方法
CN105512273A (zh) * 2015-12-03 2016-04-20 中山大学 一种基于可变长深度哈希学习的图像检索方法
CN105512289A (zh) * 2015-12-07 2016-04-20 郑州金惠计算机系统工程有限公司 基于深度学习和哈希的图像检索方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
多媒体技术研究:2014——深度学习与媒体计算;吴飞等;《中国图象图形学报》;20151116;第1423页-1433页 *

Also Published As

Publication number Publication date
CN106503106A (zh) 2017-03-15

Similar Documents

Publication Publication Date Title
CN106503106B (zh) 一种基于深度学习的图像哈希索引构建方法
CN109299216B (zh) 一种融合监督信息的跨模态哈希检索方法和系统
CN106407352B (zh) 基于深度学习的交通图像检索方法
CN110414432A (zh) 对象识别模型的训练方法、对象识别方法及相应的装置
CN113177616B (zh) 图像分类方法、装置、设备及存储介质
CN111931061B (zh) 标签映射方法、装置、计算机设备及存储介质
CN111949885B (zh) 一种面向旅游景点的个性化推荐方法
CN107330074A (zh) 基于深度学习和哈希编码的图像检索方法
CN112016601B (zh) 基于知识图谱增强小样本视觉分类的网络模型构建方法
CN109977250A (zh) 融合语义信息和多级相似性的深度哈希图像检索方法
CN109063113A (zh) 一种基于不对称深度离散哈希的快速图像检索方法、检索模型及模型构建方法
Islam et al. InceptB: a CNN based classification approach for recognizing traditional bengali games
CN109063112A (zh) 一种基于多任务学习深度语义哈希的快速图像检索方法、模型及模型构建方法
CN113962358A (zh) 一种基于时序超图注意力神经网络的信息扩散预测方法
CN104156464A (zh) 基于微视频特征数据库的微视频检索方法及装置
CN106649886A (zh) 一种利用三元组标签的深度监督散列进行图像检索方法
CN107463996A (zh) 自步‑协同训练学习方法
CN113220897A (zh) 基于实体-关系关联图的知识图谱嵌入模型
CN108446605B (zh) 复杂背景下双人交互行为识别方法
CN114329181A (zh) 一种题目推荐方法、装置及电子设备
CN117237559A (zh) 面向数字孪生城市的三维模型数据智能分析方法及系统
CN114282059A (zh) 视频检索的方法、装置、设备及存储介质
CN113780470A (zh) 一种基于自适应多通道交叉图卷积网络的图分类方法
CN109960732A (zh) 一种基于鲁棒监督的深度离散哈希跨模态检索方法及系统
CN114239730B (zh) 一种基于近邻排序关系的跨模态检索方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20170315

Assignee: Henan Wucheng Agricultural Technology Co.,Ltd.

Assignor: Beijing University of Technology

Contract record no.: X2024980000199

Denomination of invention: A method for constructing image hash indexes based on deep learning

Granted publication date: 20191018

License type: Common License

Record date: 20240105

Application publication date: 20170315

Assignee: Henan zhuodoo Information Technology Co.,Ltd.

Assignor: Beijing University of Technology

Contract record no.: X2024980000138

Denomination of invention: A method for constructing image hash indexes based on deep learning

Granted publication date: 20191018

License type: Common License

Record date: 20240104

Application publication date: 20170315

Assignee: Luoyang Lexiang Network Technology Co.,Ltd.

Assignor: Beijing University of Technology

Contract record no.: X2024980000083

Denomination of invention: A method for constructing image hash indexes based on deep learning

Granted publication date: 20191018

License type: Common License

Record date: 20240104

EE01 Entry into force of recordation of patent licensing contract