CN113377981B - 基于多任务深度哈希学习的大规模物流商品图像检索方法 - Google Patents
基于多任务深度哈希学习的大规模物流商品图像检索方法 Download PDFInfo
- Publication number
- CN113377981B CN113377981B CN202110732492.3A CN202110732492A CN113377981B CN 113377981 B CN113377981 B CN 113377981B CN 202110732492 A CN202110732492 A CN 202110732492A CN 113377981 B CN113377981 B CN 113377981B
- Authority
- CN
- China
- Prior art keywords
- image
- hash
- hash code
- learning
- retrieval
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
- G06V10/443—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
- G06V10/449—Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters
- G06V10/451—Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters with interaction between the filter responses, e.g. cortical complex cells
- G06V10/454—Integrating the filters into a hierarchical structure, e.g. convolutional neural networks [CNN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/53—Querying
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/56—Information retrieval; Database structures therefor; File system structures therefor of still image data having vectorial format
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/51—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/761—Proximity, similarity or dissimilarity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/7715—Feature extraction, e.g. by transforming the feature space, e.g. multi-dimensional scaling [MDS]; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/776—Validation; Performance evaluation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/94—Hardware or software architectures specially adapted for image or video understanding
- G06V10/95—Hardware or software architectures specially adapted for image or video understanding structured as a network, e.g. client-server architectures
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Medical Informatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biodiversity & Conservation Biology (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Abstract
一种基于多任务深度哈希学习的大规模物流商品图像检索方法,通过基于多任务的思想,可以同时学到多种长度的哈希码作为图像的高级表征。与传统的单任务相比,解决了单任务下模型重新训练导致的硬件资源浪费和时间成本开销大等弊端。与传统仅仅考虑学习单个哈希码作为图像的表征并来用检索相比。挖掘了多种长度哈希码之间的信息关联,设计了互信息损失来增强其哈希码的表征能力,解决了单个哈希码表征能力不强的弊端,进而提高哈希码的检索性能。同时模型是基于端到端的学习,即图像的特征提取和哈希码的学习是同时进行的,与传统的线性哈希方法相比,模型结构直观,容易迁移与部署实现。
Description
技术领域
本发明涉及图像处理技术领域,具体涉及一种基于多任务深度哈希学习的大规模物流商品图像检索方法。
背景技术
随着互联网和电子技术的高速发展,网上的信息量的增长异常迅速,几乎每秒钟都会上传大量的文本,图像,音频等多媒体的数据。这给很多需要进行高效最近邻搜索的领域带了极大的挑战,尤其是大规模的图像检索。当数据库中的图像数据量较少的时候,我们可以使用最简单直接的穷尽搜索方式:即将数据库中的点与查询点一一比较欧式距离,最终根据距离的大小排序。时间复杂度为线性复杂度O(dn),d和n分别是数据的维度和样本数。但是,当图像的数据量的规模比较庞大,如有上百万到上亿张图像的时候,线性搜索的方式已经不适用。另外,如在计算机视觉领域,已经越来越倾向使用高维度数据或者结构化的数据在更加精确地表达物品图像信息,并且使用复杂的相似度公式计算物品图像间的距离。在这些情况下,穷尽搜索的方式存在很大的局限性,无法高效的地完成最近邻搜索。
因此,人们开始使用近似最近邻搜索(Approximate Nearest Neighbor Search)方法快速地搜索有效解。而哈希方法是一类广泛研究的近似最近邻搜索算法,其能将文档、图像、视频等多媒体信息转换成一个紧凑的二进制编码,并保留原始数据间的相似性关系。该二进制编码(也称哈希码)间的距离度量使用的是汉明距离,其可以通过硬件的异或运算进行快速求解。因此,哈希方法能够在存储和效率上具备极大的优势,这也造成了其成为最流行的近似最近邻搜索算法之一。本发明面向的是物流行业的大规模图像检索领域,那么如何快速有效的从数据库中检索出我们需要的图片成为问题。而基于最近邻算法的哈希学习凭借其优势成为近些年来在大规模数据上做检索的利器。
大多数的哈希方法首先为用来检索的哈希码预定一个固定的长度(例如:16,32,48等)。然后训练模型学习这个长度的哈希码作为图像的高级表征并用来快速有效的检索大规模的多媒体数据。如果预定义好哈希码的长度,当需求发生改变,我们需要另一长度的哈希码用做表征和检索,我们就需要重新训练模型学习新的长度的哈希码,这就造成了硬件资源浪费和时间成本的增加。其次,我们知道哈希码是原始样本的紧凑表示,一个样本可以用不同长度的哈希码表示。直观的来说,代表相同样本的不同长度的哈希码反映与原始样本不同类型的特定信息。如果我们将它们视为原始样本的不同试图,不同视图之间应该存在一定的区别和联系。如果我们仅仅考虑一种长度的哈希码,则会忽略它们之间潜在的关联,进而造成交互信息的损失,导致表征能力的不足和检索精度处于较低的水平。而且大多数线性非深度的哈希方法,特征提取和哈希函数学习具有异步性。哈希函数的设计较为复杂,且模型的优化方法更是一个难点。
发明内容
本发明为了克服以上技术的不足,提供了一种提高哈希检索性能的基于多任务深度哈希学习的大规模物流商品图像检索方法。
本发明克服其技术问题所采用的技术方案是:
一种基于多任务深度哈希学习的大规模物流商品图像检索方法,包括如下步骤:
a)对输入的物流商品图像xi进行图像预处理,根据图像xi的标签构建物流商品图像之间的相似度矩阵S;
b)将预处理后的物流商品图像经过卷积、池化处理后得到图像的一维特征向量himg,将一维特征向量himg作为图像低级特征;
c)将图像低级特征himg输入多分支的网络中得到多个长度哈希码表示的图像的高级表征Bk,多分支网络由N个相同结构的分支组成;
d)通过公式计算相似度损失函数SILoss,sij为第i张图像与第j张图像之间的相似度,sij∈{1,0},sij取值为1时表示第i张图像与第j张图像相似,sij取值为0时表示第i张图像与第j张图像不相似,bi为第i张图像数据的二值哈希码,bj为第j张图像数据的二值哈希码,T为转置;
e)通过公式计算互信息损失函数MILoss,式中Bk为第k个分支输出的哈希码,k∈<0,...,N-1>,Bk+1为第k+1个分支输出的哈希码,Wk为将第k个分支输出的哈希码映射到第k+1个分支输出的哈希码的映射矩阵,γk为正则化参数,||·||1为L1范数,ak为优化参数;
f)利用随机梯度下降算法对相似度损失函数SILoss和互信息损失函数MILoss进行优化,优化后重复执行步骤a)至步骤e)大于等于M次,得到训练后的模型;g)将数据库中的图像数据输入到步骤f)中训练后的模型中,得到每张图像的不同长度的二值哈希码表示组合Bdatabase;
h)将需要检索的图片imgquery输入到步骤f)中训练后的模型中,得到需要检索图片imgquery的二值哈希码表示组合Bquery;
i)通过公式计算汉明距离DistHamming,将计算得到的汉明距离DistHamming基于Average Precision的度量方式返回所有检索图片查询集的平均检索精度Mean Average Precision,完成相似性检索。
优选的,步骤b)中有5个卷积层,每个卷积层后接入一个池化层,所述卷积层采用3*3大小的卷积核,所述池化层采用2*2大小的池化核,所述卷积层和池化层均采用Relu激活函数。
优选的,步骤c)中多分支网络由N个相同结构的分支组成,每个分支内部由3层全连接层相互串联构成。
优选的,步骤c)中N取值为大于0的正整数。
优选的,步骤f)中M取值为5000。
本发明的有益效果是:通过基于多任务的思想,可以同时学到多种长度的哈希码作为图像的高级表征。与传统的单任务相比,解决了单任务下模型重新训练导致的硬件资源浪费和时间成本开销大等弊端。与传统仅仅考虑学习单个哈希码作为图像的表征并来用检索相比。本专利挖掘了多种长度哈希码之间的信息关联,设计了互信息损失来增强其哈希码的表征能力,解决了单个哈希码表征能力不强的弊端,进而提高哈希码的检索性能。同时模型是基于端到端的学习,即图像的特征提取和哈希码的学习是同时进行的,与传统的线性哈希方法相比,模型结构直观,容易迁移与部署实现。可以很好的扩展到大规模的图像检索上,所以在物流行业大规模的物品图像检索中前景较好。
附图说明
图1为本发明的多任务特征提取的方法流程图;
图2为本发明的哈希码学习的方法流程图。
具体实施方式
下面结合附图1、附图2对本发明做进一步说明。
一种基于多任务深度哈希学习的大规模物流商品图像检索方法,包括如下步骤:
a)对输入的物流商品图像xi进行图像预处理,根据图像xi的标签构建物流商品图像之间的相似度矩阵S。
b)将预处理后的物流商品图像经过卷积、池化处理后得到图像的一维特征向量himg,通过一定数量的卷积核和池化核的堆叠并对图像数据的处理得到图像的一维特征向量himg作为图像低级特征。
c)采用硬参数共享网络:低级特征网络结构相同,参数共享。高级特征网络结构相同,但是分支网络的参数根据所生成的高级特征不同进而产生差异化,将图像低级特征himg输入多分支的网络中得到多个长度哈希码表示的图像的高级表征Bk,多分支网络由N个相同结构的分支组成。
d)通过公式计算相似度损失函数SILoss,sij为第i张图像与第j张图像之间的相似度,sij∈{1,0},sij取值为1时表示第i张图像与第j张图像相似,sij取值为0时表示第i张图像与第j张图像不相似,bi为第i张图像数据的二值哈希码,bj为第j张图像数据的二值哈希码,T为转置。此公式主要是建立哈希码与原始样本相似度之间的关系。如果原始样本相似,则对应的哈希码之间应该尽可能的相似;如果原始样本不相似,则对应的哈希码应该不相似。
e)通过公式计算互信息损失函数MILoss,式中Bk为第k个分支输出的哈希码,k∈<0,...,N-1>,Bk+1为第k+1个分支输出的哈希码,Wk为将第k个分支输出的哈希码映射到第k+1个分支输出的哈希码的映射矩阵,γk为正则化参数,||·||1为L1范数,ak为优化参数。一般来说,哈希码长度和哈希码的表征能力是成正相关的。因此最小化互信息损失MILoss的目的是为了促使较短长度的哈希码的表征能力趋向于较长长度的哈希码,进一步增强多个哈希码之间的关联性,使得学习到一组哈希码具有很好的表征能力,提高哈希码检索的性能。
f)利用随机梯度下降算法对相似度损失函数SILoss和互信息损失函数MILoss进行优化,优化后重复执行步骤a)至步骤e)大于等于M次,得到训练后的模型。g)将数据库中的图像数据输入到步骤f)中训练后的模型中,得到每张图像的不同长度的二值哈希码表示组合Bdatabase。例如[16bits,32bits,48bits,64bits]或[128bits,256bits,512bits]等多种组合。
h)将需要检索的图片imgquery输入到步骤f)中训练后的模型中,得到需要检索图片imgquery的二值哈希码表示组合Bquery;
i)通过公式计算汉明距离DistHamming,将计算得到的汉明距离DistHamming基于Average Precision(AP)的度量方式返回所有检索图片查询集的平均检索精度Mean Average Precision(MAP),完成相似性检索。
基于多任务深度哈希学习的大规模物流商品图像检索功能,采用多视图理论挖掘不同长度哈希码之间的潜在关联。多长度哈希码本质上是原始数据在海明空间的多种特征表示,而多长度哈希的联系学习就是对特征的互补和关联关系的利用,同样这一过程也可以看作是统一样本的多级特征融合,而多特征融合和多视角的理论学习相相关理论为该研究方法的可行性提供了理论和技术保证,进而提高了哈希检索的性能。
通过基于多任务的思想,可以同时学到多种长度的哈希码作为图像的高级表征。与传统的单任务相比,解决了单任务下模型重新训练导致的硬件资源浪费和时间成本开销大等弊端。与传统仅仅考虑学习单个哈希码作为图像的表征并来用检索相比。本专利挖掘了多种长度哈希码之间的信息关联,设计了互信息损失来增强其哈希码的表征能力,解决了单个哈希码表征能力不强的弊端,进而提高哈希码的检索性能。同时模型是基于端到端的学习,即图像的特征提取和哈希码的学习是同时进行的,与传统的线性哈希方法相比,模型结构直观,容易迁移与部署实现。可以很好的扩展到大规模的图像检索上,所以在物流行业大规模的物品图像检索中前景较好。
表1是本发明方法的第一个仿真实验结果,该实验采用MAP(平均准确率)进行度量。我们在NUS-WIDE数据集上测试结果表明多任务的思想所提升的性能是优于学习单个哈希码的性能。验证了多任务思想的合理性。
Method | 24bits | 48bits | 64bits | 128bits | 256bits |
DJMH-Single | 0.73 | 0.78 | 0.79 | 0.827 | 0.833 |
DJMH-Multiple | 0.801 | 0.827 | 0.831 | 0.846 | 0.855 |
表1
表2是是本发明方法的第二个仿真实验结果,该实验采用MAP(平均准确率)进行度量。我们在NUS-WIDE数据集上进一步研究了多长度哈希码的数量对任一长度哈希码的影响,验证了同时学习更多数量的哈希码对其中任一长度哈希码(以24位举例)的检索性能也会有提升。
表2
优选的,步骤b)中有5个卷积层,每个卷积层后接入一个池化层,所述卷积层采用3*3大小的卷积核,所述池化层采用2*2大小的池化核,所述卷积层和池化层均采用Relu激活函数。
优选的,步骤c)中多分支网络由N个相同结构的分支组成,每个分支内部由3层全连接层相互串联构成。
优选的,步骤c)中N取值为大于0的正整数。
优选的,步骤f)中M取值为5000。
最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (5)
1.一种基于多任务深度哈希学习的大规模物流商品图像检索方法,其特征在于,包括如下步骤:
a)对输入的物流商品图像xi进行图像预处理,根据图像xi的标签构建物流商品图像之间的相似度矩阵S;
b)将预处理后的物流商品图像经过卷积、池化处理后得到图像的一维特征向量himg,将一维特征向量himg作为图像低级特征;
c)将图像低级特征himg输入多分支的网络中得到多个长度哈希码表示的图像的高级表征Bk,多分支网络由N个相同结构的分支组成;
d)通过公式计算相似度损失函数SILoss,sij为第i张图像与第j张图像之间的相似度,sij∈{1,0},sij取值为1时表示第i张图像与第j张图像相似,sij取值为0时表示第i张图像与第j张图像不相似,bi为第i张图像数据的二值哈希码,bj为第j张图像数据的二值哈希码,T为转置;
e)通过公式计算互信息损失函数MILoss,式中Bk为第k个分支输出的哈希码,k∈<0,...,N-1>,Bk+1为第k+1个分支输出的哈希码,Wk为将第k个分支输出的哈希码映射到第k+1个分支输出的哈希码的映射矩阵,γk为正则化参数,||·||1为L1范数,ak为优化参数;
f)利用随机梯度下降算法对相似度损失函数SILoss和互信息损失函数MILoss进行优化,优化后重复执行步骤a)至步骤e)大于等于M次,得到训练后的模型;
g)将数据库中的图像数据输入到步骤f)中训练后的模型中,得到每张图像的不同长度的二值哈希码表示组合Bdatabase;
h)将需要检索的图片imgquery输入到步骤f)中训练后的模型中,得到需要检索图片imgquery的二值哈希码表示组合Bquery;
2.根据权利要求1所述的基于多任务深度哈希学习的大规模物流商品图像检索方法,其特征在于:步骤b)中有5个卷积层,每个卷积层后接入一个池化层,所述卷积层采用3*3大小的卷积核,所述池化层采用2*2大小的池化核,所述卷积层和池化层均采用Relu激活函数。
3.根据权利要求1所述的基于多任务深度哈希学习的大规模物流商品图像检索方法,其特征在于:步骤c)中多分支网络由N个相同结构的分支组成,每个分支内部由3层全连接层相互串联构成。
4.根据权利要求1所述的基于多任务深度哈希学习的大规模物流商品图像检索方法,其特征在于:步骤c)中N取值为大于0的正整数。
5.根据权利要求1所述的基于多任务深度哈希学习的大规模物流商品图像检索方法,其特征在于:步骤f)中M取值为5000。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110732492.3A CN113377981B (zh) | 2021-06-29 | 2021-06-29 | 基于多任务深度哈希学习的大规模物流商品图像检索方法 |
US17/809,601 US20220414144A1 (en) | 2021-06-29 | 2022-06-29 | Multi-task deep hash learning-based retrieval method for massive logistics product images |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110732492.3A CN113377981B (zh) | 2021-06-29 | 2021-06-29 | 基于多任务深度哈希学习的大规模物流商品图像检索方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113377981A CN113377981A (zh) | 2021-09-10 |
CN113377981B true CN113377981B (zh) | 2022-05-27 |
Family
ID=77580183
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110732492.3A Active CN113377981B (zh) | 2021-06-29 | 2021-06-29 | 基于多任务深度哈希学习的大规模物流商品图像检索方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US20220414144A1 (zh) |
CN (1) | CN113377981B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113704522B (zh) * | 2021-10-28 | 2022-02-18 | 山东建筑大学 | 基于人工智能的目标图像快速检索方法及系统 |
CN114419402B (zh) * | 2022-03-29 | 2023-08-18 | 中国人民解放军国防科技大学 | 图像故事描述生成方法、装置、计算机设备和存储介质 |
CN116108217B (zh) * | 2022-10-27 | 2023-12-19 | 浙江大学 | 一种基于深度哈希编码和多任务预测的逃费车辆相似图片检索方法 |
CN117292104B (zh) * | 2023-11-22 | 2024-02-27 | 南京掌控网络科技有限公司 | 基于图像识别的货架陈列检测方法及系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109165306A (zh) * | 2018-08-09 | 2019-01-08 | 长沙理工大学 | 基于多任务哈希学习的图像检索方法 |
CN109508320A (zh) * | 2018-11-27 | 2019-03-22 | 聂秀山 | 多长度哈希联合学习方法 |
CN110674333A (zh) * | 2019-08-02 | 2020-01-10 | 杭州电子科技大学 | 基于多视图增强深度哈希的大规模图像高速检索方法 |
CN111177432A (zh) * | 2019-12-23 | 2020-05-19 | 北京航空航天大学 | 一种基于分层深度哈希的大规模图像检索方法 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105512273A (zh) * | 2015-12-03 | 2016-04-20 | 中山大学 | 一种基于可变长深度哈希学习的图像检索方法 |
US10713540B2 (en) * | 2017-03-07 | 2020-07-14 | Board Of Trustees Of Michigan State University | Deep learning system for recognizing pills in images |
CN107679250B (zh) * | 2017-11-01 | 2020-12-01 | 浙江工业大学 | 一种基于深度自编码卷积神经网络的多任务分层图像检索方法 |
CN108108657B (zh) * | 2017-11-16 | 2020-10-30 | 浙江工业大学 | 基于多任务深度学习的修正局部敏感哈希车辆检索方法 |
US20190171665A1 (en) * | 2017-12-05 | 2019-06-06 | Salk Institute For Biological Studies | Image similarity search via hashes with expanded dimensionality and sparsification |
CN109063112B (zh) * | 2018-07-30 | 2022-04-01 | 成都快眼科技有限公司 | 一种基于多任务学习深度语义哈希的快速图像检索方法、模型及模型构建方法 |
CN109635141B (zh) * | 2019-01-29 | 2021-04-27 | 京东方科技集团股份有限公司 | 用于检索图像的方法、电子设备和计算机可读存储介质 |
CN110659726B (zh) * | 2019-09-24 | 2022-05-06 | 北京达佳互联信息技术有限公司 | 一种图像处理方法、装置、电子设备及存储介质 |
CN111460200B (zh) * | 2020-03-04 | 2023-07-04 | 西北大学 | 基于多任务深度学习的图像检索方法、模型及其构建方法 |
US20220147743A1 (en) * | 2020-11-09 | 2022-05-12 | Nvidia Corporation | Scalable semantic image retrieval with deep template matching |
-
2021
- 2021-06-29 CN CN202110732492.3A patent/CN113377981B/zh active Active
-
2022
- 2022-06-29 US US17/809,601 patent/US20220414144A1/en active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109165306A (zh) * | 2018-08-09 | 2019-01-08 | 长沙理工大学 | 基于多任务哈希学习的图像检索方法 |
CN109508320A (zh) * | 2018-11-27 | 2019-03-22 | 聂秀山 | 多长度哈希联合学习方法 |
CN110674333A (zh) * | 2019-08-02 | 2020-01-10 | 杭州电子科技大学 | 基于多视图增强深度哈希的大规模图像高速检索方法 |
CN111177432A (zh) * | 2019-12-23 | 2020-05-19 | 北京航空航天大学 | 一种基于分层深度哈希的大规模图像检索方法 |
Non-Patent Citations (2)
Title |
---|
Deep Collaborative Multi-View Hashing for Large-Scale Image Search;L. Zhu;《IEEE Transactions on Image Processing》;20200221;第29卷;全文 * |
基于相关度距离的无监督并行哈希图像检索;杨粟;《计算机应用》;20210125;第41卷(第07期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN113377981A (zh) | 2021-09-10 |
US20220414144A1 (en) | 2022-12-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113377981B (zh) | 基于多任务深度哈希学习的大规模物流商品图像检索方法 | |
CN107679250B (zh) | 一种基于深度自编码卷积神经网络的多任务分层图像检索方法 | |
CN106682233B (zh) | 一种基于深度学习与局部特征融合的哈希图像检索方法 | |
CN111125411B (zh) | 一种深度强相关哈希学习的大规模图像检索方法 | |
CN107330074B (zh) | 基于深度学习和哈希编码的图像检索方法 | |
CN107092661A (zh) | 一种基于深度卷积神经网络的图像检索方法 | |
CN109948742B (zh) | 基于量子神经网络的手写体图片分类方法 | |
CN110222218B (zh) | 基于多尺度NetVLAD和深度哈希的图像检索方法 | |
CN110929080B (zh) | 基于注意力和生成对抗网络的光学遥感图像检索方法 | |
CN108984642B (zh) | 一种基于哈希编码的印花织物图像检索方法 | |
CN112199532B (zh) | 一种基于哈希编码和图注意力机制的零样本图像检索方法及装置 | |
CN108399185B (zh) | 一种多标签图像的二值向量生成方法及图像语义相似度查询方法 | |
CN109829065B (zh) | 图像检索方法、装置、设备及计算机可读存储介质 | |
Li et al. | DAHP: Deep attention-guided hashing with pairwise labels | |
CN113806580B (zh) | 基于层次语义结构的跨模态哈希检索方法 | |
CN109871379B (zh) | 一种基于数据块学习的在线哈希最近邻查询方法 | |
CN112163114B (zh) | 一种基于特征融合的图像检索方法 | |
CN110598022B (zh) | 一种基于鲁棒深度哈希网络的图像检索系统与方法 | |
CN111325264A (zh) | 一种基于熵的多标签数据分类方法 | |
Zhang et al. | Deep supervised hashing using symmetric relative entropy | |
CN110110120B (zh) | 一种基于深度学习的图像检索方法和装置 | |
CN107273478B (zh) | 一种基于Group Lasso的半监督哈希图像搜索方法 | |
CN116383422B (zh) | 一种基于锚点的无监督跨模态哈希检索方法 | |
CN105117735A (zh) | 一种大数据环境下的图像检测方法 | |
Moustafa et al. | Learning to Hash with Convolutional Network for Multi-label Remote Sensing Image Retrieval. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |