CN109086437A - 一种融合Faster-RCNN和Wasserstein自编码器的图像检索方法 - Google Patents
一种融合Faster-RCNN和Wasserstein自编码器的图像检索方法 Download PDFInfo
- Publication number
- CN109086437A CN109086437A CN201810926656.4A CN201810926656A CN109086437A CN 109086437 A CN109086437 A CN 109086437A CN 201810926656 A CN201810926656 A CN 201810926656A CN 109086437 A CN109086437 A CN 109086437A
- Authority
- CN
- China
- Prior art keywords
- image
- wasserstein
- self
- feature
- encoding encoder
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Abstract
本发明公开一种融合Faster‑RCNN(Faster‑Regions with Convolutional Neural Network,快速区域卷积神经网络)和Wasserstein自编码器的图像检索方法。本发明搭建深度学习框架,采用Faster‑RCNN模型提取图像特征;对Faster‑RCNN模型进行训练,微调网络权重;提取图像的全局特征,构建图像的全局特征图库;构建Wasserstein自编码器,并对Wasserstein自编码器进行训练;采用Wasserstein自编码器对全局特征进行降维,计算欧几里得距离得出第一相似度,并进行第一次排序,完成图像的粗粒度检索;提取图像中候选区域的特征作为局部特征,构建图像的局部特征图库;采用Wasserstein自编码器对局部特征进行降维,计算第二相似度并进行第二次排序,完成图像的细粒度检索。该方法能加快图像的检索速度以及提高图像检索的准确率。
Description
技术领域
本发明涉及图像检索技术领域,特别涉及一种融合Faster-RCNN和Wasserstein自编码器的图像检索方法。
背景技术
随着互联网中图像资源的爆炸式增长,人们对于图像的检索次数已经超过网页文本检索次数,意味着人们进入读图时代。面对海量的图像数据,如何快速、准确地检索出内容相关的图像,成为大数据图像检索亟待解决的关键问题。传统的图像检索方法主要是基于图像内容的检索,即通过对图像的颜色分布、形状轮廓、纹理结构等底层视觉信息进行统计,比较图像之间视觉特征的相似度,从图像数据库中检索出与目标图像匹配相似的图像。由于图像底层视觉信息以及统计方法表征能力的局限性,对于大规模复杂图像检索的结果难以令人满意。
相比于传统的特征统计学习方法,深度学习通过构建多层神经网络模型,使用大规模图像数据训练并拟合网络中成千上万的参数,使得模型具有强大的表征能力,从而提取到图像更具有语义信息的高层特征。
通常,检索系统是根据提取到图像的全局特征,在图像库中匹配并检索相似图像。但是,用户观察图像时,往往只对图像中的部分区域或某个目标物体感兴趣,比如图像中某地标建筑物等;特征图中存在冗余信息,同时,考虑到检索系统的时效性以及减低特征的存储空间,需要对特征图降维处理。传统的主成分分析等降维方法,没有考虑到特征图中特征之间的内在联系,降维处理后存在部分特征丢失,从而影响图像检索的准确性。
中国发明专利申请公布号CN105912611A公开了一种基于CNN的快速图像检索方法,该方法包括一下步骤:1)利用CNN网络对要检索的图像进行特征提取,得到代表图像的矢量特征;利用Google Net网络架构,通过Inception结构实现了在小幅度增加计算量的情况下,让网络走向更深层次;2)在特征数据库中对此矢量特征进行k近邻检索。该发明方法能完成对图像的检索,但当图像中有多个目标时,就不能准确地提取出图像的局部特征,并且检索速度较慢。
发明内容
针对已有图像检索技术方法中图像检索速度慢、检索准确率偏低、特征降维过程中部分特征丢失的问题,本发明提供一种融合Faster-RCNN和Wasserstein自编码器的图像检索方法,提取图像的全局特征和局部特征,并且进行特征降维,计算出图像特征的相似度,根据相似度完成图像的准确检索。
为了实现上述目的,本发明提供以下技术方案:
一种融合Faster-RCNN和Wasserstein自编码器的图像检索方法,包括以下步骤:
S1:搭建深度学习框架,部署Faster-RCNN模型;
S2:对Faster-RCNN模型进行训练,微调网络权重;
S3:提取图像的全局特征,构建图像的全局特征图库;
S4:构建Wasserstein自编码器,并对Wasserstein自编码器进行训练;
S5:采用Wasserstein自编码器对全局特征图进行降维,计算全局特征之间欧几里得距离得出第一相似度,并进行第一次排序,完成图像的粗粒度检索;
S6:提取图像中候选区域的特征作为局部特征,构建图像的局部特征图库;
S7:采用Wasserstein自编码器对局部特征图进行降维,计算第二相似度并进行第二次排序,完成图像的细粒度检索。
优选的,所述S1中,本发明搭建Caffe深度学习框架。
优选的,所述S1中,本发明采用VGG网络结构作为所述Faster-RCNN模型中的特征提取模型。
优选的,所述S2中,本发明采用Oxford5k数据集中的训练集对所述Faster-RCNN模型进行训练。
优选的,所述S2中,本发明采用以下方法对所述Faster-RCNN模型进行训练:
从Oxford5k数据集的11个类别中分别选取5张图像从而得到55张图像,将此55张图像进行水平翻转并保留原始图像,进而得到110张图像,将此110张图像作为训练集;
将Faster-RCNN模型的输出类别调整为12,其中包含11类物体和1类背景;
设置迭代次数为5000,训练方式为端到端训练。
优选的,所述S3中,本发明选择卷积层Conv5_3中的全局特征图,用于构建全局特征图库。
优选的,所述S4中,本发明构建的Wasserstein自编码器包括1层卷积层、3层全连接层和1层反卷积层。
优选的,所述S4中,本发明采用以下方法对Wasserstein自编码器进行训练:
设定Wasserstein自编码器的卷积层卷积核大小为5×5,步长为2;
输入第一特征图,卷积第一特征图可得第二特征图;
将第二特征图重塑到第一全连接层,得到第一特征向量;
第一特征向量映射到第二全连接层,降维输出第二特征向量;
第二特征向量映射到第三全连接层,得到第三特征向量;
对第三特征向量进行重塑,得到第三特征图;
设定Wasserstein自编码器的反卷积层卷积核大小为5×5,步长为2,反卷积第三特征图可得第四特征图;
计算第一特征图和第四特征图的Wasserstein距离作为损失值,多次迭代训练直至收敛,完成Wasserstein自编码器参数的优化。
优选的,所述Wasserstein距离的计算函数为以下公式:
式中,pX表示输入特征的概率分布;pG表示输出特征的概率分布;表示在y服从pG概率分布下求y的期望;min表示最小值;表示在x服从pX概率分布下求x的期望;λ表示梯度惩罚项权重;表示求偏倒,fw(x)表示x的权重输出函数;c表示梯度,其值可设置为1。
优选的,所述S6中,本发明采用以下方法提取图像的局部特征:
使用区域提案网络在卷积层的特征图中提取候选区域,得到得分矩阵和坐标矩阵;
选择得分矩阵中每行得分最高的类别作为候选区域的类别,得到特征图;
根据特征图和原始图像的长宽比例,提取图像的局部特征。综上所述,由于采用了上述技术方案,与现有技术相比,本发明至少具有以下有益效果:
1.本发明通过对特征提取模型的优化,加快了图像的检索速度;
2.采用Wasserstein自编码器对图像降维,能减少图像特征的缺失,相比于主成分分析等降维方法,提高了2%的图像检索准确率;
3.本发明采用两次图像检索,相比于原有检索方法,提高了2%的图像检索准确率。
附图说明:
图1为根据本发明示例性实施例的一种图像检索方法流程示意图。
图2为根据本发明示例性实施例的Wasserstein自编码器的训练流程示意图。
具体实施方式
下面结合实施例及具体实施方式对本发明作进一步的详细描述。但不应将此理解为本发明上述主题的范围仅限于以下的实施例,凡基于本发明内容所实现的技术均属于本发明的范围。
图1为根据本发明示例性实施例的一种图像检索方法流程示意图。具体包括以下步骤:
步骤S1:搭建深度学习框架,采用Faster-RCNN模型提取图像特征,所述图像特征包括全局特征和局部特征。
具体的,步骤S1中,本发明搭建的是Caffe(Convolutional Architecture forFast Feature Embedding,快速特征嵌入的卷积体系结构)深度学习框架。本实施例采用VGG(Visual Geometry Group,视觉几何组)网络结构(例如可采用VGG16)作为Faster-RCNN(Faster-Regions with Convolutional Neural Network,快速区域卷积神经网络)模型中的特征提取模型,并且本实施例中采用Pascal VOC2007数据集对VGG网络结构进行预训练。
步骤S2:对Faster-RCNN模型进行训练,微调网络权重。
本实施例步骤S2中,本发明采用Oxford5k数据集中的训练集对Faster-RCNN模型进行训练。具体的,在Oxford5k数据集中,从11个类别中分别选取5张图像从而得到55张图像,将此55张图像进行水平翻转并保留原始图像,进而得到110张图像,本发明将此110张图像作为训练集;修改Faster-RCNN模型中的文件,将输出类别调整为12,其中包含11类物体和1类背景;设置迭代次数为5000,训练方式为端到端训练,实现网络权重的微调,输出caffemodel文件。
步骤S3:提取图像的全局特征,构建图像的全局特征图库。
本实施例步骤S3中,Faster-RCNN模型加载caffemodel文件,用于构建特征提取网络模型;上述网络模型提取出图像的全局特征,选择卷积层Conv5_3中的特征矩阵代表图像的全局特征,从而构建图像的全局特征图库。例如,特征图的维度为W×H×K,W表示图像的宽,H表示图形的高,K表示图像的个数。
步骤S4:构建Wasserstein自编码器,并对Wasserstein自编码器进行训练。
本实施例步骤S4中,本发明构建基于卷积层、全连接层以及反卷积层的Wasserstein自编码器模型,该Wasserstein自编码器包括1层卷积层、3层全连接层和1层反卷积层。
本实施例对Wasserstein自编码器进行训练,优化Wasserstein自编码器中的参数,用于减少特征图降维过程中缺失的特征数量,从而提高图像的检索准确率。
Wasserstein自编码器训练步骤如下:
S4-1:设定Wasserstein自编码器的卷积层卷积核大小为5×5,步长为2;
S4-2:输入第一特征图,卷积第一特征图可得第二特征图;
S4-3:对第二特征图进行重塑,第一全连接层上得到第一特征向量;
S4-4:第一特征向量映射到第二全连接层,输出第二特征向量;
S4-5:第二特征向量映射到第三全连接层,可得第三特征向量;
S4-6:对第三特征向量进行重塑,可得第三特征图;
S4-7:设定Wasserstein自编码器的反卷积层卷积核大小为5×5,步长为2,反卷积第三特征图可得第四特征图;
S4-8:计算第一特征图和第四特征图的Wasserstein距离作为损失值,多次迭代训练直至收敛,完成对Wasserstein自编码器参数的优化。
当损失值足够小,输出的第二特征向量保留足够的特征,可用于重建第一特征图,从而保障特征降维的有效性,提高图像的检索准确率。
Wasserstein距离的计算函数如下:
公式(1)中,pX表示输入特征的概率分布;pG表示输出特征的概率分布;表示在y服从pG概率分布下求y的期望;表示在x服从pX概率分布下求x的期望;λ表示梯度惩罚项权重;表示求偏倒,fw(x)表示x的权重输出函数;c表示梯度,其值可设置为1。
具体的,请参考图2。设定Wasserstein自编码器卷积层和反卷积层卷积核大小均为5×5,步长为2;输入第一特征图(例如其维度为7×7×512),卷积第一特征图得到第二特征图(例如其维度为2×2×1024);对所述第二特征图进行重塑(reshape)操作,第一全连接层上可得到第一特征向量(例如其维度为4096);所述第一特征向量映射到第二全连接层,输出第二特征向量(例如其维度为40);所述第二特征向量映射到第三全连接层,得到第三特征向量(例如其维度为4096);对所述第三特征向量进行重塑(reshape)操作,得到第三特征图(例如其维度为2×2×1024);反卷积第三特征图得到第四特征图(例如其维度为7×7×512)。
步骤S5:采用Wasserstein自编码器对全局特征图进行降维,计算第一相似度并进行第一次排序,完成图像的粗粒度检索。
原始图像的全局特征图中含有冗余信息及噪音信息,会造成图像检索的误差,降低检索准确率,因此需对图像特征图降维。
本实施例采用步骤S4中训练完成的Wasserstein自编码器对步骤S3中构建的图像全局特征图库中的特征图降维,减少计算的复杂度,且保留特征图的有效特征,提高图像检索的准确率。例如,输入的第一特征图维度为7×7×512,Wasserstein自编码器对第一特征图降维处理,输出第二特征向量,所述第二特征向量的维度为40。
计算图像全局特征与特征图库中的特征之间的欧几里得距离d(x,y),d(x,y)值越小,表明相似度越高,根据d(x,y)值可得出第一相似度;根据第一相似度进行排序(例如由高到低),得到第一次排序列表(即图像排序列表),完成图像的粗粒度检索。
欧几里得距离d(x,y)的计算公式如下:
公式(2)中xi表示特征x中的第i维特征,yi表示特征y中的第i维特征,n表示维数。
步骤S6:提取图像中感兴趣部分的特征作为局部特征,构建图像的局部特征图库。
本实施例步骤S6中,本发明采用步骤S3中构建的特征提取网络模型提取图像的局部特征。
具体的,选择步骤S5的第一次排序列表中前Top-K张图像作为步骤S6中的原始图像。本发明使用Faster-RCNN模型中的区域提案网络(RPN,Region Proposal Network),并选择在区分度较好的卷积层(例如第5层)的特征矩阵上提取候选区域,得到原始图像对应的得分矩阵Mscore=[Si,j]r×k(r表示候选区域个数,k表示类别个数,Si,j表示第i个区域属于类别k的分数)和坐标矩阵Mboxes=[bi,j]r×(4k)(bi,j表示第i个区域属于类别k对应的坐标);选择得分矩阵中每行得分最高的类别作为候选区域的类别(如果该类别是背景,则丢弃对应候选区域),从而得到特征图;计算特征图与原始图像的长宽比例,根据比例将原始图像坐标映射到特征图中,从而得到图像的局部特征。
步骤S7:采用Wasserstein自编码器对局部特征进行降维,计算出第二相似度并进行第二次排序,完成图像的细粒度检索。
本实施例步骤S7中,本发明采用Wasserstein自编码器对图像的局部特征降维;计算图像局部特征之间第二相似度S(r1,r2),根据第二相似度进行排序(例如由高到低),得到第二次排序列表,完成图像的细粒度检索。
得分计算函数score(r1,r2)为以下公式:
score(r1,r2)=score(r1)+score(r2) (3)
公式(3)中score(r1)表示候选区域1的得分;score(r2)表示候选区域2的得分。
类别计算函数cls(k1,k2)为以下公式:
公式(4)中cls(k1,k2)表示类别得分;k1表示候选区域1的类别;k2表示候选区域2的类别。
图像局部特征之间的第二相似度S(r1,r2)的计算公式如下:
S(r1,r2)=dis(f1,f2)+cls(k1,k2)×score(r1,r2) (5)
公式(5)中dis(f1,f2)用于计算候选区域1、2分别对应的局部特征之间的欧几里得距离;cls(k1,k2)为类别计算函数;score(r1,r2)为得分计算函数。
Claims (10)
1.一种融合Faster-RCNN和Wasserstein自编码器的图像检索方法,其特征在于,包括以下步骤:
S1:搭建深度学习框架,部署Faster-RCNN模型;
S2:对Faster-RCNN模型进行训练,微调网络权重;
S3:提取图像的全局特征,构建图像的全局特征图库;
S4:构建Wasserstein自编码器,并对Wasserstein自编码器进行训练;
S5:采用Wasserstein自编码器对全局特征图进行降维,计算全局特征之间欧几里得距离得出第一相似度,并进行第一次排序,完成图像的粗粒度检索;
S6:提取图像中候选区域的特征作为局部特征,构建图像的局部特征图库;
S7:采用Wasserstein自编码器对局部特征图进行降维,计算第二相似度并进行第二次排序,完成图像的细粒度检索。
2.如权利要求1所述的融合Faster-RCNN和Wasserstein自编码器的图像检索方法,其特征在于,所述S1中,搭建Caffe深度学习框架。
3.如权利要求1所述的融合Faster-RCNN和Wasserstein自编码器的图像检索方法,其特征在于,所述S1中,采用VGG网络结构作为所述Faster-RCNN模型中的特征提取模型。
4.如权利要求1所述的融合Faster-RCNN和Wasserstein自编码器的图像检索方法,其特征在于,所述S2中,采用Oxford5k数据集中的训练集对所述Faster-RCNN模型进行训练。
5.如权利要求1或4所述的融合Faster-RCNN和Wasserstein自编码器的图像检索方法,其特征在于,所述S2中,采用以下方法对所述Faster-RCNN模型进行训练:
从Oxford5k数据集的11个类别中分别选取5张图像从而得到55张图像,将此55张图像进行水平翻转并保留原始图像,进而得到110张图像,将此110张图像作为训练集;
将Faster-RCNN模型的输出类别调整为12,其中包含11类物体和1类背景;
设置迭代次数为5000,训练方式为端到端训练。
6.如权利要求1所述的融合Faster-RCNN和Wasserstein自编码器的图像检索方法,其特征在于,所述S3中,选择卷积层Conv5_3中的全局特征图,用于构建全局特征图库。
7.如权利要求1所述的融合Faster-RCNN和Wasserstein自编码器的图像检索方法,其特征在于,所述S4中,Wasserstein自编码器包括1层卷积层、3层全连接层和1层反卷积层。
8.如权利要求1所述的融合Faster-RCNN和Wasserstein自编码器的图像检索方法,其特征在于,所述S4中,采用以下方法对Wasserstein自编码器进行训练:
设定Wasserstein自编码器的卷积层卷积核大小为5×5,步长为2;
输入第一特征图,卷积第一特征图可得第二特征图;
将第二特征图重塑到第一全连接层,得到第一特征向量;
第一特征向量映射到第二全连接层,降维输出第二特征向量;
第二特征向量映射到第三全连接层,得到第三特征向量;
对第三特征向量进行重塑,得到第三特征图;
设定Wasserstein自编码器的反卷积层卷积核大小为5×5,步长为2,反卷积第三特征图可得第四特征图;
计算第一特征图和第四特征图的Wasserstein距离作为损失值,多次迭代训练直至收敛,完成Wasserstein自编码器参数的优化。
9.如权利要求8所述的融合Faster-RCNN和Wasserstein自编码器的图像检索方法,其特征在于,所述Wasserstein距离的计算函数为以下公式:
式中,pX表示输入特征的概率分布;pG表示输出特征的概率分布;表示在y服从pG概率分布下求y的期望;min表示最小值;表示在x服从pX概率分布下求x的期望;λ表示梯度惩罚项权重;表示求偏倒,fw(x)表示x的权重输出函数;c表示梯度,其值可设置为1。
10.如权利要求1所述的融合Faster-RCNN和Wasserstein自编码器的图像检索方法,其特征在于,所述S6中,采用以下方法提取图像的局部特征:
使用区域提案网络在卷积层的特征图中提取候选区域,得到得分矩阵和坐标矩阵;
选择得分矩阵中每行得分最高的类别作为候选区域的类别,得到特征图;
根据特征图和原始图像的长宽比例,提取图像的局部特征。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810926656.4A CN109086437B (zh) | 2018-08-15 | 2018-08-15 | 一种融合Faster-RCNN和Wasserstein自编码器的图像检索方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810926656.4A CN109086437B (zh) | 2018-08-15 | 2018-08-15 | 一种融合Faster-RCNN和Wasserstein自编码器的图像检索方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109086437A true CN109086437A (zh) | 2018-12-25 |
CN109086437B CN109086437B (zh) | 2021-06-01 |
Family
ID=64793471
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810926656.4A Active CN109086437B (zh) | 2018-08-15 | 2018-08-15 | 一种融合Faster-RCNN和Wasserstein自编码器的图像检索方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109086437B (zh) |
Cited By (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109885709A (zh) * | 2019-01-08 | 2019-06-14 | 五邑大学 | 一种基于自编码预降维的图像检索方法、装置和存储介质 |
CN110008949A (zh) * | 2019-01-24 | 2019-07-12 | 华南理工大学 | 一种图像目标检测方法、系统、装置和存储介质 |
CN110033023A (zh) * | 2019-03-11 | 2019-07-19 | 北京光年无限科技有限公司 | 一种基于绘本识别的图像数据处理方法及系统 |
CN110110670A (zh) * | 2019-05-09 | 2019-08-09 | 杭州电子科技大学 | 基于Wasserstein度量的行人跟踪中的数据关联方法 |
CN110119460A (zh) * | 2019-05-16 | 2019-08-13 | 广东三维家信息科技有限公司 | 图像检索方法、装置及电子设备 |
CN110209863A (zh) * | 2019-06-03 | 2019-09-06 | 上海蜜度信息技术有限公司 | 用于相似图片检索的方法与设备 |
CN110390259A (zh) * | 2019-06-11 | 2019-10-29 | 中国科学院自动化研究所南京人工智能芯片创新研究院 | 图数据的识别方法、装置、计算机设备和存储介质 |
CN110825904A (zh) * | 2019-10-24 | 2020-02-21 | 腾讯科技(深圳)有限公司 | 一种图像匹配方法、装置、电子设备和存储介质 |
CN110851642A (zh) * | 2019-09-29 | 2020-02-28 | 南京大学 | 一种基于自编码器和tSNE降维的图片检索方法 |
CN111026058A (zh) * | 2019-12-16 | 2020-04-17 | 浙江大学 | 基于瓦瑟斯坦距离和自编码器的半监督深度学习故障诊断方法 |
CN111046209A (zh) * | 2019-12-09 | 2020-04-21 | 中国科学院自动化研究所 | 图像聚类检索系统 |
CN111461159A (zh) * | 2019-07-04 | 2020-07-28 | 上海大学 | 一种基于相似度约束的解耦表示学习算法 |
CN111680628A (zh) * | 2020-06-09 | 2020-09-18 | 北京百度网讯科技有限公司 | 文字框融合方法、装置、设备以及存储介质 |
CN111860670A (zh) * | 2020-07-28 | 2020-10-30 | 平安科技(深圳)有限公司 | 域自适应模型训练、图像检测方法、装置、设备及介质 |
CN112528066A (zh) * | 2020-12-18 | 2021-03-19 | 广东工业大学 | 基于注意力机制的商标检索方法、系统、计算机设备和存储介质 |
CN112837299A (zh) * | 2021-02-09 | 2021-05-25 | 浙江工业大学 | 一种纺织品图像指纹检索方法 |
CN112927783A (zh) * | 2021-03-30 | 2021-06-08 | 泰康保险集团股份有限公司 | 图像检索方法及装置 |
CN113204666A (zh) * | 2021-05-26 | 2021-08-03 | 杭州联汇科技股份有限公司 | 一种基于文字查找匹配图片的方法 |
CN113343920A (zh) * | 2021-07-01 | 2021-09-03 | 中诚信征信有限公司 | 人脸识别照片的分类方法、装置、电子设备和存储介质 |
CN116310425A (zh) * | 2023-05-24 | 2023-06-23 | 山东大学 | 一种细粒度图像检索方法、系统、设备及存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106708943A (zh) * | 2016-11-22 | 2017-05-24 | 安徽睿极智能科技有限公司 | 一种基于排列融合的图像检索重排序方法及系统 |
CN106886599A (zh) * | 2017-02-28 | 2017-06-23 | 北京京东尚科信息技术有限公司 | 图像检索方法以及装置 |
CN107239565A (zh) * | 2017-06-14 | 2017-10-10 | 电子科技大学 | 一种基于显著性区域的图像检索方法 |
US20180070089A1 (en) * | 2016-09-08 | 2018-03-08 | Qualcomm Incorporated | Systems and methods for digital image stabilization |
US20180101742A1 (en) * | 2016-10-07 | 2018-04-12 | Noblis, Inc. | Face recognition and image search system using sparse feature vectors, compact binary vectors, and sub-linear search |
CN108205580A (zh) * | 2017-09-27 | 2018-06-26 | 深圳市商汤科技有限公司 | 一种图像检索方法、装置及计算机可读存储介质 |
-
2018
- 2018-08-15 CN CN201810926656.4A patent/CN109086437B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180070089A1 (en) * | 2016-09-08 | 2018-03-08 | Qualcomm Incorporated | Systems and methods for digital image stabilization |
US20180101742A1 (en) * | 2016-10-07 | 2018-04-12 | Noblis, Inc. | Face recognition and image search system using sparse feature vectors, compact binary vectors, and sub-linear search |
CN106708943A (zh) * | 2016-11-22 | 2017-05-24 | 安徽睿极智能科技有限公司 | 一种基于排列融合的图像检索重排序方法及系统 |
CN106886599A (zh) * | 2017-02-28 | 2017-06-23 | 北京京东尚科信息技术有限公司 | 图像检索方法以及装置 |
CN107239565A (zh) * | 2017-06-14 | 2017-10-10 | 电子科技大学 | 一种基于显著性区域的图像检索方法 |
CN108205580A (zh) * | 2017-09-27 | 2018-06-26 | 深圳市商汤科技有限公司 | 一种图像检索方法、装置及计算机可读存储介质 |
Non-Patent Citations (2)
Title |
---|
변영현;곽근창: ""Comparative Analysis of Performance Using Faster RCNN and ACF in People Detection"", 《THE JOURNAL OF KOREAN INSTITUTE OF INFORMATION TECHNOLOGY》 * |
桑军,郭沛,项志立,罗红玲,陈欣: ""Faster-RCNN的车型识别分析"", 《重庆大学学报》 * |
Cited By (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109885709B (zh) * | 2019-01-08 | 2022-12-23 | 五邑大学 | 一种基于自编码预降维的图像检索方法、装置和存储介质 |
CN109885709A (zh) * | 2019-01-08 | 2019-06-14 | 五邑大学 | 一种基于自编码预降维的图像检索方法、装置和存储介质 |
CN110008949A (zh) * | 2019-01-24 | 2019-07-12 | 华南理工大学 | 一种图像目标检测方法、系统、装置和存储介质 |
CN110008949B (zh) * | 2019-01-24 | 2020-03-17 | 华南理工大学 | 一种图像目标检测方法、系统、装置和存储介质 |
CN110033023B (zh) * | 2019-03-11 | 2021-06-15 | 北京光年无限科技有限公司 | 一种基于绘本识别的图像数据处理方法及系统 |
CN110033023A (zh) * | 2019-03-11 | 2019-07-19 | 北京光年无限科技有限公司 | 一种基于绘本识别的图像数据处理方法及系统 |
CN110110670A (zh) * | 2019-05-09 | 2019-08-09 | 杭州电子科技大学 | 基于Wasserstein度量的行人跟踪中的数据关联方法 |
CN110119460A (zh) * | 2019-05-16 | 2019-08-13 | 广东三维家信息科技有限公司 | 图像检索方法、装置及电子设备 |
CN110209863A (zh) * | 2019-06-03 | 2019-09-06 | 上海蜜度信息技术有限公司 | 用于相似图片检索的方法与设备 |
CN110209863B (zh) * | 2019-06-03 | 2021-01-01 | 上海蜜度信息技术有限公司 | 用于相似图片检索的方法与设备 |
CN110390259A (zh) * | 2019-06-11 | 2019-10-29 | 中国科学院自动化研究所南京人工智能芯片创新研究院 | 图数据的识别方法、装置、计算机设备和存储介质 |
CN111461159A (zh) * | 2019-07-04 | 2020-07-28 | 上海大学 | 一种基于相似度约束的解耦表示学习算法 |
CN110851642A (zh) * | 2019-09-29 | 2020-02-28 | 南京大学 | 一种基于自编码器和tSNE降维的图片检索方法 |
CN110825904A (zh) * | 2019-10-24 | 2020-02-21 | 腾讯科技(深圳)有限公司 | 一种图像匹配方法、装置、电子设备和存储介质 |
CN111046209A (zh) * | 2019-12-09 | 2020-04-21 | 中国科学院自动化研究所 | 图像聚类检索系统 |
CN111046209B (zh) * | 2019-12-09 | 2023-07-25 | 中国科学院自动化研究所 | 图像聚类检索系统 |
CN111026058A (zh) * | 2019-12-16 | 2020-04-17 | 浙江大学 | 基于瓦瑟斯坦距离和自编码器的半监督深度学习故障诊断方法 |
CN111680628A (zh) * | 2020-06-09 | 2020-09-18 | 北京百度网讯科技有限公司 | 文字框融合方法、装置、设备以及存储介质 |
CN111680628B (zh) * | 2020-06-09 | 2023-04-28 | 北京百度网讯科技有限公司 | 文字框融合方法、装置、设备以及存储介质 |
CN111860670A (zh) * | 2020-07-28 | 2020-10-30 | 平安科技(深圳)有限公司 | 域自适应模型训练、图像检测方法、装置、设备及介质 |
CN112528066A (zh) * | 2020-12-18 | 2021-03-19 | 广东工业大学 | 基于注意力机制的商标检索方法、系统、计算机设备和存储介质 |
CN112528066B (zh) * | 2020-12-18 | 2023-08-04 | 广东工业大学 | 基于注意力机制的商标检索方法、系统、计算机设备和存储介质 |
CN112837299A (zh) * | 2021-02-09 | 2021-05-25 | 浙江工业大学 | 一种纺织品图像指纹检索方法 |
CN112837299B (zh) * | 2021-02-09 | 2024-02-27 | 浙江工业大学 | 一种纺织品图像指纹检索方法 |
CN112927783A (zh) * | 2021-03-30 | 2021-06-08 | 泰康保险集团股份有限公司 | 图像检索方法及装置 |
CN112927783B (zh) * | 2021-03-30 | 2023-12-26 | 泰康同济(武汉)医院 | 图像检索方法及装置 |
CN113204666A (zh) * | 2021-05-26 | 2021-08-03 | 杭州联汇科技股份有限公司 | 一种基于文字查找匹配图片的方法 |
CN113343920A (zh) * | 2021-07-01 | 2021-09-03 | 中诚信征信有限公司 | 人脸识别照片的分类方法、装置、电子设备和存储介质 |
CN116310425A (zh) * | 2023-05-24 | 2023-06-23 | 山东大学 | 一种细粒度图像检索方法、系统、设备及存储介质 |
CN116310425B (zh) * | 2023-05-24 | 2023-09-26 | 山东大学 | 一种细粒度图像检索方法、系统、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN109086437B (zh) | 2021-06-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109086437A (zh) | 一种融合Faster-RCNN和Wasserstein自编码器的图像检索方法 | |
CN108920720B (zh) | 基于深度哈希和gpu加速的大规模图像检索方法 | |
CN111489358B (zh) | 一种基于深度学习的三维点云语义分割方法 | |
CN109919108B (zh) | 基于深度哈希辅助网络的遥感图像快速目标检测方法 | |
CN108280187B (zh) | 一种基于卷积神经网络深度特征的分级图像检索方法 | |
CN103336795B (zh) | 基于多特征的视频索引方法 | |
CN108509978A (zh) | 基于cnn的多级特征融合的多类目标检测方法及模型 | |
CN106022392B (zh) | 一种深度神经网络样本自动取舍的训练方法 | |
CN109829398A (zh) | 一种基于三维卷积网络的视频中的目标检测方法 | |
CN109063719B (zh) | 一种联合结构相似性和类信息的图像分类方法 | |
CN101650728A (zh) | 视频高层特征检索系统及其实现 | |
CN105589938A (zh) | 基于fpga的图像检索系统及检索方法 | |
CN108009637B (zh) | 基于跨层特征提取的像素级台标识别网络的台标分割方法 | |
CN108897791B (zh) | 一种基于深度卷积特征和语义相似度量的图像检索方法 | |
CN107291825A (zh) | 一种视频中同款商品的检索方法和系统 | |
CN109711401A (zh) | 一种基于Faster Rcnn的自然场景图像中的文本检测方法 | |
CN113032613B (zh) | 一种基于交互注意力卷积神经网络的三维模型检索方法 | |
CN109872331A (zh) | 一种基于深度学习的遥感图像数据自动识别分类方法 | |
CN106874421A (zh) | 基于自适应矩形窗口的图像检索方法 | |
CN110674326A (zh) | 一种基于多项式分布学习的神经网络结构检索方法 | |
CN115222998A (zh) | 一种图像分类方法 | |
CN113191450B (zh) | 一种基于动态标签调整的弱监督目标检测算法 | |
CN108805280A (zh) | 一种图像检索的方法和装置 | |
CN110188811A (zh) | 基于赋范梯度特征与卷积神经网络的水下目标检测方法 | |
CN117312594A (zh) | 一种融合双尺度特征的草图化机械零件库检索方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |