CN108205580B - 一种图像检索方法、装置及计算机可读存储介质 - Google Patents
一种图像检索方法、装置及计算机可读存储介质 Download PDFInfo
- Publication number
- CN108205580B CN108205580B CN201710891875.9A CN201710891875A CN108205580B CN 108205580 B CN108205580 B CN 108205580B CN 201710891875 A CN201710891875 A CN 201710891875A CN 108205580 B CN108205580 B CN 108205580B
- Authority
- CN
- China
- Prior art keywords
- feature
- clustering
- image
- features
- retrieved
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 57
- 230000009467 reduction Effects 0.000 claims abstract description 115
- 230000004927 fusion Effects 0.000 claims abstract description 26
- 238000012545 processing Methods 0.000 claims description 35
- 238000004590 computer program Methods 0.000 claims description 21
- 238000013527 convolutional neural network Methods 0.000 claims description 17
- 238000000265 homogenisation Methods 0.000 claims description 14
- 238000005070 sampling Methods 0.000 claims description 13
- 230000002087 whitening effect Effects 0.000 claims description 7
- 238000004364 calculation method Methods 0.000 claims description 2
- 238000005286 illumination Methods 0.000 abstract description 7
- 238000010586 diagram Methods 0.000 description 13
- 238000013528 artificial neural network Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 8
- 238000000513 principal component analysis Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 239000002904 solvent Substances 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000000556 factor analysis Methods 0.000 description 1
- 238000010191 image analysis Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/5838—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using colour
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/55—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2135—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/762—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using clustering, e.g. of similar faces in social networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/7715—Feature extraction, e.g. by transforming the feature space, e.g. multi-dimensional scaling [MDS]; Mappings, e.g. subspace methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Databases & Information Systems (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Library & Information Science (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Medical Informatics (AREA)
- Multimedia (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Mathematical Physics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
- Processing Or Creating Images (AREA)
Abstract
本发明涉及计算机视觉领域,提供了一种图像检索方法、装置及计算机可读存储介质,以准确、高效地检索背景复杂和/或ROI较小的图像。所述方法包括:对待检索图像的各卷积层特征分别进行降维操作,得到各降维特征;基于各降维特征进行聚类,得到多个聚类特征;对多个聚类特征进行特征融合,得到全局特征;基于全局特征,从数据库中对待检索图像进行检索。本发明一方面,通过对待检索图像的各卷积层特征分别进行降维操作,使得感兴趣区域(Region Of Interest,ROI)可变成任意形状,降低了噪声对图像检索结果的影响;另一方面,通过基于各降维特征进行聚类操作,获取多个聚类区域特征,最大程度上降低了由于光照、角度、遮挡等因素对图像特征的影响。
Description
技术领域
本发明属于计算机视觉领域,尤其涉及一种图像检索方法、装置及计算机可读存储介质。
背景技术
图像检索指的是给定一张待检索图像,通过检索数据库,从中返回一张与该待检索图像最相近的图像的任务。图像检索是计算机视觉及图像分析的重要问题。图像检索在许多领域有些重要的应用,例如,商品推荐、安防监控和医学诊断等。
尽管业界投入了很多精力研究图像检索,但非常遗憾的是,图像检索仍然是一个复杂且困难的问题。图像检索的检索精度、效率等受到很多因素的影响,这是因为,一方面,复杂的图像背景往往对感兴趣区域存在着严重的干扰,影响检索的精确度;另一方面,在大规模的图像检索过程中,图像往往达到百万级甚至更大,而图像检索对实时性要求又是十分高的任务,因此要求图像检索的算法必须十分高效、快捷。然而,现有的许多图像检索算法对于具有复杂背景或者感兴趣区域(Region Of Interest,ROI)较小的图像往往不能准确、高效地提取出有效的检索方案,进而不能提取出好的特征进行检索。
上述技术问题亟待业界解决。
发明内容
本发明提供一种图像检索方法、装置及计算机可读存储介质,以准确、高效地检索背景复杂和/或ROI较小的图像。
本发明第一方面提供了一种图像检索方法,所述方法包括:
对待检索图像的各卷积层特征分别进行降维操作,得到各降维特征,所述降维特征的维度小于所述卷积层特征的维度;
基于所述各降维特征进行聚类,得到多个聚类特征;
对所述多个聚类特征进行特征融合,得到全局特征;
基于所述全局特征,从数据库中对所述待检索图像进行检索。
结合本发明的第一方面,在第一方面的第一种实施方式中,所述对待检索图像的各卷积层特征分别进行降维操作之前,所述方法还包括:
将所述待检索图像输入卷积神经网络,得到所述各卷积层特征。
结合本发明的第一方面的第一种实施方式,在第一方面的第二种实施方式中,每个所述卷积层特征分别用于表征所述图像中对应像素区域的特征。
结合本发明的第一方面,在第一方面的第三种实施方式中,所述基于所述各降维特征进行聚类,得到多个聚类特征,包括:
基于所述各降维特征之间的距离,将所述降维特征进行聚类,得到多个特征聚类中心;
针对所述多个特征聚类中心的每个特征聚类中心,分别对相应的卷积层特征进行最大值采样,作为各特征聚类中心的所述聚类特征。
结合本发明的第一方面,在第一方面的第四种实施方式中,所述对所述多个聚类特征进行特征融合,得到全局特征,包括:
分别对所述多个聚类特征中的每个聚类特征进行回归处理,得到各回归聚类特征;
将所述各回归聚类特征相加,得到所述全局特征。
结合本发明的第一方面的第四种实施方式,在第一方面的第五种实施方式中,所述分别对所述多个聚类特征中的每个聚类特征进行回归处理,得到各回归聚类特征,包括:
分别对所述多个聚类特征中的每个聚类特征依次进行均一化处理、白化处理、再均一化处理,得到所述各回归聚类特征。
结合本发明的第一方面,在第一方面的第六种实施方式中,所述基于所述全局特征,从数据库中对所述待检索图像进行检索,包括:
基于所述全局特征,从所述数据库中获取与所述待检索图像之间的相似度最高的K个图像,所述K为大于或者等于1的整数。
结合本发明的第一方面的第六种实施方式,在第一方面的第七种实施方式中,所述基于所述全局特征,从所述数据库中获取与所述待检索图像之间的相似度最高的K个图像,包括:
计算所述全局特征与所述数据库中各图像特征之间的距离;
基于所述全局特征与所述数据库中各图像特征之间的距离,从所述数据库中获取与所述全局特征之间的距离最小的K个图像,作为所述与待检索图像之间的相似度最高的K个图像。
结合本发明的第一方面的第六种或第七种实施方式,在第一方面的第八种实施方式中,所述方法还包括:
展示所述K个图像以及分别与所述待检索图像之间的相似度。
结合本发明的第一方面,在第一方面的第九种实施方式中,所述降维特征的维度为5。
结合本发明的第一方面,在第一方面的第十种实施方式中,所述聚类特征的个数为32个。
本发明第二方面提供了一种图像检索装置,所述装置包括:
降维模块,用于对待检索图像的各卷积层特征分别进行降维操作,得到各降维特征,所述降维特征的维度小于所述卷积层特征的维度;
聚类模块,用于基于所述各降维特征进行聚类,得到多个聚类特征;
融合模块,用于对所述多个聚类特征进行特征融合,得到全局特征;
检索模块,用于基于所述全局特征,从数据库中对所述待检索图像进行检索。
结合本发明的第二方面,在第二方面的第一种实施方式中,所述装置还包括:
输入模块,用于将所述待检索图像输入卷积神经网络,得到所述各卷积层特征。
结合本发明的第二方面的第一种实施方式,在第二方面的第二种实施方式中,每个所述卷积层特征分别用于表征所述图像中对应像素区域的特征。
结合本发明的第二方面,在第二方面的第三种实施方式中,所述聚类模块包括:
第一处理单元,用于基于所述各降维特征之间的距离,将所述降维特征进行聚类,得到多个特征聚类中心;
采样单元,用于针对所述多个特征聚类中心的每个特征聚类中心,分别对相应的卷积层特征进行最大值采样,作为各特征聚类中心的所述聚类特征。
结合本发明的第二方面,在第二方面的第四种实施方式中,所述融合模块包括:
回归处理单元,用于分别对所述多个聚类特征中的每个聚类特征进行回归处理,得到各回归聚类特征;
相加单元,用于将所述各回归聚类特征相加,得到所述全局特征。
结合本发明的第二方面的第四种实施方式,在第二方面的第五种实施方式中,所述回归处理单元包括:
第二处理单元,用于分别对所述多个聚类特征中的每个聚类特征依次进行均一化处理、白化处理、再均一化处理,得到所述各回归聚类特征。
结合本发明的第二方面,在第二方面的第六种实施方式中,所述检索模块包括:
第一获取单元,用于基于所述全局特征,从所述数据库中获取与所述待检索图像之间的相似度最高的K个图像,所述K为大于或者等于1的整数。
结合本发明的第二方面的第六种实施方式,在第二方面的第七种实施方式中,所述第一获取单元包括:
计算单元,用于计算所述全局特征与所述数据库中各图像特征之间的距离;
第二获取单元,用于基于所述全局特征与所述数据库中各图像特征之间的距离,从所述数据库中获取与所述全局特征之间的距离最小的K个图像,作为所述与待检索图像之间的相似度最高的K个图像。
结合本发明的第二方面的第六种或第七种实施方式,所述装置还包括:
展示模块,用于展示所述K个图像以及分别与所述待检索图像之间的相似度。
结合本发明的第二方面,在第二方面的第九种实施方式中,所述降维特征的维度为5。
结合本发明的第二方面,在第二方面的第十种实施方式中,所述聚类特征的个数为32个。
本发明第三方面提供了一种终端设备,包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序,处理器执行计算机程序时实现以下步骤:
对待检索图像的各卷积层特征分别进行降维操作,得到各降维特征,所述降维特征的维度小于所述卷积层特征的维度;
基于所述各降维特征进行聚类,得到多个聚类特征;
对所述多个聚类特征进行特征融合,得到全局特征;
基于所述全局特征,从数据库中对所述待检索图像进行检索。
本发明实施例的第四方面提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
对待检索图像的各卷积层特征分别进行降维操作,得到各降维特征,所述降维特征的维度小于所述卷积层特征的维度;
基于所述各降维特征进行聚类,得到多个聚类特征;
对所述多个聚类特征进行特征融合,得到全局特征;
基于所述全局特征,从数据库中对所述待检索图像进行检索。
从上述本发明提供的技术方案可知,一方面,通过对待检索图像的各卷积层特征分别进行降维操作,使得感兴趣区域(Region Of Interest,ROI)可变成任意形状,降低了噪声对图像检索结果的影响;另一方面,通过基于各降维特征进行聚类操作,获取多个聚类区域特征,最大程度上降低了由于光照、角度、遮挡等因素对图像特征的影响。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动前提下,还可以根据这些附图获得其他的附图。
图1-a是本发明实施例提供的图像检索方法的实现流程示意图;
图1-b是本发明另一实施例提供的图像检索方法的实现流程示意图;
图1-c是本发明另一实施例提供的图像检索方法的实现流程示意图;
图2是本发明实施例提供的图像检索装置的结构示意图;
图3是本发明另一实施例提供的图像检索装置的结构示意图;
图4是本发明另一实施例提供的图像检索装置的结构示意图;
图5是本发明另一实施例提供的图像检索装置的结构示意图;
图6是本发明另一实施例提供的图像检索装置的结构示意图;
图7是本发明另一实施例提供的图像检索装置的结构示意图;
图8是本发明另一实施例提供的图像检索装置的结构示意图;
图9-a是本发明另一实施例提供的图像检索装置的结构示意图;
图9-b是本发明另一实施例提供的图像检索装置的结构示意图;
图10是本发明实施例提供的终端设备的结构示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本发明实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本发明。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本发明的描述。
为了说明本发明的技术方案,下面通过具体实施例来进行说明。
附图1-a是本发明实施例提供的图像检索方法的实现流程示意图,主要包括以下步骤Sa101至Sa104,以下详细说明:
Sa101,对待检索图像的各卷积层特征分别进行降维操作,得到各降维特征,其中,降维特征的维度小于卷积层特征的维度。
对待检索图像的各卷积层特征分别进行降维操作,是基于这样一个事实,即:多重共线性-预测变量之间相互关联(例如,多重共线性会导致解空间的不稳定,从而可能导致结果的不连贯);2.高维空间本身具有稀疏性(研究表明,一维正态分布有68%的值落于正负标准差之间,而在十维空间上只有0.02%);3)过多的变量会妨碍查找规律的建立;4)仅在变量层面上分析可能会忽略变量之间的潜在联系(例如几个预测变量可能落入仅反映数据某一方面特征的一个组内);5)最有价值的信息集中在高维向量的前面部分,而后面的部分往往是噪声;6)降维之后更利于快速高效地对特征进行聚类并降低受噪声的影响。因此,降维操作的目的包括减少预测变量的个数、确保这些变量是相互独立的以及提供一个框架来解释结果,等等。
Sa102,基于各降维特征进行聚类,得到多个聚类特征。
Sa103,对多个聚类特征进行特征融合,得到全局特征。
Sa104,基于全局特征,从数据库中对待检索图像进行检索。
从上述附图1-a示例的图像检索方法可知,一方面,通过对待检索图像的各卷积层特征分别进行降维操作,使得感兴趣区域(Region Of Interest,ROI)可变成任意形状,降低了噪声对图像检索结果的影响;另一方面,通过基于各降维特征进行聚类操作,获取多个聚类区域特征,最大程度上降低了由于光照、角度、遮挡等因素对图像特征的影响。
附图1-b是本发明实施例提供的图像检索方法的实现流程示意图,主要包括以下步骤Sb101至Sb105,以下详细说明。
Sb101,对待检索图像的各卷积层特征分别进行降维操作,得到各降维特征,其中,降维特征的维度小于卷积层特征的维度。
对待检索图像的各卷积层特征分别进行降维操作之前,还包括将待检索图像输入卷积神经网络,得到各卷积层特征。具体地,通过对神经网络的学习,获得卷积神经网络,即通过图像分类任务或距离学习任务,预先学习好神经网络权重,然后将该神经网络结构的全连接层丢弃,仅保留其卷积层的参数,包括卷积核的权重和偏移等,获得卷积神经网络;然后,将待检索图像输入卷积神经网络,使其输出待检索图像的各卷积层特征,其中,卷积神经网络包含卷积层和降采样层,此处的每个卷积层特征分别用于表征待检索图像中对应像素区域的特征。例如,若像素区域为8*8像素单位,则卷积层特征的个数为(待检索图像的高度包含的像素个数/8)*(待检索图像的宽度包含的像素个数/8);再如,若像素区域为16*16像素单位,则卷积层特征的个数为(待检索图像的高度包含的像素个数/16)*(待检索图像的宽度包含的像素个数/16),等等。
需要说明的是,上述实施例中各降维特征的维度可以根据检索的精度来定。一般而言,降维之前的各卷积层特征的维度会远远大于降维特征的维度,例如,降维之前的各卷积层特征的维度为256或512,而降维特征的维度可以为5。
从实施例可知,一方面,通过提取各卷积层特征,利用卷积神经网络的卷积层特征强大表达能力,让语义相近的图像在特征空间上也相近,降低了由于光照、角度、遮挡等因素对图像特征的影响,从而提高了图像检索的精准度或质量;另一方面,通过对待检索图像的卷积层特征进行降维操作,使得待检索图像的ROI可变成任意形状,降低噪声对图像检索结果的影响。
在本发明实施例中,待检索图像的各卷积层特征是待检索图像在图像空间H*W个位置的D维特征的集合,若对待检索图像的各卷积层特征分别进行降维操作,得到各降维特征可以是将待检索图像在图像空间H*W个位置的D维特征降为待检索图像在图像空间H*W个位置的C维特征,显然,此处的C小于D,H和W分别为待检索图像的高和宽。
Sb102,基于各降维特征之间的距离,将降维特征进行聚类,得到多个特征聚类中心。
具体地,将待检索图像的各个降维特征中特征之间的距离相当的降维特征聚成一个特征聚类中心,最终构成多个特征聚类中心。
Sb103,针对经步骤Sb102得到的多个特征聚类中心的每个特征聚类中心,分别对相应的卷积层特征上进行最大值采样,作为各特征聚类中心的聚类特征。
需要说明的是,上述步骤Sb103中,相应的卷积层特征是指每个特征聚类中心包含的各降维特征中,每个降维特征对应的卷积层特征,而聚类特征的个数可以为32个,其也可以根据检索的精度来取其他数值,此处仅仅是举例说明。
上述通过基于各降维特征进行聚类操作,获取多个聚类区域特征,最大程度上降低了由于光照、角度、遮挡等因素对图像特征的影响。
Sb104,对多个聚类特征进行特征融合,得到全局特征。
具体地,对多个聚类特征进行特征融合,得到全局特征可以是:分别对多个聚类特征中的每个聚类特征进行回归处理,得到各回归聚类特征,将各回归聚类特征相加,得到全局特征,其中,分别对多个聚类特征中的每个聚类特征进行回归处理,得到各回归聚类特征包括分别对多个聚类特征中的每个聚类特征依次进行均一化处理、白化处理、再均一化处理,从而得到各回归聚类特征。
Sb105,基于全局特征,从数据库中对待检索图像进行检索。
作为本发明一个实施例,基于全局特征,从数据库中对所述待检索图像进行检索可以是:基于全局特征,从数据库中获取与待检索图像之间的相似度最高的K个图像,其中,K为大于或者等于1的整数。具体地,
可以根据全局特征与数据库中图像的特征之间的距离,对数据库中图像与待检索图像的相似度排序,获取与待检索图像相似度最高的K个图像。
由于数据库中图像的特征与全局特征之间的距离越小,表明该图像与待检索图像越相似或相似度越高,上述实施例就是按照这个原则,对数据库中图像与待检索图像的相似度排序,获取与待检索图像相似度最高的K图像。
进一步地,基于全局特征,从数据库中获取与所述待检索图像之间的相似度最高的K个图像可以包括:计算全局特征与数据库中各图像特征之间的距离;基于全局特征与数据库中各图像特征之间的距离,从数据库中获取与全局特征之间的距离最小的K个图像,作为与待检索图像之间的相似度最高的K个图像。
从数据库中获取与待检索图像之间的相似度最高的K个图像后,所述方法还包括展示K个图像以及分别与待检索图像之间的相似度。
从上述附图1示例的图像检索方法可知,一方面,通过对待检索图像的各卷积层特征分别进行降维操作,使得感兴趣区域(Region Of Interest,ROI)可变成任意形状,降低了噪声对图像检索结果的影响;另一方面,通过基于各降维特征进行聚类操作,获取多个聚类区域特征,最大程度上降低了由于光照、角度、遮挡等因素对图像特征的影响。
附图1-c是本发明另一实施例提供的图像检索方法的实现流程示意图,主要包括以下步骤Sc101至Sc107,以下详细说明:
Sc101,将待检索图像输入卷积神经网络,得到各卷积层特征。
具体地,通过对神经网络的学习,获得卷积神经网络,即通过图像分类任务或距离学习任务,预先学习好神经网络权重,然后将该神经网络结构的全连接层丢弃,仅保留其卷积层的参数,包括卷积核的权重和偏移等,获得卷积神经网络;然后,将待检索图像输入卷积神经网络,使其输出待检索图像的各卷积层特征,其中,卷积神经网络包含卷积层和降采样层,此处的每个卷积层特征分别用于表征待检索图像中对应像素区域的特征。例如,若像素区域为8*8像素单位,则卷积层特征的个数为(待检索图像的高度包含的像素个数/8)*(待检索图像的宽度包含的像素个数/8);再如,若像素区域为16*16像素单位,则卷积层特征的个数为(待检索图像的高度包含的像素个数/16)*(待检索图像的宽度包含的像素个数/16),等等。
Sc102,对待检索图像的各卷积层特征分别进行降维操作,得到各降维特征,其中,降维特征的维度小于卷积层特征的维度。
作为本发明一个实施例,对待检索图像的各卷积层特征分别进行降维操作,得到各降维特征可以是采用主成分分析(Principal Component Analysis,PCA)方法进行降维。PCA方法具体是将降维前的n个特征用数目更少的m个特征取代,新特征是旧特征的线性组合,这些线性组合最大化样本方差,尽量使新的m个特征互不相关,而从旧特征到新特征的映射捕获数据中的固有变异性。
需要说明的是,本发明对待检索图像的各卷积层特征分别进行降维操作并不局限于上述PCA方法,还可以采用其他方法,例如,因子分析或用户自定义复合等,因此,上述PCA方法并不用于限制本发明。
在本发明实施例中,待检索图像的各卷积层特征是待检索图像在图像空间H*W个位置的D维特征的集合,若对待检索图像的各卷积层特征分别进行降维操作,得到各降维特征可以是将待检索图像在图像空间H*W个位置的D维特征降为待检索图像在图像空间H*W个位置的C维特征,显然,此处的C小于D,H和W分别为待检索图像的高和宽。
Sc103,基于各降维特征之间的距离,将降维特征进行聚类,得到多个特征聚类中心。
具体地,将待检索图像的各个降维特征中特征之间的距离相当的降维特征聚成一个特征聚类中心,最终构成多个特征聚类中心。
Sc104,针对经步骤Sc103得到的多个特征聚类中心的每个特征聚类中心,分别对相应的卷积层特征上进行最大值采样,作为各特征聚类中心的聚类特征。
需要说明的是,上述步骤S c104中,相应的卷积层特征是指每个特征聚类中心包含的各降维特征中,每个降维特征对应的卷积层特征,而聚类特征的个数可以为32个,其也可以根据检索的精度来取其他数值,此处仅仅是举例说明。
上述通过基于各降维特征进行聚类操作,获取多个聚类区域特征,最大程度上降低了由于光照、角度、遮挡等因素对图像特征的影响。
Sc105,分别对多个聚类特征中的每个聚类特征进行回归处理,得到各回归聚类特征。
具体地,分别对多个聚类特征中的每个聚类特征进行回归处理,得到各回归聚类特征包括分别对多个聚类特征中的每个聚类特征依次进行均一化处理、白化处理、再均一化处理,从而得到各回归聚类特征。
Sc106,将各回归聚类特征相加,得到全局特征。
Sc107,基于全局特征,从数据库中对待检索图像进行检索。
作为本发明一个实施例,基于全局特征,从数据库中对所述待检索图像进行检索可以是:基于全局特征,从数据库中获取与待检索图像之间的相似度最高的K个图像,其中,K为大于或者等于1的整数。具体地,
可以根据全局特征与数据库中图像的特征之间的距离,对数据库中图像与待检索图像的相似度排序,获取与待检索图像相似度最高的K个图像。
由于数据库中图像的特征与全局特征之间的距离越小,表明该图像与待检索图像越相似或相似度越高,上述实施例就是按照这个原则,对数据库中图像与待检索图像的相似度排序,获取与待检索图像相似度最高的K图像。
进一步地,基于全局特征,从数据库中获取与所述待检索图像之间的相似度最高的K个图像可以包括:计算全局特征与数据库中各图像特征之间的距离;基于全局特征与数据库中各图像特征之间的距离,从数据库中获取与全局特征之间的距离最小的K个图像,作为与待检索图像之间的相似度最高的K个图像。
从数据库中获取与待检索图像之间的相似度最高的K个图像后,所述方法还包括展示K个图像以及分别与待检索图像之间的相似度。
图2是本发明实施例提供的图像检索装置的示意图,主要包括降维模块201、聚类模块202、融合模块203和检索模块204,详细说明如下:
降维模块201,用于对待检索图像的各卷积层特征分别进行降维操作,得到各降维特征,其中,降维特征的维度小于卷积层特征的维度,降维特征的维度可以为5;
聚类模块202,用于基于各降维特征进行聚类,得到多个聚类特征,聚类特征的个数可以为32;
融合模块203,用于对多个聚类特征进行特征融合,得到全局特征;
检索模块204,用于基于全局特征,从数据库中对待检索图像进行检索。
需要说明的是,本发明实施例提供的装置,由于与本发明方法实施例基于同一构思,其带来的技术效果与本发明方法实施例相同,具体内容可参见本发明方法实施例中的叙述,此处不再赘述。
附图2示例的图像检索装置还可以包括输入模块301,如附图3示例的图像检索装置。输入模块301用于将待检索图像输入卷积神经网络,得到各卷积层特征,其中,每个卷积层特征分别用于表征图像中对应像素区域的特征。
附图2示例的聚类模块201可以包括第一处理单元401和采样单元402,如附图4示例的图像检索装置,其中:
第一处理单元401,用于基于各降维特征之间的距离,将降维特征进行聚类,得到多个特征聚类中心;
采样单元402,用于针对多个特征聚类中心的每个特征聚类中心,分别对相应的卷积层特征进行最大值采样,作为各特征聚类中心的聚类特征。
附图2示例的融合模块203可以包括回归处理单元501和相加单元502,如附图5示例的图像检索装置,其中:
回归处理单元501,用于分别对多个聚类特征中的每个聚类特征进行回归处理,得到各回归聚类特征;
相加单元502,用于将各回归聚类特征相加,得到全局特征。
附图5示例的回归处理单元501可以包括第二处理单元601,如附图6示例的图像检索装置。第二处理单元601用于分别对多个聚类特征中的每个聚类特征依次进行均一化处理、白化处理、再均一化处理,得到各回归聚类特征。
附图2示例的检索模块204可以包括第一获取单元701,如附图7示例的图像检索装置第一获取单元701用于基于全局特征,从数据库中获取与待检索图像之间的相似度最高的K个图像,其中,K为大于或者等于1的整数。
附图7示例的第一获取单元701可以包括计算单元801和第二获取单元802,如附图8示例的图像检索装置,其中:
计算单元801,用于计算全局特征与数据库中各图像特征之间的距离;
第二获取单元802,用于基于全局特征与数据库中各图像特征之间的距离,从数据库中获取与全局特征之间的距离最小的K个图像,作为与待检索图像之间的相似度最高的K个图像。
附图7或附图8示例的图像检索装置还可以包括展示模块901,如附图9-a或附图9-b示例的图像检索装置。展示模块901用于展示与待检索图像之间的相似度最高的K个图像以及分别与待检索图像之间的相似度。
图10是本发明一实施例提供的终端设备的结构示意图。如图10所示,该实施例的终端设备10包括:处理器100、存储器101以及存储在存储器101中并可在处理器100上运行的计算机程序102,例如图像检索方法的程序。处理器100执行计算机程序102时实现上述图像检索方法实施例中的步骤,例如图1-a所示的步骤Sa101至Sa104。或者,处理器100执行计算机程序102时实现上述各装置实施例中各模块/单元的功能,例如图2所示降维模块201、聚类模块202、融合模块203和检索模块204的功能。
示例性的,图像检索方法的计算机程序102主要包括:对待检索图像的各卷积层特征分别进行降维操作,得到各降维特征,所述降维特征的维度小于所述卷积层特征的维度;基于所述各降维特征进行聚类,得到多个聚类特征;对所述多个聚类特征进行特征融合,得到全局特征;基于所述全局特征,从数据库中对所述待检索图像进行检索。计算机程序102可以被分割成一个或多个模块/单元,一个或者多个模块/单元被存储在存储器101中,并由处理器100执行,以完成本发明。一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述计算机程序102在计算设备10中的执行过程。例如,计算机程序102可以被分割成降维模块201、聚类模块202、融合模块203和检索模块204的功能(虚拟装置中的模块),各模块具体功能如下:降维模块201,用于对待检索图像的各卷积层特征分别进行降维操作,得到各降维特征,所述降维特征的维度小于所述卷积层特征的维度;聚类模块202,用于基于所述各降维特征进行聚类,得到多个聚类特征;融合模块203,用于对所述多个聚类特征进行特征融合,得到全局特征;检索模块204,用于基于所述全局特征,从数据库中对所述待检索图像进行检索。
终端设备10可包括但不仅限于处理器100、存储器101。本领域技术人员可以理解,图10仅仅是终端设备10的示例,并不构成对终端设备10的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如终端设备还可以包括输入输出设备、网络接入设备、总线等。
所称处理器100可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器101可以是终端设备10的内部存储单元,例如终端设备10的硬盘或内存。存储器101也可以是终端设备10的外部存储设备,例如终端设备10上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,存储器101还可以既包括终端设备10的内部存储单元也包括外部存储设备。存储器101用于存储计算机程序以及终端设备所需的其他程序和数据。存储器101还可以用于暂时地存储已经输出或者将要输出的数据。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的实施例中,应该理解到,所揭露的装置/终端设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/终端设备实施例仅仅是示意性的,例如,模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,图像检索方法的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤,即,对待检索图像的各卷积层特征分别进行降维操作,得到各降维特征,所述降维特征的维度小于所述卷积层特征的维度;基于所述各降维特征进行聚类,得到多个聚类特征;对所述多个聚类特征进行特征融合,得到全局特征;基于所述全局特征,从数据库中对所述待检索图像进行检索。其中,计算机程序包括计算机程序代码,计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。计算机可读介质可以包括:能够携带计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。
Claims (22)
1.一种图像检索方法,其特征在于,所述方法包括:
对待检索图像的各卷积层特征分别进行降维操作,得到各降维特征,所述降维特征的维度小于所述卷积层特征的维度;根据检索精度来确定所述降维特征的维度;
基于所述各降维特征进行聚类,得到多个聚类特征;
对所述多个聚类特征进行特征融合,得到全局特征;
基于所述全局特征,从数据库中对所述待检索图像进行检索;
所述对待检索图像的各卷积层特征分别进行降维操作之前,所述方法还包括:将所述待检索图像输入卷积神经网络,得到所述各卷积层特征。
2.如权利要求1所述图像检索方法,其特征在于,每个所述卷积层特征分别用于表征所述图像中对应像素区域的特征。
3.如权利要求1所述图像检索方法,其特征在于,所述基于所述各降维特征进行聚类,得到多个聚类特征,包括:
基于所述各降维特征之间的距离,将所述降维特征进行聚类,得到多个特征聚类中心;
针对所述多个特征聚类中心的每个特征聚类中心,分别对相应的卷积层特征进行最大值采样,作为各特征聚类中心的所述聚类特征。
4.如权利要求1所述图像检索方法,其特征在于,所述对所述多个聚类特征进行特征融合,得到全局特征,包括:
分别对所述多个聚类特征中的每个聚类特征进行回归处理,得到各回归聚类特征;
将所述各回归聚类特征相加,得到所述全局特征。
5.如权利要求4所述图像检索方法,其特征在于,所述分别对所述多个聚类特征中的每个聚类特征进行回归处理,得到各回归聚类特征,包括:
分别对所述多个聚类特征中的每个聚类特征依次进行均一化处理、白化处理、再均一化处理,得到所述各回归聚类特征。
6.如权利要求1所述图像检索方法,其特征在于,所述基于所述全局特征,从数据库中对所述待检索图像进行检索,包括:
基于所述全局特征,从所述数据库中获取与所述待检索图像之间的相似度最高的K个图像,所述K为大于或者等于1的整数。
7.如权利要求6所述图像检索方法,其特征在于,所述基于所述全局特征,从所述数据库中获取与所述待检索图像之间的相似度最高的K个图像,包括:
计算所述全局特征与所述数据库中各图像特征之间的距离;
基于所述全局特征与所述数据库中各图像特征之间的距离,从所述数据库中获取与所述全局特征之间的距离最小的K个图像,作为与所述待检索图像之间的相似度最高的K个图像。
8.如权利要求6或7所述图像检索方法,其特征在于,所述方法还包括:
展示所述K个图像以及分别与所述待检索图像之间的相似度。
9.如权利要求1所述图像检索方法,其特征在于,所述降维特征的维度为5。
10.如权利要求1所述图像检索方法,其特征在于,所述聚类特征的个数为32个。
11.一种图像检索装置,其特征在于,所述装置包括:
降维模块,用于对待检索图像的各卷积层特征分别进行降维操作,得到各降维特征,所述降维特征的维度小于所述卷积层特征的维度;根据检索精度来确定所述降维特征的维度;
聚类模块,用于基于所述各降维特征进行聚类,得到多个聚类特征;
融合模块,用于对所述多个聚类特征进行特征融合,得到全局特征;
检索模块,用于基于所述全局特征,从数据库中对所述待检索图像进行检索;
所述装置还包括:输入模块,用于将所述待检索图像输入卷积神经网络,得到所述各卷积层特征。
12.如权利要求11所述图像检索装置,其特征在于,每个所述卷积层特征分别用于表征所述图像中对应像素区域的特征。
13.如权利要求11所述图像检索装置,其特征在于,所述聚类模块包括:
第一处理单元,用于基于所述各降维特征之间的距离,将所述降维特征进行聚类,得到多个特征聚类中心;
采样单元,用于针对所述多个特征聚类中心的每个特征聚类中心,分别对相应的卷积层特征进行最大值采样,作为各特征聚类中心的所述聚类特征。
14.如权利要求11所述图像检索装置,其特征在于,所述融合模块包括:
回归处理单元,用于分别对所述多个聚类特征中的每个聚类特征进行回归处理,得到各回归聚类特征;
相加单元,用于将所述各回归聚类特征相加,得到所述全局特征。
15.如权利要求14所述图像检索装置,其特征在于,所述回归处理单元包括:
第二处理单元,用于分别对所述多个聚类特征中的每个聚类特征依次进行均一化处理、白化处理、再均一化处理,得到所述各回归聚类特征。
16.如权利要求11所述图像检索装置,其特征在于,所述检索模块包括:
第一获取单元,用于基于所述全局特征,从所述数据库中获取与所述待检索图像之间的相似度最高的K个图像,所述K为大于或者等于1的整数。
17.如权利要求16所述图像检索装置,其特征在于,所述第一获取单元包括:
计算单元,用于计算所述全局特征与所述数据库中各图像特征之间的距离;
第二获取单元,用于基于所述全局特征与所述数据库中各图像特征之间的距离,从所述数据库中获取与所述全局特征之间的距离最小的K个图像,作为与所述待检索图像之间的相似度最高的K个图像。
18.如权利要求16或17所述图像检索装置,其特征在于,所述装置还包括:
展示模块,用于展示所述K个图像以及分别与所述待检索图像之间的相似度。
19.如权利要求11所述图像检索装置,其特征在于,所述降维特征的维度为5。
20.如权利要求11所述图像检索装置,其特征在于,所述聚类特征的个数为32个。
21.一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至10任意一项所述方法的步骤。
22.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至10任意一项所述方法的步骤。
Priority Applications (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710891875.9A CN108205580B (zh) | 2017-09-27 | 2017-09-27 | 一种图像检索方法、装置及计算机可读存储介质 |
CN202110818454.XA CN113536019A (zh) | 2017-09-27 | 2017-09-27 | 一种图像检索方法、装置及计算机可读存储介质 |
JP2019571060A JP6905603B2 (ja) | 2017-09-27 | 2018-09-10 | 画像検索方法、装置、機器および読み取り可能な記憶媒体 |
KR1020197038763A KR102363811B1 (ko) | 2017-09-27 | 2018-09-10 | 이미지 검색 방법, 장치, 기기 및 판독 가능 저장 매체 |
SG11202000081XA SG11202000081XA (en) | 2017-09-27 | 2018-09-10 | Image retrieval methods and apparatuses, devices, and readable storage media |
PCT/CN2018/104891 WO2019062534A1 (zh) | 2017-09-27 | 2018-09-10 | 一种图像检索方法、装置、设备及可读存储介质 |
US16/732,241 US11256737B2 (en) | 2017-09-27 | 2019-12-31 | Image retrieval methods and apparatuses, devices, and readable storage media |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710891875.9A CN108205580B (zh) | 2017-09-27 | 2017-09-27 | 一种图像检索方法、装置及计算机可读存储介质 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110818454.XA Division CN113536019A (zh) | 2017-09-27 | 2017-09-27 | 一种图像检索方法、装置及计算机可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108205580A CN108205580A (zh) | 2018-06-26 |
CN108205580B true CN108205580B (zh) | 2021-08-31 |
Family
ID=62603639
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110818454.XA Pending CN113536019A (zh) | 2017-09-27 | 2017-09-27 | 一种图像检索方法、装置及计算机可读存储介质 |
CN201710891875.9A Active CN108205580B (zh) | 2017-09-27 | 2017-09-27 | 一种图像检索方法、装置及计算机可读存储介质 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110818454.XA Pending CN113536019A (zh) | 2017-09-27 | 2017-09-27 | 一种图像检索方法、装置及计算机可读存储介质 |
Country Status (6)
Country | Link |
---|---|
US (1) | US11256737B2 (zh) |
JP (1) | JP6905603B2 (zh) |
KR (1) | KR102363811B1 (zh) |
CN (2) | CN113536019A (zh) |
SG (1) | SG11202000081XA (zh) |
WO (1) | WO2019062534A1 (zh) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113536019A (zh) * | 2017-09-27 | 2021-10-22 | 深圳市商汤科技有限公司 | 一种图像检索方法、装置及计算机可读存储介质 |
CN109086437B (zh) * | 2018-08-15 | 2021-06-01 | 重庆大学 | 一种融合Faster-RCNN和Wasserstein自编码器的图像检索方法 |
CN110502659B (zh) * | 2019-08-23 | 2022-07-15 | 深圳市商汤科技有限公司 | 图像特征提取及网络的训练方法、装置和设备 |
CN112882686B (zh) * | 2019-11-29 | 2024-07-30 | 中国商用飞机有限责任公司 | 紧固件孔特征库的建立方法、装置、计算机以及存储介质 |
KR102475177B1 (ko) * | 2020-11-04 | 2022-12-07 | 한국전자기술연구원 | 영상 처리 방법 및 장치 |
CN112766265B (zh) * | 2021-01-27 | 2023-11-14 | 厦门树冠科技有限公司 | 一种任意形状roi截取方法、系统、介质及设备 |
CN112800258B (zh) * | 2021-03-11 | 2024-05-31 | 上海依图网络科技有限公司 | 图像检索方法、装置、电子设备及计算机可读存储介质 |
CN112669320B (zh) * | 2021-03-22 | 2021-08-13 | 四川大学 | 一种基于深度神经网络的spect甲状腺显像智能识别方法 |
JP2024120121A (ja) * | 2021-07-09 | 2024-09-04 | パナソニックIpマネジメント株式会社 | 評価システム、評価方法、生成システム、生成方法、推論システム、推論方法、学習済みモデル、プログラム、及び、情報処理システム |
CN114387619A (zh) * | 2021-12-31 | 2022-04-22 | 歌尔科技有限公司 | 行人检测方法、装置、电子设备及计算机可读存储介质 |
Family Cites Families (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101211355B (zh) * | 2006-12-30 | 2010-05-19 | 中国科学院计算技术研究所 | 一种基于聚类的图像查询方法 |
CN102004786B (zh) * | 2010-12-02 | 2012-11-28 | 上海交通大学 | 图像检索系统中的加速方法 |
US9075824B2 (en) * | 2012-04-27 | 2015-07-07 | Xerox Corporation | Retrieval system and method leveraging category-level labels |
CN106462940A (zh) * | 2014-10-09 | 2017-02-22 | 微软技术许可有限责任公司 | 图像中通用对象检测 |
US9786036B2 (en) * | 2015-04-28 | 2017-10-10 | Qualcomm Incorporated | Reducing image resolution in deep convolutional networks |
WO2017006648A1 (ja) * | 2015-07-03 | 2017-01-12 | Necソリューションイノベータ株式会社 | 画像判別装置、画像判別方法、及びコンピュータ読み取り可能な記録媒体 |
US20170039469A1 (en) * | 2015-08-04 | 2017-02-09 | Qualcomm Incorporated | Detection of unknown classes and initialization of classifiers for unknown classes |
JP6364387B2 (ja) * | 2015-08-17 | 2018-07-25 | 日本電信電話株式会社 | 特徴量生成装置、方法、及びプログラム |
WO2017151759A1 (en) * | 2016-03-01 | 2017-09-08 | The United States Of America, As Represented By The Secretary, Department Of Health And Human Services | Category discovery and image auto-annotation via looped pseudo-task optimization |
CN105574215B (zh) | 2016-03-04 | 2019-11-12 | 哈尔滨工业大学深圳研究生院 | 一种基于多层特征表示的实例级图像搜索方法 |
CN106127725B (zh) * | 2016-05-16 | 2019-01-22 | 北京工业大学 | 一种基于多分辨率cnn的毫米波雷达云图分割方法 |
CN106202338B (zh) * | 2016-06-30 | 2019-04-05 | 合肥工业大学 | 基于多特征多关系的图像检索方法 |
CN106250812B (zh) * | 2016-07-15 | 2019-08-20 | 汤一平 | 一种基于快速r-cnn深度神经网络的车型识别方法 |
CN106228185B (zh) * | 2016-07-20 | 2019-10-15 | 武汉盈力科技有限公司 | 一种基于神经网络的通用图像分类识别系统及方法 |
CN106649665A (zh) * | 2016-12-14 | 2017-05-10 | 大连理工大学 | 一种面向图像检索的对象级深度特征聚合方法 |
CN106886553B (zh) * | 2016-12-27 | 2020-07-28 | 浙江宇视科技有限公司 | 一种图像检索方法及服务器 |
CN106649853A (zh) * | 2016-12-30 | 2017-05-10 | 儒安科技有限公司 | 一种基于深度学习的短文本聚类方法 |
CN106709875B (zh) * | 2016-12-30 | 2020-02-18 | 北京工业大学 | 一种基于联合深度网络的压缩低分辨率图像复原方法 |
CN106886599B (zh) * | 2017-02-28 | 2020-03-03 | 北京京东尚科信息技术有限公司 | 图像检索方法以及装置 |
CN113536019A (zh) * | 2017-09-27 | 2021-10-22 | 深圳市商汤科技有限公司 | 一种图像检索方法、装置及计算机可读存储介质 |
CN107679250B (zh) * | 2017-11-01 | 2020-12-01 | 浙江工业大学 | 一种基于深度自编码卷积神经网络的多任务分层图像检索方法 |
-
2017
- 2017-09-27 CN CN202110818454.XA patent/CN113536019A/zh active Pending
- 2017-09-27 CN CN201710891875.9A patent/CN108205580B/zh active Active
-
2018
- 2018-09-10 SG SG11202000081XA patent/SG11202000081XA/en unknown
- 2018-09-10 WO PCT/CN2018/104891 patent/WO2019062534A1/zh active Application Filing
- 2018-09-10 JP JP2019571060A patent/JP6905603B2/ja active Active
- 2018-09-10 KR KR1020197038763A patent/KR102363811B1/ko active IP Right Grant
-
2019
- 2019-12-31 US US16/732,241 patent/US11256737B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
CN108205580A (zh) | 2018-06-26 |
KR20200011988A (ko) | 2020-02-04 |
KR102363811B1 (ko) | 2022-02-16 |
SG11202000081XA (en) | 2020-02-27 |
JP6905603B2 (ja) | 2021-07-21 |
JP2020525908A (ja) | 2020-08-27 |
US20200133974A1 (en) | 2020-04-30 |
WO2019062534A1 (zh) | 2019-04-04 |
US11256737B2 (en) | 2022-02-22 |
CN113536019A (zh) | 2021-10-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108205580B (zh) | 一种图像检索方法、装置及计算机可读存储介质 | |
Jia et al. | Gabor cube selection based multitask joint sparse representation for hyperspectral image classification | |
CN110427970B (zh) | 图像分类方法、装置、计算机设备和存储介质 | |
US8200025B2 (en) | Image classification and search | |
CN115937655B (zh) | 多阶特征交互的目标检测模型及其构建方法、装置及应用 | |
Huang et al. | Local binary patterns and superpixel-based multiple kernels for hyperspectral image classification | |
KR101912748B1 (ko) | 확장성을 고려한 특징 기술자 생성 및 특징 기술자를 이용한 정합 장치 및 방법 | |
WO2023221713A1 (zh) | 图像编码器的训练方法、装置、设备及介质 | |
Yu et al. | A content-based goods image recommendation system | |
Guo et al. | Cmt: Context-matching-guided transformer for 3d tracking in point clouds | |
Russakovsky et al. | A steiner tree approach to efficient object detection | |
WO2023221790A1 (zh) | 图像编码器的训练方法、装置、设备及介质 | |
Ding et al. | Single sample per person face recognition with KPCANet and a weighted voting scheme | |
KR102421604B1 (ko) | 이미지 처리 방법, 장치 및 전자 기기 | |
CN113918598A (zh) | 一种乘积量化搜索方法、装置、终端和存储介质 | |
CN113920382A (zh) | 基于类一致性结构化学习的跨域图像分类方法和相关装置 | |
Wang et al. | Object tracking based on Huber loss function | |
Kapadia et al. | Improved CBIR system using Multilayer CNN | |
Gao et al. | Lightweight Spatial-Spectral Network Based on 3D-2D Multi-Group Feature Extraction Module for Hyperspectral Image Classification | |
Todorovich et al. | Real-time speckle image processing | |
CN110287943B (zh) | 图像的对象识别方法、装置、电子设备及存储介质 | |
CN110633630B (zh) | 一种行为识别方法、装置及终端设备 | |
Zhang et al. | Initial investigation of different classifiers for plant leaf classification using multiple features | |
Chernikov et al. | FRANS: Automatic feature extraction for time series forecasting | |
CN111897984B (zh) | 图片标注方法、装置、终端设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CP02 | Change in the address of a patent holder |
Address after: 518000 Room 201, building A, 1 front Bay Road, Shenzhen Qianhai cooperation zone, Shenzhen, Guangdong Patentee after: SHENZHEN SENSETIME TECHNOLOGY Co.,Ltd. Address before: 712 Haixiang Plaza, 1052 Nanhai Avenue, Nanshan District, Shenzhen, Guangdong 518000 Patentee before: SHENZHEN SENSETIME TECHNOLOGY Co.,Ltd. |
|
CP02 | Change in the address of a patent holder |