CN105912611A - 一种基于cnn的快速图像检索方法 - Google Patents
一种基于cnn的快速图像检索方法 Download PDFInfo
- Publication number
- CN105912611A CN105912611A CN201610211503.2A CN201610211503A CN105912611A CN 105912611 A CN105912611 A CN 105912611A CN 201610211503 A CN201610211503 A CN 201610211503A CN 105912611 A CN105912611 A CN 105912611A
- Authority
- CN
- China
- Prior art keywords
- vector
- image
- cluster centre
- data
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/5838—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using colour
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Library & Information Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Probability & Statistics with Applications (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于CNN(卷积神经网络)的快速图像检索方法,第一阶段是利用CNN网络对要检索的图像进行特征提取,得到代表图像的矢量特征。第二阶段是在特征数据库中对此矢量特征进行k近邻检索。本发明选择基于GOOGLENET网络的CNN特征,这是深度学习兴起后在计算机视觉领域的一个突破,它具有鲁棒性较好的特点。提取CNN特征后,本发明基于PQ的快速检索思想,并加入文本检索中的倒排策略,在应用中考虑自身的数据量,合理安排系统参数,并在检索结果重排序方面进行改进,加入快速排序策略,缩短了检测时间,提高了检测效率。
Description
技术领域
本发明涉及计算机视觉和模式识别的技术领域,具体涉及一种基于CNN(卷积神经网络)的快速图像检索方法。
背景技术
在当今的信息多媒体时代,互联网进入普通百姓家庭,并在生活中变得越来越重要。在日常生活中人们能够随时随地与外面的世界沟通交流,在我们通过互联网交流的过程中产生了巨大的多媒体数据,反而却给互联网用户快速找到自己所需要的信息造成了不小的障碍,因此搜索技术便应运而生。现代人在生活中使用图像和视频等方式直观的展示自己生活状态,图像信息在社会各行业中均得到普遍使用。图像信息的高效检索和管理在图像数据急剧增长的现代社会成为一个亟待解决的问题。
面对不断出现的需求,帮助用户在海量图像中高效、快速搜索到感兴趣的相关图像成为热门的研究方向。最近邻检索算法作为检索算法中的基础算法,在图像检索,图像快速匹配等领域有广泛的应用前景,因此也是人们热衷的研究方向。
图像快速检索算法主要是通过提取图像特征向量,然后在一定的距离准则(欧式距离、马氏距离等)下进行特征最近邻检索,找出与之最近的特征向量作为其对应的最相似图像。目前常用的矢量特征有SIFT、BOW、CNN特征等,常用的检索方法有K-Dtree、LSH、PQ等。
矢量特征:目前比较经典的矢量特征主要有SIFT(Scale Invariant Feature Transform)特征、BOW(Bag Of Words)特征等。
1)SIFT特征是由Lowe于2004年首次提出的一种矢量特征提取算法(参见文献【1】Lowe D M..Distinctive image features from scale-invariant keypoints[J].International Journal ofComputer Vision,2004,60(2):91-110)。该特征具有比HOG特征性能更为优越的鲁棒性,对视频图像因外界光照、尺度、位移等产生的变化都具有良好的容忍性。然而该特征计算量复杂,维度较高,如何降低其维度,实现实时性较好的特征有效提取还是一个悬而未决的难题。
2)BOW特征是信息检索领域常用的文档表示方式。在图像处理中,每幅图像描述为一个局部区域/关键点(Patches/Key Points)特征的无序集合。使用某种聚类算法(如K-means)将局部特征进行聚类,每个聚类中心被看作是词典中的一个视觉词汇(Visual Word),相当于文本检索中的词,视觉词汇由聚类中心对应特征形成的码字(code word)来表示(可看当为一种特征量化过程)。所有视觉词汇形成一个视觉词典(Visual Vocabulary),对应一个码书(codebook),即码字的集合,词典中所含词的个数反映了词典的大小。图像中的每个特征都将被映射到视觉词典的某个词上,这种映射可以通过计算特征间的距离去实现,然后统计每个视觉词的出现与否或次数,图像可描述为一个维数相同的直方图向量,即BOW特征。此特征在图像检索领域有着广泛的应用。
3)CNN特征是基于CNN网络的矢量特征,本发明中使用该特征使用GoogLeNet网络架构(【2】Szegedy C,Liu W,Jia Y,et al.Going deeper with convolutions[C]//Proceedingsof the IEEE Conference on Computer Vision and Pattern Recognition.2015:1-9.),其主要通过Inception结构实现了在不大幅度增加计算量的情况下,让网络走向更深层次,而其在ILSVRC2014的结果,也证实了该网络架构的优越性。
矢量数据检索方法:目前使用广泛的检索方法有K-D tree、LSH((Locality-SensitiveHashing)、PQ(Product Quantization)等。
4)KD-TREE算法【4,5】(参见文献【4】Friedman J H,Bentley J L,Finkel R A.Analgorithm for finding best matches in logarithmic expected time[J].ACM Transactions onMathematical Software(TOMS),1977,3(3):209-226和【5】Moore A W.An intoductory tutorialon kd-trees[J].1991)思想在于将数据分割到k维数据空间,并结合二叉检索等数据结构检索算法进行检索,这样建立一个索引树相对线性扫描可以节省很多时间,而且在检索精度上有很好的保证,但是当特征数据的维度过高,如Gist特征(参见文献【3】Oliva A,Torralba A.Building the gist of a scene:The role of global image features in recognition[J].Progress in brainresearch,2006,155:23-36.),BOW特征时,算法的效率急剧下降。
5)LSH算法(参见文献【6】Datar M,Immorlica N,Indyk P,et al.Locality-sensitivehashing scheme based on p-stable distributions[C]//Proceedings of the twentieth annualsymposium on Computational geometry.ACM,2004:253-262)是使用一些哈希函数,确保距离相互比较近的点比距离比较远的点冲突的概率大,当要查询的时候,只需要查询与查询点冲突的点,从而减少了距离计算,加快查询时间。
6)PQ算法(参见文献【7】Jegou H,Douze M,Schmid C.Product quantization for nearestneighbor search[J].Pattern Analysis and Machine Intelligence,IEEE Transactions on,2011,33(1):117-128.)利用样本数据进行量化器训练并利用量化器对原向量进行压缩表示。在进行ANN检索时,通过计算query向量与待量化后的检索向量距离来近似query向量与量化前的待检索向量的距离,其距离计算方法使用查表方法,减少了计算时间,此算法在1B SIFT特征数据上的实验结果非常好(参见文献【8】Jégou H,Tavenard R,Douze M,et al.Searchingin one billion vectors:re-rank with source coding[C]//Acoustics,Speech and Signal Processing(ICASSP),2011IEEE International Conference on.IEEE,2011:861-864)。
发明内容
本发明的目的在于:克服上述现有技术的缺陷,提供一种基于CNN的快速图像检索方法,在服务器平台上,利用CNN网络对图像进行特征提取并利用改进的搜索算法,对查询向量快速的给出与其K近邻的结果。本发明选择基于GOOGLENET网络的CNN特征,这是深度学习兴起后在图像领域的一个突破,它具有鲁棒性较好的特点。提取CNN特征后,本发明基于PQ的检索思想,并加入文本检索中的倒排策略,在应用中考虑自身的数据量,合理安排系统参数,并在检索结果重排序方面进行改进,加入快速排序策略,缩短了检测时间,提高了检测效率。
本发明的技术方案分两个阶段,第一阶段是利用CNN网络对要检索的图像进行特征提取,得到代表图像的矢量特征。第二阶段是在特征数据库中对此矢量特征进行k近邻检索。
具体步骤如下:
1)对图像进行特征提取
我们利用GoogLeNet网络架构,主要通过Inception结构实现了在不大幅度增加计算量的情况下,让网络走向更深层次,而其在ILSVRC 2014的结果,也证实了该网络架构的优越性,其细节如下所示:
e)训练前统一图像尺寸。我们采用Center-crop的方法将尺寸统一到256*256,即先将按照最小边缩放到256的比例系数进行整体缩放,然后对长边以中心为基准向两边分别做等长裁剪,保留256长度,这样基本可以保证图片不变形的同时突出图像的主体。
f)保证训练模型的鲁棒性方法。对训练集通过镜像变换进行扩充并在每次训练中从256*256的图像中随机选取224*224大小的图像块进行训练。
g)损失函数以及优化方法。损失函数选用Softmax损失函数,通过Mini-batch梯度下降法进行参数寻优以最小化损失函数。其中学习率每40,000次降低为原来的1/10,最终经过120,000次迭代终止。
h)模型应用。在模型应用上,我们对每张图片的预测,我们先将其统一成指定尺寸256*256,然后通过选取其左上、右上、左下、右下、正中以及其各自的镜面变换图进行预测,平均其预测结果,作为最终的预测类别。
2)在数据库中检索其K近邻的向量
检索过程分为两个部分,首先是将数据库中的特征进行量化并做成倒排索引结构。给定一个待查询的向量时,从此结构体中找出其K近邻的向量。
c)利用样本数据训练
利用数据库中的部分数据,进行量化器的训练。先对N维样本数据进行聚类,生成M个聚类中心。对每个特征向量在M个聚类中心定位到与之距离最近的聚类中心,上述操作完成后,此数据库即形成倒排索引结构。再将N维特征向量分成H段,对样本数据中的每一段进行聚类,生成L个聚类中心,共生成H*L个聚类中心。对数据库中的每一个特征向量,将其分成H段,每一段的子特征向量在其对于的L个聚类中心中进行量化,将数据量化成N/H维。这样减小了存储容量。将特征向量依次进行上述操作。再将量化后的数据挂载到倒排索引结构中,完成样本数据的训练和量化工作。
d)检索其K近邻的向量
对于待检索特征向量q,为了减小计算量,首先在训练过程中生成的M个聚类中心计算出W近邻的向量。实际检索过程中仅计算此W个聚类中心下挂载的向量集合R。对于欧氏距离准则,首先计算出q与其中一个聚类中心在每H维的欧氏距离,再利用查表的方法快速的计算出q与R中向量的近似距离。
本发明优点和积极效果为:
(1)由于采用CNN网络进行特征提取,这样的特征向量的鲁棒性较好,且数据量较小,易于计算,具有较好的实验效果。
(2)在K近邻检索时,利用量化思想在保证精度的条件下提高了检索速度,做到了又快又准。
附图说明
图1为不等式关系图;
图2为本发明一种基于CNN的快速图像检索方法流程图。
具体实施方式
本发明通过利用CNN网络和量化检索方法,实现了相似图像的快速搜索。
1.利用CNN网络提取图像特征向量
本发明用GoogleNet网络架构来提取表征图像的4096维特征向量。在初始化阶段,首先对整个100K图片库进行特征提取操作,生成100K个4096维的特征向量。当进行相似图像检索时,对待检索图像进行特征提取操作,生成带检索特征q。
2.量化特征向量并构建倒排结构
得到100K的特征向量后,随机选取10K作为样本数据进行量化系统的训练并将得到的量化器对整个100K的特征向量进行量化。并利用聚类方法构建倒排结构。
2.1数据预处理
对于10K样本数据T,对其进行聚类操作,得到M个聚类中心Κ={κι;ι∈M},将10K数据终端每个向量分配到此M个聚类中心下,即对每个向量v,计算与其欧式距离最近的聚类中心kι并分配到此聚类中心下。
为了减小数据误差,使样本数据的协方差为0,上述分配到各个聚类中心下的向量均与其对应的聚类中心作差,称为“残差向量”,即v,=v-q(v),q(v)为向量v所属的聚类中心。
2.2训练量化器
数据预处理完成后,将样本数据中的4096维向量按维度分为H段,每段的维度即为t=4096/H维。对每一段的子向量进行聚类操作,计算出L个聚类中心,共会产生H*L个聚类中心。每个子维度上的聚类中心集合即为后续整个数据库的量化器。
2.3建立倒排索引结构
对于整个数据库中的特征向量,利用最初得到的聚类中心集合K,将数据库中的特征向量均分配到此M个聚类中心下,并计算“残差向量”。至此形成类似字典检索的倒排索引结构。
2.4量化数据库中的特征向量
对于数据库中的每个特征向量,在每t维度上均寻找上述对应维度上M个聚类中心集合中的最近邻向量并记录其索引号ι,以此类推,完成此过程后原特征向量降为H维,以此达到降低维度存储,减小存储空间的目的。
3.近似最近邻检索
3.1遍历部分向量并确定距离阈值
给定一个待查询向量y,首先在聚类中心集合K中计算y与每个κι的距离d(y,κι),然后按距离远近的准则找出w个最近邻的聚类中心,对于向量y而言,仅需要遍历分配到此w个聚类中心下的向量即可找出其最近邻的特征向量。
在计算向量y与数据库R中特征向量x∈R距离时,我们利用向量y与量化后向量q(x)的欧氏距离d(y,q(x))=||y-q(x)||来近似y与x的欧式距离d(y,x)=||y-x||。有三角形不等式原理,如下图1所示,我们有如下不等式:
d(x,y)<d(x,q(x))+d(x,q(x))
我们设定阈值TH=d(x,q(x))+d(x,q(x)),随着遍历向量的增加,TH逐渐迭代到最小值,并以此为依据,当x与w中某些聚类中心的距离远大于TH时,依据数据的簇状分布,我们认定此聚类中心的向量均与待查询向量y相距较远,因此舍弃这部分。这样进一步的减少了遍历范围,在保证准确率的情况下提高了运算速度。其流程如下图2所示。
3.2计算近似距离
在计算d(y,q(x))时,首先计算待检索向量y与q(x)在每H维的距离之和,由上节可知每H维度上的聚类中心集合整个聚类中心的集合∑Κh,h∈Η。计算结束后会形成一个Η*Μ的矩阵T,矩阵中元素Tij代表在第j个聚类中心的第i个H段的子向量与相对应维度上的子向量欧式距离之和。
对于分配到此聚类中心下量化后的向量,仅需要在矩阵T中进行查表操作并求和即可得到近似距离d(y,q(x))。这样将计算距离的乘方操作转换为查表的加法操作,极大的减少了计算量,提升了计算速度。
3.3计算结果重排序
对上面所得到的结果利用“分治法”先选择出前k个最小值,再将此k个值进行快速排序,则得到重排序后的结果,由以上的向量序列找出其相对应的图像ID,最终完成了相似图像检索的过程。
Claims (1)
1.一种基于CNN(卷积神经网络)的快速图像检索方法,其特征在于:该方法包括:
步骤一、利用CNN网络对要检索的图像进行特征提取,得到代表图像的矢量特征;利用GoogLeNet网络架构,通过Inception结构实现了在不大幅度增加计算量的情况下,让网络走向更深层次,具体步骤如下:
a)训练前统一图像尺寸:采用Center-crop的方法将尺寸统一到256*256,即先将按照最小边缩放到256的比例系数进行整体缩放,然后对长边以中心为基准向两边分别做等长裁剪,保留256长度,这样基本可以保证图片不变形的同时突出图像的主体;
b)保证训练模型的鲁棒性:对训练集通过镜像变换进行扩充并在每次训练中从256*256的图像中随机选取224*224大小的图像块进行训练;
c)损失函数以及优化:损失函数选用Softmax损失函数,通过Mini-batch梯度下降法进行参数寻优以最小化损失函数;
d)模型应用:在模型应用上,对每张图片的预测,先将其统一成指定尺寸256*256,然后通过选取其左上、右上、左下、右下、正中以及其各自的镜面变换图进行预测,平均其预测结果,作为最终的预测类别;
步骤二、在特征数据库中对此矢量特征进行k近邻检索;其中检索过程分为两个部分,首先是将数据库中的特征进行量化并做成倒排索引结构;然后给定一个待查询的向量时,从此结构体中找出其K近邻的向量,具体步骤如下:
a)利用样本数据训练
利用数据库中的部分数据,进行量化器的训练,先对N维样本数据进行聚类,生成M个聚类中心,对每个特征向量在M个聚类中心定位到与之距离最近的聚类中心,上述操作完成后,此数据库即形成倒排索引结构,再将N维特征向量分成H段,对样本数据中的每一段进行聚类,生成L个聚类中心,共生成H*L个聚类中心,对数据库中的每一个特征向量,将其分成H段,每一段的子特征向量在其对于的L个聚类中心中进行量化,将数据量化成N/H维,这样减小了存储容量,将特征向量依次进行上述操作,再将量化后的数据挂载到倒排索引结构中,完成样本数据的训练和量化工作;
b)检索其K近邻的向量
对于待检索特征向量q,为了减小计算量,首先在训练过程中生成的M个聚类中心计算出W近邻的向量,实际检索过程中仅计算此W个聚类中心下挂载的向量集合R,对于欧氏距离准则,首先计算出q与其中一个聚类中心在每H维的欧氏距离,再利用查表的方法快速的计算出q与R中向量的近似距离。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610211503.2A CN105912611B (zh) | 2016-04-05 | 2016-04-05 | 一种基于cnn的快速图像检索方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610211503.2A CN105912611B (zh) | 2016-04-05 | 2016-04-05 | 一种基于cnn的快速图像检索方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105912611A true CN105912611A (zh) | 2016-08-31 |
CN105912611B CN105912611B (zh) | 2019-04-26 |
Family
ID=56744673
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610211503.2A Active CN105912611B (zh) | 2016-04-05 | 2016-04-05 | 一种基于cnn的快速图像检索方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105912611B (zh) |
Cited By (34)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106383912A (zh) * | 2016-10-14 | 2017-02-08 | 上海谦问万答吧云计算科技有限公司 | 一种图片检索方法和装置 |
CN106503669A (zh) * | 2016-11-02 | 2017-03-15 | 重庆中科云丛科技有限公司 | 一种基于多任务深度学习网络的训练、识别方法及系统 |
CN106570516A (zh) * | 2016-09-06 | 2017-04-19 | 国网重庆市电力公司电力科学研究院 | 一种利用卷积神经网络cnn的障碍物识别方法 |
CN106650725A (zh) * | 2016-11-29 | 2017-05-10 | 华南理工大学 | 基于全卷积神经网络的候选文本框生成和文本检测方法 |
CN106682233A (zh) * | 2017-01-16 | 2017-05-17 | 华侨大学 | 一种基于深度学习与局部特征融合的哈希图像检索方法 |
CN106778918A (zh) * | 2017-01-22 | 2017-05-31 | 北京飞搜科技有限公司 | 一种应用于手机端的深度学习图像识别系统及实现方法 |
CN106777038A (zh) * | 2016-12-09 | 2017-05-31 | 厦门大学 | 一种基于序列保留哈希的超低复杂度图像检索方法 |
CN106874489A (zh) * | 2017-02-21 | 2017-06-20 | 烟台中科网络技术研究所 | 一种基于卷积神经网络的肺结节图像块检索方法及装置 |
CN106951873A (zh) * | 2017-03-24 | 2017-07-14 | 河海大学 | 一种遥感图像目标识别方法 |
CN106980866A (zh) * | 2016-10-24 | 2017-07-25 | 商汤集团有限公司 | 一种鞋类检索方法 |
CN107220277A (zh) * | 2017-04-14 | 2017-09-29 | 西北大学 | 基于手绘草图的图像检索算法 |
CN107423752A (zh) * | 2017-06-12 | 2017-12-01 | 网易(杭州)网络有限公司 | 图片的大小超标检测方法及装置、检测服务器 |
CN107423306A (zh) * | 2016-05-24 | 2017-12-01 | 华为技术有限公司 | 一种图像检索方法及装置 |
CN107871105A (zh) * | 2016-09-26 | 2018-04-03 | 北京眼神科技有限公司 | 一种人脸认证方法和装置 |
CN108073934A (zh) * | 2016-11-17 | 2018-05-25 | 北京京东尚科信息技术有限公司 | 近重复图像检测方法与装置 |
CN108154120A (zh) * | 2017-12-25 | 2018-06-12 | 上海七牛信息技术有限公司 | 视频分类模型训练方法、装置、存储介质及电子设备 |
CN108629345A (zh) * | 2017-03-17 | 2018-10-09 | 北京京东尚科信息技术有限公司 | 高维图像特征匹配方法和装置 |
CN108764286A (zh) * | 2018-04-24 | 2018-11-06 | 电子科技大学 | 一种基于迁移学习的血管图像中特征点的分类识别方法 |
CN110046631A (zh) * | 2018-01-15 | 2019-07-23 | 塔塔咨询服务有限公司 | 用于自动推断时空图像的变化的系统和方法 |
CN110275970A (zh) * | 2019-06-21 | 2019-09-24 | 北京达佳互联信息技术有限公司 | 图像检索的方法、装置、服务器及存储介质 |
CN110276320A (zh) * | 2019-06-26 | 2019-09-24 | 杭州创匠信息科技有限公司 | 基于人脸识别的门禁方法、装置、设备和存储介质 |
CN110458107A (zh) * | 2019-08-13 | 2019-11-15 | 北京百度网讯科技有限公司 | 用于图像识别的方法和装置 |
CN110609916A (zh) * | 2019-09-25 | 2019-12-24 | 四川东方网力科技有限公司 | 视频图像数据检索方法、装置、设备和存储介质 |
CN110647632A (zh) * | 2019-08-06 | 2020-01-03 | 上海孚典智能科技有限公司 | 基于机器学习的图像与文本映射技术 |
CN110674334A (zh) * | 2019-09-16 | 2020-01-10 | 南京信息工程大学 | 基于一致性区域深度学习特征的近重复图像检索方法 |
CN111291276A (zh) * | 2020-01-13 | 2020-06-16 | 武汉大学 | 一种基于局部方向中心性度量的聚类方法 |
CN112507149A (zh) * | 2020-11-13 | 2021-03-16 | 厦门大学 | 一种动态k近邻图的构建方法及基于动态k近邻图的快速图像检索方法 |
CN112615974A (zh) * | 2020-12-14 | 2021-04-06 | 中国科学院信息工程研究所 | 一种基于深度判别器的无载体隐蔽通信方法及系统 |
US11003895B2 (en) | 2017-06-30 | 2021-05-11 | Beijing Didi Infinity Technology And Development Co., Ltd. | Systems and methods for verifying authenticity of ID photo |
CN112884005A (zh) * | 2021-01-21 | 2021-06-01 | 汉唐信通(北京)科技有限公司 | 一种基于sptag及卷积神经网的图像检索方法及装置 |
CN114140657A (zh) * | 2021-08-30 | 2022-03-04 | 浙江理工大学 | 一种基于多特征融合的图像检索方法 |
WO2022063150A1 (zh) * | 2020-09-27 | 2022-03-31 | 阿里云计算有限公司 | 数据存储方法及装置、数据查询方法及装置 |
US11487808B2 (en) | 2020-02-17 | 2022-11-01 | Wipro Limited | Method and system for performing an optimized image search |
CN115878824A (zh) * | 2020-07-07 | 2023-03-31 | 华为技术有限公司 | 图像检索系统、方法和装置 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101211355A (zh) * | 2006-12-30 | 2008-07-02 | 中国科学院计算技术研究所 | 一种基于聚类的图像查询方法 |
WO2010101186A1 (ja) * | 2009-03-04 | 2010-09-10 | 公立大学法人大阪府立大学 | 画像検索方法、画像検索プログラム及び画像登録方法 |
CN101859326A (zh) * | 2010-06-09 | 2010-10-13 | 南京大学 | 一种图像检索方法 |
CN102508901A (zh) * | 2011-11-07 | 2012-06-20 | 康佳集团股份有限公司 | 基于内容的海量图像检索方法和系统 |
CN103605765A (zh) * | 2013-11-26 | 2014-02-26 | 电子科技大学 | 一种基于聚类紧凑特征的海量图像检索系统 |
CN104036012A (zh) * | 2014-06-24 | 2014-09-10 | 中国科学院计算技术研究所 | 字典学习、视觉词袋特征提取方法及检索系统 |
CN104199922A (zh) * | 2014-09-01 | 2014-12-10 | 中国科学院自动化研究所 | 一种基于局部相似哈希算法的大规模图像库检索方法 |
US20150161178A1 (en) * | 2009-12-07 | 2015-06-11 | Google Inc. | Distributed Image Search |
CN104765764A (zh) * | 2015-02-06 | 2015-07-08 | 南京理工大学 | 一种基于大规模图像检索方法 |
CN105022752A (zh) * | 2014-04-29 | 2015-11-04 | 中国电信股份有限公司 | 图像检索方法与装置 |
-
2016
- 2016-04-05 CN CN201610211503.2A patent/CN105912611B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101211355A (zh) * | 2006-12-30 | 2008-07-02 | 中国科学院计算技术研究所 | 一种基于聚类的图像查询方法 |
WO2010101186A1 (ja) * | 2009-03-04 | 2010-09-10 | 公立大学法人大阪府立大学 | 画像検索方法、画像検索プログラム及び画像登録方法 |
US20150161178A1 (en) * | 2009-12-07 | 2015-06-11 | Google Inc. | Distributed Image Search |
CN101859326A (zh) * | 2010-06-09 | 2010-10-13 | 南京大学 | 一种图像检索方法 |
CN102508901A (zh) * | 2011-11-07 | 2012-06-20 | 康佳集团股份有限公司 | 基于内容的海量图像检索方法和系统 |
CN103605765A (zh) * | 2013-11-26 | 2014-02-26 | 电子科技大学 | 一种基于聚类紧凑特征的海量图像检索系统 |
CN105022752A (zh) * | 2014-04-29 | 2015-11-04 | 中国电信股份有限公司 | 图像检索方法与装置 |
CN104036012A (zh) * | 2014-06-24 | 2014-09-10 | 中国科学院计算技术研究所 | 字典学习、视觉词袋特征提取方法及检索系统 |
CN104199922A (zh) * | 2014-09-01 | 2014-12-10 | 中国科学院自动化研究所 | 一种基于局部相似哈希算法的大规模图像库检索方法 |
CN104765764A (zh) * | 2015-02-06 | 2015-07-08 | 南京理工大学 | 一种基于大规模图像检索方法 |
Non-Patent Citations (1)
Title |
---|
薛菲菲 等: "《基于CNN的彩色图像边缘提取方法》", 《天津师范大学学报(自然科学版)》 * |
Cited By (51)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107423306A (zh) * | 2016-05-24 | 2017-12-01 | 华为技术有限公司 | 一种图像检索方法及装置 |
CN107423306B (zh) * | 2016-05-24 | 2021-01-29 | 华为技术有限公司 | 一种图像检索方法及装置 |
CN106570516A (zh) * | 2016-09-06 | 2017-04-19 | 国网重庆市电力公司电力科学研究院 | 一种利用卷积神经网络cnn的障碍物识别方法 |
CN107871105A (zh) * | 2016-09-26 | 2018-04-03 | 北京眼神科技有限公司 | 一种人脸认证方法和装置 |
CN106383912A (zh) * | 2016-10-14 | 2017-02-08 | 上海谦问万答吧云计算科技有限公司 | 一种图片检索方法和装置 |
CN106383912B (zh) * | 2016-10-14 | 2019-09-03 | 北京字节跳动网络技术有限公司 | 一种图片检索方法和装置 |
CN106980866A (zh) * | 2016-10-24 | 2017-07-25 | 商汤集团有限公司 | 一种鞋类检索方法 |
CN106503669A (zh) * | 2016-11-02 | 2017-03-15 | 重庆中科云丛科技有限公司 | 一种基于多任务深度学习网络的训练、识别方法及系统 |
CN106503669B (zh) * | 2016-11-02 | 2019-12-10 | 重庆中科云丛科技有限公司 | 一种基于多任务深度学习网络的训练、识别方法及系统 |
CN108073934A (zh) * | 2016-11-17 | 2018-05-25 | 北京京东尚科信息技术有限公司 | 近重复图像检测方法与装置 |
CN106650725A (zh) * | 2016-11-29 | 2017-05-10 | 华南理工大学 | 基于全卷积神经网络的候选文本框生成和文本检测方法 |
CN106650725B (zh) * | 2016-11-29 | 2020-06-26 | 华南理工大学 | 基于全卷积神经网络的候选文本框生成和文本检测方法 |
CN106777038B (zh) * | 2016-12-09 | 2019-06-14 | 厦门大学 | 一种基于序列保留哈希的超低复杂度图像检索方法 |
CN106777038A (zh) * | 2016-12-09 | 2017-05-31 | 厦门大学 | 一种基于序列保留哈希的超低复杂度图像检索方法 |
CN106682233A (zh) * | 2017-01-16 | 2017-05-17 | 华侨大学 | 一种基于深度学习与局部特征融合的哈希图像检索方法 |
CN106682233B (zh) * | 2017-01-16 | 2020-03-10 | 华侨大学 | 一种基于深度学习与局部特征融合的哈希图像检索方法 |
CN106778918A (zh) * | 2017-01-22 | 2017-05-31 | 北京飞搜科技有限公司 | 一种应用于手机端的深度学习图像识别系统及实现方法 |
CN106778918B (zh) * | 2017-01-22 | 2020-10-30 | 苏州飞搜科技有限公司 | 一种应用于手机端的深度学习图像识别系统及实现方法 |
CN106874489B (zh) * | 2017-02-21 | 2020-05-12 | 烟台中科网络技术研究所 | 一种基于卷积神经网络的肺结节图像块检索方法及装置 |
CN106874489A (zh) * | 2017-02-21 | 2017-06-20 | 烟台中科网络技术研究所 | 一种基于卷积神经网络的肺结节图像块检索方法及装置 |
CN108629345A (zh) * | 2017-03-17 | 2018-10-09 | 北京京东尚科信息技术有限公司 | 高维图像特征匹配方法和装置 |
US11210555B2 (en) | 2017-03-17 | 2021-12-28 | Beijing Jingdong Shangke Information Technology Co., Ltd. | High-dimensional image feature matching method and device |
CN106951873A (zh) * | 2017-03-24 | 2017-07-14 | 河海大学 | 一种遥感图像目标识别方法 |
CN106951873B (zh) * | 2017-03-24 | 2020-07-14 | 河海大学 | 一种遥感图像目标识别方法 |
CN107220277A (zh) * | 2017-04-14 | 2017-09-29 | 西北大学 | 基于手绘草图的图像检索算法 |
CN107423752A (zh) * | 2017-06-12 | 2017-12-01 | 网易(杭州)网络有限公司 | 图片的大小超标检测方法及装置、检测服务器 |
US11003895B2 (en) | 2017-06-30 | 2021-05-11 | Beijing Didi Infinity Technology And Development Co., Ltd. | Systems and methods for verifying authenticity of ID photo |
CN108154120A (zh) * | 2017-12-25 | 2018-06-12 | 上海七牛信息技术有限公司 | 视频分类模型训练方法、装置、存储介质及电子设备 |
CN110046631A (zh) * | 2018-01-15 | 2019-07-23 | 塔塔咨询服务有限公司 | 用于自动推断时空图像的变化的系统和方法 |
CN110046631B (zh) * | 2018-01-15 | 2023-04-28 | 塔塔咨询服务有限公司 | 用于自动推断时空图像的变化的系统和方法 |
CN108764286B (zh) * | 2018-04-24 | 2022-04-19 | 电子科技大学 | 一种基于迁移学习的血管图像中特征点的分类识别方法 |
CN108764286A (zh) * | 2018-04-24 | 2018-11-06 | 电子科技大学 | 一种基于迁移学习的血管图像中特征点的分类识别方法 |
CN110275970B (zh) * | 2019-06-21 | 2022-05-06 | 北京达佳互联信息技术有限公司 | 图像检索的方法、装置、服务器及存储介质 |
CN110275970A (zh) * | 2019-06-21 | 2019-09-24 | 北京达佳互联信息技术有限公司 | 图像检索的方法、装置、服务器及存储介质 |
CN110276320A (zh) * | 2019-06-26 | 2019-09-24 | 杭州创匠信息科技有限公司 | 基于人脸识别的门禁方法、装置、设备和存储介质 |
CN110647632A (zh) * | 2019-08-06 | 2020-01-03 | 上海孚典智能科技有限公司 | 基于机器学习的图像与文本映射技术 |
CN110647632B (zh) * | 2019-08-06 | 2020-09-04 | 上海孚典智能科技有限公司 | 基于机器学习的图像与文本映射技术 |
CN110458107A (zh) * | 2019-08-13 | 2019-11-15 | 北京百度网讯科技有限公司 | 用于图像识别的方法和装置 |
CN110674334A (zh) * | 2019-09-16 | 2020-01-10 | 南京信息工程大学 | 基于一致性区域深度学习特征的近重复图像检索方法 |
CN110609916A (zh) * | 2019-09-25 | 2019-12-24 | 四川东方网力科技有限公司 | 视频图像数据检索方法、装置、设备和存储介质 |
CN111291276A (zh) * | 2020-01-13 | 2020-06-16 | 武汉大学 | 一种基于局部方向中心性度量的聚类方法 |
CN111291276B (zh) * | 2020-01-13 | 2023-05-19 | 武汉大学 | 一种基于局部方向中心性度量的聚类方法 |
US11487808B2 (en) | 2020-02-17 | 2022-11-01 | Wipro Limited | Method and system for performing an optimized image search |
CN115878824A (zh) * | 2020-07-07 | 2023-03-31 | 华为技术有限公司 | 图像检索系统、方法和装置 |
CN115878824B (zh) * | 2020-07-07 | 2023-10-20 | 华为技术有限公司 | 图像检索系统、方法和装置 |
WO2022063150A1 (zh) * | 2020-09-27 | 2022-03-31 | 阿里云计算有限公司 | 数据存储方法及装置、数据查询方法及装置 |
CN112507149A (zh) * | 2020-11-13 | 2021-03-16 | 厦门大学 | 一种动态k近邻图的构建方法及基于动态k近邻图的快速图像检索方法 |
CN112615974A (zh) * | 2020-12-14 | 2021-04-06 | 中国科学院信息工程研究所 | 一种基于深度判别器的无载体隐蔽通信方法及系统 |
CN112884005A (zh) * | 2021-01-21 | 2021-06-01 | 汉唐信通(北京)科技有限公司 | 一种基于sptag及卷积神经网的图像检索方法及装置 |
CN114140657A (zh) * | 2021-08-30 | 2022-03-04 | 浙江理工大学 | 一种基于多特征融合的图像检索方法 |
CN114140657B (zh) * | 2021-08-30 | 2024-09-10 | 浙江理工大学 | 一种基于多特征融合的图像检索方法 |
Also Published As
Publication number | Publication date |
---|---|
CN105912611B (zh) | 2019-04-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105912611B (zh) | 一种基于cnn的快速图像检索方法 | |
CN107229757B (zh) | 基于深度学习和哈希编码的视频检索方法 | |
CN103902704B (zh) | 面向大规模图像视觉特征的多维倒排索引与快速检索算法 | |
WO2013129580A1 (ja) | 近似最近傍探索装置、近似最近傍探索方法およびそのプログラム | |
CN111368133B (zh) | 一种视频库的索引表建立方法、装置、服务器及存储介质 | |
CN107577990A (zh) | 一种基于gpu加速检索的大规模人脸识别方法 | |
Rafailidis et al. | A unified framework for multimodal retrieval | |
CN112368697A (zh) | 经由对偶分解评估损失函数或损失函数的梯度的系统和方法 | |
EP2291765A2 (en) | Statistical approach to large-scale image annotation | |
CN102799614B (zh) | 基于视觉词语空间共生性的图像检索方法 | |
Weyand et al. | Visual landmark recognition from internet photo collections: A large-scale evaluation | |
Wang et al. | Fast neighborhood graph search using cartesian concatenation | |
CN114358188A (zh) | 特征提取模型处理、样本检索方法、装置和计算机设备 | |
CN114329029B (zh) | 对象检索方法、装置、设备及计算机存储介质 | |
CN114461839A (zh) | 基于多模态预训练的相似图片检索方法、装置及电子设备 | |
CN111597371A (zh) | 外观专利的多模态图像检索方法及系统 | |
CN111444390A (zh) | 一种基于Spark和深度哈希的视频并行检索方法 | |
CN116703531A (zh) | 物品数据处理方法、装置、计算机设备和存储介质 | |
US20150254280A1 (en) | Hybrid Indexing with Grouplets | |
CN105183845A (zh) | 一种结合语义特征的ervq图片索引与检索方法 | |
Ejaz et al. | Video summarization using a network of radial basis functions | |
CN112860936A (zh) | 一种基于稀疏图相似度迁移的视觉行人重识别方法 | |
CN117435685A (zh) | 文档检索方法、装置、计算机设备、存储介质和产品 | |
Wu et al. | Codebook-free compact descriptor for scalable visual search | |
WO2023116816A1 (zh) | 蛋白质序列比对方法、装置、服务器以及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20220530 Address after: 230093 room 1701, block C, building 1, zone J, phase II, Hefei Innovation Industrial Park, No. 2800, innovation Avenue, high tech Zone, Hefei, Anhui Patentee after: SNEGRID ELECTRIC TECHNOLOGY Co.,Ltd. Address before: 230026 Jinzhai Road, Baohe District, Hefei, Anhui Province, No. 96 Patentee before: University of Science and Technology of China |