CN111522986B - 图像检索方法、装置、设备和介质 - Google Patents
图像检索方法、装置、设备和介质 Download PDFInfo
- Publication number
- CN111522986B CN111522986B CN202010327963.8A CN202010327963A CN111522986B CN 111522986 B CN111522986 B CN 111522986B CN 202010327963 A CN202010327963 A CN 202010327963A CN 111522986 B CN111522986 B CN 111522986B
- Authority
- CN
- China
- Prior art keywords
- image
- feature
- retrieved
- images
- determining
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 65
- 238000003062 neural network model Methods 0.000 claims abstract description 33
- 238000012795 verification Methods 0.000 claims abstract description 19
- 230000015654 memory Effects 0.000 claims description 19
- 238000012545 processing Methods 0.000 claims description 19
- 239000011159 matrix material Substances 0.000 claims description 18
- 230000009466 transformation Effects 0.000 claims description 17
- 238000000605 extraction Methods 0.000 claims description 15
- 239000013598 vector Substances 0.000 claims description 9
- 238000004364 calculation method Methods 0.000 claims description 6
- 230000006835 compression Effects 0.000 claims description 6
- 238000007906 compression Methods 0.000 claims description 6
- 238000005516 engineering process Methods 0.000 abstract description 3
- 230000008569 process Effects 0.000 description 12
- 230000006870 function Effects 0.000 description 10
- 238000012549 training Methods 0.000 description 8
- 238000013527 convolutional neural network Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000004590 computer program Methods 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000007667 floating Methods 0.000 description 2
- 239000011521 glass Substances 0.000 description 2
- 238000005286 illumination Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/231—Hierarchical techniques, i.e. dividing or merging pattern sets so as to obtain a dendrogram
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
- G06V10/443—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
- G06V10/449—Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters
- G06V10/451—Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters with interaction between the filter responses, e.g. cortical complex cells
- G06V10/454—Integrating the filters into a hierarchical structure, e.g. convolutional neural networks [CNN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/75—Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
- G06V10/751—Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/762—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using clustering, e.g. of similar faces in social networks
- G06V10/7625—Hierarchical techniques, i.e. dividing or merging patterns to obtain a tree-like representation; Dendograms
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/24—Character recognition characterised by the processing or recognition method
- G06V30/248—Character recognition characterised by the processing or recognition method involving plural approaches, e.g. verification by template match; Resolving confusion among similar patterns, e.g. "O" versus "Q"
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Multimedia (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Medical Informatics (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Library & Information Science (AREA)
- Mathematical Physics (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Biodiversity & Conservation Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
- Processing Or Creating Images (AREA)
Abstract
本申请实施例公开了一种图像检索方法、装置、设备和介质,涉及智能搜索技术。其中,该方法包括:利用预设神经网络模型,提取待检索图像的全局特征和局部特征,以及提取待召回图像的全局特征和局部特征;通过待检索图像和待召回图像之间的全局特征匹配和局部特征匹配,确定候选图像集合;通过对待检索图像和候选图像集合中的候选图像进行局部特征验证,从候选图像集合中确定检索结果。本申请实施例可以提高针对大量数据库图像的情况下图像检索的准确率,同时保证检索效率。
Description
技术领域
本申请实施例涉及计算机技术,具体涉及智能搜索技术,尤其涉及一种图像检索方法、装置、设备和介质。
背景技术
图像检索是指在一定数据量的图像库中,找到和用户请求图像(或称为待检索图像)上的物体完全相同的图像结果,或者找到和用户请求图像完全相同的图像。目前,图像检索比较常见的方案包括:基于图像特征描述子提取图像特征的检索方法,以及利用卷积神经网络模型提取图像的全局特征,用于图像检索的方法。
然而,利用图像特征描述子提取图像特征,通常适用于图像之间的角度和光照变化不是非常大的情况,并且当图像数量较大时,检索效率以及准确率均得不到保证;基于卷积神经网络模型的现有图像检索方法,虽然检索效率比较高,但是检索准确性并不理想。
发明内容
本申请实施例公开一种图像检索方法、装置、设备和介质,以提高针对大量数据库图像的情况下图像检索的准确率,同时保证检索效率。
第一方面,本申请实施例公开了一种图像检索方法,包括:
利用预设神经网络模型,提取待检索图像的全局特征和局部特征,以及提取待召回图像的全局特征和局部特征;
通过所述待检索图像和所述待召回图像之间的全局特征匹配和局部特征匹配,确定候选图像集合;
通过对所述待检索图像和所述候选图像集合中的候选图像进行局部特征验证,从所述候选图像集合中确定检索结果。
第二方面,本申请实施例还公开了一种图像检索装置,包括:
特征提取模块,用于利用预设神经网络模型,提取待检索图像的全局特征和局部特征,以及提取待召回图像的全局特征和局部特征;
特征匹配模块,用于通过所述待检索图像和所述待召回图像之间的全局特征匹配和局部特征匹配,确定候选图像集合;
检索结果确定模块,用于通过对所述待检索图像和所述候选图像集合中的候选图像进行局部特征验证,从所述候选图像集合中确定检索结果。
第三方面,本申请实施例还公开了一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如本申请实施例任一所述的图像检索方法。
第四方面,本申请实施例还公开了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行如本申请实施例任一所述的图像检索方法。
根据本申请实施例的技术方案,通过在图像检索过程中,利用预设神经网络模型同时提取图像的全局特征和局部特征,根据图像全局特征和局部特征得到初步的图像检索结果,然后通过引入图像局部特征校验,得到最终的图像检索结果,解决了现有图像检索的准确率较低的问题,提高了针对大量数据库图像的情况下图像检索的准确率,同时保证了检索效率。
应当理解,本部分所描述的内容并非旨在标识本申请的实施例的关键或重要特征,也不用于限制本申请的范围。本申请的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本申请的限定。其中:
图1是根据本申请实施例公开的一种图像检索方法的流程图;
图2是根据本申请实施例公开的一种图像检索方法的架构示意图;
图3是根据本申请实施例公开的另一种图像检索方法的流程图;
图4是根据本申请实施例公开的又一种图像检索方法的流程图;
图5是根据本申请实施例公开的一种图像检索装置的结构示意图;
图6是根据本申请实施例公开的一种电子设备的框图。
具体实施方式
以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
图1是根据本申请实施例公开的一种图像检索方法的流程图,本申请实施例可以适用于基于用户输入的请求图像进行图像检索或搜索的情况,该方法可以由图像检索装置来执行,该装置可以采用软件和/或硬件实现,并可集成在任意的具有计算能力的电子设备上,例如服务器等。
示例性的,存在相同或相似图像检索需求的场景可以包括但不限于:
1)特定单位或公司的重复图片审核。例如保险公司的不同客户使用相同的图像,通过图像编辑处理替换上不同的车辆,从而达到骗取保险金额的目的,保险公司便存在检索出包含相同车辆的图像的需求。
2)高清原图替换。使用检索系统,检索出数据库中低分辨率图像对应的高清图像,从而利用高清图像替换掉低分辨率图像。
如图1所示,本申请实施例公开的图像检索方法可以包括:
S101、利用预设神经网络模型,提取待检索图像的全局特征和局部特征,以及提取待召回图像的全局特征和局部特征。
其中,预设神经网络模型是预先训练的用于提取图像的全局特征和局部特征的网络模型,具体可以基于卷积神经网络(Convolutional Neural Networks,CNN)实现。关于具有图像特征提取功能的网络模型的具体训练过程,本申请实施例不作限定,可以参照图像处理领域中现有模型训练原理实现。
本申请实施例中利用相同的神经网络模型对待检索图像和待召回图像进行特征处理,待召回图像即指数据库中的图像资源。任意图像的全局特征可以使用一个定长的向量来表示,例如任一张图像对应一个256维度的向量。任意图像的局部特征可以使用预设数量的特征点来表示,例如任一张图像对应600个点以内的特征点,每个点是64bit的描述空间,所以图像的局部特征可以表示为维度为[600,64]的一个矩阵。具体的,局部特征对应图像上存在的特定物体对象,例如,一张包含红酒杯的图像,该图像的局部特征可以用于表征该红酒杯在图像上的位置。
S102、通过待检索图像和待召回图像之间的全局特征匹配和局部特征匹配,确定候选图像集合。
具体的,可以首先通过全局特征匹配,对待召回图像进行初步筛选,然后通过局部特征匹配,对初步筛选的图像集合进一步进行筛选,即精细化对比图像的相似性,从而得到候选图像集合。示例性的,通过待检索图像和待召回图像之间的全局特征匹配和局部特征匹配,确定候选图像集合,可以包括:通过待检索图像和待召回图像之间的全局特征匹配,确定召回图像集合;通过待检索图像和召回图像集合中召回图像之间的局部特征匹配,确定候选图像集合。候选图像集合即相当于本申请实施例中初步确定的图像检索结果。
不同图像之间的全局特征匹配可以通过计算向量之间的距离实现,例如余弦距离计算等,如果两个向量之间距离小于第一距离阈值,则可以认为对应的两张图像之间的全局特征匹配成功,如果两个向量之间距离大于或等于第一距离阈值,则可以认为对应的两张图像之间的全局特征匹配不成功。不同图像的之间的局部特征匹配也可以通过特征点之间的距离计算来实现,例如满足特征距离小于第二距离阈值的特征点对的数量大于或等于数量阈值,则可以认为两张图像之间的局部特征匹配成功,否则,局部特征不匹配。其中,第一距离阈值、第二距离阈值以及数量阈值均可以根据需求进行灵活设置。在图像检索过程中,通过综合考虑图像的全局特征和精细化的局部特征,有助于提高图像检索的准确率。
可选的,在通过待检索图像和待召回图像之间的全局特征匹配,确定召回图像集合之前,本申请实施例公开的方法还可以包括:对待检索图像和待召回图像的全局特征进行压缩处理。例如,现有方案中图像的全局特征通常采用浮点(float)类型进行存储,并用于余弦距离计算中;本申请实施例通过特征压缩处理,将浮点类型的全局特征压缩为字符(char)类型,例如可以把每一个float表达空间,量化压缩到[-127,128]的表达空间,把原本float大小的特征,压缩到每一位特征占有1byte的大小,使得特征存储空间占用大小为原来的1/4,即特征压缩处理后,全局特征的存储空间只需要原来的1/4。尤其在超大规模(千万量级以上)检索系统中,通过图像特征压缩处理,可以减少特征占用的存储空间,减少特征匹配的耗时,有助于提高图像检索的速度,优化检索性能。
S103、通过对待检索图像和候选图像集合中的候选图像进行局部特征验证,从候选图像集合中确定检索结果。
局部特征校验旨在对候选图像集合中的候选图像和待检索图像是否显示相同的物体,或者候选图像和待检索图像是否属于相同图像进行进一步的验证。局部特征校验可以采用区别于图像局部特征匹配时采用的局部特征匹配方式来实现,例如,可以基于待检索图像和待召回图像上特征点之间的几何一致性校验思想来实现。
在现有检索系统中,通常为了确保较高的图像召回率,便选择牺牲检索准确率而忽略局部特征的进一步验证,本申请实施例则是首选考虑图像检索准确性,在确保检索准确率的基础上提升图像检索的召回率。
图2是根据本申请实施例公开的一种图像检索方法的架构示意图,不应理解为对本申请实施例的具体限定。如图2所示,在图像检索之前,需要进行图像的全局特征训练和局部特征训练,得到图像特征提取模型(即前述预设神经网络模型),将数据库图像(即待召回图像)和用户请求图像(即待检索图像)作为输入,经模型处理,得到数据库图像和用户请求图像的全局特征以及局部特征,然后结合图像几何校验,得到与用户请求图像相匹配的检索结果,进而将检索结果反馈给用户。
根据本申请实施例的技术方案,通过在图像检索过程中,利用预设神经网络模型同时提取图像的全局特征和局部特征,相比于利用图像特征描述子提取图像特征,例如规则的SIFT描述子等,利用神经网络模型提取图像全局特征和局部特征,适用的图像类型更加广泛,即使图像在拍摄光照和拍摄角度上存在较大差异,神经网络模型也可以有效地提取出图像特征,为后续实现较高性能的图像检索奠定基础;通过同时考虑图像全局特征和局部特征得到初步的图像检索结果,然后通过引入图像局部特征校验,得到最终的图像检索结果,解决了现有图像检索的准确率较低的问题,提高了针对大量数据库图像的情况下图像检索的准确率,同时保证了检索效率,进而实现了较高的检索性能。
在上述技术方案的基础上,可选的,利用预设神经网络模型,提取待检索图像的全局特征和局部特征,以及提取待召回图像的全局特征和局部特征,包括:
利用残差神经网络模型,分别提取待检索图像和待召回图像的全局特征;
利用残差神经网络模型和注意力(attention)模型,分别提取待检索图像和待召回图像的局部特征。
示例性的,在提取图像全局特征的过程中,可以利用深度残差网络ResNet50_vd模型来实现,在该模型训练过程中,使用的损失(Loss)函数是arcmargin损失函数。相比于现有检索系统中,一般使用Softmax训练模型,使用交差熵损失函数无法拉开特征类间距离,无法缩小类内距离,通过采用arcmargin损失函数,在特征分类之间加入一定的类间距离(margin),可以提高全局卷积神经网络模型的训练精度,进而确保特征提取的准确性。
进一步的,在提取待检索图像和待召回图像的局部特征的过程中,残差神经网络模型的输出层作为注意力模型的输入层。例如,可以在固定resnet50 backbone基础之上,利用conv3层的输入,接上attention层次,从而在特征图(feature map)上达到选择特征点的目的。区别于现有方案中利用图像上框选出的特定兴趣区域提取局部特征,本申请实施例直接基于完整图像对应的特征图选择局部特征点,确保了局部特征提取的准确性、可靠性。
在针对提取图像局部特征的模型训练过程中,本申请实施例采用特征分类信息,指导残差神经网络的特征输出层自动学习每个特征类别的聚焦区域,然后利用注意力模型,自动从残差神经网络的输出层提取响应高的特征点。关于注意力模型的具体实现,可以参考现有注意力模型的实现原理,本申请实施例对此不作赘述。
此外,需要说明的是,待检索图像和待召回图像的全局特征以及局部特征,可以同时提取得到,也可以不同时提取,本申请实施例不作具体限定。例如,可以在通过待检索图像和待召回图像之间的全局特征匹配,确定召回图像集合之后,再提取召回图像集合中的图像和待检索图像的局部特征。
图3是根据本申请实施例公开的另一种图像检索方法的流程图,基于上述技术方案进一步优化与扩展,并可以与上述各个可选实施方式进行结合。如图3所示,该方法可以包括:
S301、利用预设神经网络模型,提取待检索图像的全局特征和局部特征,以及提取待召回图像的全局特征和局部特征。
S302、通过待检索图像和待召回图像之间的全局特征匹配和局部特征匹配,确定候选图像集合。
其中,候选图像集合即相当于本申请实施例中初步确定的图像检索结果。
S303、确定待检索图像的局部特征和候选图像集合中候选图像的局部特征之间的特征匹配点。
示例性的,可以利用任意可用的特征点距离计算公式,计算待检索图像的局部特征点和候选图像集合中候选图像的局部特征点之间的距离,将距离小于第二距离阈值的特征点对确定为待检索图像和待召回图像的特征匹配点。该第二距离阈值的具体取值可以适应性设置。
S304、根据待检索图像和候选图像之间局部特征的相对位置关系,确定待检索图像和候选图像之间的特征变换矩阵。
即可以利用统计思想,根据待检索图像和候选图像之间局部特征的相对位置关系,确定待检索图像和候选图像上大部分局部特征点满足的特征变换矩阵,然后确定满足该特征变换矩阵的匹配特征点的数量。示例性的,可以基于随机抽样一致算法(RandomSample Consensus,RANSAC),利用findHomography函数确定待检索图像和候选图像之间的特征变换矩阵。
S305、根据候选图像的特征匹配点中满足特征变换矩阵的匹配点数量,从候选图像集合中确定检索结果。
候选图像上满足特征变换矩阵的匹配点越多,则该候选图像与待检索图像存在相同物体,或者该候选图像与待检索图像属于相同图像的概率越大。示例性的,在确定各候选图像的特征匹配点中满足特征变换矩阵的匹配点数量之后,按照数量由大到小进行排序,将排序在前的预设数量的候选图像确定为检索结果;或者,将满足特征变换矩阵的匹配点的数量大于数量阈值的候选图像,确定为检索结果。
根据本申请实施例的技术方案,通过在图像检索过程中,利用预设神经网络模型同时提取图像的全局特征和局部特征,相比于利用图像特征描述子提取图像特征,适用的图像类型更加广泛,可以有效地提取出图像特征,为后续实现较高性能的图像检索奠定基础;通过同时考虑图像全局特征和局部特征确定候选图像集合,然后根据候选图像的特征匹配点中满足特征变换矩阵的匹配点数量,得到最终的图像检索结果,解决了现有图像检索的准确率较低的问题,提高了针对大量数据库图像的情况下图像检索的准确率,同时保证了检索效率,进而实现了较高检索性能。
图4是根据本申请实施例公开的又一种图像检索方法的流程图,基于上述技术方案进一步优化与扩展,并可以与上述各个可选实施方式进行结合。如图4所示,该方法可以包括:
S401、利用预设神经网络模型,提取待检索图像的全局特征和局部特征,以及提取待召回图像的全局特征和局部特征。
S402、根据待召回图像的全局特征,对待召回图像进行层次聚类处理,得到至少一个图像聚类集合。
层次聚类处理是指对待召回图像的全局特征分布进行多层级的聚类,这有助于提高图像检索的速度。层次聚类处理包括但不限于利用两级k均值聚类算法(kmeans)进行聚类处理,通过两级kmeans聚类,可以使得图像聚类的结果更均匀,可以加速检索效果和效率。例如,依据待召回图像的全局特征,利用两级kmeans算法对大量待召回图像进行聚类,首先聚类出200个初级码本中心,在各个初级码本中心中各有200个次级中心用于第二级聚类。
S403、根据图像聚类集合对应的聚类中心特征与待检索图像的全局特征之间的特征距离,从至少一个图像聚类集合中确定目标聚类集合。
例如,可以将聚类中心特征与待检索图像的全局特征之间的特征距离小于特征距离阈值的图像聚类集合,确定为目标聚类集合,优选聚类中心与待检索图像的特征距离最近邻的图像聚类集合作为目标聚类集合。聚类中心特征与待检索图像的特征距离越近,图像聚类集合中图像与待检索图像相同或相似的概率越大。
S404、通过目标聚类集合中图像与待检索图像之间的全局特征匹配,确定召回图像集合。
筛选出目标聚类集合之后,便可以只对该集合中的图像与待检索图像进行全局特征匹配,从而减少了参与全局特征匹配的图像数量,提高了图像检索速度,保证了检索实时性。
并且,在对待召回图像进行层次聚类处理之前,可以对待召回图像的全局图像进行压缩处理,减小全局特征的存储空间,减少特征匹配耗时,达到进一步提高检索速度、优化检索性能的效果。
S405、通过待检索图像和召回图像集合中召回图像之间的局部特征匹配,确定候选图像集合。
S406、通过对待检索图像和候选图像集合中的候选图像进行局部特征验证,从候选图像集合中确定检索结果。
根据本申请实施例的技术方案,在图像检索过程中,利用预设神经网络模型同时提取图像的全局特征和局部特征,并依据全局特征对待召回图像进行层次聚类处理,然后基于聚类结果,同时考虑图像全局特征和局部特征得到初步的图像检索结果,最后通过引入图像局部特征校验,得到最终的图像检索结果,解决了现有图像检索的准确率较低的问题,提高了针对大量数据库图像的情况下图像检索的准确率,同时通过聚类处理进一步加速了检索速度,保证了检索实时性,进而实现了较高检索性能。
图5是根据本申请实施例公开的一种图像检索装置的结构示意图,本申请实施例可以适用于基于用户输入的请求图像进行图像检索或搜索的情况。该装置可以采用软件和/或硬件实现,并可集成在任意的具有计算能力的电子设备上,例如服务器等。
如图5所示,本申请实施例公开的图像检索装置500可以包括特征提取模块501、特征匹配模块502和检索结果确定模块503,其中:
特征提取模块501,用于利用预设神经网络模型,提取待检索图像的全局特征和局部特征,以及提取待召回图像的全局特征和局部特征;
特征匹配模块502,用于通过待检索图像和待召回图像之间的全局特征匹配和局部特征匹配,确定候选图像集合;
检索结果确定模块503,用于通过对待检索图像和候选图像集合中的候选图像进行局部特征验证,从候选图像集合中确定检索结果。
可选的,特征提取模块501包括:
全局特征提取单元,用于利用残差神经网络模型,分别提取待检索图像和待召回图像的全局特征;
局部特征提取单元,用于利用残差神经网络模型和注意力模型,分别提取待检索图像和待召回图像的局部特征。
可选的,在提取待检索图像和待召回图像的局部特征的过程中,残差神经网络模型的输出层作为注意力模型的输入层。
可选的,检索结果确定模块503包括:
匹配点确定单元,用于确定待检索图像的局部特征和候选图像集合中候选图像的局部特征之间的特征匹配点;
变换矩阵确定单元,用于根据待检索图像和候选图像之间局部特征的相对位置关系,确定待检索图像和候选图像之间的特征变换矩阵;
检索结果确定单元,用于根据候选图像的特征匹配点中满足特征变换矩阵的匹配点数量,从候选图像集合中确定检索结果。
可选的,特征匹配模块502包括:
召回图像集合确定单元,用于通过待检索图像和待召回图像之间的全局特征匹配,确定召回图像集合;
候选图像集合确定单元,用于通过待检索图像和召回图像集合中召回图像之间的局部特征匹配,确定候选图像集合。
可选的,召回图像集合确定单元包括:
聚类处理子单元,用于根据待召回图像的全局特征,对待召回图像进行层次聚类处理,得到至少一个图像聚类集合;
目标聚类集合确定子单元,用于根据图像聚类集合对应的聚类中心特征与待检索图像的全局特征之间的特征距离,从至少一个图像聚类集合中确定目标聚类集合;
召回图像集合确定子单元,用于通过目标聚类集合中图像与待检索图像之间的全局特征匹配,确定召回图像集合。
可选的,特征匹配模块502还包括:
特征压缩单元,用于在召回图像集合确定单元执行通过待检索图像和待召回图像之间的全局特征匹配,确定召回图像集合的操作之前,对待检索图像和待召回图像的全局特征进行压缩处理。
本申请实施例所公开的图像检索装置500可执行本申请实施例所公开的任一图像检索方法,具备执行方法相应的功能模块和有益效果。本申请装置实施例中未详尽描述的内容可以参考本申请任意方法实施例中的描述。
根据本申请的实施例,本申请实施例还提供了一种电子设备和一种可读存储介质。
如图6所示,图6是用于实现本申请实施例中图像检索方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请实施例的实现。
如图6所示,该电子设备包括:一个或多个处理器601、存储器602,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示图形用户界面(Graphical User Interface,GUI)的图形信息的指令。在其它实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样,可以连接多个电子设备,各个设备提供部分必要的操作,例如,作为服务器阵列、一组刀片式服务器、或者多处理器系统。图6中以一个处理器601为例。
存储器602即为本申请实施例所提供的非瞬时计算机可读存储介质。其中,所述存储器存储有可由至少一个处理器执行的指令,以使所述至少一个处理器执行本申请实施例所提供的图像检索方法。本申请实施例的非瞬时计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行本申请实施例所提供的图像检索方法。
存储器602作为一种非瞬时计算机可读存储介质,可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块,如本申请实施例中图像检索方法对应的程序指令/模块,例如,附图5所示的特征提取模块501、特征匹配模块502和检索结果确定模块503。处理器601通过运行存储在存储器602中的非瞬时软件程序、指令以及模块,从而执行电子设备的各种功能应用以及数据处理,即实现上述方法实施例中的图像检索方法。
存储器602可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据电子设备的使用所创建的数据等。此外,存储器602可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中,存储器602可选包括相对于处理器601远程设置的存储器,这些远程存储器可以通过网络连接至用于实现本实施例中图像检索方法的电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
用于实现本申请实施例中图像检索方法的电子设备还可以包括:输入装置603和输出装置604。处理器601、存储器602、输入装置603和输出装置604可以通过总线或者其他方式连接,图6中以通过总线连接为例。
输入装置603可接收输入的数字或字符信息,以及产生与用于实现本实施例中图像检索方法的电子设备的用户设置以及功能控制有关的键信号输入,例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置604可以包括显示设备、辅助照明装置和触觉反馈装置等,其中,辅助照明装置例如发光二极管(Light Emitting Diode,LED);触觉反馈装置例如,振动电机等。该显示设备可以包括但不限于,液晶显示器(Liquid Crystal Display,LCD)、LED显示器和等离子体显示器。在一些实施方式中,显示设备可以是触摸屏。
此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用集成电路(Application Specific Integrated Circuit,ASIC)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
这些计算程序,也称作程序、软件、软件应用、或者代码,包括可编程处理器的机器指令,并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置,例如,磁盘、光盘、存储器、可编程逻辑装置(Programmable Logic Device,PLD),包括,接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置,例如,阴极射线管(Cathode Ray Tube,CRT)或者LCD监视器;以及键盘和指向装置,例如,鼠标或者轨迹球,用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈,例如,视觉反馈、听觉反馈、或者触觉反馈;并且可以用任何形式,包括声输入、语音输入或者、触觉输入,来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统,例如,作为数据服务器,或者实施在包括中间件部件的计算系统,例如,应用服务器,或者实施在包括前端部件的计算系统,例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互,或者实施在包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信,例如通信网络,来将系统的部件相互连接。通信网络的示例包括:局域网(Local Area Network,LAN)、广域网(Wide Area Network,WAN)、和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。
根据本申请实施例的技术方案,通过在图像检索过程中,利用预设神经网络模型同时提取图像的全局特征和局部特征,根据图像全局特征和局部特征得到初步的图像检索结果,然后通过引入图像局部特征校验,得到最终的图像检索结果,解决了现有图像检索的准确率较低的问题,提高了针对大量数据库图像的情况下图像检索的准确率,同时保证了检索效率。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。
Claims (16)
1.一种图像检索方法,其特征在于,包括:
利用预设神经网络模型,提取待检索图像的全局特征和局部特征,以及提取待召回图像的全局特征和局部特征;
通过所述待检索图像和所述待召回图像之间的全局特征匹配和局部特征匹配,确定候选图像集合;
其中,所述全局特征匹配通过计算向量之间的距离实现,如果两个向量之间距离小于第一距离阈值,则认为对应的两张图像之间的全局特征匹配成功;
所述局部特征匹配通过特征点之间的距离计算来实现,满足特征距离小于第二距离阈值的特征点对的数量大于或等于数量阈值,则认为两张图像之间的局部特征匹配成功;
通过对所述待检索图像和所述候选图像集合中的候选图像进行局部特征验证,从所述候选图像集合中确定检索结果。
2.根据权利要求1所述的方法,其特征在于,利用预设神经网络模型,提取待检索图像的全局特征和局部特征,以及提取待召回图像的全局特征和局部特征,包括:
利用残差神经网络模型,分别提取所述待检索图像和所述待召回图像的全局特征;
利用所述残差神经网络模型和注意力模型,分别提取所述待检索图像和所述待召回图像的局部特征。
3.根据权利要求2所述的方法,其特征在于,在提取所述待检索图像和所述待召回图像的局部特征的过程中,所述残差神经网络模型的输出层作为所述注意力模型的输入层。
4.根据权利要求1所述的方法,其特征在于,通过对所述待检索图像和所述候选图像集合中的候选图像进行局部特征验证,从所述候选图像集合中确定检索结果,包括:
确定所述待检索图像的局部特征和所述候选图像集合中候选图像的局部特征之间的特征匹配点;
根据所述待检索图像和所述候选图像之间局部特征的相对位置关系,确定所述待检索图像和所述候选图像之间的特征变换矩阵;
根据所述候选图像的特征匹配点中满足所述特征变换矩阵的匹配点数量,从所述候选图像集合中确定所述检索结果。
5.根据权利要求1所述的方法,其特征在于,通过所述待检索图像和所述待召回图像之间的全局特征匹配和局部特征匹配,确定候选图像集合,包括:
通过所述待检索图像和所述待召回图像之间的全局特征匹配,确定召回图像集合;
通过所述待检索图像和所述召回图像集合中召回图像之间的局部特征匹配,确定所述候选图像集合。
6.根据权利要求5所述的方法,其特征在于,通过所述待检索图像和所述待召回图像之间的全局特征匹配,确定召回图像集合,包括:
根据所述待召回图像的全局特征,对所述待召回图像进行层次聚类处理,得到至少一个图像聚类集合;
根据所述图像聚类集合对应的聚类中心特征与所述待检索图像的全局特征之间的特征距离,从所述至少一个图像聚类集合中确定目标聚类集合;
通过所述目标聚类集合中图像与所述待检索图像之间的全局特征匹配,确定所述召回图像集合。
7.根据权利要求5所述的方法,其特征在于,在通过所述待检索图像和所述待召回图像之间的全局特征匹配,确定召回图像集合之前,所述方法还包括:
对所述待检索图像和所述待召回图像的全局特征进行压缩处理。
8.一种图像检索装置,其特征在于,包括:
特征提取模块,用于利用预设神经网络模型,提取待检索图像的全局特征和局部特征,以及提取待召回图像的全局特征和局部特征;
特征匹配模块,用于通过所述待检索图像和所述待召回图像之间的全局特征匹配和局部特征匹配,确定候选图像集合;
所述特征匹配模块,具体用于通过计算向量之间的距离实现所述全局特征匹配,如果两个向量之间距离小于第一距离阈值,则认为对应的两张图像之间的全局特征匹配成功;
通过特征点之间的距离计算来实现所述局部特征匹配,满足特征距离小于第二距离阈值的特征点对的数量大于或等于数量阈值,则认为两张图像之间的局部特征匹配成功;
检索结果确定模块,用于通过对所述待检索图像和所述候选图像集合中的候选图像进行局部特征验证,从所述候选图像集合中确定检索结果。
9.根据权利要求8所述的装置,其特征在于,所述特征提取模块包括:
全局特征提取单元,用于利用残差神经网络模型,分别提取所述待检索图像和所述待召回图像的全局特征;
局部特征提取单元,用于利用所述残差神经网络模型和注意力模型,分别提取所述待检索图像和所述待召回图像的局部特征。
10.根据权利要求9所述的装置,其特征在于,在提取所述待检索图像和所述待召回图像的局部特征的过程中,所述残差神经网络模型的输出层作为所述注意力模型的输入层。
11.根据权利要求8所述的装置,其特征在于,所述检索结果确定模块包括:
匹配点确定单元,用于确定所述待检索图像的局部特征和所述候选图像集合中候选图像的局部特征之间的特征匹配点;
变换矩阵确定单元,用于根据所述待检索图像和所述候选图像之间局部特征的相对位置关系,确定所述待检索图像和所述候选图像之间的特征变换矩阵;
检索结果确定单元,用于根据所述候选图像的特征匹配点中满足所述特征变换矩阵的匹配点数量,从所述候选图像集合中确定所述检索结果。
12.根据权利要求8所述的装置,其特征在于,所述特征匹配模块包括:
召回图像集合确定单元,用于通过所述待检索图像和所述待召回图像之间的全局特征匹配,确定召回图像集合;
候选图像集合确定单元,用于通过所述待检索图像和所述召回图像集合中召回图像之间的局部特征匹配,确定所述候选图像集合。
13.根据权利要求12所述的装置,其特征在于,所述召回图像集合确定单元包括:
聚类处理子单元,用于根据所述待召回图像的全局特征,对所述待召回图像进行层次聚类处理,得到至少一个图像聚类集合;
目标聚类集合确定子单元,用于根据所述图像聚类集合对应的聚类中心特征与所述待检索图像的全局特征之间的特征距离,从所述至少一个图像聚类集合中确定目标聚类集合;
召回图像集合确定子单元,用于通过所述目标聚类集合中图像与所述待检索图像之间的全局特征匹配,确定所述召回图像集合。
14.根据权利要求12所述的装置,其特征在于,所述特征匹配模块还包括:
特征压缩单元,用于在所述召回图像集合确定单元执行通过所述待检索图像和所述待召回图像之间的全局特征匹配,确定召回图像集合的操作之前,对所述待检索图像和所述待召回图像的全局特征进行压缩处理。
15.一种电子设备,其特征在于,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-7中任一项所述的图像检索方法。
16.一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使所述计算机执行权利要求1-7中任一项所述的图像检索方法。
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010327963.8A CN111522986B (zh) | 2020-04-23 | 2020-04-23 | 图像检索方法、装置、设备和介质 |
US17/208,901 US11836186B2 (en) | 2020-04-23 | 2021-03-22 | Method and apparatus for retrieving image, device, and medium |
EP21164349.9A EP3825916A3 (en) | 2020-04-23 | 2021-03-23 | Method and apparatus for retrieving image and computer-readable storage medium |
KR1020210037832A KR20210040307A (ko) | 2020-04-23 | 2021-03-24 | 이미지 검색 방법, 장치, 기기 및 매체 |
JP2021051249A JP2021103570A (ja) | 2020-04-23 | 2021-03-25 | 画像検索方法、装置、機器及び媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010327963.8A CN111522986B (zh) | 2020-04-23 | 2020-04-23 | 图像检索方法、装置、设备和介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111522986A CN111522986A (zh) | 2020-08-11 |
CN111522986B true CN111522986B (zh) | 2023-10-10 |
Family
ID=71902972
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010327963.8A Active CN111522986B (zh) | 2020-04-23 | 2020-04-23 | 图像检索方法、装置、设备和介质 |
Country Status (5)
Country | Link |
---|---|
US (1) | US11836186B2 (zh) |
EP (1) | EP3825916A3 (zh) |
JP (1) | JP2021103570A (zh) |
KR (1) | KR20210040307A (zh) |
CN (1) | CN111522986B (zh) |
Families Citing this family (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111950464B (zh) * | 2020-08-13 | 2023-01-24 | 安徽淘云科技股份有限公司 | 图像检索方法、服务端和扫描笔 |
CN112329889A (zh) * | 2020-11-26 | 2021-02-05 | Oppo广东移动通信有限公司 | 图像处理方法、装置以及电子设备 |
CN112580668B (zh) * | 2020-12-24 | 2022-10-18 | 西安深信科创信息技术有限公司 | 一种背景欺诈检测方法、装置及电子设备 |
CN112990228B (zh) * | 2021-03-05 | 2024-03-29 | 浙江商汤科技开发有限公司 | 图像特征匹配方法和相关装置、设备及存储介质 |
CN113011316B (zh) * | 2021-03-16 | 2023-05-30 | 北京百度网讯科技有限公司 | 一种镜头状态的检测方法、装置、电子设备和介质 |
US11809520B1 (en) * | 2021-03-29 | 2023-11-07 | Amazon Technologies, Inc. | Localized visual similarity |
CN112927783B (zh) * | 2021-03-30 | 2023-12-26 | 泰康同济(武汉)医院 | 图像检索方法及装置 |
CN113157962B (zh) * | 2021-04-14 | 2022-09-13 | 杭州灵伴科技有限公司 | 图像检索方法、电子装置和存储介质 |
CN113177133B (zh) * | 2021-04-23 | 2024-03-29 | 深圳依时货拉拉科技有限公司 | 一种图像检索方法、装置、设备及存储介质 |
CN113204665B (zh) * | 2021-04-28 | 2023-09-22 | 北京百度网讯科技有限公司 | 图像检索方法、装置、电子设备及计算机可读存储介质 |
CN113505257A (zh) * | 2021-05-26 | 2021-10-15 | 中国科学院深圳先进技术研究院 | 图像检索方法、商标检索方法、电子设备以及存储介质 |
WO2022265401A1 (ko) * | 2021-06-15 | 2022-12-22 | 엘지전자 주식회사 | 범용의 변환 행렬에 기반한 피쳐 정보 부호화/복호화 방법, 장치 및 비트스트림을 저장하는 기록 매체 |
CN113536017A (zh) * | 2021-07-09 | 2021-10-22 | 北京数美时代科技有限公司 | 一种图像检索方法和系统 |
CN113656630A (zh) * | 2021-08-17 | 2021-11-16 | 北京百度网讯科技有限公司 | 检索图像的方法、装置和系统 |
CN113742504A (zh) * | 2021-09-13 | 2021-12-03 | 城云科技(中国)有限公司 | 以图搜图方法、装置、计算机程序产品和计算机程序 |
CN113806582B (zh) * | 2021-11-17 | 2022-02-25 | 腾讯科技(深圳)有限公司 | 图像检索方法、装置、电子设备和存储介质 |
CN114595352A (zh) * | 2022-02-25 | 2022-06-07 | 北京爱奇艺科技有限公司 | 一种图像识别方法、装置、电子设备及可读存储介质 |
CN114674328B (zh) * | 2022-03-31 | 2023-04-18 | 北京百度网讯科技有限公司 | 地图生成方法、装置、电子设备、存储介质、及车辆 |
CN114880505A (zh) * | 2022-04-27 | 2022-08-09 | 北京百度网讯科技有限公司 | 图像检索方法、装置及计算机程序产品 |
CN114821128B (zh) * | 2022-06-24 | 2022-09-09 | 北京科技大学 | 一种尺度自适应的模板匹配方法 |
CN116680435B (zh) * | 2023-08-03 | 2024-01-19 | 南昌航空大学 | 一种基于多层特征提取的相似图像检索匹配方法 |
CN116796021B (zh) * | 2023-08-28 | 2023-12-05 | 上海任意门科技有限公司 | 图像检索方法、系统、电子设备和介质 |
Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6804683B1 (en) * | 1999-11-25 | 2004-10-12 | Olympus Corporation | Similar image retrieving apparatus, three-dimensional image database apparatus and method for constructing three-dimensional image database |
CN101777059A (zh) * | 2009-12-16 | 2010-07-14 | 中国科学院自动化研究所 | 一种提取地标性场景摘要的方法 |
JP2010266964A (ja) * | 2009-05-12 | 2010-11-25 | Canon Inc | 画像検索装置及びその制御方法並びにプログラム |
CN102542058A (zh) * | 2011-12-29 | 2012-07-04 | 天津大学 | 一种融合全局与局部视觉特征的层次化地标识别方法 |
CN103226589A (zh) * | 2012-10-15 | 2013-07-31 | 北京大学 | 获取图像的紧凑全局特征描述子的方法及图像检索方法 |
CN103714122A (zh) * | 2013-12-06 | 2014-04-09 | 安徽大学 | 一种基于局部分块二进制编码特征的图像检索方法 |
CN106933816A (zh) * | 2015-12-29 | 2017-07-07 | 北京大唐高鸿数据网络技术有限公司 | 基于全局特征和局部特征的跨镜头目标检索系统及方法 |
CN108875807A (zh) * | 2018-05-31 | 2018-11-23 | 陕西师范大学 | 一种基于多注意力多尺度的图像描述方法 |
CN109241319A (zh) * | 2018-09-28 | 2019-01-18 | 百度在线网络技术(北京)有限公司 | 一种图片检索方法、装置、服务器和存储介质 |
CN109508681A (zh) * | 2018-11-20 | 2019-03-22 | 北京京东尚科信息技术有限公司 | 生成人体关键点检测模型的方法和装置 |
CN109635141A (zh) * | 2019-01-29 | 2019-04-16 | 京东方科技集团股份有限公司 | 用于检索图像的方法、电子设备和计算机可读存储介质 |
CN109871909A (zh) * | 2019-04-16 | 2019-06-11 | 京东方科技集团股份有限公司 | 图像识别方法及装置 |
CN110083724A (zh) * | 2019-05-16 | 2019-08-02 | 上海联隐电子科技合伙企业(有限合伙) | 一种相似图像检索方法、装置及系统 |
CN110119460A (zh) * | 2019-05-16 | 2019-08-13 | 广东三维家信息科技有限公司 | 图像检索方法、装置及电子设备 |
CN110348282A (zh) * | 2019-04-30 | 2019-10-18 | 贵州大学 | 用于行人重识别的方法和设备 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010250633A (ja) | 2009-04-17 | 2010-11-04 | Seiko Epson Corp | 画像サーバー、画像検索システム、画像検索方法およびインデックス作成方法 |
US9036925B2 (en) * | 2011-04-14 | 2015-05-19 | Qualcomm Incorporated | Robust feature matching for visual search |
JP2013092941A (ja) | 2011-10-26 | 2013-05-16 | Nippon Telegr & Teleph Corp <Ntt> | 画像検索装置、方法、及びプログラム |
JP6035173B2 (ja) | 2013-03-14 | 2016-11-30 | 株式会社デンソーアイティーラボラトリ | 画像検索システム及び画像検索方法 |
US10402448B2 (en) * | 2017-06-28 | 2019-09-03 | Google Llc | Image retrieval with deep local feature descriptors and attention-based keypoint descriptors |
JP6977345B2 (ja) | 2017-07-10 | 2021-12-08 | コニカミノルタ株式会社 | 画像処理装置、画像処理方法、及び画像処理プログラム |
CN110532571B (zh) * | 2017-09-12 | 2022-11-18 | 腾讯科技(深圳)有限公司 | 文本处理方法及相关装置 |
US11170257B2 (en) | 2018-10-15 | 2021-11-09 | Ancestry.Com Operations Inc. | Image captioning with weakly-supervised attention penalty |
-
2020
- 2020-04-23 CN CN202010327963.8A patent/CN111522986B/zh active Active
-
2021
- 2021-03-22 US US17/208,901 patent/US11836186B2/en active Active
- 2021-03-23 EP EP21164349.9A patent/EP3825916A3/en not_active Withdrawn
- 2021-03-24 KR KR1020210037832A patent/KR20210040307A/ko not_active Application Discontinuation
- 2021-03-25 JP JP2021051249A patent/JP2021103570A/ja active Pending
Patent Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6804683B1 (en) * | 1999-11-25 | 2004-10-12 | Olympus Corporation | Similar image retrieving apparatus, three-dimensional image database apparatus and method for constructing three-dimensional image database |
JP2010266964A (ja) * | 2009-05-12 | 2010-11-25 | Canon Inc | 画像検索装置及びその制御方法並びにプログラム |
CN101777059A (zh) * | 2009-12-16 | 2010-07-14 | 中国科学院自动化研究所 | 一种提取地标性场景摘要的方法 |
CN102542058A (zh) * | 2011-12-29 | 2012-07-04 | 天津大学 | 一种融合全局与局部视觉特征的层次化地标识别方法 |
CN103226589A (zh) * | 2012-10-15 | 2013-07-31 | 北京大学 | 获取图像的紧凑全局特征描述子的方法及图像检索方法 |
CN103714122A (zh) * | 2013-12-06 | 2014-04-09 | 安徽大学 | 一种基于局部分块二进制编码特征的图像检索方法 |
CN106933816A (zh) * | 2015-12-29 | 2017-07-07 | 北京大唐高鸿数据网络技术有限公司 | 基于全局特征和局部特征的跨镜头目标检索系统及方法 |
CN108875807A (zh) * | 2018-05-31 | 2018-11-23 | 陕西师范大学 | 一种基于多注意力多尺度的图像描述方法 |
CN109241319A (zh) * | 2018-09-28 | 2019-01-18 | 百度在线网络技术(北京)有限公司 | 一种图片检索方法、装置、服务器和存储介质 |
CN109508681A (zh) * | 2018-11-20 | 2019-03-22 | 北京京东尚科信息技术有限公司 | 生成人体关键点检测模型的方法和装置 |
CN109635141A (zh) * | 2019-01-29 | 2019-04-16 | 京东方科技集团股份有限公司 | 用于检索图像的方法、电子设备和计算机可读存储介质 |
CN109871909A (zh) * | 2019-04-16 | 2019-06-11 | 京东方科技集团股份有限公司 | 图像识别方法及装置 |
CN110348282A (zh) * | 2019-04-30 | 2019-10-18 | 贵州大学 | 用于行人重识别的方法和设备 |
CN110083724A (zh) * | 2019-05-16 | 2019-08-02 | 上海联隐电子科技合伙企业(有限合伙) | 一种相似图像检索方法、装置及系统 |
CN110119460A (zh) * | 2019-05-16 | 2019-08-13 | 广东三维家信息科技有限公司 | 图像检索方法、装置及电子设备 |
Non-Patent Citations (3)
Title |
---|
A Statistical Framework for Image Category Search from a Mental Picture;Marin Ferecatu等;IEEE Transactions on Pattern Analysis and Machine Intelligence;全文 * |
基于深度多监督哈希的快速图像检索;郁延珍;计算机应用与软件;全文 * |
局部位置特征与全局轮廓特征相结合的图像分类方法;李雅倩;吴超;李海滨;刘彬;;电子学报(07);全文 * |
Also Published As
Publication number | Publication date |
---|---|
KR20210040307A (ko) | 2021-04-13 |
EP3825916A3 (en) | 2021-10-20 |
JP2021103570A (ja) | 2021-07-15 |
US20210209408A1 (en) | 2021-07-08 |
CN111522986A (zh) | 2020-08-11 |
EP3825916A2 (en) | 2021-05-26 |
US11836186B2 (en) | 2023-12-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111522986B (zh) | 图像检索方法、装置、设备和介质 | |
US11341366B2 (en) | Cross-modality processing method and apparatus, and computer storage medium | |
US11663258B2 (en) | Method and apparatus for processing dataset | |
CN112241764B (zh) | 图像识别方法、装置、电子设备及存储介质 | |
US20210209155A1 (en) | Method And Apparatus For Retrieving Video, Device And Medium | |
CN111918094B (zh) | 视频处理方法、装置、电子设备和存储介质 | |
CN110705460B (zh) | 图像类别识别方法及装置 | |
US20130121600A1 (en) | Methods and Apparatus for Visual Search | |
CN112084366B (zh) | 用于检索图像的方法、装置、设备以及存储介质 | |
CN111104514A (zh) | 文档标签模型的训练方法及装置 | |
KR102475235B1 (ko) | 리소스 정렬 방법, 정렬 모델을 트레이닝하는 방법 및 대응하는 장치 | |
JP7256834B2 (ja) | マルチメディアコンテンツの検索方法、マルチメディアコンテンツの検索装置、電子デバイス、記憶媒体及びコンピュータプログラム製品 | |
CN112749300B (zh) | 用于视频分类的方法、装置、设备、存储介质和程序产品 | |
CN112269789A (zh) | 存储数据的方法和装置、以及读取数据的方法和装置 | |
CN113704507B (zh) | 数据处理方法、计算机设备以及可读存储介质 | |
CN112487242A (zh) | 用于识别视频的方法、装置、电子设备及可读存储介质 | |
EP3872703A2 (en) | Method and device for classifying face image, electronic device and storage medium | |
CN111639228B (zh) | 视频检索方法、装置、设备及存储介质 | |
CN112348107A (zh) | 图像数据清洗方法及装置、电子设备和介质 | |
CN110909817B (zh) | 分布式聚类方法及系统、处理器、电子设备及存储介质 | |
WO2022227760A1 (zh) | 图像检索方法、装置、电子设备及计算机可读存储介质 | |
CN111340222B (zh) | 神经网络模型搜索方法、装置以及电子设备 | |
CN112328630B (zh) | 数据查询方法、装置、设备及存储介质 | |
CN113255398A (zh) | 兴趣点判重方法、装置、设备和存储介质 | |
CN112446237A (zh) | 视频分类方法、装置、设备及计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |