CN113505257A - 图像检索方法、商标检索方法、电子设备以及存储介质 - Google Patents
图像检索方法、商标检索方法、电子设备以及存储介质 Download PDFInfo
- Publication number
- CN113505257A CN113505257A CN202110580509.8A CN202110580509A CN113505257A CN 113505257 A CN113505257 A CN 113505257A CN 202110580509 A CN202110580509 A CN 202110580509A CN 113505257 A CN113505257 A CN 113505257A
- Authority
- CN
- China
- Prior art keywords
- feature combination
- image
- local feature
- sub
- search
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 63
- 238000013527 convolutional neural network Methods 0.000 claims description 24
- 238000000605 extraction Methods 0.000 claims description 21
- 238000004422 calculation algorithm Methods 0.000 claims description 20
- 238000011176 pooling Methods 0.000 claims description 11
- 238000012545 processing Methods 0.000 claims description 8
- 230000003247 decreasing effect Effects 0.000 claims description 6
- 238000011160 research Methods 0.000 description 7
- 230000008859 change Effects 0.000 description 6
- 230000008569 process Effects 0.000 description 5
- 230000000007 visual effect Effects 0.000 description 5
- 238000001514 detection method Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 238000012163 sequencing technique Methods 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000006386 memory function Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/53—Querying
- G06F16/538—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Library & Information Science (AREA)
- Databases & Information Systems (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供一种图像检索方法、商标检索方法、电子设备以及存储介质。其中,图像检索方法包括:获取待检索的目标图像;提取目标图像的全局特征组合;基于全局特征组合,在数据库中检索得到与目标图像相匹配的多个检索图像;提取目标图像的第一局部特征组合,以及检索图像的第二局部特征组合;基于第一局部特征组合以及第二局部特征组合,对多个检索图像进行排序,以得到检索结果。以此能够提高检索结果准确率。
Description
技术领域
本发明涉及图像检索技术领域,尤其是涉及一种图像检索方法、商标检索方法、电子设备以及存储介质。
背景技术
早期的图像检索技术都是基于文本的,根据图片的名称去搜索对应的图片,这种方法需要大量的人工事先对图像库中每张图像进行命名,工作量巨大、可拓展性差。为了解决上述问题,基于内容的图像检索应运而生,它利用计算机对图像进行分析,建立图像特征的向量描述并存入图像特征库,当用户输入一张查询图像时,用相同的特征提取方法提取查询图像的特征表示,然后在某种相似性度量准则下计算查询特征表示到特征库中各个特征的相似性大小,最后按相似性大小进行排序并顺序输出对应的图片。基于内容的图像检索技术将图像内容的表达和相似性度量交给计算机进行自动的处理,克服了采用文本进行图像检索所面临的缺陷,并且充分发挥了计算机长于计算的优势,大大提高了检索的效率,为海量图像库的检索开启了新的大门。但是这种方式在排序时时常会出现相似度较大的图像排列在前方,而相似度较小的图像排列在后方,使得检索结果不够准确。
发明内容
本发明提供一种图像检索方法、商标检索方法、电子设备以及存储介质,能够提高检索结果准确率。
为解决上述技术问题,本发明提供的第一个技术方案为:提供一种图像检索方法,方法包括:获取待检索的目标图像;提取目标图像的全局特征组合;基于全局特征组合,在数据库中检索得到与目标图像相匹配的多个检索图像;提取目标图像的第一局部特征组合,以及检索图像的第二局部特征组合;基于第一局部特征组合以及第二局部特征组合,对多个检索图像进行排序,以得到检索结果。
其中,基于第一局部特征组合以及第二局部特征组合,对多个检索图像进行排序,以得到检索结果的步骤,包括:将每一第二局部特征组合中的子特征与第一局部特征组合中的子特征进行比较,以统计每一局部特征组合中与第一局部特征组合中子特征匹配的子特征的数量;基于数量对多个检索图像进行排序,以得到检索结果。
其中,基于数量对多个检索图像进行排序,以得到检索结果的步骤,包括:根据数量按照依次递减的方式将数量对应的检索图像进行重新排序,以得到检索结果。
其中,将每一第二局部特征组合中的子特征与第一局部特征组合中的子特征进行比较的步骤,包括:利用随机采样一致(RANdom SAmple Consensus,PANSAN)特征匹配算法将每一第二局部特征组合中的子特征与第一局部特征组合中的子特征进行比较。
其中,提取目标图像的全局特征组合的步骤包括:利用卷积神经网络(Convolutional Neural Network,CNN)算法提取目标图像的全局特征组合。
其中,利用卷积神经网络(Convolutional Neural Network,CNN)算法提取目标图像的全局特征组合的步骤,包括:利用卷积层对目标图像进行特征提取,进而得到全局子特征组合;利用池化层对全局子特征组合进行处理,进而得到全局特征组合。
其中,提取目标图像的第一局部特征组合,以及检索图像的第二局部特征组合的步骤,包括:利用尺度不变特征变换(Scale invariant feature Transform,SIFT)算法提取目标图像的第一局部特征组合,以及利用尺度不变特征变换(Scale invariant featureTransform,SIFT)算法提取检索图像的第二局部特征组合。
为解决上述技术问题,本发明提供的第二个技术方案为:提供一种商标检索方法,包括:获取待检索的商标图像;提取商标图像的全局特征组合;基于全局特征组合,在数据库中检索得到与商标图像相匹配的多个检索商标图像;提取商标图像的第一局部特征组合,以及检索商标图像的第二局部特征组合;基于第一局部特征组合以及第二局部特征组合,对多个检索商标图像进行排序,以得到检索结果。
为解决上述技术问题,本发明提供的第三个技术方案为:提供一种电子设备,包括:存储器和处理器,其中,存储器存储有程序指令,处理器从存储器调取程序指令以执行任一项的图像检索方法或上述的商标检索方法。
为解决上述技术问题,本发明提供的第三个技术方案为:提供一种计算机可读存储介质,存储有程序文件,程序文件能够被执行以实现上述任一项的图像检索方法或上述的商标检索方法。
本发明的有益效果,区别于现有技术的情况,本发明利用目标图像的全局特征组合进行检索,得到与目标图像匹配的多个检索图像,利用目标图像的第一局部特征组合以及检索图像的第二局部特征组合对多个检索图像进行排序,以得到检索结果,以此能够提高检索结果准确率。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图,其中:
图1为本发明图像检索方法的一实施例的流程示意图;
图2为本发明商标检索方法的一实施例的流程示意图;
图3为本发明电子设备的一实施例的结构示意图;
图4为本发明计算机可读存储介质的一实施例的结构示意图。
具体实施方式
在一项研究成果中,提出了尺度不变特征变换(SIFT)特征提取方法。该局部特征对旋转、尺度缩放、亮度变化保持不变性,对视角变化、仿射变换、噪声也保持一定程度的稳定性。在深度学习流行之前,该特征是基于内容的图像检索领域的最常用局部特征。
在另一项研究成果中,提出了视觉词袋模型(BOVW)应用于基于内容的图像检索。视觉词袋(BOVW)的基本思想是用一组特征来表示一副图像,特征由关键点和描述符构成。这里关键点和描述符的抽取通常使用SIFT。关键点是一副图像的“突出”点,无论图像旋转还是缩放,其关键点始终是相同的。描述符是对关键点的描述,我们使用描述符来构建视觉词典。有了视觉词典,就可以将每张图像转换成特征的频率直方图,该频率直方图就是我们所需的图像向量表示。
在另一项研究成果中,提出基于卷积神经网络CNN的特征抽取方法。该方法利用骨干网络抽取图像丰富的语义特征,然后利用全局池化操作在空间上聚合这些特征得到最终的图像全局特征表示,该全局特征表示包含丰富的语义信息,运用到图像检索领域获得了很好的效果。
视觉词袋(BOVW)方法使用SIFT作为底层特征,不需要标注数据,属于无监督方法,在深度学习兴起之前是图像检索领域的常用方案。基于CNN的图像检索方法,充分利用了CNN强大的特征抽取能力和大数据时代的数据优势,使图像检索的效果大幅提升。
本申请为了进一步提高检索结果的准确率,将全局特征与局部特征相结合,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请的一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请中的术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”、“第三”的特征可以明示或者隐含地包括至少一个该特征。本申请的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。本申请实施例中所有方向性指示(诸如上、下、左、右、前、后……)仅用于解释在某一特定姿态(如附图所示)下各部件之间的相对位置关系、运动情况等,如果该特定姿态发生改变时,则该方向性指示也相应地随之改变。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
请参见图1,为本发明图像检索方法的第一实施例的流程示意图,具体包括:
步骤S11:获取待检索的目标图像。
需要对图像进行检索时,获取待检索的目标图像,该图像可以为风景图像、人物图像、商标图像等等。
步骤S12:提取目标图像的全局特征组合。
具体的,提取目标图像的全局特征组合。在一项研究成果中,提出基于卷积神经网络CNN的特征抽取方法。该方法利用骨干网络抽取图像丰富的语义特征,然后利用全局池化操作在空间上聚合这些特征得到最终的图像全局特征表示,该全局特征表示包含丰富的语义信息,运用到图像检索领域获得了很好的效果。因此,在本申请的一具体实施例中,利用卷积神经网络算法提取目标图像的全局特征组合。具体的,利用卷积层对目标图像进行特征提取,进而得到全局子特征组合;利用池化层对全局子特征组合进行处理,进而得到全局特征组合。
在一实施例中,输入一张目标图像,该目标图像的维度为C×W×H(W、H代表输入图像的宽和高,C代表通道数,对于一张彩色RGB图像,C一般为3),目标图像经过卷积层的特征抽取得到维度C’×W’×H’的全局子特征组合,其表示为一张特征图像,该特征图像的W’和H’远小于目标图像的W、H,C’远大于C。经过特征抽吸,冗余的空间信息被大部分忽略,而特征表示较原始目标图像变得更加丰富。卷积层得到的全局子特征组合仍然包括部分空间信息,利用池化层对全局子特征组合的特征图的每一个通道Xk继续宁全局池化,进而得到单个激活值。池化后的特征每个维度尺度不一样,不利于检索和排序。因此我们在池化时,还需要对特征进行标准化,即将特征变换到单位超球面上的一个点。经过卷积、池化、标准化一系列操作最终得到维度为C′×1×1的全局特征组合。
步骤S13:基于全局特征组合,在数据库中检索得到与目标图像相匹配的多个检索图像。
利用步骤S12得到的全局特征组合在数据库中进行检索,进而得到与目标图像相匹配的多个检索图像。
可以理解的,数据库中存储有大量的检索图像的全局特征组合,可以基于检索图像的全局特征组合与目标图像的全局特征组合的相似度,得到与目标图像匹配的多个检索图像。需要说明的是,在实际检索过程中,系统会根据检索图像与目标图像的相似性对检索图像进行排序。可以基于排序的结果得到与目标图像相似度最高的前K个结果S1,S2,…,SK。
步骤S14:提取目标图像的第一局部特征组合,以及检索图像的第二局部特征组合。
具体的,进一步提取目标图像的第一局部特征组合,以及检索图像的第二局部特征组合。在一项研究成果中,提出了尺度不变特征变换(SIFT)特征提取算法。该局部特征对旋转、尺度缩放、亮度变化保持不变性,对视角变化、仿射变换、噪声也保持一定程度的稳定性。该特征提取算法是基于内容的图像检索领域的最常用局部特征提取方法。因此,在本申请的一实施例中,利用尺度不变特征变换(Scale invariant feature Transform,SIFT)算法提取目标图像的第一局部特征组合,以及利用尺度不变特征变换(Scale invariantfeature Transform,SIFT)算法提取检索图像的第二局部特征组合。
SIFT局部特征的抽取分为特征点检测和特征点描述两步。对于一张维度为C×W×H的输入图像,特征点检测步骤会输出N个二维坐标点(xi,yi),i=1,2,...,N(N的值会随着图像的不同而变化),特征点描述则会在已知特征点坐标的情况下,统计坐标周围的梯度信息得到128维的特征描述符。最终一张图像将会生成N个128维的图像局部描述符以及对应坐标。
步骤S15:基于第一局部特征组合以及第二局部特征组合,对多个检索图像进行排序,以得到检索结果。
具体的,将每一第二局部特征组合中的子特征与第一局部特征组合中的子特征进行比较,以统计每一局部特征组合中与第一局部特征组合中子特征匹配的子特征的数量;基于数量对多个检索图像进行排序,以得到检索结果。
在一实施例中,利用随机采样一致特征匹配方法将每一第二局部特征组合中的子特征与第一局部特征组合中的子特征进行比较,以统计每一局部特征组合中与第一局部特征组合中子特征匹配的子特征的数量。
例如,目标图像的第一局部特征组合包括子特征Z1、Z2、Z3、Z4,检索图像包括S1,S2,S3,S4,其中,检索图像S1的第二局部特征组合包括子特征S11、S12、S13、S14,检索图像S2的第二局部特征组合包括子特征S21、S22、S23、S24,检索图像S3的第二局部特征组合包括子特征S31、S32、S33、S34,检索图像S4的第二局部特征组合包括子特征S41、S42、S43、S44。其中,检索图像S1的第二局部特征组合中的子特征S11与第一局部特征组合中的子特征Z2匹配,也即,检索图像S1中与目标图像匹配的子特征的数量为1。其中,检索图像S2的第二局部特征组合中的子特征S21、S22、S24与第一局部特征组合中的子特征Z1、Z2、Z3匹配,也即,检索图像S2中与目标图像匹配的子特征的数量为3。其中,检索图像S3的第二局部特征组合中的子特征S33、S34与第一局部特征组合中的子特征Z2、Z3匹配,也即,检索图像S3中与目标图像匹配的子特征的数量为2。其中,检索图像S4的第二局部特征组合中的子特征与第一局部特征组合中的子特征均不匹配,也即,检索图像S4中与目标图像匹配的子特征的数量为0。根据统计的数量对多个检索图像进行排序,以得到检索结果。在一实施例中,根据数量按照依次递减的方式将数量对应的检索图像进行重新排序,以得到检索结果。具体的,检索图像S1中与目标图像匹配的子特征的数量为1,检索图像S2中与目标图像匹配的子特征的数量为3,检索图像S3中与目标图像匹配的子特征的数量为2,检索图像S4的第二局部特征组合中的子特征与第一局部特征组合中的子特征均不匹配。则数量按照依次递减的方式进行排序后得到:检索图像S2、检索图像S3、检索图像S1、检索图像S4。该顺序即为检索结果,其中,检索图像S2为目标图像最相似的图像。
本实施例提出了一种结合卷积神经网络(CNN)和特征尺度不变特征变换(SIFT)特征的图像检索方法,有效的解决了图像检索中召回率和准确率的平衡问题。其中CNN特征用于全局召回,提高检索系统的召回率同时对大规模图像集合有较好的伸缩性。SIFT特征用于对返回的前K个检索结果进行重排,使得准确率进一步上升,并且最终的排序更符合人类的直觉。本实施例向全局特征与局部特征相结合,利用了两种特征各自的优点,提升了检索结果的准确率。
请参见图2,为本发明商标检索方法的一实施例的流程示意图,具体包括:
步骤S21:获取待检索的商标图像。
步骤S22:提取商标图像的全局特征组合。
具体的,提取商标图像的全局特征组合。在一项研究成果中,提出基于卷积神经网络CNN的特征抽取方法。该方法利用骨干网络抽取图像丰富的语义特征,然后利用全局池化操作在空间上聚合这些特征得到最终的图像全局特征表示,该全局特征表示包含丰富的语义信息,运用到图像检索领域获得了很好的效果。因此,在本申请的一具体实施例中,利用卷积神经网络算法提取商标图像的全局特征组合。具体的,利用卷积层对商标图像进行特征提取,进而得到全局子特征组合;利用池化层对全局子特征组合进行处理,进而得到全局特征组合。
步骤S23:基于全局特征组合,在数据库中检索得到与商标图像相匹配的多个检索商标图像。
可以理解的,数据库中存储有大量的检索商标图像的全局特征组合,可以基于检索商标图像的全局特征组合与目标图像的全局特征组合的相似度,得到与目标图像匹配的多个检索商标图像。需要说明的是,在实际检索过程中,系统会根据检索商标图像与目标图像的相似性对检索商标图像进行排序。可以基于排序的结果得到与目标图像相似度最高的前K个结果S1,S2,…,SK。
步骤S24:提取商标图像的第一局部特征组合,以及检索商标图像的第二局部特征组合。
具体的,进一步提取商标图像的第一局部特征组合,以及检索商标图像的第二局部特征组合。在一项研究成果中,提出了尺度不变特征变换(SIFT)特征提取算法。该局部特征对旋转、尺度缩放、亮度变化保持不变性,对视角变化、仿射变换、噪声也保持一定程度的稳定性。该特征提取算法是基于内容的图像检索领域的最常用局部特征提取方法。因此,在本申请的一实施例中,利用尺度不变特征变换(Scale invariant feature Transform,SIFT)算法提取商标图像的第一局部特征组合,以及利用尺度不变特征变换(Scaleinvariant feature Transform,SIFT)算法提取检索商标图像的第二局部特征组合。
SIFT局部特征的抽取分为特征点检测和特征点描述两步。对于一张维度为C×W×H的输入图像,特征点检测步骤会输出N个二维坐标点(xi,yi),i=1,2,...,N(N的值会随着图像的不同而变化),特征点描述则会在已知特征点坐标的情况下,统计坐标周围的梯度信息得到128维的特征描述符。最终一张图像将会生成N个128维的图像局部描述符以及对应坐标。
步骤S25:基于第一局部特征组合以及第二局部特征组合,对多个检索商标图像进行排序,以得到检索结果。
具体的,将每一第二局部特征组合中的子特征与第一局部特征组合中的子特征进行比较,以统计每一局部特征组合中与第一局部特征组合中子特征匹配的子特征的数量;基于数量对多个检索商标图像进行排序,以得到检索结果。
在一实施例中,利用随机采样一致特征匹配方法将每一第二局部特征组合中的子特征与第一局部特征组合中的子特征进行比较,以统计每一局部特征组合中与第一局部特征组合中子特征匹配的子特征的数量。
例如,目标图像的第一局部特征组合包括子特征Z1、Z2、Z3、Z4,检索商标图像包括S1,S2,S3,S4,其中,检索商标图像S1的第二局部特征组合包括子特征S11、S12、S13、S14,检索商标图像S2的第二局部特征组合包括子特征S21、S22、S23、S24,检索商标图像S3的第二局部特征组合包括子特征S31、S32、S33、S34,检索商标图像S4的第二局部特征组合包括子特征S41、S42、S43、S44。其中,检索商标图像S1的第二局部特征组合中的子特征S11与第一局部特征组合中的子特征Z2匹配,也即,检索商标图像S1中与目标图像匹配的子特征的数量为1。其中,检索商标图像S2的第二局部特征组合中的子特征S21、S22、S24与第一局部特征组合中的子特征Z1、Z2、Z3匹配,也即,检索商标图像S2中与目标图像匹配的子特征的数量为3。其中,检索商标图像S3的第二局部特征组合中的子特征S33、S34与第一局部特征组合中的子特征Z2、Z3匹配,也即,检索商标图像S3中与目标图像匹配的子特征的数量为2。其中,检索商标图像S4的第二局部特征组合中的子特征与第一局部特征组合中的子特征均不匹配,也即,检索商标图像S4中与目标图像匹配的子特征的数量为0。根据统计的数量对多个检索商标图像进行排序,以得到检索结果。在一实施例中,根据数量按照依次递减的方式将数量对应的检索商标图像进行重新排序,以得到检索结果。具体的,检索商标图像S1中与目标图像匹配的子特征的数量为1,检索商标图像S2中与目标图像匹配的子特征的数量为3,检索商标图像S3中与目标图像匹配的子特征的数量为2,检索商标图像S4的第二局部特征组合中的子特征与第一局部特征组合中的子特征均不匹配。则数量按照依次递减的方式进行排序后得到:检索商标图像S2、检索商标图像S3、检索商标图像S1、检索商标图像S4。该顺序即为检索结果,其中,检索商标图像S2为目标图像最相似的图像。
本实施例提出了一种结合卷积神经网络(CNN)和特征尺度不变特征变换(SIFT)特征的图像检索方法,有效的解决了图像检索中召回率和准确率的平衡问题。其中CNN特征用于全局召回,提高检索系统的召回率同时对大规模图像集合有较好的伸缩性。SIFT特征用于对返回的前K个检索结果进行重排,使得准确率进一步上升,并且最终的排序更符合人类的直觉。本实施例向全局特征与局部特征相结合,利用了两种特征各自的优点,提升了检索结果的准确率。
请参见图3,为本发明电子设备的一实施例的结构示意图,电子设备包括相互连接的存储器202和处理器201。
存储器202用于存储实现上述任意一项的方法的程序指令。
处理器201用于执行存储器202存储的程序指令。
其中,处理器201还可以称为CPU(Central Processing Unit,中央处理单元)。处理器201可能是一种集成电路芯片,具有信号的处理能力。处理器201还可以是通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器202可以为内存条、TF卡等,可以存储设备的电子设备中全部信息,包括输入的原始数据、计算机程序、中间运行结果和最终运行结果都保存在存储器中。它根据控制器指定的位置存入和取出信息。有了存储器,电子设备才有记忆功能,才能保证正常工作。电子设备的存储器按用途存储器可分为主存储器(内存)和辅助存储器(外存),也有分为外部存储器和内部存储器的分类方法。外存通常是磁性介质或光盘等,能长期保存信息。内存指主板上的存储部件,用来存放当前正在执行的数据和程序,但仅用于暂时存放程序和数据,关闭电源或断电,数据会丢失。
在本申请所提供的几个实施例中,应该理解到,所揭露的方法和装置,可以通过其它的方式实现。例如,以上所描述的装置实施方式仅仅是示意性的,例如,模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施方式方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,系统服务器,或者网络设备等)或处理器(processor)执行本申请各个实施方式方法的全部或部分步骤。
请参阅图4,为本发明计算机可读存储介质的结构示意图。本申请的存储介质存储有能够实现上述所有方法的程序文件203,其中,该程序文件203可以以软件产品的形式存储在上述存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本申请各个实施方式方法的全部或部分步骤。而前述的存储装置包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质,或者是计算机、服务器、手机、平板等终端设备。
以上仅为本发明的实施方式,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种图像检索方法,其特征在于,所述方法包括:
获取待检索的目标图像;
提取所述目标图像的全局特征组合;
基于所述全局特征组合,在数据库中检索得到与所述目标图像相匹配的多个检索图像;
提取所述目标图像的第一局部特征组合,以及所述检索图像的第二局部特征组合;
基于所述第一局部特征组合以及所述第二局部特征组合,对所述多个检索图像进行排序,以得到检索结果。
2.根据权利要求1所述的方法,其特征在于,所述基于所述第一局部特征组合以及所述第二局部特征组合,对所述多个检索图像进行排序,以得到检索结果的步骤,包括:
将每一所述第二局部特征组合中的子特征与所述第一局部特征组合中的子特征进行比较,以统计每一所述局部特征组合中与所述第一局部特征组合中子特征匹配的子特征的数量;
基于所述数量对所述多个检索图像进行排序,以得到检索结果。
3.根据权利要求2所述的方法,其特征在于,所述基于所述数量对所述多个检索图像进行排序,以得到检索结果的步骤,包括:
根据所述数量按照依次递减的方式将所述数量对应的所述检索图像进行重新排序,以得到检索结果。
4.根据权利要求2所述的方法,其特征在于,所述将每一所述第二局部特征组合中的子特征与所述第一局部特征组合中的子特征进行比较的步骤,包括:
利用随机采样一致(RANdom SAmple Consensus,PANSAN)特征匹配算法将每一所述第二局部特征组合中的子特征与所述第一局部特征组合中的子特征进行比较。
5.根据权利要求1所述的方法,其特征在于,所述提取所述目标图像的全局特征组合的步骤包括:
利用卷积神经网络(Convolutional Neural Network,CNN)算法提取所述目标图像的全局特征组合。
6.根据权利要求5所述的方法,其特征在于,所述利用卷积神经网络(ConvolutionalNeural Network,CNN)算法提取所述目标图像的全局特征组合的步骤,包括:
利用卷积层对所述目标图像进行特征提取,进而得到全局子特征组合;
利用池化层对所述全局子特征组合进行处理,进而得到所述全局特征组合。
7.根据权利要求1所述的方法,其特征在于,所述提取所述目标图像的第一局部特征组合,以及所述检索图像的第二局部特征组合的步骤,包括:
利用尺度不变特征变换(Scale invariant feature Transform,SIFT)算法提取所述目标图像的第一局部特征组合,以及利用尺度不变特征变换(Scale invariant featureTransform,SIFT)算法提取所述检索图像的第二局部特征组合。
8.一种商标检索方法,其特征在于,包括:
获取待检索的商标图像;
提取所述商标图像的全局特征组合;
基于所述全局特征组合,在数据库中检索得到与所述商标图像相匹配的多个检索商标图像;
提取所述商标图像的第一局部特征组合,以及所述检索商标图像的第二局部特征组合;
基于所述第一局部特征组合以及所述第二局部特征组合,对所述多个检索商标图像进行排序,以得到检索结果。
9.一种电子设备,其特征在于,包括:存储器和处理器,其中,所述存储器存储有程序指令,所述处理器从所述存储器调取所述程序指令以执行如权利要求1-7任一项所述的图像检索方法或权利要求8所述的商标检索方法。
10.一种计算机可读存储介质,其特征在于,存储有程序文件,所述程序文件能够被执行以实现如权利要求1-7任一项所述的图像检索方法或权利要求8所述的商标检索方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110580509.8A CN113505257A (zh) | 2021-05-26 | 2021-05-26 | 图像检索方法、商标检索方法、电子设备以及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110580509.8A CN113505257A (zh) | 2021-05-26 | 2021-05-26 | 图像检索方法、商标检索方法、电子设备以及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113505257A true CN113505257A (zh) | 2021-10-15 |
Family
ID=78008787
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110580509.8A Pending CN113505257A (zh) | 2021-05-26 | 2021-05-26 | 图像检索方法、商标检索方法、电子设备以及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113505257A (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107908646A (zh) * | 2017-10-10 | 2018-04-13 | 西安电子科技大学 | 一种基于分层卷积神经网络的图像检索方法 |
CN110119460A (zh) * | 2019-05-16 | 2019-08-13 | 广东三维家信息科技有限公司 | 图像检索方法、装置及电子设备 |
CN111522986A (zh) * | 2020-04-23 | 2020-08-11 | 北京百度网讯科技有限公司 | 图像检索方法、装置、设备和介质 |
CN112347284A (zh) * | 2020-09-16 | 2021-02-09 | 华南师范大学 | 一种组合商标图像检索方法 |
-
2021
- 2021-05-26 CN CN202110580509.8A patent/CN113505257A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107908646A (zh) * | 2017-10-10 | 2018-04-13 | 西安电子科技大学 | 一种基于分层卷积神经网络的图像检索方法 |
CN110119460A (zh) * | 2019-05-16 | 2019-08-13 | 广东三维家信息科技有限公司 | 图像检索方法、装置及电子设备 |
CN111522986A (zh) * | 2020-04-23 | 2020-08-11 | 北京百度网讯科技有限公司 | 图像检索方法、装置、设备和介质 |
CN112347284A (zh) * | 2020-09-16 | 2021-02-09 | 华南师范大学 | 一种组合商标图像检索方法 |
Non-Patent Citations (1)
Title |
---|
秦姣华 等: "基于卷积神经网络和注意力机制的图像检索", 电讯技术, vol. 61, no. 3, pages 304 - 309 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11048966B2 (en) | Method and device for comparing similarities of high dimensional features of images | |
US8805116B2 (en) | Methods and apparatus for visual search | |
CN110162695B (zh) | 一种信息推送的方法及设备 | |
US8577882B2 (en) | Method and system for searching multilingual documents | |
US9747305B2 (en) | Image search device, image search method, program, and computer-readable storage medium | |
Aly et al. | Indexing in large scale image collections: Scaling properties and benchmark | |
Ahmad et al. | Saliency-weighted graphs for efficient visual content description and their applications in real-time image retrieval systems | |
Yang et al. | An improved Bag-of-Words framework for remote sensing image retrieval in large-scale image databases | |
US20110078176A1 (en) | Image search apparatus and method | |
US9940366B2 (en) | Image search device, image search method, program, and computer-readable storage medium | |
Yasmin et al. | Content based image retrieval by shape, color and relevance feedback | |
Zhao et al. | Spatial pyramid deep hashing for large-scale image retrieval | |
CN108491543A (zh) | 图像检索方法、图像存储方法及图像检索系统 | |
CN110083731B (zh) | 图像检索方法、装置、计算机设备及存储介质 | |
US11874869B2 (en) | Media retrieval method and apparatus | |
CN111858581A (zh) | 一种分页查询的方法、装置、存储介质和电子设备 | |
CN114077682B (zh) | 一种图像检索智能识别匹配处理方法、系统和存储介质 | |
CN112182264B (zh) | 地标信息的确定方法、装置、设备及可读存储介质 | |
CN113505257A (zh) | 图像检索方法、商标检索方法、电子设备以及存储介质 | |
Chen et al. | Spatially aware feature selection and weighting for object retrieval | |
Dimitrovski et al. | Fast and scalable image retrieval using predictive clustering trees | |
CN116702024B (zh) | 流水数据类型识别方法、装置、计算机设备和存储介质 | |
CN113792210B (zh) | 一种基于语义实时分析的热控方法及系统 | |
CN113806619B (zh) | 一种语义分析系统以及语义分析方法 | |
Feng et al. | Efficient indexing for mobile image retrieval |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |