CN112612913A - 一种用于图像的搜索方法和系统 - Google Patents
一种用于图像的搜索方法和系统 Download PDFInfo
- Publication number
- CN112612913A CN112612913A CN202011582643.3A CN202011582643A CN112612913A CN 112612913 A CN112612913 A CN 112612913A CN 202011582643 A CN202011582643 A CN 202011582643A CN 112612913 A CN112612913 A CN 112612913A
- Authority
- CN
- China
- Prior art keywords
- feature
- image
- picture
- features
- level
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 37
- 239000013598 vector Substances 0.000 claims abstract description 72
- 238000000605 extraction Methods 0.000 claims abstract description 44
- 238000012549 training Methods 0.000 claims abstract description 26
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 25
- 238000012545 processing Methods 0.000 claims abstract description 21
- 238000010606 normalization Methods 0.000 claims abstract description 19
- 239000011159 matrix material Substances 0.000 claims description 16
- 238000004590 computer program Methods 0.000 claims description 10
- 238000004364 calculation method Methods 0.000 claims description 9
- 238000011176 pooling Methods 0.000 claims description 6
- 238000013528 artificial neural network Methods 0.000 claims description 5
- 230000009467 reduction Effects 0.000 abstract description 3
- 230000006870 function Effects 0.000 description 19
- 238000010586 diagram Methods 0.000 description 13
- 230000008569 process Effects 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 239000000284 extract Substances 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 230000009466 transformation Effects 0.000 description 3
- 238000000844 transformation Methods 0.000 description 3
- 230000000644 propagated effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000010845 search algorithm Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/53—Querying
- G06F16/532—Query formulation, e.g. graphical querying
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Mathematical Physics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Evolutionary Biology (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Image Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明给出了一种用于图像的搜索方法和系统,包括对待查询图片进行归一化处理获得第一图像;将第一图像输入卷积神经网络的训练模型,提取第一图像中的高层语义特征和低层图片特征并融合生成一维图片特征向量,并选取第一图像的特征维度索引特征值;根据特征维度索引特征值选取一维图片特征向量的对应部分的特征向量作为待查询图片特征;计算待查询图片特征和底库图片特征的余弦相似度,根据余弦相似度的排序选取与待查询图片最相似的底库图片。本方法将图片的高层语义特征和低层图片特征融合再进行降维提取的特征,用于图像的以图搜图,提高了搜索准确率的同时保证搜索速度基本不变。
Description
技术领域
本发明涉及图片搜索的技术领域,尤其是一种用于图像的搜索方法和系统。
背景技术
以图搜图是计算机视觉研究领域的热点之一。以图搜图主要是给定一张搜索图,从底库中查询到最相似的前几张图片。
以图搜图主要的三个基本要素是图片检索底库的制作,特征提取,检索结构。
在特征层面,最早使用简单的图像颜色通道直方图,颜色矩阵特征,也可通过不同Hash算法在像素级别上对图片进行01编码,后来出现了SIFT,HOG等局部特征。还可以将多个局部特征聚合成统一维度的矢量,融合更多的信息。近年来火热的神经网络在特征提取方面表现优异,使用CNN可以提取图像的简单或深层语义特征。
在特征匹配层面也有多种算法可以选择。Hamming距离可对两处理过后的图像特征进行异或运算,结果为1的个数即为特征间的Hamming距离。也可使用余弦相似度公式计算两特征在向量空间中的夹角,夹角越小说明向量越相似,后续也有很多计算特征距离的算法可使用,不一一列举。
现在主流的算法是通过对图片提取特征,然后与底库进行对比。但是,大部分都是提取图像的高层语义特征而忽视了图片的底层特征对以图搜图的影响。
发明内容
为了解决现有技术中图片搜索算法中大部分都是提取图像的高层语义特征而忽视了图片的底层特征造成图片搜索准确率和速度较低的技术问题,本发明提出了一种用于图像的搜索方法和系统,将图片的高层语义特征和低层图片特征融合再进行降维提取的特征,用于图像以图搜图,提高了搜索准确率的同时保证搜索速度基本不变。
根据本发明的一个方面,提出了一种用于图像的搜索方法,包括:
S1:对待查询图片进行归一化处理获得第一图像;
S2:将第一图像输入卷积神经网络的训练模型,提取第一图像中的高层语义特征和低层图片特征并融合生成一维图片特征向量,并选取第一图像的特征维度索引特征值;
S3:根据特征维度索引特征值选取一维图片特征向量的对应部分的特征向量作为待查询图片特征;以及
S4:计算待查询图片特征和底库图片特征的余弦相似度,根据余弦相似度的排序选取与待查询图片最相似的底库图片。
在一些具体的实施例中,卷积神经网络包括senet、resnet或densenet,并使用三元组损失函数作为目标损失函数。采用三元组损失函数可以有效区分非同类极相似样本。
在一些具体的实施例中,卷积神经网络的训练模型具体包括特征提取模型和特征维度选取模型。凭借两个模型的训练,能够快速获取图片的特征维度索引特征值和图片特征向量。
在一些具体的实施例中,特征提取模型具体包括:
迭代训练特征提取网络,用于使得同类的图片特征距离越近,不同类的图片特征距离越远;
将训练好的特征提取网络提取卷积神经网络中的前几层卷积层中的一层卷积特征矩阵和全连接层前一层池化层输出的卷积特征矩阵,并对其融合生成新的一维图片特征向量。
在一些具体的实施例中,特征维度选取模型具体包括:对一维图片特征向量归一化,进行方差计算,根据方差大小排序选取前n维度的图片特征向量的索引特征值作为图片特征索引特征值,其中,n取自500-1000的范围内。
在一些具体的实施例中,步骤S4之前还包括:
对底库中的图片进行归一化处理获得第二图像;
将第二图像输入卷积神经网络的训练模型,提取第二图像中的高层语义特征和低层图片特征并融合生成一维图片特征向量,并选取第二图像的特征维度索引特征值;
根据第二图像的特征维度索引特征值选取一维图片特征向量的对应部分的特征向量作为新的底库图片特征并存储。
根据本发明的第二方面,提出了一种计算机可读存储介质,其上存储有一或多个计算机程序,该一或多个计算机程序被计算机处理器执行时实施上述任一项的方法。
根据本发明的第三方面,提出了一种用于图像的搜索系统,该系统包括:
图片处理单元:配置用于对待查询图片进行归一化处理获得第一图像;
特征提取单元:配置用于将第一图像输入卷积神经网络的训练模型,提取第一图像中的高层语义特征和低层图片特征并融合生成一维图片特征向量,并选取第一图像的特征维度索引特征值;
特征获取单元:配置用于根据特征维度索引特征值选取一维图片特征向量的对应部分的特征向量作为待查询图片特征;
相似度计算单元:配置用于计算待查询图片特征和底库图片特征的余弦相似度,根据余弦相似度的排序选取与待查询图片最相似的底库图片。
在一些具体的实施例中,卷积神经网络包括senet、resnet或densenet,并使用三元组损失函数作为目标损失函数。采用三元组损失函数可以有效区分非同类极相似样本。
在一些具体的实施例中,卷积神经网络的训练模型具体包括特征提取模型和特征维度选取模型。凭借两个模型的训练,能够快速获取图片的特征维度索引特征值和图片特征向量。
在一些具体的实施例中,述特征提取模型具体包括:
迭代训练特征提取网络,用于使得同类的图片特征距离越近,不同类的图片特征距离越远;
将训练好的特征提取网络提取卷积神经网络中的前几层卷积层中的一层卷积特征矩阵和全连接层前一层池化层输出的卷积特征矩阵,并对其融合生成新的一维图片特征向量。
在一些具体的实施例中,特征维度选取模型具体包括:对一维图片特征向量归一化,进行方差计算,根据方差大小排序选取前n维度的图片特征向量的索引特征值作为图片特征索引特征值,其中,n取自500-1000的范围内。
在一些具体的实施例中,还包括:
对底库中的图片进行归一化处理获得第二图像;
将第二图像输入卷积神经网络的训练模型,提取第二图像中的高层语义特征和低层图片特征并融合生成一维图片特征向量,并选取第二图像的特征维度索引特征值;
根据第二图像的特征维度索引特征值选取一维图片特征向量的对应部分的特征向量作为新的底库图片特征并存储。
本发明提出了一种用于图像的搜索方法和系统,利用基于卷积神经网络的特征提取和特征维度选取模型,提取卷积网络中的前几层卷积层中某层卷积特征矩阵(低层图片特征)和全连接层前一层池化层输出的卷积特征矩阵(高层语义特征),并对其融合生成新一维的图片特征向量,并基于该特征向量的特征维度索引特征值获取的一维图片特征向量中对应的特征向量作为图片的新的特征,以该特征与底库中相应的特征进行余弦相似度的运算,获取底库中最相似的图片,提高了图像搜索的准确率并能够保证搜索的速度。
附图说明
包括附图以提供对实施例的进一步理解并且附图被并入本说明书中并且构成本说明书的一部分。附图图示了实施例并且与描述一起用于解释本发明的原理。将容易认识到其它实施例和实施例的很多预期优点,因为通过引用以下详细描述,它们变得被更好地理解。通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1是本申请的一个实施例的用于图像的搜索方法流程图;
图2是本申请的一个具体的实施例的特征提取和特征维度选取的流程图;
图3是本申请的一个具体的实施例的底库特征提取保存的流程图;
图4是本申请的一个具体的实施例的查询图片的流程图;
图5是本申请的一个实施例的用于图像的搜索系统的框架图;
图6是适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
根据本申请的一个实施例的用于图像的搜索方法,图1示出了根据本申请的实施例的用于图像的搜索方法流程图。如图1所示,该方法包括:
S101:对待查询图片进行归一化处理获得第一图像。图像归一化使得图像可以抵抗几何变换的攻击,它能够找出图像中的那些不变量,从而得知这些图像原本就是一样的或者一个系列的。
在一个具体的实施例中,可以采用线性函数转换的方式实现图像归一化,y=(x-MinValue)/(MaxValue-MinValue),其中,x、y分别表示转换前、后的值,MaxValue、MinValue分别为样本的最大值和最小值,利用上述方式将图片中的像素点归一化处理,可以减小图片中由于光线不均匀造成的干扰,提升图片搜索的准确性。应当认识到还可以采用其他的归一化方式,例如对数函数转换或反余切函数转换等方式,同样能够实现本发明的技术效果。
S102:将第一图像输入卷积神经网络的训练模型,提取第一图像中的高层语义特征和低层图片特征并融合生成一维图片特征向量,并选取第一图像的特征维度索引特征值。
在具体的实施例中,卷积神经网络包括senet、resnet或densenet,并使用三元组损失函数作为目标损失函数。采用三元组损失函数可以有效区分非同类极相似样本,并使得同类图片特征距离越近而不同类的图片特征距离越远。
在具体的实施例中,该卷积神经网络的训练模型具体包括特征提取模型和特征维度选取模型。上述两个模型的具体流程如图2示出了根据本申请的一个具体的实施例的特征提取和特征维度选取的流程图中所示,包括:
步骤201:准备训练图片。例如,准备1000类图片,平均每类1000张,总共1000000张。
步骤202:确定网络层和损失函数。选择卷积神经网络(例如senet、resnet、densenet),采用三元组损失函数
步骤203:训练特征提取网络。迭代训练特征提取网络,使得同类图片特征距离越近而不同图片特征距离越远。
步骤204:对准备好的数据集提取高层语义特征和低层特征。例如,准备400000张测试图片,用训练好的特征提取网络提取卷积网络中的前几层卷积层中某层卷积特征矩阵(低层特征)和全连接层前一层池化层输出的卷积特征矩阵(高层语义特征),并对其融合生成新一维的图片特征向量。
步骤205:对提取好的特征进行统计得到特征维度索引。对400000张测试图片新的图片特征首先进行归一化,然后进行方差计算,选取方差大小前n维的图片特征值的索引特征值作为图片特征索引特征值。
与现有技术中的大部分都是提取图像的高层语义特征而忽视了图片的底层特征相比,本发明将图片的高层语义特征和低层图片特征融合再进行降维最后提取的特征,用于图像以图搜图,提高了搜索准确率。
S103:根据特征维度索引特征值选取一维图片特征向量的对应部分的特征向量作为待查询图片特征。利用图2中的特征提取和特征维度选取所获取的特征维度索引特征值提取一维图片特征向量中的对应特征向量作为查询图片特征,便于进行与底库中的图片特征的比对查询。
在具体的实施例中,对底库中的图片同样利用特征提取和特征维度选取的操作,图3示出了根据本申请的一个具体的实施例的底库特征提取保存的流程图,如图3所示,包括:
步骤301:输入图片。将底库中的图片输入进行特征提取保存。
步骤302:对图片进行归一化处理。图像归一化使得图像可以抵抗几何变换的攻击,它能够找出图像中的那些不变量,从而得知这些图像原本就是一样的或者一个系列的。
步骤303:利用特征提取和特征维度选取模块提供特征提取网络。该步骤为图2中的特征提取和特征维度选取的流程。
步骤304:将图片输入训练好的多分类网络。将底库中的图片输入图2中的特征提取和特征维度选取的流程,以提取获得步骤305中的提取高层图片语义特征和低层特征矩阵。
步骤306:将图片高层语义特征和低层特征进行融合。获得新的一维图片特征向量。
步骤308:将提取到的特征进行归一化处理,根据步骤307中特征提取和特征维度选取模块提供特征维度索引特征值提取对应部分的归一化处理后的一维图片特征向量作为图片的特征向量。
步骤309:将新的特征向量存入硬盘,完成底库特征提取。
通过上述步骤将底库中的图片的特征提取并存储至硬盘中,便于进行后期图像搜索时直接利用相应的图片特征进行相似度的运算。
S104:计算待查询图片特征和底库图片特征的余弦相似度,根据余弦相似度的排序选取与待查询图片最相似的底库图片。通过与底库图片特征的余弦相似度的运算,可以获得待查询图片与底库图片的相似度排序,可以向查询者显示相似度结果,方便查询者获取最相似的图片作为查询结果。
继续参考图4,图4示出了根据本申请的一个具体的实施例的用于图像的搜索流程图,如图4所示,包括:
步骤401:输入图片。获得待查询图片,并将其输入本流程中。
步骤402:对图片进行归一化处理。图像归一化使得图像可以抵抗几何变换的攻击,它能够找出图像中的那些不变量,从而得知这些图像原本就是一样的或者一个系列的。
步骤404:将图片输入训练好的多分类网络如步骤403中利用特征提取和特征维度选取模块提供特征提取网络。
步骤405:提取高层图片语义特征和低层特征矩阵。
步骤406:将图片高层语义特征和低层特征进行融合。将图片的高层语义特征和低层图片特征融合获得一维图片特征向量,一维的图片特征向量能够提高搜索的速度。
步骤408:将提取到的特征进行归一化处理,根据步骤407中特征提取和特征维度选取模块提供特征维度索引获得的特征维度索引特征值提取归一化处理后的一维图片特征向量中对应的特征作为待查询图片的特征向量。
步骤409:将查询图片特征和底库图片特征进行余弦相似度计算。该步骤中的底库图片特征为利用图3流程中获得并存储的底库图片特征。
步骤410:将相似度计算的结果按从大到小排序,排在首位的即是最相似图片。相似度计算结果越大表明两张图片越相似,由此可以直观的获得底库图片中与待查询图片最相似的图片。
继续参考图5,图5示出了根据本申请的一个实施例的用于图像的搜索系统的框架图。该系统具体包括图片处理单元501、特征提取单元502、特征获取单元503和相似度计算单元504。
在具体的实施例中,图片处理单元501配置用于对待查询图片进行归一化处理获得第一图像;特征提取单元502配置用于将第一图像输入卷积神经网络的训练模型,提取第一图像中的高层语义特征和低层图片特征并融合生成一维图片特征向量,并选取第一图像的特征维度索引特征值;特征获取单元503配置用于根据特征维度索引特征值选取一维图片特征向量的对应部分的特征向量作为待查询图片特征;相似度计算单元504配置用于计算待查询图片特征和底库图片特征的余弦相似度,根据余弦相似度的排序选取与待查询图片最相似的底库图片。
下面参考图6,其示出了适于用来实现本申请实施例的电子设备的计算机系统600的结构示意图。图6示出的电子设备仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图6所示,计算机系统600包括中央处理单元(CPU)601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储部分608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM 603中,还存储有系统600操作所需的各种程序和数据。CPU 601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
以下部件连接至I/O接口605:包括键盘、鼠标等的输入部分606;包括诸如液晶显示器(LCD)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分608。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读存储介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。在该计算机程序被中央处理单元(CPU)601执行时,执行本申请的方法中限定的上述功能。需要说明的是,本申请的计算机可读存储介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读存储介质,该计算机可读存储介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本申请的操作的计算机程序代码,程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。
作为另一方面,本申请还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中描述的电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:对待查询图片进行归一化处理获得第一图像;将第一图像输入卷积神经网络的训练模型,提取第一图像中的高层语义特征和低层图片特征并融合生成一维图片特征向量,并选取第一图像的特征维度索引特征值;根据特征维度索引特征值选取一维图片特征向量的对应部分的特征向量作为待查询图片特征;计算待查询图片特征和底库图片特征的余弦相似度,根据余弦相似度的排序选取与待查询图片最相似的底库图片。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
Claims (13)
1.一种用于图像的搜索方法,其特征在于,包括:
S1:对待查询图片进行归一化处理获得第一图像;
S2:将所述第一图像输入卷积神经网络的训练模型,提取所述第一图像中的高层语义特征和低层图片特征并融合生成一维图片特征向量,并选取所述第一图像的特征维度索引特征值;
S3:根据所述特征维度索引特征值选取所述一维图片特征向量的对应部分的特征向量作为待查询图片特征;以及
S4:计算所述待查询图片特征和底库图片特征的余弦相似度,根据所述余弦相似度的排序选取与所述待查询图片最相似的底库图片。
2.根据权利要求1所述的用于图像的搜索方法,其特征在于,所述卷积神经网络包括senet、resnet或densenet,并使用三元组损失函数作为目标损失函数。
3.根据权利要求1所述的用于图像的搜索方法,其特征在于,所述卷积神经网络的训练模型具体包括特征提取模型和特征维度选取模型。
4.根据权利要求3所述的用于图像的搜索方法,其特征在于,所述特征提取模型具体包括:
迭代训练特征提取网络,用于使得同类的图片特征距离越近,不同类的图片特征距离越远;
将训练好的特征提取网络提取所述卷积神经网络中的前几层卷积层中的一层卷积特征矩阵和全连接层前一层池化层输出的卷积特征矩阵,并对其融合生成新的一维图片特征向量。
5.根据权利要求4所述的用于图像的搜索方法,其特征在于,所述特征维度选取模型具体包括:对所述一维图片特征向量归一化,进行方差计算,根据方差大小排序选取前n维度的所述图片特征向量的索引特征值作为图片特征索引特征值,其中,n取自500-1000的范围内。
6.根据权利要求1所述的用于图像的搜索方法,其特征在于,所述步骤S4之前还包括:
对底库中的图片进行归一化处理获得第二图像;
将所述第二图像输入所述卷积神经网络的训练模型,提取所述第二图像中的高层语义特征和低层图片特征并融合生成一维图片特征向量,并选取所述第二图像的特征维度索引特征值;
根据所述第二图像的特征维度索引特征值选取一维图片特征向量的对应部分的特征向量作为新的底库图片特征并存储。
7.一种计算机可读存储介质,其上存储有一或多个计算机程序,其特征在于,该一或多个计算机程序被计算机处理器执行时实施权利要求1至6中任一项所述的方法。
8.一种用于图像的搜索系统,其特征在于,所述系统包括:
图片处理单元:配置用于对待查询图片进行归一化处理获得第一图像;
特征提取单元:配置用于将所述第一图像输入卷积神经网络的训练模型,提取所述第一图像中的高层语义特征和低层图片特征并融合生成一维图片特征向量,并选取所述第一图像的特征维度索引特征值;
特征获取单元:配置用于根据所述特征维度索引特征值选取所述一维图片特征向量的对应部分的特征向量作为待查询图片特征;
相似度计算单元:配置用于计算所述待查询图片特征和底库图片特征的余弦相似度,根据所述余弦相似度的排序选取与所述待查询图片最相似的底库图片。
9.根据权利要求8所述的用于图像的搜索系统,其特征在于,所述卷积神经网络包括senet、resnet或densenet,并使用三元组损失函数作为目标损失函数。
10.根据权利要求8所述的用于图像的搜索系统,其特征在于,所述卷积神经网络的训练模型具体包括特征提取模型和特征维度选取模型。
11.根据权利要求10所述的用于图像的搜索系统,其特征在于,述特征提取模型具体包括:
迭代训练特征提取网络,用于使得同类的图片特征距离越近,不同类的图片特征距离越远;
将训练好的特征提取网络提取所述卷积神经网络中的前几层卷积层中的一层卷积特征矩阵和全连接层前一层池化层输出的卷积特征矩阵,并对其融合生成新的一维图片特征向量。
12.根据权利要求11所述的用于图像的搜索系统,其特征在于,所述特征维度选取模型具体包括:对所述一维图片特征向量归一化,进行方差计算,根据方差大小排序选取前n维度的所述图片特征向量的索引特征值作为图片特征索引特征值,其中,n取自500-1000的范围内。
13.根据权利要求8所述的用于图像的搜索系统,其特征在于,还包括:
对底库中的图片进行归一化处理获得第二图像;
将所述第二图像输入所述卷积神经网络的训练模型,提取所述第二图像中的高层语义特征和低层图片特征并融合生成一维图片特征向量,并选取所述第二图像的特征维度索引特征值;
根据所述第二图像的特征维度索引特征值选取一维图片特征向量的对应部分的特征向量作为新的底库图片特征并存储。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011582643.3A CN112612913A (zh) | 2020-12-28 | 2020-12-28 | 一种用于图像的搜索方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011582643.3A CN112612913A (zh) | 2020-12-28 | 2020-12-28 | 一种用于图像的搜索方法和系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112612913A true CN112612913A (zh) | 2021-04-06 |
Family
ID=75248399
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011582643.3A Pending CN112612913A (zh) | 2020-12-28 | 2020-12-28 | 一种用于图像的搜索方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112612913A (zh) |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113191400A (zh) * | 2021-04-14 | 2021-07-30 | 中国海洋大学 | 基于二维图像检索对应三维模型的方法及装置 |
CN113656582A (zh) * | 2021-08-17 | 2021-11-16 | 北京百度网讯科技有限公司 | 神经网络模型的训练方法、图像检索方法、设备和介质 |
CN113792168A (zh) * | 2021-08-11 | 2021-12-14 | 同盾科技有限公司 | 人脸底库自维护的方法、系统、电子装置和存储介质 |
CN113806582A (zh) * | 2021-11-17 | 2021-12-17 | 腾讯科技(深圳)有限公司 | 图像检索方法、装置、电子设备和存储介质 |
CN114048341A (zh) * | 2021-11-03 | 2022-02-15 | 北京中知智慧科技有限公司 | 外观设计产品的安全检索方法、系统、客户端及服务器 |
CN114064952A (zh) * | 2021-07-09 | 2022-02-18 | 武汉邦拓信息科技有限公司 | 一种基于空间感知增强的图形检索方法 |
CN114139013A (zh) * | 2021-11-29 | 2022-03-04 | 深圳集智数字科技有限公司 | 图像搜索方法、装置、电子设备及计算机可读存储介质 |
CN114168770A (zh) * | 2022-02-14 | 2022-03-11 | 成都四方伟业软件股份有限公司 | 一种基于深度学习的以图搜图方法及装置 |
CN115146103A (zh) * | 2022-09-01 | 2022-10-04 | 太平金融科技服务(上海)有限公司深圳分公司 | 图像检索方法、装置、计算机设备、存储介质和程序产品 |
CN116521918A (zh) * | 2023-05-08 | 2023-08-01 | 西南交通大学 | 一种快速搜索相似图的方法 |
CN116796199A (zh) * | 2023-06-25 | 2023-09-22 | 泉州职业技术大学 | 一种基于人工智能的项目匹配分析系统及方法 |
WO2023197827A1 (en) * | 2022-04-12 | 2023-10-19 | Hong Kong Applied Science and Technology Research Institute Company Limited | Fine-grained visual content search platform |
CN117346657A (zh) * | 2023-10-07 | 2024-01-05 | 上海勃傲自动化系统有限公司 | 一种基于5g相机的事件触发方法和系统 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107066520A (zh) * | 2017-02-14 | 2017-08-18 | 北京飞搜科技有限公司 | 一种基于多个语义层次的图片检索方法及系统 |
CN108875813A (zh) * | 2018-06-04 | 2018-11-23 | 北京工商大学 | 一种基于几何图像的三维网格模型检索方法 |
CN109710804A (zh) * | 2019-01-16 | 2019-05-03 | 信阳师范学院 | 一种教学视频图像知识点降维分析方法 |
CN110222218A (zh) * | 2019-04-18 | 2019-09-10 | 杭州电子科技大学 | 基于多尺度NetVLAD和深度哈希的图像检索方法 |
CN110347854A (zh) * | 2019-06-13 | 2019-10-18 | 西安理工大学 | 基于目标定位的图像检索方法 |
KR102097742B1 (ko) * | 2019-07-31 | 2020-04-06 | 주식회사 딥노이드 | 인공지능 기반의 의료영상 검색 시스템 및 그 구동방법 |
CN111310518A (zh) * | 2018-12-11 | 2020-06-19 | 北京嘀嘀无限科技发展有限公司 | 图片特征提取方法、目标重识别方法、装置及电子设备 |
CN112084362A (zh) * | 2020-08-07 | 2020-12-15 | 北京航空航天大学 | 一种基于层次化特征互补的图像哈希检索方法 |
-
2020
- 2020-12-28 CN CN202011582643.3A patent/CN112612913A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107066520A (zh) * | 2017-02-14 | 2017-08-18 | 北京飞搜科技有限公司 | 一种基于多个语义层次的图片检索方法及系统 |
CN108875813A (zh) * | 2018-06-04 | 2018-11-23 | 北京工商大学 | 一种基于几何图像的三维网格模型检索方法 |
CN111310518A (zh) * | 2018-12-11 | 2020-06-19 | 北京嘀嘀无限科技发展有限公司 | 图片特征提取方法、目标重识别方法、装置及电子设备 |
CN109710804A (zh) * | 2019-01-16 | 2019-05-03 | 信阳师范学院 | 一种教学视频图像知识点降维分析方法 |
CN110222218A (zh) * | 2019-04-18 | 2019-09-10 | 杭州电子科技大学 | 基于多尺度NetVLAD和深度哈希的图像检索方法 |
CN110347854A (zh) * | 2019-06-13 | 2019-10-18 | 西安理工大学 | 基于目标定位的图像检索方法 |
KR102097742B1 (ko) * | 2019-07-31 | 2020-04-06 | 주식회사 딥노이드 | 인공지능 기반의 의료영상 검색 시스템 및 그 구동방법 |
CN112084362A (zh) * | 2020-08-07 | 2020-12-15 | 北京航空航天大学 | 一种基于层次化特征互补的图像哈希检索方法 |
Cited By (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113191400B (zh) * | 2021-04-14 | 2022-04-19 | 中国海洋大学 | 基于二维图像检索对应三维模型的方法及装置 |
CN113191400A (zh) * | 2021-04-14 | 2021-07-30 | 中国海洋大学 | 基于二维图像检索对应三维模型的方法及装置 |
CN114064952A (zh) * | 2021-07-09 | 2022-02-18 | 武汉邦拓信息科技有限公司 | 一种基于空间感知增强的图形检索方法 |
CN113792168A (zh) * | 2021-08-11 | 2021-12-14 | 同盾科技有限公司 | 人脸底库自维护的方法、系统、电子装置和存储介质 |
CN113656582A (zh) * | 2021-08-17 | 2021-11-16 | 北京百度网讯科技有限公司 | 神经网络模型的训练方法、图像检索方法、设备和介质 |
WO2023020005A1 (zh) * | 2021-08-17 | 2023-02-23 | 北京百度网讯科技有限公司 | 神经网络模型的训练方法、图像检索方法、设备和介质 |
CN114048341A (zh) * | 2021-11-03 | 2022-02-15 | 北京中知智慧科技有限公司 | 外观设计产品的安全检索方法、系统、客户端及服务器 |
CN113806582A (zh) * | 2021-11-17 | 2021-12-17 | 腾讯科技(深圳)有限公司 | 图像检索方法、装置、电子设备和存储介质 |
CN114139013A (zh) * | 2021-11-29 | 2022-03-04 | 深圳集智数字科技有限公司 | 图像搜索方法、装置、电子设备及计算机可读存储介质 |
CN114139013B (zh) * | 2021-11-29 | 2024-07-16 | 深圳须弥云图空间科技有限公司 | 图像搜索方法、装置、电子设备及计算机可读存储介质 |
CN114168770A (zh) * | 2022-02-14 | 2022-03-11 | 成都四方伟业软件股份有限公司 | 一种基于深度学习的以图搜图方法及装置 |
WO2023197827A1 (en) * | 2022-04-12 | 2023-10-19 | Hong Kong Applied Science and Technology Research Institute Company Limited | Fine-grained visual content search platform |
CN115146103A (zh) * | 2022-09-01 | 2022-10-04 | 太平金融科技服务(上海)有限公司深圳分公司 | 图像检索方法、装置、计算机设备、存储介质和程序产品 |
CN116521918A (zh) * | 2023-05-08 | 2023-08-01 | 西南交通大学 | 一种快速搜索相似图的方法 |
CN116521918B (zh) * | 2023-05-08 | 2024-07-09 | 西南交通大学 | 一种快速搜索相似图的方法 |
CN116796199A (zh) * | 2023-06-25 | 2023-09-22 | 泉州职业技术大学 | 一种基于人工智能的项目匹配分析系统及方法 |
CN116796199B (zh) * | 2023-06-25 | 2024-02-20 | 泉州职业技术大学 | 一种基于人工智能的项目匹配分析系统及方法 |
CN117346657A (zh) * | 2023-10-07 | 2024-01-05 | 上海勃傲自动化系统有限公司 | 一种基于5g相机的事件触发方法和系统 |
CN117346657B (zh) * | 2023-10-07 | 2024-03-19 | 上海勃傲自动化系统有限公司 | 一种基于5g相机的事件触发方法和系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112612913A (zh) | 一种用于图像的搜索方法和系统 | |
US8762383B2 (en) | Search engine and method for image searching | |
CN111522996B (zh) | 视频片段的检索方法和装置 | |
CN106951484B (zh) | 图片检索方法及装置、计算机设备及计算机可读介质 | |
US20230376527A1 (en) | Generating congruous metadata for multimedia | |
CN109360028B (zh) | 用于推送信息的方法和装置 | |
JP6740457B2 (ja) | 商標画像のコンテンツ・ベースの検索及び取得 | |
CN113392173A (zh) | 基于区块链的信息推送更新方法、系统及云服务信息平台 | |
CN111291765A (zh) | 用于确定相似图片的方法和装置 | |
US8954365B2 (en) | Density estimation and/or manifold learning | |
CN111651636A (zh) | 视频相似片段搜索方法及装置 | |
CN111414953B (zh) | 点云分类方法和装置 | |
CN108985190B (zh) | 目标识别方法和装置、电子设备、存储介质 | |
WO2021042763A1 (en) | Image searches based on word vectors and image vectors | |
CN111930983B (zh) | 一种图像检索方法、装置、电子设备及存储介质 | |
CN115443490A (zh) | 影像审核方法及装置、设备、存储介质 | |
CN113657087A (zh) | 信息的匹配方法及装置 | |
CN110110257B (zh) | 数据处理方法及其系统、计算机系统及计算机可读介质 | |
CN110135428B (zh) | 图像分割处理方法和装置 | |
CN111488479B (zh) | 超图构建方法、装置以及计算机系统和介质 | |
CN116883740A (zh) | 相似图片识别方法、装置、电子设备和存储介质 | |
CN111191065B (zh) | 一种同源图像确定方法及装置 | |
CN116109907A (zh) | 目标检测方法、装置、电子设备及存储介质 | |
CN112650869B (zh) | 图像检索重排序方法、装置、电子设备及存储介质 | |
US11366833B2 (en) | Augmenting project data with searchable metadata for facilitating project queries |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210406 |