CN111950728A - 图像特征提取模型的构建方法、图像检索方法及存储介质 - Google Patents
图像特征提取模型的构建方法、图像检索方法及存储介质 Download PDFInfo
- Publication number
- CN111950728A CN111950728A CN202010826153.7A CN202010826153A CN111950728A CN 111950728 A CN111950728 A CN 111950728A CN 202010826153 A CN202010826153 A CN 202010826153A CN 111950728 A CN111950728 A CN 111950728A
- Authority
- CN
- China
- Prior art keywords
- image
- neural network
- picture
- sample
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000605 extraction Methods 0.000 title claims abstract description 64
- 238000000034 method Methods 0.000 title claims abstract description 59
- 238000010276 construction Methods 0.000 title claims abstract description 17
- 239000013598 vector Substances 0.000 claims abstract description 91
- 238000013528 artificial neural network Methods 0.000 claims abstract description 54
- 238000003062 neural network model Methods 0.000 claims abstract description 54
- 238000012549 training Methods 0.000 claims abstract description 29
- 238000012545 processing Methods 0.000 claims abstract description 10
- 239000000523 sample Substances 0.000 claims description 69
- 239000013074 reference sample Substances 0.000 claims description 31
- 238000011176 pooling Methods 0.000 claims description 10
- 238000012512 characterization method Methods 0.000 claims description 9
- 238000004364 calculation method Methods 0.000 claims description 8
- 230000008569 process Effects 0.000 claims description 7
- 238000012163 sequencing technique Methods 0.000 claims description 6
- 230000009286 beneficial effect Effects 0.000 abstract description 4
- 239000000284 extract Substances 0.000 abstract description 3
- 238000013473 artificial intelligence Methods 0.000 abstract description 2
- 230000006870 function Effects 0.000 description 12
- 238000010586 diagram Methods 0.000 description 11
- 238000013527 convolutional neural network Methods 0.000 description 8
- 230000002776 aggregation Effects 0.000 description 5
- 238000004220 aggregation Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000010845 search algorithm Methods 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/53—Querying
- G06F16/535—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Library & Information Science (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种图像特征提取模型的构建方法、图像检索方法及存储介质,涉及人工智能技术领域,该方法包括:搭建神经网络模型,其中,所述神经网络模型至少包括第一神经网络以及第二神经网络,所述第一神经网络用于提取图像的图像特征,所述第二神经网络用于对所述第一神经网络提取到的图像特征进行特征嵌入处理,获得所述图像的特征向量;获取用于训练的图片样本集;利用所述图片样本集对所述神经网络模型进行训练,得到图像特征提取模型。本发明的有益效果是:通过利用增强的神经网络结构和改进的损失函数对神经网络模型进行训练,使得图像特征提取模型能够更好地提取到主体目标降低背景信息的影响权重的图像特征,从而提高检索的准确率。
Description
技术领域
本发明属于人工智能技术领域,尤其涉及一种图像特征提取模型的构建方法、图像检索方法及存储介质。
背景技术
随着互联网技术的深入发展,基于图像内容检索的需求不断增加,如购物平台上的商品检索。但是,现有图像检索技术中,往往通过传统人工设计特征进行匹配,如hash特征。这种方法无法满足复杂场景需求,导致准确度不高。而简单使用卷积神经网络提取特征又无法使类内间隔更紧凑,不利于图像特征的表征,图像特征的提取时间与图像检索所需的时间较多。
发明内容
本发明正是基于现有技术仅简单使用卷积神经网络提取特征又无法使类内间隔更紧凑,不利于图像特征提取,从而导致图像特征提取以及图像检索需要花费较多时间的技术问题,提出了一种图像特征提取模型的构建方法、图像检索方法及存储介质。
第一方面,本发明实施例提供了一种图像特征提取模型的构建方法,包括:
搭建神经网络模型,其中,所述神经网络模型至少包括第一神经网络以及第二神经网络,所述第一神经网络用于提取图像的图像特征,所述第二神经网络用于对所述第一神经网络提取到的图像特征进行特征嵌入处理,获得所述图像的特征向量;
获取用于训练的图片样本集;
利用所述图片样本集对所述神经网络模型进行训练,得到图像特征提取模型。
可选地,所述第二神经网络用于对所述第一神经网络提取到的图像特征进行特征嵌入处理,获得所述图像的特征向量,包括:
对所述图像特征中的每个单元进行N次方计算,获得新的图像特征;
对所述新的图像特征进行池化运算,获得池化后的图像特征;
对所述池化后的图像特征中的每个单元进行1/N次方计算,得到所述图像的特征向量;
其中,N为正整数。
可选地,所述图片样本集中包括不同类别的样本子集,每个样本子集中包括多张图片,且每张图片各自关联有一个标签值,该标签值用于表征该图片属于其所属类别的相似度。
可选地,利用所述图片样本集对所述神经网络模型进行训练,包括:
将所述图片样本集划分为若干个图片组,每个图片组包括参考样本、正样本以及负样本,其中,所述参考样本和所述正样本为从同一类别的样本子集中选取到的图片,所述负样本为从其它不同类别的样本子集中选取到的图片;
从若干个图片组中选择任意一个图片组作为所述神经网络模型的输入,获得该图片组中各个样本对应的特征向量;以最小化该图片组中参考样本的特征向量与正样本的特征向量之间的距离,以及最大化该图片组中参考样本的特征向量与负样本的特征向量之间的距离为目标,对所述神经网络模型进行训练。
可选地,以最小化该图片组中参考样本的特征向量与正样本的特征向量之间的距离,以及最大化该图片组中参考样本的特征向量与负样本的特征向量之间的距离为目标,对所述神经网络模型进行训练,包括:
将该图片组中各个样本对应的特征向量作为AP-loss的输入,获得该图片组对应的loss值;
根据所述图片组中的参考样本对应的标签值与该图片组对应的loss值之间的差值,确定参考样本的表征分数;
对一次迭代过程中获得的所有参考样本的表征分数进行排序,获得排序结果;
对所述排序结果进行平均正确率运算,获得运算结果;
将所述运算结果作为所述神经网络模型的反向传播的输入,对所述神经网络模型中的权重进行更新,以获得所述图像特征提取模型。
第二方面,本发明实施例提供了一种图像检索方法,包括:
获取待检索图像;
将所述待检索图像作为利用如上述实施例中任一项所述的图像特征提取模型的构建方法构建的图像特征提取模型的输入,获得所述待检索图像的特征向量;
确定所述待检索图像的特征向量与预设的图片特征库中的图片的特征向量之间的相似度;
根据所述相似度从所述图片特征库中检索出与所述待检索图像相似的图片,得到图像检索结果。
可选地,所述确定所述待检索图像的特征向量与预设的图片特征库中的图片的特征向量之间的相似度,包括:
通过计算所述待检索图像的特征向量与预设的图片特征库中的图片的特征向量之间的欧氏距离或余弦距离来确定相似度。
可选地,通过以下步骤构建所述图片特征库,包括:
获取多张图片;
将每张图片分别作为所述图像特征提取模型的输入,获得每张图片所对应的特征向量;
存储每张图片以及该图片所对应的特征向量,以构建所述图片特征库。
第三方面,本发明实施例提供了一种存储介质,所述存储介质上存储有程序代码,所述程序代码被处理器执行时,实现如上述实施例中任一项所述的图像特征提取模型的构建方法,和/或,实现如上述实施例中任一项所述的图像检索方法。
第四方面,本发明实施例提供了一种电子设备,所述电子设备包括存储器、处理器,所述存储器上存储有可在所述处理器上运行的程序代码,所述程序代码被所述处理器执行时,实现如上述实施例中任一项所述的图像特征提取模型的构建方法,和/或,实现如上述实施例中任一项所述的图像检索方法。
在本发明实施例提供的一种图像特征提取模型的构建方法,通过搭建一个具有用于提取图像的图像特征的第一神经网络以及用于对所述第一神经网络提取到的图像特征进行特征嵌入处理获得图像的特征向量的第二神经网络的一个神经网络模型,并通过对其进行训练得到一个能够提取图像特征的图形特征提取模型。由此,通过该图像特征提取模型,通过利用增强的神经网络结构和改进的损失函数对神经网络模型进行训练,使得图像特征提取模型能够更好地提取到主体目标降低背景信息的影响权重的图像特征,从而提高检索的准确率。
附图说明
通过结合附图阅读下文示例性实施例的详细描述可更好地理解本公开的范围。其中所包括的附图是:
图1示出了本发明实施例一提出的一种图像特征提取模型的构建方法的流程示意图;
图2示出了神经网络模型提取特征向量的过程示意图;
图3示出了神经网络模型训练的示意图;
图4示出了利用图片组对神经网络模型进行训练的示意图;
图5示出了本发明实施例二提出的一种图像检索方法的流程示意图;
图6示出了图像检索方法的流程示意图;
图7示出了图像检索的系统架构图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,以下将结合附图及实施例来详细说明本发明的实施方法,借此对本发明如何应用技术手段来解决技术问题,并达成技术效果的实现过程能充分理解并据以实施。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述的其他方式来实施,因此,本发明的保护范围并不受下面公开的具体实施例的限制。
实施例一
根据本发明的实施例,提供了一种图像特征提取模型的构建方法,图1示出了本发明实施例一提出的一种图像特征提取模型的构建方法的流程示意图,如图1所示,该图像特征提取模型的构建方法可以包括:步骤110至步骤130。
在步骤110中,搭建神经网络模型,其中,所述神经网络模型至少包括第一神经网络以及第二神经网络,所述第一神经网络用于提取图像的图像特征,所述第二神经网络用于对所述第一神经网络提取到的图像特征进行特征嵌入处理,获得所述图像的特征向量。
这里,该第一神经网络可以采用CNN(Convolution Neural Network,卷积神经网络),也可以采用ResNet(Residual Neural Network,残差神经网络),如ResNet50或ResNet101。该第二神经网络则作为Aggregation Layer,用于对第一神经网络提取到的图像特征进行进一步的处理,来获得表征图像整体特征的特征向量。值得说明的是,该神经网络模型具备一个完整的结构,如全连接层、激活函数等。其中,神经网络模型中的主干网络可以根据具体场景更换,比如更换为较小的网络,缩小推理时间,进而提高检索速度。
在一个可选的实施方式中,所述第二神经网络用于对所述第一神经网络提取到的图像特征进行特征嵌入处理,获得所述图像的特征向量,包括:
对所述图像特征中的每个单元进行N次方计算,获得新的图像特征;
对所述新的图像特征进行池化运算,获得池化后的图像特征;
对所述池化后的图像特征中的每个单元进行1/N次方计算,得到所述图像的特征向量;
其中,N为正整数。
图2示出了神经网络模型提取特征向量的过程示意图,如图2所示,第一神经网络从待检索图像上提取图像特征,该图像特征作为初选的图像特征。第一神经网络提取到的图像特征作为第二神经网络的输入,第二神经网络作为一个Aggregation Layer,其对图像特征中的每个单元(cell)取N次方,获得新的图像特征,进而将新的图像特征进行池化运算。该池化运算可以是自适应平均池化操作,可以通过一个自适应池化层对该新的图像特征进行池化,自适应池化层能够将不同尺寸的特征图输出为固定的尺寸,固定尺寸根据网络结构自行设置优化。在经过自适应池化层操作后的得到池化后的图像特征后,对池化后的图形特征中的每个单元(cell)进行1/N次方计算,得到所述图像的特征向量,该特征向量作为图像的嵌入表达特征。其中,N为正整数,在实际实现中N可以取3,即对每个cell进行立方运算。
在步骤120中,获取用于训练的图片样本集。
在一个可选的实施方式中,所述图片样本集中包括不同类别的样本子集,每个样本子集中包括多张图片,且每张图片各自关联有一个标签值,该标签值用于表征该图片属于其所属类别的相似度。
这里,图片样本集是用于对神经网络模型进行训练的一个图片数据集,该图片样本集中包括不同类别的样本子集,每个样本子集中的图片为相似图片。如一个类别为圆形的空调图片,则该类别包括多张不同的圆形的空调图片。而且,每张图片各自关联有一个标签值,该标签值表征图片在其所属类别上的相似度。例如,圆形的空调图片的类别中包括多张不同的圆形空调图片,多张不同的圆形空调图片之间的相似度不一样,可以通过标记其相似度等级,如最像圆形的标记为1,稍微像圆形的标记为0.3,从而得到每张图片各自的标签值。
在步骤130中,利用所述图片样本集对所述神经网络模型进行训练,得到图像特征提取模型。
这里,步骤130具体可以包括步骤131至步骤133。
在步骤131中,将所述图片样本集划分为若干个图片组,每个图片组包括参考样本、正样本以及负样本,其中,所述参考样本和所述正样本为从同一类别的样本子集中选取到的图片,所述负样本为从其它不同类别的样本子集中选取到的图片。
这里,图片组是一个三元组,包括参考样本、正样本以及负样本。其中,参考样本与正样本是相似的图片,参考样本与负样本是不相似的图片。在神经网络模型的训练过程中,神经网络模型在学习参考样本与正样本的相似性的同时,也学习参考样本与负样本的差异性,从而提高神经网络模型的精度。
值得说明的是,一个类别的样本子集中的图片为同一类型的图片。
在步骤132中,从若干个图片组中选择任意一个图片组作为所述神经网络模型的输入,获得该图片组中各个样本对应的特征向量。
这里,图片组作为神经网络模型的输入,其经过第一神经网络以及第二神经网络,能够获取到图片组中各个样本对应的特征向量,进而通过损失函数对特征向量进行计算。
在步骤133中,以最小化该图片组中参考样本的特征向量与正样本的特征向量之间的距离,以及最大化该图片组中参考样本的特征向量与负样本的特征向量之间的距离为目标,对所述神经网络模型进行训练。
这里,基于损失函数的监督进行训练,目标是使得参考样本的特征向量与正样本的特征向量之间的距离最小化,以及参考样本的特征向量与负样本的特征向量之间的距离最大化。通过不断迭代,直至损失函数收敛。或者是达到预先设定的迭代次数,完成对神经网络模型的训练,得到一个图像特征提取模型。
其中,损失函数可以选择为三元损失函数(Triplet Loss),三元损失函数可以在数据量不大的时候或者数据难以训练的时候,快速对模型进行训练。损失函数也可以选择为AP-loss(Average-Precision-loss),利用AP-loss能够很好地对神经网络模型进行优化,能够准确提取图像的主体目标,并降低背景信息的影响权重。
在一个可选的实施方式中,步骤133可以包括步骤1331至步骤1335。
在步骤1331中,将该图片组中各个样本对应的特征向量作为AP-loss的输入,获得该图片组对应的loss值。
这里,该图片组中各个样本对应的特征向量是第一神经网络以及第二神经网络进行提取的,其作为Embedding(嵌入层)的输出。得到的特征向量作为AP-loss的输入,该AP-loss作为损失函数,得到图片组的损失值,即loss值。
在步骤1332中,根据所述图片组中的参考样本对应的标签值与该图片组对应的loss值之间的差值,确定参考样本的表征分数。
这里,根据所述图片组中的参考样本对应的标签值与该图片组对应的loss值之间的差值,实际上是以图片的标签值作为监督信号。由于AP-loss输出的是一个预测值,而样本的标签值作为真实值,可以通过比较预测值与真实值之间的差值,得到参考样本的表征分数。
在步骤1333中,对一次迭代过程中获得的所有参考样本的表征分数进行排序,获得排序结果。
这里,在一次迭代过程中,会利用多个图片组进行训练,因此,对得到的所有参考样本的表征分数进行排序,获得排序结果。该排序基于表征分数的大小从大到小进行排序。
在步骤1334中,对所述排序结果进行平均正确率运算,获得运算结果。
这里,平均正确率(Average Precision)作为信息检索的评价指标,通过对排序结果进行Average Precision可以解决训练中排序问题。对排序结果进行AveragePrecision,可以在训练阶段更好地应用改进的loss,否则该改进的loss函数难以训练。
在步骤1335中,将所述运算结果作为所述神经网络模型的反向传播的输入,对所述神经网络模型中的权重进行更新,以获得所述图像特征提取模型。
这里,在对排序结果进行Average Precision运算之后,将运算结果作为神经网络模型的反向传播的输入,从而利用该运算结果对神经网络模型中的函数的权重值进行更新。其具体是利用反向传播算法对神经网络模型中的权重进行更新,即将运算结果作为AP-loss的反向输入,从而对神经网络模型的权重进行更新,以达到神经网络模型训练的目的。在经过多次迭代之后,训练好的神经网络模型即为图像特征提取模型。
图3示出了神经网络模型训练的示意图,如图3所示,图片经过Net等到特征向量,即embedding输出特征向量,特征向量作为AP-loss的输入,计算loss值。
值得说明的是,AP-loss是训练的优选函数,可以让模型更好的区分哪些特征是相似的,哪些特征不是相似的.为一个标量,表示与标签数据的差距,该结果用于反向传播达到训练模型的目的。
图4示出了利用图片组对神经网络模型进行训练的示意图,如图4所示,图片组经过backbone(第一神经网络)得到图像特征,图像特征经过Aggregation Layer(第二神经网络)得到特征向量,得到的特征向量作为AP-loss或Triplet Loss的输入,学习相似特征,经过多轮的学习,完成对神经网络模型的训练,得到图像特征提取模型。
在本实施例中,首先利用第一神经网络(CNN)提取图像特征,对CNN提取的图像特征采用第二神经网络(Aggregation Layer)得到固定长度的特征向量;对得到的特征向量使用改进的Loss(AP-loss)进行端到端训练,可以得到一个能更好地获取图像特征的图像特征提取模型,该图像特征提取模型能够专注主体目标并降低背景信息的影响权重,使检索准确率更高。该图像特征提取模型可以应用在安防视频中的检索、大型图片搜索应用、人脸识别等方面。
实施例二
在上述实施例的基础上,本发明的实施例二还可以提供一种图像检索方法,图5示出了本发明实施例二提出的一种图像检索方法的流程示意图,如图5所示,该图像检索方法的构建方法可以包括:步骤210至步骤240。
在步骤210中,获取待检索图像。
这里,该待检索图像通过终端上传的图片,图片经过后端接口处理为能够输入图像特征提取模型的数据。
在步骤220中,将所述待检索图像作为利用如上述实施例所述的图像特征提取模型的构建方法构建的图像特征提取模型的输入,获得所述待检索图像的特征向量。
这里,图像特征提取模型是利用上述实施例提到的图像特征提取模型的构建方法进行构建得到的,在此不再赘述。其中,图像特征提取模型包括第一神经网络以及第二神经网络,该第一神经网络可以采用CNN(Convolution Neural Network,卷积神经网络),也可以采用ResNet(Residual Neural Network,残差神经网络),如ResNet50或ResNet 101。
在步骤230中,确定所述待检索图像的特征向量与预设的图片特征库中的图片的特征向量之间的相似度。
这里,相似度可以通过欧式距离或余弦距离进行表征,即通过计算所述待检索图像的特征向量与预设的图片特征库中的图片的特征向量之间的欧氏距离或余弦距离来确定相似度。其中,可以利用稀疏矩阵搜索算法进行图像检索。
在一个可选的实施方式中,图片特征库可以通过以下步骤构建,包括:步骤201至步骤203。
在步骤201中,获取多张图片。
这里,多张图片是用于检索的一个图片库,其包括多张图片,图片可以是相似的也可以包括不相似的。
在步骤202中,将每张图片分别作为所述图像特征提取模型的输入,获得每张图片所对应的特征向量。
这里,每张图片作为图像特征提取模型的输入,得到其对应的特征向量。该图像特征提取模型是利用上述实施例提到的图像特征提取模型的构建方法进行构建得到的,在此不再赘述。
在步骤203中,存储每张图片以及该图片所对应的特征向量,以构建所述图片特征库。
这里,通过关联每张图片以及与该图片对应的特征向量,并进行存储,可以得到一个图片特征库,该图片特征库用于图像检索。例如,图片特征库中包括图片A,图片A对应特征向量B,即储存的数据格式为A-B。
另外,图片特征库中的图片也可以各自关联有图像附加信息,该图像附加信息由用户添加,可以包括图片上传者、图片大小、图片的时间戳等信息。在输出相似图片的时候,该图像附加信息也可以作为输出,以让用户连接图片的基本信息。
在步骤240中,根据所述相似度从所述图片特征库中检索出与所述待检索图像相似的图片,得到图像检索结果。
这里,在计算到待检索图像与图片特征库中所有图片的相似度之后,根据相似度的大小进行排序,并将相似度最高的特征向量对应的图片输出给用户,该相似度最高的特征向量对应的图片为与待检索图像最相似的图片。当然,也可以将排序靠前的多个图片输出给用户,其可以根据实际情况进行选择。
图6示出了图像检索方法的流程示意图,如图6所示,待检索图像经过backbone(第一神经网络)得到图像特征,图像特征经过Aggregation Layer(第二神经网络)得到特征向量。进而利用该特征向量在图片特征库中进行检索,得到与该待检索图像相似的相似图片。
图7示出了图像检索的系统架构图,如图7所示,待检索图像经过后端接口(如RESTful API)的处理,作为图像特征提取模型的输入,经过图像特征模型得到待检索图像的特征向量后,利用该特征向量与图片特征库中的图片的特征向量进行相似度计算,从而获得与待检索图像相似的图片。其中,利用的检索算法可以是稀疏矩阵搜索算法。该图片特征库可以设置在本地服务器,也可以设置在云服务器上,如MySQL。
实施例三
根据本发明的实施例,还提供了一种存储介质,所述存储介质上存储有程序代码,所述程序代码被处理器执行时,实现如上述实施例任一项所述的图像特征提取模型的构建方法,和/或,实现如上述实施例中任一项所述的图像检索方法。
其中,该程序代码被处理器执行时,实现如实施例一所述的图像特征提取模型的构建方法,和/或,实现如实施例二所述的图像检索方法的步骤。即该存储介质中既可以只存储有实施例一所述的图像特征提取模型的构建方法的步骤的程序代码,或只存储有实现如实施例二所述的图像检索方法的步骤的程序代码,也可以同时存储着能够实现如实施例一所述的图像特征提取模型的构建的步骤的程序代码以及存储着实现如实施例二所述的图像检索方法的步骤的程序代码。
实施例四
根据本发明的实施例,还提供了一种电子设备,所述电子设备包括存储器、处理器,所述存储器上存储有可在所述处理器上运行的程序代码,所述程序代码被所述处理器执行时,实现如上述实施例任一项所述的图像特征提取模型的构建方法,和/或,实现如上述实施例中任一项所述的图像检索方法。
其中,该程序代码被处理器执行时,实现如实施例一所述的图像特征提取模型的构建方法,和/或,实现如实施例二所述的图像检索方法的步骤。即该存储介质中既可以只存储有实施例一所述的图像特征提取模型的构建方法的步骤的程序代码,或只存储有实现如实施例二所述的图像检索方法的步骤的程序代码,也可以同时存储着能够实现如实施例一所述的图像特征提取模型的构建的步骤的程序代码以及存储着实现如实施例二所述的图像检索方法的步骤的程序代码。
以上结合附图详细说明了本发明的技术方案,考虑到现有技术仅简单使用卷积神经网络提取特征又无法使类内间隔更紧凑,不利于图像特征,从而导致图像特征提取以及图像检索需要花费较多时间。本发明提供一种图像特征提取模型的构建方法、图像检索方法、存储介质以及电子设备,通过利用增强的神经网络结构和改进的损失函数对神经网络模型进行训练,使得图像特征提取模型能够更好地提取到主体目标降低背景信息的影响权重的图像特征,从而提高检索的准确率。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本发明实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台电子设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
虽然本发明所公开的实施方式如上,但所述的内容只是为了便于理解本发明而采用的实施方式,并非用以限定本发明。任何本发明所属技术领域内的技术人员,在不脱离本发明所公开的精神和范围的前提下,可以在实施的形式上及细节上作任何的修改与变化,但本发明的保护范围,仍须以所附的权利要求书所界定的范围为准。
Claims (10)
1.一种图像特征提取模型的构建方法,其特征在于,包括:
搭建神经网络模型,其中,所述神经网络模型至少包括第一神经网络以及第二神经网络,所述第一神经网络用于提取图像的图像特征,所述第二神经网络用于对所述第一神经网络提取到的图像特征进行特征嵌入处理,获得所述图像的特征向量;
获取用于训练的图片样本集;
利用所述图片样本集对所述神经网络模型进行训练,得到图像特征提取模型。
2.根据权利要求1所述的图像特征提取模型的构建方法,其特征在于,所述第二神经网络用于对所述第一神经网络提取到的图像特征进行特征嵌入处理,获得所述图像的特征向量,包括:
对所述图像特征中的每个单元进行N次方计算,获得新的图像特征;
对所述新的图像特征进行池化运算,获得池化后的图像特征;
对所述池化后的图像特征中的每个单元进行1/N次方计算,得到所述图像的特征向量;
其中,N为正整数。
3.根据权利要求1所述的图像特征提取模型的构建方法,其特征在于,所述图片样本集中包括不同类别的样本子集,每个样本子集中包括多张图片,且每张图片各自关联有一个标签值,该标签值用于表征该图片属于其所属类别的相似度。
4.根据权利要求3所述的图像特征提取模型的构建方法,其特征在于,利用所述图片样本集对所述神经网络模型进行训练,包括:
将所述图片样本集划分为若干个图片组,每个图片组包括参考样本、正样本以及负样本,其中,所述参考样本和所述正样本为从同一类别的样本子集中选取到的图片,所述负样本为从其它不同类别的样本子集中选取到的图片;
从若干个图片组中选择任意一个图片组作为所述神经网络模型的输入,获得该图片组中各个样本对应的特征向量;
以最小化该图片组中参考样本的特征向量与正样本的特征向量之间的距离,以及最大化该图片组中参考样本的特征向量与负样本的特征向量之间的距离为目标,对所述神经网络模型进行训练。
5.根据权利要求4所述的图像特征提取模型的构建方法,其特征在于,以最小化该图片组中参考样本的特征向量与正样本的特征向量之间的距离,以及最大化该图片组中参考样本的特征向量与负样本的特征向量之间的距离为目标,对所述神经网络模型进行训练,包括:
将该图片组中各个样本对应的特征向量作为AP-loss的输入,获得该图片组对应的loss值;
根据所述图片组中的参考样本对应的标签值与该图片组对应的loss值之间的差值,确定参考样本的表征分数;
对一次迭代过程中获得的所有参考样本的表征分数进行排序,获得排序结果;
对所述排序结果进行平均正确率运算,获得运算结果;
将所述运算结果作为所述神经网络模型的反向传播的输入,对所述神经网络模型中的权重进行更新,以获得所述图像特征提取模型。
6.一种图像检索方法,其特征在于,包括:
获取待检索图像;
将所述待检索图像作为利用如权利要求1至5中任一项所述的图像特征提取模型的构建方法构建的图像特征提取模型的输入,获得所述待检索图像的特征向量;
确定所述待检索图像的特征向量与预设的图片特征库中的图片的特征向量之间的相似度;
根据所述相似度从所述图片特征库中检索出与所述待检索图像相似的图片,得到图像检索结果。
7.根据权利要求6所述的图像检索方法,其特征在于,所述确定所述待检索图像的特征向量与预设的图片特征库中的图片的特征向量之间的相似度,包括:
通过计算所述待检索图像的特征向量与预设的图片特征库中的图片的特征向量之间的欧氏距离或余弦距离来确定相似度。
8.根据权利要求6或7所述的图像检索方法,其特征在于,通过以下步骤构建所述图片特征库,包括:
获取多张图片;
将每张图片分别作为所述图像特征提取模型的输入,获得每张图片所对应的特征向量;
存储每张图片以及该图片所对应的特征向量,以构建所述图片特征库。
9.一种存储介质,所述存储介质上存储有程序代码,其特征在于,所述程序代码被处理器执行时,实现如权利要求1至5中任一项所述的图像特征提取模型的构建方法,和/或,实现如权利要求6至8中任一项所述的图像检索方法。
10.一种电子设备,其特征在于,所述电子设备包括存储器、处理器,所述存储器上存储有可在所述处理器上运行的程序代码,所述程序代码被所述处理器执行时,实现如权利要求1至5中任一项所述的图像特征提取模型的构建方法,和/或,实现如权利要求6至8中任一项所述的图像检索方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010826153.7A CN111950728B (zh) | 2020-08-17 | 2020-08-17 | 图像特征提取模型的构建方法、图像检索方法及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010826153.7A CN111950728B (zh) | 2020-08-17 | 2020-08-17 | 图像特征提取模型的构建方法、图像检索方法及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111950728A true CN111950728A (zh) | 2020-11-17 |
CN111950728B CN111950728B (zh) | 2024-06-18 |
Family
ID=73342625
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010826153.7A Active CN111950728B (zh) | 2020-08-17 | 2020-08-17 | 图像特征提取模型的构建方法、图像检索方法及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111950728B (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112733863A (zh) * | 2021-01-07 | 2021-04-30 | 苏州浪潮智能科技有限公司 | 一种图像特征提取方法、装置、设备及存储介质 |
CN112766406A (zh) * | 2021-01-29 | 2021-05-07 | 北京达佳互联信息技术有限公司 | 物品图像的处理方法、装置、计算机设备及存储介质 |
CN113255838A (zh) * | 2021-06-29 | 2021-08-13 | 成都数之联科技有限公司 | 图像分类模型训练方法及系统及装置及介质及分类方法 |
CN113282777A (zh) * | 2021-04-20 | 2021-08-20 | 北京沃东天骏信息技术有限公司 | 一种模型训练方法、装置、电子设备及存储介质 |
CN113326864A (zh) * | 2021-04-06 | 2021-08-31 | 上海海洋大学 | 一种图像检索模型、训练方法 |
CN113807516A (zh) * | 2021-09-13 | 2021-12-17 | 长城计算机软件与系统有限公司 | 神经网络模型的训练方法及图像检索方法 |
CN113886520A (zh) * | 2021-08-26 | 2022-01-04 | 广东工业大学 | 一种基于图神经网络的代码检索方法、系统及计算机可读存储介质 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106250866A (zh) * | 2016-08-12 | 2016-12-21 | 广州视源电子科技股份有限公司 | 基于神经网络的图像特征提取建模、图像识别方法及装置 |
CN108416065A (zh) * | 2018-03-28 | 2018-08-17 | 复旦大学 | 基于层级神经网络的图像-句子描述生成系统及方法 |
CN110222560A (zh) * | 2019-04-25 | 2019-09-10 | 西北大学 | 一种嵌入相似性损失函数的文本人员搜索方法 |
CN110751285A (zh) * | 2018-07-23 | 2020-02-04 | 第四范式(北京)技术有限公司 | 神经网络模型的训练方法和系统以及预测方法和系统 |
CN110866140A (zh) * | 2019-11-26 | 2020-03-06 | 腾讯科技(深圳)有限公司 | 图像特征提取模型训练方法、图像搜索方法及计算机设备 |
US20200175062A1 (en) * | 2017-07-28 | 2020-06-04 | Hangzhou Hikvision Digital Technology Co., Ltd. | Image retrieval method and apparatus, and electronic device |
CN111242184A (zh) * | 2020-01-03 | 2020-06-05 | 支付宝(杭州)信息技术有限公司 | 图像特征提取模型的训练方法和图像检索方法 |
CN111310844A (zh) * | 2020-02-26 | 2020-06-19 | 广州华工邦元信息技术有限公司 | 车辆识别模型构建方法及装置、识别方法及装置 |
CN111401521A (zh) * | 2020-03-11 | 2020-07-10 | 北京迈格威科技有限公司 | 神经网络模型训练方法及装置、图像识别方法及装置 |
CN111476291A (zh) * | 2020-04-03 | 2020-07-31 | 南京星火技术有限公司 | 数据处理方法,装置及存储介质 |
-
2020
- 2020-08-17 CN CN202010826153.7A patent/CN111950728B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106250866A (zh) * | 2016-08-12 | 2016-12-21 | 广州视源电子科技股份有限公司 | 基于神经网络的图像特征提取建模、图像识别方法及装置 |
US20200175062A1 (en) * | 2017-07-28 | 2020-06-04 | Hangzhou Hikvision Digital Technology Co., Ltd. | Image retrieval method and apparatus, and electronic device |
CN108416065A (zh) * | 2018-03-28 | 2018-08-17 | 复旦大学 | 基于层级神经网络的图像-句子描述生成系统及方法 |
CN110751285A (zh) * | 2018-07-23 | 2020-02-04 | 第四范式(北京)技术有限公司 | 神经网络模型的训练方法和系统以及预测方法和系统 |
CN110222560A (zh) * | 2019-04-25 | 2019-09-10 | 西北大学 | 一种嵌入相似性损失函数的文本人员搜索方法 |
CN110866140A (zh) * | 2019-11-26 | 2020-03-06 | 腾讯科技(深圳)有限公司 | 图像特征提取模型训练方法、图像搜索方法及计算机设备 |
CN111242184A (zh) * | 2020-01-03 | 2020-06-05 | 支付宝(杭州)信息技术有限公司 | 图像特征提取模型的训练方法和图像检索方法 |
CN111310844A (zh) * | 2020-02-26 | 2020-06-19 | 广州华工邦元信息技术有限公司 | 车辆识别模型构建方法及装置、识别方法及装置 |
CN111401521A (zh) * | 2020-03-11 | 2020-07-10 | 北京迈格威科技有限公司 | 神经网络模型训练方法及装置、图像识别方法及装置 |
CN111476291A (zh) * | 2020-04-03 | 2020-07-31 | 南京星火技术有限公司 | 数据处理方法,装置及存储介质 |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112733863A (zh) * | 2021-01-07 | 2021-04-30 | 苏州浪潮智能科技有限公司 | 一种图像特征提取方法、装置、设备及存储介质 |
CN112733863B (zh) * | 2021-01-07 | 2022-06-07 | 苏州浪潮智能科技有限公司 | 一种图像特征提取方法、装置、设备及存储介质 |
CN112766406A (zh) * | 2021-01-29 | 2021-05-07 | 北京达佳互联信息技术有限公司 | 物品图像的处理方法、装置、计算机设备及存储介质 |
CN113326864A (zh) * | 2021-04-06 | 2021-08-31 | 上海海洋大学 | 一种图像检索模型、训练方法 |
CN113326864B (zh) * | 2021-04-06 | 2023-11-24 | 上海海洋大学 | 一种图像检索模型训练方法、装置及存储介质 |
CN113282777A (zh) * | 2021-04-20 | 2021-08-20 | 北京沃东天骏信息技术有限公司 | 一种模型训练方法、装置、电子设备及存储介质 |
CN113255838A (zh) * | 2021-06-29 | 2021-08-13 | 成都数之联科技有限公司 | 图像分类模型训练方法及系统及装置及介质及分类方法 |
CN113886520A (zh) * | 2021-08-26 | 2022-01-04 | 广东工业大学 | 一种基于图神经网络的代码检索方法、系统及计算机可读存储介质 |
CN113886520B (zh) * | 2021-08-26 | 2024-05-14 | 广东工业大学 | 一种基于图神经网络的代码检索方法、系统及计算机可读存储介质 |
CN113807516A (zh) * | 2021-09-13 | 2021-12-17 | 长城计算机软件与系统有限公司 | 神经网络模型的训练方法及图像检索方法 |
CN113807516B (zh) * | 2021-09-13 | 2024-05-14 | 新长城科技有限公司 | 神经网络模型的训练方法及图像检索方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111950728B (zh) | 2024-06-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111950728B (zh) | 图像特征提取模型的构建方法、图像检索方法及存储介质 | |
CN110059198B (zh) | 一种基于相似性保持的跨模态数据的离散哈希检索方法 | |
CN106202256B (zh) | 基于语义传播及混合多示例学习的Web图像检索方法 | |
CN112819023B (zh) | 样本集的获取方法、装置、计算机设备和存储介质 | |
CN110188223A (zh) | 图像处理方法、装置及计算机设备 | |
WO2018015848A2 (en) | Finding k extreme values in constant processing time | |
CN113127632A (zh) | 基于异质图的文本摘要方法及装置、存储介质和终端 | |
WO2018166273A1 (zh) | 高维图像特征匹配方法和装置 | |
CN112307239B (zh) | 一种图像检索方法、装置、介质和设备 | |
CN112507912B (zh) | 一种识别违规图片的方法及装置 | |
CN115482418B (zh) | 基于伪负标签的半监督模型训练方法、系统及应用 | |
CN113177141A (zh) | 基于语义嵌入软相似性的多标签视频哈希检索方法及设备 | |
CN111105013A (zh) | 对抗网络架构的优化方法、图像描述生成方法和系统 | |
CN114556364B (zh) | 用于执行神经网络架构搜索的计算机实现方法 | |
CN112818162A (zh) | 图像检索方法、装置、存储介质和电子设备 | |
CN112214623A (zh) | 一种面向图文样本的高效监督图嵌入跨媒体哈希检索方法 | |
CN111241310A (zh) | 一种深度跨模态哈希检索方法、设备及介质 | |
CN116795947A (zh) | 文档推荐方法、装置、电子设备及计算机可读存储介质 | |
CN115309865A (zh) | 基于双塔模型的交互式检索方法、装置、设备及存储介质 | |
CN111831847B (zh) | 相似图片集推荐方法及其系统 | |
CN115373697A (zh) | 数据处理方法和数据处理装置 | |
CN110909193B (zh) | 图像排序展示方法、系统、设备和存储介质 | |
JP6017277B2 (ja) | 特徴ベクトルの集合で表されるコンテンツ間の類似度を算出するプログラム、装置及び方法 | |
CN117009599A (zh) | 数据检索方法、装置、处理器及电子设备 | |
CN114780863B (zh) | 基于人工智能的项目推荐方法、装置、计算机设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |