CN112784087A - 图像检索方法、装置、计算机设备及存储介质 - Google Patents
图像检索方法、装置、计算机设备及存储介质 Download PDFInfo
- Publication number
- CN112784087A CN112784087A CN202110123122.XA CN202110123122A CN112784087A CN 112784087 A CN112784087 A CN 112784087A CN 202110123122 A CN202110123122 A CN 202110123122A CN 112784087 A CN112784087 A CN 112784087A
- Authority
- CN
- China
- Prior art keywords
- image
- clustering
- cluster
- retrieval
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/55—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/51—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Software Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Probability & Statistics with Applications (AREA)
- Evolutionary Biology (AREA)
- Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Biomedical Technology (AREA)
- Databases & Information Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及人工智能技术领域,尤其涉及一种图像检索方法、装置、设备及存储介质。该图像检索方法包括获取待识别图像;将所述待识别图像输入至预先训练好的图像聚类模型中,预测所述待识别图像对应的目标类簇标识;其中,所述图像聚类模型将预创建的图像库划分为多个预划分类簇;从所述多个预划分类簇中,获取所述目标类簇标识对应的预划分类簇作为目标检索类簇;其中,所述目标检索簇包括至少一个待匹配图像;基于所述目标检索簇对所述待识别图像进行图像检索。该方法可有效保证聚类精度且可有效避免传统图像检索导致的计算量大以及耗时的问题。
Description
技术领域
本发明涉及人工智能技术领域,尤其涉及一种图像检索方法、装置、计算机设备及存储介质。
背景技术
人脸识别是基于人的脸部特征信息进行身份识别的一种生物识别技术。人脸识别如今已经被应用于各个生活场景中,比如门禁,闸机,监控等等。人脸识别的主要目标是把输入的人脸图像从数据库中检索到匹配的人脸特征进行比对,从而进行人脸识别。
人脸检索是人脸识别环节中的一个重要环节。人脸检索是将人脸识别模型提取的人脸特征,与数据库里预存储的其他人脸特征进行逐一匹配,得到与当前人脸特征相似度最高的人脸特征。在小规模的底库进行人脸检索的时往往使用暴力比对方式,即数据库中的每个人脸特征均直接与当前特征进行特征相似度计算。但当底库规模较大时,暴力比对方式所带来的计算量和耗时则变得越发显著。
为了减少人脸检索比对过程中的计算量,对数据库中的人脸数据建立聚类索引是一种可行的方法。通过聚类索引,可以有效减少检索过程中的需要比对的特征数量,从而缩短检索时间,提高效率。
现有的人脸聚类检索通常是在提取人脸特征之后,采用传统聚类方法(如k-means、DBSCAN)对特征进行聚类。后续进行人脸识别时,在传统聚类的基础上,对于对应样本所邻近的聚类簇进行暴力比对。该种图像检索方式在较小规模或单一应用场景的情况下可以在一定程度上加快检索速度,但是对于亿级数据库来说,该种检索方式的计算量较大,且无法实现在计算量下降的同时保证聚类精度。
发明内容
本发明实施例提供一种图像检索方法、装置、计算机设备及存储介质,以解决目前传统的人脸检索方式计算量大,且无法实现在计算量下降的同时保证聚类精度的问题。
一种图像检索方法,包括:
获取待识别图像;
将所述待识别图像输入至预先训练好的图像聚类模型中,预测所述待识别图像对应的目标类簇标识;其中,所述图像聚类模型将预创建的图像库划分为多个预划分类簇;
从所述多个预划分类簇中,获取所述目标类簇标识对应的预划分类簇作为目标检索类簇;其中,所述目标检索簇包括至少一个待匹配图像;
基于所述目标检索簇对所述待识别图像进行图像检索。
一种图像检索装置,包括:
图像获取模块,用于获取待识别图像;
预测模块,用于将所述待识别图像输入至预先训练好的图像聚类模型中,预测所述待识别图像对应的目标类簇标识;其中,所述图像聚类模型将预创建的图像库划分为多个预划分类簇;
目标检索簇确定模块,用于从所述多个预划分类簇中,获取所述目标类簇标识对应的预划分类簇作为目标检索类簇;其中,所述目标检索簇包括至少一个待匹配图像;
图像检索模块,用于基于所述目标检索簇对所述待识别图像进行图像检索。
一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述图像检索方法的步骤。
一种计算机存储介质,所述计算机存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述图像检索方法的步骤。
上述图像检索方法、装置、计算机设备及存储介质中,通过获取待识别图像,以便将待识别图像输入至预先训练好的图像聚类模型中,直接预测出待识别图像在预创建的图像库中最邻近样本对应的目标类簇标识,与传统仅按照预先通过聚类算法对图像库中的存储的图像进行聚类的聚类结果进行图像检索相比,可有效保证聚类精度。然后,从图像库中存储的多个预划分类簇中,获取目标类簇标识对应的预划分类簇作为目标检索类簇,以便基于目标检索簇对待识别图像进行图像检索,保证图像检索效率,且可有效避免传统通过聚类结果与待识别图像的图像特征进行比对进而确定目标类簇的方式所导致的计算量大以及耗时的问题。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一实施例中图像检索方法的一应用环境示意图;
图2是本发明一实施例中图像检索方法的一流程图;
图3是图2中步骤S202的一具体流程图;
图4是本发明一实施例中图像检索方法的一流程图;
图5是本发明一实施例中图像检索方法的一流程图;
图6是本发明一实施例中图像检索装置的一示意图;
图7是本发明一实施例中计算机设备的一示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
该图像检索方法可应用在如图1的应用环境中,其中,计算机设备通过网络与服务器进行通信。计算机设备可以但不限于各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备。服务器可以用独立的服务器来实现。
在一实施例中,如图2所示,提供一种图像检索方法,以该方法应用在图1中的服务器为例进行说明,包括如下步骤:
S201:获取待识别图像。
其中,本方法可应用在图像识别的应用场景下,可在图像识别过程中快速检索到与待识别图像的图像特征最邻近的多个特征,以便进行特征匹配,识别图像中的实体。于本实施例中,该待识别图像可为人脸图像。
S202:将待识别图像输入至预先训练好的图像聚类模型中,预测待识别图像对应的目标类簇标识;其中,图像聚类模型将预创建的图像库划分为多个预划分类簇。
其中,图像聚类模型是用于预测待识别图像与预划分类簇的相似概率。该图像聚类模型的模型输入为待识别图像,模型输出为类簇标识。该类簇标识用于指示预划分类簇。该图像聚类模型包括特征提取层以及与其连接的特征分类层,如softmax层。
具体地,该图像聚类模型在训练过程中采用半监督学习的方式训练模型,即通过不断对图像库中样本提取特征并对该特征进行聚类,以根据聚类结果标注训练图像特征,然后将该训练图像特征输入至特征分类层中进行预测,并根据预测输出与标注的真实标签计算模型损失,不断迭代训练,且在迭代训练时,每轮训练中的聚类过程中所需的聚类中心均采用上一轮训练所得到的聚类中,以不断更新优化聚类中心,最终将图像库划分为多个预划分类簇,每一预划分类簇对应一索引标识(也即类簇标识),以便根据该索引标识从图像库中定位待检索类簇,进而根据该待检索类簇进行特征匹配。
可以理解地是,本实施例中通过将待识别图像输入至图像聚类模型中,以直接预测出该待识别图像回应的目标类簇标识,无需每次在确定聚类簇时,均需要计算待识别图像与每一预先聚类好的类簇之间的距离,可有效减少图像检索过程中的计算量,保证检索效率。并且,该图像聚类模型是采用深层神经网络,提取图像特征信息,并训练优化网络对于图像特征信息的权重等参数,可有效提升聚类精度。
进一步地,该图像聚类模型中由于内置特征提取层,可在预测类簇标识时,无需预先提取图像特征,实现端到端的聚类簇预测。
S203:从多个预划分类簇中,获取目标类簇标识对应的预划分类簇作为目标检索类簇;其中,目标检索簇包括至少一个待匹配图像。
具体地,按照目标类簇标识,从多个预划分类簇中读取与目标类簇标识对应的预划分类簇作为目标检索类簇。该目标检索类簇中包括多个待匹配图像,用于与待识别图像对应的图像特征进行特征匹配,进而实现图像识别。
S204:基于目标检索簇对待识别图像进行图像检索。
具体地,基于目标检索簇对待识别图像进行图像检索,即通过将提取到的待识别图像的图像特征与目标检索类簇中的多个待匹配图像进行逐一匹配,即可得到对应的匹配结果即图像识别结果。
本实施例中,通过获取待识别图像,以便将待识别图像输入至预先训练好的图像聚类模型中,直接预测出待识别图像在预创建的图像库中最邻近样本对应的目标类簇标识,与传统仅按照预先通过聚类算法对图像库中的存储的图像进行聚类的聚类结果进行图像检索相比,可有效保证聚类精度。然后,从图像库中存储的多个预划分类簇中,获取目标类簇标识对应的预划分类簇作为目标检索类簇,以便基于目标检索簇对待识别图像进行图像检索,保证图像检索效率,且可有效避免传统通过聚类结果与待识别图像的图像特征进行比对进而确定目标类簇的方式所导致的计算量大以及耗时的问题。
在一实施例中,如图3所示,步骤202中,即将待识别图像输入至预先训练好的图像聚类模型中,预测待识别图像对应的目标类簇标识,具体包括如下步骤:
S301:将待识别图像输入至预先训练好的图像聚类模型中进行预测,得到模型输出结果;其中,模型输出结果包括多个概率值;概率值用于描述待识别图像与预划分类簇的匹配度。
具体地,将待识别图像输入至预先训练好的图像聚类模型中进行特征提取,然后将提取到的图像特征输入至特征分类层中进行特征分类,得到模型输出结果,该模型输出为一N维的softmax向量,该向量中的每一分量对应一概率值,该概率值用于描述待识别图像所提取的图像特征与图像库中的预划分类簇的匹配度。
S302:按照预设筛选规则,从多个概率值中选取若干个概率值对应的索引标识作为目标类簇标识;其中,索引标识用于指示预划分类簇。
由于图像聚类模型的输出为一个N维的softmax向量,故对于簇的搜索量k,可按照预设筛选规则动态选择,即从多个概率值中选取若干个概率值对应的索引标识作为目标类簇标识。其中,预设筛选规则可为选取概率最大或大于预设阈值的概率值所对应的索引标识作为目标类簇标识,此处不做限定。
在一实施例中,步骤S302具体为:对多个概率值进行排序,并将排在前N位的概率值且N个概率值的累加和大于预设聚类精度的概率值所对应的索引标识作为目标类簇标识。
具体地,为进一步保证聚类精度,可从softmax向量中的全局角度选取所需的目标类簇标识,即对多个概率值进行排序,并将排在前N位的概率值和/或N个概率值的累加和大于预设聚类精度的概率值对应的索引标识作为目标类簇标识,以尽可能保证聚类精度,而不是单一从大于预设阈值或选取概率值最大的索引标识作为目标类簇标识,进而保证后续图像识别的准确率。
在一实施例中,如图4所示,该图像检索方法还包括如下步骤:
S401:创建原始聚类模型;其中,原始聚类模型包括特征提取层和特征分类层。
其中,该原始聚类模型的模型结构包括特征提取层和特征分类层。具体地,原始聚类模型是将一预先训练好的图像特征提取模型作为特征提取层,并将该特征提取层的最后接入softmax分类层,用于对输入的图像特征进行分类,预测聚类簇标识。
S402:从图像库中随机选取若干用户,并获取每一用户对应的多个训练图像。
具体地,图像库中存储有不同用户对应的多渠道采集的训练图像如,人脸图像,通过从图像库中,随机选取若干用户,并获取每一用户对应的多个训练图像。其中,在获取每一用户对应的多个训练图像时,一般获取2-3张,且不同用户所选取的训练图像的数量保持一致,以避免各用户的训练图像数量不均衡,影响模型中的聚类结果。
S403:将训练图像输入至特征提取层,提取训练图像的训练图像特征。
具体地,该特征提取层实质为一预训练的图像特征提取模型,该人脸特征模型提取模型的输入为图像,输出为经过深度神经网络中的各层的非线性变换所提取的图像特征。通过复用该图像特征提取模型作为图像聚类模型的模型结构,可使图像聚类模型训练的主要目标为特征分类,预测类簇标识的部分。
S404:对多个用户的训练图像特征进行聚类,得到聚类结果。
S405:根据聚类结果对训练图像特征进行标注,并将标注后的训练图像特征输入至特征分类层进行分类预测,输出预测类簇标识。
具体地,可采用聚类算法对多个用户的训练图像特征进行聚类,得到聚类结果,该聚类结果包括多个携带类簇标识的聚类簇以及每一类簇对应的聚类中心向量(该聚类中心向量为通过对每一类簇对应的向量取均值并归一化处理后的结果),以根据该聚类结果对训练图像特征进行标注,即标注后的结果为:(训练图像特征-类簇标识),并将训练图像特征作为softmax层的输入,以通过softmax层对该训练图像特征进行分类,以通过半监督学习的方式训练模型,得到模型输出的预测类簇标识,并将该预测输出与预先标注的类簇标识代入损失函数中计算模型损失。
S406:基于预测类簇标识,计算模型损失,并根据模型损失更新原始聚类模型,迭代训练,直至模型收敛,得到图像聚类模型。
具体地,通过原始聚类模型对应的模型更新算法对原始聚类模型中的每一神经元的模型参数(如模型权值)求偏导即可优化原始聚类模型中每一神经元的模型参数,当原始聚类模型的预测准确率达到预设阈值即模型收敛,即可得到图像聚类模型。
具体地,本实施例中可采用交叉熵(cross-entropy)作为损失函数,计算模型损失,该损失函数的数学表示形如由以上公式可知,权重学习的速度受到σ(z)-y的影响,即误差与梯度成正比,误差越大,梯度越大,学习速率就越快,且可有效避免二次代价函数中的误差受σ'(z)的影响,模型训练的速率不稳定的问题。
可以理解地是,该图像聚类模型为一深层神经网络结构,可通过利用该深层神经网络,在训练过程中学习到区分人脸大致类别的有效信息,并忽略人脸局部的细节信息,有效地将人脸图像划分成N个类簇,可在保证检索效率的情况下,减少聚类精度的损失。
在一实施例中,如图5所示,步骤S404中,即对多个用户的训练图像特征进行聚类,得到聚类结果,具体包括如下步骤:
S501:将上一轮训练输出的聚类结果对应的聚类中心作为本轮训练的初始聚类中心。
S502:根据初始聚类中心,对多个用户的训练图像特征进行聚类,得到聚类结果。
具体地,在迭代训练的过程中,每轮训练的聚类算法沿用一场算法的思想,即继承上一轮训练输出的聚类中心作为本轮训练的初始聚类中心,加快学习速率,通过重复执行步骤S402-S406,不断迭代更新聚类中心,使模型学习到不同聚类结果所标注的训练图像特征,保证模型的泛化性。
可以理解地是,在第一轮训练时,可如图4所示,步骤S404中可通过预设的聚类中心作为初始聚类中心进行聚类,在后续2-N轮的迭代训练过程中,如图5所示,步骤S404可继承上一轮训练所输出的聚类中心进行聚类即可。
在一实施例中,对多个用户的训练图像特征进行聚类,得到聚类结果,具体为:采用球面K均值聚类算法,对多个用户的训练图像特征进行聚类,得到聚类结果。
具体地,本实施例中采用球面K均值聚类算法(spherical k-means),对多个用户的训练图像特征进行聚类,得到聚类结果。该聚类算法是针对归一化向量进行聚类的一种k-means聚类算法的变种。
该算法会将聚类中心向量以及图像特征向量进行归一化,该归一化后的归一化向量分布在一个高维的超球面上,使得图像特征向量到聚类中心的距离可等价二者之间的cosine距离,相比于传统的K均值聚类算法来说,可有效保证特征相似度评估的准确性。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
在一实施例中,提供一种图像检索装置,该图像检索装置与上述实施例中图像检索方法一一对应。如图6所示,该图像检索装置包括图像获取模块10、预测模块20、目标检索簇确定模块30和图像检索模块40。各功能模块详细说明如下:
图像获取模块10,用于获取待识别图像。
预测模块20,用于将待识别图像输入至预先训练好的图像聚类模型中,预测待识别图像对应的目标类簇标识;其中,图像聚类模型将预创建的图像库划分为多个预划分类簇。
目标检索簇确定模块30,用于从多个预划分类簇中,获取目标类簇标识对应的预划分类簇作为目标检索类簇;其中,目标检索簇包括至少一个待匹配图像。
图像检索模块40,用于基于目标检索簇对待识别图像进行图像检索。
具体地,预测模块包括预测单元和筛选单元。
预测单元,用于将待识别图像输入至预先训练好的图像聚类模型中,得到模型输出结果;其中,模型输出结果包括多个概率值;概率值用于描述待识别图像与预划分类簇的匹配度。
筛选单元,用于按照预设筛选规则,从多个概率值中选取若干个概率值对应的索引标识作为目标类簇标识;其中,索引标识用于指示预划分类簇。
具体地,筛选单元具体为:对多个概率值进行排序,并将排在前N位且N个概率值的累加和大于预设聚类精度的概率值对应的索引标识作为目标类簇标识。
具体地,该图像检索装置还包括模型创建模块、训练数据获取模块、特征提取模块、聚类模块、标注模块以及模型更新模块。
模型创建模块,用于创建原始聚类模型;其中,原始聚类模型包括特征提取层和特征分类层。
训练数据获取模块,用于从图像库中,随机选取若干用户,并获取每一用户对应的多个训练图像。
特征提取模块,用于将训练图像输入至特征提取层,提取训练图像的训练图像特征。
聚类模块,用于对多个用户的训练图像特征进行聚类,得到聚类结果。
标注模块,用于根据聚类结果对训练图像特征进行标注,并将标注后的训练图像特征输入至特征分类层进行分类预测,输出预测类簇标识。
模型更新模块,用于基于预测类簇标识,计算模型损失,并根据模型损失更新优化原始聚类模型,得到图像聚类模型。
具体地,聚类模块包括聚类中心继承单元和聚类单元。
聚类中心继承单元,用于将上一轮训练输出的聚类结果对应的聚类中心作为本轮训练的初始聚类中心。
聚类单元,用于根据初始聚类中心,对多个用户的训练图像特征进行聚类,得到聚类结果。
关于图像检索装置的具体限定可以参见上文中对于图像检索方法的限定,在此不再赘述。上述图像检索装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图7所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括计算机存储介质、内存储器。该计算机存储介质存储有操作系统、计算机程序和数据库。该内存储器为计算机存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储执行图像检索方法过程中生成或获取的数据,如图像识别模型。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种图像检索方法。
在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述实施例中的图像检索方法的步骤,例如图2所示的步骤S201-S204,或者图3至图5中所示的步骤。或者,处理器执行计算机程序时实现图像检索装置这一实施例中的各模块/单元的功能,例如图6所示的各模块/单元的功能,为避免重复,这里不再赘述。
在一实施例中,提供一计算机存储介质,该计算机存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述实施例中图像检索方法的步骤,例如图2所示的步骤S201-S204,或者图3至图5中所示的步骤,为避免重复,这里不再赘述。或者,该计算机程序被处理器执行时实现上述图像检索装置这一实施例中的各模块/单元的功能,例如图6所示的各模块/单元的功能,为避免重复,这里不再赘述。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。
Claims (10)
1.一种图像检索方法,其特征在于,包括:
获取待识别图像;
将所述待识别图像输入至预先训练好的图像聚类模型中,预测所述待识别图像对应的目标类簇标识;其中,所述图像聚类模型将预创建的图像库划分为多个预划分类簇;
从所述多个预划分类簇中,获取所述目标类簇标识对应的预划分类簇作为目标检索类簇;其中,所述目标检索簇包括至少一个待匹配图像;
基于所述目标检索簇对所述待识别图像进行图像检索。
2.如权利要求1所述图像检索方法,其特征在于,所述将所述待识别图像输入至预先训练好的图像聚类模型中,预测所述待识别图像对应的目标类簇标识,包括:
将所述待识别图像输入至预先训练好的图像聚类模型中进行预测,得到模型输出结果;其中,所述模型输出结果包括多个概率值;所述概率值用于描述所述待识别图像与所述预划分类簇的匹配度;
按照预设筛选规则,从所述多个概率值中选取若干个概率值对应的索引标识作为所述目标类簇标识;其中,所述索引标识用于指示所述预划分类簇。
3.如权利要求2所述图像检索方法,其特征在于,所述按照预设筛选规则,从所述多个概率值中选取若干个概率值对应的索引标识作为所述目标类簇标识,包括:
对所述多个概率值进行排序,并将排在前N位且所述N个概率值的累加和大于预设聚类精度的概率值所对应的索引标识作为所述目标类簇标识。
4.如权利要求1所述图像检索方法,其特征在于,包括:
创建原始聚类模型;其中,所述原始聚类模型包括特征提取层和特征分类层;
从所述图像库中随机选取若干用户,并获取每一用户对应的多个训练图像;
将所述训练图像输入至所述特征提取层,提取所述训练图像的训练图像特征;
对多个用户的训练图像特征进行聚类,得到聚类结果;
根据所述聚类结果对所述训练图像特征进行标注,并将标注后的训练图像特征输入至所述特征分类层进行分类预测,输出预测类簇标识;
基于所述预测类簇标识,计算模型损失,并根据所述模型损失更新优化所述原始聚类模型,得到所述图像聚类模型。
5.如权利要求4所述图像检索方法,其特征在于,所述对多个用户的训练图像特征进行聚类,得到聚类结果,包括:
将上一轮训练输出的聚类结果对应的聚类中心作为本轮训练的初始聚类中心;
根据所述初始聚类中心,对多个用户的训练图像特征进行聚类,得到聚类结果。
6.如权利要求4所述图像检索方法,其特征在于,所述对多个用户的训练图像特征进行聚类,得到聚类结果,包括:
采用球面K均值聚类算法,对多个用户的训练图像特征进行聚类,得到聚类结果。
7.一种图像检索装置,其特征在于,包括:
图像获取模块,用于获取待识别图像;
预测模块,用于将所述待识别图像输入至预先训练好的图像聚类模型中,预测所述待识别图像对应的目标类簇标识;其中,所述图像聚类模型将预创建的图像库划分为多个预划分类簇;
目标检索簇确定模块,用于从所述多个预划分类簇中,获取所述目标类簇标识对应的预划分类簇作为目标检索类簇;其中,所述目标检索簇包括至少一个待匹配图像;
图像检索模块,用于基于所述目标检索簇对所述待识别图像进行图像检索。
8.如权利要求7所述的图像检索装置,其特征在于,所述预测模块包括:
预测单元,用于将所述待识别图像输入至预先训练好的图像聚类模型中,得到模型输出结果;其中,所述模型输出结果包括多个概率值;所述概率值用于描述所述待识别图像与所述预划分类簇的匹配度;
筛选单元,用于按照预设筛选规则,从所述多个概率值中选取若干个概率值对应的索引标识作为所述目标类簇标识;其中,所述索引标识用于指示所述预划分类簇。
9.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述图像检索方法的步骤。
10.一种计算机存储介质,所述计算机存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述图像检索方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110123122.XA CN112784087A (zh) | 2021-01-29 | 2021-01-29 | 图像检索方法、装置、计算机设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110123122.XA CN112784087A (zh) | 2021-01-29 | 2021-01-29 | 图像检索方法、装置、计算机设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112784087A true CN112784087A (zh) | 2021-05-11 |
Family
ID=75759614
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110123122.XA Pending CN112784087A (zh) | 2021-01-29 | 2021-01-29 | 图像检索方法、装置、计算机设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112784087A (zh) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113344132A (zh) * | 2021-06-30 | 2021-09-03 | 成都商汤科技有限公司 | 身份识别方法、系统、装置、计算机设备及存储介质 |
CN113408530A (zh) * | 2021-07-16 | 2021-09-17 | 北京百度网讯科技有限公司 | 一种图像识别方法、装置、设备以及存储介质 |
CN113468365A (zh) * | 2021-09-01 | 2021-10-01 | 北京达佳互联信息技术有限公司 | 图像类别识别模型的训练方法、图像检索方法及装置 |
CN113553483A (zh) * | 2021-07-02 | 2021-10-26 | 广联达科技股份有限公司 | 构件检索方法、装置、电子设备及可读存储介质 |
CN113590609A (zh) * | 2021-06-22 | 2021-11-02 | 北京旷视科技有限公司 | 数据分库方法及装置、存储介质及电子设备 |
CN114461837A (zh) * | 2022-02-16 | 2022-05-10 | 北京百度网讯科技有限公司 | 一种图像处理方法、装置及电子设备 |
CN114676279A (zh) * | 2022-05-25 | 2022-06-28 | 腾讯科技(深圳)有限公司 | 图像检索方法、装置、设备及计算机可读存储介质 |
CN114741544A (zh) * | 2022-04-29 | 2022-07-12 | 北京百度网讯科技有限公司 | 图像检索方法、检索库构建方法、装置、电子设备及介质 |
WO2023154435A3 (en) * | 2022-02-10 | 2023-09-21 | Clarifai, Inc. | Automatic unstructured knowledge cascade visual search |
CN116881485A (zh) * | 2023-06-19 | 2023-10-13 | 北京百度网讯科技有限公司 | 生成图像检索索引的方法及装置、电子设备和介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105354307A (zh) * | 2015-11-06 | 2016-02-24 | 腾讯科技(深圳)有限公司 | 一种图像内容识别方法及装置 |
US20190108411A1 (en) * | 2017-10-11 | 2019-04-11 | Alibaba Group Holding Limited | Image processing method and processing device |
CN110297935A (zh) * | 2019-06-28 | 2019-10-01 | 京东数字科技控股有限公司 | 图像检索方法、装置、介质及电子设备 |
CN110569793A (zh) * | 2019-09-09 | 2019-12-13 | 西南交通大学 | 一种无监督相似性判别学习的目标跟踪方法 |
-
2021
- 2021-01-29 CN CN202110123122.XA patent/CN112784087A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105354307A (zh) * | 2015-11-06 | 2016-02-24 | 腾讯科技(深圳)有限公司 | 一种图像内容识别方法及装置 |
US20190108411A1 (en) * | 2017-10-11 | 2019-04-11 | Alibaba Group Holding Limited | Image processing method and processing device |
CN110297935A (zh) * | 2019-06-28 | 2019-10-01 | 京东数字科技控股有限公司 | 图像检索方法、装置、介质及电子设备 |
CN110569793A (zh) * | 2019-09-09 | 2019-12-13 | 西南交通大学 | 一种无监督相似性判别学习的目标跟踪方法 |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113590609A (zh) * | 2021-06-22 | 2021-11-02 | 北京旷视科技有限公司 | 数据分库方法及装置、存储介质及电子设备 |
CN113344132A (zh) * | 2021-06-30 | 2021-09-03 | 成都商汤科技有限公司 | 身份识别方法、系统、装置、计算机设备及存储介质 |
CN113553483A (zh) * | 2021-07-02 | 2021-10-26 | 广联达科技股份有限公司 | 构件检索方法、装置、电子设备及可读存储介质 |
CN113408530B (zh) * | 2021-07-16 | 2022-05-13 | 北京百度网讯科技有限公司 | 一种图像识别方法、装置、设备以及存储介质 |
CN113408530A (zh) * | 2021-07-16 | 2021-09-17 | 北京百度网讯科技有限公司 | 一种图像识别方法、装置、设备以及存储介质 |
CN113468365A (zh) * | 2021-09-01 | 2021-10-01 | 北京达佳互联信息技术有限公司 | 图像类别识别模型的训练方法、图像检索方法及装置 |
WO2023154435A3 (en) * | 2022-02-10 | 2023-09-21 | Clarifai, Inc. | Automatic unstructured knowledge cascade visual search |
US11835995B2 (en) | 2022-02-10 | 2023-12-05 | Clarifai, Inc. | Automatic unstructured knowledge cascade visual search |
CN114461837A (zh) * | 2022-02-16 | 2022-05-10 | 北京百度网讯科技有限公司 | 一种图像处理方法、装置及电子设备 |
CN114741544A (zh) * | 2022-04-29 | 2022-07-12 | 北京百度网讯科技有限公司 | 图像检索方法、检索库构建方法、装置、电子设备及介质 |
CN114741544B (zh) * | 2022-04-29 | 2023-02-07 | 北京百度网讯科技有限公司 | 图像检索方法、检索库构建方法、装置、电子设备及介质 |
CN114676279A (zh) * | 2022-05-25 | 2022-06-28 | 腾讯科技(深圳)有限公司 | 图像检索方法、装置、设备及计算机可读存储介质 |
CN116881485A (zh) * | 2023-06-19 | 2023-10-13 | 北京百度网讯科技有限公司 | 生成图像检索索引的方法及装置、电子设备和介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112784087A (zh) | 图像检索方法、装置、计算机设备及存储介质 | |
Wu et al. | Unsupervised feature learning via non-parametric instance discrimination | |
CN110021439B (zh) | 基于机器学习的医疗数据分类方法、装置和计算机设备 | |
CN112949780A (zh) | 特征模型训练方法、装置、设备及存储介质 | |
Cardoso et al. | Weightless neural networks for open set recognition | |
CN111860674A (zh) | 样本类别识别方法、装置、计算机设备及存储介质 | |
CN111461637A (zh) | 简历筛选方法、装置、计算机设备和存储介质 | |
CN111898758A (zh) | 一种用户异常行为识别方法、装置及计算机可读存储介质 | |
US11610060B2 (en) | Automatic lexical sememe prediction system using lexical dictionaries | |
CN112926654A (zh) | 预标注模型训练、证件预标注方法、装置、设备及介质 | |
CN112070058A (zh) | 人脸面部复合情感表情识别方法及系统 | |
Chen et al. | Continuous learning for android malware detection | |
De Rosa et al. | Online open world recognition | |
CN110674636A (zh) | 一种用电行为分析方法 | |
Gao et al. | Adversarial mobility learning for human trajectory classification | |
CN115409111A (zh) | 命名实体识别模型的训练方法和命名实体识别方法 | |
CN110929724A (zh) | 字符识别方法、装置、计算机设备和存储介质 | |
CN112836753B (zh) | 用于域自适应学习的方法、装置、设备、介质和产品 | |
CN111401440B (zh) | 目标分类识别方法、装置、计算机设备及存储介质 | |
CN111783088B (zh) | 一种恶意代码家族聚类方法、装置和计算机设备 | |
Susan et al. | Smaller feature subset selection for real-world datasets using a new mutual information with Gaussian gain | |
CN113077015B (zh) | 样本选择方法、装置、计算机设备及存储介质 | |
CN115374278A (zh) | 文本处理模型蒸馏方法、装置、计算机设备及介质 | |
Carreño et al. | SNDProb: A probabilistic approach for streaming novelty detection | |
CN113627514A (zh) | 知识图谱的数据处理方法、装置、电子设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |