CN111680183A - 对象检索方法及装置、存储介质及电子设备 - Google Patents
对象检索方法及装置、存储介质及电子设备 Download PDFInfo
- Publication number
- CN111680183A CN111680183A CN202010809857.3A CN202010809857A CN111680183A CN 111680183 A CN111680183 A CN 111680183A CN 202010809857 A CN202010809857 A CN 202010809857A CN 111680183 A CN111680183 A CN 111680183A
- Authority
- CN
- China
- Prior art keywords
- images
- retrieval
- features
- image
- similarity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Library & Information Science (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Multimedia (AREA)
- Life Sciences & Earth Sciences (AREA)
- Databases & Information Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Processing Or Creating Images (AREA)
Abstract
本申请涉及图像检索技术领域,提供一种对象检索方法及装置、存储介质及电子设备。其中,对象检索方法包括:获取待检索图像,并利用神经网络模型提取出待检索图像的特征;计算待检索图像的特征与对象库中的每张图像的特征之间的相似度,输出其中相似度最大的多张图像;迭代执行重检索流程,直至满足检索结束条件,输出获得的目标图像;重检索流程包括:获取人工从相似度最大的多张图像中筛选出的至少一张目标图像;根据已获得的目标图像的特征确定重检索特征;计算重检索特征与对象库中的图像的特征之间的相似度,输出其中相似度最大的多张图像。通过该方法获得的检索结果准确率非常高,并且该方法也不会给工作人员带来太大的作业压力。
Description
技术领域
本发明涉及图像检索技术领域,具体而言,涉及一种对象检索方法及装置、存储介质及电子设备。
背景技术
近几年视频结构化技术开始大规模地应用,该技术通过对原始视频进行智能分析,提取出视频中出现的每个对象(如行人、车辆、动物等)的截图和属性信息并存入数据库。其中,基于视频结构化数据的以图搜图是最常见的应用之一。例如,以某个嫌疑人的图像作为待检索图像,在行人库里找出该嫌疑人在多个摄像头下出现的截图。
在现有方法中,一般通过预训练的神经网络提取待检索图像和行人库中的图像的特征,然后通过特征比对获得检索结果。然而,由于拍摄场景的复杂性以及现有深度学习算法本身的局限,导致检索结果的准确率不高。
发明内容
本申请实施例的目的在于提供一种对象检索方法及装置、存储介质及电子设备,以改善上述技术问题。
为实现上述目的,本申请提供如下技术方案:
第一方面,本申请实施例提供一种对象检索方法,包括:获取待检索图像,并利用神经网络模型提取出所述待检索图像的特征;计算所述待检索图像的特征与对象库中的每张图像的特征之间的相似度,输出其中相似度最大的多张图像;迭代执行重检索流程,直至满足检索结束条件,输出经所述重检索流程获得的目标图像;其中,所述重检索流程包括:获取人工从相似度最大的多张图像中筛选出的至少一张目标图像,所述目标图像为与所述待检索图像包含有同一对象的图像;根据已获得的目标图像的特征确定重检索特征;计算所述重检索特征与所述对象库中的图像的特征之间的相似度,输出其中相似度最大的多张图像。
上述方案在进行对象检索时,首先通过计算特征相似度从对象库中初步筛选出和待检索图像相似的图像,然后从初步筛选出的图像中进一步通过人工方式筛选出目标图像,最后再基于目标图像的特征进行迭代式检索,直至获得最终的检索结果(即满足检索终止条件时得到的所有目标图像)。
该方案的优势在于:其一,所有的检索结果都是经过人工确认的,准确率非常高;其二,人工筛选是在机器筛选(即利用特征相似度进行初筛)的基础上进行的,而非在整个对象库中进行,其筛选范围有限,不会给工作人员带来太大的作业压力;其三,重检索特征是根据人工确认为正确的检索结果(即目标图像)所具有的特征得到的,因此基于重检索特征进行迭代式检索,能够检索到较为准确的结果,这也有利于进一步缓解人工筛选的压力。
在第一方面的一种实现方式中,所述根据已获得的目标图像的特征确定重检索特征,包括:将本轮迭代筛选出的所述至少一张目标图像的特征的均值确定为所述重检索特征,或者,将本轮迭代筛选出的所述至少一张目标图像的特征以及之前获得的目标图像的特征的均值确定为所述重检索特征。
在上述实现方式中,通过计算目标图像的特征均值得到重检索特征,相当于对正确的检索结果所具有的特征进行了统计,从而基于此重检索特征进行迭代式检索,得到正确的检索结果的可能性更高。
在第一方面的一种实现方式中,所述根据已获得的目标图像的特征确定重检索特征,包括:从已获得的目标图像中选择一张其特征尚未被用于重检索的目标图像,并将选择出的目标图像的特征确定为所述重检索特征。
在上述实现方式中,每轮迭代只选择一张目标图像的特征作为重检索特征进行对象检索,由于目标图像的特征是构建对象库时就已经提取的,因此该实现方式下获得重检索特征无需进行计算,非常简单。并且,基于单张目标图像的特征进行检索,其检索范围也更大(相较于上面取特征均值的方式而言),有可能会检索到更多的目标图像。
在第一方面的一种实现方式中,所述计算所述待检索图像的特征与对象库中的每张图像的特征之间的相似度,输出其中相似度最大的多张图像,包括:计算所述待检索图像的特征与对象库中的每张图像的特征之间的相似度,按降序输出其中相似度最大的多张图像;所述计算所述重检索特征与所述对象库中的图像的特征之间的相似度,输出其中相似度最大的多张图像,包括:计算所述重检索特征与所述对象库中的图像的特征之间的相似度,按降序输出其中相似度最大的多张图像。
将相似度最大的多张图像输出时,可以采取无序输出的方式,也可以采取降序输出的方式。前者在输出时会更简单一些,但后者的优势在于:按照特征相似度进行的图像筛选虽然准确性不如人工,但其筛选结果仍具有相当高的参考价值,通常与待检索图像特征相似度较小的图像肯定就不是目标图像了。因此,人工在筛选时完全可以利用该相似度排序结果,只在排序靠前的若干张图像中进行筛选,或者,从排序最高的图像开始依次筛选,在发现某个图像或连续几个图像并非目标图像时,后续图像就不再筛选,此举有利于减轻人工作业的压力。
在第一方面的一种实现方式中,所述计算所述重检索特征与所述对象库中的图像的特征之间的相似度,包括:计算所述重检索特征与剩余图像的特征之间的相似度;其中,所述剩余图像是指所述对象库中除已获得的目标图像以外的图像。
由于目标图像是已经被人工确认为正确的检索结果,所以没有必要再参与特征相似度的计算,此举有利于减少相似度计算的运算量。
在第一方面的一种实现方式中,所述检索结束条件包括以下至少一项:已获得的目标图像的总数量已经满足需求;在一轮迭代中,人工进行图像筛选的筛选结果表明相似度最大的多张图像中不包含目标图像;在连续多轮迭代中,人工进行图像筛选的筛选结果均表明相似度最大的多张图像中不包含目标图像。
上述实现方式中的第一个检索结束条件可适用于对检索结果的数量有明确要求的场景;第二、三个检索结束条件可适用于对检索结果的数量没有明确要求的场景;当然,这几个条件也可以组合使用。
在第一方面的一种实现方式中,所述获取人工从相似度最大的多张图像中筛选出的至少一张目标图像,包括:在可视化界面上显示相似度最大的多张图像供人工筛选;根据人工在所述可视化界面上进行图像筛选的筛选结果从相似度最大的多张图像中获取至少一张目标图像。
在上述实现方式中,提供一个可视化界面供工作人员执行图像筛选操作,方便了工作人员查看图像,有利于提高人工筛选图像的效率。
第二方面,本申请实施例提供一种对象检索装置,包括:特征提取模块,用于获取待检索图像,并利用神经网络模型提取出所述待检索图像的特征;相似性度量模块,用于计算所述待检索图像的特征与对象库中的每张图像的特征之间的相似度,输出其中相似度最大的多张图像;迭代检索模块,用于迭代执行重检索流程,直至满足检索结束条件,输出经所述重检索流程获得的目标图像;其中,所述重检索流程包括:获取人工从相似度最大的多张图像中筛选出的至少一张目标图像,所述目标图像为与所述待检索图像包含有同一对象的图像;根据已获得的目标图像的特征确定重检索特征;计算所述重检索特征与所述对象库中的图像的特征之间的相似度,输出其中相似度最大的多张图像。
第三方面,本申请实施例提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序指令,所述计算机程序指令被处理器读取并运行时,执行第一方面或第一方面的任意一种可能的实现方式提供的方法。
第四方面,本申请实施例提供一种电子设备,包括:存储器以及处理器,所述存储器中存储有计算机程序指令,所述计算机程序指令被所述处理器读取并运行时,执行第一方面或第一方面的任意一种可能的实现方式提供的方法。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本申请实施例提供的一种对象检索方法的流程图;
图2(A)至图2(B)示出了本申请实施例提供的一种对象检索界面的示意图;
图3示出了本申请实施例提供的一种对象检索装置的模块图;
图4示出了本申请实施例提供的一种电子设备的示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行描述。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
图1示出了本申请实施例提供的一种对象检索方法的流程图。该方法是一种实现以图搜图的方案,即根据一张包含某个对象的待检索图像,从对象库中搜索出包含有同一对象的若干张图像作为检索结果。这里所称的对象,可以指行人、车辆、动物等,具体不作限定。对象库是指包含有某类对象的图像的集合,作为进行对象检索的范围,例如,行人库可以是摄像头采集的行人图像的集合,其具体实现形式可以是一个数据库。该对象检索方法可以应用于多种场景,例如,检索嫌疑人图像以便锁定嫌疑人的活动区域,检索肇事车辆的图像以便确定肇事车辆的行驶轨迹,等等。图1中的方法可以但不限于由图4示出的电子设备执行,参照图1,该方法包括:
步骤S110:获取待检索图像,并利用神经网络模型提取出待检索图像的特征。
本申请并不限定步骤S110中的神经网络的具体结构,例如,可以采用现有技术中的VGG、ResNet、GoogleNet等网络进行特征提取,也可以设计新的网络结构进行特征提取。神经网络提取出的特征可以采用向量的形式,但也不排除采用其他形式,例如矩阵、哈希值等。
步骤S120:计算待检索图像的特征与对象库中的每张图像的特征之间的相似度,输出其中相似度最大的多张图像。
构成对象库的每张图像,也和待检索图像采用同一神经网络模型进行特征提取,提取到的特征可以和图像一同保存在对象库中,这些特征提取行为可以在构建对象库的过程中完成。
特征之间相似度的计算方式取决于特征采用的形式,例如,在特征采用向量形式时,两个特征之间相似度可以定义为两个向量之间的距离,比如余弦距离、欧式距离、杰卡德距离、马氏距离等,计算出的距离越近,特征之间的相似度越高,计算出的距离越远,特征之间的相似度越低。
计算出待检索图像的特征与对象库中的每张图像的特征之间的相似度后,可以输出其中相似度最大的多张图像,为便于阐述,不妨假设为N张(N>1)。这N张图像可以采用无序输出,也可以采用降序输出,比如,可以基于计算出的相似度构造一个规模为N的小顶堆,小顶堆中的N个相似度节点对应相似度最大的N张图像,在根据小顶堆输出这N张图像时,既可以采用无序输出,也可以采用降序输出。若采用无序输出,在步骤上会简单一些,若采用降序输出,在步骤上会复杂一些,但对于后面的人工筛选步骤有好处,具体后文再说明。
在一些实现方式中,可以将相似度最大的N张图像显示在一个可视化界面(例如,网页或者软件界面)上供工作人员查看,以便其执行后续的图像筛选操作。图2(A)示出了该可视化界面的一种布局方式。参照图2(A),可视化界面的左侧部分显示待检索图像,右侧部分则显示检索结果,在图2(A)中,检索结果部分一共显示了16张图像(N=16),分别编号1-16,根据上文所述,这16张图像可以按照相似度排序显示,也可以不按照相似度排序显示(无序显示)。
步骤S130:迭代执行重检索流程。
步骤S130中的重检索流程包含步骤S132至步骤S134,重检索流程是一个迭代检索过程,即在不满足检索结束条件时,步骤S132至步骤S134会一直重复执行,重复执行一次为一轮迭代。若在迭代过程中检测到检索结束条件已经满足,则迭代过程终止,继续执行步骤S140。关于检索结束条件,后文再进行说明,下面在介绍步骤S132至步骤S134时,先暂时不考虑检索结束条件。
步骤S132:获取人工从相似度最大的多张图像中筛选出的至少一张目标图像。
步骤S120中得到的相似度最大的多张图像只是一个机器初筛的结果,由于图像拍摄场景的复杂性以及现有深度学习算法(体现在神经网络模型中)本身的局限,初步筛选的结果很可能存在一些错误。在步骤S132中,工作人员可以在步骤S120获得的多张图像的基础上进行人工筛选,选择那些与待检索图像包含有同一对象的图像,称为目标图像,目标图像是本方案最终要获得的检索结果。
在一些实现方式中,人工筛选可以在一个可视化界面上进行,如图2(A)所示。右侧的16张图像每张都处于可被选中的状态,若点击某张图像后,该图像右上角会出现一个勾,表示选中,再次点击该图像则右上角的勾消失,表示取消选中。被工作人员选中的图像即为目标图像,也就是工作人员认为正确的检索结果,在图2(A)中,编号1、2、3、5的图像为目标图像。在可视化界面上进行图像筛选十分直观,有利于提高人工筛选的效率,但应当理解,该可视化界面并非只能采用图2(A)中的布局方式。另外,在一些实现方式中,不提供可视化界面进行人工筛选也是可行的,例如可由工作人员直接打开对象库中的图像查看并进行筛选。
但须注意的是,在可视化界面上选择了目标图像,并不一定等价于从步骤S120输出的多张图像中选择了目标图像,在一些实现方式中,位于前台的可视化界面上的人工筛选结果要等到开始重检索(点击界面上的重检索按钮)后才会传递给后台程序,由后台程序负责从步骤S120输出的多张图像中选择目标图像。
在阐述步骤S120时曾经提到,步骤S120中获得的多张图像可以采用降序输出,将有利于人工筛选目标图像,现在说明其原因:
按照特征相似度进行的图像初步筛选虽然准确性不如人工,但其筛选结果仍具有相当高的参考价值,通常与待检索图像特征相似度较小的图像肯定就不是目标图像了。因此,人工在筛选时完全可以利用特征相似度的排序结果,只在排序靠前的若干张图像中进行筛选,或者,从排序最高的图像开始依次筛选,在发现某个图像或者连续的几个图像并非目标图像时,后续图像就不再筛选,此举有利于减轻人工作业的压力。
例如,在图2(A)中,图像1-16按照其特征与待检索图像的特征之间的相似度降序排序,图像间隔阈值设置为2。则在进行人工筛选时,工作人员可以按照编号1-16的顺序查看每张图像,参照图2(A),图像1-3经人工确认均为目标图像,图像4经人工确认不是目标图像,但由于图像间隔阈值为2,所以可以继续查看图像5,图像5经人工确认是目标图像,图像6-7经人工确认都不是目标图像,由于图像间隔阈值为2,所以图像7之后的图像就不必再进行人工筛选了。因为这些图像的特征与待检索图像的特征的差异只会比图像7更大,其属于目标图像的概率已经较小,即使其中还存在个别目标图像,也需要工作人员耗费较大的精力才能找全,然而很多应用场景并不要求搜索出对象库中的全部目标图像,此时应主要考虑如何减轻工作人员的筛选负担。
作为对比的,若步骤S120中获得的多张图像采用无序输出,工作人员可能需要查看输出的所有图像才能筛选出目标图像,在图像数量较多时,将十分耗费精力。
需要指出,上面在阐述步骤S132时,均将步骤S120中输出的图像作为人工筛选的范围,但实际上,只有首次执行步骤S132时,人工筛选的范围才是步骤S120中输出的图像,其后迭代时,人工筛选的范围应为步骤S136中输出的图像,不过其筛选方式是类似的,因此不再重复说明。
步骤S134:根据已获得的目标图像的特征确定重检索特征。
步骤S136:计算重检索特征与对象库中的图像的特征之间的相似度,输出其中相似度最大的多张图像。
以上两个步骤合并在一起阐述。步骤S134有多种可能的实现方式,下面列举一些:
(1)计算本轮迭代中人工筛选出的至少一张目标图像的特征的均值,将计算结果作为重检索特征。
(2)计算已获得的全部目标图像的特征的均值,将计算结果作为重检索特征。例如,每轮迭代筛选出目标图像后,可将目标图像加入到一个目标图像池中,方式(2)即计算目标图像池中所有图像的特征的均值。其中,已获得的全部目标图像包括:本轮迭代中人工筛选出的至少一张目标图像以及之前各轮迭代中人工筛选出的所有目标图像。
(3)从已获得的全部目标图像中选择一张目标图像,并将选择出的目标图像的特征作为重检索特征。其要求是:选出的目标图像尚未被用于重检索(即该目标图像的特征在之前各轮迭代中从未被作为重检索特征)。
确定好重检索特征后,在步骤S136中基于该重检索特征重新在对象库中重新进行筛选,其过程类似步骤S120,不再详细阐述,步骤S136中得到的相似度最大的多张图像也可以进行无序或降序的输出。假设步骤S136中输出的图像为M张(M>1),M可以和步骤S120中提到的N相等,也可以不等。另外还需要指出,由于已获得的目标图像是已经被人工确认为正确的检索结果,所以在重检索时没有必要再参与特征相似度的计算,只需计算重检索特征与对象库中的剩余图像(指除已获得的目标图像以外的图像)的特征之间的相似度即可,此举有利于减少重检索时相似度计算的运算量。
下面简单对比一下获得重检索特征的三种方式:
方式(1)和(2)都是通过计算目标图像的特征均值得到重检索特征,相当于对正确的检索结果(人工筛选结果基本可以认为是正确的检索结果)所具有的特征进行了统计,从而基于此重检索特征重新检索对象库(指重新进行初步筛选),得到正确的检索结果的可能性更高,后期人工筛选起来也更容易。当然,相较于方式(1),方式(2)可能会涉及更多的计算,但方式(2)中由于考虑了更多的目标图像的特征,因此所得到的重检索特征对待检索对象的描述能力可能会更强一些。
方式(3)中,每轮迭代只选择一张目标图像的特征作为重检索特征进行重检索,由于目标图像的特征很可能是构建对象库时就已经提取的,因此该实现方式下获得重检索特征无需进行计算,非常简单。并且,基于单张目标图像的特征进行检索,其检索范围相较于方式(1)(2)也更大,有可能会检索到更多的目标图像。例如,某轮迭代中人工筛选出3张目标图像,若按照方式(1)执行,则会计算这3张目标图像的特征向量的均值进行重检索,若按照方式(3)执行,则最多可以分别根据这3张目标图像的3个特征向量进行3轮重检索,其检索范围更大。
若采用可视化方式实现对象重检索,其过程可以参考图2(A)以及图2(B),可视化界面右下角设置一个重检索按钮,图2(A)中,工作人员在选定目标图像后,点击该按钮,即执行步骤S132至步骤S136(前文已经阐述,步骤S132在后台的执行可能要等到点击重检索按钮之后),执行完步骤S136后,将得到的相似度最大的多张图像输出到可视化界面上,如图2(B)所示。在图2(B)中,本轮迭代中选定的目标图像仍然显示在检索结果部分(阴影示出的图像1、2、3、5),而本轮迭代中新筛选出的(指通过新一轮的初步筛选选出的)图像则显示在其后,编号为17-28,在图2(A)中未被选为目标图像的4、6-16则从检索结果部分移除。在下一轮迭代中,工作人员在选定图像17、18作为目标图像后,可以再次点击重检索按钮,以此类推,不再具体说明。最终,在步骤S130的重检索流程结束后,所有的目标图像都显示在可视化界面的检索结果部分。
下面介绍一下检索结束条件,检索结束条件可以但不限于包括以下至少一项:
(1)已获得的目标图像的总数量已经满足需求。例如,需要的检索结果为50张图像,若某轮迭代中人工筛选出的目标图像加上之前轮次的迭代中已经获得目标图像后,其总数量已经达到或超过50张图像,则满足条件(1)。
(2)在一轮迭代中,人工进行图像筛选的筛选结果表明相似度最大的多张图像中不包含目标图像。例如,重检索特征是根据本轮迭代中人工筛选出的目标图像的特征的均值计算的,完成本轮的重检索后,在下一轮迭代中进行人工筛选时,发现从重检索得到的图像中无法再筛选出新的目标图像,从而也就无法再计算新的重检索特征,即无法继续进行检索,满足条件(2)。
(3)在连续多轮迭代中,人工进行图像筛选的筛选结果均表明相似度最大的多张图像中不包含目标图像。例如,重检索特征是从已获得的三张目标图像中选择出的一张目标图像的特征,完成本轮的重检索后,在下一轮迭代中进行人工筛选时,发现从重检索得到的图像中无法再筛选出新的目标图像。但由于已获得的三张目标图像中还有两张目标图像未用于重检索,故可以尝试将这两张目标图像的特征分别作为重检索特征再进行两轮重检索,若仍然无法筛选出任何新的目标图像,则无法继续进行检索,满足条件(3)。
简单总结,条件(1)可适用于对检索结果的数量有明确要求的场景;条件(2)、(3)可适用于对检索结果的数量没有明确要求的场景;当然,这三个条件也可以组合使用,但条件(2)(3)不可同时使用。以上三个条件均可以在获得人工筛选结果后进行判断。
步骤S140:输出已获得的目标图像。
步骤S140中的图像输出可以是一次性输出,也可以是边检索边输出。例如,在图2(A)和图2(B)中,作为搜索结果的目标图像是逐步显示在可视化界面的搜索结果部分的。
综上所述,本申请实施例提供的对象检索方法在进行检索时,首先通过计算特征相似度从对象库中初步筛选出和待检索图像相似的图像,然后从初步筛选出的图像中进一步通过人工方式筛选出目标图像,最后再基于目标图像的特征进行迭代式检索,直至获得最终的检索结果。
该方案的优势在于:其一,所有的检索结果都是经过人工确认的,准确率非常高;其二,人工筛选是在机器筛选的基础上进行的,而非在整个对象库中进行,其筛选范围有限,不会给工作人员带来太大的作业压力;其三,重检索特征是根据人工确认为正确的检索结果所具有的特征得到的,因此基于重检索特征进行迭代式检索,能够检索到较为准确的结果,这也有利于进一步缓解人工筛选的压力。
图3示出了本申请实施例提供的对象检索装置200的功能模块图。参照图3,对象检索装置200包括:
特征提取模块210,用于获取待检索图像,并利用神经网络模型提取出所述待检索图像的特征;
相似性度量模块220,用于计算所述待检索图像的特征与对象库中的每张图像的特征之间的相似度,输出其中相似度最大的多张图像;
迭代检索模块230,用于迭代执行重检索流程,直至满足检索结束条件,输出经所述重检索流程获得的目标图像;其中,所述重检索流程包括:获取人工从相似度最大的多张图像中筛选出的至少一张目标图像,所述目标图像为与所述待检索图像包含有同一对象的图像;根据已获得的目标图像的特征确定重检索特征;计算所述重检索特征与所述对象库中的图像的特征之间的相似度,输出其中相似度最大的多张图像。
在对象检索装置200的一种实现方式中,迭代检索模块230根据已获得的目标图像的特征确定重检索特征,包括:将本轮迭代筛选出的所述至少一张目标图像的特征的均值确定为所述重检索特征,或者,将本轮迭代筛选出的所述至少一张目标图像的特征以及之前获得的目标图像的特征的均值确定为所述重检索特征。
在对象检索装置200的一种实现方式中,迭代检索模块230根据已获得的目标图像的特征确定重检索特征,包括:从已获得的目标图像中选择一张其特征尚未被用于重检索的目标图像,并将选择出的目标图像的特征确定为所述重检索特征。
在对象检索装置200的一种实现方式中,相似性度量模块220计算所述待检索图像的特征与对象库中的每张图像的特征之间的相似度,输出其中相似度最大的多张图像,包括:计算所述待检索图像的特征与对象库中的每张图像的特征之间的相似度,按降序输出其中相似度最大的多张图像;迭代检索模块230计算所述重检索特征与所述对象库中的图像的特征之间的相似度,输出其中相似度最大的多张图像,包括:计算所述重检索特征与所述对象库中的图像的特征之间的相似度,按降序输出其中相似度最大的多张图像。
在对象检索装置200的一种实现方式中,迭代检索模块230计算所述重检索特征与所述对象库中的图像的特征之间的相似度,包括:计算所述重检索特征与剩余图像的特征之间的相似度;其中,所述剩余图像是指所述对象库中除已获得的目标图像以外的图像。
在对象检索装置200的一种实现方式中,所述检索结束条件包括以下至少一项:已获得的目标图像的总数量已经满足需求;在一轮迭代中,人工进行图像筛选的筛选结果表明相似度最大的多张图像中不包含目标图像;在连续多轮迭代中,人工进行图像筛选的筛选结果均表明相似度最大的多张图像中不包含目标图像。
在对象检索装置200的一种实现方式中,迭代检索模块230获取人工从相似度最大的多张图像中筛选出的至少一张目标图像,包括:在可视化界面上显示相似度最大的多张图像供人工筛选;根据人工在所述可视化界面上进行图像筛选的筛选结果从相似度最大的多张图像中获取至少一张目标图像。
本申请实施例提供的对象检索装置200,其实现原理及产生的技术效果在前述方法实施例中已经介绍,为简要描述,装置实施例部分未提及之处,可参考方法实施例中相应内容。
图4示出了本申请实施例提供的电子设备300的一种可能的结构。参照图4,电子设备300包括:处理器310、存储器320以及通信接口330,这些组件通过通信总线340和/或其他形式的连接机构(未示出)互连并相互通讯。
其中,存储器320包括一个或多个(图中仅示出一个),其可以是,但不限于,随机存取存储器(Random Access Memory,简称RAM),只读存储器(Read Only Memory,简称ROM),可编程只读存储器(Programmable Read-Only Memory,简称PROM),可擦除可编程只读存储器(Erasable Programmable Read-Only Memory,简称EPROM),电可擦除可编程只读存储器(Electric Erasable Programmable Read-Only Memory,简称EEPROM)等。处理器310以及其他可能的组件可对存储器320进行访问,读和/或写其中的数据。
处理器310包括一个或多个(图中仅示出一个),其可以是一种集成电路芯片,具有信号的处理能力。上述的处理器310可以是通用处理器,包括中央处理器(CentralProcessing Unit,简称CPU)、微控制单元(Micro Controller Unit,简称MCU)、网络处理器(Network Processor,简称NP)或者其他常规处理器;还可以是专用处理器,包括图形处理器(Graphics Processing Unit,GPU)、数字信号处理器(Digital Signal Processor,简称DSP)、专用集成电路(Application Specific Integrated Circuits,简称ASIC)、现场可编程门阵列(Field Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。并且,在处理器310为多个时,其中的一部分可以是通用处理器,另一部分可以是专用处理器。
通信接口330包括一个或多个(图中仅示出一个),可以用于和其他设备进行直接或间接地通信,以便进行数据的交互。通信接口330可以包括进行有线和/或无线通信的接口。
在存储器320中可以存储一个或多个计算机程序指令,处理器310可以读取并运行这些计算机程序指令,以实现本申请实施例提供的对象检索方法以及其他期望的功能。
可以理解,图4所示的结构仅为示意,电子设备300还可以包括比图4中所示更多或者更少的组件,或者具有与图4所示不同的配置。图4中所示的各组件可以采用硬件、软件或其组合实现。电子设备300可能是实体设备,例如PC机、笔记本电脑、平板电脑、手机、服务器、嵌入式设备等,也可能是虚拟设备,例如虚拟机、虚拟化容器等。并且,电子设备400也不限于单台设备,也可以是多台设备的组合或者大量设备构成的集群。
本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序指令,所述计算机程序指令被计算机的处理器读取并运行时,执行本申请实施例提供的对象检索方法。例如,计算机可读存储介质可以实现为图4中电子设备300中的存储器320。
以上所述仅为本申请的实施例而已,并不用于限制本申请的保护范围,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (10)
1.一种对象检索方法,其特征在于,包括:
获取待检索图像,并利用神经网络模型提取出所述待检索图像的特征;
计算所述待检索图像的特征与对象库中的每张图像的特征之间的相似度,输出其中相似度最大的多张图像;
迭代执行重检索流程,直至满足检索结束条件,输出经所述重检索流程获得的目标图像;其中,所述重检索流程包括:
获取人工从相似度最大的多张图像中筛选出的至少一张目标图像,所述目标图像为与所述待检索图像包含有同一对象的图像;
根据已获得的目标图像的特征确定重检索特征;
计算所述重检索特征与所述对象库中的图像的特征之间的相似度,输出其中相似度最大的多张图像。
2.根据权利要求1所述的对象检索方法,其特征在于,所述根据已获得的目标图像的特征确定重检索特征,包括:
将本轮迭代筛选出的所述至少一张目标图像的特征的均值确定为所述重检索特征,或者,将本轮迭代筛选出的所述至少一张目标图像的特征以及之前获得的目标图像的特征的均值确定为所述重检索特征。
3.根据权利要求1所述的对象检索方法,其特征在于,所述根据已获得的目标图像的特征确定重检索特征,包括:
从已获得的目标图像中选择一张其特征尚未被用于重检索的目标图像,并将选择出的目标图像的特征确定为所述重检索特征。
4.根据权利要求1所述的对象检索方法,其特征在于,所述计算所述待检索图像的特征与对象库中的每张图像的特征之间的相似度,输出其中相似度最大的多张图像,包括:
计算所述待检索图像的特征与对象库中的每张图像的特征之间的相似度,按降序输出其中相似度最大的多张图像;
所述计算所述重检索特征与所述对象库中的图像的特征之间的相似度,输出其中相似度最大的多张图像,包括:
计算所述重检索特征与所述对象库中的图像的特征之间的相似度,按降序输出其中相似度最大的多张图像。
5.根据权利要求1所述的对象检索方法,其特征在于,所述计算所述重检索特征与所述对象库中的图像的特征之间的相似度,包括:
计算所述重检索特征与剩余图像的特征之间的相似度;其中,所述剩余图像是指所述对象库中除已获得的目标图像以外的图像。
6.根据权利要求1所述的对象检索方法,其特征在于,所述检索结束条件包括以下至少一项:
已获得的目标图像的总数量已经满足需求;
在一轮迭代中,人工进行图像筛选的筛选结果表明相似度最大的多张图像中不包含目标图像;
在连续多轮迭代中,人工进行图像筛选的筛选结果均表明相似度最大的多张图像中不包含目标图像。
7.根据权利要求1-6中任一项所述的对象检索方法,其特征在于,所述获取人工从相似度最大的多张图像中筛选出的至少一张目标图像,包括:
在可视化界面上显示相似度最大的多张图像供人工筛选;
根据人工在所述可视化界面上进行图像筛选的筛选结果从相似度最大的多张图像中获取至少一张目标图像。
8.一种对象检索装置,其特征在于,包括:
特征提取模块,用于获取待检索图像,并利用神经网络模型提取出所述待检索图像的特征;
相似性度量模块,用于计算所述待检索图像的特征与对象库中的每张图像的特征之间的相似度,输出其中相似度最大的多张图像;
迭代检索模块,用于迭代执行重检索流程,直至满足检索结束条件,输出经所述重检索流程获得的目标图像;其中,所述重检索流程包括:获取人工从相似度最大的多张图像中筛选出的至少一张目标图像,所述目标图像为与所述待检索图像包含有同一对象的图像;根据已获得的目标图像的特征确定重检索特征;计算所述重检索特征与所述对象库中的图像的特征之间的相似度,输出其中相似度最大的多张图像。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序指令,所述计算机程序指令被处理器读取并运行时,执行如权利要求1-7中任一项所述的方法。
10.一种电子设备,其特征在于,包括存储器以及处理器,所述存储器中存储有计算机程序指令,所述计算机程序指令被所述处理器读取并运行时,执行权利要求1-7中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010809857.3A CN111680183B (zh) | 2020-08-13 | 2020-08-13 | 对象检索方法及装置、存储介质及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010809857.3A CN111680183B (zh) | 2020-08-13 | 2020-08-13 | 对象检索方法及装置、存储介质及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111680183A true CN111680183A (zh) | 2020-09-18 |
CN111680183B CN111680183B (zh) | 2020-11-24 |
Family
ID=72458306
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010809857.3A Active CN111680183B (zh) | 2020-08-13 | 2020-08-13 | 对象检索方法及装置、存储介质及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111680183B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113761241A (zh) * | 2021-07-23 | 2021-12-07 | 北京旷视科技有限公司 | 图像搜索方法及装置、计算机可读存储介质及电子设备 |
CN113901648A (zh) * | 2021-09-24 | 2022-01-07 | 成都飞机工业(集团)有限责任公司 | 一种编制零件工艺规程的方法及装置 |
CN116828099A (zh) * | 2023-08-29 | 2023-09-29 | 荣耀终端有限公司 | 一种拍摄方法、介质和电子设备 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1967536A (zh) * | 2006-11-16 | 2007-05-23 | 华中科技大学 | 基于区域的多特征融合及多级反馈的潜伏语义图像检索方法 |
CN101692224A (zh) * | 2009-07-08 | 2010-04-07 | 南京师范大学 | 融合空间关系语义的高分辨率遥感图像检索方法 |
CN102207968A (zh) * | 2011-06-08 | 2011-10-05 | 北京百度网讯科技有限公司 | 一种基于检索结果相关性判断的检索方法及装置 |
CN102306179A (zh) * | 2011-08-26 | 2012-01-04 | 上海冠勇信息科技有限公司 | 基于分级颜色分布描述符的图像内容检索方法 |
CN103605811A (zh) * | 2013-12-10 | 2014-02-26 | 三峡大学 | 一种纹理图像的检索方法和装置 |
CN103870569A (zh) * | 2014-03-13 | 2014-06-18 | 北方信息控制集团有限公司 | 一种基于内容的彩色动物图像检索方法与系统 |
CN104991959A (zh) * | 2015-07-21 | 2015-10-21 | 北京京东尚科信息技术有限公司 | 一种基于内容检索相同或相似图像的方法与系统 |
CN111209331A (zh) * | 2020-01-06 | 2020-05-29 | 北京旷视科技有限公司 | 目标对象的检索方法、装置及电子设备 |
-
2020
- 2020-08-13 CN CN202010809857.3A patent/CN111680183B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1967536A (zh) * | 2006-11-16 | 2007-05-23 | 华中科技大学 | 基于区域的多特征融合及多级反馈的潜伏语义图像检索方法 |
CN101692224A (zh) * | 2009-07-08 | 2010-04-07 | 南京师范大学 | 融合空间关系语义的高分辨率遥感图像检索方法 |
CN102207968A (zh) * | 2011-06-08 | 2011-10-05 | 北京百度网讯科技有限公司 | 一种基于检索结果相关性判断的检索方法及装置 |
CN102306179A (zh) * | 2011-08-26 | 2012-01-04 | 上海冠勇信息科技有限公司 | 基于分级颜色分布描述符的图像内容检索方法 |
CN103605811A (zh) * | 2013-12-10 | 2014-02-26 | 三峡大学 | 一种纹理图像的检索方法和装置 |
CN103870569A (zh) * | 2014-03-13 | 2014-06-18 | 北方信息控制集团有限公司 | 一种基于内容的彩色动物图像检索方法与系统 |
CN104991959A (zh) * | 2015-07-21 | 2015-10-21 | 北京京东尚科信息技术有限公司 | 一种基于内容检索相同或相似图像的方法与系统 |
CN111209331A (zh) * | 2020-01-06 | 2020-05-29 | 北京旷视科技有限公司 | 目标对象的检索方法、装置及电子设备 |
Non-Patent Citations (1)
Title |
---|
陶怡墨: "基于内容的医学图像检索", 《中国优秀博硕士学位论文全文数据库 (硕士) 医药卫生科技辑》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113761241A (zh) * | 2021-07-23 | 2021-12-07 | 北京旷视科技有限公司 | 图像搜索方法及装置、计算机可读存储介质及电子设备 |
CN113901648A (zh) * | 2021-09-24 | 2022-01-07 | 成都飞机工业(集团)有限责任公司 | 一种编制零件工艺规程的方法及装置 |
CN116828099A (zh) * | 2023-08-29 | 2023-09-29 | 荣耀终端有限公司 | 一种拍摄方法、介质和电子设备 |
CN116828099B (zh) * | 2023-08-29 | 2023-12-19 | 荣耀终端有限公司 | 一种拍摄方法、介质和电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN111680183B (zh) | 2020-11-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110084292B (zh) | 基于DenseNet和多尺度特征融合的目标检测方法 | |
CN111680183B (zh) | 对象检索方法及装置、存储介质及电子设备 | |
CN112434721B (zh) | 一种基于小样本学习的图像分类方法、系统、存储介质及终端 | |
CN107944450B (zh) | 一种车牌识别方法及装置 | |
EP4116867A1 (en) | Vehicle tracking method and apparatus, and electronic device | |
JP5282658B2 (ja) | 画像学習、自動注釈、検索方法及び装置 | |
CN111581423B (zh) | 一种目标检索方法及装置 | |
CN109165309B (zh) | 负例训练样本采集方法、装置及模型训练方法、装置 | |
JP7242994B2 (ja) | ビデオイベント識別方法、装置、電子デバイス及び記憶媒体 | |
CN112529068B (zh) | 一种多视图图像分类方法、系统、计算机设备和存储介质 | |
CN113642571A (zh) | 一种基于显著性注意力机制的细粒度图像识别方法 | |
CN115690545B (zh) | 训练目标跟踪模型和目标跟踪的方法和装置 | |
CN115761599A (zh) | 一种视频异常检测方法及系统 | |
CN115545103A (zh) | 异常数据识别、标签识别方法和异常数据识别装置 | |
CN110083731B (zh) | 图像检索方法、装置、计算机设备及存储介质 | |
CN114168768A (zh) | 图像检索方法及相关设备 | |
CN111382638A (zh) | 一种图像检测方法、装置、设备和存储介质 | |
CN112613496A (zh) | 一种行人重识别方法、装置、电子设备及存储介质 | |
CN112765362A (zh) | 基于改进自编码器的知识图谱实体对齐方法及相关设备 | |
US8380004B1 (en) | Object image matching and applications thereof | |
CN111611981A (zh) | 信息识别方法和装置及信息识别神经网络训练方法和装置 | |
CN111797290A (zh) | 数据处理方法、装置、存储介质及电子设备 | |
CN113269176B (zh) | 图像处理模型训练、图像处理方法、装置和计算机设备 | |
US20210124780A1 (en) | Graph search and visualization for fraudulent transaction analysis | |
CN114037826A (zh) | 基于多尺度增强特征的文本识别方法、装置、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |