CN114357226A - 一种图像查询方法、装置及设备 - Google Patents
一种图像查询方法、装置及设备 Download PDFInfo
- Publication number
- CN114357226A CN114357226A CN202111511932.9A CN202111511932A CN114357226A CN 114357226 A CN114357226 A CN 114357226A CN 202111511932 A CN202111511932 A CN 202111511932A CN 114357226 A CN114357226 A CN 114357226A
- Authority
- CN
- China
- Prior art keywords
- image
- initial
- feature
- target
- generating
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 54
- 238000005286 illumination Methods 0.000 claims description 77
- 230000004927 fusion Effects 0.000 claims description 56
- 238000004458 analytical method Methods 0.000 claims description 30
- 230000036544 posture Effects 0.000 description 30
- 230000006870 function Effects 0.000 description 24
- 238000010586 diagram Methods 0.000 description 13
- 230000008569 process Effects 0.000 description 8
- 238000004590 computer program Methods 0.000 description 7
- 230000002159 abnormal effect Effects 0.000 description 5
- 230000008859 change Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Landscapes
- Processing Or Creating Images (AREA)
Abstract
本申请提供一种图像查询方法、装置及设备,该方法包括:获取初始图像,初始图像包括第一感兴趣区域和第一噪音区域;基于初始图像生成候选图像,候选图像包括第二感兴趣区域和第二噪音区域;所述第二感兴趣区域的图像特征与所述第一感兴趣区域的图像特征匹配,所述第二噪音区域的图像特征与所述第一噪音区域的图像特征不匹配;基于所述初始图像和所述候选图像,从图像数据库中查询与所述初始图像对应的目标图像;所述图像数据库用于记录具有身份信息的图像。通过本申请的技术方案,基于多帧图像的特征查询与初始图像匹配的目标图像,能够查询到准确的目标图像。即使只提供一帧初始图像,也可以基于多帧图像查询目标图像,提升图像查询的性能。
Description
技术领域
本申请涉及图像处理技术领域,尤其涉及一种图像查询方法、装置及设备。
背景技术
图像查询也可以称为图像搜索,是指从图像数据库中查询出与初始图像匹配的目标图像的过程,图像数据库用于记录具有身份信息的图像。比如说,在得到初始图像后,获取该初始图像的特征(如颜色、形状、纹理等特征),并计算该初始图像的特征与图像数据库中的每帧图像的特征之间的相似度,并将相似度最大的图像作为与该初始图像匹配的目标图像。由于目标图像具有身份信息,因此,将目标图像对应的身份信息作为该初始图像对应的身份信息,即该初始图像也是归属于这个身份信息的图像,从而实现图像查询过程。
但是,基于初始图像的特征与图像数据库中的每帧图像的特征之间的相似度,查询与初始图像匹配的目标图像时,可能无法查询到准确的目标图像,即查询出错误的目标图像,图像查询结果错误。比如说,初始图像应该与图像数据库中的图像a1匹配,但查询结果是初始图像与图像数据库中的图像a2匹配。
发明内容
本申请提供一种图像查询方法,所述方法包括:
获取初始图像,所述初始图像包括第一感兴趣区域和第一噪音区域;
基于所述初始图像生成候选图像,所述候选图像包括第二感兴趣区域和第二噪音区域;所述第二感兴趣区域的图像特征与所述第一感兴趣区域的图像特征匹配,所述第二噪音区域的图像特征与所述第一噪音区域的图像特征不匹配;
基于所述初始图像和所述候选图像,从图像数据库中查询与所述初始图像对应的目标图像;其中,所述图像数据库用于记录具有身份信息的图像。
本申请提供一种图像查询装置,所述装置包括:
获取模块,用于获取初始图像,所述初始图像包括第一感兴趣区域和第一噪音区域;生成模块,用于基于所述初始图像生成候选图像,所述候选图像包括第二感兴趣区域和第二噪音区域;其中,所述第二感兴趣区域的图像特征与所述第一感兴趣区域的图像特征匹配,且所述第二噪音区域的图像特征与所述第一噪音区域的图像特征不匹配;查询模块,用于基于所述初始图像和所述候选图像,从图像数据库中查询与所述初始图像对应的目标图像;其中,所述图像数据库用于记录具有身份信息的图像。
本申请提供一种图像查询设备,包括:处理器和机器可读存储介质,所述机器可读存储介质存储有能够被所述处理器执行的机器可执行指令;所述处理器用于执行机器可执行指令,以实现本申请上述示例公开的图像查询方法。
由以上技术方案可见,本申请实施例中,基于初始图像生成候选图像,并基于初始图像和候选图像从图像数据库中查询与初始图像对应的目标图像,也就是说,基于多帧图像的特征(初始图像的特征和候选图像的特征)查询与初始图像匹配的目标图像,能够查询到准确的目标图像,即查询出准确的目标图像,图像的查询结果正确。在使用图像查询功能时,即使无法提供多帧初始图像,只能提供一帧初始图像,也可以基于一帧初始图像生成至少一帧候选图像,继而基于多帧图像查询目标图像,显著提升图像查询功能的性能,使得基于多帧图像的查询功能发挥作用,实现多图查询功能。能够根据一帧初始图像生成更丰富的多帧候选图像,生成多样性的候选图像,丰富了查询目标的表达形式,实现基于多帧图像的图像查询,查询结果更加可靠准确,提升查询性能。
附图说明
为了更加清楚地说明本申请实施例或者现有技术中的技术方案,下面将对本申请实施例或者现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据本申请实施例的这些附图获得其他的附图。
图1是本申请一种实施方式中的图像查询方法的流程示意图;
图2是本申请一种实施方式中的图像查询方法的流程示意图;
图3是本申请一种实施方式中的图像查询方法的流程示意图;
图4是本申请一种实施方式中的图像查询装置的结构示意图;
图5是本申请一种实施方式中的图像查询设备的硬件结构图。
具体实施方式
在本申请实施例使用的术语仅仅是出于描述特定实施例的目的,而非限制本申请。本申请和权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其它含义。还应当理解,本文中使用的术语“和/或”是指包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本申请实施例可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本申请范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,此外,所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
本申请实施例中提出一种图像查询方法,也可以称为图像检索方法,参见图1所示,为该图像查询方法的流程示意图,该图像查询方法可以包括:
步骤101、获取初始图像,该初始图像包括第一感兴趣区域和第一噪音区域。
步骤102、基于该初始图像生成候选图像,该候选图像可以包括第二感兴趣区域和第二噪音区域。其中,第二感兴趣区域的图像特征与第一感兴趣区域的图像特征匹配,第二噪音区域的图像特征与第一噪音区域的图像特征不匹配。
示例性的,基于该初始图像生成候选图像,可以包括但不限于:基于已获取的生成条件确定该初始图像中的第一噪音区域;对该初始图像中的第一噪音区域进行调整,得到第二噪音区域,并通过第二噪音区域替换该初始图像中的第一噪音区域,得到候选图像,即候选图像包括的是第二噪音区域。
示例性的,对该初始图像中的第一噪音区域进行调整,得到第二噪音区域,可以包括但不限于:若该生成条件是姿态生成条件,该第一噪音区域包括目标对象对应的初始姿态,则对目标对象对应的初始姿态进行调整,得到目标对象对应的目标姿态,并基于该目标姿态生成第二噪音区域。若该生成条件是角度生成条件,该第一噪音区域包括目标对象对应的初始角度,则对目标对象对应的初始角度进行调整,得到目标对象对应的目标角度,并基于该目标角度生成第二噪音区域。若该生成条件是光照生成条件,该第一噪音区域包括初始光照,则对初始光照进行调整,得到目标光照,并基于该目标光照生成第二噪音区域。若该生成条件是背景生成条件,该第一噪音区域包括初始背景,则对初始背景进行调整,得到目标背景,并基于该目标背景生成第二噪音区域。
示例性的,基于已获取的生成条件确定该初始图像中的第一噪音区域之前,还可以获取已配置的生成条件;或者,可以对该初始图像进行分析,并基于分析结果确定生成条件。示例性的,基于分析结果确定生成条件,可以包括但不限于:若该分析结果表示需要增强目标对象的姿态特征表达能力,则确定生成条件是姿态生成条件;若该分析结果表示需要增强目标对象的角度特征表达能力,则确定生成条件是角度生成条件;若该分析结果表示需要增强初始图像的光照特征表达能力,则确定生成条件是光照生成条件;若该分析结果表示需要增强初始图像的背景表达能力,则确定生成条件是背景生成条件。
步骤103、基于该初始图像和该候选图像,从图像数据库中查询与该初始图像对应的目标图像;其中,图像数据库用于记录具有身份信息的图像。
在一种可能的实施方式中,基于该初始图像和该候选图像,从图像数据库中查询与该初始图像对应的目标图像,可以包括但不限于:基于该初始图像对应的特征和该候选图像对应的特征生成融合特征;基于该融合特征与该图像数据库中的每个图像之间的相似度,从该图像数据库中查询与该初始图像对应的目标图像;或者,针对该图像数据库中的每个图像,基于该图像与该初始图像对应的特征之间的相似度以及该图像与该候选图像对应的特征之间的相似度,确定该图像对应的融合相似度;基于该图像数据库中的每个图像对应的融合相似度,从该图像数据库中查询与该初始图像对应的目标图像。
示例性的,该初始图像对应的特征包括D个特征维度的第一特征值,该候选图像对应的特征包括D个特征维度的第二特征值,且该融合特征包括D个特征维度的融合特征值。基于此,基于该初始图像对应的特征和该候选图像对应的特征生成融合特征,包括但不限于:针对每个特征维度,将该特征维度的第一特征值和该特征维度的第二特征值的平均值,确定为该特征维度的融合特征值;基于所有特征维度的融合特征值生成该融合特征;或者,针对每个特征维度,将该特征维度的第一特征值和该特征维度的第二特征值的最大值,确定为该特征维度的融合特征值;基于所有特征维度的融合特征值生成该融合特征。
示例性的,基于该初始图像和该候选图像,从图像数据库中查询与该初始图像对应的目标图像,可以包括但不限于:确定该初始图像中目标对象的目标类型;基于该初始图像和该候选图像,从该目标类型对应的图像数据库中查询与该初始图像对应的目标图像;其中,该目标类型可以为车辆类型、或该目标类型可以为人员类型、或该目标类型可以为商品类型。
由以上技术方案可见,本申请实施例中,基于初始图像生成候选图像,并基于初始图像和候选图像从图像数据库中查询与初始图像对应的目标图像,也就是说,基于多帧图像的特征(初始图像的特征和候选图像的特征)查询与初始图像匹配的目标图像,能够查询到准确的目标图像,即查询出准确的目标图像,图像的查询结果正确。在使用图像查询功能时,即使无法提供多帧初始图像,只能提供一帧初始图像,也可以基于一帧初始图像生成至少一帧候选图像,继而基于多帧图像查询目标图像,显著提升图像查询功能的性能,使得基于多帧图像的查询功能发挥作用,实现多图查询功能。能够根据一帧初始图像生成更丰富的多帧候选图像,生成多样性的候选图像,丰富了查询目标的表达形式,实现基于多帧图像的图像查询,查询结果更加可靠准确,提升查询性能。
以下结合具体实施例,对本申请实施例的技术方案进行说明。
图像查询系统用于实现图像查询功能,图像查询系统也可以称为图像检索系统,图像检索系统用于实现图像检索功能(即图像查询功能),为了方便描述,以图像查询系统为例。在图像查询系统中,通常需要维护图像数据库,该图像数据库用于记录具有身份信息的图像,也就是说,针对图像数据库中的每帧图像,均具有身份信息,该身份信息用于表示图像的相关属性。
比如说,若图像数据库是针对车辆类型的图像数据库,则图像数据库中每帧图像均是车辆图像,车辆图像对应的身份信息可以包括但不限于:车牌标识、车辆颜色、车主信息、车辆型号、车辆外观,对此不做限制等。若图像数据库是针对人员类型的图像数据库,则图像数据库中每帧图像均是人员图像,人员图像对应的身份信息可以包括但不限于:人脸特征、身份证号码、手机号码、家庭地址、性别等,对此不做限制。若图像数据库是针对商品类型的图像数据库,则图像数据库中每帧图像均是商品图像,商品图像对应的身份信息可以包括但不限于:商品标识、商品价格、出产地、商品数量等,对此不做限制。
示例性的,在图像查询系统中,图像查询是指从图像数据库中查询出与初始图像(即用户输入给图像查询系统的图像)匹配的目标图像的过程。
比如说,用户向图像查询系统输入一帧初始图像,图像查询系统在得到该初始图像后,获取该初始图像的特征(如颜色、形状、纹理等特征),并计算该初始图像的特征与图像数据库中的每帧图像的特征之间的相似度,并将相似度最大的图像作为与该初始图像匹配的目标图像。由于目标图像具有身份信息,因此,图像查询系统将目标图像对应的身份信息作为该初始图像对应的身份信息,即该初始图像也是归属于这个身份信息的图像,从而实现图像查询过程。
但是,图像查询系统基于初始图像的特征与图像数据库中的每帧图像的特征之间的相似度,查询与初始图像匹配的目标图像时,可能无法查询到准确的目标图像,即图像查询系统查询出错误的目标图像,图像查询结果错误。
为了提高图像查询的准确率,在图像查询过程中,可以基于多帧初始图像实现图像查询,从而显著提升图像查询系统的性能。但是,用户在使用图像查询系统时,通常无法提供多帧初始图像,大多数情况下只能提供一帧初始图像,从而导致无法基于多帧初始图像实现图像查询,基于多帧初始图像的图像查询功能无法发挥作用,极大地限制了基于多帧初始图像进行图像查询的应用范围。
针对上述发现,本申请实施例中提出一种图像查询方法,可以基于初始图像生成候选图像,并基于初始图像和候选图像实现图像查询,即基于多帧图像实现图像查询,基于多帧图像的图像查询功能能够发挥作用,提高图像查询的准确率,显著提升图像查询系统的性能,能够查询到准确的目标图像。在使用图像查询功能时,即使无法提供多帧初始图像,只能提供一帧初始图像,也可以基于一帧初始图像生成至少一帧候选图像,继而基于多帧图像查询目标图像。
在上述应用场景下,本申请实施例中提出一种图像查询方法,该方法可以应用于图像查询系统,图像查询系统也可以称为图像检索系统,参见图2所示,为该图像查询方法的流程示意图,该图像查询方法可以包括以下步骤:
步骤201、获取初始图像,该初始图像包括第一感兴趣区域和第一噪音区域。
示例性的,用户可以向图像查询系统输入图像,为区分方便,将用户输入的图像称为初始图像,即图像查询系统可以获取初始图像。当然,图像查询系统也可以采用其它方式获取初始图像,对此初始图像的获取方式不做限制。
示例性的,图像查询系统可以获取一帧初始图像,也可以获取至少两帧初始图像,对此初始图像的数量不做限制,后续以一帧初始图像为例。当初始图像的数量为至少两帧时,每帧初始图像的处理方式相同,本实施例中不再赘述。
示例性的,针对初始图像来说,可以将初始图像划分为感兴趣区域和噪音区域,为了区分方便,将初始图像中的感兴趣区域称为第一感兴趣区域,将初始图像中的噪音区域称为第一噪音区域。第一感兴趣区域是用户关注的图像区域,在基于初始图像生成候选图像时,不能对第一感兴趣区域进行调整,即第一感兴趣区域是不会发生变化的区域,如果第一感兴趣区域发生变化,则会导致初始图像的查询出现异常,无法查询到准确的目标图像。第一噪音区域是用户不关注的图像区域,在基于初始图像生成候选图像时,能够对第一噪音区域进行调整,即第一噪音区域是可能发生变化的区域,即使第一噪音区域发生变化,也不会导致初始图像的查询出现异常,仍然能够查询到准确的目标图像。
关于第一感兴趣区域和第一噪音区域,可以配置第一感兴趣区域的位置信息(如第一感兴趣区域是矩形区域时,该位置信息可以包括左上角坐标、右上角坐标、右下角坐标和左下角坐标,或,该位置信息可以包括任一角点坐标(如左上角坐标)、及该矩形区域的宽度和高度,当然,上述只是示例,对此位置信息不做限制,只要基于该位置信息能够确定第一感兴趣区域即可),基于第一感兴趣区域的位置信息,就可以从初始图像中获取到第一感兴趣区域,并将初始图像中除第一感兴趣区域之外的剩余区域作为第一噪音区域。
关于第一感兴趣区域和第一噪音区域,图像查询系统可以对初始图像进行分析,得到第一感兴趣区域和第一噪音区域。比如说,针对人员类型的初始图像,人脸区域是用户关注的图像区域,不能对人脸区域进行修改(人脸区域修改的话就是另一人脸,导致图像查询出现异常),因此,可以从该初始图像中分析出人脸区域,并将初始图像中的人脸区域作为第一感兴趣区域,并将初始图像中除第一感兴趣区域之外的剩余区域作为第一噪音区域。又例如,针对车辆类型的初始图像,车牌区域是用户关注的图像区域,不能对车牌区域进行修改(车牌区域修改的话就是另一车牌,导致图像查询出现异常),因此,可以从该初始图像中分析出车牌区域,并将初始图像中的车牌区域作为第一感兴趣区域,并将初始图像中除第一感兴趣区域之外的剩余区域作为第一噪音区域。
当然,上述只是划分第一感兴趣区域和第一噪音区域的示例,对此不做限制,只要能够将初始图像划分为第一感兴趣区域和第一噪音区域即可。
在将初始图像划分为第一感兴趣区域和第一噪音区域之后,在基于初始图像生成候选图像时,不能对第一感兴趣区域进行调整,即第一感兴趣区域是不会发生变化的区域,能够对第一噪音区域进行调整,即第一噪音区域是可能发生变化的区域,即使第一噪音区域发生变化,也不会导致图像查询出现异常。
步骤202、基于该初始图像生成候选图像,该候选图像可以包括第二感兴趣区域和第二噪音区域。其中,第二感兴趣区域的图像特征与第一感兴趣区域的图像特征匹配,第二噪音区域的图像特征与第一噪音区域的图像特征不匹配。
比如说,候选图像中的第二感兴趣区域与初始图像中的第一感兴趣区域可以相同,因此,第二感兴趣区域的图像特征与第一感兴趣区域的图像特征可以匹配。候选图像中的第二噪音区域与初始图像中的第一噪音区域可以不同,因此,第二噪音区域的图像特征与第一噪音区域的图像特征可以不匹配。
初始图像包括第一感兴趣区域和第一噪音区域,第一感兴趣区域是不能进行调整的区域,即第一感兴趣区域不会发生变化,第一噪音区域是能够进行调整的区域,即第一噪音区域可以发生变化。在此基础上,针对步骤202,在基于初始图像生成候选图像时,保留初始图像中的第一感兴趣区域不变,即不对第一感兴趣区域进行调整,对初始图像中的第一噪音区域进行调整,得到调整后的第二噪音区域,使用第二噪音区域替换初始图像中的第一噪音区域,得到候选图像。显然,候选图像可以包括感兴趣区域和噪音区域,将候选图像中的感兴趣区域称为第二感兴趣区域,将候选图像中的噪音区域称为第二噪音区域。
在基于初始图像生成候选图像时,保留初始图像中的第一感兴趣区域不变,对初始图像中的第一噪音区域进行调整,则候选图像中的第二感兴趣区域与初始图像中的第一感兴趣区域相同,即第二感兴趣区域的图像特征与第一感兴趣区域的图像特征匹配,候选图像中的第二噪音区域与初始图像中的第一噪音区域不同,即第二噪音区域的图像特征与第一噪音区域的图像特征可以不匹配。
在一种可能的实施方式中,第一噪音区域可以包括多种待调整区域,比如说,针对人员类型的初始图像,可以对第一噪音区域中目标对象(如目标用户)的姿态进行调整,即目标对象的姿态作为待调整的第一噪音区域;或者,对第一噪音区域中目标对象的角度进行调整,即目标对象的角度作为待调整的第一噪音区域;或者,对第一噪音区域中的光照进行调整,即光照作为待调整的第一噪音区域;或者,对第一噪音区域中的背景进行调整,即背景作为待调整的第一噪音区域。针对车辆类型的初始图像,可以对第一噪音区域中的光照进行调整,即光照作为待调整的第一噪音区域;或者,对第一噪音区域中的背景进行调整,即背景作为待调整的第一噪音区域。针对商品类型的初始图像,可以对第一噪音区域中的光照进行调整,即光照作为待调整的第一噪音区域;或者,对第一噪音区域中的背景进行调整,即背景作为待调整的第一噪音区域。
当然,上述只是待调整的第一噪音区域的几个示例,对此不做限制。
为了获知对哪种类型的第一噪音区域进行调整,本实施例中,可以获取生成条件,基于已获取的生成条件,可以确定初始图像中的第一噪音区域,对该初始图像中的第一噪音区域进行调整,得到第二噪音区域,并通过第二噪音区域替换该初始图像中的第一噪音区域,得到候选图像。在基于初始图像生成候选图像时,保留初始图像中的第一感兴趣区域不变,对初始图像中的第一噪音区域进行调整,使得候选图像中的第二感兴趣区域与初始图像中的第一感兴趣区域相同,候选图像中的第二噪音区域与初始图像中的第一噪音区域不同。
示例性的,为了获取生成条件,可以获取已配置的生成条件。比如说,预先配置生成条件是姿态生成条件,则获取已配置的姿态生成条件,姿态生成条件表示对第一噪音区域中目标对象的姿态进行调整,即目标对象的姿态作为待调整的第一噪音区域。或者,预先配置生成条件是角度生成条件,则获取已配置的角度生成条件,角度生成条件表示对第一噪音区域中目标对象的角度进行调整,即目标对象的角度作为待调整的第一噪音区域。或者,预先配置生成条件是光照生成条件,则获取已配置的光照生成条件,光照生成条件表示对第一噪音区域中的光照进行调整,即光照作为待调整的第一噪音区域。或者,预先配置生成条件是背景生成条件,则获取已配置的背景生成条件,背景生成条件表示对第一噪音区域中的背景进行调整,即背景作为待调整的第一噪音区域。
示例性的,为了获取生成条件,可以对初始图像进行分析,并基于分析结果确定该初始图像对应的生成条件。比如说,若该分析结果表示需要增强目标对象的姿态特征表达能力(如初始图像中目标对象的姿态不符合预设姿态要求,对此预设姿态要求不做限制),则确定生成条件是姿态生成条件,姿态生成条件表示对第一噪音区域中目标对象的姿态进行调整,即目标对象的姿态作为待调整的第一噪音区域。或者,若该分析结果表示需要增强目标对象的角度特征表达能力(如初始图像中目标对象的角度不符合预设角度要求,对此预设角度要求不做限制),则确定生成条件是角度生成条件,角度生成条件表示对第一噪音区域中目标对象的角度进行调整,即目标对象的角度作为待调整的第一噪音区域。或者,若该分析结果表示需要增强初始图像的光照特征表达能力(如初始图像中光照不符合预设光照要求,对此预设光照要求不做限制),则确定生成条件是光照生成条件,光照生成条件表示对第一噪音区域中的光照进行调整,即光照作为待调整的第一噪音区域。或者,若该分析结果表示需要增强初始图像的背景表达能力(如初始图像中背景不符合预设背景要求,对此预设背景要求不做限制),则确定生成条件是背景生成条件,背景生成条件表示对第一噪音区域中的背景进行调整,即背景作为待调整的第一噪音区域。
当然,姿态生成条件、角度生成条件、光照生成条件和背景生成条件,只是生成条件的几个示例,对此不做限制,还可以是其它类型的生成条件。上述生成条件的获取方式也只是示例,对此不做限制。示例性的,生成条件可以为姿态生成条件、角度生成条件、光照生成条件和背景生成条件中的一个,也可以为姿态生成条件、角度生成条件、光照生成条件和背景生成条件中的至少两个,比如说,已配置的生成条件是姿态生成条件和光照生成条件,基于分析结果确定的生成条件是姿态生成条件、光照生成条件和背景生成条件,以此类推。
示例性的,基于已获取的生成条件,可以确定初始图像中与该生成条件对应的第一噪音区域,并对该初始图像中的第一噪音区域进行调整,得到第二噪音区域。比如说,若该生成条件是姿态生成条件,则需要对第一噪音区域中目标对象的姿态(为区分方便,将该姿态称为初始姿态)进行调整,因此,从第一噪音区域中确定出目标对象对应的初始姿态,即第一噪音区域包括目标对象对应的初始姿态,对目标对象对应的初始姿态进行调整(对此调整方式不做限制,只要改变初始姿态即可),得到目标对象对应的目标姿态(即初始姿态对应的调整后姿态),并基于该目标姿态生成第二噪音区域,即通过目标姿态替换第一噪音区域中的初始姿态,将替换后的第一噪音区域作为第二噪音区域。
又例如,若该生成条件是角度生成条件,则需要对第一噪音区域中目标对象的角度(为区分方便,将该角度称为初始角度)进行调整,因此,从第一噪音区域中确定出目标对象对应的初始角度,即第一噪音区域包括目标对象对应的初始角度,对目标对象对应的初始角度进行调整(对此调整方式不做限制,只要改变初始角度即可),得到目标对象对应的目标角度(即初始角度对应的调整后角度),并基于该目标角度生成第二噪音区域,即通过目标角度替换第一噪音区域中的初始角度,将替换后的第一噪音区域作为第二噪音区域。
又例如,若该生成条件是光照生成条件,则需要对第一噪音区域中的光照(为区分方便,将该光照称为初始光照)进行调整,因此,从第一噪音区域中确定出初始光照,即第一噪音区域包括初始光照,对初始光照进行调整(对此调整方式不做限制,只要改变初始光照即可),得到目标光照(即初始光照对应的调整后光照),并基于该目标光照生成第二噪音区域,即通过目标光照替换第一噪音区域中的初始光照,将替换后的第一噪音区域作为第二噪音区域。
又例如,若该生成条件是背景生成条件,则需要对第一噪音区域中的背景(为区分方便,将该背景称为初始背景)进行调整,因此,从第一噪音区域中确定出初始背景,即第一噪音区域包括初始背景,对初始背景进行调整(对此调整方式不做限制,只要改变初始背景即可),得到目标背景(即初始背景对应的调整后背景),并基于该目标背景生成第二噪音区域,即通过目标背景替换第一噪音区域中的初始背景,将替换后的第一噪音区域作为第二噪音区域。
示例性的,若生成条件为姿态生成条件、角度生成条件、光照生成条件和背景生成条件中的至少两个,则可以对该初始图像中的第一噪音区域进行至少两种调整,得到调整后的第二噪音区域。比如说,若生成条件为姿态生成条件和光照生成条件,则从第一噪音区域中确定出目标对象对应的初始姿态,对目标对象对应的初始姿态进行调整,得到目标对象对应的目标姿态,以及,从第一噪音区域中确定出初始光照,对初始光照进行调整,得到目标光照。在此基础上,通过目标姿态替换第一噪音区域中的初始姿态,并通过目标光照替换第一噪音区域中的初始光照,将替换后的第一噪音区域作为第二噪音区域。
综上所述,可以对初始图像中的第一噪音区域进行调整,得到第二噪音区域。在此基础上,可以通过第二噪音区域替换初始图像中的第一噪音区域,得到候选图像。显然,候选图像中的第二感兴趣区域与初始图像中的第一感兴趣区域相同,且候选图像中的第二噪音区域与初始图像中的第一噪音区域不同。
示例性的,在基于初始图像生成候选图像时,可以生成至少一帧候选图像,如生成两帧候选图像、三帧候选图像、四帧候选图像、五帧候选图像等,对此候选图像的数量不做限制。比如说,若需要生成三帧候选图像,那么:
若生成条件是姿态生成条件,则将目标对象对应的初始姿态调整为目标姿态1,通过目标姿态1替换第一噪音区域中的初始姿态,得到第二噪音区域1,并通过第二噪音区域1替换初始图像中的第一噪音区域,得到候选图像1;将目标对象对应的初始姿态调整为目标姿态2,通过目标姿态2替换第一噪音区域中的初始姿态,得到第二噪音区域2,并通过第二噪音区域2替换初始图像中的第一噪音区域,得到候选图像2;将目标对象对应的初始姿态调整为目标姿态3,通过目标姿态3替换第一噪音区域中的初始姿态,得到第二噪音区域3,并通过第二噪音区域3替换初始图像中的第一噪音区域,得到候选图像3。
以此类推,若生成条件是背景生成条件,则可以将初始背景调整为目标背景1,通过目标背景1替换第一噪音区域中的初始背景,得到第二噪音区域1,并通过第二噪音区域1替换初始图像中的第一噪音区域,得到候选图像1;可以将初始背景调整为目标背景2(与目标背景1不同),通过目标背景2替换第一噪音区域中的初始背景,得到第二噪音区域2,并通过第二噪音区域2替换初始图像中的第一噪音区域,得到候选图像2;可以将初始背景调整为目标背景3,通过目标背景3替换第一噪音区域中的初始背景,得到第二噪音区域3,并通过第二噪音区域3替换初始图像中的第一噪音区域,得到候选图像3。
综上所述,在步骤202中,可以基于初始图像生成至少一帧候选图像,即生成该初始图像中目标对象在不同生成条件下的候选图像,如不同姿态、不同角度、不同光照或者不同背景下的候选图像,候选图像不改变初始图像中目标对象的身份信息(通过第二感兴趣区域与第一感兴趣区域相同保证身份信息不变),候选图像能够增强初始图像的特征表达能力(通过第二噪音区域与第一噪音区域不同增强特征表达能力),增强特征鲁棒性,取得更好的查询结果。
比如说,给定在背景A下、光照较暗、正面的初始图像,可以生成背景B下(即将初始背景调整为目标背景)、光照正常(即将初始光照调整为目标光照)、正面的候选图像1。生成背景B下、光照正常、侧面(即将初始角度调整为目标角度)的候选图像2。生成背景C下(即将初始背景调整为目标背景)、光照正常、正面的候选图像3。生成背景C下、光照正常、侧面的候选图像4。生成背景A下、光照正常、正面的候选图像5。综上所述,基于一帧原始图像,可以得到五帧候选图像,当然,上述五帧候选图像只是示例,对此不做限制。
又例如,若用户关心目标对象在特定背景(即特定场景)中是否出现,且用户仅能提供非特定背景下的初始图像,那么,可以将初始图像中的非特定背景替换为特定背景,得到特定背景下的候选图像,即生成候选图像进行图像查询。通过生成特定背景下的候选图像进行查询,可以减少背景信息的干扰,使得在计算目标对象的相似度时更关注前景目标,即需要查找的目标对象本身。
步骤203、基于初始图像对应的特征和候选图像对应的特征生成融合特征。
比如说,基于初始图像对应的特征和至少一帧候选图像对应的特征融合成一个融合特征用于查询。例如,采用均值融合方式或者极大值融合方式,将初始图像对应的特征和至少一帧候选图像对应的特征融合成一个融合特征。
示例性的,初始图像对应的特征包括D个特征维度的第一特征值,候选图像对应的特征包括D个特征维度的第二特征值,且融合特征包括D个特征维度的融合特征值。基于此,针对每个特征维度,可以将该特征维度的第一特征值和该特征维度的第二特征值的平均值,确定为该特征维度的融合特征值;基于所有特征维度的融合特征值生成该融合特征。或者,针对每个特征维度,可以将该特征维度的第一特征值和该特征维度的第二特征值的最大值,确定为该特征维度的融合特征值;基于所有特征维度的融合特征值生成该融合特征。
比如说,融合特征的计算公式的一个示例,可以参见如下公式所示:
在上述公式中,N表示图像总数量(即初始图像和候选图像的总数量),n的取值范围是1-N,表示第n帧图像(可以是初始图像或候选图像),D表示特征维度的总数量,i的取值范围是1-D,表示第i个特征维度。fi Q表示第i个特征维度的融合特征值,fi n表示第n帧图像的第i个特征维度的特征值(即初始图像中的第一特征值,或者,候选图像中的第二特征值)。基于上述公式,针对特征维度i,可以将所有N帧图像对应的特征维度i的特征值的平均值,作为特征维度i的融合特征值,而所有D个特征维度的融合特征值就组成融合特征。
当然,上述公式是以均值融合方式为例,在采用极大值融合方式时,每一特征维度的融合特征值取N帧图像对应的该特征维度的特征值的最大值即可。
步骤204、基于该融合特征与图像数据库(用于记录具有身份信息的图像)中每个图像之间的相似度,从图像数据库中查询与该初始图像对应的目标图像。
比如说,计算该融合特征与图像数据库中的每个图像的特征之间的相似度,对此相似度的计算方式不做限制。基于该融合特征与每个图像的特征之间的相似度,可以从所有相似度中选取最大相似度,并将最大相似度对应的图像(即图像数据库中的图像)作为与该初始图像对应的目标图像。
又例如,计算该融合特征与图像数据库中的每个图像的特征之间的相似度,基于该融合特征与每个图像的特征之间的相似度,按照相似度从大到小的顺序对图像数据库中的图像进行排序,基于排序结果选取靠前的K(K为正整数)个图像(即图像数据库中的图像)作为与该初始图像对应的目标图像。
综上所述,可以得到与初始图像对应的目标图像,由于目标图像具有身份信息,因此,图像查询系统将目标图像对应的身份信息作为该初始图像对应的身份信息,即该初始图像也是归属于这个身份信息的图像,实现图像查询过程。
在一种可能的实施方式中,还可以确定该初始图像中目标对象的目标类型,并从该目标类型对应的图像数据库中查询与该初始图像对应的目标图像。比如说,基于该融合特征与该目标类型对应的图像数据库中每个图像之间的相似度,从该目标类型对应的图像数据库中查询与该初始图像对应的目标图像。
其中,目标类型可以为车辆类型、或目标类型可以为人员类型、或目标类型可以为商品类型。当然,上述只是目标类型的几个示例,对此不做限制。示例性的,若目标类型为车辆类型,则目标类型对应的图像数据库是针对车辆类型的图像数据库,图像数据库中每帧图像均是车辆图像。若目标类型为人员类型,则目标类型对应的图像数据库是针对人员类型的图像数据库,图像数据库中每帧图像均是人员图像。若目标类型为商品类型,则目标类型对应的图像数据库是针对商品类型的图像数据库,图像数据库中每帧图像均是商品图像。
本申请实施例中提出一种图像查询方法,该方法可以应用于图像查询系统,参见图3所示,为该图像查询方法的流程示意图,该方法可以包括以下步骤:
步骤301、获取初始图像,该初始图像包括第一感兴趣区域和第一噪音区域。
步骤302、基于该初始图像生成候选图像,该候选图像可以包括第二感兴趣区域和第二噪音区域。其中,第二感兴趣区域的图像特征与第一感兴趣区域的图像特征匹配,第二噪音区域的图像特征与第一噪音区域的图像特征不匹配。
示例性的,步骤301-步骤302可以参见步骤201-步骤202,在此不再赘述。
步骤303、针对图像数据库(图像数据库用于记录具有身份信息的图像)中的每个图像,基于该图像与该初始图像对应的特征之间的相似度以及该图像与该候选图像对应的特征之间的相似度,确定该图像对应的融合相似度。
比如说,将初始图像对应的特征和至少一帧候选图像对应的特征组成一个特征集合,该特征集合包括初始图像对应的特征和每个候选图像对应的特征。针对图像数据库中的每个图像,计算该图像的特征与特征集合中的每个特征之间的相似度,然后,计算这些相似度的平均值,作为该图像对应的融合相似度。
比如说,融合相似度的计算公式的一个示例,可以参见如下公式所示:
在上述公式中,N表示图像总数量(即初始图像和候选图像的总数量),n的取值范围是1-N,表示第n帧图像(可以是初始图像或候选图像),表示图像数据库中的第m张图像与特征集合中的所有特征之间的融合相似度,即图像数据库中的第m张图像对应的融合相似度。表示第n帧图像(即特征集合中的第n个特征)与图像数据库中的第m张图像之间的相似度。
步骤304、基于该图像数据库中的每个图像对应的融合相似度,从该图像数据库中查询与该初始图像对应的目标图像。比如说,将融合相似度最大的图像(即图像数据库中的图像)作为该初始图像对应的目标图像。又例如,按照融合相似度从大到小的顺序对图像数据库中的图像进行排序,基于排序结果选取靠前的K个图像(即图像数据库中的图像)作为该初始图像对应的目标图像。
综上所述,可以得到与初始图像对应的目标图像,由于目标图像具有身份信息,因此,图像查询系统将目标图像对应的身份信息作为该初始图像对应的身份信息,即该初始图像也是归属于这个身份信息的图像,实现图像查询过程。
在一种可能的实施方式中,还可以确定该初始图像中目标对象的目标类型,并从该目标类型对应的图像数据库中查询与该初始图像对应的目标图像。比如说,针对该目标类型对应的图像数据库中的每个图像,基于该图像与该初始图像对应的特征之间的相似度以及该图像与该候选图像对应的特征之间的相似度,确定该图像对应的融合相似度。基于该目标类型对应的图像数据库中的每个图像对应的融合相似度,从该目标类型对应的图像数据库中查询与该初始图像对应的目标图像。其中,目标类型可以为车辆类型、或目标类型可以为人员类型、或目标类型可以为商品类型。当然,上述只是目标类型的示例,对此不做限制。
由以上技术方案可见,本申请实施例中,可以基于多帧图像的特征查询与初始图像匹配的目标图像,能够查询到准确的目标图像,图像的查询结果正确。在使用图像查询功能时,即使无法提供多帧初始图像,只能提供一帧初始图像,也可以基于一帧初始图像生成至少一帧候选图像,继而基于多帧图像查询目标图像,显著提升图像查询功能的性能,使得基于多帧图像的查询功能发挥作用,实现多图查询功能。能够根据一帧初始图像生成更丰富的多帧候选图像,生成多样性的候选图像,丰富了查询目标的表达形式,实现基于多帧图像的图像查询,查询结果更加可靠准确,形成的查询特征集的检索结果更加鲁棒,扩大了基于多图查询的技术的应用范围,提升图像查询系统的查询性能。
基于与上述方法同样的申请构思,本申请实施例中提出一种图像查询装置,参见图4所示,为所述图像查询装置的结构示意图,所述装置可以包括:
获取模块41,用于获取初始图像,所述初始图像包括第一感兴趣区域和第一噪音区域;生成模块42,用于基于所述初始图像生成候选图像,所述候选图像包括第二感兴趣区域和第二噪音区域;其中,所述第二感兴趣区域的图像特征与所述第一感兴趣区域的图像特征匹配,且所述第二噪音区域的图像特征与所述第一噪音区域的图像特征不匹配;查询模块43,用于基于所述初始图像和所述候选图像,从图像数据库中查询与所述初始图像对应的目标图像;其中,所述图像数据库用于记录具有身份信息的图像。
示例性的,所述生成模42块基于所述初始图像生成候选图像时具体用于:基于已获取的生成条件确定所述初始图像中的第一噪音区域,并对所述初始图像中的第一噪音区域进行调整,得到第二噪音区域;以及,通过所述第二噪音区域替换所述初始图像中的第一噪音区域,得到所述候选图像。
示例性的,所述生成模块42对所述初始图像中的第一噪音区域进行调整,得到第二噪音区域时具体用于:若所述生成条件是姿态生成条件,且所述第一噪音区域包括目标对象对应的初始姿态,则对所述目标对象对应的初始姿态进行调整,得到所述目标对象对应的目标姿态,并基于所述目标姿态生成第二噪音区域;若所述生成条件是角度生成条件,且所述第一噪音区域包括目标对象对应的初始角度,则对所述目标对象对应的初始角度进行调整,得到所述目标对象对应的目标角度,并基于所述目标角度生成第二噪音区域;若所述生成条件是光照生成条件,且所述第一噪音区域包括初始光照,则对所述初始光照进行调整,得到目标光照,并基于所述目标光照生成第二噪音区域;若所述生成条件是背景生成条件,且所述第一噪音区域包括初始背景,则对所述初始背景进行调整,得到目标背景,并基于所述目标背景生成第二噪音区域。
示例性的,所述获取模块41,还用于获取已配置的生成条件;或者,对所述初始图像进行分析,基于分析结果确定生成条件;其中,所述获取模块基于分析结果确定生成条件时具体用于:若所述分析结果表示需要增强目标对象的姿态特征表达能力,则确定所述生成条件是姿态生成条件;或者,若所述分析结果表示需要增强目标对象的角度特征表达能力,则确定所述生成条件是角度生成条件;或者,若所述分析结果表示需要增强初始图像的光照特征表达能力,则确定所述生成条件是光照生成条件;或者,若所述分析结果表示需要增强初始图像的背景表达能力,则确定所述生成条件是背景生成条件。
示例性的,所述查询模块43基于所述初始图像和所述候选图像,从图像数据库中查询与所述初始图像对应的目标图像时具体用于:基于初始图像对应的特征和所述候选图像对应的特征生成融合特征;基于所述融合特征与所述图像数据库中的每个图像之间的相似度,从所述图像数据库中查询与所述初始图像对应的目标图像;或者,针对所述图像数据库中的每个图像,基于该图像与所述初始图像对应的特征之间的相似度以及该图像与所述候选图像对应的特征之间的相似度,确定该图像对应的融合相似度;基于所述图像数据库中的每个图像对应的融合相似度,从图像数据库中查询与所述初始图像对应的目标图像。
示例性的,所述初始图像对应的特征包括D个特征维度的第一特征值,所述候选图像对应的特征包括D个特征维度的第二特征值,所述融合特征包括D个特征维度的融合特征值;所述查询模块43基于初始图像对应的特征和所述候选图像对应的特征生成融合特征时具体用于:针对每个特征维度,将该特征维度的第一特征值和该特征维度的第二特征值的平均值,确定为该特征维度的融合特征值;基于所有特征维度的融合特征值生成融合特征;或者,针对每个特征维度,将该特征维度的第一特征值和该特征维度的第二特征值的最大值,确定为该特征维度的融合特征值;基于所有特征维度的融合特征值生成融合特征。
示例性的,所述查询模块43基于所述初始图像和所述候选图像,从图像数据库中查询与所述初始图像对应的目标图像时具体用于:确定所述初始图像中目标对象的目标类型;基于所述初始图像和所述候选图像,从所述目标类型对应的图像数据库中查询与所述初始图像对应的目标图像;其中,所述目标类型为车辆类型、或所述目标类型为人员类型、或所述目标类型为商品类型。
基于与上述方法同样的申请构思,本申请实施例中提出一种图像查询设备,参见图5所示,图像查询设备包括:处理器51和机器可读存储介质52,机器可读存储介质52存储有能够被处理器51执行的机器可执行指令;所述处理器51用于执行机器可执行指令,以实现本申请上述示例公开的图像查询方法。
基于与上述方法同样的申请构思,本申请实施例还提供一种机器可读存储介质,所述机器可读存储介质上存储有若干计算机指令,所述计算机指令被处理器执行时,能够实现本申请上述示例公开的图像查询方法。
其中,上述机器可读存储介质可以是任何电子、磁性、光学或其它物理存储装置,可以包含或存储信息,如可执行指令、数据,等等。例如,机器可读存储介质可以是:RAM(Radom Access Memory,随机存取存储器)、易失存储器、非易失性存储器、闪存、存储驱动器(如硬盘驱动器)、固态硬盘、任何类型的存储盘(如光盘、dvd等),或者类似的存储介质,或者它们的组合。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机,计算机的具体形式可以是个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件收发设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任意几种设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可以由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其它可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其它可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
而且,这些计算机程序指令也可以存储在能引导计算机或其它可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或者多个流程和/或方框图一个方框或者多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其它可编程数据处理设备上,使得在计算机或者其它可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其它可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。
Claims (10)
1.一种图像查询方法,其特征在于,所述方法包括:
获取初始图像,所述初始图像包括第一感兴趣区域和第一噪音区域;
基于所述初始图像生成候选图像,所述候选图像包括第二感兴趣区域和第二噪音区域;所述第二感兴趣区域的图像特征与所述第一感兴趣区域的图像特征匹配,所述第二噪音区域的图像特征与所述第一噪音区域的图像特征不匹配;
基于所述初始图像和所述候选图像,从图像数据库中查询与所述初始图像对应的目标图像;其中,所述图像数据库用于记录具有身份信息的图像。
2.根据权利要求1所述的方法,其特征在于,
所述基于所述初始图像生成候选图像,包括:
基于已获取的生成条件确定所述初始图像中的第一噪音区域;
对所述初始图像中的第一噪音区域进行调整,得到第二噪音区域,通过所述第二噪音区域替换所述初始图像中的第一噪音区域,得到所述候选图像。
3.根据权利要求2所述的方法,其特征在于,所述对所述初始图像中的第一噪音区域进行调整,得到第二噪音区域,包括:
若所述生成条件是姿态生成条件,所述第一噪音区域包括目标对象对应的初始姿态,则对所述目标对象对应的初始姿态进行调整,得到所述目标对象对应的目标姿态,基于所述目标姿态生成第二噪音区域;
若所述生成条件是角度生成条件,所述第一噪音区域包括目标对象对应的初始角度,则对所述目标对象对应的初始角度进行调整,得到所述目标对象对应的目标角度,基于所述目标角度生成第二噪音区域;
若所述生成条件是光照生成条件,所述第一噪音区域包括初始光照,则对所述初始光照进行调整,得到目标光照,基于所述目标光照生成第二噪音区域;
若所述生成条件是背景生成条件,所述第一噪音区域包括初始背景,则对所述初始背景进行调整,得到目标背景,基于所述目标背景生成第二噪音区域。
4.根据权利要求2或3所述的方法,其特征在于,所述基于已获取的生成条件确定所述初始图像中的第一噪音区域之前,所述方法还包括:
获取已配置的生成条件;或者,对所述初始图像进行分析,基于分析结果确定生成条件;其中,所述基于分析结果确定生成条件包括:
若所述分析结果表示需要增强目标对象的姿态特征表达能力,则确定生成条件是姿态生成条件;若所述分析结果表示需要增强目标对象的角度特征表达能力,则确定生成条件是角度生成条件;若所述分析结果表示需要增强初始图像的光照特征表达能力,则确定生成条件是光照生成条件;若所述分析结果表示需要增强初始图像的背景表达能力,则确定生成条件是背景生成条件。
5.根据权利要求1所述的方法,其特征在于,所述基于所述初始图像和所述候选图像,从图像数据库中查询与所述初始图像对应的目标图像,包括:
基于所述初始图像对应的特征和所述候选图像对应的特征生成融合特征;基于所述融合特征与所述图像数据库中的每个图像之间的相似度,从所述图像数据库中查询与所述初始图像对应的目标图像;或者,
针对所述图像数据库中的每个图像,基于该图像与所述初始图像对应的特征之间的相似度以及该图像与所述候选图像对应的特征之间的相似度,确定该图像对应的融合相似度;基于所述图像数据库中的每个图像对应的融合相似度,从所述图像数据库中查询与所述初始图像对应的目标图像。
6.根据权利要求5所述的方法,其特征在于,所述初始图像对应的特征包括D个特征维度的第一特征值,所述候选图像对应的特征包括D个特征维度的第二特征值,且所述融合特征包括D个特征维度的融合特征值;所述基于所述初始图像对应的特征和所述候选图像对应的特征生成融合特征,包括:
针对每个特征维度,将该特征维度的第一特征值和该特征维度的第二特征值的平均值,确定为该特征维度的融合特征值;基于所有特征维度的融合特征值生成所述融合特征;或者,针对每个特征维度,将该特征维度的第一特征值和该特征维度的第二特征值的最大值,确定为该特征维度的融合特征值;基于所有特征维度的融合特征值生成所述融合特征。
7.根据权利要求1所述的方法,其特征在于,所述基于所述初始图像和所述候选图像,从图像数据库中查询与所述初始图像对应的目标图像,包括:
确定初始图像中目标对象的目标类型;基于所述初始图像和所述候选图像,从所述目标类型对应的图像数据库中查询与所述初始图像对应的目标图像;
其中,所述目标类型为车辆类型、或人员类型、或商品类型。
8.一种图像查询装置,其特征在于,所述装置包括:
获取模块,用于获取初始图像,所述初始图像包括第一感兴趣区域和第一噪音区域;生成模块,用于基于所述初始图像生成候选图像,所述候选图像包括第二感兴趣区域和第二噪音区域;其中,所述第二感兴趣区域的图像特征与所述第一感兴趣区域的图像特征匹配,且所述第二噪音区域的图像特征与所述第一噪音区域的图像特征不匹配;查询模块,用于基于所述初始图像和所述候选图像,从图像数据库中查询与所述初始图像对应的目标图像;其中,所述图像数据库用于记录具有身份信息的图像。
9.根据权利要求8所述的装置,其特征在于,
其中,所述生成模块基于所述初始图像生成候选图像时具体用于:基于已获取的生成条件确定所述初始图像中的第一噪音区域,并对所述初始图像中的第一噪音区域进行调整,得到第二噪音区域;以及,通过所述第二噪音区域替换所述初始图像中的第一噪音区域,得到所述候选图像;
其中,所述生成模块对所述初始图像中的第一噪音区域进行调整,得到第二噪音区域时具体用于:若所述生成条件是姿态生成条件,且所述第一噪音区域包括目标对象对应的初始姿态,则对所述目标对象对应的初始姿态进行调整,得到所述目标对象对应的目标姿态,并基于所述目标姿态生成第二噪音区域;若所述生成条件是角度生成条件,且所述第一噪音区域包括目标对象对应的初始角度,则对所述目标对象对应的初始角度进行调整,得到所述目标对象对应的目标角度,并基于所述目标角度生成第二噪音区域;若所述生成条件是光照生成条件,且所述第一噪音区域包括初始光照,则对所述初始光照进行调整,得到目标光照,并基于所述目标光照生成第二噪音区域;若所述生成条件是背景生成条件,且所述第一噪音区域包括初始背景,则对所述初始背景进行调整,得到目标背景,并基于所述目标背景生成第二噪音区域;
其中,所述获取模块,还用于获取已配置的生成条件;或者,对所述初始图像进行分析,基于分析结果确定生成条件;其中,所述获取模块基于分析结果确定生成条件时具体用于:若所述分析结果表示需要增强目标对象的姿态特征表达能力,则确定所述生成条件是姿态生成条件;或者,若所述分析结果表示需要增强目标对象的角度特征表达能力,则确定所述生成条件是角度生成条件;或者,若所述分析结果表示需要增强初始图像的光照特征表达能力,则确定所述生成条件是光照生成条件;或者,若所述分析结果表示需要增强初始图像的背景表达能力,则确定所述生成条件是背景生成条件;
其中,所述查询模块基于所述初始图像和所述候选图像,从图像数据库中查询与所述初始图像对应的目标图像时具体用于:基于所述初始图像对应的特征和所述候选图像对应的特征生成融合特征;基于所述融合特征与所述图像数据库中的每个图像之间的相似度,从所述图像数据库中查询与所述初始图像对应的目标图像;或者,针对所述图像数据库中的每个图像,基于该图像与所述初始图像对应的特征之间的相似度以及该图像与所述候选图像对应的特征之间的相似度,确定该图像对应的融合相似度;基于所述图像数据库中的每个图像对应的融合相似度,从所述图像数据库中查询与所述初始图像对应的目标图像;
其中,所述初始图像对应的特征包括D个特征维度的第一特征值,所述候选图像对应的特征包括D个特征维度的第二特征值,所述融合特征包括D个特征维度的融合特征值;所述查询模块基于所述初始图像对应的特征和所述候选图像对应的特征生成融合特征时具体用于:针对每个特征维度,将该特征维度的第一特征值和该特征维度的第二特征值的平均值,确定为该特征维度的融合特征值;基于所有特征维度的融合特征值生成融合特征;或者,针对每个特征维度,将该特征维度的第一特征值和该特征维度的第二特征值的最大值,确定为该特征维度的融合特征值;基于所有特征维度的融合特征值生成融合特征;
其中,所述查询模块基于所述初始图像和所述候选图像,从图像数据库中查询与所述初始图像对应的目标图像时具体用于:确定所述初始图像中目标对象的目标类型;基于所述初始图像和所述候选图像,从所述目标类型对应的图像数据库中查询与所述初始图像对应的目标图像;其中,所述目标类型为车辆类型、或所述目标类型为人员类型、或所述目标类型为商品类型。
10.一种图像查询设备,其特征在于,包括:处理器和机器可读存储介质,所述机器可读存储介质存储有能够被所述处理器执行的机器可执行指令;所述处理器用于执行机器可执行指令,以实现权利要求1-7任一项所述的方法步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111511932.9A CN114357226A (zh) | 2021-12-07 | 2021-12-07 | 一种图像查询方法、装置及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111511932.9A CN114357226A (zh) | 2021-12-07 | 2021-12-07 | 一种图像查询方法、装置及设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114357226A true CN114357226A (zh) | 2022-04-15 |
Family
ID=81098498
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111511932.9A Pending CN114357226A (zh) | 2021-12-07 | 2021-12-07 | 一种图像查询方法、装置及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114357226A (zh) |
-
2021
- 2021-12-07 CN CN202111511932.9A patent/CN114357226A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9171197B2 (en) | Facial tracking method | |
US20180225736A1 (en) | Image processing | |
CN104573706B (zh) | 一种物体图像识别方法及其系统 | |
CN101281540B (zh) | 用于处理信息的设备、方法和计算机程序 | |
US8559726B2 (en) | Image analysis based on pixel brightness grouping | |
CN108875542B (zh) | 一种人脸识别方法、装置、系统及计算机存储介质 | |
CN109784270B (zh) | 一种提升人脸图片识别完整性的处理方法 | |
CN110717366A (zh) | 文本信息的识别方法、装置、设备及存储介质 | |
US10007678B2 (en) | Image processing apparatus, image processing method, and recording medium | |
JP2020525908A (ja) | 画像検索方法、装置、機器および読み取り可能な記憶媒体 | |
CN112329660B (zh) | 一种场景识别方法、装置、智能设备及存储介质 | |
CN112417970A (zh) | 目标对象识别方法、装置和电子系统 | |
US12056212B2 (en) | Methods and systems for generating composite image descriptors | |
CN112966652A (zh) | 轨迹汇聚方法、装置、计算机设备及存储介质 | |
CN115115825B (zh) | 图像中的对象检测方法、装置、计算机设备和存储介质 | |
US20120170809A1 (en) | Procedure for recognizing objects | |
CN111444373B (zh) | 图像检索方法及其装置、介质和系统 | |
JP7438690B2 (ja) | 情報処理装置、画像認識方法及び学習モデル生成方法 | |
CN114357226A (zh) | 一种图像查询方法、装置及设备 | |
CN112016609B (zh) | 一种图像聚类方法、装置、设备及计算机存储介质 | |
JP6770363B2 (ja) | 顔方向推定装置及びそのプログラム | |
Sperker et al. | Feature-based object recognition—A case study for car model detection | |
CN114359957A (zh) | 一种人体图像的归类方法、装置及设备 | |
CN113221786A (zh) | 数据分类方法及装置、电子设备和存储介质 | |
JP6717769B2 (ja) | 情報処理装置及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |