CN110705380B - 用于实现目标对象属性识别的方法、装置、介质以及设备 - Google Patents

用于实现目标对象属性识别的方法、装置、介质以及设备 Download PDF

Info

Publication number
CN110705380B
CN110705380B CN201910863091.4A CN201910863091A CN110705380B CN 110705380 B CN110705380 B CN 110705380B CN 201910863091 A CN201910863091 A CN 201910863091A CN 110705380 B CN110705380 B CN 110705380B
Authority
CN
China
Prior art keywords
interest
region
scaling
feature
processor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910863091.4A
Other languages
English (en)
Other versions
CN110705380A (zh
Inventor
潘雨彤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Horizon Robotics Technology Research and Development Co Ltd
Original Assignee
Beijing Horizon Robotics Technology Research and Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Horizon Robotics Technology Research and Development Co Ltd filed Critical Beijing Horizon Robotics Technology Research and Development Co Ltd
Priority to CN201910863091.4A priority Critical patent/CN110705380B/zh
Publication of CN110705380A publication Critical patent/CN110705380A/zh
Application granted granted Critical
Publication of CN110705380B publication Critical patent/CN110705380B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/46Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Image Analysis (AREA)

Abstract

公开了一种用于实现目标对象属性识别的方法、装置、介质以及设备,其中的方法包括:获取待处理兴趣区域;根据处理器对兴趣区域特征的缩放处理条件以及所述处理器执行第一神经网络运算所需的输入特征的空间分辨率,从金字塔特征中确定所述待处理兴趣区域对应的特征层;根据所述待处理兴趣区域在所述对应的特征层中的映射,为所述处理器的缩放处理提供兴趣区域特征,并获得经过所述处理器缩放处理后的兴趣区域特征;基于所述处理器执行的第一神经网络运算对所述缩放处理后的兴趣区域特征进行目标对象属性识别。本公开有利于优化目标对象属性识别过程,有利于提高目标对象属性识别的准确性。

Description

用于实现目标对象属性识别的方法、装置、介质以及设备
技术领域
本公开涉及计算机视觉技术,尤其涉及一种用于实现目标对象属性识别的方法、用于实现目标对象属性识别的装置、存储介质以及电子设备。
背景技术
目标对象属性识别通常包括:人脸属性识别以及人体属性识别等。在目标对象属性识别过程中,通常需要确定出待识别图像中的兴趣区域,并从图像特征中获得兴趣区域特征,通过对兴趣区域特征进行相应的运算处理,可以确定目标对象属性。
兴趣区域特征会对目标对象属性识别的准确性产生影响,如何获得合适的兴趣区域特征,以提高目标对象属性识别的准确性,是一个值得关注的技术问题。
发明内容
为了解决上述技术问题,提出了本公开。本公开的实施例提供了一种用于实现目标对象属性识别的方法、装置、存储介质以及电子设备。
根据本公开实施例的一个方面,提供一种用于实现目标对象属性识别的方法,包括:获取待处理兴趣区域;根据处理器对兴趣区域特征的缩放处理条件以及所述处理器执行第一神经网络运算所需的输入特征的空间分辨率,从金字塔特征中确定所述待处理兴趣区域对应的特征层;根据所述待处理兴趣区域在所述对应的特征层中的映射,为所述处理器的缩放处理提供兴趣区域特征,并获得经过所述处理器缩放处理后的兴趣区域特征;基于所述处理器执行的第一神经网络运算对所述缩放处理后的兴趣区域特征进行目标对象属性识别。
根据本公开实施例的另一个方面,提供一种用于实现目标对象属性识别的装置,包括:获取兴趣区域模块,用于获取待处理兴趣区域;确定特征层模块,用于根据处理器对兴趣区域特征的缩放处理条件以及所述处理器执行第一神经网络运算所需的输入特征的空间分辨率,从金字塔特征中确定所述获取兴趣区域模块获取的待处理兴趣区域对应的特征层;获取区域特征模块,用于根据所述待处理兴趣区域在所述对应的特征层中的映射,为所述处理器的缩放处理提供兴趣区域特征,并获得经过所述处理器缩放处理后的兴趣区域特征;属性识别模块,用于基于所述处理器执行的第一神经网络运算对所述缩放处理后的兴趣区域特征进行目标对象属性识别。
根据本公开实施例的再一方面,提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于实现目标对象属性识别的方法。
根据本公开实施例的又一方面,提供了一种电子设备,该电子设备包括:处理器;用于存储所述处理器可执行指令的存储器;所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现上述用于实现目标对象属性识别的方法。
基于本公开上述实施例提供的一种用于实现目标对象属性识别的方法和装置,通过利用处理器对兴趣区域特征的缩放处理条件以及第一神经网络的输入特征的空间分辨率,从金字塔特征中选取待处理兴趣区域对应的特征层,使选取特征层的过程与兴趣区域特征的缩放处理相关联,从而有利于使选取出的特征层更合理,可以有效避免由于兴趣区域特征无法进行缩放处理,被丢弃,而需要再次选取特征层的过程。由此可知,本公开提供的技术方案有利于优化目标对象属性识别过程,并有利于提高目标对象属性识别的准确性。另外,通过利用金字塔特征,并对兴趣区域特征进行缩放处理,在有利于降低目标对象属性识别的效果损失的同时,有利于提高处理器执行第一神经网络运算的效率,从而有利于提高目标对象属性识别的实时性。
下面通过附图和实施例,对本公开的技术方案做进一步的详细描述。
附图说明
通过结合附图对本公开实施例进行更详细的描述,本公开的上述以及其他目的、特征以及优势将变得更加明显。附图用来提供对本公开实施例的进一步的理解,并且构成说明书的一部分,与本公开实施例一起用于解释本公开,并不构成对本公开的限制。在附图中,相同的参考标号通常代表相同部件或步骤。
图1是本公开所适用的一场景示意图;
图2是本公开所适用的另一场景示意图;
图3为本公开的用于实现目标对象属性识别的方法一个实施例的流程图;
图4为本公开的获取待处理兴趣区域一个实施例的流程图;
图5为本公开的从金字塔特征中确定待处理兴趣区域对应的特征层一个实施例的流程图;
图6为本公开的获得经过处理器缩放处理后的兴趣区域特征一个实施例的流程图;
图7为本公开的用于实现目标对象属性识别的方法另一个实施例的流程图;
图8为本公开的用于实现目标对象属性识别的装置一实施例的结构示意图;
图9是本申请一示例性实施例提供的电子设备的结构图。
具体实施方式
下面将参考附图详细地描述根据本公开的示例实施例。显然,所描述的实施例仅仅是本公开的一部分实施例,而不是本公开的全部实施例,应理解,本公开不受这里描述的示例实施例的限制。
应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本公开的范围。
本领域技术人员可以理解,本公开实施例中的“第一”、“第二”等术语仅用于区别不同步骤、设备或模块等,既不代表任何特定技术含义,也不表示它们之间的必然逻辑顺序。
还应理解,在本公开实施例中,“多个”可以指两个或两个以上,“至少一个”可以指一个、两个或两个以上。
还应理解,对于本公开实施例中提及的任一部件、数据或结构,在没有明确限定或者在前后文给出相反启示的情况下,一般可以理解为一个或多个。
另外,本公开中术语“和/或”,仅是一种描述关联对象的关联关系,表示可以存在三种关系,如A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本公开中字符“/”,一般表示前后关联对象是一种“或”的关系。
还应理解,本公开对各个实施例的描述着重强调各个实施例之间的不同之处,其相同或相似之处可以相互参考,为了简洁,不再一一赘述。
同时,应当明白,为了便于描述,附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。
以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本公开及其应用或使用的任何限制。
对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
本公开的实施例可以应用于终端设备、计算机系统、服务器等电子设备,其可与众多其它通用或者专用计算系统环境或配置一起操作。适于与终端设备、计算机系统或者服务器等电子设备一起使用的众所周知的终端设备、计算系统、环境和/或配置的例子包括但不限于:个人计算机系统、服务器计算机系统、瘦客户机、厚客户机、手持或膝上设备、基于微处理器的系统、机顶盒、可编程消费电子产品、网络个人电脑、小型计算机系统、大型计算机系统和包括上述任何系统的分布式云计算技术环境等等。
终端设备、计算机系统、服务器等电子设备可以在由计算机系统执行的计算机系统可执行指令(诸如程序模块)的一般语境下描述。通常,程序模块可以包括例程、程序、目标程序、组件、逻辑、数据结构等等,它们执行特定的任务或者实现特定的抽象数据类型。计算机系统/服务器可以在分布式云计算环境中实施。在分布式云计算环境中,任务可以是由通过通信网络连接的远程处理设备执行的。在分布式云计算环境中,程序模块可以位于包括存储设备的本地或远程计算系统存储介质上。
本公开概述
在实现本公开的过程中,发明人发现,执行神经网络运算的处理器,在目标对象属性识别的实时性方面,存在一定的优势。出于实时性以及处理器硬件资源限制等因素的考虑,往往会在处理器中设置FPN(Feature Pyramid Networks,特征金字塔网络)单元以及缩放单元等单元。由于这些单元有利于提高处理器实现目标对象属性识别的速度,因此,可以称为硬件加速单元。处理器中设置的缩放单元主要用于对兴趣区域特征进行缩放调整,以使缩放调整后的兴趣区域特征可以符合后续神经网络对输入特征的要求。
在缩放单元对兴趣区域特征进行缩放调整之前,通常需要从FPN单元输出的金字塔特征中选取相应的特征层,以便于利用选取的特征层获得兴趣区域特征。特征层的选取决定着兴趣区域特征,而兴趣区域特征会影响目标对象属性识别结果的准确性。因此,从金字塔特征中选取的特征层是否合适,会影响目标对象属性识别的准确性。
示例性概述
本公开提供的用于实现目标对象属性识别的技术方案可以适用于多种场景中。一个例子如图1所示。
图1中,车辆100可以实现智能驾驶,例如,车辆100可以实现自动驾驶或者辅助驾驶等。车辆100的车载系统(图1中未示出)包括:控制系统(图1中未示出)以及摄像装置101。
在车辆100处于自动驾驶模式或者高级辅助驾驶模式的情况下,摄像装置101通过视频拍摄功能可以实时的获得车辆100所在路面的视频流,摄像装置101将其拍摄获得的视频流实时的提供给车辆100的车载系统中的控制系统。控制系统可以针对摄像装置101传输来的视频流中的每一视频帧分别进行提取图像特征处理,获得每一视频帧的金字塔特征,控制系统利用金字塔特征执行后续的目标对象属性识别操作(例如,执行识别车辆位置和朝向、行人位置和朝向以及交通指示灯的亮灯颜色等操作),之后,控制系统根据目标对象属性识别结果,实时产生并下发相应的控制指令,从而实现控制车辆100的驾驶状态。控制系统产生并下发的控制指令包括但不限于:速度保持控制指令、速度调整控制指令、方向保持控制指令、方向调整控制指令以及预警提示控制指令等。
需要特别说明的是,上述实现目标对象属性识别的操作也可以由摄像装置101执行,即摄像装置101对其拍摄获得的每一视频帧分别进行提取图像特征处理,获得每一视频帧的金字塔特征,摄像装置101利用金字塔特征执行后续的目标对象属性识别操作,之后,摄像装置101将目标对象属性识别结果提供给控制系统,由控制系统根据接收到的目标对象属性识别结果,实时产生并下发相应的控制指令,从而实现控制车辆100的驾驶状态。
本公开的技术方案的适用场景的又一个例子如图2所示。
图2中,用户200的智能移动电话201具有刷脸解锁功能。在智能移动电话201处于黑屏状态下,若用户200点亮智能移动电话201的屏幕,则智能移动电话201开始执行刷脸解锁操作。例如,智能移动电话201启动内置摄像头的拍摄功能,并针对摄像头拍摄获得的视频中的每一视频帧分别进行提取图像特征处理,获得每一视频帧的金字塔特征,智能移动电话201利用金字塔特征继续执行目标对象属性识别操作,例如,识别视频帧中的目标对象是否为活体以及该目标对象是否为具有屏幕解锁功能的人脸等,智能移动电话201可以根据目标对象属性识别结果,确定是否解锁屏幕。
另外,在智能移动电话201中的APP(Application,应用程序)具有刷脸支付功能的情况下,智能移动电话201中的APP在获得待支付账单后,可以根据目标对象属性识别结果,确定是否支付该账单。
示例性方法
图3为本公开的用于实现目标对象属性识别的方法一个实施例的流程图。本公开中的目标对象属性识别也可以称为目标对象属性预测(Inference)或者目标对象属性检测等。
如图3所示的方法包括:S300、S301、S302以及S303。下面对各步骤分别进行说明。
S300、获取待处理兴趣区域。
本公开中的待处理兴趣区域是需要进行目标对象属性识别的图像中的待处理兴趣区域。待处理兴趣区域可以是指:需要在一金字塔特征中确定出其对应的特征层,并利用该特征层来确定出其对应的特征的ROI(Region Of Interest,兴趣区域)。生成并获得图像中的待处理兴趣区域的执行主体可以为处理器。
S301、根据处理器对兴趣区域特征的缩放处理条件以及处理器执行第一神经网络运算所需的输入特征的空间分辨率,从金字塔特征中确定待处理兴趣区域对应的特征层。
本公开中的处理器对兴趣区域特征的缩放处理条件可以认为是:处理器在对兴趣区域特征执行缩放处理时,对兴趣区域特征的限制条件。该缩放处理条件可以根据实际需求设置,例如,该缩放处理条件可以包括:针对兴趣区域特征的大小的条件以及针对兴趣区域特征的缩放倍数的条件等。
本公开中的第一神经网络可以为CNN(Convolutional Neural Networks,卷积神经网络)等。本公开中的处理器所执行的第一神经网络运算可以包括但不限于卷积运算。例如,还可以包括:池化运算等。本公开中的处理器执行第一神经网络运算所需的输入特征的空间分辨率可以认为是:第一神经网络的输入特征的空间分辨率。输入特征的空间分辨率可以是指输入特征的高(h)和宽(w)。
本公开中的处理器执行第一神经网络运算所需的输入特征的空间分辨率可以认为是对缩放处理后的兴趣区域特征的空间分辨率的限制条件。
本公开中的金字塔特征是进行目标对象属性识别的图像的金字塔特征。本公开从金字塔特征中确定出的待处理兴趣区域对应的特征层通常为金字塔特征中的某一层特征层。金字塔特征中的最底层的特征层的空间分辨率通常为图像的空间分辨率。金字塔特征中的除最底层之外的其他层的特征层的空间分辨率通常为图像的空间分辨率的m分之一,其中的m可以为2n,且n为金字塔特征中的特征层的层数,设定金字塔特征中的最底层的特征层的层数为0,即最底层的特征层的空间分辨率最大。
本公开中的金字塔特征可以是用于形成金字塔特征的FPN(Feature PyramidNetworks,特征金字塔网络)针对图像生成的金字塔特征。例如,本公开的处理器中的一部分计算资源(例如,一部分乘加单元以及一部分缓存单元等)可以专门用于执行基于FPN的运算,该部分计算资源可以认为是FPN单元,此时,金字塔特征可以认为是在处理器中的FPN单元执行FPN运算得到的,因此,本公开中的处理器可以认为是嵌入有FPN单元的处理器。
由于本公开处理器中的FPN单元有利于提高处理器进行目标对象属性识别的效率,因此,可以将FPN单元看做是处理器的加速单元。
S302、根据待处理兴趣区域在待处理兴趣区域对应的特征层中的映射,为处理器的缩放处理提供兴趣区域特征,并获得经过处理器缩放处理后的兴趣区域特征。
本公开中的待处理兴趣区域在待处理兴趣区域对应的特征层中的映射可以认为是,在待处理兴趣区域对应的特征层中确定待处理兴趣区域的坐标位置,从而可以获得兴趣区域特征。例如,待处理兴趣区域对应的特征层的空间分辨率相比于图像的空间分辨率而言,通常会存在一定的缩放比例,如果待处理兴趣区域是图像中的一区域,则本公开可以按照待处理兴趣区域对应的特征层相对于图像的缩放比例,对待处理兴趣区域进行相应的缩放,并按照待处理兴趣区域在图像中的坐标位置,来确定缩放后的待处理兴趣区域在特征层中的坐标位置。
S303、基于处理器执行的第一神经网络运算对上述缩放处理后的兴趣区域特征进行目标对象属性识别。
本公开中的目标对象可以是指:人体、人脸、车辆、建筑物或者动物等。本公开中的目标对象属性可以是指用于表征目标对象的固有特点的信息。例如,目标对象属性可以包括但不限于:人的年龄段、性别、活体、车辆颜色、车牌号码或者人脸上的遮挡物(眼镜或者口罩)等。本公开中的处理器可以通过读取缩放处理后的兴趣区域特征,并针对读取到的兴趣区域特征执行相应的运算(如卷积运算等),可以获得目标对象属性识别结果。本公开不限制处理器执行第一神经网络运算的具体实现方式。
在处理器对兴趣区域特征执行缩放处理的情况下,本公开通过利用处理器对兴趣区域特征的缩放处理条件以及第一神经网络的输入特征的空间分辨率,从金字塔特征中选取待处理兴趣区域对应的特征层,使选取特征层的过程与兴趣区域特征的缩放处理相关联,可以有效避免由于兴趣区域特征无法进行缩放处理,被丢弃,而需要再次选取特征层的过程,从而有利于优化特征层的选取过程,有利于使选取出的特征层更合理。由此可知,本公开有利于优化目标对象属性识别过程,并有利于提高目标对象属性识别的准确性。另外,通过利用金字塔特征,并对兴趣区域特征进行缩放处理,在有利于降低目标对象属性识别的效果损失的同时,有利于提高处理器执行第一神经网络运算的效率,从而有利于提高目标对象属性识别的实时性。
在一个可选示例中,本公开的S300中的获取待处理兴趣区域的过程可以如图4所示。
图4中,S400、根据处理器对图像执行第二神经网络运算得到的兴趣区域检测结果,获得初始兴趣区域。该初始兴趣区域也可以称为原始兴趣区域等。
可选的,第二神经网络可以为用于形成ROI(Region Of Interest,兴趣区域)的神经网络。例如,第二神经网络可以为RPN(RegionProposal Network,区域候选网络)等。本公开中的处理器中的一部分计算资源(例如,一部分乘加单元以及一部分缓存单元等)可以专用于执行基于RPN等第二神经网络所涉及到的运算,该部分计算资源可以认为是RPN单元。本公开中的ROI可以认为是设置于处理器中的RPN单元根据预先设置的指令执行相应的运算获得的。本公开中的处理器可以认为是嵌入有RPN单元的处理器。
S401、对初始兴趣区域进行归一化(Normalize)处理,获得待处理兴趣区域。
可选的,对初始兴趣区域进行归一化处理可以包括但不限于:根据预定宽高比调整初始兴趣区域的大小等。例如,通过调整初始兴趣区域的左上顶点的坐标和/或右下顶点的坐标等使待处理兴趣区域的宽高比为预定宽高比。
本公开通过利用第二神经网络获得初始兴趣区域,并对初始兴趣区域进行归一化处理,可以避免待处理兴趣区域对应的兴趣区域特征在进行缩放处理以及后续的目标对象属性识别过程中,产生被拉长或者被压胖等变形现象,从而可以避免兴趣区域特征的变形对后续的目标对象属性识别操作的影响,进而有利于提高目标对象属性识别的准确性。
在一个可选示例中,本公开中的处理器可以包括:缩放单元以及以及用于执行第一神经网络运算的乘加单元(Multiply and Accumulate,MAC)。
可选的,处理器中的一部分计算资源(例如,一部分乘加单元以及一部分缓存单元等)可以专用于执行对兴趣区域特征的缩放处理,该部分计算资源可以认为是缩放单元或者缩放器(Resizer),从而可以将该部分计算资源认为是设置于处理器中的缩放单元,因此,本公开中的处理器可以认为是嵌入有缩放单元的处理器。本公开中的处理器对兴趣区域特征的缩放处理条件可以认为是对缩放单元对兴趣区域特征的缩放处理条件。由于本公开中的缩放单元有利于提高处理器进行目标对象属性识别的效率,因此,可以将缩放单元认为是处理器的加速单元。
可选的,本公开的处理器中的一部分计算资源(例如,一部分乘加单元以及一部分缓存单元等)可以专用于执行CNN运算(例如,卷积运算等),该部分计算资源可以认为是CNN单元,从而可以将该部分计算资源认为是设置于处理器中的CNN单元,因此,本公开中的处理器可以认为是嵌入有CNN的处理器。
结合上述描述,本公开中的处理器可以认为是嵌入有FPN单元、缩放单元、第二神经网络(如RPN)单元以及CNN单元的处理器。
本公开通过在处理器中为缩放单元和第一神经网络设置专用的计算资源,形成嵌入有缩放单元和第一神经网络单元的处理,有利于提高目标对象属性识别的速度,从而有利于提高目标对象属性识别的实时性。
在一个可选示例中,本公开的S301中的从金字塔特征中确定待处理兴趣区域对应的特征层的一个例子如图5所示。
图5中,S500、根据处理器对兴趣区域特征的缩放处理条件以及处理器执行第一神经网络运算所需的输入特征的空间分辨率,确定待处理兴趣区域的第一缩放系数。
可选的,由于本公开中的第一神经网络通常对其输入特征在空间分辨率上具有一定的要求,而在对兴趣区域特征进行缩放处理时,放大的倍数太大或者缩小倍数太小,均会对兴趣区域特征的表达产生较大影响,从而可能会影响目标对象属性识别的准确性,因此,本公开针对缩放处理会预先设置缩放处理条件,以尽量避免缩放处理后的兴趣区域特征对目标对象属性识别的影响。
可选的,本公开中的缩放处理条件可以包括但不限于:对兴趣区域特征的宽高范围限制以及对兴趣区域特征的缩放倍数范围限制等。本公开通过对缩放处理条件和第一神经网络的输入特征的空间分辨率进行综合衡量,来确定待处理兴趣区域对应的特征层,有利于一次性选取出合适的特征层。
可选的,本公开可以根据处理器对兴趣区域特征的宽高范围、缩放倍数范围以及处理器执行第一神经网络运算所需的输入特征的空间分辨率,来确定待处理兴趣区域的缩放系数取值范围,之后,本公开可以根据该缩放系数取值范围确定出一第一缩放系数。
可选的,本公开中的处理器对兴趣区域特征的宽高范围可以结合处理器对兴趣区域特征的缩放倍数范围来考虑,而处理器对兴趣区域特征的缩放倍数范围可以结合兴趣区域特征被缩放后的表达能力来考虑。
可选的,本公开中的处理器对兴趣区域特征的宽高范围可以包括:兴趣区域特征的最大宽度和最小宽度以及兴趣区域特征的最大高度和最小高度。例如,兴趣区域特征的最大宽度可以为256,兴趣区域特征的最小宽度可以为32,兴趣区域特征的最大高度可以为256,兴趣区域特征的最小高度可以为32。
可选的,本公开中的缩放倍数范围可以包括:兴趣区域特征的最大放大倍数以及兴趣区域特征的最小缩小倍数。例如,兴趣区域特征的最大放大倍数可以为8倍,兴趣区域特征的最小缩小倍数可以为2倍。
可选的,本公开中的处理器执行第一神经网络运算所需的输入特征的空间分辨率可以根据实际需求设置,例如,该空间分辨率可以为64×64。
可选的,假定兴趣区域特征的最大宽度为256,兴趣区域特征的最小宽度为32,兴趣区域特征的最大高度为256,兴趣区域特征的最小高度为32,兴趣区域特征的最大放大倍数为8倍,兴趣区域特征的最小缩小倍数为2倍,在该假定的条件下,本公开可以利用下述公式(1)来计算待处理兴趣区域的缩放系数取值范围:
Figure BDA0002200415940000111
在上述公式(1)中,f1(x)表示由四个不等式组成的方程组;dst_w表示第一神经网络的输入特征的空间分辨率中的宽;w表示待处理兴趣区域的宽;s表示待处理兴趣区域的缩放系数取值范围;dst_h表示第一神经网络的输入特征的空间分辨率中的高;h表示待处理兴趣区域的高。需要特别说明的是,在兴趣区域特征的最大宽度、最小宽度、最大高度、最小高度最大放大倍数以及最小缩小倍数发生变化时,上述公式(1)中的相应数值也应随之改变。
可选的,上述公式(1)可以变化为下述公式(2)以及公式(3)的形式:
Figure BDA0002200415940000112
Figure BDA0002200415940000113
上述公式(2)和公式(3)中的f2(x)和f3(x)分别表示由两个不等式组成的方程组。
通过对公式(1)进行求解或者通过对公式(2)和公式(3)进行求解,可以获得s的取值范围,从而获得待处理兴趣区域的缩放系数取值范围。
本公开通过确定出待处理兴趣区域的缩放系数取值范围,并利用该缩放系数取值范围确定出第一缩放系数,可以利用第一缩放系数来衡量金字塔特征中的各特征层,从而有利于为待处理兴趣区域选取出合适的特征层,并有利于避免由于兴趣区域特征无法进行缩放处理,被丢弃,而需要再次选取特征层的过程。
可选的,本公开在获得缩放系数取值范围后,可以将缩放系数取值范围内的一缩放系数作为第一缩放系数,例如,将缩放系数取值范围中的最大值作为第一缩放系数。
本公开通过将缩放系数取值范围中的最大值作为第一缩放系数,有利于为待处理兴趣区域选取出合适的特征层,进一步有利于避免由于兴趣区域特征无法进行缩放处理,被丢弃,而需要再次选取特征层的过程。
S501、根据第一缩放系数以及金字塔特征中的各特征层的第二缩放系数,确定待处理兴趣区域对应的特征层。
可选的,本公开可以通过对比第一缩放系数和各特征层的第二缩放系数的大小,确定待处理兴趣区域对应的特征层。例如,本公开可以从金字塔特征中的各特征层的第二缩放系数中选取一个与第一缩放系数最接近,且不超过第一缩放系数的第二缩放系数,并将具有选取出的该第二缩放系数的特征层作为待处理兴趣区域对应的特征层。另外,如果不存在满足上述条件的特征层,则可以不对该待处理兴趣区域进行映射、缩放以及后续的属性识别处理操作,例如,可以丢弃该待处理兴趣区域。
本公开通过利用第一缩放系数和第二缩放系数选取特征层,使选取出的特征层的缩放系数与兴趣区域特征的缩放处理以及第一神经网络的输入特征的空间分辨率相关联,有利于优化特征层的选取过程。通过使选取出的特征层更合理与第一缩放系数最接近,且不超过第一缩放系数的第二缩放系数,使特征层的选取更为合理,进一步有利于消除在对兴趣区域特征进行缩放处理之后,由于被判定为非法兴趣区域特征而被丢弃的现象。
在一个可选示例中,本公开的S302中的获得经过处理器缩放处理后的兴趣区域特征的一个例子可以如图6所示。
图6中,S600、将待处理兴趣区域映射在待处理兴趣区域对应的特征层中。
可选的,本公开可以根据特征层的第二缩放系数,对待处理兴趣区域的大小进行调整,例如,将待处理兴趣区域的宽和高分别与第二缩放系统相乘,获得大小调整后的待处理兴趣区域。本公开可以根据待处理兴趣区域在图像中的坐标位置,确定大小调整后的待处理兴趣区域在特征层中的坐标位置,从而将待处理兴趣区域映射在特征层中。
S601、根据处理器的缩放处理对兴趣区域的宽高奇偶条件,确定映射在对应的特征层中的待处理兴趣区域的顶点坐标,获得兴趣区域特征。
可选的,本公开中的处理器的缩放处理对兴趣区域的宽高奇偶条件可以认为是处理器的缩放处理对兴趣区域的宽所包含的列数以及高所包含的行数的限制条件。例如,兴趣区域的宽所包含的列数以及高所包含的行数均应为偶数等。
可选的,本公开可以在确定出映射在特征层中的待处理兴趣区域的宽和高不满足预先设定的宽高奇偶条件时,通过调整映射在特征层中的待处理兴趣区域的顶点坐标,使待处理兴趣区域的宽和高分别满足预先设定的宽高奇偶条件。
可选的,调整映射在特征层中的待处理兴趣区域的顶点坐标可能会导致待处理兴趣区域的大小发生变化。例如,本公开可以将映射在特征层中的待处理兴趣区域的左上顶点坐标调整为与当前左上顶点坐标最接近的偶数行和偶数列,并将右下顶点坐标调整为与当前右下顶点坐标最接近的奇数行和基数列。
本公开通过对映射在特征层中的待处理兴趣区域的顶点坐标进行调整,有利于消除在对兴趣区域特征进行缩放处理之后,由于被判定为非法兴趣区域特征而被丢弃的现象。
可选的,本公开在获得了兴趣区域特征之后,还可以对兴趣区域特征进行合法性验证,在合法性验证通过时,才会将该兴趣区域特征提供给缩放单元,由缩放单元对该兴趣区域特征进行缩放处理。如果合法性验证不通过,则不再对该兴趣区域特征进行缩放处理,例如,可以丢弃该兴趣区域特征。
图7为本公开的用于实现目标对象属性识别的方法一个实施例的流程图。
S700、开始本次用于实现目标对象属性识别的方法。
S701、对第一神经网络输入合法性进行验证。如果合法性验证通过,则到S702,如果合法性验证失败,则到S709。
可选的,可以将本步骤的输入合法性验证认为是对第一神经网络的输入设置信息以及缩放处理的输出设置信息的验证。
S702、获取图像的初始兴趣区域。
S703、对初始兴趣区域进行归一化处理,获得待处理兴趣区域。
S704、确定待处理兴趣区域对应的特征层。
可选的,本公开可以采用上述公式(2)和公式(3)计算出待处理兴趣区域的缩放系数取值范围,并从该缩放系数取值范围中选取出一个缩放系数(如从缩放系数取值范围中选取出最大值),作为第一缩放系数,本公开可以根据第一缩放系数以及金字塔特征中的各特征层的第二缩放系数,确定该待处理兴趣区域对应的特征层。本公开可以将待处理兴趣区域映射在该特征层中,并通过调整待处理兴趣区域的左上顶点和右下顶点坐标位置,最终获得兴趣区域特征。
S705、判断是否选取出的特征层,如果选取出了特征层,则到S706,如果未选取出特征层,则到S709。
S706、通过将待处理兴趣区域映射到特征层中,获得兴趣区域特征。
S707、对当前获得的兴趣区域特征进行合法性验证。例如,验证兴趣区域特征的宽和高是否均大于等于32,是否均小于等于256,另外,还可以验证兴趣区域特征的宽和高是否为偶数,还有,还可以验证兴趣区域特征的缩小倍数是否为2倍以内以及放大倍数是否为8倍以内。如果本步骤的合法性验证通过,则到S708,如果本步骤的合法性验证失败,则可以上报错误,并到S709。
S708、处理器中的缩放单元对兴趣区域特征进行缩放处理。本公开通过对缩放处理后的兴趣区域特征执行后续的目标对象属性识别操作,获得目标对象属性识别结果。
S709、本次用于实现目标对象属性识别的方法结束。
示例性装置
图8为本公开的服务发现装置一个实施例的结构示意图。该实施例的装置可用于实现本公开相应的方法实施例。如图8所示的装置包括:获取兴趣区域模块800、确定特征层模块801、获取区域特征模块802以及属性识别模块803。
获取兴趣区域模块800用于获取待处理兴趣区域。
可选的,获取兴趣区域模块800可以根据处理器对图像执行第二神经网络运算得到的兴趣区域检测结果,获得初始兴趣区域,之后,获取兴趣区域模块800可以对初始兴趣区域进行归一化处理,从而获得待处理兴趣区域。获取兴趣区域模块800具体执行的操作可以参见上述针对图4的描述。
确定特征层模块801用于根据处理器对兴趣区域特征的缩放处理条件以及所述处理器执行第一神经网络运算所需的输入特征的空间分辨率,从金字塔特征中确定获取兴趣区域模块800获取的待处理兴趣区域对应的特征层。
可选的,本公开中的处理器包括:缩放单元和第一神经网络,处理器对兴趣区域特征的缩放处理条件可以认为是缩放单元对兴趣区域特征的缩放处理条件。
可选的,确定特征层模块801可以包括:第一确定子模块8011和第二确定子模块8012。
其中的第一确定子模块8011用于根据处理器对兴趣区域特征的缩放处理条件以及处理器执行第一神经网络运算所需的输入特征的空间分辨率,确定待处理兴趣区域的第一缩放系数。例如,第一确定子模块8011可以根据处理器对兴趣区域特征的宽高范围、缩放倍数范围以及处理器执行第一神经网络运算所需的输入特征的空间分辨率,确定待处理兴趣区域的缩放系数取值范围,并根据缩放系数取值范围确定第一缩放系数。第一确定子模块8011可以将缩放系数取值范围中的最大值作为第一缩放系数。
其中的第二确定子模块8012用于根据上述第一缩放系数以及金字塔特征中的各特征层的第二缩放系数,确定获取兴趣区域模块800获取的待处理兴趣区域对应的特征层。例如,第二确定子模块8012可以从金字塔特征中的各特征层的第二缩放系数中选取与第一缩放系数最接近,且不超过第一缩放系数的第二缩放系数,并将具有选取出的第二缩放系数的特征层作为待处理兴趣区域对应的特征层。
第一确定子模块8011和第二确定子模块8012具体执行的操作可以参见上述针对图5的描述。
获取区域特征模块802用于根据待处理兴趣区域在确定特征层模块801确定出的待处理兴趣区域对应的特征层中的映射,为处理器的缩放处理提供兴趣区域特征,并获得经过处理器缩放处理后的兴趣区域特征。例如,获取区域特征模块802将待处理兴趣区域映射在待处理兴趣区域对应的特征层中,并根据处理器的缩放处理对兴趣区域的宽高奇偶条件,确定映射在特征层中的待处理兴趣区域的顶点坐标,从而获得兴趣区域特征。获取区域特征模块802具体执行的操作可以参见上述针对图6的描述。
属性识别模块803用于基于处理器执行的第一神经网络运算对获取区域特征模块802获得的缩放处理后的兴趣区域特征进行目标对象属性识别。
示例性电子设备
下面参考图9来描述根据本公开实施例的电子设备。图9示出了根据本公开实施例的电子设备的框图。如图9所示,电子设备91包括一个或多个处理器911和存储器912。
处理器911可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其他形式的处理单元,并且可以控制电子设备91中的其他组件以执行期望的功能。
存储器912可以包括一个或多个计算机程序产品,所述计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。所述易失性存储器,例如,可以包括:随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。所述非易失性存储器,例如,可以包括:只读存储器(ROM)、硬盘以及闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器911可以运行所述程序指令,以实现上文所述的本公开的各个实施例的用于实现目标对象属性识别的方法以及/或者其他期望的功能。在所述计算机可读存储介质中还可以存储诸如输入信号、信号分量、噪声分量等各种内容。
在一个示例中,电子设备91还可以包括:输入装置913以及输出装置914等,这些组件通过总线系统和/或其他形式的连接机构(未示出)互连。此外,该输入设备913还可以包括例如键盘、鼠标等等。该输出装置914可以向外部输出各种信息。该输出设备914可以包括例如显示器、扬声器、打印机、以及通信网络及其所连接的远程输出设备等等。
当然,为了简化,图9中仅示出了该电子设备91中与本公开有关的组件中的一些,省略了诸如总线、输入/输出接口等等的组件。除此之外,根据具体应用情况,电子设备91还可以包括任何其他适当的组件。
示例性计算机程序产品和计算机可读存储介质
除了上述方法和设备以外,本公开的实施例还可以是计算机程序产品,其包括计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本公开各种实施例的用于实现目标对象属性识别的方法中的步骤。
所述计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本公开实施例操作的程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如Java、C++等,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。
此外,本公开的实施例还可以是计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本公开各种实施例的用于实现目标对象属性识别的方法中的步骤。
所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列举)可以包括:具有一个或者多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
以上结合具体实施例描述了本公开的基本原理,但是,需要指出的是,在本公开中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势以及效果等是本公开的各个实施例必须具备的。另外,上述公开的具体细节仅是为了示例的作用和便于理解的作用,而非限制,上述细节并不限制本公开为必须采用上述具体的细节来实现。
本说明书中各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似的部分相互参见即可。对于系统实施例而言,由于其与方法实施例基本对应,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本公开中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的,可以按任意方式连接、布置、配置这些器件、装置、设备以及系统。诸如“包括”、“包含、“具有”等等的词语是开放性词汇,指“包括但不限于”,且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”,且可与其互换使用,除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”,且可与其互换使用。
可能以许多方式来实现本公开的方法和装置。例如,可通过软件、硬件、固件或者软件、硬件、固件的任何组合来实现本公开的方法和装置。用于所述方法的步骤的上述顺序仅是为了进行说明,本公开的方法的步骤不限于以上具体描述的顺序,除非以其它方式特别说明。此外,在一些实施例中,还可将本公开实施为记录在记录介质中的程序,这些程序包括用于实现根据本公开的方法的机器可读指令。因而,本公开还覆盖存储用于执行根据本公开的方法的程序的记录介质。
还需要指出的是,在本公开的装置、设备和方法中,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本公开的等效方案。
提供所公开的方面的以上描述,以使本领域的任何技术人员能够做出或者使用本公开。对这些方面的各种修改等对于本领域技术人员而言,是非常显而易见的,并且在此定义的一般原理可以应用于其他方面,而不脱离本公开的范围。因此,本公开不意图被限制到在此示出的方面,而是按照与在此公开的原理和新颖的特征一致的最宽范围。
为了例示和描述的目的已经给出了以上描述。此外,此描述不意图将本公开的实施例限制到在此公开的形式中。尽管以上已经讨论了多个示例方面以及实施例,但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。

Claims (16)

1.一种用于实现目标对象属性识别的方法,包括:
获取待处理兴趣区域;
根据处理器对兴趣区域特征的缩放处理条件以及所述处理器执行第一神经网络运算所需的输入特征的空间分辨率,从金字塔特征中确定所述待处理兴趣区域对应的特征层;
根据所述待处理兴趣区域在所述对应的特征层中的映射,为所述处理器的缩放处理提供兴趣区域特征,并获得经过所述处理器缩放处理后的兴趣区域特征;
基于所述处理器执行的第一神经网络运算对所述缩放处理后的兴趣区域特征进行目标对象属性识别;
其中,根据处理器对兴趣区域特征的缩放处理条件以及所述处理器执行第一神经网络运算所需的输入特征的空间分辨率,从金字塔特征中确定所述待处理兴趣区域对应的特征层,包括:根据所述处理器对兴趣区域特征的缩放处理条件以及所述处理器执行第一神经网络运算所需的输入特征的空间分辨率,确定所述待处理兴趣区域的第一缩放系数;根据所述第一缩放系数以及金字塔特征中的各特征层的第二缩放系数,确定所述待处理兴趣区域对应的特征层。
2.根据权利要求1所述的方法,其中,所述获取待处理兴趣区域,包括:
根据处理器对图像执行第二神经网络运算得到的兴趣区域检测结果,获得初始兴趣区域;
对所述初始兴趣区域进行归一化处理,获得待处理兴趣区域。
3.根据权利要求1所述的方法,其中,所述处理器包括:缩放单元和第一神经网络,所述处理器对兴趣区域特征的缩放处理条件为所述缩放单元对兴趣区域特征的缩放处理条件。
4.根据权利要求2所述的方法,其中,所述处理器包括:缩放单元和第一神经网络,所述处理器对兴趣区域特征的缩放处理条件为所述缩放单元对兴趣区域特征的缩放处理条件。
5.根据权利要求1所述的方法,其中,所述根据处理器对兴趣区域特征的缩放处理条件以及所述处理器执行第一神经网络运算所需的输入特征的空间分辨率,确定所述待处理兴趣区域的第一缩放系数,包括:
根据处理器对兴趣区域特征的宽高范围、缩放倍数范围以及所述处理器执行第一神经网络运算所需的输入特征的空间分辨率,确定所述待处理兴趣区域的缩放系数取值范围;
根据所述缩放系数取值范围确定第一缩放系数。
6.根据权利要求5所述的方法,其中,所述根据所述缩放系数取值范围确定第一缩放系数,包括:
将所述缩放系数取值范围中的最大值作为第一缩放系数。
7.根据权利要求1所述的方法,其中,所述根据所述第一缩放系数以及金字塔特征中的各特征层的第二缩放系数,确定所述待处理兴趣区域对应的特征层,包括:
从所述金字塔特征中的各特征层的第二缩放系数中选取与所述第一缩放系数最接近,且不超过所述第一缩放系数的第二缩放系数;
将具有所述选取出的第二缩放系数的特征层作为所述待处理兴趣区域对应的特征层。
8.根据权利要求2所述的方法,其中,所述根据所述第一缩放系数以及金字塔特征中的各特征层的第二缩放系数,确定所述待处理兴趣区域对应的特征层,包括:
从所述金字塔特征中的各特征层的第二缩放系数中选取与所述第一缩放系数最接近,且不超过所述第一缩放系数的第二缩放系数;
将具有所述选取出的第二缩放系数的特征层作为所述待处理兴趣区域对应的特征层。
9.根据权利要求3所述的方法,其中,所述根据所述第一缩放系数以及金字塔特征中的各特征层的第二缩放系数,确定所述待处理兴趣区域对应的特征层,包括:
从所述金字塔特征中的各特征层的第二缩放系数中选取与所述第一缩放系数最接近,且不超过所述第一缩放系数的第二缩放系数;
将具有所述选取出的第二缩放系数的特征层作为所述待处理兴趣区域对应的特征层。
10.根据权利要求4所述的方法,其中,所述根据所述第一缩放系数以及金字塔特征中的各特征层的第二缩放系数,确定所述待处理兴趣区域对应的特征层,包括:
从所述金字塔特征中的各特征层的第二缩放系数中选取与所述第一缩放系数最接近,且不超过所述第一缩放系数的第二缩放系数;
将具有所述选取出的第二缩放系数的特征层作为所述待处理兴趣区域对应的特征层。
11.根据权利要求5所述的方法,其中,所述根据所述第一缩放系数以及金字塔特征中的各特征层的第二缩放系数,确定所述待处理兴趣区域对应的特征层,包括:
从所述金字塔特征中的各特征层的第二缩放系数中选取与所述第一缩放系数最接近,且不超过所述第一缩放系数的第二缩放系数;
将具有所述选取出的第二缩放系数的特征层作为所述待处理兴趣区域对应的特征层。
12.根据权利要求6所述的方法,其中,所述根据所述第一缩放系数以及金字塔特征中的各特征层的第二缩放系数,确定所述待处理兴趣区域对应的特征层,包括:
从所述金字塔特征中的各特征层的第二缩放系数中选取与所述第一缩放系数最接近,且不超过所述第一缩放系数的第二缩放系数;
将具有所述选取出的第二缩放系数的特征层作为所述待处理兴趣区域对应的特征层。
13.根据权利要求1至12中任一项所述的方法,其中,所述根据所述待处理兴趣区域在所述对应的特征层中的映射,为所述处理器的缩放处理提供兴趣区域特征,并获得经过所述处理器缩放处理后的兴趣区域特征,包括:
将所述待处理兴趣区域映射在所述对应的特征层中;
根据所述处理器的缩放处理对兴趣区域的宽高奇偶条件,确定映射在所述对应的特征层中的待处理兴趣区域的顶点坐标,获得兴趣区域特征。
14.一种用于实现目标对象属性识别的装置,包括:
获取兴趣区域模块,用于获取待处理兴趣区域;
确定特征层模块,用于根据处理器对兴趣区域特征的缩放处理条件以及所述处理器执行第一神经网络运算所需的输入特征的空间分辨率,从金字塔特征中确定所述获取兴趣区域模块获取的待处理兴趣区域对应的特征层;
获取区域特征模块,用于根据所述待处理兴趣区域在所述确定特征层模块确定出的待处理兴趣区域对应的特征层中的映射,为所述处理器的缩放处理提供兴趣区域特征,并获得经过所述处理器缩放处理后的兴趣区域特征;
属性识别模块,用于基于所述处理器执行的第一神经网络运算对所述获取区域特征模块获得的缩放处理后的兴趣区域特征进行目标对象属性识别;
其中,所述确定特征层模块包括:
第一确定子模块,用于根据所述处理器对兴趣区域特征的缩放处理条件以及所述处理器执行第一神经网络运算所需的输入特征的空间分辨率,确定所述待处理兴趣区域的第一缩放系数;
第二确定子模块,用于根据所述第一缩放系数以及金字塔特征中的各特征层的第二缩放系数,确定所述待处理兴趣区域对应的特征层。
15.一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于执行上述权利要求1-13中任一项所述的方法。
16.一种电子设备,所述电子设备包括:
处理器;
用于存储所述处理器可执行指令的存储器;
所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现上述权利要求1-13中任一项所述的方法。
CN201910863091.4A 2019-09-12 2019-09-12 用于实现目标对象属性识别的方法、装置、介质以及设备 Active CN110705380B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910863091.4A CN110705380B (zh) 2019-09-12 2019-09-12 用于实现目标对象属性识别的方法、装置、介质以及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910863091.4A CN110705380B (zh) 2019-09-12 2019-09-12 用于实现目标对象属性识别的方法、装置、介质以及设备

Publications (2)

Publication Number Publication Date
CN110705380A CN110705380A (zh) 2020-01-17
CN110705380B true CN110705380B (zh) 2022-05-24

Family

ID=69194490

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910863091.4A Active CN110705380B (zh) 2019-09-12 2019-09-12 用于实现目标对象属性识别的方法、装置、介质以及设备

Country Status (1)

Country Link
CN (1) CN110705380B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109409371A (zh) * 2017-08-18 2019-03-01 三星电子株式会社 用于图像的语义分割的系统和方法
CN109614985A (zh) * 2018-11-06 2019-04-12 华南理工大学 一种基于密集连接特征金字塔网络的目标检测方法
CN109934163A (zh) * 2018-12-27 2019-06-25 北京航空航天大学 一种基于场景先验和特征再融合的航空图像车辆检测方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109409371A (zh) * 2017-08-18 2019-03-01 三星电子株式会社 用于图像的语义分割的系统和方法
CN109614985A (zh) * 2018-11-06 2019-04-12 华南理工大学 一种基于密集连接特征金字塔网络的目标检测方法
CN109934163A (zh) * 2018-12-27 2019-06-25 北京航空航天大学 一种基于场景先验和特征再融合的航空图像车辆检测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
"Feature Pyramid Networks for Object Detection";Tsung-Yi Lin 等;《arXiv》;20171109;正文第1-9页 *

Also Published As

Publication number Publication date
CN110705380A (zh) 2020-01-17

Similar Documents

Publication Publication Date Title
CN113486796B (zh) 无人车位置检测方法、装置、设备、存储介质及车辆
CN108898086B (zh) 视频图像处理方法及装置、计算机可读介质和电子设备
CN108846440B (zh) 图像处理方法及装置、计算机可读介质和电子设备
CN110473137B (zh) 图像处理方法和装置
CN112862702B (zh) 图像增强方法、装置、设备及存储介质
CN106161980A (zh) 基于双摄像头的拍照方法及系统
US10474935B2 (en) Method and device for target detection
CN111666960A (zh) 图像识别方法、装置、电子设备及可读存储介质
CN110533046B (zh) 一种图像实例分割方法、装置、计算机可读存储介质及电子设备
CN111598065A (zh) 深度图像获取方法及活体识别方法、设备、电路和介质
CN111292335B (zh) 一种前景掩模特征图的确定方法、装置及电子设备
CN114170826B (zh) 自动驾驶控制方法和装置、电子设备和存储介质
CN113610172A (zh) 神经网络模型训练方法和装置、传感数据融合方法和装置
CN113947768A (zh) 一种基于单目3d目标检测的数据增强方法和装置
US20110033085A1 (en) Image processing apparatus and image processing method
CN115294328A (zh) 目标检测框的生成方法、装置、存储介质和电子设备
CN114782510A (zh) 目标物体的深度估计方法和装置、存储介质、电子设备
JP2021529370A (ja) ターゲット対象の向きの決定方法、スマート運転制御方法及び装置並びに機器
US20170293818A1 (en) Method and system that determine the suitability of a document image for optical character recognition and other image processing
CN112132753B (zh) 多尺度结构引导图像的红外图像超分辨率方法及系统
CN110705380B (zh) 用于实现目标对象属性识别的方法、装置、介质以及设备
CN112037130A (zh) 一种自适应图像拼接融合方法、装置、电子设备及存储介质
CN113989376B (zh) 室内深度信息的获取方法、装置和可读存储介质
CN112804477B (zh) 预置点图像参数的确定方法、装置、电子设备及存储介质
CN112153298B (zh) 确定目标对象理想亮度的方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant