CN114677347A - 一种人形识别方法、装置、设备及介质 - Google Patents

一种人形识别方法、装置、设备及介质 Download PDF

Info

Publication number
CN114677347A
CN114677347A CN202210279621.2A CN202210279621A CN114677347A CN 114677347 A CN114677347 A CN 114677347A CN 202210279621 A CN202210279621 A CN 202210279621A CN 114677347 A CN114677347 A CN 114677347A
Authority
CN
China
Prior art keywords
image
human
human shape
determining
rgb
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210279621.2A
Other languages
English (en)
Inventor
王正学
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Huacheng Software Technology Co Ltd
Original Assignee
Hangzhou Huacheng Software Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Huacheng Software Technology Co Ltd filed Critical Hangzhou Huacheng Software Technology Co Ltd
Priority to CN202210279621.2A priority Critical patent/CN114677347A/zh
Publication of CN114677347A publication Critical patent/CN114677347A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/90Determination of colour characteristics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image
    • G06T2207/10012Stereo images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10024Color image

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Image Analysis (AREA)

Abstract

本申请公开了一种人形识别方法、装置、设备及介质,用以提高人形识别结果的准确性。由于在人形识别的过程中,若确定获取到的RGB图像中包含有人形,会获取该RGB图像中包含有人形的第一图像区域、以及与该RGB图像关联的深度图像。然后确定该深度图像中与该第一图像区域对应的第二图像区域的三维数据,从而方便后续基于该三维数据,进一步确定拍摄区域中是否存在人形,从而实现准确地进行人形检测,提高人形检测结果的准确性,避免飞虫、光线等因素的影响。

Description

一种人形识别方法、装置、设备及介质
技术领域
本申请涉及图像处理技术领域,尤其涉及一种人形识别方法、装置、设备及介质。
背景技术
随着科技的不断发展,特别是图像处理技术的发展,人形识别技术广泛应用于视频监控、机器人等各个领域。例如,为了提高用户的交互体验,商场内的导航机器人可以对工作环境下的人形进行识别,从而实现将该导航机器人的显示屏始终面对当前与该导航机器人进行交互的用户。但在进行人形识别的过程中,可能会受到飞虫、光线等因素的影响,从而降低人形识别结果的准确性。因此,如何提高人形识别结果的准确性是近几年来人们日益关注的问题。
发明内容
本申请提供了一种人形识别方法、装置、设备及介质,用以提高人形识别结果的准确性。
本申请提供了一种人形识别方法,所述方法包括:
若确定获取到的红绿蓝RGB图像中包含有人形,则获取与所述RGB图像关联的深度图像;其中,所述深度图像与所述RGB图像的拍摄区域相同;
确定所述深度图像的三维数据;
基于所述三维数据,确定所述拍摄区域中是否存在人形。
本申请提供了一种人形识别装置,所述装置包括:
获取单元,用于若确定获取到的红绿蓝RGB图像中包含有人形,则获取与所述RGB图像关联的深度图像;其中,所述深度图像与所述RGB图像的拍摄区域相同;
确定单元,用于确定所述深度图像的三维数据;
处理单元,用于基于所述三维数据,确定所述拍摄区域中是否存在人形。
本申请提供了一种电子设备,所述电子设备至少包括处理器和存储器,所述处理器用于执行存储器中存储的计算机程序时实现如上述所述人形识别方法的步骤。
本申请提供了一种计算机可读存储介质,其存储有计算机程序,所述计算机程序被处理器执行时实现如上述所述人形识别方法的步骤。
由于在人形识别的过程中,若确定获取到的RGB图像中包含有人形,会获取该RGB图像中包含有人形的第一图像区域、以及与该RGB图像关联的深度图像。然后确定该深度图像中与该第一图像区域对应的第二图像区域的三维数据,从而方便后续基于该三维数据,进一步确定拍摄区域中是否存在人形,从而实现准确地进行人形检测,提高人形检测结果的准确性,避免飞虫、光线等因素的影响。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种人形识别过程示意图;
图2为本申请提供的具体的人形识别流程示意图;
图3为本申请提供的一种人形识别装置的结构示意图;
图4为本申请实施例提供的一种电子设备结构示意图。
具体实施方式
下面将结合附图对本申请作进一步地详细描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。
本领域技术人员知道,本申请的实施方式可以实现为一种系统、装置、设备、方法或计算机程序产品。因此,本申请可以具体实现为以下形式,即:完全的硬件、完全的软件(包括固件、驻留软件、微代码等),或者硬件和软件结合的形式。
在本文中,需要理解的是,附图中的任何元素数量均用于示例而非限制,以及任何命名都仅用于区分,而不具有任何限制含义。
为了方便理解,下面对本申请实施例中涉及的部分概念进行解释:
红绿蓝RGB相机:为普通相机,可以获取到空间二维数据。
深度(Time of flight,TOF)相机:通过发送红外光,计算飞行时间,可以直接获取到空间3维立体数据。
相关技术中,一般采用如下两种方式进行人形检测:
方式一、当红外感应器感应到拍摄范围内有人形有异动,且检测到拍摄范围内有声音异动时,便确定拍摄范围内存在人形。
方式二、检测当前帧中的运动目标,并进行轮廓提取,以及确定移动检测框的个数;根据获取到的移动检测框的结果,判断当前帧中是否存在运动的目标;如果当前帧中存在运动的目标,则确定采集到的红绿蓝RGB图像中是否存在人形。
对于上述的两种方式,容易将拍摄范围内的车子、动物等对象误识别为人形,易受到摇摆的人体模型,光线变化的影响,降低人形识别的准确率。
为了解决上述的问题,本申请提供了一种人形识别方法、装置、设备及介质。由于在人形识别的过程中,若确定获取到的RGB图像中包含有人形,会获取该RGB图像中包含有人形的第一图像区域、以及与该RGB图像关联的深度图像。然后确定该深度图像中与该第一图像区域对应的第二图像区域的三维数据,从而方便后续基于该三维数据,进一步确定拍摄区域中是否存在人形,从而实现准确地进行人形检测,提高人形检测结果的准确性,避免飞虫、光线等因素的影响。
实施例1:
图1为本申请实施例提供的一种人形识别过程示意图,该过程包括:
S101:若确定获取到的红绿蓝RGB图像中包含有人形,则获取与所述RGB图像关联的深度图像;其中,所述深度图像与所述RGB图像的拍摄区域相同。
本申请实施例提供的人形识别方法应用于电子设备,该电子设备可以是图像采集设备,比如,双目相机,或,具有两个摄像头的相机等,也可以是接收到图像采集设备采集到的图像的PC、服务器等设备。
在一些可能的应用场景中,在需要监控的拍摄区域安装有至少一个相机,以实时确定该拍摄区域中是否存在人形,从而方便后续对拍摄区域的过往人员进行管理。为保证能够得到途径拍摄区域的所有人像图像,该相机可以按照一定的采集周期进行图像的采集,或者按照设置的采集时间进行图像的采集。后续进行人形识别的电子设备可以对采集到的图像进行相应的处理,从而实现准确地确定拍摄区域是否存在人形。
需要说明的是,该进行人形识别的电子设备可以与该相机相同,也可以不同。也就是说,该进行人形识别的电子设备获取到的图像可以是自身采集到的,也可以是接收其它设备发送的。
在进行人形识别的过程中,电子设备获取到的图像包括RGB图像,即用于采集拍摄区域的图像的相机至少包括RGB相机。例如,采集拍摄区域的图像的相机为双目相机,则该双目相机至少包括RGB相机。电子设备可以对获取到的RGB图像进行人形检测,确定该RGB图像中是否包含有人形,从而方便电子设备可以从获取到的大量的图像中,筛选出可能存在人形的RGB图像,进而基于筛选出的可能存在人形的RGB图像,确定拍摄区域中是否存在人形。示例性的,电子设备可以通过传统视觉算法确定RGB图像中是否包含有人形,比如,局部二值模式(Local binary pattern,LBP),也可以通过预先训练的人形检测模型确定RGB图像中是否包含有人形,还可以通过人工标定的方法确定RGB图像中是否包含有人形。具体实施过程中,可以根据实际需求进行灵活设置,在此不做具体限定。
例如,电子设备获取到至少一张RGB图像之后,可以按照采集时间的顺序,依次将获取到的至少一张RGB图像缓存到队列(queue)中,该队列的深度可以为预设数值max。示例性的,电子设备使用FIFO(First Input First Output,先入先出)算法,将获取到的至少一张RGB图像缓存到队列中。电子设备后续可以从队列头部取出RGB图像进行人形检测,确定获取到的RGB图像中是否包含有人形。
在一种可能的实施方式中,为了方便电子设备对RGB图像进行人形检测,可以先获取该RGB图像的灰度图像,对该灰度图像进行人形检测,从而减少人形检测所需的计算量。示例性的,若确定该灰度图像中包含有人形,则确定该RGB图像中包含有人形。若确定该灰度图像中不包含有人形,则确定该RGB图像中不包含有人形。
在本申请中,电子设备还可以获取到拍摄区域的深度图像,即用于采集拍摄区域的图像的相机还包括深度相机。例如,采集拍摄区域的图像的相机为双目相机,则该双目相机还包括深度相机。电子设备通过该深度相机,可以方便获取到拍摄区域的三维数据,并基于该三维数据,模拟出拍摄区域的实际环境,从而准确地确定该拍摄区域中是否存在人形。示例性的,当确定获取到的RGB图像中包含有人形时,可以获取与该RGB图像关联的深度图像。其中,与该RGB图像关联的深度图像可以是在确定该RGB图像中包含有人形时,采集到的深度图像,也可以是采集该RGB图像时,采集到的拍摄区域的深度图像。
需要说明的是,深度图像与RGB图像的拍摄区域相同。
考虑到只有在确定RGB图像中存在人形的时候,才会用到深度图像进行后续的处理,因此,在人形识别过程中,用于采集拍摄区域的深度图像的深度相机的默认状态可以是低功耗模式,即不采集拍摄区域的深度图像,当确定RGB图像中存在人形时,该深度相机才开始采集拍摄区域的深度图像,即将该深度相机从默认状态转换为工作状态,从而减少深度相机采集大量的深度图像所耗费的资源,解决因深度相机持续工作,功耗较大问题。
在一种可能的实施方式中,考虑到电子设备实时确定采集到的大量的RGB图像中是否包含有人形,会耗费大量的计算量。并且,拍摄区域中存在人形时,该人形一般会在拍摄区域中发生运动,从而造成相机采集到的图像发生变化。因此,在本申请中,电子设备可以在获取到任一RGB图像后,可以先确定该RGB图像与获取到的上一帧RGB图像是否不同,从而确定该拍摄区域中是否存在发生运动的目标,进而确定是否需要对该RGB图像进行人形检测,降低电子设备所需的计算量。示例性的,电子设备可以通过确定获取到的RGB图像与上一帧RGB图像之间的相似度,确定两张图像是否不同,也可以通过模型确定获取到的两张图像之间是否不同。具体确定两张图像是否不同时,可以根据实际需求进行灵活设置,在此不做具体限定。当确定获取到的RGB图像与获取到的上一帧RGB图像相同时,说明拍摄区域中不存在发生运动的目标,则获取下一帧RGB图像。当确定获取到的RGB图像与获取到的上一帧RGB图像不同时,说明拍摄区域中存在发生运动的目标,则对该RGB图像进行人形检测,确定该RGB图像中是否存在人形。
例如,电子设备获取到至少一张RGB图像之后,可以按照采集时间的顺序,依次将获取到的至少一张RGB图像缓存到队列(queue)中,该队列的深度可以为预设数值max。示例性的,电子设备使用FIFO(First Input First Output,先入先出)算法,将获取到的至少一张RGB图像缓存到队列中。电子设备后续可以从队列头部取出队列前两帧RGB图像进行移动检测,即确定这两帧RGB图像之间是否不同。若确定这两帧图像之间相同,说明拍摄区域中不存在发生运动的目标,则继续从队列头部取出队列前两帧RGB图像进行移动检测。若确定这两帧图像之间不同,说明拍摄区域中存在发生运动的目标,则对取出的后一帧RGB图像进行人形检测。
在一种可能的实施方式中,电子设备也可以在确定拍摄区域中存在发生运动的目标后,可以确定获取到的所有RGB图像的灰度图像,从所有灰度图像中,确定最佳灰度图像。示例性的,可以将清晰度最高的灰度图像确定为最佳灰度图像,也可以将存在噪声最少的灰度图像确定为最佳灰度图像,还可以将亮度在预设范围内的灰度图像确定为最佳灰度图像。然后对该最佳灰度图像进行人形检测,从而保证人形检测的效果,避免RGB图像的采集质量对人形检测的结果的影响。
例如,电子设备使用FIFO(First Input First Output,先入先出)算法,将获取到的至少一张RGB图像缓存到队列中。电子设备后续可以从队列头部取出队列前两帧RGB图像进行移动检测,即确定这两帧RGB图像之间是否不同。若确定这两帧图像之间相同,说明拍摄区域中不存在发生运动的目标,则继续从队列头部取出队列前两帧RGB图像进行移动检测。若确定这两帧图像之间不同,说明拍摄区域中存在发生运动的目标,则获取队列中缓存的所有RGB图像的灰度图像,从获取到的所有灰度图像中,确定最佳灰度图像,并对该最佳灰度图像进行人形检测。
S102:确定所述深度图像的三维数据。
电子设备获取到深度图像后,可以对该深度图像进行处理,比如,深度计算,获取该深度图像的三维数据。其中,该三维数据至少包括深度信息。
需要说明的是,获取深度图像的三维数据的具体过程数据现有技术,在此不做具体限定。
在一种可能的实施方式中,所述确定所述深度图像的三维数据,包括:
获取所述RGB图像中包含有人形的第一图像区域;
确定所述深度图像中与所述第一图像区域对应的第二图像区域;
对所述第二图像区域进行处理,确定所述第二图像区域的三维数据。
考虑到获取全帧深度图像的三维数据,可能会耗费大量的计算量。因此,在本申请中,可以只获取深度图像中可能存在人形的区域的三维数据。示例性的,在对RGB图像进行人形检测的过程中,若该RGB图像中包含有人形,则还可以获取到该RGB图像中包含有人形的图像区域(记为第一图像区域)。其中,该第一图像区域为RGB图像去除了大量的背景信息的子图像。根据该第一图像区域,确定深度图像中与该第一图像区域对应的图像区域(记为第二图像区域),该第二图像区域为该深度图像中可能包含有人形的图像区域。例如,可以根据该第一图像区域中包含的每个像素点在RGB图像中的位置信息,确定深度图像中分别与这些位置信息对应的像素点,将确定的每个像素点所构成的图像区域确定为第二图像区域。电子设备获取到第二图像区域后,可以对该第二图像区域进行处理,比如,深度计算,获取该第二图像区域的三维数据。
S103:基于所述三维数据,确定所述拍摄区域中是否存在人形。
当基于上述的实施例获取到三维数据后,电子设备可以对该三维数据进行相应的处理,比如,通过最近点搜索法(Iterative Closest Point,ICP)对该三维数据进行处理,从而确定该拍摄区域中是否存在人形。
在一种示例中,电子设备对获取到的三维数据进行处理,比如,通过最近点搜索法(Iterative Closest Point,ICP)对该三维数据进行处理,可以确定该深度图像中是否存在人形。当基于该三维数据,确定深度图像中存在人形,则可以基于该三维数据,确定采集到该深度图像时该人形与相机之间的距离,以通过该距离,进一步准确地确定拍摄区域中是否存在人形。
考虑到一般需要关注的人形不会距离相机太远,也不会距离相机太近,且一定会经过该拍摄区域中的某一范围内的。因此,在本申请中,预设有距离范围(记为预设距离范围)。当基于上述的实施例获取人形与相机之间的距离后,可以判断该距离是否在预设距离范围内。若确定该距离在预设距离范围内,说明该人形是需要进行关注的,则可以确定该拍摄区域中存在人形。
在一种可能的实施方式中,若确定该距离不在预设距离范围内,说明该人形是不需要进行关注的,则可以确定该拍摄区域中不存在人形。
在另一种可能的实施方式中,若确定该距离不在预设距离范围内,则可以获取该深度图像之后的预设帧数深度图像,并确定该预设帧数深度图像中是否存在人形。若确定该预设帧数图像中存在人形,则确定该拍摄区域中存在人形。若确定该预设帧数图像中仍不存在人形,则确定该拍摄区域中不存在人形,从而避免采集到的一帧深度图像中存在的误差,对人形识别结果的影响,进一步提高人形识别结果的准确性。
同样的,当基于上述的实施例确定获取到的深度图像中不存在人形,即基于三维数据,确定该深度图像中不存在人形,则可以获取该深度图像之后的预设帧数深度图像,并确定该预设帧数深度图像中是否存在人形。若确定该预设帧数图像中存在人形,则确定该拍摄区域中存在人形。若确定该预设帧数图像中仍不存在人形,则确定该拍摄区域中不存在人形,从而避免采集到的一帧深度图像中存在的误差,对人形识别结果的影响,进一步提高人形识别结果的准确性。
在本申请中,当基于上述的实施例确定了拍摄区域中存在人形,则可以关闭用于采集深度图像的深度相机,或,控制该深度相机进入低功耗状态,上报检测到人形的结果,方便后续对检测到的人形进行进一步地处理,同时电子设备也可以进行下一次的人形检测。当基于上述的实施例确定了拍摄区域中不存在人形,则也可以关闭用于采集深度图像的深度相机,或,控制该深度相机进入低功耗状态,上报未检测到人形的结果,并进行下一次的人形检测。
由于在人形识别的过程中,若确定获取到的RGB图像中包含有人形,会获取该RGB图像中包含有人形的第一图像区域、以及与该RGB图像关联的深度图像。然后确定该深度图像中与该第一图像区域对应的第二图像区域的三维数据,从而方便后续基于该三维数据,进一步确定拍摄区域中是否存在人形,从而实现准确地进行人形检测,提高人形检测结果的准确性,避免飞虫、光线等因素的影响。
实施例2:
下面通过具体的实施例对本申请提供的人形识别方法进行详细的介绍,图2为本申请提供的具体的人形识别流程示意图,以电子设备为双目相机为例,该流程包括:
S201:初始化双目相机。
其中,初始化双目相机包括:开启双目相机的RGB相机,控制该双目相机的深度相机进入低功耗状态,即该深度相机不采集深度图像。
S202:使用FIFO算法,将获取到的至少一张RGB图像缓存到队列中,该队列的深度可以为预设数值max。
S203:从队列头部取出队列前两帧RGB图像进行移动检测,即确定这两帧RGB图像之间是否不同,若是,执行S204,否则,执行S202。
S204:获取队列中所有RGB图像的灰度图像,从所有灰度图像中,确定最佳灰度图像。
S205:判断该最佳灰度图像中是否存在人形,若是,执行S206,否则,执行S202。
S206:获取该最佳灰度图像中包含有人形的第一图像区域。
S207:控制深度相机采集深度图像。
其中,可以通过控制深度相机从低功耗状态转变为工作状态,实现控制深度相机开始采集深度图像。
通过深度相机可以直接获取深度信息,不需要通过复杂算法,计算深度信息,因此算法简单,大大降低了对电子设备的算力要求。
S208:根据该第一图像区域,确定深度图像中与该第一图像区域对应的第二图像区域。
S209:获取该第二图像区域的三维数据,并基于该三维数据,确定该深度图像中是否存在人形,若是,执行S210,否则,执行S211。
S210:基于该三维数据,确定采集该深度图像时该人形与相机之间的距离,并判断该距离是否在预设距离范围内,若是,执行S213,否则,执行S211。
S211:判断是否已经采集到该RGB图像关联的预设帧数深度图像,若是,执行S212,否则,执行S207。
S212:确定拍摄区域中不存在人形,控制该深度相机进入低功耗状态,上报未检测到人形的结果,并进行下一次的人形检测。
S213:确定拍摄区域中存在人形,控制该深度相机关闭,上报检测到人形的结果,并进行下一次的人形检测。
实施例3:
本申请提供了一种人形识别装置,图3为本申请提供的一种人形识别装置的结构示意图,该装置包括:
获取单元31,用于若确定获取到的红绿蓝RGB图像中包含有人形,则获取与所述RGB图像关联的深度图像;其中,所述深度图像与所述RGB图像的拍摄区域相同;
确定单元32,用于确定所述深度图像的三维数据;
处理单元33,用于基于所述三维数据,确定所述拍摄区域中是否存在人形。
在某些可能的实施方式中,所述获取单元31,还用于确定获取到的红绿蓝RGB图像中包含有人形之前,确定所述RGB图像与获取到的上一帧RGB图像不同。
在某些可能的实施方式中,所述获取单元31,具体用于确定所述RGB图像的灰度图像;对所述灰度图像进行人形检测处理;若确定所述灰度图像中检测到人形,则确定所述RGB图像中包含有人形。
在某些可能的实施方式中,所述确定单元32,具体用于获取所述RGB图像中包含有人形的第一图像区域;确定所述深度图像中与所述第一图像区域对应的第二图像区域;对所述第二图像区域进行处理,确定所述第二图像区域的三维数据。
在某些可能的实施方式中,所述处理单元33,具体用于若基于所述三维数据,确定所述深度图像中存在人形,则基于所述三维数据,确定采集所述深度图像时所述人形与相机之间的距离;若所述距离在预设距离范围内,则确定所述拍摄区域中存在人形。
在某些可能的实施方式中,所述处理单元33,具体用于若基于所述三维数据,确定所述深度图像中不存在人形,则获取所述深度图像之后的预设帧数深度图像,并确定所述预设帧数深度图像中是否存在人形;若所述预设帧数图像中均不存在人形,则确定所述拍摄区域中不存在人形。
在某些可能的实施方式中,所述处理单元33,具体用于若所述预设帧数图像中存在人形,则确定所述拍摄区域中存在人形。
由于在人形识别的过程中,若确定获取到的RGB图像中包含有人形,会获取该RGB图像中包含有人形的第一图像区域、以及与该RGB图像关联的深度图像。然后确定该深度图像中与该第一图像区域对应的第二图像区域的三维数据,从而方便后续基于该三维数据,进一步确定拍摄区域中是否存在人形,从而实现准确地进行人形检测,提高人形检测结果的准确性,避免飞虫、光线等因素的影响。
实施例4:
如图4为本申请实施例提供的一种电子设备结构示意图,在上述各实施例的基础上,本申请实施例还提供了一种电子设备,如图4所示,包括:处理器41、通信接口42、存储器43和通信总线44,其中,处理器41,通信接口42,存储器43通过通信总线44完成相互间的通信;
存储器43中存储有计算机程序,当程序被处理器41执行时,使得处理器41执行如下步骤:
若确定获取到的红绿蓝RGB图像中包含有人形,则获取与所述RGB图像关联的深度图像;其中,所述深度图像与所述RGB图像的拍摄区域相同;
确定所述深度图像的三维数据;
基于所述三维数据,确定所述拍摄区域中是否存在人形。
由于上述电子设备解决问题的原理与人形识别方法相似,因此上述电子设备的实施可以参见方法的实施,重复之处不再赘述。
上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。通信接口62用于上述电子设备与其他设备之间的通信。存储器可以包括随机存取存储器(RandomAccess Memory,RAM),也可以包括非易失性存储器(Non-Volatile Memory,NVM),例如至少一个磁盘存储器。可选地,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述处理器可以是通用处理器,包括中央处理器、网络处理器(NetworkProcessor,NP)等;还可以是数字指令处理器(Digital Signal Processing,DSP)、专用集成电路、现场可编程门陈列或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。
由于在人形识别的过程中,若确定获取到的RGB图像中包含有人形,会获取该RGB图像中包含有人形的第一图像区域、以及与该RGB图像关联的深度图像。然后确定该深度图像中与该第一图像区域对应的第二图像区域的三维数据,从而方便后续基于该三维数据,进一步确定拍摄区域中是否存在人形,从而实现准确地进行人形检测,提高人形检测结果的准确性,避免飞虫、光线等因素的影响。
实施例5:
在上述各实施例的基础上,本申请实施例还提供了一种计算机可读存储介质,计算机可读存储介质内存储有可由处理器执行的计算机程序,当程序在处理器上运行时,使得处理器执行时实现如下步骤:
若确定获取到的红绿蓝RGB图像中包含有人形,则获取与所述RGB图像关联的深度图像;其中,所述深度图像与所述RGB图像的拍摄区域相同;
确定所述深度图像的三维数据;
基于所述三维数据,确定所述拍摄区域中是否存在人形。
本申请实施例提供的计算机可读介质解决问题的原理与人形识别方法解决问题的原理相同,具体内容可参见上述方法实施例。
由于在人形识别的过程中,若确定获取到的RGB图像中包含有人形,会获取该RGB图像中包含有人形的第一图像区域、以及与该RGB图像关联的深度图像。然后确定该深度图像中与该第一图像区域对应的第二图像区域的三维数据,从而方便后续基于该三维数据,进一步确定拍摄区域中是否存在人形,从而实现准确地进行人形检测,提高人形检测结果的准确性,避免飞虫、光线等因素的影响。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (10)

1.一种人形识别方法,其特征在于,所述方法包括:
若确定获取到的红绿蓝RGB图像中包含有人形,则获取与所述RGB图像关联的深度图像;其中,所述深度图像与所述RGB图像的拍摄区域相同;
确定所述深度图像的三维数据;
基于所述三维数据,确定所述拍摄区域中是否存在人形。
2.如权利要求1所述的方法,其特征在于,所述确定获取到的红绿蓝RGB图像中包含有人形之前,所述方法还包括:
确定所述RGB图像与获取到的上一帧RGB图像不同。
3.如权利要求1所述的方法,其特征在于,所述确定获取到的红绿蓝RGB图像中包含有人形,包括:
确定所述RGB图像的灰度图像;
对所述灰度图像进行人形检测处理;
若确定所述灰度图像中检测到人形,则确定所述RGB图像中包含有人形。
4.如权利要求1所述的方法,其特征在于,所述确定所述深度图像的三维数据,包括:
获取所述RGB图像中包含有人形的第一图像区域;
确定所述深度图像中与所述第一图像区域对应的第二图像区域;
对所述第二图像区域进行处理,确定所述第二图像区域的三维数据。
5.如权利要求1所述的方法,其特征在于,基于所述三维数据,确定所述拍摄区域中存在人形,包括:
若基于所述三维数据,确定所述深度图像中存在人形,则基于所述三维数据,确定采集所述深度图像时所述人形与相机之间的距离;
若所述距离在预设距离范围内,则确定所述拍摄区域中存在人形。
6.如权利要求1-5任一所述的方法,其特征在于,基于所述三维数据,确定所述拍摄区域中不存在人形,包括:
若基于所述三维数据,确定所述深度图像中不存在人形,则获取所述深度图像之后的预设帧数深度图像,并确定所述预设帧数深度图像中是否存在人形;
若所述预设帧数图像中均不存在人形,则确定所述拍摄区域中不存在人形。
7.如权利要求6所述的方法,其特征在于,所述方法还包括:
若所述预设帧数图像中存在人形,则确定所述拍摄区域中存在人形。
8.一种人形识别装置,其特征在于,所述装置包括:
获取单元,用于若确定获取到的红绿蓝RGB图像中包含有人形,则获取与所述RGB图像关联的深度图像;其中,所述深度图像与所述RGB图像的拍摄区域相同;
确定单元,用于确定所述深度图像的三维数据;
处理单元,用于基于所述三维数据,确定所述拍摄区域中是否存在人形。
9.一种电子设备,其特征在于,所述电子设备至少包括处理器和存储器,所述处理器用于执行存储器中存储的计算机程序时实现如权利要求1-7中任一所述人形识别方法的步骤。
10.一种计算机可读存储介质,其特征在于,其存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1-7中任一所述人形识别方法的步骤。
CN202210279621.2A 2022-03-21 2022-03-21 一种人形识别方法、装置、设备及介质 Pending CN114677347A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210279621.2A CN114677347A (zh) 2022-03-21 2022-03-21 一种人形识别方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210279621.2A CN114677347A (zh) 2022-03-21 2022-03-21 一种人形识别方法、装置、设备及介质

Publications (1)

Publication Number Publication Date
CN114677347A true CN114677347A (zh) 2022-06-28

Family

ID=82075150

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210279621.2A Pending CN114677347A (zh) 2022-03-21 2022-03-21 一种人形识别方法、装置、设备及介质

Country Status (1)

Country Link
CN (1) CN114677347A (zh)

Similar Documents

Publication Publication Date Title
JP6942488B2 (ja) 画像処理装置、画像処理システム、画像処理方法、及びプログラム
CN109934065B (zh) 一种用于手势识别的方法和装置
CN106886216B (zh) 基于rgbd人脸检测的机器人自动跟踪方法和系统
KR20120138627A (ko) 안면 추적 장치 및 방법
CN111062263B (zh) 手部姿态估计的方法、设备、计算机设备和存储介质
JP2016015045A (ja) 画像認識装置、画像認識方法及びプログラム
WO2022121130A1 (zh) 电力目标检测方法、装置、计算机设备和存储介质
US10909388B2 (en) Population density determination from multi-camera sourced imagery
US11200681B2 (en) Motion detection method and motion detection system with low computational complexity and high detection accuracy
JP2018120283A (ja) 情報処理装置、情報処理方法及びプログラム
CN114267041B (zh) 场景中对象的识别方法及装置
CN111598065A (zh) 深度图像获取方法及活体识别方法、设备、电路和介质
CN111382637A (zh) 行人检测跟踪方法、装置、终端设备及介质
CN110827320A (zh) 基于时序预测的目标跟踪方法和装置
CN112949418A (zh) 说话对象的确定方法、装置、电子设备及存储介质
JP6991045B2 (ja) 画像処理装置、画像処理装置の制御方法
WO2022198508A1 (zh) 镜头异常提示方法、装置、可移动平台及可读存储介质
KR101290517B1 (ko) 촬영장치 및 이의 대상 추적방법
CN111784750A (zh) 视频图像中移动物体追踪方法、装置、设备以及存储介质
JPWO2018179119A1 (ja) 映像解析装置、映像解析方法およびプログラム
CN114677347A (zh) 一种人形识别方法、装置、设备及介质
CN113658274B (zh) 用于灵长类动物种群行为分析的个体间距自动计算方法
KR20220127188A (ko) 맞춤형 객체 검출 모델을 가진 객체 검출 장치
CN107977644B (zh) 基于图像采集设备的图像数据处理方法及装置、计算设备
JP4942197B2 (ja) テンプレート作成装置及び表情認識装置並びにその方法、プログラム及び記録媒体

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination