WO2022237591A1

WO2022237591A1 - 运动对象的识别方法、装置、电子设备及可读存储介质

Info

Publication number: WO2022237591A1
Application number: PCT/CN2022/090390
Authority: WO
Inventors: 何伟; 马欣; 吴臻志; 祝夭龙
Original assignee: 北京灵汐科技有限公司
Priority date: 2021-05-08
Filing date: 2022-04-29
Publication date: 2022-11-17
Also published as: CN113096158A

Abstract

本公开提供一种运动对象的识别方法、装置、电子设备及可读存储介质，其中，方法包括：获取基于事件的视觉传感器采集的事件流数据；根据采集的事件流数据，进行感兴趣目标检测，得到检测结果；在检测结果为检测到感兴趣目标的情况下，获取目标图像帧集合；其中，目标图像帧集合包括目标时间段内的图像帧，目标时间段包括感兴趣目标出现的时间段；根据目标图像帧集合，识别运动对象。根据该方法，可以节约计算资源，提高计算效率。

Description

运动对象的识别方法、装置、电子设备及可读存储介质

技术领域

本公开实施例涉及图像检测技术领域，尤其涉及一种运动对象的识别方法、装置、电子设备及可读存储介质。

背景技术

目前，出于安防管理的需要，监控设备布满了街道、社区、楼宇等各种公共场合。当监控设备采集的视频中出现运动对象的时间相对稀疏时，在对监控设备采集的视频进行分析时，通常包括大量无实际内容的图像帧，从而需要耗费大量不必要的计算资源，计算效率也较低。

发明内容

本公开实施例提供了一种运动对象的识别方法、装置、电子设备及可读存储介质，以节约对运动对象进行识别的计算资源，提高计算效率。

第一方面，本公开实施例提供了一种运动对象的识别方法，包括：获取基于事件的视觉传感器采集的事件流数据；根据采集的事件流数据，进行感兴趣目标检测，得到检测结果；在检测结果为检测到感兴趣目标的情况下，获取目标图像帧集合；其中，目标图像帧集合包括目标时间段内的图像帧，目标时间段包括感兴趣目标出现的时间段；根据目标图像帧集合，识别运动对象。

第二方面，本公开实施例提供了一种运动对象的识别装置，包括：第一获取模块，用于获取基于事件的视觉传感器采集的事件流数据；检测模块，用于根据采集的事件流数据，进行感兴趣目标检测，得到检测结果；第二获取模块，用于在检测结果为检测到感兴趣目标的情况下，获取目标图像帧集合；其中，目标图像帧集合包括目标时间段内的图像帧，目标时间段包括感兴趣目标出现的时间段；识别模块，用于根据目标图像帧集合，识别运动对象。

第三方面，本公开实施例还提供了一种电子设备，其特征在于，包括处理器，存储器及存储在存储器上并可在处理器上运行的程序或指令，程序或指令被处理器执行时实现如第一方面的方法的步骤。

第四方面，本公开实施例还提供了一种可读存储介质，可读存储介质上存储程序或指令，程序或指令被处理器执行时实现如第一方面的方法的步骤。

第五方面，本公开实施例还提供一种计算机程序产品，包括计算机可读代码，或者承载有计算机可读代码的非易失性计算机可读存储介质，其中，当计算机可读代码在电子设备的处理器中运行时，电子设备中的处理器执行用于实现如第一方面的方法的步骤。

本公开实施例中，获取动态视觉传感器DVS事件流；根据DVS事件流，进行感兴趣目标检测；在检测到感兴趣目标的情况下，获取目标图像帧集合；目标图像帧集合包括目标时间段内的图像帧，目标时间段包括感兴趣目标出现的时间段；根据目标图像帧集合，识别运动对象。在基于DVS事件流检测到感兴趣目标的情况下，确定存在感兴趣目标，获取基于感兴趣目标确定的目标图像帧集合并进行分析识别运动对象，从而节约计算资源，提高计算效率。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，而非限制本公开。根据下面参考附图对示例性实施例的详细说明，本公开的其它特征及方面将变得清楚。

附图说明

图1是本公开实施例提供的运动对象的识别方法的流程图；

图2是本公开实施例的网络系统的结构图；

图3是本公开实施例提供的运动对象的识别装置的结构框图；

图4是本公开实施例提供的电子设备的结构框图。

具体实施方式

下面将结合本公开实施例中的附图，对本公开实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。另外还需要说明的是，为了便于描述，附图中仅示出了与本公开相关的部分而非全部结构。

在本公开的描述中，需要理解的是，术语“第一”、“第二”仅由于描述目的，且不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。因此，限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者多个该特征。本发明的描述中，除非另有说明，“多个”的含义是两个或两个以上。

在视频监控领域的一些场景中，为了确保监控内容的实时、连贯，会将全部监控到的图像画面信息送给内容监控模块进行分析。这种方式下，无论画面中是否存在有意义的目标，后续分析模块都会进行计算操作。然而，对实际监控录像内容分析可知，视频场景中出现运动对象(监控对象、车等)的时间点相对稀疏，为减少分析模块将大量计算资源消耗到无实际内容的画面帧上，人们考虑只对有运动物体出现时的画面进行分析。

示例性地，无实际内容的画面帧中的画面可以是如下情形中的任一种：画面全黑或全蓝、画面不清晰(画面的清晰度小于预设清晰度阈值)、或画面具有较大面积遮挡(被遮挡画面在视频画面整体面积中占比超过预定比例阈值)。

在一些场景中，可以通过帧差法(也可称为是帧间差分法)来进行运动对象的识别；具体地，帧差法是将色彩模式画面的前后帧对应的像素点进行差运算以得到差值，当该差值的绝对值超过特定阈值，即可以判定画面中是否有运动对象(或移动物体)，以对运动对象进行识别。

在本公开实施例中，色彩模式是工业界的一种颜色标准。作为示例，色彩模式例如可以包括但不限于是：红绿蓝(RED Green Blue，RGB)色彩模式、标准RGB(Standard Red Green Blue，sRGB)色彩模式、Adobe RGB中的一种。其中，RGB色彩模式通过对红色(RED，R)、绿色(Green，G)、蓝色(Blue，B)三个颜色通道的变化以及互相之间的叠加得到多种颜色的；sRGB色彩模式可以基于独立的色彩坐标，使色彩在不同的设备使用传输中对应于同一的色彩坐标体系；Adobe RGB色彩模式与sRGB色彩模式相比具有更大的色域空间。

在一些实施例中，基于色彩模式的图像采集装置例如可以包括如下设备中的至少一种：基于色彩模式的摄像头感光元件、基于色彩模式的相机镜头、基于色彩模式的高速摄像机。

在实际应用场景中，色彩模式例如可以包括RGB色彩模式、sRGB色彩模式和Adobe RGB色彩模式；应理解，色彩模式还可以包括更多类型，具体可以根据图像采集需求进行选择，本公开实施例不做具体限定。

在一些场景中，以色彩模式为RGB色彩模式为例，可以将基于RGB色彩模式简称为是RGB或RGB域；以及，可以将基于色彩模式的图像采集装置采集的图像帧和视频信息，简称为是RGB图像帧和RGB域视频信息。

在通过帧差法识别运动对象时，对于监控区域光照较暗的地方出现的深色的运动目标，受限于基于RGB色彩模式的摄像头感光元件的动态范围，连续图像在运动目标的运动区域的画面像素变化极小，此时使用帧间差方法发现运动对象的难度较大，不利于有效发现运动对象。

对于监控区域中存在高亮度光源的场景，如监控画面中某处有高亮度照明灯发出的光源直射到基于RGB色彩模式的相机镜头，拍摄场景在高亮光源附近会产生一片白色模糊现象，类似人眼看到的炫光模糊，导致在该模糊区域中使用帧差法发现运动对象的难度较大，不利于有效发现运动对象。

第一方面，本公开实施例提供了一种运动对象的识别方法。

本公开实施例的运动对象的识别方法可由相应的运动对象的识别装置执行，该装置可采用软件和/或硬件的方式实现，并一般可集成于电子设备中。

图1是本公开实施例提供的运动对象的识别方法的流程图。参见图1，本公开实施例的运动对象的识别方法包括：

S101、获取基于事件的视觉传感器采集的事件流数据；

S102、根据采集的事件流数据，进行感兴趣目标检测，得到检测结果；

S103、在检测结果为检测到感兴趣目标的情况下，获取目标图像帧集合；其中，目标图像帧集合包括目标时间段内的图像帧，目标时间段包括感兴趣目标出现的时间段；

S104、根据目标图像帧集合，识别运动对象。

本公开实施例的运动对象的识别方法，在基于根据采集的事件流数据确定存在感兴趣目标时，获取基于感兴趣目标确定的目标图像帧集合，并进行分析识别运动对象，通过该方法，可以对基于事件的视觉传感器发现的存在感兴趣目标的时间段的图像帧集合进行后续分析处理，不必将所有时间段的图像帧全部进行后续分析处理，从而可以大幅降低对运动对象(例如移动目标)进行检测的场景中进行目标识别和分析处理的计算量，进而可以节约计算资源，提高计算效率。

在一些实施例中，该运动对象的识别方法可以应用于相应的识别装置，识别装置可以为计算机、服务器等具备数据处理功能的设备或者数据平台。具备数据处理功能的设备例如可以是嵌入式设备。事件流数据可以由识别装置的动态视觉传感模块采集，也可以由独立于识别装置的动态视觉传感器采集后传输至识别装置；图像帧可以由识别装置的基于色彩模式的图像采集模块采集，也可以由独立于识别装置的基于色彩模式的图像采集装置采集后传输至识别装置。

在一些实施例中，基于事件的视觉传感器包括如下任一传感器中的至少一者：动态视觉传感器(Dynamic Vision Sensor，DVS)和事件性相机(Event Camera)传感器。

其中，DVS也可以称为动态事件传感器，传感器内部可以包括多个像素单元构成的像素单元阵列，其中每个像素单元在感应到光强变化时，可以响应并记录光强快速变化的区域；事件性相机传感器可以通过检测每个像素的亮度变化来生成一个事件，具有高动态范围、低延时和无运动模糊的优势；对于事件性相机传感器而言，在检测正在运动的物体时，无论是低光照场景还是高曝光场景，均可以发挥作用。

在本公开实施例中，基于事件的视觉传感器可以采用事件触发的处理机制输出事件流数据。事件流数据可以包括：光强变化的时间戳、光强值以及被触发像素单元的坐标位置等信息。

在本公开实施例的运动对象的识别方法中，由于DVS的事件触发的处理机制，使得DVS可以侦测到更高速率运动的高速物体，具有更大的动态范围，从而可以在监控区域光照较暗的地方(低光照场景)或者监控区域中存在高亮度光源的场景(高曝光场景)下都能准确感应并输出场景变化，因此，相较于帧差法，采用基于事件的视觉传感器进行感兴趣的目标运动对象的检测，有利于降低发现运动对象的难度，并有利于提高发现运动对应的效率和准确性，从而有效发现运动目标。

在一些实施例中，事件流数据是基于事件机制，采用基于事件的视觉传感器，对于捕获的每个像素点位置，当光强度变化超过第一预设阈值时生成该位置的事件信号。具体的，对于捕获的每个像素点位置，当光强度变化超过第一预设阈值，且该像素点位置从低亮度跳变至高亮度时，可以生成“+1”事件信号；当光强度变化超过第一预设阈值，且该像素点位置从高亮度跳变至低亮度时可以生成“-1”事件信号；当光强度变化不超过第一预设阈值时不发送事件信号。

在本公开实施例中，根据事件流数据进行感兴趣目标检测，在检测到感兴趣目标的情况下，可以获取感兴趣目标出现的时间段内的图像帧，得到目标图像帧集合，基于目标图像帧集合中的图像帧，可以通过连续帧间差分法，对目标图像帧集合中的相邻两帧对差分运算，以计算帧间像素变化是否超过第二预设阈值来确定是否存在运动对象。需要说明的是，本公开实施例也可以参考除帧差法之外的其他识别运动对象的方法，在此不再赘述。

以基于事件的视觉传感器为DVS为例，本公开实施例提供的运动对象的识别方法，可以根据获取的事件流数据，进行感兴趣目标检测，得到检测结果；在检测结果为检测到感兴趣目标的情况下，获取与感兴趣目标相关联的目标图像帧集合；再根据目标图像帧集合，识别运动对象。在基于事件流数据确定存在感兴趣目标时，获取基于感兴趣目标确定的目标图像帧集合并进行分析识别运动对象，从而节约计算资源，提高计算效率，并可以降低发现运动对象的难度，从而有效发现运动目标。

在本公开实施例的可选实施方式中，步骤S102具体可以包括：

将事件流数据或者事件流数据对应的脉冲序列输入预训练的神经网络中，通过预训练的神经网络进行感兴趣目标检测，以确定是否检测到感兴趣目标，得到感兴趣目标的检测结果；其中，事件流数据对应的脉冲序列基于对事件流数据编码得到。

本公开实施例中，可以将事件流数据或者事件流数据对应的脉冲序列输入到预训练的神经网络中，以检测感兴趣目标。

需要说明的是，可以使用各种基于事件的视觉传感器采集的事件流数据或者事件流数据对应的脉冲序列来完成输入预训练的神经网络，以进行感兴趣目标检测。例如，可以基于DVS、事件性相机传感器等图像传感器所采集的事件流数据来进行感兴趣目标检测。为了简化描述起见，本文下述的多个实施例以DVS采集的事件流数据(简称DVS事件流数据)为例来阐述进行感兴趣目标检测的具体实施方式。但该描述并不能被解读为限制本方案的范围或实施可能性，对DVS以外的其他基于事件的视觉传感器所采集的事件流数据的处理方法与对DVS事件流数据的处理方法保持一致。

在一种实现形式中，可以将DVS事件流数据输入到预训练的神经网络中。预训练的神经网络可以以采样周期为T的DVS事件流数据作为训练样本进行训练，预训练的神经网络的输入信息可以包括采样周期为T的DVS事件流数据，输出信息可以包括但不限于感兴趣目标指示信息、存在感兴趣目标的置信度、感兴趣目标的位置信息中的至少一项。其中，感兴趣目标指示信息用于指示是否存在感兴趣目标；感兴趣目标的位置信息可以包括四个维度，示例性的，位置信息可以表示为(x，y，w，h)，其中，x、y分别表示感兴趣目标的中心点的横纵坐标，w，h分别表示感兴趣目标的宽和高。

在另一种实现形式中，可以先将DVS事件流数据进行编码得到DVS事件数据对应的脉冲序列，再将脉冲序列输入到预训练的脉冲神经网络中，脉冲神经网络可以表征时空信息，能够提高感兴趣目标检测的准确性。

在一些实施例中，预训练的神经网络为以下任意一项：脉冲神经网络；脉冲神经网络和人工神经网络融合的神经网络。

在本公开实施例的可选实施方式中，图像帧可以由基于色彩模式的图像采集装置采集得到，事件流数据由基于事件的视觉传感器采集得到，例如：DVS事件流数据由动态视觉传感器DVS采集得到的事件流数据。

在步骤S103，在从采集到的事件流数据中检测到感兴趣目标的情况下，可以确定感兴趣目标出现的时间段的数量为至少一个。

作为示例，感兴趣目标出现的每个时间段，可以由每次检测到该感兴趣目标出现的起始时刻和该次检测到该感兴趣目标消失的时刻来确定；作为示例，感兴趣目标出现的时间段，也可以由检测到该感兴趣目标首次出现的起始时刻和最后一次检测到该感兴趣目标消失的时刻来确定。

作为具体示例，若在t1时刻检测到感兴趣目标出现，在t1时刻之后的t2时刻检测到该感兴趣目标消失；在t2时刻之后的t3时刻再次检测到该感兴趣目标出现，在t3时刻之后的t4时刻检测到该感兴趣目标消失，则：可以将从t1时刻到t2时刻的时间段作为一个感兴趣目标出现的时间段，将从t3时刻到t4时刻的时间段作为另一个感兴趣目标出现的时间段；或者，也可以将从t1时刻到t4时刻的时间段为感兴趣目标出现的时间段。

在一些场景中，可以将感兴趣目标消失时刻之后预定时长阈值的时刻，作为感兴趣目标消失的时刻；其中，预定时长阈值的取值大于或等于零，具体可以根据实际情况进行设置。

在一些实施例中，目标图像帧集合包括第一图像帧集合；步骤S103中在检测结果为检测到感兴趣目标的情况下，获取目标图像帧集合的步骤，具体可以包括：S11，在检测到感兴趣目标的情况下，获取通过基于色彩模式的图像采集装置采集的在目标时间段内的图像帧，得到第一图像帧集合。

在一些实施例中，步骤S11中获取的图像帧的数量大于或等于1且小于或等于N，N为目标时间段内图像帧的总数量。

例如，在监控场景例如违章车辆拍摄场景中，通常只需要获取若干(数量大于或等于1且小于N)图像帧，就可以准确率较高的运动对象识别结果。为了降低基于色彩模式的图像采集装置的能耗和节约内存空间，可以设置获取目标时间段内的图像帧的数量为大于或等于1且小于N，设置的数量的具体取值可以根据实际需要来确定，本公开实施例不做具体限定。

在本公开实施例中，事件流数据可以由独立于识别装置的动态视觉传感器采集，识别装置可以从动态视觉传感器获取事件流数据。图像帧由独立于识别装置的基于色彩模式的图像采集装置采集，识别装置可以从通过图像采集装置获取图像帧。

在一些实施例中，步骤S11中获取通过基于色彩模式的图像采集装置采集的在目标时间段内的图像帧，得到第一图像帧集合的步骤，具体可以包括如下步骤。

S21，在第一时刻向基于色彩模式的图像采集装置发送第一指令，第一时刻为目标时间段的起始时刻，第一指令用于指示基于色彩模式的图像采集装置采集并返回实时图像帧；S22，接收基于色彩模式的图像采集装置发送的实时图像帧；S23，在第二时刻向基于色彩模式的图像采集装置发送第二指令，第二时刻为目标时间段的终止时刻，第二指令用于指示基于色彩模式的图像采集装置停止采集实时图像帧；S24，根据接收的从起始时刻到终止时刻的实时图像帧，得到第一图像帧集合。

在本公开实施例中，在检测到感兴趣目标时，可以将检测到感兴趣目标的当前时刻确定为目标时间段的初始时刻，在此表示为第一时刻。识别装置可以在第一时刻向基于色彩模式的图像采集装置发送第一指令，以指示基于色彩模式的图像采集装置开始采集实时图像帧，并将实时图像帧返回识别装置。当感兴趣目标消失后，可以确定目标时间段的终止时刻，在此表示为第二时刻。识别装置可以在第二时刻向基于色彩模式的图像采集装置发送第二指令，以指示基于色彩模式的图像采集装置停止采集实时图像帧。识别装置可以通过接收第一时刻至第二时刻之间的实时图像帧，实时图像帧是指基于色彩模式的图像采集装置采集每一帧原始图像得到第一图像帧集合。

具体实现时，第一时刻可以为初次检测到存在感兴趣目标的时刻，第二时刻的确定可以基于检测到感兴趣目标消失的时刻延后预定时长阈值。由于感兴趣目标的出现可能不连续，目标时间段的数量可以为多个，第一时刻为每次感兴趣目标出现时的时刻，第二时刻为每次感兴趣目标消失的时刻，第一图像帧集合包括多个目标时间段内接收到的实时图像帧，具体可根据实际情况决定，本公开实施例在此不作限定。

本实现形式中，基于色彩模式的图像采集装置可以仅需采集目标时间段内的实时图像帧，在其他时间，基于色彩模式的图像采集可以不采集实时图像帧，从而可以降低基于色彩模式的图像采集装置的能耗。同时，识别装置可以仅存储第一图像帧集合，节约内存空间，提高了内存利用率。

在一些实施例中，目标图像帧集合包括第一图像帧集合，运动对象的识别方法还包括：接收基于色彩模式的图像采集装置发送的实时图像帧；其中，图像帧是在基于色彩模式的图像采集装置采集事件流数据的过程中，通过基于色彩模式的图像采集装置同步采集得到。

在该实施例中，步骤S11中获取通过基于色彩模式的图像采集装置采集的在目标时间段内的图像帧，得到第一图像帧集合的步骤，具体可以包括：S31，从接收的图像帧中获取目标时间段内的实时图像帧，得到第一图像帧集合。

在该实施例中，在基于事件的视觉传感器采集事件流数据的过程中，基于色彩模式的图像采集装置(例如基于RGB色彩模式的相机，简称RGB相机)可以同步采集实时图像帧，DVS事件流数据可以与实时图像帧在时间上对齐，例如，一定时间区间内的DVS事件流数据可以对应一实时图像帧。识别装置可以接收DVS事件流数据以及接收实时图像帧，当根据DVS事件流数据检测到存在感兴趣目标时，识别装置可以基于当前的DVS事件流数据，对应获取与其时间对齐的实时图像帧，从而获取目标时间段内的至少部分实时图像帧，得到目标图像帧集合。本实现形式获取的目标图像帧集合可以更加准确地对应感兴趣目标出现时的实时图像帧，提高了运动对象识别的准确性。

在一些实施例中，目标图像帧集合包括第二图像帧集合。

在该实施例中，步骤S103中的在检测到存在感兴趣目标的情况下，获取目标图像帧集合的步骤，具体可以包括：S41，根据事件流数据，确定感兴趣目标的位置信息； S42，在基于色彩模式的图像采集装置采集的实时图像帧中，截取位置信息对应的图像帧，得到第二图像帧集合。

本公开实施例中，基于DVS事件流可以捕获存在相对运动且光强度变化超过第一预设阈值的像素点，而这些像素点通常分布在对象的轮廓或者边界周围，因此感兴趣目标所在的位置，很有可能存在运动对象。识别装置可以在基于色彩模式的图像采集装置采集的实时图像帧中，截取感兴趣目标的位置信息对应的图像，得到目标图像帧集合。也就是说，图像帧集合中的图像帧在基于色彩模式的图像采集装置采集的实时图像帧中，对应于该位置信息的局部图像，基于该目标图像帧集合识别运动对象，可以进一步提高运动对象检测的效率和准确性。

在本公开实施例中，识别装置可以接收基于色彩模式的图像采集装置采集的实时图像帧以及动态视觉传感器采集的DVS事件流，在根据DVS事件流，确定感兴趣目标的位置信息时，可以确定与DVS事件流对应的实时图像帧，例如，可以对DVS事件流以及实时图像帧进行时间对齐，确定与检测到存在感兴趣目标DVS事件流对应的实时图像帧，并在该实时图像帧上截取位置信息对应的图像帧。例如，可以对DVS事件流以及实时图像帧进行空间对齐，并根据位置信息，截取实时图像帧中位置信息对应的局部图像，得到第二图像帧集合中的图像帧。

可选的，识别装置可以在检测到存在感兴趣目标的情况下，控制基于色彩模式的图像采集装置采集目标时间段内的实时图像帧，例如，向基于色彩模式的图像采集装置发送采集或者停止采集实时图像帧的指令，接收基于色彩模式的图像采集装置发送的实时图像帧，并根据接收到的实时图像帧以及位置信息，截取位置信息对应的图像帧。例如，可以对DVS事件流以及实时图像帧进行空间对齐，并根据位置信息，截取实时图像帧中位置信息对应的局部图像，得到第二图像帧集合中的图像帧。

可选的，识别装置在基于DVS事件流进行感兴趣目标检测时，可以得到感兴趣目标的指示信息、感兴趣目标的位置信息等，例如，将DVS事件流输入预训练的神经网络，可以输出感兴趣目标的指示信息、感兴趣目标的位置信息等。识别装置可以基于感兴趣目标的指示信息，确定感兴趣目标出现的实时图像帧，再截取这些实时图像帧中包含感兴趣目标的局部图像，示例性的，在位置信息表示为(x，y，w，h)，其中，x、y分别表示感兴趣目标的中心点的横纵坐标，w，h分别表示感兴趣目标的宽和高的情况下，识别装置可以截取上述实时图像帧中包含感兴趣目标的矩形区域；或者在位置信息用于指示感兴趣目标的轮廓的情况下，可以基于感兴趣目标的轮廓截取图像，得到第二图像帧集合中的图像帧。

在一些实施例中，上述步骤S103和S104可以同步执行。也就是说，在步骤S103中获取到目标图像帧的时刻，可以同步开始执行步骤S104中对运动对象进行识别的步骤。

在本公开实施例中，在根据事件流数据，确定存在感兴趣目标例如运动对象等动态目标的开始时刻，可以使用基于色彩模式的图像采集装置(例如RGB相机)同步开始采集图像，并同步对采集的图像帧进行运动对象识别。相较于在获取目标图像帧集合后，才开始执行根据目标图像帧集合识别运动对象的识别计算，本公开实施例可以在采集到图像的同时，进行识别计算的同步处理，从而有利于提高图像识别计算效率，进而可以提高运动对象的识别效率。

在一些实施例中，目标图像帧集合中包括基于色彩模式的图像采集装置采集的图像帧；对于基于事件的视觉传感器和基于色彩模式的图像采集装置，二者位于同一图像数据采集设备中，且二者所包含摄像头之间的距离小于预设距离阈值。

在本公开实施例中，可以将基于事件的视觉传感器和基于色彩模式的图像采集装置集成到一个固定的设备中，在该固定的设备中，基于事件的视觉传感器和基于色彩模式的图像采集装置足够接近，以减少出现角度视差的出现概率。

在不违背逻辑的情况下，本公开不同实施例之间可以相互结合，不同实施例描述有所侧重，未侧重描述的部分可参见其他实施例的记载。

图2示出本公开实施例的网络系统的结构图。在图2中，该网络系统包括数据采集模块210、目标定位模块220和识别分析模块230。

其中，数据采集模块210包括基于色彩模式的图像采集装置和基于事件的视觉传感器，例如图2中示出的RGB图像采集装置和动态视觉传感器DVS，RGB图像采集装置可以向目标定位模块220传输采集的图像帧，动态视觉传感器DVS可以向目标定位模块220传输DVS事件流。目标定位模块220可以根据DVS事件流检测感兴趣目标，并基于感兴趣目标确定目标图像帧集合。识别分析模块230可以获取目标定位模块220传输的目标图像帧集合，并对目标图像帧集合中的图像帧进行运动对象的识别和分析，并输出结果。

根据本公开实施例提供的运动对象的识别方法，在基于DVS事件流确定存在感兴趣目标时，获取基于感兴趣目标确定的目标图像帧集合并进行分析识别运动对象，从而降低将计算资源消耗到无实际内容的图像帧上的概率，节约了计算资源，提高了计算效率，并可以降低发现运动对象的难度，从而有效发现运动目标。

图3为本公开实施例提供的运动对象的识别装置的结构示意图。

如图3所示，运行对象的识别装置300包括如下模块。

第一获取模块301，用于获取基于事件的视觉传感器采集的事件流数据。

检测模块302，用于根据采集的事件流数据，进行感兴趣目标检测，得到检测结果。

第二获取模块303，用于在检测结果为检测到感兴趣目标的情况下，获取目标图像帧集合；其中，目标图像帧集合包括目标时间段内的图像帧，目标时间段包括感兴趣目标出现的时间段；

识别模块304，用于根据目标图像帧集合，识别运动对象。

可选的，检测模块302具体用于：将事件流数据或者事件流数据对应的脉冲序列输入预训练的神经网络中，通过预训练的神经网络进行感兴趣目标检测，以确定是否检测到感兴趣目标，得到感兴趣目标的检测结果；其中，DVS事件流对应的脉冲序列基于对 DVS事件流编码得到。

可选的，预训练的神经网络包括以下任意一项：脉冲神经网络；脉冲神经网络和人工神经网络融合的神经网络。

可选的，图像帧由色彩模式RGB图像采集装置采集，DVS事件流由动态视觉传感器DVS采集。

可选的，目标图像帧集合包括第一图像帧集合，第二获取模块303具体用于：在检测到感兴趣目标的情况下，获取通过基于色彩模式的图像采集装置采集的在目标时间段内的图像帧，得到第一图像帧集合。

可选的，第二获取模块303包括：第一发送单元，用于在第一时刻向基于色彩模式的图像采集装置发送第一指令，第一时刻为目标时间段的起始时刻，第一指令用于指示基于色彩模式的图像采集装置采集并返回实时图像帧；接收单元，用于接收基于色彩模式的图像采集装置发送的实时图像帧；第二发送单元，用于在第二时刻向基于色彩模式的图像采集装置发送第二指令，第二时刻为目标时间段的终止时刻，第二指令用于指示基于色彩模式的图像采集装置停止采集实时图像帧；根据接收的从起始时刻到终止时刻的实时图像帧，得到第一图像帧集合。

可选的，目标图像帧集合包括第一图像帧集合，运行对象的识别装置300还包括：接收模块，用于接收基于色彩模式的图像采集装置发送的实时图像帧；其中，图像帧是在基于色彩模式的图像采集装置采集事件流数据的过程中，通过基于色彩模式的图像采集装置同步采集得到；第二获取模块303具体用于：从接收的图像帧中获取目标时间段内的图像帧，得到第一图像帧集合。

可选的，目标图像帧集合包括第二图像帧集合，第二获取模块303包括：确定单元，用于根据事件流数据，确定感兴趣目标的位置信息；在基于色彩模式的图像采集装置采集的实时图像帧中，截取位置信息对应的图像帧，得到第二图像帧集合。

可选的，目标图像帧集合中包括基于色彩模式的图像采集装置采集的图像帧；对于基于事件的视觉传感器和基于色彩模式的图像采集装置，二者位于同一图像数据采集设备中，且二者所包含摄像头之间的距离小于预设距离阈值。

本公开实施例提供的运动对象的识别装置具有的功能或包含的模块可以用于执行上文方法实施例描述的方法，其具体实现和技术效果可参照上文方法实施例的描述，为了简洁，这里不再赘述。

图4示出本公开实施例的电子设备的结构示意图。

如图4所示，本公开实施例还提供一种电子设备，该电子设备包括：至少一个处理器401，至少一个存储器402，以及一个或多个I/O接口403，连接在处理器501与存储器502之间；其中，存储器502存储有可被至少一个处理器501执行的一个或多个计算机程序，一个或多个计算机程序被至少一个处理器501执行，以使至少一个处理器501能够执行上述的运动对象的识别方法。

在本公开实施例中，该计算机程序被处理器401执行时实现运行对象的识别方法实施例的各个过程，为了简洁，这里不再赘述。

需要注意的是，本公开实施例中的电子设备包括上述的移动电子设备和非移动电子设备。

本公开实施例还提供一种可读存储介质，可读存储介质上存储有程序或指令，该程序或指令被处理器执行时实现上述运行对象的识别方法实施例的各个过程，为了简洁，这里不再赘述。

其中，处理器为上述实施例中的电子设备中的处理器。可读存储介质，包括计算机可读存储介质，如计算机只读存储器(Read-Only Memory，ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等。

本公开实施例还提供了一种计算机程序产品，包括计算机可读代码，或者承载有计算机可读代码的非易失性计算机可读存储介质，当计算机可读代码在电子设备的处理器中运行时，电子设备中的处理器执行上述的运动对象的识别方法。

本领域普通技术人员可以理解，上文中所公开方法中的全部或某些步骤、系统、装置中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。在硬件实施方式中，在以上描述中提及的功能模块/单元之间的划分不一定对应于物理组件的划分；例如，一个物理组件可以具有多个功能，或者一个功能或步骤可以由若干物理组件合作执行。某些物理组件或所有物理组件可以被实施为由处理器，如中央处理器、数字信号处理器或微处理器执行的软件，或者被实施为硬件，或者被实施为集成电路，如专用集成电路。这样的软件可以分布在计算机可读存储介质上，计算机可读存储介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。

如本领域普通技术人员公知的，术语计算机存储介质包括在用于存储信息(诸如计算机可读程序指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM)、静态随机存取存储器(SRAM)、闪存或其他存储器技术、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外，本领域普通技术人员公知的是，通信介质通常包含计算机可读程序指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据，并且可包括任何信息递送介质。

这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备，或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令，并转发该计算机可读程序指令，以供存储在各个计算/处理设备中的计算机可读存储介质中。

用于执行本公开操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码，编程语言包括面向对象的编程语言—诸如Smalltalk、C++等，以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机，或者，可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中，通过利用计算机可读程序指令的状态信息来个性化定制电子电路，例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA)，该电子电路可以执行计算机可读程序指令，从而实现本公开的各个方面。

这里所描述的计算机程序产品可以具体通过硬件、软件或其结合的方式实现。在一个可选实施例中，计算机程序产品具体体现为计算机存储介质，在另一个可选实施例中，计算机程序产品具体体现为软件产品，例如软件开发包(Software Development Kit，SDK)等等。

这里参照根据本公开实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本公开的各个方面。应当理解，流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合，都可以由计算机可读程序指令实现。

这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器，从而生产出一种机器，使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时，产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中，这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作，从而，存储有指令的计算机可读介质则包括一个制造品，其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。

也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上，使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤，以产生计算机实现的过程，从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。

附图中的流程图和框图显示了根据本公开的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分，所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个连续的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或动作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

本文已经公开了示例实施例，并且虽然采用了具体术语，但它们仅用于并仅应当被解释为一般说明性含义，并且不用于限制的目的。在一些实例中，对本领域技术人员显而易见的是，除非另外明确指出，否则可单独使用与特定实施例相结合描述的特征、特性和/或元素，或可与其他实施例相结合描述的特征、特性和/或元件组合使用。因此，本领域技术人员将理解，在不脱离由所附的权利要求阐明的本公开的范围的情况下，可进行各种形式和细节上的改变。

Claims

一种运动对象的识别方法，其特征在于，包括：

获取基于事件的视觉传感器采集的事件流数据；

根据采集的所述事件流数据，进行感兴趣目标检测，得到检测结果；

在所述检测结果为检测到所述感兴趣目标的情况下，获取目标图像帧集合；其中，所述目标图像帧集合包括目标时间段内的图像帧，所述目标时间段包括所述感兴趣目标出现的时间段；

根据所述目标图像帧集合，识别运动对象。
根据权利要求1所述的方法，其特征在于，所述根据采集的所述事件流数据，进行感兴趣目标检测，得到检测结果，包括：

将所述事件流数据或者所述事件流数据对应的脉冲序列输入预训练的神经网络中，通过所述预训练的神经网络进行感兴趣目标检测，以确定是否检测到所述感兴趣目标，得到所述感兴趣目标的检测结果；

其中，所述事件流数据对应的脉冲序列基于对所述事件流数据编码得到。
根据权利要求2所述的方法，其特征在于，所述预训练的神经网络包括以下任意一项：脉冲神经网络；脉冲神经网络和人工神经网络融合的神经网络。
根据权利要求1所述的方法，其特征在于，所述目标图像帧集合包括第一图像帧集合；所述在所述检测结果为检测到所述感兴趣目标的情况下，获取目标图像帧集合，包括：

在检测到所述感兴趣目标的情况下，获取通过基于色彩模式的图像采集装置采集的在所述目标时间段内的图像帧，得到所述第一图像帧集合。
根据权利要求4所述的方法，其特征在于，所述获取通过基于色彩模式的图像采集装置采集的在所述目标时间段内的图像帧，得到所述第一图像帧集合，包括：

在第一时刻向所述基于色彩模式的图像采集装置发送第一指令，所述第一时刻为所述目标时间段的起始时刻，所述第一指令用于指示所述基于色彩模式的图像采集装置采集并返回实时图像帧；

接收所述基于色彩模式的图像采集装置发送的实时图像帧；

在第二时刻向所述基于色彩模式的图像采集装置发送第二指令，所述第二时刻为所述目标时间段的终止时刻，所述第二指令用于指示所述基于色彩模式的图像采集装置停止采集实时图像帧；

根据接收的从所述起始时刻到所述终止时刻的实时图像帧，得到所述第一图像帧集合。
根据权利要求4所述的方法，其特征在于，所述方法还包括：

接收基于色彩模式的图像采集装置发送的实时图像帧；其中，所述图像帧是在所述基于色彩模式的图像采集装置采集事件流数据的过程中，通过基于色彩模式的图像采集装置同步采集得到；

所述获取通过基于色彩模式的图像采集装置采集的在所述目标时间段内的图像帧，得到所述第一图像帧集合，包括：

从接收的所述图像帧中获取所述目标时间段内的图像帧，得到所述第一图像帧集合。
根据权利要求1所述的方法，其特征在于，所述目标图像帧集合包括第二图像帧集合，所述在所述检测结果为检测到所述感兴趣目标的情况下，获取目标图像帧集合，包括：

根据所述事件流数据，确定所述感兴趣目标的位置信息；

在基于色彩模式的图像采集装置采集的实时图像帧中，截取所述位置信息对应的图像帧，得到所述第二图像帧集合。
根据权利要求1-7中任一项所述的方法，其特征在于，

所述目标图像帧集合中包括基于色彩模式的图像采集装置采集的图像帧；

对于所述基于事件的视觉传感器和所述基于色彩模式的图像采集装置，二者位于同一图像数据采集设备中，且二者所包含摄像头之间的距离小于预设距离阈值。
一种运动对象的识别装置，其特征在于，包括：

第一获取模块，用于获取基于事件的视觉传感器采集的事件流数据；

检测模块，用于根据采集的所述事件流数据，进行感兴趣目标检测，得到检测结果；

第二获取模块，用于在所述检测结果为检测到所述感兴趣目标的情况下，获取目标图像帧集合；其中，所述目标图像帧集合包括目标时间段内的图像帧，所述目标时间段包括所述感兴趣目标出现的时间段；

识别模块，用于根据所述目标图像帧集合，识别运动对象。
一种电子设备，其特征在于，包括处理器，存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令，所述程序或指令被所述处理器执行时实现包括如权利要求1至8中任一项所述的方法的步骤。
一种可读存储介质，其特征在于，所述可读存储介质上存储程序或指令，所述程序或指令被处理器执行时实现包括权利要求1至8中任一项所述的方法的步骤。
一种计算机程序产品，包括计算机可读代码，或者承载有计算机可读代码的非易失性计算机可读存储介质，其中，当所述计算机可读代码在电子设备的处理器中运行时，所述电子设备中的处理器执行用于实现权利要求1-8中的任一项所述的方法。