CN111695681B

CN111695681B - 一种高分辨率动态视觉观测方法及装置

Info

Publication number: CN111695681B
Application number: CN202010549524.1A
Authority: CN
Inventors: 高跃; 李思奇
Original assignee: Tsinghua University
Current assignee: Tsinghua University
Priority date: 2020-06-16
Filing date: 2020-06-16
Publication date: 2022-10-11
Anticipated expiration: 2040-06-16
Also published as: CN111695681A

Abstract

本发明公开了一种高分辨率动态视觉观测方法，包括：步骤1、获取低分辨率事件流数据，从事件相机获取低空间分辨率的事件流数据；步骤2、进行数据预处理，根据输入低分辨率事件数据的空间分辨率尺寸和期望得到高分辨率事件数据的空间分辨率尺寸，计算得到所需要提升分辨率的倍数；步骤3、构建脉冲神经网络，使用Spike Response模型作为神经元动力学模型，构建全连接脉冲神经网络；步骤4、完成高分辨率时空脉冲信号计算；步骤5、进行数据后处理，实现高分辨率动态视觉观测。本方法可以从低分辨率的稀疏事件数据获得更高空间分辨率的事件数据，实现高分辨率动态视觉观测的效果。

Description

一种高分辨率动态视觉观测方法及装置

技术领域

本发明涉及计算机视觉及神经形态计算领域，尤其涉及一种高分辨率动态视觉观测方法及装置。

背景技术

事件相机是一种受生物启发的传感器，工作原理与传统的相机有很大的差别。与传统相机以固定帧率采集场景绝对光强不同，这种相机当且仅当场景光强变化时输出数据，这种输出的数据称为事件流。与传统相机相比，事件相机有着高动态范围、高时间分辨率、无动态模糊等优点。

事件相机作为一种新型视觉传感器，其输出数据的形式与传统相机完全不同，无法直接应用传统相机及图像的各种算法。传统相机以固定速率(即帧率)采集场景的光强值，并以固定速率输出为图片数据。事件相机则没有帧率的概念，其每个像素点异步工作，当检测到光强变化时输出一条事件。每条事件为一个四元组(x,y,t,p)，包含像素横纵坐标(x,y)、时间戳t和事件极性p(其中，p＝-1表示该像素点光强减小，p＝1表示该像素点光强增大)。所有像素点输出的事件数据汇总起来，形成由一条条事件组成的事件列表，作为相机输出的事件流数据。一个长度为20秒传统相机获得的视频数据，和与之对应的事件相机输出的事件流数据的实例如图1所示。因此，传统相机及传统图像处理领域中适用的各种算法及方法，均无法直接使用于事件相机及事件数据。

脉冲神经网络是第三代人工神经网络，它把时间信息的影响也考虑其中。脉冲神经网络中的神经元不是在每一次迭代传播中都被激活，而是在它的膜电位达到某一个特定值才被激活。当一个神经元被激活，它会产生一个信号传递给其他神经元，提高或降低其膜电位。脉冲神经网络模拟神经元更加接近实际，更加适用于处理时序脉冲信号。

相比于传统相机，事件相机可以获得极高的时间分辨率，但由于事件相机受限于功率及响应时间等因素，空间分辨率较低，空间分辨率与事件分辨率形成一对矛盾。如何提升事件流数据的空间分辨率，实现高分辨率动态观测是亟待解决的问题。现有方法采用非齐次泊松过程建模每个像素点的事件触发的过程，利用每个像素点周围8个像素点的事件数预估该像素点的事件数。这种方法仅考虑每个像素点周围的信息，缺乏对于场景整体动态信息的使用。同时，对于每个像素点的非齐次泊松过程建模较为耗费时间，效率极低。

发明内容

为解决现有事件相机空间分辨率低的问题，本发明提供了一种高分辨率动态视觉观测方法及装置，可以在现有事件相机所获取的低空间分辨率事件数据的基础上得到更高空间高分辨率的事件数据。

本发明的技术方案是提供了一种高分辨率动态视觉观测方法，包括如下步骤：

步骤1、获取低分辨率事件流数据，从事件相机获取低空间分辨率的事件流数据；

步骤2、进行数据预处理，根据输入低分辨率事件数据的空间分辨率尺寸和期望得到高分辨率事件数据的空间分辨率尺寸，计算得到所需要提升分辨率的倍数；将输入低分辨率事件流数据中每个事件的空间坐标与需要提升分辨率的倍数相乘，得到空间稀疏的事件流数据ε′；将稀疏的事件流数据根据空间坐标、极性及时间戳信息编码为对应的二进制四维张量V，再重排成平面二维张量V′，两个维度分别对应空间及时间维度；

步骤3、构建脉冲神经网络，使用Spike Response模型作为神经元动力学模型，构建全连接脉冲神经网络；

步骤4、完成高分辨率时空脉冲信号计算，将步骤2得到的稀疏的时空脉冲信号使用步骤3得到的全连接脉冲神经网络进行前向传播，得到高分辨率的稠密时空脉冲信号；

步骤5、进行数据后处理，统计步骤4得到的稠密时空脉冲信号中，触发脉冲的空间坐标及时间戳，并恢复为高分辨率事件流数据ε_h，实现高分辨率动态视觉观测。

本发明还提供了一种高分辨率动态视觉观测装置，包括：原始数据获取单元，数据预处理单元，脉冲神经网络构建单元，高分辨率时空脉冲信号计算单元，数据后处理单元；其特征在于：

低分辨率事件流数据获取单元，从事件相机获取低空间分辨率的事件流数据；

数据预处理单元，根据输入低分辨率事件数据的空间分辨率尺寸和期望得到高分辨率事件数据的空间分辨率尺寸，计算得到所需要提升分辨率的倍数；将输入低分辨率事件流数据中每个事件的空间坐标与需要提升分辨率的倍数相乘，得到空间稀疏的事件流数据ε′；将稀疏的事件流数据根据空间坐标、极性及时间戳信息编码为对应的二进制四维张量V，再重排成平面二维张量V′，两个维度分别对应空间及时间维度；

脉冲神经网络构建单元，使用Spike Response模型作为神经元动力学模型，构建全连接脉冲神经网络；

高分辨率时空脉冲信号计算单元，将数据预处理单元得到的稀疏的时空脉冲信号使用脉冲神经网络构建单元得到的全连接脉冲神经网络进行前向传播，得到高分辨率的时空脉冲信号；

数据后处理单元，统计高分辨率时空脉冲信号计算单元输出的稠密时空脉冲信号中，触发脉冲的空间坐标及时间戳，并恢复为高分辨率事件流数据ε_h，实现高分辨率动态视觉观测。

本发明的有益效果是：本高分辨率动态视觉观测方法可以从目前低空间分辨率的事件相机所获取的事件数据中，获得更高空间分辨率的场景动态观测效果。本发明使用全连接脉冲神经网络处理低分辨率事件流数据，可以解决现有方法缺乏对于场景整体动态信息的使用的问题。同时，本发明使用全连接脉冲神经网络处理低分辨率事件流数据，可以同步处理每个像素点的事件数据，极大提升效率。

附图说明

图1是一个时间长度为20秒的传统相机获得的视频数据和与之对应的事件相机获得的流数据示意图。

图2是本发明中所述事件流超分辨率步骤及事件流超分辨率装置中所使用的全连接脉冲神经网络的结构示意图。

图3是本发明一种实施实例的高分辨率动态视觉观测方法的流程示意图。

具体实施方式

以下结合图3对发明的技术方案作进一步详细说明。

如图3所示，该实施例提供了一种高分辨动态视觉观测方法，用于事件流超分辨率与场景高分辨率观测，包括如下步骤：

该步骤中，利用现有事件相机，采集待实现超分辨率的低空间分辨率事件流数据。事件相机作为仿生新型相机，其当且仅当场景光强变化时输出数据，这种输出的数据称为事件流。事件相机所输出的事件流数据可以用公式(1)的形式表示

其中，ε为事件流集合，i表示事件流中事件的编号，x_i为第i个事件的空间横坐标，y_i为第i个事件的空间纵坐标，t_i表示第i个事件的时间戳，p_i为第i个事件的极性。p_i＝1表示这个像素点的光强增大，p_i＝-1表示这个像素点的光强减小。

步骤2、进行数据预处理，根据输入低分辨率事件数据的空间分辨率尺寸和期望得到高分辨率事件数据的空间分辨率尺寸，计算得到所需要提升分辨率的倍数k；将输入低分辨率事件流数据中每个事件的空间坐标与需要提升分辨率的倍数相乘，得到空间稀疏的事件流数据ε′；将稀疏的事件流数据根据空间坐标、极性及时间戳信息编码为对应的二进制四维张量V，再重排成平面二维张量V′，两个维度分别对应空间及时间维度；

该步骤中，所需要提升分辨率的倍数k由如下公式获得：

其中，W_h和H_h分别为期望得到高分辨率事件数据的宽和高，W_l和H_l分别为输入低分辨率事件数据的宽和高。

空间稀疏的事件流数据ε′采用如下算法获得：

x′_i＝x_i·k,y′_i＝y_i·k

其中，x_i与y_i分别为输入低分辨率事件流中第i个事件的空间横纵坐标，t_i为输入低分辨率事件流中第i个事件的时间戳，p_i为输入低分辨率事件流中第i个事件的极性，x′_i为所述空间稀疏事件流中第i个事件的横坐标，y′_i为所述空间稀疏事件流中第i个事件的纵坐标。

二进制四维张量V及平面二维张量V′采用如下算法获得：

其中，W_h和H_h分别为期望得到高分辨率事件数据的宽和高，δ(·)为单位脉冲函数。

该步骤中，全连接脉冲神经网络结构如图2所示，包含输入层、输出层和三个隐藏层，输入层与输出层的神经元个数均为2×W_h×H_h，三个隐藏层的神经元个数依次为2048、1024和2048。

该步骤中，高分辨率事件流数据ε_h采用如下算法获得：

s.t.V_out(x^h _i+y^h _i×W_h+p^h _i×H_h×W_h,t^h _i)＝1

其中，V_out为步骤4得到的稠密时空脉冲信号，W_h和H_h分别为期望得到高分辨率事件数据的宽和高，x^h _i为高分辨率事件流数据中第i个事件的横坐标，y^h _i为高分辨率事件流数据中第i个事件的纵坐标，t^h _i为高分辨率事件流数据中第i个事件的时间戳，p^h _i为高分辨率事件流数据中第i个事件的极性。

该实例还提供了一种高分辨率动态视觉观测装置，包括：原始数据获取单元，数据预处理单元，脉冲神经网络构建单元，高分辨率时空脉冲信号计算单元，数据后处理单元；

数据预处理单元，根据输入低分辨率事件数据的空间分辨率尺寸和期望得到高分辨率事件数据的空间分辨率尺寸，计算得到所需要提升分辨率的倍数k；将输入低分辨率事件流数据中每个事件的空间坐标与需要提升分辨率的倍数相乘，得到空间稀疏的事件流数据ε′；将稀疏的事件流数据根据空间坐标、极性及时间戳信息编码为对应的二进制四维张量V，再重排成平面二维张量V′，两个维度分别对应空间及时间维度；

该实施例提供的一种高分辨率动态视觉观测装置，可用于实现一种高分辨动态视觉观测方法。

以上内容是结合具体的优选实施方式对本发明所做的进一步详细说明，不能认定本发明的具体实施只局限于这些说明。对于本发明所述技术领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干简单推演或替换，都应当视为本发明由所提交的权利要求书确定的专利保护范围。

Claims

1.一种高分辨率动态视觉观测方法，其特征在于：包括如下步骤：

2.如权利要求1所述的高分辨率动态视觉观测方法，其特征在于，步骤2中，空间稀疏的事件流数据ε′采用如下算法获得：

x′_i＝x_i·k,y′_i＝y_i·k

其中，W_h和H_h分别为期望得到高分辨率事件数据的宽和高，W_l和H_l分别为输入低分辨率事件数据的宽和高，k为所需要提升分辨率的倍数，x_i与y_i分别为输入低分辨率事件流中第i个事件的空间横坐标和纵坐标，t_i为输入低分辨率事件流中第i个事件的时间戳，p_i为输入低分辨率事件流中第i个事件的极性，x′_i为所述空间稀疏事件流中第i个事件的横坐标，y′_i为所述空间稀疏事件流中第i个事件的纵坐标。

3.如权利要求2所述的高分辨率动态视觉观测方法，其特征在于，步骤2中，二进制四维张量V及平面二维张量V′采用如下算法获得：

其中，δ(·)为单位脉冲函数。

4.如权利要求2所述的高分辨率动态视觉观测方法，其特征在于，步骤3中，所述全连接脉冲神经网络包含输入层、输出层和三个隐藏层，输入层与输出层的神经元个数均为2×W_h×H_h，三个隐藏层的神经元个数依次为2048、1024和2048。

5.如权利要求2所述的高分辨率动态视觉观测方法，其特征在于，步骤5中，高分辨率事件流数据ε_h采用如下算法获得：

s.t.V_out(x^h _i+y^h _i×W_h+p^h _i×H_h×W_h,t^h _i)＝1

其中，V_out为步骤4得到的稠密时空脉冲信号，x^h _i为高分辨率事件流数据中第i个事件的横坐标，y^h _i为高分辨率事件流数据中第i个事件的纵坐标，t^h _i为高分辨率事件流数据中第i个事件的时间戳，p^h _i为高分辨率事件流数据中第i个事件的极性。

6.一种高分辨率动态视觉观测装置，包括：原始数据获取单元，数据预处理单元，脉冲神经网络构建单元，高分辨率时空脉冲信号计算单元，数据后处理单元；其特征在于：

7.如权利要求6所述的高分辨率动态视觉观测装置，其特征在于，数据预处理单元，空间稀疏的事件流数据ε′采用如下算法获得：

x′_i＝x_i·k,y′_i＝y_i·k

8.如权利要求7所述的高分辨率动态视觉观测装置，其特征在于，数据预处理单元，二进制四维张量V及平面二维张量V′采用如下算法获得：

其中，δ(·)为单位脉冲函数。

9.如权利要求7所述的高分辨率动态视觉观测装置，其特征在于，脉冲神经网络构建单元，所述全连接脉冲神经网络包含输入层、输出层和三个隐藏层，输入层与输出层的神经元个数均为2×W_h×H_h，三个隐藏层的神经元个数依次为2048、1024和2048。

10.如权利要求7所述的高分辨率动态视觉观测装置，其特征在于，数据后处理单元，高分辨率事件流数据ε_h采用如下算法获得：

s.t.V_out(x^h _i+y^h _i×W_h+p^h _i×H_h×W_h,t^h _i)＝1

其中，V_out为高分辨率时空脉冲信号计算单元得到的稠密时空脉冲信号，x^h _i为高分辨率事件流数据中第i个事件的横坐标，y^h _i为高分辨率事件流数据中第i个事件的纵坐标，t^h _i为高分辨率事件流数据中第i个事件的时间戳，p^h _i为高分辨率事件流数据中第i个事件的极性。