CN117132625A

CN117132625A - 一种基于单像素成像的3d物体追踪方法

Info

Publication number: CN117132625A
Application number: CN202311089895.6A
Authority: CN
Inventors: 耿子涵; 张欢; 刘宗昊; 黄宇龙
Original assignee: Shenzhen International Graduate School of Tsinghua University
Current assignee: Shenzhen International Graduate School of Tsinghua University
Priority date: 2023-08-28
Filing date: 2023-08-28
Publication date: 2023-11-28

Abstract

本发明提出了一种基于单像素成像的3D目标物体实时跟踪方法。其中，具体方法为：基于一种图像几何矩理论计算场景中目标物体的3D坐标；基于图像低阶矩的计算方式，通过充分利用DMD的快速调制速率特性，能够高效对物体进行追踪定位；可以在几何矩模式中加入用来恢复空间信息的调制图案，在定位的同时实现成像的功能，来进行目标检测。对于可见光波段不可见的气体进行动态定位和成像显示。本发明提出了一种鲁棒性、实时性高的目标跟踪方法，可应用至汽车自动驾驶领域，且适用于一些非可见气体的动态定位和成像显示。

Description

一种基于单像素成像的3D物体追踪方法

技术领域

本发明属于成像技术领域，具体涉及一种基于单像素成像的3D物体追踪方法。

背景技术

随着计算机数据处理能力的增强，成像模式从传统的依赖光学物理设备逐渐发展成光学和信号处理相结合的计算成像技术。这是通过光学系统和信号处理的有机结合和联合优化实现的。近年来，在一些制造领域，视觉检测仪器需要能够实现高精度、高分辨率、高速、实时的三维成像和传感，以满足工业制造的应用需求，例如快速在线检测和机器人视觉导航。采用传统的光学成像系统设计思路，要想在成像性能上获得微小的提升，通常意味着硬件成本的急剧增加，甚至难以实现工程应用。另一方面，光电探测器的尺寸、像素尺寸和响应灵敏度正在逼近物理极限，难以满足这些极具挑战性的要求。于是如何以低成本的方式实现目标物体的快速实时跟踪成为了一项重要课题。

单像素成像(SPI)是2008年兴起的一种新型计算成像技术，其具体原理是通过空间光调制技术向目标物体投射编码过的结构光图案，可以将二维或三维的场景空间信息融入到一维的光信号中，这种一维的光信号可以通过单像素探测器进行采集，最后由一维信号与结构光图案之间的关联运算可以计算出物体的图像。

对于二维灰度图像，场景的反射率可以用相应空间位置的每个元素的一个值来表示，如果把二维图像转化为一维，则可以表示为O＝[i₁,i₂,…,i_N]^T。这样图像的重建过程就是获取O的N个元素的过程。假设数字微镜阵列(DMD)调制了M张不同的N维图案P_(x,y),M＝[P₁,P₂,…,P_M]^T，它是一个M×N的二维测量矩阵，(x,y)表示每个投射图案的坐标值，M表示投射图案的张数，其对应的强度值为S_M＝[s₁,s₂,…,s_M]^T，那么单像素成像的图像重建过程可表示为以下形式：

S_M＝P_(x,y),M×O_(x,y)#(1)

如果P_(x,y),M是正交的并且测量图案的数量M等于图像的像素数N，那么方程(1)可变成下面的表现形式：

否则方程(1)是欠定的。单像素成像本质上虽然是一种通过时间分辨率换取空间分辨率的方式，M＝N的全采样策略显然不是一种很高效的方式，目前有几种方法可以提高单像素成像的成像效率。首先得益于一些硬件如空间调制器(数字微镜阵列)在性能上的提升，图案调制速率已经能够达到22kHz；其次基于一些稀疏的正交测量矩阵也很有效，比如哈达玛测量矩阵或傅立叶基测量矩阵；然后还有像压缩感知的方法，比如l1范式最小值或全变分算法等，都可以实现M<N的低采样效果；不仅如此，随着深度学习的快速发展，单像素成像中低采样的方式也可以结合深度学习来实现，且效果比其上述方法会更理想。一些在计算机视觉领域的一些去噪网络可以直接用在单像素成像中来，这种网络的输入是低采样重建出来的低分辨率重建图像，输出是我们想要的高分辨率重建图像，具体表示形式为：

x＝f_w(SPI(I))#(3)

其中f_w()表示网络模型函数，表示一种从低分辨率图像到高分辨率图像的一种映射关系，SPI()表示传统的单像素成像过程。后来有研究者实现了端到端的从探测器收集的强度值到图像的神经网络。那么这种图像重建过程就可以表示为：

x＝f_w(I)#(4)

其中，I为要追踪的物体平面。

另外可以通过在损失函数里添加一些正则化或者调整模型的数据集来防止过拟合和提高模型的泛化性，其次，有研究显示，在模型中考虑通道注意力机有助于恢复一些局部信息。

虽然数字微镜器件(DMD)可以以22kHz的高刷新率来提高成像速度。然而，这样的刷新率对于物体成像来说是不够的，特别是对于快速移动的物体成像任务。之前的单像素成像工作主要集中在静态物体成像上。然而，在现实生活场景中，移动物体成像具有更多实际应用，例如遥感、工业测量、国防领域中的飞机监控和自动驾驶车辆的3D感知等。在运动物体追踪成像的研究领域中，运动模糊是最主要问题。首先想到的解决方法是运动补偿，具体来说，目标的位置可以从图像传感器捕获的连续图像中提取出来，然后通过运动补偿变换光照模式，这在原理上与静态SPI相同。然而，对于快速移动的物体，同时实现超高时间和空间分辨率的跟踪仍然很困难。在实践中，高速摄像机可以以相对较高的信噪比(SNR)捕捉动态物体。然而，它需要高数据传输量和高成本。此外，此类相机不适用于可见光以外的波长。

发明内容

为解决现有技术中存在的问题，本发明提出了一种基于单像素成像的3D物体追踪方法，基于单像素成像和几何矩模式图案质心计算进行目标物体的三维追踪方法，该方法追踪速度快，精度较高，环境抗干扰性强，可以实现实时的物体目标追踪任务。

为实现上述目的，本发明采用如下方案：

本发明提供一种基于单像素成像的3D物体追踪方法，基于单像素成像系统，所述单像素成像系统包括光源、空间光调制器(DMD)、待测物体和单像素探测器，本方法包括以下步骤：

(4)：通过空间光调制器向所述待测物体投射特定图案，并通过所述单像素探测器接收光信号；

(5)：根据所述光信号得到所述待测物体的质心坐标，完成定位，具体包括以下步骤：

(2-1)：对于一个二维场景o(x,y)，几何矩m_pq表示为：

m_pq＝∑_x,yx^py^qo(x,y)#(5)；

(2-2)：通过所述光信号得到零阶矩m₀₀和两个一阶矩m₀₁、m₁₀；

(2-3)：计算所述待测物体的质心坐标(x,y)，通过如下公式计算：

其中，所述特定图案为几何矩模式图案。

进一步地，所述几何矩模式图案包括S1、S2、S3，具体为：

进一步地，步骤(1)中，投射特定图案具体为：第一帧使用S1、S2、S3，其余每一帧分别由S2和S3交替投影。

进一步地，还包括以下步骤：

(6)：在几何矩模式中加入用来恢复空间信息的调制图案，在定位的同时实现成像的功能，来进行目标检测。

进一步地，所述用来恢复空间信息的调制图案为哈达玛图案或傅立叶图案。

进一步地，对于三维物体的追踪，需要建立两个相互垂直的二维追踪平面，分别进行步骤(1)至步骤(2)的操作，最后再进行坐标整合。

进一步地，对于三维物体的追踪方法具体为，准直光束经过加载有几何矩模式图案的调制设备后，由分束镜或其他光学仪器分成两束垂直的光路，再分别由反射镜形成两路相互垂直的光路穿过物体；然后用所述基于单像素成像的3D物体追踪方法分别追踪两个相互垂直二维平面内的坐标值，再将它们合并成一个三维坐标，两个垂直的二维平面共一个Z轴。

有益效果：

本发明提供一种基于单像素成像的3D物体追踪方法，通过几何矩模式图案的设置，并通过投射几何矩图案直接获取光信号并计算物体质心坐标，不需要成像，直接完成对物体的追踪定位，大大提高了计算速度和追踪频率，能够实现对于快速移动的物体进行超高时间和空间分辨率的跟踪，并且，由于每次只采集一个像素值，它的抗噪能力较强，单像素探测器可用于其他不可见波段，比如红外以及太赫兹等等适用于可见光以外的波长。

附图说明

图1是单像素成像结构光检测系统配置示意图；

图2是本发明实施例中由空间抖动方法生成的二值化几何矩图案示意图；

图3是本发明实施例中照明图案示意图；

图4是本发明实施例中二维坐标合成三维坐标示意图。

具体实施方式

为使本发明技术方案和优点更加清楚，下面将结合本发明中的附图对本发明实施例的技术方案进行完整地描述。显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

下面详细描述本发明的实施例，实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，仅用于解释本发明，而不能理解为对本发明的限制。

本发明提出了基于单像素成像和几何矩模式图案质心计算进行目标物体的三维追踪方法，该方法追踪速度快，精度较高，环境抗干扰性强，可以实现实时的物体目标追踪任务。具体内容如下：

如图1，单像素成像系统配置具体为，光源(light source)发出的光经过微镜调制DMD(digital micromirror device)调制后的几何矩图案到达物体(object)表面后由单像素探测器(single-pixel detector)检测反射的光强。

首先为了定位物体，设计了几种不同的几何矩模式图案，分别为S1、S2、S3，具体形式如下所示：

一般来说，对于一个二维场景o(x,y)，几何矩m_pq的定义如下：

其中几何矩的阶数可以用p+q来表达，p和q分别是x和y的幂次，它们的和表示几何矩的阶数，我们对比方程1和方程5，可以发现设计的用来对物体进行投影的三种几何矩图案S1、S2、S3正好是几何矩定义式里的x^py^q，而m_pq则正好对应于由单像素探测器收集的强度值，由此我们可以直接通过探测器收集的光强值得到零阶矩m₀₀和两个一阶矩m₀₁、m₁₀，探测器收集的光强值就是对应的几何矩。那么物体的质心坐标(x,y)可以通过下式来计算：

如图3所示，这是我们设计的通过DMD投射的照明图案，除了第一张S1之外，其余每一帧都分别由S2和S3交替投影，S1探测的值对应零阶矩m₀₀，用S2和S3两张图案是为了分别定位x方向和y方向的坐标，原理是通过图像的二阶矩可以计算整个图像的质心坐标，而图像的二阶矩计算公式和单像素成像的公式可以匹配上，区别点主要是不像寻常的方法是先成像，然后在跟踪定位，这个可以跳过成像这个步骤，且只需要投射两张图案就可以达到目的，结合高刷新率的光调制设备可以做到超高频率定位。DMD目前的调制速率最高能达到22kHz，如果只需要两张图案就能定位的话，那么定位速率就是11kHz。

上述内容应用于二维平面内的追踪已经经过实验论证，对于三维物体的追踪，只需要建立两个相互垂直的二维追踪平面，最后再进行坐标整合，就能计算出物体的实时三维坐标，如图4所示。

在一些实施例中，可以在几何矩模式中加入用来恢复空间信息的调制图案，在定位的同时实现成像的功能，来进行目标检测。单像素成像领域为了恢复成像目标的空间信息，需要投射一些我们编码好的图案(也可以是随机编码图案)，通过这些图案投射过去可以对物体平面的信息进行一个域的转换，每一张图案对应于该域下的一个单像素值，然后再通过逆变换可以还原物体平面的信息，我们通过在每一帧里面加入一张这种用于成像的图案，这样在实现追踪的过程中还可以对物体进行粗略的成像。

通过上述的方法，可以在只使用一个空间光调制器的条件下仅仅投射两张图案即可实现实时的物体目标三维追踪目标。

本发明提出了一种成本较低，抗干扰性强的三维追踪方法。

1、首先是单像素成像本身的优点。与传统成像相比，SPI在很多方面都具有显著优势；在成像鲁棒性方面，SPI使用统计测量，可以抑制与光源统计无关的噪声；从探测器的角度来看，用于单像素探测的桶形探测的单元探测装置在技术上往往比面阵探测装置具有更好的性能，这使得SPI在较弱回波条件下成为可能，上述优点均表明SPI具有较好的适应性。在成像所需的器件方面，SPI系统不需要阵列探测器，也可以实现无透镜成像，并且可以扩展到X射线、中远红外、太赫兹(THz)波长和其他一些难以实现面阵检测或难以获得可用成像镜头的波段。在这种情况下，SPI有更多的潜在应用。

2、许多实际应用往往需要对运动物体进行成像，如活细胞成像、安全监控、空中预警和自动驾驶等。SPI系统可以看作是一个多模态融合传感器，可以同时进行三维定位和成像。如果应用于自动驾驶，它可能会代替执行摄像头和雷达的多传感任务。因此该方案有望从生产成本以及模型结构复杂度上提供一种更有效的方式。

研究者先后提出了不同的追踪方法，从最初的互相关方法从相邻图像中提取物体的位置信息再到傅立叶基图案照明或离散余弦的方法，其中定位速率最快的方法是本发明通过DMD投射几何矩图案进行跟踪定位，如图2所示。该方法的跟踪速率理论上为调制速率的二分之一。

在本说明书的描述中，参考术语“一个实施例”和“示例”等述意指结合该实施例或示例描述的具体特征、结构或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不必须针对的是相对的实施例或示例中以合适的方式结合。

必须指出，以上实施例的说明不用于限制而只是用于帮助理解本发明的核心思想，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，对本发明进行的任何改进以及与本产品等同的替代方案，也属于本发明权利要求的保护范围内。

Claims

1.一种基于单像素成像的3D物体追踪方法，其特征在于，基于单像素成像系统，所述单像素成像系统包括光源、空间光调制器(DMD)、待测物体和单像素探测器，本方法包括以下步骤：

(1)：通过空间光调制器向所述待测物体投射特定图案，并通过所述单像素探测器接收光信号；

(2)：根据所述光信号得到所述待测物体的质心坐标，完成定位，具体包括以下步骤：

(2-1)：对于一个二维场景o(x,y)，几何矩m_pq表示为：

m_pq＝∑_x，yx^py^qo(x,y)#(5)；

其中，所述特定图案为几何矩模式图案。

2.根据权利要求1所述的方法，其特征在于，所述几何矩模式图案包括S1、S2、S3，具体为：

3.根据权利要求2所述的方法，其特征在于，步骤(1)中，投射特定图案具体为：第一帧使用S1、S2、S3，其余每一帧分别由S2和S3交替投影。

4.根据权利要求1所述的方法，其特征在于，还包括以下步骤：

(3)：在几何矩模式中加入用来恢复空间信息的调制图案，在定位的同时实现成像的功能，来进行目标检测。

5.根据权利要求4所述的方法，其特征在于，所述用来恢复空间信息的调制图案为哈达玛图案或傅立叶图案。

6.根据权利要求1所述的方法，其特征在于，对于三维物体的追踪，需要建立两个相互垂直的二维追踪平面，分别进行步骤(1)至步骤(2)的操作，最后再进行坐标整合。

7.根据权利要求6所述的方法，其特征在于，对于三维物体的追踪方法具体为，准直光束经过加载有几何矩模式图案的调制设备后，由分束镜或其他光学仪器分成两束垂直的光路，再分别由反射镜形成两路相互垂直的光路穿过物体；然后用所述基于单像素成像的3D物体追踪方法分别追踪两个相互垂直二维平面内的坐标值，再将它们合并成一个三维坐标，两个垂直的二维平面共一个Z轴。