CN104506838B

CN104506838B - 一种符号阵列面结构光的深度感知方法、装置及系统

Info

Publication number: CN104506838B
Application number: CN201410810399.XA
Authority: CN
Inventors: 葛晨阳; 周艳辉
Original assignee: NINGBO YINGXIN INFORMATION SCIENCE & TECHNOLOGY Co Ltd
Current assignee: NINGBO YINGXIN INFORMATION SCIENCE & TECHNOLOGY Co Ltd
Priority date: 2014-12-23
Filing date: 2014-12-23
Publication date: 2016-06-29
Anticipated expiration: 2034-12-23
Also published as: US20160178355A1; CN104506838A; US9829309B2

Abstract

本发明公开了一种符号阵列面结构光的深度感知方法、装置及系统，由激光图形投射器向目标物体或投射空间投射由符合阵列构成的编码图形Pattern，图像传感器采集获得连续的输入符号编码图像序列，先对输入符号编码图像进行解码，解码过程包括预处理、符号定位、符号识别、符号校正，完成符号识别的输入符号解码图像与已知距离的参考符号解码图像进行符号匹配计算，得到视差值，再结合深度计算公式生成网格形式表示的目标物体或投射空间的深度点云信息。本发明内容可快速获得动态场景下目标物体或投射空间的高分辨率、高精度的深度信息，便于模块方式移植入或嵌入智能设备中用于3D建模、3D地图生成等。

Description

一种符号阵列面结构光的深度感知方法、装置及系统

技术领域

本发明属于模式识别、人机交互、三维重建及机器视觉技术领域，具体涉及一种符号阵列面结构光的深度感知方法、装置及系统。

背景技术

在消费电子领域，深度感知技术有助于提高电子产品的智能水平和交互能力，帮助智能终端理解人类动作，成为“现实物理世界”与“虚拟网络世界”交互手段之一，不仅可以在智能电视、智能手机、家电、平板PC等领域实现创新应用，也可用于智能视频监控、面部识别系统、三维动画制作、动态场景检测、3D地图实时生成等三维重建场合。在工业领域，高分辨率、高精度的三维深度信息在汽车辅助安全驾驶、高速机床加工、工业3D建模、3D打印、医疗成像、物联网3D视觉感知、机器人操控等领域有着广泛的应用需求。

基于结构光主动视觉模式的深度感知技术(激光图形投射器主动投射图形Pattern、图像传感器采集连续图像)可以较为准确地获取目标物体或投射空间的深度信息，该模式相比双目立体摄像头，通过编码结构光主动对投射物或投射空间进行特征标定，所获取的深度图信息更稳定可靠、受环境光影响小、匹配过程不受物体纹理信息的影响等优势。如微软Kinect，其通过主动投射红外激光散斑图像进行特征标定，由红外摄像头采集红外图像序列，再由深度感知专用芯片计算获取深度信息。但Kinect通过DoE衍射生成激光散斑图像来获取深度信息的方式难以获得高分辨率、高精度的深度信息，难以满足工业建模等领域的应用需求，且不具备自我深度校正的能力。同时现有的结构光编码深度感知和三维测量技术，难以实时获得动态场景下目标物体高分辨率、高精度的深度信息。

发明内容

鉴于此，本发明的目的在于提供一种符号阵列面结构光的深度感知方法、装置及系统，基于结构光编码的主动视觉模式，由激光图形投射器向目标物体或投射空间投射由符合阵列构成的编码图形Pattern，图像传感器采集获得连续的输入符号编码图像序列，先对输入符号编码图像进行解码，解码过程包括预处理、符号定位、符号识别、符号校正，完成符号识别的输入符号解码图像与已知距离的参考符号解码图像进行符号匹配计算，得到视差值，再结合深度计算公式生成网格形式表示的目标物体或投射空间的深度点云信息。

本发明的一种符号阵列面结构光的深度感知方法，包括：

获取所述符号阵列面结构光的输入符号编码图像；

对所述输入符号编码图像进行自适应预处理；

对预处理之后的输入符号编码图像进行符号定位，识别所述输入符号编码图像中所有符号中心点的位置；

对预处理之后的输入符号编码图像进行符号识别，映射为对应的数字；

根据所述对应的数字对识别后的符号进行校正，完成输入符号编码图像的解码；

将校正后的输入符号解码图像与已知距离的参考符号解码图像进行符号匹配，生成符号对应的视差值；

根据所述参考符号解码图像的已知距离和所述视差值，确定所述输入符号编码图像中符号中心点的深度值。

优选地，所述对预处理之后的输入符号编码图像进行符号定位，识别所述输入符号编码图像中所有符号中心点的位置，包括：根据设计参数逐个计算所述符号中心点的位置或根据符号特征信息，利用模式识别确定所述符号中心点的位置。

优选地，所述符号识别，包括：模板匹配方法，将编码符号作为标准匹配符号模板，标准匹配符号模板可围绕符号中心点进行小角度的旋转或对符号进行线性、非线性变换后识别输入符号编码图像中的编码符号。

优选地，所述符号识别，包括：基于样本训练进行SVM模式识别方法。

优选地，所述映射为对应的数字，包括：将识别出的正确的符号映射到具体的数字N上，未能正确识别的符号用特定数字M表示。

优选地，所述根据所述对应的数字对识别后的符号进行校正，包括：对识别出的符号，结合其周围符号，利用符号编码规则进行验证。

优选地，符合所述符号编码规则的符号识别为正确，不符合所述符号编码规则的符号用特定数字M表示为未能正确识别的符号并进行进一步校正，通过循环校正填补，生成校正后的输入符号解码图像。

优选地，所述将校正后的输入符号解码图像与已知距离的参考符号解码图像进行符号匹配，包括通过输入符号在参考符号解码图像中对应位置的符号为中心、一定大小范围内搜索与所述输入符号最接近的匹配符号。

优选地，所述将校正后的输入符号解码图像与已知距离的参考符号解码图像进行符号匹配，包括：输入符号结合其周围符号组成输入符号模板，以模板形式在参考符号解码图象的搜索窗搜寻最优匹配模板，得到输入符号的匹配符号，从而得到输入符号与匹配符号之间的视差值(Δx，Δy)。

优选地，所述输入符号编码图像中符号中心点的深度值，包括：利用X或Y方向的视差值Δm(Δx或Δy)结合参考符号解码图像的已知距离参数d、激光图形投射器与图像传感器之间的基线距离S、图像传感器焦距f和点距参数μ，根据以下深度计算公式计算得到输入符号中心点o的深度信息d′：

d^{'} = d - \frac{Δmμ d^{2}}{fS + Δmμd} = \frac{fSd}{fS + Δmμd}

本发明可快速获得动态场景下目标物体或投射空间的高分辨率、高精度的深度信息，既可以通过软件编程方式移植到不同的硬件平台、操作系统上，也易于通过硬件实现集成入芯片中，降低了智能设备集成深度感知模块获取高分辨率、高精度深度信息的门槛，使智能设备(智能手机、平板电脑等移动设备)进行实时的3D扫描、3D建模和实时生成3D地图成为可能。采用本发明技术方案的有益效果还将通过以下实施例的阐述而得到具体的体现。

相应地，本发明还包括一种符号阵列面结构光的深度感知装置，及包括所述装置的系统。

附图说明

图1是本发明实施例的整体流程框图；

图2是本发明实施例的符号编码图像示意图；

图3是本发明实施例的编码符号示意图；

图4是本发明实施例的符号与数字映射关系；

图5是本发明实施例的符号校正方法；

图6是本发明实施例的符号匹配方法；

图7是本发明实施例的符号匹配后确定视差值示意图；

图8是本发明实施例的符号深度计算方法示意图；

图9是本发明的又一实施例；

图10是本发明的又一实施例。

具体实施方式

下面结合附图对本发明进行进一步的详细说明。

图1示意性图示了本发明实施例符号阵列面结构光深度感知的整体流程图。为了清楚说明，下文中将结合图2、图3、图4、图5、图6、图7、图8、图9、图10来描述该方法。

所述的激光图形投射器是一种激光编码图形Pattem发射装置，所投射的图形可以是固定的，也可以通过编程更改；其发射可与图像传感器的接收进行同步控制；所投射的图形具有一定的水平垂直视角FoV；激光光源可以是可见光、红外、紫外线、X射线。

所述的编码符号是指一种规则的、具有相同大小的符号，例如数字、字母、特定形状符号等。编码符号之间可互相区分、具有唯一性，同时也可以互相串接起来。

所述的输入符号编码图像是图像传感器采集获得、由一些编码符号按一定的规则有机排列而成。该图像由激光图形投射器投射到目标物体或投射空间上作为特征进行标定，再由图像传感器采集获得。一般由水平方向相同编码符号构成，但其上下编码符号不同，经一定角度的整体旋转，从而实现在水平或垂直方向的一定范围内编码符号不重复。

所述的参考符号解码图像是由激光图形投射器投射固定图形的激光束(红外、可见光、紫外线、不可见光)与激光图形投射器的中心轴(Z轴)相垂直或与激光图形投射器的中心轴成固定的夹角、且已知垂直距离为d的平面(该平面可由投影布、平板等构成，用于呈现清晰稳定的激光图像，该平面可称之为参考基准平面)上，再由图像传感器采集得到。参考符号解码图像经与输入符号编码图像同样的自适应预处理、符号定位、符号识别、符号校正后，作为输入符号编码图像进行符号匹配计算的匹配基准图形，可由一幅或多幅不同距离的激光符号编码图像构成。

所述的输入符号解码图像是输入符号编码图像经自适应预处理、符号定位、符号识别和一次或多次符号校正填补后输出的符号图像，即指已实现解码的图像。

根据本发明的一种符号阵列面结构光的深度感知方法，包括以下步骤：

步骤1：自适应预处理。对图像传感器采集获得的输入符号编码图像进行图像自适应预处理，使输入符号编码图像序列特性较为一致，包括增强、去噪、去除光照背景影响等。

其中输入符号编码图像是由一些编码符号按一定的规则有机排列而成，如图2所示，由激光图形投射器投射到目标物体或投射空间上作为特征进行标定，再由图像传感器采集获得。所排列的编码符号在水平或垂直方向的一定范围内不重复。

自适应预处理过程包括输入视频格式转换(如Bayer、ITU601、ITU656、MIPI接口格式转换)、色度空间转换(如RGB转YUV)、灰度图像一致性增强、灰度图像二值化(也可不进行二值化，直接对灰度图像进行处理)等。通过自适应预处理，使所采集的输入符号编码图像更清晰、减少噪声和光照影响，并实现输入符号编码图像序列的一致性增强，有利于本发明内容的符号识别、校正和深度计算。

步骤2：符号定位。经图像自适应预处理后的输入符号编码图像进行符号定位，识别符号中心点所在的位置。要确定输入符号编码图像中符号中心点的位置，由于编码过程中所采用的符号一般大小是一致的，一种方法是根据设计参数(符号大小、符号排列规则、符号倾斜角度等)可逐个计算出符号中心点所在；另一种方法是根据符号特征信息，利用模式识别方法来确定该符号中心点的位置。

步骤3：符号识别。经图像自适应预处理后的输入符号编码图像进行符号识别，识别出输入符号编码图像中正确的符号，并映射到具体的数字N上，即用数字来代表该符号，相同的符号映射到同一数字；未能正确识别的符号可用特定数字M表示。

图3是本发明实施例的编码符号示意图，由16种编码符号组成，每种编码符号由点、线按不同的排列结构组成，具有唯一性，互相之间识别区分，也可以互相串接起来。不同编码符号的大小相同。图3仅是本发明一种实施例，也可以由其它类型的符号组成，其符号形状、符号个数的不同都属于本发明范围。

图4是本发明实施例的16种编码符号与数字0～15的一一映射关系。未能正确识别的编码符号(即识别过程中不符合16种编码符号规律的符号，其产生原因包括所投射的激光图形被目标物体吸收、遮挡，或激光投射距离过远，自适应预处理过程中符号处理缺陷等)可用数字16表示。图4仅是本发明一种实施例，数字仅用于区别和代表符号，符号的其它区别表示方法都属于本发明范围。

编码符号的识别过程，一种采用模板匹配方法进行识别。本发明实施例，将16种编码符号作为标准匹配符号模板，由于输入符号编码图像中由于被投射物体角度等原因，部分编码符号存在形变问题，标准匹配符号模板可围绕符号中心点(步骤2中所定位位置)进行小角度的旋转或对符号进行线性、非线性变换后识别输入符号编码图像中的具体符号，从而增强其识别的鲁棒性。另一种可采用样本训练方法进行SVM模式识别。本发明实施例，针对这16种编码符号的每一种符号，从输入符号编码图像中人工或机器选择K组正确的符号作为样本进行训练。以上两种方法尽是本发明实施例，采用其它识别方法都属于本发明范围。

步骤4：符号校正。经符号识别后的输入符号编码图像，利用符号编码规则，通过一次或多次校正填补，生成输入符号解码图像，如图5所示，具体包括：

步骤4.1：符号初次校正。经符号识别后的输入符号编码图像，验证已识别出的符号的正确性，具体方法：对当前已识别出的符号，结合其周围符号(上下左右斜方向一个或多个符号)，利用符号编码规则进行验证，符合符号编码规则的认为当前符号正确，不符合编码规则的符号再用特定数字M表示为未正确识别的符号。

图6是本发明实施例的符号校正方法。图6.a为符号编码规则示例，用三列数字表示的编码符号排列，数字对应符号，其符合一定的编码规则，参考符号解码图像中的编码排列就是符合这种编码规则，其中的任意一个符号都可以根据其周围关系(上下左右斜方向)来确定，在水平或垂直一定的范围内具有唯一性。图6.b为输入符号编码图像示例，用圆圈表示的数字为步骤3识别出来的符号，用数字16表示的符号为未能正确识别的符号，经符号初次校正后，见图6.c，已识别出的符号结合其周围符号(如上下左右4个符号)，根据符号编码规则经验证得知数字10、9对应的符号完全正确，未通过验证的符号重新改为数字16表示为未正确识别的符号。

步骤4.2：符号循环校正填补。对经步骤4.1的输入符号编码图像，对在已正确识别的符号周围(上下左右斜方向)存在未正确识别的符号时，利用符号编码规则，进行一次或多次循环校正填补，最终生成符号正确识别(即实现解码)的输入符号解码图像。

如图6所示，进入符号循环校正填补阶段，对未能正确的符号的处理，利用完全正确的符号根据符号编码规则，在其上下左右、斜对角共8个方向向外进行膨胀，比如根据一致的符号编码规则，数字10的左右为数字1，上为数字15，下为6，左上、右上为数字6，左下、右下为数字5。通过多次循环校正和填补，最终输出符号正确的输入符号解码图像，从而完成编码符号的解码过程。

步骤5：符号匹配。输入符号解码图像与已知距离的参考符号解码图像进行符号匹配计算，生成符号对应的偏移量，即视差值。

图7是本发明实施例的符号匹配后确定视差值方法示意图。其中参考符号解码图像的已知距离为d，其符号排列符合编码规则，作为输入符号编码图像进行符号匹配计算的匹配基准图形，可以由一幅或多幅不同距离的激光符号编码图像构成。输入符号解码图像中符号10在参考符号解码图像中搜寻其匹配的符号为例，符号10结合其周围(上下左右、斜对角)多个符号组成输入符号模板，模板形状包括垂直方向1×3窗口、五点窗口(左右上下及中间)、3×3窗口等，通过输入符号模板在参考符号解码图像中对应位置的符号为中心、一定大小范围内W×H搜索与输入符号模版最接近且相一致的匹配符号。在参考符号解码图像中成功搜索到匹配符号，即得到输入符号与匹配符号之间的视差值(Δx，Δy)，也就是视差值。

步骤6：深度计算确定。视差值结合图像传感器等已知参数，利用深度计算公式获得网格方式表示、对应符号所在位置的深度点云信息。利用X或Y方向的视差值Δm(Δx或Δy)结合参考符号解码图像的已知距离参数d、激光图形投射器与图像传感器之间的基线距离S、图像传感器焦距f和点距参数μ，根据深度计算公式计算得到输入符号中心点o的深度信息d′，如图8所示。

在本实施例中，根据以下深度计算公式计算d′：

d^{'} = d - \frac{Δmμ d^{2}}{fS + Δmμd} = \frac{fSd}{fS + Δmμd}

其中视差值Δm等于输入符号解码图像的输入符号中心点位置x坐标值-参考符号解码图像的匹配符号中心点位置x′坐标值，或输入符号解码图像的输入符号中心点位置y坐标值-参考符号解码图像的匹配符号中心点位置y′坐标值，有正负。如视差值Δm为正，表示比参考符号解码图像距离更近；视差值Δm为负，表示比参考符号解码图像距离更远。

进一步地，将输入符号解码图像的符号中心点移到同一行的下一个符号中心点上，重复步骤5，得到下一个符号中心点对应的深度值，如此逐个符号计算得到输入符号编码图像中所有符号对应的深度值(用深度点云表示)。同理也可以用于计算输入符号编码图像序列的深度点云信息。

图9公开了本发明的另一个实施例，涉及一种符号阵列面结构光的深度感知装置，包括：

获取模块，用于获取所述符号阵列面结构光的输入符号编码图像；

预处理模块，用于对所述输入符号编码图像进行自适应预处理；

定位模块，用于对预处理之后的输入符号编码图像进行符号定位，识别所述输入符号编码图像中所有符号中心点的位置；

识别模块，用于对预处理之后的输入符号编码图像进行符号识别，映射为对应的数字；

校正模块，用于根据所述对应的数字对识别后的符号进行校正，完成输入符号编码图像的解码；

匹配模块，用于将校正后的输入符解码图像与已知距离的参考符号解码图像进行符号匹配，生成符号对应的视差值；

确定模块，用于根据所述参考符号解码图像的已知距离和所述视差值，确定所述输入符号编码图像中的符号中心点的深度值。

其中，定位模块用于根据设计参数逐个计算所述符号中心点的位置或根据符号特征信息，利用模式识别确定所述符号中心点的位置。

其中，识别模块通过模板匹配将编码符号作为标准匹配符号模板，标准匹配符号模板围绕符号中心点进行小角度的旋转或对符号进行线性、非线性变换后识别输入符号编码图像中的编码符号。

其中，识别模块用于将识别出的正确的符号映射到具体的数字N上，未能正确识别的符号用特定数字M表示。

其中，校正模块用于对识别出的符号，结合其周围符号，利用所述符号的符号编码规则进行验证，符合所述符号编码规则的符号识别为正确，不符合所述符号编码规则的符号用特定数字M表示为未能正确识别的符号并进行进一步校正，通过循环校正填补，生成校正后的输入符号解码图像。

其中，匹配模块用于通过输入符号在参考符号解码图像中对应位置的符号为中心、一定大小范围内搜索与所述输入符号最接近的匹配符号。

其中，确定模块利用X或Y方向的视差值Δm(Δx或Δy)结合参考符号解码图像的已知距离参数d、激光图形投射器与图像传感器之间的基线距离S、图像传感器焦距f和点距参数μ，根据以下深度计算公式计算得到输入符号中心点o的深度信息d′：

d^{'} = d - \frac{Δmμ d^{2}}{fS + Δmμd} = \frac{fSd}{fS + Δmμd} .

图10公开了本发明的又一实施例，涉及一种符号阵列面结构光的深度感知系统，包括激光图形投射器和上一实施例的深度感知装置，其中激光图形投射器向目标物体或投射空间投射编码图形后由深度感知装置接收到输入符号编码图像。

虽然上述的实施例在特定的系统中完成，然其并非限定本发明，本发明可类似的应用到相似的图案投射和图像传感器系统中；同样，用于作为匹配标准的参考符号解码图像并非限定为1幅，可以是多幅图像。本行业的技术人员应该了解，本发明不受上述实施例的限制，上述实施例和说明书中描述的只是说明本发明的原理，在不脱离本发明精神和范围的前提下，本发明还会有各种变化和改进，这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

Claims

1.一种符号阵列面结构光的深度感知方法，其特征在于，包括：

获取所述符号阵列面结构光的输入符号编码图像；

对所述输入符号编码图像进行自适应预处理；

根据所述参考符号解码图像的已知距离和所述视差值，确定所述输入符号编码图像中的符号中心点的深度值。

2.根据权利要求1所述的方法，其特征在于：所述对预处理之后的输入符号编码图像进行符号定位，识别所述输入符号编码图像中所有符号中心点的位置，包括：根据设计参数逐个计算所述符号中心点的位置或根据符号特征信息，利用模式识别确定所述符号中心点的位置。

3.根据权利要求1或2所述的方法，其特征在于：所述符号识别，包括：模板匹配方法，将编码符号作为标准匹配符号模板，标准匹配符号模板围绕符号中心点进行小角度的旋转或对符号进行线性、非线性变换后识别输入符号编码图像中的编码符号。

4.根据权利要求1所述的方法，其特征在于：所述映射为对应的数字，包括：将识别出的正确的符号映射到具体的数字N上，未能正确识别的符号用特定数字M表示。

5.根据权利要求1或4所述的方法，其特征在于：所述根据所述对应的数字对识别后的符号进行校正，包括：对识别出的符号，结合其周围符号，利用所述符号的符号编码规则进行验证。

6.根据权利要求5所述的方法，其特征在于：符合所述符号编码规则的符号识别为正确，不符合所述符号编码规则的符号用特定数字M表示为未能正确识别的符号并进行进一步校正，通过循环校正填补，生成校正后的输入符号解码图像。

7.根据权利要求1所述的方法，其特征在于：所述将校正后的输入符号解码图像与已知距离的参考符号解码图像进行符号匹配，包括通过输入符号在参考符号解码图像中对应位置的符号为中心、一定大小范围内搜索与所述输入符号最接近的匹配符号。

8.根据权利要求1或7所述的方法，其特征在于：所述将校正后的输入符号解码图像与已知距离的参考符号解码图像进行符号匹配，生成符号对应的视差值，根据所述已知距离和所述视差值，确定所述输入符号编码图像的符号中心点的深度包括：

输入符号结合其周围符号组成输入符号模板，以模板形式在参考符号解码图象的搜索窗搜寻最优匹配模板，得到输入符号的匹配符号，从而得到输入符号与匹配符号之间的视差值(Δx，Δy)；

利用X或Y方向的视差值Δm(Δx或Δy)结合参考符号解码图像的已知距离参数d、激光图形投射器与图像传感器之间的基线距离S、图像传感器焦距f和点距参数μ，根据以下深度计算公式计算得到输入符号中心点o的深度信息d′；

d^{'} = d - \frac{{Δmμd}^{2}}{f S + Δ m μ d} = \frac{f S d}{f S + Δ m μ d} .

9.一种符号阵列面结构光的深度感知装置，其特征在于，包括：

10.根据权利要求9所述的装置，其特征在于：所述定位模块用于根据设计参数逐个计算所述符号中心点的位置或根据符号特征信息，利用模式识别确定所述符号中心点的位置。

11.根据权利要求9或10所述的装置，其特征在于：所述识别模块通过模板匹配将编码符号作为标准匹配符号模板，标准匹配符号模板围绕符号中心点进行小角度的旋转或对符号进行线性、非线性变换后识别输入符号编码图像中的编码符号。

12.根据权利要求9所述的装置，其特征在于：所述识别模块用于将识别出的正确的符号映射到具体的数字N上，未能正确识别的符号用特定数字M表示。

13.根据权利要求9或12所述的装置，其特征在于：所述校正模块用于对识别出的符号，结合其周围符号，利用所述符号的符号编码规则进行验证，符合所述符号编码规则的符号识别为正确，不符合所述符号编码规则的符号用特定数字M表示为未能正确识别的符号并进行进一步校正，通过循环校正填补，生成校正后的输入符号解码图像。

14.根据权利要求9所述的装置，其特征在于：所述匹配模块用于通过输入符号在参考符号解码图像中对应位置的符号为中心、一定大小范围内搜索与所述输入符号最接近的匹配符号。

15.根据权利要求9所述的装置，其特征在于：所述确定模块利用X或Y方向的视差值Δm(Δx或Δy)结合参考符号解码图像的已知距离参数d、激光图形投射器与图像传感器之间的基线距离S、图像传感器焦距f和点距参数μ，根据以下深度计算公式计算得到输入符号中心点o的深度信息d′：

d^{'} = d - \frac{{Δmμd}^{2}}{f S + Δ m μ d} = \frac{f S d}{f S + Δ m μ d} .

16.一种符号阵列面结构光的深度感知系统，包括激光图形投射器和如权利要求9-15任一所述的深度感知装置，所述激光图形投射器向目标物体或投射空间投射编码图形后由所述深度感知装置接收到输入符号编码图像。