CN111027415A

CN111027415A - 一种基于偏振图像的车辆检测方法

Info

Publication number: CN111027415A
Application number: CN201911147948.9A
Authority: CN
Inventors: 黄志明; 汪凯巍; 李华兵; 杨恺伦
Original assignee: Hangzhou Lingxiang Technology Co ltd
Current assignee: Hangzhou Lingxiang Technology Co ltd
Priority date: 2019-11-21
Filing date: 2019-11-21
Publication date: 2020-04-17
Anticipated expiration: 2039-11-21
Also published as: CN111027415B

Abstract

本发明公开了一种基于偏振图像的车辆检测方法。该方法包括：采集RGB‑P图像构建小型数据集、计算偏振图像的斯托克斯矢量、线性偏振度DoLP和线性偏振角值AoLP，然后据此构建HSL空间图像，最后将HSL图像送入SSD网络训练得到最终的车辆检测模型。该方法相比现有的车辆检测技术，实现了更好、更准确的车辆检测效果，解决了特殊场景下的车辆检测问题，可以更好地满足实际应用需求，一定程度上填补了这一块的技术空缺。

Description

一种基于偏振图像的车辆检测方法

技术领域

本发明属于深度学习技术、偏振成像技术、目标检测技术、图像处理技术、计算机视觉技术领域，具体地涉及一种基于偏振图像的车辆检测方法。

背景技术

随着计算机视觉技术的发展，目标检测技术已经有传统的图像算法转到深度学习领域，并已经实现了较好的检测效果，如Faster R-CNN、YOLO等。深度学习模型是通过大型的图像数据集(ImageNet，PASCAL VOC等)训练所得到，但是这些大型数据集都是RGB图像组成，对于现实世界中一些比较复杂的场景(如车辆上的高光、高反等)，仅仅依赖RGB信息是不够的，现有的仅通过RGB图像信息训练的车辆检测模型很难满足实际要求。因此，一个能够满足各种复杂场景下的车辆检测方法对于自动驾驶等技术领域是迫切需要的。要想实现较好的检测效果就必须融合更多维度的信息。

发明内容

本发明的目的在于针对现有车辆检测技术在复杂场景下的局限性，提出了一种基于偏振图像的车辆检测方法。

本发明的目的是通过如下技术方案实现的：一种基于偏振图像的车辆检测方法，具体包括以下步骤：

(1)采集RGB-P图像构建小型数据集：通过基于微偏振阵列成像技术的彩色偏振相机获取任意场景在0°、45°、90°和135°的偏振角下的图像，从而获得当前场景下的RGB-P图像；

(2)通过计算出斯托克斯参量中的I、Q、U后，算出每个像素的DOLP和AOLP的值：

(2.1)计算偏振图像的斯托克斯矢量S＝[I,Q,U,V]^T中的I，Q，U三个参量：使用I(0)、I(45)、I(90)和I(135)分别表示步骤1中对应角度下的偏振图像，则有：

I＝I(0)+I(45)+I(90)+I(135)

Q＝I(0)-I(90)

U＝I(45)-I(135)， (1)

其中，I表示总光强度，Q表示水平方向直线偏振光分量，U表示45°方向直线偏振光分量，V表示右旋园偏振分量。

(2.2)计算出偏振斯托克斯矢量后，对应图像的每个像素的线性偏振度DoLP表示为：

(2.3)在DoLP值大于0.3的图像区域，计算每个像素的线性偏振角值AoLP：

(3)计算出当前场景的DoLP图像和AoLP图像后，再将步骤1获得的当前场景下的RGB-P图像转换到HSL空间的图像，其中，H表示色度，H＝2*AoLP；S表示饱和度，S＝DoLP；L表示亮度，L＝I/255。

(4)选取SSD目标检测网络对步骤3中的HSL空间的图像进行训练：采用在ImageNet数据集上预训练好的SSD目标检测网络模型，使用迁移学习的fine-tune方法让所述SSD目标检测网络模型的conv1层到conv5层的参数固定，重新训练学习conv5层以后的参数，在迭代多个epoch后直到SSD目标检测网络模型收敛，停止训练，得到基于RGB-P信息的车辆检测模型。

(5)将实际场景拍摄的RGB-P图像输入到步骤4中训练得到的车辆检测模型中，输出车辆在图像中的位置。

进一步地，DoLP的取值范围在0～1之间，1代表完全线偏振光，0代表完全非线偏振光。

进一步地，AoLP的取值范围在0°取180°之间。

与现有技术相比，本发明具有如下有益效果：

(1)场景适应性更好；相比于仅使用RGB信息的车辆检测网络模型，本发明的方法对真实世界中各种复杂的应用场景的适应性更好。因为本方法除了结合RGB信息外，还融入了偏振信息，因此在高光高反区域的场景下，本方法检测效果明显优于仅依靠RGB信息的车辆检测模型。

(2)平均准确率(mAP)更高；本发明在实际测试过程中，对于实际场景中的车辆的平均检测准确率要比仅用RGB信息训练的模型更高。因为大部分的车辆的表面都是金属材质，相较于其他物体具有很高的偏振特性，因此检测的平均准确率要高于仅仅使用RGB信息的网络模型。

(3)输出的环境感知信息更多。由于本方法采用基于微偏振阵列成像相机采集数据集，因此本发明除了能实时检测车辆之外，还能输出更多维度的场景信息，如偏振度、偏振角等。

附图说明

图1为偏振相机拍摄的四个不同偏振角度下的偏振图像；

图2为DoLP图像；

图3为AoLP图像；

图4为网络输入的HSL图像；

图5为SSD目标检测网络结构。

具体实施方式

本发明公开了一种基于偏振图像的车辆检测方法，具体包括以下步骤：

(1)采集RGB-P图像构建小型数据集：本方法拟使用场景的RGB-P信息进行训练，但是目前是没有适用的RGB-P图像的数据集的，因此需要手动采集制作。RGB-P图像的采集是通过一个基于微偏振阵列成像技术的彩色偏振相机完成，该偏振相机可以同时获取任意场景在0°、45°、90°和135°偏振角下的图像，如图1所示：左上对应的是90°，右上对应45°，左下对应135°以及右下对应的是0°，从而获得当前场景下的RGB-P图像；

(2.1)在获取到当前场景的四个不同偏振角度下的偏振图像后，需要计算图像的偏振斯托克斯矢量S＝[I,Q,U,V]^T中的I,Q,U三个参量，以获得该场景图像的偏振度和偏振角信息。使用I(0)、I(45)、I(90)和I(135)分别表示步骤1中对应偏振角度下的图像，则有：

I＝I(0)+I(45)+I(90)+I(135)

Q＝I(0)-I(90)

U＝I(45)-I(135)， (1)

其中，I表示总光强度，Q表示水平方向直线偏振光分量，U表示45°方向直线偏振光分量，V表示右旋园偏振光分量。

(2.2)计算出偏振的斯托克斯矢量S中的I,Q,U后，则对应图像的每个像素的线性偏振

度DoLP可表示为：

其中，DoLP的取值范围在0～1之间，1代表完全线偏振光，0代表完全非线偏振光，如图2所示，表示了当前场景的偏振度信息，其中亮度较高的区域对应偏振度较强的区域。

其中，AoLP的取值范围在0°～180°之间，AoLP反映了高偏振区域表面的轮廓信息，如图3，表示了当前场景的偏振角信息，可以看出偏振度较高的连续区域上偏振角的大小基本一致。

(3)因为当前主流的目标检测网络(如Faster-RCNN，SSD等)都输入的是RGB图像来训练模型，如果想要融入偏振信息进行训练，则必须改变图像的输入格式。在计算出图像的DoLP和AoLP后，将步骤1获得当前场景下的RGB-P图像转换到HSL空间的图像，HSL空间仿照HSV空间，其中，H表示色度，H＝2*AoLP；S表示饱和度，S＝DoLP；L表示亮度，L＝I/255，如图4所示，将图像转换成HSL空间后，不仅保留了原有的亮度信息，还可以充分利用到场景的偏振度，偏振角信息，因此有利于提升检测效果。

(4)选取SSD目标检测网络对步骤3中的HSL空间的图像进行训练：采用在ImageNet数据集上预训练好的SSD目标检测网络模型，使用迁移学习的fine-tune方法让所述SSD目标检测网络模型的conv1层到conv5层的参数固定，重新学习网络后几层的参数，在多次迭代到模型收敛后，停止训练，得到基于RGB-P信息的车辆检测模型；所述SSD目标检测网络模型如图5所示。

该方法能够准确地检测出车辆在图像中的位置，并生成Bounding Box将车辆目标框出显示，实时帧率能达到40帧，检测速度满足实时性的要求。

Claims

1.一种基于偏振图像的车辆检测方法，其特征在于，具体包括以下步骤：

I＝I(0)+I(45)+I(90)+I(135)

Q＝I(0)-I(90)

U＝I(45)-I(135)， (1)

2.如权利要求1所述车辆检测方法，其特征在于，DoLP的取值范围在0～1之间，1代表完全线偏振光，0代表完全非线偏振光。

3.如权利要求1所述车辆检测方法，其特征在于，AoLP的取值范围在0°取180°之间。