CN111881739A

CN111881739A - 一种汽车尾灯状态识别方法

Info

Publication number: CN111881739A
Application number: CN202010565899.7A
Authority: CN
Inventors: 戴亮亮; 张卡; 何佳; 尼秀明
Original assignee: Anhui Qingxin Internet Information Technology Co ltd
Current assignee: Anhui Qingxin Internet Information Technology Co ltd
Priority date: 2020-06-19
Filing date: 2020-06-19
Publication date: 2020-11-03
Anticipated expiration: 2040-06-19
Also published as: CN111881739B

Abstract

本发明公开了一种汽车尾灯状态识别方法，属于计算机视觉和辅助驾驶技术领域，包括：获取待识别的车尾图像，并输入至预先训练好的尾灯状态识别模型，该尾灯状态识别模型包括特征提取网络和尾灯状态判别网络；利用特征提取网络提取车尾图像的尾灯特征向量；利用尾灯状态判别网络对尾灯特征向量进行处理，识别出汽车尾灯的状态。本发明设计基于注意力机制的卷积‑循环神经网络直接在车尾图像中提取尾灯特征，并推理尾灯前后时刻的亮度变化，能够稳定有效地识别复杂环境下的汽车尾灯状态。

Description

一种汽车尾灯状态识别方法

技术领域

本发明涉及计算机视觉和辅助驾驶技术领域，特别涉及一种汽车尾灯状态识别方法。

背景技术

尾灯状态是驾驶员判断前方车辆行驶意图的主要依据。在日间行驶时，驾驶员由于注意力不集中、视距、光照强度等因素影响，可能无法有效的接收到前方车辆的尾灯示警信息，导致车辆驾驶预判不及时，从而引发交通安全问题。因此，快速有效的汽车尾灯状态识别，是辅助驾驶领域亟待解决的问题。

基于视觉的汽车尾灯状态识别主要是通过分析包含汽车尾灯的图像数据，从而识别出尾灯的类型及点亮状态，达到预判前方车辆驾驶意图的目的。现有的汽车尾灯分析方法主要有以下几种：

(1)基于颜色统计的阈值分割法。该类方法通常利用颜色空间变换将车尾图像转换到特定的颜色空间进行筛选，然后对不同类型的尾灯的“关闭”与“点亮”状态设定特定的颜色阈值，从而进行尾灯分割，达到尾灯状态识别的目的。该类方法的优势是速度快、不依赖于尾灯的精确定位；但对于颜色及光照敏感，准确度、鲁棒性较差。

(2)基于连续帧的帧差法。该类方法通过选取特定间隔的连续汽车尾灯图，利用帧间差分的方法，对比相邻时刻的尾灯颜色变化，达到识别尾灯状态的目的。这类方法引入了时序相关性，一定程度地解决了光照干扰。但仍对颜色较为敏感，且依赖于尾灯区域的定位及对齐，实际实现较难。

(3)基于机器学习的分类法。该类方法通过设计并训练一个尾灯状态分类器(如支持向量机、贝叶斯分类器等)，对尾灯区域的图像特征进行分类，达到尾灯状态识别的目的。这类方法识别精度较高，对光照、背景的干扰能力较强。但在实际应用中，该类方法识别准确率依赖于尾灯的检测精度，且受车距导致的尾灯图像分辨率影响，识别结果在时序上不够平滑。

发明内容

本发明的目的在于克服上述背景技术中的不足，以稳定有效识别复杂环境下的汽车尾灯状态。

为实现以上目的，采用一种汽车尾灯状态识别方法，包括如下步骤：

获取待识别的车尾图像，并输入至预先训练好的尾灯状态识别模型，该尾灯状态识别模型包括特征提取网络和尾灯状态判别网络；

利用特征提取网络提取车尾图像的尾灯特征向量；

利用尾灯状态判别网络对尾灯特征向量进行处理，识别出汽车尾灯的状态。

进一步地，所述特征提取网络包括基干网络和空间注意力模块，基干网络的输出与空间注意力模块连接；

基干网络包括卷积层Conv0、全局最大池化层MaxPooling0、全局平均池化层Global AvgPooling和残差模块ResNeXt block0、ResNeXt block1和ResNeXt block2，卷积层Conv0的输入为所述待识别的车尾图像、输出与全局最大池化层MaxPooling0的输入连接，全局最大池化层MaxPooling0的输出依次经残差模块ResNeXt block0、ResNeXt block1和ResNeXt block2后与全局平均池化层Global AvgPooling的输入连接。

进一步地，所述空间注意力模块包括空间注意力模块Spatial AttentionModule0、Spatial Attention Module1和Spatial Attention Module2；

所述残差模块ResNeXt block0、ResNeXt block1和ResNeXt block2的输出分别与所述空间注意力模块Spatial Attention Module0、Spatial Attention Module1和Spatial Attention Module2的输入连接，

所述残差模块ResNeXt block0的输出与所述空间注意力模块Spatial AttentionModule0的输出的Hadamard积作为所述残差模块ResNeXt block1的输入；所述残差模块ResNeXt block1的输出与所述空间注意力模块Spatial Attention Module1的输出的Hadamard积作为所述残差模块ResNeXt block2的输入；所述残差模块ResNeXt block2的输出与所述空间注意力模块Spatial Attention Module2的输出的Hadamard积作为所述全局平均池化层Global AvgPooling的输入，所述全局平均池化层Global AvgPooling的输出为所述尾灯特征向量。

进一步地，所述残差模块包括卷积层Conv_a、分组卷积Group_Conv、卷积层Conv_c、卷积层Conv_b和卷积层Conv_d，输入图像经卷积层Conv_a和卷积层Conv_b输入，卷积层Conv_a的输出与分组卷积Group_Conv输入连接，分组卷积Group_Conv的输出与卷积层Conv_c输入连接，卷积层Conv_b的输出和卷积层Conv_c的输出经concatenate操作拼接处理后作为卷积层Conv_d的输入，卷积层Conv_d的输出为特征图。

进一步地，所述空间注意力模块包括全局平均池化层、全局最大池化层、拼接层和卷积层Conv，全局平均池化层和全局最大池化层的输入为所述残差模块输出的特征图，全局平均池化层和全局最大池化层的输出经拼接层拼接处理后作为卷积层Conv的输入，卷积层Conv的输出经sigmoid函数激活操作处理得到注意力权重矩阵。

进一步地，灯状态判别网络包括门限循环单元层、时序注意力模块和尾灯状态分类器，门限循环单元层包括两个单层循环结构GRU Layer0和GRU Layer1，时序注意力模块的输入与单层循环结构GRU Layer0连接、输出与单层循环结构GRU Layer1连接，单层循环结构GRU Layer1的输出与尾灯状态分类器连接。

进一步地，所述时序注意力模块用于利用全连接层和Softmax激活操作对所述单层循环结构GRU Layer0的输出结果进行时序权重分配，具体计算方式如下：

其中，h_in和h_out分别为所述GRU Layer0各时刻的输出状态和注意力权重分配后的时序特征结果，f(·)为全连接操作。

进一步地，所述尾灯状态识别模型的训练步骤包括：

获取车尾序列样本训练集，集合中的车尾序列样本为按照时序关系将n张连续的车尾局部图构成的图像序列，每张车尾局部图上标注有尾灯状态信息；

设置所述尾灯状态识别模型的损失函数和学习率；

利用车尾序列样本对所述尾灯状态识别模型进行训练，得到所述预先训练好的尾灯状态识别模型。

进一步地，所述获取车尾序列样本训练集，包括：

获取不同场景下的尾灯变化视频数据；

将尾灯变化视频数据转换为连续帧图像，并利用目标检测算法获取各帧图像中目标车辆的汽车尾部区域，得到车尾局部图；

根据尾灯的状态对每张车位局部图进行状态标注，并按照时序关系，将每n张连续的标注有状态信息的车尾局部图序列集合作为所述车尾序列样本；

根据所述车尾序列样本，构建所述车尾序列样本训练集。

进一步地，在所述尾灯状态识别模型的训练过程中，还包括：

使用余弦退火策略对所述学习率进行动态调整。

与现有技术相比，本发明存在以下技术效果：深度学习由于其优越的性能及泛化能力，已经成为了视觉领域的常用算法。其中，卷积神经网络能够有效地提取图像高维特征，注意力机制提升了神经网络对有效区域的关注程度，而循环神经网络擅于学习时序相关性。本发明设计基于注意力机制的卷积-循环神经网络直接在车尾图像中提取尾灯特征，并推理尾灯前后时刻的亮度变化，能够稳定有效地识别复杂环境下的汽车尾灯状态。

附图说明

下面结合附图，对本发明的具体实施方式进行详细描述：

图1是一种汽车尾灯状态识别方法的流程图；

图2是本发明整体设计流程图；

图3是尾灯状态识别模型的整体结构图；

图4是特征提取网络的结构图；

图5是残差模块的结构图；

图6是空间注意力模块的结构图；

图7是尾灯状态判别网络的结构图。

具体实施方式

为了更进一步说明本发明的特征，请参阅以下有关本发明的详细说明与附图。所附图仅供参考与说明之用，并非用来对本发明的保护范围加以限制。

如图1所示，本实施例公开了一种汽车尾灯状态识别方法，包括如下步骤S1至S3：

S1、获取待识别的车尾图像，并输入至预先训练好的尾灯状态识别模型，该尾灯状态识别模型包括特征提取网络和尾灯状态判别网络；

S2、利用特征提取网络提取车尾图像的尾灯特征向量；

S3、利用尾灯状态判别网络对尾灯特征向量进行处理，识别出汽车尾灯的状态。

本实施例所设计尾灯状态识别模型使用了卷积-循环神经网络和注意力机制，可解决现有尾灯识别技术对尾灯定位精度的依赖问题，同时时序信息的引入，克服了现有技术对光照、色差等颜色信息过于敏感等难题，提高了尾灯状态识别结果在时序上的稳定性和准确度。

如图2-3所示，本实施例中在利用计尾灯状态识别模型对任意获取的待识别车尾图像进行尾灯状态识别前，还包括设计尾灯状态识别模型和对模型进行训练。

本实施例中的尾灯状态识别模型，首先利用卷积神经网络(CNN)提取车尾序列样本中图像帧的高维特征，再利用递归神经网络(RNN)推理各帧之间的时序相关性，这种结合空间和时序特征的方式，大大提升了模型的识别精度和时序稳定性。另外，模型在卷积网络中设计了空间注意力结构(CNN-Attention)，能够有效提高CNN对车尾图像中的尾灯局部区域的关注程度，使得模型不依赖于车尾灯的精确定位；同时设计了时序注意力结构(RNN-Attention)，增强了RNN对尾灯状态变化的敏感程度。

如图4所示，所设计的尾灯状态识别模型包括特征提取网络和尾灯状态判别网络，其中特征提取网络采用卷积神经网络，尾灯状态判别网络采用递归神经网络。特征提取网络包括基干网络(Backbone)和空间注意力模块(Spatial Attention Module)，特征提取网络的输入是尺寸为128×128的车尾RGB图像，输出为提取到的128维尾灯特征向量。在本实施例中，卷积网络的核尺寸用高×宽表示，特征图尺寸通过高×宽×通道数(H×W×C)来表示。

需要说明的是，在卷积神经网络中，如无特殊说明，每个卷积层均包含批归一化层(Batch Normalization)和非线性激活(Activation)操作。其中，非线性激活操作采用Mish函数，具体表达式如下：

f(x)＝x·tanh(ln(1+e^x))，

其中，f(x)为mish函数，其中x为输入特征图，tanh(·)为双曲正切函数，ln(·)为以常数e为底数的对数函数，f(x)连续可导，在避免封顶饱和的同时对负值有更好的微小梯度。

进一步地，所述基干网络如图4所示，卷积层Conv0的核尺寸为7×7、步长为2×2，大的核尺寸能够增大卷积核的感受野，有效的提取输入图像的全局抽象特征，配合核尺寸为4×4、步长为2×2的最大池化层MaxPooling0，能够快速减小特征图尺寸，并保留特征的平移和旋转不变性；ResNeXt block0、ResNeXt block1、ResNeXt block2为三个包含分组卷积的残差模块。如图5所示，该残差模块首先使用核尺寸为1×1、步长为1×1的卷积层Conv_a对特征图进行通道数(C)降维。然后，利用组数(group)为32的分组卷积Group_Conv扩大网络宽度，提升网络的特征学习能力。接着，使用核尺寸为1×1、步长为2×2的卷积层Conv_c减小特征图尺寸并恢复通道数，同时，残差跳跃连接通过核尺寸为3×3、步长为2×2的卷积层Conv_b计算。最后，利用核尺寸为3×3，步长为1×1的卷积层Conv_d进行特征融合，得到残差结构的输出特征图；如图3所示，基干网络的最后，通过全局平均池化操作(GlobalAverage Pooling)将残差结构的输出特征图映射成128维的特征向量。

进一步地，所述空间注意力模块，即通过学习权重分配，使网络更加关注特征图的有效区域，所述空间注意力模块包括空间注意力模块Spatial Attention Module0、Spatial Attention Module1和Spatial Attention Module2；

简单来说，在本实施例中，空间注意力模块能够帮助基干网络从车尾图像中自动识别尾灯的有效区域，避免了现有尾灯识别方法对尾灯定位精度地依赖。如图6所示，空间注意力模块首先利用全局平均池化操作和全局最大池化操作分别将尺寸为H×W×C的输入特征图进行通道压缩，拼接获得1个尺寸为H×W×2的空域敏感矩阵。然后通过一个核尺寸为5×5、步长为1×1的卷积层进行特征映射，结合sigmoid激活操作，得到尺寸为H×W的注意力权重矩阵，所述注意力权重矩阵的每个元素均为0～1的小数，表示输入特征图对应位置的特征值在尾灯识别任务中的重要程度。因此，最终输入特征图(H×W×C)与注意力权重矩阵(H×W)的Hadamard积即为注意力增强后的特征图，具体计算方式如下：

f_out＝f_in*σ(conv([g_max(f_in)，g_avg(f_in)]))

其中，f_in和f_out分别为输入特征(即残差模块输出的特征图)和注意力增强后的特征，σ(·)为sigmoid激活函数，conv表示卷积操作，g_max(·)和g_avg(·)分别表示全局最大池化操作和全局平均池化操作，*表示表示Hadamard乘积操作，即矩阵对应维度元素直接相乘。

进一步地，设计的尾灯状态判别网络如图7所示，所述尾灯状态判别网络包括门限循环单元(GRU)层、时序注意力模块(Temporal Attention)和尾灯状态分类器(Classifier)，门限循环单元层包括两个单层循环结构GRU Layer0和GRU Layer1，时序注意力模块的输入与单层循环结构GRU Layer0连接、输出与单层循环结构GRU Layer1连接，单层循环结构GRU Layer1的输出与尾灯状态分类器连接。

其中，GRU层对时序特征敏感，能够学习车尾灯前后时刻的状态变化，提高了模型对光照变化、灯罩色差等颜色差异的抗干扰能力，保证了识别结果的稳定性和有效性；时序注意力模块在尾灯状态发生变化时，能够有效提高GRU层对该时刻特征的关注程度，使网络对尾灯变化更具有判别能力，提升了模型对尾灯状态的识别精度。网络的输入为由上述卷积神经网络提取到的车尾特征序列，尺寸为车尾序列样本长度×特征长度，即8×128；网络的输出为车尾序列样本中各帧图像的尾灯状态，尺寸为8×3。

进一步地，所述循环神经网络包含的2个GRU层(GRU Layer0和GRU Layerl)，均为单层循环结构，隐含节点个数分别为128和256，网络输出每个时刻的时序相关性特征。

进一步地，所述时序注意力模块如图7所示，利用全连接层和Softmax激活操作对GRU Layer0的输出结果进行时序权重分配，达到尾灯状态动态关注的目的，具体计算方式如下：

其中，h_in和h_out分别为GRU Layer0各时刻的输出状态和注意力权重分配后的时序特征结果，f(·)为全连接操作，*表示表示Hadamard乘积操作，即矩阵对应元素相乘。

进一步地，所述尾灯状态分类器，对各时刻的尾灯状态进行判别，由2个分别包含128和3个隐含节点的全连接层组成，通过Sigmoid激活操作对输出结果进行非线性映射，得到车尾序列样本中各帧图像的尾灯状态标签。

进一步地，所述尾灯状态识别模型的训练步骤包括：

(1)采集并标注包含汽车尾灯变化的视频数据，获得车尾序列样本训练集：

首先，采集各场景下不同车型、光照条件、拍摄角度和距离下的尾灯变化视频数据。具体视频内容包括刹车灯、左转向灯、右转向灯、应急灯共4种尾灯的“点亮”与“关闭”动作序列；

然后，将上述各视频数据转化为连续帧图像，利用目标检测算法(如YOLO、SSD等)获取各帧图像中目标车辆的汽车尾部区域，得到车尾局部图x；

接着，根据各车灯的“关闭”或“点亮”情况对每张车尾局部图进行状态标注。标注标签y为k维向量，各维度分别代表所属类型尾灯是否点亮，具体可表示为：

y＝[l₁,l₂,...,l_k]^T

其中，l∈[0,1]，分别表示所属类别的尾灯是“关闭”或“点亮”状态。另外，由于在本实施例中共采集了4种尾灯类型，但在实际情况中应急灯“点亮”即左、右转向灯同时“点亮”，因此，在本实施例中k＝3。

最后，按照时序关系，将每n张连续的车尾局部图的序列集合作为一个上述车尾序列样本，得到所述的车尾序列样本训练集。具体的，对于每个车尾序列训练样本X，均包含n张连续车尾局部图像：

X＝[x₁,x₂,...,x_n]

则其对应的尾灯状态标签为Y＝[y₁,y₂,...,y_n]；在本实施例中，选择使用连续的8张车尾局部图作为一个车尾序列样本，因此n＝8。

(2)设置尾灯状态识别模型的目标损失函数和学习率等条件，并结合训练集对尾灯状态识别模型的网络参数进行训练优化：

所述目标损失函数为二值交叉熵损失，初始学习率设为0.01，在网络训练过程中，使用余弦退火策略对学习率进行动态调整。最终得到的最优神经网络模型能够在实际场景中对车尾序列图像进行推理，从而识别尾灯状态变化。

进一步地，在利用所述尾灯状态识别模型在实际场景中实时识别汽车尾灯状态时，由于所述尾灯状态识别模型的能够同时识别连续8帧车尾图像的尾灯状态，在实际使用场景中，可设置模型的推理时间为8帧时间，减少模型推理的时间代价。则，具体的实时尾灯识别过程为：

首先，图像采集设备实时采集场景图像，确认目标车辆的车尾区域，并缓存车尾图像；然后，在时刻为t0时，获取缓存的最近8帧车尾图像，缩放到尺寸为128×128，利用所述最优尾灯状态识别模型识别这8张车尾图像的尾灯状态；最后，每隔8帧重复一次上述操作，达到目标车辆尾灯状态实时识别的目的。

本发明提供的技术方案与已有的公知技术相比，具有如下显著效果：

(1)本发明所设计的尾灯状态识别模型为一种端到端的卷积-循环神经网络模型，其结合卷积神经网络的图像特征提取能力和循环神经网络的时序特征提取能力，显著提高了尾灯状态识别的稳定性和准确性。

(2)本发明在尾灯状态识别模型中设计了空间注意力模块和时序注意力模块。其中，空间注意力模块增强了车尾图像中的尾灯特征，克服了现有方法对尾灯区域的定位依赖；时序注意力模块使模型更加关注序列中尾灯的状态变化，提高了网络模型对尾灯状态的判别性能。

(3)本发明结合了图像序列的时序信息，在实际应用中，解决了现有尾灯状态识别方法由于不同时刻光照强度不同、不同车型的灯罩色差等颜色变化导致的识别效果鲁棒差等问题。同时，序列信息的应用，使得识别结果在连续时刻上更加平滑稳定，有利于驾驶意图分析、驾驶预警等辅助驾驶工作的开展。

以上所述仅为本发明的较佳实施例，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种汽车尾灯状态识别方法，其特征在于，包括：

利用特征提取网络提取车尾图像的尾灯特征向量；

2.如权利要求1所述的汽车尾灯状态识别方法，其特征在于，所述特征提取网络包括基干网络和空间注意力模块，基干网络的输出与空间注意力模块连接；

基干网络包括卷积层Conv0、全局最大池化层MaxPooling0、全局平均池化层GlobalAvgPooling和残差模块ResNeXt block0、ResNeXt block1和ResNeXt block2，卷积层Conv0的输入为所述待识别的车尾图像、输出与全局最大池化层MaxPooling0的输入连接，全局最大池化层MaxPooling0的输出依次经残差模块ResNeXt block0、ResNeXt block1和ResNeXtblock2后与全局平均池化层Global AvgPooling的输入连接。

3.如权利要求2所述的汽车尾灯状态识别方法，其特征在于，所述空间注意力模块包括空间注意力模块Spatial Attention Module0、Spatial Attention Module1和SpatialAttention Module2；

所述残差模块ResNeXt block0、ResNeXt block1和ResNeXt block2的输出分别与所述空间注意力模块Spatial Attention Module0、Spatial Attention Module1和SpatialAttention Module2的输入连接，

所述残差模块ResNeXt block0的输出与所述空间注意力模块Spatial AttentionModule0的输出的Hadamard积作为所述残差模块ResNeXt block1的输入；所述残差模块ResNeXt block1的输出与所述空间注意力模块Spatial Attention Module1的输出的Hadamard积作为所述残差模块ResNeXt block2的输入；所述残差模块ResNeXt block2的输出与所述空间注意力模块Spatial Attention Module2的输出的Hadamard积作为所述全局平均池化层GlobalAvgPooling的输入，所述全局平均池化层Global AvgPooling的输出为所述尾灯特征向量。

4.如权利要求2所述的汽车尾灯状态识别方法，其特征在于，所述残差模块包括卷积层Conv_a、分组卷积Group_Conv、卷积层Conv_c、卷积层Conv_b和卷积层Conv_d，输入图像经卷积层Conv_a和卷积层Conv_b输入，卷积层Conv_a的输出与分组卷积Group_Conv输入连接，分组卷积Group_Conv的输出与卷积层Conv_c输入连接，卷积层Conv_b的输出和卷积层Conv_c的输出经concatenate操作拼接处理后作为卷积层Conv_d的输入，卷积层Conv_d的输出为特征图。

5.如权利要求3所述的汽车尾灯状态识别方法，其特征在于，所述空间注意力模块包括全局平均池化层、全局最大池化层、拼接层和卷积层Conv，全局平均池化层和全局最大池化层的输入为所述残差模块输出的特征图，全局平均池化层和全局最大池化层的输出经拼接层拼接处理后作为卷积层Conv的输入，卷积层Conv的输出经sigmoid函数激活操作处理得到注意力权重矩阵。

6.如权利要求1所述的汽车尾灯状态识别方法，其特征在于，灯状态判别网络包括门限循环单元层、时序注意力模块和尾灯状态分类器，门限循环单元层包括两个单层循环结构GRU Layer0和GRU Layer1，时序注意力模块的输入与单层循环结构GRU Layer0连接、输出与单层循环结构GRU Layer1连接，单层循环结构GRU Layer1的输出与尾灯状态分类器连接。

7.如权利要求6所述的汽车尾灯状态识别方法，其特征在于，所述时序注意力模块用于利用全连接层和Softmax激活操作对所述单层循环结构GRU Layer0的输出结果进行时序权重分配，具体计算方式如下：

8.如权利要求1所述的汽车尾灯状态识别方法，其特征在于，所述尾灯状态识别模型的训练步骤包括：

设置所述尾灯状态识别模型的损失函数和学习率；

9.如权利要求8所述的汽车尾灯状态识别方法，其特征在于，所述获取车尾序列样本训练集，包括：

获取不同场景下的尾灯变化视频数据；

根据所述车尾序列样本，构建所述车尾序列样本训练集。

10.如权利要求8所述的汽车尾灯状态识别方法，其特征在于，在所述尾灯状态识别模型的训练过程中，还包括：

使用余弦退火策略对所述学习率进行动态调整。