CN110516573A

CN110516573A - 结合颜色、纹理特征的两阶段烟雾识别卷积神经网络

Info

Publication number: CN110516573A
Application number: CN201910763865.6A
Authority: CN
Inventors: 罗胜
Original assignee: Wenzhou University
Current assignee: Wenzhou University
Priority date: 2019-08-19
Filing date: 2019-08-19
Publication date: 2019-11-29

Abstract

本发明公开了一种结合颜色、纹理特征的两阶段烟雾识别卷积神经网络，网络主要由颜色通道卷积子网络、纹理卷积子网络二部分组成。颜色通道卷积子网络在颜色空间操作，抽取烟雾与非烟雾类间最大差别颜色模式；纹理卷积子网络在纹理空间操作，在颜色通道上抽取形状特征。整个网络的最后一层,包含上层池化而来的特征，还拼合了颜色层、纹理层等中间各层池化后的特征，然后对每通道上的特征全局最大池化成一维向量，再通过sigmoid函数分类判别场景中是否有烟雾和火焰。本发明自动训练生成的颜色通道能覆盖更多的样本；比传统人工抽取特征的方法通用性更强，比通用卷积网络轻，并且准确度更高。

Description

结合颜色、纹理特征的两阶段烟雾识别卷积神经网络

技术领域

本发明涉及烟雾识别技术领域，具体涉及一种结合颜色、纹理特征的两阶段烟雾识别卷积神经网络。

背景技术

火灾对人类生产生活造成巨大损害。火灾预警的时间越迟，人员伤亡就越大，财产损失越高。而烟雾作为火灾初期产生的重要特征，如果能通过视觉装置有效的捕捉到烟雾，就能在火情尚未扩大时提供及时、有效的预警，从而减小人员伤亡和财产损失。由于监控相机易于架设且存在普遍，因此开展基于视觉的烟雾检测/火灾研究具有重要的实际应用意义。

早期的烟雾识别多围绕颜色、纹理以及轮廓等静态特征展开，例如通过分析烟雾像素点的RGB、YCbCr、CIE Lab、HSI、YUV、dark channel等颜色信息建立烟雾识别模型，Yuanproposed several smoke detection methods,which are a fast accumulative motionorientation model based on integral image, histograms of Local Binary Pattern(LBP)and Local Binary Pattern Variance(LBPV)based on pyramids,shape invariant features on multi-scale partitions with AdaBoost and high-order localternary patterns with locality preserving projection。但是烟雾的静态特征变化范围大，例如不同的火源就有不同颜色的烟雾，因此人工抽取的特征难以应对各式各样的烟雾。卷积网络能够自动抽取特征，因此Frizzi、ZHIJIAN Yin、 Mengxia Yin等人采用多层卷积神经网络进行火焰和烟雾检测。但是直接采用传统的深度卷积网络往往结构复杂、参数繁多，样本不充分，不得不采用迁移学习和数据增强，检测效果并不理想。注意到传统方法的有效性，王正来将 RGB和HSI图像输入单路深度残差网络,再两个单路深度残差网络模型获得的特征结合,作为Softmax分类器的输入特征进行训练。Oleksii Maksymiv觉得烟雾的纹理与众不同，因此先采用adaboost和LBP来定位可能区域，然后用传统卷积网络来决定场景中是否存在烟雾。陈俊周等人采用卷积网络生成静态纹理信息，与动态纹理结合降低误检率。Yi Zhao先生成saliency image，再用Alexnet改造而来的卷积网络分析saliencyimage是否有目标。

事实上，烟雾的确在颜色、纹理以及轮廓上具有与众不同的特点，从这些方面的确可以把烟雾从背景中区分出来。早期的研究将注意力放在颜色、纹理以及轮廓上的特征是正确的。从卷积神经网络摄取的特征来看，卷积神经网络也是依据这些信息来进行综合分析的。但是采用通用的卷积神经网络，网络会过于巨大，并且往往样本不充足，并不能发挥深度网络的长处。王正来、Oleksii Maksymi、Yi Zhao意识到颜色、纹理以及轮廓的作用，有意识地将这些信息结合到网络里，但是这些网络往往分成两个部分，第一个部分采用传统方法，第二个部分再采用卷积神经网络来进行判断，工作量较大的同时，精确度较低。

发明内容

为解决上述问题，本发明提供了一种先生成颜色通道、再从颜色通道中生成纹理、形状等空间特征的烟雾识别卷积神经网络。

为实现上述目的，本发明采取的技术方案为：

一种结合颜色、纹理特征的两阶段烟雾识别卷积神经网络，网络主要由颜色通道卷积子网络、纹理卷积子网络二部分组成。颜色通道卷积子网络在颜色空间操作，抽取烟雾与非烟雾类间最大差别颜色模式x_c；纹理卷积子网络在纹理空间操作，在颜色通道上抽取形状特征x_a。整个网络的最后一层,包含上层池化而来的特征，还拼合了颜色层、纹理层等中间各层池化后的特征，然后对每通道上的特征全局最大池化成一维向量，再通过sigmoid函数分类判别场景中是否有烟雾和火焰。

进一步地，所述颜色通道卷积子网络用于对颜色通道用1×1的卷积核求和，然后进行非线性变换，即：

式中，f_k ⁱ为第i层的第k个颜色通道，f_m ^i-1为第i-1层的第m个颜色通道， W_k ^i-1为i-1层到i层的第k个卷积核，W_km ^i-1为第i-1层第m个颜色通道到第i 层第k个颜色通道的第k个卷积核的权重，b_k第i-1层的第k个偏置项，g^i-1为第i-1层的非线性激活函数。

进一步地，所述纹理卷积子网络总每层实现以下功能，

式中，f_km ⁱ为第i层的第k×m个纹理通道，f_m ^i-1为第i-1层的第m个纹理通道，W_km ^i-1为i-1层到i层第m个纹理通道的第k个卷积核，b_km第i-1层的第k×m个偏置项，g^i-1为第i-1层的非线性激活函数。

进一步地，该卷积神经网络通过以下步骤训练所得：

S1、构建训练数据集并完成数据集的预处理：

训练数据集包括两个子集：一个子集是像素级标签的图像，包括有烟有火的图像、有烟无火的图像、无烟有火的图像、无烟无火的图像；另一个子集是图像级标签，包括有烟有火的图像、有烟无火的图像、无烟有火的图像、无烟无火的图像；每个样本在输入网络训练之前，需进行直方图均衡化和尺寸归一化处理；

S2、训练

训练分三个阶段进行：第一阶段用像素级标签训练颜色通道卷积子网络 N1次,第二阶段用像素级标签训练颜色通道卷积子网络和颜色通道卷积子网络、纹理卷积子网络N2次，第三阶段用图像级标签训练整个网络N3次，整个训练按此轮次完成N4轮迭代；具体的：

第一、二阶段训练要使用像素级标签，按像素的特征值计算类别，因此需要在颜色通道卷积子网络、纹理卷积子网络后面插入分类连接层；将颜色通道卷积子网络输出的5个通道用1×1×5×2的卷积成同样大小的2通道图像，再通过softmax非线性函数变换成烟、火的概率；烟、火的损失函数J₁ ^s、J₁ ^f分别为：

式中，s/f是分类结果及标签图像中烟、火两个通道，ij是像素坐标，p_ij ^s/f是像素p_ij在s或者f通道中的概率，L_ij ^s/f是像素p_ij在s或者f通道中的标签，λ₁是加权系数，‖W¹//₂是颜色通道卷积子网络可训练参数的L2范数；

烟、火的检测精度A₁ ^s、A₁ ^f分别为：

式中，N表示图像中像素的数量；

第三阶段采用弱监督的方式用图像级标签训练颜色通道卷积子网络、纹理卷积子网络；将纹理卷积子网络的输出F⁴用1×1×5×2的卷积成同样大小的 2通道图像，再通过softmax非线性函数变换成烟、火的概率；然后与按1/16 降采样的像素级标签图像求差后累加作为烟、火的损失函数J₂ ^s、J₂ ^f：

式中，(s/f)₂是1/16降采样后标签图像中烟、火两个通道，ij是像素坐标，p_ij ^(s/f)2是像素pij在s或者f通道中的概率，L_ij ^(s/f)2是像素p_ij在s或者f 通道中的标签，λ₂是加权系数，‖W²‖₂是颜色通道卷积子网络可训练参数的 L2范数。

本发明具有以下有益效果：

(1)比RGB、YCbCr、CIE Lab、HSI、YUV、dark channel等简单的颜色模型，自动训练生成的颜色通道能覆盖更多的样本；

(2)比采用通用的卷积神经网络指向性明确，简单的网络具有更好的性能，轻型网络也意味着不大的数据依赖；

(3)比传统人工抽取特征的方法通用性更强，比通用卷积网络轻，并且准确度更高。

附图说明

图1为本发明实施例一种结合颜色、纹理特征的两阶段烟雾识别卷积神经网络的结构示意图。

图2为本发明实施例的训练流程图。

具体实施方式

下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明，但不以任何形式限制本发明。应当指出的是，对本领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干变形和改进。这些都属于本发明的保护范围。

如图1和表1所示，本发明实施例提供了一种结合颜色、纹理特征的两阶段烟雾识别卷积神经网络，该卷积神经网络包括颜色通道卷积子网络和纹理卷积子网络，由于烟雾往往叠加在场景之上，图像像素值由烟雾和场景加权而成，因此每个像素加[烟雾，非烟雾]的标签比较困难，并且样本数量巨大，因此采用弱监督方式训练。网络的最后一层除了上层max pooling而来的特征，还拼合了输入层、颜色层、纹理层等中间各层经max pooling后的特征，然后对每通道上的特征全局最池化成一维向量，再分类判别场景中是否有烟雾和火焰。颜色通道卷积子网络在颜色空间操作，抽取烟雾与非烟雾类间差别最大的颜色模式；纹理卷积子网络在纹理空间操作，在颜色通道上抽取形状特征；

表1网络结构

该卷积神经网络采用GAP+CAM的弱监督训练方式，仅标注图像[烟雾，非烟雾]，将输入图像、颜色通道卷积子网络和纹理卷积子网络的信息池化后拼合起来，在全局池化成45维的向量后，由该向量全连接，判断场景中是否存在烟雾；

特征拼合层

将颜色通道卷积子网络的输出、纹理卷积子网络各池化层的输出，分别按相应尺寸最大池化到纹理卷积子网络最后特征图大小，然后拼合成230通道的特征层,即：

f¹⁹＝[MP₁₆(f⁴)MP₈(f⁷)MP₄(f¹⁰)MP₂(f¹⁴)f¹⁸]

式中，f⁴、f⁷、f¹⁰、f¹⁴、f¹⁸、f¹⁹分别是颜色通道卷积子网络的输出特征、纹理卷积子网络中第1、2、3、4次池化后的特征和拼合后的特征，MP₁₆、MP₈、MP₄、 MP₂表示对各种尺寸的特征分别按16×16、8×8、4×4、2×2的尺寸池化。

全局最大池化

采用全局最大池化。全局最大池化从二维的特征图中选择最大的值作为池化结果，将二维特征转变成一维的标量，将特征拼合层转变成230维的向量。

式中，f_m ²⁰是在第20个特征层上第m个通道，f_j，m ¹⁹是在第19个特征层上第m 个特征图(16×16)上第j个点的特征值，m是特征通道。

特征分类

我们采用了全连接层来分辨样本是否包含烟雾。一般而言，全连接层包含了网络中的大多层参数，容易过拟合。在训练中加入dropout来降低过拟合，提高网络的泛化能力。第21层的全连接层如下式所示：

检测到的烟雾概率为：

式中，p_s是烟雾概率，f²¹是第21层输出的一维特征，f₀ ²¹和L₀是sigmoid函数的偏置、倍数项。

烟、火共生检测

为了提高烟雾的检测精度，网络同时检测烟、火，在全局平均池化层后分别输出图像中有烟、火的概率。

损失函数

我们采用检测出的烟雾概率p_s和类别标签L_s构成网络的损失函数

式中，||W^A||₂是网络中所有可训练参数的L₂范数，λ_A是权重系数。式中的第二项可以让参数迭代过程变得光滑，限制参数空间。

采用随机梯度下降和BP方法，按下式调整网络参数W：

式中，t是迭代次数，W_t+1、W_t分别是第t+1、t轮迭代时的网络参数,V_t+1、V_t分别是参数调整量，M_u为动量，一般为0.9，L_r为学习率，是参数梯度。

颜色通道卷积子网络

所述颜色通道卷积子网络采用1×1×3×9、1×1×9×36、1×1×36×11 和1×1×11×5共4层卷积网络进行颜色变换，找到烟雾与非烟雾类间差别最大的颜色通道fⁱ，过程如图2所示。图2最右的两个虚线框是烟雾、火焰的概率图，分别表示仅根据颜色特征判别图像中每个像素是否是烟雾、火焰的概率。

所述颜色通道卷积子网络用于对颜色通道用1×1的卷积核求和，然后进行非线性变换，即：

式中，f_k ⁱ为第i层的第k个颜色通道，f_m ^i-1为第i-1层的第m个颜色通道，W_k ^i-1为i-1层到i层的第k个卷积核，W_km ^i-1为第i-1层第m个颜色通道到第i层第k个颜色通道的第k个卷积核的权重，b_k第i-1层的第k个偏置项， g^i-1为第i-1层的非线性激活函数。

纹理卷积子网络

所述纹理卷积子网络在每个颜色通道用独立的卷积核卷积，只在空间维度上抽取特征，而没有通道间的混合,为了丰富纹理特征，纹理卷积子网络会在每层先将每个颜色通道扩展为2-3个颜色通道，然后扩大感受野。所述纹理卷积子网络总共4层，每层有2-3次卷积操作、1个池化操作，卷积核都是3×3 大小，每次卷积操作后都要批正则化，然后采用sigmoid函数激活。

所述纹理卷积子网络总每层实现以下功能，

式中，f_km ⁱ为第i层的第k×m个纹理通道，f_m ^i-1为第i-1层的第m个纹理通道，W_km ^i-1为i-1层到i层第m个纹理通道的第k个卷积核，b_km第i-1层的第 k×m个偏置项，g^i-1为第i-1层的非线性激活函数。卷积操作如所示。

如图2所述，该卷积神经网络通过以下步骤训练所得：

训练分三个阶段进行：第一阶段用像素级标签训练颜色通道卷积子网络 N1次,第二阶段用像素级标签训练颜色通道卷积子网络和颜色通道卷积子网络、纹理卷积子网络N2次，第三阶段用图像级标签训练整个网络N3次。整个训练按此轮次完成N4轮迭代。

第一、二阶段训练要使用像素级标签，按像素的特征值计算类别，因此需要在颜色通道卷积子网络、纹理卷积子网络后面插入分类连接层。将颜色通道卷积子网络输出的5个通道用1×1×5×2的卷积成同样大小的2通道图像，再通过softmax非线性函数变换成烟、火的概率。烟、火的损失函数J₁ ^s、J₁ ^f分别为：

式中，s/f是分类结果及标签图像中烟、火两个通道，ij是像素坐标，p_ij ^s/f是像素p_ij在s或者f通道中的概率，L_ij ^s/f是像素p_ij在s或者f通道中的标签，λ₁是加权系数，‖W¹//₂是颜色通道卷积子网络可训练参数的L2范数。

烟、火的检测精度A₁ ^s、A₁ ^f分别为：

式中，N表示图像中像素的数量。

第三阶段采用弱监督的方式用图像级标签训练颜色通道卷积子网络、纹理卷积子网络。将纹理卷积子网络的输出F⁴用1×1×5×2的卷积成同样大小的 2通道图像，再通过softmax非线性函数变换成烟、火的概率。然后与按1/16 降采样的像素级标签图像求差后累加作为烟、火的损失函数J₂ ^s、J₂ ^f：

式中，(s/f)₂是1/16降采样后标签图像中烟、火两个通道，ij是像素坐标，p_ij ^(s/f)2是像素pij在s或者f通道中的概率，L_ij ^(s/f)2是像素p_ij在s或者f 通道中的标签，λ₂是加权系数，‖W²‖₂是颜色通道卷积子网络可训练参数的L2范数。

以上对本发明的具体实施例进行了描述。需要理解的是，本发明并不局限于上述特定实施方式，本领域技术人员可以在权利要求的范围内做出各种变化或修改，这并不影响本发明的实质内容。在不冲突的情况下，本申请的实施例和实施例中的特征可以任意相互组合。

Claims

1.一种结合颜色、纹理特征的两阶段烟雾识别卷积神经网络，其特征在于：该卷积神经网络包括颜色通道卷积子网络和纹理卷积子网络，颜色通道卷积子网络在颜色空间操作，抽取烟雾与非烟雾类间差别最大的颜色模式；纹理卷积子网络在纹理空间操作，在颜色通道上抽取形状特征；该卷积神经网络采用GAP+CAM的弱监督训练方式，仅标注图像[烟雾，非烟雾]，将输入图像、颜色通道卷积子网络和纹理卷积子网络的信息池化后拼合起来，在全局池化成45维的向量后，由该向量全连接，判断场景中是否存在烟雾。

2.如权利要求1所述的一种结合颜色、纹理特征的两阶段烟雾识别卷积神经网络，其特征在于：所述颜色通道卷积子网络用于对颜色通道用1×1的卷积核求和，然后进行非线性变换，即：

式中，f_k ⁱ为第i层的第k个颜色通道，f_m ^i-1为第i-1层的第m个颜色通道，W_k ^i-1为i-1层到i层的第k个卷积核，W_km ^i-1为第i-1层第m个颜色通道到第i层第k个颜色通道的第k个卷积核的权重，b_k第i-1层的第k个偏置项，g^i-1为第i-1层的非线性激活函数。

3.如权利要求1所述的一种结合颜色、纹理特征的两阶段烟雾识别卷积神经网络，其特征在于：所述纹理卷积子网络总每层实现以下功能，

4.如权利要求1所述的一种结合颜色、纹理特征的两阶段烟雾识别卷积神经网络，其特征在于：该卷积神经网络通过以下步骤训练所得：

S1、构建训练数据集并完成数据集的预处理：

S2、训练

训练分三个阶段进行：第一阶段用像素级标签训练颜色通道卷积子网络N1次,第二阶段用像素级标签训练颜色通道卷积子网络和颜色通道卷积子网络、纹理卷积子网络N2次，第三阶段用图像级标签训练整个网络N3次，整个训练按此轮次完成N4轮迭代；具体的：

式中，s/f是分类结果及标签图像中烟、火两个通道，ij是像素坐标，p_ij ^s/f是像素p_ij在s或者f通道中的概率，L_ij ^s/f是像素p_ij在s或者f通道中的标签，λ₁是加权系数，‖W¹‖₂是颜色通道卷积子网络可训练参数的L2范数；

烟、火的检测精度A₁ ^s、A₁ ^f分别为：

式中，N表示图像中像素的数量；

第三阶段采用弱监督的方式用图像级标签训练颜色通道卷积子网络、纹理卷积子网络；将纹理卷积子网络的输出F⁴用1×1×5×2的卷积成同样大小的2通道图像，再通过softmax非线性函数变换成烟、火的概率；然后与按1/16降采样的像素级标签图像求差后累加作为烟、火的损失函数J₂ ^s、J₂ ^f：

式中，(s/f)₂是1/16降采样后标签图像中烟、火两个通道，ij是像素坐标，p_ij ^(s/f)2是像素pij在s或者f通道中的概率，L_ij ^(s/f)2是像素p_ij在s或者f通道中的标签，λ₂是加权系数，‖W²‖₂是颜色通道卷积子网络可训练参数的L2范数。