CN110363104A

CN110363104A - 一种柴油黑烟车的检测方法

Info

Publication number: CN110363104A
Application number: CN201910550952.3A
Authority: CN
Inventors: 康宇; 王晓栋; 李泽瑞
Original assignee: University of Science and Technology of China USTC
Current assignee: University of Science and Technology of China USTC
Priority date: 2019-06-24
Filing date: 2019-06-24
Publication date: 2019-10-22
Anticipated expiration: 2039-06-24
Also published as: CN110363104B

Abstract

本发明公开了一种柴油黑烟车的检测方法，属于环境检测技术领域，包括利用道路的监控图片构建黑烟车样本数据集，并在监控图片中标注出黑烟车位置所在的矩形边界框；对监控图片上标注的矩形边界框使用k‑均值聚类算法，计算出包含柴油黑烟车的先验框；利用监控图片和包含柴油黑烟车的先验框，对构建的目标检测模型进行训练，得到训练好的模型；利用训练好的模型对待检测的监控图片进行检测，判断待检测监控图片中是否存在黑烟车。本发明在新的数据集中聚类得到先验框，更有利于对监控图片中目标的定位，通过预测矩形边界框相对于先验框的偏移值，提高了网络的召回率，增强网络的检测能力。

Description

一种柴油黑烟车的检测方法

技术领域

本发明涉及环境检测技术领域，特别涉及一种柴油黑烟车的检测方法。

背景技术

柴油车所排放的黑烟废气中含有约两百种不同的化合物，是造成细颗粒物、光化学烟雾污染的主要原因之一。综合考虑柴油车行驶里程和排放系数，一辆无法达到国三排放标准或更低排放标准的柴油车的氮氧化物和细颗粒物排放量，相当于两百多辆国四排放标准小轿车排放量之和。

基于烟雾具有视觉模糊特性、半透明特性、微粒特性和扩散运动特性，近年来有许多专家学者针对烟雾检测提出了很多相关工作。翟文鹏等根据视频烟雾的颜色特征以及烟雾运动的扩散性，提出一种基于颜色特征和运动特征的视频烟雾探测方法：首先利用光流场法进行运动检测提取烟雾区域，然后对提取的烟雾区域进行烟雾运动相对稳定性分析和烟雾运动局部不规则分析，结合烟雾的颜色特征，在给定的阈值条件下进行烟雾检测。

由于烟雾会遮挡图片的纹理和边缘，导致图片的高频信息减少，其主要反映在小波域的烟雾图片在小波高频能量会减少。基于这一特性，吴爱国等提出了利用混合高斯模型提取烟雾区域，然后对小波变化分析烟雾区域得到烟雾判别输出的静态特征和动态特征相结合的烟雾检测方法。

以上烟雾检测方法主要存在以下两点不足：

(1)之前已开展的绝大多数研究工作都是针对森林火灾或者工厂烟囱排放烟雾的高空视角，其应用场景中的运动干扰物较少，背景相对固定，使之难以成为适用于各种场景的通用烟雾检测方法。

例如本发明所涉及的自然条件下的交通道口监控摄像机工作场景，其中存在光照变化频繁剧烈，路面颜色灰暗，水渍污渍遍布，道路旁杂物较多，车辆间存在相互遮挡，烟羽轮廓面积多变等问题。传统烟雾检测算法所使用的基于经验阈值和实验统计阈值的人工特征提取方法，如人工设计建模烟雾的颜色特征、频域特征、纹理特征等，难以胜任如此复杂场景下的检测任务。

(2)传统方法所设计的机器学习算法的所有计算任务都只能部署在CPU上进行，实时性很差，难以根据具体的应用场景进行特定优化以及支持GPU并行计算加速。

发明内容

本发明的目的在于克服上述背景技术中的缺陷，以提供一种适用于自然条件下的交通道口监控摄像机工作场景的烟雾检测方法。

为实现以上目的，本发明采用一种柴油黑烟车检测方法，包括如下步骤：

利用道路的监控图片构建黑烟车样本数据集，并在监控图片中标注出黑烟车位置所在的矩形边界框；

构建目标检测模型，并对监控图片上标注的矩形边界框使用k-均值聚类算法，计算出包含柴油黑烟车的先验框；

利用监控图片和包含柴油黑烟车的先验框，对构建的目标检测模型进行训练，得到训练好的模型；

利用训练好的模型对待检测的监控图片进行检测，判断待检测监控图片中是否存在黑烟车。

进一步地，所述利用道路的监控图片构建黑烟车样本数据集，并在监控图片中标注出黑烟车位置所在的矩形边界框，包括：

将所述样本数据集中的监控图片划分为训练集、验证集和测试集；

在训练集、验证集和测试集中包含的监控图片中标注出黑烟车位置所在的矩形边界框，并将矩形边界框的中心点坐标(x，y)、矩形边界框的宽w和矩形边界框的高h作为图片标签；

将图片标签相对于所述监控图片尺寸批归一化到(0，1)之间，并将批归一化后的图片标签保存在与所述监控图片同名的xml格式文件中，其中，批归一化后的图片标签包括归一化后的中心点坐标、归一化后的宽度值和归一化后的高度值；

在所述监控图片中存在黑烟车的检测结果，将类别标签c定义为数字类别1，在所述监控图片中不存在黑烟车的检测结果，将类别标签c 定义为数字类别0；

将图片标签和存储路径保存在与所述监控图片同名的txt文件中。

进一步地，所述训练集、验证集和测试集中包含的监控图片的数量比例为8:1:1，所有监控图片中存在柴油黑烟车的图片数量和不存在柴油黑烟车的图片数量之比为1:1，其中：

所述验证集中的监控图片用于对所述训练后的模型的性能进行验证，得到验证后的模型；

所述测试集中的监控图片用于对所述验证后的模型进行再次验证，得到最终的目标检测模型。

进一步地，在所述利用道路的监控图片构建黑烟车样本数据集之后，还包括：

采用数据增强方法对所述样本数据集中的监控图片进行扩充。

进一步地，所述目标检测模型的结构包括：骨干网络、空间金字塔池化、特征金字塔网络以及检测层，骨干网络的输出依次连接空间金字塔池化、特征金字塔网络以及检测层；

骨干网络的输入为经过缩放的所述监控图片、输出为所述监控图片的特征图，空间金字塔池化的输入为所述监控图片的特征图、输出为相同大小和通道数的特征图，特征金字塔网络的输入为经过空间金字塔池化的特征图，输出为经过多层融合的特征图，检测层的输入为经过多层融合的特征图、输出为包含分类结果、类别置信度和预测框坐标的特征向量。

进一步地，在所述利用监控图片和包含柴油黑烟车的先验框，对构建的目标检测模型进行训练，得到训练好的模型之前，还包括：

使用ImageNet分类数据集对所述目标检测模型中的特征提取网络进行预训练，以得到预训练后的模型；

相应地，利用监控图片和包含柴油黑烟车的先验框，对预训练后的模型进行训练，得到训练好的模型。

进一步地，所述构建目标检测模型，并对监控图片上标注的矩形边界框使用k-均值聚类算法，计算出包含柴油黑烟车的先验框，包括：

事先定义不同尺寸的先验框，并从与所述监控图片对应的xml格式文件中读取所述归一化后的宽度值和所述归一化后的高度值；

将所述归一化后的宽度值和所述归一化后的高度值分别乘以所述批归一化时的缩放系数，得到所述矩形边界框；

统计k个先验框分别与所述矩形边界框的重叠面积，并将所述重叠面积作为距离度量，聚类提取出包含柴油黑烟车的先验框。

进一步地，将监控图片中标注出的矩形边界框作为真值框，所述利用监控图片和包含柴油黑烟车的先验框，对构建的目标检测模型进行训练，得到训练好的模型，包括：

利用所述预训练后的特征提取网络对输入的所述训练集中的监控图片进行特征提取，得到特征图；

利用所述包含柴油黑烟车的先验框对特征图进行预测，得到预测框，该预测框中包含目标定位信息、含有目标的概率信息以及存在柴油黑烟车的条件概率信息，目标定位信息包括所述真值框的中心点坐标相对于所述先验框的偏移坐标和所述真值框的宽和高；

根据所述预测框与所述真值框的重叠面积和所述预测框含有目标的概率信息，计算目标置信度；

将目标置信度小于置信度值阈值的预测框滤除，得到筛选后的预测框；

利用非极大值抑制算法将所述筛选后的预测框进行合并重叠，得到剩余的预测框；

计算剩余的预测框内目标的类别置信度，若类别置信度大于设定的类别置信度阈值，则确定该预测框对应的监控图片中含有柴油黑烟车。

进一步地，所述目标检测模型的总损失函数为：

其中，l表示各子损失函数，W和H分别表示所述特征图的宽和高； A指所述先验框的数量，C表示类别数量，上角标中o表示目标，r表示先验框坐标，k表示先验框编号，c表示类别标签，truth表示与所述真值框相匹配，下角标中t表示迭代次数，K表示编号为K的ground truth 真值框，noobj表示先验框中不存在目标，prior表示先验框，coord表示坐标，obj表示存在目标，class表示类别，i、j表示编号为k的先验框中的某个像素点(i，j)，λ_noobj表示背景置信度损失函数的权重系数，λ_prior表示先验框prior与预测框b坐标损失函数的权重系数，λ_coord表示负责预测的先验框所得到的预测框与标签边界框坐标损失函数的权重系数， λ_obj表示目标置信度损失函数的权重系数，λ_class表示分类损失函数的权重系数，项损失函数表示计算背景的置信度误差，先验框中无目标的置信度误差为项表示计算先验框 prior与预测框b的坐标损失函数，项表示计算与某个真值框ground truth匹配的预测框的定位误差； (项表示计算目标置信度误差； )表示计算分类误差，*表示乘积。

进一步地，在GPU平台上运行所述柴油黑烟车的检测方法。

与现有技术相比，本发明存在以下技术效果：本发明针对柴油黑烟车这一特定目标，使用k-均值聚类算法对监控图片上标注出的矩形边界框即真值框进行聚类，得到包含有柴油黑烟车的先验框，以用于目标检测模型中对监控图片中目标的定位。与传统的人工设计先验框相比，本方案不再直接预测边界框的尺寸，而是在新的数据集中聚类得到先验框，更有利于对监控图片中目标的定位，在利用目标检测模型进行目标预测时，不直接预测目标的位置和其矩形边界框的大小，而是预测矩形边界框相对于先验框的偏移值，从而大大提高了网络的召回率，增强网络的检测能力。

附图说明

下面结合附图，对本发明的具体实施方式进行详细描述：

图1是一种柴油黑烟车的检测方法的流程示意图；

图2是本方案对应的检测原理框图；

图3是柴油黑烟车检测示例图；

图4是目标检测模型的结构示意图。

具体实施方式

为了更进一步说明本发明的特征，请参阅以下有关本发明的详细说明与附图。所附图仅供参考与说明之用，并非用来对本发明的保护范围加以限制。

如图1所示，本实施例公开了一种柴油黑烟车的检测方法，包括如下步骤S1至S4：

S1、利用道路的监控图片构建黑烟车样本数据集，并在监控图片中标注出黑烟车位置所在的矩形边界框；

S2、构建目标检测模型，并对监控图片上标注的矩形边界框使用k- 均值聚类算法，计算出包含柴油黑烟车的先验框；

S3、利用监控图片和包含柴油黑烟车的先验框，对构建的目标检测模型进行训练，得到训练好的模型；

S4、利用训练好的模型对待检测的监控图片进行检测，判断待检测监控图片中是否存在黑烟车。

其中，在步骤S1中：首先获取微调目标检测模型所需的监控图片及其与监控图片对应的图片标签。本实施例使用的交通道口监控摄像机视角下的真实监控图片均由位于安徽省合肥市G312国道和新桥大道交口自西向东和自东向西的数台电子警察摄像机所拍摄。

具体地，将所拍摄到的监控视频按每秒五帧，逐帧提取成单幅监控图片后，按照拍摄时间对监控图片进行重命名，并将所有监控图片按照 8：1：1的比例划分为训练集、验证集和测试集，同时保证所有监控图片中存在柴油黑烟车的图片数量与图片中不存在柴油黑烟车的图片数量之比为1：1。其中，训练集中的监控图片用于对构建的目标检测模型进行训练，得到训练后的模型；验证集中的监控图片用于对所述训练后的模型的性能进行验证，得到验证后的模型；测试集中的监控图片用于对所述验证后的模型进行再次验证，得到最终的目标检测模型。

具体地，图片的标签为所提取的每张监控图片中的包含柴油黑烟车尾部及烟羽的完整轮廓的矩形边界框的中心点坐标(x,y)、边界框的宽高 (w,h)及其类别标签c。同时，将前四个参数(x,y)，(w,h)都相对于原始图片尺寸批归一化到(0,1)之间，保存在与监控图片同名的xml格式文件中。若该目标区域中存在柴油黑烟车，则将该监控图片的类别标签定义为数字类别1，即存在柴油黑烟车；若监控图片中不存在柴油黑烟车，则将监控图片的类别标签定义为数字类别0；最后，将该监控图片的标签和路径保存在与监控图片同名的txt格式文件中，编码格式为UTF-8，便于在标准化流程中训练模型时，读取图片的标签数据。

需要说明的是，为了加快网络训练时的收敛速度，降低网络过拟合，提高网络的泛化能力，本实施例引入批归一化层。批归一化是一种网络正则化方法，该算法是指在网络的每一层输入之前插入一个归一化层，该层通过求取输入数据的均值和方差，对输入网络的小批量数据进行归一化：对该批监控图片的各特征向量分别进行归一化处理，分别使每个特征的数据分布变换为均值0，方差1，从而使得每一批训练样本在每一层都有类似的分布。还可对上一步的输出再做一次线性变换，假设上一步的输出为Z，则Z1＝γZ+β。这里γ、β是可以训练的参数。通过引入可学习参数γ、β还原输入数据的分布，经过处理的数据再被送入下一层网络。

进一步地，由于目标检测模型训练需要大量的监控图片，但是从交通道口监控摄像机视角下的真实监控图片，含有柴油黑烟车的图片数量较少，难以满足目标检测模型训练时对于训练数据的需求。本实施例在小样本情况下，通过多种数据增强方法，比如平移、旋转、镜像、裁剪、缩放、颜色抖动，添加椒盐噪声和高斯噪音干扰等，对样本数据集进行扩充，以大幅提高网络泛化能力。

进一步地，如图4所示，上述步骤S2中所构建的目标检测模型的结构包括：骨干网络、空间金字塔池化、特征金字塔网络以及检测层，骨干网络的输出依次连接空间金字塔池化、特征金字塔网络以及检测层；

其中，骨干网络，一般为全卷积网络，用于提取特征，输入为经过放缩的原图，输出为经过全卷积网络提取的特征图；空间金字塔池化，由最大池化层和1×1卷积核组成，输入为经过全卷积网络提取的特征图，输出为相同大小和通道数的特征图；特征金字塔网络，使用2倍上采样融合多层特征，改进骨干网络的特征提取效果，增强网络对小目标(一般为小于32×32的物体)的检测效果，输入为经过空间金字塔池化的特征图，输出为经过多层融合的特征图；检测层，由批归一化层和全连接层组成，输入为经过多层融合的特征图，输出为包含分类结果、类别置信度和预测框坐标的特征向量。

与现有技术相比，本实施例通过修改目标检测模型的网络结构，将锚点重新设置在车辆尾部，面向摄像机的三条车道上，修改卷积方式是指将卷积层中使用的标准3×3卷积核，替换为深度分离的3×3卷积与 1×1卷积的组合。深度分离的卷积核数量等于输入特征图的数量，每个卷积核只负责一个特征图，即只作用于单通道，之后再使用1×1卷积作用于所有3×3深度分离卷积输出的特征图，之后再通过激活函数。本方案中将传统模型网络结构中的23个卷积层压缩为10个，通过修改网络结构，使得构建的目标检测模型变得更小，参数更少，更少的参数在做检测时运算量更少，以提高计算速度。

进一步地，在上述步骤S3：利用监控图片和包含柴油黑烟车的先验框，对构建的目标检测模型进行训练，得到训练好的模型之前，还包括：

上述步骤S2中，对监控图片上标注的矩形边界框使用k-均值聚类算法，计算出包含柴油黑烟车的先验框，具体包括如下细分步骤S21至 S23：

S21、事先定义不同尺寸的先验框，并从与所述监控图片对应的xml 格式文件中读取所述归一化后的宽度值和所述归一化后的高度值；

S22、将所述归一化后的宽度值和所述归一化后的高度值分别乘以所述批归一化时的缩放系数，得到所述矩形边界框；

S23、统计k个先验框分别与所述矩形边界框的重叠面积，并将所述重叠面积作为距离度量，聚类提取出包含柴油黑烟车的先验框。

具体地，定义的聚类距离度量公式为：

d(box，centroid)＝1-IOU(box，centroid)，

其中，d表示计算聚类距离指标，box表示标签中的每个矩形边界框，centroid表示从矩形边界框中挑选出的聚类中心框， IOU(box，centroid)表示标签中的边界框与聚类中心框的重叠面积即距离度量，且IOU(box，centroid)值与边界框的尺寸无关。

需要说明的是，本方案相比于使用人工设计的先验框，在新的数据集上聚类得到的先验框更有助于对目标的定位，使得柴油黑烟车的检测精度更高，漏检率更低。

优选地，由于k-均值聚类算法对聚类中心初值的选取十分敏感，因此聚类中心的选取过程为：首先统计图片标签中所有矩形边界框的大小，得到聚类距离尽可能大(即d(box，centroid)≈1)的三个矩形边界框作为初始聚类中心框，使得共享同一初始聚类中心框的ground truth真值框的相似性尽可能大，同时不共享同一初始聚类中心框的ground truth 真值框的差异性也尽可能地大，加快网络收敛速度，提升模型预测精度。

进一步地，本实施例在训练目标检测模型时，通过最小优化误差函数中的定位误差、目标误差和分类误差，并使用带动量的随机梯度下降法更新权重参数，最终保存训练好的模型参数到权重文件中。具体地，上述步骤S3：利用监控图片和包含柴油黑烟车的先验框，对构建的目标检测模型进行训练，得到训练好的模型，包括如下细分步骤S31至S36：

S31、利用所述预训练后的特征提取网络对输入的所述训练集中的监控图片进行特征提取，得到特征图；

S32、利用所述包含柴油黑烟车的先验框对特征图进行预测，得到预测框，该预测框中包含目标定位信息、含有目标的概率信息以及存在柴油黑烟车的条件概率信息，目标定位信息包括所述真值框的中心点坐标相对于所述先验框的偏移坐标和所述真值框的宽和高；

S33、根据所述预测框与所述真值框的重叠面积和所述预测框含有目标的概率信息，计算目标置信度；

S34、将目标置信度小于置信度值阈值的预测框滤除，得到筛选后的预测框；

S35、利用非极大值抑制算法将所述筛选后的预测框进行合并重叠，得到剩余的预测框；

S36、计算剩余的预测框内目标的类别置信度，若类别置信度大于设定的类别置信度阈值，则确定该预测框对应的监控图片中含有柴油黑烟车。

具体地，本实施例中利用与训练得到的模型参数对全卷积层网络即特征提取网络进行初始化，之后输入训练集中的监控图片，并对输入的监控图片进行缩放，通过短边补零的操作，保持输入的监控图片的宽高比，并进行多尺度训练，将输入的监控图片缩放为320×320像素大小，以在预测时通过使用320×320这种像素更少的监控图片，减少算法用时。

训练时利用特征提取网络对输入的监控图片进行特征提取，通过卷积核滑动补偿以及池化操作，对特征图进行下采样，得到13×13大小的特征图。在得到的13×13大小的特征图的每个单元格上使用先验框分别预测3个预测框，由于目标检测模型的检测结果只有一类即存在黑烟，因此总共得到507个预测框。

在预测框计算过程中，对于某个矩形边界框，首先要确定其中心点落在13×13大小的特征图的那个单元格上，然后计算这个单元格的3 个先验框与矩形边界框的占空比。特别地，计算占空比时不考虑坐标，只考虑形状，此处取原点，然后计算对应的占空比，占空比最大的先验框与矩形边界框匹配，其所对应的预测框负责预测相应的矩形边界框。

这些预测框中包含目标定位信息、含有目标的概率信息Pr(Object) 以及存在柴油黑烟车的条件概率信息(Pr(Smoke|Object))，目标定位信息包括所述真值框的中心点坐标相对于所述先验框的偏移坐标和所述真值框的宽和高。

具体地，上述步骤S33中，目标置信度的计算公式为：

其中，Pr(Object)表示预测框内含有目标的概率，表示预测框与标签边界框即真值框ground truth的重叠面积，*表示乘积。若预测框内含有目标，则Pr(Object)＝1，该预测框的目标置信度为否则，Pr(Object)＝0，认为预测框中没有目标，Conf(Object)＝0。

具体地，上述步骤S34中，对于所得到的507个预测框，将置信度小于预先设定的置信度阈值(该处的置信度阈值可取值为0.5)的预测框滤除，得到筛选后的预测框，使得每个真值框ground truth有且仅有一个预测框与之对应。

具体地，上述步骤S35中，利用非极大值抑制算法(Non-Maximum Suppression，NMS)对筛选后的预测框进行处理，合并占空比大于占空比阈值(该处的占空比阈值可取值为0.45)的预测框即冗余框，得到剩余的预测框。其中，NMS算法在许多计算机视觉任务中均有应用，比如边缘检测、人脸识别、目标检测等。在目标检测算法得到很多预测框后，对这些预测框的目标置信度得分进行排序，选中最高分及其对应的预测框，之后遍历剩余的预测框，若和当前最高分对应的预测框的重叠面积大于占空比阈值，就将预测框删除，小于占空比阈值的预测框则保留。本实施例中在目标检测过程中将其作为一种后处理算法，用于去除冗余的重叠预测框。

具体地，上述步骤S36中，网络使用二分类交叉熵损失函数如下所示：

Pr(Smoke|Object)＝一[y×log(p)+(1-y)×log(1-p)]

上式给出预测框内是否存在柴油黑烟车的条件概率 Pr(Smoke|Object)的计算方法。其中，y表示预测框的类别标签，若为正类，则y＝1，即预测框内存在柴油黑烟车；若为负类，则y＝0，即预测框内不存在柴油黑烟车，p表示预测框的标签预测为正的概率。

然后计算预测框内目标的类别置信度Conf，类别置信度Conf的计算公式为：

本实施例中将预测框的类别置信度与预先设定的类别置信度阈值 (该处的类别置信度阈值可取值为0.5)进行比较，若预测框的类别置信度大于类别置信度阈值，则判断对应的监控图片中存在柴油黑烟车，并得到监控图片中柴油黑烟车预测框的位置坐标。

优选地，在确定监控图片中存在柴油黑烟车时，根据该监控图片上矩形边界框的坐标，将包含柴油黑烟车尾部及烟羽完整轮廓的矩形区域裁剪保存为与监控图片同名的jpg格式文件中。

进一步地，模型的总损失函数loss_t的计算公式如下：

其中，l表示各子损失函数，W和H分别表示网络输出大小为13× 13特征图的宽和高，A指先验框的数量，特别地，此处等于3。C表示类别数量；上角标中o表示目标，r表示先验框坐标，k表示先验框编号， c表示类别标签，truth表示与标签边界框相匹配；下角标中t表示迭代次数，K表示编号为K的ground truth真值框，noobj表示先验框中无目标即背景，prior表示先验框，coord表示坐标，obj表示存在目标，class 表示类别，i、j表示编号为k的先验框中的某个像素点(训。

不同的λ表示不同子损失函数的权重系数，λ_noobj表示背景置信度损失函数的权重，λ_prior表示先验框prior与预测框b坐标损失函数的权重系数，λ_coord表示负责预测的先验框所得到的预测框与标签边界框坐标损失函数的权重系数，λ_obj表示目标置信度损失函数的权重系数，λ_class表示分类损失函数的权重系数。项损失函数表示计算背景的置信度误差，需要先计算各个预测框和所有矩形边界框的占空比，并求取最大的占空比Max IOU。若该项值小于设定的占空比阈值Thresh，特别地，该占空比阈值取0.45，那么该预测框就会被标记为背景，即不存在柴油黑烟车，从而需要计算noobj 无目标的置信度误差项表示计算先验框prior与预测框b的坐标损失函数，且只在前 12800次迭代中计算，使得目标检测模型可以在训练前期使预测框快速学习先验框的形状。项表示计算与某个矩形边界框即真值框ground truth匹配的预测框的定位误差； (项表示计算目标置信度误差； )表示计算分类误差。

特别地，在计算是否存在目标置信度时，若存在目标，则目标置信度损失函数的权重系数λ_obj取值为1，当求取目标置信度误差时，目标置信度应取预测框与矩形边界框的真实占空比大小，对于那些没有与矩形边界框匹配的先验框所得到的预测框，那些最大占空比低于占空比阈值的被视作背景，其它全部忽略，不进行任何误差计算。

优选地，本实施例中将改进后的目标检测算法部署在图形处理器 (GraphicsProcessing Unit，GPU)，用于解决城市交通道口监控摄像头视角下的柴油黑烟车的实时检测问题，利用统一计算设备架构(Compute Unified Device Architecture，CUDA)和对DNN的GPU加速库(CUDA Deep Neural Network，CUDNN)加速库使算法可以并行运算，减少了计算耗时。

以上所述仅为本发明的较佳实施例，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种柴油黑烟车的检测方法，其特征在于，包括：

2.如权利要求1所述的柴油黑烟车的检测方法，其特征在于，所述利用道路的监控图片构建黑烟车样本数据集，并在监控图片中标注出黑烟车位置所在的矩形边界框，包括：

在训练集、验证集和测试集中包含的监控图片中标注出黑烟车位置所在的矩形边界框，并将矩形边界框的中心点坐标(x，y)、矩形边界框的宽w、矩形边界框的高h以及类别标签c作为图片标签；

在所述监控图片中存在黑烟车的检测结果，将类别标签c定义为数字类别1，在所述监控图片中不存在黑烟车的检测结果，将类别标签c定义为数字类别0；

3.如权利要求2所述的柴油黑烟车的检测方法，其特征在于，所述训练集、验证集和测试集中包含的监控图片的数量比例为8:1:1，所有监控图片中存在柴油黑烟车的图片数量和不存在柴油黑烟车的图片数量之比为1:1，其中：

4.如权利要求3所述的柴油黑烟车的检测方法，其特征在于，在所述利用道路的监控图片构建黑烟车样本数据集之后，还包括：

5.如权利要求2所述的柴油黑烟车的检测方法，其特征在于，所述目标检测模型的结构包括：骨干网络、空间金字塔池化、特征金字塔网络以及检测层，骨干网络的输出依次连接空间金字塔池化、特征金字塔网络以及检测层；

6.如权利要求5所述的柴油黑烟车的检测方法，其特征在于，在所述利用监控图片和包含柴油黑烟车的先验框，对构建的目标检测模型进行训练，得到训练好的模型之前，还包括：

7.如权利要求5所述的柴油黑烟车的检测方法，其特征在于，所述构建目标检测模型，并对监控图片上标注的矩形边界框使用k-均值聚类算法，计算出包含柴油黑烟车的先验框，包括：

8.如权利要求6所述的柴油黑烟车的检测方法，其特征在于，将监控图片中标注出的矩形边界框作为真值框，所述利用监控图片和包含柴油黑烟车的先验框，对构建的目标检测模型进行训练，得到训练好的模型，包括：

9.如权利要求8所述的柴油黑烟车的检测方法，其特征在于，所述目标检测模型的总损失函数为：

其中，l表示各子损失函数，W和H分别表示所述特征图的宽和高；A指所述先验框的数量，C表示类别数量，上角标中o表示目标，r表示先验框坐标，k表示先验框编号，c表示类别标签，truth表示与所述真值框相匹配，下角标中t表示迭代次数，K表示编号为K的groundtruth真值框，noobj表示先验框中不存在目标，prior表示先验框，coord表示坐标，obj表示存在目标，class表示类别，i、j表示编号为k的先验框中的某个像素点(i,j)，λ_noobj表示背景置信度损失函数的权重系数，λ_prior表示先验框prior与预测框b坐标损失函数的权重系数，λ_coord表示负责预测的先验框所得到的预测框与标签边界框坐标损失函数的权重系数，λ_obj表示目标置信度损失函数的权重系数，λ_class表示分类损失函数的权重系数，项损失函数表示计算背景的置信度误差，先验框中无目标的置信度误差为项表示计算先验框prior与预测框b的坐标损失函数，项表示计算与某个真值框ground truth匹配的预测框的定位误差；项表示计算目标置信度误差；表示计算分类误差，*表示乘积。

10.如权利要求1-9任一项所述的柴油黑烟车的检测方法，其特征在于，在GPU平台上运行所述柴油黑烟车的检测方法。