CN111414807B

CN111414807B - 一种基于yolo技术的潮水识别与危机预警方法

Info

Publication number: CN111414807B
Application number: CN202010127428.8A
Authority: CN
Inventors: 陈友荣; 熊振宇; 周亚娟; 陈鹏; 赵克华; 吕晓雯; 孙萍
Original assignee: Zhejiang Shuren University
Current assignee: Zhejiang Shuren University
Priority date: 2020-02-28
Filing date: 2020-02-28
Publication date: 2024-02-27
Anticipated expiration: 2040-02-28
Also published as: CN111414807A

Abstract

本发明公开一种基于YOLO技术的潮水识别与危机预警方法，该方法通过缩放、旋转、平移、对称等方面的数据增强操作建立潮水数据集，利用滤波提取出大气折射率，对图像进行色彩平衡操作，选取大气光成分A。利用暗通道去雾，对图像进行去雾，并且对图像进行白平衡操作，从而获得较清晰的图像。对处理后的图像，采用YOLO网络进行训练，获得潮水识别模型。根据模型，对输入的图像进行识别，并计算潮水的位置和高度，到设备的距离和时间，当发生危险时可以及时发出预警。本发明是目前对潮水识别和危机预警方面的有益补充，可自动监测潮水的状态，弥补人工巡逻的不足，降低因涌潮引起的人员死亡率和避免家庭悲剧的发生。

Description

一种基于YOLO技术的潮水识别与危机预警方法

技术领域：

本发明涉及深度学习技术领域，尤其涉及基于回归的目标识别方法领域，具体是指一种基于YOLO技术的潮水识别与危机预警方法。

背景技术：

潮水伤人事件的主要原因是人们不够了解涌潮的特性，主观上不重视且主管部门主要采用定期巡逻预警的方式提醒群众，由于人力、覆盖面有限，预警效果较差，因此急需一种潮水识别和危机预警方法，自动识别潮水并提前危机预警。

近些年，随着深度学习技术的快速发展，基于深度学习的方法被广泛应用于目标识别领域。目前基于深度学习的目标识别方法主要分为两类：一是基于候选区域的目标识别方法，其具有较高的检测准确率，但是检测速度较慢，不适用于涌潮检测；二是基于回归的目标识别方法，其检测速度较快，如SSD、YOLO v3、R-CNN等。其中SSD目标检测方法对于小目标的检测率较低，并且神经网络的调试参数需要手工设置且较依赖调试经验。R-CNN方法的准确率较高，但由于其算法复杂程度较高，因此检测所花费的时间较多。YOLO v3方法在保证准确度的同时，其检测时间只需29毫秒，可满足涌潮检测实时性的要求，因此选择YOLO v3方法识别潮水相对更加合适。

目前已有部分学者研究基于YOLO技术的图像识别方法，如张辉提出了一种基于图像识别的自动跟踪算法，可识别高强度运动下的人体动作，实现快速、精准地提取人体动作特征。裴月玲等人基于车牌识别系统下，提出了基于人工智能的车牌号与车型识别算法。廖恩红等人提出了一种基于卷积神经网络的食品图像识别算法，实现对食物的精准分类。Kanghui Zhou等人基于数值天气预报数据，提出了一种对短时大雨，冰雹，对流阵风和雷暴等强对流天气的深度学习目标预测解决方案，可获得较好的预测技巧。Guoli Zhang等人为了减少森林大火给社会和经济造成的损失，提出了一种基于卷积神经网络的森林火灾敏感性空间预测模型，扩展了CNN在森林火灾敏感性预测中的应用。Jiangyun Li等人为了改进息肉检测方法的缺陷，通过增加不同级别的特征图融合，提出一种基于深度神经网络的检测算法，实现了高准确的息肉检测。

虽然上述各位学者侧重研究利用YOLO技术实现各种应用，但鲜少有用于潮水识别及预警的应用领域研究报道，由于潮水有其特定的移动形态及运动速度等考虑因素，上述有关YOLO技术的现有方法都并不能直接适用于潮水的识别和预警，有鉴于此，本案由此而生。

发明内容：

本发明公开一种基于YOLO技术的潮水识别与危机预警方法，该方法考虑了潮水形状和朝向多样性、运动速度快、容易受到雾霾天气影响等因素，结合YOLO技术的应用可实时识别出所监控潮水的位置，并分析到达的时间和高度，当存在危机状态时可通知周围人员，达到预警效果，从而避免涌潮带来的安全隐患，避免人员的受伤甚至死亡。

为了实现上述发明目的，本发明所采用的技术方案为：

一种基于YOLO技术的潮水识别与危机预警方法，内容包括：

步骤1：采用爬虫技术爬取现有图片库中的潮水图像，对图像进行数据增强处理，获得不同类型潮水形态的若干图片，共同构建成潮水训练集；

步骤2：判断网络模型当前所处状态：若当前为训练状态，则加载潮水训练集中的潮水图像数据；若当前为识别状态，则读取摄像头采集的潮水图像数据；

步骤3：将图像从RGB颜色空间转到LAB颜色空间，然后进行伽马校正后转回RGB颜色空间，获得经过白平衡处理后的图像；

步骤4：从高到低排序图像的暗原色值，选取排序为第0.1％个的原像素的最大值作为大气光成分A；

步骤5：引入暗通道模型和雾模型，对雾模型进行滤波处理，计算大气折射率；

步骤6：根据计算的大气光成分A和大气折射率，利用暗通道模型对图像进行去雾，得到去雾后的图像；

步骤7：将去雾后图像归一化，并送入YOLO卷积网络；

步骤8：判断当前模型所处状态，如果当前状态是识别状态，则跳到步骤 12；若当前状态为训练状态，则判断图像是否处理完成：如果每一个图像都处理完，则跳到步骤9；若仍存在未处理完的，则读取训练集中下一个图像，跳到步骤2；

步骤9：通过YOLO的网络卷积层，计算卷积神经网络中的三层卷积层的每一层输出特征值，将所有的特征值组成卷积神经网络中卷积层的输出特征值矩阵；

步骤10：计算输出预测值，计算表达预测值与真实情况之间差距程度的损失函数值，并比较损失函数值与所设定阈值的大小：若损失函数值小于阈值，则模型训练完成，获得训练好的网络模型以及网络模型的权重参数，并令当前状态为识别状态，执行步骤2；若损失函数值大于阈值，则执行步骤 11；

步骤11：利用损失函数值进行反向传播，更新网络偏置项参数和权重矩阵，跳到步骤10；

步骤12：调用之前输出的权重文件加载网络模型，送入YOLO的网络卷积层，提取图像特征并识别目标，获得每个潮水目标的检测框及置信度分数，输出检测框的坐标；

步骤13：寻找置信度最大的检测框，计算最大检测框与其余各框的两框重叠比例IOU，并删除IOU值大于所设定阈值的检测框；

步骤14：判断是否完成所有检测框的判断，若仍有未完成的，则返回步骤13；若均完成，则获得检测框并将该检测框作为识别框，获得识别框中心点的坐标作为该目标潮水的图片坐标，计算当前潮水的位置、速度、高度、到达时间；

步骤15：判断潮水高度、速度和到达时间是否都大于各自设定的阈值，如果三个参数都大于各自所设定阈值，则启动报警提醒，报警后以及上述三个参数不同时满足都大于各自阈值时，重新执行步骤2。

所述步骤1中图像增强处理方式为：利用opencv-python库的resize函数调节图片的分辨率，增加对应标签；利用opencv-python库的 getRotationMatrix2D函数，将图像进行旋转，旋转角度为随机生成，旋转范围为7度-15度；将图像往x轴、y轴方向上随机移动像素距离，移动范围为1-10 个像素点，实现图像的平移；给图像做中心对称，实现图像的对称数据增强。

所述步骤3中的伽马校正方式为：通过公式(1)对其L通道进行伽马校正：

其中，表示校正前有雾图像的L通道的均值；L_a表示伽马校正后的L通道。

所述步骤5中的大气折射率计算方法如下：令去雾系数值为0.95，然后按照下列步骤进行：

(5.1)令暗通道模型为

其中，J_dark(a)表示图像J(a)的暗通道，J(a)表示去雾后的图像，J^c表示三颜色通道，c表示R,G,B三个通道中的某一通道，J^c(a)表示图像a的每个通道，a表示输入的图像；

(5.2)利用待去雾图像I(a)、大气光成分A值和大气折射率，获得雾模型为：

I(a)＝J(a)t(a)+A(1-t(a)) (3)

其中，t(a)表示大气折射率，反应了光线的穿透能力；

(5.3)对公式(3)进行变形，转化成以下模型：

(5.4)根据大气光成分A，对模型(4)进行滤波处理，得到以下模型：

(5.5)通过公式(6)，计算大气折射率t(a)：

其中，ω表示雾气参数，其范围是[0,1]。

所述步骤6中的图像去雾方法具体步骤如下：

(6.1)通过公式(7)将的值取到[0,1]，得到白平衡后的输入图像为：

(6.2)令白平衡后的雾模型表示为：

I'(a)＝J'(a)t(a)+A(1-t(a)) (8)

(6.3)根据公式(8)和公式(9)，可得到去雾后的图像J(a)；

其中，t₀表示折射率设定的最低值，一般取值为0.1。

所述步骤10中的输出预测值计算方式为：根据当前权重矩阵和网络偏置项参数，通过公式(10)计算输出预测值：

δ＝g(wβ₁+wβ₂+b) (10)

其中，δ表示输出预测值，g()表示激活函数，w表示当前权重矩阵，b表示网络偏置项参数，β₁和β₂表示输出预测值矩阵向量。

所述步骤10中的损失函数计算方式为：根据当前权重矩阵，通过公式(11) 计算损失函数：

Loss＝α₁Loss_{中心坐标及宽高}+α₂Loss_置信度+α₃Loss_分类 (11)

其中，Loss表示总损失度，Loss_{中心坐标及宽高}表示预测的坐标与实际的坐标的误差，Loss_置信度表示每个边界框预测值的置信度误差，Loss_分类表示分类时的概率值误差，α₁,α₂,α₃表示误差损失因子。

所述步骤11中网络偏置项参数和权重矩阵更新方式为：通过公式(12)和 (13)更新网络偏置项参数和权重矩阵：

其中，表示更新后的网络偏置项参数，b^l表示更新前的网络偏置项参数，/>表示当前层的敏感度图，η表示学习率，即梯度，/>表示更新后的权重矩阵，ω^l表示更新前的权重矩阵。

所述步骤12中先将图片resize成416*416的格式，调用图片检测函数，对提取特征进行循环判断和识别目标，获得每一个类标签的概率，对每一个类标签概率进行判断，选择最大概率的类型作为目标，并定位图像中每个潮水目标的检测框和置信度分数，输出检测框的坐标。

所述步骤13中IOU通过公式(14)：

其中，object_conf表示置信度(confidence score)，即预测边框中包含目标的置信度，P_r(obiect)表示目标是否存在于预测边框对应的单元格中，取1表示存在，取0表示不存在；为预测框与真实值的交并比。

所述步骤14中，根据摄像头所在的位置和像素尺寸，获得当前潮水到设备所在位置的距离D₁，计算相邻图片中潮水的距离为：

D₂＝f(x₁-x₂) (15)

其中，D₂表示相邻图片中潮水位置的位移，x₁表示第一个图片中识别框中点的横坐标，x₂表示第二个图片中识别框中点的横坐标；

根据检测框的宽度，获得潮水的高度，令T_in表示截图的时间间隙，计算潮水的速度为D₂/T_in，通过公式(16)计算潮水到达摄像头所在位置的时间T：

T＝D₁×T_in/D₂ (16)。

本发明与现有技术相比，有益效果主要表现在：本发明方法通过缩放、旋转、平移、对称等方面的数据增强操作建立潮水数据集，利用滤波提取出大气折射率，对图像进行色彩平衡操作，选取大气光成分A。利用暗通道去雾，对图像进行去雾，并且对图像进行白平衡操作，从而获得较清晰的图像。对处理后的图像，采用YOLO网络进行训练，获得潮水识别模型。根据模型，对输入的图像进行识别，并计算潮水的位置和高度，到设备的距离和时间，当发生危险时可以及时发出预警。本发明是目前对潮水识别和危机预警方面的有益补充，可自动监测潮水的状态，弥补人工巡逻的不足，降低因涌潮引起的人员死亡率和避免家庭悲剧的发生。

附图说明：

图1为本发明所提供方法的流程图。

具体实施方式：

本实施例公开一种基于YOLO技术的潮水识别与危机预警方法，该方法如图1所示，主要步骤如下：

(1)采用爬虫技术爬取百度图片中的潮水图像。利用opencv-python库的resize函数调节图片的分辨率，增加对应标签；利用opencv-python库的getRotationMatrix2D函数，将图像进行旋转，旋转角度为随机生成，旋转范围为7度-15度；将图像往x轴、y轴方向上随机移动像素距离，移动范围为1-10 个像素点，实现图像的平移；给图像做中心对称，实现图像的对称数据增强。经过平移、旋转、对称和缩放的数据增强操作，获得包含横向潮水、竖向潮水、斜向潮水、爆炸型潮水等四类不同潮水形态的共1629张图片，并对图片中所有潮水进行标注，建立潮水训练集。

(2)判断当前模型状态是训练状态还是识别状态，如果当前状态是训练状态，则加载潮水训练集中的潮水图像数据；如果当前状态为识别状态，则读取摄像头采集的潮水图像数据。

(3)将图像从RGB颜色空间转到LAB颜色空间，通过公式(1)对其L通道进行伽马校正。将伽马校正后的图像转回RGB颜色空间，获得经过白平衡处理后的图像。

其中，表示校正前有雾图像的L通道的均值；L_a表示伽马校正后的L 通道。

(4)从高到低排序图像的暗原色值，选取排序为第0.1％个的原像素的最大值作为大气光成分A。

(5)令去雾系数值为0.95，引入暗通道模型和雾模型，对雾模型进行滤波处理，计算大气折射率。大气折射率的具体计算方法包含如下步骤：

(5.1)令暗通道模型为

其中，J_dark(a)表示图像J(a)的暗通道，J(a)表示去雾后的图像，J^c表示三颜色通道，c表示R,G,B三个通道中的某一通道，J^c(a)表示图像a的每个通道，a表示输入的图像。

(5.2)利用待去雾图像I(a)、大气光成分A值和大气折射率，获得雾模型为 I(a)＝J(a)t(a)+A(1-t(a)) (3)

其中，t(a)表示大气折射率，反应了光线的穿透能力。

(5.3)对公式(3)进行变形，转化成以下模型：

(5.5)通过公式(6)，计算大气折射率t(a)。

其中，ω表示雾气参数(即反应去雾程度的参数)，其范围是[0,1]，本方法ω值的经验值可为0.95，保留一部分雾。

(6)根据计算的大气光成分A和大气折射率，利用暗通道模型对图像进行去雾，得到去雾后的图像；图像去雾方法的具体步骤如下：

(6.1)通过公式(7)将的值取到[0,1]，得到白平衡后的输入图像为

(6.2)令白平衡后的雾模型表示为：

I'(a)＝J'(a)t(a)+A(1-t(a)) (8)

(6.3)根据公式(8)和公式(9)，可到去雾后的图像J(a)

其中，t₀表示折射率设定的最低值，一般取值为0.1。

(7)把去雾后的图像归一化为416*416图像，并将其图像送入YOLO的卷积网络；

(8)判断当前模型所处状态，如果当前状态是识别状态，则跳到步骤12，若为训练状态则需判断图像是否处理完成。如果每一个图像都处理完，则跳到步骤(9)，尚有未处理完的，则读取训练集中下一个图像，跳到步骤(2)。

(9)通过YOLO的网络卷积层，计算卷积神经网络中网格大小分别为 13×13、26×26和52×52的三层卷积层的每一层输出特征值，将所有的特征值组成卷积神经网络中卷积层的输出特征值矩阵；

(10)根据当前权重矩阵和网络偏置项参数，通过公式(10)计算输出预测值，通过公式(11)计算表达预测值与真实情况之间差距程度的损失函数，如果损失函数小于阈值Loss_y，则训练完成，获得网络模型的权重参数，获得网络模型，令当前状态为识别状态，读取摄像头采集的潮水图像数据，跳到步骤(3)；如果损失函数大于阈值，则跳到步骤(11)。

δ＝g(wβ₁+wβ₂+b) (10)

其中，Loss表示总损失度，Loss_{中心坐标及宽高}表示预测的坐标与实际的坐标的误差，Loss_置信度表示每个边界框预测值的置信度误差，Loss_分类表示分类时的概率值误差。α₁,α₂,α₃表示误差损失因子。

(11)利用损失值进行反向传播，通过公式(12)和(13)更新网络偏置项参数和权重矩阵，跳到步骤(10)。

(12)调用之前输出的权重文件加载网络模型，将图片resize成416*416 的格式，送入YOLO的网络卷积层，提取图像特征，调用图片检测函数，对提取特征进行循环判断和识别目标，获得每一个类标签的概率。对每一个类标签概率进行判断，选择最大概率的类型作为目标，并定位图像中每个潮水目标的检测框和置信度分数，输出检测框的坐标。

(13)在所有的检测框中找到置信度最大的框，通过公式(14)依次计算其与剩余框的两框重叠比例IOU，如果IOU值大于阈值，则将该框删除。

其中，object_conf表示置信度(confidence score)，即预测边框中包含目标的置信度，P_r(obiect)表示目标是否存在于预测边框对应的单元格中，取1表示存在，取0表示不存在。为预测框与真实值的交并比(intersection overunion)。

(14)判断是否完成所有检测框的判断，如果没有完成，则重新跳到步骤(13)，如果均完成则获得检测框，该检测框为识别框，获得识别框中目标为识别的潮水目标。

(15)将识别框中心点的坐标作为该目标潮水的图片坐标。根据摄像头所在的位置和像素尺寸，获得当前潮水到设备所在位置的距离D₁，计算相邻图片中潮水的距离为：

D₂＝f(x₁-x₂) (15)

其中，D₂表示相邻图片中潮水位置的位移，x₁表示第一个图片中识别框中点的横坐标，x₂表示第二个图片中识别框中点的横坐标。

(16)根据检测框的宽度，获得潮水的高度，令T_in表示截图的时间间隙，计算潮水的速度为D₂/T_in。通过公式(16)计算潮水到达摄像头所在位置的时间 T：

T＝D₁×T_in/D₂ (16)

(17)根据潮水的位置、速度、高度和到达时间等潮水参数，并且判断潮水高度、速度和到达时间是否都大于阈值，如果三个参数都大于所设定阈值，则表示该潮水可能会造成一定的危险，立即通知管理人员，并通过语音和报警灯对摄像头所在的周围人员进行危机报警，完成预警后重新跳到步骤 (2)；如果三个参数不同时满足大于各自设定阈值的条件，则直接跳到步骤(2)。

本发明提供了基于YOLO技术的潮水识别与危机预警方法。该方法通过缩放、旋转、平移、对称等方面的数据增强操作建立潮水数据集，之后利用滤波提取出大气折射率，对图像进行色彩平衡操作，选取大气光成分A。利用暗通道去雾，对图像进行去雾，并且对图像进行白平衡操作，从而获得较清晰的图像。对处理后的图像，采用YOLO网络进行训练，获得潮水识别模型。根据模型，对输入的图像进行识别，并计算潮水的位置，到设备的距离和时间，当发生危险时可以及时发出预警。

在此说明书中，本发明已参照其特定的实施例作了描述。但是，很显然仍可以作出各种修改和变换而不背离本发明的精神和范围。因此，说明书和附图应被认为是说明性的而非限制性的。

Claims

1.一种基于YOLO技术的潮水识别与危机预警方法，其特征在于：内容包括：

步骤7：将去雾后图像归一化，并送入YOLO卷积网络；

步骤8：判断当前模型所处状态，如果当前状态是识别状态，则跳到步骤12；若当前状态为训练状态，则判断图像是否处理完成：如果每一个图像都处理完，则跳到步骤9；若仍存在未处理完的，则读取训练集中下一个图像，跳到步骤2；

步骤10：计算输出预测值，计算表达预测值与真实情况之间差距程度的损失函数值，并比较损失函数值与所设定阈值的大小：若损失函数值小于阈值，则模型训练完成，获得训练好的网络模型以及网络模型的权重参数，并令当前状态为识别状态，执行步骤2；若损失函数值大于阈值，则执行步骤11；

具体如下；根据摄像头所在的位置和像素尺寸，获得当前潮水到设备所在位置的距离D₁，计算相邻图片中潮水的距离为：

D₂＝f(x₁-x₂) (15)

T＝D₁×T_in/D₂ (16)

2.根据权利要求1所述的一种基于YOLO技术的潮水识别与危机预警方法，其特征在于：所述步骤1中图像增强处理方式为：利用opencv-python库的resize函数调节图片的分辨率，增加对应标签；利用opencv-python库的getRotationMatrix2D函数，将图像进行旋转，旋转角度为随机生成，旋转范围为7度-15度；将图像往x轴、y轴方向上随机移动像素距离，移动范围为1-10个像素点，实现图像的平移；给图像做中心对称，实现图像的对称数据增强。

3.根据权利要求1所述的一种基于YOLO技术的潮水识别与危机预警方法，其特征在于：所述步骤3中的伽马校正方式为：通过公式(1)对其L通道进行伽马校正：

4.根据权利要求1所述的一种基于YOLO技术的潮水识别与危机预警方法，其特征在于：所述步骤5中的大气折射率计算方法如下：令去雾系数值为0.95，然后按照下列步骤进行：

(5.1)令暗通道模型为

I(a)＝J(a)t(a)+A(1-t(a)) (3)

其中t(a)表示大气折射率，反应了光线的穿透能力；

(5.3)对公式(3)进行变形，转化成以下模型：

(5.5)通过公式(6)，计算大气折射率t(a)：

其中，ω表示雾气参数，其范围是[0,1]。

5.根据权利要求4所述的一种基于YOLO技术的潮水识别与危机预警方法，其特征在于：所述步骤6中的图像去雾方法具体步骤如下：

(6.2)令白平衡后的雾模型表示为：

I'(a)＝J'(a)t(a)+A(1-t(a)) (8)

(6.3)根据公式(8)和公式(9)，可得到去雾后的图像J(a)；

其中，t₀表示折射率设定的最低值，一般取值为0.1。

6.根据权利要求1所述的一种基于YOLO技术的潮水识别与危机预警方法，其特征在于：所述步骤10中的输出预测值计算方式为：根据当前权重矩阵和网络偏置项参数，通过公式(10)计算输出预测值：

δ＝g(wβ₁+wβ₂+b) (10)

其中，δ表示输出预测值，g()表示激活函数，w表示当前权重矩阵，b表示网络偏置项参数，β₁和β₂表示输出预测值矩阵向量；

所述步骤10中的损失函数计算方式为：根据当前权重矩阵，通过公式(11)计算损失函数：

7.根据权利要求1所述的一种基于YOLO技术的潮水识别与危机预警方法，其特征在于：所述步骤11中网络偏置项参数和权重矩阵更新方式为：通过公式(12)和(13)更新网络偏置项参数和权重矩阵：

8.根据权利要求1所述的一种基于YOLO技术的潮水识别与危机预警方法，其特征在于：所述步骤12中先将图片resize成416*416的格式，调用图片检测函数，对提取特征进行循环判断和识别目标，获得每一个类标签的概率，对每一个类标签概率进行判断，选择最大概率的类型作为目标，并定位图像中每个潮水目标的检测框和置信度分数，输出检测框的坐标。

9.根据权利要求8所述的一种基于YOLO技术的潮水识别与危机预警方法，其特征在于：所述步骤13中IOU通过公式(14)：