CN110619365B

CN110619365B - 一种落水检测方法

Info

Publication number: CN110619365B
Application number: CN201910880971.2A
Authority: CN
Inventors: 方武; 李晨曦; 祖宝明
Original assignee: Suzhou Institute of Trade and Commerce
Current assignee: Suzhou Institute of Trade and Commerce
Priority date: 2019-09-18
Filing date: 2019-09-18
Publication date: 2023-09-12
Anticipated expiration: 2039-09-18
Also published as: CN110619365A

Abstract

本发明公开了一种落水检测方法，包括：获取可见光图像与热图像；调用目标检测模型对可见光图像与热图像进行叠加，得目标图像；调用目标检测模型对目标图像进行检测，得到目标图像中包含落水者的最终目标框。通过使用该检测方法，提高检测速度及定位准确率，提高夜间等复杂环境下的识别率。

Description

一种落水检测方法

技术领域

本发明涉及图像识别和深度学习领域，尤其涉及一种基于可见光图像和热图像特征叠加的落水检测方法。

背景技术

图像融合作为信息融合的一个分支，是当前信息融合研究中的一个热点。图像融合的数据形式是包含有明暗、色彩、温度、距离以及其他的景物特征的图像。这些图像可以以一副，或者一列的形式给出。而图像融合是将2张或2张以上的图像信息融合到1张图像上，使得融合的图像含有更多的信息、能够更方便人来观察或者计算机处理。然而传统的识别检测算法存在准确率不高，鲁棒性不强，检测识别速度慢等缺点。

发明内容

本发明目的是提供一种落水检测方法，通过使用该检测方法，提高检测速度及定位准确率，提高夜间等复杂环境下的识别率。

为达到上述目的，本发明采用的技术方案是：一种落水检测方法，包括：

获取可见光图像与热图像；

调用目标检测模型对可见光图像与热图像进行叠加，得目标图像；

调用目标检测模型对目标图像进行检测，得到目标图像中包含落水者的最终目标框。

上述技术方案中，所述目标检测模型通过如下步骤构建：

构建十四层卷积神经网络模型；

对十四层卷积神经网络模型进行预训练，得预检测模型；

对预检测模型进行二次训练，得检测模型；

对检测模型进行测试，得目标检测模型。

上述技术方案中，所述十四层卷积神经网络模型包括八层卷积层与六层最大值池化层，第一层与最后一层为所述卷积层，第二层至第十三层以最大值池化层与卷积层交替设置。

上述技术方案中，步骤“对十四层卷积神经网络模型进行预训练”中是采用迁移学习方法，预训练的范围为通用行人检测数据库。

上述技术方案中，步骤“对预检测模型进行二次训练”中二次训练的范围为训练样本集。

上述技术方案中，所述训练样本集通过如下步骤构建：

获取样本图像；

对样本图像扩充数据集；

对数据集标注，得训练样本集。

上述技术方案中，步骤“对检测模型进行测试”包括：

对样本图像缩放，得子图像；

将子图像平均分为若干个预测框；

在每个预测框输出大小不同的若干个目标框；

若目标框中温差大于十度，则该目标框检测概率设为1，否则设为0.5，预测值＝目标框*检测概率；

利用目标框对检测模型进行测试，得目标检测模型。

上述技术方案中，所述子图像大小为832*832像素，对所述子图像均分为一百六十九个预测框。

上述技术方案中，所述预测框为13*13矩阵，每一所述预测框内预测五个尺寸大小不同的目标框。

上述技术方案中，所述可见光图像与热图像通过树莓派摄像头同时获取。

由于上述技术方案运用，本发明与现有技术相比具有下列优点：

1.本发明中将可见光图像与热图像的特征进行叠加，可用于复杂环境下实时落水人员识别检测，提高夜间等复杂环境下的识别率。

2.目标检测模型是由定制化十四层卷积神经网络模型经通用行人检测数据库与训练样本集多次训练，及目标框测试得到，基于分类回归的卷积神经网络目标检测方法具有速度快、精度高的优点，可用于实时落水人员识别检测系统。

具体实施方式

下面结合实施例对本发明作进一步描述：

实施例一：一种落水检测方法，包括：

获取可见光图像与热图像；

其中，目标检测模型通过如下步骤构建：

构建十四层卷积神经网络模型；

对十四层卷积神经网络模型进行预训练，得预检测模型；

对预检测模型进行二次训练，得检测模型；

对检测模型进行测试，得目标检测模型。

其中，所述十四层卷积神经网络模型包括八层卷积层与六层最大值池化层，第一层与最后一层为所述卷积层，第二层至第十三层以最大值池化层与卷积层交替设置。卷积神经网络结构参数表见表1。

表1卷积网络结构参数表

其中，预检测模型的获取步骤为：采用迁移学习方法利用通用行人检测数据库对十四层卷积神经网络模型进行预训练得到。

其中，检测模型的获取步骤为：

通过手机、无人机或摄像机等具有拍摄功能的设备采集落水人员的图像，作为样本图像；

对样本图像采用经典数据增强的方法扩充数据集；

对扩充后的数据集进行标注，所述标注是指对图像中标注矩形框，所述矩形框内包含落水人员大小和位置坐标，且对所述标注设定标签，所述标签是指标注的矩形框内落水人员的类别，得训练样本集；

利用训练样本集对预检测模型进行二次训练，得检测模型。

其中，目标检测模型的获取步骤为：

将样本图像缩放成832*832像素的子图像；

将子图像平均分为13*13矩阵大小的一百六十九个预测框，每一预测框内预测五个尺寸大小不同的目标框，根据常见落水人员尺寸比例将目标框分别设置为：32*46像素、38*52像素、46*62像素、36*48像素与78*118像素，对目标框通过热图像传感器检测每个像素点位置的温度，取最高值-最低值，若目标框中温差大于湿度，则该目标框检测概率设为1，否则设为0.5，预测值＝目标框*检测概率，取最大预测值为落水者的最终目标框；

利用目标框对检测模型进行测试，得目标检测模型。

利用目标检测模型，对同时获取的可见光图像与热图像进行叠加，并检测识别，以确定所述目标图像中落水人员的分类及其位置坐标。

y＝M(x)，为输入到输出的映射函数；

其中，x为输入图像，y为落水人员分类及其位置坐标。

本申请选择树莓派摄像头平台进行测试，所述树莓派摄像头测试平台参数见表2。

表2树莓派摄像头测试平台参数

上述实施例只为说明本发明的技术构思及特点，其目的在于让熟悉此项技术的人士能够了解本发明的内容并据以实施，并不能以此限制本发明的保护范围。凡根据本发明精神实质所作的等效变化或修饰，都应涵盖在本发明的保护范围之内。

Claims

1.一种落水检测方法，其特征在于，包括：

获取可见光图像与热图像；

调用目标检测模型对目标图像进行检测，得到目标图像中包含落水者的最终目标框；

所述目标检测模型通过如下步骤构建：

构建十四层卷积神经网络模型；

对十四层卷积神经网络模型进行预训练，得预检测模型；

构建训练样本集，对预检测模型进行二次训练，得检测模型；所述训练样本集的构建过程包括：获取样本图像，对样本图像扩充数据集，对数据集标注，得训练样本集；

对样本图像缩放，得子图像；

将子图像平均分为若干个预测框；

在每个预测框输出大小不同的若干个目标框；

利用目标框对检测模型进行测试，得目标检测模型。

2.根据权利要求1所述的落水检测方法，其特征在于：所述十四层卷积神经网络模型包括八层卷积层与六层最大值池化层，第一层与最后一层为所述卷积层，第二层至第十三层以最大值池化层与卷积层交替设置。

3.根据权利要求1所述的落水检测方法，其特征在于：步骤“对十四层卷积神经网络模型进行预训练”中是采用迁移学习方法，预训练的范围为通用行人检测数据库。

4.根据权利要求1所述的落水检测方法，其特征在于：所述子图像大小为832*832像素，对所述子图像均分为一百六十九个预测框。

5.根据权利要求4所述的落水检测方法，其特征在于：所述预测框为13*13矩阵，每一所述预测框内预测五个尺寸大小不同的目标框。

6.根据权利要求1所述落水检测方法，其特征在于：所述可见光图像与热图像通过树莓派摄像头同时获取。