CN117392539B

CN117392539B - 一种基于深度学习的河流水体识别方法、电子设备及存储介质

Info

Publication number: CN117392539B
Application number: CN202311327240.8A
Authority: CN
Inventors: 齐少群; 万鲁河; 王雷; 卢廷玉; 杜以鑫
Original assignee: Harbin Normal University
Current assignee: Harbin Normal University
Priority date: 2023-10-13
Filing date: 2023-10-13
Publication date: 2024-04-09
Anticipated expiration: 2043-10-13
Also published as: CN117392539A

Abstract

一种基于深度学习的河流水体识别方法、电子设备及存储介质，属于水文信息提取技术领域。为提高城市河流小尺度环境识别精度，本发明采集河流所在目标区域的遥感影像数据，利用具有图像采集装置和卫星定位装置的无人机采集河流所在目标区域的水体图像数据；对采集的遥感影像数据、水体图像数据进行预处理，然后按照所在目标区域的坐标进行匹配，构建遥感影像训练集和遥感影像测试集，水体图像训练集和水体图像测试集；构建基于深度学习的河流水体识别模型；将得到的训练集中的数据输入到步骤S4构建的基于深度学习的河流水体识别模型中进行模型训练，然后对训练好的基于深度学习的河流水体识别模型进行测试，得到基于深度学习的河流水体识别结果。

Description

一种基于深度学习的河流水体识别方法、电子设备及存储介质

技术领域

本发明属于水文信息提取技术领域，具体涉及一种基于深度学习的河流水体识别方法、电子设备及存储介质。

背景技术

河流作为重要的资源和载体，是生态系统的绿色生命线，关系到人类的生存和发展。然而，河流水环境极易受到污染，特别是城市河道，随着现代城市的飞速发展与扩张，人口密度增加，给城市河流水环境带来了挑战。

随着新的卫星传感器不断升空,时间分辨率和空间分辨率不断提高,水质遥感监测从定性发展到定量,但是利用卫星遥感技术对水质监测的研究主要集中在区域跨度较大的研究对象上，例如大型湖泊水库和河口海岸的监测，对小尺度和微型态环境问题研究相对较少。

发明内容

本发明要解决的问题是提高城市河流小尺度环境识别精度，提出一种基于深度学习的河流水体识别方法、电子设备及存储介质。

为实现上述目的，本发明通过以下技术方案实现：

一种基于深度学习的河流水体识别方法，包括如下步骤：

S1、采集河流所在目标区域的遥感影像数据，利用安装有图像采集装置和卫星定位装置的无人机，采集河流所在目标区域的水体图像数据；

S2、对步骤S1采集的遥感影像数据、水体图像数据进行预处理；

S3、将步骤S2预处理后的遥感影像数据、水体图像数据，按照所在目标区域的坐标进行匹配，构建遥感影像训练集和遥感影像测试集，水体图像训练集和水体图像测试集；

S4、构建基于深度学习的河流水体识别模型；

S5、将步骤S3得到的训练集中的数据输入到步骤S4构建的基于深度学习的河流水体识别模型中进行模型训练，然后对训练好的基于深度学习的河流水体识别模型进行测试，得到基于深度学习的河流水体识别结果。

进一步的，步骤S2的具体实现方法包括如下步骤：

S2.1、对步骤S1采集的遥感影像数据进行预处理；

S2.1.1、设置步骤S1采集的在坐标点(x,y)的遥感影像数据为ri(x,y)，对步骤S1采集的遥感影像数据进行大气校正处理，计算表达式为：

ri_corr(x,y)＝ri(x,y)-P(x,y)×Atm(x,y)

其中，ri_corr(x,y)为大气校正处理后的遥感影像数据，P(x,y)为大气光谱特性参数在坐标点(x,y)的值，Atm(x,y)为大气对遥感影像数据的影响函数；

S2.1.2、对步骤S2.1.1经过大气校正处理后的遥感影像数据进行图像分割，分割成尺寸均为h×w的区域遥感图像数据，其中，h为图像的高，w为图像的宽，ri_h×w(x_i,y_i)为第i个区域遥感图像数据，得到处理后的遥感图像数据集RI_h×w(x,y)；

设置分割图像的矩阵为0矩阵，尺寸为h×w，h为图像的高，w为图像的宽；设置滑动窗口的尺寸为0矩阵的尺寸；控制滑动窗口在经过大气校正处理后的遥感影像数据上滑动，在窗口内的图像区域被复制给0矩阵并保存，保存时生成对应的区域标记；通过Timsort算法将经过大气校正处理后的遥感影像数据切割块按照时间顺序进行排序，得到处理后的遥感图像数据集RI_h×w(x,y)；

S2.2、对步骤S1采集的水体图像数据进行预处理；

S2.2.1、设置步骤S1采集的在坐标点(x,y)的水体图像数据为uavi(x,y)，对步骤S1采集的水体图像数据进行形状校正处理，计算表达式为：

uavi_corr(x,y)＝uavi(x,y)×(1+ε₁×r²+ε₂×r⁴)

其中，uavi_corr(x,y)为形状校正处理后的水体图像数据，ε₁、ε₂、ε₃为相机镜头的变形修正计算系数，r为相机镜头的光心周围距离；

S2.2.2、对步骤S2.2.1经过形状校正处理后的水体图像数据进行图像分割，分割成尺寸均为h×w的区域水体图像数据，其中，h为图像的高，w为图像的宽，uavi_h×w(x_i,y_i)为第i个区域水体图像数据，得到处理后的区域水体图像数据集UACVI_h×w(x,y)；

设置分割图像的矩阵为0矩阵，尺寸为h×w，h为图像的高，w为图像的宽；设置滑动窗口的尺寸为0矩阵的尺寸；控制滑动窗口在经过形状校正处理后的水体图像数据上滑动，在窗口内的图像区域被复制给0矩阵并保存，保存时生成对应的区域标记；通过Timsort算法将经过形状校正处理后的水体图像数据切割块按照时间顺序进行排序，得到处理后的区域水体图像数据集UACVI_h×w(x,y)。

进一步的，步骤S3中所述训练集中的数据占总数据的80％，测试集中的数据占总数据的20％。

进一步的，步骤S4的具体实现方法包括如下步骤：

S4.1、构建残差神经网络，所述残差神经网络的第一级卷积层采用4个3*3卷积核级包括conv0_1、conv0_2、conv0_3、conv0_4，用于分别提取遥感影像数据、水体图像数据的初始特征图数据；

S4.2、将步骤S4.1输出的遥感影像数据、水体图像数据初始特征图数据分别输入到多层感知机神经网络中进行特征提取，多层感知机神经网络由输入层、隐藏层和输出层组成，将步骤S4.1得到的初始特征图数据在输入层首先与权重矩阵相乘，然后加上偏置项，然后通过Relu激活函数进行非线性变换，得到该层的输出，该层的输出又作为下一层的输入，重复上述过程，直到输出层输出遥感影像数据、水体图像数据的多层感知机神经网络特征图；

多层感知机神经网络通过前向传播计算输出层的输出，前向传播的计算表达式为：

a^(l)＝f(w^(l)a^(l-1)+b^(l))

其中，a^(l)为第l层的输出，w^(l)为第l层的权重矩阵，b^(l)为第l层的偏置项，f为激活函数；

设置C为损失函数，所述多层感知机神经网络通过反向传播算法计算损失函数对权重和偏置的偏导数z^(l)，计算表达式为：

并利用梯度下降法对权重和偏置进行更新最小化损失函数，损失函数对第l层参数的梯度的计算表达式为：

其中，为第l层输出对第l层权重矩阵的梯度；

S4.3、然后将步骤S4.2得到的遥感影像数据、水体图像数据的多层感知机神经网络特征图输入特征聚合模块进行特征融合，然后进行拼接处理，输出深度学习的河流水体识别结果；所述特征融合的计算表达式为：

其中，MaxPool_t为在时间维度上的最大值池化，AvgPool_t为在时间维度上的均值池化，I_ri为遥感影像多层感知机神经网络特征图，I_uavi为水体图像多层感知机神经网络特征图，B为BatchNorm层，R为ReLU层，为卷积核为3×3×3的3D卷积核，I为特征融合后的特征图。

进一步的，步骤S5进行模型训练的评估指标为MAE评估指标，MAE计算估计值与真实值之差的绝对值的平均值，其计算公式为：

其中，n为样本数量，y_i为第i个样本的真实值，为第i个样本的估计值。

电子设备，包括存储器和处理器，存储器存储有计算机程序，所述的处理器执行所述计算机程序时实现所述的一种基于深度学习的河流水体识别方法的步骤。

计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现所述的一种基于深度学习的河流水体识别方法。

本发明的有益效果：

本发明所述的一种基于深度学习的河流水体识别方法，基于遥感影像数据和无人机采集的图像相融合，与普通的遥感影像相比，融合后的图像特征具有更高的分辨率,再结合深度学习方法,能够识别河流小尺度环境。

本发明所述的一种基于深度学习的河流水体识别方法，与现有技术相比，构建基于深度学习的河流水体识别模型利用深度学习方法,不需要人为设置阈值，加快处理速度，实现准确识别河流。

附图说明

图1为本发明所述的一种基于深度学习的河流水体识别方法的流程图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及具体实施方式，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施方式仅用以解释本发明，并不用于限定本发明，即所描述的具体实施方式仅仅是本发明一部分实施方式，而不是全部的具体实施方式。通常在此处附图中描述和展示的本发明具体实施方式的组件可以以各种不同的配置来布置和设计，本发明还可以具有其他实施方式。

因此，以下对在附图中提供的本发明的具体实施方式的详细描述并非旨在限制要求保护的本发明的范围，而是仅仅表示本发明的选定具体实施方式。基于本发明的具体实施方式，本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他具体实施方式，都属于本发明保护的范围。

为能进一步了解本发明的发明内容、特点及功效，兹例举以下具体实施方式，并配合附图1详细说明如下：

具体实施方式一：

一种基于深度学习的河流水体识别方法，包括如下步骤：

进一步的，步骤S2的具体实现方法包括如下步骤：

S2.1、对步骤S1采集的遥感影像数据进行预处理；

ri_corr(x,y)＝ri(x,y)-P(x,y)×Atm(x,y)

S2.2、对步骤S1采集的水体图像数据进行预处理；

uavi_corr(x,y)＝uavi(x,y)×(1+ε₁×r²+ε₂×r⁴)

设置分割图像的矩阵为0矩阵，尺寸为h×w，h为图像的高，w为图像的宽；设置滑动窗口的尺寸为0矩阵的尺寸；控制滑动窗口在经过形状校正处理后的水体图像数据上滑动，在窗口内的图像区域被复制给0矩阵并保存，保存时生成对应的区域标记；通过Timsort算法将经过形状校正处理后的水体图像数据切割块按照时间顺序进行排序，得到处理后的区域水体图像数据集UACVI_h×w(x,y)；

进一步的，步骤S3中所述训练集中的数据占总数据的80％，测试集中的数据占总数据的20％；

S4、构建基于深度学习的河流水体识别模型；

进一步的，步骤S4的具体实现方法包括如下步骤：

a^(l)＝f(w^(l)a^(l-1)+b^(l))

其中，为第l层输出对第l层权重矩阵的梯度；

其中，MaxPool_t为在时间维度上的最大值池化，AvgPool_t为在时间维度上的均值池化，I_ri为遥感影像多层感知机神经网络特征图，I_uavi为水体图像多层感知机神经网络特征图，B为BatchNorm层，R为ReLU层，为卷积核为3×3×3的3D卷积核，I为特征融合后的特征图；

S5、将步骤S3得到的训练集中的数据输入到步骤S4构建的基于深度学习的河流水体识别模型中进行模型训练，然后对训练好的基于深度学习的河流水体识别模型进行测试，得到基于深度学习的河流水体识别结果；

具体实施方式二：

本发明的计算机装置可以是包括有处理器以及存储器等装置，例如包含中央处理器的单片机等。并且，处理器用于执行存储器中存储的计算机程序时实现上述的一种基于深度学习的河流水体识别方法的步骤。

所称处理器可以是中央处理单元(Central Processing Unit，CPU)，还可以是其他通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现成可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

所述存储器可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等；存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外，存储器可以包括高速随机存取存储器，还可以包括非易失性存储器，例如硬盘、内存、插接式硬盘，智能存储卡(Smart Media Card,SMC)，安全数字(Secure Digital,SD)卡，闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

具体实施方式三：

本发明的计算机可读存储介质可以是被计算机装置的处理器所读取的任何形式的存储介质，包括但不限于非易失性存储器、易失性存储器、铁电存储器等，计算机可读存储介质上存储有计算机程序，当计算机装置的处理器读取并执行存储器中所存储的计算机程序时，可以实现上述的一种基于深度学习的河流水体识别方法的步骤。

所述计算机程序包括计算机程序代码，所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括：能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是，所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减，例如在某些司法管辖区，根据立法和专利实践，计算机可读介质不包括电载波信号和电信信号。

需要说明的是，术语“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

虽然在上文中已经参考具体实施方式对本申请进行了描述，然而在不脱离本申请的范围的情况下，可以对其进行各种改进并且可以用等效物替换其中的部件。尤其是，只要不存在结构冲突，本申请所披露的具体实施方式中的各项特征均可通过任意方式相互结合起来使用，在本说明书中未对这些组合的情况进行穷举性的描述仅仅是出于省略篇幅和节约资源的考虑。因此，本申请并不局限于文中公开的特定具体实施方式，而是包括落入权利要求的范围内的所有技术方案。

Claims

1.一种基于深度学习的河流水体识别方法，其特征在于，包括如下步骤：

步骤S2的具体实现方法包括如下步骤：

S2.1、对步骤S1采集的遥感影像数据进行预处理；

ri_corr(x,y)＝ri(x,y)-P(x,y)×Atm(x,y)

S2.2、对步骤S1采集的水体图像数据进行预处理；

uavi_corr(x,y)＝uavi(x,y)×(1+ε₁×r²+ε₂×r⁴)

其中，uavi_corr(x,y)为形状校正处理后的水体图像数据，ε₁、ε₂为相机镜头的变形修正计算系数，r为相机镜头的光心周围距离；

S4、构建基于深度学习的河流水体识别模型；

2.根据权利要求1中所述的一种基于深度学习的河流水体识别方法，其特征在于，步骤S3中所述训练集中的数据占总数据的80％，测试集中的数据占总数据的20％。

3.根据权利要求2中所述的一种基于深度学习的河流水体识别方法，其特征在于，步骤S4的具体实现方法包括如下步骤：

a^(l)＝f(w^(l)a^(l-1)+b^(l))

其中，为第l层输出对第l层权重矩阵的梯度；

S4.3、然后将步骤S4.2得到的遥感影像数据、水体图像数据的多层感知机神经网络特征图输入特征聚合模块进行特征融合，然后进行拼接处理，输出深度学习的河流水体识别结果；

所述特征融合的计算表达式为：

4.根据权利要求3中所述的一种基于深度学习的河流水体识别方法，其特征在于，步骤S5进行模型训练的评估指标为MAE评估指标，MAE计算估计值与真实值之差的绝对值的平均值，其计算公式为：

5.电子设备，其特征在于，包括存储器和处理器，存储器存储有计算机程序，所述的处理器执行所述计算机程序时实现权利要求1-4任一项所述的一种基于深度学习的河流水体识别方法的步骤。

6.计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1-4任一项所述的一种基于深度学习的河流水体识别方法。