CN117437519B

CN117437519B - 一种无水尺水位识别方法及装置

Info

Publication number: CN117437519B
Application number: CN202311462782.6A
Authority: CN
Inventors: 丁晓嵘; 张新; 李晓梅; 聂明杰; 李楠; 王柏春; 张兴业; 高涵; 王娜; 田晓宇; 项乾
Original assignee: Beijing Smart Water Development Research Institute
Current assignee: Beijing Smart Water Development Research Institute
Priority date: 2023-11-06
Filing date: 2023-11-06
Publication date: 2024-04-12
Anticipated expiration: 2043-11-06
Also published as: CN117437519A

Abstract

本发明提出了一种无水尺水位识别方法及装置，联合sift与MoCB‑Unet网络进行无水尺水位识别。所述方法包括：构建MoCB‑Unet网络用于分割水位图像中的水位线；对MoCB‑Unet模型，使用训练集训练模型，进行参数更新；将训练后参数最优的模型输出到文件；把模型部署在边缘侧设备，将获取到的实时水位图像送入设备模型进行水位线分割，得到水面分割结果的像素坐标，通过拟合将像素坐标转换为实际水位高度。本发明在解码部分与相邻的高层特征进行跳跃式连接，逐层提升水位线分割的精度；最后，联合sift算子和Flann算法修正相机抖动造成的水位线错位问题，同时可部署于边缘端设备上无水尺水位智能识别技术。

Description

一种无水尺水位识别方法及装置

技术领域

本发明涉及计算机视觉和模式识别领域，具体涉及一种可部署于边缘端设备的无水尺水位智能识别方法及装置，尤其涉及一种联合sift与MoCB-Unet进行无水尺水位识别的方法及装置。

背景技术

水位的高低和变化趋势等测量数据作为水文研究的必要数据，在水文学和水资源管理中不可或缺。传统的水位监测方法通常依赖于人工测量或使用传感器设备。人工测量水位的方式，需要人员进行实地测量和手工传录数据，不仅造成人力资源的浪费，且具有测量效率低效、数据相对离散和易出错等问题。而能够实现实时监测的水位测量传感器，虽然具备监测精度较高、低功耗、数据传输方便等优势，但存在安装维护成本高、依赖电力供应、测量范围有限以及受环境影响较大等问题。现在越来越多的水库、河道等水域区域安装了视频监控设备，这些设备能够提供高分辨率的图像和视频数据，利用这些视频数据进行水位识别成为了一种可行的方案。

随着GPU等硬件技术的快速发展和视频监控系统在智慧水务中的推广普及，基于深度学习的智能水位识别已成为研究的主导。该技术利用深度神经网络搭建水位智能识别模型，实现无接触式水位实时自动读取，为水利管理决策提供支持。现有的水位识别方法如：基于SSD检测模型的自动检测识别水尺上的水位高度，以及基于图像分割模型的水位线检测算法，通过对目标图像分割水位线，拟合预测水位高度；或对水位标尺图像进行分割，用来提取水平面坐标，从而计算实际水位值。上述方法对光照变化、异物遮挡、图像模糊具有一定的鲁棒性，但在实时连续的水位检测时，识别精度较低。另外，上述方法均将水尺作为水位识别的主体。

然而，在全天候实时水位监测过程中，由于不同河湖水库的地面环境与光照气候条件不同，存在着水位识别现场是否部署水尺、恶劣环境图像色差大、相机抖动等问题，因此把水尺作为研究主体进行水位识别存在一定的局限性。此外，将结构复杂参数庞大的分割模型部署于边缘端设备时，对网络参数量以及模型大小有着一定的限制。在这种情况下，亟需一种可部署于边缘端设备上的无水尺水位智能识别技术。

发明内容

本发明意在提供一种无水尺水位识别方法及装置，以解决现有技术中存在的不足，本发明要解决的技术问题通过以下技术方案来实现。

本发明的一个实施方式，提出一种无水尺水位识别方法，联合sift与MoCB-Unet进行无水尺水位识别，包括如下步骤：

S1 构建MoCB-Unet网络用于分割水位图像中的水位线；

S2 对MoCB-Unet模型，使用训练集训练模型，进行参数更新；

S3 模型输出，将训练后参数最优的模型输出到文件；

S4 模型使用，把模型部署在边缘侧设备，将获取到的实时水位图像送入设备模型进行水位线分割，得到水面分割结果的像素坐标，通过拟合将像素坐标转换为实际水位高度。

进一步地，所述S1具体包括：

S1.1 在传统U-net网络编码部分的主干特征提取网络部分，使用MobilenetV2的深度可分离卷积取代传统卷积，进行特征提取；

S1.2 对所述特征，采用MobilenetV2的倒残差结构，实现U-net编码部分的特征提取；

S1.3 对上述获取的最高层编码特征，采用倒残差网络和卷积核为3×3的卷积操作，扩大原特征通道数，并上采样到与相邻低层特征相同的尺度，用于与相邻低层特征的跳跃式连接。

进一步地，还包括：

S1.4 除最高层特征外，将编码部分获取的逐层特征，首先分别输入CBAM模块，生成通道注意力特征映射；

S1.5 将CBAM模块获取逐层通道注意力特征作为输入，接着分别输入CBAM模型的空间注意力部分，得到空间注意力特征映射；

S1.6 将空间注意力特征和通道注意力特征点乘，最终得到结合了CBAM注意力机制的特征映射；

S1.7 将所述结合了CBAM注意力机制的特征映射，在跳跃式连接部分，与上采样后的相邻高层特征相融合。

进一步地，所述S1.1中的MobileNetV2的深度可分离卷积分为深度卷积和逐点卷积，深度卷积将图像中每个输入通道与一个独立的卷积核进行卷积，将每个通道之间的特征分离；然后，对每个通道的输出特征采用1×1卷积核进行逐点卷积，将深度卷积得到的特征图进行特征融合。

进一步地，所述倒残差结构包括，首先使用1×1卷积核进行上采样，提升通道数，再使用深度可分离卷积对升维后的特征图进行特征提取，最后使用1×1卷积核进行下采样，降低特征通道数；重复上述操作直到深度可分离卷积提取特征步长为1时，对输入特征与输出特征进行残差连接，每个残差块的输入和输出之间的关系可以表示为：

（1）

其中，为特征的倒残差提取。

进一步地，所述S1.4生成通道注意力特征映射具体包括：

采用公式（2）所示的通道注意力模型，即：分别经过全局平均池化和全局最大池化，生成池化后的特征描述子，将二者分别输入全连接层后相加；经过卷积后，采用激活函数sigmoid进行非线性化，得到通道注意力映射，最后将通道注意力映射和原特征相乘，生成通道注意力特征映射为：

（2）

其中，为输入特征，为全局平均池化操作，为全局最大池化操作，表示全连接操作，表示Sigmoid激活函数，为点乘。

进一步地，所述S1.5得到空间注意力特征映射，具体包括：

采用公式（3）所示的空间注意力模型，即：分别进行全局平均池化和全局最大池化，并将这两个池化结果首尾连接后，进行卷积操作，将通道数压缩到一维，经过sigmoid激活函数，得到结合了空间注意力机制的特征映射为：

（3）

其中，为输入特征，为全局平均池化操作，为全局最大池化操作，表示Sigmoid激活函数，表示连接操作，表示卷积核为7×7 的卷积操作。

进一步地，所述S1.6得到结合了CBAM注意力机制的特征映射，具体包括：

采用公式（4）将空间注意力特征和通道注意力特征点乘，最终得到结合了CBAM注意力机制的特征映射为：

（4）

进一步地，所述S4模型使用具体包括：

S4.1 把模型部署在边缘侧设备，将摄像头获取到的实时水位图像送入设备模型进行图像分割，得到水位分割结果坐标为；

S4.2 使用Sift算法，获取实时水位图像与该站点特征水位图像的sift 特征描述子：；

S4.3 使用FLANN特征匹配算法，将特征水位图像的sift特征描述子和实时水位图像的sift特征描述子快速搜索匹配，搜索出二者相匹配的特征描述子；根据匹配点坐标，修正水位像素坐标为；

S4.4 通过最小二乘多项式拟合，求得现实世界坐标与像素高度坐标映射函数，将水位像素高度转换为现实水位高度；

其中，为水位实际高程；为水位像素高程；为标定物实际高度与标定值的偏差；—拟合得到的系数。

本发明的另一实施方式，提出一种无水尺水位识别装置，联合sift与MoCB-Unet进行无水尺水位识别，该装置包括：

构建模块，用于构建MoCB-Unet网络用于分割水位图像中的水位线；

模型训练模块，用于对MoCB-Unet模型，使用训练集训练模型，进行参数更新；

模型输出模块，用于将训练后参数最优的模型输出到文件；

模型使用模块，用于把模型部署在边缘侧设备，将获取到的实时水位图像送入设备模型进行水位线分割，得到水面分割结果的像素坐标，通过拟合将像素坐标转换为实际水位高度。

本发明方案相对于现有技术具有以下有益效果：

（1）本发明使用轻量级的MobilenetV2用以编码部分的特征提取，将提取到的各层特征结合CBAM注意力模块，在解码部分与相邻的高层特征进行跳跃式连接，逐层提升水位线分割的精度。

（2）本发明的MoCB-Unet网络通过改进传统的U-net分割网络，对实时采集的水位图像进行水位线分割；对于分割后的图像，针对现场常见的相机抖动以及其他外部干扰造成的图像发生畸变问题，用同一场景中稳态下的水位图像作为特征水位图像，使用Sift分别获取特征水位图像与待识别水位图像的sift特征描述子，并使用Flann算法对二者的特征点进行快速匹配，进行畸变图像的矫正，修正水位线坐标。

附图说明

下面结合附图和具体实施方式对本发明作进一步的说明。

图1为本发明的一种联合sift与MoCB-Unet的无水尺水位识别方法流程图；

图2为本发明的一种训练样本示例图；

图3为本发明的一种MoCB-Unet网络结构示意图；

图4为本发明的一种Mobilenetv2的深度可分离卷积结构示意图；

图5为本发明的一种Mobilenetv2的倒残差结构示意图；

图6为本发明的一种CBAM注意力结构示意图；

图7为本发明的一种摄像机左抖动时图像特征匹配图；

图8为本发明的一种联合sift与MoCB-Unet的无水尺水位识别装置结构示意图。

具体实施方式

需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。

本发明主要基于U-net图像分割模型，提供一种无水尺水位识别方法及装置，联合sift与MoCB-Unet（结合Mobile-Net与CBAM注意力机制的Unet网络）网络进行无水尺水位识别。其中，MoCB-Unet网络通过改进传统的U-net分割网络，对实时采集的水位图像进行水位线分割；对于分割后的图像，针对现场常见的相机抖动以及其他外部干扰造成的图像发生畸变问题，用同一场景中稳态下的水位图像作为特征水位图像，使用Sift分别获取特征水位图像与待识别水位图像的sift特征描述子，并使用Flann（快速最近邻逼近搜索函数库）算法对二者的特征点进行快速匹配，进行畸变图像的矫正，修正水位线坐标。

图1为本发明的一种无水尺水位识别方法，联合sift与MoCB-Unet网络进行无水尺水位识别方法的流程图，下面将对本发明的具体实施进行阐述。

步骤1，数据准备：数据采集、数据标注和数据划分；

步骤1.1，实地采集1280×720像素的无水尺水位图像做为样本图像，如图2所示。

图2为本发明的一种训练样本示例图。所采样本包含来自于强光照、低光照、雾景、雨景、冰面、倒影、阴影以及摄像机抖动等不同因素的干扰。

步骤1.2，使用标注软件labelme将每一副样本图像标注为水面区域和背景区域，生成掩码图像。并将标注内容存于txt文件，原图像和标注内容存放于同一个文件夹。

步骤1.3，将样本图像和其标注信息划分为训练集、验证集和测试集，分别占比60%、20%、20%。

步骤2，构建MoCB-Unet网络用于分割水位图像中的水位线，包含以下子步骤：

步骤2.1，如图3所示，在传统U-net网络编码部分的主干特征提取网络；使用MobilenetV2的深度可分离卷积取代的传统卷积，进行特征提取。

图3为本发明的一种MoCB-Unet网络结构示意图，在传统U-net网络编码部分的主干特征提取网络；并且加入了深度卷积，跳跃连接，CBAM模块。

图3的网络是一个经典的全卷积网络（即网络中没有全连接操作）。网络的输入是一张 512×512 的边缘经过镜像操作的图片（input image tile），网络的左侧是由卷积和Max Pooling构成的一系列降采样操作，将这一部分叫做压缩路径（contracting path）。压缩路径由4个block组成，每个block使用了3个有效卷积和1个Max Pooling降采样，每次降采样之后Feature Map的个数乘2，因此有了图中所示的Feature Map尺寸变化。最终得到了尺寸为 32×32 的Feature Map。

网络的右侧部分中叫做扩展路径（expansive path）。同样由4个block组成，每个block开始之前通过反卷积将Feature Map的尺寸乘2，同时将其个数减半（最后一层略有不同），然后和左侧对称的压缩路径的Feature Map合并，由于左侧压缩路径和右侧扩展路径的Feature Map的尺寸不一样，U-Net是通过将压缩路径的Feature Map裁剪到和扩展路径相同尺寸的Feature Map进行归一化的（即图3中左侧虚线部分）。扩展路径的卷积操作依旧使用的是有效卷积操作，最终得到的Feature Map的尺寸是 256×256 。由于该任务是一个二分类任务，所以网络最终有两个输出，分别代表输出的两个不同的类别，即水面与背景。

图4为本发明的一种Mobilenetv2的深度可分离卷积结构示意图；分为深度卷积和逐点卷积，深度卷积将图像中每个输入通道与一个独立的卷积核进行卷积，将每个通道之间的特征分离；其后，对每个通道的输出特征采用1×1卷积核进行逐点卷积，将深度卷积得到的特征图进行特征融合。

步骤2.2，如图3所示，对步骤2.1输出的主干特征，采用MobilenetV2的倒残差结构，实现U-net编码部分的特征提取。

如图5所示为本发明的一种Mobilenetv2的倒残差结构示意图。所述倒残差结构具体包括：首先使用1×1卷积核进行上采样，提升通道数，再使用深度可分离卷积对升维后的特征图进行特征提取，最后使用1×1卷积核进行下采样，降低特征通道数；重复上述操作直到深度可分离卷积提取特征步长为1时，对输入特征与输出特征进行残差连接。每个残差块的输入和输出之间的关系可以表示为：

（1）

其中，为特征的倒残差提取。图5中左侧进行深度可分离卷积时步长为2，在卷积同时会压缩特征图大小；右侧进行深度可分离卷积时步长为1，卷积时不会压缩特征图大小，当步长为1时，进行残差连接。残差连接是将输入加入到输出里。

步骤2.3，对上述获取的最高层（压缩路径最终结果）编码特征，采用步长为1的倒残差网络和卷积核为3×3的卷积操作，将原特征通道数从原160维扩大到1280维，并上采样到与相邻低层特征相同的尺度，用于与相邻低层特征的跳跃式连接。

步骤2.4，除最高层编码特征外，将编码部分获取的逐层特征，分别输入到图6所示的CBAM模块，生成通道注意力特征映射。

图6为本发明的一种CBAM注意力结构示意图，具体为：首先采用公式（1）所示的通道注意力模型，即：分别经过全局平均池化和全局最大池化，生成池化后的特征描述子，将二者分别输入全连接层后相加；经过通道数为C/2的1×1卷积和通道数为C的1×1卷积后，采用激活函数sigmoid进行非线性化，得到通道注意力映射，最后将通道注意力映射和原特征相乘，生成通道注意力特征映射。

（2）

步骤2.5，如图6所示，将CBAM模块获取逐层通道注意力特征作为输入特征，接下来采用公式（2）所示的空间注意力模型，即：分别进行全局平均池化和全局最大池化，并将这两个池化结果首尾连接后，进行一次7×7的卷积操作，将通道数压缩到一维，经过 sigmoid激活函数，得到结合了空间注意力机制的特征映射。

（3）

其中，为输入特征，为全局平均池化操作，为全局最大池化操作，表示全连接操作，表示Sigmoid激活函数，表示连接操作，表示卷积核为7×7的卷积操作，为点乘。

步骤2.6，如图6所示，采用公式（3）将空间注意力特征和通道注意力特征点乘，最终得到结合了CBAM注意力机制的特征映射。

（4）

步骤2.7，将上述每层结合了CBAM注意力机制的特征映射，在跳跃式连接部分，与上采样后的相邻高层特征相融合。

步骤3，对MoCB-Unet模型，使用训练集训练模型，进行参数更新，每训练10轮后，使用验证集验证模型的分割精度，这个过程迭代100轮，当损失函数保持稳定，多次不连续下降时，终止迭代。

步骤4，模型输出：将训练后参数最优的模型输出到*.h5文件，以方便模型可移植到边缘端设备。

步骤5，模型使用：包含以下子步骤：

步骤5.1，把模型部署在边缘侧设备，将摄像头获取到的实时水位图像送入设备模型进行水位线分割，得到水面分割结果的像素坐标；

步骤5.2，选用同一场景稳态下的水位图像作为特征水位图像，使用Sift算法，分别获取实时水位图像与特征水位图像的sift特征描述子：和；

步骤5.3，以为输入的参照特征，使用FLANN库提供的KNN算法构建一个针对的索引结构，将实时水位图像中的sift特征描述子作为查询对象，利用索引结构进行近似最近邻搜索，找与相似的特征描述子，筛选出二者相匹配的特征点；使用单应性矩阵变换，对实时水位图像进行旋转、变换等操作，与特征水位图像进行对齐，得到修正后的实时水位图像和水位线像素坐标。

如图7所示为本发明的一种摄像机左抖动时图像特征匹配图。其中，图中(a-b)为选用的特征水位图像和摄像机向左抖动时实时水位图像示例，图中(c)为选用的正常视角下的特征水位图像，图中(d)为利用sift算子畸变矫正后的实时水位图像。

步骤5.4，通过最小二乘多项式拟合，求得现实世界坐标与像素高度坐标映射函数，将水位像素高度转换为现实水位高度。

其中，为水位实际高程；为水位像素高程；为标定物实际高度与标定值的偏差；为拟合得到的系数。

图8所示为本发明的另一实施方式，提出一种无水尺水位识别装置，联合sift与MoCB-Unet网络进行无水尺水位的识别，该装置具体包括：

模型输出模块，用于将训练后参数最优的模型输出到文件；

本发明通过构建最优网络模型，进行训练，将训练得到的模型部署在边缘侧设备，利用设备在现场进行全天候不间断水位识别。

应该指出，上述详细说明都是示例性的，旨在对本申请提供进一步的说明。除非另有指明，本文使用的所有技术和科学术语均具有与本申请所属技术领域的普通技术人员的通常理解所相同的含义。

需要注意的是，这里所使用的术语仅是为了描述具体实施方式，而非意图限制根据本申请的示例性实施方式。如在这里所使用的，除非上下文另外明确指出，否则单数形式也意图包括复数形式。此外，还应当理解的是，当在本说明书中使用术语“包含”和/或“包括”时，其指明存在特征、步骤、操作、器件、组件和/或它们的组合。

需要说明的是，本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的术语在适当情况下可以互换，以便这里描述的本申请的实施方式能够以除了在这里图示或描述的那些以外的顺序实施。

此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含。例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

为了便于描述，在这里可以使用空间相对术语，如“在……之上”、“在……上方”、“在……上表面”、“上面的”等，用来描述如在图中所示的一个器件或特征与其他器件或特征的空间位置关系。应当理解的是，空间相对术语旨在包含除了器件在图中所描述的方位之外的在使用或操作中的不同方位。例如，如果附图中的器件被倒置，则描述为“在其他器件或构造上方”或“在其他器件或构造之上”的器件之后将被定位为“在其他器件或构造下方”或“在其他器件或构造之下”。因而，示例性术语“在……上方”可以包括“在……上方”和“在……下方”两种方位。该器件也可以其他不同方式定位，如旋转90度或处于其他方位，并且对这里所使用的空间相对描述作出相应解释。

在上面详细的说明中，参考了附图，附图形成本文的一部分。在附图中，类似的符号典型地确定类似的部件，除非上下文以其他方式指明。在详细的说明书、附图及权利要求书中所描述的图示说明的实施方案不意味是限制性的。在不脱离本文所呈现的主题的精神或范围下，其他实施方案可以被使用，并且可以作其他改变。

以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种无水尺水位识别方法，联合sift与MoCB-Unet网络进行无水尺水位的识别，其特征在于，包括如下步骤：

S1 构建MoCB-Unet网络用于分割水位图像中的水位线；

S2 对MoCB-Unet模型，使用训练集训练模型，进行参数更新；

S3 模型输出，将训练后参数最优的模型输出到文件；

S4 模型使用，把模型部署在边缘侧设备，将获取到的实时水位图像送入设备模型进行水位线分割，得到水面分割结果的像素坐标，通过拟合将像素坐标转换为实际水位高度；

所述S1构建MoCB-Unet网络用于分割水位图像中的水位线具体包括：

S1.3 对上述获取的最高层编码特征，采用倒残差网络和卷积核为3×3的卷积操作，扩大原特征通道数，并上采样到与相邻低层特征相同的尺度，用于与相邻低层特征的跳跃式连接；

2.根据权利要求1所述的无水尺水位识别方法，其特征在于，

所述S1.1中的MobileNetV2的深度可分离卷积分为深度卷积和逐点卷积，深度卷积将图像中每个输入通道与一个独立的卷积核进行卷积，将每个通道之间的特征分离；然后，对每个通道的输出特征采用1×1卷积核进行逐点卷积，将深度卷积得到的特征图进行特征融合。

3.根据权利要求1所述的无水尺水位识别方法，其特征在于，

所述S1.2中的倒残差结构包括，首先使用1×1卷积核进行上采样，提升通道数，再使用深度可分离卷积对升维后的特征图进行特征提取，最后使用1×1卷积核进行下采样，降低特征通道数；重复上述操作直到深度可分离卷积提取特征步长为1时，对输入特征与输出特征进行残差连接，每个残差块的输入和输出之间的关系表示为：

（1）

其中，为特征的倒残差提取。

4.根据权利要求1所述的无水尺水位识别方法，其特征在于，

所述S1.4生成通道注意力特征映射具体包括：

采用公式（2）所示的通道注意力模型，即：分别经过全局平均池化和全局最大池化，生成池化后的特征描述子，将二者分别输入全连接层后相加；经过卷积后，采用激活函数 sigmoid进行非线性化，得到通道注意力映射，最后将通道注意力映射和原特征相乘，生成通道注意力特征映射为：

（2）

5.根据权利要求1所述的无水尺水位识别方法，其特征在于，

所述S1.5得到空间注意力特征映射，具体包括：

（3）

其中，为输入特征，为全局平均池化操作，为全局最大池化操作，表示Sigmoid激活函数，表示连接操作，表示卷积核为7×7的卷积操作。

6.根据权利要求1所述的无水尺水位识别方法，其特征在于，

所述S1.6得到结合了CBAM注意力机制的特征映射，具体包括：

采用公式（4）将空间注意力特征和通道注意力特征点乘，最终得到结合了 CBAM注意力机制的特征映射为：

（4）。

7.根据权利要求1所述的无水尺水位识别方法，其特征在于，

所述S4模型使用具体包括：

S4.2 使用Sift算法，获取实时水位图像与站点特征水位图像的sift特征描述子：；

8.一种无水尺水位识别装置，联合sift与MoCB-Unet网络进行无水尺水位识别，其特征在于，该装置包括：

模型输出模块，用于将训练后参数最优的模型输出到文件；

模型使用模块，用于把模型部署在边缘侧设备，将获取到的实时水位图像送入设备模型进行水位线分割，得到水面分割结果的像素坐标，通过拟合将像素坐标转换为实际水位高度；

所述构建模块，用于构建MoCB-Unet网络用于分割水位图像中的水位线，具体包括：

在传统U-net网络编码部分的主干特征提取网络部分，使用MobilenetV2的深度可分离卷积取代传统卷积，进行特征提取；

对所述特征，采用MobilenetV2的倒残差结构，实现U-net编码部分的特征提取；

对上述获取的最高层编码特征，采用倒残差网络和卷积核为3×3的卷积操作，扩大原特征通道数，并上采样到与相邻低层特征相同的尺度，用于与相邻低层特征的跳跃式连接；

除最高层特征外，将编码部分获取的逐层特征，首先分别输入CBAM模块，生成通道注意力特征映射；

将CBAM模块获取逐层通道注意力特征作为输入，接着分别输入CBAM模型的空间注意力部分，得到空间注意力特征映射；

将空间注意力特征和通道注意力特征点乘，最终得到结合了CBAM注意力机制的特征映射；

将所述结合了CBAM注意力机制的特征映射，在跳跃式连接部分，与上采样后的相邻高层特征相融合。