CN111598098A

CN111598098A - 一种基于全卷积神经网络的水尺水位线检测及有效性识别方法

Info

Publication number: CN111598098A
Application number: CN202010386698.0A
Authority: CN
Inventors: 张振; 周扬; 王慧斌; 张丽丽; 汪崎宇; 李嘉辉; 沈淏旸
Original assignee: Hohai University HHU
Current assignee: Hohai University HHU
Priority date: 2020-05-09
Filing date: 2020-05-09
Publication date: 2020-08-28
Anticipated expiration: 2040-05-09
Also published as: CN111598098B

Abstract

本发明公开了一种基于全卷积神经网络的水尺水位线检测及有效性识别方法，包括如下步骤：S1、获取水尺图像并进行人工标注，将水尺、水草和水体用不同的类别区分，得到标签图；S2、设计全卷积神经网络结构，进行网络训练；S3、利用训练得到的全卷积神经网络对待测图像进行语义分割，实现像素级的语义标记；S4、在语义分割图像中检测水尺水位线及识别有效性。本发明检测精度高，鲁棒性强，操作简单。

Description

一种基于全卷积神经网络的水尺水位线检测及有效性识别方法

技术领域

本发明涉及计算机视觉技术领域，尤其是一种基于全卷积神经网络的水尺水位线检测及有效性识别方法。

背景技术

水位是河流湖库的基本水文要素之一，是反映水体、水流变化的重要指标，水位数据是防汛抗旱、灌溉、航运和水利设施的建设和管理的基本依据，因此，及时可靠的水位测量对于水资源管理规划和可持续发展具有重要意义。水尺通过读数记录水位的高度，是一种最直观和简单的测量工具；然而传统水尺测量需要人工定时观测，自动化程度低，人员劳动强度大。现有的自动水位计主要包括浮子式、压力式、超声波式及雷达式等，但普遍存在设备及安装成本高，测量精度易受环境温度、泥沙含量及现场控制结构的影响，需要工作人员定期维护等缺点。

目前国内许多重要的水位观测点均设有视频监控系统并配有标准水尺，为基于图像的水尺水位检测提供了有利条件。图像法利用图像传感器代替人眼获取水尺图像，通过图像处理技术检测水位线对应的读数，从而自动获取水位信息。然而在野外实际应用中，由于水尺和拍摄设备之间的距离较长，造成图像分辨率较低和背景干扰噪声较多，同时野外环境光照强度的变化对成像效果的影响较大，晴天时水面耀光、水尺倒影强烈，阴雨天气时水尺和水面的灰度值接近，导致常规基于灰度、边缘信息的图像处理技术将很难从中提取出水位线，或者检测误差较大，对于水尺有水草遮挡等测量结果的有效性也无法进行识别。

发明内容

本发明所要解决的技术问题在于，提供一种基于全卷积神经网络的水尺水位线检测及有效性识别方法，检测精度高，鲁棒性强，操作简单。

为解决上述技术问题，本发明提供一种基于全卷积神经网络的水尺水位线检测及有效性识别方法，包括如下步骤：

S1、获取水尺图像并进行人工标注，将水尺、水草和水体用不同的类别区分，得到标签图；

S2、设计全卷积神经网络结构，进行网络训练；

S3、利用训练得到的全卷积神经网络对待测图像进行语义分割，实现像素级的语义标记；

S4、在语义分割图像中检测水尺水位线及识别有效性。

优选的，步骤S1中，所述的获取水尺图像具体包括以下步骤：

S1.1：选取不同天气、光照和水流条件下24位的实际水尺监控图像数据建立图像样本集，按照训练样本集，验证样本集＝8:2的方式进行划分；

S1.2：处理实际水尺监控图像生成24位的正射水尺图像，长为H像素、宽为W像素。

优选的，步骤S1中，所述的将水尺、水草和水体用不同的类别区分，得到标签图是对24位的正射水尺图像进行手工标注，生成的8位PNG格式的标签图，其中水体部分的像素值为0，水尺部分的像素值为1，水草部分的像素值为2，将目标物体和背景分离，使得正射水尺图像中的每个像素点都有明确的类别。

优选的，步骤S2中，所述的全卷积神经网络结构具体为：

S2.1：将VGG-19网络作为待搭建全卷积神经网络的基础网络；

S2.2：将待搭建全卷积神经网络中的全连接层FC-4096、FC-4096和FC-1000分别转换为卷积层，卷积核的大小(宽，长，通道数)分别为(7,7,4096)、(1,1,4096)、(1,1,1000)；

S2.3：网络的具体结构如下所示：

CONV1(3×3×64)→CONV2(3×3×64)→AVGP1→CONV3(3×3×128)→CONV4(3×3×128)→AVGP2→CONV5(3×3×256)→CONV6(3×3×256)→CONV7(3×3×256)→CONV8(3×3×256)→AVGP3→CONV9(3×3×512)→CONV10(3×3×512)→CONV11(3×3×512)→CONV12(3×3×512)→AVGP4→CONV13(3×3×512)→CONV14(3×3×512)→CONV15(3×3×512)→CONV16(3×3×512)→MAXP1→CONV17(7×7×4096)→CONV18(1×1×4096)→CONV19(1×1×1000)

其中“CONV”代表卷积层，括号内部分为该层卷积核参数即宽度×长度×通道数，各卷积层后都连接着一个“ReLU”激活函数层，为了公式的简洁该层并未给出，“AVGP”代表均值池化层，“MAXP”代表最大值池化层，池化层的大小均为(2,2)，步长为2；

S2.4：搭建的全卷积神经网络通过分层计算特征图最终得到语义分割结果，卷积层通过卷积核在本层特征图上的卷积计算得到下一层的特征图，卷积核M可以包含若干个学习的权重参数，公式(1)给出了第m层的卷积特征图的计算公式：

其中，f(·)选用的激活函数，M_x和M_y分别表示卷积核M的长度和宽度，w_jk表示卷积核M的权重值，

表示二维卷积运算，t^m-1表示第m层的卷积特征图的输入，也是第m-1层的输出，b^m表示第m层的滤波器的偏量；

S2.5：步骤S2.4中所述的激活函数选用的是“ReLU”，公示(2)给出了其函数运算公式：

f(x)＝max(0,x) (2)

S2.6：经过AVGP1后特征图缩小为原图像尺寸的1/2；AVGP2后缩小为原图像的1/4；AVGP3后缩小为原图像的1/8，保留AVGP3输出的特征图；AVGP4后缩小为原图像的1/16，保留AVGP4输出的特征图；最后经过MAXP1后缩小为原图像的1/32；CONV17、CONV18和CONV19不改变图像大小，经过CONV19后特征图仍为原图像的1/32；

S2.7：为了将分辨率变小的特征图恢复到和原图一样的尺寸大小，对特征图进行上采样操作：将经过最后一层卷积层CONV19的特征图进行2倍上采样，并将采样结果与AVGP4输出的特征图进行融合；再将融合结果进行2倍上采样，并将采样结果与AVGP3输出的特征图进行融合；再将融合结果进行8倍上采样，将特征图恢复和原图一样的尺寸大小；

S2.8：最后使用softmax分类器做逐像素预测，softmax多分类层会对每一个像素进行分类，判断每个像素所属类别之后计算损失函数，通过反向传播算法一层层的更新网络中的参数；

S2.9：步骤S2.8中所述的“softmax分类器”，是指一种常用的有监督多分类模型，对各个输入分类器的概率值做指数计算，经归一化后，最大值所代表的类别即为分类结果；

S2.10：步骤S2.8中所述的损失函数为交叉熵损失函数，计算损失函数的具体过程为将softmax多分类层的输出向量和标注的样本数据的标签值做交叉熵处理，公示(3)给出了交叉熵的计算公式：

其中，y_i′指标注的标签值当中的第i个元素的值，y_i指softmax层的输出向量[Y₁,Y₂,Y₃...]的第i个向量数据。

优选的，步骤S3中，所述的利用训练得到的全卷积神经网络对待测图像进行语义分割后生成像素值在[0,2]之间的8位JPG格式的分割结果图，其长为H像素、宽为W像素，其中水体部分的像素值为0，水尺部分的像素值为1，水草部分的像素值为2，为便后续进行水位线检测，将该分割结果图内的各部分像素值均扩大100倍，即水体部分的像素值为0，水尺部分的像素值为100，水草部分的像素值为200。

优选的，步骤S4中，所述的在语义分割图像中检测水尺水位线及识别有效性包括以下步骤：

S4.1：根据公式(4)计算8位分割结果图像素值水平投影：

S(r)＝B(r,1)+B(r,2)+B(r,3)+…+B(r,W) (4)

其中，B(r,w)为像素(r,w)处的像素值，r为像素的行坐标，w为像素的列坐标，r＝1,2,3,…,H，w＝1,2,3,…,W；

S4.2：设定固定阈值T_r和T_g，T_r确定水尺部分，T_g确定水草部分，在分割结果图像素值水平投影中自上而下进行遍历，S(r)＜T_r的像素行坐标为水体部分，记为r_w，T_r＜S(r)＜T_g的像素行坐标为水尺部分，记为r_r，S(r)＞T_g的像素行坐标为水草部分，记为r_g；

S4.3：通过计算水体部分的垂直方向的像素长度确定水位线位置L；

L＝r_w2-r_w1 (5)

其中，r_w2为水体部分顶端的像素行坐标，r_w1为水体部分底端的像素行坐标；

S4.4：识别检测结果的有效性，若r_r＜r_g＜r_w，即水草部分的像素行坐标位于水尺部分像素行坐标和水体部分像素行坐标之间，则判断水位线区域有水草遮挡，标记该检测结果有水草干扰需要进行人工复检。

本发明的有益效果为：(1)检测精度高；本发明利用全卷积神经网络实现了对图像的逐像素预测，通过对每个像素点进行分类，实现整幅图像的语义分割，水位线的检测精度可以达到像素级；(2)鲁棒性强；本发明的训练数据集包含不同时间、不同条件下的实际监控图像数据，利用全卷积神经网络自动提取水尺、水草和水体区域信息特征，通过训练中的反向传播算法自动更新参数，保证了系统的统一性，使得模型鲁棒性强，能够适应野外应用中不同光照、天气等复杂环境，对于水草遮挡水尺的特殊情况能够自动识别检测结果的有效性，便于后期进行人工核验；(3)操作简单；本发明是一种端到端的全自动检测方法，在网络模型训练完成后，用户直接输入待检测图像，即可得到网络模型输出的分割结果和水位线检测结果，操作简单，自动化程度高，实用性强。

附图说明

图1为本发明的方法流程示意图。

图2(a)为本发明具体实施例中获取的正射水尺图像示意图。

图2(b)为本发明具体实施例中生成的标签示意图。

图2(c)为本发明具体实施例中生成的标签图像素值扩大100倍的结果示意图。

图3为本发明具体实施方式中全卷积神经网络结构示意图。

图4(a)为本发明具体实施例中无水草遮挡的待测图像示意图。

图4(b)为本发明具体实施例中无水草遮挡的分割结果图像示意图。

图4(c)为本发明具体实施例中无水草遮挡的水位线检测结果示意图。

图5(a)为本发明具体实施例中有水草遮挡的待测图像示意图。

图5(b)为本发明具体实施例中有水草遮挡的分割结果图像示意图。

图5(c)为本发明具体实施例中有水草遮挡的水位线检测结果示意图。

具体实施方式

如图1所示，一种基于全卷积神经网络的水尺水位线检测及有效性识别方法，包括如下步骤：

S1、获取水尺图像并进行人工标注，将水尺、水草和水体(背景)用不同的类别区分，得到标签图；

S2、设计全卷积神经网络结构，进行网络训练；

S4、在语义分割图像中检测水尺水位线及识别有效性。

步骤S1所述的获取水尺图像包括以下步骤：

S1.1：选取不同天气、光照和水流条件下24位的实际水尺监控图像数据建立图像样本集，按照训练样本集：验证样本集＝8：2的方式进行划分；

S1.2：处理实际水尺监控图像生成24位的正射水尺图像，长为H＝2000像素、宽为W＝200像素，如图2(a)所示。

步骤S1所述的将水尺、水草和水体(背景)用不同的类别区分，得到标签图是对24位的正射水尺图像进行手工标注，生成的8位PNG格式的标签图，如图2(b)所示，其中水体(背景)部分的像素值为0，水尺部分的像素值为1，水草部分的像素值为2，将目标物体和背景分离，使得正射水尺图像中的每个像素点都有明确的类别。为便于观察标签图，将生成的标签图像素值扩大100倍，结果如图2(c)所示。

步骤S2所述的全卷积神经网络结构如图3所示，包括：

S2.1：将VGG-19网络作为待搭建全卷积神经网络的基础网络；

S2.3：网络的具体结构如下所示：

f(x)＝max(0,x) (2)

S2.9：步骤S2.8中所述的“softmax分类器”，是指一种常用的有监督多分类模型，对各个输入分类器的概率值做指数计算，经归一化后，最大值所代表的类别即为分类结果。

S2.10：步骤S2.8中所述的损失函数为交叉熵损失函数，计算损失函数的具体过程为将softmax多分类层的输出向量和标注的样本数据的标签值做交叉熵处理，公式(3)给出了交叉熵的计算公式：

其中，y′_i指标注的标签值当中的第i个元素的值，y_i指softmax层的输出向量[Y₁,Y₂,Y₃...]的第i个向量数据。

步骤S3所述的利用训练得到的全卷积神经网络对待测图像进行语义分割，待测图像如图4(a)和图5(a)所示，其中图4(a)为无水草遮挡时的待测图像，图5(a)为有水草遮挡时的待测图像。进行语义分割后生成像素值在[0,2]之间的8位JPG格式的分割结果图，其长为H像素、宽为W像素，其中水体(背景)部分的像素值为0，水尺部分的像素值为1，水草部分的像素值为2，为便后续进行水位线检测，将该分割结果图内的各部分像素值均扩大100倍，即水体(背景)部分的像素值为0，水尺部分的像素值为100，水草部分的像素值为200，如图4(b)和图5(b)所示，其中图4(b)为无水草遮挡时的分割结果示意图，图5(b)为有水草遮挡时的分割结果示意图。

步骤S4所述的在语义分割图像中检测水尺水位线及识别有效性包括以下步骤：

S4.1：根据公式(4)计算8位分割结果图像素值水平投影：

S(r)＝B(r,1)+B(r,2)+B(r,3)+…+B(r,W) (4)

S4.2：设定固定阈值T_r和T_g，T_r确定水尺部分，T_g确定水草部分。在分割结果图像素值水平投影中自上而下进行遍历，S(r)＜T_r的像素行坐标为水体部分，记为r_w，T_r＜S(r)＜T_g的像素行坐标为水尺部分，记为r_r，S(r)＞T_g的像素行坐标为水草部分，记为r_g；

L＝r_w2-r_w1 (5)

其中，r_w2为水体部分顶端的像素行坐标，r_w1为水体部分底端的像素行坐标，水位线检测结果示意图如图4(c)和图5(c)所示，其中图4(c)为无水草遮挡时的水位线检测结果示意图，图5(c)为有水草遮挡时的水位线检测结果示意图；

S4.4：识别检测结果的有效性，若r_r＜r_g＜r_w，即水草部分的像素行坐标位于水尺部分像素行坐标和水体部分像素行坐标之间，如图5(b)所示，则判断水位线区域有水草遮挡，标记该检测结果有水草干扰需要进行人工复检。

不同于常规图像处理只能提取浅层次的视觉特征，卷积神经网络可以提取更高层次的视觉特征，在图像语义分割和分类等多种图像分析任务中取得极具优势的效果，并显现出高效的学习性能和良好的应用效果。而全卷积神经网络通过将卷积神经网络中最后的全连接层用卷积层来替代，并结合上采样和特征层裁剪操作，实现了对图像的逐像素预测。本发明将全卷积神经网络引入水尺水位线检测中。首先获取水尺图像并进行人工标注，将水尺、水草和水体(背景)用不同的类别区分，得到标签图，再设计全卷积神经网络结构，进行网络训练。然后利用训练得到的全卷积神经网络对待测图像进行语义分割，实现像素级的语义标记，最后在语义分割图像中检测水尺水位线并识别检测结果的有效性。

Claims

1.一种基于全卷积神经网络的水尺水位线检测及有效性识别方法，其特征在于，包括如下步骤：

S2、设计全卷积神经网络结构，进行网络训练；

S4、在语义分割图像中检测水尺水位线及识别有效性。

2.如权利要求1所述的基于全卷积神经网络的水尺水位线检测及有效性识别方法，其特征在于，步骤S1中，所述的获取水尺图像具体包括以下步骤：

3.如权利要求1所述的基于全卷积神经网络的水尺水位线检测及有效性识别方法，其特征在于，步骤S1中，所述的将水尺、水草和水体用不同的类别区分，得到标签图是对24位的正射水尺图像进行手工标注，生成的8位PNG格式的标签图，其中水体部分的像素值为0，水尺部分的像素值为1，水草部分的像素值为2，将目标物体和背景分离，使得正射水尺图像中的每个像素点都有明确的类别。

4.如权利要求1所述的基于全卷积神经网络的水尺水位线检测及有效性识别方法，其特征在于，步骤S2中，所述的全卷积神经网络结构具体为：

S2.1：将VGG-19网络作为待搭建全卷积神经网络的基础网络；

S2.3：网络的具体结构如下所示：

f(x)＝max(0,x) (2)

5.如权利要求1所述的基于全卷积神经网络的水尺水位线检测及有效性识别方法，其特征在于，步骤S3中，所述的利用训练得到的全卷积神经网络对待测图像进行语义分割后生成像素值在[0,2]之间的8位JPG格式的分割结果图，其长为H像素、宽为W像素，其中水体部分的像素值为0，水尺部分的像素值为1，水草部分的像素值为2，为便后续进行水位线检测，将该分割结果图内的各部分像素值均扩大100倍，即水体部分的像素值为0，水尺部分的像素值为100，水草部分的像素值为200。

6.如权利要求1所述的基于全卷积神经网络的水尺水位线检测及有效性识别方法，其特征在于，步骤S4中，所述的在语义分割图像中检测水尺水位线及识别有效性包括以下步骤：

S4.1：根据公式(4)计算8位分割结果图像素值水平投影：

S(r)＝B(r,1)+B(r,2)+B(r,3)+…+B(r,W) (4)

L＝r_w2-r_w1 (5)