CN115343703A

CN115343703A - 一种基于自训练的3d-cnn探地雷达三维图像的管线识别方法

Info

Publication number: CN115343703A
Application number: CN202210881029.XA
Authority: CN
Inventors: 白旭; 温志涛; 魏守明; 郭士増; 刘金龙; 栗昱昊; 张天祥; 崔海涛
Original assignee: Dalian Zhongrui Science & Technology Development Co ltd; Harbin Institute of Technology
Current assignee: Dalian Zhongrui Science & Technology Development Co ltd; Harbin Institute of Technology
Priority date: 2022-07-26
Filing date: 2022-07-26
Publication date: 2022-11-15

Abstract

本发明提出一种基于自训练的3D‑CNN探地雷达三维图像的管线识别方法。所述方法包括对所获得的探地雷达三维回波图像进行预处理；将探地雷达三维回波图像划分成训练集和验证集，对验证集中的全部数据以及训练集中的一部分数据进行人工标注；利用训练集对结合注意力机制的3D‑CNN的神经网络模型进行自训练，得到训练好的权重模型；利用训练好的神经网络模型，对探地雷达三维回波图像进行管线目标识别。本发明解决了传统的神经网络依赖于大量、准确的标记样本的问题，仅用少量的标记样本和大量的无标记样本使得识别准确率有了较大的提高，同时也节省了人工标注样本的时间，提高了效率。

Description

一种基于自训练的3D-CNN探地雷达三维图像的管线识别方法

技术领域

本发明属于探地雷达三维回波图后处理的目标检测技术领域，特别是涉及一种基于自训练的3D-CNN探地雷达三维图像的管线识别方法。

背景技术

探地雷达是一种高效率的、无破坏性的用于探测浅层地下环境的探测技术。探地雷达通过发射电线不断向地层发射高频电磁波，电磁波可以穿透地下介质。但是由于不同的地下介质具有不同的介电常数。电磁波在地层传播时，会在介质交替层发生反射和折射。接收天线通过接收多道反射回波(A-Scan)，信号通过信号处理技术，拼接为二维B-Scan图像。但是二维B-Scan图像并不能完全反映地下目标的特征。比如受检测方向、图像选取方式等的影响，二维B-Scan图像中的信息可能不能被识别而发生漏检的情况。如果采用的阵列式发射天线和接收天线，每个天线将会得到一个平面的二维B-Scan图像，通过将空间内的多个二维B-Scan图像按顺序堆叠，将会得到一副可以完整反映地下空间结构的三维图像(C-Scan)。

随着深度学习的发展，深度卷积神经网络被广泛的应用于各个领域，在解决图像识别分类问题时往往能取得较好的效果，然而它们的成功很大程度上依赖于大量、准确的标记样本。在探地雷达研究领域中，想要获得这样的标签样本集并非易事。随着探地雷达采集技术的发展，使得原始探地雷达数据的获取难度降低，研究者们可在相关从事道路检测的公司获取大量的探地雷达原始数据图像。在这种背景下，将自训练这样的半监督学习算法应用到探地雷达图像识别网络中，仅用少量的标记样本和大量的无标记样本，使识别网络达到一个较好的性能，有着非常重要的现实意义。

发明内容

本发明目的是为了解决传统基于监督训练的方法依赖于大量准确的标记样本的问题，提出了一种基于自训练的3D-CNN探地雷达三维图像的管线识别方法。

本发明是通过以下技术方案实现的，本发明提出一种基于自训练的3D-CNN探地雷达三维图像的管线识别方法，所述方法具体包括：

步骤1：对所获得的探地雷达三维回波图像进行预处理，所述预处理包括利用均值滤波进行直达波滤除以及利用极值包络法对滤除直达波后的图像进行增益处理；

步骤2：将步骤1得到的探地雷达三维回波图像随机划分成训练集和验证集，对验证集中的全部数据以及训练集中的一部分数据进行人工标注，分别为管线、空洞和无目标三类，作为有标签样本，训练集中的其余数据作为无标签样本；

步骤3：利用步骤2得到的训练集对结合注意力机制的3D-CNN的神经网络模型A-3D-CNN进行自训练，得到训练好的权重模型；所述自训练是通过对无标签样本分配伪标签来对A-3D-CNN网络进行训练的；网络训练过程分为两个阶段，第一个阶段中首先用有标签样本集L对A-3D-CNN充分预训练；第二个阶段中首先使用训练后的A-3D-CNN对无标签样本集U进行预测，将预测结果中概率最大的类设为该样本的伪标签，将拥有伪标签的无标签数据视为有标签的数据，共同参与对A-3D-CNN的训练；

步骤4：利用步骤3获得的训练好的神经网络模型，对探地雷达三维回波图像进行管线目标识别。

进一步地，所述直达波在B-Scan图像中会呈现为两条水平状的黑白条纹，地下探测目标的回波在同一条测线上各个测点的A-Scan回波信号中互不相关，根据互不相关性，均值滤波法能够有效的去除B-Scan图像中的直达波干扰信号。

进一步地，所述增益处理采用自适应分段增益处理，所述自适应分段增益能够根据信号在指定时窗内的均值幅度来确定该时窗内增益权重，即可以根据探地雷达信号进行自适应的增益权重设置。

进一步地，自适应增益函数的生成方法是：首先对A-Scan数据取绝对值，并计算多道A-Scan信号的平均值H(i)，然后按照分段数计算每段时窗内H(i)的均值，将该均值的倒数作为该时窗的起始点的增益值，增益函数中其它位置可通过线性插值获得，它每段的增益权重由B-Scan图像自适应获得；取H(i)的包络极值点作为分段点，即可自适应的获得最优分段数和分段点，称之为极值包络增益。

进一步地，训练集和验证集划分比例为6:4。

进一步地，所述训练过程中的损失函数为：

公式(1)中第一项是监督学习下的网络的损失函数，第二项是无标记样本的损失项；式中

是有标签的样本的真实标签，

是网络的预测输出，其中

网络为无标签样本分配的伪标签，可通过公式(2)得到，

是网络的预测输出，α(t)是无标签样本的损失函数分配权重系数，α(t)可通过公式(3)得到，其中T₁表示预训练的周期数，从T₁到T₂使无监督损失逐渐上升，α_f为无监督损失项最大的加权系数。

进一步地，所述自训练的训练参数为16batch和250epochs，初始学习率设为0.01，每经过60个周期，学习率缩小10倍，最终得到经过自训练的权重模型。

进一步地，在步骤4中，将未输入过该神经网络模型的地下管线目标探地雷达三维回波图像输入到训练好的权重模型中，自动地对探地雷达三维回波图像中的地下管线目标进行检测，最终标注出带有地下管线信息的三维回波图像。

本发明提出一种电子设备，包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现所述一种基于自训练的3D-CNN探地雷达三维图像的管线识别方法的步骤。

本发明提出一种计算机可读存储介质，用于存储计算机指令，所述计算机指令被处理器执行时实现所述一种基于自训练的3D-CNN探地雷达三维图像的管线识别方法的步骤。

本发明的有益效果为：

本发明将实际获得的探地雷达三维图像经过预处理和人工标注后，制作成探地雷达三维图像数据集，并利用数据集中的训练集结合自训练算法训练出可对后续的探地雷达三维图像进行地下管线自动识别检测的神经网络模型。采用本发明的方法可以有效地提高对探地雷达三维回波图像的识别准确率和检测效率。本发明可以将地下管线目标识别概率提高到87％以上。

传统的基于卷积神经网络的探地雷达三维图像分类方法往往依赖于大量可用的标记样本去训练网络，才能得到一个高性能的网络模型。然而在探地雷达领域，并没有公开可用数据集，又因为探地雷达数据的正确解译较为困难，这使得通过人工标记样本的成本非常高昂。本发明的目的使将自训练这样的半监督学习算法应用到探地雷达图像识别网络中，通过网络预测为无标记样本分配伪标签的方式，实现对无标签样本的利用，进而提升网络模型的分类性能，提高对探地雷达三维图像关系识别的准确率和效率。

附图说明

图1是基于自训练的结合注意力机制的3D-CNN算法的三维探地雷达图像地下管线识别方法的流程图。

图2是均值滤波法去除直达波前后的对比图。

图3是极值包络增益处理前后的对比图。

图4是基于自训练的探地雷达三维图像分类框图。

图5是A-3D-CNN模型结构图。

图6是3D-CNN网络结构流程图。

图7是3D-CNN网络中BasicBlock模块结构图。

图8是阈值为0.8时的网络分类准确率结果图。

图9是不同阈值下的网络准确率提升情况示意图。

具体实施方式

下面将结合本发明实施例中的附图对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

结合图1-图9，本发明提出一种基于自训练的结合注意力机制的3D-CNN探地雷达三维图像的管线识别方法，所述自动识别方法包括以下步骤：

步骤1：对所获得的探地雷达三维回波图像进行预处理，包括利用均值滤波进行直达波滤除、利用极值包络法对滤除直达波后的图像进行增益处理；

步骤2：将步骤1得到的探地雷达三维回波图像随机划分成训练集和验证集，对验证集中的全部数据以及训练集中的一部分数据进行人工标注，分别为管线、空洞和无目标三类，作为有标签样本，训练集中的其余数据则作为无标签样本；

步骤3：利用步骤2的训练集对A-3D-CNN网络进行自训练，得到训练好的权重模型；

所述步骤1利用均值滤波的方法实现探地雷达三维图像直达波的滤除。直达波在B-Scan图像中通常会呈现为两条水平状的黑白条纹，这是由于在实际道路工程探测时，车载探地雷达与路面之间的距离不会发生明显的变化，所以在探地雷达同一条测线上的不同测点的A-Scan回波信号中，直达波的到达时间基本相同，反映到B-Scan图像中便是一条水平的直线。而地下探测目标的回波在同一条测线上各个测点的A-Scan回波信号中互不相关，利用这个特性，均值滤波法便可以方便有效的去除B-Scan图像中的直达波干扰信号。直达波是探地雷达信号中最主要的干扰噪声，相比于目标反射回波来说，直达波信号的幅度要大的多，导致在探地雷达的B-Scan图像中，地面以下的信号特征被严重压制，几乎不能看到，如图2所示，极大影响了神经网络对于地下目标的探测与识别，因此探地雷达数据预处理首先就是要去除直达波干扰。

均值滤波的具体方法如下：

首先假设探地雷达一条测线上的B-Scan图像是由N个A-Scan回波信号构成的，每个A-Scan回波信号又包含M个采样点。那么B-Scan图像可以表示为一个M×N的矩阵，这时均值滤波法的数学表达式可表示为：

其中w_i(i,j)是滤波前的B-Scan图像矩阵中第i行第j列的值，对应的是第j个A-Scan回波信号中第i个采样点的值。w'_i(i,j)是滤波后B-Scan图像矩阵中第i行第j列的值。

所述增益处理采用自适应分段增益处理，所述自适应分段增益可以根据信号在指定时窗内的均值幅度来确定的该时窗内增益权重，即可以根据探地雷达信号进行自适应的增益权重设置。自适应增益函数的生成方法是：首先对A-Scan数据取绝对值，并计算多道A-Scan信号的平均值H(i)，然后按照分段数计算每段时窗内H(i)的均值，将该均值的倒数作为该时窗的起始点的增益值，增益函数中其它位置可通过线性插值获得，它每段的增益权重由B-Scan图像自适应获得。为了克服分段自适应增益难以获得最优的分段数和分段点的问题，可以取H(i)的包络极值点作为分段点，即可自适应的获得最优分段数和分段点，称之为极值包络增益。

具体方法为：首先对H(i)取希尔伯特变换，获得H(i)的包络值，并求得包络的极大值，将极大值点作为分段点。同时考虑到之前对直达波之前进行了无意义的增益，以及对深层噪声进行了过度增益，所以在这两段进行特殊处理：

(1)在函数H(i)包络的最大值点出现之前，认为在这之前的信号不需要增益。

(2)为了防止对深层信号过度增益，当函数H(i)包络的极大值小于最大值的三十分之一时，便不再取后面的极值点。

经过极值包络增益处理后的探地雷达回波图像如图3所示。

所述步骤2将步骤1中得到的探地雷达的三维图像随机划分为训练集和验证集，训练集和验证集划分比例约为6:4。对验证集的全部数据和训练集中的一部分数据进行人工标注，分成3个类别，分别为管线、空洞以及无目标，作为有标签样本，而训练集中剩余的数据作为无标签样本。

自训练算法是通过对无标签样本分配伪标签来对A-3D-CNN网络进行训练的，所以将该方法称为PL(Pseudo-Label)算法，该算法的实现框图如图4所示，具体实现流程如下：

首先将训练集中有标签的样本集记为D_l＝{(x_n,y_n):n∈(1,2,…N)}，其x_n∈R^H×W×D是训练样本，y_n∈(1,2,…,C)是对应样本的类别标签，将无标签的样本样本集记为D_u＝u_m∈R^H×W×D:m∈(1,2,…,M)。

网络训练过程主要分为两个阶段，第一个阶段中首先用有标签样本集L对A-3D-CNN充分预训练。第二个阶段中首先使用训练后的A-3D-CNN对无标签样本集U进行预测，将预测结果中概率最大的类设为该样本的伪标签，将拥有伪标签的无标签数据视为有标签的数据，共同参与对A-3D-CNN的训练。

在训练的第二个阶段中通过给无标签样本分配伪标签的方式实现了对无标签样本的利用。可见基于自训练的半监督分类方法是一个简单、高效且使用自由度非常高的方法，它可以很轻易的应用到各个领域中。但是在这种方法中存在的问题是，网络无法确定通过预测方式来分配的伪标签是否是正确的。尤其是训练的第一阶段仅用少量有标签样本对网络进行训练，无法保证此时网络的可靠性。因此在训练的第二个阶段中，伪标签的损失函数的权重不宜设置过大，可以通过为无标签损失函数设置一个权重，使其随着训练的进行而逐步上升。

该训练过程中的损失函数可通过公式(1)得到，该损失函数很好理解，第一项是监督学习下的网络的损失函数，而第二项是无标记样本的损失项。式中

是有标签的样本的真实标签，

是网络的预测输出，其中

网络为无标签样本分配的伪标签，可通过公式(2)得到，

是网络的预测输出，α(t)是为无标签样本的损失函数分配权重系数。α(t)可通过公式(3)得到，其中T₁表示预训练的周期数，从T₁到T₂使无监督损失逐渐上升，α_f为无监督损失项最大的加权系数。

该方法通过将网络预测结果中概率最大的类作为该样本的伪标签，然后将这个伪标签视为该样本“真正的标签”去参与损失函数的计算，实现了对无标签样本的监督训练。通过交叉熵的计算方法可知：当网络对预测结果比较自信，即对应伪标签类别的概率值比较大时，那么该样本的交叉熵的值会比较小，而网络对预测结果不自信，即多个类别的概率值比较接近时，那么该样本的交叉熵的值会比较大。交叉熵的值更大的这些样本对网络的影响会更大，会使网络朝着使这些样本的熵最小化的方向优化。如果这些不自信的预测结果大部分都是正确的，那么网络性能将会得到一个巨大的提高。然而当这些不自信的预测结果错误时，利用这些标签错误的样本训练网络时，就会导致网络的性能变差。为了降低这种不期望的风险可以使用伪标签预测的置信度阈值，仅当网络预测的最大概率大于该阈值时，才为该样本添加伪标签，从而使网络获得“稳健”的学习。

所述步骤3利用步骤2中获得的训练集A-3D-CNN神经网络模型进行自训练，网络模型结构如图5所示，首先将通道注意力机制应用到水平切面图，使网络更加关注具有关键特征信息的水平切面图，抑制不重要的水平切面图，然后通过空间注意力机制，使网络学习到水平切片图中关键特征的位置信息。然后将经过注意力机制模块优化后的图像再送入3D-CNN中。所采用的3D-CNN的网络模型如图6所示。首先网络的单个输入尺寸为(1，36，128，128)，1表示只有一个C-Scan图像，36为通道数，即一张C-Scan图像中所包含的B-Scan图像数，128和128表示单张B-Scan图像的大小为128*128。将输入图像与4个3*3*3的卷积核进行三维卷积操作，得到尺寸为(4，36，128，128)的三维特征图像，然后采用批标准化对所得到的三维特征图像进行归一化，再利用Relu激活函数进行非线性变换，来增加神经网络各层之间的非线性关系，缓解网络模型过拟合以及梯度爆炸的问题，最后将得到的4个三维特征图作为下一层的输入；第二层为1个BasicBlock模块(BasicBlock模块结构如图7所示)，输入尺寸为(4，36，128，128)，输出尺寸为(8，36，128，128)，第三层也为1个BasicBlock模块，但是输入尺寸为(8，36，128，128)，输出尺寸为(8，36，128，128)第四层为3组BasicBlock模块，每一组都由输入尺寸为(8，36，128，128)，输出尺寸为(16，18，64，64)的BasicBlock模块和输入尺寸为(16，18，64，64)，输出尺寸为(16，18，64，64)的BasicBlock模块构成，经过以上四层最终得到了尺寸为(16，18，64，64)的三维特征图，然后进行全局平均池化和flatten层展平进行特征提取，最终将提取到的特征送入全连接层得到分类输出。

选取训练超参数为16batch和250epochs，初始学习率设为0.01，每经过60个周期，学习率缩小10倍。将T₁和T₂分别设置为100和200，设置为0.5，使无标签样本在第100个周期时加入训练，并从100到200周期期间权重不断上升，在第200周期时，权重上升到最大值0.5，最后训练50周期后结束训练。为了避免实验的偶然性，本发明中将数据集随机置乱5次，再从训练集中选取有标签样本和无标签样本。图8给出了阈值设为0.8时，网络在置乱5次后不同的数据集上的最终分类结果,在5次实验中，相比于未使用自训练算法，使用自训练算法利用无标签样本进行半监督训练后，分类准确率均有所提高，平均提升了1.97％。图9给出了不同阈值下，网络加入无标签样本后，网络的分类准确度的提升情况。可以看到，在不同阈值下，网络的分类准确率均有所提升。但当不设阈值(阈值为0)，网络对难分的样本预测的伪标签错误过多，训练样本噪声过多，导致网络性能提升较小；当网络的阈值过高时，此时加入训练中的无标签样本往往是网络很确信的，这种样本虽然有很大可能是正确的，但是网络从这类容易分类的样本中可学习到的“新知识”已经很少了，这种样本对网络的提升并不大，所以本发明最终将阈值设为准确率提升最大时对应的阈值，即为0.5，最终得到经过训练的权重模型。

所述步骤4利用步骤3中得到的神经网络模型，对探地雷达的三维回波图像进行管线识别。将未曾输入到神经网络模型中的探地雷达三维图像作为训练好的神经网络模型的输入，使网络自动地对探地雷达三维图像进行目标管线识别，最终标注出带有管线的探地雷达三维图像。

本申请实施例中的存储器可以是易失性存储器或非易失性存储器，或可包括易失性和非易失性存储器两者。其中，非易失性存储器可以是只读存储器(read only memory，ROM)、可编程只读存储器(programmable ROM，PROM)、可擦除可编程只读存储器(erasablePROM，EPROM)、电可擦除可编程只读存储器(electrically EPROM，EEPROM)或闪存。易失性存储器可以是随机存取存储器(random access memory，RAM)，其用作外部高速缓存。通过示例性但不是限制性说明，许多形式的RAM可用，例如静态随机存取存储器(static RAM，SRAM)、动态随机存取存储器(dynamic RAM，DRAM)、同步动态随机存取存储器(synchronousDRAM，SDRAM)、双倍数据速率同步动态随机存取存储器(double data rate SDRAM，DDRSDRAM)、增强型同步动态随机存取存储器(enhanced SDRAM，ESDRAM)、同步连接动态随机存取存储器(synchlink DRAM，SLDRAM)和直接内存总线随机存取存储器(direct rambusRAM，DR RAM)。应注意，本发明描述的方法的存储器旨在包括但不限于这些和任意其它适合类型的存储器。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机指令时，全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(digital subscriber line，DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质(例如，软盘、硬盘、磁带)、光介质(例如，高密度数字视频光盘(digital video disc，DVD))、或者半导体介质(例如，固态硬盘(solid state disc，SSD))等。

在实现过程中，上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。结合本申请实施例所公开的方法的步骤可以直接体现为硬件处理器执行完成，或者用处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器，闪存、只读存储器，可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器，处理器读取存储器中的信息，结合其硬件完成上述方法的步骤。为避免重复，这里不再详细描述。

应注意，本申请实施例中的处理器可以是一种集成电路芯片，具有信号的处理能力。在实现过程中，上述方法实施例的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成，或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器，闪存、只读存储器，可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器，处理器读取存储器中的信息，结合其硬件完成上述方法的步骤。

以上对本发明所提出的一种基于自训练的3D-CNN探地雷达三维图像的管线识别方法进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种基于自训练的3D-CNN探地雷达三维图像的管线识别方法，其特征在于，所述方法具体包括：

2.根据权利要求1所述的方法，其特征在于，所述直达波在B-Scan图像中会呈现为两条水平状的黑白条纹，地下探测目标的回波在同一条测线上各个测点的A-Scan回波信号中互不相关，根据互不相关性，均值滤波法能够有效的去除B-Scan图像中的直达波干扰信号。

3.根据权利要求2所述的方法，其特征在于，所述增益处理采用自适应分段增益处理，所述自适应分段增益能够根据信号在指定时窗内的均值幅度来确定该时窗内增益权重，即可以根据探地雷达信号进行自适应的增益权重设置。

4.根据权利要求3所述的方法，其特征在于，自适应增益函数的生成方法是：首先对A-Scan数据取绝对值，并计算多道A-Scan信号的平均值H(i)，然后按照分段数计算每段时窗内H(i)的均值，将该均值的倒数作为该时窗的起始点的增益值，增益函数中其它位置可通过线性插值获得，它每段的增益权重由B-Scan图像自适应获得；取H(i)的包络极值点作为分段点，即可自适应的获得最优分段数和分段点，称之为极值包络增益。

5.根据权利要求1所述的方法，其特征在于，训练集和验证集划分比例为6:4。

6.根据权利要求1所述的方法，其特征在于，所述训练过程中的损失函数为：

是有标签的样本的真实标签，

是网络的预测输出，其中

网络为无标签样本分配的伪标签，可通过公式(2)得到，

7.根据权利要求6所述的方法，其特征在于，所述自训练的训练参数为16batch和250epochs，初始学习率设为0.01，每经过60个周期，学习率缩小10倍，最终得到经过自训练的权重模型。

8.根据权利要求1所述的方法，其特征在于，在步骤4中，将未输入过该神经网络模型的地下管线目标探地雷达三维回波图像输入到训练好的权重模型中，自动地对探地雷达三维回波图像中的地下管线目标进行检测，最终标注出带有地下管线信息的三维回波图像。

9.一种电子设备，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1-8任一项所述方法的步骤。

10.一种计算机可读存储介质，用于存储计算机指令，其特征在于，所述计算机指令被处理器执行时实现权利要求1-8任一项所述方法的步骤。