CN113065617A

CN113065617A - 物体识别方法、装置、计算机设备和存储介质

Info

Publication number: CN113065617A
Application number: CN202110616793.XA
Authority: CN
Inventors: 李靖翔; 赖皓; 冯梦婷; 程江洲; 尹海涛; 刘羽超; 袁海; 赵明; 胡辉祥; 雍育烨; 洪乐洲; 熊双成; 李双杰; 颜志敏; 雷庆山; 肖志超; 庞鹏; 李宏昌; 肖一鹏; 吕圣琦
Original assignee: Guangzhou Bureau of Extra High Voltage Power Transmission Co
Current assignee: Guangzhou Bureau of Extra High Voltage Power Transmission Co
Priority date: 2021-06-03
Filing date: 2021-06-03
Publication date: 2021-07-02

Abstract

本申请涉及一种物体识别方法、装置、计算机设备和存储介质。通过获取包括待识别的地埋物的待识别图像，将待识别图像输入包括特征提取子模型和物体识别子模型的目标识别模型中，并通过包括多个卷积层的特征提取子模型以及物体识别子模型识别待识别图像中的待识别的地埋物并输出识别结果，根据目标识别模型输出的识别结果确定待识别图像中待识别的地埋物的类型。相较于传统的通过霍夫变换等方式检测探地雷达图像中的地埋物，本方案利用包括多个卷积层的特征提取子模型以及物体识别子模型识别待识别图像中的地埋物类型，从而实现提高地埋物体的识别精度的效果。

Description

物体识别方法、装置、计算机设备和存储介质

技术领域

本申请涉及图像处理技术领域，特别是涉及一种物体识别方法、装置、计算机设备和存储介质。

背景技术

探地雷达(GPRB，Ground Penetrating Rada)广泛应用于考古、结构工程和许多其他地球物理应用的地下预埋件成像。在探地雷达扫描图像中，埋藏的物体通过电磁波的方式被扫描出来，并在二维图形中以双曲线形式可视化。双曲线形式的雷达图通常很难解释，需要现场专家的帮助才能正确识别地下埋藏的物体。

近年来，许多方法被用于对GPRB扫描图像的双曲线模式分析，从而识别出图像中被扫描出的物体。例如HT（霍夫变换，Hough Transform）方法等。然而，虽然通过HT方法可以识别探底雷达扫描图像中的地物，但扫描图像中的地埋物不能完全检测到。

因此，目前对于探底雷达扫描图像中的物体识别方法存在识别精度低的缺陷。

发明内容

基于此，有必要针对上述技术问题，提供一种能够提高识别精度的物体识别方法、装置、计算机设备和存储介质。

一种物体识别方法，所述方法包括：

获取待识别图像；所述待识别图像中包括待识别的地埋物；

将所述待识别图像输入目标识别模型；所述目标识别模型包括特征提取子模型以及物体识别子模型；所述特征提取子模型包括多个卷积层；所述目标识别模型用于根据所述特征提取子模型中的多个卷积层以及所述物体识别子模型识别所述待识别图像中的待识别的地埋物并输出识别结果；所述目标识别模型基于多个样本图像对所述特征提取子模型以及所述物体识别子模型进行训练得到；

根据所述目标识别模型输出的识别结果，确定所述待识别图像中待识别的地埋物的类型。

在其中一个实施例中，所述获取待识别图像，包括：

通过探地雷达获取探地雷达扫描图像；

对所述探地雷达扫描图像进行灰度处理以及数据增强处理，得到所述待识别图像。

在其中一个实施例中，所述对所述探地雷达扫描图像进行灰度处理以及数据增强处理，得到所述待识别图像包括：

对所述探地雷达扫描图像的色相、饱和度以及色相、饱和度和强度进行颜色空间转换；

对进行颜色空间转换的所述探地雷达扫描图像添加散斑噪声，得到所述待识别图像。

在其中一个实施例中，所述方法还包括：

获取多个样本图像以及待训练的识别模型对应的权重和偏置值；所述多个样本图像包括测试样本图像和真实样本图像；

将所述测试样本图像输入所述待训练的识别模型，获取所述待训练的识别模型针对所述测试样本图像的输出结果；所述待训练的识别模型用于根据所述权重和偏置值以及待训练的特征提取子模型中的多个卷积层提取所述测试样本图像中待识别的地埋物对应的样本特征图像，根据待训练的物体识别子模型识别所述样本特征图像对应的地埋物的样本波形结构并输出；

判断所述样本波形结构与所述真实样本图像中对应的地埋物的真实波形结构的相似度是否大于或等于预设阈值；

若否，根据当前样本波形结构以及当前真实波形结构，调整所述权重和偏置值，得到新的待训练的识别模型，返回将所述测试样本图像输入所述待训练的识别模型的步骤；

若是，结束循环，根据循环结束时的权重和偏置值，得到所述目标识别模型。

在其中一个实施例中，所述获取多个样本图像，包括：

获取包括待识别的地埋物的多个模拟探地雷达扫描图像以及包括待识别的地埋物的多个真实探地雷达扫描图像；

对所述多个模拟探地雷达扫描图像以及包括待识别的地埋物的多个真实探地雷达扫描图像均进行灰度处理以及数据增强处理；得到处理后的模拟探地雷达扫描图像以及所述样本真实图像；

根据迁移学习算法获取处理后的模拟探地雷达扫描图像中的前景图像以及背景图像，作为所述多个样本测试图像；

根据多个所述样本测试图像以及多个所述样本真实图像，得到所述多个样本图像。

在其中一个实施例中，将所述测试样本图像输入所述待训练的识别模型，获取所述待训练的识别模型针对所述测试样本图像的输出结果，包括：

从所述测试样本图像中提取预设数量通道的测试样本输入图像；

将所述测试样本输入图像按照所述预设数量通道输入所述待训练的识别模型中的多个卷积层；

根据从各个通道输入的所述测试样本输入图像、预设类标签以及预设图像修正权值，通过预设成本函数得到所述测试样本图像对应的权重和偏置值；

针对每层所述卷积层，若当前卷积层为第一层卷积层，根据所述测试样本输入图像、预设卷积算子、所述权重和偏置值，得到当前层卷积层中所述测试样本输入图像对应的第一特征图像，将所述第一特征图像输入下一层卷积层中；

若当前卷积层不为第一层卷积层，根据上一层卷积层输入的第一特征图像、所述预设卷积算子、所述权重和偏置值，得到当前层卷积层中所述测试样本输入图像对应的第二特征图像，将所述第二特征图像输入下一层卷积层中，直到所述第二特征图像到达最后一层卷积层；

将所述最后一层卷积层输出的第二特征图像发送至池化层；所述池化层用于对所述第二特征图像进行缩小处理并通过预设激活函数进行激活，将激活后的第二特征图像发送至待训练的物体识别子模型；

获取所述物体识别子模型根据所述第二特征图像识别的样本波形结构，得到所述输出结果。

在其中一个实施例中，所述待识别的地埋物的类型包括以下至少一种：

所述待识别的地埋物的材料、形状以及土壤类型。

一种物体识别装置，所述装置包括：

获取模块，用于获取待识别图像；所述待识别图像中包括待识别的地埋物；

识别模块，用于将所述待识别图像输入目标识别模型；所述目标识别模型包括特征提取子模型以及物体识别子模型；所述特征提取子模型包括多个卷积层；所述目标识别模型用于根据所述特征提取子模型中的多个卷积层以及所述物体识别子模型识别所述待识别图像中的待识别的地埋物并输出识别结果；所述目标识别模型基于多个样本图像对所述特征提取子模型以及所述物体识别子模型进行训练得到；

确定模块，用于根据所述目标识别模型输出的识别结果，确定所述待识别图像中待识别的地埋物的类型。

一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现上述的方法的步骤。

一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现上述的方法的步骤。

上述物体识别方法、装置、计算机设备和存储介质，通过获取包括待识别的地埋物的待识别图像，将待识别图像输入包括特征提取子模型和物体识别子模型的目标识别模型中，并通过包括多个卷积层的特征提取子模型以及物体识别子模型识别待识别图像中的待识别的地埋物并输出识别结果，根据目标识别模型输出的识别结果确定待识别图像中待识别的地埋物的类型。相较于传统的通过霍夫变换等方式检测探地雷达图像中的地埋物，本方案利用包括多个卷积层的特征提取子模型以及物体识别子模型识别待识别图像中的地埋物类型，从而实现提高地埋物体的识别精度的效果。

附图说明

图1为一个实施例中物体识别方法的应用环境图；

图2为一个实施例中物体识别方法的流程示意图；

图3为一个实施例中目标识别模型的结构示意图；

图4为一个实施例中训练目标识别模型的流程示意图；

图5为另一个实施例中物体识别方法的流程示意图；

图6为一个实施例中物体识别装置的结构框图；

图7为一个实施例中计算机设备的内部结构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

本申请提供的物体识别方法，可以应用于如图1所示的应用环境中。其中，终端102通过网络与服务器104进行通信。终端102可以获取包括待识别的地埋物的待识别图像，例如可以从服务器104获取上述待识别图像，也可以从终端102本地获取，并将上述待识别图像输入目标识别模型，得到目标识别模型输出的识别结果，终端102可以根据目标识别模型输出的识别结果，确定待识别图像中的地埋物的类型。在一个实施例中，终端102还可以将识别结果发送至服务器104进行存储。其中，终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机和平板电脑，服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。

在一个实施例中，如图2所示，提供了一种物体识别方法，以该方法应用于图1中的终端为例进行说明，包括以下步骤：

步骤S202，获取待识别图像；待识别图像中包括待识别的地埋物。

其中，待识别图像可以是需要进行物体识别的图像，需要识别的物体可以是地埋物，即地下埋藏的物体。其中，地埋物的物体类型可以包括多种。终端102可以通过特定的设备获取。例如，在一个实施例中，获取待识别图像，包括：通过探地雷达获取探地雷达扫描图像；对探地雷达扫描图像进行灰度处理以及数据增强处理，得到待识别图像。本实施例中，上述待识别图像可以通过探地雷达获取，终端102可以通过探地雷达获取探地雷达扫描图像，并且可以对获取到的探地雷达扫描图像进行灰度处理以及数据增强处理，从而得到上述用于输入识别模型的待识别图像。其中，探地雷达扫描图像可以是一种波形图，例如以双曲线形式呈现。上述待识别图像可以是灰色的，因此终端102可以对获取到的探地雷达扫描图像进行灰度处理以及数据增强处理，例如通过颜色空间转换方式进行灰度处理，通过向图像中添加数据进行数据增强处理，从而可以提高待识别图像的图像质量以及识别成功率。

步骤S204，将待识别图像输入目标识别模型；目标识别模型包括特征提取子模型以及物体识别子模型；特征提取子模型包括多个卷积层；目标识别模型用于根据特征提取子模型中的多个卷积层以及物体识别子模型识别待识别图像中的待识别的地埋物并输出识别结果；目标识别模型基于多个样本图像对特征提取子模型以及物体识别子模型进行训练得到。

其中，目标识别模型可以是用于识别待识别图像中的待识别的地埋物的模型。目标识别模型中可以包括用于特征提取的部分以及用于物体识别的部分，例如可以包括特征提取子模型以及物体识别子模型。终端102可以通过将上述待识别图像输入目标识别模型中，并获取目标识别模型针对待识别图像输出的识别结果。

其中，如图3所示，图3为一个实施例中目标识别模型的结构示意图。上述目标识别子模型可以是CSVM模型，CSVM模型可以是一种结合了支持向量机与深度CNN（卷积神经网络，Convolutional Neural Networks）特征的一种卷积支持向量机；上述特征提取子模型可以包括多层卷积层，还可以包括多层池化层，从而特征提取子模型可以通过多层卷积层待识别图像进行特征识别和映射，最终得到待识别图像中的特征图像，并且还可以通过物体识别子模型识别特征图像中包含的地埋物，输出相应的识别结果。

例如，CSVM具有多层卷积层和池化层，卷积滤波器包含一组线性支持向量机滤波器，终端102可以在卷积层中利用原特征生成新的特征映射；例如，在每一个卷积层，通过从特征图像中提取不同区域的特征补丁来执行监督训练过程，获取的特征映射通过ReLU（Rectified Linear Units，激活函数）层传递。具体地，如图3所示，上述待识别图像输入目标识别模型前，可以首先将待识别图像按照预设数量的通道进行提取，例如将待识别图像中提取三个通道的图像，三个通道的图像可以是具有不同特征的图像，终端102可以将三个通道的图像输入上述目标识别模型；各层卷积层输出特征图像并进行特征映射的公式可以如下所示：

，其中，*为卷积算子，

表示

输入在l层的

特征图输出，f为ReLU激活函数，

为支持向量机滤波器的权重和偏置值，

为通过第i通道输入目标识别模型的图像，l表示第l层卷积层。并且，上述物体识别子模型可以是SVM（Support Vector Machine，支持向量机）模型，终端102还可以利用上述物体识别子模型在池化过程的基础上缩减大小并对最终提取的特征矩阵进行线性SVM分类。具体地，终端102可以将提取出的特征图像插入池化层，减小下一层输入的空间大小，例如可以使用平均或最大池操作来减少空间大小，最后的分类任务是根据从CSVM的级联卷积层和池化层中提取的高级特征通过二值支持向量机分类器进行分类。其中，上述特征矩阵可以是由多个特征图像组成的矩阵，终端102可以将特征矩阵整合为特征波形，从而进行SVM分类；上述目标识别模型可以是通过无监督学习方法进行机器学习的。

步骤S206，根据目标识别模型输出的识别结果，确定待识别图像中待识别的地埋物的类型。

其中，目标识别模型可以对上述待识别图像进行识别，例如识别其中的地埋物，并输出相应的识别结果。具体地，上述待识别图像可以是波形图，而波形图的形式不同，代表的地埋物类型也不同，因此可以终端102可以利用目标识别模型，根据波形图的特征确定地埋物类型，上述地埋物的类型可以包括多种，例如，在一个实施例中，待识别的地埋物的类型包括以下至少一种：待识别的地埋物的材料、形状以及土壤类型。每种类型中还可以包括多种类别，例如，在材料分类方面，主要有5种类型的地埋物。分别是Alimunia

，

，尼龙

，

，完美导体

，

，硅

，

和木材

，

。针对形状分类问题，主要有矩形、圆形和三角形3种。最后对土壤类型划分的问题，模拟了3种不同土壤类型的湿度，干燥土壤

，

，微湿土壤

，

，湿润土壤

，

。其中，

为电导率，

为导体介质参数。终端102可以获取目标识别模型输出的对地埋物类型的识别结果，从而确定待识别图像中的地埋物的类型。

上述物体识别方法中，通过获取包括待识别的地埋物的待识别图像，将待识别图像输入包括特征提取子模型和物体识别子模型的目标识别模型中，并通过包括多个卷积层的特征提取子模型以及物体识别子模型识别待识别图像中的待识别的地埋物并输出识别结果，根据目标识别模型输出的识别结果确定待识别图像中待识别的地埋物的类型。相较于传统的通过霍夫变换等方式检测探地雷达图像中的地埋物，本方案利用包括多个卷积层的特征提取子模型以及物体识别子模型识别待识别图像中的地埋物类型，从而实现提高地埋物体的识别精度的效果。

在一个实施例中，对探地雷达扫描图像进行灰度处理以及数据增强处理，得到待识别图像包括：对探地雷达扫描图像的色相、饱和度以及色相、饱和度和强度进行颜色空间转换；对进行颜色空间转换的探地雷达扫描图像添加散斑噪声，得到待识别图像。

本实施例中，终端102可以通过探地雷达得到上述待识别图像，终端102可以通过探地雷达得到探地雷达扫描图，终端102通过对探地雷达扫描图进行灰度处理和数据增强后，可以得到上述待识别图像。例如，终端102可以对通过探地雷达得到的探地雷达扫描图像的色相、饱和度，以及色相、饱和度和强度进行颜色空间转换，完成对探地雷达扫描图像的灰度处理；终端102还可以对进行颜色空间转换后的探地雷达扫描图像添加散斑噪声，从而实现对待识别图像的数据增强处理。

通过本实施例，终端102可以对探地雷达扫描图像进行灰度处理，提高目标识别模型对待识别图像的识别精度，终端102还可以对探地雷达扫描图像进行数据增强处理，从而可以准确识别待识别图像中的位移情况。

在一个实施例中，还包括：获取多个样本图像以及待训练的识别模型对应的权重和偏置值；多个样本图像包括测试样本图像和真实样本图像；将测试样本图像输入待训练的识别模型，获取待训练的识别模型针对测试样本图像的输出结果；待训练的识别模型用于根据权重和偏置值以及待训练的特征提取子模型中的多个卷积层提取测试样本图像中待识别的地埋物对应的样本特征图像，根据待训练的物体识别子模型识别样本特征图像对应的地埋物的样本波形结构并输出；判断样本波形结构与真实样本图像中对应的地埋物的真实波形结构的相似度是否大于或等于预设阈值；若否，根据当前样本波形结构以及当前真实波形结构，调整权重和偏置值，得到新的待训练的识别模型，返回将测试样本图像输入待训练的识别模型的步骤；若是，结束循环，根据循环结束时的权重和偏置值，得到目标识别模型。

本实施例中，终端102可以通过多个样本图像训练得到上述目标识别模型。例如，终端102可以获取多个样本图像以及待训练的识别模型对应的权重和偏置值，其中多个样本图像包括测试样本图像和真实样本图像，测试样本图像可以是基于模拟探地雷达扫描图像生成的，真实样本图像可以是基于真实探地雷达扫描图像生成的。其中，模拟探地雷达扫描图像可以通过终端102中的软件生成得到，真实样本图像可以是通过探地雷达扫描得到。终端102可以将测试样本图像输入待训练的识别模型，并获取待训练的识别模型针对测试样本图像的输出结果。其中，待训练的识别模型可以包括待训练的特征提取子模型以及待训练的物体识别子模型，终端102可以利用待训练的特征提取子模型中的多个卷积层，逐层提取测试样本图像中的待识别的地埋物对应的样本特征图像，其中，特征提取子模型可以是基于上述权重和偏置值进行特征的提取。例如通过特定的函数进行提取。终端102可以将待训练的特征提取子模型输出的待识别的地埋物对应的样本特征图像，利用待训练的物体识别子模型识别特征图像中对应的地埋物的样本波形结构，从而识别地埋物的类别并输出相应的识别结果。终端102可以判断上述样本波形结构与对应的真实样本图像中的相应地埋物的真实波形结构的相似度是否大于或等于预设阈值，若终端102判断为否，则说明当前待训练的识别模型的识别精度不足，此时终端102可以调整上述权重和偏置值，从而得到新的待训练的识别模型，并返回将测试样本图像输入待训练的识别模型的步骤，从而终端102可以开始下一轮训练。

当终端102检测到样本波形结构与真实样本图像中对应的地埋物的真实波形结构的相似度是否大于或等于预设阈值时，可以确定待训练的识别模型训练完成，从而终端102可以结束循环，并根据结束循环时得到的权重和偏置值，得到上述目标识别模型。

另外，在一个实施例中，上述目标识别模型的训练过程可以如图4所示，图4为一个实施例中训练目标识别模型的流程示意图。当上述样本图像数量小于预设数量时，终端102可以通过多个通道将样本测试图像输入第一待训练的识别模型，并且该第一待训练的识别模型可以是规格较小的识别模型，终端102通过对规格较小的第一待训练的识别模型进行训练，得到第一目标识别模型，终端102可以将训练完成的第一目标识别模型的相关参数，如权重和偏置值等，传递至规模较大的第二待训练的识别模型，得到第二目标识别模型，从而终端102可以利用第二目标识别模型进行待识别图像的识别，并且在识别过程中对权重和偏置值等参数进行优化。从而实现在样本数量较小时仍可以得到较高精度的目标识别模型的效果。

通过上述实施例，终端102可以利用样本图像对待训练的识别模型进行训练，从而得到用于识别待识别图像中的地埋物的目标识别模型，提高了地埋物体识别的精度。

在一个实施例中，获取多个样本图像，包括：获取包括待识别的地埋物的多个模拟探地雷达扫描图像以及包括待识别的地埋物的多个真实探地雷达扫描图像；对多个模拟探地雷达扫描图像以及包括待识别的地埋物的多个真实探地雷达扫描图像均进行灰度处理以及数据增强处理；得到处理后的模拟探地雷达扫描图像以及样本真实图像；根据迁移学习算法获取处理后的模拟探地雷达扫描图像中的前景图像以及背景图像，作为多个样本测试图像；根据多个样本测试图像以及多个样本真实图像，得到多个样本图像。

本实施例中，终端102可以对待训练的识别模型进行训练，在训练过程中需要获取多个样本图像，终端102可以获取包括待识别的地埋物的多个模拟探地雷达扫描图像以及包括待识别的地埋物的多个真实探地雷达扫描图像，其中，模拟探地雷达扫描图像可以是通过计算机模拟得到的图像，真实探地雷达扫描图像可以是通过探地雷达扫描得到的图像。终端102可以对上述各个模拟探地雷达扫描图像和多个真实探地雷达扫描图像均进行灰度处理和数据增强处理，从而得到处理后的模拟探地雷达扫描图像以及样本真实图像，即上述样本真实图像仅需要进行灰度处理和数据增强处理。

另外，终端102还可以利用迁移学习算法，获取处理后的模拟探地雷达扫描图像中的前景图像以及背景图像，并且终端102还可以对前景图像和背景图像进行排列组合，从而实现图像的数量增加，并将增加数量后的图像作为样本测试图像。从而终端102可以根据上述多个样本测试图像以及多个样本真实图像，得到用于训练待训练的识别模型的多个样本图像。

具体地，终端102可以通过GprMax模拟器生成第一预设数量的探地雷达扫描图像，例如4280张GPRB扫描图像，作为模拟探地雷达扫描图像，其中，终端102可以随机选择第二预设数量的图像为测试集，例如2140张，即上述测试样本图像的数量，并且终端10还可以将训练数据分为多个组，例如分为267个、535个、1070个、1605个和2140个5组训练实例，分析模型对训练样本数量的敏感性。在训练和测试阶段，训练和测试的图像都被重新缩放以适应CNN和CSVM架构的输入。终端102得到上述模拟探地雷达扫描图像后，可以通过从色相、饱和度到色相、饱和度、强度的颜色空间转换，实现灰度处理，以及通过添加散斑噪声实现数据增强，并且由于数据集中包含感兴趣的对象，即前景图像和负图像，即背景图像，终端102还可以利用迁移学习机制，获取上述模拟探地雷达扫描图像中的前景图像和背景图像，并进行排列组合，实现对模拟图像的数量增加。除了模拟图像外，终端102还可以获取第三预设数量的真实GPRB扫描图像作为真实样本图像，并且对真实样本图像进行上述灰度处理和数据增强处理。

通过本实施例，终端102可以利用模拟探地雷达扫描图像以及真实探地雷达扫描图像得到上述样本图像，从而可以利用样本图像对待训练的识别模型进行训练，实现提高地埋物识别精度的效果。

在一个实施例中，将测试样本图像输入待训练的识别模型，获取待训练的识别模型针对测试样本图像的输出结果，包括：从测试样本图像中提取预设数量通道的测试样本输入图像；将测试样本输入图像按照预设数量通道输入待训练的识别模型中的多个卷积层；根据从各个通道输入的测试样本输入图像、预设类标签以及预设图像修正权值，通过预设成本函数得到测试样本图像对应的权重和偏置值；针对每层卷积层，若当前卷积层为第一层卷积层，根据测试样本输入图像、预设卷积算子、权重和偏置值，得到当前层卷积层中测试样本输入图像对应的第一特征图像，将第一特征图像输入下一层卷积层中；若当前卷积层不为第一层卷积层，根据上一层卷积层输入的第一特征图像、预设卷积算子、权重和偏置值，得到当前层卷积层中测试样本输入图像对应的第二特征图像，将第二特征图像输入下一层卷积层中，直到第二特征图像到达最后一层卷积层；将最后一层卷积层输出的第二特征图像发送至池化层；池化层用于对第二特征图像进行缩小处理并通过预设激活函数进行激活，将激活后的第二特征图像发送至待训练的物体识别子模型；获取物体识别子模型根据第二特征图像识别的样本波形结构，得到输出结果。

本实施例中，终端102可以利用上述测试样本图像以及真实样本图像对待训练的识别模型进行训练，终端102可以从测试样本图像中提取预设数量通道的测试样本输入图像。例如，终端102可以从

的补丁图像中提取出一个3通道的图像

，处理完所有图像后，把它定义为

的数据集。终端102还可以将上述测试样本输入图像按照预设数量的通道输入待训练的识别模型中的多个卷积层，上述测试样本输入图像可以在多个卷积层中逐层进行训练，并且每层的训练精度逐渐提高。

终端102可以根据各个通道输入的测试样本输入图像、预设类标签以及预设图像修正权值，通过对预设成本函数进行优化，得到测试样本图像对应的权重和偏置值。例如，终端102可以从训练数据中随机选择子集学习一系列支持向量机滤波器。终端102可以设定输入映射的相关参数，例如，终端102可以令，和分别为输入映射的高度、宽度和深度，权重和偏置值的具体公式可以如下所示：

，其中，

为类标签，x_i为通过第i通道输入的测试样本输入图像，b为图像权重值，用于修正边缘模糊等情况。终端102通过预设成本函数，例如函数最小值，确定各支持向量机滤波器的权重

和偏置值。

终端102可以在上述各个卷积层中进行特征的提取，例如，针对每层卷积层，若该卷层为第一层，则终端102可以利用输入的测试样本输入图像，预设的卷积算子、权重和偏置值，得到该层卷积层中测试样本输入图像对应的第一特征图像，并将第一特征图像输入到下一层卷积层中。若当前卷积层不为第一层卷积层，则终端102可以根据上一层卷积层输入的第一特征图像，预设卷积算子、权重和偏置值，得到当前卷积层中测试样本输入图像对应的第二特征图像，并将第二特征图像输入到下一层卷积层中，直到第二特征图像到达最后一层卷积层。其中，上述每层卷积层提取特征时可以对图像中的不同区域进行特征提取。具体地，终端102可以利用迁移学习机制训练卷积神经网络（CNN）形成预训练模型；并在CNN中使用K近邻(KNN)和支持向量机(SVM)代替Softmax分类器，作为卷积滤波器来创建特征映射，即终端102对上述测试样本输入图像进行特征提取时，可以首先提取特征，并对特征进行聚类，得到该测试样本输入图像对应的特征图像，在每层卷积层中，终端102可以选择优化算法更新CNN结构内的参数，利用原特征生成新的特征映射，在每一个卷积层，通过从特征图中提取不同区域的补丁来执行监督训练过程，终端102在每层中可以利用原特征生成新的特征映射，在每一个卷积层，通过从特征图中提取不同区域的特征补丁来执行监督训练过程。例如，对于第l层，第层的输出特征映射是通过将输入特征映射与训练有素的带有预定义步幅的滤波器卷积并应用非线性函数，特征提取的公式可以如下所示：

；其中， x_i为不同通道的测试样本输入图像，*为卷积算子，

表示

输入在l层的

特征图输出，f为ReLU激活函数，

为支持向量机滤波器的权重和偏置值，

为通过第i通道输入目标识别模型的图像，l表示第l层卷积层。

经过最后一层卷积层的特征提取后，终端102可以得到最后一层卷积层输出的第二特征图像，终端102可以将最后一层卷积层输出的第二特征图像发送至池化层，终端102可以通过池化层对第二特征图像进行缩小处理并通过预设激活函数进行激活，将激活后的第二特征图像发送至待训练的物体识别子模型，从而终端102可以利用待训练的物体识别子模型对第二特征图像进行波形识别，得到待训练的物体识别子模型输出的样本波形结构，从而得到待训练的识别模型的输出结果。具体地，终端102可以将获取的第二特征图像，作为特征映射，通过ReLU层传递，并在池化过程的基础上缩减大小，对最终提取的特征矩阵进行线性SVM分类。其中，上述池化层可以是用于减小下一层输入空间大小的层，终端102可以利用平均或最大池操作来减少空间大小。对于分类任务，终端102可以根据从CSVM的级联卷积层和池化层中提取的高级特征训练一个二值支持向量机分类器。

通过上述实施例，终端102可以利用待训练的特征提取子模型中的多层卷积层，对测试样本输入图像进行多层特征提取，并通过物体识别子模型进行地埋物类型的识别，从而可以提高目标识别模型对地埋物类型的识别精度。

在一个实施例中，如图5所示，图5为另一个实施例中物体识别方法的流程示意图。包括以下流程：本实施例中，终端102可以对本方案提供的物体识别方法的识别精度与其他识别方法的识别精度进行对比，得到本方案提供的物体识别方法的有效性。终端102可以通过GprMax模拟器生成第一数量的GPRB扫描图像，例如4280张，并随机选择第二数量的图像作为测试集，例如2140张，将训练数据分为多组训练实例，例如分为267个、535个、1070个、1605个和2140个5组训练实例，分析模型对训练样本数量的敏感性。

在训练和测试阶段，训练和测试的图像都被重新缩放以适应CNN和CSVM架构的输入，并对本方案提供的目标识别模型以及其他识别模型考虑了三种训练策略：即从零开始训练、预先训练和微调模型，使用Softmax和SVM两种分类器。在本实验中选择了AlexNet、VGG-16、GoogleNet、ResNet50和SqueezeNet预训练架构进行特征提取。

在数据选取阶段，终端102可以利用仿真软件进行探地雷达仿真参数的设定，包括：（1）发射机和接收机都选用偶极天线，偶极天线之间的距离设置为；（2）接地面到天线的距离设置为2mm；（3）仿真数据采用中心频率为2.6 GHz的Ricker波形，选取中心频率值从而提高探地雷达图像的分辨率；（4）源带宽设置为400MHz；（5）设置窗口时间为6ns；（6）探测域大小固定为60 ×30厘米。从而终端102可以利用设置为上述参数的仿真探地雷达进行仿真扫描。

终端可以通过上述模型对地埋物的类型进行识别，其中，地埋物的类型包括材料分类、形状分类和土壤分类等。在材料分类方面，主要有5种类型的地埋物。分别是Alimunia

，

，尼龙

，

，完美导体

，

，硅

，

和木材

，

，

，微湿土壤

，

，湿润土壤

，

。其中，

为电导率，

为导体介质参数。

在本实施例中，终端102可以使用GprMax模拟器生成1070张GPRB扫描图像，通过色相、饱和度和色相、饱和度、强度的颜色空间转换和散斑噪声的添加进行数据增强。最后通过前景图像和背景图像的排列组合，将模拟图像数量增加到4280张，所有的图像都是灰色的。除了模拟图像外，还利用了54张真实的GPRB扫描图像对形状类型进行分类。

本实施例中使用的识别模型可以是CSVM模型，可以包括三种类型的网络，每种网络包含三层CSVM。这三个网络在每一层的过滤器数量上有所不同。第一个网络称为小型CSVM模型，在每一层中包含384个、1024个和2048个过滤器。介质模型有768个、2048个和4096个过滤器。而大模型由1152个、3072个和6144个滤波器组成。在这三种模型中，第一个卷积层的滤波器大小为11×11和4个像素点。输出通过一个大小为3×3、像素点为3的窗口，然后作为输入到下一个卷积层。第二个卷积层有5×5个卷积核和1个像素点，且该层中包括一个窗口大小为3的最大池化层和2个像素点。最后一层由一个3×3卷积核、1个像素点的卷积层，和一个2×2窗口大小、1个像素点的最大池化层组成，所有的卷积层都使用ReLu激活函数。

上述小型CSVM模型、介质模型和大模型均可以分别设置为零训练模型、预训练模型和微调模型。其中零训练模型可以是未经过训练的模型、预训练模型和微调模型可以是经过训练的模型，且微调模型的训练精度大于预训练模型。在微调模型中，终端102通过迁移学习将CNN结构参数赋值为初始值，因此获得了更快的训练速度和更高的分类精度。在预训练的模型中，终端102根据CNN算法进行特征提取过程。在零续训练模型中CNN参数都是随机选取的，要花费大量时间才能形成最佳模型，而且其性能无法再次优化。终端102可以采用Softmax和SVM结果进行对比分析并使用不同数量的训练数据来分析模型中训练图像的敏感性。

在对比实验分析中，终端102可以使用传统的机器学习方法GLCM（Grey-Level Co-occurrence Matrix，灰度共生矩阵）、GLRLM（gray-level run-length matrix，灰度行程矩阵）和ACF（Aggregate Channel Features，聚合通道特征）以及稀疏表示方法进行特征提取，训练高斯支持向量机分类器进行预测。终端102还可以将SVM和Softmax分类器的总体准确率作为一个性能指标，用于比较的所有训练策略和模型，即正确分类的百分比。

终端102可以对上述小型CSVM模型、介质模型和大模型中分别进行基于零训练、预训练和微调的识别，并得到识别结果。终端102为分析训练数据的敏感性，分别改变267、535、1070、1605和2140四个训练数据个数。采用2140张GPRB扫描图像对模型进行测试。在深度学习结构中，AlexNet、GoogleNet、VGG-16、ResNet、SquezeeNet和3种类型的CSVM模型是首选。此外，这些结构在零训练、预先训练和微调的模型中进行训练，使用Softmax和Gaussian SVM来测试分类器的性能。

对于零训练模型中的材料类型分类，AlexNet + SVM结构的分类准确率达到86.17%。VGG-16和SquezeeNet结构的精度均达到20.11%。准确率低的主要原因是这些网络需要更多的训练数据。由于GoogleNet和ResNet的总计算时间不考虑scratch模型，在所有分类中，CSVM仅作为划痕模型。如表1所示，大型CSVM模型以2140张训练图像对地埋物材料类型的分类准确率最高，达到95.46%。在预训练模型中，在2140张训练图像中，ResNet +Softmax分类准确率最高，达到56.78%，Google + SVM的最低准确率为28.05%。在微调模型中，ResNet + Softmax的准确率最低，为43.68%；另一方面，VGG-16 + SVM在2140张训练图像中的效果更好，达到94.16%。

在零训练模型的形状分类中，AlexNet + SVM在2140张训练图像中分类准确率最高，为98.74%，而VGG + SVM在1605张训练图像中分类准确率最低，为30.07%。在预训练模型中，在2140张训练图像中，ResNet + Softmax的准确率最高，为95.32%，其次是SquezeeNet+ SVM的准确率最低，为67.34%。VGG-16 + Softmax采用1605张训练图像进行微调模型，形状类型分类的结果最高，达到98.96%。此外在微调模型中，ResNet + Softmax对267张训练图像的分类结果最低，为89.57%。在真实的GPR B扫描图像中，大型CSVM模型的形状分类精度达到了最高的74.07%。

在土壤类型分类中，大型CSVM模型在2140张训练图像中准确率最高，达到99.76%。一般来说，VGG-16和SquezeeNet在scratch模型中准确率最低，为33.33%。对于预训练模型，在2140张训练图像中，ResNet + Softmax的分类准确率最高，达到98.27%。Squeeze Net+SVM在267张训练图像中的准确率最低为53.94%。在微调模型中，有四种结构，其精度最高为99.59%。使用ResNet + Softmax的最低准确率为94.93%。

在计算时间方面，深度学习结构中小型CSVM模型的计算时间最少，约为2小时。VGG-16完成了最长时间741分钟的训练过程。

终端102还可以利用高斯支持向量机对GLCM、GLRLM、ACF和稀疏特征进行分类。在分类结果中，GLRLM + SVM模型对材料、形状、土壤类型的正确分类率分别为19.71%、33.19%和32.06%，分类效果最好，分析结果如表1所示。

表1传统机器学习方法分类精度汇总表

由表1可知，在分析GPRB扫描图像时，经典机器学习方法中的统计特征提取不足。CSVM和CNN比传统的机器学习方法更能有效的提取图像的区域和边缘特征，因为它们本身具有较强的提取弱边缘特征的能力。本实验采用CSVM模型中的线性支持向量机进行特征提取，在CNN结构中它们的性能优于卷积滤波器。CSVM模型中的层数应根据训练数据的数量正确调整，随着数据数量的增加，卷积支持向量机的层数也会增加。

终端102还可以使用不同数量的线性支持向量机卷积滤波器来获得较高的测试精度和检测时间，如表2所示。

表2不同卷积深度分类时间汇总表

其中，性能时间取决于网络的深度和参数的数量。小型CSVM模型的性能最好，为0.1233s。持续时间最长的是ResNet，为0.3017s。当评估不同尺度的CSVM模型对GPRB扫描图像分析的结果时，可以看出它们的检测时间比其他两种CNN模型都要快。产生这些结果的主要原因是CSVM模型包含的参数较少。因此，与其他CNN模型相比，CSVM模型的检测次数较低，如表2所示。支持向量机的卷积滤波器具有优越的特征提取能力，具有较高的测试精度。

通过上述实施例可知，本方案利用包括多个卷积层的特征提取子模型以及物体识别子模型识别待识别图像中的地埋物类型，实现了提高地埋物体的识别精度的效果。

应该理解的是，虽然图2及图4-图5的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，图2及图4-图5中的至少一部分步骤可以包括多个步骤或者多个阶段，这些步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。

在一个实施例中，如图6所示，提供了一种物体识别装置，包括：获取模块500、识别模块502和确定模块504，其中：

获取模块500，用于获取待识别图像；待识别图像中包括待识别的地埋物。

识别模块502，用于将待识别图像输入目标识别模型；目标识别模型包括特征提取子模型以及物体识别子模型；特征提取子模型包括多个卷积层；目标识别模型用于根据特征提取子模型中的多个卷积层以及物体识别子模型识别待识别图像中的待识别的地埋物并输出识别结果；目标识别模型基于多个样本图像对特征提取子模型以及物体识别子模型进行训练得到。

确定模块504，用于根据目标识别模型输出的识别结果，确定待识别图像中待识别的地埋物的类型。

在一个实施例中，上述获取模块500，具体用于通过探地雷达获取探地雷达扫描图像；对探地雷达扫描图像进行灰度处理以及数据增强处理，得到待识别图像。

在一个实施例中，上述获取模块500，具体用于对探地雷达扫描图像的色相、饱和度以及色相、饱和度和强度进行颜色空间转换；对进行颜色空间转换的探地雷达扫描图像添加散斑噪声，得到待识别图像。

在一个实施例中，上述装置还包括：训练模块，用于获取多个样本图像以及待训练的识别模型对应的权重和偏置值；多个样本图像包括测试样本图像和真实样本图像；将测试样本图像输入待训练的识别模型，获取待训练的识别模型针对测试样本图像的输出结果；待训练的识别模型用于根据权重和偏置值以及待训练的特征提取子模型中的多个卷积层提取测试样本图像中待识别的地埋物对应的样本特征图像，根据待训练的物体识别子模型识别样本特征图像对应的地埋物的样本波形结构并输出；判断样本波形结构与真实样本图像中对应的地埋物的真实波形结构的相似度是否大于或等于预设阈值；若否，根据当前样本波形结构以及当前真实波形结构，调整权重和偏置值，得到新的待训练的识别模型，返回将测试样本图像输入待训练的识别模型的步骤；若是，结束循环，根据循环结束时的权重和偏置值，得到目标识别模型。

在一个实施例中，上述训练模块，具体用于获取包括待识别的地埋物的多个模拟探地雷达扫描图像以及包括待识别的地埋物的多个真实探地雷达扫描图像；对多个模拟探地雷达扫描图像以及包括待识别的地埋物的多个真实探地雷达扫描图像均进行灰度处理以及数据增强处理；得到处理后的模拟探地雷达扫描图像以及样本真实图像；根据迁移学习算法获取处理后的模拟探地雷达扫描图像中的前景图像以及背景图像，作为多个样本测试图像；根据多个样本测试图像以及多个样本真实图像，得到多个样本图像。

在一个实施例中，上述训练模块，具体用于从测试样本图像中提取预设数量通道的测试样本输入图像；将测试样本输入图像按照预设数量通道输入待训练的识别模型中的多个卷积层；根据从各个通道输入的测试样本输入图像、预设类标签以及预设图像修正权值，通过预设成本函数得到测试样本图像对应的权重和偏置值；针对每层卷积层，若当前卷积层为第一层卷积层，根据测试样本输入图像、预设卷积算子、权重和偏置值，得到当前层卷积层中测试样本输入图像对应的第一特征图像，将第一特征图像输入下一层卷积层中；若当前卷积层不为第一层卷积层，根据上一层卷积层输入的第一特征图像、预设卷积算子、权重和偏置值，得到当前层卷积层中测试样本输入图像对应的第二特征图像，将第二特征图像输入下一层卷积层中，直到第二特征图像到达最后一层卷积层；将最后一层卷积层输出的第二特征图像发送至池化层；池化层用于对第二特征图像进行缩小处理并通过预设激活函数进行激活，将激活后的第二特征图像发送至待训练的物体识别子模型；获取物体识别子模型根据第二特征图像识别的样本波形结构，得到输出结果。

关于物体识别装置的具体限定可以参见上文中对于物体识别方法的限定，在此不再赘述。上述物体识别装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中，提供了一种计算机设备，该计算机设备可以是终端，其内部结构图可以如图7所示。该计算机设备包括通过系统总线连接的处理器、存储器、通信接口、显示屏和输入装置。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信，无线方式可通过WIFI、运营商网络、NFC（近场通信）或其他技术实现。该计算机程序被处理器执行时以实现一种物体识别方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏，该计算机设备的输入装置可以是显示屏上覆盖的触摸层，也可以是计算机设备外壳上设置的按键、轨迹球或触控板，还可以是外接的键盘、触控板或鼠标等。

本领域技术人员可以理解，图7中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在一个实施例中，提供了一种计算机设备，包括存储器和处理器，存储器中存储有计算机程序，该处理器执行计算机程序时实现上述的物体识别方法。

在一个实施例中，提供了一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现上述的物体识别方法。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器（Read-Only Memory，ROM）、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器（Random Access Memory，RAM）或外部高速缓冲存储器。作为说明而非局限，RAM可以是多种形式，比如静态随机存取存储器（Static Random Access Memory，SRAM）或动态随机存取存储器（Dynamic Random Access Memory，DRAM）等。

以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请专利的保护范围应以所附权利要求为准。

Claims

1.一种物体识别方法，其特征在于，所述方法包括：

获取待识别图像；所述待识别图像中包括待识别的地埋物；

2.根据权利要求1所述的方法，其特征在于，所述获取待识别图像，包括：

通过探地雷达获取探地雷达扫描图像；

3.根据权利要求2所述的方法，其特征在于，所述对所述探地雷达扫描图像进行灰度处理以及数据增强处理，得到所述待识别图像包括：

4.根据权利要求1所述的方法，其特征在于，所述方法还包括：

5.根据权利要求4所述的方法，其特征在于，所述获取多个样本图像，包括：

6.根据权利要求4所述的方法，其特征在于，将所述测试样本图像输入所述待训练的识别模型，获取所述待训练的识别模型针对所述测试样本图像的输出结果，包括：

7.根据权利要求1所述的方法，其特征在于，所述待识别的地埋物的类型包括以下至少一种：

所述待识别的地埋物的材料、形状以及土壤类型。

8.一种物体识别装置，其特征在于，所述装置包括：

9.一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的方法。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法。