CN111191593A

CN111191593A - 图像目标检测方法、装置、存储介质及污水管道检测装置

Info

Publication number: CN111191593A
Application number: CN201911399199.9A
Authority: CN
Inventors: 张进; 杨雷
Original assignee: Chengdu Yun Shang Lian Lian Environmental Technology Co Ltd
Current assignee: Chengdu Yun Shang Lian Lian Environmental Technology Co Ltd
Priority date: 2019-12-30
Filing date: 2019-12-30
Publication date: 2020-05-22

Abstract

本发明公开了一种图像目标检测方法，属于计算机技术领域，所述方法包括：获取待处理的目标图像；将所述目标图像输入卷积神经网络模型，提取至多5个特征图；基于所述卷积神经网络模型输出所述至多5个特征图中的每个特征图对应的预测框；通过检测模块对所有预测框进行目标识别，获得所述目标图像的识别结果；其中，所述检测模块包括依次相连的残差块和检测卷积层。本发明还公开了一种图像目标检测装置、存储介质和污水管道检测装置。该方法可在严格限制系统内存和计算成本的情况下进行图像准确识别检测。

Description

图像目标检测方法、装置、存储介质及污水管道检测装置

技术领域

本发明属于计算机技术领域，具体涉及到一种图像目标检测方法、装置、存储介质及污水管道检测装置。

背景技术

随着科技的发展，以及深度学习的兴起，对图像中目标进行识别的技术已成为计算机视觉非常重要技术之一，并且使用深度学习在图像目标检测领域中的应用得到巨大的突破，一系列基于深度学习算法的图像目标学习方法被提出来。例如，SSD(Single ShotMultiBox Detector)等深度学习算法。通过这些深度学习算法，可以从给定的图像中识别出某个物体所在的区域，如在图像上识别出人、车、或房子等物体。从而上述算法利用到了缺陷监测，风险检测等具体领域。

具体到污水管道领域，目前污水管道的目视检查是由经过认证的操作人员通过闭路电视(CCTV)完成的。由于操作人员的经验所限或疲劳，这是一项耗时、成本高且容易出错的工作。因此，目前存在通过卷积神经网络实现自动检测异常的技术，该技术不仅可以减少检查时间和成本，同时可以确保评估的准确性和质量。但是目前的污水管道缺陷检测模型训练过程要求较大的系统内存，且仍然存在耗时长、计算成本高、污水管道图像的检测速度非常慢的问题，无法在计算资源配置较小的移动终端上实施，很难满足移动端进行实时检测的需求。

发明内容

为了解决现有技术存在的上述问题，本申请实施例提供图像目标检测方法、装置、存储介质及污水管道检测装置，以在有限计算能力和存储资源的设备上较快地从获取的图像准确识别目标。

为了达到上述目的，本申请的实施例所采用的技术方案如下：

第一方面，本申请的实施例提供一种图像目标检测方法，包括：

获取待处理的目标图像；

将所述目标图像输入卷积神经网络模型，提取至多5个特征图；

基于所述卷积神经网络模型输出所述至多5个特征图中的每个特征图对应的预测框；

通过检测模块对所有预测框进行目标识别，获得所述目标图像的识别结果；其中，所述检测模块包括依次相连的残差块和检测卷积层。

进一步的，所述残差块包含卷积分支和残差分支，所述卷积分支中的第一卷积层的卷积核大小等于位于所述第一卷积层之后的第二卷积层的卷积核大小。

进一步的，所述卷积分支还包括第三卷积层，所述第一卷积层、所述第二卷积层和所述第三卷积层顺次相连；

其中，所述第一卷积层和所述第二卷积层的卷积核大小为3×3；所述第三卷积层的卷积核大小为1×1。

进一步的，所述残差分支包括残差卷积层，所述残差卷积层的卷积核等于所述第三卷积层的卷积核大小。

进一步的，将所述目标图像输入卷积神经网络模型前，将所述待处理的目标图像缩放为设定尺寸、设定通道数的图像。

进一步的，所述图像为尺寸为416×416，3通道的RGB图。

进一步的，所述检测卷积层的卷积核大小为1×1。

第二方面，本申请的实施例提供一种图像目标检测装置，包括：

获取单元，用于获取待处理的目标图像，且所述获取单元能够将所述目标图像缩放为设定尺寸、设定通道数的图像。

第一处理单元，用于将所述目标图像输入卷积神经网络模型，提取至多5个特征图。

第二处理单元，用于基于所述卷积神经网络模型输出所述至多5个特征图中的每个特征图对应的预测框；

第三处理单元，通过检测模块对所有预测框进行目标识别，获得所述待处理目标图像的识别结果；其中，所述检测模块包括依次相连的残差块和检测卷积层。

第三方面，本申请的实施例提供一种计算机可读介质，存储有计算机程序，所述计算机程序被处理器执行时实现如前所述的图像目标检测方法。

第四方面，本申请的实施例提供一种污水管道检测装置，包括：

管道图像采集模块，用于实时获取污水管道图像；

管道图像检测识别模块，用于将所述目标图像输入卷积神经网络模型，提取至多5个特征图；基于所述卷积神经网络模型输出所述至多5个特征图中的每个特征图对应的预测框；通过检测模块对所有预测框进行目标识别，获得所述目标图像的识别结果；其中，所述检测模块包括依次相连的残差块和检测卷积层；

内置系统模块，用于接收所述识别结果，并根据所述识别结果调取对应的污水管道维修方案；以及

显示装置，用于接收并显示存在缺陷的图像和所述污水管道维修方案。

与现有技术相比，本申请的实施例提供的图像目标检测方法，以及可以实施该方法的装置、存储介质以及污水管道检测装置可以在有限的计算资源和内存条件下，通过使用五个特征图用于预测减少参数量与计算量，并加入轻量化的残差块确保特征的表达，从而在严格限制系统内存和计算成本的情况下，获得高质量的卷积神经网络模型，以对图像中的目标实现精确的检测识别，从而能够处理污水管道缺陷检测任务，取得污水管道缺陷检测中时效性和精确性的统一。

参照后文的说明和附图，详细公开了本发明的特定实施方式，指明了本发明的原理可以被采用的方式。应该理解，本发明的实施方式在范围上并不因而受到限制。在所附权利要求的精神和条款的范围内，本发明的实施方式包括许多改变、修改和等同。

针对一种实施方式描述和/或示出的特征可以以相同或类似的方式在一个或更多个其它实施方式中使用，与其它实施方式中的特征相组合，或替代其它实施方式中的特征。

应该强调，术语“包括/包含”在本文使用时指特征、整件、步骤或组件的存在，但并不排除一个或更多个其它特征、整件、步骤或组件的存在或附加。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本申请的较佳实施例的步骤示意图；

图2是本申请的较佳实施例的特征图示意图；

图3是本申请的较佳实施例的残差块示意图；

图4是本申请的较佳实施例的装置结构示意图；

图5是本申请的较佳实施例的污水管道检测装置示意图。

具体实施方式

为了使本技术领域的人员更好地理解本发明中的技术方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都应当属于本发明保护的范围。

需要说明的是，当元件被称为“设置于”另一个元件，它可以直接在另一个元件上或者也可以存在居中的元件。当一个元件被认为是“连接”另一个元件，它可以是直接连接到另一个元件或者可能同时存在居中元件。本文所使用的术语“垂直的”、“水平的”、“左”、“右”以及类似的表述只是为了说明的目的，并不表示是唯一的实施方式。

除非另有定义，本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施方式的目的，不是旨在于限制本发明。本文所使用的术语“和/或”包括一个或多个相关的所列项目的任意的和所有的组合。

本发明实施例提供的图像目标检测方法和图像目标检测装置可设置在任何的网络设备中，用于对拍摄的图片以及视频中的每帧图像进行检测识别操作，主要用于污水管道的缺陷类别识别。该网络设备可以包括终端或服务器等，该终端包括但不限于个人计算机、手持式或穿戴型设备、移动终端、多处理器系统化、小型计算机、以及包括上述任意系统或设备的分布式计算环境等。该终端优选为安装有图像目标检测应用的移动终端，该移动终端可对图像中的目标区域进行快速特征提取，并识别特征类别，且对移动终端自身的配置资源的需求较低，从而实现实时的图像快速检测识别。

参阅图1，本发明实施例提供一种图像目标检测方法，包括：

步骤S1：获取待处理的目标图像；

步骤S2：将所述目标图像输入卷积神经网络模型，提取至多5个特征图；

步骤S3：基于所述卷积神经网络模型输出所述至多5个特征图中的每个特征图对应的预测框；

步骤S4：通过检测模块对所有预测框进行目标识别，获得所述目标图像的识别结果；其中，所述检测模块包括依次相连的残差块和检测卷积层。

详细介绍如下：

在步骤S1中，获取待处理的目标图像。

在本发明的一个实施例中，待处理的目标图像可以是进行视觉处理的图像，特别是需要识别图像中的物体的缺陷类别的图像。该图像可以是高频相机拍摄的一系列照片，也可以是摄像机拍摄的录像中的连续的每一帧图像。

在步骤S2中，将所述目标图像输入卷积神经网络模型，提取至多5个特征图。

在本发明的一个实施例中，为了减少卷积神经网络模型的计算量，以不同于原始单样本多边框检测器(Single Shot MultiBox Detector,SSD)的方式构建目标检测网络，也即是仅使用至多5个特征图用于检测识别。

参阅图2，较佳的，本发明的一个实施例中，该图像目标检测方法仅有5个特征图(feature map)，特征图的尺寸即为：19×19,10×10,5×5,3×3和1×1。为了减少计算量没有如现有技术中一样使用38×38的特征图。

具体的，步骤S4如同现有的SSD目标检测算法一样，在每个特征图生成预测框。对于每个预测框，首先根据类别置信度确定其类别(置信度最大者)与置信度值，并过滤掉属于背景的预测框。然后根据置信度阈值过滤掉阈值较低的预测框。对于留下的预测框进行解码，根据先验框得到其真实的位置参数。解码之后，一般需要根据置信度进行降序排列，然后仅保留最高的若干个预测框，比如200个。最后就是进行非极大抑制算法(Non-MaximumSuppression，NMS)算法，过滤掉那些重叠度较大的预测框。最后剩余的预测框就是检测结果了。

在至多使用5个特征图的情况下，为了确保在特征提取中特征的表达能力，所述检测模块包括依次相连的残差块(Residual Block)和检测卷积层。

残差块中的卷积层在进行卷积操作时，既保证了对特征提取的处理，又能够确保不会遗失任何一个特征点，进而可以确保特征网络表达能力，从而确保图像特征提取的准确性，提高了图像识别的准备率。

具体的，参阅图3，为本发明实施例的残差块的每个卷积阶段中的残差块结构示意图。为了避免增加计算量，以使得本发明实施例提供的图像目标检测方法和目标检测装置均可于移动终端上使用。所述残差块为轻量化的残差块，即仅有残差块的数量仅仅有一个。所述残差块包含卷积分支和残差分支，残差分支由卷积分支的输入指向卷积分支的输出。

为了避免增加计算量，以使得本发明实施例提供的图像目标检测方法和目标检测装置均可于移动终端上使用，其中，所述卷积分支中的第一卷积层的卷积核大小等于位于所述第一卷积层之后的第二卷积层的卷积核大小。所述卷积分支还包括第三卷积层，所述第一卷积层、所述第二卷积层和所述第三卷积层顺次相连。具体的，所述第一卷积层和所述第二卷积层的卷积核大小为3×3；所述第三积层的卷积核大小为1×1。该第三卷积层的数量为256，第一卷积层和第二卷积层的数量均为128，而第三卷积层的数量为256.即使用最后一个1×1的卷积层还原，既保持了计算的精度，又减少了计算量。

可选的，所述卷积分支包括残差卷积层，所述残差卷积层的卷积核小于位于所述第三卷积层的卷积核大小。在本发明的一个实施例中，残差卷积层的卷积核的大小为1×1，卷积核数量为256。

具体的，对于残差块而言，如果其输入和输出具有相同的尺寸，那么残差分支是一个恒等映射，但是如果其输入和输出的尺寸不同，那么需要通过一个卷积操作来将输入和输出映射到相同的尺寸上，即在残差分支上增加一个1×1的卷积层来实现。从而达到最优的处理效果。参阅图3，在本发明的一个实施例中，使用了一个两路密集层来得到不同尺度的感受野(receptive field)。其中一路使用一个1×1的较小卷积核，它能够较好地捕捉小尺度的目标。另一路使用串联的两个3×3和1×1的卷积核来学习大尺度目标的视觉特征，从而确保特征的表达能力，不会跳过任何一个特征点。

残差分支和卷积分支在元素层面上执行加法运算，得到每个残差块的输出，并将其作为检测卷积层的输入。

在本发明的一个实施例中，将所述目标图像输入卷积神经网络模型前，将所述待处理的目标图像缩放为设定尺寸、设定通道数的图像。通过将所述待处理的目标图像缩放为设定尺寸和设定通道数的图像，从而使得本发明实施例提供的图像目标检测方法和装置可以处理任意大小的图片。

在本发明的一个实施例中，所述图像为尺寸为416×416，3通道的RGB图。具体的，输入卷积神经网络模型中的为一张任意大小的图片，在保持长宽比不变的情况下，缩放至图片的长或者宽达到416，再把该缩放后的图覆盖在416×416的新图上，作为卷积神经网络模型的输入。

在本发明的一个实施例中，为了减少参数量与计算量，所述检测卷积层的卷积核大小为1×1。

在一具体的应用场景中，输入卷积神经网络模型中的为一张任意大小的图片，在保持长宽比不变的情况下，缩放至图片的长或者宽达到416，再把该缩放后的图覆盖在416×416的新图上，作为卷积神经网络模型的输入。也即是所述待处理的目标图像为尺寸为416×416，3通道的RGB图。将该RGB图输入到卷积神经网络模型后，通过相连的多个中间卷积层提取出5个特征图，特征图的尺寸即为：19×19,10×10,5×5,3×3和1×1。为了减少计算量没有如现有技术采用38×38的特征图。得到了特征图之后，需要通过检测模块，对特征图进行卷积得到检测结果。其中需要先生成先验框，而同一个特征图上每个单元设置的先验框是相同的，这里的数目指的是一个单元的先验框数目。先验框的设置，包括尺度和长宽比两个方面。先验框的具体生成规则为本领域技术人员已知的，此处不再赘述。在检测之前，卷积神经网络模型具有一个残差块，把残差块的输出作为检测卷积层的输入，从而确保特征的表达能力，避免特征在运算过程的丢失。检测卷积层对每个预测框的检测值包含两个部分：类别置信度和边界框位置，各采用一次1×1卷积来进行完成。对于每个预测框，首先根据类别置信度确定其类别(置信度最大者)与置信度值，并过滤掉属于背景的预测框。然后根据置信度阈值，例如0.5过滤掉阈值较低的预测框。对于留下的预测框进行解码，根据先验框得到其真实的位置参数。解码之后，一般需要根据置信度进行降序排列，然后仅保留最先的，如400个预测框。最后就是进行NMS算法，过滤掉那些重叠度较大的预测框。最后剩余的预测框就是检测结果了。

参阅图4，为了更好的实施本发明实施例提供的图像目标检测方法，本发明实施例还提供了一种图像目标检测装置，包括：获取单元、第一处理单元、和第二处理单元和第三处理单元。

其中，获取单元，用于获取待处理的目标图像。获取单元还能够将所述目标图像缩放为设定尺寸、设定通道数的图像。

第二处理单元，用于基于所述卷积神经网络模型输出所述至多5个特征图中的每个特征图对应的预测框。

第三处理单元，通过检测模块对所有预测框进行目标识别，获得所述目标图像的识别结果；其中，所述检测模块包括依次相连的残差块和检测卷积层。

本领域的技术人员可以理解，上述实施例的各种方法中的全部或者部分步骤可以通过指令来完成，或通过指令控制相关的硬件来完成，该指令可以存储于一计算机可读储介质中，并由处理器进行加载和执行。

为了更好的实施本发明实施例提供的图像目标检测方法，本发明实施例还提供了一种计算机可读介质，其存储有计算机程序，所述计算机程序被处理器执行时实现如前所述的图像目标检测方法。例如，该可读介质储存有多条指令，该指令能够被处理器进行加载，以执行本发明实施例所提供的图像目标检测方法，例如：步骤S1：获取待处理的目标图像；

以上各个操作的具体实施可参见前面的实施例，在此不再赘述。

其中，该可读介质可以包括：可读存储器(ROM)、随机存取记忆体(RAM、磁盘或者光盘等。

对于地下污水管道的缺陷检测，基于现有技术的监控、运营管理的难度较大，而目前人工目视容易受到人为因素影响而出错。目前最优的，通过闭路电视实时获取地下污水管道的图像的污水实时检测系统的运算成本大，不能及时得到检测结果，无法做到时效性、预测准确性的统一。因此，为了能够实时和快速处理管道缺陷检测任务，更好在污水管道监测领域实施本发明实施例提供的图像目标检测方法，参阅图5，本发明实施例还提供了一种污水管道检测装置，包括管道图像采集模块、管道图像检测识别模块、内置系统模块和显示装置。

其中，管道图像采集模块，用于实时获取污水管道的图像。

所述管道图像采集模块可采用移动设备或者移动终端上的摄像头，通过摄像头对污水管道进行拍摄，例如管道机器人上携带的摄像头。摄像头将采集的图像传输给后续的管道图像检测识别模块中。

管道图像检测识别模块，用于将所述目标图像输入卷积神经网络模型，提取至多5个特征图；基于所述卷积神经网络模型输出所述至多5个特征图中的每个特征图对应的预测框；通过检测模块对所有预测框进行目标识别，获得所述待处理目标图像的识别结果；其中，所述检测模块包括依次相连的残差块和检测卷积层。

具体的，该管道图像检测识别模块内构建有如前述实施例记载的高效的卷积神经网络模型，将管道图像采集模块获取的一系列图像输入到该卷积神经网络模型中。通过该卷积神经网络模型对拍摄的污水管道图像进行实时和快速的缺陷检测。实现污水管道的缺陷检测的实时和预测准确性的统一。同时，由于该卷积神经网络模型的计算成本较小，可以将该模块配置到移动端使用，从而在有限的计算资源和内存条件下，能够处理污水管道缺陷检测任务。

内置系统模块，用于接收所述识别结果，并根据所述识别结果调取对应的污水管道维修方案。具体的，在污水管道检测装置存储有各个污水管道缺陷类别对应的维修方案，在污水管道缺陷的实时检测结果出来后，即可调取对应的污水管道维修方案，从而便于维修作业马上进行，从而减少内部的时间运营成本。并将检测出存在管道缺陷的图像、缺陷类别和相关信息以及对应的污水管道维修方案保存在内置系统模块的数据库中。

显示装置，用于接收并显示存在缺陷的图像和所述污水管道维修方案。具体的，内置系统模块调取对应的污水管道维修方案后通过显示装置实现人机交互，便于操作者对相应位置进行维修操作。

因此，本污水管道检测装置可以配置在管道机器人和一移动终端上，实现实时和快速处理管道缺陷检测任务。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统、装置和方法，可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，又例如，多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-OnlyMemory)、随机存取存储器(RAM，RandomAccessMemory)、磁碟或者光盘等各种可以存储程序代码的介质。

最后应说明的是：以上实施例，仅为本发明的具体实施方式，用以说明本发明的技术方案，而非对其限制，本发明的保护范围并不局限于此，尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化，或者对其中部分技术特征进行等同替换；而这些修改、变化或者替换，并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以权利要求的保护范围为准。

Claims

1.一种图像目标检测方法，其特征在于，包括：

获取待处理的目标图像；

2.根据权利要求1所述的一种图像目标检测方法，其特征在于，所述残差块包含卷积分支和残差分支，所述卷积分支中的第一卷积层的卷积核大小等于位于所述第一卷积层之后的第二卷积层的卷积核大小。

3.根据权利要求2所述的一种图像目标检测方法，其特征在于，所述卷积分支还包括第三卷积层，所述第一卷积层、所述第二卷积层和所述第三卷积层顺次相连；

4.根据权利要求3所述的一种图像目标检测方法，其特征在于，所述残差分支包括残差卷积层，所述残差卷积层的卷积核等于所述第三卷积层的卷积核大小。

5.根据权利要求1所述的一种图像目标检测方法，其特征在于，将所述目标图像输入卷积神经网络模型前，将所述待处理的目标图像缩放为设定尺寸、设定通道数的图像。

6.根据权利要求5所述的一种图像目标检测方法，其特征在于，所述图像为尺寸为416×416，3通道的RGB图。

7.根据权利要求1所述的一种图像目标检测方法，其特征在于，所述检测卷积层的卷积核大小为1×1。

8.一种图像目标检测装置，其特征在于，包括：

获取单元，用于获取待处理的目标图像，且获取单元能够将所述目标图像缩放为设定尺寸、设定通道数的图像；

第一处理单元，用于将所述目标图像输入卷积神经网络模型，提取至多5个特征图；

9.一种计算机可读介质，存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1-7任一项所述的图像目标检测方法。

10.一种污水管道检测装置，其特征在于，包括：

管道图像采集模块，用于实时获取污水管道图像；