CN112766046A

CN112766046A - 一种目标检测方法及相关装置

Info

Publication number: CN112766046A
Application number: CN202011583896.2A
Authority: CN
Inventors: 唐健; 潘国峰; 石伟; 陶昆
Original assignee: Shenzhen Jieshun Science and Technology Industry Co Ltd
Current assignee: Shenzhen Jieshun Science and Technology Industry Co Ltd
Priority date: 2020-12-28
Filing date: 2020-12-28
Publication date: 2021-05-07
Anticipated expiration: 2040-12-28
Also published as: CN112766046B

Abstract

本申请公开了一种目标检测方法，包括将图像输入实例分割网络模型，通过所述实例分割网络模型对所述图像进行分析处理输出特征信息；对所述特征信息进行筛选得到检测目标的特征信息；依据所述检测目标的所述特征信息中的分割实例掩膜，得到所述检测目标的多边形轮廓。该目标检测方法能够降低误检和漏检概率，提高检测精度。本申请还公开了一种目标检测装置、设备及计算机可读存储介质，均具有上述技术效果。

Description

一种目标检测方法及相关装置

技术领域

本申请涉及安防监控技术领域，特别涉及一种目标检测方法；还涉及一种目标检测装置、设备以及计算机可读存储介质。

背景技术

随着计算机视觉技术的进步，目标检测技术在自动驾驶、人流量统计、考勤通行、安全监控等领域得到了广泛应用。目前，目标检测技术在中远距离场景(例如智慧交通、无人驾驶等场景)下取得了显著的效果。然而在近距离场景(例如人行通道闸、汽车驶出停车场卡口等场景)下仍存在严重的问题，主要体现在：1、目标距离相机太近导致目标检测框太大，从而产生误检和漏检的情况；2、针对广角相机，靠近相机视野边界的目标存在严重的扭曲或倾斜，从而导致检测模型的目标检测框更宽，从而影响检测精度。例如在人行通道闸场景下，由于人行通道闸自身高度的问题，导致辅助相机抓拍行人为行人身体一部分，因此在一定程度上会给检测带来误检；行人为非刚体，不同时空中具有较明显的形变，在不完整行人的情况下会产生误检；通行高峰期，不同行人之间存在一定的遮挡，会产生漏检；远离图像中心的目标(即靠近相机视野边界的目标)存在严重的扭曲或倾斜，给检测任务带来严重影响，导致此类目标的检测框较大，从而产生检测框中背景较多，不利于场景事件判断。

因此，如何降低误检和漏检概率，提高检测精度已成为本领域技术人员亟待解决的技术问题。

发明内容

本申请的目的是提供一种目标检测方法，能够降低误检和漏检概率，提高检测精度。本申请的另一个目的是提供一种目标检测装置、设备以及计算机可读存储介质，均具有上述技术效果。

为解决上述技术问题，本申请提供了一种目标检测方法，包括：

将图像输入实例分割网络模型，通过所述实例分割网络模型对所述图像进行分析处理输出特征信息；

对所述特征信息进行筛选得到检测目标的特征信息；

依据所述检测目标的所述特征信息中的分割实例掩膜，得到所述检测目标的多边形轮廓。

可选的，所述对所述特征信息进行筛选得到检测目标的特征信息包括：

比较各所述特征信息中的目标类预测置信度与置信度阈值的大小，筛选出目标类预测置信度大于所述置信度阈值的所述特征信息，得到最优特征信息；

比对各所述最优特征信息中的所述分割实例掩膜与目标掩膜面积阈值，筛选出分割实例掩膜与所述掩膜面积阈值一致的最优特征信息，得到所述检测目标的特征信息。

可选的，所述依据所述检测目标的所述特征信息中的分割实例掩膜，得到所述检测目标的多边形轮廓包括：

计算所述检测目标的所述特征信息中分割实例掩膜的中心坐标；

以所述中心坐标作为极坐标中心点构建极坐标系；

从所述极坐标中心点向所述极坐标系的多个不同方向分别发射一条射线；

计算各射线与所述分割实例掩膜的交点；

将各交点顺次连接得到所述检测目标的多边形轮廓。

可选的，将图像输入实例分割网络模型前还包括：

对所述图像进行预处理。

可选的，所述对所述图像进行预处理包括：

对所述图像进行随机旋转、镜像、翻转、标准归一化以及双线性差值处理，得到目标大小的图像。

可选的，训练得到所述实例分割网络模型包括：

获取训练数据集；

利用所述训练数据集与像素级类别损失函数、目标检测框损失函数以及目标掩膜损失函数，训练得到所述实例分割网络模型。

可选的，所述获取训练数据集包括：

录制包含多种类别物体的检测区域的视频；

从所述视频中抓取图像并标注像素级实例分割数据，得到标注图像；

将所述标注图像转换为coco格式的所述训练数据集。

为解决上述技术问题，本申请还提供了一种目标检测装置，包括：

特征信息提取模块，用于将图像输入实例分割网络模型，通过所述实例分割网络模型对所述图像进行分析处理输出特征信息；

特征信息筛选模块，用于对所述特征信息进行筛选得到检测目标的特征信息；

目标轮廓确定模块，用于依据所述检测目标的所述特征信息中的分割实例掩膜，得到所述检测目标的多边形轮廓。

为解决上述技术问题，本申请还提供了一种目标检测设备，包括：

存储器，用于存储计算机程序；

处理器，用于执行所述计算机程序时实现如上任一项所述的目标检测方法的步骤。

为解决上述技术问题，本申请还提供了一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如上任一项所述的目标检测方法的步骤。

本申请所提供的目标检测方法，包括：将图像输入实例分割网络模型，通过所述实例分割网络模型对所述图像进行分析处理输出特征信息；对所述特征信息进行筛选得到检测目标的特征信息；依据所述检测目标的所述特征信息中的分割实例掩膜，得到所述检测目标的多边形轮廓。

可见，本申请所提供的目标检测方法，利用实例分割网络模型能够准确分割出检测目标的分割实例掩膜，进而依据所得分割实例掩膜得到检测目标的多边形轮廓，实现对检测目标的精准识别，可以有效解决近距离场景下误检、漏检以及检测精度低的问题。

本申请所提供的目标检测装置、设备以及计算机可读存储介质均具有上述技术效果。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对现有技术和实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本申请实施例所提供的一种目标检测方法的流程示意图；

图2为本申请实施例所提供的一种resnet101残差网络的结构示意图；

图3为本申请实施例所提供的一种后处理方法的示意图；

图4为本申请实施例所提供的一种全卷积网络结构示意图；

图5为本申请实施例所提供的一种多边形轮廓示意图；

图6为本申请实施例所提供的一种目标检测装置的示意图；

图7为本申请实施例所提供的一种目标检测设备的示意图。

具体实施方式

本申请的核心是提供一种目标检测方法，能够降低误检和漏检概率，提高检测精度。本申请的另一个核心是提供一种目标检测装置、设备以及计算机可读存储介质，均具有上述技术效果。

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

请参考图1，图1为本申请实施例所提供的一种目标检测方法的示意图，参考图1所示，该方法包括：

S101：将图像输入实例分割网络模型，通过实例分割网络模型对图像进行分析处理输出特征信息；

具体的，实例分割网络模型包括主干网络、检测网络以及分割网络。主干网络采用简化后的resent101残差网络，残差结构如图2所示，图2中①为Res_Block_up结构参考。图3所示，检测网络采用SSD算法中的后处理方法，包括非极大值遏制nms算法。其中，P_i表示主干网络输出特征对于类别i的概率得分，w与h分别为对应特征层的宽和高，n为对应特征层的通道数，c为类别数，a为目标预选框，k为分割掩膜系数，例如，分割掩膜系数设置为24。分割网络采用全卷积网络结构，参考图4所示，w与h分别为对应特征层的宽和高，P₃为特征金字塔结构中的第三特征层输出特征，x4表示与前一网络层具有相同参数的卷积层共有4层，k为最后一层特征数，例如可以设置为32。

对于resent101残差网络、后处理方法以及全卷积网络的更具体的内容，本申请在此不做赘述，参考现有技术的相关描述即可。

在拍摄得到图像的基础上，将图像输入实例分割网络模型，由实例分割网络模型对图像进行分析处理并输出特征信息。其中，实例分割网络模型输出的特征信息包括预测检测框特征、预测目标类标签、目标类预测置信度以及分割实例掩膜。预测目标类标签是指预测目标为哪一种类型，例如，预测目标为为人，包等。目标类预测置信度是指属于预测目标类型的概率，例如属于包的概率为60％。

其中，将图像输入实例分割网络模型前还可以包括：对图像进行预处理。且对图像进行预处理可以包括：对图像进行随机旋转、镜像、翻转、标准归一化以及双线性差值处理，得到目标大小的图像，例如得到400*400大小的图像。

S102：对特征信息进行筛选得到检测目标的特征信息；

具体的，在得到特征信息的基础上，进一步进行特征信息筛选，得到检测目标的特征信息。

在一种具体的实施方式中，对特征信息进行筛选得到检测目标的特征信息包括：比较各特征信息中的目标类预测置信度与置信度阈值的大小，筛选出目标类预测置信度大于置信度阈值的特征信息，得到最优特征信息；比对各最优特征信息中的分割实例掩膜与目标掩膜面积阈值，筛选出分割实例掩膜与掩膜面积阈值一致的最优特征信息，得到检测目标的特征信息。

具体而言，预先设置置信度阈值，由实例分割网络模型对图像进行分析处理并输出特征信息后，将其中的各目标类预测置信度与置信度阈值进行比较，筛选出目标类预测置信度大于置信度阈值的特征信息，得到最优的特征信息。

需要说明的是，预测检测框特征、预测目标类标签、目标类预测置信度以及分割实例掩膜相互对应，四者为一组特征信息。若某一组特征信息中的目标类预测置信度小于或等于置信度阈值，则将该组特征信息中的预测检测框特征、预测目标类标签、目标类预测置信度以及分割实例掩膜均去除。相反，若某一组特征信息中的目标类预测置信度大于置信度阈值，则将该组特征信息中的预测检测框特征、预测目标类标签、目标类预测置信度以及分割实例掩膜均保留。

例如，置信度阈值设置为75％，则高于75％的目标类预测置信度及其组内的预测检测框特征、预测目标类标签以及分割实例掩膜均保留，而将等于或低于75％的目标类预测置信度及其组内的预测检测框特征、预测目标类标签以及分割实例掩膜均去除。

另外，预先设置不同类型目标的目标掩膜面积阈值，在得到最优特征信息的基础上，进一步比对各最优特征信息中的分割实例掩膜与目标掩膜面积阈值，并去除分割实例掩膜与掩膜面积阈值不一致的最优特征信息，以去除多余或异常的分割实例掩膜，而保留分割实例掩膜与掩膜面积阈值一致的最优特征信息。

例如，某一分割实例掩膜是人与包为一体分割实例掩膜，且该分割实例掩膜与人对应的目标掩膜面积阈值不一致，故此时去除此分割实例掩膜。某一分割实例掩膜为雨伞的分割实例掩膜，与雨伞对应的目标掩膜面积阈值一致，则此时保留该分割实例掩膜。

S103：依据检测目标的特征信息中的分割实例掩膜，得到检测目标的多边形轮廓。

具体的，得到检测目标的分割实例掩膜后，进一步依据检测目标的分割实例掩膜得到检测目标的多边形轮廓，实现目标检测。

其中，在一种具体的实施方式中，依据检测目标的特征信息中的分割实例掩膜，得到检测目标的多边形轮廓方式可以为：计算检测目标的特征信息中分割实例掩膜的中心坐标；以中心坐标作为极坐标中心点构建极坐标系；从极坐标中心点向极坐标系的多个不同方向分别发射一条射线；计算各射线与分割实例掩膜的交点；将各交点顺次连接得到检测目标的多边形轮廓。

参考图5所示，以多边形轮廓具体为八变形轮廓为例：利用图像处理技术计算分割实例掩膜的中心坐标C；以中心坐标作为极坐标中心点，以水平正方向为极坐标初始方向构建极坐标系；从极坐标中心点向极坐标系的多个不同方向分别发射一条射线，如向与x轴成45度角、90度角、135度角、180度角、225度角、270度角以及315度角这八个方向分别发射一条射线，一共发射八条射线；八条射线与分割实例掩膜产生八个交点；将这八个交点顺次连接得到检测目标的八边形轮廓。图5中虚线表示分割实例掩膜，实线表示所发射的八条射线以及所的八边形轮廓。

可以明白的是，除八边形轮廓外，还可以为六边形轮廓等其他多边形轮廓，对此本申请不做唯一限定，可以进行差异性设置。

进一步，在上述实施例的基础上，训练得到实例分割网络模型的方式可以包括：获取训练数据集；利用训练数据集与像素级类别损失函数、目标检测框损失函数以及目标掩膜损失函数，训练得到实例分割网络模型。其中，获取训练数据集可以包括：录制包含多种类别物体的检测区域的视频；从视频中抓取图像并标注像素级实例分割数据，得到标注图像；将标注图像转换为coco格式的训练数据集。

具体而言，可以通过广角辅助相机录制视频，进而可从录制的视频中隔帧抓取图像，并使用实例分割工具标注像素级实例分割数据，得到大量的标注图像，最后将标注图像转换为coco格式的训练数据集，用于实例分割网络模型的训练。

为提升网络的综合性能，本实施例以像素级类别损失函数、目标检测框损失函数以及目标掩膜损失函数三个损失函数作为总损失函数进行模型训练。总损失函数表示如下：

L＝λ_clsL_cls+λ_boxL_box+λ_maskL_mask；

式中，L为总损失函数，L_cls为像素级类别损失函数，L_box为目标检测框损失函数，L_mask为目标掩膜损失函数，且L_mask＝BCE(M,M_gt)；BCE表示均方差损失，M表示掩膜，M_gt表示标注掩膜。λ_cls为像素级类别损失函数对应的权重，λ_box为目标检测框损失函数对应的权重，λ_mask为目标检测框损失函数对应的权重。例如，λ_cls、λ_box与λ_mask可分别设置为1、2.225与6.125。

综上所述，本申请所提供的目标检测方法，利用实例分割网络模型能够准确分割出检测目标的分割实例掩膜，进而依据所得分割实例掩膜得到检测目标的多边形轮廓，实现对检测目标的精准识别，可以有效解决近距离场景下误检、漏检以及检测精度低的问题。

以下以通道闸场景为例阐述本申请所提供的技术方案：

1、准备训练数据集：利用广角辅助相机录制通道闸视频，包括通道闸内经常出现的11种物体类别和通道闸区域中的感兴趣区域，共12个类别。从录制的视频中隔帧抓取图像，并使用实例分割标注工具标注像素级实例分割数据，标注类别12类(包括通道闸感兴趣区域、行人、小孩、婴儿、电动车、自行车、雨伞、背包、食品袋、文件包、婴儿车以及行李箱)，获得大量的标注图像；最后将标注图像转换成coco格式的数据集。

2、网络模型设计与训练：由于目标任务是将通道闸行人进行像素级精确分割，输出检测框，同时输出类标签和分类置信度，因此网络模型包括检测网络部分与分割网络部分。

为提升网络的综合性能，以像素级类别损失函数、目标检测框损失函数以及目标掩膜损失函数三个损失函数作为总损失函数进行模型训练，得到用于图像分析的实例分割网络模型。

3、目标识别：对图像进行随机旋转、镜像、翻转、标准归一化以及双线性差值处理后，将处理后的图像输入训练好的实例分割网络模型，由实例分割网络模型进行图像分析，输出预测检测框特征、预测目标类标签、目标类预测置信度以及分割实例掩膜。

根据置信度阈值，筛选出大于置信度阈值的目标类预测置信度及其对应的预测检测框特征、预测目标类标签以及分割实例掩膜。

根据掩膜面积阈值，筛选出检测目标的分割实例掩膜，去除多余或异常掩膜。

计算分割实例掩膜的中心坐标；以中心坐标作为极坐标中心点构建极坐标系；从极坐标中心点向极坐标系的多个不同方向分别发射一条射线；计算各射线与分割实例掩膜的交点；将各交点顺次连接得到检测目标的多边形轮廓。

本申请还提供了一种目标识别装置，下文描述的该装置可以与上文描述的方法相互对应参照。请参考图6，图6为本申请实施例所提供的一种目标识别装置的示意图，结合图6所示，该装置包括：

特征信息提取模块10，用于将图像输入实例分割网络模型，通过所述实例分割网络模型对所述图像进行分析处理输出特征信息；

特征信息筛选模块20，用于对所述特征信息进行筛选得到检测目标的特征信息；

目标轮廓确定模块30，用于依据所述检测目标的所述特征信息中的分割实例掩膜，得到所述检测目标的多边形轮廓。

在上述实施例的基础上，可选的，所述特征信息筛选模块20包括：

第一筛选单元，用于比较各所述特征信息中的目标类预测置信度与置信度阈值的大小，筛选出目标类预测置信度大于所述置信度阈值的所述特征信息，得到最优特征信息；

第二筛选单元，用于比对各所述最优特征信息中的所述分割实例掩膜与目标掩膜面积阈值，筛选出分割实例掩膜与所述掩膜面积阈值一致的最优特征信息，得到所述检测目标的特征信息。

在上述实施例的基础上，可选的，目标轮廓确定模块30包括：

中心坐标计算单元，用于计算所述检测目标的所述特征信息中分割实例掩膜的中心坐标；

坐标系建立单元，用于以所述中心坐标作为极坐标中心点构建极坐标系；

射线发射单元，用于从所述极坐标中心点向所述极坐标系的多个不同方向分别发射一条射线；

交点计算单元，用于计算各射线与所述分割实例掩膜的交点；

交点连接单元，用于将各交点顺次连接得到所述检测目标的多边形轮廓。

在上述实施例的基础上，可选的，还包括：

图像预处理模块，用于对所述图像进行预处理。

在上述实施例的基础上，可选的，所述图像预处理模块具体用于对所述图像进行随机旋转、镜像、翻转、标准归一化以及双线性差值处理，得到目标大小的图像。

在上述实施例的基础上，可选的，训练得到所述实例分割网络模型的方式为：

获取训练数据集；

在上述实施例的基础上，可选的，获取训练数据集的方式为：

录制包含多种类别物体的检测区域的视频；

将所述标注图像转换为coco格式的所述训练数据集。

本申请还提供了一种目标识别设备，参考图7所示，该设备包括存储器1和处理器2。

存储器1，用于存储计算机程序；

处理器2，用于执行计算机程序实现如下的步骤：

将图像输入实例分割网络模型，通过所述实例分割网络模型对所述图像进行分析处理输出特征信息；对所述特征信息进行筛选得到检测目标的特征信息；依据所述检测目标的所述特征信息中的分割实例掩膜，得到所述检测目标的多边形轮廓。

对于本申请所提供的设备的介绍请参照上述方法实施例，本申请在此不做赘述。

本申请还提供了一种计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，计算机程序被处理器执行时可实现如下的步骤：

该计算机可读存储介质可以包括：U盘、移动硬盘、只读存储器(Read-OnlyMemory，ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

对于本申请所提供的计算机可读存储介质的介绍请参照上述方法实施例，本申请在此不做赘述。

说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置、设备以及计算机可读存储介质而言，由于其与实施例公开的方法相对应，所以描述的比较简单，相关之处参见方法部分说明即可。

专业人员还可以进一步意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、计算机软件或者二者的结合来实现，为了清楚地说明硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块，或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。

以上对本申请所提供的目标检测方法、装置、设备以及计算机可读存储介质进行了详细介绍。本文中应用了具体个例对本申请的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本申请的方法及其核心思想。应当指出，对于本技术领域的普通技术人员来说，在不脱离本申请原理的前提下，还可以对本申请进行若干改进和修饰，这些改进和修饰也落入本申请权利要求的保护范围。

Claims

1.一种目标检测方法，其特征在于，包括：

对所述特征信息进行筛选得到检测目标的特征信息；

2.根据权利要求1所述的目标检测方法，其特征在于，所述对所述特征信息进行筛选得到检测目标的特征信息包括：

3.根据权利要求1所述的目标检测方法，其特征在于，所述依据所述检测目标的所述特征信息中的分割实例掩膜，得到所述检测目标的多边形轮廓包括：

以所述中心坐标作为极坐标中心点构建极坐标系；

计算各射线与所述分割实例掩膜的交点；

将各交点顺次连接得到所述检测目标的多边形轮廓。

4.根据权利要求1所述的目标检测方法，其特征在于，将图像输入实例分割网络模型前还包括：

对所述图像进行预处理。

5.根据权利要求4所述的目标检测方法，其特征在于，所述对所述图像进行预处理包括：

6.根据权利要求1所述的目标检测方法，其特征在于，训练得到所述实例分割网络模型包括：

获取训练数据集；

7.根据权利要求6所述的目标检测方法，其特征在于，所述获取训练数据集包括：

录制包含多种类别物体的检测区域的视频；

将所述标注图像转换为coco格式的所述训练数据集。

8.一种目标检测装置，其特征在于，包括：

9.一种目标检测设备，其特征在于，包括：

存储器，用于存储计算机程序；

处理器，用于执行所述计算机程序时实现如权利要求1至7任一项所述的目标检测方法的步骤。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的目标检测方法的步骤。