CN114359641A

CN114359641A - 目标对象的检测方法以及相关装置、设备

Info

Publication number: CN114359641A
Application number: CN202111590273.2A
Authority: CN
Inventors: 王凯; 王晓云; 麻晓波; 支洪平; 郑伟伟; 高少丹; 李小兵; 吴军军
Original assignee: Iflytek Suzhou Technology Co Ltd
Current assignee: Iflytek Suzhou Technology Co Ltd
Priority date: 2021-12-23
Filing date: 2021-12-23
Publication date: 2022-04-15

Abstract

本申请公开了目标对象的检测方法以及相关装置、设备，其中，目标对象的检测方法包括：获取到待检测图像，其中，待检测图像中包含目标对象；对待检测图像进行一次特征提取，得到待检测图像的第一特征数据，基于第一特征数据对目标对象进行检测，得到第一检测结果；基于第一检测结果对待检测图像进行二次特征提取，得到待检测图像的第二特征数据，基于第二特征数据对目标对象进行检测，得到第二检测结果，其中，第二特征数据的特征维度高于第一特征数据；基于第二检测结果确定目标对象的位姿信息。上述方案，能够提高目标对象的检测的准确性和精度。

Description

目标对象的检测方法以及相关装置、设备

技术领域

本申请涉及图像检测的技术领域，特别是涉及目标对象的检测方法以及相关装置、设备。

背景技术

随着科学技术的不断进步，对图像进行目标对象的检测已经逐步应用到生活的方方面面，例如：人脸识别、手势识别、设备状态识别等领域。

目前，图像检测技术往往采用Faster-RCNN或YOLO检测神经网络结构进行图像检测，但此类网络结构较为复杂，时间复杂度较高；而且检测精度不够高。

因此，目前亟需一种目标对象的检测方法来提高图像检测的准确性。

发明内容

本申请提供了目标对象的检测方法以及相关装置、设备，以解决现有技术中存在的图像检测的准确性不高的问题。

本申请提供了一种目标对象的检测方法，包括：获取到待检测图像，其中，待检测图像中包含目标对象；对待检测图像进行一次特征提取，得到待检测图像的第一特征数据，基于第一特征数据对目标对象进行检测，得到第一检测结果；基于第一检测结果对待检测图像进行二次特征提取，得到待检测图像的第二特征数据，基于第二特征数据对目标对象进行检测，得到第二检测结果，其中，第二特征数据的特征维度高于第一特征数据；基于第二检测结果确定目标对象的位姿信息

其中，对待检测图像进行一次特征提取，得到待检测图像的第一特征数据，基于第一特征数据对目标对象进行检测，得到第一检测结果的步骤包括：通过检测模型的第一检测网络对待检测图像进行一次特征提取得到第一特征数据，并基于第一特征数据确定多个第一目标检测框及其坐标信息以及各第一目标检测框内是否存在目标对象；基于各存在目标对象的第一目标检测框的坐标信息得到第一检测结果。

其中，基于各存在目标对象的第一目标检测框的坐标信息得到第一检测结果的步骤包括：利用第一检测网络确定各存在目标对象的第一目标检测框的置信度；基于置信度最大的第一目标检测框的坐标信息对其他第一目标检测框的坐标信息进行比对，以确定置信度最大的第一目标检测框与各其他第一目标检测框的重叠程度；将与置信度最大的第一目标检测框的重叠程度超过第一设定值的其他第一目标检测框去除，并将置信度最大的第一目标检测框以及重叠程度不超过第一设定值的其他第一目标检测框的坐标信息确定为第一检测结果。

其中，第一检测网络包括：相互级联的第一卷积层、第二卷积层、第三卷积层、第四卷积层以及第五卷积层；第五卷积层包括第一分类卷积层以及第一坐标卷积层；通过检测模型的第一检测网络对待检测图像进行一次特征提取得到第一特征数据，并基于第一特征数据确定多个第一目标检测框及其坐标信息以及各第一目标检测框内是否存在目标对象的步骤包括：通过卷积核为3*5、滑动步长为1*2、通道数为10的第一卷积层对待检测图像进行卷积处理，并依次对卷积处理后的待检测图像进行激活、池化处理，得到第一卷积层处理后的特征数据；通过卷积核为3*5、滑动步长为1*2、通道数为16的第二卷积层对第一卷积层处理后的特征数据进行卷积处理，并对卷积处理后的特征数据进行激活处理，得到第二卷积层处理后的特征数据；通过卷积核为3*5、滑动步长为2*2、通道数为16的第三卷积层对第二卷积层处理后的特征数据进行卷积处理，并对卷积处理后的特征数据进行激活处理，得到第三卷积层处理后的特征数据；通过卷积核为3*3、滑动步长为1*1、通道数为16的第四卷积层对第三卷积层处理后的特征数据进行卷积处理，并对卷积处理后的特征数据进行激活处理，得到第四卷积层处理后的特征数据；通过第五卷积层内卷积核为1*1、滑动步长为1*1、通道数为4的第一坐标卷积层对第四卷积层处理后的特征数据进行卷积处理，得到各第一目标检测框及其坐标信息；以及通过第五卷积层内卷积核为1*1、滑动步长为1*1、通道数为2的第一分类卷积层对第四卷积层处理后的特征数据进行卷积处理，以确定各第一目标检测框内是否存在目标对象。

其中，基于第一检测结果对待检测图像进行二次特征提取，得到待检测图像的第二特征数据，基于第二特征数据对目标对象进行检测，得到第二检测结果的步骤包括：基于第一检测结果中各存在目标对象的第一目标检测框的坐标信息从待检测图像中截取目标图像；通过检测模型的第二检测网络对目标图像进行二次特征提取，取得到第二特征数据，并基于第二特征数据确定多个第二目标检测框及其坐标信息以及各第二目标检测框内是否存在目标对象；基于各存在目标对象的第二目标检测框的坐标信息得到第二检测结果。

其中，基于各存在目标对象的第二目标检测框的坐标信息得到第二检测结果的步骤包括：利用第二检测网络确定各存在目标对象的第二目标检测框的置信度；基于置信度最大的第二目标检测框的坐标信息对其他第二目标检测框的坐标信息进行比对，以确定置信度最大的第二目标检测框与各其他第二目标检测框的重叠程度；将与置信度最大的第二目标检测框的重叠程度超过第二设定值的其他第二目标检测框去除，并将置信度最大的第二目标检测框以及重叠程度不超过第二设定值的其他第二目标检测框的坐标信息确定为第二检测结果。

其中，第二检测网络包括：相互级联的第六卷积层、第七卷积层、第八卷积层、第九卷积层、第十卷积层以及第十一卷积层；第十一卷积层包括第二分类卷积层以及第二坐标卷积层；通过检测模型的第二检测网络对目标图像进行二次特征提取，取得到第二特征数据，并基于第二特征数据确定多个第二目标检测框及其坐标信息以及各第二目标检测框内是否存在目标对象的步骤包括：通过卷积核为3*5、滑动步长为1*2、通道数为10的第六卷积层对目标图像进行卷积处理，并依次对卷积处理后的目标图像进行激活、池化处理，得到第六卷积层处理后的特征数据；通过卷积核为3*5、滑动步长为1*2、通道数为16的第七卷积层对第六卷积层处理后的特征数据进行卷积处理，并依次对卷积处理后的特征数据进行激活、池化处理，得到第七卷积层处理后的特征数据；通过卷积核为3*5、滑动步长为2*2、通道数为32的第八卷积层对第七卷积层处理后的特征数据进行卷积处理，并对卷积处理后的特征数据进行激活处理，得到第八卷积层处理后的特征数据；通过卷积核为3*3、滑动步长为1*1、通道数为64的第九卷积层对第八卷积层处理后的特征数据进行卷积处理，并对卷积处理后的特征数据进行激活处理，得到第九卷积层处理后的特征数据；通过卷积核为1*1、滑动步长为1*1、通道数为128的第十卷积层对第九卷积层处理后的特征数据进行卷积处理，并对卷积处理后的特征数据进行激活处理，得到第十卷积层处理后的特征数据；通过第十一卷积层内卷积核为1*1、滑动步长为1*1、通道数为4的第二坐标卷积层对第十卷积层处理后的特征数据进行卷积处理，得到各第二目标检测框及其坐标信息；以及通过第十一卷积层内卷积核为1*1、滑动步长为1*1、通道数为2的第二分类卷积层对第十卷积层处理后的特征数据进行卷积处理，确定各第二目标检测框内是否存在目标对象。

其中，基于第二检测结果确定目标对象的位姿信息的步骤包括：通过检测模型的输出网络基于第二检测结果确定目标对象的位姿信息；其中，目标对象的位姿信息包括目标对象的第三目标检测框及其坐标信息、第三目标检测框中是否存在目标对象、目标对象的特征点位置以及目标对象的倾斜角度。

其中，输出网络包括：相互级联的第十二卷积层、第十三卷积层、第十四卷积层、第十五卷积层、第十六卷积层、第十七卷积层以及第十八卷积层；十八卷积层包括第三分类卷积层、第三坐标卷积层、角度卷积层以及特征点卷积层；通过输出网络基于第二检测结果确定目标对象的位姿信息的步骤包括：基于第二检测结果确定目标对象的第二目标检测框对应的图像，并通过卷积核为3*5、滑动步长为1*2、通道数为12的第十二卷积层对图像进行卷积处理，并依次对卷积处理后的图像进行激活、池化处理，得到第十二卷积层处理后的特征数据；通过卷积核为3*5、滑动步长为1*2、通道数为16的第十三卷积层对第十二卷积层处理后的特征数据进行卷积处理，并依次对卷积处理后的特征数据进行激活、池化处理，得到第十三卷积层处理后的特征数据；通过卷积核为3*5、滑动步长为1*1、通道数为24的第十四卷积层对第十三卷积层处理后的特征数据进行卷积处理，并对依次卷积处理后的特征数据进行激活、池化处理，得到第十四卷积层处理后的特征数据；通过卷积核为3*3、滑动步长为1*1、通道数为48的第十五卷积层对第十四卷积层处理后的特征数据进行卷积处理，并对卷积处理后的特征数据进行激活处理，得到第十五卷积层处理后的特征数据；通过卷积核为3*3、滑动步长为1*1、通道数为96的第十六卷积层对第十五卷积层处理后的特征数据进行卷积处理，并对卷积处理后的特征数据进行激活处理，得到第十六卷积层处理后的特征数据；通过卷积核为1*1、滑动步长为1*1、通道数为256的第十七卷积层对第十六卷积层处理后的特征数据进行卷积处理，并对卷积处理后的特征数据进行激活处理，得到第十七卷积层处理后的特征数据；通过第十八卷积层内卷积核为1*1、滑动步长为1*1、通道数为4的第三坐标卷积层对第十七卷积层处理后的特征数据进行卷积处理，得到各第三目标检测框及其坐标信息；以及通过第十八卷积层内卷积核为1*1、滑动步长为1*1、通道数为2的第三分类卷积层对第十七卷积层处理后的特征数据进行卷积处理，确定各第三目标检测框内是否存在目标对象；以及通过第十八卷积层内卷积核为1*1、滑动步长为1*1、通道数为12的特征点卷积层对第十七卷积层处理后的特征数据进行卷积处理，确定目标对象的特征点位置；以及通过第十八卷积层内卷积核为1*1、滑动步长为1*1、通道数为1的角度卷积层对第十七卷积层处理后的特征数据进行卷积处理，确定目标对象的倾斜角度。

其中，获取到待检测图像的步骤之前包括：获取到样本图像以及样本图像的标准位姿信息；基于缩放因子逐步对样本图像的尺寸进行缩放，直至缩放后的样本图像的尺寸满足预设缩放条件，得到多尺度的样本图像；依次通过训练中的检测模型的第一检测网络、第二检测网络以及输出网络对多尺度的样本图像进行预测，得到预测位姿信息；基于预测位姿信息与标准位姿信息对训练中的检测模型进行训练，得到训练完成的检测模型。

其中，获取到待检测图像的步骤包括：获取到初始图像，调整初始图像的尺寸；对调整尺寸后的初始图像的像素参数进行归一化处理，以得到待检测图像。

其中，目标对象包括受电弓；获取到待检测图像的步骤包括：获取到待检测的受电弓图像，受电弓图像中包含受电弓；基于第二检测结果确定目标对象的位姿信息的步骤包括基于第二检测结果确定受电弓的目标检测框及其坐标信息、目标检测框中是否存在受电弓、受电弓的特征点位置以及受电弓的倾斜角度。

本申请还提供了一种目标对象的检测装置，包括：获取模块，用于获取到待检测图像，其中，待检测图像中包含目标对象；一次检测模块，用于对待检测图像进行一次特征提取，得到待检测图像的第一特征数据，基于第一特征数据对目标对象进行检测，得到第一检测结果；二次检测模块，用于基于第一检测结果对待检测图像进行二次特征提取，得到待检测图像的第二特征数据，基于第二特征数据对目标对象进行检测，得到第二检测结果，其中，第二特征数据的特征维度高于第一特征数据；确定模块，用于基于第二检测结果确定目标对象的位姿信息。

本申请还提供了一种电子设备，包括相互耦接的存储器和处理器，处理器用于执行存储器中存储的程序指令，以实现上述任一项的目标对象的检测方法。

本申请还提供了一种计算机可读存储介质，其上存储有程序指令，程序指令被处理器执行时实现上述任一项的目标对象的检测方法。

上述方案，本申请通过先对待检测图像进行一次特征提取，得到待检测图像的第一特征数据，基于第一特征数据对目标对象进行检测，得到第一检测结果，再基于第一检测结果对待检测图像进行二次特征提取，得到待检测图像的第二特征数据，基于第二特征数据对目标对象进行检测，得到第二检测结果，其中，第二特征数据的特征维度高于第一特征数据，最后基于第二检测结果确定目标对象的位姿信息，从而通过一次特征提取先粗筛非目标对象的相关特征，减轻二次特征提取的计算压力，再通过二次特征提取在第一检测结果的基础上进行更加精细的特征提取，从而提高目标对象的检测精度，进而提高图像检测精度。

附图说明

图1是本申请目标对象的检测方法一实施例的流程示意图；

图2是本申请目标对象的检测方法另一实施例的流程示意图；

图3是图2实施例中第一检测网络一实施方式的结构示意图；

图4是图2实施例中第二检测网络一实施方式的结构示意图；

图5是图2实施例中输出网络一实施方式的结构示意图；

图6是本申请目标对象的检测装置一实施例的结构示意图；

图7是本申请电子设备一实施例的框架示意图；

图8为本申请计算机可读存储介质一实施例的框架示意图。

具体实施方式

下面结合说明书附图，对本申请实施例的方案进行详细说明。

以下描述中，为了说明而不是为了限定，提出了诸如特定系统结构、接口、技术之类的具体细节，以便透彻理解本申请。

本文中术语“系统”和“网络”在本文中常被可互换使用。本文中术语“和/或”，仅仅是一种描述关联对象的关联关系，可以存在三种关系，例如，A和/或B，可以：单独存在A，同时存在A和B，单独存在B这三种情况。另外，本文中字符“/”，一般前后关联对象是一种“或”的关系。此外，本文中的“多”两个或者多于两个。

请参阅图1，图1是本申请目标对象的检测方法一实施例的流程示意图。具体而言，可以包括如下步骤：

步骤S11：获取到待检测图像，其中，待检测图像中包含目标对象。

获取到待检测图像，其中，待检测图像中包含目标对象。本步骤的待检测图像的数量可以为一张或多张。

本实施例的目标对象可以包括活体、机械设备或自然对象，例如：人脸、人体、动物、陀螺仪、受电弓、云朵等等，具体的目标对象可以基于实际需求进行设置，在此不做限定。而单张待检测图像中的目标对象的数量也可以为一个或多个。

在一个具体的应用场景中，可以通过照相设备对目标对象进行拍照，从而得到包含目标对象的待检测图像。在另一个具体的应用场景中，也可以通过从视频数据中截取每一帧或多帧的包含目标对象的视频帧作为待检测图像。具体地待检测图像的获取方法在此不做限定。

步骤S12：对待检测图像进行一次特征提取，得到待检测图像的第一特征数据，基于第一特征数据对目标对象进行检测，得到第一检测结果。

获取到待检测图像后，对待检测图像进行一次特征提取，得到待检测图像的第一特征数据，再基于第一特征数据对目标对象进行检测，得到第一检测结果。

在一个具体的应用场景中，可以通过图像检测模型对待检测图像进行一次特征提取，得到待检测图像的第一特征数据，再通过基于第一特征数据对目标对象进行检测，得到第一检测结果。在另一个具体的应用场景中，也可以直接通过特征提取算法对待检测图像进行一次特征提取，得到待检测图像的第一特征数据，再通过分类算法基于第一特征数据对目标对象进行检测，得到第一检测结果。在另一个具体的应用场景中，也可以通过相关图像检测软件或工具对待检测图像进行一次特征提取，得到待检测图像的第一特征数据，再基于第一特征数据对目标对象进行检测，得到第一检测结果。

本实施例的第一检测结果包括目标对象的位置、检测框的位置、特征点、倾斜角度、尺寸大小、颜色等特征中的一种或多种，具体可以基于实际需求进行设置，在此不做限定。

步骤S13：基于第一检测结果对待检测图像进行二次特征提取，得到待检测图像的第二特征数据，基于第二特征数据对目标对象进行检测，得到第二检测结果，其中，第二特征数据的特征维度高于第一特征数据。

获取到待检测图像的第一检测结果后，基于第一检测结果对待检测图像进行二次特征提取，得到待检测图像的第二特征数据，基于第二特征数据对目标对象进行检测，得到第二检测结果。

在一个具体的应用场景中，可以基于第一检测结果在待检测图像上确定目标对象的相关信息，再基于目标对象的相关信息进行二次特征提取，得到待检测图像的第二特征数据。在另一个具体的应用场景中，也可以直接对第一检测结果再次进行二次特征提取，得到待检测图像的第二特征数据，基于第二特征数据对目标对象进行检测，得到第二检测结果。

其中，本实施例的第二特征数据的特征维度高于第一特征数据。即第二特征数据的特征精度高于第一特征数据的特征精度，从而通过一次特征提取先粗筛非目标对象的相关特征，减轻二次特征提取的计算压力，再通过二次特征提取在第一检测结果的基础上进行更加精细的特征提取，从而提高目标对象的检测精度，进而提高图像检测精度。

在一个具体的应用场景中，第一特征数据的特征维度可以为256，而第二特征数据的特征维度可以为400。从而利用256维度的第一特征数据对非目标对象的相关特征进行粗筛，再利用400维度的第二特征数据进行更加精细的特征提取，从而提高目标对象的检测精度，进而提高图像检测精度。

其中，第一特征数据的特征维度和第二特征数据的特征维度也可以具体为其他数值，在此不做限定。

步骤S14：基于第二检测结果确定目标对象的位姿信息。

获得第二检测结果后，基于第二检测结果确定目标对象的位姿信息。其中，目标对象的位姿信息可以基于目标对象的类型而具体包括不同的位姿信息。具体地，目标对象的位姿信息可以包括但不限于：目标对象的目标检测框及其坐标信息、目标检测框中是否存在目标对象、目标对象的特征点位置、目标对象的倾斜角度、目标对象的倾斜角度的尺寸大小、目标对象的颜色、目标对象的形状等等。

通过上述步骤，本实施例的目标对象的检测方法通过先对待检测图像进行一次特征提取，得到待检测图像的第一特征数据，基于第一特征数据对目标对象进行检测，得到第一检测结果，再基于第一检测结果对待检测图像进行二次特征提取，得到待检测图像的第二特征数据，基于第二特征数据对目标对象进行检测，得到第二检测结果，其中，第二特征数据的特征维度高于第一特征数据，最后基于第二检测结果确定目标对象的位姿信息，从而通过一次特征提取先粗筛非目标对象的相关特征，减轻二次特征提取的计算压力，再通过二次特征提取在第一检测结果的基础上进行更加精细的特征提取，从而提高目标对象的检测精度，进而提高图像检测精度。

请参阅图2，图2是本申请目标对象的检测方法另一实施例的流程示意图。具体而言，可以包括如下步骤：

步骤S21：获取到初始图像，调整初始图像的尺寸，对调整尺寸后的初始图像的像素参数进行归一化处理，以得到待检测图像。

先获取到初始图像，其中初始图像中包括目标对象。

先调整初始图像的尺寸，以使其适配检测模型的输入尺寸。而检测模型的输入尺寸可以基于目标对象的比例和/或大小进行训练调整。在一个具体的应用场景中，当目标对象为受电弓时，其长宽比为：20:91，而检测模型的输入尺寸对应调整为20:91，而在本步骤中，基于检测模型的输入尺寸对初始图像的尺寸进行调整，从而使其长宽比与20:91匹配。

对调整尺寸后的初始图像的像素参数进行归一化处理，以得到待检测图像。由于初始图像上的每个像素点的RGB数值范围都在[0，255]的范围内，即都为非负数，则通过对初始图像的像素参数进行归一化处理，使各像素参数映射到(-1,1)之间，从而简化各像素参数，便于后续特征提取和检测的计算量，加快收敛速度。

步骤S22：通过检测模型的第一检测网络对待检测图像进行一次特征提取得到第一特征数据，并基于第一特征数据确定多个第一目标检测框及其坐标信息以及各第一目标检测框内是否存在目标对象；基于各存在目标对象的第一目标检测框的坐标信息得到第一检测结果。

得到待检测图像后，通过检测模型的第一检测网络对待检测图像进行一次特征提取得到第一特征数据，并基于第一特征数据确定多个第一目标检测框及其坐标信息以及各第一目标检测框内是否存在目标对象。其中，第一目标检测框为第一检测网络基于目标对象对待检测网络进行检测到的应该包含目标对象的检测框。其中，本实施例的检测模型包括相互级联的第一检测网络、第二检测网络以及输出网络。

确定了多个第一目标检测框及其坐标信息后，再确定各第一目标检测框内是否存在目标对象，最后基于各存在目标对象的第一目标检测框的坐标信息得到第一检测结果。即第一检测结果包括各存在目标对象的第一目标检测框的坐标信息。

其中，由于各第一目标检测框在检测时是各种独立检测的，各第一目标检测框之间可能存在大量重叠，从而导致无效地重复检测，降低第一检测结果的有效性，因此，可以利用第一检测网络确定各存在目标对象的第一目标检测框的置信度；基于置信度最大的第一目标检测框的坐标信息对其他第一目标检测框的坐标信息进行比对，以确定置信度最大的第一目标检测框与各其他第一目标检测框的重叠程度；将与置信度最大的第一目标检测框的重叠程度超过第一设定值的其他第一目标检测框去除，并将置信度最大的第一目标检测框以及重叠程度不超过第一设定值的其他第一目标检测框的坐标信息确定为第一检测结果。

在一个具体的应用场景中，可以利用第一检测网络确定各存在目标对象的第一目标检测框的置信度分值，将置信度最大的第一目标检测框的坐标信息对其他第一目标检测框的坐标信息进行比对，以计算置信度最大的第一目标检测框与各其他第一目标检测框的交并比(Intersection over Union)，将与置信度最大的第一目标检测框的交并比超过第一设定值的其他第一目标检测框去除，并将置信度最大的第一目标检测框以及交并比不超过第一设定值的其他第一目标检测框的坐标信息确定为第一检测结果。其中，第一设定值可以为0.6或其他数值，具体基于去重需求进行设置。

本实施例的第一检测网络包括：相互级联的第一卷积层、第二卷积层、第三卷积层、第四卷积层以及第五卷积层；第五卷积层包括第一分类卷积层以及第一坐标卷积层。依次通过第一卷积层、第二卷积层、第三卷积层、第四卷积层对待检测图像进行特征提取，得到第一特征数据，再通过第五卷积层基于第一特征数据确定多个第一目标检测框及其坐标信息以及各第一目标检测框内是否存在目标对象；基于各存在目标对象的第一目标检测框的坐标信息得到第一检测结果。

请参阅图3，图3是图2实施例中第一检测网络一实施方式的结构示意图。本实施方式以目标对象为受电弓为例，对第一检测网络的结构进行说明。

本实施例的第一检测网络30包括：相互级联的第一卷积层31、第二卷积层32、第三卷积层33、第四卷积层34以及第五卷积层35；第五卷积层35包括第一分类卷积层352以及第一坐标卷积层351。

则在本实施方式中，通过检测模型的第一检测网络30对待检测图像进行一次特征提取得到第一特征数据，并基于第一特征数据确定多个第一目标检测框及其坐标信息以及各第一目标检测框内是否存在目标对象的步骤具体包括：

将待检测图像调整为通道数*高*宽依次为3*20*91的图像，并将图像输入到第一检测网络30中进行检测。

具体地，通过卷积核为3*5(高*宽)、滑动步长为1*2(高*宽)、通道数为10的第一卷积层31对图像进行卷积处理，得到尺寸为10*18*44(通道数*高*宽)的卷积处理后的待检测图像，并依次对卷积处理后的待检测图像进行ReLU激活操作，以及经2*2(高*宽)且步长为2的池化处理，得到第一卷积层31处理后的特征数据，第一卷积层31处理后的特征数据的尺寸为10*9*22(通道数*高*宽)，其中，后续尺寸参数的含义与第一卷积层31中各数据的含义相同，后续不再赘述。

通过卷积核为3*5、滑动步长为1*2、通道数为16的第二卷积层32对第一卷积层31处理后的特征数据进行卷积处理，得到尺寸为16*7*9的特征数据，并对卷积处理后的特征数据进行ReLU激活处理，得到第二卷积层32处理后的特征数据。

通过卷积核为3*5、滑动步长为2*2、通道数为16的第三卷积层33对第二卷积层32处理后的特征数据进行卷积处理，得到尺寸为16*3*3的特征数据，并对卷积处理后的特征数据进行ReLU激活处理，得到第三卷积层33处理后的特征数据；

通过卷积核为3*3、滑动步长为1*1、通道数为16的第四卷积层34对第三卷积层33处理后的特征数据进行卷积处理，得到尺寸为16*1*1的特征数据，并对卷积处理后的特征数据进行激活处理，得到第四卷积层34处理后的特征数据。

通过第五卷积层35内卷积核为1*1、滑动步长为1*1、通道数为4的第一坐标卷积层351对第四卷积层34处理后的特征数据进行卷积处理，得到各第一目标检测框及其坐标信息，其中，第一坐标卷积层351处理后的特征数据的尺寸为4*1*1，即为各第一目标检测框的四个角点的坐标信息，从而完成第一目标检测框的框回归。以及通过第五卷积层35内卷积核为1*1、滑动步长为1*1、通道数为2的第一分类卷积层352对第四卷积层34处理后的特征数据进行卷积处理，以确定各第一目标检测框内是否存在目标对象。第一分类卷积层352的输出的向量为2*1*1，即通过二分类的方式确定各第一目标检测框内是否存在目标对象。

将各第一目标检测框及其坐标信息以及各第一目标检测框内是否存在目标对象确定为本实施例的第一检测结果。

步骤S23：基于第一检测结果中各存在目标对象的第一目标检测框的坐标信息从待检测图像中截取目标图像；通过检测模型的第二检测网络对目标图像进行二次特征提取，取得到第二特征数据，并基于第二特征数据确定多个第二目标检测框及其坐标信息以及各第二目标检测框内是否存在目标对象；基于各存在目标对象的第二目标检测框的坐标信息得到第二检测结果。

获取到第一检测结果后，基于第一检测结果中各存在目标对象的第一目标检测框的坐标信息从待检测图像中截取目标图像，并通过检测模型的第二检测网络对目标图像进行二次特征提取，取得到第二特征数据，并基于第二特征数据确定多个第二目标检测框及其坐标信息以及各第二目标检测框内是否存在目标对象；确定了多个第二目标检测框及其坐标信息后，再确定各第二目标检测框内是否存在目标对象，最后基于各存在目标对象的第二目标检测框的坐标信息得到第一检测结果。即第二检测结果包括各存在目标对象的第二目标检测框的坐标信息。

本实施例的第一检测网络相当于轻量级的网络，分辨率低一点，第二检测网络利用第一检测网络的输出作为输入，进行第二次细筛，从而通过输入分辨率更高、网络参数更复杂的第二检测网络进行更加精细的分类，筛选掉第一检测结果中不是目标对象的检测框。

其中，由于各第二目标检测框在检测时是各种独立检测的，各第二目标检测框之间仍然可能存在大量重叠，从而导致无效地重复检测，降低第二检测结果的有效性，因此，可以利用第二检测网络确定各存在目标对象的第二目标检测框的置信度；基于置信度最大的第二目标检测框的坐标信息对其他第二目标检测框的坐标信息进行比对，以确定置信度最大的第二目标检测框与各其他第二目标检测框的重叠程度；将与置信度最大的第二目标检测框的重叠程度超过第二设定值的其他第二目标检测框去除，并将置信度最大的第二目标检测框以及重叠程度不超过第二设定值的其他第二目标检测框的坐标信息确定为第二检测结果。

在二个具体的应用场景中，可以利用第二检测网络确定各存在目标对象的第二目标检测框的置信度分值，将置信度最大的第二目标检测框的坐标信息对其他第二目标检测框的坐标信息进行比对，以计算置信度最大的第二目标检测框与各其他第二目标检测框的交并比(Intersection over Union)，将与置信度最大的第二目标检测框的交并比超过第二设定值的其他第二目标检测框去除，并将置信度最大的第二目标检测框以及交并比不超过第二设定值的其他第二目标检测框的坐标信息确定为第二检测结果。其中，第二设定值可以为0.3或其他数值，具体基于去重需求进行设置。其中，第二设定值小于第一设定值，从而在第一目标检测框的基础上进一步减少各第二目标检测框的重叠程度。

本实施例的第二检测网络包括：相互级联的第六卷积层、第七卷积层、第八卷积层、第九卷积层、第十卷积层以及第十一卷积层；第十一卷积层包括第二分类卷积层以及第二坐标卷积层；依次通过第六卷积层、第七卷积层、第八卷积层、第九卷积层、第十卷积层对目标图像进行特征提取，得到第二特征数据，再通过第十一卷积层基于第二特征数据确定多个第二目标检测框及其坐标信息以及各第二目标检测框内是否存在目标对象；基于各存在目标对象的第二目标检测框的坐标信息得到第二检测结果。

请参阅图4，图4是图2实施例中第二检测网络一实施方式的结构示意图。本实施方式以目标对象为受电弓为例，对第二检测网络的结构进行说明。

本实施例的第二检测网络40包括：相互级联的第六卷积层41、第七卷积层42、第八卷积层43、第九卷积层44、第十卷积层45以及第十一卷积层46；第十一卷积层包括第二分类卷积层462以及第二坐标卷积层461。

则通过检测模型的第二检测网络40对目标图像进行二次特征提取，取得到第二特征数据，并基于第二特征数据确定多个第二目标检测框及其坐标信息以及各第二目标检测框内是否存在目标对象的步骤包括：

基于第一目标检测框的坐标信息去待检测图像向截取尺寸大小为3*34*159的目标图像，并将目标图像输入到第二检测网络40中进行检测。

具体地，通过卷积核为3*5、滑动步长为1*2、通道数为10的第六卷积层41对目标图像进行卷积处理，得到尺寸为10*32*78(通道数*高*宽)的卷积处理后的目标图像，并依次对卷积处理后的目标图像进行ReLU激活操作，以及经2*2(高*宽)且步长为2的池化处理，得到第六卷积层41处理后的特征数据，第六卷积层41处理后的特征数据的尺寸为10*16*39(通道数*高*宽)。

通过卷积核为3*5、滑动步长为1*2、通道数为16的第七卷积层42对第六卷积层41处理后的特征数据进行卷积处理，得到尺寸为16*14*18(通道数*高*宽)的特征数据，并依次对卷积处理后的特征数据进行ReLU激活操作，以及经2*2(高*宽)且步长为2的池化处理，得到第七卷积层42处理后的特征数据，第七卷积层42处理后的特征数据的尺寸为16*7*9。

通过卷积核为3*5、滑动步长为2*2、通道数为32的第八卷积层43对第七卷积层42处理后的特征数据进行卷积处理，得到尺寸为32*3*3的特征数据，并对卷积处理后的特征数据进行激活处理，得到第八卷积层43处理后的特征数据。

通过卷积核为3*3、滑动步长为1*1、通道数为64的第九卷积层44对第八卷积层43处理后的特征数据进行卷积处理，得到尺寸为64*1*1的特征数据，并对卷积处理后的特征数据进行激活处理，得到第九卷积层44处理后的特征数据。

通过卷积核为1*1、滑动步长为1*1、通道数为128的第十卷积层45对第九卷积层44处理后的特征数据进行卷积处理，得到第十卷积层45处理后的特征数据；第十卷积层45处理后的特征数据的尺寸为128*1*1。

通过第十一卷积层46内卷积核为1*1、滑动步长为1*1、通道数为4的第二坐标卷积层461对第十卷积层45处理后的特征数据进行卷积处理，得到各第二目标检测框及其坐标信息，其中，第二坐标卷积层461处理后的特征数据的尺寸为4*1*1，即为各第二目标检测框的四个角点的坐标信息。从而完成第二目标检测框的框回归；以及通过第十一卷积层46内卷积核为1*1、滑动步长为1*1、通道数为2的第二分类卷积层462对第十卷积层45处理后的特征数据进行卷积处理，确定各第二目标检测框内是否存在目标对象。第二分类卷积层462的输出的向量为2*1*1，即通过二分类的方式确定各第二目标检测框内是否存在目标对象。

将各第二目标检测框及其坐标信息以及各第二目标检测框内是否存在目标对象确定为本实施例的第二检测结果。

步骤S24：通过检测模型的输出网络基于第二检测结果确定目标对象的位姿信息。

得到第二检测结果后，通过检测模型的输出网络基于第二检测结果确定目标对象的位姿信息。

其中，目标对象的位姿信息包括目标对象的第三目标检测框及其坐标信息、第三目标检测框中是否存在目标对象、目标对象的特征点位置以及目标对象的倾斜角度。

本实施例的输出网络包括：相互级联的第十二卷积层、第十三卷积层、第十四卷积层、第十五卷积层、第十六卷积层、第十七卷积层以及第十八卷积层；十八卷积层包括第三分类卷积层、第三坐标卷积层、角度卷积层以及特征点卷积层。

请参阅图5，图5是图2实施例中输出网络一实施方式的结构示意图。本实施方式以目标对象为受电弓为例，对输出网络的结构进行说明。

本实施例的输出网络50包括：相互级联的第十二卷积层51、第十三卷积层52、第十四卷积层53、第十五卷积层54、第十六卷积层55、第十七卷积层56以及第十八卷积层57；十八卷积层包括第三分类卷积层572、第三坐标卷积层571、角度卷积层573以及特征点卷积层574。

则通过输出网络50基于第二检测结果确定目标对象的位姿信息的步骤包括：

基于第二检测结果确定目标对象的第二目标检测框对应的图像，且将该图像的尺寸调整为3*60*251，并通过卷积核为3*5、滑动步长为1*2、通道数为12的第十二卷积层51对该图像进行卷积处理，得到尺寸为12*58*124(通道数*高*宽)的卷积处理后的目标图像，并依次对卷积处理后的目标图像进行ReLU激活操作，以及经2*2(高*宽)且步长为2的池化处理，得到第十二卷积层51处理后的特征数据，第十二卷积层51处理后的特征数据的尺寸为12*29*62。

通过卷积核为3*5、滑动步长为1*2、通道数为16的第十三卷积层52对第十二卷积层51处理后的特征数据进行卷积处理，得到尺寸为16*27*29的卷积处理后的特征数据，并依次对卷积处理后的特征数据进行ReLU激活操作，以及经3*3(高*宽)且步长为2的池化处理，得到第十三卷积层52处理后的特征数据，第十三卷积层52处理后的特征数据的尺寸为16*13*14。

通过卷积核为3*5、滑动步长为1*1、通道数为24的第十四卷积层53对第十三卷积层52处理后的特征数据进行卷积处理，得到尺寸为24*11*10的卷积处理后的特征数据，并依次对卷积处理后的特征数据进行ReLU激活操作，以及经3*3(高*宽)且步长为2的池化处理，得到第十四卷积层53处理后的特征数据，第十四卷积层53处理后的特征数据的尺寸为24*5*5。

通过卷积核为3*3、滑动步长为1*1、通道数为48的第十五卷积层54对第十四卷积层53处理后的特征数据进行卷积处理，得到尺寸为48*3*3的卷积处理后的特征数据，并对卷积处理后的特征数据进行激活处理，得到第十五卷积层54处理后的特征数据；

通过卷积核为3*3、滑动步长为1*1、通道数为96的第十六卷积层55对第十五卷积层54处理后的特征数据进行卷积处理，得到尺寸为96*1*1的卷积处理后的特征数据，并对卷积处理后的特征数据进行激活处理，得到第十六卷积层55处理后的特征数据；

通过卷积核为1*1、滑动步长为1*1、通道数为256的第十七卷积层56对第十六卷积层55处理后的特征数据进行卷积处理，得到尺寸为256*1的卷积处理后的特征数据，并对卷积处理后的特征数据进行激活处理，得到第十七卷积层56处理后的特征数据；

通过第十八卷积层57内卷积核为1*1、滑动步长为1*1、通道数为4的第三坐标卷积层571对第十七卷积层56处理后的特征数据进行卷积处理，得到各第三目标检测框及其坐标信息，其中，第三坐标卷积层571处理后的特征数据的尺寸为4*1*1，即为各第三目标检测框的四个角点的坐标信息。从而完成第三目标检测框的框回归；以及通过第十八卷积层57内卷积核为1*1、滑动步长为1*1、通道数为2的第三分类卷积层572对第十七卷积层56处理后的特征数据进行卷积处理，确定各第三目标检测框内是否存在目标对象，第三分类卷积层572的输出的向量为2*1*1，即通过二分类的方式确定各第二目标检测框内是否存在目标对象。以及通过第十八卷积层57内卷积核为1*1、滑动步长为1*1、通道数为12的特征点卷积层574对第十七卷积层56处理后的特征数据进行卷积处理，确定目标对象的特征点位置；其中，本实施例的受电弓的特征点共有6个，则特征点卷积层574的输出的向量为12*1，表示受电弓的特征点位置，每两个分量为一组，分别表示特征点的横坐标和纵坐标。以及通过第十八卷积层57内卷积核为1*1、滑动步长为1*1、通道数为1的角度卷积层573对第十七卷积层处理后的特征数据进行卷积处理，确定目标对象的倾斜角度。

将各第三目标检测框及其坐标信息、各第三目标检测框内是否存在目标对象、目标对象的倾斜角度以及目标对象的特征点位置确定为本实施例的第二检测结果。

在一个具体的实时方式中，当进行目标对象的检测之前，先对检测模型进行训练，其中，训练过程包括：获取到样本图像以及样本图像的标准位姿信息；基于缩放因子逐步对样本图像的尺寸进行缩放，得到图像金字塔，直至缩放后的样本图像的尺寸满足预设缩放条件，得到多尺度的样本图像。其中，对样本图像的尺寸进行缩放，先基于样本图像利用缩放因子(factor)进行缩放，得到第一缩放图像，再基于第一缩放图像利用缩放因子进行缩放，得到第二缩放图像...以此类推，直至缩放后的样本图像的尺寸满足预设缩放条件。其中，缩放因子可以包括0.5、1.5或其他参数，在此不做限定。

而预设缩放条件则为缩放后的样本图像的尺寸达到最小尺寸和/或最大尺寸。其中，最小尺寸可以为样本图像的0.12％，最大尺寸可以为样本图像的120％等占比缩放尺寸，具体数值在此不做限定。其中，最大尺寸越小以及最小尺寸越大，图像金字塔的层数越少，调整大小和模型训练时的计算量越小，训练效率越高。其中，本实施例通过预设缩放条件中为占比缩放尺寸以及固定的缩放因子能够有效控制图像金字塔的缩放，减少图像的无意义缩放，并提高基于上述方式缩放后的图像的有效利用率，进而提高训练效果和效率。

在一个具体的应用场景中，当目标对象为受电弓时，样本图像缩放时的长宽比可以为20:91，即每次缩放后的样本图像的长宽比都为20:91。其中，预设缩放条件还包括：当缩放后的样本图像的尺寸没有达到样本图像的0.12％，但其宽度已经小于或等于20像素时，也停止缩放。当宽度小于或等于20像素后，其尺寸已不再具备训练价值。

依次通过训练中的检测模型的第一检测网络、第二检测网络以及输出网络对基于上述方法得到的多尺度样本图像进行预测，得到预测位姿信息；基于预测位姿信息与标准位姿信息对训练中的检测模型进行训练，得到训练完成的检测模型。

通过多尺度的样本图像对检测模型进行训练后，使得训练完成的检测模型能够适应于多尺度的待检测图像，从而减少因待检测图像的尺寸与检测模型的输入不匹配而导致的检测失败的情况发生，提高目标对象的检测效率和应用范围。

通过上述步骤，本实施例的目标对象的检测方法通过调整初始图像的尺寸，对调整尺寸后的初始图像的像素参数进行归一化处理，以得到待检测图像能够使图像适配检测模型的输入尺寸，提高检测效率，并利用归一化处理简化各像素参数，便于后续特征提取和检测的计算量，加快收敛速度。再通过检测模型的第一检测网络对待检测图像进行一次特征提取，得到待检测图像的第一特征数据，基于第一特征数据对目标对象进行检测，得到第一检测结果，再通过检测模型的第二检测网络基于第一检测结果对待检测图像进行二次特征提取，得到待检测图像的第二特征数据，最后通过检测模型的输出网络基于第二特征数据对目标对象进行检测，得到第二检测结果，其中，第二特征数据的特征维度高于第一特征数据，最后基于第二检测结果确定目标对象的位姿信息，从而通过第一检测网络先粗筛非目标对象的相关特征，减轻二次特征提取的计算压力，再通过第二检测网络提取在第一检测结果的基础上进行更加精细的特征提取，从而提高目标对象的检测精度，进而提高图像检测精度。且本实施例在检测前，通过设置有最小尺寸和最大尺寸的多尺度的样本图像对检测模型进行训练，减少图像金字塔的层数，减少调整大小和模型训练时的计算量，提高训练效率使得训练完成的检测模型能够适应于多尺度的待检测图像，从而减少因待检测图像的尺寸与检测模型的输入不匹配而导致的检测失败的情况发生，提高目标对象的检测效率和应用范围。

在一个具体的实施方式中，目标对象包括受电弓，受电弓是电力机车的重要组成部件之一，它是电力牵引机车从接触网直接取得电能的电气设备。它的工作姿态能够直接影响轨道列车的安全运行。通常，通过受电弓的位姿信息评判受电弓是否处于正确的工作姿态，而受电弓的工作姿态能够直接影响轨道列车的安全运行，因此，对列车受电弓工作姿态的实时检测能够有效避免列车运行过程中的很多问题，从而保障了列车运行的安全可靠。

获取到待检测的受电弓图像，受电弓图像中包含受电弓。此处，待检测的受电弓图像即需进行受电弓姿态检测的受电弓图像。受电弓图像可以是通过安装在列车上的图像采集设备拍摄的，也可以是通过安装在列车受电弓前方的在线拍照系统采集的，受电弓图像可以是单张图像，也可以是从视频中提取到的图像帧，本发明实施例对此不做具体限定。

具体地，在得到待检测的受电弓图像之后，可以对受电弓图像进行目标检测，此处检测的目标即受电弓图像中包含的受电弓，检测所得的结果即受电弓图像中受电弓的位姿信息，位姿信息可以包括受电弓的姿态信息和位置信息，其中受电弓的姿态信息即与受电弓姿态相关的信息，例如受电弓的倾斜角度，受电弓的位置信息即与受电弓位置相关的信息，例如受电弓的检测框在受电弓图像中的位置，受电弓关键点位置。

为了在实现受电弓图像检测的同时，保证图像检测的检测效率，可根据多个级联的第一检测网络、第二检测网络以及输出网络构成的检测模型对获取到的待检测的受电弓图像进行目标检测。

本发明实施例中，设置检测模型中的第一检测网络、第二检测网络以及输出网络均为多层卷积结构，多层卷积结构具体是多个卷积层的级联结构，多层卷积结构下的第一检测网络可以视为弱分类器，弱分类器本身具备结构简单、计算效率高的优点，一方面可以利用级联结构将前一模型的输出作为后一模型的输入的特质，从而在目标检测前期筛除大量非目标检测框。减轻后期处理压力，另一方面可以利用多层卷积结构作为弱分类器结构简单的优势，从整体上降低计算复杂度，提高目标检测效率。

另外，在不额外增加计算量的前提下，为了进一步提高受电弓检测的准确性，本发明实施例还对检测模型中的第一检测网络、第二检测网络以及输出网络的结构进行了改进，使得各网络在针对受电弓检测时能够更具针对性。为了提高各网络针对受电弓的适配度，可以将各网络中的多层卷积结构设置为适配受电弓本身的形状的结构。为了适配受电弓形状，可以对多层卷积结构中卷积核的宽高进行调整，也可以对多层卷积结构在进行卷积时的滑动窗口的宽高进行调整，还可以对多层卷积结构中的卷积核和滑动窗口的宽高均作调整。

本发明实施例提供的受电弓检测方法，通过多个级联的第一检测网络、第二检测网络以及输出网络构成的检测模型，对受电弓图像进行目标检测，图像检测相较于接触式传感器检测和人工检测，极大节约了成本，提高了检测效率。其中，级联结构的特质使得在目标检测前期能够筛除大量非目标候选框，减轻了后期处理压力；多层卷积结构下的目标检测模型从整体上降低计算复杂度，提高目标检测效率；此外，适配受电弓本身的形状的多层卷积结构，使得检测模型针对受电弓检测时能够更具针对性，进一步优化了检测效率。

请参阅图6，图6是本申请目标对象的检测装置一实施例的结构示意图。

本实施例的目标对象的检测装置60包括：获取模块61、一次检测模块62、二次检测模块63以及确定模块64。获取模块61用于获取到待检测图像，其中，待检测图像中包含目标对象；一次检测模块62用于对待检测图像进行一次特征提取，得到待检测图像的第一特征数据，基于第一特征数据对目标对象进行检测，得到第一检测结果；二次检测模块63用于基于第一检测结果对待检测图像进行二次特征提取，得到待检测图像的第二特征数据，基于第二特征数据对目标对象进行检测，得到第二检测结果，其中，第二特征数据的特征维度高于第一特征数据；确定模块64用于基于第二检测结果确定目标对象的位姿信息。

一次检测模块62还用于通过检测模型的第一检测网络对待检测图像进行一次特征提取得到第一特征数据，并基于第一特征数据确定多个第一目标检测框及其坐标信息以及各第一目标检测框内是否存在目标对象；基于各存在目标对象的第一目标检测框的坐标信息得到第一检测结果。

一次检测模块62还用于利用第一检测网络确定各存在目标对象的第一目标检测框的置信度；基于置信度最大的第一目标检测框的坐标信息对其他第一目标检测框的坐标信息进行比对，以确定置信度最大的第一目标检测框与各其他第一目标检测框的重叠程度；将与置信度最大的第一目标检测框的重叠程度超过第一设定值的其他第一目标检测框去除，并将置信度最大的第一目标检测框以及重叠程度不超过第一设定值的其他第一目标检测框的坐标信息确定为第一检测结果。

一次检测模块62还用于通过卷积核为3*5、滑动步长为1*2、通道数为10的第一卷积层对待检测图像进行卷积处理，并依次对卷积处理后的待检测图像进行激活、池化处理，得到第一卷积层处理后的特征数据；通过卷积核为3*5、滑动步长为1*2、通道数为16的第二卷积层对第一卷积层处理后的特征数据进行卷积处理，并对卷积处理后的特征数据进行激活处理，得到第二卷积层处理后的特征数据；通过卷积核为3*5、滑动步长为2*2、通道数为16的第三卷积层对第二卷积层处理后的特征数据进行卷积处理，并对卷积处理后的特征数据进行激活处理，得到第三卷积层处理后的特征数据；通过卷积核为3*3、滑动步长为1*1、通道数为16的第四卷积层对第三卷积层处理后的特征数据进行卷积处理，并对卷积处理后的特征数据进行激活处理，得到第四卷积层处理后的特征数据；通过第五卷积层内卷积核为1*1、滑动步长为1*1、通道数为4的第一坐标卷积层对第四卷积层处理后的特征数据进行卷积处理，得到各第一目标检测框及其坐标信息；以及通过第五卷积层内卷积核为1*1、滑动步长为1*1、通道数为2的第一分类卷积层对第四卷积层处理后的特征数据进行卷积处理，以确定各第一目标检测框内是否存在目标对象。

二次检测模块63还用于基于第一检测结果中各存在目标对象的第一目标检测框的坐标信息从待检测图像中截取目标图像；通过检测模型的第二检测网络对目标图像进行二次特征提取，取得到第二特征数据，并基于第二特征数据确定多个第二目标检测框及其坐标信息以及各第二目标检测框内是否存在目标对象；基于各存在目标对象的第二目标检测框的坐标信息得到第二检测结果。

二次检测模块63还用于利用第二检测网络确定各存在目标对象的第二目标检测框的置信度；基于置信度最大的第二目标检测框的坐标信息对其他第二目标检测框的坐标信息进行比对，以确定置信度最大的第二目标检测框与各其他第二目标检测框的重叠程度；将与置信度最大的第二目标检测框的重叠程度超过第二设定值的其他第二目标检测框去除，并将置信度最大的第二目标检测框以及重叠程度不超过第二设定值的其他第二目标检测框的坐标信息确定为第二检测结果。

二次检测模块63还用于通过卷积核为3*5、滑动步长为1*2、通道数为10的第六卷积层对目标图像进行卷积处理，并依次对卷积处理后的目标图像进行激活、池化处理，得到第六卷积层处理后的特征数据；通过卷积核为3*5、滑动步长为1*2、通道数为16的第七卷积层对第六卷积层处理后的特征数据进行卷积处理，并依次对卷积处理后的特征数据进行激活、池化处理，得到第七卷积层处理后的特征数据；通过卷积核为3*5、滑动步长为2*2、通道数为32的第八卷积层对第七卷积层处理后的特征数据进行卷积处理，并对卷积处理后的特征数据进行激活处理，得到第八卷积层处理后的特征数据；通过卷积核为3*3、滑动步长为1*1、通道数为64的第九卷积层对第八卷积层处理后的特征数据进行卷积处理，并对卷积处理后的特征数据进行激活处理，得到第九卷积层处理后的特征数据；通过卷积核为1*1、滑动步长为1*1、通道数为128的第十卷积层对第九卷积层处理后的特征数据进行卷积处理，并对卷积处理后的特征数据进行激活处理，得到第十卷积层处理后的特征数据；通过第十一卷积层内卷积核为1*1、滑动步长为1*1、通道数为4的第二坐标卷积层对第十卷积层处理后的特征数据进行卷积处理，得到各第二目标检测框及其坐标信息；以及通过第十一卷积层内卷积核为1*1、滑动步长为1*1、通道数为2的第二分类卷积层对第十卷积层处理后的特征数据进行卷积处理，确定各第二目标检测框内是否存在目标对象。

确定模块64还用于通过检测模型的输出网络基于第二检测结果确定目标对象的位姿信息；其中，目标对象的位姿信息包括目标对象的第三目标检测框及其坐标信息、第三目标检测框中是否存在目标对象、目标对象的特征点位置以及目标对象的倾斜角度。

确定模块64还用于基于第二检测结果确定目标对象的第二目标检测框对应的图像，并通过卷积核为3*5、滑动步长为1*2、通道数为12的第十二卷积层对图像进行卷积处理，并依次对卷积处理后的图像进行激活、池化处理，得到第十二卷积层处理后的特征数据；通过卷积核为3*5、滑动步长为1*2、通道数为16的第十三卷积层对第十二卷积层处理后的特征数据进行卷积处理，并依次对卷积处理后的特征数据进行激活、池化处理，得到第十三卷积层处理后的特征数据；通过卷积核为3*5、滑动步长为1*1、通道数为24的第十四卷积层对第十三卷积层处理后的特征数据进行卷积处理，并对依次卷积处理后的特征数据进行激活、池化处理，得到第十四卷积层处理后的特征数据；通过卷积核为3*3、滑动步长为1*1、通道数为48的第十五卷积层对第十四卷积层处理后的特征数据进行卷积处理，并对卷积处理后的特征数据进行激活处理，得到第十五卷积层处理后的特征数据；通过卷积核为3*3、滑动步长为1*1、通道数为96的第十六卷积层对第十五卷积层处理后的特征数据进行卷积处理，并对卷积处理后的特征数据进行激活处理，得到第十六卷积层处理后的特征数据；通过卷积核为1*1、滑动步长为1*1、通道数为256的第十七卷积层对第十六卷积层处理后的特征数据进行卷积处理，并对卷积处理后的特征数据进行激活处理，得到第十七卷积层处理后的特征数据；通过第十八卷积层内卷积核为1*1、滑动步长为1*1、通道数为4的第三坐标卷积层对第十七卷积层处理后的特征数据进行卷积处理，得到各第三目标检测框及其坐标信息；以及通过第十八卷积层内卷积核为1*1、滑动步长为1*1、通道数为2的第三分类卷积层对第十七卷积层处理后的特征数据进行卷积处理，确定各第三目标检测框内是否存在目标对象；以及通过第十八卷积层内卷积核为1*1、滑动步长为1*1、通道数为12的特征点卷积层对第十七卷积层处理后的特征数据进行卷积处理，确定目标对象的特征点位置；以及通过第十八卷积层内卷积核为1*1、滑动步长为1*1、通道数为1的角度卷积层对第十七卷积层处理后的特征数据进行卷积处理，确定目标对象的倾斜角度。

获取模块61还用于获取到样本图像以及样本图像的标准位姿信息；基于缩放因子逐步对样本图像的尺寸进行缩放，直至缩放后的样本图像的尺寸满足预设缩放条件，得到多尺度的样本图像；依次通过训练中的检测模型的第一检测网络、第二检测网络以及输出网络对多尺度的样本图像进行预测，得到预测位姿信息；基于预测位姿信息与标准位姿信息对训练中的检测模型进行训练，得到训练完成的检测模型。

获取模块61还用于获取到初始图像，调整初始图像的尺寸；对调整尺寸后的初始图像的像素参数进行归一化处理，以得到待检测图像。

获取模块61还用于获取到待检测的受电弓图像，受电弓图像中包含受电弓；确定模块64还用于基于第二检测结果确定受电弓的目标检测框及其坐标信息、目标检测框中是否存在受电弓、受电弓的特征点位置以及受电弓的倾斜角度。

上述方案，能够提高目标对象的检测精度。

请参阅图7，图7是本申请电子设备一实施例的框架示意图。电子设备70包括相互耦接的存储器71和处理器72，处理器72用于执行存储器71中存储的程序指令，以实现上述任一目标对象的检测方法实施例的步骤。在一个具体的实施场景中，电子设备70可以包括但不限于：微型计算机、服务器，此外，电子设备70还可以包括笔记本电脑、平板电脑等移动设备，在此不做限定。

具体而言，处理器72用于控制其自身以及存储器71以实现上述任一目标对象的检测方法实施例的步骤。处理器72还可以称为CPU(Central Processing Unit，中央处理单元)。处理器72可能是一种集成电路芯片，具有信号的处理能力。处理器72还可以是通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(ApplicationSpecific Integrated Circuit，ASIC)、现场可编程门阵列(Field-Programmable GateArray，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。另外，处理器72可以由集成电路芯片共同实现。

上述方案，能够提高目标对象的检测精度。

请参阅图8，图8为本申请计算机可读存储介质一实施例的框架示意图。计算机可读存储介质80存储有能够被处理器运行的程序指令801，程序指令801用于实现上述任一目标对象的检测方法实施例的步骤。

上述方案，能够提高目标对象的检测精度。

在本申请所提供的几个实施例中，应该理解到，所揭露的方法和装置，可以通过其它的方式实现。例如，以上所描述的装置实施方式仅仅是示意性的，例如，模块或单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性、机械或其它的形式。

作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施方式方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)或处理器(processor)执行本申请各个实施方式方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

Claims

1.一种目标对象的检测方法，其特征在于，所述目标对象的检测方法包括：

获取到待检测图像，其中，所述待检测图像中包含目标对象；

对所述待检测图像进行一次特征提取，得到所述待检测图像的第一特征数据，基于所述第一特征数据对所述目标对象进行检测，得到第一检测结果；

基于所述第一检测结果对所述待检测图像进行二次特征提取，得到所述待检测图像的第二特征数据，基于所述第二特征数据对所述目标对象进行检测，得到第二检测结果，其中，所述第二特征数据的特征维度高于所述第一特征数据；

基于所述第二检测结果确定所述目标对象的位姿信息。

2.根据权利要求1所述的目标对象的检测方法，其特征在于，所述对所述待检测图像进行一次特征提取，得到所述待检测图像的第一特征数据，基于所述第一特征数据对所述目标对象进行检测，得到第一检测结果的步骤包括：

通过检测模型的第一检测网络对所述待检测图像进行一次特征提取得到所述第一特征数据，并基于所述第一特征数据确定多个第一目标检测框及其坐标信息以及各第一目标检测框内是否存在所述目标对象；

基于各存在所述目标对象的第一目标检测框的坐标信息得到所述第一检测结果。

3.根据权利要求2所述的目标对象的检测方法，其特征在于，所述基于各存在所述目标对象的第一目标检测框的坐标信息得到所述第一检测结果的步骤包括：

利用所述第一检测网络确定各存在所述目标对象的第一目标检测框的置信度；

基于置信度最大的第一目标检测框的坐标信息对其他第一目标检测框的坐标信息进行比对，以确定置信度最大的第一目标检测框与各其他第一目标检测框的重叠程度；

将与所述置信度最大的第一目标检测框的重叠程度超过第一设定值的其他第一目标检测框去除，并将所述置信度最大的第一目标检测框以及重叠程度不超过第一设定值的其他第一目标检测框的坐标信息确定为所述第一检测结果。

4.根据权利要求2所述的目标对象的检测方法，其特征在于，所述第一检测网络包括：相互级联的第一卷积层、第二卷积层、第三卷积层、第四卷积层以及第五卷积层；所述第五卷积层包括第一分类卷积层以及第一坐标卷积层；

所述通过检测模型的第一检测网络对所述待检测图像进行一次特征提取得到所述第一特征数据，并基于所述第一特征数据确定多个第一目标检测框及其坐标信息以及各第一目标检测框内是否存在所述目标对象的步骤包括：

通过卷积核为3*5、滑动步长为1*2、通道数为10的第一卷积层对所述待检测图像进行卷积处理，并依次对卷积处理后的待检测图像进行激活、池化处理，得到第一卷积层处理后的特征数据；

通过卷积核为3*5、滑动步长为1*2、通道数为16的第二卷积层对所述第一卷积层处理后的特征数据进行卷积处理，并对卷积处理后的特征数据进行激活处理，得到第二卷积层处理后的特征数据；

通过卷积核为3*5、滑动步长为2*2、通道数为16的第三卷积层对所述第二卷积层处理后的特征数据进行卷积处理，并对卷积处理后的特征数据进行激活处理，得到第三卷积层处理后的特征数据；

通过卷积核为3*3、滑动步长为1*1、通道数为16的第四卷积层对所述第三卷积层处理后的特征数据进行卷积处理，并对卷积处理后的特征数据进行激活处理，得到第四卷积层处理后的特征数据；

通过所述第五卷积层内卷积核为1*1、滑动步长为1*1、通道数为4的第一坐标卷积层对所述第四卷积层处理后的特征数据进行卷积处理，得到各第一目标检测框及其坐标信息；以及通过所述第五卷积层内卷积核为1*1、滑动步长为1*1、通道数为2的第一分类卷积层对所述第四卷积层处理后的特征数据进行卷积处理，以确定所述各第一目标检测框内是否存在所述目标对象。

5.根据权利要求2所述的目标对象的检测方法，其特征在于，所述基于所述第一检测结果对所述待检测图像进行二次特征提取，得到所述待检测图像的第二特征数据，基于所述第二特征数据对所述目标对象进行检测，得到第二检测结果的步骤包括：

基于所述第一检测结果中各存在所述目标对象的第一目标检测框的坐标信息从所述待检测图像中截取目标图像；

通过检测模型的第二检测网络对所述目标图像进行二次特征提取，取得到所述第二特征数据，并基于所述第二特征数据确定多个第二目标检测框及其坐标信息以及各第二目标检测框内是否存在所述目标对象；

基于各存在所述目标对象的第二目标检测框的坐标信息得到所述第二检测结果。

6.根据权利要求5所述的目标对象的检测方法，其特征在于，所述基于各存在所述目标对象的第二目标检测框的坐标信息得到所述第二检测结果的步骤包括：

利用所述第二检测网络确定各存在所述目标对象的第二目标检测框的置信度；

基于置信度最大的第二目标检测框的坐标信息对其他第二目标检测框的坐标信息进行比对，以确定置信度最大的第二目标检测框与各其他第二目标检测框的重叠程度；

将与所述置信度最大的第二目标检测框的重叠程度超过第二设定值的其他第二目标检测框去除，并将所述置信度最大的第二目标检测框以及重叠程度不超过第二设定值的其他第二目标检测框的坐标信息确定为所述第二检测结果。

7.根据权利要求5所述的目标对象的检测方法，其特征在于，第二检测网络包括：相互级联的第六卷积层、第七卷积层、第八卷积层、第九卷积层、第十卷积层以及第十一卷积层；所述第十一卷积层包括第二分类卷积层以及第二坐标卷积层；

所述通过检测模型的第二检测网络对所述目标图像进行二次特征提取，取得到所述第二特征数据，并基于所述第二特征数据确定多个第二目标检测框及其坐标信息以及各第二目标检测框内是否存在所述目标对象的步骤包括：

通过卷积核为3*5、滑动步长为1*2、通道数为10的第六卷积层对所述目标图像进行卷积处理，并依次对卷积处理后的目标图像进行激活、池化处理，得到第六卷积层处理后的特征数据；

通过卷积核为3*5、滑动步长为1*2、通道数为16的第七卷积层对所述第六卷积层处理后的特征数据进行卷积处理，并依次对卷积处理后的特征数据进行激活、池化处理，得到第七卷积层处理后的特征数据；

通过卷积核为3*5、滑动步长为2*2、通道数为32的第八卷积层对所述第七卷积层处理后的特征数据进行卷积处理，并对卷积处理后的特征数据进行激活处理，得到第八卷积层处理后的特征数据；

通过卷积核为3*3、滑动步长为1*1、通道数为64的第九卷积层对所述第八卷积层处理后的特征数据进行卷积处理，并对卷积处理后的特征数据进行激活处理，得到第九卷积层处理后的特征数据；

通过卷积核为1*1、滑动步长为1*1、通道数为128的第十卷积层对所述第九卷积层处理后的特征数据进行卷积处理，并对卷积处理后的特征数据进行激活处理，得到第十卷积层处理后的特征数据；

通过所述第十一卷积层内卷积核为1*1、滑动步长为1*1、通道数为4的第二坐标卷积层对所述第十卷积层处理后的特征数据进行卷积处理，得到各第二目标检测框及其坐标信息；以及通过所述第十一卷积层内卷积核为1*1、滑动步长为1*1、通道数为2的第二分类卷积层对所述第十卷积层处理后的特征数据进行卷积处理，确定所述各第二目标检测框内是否存在所述目标对象。

8.根据权利要求5所述的目标对象的检测方法，其特征在于，所述基于所述第二检测结果确定所述目标对象的位姿信息的步骤包括：

通过检测模型的输出网络基于所述第二检测结果确定所述目标对象的位姿信息；

其中，所述目标对象的位姿信息包括所述目标对象的第三目标检测框及其坐标信息、所述第三目标检测框中是否存在目标对象、所述目标对象的特征点位置以及所述目标对象的倾斜角度。

9.根据权利要求8所述的目标对象的检测方法，其特征在于，所述输出网络包括：相互级联的第十二卷积层、第十三卷积层、第十四卷积层、第十五卷积层、第十六卷积层、第十七卷积层以及第十八卷积层；所述十八卷积层包括第三分类卷积层、第三坐标卷积层、角度卷积层以及特征点卷积层；

所述通过输出网络基于所述第二检测结果确定所述目标对象的位姿信息的步骤包括：

基于所述第二检测结果确定所述目标对象的第二目标检测框对应的图像，并通过卷积核为3*5、滑动步长为1*2、通道数为12的第十二卷积层对所述图像进行卷积处理，并依次对卷积处理后的图像进行激活、池化处理，得到第十二卷积层处理后的特征数据；

通过卷积核为3*5、滑动步长为1*2、通道数为16的第十三卷积层对所述第十二卷积层处理后的特征数据进行卷积处理，并依次对卷积处理后的特征数据进行激活、池化处理，得到第十三卷积层处理后的特征数据；

通过卷积核为3*5、滑动步长为1*1、通道数为24的第十四卷积层对所述第十三卷积层处理后的特征数据进行卷积处理，并对依次卷积处理后的特征数据进行激活、池化处理，得到第十四卷积层处理后的特征数据；

通过卷积核为3*3、滑动步长为1*1、通道数为48的第十五卷积层对所述第十四卷积层处理后的特征数据进行卷积处理，并对卷积处理后的特征数据进行激活处理，得到第十五卷积层处理后的特征数据；

通过卷积核为3*3、滑动步长为1*1、通道数为96的第十六卷积层对所述第十五卷积层处理后的特征数据进行卷积处理，并对卷积处理后的特征数据进行激活处理，得到第十六卷积层处理后的特征数据；

通过卷积核为1*1、滑动步长为1*1、通道数为256的第十七卷积层对所述第十六卷积层处理后的特征数据进行卷积处理，并对卷积处理后的特征数据进行激活处理，得到第十七卷积层处理后的特征数据；

通过所述第十八卷积层内卷积核为1*1、滑动步长为1*1、通道数为4的第三坐标卷积层对所述第十七卷积层处理后的特征数据进行卷积处理，得到各第三目标检测框及其坐标信息；以及通过所述第十八卷积层内卷积核为1*1、滑动步长为1*1、通道数为2的第三分类卷积层对所述第十七卷积层处理后的特征数据进行卷积处理，确定所述各第三目标检测框内是否存在所述目标对象；以及通过所述第十八卷积层内卷积核为1*1、滑动步长为1*1、通道数为12的特征点卷积层对所述第十七卷积层处理后的特征数据进行卷积处理，确定所述目标对象的特征点位置；以及通过所述第十八卷积层内卷积核为1*1、滑动步长为1*1、通道数为1的角度卷积层对所述第十七卷积层处理后的特征数据进行卷积处理，确定所述目标对象的倾斜角度。

10.根据权利要求2-9任一项所述的目标对象的检测方法，其特征在于，所述获取到待检测图像的步骤之前包括：

获取到样本图像以及所述样本图像的标准位姿信息；

基于缩放因子逐步对所述样本图像的尺寸进行缩放，直至缩放后的所述样本图像的尺寸满足预设缩放条件，得到多尺度的样本图像；

依次通过训练中的检测模型的第一检测网络、第二检测网络以及输出网络对所述多尺度的样本图像进行预测，得到预测位姿信息；

基于所述预测位姿信息与所述标准位姿信息对所述训练中的检测模型进行训练，得到训练完成的检测模型。

11.根据权利要求1所述的目标对象的检测方法，其特征在于，所述获取到待检测图像的步骤包括：

获取到初始图像，调整所述初始图像的尺寸；

对调整尺寸后的初始图像的像素参数进行归一化处理，以得到所述待检测图像。

12.根据权利要求1所述的目标对象的检测方法，其特征在于，所述目标对象包括受电弓；

所述获取到待检测图像的步骤包括：

获取到待检测的受电弓图像，所述受电弓图像中包含受电弓；

所述基于所述第二检测结果确定所述目标对象的位姿信息的步骤包括

基于所述第二检测结果确定所述受电弓的目标检测框及其坐标信息、所述目标检测框中是否存在受电弓、所述受电弓的特征点位置以及所述受电弓的倾斜角度。

13.一种目标对象的检测装置，其特征在于，所述目标对象的检测装置包括：

获取模块，用于获取到待检测图像，其中，所述待检测图像中包含目标对象；

一次检测模块，用于对所述待检测图像进行一次特征提取，得到所述待检测图像的第一特征数据，基于所述第一特征数据对所述目标对象进行检测，得到第一检测结果；

二次检测模块，用于基于所述第一检测结果对所述待检测图像进行二次特征提取，得到所述待检测图像的第二特征数据，基于所述第二特征数据对所述目标对象进行检测，得到第二检测结果，其中，所述第二特征数据的特征维度高于所述第一特征数据；

确定模块，用于基于所述第二检测结果确定所述目标对象的位姿信息。

14.一种电子设备，其特征在于，包括相互耦接的存储器和处理器，所述处理器用于执行所述存储器中存储的程序指令，以实现如权利要求1至12任一项所述的目标对象的检测方法。

15.一种计算机可读存储介质，其上存储有程序指令，其特征在于，所述程序指令被处理器执行时实现如权利要求1至12任一项所述的目标对象的检测方法。