WO2022148143A1

WO2022148143A1 - 一种目标检测方法及装置

Info

Publication number: WO2022148143A1
Application number: PCT/CN2021/131569
Authority: WO
Inventors: 云一宵; 郑迪威; 马志贤; 苏惠荞
Original assignee: 华为技术有限公司
Priority date: 2021-01-08
Filing date: 2021-11-18
Publication date: 2022-07-14
Also published as: CN114792416A

Abstract

一种目标检测方法及装置，所述方法包括：获取第一图像（S401）；然后对第一图像进行处理得到Q个感兴趣区域，确定每一个感兴趣区域中的参考点对应的图像坐标系的坐标（S402）；根据所述参考点对应的图像坐标系的坐标，确定所述参考点对应的车体坐标系的坐标（S403）；确定第一目标物体的三维模型（S404）；根据所述参考点对应的车体坐标系的坐标、所述三维模型的顶点集合，确定所述三维模型在车体坐标系对应的至少一个坐标（S405）；将所述至少一个坐标在图像坐标系进行投影得到Q个像素区域（S406）；根据Q个感兴趣区域和Q个像素区域，确定目标的检测结果（S407）。该方法能够对交通场景中的障碍物实时检测，提升了在自动驾驶或者辅助驾驶中的高级驾驶辅助系统能力。

Description

一种目标检测方法及装置

本申请要求于2021年01月08日提交中国专利局、申请号为202110026498.9、申请名称为“一种目标检测方法及装置”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及图像处理技术领域，尤其涉及一种目标检测方法及装置。

背景技术

随着社会的发展，智能运输设备、智能家居设备、机器人等智能终端正在逐步进入人们的日常生活中。传感器在智能终端上发挥着十分重要的作用。安装在智能终端上的各式各样的传感器，比如毫米波雷达，激光雷达，摄像头，超声波雷达等，在智能终端的运动过程中感知周围的环境，收集数据，进行移动物体的辨识、追踪、测速、测距，以及静止场景如车道线、交通场景物体的识别和定位，并结合导航仪及地图数据进行路径规划以及其他行为控制。

在典型的交通场景中，会存在一些占据可行驶路面，影响车辆前行的物体，如图1所示，例如，交通锥、机动车用三角警告牌、平躺的轮胎等等，如何对这些物体进行实时检测，为后续的路径规划提供重要的信息是亟需解决的技术问题。

发明内容

本申请实施例公开了一种目标检测方法及装置，能够对交通场景中的障碍物物体进行实时检测，为后续的路径规划提供重要的信息，提升了在自动驾驶或者辅助驾驶中的高级驾驶辅助系统能力。

本申请实施例第一方面公开了一种目标检测方法，包括：获取第一图像；对所述第一图像进行处理得到Q个感兴趣区域，确定所述每一个感兴趣区域中的参考点对应的图像坐标系的坐标；其中，Q为正整数；根据所述每一个感兴趣区域中的参考点对应的图像坐标系的坐标，确定所述每一个感兴趣区域中的参考点对应的车体坐标系的坐标；确定第一目标物体的三维模型；根据所述每一个感兴趣区域中的参考点对应的车体坐标系的坐标、所述第一目标物体的三维模型的顶点集合，确定所述第一目标物体的三维模型在所述车体坐标系对应的至少一个坐标；将所述第一目标物体的三维模型在所述车体坐标系对应的至少一个坐标在所述图像坐标系进行投影得到Q个像素区域；根据所述Q个感兴趣区域和所述Q个像素区域，确定所述目标的检测结果。

通过本申请实施例的方法，由于交通锥、机动车用三角警告牌以及轮胎等交通场景障碍物物体在国际或国家标准中都有明确的参数规定，因此可以通过上述交通场景障碍物物体为基准定义三维模型坐标系，从而获取第一目标物体的三维模型。本申请实施例，通过将第一目标物体的三维模型摆放在每一个感兴趣区域中的参考点对应的车体坐标上，从而获取第一目标物体的三维模型在车体坐标系对应的坐标，通过这样的方式，即使上述交通场景障碍物物体的形状大小尺寸存在一定程度的变化，但只要整体形状没有发生严重的改变，通过本申请实施例，仍然可以检测出交通场景障碍物物体。而且本申请实施例通过将感兴趣区域的参考点由图像坐标系转换到车体坐标系，然后在参考点对应的车体坐标系上摆放第一目标物体的三维模型，确定第一目标物体的三维模型的在车体坐标系的坐标，然后将三维模型在车体坐标系的坐标在图像坐标系进行投影匹配，也就是说本申请实施例通过对第一目标物体的成像特征进行处理分析，达到检测的目的，而无需获取预先采集和标注得到的大量的训练样本进行训练，计算复杂度低。

在一种可能的实现方式中，所述根据所述Q个感兴趣区域和所述Q个像素区域，确定所述目标的检测结果，包括：对所述Q个像素区域对应的Q个感兴趣区域进行筛选处理得到R个感兴趣区域，所述每一个像素区域对应一个感兴趣区域，R为正整数，且R小于等于Q；确定所述R个感兴趣区域对应的R个外接矩形；根据所述R个外接矩形，确定所述目标的检测结果。

在上述方法中，通过对Q个感兴趣区域进行筛选处理得到R个感兴趣区域能够有效的去除图像噪点，提升目标检测结果的准确性，根据R个外接矩形确定目标的检测结果可以是通过采用非极大值抑制算法该R个外接矩形进行处理，去除冗余的外接矩形，最终确定目标的检测结果，加快了目标检测的效率。

在又一种可能的实现方式中，所述对所述Q个像素区域对应的Q个感兴趣区域进行筛选处理得到R个感兴趣区域,包括如下至少一种方式：当所述Q个感兴趣区域中的第一感兴趣区域的面积占所述第一感兴趣区域的凸包络面积的比例大于第一预设值，将所述第一感兴趣区域作为所述R个感兴趣区域中的一个；当所述Q个感兴趣区域中的第一感兴趣区域的凸包络宽高比与所述第一感兴趣区域对应的像素区域的宽高比的比值满足大于第二预设值且小于第三预设值的条件，将所述第一感兴趣区域作为所述R个感兴趣区域中的一个；当所述Q个感兴趣区域中的第一感兴趣区域的凸包络面积与所述第一感兴趣区域对应的像素区域的面积的比值满足大于所述第二预设值且小于所述第三预设值的条件，将所述第一感兴趣区域作为所述R个感兴趣区域中的一个；当所述Q个感兴趣区域中的第一感兴趣区域的凸包络轮廓与所述第一感兴趣区域对应的像素区域的轮廓的交并比IOU大于第四预设值，将所述第一感兴趣区域作为所述R个感兴趣区域中的一个。

在又一种可能的实现方式中，所述对所述Q个像素区域对应的Q个感兴趣区域进行筛选处理得到R个感兴趣区域,包括如下方式：使用预先训练好的分类器对所述Q个感兴趣区域中的第一感兴趣区域的外接矩形中的内容进行评价打分，获得第一分值；当所述第一分值高于第五预设值时，将所述第一感兴趣区域作为所述R个感兴趣区域中的一个。

在又一种可能的实现方式中，所述根据所述R个外接矩形，确定所述目标的检测结果，包括：计算所述R个外接矩形的面积；根据所述R个外接矩形的面积确定所述目标的检测结果。

在上述方法中，通过R个外接矩形的面积能够快速的确定目标的检测结果，加快了目标检测的效率。

在又一种可能的实现方式中，所述根据所述R个外接矩形，确定所述目标的检测结果，包括：使用预先训练好的分类器对所述R个外接矩形中的内容进行评价打分，获得R个分值；根据所述R个分值确定所述目标的检测结果。

本申请实施例第二方面公开了一种目标检测装置，包括：获取模块，用于获取第一图像；处理模块，用于对所述第一图像进行处理得到Q个感兴趣区域，确定每一个感兴趣区域中的参考点对应的图像坐标系的坐标；其中，Q为正整数；所述处理模块，用于根据所述每一个感兴趣区域中的参考点对应的图像坐标系的坐标，确定所述每一个感兴趣区域中的参考点对应的车体坐标系的坐标；所述处理模块，用于确定第一目标物体的三维模型；所述处理模块，用于根据所述每一个感兴趣区域中的参考点对应的车体坐标系的坐标、所述第一目标物体的三维模型的顶点集合，确定所述第一目标物体的三维模型在所述车体坐标系对应的至少一个坐标；所述处理模块，用于将所述第一目标物体的三维模型在所述车体坐标系对应的至少一个坐标在所述图像坐标系进行投影得到Q个像素区域；所述处理模块，用于根据所述至少一个感兴趣区域和所述Q个像素区域，确定所述目标的检测结果。

在一种可能的实现方式中，所述处理模块，还用于对所述Q个像素区域对应的Q个感兴趣区域进行筛选处理得到R个感兴趣区域，所述每一个像素区域对应一个感兴趣区域，R为正整数且R小于等于Q；确定所述R个感兴趣区域对应的R个外接矩形；根据所述R个外接矩形，确定所述目标的检测结果。

在又一种可能的实现方式中，所述处理模块，还用于在所述Q个感兴趣区域中的第一感兴趣区域的面积占所述第一感兴趣区域的凸包络面积的比例大于第一预设值的情况下，将所述第一感兴趣区域作为所述R个感兴趣区域中的一个；在所述Q个感兴趣区域中的第一感兴趣区域的凸包络宽高比与所述第一感兴趣区域对应的像素区域的宽高比的比值满足大于第二预设值且小于第三预设值的条件的情况下，将所述第一感兴趣区域作为所述R个感兴趣区域中的一个；在所述Q个感兴趣区域中的第一感兴趣区域的凸包络面积与所述第一感兴趣区域对应的像素区域的面积的比值满足大于所述第二预设值且小于所述第三预设值的条件的情况下，将所述第一感兴趣区域作为所述R个感兴趣区域中的一个；在所述Q个感兴趣区域中的第一感兴趣区域的凸包络轮廓与所述第一感兴趣区域对应的像素区域的轮廓的交并比IOU大于第四预设值的情况下，将所述第一感兴趣区域作为所述R个感兴趣区域中的一个。

在又一种可能的实现方式中，所述处理模块，还用于使用预先训练好的分类器对所述Q个感兴趣区域中的第一感兴趣区域的外接矩形中的内容进行评价打分，获得第一分值；在所述第一分值高于第五预设值的情况下，将所述第一感兴趣区域作为所述R个感兴趣区域中的一个。

在又一种可能的实现方式中，所述处理模块，还用于计算所述R个外接矩形的面积；根据所述R个外接矩形的面积确定所述目标的检测结果。

在又一种可能的实现方式中，所述处理模块，还用于使用预先训练好的分类器对所述R个外接矩形中的内容进行评价打分，获得R个分值；根据所述R个分值确定所述目标的检测结果。

关于第二方面或可能的实现方式所带来的技术效果，可参考对于第一方面或相应的实现方式的技术效果的介绍。

本申请实施例第三方面公开了一种目标检测装置，包括：处理器和存储器，所述存储器用于存储一个或多个程序，所述一个或多个程序包括计算机执行指令，所述处理器用于调用所述存储器存储的一个或多个程序，执行如下操作：获取第一图像；对所述第一图像进行处理得到Q个感兴趣区域，确定所述每一个感兴趣区域中的参考点对应的图像坐标系的坐标；根据所述每一个感兴趣区域中的参考点对应的图像坐标系的坐标，确定所述每一个感兴趣区域中的参考点对应的车体坐标系的坐标；确定第一目标物体的三维模型；根据所述每一个感兴趣区域中的参考点对应的车体坐标系的坐标、所述第一目标物体的三维模型的顶点集合，确定所述第一目标物体的三维模型在所述车体坐标系对应的至少一个坐标；将所述第一目标物体的三维模型在所述车体坐标系对应的至少一个坐标在所述图像坐标系进行投影得到Q个像素区域；根据所述Q个感兴趣区域和所述Q个像素区域，确定所述目标的检测结果，其中，Q为正整数。

在一种可能的实现方式中，所述至少一个处理器，还用于对所述Q个像素区域对应的Q个感兴趣区域进行筛选处理得到R个感兴趣区域，所述每一个像素区域对应一个感兴趣区域，R为正整数，且R小于等于Q；确定所述R个感兴趣区域对应的R个外接矩形；根据所述R个外接矩形，确定所述目标的检测结果。

在又一种可能的实现方式中，所述至少一个处理器，还用于在所述Q个感兴趣区域中的第一感兴趣区域的面积占所述第一感兴趣区域的凸包络面积的比例大于第一预设值的情况下，将所述第一感兴趣区域作为所述R个感兴趣区域中的一个；在所述Q个感兴趣区域中的第一感兴趣区域的凸包络宽高比与所述第一感兴趣区域对应的像素区域的宽高比的比值满足大于第二预设值且小于第三预设值的条件的情况下，将所述第一感兴趣区域作为所述R个感兴趣区域中的一个；在所述Q个感兴趣区域中的第一感兴趣区域的凸包络面积与所述第一感兴趣区域对应的像素区域的面积的比值满足大于所述第二预设值且小于所述第三预设值的条件的情况下，将所述第一感兴趣区域作为所述R个感兴趣区域中的一个；在所述Q个感兴趣区域中的第一感兴趣区域的凸包络轮廓与所述第一感兴趣区域对应的像素区域的轮廓的交并比IOU大于第四预设值的情况下，将所述第一感兴趣区域作为所述R个感兴趣区域中的一个。

在又一种可能的实现方式中，所述至少一个处理器，还用于使用预先训练好的分类器对所述Q个感兴趣区域中的第一感兴趣区域的外接矩形中的内容进行评价打分，获得第一分值；当所述第一分值高于第五预设值时，将所述第一感兴趣区域作为所述R个感兴趣区域中的一个。

在又一种可能的实现方式中，所述至少一个处理器，还用于计算所述R个外接矩形的面积；根据所述R个外接矩形的面积确定所述目标的检测结果。

在又一种可能的实现方式中，所述至少一个处理器，还用于使用预先训练好的分类器对所述R个外接矩形中的内容进行评价打分，获得R个分值；根据所述R个分值确定所述目标的检测结果。

关于第三方面或可能的实现方式所带来的技术效果，可参考对于第一方面或相应的实现方式的技术效果的介绍。

结合上述任意一个方面或者任意一个方面的任意一种可能的实现方式，在又一种可能的实现方式中，所述第一目标物体的三维模型的顶点集合，包括：一个第一上顶点(0,0，H1)、以及所述第一上顶点对应的第一底面圆上的n个等分点

其中，H1表示第一高度，R1表示所述第一上顶点对应的第一底面圆的半径，以所述第一底面圆的圆心为原点(0,0,0)，坐标轴为X轴向前、Y轴向左、Z轴向上定义的三维模型坐标系，k＝0,1,2,…,n-1，所述n为正整数。

结合上述任意一个方面或者任意一个方面的任意一种可能的实现方式，在又一种可能的实现方式中，所述第一目标物体的三维模型的顶点集合，包括：一个第二上顶点(0,0，L*cos(π/3))、左顶点

和右顶点

其中，L表示边长，以底边的中心为原点(0,0,0)，坐标轴为X轴向前、Y轴向左、Z轴向上定义的三维模型坐标系。

结合上述任意一个方面或者任意一个方面的任意一种可能的实现方式，在又一种可能的实现方式中，所述第一目标物体的三维模型的顶点集合，包括：第二底面圆上的m个等分点

以及所述第二底面圆对应的顶面圆上的m个等分点

其中，H2表示第二高度，R2表示所述第二底面圆的半径，k＝0,1,2,…,m-1，m为正整数。

本申请实施例第四方面公开了一种芯片系统，所述芯片系统包括至少一个处理器和获取接口，所述至少一个处理器用于从所述获取接口调用计算机程序，实现上述任意一方面或任意一方面的可能的实现方式中所描述的方法。

本申请实施例第五方面公开了一种计算机可读存储介质，所述存储介质中存储有计算机程序，当所述计算机程序在计算机上运行时，实现上述任意一方面或任意一方面的可能的实现方式中所描述的方法。

本申请实施例第六方面公开了一种车辆，所述车辆包括第二方面中的一种目标检测装置或第三方面中的一种目标检测装置。

附图说明

以下对本申请实施例用到的附图进行介绍。

图1是本申请实施例提供的一种交通场景中的目标障碍物的示意图；

图2是本申请实施例提供的一种目标检测系统的结构示意图；

图3是本申请实施例提供的一种交通场景示例图；

图4是本申请实施例提供的一种目标检测方法的流程示意图；

图5是本申请实施例提供的一种图像坐标系的示意图；

图6是本申请实施例提供的一种第一图像的示意图；

图7是本申请实施例提供的又一种第一图像的示意图；

图8是本申请实施例提供的又一种第一图像的示意图；

图9是本申请实施例提供的一种对第一图像处理得到的感兴趣区域的示意图；

图10是本申请实施例提供的又一种对第一图像处理得到的感兴趣区域的示意图；

图11是本申请实施例提供的又一种对第一图像处理得到的感兴趣区域的示意图；

图12是本申请实施例提供的一种反投影过程的示意图；

图13是本申请实施例提供的一种相机坐标系和图像坐标系的示意图；

图14是本申请实施例提供的一种参考点对应的图像坐标系的坐标的位置、与参考点对应的车体坐标系的坐标的位置之间的对应关系；

图15是本申请实施例提供的一种第一目标物体的三维模型的示意图；

图16是本申请实施例提供的又一种第一目标物体的三维模型的示意图；

图17是本申请实施例提供的又一种第一目标物体的三维模型的示意图；

图18是本申请实施例提供的一种在参考点对应的车体坐标系的坐标的位置上摆放第一目标物体的三维模型的过程；

图19是本申请实施例提供的一种反投影的示意图；

图20是本申请实施例提供的一种像素区域的示意图；

图21是本申请实施例提供的一种像素区域在第一图像中示意的示意图；

图22是本申请实施例提供的又一种像素区域的示意图；

图23是本申请实施例提供的又一种像素区域的示意图；

图24是本申请实施例提供的一种外接矩形的示意图；

图25是本申请实施例提供的一种目标的检测结果的示意图；

图26是本申请实施例提供的一种目标的检测结果的示意图；

图27是本申请实施例提供的一种目标的检测结果的示意图；

图28是本申请实施例提供的一种目标检测装置的示意图；

图29是本申请实施例提供的一种目标的检测装置的示意图。

具体实施方式

下面结合本申请实施例中的附图对本申请实施例进行描述。

请参见图2，图2是本申请实施例提供的一种目标检测系统2000的结构示意图，该系统包括获取模块2001、处理模块2002和规划和控制模块2003，其中，获取模块2001用于获取待检测图像；处理模块2002用于对获取模块2001获取的待检测图像中的障碍物进行检测；规划和控制模块2003用于接收处理模块2002的输出，对可移动平台自身的行为进行规划和控制。该系统2000可以应用于可移动平台，例如，车辆、机器人等。

下面对本申请中的部分用语进行解释说明，以便于理解。

三维投影(3-Dimension projection)：指将三维空间中的点映射到二维平面上的过程。在计算机视觉领域，三维投影主要指的是将世界空间中的点，通过相机模型(例如，针孔模型)，映射到二维图像平面的过程，该世界空间可以为车体坐标系。

反向投影(back-projection)：三维投影的逆过程，指将二维平面中的点映射到三维空间中的过程。在计算机视觉领域，反向投影主要指的是将二维图像平面中的点，通过相机模型和一些几何约束(例如，理想地平面假设)，映射到世界空间中的过程，该世界空间可以为车体坐标系。

理想地平面假设(flat-earth assumption)：指自车行驶所在的路面被认为是一个理想的平面。基于这个假设，可以实现反向投影，即从二维图像平面中属于路面的像素点出发，找到世界空间中理想地平面，即车体坐标系上定义的一个平面对应的点。

凸包络(convex hull)：给定一个点集，这个点集的凸包络就是包含点集中所有点的最小面积的凸多边形。直观的说，一个凸多边形(convex polygon)就是没有任何凹陷位的多边形。

非极大值抑制(non-maximum suppression，NMS)：指一种搜索局部最大值，去除非极大值的算法，常用于目标检测中对检测框的后处理。算法的输入是一组候选框以及每个候选框对应的得分(score)，输出是候选框的一个子集。具体的步骤为：首先，设所有的框都没有被抑制，所有框按照得分从大到小排序；从分数最高的框开始遍历，对于每一个框，如果该框没有被抑制，那么就将所有与它的重合程度大于阈值的框设为抑制；最后，返回没有被抑制的框。

交并比(Intersection-over-Union，IoU)：IOU是在目标检测中使用的一个概念，是两个区域的重叠率；简单来说，即两个区域面积的交集和并集的比值，以两个区域为第一区域和第二区域为例，那么第一区域与第二区域之间的交并比IOU的计算公式如下：

其中，S _{area(C)∩？？？？(G)}为第一区域C与第二区域G之间的交集的面积，S _{area(C)∩？rea(G)}为第一区域C与第二区域G之间的并集的面积。在一种示例中，所述Q个感兴趣区域中的第一感兴趣区域的凸包络轮廓与所述第一感兴趣区域对应的像素区域的轮廓的交并比IOU大于第四预设值，将所述第一感兴趣区域作为所述R个感兴趣区域中的一个，其中，第四预设值为70％，那么Q个感兴趣区域中的第一感兴趣区域的凸包络轮廓包括的区域为第一区域，所述第一感兴趣区域对应的像素区域的轮廓包括的区域可以为第二区域。

聚类：是指将物理或抽象对象的集合分成由类似的对象组成的多个类的过程。由聚类所生成的簇是一组数据对象的集合，这些对象与同一个簇中的对象彼此相似，与其他簇中的对象相异。

在交通场景中实时检测目标障碍物的相关技术主要分为两类：第一类：通过毫米波雷达、激光雷达等传感器，以及基于物理或几何原理，测量周围物体的距离、速度、方位角等信息，或形成周围环境的三维点云或深度信息，对目标障碍物进行探测。第二类：通过摄像头采集到的可见光图像，基于对目标物体成像特征的处理分析和学习，对画面中的物体进行识别，从而达到检测出图像中的目标障碍物的目的。

在一种方法中，以在交通场景中，目标障碍物为交通锥为例：基于监督学习，利用预先采集和标注得到的交通锥的训练样本，训练得到检测和识别模型，然后对画面中的候选目标区域进行检测和识别，达到检测出交通锥的目的。具体过程如下：首先，获取压缩和激活网络SENet和密集卷积网络DenseNet，然后基于SENet和DenseNet及预设的目标检测模型确定目标网络结构，也就是设计级联网络结构，然后基于多张包含交通锥的原始交通锥场景图像，训练目标网络结构得到交通锥识别模型；然后将待识别图像输入该交通锥识别模型，输出识别结果，识别结果为待识别图像中有交通锥及交通锥在待识别图像中的位置、或待识别图像中无交通锥。但是，通过这种方式检测目标障碍物存在如下缺点：级联网络框架的算法复杂度较高，对算力要求较大，如果计算平台的算力有限，则难以部署或形成实时有效的检测。而且基于监督学习的传统目标检测框架需要训练模型，对数量的数量和分别的依赖程度比较高，因此需要针对不同类型的目标障碍物进行一定规模的数据采集和标注，当训练样本的数量和分布不足时，则难以形成有效实时检测。

在又一种方法中，基于通常情况下，属于同一个前景物体的光流趋同、且与背景的光流明显不一致的前提，通过对场景中的光流进行聚类，达到检测出目标障碍物的目的。具体过程如下：首先，计算相邻帧之间的光流。然后，基于光流场，聚类位置相互靠近、且位移矢量相似的像素点。聚类的准则则：是否具有共同的光流汇集点(focus of expansion)，以及共同的尺度(scale magnitude)。然后，输出这些被聚类的光流簇，作为前景目标区域，即目标障碍物检测结果。如图3中的3-1所示，表示一个交通场景示例，其中包括其中包含行人(320)与汽车(310)等前景物体，以及静态背景(例如，地面、道路等)；如图3中的3-2所示给出了对应的特征空间(由光流汇集点的横坐标X、光流汇集点的横坐标Y，以及光流矢量尺度这三个维度构成)，其中包含行人对应的特征点(350)，汽车对应的特征点(340)，还有静态背景对应的特征子空间(330)。穿越道路的行人产生的光流，有共同的汇集点，和相同的尺度(S2)，因此在特征空间中形成了一个特征点(350)。静态背景的光流，有共同的汇集点，但是存在较广的尺度分布，所以其对应的特征子空间(330)呈圆柱状，而非点状。由于行人的光流汇集点与静态背景的光流汇集点明显不同，因此在特征空间中，行人对应的特征点(350)和静态背景对应的特征子空间(330)有较大的距离，比较容易区分。也就是说通过在上述特征空间中对光流聚类，可以有效检测出示例中的行人。但是，通过这种方式检测存在如下缺点：基于全局稠密光流，计算开销较大，对算法的实时性造成挑战；物体能被检测到的首要前提，是有对应的光流，如果因为物体纹理单一或重复、运动模糊、帧间位移过大超出搜索范围、和自车相对静止等常见原因导致光流计算失效，则无法检测；检测性能依赖于光流的精度，如果对光流汇集点和尺度的估计不够准确，则无法形成有效聚类；对于在车辆正前方，运动状态为静止或者平行于车辆运动方向的物体，无法形成有效检测。如图3所示，前方的汽车(310)产生的光流，有共同的汇集点，和相同的尺度(S1)，因此在特征空间中形成了一个特征点(340)。然而，由于这辆汽车正处于上述的运动状态(静止或者平行于车辆运动方向)，其光流汇集点正好与静态背景的光流汇集点相同，导致了在特征空间中，其对应的特征点(340)被静态背景对应的特征子空间(330)所包含。也就是说通过在上述特征空间中对光流聚类，无法有效检测出示例中的汽车。

基于此，本申请实施例提出了以下解决方案。

该方法的执行主体为可移动平台，该可移动平台可以为车辆、机器人等等。

请参见图4，图4是本申请实施例提供的一种目标检测方法，该方法包括但不限于如下步骤：

步骤S401：获取第一图像。

具体地，获取第一图像的方式可以包括两种：当本申请实施例方法应用于摄像头的芯片中时，获取第一图像就是指摄像头拍摄的图像；当本申请实施例方法应用于摄像头之外的芯片中时，获取第一图像就是指从摄像头接收图像，摄像头可以为单目摄像头、双目摄像头、多目摄像头或者环视摄像头等等，此处不做限定。

步骤S402：对所述第一图像进行处理得到Q个感兴趣区域，确定所述每一个感兴趣区域中的参考点对应的图像坐标系的坐标。

具体地，Q为正整数，可以通过对所述第一图像的色彩范围进行限定或者提取边缘的方式对所述第一图像进行处理得到Q个感兴趣区域。具体通过对所述第一图像的色彩范围进行限定的方式对所述第一图像进行处理的过程如下：将所述第一图像的色彩空间转换为色相、饱和度、亮度值(Hue,Saturation,Value，HSV)，然后对色相、饱和度、亮度值这三个维度的范围进行限定从而得到Q个感兴趣区域。具体通过提取边缘的方式对所述第一图像进行处理得到Q个感兴趣区域的过程如下：通常情况下，物体与路面的像素取值分布不同，因此在物体边界处往往会呈现出因像素取值变化较大导致的明显边缘特征，所以通过边缘算子对第一图像进行处理，可以得到Q个感兴趣区域。

具体地，所述每一个感兴趣区域中的参考点可以为所述每一个感兴趣区域中的底部中点，也可以是每一个感兴趣区域中的其他点，此处不做限定，采取统一取点的标准即可。所述图像坐标系可以分为图像像素坐标系和图像物理坐标系，图像物理坐标系的原点O ₁为相机光轴与成像平面的交点即主点，X轴和Y轴分别平行于相机坐标系的Xc轴与Yc轴，是平面直角坐标系；图像像素坐标系是固定在图像上以像素为单位的平面直角坐标系，其原点O ₀位于图像左上角，u轴和v轴分别平行于图像物理坐标系的X轴和Y轴，主点在u-v坐标系中的坐标为(u ₀，v ₀)，如图5所示。图像上的一个点在图像物理坐标系和图像像素坐标系下的坐标可以相互转换。

具体转换过程如下，假设图像上的一个点在图像物理坐标系下的坐标为(x，y)、在图像像素坐标系下的坐标为(u，v),(u ₀，v ₀)为主点在图像像素坐标系下的像素坐标。du，dv分别为一个像素在X轴和Y轴上的物理尺寸，那么

上述公式(1)可以用矩阵相乘形式表达，具体如下：

对所述第一图像进行处理得到Q个感兴趣区域的具体示例如下：

在一种示例中，第一图像如图6所示，该第一图像中包括交通锥，将该第一图像的色彩空间转换为HSV，并且对色相H、饱和度S、亮度值V这三个维度的范围进行限定，在本申请实施例中，对HSV色彩空间中橙红色子空间限定为0°≤H≤10°,160°≤H≤180°；70≤S≤255；100≤V≤255，从而得到Q个感兴趣区域。

在又一种示例中，第一图像如图7所示，该第一图像中包括机动车用三角警告牌，将该第一图像的色彩空间转换为HSV，并且对色相H、饱和度S、亮度值V这三个维度的范围进行限定，在本申请实施例中，对HSV色彩空间中橙红色子空间限定为0°≤H≤10°,160°≤H≤180°；70≤S≤255；100≤V≤255，从而得到Q个感兴趣区域。

在又一种示例中，第一图像如图8所示，该第一图像中包括平躺轮胎，将该第一图像的色彩空间转换为HSV，并且对色相H、饱和度S、亮度值V这三个维度的范围进行限定，在本申请实施例中，对HSV色彩空间中黑色子空间限定为0°≤H≤120°；0≤S≤100；100≤V≤20，从而得到Q个感兴趣区域。

可选的，在一种可能的实现方式中，对第一图像进行处理得到一个或多个感兴趣区域之后，若所述一个或多个感兴趣区域中某个感兴趣区域包含的像素点的个数少于S个，则将该感兴趣区域滤除。

具体地，S为正整数。

在一种示例中，假设第一图像如图6所示，S的取值为5，对第一图像进行处理得到Q+1个感兴趣区域，其中，Q+1个感兴趣区域中的一个感兴趣区域包含的像素点的个数为2，那么将该点的个数为2的一个感兴趣区域滤除，最终得到的Q个感兴趣区域如图9所示。

在又一种示例中，假设第一图像如图7所示，S的取值为5，对第一图像进行处理得到Q+2个感兴趣区域，其中，Q+2个感兴趣区域中的一个感兴趣区域包含的像素点的个数为2，一个感兴趣区域包含的像素点的个数为3，那么将该像素点的个数为2的一个感兴趣区域、以及像素点的个数为3的一个感兴趣区域都滤除，最终得到的Q个感兴趣区域如图10所示。

在又一种示例中，假设第一图像如图8所示，S的取值为15，对第一图像进行处理得到Q+1个感兴趣区域，其中，Q+1个感兴趣区域中的一个感兴趣区域包含的像素点的个数为10，那么将该像素点的个数为10的一个感兴趣区域滤除，最终得到的Q个感兴趣区域如图11所示。

步骤S403：根据所述每一个感兴趣区域中的参考点对应的图像坐标系的坐标，确定所述每一个感兴趣区域中的参考点对应的车体坐标系的坐标。

具体地，该过程可以简称为反投影。如图12所示，假设每一个感兴趣区域中的参考点都对应一个地面物体，反投影的目的就是为了找到这个假定存在的地面物体对应的车体坐标系的坐标。在本申请实施例中，该车体坐标系的原点O ₃为自车后轴中心点在理想地平面，即车体坐标系中定义的一个平面上的投影，坐标轴为X _w轴向前，Y _w轴向左，Z _w轴向上。

具体地，根据相机的外部参数，内参矩阵和尺度参数将所述每一个感兴趣区域中的参考点对应的图像坐标系的坐标，确定所述每一个感兴趣区域中的参考点对应的车体坐标系坐标，也就是说将所述每一个感兴趣区域中的参考点由图像坐标系转换到车体坐标系，具体转换关系如下：

首先，将图像坐标系中每一个感兴趣区域中的参考点进行归一化处理：具体公式如下：

E _norm＝K ^-1e (3)

其中，E _norm表示归一化的图像坐标系中每一个感兴趣区域中的参考点对应的图像坐标系的坐标，K表示相机的内参矩阵，e表示每一个感兴趣区域中的参考点对应的图像坐标系的坐标。

然后，如图13所示，从相机原点O _c出发，连接图像坐标系中每一个感兴趣区域中的参考点，得到相机坐标系中的射线的表达式Ray(t ₁)＝(x _it ₁，y _it ₁，t ₁)；其中，x _i，y _i表示每一个感兴趣区域中的参考点对应的图像坐标系的横坐标和纵坐标，t ₁表示系数。

在车体坐标系定义一个理想地平面，由于车体坐标系的原点O ₃为自车后轴中心点在理想地平面上的投影，坐标轴为X _w轴向前，Y _w轴向左，Z _w轴向上，因此车体坐标系中的理想地平面可以由法向量n＝[0,0,1]和车体坐标系的原点O ₃(0,0,0)确定，已知从车体坐标系到相机坐标系的变换矩阵，将上述法向量n和车体坐标系的原点O ₃从车体坐标系转换到相机坐标系，得到该理想地平面在相机坐标系中的对应表达式Ax+By+Cz+D＝0。其中，A,B,C,D为已知常数，并且A,B,C不同时为零。

根据射线的表达式和理想地平面在相机坐标系中的对应表达式得到

然后将t ₁带入射线的表达式，即可得到射线与平面的交点，该交点为图像坐标系中每一个感兴趣区域中的参考点对应在相机坐标系中的点，然后通过从相机坐标系到车体坐标系的变换矩阵，可以得到参考点对应在车体坐标系中的点，也即通过上述过程根据每一个感兴趣区域中的参考点对应的图像坐标系的坐标，确定每一个感兴趣区域中的参考点对应的车体坐标系的坐标。

在一种示例中，如图14所示，假设所述每一个感兴趣区域中的参考点对应的图像坐标系的坐标的位置分别为1001、1002、1003、1004、1005、1006，根据相机的外部参数，内参矩阵和尺度参数确定所述每一个感兴趣区域中的参考点对应的车体坐标系的坐标的位置分别为1007、1008、1009、1010、1011、1012。具体的所述每一个感兴趣区域中的参考点对应的图像坐标系的坐标的位置、所述每一个感兴趣区域中的参考点对应的车体坐标系的坐标的位置之间的对应关系，如表格1所示。

表格1

步骤S404：确定第一目标物体的三维模型。

具体的，第一目标物体的三维模型可以为对交通锥、机动车用三角警告牌和平躺的轮胎等等进行三维建模得到的，此处不做限定。由于交通锥、机动车用三角警告牌和轮胎的具体参数信息，国际或者国际标准中都有明确的规定，因此可以以交通锥、机动车用三角警告牌和轮胎为参照物，定义三维模型坐标系，从而确定第一目标物体的三维模型的顶点集合。

在一种示例中，如图15所示，交通锥可以表示为一个底面半径R1＝0.15米、高度H1＝0.7米的圆锥体(201)，假设第一目标物体的三维模型为对交通锥(101)进行三维建模得到的，具体如下：定义一个三维模型坐标系，以第一底面圆的圆心为原点(0,0,0)，坐标轴为X轴向前、Y轴向左、Z轴向上，那么所述第一目标物体的三维模型的顶点集合包括一个第一上顶点(0,0，H1)、以及所述第一上顶点对应的第一底面圆上的n个等分点

其中，H1表示高度，R1表示第一底面圆的半径，k＝0,1,2,…,n-1，n为正整数。在本申请实施例中，n取值为36。

在又一种示例中，如图16所示，机动车用三角警告牌模型可以表示为一个边长为L＝0.5米的等边三角形(203)，假设第一目标物体的三维模型为对机动车用三角警告牌(103)进行三维建模得到的，具体如下：定义一个三维模型坐标系，以底边的中心为原点(0,0,0)，坐标轴为X轴向前、Y轴向左、Z轴向上，那么所述第一目标物体的三维模型的顶点集合包括一个第二上顶点(0,0，L*cos(π/3))、左顶点

和右顶点

其中，L表示边长。

在又一种示例中，如图17所示，平躺轮胎可以表示为一个底面半径R2＝0.356米、高度H2＝0.125米的圆柱体(205)，假设第一目标物体的三维模型为对平躺轮胎(105)进行三维建模得到的，具体如下：定义一个三维模型坐标系，以第二底面圆的圆心为原点(0,0,0)，坐标轴为X轴向前、Y轴向左、Z轴向上，那么所述第一目标物体的三维模型的顶点集合包括第二底面圆上的m个等分点

以及所述第二底面圆对应的顶面圆上的m个等分点

其中，H2表示高度，R2表示第二底面圆的半径，k＝0,1,2,…,m-1，m为正整数。本实施例中，m的取值为36。

步骤S405：根据所述每一个感兴趣区域中的参考点对应的车体坐标系的坐标、所述第一目标物体的三维模型的顶点集合，确定所述第一目标物体的三维模型在所述车体坐标系对应的至少一个坐标。

具体地，该过程可以认为是在每一个感兴趣区域中的参考点对应的车体坐标系的坐标的位置上摆放第一目标物体的三维模型，也就是说，第一目标物体的三维模型的顶点集合中的所有点对应的三维模型坐标系的坐标从三维模型坐标系平移到车体坐标系。

在一种示例中，假设一个感兴趣区域中的参考点对应的车体坐标系的坐标为(X _GP,Y _GP,Z _GP)，第一目标物体的三维模型的顶点集合中的一个点在三维模型坐标系中的坐标为(P _X,P _Y,P _Z)，那么在所述一个感兴趣中的参考点上摆放所述第一目标物体的三维模型，确定所述第一目标物体的三维模型的顶点集合中的一个点在所述车体坐标系中的坐标为(X _GP+P _X,Y _GP+P _Y,Z _GP+P _Z)，通过这样的方式能够确定所述第一目标物体的三维模型的顶点集合中的所有点在所述车体坐标系对应的坐标，也就是说确定所述第一目标物体的三维模型在所述车体坐标系对应的至少一个坐标。

在一种示例中，如图18所示，表示在所述每一个感兴趣区域中的参考点对应的车体坐标系的坐标的位置上摆放第一目标物体的三维模型的过程，也就是说所述每一个感兴趣区域中的参考点对应一个第一目标物体的三维模型，Q个感兴趣区域对应Q个第一目标物体的三维模型。具体的所述每一个感兴趣区域中的参考点对应的图像坐标系的坐标的位置、所述每一个感兴趣区域中的参考点对应的车体坐标系的坐标的位置、以及所述第一目标物体的三维模型在所述车体坐标系对应的至少一个坐标的位置之间的对应关系如表格2所示。

表格2

步骤S406：将所述第一目标物体的三维模型在所述车体坐标系对应的至少一个坐标在所述图像坐标系进行投影得到Q个像素区域。

具体地，这个过程可以简称为三维投影，根据相机的外部参数，内参矩阵和尺度参数，将所述第一目标物体的三维模型在所述车体坐标系对应的至少一个坐标由车体坐标系转换到图像坐标系，也就是确定所述第一目标物体的三维模型在所述图像坐标系对应的至少一个坐标，然后对所述第一目标物体的三维模型在所述图像坐标系对应的至少一个坐标的点集取轮廓，从而得到Q个像素区域，其中Q为正整数。

具体地，根据第一目标物体的三维模型在车体坐标系对应的至少一个坐标确定第一目标物体的三维模型在图像坐标系对应的至少一个坐标，具体如下：

首先，图像物理坐标系O _cXYZ与相机坐标系O _cX _cY _cZ _c之间的关系：

如图19所示假设空间上一物点P在相机坐标系下的坐标为(X _c,Y _c,Z _c)。则该P点对应相点p在图像物理坐标系下的坐标为：

其中，(X _c,Y _c,Z _c)表示空间上一物点P在相机坐标系下的坐标，f表示相机焦距，Z _c表示尺度参数。

其次，相机坐标系O _cX _cY _cZ _c与车体坐标系O _wX _wY _wZ _w之间的关系：

其中，0 ^T＝(0,0,0) ^T，R3为旋转矩阵，t为位移向量，(X _c,Y _c,Z _c)表示空间上一物点P在相机坐标系下的坐标，(X _w,Y _w,Z _w)表示空间上一物点P在车体坐标系下的坐标。

然后，根据公式(2)、公式(5)和公式(6)确定图像像素坐标系与车体坐标系之间的关系：

因此，可以根据公式(7)，也就是根据第一目标物体的三维模型在车体坐标系对应的至少一个坐标确定第一目标物体的三维模型在图像坐标系对应的至少一个坐标，其中，[u,v] ^T表示第一目标物体的三维模型在图像坐标系对应的至少一个坐标，[X _w,Y _w,Z _w]表示第一目标物体的三维模型在车体坐标系对应的至少一个坐标，Z _c表示尺度参数，也可以认为第一目标物体的三维模型在相机坐标系对应的至少一个坐标，

为相机的内参矩阵，R3为旋转矩阵，t为位移向量。

在一种示例中，假设所述第一目标物体的三维模型在所述车体坐标系对应的至少一个坐标的位置分别为1107、1108、1109、1110、1111、1112，那么将所述第一目标物体的三维模型在所述车体坐标系对应的至少一个坐标在所述图像坐标系进行投影得到Q个像素区域，如图20所示，确定所述第一目标物体的三维模型在所述车体坐标系对应的至少一个坐标的位置为1107、1108、1109、1110、1111、1112对应的Q个像素区域分别为1201、1202、1203、1204、1205、1206。将所述Q个像素区域在第一图像中示意如图21所示。具体地，所述每一个感兴趣区域中的参考点对应的图像坐标系的坐标的位置、所述每一个感兴趣区域中的参考点对应的车体坐标系的坐标的位置、以及所述第一目标物体的三维模型在所述车体坐标系对应的至少一个坐标的位置、以及Q个像素区域之间的对应关系如表格3所示。

表格3

在一种示例中，假设第一图像如图6所示，对所述第一图像进行处理得到的Q个感兴趣区域如图9所示。然后根据所述每一个感兴趣区域中的参考点对应的图像坐标系的坐标，确定所述每一个感兴趣区域中的参考点对应的车体坐标系的坐标；确定第一目标物体的三维模型是通过对机动车用三角警告牌进行三维建模得到的；然后根据所述每一个感兴趣区域中的参考点对应的车体坐标系的坐标、所述第一目标物体的三维模型的顶点集合，确定所述第一目标物体的三维模型在所述车体坐标系对应的至少一个坐标；将所述第一目标物体的三维模型在所述车体坐标系对应的至少一个坐标在所述图像坐标系进行投影得到Q个像素区域，如图22所示。

在一种示例中，假设第一图像如图7所示，对所述第一图像进行处理得到的Q个感兴趣区域如图10所示。然后根据所述每一个感兴趣区域中的参考点对应的图像坐标系的坐标，确定所述每一个感兴趣区域中的参考点对应的车体坐标系的坐标；确定第一目标物体的三维模型是通过对平躺轮胎进行三维建模得到的；然后根据所述每一个感兴趣区域中的参考点对应的车体坐标系的坐标、所述第一目标物体的三维模型的顶点集合，确定所述第一目标物体的三维模型在所述车体坐标系对应的至少一个坐标；将所述第一目标物体的三维模型在所述车体坐标系对应的至少一个坐标在所述图像坐标系进行投影得到Q个像素区域，如图23所示。

步骤S407：根据所述Q个感兴趣区域和Q个像素区域，确定目标的检测结果。

具体地，对Q个像素区域对应的Q个感兴趣区域进行筛选处理得到R个感兴趣区域，其中，每一个像素区域对应一个感兴趣区域，R为正整数且R小于等于Q；然后确定R个感兴趣区域对应的R个外接矩形；根据R个外接矩形，确定目标的检测结果。每一个像素区域对应一个感兴趣区域可以认为是一个聚类的过程。假设将所述第一目标物体的三维模型在所述车体坐标系对应的至少一个坐标在所述图像坐标系进行投影得到Q个像素区域，如图20所示，在图20中包括6个像素区域分别为像素区域1201、像素区域1202、像素区域1203、像素区域1204、像素区域1205和像素区域1206，像素区域1201对应的感兴趣区域是指像素区域1201包括的白色区域部分，像素区域1202对应的感兴趣区域是指像素区域1202中包括的白色区域部分，像素区域1203对应的感兴趣区域、像素区域1204对应的感兴趣区域、像素区域1205对应的感兴趣区域、像素区域1206对应的感兴趣区域都是同理，此处不再赘述。

在一种可能的实现方式中，对Q个像素区域对应的Q个感兴趣区域进行筛选处理得到R个感兴趣区域，可以包括以下5种筛选规则：

规则1：当所述Q个感兴趣区域中的第一感兴趣区域的面积占所述第一感兴趣区域的凸包络面积的比例大于第一预设值，将所述第一感兴趣区域作为所述R个感兴趣区域中的一个。在一种示例中，第一预设值可以为50％，假设Q个感兴趣区域中的第一感兴趣区域的面积为20像素(pixels),第一感兴趣区域的凸包络面积为25(pixels)，由于该第一感兴趣区域的面积20(pixels)与第一感兴趣区域的凸包络面积为25(pixels)的比值为80％，80％大于50％，那么该第一感兴趣区域保留，作为R个感兴趣区域中的一个。

规则2：当所述Q个感兴趣区域中的第一感兴趣区域的凸包络宽高比与所述第一感兴趣区域对应的像素区域的宽高比的比值满足大于第二预设值且小于第三预设值的条件，将所述第一感兴趣区域作为所述R个感兴趣区域中的一个。在一种示例中，第二预设值为0.5，第三预设值为2。

规则3：当所述Q个感兴趣区域中的第一感兴趣区域的凸包络面积与所述第一感兴趣区域对应的像素区域的面积的比值满足大于所述第二预设值且小于所述第三预设值的条件，将所述第一感兴趣区域作为所述R个感兴趣区域中的一个。在一种示例中，第二预设值为0.5，第三预设值为2。

规则4：当所述Q个感兴趣区域中的第一感兴趣区域的凸包络轮廓与所述第一感兴趣区域对应的像素区域的轮廓的交并比IOU大于第四预设值，将所述第一感兴趣区域作为所述R个感兴趣区域中的一个。在一种示例中，第四预设值为70％。

规则5：使用预先训练好的分类器对所述Q个感兴趣区域中的第一感兴趣区域的外接矩形中的内容进行评价打分，获得第一分值；当所述第一分值高于第五预设值时，将所述第一感兴趣区域作为所述R个感兴趣区域中的一个。

以上规则1、规则2、规则3、规则4和规则5可以任意组合，此处不做限定。例如，当上述规则1、规则2、规则3和规则4同时满足时，即当所述Q个感兴趣区域中的第一感兴趣区域的面积占所述第一感兴趣区域的凸包络面积的比例大于第一预设值、所述第一感兴趣区域的凸包络宽高比与所述第一感兴趣区域对应的像素区域的宽高比的比值满足大于第二预设值且小于第三预设值的条件、所述第一感兴趣区域的凸包络面积与所述第一感兴趣区域对应的像素区域的面积的比值满足大于所述第二预设值且小于所述第三预设值的条件、且所述第一感兴趣区域的凸包络轮廓与所述第一感兴趣区域对应的像素区域的轮廓的交并比IOU大于第四预设值，将所述第一感兴趣区域作为所述R个感兴趣区域中的一个。

在一种可能的实现方式中，根据R个外接矩形，确定目标的检测结果包括：计算所述R个外接矩形的面积；根据所述R个外接矩形的面积确定所述目标的检测结果。

具体地，可以采用非极大值抑制算法确定目标的检测结果。首先设R个外接矩形都没有抑制，然后将该R个外接矩形按照面积的大小从大到小排序，然后从面积最大的外接矩形开始遍历，对每一个外接矩形，如果没有被抑制，那么将所有与它的重合程度大于阈值的外接矩形设为抑制，最后返回没有被抑制的外接矩形。当然也可以采用其他的方式根据R个外接矩形的面积确定目标的检测结果，本申请实施例不做限定。

在一种可能的实现方式中，根据R个外接矩形，确定目标的检测结果包括：使用预先训练好的分类器对所述R个外接矩形中的内容进行评价打分，获得R个分值；根据所述R个分值确定所述目标的检测结果。

具体地，获得R个分值之后可以采用非极大值抑制算法确定目标的检测结果。首先设R个外接矩形都没有抑制，然后将该R个外接矩形按照R个分值的大小从大到小排序，然后从分值最大的外接矩形开始遍历，对每一个外接矩形，如果没有被抑制，那么将所有与它的重合程度大于阈值的外接矩形设为抑制，最后返回没有被抑制的外接矩形。当然也可以采用其他的方式根据R个分值确定目标的检测结果，本申请实施例不做限定。

在一种示例中，假设将所述第一目标物体的三维模型在所述车体坐标系对应的至少一个坐标在所述图像坐标系进行投影得到Q个像素区域，如图20所示，Q为6，每一个像素区域对应一个感兴趣区域，通过过滤规则对6个像素区域对应的感兴趣区域进行过滤，此时过滤规则为规则1、规则2、规则3和规则4同时满足，确定图20中的像素区域1201对应的感兴趣区域、像素区域1202对应的感兴趣区域和像素区域1206对应的感兴趣区域不满足以上过滤规则，那么该像素区域1201对应的感兴趣区域、像素区域1202对应的感兴趣区域和像素区域1206对应的感兴趣区域被过滤掉，那么像素区域1203对应的感兴趣区域、像素区域1204对应的感兴趣区域和像素区域1205对应的感兴趣区域满足以上过滤规则，被保留。然后对像素区域1203对应的感兴趣区域、像素区域1204对应的感兴趣区域和像素区域1205对应的感兴趣区域做外接矩形(rectangular bounding box)，即检测框，分别为外接矩形1401、外接矩形1402和外接矩形1403，具体格式为[x1,y1,w1,h1]，其中(x1,y1)为矩形框的左上角图像坐标，(w1,h1)为矩形框的像素宽、高，如图24所示。

第一种方式，计算外接矩形1401、外接矩形1402和外接矩形1403的面积，根据面积大者优先的非极大值抑制算法，确定外接矩形1402和外接矩形1403被去除，从而输出外接矩形1401，最终得到目标的检测结果，也就是交通锥在第一图像中的位置，如图25所示。

第二种方式，使用预先训练好的分类器对外接矩形1401、外接矩形1402和外接矩形1403中的内容进行评价打分，获得3个分值；然后假设外接矩形1401、外接矩形1402和外接矩形1403都没有被抑制，外接矩形1401、外接矩形1402和外接矩形1403按照得分从大到小排序；从分数最高的外接矩形开始遍历，对于每一个外接矩形，如果该外接矩形没有被抑制，那么就将所有与它的重合程度大于阈值的外接矩形设为抑制；最后，返回没有被抑制的外接矩形，即外接矩形1401，最终得到目标的检测结果，也就是交通锥在第一图像中的位置，如图25所示。

在一种示例中，假设将所述第一目标物体的三维模型在所述车体坐标系对应的至少一个坐标在所述图像坐标系进行投影得到Q个像素区域，如图22所示，Q为2，每一个像素区域对应一个感兴趣区域，通过过滤规则对2个像素区域对应的感兴趣区域进行过滤，此时过滤规则为规则1、规则2、规则3和规则4同时满足，确定图22中的像素区域1902对应的感兴趣区域不满足以上过滤规则，那么该像素区域1902对应的感兴趣区域被过滤掉，像素区域1901对应的感兴趣区域满足以上过滤规则，被保留。然后对像素区域1901对应的感兴趣区域做外接矩形(rectangular bounding box)，即检测框，具体格式为[x1,y1,w1,h1]，其中(x1,y1)为矩形框的左上角图像坐标，(w1,h1)为矩形框的像素宽、高。然后根据外接矩形，确定目标的检测结果，也就是机动车用三角警告牌在第一图像中的位置，如图26所示。

在一种示例中，假设将所述第一目标物体的三维模型在所述车体坐标系对应的至少一个坐标在所述图像坐标系进行投影得到Q个像素区域，如图23所示，每一个像素区域对应一个感兴趣区域，通过过滤规则对Q个像素区域对应的感兴趣区域进行过滤，此时过滤规则为规则1、规则2、规则3和规则4同时满足，确定图23中的像素区域2501对应的感兴趣区域满足以上过滤规则，被保留，除像素区域2501之外的像素区域对应的感兴趣区域不满足以上过滤规则，那么将除像素区域2501之外的像素区域对应的感兴趣区域过滤掉。然后对像素区域2501对应的感兴趣区域做外接矩形(rectangular bounding box)，即检测框，具体格式为[x1,y1,w1,h1]，其中(x1,y1)为矩形框的左上角图像坐标，(w1,h1)为矩形框的像素宽、高。然后根据外接矩形，确定目标的检测结果，也就是平躺轮胎在第一图像中的位置，如图27所示。

上述详细阐述了本申请实施例的方法，下面提供了本申请实施例的装置。

请参见图28，图28是本申请实施例提供的一种目标检测装置2800的结构示意图，该目标检测装置可以包括获取模块2801和处理模块2802，其中，各个模块的详细描述如下。

获取模块2801，用于获取第一图像；处理模块2802，用于对所述第一图像进行处理得到Q个感兴趣区域，确定每一个感兴趣区域中的参考点对应的图像坐标系的坐标；其中，Q为正整数；所述处理模块2802，用于根据所述每一个感兴趣区域中的参考点对应的图像坐标系的坐标，确定所述每一个感兴趣区域中的参考点对应的车体坐标系的坐标；所述处理模块2802，用于确定第一目标物体的三维模型；所述处理模块2802，用于根据所述每一个感兴趣区域中的参考点对应的车体坐标系的坐标、所述第一目标物体的三维模型的顶点集合，确定所述第一目标物体的三维模型在所述车体坐标系对应的至少一个坐标；所述处理模块2802，用于将所述第一目标物体的三维模型在所述车体坐标系对应的至少一个坐标在所述图像坐标系进行投影得到Q个像素区域；所述处理模块2802，用于根据所述至少一个感兴趣区域和所述Q个像素区域，确定所述目标的检测结果。

在一种可能的实现方式中，所述处理模块2802，还用于对所述Q个像素区域对应的Q个感兴趣区域进行筛选处理得到R个感兴趣区域，所述每一个像素区域对应一个感兴趣区域，R为正整数且R小于等于Q；确定所述R个感兴趣区域对应的R个外接矩形；根据所述R个外接矩形，确定所述目标的检测结果。

在又一种可能的实现方式中，所述处理模块2802，还用于在所述Q个感兴趣区域中的第一感兴趣区域的面积占所述第一感兴趣区域的凸包络面积的比例大于第一预设值的情况下，将所述第一感兴趣区域作为所述R个感兴趣区域中的一个；在所述Q个感兴趣区域中的第一感兴趣区域的凸包络宽高比与所述第一感兴趣区域对应的像素区域的宽高比的比值满足大于第二预设值且小于第三预设值的条件的情况下，将所述第一感兴趣区域作为所述R个感兴趣区域中的一个；在所述Q个感兴趣区域中的第一感兴趣区域的凸包络面积与所述第一感兴趣区域对应的像素区域的面积的比值满足大于所述第二预设值且小于所述第三预设值的条件的情况下，将所述第一感兴趣区域作为所述R个感兴趣区域中的一个；在所述Q个感兴趣区域中的第一感兴趣区域的凸包络轮廓与所述第一感兴趣区域对应的像素区域的轮廓的交并比IOU大于第四预设值的情况下，将所述第一感兴趣区域作为所述R个感兴趣区域中的一个。

在又一种可能的实现方式中，所述处理模块2802，还用于使用预先训练好的分类器对所述Q个感兴趣区域中的第一感兴趣区域的外接矩形中的内容进行评价打分，获得第一分值；在所述第一分值高于第五预设值的情况下，将所述第一感兴趣区域作为所述R个感兴趣区域中的一个。

在又一种可能的实现方式中，所述处理模块2802，还用于计算所述R个外接矩形的面积；根据所述R个外接矩形的面积确定所述目标的检测结果。

在又一种可能的实现方式中，所述处理模块2802，还用于使用预先训练好的分类器对所述R个外接矩形中的内容进行评价打分，获得R个分值；根据所述R个分值确定所述目标的检测结果。

在又一种可能的实现方式中，所述第一目标物体的三维模型的顶点集合，包括：一个第一上顶点(0,0，H1)、以及所述第一上顶点对应的第一底面圆上的n个等分点

在又一种可能的实现方式中，所述第一目标物体的三维模型的顶点集合，包括：一个第二上顶点(0,0，L*cos(π/3))、左顶点

和右顶点

在又一种可能的实现方式中，所述第一目标物体的三维模型的顶点集合，包括：第二底面圆上的m个等分点

以及所述第二底面圆对应的顶面圆上的m个等分点

需要说明的是，各个模块的实现及有益效果还可以对应参照图4所示的方法实施例的相应描述。

请参见图29，图29是本申请实施例提供的一种目标检测装置2900，该装置2900包括处理器2901和通信接口2903，可选的，还包括存储器2902，所述处理器2901、存储器2902和通信接口2903通过总线2904相互连接。

存储器2902包括但不限于是随机存储记忆体(random access memory，RAM)、只读存储器(read-only memory，ROM)、可擦除可编程只读存储器(erasable programmable read only memory，EPROM)、或便携式只读存储器(compact disc read-only memory，CD-ROM)，该存储器2902用于相关计算机程序及数据。通信接口2903用于接收和发送数据。

处理器2901可以是一个或多个中央处理器(central processing unit，CPU)，在处理器2901是一个CPU的情况下，该CPU可以是单核CPU，也可以是多核CPU。

该装置2900中的处理器2901用于读取所述存储器2902中存储的计算机程序代码，执行上述图4所执行的方法。

该目标检测装置可为具有目标检测功能的车辆，或者为具有目标检测功能的其他部件。该目标检测装置包括但不限于：车载终端、车载控制器、车载模块、车载模组、车载部件、车载芯片、车载单元、车载雷达或车载摄像头等其他传感器，车辆可通过该车载终端、车载控制器、车载模块、车载模组、车载部件、车载芯片、车载单元、车载雷达或摄像头，实施本申请提供的方法。

该目标检测装置还可以为除了车辆之外的其他具有目标检测功能的智能终端，或设置在除了车辆之外的其他具有目标检测功能的智能终端中，或设置于该智能终端的部件中。该智能终端可以为智能运输设备、智能家居设备、机器人等其他终端设备。该目标检测装置包括但不限于智能终端或智能终端内的控制器、芯片、雷达或摄像头等其他传感器、以及其他部件等。

该目标检测装置可以是一个通用设备或者是一个专用设备。在具体实现中，该装置还可以台式机、便携式电脑、网络服务器、掌上电脑(personal digital assistant，PDA)、移动手机、平板电脑、无线终端设备、嵌入式设备或其他具有处理功能的设备。本申请实施例不限定该目标检测装置的类型。

该目标检测装置还可以是具有处理功能的芯片或处理器，该目标检测装置可以包括多个处理器。处理器可以是一个单核(single-CPU)处理器，也可以是一个多核(multi-CPU)处理器。该具有处理功能的芯片或处理器可以设置在传感器中，也可以不设置在传感器中，而设置在传感器输出信号的接收端。

本申请实施例还提供一种芯片系统，所述芯片系统包括至少一个处理器和通信接口，所述至少一个处理器用于从所述通信接口调用计算机程序，当所述处理器执行所述指令时，图4所示的方法流程得以实现。

本申请实施例还提供一种计算机可读存储介质，所述计算机可读存储介质中存储有计算机程序，当其在计算机上运行时，图4所示的方法流程得以实现。

本申请实施例还提供一种计算机程序产品，当所述计算机程序产品在计算机上运行时，图4所示的方法流程得以实现。

本申请实施例还提供一种车辆，所述车辆包括至少一个目标检测装置。本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，该流程可以由计算机程序来计算机程序相关的硬件完成，该计算机程序可存储于计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法实施例的流程。而前述的存储介质包括：ROM或随机存储记忆体RAM、磁碟或者光盘等各种可存储计算机程序代码的介质。

Claims

一种目标检测方法，其特征在于，包括：

获取第一图像；

对所述第一图像进行处理得到Q个感兴趣区域，确定所述每一个感兴趣区域中的参考点对应的图像坐标系的坐标；

根据所述每一个感兴趣区域中的参考点对应的图像坐标系的坐标，确定所述每一个感兴趣区域中的参考点对应的车体坐标系的坐标；

确定第一目标物体的三维模型；

根据所述每一个感兴趣区域中的参考点对应的车体坐标系的坐标、所述第一目标物体的三维模型的顶点集合，确定所述第一目标物体的三维模型在所述车体坐标系对应的至少一个坐标；

将所述第一目标物体的三维模型在所述车体坐标系对应的至少一个坐标在所述图像坐标系进行投影得到Q个像素区域；

根据所述Q个感兴趣区域和所述Q个像素区域，确定所述目标的检测结果；其中，所述Q为正整数。
根据权利要求1所述的方法，其特征在于，所述根据所述Q个感兴趣区域和所述Q个像素区域，确定所述目标的检测结果，包括：

对所述Q个像素区域对应的Q个感兴趣区域进行筛选处理得到R个感兴趣区域，所述每一个像素区域对应一个感兴趣区域，R为正整数，且R小于等于Q；

确定所述R个感兴趣区域对应的R个外接矩形；

根据所述R个外接矩形，确定所述目标的检测结果。
根据权利要求2所述的方法，其特征在于，所述对所述Q个像素区域对应的Q个感兴趣区域进行筛选处理得到R个感兴趣区域,包括如下至少一种方式：

当所述Q个感兴趣区域中的第一感兴趣区域的面积占所述第一感兴趣区域的凸包络面积的比例大于第一预设值，将所述第一感兴趣区域作为所述R个感兴趣区域中的一个；

当所述Q个感兴趣区域中的第一感兴趣区域的凸包络宽高比与所述第一感兴趣区域对应的像素区域的宽高比的比值满足大于第二预设值且小于第三预设值的条件，将所述第一感兴趣区域作为所述R个感兴趣区域中的一个；

当所述Q个感兴趣区域中的第一感兴趣区域的凸包络面积与所述第一感兴趣区域对应的像素区域的面积的比值满足大于所述第二预设值且小于所述第三预设值的条件，将所述第一感兴趣区域作为所述R个感兴趣区域中的一个；

当所述Q个感兴趣区域中的第一感兴趣区域的凸包络轮廓与所述第一感兴趣区域对应的像素区域的轮廓的交并比IOU大于第四预设值，将所述第一感兴趣区域作为所述R个感兴趣区域中的一个。
根据权利要求2所述的方法，其特征在于，所述对所述Q个像素区域对应的Q个感兴趣区域进行筛选处理得到R个感兴趣区域,包括如下方式：

使用预先训练好的分类器对所述Q个感兴趣区域中的第一感兴趣区域的外接矩形中的内容进行评价打分，获得第一分值；

当所述第一分值高于第五预设值时，将所述第一感兴趣区域作为所述R个感兴趣区域中的一个。
根据权利要求2-4任一项所述的方法，其特征在于，所述根据所述R个外接矩形，确定所述目标的检测结果，包括：

计算所述R个外接矩形的面积；

根据所述R个外接矩形的面积确定所述目标的检测结果。
根据权利要求2-4任一项所述的方法，其特征在于，所述根据所述R个外接矩形，确定所述目标的检测结果，包括：

使用预先训练好的分类器对所述R个外接矩形中的内容进行评价打分，获得R个分值；

根据所述R个分值确定所述目标的检测结果。
根据权利要求1-6任一项所述的方法，其特征在于，所述第一目标物体的三维模型的顶点集合，包括：

一个第一上顶点(0,0，H1)、以及所述第一上顶点对应的第一底面圆上的n个等分点

其中，H1表示第一高度，R1表示所述第一上顶点对应的第一底面圆的半径，以所述第一底面圆的圆心为原点(0,0,0)，坐标轴为X轴向前、Y轴向左、Z轴向上定义的三维模型坐标系，k＝0,1,2,…,n-1，所述n为正整数。
根据权利要求1-6任一项所述的方法，其特征在于，所述第一目标物体的三维模型的顶点集合，包括：

一个第二上顶点(0,0，L*cos(π/3))、左顶点
和右顶点

其中，L表示边长，以底边的中心为原点(0,0,0)，坐标轴为X轴向前、Y轴向左、Z轴向上定义的三维模型坐标系。
根据权利要求1-7任一项所述的方法，其特征在于，所述第一目标物体的三维模型的顶点集合，包括：

第二底面圆上的m个等分点
以及所述第二底面圆对应的顶面圆上的m个等分点

其中，H2表示第二高度，R2表示所述第二底面圆的半径，k＝0,1,2,…,m-1，m为正整数。
一种目标检测装置，其特征在于，包括：

获取模块，用于获取第一图像；

处理模块，用于对所述第一图像进行处理得到Q个感兴趣区域，确定每一个感兴趣区域中的参考点对应的图像坐标系的坐标；

所述处理模块，用于根据所述每一个感兴趣区域中的参考点对应的图像坐标系的坐标，确定所述每一个感兴趣区域中的参考点对应的车体坐标系的坐标；

所述处理模块，用于确定第一目标物体的三维模型；

所述处理模块，用于根据所述每一个感兴趣区域中的参考点对应的车体坐标系的坐标、所述第一目标物体的三维模型的顶点集合，确定所述第一目标物体的三维模型在所述车体坐标系对应的至少一个坐标；

所述处理模块，用于将所述第一目标物体的三维模型在所述车体坐标系对应的至少一个坐标在所述图像坐标系进行投影得到Q个像素区域；

所述处理模块，用于根据所述至少一个感兴趣区域和所述Q个像素区域，确定所述目标的检测结果，其中，Q为正整数。
根据权利要求10所述的装置，其特征在于，

所述处理模块，还用于对所述Q个像素区域对应的Q个感兴趣区域进行筛选处理得到R个感兴趣区域，所述每一个像素区域对应一个感兴趣区域，R为正整数且R小于等于Q；确定所述R个感兴趣区域对应的R个外接矩形；根据所述R个外接矩形，确定所述目标的检测结果。
根据权利要求11所述的装置，其特征在于，

所述处理模块，还用于在所述Q个感兴趣区域中的第一感兴趣区域的面积占所述第一感兴趣区域的凸包络面积的比例大于第一预设值的情况下，将所述第一感兴趣区域作为所述R个感兴趣区域中的一个；在所述Q个感兴趣区域中的第一感兴趣区域的凸包络宽高比与所述第一感兴趣区域对应的像素区域的宽高比的比值满足大于第二预设值且小于第三预设值的条件的情况下，将所述第一感兴趣区域作为所述R个感兴趣区域中的一个；在所述Q个感兴趣区域中的第一感兴趣区域的凸包络面积与所述第一感兴趣区域对应的像素区域的面积的比值满足大于所述第二预设值且小于所述第三预设值的条件的情况下，将所述第一感兴趣区域作为所述R个感兴趣区域中的一个；在所述Q个感兴趣区域中的第一感兴趣区域的凸包络轮廓与所述第一感兴趣区域对应的像素区域的轮廓的交并比IOU大于第四预设值的情况下，将所述第一感兴趣区域作为所述R个感兴趣区域中的一个。
根据权利要求11所述的装置，其特征在于，

所述处理模块，还用于使用预先训练好的分类器对所述Q个感兴趣区域中的第一感兴趣区域的外接矩形中的内容进行评价打分，获得第一分值；在所述第一分值高于第五预设值的情况下，将所述第一感兴趣区域作为所述R个感兴趣区域中的一个。
根据权利要求11-13任一项所述的装置，其特征在于，

所述处理模块，还用于计算所述R个外接矩形的面积；根据所述R个外接矩形的面积确定所述目标的检测结果。
根据权利要求11-13任一项所述的装置，其特征在于，

所述处理模块，还用于使用预先训练好的分类器对所述R个外接矩形中的内容进行评价打分，获得R个分值；根据所述R个分值确定所述目标的检测结果。
根据权利要求10-15任一项所述的装置，其特征在于，所述第一目标物体的三维模型的顶点集合，包括：

一个第一上顶点(0,0，H1)、以及所述第一上顶点对应的第一底面圆上的n个等分点

其中，H1表示第一高度，R1表示所述第一上顶点对应的第一底面圆的半径，以所述第一底面圆的圆心为原点(0,0,0)，坐标轴为X轴向前、Y轴向左、Z轴向上定义的三维模型坐标系，k＝0,1,2,…,n-1，所述n为正整数。
根据权利要求10-15任一项所述的装置，其特征在于，所述第一目标物体的三维模型的顶点集合，包括：

一个第二上顶点(0,0，L*cos(π/3))、左顶点
和右顶点

其中，L表示边长，以底边的中心为原点(0,0,0)，坐标轴为X轴向前、Y轴向左、Z轴向上定义的三维模型坐标系。
根据权利要求10-15任一项所述的装置，其特征在于，所述第一目标物体的三维模型的顶点集合，包括：

第二底面圆上的m个等分点
以及所述第二底面圆对应的顶面圆上的m个等分点

其中，H2表示第二高度，R2表示所述第二底面圆的半径，k＝0,1,2,…,m-1，m为正整数。
一种目标检测装置，其特征在于，包括：处理器和存储器；所述存储器用于存储一个或多个程序，所述一个或多个程序包括计算机执行指令，当所述装置运行时，所述处理器执行所述存储器存储的所述一个或多个程序以使所述装置执行如权利要求1-9任一项所述的方法。
一种芯片系统，其特征在于，所述芯片系统包括至少一个处理器和获取接口，所述至少一个处理器用于从所述获取接口调用计算机程序，当所述处理器执行所述指令时，以使得所述芯片系统所在装置实现如权利要求1-9中任一项所述的方法。
一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有计算机程序，当所述计算机程序在计算机上运行时，使得所述计算机执行如权利要求1-9中任一项所述的方法。
一种车辆，其特征在于，所述车辆包括如权利要求10至19中任一项所述的目标检测装置。