CN112233097B

CN112233097B - 基于空时域多维融合的道路场景他车检测系统和方法

Info

Publication number: CN112233097B
Application number: CN202011120818.9A
Authority: CN
Inventors: 高洪波; 黄逸飞; 李智军; 朱菊萍; 何希
Original assignee: University of Science and Technology of China USTC
Current assignee: University of Science and Technology of China USTC
Priority date: 2020-10-19
Filing date: 2020-10-19
Publication date: 2022-10-28
Anticipated expiration: 2040-10-19
Also published as: CN112233097A

Abstract

本发明提供了一种基于空时域多维融合技术的道路场景他车检测系统和方法，利用相机、雷达的标定参数得到投影矩阵，根据距离远近以不同的色调，通过投影矩阵将雷达点云数据与相机图像数据融合，形成多维融合图像数据；采用两个YOLOv3模型分别对相机图像数据和多维融合图像数据进行检测，标定目标车辆的检测框，形成第一标注图片和第二标注图片后进行训练，得到第一目标检测模型和第二目标检测模型；对目标车辆的检测框进行跟踪和数据关联，筛选后输出检测结果。结合图像序列帧的时域信息通过数据关联实现目标追踪进行他车检测，更接近实际的道路场景，减少了因道路场景车辆的运动性而产生的对他车检测精度的影响，提高检测精确度，鲁棒性。

Description

基于空时域多维融合的道路场景他车检测系统和方法

技术领域

本发明涉及模式识别与人工智能技术领域，具体地，涉及一种基于空时域多维融合的道路场景他车检测系统和方法，尤其是一种结合了相机图像信息、雷达点云信息和目标跟踪信息的基于空时域多维融合技术的道路场景他车检测方法。

背景技术

在计算机技术不断发展的现在，深度学习技术在目标检测领域取得了巨大的进展，与此同时，汽车的保有量在不断提升，人们对代步工具的便利性与安全性有了日益增长的新要求。在目标检测中，车辆的目标检测是一大重要领域，能否快速安全地检测车辆，是无人驾驶技术的可行性与安全性的前提，具有较大的研究意义。

目前传统的目标检测算法多为对单帧RBG图像进行的目标检测。这样的检测方法有几个缺点，首先，在实际的道路场景中，自动驾驶车辆具有多种传感器，如激光雷达、彩色相机、GPS系统等，采取单一的图像目标检测方法不能充分地利用这些道路场景空域上的多维信息。第二，道路场景中图像的形式为一帧帧的连续视频序列，在这些序列中，图像的帧与帧之间存在大量的冗余信息以及关联信息，采取单一的图像目标检测方法不能充分地利用这些道路场景时域上的多维信息。第三，在运动的车辆上，相机采集到的图像往往具有遮挡，失焦，运动模糊，光照变化等问题，若采取单一的图像目标检测方法，不能充分地避免这些问题对目标检测算法精确度的影响，这给道路场景的目标检测带来了较大的难度。在现有的目标检测法越来越精确，快速的情况下，利用道路场景空域的多维信息以及时域信息的关联性，结合现有的目标检测方法，可以提高检测的性能。深度神经网络的研究为我们提供了检测的工具，其中YOLOv3网络对目标检测具有较高的准确性与实时性。相比单帧信息的目标检测方法，在道路场景中采取目标跟踪数据关联的方式结合多帧信息，可以进一步提高目标检测的准确率和鲁棒性。道路场景中车辆检测的准确度对后续无人驾驶技术的安全问题至关重要。

与本申请相关的专利文献CN110781927A，开了车路协同下基于深度学习的目标检测与分类方法，包括：获取目标的点云数据，并将所述目标的点云数据映射到矩阵中，对所述点云数据进行网格化；采用基于网格化与帧融合的密度聚类，判断空间中目标的邻域关系和密度；根据所述基于网格化与帧融合的密度聚类，通过权重共享卷积核提取所述点云数据的局部特征，对所述目标进行分类。基于深度学习对目标进行了准确的检测与分类，但是并不适用于多维道路场景检测。利用了交通系统中的监控设备，相比配备了监控设备的城市交通，在没有监控设备或缺少监控设备的乡村街道等道路场景，并不适用。

发明内容

针对现有技术中的缺陷，本发明的目的是提供一种基于空时域多维融合技术的道路场景他车检测系统和方法。

根据本发明提供的一种基于空时域多维融合技术的道路场景他车检测系统，包括：

数据预处理模块：利用相机、雷达的标定参数得到投影矩阵，根据距离远近以不同的色调，通过投影矩阵将雷达点云数据与相机图像数据融合，形成多维融合图像数据；

目标检测网络模块：采用两个YOLOv3模型分别对相机图像数据和多维融合图像数据进行检测，标定目标车辆的检测框，形成第一标注图片和第二标注图片，并对第一标注图片和第二标注图片进行训练，得到第一目标检测模型和第二目标检测模型；

数据关联追踪后处理模块：对目标车辆的检测框进行跟踪和数据关联，筛选后输出检测结果。

优选地，所述数据预处理模块包括：

KITTI数据集预处理模块：将KITTI目标跟踪数据集按视频序列分为训练集与测试集；训练集与测试集中忽略非车辆，保留车辆类别，用于他车检测，将标注信息格式转换为YOLOv3所用的格式；

图像数据融合处理模块：使用KITTI目标跟踪数据集给出的雷达点云与图像的配准关系，将雷达点云数据平移变换与相机图像数据对齐，以点阵形式投影在相机图像数据中，以冷暖色调表示远近的距离信息，得到多维融合图像数据。

优选地，所述目标检测网络模块包括：

标定检测框模块：使用darknet53网络结构对相机图像数据和多维融合图像数据进行特征提取，通过网格对背景前景划分，形成预测框；

训练检测模型模块：使用两个YOLOv3模型分别依据第一标注图片和第二标注图片进行训练和预测，得到第一目标检测模型和第二目标检测模型。

优选地，所述数据关联追踪后处理模块包括：

数据关联筛选模块：令第一目标检测模型和第二目标检测模型输出的检测框序列，进行两两数据关联，筛选出高置信度的检测框；

数据关联追踪模块：分别对两个目标检测网络在时间轴上相邻帧之间的检测框进行关联匹配，得到被追踪目标。

优选地，对使用数据关联区分后的检测框有选择的进行输出，检测框一共有四类，第一类为在两个目标检测网络所得到的检测框关联成功的交集；第二类为在相机图像目标检测网络中经过相邻帧的关联算法关联后被判定为被追踪目标的目标检测框；第三类为在雷达点云投影图像目标检测网络中经过相邻帧关联算法关联后被判定为追踪目标且上一帧与另一目标检测网络成功关联的目标检测框；第四类为在第一、第二、第三类之外的所有目标检测框。

根据本发明提供的一种基于空时域多维融合技术的道路场景他车检测方法，包括：

数据预处理步骤：利用相机、雷达的标定参数得到投影矩阵，根据距离远近以不同的色调，通过投影矩阵将雷达点云数据与相机图像数据融合，形成多维融合图像数据；

目标检测网络步骤：采用两个YOLOv3模型分别对相机图像数据和多维融合图像数据进行检测，标定目标车辆的检测框，形成第一标注图片和第二标注图片，并对第一标注图片和第二标注图片进行训练，得到第一目标检测模型和第二目标检测模型；

数据关联追踪后处理步骤：对目标车辆的检测框进行跟踪和数据关联，筛选后输出检测结果。

优选地，所述数据预处理步骤包括：

KITTI数据集预处理步骤：将KITTI目标跟踪数据集按视频序列分为训练集与测试集；训练集与测试集中忽略非车辆，保留车辆类别，用于他车检测，将标注信息格式转换为YOLOv3所用的格式；

图像数据融合处理步骤：使用KITTI目标跟踪数据集给出的雷达点云与图像的配准关系，将雷达点云数据平移变换与相机图像数据对齐，以点阵形式投影在相机图像数据中，以冷暖色调表示远近的距离信息，得到多维融合图像数据。

优选地，所述目标检测网络步骤包括：

标定检测框步骤：使用darknet53网络结构对相机图像数据和多维融合图像数据进行特征提取，通过网格对背景前景划分，形成预测框；

训练检测模型步骤：使用两个YOLOv3模型分别依据第一标注图片和第二标注图片进行训练和预测，得到第一目标检测模型和第二目标检测模型。

优选地，所述数据关联追踪后处理步骤包括：

数据关联筛选步骤：令第一目标检测模型和第二目标检测模型输出的检测框序列，进行两两数据关联，筛选出高置信度的检测框；

数据关联追踪步骤：分别对两个目标检测网络在时间轴上相邻帧之间的检测框进行关联匹配，得到被追踪目标。

与现有技术相比，本发明具有如下的有益效果：

1、本发明相对使用单帧空域信息的目标检测算法，结合图像序列帧的时域信息通过数据关联实现目标追踪进行他车检测，更接近实际的道路场景，减少了因道路场景车辆的运动性而产生的遮挡，运动模糊，失焦等问题对他车检测精度的影响，从而提高检测精确度，鲁棒性。

2、本发明相对使用相机图像的目标检测算法，结合雷达点云的深度信息进行他车检测，通过多传感器检测结果融合的方式，减少了因相机图像成像性质出现的光照变化，失焦，运动模糊等问题对他车检测精度的影响，从而提高检测精确度，鲁棒性。

3、本发明相对使用雷达点云信息的目标检测算法，结合相机图像信息进行他车检测，通过多传感器检测结果融合的方式，减少了激光雷达因稀疏性而产生的小物体，远处物体难以检测问题。

附图说明

通过阅读参照以下附图对非限制性实施例所作的详细描述，本发明的其它特征、目的和优点将会变得更明显：

图1为本发明的总体结构示意图。

具体实施方式

下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明，但不以任何形式限制本发明。应当指出的是，对本领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干变化和改进。这些都属于本发明的保护范围。

本发明结合了车载摄像头以及车载激光雷达信息，并使用具有实时性的YOLOv3网络，在不同场景中对目标进行了实时性的检测与分类，并具有较高的准确性。

实施例1

如图1所示，一种基于空时域多维融合技术的道路场景他车检测系统，分为数据预处理模块、目标检测网络模块和数据关联追踪后处理模块三部分。数据预处理模块用于为目标检测网络模块提供多维融合的图像数据，相机采集到的图像为目标检测网络提供他车检测的主要数据，激光雷达采集到的点云信息投影在图像平面上，为目标检测网络提供他车检测的辅助数据，用于改善在目标检测中出现的错检，误检等情况。目标检测网络模块用于为后续后处理提供可靠的检测框。数据关联追踪后处理模块用于整个系统的输出，对目标检测网络输出的检测框进行数据关联与筛选，从而择优输出最佳的检测结果，解决目标检测网络中常出现的遮挡，模糊等问题，从而提高在道路场景中的他车检测精确度，鲁棒性。

本发明主要针对道路场景的他车检测问题，其网络特性能够使检测速度与传感器采样频率更加接近，并改善了因为遮挡，运动模糊等在道路场景中常常出现的问题而导致的检测错误，能够为后续的使用提供有效可靠的他车检测结果。

本发明的数据预处理模块、目标检测网络模块和数据关联追踪后处理模块三部分的具体结构和连接关系如下。

所述的数据预处理模块利用相机、雷达的标定参数得到投影矩阵，将雷达点云数据与相机图像数据融合，根据距离远近以不同的色调投影到图像上。

所述的目标检测网络模块，两个YOLOv3模型分别对相机图像与雷达点云投影图像独立检测出目标车辆的检测框，使两个目标检测网络满足道路场景中他车检测所需的多维融合需求。

所述的目标检测网络模块中，两个YOLOv3模型分别依据KITTI数据集的标注图片与雷达点云投影图像的标注图片进行训练和预测，从而获取目标检测模型。通过形成两个目标检测模型后，对于不同检测器与视频帧序列之间的检测结果，即检测框，根据一定特征进行两两配对，即关联，从而起到目标追踪以及检测结果融合的效果。从而得出四类不同层次的检测框，即不同检测器检测结果的交集目标检测框，第一个检测器检测结果中被跟踪的目标检测框，第二个检测器检测结果中被跟踪的目标检测框，未出现在交集且未被跟踪的目标检测框。输出结果即检测器之间检测结果的交集，选择二者中置信度较高的一项输出；检测器中被跟踪的对象，检测器中不被跟踪但置信度较高的检测结果。从而得到最终输出检测框。其中置信度由网络特征提取后生成的特征向量得到。

所述的数据关联追踪后处理系统，使用数据关联算法对两个目标检测网络所得到的检测框进行关联匹配。关联成功的目标检测框准确度最高，从而区分了不同检测框的准确度优先级，使道路场景的他车检测更加可靠。

所述的数据关联追踪后处理系统，使用数据关联算法分别对两个目标检测网络在时间轴上相邻帧之间的检测框进行关联匹配。关联成功的目标检测框即视为被追踪目标，被追踪目标的准确度相对较高，从而区分了不同检测框的准确度优先级。使道路场景的他车检测更加可靠。

所述的数据关联追踪后处理系统，对使用数据关联算法区分后的检测框有选择的进行输出，这些检测框一共有四类，第一类为在两个目标检测网络所得到的检测框关联成功的交集；第二类为在相机图像目标检测网络中经过相邻帧的关联算法关联后被判定为被追踪目标的目标检测框；第三类为在雷达点云投影图像目标检测网络中经过相邻帧关联算法关联后被判定为追踪目标且上一帧与另一目标检测网络成功关联的目标检测框；第四类为在第一、第二、第三类之外的所有目标检测框。后处理系统输出结果为第一、第二、第三类。通过对检测框分类后输出，筛选出可信度高的检测结果，从而提高了道路场景中他车检测的准确度，鲁棒性。

所述的数据关联追踪后处理系统，使用的数据关联算法为匈牙利算法，匈牙利算法是解决指派问题的高效经典算法，而检测框的两两匹配恰好可以当作是指派问题进行处理。从而起到了数据关联的作用。

下面结合附图对本发明作进一步详述。

一种基于空、时域多维融合技术的道路场景他车检测系统，分为数据预处理模块、目标检测网络模块和数据关联追踪后处理模块三部分。

数据预处理模块包括KITTI数据集预处理与雷达点云数据与RGB图像数据的融合。

所述的KITTI数据集预处理是将KITTI目标跟踪数据集按视频序列分为训练集与测试集；将非车辆类忽略，保留‘Car’轿车，‘Van’巴士，‘Truck’货车三种类别，用于他车检测；将标注信息格式转换为yolov3所用的格式。

所述的雷达点云数据与RGB图像数据融合是使用KITTI数据集给出的雷达点云与图像的配准关系，即相机，雷达的内外标定参数，有转换关系：x＝P₀*T_r*X，其中P₀为投影矩阵，T_r为变换矩阵，X为点云坐标，x为点云投影坐标，使得雷达点云平移变换与RGB图像对齐。对齐后，以点阵的形式投影在图像中，以冷暖色调来表示远近的距离信息。这使得雷达点云的空间分布信息得以与RGB图像融合，在原始RGB图像中潜在地包含了深度信息，提高了传统二维目标检测数据的维度。

所述的目标检测网络系统所使用的神经网络模型为YOLOv3网络模型，该网络模型使用darknet53对输入的图像进行特征提取。将输入图像分为N×N个cell网格，每一个cell网格通过生成预测框的方式对目标进行预测以及背景前景的划分，每个预测框预测五个参数(t_x t_y t_w t_h t_o),这些参数将生成检测框的实际位置与大小(b_x b_y b_w b_h)满足以下关系：

b_x＝σ(t_x)+c_x

b_y＝σ(t_y)+c_y

其中σ(x)函数为sigmoid函数，将值约束在0到1之间，保证中心点在cell网格中，c_xc_y为cell网格左上角位置的偏移值，p_wp_h为ancher box的长宽值。ancher box为预设的固定参考框，通过上述转换可得到预测的检测框。

预测框的置信度公式为Pr(object)*IOU(b,object)＝σ(t_o)，其中Pr(object)表示当有标记框(ground truth)落于cell网格上时取值为1，否则取值为0。IOU(b,object)表示预测框与标记框(ground truth)的交并比，二者乘积即表示预测框是否含有目标以及目标的置信度大小，其中标记框为数据集制作中人工标记的在图片中目标的标记框，起到与检测框进行比对的作用。

所述的YOLOv3模型从3个不同尺度进行特征提取，以416*416的图像为例，三个不同尺度分别为52*52，26*26，13*13，分别为原图像的1/8,1/16以及1/32，提取后输出得到若干维的特征向量，维度数目为分类数目加五，前四个维度表示候选的检测框的信息，下一个维度表示有无物体的概率，最后的维度表示不同类别的分类概率。在对这些候选的检测框进行非极大值抑制后得到输出的检测框。在不同尺度下的featuremap上每个cell网格分别预测三个预测框，相对于YOLOv2提高了检测框总数以及多尺度检测从而提升了对小目标的检测能力，对于道路场景他车检测来说，更容易识别出远处在相机图像中表现得相对较小的车辆。

所述的YOLOv3模型的损失函数计算为坐标均方差(包括中心点坐标，预测框长宽值)、置信度均方差以及分类均方差之和。

所述的目标检测网络系统使用两个YOLOv3模型分别依据KITTI数据集的标注图片与雷达点云投影图像的标注图片进行训练和预测，从而得到两个不同的目标检测模型，模型中保存着网络模型的权重信息，网络对图像进行特征提取后可得到目标检测检测框。两个不同的目标检测模块分别对相机图像数据以及融合数据进行目标检测。

所述的数据关联追踪后处理系统输入为两个目标检测模型输出的检测框序列，使用数据关联的方法对不同检测器与视频序列之间的检测结果，即检测框序列。进行两两配对，在这里配对的依据为检测框中心点之间的距离以及检测框的交并比，即相交部分面积与并合部分面积的比值。依据这些数据，得到代价矩阵，使用匈牙利算法进行两两配对。通过两两之间的数据关联筛选出置信度较高的一部分检测框，同时通过相邻帧之间的数据关联得到被追踪目标，在上一步基础上得到完整的检测结果。

所述的数据关联追踪后处理系统使用匈牙利数据关联算法对检测框进行数据关联，即对于不同检测器与视频帧序列之间的检测结果，即检测框，根据一定特征进行两两配对，从而起到目标追踪以及检测结果融合的效果。算法结构如下：

第一步：对两类检测框(目标检测网络1与目标检测网络2或当前帧与上一帧)的所有检测框计算两两之间的匹配代价值从而得到代价矩阵d：

即检测框之间的欧氏距离，(x₁,y₁)和(x₂,y₂)分别为两个检测框的坐标，在使用该代价矩阵进行数据关联后，相对于只使用欧氏距离进行数据关联，考虑到他车往往不会发生形变，检测框大小变化不大，对已关联的检测框计算交并比，即相交部分面积与并合部分面积的比值。若交并比过小，则取消关联关系。

第二步：分别找出代价矩阵中每一行以及每一列中的最小元素，并按每行每列减去对应的元素，得到新的代价矩阵。

第三步：在变换后的代价矩阵中确定独立的0元素。若独立已有n个得到最优解；若独立0元素少于n个，转第四步。确定方法如下：找到0元素最少的行或列，圈出其中一个0元素，划掉该行或该列的其他0元素，重复此步骤使得矩阵中所有0元素都被圈出或者划掉。

第四步：作最少的直线数K将所有0元素覆盖，继续变换代价矩阵，得到新的代价矩阵，返回第三步。变换方式如下：从未被覆盖数字中找到最小值n，直线相交处元素加上n，被直线覆盖没有相交的元素不变，从而得到新的代价矩阵。

匹配成功后，根据设置的阈值得到关联成功后的检测框。

所述的数据关联追踪后处理系统在数据关联后得到了四类置信度不同的检测框，第一类为在两个目标检测网络所得到的检测框关联成功的交集；第二类为在相机图像目标检测网络中经过相邻帧的关联算法关联后被判定为被追踪目标的目标检测框；第三类为在雷达点云投影图像目标检测网络中经过相邻帧关联算法关联后被判定为追踪目标且上一帧与另一目标检测网络成功关联的目标检测框；第四类为在第一、第二、第三类之外的所有目标检测框。后处理系统输出结果为第一、第二、第三类。通过对检测框分类后输出，筛选出可信度高的检测结果，即检测器之间检测结果的交集，选择二者中置信度较高的一项输出；检测器中被跟踪的对象，检测器中不被跟踪但置信度较高的检测结果。从而提高了道路场景中他车检测的准确度，鲁棒性。

实施例2

实施例2可以视为是实施例1的优选例。实施例2说明的基于空时域多维融合技术的道路场景他车检测方法，利用了实施例1说明的基于空时域多维融合技术的道路场景他车检测系统。

一种基于空时域多维融合技术的道路场景他车检测方法，包括：

目标检测网络步骤：采用两个YOLOv3模型分别对相机图像数据和多维融合图像数据进行检测，标定目标车辆的检测框，形成第一标注图片和第二标注图片，并对第一标注图片和第二标注图片进行训练，得到第一目标检测模型和第二目标检测模型，使两个目标检测网络满足道路场景中他车检测所需的多维融合需求。两个YOLOv3模型分别依据KITTI数据集的标注图片与雷达点云投影图像的标注图片进行训练和预测，从而获取目标检测模型；

数据关联追踪后处理步骤：对目标车辆的检测框进行跟踪和数据关联，筛选后输出检测结果，使用数据关联算法对两个目标检测网络所得到的检测框进行关联匹配。关联成功的目标检测框准确度最高，从而区分了不同检测框的准确度优先级，使道路场景的他车检测更加可靠。尤其是，使用数据关联算法分别对两个目标检测网络在时间轴上相邻帧之间的检测框进行关联匹配。关联成功的目标检测框即视为被追踪目标，被追踪目标的准确度相对较高，从而区分了不同检测框的准确度优先级。使道路场景的他车检测更加可靠。

所述数据预处理步骤包括：

所述目标检测网络步骤包括：

所述数据关联追踪后处理步骤包括：

对使用数据关联区分后的检测框有选择的进行输出，检测框一共有四类，第一类为在两个目标检测网络所得到的检测框关联成功的交集；第二类为在相机图像目标检测网络中经过相邻帧的关联算法关联后被判定为被追踪目标的目标检测框；第三类为在雷达点云投影图像目标检测网络中经过相邻帧关联算法关联后被判定为追踪目标且上一帧与另一目标检测网络成功关联的目标检测框；第四类为在第一、第二、第三类之外的所有目标检测框。后处理系统输出结果为第一、第二、第三类。通过对检测框分类后输出，筛选出可信度高的检测结果，从而提高了道路场景中他车检测的准确度，鲁棒性。使用的数据关联算法为匈牙利算法，匈牙利算法是解决指派问题的高效经典算法，而检测框的两两匹配恰好可以当作是指派问题进行处理。从而起到了数据关联的作用。

数据预处理为目标检测网络提供多维融合的图像数据，相机采集到的图像为目标检测网络提供他车检测的主要数据，激光雷达采集到的点云信息投影在图像平面上，为目标检测网络提供他车检测的辅助数据，用于改善在目标检测中出现的错检，误检等情况。目标检测网络用于为后续后处理提供可靠的检测框。数据关联追踪后处理对目标检测网络输出的检测框进行数据关联与筛选，从而择优输出最佳的检测结果，解决目标检测网络中常出现的遮挡，模糊等问题。

本领域技术人员知道，除了以纯计算机可读程序代码方式实现本发明提供的系统、装置及其各个模块以外，完全可以通过将方法步骤进行逻辑编程来使得本发明提供的系统、装置及其各个模块以逻辑门、开关、专用集成电路、可编程逻辑控制器以及嵌入式微控制器等的形式来实现相同程序。所以，本发明提供的系统、装置及其各个模块可以被认为是一种硬件部件，而对其内包括的用于实现各种程序的模块也可以视为硬件部件内的结构；也可以将用于实现各种功能的模块视为既可以是实现方法的软件程序又可以是硬件部件内的结构。

以上对本发明的具体实施例进行了描述。需要理解的是，本发明并不局限于上述特定实施方式，本领域技术人员可以在权利要求的范围内做出各种变化或修改，这并不影响本发明的实质内容。在不冲突的情况下，本申请的实施例和实施例中的特征可以任意相互组合。

Claims

1.一种基于空时域多维融合技术的道路场景他车检测系统，其特征在于，包括：

目标检测网络模块：采用两个YOLOv3模型分别对相机图像数据和多维融合图像数据进行检测，标定目标车辆的检测框，形成第一标注图片和第二标注图片，并利用第一标注图片和第二标注图片对模型进行训练，得到第一目标检测模型和第二目标检测模型；

数据关联追踪后处理模块：数据关联后对目标车辆的检测框进行跟踪，筛选后输出检测结果；

所述数据关联追踪后处理模块包括：

2.根据权利要求1所述的基于空时域多维融合技术的道路场景他车检测系统，其特征在于，所述数据预处理模块包括：

3.根据权利要求1所述的基于空时域多维融合技术的道路场景他车检测系统，其特征在于，所述目标检测网络模块包括：

4.根据权利要求1所述的基于空时域多维融合技术的道路场景他车检测系统，其特征在于，对使用数据关联区分后的检测框有选择的进行输出，检测框一共有四类，第一类为在两个目标检测网络所得到的检测框关联成功的交集；第二类为在相机图像目标检测网络中经过相邻帧的关联算法关联后被判定为被追踪目标的目标检测框；第三类为在相机图像目标检测网络中经过相邻帧关联算法关联后被判定为追踪目标且上一帧与另一目标检测网络成功关联的目标检测框；第四类为在第一、第二、第三类之外的所有目标检测框。

5.一种基于空时域多维融合技术的道路场景他车检测方法，其特征在于，包括：

目标检测网络步骤：采用两个YOLOv3模型分别对相机图像数据和多维融合图像数据进行检测，标定目标车辆的检测框，形成第一标注图片和第二标注图片，并利用第一标注图片和第二标注图片对模型进行训练，得到第一目标检测模型和第二目标检测模型；

数据关联追踪后处理步骤：数据关联后对目标车辆的检测框进行跟踪，筛选后输出检测结果；

所述数据关联追踪后处理步骤包括：

6.根据权利要求5所述的基于空时域多维融合技术的道路场景他车检测方法，其特征在于，所述数据预处理步骤包括：

7.根据权利要求5所述的基于空时域多维融合技术的道路场景他车检测方法，其特征在于，所述目标检测网络步骤包括：

8.根据权利要求5所述的基于空时域多维融合技术的道路场景他车检测方法，其特征在于，对使用数据关联区分后的检测框有选择的进行输出，检测框一共有四类，第一类为在两个目标检测网络所得到的检测框关联成功的交集；第二类为在相机图像目标检测网络中经过相邻帧的关联算法关联后被判定为被追踪目标的目标检测框；第三类为在相机图像目标检测网络中经过相邻帧关联算法关联后被判定为追踪目标且上一帧与另一目标检测网络成功关联的目标检测框；第四类为在第一、第二、第三类之外的所有目标检测框。