CN112633182A - 一种车辆状态检测方法、装置、设备和存储介质 - Google Patents

一种车辆状态检测方法、装置、设备和存储介质 Download PDF

Info

Publication number
CN112633182A
CN112633182A CN202011564169.1A CN202011564169A CN112633182A CN 112633182 A CN112633182 A CN 112633182A CN 202011564169 A CN202011564169 A CN 202011564169A CN 112633182 A CN112633182 A CN 112633182A
Authority
CN
China
Prior art keywords
vehicle
detection
dimensional
state
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011564169.1A
Other languages
English (en)
Inventor
雷雨苍
陈国斌
任晓波
李子贺
韩旭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Weride Technology Co Ltd
Original Assignee
Guangzhou Weride Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Weride Technology Co Ltd filed Critical Guangzhou Weride Technology Co Ltd
Priority to CN202011564169.1A priority Critical patent/CN112633182A/zh
Publication of CN112633182A publication Critical patent/CN112633182A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/56Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
    • G06V20/58Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads
    • G06V20/584Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads of vehicle lights or traffic lights
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Traffic Control Systems (AREA)

Abstract

本申请公开了一种车辆状态检测方法、装置、设备和存储介质,方法包括:获取图像数据和声音数据;通过第一预置模型检测图像数据中的车辆类别和车辆灯光状态,得到第一检测结果;通过第二预置模型检测声音数据的类型,得到第二检测结果;根据第一检测结果和第二检测结果,确定车辆状态。本申请解决了现有技术只识别车辆类型,不能识别车辆状态,导致自动驾驶车辆做出不合理的避让行为的技术问题。

Description

一种车辆状态检测方法、装置、设备和存储介质
技术领域
本申请涉及车辆检测技术领域,尤其涉及一种车辆状态检测方法、装置、设备和存储介质。
背景技术
随着自动控制和人工智能技术的发展,自动驾驶车辆得到了广泛的关注。其中,自动驾驶车辆的避让能力非常重要。自动驾驶车辆需要识别出行驶道路上的车辆,根据车辆状态,规划路径或做出恰当的避让行为。特别是,在行驶道路上存在执行紧急任务的紧急车辆(警车、消防车、救护车)时,自动驾驶车辆需要将紧急车辆从其他普通车辆中区分出来,并识别出紧急车辆正在执行紧急任务,进而做出避让行为。
因此,提供一种车辆状态检测方法来判断车辆类型是本领域技术人员亟需解决的技术问题。
发明内容
本申请提供了一种车辆状态检测方法、装置、设备和存储介质,用于解决现有技术只识别车辆类型,不能识别车辆状态,导致自动驾驶车辆做出不合理的避让行为的技术问题。
有鉴于此,本申请第一方面提供了一种车辆状态检测方法,包括:
获取图像数据和声音数据;
通过第一预置模型检测所述图像数据中的车辆类别和车辆灯光状态,得到第一检测结果;
通过第二预置模型检测所述声音数据的类型,得到第二检测结果;
根据所述第一检测结果和所述第二检测结果,确定车辆状态。
可选的,所述通过第一预置模型检测所述图像数据中的车辆类别和车辆灯光状态,得到第一检测结果,之前还包括:
基于获取的三维点云数据进行车辆检测,得到若干三维车辆检测框;
基于目标车辆对所述三维车辆检测框进行选择,得到目标三维车辆检测框;
将所述目标三维车辆检测框投影到所述图像数据上,得到目标二维车辆框;
根据所述目标二维车辆框对所述图像数据进行裁剪,得到目标车辆图像。
可选的,所述基于获取的三维点云数据进行车辆检测,得到若干三维车辆检测框,包括:
对获取的三维点云数据和所述图像数据进行多模态融合,得到融合数据;
对所述融合数据进行车辆检测,得到若干三维车辆检测框。
可选的,所述将所述目标三维车辆检测框投影到所述图像数据上,得到目标二维车辆框,包括:
对所述目标三维车辆检测框的每条边上的三维点云进行采样,得到采样点云集;
将所述采样点云集投影到所述图像数据上,得到对应的目标二维点集;
基于所述目标二维点集生成目标二维车辆框。
可选的,所述基于所述目标二维点集生成目标二维车辆框,包括:
计算所述目标二维点集的最小外接矩形,得到目标二维车辆框。
可选的,所述根据所述第一检测结果和所述第二检测结果,确定车辆状态,之后还包括:
当所述车辆状态中某一车辆状态与对应的历史车辆状态不一致时,根据所述历史车辆状态调整所述某一车辆状态;
其中,所述历史车辆状态与所述某一车辆状态对应同一车辆,且该车辆的所述历史车辆状态为同一车辆状态。
可选的,当所述车辆类别为紧急车辆时,所述车辆灯光状态包括:车辆紧急灯开启状态和车辆紧急灯未开启状态。
可选的,所述第一预置模型的配置过程为:
获取紧急车辆数据集和车端采集的训练图像;
通过所述紧急车辆数据集对第一模型进行训练,得到预训练模型;
通过所述训练图像训练所述预训练模型,得到所述第一预置模型。
本申请第二方面提供了一种车辆状态检测装置,包括:
第一获取单元,用于获取图像数据和声音数据;
第一检测单元,用于通过第一预置模型检测所述图像数据中的车辆类别和车辆灯光状态,得到第一检测结果;
第二检测单元,用于通过第二预置模型检测所述声音数据的类型,得到第二检测结果;
确定单元,用于根据所述第一检测结果和所述第二检测结果,确定车辆状态。
本申请第三方面提供了一种车辆状态检测设备,所述设备包括处理器以及存储器;
所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
所述处理器用于根据所述程序代码中的指令执行第一方面任一种所述的车辆状态检测方法。
本申请第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质用于存储程序代码,所述程序代码用于执行第一方面任一种所述的车辆状态检测方法。
从以上技术方案可以看出,本申请具有以下优点:
本申请提供了一种车辆状态检测方法,包括:获取图像数据和声音数据;
通过第一预置模型检测图像数据中的车辆类别和车辆灯光状态,得到第一检测结果;通过第二预置模型检测声音数据的类型,得到第二检测结果;根据第一检测结果和第二检测结果,确定车辆状态。
本申请中,通过检测车辆类别来区分紧急车辆与普通车辆,通过检测车辆灯光状态以确定紧急车辆的紧急灯光状态和普通车辆灯光状态,得到第一检测结果;通过检测声音数据的类型,以区分紧急车辆的警笛声和普通车辆的笛声,得到第二检测结果;最终根据第一检测结果和第二检测结果确定车辆状态,进而可以确定紧急车辆状态或普通车辆状态,使得自动驾驶车辆可以根据紧急车辆状态或普通车辆状态做出合理的避让行为,解决了现有技术只识别车辆类型,不能识别车辆状态,导致自动驾驶车辆做出不合理的避让行为的技术问题。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
图1为本申请实施例提供的一种车辆状态检测方法的一个流程示意图;
图2为本申请实施例提供的一种车辆状态检测方法的另一个流程示意图;
图3为本申请实施例提供的一种获取目标车辆图像的一个流程示意图;
图4为本申请实施例提供的一种车辆状态检测装置的一个结构示意图;
图5为本申请实施例提供的一种车辆状态检测设备的一个结构示意图。
具体实施方式
本申请提供了一种车辆状态检测方法、装置、设备和存储介质,用于解决现有技术只识别车辆类型,不能识别车辆状态,导致自动驾驶车辆做出不合理的避让行为的技术问题。
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
为了便于理解,请参阅图1,本申请提供的一种车辆状态检测方法的一个实施例,包括:
步骤101、获取图像数据和声音数据。
在本申请实施例中,可以通过自动驾驶车辆挂载的摄像头采集其周围环境的图像数据,可以通过自动驾驶车辆上布置的麦克风来采集其周围环境的声音数据。
步骤102、通过第一预置模型检测图像数据中的车辆类别和车辆灯光状态,得到第一检测结果。
在本申请实施例中,将获取的图像数据输入到第一预置模型进行车辆类别检测和车辆灯光状态检测,车辆类别检测主要是检测车辆为紧急车辆或普通车辆,车辆灯光状态检测主要检测车辆灯光为开启状态或未开启状态。当车辆类别为紧急车辆时,车辆灯光状态检测主要是检测紧急灯状态,相应的,车辆灯光状态包括车辆紧急灯开启状态和车辆紧急灯未开启状态。通过检测得到的第一检测结果可以确定自动驾驶车辆周围环境中是否存在紧急车辆、紧急车辆灯光状态,以及该紧急车辆的当前位置、速度、朝向等信息。
其中,第一预置模型可以为训练好的机器学习模型,例如,卷积神经网络(CNN)、随机森林、支持向量机分类器等,第一预置模型具体为何种机器学习模型在此不做具体的限定。
步骤103、通过第二预置模型检测声音数据的类型,得到第二检测结果。
在本申请实施例中,将获取的声音数据输入到第二预置模型进行声音类型检测,得到第二检测结果。其中,声音类型可以包括普通车辆的笛声、紧急车辆的警笛声,以及说话声等。根据第二检测结果可以确定自动驾驶车辆周围环境中是否存在警笛声。
其中,第二预置模型可以为训练好的机器学习模型,例如,CNN、LSTN(长短时记忆网络)等,第二预置模型具体为何种机器学习模型在此不做具体的限定。
需要说明的是,步骤102和步骤103可以同时进行,也可以先后进行,在此不做具体限定。
步骤104、根据第一检测结果和第二检测结果,确定车辆状态。
本申请实施例可以根据第一检测结果确定自动驾驶车辆周围环境中是否存在紧急车辆以及紧急车辆的紧急灯状态;或者确定自动驾驶车辆周围环境中是否存在普通车辆,以及普通车辆灯光状态,例如是否有开启转向灯;通过第二检测结果可以确定该自动驾驶车辆周围环境中是否存在紧急车辆的警笛声。
当根据第一检测结果和第二检测结果确定该自动驾驶车辆周围环境存在紧急车辆,并且紧急车辆的紧急灯开启,并且周围环境中存在警笛声,可以判定该紧急车辆处于执行紧急任务状态,此时自动驾驶车辆需要进行避让,通过紧急车辆的紧急灯状态和警笛声确定紧急车辆的车辆状态,可以减少自动驾驶车辆出现不合理避让行为现象。
当根据第一检测结果和第二检测结果确定该自动驾驶车辆周围环境存在紧急车辆,并且该紧急车辆的紧急灯未开启,或该自动驾驶车辆周围环境中不存在警笛声,可以判定该紧急车辆处于未执行紧急任务状态,此时该自动驾驶车辆可以进一步根据该紧急车辆的位置、速度等信息确定是否需要避让。
当根据第一检测结果和第二检测结果确定存在普通车辆,以及普通车辆开启转向灯时,可以进一步根据该普通车辆的位置、速度等信息确定是否需要进行避让。
本申请实施例中,通过检测车辆类别来区分紧急车辆与普通车辆,通过检测车辆灯光状态以确定紧急车辆的紧急灯光状态和普通车辆灯光状态,得到第一检测结果;通过检测声音数据的类型,以区分紧急车辆的警笛声和普通车辆的笛声,得到第二检测结果;最终根据第一检测结果和第二检测结果确定车辆状态,进而可以确定紧急车辆状态或普通车辆状态,使得自动驾驶车辆可以根据紧急车辆状态或普通车辆状态做出合理的避让行为,解决了现有技术只识别车辆类型,不能识别车辆状态,导致自动驾驶车辆做出不合理的避让行为的技术问题。
以上为本申请提供的一种车辆状态检测方法的一个实施例,以下为本申请提供的一种车辆检测方法的另一个实施例。
请参考图2,本申请实施例提供的一种车辆状态检测方法,包括:
步骤201、获取图像数据和声音数据。
在本申请实施例中,可以通过自动驾驶车辆挂载的摄像头采集其周围环境的图像数据,可以通过自动驾驶车辆上布置的麦克风来采集其周围环境的声音数据。
步骤202、对图像数据中的目标车辆进行裁剪,得到目标车辆图像。
本申请实施例考虑到对图像数据中的每一辆车辆都进行处理,计算量较大;即便自动驾驶车辆周围环境确实存在紧急车辆,但如果该紧急车辆位置距离该自动驾驶车辆较远时,并不影响该自动驾驶车辆,此时就不需要对该紧急车辆进行避让,也就不需要去检测该紧急车辆。
基于上述情况,本申请实施例在当前环境中选择感兴趣车辆作为目标车辆,其中,感兴趣车辆的选择方法可以为:选择距离当前自动驾驶车辆最近的预置数量辆车辆作为感兴趣车辆,例如,选择距离当前自动驾驶车辆最近的32辆车辆作为感兴趣车辆;或者,选择当前自动驾驶车辆周围预置区域内的车辆作为感兴趣车辆,例如,选择当前自动驾驶车辆周围5米内的车辆作为感兴趣车辆等;又或者,选择当前自动驾驶车辆后方最近的预置数量辆车辆作为感兴趣车辆,或选择当前自动驾驶车辆后方预置区域内的车辆作为感兴趣车辆,还可以采用其他的选择方法,在此不再一一列举说明。
通过上述方法确定若干辆目标车辆后,对图像数据中的目标车辆进行裁剪,即,将图像数据中目标车辆所在的图像区域进行裁剪,得到目标车辆图像,通过对目标车辆图像进行后续的处理,减少了数据量,可以提高检测效率。其中,在对图像数据中的目标车辆进行裁剪时,需要先检测出目标车辆在图像数据中的具体位置,再根据其在图像数据中的位置进行裁剪。
在一种实施例中,可以通过机器学习模型对图像数据中的目标车辆位置进行检测,在检测得到目标车辆的位置后再进行裁剪。
在另一种实施例中,可以通过获取的三维点云数据确定目标车辆的三维位置,再将目标车辆的三维位置投影到图像数据上,得到目标车辆的二维位置,再进行裁剪,请参考图3,其具体过程为:
S2021、基于获取的三维点云数据进行车辆检测,得到若干三维车辆检测框。
在本申请实施例中,可以通过自动驾驶车辆上的激光传感器获取该车辆周围环境的三维点云数据,在采集三维点云数据的过程中,当激光传感器扫描到摄像头的可视范围时,通过同步器触发该摄像头采集同一时刻的图像数据,即图像数据和三维点云数据是同步获取的。而声音数据不需要和三维点云数据完全同步,可以有一定的时间差。
在一种实施例中,可以通过第三预置模型对获取的三维点云数据进行车辆检测,得到若干三维车辆检测框。其中,第三预置模型可以为训练好的卷积神经网络模型。由于紧急车辆在点云特征上与其他普通车辆并无显著区别,不会存在由于紧急车辆数据量稀少而导致模型检测效果不佳的问题,因此,通过第三预置模型对三维点云数据进行车辆检测的检测准确率较高。
在另一种实施例中,可以对获取的三维点云数据和图像数据进行多模态融合,得到融合数据;对融合数据进行车辆检测,得到若干三维车辆检测框。
基于前述内容可知,三维点云数据和图像数据是同一时刻采集的同一对象的数据,只是数据表征的形式不同,因此可以对获取的三维点云数据和图像数据进行多模态融合,然后可以通过卷积神经网络模型对融合数据进行车辆检测。其中,可以根据摄像机和激光传感器之间的位置关系,将图像数据转换为三维数据;然后将转换后得到的三维数据与三维点云数据进行融合;最终基于融合数据进行车辆检测,得到若干个三维车辆检测框。通过多模态融合方法可以提高对车辆三维位置的检测精度。
S2022、基于目标车辆对三维车辆检测框进行选择,得到目标三维车辆检测框。
根据前述内容可知,本申请实施例在当前环境中选择感兴趣车辆作为目标车辆。在确定目标车辆后,可以基于目标车辆对三维车辆检测框进行选择,得到目标三维车辆检测框。
具体的,可以在所有的三维车辆检测框中选择目标车辆对应的三维车辆检测框作为目标三维车辆检测框。例如,当目标车辆为距离当前自动驾驶车辆最近的预置数量辆车辆时,先计算各三维车辆检测框到当前自动驾驶车辆的距离,通过激光传感器采集的三维点云数据是包含了各三维点云到激光传感器的深度信息,即各三维点云到激光传感器的距离是已知的,而激光传感器与当前自动驾驶车辆的相对位置也是确定的,因此根据各三维点云到激光传感器的深度信息和激光传感器到当前自动驾驶车辆的相对位置,可以计算得到各三维车辆检测框到当前自动驾驶车辆的距离;然后基于各三维车辆检测框到当前自动驾驶车辆的距离,选择距离当前自动驾驶车辆最近的预置数量辆车辆对应的三维车辆检测框作为目标三维车辆检测框。其中,计算三维车辆检测框到当前自动驾驶车辆的距离,可以是选择三维车辆检测框中的若干个三维点云来计算到当前自动驾驶车辆的距离,以减少计算量,具体可以是计算这些三维点云到当前自动驾驶车辆的中心点的距离。根据选择的这些三维点云到激光传感器的深度信息以及激光传感器到当前自动驾驶车辆的相对位置,计算得到这些三维点云到当前自动驾驶车辆的距离,可以选择这些三维点云到当前自动驾驶车辆的距离的最短距离、最长距离或平均距离作为这些三维点云对应的三维车辆检测框到当前自动驾驶车辆的距离。
又例如,当目标车辆为当前自动驾驶车辆周围预置区域内的车辆时,首先通过上述方法计算各三维车辆检测框到当前自动驾驶车辆的距离,然后基于各三维车辆检测框到当前自动驾驶车辆的距离,选择当前自动驾驶车辆周围预置区域内的车辆对应的三维车辆检测框作为目标三维车辆检测框。
再例如,当目标车辆为距离当前自动驾驶车辆后方最近的预置数量辆车辆时,由于通过激光传感器采集的三维点云数据是包含了角度分辨率(包括垂直方向的角度分辨率和水平方向的角度分辨率),根据该角度分辨率可以筛选得到当前自动驾驶车辆后方区域的三维点云数据,进而确定自动驾驶车辆后方区域对应的三维车辆检测框;然后通过前述方法计算自动驾驶车辆后方区域中的各三维车辆检测框到当前自动驾驶车辆的距离;最后选择距离当前自动驾驶车辆后方最近的预置数量辆车辆对应的三维车辆检测框作为目标三维车辆检测框。当目标车辆为当前自动驾驶车辆后方预置区域内的车辆时,可以先结合上述方法确定自动驾驶车辆后方区域对应的三维车辆检测框;再计算这些三维车辆检测框到当前自动驾驶车辆的距离;最后基于这些三维车辆检测框到当前自动驾驶车辆的距离,选择当前自动驾驶车辆后方预置区域内的车辆对应的三维车辆检测框作为目标三维车辆检测框。
S2023、将目标三维车辆检测框投影到图像数据上,得到目标二维车辆框。
在本申请实施例中,可以直接将目标三维车辆检测框投影到图像数据上,得到对应的二维车辆框。由于将三维检测框投影到二维图像需要考虑一些特殊场景,例如,车辆的车头落入到图像数据中,但车辆的车尾没有落入图像数据中,这将导致三维车辆检测框在二维图像上残缺。针对这些特殊场景,需要进行复杂的数学推导和大量特殊情况的研究,增大了投影的复杂性。
为了解决上述问题,在本申请实施例中,对目标三维车辆检测框的每条边上的三维点云进行采样,得到采样点云集;将采样点云集投影到图像数据上,得到对应的目标二维点集;基于目标二维点集生成目标二维车辆框。
本申请实施例将三维检测框的投影问题简化为三维点云的投影问题,由于三维点云的投影不需要考虑每个点云之间的几何约束,大大减少了特殊情况的研究,简化了投影过程。
进一步,考虑到投影到图像数据上的目标二维点集可能不是落在一个二维矩形框中,使得基于目标二维点集生成的目标二维车辆框可能不是一个规整的车辆框,进而得到不规整的目标车辆图像,而不规整的目标车辆图像无法输入到第一预置模型进行处理。因此,本申请实施例计算目标二维点集的最小外接矩形,将该最小外接矩形作为目标二维车辆框。
S2024、根据目标二维车辆框对图像数据进行裁剪,得到目标车辆图像。
通过上述步骤得到目标二维车辆框后,对图像数据中目标二维车辆框所在的图像区域进行裁剪,得到对应的目标车辆图像。
步骤203、通过第一预置模型检测目标车辆图像中的车辆类别和车辆灯光状态,得到第一检测结果。
在本申请实施例中,将获取的图像数据输入到第一预置模型进行车辆类别检测和车辆灯光状态检测,车辆类别检测主要是检测车辆为紧急车辆或普通车辆,车辆灯光状态检测主要检测车辆灯光为开启状态或未开启状态。当车辆类别为紧急车辆时,车辆灯光状态检测主要是检测紧急灯状态,相应的,车辆灯光状态包括车辆紧急灯开启状态和车辆紧急灯未开启状态。通过检测得到的第一检测结果可以确定自动驾驶车辆周围环境中是否存在紧急车辆和紧急车辆灯光状态,以及该紧急车辆的当前位置、速度、朝向等信息。
其中,第一预置模型可以为训练好的机器学习模型,例如,卷积神经网络(CNN)、随机森林、支持向量机分类器等,第一预置模型具体为何种机器学习模型在此不再具体的限定。
进一步,本申请实施例中的第一预置模型的配置过程为:
获取紧急车辆数据集和车端采集的训练图像;通过紧急车辆数据集对第一模型进行训练,得到预训练模型;通过训练图像训练预训练模型,得到第一预置模型。
自动驾驶车辆上运行的基于图像数据的网络模型,其通常需要挂载在该车辆上的摄像头采集的数据来训练。与普通车辆相比,紧急车辆在日常中并非是常见的车辆,使得自动驾驶车辆收集紧急车辆图像数据困难,进而影响第一预置模型性能。为了解决该问题,本申请实施例采用迁移学习方法来训练第一模型,从公开的数据库中获取紧急车辆数据集,采用公开的紧急车辆数据集对第一模型进行预训练,得到预训练模型;进一步通过车端采集的训练图像对预训练模型进行微调,得到第一预置模型。
可以理解的是,紧急车辆数据集和车端采集的训练图像是有标签图像,紧急车辆数据集和车端采集的训练图像可以标注了车辆类别(紧急车辆、普通车辆)、车辆灯类别(紧急灯、普通车灯)以及车辆灯光状态(车辆灯开启状态、车辆灯未开启状态)等。
步骤204、通过第二预置模型检测声音数据的类型,得到第二检测结果。
在本申请实施例中,将获取的声音数据输入到第二预置模型进行声音类型检测,得到第二检测结果。其中,声音类型可以包括普通车辆的笛声、紧急车辆的警笛声,以及说话声等。根据第二检测结果可以确定自动驾驶车辆的周围环境中是否存在警笛声。
其中,第二预置模型可以为训练好的机器学习模型,例如,CNN、LSTN(长短时记忆网络)等,第二预置模型具体为何种机器学习模型在此不做具体的限定。第二预置模型可以通过声音训练集训练第二模型得到,第二模型的具体训练过程属于现有技术,在此不再进行赘述。
步骤205、根据第一检测结果和第二检测结果,确定车辆状态。
本申请实施例可以根据第一检测结果确定自动驾驶车辆周围环境中是否存在紧急车辆以及紧急车辆的紧急灯状态;或者确定自动驾驶车辆周围环境中是否存在普通车辆,以及普通车辆灯光状态,例如是否有开启转向灯;通过第二检测结果可以确定该自动驾驶车辆周围环境中是否存在紧急车辆的警笛声。当根据第一检测结果和第二检测结果确定该自动驾驶车辆周围环境存在紧急车辆,并且紧急车辆的紧急灯开启,并且周围环境中存在警笛声,可以判定该紧急车辆处于执行紧急任务状态,此时自动驾驶车辆需要进行避让,通过紧急车辆的紧急灯状态和警笛声确定紧急车辆的车辆状态,可以减少自动驾驶车辆出现不合理避让行为现象。
进一步,在得到当前时刻的第一检测结果和第二检测结果,并确定了当前时刻的车辆状态后,可以基于跟踪的时序决策方法来判断当前车辆状态是否有效、可靠,还可以进一步进行调整优化。
具体的,当车辆状态中某一车辆状态与对应的历史车辆状态不一致时,根据历史车辆状态调整某一车辆状态;其中,历史车辆状态与某一车辆状态对应同一车辆,且该车辆的历史车辆状态为同一车辆状态。例如,某一车辆在t时刻已连续第N(N>1)次被检测为紧急车辆且均处于执行紧急任务状态,但在t+1时刻由于图像数据上的遮挡等问题,使得第一预置模型输出不稳定,得到该车辆为紧急车辆但处于未执行紧急任务状态。根据历史车辆状态信息可知,t+1时刻的结果有大概率是错误的,此时,可以根据历史车辆状态信息对t+1时刻的车辆状态进行调整,可以采用该车辆在t时刻的车辆状态作为其在t+1时刻的车辆状态,即在t+1时刻,该车辆为紧急车辆且处于执行紧急任务状态。
可以理解的是,本领域技术人员可以基于机器学习方法来实现基于时序决策方法确定车辆状态,例如,通过将各车辆当前时刻以及当前时刻之前的车辆状态输入到RNN(递归神经网络)模型,使得RNN模型基于历史车辆状态信息预测下一时刻该车辆的车辆状态。也可以基于滤波方法来实现基于时序决策方法确定车辆状态,例如卡尔曼滤波等。
本申请实施例中,通过检测车辆类别来区分紧急车辆与普通车辆,通过检测车辆灯光状态以确定紧急车辆的紧急灯光状态和普通车辆灯光状态,得到第一检测结果;通过检测声音数据的类型,以区分紧急车辆的警笛声和普通车辆的笛声,得到第二检测结果;最终根据第一检测结果和第二检测结果确定车辆状态,进而可以确定紧急车辆状态或普通车辆状态,使得自动驾驶车辆可以根据紧急车辆状态或普通车辆状态做出合理的避让行为,解决了现有技术只识别车辆类型,不能识别车辆状态,导致自动驾驶车辆做出不合理的避让行为的技术问题。
进一步,本申请通过选择感兴趣车辆作为目标车辆,并基于目标车辆对图像数据进行裁剪,得到目标车辆图像,通过目标车辆图像进行车辆类别检测和车辆灯状态检测,不需要对图像数据中的每一辆车辆都进行处理,减少了数据量,提高了检测效率。
进一步,本申请实施例采用三维点云数据进行车辆检测,以确定目标车辆在图像数据上的位置,相比于基于图像数据进行车辆检测,其可以准确定位目标车辆的三维位置,可以提高目标车辆位置的检测精度。
进一步,本申请实施例将三维检测框的投影问题简化为三维点云的投影问题,由于三维点云的投影不需要考虑每个点云之间的几何约束,简化了投影过程。
进一步,本申请实施例考虑到通过车辆挂载的摄像头采集紧急车辆数据比较困难,进而影响检测模型性能,本申请实施例从公开的数据库中获取紧急车辆数据集,采用公开的紧急车辆数据集对第一模型进行预训练,再通过车端采集的训练图像进行微调,得到第一预置模型,缓解了紧急车辆数据收集困难的问题,并提高了第一预置模型的检测性能。
进一步,本申请实施例在得到第一检测结果和第二检测结果后,基于时序决策方法来确定最终的车辆状态,以保证最终车辆状态的准确性和可靠性,避免车辆状态检测出错。
以上为本申请提供的一种车辆状态检测方法的另一个实施例,以下为本申请实施例提供的一种车辆检测装置的一个实施例。
请参考图4,本申请实施例提供的一种车辆状态检测装置,包括:
第一获取单元301,用于获取图像数据和声音数据;
第一检测单元302,用于通过第一预置模型检测图像数据中的车辆类别和车辆灯光状态,得到第一检测结果;
第二检测单元303,用于通过第二预置模型检测声音数据的类型,得到第二检测结果;
确定单元304,用于根据第一检测结果和第二检测结果,确定车辆状态。
作为进一步地改进,还包括:
裁剪单元305,用于对图像数据中的目标车辆进行裁剪,得到目标车辆图像;
相应的,第一检测单元302具体用于:
通过第一预置模型检测目标车辆图像中的车辆类别和车辆灯光状态,得到第一检测结果。
作为进一步地改进,裁剪单元305具体包括:
检测子单元,用于基于获取的三维点云数据进行车辆检测,得到若干三维车辆检测框;
选择子单元,用于基于目标车辆对三维车辆检测框进行选择,得到目标三维车辆检测框;
投影子单元,用于将目标三维车辆检测框投影到图像数据上,得到目标二维车辆框;
裁剪子单元,用于根据目标二维车辆框对图像数据进行裁剪,得到目标车辆图像。
作为进一步地改进,检测子单元具体包括:第一检测子单元和第二检测子单元;
第一检测子单元用于:
通过第三预置模型对获取的三维点云数据进行车辆检测,得到若干三维车辆检测框;
第二检测子单元用于:
对获取的三维点云数据和图像数据进行多模态融合,得到融合数据;
对融合数据进行车辆检测,得到若干三维车辆检测框。
作为进一步地改进,投影子单元具体用于:
对目标三维车辆检测框的每条边上的三维点云进行采样,得到采样点云集;
将采样点云集投影到图像数据上,得到对应的目标二维点集;
基于目标二维点集生成目标二维车辆框。
作为进一步地改进,还包括:
调整单元306,用于当车辆状态中某一车辆状态与对应的历史车辆状态不一致时,根据历史车辆状态调整某一车辆状态;
其中,历史车辆状态与某一车辆状态对应同一车辆,且该车辆的历史车辆状态为同一车辆状态。
作为进一步地改进,还包括:配置单元307,用于配置第一预置模型;
配置单元307具体用于:
获取紧急车辆数据集和车端采集的训练图像;
通过紧急车辆数据集对第一模型进行训练,得到预训练模型;
通过训练图像训练预训练模型,得到第一预置模型。
本申请实施例中,通过检测车辆类别来区分紧急车辆与普通车辆,通过检测车辆灯光状态以确定紧急车辆的紧急灯光状态和普通车辆灯光状态,得到第一检测结果;通过检测声音数据的类型,以区分紧急车辆的警笛声和普通车辆的笛声,得到第二检测结果;最终根据第一检测结果和第二检测结果确定车辆状态,进而可以确定紧急车辆状态或普通车辆状态,使得自动驾驶车辆可以根据紧急车辆状态或普通车辆状态做出合理的避让行为,解决了现有技术只识别车辆类型,不能识别车辆状态,导致自动驾驶车辆做出不合理的避让行为的技术问题。
进一步,本申请通过选择感兴趣车辆作为目标车辆,并基于目标车辆对图像数据进行裁剪,得到目标车辆图像,通过目标车辆图像进行车辆类别检测和车辆灯状态检测,不需要对图像数据中的每一辆车辆都进行处理,减少了数据量,提高了检测效率。
进一步,本申请实施例采用三维点云数据进行车辆检测,以确定目标车辆在图像数据上的位置,相比于基于图像数据进行车辆检测,其可以准确定位目标车辆的三维位置,可以提高目标车辆位置的检测精度。
进一步,本申请实施例将三维检测框的投影问题简化为三维点云的投影问题,由于三维点云的投影不需要考虑每个点云之间的几何约束,简化了投影过程。
进一步,本申请实施例考虑到通过车辆挂载的摄像头采集紧急车辆数据比较困难,进而影响检测模型性能,本申请实施例从公开的数据库中获取紧急车辆数据集,采用公开的紧急车辆数据集对第一模型进行预训练,再通过车端采集的训练图像进行微调,得到第一预置模型,缓解了紧急车辆数据收集困难的问题,并提高了第一预置模型的检测性能。
进一步,本申请实施例在得到第一检测结果和第二检测结果后,基于时序决策方法来确定最终的车辆状态,以保证最终车辆状态的准确性和可靠性,避免车辆状态检测出错。
请参考图5,本申请实施例还提供了一种车辆状态检测设备,设备包括处理器以及存储器;
存储器用于存储程序代码,并将程序代码传输给处理器;
处理器用于根据程序代码中的指令执行前述方法实施例中的车辆状态检测方法。
本申请实施例还提供了一种计算机可读存储介质,计算机可读存储介质用于存储程序代码,程序代码用于执行前述方法实施例中的车辆状态检测方法。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以通过一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(英文全称:Read-OnlyMemory,英文缩写:ROM)、随机存取存储器(英文全称:RandomAccess Memory,英文缩写:RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims (11)

1.一种车辆状态检测方法,其特征在于,包括:
获取图像数据和声音数据;
通过第一预置模型检测所述图像数据中的车辆类别和车辆灯光状态,得到第一检测结果;
通过第二预置模型检测所述声音数据的类型,得到第二检测结果;
根据所述第一检测结果和所述第二检测结果,确定车辆状态。
2.根据权利要求1所述的车辆状态检测方法,其特征在于,所述通过第一预置模型检测所述图像数据中的车辆类别和车辆灯光状态,得到第一检测结果,之前还包括:
基于获取的三维点云数据进行车辆检测,得到若干三维车辆检测框;
基于目标车辆对所述三维车辆检测框进行选择,得到目标三维车辆检测框;
将所述目标三维车辆检测框投影到所述图像数据上,得到目标二维车辆框;
根据所述目标二维车辆框对所述图像数据进行裁剪,得到目标车辆图像。
3.根据权利要求2所述的车辆状态检测方法,其特征在于,所述基于获取的三维点云数据进行车辆检测,得到若干三维车辆检测框,包括:
对获取的三维点云数据和所述图像数据进行多模态融合,得到融合数据;
对所述融合数据进行车辆检测,得到若干三维车辆检测框。
4.根据权利要求2所述的车辆状态检测方法,其特征在于,所述将所述目标三维车辆检测框投影到所述图像数据上,得到目标二维车辆框,包括:
对所述目标三维车辆检测框的每条边上的三维点云进行采样,得到采样点云集;
将所述采样点云集投影到所述图像数据上,得到对应的目标二维点集;
基于所述目标二维点集生成目标二维车辆框。
5.根据权利要求4所述的车辆状态检测方法,其特征在于,所述基于所述目标二维点集生成目标二维车辆框,包括:
计算所述目标二维点集的最小外接矩形,得到目标二维车辆框。
6.根据权利要求1所述的车辆状态检测方法,其特征在于,所述根据所述第一检测结果和所述第二检测结果,确定车辆状态,之后还包括:
当所述车辆状态中某一车辆状态与对应的历史车辆状态不一致时,根据所述历史车辆状态调整所述某一车辆状态;
其中,所述历史车辆状态与所述某一车辆状态对应同一车辆,且该车辆的所述历史车辆状态为同一车辆状态。
7.根据权利要求1-6任一项所述的车辆状态检测方法,其特征在于,当所述车辆类别为紧急车辆时,所述车辆灯光状态包括:车辆紧急灯开启状态和车辆紧急灯未开启状态。
8.根据权利要求7所述的车辆状态检测方法,其特征在于,所述第一预置模型的配置过程为:
获取紧急车辆数据集和车端采集的训练图像;
通过所述紧急车辆数据集对第一模型进行训练,得到预训练模型;
通过所述训练图像训练所述预训练模型,得到所述第一预置模型。
9.一种车辆状态检测装置,其特征在于,包括:
第一获取单元,用于获取图像数据和声音数据;
第一检测单元,用于通过第一预置模型检测所述图像数据中的车辆类别和车辆灯光状态,得到第一检测结果;
第二检测单元,用于通过第二预置模型检测所述声音数据的类型,得到第二检测结果;
确定单元,用于根据所述第一检测结果和所述第二检测结果,确定车辆状态。
10.一种车辆状态检测设备,其特征在于,所述设备包括处理器以及存储器;
所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
所述处理器用于根据所述程序代码中的指令执行权利要求1-8任一项所述的车辆状态检测方法。
11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质用于存储程序代码,所述程序代码用于执行权利要求1-8任一项所述的车辆状态检测方法。
CN202011564169.1A 2020-12-25 2020-12-25 一种车辆状态检测方法、装置、设备和存储介质 Pending CN112633182A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011564169.1A CN112633182A (zh) 2020-12-25 2020-12-25 一种车辆状态检测方法、装置、设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011564169.1A CN112633182A (zh) 2020-12-25 2020-12-25 一种车辆状态检测方法、装置、设备和存储介质

Publications (1)

Publication Number Publication Date
CN112633182A true CN112633182A (zh) 2021-04-09

Family

ID=75324999

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011564169.1A Pending CN112633182A (zh) 2020-12-25 2020-12-25 一种车辆状态检测方法、装置、设备和存储介质

Country Status (1)

Country Link
CN (1) CN112633182A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113763717A (zh) * 2021-08-31 2021-12-07 广州文远知行科技有限公司 一种车辆的识别方法、装置、计算机设备和存储介质
CN113793518A (zh) * 2021-09-13 2021-12-14 浙江大华技术股份有限公司 车辆通行处理方法、装置、电子设备和存储介质
CN114453630A (zh) * 2022-01-20 2022-05-10 湖北文理学院 控制机床铣削不粘刀的方法、装置、电子设备和存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104620259A (zh) * 2012-09-10 2015-05-13 哈曼国际工业有限公司 使用音频/视觉线索的车辆安全系统
US20170249839A1 (en) * 2016-02-29 2017-08-31 Faraday&Future Inc. Emergency signal detection and response
JP2018013386A (ja) * 2016-07-20 2018-01-25 株式会社Jvcケンウッド 車両用表示制御装置、車両用表示システム、車両用表示制御方法およびプログラム
WO2018201349A1 (zh) * 2017-05-03 2018-11-08 华为技术有限公司 一种应急车辆的识别方法及装置
CN111611853A (zh) * 2020-04-15 2020-09-01 宁波吉利汽车研究开发有限公司 一种传感信息融合方法、装置及存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104620259A (zh) * 2012-09-10 2015-05-13 哈曼国际工业有限公司 使用音频/视觉线索的车辆安全系统
US20170249839A1 (en) * 2016-02-29 2017-08-31 Faraday&Future Inc. Emergency signal detection and response
JP2018013386A (ja) * 2016-07-20 2018-01-25 株式会社Jvcケンウッド 車両用表示制御装置、車両用表示システム、車両用表示制御方法およびプログラム
WO2018201349A1 (zh) * 2017-05-03 2018-11-08 华为技术有限公司 一种应急车辆的识别方法及装置
CN111611853A (zh) * 2020-04-15 2020-09-01 宁波吉利汽车研究开发有限公司 一种传感信息融合方法、装置及存储介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113763717A (zh) * 2021-08-31 2021-12-07 广州文远知行科技有限公司 一种车辆的识别方法、装置、计算机设备和存储介质
CN113793518A (zh) * 2021-09-13 2021-12-14 浙江大华技术股份有限公司 车辆通行处理方法、装置、电子设备和存储介质
CN114453630A (zh) * 2022-01-20 2022-05-10 湖北文理学院 控制机床铣削不粘刀的方法、装置、电子设备和存储介质

Similar Documents

Publication Publication Date Title
US11790664B2 (en) Estimating object properties using visual image data
US11977675B2 (en) Primary preview region and gaze based driver distraction detection
EP3759700B1 (en) Method for determining driving policy
CN112633182A (zh) 一种车辆状态检测方法、装置、设备和存储介质
CN108725440B (zh) 前向碰撞控制方法和装置、电子设备、程序和介质
US10373024B2 (en) Image processing device, object detection device, image processing method
JP6230673B2 (ja) 交通信号マップ作成及び検出
CN109446371A (zh) 一种智能汽车仿真测试场景库生成方法及测试系统和方法
CN108388834A (zh) 利用循环神经网络和级联特征映射的对象检测
KR102453627B1 (ko) 딥러닝 기반 교통 흐름 분석 방법 및 시스템
CN112528773B (zh) 障碍物信息融合方法、装置、电子设备和存储介质
CN111094095B (zh) 自动地感知行驶信号的方法、装置及运载工具
CN110588512A (zh) 一种危险驾驶识别与预警装置、方法及系统
WO2022161139A1 (zh) 行驶朝向检测方法、装置、计算机设备及存储介质
US20200047751A1 (en) Cooperative vehicle safety system and method
CN114972911A (zh) 自动驾驶感知算法模型的输出数据收集处理方法及设备
US20220092981A1 (en) Systems and methods for controlling vehicle traffic
CN111985388A (zh) 行人注意力检测驾驶辅助系统、装置和方法
CN113723282B (zh) 车辆行驶提示方法、装置、电子设备以及存储介质
CN113183982A (zh) 车辆的行驶路线的生成方法及装置、自动驾驶车辆
WO2023178510A1 (zh) 图像处理方法、装置和系统、可移动平台
CN117591847B (zh) 基于车况数据的模型指向评测方法和装置
CN117593892B (zh) 真值数据的获取方法和装置、存储介质及电子设备
US20180222386A1 (en) Enhanced lane negotiation
US20220067395A1 (en) Vehicles, Systems and Methods for Determining an Occupancy Map of a Vicinity of a Vehicle

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination