CN114802258A

CN114802258A - 车辆控制方法、装置、存储介质及车辆

Info

Publication number: CN114802258A
Application number: CN202210444360.5A
Authority: CN
Inventors: 叶航军; 蔡锐; 赵婕; 祝贺; 王斌; 周珏嘉; 殷天宇
Original assignee: Beijing Xiaomi Mobile Software Co Ltd
Current assignee: Beijing Xiaomi Mobile Software Co Ltd
Priority date: 2022-04-25
Filing date: 2022-04-25
Publication date: 2022-07-29

Abstract

本公开涉及一种车辆控制方法、装置、存储介质及车辆，属于车辆控制领域，所述方法包括：获取车辆行驶过程中的路况图像；将所述路况图像输入路况检测模型，得到路况检测结果，所述路况检测模型是预先经过基于类别标签权重的半监督训练得到的，所述路况检测结果包括所述路况图像中各个目标物体的位置信息以及类别信息，所述类别标签权重用于表征类别相似性；根据所述路况检测结果控制所述车辆。基于类别标签权重训练路况检测模型不仅能够减少模型过拟合的概率，还能够减小错误伪标签的影响，提高了训练得到的路况检测模型的鲁棒性，使得该路况检测模型输出的检测结果更加准确，提高了行车安全。

Description

车辆控制方法、装置、存储介质及车辆

技术领域

本公开涉及智能网联汽车技术领域，尤其涉及一种车辆控制方法、装置、存储介质及车辆。

背景技术

目标检测是自动驾驶领域的一项关键技术，直接影响人员和车辆的安全。目标检测也是计算机视觉中最具挑战性的问题之一。半监督目标检测在传统目标检测基础上实现了数据扩展，减少了数据标注的人工成本，降低了目标检测在各个领域的应用成本。

然而在相关技术中，目前大多数半监督目标检测都在训练期间使用硬标签进行训练，这不利于减小错误伪标签对训练的持续不良影响，容易对错误伪标签产生过拟合，使得在自动驾驶时可能会导致车辆行驶过程中目标检测不准确，导致出现事故，造成危险。

发明内容

为克服相关技术中存在的问题，本公开提供一种车辆控制方法、装置、存储介质及车辆。

根据本公开实施例的第一方面，提供一种车辆控制方法，包括：

获取车辆行驶过程中的路况图像；

将所述路况图像输入路况检测模型，得到路况检测结果，所述路况检测模型是预先经过基于类别标签权重的半监督训练得到的，所述路况检测结果包括所述路况图像中各个目标物体的位置信息以及类别信息，所述类别标签权重用于表征类别相似性；

根据所述路况检测结果控制所述车辆。

可选地，所述路况检测模型的数据集包括第一数据集和第二数据集，所述第一数据集包括标注有真实标签信息的路况图像样本，所述第二数据集包括未标注真实标签信息的路况图像样本，所述路况检测模型的训练包括：

将所述第一数据集输入路况检测模型进行预训练，并确定预训练完成后的所述路况检测模型输出的针对所述第一数据集的第一预测标签和所述真实标签信息之间的第一损失；

基于所述路况检测模型的中间层在所述预训练过程输出的类别特征信息，确定所述路况检测模型的类别标签权重；

根据所述类别标签权重以及所述第二数据集生成第三数据集和对应所述第三数据集的伪标签；

根据所述第三数据集以及所述伪标签对所述路况检测模型进行再次训练，得到训练完成的所述路况检测模型。

可选地，所述基于所述路况检测模型的中间层在所述预训练过程输出的类别特征信息，确定所述路况检测模型的类别标签权重包括：

根据所述类别特征信息计算各个类别标签之间的类间间距；

根据所述类间间距，确定各个类别之间的类别相似性信息；

根据所述类别相似性信息，确定所述类别标签权重。

可选地，所述根据所述类别标签权重以及所述第二数据集生成第三数据集和对应所述第三数据集的伪标签包括：

将所述第二数据集输入训练完成的所述路况检测模型，得到第一伪标签；

基于所述类别标签权重，确定第二伪标签；

对所述第二数据集以及所述第二伪标签进行数据增强操作，得到增强后的第三数据集以及第三伪标签，所述第三伪标签为对应所述第三数据集的伪标签。

可选地，所述将所述第二数据集输入训练完成的所述路况检测模型，得到第一伪标签包括：

将所述第二数据集输入训练完成的所述路况检测模型，得到对应第二数据集的第一预测值，所述第一预测值包括位置预测值以及类别预测值，所述类别预测值包括对应的目标物体属于各个类别的类别概率；

对所述位置预测值执行非极大值抑制操作，得到位置置信度高的第一目标物体；

根据各个所述第一目标物体对应的类别预测值中属于各个类别的类别概率，确定各个所述第一目标物体对应的类别置信度；

确定各个所述第一目标物体中类别置信度大于预设置信阈值的第二目标物体；

根据各个所述第二目标物体对应的位置预测值确定位置信息，并根据对应的类别预测值中属于各个类别的类别概率确定类别信息，得到所述第一伪标签。

可选地，所述根据所述第三数据集以及所述伪标签对所述路况检测模型进行再次训练，得到训练完成的所述路况检测模型包括：

将所述第三数据集输入所述第一路况检测模型，得到第二预测标签；

根据所述第二预测标签以及所述第三伪标签，计算第二损失；

基于所述第一损失以及所述第二损失，对所述路况检测模型的参数进行更新，得到训练完成的所述路况检测模型。

可选地，所述基于所述第一损失以及所述第二损失，对所述路况检测模型的参数进行更新包括：

分别对所述第一损失以及所述第二损失进行归一化操作，得到第一归一化损失以及第二归一化损失；

根据所述第一归一化损失以及所述第二归一化损失的和，对所述路况检测模型的参数进行更新。

可选地，所述对所述第二数据集以及所述第二伪标签进行数据增强操作，得到增强后的第三数据集以及第三伪标签包括：

对所述第二数据集中的图像进行色彩转换、几何变换、比例缩放、盒级变换以及灰框填充的数据增强操作中的至少一种；并，

在所述第二数据集中的图像的像素位置发生变化的情况下，对所述第二数据集中的图像对应的第二伪标签中的位置信息进行相应的变化。；

根据本公开实施例的第二方面，提供一种车辆控制装置，包括：

获取模块，用于获取车辆行驶过程中的路况图像；

检测模块，用于将所述路况图像输入路况检测模型，得到路况检测结果，所述路况检测模型是预先经过基于类别标签权重的半监督训练得到的，所述路况检测结果包括所述路况图像中各个目标物体的位置信息以及类别信息，所述类别标签权重用于表征类别相似性；

控制模块，用于根据所述路况检测结果控制所述车辆。

根据本公开实施例的第三方面，提供一种计算机可读存储介质，其上存储有计算机程序指令，该程序指令被处理器执行时实现本公开第一方面所提供的车辆控制方法的步骤。

根据本公开实施例的第四方面，提供一种车辆，所述车辆包括：

处理器；

用于存储处理器可执行指令的存储器；

其中，所述处理器被配置为：

获取车辆行驶过程中的路况图像；

根据所述路况检测结果控制所述车辆。

本公开的实施例提供的技术方案可以包括以下有益效果：通过预先经过基于类别标签权重的半监督训练的路况检测模型对车辆行驶过程中的图像进行检测，并根据检测结果控制车辆行驶，由于类别标签权重能够表征类别相似性，基于类别标签权重训练路况检测模型不仅能够减少模型过拟合的概率，还能够减小错误伪标签的影响，提高了训练得到的路况检测模型的鲁棒性，使得该路况检测模型输出的检测结果更加准确，提高了行车安全。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理。

图1是根据一示例性实施例示出的一种车辆控制方法的流程图。

图2是根据一示例性实施例示出的一种路况检测模型的训练方法的流程图。

图3是根据一示例性实施例示出的一种车辆控制装置的框图。

图4是根据一示例性实施例示出的一种车辆控制装置的框图。

图5是根据一示例性实施例示出的一种车辆控制装置的框图。

图6是根据一示例性实施例示出的一种车辆的功能框示意图。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

需要说明的是，本申请中所有获取信号、信息或数据的动作都是在遵照所在地国家相应的数据保护法规政策的前提下，并获得由相应装置所有者给予授权的情况下进行的。

为了使得本领域技术人员更加理解本公开提供的技术方案的改进之处，本公开先对相关技术进行进一步介绍。

目标检测是自动驾驶领域的一项关键技术，直接影响人员和车辆的安全。目标检测也是计算机视觉中最具挑战性的问题之一，其目的是判断图像中是否存在指定类别的对象，若存在则返回每个对象的位置和类别。

卷积神经网络推动了目标检测算法的不断发展与完善。但与此同时，人工标注成本过高导致的训练数据缺乏的问题越来越受到重视。目前大多数基于视觉的半监督目标检测算法中使用人工标注的数据部分仅占总数据的5％-30％。半监督学习允许算法在现有数据集的基础上加入海量无标签的数据，并从这些数据的训练中提升精确度。半监督目标检测在传统目标检测基础上实现了数据扩展，减少了数据标注的人工成本，降低了目标检测在各个领域的应用成本。

STAC和目前大多数半监督目标检测都在训练期间使用硬标签进行训练，这不利于减小错误伪标签对训练的持续不良影响，容易对错误伪标签产生过拟合。虽然，使用标签平滑化(label smoothing)，可以有效减弱过拟合现象，但其对于所有类别使用相同权重，抹除了类别之间的相似性信息，不能减小错误伪标签的影响，错误伪标签将对模型训练产生持续影响，最终影响检测精度，并且，目前使用软标签的半监督目标检测方法大都是在判断前景和背景时使用软标签，没有减少错误分类的伪标签的危害。

进而，在自动驾驶时可能会导致车辆行驶过程中目标检测不准确，导致出现事故，造成危险。

为了解决相关技术中存在的问题，本公开提供一种车辆控制方法、装置、存储介质及车辆。

图1是根据一示例性实施例示出的一种车辆控制方法的流程图，该方法应用于车辆，例如车辆上配置的电子控制单元、行车电脑等具备信息处理能力的电子设备，如图1所示，该方法包括步骤：

S101、获取车辆行驶过程中的路况图像。

其中，路况图像可以是通过车辆上配置的摄像头获取的，可以包括车辆前方和/或后方的图像。

S102、将所述路况图像输入路况检测模型，得到路况检测结果。

所述路况检测模型是预先经过基于类别标签权重的半监督训练得到的，所述路况检测结果包括所述路况图像中各个目标物体的位置信息以及类别信息，所述类别标签权重用于表征类别相似性。

示例地，该位置信息可以是路况图像中以边界框的形式表示，类别信息可以通过文字表示，例如，“行人”，“车辆”，“减速带”等等。

在一种可能的实施方式中，还可以将该路况图像以及对应的检测结果，通过车辆上的显示屏幕显示。

其中，该路况检测模型可以是通过其他电子设备，如服务器，进行训练后发送给车辆的，也可以是通过车辆上的行车电脑训练得到的，本公开对此不作限定。

本领域技术人员应知悉，半监督训练指是监督学习与无监督学习相结合的一种模型训练方法，半监督训练使用大量的未标记数据，以及同时使用标记数据，来进行模型的训练。

具体地，该类别标签权重可以是基于路况检测模型的监督训练的过程中，从网络的中间层提取得到的类别信息特征得到的，例如，根据所述类别特征信息计算各个类别标签之间的类间间距；根据所述类间间距，确定各个类别之间的类别相似性信息；根据所述类别相似性信息，确定所述类别标签权重。可以理解的是，上述中间层可以是网络倒数第二层，该层的输出的结果可以为该网络基于训练集输出的对应训练集的特征向量。

其中，类间间距远表征类别相似度低，间距近表征类别相似度高。类别标签权重可以是以类别标签权重矩阵表示的。

S103、根据所述路况检测结果控制所述车辆。

示例地，若所述路况检测结果表征前方道路出现减速带，则控制车辆减速。或者，若检测结果表征车辆前方出现行人，则可以控制车辆减速的同时鸣笛提示。

在本公开实施例中，通过预先经过基于类别标签权重的半监督训练的路况检测模型对车辆行驶过程中的图像进行检测，并根据检测结果控制车辆行驶，由于类别标签权重能够表征类别相似性，基于类别标签权重训练路况检测模型不仅能够减少模型过拟合的概率，还能够减小错误伪标签的影响，提高了训练得到的路况检测模型的鲁棒性，使得该路况检测模型输出的检测结果更加准确，提高了行车安全。

在一些可选地实施中，所述路况检测模型的数据集包括第一数据集和第二数据集，所述第一数据集包括标注有真实标签信息的路况图像样本，所述第二数据集包括未标注真实标签信息的路况图像样本，所述路况检测模型的训练包括：

其中，第一数据集中图像样本的数量可以远小于上述第二图像集中图像的数量，该路况检测模型可以是FastRCNN模型。

并且，上述预训练完成可以是通过计算该路况检测模型是否收敛确定的，或者，也可以根据训练时长确定的，例如，训练的步长大于预设阈值，则可以确定预训练完成，得到预训练完成的路况检测模型，此时，可以将该预训练完成的路况检测模型认为是教师模型。将没有标签的第二数据集输入该教师模型进行预测，则能够得到该教师模型输出的对应的伪标签，该伪标签包括对应的数据集中每一个图像中的每一个目标物体的位置信息以及类别信息。

采用上述方案，先基于具备标签的数据集对路况检测模型进行预训练得到教师模型，以使得该教师模型具备目标检测以及类型判别的能力，同时，再基于类别特征信息得到类别标签权重，以使得能够基于不具备标签信息的数据集具备伪标签，以对教师模型进行进一步的训练，得到最终的路况检测模型，以保证该路况检测模型不仅能够减少模型过拟合的概率，还能够减小错误伪标签的影响。

在一些可能的实施方式中，所述基于所述路况检测模型的中间层在所述预训练过程输出的类别特征信息，确定所述路况检测模型的类别标签权重包括：

根据所述类别特征信息计算各个类别标签之间的类间间距；

根据所述类间间距，确定各个类别之间的类别相似性信息；

根据所述类别相似性信息，确定所述类别标签权重。

其中，针对类间间距、类别相似性信息以及类别标签权重以在上文中进行了介绍，此处不再赘述。采用本方案，通过计算类间间距以得到类别相似性信息，能够准确地得到类别标签权重。

基于所述类别标签权重，确定第二伪标签；

可以理解的是，网络对图像中的目标的类别预测是不同的，经过筛选后得到的伪标签实际上是相同的，例如，对第二数据集中某一图像的某一目标物体A的类别预测值为{0.9,0.09,0.01}，另一目标B的类别预测值为{0.9,0.05,0.05}，另一目标C的类别预测值为{0.5,0.25,0.25}，在目标A的预测值中，0.9表征该目标为汽车的概率，0.09表征该目标为三轮车的概率，0.01表征该目标自行车的概率，针对目标B与目标C同理。在经过筛选之后，得到目标A与目标B的第一伪标签表征该目标物体为“汽车”，目标C则因为概率最大值为0.5，小于预设阈值，作为不可靠对象移除。具体地，针对预测值的筛选在下方的可能的实施例中将进一步介绍，在此不再赘述。

示例地，针对第二数据集中某一图像的某一目标物体A的第一伪标签表征该物体A为“汽车”，基于类别标签权重对该标签进行处理后，得到的第二伪标签可以表征该物体A为“汽车”的概率为0.88，为“三轮车”的概率为0.09，为“自行车”的概率为0.03。也就是说，类别标签权重能够表征汽车标签与三轮车标签之间的相似性高于汽车标签与三轮车标签之间的相似性。具体地，第一伪标签和可以与类别标签权重矩阵中对应的列进行处理，例如相加，归一化等。

采用本方案，能够在教师模型输出伪标签之后，对伪标签进行处理，以将类别关联性加入伪标签中，以使得该伪标签能够表征类别间的关联信息，以使得最终训练得到的路况检测模型对路况的判断更加准确，提高该模型的鲁棒性。

在又一些可选地所述例中，所述将所述第二数据集输入训练完成的所述路况检测模型，得到第一伪标签包括：

其中，预设置信阈值可以根据模型的实际训练情况确定，例如，可以标定为0.7、0.8等，本公开对此不作限定。

可以理解的是，路况检测模型会针对第二数据集预测得到大量的目标框预测结果，也就是针对目标位置的预测，利用非极大值抑制能够消除大量的冗余框找到最佳的目标边界框，以减少模型的计算量，提高计算效率。

进一步，类别置信度可以是根据该路况检测模型的预测结果的最大概率类别确定的，例如，某一目标物体A的类别预测值为{0.9,0.09,0.01}，另一目标B的类别预测值为{0.9,0.05,0.05}，另一目标C的类别预测值为{0.5,0.25,0.25}，则，目标A以及目标B对应的类别置信度均为0.9，目标C对应的类别置信度则为0.5，若预设置信阈值为0.8，则目标C的置信度低于预设置信阈值，则可以将目标C对应的伪标签移除。

采用本方案，通过利用非极大值抑制消除大量的冗余框，再使用预设执行阈值来挑选高置信度的类别标签，进而筛选得到教师模型输出的置信度较高的伪标签，以避免错误标签对模型的训练造成持续的影响。

在一些可选地实施例中，所述根据所述第三数据集以及所述伪标签对所述路况检测模型进行再次训练，得到训练完成的所述路况检测模型包括：

将所述第三数据集输入所述路况检测模型，得到第二预测标签；

其中，第一损失以及第二损失可以均是基于交叉熵计算得到的。

采用本方案，基于类别标签权重得到的第三伪标签，与教师模型对第三数据集的预测值进行对比，计算得到第二损失，并，基于第一阶段针对教师模型训练的第一损失以及该第二损失对该教师模型进行进一步训练，使得该模型考虑到教师模型的训练阶段的损失以及基于伪标签训练的损失，令该模型能够具备更加准确的路况检测能力，保证了驾驶的安全。

具体地，对第一损失进行归一化可以是基于第一数据集中图像的数量、类别损失以及位置损失(即回归框损失)计算得到的，对第二损失进行归一化可以是根据第三数据集中图像的数量、类别损失以及位置损失计算得到的。

采用本方案，通过对第一损失以及第二损失分别归一化，归一化之后相加，能够有效地在有监督和半监督之间的损失值差别较大的情况下，也不会导致一方被忽略，提高了模型的整体训练效果。

在所述第二数据集中的图像的像素位置发生变化的情况下，对所述第二数据集中的图像对应的第二伪标签中的位置信息进行相应的变化。

可以理解的是，若不对第二数据集以及第二伪标签进行处理直接输入教师教师，该教师模型输出的结果可能与第二伪标签相同，进而无法准确的得到模型的损失。

采用本方案，通过对图像进行色彩转换、几何变换、比例缩放、盒级变换或灰框填充等数据增强，并同时对对应的伪标签的位置信息进行相应的变换，进而得到增强后的第三数据集与对应的伪标签，进而对该路况检测模型训练，能够有效地保证该路况检测模型的训练效果，并提高该路况检测模型的泛化能力。

为了使得本领域技术人员更加理解本公开提供的技术方案，本公开提供如图2所示的根据一示例性实施例示出的一种路况检测模型的训练方法的流程图，如图2所示，该方法包括步骤：

S201、获取第一数据集和第二数据集。

其中，所述第一数据集包括标注有真实标签信息的路况图像样本，所述第二数据集包括未标注真实标签信息的路况图像样本。

S202、将所述第一数据集输入第一模型进行预训练，得到教师模型。

其中，第一模型可以是FastRCNN模型。

S203、基于教师模型的中间层在所述预训练过程输出的类别特征信息，确定所述路况检测模型的类别标签权重。

其中，类别相似性信息由类间距离决定，间距远的类别相似度低，间距近的类别相似度高。类间距离基于在全监督训练阶段中网络倒数第二层的类别特征信息得到。

S204、确定教师模型基于第一数据集的第一预测结果，与真实标签信息之间的第一损失。

S205、将第二数据集输入教师模型，对教师模型的预测结果进行筛选后得到第一伪标签。

其中，筛选包括通过对位置信息进行非极大值抑制，以及判断类别预测值的最大概率类别是否大于预设置信阈值。

S206、根据第一伪标签以及类别标签权重，确定第二伪标签。

S207、对第二数据集以及第二伪标签进行同步的数据增强处理，得到第三数据集以及第三伪标签。

其中，数据增强处理可以包括图像级别的颜色抖动、平移、旋转、剪切、小幅度的平移、旋转、剪切等等。

S208、将第三数据集输入教师模型，得到第二预测结果。

S209、基于第二预测结果与第三伪标签，确定第二损失。

S210、基于第一损失以及第二损失，更新教师模型的参数，以得到训练完成的路况检测模型。

以上训练方法，对标签平滑化进行改进，使用以类别相似性信息为依据的软标签权重取代平均分配的软标签权重，以降低错误伪标签对训练产生的危害。在增强模型鲁棒性的同时减少了错误伪标签对后续训练的影响。可以理解的是，由于软标签的作用在第二阶段的训练中计算损失的时候才发挥，因此可以在计算损失之前时候才把类别标签权重加到伪标签上。

例如，可以在步骤S207之后，根据数据增强之后的伪标签，以及类别标签权重得到最终的用于计算损失的伪标签。

可以理解的是，所述路况检测模型的训练方法的执行主体可以是车载终端，也可以是服务器。服务器可以在训练得到训练完成的路况检测模型之后，将该训练完成的路况检测模型发送给车载终端，以使得车载终端能够根据该路况检测模型进行路况检测，并根据路况检测结果控制车辆，以保证车辆的行车安全。

基于相同的发明构思，图3是根据一示例性实施例示出的一种车辆控制装置30的框图，如图3所示，所述装置30包括：

获取模块31，用于获取车辆行驶过程中的路况图像；

检测模块32，用于将所述路况图像输入路况检测模型，得到路况检测结果，所述路况检测模型是预先经过基于类别标签权重的半监督训练得到的，所述路况检测结果包括所述路况图像中各个目标物体的位置信息以及类别信息，所述类别标签权重用于表征类别相似性；

控制模块33，用于根据所述路况检测结果控制所述车辆。

可选地，所述路况检测模型的数据集包括第一数据集和第二数据集，所述第一数据集包括标注有真实标签信息的路况图像样本，所述第二数据集包括未标注真实标签信息的路况图像样本，所述装置30还包括：

输入模块，用于将所述第一数据集输入路况检测模型进行预训练，并确定预训练完成后的所述路况检测模型输出的针对所述第一数据集的第一预测标签和所述真实标签信息之间的第一损失；

权重确定模块，用于基于所述路况检测模型的中间层在所述预训练过程输出的类别特征信息，确定所述路况检测模型的类别标签权重；

生成模块，用于根据所述类别标签权重以及所述第二数据集生成第三数据集和对应所述第三数据集的伪标签；

训练模块，用于根据所述第三数据集以及所述伪标签对所述路况检测模型进行再次训练，得到训练完成的所述路况检测模型。

可选地，所述权重确定模块具体用于：

根据所述类别特征信息计算各个类别标签之间的类间间距；

根据所述类间间距，确定各个类别之间的类别相似性信息；

根据所述类别相似性信息，确定所述类别标签权重。

可选地，所述生成模块具体用于：

基于所述类别标签权重，确定第二伪标签；

可选地，所述生成模块还用于：

可选地，所述训练模块具体用于：

可选地，所述训练模块还用于：

可选地，所述生成模块还用于：

关于上述实施例中的装置，其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

本公开还提供一种计算机可读存储介质，其上存储有计算机程序指令，该程序指令被处理器执行时实现本公开提供的车辆控制方法的步骤。

图4是根据一示例性实施例示出的一种车辆控制装置400的框图。例如，装置400可以是移动电话，计算机，数字广播终端，消息收发设备，游戏控制台，平板设备，医疗设备，健身设备，个人数字助理等。

参照图4，装置400可以包括以下一个或多个组件：处理组件402，存储器404，电力组件406，多媒体组件408，音频组件410，输入/输出(I/O)的接口412，传感器组件414，以及通信组件416。

处理组件402通常控制装置400的整体操作，诸如与显示，电话呼叫，数据通信，相机操作和记录操作相关联的操作。处理组件402可以包括一个或多个处理器420来执行指令，以完成上述的方法的全部或部分步骤。此外，处理组件402可以包括一个或多个模块，便于处理组件402和其他组件之间的交互。例如，处理组件402可以包括多媒体模块，以方便多媒体组件408和处理组件402之间的交互。

存储器404被配置为存储各种类型的数据以支持在装置400的操作。这些数据的示例包括用于在装置400上操作的任何应用程序或方法的指令，联系人数据，电话簿数据，消息，图片，视频等。存储器404可以由任何类型的易失性或非易失性存储设备或者它们的组合实现，如静态随机存取存储器(SRAM)，电可擦除可编程只读存储器(EEPROM)，可擦除可编程只读存储器(EPROM)，可编程只读存储器(PROM)，只读存储器(ROM)，磁存储器，快闪存储器，磁盘或光盘。

电力组件406为装置400的各种组件提供电力。电力组件406可以包括电源管理系统，一个或多个电源，及其他与为装置400生成、管理和分配电力相关联的组件。

多媒体组件408包括在所述装置400和用户之间的提供一个输出接口的屏幕。在一些实施例中，屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板，屏幕可以被实现为触摸屏，以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界，而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中，多媒体组件408包括一个前置摄像头和/或后置摄像头。当装置400处于操作模式，如拍摄模式或视频模式时，前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。

音频组件410被配置为输出和/或输入音频信号。例如，音频组件410包括一个麦克风(MIC)，当装置400处于操作模式，如呼叫模式、记录模式和语音识别模式时，麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器404或经由通信组件416发送。在一些实施例中，音频组件410还包括一个扬声器，用于输出音频信号。

I/O接口412为处理组件402和外围接口模块之间提供接口，上述外围接口模块可以是键盘，点击轮，按钮等。这些按钮可包括但不限于：主页按钮、音量按钮、启动按钮和锁定按钮。

传感器组件414包括一个或多个传感器，用于为装置400提供各个方面的状态评估。例如，传感器组件414可以检测到装置400的打开/关闭状态，组件的相对定位，例如所述组件为装置400的显示器和小键盘，传感器组件414还可以检测装置400或装置400一个组件的位置改变，用户与装置400接触的存在或不存在，装置400方位或加速/减速和装置400的温度变化。传感器组件414可以包括接近传感器，被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件414还可以包括光传感器，如CMOS或CCD图像传感器，用于在成像应用中使用。在一些实施例中，该传感器组件414还可以包括加速度传感器，陀螺仪传感器，磁传感器，压力传感器或温度传感器。

通信组件416被配置为便于装置400和其他设备之间有线或无线方式的通信。装置400可以接入基于通信标准的无线网络，如WiFi，2G或3G，或它们的组合。在一个示例性实施例中，通信组件416经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中，所述通信组件416还包括近场通信(NFC)模块，以促进短程通信。例如，在NFC模块可基于射频识别(RFID)技术，红外数据协会(IrDA)技术，超宽带(UWB)技术，蓝牙(BT)技术和其他技术来实现。

在示例性实施例中，装置400可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现，用于执行上述车辆控制方法。

在示例性实施例中，还提供了一种包括指令的非临时性计算机可读存储介质，例如包括指令的存储器404，上述指令可由装置400的处理器420执行以完成上述车辆控制方法。例如，所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

在另一示例性实施例中，还提供一种计算机程序产品，该计算机程序产品包含能够由可编程的装置执行的计算机程序，该计算机程序具有当由该可编程的装置执行时用于执行上述的车辆控制方法的代码部分。

图5是根据一示例性实施例示出的一种车辆控制装置500的框图。例如，装置500可以被提供为一服务器。参照图5，装置500包括处理组件522，其进一步包括一个或多个处理器，以及由存储器532所代表的存储器资源，用于存储可由处理组件522的执行的指令，例如应用程序。存储器532中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外，处理组件522被配置为执行指令，以执行上述车辆控制方法。

装置500还可以包括一个电源组件526被配置为执行装置500的电源管理，一个有线或无线网络接口550被配置为将装置500连接到网络，和一个输入输出(I/O)接口558。装置500可以操作基于存储在存储器532的操作系统，例如Windows Server^TM，Mac OS X^TM，Unix^TM，Linux^TM，FreeBSD^TM或类似。

参阅图6，图6为本申请实施例提供的一种车辆600的功能框图。

图6是一示例性实施例示出的一种车辆600的一个功能框图示意图。车辆600可以被配置为完全或部分自动驾驶模式。例如，车辆600可以通过感知系统620获取其周围的环境信息，并基于对周边环境信息的分析得到自动驾驶策略以实现完全自动驾驶，或者将分析结果呈现给用户以实现部分自动驾驶。

车辆600可包括各种子系统，例如，信息娱乐系统610、感知系统620、决策控制系统630、驱动系统640以及计算平台650。可选的，车辆600可包括更多或更少的子系统，并且每个子系统都可包括多个部件。另外，车辆600的每个子系统和部件可以通过有线或者无线的方式实现互连。

在一些实施例中，信息娱乐系统610可以包括通信系统611，娱乐系统612以及导航系统613。

通信系统611可以包括无线通信系统，无线通信系统可以直接地或者经由通信网络来与一个或多个设备无线通信。例如，无线通信系统可使用3G蜂窝通信，例如CDMA、EVD0、GSM/GPRS，或者4G蜂窝通信，例如LTE。或者5G蜂窝通信。无线通信系统可利用WiFi与无线局域网(wireless local area network，WLAN)通信。在一些实施例中，无线通信系统可利用红外链路、蓝牙或ZigBee与设备直接通信。其他无线协议，例如各种车辆通信系统，例如，无线通信系统可包括一个或多个专用短程通信(dedicated short range communications，DSRC)设备，这些设备可包括车辆和/或路边台站之间的公共和/或私有数据通信。

娱乐系统612可以包括显示设备，麦克风和音响，用户可以基于娱乐系统在车内收听广播，播放音乐；或者将手机和车辆联通，在显示设备上实现手机的投屏，显示设备可以为触控式，用户可以通过触摸屏幕进行操作。

在一些情况下，可以通过麦克风获取用户的语音信号，并依据对用户的语音信号的分析实现用户对车辆600的某些控制，例如调节车内温度等。在另一些情况下，可以通过音响向用户播放音乐。

导航系统613可以包括由地图供应商所提供的地图服务，从而为车辆600提供行驶路线的导航，导航系统613可以和车辆的全球定位系统621、惯性测量单元622配合使用。地图供应商所提供的地图服务可以为二维地图，也可以是高精地图。

感知系统620可包括感测关于车辆600周边的环境的信息的若干种传感器。例如，感知系统620可包括全球定位系统621(全球定位系统可以是GPS系统，也可以是北斗系统或者其他定位系统)、惯性测量单元(inertial measurement unit，IMU)622、激光雷达623、毫米波雷达624、超声雷达625以及摄像装置626。感知系统620还可包括被监视车辆600的内部系统的传感器(例如，车内空气质量监测器、燃油量表、机油温度表等)。来自这些传感器中的一个或多个的传感器数据可用于检测对象及其相应特性(位置、形状、方向、速度等)。这种检测和识别是车辆600的安全操作的关键功能。

全球定位系统621用于估计车辆600的地理位置。

惯性测量单元622用于基于惯性加速度来感测车辆600的位姿变化。在一些实施例中，惯性测量单元622可以是加速度计和陀螺仪的组合。

激光雷达623利用激光来感测车辆600所位于的环境中的物体。在一些实施例中，激光雷达623可包括一个或多个激光源、激光扫描器以及一个或多个检测器，以及其他系统组件。

毫米波雷达624利用无线电信号来感测车辆600的周边环境内的物体。在一些实施例中，除了感测物体以外，毫米波雷达624还可用于感测物体的速度和/或前进方向。

超声雷达625可以利用超声波信号来感测车辆600周围的物体。

摄像装置626用于捕捉车辆600的周边环境的图像信息。摄像装置626可以包括单目相机、双目相机、结构光相机以及全景相机等，摄像装置626获取的图像信息可以包括静态图像，也可以包括视频流信息。

决策控制系统630包括基于感知系统620所获取的信息进行分析决策的计算系统631，决策控制系统630还包括对车辆600的动力系统进行控制的整车控制器632，以及用于控制车辆600的转向系统633、油门634和制动系统635；

计算系统631可以操作来处理和分析由感知系统620所获取的各种信息以便识别车辆600周边环境中的目标、物体和/或特征。目标可以包括行人或者动物，物体和/或特征可包括交通信号、道路边界和障碍物。计算系统631可使用物体识别算法、运动中恢复结构(Structure from Motion，SFM)算法、视频跟踪等技术。在一些实施例中，计算系统631可以用于为环境绘制地图、跟踪物体、估计物体的速度等等。计算系统631可以将所获取的各种信息进行分析并得出对车辆的控制策略。

整车控制器632可以用于对车辆的动力电池和引擎641进行协调控制，以提升车辆600的动力性能。

转向系统633可操作来调整车辆600的前进方向。例如在一个实施例中可以为方向盘系统。

油门634用于控制引擎641的操作速度并进而控制车辆600的速度。

制动系统635用于控制车辆600减速。制动系统635可使用摩擦力来减慢车轮644。在一些实施例中，制动系统635可将车轮644的动能转换为电流。制动系统635也可采取其他形式来减慢车轮644转速从而控制车辆600的速度。

驱动系统640可包括为车辆600提供动力运动的组件。在一个实施例中，驱动系统640可包括引擎641、能量源642、传动系统643和车轮644。引擎641可以是内燃机、电动机、空气压缩引擎或其他类型的引擎组合，例如汽油发动机和电动机组成的混动引擎，内燃引擎和空气压缩引擎组成的混动引擎。引擎641将能量源642转换成机械能量。

能量源642的示例包括汽油、柴油、其他基于石油的燃料、丙烷、其他基于压缩气体的燃料、乙醇、太阳能电池板、电池和其他电力来源。能量源642也可以为车辆600的其他系统提供能量。

传动系统643可以将来自引擎641的机械动力传送到车轮644。传动系统643可包括变速箱、差速器和驱动轴。在一个实施例中，传动系统643还可以包括其他器件，比如离合器。其中，驱动轴可包括可耦合到一个或多个车轮644的一个或多个轴。

车辆600的部分或所有功能受计算平台650控制。计算平台650可包括至少一个处理器651，处理器651可以执行存储在例如存储器652这样的非暂态计算机可读介质中的指令653。在一些实施例中，计算平台650还可以是采用分布式方式控制车辆600的个体组件或子系统的多个计算设备。

处理器651可以是任何常规的处理器，诸如商业可获得的CPU。替选地，处理器651还可以包括诸如图像处理器(Graphic Process Unit，GPU)，现场可编程门阵列(FieldProgrammable Gate Array，FPGA)、片上系统(Sysem on Chip，SOC)、专用集成芯片(Application Specific Integrated Circuit，ASIC)或它们的组合。尽管图6功能性地图示了处理器、存储器、和在相同块中的计算机的其它元件，但是本领域的普通技术人员应该理解该处理器、计算机、或存储器实际上可以包括可以或者可以不存储在相同的物理外壳内的多个处理器、计算机、或存储器。例如，存储器可以是硬盘驱动器或位于不同于计算机的外壳内的其它存储介质。因此，对处理器或计算机的引用将被理解为包括对可以或者可以不并行操作的处理器或计算机或存储器的集合的引用。不同于使用单一的处理器来执行此处所描述的步骤，诸如转向组件和减速组件的一些组件每个都可以具有其自己的处理器，处理器只执行与特定于组件的功能相关的计算。

在本申请实施方式中，处理器651可以获取车辆行驶过程中的路况图像；将所述路况图像输入路况检测模型，得到路况检测结果，所述路况检测模型是预先经过基于类别标签权重的半监督训练得到的，所述路况检测结果包括所述路况图像中各个目标物体的位置信息以及类别信息，所述类别标签权重用于表征类别相似性；根据所述路况检测结果控制车辆600。

在此处所描述的各个方面中，处理器651可以位于远离该车辆并且与该车辆进行无线通信。在其它方面中，此处所描述的过程中的一些在布置于车辆内的处理器上执行而其它则由远程处理器执行，包括采取执行单一操纵的必要步骤。

在一些实施例中，存储器652可包含指令653(例如，程序逻辑)，指令653可被处理器651执行来执行车辆600的各种功能。存储器652也可包含额外的指令，包括向信息娱乐系统610、感知系统620、决策控制系统630、驱动系统640中的一个或多个发送数据、从其接收数据、与其交互和/或对其进行控制的指令。

除了指令653以外，存储器652还可存储数据，例如道路地图、路线信息，车辆的位置、方向、速度以及其它这样的车辆数据，以及其他信息。这种信息可在车辆600在自主、半自主和/或手动模式中操作期间被车辆600和计算平台650使用。

计算平台650可基于从各种子系统(例如，驱动系统640、感知系统620和决策控制系统630)接收的输入来控制车辆600的功能。例如，计算平台650可利用来自决策控制系统630的输入以便控制转向系统633来避免由感知系统620检测到的障碍物。在一些实施例中，计算平台650可操作来对车辆600及其子系统的许多方面提供控制。

可选地，上述这些组件中的一个或多个可与车辆600分开安装或关联。例如，存储器652可以部分或完全地与车辆600分开存在。上述组件可以按有线和/或无线方式来通信地耦合在一起。

可选地，上述组件只是一个示例，实际应用中，上述各个模块中的组件有可能根据实际需要增添或者删除，图6不应理解为对本公开实施例的限制。

在道路行进的自动驾驶汽车，如上面的车辆600，可以识别其周围环境内的物体以确定对当前速度的调整。物体可以是其它车辆、交通控制设备、或者其它类型的物体。在一些示例中，可以独立地考虑每个识别的物体，并且基于物体的各自的特性，诸如它的当前速度、加速度、与车辆的间距等，可以用来确定自动驾驶汽车所要调整的速度。

可选地，车辆600或者与车辆600相关联的感知和计算设备(例如计算系统631、计算平台650)可以基于所识别的物体的特性和周围环境的状态(例如，交通、雨、道路上的冰、等等)来预测识别的物体的行为。可选地，每一个所识别的物体都依赖于彼此的行为，因此还可以将所识别的所有物体全部一起考虑来预测单个识别的物体的行为。车辆600能够基于预测的识别的物体的行为来调整它的速度。换句话说，自动驾驶汽车能够基于所预测的物体的行为来确定车辆将需要调整到(例如，加速、减速、或者停止)什么稳定状态。在这个过程中，也可以考虑其它因素来确定车辆600的速度，诸如，车辆600在行驶的道路中的横向位置、道路的曲率、静态和动态物体的接近度等等。

除了提供调整自动驾驶汽车的速度的指令之外，计算设备还可以提供修改车辆600的转向角的指令，以使得自动驾驶汽车遵循给定的轨迹和/或维持与自动驾驶汽车附近的物体(例如，道路上的相邻车道中的轿车)的安全横向和纵向距离。

上述车辆600可以为轿车、卡车、摩托车、公共汽车、船、飞机、直升飞机、割草机、娱乐车、游乐场车辆、施工设备、电车、高尔夫球车、火车等，本公开实施例不做特别的限定。

本领域技术人员在考虑说明书及实践本公开后，将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由下面的权利要求指出。

应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims

1.一种车辆控制方法，其特征在于，包括：

获取车辆行驶过程中的路况图像；

根据所述路况检测结果控制所述车辆。

2.根据权利要求1所述的方法，其特征在于，所述路况检测模型的数据集包括第一数据集和第二数据集，所述第一数据集包括标注有真实标签信息的路况图像样本，所述第二数据集包括未标注真实标签信息的路况图像样本，所述路况检测模型的训练包括：

3.根据权利要求2所述的方法，其特征在于，所述基于所述路况检测模型的中间层在所述预训练过程输出的类别特征信息，确定所述路况检测模型的类别标签权重包括：

根据所述类别特征信息计算各个类别标签之间的类间间距；

根据所述类间间距，确定各个类别之间的类别相似性信息；

根据所述类别相似性信息，确定所述类别标签权重。

4.根据权利要求2所述的方法，其特征在于，所述根据所述类别标签权重以及所述第二数据集生成第三数据集和对应所述第三数据集的伪标签包括：

基于所述类别标签权重，确定第二伪标签；

5.根据权利要求4所述的方法，其特征在于，所述将所述第二数据集输入训练完成的所述路况检测模型，得到第一伪标签包括：

6.根据权利要求4所述的方法，其特征在于，所述根据所述第三数据集以及所述伪标签对所述路况检测模型进行再次训练，得到训练完成的所述路况检测模型包括：

7.根据权利要求6所述的方法，其特征在于，所述基于所述第一损失以及所述第二损失，对所述路况检测模型的参数进行更新包括：

8.根据权利要求4-7任一项所述的方法，其特征在于，所述对所述第二数据集以及所述第二伪标签进行数据增强操作，得到增强后的第三数据集以及第三伪标签包括：

9.一种车辆控制装置，其特征在于，包括：

获取模块，用于获取车辆行驶过程中的路况图像；

控制模块，用于根据所述路况检测结果控制所述车辆。

10.一种计算机可读存储介质，其上存储有计算机程序指令，其特征在于，该程序指令被处理器执行时实现权利要求1-7中任一项所述方法的步骤。

11.一种车辆，其特征在于，所述车辆包括：

处理器；

用于存储处理器可执行指令的存储器；

其中，所述处理器被配置为：

获取车辆行驶过程中的路况图像；

根据所述路况检测结果控制所述车辆。