WO2019000391A1

WO2019000391A1 - 车辆的控制方法、装置及设备

Info

Publication number: WO2019000391A1
Application number: PCT/CN2017/091095
Authority: WO
Inventors: 许松岑; 郑荣福; 王靓伟; 庄雨铮
Original assignee: 华为技术有限公司
Priority date: 2017-06-30
Filing date: 2017-06-30
Publication date: 2019-01-03
Also published as: EP3647140B1; CN110809542A; CN110809542B; EP3647140A4; EP3647140A1; US20200139989A1

Abstract

一种车辆的控制方法、装置及设备。该方法包括：在自动驾驶车辆处于自动驾驶状态时，获取自动驾驶车辆的行驶状态信息和自动驾驶车辆的第一行驶环境信息（101）；基于行驶状态信息、第一行驶环境信息和控制指令决策模型，计算自动驾驶车辆的粗粒度控制指令（102）；根据第二行驶环境信息判断是否执行粗粒度控制指令（103）；当判定执行粗粒度控制指令时，根据车道信息和自动驾驶车辆的行驶状态信息，确定与粗粒度控制指令对应的细粒度控制指令（104）。该车辆的控制方法、装置及设备能够解决自动驾驶控制决策系统输出的控制指令给自动驾驶的车辆带来安全隐患的问题。

Description

车辆的控制方法、装置及设备

技术领域

本发明涉及通信技术领域，尤其涉及一种车辆的控制方法、装置及设备。

背景技术

自动驾驶系统是集自动控制、体系结构、人工智能、视觉计算等众多技术于一体的智能系统。自动驾驶系统中控制决策系统根据感知系统解析出的信息可以确定出自动驾驶的策略，然后输出相应的控制指令，以实现规划车辆行车路线并控制车辆自动行驶的目的。

控制决策系统在确定自动驾驶策略时需要考虑到汽车行驶的安全性和舒适性，需要在尽快到达目的地的同时保证驾驶过程的安全。因此，自动驾驶系统中对控制决策系统控制车辆自动驾驶时的安全性和可靠性有着严格要求。

现有技术中，为了保证车辆自动驾驶时的安全性和可靠性，控制决策系统通常基于自动驾驶车辆在行驶时的各项参数，利用学习算法计算并输出自动驾驶车辆的控制指令，如方向盘角度、油门大小、刹车力度等等，通过输出的控制指令对自动驾驶车辆进行控制。但是，在控制决策系统通过控制指令控制车辆自动驾驶时，自动驾驶车辆经常会出现不符合自然驾驶行为的情况，例如，自动驾驶车辆出现频繁的左右摆动，甚至导致安全事故发生，因此会给自动驾驶的车辆带来安全隐患。

发明内容

本发明实施例提供了一种车辆的控制方法、装置及设备，能够解决现有技术中通过控制指令控制车辆自动驾驶时给自动驾驶的车辆带来安全隐患的问题。

第一方面，本发明实施例提供了一种车辆的控制方法，包括：

在自动驾驶车辆处于自动驾驶状态时，获取自动驾驶车辆的行驶状态信息和自动驾驶车辆的第一行驶环境信息；

基于行驶状态信息、第一行驶环境信息和控制指令决策模型，计算自动驾驶车辆的粗粒度控制指令，粗粒度控制指令用于控制自动驾驶车辆的行驶方式，控制指令决策模型为基于自动驾驶车辆在训练状态时的训练行驶状态信息和自动驾驶车辆在训练状态时的训练行驶环境信息训练得到的；

根据第二行驶环境信息判断是否执行粗粒度控制指令，第二行驶环境信息包括在自动驾驶车辆处于自动驾驶状态时，与粗粒度控制指令对应的行驶环境信息；

当判定执行粗粒度控制指令时，根据车道信息和自动驾驶车辆的行驶状态信息，确定与粗粒度控制指令对应的细粒度控制指令，细粒度控制指令用于控制自动驾驶车辆的行驶参数，车道信息包括自动驾驶车辆所行驶道路中粗粒度控制指令对应车道的信息；

输出细粒度控制指令。

本发明实施例中，通过行驶状态信息、第一行驶环境信息和控制指令决策模型先计算出粗粒度控制指令，然后基于第二行驶环境信息来判定是否可以执行粗粒度控制指令，即在确定控制自动驾驶车辆的行驶参数之前，先计算出粗粒度控制指令计算出自动驾驶车辆的行驶方式，当判定可以执行粗粒度控制指令时，再将粗粒度控制指令转换为细粒度控制指令，从而能够避免在车辆自动控制时输出不必要或错误的控制指令，避免自动驾驶车辆出现不符合自然驾驶行为或发送安全事故；同时，本发明实施例中在判定可以执行粗粒度控制指令后，基于自动驾驶车辆的行驶状态信息和粗粒度控制指令对应的车道信息将粗粒度控制指令转换为细粒度控制指令，即充分考虑自动驾驶车辆行驶时的自身状况和车道信息确定出适合控制自动驾驶车辆的细粒度控制指令，提高细粒度控制指令的准确性和自动驾驶车辆控制的精确性，避免自动驾驶车辆出现不符合自然驾驶行为或发送安全事故，从降低自动驾驶的车辆的安全隐患，进一步提高自动驾驶车辆的安全性和舒适性。

结合第一方面，在第一方面的第一种可能的实施方式中，粗粒度控制指令包括直行；

车道信息包括自动驾驶车辆直行时所行驶车道的预设期望速度，自动驾驶车辆的行驶状态信息包括自动驾驶车辆的当前速度；

根据车道信息和自动驾驶车辆的行驶状态信息，确定与粗粒度控制指令对应的细粒度控制指令，包括：

基于预设期望速度和当前速度，确定细粒度控制指令。

本实施方式中，粗粒度控制指令包括直行时，不需要对自动驾驶车辆的方向盘转角进行控制，可以只控制自动驾驶车辆的行驶速度，所以根据自动驾驶车辆的当前的速度和自动驾驶车辆在直行车道的预设期望速度来对自动驾驶车辆来确定细粒度控制指令，提高细粒度控制指令的准确性和自动驾驶车辆控制的精确性，避免自动驾驶车辆出现左右摆动等不符合自然驾驶行为。

结合第一方面或上述可能的实施方式，在第一方面的第二种可能的实施方式中，细粒度控制指令包括自动驾驶车辆的油门大小；

基于预设期望速度和当前速度，确定细粒度控制指令，包括：

当当前速度大于预设期望速度时，油门大小等于零；

当当前速度不大于预设期望速度时，基于第一预设公式计算自动驾驶车辆的油门大小，其中，第一预设公式包括：

油门大小＝预设油门控制系数×(预设期望速度-当前速度+预设值)。

本实施方式中，当前速度大于预设期望速度时，说明自动驾驶车辆的行驶速度过大，所以此时将油门大小确定为零，以便于尽快降低自动驾驶车辆的行驶速度；当前速度不大于预设期望速度时，说明自动驾驶车辆的行驶速度正常，此时基于预设期望速度和当前速度之间的差值和预设油门控制系数确定油门大小，以实现对油门的精确控制，保证自动驾驶车辆行驶的安全性。

具体的，本实施方式中预设期望速度不大于自动驾驶车辆直行时所行驶车道的最高限速。

结合第一方面或上述可能的实施方式，在第一方面的第三种可能的实施方式中，细粒度控制指令包括自动驾驶车辆的刹车力度；

当当前速度小于预设期望速度时，刹车力度等于零；

当当前速度不小于预设期望速度时，基于第二预设公式计算自动驾驶车辆的刹车力度，其中，第二预设公式包括：

刹车力度＝预设刹车控制系数×(当前速度-预设期望速度)。

本实施方式中，当前速度小于预设期望速度时，说明自动驾驶车辆的行驶速度正常，此时可以不进行刹车，所以将刹车力度调整为零；当前速度不小于预设期望速度时，说明自动驾驶车辆的行驶速度过大，此时需要通过刹车来控制自动驾驶车辆的速度，所以基于预设期望速度和当前速度之间的差值和预设刹车控制系数确定刹车力度，以实现对刹车的精确控制，保证自动驾驶车辆行驶的安全性。

结合第一方面或上述可能的实施方式，在第一方面的第四种可能的实施方式中，粗粒度控制指令包括换道方向；

基于自动驾驶车辆的行驶状态信息，模拟自动驾驶车辆在换道方向的换道行驶路径；

根据换道行驶路径和车道信息，确定自动驾驶车辆的细粒度控制指令。

本实施方式中，粗粒度控制指令包括换道方向时，控制自动驾驶车辆向换道方向侧进行换道，此时首先模拟出自动驾驶车辆的换道行驶路径，即在自动驾驶车辆实际进行换道之前，先确定出换道路径，然后再基于预先确定的换道路径和车道信息确定自动驾驶车辆在换道时的细粒度控制指令，从而提高细粒度控制指令的准确性和自动驾驶车辆控制的精确性，进而提高自动驾驶车辆换道时的安全性。

结合第一方面或上述可能的实施方式，在第一方面的第五种可能的实施方式中，细粒度控制指令包括方向盘转角；

车道信息包括换道行驶路径对应车道的车道宽度和换道行驶路径对应车道的车道中线；

根据换道行驶路径和车道信息，确定自动驾驶车辆的细粒度控制指令，包括：

确定在换道行驶路径中自动驾驶车辆行驶方向与自动驾驶车辆当前所在车道直行方向之间至少一个转向角度；

在换道行驶路径中，根据换道行驶路径对应车道的车道宽度确定自动驾驶车辆在转向角度对应位置的所属车道的目标车道宽度；

在换道行驶路径中，根据换道行驶路径对应车道的车道中线确定自动驾驶车辆在转向角度对应位置与所属车道的车道中线之间的目标距离；

基于第三预设公式、转向角度、目标车道宽度和目标距离计算方向盘转角，其中，第三预设公式包括：

方向盘转角＝[转向角度-目标距离/(目标车道宽度×第一转角系数)]×第二转角系数。

本实施方式中，由于自动驾驶车辆的换道行驶路径为曲线，需要对自动驾驶车辆的方向盘转角进行控制，所以基于预先模拟的换道行驶路径可以确定出自动驾驶车辆在换道时离散的需要转向的位置和转向角度，然后在结合换道行驶路径中各转向角度对应车道的信息确定出方向盘在对应各转向角度时的转角，即确定出自动驾驶车辆在换道时方向盘需要转动的角度，从而实现对方向盘的精确控制，保证自动驾驶车辆行驶的安全性。

具体的，本实施方式中预设期望速度不大于自动驾驶车辆直行时所行驶车道的最高限速。方向盘转角的取值范围可以为大于等于-1且小于等于1。

结合第一方面或上述可能的实施方式，在第一方面的第六种可能的实施方式中，细粒度控制指令还包括自动驾驶车辆的油门大小；

车道信息包括换道行驶路径对应车道的预设期望速度；

确定在换道行驶路径中自动驾驶车辆行驶方向与自动驾驶车辆当前所在车道直行方向之间至少一个转向角度之后，还包括：

在换道行驶路径中，基于自动驾驶车辆的行驶状态信息确定自动驾驶车辆在转向角度对应位置的当前速度；

在换道行驶路径中，根据换道行驶路径对应车道的预设期望速度确定自动驾驶车辆在转向角度对应位置所属车道的目标预设期望速度；

当当前速度大于目标预设期望速度时，油门大小等于零；

当当前速度不大于目标预设期望速度时，基于第四预设公式计算自动驾驶车辆在转向角度对应位置的油门大小，其中，第四预设公式包括：

油门大小＝预设油门控制系数×(目标预设期望速度-当前速度+预设值)。

本实施方式中，在自动驾驶车辆换道时，还可以对行驶速度进行控制。在当前速度大于目标预设期望速度时，将油门大小确定为零，以便于尽快降低自动驾驶车辆的行驶速度；当前速度不大于目标预设期望速度时，基于目标预设期望速度和当前速度之间的差值和预设油门控制系数确定油门大小，以实现对油门的精确控制，同时保证自动驾驶车辆行驶的安全性。

具体的，本实施方式中目标预设期望速度不大于换道行驶路径对应车道的最高限速。

结合第一方面或上述可能的实施方式，在第一方面的第七种可能的实施方式中，细粒度控制指令还包括自动驾驶车辆的刹车力度；

车道信息还包括换道行驶路径对应车道的预设期望速度；

在换道行驶路径中，基于自动驾驶车辆的行驶状态信息确定自动驾驶车辆在转向角度对应位置所属车道的当前速度；

在换道行驶路径中，根据换道行驶路径对应车道的预设期望速度确定自动驾驶车辆在转向角度对应位置的目标预设期望速度；

当当前速度小于目标预设期望速度时，刹车力度等于零；

当当前速度不小于目标预设期望速度时，基于第五预设公式计算自动驾驶车辆在转向角度对应位置的刹车力度，其中，第五预设公式包括：

刹车力度＝预设刹车控制系数×(当前速度-目标预设期望速度)。

本实施方式中，在自动驾驶车辆换道时，还可以对行驶速度进行控制。当前速度小于目标预设期望速度时，可以不进行刹车，所以将刹车力度调整为零；当前速度不小于目标预设期望速度时，需要通过刹车来控制自动驾驶车辆的速度，所以基于目标预设期望速度和当前速度之间的差值和预设刹车控制系数确定刹车力度，以实现对刹车的精确控制，保证自动驾驶车辆行驶的安全性。

具体的，在上述实施方式中目标预设期望速度不大于换道行驶路径对应车道的最高限速。油门大小的取值范围可以为大于等于0且小于等于1。刹车力度的取值范围可以为大于等于0且小于等于1。预设值的取值可以为1。

结合第一方面或上述可能的实施方式，在第一方面的第八种可能的实施方式中，第一行驶环境信息包括自动驾驶车辆所行驶车道的车道信息，自动驾驶车辆预设距离内车辆的信息，自动驾驶车辆预设距离内路面的信息中至少一项；

第二行驶环境信息包括自动驾驶车辆所行驶车道中与粗粒度控制指令对应的车道信息，自动驾驶车辆预设距离内与粗粒度控制指令对应的车辆信息，自动驾驶车辆预设距离内与粗粒度控制指令对应的路面信息中至少一项。

结合第一方面或上述可能的实施方式，在第一方面的第九种可能的实施方式中，第二行驶环境信息包括目标车辆与自动驾驶车辆之间的第一车辆距离，目标车辆表示自动驾驶车辆预设距离内与粗粒度控制指令对应的车辆；

根据第二行驶环境信息判断是否执行粗粒度控制指令，包括：

当第一车辆距离大于安全距离时，判定执行粗粒度控制指令；

当第一车辆距离不大于安全距离时，判定不执行粗粒度控制指令。

本实施方式中，在计算出粗粒度控制指令后，从安全角度出发，可以通过判断自动驾驶车辆预设距离内与粗粒度控制指令对应的车辆是否会影响自动驾驶车辆的安全来确定是否执行粗粒度控制指令，即判断目标车辆与自动驾驶车辆之间的第一车辆距离是否达到安全距离。通过对第一车辆距离和安全距离之间大小的判断，可以有效的提高自动驾驶车辆在自动驾驶中的安全性，避免自动驾驶车辆执行错误或不必要的控制指令导致安全事故的发生。

结合第一方面或上述可能的实施方式，在第一方面的第十种可能的实施方式中，粗粒度控制指令包括换道方向；

在根据第二行驶环境信息判断是否执行粗粒度控制指令之前，还包括：

基于自动驾驶车辆的行驶状态信息模拟自动驾驶车辆在换道方向的换道行驶路径；

第二行驶环境信息包括目标车辆与自动驾驶车辆在换道行驶路径行驶时的第二车辆距离，目标车辆表示自动驾驶车辆预设距离内与粗粒度控制指令对应的车辆；

当第二车辆距离大于安全距离时，判定执行粗粒度控制指令；

当第二车辆距离不大于安全距离时，判定不执行粗粒度控制指令。

本实现方式中，粗粒度控制指令包括换道方向时，可以先模拟出自动驾驶车辆的换道行驶路径，然后基于目标车辆与自动驾驶车辆在换道行驶路径行驶时的第二车辆距离对是否执行粗粒度控制指令进行判断，从而提高判断的准确性和自动驾驶车辆在自动驾驶中的安全性。

具体的，在上述实施例中，安全距离可以为：自动驾驶车辆以自动驾驶车辆的当前速度行驶、且目标车辆以目标车辆的当前速度行驶，在预设时间段内使自动驾驶车辆和目标车辆之间不接触的距离。

结合第一方面或上述可能的实施方式，在第一方面的第十一种可能的实施方式中，在基于行驶状态信息、第一行驶环境信息和控制指令决策模型，计算自动驾驶车辆的粗粒度控制指令之前，还包括：

初始化控制指令决策模型的模型参数；

获取训练参数，训练参数包括训练行驶状态信息和训练行驶环境信息；

根据模型参数和训练参数计算自动驾驶车辆的粗粒度训练控制指令；

依据粗粒度训练控制指令计算损失函数的值；

当损失函数的值未达到预设条件时，更新模型参数；

根据更新后的模型参数和训练参数计算自动驾驶车辆的更新粗粒度训练控制指令，并重新计算损失函数的值，直到损失函数的值达到预设条件；

将损失函数的值达到预设条件时对应的模型参数确定为控制指令决策模型的最终模型参数。

结合第一方面或上述可能的实施方式，在第一方面的第十二种可能的实施方式中，损失函数Loss1包括：

Loss1＝|vcosα-vsinα-Q|²，

其中，v表示自动驾驶车辆的当前速度，α表示自动驾驶车辆的当前行驶方向与自动驾驶车辆所在车道之间的夹角，Q表示粗粒度训练控制指令与训练参数对应预设粗粒度训练控制指令之间匹配的程度。

结合第一方面或上述可能的实施方式，在第一方面的第十三种可能的实施方式中，更新模型参数之前，还包括：

计算模型参数的更新梯度；

更新模型参数，包括：

基于更新梯度、预设更新系数和更新前的模型参数，计算更新后的模型参数。

结合第一方面或上述可能的实施方式，在第一方面的第十四种可能的实施方式中，在计算模型参数的更新梯度之前，还包括：

判断是否执行粗粒度训练控制指令；

计算模型参数的更新梯度，包括：

当判定执行粗粒度训练控制指令时，通过第一预设关系计算更新梯度，第一预设关系包括更新梯度等于第一损失函数对模型参数的偏导值，第一损失函数为Loss1＝|vcosα-vsinα-Q|²，其中，v表示自动驾驶车辆的当前速度，α表示自动驾驶车辆的当前行驶方向与自动驾驶车辆所在车道之间的夹角，Q表示粗粒度训练控制指令与训练参数对应预设粗粒度训练控制指令之间匹配的程度；

当判定不执行粗粒度训练控制指令时，通过第二预设关系计算更新梯度，第二预设关系包括更新梯度等于第二损失函数对模型参数的偏导值，第二损失函数为Loss2＝|vsinα-vcosα-Q|²。

第二方面，本发明实施例提供了一种车辆的控制装置，包括：

获取单元，用于在自动驾驶车辆处于自动驾驶状态时，获取自动驾驶车辆的行驶状态信息和自动驾驶车辆的第一行驶环境信息；

计算单元，用于基于行驶状态信息、第一行驶环境信息和控制指令决策模型，计算自动驾驶车辆的粗粒度控制指令，粗粒度控制指令用于控制自动驾驶车辆的行驶方式，控制指令决策模型为基于自动驾驶车辆在训练状态时的训练行驶状态信息和自动驾驶车辆在训练状态时的训练行驶环境信息训练得到的；

判断单元，用于根据第二行驶环境信息判断是否执行粗粒度控制指令，第二行驶环境信息包括在自动驾驶车辆处于自动驾驶状态时，与粗粒度控制指令对应的行驶环境信息；

确定单元，用于当判定执行粗粒度控制指令时，根据车道信息和自动驾驶车辆的行驶状态信息，确定与粗粒度控制指令对应的细粒度控制指令，细粒度控制指令用于控制自动驾驶车辆的行驶参数，车道信息包括自动驾驶车辆所行驶道路中粗粒度控制指令对应车道的信息；

输出单元，用于输出细粒度控制指令。

本发明实施例中，控制装置通过行驶状态信息、第一行驶环境信息和控制指令决策模型先计算出粗粒度控制指令，然后基于第二行驶环境信息来判定是否可以执行粗粒度控制指令，即在确定控制自动驾驶车辆的行驶参数之前，先计算出粗粒度控制指令计算出自动驾驶车辆的行驶方式，当判定可以执行粗粒度控制指令时，再将粗粒度控制指令转换为细粒度控制指令，从而能够避免在车辆自动控制时输出不必要或错误的控制指令，避免自动驾驶车辆出现不符合自然驾驶行为或发送安全事故；同时，本发明实施例中控制装置在判定可以执行粗粒度控制指令后，基于自动驾驶车辆的行驶状态信息和粗粒度控制指令对应的车道信息将粗粒度控制指令转换为细粒度控制指令，即充分考虑自动驾驶车辆行驶时的自身状况和车道信息确定出适合控制自动驾驶车辆的细粒度控制指令，提高细粒度控制指令的准确性和自动驾驶车辆控制的精确性，避免自动驾驶车辆出现不符合自然驾驶行为或发送安全事故，从降低自动驾驶的车辆的安全隐患，进一步提高自动驾驶车辆的安全性和舒适性。

结合第二方面，在第二方面的第一种可能的实施方式中，粗粒度控制指令包括直行；

确定单元具体用于基于预设期望速度和当前速度，确定细粒度控制指令。

本实施方式中，粗粒度控制指令包括直行时，控制装置不需要对自动驾驶车辆的方向盘转角进行控制，可以只控制自动驾驶车辆的行驶速度，所以根据自动驾驶车辆的当前的速度和自动驾驶车辆在直行车道的预设期望速度来对自动驾驶车辆来确定细粒度控制指令，提高细粒度控制指令的准确性和自动驾驶车辆控制的精确性，避免自动驾驶车辆出现左右摆动等不符合自然驾驶行为。

结合第二方面或上述可能的实施方式，在第二方面的第二种可能的实施方式中，细粒度控制指令包括自动驾驶车辆的油门大小；

确定单元具体用于：

当当前速度大于预设期望速度时，油门大小等于零；

本实施方式中，当前速度大于预设期望速度时，说明自动驾驶车辆的行驶速度过大，所以此时控制装置将油门大小确定为零，以便于尽快降低自动驾驶车辆的行驶速度；当前速度不大于预设期望速度时，说明自动驾驶车辆的行驶速度正常，此时控制装置基于预设期望速度和当前速度之间的差值和预设油门控制系数确定油门大小，以实现对油门的精确控制，保证自动驾驶车辆行驶的安全性。

结合第二方面或上述可能的实施方式，在第二方面的第三种可能的实施方式中，细粒度控制指令包括自动驾驶车辆的刹车力度；

确定单元具体用于：

当当前速度小于预设期望速度时，刹车力度等于零；

刹车力度＝预设刹车控制系数×(当前速度-预设期望速度)。

本实施方式中，当前速度小于预设期望速度时，说明自动驾驶车辆的行驶速度正常，此时控制装置可以不进行刹车，所以将刹车力度调整为零；当前速度不小于预设期望速度时，说明自动驾驶车辆的行驶速度过大，此时控制装置需要通过刹车来控制自动驾驶车辆的速度，所以基于预设期望速度和当前速度之间的差值和预设刹车控制系数确定刹车力度，以实现对刹车的精确控制，保证自动驾驶车辆行驶的安全性。

结合第二方面或上述可能的实施方式，在第二方面的第四种可能的实施方式中，粗粒度控制指令包括换道方向；

确定单元具体用于：

本实施方式中，粗粒度控制指令包括换道方向时，控制装置控制自动驾驶车辆向换道方向侧进行换道，此时首先模拟出自动驾驶车辆的换道行驶路径，即在自动驾驶车辆实际进行换道之前，先确定出换道路径，然后再基于预先确定的换道路径和车道信息确定自动驾驶车辆在换道时的细粒度控制指令，从而提高细粒度控制指令的准确性和自动驾驶车辆控制的精确性，进而提高自动驾驶车辆换道时的安全性。

结合第二方面或上述可能的实施方式，在第二方面的第五种可能的实施方式中，细粒度控制指令包括方向盘转角；

确定单元具体用于：

本实施方式中，由于自动驾驶车辆的换道行驶路径为曲线，控制装置需要对自动驾驶车辆的方向盘转角进行控制，所以基于预先模拟的换道行驶路径可以确定出自动驾驶车辆在换道时需要转向的位置和转向角度，然后在结合换道行驶路径中各转向角度对应车道的信息确定出方向盘在对应各转向角度时的转角，即确定出自动驾驶车辆在换道时方向盘需要转动的角度，从而实现对方向盘的精确控制，保证自动驾驶车辆行驶的安全性。

结合第二方面或上述可能的实施方式，在第二方面的第六种可能的实施方式中，细粒度控制指令还包括自动驾驶车辆的油门大小；

车道信息还包括换道行驶路径对应车道的预设期望速度；

确定单元具体用于：

当当前速度大于目标预设期望速度时，油门大小等于零；

本实施方式中，在自动驾驶车辆换道时，控制装置还可以对行驶速度进行控制。在当前速度大于目标预设期望速度时，将油门大小确定为零，以便于尽快降低自动驾驶车辆的行驶速度；当前速度不大于目标预设期望速度时，基于目标预设期望速度和当前速度之间的差值和预设油门控制系数确定油门大小，以实现对油门的精确控制，同时保证自动驾驶车辆行驶的安全性。

结合第二方面或上述可能的实施方式，在第二方面的第七种可能的实施方式中，细粒度控制指令还包括自动驾驶车辆的刹车力度；

车道信息还包括换道行驶路径对应车道的预设期望速度；

确定单元具体用于：

当当前速度小于目标预设期望速度时，刹车力度等于零；

本实施方式中，在自动驾驶车辆换道时，控制装置还可以对行驶速度进行控制。当前速度小于目标预设期望速度时，可以不进行刹车，所以将刹车力度调整为零；当前速度不小于目标预设期望速度时，需要通过刹车来控制自动驾驶车辆的速度，所以基于目标预设期望速度和当前速度之间的差值和预设刹车控制系数确定刹车力度，以实现对刹车的精确控制，保证自动驾驶车辆行驶的安全性。

结合第二方面或上述可能的实施方式，在第二方面的第八种可能的实施方式中，第一行驶环境信息包括自动驾驶车辆所行驶车道的车道信息，自动驾驶车辆预设距离内车辆的信息，自动驾驶车辆预设距离内路面的信息中至少一项；

结合第二方面或上述可能的实施方式，在第二方面的第九种可能的实施方式中，第二行驶环境信息包括目标车辆与自动驾驶车辆之间的第一车辆距离，目标车辆表示自动驾驶车辆预设距离内与粗粒度控制指令对应的车辆；

判断单元具体用于：

本实施方式中，在计算出粗粒度控制指令后，从安全角度出发，控制装置可以通过判断自动驾驶车辆预设距离内与粗粒度控制指令对应的车辆是否会影响自动驾驶车辆的安全来确定是否执行粗粒度控制指令，即判断目标车辆与自动驾驶车辆之间的第一车辆距离是否达到安全距离。通过对第一车辆距离和安全距离之间大小的判断，在第一车辆距离未达到安全距离时不执行粗粒度控制指令，在第一车辆距离达到安全距离时才执行粗粒度控制指令，可以有效的提高自动驾驶车辆在自动驾驶中的安全性，避免自动驾驶车辆执行错误或不必要的控制指令导致安全事故的发生。

结合第二方面或上述可能的实施方式，在第二方面的第十种可能的实施方式中，粗粒度控制指令包括换道方向；装置还包括：

模拟单元，用于基于自动驾驶车辆的行驶状态信息模拟自动驾驶车辆在换道方向的换道行驶路径；

判断单元具体用于：

本实施方式中，粗粒度控制指令包括换道方向时，控制装置可以先模拟出自动驾驶车辆的换道行驶路径，然后基于目标车辆与自动驾驶车辆在换道行驶路径行驶时的第二车辆距离对是否执行粗粒度控制指令进行判断，从而提高判断的准确性和自动驾驶车辆在自动驾驶中的安全性。

结合第二方面或上述可能的实施方式，在第二方面的第十一种可能的实施方式中，还包括：

初始化单元，用于初始化控制指令决策模型的模型参数；

获取单元还用于获取训练参数，训练参数包括训练行驶状态信息和训练行驶环境信息；

计算单元还用于根据模型参数和训练参数计算自动驾驶车辆的粗粒度训练控制指令；以及，用于依据粗粒度训练控制指令计算损失函数的值；

装置还包括：

更新单元，用于当损失函数的值未达到预设条件时，更新模型参数；

计算单元，还用于根据更新后的模型参数和训练参数计算自动驾驶车辆的更新粗粒度训练控制指令，并重新计算损失函数的值，直到损失函数的值达到预设条件；

确定单元还用于将损失函数的值达到预设条件时对应的模型参数确定为控制指令决策模型的最终模型参数。

结合第二方面或上述可能的实施方式，在第二方面的第十二种可能的实施方式中，损失函数Loss1包括：

Loss1＝|vcosα-vsinα-Q|²，

结合第二方面或上述可能的实施方式，在第二方面的第十三种可能的实施方式中，计算单元还用于计算模型参数的更新梯度；

更新单元具体用于基于更新梯度、预设更新系数和更新前的模型参数，计算更新后的模型参数。

结合第二方面或上述可能的实施方式，在第二方面的第十四种可能的实施方式中，判断单元还用于判断是否执行粗粒度训练控制指令；

计算单元具体用于：

第三方面，本发明实施例提供了一种车辆的控制设备，包括：

存储器、处理器和总线；

存储器和处理器通过总线连接并完成相互间的通信；

存储器用于存储程序代码；

处理器通过读取存储器中存储的可执行程序代码来运行与可执行程序代码对应的程序，以用于执行如第一方面所述的方法。

第四方面，本发明实施例提供一种计算机可读存储介质，计算机可读存储介质中存储有指令，当其在计算机上运行时，使得计算机执行第一方面所述的方法。

第五方面，本发明实施例提供了一种包含指令的计算机程序产品，当其在计算机上运行时，使得计算机执行第一方面所述的方法。

第六方面，本发明实施例提供一种计算机程序，当其在计算机上运行时，使得计算机执行第一方面所述的方法。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对本发明实施例中所需要使用的附图作简单地介绍。

图1是根据本发明一实施例提供的车辆的控制方法的示意性流程图；

图2是根据本发明一实施例中一种确定细粒度控制指令的方法的示意性流程图；

图3是根据本发明一实施例中又一种确定细粒度控制指令的方法的示意性流程图；

图4是根据本发明一实施例的车辆的控制装置的示意性框图；

图5是根据本发明又一实施例的车辆的控制装置的示意性框图；

图6是根据本发明一实施例的车辆的控制设备的示意性框图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述。

本发明实施例适用于对车辆进行自动驾驶控制的场景。本发明实施例中对自动驾驶车辆进行控制可以为控制决策系统，控制决策系统可以分为两部分，分别为强化学习层和运动轨迹安全控制层。强化学习层可以通过行驶策略决策模型，再根据获取的自动驾驶车辆相关的信息计算出粗粒度控制指令，然后将粗粒度控制指令传输给运动轨迹安全控制层；运动轨迹安全控制层可以从行驶安全角度对是否执行粗粒度控制指令进行判断，当判定执行粗粒度控制指令时，将粗粒度控制指令转换为细粒度控制指令，即控制自动驾驶车辆行驶的具体行驶参数，并输出细粒度控制指令至车辆的控制系统，以实现对车辆的自动驾驶控制。

图1示出了根据本发明一实施例的车辆的控制方法的示意性流程图。如图1所示，该方法包括以下步骤101-105。

101，在自动驾驶车辆处于自动驾驶状态时，获取自动驾驶车辆的行驶状态信息和自动驾驶车辆的第一行驶环境信息。

其中，在自动驾驶车辆处于自动驾驶状态时，可以实时获取自动驾驶车辆的行驶状态信息和第一行驶环境信息，然后基于获取的行驶状态信息和第一行驶环境信息来计算自动驾驶车辆的粗粒度控制指令。

本发明实施例中，第一行驶环境信息可以包括自动驾驶车辆所行驶车道的车道信息，自动驾驶车辆预设距离内车辆的信息，自动驾驶车辆预设距离内路面的信息中至少一项。车道信息可以包括车道的最高限速和车道的宽度等等，车辆的信息可以包括车辆数量、车辆行驶方向以及车辆与自动驾驶车辆之间的距离等等，路面的信息可以包括路面上隔离设施的信息和路面上障碍物的信息等等。自动驾驶车辆的行驶状态信息可以包括自动驾驶车辆的位置、自动驾驶车辆的速度、自动驾驶车辆的行驶方向和自动驾驶车辆与其所行驶车道的夹角等等。

需要说明的是，本步骤中对获取行驶状态信息和第一行驶环境信息的方式不做限定，可以包括各类传感器，如激光雷达、超声波雷达、毫米波雷达等，车载摄像头，全球定位系统(Global Positioning System，GPS)，地图，自动驾驶车辆的车载诊断系统(OBD)数据等等。

102，基于行驶状态信息、第一行驶环境信息和控制指令决策模型，计算自动驾驶车辆的粗粒度控制指令。

其中，粗粒度控制指令用于控制自动驾驶车辆的行驶方式，控制指令决策模型为基于自动驾驶车辆在训练状态时的训练行驶状态信息和自动驾驶车辆在训练状态时的训练行驶环境信息训练得到的。

本发明实施例中，行驶方式可以包括直行、换道、掉头、转弯等等，粗粒度控制指令可以包括直行或换道，在粗粒度控制指令包括换道时，还可以包括换道方向。控制指令决策模型为预先训练得出的，其在训练时将训练行驶状态信息和训练行驶环境信息作为输入。

103，根据第二行驶环境信息判断是否执行粗粒度控制指令。

其中，第二行驶环境信息包括在自动驾驶车辆处于自动驾驶状态时，与粗粒度控制指令对应的行驶环境信息。本步骤中判断步骤102计算的粗粒度控制指令是否可以执行主要参考自动驾驶车辆行驶时的安全因素，来避免自动驾驶车辆执行步骤102计算的错误或必要的粗粒度控制指令。

由于步骤102计算出粗粒度控制指令后，已经确定自动驾驶车辆的行驶方式，所以在本步骤判断是否执行粗粒度控制指令时，只需要根据对粗粒度控制指令执行有影响的行驶环境信息进行判断即可，所以本步骤中基于与粗粒度控制指令对应的行驶环境信息来判断是否执行粗粒度控制指令。

具体的，当粗粒度控制指令包括直行时，与粗粒度控制指令对应的行驶环境信息可以包括自动驾驶车辆前方预设范围内的行驶环境信息；当粗粒度控制指令包括换道方向时，与粗粒度控制指令对应的行驶环境信息可以包括自动驾驶车辆在换道方向一侧预设范围内的行驶环境信息。

本发明实施例中，第二行驶环境信息可以包括自动驾驶车辆所行驶车道中与粗粒度控制指令对应的车道信息，自动驾驶车辆预设距离内与粗粒度控制指令对应的车辆信息，自动驾驶车辆预设距离内与粗粒度控制指令对应的路面信息中至少一项。车道信息可以包括车道的最高限速和车道的宽度等等，车辆的信息可以包括车辆数量、车辆行驶方向和车辆与自动驾驶车辆之间的距离等等，路面的信息可以包括路面上隔离设施的信息和路面上障碍物的信息等等。

需要说明的是，本步骤中第二行驶环境信息可以实时进行获取，也可以从步骤101获取的第一行驶环境信息中确定。

104，当判定执行粗粒度控制指令时，根据车道信息和自动驾驶车辆的行驶状态信息，确定与粗粒度控制指令对应的细粒度控制指令。

其中，细粒度控制指令可以为用于控制自动驾驶车辆的行驶参数，可以包括方向盘转角、油门大小和刹车力度等等。车道信息可以包括自动驾驶车辆所行驶道路中粗粒度控制指令对应车道的信息，自动驾驶车辆所行驶道路包括自动驾驶车辆所行驶的车道和自动驾驶车辆允许换道的车道，自动驾驶车辆所行驶道路中粗粒度控制指令对应车道可以表示自动驾驶车辆在执行粗粒度控制指令所要行驶的车道。例如，粗粒度控制指令包括直行时，自动驾驶车辆所行驶道路中粗粒度控制指令对应车道可以为自动驾驶车辆直行时所行驶车道；粗粒度控制指令包括换道方向时，自动驾驶车辆所行驶道路中粗粒度控制指令对应车道可以为自动驾驶车辆在换道时所行驶的车道。

需要说明的是，本步骤中车道信息和自动驾驶车辆的行驶状态信息可以实时进行获取，也可以从步骤101获取的行驶状态信息和第一行驶环境信息中确定。

105，输出细粒度控制指令。

其中，本步骤中将步骤104确定的细粒度控制指令输出，实现对自动驾驶车辆相应的部件进行控制，从而达到车辆自动驾驶的目的。

图2是根据本发明一实施例中一种确定细粒度控制指令的方法的示意性流程图。

在本发明实施例的一种实施方式中，步骤102计算出的粗粒度控制指令可以包括直行，此时步骤104中车道信息包括自动驾驶车辆直行时所行驶车道的预设期望速度，自动驾驶车辆的行驶状态信息包括自动驾驶车辆的当前速度；则当判定执行粗粒度控制指令时，如图2所示，步骤104可以具体执行为步骤1041。

1041，基于预设期望速度和当前速度，确定细粒度控制指令。

其中，由于粗粒度控制指令为直行，所以不需要对自动驾驶车辆的方向盘转角进行控制，方向盘可以保持当前状态不进行调整，此时可以控制自动驾驶车辆的行驶速度。

本发明实施例中，自动驾驶车辆在行驶时可以针对不同的行驶车道预设对应的期望速度，为了符合车辆行驶规则和保证行驶安全，预设期望速度不能大于车道的最高限速。本步骤中基于自动驾驶车辆的当前速度和其直行时所行驶车道的预设期望速度来对自动驾驶车辆的速度进行控制，即计算细粒度控制指令，使其能够安全行驶。

对车辆行驶速度进行控制通常通过控制车辆的油门或刹车来实现。

具体的，本发明实施例中，细粒度控制指令可以包括自动驾驶车辆的油门大小。

在确定油门大小时，需要首先判定自动驾驶车辆的当前速度和其直行时所行驶车道的预设期望速度之间的大小关系。在当前速度大于预设期望速度时，说明自动驾驶车辆的行驶速度过大，所以此时油门可以设置为最小状态，将油门大小确定为零，以便于尽快降低自动驾驶车辆的行驶速度；在当前速度不大于预设期望速度时，说明自动驾驶车辆的行驶速度正常，此时基于预设期望速度和当前速度之间的差值和预设油门控制系数确定油门大小以实现对油门的精确控制，保证自动驾驶车辆行驶的安全性。在当前速度不大于预设期望速度时，可以基于第一预设公式计算自动驾驶车辆的油门大小，其中，第一预设公式如公式1所示。

油门大小＝预设油门控制系数×(预设期望速度-当前速度+预设值) (1)

其中，在公式1中，预设期望速度表示自动驾驶车辆直行时所行驶车道的预设期望速度，当自动驾驶车辆直行时所行驶车道的预设期望速度为自动驾驶车辆直行时所行驶车道的最高限速时，公式1中预设期望速度可以替换为最高限速的值。公式1中当前速度表示自动驾驶车辆的当前速度。

需要说明的是，通过上述公式1可以计算出自动驾驶车辆油门大小，通常情况下，设置油门大小为1时表示油门最大状态，油门大小为0时表示油门最小的状态，所以油门大小的取值范围可以为大于等于0且小于等于1。预设值可以根据实际应用场景和车辆的具体性能来取值，通常情况下，预设值可以等于1。

具体的，本发明实施例中，细粒度控制指令可以包括自动驾驶车辆的刹车力度。

在确定刹车力度时，需要首先判定自动驾驶车辆的当前速度和其直行时所行驶车道的预设期望速度之间的大小关系。当前速度小于预设期望速度时，说明自动驾驶车辆的行驶速度正常，此时自动驾驶车辆可以不进行刹车，所以刹车可以设置为最小状态，即刹车力度确定为零；当前速度不小于预设期望速度时，说明自动驾驶车辆的行驶速度过大，此时需要通过刹车来降低自动驾驶车辆的速度，所以基于预设期望速度和当前速度之间的差值和预设刹车控制系数确定刹车力度，以实现对刹车的精确控制，保证自动驾驶车辆行驶的安全性。在当前速度不小于预设期望速度时，可以基于第二预设公式计算自动驾驶车辆的刹车力度，其中，第二预设公式如公式2所示。

刹车力度＝预设刹车控制系数×(当前速度-预设期望速度) (2)

其中，在公式2中，预设期望速度表示自动驾驶车辆直行时所行驶车道的预设期望速度，当自动驾驶车辆直行时所行驶车道的预设期望速度为自动驾驶车辆直行时所行驶车道的最高限速时，公式2中预设期望速度可以替换为最高限速的值。公式2中当前速度表示自动驾驶车辆的当前速度。

需要说明的是，通过上述公式2可以计算出自动驾驶车辆的刹车力度，通常情况下，设置刹车力度为1时表示刹车力度的最大状态，刹车力度为0时表示刹车力度最小的状态，所以刹车力度的取值范围可以为大于等于0且小于等于1的数值。

需要说明的是，公式1中预设油门控制系数和公式2中预设刹车控制系数可以根据自动驾驶车辆的性能进行确定，不同品牌和型号的车辆，其对应的预设油门控制系数和预设刹车控制系数均可以不同，例如，预设刹车控制系数可以为0.1，预设油门控制系数可以为0.2。

本发明实施例中，粗粒度控制指令包括直行时，不需要对自动驾驶车辆的方向盘转角进行控制，可以只控制自动驾驶车辆的行驶速度，所以根据自动驾驶车辆的当前的速度和自动驾驶车辆在直行车道的预设期望速度来对自动驾驶车辆来确定细粒度控制指令，提高细粒度控制指令的准确性和自动驾驶车辆控制的精确性，避免自动驾驶车辆出现左右摆动等不符合自然驾驶行为。

图3是根据本发明一实施例中又一种确定细粒度控制指令的方法的示意性流程图。

在本发明实施例的又一种实施方式中，步骤102计算出的粗粒度控制指令可以包括换道方向，此时当判定执行粗粒度控制指令时，如图3所示，步骤104可以具体执行为步骤1042和步骤1043。

1042，基于自动驾驶车辆的行驶状态信息，模拟自动驾驶车辆在换道方向的换道行驶路径。

其中，模拟换道行驶路径的实现方式不做限定。

1043，根据换道行驶路径和车道信息，确定自动驾驶车辆的细粒度控制指令。

本发明实施例中，在粗粒度控制指令包括换道方向时，说明自动驾驶车辆需要在换道方向对应一侧进行换道，此时首先模拟出自动驾驶车辆的换道行驶路径，即在自动驾驶车辆实际进行换道之前，先确定出换道路径，然后再基于预先确定的换道路径和车道信息确定自动驾驶车辆在换道时的细粒度控制指令，从而提高细粒度控制指令的准确性和自动驾驶车辆控制的精确性，进而提高自动驾驶车辆换道时的安全性。

具体的，本发明实施例中，细粒度控制指令可以包括自动驾驶车辆的方向盘转角。此时步骤1043中车道信息包括换道行驶路径对应车道的车道宽度和换道行驶路径对应车道的车道中线；步骤1043可以具体执行为：确定在换道行驶路径中自动驾驶车辆行驶方向与自动驾驶车辆当前所在车道直行方向之间至少一个转向角度；在换道行驶路径中，根据换道行驶路径对应车道的车道宽度确定自动驾驶车辆在转向角度对应位置的所属车道的目标车道宽度；在换道行驶路径中，根据换道行驶路径对应车道的车道中线确定自动驾驶车辆在转向角度对应位置与所属车道的车道中线之间的目标距离；基于第三预设公式、转向角度、目标车道宽度和目标距离计算方向盘转角，其中，第三预设公式如公式3所示。

其中，模拟出的换道行驶路径为一段自动驾驶车辆换道行驶的曲线路径，本发明实施例中，为了便于对自动驾驶车辆的控制，可以将换道行驶路径中自动驾驶车辆的连续行驶过程离散为至少一个时间点，并计算自动驾驶车辆在这些时间点的细粒度控制指令，以此种方式来实现对自动驾驶车辆整个换道行驶过程的控制。所以针对将换道行驶路径离散后的时间点可以确定出自动驾驶车辆在换道行驶路径的至少一个位置，进而可以模拟出在换道行驶中自动驾驶车辆行驶方向与自动驾驶车辆当前所在车道直行方向之间的至少一个转向角度，即确定出在换道行驶路径中自动驾驶车辆行驶方向与自动驾驶车辆当前所在车道直行方向之间至少一个转向角度。

在确定出各转向角度后，需要将这些转向角度转换为自动驾驶车辆的方向盘转角。针对至少一个转向角度中每个转向角度，可以确定出此转向角度对应换道行驶路径中的位置，即对应此转向角度时自动驾驶车辆在换道行驶路径中的位置，进而确定出自动驾驶车辆在换道行驶路径中位置所属的车道，以及自动驾驶车辆在换道行驶路径中位置所属车道的目标车道宽度。同样的，针对至少一个转向角度中每个转向角度，可以根据换道行驶路径对应车道的车道中线，确定出自动驾驶车辆在换道行驶路径中转向角度对应位置所属车道的车道中线与自动驾驶车辆在换道行驶路径中转向角度对应位置之间的目标距离。在针对至少一个转向角度中每个转向角度，确定出对应的目标车道宽度和目标距离后，再根据公式3即可进行计算出转向角度对应的方向盘转角。

方向盘转角＝[转向角度-目标距离/(目标车道宽度×第一转角系数)]×第二转角系数

(3)

其中，在公式3中，转向角度表示自动驾驶车辆行驶方向与自动驾驶车辆直行方向之间的角度，目标距离表示自动驾驶车辆在换道行驶路径中转向角度对应位置与自动驾驶车辆在换道行驶路径中转向角度对应位置所属车道的车道中线之间的距离，目标车道宽度表示自动驾驶车辆在换道行驶路径中转向角度对应位置的所属车道的目标车道宽度。

需要说明的是，在公式3中第一转角系数和第二转角系数可以根据自动驾驶车辆的性能进行确定，不同品牌和型号的车辆，其对应的第一转角系数和第二转角系数均可以不同，例如，第一转角系数可以取值为0.541，第一转角系数可以取值为0.4。本发明实施例中，可以设置方向盘在向一侧转动最大角度时方向盘转角的取值为-1，方向盘在向另一侧转动最大角度时方向盘转角的取值为1，则方向盘转角的范围可以为大于等于-1且小于等于1。

本发明实施例中，由于自动驾驶车辆的换道行驶路径为曲线，需要对自动驾驶车辆的方向盘转角进行控制，所以基于预先模拟的换道行驶路径可以确定出自动驾驶车辆在换道时需要转向的位置和转向角度，然后在结合换道行驶路径中各转向角度对应车道的信息确定出方向盘在对应各转向角度时的转角，即确定出自动驾驶车辆在换道时方向盘需要转动的角度，从而实现对方向盘的精确控制，保证自动驾驶车辆行驶的安全性。

本发明实施例中，在确定出自动驾驶车辆换道过程中方向盘转角后，还可以对自动驾驶车辆的行驶速度进行控制。在上述步骤1043执行过程中，为了便于对自动驾驶车辆的控制，将换道行驶路径中自动驾驶车辆的连续行驶过程离散为至少一个时间点，并确定出至少一个转向角度。本发明实施例中，可以通过确定自动驾驶车辆在换道行驶路径中对应至少一个转向角度中每个转向角度的速度，对进行自动驾驶车辆的行驶速度进行控制。

具体的，细粒度控制指令还包括自动驾驶车辆的油门大小。此时步骤104中车道信息还可以包括换道行驶路径对应车道的预设期望速度。

上述步骤1043的执行过程中，在确定出至少一个转向角度之后，还可以执行如下过程：在换道行驶路径中，基于自动驾驶车辆的行驶状态信息确定自动驾驶车辆在转向角度对应位置的当前速度；在换道行驶路径中，根据换道行驶路径对应车道的预设期望速度确定自动驾驶车辆在转向角度对应位置所属车道的目标预设期望速度；当当前速度大于目标预设期望速度时，油门大小等于零；当当前速度不大于目标预设期望速度时，基于第四预设公式计算自动驾驶车辆在转向角度对应位置的油门大小。

其中，本发明实施例中，对至少一个转向角度中每个转向角度均可以确定对应的油门大小。首先确定出在换道行驶路径中，自动驾驶车辆在转向角度对应位置的当前速度和自动驾驶车辆在转向角度对应位置所属车道的目标预设期望速度，根据公式4进行计算即可确定油门大小。

油门大小＝预设油门控制系数×(目标预设期望速度-当前速度+预设值) (4)

其中，公式4中目标预设期望速度表示自动驾驶车辆在换道行驶路径中转向角度对应位置所属车道的目标预设期望速度，当目标预设期望速度为自动驾驶车辆在换道行驶路径中转向角度对应位置所属车道的最高限速时，公式4中目标预设期望速度可以替换为最高限速的值。公式4中当前速度表示自动驾驶车辆在换道行驶路径中转向角度对应位置的当前速度。

本发明实施例中，在自动驾驶车辆换道时，还可以对行驶速度进行控制。在当前速度大于目标预设期望速度时，将油门大小确定为零，以便于尽快降低自动驾驶车辆的行驶速度；当前速度不大于目标预设期望速度时，基于目标预设期望速度和当前速度之间的差值和预设油门控制系数确定油门大小，以实现对油门的精确控制，同时保证自动驾驶车辆行驶的安全性。

具体的，细粒度控制指令还可以包括自动驾驶车辆的刹车力度。此时步骤104中车道信息还可以包括换道行驶路径对应车道的预设期望速度。

在上述步骤1043的执行过程中，在确定出至少一个转向角度之后，还可以执行如下过程：在换道行驶路径中，基于自动驾驶车辆的行驶状态信息确定自动驾驶车辆在转向角度对应位置的当前速度；在换道行驶路径中，根据换道行驶路径对应车道的预设期望速度确定自动驾驶车辆在转向角度对应位置所属车道的目标预设期望速度；当当前速度小于目标预设期望速度时，刹车力度等于零；当当前速度不小于目标预设期望速度时，基于第五预设公式计算自动驾驶车辆在转向角度对应位置的刹车力度。

其中，本发明实施例中，对至少一个转向角度中每个转向角度均可以确定对应的刹车力度。首先确定出在换道行驶路径中，自动驾驶车辆在转向角度对应位置的当前速度和自动驾驶车辆在转向角度对应位置所属车道的目标预设期望速度，根据公式5进行计算即可确定刹车力度。

刹车力度＝预设刹车控制系数×(当前速度-目标预设期望速度) (5)

其中，公式5中目标预设期望速度表示自动驾驶车辆在换道行驶路径中转向角度对应位置所属车道的目标预设期望速度，当目标预设期望速度为自动驾驶车辆在换道行驶路径中转向角度对应位置所属车道的最高限速时，公式5中目标预设期望速度可以替换为最高限速的值。公式5中当前速度表示自动驾驶车辆在换道行驶路径中转向角度对应位置的当前速度。

本发明实施例中，在自动驾驶车辆换道时，还可以对行驶速度进行控制。当前速度小于目标预设期望速度时，可以不进行刹车，所以将刹车力度调整为零；当前速度不小于目标预设期望速度时，需要通过刹车来控制自动驾驶车辆的速度，所以基于目标预设期望速度和当前速度之间的差值和预设刹车控制系数确定刹车力度，以实现对刹车的精确控制，保证自动驾驶车辆行驶的安全性。

需要说明的是，公式4中油门大小、预设油门控制系数和预设值的取值方式与公式1中油门大小、预设油门控制系数和预设值的取值方式相同。公式5中刹车力度和预设刹车控制系数的取值方式与公式2中油门大小和预设刹车控制系数的取值方式相同。

作为本发明实施例中又一种可选的实施方式，第二行驶环境信息可以包括目标车辆与自动驾驶车辆之间的第一车辆距离，目标车辆表示自动驾驶车辆预设距离内与粗粒度控制指令对应的车辆。此时步骤103可以具体执行为：当第一车辆距离大于安全距离时，判定执行粗粒度控制指令；当第一车辆距离不大于安全距离时，判定不执行粗粒度控制指令。

其中，当粗粒度控制指令包括直行时，目标车辆表示自动驾驶车辆前方预设距离内的车辆；当粗粒度控制指令包括换道方向时，目标车辆表示自动驾驶车辆在换道方向一侧预设距离内的车辆。如果自动驾驶车辆预设距离内与粗粒度控制指令对应的车辆为零，即自动驾驶车辆预设距离内不存在与粗粒度控制指令对应的车辆，则可以将第一车辆距离确定为无限大。

需要说明的是，当第一车辆距离小于或等于预设安全距离时，可以判定不执行粗粒度控制指令，此时自动驾驶车辆可以丢弃粗粒度控制指令，保持当前的驾驶状态。在粗粒度控制指令包括直行时，如果判定不执行粗粒度控制指令，也可以执行本发明实施例中步骤1041中所述的处理过程，以便于对自动驾驶车辆实时进行行驶速度的控制。在本发明实施例中，还可以通过其他信息判断是否执行粗粒度控制指令，本发明实施例不做限定。

本发明实施例中，安全距离可以为：自动驾驶车辆以自动驾驶车辆的当前速度行驶、且目标车辆以目标车辆的当前速度行驶，在预设时间段内使自动驾驶车辆和目标车辆之间不接触的距离。即安全距离需要保证自动驾驶车辆以自动驾驶车辆的当前速度行驶预设时间段，同时目标车辆以目标车辆的当前速度行驶相同的预设时间段，在此行驶过程中自动驾驶车辆和目标车辆不会发生碰撞。

本发明实施例中，在计算出粗粒度控制指令后，从安全角度出发，可以通过判断自动驾驶车辆预设距离内与粗粒度控制指令对应的车辆是否会影响自动驾驶车辆的安全来确定是否执行粗粒度控制指令，即判断目标车辆与自动驾驶车辆之间的第一车辆距离是否达到安全距离。通过对第一车辆距离和安全距离之间大小的判断，在第一车辆距离未达到安全距离时不执行粗粒度控制指令，在第一车辆距离达到安全距离时才执行粗粒度控制指令，可以有效的提高自动驾驶车辆在自动驾驶中的安全性，避免自动驾驶车辆执行错误或不必要的控制指令导致安全事故的发生。

作为本发明实施例中又一种可选的实施方式，当粗粒度控制指令包括换道方向时，在步骤103之前还可以执行步骤106：基于自动驾驶车辆的行驶状态信息模拟自动驾驶车辆在换道方向的换道行驶路径。此时第二行驶环境信息包括目标车辆与自动驾驶车辆在换道行驶路径行驶时的第二车辆距离，目标车辆表示自动驾驶车辆预设距离内与粗粒度控制指令对应的车辆。则步骤103可以具体执行为当第二车辆距离大于安全距离时，判定执行粗粒度控制指令；当第二车辆距离不大于安全距离时，判定不执行粗粒度控制指令。

其中，当粗粒度控制指令包括换道方向时，目标车辆表示自动驾驶车辆在换道方向一侧预设距离内的车辆。如果自动驾驶车辆预设距离内与粗粒度控制指令对应的车辆为零，即自动驾驶车辆预设距离内不存在与粗粒度控制指令对应的车辆，则可以将第二车辆距离确定为无限大。

需要说明的是，当第二车辆距离小于或等于预设安全距离时，可以判定不执行粗粒度控制指令，此时自动驾驶车辆可以丢弃粗粒度控制指令，保持当前的驾驶状态。在本发明实施例中，还可以通过其他信息判断是否执行粗粒度控制指令，本发明实施例不做限定。

本发明实施例中，粗粒度控制指令包括换道方向时，可以先模拟出自动驾驶车辆的换道行驶路径，然后基于目标车辆与自动驾驶车辆在换道行驶路径行驶时的第二车辆距离对是否执行粗粒度控制指令进行判断，从而提高判断的准确性和自动驾驶车辆在自动驾驶中的安全性。

作为本发明实施例中又一种可选的实施方式，在执行步骤102之前，本发明实施例还包括对控制指令决策模型进行训练的过程。具体可以包括如下步骤。

A、初始化控制指令决策模型的模型参数。

其中，在开始对控制指令决策模型进行训练时，需要对控制指令决策模型的模型参数进行初始化。初始化方式可以为随机生成。

B、获取训练参数。

其中，训练参数包括训练行驶状态信息和训练行驶环境信息，即为自动驾驶车辆在训练状态时的训练行驶状态信息和所述自动驾驶车辆在训练状态时的训练行驶环境信息。训练行驶状态信息与步骤101中行驶状态信息包括的内容可以相同，不同之处在于，训练行驶状态信息为自动驾驶车辆在训练状态时获取的，行驶状态信息为自动驾驶车辆在自动驾驶状态时获取的。训练行驶环境信息与步骤101中行驶环境信息包括的内容可以相同，不同之处在于，训练行驶环境信息为自动驾驶车辆在训练状态时获取的，行驶环境信息为自动驾驶车辆在自动驾驶状态时获取的。

C、根据模型参数和训练参数计算自动驾驶车辆的粗粒度训练控制指令。

其中，此时模型参数在训练过程中需要不断更新，直到达到控制指令决策模型的精度或准确度需求，模型参数的更新方式通过计算出粗粒度训练控制指令是否满足要求来确定的。

D、依据粗粒度训练控制指令计算损失函数的值。

其中，损失函数Loss1可以如公式6所示。

Loss1＝|vcosα-vsinα-Q|² (6)

其中，v表示自动驾驶车辆的当前速度，_α表示自动驾驶车辆的当前行驶方向与自动驾驶车辆所在车道之间的夹角，Q表示粗粒度训练控制指令与训练参数对应预设粗粒度训练控制指令之间匹配的程度。

需要说明的是，v表示自动驾驶车辆在训练状态下的行驶速度。

E、当损失函数的值未达到预设条件时，更新模型参数。

其中，本发明实施例中通过计算的损失函数的值与预设条件比较来确定控制指令决策模型中模型参数是否已经满足需求，即控制指令决策模型是否训练完成。当损失函数的值未达到预设条件时，表示模型参数还未满足需求，所以需要更新模型参数，继续对控制指令决策模型进行训练。

需要说明的是，预设条件可以根据模型参数的需求，或控制指令决策模型需要达到的标准来确定。本发明实施例中，预设条件可以包括损失函数的值连续处于预设范围内的次数达到预设门限。

F、根据更新后的模型参数和训练参数计算自动驾驶车辆的更新粗粒度训练控制指令，并重新计算损失函数的值，直到损失函数的值达到预设条件。

其中，在更新模型参数后，可以根据更新模型参数重新执行步骤C，得出更新粗粒度训练控制指令，进而执行步骤D计算出新的损失函数值，再将新的损失函数值与预设条件进行比较，当新的损失函数的值未达到预设条件时，再执行步骤E、F，即如此循环执行，直到步骤D计算出的损失函数的值达到预设条件。

G、将损失函数的值达到预设条件时对应的模型参数，确定为控制指令决策模型的最终模型参数。

其中，本步骤中判定计算出的损失函数的值已经达到预设条件，表示模型参数能够满足需求，控制指令决策模型训练完成，此时损失函数的值达到预设条件时对应的模型参数即为控制指令决策模型训练完成后得出的模型参数。

需要说明的是，控制指令决策模型可以为神经网络模型，其训练控制指令决策模型的算法可以为演员-评论家强化学习算法。行驶策略决策模型为演员网络，而Q的值通过评论家网络来计算。评论家网络也可以为神经网络模型，输入为步骤B获取的训练参数和步骤C计算的粗粒度训练控制指令，输出为Q值，评论家网络的参数在步骤A中进行初始化，在每次步骤E更新模型参数后对评论家网络中参数进行更新，更新的方式不做限定，可以采用反向传播算法实现。

在本发明实施例的一种可选的实施方式中，在步骤E更新模型参数之前，还需要计算模型参数的更新梯度。此时在计算出更新梯度后，可以基于更新梯度、预设更新系数和更新前的模型参数，计算更新后的模型参数。

具体的，可以根据公式7计算更新后的模型参数。

其中，θ表示更新后的模型参数，θ1表示更新前的模型参数，β表示预设更新系数，

表示更新梯度。

具体的，在上述计算模型参数的更新梯度的过程中，在计算模型参数的更新梯度之前，还可以判断自动驾驶车辆是否会执行粗粒度训练控制指令；此时计算模型参数的更新梯度可以具体执行为如下过程：当判定执行粗粒度训练控制指令时，通过第一预设关系计算更新梯度；当判定不执行训练驾驶策略时，通过第二预设关系计算更新梯度。

其中，第一预设关系可以包括：更新梯度等于第一损失函数对模型参数的偏导值，此时第一损失函数如公式6所示。第二预设关系可以包括：更新梯度等于第二损失函数对模型参数的偏导值，第二损失函数如公式8所示。

Loss2＝|-R-Q|²＝|vsinα-vcosα-Q|² (8)

公式8中各参数的含义与公式6中个参数的含义相同，在此不再赘述。

当判定执行粗粒度训练控制指令时，公式7中

当判定不执行粗粒度训练控制指令时，公式7中

图4是根据本发明一实施例的车辆的控制装置200的示意性框图。如图4所示，该装置200包括：

获取单元201，用于在自动驾驶车辆处于自动驾驶状态时，获取自动驾驶车辆的行驶状态信息和自动驾驶车辆的第一行驶环境信息；

计算单元202，用于基于行驶状态信息、第一行驶环境信息和控制指令决策模型，计算自动驾驶车辆的粗粒度控制指令，粗粒度控制指令用于控制自动驾驶车辆的行驶方式，控制指令决策模型为基于自动驾驶车辆在训练状态时的训练行驶状态信息和自动驾驶车辆在训练状态时的训练行驶环境信息训练得到的；

判断单元203，用于根据第二行驶环境信息判断是否执行粗粒度控制指令，第二行驶环境信息包括在自动驾驶车辆处于自动驾驶状态时，与粗粒度控制指令对应的行驶环境信息；

确定单元204，用于当判定执行粗粒度控制指令时，根据车道信息和自动驾驶车辆的行驶状态信息，确定与粗粒度控制指令对应的细粒度控制指令，细粒度控制指令用于控制自动驾驶车辆的行驶参数，车道信息包括自动驾驶车辆所行驶道路中粗粒度控制指令对应车道的信息；

输出单元205，用于输出细粒度控制指令。

本发明实施例中，控制装置200通过行驶状态信息、第一行驶环境信息和控制指令决策模型先计算出粗粒度控制指令，然后基于第二行驶环境信息来判定是否可以执行粗粒度控制指令，即在确定控制自动驾驶车辆的行驶参数之前，先计算出粗粒度控制指令计算出自动驾驶车辆的行驶方式，当判定可以执行粗粒度控制指令时，再将粗粒度控制指令转换为细粒度控制指令，从而能够避免在车辆自动控制时输出不必要或错误的控制指令，避免自动驾驶车辆出现不符合自然驾驶行为或发送安全事故；同时，本发明实施例中控制装置在判定可以执行粗粒度控制指令后，基于自动驾驶车辆的行驶状态信息和粗粒度控制指令对应的车道信息将粗粒度控制指令转换为细粒度控制指令，即充分考虑自动驾驶车辆行驶时的自身状况和车道信息确定出适合控制自动驾驶车辆的细粒度控制指令，提高细粒度控制指令的准确性和自动驾驶车辆控制的精确性，避免自动驾驶车辆出现不符合自然驾驶行为或发送安全事故，从降低自动驾驶的车辆的安全隐患，进一步提高自动驾驶车辆的安全性和舒适性。

可以理解的是，粗粒度控制指令包括直行；

确定单元204具体用于基于预设期望速度和当前速度，确定细粒度控制指令。

可以理解的是，细粒度控制指令包括自动驾驶车辆的油门大小；

确定单元204具体用于：

当当前速度大于预设期望速度时，油门大小等于零；

可以理解的是，细粒度控制指令包括自动驾驶车辆的刹车力度；

确定单元204具体用于：

当当前速度小于预设期望速度时，刹车力度等于零；

刹车力度＝预设刹车控制系数×(当前速度-预设期望速度)。

可以理解的是，粗粒度控制指令包括换道方向；

确定单元204具体用于：

可以理解的是，细粒度控制指令包括方向盘转角；

确定单元204具体用于：

可以理解的是，细粒度控制指令还包括自动驾驶车辆的油门大小；

车道信息还包括换道行驶路径对应车道的预设期望速度；

确定单元204具体用于：

当当前速度大于目标预设期望速度时，油门大小等于零；

可以理解的是，细粒度控制指令还包括自动驾驶车辆的刹车力度；

车道信息还包括换道行驶路径对应车道的预设期望速度；

确定单元204具体用于：

当当前速度小于目标预设期望速度时，刹车力度等于零；

可以理解的是，第一行驶环境信息包括自动驾驶车辆所行驶车道的车道信息，自动驾驶车辆预设距离内车辆的信息，自动驾驶车辆预设距离内路面的信息中至少一项；

可以理解的是，第二行驶环境信息包括目标车辆与自动驾驶车辆之间的第一车辆距离，目标车辆表示自动驾驶车辆预设距离内与粗粒度控制指令对应的车辆；

判断单元203具体用于：

图5是根据本发明又一实施例的车辆的控制装置200的示意性框图。

可以理解的是，粗粒度控制指令包括换道方向；

如图5所示，控制装置200还可以包括：

模拟单元206，用于基于自动驾驶车辆的行驶状态信息模拟自动驾驶车辆在换道方向的换道行驶路径；

判断单元203具体用于：

可以理解的是，如图5所示，控制装置200还可以包括：

初始化单元207，用于初始化控制指令决策模型的模型参数；

获取单元201还用于获取训练参数，训练参数包括训练行驶状态信息和训练行驶环境信息；

计算单元202还用于根据模型参数和训练参数计算自动驾驶车辆的粗粒度训练控制指令；以及，用于依据粗粒度训练控制指令计算损失函数的值；

更新单元208，用于当损失函数的值未达到预设条件时，更新模型参数；

计算单元202还用于根据更新后的模型参数和训练参数计算自动驾驶车辆的更新粗粒度训练控制指令，并重新计算损失函数的值，直到损失函数的值达到预设条件；

确定单元204还用于将损失函数的值达到预设条件时对应的模型参数确定为控制指令决策模型的最终模型参数。

可以理解的是，损失函数Loss1包括：

Loss1＝|vcosα-vsinα-Q|²，

可以理解的是，计算单元202还用于计算模型参数的更新梯度；

更新单元208具体用于基于更新梯度、预设更新系数和更新前的模型参数，计算更新后的模型参数。

可以理解的是，判断单元203还用于判断是否执行粗粒度训练控制指令；

计算单元202具体用于：

根据本发明实施例的车辆的控制装置200可对应于根据本发明实施例的车辆的控制方法中的执行主体，并且车辆的控制装置200中的各个模块的上述和其它操作和/或功能分别为了实现车辆的控制方法中的各个相应流程，为了简洁，在此不再赘述。

图6是根据本发明一实施例的车辆的控制设备300的示意性框图。如图6所示，设备300包括处理器301和存储器302总结303，总线303用于连接处理器301和存储器302，使处理器301和存储器302通过总线303进行相互通信，存储器302用于存储可执行的程序代码，处理器301通过读取存储器302中存储的可执行程序代码来运行与可执行程序代码对应的程序。

具体地，处理器301还用于执行一种车辆的控制方法；其中，车辆的控制方法包括：

输出细粒度控制指令。

根据本发明实施例的车辆的控制设备300，可对应于根据本发明实施例的车辆的控制方法中的执行主体，并且车辆的控制设备300中的各个模块的上述和其它操作和/或功能分别为了实现车辆的控制方法中的各个相应流程，为了简洁，在此不再赘述。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时，全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质，(例如，软盘、硬盘、磁带)、光介质(例如，DVD)、或者半导体介质(例如固态硬盘(olid State Disk，SSD))等。

Claims

一种车辆的控制方法，其特征在于，包括：

在自动驾驶车辆处于自动驾驶状态时，获取所述自动驾驶车辆的行驶状态信息和所述自动驾驶车辆的第一行驶环境信息；

基于所述行驶状态信息、所述第一行驶环境信息和控制指令决策模型，计算所述自动驾驶车辆的粗粒度控制指令，所述粗粒度控制指令用于控制所述自动驾驶车辆的行驶方式，所述控制指令决策模型为基于所述自动驾驶车辆在训练状态时的训练行驶状态信息和所述自动驾驶车辆在训练状态时的训练行驶环境信息训练得到的；

根据第二行驶环境信息判断是否执行所述粗粒度控制指令，所述第二行驶环境信息包括在所述自动驾驶车辆处于自动驾驶状态时，与所述粗粒度控制指令对应的行驶环境信息；

当判定执行所述粗粒度控制指令时，根据车道信息和所述自动驾驶车辆的行驶状态信息，确定与所述粗粒度控制指令对应的细粒度控制指令，所述细粒度控制指令用于控制所述自动驾驶车辆的行驶参数，所述车道信息包括所述自动驾驶车辆所行驶道路中所述粗粒度控制指令对应车道的信息；

输出所述细粒度控制指令。
根据权利要求1所述的控制方法，其特征在于，所述粗粒度控制指令包括直行；

所述车道信息包括所述自动驾驶车辆直行时所行驶车道的预设期望速度，所述自动驾驶车辆的行驶状态信息包括所述自动驾驶车辆的当前速度；

所述根据车道信息和所述自动驾驶车辆的行驶状态信息，确定与所述粗粒度控制指令对应的细粒度控制指令，包括：

基于所述预设期望速度和所述当前速度，确定所述细粒度控制指令。
根据权利要求2所述的控制方法，其特征在于，所述细粒度控制指令包括所述自动驾驶车辆的油门大小；

所述基于所述预设期望速度和所述当前速度，确定所述细粒度控制指令，包括：

当所述当前速度大于所述预设期望速度时，所述油门大小等于零；

当所述当前速度不大于所述预设期望速度时，基于第一预设公式计算所述自动驾驶车辆的油门大小，其中，所述第一预设公式包括：

所述油门大小＝预设油门控制系数×(所述预设期望速度-所述当前速度+预设值)。
根据权利要求2或3所述的控制方法，其特征在于，所述细粒度控制指令包括所述自动驾驶车辆的刹车力度；

所述基于所述预设期望速度和所述当前速度，确定所述细粒度控制指令，包括：

当所述当前速度小于所述预设期望速度时，所述刹车力度等于零；

当所述当前速度不小于所述预设期望速度时，基于第二预设公式计算所述自动驾驶车辆的刹车力度，其中，所述第二预设公式包括：

所述刹车力度＝预设刹车控制系数×(所述当前速度-所述预设期望速度)。
根据权利要求1所述的控制方法，其特征在于，所述粗粒度控制指令包括换道方向；

所述根据车道信息和所述自动驾驶车辆的行驶状态信息，确定与所述粗粒度控制指令对应的细粒度控制指令，包括：

基于所述自动驾驶车辆的行驶状态信息，模拟所述自动驾驶车辆在所述换道方向的换道行驶路径；

根据所述换道行驶路径和所述车道信息，确定所述自动驾驶车辆的细粒度控制指令。
根据权利要求5所述的控制方法，其特征在于，所述细粒度控制指令包括方向盘转角；

所述车道信息包括所述换道行驶路径对应车道的车道宽度和所述换道行驶路径对应车道的车道中线；

所述根据所述换道行驶路径和所述车道信息，确定所述自动驾驶车辆的细粒度控制指令，包括：

确定在所述换道行驶路径中所述自动驾驶车辆行驶方向与所述自动驾驶车辆当前所在车道直行方向之间至少一个转向角度；

在所述换道行驶路径中，根据所述换道行驶路径对应车道的车道宽度确定所述自动驾驶车辆在所述转向角度对应位置的所属车道的目标车道宽度；

在所述换道行驶路径中，根据所述换道行驶路径对应车道的车道中线确定所述自动驾驶车辆在所述转向角度对应位置与所述所属车道的车道中线之间的目标距离；

基于第三预设公式、所述转向角度、所述目标车道宽度和所述目标距离计算所述方向盘转角，其中，所述第三预设公式包括：

所述方向盘转角＝[所述转向角度-所述目标距离/(所述目标车道宽度×第一转角系数)]×第二转角系数。
根据权利要求6所述的控制方法，其特征在于，所述细粒度控制指令还包括所述自动驾驶车辆的油门大小；

所述车道信息还包括所述换道行驶路径对应车道的预设期望速度；

所述确定在所述换道行驶路径中所述自动驾驶车辆行驶方向与所述自动驾驶车辆当前所在车道直行方向之间至少一个转向角度之后，还包括：

在所述换道行驶路径中，基于所述自动驾驶车辆的行驶状态信息确定所述自动驾驶车辆在所述转向角度对应位置的当前速度；

在所述换道行驶路径中，根据所述换道行驶路径对应车道的预设期望速度确定所述自动驾驶车辆在所述转向角度对应位置所属车道的目标预设期望速度；

当所述当前速度大于所述目标预设期望速度时，所述油门大小等于零；

当所述当前速度不大于所述目标预设期望速度时，基于第四预设公式计算所述自动驾驶车辆在所述转向角度对应位置的油门大小，其中，所述第四预设公式包括：

所述油门大小＝预设油门控制系数×(所述目标预设期望速度-所述当前速度+预设值)。
根据权利要求6或7所述的控制方法，其特征在于，所述细粒度控制指令还包括所述自动驾驶车辆的刹车力度；

所述车道信息还包括所述换道行驶路径对应车道的预设期望速度；

所述确定在所述换道行驶路径中所述自动驾驶车辆行驶方向与所述自动驾驶车辆当前所在车道直行方向之间至少一个转向角度之后，还包括：

在所述换道行驶路径中，基于所述自动驾驶车辆的行驶状态信息确定所述自动驾驶车辆在所述转向角度对应位置的当前速度；

在所述换道行驶路径中，根据所述换道行驶路径对应车道的预设期望速度确定所述自动驾驶车辆在所述转向角度对应位置所属车道的目标预设期望速度；

当所述当前速度小于所述目标预设期望速度时，所述刹车力度等于零；

当所述当前速度不小于所述目标预设期望速度时，基于第五预设公式计算所述自动驾驶车辆在所述转向角度对应位置的刹车力度，其中，所述第五预设公式包括：

所述刹车力度＝预设刹车控制系数×(所述当前速度-所述目标预设期望速度)。
根据权利要求1-8任一项所述的控制方法，其特征在于，所述第一行驶环境信息包括所述自动驾驶车辆所行驶车道的车道信息，所述自动驾驶车辆预设距离内车辆的信息，所述自动驾驶车辆预设距离内路面的信息中至少一项；

所述第二行驶环境信息包括所述自动驾驶车辆所行驶车道中与所述粗粒度控制指令对应的车道信息，所述自动驾驶车辆预设距离内与所述粗粒度控制指令对应的车辆信息，所述自动驾驶车辆预设距离内与所述粗粒度控制指令对应的路面信息中至少一项。
根据权利要求1-9任一项所述的控制方法，其特征在于，所述第二行驶环境信息包括目标车辆与所述自动驾驶车辆之间的第一车辆距离，所述目标车辆表示所述自动驾驶车辆预设距离内与所述粗粒度控制指令对应的车辆；

所述根据第二行驶环境信息判断是否执行所述粗粒度控制指令，包括：

当所述第一车辆距离大于安全距离时，判定执行所述粗粒度控制指令；

当所述第一车辆距离不大于安全距离时，判定不执行所述粗粒度控制指令。
根据权利要求1、5-9任一项所述的控制方法，其特征在于，所述粗粒度控制指令包括换道方向；

在所述根据第二行驶环境信息判断是否执行所述粗粒度控制指令之前，还包括：

基于所述自动驾驶车辆的行驶状态信息模拟所述自动驾驶车辆在所述换道方向的换道行驶路径；

所述第二行驶环境信息包括目标车辆与所述自动驾驶车辆在所述换道行驶路径行驶时的第二车辆距离，所述目标车辆表示所述自动驾驶车辆预设距离内与所述粗粒度控制指令对应的车辆；

所述根据第二行驶环境信息判断是否执行所述粗粒度控制指令，包括：

当所述第二车辆距离大于安全距离时，判定执行所述粗粒度控制指令；

当所述第二车辆距离不大于安全距离时，判定不执行所述粗粒度控制指令。
根据权利要求1-11任一项所述的控制方法，其特征在于，在所述基于所述行驶状态信息、所述第一行驶环境信息和控制指令决策模型，计算所述自动驾驶车辆的粗粒度控制指令之前，还包括：

初始化所述控制指令决策模型的模型参数；

获取训练参数，所述训练参数包括所述训练行驶状态信息和所述训练行驶环境信息；

根据所述模型参数和所述训练参数计算所述自动驾驶车辆的粗粒度训练控制指令；

依据所述粗粒度训练控制指令计算损失函数的值；

当所述损失函数的值未达到预设条件时，更新所述模型参数；

根据更新后的模型参数和所述训练参数计算所述自动驾驶车辆的更新粗粒度训练控制指令，并重新计算所述损失函数的值，直到所述损失函数的值达到预设条件；

将所述损失函数的值达到预设条件时对应的模型参数确定为所述控制指令决策模型的最终模型参数。
根据权利要求12所述的控制方法，其特征在于，所述损失函数Loss1包括：

Loss1＝|v cosα-v sinα-Q|²，

其中，v表示所述自动驾驶车辆的当前速度，α表示所述自动驾驶车辆的当前行驶方向与所述自动驾驶车辆所在车道之间的夹角，Q表示所述粗粒度训练控制指令与所述训练参数对应预设粗粒度训练控制指令之间匹配的程度。
根据权利要求12所述的控制方法，其特征在于，所述更新所述模型参数之前，还包括：

计算所述模型参数的更新梯度；

所述更新所述模型参数，包括：

基于所述更新梯度、预设更新系数和更新前的模型参数，计算更新后的模型参数。
根据权利要求14所述的控制方法，其特征在于，在所述计算所述模型参数的更新梯度之前，还包括：

判断是否执行所述粗粒度训练控制指令；

所述计算所述模型参数的更新梯度，包括：

当判定执行所述粗粒度训练控制指令时，通过第一预设关系计算所述更新梯度，所述第一预设关系包括所述更新梯度等于第一损失函数对所述模型参数的偏导值，所述第一损失函数为Loss1＝|v cosα-v sinα-Q|²，其中，v表示所述自动驾驶车辆的当前速度，α表示所述自动驾驶车辆的当前行驶方向与所述自动驾驶车辆所在车道之间的夹角，Q表示所述粗粒度训练控制指令与所述训练参数对应预设粗粒度训练控制指令之间匹配的程度；

当判定不执行所述粗粒度训练控制指令时，通过第二预设关系计算所述更新梯度，所述第二预设关系包括所述更新梯度等于第二损失函数对所述模型参数的偏导值，所述第二损失函数为Loss2＝|v sinα-v cosα-Q|²。
一种车辆的控制装置，其特征在于，包括：

获取单元，用于在自动驾驶车辆处于自动驾驶状态时，获取所述自动驾驶车辆的行驶状态信息和所述自动驾驶车辆的第一行驶环境信息；

计算单元，用于基于所述行驶状态信息、所述第一行驶环境信息和控制指令决策模型，计算所述自动驾驶车辆的粗粒度控制指令，所述粗粒度控制指令用于控制所述自动驾驶车辆的行驶方式，所述控制指令决策模型为基于所述自动驾驶车辆在训练状态时的训练行驶状态信息和所述自动驾驶车辆在训练状态时的训练行驶环境信息训练得到的；

判断单元，用于根据第二行驶环境信息判断是否执行所述粗粒度控制指令，所述第二行驶环境信息包括在所述自动驾驶车辆处于自动驾驶状态时，与所述粗粒度控制指令对应的行驶环境信息；

确定单元，用于当判定执行所述粗粒度控制指令时，根据车道信息和所述自动驾驶车辆的行驶状态信息，确定与所述粗粒度控制指令对应的细粒度控制指令，所述细粒度控制指令用于控制所述自动驾驶车辆的行驶参数，所述车道信息包括所述自动驾驶车辆所行驶道路中所述粗粒度控制指令对应车道的信息；

输出单元，用于输出所述细粒度控制指令。
根据权利要求16所述的控制装置，其特征在于，所述粗粒度控制指令包括直行；

所述车道信息包括所述自动驾驶车辆直行时所行驶车道的预设期望速度，所述自动驾驶车辆的行驶状态信息包括所述自动驾驶车辆的当前速度；

所述确定单元具体用于基于所述预设期望速度和所述当前速度，确定所述细粒度控制指令。
根据权利要求17所述的控制装置，其特征在于，所述细粒度控制指令包括所述自动驾驶车辆的油门大小；

所述确定单元具体用于：

当所述当前速度大于所述预设期望速度时，所述油门大小等于零；

当所述当前速度不大于所述预设期望速度时，基于第一预设公式计算所述自动驾驶车辆的油门大小，其中，所述第一预设公式包括：

所述油门大小＝预设油门控制系数×(所述预设期望速度-所述当前速度+预设值)。
根据权利要求17或18所述的控制装置，其特征在于，所述细粒度控制指令包括所述自动驾驶车辆的刹车力度；

所述确定单元具体用于：

当所述当前速度小于所述预设期望速度时，所述刹车力度等于零；

当所述当前速度不小于所述预设期望速度时，基于第二预设公式计算所述自动驾驶车辆的刹车力度，其中，所述第二预设公式包括：

所述刹车力度＝预设刹车控制系数×(所述当前速度-所述预设期望速度)。
根据权利要求16所述的控制装置，其特征在于，所述粗粒度控制指令包括换道方向；

所述确定单元具体用于：

基于所述自动驾驶车辆的行驶状态信息，模拟所述自动驾驶车辆在所述换道方向的换道行驶路径；

根据所述换道行驶路径和所述车道信息，确定所述自动驾驶车辆的细粒度控制指令。
根据权利要求20所述的控制装置，其特征在于，所述细粒度控制指令包括方向盘转角；

所述车道信息包括所述换道行驶路径对应车道的车道宽度和所述换道行驶路径对应车道的车道中线；

所述确定单元具体用于：

确定在所述换道行驶路径中所述自动驾驶车辆行驶方向与所述自动驾驶车辆当前所在车道直行方向之间至少一个转向角度；

在所述换道行驶路径中，根据所述换道行驶路径对应车道的车道宽度确定所述自动驾驶车辆在所述转向角度对应位置的所属车道的目标车道宽度；

在所述换道行驶路径中，根据所述换道行驶路径对应车道的车道中线确定所述自动驾驶车辆在所述转向角度对应位置与所述所属车道的车道中线之间的目标距离；

基于第三预设公式、所述转向角度、所述目标车道宽度和所述目标距离计算所述方向盘转角，其中，所述第三预设公式包括：

所述方向盘转角＝[所述转向角度-所述目标距离/(所述目标车道宽度×第一转角系数)]×第二转角系数。
根据权利要求21所述的控制装置，其特征在于，所述细粒度控制指令还包括所述自动驾驶车辆的油门大小；

所述车道信息还包括所述换道行驶路径对应车道的预设期望速度；

所述确定单元具体用于：

在所述换道行驶路径中，基于所述自动驾驶车辆的行驶状态信息确定所述自动驾驶车辆在所述转向角度对应位置的当前速度；

在所述换道行驶路径中，根据所述换道行驶路径对应车道的预设期望速度确定所述自动驾驶车辆在所述转向角度对应位置所属车道的目标预设期望速度；

当所述当前速度大于所述目标预设期望速度时，所述油门大小等于零；

当所述当前速度不大于所述目标预设期望速度时，基于第四预设公式计算所述自动驾驶车辆在所述转向角度对应位置的油门大小，其中，所述第四预设公式包括：

所述油门大小＝预设油门控制系数×(所述目标预设期望速度-所述当前速度+预设值)。
根据权利要求21或22所述的控制装置，其特征在于，所述细粒度控制指令还包括所述自动驾驶车辆的刹车力度；

所述车道信息还包括所述换道行驶路径对应车道的预设期望速度；

所述确定单元具体用于：

在所述换道行驶路径中，基于所述自动驾驶车辆的行驶状态信息确定所述自动驾驶车辆在所述转向角度对应位置的当前速度；

在所述换道行驶路径中，根据所述换道行驶路径对应车道的预设期望速度确定所述自动驾驶车辆在所述转向角度对应位置所属车道的目标预设期望速度；

当所述当前速度小于所述目标预设期望速度时，所述刹车力度等于零；

当所述当前速度不小于所述目标预设期望速度时，基于第五预设公式计算所述自动驾驶车辆在所述转向角度对应位置的刹车力度，其中，所述第五预设公式包括：

所述刹车力度＝预设刹车控制系数×(所述当前速度-所述目标预设期望速度)。
根据权利要求16-23任一项所述的控制装置，其特征在于，所述第一行驶环境信息包括所述自动驾驶车辆所行驶车道的车道信息，所述自动驾驶车辆预设距离内车辆的信息，所述自动驾驶车辆预设距离内路面的信息中至少一项；

所述第二行驶环境信息包括所述自动驾驶车辆所行驶车道中与所述粗粒度控制指令对应的车道信息，所述自动驾驶车辆预设距离内与所述粗粒度控制指令对应的车辆信息，所述自动驾驶车辆预设距离内与所述粗粒度控制指令对应的路面信息中至少一项。
根据权利要求16-24任一项所述的控制装置，其特征在于，所述第二行驶环境信息包括目标车辆与所述自动驾驶车辆之间的第一车辆距离，所述目标车辆表示所述自动驾驶车辆预设距离内与所述粗粒度控制指令对应的车辆；

所述判断单元具体用于：

当所述第一车辆距离大于安全距离时，判定执行所述粗粒度控制指令；

当所述第一车辆距离不大于安全距离时，判定不执行所述粗粒度控制指令。
根据权利要求16、20-24任一项所述的控制装置，其特征在于，所述粗粒度控制指令包括换道方向；所述装置还包括：

模拟单元，用于基于所述自动驾驶车辆的行驶状态信息模拟所述自动驾驶车辆在所述换道方向的换道行驶路径；

所述第二行驶环境信息包括目标车辆与所述自动驾驶车辆在所述换道行驶路径行驶时的第二车辆距离，所述目标车辆表示所述自动驾驶车辆预设距离内与所述粗粒度控制指令对应的车辆；

所述判断单元具体用于：

当所述第二车辆距离大于安全距离时，判定执行所述粗粒度控制指令；

当所述第二车辆距离不大于安全距离时，判定不执行所述粗粒度控制指令。
根据权利要求16-26任一项所述的控制装置，其特征在于，还包括：

初始化单元，用于初始化所述控制指令决策模型的模型参数；

所述获取单元还用于获取训练参数，所述训练参数包括所述训练行驶状态信息和所述训练行驶环境信息；

所述计算单元还用于根据所述模型参数和所述训练参数计算所述自动驾驶车辆的粗粒度训练控制指令；以及，用于依据所述粗粒度训练控制指令计算损失函数的值；

所述装置还包括：

更新单元，用于当所述损失函数的值未达到预设条件时，更新所述模型参数；

所述计算单元，还用于根据更新后的模型参数和所述训练参数计算所述自动驾驶车辆的更新粗粒度训练控制指令，并重新计算所述损失函数的值，直到所述损失函数的值达到预设条件；

所述确定单元还用于将所述损失函数的值达到预设条件时对应的模型参数确定为所述控制指令决策模型的最终模型参数。
根据权利要求27所述的控制装置，其特征在于，所述损失函数Loss1包括：

Loss1＝|v cosα-v sinα-Q|²，

其中，v表示所述自动驾驶车辆的当前速度，α表示所述自动驾驶车辆的当前行驶方向与所述自动驾驶车辆所在车道之间的夹角，Q表示所述粗粒度训练控制指令与所述训练参数对应预设粗粒度训练控制指令之间匹配的程度。
根据权利要求27所述的控制装置，其特征在于，所述计算单元还用于计算所述模型参数的更新梯度；

所述更新单元具体用于基于所述更新梯度、预设更新系数和更新前的模型参数，计算更新后的模型参数。
根据权利要求29所述的控制装置，其特征在于，所述判断单元还用于判断是否执行所述粗粒度训练控制指令；

所述计算单元具体用于：

当判定执行所述粗粒度训练控制指令时，通过第一预设关系计算所述更新梯度，所述第一预设关系包括所述更新梯度等于第一损失函数对所述模型参数的偏导值，所述第一损失函数为Loss1＝|v cosα-v sinα-Q|²，其中，v表示所述自动驾驶车辆的当前速度，α表示所述自动驾驶车辆的当前行驶方向与所述自动驾驶车辆所在车道之间的夹角，Q表示所述粗粒度训练控制指令与所述训练参数对应预设粗粒度训练控制指令之间匹配的程度；

当判定不执行所述粗粒度训练控制指令时，通过第二预设关系计算所述更新梯度，所述第二预设关系包括所述更新梯度等于第二损失函数对所述模型参数的偏导值，所述第二损失函数为Loss2＝|v sinα-v cosα-Q|²。
一种车辆的控制设备，其特征在于，包括：

存储器、处理器和总线；

所述存储器和所述处理器通过所述总线连接并完成相互间的通信；

所述存储器用于存储程序代码；

所述处理器通过读取所述存储器中存储的可执行程序代码来运行与所述可执行程序代码对应的程序，以用于执行如权利要求1-15任一项所述的控制方法。
一种计算机可读存储介质，其特征在于，包括指令，当所述指令在计算机上运行时，使得所述计算机执行如权利要求1-15任一项所述的方法。