CN111216723B - 车辆的行驶控制方法、装置和存储介质 - Google Patents
车辆的行驶控制方法、装置和存储介质 Download PDFInfo
- Publication number
- CN111216723B CN111216723B CN201811414973.4A CN201811414973A CN111216723B CN 111216723 B CN111216723 B CN 111216723B CN 201811414973 A CN201811414973 A CN 201811414973A CN 111216723 B CN111216723 B CN 111216723B
- Authority
- CN
- China
- Prior art keywords
- information
- vehicle
- reward
- vehicle distance
- state information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 42
- 238000011217 control strategy Methods 0.000 claims abstract description 27
- 230000002787 reinforcement Effects 0.000 claims abstract description 23
- 230000006870 function Effects 0.000 claims description 26
- 238000004590 computer program Methods 0.000 claims description 22
- 238000004364 calculation method Methods 0.000 claims description 12
- 238000011176 pooling Methods 0.000 claims description 5
- 230000005284 excitation Effects 0.000 claims description 3
- 230000008569 process Effects 0.000 abstract description 11
- 230000009286 beneficial effect Effects 0.000 description 6
- 230000006872 improvement Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Images
Classifications
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W30/00—Purposes of road vehicle drive control systems not related to the control of a particular sub-unit, e.g. of systems using conjoint control of vehicle sub-units
- B60W30/14—Adaptive cruise control
- B60W30/16—Control of distance between vehicles, e.g. keeping a distance to preceding vehicle
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W40/00—Estimation or calculation of non-directly measurable driving parameters for road vehicle drive control systems not related to the control of a particular sub unit, e.g. by using mathematical models
- B60W40/02—Estimation or calculation of non-directly measurable driving parameters for road vehicle drive control systems not related to the control of a particular sub unit, e.g. by using mathematical models related to ambient conditions
- B60W40/04—Traffic conditions
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W50/00—Details of control systems for road vehicle drive control not related to the control of a particular sub-unit, e.g. process diagnostic or vehicle driver interfaces
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W50/00—Details of control systems for road vehicle drive control not related to the control of a particular sub-unit, e.g. process diagnostic or vehicle driver interfaces
- B60W2050/0001—Details of the control system
- B60W2050/0019—Control system elements or transfer functions
- B60W2050/0028—Mathematical models, e.g. for simulation
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W2520/00—Input parameters relating to overall vehicle dynamics
- B60W2520/06—Direction of travel
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W2520/00—Input parameters relating to overall vehicle dynamics
- B60W2520/10—Longitudinal speed
Landscapes
- Engineering & Computer Science (AREA)
- Automation & Control Theory (AREA)
- Transportation (AREA)
- Mechanical Engineering (AREA)
- Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Human Computer Interaction (AREA)
- Control Of Driving Devices And Active Controlling Of Vehicle (AREA)
- Traffic Control Systems (AREA)
Abstract
本发明公开了一种车辆的行驶控制方法,涉及汽车的行驶控制领域,包括步骤:获取车辆所处环境的图像信息;根据所述图像信息,计算所述车辆的位置信息;其中,所述位置信息包括所述车辆与前方车辆的车距信息,以及所述车辆与车道中心的偏移信息;获取所述车辆的行驶状态信息;其中,所述行驶状态信息包括车速信息和行驶方向信息;根据所述位置信息和所述行驶状态信息,通过预先训练的强化学习模型得到相应的控制策略。本发明还提供了车辆的行驶控制装置和存储介质,可以在自动跟车的行驶控制中,有效地提高车辆在行驶过程中的稳定性和安全性。
Description
技术领域
本发明涉及汽车的行驶控制领域,尤其涉及一种车辆的行驶控制方法、装置和存储介质。
背景技术
随着汽车工业的发展,汽车的智能驾驶功能得到了越来越多的关注。
目前常见的智能驾驶功能通常有自动跟车功能,在现有的自动跟车功能中,主要是通过获取本车与前车的车距,以及本车与前车的行驶方向的夹角,计算出相应的控制策略,从而对本车的行驶进行控制。
在实施本发明的过程中发明人发现,现有技术依赖于与前车之间的车距和行驶方向的夹角,在前车突然出现变道,或是突然出现异常急转弯的情况下,本车也往往会相应地执行突然变道或转向的操作,导致行驶的稳定性和安全性收到较大影响。
发明内容
本发明实施例的目的是提供一种车辆的行驶控制方法、装置和存储介质,可以在自动跟车的行驶控制中,有效地提高车辆在行驶过程中的稳定性和安全性。
为实现上述目的,本发明实施例提供了一种车辆的行驶控制方法,包括步骤:
获取车辆所处环境的图像信息;
根据所述图像信息,计算所述车辆的位置信息;其中,所述位置信息包括所述车辆与前方车辆的车距信息,以及所述车辆与车道中心的偏移信息;
获取所述车辆的行驶状态信息;其中,所述行驶状态信息包括车速信息和行驶方向信息;
根据所述位置信息和所述行驶状态信息,通过预先训练的强化学习模型得到相应的控制策略。
作为上述方案的改进,所述根据所述图像信息,计算所述车辆的位置信息,包括步骤:
将所述图像信息载入预先训练的卷积网络模型,得到所述卷积网络模型的卷积输出;所述卷积输出为至少包括两个数值的一维数组,所述两个数值分别表征所述车距信息与所述偏移信息。
作为上述方案的改进,所述卷积网络模型的卷积核大小为5×5,,步长为1;所述卷积网络模型的池化窗口大小为3×3;所述卷积网络模型的激励函数为ReLU函数。
作为上述方案的改进,所述强化学习模型的奖励函数包括纵向奖励和横向奖励;
若所述车距信息处于预设的目标车距范围内,则所述纵向奖励为最大值;若所述车距信息小于预设的安全车距,则所述纵向奖励为最小值;
若所述偏移信息处于预设的允许偏移范围内,则所述横向奖励为最大;若所述偏移信息超过所述车道中心对应的车道边界,则所述横向奖励为最小。
作为上述方案的改进:
若所述车距信息未处于所述目标车距范围内,且不小于所述安全车距,且根据所述行驶状态信息,所述车距信息趋向于所述目标车距范围,则所述纵向奖励为次大值;若所述车距信息未处于所述目标车距范围内,且不小于所述安全车距,且根据所述行驶状态信息,所述车距信息未趋向于所述目标车距范围,则所述纵向奖励为次小值;
若所述偏移信息未处于所述允许偏移范围,且未超过所述车道边界,且根据所述行驶状态信息,所述偏移信息趋向于所述允许偏移范围,则所述横向奖励为次大值;若所述偏移信息未处于所述允许偏移范围,且未超过所述车道边界,且根据所述行驶状态信息,所述偏移信息未趋向于所述允许偏移范围,则所述横向奖励为次小值。
作为上述方案的改进,所述行驶状态信息还包括所述车辆的油门开度,以及制动踏板开度。
作为上述方案的改进,所述控制策略包括所述车辆的油门开度变化量、制动踏板开度变化量和车辆行驶方向变化量中的一项或多项。
本发明还提供了一种车辆的行驶控制装置,包括
图像获取模块,用于获取车辆所处环境的图像信息;
位置计算模块,用于根据所述图像信息,计算所述车辆的位置信息;其中,所述位置信息包括所述车辆与前方车辆的车距信息,以及所述车辆与车道中心的偏移信息;
状态获取模块,用于获取所述车辆的行驶状态信息;其中,所述行驶状态信息包括车速信息和行驶方向信息;
策略计算模块,用于根据所述位置信息和所述行驶状态信息,通过预先训练的强化学习模型得到相应的控制策略。
本发明实施例还提供了一种汽车的行驶控制装置,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现如上任意一项所述的行驶控制方法。
本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行如上任意一项所述的行驶控制方法。
与现有技术相比,本发明公开的车辆的行驶控制方法、装置和存储介质,通过获取车辆所处环境的图像信息,从而得到所述车辆的位置信息,所述位置信息包括所述车辆与前方车辆的车距信息,以及所述车辆与车道中心的偏移信息。并获取所述车辆的行驶状态信息,从而根据所述位置信息和所述行驶状态信息,通过强化学习模型得到相应的控制策略。由于在计算所述控制策略的过程中,考虑了所述车距信息与所述偏移信息的影响,并且还结合了所述行驶状态信息,通过强化学习进行计算,在所述前方车辆的行驶发生突发性变化时,依然能够得到相对稳定的控制策略,解决了现有行驶控制方法中,前车行驶发生突发性变化时,容易对本车的行驶控制造成较大影响的问题,可以在自动跟车的行驶控制中,有效地提高车辆在行驶过程中的稳定性和安全性。
附图说明
图1是本发明实施例1中一种车辆的行驶控制方法的流程示意图。
图2是本发明实施例2中一种车辆的行驶控制装置的结构示意图。
图3是本发明实施例3中一种车辆的行驶控制装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参见图1,是本发明实施例1提供的一种车辆的行驶控制方法的流程示意图。所述行驶控制方法包括步骤S110至步骤S140。
S110、获取车辆所处环境的图像信息。
所述图像信息可以是由所述车辆搭载的取像装置进行拍摄,例如车载摄像头等,由执行本方法的装置获取拍摄到的所述图像信息,例如由所述车辆的ECU(ElectronicControl Unit,电子控制单元)获取拍摄到的所述图像信息,或是由线上的控制中心获取所述图像信息等。可以理解地,也可以是由包括了取像装置的设备拍摄并获取所述图像信息,均不影响本发明可取得的有益效果。
作为一种可选的实施方式,可以是通过所述车辆的前置摄像头对前方道路进行拍摄,以30FPS作为采集帧率,得到分辨率不小于800×640的RGB图像信息,以所述RGB图像信息作为所述图像信息,发送给所述车辆的ECU或控制中心。
S120、根据所述图像信息,计算所述车辆的位置信息;其中,所述位置信息包括所述车辆与前方车辆的车距信息,以及所述车辆与车道中心的偏移信息。
由于所述图像信息中描述了所述车辆所处的环境,因此可以根据所述图像信息,计算出所述车辆的位置信息。至少可以得到所述车辆前方是否有其他车辆,或是所述车辆与前方车辆的车距,还可根据所述图像信息中的路面图像,得到所述车辆偏离车道中心的距离,也即可以得到所述车辆相对于前方车辆的车距信息,以及所述车辆与车道中心的偏移信息。
优选地,可以是通过机器学习的方式,根据所述图像信息得到所述车辆的位置信息。例如,步骤S120可以具体为:
将所述图像信息载入预先训练的卷积网络模型,得到所述卷积网络模型的卷积输出;所述卷积输出为至少包括两个数值的一维数组,所述两个数值分别表征所述车距信息与所述偏移信息。
例如,所述一维数组可以是包括数值A1和数值A2,即一维数组{A1,A2},其中数值A1表征所述车距信息,数值A2表征所述偏移信息。可以理解地,所述车距信息和所述偏移信息均不限于用一个数值进行表征,还可以是多个数值,或是多维矩阵,均不影响本发明可取得的有益效果。
更具体地,还可以对数值A1的含义进行定义:若数值A1=0则表示所述车辆前方60米范围内没有其他车辆;若数值A1>0,则由数值大小表示前方车辆的远近。还可以对数值A2进行定义:若A2<0,则表示所述车辆相对于当前车道的车道中心偏左;若所述A2=0,则表示所述车辆正处于所述车道中心;若所述A2>0,则表示所述车辆相对所述车道中心偏右。可以理解地,在实际应用中,对数值A1和数值A2的定义可以根据实际需要进行相应调整,均不影响本发明可取得的有益效果。
更优选地,在所述卷积网络模型中,可以采用三个卷积层,定义卷积核大小为5×5,步长为1;还可以采用三个池化层,定义池化层的池化窗口大小为3×3;还可以采用ReLU函数作为激励函数,所述ReLU函数具体为:
针对所述卷积网络模型,作为一种可选的实施方式,可以是采用监督学习的方式进行所述预先训练,以得到所述卷积网络模型。例如采用大量的标注样本进行训练。优选地,所述标注样本的数量不少于两百万张。
S130、获取所述车辆的行驶状态信息;其中,所述行驶状态信息包括车速信息和行驶方向信息。
作为一种可选的实施方式,可以是通过所述车辆的CAN总线解析,从而获取所述行驶状态信息。可选地,还可以是通过一定的采样频率获取所述行驶状态信息,例如30Hz的采样频率。针对所述行驶方向信息,还可以是通过获取车辆方向盘的转角信息,以得到所述行驶方向信息。
优选地,所述行驶状态信息还可以包括所述车辆的油门开度和制动踏板开度等,以进一步提高对所述车辆进行控制的稳定性。
可以理解地,步骤S130相对于步骤S110及步骤S120的执行次序并无限定,可以是在步骤S110及步骤S120的任一步骤之前执行,或是与步骤S110及步骤S120中的任一步骤同步执行,或是在步骤S110及步骤S120的任一步骤之后执行,均不影响本发明可取得的有益效果。
S140、根据所述位置信息和所述行驶状态信息,通过预先训练的强化学习模型得到相应的控制策略。
可以是预先训练所述强化学习模型,以所述位置信息和所述行驶状态信息作为所述强化学习模型的输入,从而根据所述强化学习模型的输出得到所述控制策略。
优选地,所述控制策略可以是所述车辆的动作输出量,例如油门开度变化量、制动踏板开度变化量和车辆行驶方向变化量等的一项或多项。根据所述控制策略,控制所述车辆的相应结构进行工作,例如根据所述油门开度变化量控制油门开度、根据所述制动踏板开度变化量控制所述制动踏板,以根据所述车辆行驶方向变化量控制所述车辆的行驶方向等,以实现对所述车辆的行驶控制。可以理解地,所述控制策略可能根据车辆的实际情况有所调整,不影响本发明可取得的有益效果。
更优选地,所述油门开度变化量和所述制动踏板变化量的取值可以设定在(-5,5)的区间范围内,控制精度设定为1%,即对油门开度和制动踏板开度的每次调整,限定在±5%的开度范围内。所述车辆行驶方向变化量可以通过方向盘转角变化量进行调整,可以将所述方向盘转角变化量设定在(-15,15)的区间范围内,控制精度设定为1°,即对方向盘转角的每次调整,限定在±15°的范围内。在实际应用中,可能根据具体情况的设定有所调整,均不影响本发明可取得的有益效果。
针对所述强化学习模型,可以是采用离散函数作为奖励函数,所述奖励函数还可以包括纵向奖励和横向奖励,以所述纵向奖励与所述横向奖励之和作为所述奖励函数。可以理解地,在其他情况下,还可以是以所述纵向奖励与所述横向奖励的其他计算值作为所述奖励函数,例如二者的乘积或是通过特定运算公式得到的其他计算值,均不影响本发明可取得的有益效果。
优选地,所述纵向奖励和所述横向奖励可以通过以下依据进行取值。
所述纵向奖励:所述若所述车距信息处于预设的目标车距范围内,则所述纵向奖励为最大值;若所述车距信息小于预设的安全车距,则所述纵向奖励为最小值。
所述横向奖励:若所述偏移信息处于预设的允许偏移范围内,则所述横向奖励为最大;若所述偏移信息超过所述车道中心对应的车道边界,则所述横向奖励为最小。
更优选地,所述纵向奖励和所述横向奖励的取值依据还可以进一步细化。
所述纵向奖励还可以包括:若所述车距信息未处于所述目标车距范围内,且不小于所述安全车距,且根据所述行驶状态信息,所述车距信息趋向于所述目标车距范围,则所述纵向奖励为次大值;若所述车距信息未处于所述目标车距范围内,且不小于所述安全车距,且根据所述行驶状态信息,所述车距信息未趋向于所述目标车距范围,则所述纵向奖励为次小值。
所述横向奖励还可以包括:若所述偏移信息未处于所述允许偏移范围,且未超过所述车道边界,且根据所述行驶状态信息,所述偏移信息趋向于所述允许偏移范围,则所述横向奖励为次大值;若所述偏移信息未处于所述允许偏移范围,且未超过所述车道边界,且根据所述行驶状态信息,所述偏移信息未趋向于所述允许偏移范围,则所述横向奖励为次小值。
作为举例,设所述纵向奖励为R1,所述车距信息为d,所述目标车距范围为[d1,d2],所述安全车距为d0,所述车距信息的变化量为△d;设所述横向奖励为R2,所述偏移信息为s,所述允许偏移范围为[s1,s2],所述车道边界对应的偏移量为s0,所述偏移信息的变化量为△s。对应的所述纵向奖励和所述横向奖励参见表1。
表1纵向奖励和横向奖励计算表
其中,针对所述车距信息的变化量,可以是通过将当前采集到的车距信息和上一时刻的车距信息进行比较,以得到所述车距信息的变化量;也可以是通过所述行驶状态信息,以判断所述车距信息是否趋于所述目标车距范围,从而得到所述车距信息的变化量。针对所述偏移信息的变化量,可以是通过将当前采集到的偏移信息和上一时刻的偏移信息进行比较,以得到所述偏移信息的变化量;也可以是通过所述行驶状态信息,以判断所述偏移信息是否趋于所述允许偏移范围,从而得到所述偏移信息的变化量。
本发明实施例1公开的车辆的行驶控制方法,通过获取车辆所处环境的图像信息,从而得到所述车辆的位置信息,所述位置信息包括所述车辆与前方车辆的车距信息,以及所述车辆与车道中心的偏移信息。并获取所述车辆的行驶状态信息,从而根据所述位置信息和所述行驶状态信息,通过强化学习模型得到相应的控制策略。由于在计算所述控制策略的过程中,考虑了所述车距信息与所述偏移信息的影响,并且还结合了所述行驶状态信息,通过强化学习进行计算,在所述前方车辆的行驶发生突发性变化时,依然能够得到相对稳定的控制策略,解决了现有行驶控制方法中,前车行驶发生突发性变化时,容易对本车的行驶控制造成较大影响的问题,可以在自动跟车的行驶控制中,有效地提高车辆在行驶过程中的稳定性和安全性。
本发明实施例2还提供了一种车辆的行驶控制装置。参见图2,行驶控制装置20包括图像获取模块21、位置计算模块22、状态获取模块23和策略计算模块24。
所述图像获取模块21,用于获取车辆所处环境的图像信息。所述位置计算模块22,用于根据所述图像信息,计算所述车辆的位置信息;其中,所述位置信息包括所述车辆与前方车辆的车距信息,以及所述车辆与车道中心的偏移信息。所述状态获取模块23,用于获取所述车辆的行驶状态信息;其中,所述行驶状态信息包括车速信息和行驶方向信息。所述策略计算模块24,用于根据所述位置信息和所述行驶状态信息,通过预先训练的强化学习模型得到相应的控制策略。
所述行驶控制装置20的工作过程如实施例1所述的行驶控制方法,在此不作赘述。
本发明实施例2公开的车辆的行驶控制装置,通过获取车辆所处环境的图像信息,从而得到所述车辆的位置信息,所述位置信息包括所述车辆与前方车辆的车距信息,以及所述车辆与车道中心的偏移信息。并获取所述车辆的行驶状态信息,从而根据所述位置信息和所述行驶状态信息,通过强化学习模型得到相应的控制策略。由于在计算所述控制策略的过程中,考虑了所述车距信息与所述偏移信息的影响,并且还结合了所述行驶状态信息,通过强化学习进行计算,在所述前方车辆的行驶发生突发性变化时,依然能够得到相对稳定的控制策略,解决了现有行驶控制方法中,前车行驶发生突发性变化时,容易对本车的行驶控制造成较大影响的问题,可以在自动跟车的行驶控制中,有效地提高车辆在行驶过程中的稳定性和安全性。
本发明实施例3提供了一种车辆的行驶控制装置。参见图3,行驶控制装置30包括:处理器31、存储器32以及存储在所述存储器中并可在所述处理器上运行的计算机程序,例如行驶控制程序。所述处理器31执行所述计算机程序时实现上述各个测试方法实施例中的步骤,例如图1所示的步骤S120。或者,所述处理器执行所述计算机程序时实现上述各装置实施例中各模块的功能,例如实施例2所述的行驶控制装置。
示例性的,所述计算机程序可以被分割成一个或多个模块,所述一个或者多个模块被存储在所述存储器32中,并由所述处理器31执行,以完成本发明。所述一个或多个模块可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序在所述行驶控制装置30中的执行过程。例如,所述计算机程序可以被分割成图像获取模块、位置计算模块、状态计算模块和策略计算模块,各模块具体功能如下:所述图像获取模块,用于获取车辆所处环境的图像信息;所述位置计算模块,用于根据所述图像信息,计算所述车辆的位置信息;其中,所述位置信息包括所述车辆与前方车辆的车距信息,以及所述车辆与车道中心的偏移信息;所述状态获取模块,用于获取所述车辆的行驶状态信息;其中,所述行驶状态信息包括车速信息和行驶方向信息;所述策略计算模块,用于根据所述位置信息和所述行驶状态信息,通过预先训练的强化学习模型得到相应的控制策略。
所述行驶控制装置30可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述行驶控制装置30可包括,但不仅限于,处理器31、存储器32。本领域技术人员可以理解,所述示意图仅仅是图像增强设备的示例,并不构成对行驶控制装置30的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述行驶控制装置30还可以包括输入输出设备、网络接入设备、总线等。
所称处理器31可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器31是所述行驶控制装置30的控制中心,利用各种接口和线路连接整个行驶控制装置30的各个部分。
所述存储器32可用于存储所述计算机程序和/或模块,所述处理器31通过运行或执行存储在所述存储器32内的计算机程序和/或模块,以及调用存储在存储器32内的数据,实现所述行驶控制装置30的各种功能。所述存储器32可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器32可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(SecureDigital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
其中,所述行驶控制装置30集成的模块如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。
本发明实施例3公开的汽车的行驶控制装置和可读存储介质,通过获取车辆所处环境的图像信息,从而得到所述车辆的位置信息,所述位置信息包括所述车辆与前方车辆的车距信息,以及所述车辆与车道中心的偏移信息。并获取所述车辆的行驶状态信息,从而根据所述位置信息和所述行驶状态信息,通过强化学习模型得到相应的控制策略。由于在计算所述控制策略的过程中,考虑了所述车距信息与所述偏移信息的影响,并且还结合了所述行驶状态信息,通过强化学习进行计算,在所述前方车辆的行驶发生突发性变化时,依然能够得到相对稳定的控制策略,解决了现有行驶控制方法中,前车行驶发生突发性变化时,容易对本车的行驶控制造成较大影响的问题,可以在自动跟车的行驶控制中,有效地提高车辆在行驶过程中的稳定性和安全性。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。
Claims (9)
1.一种车辆的行驶控制方法,其特征在于,包括步骤:
获取车辆所处环境的图像信息;
根据所述图像信息,计算所述车辆的位置信息;其中,所述位置信息包括所述车辆与前方车辆的车距信息,以及所述车辆与车道中心的偏移信息;
获取所述车辆的行驶状态信息;其中,所述行驶状态信息包括车速信息和行驶方向信息;
根据所述位置信息和所述行驶状态信息,通过预先训练的强化学习模型得到相应的控制策略;
所述强化学习模型的奖励函数包括纵向奖励和横向奖励;
若所述车距信息处于预设的目标车距范围内,则所述纵向奖励为最大值;若所述车距信息小于预设的安全车距,则所述纵向奖励为最小值;
若所述偏移信息处于预设的允许偏移范围内,则所述横向奖励为最大值;若所述偏移信息超过所述车道中心对应的车道边界,则所述横向奖励为最小值。
2.如权利要求1所述的行驶控制方法,其特征在于,所述根据所述图像信息,计算所述车辆的位置信息,包括步骤:
将所述图像信息载入预先训练的卷积网络模型,得到所述卷积网络模型的卷积输出;所述卷积输出为至少包括两个数值的一维数组,所述两个数值分别表征所述车距信息与所述偏移信息。
3.如权利要求2所述的行驶控制方法,其特征在于,所述卷积网络模型的卷积核大小为5×5,步长为1;所述卷积网络模型的池化窗口大小为3×3;所述卷积网络模型的激励函数为ReLU函数。
4.如权利要求1所述的行驶控制方法,其特征在于:
若所述车距信息未处于所述目标车距范围内,且不小于所述安全车距,且根据所述行驶状态信息,所述车距信息趋向于所述目标车距范围,则所述纵向奖励为次大值;若所述车距信息未处于所述目标车距范围内,且不小于所述安全车距,且根据所述行驶状态信息,所述车距信息未趋向于所述目标车距范围,则所述纵向奖励为次小值;
若所述偏移信息未处于所述允许偏移范围,且未超过所述车道边界,且根据所述行驶状态信息,所述偏移信息趋向于所述允许偏移范围,则所述横向奖励为次大值;若所述偏移信息未处于所述允许偏移范围,且未超过所述车道边界,且根据所述行驶状态信息,所述偏移信息未趋向于所述允许偏移范围,则所述横向奖励为次小值。
5.如权利要求1所述的行驶控制方法,其特征在于,所述行驶状态信息还包括所述车辆的油门开度,以及制动踏板开度。
6.如权利要求1至5任一项所述的行驶控制方法,其特征在于,所述控制策略包括所述车辆的油门开度变化量、制动踏板开度变化量和车辆行驶方向变化量中的一项或多项。
7.一种车辆的行驶控制装置,其特征在于,包括
图像获取模块,用于获取车辆所处环境的图像信息;
位置计算模块,用于根据所述图像信息,计算所述车辆的位置信息;其中,所述位置信息包括所述车辆与前方车辆的车距信息,以及所述车辆与车道中心的偏移信息;
状态获取模块,用于获取所述车辆的行驶状态信息;其中,所述行驶状态信息包括车速信息和行驶方向信息;
策略计算模块,用于根据所述位置信息和所述行驶状态信息,通过预先训练的强化学习模型得到相应的控制策略;
所述强化学习模型的奖励函数包括纵向奖励和横向奖励;
若所述车距信息处于预设的目标车距范围内,则所述纵向奖励为最大值;若所述车距信息小于预设的安全车距,则所述纵向奖励为最小值;
若所述偏移信息处于预设的允许偏移范围内,则所述横向奖励为最大值;若所述偏移信息超过所述车道中心对应的车道边界,则所述横向奖励为最小值。
8.一种汽车的行驶控制装置,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至6中任意一项所述的行驶控制方法。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行如权利要求1至6中任意一项所述的行驶控制方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811414973.4A CN111216723B (zh) | 2018-11-26 | 2018-11-26 | 车辆的行驶控制方法、装置和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811414973.4A CN111216723B (zh) | 2018-11-26 | 2018-11-26 | 车辆的行驶控制方法、装置和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111216723A CN111216723A (zh) | 2020-06-02 |
CN111216723B true CN111216723B (zh) | 2021-04-16 |
Family
ID=70825482
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811414973.4A Active CN111216723B (zh) | 2018-11-26 | 2018-11-26 | 车辆的行驶控制方法、装置和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111216723B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112904852B (zh) * | 2021-01-18 | 2021-09-17 | 国汽智控(北京)科技有限公司 | 一种自动驾驶控制方法、装置及电子设备 |
CN112721935A (zh) * | 2021-01-19 | 2021-04-30 | 西人马帝言(北京)科技有限公司 | 一种车辆控制模型训练方法、车辆控制方法及装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014130460A2 (en) * | 2013-02-25 | 2014-08-28 | Honda Motor Co., Ltd. | Real time risk assessment for advanced driver assist system |
CN105059287A (zh) * | 2015-07-31 | 2015-11-18 | 奇瑞汽车股份有限公司 | 一种车道保持方法和装置 |
CN108227710A (zh) * | 2017-12-29 | 2018-06-29 | 商汤集团有限公司 | 自动驾驶控制方法和装置、电子设备、程序和介质 |
CN108657163A (zh) * | 2017-03-27 | 2018-10-16 | 现代自动车株式会社 | 基于深度学习的自主车辆控制设备及其系统和方法 |
CN108773373A (zh) * | 2016-09-14 | 2018-11-09 | 北京百度网讯科技有限公司 | 用于操作自动驾驶车辆的方法和装置 |
-
2018
- 2018-11-26 CN CN201811414973.4A patent/CN111216723B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014130460A2 (en) * | 2013-02-25 | 2014-08-28 | Honda Motor Co., Ltd. | Real time risk assessment for advanced driver assist system |
CN105059287A (zh) * | 2015-07-31 | 2015-11-18 | 奇瑞汽车股份有限公司 | 一种车道保持方法和装置 |
CN108773373A (zh) * | 2016-09-14 | 2018-11-09 | 北京百度网讯科技有限公司 | 用于操作自动驾驶车辆的方法和装置 |
CN108657163A (zh) * | 2017-03-27 | 2018-10-16 | 现代自动车株式会社 | 基于深度学习的自主车辆控制设备及其系统和方法 |
CN108227710A (zh) * | 2017-12-29 | 2018-06-29 | 商汤集团有限公司 | 自动驾驶控制方法和装置、电子设备、程序和介质 |
Also Published As
Publication number | Publication date |
---|---|
CN111216723A (zh) | 2020-06-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE102015202628B4 (de) | In ein fahrzeug eingebaute vorrichtung zur auswahl eines vorausfahrenden fahrzeugs in dem fahrtweg des trägerfahrzeugs der vorrichtung | |
CN111216723B (zh) | 车辆的行驶控制方法、装置和存储介质 | |
EP3647136A1 (en) | Vehicle traveling assistance method and vehicle traveling assistance device | |
DE102014219922A1 (de) | Vorrichtung zur auswahl eines vorausfahrenden fahrzeugs | |
CN112879173A (zh) | 一种控制油门滤波的方法及相关装置 | |
CN115489336B (zh) | 基于大数据的电机扭矩输出优化方法和装置 | |
CN111038504B (zh) | 车辆自适应巡航控制方法、装置、车辆及存储介质 | |
CN113511202A (zh) | 自适应巡航系统弯道车速控制方法、存储介质及电子设备 | |
CN114394153B (zh) | 方向盘虚位状态确定方法、装置及电子设备 | |
CN111301411B (zh) | 车辆的行驶控制方法和装置 | |
DE112020003039T5 (de) | Ortungsvorrichtung | |
CN113110486B (zh) | 智能网联汽车协作式换道引导方法、系统及可读存储介质 | |
CN115123245A (zh) | 驾驶模式切换方法、装置和车辆 | |
CN113516847A (zh) | 基于车联网v2x的高速公路防拥堵控制方法及系统 | |
CN112542061A (zh) | 基于车联网的借道超车控制方法、装置、系统及存储介质 | |
WO2020169386A1 (de) | VERFAHREN UND COMPUTERPROGRAMMPRODUKT ZUM ADAPTIEREN EINER AUFLÖSUNG EINES MULTISENSORSYSTEMS EINES STRAßENFAHRZEUGES UND STEUERGERÄT FÜR EIN MULTISENSORSYSTEM UND COMPUTERPROGRAMMPRODUKT | |
CN111038503A (zh) | 车辆自适应巡航控制方法、装置、车辆及存储介质 | |
DE102014219624A1 (de) | Auswahlvorrichtung für ein vorausbefindliches fahrzeug | |
CN114906141A (zh) | 自适应巡航控制方法及装置 | |
EP4183628A1 (en) | Adaptive headlamp control method, and terminal device and storage medium | |
CN110936955B (zh) | 自动驾驶车辆车速控制方法、装置、车载设备及存储介质 | |
DE102021109192A1 (de) | Fahrzeug-steuereinheit, verfahren, und computerprogramm zur steuerung eines fahrzeugs | |
CN111325869A (zh) | 一种车辆疲劳驾驶精确判断方法、终端设备及存储介质 | |
JP7180574B2 (ja) | 操舵制御装置及び操舵制御方法 | |
CN113968134B (zh) | 一种基于电磁感应的油门踏板限制方法、装置及终端设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |