CN111240312A - 用于自动驾驶车辆的基于学习的动态建模方法 - Google Patents

用于自动驾驶车辆的基于学习的动态建模方法 Download PDF

Info

Publication number
CN111240312A
CN111240312A CN201910828148.7A CN201910828148A CN111240312A CN 111240312 A CN111240312 A CN 111240312A CN 201910828148 A CN201910828148 A CN 201910828148A CN 111240312 A CN111240312 A CN 111240312A
Authority
CN
China
Prior art keywords
adv
control commands
planning
states
neural network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910828148.7A
Other languages
English (en)
Other versions
CN111240312B (zh
Inventor
罗琦
许稼轩
许珂诚
肖祥全
余思洋
缪景皓
胡江滔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu USA LLC
Original Assignee
Baidu USA LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Baidu USA LLC filed Critical Baidu USA LLC
Publication of CN111240312A publication Critical patent/CN111240312A/zh
Application granted granted Critical
Publication of CN111240312B publication Critical patent/CN111240312B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course or altitude of land, water, air, or space vehicles, e.g. automatic pilot
    • G05D1/02Control of position or course in two dimensions
    • G05D1/021Control of position or course in two dimensions specially adapted to land vehicles
    • G05D1/0231Control of position or course in two dimensions specially adapted to land vehicles using optical position detecting means
    • G05D1/0234Control of position or course in two dimensions specially adapted to land vehicles using optical position detecting means using optical markers or beacons
    • G05D1/0236Control of position or course in two dimensions specially adapted to land vehicles using optical position detecting means using optical markers or beacons in combination with a laser
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course or altitude of land, water, air, or space vehicles, e.g. automatic pilot
    • G05D1/02Control of position or course in two dimensions
    • G05D1/021Control of position or course in two dimensions specially adapted to land vehicles
    • G05D1/0212Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory
    • G05D1/0221Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory involving a learning process
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W60/00Drive control systems specially adapted for autonomous road vehicles
    • B60W60/001Planning or execution of driving tasks
    • B60W60/0011Planning or execution of driving tasks involving control alternatives for a single driving scenario, e.g. planning several paths to avoid obstacles
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course or altitude of land, water, air, or space vehicles, e.g. automatic pilot
    • G05D1/0088Control of position, course or altitude of land, water, air, or space vehicles, e.g. automatic pilot characterized by the autonomous decision making process, e.g. artificial intelligence, predefined behaviours
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course or altitude of land, water, air, or space vehicles, e.g. automatic pilot
    • G05D1/02Control of position or course in two dimensions
    • G05D1/021Control of position or course in two dimensions specially adapted to land vehicles
    • G05D1/0212Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory
    • G05D1/0214Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory in accordance with safety or protection criteria, e.g. avoiding hazardous areas
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course or altitude of land, water, air, or space vehicles, e.g. automatic pilot
    • G05D1/02Control of position or course in two dimensions
    • G05D1/021Control of position or course in two dimensions specially adapted to land vehicles
    • G05D1/0212Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory
    • G05D1/0223Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory involving speed control of the vehicle
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course or altitude of land, water, air, or space vehicles, e.g. automatic pilot
    • G05D1/02Control of position or course in two dimensions
    • G05D1/021Control of position or course in two dimensions specially adapted to land vehicles
    • G05D1/0212Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory
    • G05D1/0225Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory involving docking at a fixed facility, e.g. base station or loading bay
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course or altitude of land, water, air, or space vehicles, e.g. automatic pilot
    • G05D1/02Control of position or course in two dimensions
    • G05D1/021Control of position or course in two dimensions specially adapted to land vehicles
    • G05D1/0231Control of position or course in two dimensions specially adapted to land vehicles using optical position detecting means
    • G05D1/0238Control of position or course in two dimensions specially adapted to land vehicles using optical position detecting means using obstacle or wall sensors
    • G05D1/024Control of position or course in two dimensions specially adapted to land vehicles using optical position detecting means using obstacle or wall sensors in combination with a laser
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course or altitude of land, water, air, or space vehicles, e.g. automatic pilot
    • G05D1/02Control of position or course in two dimensions
    • G05D1/021Control of position or course in two dimensions specially adapted to land vehicles
    • G05D1/0231Control of position or course in two dimensions specially adapted to land vehicles using optical position detecting means
    • G05D1/0242Control of position or course in two dimensions specially adapted to land vehicles using optical position detecting means using non-visible light signals, e.g. IR or UV signals
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course or altitude of land, water, air, or space vehicles, e.g. automatic pilot
    • G05D1/02Control of position or course in two dimensions
    • G05D1/021Control of position or course in two dimensions specially adapted to land vehicles
    • G05D1/0231Control of position or course in two dimensions specially adapted to land vehicles using optical position detecting means
    • G05D1/0246Control of position or course in two dimensions specially adapted to land vehicles using optical position detecting means using a video camera in combination with image processing means
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course or altitude of land, water, air, or space vehicles, e.g. automatic pilot
    • G05D1/02Control of position or course in two dimensions
    • G05D1/021Control of position or course in two dimensions specially adapted to land vehicles
    • G05D1/0255Control of position or course in two dimensions specially adapted to land vehicles using acoustic signals, e.g. ultra-sonic singals
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course or altitude of land, water, air, or space vehicles, e.g. automatic pilot
    • G05D1/02Control of position or course in two dimensions
    • G05D1/021Control of position or course in two dimensions specially adapted to land vehicles
    • G05D1/0257Control of position or course in two dimensions specially adapted to land vehicles using a radar
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course or altitude of land, water, air, or space vehicles, e.g. automatic pilot
    • G05D1/02Control of position or course in two dimensions
    • G05D1/021Control of position or course in two dimensions specially adapted to land vehicles
    • G05D1/0259Control of position or course in two dimensions specially adapted to land vehicles using magnetic or electromagnetic means
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course or altitude of land, water, air, or space vehicles, e.g. automatic pilot
    • G05D1/02Control of position or course in two dimensions
    • G05D1/021Control of position or course in two dimensions specially adapted to land vehicles
    • G05D1/0259Control of position or course in two dimensions specially adapted to land vehicles using magnetic or electromagnetic means
    • G05D1/0261Control of position or course in two dimensions specially adapted to land vehicles using magnetic or electromagnetic means using magnetic plots
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course or altitude of land, water, air, or space vehicles, e.g. automatic pilot
    • G05D1/02Control of position or course in two dimensions
    • G05D1/021Control of position or course in two dimensions specially adapted to land vehicles
    • G05D1/0276Control of position or course in two dimensions specially adapted to land vehicles using signals provided by a source external to the vehicle
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course or altitude of land, water, air, or space vehicles, e.g. automatic pilot
    • G05D1/02Control of position or course in two dimensions
    • G05D1/021Control of position or course in two dimensions specially adapted to land vehicles
    • G05D1/0276Control of position or course in two dimensions specially adapted to land vehicles using signals provided by a source external to the vehicle
    • G05D1/0278Control of position or course in two dimensions specially adapted to land vehicles using signals provided by a source external to the vehicle using satellite positioning signals, e.g. GPS
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course or altitude of land, water, air, or space vehicles, e.g. automatic pilot
    • G05D1/02Control of position or course in two dimensions
    • G05D1/021Control of position or course in two dimensions specially adapted to land vehicles
    • G05D1/0276Control of position or course in two dimensions specially adapted to land vehicles using signals provided by a source external to the vehicle
    • G05D1/028Control of position or course in two dimensions specially adapted to land vehicles using signals provided by a source external to the vehicle using a RF signal
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions

Abstract

在实施方式中,提供了与自动驾驶车辆ADV一起使用的基于学习的动态建模方法。ADV中的控制模块可以生成针对第一驾驶周期的ADV的当前状态和控制命令,并且将当前状态和控制命令发送给动态模型,所述动态模型使用经训练的神经网络模型进行实施。基于当前状态和控制命令,动态模型生成针对第二驾驶周期的预期未来状态,在第二驾驶周期期间,控制模块生成实际未来状态。ADV将预期未来状态与实际未来状态进行比较,以生成比较结果,比较结果用于对ADV中的决策模块、规划模块和控制模块中的一个或多个进行评估。

Description

用于自动驾驶车辆的基于学习的动态建模方法
技术领域
本公开的实施方式总体涉及操作自动驾驶车辆。更具体地,本公开的实施方式涉及用于自动驾驶车辆的基于学习的动态建模方法。
背景技术
以自动驾驶模式运行(例如,无人驾驶)的车辆可以将乘员、尤其是驾驶员从一些驾驶相关的职责中解放出来。当以自动驾驶模式运行时,车辆可以使用车载传感器和高清地图导航到各个位置,从而允许车辆在最少人机交互的情况下或在没有任何乘客的一些情况下行驶。
自动驾驶车辆(ADV)依赖于多种模块来规划轨迹并控制致动器命令。这些模块中使用的过程和算法通常需要进行测试,或者响应于发生变化的驾驶环境进行调整。动态模型描述了ADV的动态特性,可以基于车辆的当前状态和致动器命令来预测ADV的未来状态。
现有的动态模型依赖于静态数据表,例如校准表和解析方程。考虑到ADV的特性的动态本质,难以将单个此类动态模型应用于多个ADV或使动态模型适应于不同的场景。此外,通常需要大量的数据表来使这种动态模型精确且有效。因此,需要一种能够容易地扩展到不同车辆的轻量且精确的动态模型。
发明内容
本公开的一方面提供了一种用于操作自动驾驶车辆(ADV)的计算机实施方法,该方法包括:响应于针对第一驾驶周期的用于控制ADV的第一组一个或多个控制命令,测量ADV的多个当前状态;基于多个当前状态和第一组控制命令,使用动态模型对针对第二驾驶周期的多个预期未来状态进行预测;响应于针对第二驾驶周期的用于控制ADV的第二组一个或多个控制命令,测量多个实际未来状态;将多个预期未来状态与多个实际未来状态进行比较;以及基于比较来修改规划算法,其中,所修改的规划算法在对用于自动驾驶ADV的后续路径进行规划时被实时地使用。
本公开另一方面提供了一种存储有指令的非暂时性机器可读介质,指令在由处理器运行时致使处理器执行操作自动驾驶车辆(ADV)的操作,该操作包括:响应于针对第一驾驶周期的用于控制ADV的第一组一个或多个控制命令,测量ADV的多个当前状态;基于多个当前状态和第一组控制命令,使用动态模型对针对第二驾驶周期的多个预期未来状态进行预测;响应于针对第二驾驶周期的用于控制ADV的第二组一个或多个控制命令,测量多个实际未来状态;将多个预期未来状态与多个实际未来状态进行比较;以及基于比较来修改规划算法,其中,所修改的规划算法在对用于自动驾驶ADV的后续路径进行规划时被实时地使用。
本公开又一方面提供了一种数据处理系统,其包括:处理器;以及存储器,存储器联接至处理器并存储指令,指令在由处理器运行时使得处理器执行操作自动驾驶车辆(ADV)的操作,操作包括:响应于针对第一驾驶周期的用于控制ADV的第一组一个或多个控制命令,测量ADV的多个当前状态;基于多个当前状态和第一组控制命令,使用动态模型对针对第二驾驶周期的多个预期未来状态进行预测;响应于针对第二驾驶周期的用于控制ADV的第二组一个或多个控制命令,测量多个实际未来状态;将多个预期未来状态与多个实际未来状态进行比较;以及基于比较来修改规划算法,其中,所修改的规划算法在对用于自动驾驶ADV的后续路径进行规划时被实时地使用。
附图说明
本公开的实施方式在附图的各图中以举例而非限制的方式示出,附图中的相同参考数字指示相似元件。
图1是示出根据一个实施方式的网络化系统的框图。
图2是示出根据一个实施方式的自动驾驶车辆的示例的框图。
图3A和图3B是示出根据一个实施方式的与自动驾驶车辆一起使用的感知与规划系统的示例的框图。
图4示出了根据实施方式的用于提供与ADV一起使用的动态模型的系统。
图5示出了根据实施方式的使用动态模型的示例性数据流。
图6示出了根据实施方式的在ADV中使用的示例性神经网络模型。
图7是示出根据实施方式的提供与ADV一起使用的动态模型的示例性过程的流程图。
图8是示出可以与一个实施方式一起使用的数据处理系统的示例的框图。
具体实施方式
将参考以下所讨论的细节来描述本公开的各种实施方式和方面,附图将示出所述各种实施方式。下列描述和附图是对本公开的说明,而不应当解释为限制本公开。描述了许多特定细节以提供对本公开各种实施方式的全面理解。然而,在某些情况下,并未描述众所周知的或常规的细节以提供对本公开的实施方式的简洁讨论。
本说明书中对“一个实施方式”或“实施方式”的引述意味着结合该实施方式所描述的特定特征、结构或特性可以包括在本公开的至少一个实施方式中。短语“在一个实施方式中”在本说明书中各处的记载不必全部指同一实施方式。
在实施方式中,提供了与自动驾驶车辆一起使用的基于学习的动态建模方法。ADV中的控制模块可以生成针对第一驾驶周期的ADV的当前状态和控制命令,并且将当前状态和控制命令发送给动态模型,所述动态模型使用经训练的神经网络模型进行实施。基于当前状态和控制命令,动态模型生成针对第二驾驶周期的预期未来状态。控制模块也生成针对第二驾驶周期的实际未来状态。随后,ADV可以将预期未来状态与实际未来状态进行比较,以生成比较结果,该比较结果可以用于对ADV中的决策模块、规划模块和控制模块中的一个或多个进行评估。
在实施方式中,用于实施动态模型的经训练的神经网络可以是线性回归、多层感知器(MLP)或递归神经网络(RNN)中的一个,或者可以是其他类型的神经网络模型。可以在离线模式下使用通过ADV的传感器在多种道路状况中收集的真实世界数据对神经网络模型进行训练。神经网络模型可以包括输入层、一个或多个隐藏层和输出层。输入层将当前状态和控制命令作为输入馈送到一个或多个隐藏层中。每个隐藏层都封装有用于从输入生成中间输出的复杂函数。输出层收集中间输出,并产生用于ADV的第二驾驶周期的预期未来状态。
当前状态包括针对第一驾驶周期的ADV的速度、加速度和角速度;并且控制命令包括针对第一驾驶周期的油门命令、制动命令和转向命令。每个当前状态可以具有针对第二驾驶周期的相应的预期未来状态和实际未来状态。第一驾驶周期和第二驾驶周期中的每个均可以是ADV在此期间生成规划与控制数据并且基于规划与控制数据发出一个或多个控制命令的时间间隔。
在将仿真环境中的控制与规划算法部署给ADV之前,可以使用基于学习的动态模型来基于ADV的真实世界的动态特性(例如,当前状态和实际未来状态)对控制与规划算法进行测试和调整。由此,基于学习的动态算法可以极大地提高ADV的算法开发的安全性和效率。
在实施方式中,ADV还包括逆动态模型,该逆动态模型配置成基于当前状态和预期未来状态来计算一个或多个控制命令,以用于ADV的实时自适应控制。
自动驾驶车辆
图1是示出根据本公开的一个实施方式的自动驾驶车辆网络配置的框图。参考图1,网络配置100包括可以通过网络102通信地联接到一个或多个服务器103至104的自动驾驶车辆101。尽管示出一个自动驾驶车辆,但多个自动驾驶车辆可以通过网络102联接到彼此和/或联接到服务器103至104。网络102可以是任何类型的网络,例如,有线或无线的局域网(LAN)、诸如互联网的广域网(WAN)、蜂窝网络、卫星网络或其组合。服务器103至104可以是任何类型的服务器或服务器群集,诸如,网络或云服务器、应用服务器、后端服务器或其组合。服务器103至104可以是数据分析服务器、内容服务器、交通信息服务器、地图和兴趣点(MPOI)服务器或者位置服务器等。
自动驾驶车辆是指可以被配置成处于自动驾驶模式下的车辆,在所述自动驾驶模式下车辆在极少或没有来自驾驶员的输入的情况下导航通过环境。这种自动驾驶车辆可以包括传感器系统,所述传感器系统具有被配置成检测与车辆运行环境有关的信息的一个或多个传感器。所述车辆和其相关联的控制器使用所检测的信息来导航通过所述环境。自动驾驶车辆101可以在手动模式下、在全自动驾驶模式下或者在部分自动驾驶模式下运行。
在一个实施方式中,自动驾驶车辆101包括,但不限于,感知与规划系统110、车辆控制系统111、无线通信系统112、用户接口系统113、信息系统114(未示出)和传感器系统115。自动驾驶车辆101还可以包括普通车辆中包括的某些常用部件,诸如:发动机、车轮、方向盘、变速器等,所述部件可以由车辆控制系统111和/或感知与规划系统110使用多种通信信号和/或命令进行控制,该多种通信信号和/或命令例如,加速信号或命令、减速信号或命令、转向信号或命令、制动信号或命令等。
部件110至115可以经由互连件、总线、网络或其组合通信地联接到彼此。例如,部件110至115可以经由控制器局域网(CAN)总线通信地联接到彼此。CAN总线是被设计成允许微控制器和装置在没有主机的应用中与彼此通信的车辆总线标准。它是最初是为汽车内的复用电气布线设计的基于消息的协议,但也用于许多其它环境。
现在参考图2,在一个实施方式中,传感器系统115包括但不限于一个或多个摄像机211、全球定位系统(GPS)单元212、惯性测量单元(IMU)213、雷达单元214以及光探测和测距(LIDAR)单元215。GPS系统212可以包括收发器,所述收发器可操作以提供关于自动驾驶车辆的位置的信息。IMU单元213可以基于惯性加速度来感测自动驾驶车辆的位置和定向变化。雷达单元214可以表示利用无线电信号来感测自动驾驶车辆的本地环境内的对象的系统。在一些实施方式中,除感测对象之外,雷达单元214可以另外感测对象的速度和/或前进方向。LIDAR单元215可以使用激光来感测自动驾驶车辆所处环境中的对象。除其它系统部件之外,LIDAR单元215还可以包括一个或多个激光源、激光扫描器以及一个或多个检测器。摄像机211可以包括用来采集自动驾驶车辆周围环境的图像的一个或多个装置。摄像机211可以是静物摄像机和/或视频摄像机。摄像机可以是可机械地移动的,例如,通过将摄像机安装在旋转和/或倾斜平台上。
传感器系统115还可以包括其它传感器,诸如:声纳传感器、红外传感器、转向传感器、油门传感器、制动传感器以及音频传感器(例如,麦克风)。音频传感器可以被配置成从自动驾驶车辆周围的环境中采集声音。转向传感器可以被配置成感测方向盘、车辆的车轮或其组合的转向角度。油门传感器和制动传感器分别感测车辆的油门位置和制动位置。在一些情形下,油门传感器和制动传感器可以集成为集成式油门/制动传感器。
在一个实施方式中,车辆控制系统111包括但不限于转向单元201、油门单元202(也被称为加速单元)和制动单元203。转向单元201用来调整车辆的方向或前进方向。油门单元202用来控制电动机或发动机的速度,电动机或发动机的速度进而控制车辆的速度和加速度。制动单元203通过提供摩擦使车辆的车轮或轮胎减速而使车辆减速。应注意,如图2所示的部件可以以硬件、软件或其组合实施。
回到图1,无线通信系统112允许自动驾驶车辆101与诸如装置、传感器、其它车辆等外部系统之间的通信。例如,无线通信系统112可以与一个或多个装置直接无线通信,或者经由通信网络进行无线通信,诸如,通过网络102与服务器103至104通信。无线通信系统112可以使用任何蜂窝通信网络或无线局域网(WLAN),例如,使用WiFi,以与另一部件或系统通信。无线通信系统112可以例如使用红外链路、蓝牙等与装置(例如,乘客的移动装置、显示装置、车辆101内的扬声器)直接通信。用户接口系统113可以是在车辆101内实施的外围装置的部分,包括例如键盘、触摸屏显示装置、麦克风和扬声器等。
自动驾驶车辆101的功能中的一些或全部可以由感知与规划系统110控制或管理,尤其当在自动驾驶模式下操作时。感知与规划系统110包括必要的硬件(例如,处理器、存储器、存储设备)和软件(例如,操作系统、规划和路线制定程序),以从传感器系统115、控制系统111、无线通信系统112和/或用户接口系统113接收信息,处理所接收的信息,规划从起始点到目的地点的路线或路径,随后基于规划和控制信息来驾驶车辆101。替代地,感知与规划系统110可以与车辆控制系统111集成在一起。
例如,作为乘客的用户可以例如经由用户接口来指定行程的起始位置和目的地。感知与规划系统110获得行程相关数据。例如,感知与规划系统110可以从MPOI服务器中获得位置和路线信息,所述MPOI服务器可以是服务器103至104的一部分。位置服务器提供位置服务,并且MPOI服务器提供地图服务和某些位置的POI。替代地,此类位置和MPOI信息可以本地高速缓存在感知与规划系统110的永久性存储装置中。
当自动驾驶车辆101沿着路线移动时,感知与规划系统110也可以从交通信息系统或服务器(TIS)获得实时交通信息。应注意,服务器103至104可以由第三方实体进行操作。替代地,服务器103至104的功能可以与感知与规划系统110集成在一起。基于实时交通信息、MPOI信息和位置信息以及由传感器系统115检测或感测的实时本地环境数据(例如,障碍物、对象、附近车辆),感知与规划系统110可以规划最佳路线并且根据所规划的路线例如经由控制系统111来驾驶车辆101,以安全且高效到达指定目的地。
服务器103可以是用于为各种客户端执行数据分析服务的数据分析系统。在一个实施方式中,数据分析系统103包括数据收集器121和机器学习引擎122。数据收集器121从各种车辆(自动驾驶车辆或由人类驾驶员驾驶的常规车辆)收集驾驶统计数据123。驾驶统计数据123包括指示在不同时间点发出的驾驶命令(例如,油门、制动、转向命令)和由车辆的传感器采集的车辆的响应(例如,速度、加速、减速、方向)的信息。驾驶统计数据123还可以包括描述在不同时间点的驾驶环境的信息,例如,路线(包括起始和目的地位置)、MPOI、道路状况、天气状况等。
基于驾驶统计数据123,机器学习引擎122出于各种目的生成或训练一组规则、算法和/或预测模型124。例如,可以选择并限定一组具有初始系数或参数的五次多项式函数。此外,还可以基于诸如传感器规格和具体车辆设计的硬件特性来限定一组约束,其可以从驾驶统计数据123获得。然后,可以将算法124上传到ADV上,以在自动驾驶期间实时使用。
图3A至图3B是示出根据一个实施方式的与自动驾驶车辆一起使用的感知与规划系统的示例的框图。系统300可以被实施为图1的自动驾驶车辆101的一部分,包括但不限于感知与规划系统110、控制系统111和传感器系统115。参考图3A至图3B,感知与规划系统110包括但不限于定位模块301、感知模块302、预测模块303、决策模块304、规划模块305、控制模块306、路线规划模块307以及虚拟车辆模块309。
模块301至309中的一些或全部可以以软件、硬件或其组合实施。例如,这些模块可以安装在永久性存储装置352中、加载到存储器351中,并且由一个或多个处理器(未示出)执行。应注意,这些模块中的一些或全部可以通信地联接到图2的车辆控制系统111的一些或全部模块或者与它们集成在一起。模块301至309中的一些可以一起集成为集成模块。
定位模块301确定自动驾驶车辆300的当前位置(例如,利用GPS单元212)和管理与用户的行程或路线相关的任何数据。定位模块301(也被称为地图与路线模块)管理与用户的行程或路线相关的任何数据。用户可以例如经由用户接口登录并且指定行程的起始位置和目的地。定位模块301与自动驾驶车辆300的诸如地图和路线信息311的其它部件通信,以获得行程相关数据。例如,定位模块301可以从位置服务器和地图与POI(MPOI)服务器获得位置和路线信息。位置服务器提供位置服务,并且MPOI服务器提供地图服务和某些位置的POI,从而可以作为地图和路线信息311的一部分高速缓存。当自动驾驶车辆300沿着路线移动时,定位模块301也可以从交通信息系统或服务器获得实时交通信息。
基于由传感器系统115提供的传感器数据和由定位模块301获得的定位信息,感知模块302确定对周围环境的感知。感知信息可以表示普通驾驶员在驾驶员正驾驶的车辆周围将感知到的东西。感知可以包括例如采用对象形式的车道配置、交通灯信号、另一车辆的相对位置、行人、建筑物、人行横道或其它交通相关标志(例如,停止标志、让行标志)等。车道配置包括描述一条或多条车道的信息,例如,车道的形状(例如,直线车道或弯曲车道)、车道的宽度、道路中的车道数量、单向或双向车道、合流或分流车道、出口车道等。
感知模块302可以包括计算机视觉系统或计算机视觉系统的功能,以处理并分析由一个或多个摄像机采集的图像,从而识别自动驾驶车辆环境中的对象和/或特征。所述对象可以包括交通信号、道路边界、其它车辆、行人和/或障碍物等。计算机视觉系统可以使用对象识别算法、视频跟踪以及其它计算机视觉技术。在一些实施方式中,计算机视觉系统可以绘制环境地图,跟踪对象,以及估算对象的速度等。感知模块302也可以基于由诸如雷达和/或LIDAR的其它传感器提供的其它传感器数据来检测对象。
针对每个对象,预测模块303预测在不同情况下对象将如何表现。预测是鉴于地图/路线信息311和交通规则312的集合、基于在时间点感知驾驶环境的感知数据来执行的。例如,如果对象是在相反方向上的车辆并且当前驾驶环境包括交叉路口,预测模块303将预测车辆是否可能直线前进或转弯。如果感知数据指示交叉路口没有交通信号灯,则预测模块303可预测车辆可能在进入交叉路口之前必须完全停止。如果感知数据指示车辆当前位于仅限左转的车道或仅限右转的车道,则预测模块303可预测车辆将非常可能分别进行左转或右转。
针对每个对象,决策模块304作出关于如何处置对象的决定。例如,针对特定对象(例如,交叉路线中的另一车辆)以及描述对象的元数据(例如,速度、方向、转弯角度),决策模块304决定如何与所述对象相遇(例如,超车、让行、停止、超过)。决策模块304可以根据诸如交通规则或驾驶规则312的规则集来作出此类决定,所述规则集可以存储在永久性存储装置352中。
路线规划模块307被配置成提供从起始点到目的地点的一个或多个路线或路径。例如,对于从用户接收的从起始位置到目的地位置的给定行程,路线规划模块307获得路线和地图信息311并确定从起始位置到达目的地位置的所有可能路线或路径。路线规划模块307可以以地形图的形式为确定的每个路线生成从起始位置到达目的地位置的参考路线。参考路线指的是不受任何其他事物诸如其他车辆、障碍物或交通状况等干扰的理想的路线或路径。换而言之,如果道路上没有其他车辆、行人或障碍物,则ADV应该精确或严密地跟从参考路线。然后,地形图被提供给决策模块304和/或规划模块305。决策模块304和/或规划模块305检查所有可能的路线,以考虑到由其他模块提供的其他数据,诸如来自定位模块301的交通状况、感知模块302感知的驾驶环境以及预测模块303预测的交通状况来选择和修改最佳路线中的一个。用于控制ADV的实际路径或路线可以与路线规划模块307提供的参考路线接近或不同于参考路线,这取决于在那个时间点的具体驾驶环境。
基于针对所感知到的对象中的每个的决定,规划模块305为自动驾驶车辆规划路径或路线以及驾驶参数(例如,距离、速度和/或转弯角度),使用由路线规划模块307提供的参考路线作为基准。换而言之,针对给定的对象,决策模块304决定对该对象做什么,而规划模块305确定如何去做。例如,针对给定的对象,决策模块304可以决定超过所述对象,而规划模块305可以确定在所述对象的左侧还是右侧超过。规划和控制数据由规划模块305生成,包括描述车辆300在下一移动循环(例如,下一路线段/路径段)中将如何移动的信息。例如,规划和控制数据可以指示车辆300以30英里每小时(mph)的速度移动10米,随后以25mph的速度变到右侧车道。
基于规划和控制数据,控制模块306根据由规划和控制数据限定的路线或路径通过将适当的命令或信号发送到车辆控制系统111来控制并驾驶自动驾驶车辆。所述规划和控制数据包括足够的信息,以沿着路径或路线在不同的时间点使用适当的车辆设置或驾驶参数(例如,油门、制动和转弯命令)将车辆从路线或路径的第一点驾驶到第二点。
在一个实施方式中,规划阶段在多个规划周期中执行,规划周期也被称为驾驶周期,例如,在100毫秒(ms)的每个时间间隔中。对于每个规划周期或驾驶周期,将基于规划和控制数据发出一个或多个控制命令。换而言之,针对每100ms,规划模块305规划下一个路线段或路径段,例如,包括目标位置和ADV到达目标位置所需的时间。替代地,规划模块305可以进一步指定具体的速度、方向和/或转向角度等。在一个实施方式中,规划模块305针对下一个预先确定的时间段(诸如5秒)规划路线段或路径段。针对每个规划周期,规划模块305基于在前一个周期中规划的目标位置规划当前周期(例如,接下来的5秒)的目标位置。然后,控制模块306基于当前周期的规划和控制数据生成一个或多个控制命令(例如,油门、制动和转向控制命令)。
应注意,决策模块304和规划模块305可以集成为集成模块。决策模块304/规划模块305可以包括导航系统或导航系统的功能,以确定自动驾驶车辆的驾驶路径。例如,导航系统可以确定用于实现自动驾驶车辆沿着以下路径移动的一系列速度和前进方向:所述路径在使自动驾驶车辆沿着通往最终目的地的基于车行道的路径前进的同时,基本上避免感知到的障碍物。目的地可以根据经由用户接口系统113进行的用户输入来设定。导航系统可以在自动驾驶车辆正在运行的同时动态地更新驾驶路径。导航系统可以将来自GPS系统和一个或多个地图的数据合并,以确定用于自动驾驶车辆的驾驶路径。
虚拟车辆模块309可以作为仿真器进行操作,并且可以使用训练的神经网络模型进行实施。当控制模块306在规划阶段的驾驶周期中生成ADV的当前状态(例如,速度)和控制命令时,控制模块306可以将当前状态和控制命令发送给经训练的神经模块,所述经训练的神经模块用于生成针对第二驾驶周期的ADV的预期未来状态。ADV可以将预期的未来状态与通过控制模块306生成的针对第二驾驶周期的实际未来状态进行比较。可以使用两组未来状态之间的比较结果来对ADV中的决策模块304、规划模块305、控制模块306以及一个或多个其他模块进行评估。
应注意,如上文示出和描述的部件中的一些或全部可以在软件、硬件或其组合中实施。例如,此类部件可以实施为安装并存储在永久性存储装置中的软件,所述软件可以通过处理器(未示出)加载在存储器中并在存储器中执行以实施本申请全文中所述的过程或操作。替代地,此类部件可以实施为编程或嵌入到专用硬件(诸如,集成电路(例如,专用集成电路或ASIC)、数字信号处理器(DSP)或现场可编程门阵列(FPGA))中的可执行代码,所述可执行代码可以经由来自应用的相应驱动程序和/或操作系统来访问。此外,此类部件可以实施为处理器或处理器内核中的特定硬件逻辑,作为可由软件部件通过一个或多个特定指令访问的指令集的一部分。
动态模型
图4示出了根据实施方式的用于提供与ADV一起使用的动态模型的系统。
如图4所示,虚拟车辆模块309可以作为仿真器进行操作,并且可以包括经训练的神经网络模型(或动态模型)401。经训练的神经网络模型401是可以接收405一组ADV的当前状态以及一个或多个控制命令的动态模型,所述一个或多个控制命令在特定驾驶周期期间由控制模块306生成。一个或多个控制命令也被发送403到控制系统111,以根据由规划与控制数据限定的路线或路径将ADV导航到下一目标位置。
神经网络模型401可以在离线模式下使用由传感器(例如,IMU和GPS)收集的、记录车辆在可以涵盖多种道路类型、障碍物类型和道路环境的多种场景中的实时动态(例如,状态)的真实世界数据进行训练。例如,真实世界数据可以从百度TM的阿波罗(Apollo)开放数据平台下载。神经网络模型401可包括输入层、一个或多个隐藏层以及一个或多个输出层。输入层将当前状态和控制命令作为输入馈送到一个或多个隐藏层中。每个隐藏层都封装有用于由输入生成中间输出的复杂函数。一个或多个输出层收集中间输出并产生用于ADV的第二驾驶周期的预期未来状态408。
在实施方式中,ADV的状态可以包括驾驶参数,诸如速度、加速度、角速度。提供ADV的上述状态作为示例。取决于模拟或评估要求,也可使用其他状态作为动态模型的输入。例如,如果动态模型将对ADV的斜率状况进行仿真,则可以使用ADV的一个或多个俯仰角作为动态模型的输入。控制命令可包括与油门、制动和车轮转向相关的命令。ADV可以在每个驾驶周期(例如,100ms)中生成驾驶参数。驾驶周期可以是ADV在此期间生成规划与控制数据的时间间隔,并且基于规划与控制数据发出一个或多个控制命令。
在实施方式中,虚拟车辆模块309可以接收406通过控制模块306生成的针对第二驾驶周期的实际未来状态407。可以使用损失函数409将预期未来状态408与实际未来状态407进行比较,从而生成比较结果411。比较结果411可以被保存到永久性存储装置352以供将来使用,例如,用于对动态模型401进行微调,以及对决策模块304、规划模块305和/或控制模块306进行评估。
由于ADV的状态和控制命令是基于来自决策模块304和规划模块305的数据通过控制模块306发出的,因此实际未来状态407与预期未来状态408之间的显著差异表示这些模块中使用的一个或多个过程或算法无法按预期执行。在离线模式下,可以使用比较结果411中的差异对那些模块进行评估和修改。
图5示出了根据实施方式的使用动态模型的示例性数据流。
图5中示出的数据流使用多层感知器(MLP)神经网络模型作为示例,并且以离线阶段509开始,在离线阶段509期间可以使用脚本来从原始数据501(例如,百度TM的阿波罗(Apollo)数据平台上的数据)提取训练数据集503。然后,对MLP模型进行训练,并将训练结果存储在二进制文件505中。
在线上阶段511期间,可以使用仿真控制加载器将经训练的MLP模型505加载507到自动驾驶车辆的存储器中,并且经训练的MLP模型505可以用于预测ADV的状态。
在实施方式中,MLP神经网络模型505的输入层包括ADV的最新/当前状态(例如,速度、加速度、角速度)以及控制命令(例如,油门、制动、转向)。MLP神经网络模型505的输出层包括针对下一驾驶周期预测的加速度和角速度。可以通过随时间对预测的加速度和角速度进行积分来计算ADV在下一驾驶周期中的速度和行进。
图6示出了根据实施方式的在ADV中使用的示例性神经网络模型。
神经网络模型600是使用由车辆中的传感器收集的真实世界数据训练的多层感知器(MLP)神经网络模型。神经网络模型可以包括设计成模拟人脑的连接神经元的集合。MLP神经网络模型中的神经元完全连接,一层中的每个节点以特定权重连接至下一层中的每个节点。在训练期间,神经网络模型600在对每个数据片段处理之后基于输出中相比于预期结果的错误量来改变连接权重。
返回参考图6,MLP神经网络模型600可包括用于接收输入数据601的输入层605、对输入数据做出决策或预测的输出层609以及位于输入层605与输出层609之间的任意数量的隐藏层(例如,隐藏层607)。隐藏层是神经网络模型600的真正计算引擎。隐藏层607中的神经元可以包括用于对输入数据601进行变换的激活函数。修正线性单元(ReLU)602是在神经网络模型600中使用的激活函数。如果ReLU602接收到任何负输入,则返回0;并且针对接收到的任意正值,ReLU602返回该值。虽然图600示出了一个隐藏层607和一个输出层609,但MLP神经网络模型600可以包括多个隐藏层和多个输出层。
在实施方式中,用于神经网络模型600的输入数据601包括针对第一驾驶周期的ADV的状态(例如,速度、加速度和角速度)以及控制命令(例如,油门命令、制动命令和转向命令)。输入数据601通过一个或多个隐藏层进行处理并转换成输出数据604,输出数据604是针对第二驾驶周期的ADV的预期状态。可以以图形方式显示603和608每个预期状态(例如,加速度和角速度)。基于随时间的加速度和角速度,可以对针对第二驾驶周期的ADV的速度进行计算。
图7是示出根据实施方式的提供与ADV一起使用的动态模型的示例性过程的流程图。
过程700可以由处理逻辑执行,处理逻辑可以包括软件、硬件或其组合。过程700可以由处理逻辑执行,处理逻辑可以包括硬件(例如,电路、专用逻辑、可编程逻辑、处理器、处理装置、中央处理单元(CPU)、片上系统(SoC)等)、软件(例如,在处理装置上运行/执行的指令)、固件(例如,微代码)或其组合。在一些实施方式中,过程700可以由如图3A和图3B所示的感知模块302和规划模块305中的一个或多个执行。
参考图7,在操作701中,响应于针对第一驾驶周期的对ADV进行控制的第一组一个或多个控制命令来测量ADV的多个当前状态。响应于第一驾驶周期的第一组控制命令,可以由ADV中的控制模块生成当前状态。ADV的当前状态可以包括ADV在第一驾驶周期期间的速度、加速度和角速度。控制命令可包括制动命令、油门命令和转向命令。在操作703中,基于当前状态和第一组控制命令,使用动态模型来预测针对第二驾驶周期的预期未来状态。动态模型接收当前状态和控制命令作为输入,并基于这些输入生成针对第二驾驶周期的预期未来状态。动态模型表示使用人工编辑的数据集进行训练的神经网络模型,其中,人工编辑的数据集可以从开源数据平台获得。在操作705中,响应于针对第二驾驶周期的控制ADV的第二组一个或多个控制命令来测量多个实际未来状态。通过针对第二驾驶周期的控制命令生成实际未来状态。在操作707中,将预期未来状态与实际未来状态进行比较,以生成比较结果。在操作709中,基于该比较来修改规划算法,以在对用于自动驾驶ADV的后续路径进行规划时实时地使用。
应注意,如上文示出和描述的部件中的一些或全部可以在软件、硬件或其组合中实施。例如,此类部件可以实施为安装并存储在永久性存储装置中的软件,所述软件可以通过处理器(未示出)加载在存储器中并在存储器中执行以实施本申请全文中所述的过程或操作。替代地,此类部件可以实施为编程或嵌入到专用硬件(诸如,集成电路(例如,专用集成电路或ASIC)、数字信号处理器(DSP)或现场可编程门阵列(FPGA))中的可执行代码,所述可执行代码可以经由来自应用的相应驱动程序和/或操作系统来访问。此外,此类部件可以实施为处理器或处理器内核中的特定硬件逻辑,作为可由软件部件通过一个或多个特定指令访问的指令集的一部分。
图8是示出可以与本公开的一个实施方式一起使用的数据处理系统的示例的框图。例如,系统1500可以表示以上所述的执行上述过程或方法中的任一个的任何数据处理系统,例如,图1的虚拟车辆模块309。系统1500可以包括许多不同的部件。这些部件可以实施为集成电路(IC)、集成电路的部分、分立电子装置或适用于电路板(诸如,计算机系统的主板或插入卡)的其它模块或者实施为以其它方式并入计算机系统的机架内的部件。
还应注意,系统1500旨在示出计算机系统的许多部件的高阶视图。然而,应当理解的是,某些实施方式中可以具有附加的部件,此外,其它实施方式中可以具有所示部件的不同布置。系统1500可以表示台式计算机、膝上型计算机、平板计算机、服务器、移动电话、媒体播放器、个人数字助理(PDA)、智能手表、个人通信器、游戏装置、网络路由器或集线器、无线接入点(AP)或中继器、机顶盒或其组合。此外,虽然仅示出了单个机器或系统,但是术语“机器”或“系统”还应当被理解为包括单独地或共同地执行一个(或多个)指令集以执行本文所讨论的任何一种或多种方法的机器或系统的任何集合。
在一个实施方式中,系统1500包括通过总线或互连件1510连接的处理器1501、存储器1503以及装置1505至1508。处理器1501可以表示其中包括单个处理器内核或多个处理器内核的单个处理器或多个处理器。处理器1501可以表示一个或多个通用处理器,诸如,微处理器、中央处理单元(CPU)等。更具体地,处理器1501可以是复杂指令集计算(CISC)微处理器、精简指令集计算(RISC)微处理器、超长指令字(VLIW)微处理器、或实施其它指令集的处理器、或实施指令集组合的处理器。处理器1501还可以是一个或多个专用处理器,诸如,专用集成电路(ASIC)、蜂窝或基带处理器、现场可编程门阵列(FPGA)、数字信号处理器(DSP)、网络处理器、图形处理器、通信处理器、加密处理器、协处理器、嵌入式处理器、或者能够处理指令的任何其它类型的逻辑。
处理器1501(其可以是低功率多核处理器套接口,诸如超低电压处理器)可以充当用于与所述系统的各种部件通信的主处理单元和中央集线器。这种处理器可以实施为片上系统(SoC)。处理器1501被配置成执行用于执行本文所讨论的操作和步骤的指令。系统1500还可以包括与可选的图形子系统1504通信的图形接口,图形子系统1504可以包括显示控制器、图形处理器和/或显示装置。
处理器1501可以与存储器1503通信,存储器1503在一个实施方式中可以经由多个存储器装置实施以提供给定量的系统存储。存储器1503可以包括一个或多个易失性存储(或存储器)装置,诸如,随机存取存储器(RAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、静态RAM(SRAM)或者其它类型的存储装置。存储器1503可以存储包括由处理器1501或任何其它装置执行的指令序列的信息。例如,各种操作系统、装置驱动程序、固件(例如,输入输出基本系统或BIOS)和/或应用的可执行代码和/或数据可以加载到存储器1503中并由处理器1501执行。操作系统可以是任何类型的操作系统,例如,机器人操作系统(ROS)、来自
Figure BDA0002189789660000171
公司的
Figure BDA0002189789660000172
操作系统、来自苹果公司的Mac
Figure BDA0002189789660000173
来自
Figure BDA0002189789660000174
公司的
Figure BDA0002189789660000175
LINUX、UNIX,或者其它实时或嵌入式操作系统。
系统1500还可以包括I/O装置,诸如装置1505至1508,包括网络接口装置1505、可选的输入装置1506,以及其它可选的I/O装置1507。网络接口装置1505可以包括无线收发器和/或网络接口卡(NIC)。所述无线收发器可以是WiFi收发器、红外收发器、蓝牙收发器、WiMax收发器、无线蜂窝电话收发器、卫星收发器(例如,全球定位系统(GPS)收发器)或其它射频(RF)收发器或者它们的组合。NIC可以是以太网卡。
输入装置1506可以包括鼠标、触摸板、触敏屏幕(其可以与显示装置1504集成在一起)、指针装置(诸如,手写笔)和/或键盘(例如,物理键盘或作为触敏屏幕的一部分显示的虚拟键盘)。例如,输入装置1506可以包括联接到触摸屏的触摸屏控制器。触摸屏和触摸屏控制器例如可以使用多种触敏技术(包括但不限于电容、电阻、红外和表面声波技术)中的任一种,以及其它接近传感器阵列或用于确定与触摸屏接触的一个或多个点的其它元件来检测其接触和移动或间断。
I/O装置1507可以包括音频装置。音频装置可以包括扬声器和/或麦克风,以促进支持语音的功能,诸如语音识别、语音复制、数字记录和/或电话功能。其它I/O装置1507还可以包括通用串行总线(USB)端口、并行端口、串行端口、打印机、网络接口、总线桥(例如,PCI-PCI桥)、传感器(例如,诸如加速度计运动传感器、陀螺仪、磁强计、光传感器、罗盘、接近传感器等)或者它们的组合。装置1507还可以包括成像处理子系统(例如,摄像机),所述成像处理子系统可以包括用于促进摄像机功能(诸如,记录照片和视频片段)的光学传感器,诸如电荷耦合装置(CCD)或互补金属氧化物半导体(CMOS)光学传感器。某些传感器可以经由传感器集线器(未示出)联接到互连件1510,而诸如键盘或热传感器的其它装置可以根据系统1500的具体配置或设计由嵌入式控制器(未示出)控制。
为了提供对诸如数据、应用、一个或多个操作系统等信息的永久性存储,大容量存储设备(未示出)也可以联接到处理器1501。在各种实施方式中,为了实现更薄且更轻的系统设计并且改进系统响应性,这种大容量存储设备可以经由固态装置(SSD)实施。然而,在其它实施方式中,大容量存储设备可以主要使用硬盘驱动器(HDD)实施,其中较小量的SSD存储设备充当SSD高速缓存以在断电事件期间实现上下文状态以及其它此类信息的非易失性存储,从而使得在系统活动重新启动时能够实现快速通电。另外,闪存装置可以例如经由串行外围接口(SPI)联接到处理器1501。这种闪存装置可以提供系统软件的非易失性存储,系统软件包括所述系统的BIOS以及其它固件。
存储装置1508可以包括计算机可访问的存储介质1509(也被称为机器可读存储介质或计算机可读介质),其上存储有体现本文所述的任何一种或多种方法或功能的一个或多个指令集或软件(例如,模块、单元和/或逻辑1528)。处理模块/单元/逻辑1528可以表示上述部件中的任一个,例如规划模块305、控制模块306和虚拟车辆模块309。处理模块/单元/逻辑1528还可以在其由数据处理系统1500、存储器1503和处理器1501执行期间完全地或至少部分地驻留在存储器1503内和/或处理器1501内,数据处理系统1500、存储器1503和处理器1501也构成机器可访问的存储介质。处理模块/单元/逻辑1528还可以通过网络经由网络接口装置1505进行发送或接收。
计算机可读存储介质1509也可以用来永久性地存储以上描述的一些软件功能。虽然计算机可读存储介质1509在示例性实施方式中被示为单个介质,但是术语“计算机可读存储介质”应当被认为包括存储所述一个或多个指令集的单个介质或多个介质(例如,集中式或分布式数据库和/或相关联的高速缓存和服务器)。术语“计算机可读存储介质”还应当被认为包括能够存储或编码指令集的任何介质,所述指令集用于由机器执行并且使得所述机器执行本公开的任何一种或多种方法。因此,术语“计算机可读存储介质”应被认为包括但不限于固态存储器以及光学介质和磁性介质,或者任何其它非暂时性机器可读介质。
本文所述的处理模块/单元/逻辑1528、部件以及其它特征可以实施为分立硬件部件或集成在硬件部件(诸如,ASICS、FPGA、DSP或类似装置)的功能中。此外,处理模块/单元/逻辑1528可以实施为硬件装置内的固件或功能电路。此外,处理模块/单元/逻辑1528可以以硬件装置和软件部件的任何组合来实施。
应注意,虽然系统1500被示出为具有数据处理系统的各种部件,但是并不旨在表示使部件互连的任何特定架构或方式;因为此类细节和本公开的实施方式没有密切关系。还应当认识到,具有更少部件或可能具有更多部件的网络计算机、手持计算机、移动电话、服务器和/或其它数据处理系统也可以与本公开的实施方式一起使用。
前述详细描述中的一些部分已经根据在计算机存储器内对数据位的运算的算法和符号表示而呈现。这些算法描述和表示是数据处理领域中的技术人员所使用的方式,以将他们的工作实质最有效地传达给本领域中的其他技术人员。本文中,算法通常被认为是导致所期望结果的自洽操作序列。这些操作是指需要对物理量进行物理操控的操作。
然而,应当牢记,所有这些和类似的术语均旨在与适当的物理量关联,并且仅仅是应用于这些量的方便标记。除非在以上讨论中以其它方式明确地指出,否则应当了解,在整个说明书中,利用术语(诸如所附权利要求书中所阐述的术语)进行的讨论是指计算机系统或类似电子计算装置的动作和处理,所述计算机系统或电子计算装置操控计算机系统的寄存器和存储器内的表示为物理(电子)量的数据,并将所述数据变换成计算机系统存储器或寄存器或者其它此类信息存储设备、传输或显示装置内类似地表示为物理量的其它数据。
本公开的实施方式还涉及用于执行本文中的操作的设备。这种计算机程序被存储在非暂时性计算机可读介质中。机器可读介质包括用于以机器(例如,计算机)可读的形式存储信息的任何机构。例如,机器可读(例如,计算机可读)介质包括机器(例如,计算机)可读存储介质(例如,只读存储器(“ROM”)、随机存取存储器(“RAM”)、磁盘存储介质、光存储介质、闪存存储器装置)。
前述附图中所描绘的过程或方法可以由处理逻辑来执行,所述处理逻辑包括硬件(例如,电路、专用逻辑等)、软件(例如,体现在非暂时性计算机可读介质上)或两者的组合。尽管所述过程或方法在上文是依据一些顺序操作来描述的,但是应当了解,所述操作中的一些可以按不同的顺序执行。此外,一些操作可以并行地执行而不是顺序地执行。
本公开的实施方式并未参考任何特定的编程语言进行描述。应认识到,可以使用多种编程语言来实施如本文描述的本公开的实施方式的教导。
在以上的说明书中,已经参考本公开的具体示例性实施方式对本公开的实施方式进行了描述。将显而易见的是,在不脱离所附权利要求书中阐述的本公开的更宽泛精神和范围的情况下,可以对本公开做出各种修改。因此,应当在说明性意义而不是限制性意义上来理解本说明书和附图。

Claims (20)

1.用于操作自动驾驶车辆ADV的计算机实施方法,所述方法包括:
响应于针对第一驾驶周期的用于控制所述ADV的第一组一个或多个控制命令,测量所述ADV的多个当前状态;
基于所述多个当前状态和所述第一组控制命令,使用动态模型对针对第二驾驶周期的多个预期未来状态进行预测;
响应于针对第二驾驶周期的用于控制所述ADV的第二组一个或多个控制命令,测量多个实际未来状态;
将所述多个预期未来状态与所述多个实际未来状态进行比较;以及
基于所述比较来修改规划算法,其中,所修改的规划算法在对用于自动驾驶所述ADV的后续路径进行规划时被实时地使用。
2.根据权利要求1所述的方法,其中,所述多个预期未来状态由所述动态模型生成,所述动态模型是基于经训练的神经网络模型的,其中,所述经训练的神经网络模型是线性回归、多层感知器MLP和递归神经网络RNN中的一个。
3.根据权利要求2所述的方法,其中,使用包括由车辆中的传感器收集的真实世界数据的数据集来训练所述神经网络模型。
4.根据权利要求1所述的方法,其中,所述ADV包括逆动态模型,所述逆动态模型配置成基于所述多个当前状态和所述多个预期未来状态来计算一个或多个控制命令,其中,所述一个或多个控制命令用于所述ADV的实时自适应控制。
5.根据权利要求1所述的方法,其中,所述多个当前状态包括速度、加速度和角速度,其中,所述第一组控制命令和所述第二组控制命令中的每个均包括油门命令、制动命令和转向命令。
6.根据权利要求1所述的方法,其中,将所述比较的结果保存在永久性存储器中,以供将来使用。
7.根据权利要求1所述的方法,其中,所述第一驾驶周期和所述第二驾驶周期中的每个均是所述ADV在此期间生成规划与控制数据并且基于所述规划与控制数据发出一个或多个控制命令的时间间隔。
8.一种存储有指令的非暂时性机器可读介质,所述指令在由处理器运行时致使所述处理器执行操作自动驾驶车辆ADV的操作,所述操作包括:
响应于针对第一驾驶周期的用于控制所述ADV的第一组一个或多个控制命令,测量所述ADV的多个当前状态;
基于所述多个当前状态和所述第一组控制命令,使用动态模型对针对第二驾驶周期的多个预期未来状态进行预测;
响应于针对第二驾驶周期的用于控制所述ADV的第二组一个或多个控制命令,测量多个实际未来状态;
将所述多个预期未来状态与所述多个实际未来状态进行比较;以及
基于所述比较来修改规划算法,其中,所修改的规划算法在对用于自动驾驶所述ADV的后续路径进行规划时被实时地使用。
9.根据权利要求8所述的非暂时性机器可读介质,其中,所述多个预期未来状态由所述动态模型生成,所述动态模型是基于经训练的神经网络模型的,其中,所述经训练的神经网络模型是线性回归、多层感知器MLP和递归神经网络RNN中的一个。
10.根据权利要求9所述的非暂时性机器可读介质,其中,使用包括由车辆中的传感器收集的真实世界数据的数据集来训练所述神经网络模型。
11.根据权利要求8所述的非暂时性机器可读介质,其中,所述ADV包括逆动态模型,所述逆动态模型配置成基于所述多个当前状态和所述多个预期未来状态来计算一个或多个控制命令,其中,所述一个或多个控制命令用于所述ADV的实时自适应控制。
12.根据权利要求8所述的非暂时性机器可读介质,其中,所述多个当前状态包括速度、加速度和角速度,其中,所述第一组控制命令和所述第二组控制命令中的每个均包括油门命令、制动命令和转向命令。
13.根据权利要求8所述的非暂时性机器可读介质,其中,所述比较的结果被保存在永久性存储器中,以供将来使用。
14.根据权利要求8所述的非暂时性机器可读介质,其中,所述第一驾驶周期和所述第二驾驶周期中的每个均是所述ADV在此期间生成规划与控制数据并且基于所述规划与控制数据发出一个或多个控制命令的时间间隔。
15.数据处理系统,包括:
处理器;以及
存储器,所述存储器联接至所述处理器并存储指令,所述指令在由所述处理器运行时使得所述处理器执行操作自动驾驶车辆ADV的操作,所述操作包括:
响应于针对第一驾驶周期的用于控制所述ADV的第一组一个或多个控制命令,测量所述ADV的多个当前状态;
基于所述多个当前状态和所述第一组控制命令,使用动态模型对针对第二驾驶周期的多个预期未来状态进行预测;
响应于针对第二驾驶周期的用于控制所述ADV的第二组一个或多个控制命令,测量多个实际未来状态;
将所述多个预期未来状态与所述多个实际未来状态进行比较;以及
基于所述比较来修改规划算法,其中,所修改的规划算法在对用于自动驾驶所述ADV的后续路径进行规划时被实时地使用。
16.根据权利要求15所述的系统,其中,所述多个预期未来状态由所述动态模型生成,所述动态模型是基于经训练的神经网络模型的,其中,所述经训练的神经网络模型是线性回归、多层感知器MLP和递归神经网络RNN中的一个。
17.根据权利要求16所述的系统,其中,使用包括由车辆中的传感器收集的真实世界数据的数据集来训练所述神经网络模型。
18.根据权利要求15所述的系统,其中,所述ADV包括逆动态模型,所述逆动态模型配置成基于所述多个当前状态和所述多个预期未来状态来计算一个或多个控制命令,其中,所述一个或多个控制命令用于所述ADV的实时自适应控制。
19.根据权利要求15所述的系统,其中,所述多个当前状态包括速度、加速度和角速度,其中,所述第一组控制命令和所述第二组控制命令中的每个均包括油门命令、制动命令和转向命令。
20.根据权利要求15所述的系统,其中,所述比较的结果被保存在永久性存储器中以供将来使用;以及
其中,所述第一驾驶周期和所述第二驾驶周期中的每个均是所述ADV在此期间生成规划与控制数据并且基于所述规划与控制数据发出一个或多个控制命令的时间间隔。
CN201910828148.7A 2018-11-29 2019-09-03 用于自动驾驶车辆的基于学习的动态建模方法 Active CN111240312B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US16/204,941 US11199846B2 (en) 2018-11-29 2018-11-29 Learning-based dynamic modeling methods for autonomous driving vehicles
US16/204,941 2018-11-29

Publications (2)

Publication Number Publication Date
CN111240312A true CN111240312A (zh) 2020-06-05
CN111240312B CN111240312B (zh) 2023-07-28

Family

ID=70849121

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910828148.7A Active CN111240312B (zh) 2018-11-29 2019-09-03 用于自动驾驶车辆的基于学习的动态建模方法

Country Status (2)

Country Link
US (1) US11199846B2 (zh)
CN (1) CN111240312B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112230632A (zh) * 2020-10-28 2021-01-15 北京航迹科技有限公司 用于自动驾驶的方法、装置、设备和存储介质
CN114475644A (zh) * 2020-10-28 2022-05-13 通用汽车环球科技运作有限责任公司 用于自主交通工具的行为控制的正演模拟
WO2022105394A1 (en) * 2020-11-17 2022-05-27 Suzhou Zhijia Science & Technologies Co., Ltd. Simulation method and system, device, readable storage medium, and platform for autonomous driving

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11656626B2 (en) * 2018-11-12 2023-05-23 Robotic Research Opco, Llc Autonomous truck loading for mining and construction applications
US11644843B2 (en) 2018-11-12 2023-05-09 Robotic Research Opco, Llc Learning mechanism for autonomous trucks for mining and construction applications
US11353865B2 (en) 2018-11-13 2022-06-07 Robotic Research Opco, Llc Coordination of mining and construction vehicles via scripting control
US10814870B2 (en) * 2018-12-04 2020-10-27 GM Global Technology Operations LLC Multi-headed recurrent neural network (RNN) for multi-class trajectory predictions
DE102018222720B4 (de) * 2018-12-21 2022-01-05 Continental Teves Ag & Co. Ohg Überwachung von auf neuronalen Netzwerken basierten Fahrfunktionen
US11328313B2 (en) * 2019-05-08 2022-05-10 Retailmenot, Inc. Predictive bounding of combinatorial optimizations that are based on data sets acquired post-prediction through high-latency, heterogenous interfaces
US11128737B1 (en) * 2019-08-28 2021-09-21 Massachusetts Mutual Life Insurance Company Data model monitoring system
US11900244B1 (en) * 2019-09-30 2024-02-13 Amazon Technologies, Inc. Attention-based deep reinforcement learning for autonomous agents
US11338819B2 (en) * 2019-09-30 2022-05-24 Baidu Usa Llc Cloud-based vehicle calibration system for autonomous driving
JP7334695B2 (ja) * 2020-09-04 2023-08-29 トヨタ自動車株式会社 車両用乗員支援装置
US11878706B2 (en) * 2021-08-19 2024-01-23 GM Global Technology Operations LLC Driver command prediction
US11897503B2 (en) * 2021-09-02 2024-02-13 Baidu.Com Times Technology (Beijing) Co., Ltd. Method and apparatus for detecting unexpected control state in autonomous driving system

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090143932A1 (en) * 2007-11-30 2009-06-04 Honda Motor Co., Ltd. Mobile apparatus and control program therefor
US20130179382A1 (en) * 2012-01-11 2013-07-11 Honda Research Institute Europe Gmbh Vehicle with computing means for monitoring and predicting traffic participant objects
US20150127150A1 (en) * 2013-11-01 2015-05-07 Brain Corporation Apparatus and methods for haptic training of robots
CN108073168A (zh) * 2016-11-09 2018-05-25 百度(美国)有限责任公司 对自主驾驶车辆进行决策的评估体系
CN108099918A (zh) * 2016-11-23 2018-06-01 百度(美国)有限责任公司 用于确定自主车辆的命令延迟的方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017083767A1 (en) * 2015-11-12 2017-05-18 Google Inc. Training neural networks using a prioritized experience memory
WO2019033025A1 (en) * 2017-08-10 2019-02-14 Patroness, LLC SYSTEMS AND METHODS FOR IMPROVED AUTONOMOUS OPERATIONS OF A MOTORIZED MOBILE SYSTEM
WO2019081705A1 (en) * 2017-10-27 2019-05-02 Deepmind Technologies Limited USING HIERARCHICAL REPRESENTATIONS FOR NEURONAL NETWORK ARCHITECTURE SEARCH
US11361599B2 (en) * 2018-08-23 2022-06-14 Ford Global Technologies, Llc Vehicle damage detection
US11924290B2 (en) * 2018-10-26 2024-03-05 Dell Products, Lp Aggregated stochastic method for predictive system response

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090143932A1 (en) * 2007-11-30 2009-06-04 Honda Motor Co., Ltd. Mobile apparatus and control program therefor
US20130179382A1 (en) * 2012-01-11 2013-07-11 Honda Research Institute Europe Gmbh Vehicle with computing means for monitoring and predicting traffic participant objects
US20150127150A1 (en) * 2013-11-01 2015-05-07 Brain Corporation Apparatus and methods for haptic training of robots
CN108073168A (zh) * 2016-11-09 2018-05-25 百度(美国)有限责任公司 对自主驾驶车辆进行决策的评估体系
CN108099918A (zh) * 2016-11-23 2018-06-01 百度(美国)有限责任公司 用于确定自主车辆的命令延迟的方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112230632A (zh) * 2020-10-28 2021-01-15 北京航迹科技有限公司 用于自动驾驶的方法、装置、设备和存储介质
CN114475644A (zh) * 2020-10-28 2022-05-13 通用汽车环球科技运作有限责任公司 用于自主交通工具的行为控制的正演模拟
WO2022105394A1 (en) * 2020-11-17 2022-05-27 Suzhou Zhijia Science & Technologies Co., Ltd. Simulation method and system, device, readable storage medium, and platform for autonomous driving

Also Published As

Publication number Publication date
US20200174486A1 (en) 2020-06-04
CN111240312B (zh) 2023-07-28
US11199846B2 (en) 2021-12-14

Similar Documents

Publication Publication Date Title
CN111240312B (zh) 用于自动驾驶车辆的基于学习的动态建模方法
US20210208597A1 (en) Sensor aggregation framework for autonomous driving vehicles
CN109937343B (zh) 用于自动驾驶车辆交通预测中的预测轨迹的评估框架
CN110389585B (zh) 用于自动驾驶车辆的基于学习的速度规划器
CN111252061B (zh) 用于自动驾驶车辆的实时决策制定
CN109196432B (zh) 用于自动驾驶车辆的速度控制参数估计方法、介质和系统
CN108475057B (zh) 基于车辆周围的情境预测车辆的一个或多个轨迹的方法和系统
CN108604095B (zh) 确定操作自动驾驶车辆的转向率的方法、介质及处理系统
US11493926B2 (en) Offline agent using reinforcement learning to speedup trajectory planning for autonomous vehicles
CN111824139B (zh) 用于预测与自动驾驶车辆相关的运动对象的运动的方法
US11467591B2 (en) Online agent using reinforcement learning to plan an open space trajectory for autonomous vehicles
CN111258217B (zh) 实时对象行为预测
US20190318267A1 (en) System and method for training a machine learning model deployed on a simulation platform
CN108255170B (zh) 动态地调整自动驾驶车辆的速度控制率的方法
CN111380534B (zh) 用于自动驾驶车辆的基于st图学习的方法
CN108334077B (zh) 确定自动驾驶车辆的速度控制的单位增益的方法和系统
CN108684203B (zh) 确定自动驾驶车辆的道路摩擦的方法和系统
CN110597243B (zh) 自动驾驶车辆的基于v2x通信的车辆车道系统
KR102398256B1 (ko) 비전 기반 인식 시스템에 의한 대립적 샘플들 검출 방법
CN110621541B (zh) 用于生成轨迹以操作自动驾驶车辆的方法和系统
KR20200037119A (ko) 자율 주행 차량에 사용되는 터널에 기초한 계획 시스템
CN111328385A (zh) 用于自动驾驶车辆的基于螺旋路径的三点转弯规划
CN111240313A (zh) 用于操作自动驾驶车辆的基于预定校准表的车辆控制系统
CN111240314A (zh) 用于l2自动驾驶的基于预定校准表的车辆油门/制动辅助系统
CN113226825B (zh) 自动驾驶车辆的基于扭矩反馈的车辆纵向自动校准系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant