CN110378483A - 部署在模拟平台上的用于训练机器学习模型的系统和方法 - Google Patents

部署在模拟平台上的用于训练机器学习模型的系统和方法 Download PDF

Info

Publication number
CN110378483A
CN110378483A CN201811384514.6A CN201811384514A CN110378483A CN 110378483 A CN110378483 A CN 110378483A CN 201811384514 A CN201811384514 A CN 201811384514A CN 110378483 A CN110378483 A CN 110378483A
Authority
CN
China
Prior art keywords
driving
vehicle
data
statistical data
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811384514.6A
Other languages
English (en)
Inventor
张亮亮
余思洋
李栋
胡江滔
陶佳鸣
蒋一飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu USA LLC
Original Assignee
Baidu USA LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Baidu USA LLC filed Critical Baidu USA LLC
Publication of CN110378483A publication Critical patent/CN110378483A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/10Geometric CAD
    • G06F30/15Vehicle, aircraft or watercraft design
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G07CHECKING-DEVICES
    • G07CTIME OR ATTENDANCE REGISTERS; REGISTERING OR INDICATING THE WORKING OF MACHINES; GENERATING RANDOM NUMBERS; VOTING OR LOTTERY APPARATUS; ARRANGEMENTS, SYSTEMS OR APPARATUS FOR CHECKING NOT PROVIDED FOR ELSEWHERE
    • G07C5/00Registering or indicating the working of vehicles
    • G07C5/008Registering or indicating the working of vehicles communicating information to a remotely located station
    • GPHYSICS
    • G07CHECKING-DEVICES
    • G07CTIME OR ATTENDANCE REGISTERS; REGISTERING OR INDICATING THE WORKING OF MACHINES; GENERATING RANDOM NUMBERS; VOTING OR LOTTERY APPARATUS; ARRANGEMENTS, SYSTEMS OR APPARATUS FOR CHECKING NOT PROVIDED FOR ELSEWHERE
    • G07C5/00Registering or indicating the working of vehicles
    • G07C5/08Registering or indicating performance data other than driving, working, idle, or waiting time, with or without registering driving, working, idle or waiting time
    • G07C5/0841Registering performance data
    • G07C5/085Registering performance data using electronic data carriers

Abstract

公开了用于训练机器学习模型的系统和方法。在一个实施方式中,对于多个驾驶场景的每个,响应于来自车辆的一个或多个传感器的传感器数据和驾驶场景,在车辆由人类驾驶员根据驾驶场景驾驶的同时收集车辆的驾驶统计数据和环境数据。在完成驾驶场景后,驾驶员被请求为完成的驾驶场景选择标签并且所选择的标签响应于驾驶员的选择被存储。基于预定标准从驾驶统计数据和环境数据提取特征。所提取的特征包括在驾驶场景期间在不同时间点收集的驾驶统计数据的一些和环境数据的一些。

Description

部署在模拟平台上的用于训练机器学习模型的系统和方法
技术领域
本公开的实施方式总体涉及操作自动驾驶车辆。更具体地,本公开的实施方式涉及部署在模拟平台上的用于训练机器学习模型的系统和方法。
背景技术
以自动驾驶模式运行(例如,无人驾驶)的车辆可将乘员、尤其是人类驾驶员从一些驾驶相关的职责中解放出来。当以自动驾驶模式运行时,车辆可使用车载传感器导航到各个位置,从而允许车辆在最少人机交互的情况下或在没有任何乘客的一些情况下行驶。
运动规划和控制是自动驾驶中的关键操作。然而,传统的运动规划操作主要根据其曲率和速度估计完成给定路径的难度而不考虑不同类型车辆的特征的差异。一些运动规划和控制被应用于所有类型的车辆,在一些情况下可能不太精确和平滑。
为了改进自动驾驶中的运动和规划控制,自动驾驶模拟器一般用于评估这种软件部件(例如,感知与规划控制)的软件性能。例如,传统的模拟器一般基于预定义的分级系统评估软件部件,所述分级系统包括一系列分级度量。然而,所述分级系统在许多驾驶场景(例如,转弯场景)中失效并常常在所述驾驶场景需要度量的不同组合来定义时失败。
发明内容
根据本申请的一方面,提供了一种训练用于评估车辆的自动驾驶的机器学习模型的计算机实施的方法,所述方法包括:
对于多个驾驶场景的每个,
响应于来自车辆的一个或多个传感器的传感器数据和所述驾驶场景,在所述车辆由人类驾驶员根据所述驾驶场景驾驶的同时收集所述车辆的驾驶统计数据和环境数据;
在完成所述驾驶场景后,请求所述驾驶员为完成的驾驶场景选择标签并响应于所述驾驶员的选择来存储所选择的标签;以及
基于预定标准从所述驾驶统计数据和所述环境数据提取特征,提取的特征包括在所述驾驶场景期间在不同时间点收集的所述驾驶统计数据的一些和所述环境数据的一些,所述提取的特征随后被用于评估多个自动驾驶车辆的自动驾驶的行为。
根据本申请的另一方面,提供了一种存储有指令的非暂时性机器可读介质,所述指令在由处理器执行时致使所述处理器执行操作,所述操作包括:
对于多个驾驶场景的每个,
响应于来自车辆的一个或多个传感器的传感器数据和所述驾驶场景,在所述车辆由人类驾驶员根据所述驾驶场景驾驶的同时收集所述车辆的驾驶统计数据和环境数据;
在完成所述驾驶场景后,请求所述驾驶员为完成的驾驶场景选择标签并响应于所述驾驶员的选择来存储所选择的标签;以及
基于预定标准从所述驾驶统计数据和所述环境数据提取特征,提取的特征包括在所述驾驶场景期间在不同时间点收集的所述驾驶统计数据的一些和所述环境数据的一些,所述提取的特征随后被用于评估多个自动驾驶车辆的自动驾驶的行为。
根据本申请的又一方面,提供了一种数据处理系统,包括:
处理器;以及
存储器,所述存储器联接到所述处理器,以存储指令,所述指令在由所述处理器执行时致使所述处理器执行操作,所述操作包括:
对于多个驾驶场景的每个,
响应于来自车辆的一个或多个传感器的传感器数据和所述驾驶场景,在所述车辆由人类驾驶员根据所述驾驶场景驾驶的同时收集所述车辆的驾驶统计数据和环境数据;
在完成所述驾驶场景后,请求所述驾驶员为完成的驾驶场景选择标签并响应于所述驾驶员的选择来存储所选择的标签;以及
基于预定标准从所述驾驶统计数据和所述环境数据提取特征,提取的特征包括在所述驾驶场景期间在不同时间点收集的所述驾驶统计数据的一些和所述环境数据的一些,所述提取的特征随后被用于评估多个自动驾驶车辆的自动驾驶的行为。
附图说明
本公开的实施方式在附图的各图中以举例而非限制的方式示出,附图中的相同参考标记指示相似元件。
图1是示出根据一个实施方式的网络化系统的框图。
图2是示出根据一个实施方式的自动驾驶车辆的示例的框图。
图3A至图3B是示出根据一个实施方式的与自动驾驶车辆一起使用的感知与规划系统的示例的框图。
图4是示出根据一个实施方式的用于训练机器学习模型的系统的示例的框图。
图5是示出根据一个实施方式的用于评估自动驾驶软件部件的系统的示例的框图。
图6是示出根据一个实施方式的提取的特征的示例的示图。
图7是示出根据一个实施方式的训练机器学习模型的方法的流程图。
图8是示出根据一个实施方式的评估自动驾驶软件部件的方法的流程图。
图9是示出根据一个实施方式的数据处理系统的框图。
具体实施方式
将参考以下所讨论的细节来描述本公开的各种实施方式和方面,附图将示出所述各种实施方式。下列描述和附图是本公开的说明,而不应当解释为对本公开进行限制。描述了许多特定细节以提供对本公开的各种实施方式的全面理解。然而,在某些情况下,并未描述众所周知的或常规的细节,以提供对本公开的实施方式的简洁讨论。
本说明书中对“一个实施方式”或“实施方式”的提及意味着结合该实施方式所描述的特定特征、结构或特性可包括在本公开的至少一个实施方式中。短语“在一个实施方式中”在本说明书中各个地方的出现不必全部指同一实施方式。
根据一些实施方式,在人类驾驶员根据驾驶场景操作车辆的同时,系统收集人类驾驶员的驾驶统计数据和与驾驶场景相关联的环境数据。例如,系统与来自车辆(例如,自动驾驶车辆)的一个或多个传感器通信以获得与人类驾驶员的驾驶风格相关联的传感器数据。所收集的驾驶统计数据和环境数据被存储在远程服务器(例如,云存储)上和/或本地存储在永久性存储装置中。系统从远程服务器和/或永久性存储装置接收(或检索)所收集的驾驶统计数据和环境数据以从所收集的驾驶统计数据和环境数据提取特征。所提取的特征用于训练算法/模型(例如,机器学习模型),所述算法/模型可被部署在离线自动驾驶模拟平台上来评估自动驾驶软件部件(例如,感知与规划控制)的性能。以这种方式,自动驾驶软件部件可被改进以处理困难的驾驶场景(例如,转弯场景),由此确保自动驾驶车辆的人类用户的安全。
在一个实施方式中,对于每个驾驶场景,响应于来自车辆的一个或多个传感器的传感器数据和驾驶场景,在车辆由人类驾驶员根据驾驶场景驾驶的同时,收集车辆的驾驶统计数据和环境数据。在完成驾驶场景后,驾驶员被请求为完成的驾驶场景选择标签,所选择的标签响应于驾驶员的选择被存储。基于预定标准从驾驶统计数据和环境数据提取特征。所提取的特征包括在驾驶场景期间在不同时间点收集的驾驶统计数据的一些和环境数据的一些。
在一个实施方式中,机器学习模型被训练以通过使用提取的特征和多个标签连续学习多个驾驶场景中人类驾驶员的驾驶行为和喜好。
在一个实施方式中,继收集车辆的驾驶统计数据和环境数据之后,所收集的驾驶统计数据和环境数据被远程存储在服务器上。在从驾驶统计数据和环境数据提取特征之前,从服务器检索所收集的驾驶统计数据和环境数据。
图1是示出根据本公开的一个实施方式的自动驾驶车辆网络配置的框图。参考图1,网络配置100包括可通过网络102通信地联接到一个或多个服务器103至104的自动驾驶车辆101。尽管示出一个自动驾驶车辆,但多个自动驾驶车辆可通过网络102联接到彼此和/或联接到服务器103至104。网络102可以是任何类型的网络,例如,有线或无线的局域网(LAN)、诸如互联网的广域网(WAN)、蜂窝网络、卫星网络或其组合。服务器103至104可以是任何类型的服务器或服务器群集,诸如,网络或云服务器、应用服务器、后端服务器或其组合。服务器103至104可以是数据分析服务器、内容服务器、交通信息服务器、地图和兴趣点(MPOI)服务器或位置服务器等。
自动驾驶车辆是指可被配置成处于自动驾驶模式下的车辆,在所述自动驾驶模式下车辆在极少或没有来自驾驶员的输入的情况下导航通过环境。这种自动驾驶车辆可包括传感器系统,所述传感器系统具有被配置成检测与车辆运行环境有关的信息的一个或多个传感器。所述车辆和其相关联的控制器使用所检测的信息来导航通过所述环境。自动驾驶车辆101可在手动模式下、在全自动驾驶模式下或者在部分自动驾驶模式下运行。
在一个实施方式中,自动驾驶车辆101包括,但不限于,感知与规划系统110、车辆控制系统111、无线通信系统112、用户接口系统113和传感器系统115。自动驾驶车辆101还可包括普通车辆中包括的某些常用部件,诸如:发动机、车轮、方向盘、变速器等,所述部件可由车辆控制系统111和/或感知与规划系统110使用多种通信信号和/或命令进行控制,该多种通信信号和/或命令例如,加速信号或命令、减速信号或命令、转向信号或命令、制动信号或命令等。
部件110至115可经由互连件、总线、网络或其组合通信地联接到彼此。例如,部件110至115可经由控制器局域网(CAN)总线通信地联接到彼此。CAN总线是被设计成允许微控制器和装置在没有主机的应用中与彼此通信的车辆总线标准。它是最初是为汽车内的复用电气布线设计的基于消息的协议,但也用于许多其它环境。
现在参考图2,在一个实施方式中,传感器系统115包括但不限于一个或多个摄像机211、全球定位系统(GPS)单元212、惯性测量单元(IMU)213、雷达单元214以及光探测和测距(LIDAR)单元215。GPS单元212可包括收发器,所述收发器可操作以提供关于自动驾驶车辆的位置的信息。IMU单元213可基于惯性加速度来感测自动驾驶车辆的位置和定向变化。雷达单元214可表示利用无线电信号来感测自动驾驶车辆的本地环境内的对象的系统。在一些实施方式中,除感测对象之外,雷达单元214可另外感测对象的速度和/或前进方向。LIDAR单元215可使用激光来感测自动驾驶车辆所处环境中的对象。除其它系统部件之外,LIDAR单元215还可包括一个或多个激光源、激光扫描器以及一个或多个检测器。摄像机211可包括用来采集自动驾驶车辆周围环境的图像的一个或多个装置。摄像机211可以是静物摄像机和/或视频摄像机。摄像机可以是可机械地移动的,例如,通过将摄像机安装在旋转和/或倾斜平台上。
传感器系统115还可包括其它传感器,诸如:声纳传感器、红外传感器、转向传感器、油门传感器、制动传感器以及音频传感器(例如,麦克风)。音频传感器可被配置成从自动驾驶车辆周围的环境中采集声音。转向传感器可被配置成感测方向盘、车辆的车轮或其组合的转向角度。油门传感器和制动传感器分别感测车辆的油门位置和制动位置。在一些情形下,油门传感器和制动传感器可集成为集成式油门/制动传感器。
在一个实施方式中,车辆控制系统111包括但不限于转向单元201、油门单元202(也被称为加速单元)和制动单元203。转向单元201用来调整车辆的方向或前进方向。油门单元202用来控制电动机或发动机的速度,电动机或发动机的速度进而控制车辆的速度和加速度。制动单元203通过提供摩擦使车辆的车轮或轮胎减速而使车辆减速。应注意,如图2所示的部件可以以硬件、软件或其组合实施。
返回参考图1,无线通信系统112允许自动驾驶车辆101与诸如装置、传感器、其它车辆等外部系统之间的通信。例如,无线通信系统112可以与一个或多个装置直接无线通信,或者经由通信网络进行无线通信,诸如,通过网络102与服务器103至104通信。无线通信系统112可使用任何蜂窝通信网络或无线局域网(WLAN),例如,使用WiFi,以与另一部件或系统通信。无线通信系统112可例如使用红外链路、蓝牙等与装置(例如,乘客的移动装置、显示装置、车辆101内的扬声器)直接通信。用户接口系统113可以是在车辆101内实施的外围装置的部分,包括例如键盘、触摸屏显示装置、麦克风和扬声器等。
自动驾驶车辆101的功能中的一些或全部可由感知与规划系统110控制或管理,尤其当在自动驾驶模式下操作时。感知与规划系统110包括必要的硬件(例如,处理器、存储器、存储装置)和软件(例如,操作系统、规划和路线安排程序),以从传感器系统115、控制系统111、无线通信系统112和/或用户接口系统113接收信息,处理所接收的信息,规划从起始点到目的地点的路线或路径,随后基于规划和控制信息来驾驶车辆101。可替代地,感知与规划系统110可与车辆控制系统111集成在一起。
例如,作为乘客的用户可例如经由用户接口来指定行程的起始位置和目的地。感知与规划系统110获得行程相关数据。例如,感知与规划系统110可从MPOI服务器中获得位置和路线信息,所述MPOI服务器可以是服务器103至104的一部分。位置服务器提供位置服务,并且MPOI服务器提供地图服务和某些位置的POI。可替代地,此类位置和MPOI信息可本地高速缓存在感知与规划系统110的永久性存储装置中。
当自动驾驶车辆101沿着路线移动时,感知与规划系统110也可从交通信息系统或服务器(TIS)获得实时交通信息。应注意,服务器103至104可由第三方实体进行操作。可替代地,服务器103至104的功能可与感知与规划系统110集成在一起。基于实时交通信息、MPOI信息和位置信息以及由传感器系统115检测或感测的实时本地环境数据(例如,障碍物、对象、附近车辆),感知与规划系统110可规划最佳路线并且根据所规划的路线例如经由控制系统111来驾驶车辆101,以安全且高效到达指定目的地。
根据一个实施方式,服务器103可以包括驾驶统计数据123和环境数据124。如下文中更详细讨论的,在自动驾驶车辆101由人类驾驶员以手动驾驶模式操作或驾驶的同时,数据收集器(例如,图3A的数据收集器308)自动地收集驾驶统计数据123和环境数据124并将它们存储到服务器103上。在一个实施方式中,驾驶统计数据123可以描述车辆101的车辆状态并包括指示所发出的驾驶命令(例如,油门、制动、转向命令)和/或车辆的传感器在不同时间点采集的车辆的响应(例如,速度、加速度、减速度、方向、加速度变化率)的信息。环境数据124可以包括描述不同时间点的驾驶环境的信息,例如,路线(包括起始位置和目的地位置)、MPOI、道路状况、天气状况、障碍物信息等。
如下文更详细讨论的,基于驾驶统计数据123和环境数据124,出于各种目的,机器学习引擎(例如,图3A的机器学习引擎310)可以生成或训练一组规则、算法、和/或预测模型,例如执行离线自动驾驶模拟以评估自动驾驶车辆的软件部件(例如,感知与规划控制)。
图3A和图3B是示出根据一个实施方式的与自动驾驶车辆一起使用的感知与规划系统的示例的框图。系统300可被实施为图1的自动驾驶车辆101的一部分,包括但不限于感知与规划系统110、控制系统111和传感器系统115。参考图3A至图3B,感知与规划系统110包括但不限于定位模块301、感知模块302、预测模块303、决策模块304、规划模块305、控制模块306、路线模块307、数据收集器308、特征提取模块309和机器学习引擎310。
模块301至310中的一些或全部可以以软件、硬件或其组合实施。例如,这些模块可安装在永久性存储装置352中、加载到存储器351中,并且由一个或多个处理器(未示出)执行。应注意,这些模块中的一些或全部可通信地联接到图2的车辆控制系统111的一些或全部模块或者与它们集成在一起。模块301至310中的一些可一起集成为集成模块。
定位模块301确定自动驾驶车辆300的当前位置(例如,利用GPS单元212)以及管理与用户的行程或路线相关的任何数据。定位模块301(也称作为地图与路线模块)管理与用户的行程或路线相关的任意数据。用户可例如经由用户接口登录并且指定行程的起始位置和目的地。定位模块301与自动驾驶车辆300的诸如地图与路线信息311的其它部件通信,以获得行程相关数据。例如,定位模块301可从位置服务器和地图与POI(MPOI)服务器获得位置和路线信息。位置服务器提供位置服务,并且MPOI服务器提供地图服务和某些位置的POI,从而可作为地图与路线信息311的一部分高速缓存。当自动驾驶车辆300沿着路线移动时,定位模块301也可从交通信息系统或服务器获得实时交通信息。
基于由传感器系统115提供的传感器数据和由定位模块301获得的定位信息,感知模块302确定对周围环境的感知。感知信息可表示普通驾驶员在驾驶员正驾驶的车辆周围将感知到的东西。感知可包括例如采用对象形式的车道配置(例如,直线车道或弯曲车道)、交通灯信号、另一车辆的相对位置、行人、建筑物、人行横道或其它交通相关标志(例如,停止标志、让行标志)等。
感知模块302可包括计算机视觉系统或计算机视觉系统的功能,以处理并分析由一个或多个摄像机采集的图像,从而识别自动驾驶车辆环境中的对象和/或特征。所述对象可包括交通信号、道路边界、其它车辆、行人和/或障碍物等。计算机视觉系统可使用对象识别算法、视频跟踪以及其它计算机视觉技术。在一些实施方式中,计算机视觉系统可绘制环境地图,跟踪对象,以及估算对象的速度等。感知模块302也可基于由诸如雷达和/或LIDAR的其它传感器提供的其它传感器数据来检测对象。
针对每个对象,预测模块303预测对象在这种情况下将如何表现。预测是根据一组地图/路线信息311和交通规则312、基于感知数据执行的,该感知数据感知在该时间点的驾驶环境。例如,如果对象为相反方向上的车辆且当前驾驶环境包括十字路口,则预测模块303将预测车辆是否可能会向前直行或转弯。如果感知数据表明十字路口没有交通灯,则预测模块303可能会预测车辆在进入十字路口之前可能需要完全停车。如果感知数据表明车辆目前处于左转唯一车道或右转唯一车道,则预测模块303可能预测车辆将更可能分别左转或右转。
针对每个对象,决策模块304作出关于如何处置对象的决定。例如,针对特定对象(例如,交叉路线中的另一车辆)以及描述对象的元数据(例如,速度、方向、转弯角度),决策模块304决定如何与所述对象相遇(例如,超车、让行、停止、超过)。决策模块304可根据诸如交通规则或驾驶规则312的规则集来作出此类决定,所述规则集可存储在永久性存储装置352中。
路线模块307配置成提供从起始点到目的地点的一个或多个路线或路径。对于从起始位置到目的地位置的给定行程,例如从用户接收的给定行程,路线模块307获得路线与地图信息311,并确定从起始位置至到达目的地位置的所有可能路线或路径。路线模块307可生成地形图形式的参考线,它确定了从起始位置至到达目的地位置的每个路线。参考线是指不受其它诸如其它车辆、障碍物或交通状况的任何干扰的理想路线或路径。即,如果道路上没有其它车辆、行人或障碍物,则ADV应精确地或紧密地跟随参考线。然后,将地形图提供至决策模块304和/或规划模块305。决策模块304和/或规划模块305检查所有可能的路线,以根据由其它模块提供的其它数据选择和更改最佳路线中的一个,其中,其它数据诸如为来自定位模块301的交通状况、由感知模块302感知到的驾驶环境以及由预测模块303预测的交通状况。根据时间点下的特定驾驶环境,用于控制ADV的实际路径或路线可能接近于或不同于由路线模块307提供的参考线。
基于针对所感知到的对象中的每个的决定,规划模块305使用由路线模块307提供的参考线作为基础,为自动驾驶车辆规划路径或路线以及驾驶参数(例如,距离、速度和/或转弯角度)。换言之,针对给定的对象,决策模块304决定对该对象做什么,而规划模块305确定如何去做。例如,针对给定的对象,决策模块304可决定超过所述对象,而规划模块305可确定在所述对象的左侧还是右侧超过。规划和控制数据由规划模块305生成,包括描述车辆300在下一移动循环(例如,下一路线/路径段)中将如何移动的信息。例如,规划和控制数据可指示车辆300以30英里每小时(mph)的速度移动10米,随后以25mph的速度变到右侧车道。
基于规划和控制数据,控制模块306根据由规划和控制数据限定的路线或路径通过将适当的命令或信号发送到车辆控制系统111来控制并驾驶自动驾驶车辆。所述规划和控制数据包括足够的信息,以沿着路径或路线在不同的时间点使用适当的车辆设置或驾驶参数(例如,油门、制动和转弯命令)将车辆从路线或路径的第一点驾驶到第二点。
在一个实施方式中,规划阶段在多个规划周期(也称作为指令周期)中执行,例如,在每个时间间隔为100毫秒(ms)的周期中执行。对于规划周期或指令周期中的每一个,将基于规划和控制数据发出一个或多个控制指令。即,对于每100ms,规划模块305规划下一个路线段或路径段,例如,包括目标位置和ADV到达目标位置所需要的时间。可替代地,规划模块305还可规定具体的速度、方向和/或转向角等。在一个实施方式中,规划模块305为下一个预定时段(诸如,5秒)规划路线段或路径段。对于每个规划周期,规划模块305基于在前一周期中规划的目标位置规划用于当前周期(例如,下一个5秒)的目标位置。控制模块306然后基于当前周期的规划和控制数据生成一个或多个控制指令(例如,油门、制动、转向控制指令)。
应注意,决策模块304和规划模块305可集成为集成模块。决策模块304/规划模块305可包括导航系统或导航系统的功能,以确定自动驾驶车辆的驾驶路径。例如,导航系统可确定用于实现自动驾驶车辆沿着以下路径移动的一系列速度和前进方向:所述路径在使自动驾驶车辆沿着通往最终目的地的基于车行道的路径前进的同时,基本上避免感知到的障碍物。目的地可根据经由用户接口系统113进行的用户输入来设定。导航系统可在自动驾驶车辆正在运行的同时动态地更新驾驶路径。导航系统可将来自GPS系统和一个或多个地图的数据合并,以确定用于自动驾驶车辆的驾驶路径。
决策模块304/规划模块305还可包括防撞系统或防撞系统的功能,以识别、评估并且避免或以其它方式越过自动驾驶车辆的环境中的潜在障碍物。例如,防撞系统可通过以下方式实现自动驾驶车辆的导航中的变化:操作控制系统111中的一个或多个子系统来采取变向操纵、转弯操纵、制动操纵等。防撞系统可基于周围的交通模式、道路状况等自动确定可行的障碍物回避操纵。防撞系统可被配置成使得当其它传感器系统检测到位于自动驾驶车辆将变向进入的相邻区域中的车辆、建筑障碍物等时不采取变向操纵。防撞系统可自动选择既可使用又使得自动驾驶车辆乘员的安全性最大化的操纵。防撞系统可选择预测使得自动驾驶车辆的乘客舱中出现最小量的加速度的避让操纵。
在车辆由人类驾驶员根据驾驶场景(例如,驾驶场景314的一个)驾驶的同时,数据收集器308从车辆(例如,以手动驾驶模式运行的自动驾驶车辆101或普通车辆)收集驾驶统计数据123和/或环境数据124。驾驶场景314可以被预定且被存储在永久性存储装置352中。在一个实施方式中,驾驶场景314的每个均可以包括预定的驾驶环境信息,例如路线(包括起始位置和目的地位置),MPOI、道路状况、交通状况、天气状况、障碍物信息等。
在一个实施方式中,数据收集器308可以将驾驶统计数据123和环境数据124存储在永久性存储装置352中和/或远程存储在服务器103(例如,云存储)上。在一个实施方式中,驾驶统计数据123可以描述车辆的车辆状态并包括指示所发出的驾驶命令(例如,油门、制动、转向命令)和在不同时间点由传感器系统115的传感器采集的车辆的响应的信息,例如,速度、加速度、减速度、加速度变化率(也称为加速度的时间导数)。在一个实施方式中,环境数据124包括描述不同时间点的驾驶环境的信息,例如,路线(包括起始位置和目的地位置)、MPOI、道路状况、天气状况、障碍物信息(例如,障碍物及其位置、障碍物分类、障碍物速度、障碍物加速度)等。在一个实施方式中,环境数据124中的这些数据可以使用地图和路线信息311和/或高清晰度(HD)地图来确定。
在完成每个驾驶场景(例如,驾驶场景314的每个)后,数据收集器308可例如经由用户接口系统113请求人类驾驶员为完成的驾驶场景选择标签。例如,驾驶员可以将驾驶场景标为“安全”或“舒适”,它可以生成标签值“1”。另一方面,驾驶员可以将驾驶场景标为“不安全”或“不舒适”,它可以生成标签值“0”。响应于驾驶员的选择,与每个驾驶场景对应的每个标签可以作为标签315被存储在永久性存储装置352中(或服务器103上)。
特征提取模块309基于预定标准从驾驶统计数据123和环境数据124提取(或过滤)信息。特征提取模块可以从驾驶统计数据123确定某些有用的驾驶统计数据和从环境数据124确定某些有用的环境数据以提取信息,并将信息作为提取的特征316存储在永久性存储装置352中。例如,预定标准可以决定指示车辆响应的信息是有用的。由此,速度、加速度、减速度、方向、加速度变化率等从驾驶统计数据123被提取或过滤并被存储为提取的特征316的一部分。类似地,预定标准可以决定障碍物信息是有用的。由此,障碍物及其位置、障碍物分类、障碍物速度、障碍物加速度等从环境数据124被提取或过滤并被存储为提取的特征316的一部分。
在一个实施方式中,对于每个驾驶场景(例如,驾驶场景314的每个)和对于每个时间点,所提取的特征316可以包括障碍物标识符(ID)、在时间点为每个障碍物标识符记录的时间戳、为每个障碍物标识符在记录的时间戳处采集的车辆速度、为每个障碍物标识符在记录的时间戳处采集的车辆加速度变化率、以及为每个障碍物标识符在记录的时间戳处采集的障碍物的位置(例如,x、y、z坐标)。
提取的特征316和标签315可以被提供给机器学习引擎310以生成或训练一组规则、算法和/或预测模型313(可以存储在永久性存储装置352中)。例如,在一个实施方式中,机器学习引擎310可以调用一个或多个机器学习模型/算法(例如,深度学习架构,诸如深度神经网络、深度卷积神经网络、深度信念网络和/或递归神经网络),以通过使用所提供的提取的特征316和标签315连续确定或学习每个预定驾驶场景中人类驾驶员的驾驶行为和喜好。训练的算法/模型313可以被部署到离线模拟平台(例如,自动驾驶模拟器)以评估软件部件(例如,感知与规划控制)的性能。
根据另一实施方式,特征提取和机器学习以创建模型的操作可离线执行,例如由另一数据处理系统(例如,中央服务器)诸如如103执行。也就是说,中央服务器可以包含特征提取模块309和/或机器学习引擎310以处理从许多车辆收集的数据并如本申请所描述地基于收集的数据生成评估模型或算法。
图4是示出根据一个实施方式的用于训练机器学习模型的系统的示例的框图。参考图4,系统400包括数据收集器308、特征提取模块309和机器学习引擎310。在图4中,在一个实施方式中,数据收集器308从传感器系统115接收或检索传感器数据、以及接收或检索驾驶场景314(例如,从永久性存储装置352或服务器103)。如之前所描述的,在车辆由人类驾驶员根据驾驶场景314的每个驾驶的同时,数据收集器308从车辆(例如,以手动驾驶模式操作的自动驾驶车辆101或普通车辆)收集驾驶统计数据123和/或环境数据124。驾驶统计数据123和/或环境数据124可以被本地存储(例如,在永久性存储装置352中)或远程存储在服务器103(如图4所示)上。在完成每个驾驶场景(例如,驾驶场景314的每个)后,数据收集器308可以例如经由用户接口系统113请求人类驾驶员为完成的驾驶场景贴标签,并且标签可以作为标签315被存储(如之前描述的,为了简化起见,将不再描述)。
在一个实施方式中,随后特征提取模块309可以接收或检索所存储的驾驶统计数据123和环境数据124,基于预定标准从驾驶统计数据123和环境数据124提取或过滤信息。然后,特征提取模块309可以将该信息存储为提取的特征(例如,图3A的提取的特征316)。关于提取的特征316,参考图6,即示出根据一个实施方式的提取的特征的示例的示图,对于(例如,来自驾驶场景314的)每个驾驶场景601,提取的特征316可以包括标识符(ID)602、与ID 602的每个相关联的时间戳603、驾驶统计数据604和环境数据605。ID 602的每个可以是表示驾驶场景601中的具体障碍物的障碍物ID(障碍物1...障碍物N)。在一个实施方式中,ID 602还可以包括表示由人类驾驶员驾驶的车辆的车辆ID。时间戳603表示驾驶通过驾驶场景601时在不同时间点记录的时间Ti,其中i≥0。驾驶统计数据604可以包括在驾驶员遇到每个具体障碍物(例如,障碍物1...障碍物N)时的记录时间Ti处采集的(可以从驾驶统计数据123过滤的)驾驶统计数据。在一个实施方式中,驾驶统计数据604可以包括指示车辆响应(例如,速度、加速度、减速度、方向、加速度变化率等)的信息。环境数据605可以包括在驾驶员遇到每个具体障碍物时的记录时间Ti处采集的(可以从环境数据124过滤的)环境数据。例如,环境数据605可以包括在时间Ti采集的每个障碍物的位置(例如,x、y、z坐标)。
返回参考图4,提取的特征和标签315被提供给机器学习引擎310。机器学习引擎310生成或训练一组规则、算法和/或预测模型313。例如,在一个实施方式中,机器学习引擎310可以调用一个或多个机器学习模型/算法(例如,深度学习架构诸如深度神经网络、深度卷积神经网络、深度信念网络和/或递归神经网络),以通过使用所提供的提取的特征316和标签315连续确定或学习每个预定驾驶场景中人类驾驶员的驾驶行为和喜好,使得算法/模型313可被调用以在驾驶环境下操作自动驾驶车辆(例如,车辆101)通过不同的驾驶场景。
图5是示出根据一个实施方式的用于评估自动驾驶软件部件的系统的示例的框图。在一些实施方式中,系统500可以在客户设备(例如,主机或服务器)、个人计算机(例如,台式机、膝上型电脑、平板电脑等)或自动驾驶车辆(例如,图1的车辆101)上实现。
如图所示,系统500包括模拟引擎(也称为模拟器或模拟平台)501和评估模块502。训练的算法/模型313可以被部署至用于执行自动驾驶模拟的模拟引擎501以测试软件部件(例如,感知与规划控制)。也就是说,提取的特征随后可以被用于评估一个或多个自动驾驶车辆(例如,图1的自动驾驶车辆101)的自动驾驶的行为。例如,模拟引擎501可以包括嵌入的地图(例如,HD地图)、虚拟驾驶场景(可类似于驾驶场景314)、以及测试软件部件(例如,感知与规划控制)。通过使用部署的算法/模型313,模拟引擎501可以虚拟地操作车辆以在模拟环境下驾驶通过各种驾驶场景来测试软件部件。来自模拟的模拟结果可以被提供给评估模块502用于评估用算法/模型313操作的测试软件部件。例如,基于模拟结果(例如,描述在模拟环境下操作的虚拟车辆的状态的信息),评估模块502可以确定测试软件部件通过还是失败。在这样做时,评估模块502可以基于结果生成概率。如果概率超过阈值(例如,0.5或0与1之间的任意其他合适的值),评估模块502可以输出成功或通过的指示。否则,评估模块502可以输出失败的指示。
图7是根据一个实施方式的用于训练机器学习模型的方法的流程图。过程700可以由处理逻辑执行,所述处理逻辑可以包括软件、硬件或其组合。例如,过程700可以由图1的感知与规划系统110执行。参考图7,在框701,对于一个或多个驾驶场景的每个,处理逻辑响应于来自车辆的一个或多个传感器的传感器数据和驾驶场景,在车辆由人类驾驶员根据驾驶场景驾驶的同时收集车辆的驾驶统计数据和环境数据。在框702,在完成驾驶场景后,处理逻辑请求驾驶员为完成的驾驶场景选择标签并响应于驾驶员的选择来存储所选择的标签。在框703,处理逻辑基于预定标准从驾驶统计数据和环境数据提取特征,其中提取的特征包括在驾驶场景期间在不同时间点收集的驾驶统计数据的一些和环境数据的一些。在框704,处理逻辑训练机器学习模型以通过使用提取的特征以及一个或多个标签连续学习驾驶场景中人类驾驶员的驾驶行为和喜好。
图8是示出根据一个实施方式的评估自动驾驶软件部件的方法的流程图。过程800可以由处理逻辑执行,所述处理逻辑可以包括软件、硬件或其组合。
在框801,处理逻辑将机器学习模型部署在模拟平台上。在框802,处理逻辑通过使用机器学习模型在模拟平台上执行自动驾驶模拟以测试软件部件(例如,感知与规划控制)并生成模拟结果。在框803,处理逻辑基于模拟结果评估软件部件。
应注意,如上文示出和描述的部件中的一些或全部可在软件、硬件或其组合中实施。例如,此类部件可实施为安装并存储在永久性存储装置中的软件,所述软件可通过处理器(未示出)加载在存储器中并在存储器中执行以实施贯穿本申请所述的过程或操作。可替代地,此类部件可实施为编程或嵌入到专用硬件(诸如,集成电路(例如,专用集成电路或ASIC)、数字信号处理器(DSP)或现场可编程门阵列(FPGA))中的可执行代码,所述可执行代码可经由来自应用的相应驱动程序和/或操作系统来访问。此外,此类部件可实施为处理器或处理器内核中的特定硬件逻辑,作为可由软件部件通过一个或多个特定指令访问的指令集的一部分。
图9是示出可与本公开的一个实施方式一起使用的数据处理系统的示例的框图。例如,系统1500可表示以上所述的执行上述过程或方法中的任一个的任何数据处理系统,例如,图1的感知与规划系统110或者服务器103至104中的任一个。系统1500可包括许多不同的部件。这些部件可实施为集成电路(IC)、集成电路的部分、分立电子装置或适用于电路板(诸如,计算机系统的主板或插入卡)的其它模块或者实施为以其它方式并入计算机系统的机架内的部件。
还应注意,系统1500旨在示出计算机系统的许多部件的高阶视图。然而,应当理解的是,某些实施例中可具有附加的部件,此外,其它实施例中可具有所示部件的不同布置。系统1500可表示台式计算机、膝上型计算机、平板计算机、服务器、移动电话、媒体播放器、个人数字助理(PDA)、智能手表、个人通信器、游戏装置、网络路由器或集线器、无线接入点(AP)或中继器、机顶盒或其组合。此外,虽然仅示出了单个机器或系统,但是术语“机器”或“系统”还应当被理解为包括单独地或共同地执行一个(或多个)指令集以执行本文所讨论的任何一种或多种方法的机器或系统的任何集合。
在一个实施方式中,系统1500包括通过总线或互连件1510连接的处理器1501、存储器1503以及装置1505至1508。处理器1501可表示其中包括单个处理器内核或多个处理器内核的单个处理器或多个处理器。处理器1501可表示一个或多个通用处理器,诸如,微处理器、中央处理单元(CPU)等。更具体地,处理器1501可以是复杂指令集计算(CISC)微处理器、精简指令集计算(RISC)微处理器、超长指令字(VLIW)微处理器、或实施其它指令集的处理器、或实施指令集组合的处理器。处理器1501还可以是一个或多个专用处理器,诸如,专用集成电路(ASIC)、蜂窝或基带处理器、现场可编程门阵列(FPGA)、数字信号处理器(DSP)、网络处理器、图形处理器、通信处理器、加密处理器、协处理器、嵌入式处理器、或者能够处理指令的任何其它类型的逻辑。
处理器1501(其可以是低功率多核处理器套接口,诸如超低电压处理器)可充当用于与所述系统的各种部件通信的主处理单元和中央集线器。这种处理器可实施为片上系统(SoC)。处理器1501被配置成执行用于执行本文所讨论的操作和步骤的指令。系统1500还可包括与可选的图形子系统1504通信的图形接口,图形子系统1504可包括显示控制器、图形处理器和/或显示装置。
处理器1501可与存储器1503通信,存储器1503在一个实施方式中可经由多个存储器装置实施以提供给定量的系统存储。存储器1503可包括一个或多个易失性存储(或存储器)装置,诸如,随机存取存储器(RAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、静态RAM(SRAM)或者其它类型的存储装置。存储器1503可存储包括由处理器1501或任何其它装置执行的指令序列的信息。例如,各种操作系统、装置驱动程序、固件(例如,输入输出基本系统或BIOS)和/或应用的可执行代码和/或数据可加载到存储器1503中并由处理器1501执行。操作系统可以是任何类型的操作系统,例如,机器人操作系统(ROS)、来自公司的操作系统、来自苹果公司的Mac来自公司的LINUX、UNIX,或者其它实时或嵌入式操作系统。
系统1500还可包括I/O装置,诸如装置1505至1508,包括网络接口装置1505、可选的输入装置1506,以及其它可选的I/O装置1507。网络接口装置1505可包括无线收发器和/或网络接口卡(NIC)。所述无线收发器可以是WiFi收发器、红外收发器、蓝牙收发器、WiMax收发器、无线蜂窝电话收发器、卫星收发器(例如,全球定位系统(GPS)收发器)或其它射频(RF)收发器或者它们的组合。NIC可以是以太网卡。
输入装置1506可包括鼠标、触摸板、触敏屏幕(其可与显示装置1504集成在一起)、指针装置(诸如,手写笔)和/或键盘(例如,物理键盘或作为触敏屏幕的一部分显示的虚拟键盘)。例如,输入装置1506可包括联接到触摸屏的触摸屏控制器。触摸屏和触摸屏控制器例如可使用多种触敏技术(包括但不限于电容、电阻、红外和表面声波技术)中的任一种,以及其它接近传感器阵列或用于确定与触摸屏接触的一个或多个点的其它元件来检测其接触和移动或间断。
I/O装置1507可包括音频装置。音频装置可包括扬声器和/或麦克风,以促进支持语音的功能,诸如语音识别、语音复制、数字记录和/或电话功能。其它I/O装置1507还可包括通用串行总线(USB)端口、并行端口、串行端口、打印机、网络接口、总线桥(例如,PCI-PCI桥)、传感器(例如,诸如加速度计运动传感器、陀螺仪、磁强计、光传感器、罗盘、接近传感器等)或者它们的组合。装置1507还可包括成像处理子系统(例如,摄像机),所述成像处理子系统可包括用于促进摄像机功能(诸如,记录照片和视频片段)的光学传感器,诸如电荷耦合装置(CCD)或互补金属氧化物半导体(CMOS)光学传感器。某些传感器可经由传感器集线器(未示出)联接到互连件1510,而诸如键盘或热传感器的其它装置可根据系统1500的具体配置或设计由嵌入式控制器(未示出)控制。
为了提供对诸如数据、应用、一个或多个操作系统等信息的永久性存储,大容量存储装置(未示出)也可联接到处理器1501。在各种实施方式中,为了实现更薄且更轻的系统设计并且改进系统响应性,这种大容量存储装置可经由固态装置(SSD)来实施。然而,在其它实施方式中,大容量存储装置可主要使用硬盘驱动器(HDD)来实施,其中较小量的SSD存储装置充当SSD高速缓存以在断电事件期间实现上下文状态以及其它此类信息的非易失性存储,从而使得在系统活动重新启动时能够实现快速通电。另外,闪存装置可例如经由串行外围接口(SPI)联接到处理器1501。这种闪存装置可提供系统软件的非易失性存储,所述系统软件包括所述系统的BIOS以及其它固件。
存储装置1508可包括计算机可访问的存储介质1509(也被称为机器可读存储介质或计算机可读介质),其上存储有体现本文所述的任何一种或多种方法或功能的一个或多个指令集或软件(例如,模块、单元和/或逻辑1528)。处理模块/单元/逻辑1528可表示上述部件中的任一个,例如规划模块305、控制模块306、数据收集器308、特征提取模块309以及机器学习引擎310。处理模块/单元/逻辑1528还可在其由数据处理系统1500、存储器1503和处理器1501执行期间完全地或至少部分地驻留在存储器1503内和/或处理器1501内,数据处理系统1500、存储器1503和处理器1501也构成机器可访问的存储介质。处理模块/单元/逻辑1528还可通过网络经由网络接口装置1505进行传输或接收。
计算机可读存储介质1509也可用来永久性地存储以上描述的一些软件功能。虽然计算机可读存储介质1509在示例性实施方式中被示为单个介质,但是术语“计算机可读存储介质”应当被认为包括存储所述一个或多个指令集的单个介质或多个介质(例如,集中式或分布式数据库和/或相关联的高速缓存和服务器)。术语“计算机可读存储介质”还应当被认为包括能够存储或编码指令集的任何介质,所述指令集用于由机器执行并且使得所述机器执行本公开的任何一种或多种方法。因此,术语“计算机可读存储介质”应当被认为包括但不限于固态存储器以及光学介质和磁性介质,或者任何其它非暂时性机器可读介质。
本文所述的处理模块/单元/逻辑1528、部件以及其它特征可实施为分立硬件部件或集成在硬件部件(诸如,ASICS、FPGA、DSP或类似装置)的功能中。此外,处理模块/单元/逻辑1528可实施为硬件装置内的固件或功能电路。此外,处理模块/单元/逻辑1528可以以硬件装置和软件部件的任何组合来实施。
应注意,虽然系统1500被示出为具有数据处理系统的各种部件,但是并不旨在表示使部件互连的任何特定架构或方式;因为此类细节和本公开的实施方式没有密切关系。还应当认识到,具有更少部件或可能具有更多部件的网络计算机、手持计算机、移动电话、服务器和/或其它数据处理系统也可与本公开的实施方式一起使用。
前述详细描述中的一些部分已经根据在计算机存储器内对数据位的运算的算法和符号表示而呈现。这些算法描述和表示是数据处理领域中的技术人员所使用的方式,以将他们的工作实质最有效地传达给本领域中的其他技术人员。本文中,算法通常被认为是导致所期望结果的自洽操作序列。这些操作是指需要对物理量进行物理操控的操作。
然而,应当牢记,所有这些和类似的术语均旨在与适当的物理量关联,并且仅仅是应用于这些量的方便标记。除非在以上讨论中以其它方式明确地指出,否则应当了解,在整个说明书中,利用术语(诸如所附权利要求书中所阐述的术语)进行的讨论是指计算机系统或类似电子计算装置的动作和处理,所述计算机系统或电子计算装置操控计算机系统的寄存器和存储器内的表示为物理(电子)量的数据,并将所述数据变换成计算机系统存储器或寄存器或者其它此类信息存储装置、传输或显示装置内类似地表示为物理量的其它数据。
本公开的实施方式还涉及用于执行本文中的操作的设备。这种计算机程序被存储在非暂时性计算机可读介质中。机器可读介质包括用于以机器(例如,计算机)可读的形式存储信息的任何机构。例如,机器可读(例如,计算机可读)介质包括机器(例如,计算机)可读存储介质(例如,只读存储器(“ROM”)、随机存取存储器(“RAM”)、磁盘存储介质、光存储介质、闪存存储器装置)。
前述附图中所描绘的过程或方法可由处理逻辑来执行,所述处理逻辑包括硬件(例如,电路、专用逻辑等)、软件(例如,体现在非暂时性计算机可读介质上)或两者的组合。尽管所述过程或方法在上文是依据一些顺序操作来描述的,但是应当了解,所述操作中的一些可按不同的顺序执行。此外,一些操作可并行地执行而不是顺序地执行。
本公开的实施方式并未参考任何特定的编程语言进行描述。应认识到,可使用多种编程语言来实施如本文描述的本公开的实施方式的教导。
在以上的说明书中,已经参考本公开的具体示例性实施方式对本公开的实施方式进行了描述。将显而易见的是,在不脱离所附权利要求书中阐述的本公开的更宽泛精神和范围的情况下,可对本发明作出各种修改。因此,应当在说明性意义而不是限制性意义上来理解本说明书和附图。

Claims (21)

1.一种训练用于评估车辆的自动驾驶的机器学习模型的计算机实施的方法,所述方法包括:
对于多个驾驶场景的每个,
响应于来自车辆的一个或多个传感器的传感器数据和所述驾驶场景,在所述车辆由人类驾驶员根据所述驾驶场景驾驶的同时收集所述车辆的驾驶统计数据和环境数据;
在完成所述驾驶场景后,请求所述驾驶员为完成的驾驶场景选择标签并响应于所述驾驶员的选择来存储所选择的标签;以及
基于预定标准从所述驾驶统计数据和所述环境数据提取特征,提取的特征包括在所述驾驶场景期间在不同时间点收集的所述驾驶统计数据的一些和所述环境数据的一些,所述提取的特征随后被用于评估多个自动驾驶车辆的自动驾驶的行为。
2.如权利要求1所述的方法,进一步包括:
训练机器学习模型以通过使用所述提取的特征和多个标签连续学习所述多个驾驶场景中所述人类驾驶员的驾驶行为和喜好。
3.如权利要求1所述的方法,其中所述驾驶统计数据的一些包括指示所述车辆的响应的信息,所述环境数据的一些包括障碍物信息。
4.如权利要求1所述的方法,其中对于每个驾驶场景,所述提取的特征包括:
标识符,包括表示所述驾驶场景中的障碍物的障碍物标识符和表示所述车辆的车辆标识符;
与所述标识符的每个相关联的时间戳,其中所述时间戳表示在所述车辆驾驶通过所述驾驶场景的同时在不同时间点记录的时间Ti,其中i≥0;
指示在记录的时间Ti采集的所述车辆的响应的信息;以及
在所述记录的时间Ti采集的障碍物信息。
5.如权利要求3所述的方法,其中
指示所述车辆的响应的信息包括所述车辆的速度、加速度、减速度、和加速度变化率;以及
所述障碍物信息包括障碍物的位置。
6.如权利要求2所述的方法,其中所述多个标签的每个包括标签值0或1,其中0指示不安全,1指示安全。
7.如权利要求1所述的方法,进一步包括:
继收集所述车辆的驾驶统计数据和环境数据之后,将收集的所述驾驶统计数据和所述环境数据远程存储到服务器上;以及
在从所述驾驶统计数据和所述环境数据提取特征之前,从所述服务器检索收集的所述驾驶统计数据和所述环境数据。
8.一种存储有指令的非暂时性机器可读介质,所述指令在由处理器执行时致使所述处理器执行操作,所述操作包括:
对于多个驾驶场景的每个,
响应于来自车辆的一个或多个传感器的传感器数据和所述驾驶场景,在所述车辆由人类驾驶员根据所述驾驶场景驾驶的同时收集所述车辆的驾驶统计数据和环境数据;
在完成所述驾驶场景后,请求所述驾驶员为完成的驾驶场景选择标签并响应于所述驾驶员的选择来存储所选择的标签;以及
基于预定标准从所述驾驶统计数据和所述环境数据提取特征,提取的特征包括在所述驾驶场景期间在不同时间点收集的所述驾驶统计数据的一些和所述环境数据的一些,所述提取的特征随后被用于评估多个自动驾驶车辆的自动驾驶的行为。
9.如权利要求8所述的非暂时性机器可读介质,其中所述操作进一步包括:
训练机器学习模型以通过使用所述提取的特征和多个标签连续学习所述多个驾驶场景中所述人类驾驶员的驾驶行为和喜好。
10.如权利要求8所述的非暂时性机器可读介质,其中所述驾驶统计数据的一些包括指示所述车辆的响应的信息,所述环境数据的一些包括障碍物信息。
11.如权利要求8所述的非暂时性机器可读介质,其中对于每个驾驶场景,所述提取的特征包括:
标识符,包括表示所述驾驶场景中的障碍物的障碍物标识符和表示所述车辆的车辆标识符;
与所述标识符的每个相关联的时间戳,其中所述时间戳表示在所述车辆驾驶通过所述驾驶场景的同时在不同时间点记录的时间Ti,其中i≥0;
指示在记录的时间Ti采集的所述车辆的响应的信息;以及
在所述记录的时间Ti采集的障碍物信息。
12.如权利要求10所述的非暂时性机器可读介质,其中
指示所述车辆的响应的信息包括所述车辆的速度、加速度、减速度、和加速度变化率;以及
所述障碍物信息包括障碍物的位置。
13.如权利要求9所述的非暂时性机器可读介质,其中所述多个标签的每个包括标签值0或1,其中0指示不安全,1指示安全。
14.如权利要求8所述的非暂时性机器可读介质,其中所述操作进一步包括:
继收集所述车辆的驾驶统计数据和环境数据之后,将收集的所述驾驶统计数据和所述环境数据远程存储到服务器上;以及
在从所述驾驶统计数据和所述环境数据提取特征之前,从所述服务器检索收集的所述驾驶统计数据和所述环境数据。
15.一种数据处理系统,包括:
处理器;以及
存储器,所述存储器联接到所述处理器,以存储指令,所述指令在由所述处理器执行时致使所述处理器执行操作,所述操作包括:
对于多个驾驶场景的每个,
响应于来自车辆的一个或多个传感器的传感器数据和所述驾驶场景,在所述车辆由人类驾驶员根据所述驾驶场景驾驶的同时收集所述车辆的驾驶统计数据和环境数据;
在完成所述驾驶场景后,请求所述驾驶员为完成的驾驶场景选择标签并响应于所述驾驶员的选择来存储所选择的标签;以及
基于预定标准从所述驾驶统计数据和所述环境数据提取特征,提取的特征包括在所述驾驶场景期间在不同时间点收集的所述驾驶统计数据的一些和所述环境数据的一些,所述提取的特征随后被用于评估多个自动驾驶车辆的自动驾驶的行为。
16.如权利要求15所述的数据处理系统,其中所述操作进一步包括:
训练机器学习模型以通过使用所述提取的特征和多个标签连续学习所述多个驾驶场景中所述人类驾驶员的驾驶行为和喜好。
17.如权利要求15所述的数据处理系统,其中所述驾驶统计数据的一些包括指示所述车辆的响应的信息,所述环境数据的一些包括障碍物信息。
18.如权利要求15所述的数据处理系统,其中对于每个驾驶场景,所述提取的特征包括:
标识符,包括表示所述驾驶场景中的障碍物的障碍物标识符和表示所述车辆的车辆标识符;
与所述标识符的每个相关联的时间戳,其中所述时间戳表示在所述车辆驾驶通过所述驾驶场景的同时在不同时间点记录的时间Ti,其中i≥0;
指示在记录的时间Ti采集的所述车辆的响应的信息;以及
在所述记录的时间Ti采集的障碍物信息。
19.如权利要求17所述的数据处理系统,其中
指示所述车辆的响应的信息包括所述车辆的速度、加速度、减速度、和加速度变化率;以及
所述障碍物信息包括障碍物的位置。
20.如权利要求16所述的数据处理系统,其中所述多个标签的每个包括标签值0或1,其中0指示不安全,1指示安全。
21.如权利要求15所述的数据处理系统,其中所述操作进一步包括:
继收集所述车辆的驾驶统计数据和环境数据之后,将收集的所述驾驶统计数据和所述环境数据远程存储到服务器上;以及
在从所述驾驶统计数据和所述环境数据提取特征之前,从所述服务器检索收集的所述驾驶统计数据和所述环境数据。
CN201811384514.6A 2018-04-12 2018-11-20 部署在模拟平台上的用于训练机器学习模型的系统和方法 Pending CN110378483A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US15/952,089 US11328219B2 (en) 2018-04-12 2018-04-12 System and method for training a machine learning model deployed on a simulation platform
US15/952,089 2018-04-12

Publications (1)

Publication Number Publication Date
CN110378483A true CN110378483A (zh) 2019-10-25

Family

ID=68160019

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811384514.6A Pending CN110378483A (zh) 2018-04-12 2018-11-20 部署在模拟平台上的用于训练机器学习模型的系统和方法

Country Status (3)

Country Link
US (1) US11328219B2 (zh)
JP (1) JP6738932B2 (zh)
CN (1) CN110378483A (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111547064A (zh) * 2020-05-26 2020-08-18 吉林大学 一种用于汽车自适应巡航系统的驾驶风格识别和分类方法
CN111652153A (zh) * 2020-06-04 2020-09-11 北京百度网讯科技有限公司 场景自动识别方法、装置、无人车及存储介质
CN111680730A (zh) * 2020-06-01 2020-09-18 中国第一汽车股份有限公司 一种地理围栏的生成方法、装置、计算机设备和存储介质
CN112180921A (zh) * 2020-09-22 2021-01-05 安徽江淮汽车集团股份有限公司 自动驾驶算法训练系统及方法
CN112364882A (zh) * 2019-12-30 2021-02-12 致讯科技(天津)有限公司 一种基于感知赋能的增强自动驾驶方法和系统
CN113044037A (zh) * 2019-12-28 2021-06-29 华为技术有限公司 智能汽车的控制方法、装置和控制系统
CN113508065A (zh) * 2020-01-23 2021-10-15 百度时代网络技术(北京)有限公司 用于自主车辆控制的跨平台控制剖析
CN114148342A (zh) * 2020-09-07 2022-03-08 奥迪股份公司 自动驾驶判断系统、自动驾驶控制系统及车辆
CN114261394A (zh) * 2020-09-15 2022-04-01 保时捷股份公司 用于确定交通场景的方法、系统和计算机可读存储介质
CN116710977A (zh) * 2021-01-15 2023-09-05 埃尔构人工智能有限责任公司 用于构建远程机器学习模型的数据的智能车载选择的自主车辆系统

Families Citing this family (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019017253A1 (ja) * 2017-07-18 2019-01-24 パイオニア株式会社 制御装置、制御方法、およびプログラム
US11273836B2 (en) 2017-12-18 2022-03-15 Plusai, Inc. Method and system for human-like driving lane planning in autonomous driving vehicles
US20190185012A1 (en) 2017-12-18 2019-06-20 PlusAI Corp Method and system for personalized motion planning in autonomous driving vehicles
US11130497B2 (en) * 2017-12-18 2021-09-28 Plusai Limited Method and system for ensemble vehicle control prediction in autonomous driving vehicles
US11602999B1 (en) * 2018-05-01 2023-03-14 Zoox, Inc. Predictive control strategies for vehicles
US10576380B1 (en) * 2018-11-05 2020-03-03 Sony Interactive Entertainment LLC Artificial intelligence (AI) model training using cloud gaming network
US10915109B2 (en) * 2019-01-15 2021-02-09 GM Global Technology Operations LLC Control of autonomous vehicle based on pre-learned passenger and environment aware driving style profile
US11446815B2 (en) 2019-03-01 2022-09-20 Duality Robotics, Inc. Autonomous robot scenario re-simulation
CN110069064B (zh) * 2019-03-19 2021-01-29 驭势科技(北京)有限公司 一种自动驾驶系统升级的方法、自动驾驶系统及车载设备
US11554785B2 (en) * 2019-05-07 2023-01-17 Foresight Ai Inc. Driving scenario machine learning network and driving environment simulation
US11420625B2 (en) * 2019-07-03 2022-08-23 Ford Global Technologies, Llc Vehicle intersection operation
US11941976B2 (en) * 2019-07-25 2024-03-26 Pony Ai Inc. System and method for sharing data collected from the street sensors
US11928399B1 (en) * 2019-09-24 2024-03-12 Zoox, Inc. Simulating object occlusions
US20210094565A1 (en) * 2019-09-30 2021-04-01 Ghost Locomotion Inc. Motion-based scene selection for an autonomous vehicle
CN111125442B (zh) * 2019-12-11 2022-11-15 苏州智加科技有限公司 数据标注方法及装置
KR20220127131A (ko) * 2019-12-17 2022-09-19 포레텔릭스 엘티디. 자율 주행 차량의 올바른 동작을 모니터링하기 위한 시스템 및 그 방법
CN111122175B (zh) * 2020-01-02 2022-02-25 阿波罗智能技术(北京)有限公司 测试自动驾驶系统的方法以及装置
KR102139172B1 (ko) * 2020-01-06 2020-07-29 주식회사 모라이 가상환경에서의 자율주행차량 시뮬레이션 방법
CN111353221A (zh) * 2020-02-24 2020-06-30 上海商汤临港智能科技有限公司 自动驾驶仿真方法和装置、电子设备及存储介质
DE102020202540A1 (de) 2020-02-27 2021-09-02 Psa Automobiles Sa Verfahren zum Trainieren wenigstens eines Algorithmus für ein Steuergerät eines Kraftfahrzeugs, Computerprogrammprodukt sowie Kraftfahrzeug
CN111680362B (zh) * 2020-05-29 2023-08-11 北京百度网讯科技有限公司 一种自动驾驶仿真场景获取方法、装置、设备及存储介质
US11829150B2 (en) 2020-06-10 2023-11-28 Toyota Research Institute, Inc. Systems and methods for using a joint feature space to identify driving behaviors
US11851086B2 (en) * 2020-06-26 2023-12-26 Waymo Llc Using simulations to identify differences between behaviors of manually-driven and autonomous vehicles
CN111931286A (zh) * 2020-06-29 2020-11-13 北京百度网讯科技有限公司 纵向动力学模型的训练方法、装置及设备
EP3951673A1 (en) * 2020-08-04 2022-02-09 Aptiv Technologies Limited Method and system of collecting training data suitable for training an autonomous driving system of a vehicle
US11938957B2 (en) * 2020-08-24 2024-03-26 Motional Ad Llc Driving scenario sampling for training/tuning machine learning models for vehicles
US11568688B2 (en) 2020-08-25 2023-01-31 Motional Ad Llc Simulation of autonomous vehicle to improve safety and reliability of autonomous vehicle
CN112396501B (zh) * 2020-12-10 2024-03-19 中国科学院深圳先进技术研究院 一种基于交互式强化学习的订单分派方法及系统
US11912302B2 (en) * 2020-12-21 2024-02-27 Zoox, Inc. Autonomous control engagement
US11738777B2 (en) 2020-12-21 2023-08-29 Zoox, Inc. Dynamic autonomous control engagement
US20220227397A1 (en) * 2021-01-19 2022-07-21 Baidu Usa Llc Dynamic model evaluation package for autonomous driving vehicles
EP4033460A1 (en) * 2021-01-22 2022-07-27 Aptiv Technologies Limited Data recording for adas testing and validation
DE102021103697A1 (de) * 2021-02-17 2022-08-18 Jürgen Vogt Verfahren, vorrichtung zur datenverarbeitung, gerät und system
US20220297726A1 (en) * 2021-03-17 2022-09-22 Pony Ai Inc. Computerized detection of unsafe driving scenarios
CN113051765B (zh) * 2021-03-31 2024-01-05 中国科学院合肥物质科学研究院 一种基于虚拟场景变换的智能驾驶车辆车路在环测试方法
US11947356B2 (en) * 2021-04-13 2024-04-02 Waymo Llc Evaluating pullovers for autonomous vehicles
CN113119999B (zh) 2021-04-16 2024-03-12 阿波罗智联(北京)科技有限公司 自动驾驶特征的确定方法、装置、设备、介质及程序产品
CN113192381B (zh) * 2021-05-11 2023-07-28 上海西井科技股份有限公司 基于混合场景的模拟驾驶方法、系统、设备及存储介质
CN113496213A (zh) * 2021-06-29 2021-10-12 中汽创智科技有限公司 一种目标感知数据的确定方法、装置、系统及存储介质
CN113590951A (zh) * 2021-07-29 2021-11-02 上海德衡数据科技有限公司 一种感知数据处理方法及系统
CN113734203B (zh) * 2021-09-23 2023-02-28 中汽创智科技有限公司 一种智能驾驶的控制方法、装置、系统及存储介质
CN114511827B (zh) * 2021-11-30 2024-04-12 重庆长安汽车股份有限公司 一种智能辅助驾驶的车云感知闭环处理方法
BE1029668B1 (nl) 2021-12-03 2023-03-02 Ivex Methoden, systemen, opslagmedia en apparatuur voor end-to-end scenario-extractie uit 3d input puntenwolken, scenario-indeling en het genereren van sequentiële rij-eigenschappen voor de identificatie van veiligheidskritieke scenario-categorieën
US20230310995A1 (en) * 2022-03-31 2023-10-05 Advanced Micro Devices, Inc. Detecting personal-space violations in artificial intelligence based non-player characters

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110153742A1 (en) * 2009-12-23 2011-06-23 Aws Convergence Technologies, Inc. Method and Apparatus for Conveying Vehicle Driving Information
US20170200061A1 (en) * 2016-01-11 2017-07-13 Netradyne Inc. Driver behavior monitoring
US20170261990A1 (en) * 2016-03-10 2017-09-14 Ford Global Technologies, Llc Systems and methods for driving risk index estimation
CN107577227A (zh) * 2016-07-05 2018-01-12 百度(美国)有限责任公司 操作无人驾驶车辆的方法、装置和数据处理系统
US9884630B1 (en) * 2016-07-05 2018-02-06 Uber Technologies, Inc. Autonomous vehicle performance optimization system

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8508353B2 (en) * 2009-01-26 2013-08-13 Drivecam, Inc. Driver risk assessment system and method having calibrating automatic event scoring
US8552851B2 (en) * 2008-05-09 2013-10-08 Nec Corporation Operation state judgement method and system
US8854199B2 (en) * 2009-01-26 2014-10-07 Lytx, Inc. Driver risk assessment system and method employing automated driver log
JP2012256138A (ja) * 2011-06-08 2012-12-27 Daihatsu Motor Co Ltd 携帯端末装置およびこれを備えた運転評価システム
US9361409B2 (en) * 2013-01-10 2016-06-07 International Business Machines Corporation Automatic driver modeling for integration of human-controlled vehicles into an autonomous vehicle network
JP2015089801A (ja) * 2013-11-07 2015-05-11 株式会社デンソー 運転制御装置
EP3279052A4 (en) * 2015-03-31 2018-12-05 Hitachi Automotive Systems, Ltd. Automatic driving control device
JP6922739B2 (ja) * 2015-09-30 2021-08-18 ソニーグループ株式会社 情報処理装置、および情報処理方法、並びにプログラム
DE102015224558A1 (de) * 2015-12-08 2017-06-08 Robert Bosch Gmbh Verfahren zum Validieren einer Fahrassistenzfunktion eines Kraftfahrzeugs
US11120353B2 (en) * 2016-08-16 2021-09-14 Toyota Jidosha Kabushiki Kaisha Efficient driver action prediction system based on temporal fusion of sensor data using deep (bidirectional) recurrent neural network
US10308242B2 (en) * 2017-07-01 2019-06-04 TuSimple System and method for using human driving patterns to detect and correct abnormal driving behaviors of autonomous vehicles
JP6946861B2 (ja) * 2017-08-29 2021-10-13 トヨタ自動車株式会社 自動運転評価装置及び自動運転評価方法
US20190101914A1 (en) * 2017-10-02 2019-04-04 Allstate Insurance Company Data Processing System with Machine Learning Engine for Providing Driving Data Analysis and Vehicle Control Functions
US10976737B2 (en) * 2017-11-21 2021-04-13 GM Global Technology Operations LLC Systems and methods for determining safety events for an autonomous vehicle
US10169680B1 (en) * 2017-12-21 2019-01-01 Luminar Technologies, Inc. Object identification and labeling tool for training autonomous vehicle controllers

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110153742A1 (en) * 2009-12-23 2011-06-23 Aws Convergence Technologies, Inc. Method and Apparatus for Conveying Vehicle Driving Information
US20170200061A1 (en) * 2016-01-11 2017-07-13 Netradyne Inc. Driver behavior monitoring
US20170261990A1 (en) * 2016-03-10 2017-09-14 Ford Global Technologies, Llc Systems and methods for driving risk index estimation
CN107577227A (zh) * 2016-07-05 2018-01-12 百度(美国)有限责任公司 操作无人驾驶车辆的方法、装置和数据处理系统
US9884630B1 (en) * 2016-07-05 2018-02-06 Uber Technologies, Inc. Autonomous vehicle performance optimization system

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
谢颖: "信息融合算法研究及其应用", 《中国优秀硕士学位论文全文数据库 (信息科技辑)》 *

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113044037A (zh) * 2019-12-28 2021-06-29 华为技术有限公司 智能汽车的控制方法、装置和控制系统
CN112364882A (zh) * 2019-12-30 2021-02-12 致讯科技(天津)有限公司 一种基于感知赋能的增强自动驾驶方法和系统
CN112364882B (zh) * 2019-12-30 2023-04-07 致讯科技(天津)有限公司 一种基于感知赋能的增强自动驾驶方法和系统
CN113508065B (zh) * 2020-01-23 2023-08-04 百度时代网络技术(北京)有限公司 用于自主车辆控制的跨平台控制剖析
CN113508065A (zh) * 2020-01-23 2021-10-15 百度时代网络技术(北京)有限公司 用于自主车辆控制的跨平台控制剖析
CN111547064B (zh) * 2020-05-26 2022-07-12 吉林大学 一种用于汽车自适应巡航系统的驾驶风格识别和分类方法
CN111547064A (zh) * 2020-05-26 2020-08-18 吉林大学 一种用于汽车自适应巡航系统的驾驶风格识别和分类方法
CN111680730A (zh) * 2020-06-01 2020-09-18 中国第一汽车股份有限公司 一种地理围栏的生成方法、装置、计算机设备和存储介质
CN111652153A (zh) * 2020-06-04 2020-09-11 北京百度网讯科技有限公司 场景自动识别方法、装置、无人车及存储介质
CN111652153B (zh) * 2020-06-04 2023-12-22 北京百度网讯科技有限公司 场景自动识别方法、装置、无人车及存储介质
CN114148342A (zh) * 2020-09-07 2022-03-08 奥迪股份公司 自动驾驶判断系统、自动驾驶控制系统及车辆
CN114261394A (zh) * 2020-09-15 2022-04-01 保时捷股份公司 用于确定交通场景的方法、系统和计算机可读存储介质
CN112180921A (zh) * 2020-09-22 2021-01-05 安徽江淮汽车集团股份有限公司 自动驾驶算法训练系统及方法
CN112180921B (zh) * 2020-09-22 2021-07-30 安徽江淮汽车集团股份有限公司 自动驾驶算法训练系统及方法
CN116710977A (zh) * 2021-01-15 2023-09-05 埃尔构人工智能有限责任公司 用于构建远程机器学习模型的数据的智能车载选择的自主车辆系统
CN116710977B (zh) * 2021-01-15 2024-04-16 埃尔构人工智能有限责任公司 用于构建远程机器学习模型的数据的智能车载选择的自主车辆系统

Also Published As

Publication number Publication date
US11328219B2 (en) 2022-05-10
US20190318267A1 (en) 2019-10-17
JP2019185783A (ja) 2019-10-24
JP6738932B2 (ja) 2020-08-12

Similar Documents

Publication Publication Date Title
CN110378483A (zh) 部署在模拟平台上的用于训练机器学习模型的系统和方法
CN110377025A (zh) 用于自动驾驶车辆的传感器聚合框架
CN109429518A (zh) 基于地图图像的自动驾驶交通预测
CN110239562A (zh) 自动驾驶车辆的基于周围车辆行为的实时感知调整与驾驶调适
CN109937343A (zh) 用于自动驾驶车辆交通预测中的预测轨迹的评估框架
CN110345955A (zh) 用于自动驾驶的感知与规划协作框架
CN110377024A (zh) 用于自动驾驶车辆的自动数据标注
CN109489673A (zh) 用于自动驾驶车辆的数据驱动地图更新系统
CN110389583A (zh) 生成自动驾驶车辆的轨迹的方法
CN110389585A (zh) 用于自动驾驶车辆的基于学习的速度规划器
CN110388931A (zh) 将对象的二维边界框转换成自动驾驶车辆的三维位置的方法
CN109935077A (zh) 用于为自动驾驶车辆构建车辆与云端实时交通地图的系统
CN110389584A (zh) 用于评估自动驾驶车辆的轨迹候选项的方法
CN110462543A (zh) 用于评估自动驾驶车辆的感知要求的基于仿真的方法
CN108732589A (zh) 利用3d lidar和定位自动采集用于对象识别的训练数据
CN110389581A (zh) 用于为自动驾驶车辆生成障碍物的预测轨迹的方法
CN108205830A (zh) 识别对于无人驾驶车辆的个人驾驶偏好的方法和系统
CN108604095A (zh) 动态调整自动驾驶车辆的转向率的方法
CN108027243A (zh) 用于操作自动驾驶车辆的控制误差校正规划方法
CN110349416A (zh) 用于自动驾驶车辆(adv)的基于密度的交通灯控制系统
CN108475057A (zh) 基于车辆周围的情境预测车辆的一个或多个轨迹的方法和系统
CN108387241A (zh) 更新自动驾驶车辆的定位地图的方法和系统
CN108139884A (zh) 模拟自动驾驶车辆移动的物理模型和结合机器学习的方法
CN110386142A (zh) 用于自动驾驶车辆的俯仰角校准方法
CN110096053A (zh) 用于自动驾驶车辆的驾驶轨迹生成方法、系统和机器可读介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination