CN109990794A - 具有动态成本学习的自主驾驶轨迹规划器 - Google Patents

具有动态成本学习的自主驾驶轨迹规划器 Download PDF

Info

Publication number
CN109990794A
CN109990794A CN201811525026.2A CN201811525026A CN109990794A CN 109990794 A CN109990794 A CN 109990794A CN 201811525026 A CN201811525026 A CN 201811525026A CN 109990794 A CN109990794 A CN 109990794A
Authority
CN
China
Prior art keywords
vehicle
coefficient
cost
neural network
navigation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811525026.2A
Other languages
English (en)
Inventor
S·R·贾法利塔夫提
邹光宇
M·J·休伯
U·P·穆达里格
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
GM Global Technology Operations LLC
Original Assignee
GM Global Technology Operations LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by GM Global Technology Operations LLC filed Critical GM Global Technology Operations LLC
Publication of CN109990794A publication Critical patent/CN109990794A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01CMEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
    • G01C21/00Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
    • G01C21/26Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00 specially adapted for navigation in a road network
    • G01C21/34Route searching; Route guidance
    • G01C21/3407Route searching; Route guidance specially adapted for specific applications
    • G01C21/343Calculating itineraries, i.e. routes leading from a starting point to a series of categorical destinations using a global route restraint, round trips, touristic trips
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/02Control of position or course in two dimensions
    • G05D1/021Control of position or course in two dimensions specially adapted to land vehicles
    • G05D1/0212Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory
    • G05D1/0221Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory involving a learning process
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01CMEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
    • G01C21/00Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
    • G01C21/26Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00 specially adapted for navigation in a road network
    • G01C21/34Route searching; Route guidance
    • G01C21/3407Route searching; Route guidance specially adapted for specific applications
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W30/00Purposes of road vehicle drive control systems not related to the control of a particular sub-unit, e.g. of systems using conjoint control of vehicle sub-units
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W60/00Drive control systems specially adapted for autonomous road vehicles
    • B60W60/001Planning or execution of driving tasks
    • B60W60/0011Planning or execution of driving tasks involving control alternatives for a single driving scenario, e.g. planning several paths to avoid obstacles
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01CMEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
    • G01C21/00Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
    • G01C21/26Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00 specially adapted for navigation in a road network
    • G01C21/34Route searching; Route guidance
    • G01C21/3446Details of route searching algorithms, e.g. Dijkstra, A*, arc-flags, using precalculated routes
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01CMEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
    • G01C21/00Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
    • G01C21/26Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00 specially adapted for navigation in a road network
    • G01C21/34Route searching; Route guidance
    • G01C21/3453Special cost functions, i.e. other than distance or default speed limit of road segments
    • G01C21/3469Fuel consumption; Energy use; Emission aspects
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/0088Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots characterized by the autonomous decision making process, e.g. artificial intelligence, predefined behaviours
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/01Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W2554/00Input parameters relating to objects

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Automation & Control Theory (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Mechanical Engineering (AREA)
  • Transportation (AREA)
  • Business, Economics & Management (AREA)
  • Game Theory and Decision Science (AREA)
  • Medical Informatics (AREA)
  • Human Computer Interaction (AREA)
  • Traffic Control Systems (AREA)
  • Control Of Driving Devices And Active Controlling Of Vehicle (AREA)

Abstract

一种车辆、车辆自主导航的系统和方法。在车辆的处理器处接收用于沿路段导航训练交通场景的参考轨迹。处理器确定用于与模拟参考轨迹的候选轨迹相关联的成本函数的系数。将所确定的系数提供给神经网络以训练神经网络。训练的神经网络使用由神经网络确定的成本系数来生成用于导航车辆的导航轨迹。使用导航轨迹沿路段导航车辆。

Description

具有动态成本学习的自主驾驶轨迹规划器
引言
本公开涉及用于车辆自主导航的系统,并且具体涉及用于训练神经网络以选择用于在动态道路和交通场景中导航的轨迹的系统和方法。
自主车辆采用生成用于导航车辆的轨迹的运动规划系统。大多数运动规划系统通过确定与该轨迹相关联的成本函数来寻找一段道路上的车辆的最佳轨迹。然而,通常仅使用单个或甚至多个成本函数难以生成在多个不同道路场景上可操作的同时模仿类似人的驾驶的轨迹。因此,期望提供一种针对不同道路场景动态地获取最优轨迹的轨迹规划方法。
发明内容
在一个示例性实施例中,公开了一种车辆自主导航的方法。该方法包括:在处理器处接收用于沿路段导航训练交通场景的参考轨迹、在该处理器处确定用于与模拟参考轨迹的候选轨迹相关联的成本函数的系数、将确定的系数提供给神经网络以训练神经网络、并且使用训练的神经网络使用由神经网络确定的适当的成本系数来生成用于导航车辆的导航轨迹。使用导航轨迹沿路段导航车辆。
除了本文描述的一个或多个特征之外,路段由用于训练神经网络的搜索图表示,并且候选轨迹局限于搜索图。搜索图可以包括车辆状态数据和沿路段的对象的数据。与候选轨迹相关联的成本函数取决于训练交通场景中的对象。
确定系数包括:确定与参考轨迹相关联的成本以及确定系数,对于该系数,与候选轨迹相关联的成本函数输出在与参考轨迹相关联的成本的选择标准内的成本。在各个实施例中,选择成本函数的系数以提供近似参考轨迹的最小成本的最优轨迹。
在另一示例性实施例中,公开了一种用于导航自主车辆的系统。该系统包括处理器,该处理器配置为接收用于沿路段导航训练交通场景的参考轨迹、确定用于与模拟参考轨迹的候选轨迹相关联的成本函数的系数、将确定的系数提供给神经网络以训练神经网络、并且在神经网络处使用由神经网络确定的适当的成本系数来生成用于导航车辆的导航轨迹。处理器还配置为使用导航轨迹沿路段导航车辆。
除了本文描述的一个或多个特征之外,该处理器还配置为经由具有局限于该搜索图的候选轨迹的搜索图来表示该路段并且使用该搜索图作为输入来训练该神经网络。搜索图包括车辆状态数据和沿路段的对象的数据。与候选轨迹相关联的成本函数取决于交通场景中的对象。
处理器进一步配置为确定系数,对于该系数与候选轨迹相关联的成本在与参考轨迹相关联的成本的选择标准内。处理器进一步配置为确定成本函数的提供近似参考轨迹的最小成本的最优轨迹的系数,并且使用确定的系数训练神经网络。
在又一示例性实施例中,公开了一种自主车辆。该车辆包括处理器,该处理器配置为接收用于沿路段导航训练交通场景的参考轨迹、确定用于与模拟参考轨迹的候选轨迹相关联的成本函数的系数、将确定的系数提供给神经网络以训练神经网络、使用由训练的神经网络确定的适当的成本系数来生成用于导航车辆的导航轨迹,并且使用导航轨迹来沿路段导航车辆。
除了本文描述的一个或多个特征之外,该处理器经由具有局限于该搜索图形的候选轨迹的搜索图形来表示该路段并且使用该搜索图形来训练该神经网络。与候选轨迹相关联的成本函数取决于交通场景中的对象。处理器确定系数,对于该系数与候选轨迹相关联的成本在与参考轨迹相关联的成本的选择标准内。处理器确定成本函数的提供近似参考轨迹的最小成本的最优轨迹的系数,并且使用确定的系数训练神经网络。
车辆包括传感器,该传感器检测车辆的状况和涉及车辆的实时交通场景的状况,并且神经网络生成适合于感测到的实时交通场景的成本系数,并根据生成的成本系数生成导航轨迹。
通过以下结合附图的详细描述,本发明的以上特征和优点以及其它特征和优点是显而易见的。
附图说明
其他特征、优点和细节仅作为示例出现在以下详细描述中,详细描述参考附图,其中:
图1示出了根据多个实施例的通常与车辆相关联的轨迹规划系统;
图2示出了可以由主车辆遇到或可以被用作训练场景的说明性交通场景的俯视图;
图3示出了示出在一个实施例中用于寻找用于训练深度神经网络(DNN)的成本函数系数的数据流的示意图;
图4示出了在实施例中用于将DNN训练到选择的交通场景的示意图;
图5示出了在一个实施例中用于在车辆的操作中使用训练的神经网络以便导航交通模式的数据流的示意图;并且
图6示出了示出根据一个实施例的导航选择的交通场景的方法的流程图。
具体实施方式
以下描述本质上仅仅是示例性的,并不旨在限制本公开、其应用或使用。应当理解,在所有附图中,相应的参考标记表示相同或相应的部分和特征。
参考图1,总体上以100示出的轨迹规划系统与根据各个实施例的自主车辆10相关联。一般而言,系统100确定用于自动驾驶的轨迹规划。如图1中所描绘的,自主车辆10一般包括底盘12、主体14、前轮16和后轮18。主体14被布置在底盘12上并且基本上封闭自主车辆10的部件。主体14和底盘12可以共同形成单体结构。轮16-18各自在主体14的相应角部附近可旋转地联接到底盘12。
在各种实施例中,自主车辆10是自主车辆,并且轨迹规划系统100结合到自主车辆10(下文称为自主车辆10)中。自主车辆10例如是被自动控制以将乘客从一个位置承载到另一位置的车辆。自主车辆10在示出的实施例中被描绘为客车,但是应当理解的是,也可以使用任何其他车辆,包括卡车、运动型多功能车(SUV)、休闲车辆(RV)、船舶、飞机等。在示例性实施例中,自主车辆10是所谓的四级或五级自动化系统。参照自动驾驶系统的、动态驾驶任务的所有方面的驾驶模式特定性能,四级系统指示高度自动化,即使人类驾驶员没有适当地响应请求以干预。参照自动驾驶系统在可以由人类驾驶员管理的所有道路和环境条件下的动态驾驶任务的所有方面的全时间性能,五级系统指示全自动化。
如所示的那样,自主车辆10一般包括推进系统20、变速器系统22、转向系统24、制动器系统26、传感器系统28、致动器系统30、至少一个数据存储设备32、至少一个控制器34和通信系统36。在各种实施例中,推进系统20可以包括内燃机、诸如牵引电动机的电机和/或燃料电池推进系统。变速器系统22配置为根据可选择的速度比将动力从推进系统20传输到车轮16-18。根据各种实施例,变速器系统22可以包括有级自动变速器、无级变速器或其他适当的变速器。制动器系统26配置为向车轮16-18提供制动扭矩。在各种实施例中,制动器系统26可以包括摩擦制动器、电线制动、诸如电机的再生制动系统和/或其他适当的制动系统。转向系统24影响车轮16-18的位置。虽然为了说明的目的被描绘为包括转向盘,但是在本公开的范围内预期的一些实施例中,转向系统24可以不包括转向盘。
传感器系统28包括感测自主车辆10的外部环境和/或内部环境的可观察状况的一个或多个感测设备40a-40n。感测设备40a-40n可以包括但不限于雷达、激光雷达、全球定位系统、光学摄像机、热摄像机、超声传感器和/或其他传感器。致动器系统30包括控制一个或多个车辆特征的一个或多个致动器设备42a-42n,例如但不限于推进系统20、变速器系统22、转向系统24和制动器系统26。在各种实施例中,车辆特征可以进一步包括内部和/或外部车辆特征,诸如但不限于门、行李箱和诸如空气、音乐、照明等(未编号)的舱室特征。
数据存储设备32存储用于在自动控制自主车辆10中使用的数据。在各种实施例中,数据存储设备32存储可导航环境的定义映射。在各种实施例中,定义的映射可以由远程系统预定义并且从远程系统获得(关于图2进一步详细描述)。例如,定义的映射可以由远程系统组装并通信到自主车辆10(无线地和/或以有线方式)并存储在数据存储设备32中。如可以理解的那样,数据存储设备32可以是控制器34的与控制器34分离的一部分,或者是控制器34的一部分和分离系统的一部分。
控制器34包括至少一个处理器44和计算机可读存储设备或介质46。处理器44可以是任何定制的或可商购的处理器、中央处理单元(CPU)、图形处理单元(GPU)、与控制器34相关联的几个处理器当中的辅助处理器、基于半导体的微处理器(以微芯片或芯片组的形式)、宏处理器、它们的任何组合或或者一般用于执行指令的任何设备。例如,计算机可读存储设备或介质46可以包括只读存储器(ROM)、随机存取存储器(RAM)和保活存储器(KAM)中的易失性和非易失性存储器。KAM是持久或非易失性存储器,其可以被用于在处理器44断电时存储各种操作变量。计算机可读存储设备或介质46可以使用许多已知存储设备中的任何一个来实施,诸如PROM(可编程只读存储器)、EPROM(电PROM)、EEPROM(电可擦除PROM)、闪存或能够存储由控制器34在控制自主车辆10中使用的数据(其中一些代表可执行指令)的任何其他电、磁、光或组合存储器设备。
指令可以包括一个或多个分离的程序,程序中的每一个包括用于实施逻辑功能的可执行指令的有序列表。这些指令在被处理器44执行时接收和处理来自传感器系统28的信号,执行用于自动控制自主车辆10的部件的逻辑、计算、方法和/或算法,并且向致动器系统30生成控制信号,以基于逻辑、计算、方法和/或算法来自动控制自主车辆10的部件。尽管在图1中仅示出了一个控制器34,但自主车辆10的实施例可以包括通过任何合适的通信介质或通信介质的组合进行通信并且协作来处理传感器信号、执行逻辑、计算、方法和/或算法、并且生成控制信号以自动控制自主车辆10的特征的任意数量的控制器34。
在各种实施例中,控制器34的一个或多个指令被实现在轨迹规划系统100中,并且当被处理器44执行时,生成解决环境的运动约束和动态约束的轨迹输出。例如,指令接收处理信号并且将数据映射作为输入。指令执行具有定制成本函数的基于图形的方法,以应付城市道路和公路两者中的不同道路场景。
通信系统36配置为向和从其他实体48无线通信信息,诸如但不限于其他车辆(“V2V”通信)、基础设施(“V2I”通信)、远程系统和/或个人设备(关于图2更详细地描述)。在示例性实施例中,通信系统36是配置为使用IEEE802.11标准或通过使用蜂窝数据通信经由无线局域网(WLAN)进行通信的无线通信系统。然而,诸如专用程离通信(DSRC)信道的附加或替换的通信方法也被认为在本公开的范围内。DSRC信道指的是专门设计用于汽车使用的单向或双向短程到中程无线通信信道和相应的一组协议和标准。
自主车辆10包括用于在路段上通过选择的道路场景或选择的交通场景自主导航的系统。该系统操作并训练神经网络以相对于多个交通场景、道路场景等进行驾驶,并且然后使用训练的神经网络在实际的道路和交通场景中进行驾驶。该训练方法包括:在不同道路场景中收集期望的类似人类驾驶的训练数据以及基于对轨迹规划系统100的输入来生成搜索图。为搜索图定义成本函数,该成本函数定义从搜索图的起点到搜索图的终点遍历搜索图的每个轨迹的成本值。成本函数包括预定义的不同成本分量和为每个成本分量指定权重的不同成本系数。成本分量可以是车辆的用于与道路上的其他对象碰撞的分配或计算的能量成本或能量费用,或者用于转向、切换车道、改变速度的分配或计算的能量成本或能量费用。然后使用所收集的训练数据中的车辆的期望轨迹来找到导致最小成本轨迹或基本上最小成本轨迹的相应的成本函数系数,该最小成本轨迹或基本上最小成本轨迹接近如通过图形搜索确定的期望轨迹。然后可以将系数的值存储在数据库中并用于训练深度神经网络。在实际的驾驶情况下,系统可以识别与训练交通场景匹配或基本上匹配的实际交通场景,并且计算适当的系数以构造用于检测到的交通场景的轨迹并且沿所构造的轨迹导航车辆。
图2示出了可由主车辆遇到或可以被用作训练场景的说明性交通场景的俯视图200。俯视图200示出了沿三车道道路202的中心车道以35公里/小时(km/h)驾驶的主车辆(HV)204。三车道道路202包括左车道202a、中心车道202b和右车道202c。HV 204在页面的最左侧处。若干远程对象也在道路202上,并且为主车辆204到达其目的地提供障碍物,例如页面的最右侧。特别地,目标车辆1(TV1)在中心车道202b中并且以0km/h(静止)行驶,目标车辆2(TV2)在左侧车道202a中并且以0km/h(静止)行驶,并且目标车辆3(TV3)在右侧车道202c中并且以35km/h行驶。
HV 204可以考虑各种轨迹(T1、T2、T3)以便导航三车道道路202。然而,采取何种轨迹取选择决于交通状况以及与给定交通状况的轨迹相关的成本或费用。与轨迹相关联的成本或能量费用可以基于若干因素,诸如道路状况、交通状况。例如,能量费用可以通过改变车道或通过需要转向车辆而引起。附加地,能量费用可以通过沿使主车辆204与任何目标车辆接触或驾驶车辆离开道路的轨迹继续而引起。
为了图示,首先考虑其中HV 204是道路上唯一车辆的交通场景。HV204最有可能选择轨迹T2(在不改变车道的情况下沿中心车道202b驾驶)因为这对于HV 104的控制器来说产生相对低的成本,因为不需要改变车道。轨迹T1包括改变到左车道202b并且由于改变车道而引起成本。轨迹T3包括改变到右车道2023并且由于改变车道而引起成本。因此,轨迹T2具有最低成本,并且因此是所选择的轨迹。
现在考虑图2中具体示出的交通场景,其包括车辆TV1、TV2和TV3。通过沿轨迹T2驾驶,HV 204沿中心车道202b驾驶,直到它进入TV1,这是不期望的结果。成本计算使得高成本与碰撞相关联,在一些情况下,碰撞的成本可以被设置为无穷大。因此,高成本与轨迹T2相关联。另一方面,通过沿轨迹T1驾驶,HV 204可以沿中心车道202b驾驶,以便超过TV2,改变到左侧车道202a并且然后驾驶超过TV1,由此成功地导航通过交通。虽然通过改变车道、任何加速、减速等引起成本,但是不存在由碰撞引起的成本。因此,与轨迹T1相关联的成本相对较低。轨迹T3似乎是不可实现的轨迹,因为HV 104和TV3以相同的速度驾驶,防止HV 204超过TV3以便改变到TV3前面的右车道202c中。因此,也可以将高成本与轨迹T3相关联。轨迹成本的比较使得为该场景选择轨迹T1。
图3示出了示出一个实施例中用于训练神经网络的数据流的示意图300。图300包含用于训练神经网络的训练场景。应当理解的是,对于多个可能的道路或交通场景必须使用多个训练场景来训练。训练场景可以根据目标车辆的数量、位置和速度、道路状况、道路曲率以及主车辆的不同状态而不同。
训练场景以数据304(诸如状态数据304a、道路场景数据304b、行为数据304c和对象融合数据304d)的形式向轨迹规划系统100提供输入。状态数据304a(HV状态)包括主车辆的参数,诸如主车辆的位置、速度、取向、加速度等。道路场景数据304b提供关于路段边界和几何形状的信息,包括长度、宽度、车道数量、曲率等,以及默认轨迹。行为数据304c提供主车辆的动态引导,诸如主车辆加速、减速、左转、右转、改变为左车道、改变为右车道的运动能力。对象融合数据304d例如包括目标车辆(TV1、TV2、TV3)的数量、位置和速度。
使用状态数据304A、道路场景数据304B和行为数据304C作为包括主车辆104遍历交通场景的不同轨迹的网格表示来形成搜索图306。在不考虑目标车辆或其他对象的存在的情况下创建搜索图306。网格位置指示在主车辆沿道路从网格的起始位置(通常在左边)移动到网格的结束位置(通常在右边)时主车辆的可能位置。在主车辆沿网格点移动时,引起成本。网格点之间的每个移动具有相关的成本,并且沿网格的轨迹成本是沿构成轨迹的网格点的每个移动的成本的总和。然后,可以将目标车辆添加到搜索图形,使得在确定这些轨迹的成本时包含目标车辆的位置和速度。
一旦计算了搜索图306,就提供了主车辆104的参考轨迹310,其在用于导航通过交通场景的期望的类似人类的驾驶或计算机模拟驾驶期间被收集。参考轨迹310叠加在搜索图306上,并且找到搜索图306中最接近参考轨迹310的最优轨迹312。然后确定为每个成本分量指定权重的成本函数系数308,使得用该成本函数搜索图306导致在搜索图306中的所有候选轨迹中具有最小成本值的最优轨迹312。通过使用搜索图306和成本系数308来实施对神经网络的训练。
在实施例中,定义在搜索图306中找到最优轨迹312的成本函数,其中成本函数和成本分量之间的关系用公式表示。(1):
Ctrajectory=∑ii Ci (1)
其中Ctrajectory是与每个候选轨迹相关联的成本函数,Ci是指示与轨迹相关联的成本的成本分量,并且αi是与第i个成本分量相关联的系数。系数αi被包括以确定每个候选轨迹的总成本中的每个成本分量的权重。训练深度神经网络以学习针对不同道路场景和交通状况的这些系数αi。图4示出了在实施例中用于将深度神经网络训练到选择的交通场景的示意图400。提供日志数据304,诸如诸如状态数据304a、道路场景数据304b、行为数据304c和对象融合数据304d。日志数据用于生成搜索图306。记录的车辆状态数据304a可以被用于确定车辆的驾驶参考轨迹310。然后使用搜索图306和参考轨迹310来确定成本系数308。然后将搜索图306和成本系数308提供给深度神经网络402,以便训练神经网络402获得选择的交通场景。
图5示出了在一个实施例中用于在车辆的操作中使用训练的神经网络以便导航交通模式的数据流的示意图500。在车辆处于交通场景中时,车辆使用主车辆上的传感器感测各种数据504,诸如车辆状态数据504a、道路场景数据504b、行为数据504c和对象融合数据504d。提供这些参数504以形成搜索图506。搜索图506被提供给训练的深度神经网络402,其输出适当的成本函数系数508。这些成本系数用于搜索图506,以便找到最优的最小成本轨迹508。然后使用最佳轨迹508来确定满足主车辆的运动约束的安全且平滑的最终轨迹510。然后将最终轨迹510提供给控制器,以便将车辆导航通过当前道路场景。
因此,导航车辆包括训练场景,该训练场景包括处理器接收训练交通场景以及适于导航训练交通场景的参考轨迹。处理器确定与成本函数相关联的多个系数。通过搜索匹配或接近参考轨迹的图,以导致最优的最小成本轨迹的方式确定系数。确定的系数和搜索图以及参数化搜索图的各种参数(诸如车辆的运动和沿路段的对象)被提供给深度神经网络以训练神经网络。训练的神经网络然后被用于生成实时交通场景的导航轨迹。传感器可以检测实时交通场景,生成适合于实时交通场景的系数,并根据生成的成本系数生成导航轨迹。
图6示出了示出根据一个实施例的导航选择的交通场景的方法的流程图600。该方法开始于方框602处并进行到框604,在框604处,车辆上的传感器用于获得输入,诸如车辆的环境条件。诸如道路参数和交通场景、诸如外部对象和车辆的位置、它们的距离、方位角和相对速度。在框606处,处理器检查输入以确定它们是否有效。如果输入无效,则过程返回到框604以获得新的输入。当认为输入有效时,该方法进行到框608。在框608中,生成搜索图。在框610,该方法确定搜索图是否是有效搜索图。如果搜索图无效,则该方法返回到在框604中获得输入。如果搜索图有效,则该方法进行到框612,其中神经网络计算成本函数系数。在框614中,该方法确定系数是否有效。如果系数无效,则该方法返回到框604以获得新的输入。如果系数有效,则方法进行到框616。在框616中,搜索图以便找到最优路径。在框618中,确定最佳路径是否有效。如果最佳路径无效,则该方法返回到框604,以便获得新的输入。如果最佳路径有效,则该方法进行到框620。在框620中,平滑最佳路径以便在道路上形成平滑轨迹。平滑轨迹是具有最小曲率和曲率变化率的安全通道内的路径。除了别的之外,平滑轨迹避免了在驾驶期间过度的横向加速度或跳动。在框622中,该方法根据平滑轨迹生成局部轨迹。局部轨迹与平滑轨迹的不同之处在于它满足了诸如主车辆在位置、方向、曲率和速度上的连续性的运动约束。在框624中,确定局部轨迹是否是安全且可行的。如果确定局部轨迹不安全或不可行,则该方法返回到框604。如果确定局部轨迹是安全且可行的,则在框626中将轨迹发送到控制器,以便使用局部轨迹来导航车辆。
虽然已经参考示例性实施例描述了以上公开,但是本领域技术人员将理解的是,在不脱离其范围的情况下,可以进行各种改变并且可以用等同物代替其元件。此外,在不脱离本发明的实质范围的情况下,可以进行许多修改以使特定情况或材料适应本公开的教导。因此,本公开不限于公开的特定实施例,而是将包括落入本申请范围内的所有实施例。

Claims (10)

1.一种车辆自主导航的方法,包括:
在处理器处接收用于沿路段导航训练交通场景的参考轨迹;
在所述处理器处确定用于与模拟所述参考轨迹的候选轨迹相关联的成本函数的系数;
将所述确定的系数提供给神经网络以训练所述神经网络;
使用所述训练的神经网络使用由所述神经网络确定的适当成本系数来生成用于导航所述车辆的导航轨迹;以及
使用所述导航轨迹沿所述路段导航所述车辆。
2.如权利要求1所述的方法,还包括经由搜索图表示所述路段,其中所述候选轨迹被局限于所述搜索图,并且使用所述搜索图训练所述神经网络。
3.如权利要求1所述的方法,其中确定所述系数进一步包括:确定与所述参考轨迹相关联的成本;以及确定所述系数,对于所述系数,与所述候选轨迹相关联的所述成本函数输出在与所述参考轨迹相关联的所述成本的选择标准内的成本。
4.如权利要求1所述的方法,进一步包括确定所述成本函数的提供近似所述参考轨迹的最小成本的最优轨迹的所述系数。
5.一种自主车辆,包括:
处理器,配置为:
接收用于沿路段导航训练交通场景的参考轨迹;
确定用于与模拟所述参考轨迹的候选轨迹相关联的成本函数的系数;
将所述确定的系数提供给神经网络以训练所述神经网络;
使用由所述神经网络确定的适当成本系数来生成用于导航所述车辆的导航轨迹;以及
使用所述导航轨迹沿所述路段导航所述车辆。
6.如权利要求5所述的车辆,其中所述处理器还配置为经由具有局限于搜索图的候选轨迹的所述搜索图来表示所述路段并且使用所述搜索图来训练所述神经网络。
7.如权利要求5所述的车辆,其中与所述候选轨迹相关联的所述成本函数取决于所述交通场景中的对象。
8.如权利要求5所述的车辆,其中所述处理器还配置为确定所述系数,对于所述系数,与所述候选轨迹相关联的所述成本在与所述参考轨迹相关联的成本的选择标准内。
9.如权利要求5所述的车辆,其中所述处理器还配置为确定所述成本函数的提供近似所述参考轨迹的最小成本的最优轨迹的所述系数,并使用所述确定的系数训练所述神经网络。
10.如权利要求5所述的车辆,进一步包括检测所述车辆的状况和涉及所述车辆的实时交通场景的状况的传感器,其中所述神经网络还配置为生成适合于所述感测的实时交通场景的成本系数,并根据所述生成的成本系数生成所述导航轨迹。
CN201811525026.2A 2018-01-02 2018-12-13 具有动态成本学习的自主驾驶轨迹规划器 Pending CN109990794A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US15/859,857 US20190204842A1 (en) 2018-01-02 2018-01-02 Trajectory planner with dynamic cost learning for autonomous driving
US15/859857 2018-01-02

Publications (1)

Publication Number Publication Date
CN109990794A true CN109990794A (zh) 2019-07-09

Family

ID=66816941

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811525026.2A Pending CN109990794A (zh) 2018-01-02 2018-12-13 具有动态成本学习的自主驾驶轨迹规划器

Country Status (3)

Country Link
US (1) US20190204842A1 (zh)
CN (1) CN109990794A (zh)
DE (1) DE102018133576A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112829769A (zh) * 2020-09-15 2021-05-25 百度(美国)有限责任公司 自动驾驶车辆的混合规划系统
CN113552867A (zh) * 2020-04-20 2021-10-26 华为技术有限公司 一种运动轨迹的规划方法及轮式移动设备
CN114270142A (zh) * 2019-07-19 2022-04-01 祖克斯有限公司 非结构化的车辆路径规划器

Families Citing this family (48)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018176000A1 (en) 2017-03-23 2018-09-27 DeepScale, Inc. Data synthesis for autonomous control systems
US11157441B2 (en) 2017-07-24 2021-10-26 Tesla, Inc. Computational array microprocessor system using non-consecutive data formatting
US10671349B2 (en) 2017-07-24 2020-06-02 Tesla, Inc. Accelerated mathematical engine
US11409692B2 (en) 2017-07-24 2022-08-09 Tesla, Inc. Vector computational unit
US11893393B2 (en) 2017-07-24 2024-02-06 Tesla, Inc. Computational array microprocessor system with hardware arbiter managing memory requests
US11561791B2 (en) 2018-02-01 2023-01-24 Tesla, Inc. Vector computational unit receiving data elements in parallel from a last row of a computational array
US10996679B2 (en) * 2018-04-17 2021-05-04 Baidu Usa Llc Method to evaluate trajectory candidates for autonomous driving vehicles (ADVs)
US11966838B2 (en) * 2018-06-19 2024-04-23 Nvidia Corporation Behavior-guided path planning in autonomous machine applications
US11215999B2 (en) 2018-06-20 2022-01-04 Tesla, Inc. Data pipeline and deep learning system for autonomous driving
US11361457B2 (en) 2018-07-20 2022-06-14 Tesla, Inc. Annotation cross-labeling for autonomous control systems
US11636333B2 (en) 2018-07-26 2023-04-25 Tesla, Inc. Optimizing neural network structures for embedded systems
US11562231B2 (en) 2018-09-03 2023-01-24 Tesla, Inc. Neural networks for embedded devices
CN115512173A (zh) 2018-10-11 2022-12-23 特斯拉公司 用于使用增广数据训练机器模型的系统和方法
US11196678B2 (en) 2018-10-25 2021-12-07 Tesla, Inc. QOS manager for system on a chip communications
US11816585B2 (en) 2018-12-03 2023-11-14 Tesla, Inc. Machine learning models operating at different frequencies for autonomous vehicles
US11537811B2 (en) 2018-12-04 2022-12-27 Tesla, Inc. Enhanced object detection for autonomous vehicles based on field view
US11610117B2 (en) 2018-12-27 2023-03-21 Tesla, Inc. System and method for adapting a neural network model on a hardware platform
US10997461B2 (en) 2019-02-01 2021-05-04 Tesla, Inc. Generating ground truth for machine learning from time series elements
US11567514B2 (en) 2019-02-11 2023-01-31 Tesla, Inc. Autonomous and user controlled vehicle summon to a target
US10956755B2 (en) 2019-02-19 2021-03-23 Tesla, Inc. Estimating object properties using visual image data
CN109712421B (zh) * 2019-02-22 2021-06-04 百度在线网络技术(北京)有限公司 自动驾驶车辆的速度规划方法、装置和存储介质
US11073834B2 (en) * 2019-04-30 2021-07-27 Baidu Usa Llc Path generation for static obstacle avoidance
US11562251B2 (en) * 2019-05-16 2023-01-24 Salesforce.Com, Inc. Learning world graphs to accelerate hierarchical reinforcement learning
US11532188B2 (en) * 2019-08-22 2022-12-20 GM Global Technology Operations LLC Architecture and methodology for state estimation failure detection using crowdsourcing and deep learning
US11390300B2 (en) * 2019-10-18 2022-07-19 Uatc, Llc Method for using lateral motion to optimize trajectories for autonomous vehicles
RU2745804C1 (ru) * 2019-11-06 2021-04-01 Общество с ограниченной ответственностью "Яндекс Беспилотные Технологии" Способ и процессор для управления перемещением в полосе движения автономного транспортного средства
CN110866477A (zh) * 2019-11-06 2020-03-06 中国人民解放军战略支援部队信息工程大学 一种轨迹运动模式识别方法及装置
US11590969B1 (en) * 2019-12-04 2023-02-28 Zoox, Inc. Event detection based on vehicle data
FR3104516A1 (fr) * 2019-12-12 2021-06-18 Psa Automobiles Sa Procédé et système pour gérer un déplacement latéral d’un véhicule automobile dans une voie de circulation d’une chaussée
US11893457B2 (en) 2020-01-15 2024-02-06 International Business Machines Corporation Integrating simulated and real-world data to improve machine learning models
CN114787892A (zh) * 2020-02-27 2022-07-22 松下知识产权经营株式会社 控制系统以及控制方法
US11816901B2 (en) * 2020-03-04 2023-11-14 Nec Corporation Multi-agent trajectory prediction
DE102020108857A1 (de) * 2020-03-31 2021-09-30 Daimler Ag Verfahren zur Planung einer Soll-Trajektorie
US20210302981A1 (en) * 2020-03-31 2021-09-30 Gm Cruise Holdings Llc Proactive waypoints for accelerating autonomous vehicle testing
DE102020111953A1 (de) 2020-05-04 2021-11-04 Bayerische Motoren Werke Aktiengesellschaft Trajektorienplanungsmodul für automatisiertes fahren
US11634161B2 (en) * 2020-06-24 2023-04-25 Woven Planet North America, Inc. Path planning using delta cost volume generated from movement restrictions and observed driving behavior
DE102020207897A1 (de) 2020-06-25 2021-12-30 Robert Bosch Gesellschaft mit beschränkter Haftung Situationsangepasste Ansteuerung für Fahrassistenzsysteme und Systeme zum zumindest teilweise automatisierten Führen von Fahrzeugen
US20220034664A1 (en) * 2020-08-03 2022-02-03 Capital One Services, Llc Utilizing machine learning and a network of trust for crowd and traffic control and for mapping a geographical area
US11927967B2 (en) * 2020-08-31 2024-03-12 Woven By Toyota, U.S., Inc. Using machine learning models for generating human-like trajectories
US20220063666A1 (en) 2020-09-01 2022-03-03 Motional Ad Llc Scoring autonomous vehicle trajectories using reasonable crowd data
US11753041B2 (en) 2020-11-23 2023-09-12 Waymo Llc Predicting behaviors of road agents using intermediate intention signals
US11851081B2 (en) 2020-12-01 2023-12-26 Waymo Llc Predictability-based autonomous vehicle trajectory assessments
FR3117974A1 (fr) * 2020-12-21 2022-06-24 Psa Automobiles Sa Procédé et dispositif de contrôle d’un véhicule
FR3117979A1 (fr) * 2020-12-21 2022-06-24 Psa Automobiles Sa Procédé et dispositif de contrôle d’un véhicule autonome
WO2022246750A1 (zh) * 2021-05-27 2022-12-01 深圳市大疆创新科技有限公司 轨迹生成方法、装置、可移动平台及存储介质
CN114167860B (zh) * 2021-11-24 2023-07-07 东风商用车有限公司 一种自动驾驶最优轨迹生成方法及装置
WO2023148298A1 (en) * 2022-02-03 2023-08-10 Five AI Limited Trajectory generation for mobile agents
GB2616617A (en) * 2022-03-14 2023-09-20 Aptiv Tech Ltd Method and computer system for controlling the movement of a host vehicle

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106428009A (zh) * 2015-07-31 2017-02-22 福特全球技术公司 车辆轨迹确定
CN106767874A (zh) * 2015-11-19 2017-05-31 通用汽车环球科技运作有限责任公司 用于通过在车辆导航系统中的群体感知的燃料消耗预测和成本估计的方法及装置
CN107340772A (zh) * 2017-07-11 2017-11-10 清华大学 一种面向无人驾驶的拟人化参考轨迹规划方法
CN111373458A (zh) * 2017-11-07 2020-07-03 图森有限公司 用于自主车辆的轨迹规划的基于预测的系统和方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106428009A (zh) * 2015-07-31 2017-02-22 福特全球技术公司 车辆轨迹确定
CN106767874A (zh) * 2015-11-19 2017-05-31 通用汽车环球科技运作有限责任公司 用于通过在车辆导航系统中的群体感知的燃料消耗预测和成本估计的方法及装置
CN107340772A (zh) * 2017-07-11 2017-11-10 清华大学 一种面向无人驾驶的拟人化参考轨迹规划方法
CN111373458A (zh) * 2017-11-07 2020-07-03 图森有限公司 用于自主车辆的轨迹规划的基于预测的系统和方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114270142A (zh) * 2019-07-19 2022-04-01 祖克斯有限公司 非结构化的车辆路径规划器
US11875678B2 (en) 2019-07-19 2024-01-16 Zoox, Inc. Unstructured vehicle path planner
CN114270142B (zh) * 2019-07-19 2024-01-23 祖克斯有限公司 非结构化的车辆路径规划器
CN113552867A (zh) * 2020-04-20 2021-10-26 华为技术有限公司 一种运动轨迹的规划方法及轮式移动设备
CN112829769A (zh) * 2020-09-15 2021-05-25 百度(美国)有限责任公司 自动驾驶车辆的混合规划系统

Also Published As

Publication number Publication date
DE102018133576A1 (de) 2019-07-04
US20190204842A1 (en) 2019-07-04

Similar Documents

Publication Publication Date Title
CN109990794A (zh) 具有动态成本学习的自主驾驶轨迹规划器
US10503172B2 (en) Controlling an autonomous vehicle based on independent driving decisions
JP7391879B2 (ja) ドライブエンベロープの決定
CN109003441B (zh) 按照交通动态控制车辆的系统和方法
CN106338988B (zh) 自动驾驶车辆的控制装置
US11447129B2 (en) System and method for predicting the movement of pedestrians
CN109690657B (zh) 用于在车辆中操作智能教程的方法和装置
CN114222691A (zh) 基于成本的路径确定
US20190266516A1 (en) Adversarial learning of driving behavior
CN108931978A (zh) 车辆冰撞击预测
GB2548977A (en) Autonomous vehicle operation based on interactive model predictive control
CN110481555A (zh) 自主乘坐动力学舒适度控制器
CN106996793A (zh) 地图更新判定系统
US20220105959A1 (en) Methods and systems for predicting actions of an object by an autonomous vehicle to determine feasible paths through a conflicted area
JP7063043B2 (ja) 車両制御装置、および、決定方法
WO2019134110A1 (en) Autonomous driving methods and systems
JP2022517428A (ja) 車両制御
US11718290B2 (en) Methods and systems for safe out-of-lane driving
JP7173990B2 (ja) 追越確率コレクションを生成する方法、自動車の制御装置を動作させる方法、追越確率コレクション装置および制御装置
CN113619597A (zh) 自动驾驶车辆速度限制变更的规划系统
WO2023067879A1 (ja) 車両制御装置、車両制御方法、及び車両制御システム
US20230141801A1 (en) Systems and methods for maneuvering vehicles using predictive control and automated driving
JP7362899B2 (ja) 車両の走行支援方法及び走行支援装置
CN107784836A (zh) 用于提供所预测的车辆运动的方法和装置
US20240157973A1 (en) System and method for determining a trajectory for a vehicle

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20190709

WD01 Invention patent application deemed withdrawn after publication