具体实施方式
诸如自主车辆或半自主车辆之类的车辆可以穿越车辆交通运输网的一部分。所述车辆可包括一个或多个传感器,并且穿越所述车辆交通运输网可包括:传感器生成或捕获传感器数据,例如生成或捕获对应于车辆的操作环境或车辆的操作环境的一部分的数据。例如,传感器数据可以包括与一个或多个外部对象相对应的信息,所述一个或多个外部对象例如是行人、周边车辆、车辆操作环境内的其他对象、车辆交通运输网几何结构(车辆运输几何网络)或其组合。
自主车辆可包括自主车辆操作管理系统,所述自主车辆操作管理系统可以包括一个或多个操作环境监测器,所述操作环境监测器可以处理用于自主车辆的操作环境的信息,例如传感器数据。操作环境监测器可以包括堵塞监测器,所述堵塞监测器可以确定车辆交通运输网在时空上接近所述自主车辆的一些部分的可用性信息的概率。
自主车辆操作管理系统可以包括:自主车辆操作管理控制器、或执行器,所述自主车辆操作管理控制器、或执行器可以检测对应于外部对象的一个或多个操作情景,诸如行人情景、交叉路口情景、车道变更情景、或任何其他车辆操作情景或车辆操作情景的组合。
自主车辆操作管理系统可以包括一个或多个特定情景操作控制评估模块。每个特定情景操作控制评估模块可以是相应操作情景的模型,例如是部分可观察马尔可夫决策过程(Partially Observable Markov Decision Process,POMDP)模型。自主车辆操作管理控制器可以响应于对相应的操作场景进行检测而将特定情景操作控制评估模块的相应示例进行实例化。
自主车辆操作管理控制器可以接收来自相应的经实例化的特定情景操作控制评估模块示例的候选的车辆控制动作,可以从候选的车辆控制动作中识别车辆控制动作,并且可以根据经识别的车辆控制动作控制自主车辆以穿越车辆交通运输网的一部分。
虽然本文参考自主车辆进行了描述,但是本文描述的方法和设备可以在能够自主操作或半自动操作的任何车辆中实现。尽管参考车辆交通运输网进行了描述,但是本文描述的方法和设备可以包括在可通行车辆的任何区域中操作的自主车辆。
如本文所使用的,术语“计算机”或“计算装置”包括能够执行本文所公开的任何方法或所述任何方法的任何一个或多个部分的任何单元或多个单元的组合。
如本文所使用的,术语“处理器”指示一个或多个处理器,诸如一个或多个专用处理器、一个或多个数字信号处理器、一个或多个微处理器、一个或多个控制器、一个或多个微控制器、一个或多个应用处理器、一个或多个专用集成电路、一个或多个专用标准产品;一个或多个现场可编程门阵列、任何其他类型的集成电路或集成电路的组合、一个或多个状态机或它们的任意组合。
如本文所使用的,术语“存储器”指示任何计算机可用介质或计算机可读介质,或者可以有形地包含、存储、通信或传输可以由任何处理器使用或与任何处理器结合使用的任何信号或信息的装置。例如,存储器可以是一个或多个只读存储器(read onlymemories,ROM)、一个或多个随机存取存储器(random access memories,RAM)、一个或多个寄存器、低功率双倍数据速率(low power double data rate,LPDDR)存储器、一个或多个高速缓冲存储器、一个或多个半导体存储器装置、一个或多个磁介质、一个或多个光学介质、一个或多个磁光介质或它们的任意组合。
如本文所使用的,术语“指令”可以包括用于执行本文公开的任何方法或所述任何方法的任何一个或多个部分的指示或表达,并且可以以硬件、软件、或它们的任意组合来实现。例如,指令可以实现为存储在存储器中的诸如计算机程序之类的信息,所述信息可以由处理器实行以执行如本文所述的相应的方法、算法、方面中的任一者或其组合。在一些实施方式中,指令或指令的一部分可以实现为专用处理器或电路,所述专用处理器或电路可以包括用于实施本文所述的方法、算法、方面中的任一者或其组合的专用硬件。在一些实现方式中,指令中的一些部分可以分布于单个装置上的多个处理器、多个装置上的多个处理器上,所述多个处理器直接通信或跨诸如局域网、广域网、因特网或其组合之类的网络进行通信。
如本文所使用的,术语“示例”、“实施方式”、“实现方式”、“方面”、“特征”或“元素”指示用作示例、事例或说明。除非明确指出,否则任何示例、实施方式、实现方式、方面、特征或元素与各个其他示例、实施方式、实现方式、方面、特征或元素彼此独立,并且可以与任何其他示例、实施方式、实现方式、方面、特征或元素组合使用。
如本文所使用的,术语“确定”和“识别”或它们的任何变型包括选择、确认、计算、查找、接收、确定、建立、获得,或使用本文示出和描述的装置中的一个或多个装置以任何其他方式识别或确定。
如本文所使用的,术语“或”用于表示包含性的“或”而非排他性的“或”。即,除非另有说明或从上下文中清楚得知,否则“X包括A或B”旨在表示自然的包容性排列中的任何一种。也就是说,如果X包括A;X包括B;或者X包括A和B二者,则在任何一种前述情况下均满足“X包括A或B”。另外,除非另有说明或根据上下文清楚地指向单数形式,否则本申请和所附权利要求中使用的冠词“一”和“一种”通常应理解为表示“一个或多个”。
此外,为了简化说明,尽管本文中的附图和描述可以包括步骤或阶段的序列或系列,但是本文公开的方法的元素可以以各种顺序发生或同时发生。另外,本文公开的方法的元素可以与本文未明确呈现和描述的其他元素一起发生。此外,并非需要本文描述的方法的所有元素来实现根据本公开的方法。虽然本文以特定组合描述了各个方面、特征和元素,但是每个方面、特征、或元素都可以独立使用或者与其他方面、特征和元素以各种组合使用或不与其他方面、特征和元素以各种组合使用。
图1是车辆的示例的图,其中可以实现本文公开的各个方面、特征和元素。在一些实施方式中,车辆1000包括底盘1100、动力系1200、控制器1300、车轮1400或任意其他元件,或者车辆的多个元件的组合。尽管为了简单起见,车辆1000示出为包括四个车轮1400,但是也可以使用任何其他一个或多个推进装置,诸如推进器或行走装置。在图1中,线路互连单元,诸如动力系1200、控制器1300和车轮1400,指示可以在各个相应单元之间传递诸如数据或控制信号之类的信息、诸如电力或扭矩之类的动力,或者传递信息和动力两者。例如,控制器1300可以从动力系1200接收动力,并且与动力系1200、车轮1400或这两者通信以控制车辆1000,所述控制可以包括加速、减速、转向或以其他方式控制车辆1000。
动力系1200包括动力源1210、变速器1220、转向单元1230、致动器1240或任意其他元件,或者动力系的诸如悬架、驱动轴、车轴或排气系统之类的多个元件的组合。尽管单独地示出,但是车轮1400可以被包括在动力系1200中。
动力源1210包括发动机、电池或其组合。动力源1210可以是可操作成提供诸如电能、热能或动能之类的能量的任何装置或多个装置的组合。例如,动力源1210包括发动机,诸如内燃机、电马达、或内燃机和电马达的组合,并且可操作以向车轮1400中的一个或多个车轮提供作为动力的动能。在一些实施方式中,动力源1210包括势能单元,诸如一个或多个干电池,例如镍镉(NiCd)电池、镍锌(NiZn)电池、镍金属氢化物(NiMH)电池、锂离子(Li离子)电池;太阳能电池;燃料电池或能够提供能量的任何其他装置。
变速器1220从动力源1210接收诸如动能之类的能量,并将所述能量传递到车轮1400以提供动力。变速器1220可以由控制器1300、致动器1240或这两者控制。转向单元1230可以由控制器1300、致动器1240或两者控制,并且所述转向单元控制车轮1400以使车辆转向。致动器1240可以从控制器1300接收信号,并且可以致动或控制动力源1210、变速器1220、转向单元1230或它们的任意组合以对车辆1000进行操作。
在一些实施方式中,控制器1300包括定位单元1310、电子通信单元1320、处理器1330、存储器1340、用户接口1350、传感器1360、电子通信接口1370或它们的任意组合。尽管示出为单个单元,但是控制器1300的任何一个或多个单元都可以集成到任意数量的单独的物理单元中。例如,用户接口1350和处理器1330可以集成在第一物理单元中,存储器1340可以集成在第二物理单元中。尽管未在图1中示出,但是控制器1300可以包括动力源,例如电池。尽管示出为单独单元,但是定位单元1310、电子通信单元1320、处理器1330、存储器1340、用户接口1350、传感器1360、电子通信接口1370或它们的任意组合都可以集成在一个或多个电子单元、电路或芯片中。
在一些实施方式中,处理器1330包括能够操纵或处理现有信号或之后生成的信号或其他信息的任何装置或多个装置的组合,所述处理器1330包括光学处理器、量子处理器、分子处理器或其组合。例如,处理器1330可以包括一个或多个专用处理器、一个或多个数字信号处理器、一个或多个微处理器、一个或多个控制器、一个或多个微控制器、一个或多个集成电路、一个或多个专用集成电路、一个或多个现场可编程门阵列、一个或多个可编程逻辑阵列、一个或多个可编程逻辑控制器、一个或多个状态机,或它们的任意组合。处理器1330可以与定位单元1310、存储器1340、电子通信接口1370、电子通信单元1320、用户接口1350、传感器1360、动力系1200或它们的任意组合以可操作的方式耦合。例如,处理器可以经由通信总线1380与存储器1340以可操作的方式耦合。
存储器1340可以包括能够例如包含、存储、通信或传输机器可读指令或与机器可读指令相关联的任何信息的任何有形的非暂时性计算机可用或计算机可读介质,以供处理器1330使用或与处理器1330结合使用。存储器1340可以是例如一个或多个固态驱动器、一个或多个存储器卡、一个或多个可移动介质、一个或多个只读存储器、一个或多个随机存取存储器、一种或多种盘,包括硬盘、软盘、光盘、磁卡或光卡,或适用于存储电子信息的任何类型的非暂时性介质,或它们的任意组合。
如图所示,电子通信接口1370可以是无线天线、有线通信端口、光通信端口,或能够与有线或无线电子通信介质1500交互的任何其他有线或无线单元。虽然图1示出了通过单个通信链路进行通信的电子通信接口1370,通信接口可以被配置为经由多个通信链路进行通信。虽然图1示出了单个电子通信接口1370,但是车辆可以包括任意数量的通信接口。
电子通信单元1320可以配置为经由有线或无线电子通信介质1500(诸如经由通信接口1370)发送或接收信号。尽管未在图1中明确示出,但是电子通信单元1320配置用于经由诸如射频(radio frequency,RF)、紫外线(ultraviolet,UV)、可见光、光纤、线路或其组合之类的任何有线或无线通信介质来发送、接收或者既发送也接收。虽然图1示出了单个电子通信单元1320和单个电子通信接口1370,但是可以使用任意数量的电子通信单元和任意数量的电子通信接口。在一些实施方式中,电子通信单元1320可包括专用短程通信(dedicated short range communications,DSRC)单元、车载单元(on-board unit,OBU)或其组合。
定位单元1310可以确定车辆1000的地理位置信息,诸如经度、纬度、海拔、行驶方向或速度。例如,定位单元可以包括全球定位系统(global positioning system,GPS)单元,诸如启用美国国家海洋电子协会(National Marine-Electronics Association,NMEA)的广域扩充系统(Wide Area Augmentation System,WAAS)单元、无线电三角测量单元或其组合。定位单元1310可用于获得表示例如车辆1000的当前朝向、车辆1000的二维或三维的当前位置、车辆1000的当前角度定向或其组合的信息。
用户接口1350可以包括能够与人交互的任何单元,诸如虚拟键盘或物理键盘、触摸板、显示器、触摸显示器、平视显示器、虚拟显示器、增强现实显示器、触觉显示器、诸如眼动跟踪装置之类的特征跟踪装置、扬声器、麦克风、摄像机、传感器、打印机或它们的任意组合。如图所示,用户接口1350可以与处理器1330可操作地耦合,或者与控制器1300的任何其他单元可操作地耦合。尽管示出为单个单元,但是用户接口1350可以包括一个或多个物理单元。例如,用户接口1350可以包括用于与人进行音频通信的音频接口,以及用于与人进行基于视觉和基于触觉通信的触摸显示器。在一些实施方式中,用户接口1350可以包括多个显示器,例如多个物理上分离的单元、单个物理单元内的多个被限定的部分,或其组合。
传感器1360可包括一个或多个传感器,例如传感器阵列,所述一个或多个传感器是可操作的以提供可用于控制车辆的信息。传感器1360可以提供关于车辆的当前操作特性的信息。传感器1360可包括例如速度传感器、加速度传感器、转向角传感器、牵引相关传感器、制动相关传感器、方向盘位置传感器、眼动跟踪传感器、就座位置传感器或任何传感器或多种传感器的组合,传感器是可操作的以报告关于车辆1000的当前动态情况的某些方面的信息。
在一些实施方式中,传感器1360可包括可操作的以获得关于车辆1000周围的物理环境的信息的传感器。例如,一个或多个传感器可以检测道路几何结构和障碍物,诸如固定障碍物、车辆以及行人之类。在一些实施方式中,传感器1360可以是或可以包括现在已知的或以后开发的一个或多个摄像机、激光传感系统、红外传感系统、声学传感系统或任何其他合适类型的车载环境感测装置或多种装置的组合。在一些实施方式中,可以将传感器1360和定位单元1310进行组合。
虽然未单独示出,但是在一些实施方式中,车辆1000可包括轨迹控制器。例如,控制器1300可以包括轨迹控制器。轨迹控制器是可操作的以获得描述车辆1000的当前状态的信息和获得为车辆1000规划的路线,并且基于该信息来确定并优化车辆1000的轨迹。在一些实施方式中,轨迹控制器可以输出可操作的以控制车辆1000的信号,使得车辆1000遵循由所述轨迹控制器确定的轨迹。例如,轨迹控制器的输出可以是经优化的轨迹,所述经优化的轨迹可以被提供给动力系1200、车轮1400或这两者。在一些实施方式中,经优化的轨迹可以是控制输入,诸如一组转向角,其中每个转向角与时间点或位置相对应。在一些实施方式中,经优化的轨迹可以是一个或多个路径、线、曲线或其组合。
车轮1400中的一个或多个车轮可以是转向轮、推进轮或转向和推进的轮,所述转向轮在转向单元1230的控制下枢转到一定的转向角;所述推进轮在变速器1220的控制下被扭转以推进所述车辆1000;所述转向和推进的轮可以对车辆1000进行转向和推进。
尽管未在图1中示出,但是车辆可包括图1中未示出的单元或元件,诸如外壳、
模块、调频(frequency modulated,FM)无线电单元、近场通信(Near FieldCommunication,NFC)模块、液晶显示器(liquid crystal display,LCD)显示单元、有机发光二极管(organic light-emitting diode,OLED)显示器单元、扬声器或它们的任意组合。
在一些实施方式中,车辆1000可以是自主车辆(自动驾驶的车辆)。可以在没有直接人为干预的情况下对自主车辆进行自主地控制以穿越车辆交通运输网的一部分。尽管未在图1中单独示出,但在一些实施方式中,自主车辆可包括自主车辆控制单元,所述自主车辆控制单元可执行自主车辆的路线规划、通行和控制。在一些实施方式中,自主车辆控制单元可以与车辆的其他单元集成在一起。例如,控制器1300可以包括自主车辆控制单元。
在一些实施方式中,自主车辆控制单元可以根据当前车辆操作参数控制或操作所述车辆1000,以穿越车辆交通运输网的一部分。在另一示例中,自主车辆控制单元可以控制或操作所述车辆1000,以执行限定的操作或操纵,例如停车。在另一示例中,基于车辆信息、环境信息、表示车辆交通运输网的车辆交通运输网信息或者其组合,自主车辆控制单元可以生成从起点(诸如车辆1000的当前位置)到终点的行驶路线,并且自主车辆控制单元可以根据路线来控制或操作所述车辆1000,以穿越车辆交通运输网。例如,自主车辆控制单元可以将行驶路线输出到轨迹控制器,所述轨迹控制器可以使用生成的路线来操作车辆1000从起点行驶到终点。
图2是车辆运输和通信系统的一部分的示例的图,其中可以实现本文公开的方面、特征和元素。车辆运输和通信系统2000可以包括一个或多个车辆2100/2110(诸如图1中所示的车辆1000之类),所述一个或多个车辆2100/2110可以行驶经过一个或多个车辆交通运输网2200的一个或多个部分,并且可以经由一个或多个电子通信网络2300进行通信。尽管未在图2中明确示出,但是车辆可以穿越未明确被包括在或未完全包括在车辆交通运输网中的区域,例如越野区域(非公路区域)。
在一些实施方式中,电子通信网络2300可以例如是多址系统,并且可以在车辆2100/2110和一个或多个通信装置2400之间提供通信,诸如语音通信、数据通信、视频通信、消息通信或其组合。例如,车辆2100/2110可以经由所述网络2300从通信装置2400接收信息,例如表示车辆交通运输网2200的信息。
在一些实施方式中,车辆2100/2110可以经由有线通信链路(未示出)、无线通信链路2310/2320/2370或任意数量的有线或无线通信链路的组合进行通信。例如,如所示出的,车辆2100/2110可以经由地面无线通信链路2310、经由非地面无线通信链路2320或经由所述地面无线通信链路和非地面无线通信链路的组合进行通信。在一些实现方式中,地面无线通信链路2310可以包括以太网链路、串行链路、蓝牙链路、红外(infrared,IR)链路、紫外(UV)链路或能够提供电子通信的任何链路。
在一些实施方式中,车辆2100/2110可以与其他车辆2100/2110通信。例如,主车辆或主体车辆(HV)2100可以从周边车辆或目标车辆(RV)2110,经由直接通信链路2370或经由网络2300接收一个或多个自动化的车辆间消息,诸如基本安全消息(basic safetymessage,BSM)。例如,周边车辆2110可以将该消息广播到限定的广播范围(例如300米)内的主车辆。在一些实施方式中,主车辆2100可以经由诸如信号复示器(未示出)或其他周边车辆(未示出)之类的第三方接收消息。在一些实施方式中,车辆2100/2110基于例如限定的间隔(例如100毫秒)周期性地发送一个或多个自动化的车辆间消息。
自动化的车辆间消息可包括车辆识别信息;地理空间状态信息,诸如经度、纬度或海拔信息、地理空间位置精度信息;运动状态信息,诸如车辆加速度信息、偏航速率信息、速度信息、车辆朝向信息、制动系统状态信息、油门调节信息、方向盘角度信息;或车辆路线信息;或车辆操作状态信息,诸如车辆大小信息、前灯状态信息、转向信号信息、雨刷状态数据、变速器信息或与正在变速的车辆状态相关的任何其他信息或这些信息的组合。例如,变速器状态信息可以指示正在变速的车辆的变速器是处于空档状态、停车状态、继续行进向前状态还是倒车状态。
在一些实施方式中,车辆2100经由接入点2330与通信网络2300进行通信。可以包括计算装置的接入点2330可以配置为经由有线或无线通信链路2310/2340与车辆2100、与通信网络2300、与一个或多个通信装置2400或与其组合进行通信。例如,接入点2330是基站、基站收发信台(base transceiver station,BTS)、Node B、演进型Node B(eNodeB)、Home Node-B(Hnode B)、无线路由器、有线路由器、集线器、中继器、交换机或任何类似的有线或无线装置。尽管显示为单个单元,但是接入点可以包括任意数量的互连单元。
在一些实施方式中,车辆2100可以经由卫星2350或其他非地面通信装置与通信网络2300通信。可以包括计算装置的卫星2350可以配置为经由一个或多个通信链路2320/2360与车辆2100、与通信网络2300、与一个或多个通信装置2400或与其组合进行通信。尽管显示为单个单元,但是卫星可包括任意数量的互连单元。
电子通信网络2300可以是被配置为提供语音、数据或任何其他类型的电子通信的任何类型的网络。例如,电子通信网络2300包括局域网(local area network,LAN)、广域网(wide area network,WAN)、虚拟专用网(virtual private network,VPN)、移动或蜂窝电话网、因特网或任何其他电子通信系统。电子通信网络2300可以使用通信协议,诸如传输控制协议(transmission control protocol,TCP)、用户数据报协议(user datagramprotocol,UDP)、互联网协议(internet protocol,IP)、实时传输协议(real-timetransport protocol,RTP)、超文本传输协议(HyperText Transport Protocol,HTTP)或其组合。尽管示出为单个单元,但是电子通信网络可以包括任意数量的互连单元。
在一些实施方式中,车辆2100可以识别车辆交通运输网2200的一部分或状况。例如,所述车辆可包括一个或多个车载传感器2105(诸如图1中所示的传感器1360),所述车载传感器2105可以包括速度传感器、轮速传感器、摄像机、陀螺仪、光学传感器、激光传感器、雷达传感器、声波传感器,或能够确定或识别车辆交通运输网2200的一部分或状况的任何其他传感器或装置,或上述其组合。
在一些实施方式中,车辆2100可以使用经由电子通信网络2300通信的信息来穿越一个或多个车辆交通运输网2200的一个或多个部分,所述信息例如是表示车辆交通运输网2200的信息、由一个或多个车载传感器2105识别的信息,或上述信息的组合。
尽管为简单起见,图2示出了一个车辆2100、一个车辆交通运输网2200、一个电子通信网络2300和一个通信装置2400,但是可以使用任意数量的车辆、网络或计算装置。在一些实施方式中,车辆运输和通信系统2000可以包括图2中未示出的装置、单元或元件。尽管所述车辆2100被示出为单个单元,但是车辆可包括任意数量的互连单元。
尽管示出车辆2100经由所述电子通信网络2300与通信装置2400进行通信,但是车辆2100可以经由任意数量的直接或间接通信链路与通信装置2400进行通信。例如,车辆2100可以经由诸如蓝牙通信链路之类的直接通信链路与通信装置2400进行通信。
在一些实施方式中,车辆2100/2210可以与诸如车辆的驾驶员、操作员或所有者之类的实体2500/2510相关联。在一些实施方式中,与车辆2100/2110相关联的实体2500/2510可以与诸如智能手机2502/2512或计算机2504/2514之类的一个或多个个人电子装置2502/2504/2512/2514相关联。在一些实施方式中,个人电子装置2502/2504/2512/2514可以经由直接或间接通信链路与对应的车辆2100/2110进行通信。尽管在图2中示出了一个实体2500/2510与一个车辆2100/2110相关联,但是任意数量的车辆可以与实体相关联,以及任意数量的实体可以与车辆相关联。
图3是根据本公开的车辆交通运输网的一部分的图。车辆交通运输网3000可包括:一个或多个不可通行区域3100,例如建筑物;一个或多个部分可通行区域,例如停车区域3200;一个或多个可通行区域,例如道路3300/3400;或者上述区域的组合。在一些实施方式中,诸如图1中所示的车辆1000、图2中所示的车辆2100/2110中的一者之类的自主车辆;半自主车辆或实现自主驾驶的任何其他车辆可以穿越车辆交通运输网3000的一个或多个部分。
车辆交通运输网可以包括在一个或多个可通行区域或部分可通行区域3200/3300/3400之间的一个或多个互通区域3210。例如,图3中所示的车辆交通运输网的一部分包括在停车区域3200和道路3400之间的互通区域3210。在一些实施方式中,停车区域3200可包括停车场3220。
车辆交通运输网的一部分,例如道路3300/3400,可以包括一个或多个车道3320/3340/3360/3420/3440,并且可以与由在图3中的箭头指示的一个或多个行驶方向相关联。
在一些实施方式中,车辆交通运输网或该车辆交通运输网的一部分,例如图3中所示的车辆交通运输网的一部分,可以用车辆交通运输网信息来表示。例如,车辆交通运输网信息可以表达为可以存储在数据库或文件中的例如标记语言元素之类的元素的层次结构。为简单起见,本文的附图将表示车辆交通运输网的部分的车辆交通运输网信息描绘为图或地图;然而,车辆交通运输网信息可以以能够表示车辆交通运输网或该车辆交通运输网的一部分的任何计算机可用形式来表达。在一些实施方式中,车辆交通运输网信息可以包括车辆交通运输网控制信息(例如行驶方向信息)、速度限制信息、收费信息、等级信息(例如倾斜或角度信息)、表面材料信息、美学信息,或上述信息的组合。
在一些实施方式中,车辆交通运输网的一部分或组合的多个部分可以被识别为关注点或终点。例如,车辆交通运输网信息可以将建筑物,例如不可通行区域3100以及相邻的部分可通行的停车区域3200识别为关注点,自主车辆可以将所述关注点识别为终点,并且该自主车辆可以通过穿越车辆交通运输网从起点行驶到终点。尽管与不可通行区域3100相关联的停车区域3200在图3中被示出为与不可通行区域3100相邻,但是终点可以包括例如建筑物和与该建筑物在物理上或地理上不相邻的停车区域。
在一些实施方式中,识别终点可以包括识别所述终点的位置,所述位置可以是离散的独一无二的可识别的地理位置。例如,车辆交通运输网可以包括用于终点的所限定的位置,诸如街道地址、邮政地址、车辆交通运输网地址、GPS地址,或上述地址的组合。
在一些实施方式中,终点可以与一个或多个入口相关联,所述入口例如是图3中所示的入口3500。在一些实施方式中,车辆交通运输网信息可以包括所限定的入口位置信息,例如识别与终点相关联的入口的地理位置的信息。在一些实施方式中,可以如本文所述的那样,对预测的入口位置信息进行确定。
在一些实施方式中,车辆交通运输网可以与行人运输网络相关联,或者可以包括行人运输网络。例如,图3包括行人运输网络的一部分3600,其可以是人行道。在一些实施方式中,行人运输网络或行人运输网络的一部分,例如图3中所示的行人运输网络的所述部分3600,可以用行人运输网络信息来表示。在一些实施方式中,车辆交通运输网信息可包括行人运输网络信息。行人运输网络可包括行人可通行区域。诸如人行道或行人通道之类的行人可通行区域可以与车辆交通运输网的不可通行区域相对应。尽管未在图3中单独示出,但是诸如人行横道之类的行人可通行区域可以与车辆交通运输网的可通行区域或部分可通行区域相对应。
在一些实施方式中,终点可以与一个或多个停靠位置相关联,所述停靠位置例如是图3中所示的停靠位置3700。停靠位置3700可以是接近终点的指定位置或区域或未指定的位置或区域,在该停靠位置处,自主车辆可以停车、暂停或停泊,使得可以执行诸如装载乘客或卸载乘客之类的停靠操作。
在一些实施方式中,车辆交通运输网信息可包括停靠位置信息,诸如识别与终点相关联的一个或多个停靠位置3700的地理位置的信息。在一些实施方式中,停靠位置信息可以是被限定的停靠位置信息,其可以是人为地包括在所述车辆交通运输网信息中的停靠位置信息。例如,可以基于用户输入,将被限定的停靠位置信息包括在车辆交通运输网信息中。在一些实施方式中,如本文所述,停靠位置信息可以是自动生成的停靠位置信息。尽管未在图3中单独示出,停靠位置信息可以识别与停靠位置3700相关联的停靠操作的类型。例如,终点可以与用于装载乘客的第一停靠位置和用于卸载乘客的第二停靠位置相关联。尽管自主车辆可以停车在停靠位置处,但是与终点相关联的停靠位置可以是独立的并且不同于与所述终点相关联的停车区域。
在示例中,自主车辆可以将关注点识别为终点,所述关注点可以包括不可通行区域3100、停车区域3200和入口3500。自主车辆可以将作为关注点的不可通行区域3100或入口3500识别为第一终点,以及可以将停车区域3200识别为第二终点。自主车辆可将停靠位置3700识别为针对所述第一终点的停靠位置。自主车辆可以生成从起点(未示出)到停靠位置3700的路线。自主车辆可使用所述路线从起点穿越所述车辆交通运输网到停靠位置3700。自主车辆可以停车或停泊在所述停靠位置3700处,使得可以执行装载乘客或卸载乘客。自主车辆可以生成从停靠位置3700到停车区域3200的后续路线,可以使用所述后续路线从所述停靠位置3700穿越所述车辆交通运输网到停车区域3200,并且可停泊在所述停车区域3200中。
图4是根据本公开的实施方式的自主车辆操作管理系统4000的示例的图。所述自主车辆操作管理系统4000可以在以下车辆中实现:自主车辆,诸如图1中所示的车辆1000、图2中所示的车辆2100/2110中的一者、半自主车辆或实现自主驾驶的任何其他车辆。
自主车辆可以穿越车辆交通运输网或车辆交通运输网的一部分,其可以包括穿越多个独特的车辆操作情景。所述自主车辆的独特的车辆操作情景可以包括任何可明显识别的操作状况的集合,所述操作状况可以影响自主车辆在限定的时空区域或操作环境中的操作。例如,独特的车辆操作情景可以基于自主车辆在限定的时空距离内可以穿越的道路、道路段或车道的数量或基数。在另一示例中,所述自主车辆的独特的车辆操作情景可以基于一个或多个交通控制装置,所述交通控制装置可以影响自主车辆在限定的时空区域或操作环境中的操作。在另一示例中,所述自主车辆的独特的车辆操作情景可以基于一个或多个可识别的规则、条例或法则,所述规则、条例或法则可以影响自主车辆在限定的时空区域或操作环境内的操作。在另一示例中,所述自主车辆的独特的车辆操作情景可以基于一个或多个可识别的外部对象,所述可识别的外部对象可以影响自主车辆在限定的时空区域或操作环境内的操作。
独特的车辆操作情景的示例包括:一种独特的车辆操作情景,其中自主车辆正在穿越交叉路口;一种独特的车辆操作情景,其中行人正在穿越或接近所述自主车辆的预期路径;以及一种独特的车辆操作情景,其中所述自主车辆正在变更车道。
为了简单和清楚起见,本文参考车辆操作情景的类型或类别来描述相似的车辆操作情景。例如,包括行人的车辆操作情景在本文中可被称为行人情景,所述行人情景涉及包括行人的车辆操作情景的类型或类别。作为示例,第一行人车辆操作情景可以包括行人在人行横道处穿越道路,第二行人车辆操作情景可以包括行人乱穿马路的穿越道路。虽然本文描述了行人车辆操作情景、交叉路口车辆操作情景和车道变更车辆操作情景,但是可以使用任何其他车辆操作情景或车辆操作情景类型。
自主车辆的操作环境的各个方面可以表示在相应的独特的车辆操作情景中。例如,外部对象的相对的取向、轨迹、预期路径可以表示在相应的独特的车辆操作情景中。在另一示例中,车辆交通运输网的相对几何结构可以被表示在相应的独特的车辆操作情景中。
作为示例,第一独特的车辆操作情景可以对应于行人正在人行横道处穿越道路,并且在所述第一独特的车辆操作情景中可以表示行人的相对的取向和预期路径,例如从右到左的穿越相对于从左到右的穿越。第二独特的车辆操作情景可以对应于行人正在乱穿马路的穿越道路,并且在所述第二独特的车辆操作情景中可以表示行人的相对的取向和预期路径,例如从右到左的穿越相对于从左到右的穿越。
在一些实施方式中,自主车辆可以在一操作环境内穿越多个独特的车辆操作情景,这可以是复合的车辆操作情景的多个方面。例如,行人可以接近用于自主车辆穿越交叉路口的预期路径。
自主车辆操作管理系统4000可以操作或控制所述自主车辆在经受限定的约束状况下穿越所述独特的车辆操作情景,所述限定的约束例如是安全约束、法律约束、物理约束、用户可接受性约束、或可以为自主车辆的操作进行限定或从中导出的任何其他约束,或上述约束的组合。
在一些实施方式中,控制所述自主车辆以穿越所述独特的车辆操作情景可以包括:识别或检测所述独特的车辆操作情景;基于所述独特的车辆操作情景来识别候选的车辆控制动作;根据所述候选的车辆控制动作中的一个或多个候选的车辆控制动作来控制所述自主车辆穿越车辆交通运输网的一部分;或其组合。
车辆控制动作可以指示可与穿越车辆交通运输网的一部分相结合的由所述自主车辆来执行的车辆控制操作或操纵,诸如加速、减速、转弯、停止或任何其他车辆操作、或者多个车辆操作的组合。
根据车辆控制动作,自主车辆操作管理控制器4100或自主车辆的其他单元可以控制所述自主车辆穿越车辆交通运输网或车辆交通运输网的一部分。
例如,自主车辆操作管理控制器4100可以根据通过停止所述自主车辆或以其他方式将所述自主车辆控制成是静止的或保持静止状态的“停止”车辆控制动作,来控制所述自主车辆穿越车辆交通运输网或车辆交通运输网的一部分。
在另一示例中,自主车辆操作管理控制器4100可以根据通过缓慢地向前移动短距离(例如数英寸或一英尺)的“前进”车辆控制动作,来控制所述自主车辆穿越车辆交通运输网或车辆交通运输网的一部分。
在另一示例中,自主车辆操作管理控制器4100可以根据通过以限定的加速率加速或者以限定范围内的加速率加速的“加速”车辆控制动作,来控制所述自主车辆穿越车辆交通运输网或车辆交通运输网的一部分。
在另一示例中,自主车辆操作管理控制器4100可以根据通过以限定的减速率减速或者以限定范围内的减速率减速的“减速”车辆控制动作,来控制所述自主车辆穿越车辆交通运输网或车辆交通运输网的一部分。
在另一示例中,根据通过根据当前操作参数(诸如通过维持当前速度、维持当前路径或路线、维持当前车道取向等)控制所述自主车辆穿越车辆交通运输网或车辆交通运输网的一部分的“维持”车辆控制动作,自主车辆操作管理控制器4100可以控制所述自主车辆穿越车辆交通运输网或车辆交通运输网的一部分。
在另一示例中,根据通过开始或恢复先前识别的一组操作参数(所述先前识别的一组操作参数可以包括根据一个或多个其他车辆控制动作来控制自主车辆穿越车辆交通运输网或车辆交通运输网的一部分)控制所述自主车辆穿越车辆交通运输网或车辆交通运输网的一部分的“继续行进”车辆控制动作,自主车辆操作管理控制器4100可以控制所述自主车辆穿越车辆交通运输网或车辆交通运输网的一部分。例如,自主车辆可以在交叉路口处静止,用于自主车辆的经识别的路线可以包括穿越通过所述交叉路口,根据“继续行进”车辆控制动作来控制所述自主车辆可以包括:控制沿所识别的路径的所述自主车辆以限定的加速率加速到限定的速度。在另一示例中,自主车辆可以以限定的速度穿越所述车辆交通运输网的一部分,可以为自主车辆识别车道变更,根据“继续行进”车辆控制动作来控制所述自主车辆可以包括:控制所述自主车辆根据限定的车道变更参数来执行一系列的轨迹调整,使得所述自主车辆执行所识别的车道变更操作。
在一些实施方式中,车辆控制动作可以包括一个或多个性能标准。例如,“停止”车辆控制动作可以包括作为性能标准的减速率。在另一示例中,“继续行进”车辆控制动作可以明确地将路线或路径信息、速度信息、加速率或其组合指示为性能标准,或者所述“继续行进”车辆控制动作可以明确地或隐含地指示:可以维持当前的或先前识别的路径、速度、加速率或其组合。
在一些实施方式中,车辆控制动作可以是复合的车辆控制动作,其可以包括一系列的车辆控制动作、组合的车辆控制动作或这两者。例如,“前进”车辆控制动作可以指示“停止”车辆控制动作、与限定的加速率相关联的后续“加速”车辆控制动作、以及与限定的减速率相关联的后续“停止”车辆控制动作,因此,根据“前进”车辆控制动作来控制自主车辆包括:控制自主车辆缓慢向前移动短距离,例如数英寸或一英尺。
在一些实施方式中,自主车辆操作管理系统4000可包括自主车辆操作管理控制器4100、堵塞监测器4200、操作环境监测器4300、特定情景操作控制评估模块4400,或上述组合。尽管被分开描述,但是所述堵塞监测器4200可以是操作环境监测器4300的一个或多个示例。
自主车辆操作管理控制器4100可以接收、识别或以其他方式访问表示自主车辆的操作环境的操作环境信息,所述自主车辆的操作环境诸如当前操作环境或预期的操作环境或其一个或多个方面。所述自主车辆的操作环境可以包括可明显识别的一组操作状况,所述操作状况可以影响自主车辆在所限定的时空区域内的自主车辆的操作。
例如,操作环境信息可以包括用于自主车辆的车辆信息,诸如指示自主车辆的地理空间位置的信息、将自主车辆的地理空间位置与表示车辆交通运输网的信息相关联的信息、自主车辆的路线、自主车辆的速度、自主车辆的加速状态、自主车辆的乘客信息、或关于自主车辆或所述自主车辆的操作的任何其他信息。
在另一示例中,操作环境信息可以包括:表示接近所述自主车辆的车辆交通运输网的信息,例如距所述自主车辆不超出限定的空间距离(例如300米)的车辆交通运输网的信息;指示车辆交通运输网的一个或多个方面的几何结构的信息;指示车辆交通运输网的诸如表面状况之类的状况的信息,或上述信息的任意组合。
在另一示例中,操作环境信息可以包括:表示自主车辆的操作环境内的外部对象的信息,诸如表示行人、非人类的动物、非机动的运输装置(例如自行车或滑板)、机动运输装置(例如周边车辆)或任何其他可能影响所述自主车辆的操作的外部对象或实体的信息。
在一些实施方式中,自主车辆操作管理控制器4100可以监测所述自主车辆的操作环境或其限定的方面。在一些实施方式中,监测所述自主车辆的操作环境可以包括:识别和跟踪外部对象、识别独特的车辆操作情景,或其组合。
例如,自主车辆操作管理控制器4100可以利用自主车辆的操作环境来识别和跟踪外部对象。识别和跟踪外部对象可以包括:识别相应外部对象(相对于自主车辆)的时空位置、识别针对相应外部对象的一个或多个预期路径,这可以包括识别外部对象的速度、轨迹或该两者。为了简单和清楚起见,本文对位置、预期位置、路径、预期路径等的描述可以省略明确指示出对应位置和路径涉及的地理空间分量和时间分量;然而,除非本文明确指出,或者以其他方式从上下文中明确地清楚,否则本文描述的位置、预期位置、路径、预期路径等可包括地理空间分量、时间分量或这两者。
在一些实施方式中,操作环境监测器4300可以包括用于监测行人的操作环境监测器4310(行人监测器)、用于监测交叉路口的操作环境监测器4320(交叉路口监测器)、用于监测车道变更的操作环境监测器4330(车道变更监测器),或上述监测器的组合。使用虚线示出操作环境监测器4340指示出:自主车辆操作管理系统4000可包括任意数量的操作环境监测器4300。
可以由相应的操作环境监测器4300监测一个或多个独特的车辆操作情景。例如,行人监测器4310可以监测与多个行人车辆操作情景相对应的操作环境信息,交叉路口监测器4320可以监测与多个交叉路口车辆操作情景相对应的操作环境信息,以及车道变更监测器4330可以监测与多个车道变更车辆操作情景相对应的操作环境信息。
操作环境监测器4300可以接收或以其他方式访问以下操作环境信息,诸如由自主车辆的一个或多个传感器生成或捕获的操作环境信息、车辆交通运输网信息、车辆交通运输网几何结构信息,或上述信息的组合。例如,用于监测行人的操作环境监测器4310可以接收或以其他方式访问诸如传感器信息之类的信息,该信息可以指示自主车辆的操作环境中的一个或多个行人、与自主车辆的操作环境中的一个或多个行人相对应、或以其他方式与自主车辆的操作环境中的一个或多个行人相关联。
在一些实施方式中,操作环境监测器4300可以将所述操作环境信息或操作环境信息的一部分与操作环境或操作环境的一方面相关联,诸如与外部对象(诸如行人、周边车辆)或车辆交通运输网几何结构的方面相关联。
在一些实施方式中,操作环境监测器4300可以生成或以其他方式识别表示所述操作环境的一个或多个方面的信息,诸如具有外部对象(诸如行人、周边车辆)的信息或车辆交通运输网几何结构的方面的信息,其可以包括过滤所述操作环境信息、将所述操作环境信息抽象化或以其他方式处理所述操作环境信息。
在一些实施方式中,操作环境监测器4300可以将表示所述操作环境的一个或多个方面的信息输出到自主车辆操作管理控制器4100、或者由所述自主车辆操作管理控制器4100访问表示所述操作环境的一个或多个方面的信息,如此将表示所述操作环境的一个或多个方面的信息存储在可以由所述自主车辆操作管理控制器4100访问的自主车辆的存取器(例如图1中所示的存储器1340)中、将表示所述操作环境的一个或多个方面的信息发送到所述自主车辆操作管理控制器4100,或上述组合。在一些实施方式中,操作环境监测器4300可以将表示所述操作环境的一个或多个方面的信息输出到自主车辆操作管理系统4000的一个或多个单元,例如堵塞监测器4200。
例如,用于监测行人的操作环境监测器4310可以联系、关联或以其他方式处理所述操作环境信息,从而识别、跟踪或预测一个或多个行人的动作。例如,用于监测行人的操作环境监测器4310可以接收以下信息:来自于一个或多个传感器的信息,例如传感器信息,所述传感器信息可以对应于一个或多个行人;用于监测行人的操作环境监测器4310可以将所述传感器信息与一个或多个经识别的行人相关联,这可以包括识别相应的经识别的行人中的一个或多个行人的行驶方向、路径(例如预期路径)、当前速度或预期速度、当前加速率或预期加速率,或其组合;并且用于监测行人的操作环境监测器4310可以将经识别的、经关联的或生成的行人信息输出到所述自主车辆操作管理控制器4100、或者由所述自主车辆操作管理控制器4100访问所述经识别的、经关联的或生成的行人信息。
在另一示例中,用于监测交叉路口的操作环境监测器4320可以联系、关联或以其他方式处理所述操作环境信息,以识别、跟踪或预测所述自主车辆的操作环境中的一个或多个周边车辆的动作、以识别在所述自主车辆的操作环境中的交叉路口或其方面、以识别车辆交通运输网几何结构,或上述组合。例如,用于监测交叉路口的操作环境监测器4310可以接收以下信息:来自于一个或多个传感器的信息,例如传感器信息,所述传感器信息可以对应于自主车辆的操作环境中的一个或多个周边车辆、自主车辆的操作环境中的交叉路口或者其一个或多个方面、车辆交通运输网几何结构或上述组合;用于监测交叉路口的操作环境监测器4310可以将所述传感器信息与自主车辆的操作环境中的一个或多个经识别的周边车辆、自主车辆的操作环境中的交叉路口或者交叉路口的一个或多个方面、车辆交通运输网几何结构或上述组合相关联,这可以包括可以识别相应的经识别的周边车辆的一个或多个周边车辆的当前的或预期的行驶方向、路径(例如预期路径)、当前的或预期的速度、当前的或预期的加速率或其组合;并且用于监测交叉路口的操作环境监测器4320可以将经识别的、经关联的或生成的交叉路口信息输出到所述自主车辆操作管理控制器4100、或者由所述自主车辆操作管理控制器4100访问经识别的、经关联的或生成的交叉路口信息。
在另一示例中,用于监测车道变更的操作环境监测器4330可以联系、关联或以其他方式处理所述操作环境信息,以识别、跟踪或预测所述自主车辆的操作环境中的一个或多个周边车辆的动作,例如指示沿着自主车辆的预期路径的慢速的或静止的周边车辆的信息,以识别所述自主车辆的操作环境的一个或多个方面,例如自主车辆的操作环境中的车辆交通运输网几何结构、或者在地理空间上对应于当前的或预期的车道变更操作的上述组合。例如,用于监测车道变更的操作环境监测器4330可以接收以下信息:来自于一个或多个传感器的信息,例如传感器信息,所述传感器信息可以对应于自主车辆的操作环境中的一个或多个周边车辆、自主车辆的操作环境中的自主车辆的操作环境的一个或多个方面、或者在地理空间上对应于当前的或预期的车道变更操作的上述组合;用于监测车道变更的操作环境监测器4330可以将传感器信息与自主车辆的操作环境中的一个或多个经识别的周边车辆、自主车辆的操作环境的一个或多个方面、或者地理空间上对应于当前的或预期的车道变更操作的上述组合相关联,这可以包括可以识别相应的经识别的周边车辆的一个或多个周边车辆的当前的或预期的行驶方向、路径(例如预期路径)、当前的或预期的速度、当前的或预期的加速率或其组合;并且用于监测车道变更的操作环境监测器4330可以将经识别的、经关联的或生成的车道变更信息输出到所述自主车辆操作管理控制器4100、或者由所述自主车辆操作管理控制器4100访问所述经识别的、经关联的或生成的车道变更信息。
自主车辆操作管理控制器4100可以基于由操作环境信息表示的操作环境的一个或多个方面来识别一个或多个独特的车辆操作情景。例如,自主车辆操作管理控制器4100可以响应于识别由操作环境监测器4300中的一个或多个操作环境监测器指示的操作环境信息、或基于由操作环境监测器4300中的一个或多个操作环境监测器指示的操作环境信息,来识别独特的车辆操作情景。
在一些实施方式中,自主车辆操作管理控制器4100可以基于由操作环境信息表示的操作环境中的一个或多个方面来识别多个独特的车辆操作情景。例如,操作环境信息可以包括表示沿着自主车辆的预期路径接近交叉路口的行人的信息;并且自主车辆操作管理控制器4100可以识别行人车辆操作情景、交叉路口车辆操作情景或它们两者。
自主车辆操作管理控制器4100可以基于由操作环境信息表示的操作环境的一个或多个方面来实例化所述特定情景操作控制评估模块4400的一个或多个特定情景操作控制评估模块的相应示例。例如,自主车辆操作管理控制器4100可以响应于识别所述独特的车辆操作情景来实例化所述特定情景操作控制评估模块4400的示例。
在一些实施方式中,自主车辆操作管理控制器4100可以基于由操作环境信息表示的操作环境的一个或多个方面来实例化一个或多个特定情景操作控制评估模块4400的多个示例。例如,操作环境信息可以指示在自主车辆的操作环境中的两个行人,并且自主车辆操作管理控制器4100可以基于由操作环境信息表示的操作环境的一个或多个方面来针对每个行人实例化行人特定情景操作控制评估模块4410的相应示例。
在一些实施方式中,对应于诸如行人情景、交叉路口情景或车道变更情景之类的情景的经识别的外部对象(诸如行人或周边车辆)的基数、数量或计数可超出限定的阈值,所述限定的阈值可以是限定的特定情景的阈值,并且自主车辆操作管理控制器4100可以省略对与经识别的外部对象中的一个或多个外部对象相对应的特定情景操作控制评估模块4400的示例的实例化。
例如,由操作环境监测器4300指示的操作环境信息可以指示在自主车辆的操作环境中的二十五个行人;用于行人情景的限定的阈值可以是行人的限定基数,例如十;自主车辆操作管理控制器4100可以识别十个最相关的行人,例如地理空间上最接近所述自主车辆的十个行人,所述十个行人具有与所述自主车辆会聚的预期路径;自主车辆操作管理控制器4100可以针对十个最相关的行人实例化所述行人特定情景操作控制评估模块4410的十个示例;并且自主车辆操作管理控制器4100可以省略实例化针对其他十五个行人的所述行人特定情景操作控制评估模块4410的示例。
在另一示例中,由操作环境监测器4300指示的操作环境信息可指示包括四个道路段(诸如北行道路段、南行道路段、东行道路段和西行道路段)的交叉路口,并指示对应于北行道路段的五个周边车辆、对应于南行道路段的三个周边车辆、对应于东行道路段的四个周边车辆、以及对应于西行道路段的两个周边车辆;用于所述交叉路口情景的限定的阈值可以是每个道路段的的周边车辆的限定基数,例如二;自主车辆操作管理控制器4100可以识别每个道路段的两个最相关的周边车辆,例如地理空间上最接近所述交叉路口的两个周边车辆,在每个道路段上的所述两个周边车辆与所述自主车辆具有会聚的预期路径;自主车辆操作管理控制器4100可以对以下示例进行实例化:针对与北行道路段相对应的两个最相关的周边车辆的交叉路口特定情景操作控制评估模块4420的两个示例、针对与南行道路段相对应的两个最相关的周边车辆的交叉路口特定情景操作控制评估模块4420的两个示例、针对与东行道路段相对应的两个最相关的周边车辆的交叉路口特定情景操作控制评估模块4420的两个示例,针对与西行道路段相对应的两个最相关的周边车辆的交叉路口特定情景操作控制评估模块4420的两个示例;并且自主车辆操作管理控制器4100可以省略实例化以下交叉路口特定情景操作控制评估模块4420的示例:与北行道路段相对应的其他三个周边车辆、与南行道路段相对应的另一周边车辆、以及与东行道路段相对应的其他两个周边车辆。可替代地或额外地,用于交叉路口情景的限定的阈值可以是每个交叉路口的的周边车辆的限定基数,例如八个;并且自主车辆操作管理控制器4100可以识别与交叉路口最相关的八个周边车辆,例如在地理空间上最接近所述交叉路口的八个周边车辆,所述八个周边车辆与所述自主车辆具有会聚的预期路径;自主车辆操作管理控制器4100可以针对八个最相关的周边车辆来实例化交叉路口特定情景操作控制评估模块4420的八个示例;并且自主车辆操作管理控制器4100可以省略实例化针对其他六个周边车辆的交叉路口特定情景操作控制评估模块4420的示例。
在一些实施方式中,自主车辆操作管理控制器4100可以将操作环境信息或操作环境信息的一个或多个方面发送到自主车辆的其他单元,例如堵塞监测器4200或特定情景操作控制评估模块4400的一个或多个示例。
在一些实施方式中,自主车辆操作管理控制器4100可以将所述操作环境信息或操作环境信息的一个或多个方面诸如存储在所述自主车辆的存储器如图1中所示的存储器1340中。
自主车辆操作管理控制器4100可以接收来自特定情景操作控制评估模块4400的相应示例的候选的车辆控制动作。例如,来自第一特定情景操作控制评估模块4400的第一示例的候选的车辆控制动作可以指示“停止”车辆控制动作,来自第二特定情景操作控制评估模块4400的第二示例的候选的车辆控制动作可以指示“前进”车辆控制动作,以及来自第三特定情景操作控制评估模块4400的第三示例的候选的车辆控制动作可以指示“继续行进”车辆控制动作。
自主车辆操作管理控制器4100可以根据一个或多个候选的车辆控制动作来确定是否穿越所述车辆交通运输网的一部分。例如,自主车辆操作管理控制器4100可以接收来自特定情景操作控制评估模块4400的多个示例的多个候选的车辆控制动作,可以从所述候选的车辆控制动作中识别车辆控制动作,并且可以根据所述车辆控制动作来穿越所述车辆交通运输网。
在一些实施方式中,自主车辆操作管理控制器4100可以基于一个或多个限定的车辆控制动作识别标准而从所述候选的车辆控制动作中识别车辆控制动作。
在一些实施方式中,所述限定的车辆控制动作识别标准可以包括与每种类型的车辆控制动作相关联的优先级、权重或等级,并且从候选的车辆控制动作中识别车辆控制动作可以包括从所述候选的车辆控制动作中识别最高优先级的车辆控制动作。例如,“停止”车辆控制动作可以与高优先级相关联,“前进”车辆控制动作可以与低于高优先级的中间优先级相关联,以及“继续行进”车辆控制动作可以与低于中间优先级的低优先级相关联。在一示例中,候选的车辆控制动作可以包括一个或多个“停止”车辆控制动作,并且所述“停止”车辆控制动作可以被识别为车辆控制动作。在另一示例中,候选的车辆控制动作可以省略“停止”车辆控制动作,可以包括一个或多个“前进”车辆控制动作,并且所述“前进”车辆控制动作可以被识别为车辆控制动作。在另一示例中,候选的车辆控制动作可以省略“停止”车辆控制动作,可以省略“前进”车辆控制动作,可以包括一个或多个“继续行进”车辆控制动作,并且所述“继续行进”车辆控制动作可以被识别为车辆控制动作。
在一些实施方式中,从候选的车辆控制动作中识别车辆控制动作可以包括:基于限定的车辆控制动作识别标准、实例化的情景、与所述实例化的情景相关联的权重、候选的车辆控制动作、与所述候选的车辆控制动作相关联的权重或上述组合,生成或计算每种类型的车辆控制动作的加权平均值。
例如,从候选的车辆控制动作中识别车辆控制动作可以包括:实施机器学习组件,例如分类问题的监督学习,以及使用相应车辆操作情景的多个示例(例如1000个示例)训练所述机器学习组件。在另一示例中,从候选的车辆控制动作中识别车辆控制动作可以包括:实施可以描述相应的候选的车辆控制动作如何影响后续的候选的车辆控制动作的影响的马尔可夫决策过程或部分可观察马尔可夫决策过程,并且可以包括为相应的车辆控制动作输出正面奖励或负面奖励的奖励函数。
自主车辆操作管理控制器4100可以不将特定情景操作控制评估模块4400的示例进行实例化。例如,自主车辆操作管理控制器4100可以将一组独特的操作状况识别为指示用于自主车辆的独特的车辆操作情景,为独特的车辆操作情景实例化特定情景操作控制评估模块4400的示例,监测操作状况,随后确定所述操作状况中的一个或多个操作状况已经过期或者有可能影响低于限定的阈值的自主车辆的操作;并且自主车辆操作管理控制器4100可以不将特定情景操作控制评估模块4400的示例进行实例化。
堵塞监测器4200可以接收表示自主车辆的操作环境或自主车辆的操作环境的方面的操作环境信息。例如,堵塞监测器4200可以从自主车辆操作管理控制器4100、自主车辆的传感器、外部装置(例如周边车辆或基础设施装置)或其组合接收操作环境信息。在一些实施方式中,堵塞监测器4200可以从诸如自主车辆的存储器之类的存储器(例如图1中所示的存储器1340)读取操作环境信息或操作环境信息的一部分。
尽管未在图4中明确示出,自主车辆操作管理系统4000可以包括预测器模块,所述预测器模块可以生成预测信息并将预测信息发送到所述堵塞监测器4200,并且堵塞监测器4200可以将可用性信息的概率输出到所述操作环境监测器4300中的一个或多个操作环境监测器。
堵塞监测器4200可以确定车辆交通运输网的一个或多个部分的可用性的相应概率或对应的堵塞概率,所述车辆交通运输网的一个或多个部分例如是接近所述自主车辆的车辆交通运输网的部分,所述车辆交通运输网的部分可以包括对应于所述自主车辆的预期路径(例如基于自主车辆的当前路线而识别的预期路径)的车辆交通运输网的部分。
可用性的概率或对应的堵塞概率可以指示所述自主车辆可以安全地穿越所述车辆交通运输网的一部分或所述车辆交通运输网内空间位置的概率或可能性,例如不受外部对象(例如周边车辆或行人)的阻碍。例如,车辆交通运输网的一部分可以包括障碍物,例如静止物体,并且对于车辆交通运输网的该部分的可用性的概率是低的,例如0%,这可以表示为对于车辆交通运输网的该部分具有高的堵塞概率,例如100%。
堵塞监测器4200可以识别所述自主车辆的操作环境内(例如300米以内)的车辆交通运输网的多个部分中的每个部分的相应的可用性的概率。
在一些实施方式中,堵塞监测器4200可以基于用于自主车辆的操作信息、用于一个或多个外部对象的操作信息、表示车辆交通运输网的车辆交通运输网信息或上述组合,来识别所述车辆交通运输网的一部分和对应的可用性的概率。在一些实施方式中,用于自主车辆的操作信息可以包括指示自主车辆在车辆交通运输网中的地理空间位置的信息,所述地理空间位置可以是当前位置或预期位置,例如基于自主车辆的预期路径而识别的预期位置。在一些实施方式中,外部对象的操作信息可以指示所述车辆交通运输网中的或接近所述车辆交通运输网的一个或多个外部对象的相应的地理空间位置,所述地理空间位置可以是当前位置或预期位置,例如基于相应外部对象的预期路径而识别的预期位置。
在一些实施方式中,可用性的概率可以由与自主车辆的操作环境中的每个外部对象相对应的堵塞监测器4200来指示,并且地理空间区域可以与对应于多个外部对象的多个可用性的概率相关联。在一些实施方式中,可用性的总概率(诸如针对行人的可用性的概率和针对周边车辆的可用性的概率)可由对应于自主车辆的操作环境中的每种类型的外部对象的堵塞监测器4200来指示,并且地理空间区域可以与对应于多个外部对象类型的多个可用性的概率相关联。在一些实施方式中,堵塞监测器4200可以为每个地理空间位置指示一个可用性的总概率,所述可用性的总概率可以包括针对地理空间位置的多个可用性的时间概率。
在一些实施方式中,堵塞监测器4200可以:识别外部对像;跟踪外部对象;将外部对象的位置信息、路径信息或上述两者进行投射(规划);或者上述组合。例如,堵塞监测器4200可以识别外部对象并且可以识别外部对象的预期路径,所述堵塞监测器4200可以指示一系列的预期的空间位置、预期的时间位置和对应的概率。
在一些实施方式中,堵塞监测器可以基于操作环境信息来识别外部对象的预期路径,所述操作环境信息例如是指示外部对象的当前位置的信息、指示外部对象的当前轨迹的信息、指示外部对象的分类类型的信息(例如将外部对象分类为行人或周边车辆的信息)、车辆交通运输网信息(例如指示车辆交通运输网包括接近所述外部对象的人行横道的信息)、与外部对象相关联的先前识别的或跟踪的信息,或上述信息的任意组合。例如,可以将外部对象识别为周边车辆,并且可以基于指示所述周边车辆的当前位置的信息、指示周边车辆的当前轨迹的信息、指示周边车辆的当前速度的信息、对应于周边车辆的车辆交通运输网信息、法律或监管信息或上述信息的组合,来识别所述周边车辆的预期路径。
在一些实施方式中,堵塞监测器4200可以连续地或周期性地对可用性的概率进行确定或更新。在一些实施方式中,可以将一个或多个类别或类型的外部对象识别为优先堵塞,并且优先堵塞的外部对象的预期路径可以在空间上和时间上与另一优先堵塞的外部对象的预期路径相重叠。例如,行人的预期路径可能与另一行人的预期路径相重叠。在一些实施方式中,一个或多个类别或类型的外部对象可以被识别为延迟堵塞,并且延迟堵塞的外部对象的预期路径可以被其他外部对象堵塞,例如受到其他外部对象的阻碍或以其他方式受到影响。例如,周边车辆的预期路径可能被另一周边车辆或行人所堵塞。
在一些实施方式中,堵塞监测器4200可以识别优先堵塞的外部对象(例如行人)的预期路径,并且可以识别延迟堵塞的外部对象(例如周边车辆)的预期路径,延迟堵塞的外部对象的预期路径受到优先堵塞的外部对象的预期路径的制约。在一些实施方式中,堵塞监测器4200可以将可用性的概率或对应的堵塞概率传送至自主车辆操作管理控制器4100。自主车辆操作管理控制器4100可以将所述可用性的概率或对应的堵塞概率传送到特定情景操作控制评估模块4400的相应的实例化的示例。
每个特定情景操作控制评估模块4400可以对相应的独特的车辆操作情景建模。自主车辆操作管理系统4000可包括任意数量的特定情景操作控制评估模块4400,每个特定情景操作控制评估模块对相应的独特的车辆操作情景建模。
在一些实施方式中,通过特定情景操作控制评估模块4400对独特的车辆操作情景建模可以包括:生成、维护或者生成并维护表示与所述独特的车辆操作情景相对应的自主车辆的操作环境的各个方面的状态信息;识别对应状态相关的多个经建模的各方面之间的潜在相互作用;以及对解析该模型的候选的车辆控制动作进行确定。在一些实施方式中,可以从所述模型中省略除了与独特的车辆操作情景相对应的自主车辆的操作环境的限定的一组方面之外的自主车辆的操作环境的方面。
自主车辆操作管理系统4000可以是独立的解析方案并且可以包括独特的车辆操作情景的任何模型,诸如单代理模型、多代理模型、学习模型、或者一个或多个独特的车辆操作情景中的任何其他模型。
所述特定情景操作控制评估模块4400中的一个或多个可以是经典计划(Classical Planning,CP)模型,所述经典计划模型可以是单代理模型,并且可以基于限定的输入状态对独特的车辆操作情景进行建模,所述限定的输入状态可以指示由特定情景操作控制评估模块4400建模的独特的车辆操作情景的自主车辆的操作环境的元素的相应的非概率性状态。在经典计划模型中,与时间位置相关联的建模元素(例如外部对象)的一个或多个方面(例如地理空间位置)可以与另一时间位置(例如紧接的后续的时间位置)相关联的对应方面在非概率性的方面相差例如限定量或固定量。例如,在第一时间位置处,周边车辆可以具有第一地理空间位置,在紧接的后续的第二时间位置处,周边车辆可以具有第二地理空间位置,所述第二地理空间位置与第一地理空间位置沿着周边车辆的预期路径相差限定的地理空间距离,例如有限的米数。
特定情景操作控制评估模块4400中的一个或多个可以是离散的时间随机控制过程,例如马尔可夫决策过程(Markov Decision Process,MDP)模型,其可以是单代理模型,并且可以基于限定的输入状态对独特的车辆操作情景进行建模。可以将对自主车辆的操作环境的变化(例如,外部对象的位置的变化)建模为概率变化。马尔可夫决策过程模型可以比经典计划(CP)模型利用更多的处理资源并且可以更准确地对独特的车辆操作情景进行建模。
马尔可夫决策过程模型可以将独特的车辆操作情景建模为具有对应状态(例如当前状态、预期的未来状态或它们两者)的一系列的时间位置(诸如当前时间位置、未来时间位置或它们两者)。在每个时间位置处,所述模型可以具有可以是预期状态并且可以与一个或多个候选的车辆控制动作相关联的状态。该模型可以将自主车辆表示为一种代理,所述代理根据针对当前状态的经识别的动作和所述经识别的动作将状态从当前状态转换到后续状态的概率,沿着一系列的时间位置从一个状态(当前状态)转换到另一状态(后续状态)。
该模型可以产生奖励,所述奖励可以是正值或负值,根据相应的动作,对应于从一个状态转换到另一个状态。该模型可以通过识别与所述一系列的时间位置中的将累积奖励最大化的每个状态相对应的动作来解析所述独特的车辆操作情景。对模型的解析可以包括:响应于经建模的情景和所述操作环境信息,对车辆控制动作进行识别。
马尔可夫决策过程模型可以使用状态的集合、动作的集合、状态转换概率的集合、奖励函数或其组合来对独特的车辆操作情景建模。在一些实施方式中,对独特的车辆操作情景建模可以包括使用折扣因子,所述折扣因子可以对应用于后续时间段的奖励函数的输出进行调整或折扣。
所述状态的集合可以包括马尔可夫决策过程模型的当前状态、马尔可夫决策过程模型的一个或多个可能的后续状态,或上述状态的组合。状态可以表示可能在概率上影响自主车辆在离散的时间位置处的操作的自主车辆的操作环境的相应的限定的方面(例如外部对象和交通控制装置)的经识别的状况(其可以是预期状况)。例如,在自主车辆附近操作的周边车辆可以影响自主车辆的操作并且可以表示在马尔可夫决策过程模型中,所述马尔可夫决策过程模型可以包括表示对应于所考虑的时间位置的:周边车辆的经识别的或预期的地理空间位置;周边车辆的经识别的或预期的路径、周边车辆的经识别的或预期的朝向或它们两者;周边车辆的经识别的或预期的速度;周边车辆的经识别的或预期的加速率或减速率;或上述组合。在实例化时,马尔可夫决策过程模型的当前状态可以对应于操作环境的同期状态或状况。可以为每个独特的车辆操作情景限定相应的状态的集合。
尽管可以使用任意数量或基数的状态,但是在一模型中包括的状态的数量或基数可以限于限定的最大数量的状态,例如300个状态。例如,模型可以包括用于对应情景的300个最可能的状态。
所述动作的集合可以包括在所述状态的集合中的每个状态下对于马尔可夫决策过程模型可用的车辆控制动作。可以为每个独特的车辆操作情景限定相应的动作的集合。
所述状态转换概率的集合可以概率性地表示:响应于动作,对于自主车辆的(如由所述状态所表示的)操作环境的潜在或预期的变化。例如,状态转换概率可以指示以下概率:响应于自主车辆根据相应的动作从当前状态穿越所述车辆交通运输网,自主车辆的操作环境对应于紧接在与当前状态相对应的当前时间位置之后的相应时间位置处的相应状态的概率。
可以基于操作环境信息来识别所述状态转换概率的集合。例如,操作环境信息可以指示区域类型(例如城市或乡村)、一天中的时间、环境光水平、天气状况、交通状况(所述交通状况可以包括预期的交通状况,例如高峰时间状况、事故相关的交通拥堵)或假日相关的驾驶员行为状况、道路状况、管辖状况(例如国家、州或市状况)、或可能影响自主车辆的操作的任何其他状况或多个状况的组合。
与行人车辆操作情景相关联的状态转换概率的示例可以包括:以行人与相应道路段之间的地理空间距离为基础的行人乱穿马路的限定概率;行人在交叉路口停止的限定概率;行人穿越人行横道的限定概率;行人在人行横道上对自主车辆让行的限定概率;与行人车辆操作情景相关联的任何其他概率。
与交叉路口车辆操作情景相关联的状态转换概率的示例可以包括:周边车辆到达交叉路口的限定概率;周边车辆拦截自主车辆的限定概率;在紧接着穿越交叉路口的第二周边车辆之后并且非常接近该第二周边车辆的周边车辆例如在没有通行权的情况下(借道)穿越该交叉路口的限定概率;在穿越交叉路口之前,根据交通控制装置、规则或其他通行权指示,周边车辆在该交叉路口附近停止的限定概率;周边车辆穿越交叉路口的限定概率;周边车辆偏离交叉路口附近的预期路径的限定概率;周边车辆偏离预期的通行权优先权的限定概率;与交叉路口车辆操作情景相关联的任何其他概率。
与车道变更车辆操作情景相关联的状态转换概率的示例可以包括:周边车辆改变速度的限定概率,诸如所述自主车辆后面的周边车辆增加速度的限定概率或所述自主车辆前方的周边车辆减小速度的限定概率;所述自主车辆前方的周边车辆变更车道的限定概率;所述自主车辆附近的周边车辆改变速度以允许所述自主车辆进行并道的限定概率;或与车道变更车辆操作情景相关联的任何其他概率。
奖励函数可以确定可以对于状态和动作的每个组合累积的相应的正值或负(耗)值,所述相应的正值或负(耗)值可以表示自主车辆从根据对应的车辆控制动作的对应状态穿越所述车辆交通运输网到后续状态的预期值。
可以基于操作环境信息来识别所述奖励函数。例如,操作环境信息可以指示区域类型(例如城市或乡村)、一天中的时间、环境光水平、天气状况、交通状况(所述交通状况可以包括预期的交通状况,例如高峰时间状况、事故相关的交通拥堵)或假日相关的驾驶员行为状况、道路状况、管辖状况(例如国家、州或市状况)、或可能影响自主车辆的操作的任何其他状况或多个状况的组合。
所述特定情景操作控制评估模块4400中的一个或多个可以是部分可观察马尔可夫决策过程(POMDP)模型,其可以是单代理模型。除了部分可观察马尔可夫决策过程模型可以包括对不确定性状态的建模之外,部分可观察马尔可夫决策过程模型可以类似于马尔可夫决策过程模型。部分可观察马尔可夫决策过程模型可以包括对置信度、传感器可信度、干扰度、噪声、不确定性(例如传感器不确定性)等进行建模。部分可观察马尔可夫决策过程模型可以比马尔可夫决策过程模型利用更多的处理资源并且可以更准确地对独特的车辆操作情景进行建模。
部分可观察马尔可夫决策过程模型可以使用状态的集合、动作的集合、状态转换概率的集合、奖励函数、观察的集合、条件性观察概率的集合或上述组合来对独特的车辆操作情景进行建模。所述状态的集合、动作的集合、状态转换概率的集合和奖励函数可以类似于以上对马尔可夫决策过程模型所描述的那些。
所述观察的集合可以包括对应于相应状态的观察。观察可以提供关于相应状态的属性的信息。观察可以与相应的时间位置相对应。观察可以包括操作环境信息,例如传感器信息。观察可包括预期的或预测的操作环境信息。
例如,部分可观察马尔可夫决策过程模型可以包括在对应于第一状态的第一地理空间位置和第一时间位置处的自主车辆;该模型可以指示自主车辆可以识别并执行或尝试执行车辆控制动作,以从第一地理空间位置开始穿越所述车辆交通运输网而穿越到在紧接着第一时间位置之后的第二时间位置处的第二地理空间位置;并且对应于第二时间位置的所述观察的集合可以包括被识别的对应于第二时间位置的操作环境信息,诸如对于自主车辆的地理空间位置信息、对于一个或多个外部对象的地理空间位置信息、可用性的概率、预期路径信息等等。
所述条件性观察概率的集合可以包括基于自主车辆的操作环境进行相应观察的概率。例如,自主车辆可以通过穿越第一道路来接近一交叉路口,同时周边车辆可以通过穿越第二道路来接近该交叉路口,所述自主车辆可以识别和评估对应于该交叉路口的操作环境信息(例如传感器信息),所述操作环境信息可能包括对应于所述周边车辆的操作环境信息。在一些实施方式中,操作环境信息可能是不准确的、不完整的或错误的。在马尔可夫决策过程模型中,自主车辆可非概率性地识别周边车辆,这可以包括识别周边车辆的位置、周边车辆的预期路径等;以及经识别的信息(例如基于不准确的操作环境信息而识别出的周边车辆的位置)可能是不准确的或错误的。在部分可观察马尔可夫决策过程模型中,自主车辆可识别概率性地识别周边车辆的信息,这可以包括概率性地识别周边车辆的位置信息,诸如指示周边车辆可能接近所述交叉路口的位置信息。对应于观察或概率性地识别周边车辆的位置的条件性观察概率可以表示所识别的操作环境信息准确地表示周边车辆的位置的概率。
可以基于操作环境信息识别所述条件性观察概率的集合。例如,操作环境信息可以指示区域类型(例如城市或乡村)、一天中的时间、环境光水平、天气状况、交通状况(所述交通状况可以包括预期的交通状况,例如高峰时间状况、事故相关的交通拥堵)或假日相关的驾驶员行为状况、道路状况、管辖状况(例如国家、州或市状况)、或可能影响自主车辆的操作的任何其他状况或多个状况的组合。
在一些实施方式如实施部分可观察马尔可夫决策过程模型的实施方式中,对自主车辆操作控制情景建模可以包括对障碍物建模。例如,操作环境信息可以包括对应于自主车辆的操作环境中的一个或多个障碍物(诸如传感器障碍物)的信息,使得所述操作环境信息可以省略表示自主车辆的操作环境中的一个或多个成障碍的外部对象的信息。例如,障碍物可以是外部对象,诸如交通标志、建筑物、树、经识别的外部对象,或能够在限定的时空位置处相对于所述自主车辆阻挡一个或多个其他操作状况(例如外部对象)的任何其他操作状况或多个操作状况的组合。在一些实施方式中,操作环境监测器4300可以识别障碍物,可以识别或确定外部对象被所识别的障碍物阻挡或隐藏的概率,并且可以包括所述操作环境信息中的成障碍的车辆概率信息,以输出到自主车辆操作管理控制器4100,并且由所述自主车辆操作管理控制器4100传送到相应的特定情景操作控制评估模块4400。
在一些实施方式中,所述特定情景操作控制评估模块4400中的一个或多个可以是分布式部分可观察马尔可夫决策过程(Dec-POMDP)模型,其可以是多代理模型,并且可以对独特的车辆操作情景进行建模。分布式部分可观察马尔可夫决策过程模型可以类似于部分可观察马尔可夫决策过程模型,除了部分可观察马尔可夫决策过程模型可以对自主车辆和外部对象的子集(例如一个外部对象)进行建模之外,分布式部分可观察马尔可夫决策过程模型可以对自主车辆和外部对象的集合进行建模。
在一些实施方式中,特定情景操作控制评估模块4400中的一个或多个可以是部分可观察随机博弈(Partially Observable Stochastic Game,POSG)模型,其可以是多代理模型,并且可以对独特的车辆操作情景进行建模。部分可观察随机博弈模型可以类似于分布式部分可观察马尔可夫决策过程,除了分布式部分可观察马尔可夫决策过程模型可以包括用于自主车辆的奖励函数之外,部分可观察随机博弈模型可以包括用于自主车辆的奖励函数和用于各个外部对象的相应的奖励函数。
在一些实施方式中,特定情景操作控制评估模块4400中的一个或多个可以是强化学习(Reinforcement Learning,RL)模型,其可以是学习模型并且可以对独特的车辆操作情景进行建模。强化学习模型可以类似于马尔可夫决策过程模型或部分可观察马尔可夫决策过程模型,除了可以从该模型中省略限定的状态转换概率、观察概率、奖励函数或它们的任意组合。
在一些实施方式中,强化学习模型可以是基于模型的强化学习模型,其可以包括基于一个或多个被建模的或被观察的事件生成状态转换概率、观察概率、奖励函数或其任意组合。
在强化学习模型中,该模型可以评估一个或多个事件或交叉路口,所述事件可以是模拟的事件,诸如穿越交叉路口、穿越行人附近的车辆交通运输网或者变更车道,并且可以响应于相应的事件而生成或修改对应的模型或对应的模型的解。例如,自主车辆可以使用强化学习模型来穿越交叉路口。强化学习模型可以指示用于穿越所述交叉路口的候选的车辆控制动作。自主车辆可以使用作为针对一时间位置的车辆控制动作的候选的车辆控制动作来穿越所述交叉路口。自主车辆可以使用所述候选的车辆控制动作来确定穿越交叉路口的结果,并且可以基于所述结果来更新所述模型。
在一示例中,在第一时间位置处,周边车辆可以在具有禁止的通行权指示(例如红灯)的交叉路口处静止,强化学习模型可以为所述第一时间位置指示候选的“继续行进”车辆控制动作,强化学习模型可以包括对在根据所识别的候选的车辆控制动作穿越所述车辆交通运输网之后的后续时间位置处的操作环境信息进行识别的概率,指示对应于第一时间位置的周边车辆的地理空间位置不同于对应于第二时间位置的周边车辆的地理空间位置的概率是低的,例如0/100。自主车辆可以根据所识别的候选的车辆控制动作穿越所述车辆交通运输网;随后可以确定对应于第一时间位置的周边车辆的地理空间位置不同于对应于第二时间位置的周边车辆的地理空间位置;并且可以相应地结合所识别的事件将所述概率修改或更新,例如修改或更新至1/101。
在另一示例中,强化学习模型可以根据所识别的车辆控制动作并且根据所识别的操作环境信息对于从第一时间位置穿越所述车辆交通运输网到第二时间位置,来指示限定的正面的预期奖励,这可以是概率性的。自主车辆可以根据所识别的车辆控制动作穿越所述车辆交通运输网。自主车辆可基于后续识别的操作环境信息(其可以是概率性的)来确定:对应于第二时间位置的操作环境信息基本上类似于对应于第一时间位置的所识别的操作环境信息,这可以指示根据所识别的车辆控制动作穿越车辆交通运输网的成本,例如时间成本;并且强化学习模型可以减少相应的预期奖励。
自主车辆操作管理系统4000可包括任意数量的模型或组合类型的模型的组合。例如,行人特定情景操作控制评估模块4410、交叉路口特定情景操作控制评估模块4420和车道变更特定情景操作控制评估模块4430可以是部分可观察马尔可夫决策过程模型。在另一示例中,行人特定情景操作控制评估模块4410可以是马尔可夫决策过程模型,交叉路口特定情景操作控制评估模块4420和车道变更特定情景操作控制评估模块4430可以是部分可观察马尔可夫决策过程模型。
自主车辆操作管理控制器4100可以基于所述操作环境信息来实例化特定情景操作控制评估模块4400的任意数量的示例。
例如,操作环境信息可以包括表示行人沿着自主车辆的预期路径接近交叉路口的信息;并且自主车辆操作管理控制器4100可以识别行人车辆操作情景、交叉路口车辆操作情景或上述两者。自主车辆操作管理控制器4100可以实例化行人特定情景操作控制评估模块4410的示例、交叉路口特定情景操作控制评估模块4420的示例或上述两者。
在另一示例中,操作环境信息可包括表示沿着自主车辆的预期路径在一交叉路口处或附近有多于一个行人的信息。自主车辆操作管理控制器4100可以识别与一个或多个行人相对应的行人操作情景、交叉路口车辆操作情景或其组合。自主车辆操作管理控制器4100可以对针对所述行人操作情景中的一些或所有的行人特定情景操作控制评估模块4410的示例、交叉路口特定情景操作控制评估模块4420的示例或其组合进行实例化。
行人特定情景操作控制评估模块4410可以是自主车辆操作控制情景的模型,所述模型包括自主车辆穿越于行人附近的车辆交通运输网的一部分(行人情景)。行人特定情景操作控制评估模块4410可以接收来自于自主车辆操作管理控制器4100的操作环境信息,诸如通过用于监测行人的操作环境监测器4310生成的行人信息。
行人特定情景操作控制评估模块4410可以对行人行为进行建模,所述行人行为对应于穿越车辆交通运输网的一部分或者以其他方式概率性地影响自主车辆的操作的行人。在一些实施方式中,行人特定情景操作控制评估模块4410可以根据表达可能的行人行为的行人模型规则对行人进行建模。例如,行人模型规则可以表示车辆交通运输网规则、行人运输网络规则、预测的行人行为、社会规范或其组合。例如,行人模型规则可以指示行人可以经由人行横道或其他限定的行人可访问区域来穿越车辆交通运输网的一部分的概率。在一些实施方式中,行人特定情景操作控制评估模块4410可以将行人建模为独立于限定的车辆交通运输网规则、行人运输网络规则或它们两者,例如乱穿马路。
行人特定情景操作控制评估模块4410可以输出候选的车辆控制动作,诸如候选的“停止”车辆控制动作、候选的“前进”车辆控制动作或候选的“继续行进”车辆控制动作。在一些实施方式中,候选的车辆控制动作可以是复合的车辆控制动作。例如,候选的车辆控制动作可以包括“前进”车辆控制动作,其可以是行人通信车辆控制动作的间接信号,也可以是行人通信车辆控制动作的直接信号,例如自主车辆的闪烁前灯或自主车辆发出的喇叭声。图7中示出了自主车辆操作控制情景的示例,所述自主车辆操作控制情景包括自主车辆穿越行人附近的车辆交通运输网的一部分。
交叉路口特定情景操作控制评估模块4420可以是自主车辆操作控制情景的模型,其包括自主车辆穿越于包括交叉路口的车辆交通运输网的一部分。交叉路口特定情景操作控制评估模块4420可以对周边车辆的行为进行建模,所述周边车辆穿越所述车辆交通运输网中的交叉路口,或者所述周边车辆以其他方式概率性地影响穿越所述交叉路口的自主车辆的操作。交叉路口可以包括车辆交通运输网的任何部分,其中车辆可以从一条道路转移到另一条道路。
在一些实施方式中,对包括自主车辆穿越包括一交叉路口的车辆交通运输网的一部分的自主车辆操作控制情景进行建模可以包括:确定车辆穿越所述交叉路口的通行权次序,例如通过与周边车辆磋商而确定车辆穿越所述交叉路口的通行权次序。
在一些实施方式中,对包括自主车辆穿越包括一交叉路口的车辆交通运输网的一部分的自主车辆操作控制情景进行建模可以包括:对一个或多个交通控制物(例如停止标志、让行标志、交通灯或任何其他交通控制装置)、规则、信号或其组合进行建模。
在一些实施方式中,对包括自主车辆穿越包括一交叉路口的车辆交通运输网的一部分的自主车辆操作控制情景进行建模可以包括:输出候选的“前进”车辆控制动作;响应于自主车辆执行所述候选的“前进”车辆控制动作,接收诸如传感器信息之类的信息;并基于所接收的信息而输出后续的候选的车辆控制动作。
在一些实施方式中,对包括自主车辆穿越包括一交叉路口的车辆交通运输网的一部分的自主车辆操作控制情景进行建模可以包括:根据车辆交通运输网规则对周边车辆可以穿越所述交叉路口的概率进行建模。在一些实施方式中,对包括自主车辆穿越包括一交叉路口的车辆交通运输网的一部分的自主车辆操作控制情景建模可以包括:对周边车辆可以独立于一个或多个车辆交通运输网规则(例如通过紧密跟随或借道具有通行权的另一周边车辆)来穿越所述交叉路口的概率进行建模。
交叉路口特定情景操作控制评估模块4420可以输出候选的车辆控制动作,诸如候选的“停止”车辆控制动作、候选的“前进”车辆控制动作或候选的“继续行进”车辆控制动作。在一些实施方式中,候选的车辆控制动作可以是复合的车辆控制动作。例如,候选的车辆控制动作可以包括“继续行进”车辆控制动作以及通信车辆控制动作的信号,例如闪烁的自主车辆的转向信号。图8中示出了自主车辆操作控制情景的示例,所述自主车辆操作控制情景包括自主车辆穿越交叉路口。
车道变更特定情景操作控制评估模块4430可以是包括自主车辆通过执行车道变更操作来穿越车辆交通运输网的一部分的自主车辆操作控制情景的模型。车道变更特定情景操作控制评估模块4430可以对周边车辆的行为进行建模,所述周边车辆的行为概率性地影响穿越变更车道的自主车辆的操作。
在一些实施方式中,对包括自主车辆通过执行车道变更来穿越车辆交通运输网的一部分的自主车辆操作控制情景进行建模可以包括输出:候选的“维持”车辆控制动作、“继续行进”车辆控制动作、“加速”车辆控制动作、“减速”车辆控制动作或其组合。在图9中示出包括自主车辆变更车道的自主车辆操作控制情景的示例。
在一些实施方式中,自主车辆操作管理控制器4100、堵塞监测器4200、操作环境监测器4300或特定情景操作控制评估模块4400中的一者或多者可以连续地或周期性地操作,例如以十赫兹(10Hz)的频率进行操作。例如,自主车辆操作管理控制器4100可以每秒多次地(例如每秒十次地)识别车辆控制动作。自主车辆操作管理系统4000的每个部件的操作频率可以是同步的或不同步的,并且自主车辆操作管理控制器4100、堵塞监测器4200、操作环境监测器4300或特定情景操作控制评估模块4400中的一者或多者的操作率与所述自主车辆操作管理控制器4100、堵塞监测器4200、操作环境监测器4300或特定情景操作控制评估模块4400中的其他的一者或多者的操作率无关。
在一些实施方式中,由特定情景操作控制评估模块4400的示例输出的候选的车辆控制动作可以包括操作环境信息(例如状态信息)、时间信息或上述两者,或者与操作环境信息(例如状态信息)、时间信息或上述两者相关联。例如,候选的车辆控制动作可以与表示可能的未来状态、未来的时间位置或上述两者的操作环境信息相关联。在一些实施方式中,自主车辆操作管理控制器4100可以识别表示过去的时间位置的过时的候选的车辆控制动作、具有低于最小阈值的发生概率的状态或未选择的候选的车辆控制动作,并且自主车辆操作管理控制器4100可以删除、省略或忽略所述过时的候选的车辆控制动作。
图5是根据本公开的实施方式的自主车辆操作管理5000的示例的流程图。自主车辆操作管理5000可以在以下车辆中实现:例如图1中所示的车辆1000、图2中所示的车辆2100/2110中的一者的自主车辆;半自主车辆或实现自主驾驶的任何其他车辆。例如,自主车辆可以实现自主车辆操作管理系统,例如图4中所示的自主车辆操作管理系统4000。
自主车辆操作管理5000可以包括实现或操作一个或多个模块或部件,这可以包括操作:自主车辆操作管理控制器或执行器5100,例如图4中所示的自主车辆操作管理控制器4100;堵塞监测器5200,例如图4中所示的堵塞监测器4200;零个或多个特定情景操作控制评估模块示例(scenario-specific operational control evaluation moduleinstances,SSOCEMI)5300,例如图4中所示的特定情景操作控制评估模块4400的示例;或上述组合。
尽管未在图5中单独示出,在一些实施方式中,执行器5100可以监测自主车辆的操作环境或所述自主车辆的操作环境的限定的方面。在一些实施方式中,监测自主车辆的操作环境可以包括:在5110处,识别和跟踪外部对象;在5120处,识别独特的车辆操作情景;或上述组合。
在5110处,执行器5100可以识别自主车辆的操作环境或所述自主车辆的操作环境的方面。识别所述操作环境可以包括识别表示操作环境或操作环境的一个或多个方面的操作环境信息。在一些实施方式中,操作环境信息可包括用于自主车辆的车辆信息、表示接近所述自主车辆的车辆交通运输网的信息或接近所述自主车辆的车辆交通运输网的一个或多个方面的信息、表示自主车辆的操作环境中的外部对象的信息或自主车辆的操作环境中的外部对象的一个或多个方面的信息、或上述信息的组合。
在一些实施方式中,在5110处,执行器5100可以基于传感器信息、车辆交通运输网信息、先前识别的操作环境信息或描述所述操作环境的一个或多个方面的任何其他信息或多个信息的组合来识别所述操作环境信息。在一些实施方式中,传感器信息可以是经处理的传感器信息,例如来自自主车辆的传感器信息处理单元的经处理的传感器信息,所述传感器信息处理单元可以从自主车辆的传感器接收传感器信息、并且可以基于所述传感器信息生成所述经处理的传感器信息。
在一些实施方式中,在5110处,识别所述操作环境信息可以包括从自主车辆的传感器接收指示操作环境的一个或多个方面的信息,所述传感器例如是图1中所示的传感器1360或图2中示出的车载传感器2105。例如,传感器可以检测距自主车辆不超出限定距离(例如300米)的在所述自主车辆外部的外部对象,诸如行人、车辆或任何其他对象,并且传感器可以将指示或表示外部对象的传感器信息发送至执行器5100。在一些实施方式中,传感器或自主车辆的其他单元可将传感器信息存储在所述自主车辆的存储器中,例如图1中所示的存储器1340,并且自主车辆操作管理控制器5100从所述存储器读取所述传感器信息。
在一些实施方式中,由传感器信息指示的外部对象可以是不确定的,并且自主车辆操作管理控制器5100可以基于传感器信息、其他信息(例如来自其他传感器的信息)、对应于先前识别的对象的信息或上述信息的组合,来识别对象信息,诸如对象类型。在一些实施方式中,传感器或自主车辆的其他单元可识别所述对象信息并可发送对象识别信息到自主车辆操作管理控制器5100。
在一些实施方式中,传感器信息可指示道路状况、道路特征或其组合。例如,传感器信息可以指示道路状况,诸如潮湿的道路状况、结冰的道路状况或任何一种或多种其他道路状况。在另一示例中,传感器信息可以指示道路标记(例如车道线)、道路几何结构的方面或任何一种或多种其他道路特征。
在一些实施方式中,在5110处,识别所述操作环境信息可以包括识别来自于车辆交通运输网信息中的指示操作环境的一个或多个方面的信息。例如,自主车辆操作管理控制器5100可以读取或以其他方式接收:指示自主车辆正在接近交叉路口的车辆交通运输网信息、或以其他方式表达所述自主车辆附近(例如自主车辆的300米范围内)的车辆交通运输网的几何结构或构型的车辆交通运输网信息。
在一些实施方式中,在5110处,识别所述操作环境信息可以包括识别来自于自主车辆外部的周边车辆或其他远程装置的指示操作环境的一个或多个方面的信息。例如,自主车辆可以经由无线电子通信链路从周边车辆接收周边车辆消息,所述周边车辆消息包括指示:所述周边车辆的周边车辆地理空间状态信息的周边车辆信息、所述周边车辆的周边车辆运动状态信息,或上述两者。
在一些实施方式中,执行器5100可以包括一个或多个特定情景监测器模块示例。例如,执行器5100可以包括用于监测行人的特定情景监测器模块示例、用于监测交叉路口的特定情景监测器模块示例、用于监测车道变更的特定情景监测器模块示例,或上述示例的组合。每个特定情景监测器模块示例可以接收或以其他方式访问对应于相应情景的操作环境信息,并且可以将对应于相应情景的专用的监测器信息发送、存储或以其他方式输出到执行器5100、堵塞监测器5200、特定情景操作控制评估模块示例5300或其组合,或者通过执行器5100、堵塞监测器5200、特定情景操作控制评估模块示例5300或其组合来访问对应于相应情景的专用的监测器信息。
在一些实施方式中,在5112处,执行器5100可以将表示自主车辆的操作环境的操作环境信息发送到堵塞监测器5200。可替代地或另外地,堵塞监测器5200可以接收来自于所述自主车辆的另一部件(例如来自于所述自主车辆的传感器)的表示所述自主车辆的操作环境的操作环境信息;堵塞监测器5200可以读取来自于自主车辆的存储器的表示所述自主车辆的操作环境的操作环境信息;或上述的组合。
在5120处,执行器5100可以检测或识别一个或多个独特的车辆操作情景。在一些实施方式中,在5120处,执行器5100可以基于由在5110处识别的操作环境信息表示的操作环境的一个或多个方面,来检测独特的车辆操作情景。
在一些实施方式中,在5120处,执行器5100可以识别多个独特的车辆操作情景,所述多个独特的车辆操作情景可以是复合的车辆操作情景的多个方面。例如,操作环境信息可以包括表示行人沿着自主车辆的预期路径接近交叉路口的信息,并且在5120处,执行器5100可以识别行人车辆操作情景、交叉路口车辆操作情景或这两者。在另一示例中,由操作环境信息表示的操作环境可以包括多个外部对象,并且在5120处,执行器5100可以识别与每个外部对象相对应的独特的车辆操作情景。
在5130处,执行器5100可以基于由操作环境信息表示的操作环境的一个或多个方面,来实例化特定情景操作控制评估模块示例5300。例如,响应于在5120处识别独特的车辆操作情景,执行器5100可以在5130处实例化特定情景操作控制评估模块示例5300。
尽管图5中示出了一个特定情景操作控制评估模块示例5300,但是执行器5100可以实例化多个基于在5110处识别的操作环境信息表示的操作环境的一个或多个方面的特定情景操作控制评估模块示例5300,每个特定情景操作控制评估模块示例5300都与在5120处检测到的相应的独特的车辆操作情景相对应、或者与在5110处识别的独特的外部对象和在5120处检测到的相应的独特的车辆操作情景的组合相对应。
例如,由在5110处识别的操作环境信息表示的操作环境可以包括多个外部对象;执行器5100可以在5120处基于在5110处识别的操作环境信息表示的操作环境来检测多个独特的车辆操作情景,所述多个独特的车辆操作情景可以是复合的车辆操作情景的多个方面;并且执行器5100可以实例化对应于独特的车辆操作情景和外部对象的每个独特的组合的特定情景操作控制评估模块示例5300。
在一些实施方式中,对应于在5120处识别的独特的车辆操作情景的特定情景操作控制评估模块可能是不可用的;并且在5130处将特定情景操作控制评估模块示例5300实例化可以包括生成、解析和实例化对应于在5120处识别的独特的车辆操作情景的特定情景操作控制评估模块示例5300。例如,在5120处识别的独特的车辆操作情景可以指示包括具有停止交通控制信号(例如停止标志)的两个车道并且所述两个车道具有让行交通控制信号(例如让行标志)的交叉路口;可用的特定情景操作控制评估模块可以包括与5120处识别的独特的车辆操作情景不同的部分可观察马尔可夫决策过程特定情景操作控制评估模块,例如对包括四个具有停止交通控制信号的车道的交叉路口情景进行建模的部分可观察马尔可夫决策过程特定情景操作控制评估模块;并且执行器5100可以在5130处生成、解析和实例化对包括具有停止交通控制信号的两个车道和具有让行交通控制信号的两个车道的交叉路口进行建模的马尔可夫决策过程特定情景操作控制评估模块示例5300。
在一些实施方式中,在5130处实例化特定情景操作控制评估模块示例可以包括基于关于自主车辆的信息、操作环境信息或其组合来识别时空会聚的会聚概率。识别时空会聚的会聚概率可以包括:识别自主车辆的预期路径;识别周边车辆的预期路径;以及识别自主车辆和周边车辆的会聚的概率,所述自主车辆和周边车辆的会聚的概率指示自主车辆和周边车辆基于预期的路径信息发生会聚或碰撞的概率。可以响应于确定了会聚概率超出限定的阈值(所述限定的阈值例如是限定的最大可接受的会聚概率)来实例化所述特定情景操作控制评估模块示例。
在一些实施方式中,在5130处实例化特定情景操作控制评估模块示例5300可以包括:如在5132处所示的,将表示自主车辆的操作环境的操作环境信息发送到特定情景操作控制评估模块示例5300。
在5310处,特定情景操作控制评估模块示例5300可以接收表示自主车辆的操作环境的操作环境信息或操作环境信息的一个或多个方面。例如,特定情景操作控制评估模块示例5300可以接收在5132处由执行器5100发送的表示自主车辆的操作环境的操作环境信息或操作环境信息的一个或多个方面。可替代地或另外地,特定情景操作控制评估模块示例5300可以接收来自于自主车辆的其他部件(诸如来自于自主车辆的传感器或来自于堵塞监测器5200)的表示自主车辆的操作环境的操作环境信息;特定情景操作控制评估模块示例5300可以从自主车辆的存储器读取表示自主车辆的操作环境的操作环境信息;或上述的组合。
在5210处,堵塞监测器5200可以接收表示自主车辆的操作环境的操作环境信息或操作环境信息的方面。例如,堵塞监测器5200可以接收在5112处由执行器5100发送的操作环境信息或操作环境信息的方面。在一些实施方式中,堵塞监测器5200可以接收来自于自主车辆的传感器、外部装置(诸如周边车辆或基础设施装置)或其组合的操作环境信息或操作环境信息的方面。在一些实施方式中,堵塞监测器5200可以从存储器(例如自主车辆的存储器)读取所述操作环境信息或操作环境信息的方面。
在5220处,堵塞监测器5200可以确定对于车辆交通运输网的一个或多个部分的相应的可用性的概率(probability of availability,POA)或对应的堵塞概率,所述车辆交通运输网的一个或多个部分例如是所述车辆交通运输网的接近所述自主车辆的部分,所述车辆交通运输网的接近所述自主车辆的部分可以包括车辆交通运输网的对应于自主车辆的预期路径的部分,所述预期路径例如是基于自主车辆的当前路线而识别的预期路径。
在一些实施方式中,在5220处确定相应的可用性的概率可以包括:识别外部对象、跟踪外部对象、投射外部对象的位置信息、投射外部对象的路径信息,或其组合。例如,堵塞监测器5200可以识别外部对象并且可以识别外部对象的预期路径,所述预期路径可以指示一系列的预期的空间位置、预期的时间位置和对应的概率。
在一些实施方式中,堵塞监测器5200可以基于操作环境信息识别外部对象的预期路径,所述操作环境信息例如是指示外部对象的当前位置的信息、指示外部对象的当前轨迹的信息、指示外部对象的分类的类型的信息(例如将外部对象分类为行人或周边车辆的信息)、车辆交通运输网信息(例如指示车辆交通运输网包括接近所述外部对象的人行横道的信息)、与外部对象相关联的先前识别或跟踪的信息、或上述信息的任意组合。例如,可以将外部对象识别为周边车辆,并且可以基于指示周边车辆的当前位置的信息、指示周边车辆的当前轨迹的信息、指示周边车辆的当前速度的信息、与周边车辆相对应的车辆交通运输网信息、法律或规则信息或上述信息的组合,来识别所述周边车辆的预期路径。
在一些实施方式中,在5222处,堵塞监测器5200可以将在5220处识别的可用性的概率发送到特定情景操作控制评估模块示例5300。可替代地或另外地,堵塞监测器5200可以将在5220处识别的可用性的概率存储在自主车辆的存储器中,或上述组合。尽管未在图5中明确示出,对于向特定情景操作控制评估模块示例5300发送可用性的概率来说附加地或替代地,在5212处,堵塞监测器5200可以将在5220处识别的可用性的概率发送到执行器5100。
在5320处,特定情景操作控制评估模块示例5300可以接收可用性的概率。例如,在5222处,特定情景操作控制评估模块示例5300可以接收由堵塞监测器5200发送的可用性的概率。在一些实施方式中,特定情景操作控制评估模块示例5300可以从存储器(例如自主车辆的存储器)读取所述可用性的概率。
在5330处,特定情景操作控制评估模块示例5300可以对相应的独特的车辆操作情景的模型进行解析。在一些实施方式中,在5330处,特定情景操作控制评估模块示例5300可以生成或识别出候选的车辆控制动作。
在一些实施方式中,在5332处,特定情景操作控制评估模块示例5300可以将在5330处识别的候选的车辆控制动作发送到执行器5100。可替代地或另外地,特定情景操作控制评估模块示例5300可以将在5330处识别的候选的车辆控制动作存储在自主车辆的存储器中。
在5140处,执行器5100可以接收候选的车辆控制动作。例如,在5140处,执行器5100可以接收来自于特定情景操作控制评估模块示例5300的候选的车辆控制动作。可替代地或另外地,执行器5100可以从自主车辆的存储器读取所述候选的车辆控制动作。
在5150处,执行器5100可批准所述候选的车辆控制动作,或以其他方式将所述候选的车辆控制动作识别为用于控制自主车辆穿越车辆交通运输网的车辆控制动作。例如,执行器5100可以在5120处识别一种独特的车辆操作情景,可以在5130处实例化一种特定情景操作控制评估模块示例5300,可以在5140处接收一种候选的车辆控制动作,并且可以在5150处批准所述候选的车辆控制动作。
在一些实施方式中,执行器5100可以在5120处识别多种独特的车辆操作情景,可以在5130处实例化多种特定情景操作控制评估模块示例5300,可以在5140处接收多种候选的车辆控制动作,并且可以在5150处批准所述候选的车辆控制动作中的一个或多个。另外地或者可替代地,自主车辆操作管理5000可以包括运用一个或多个先前实例化的特定情景操作控制评估模块示例(未明确示出);并且执行器可以在5140处接收候选的车辆控制动作,所述候选的车辆控制动作来自于在5130处实例化的特定情景操作控制评估模块示例以及来自于先前实例化的特定情景操作控制评估模块示例中的一个或多个;并且所述执行器可以在5150处批准所述候选的车辆控制动作中的一个或多个。
在5150处批准候选的车辆控制动作可以包括:根据所述候选的车辆控制动作来确定是否穿越所述车辆交通运输网的一部分。
执行器5100可以根据在5150处识别的车辆控制动作,在5160处控制自主车辆穿越所述车辆交通运输网或车辆交通运输网的一部分。
在5170处,执行器5100可以识别自主车辆的操作环境或操作环境的方面。在5170处识别自主车辆的操作环境或操作环境的方面可以类似于在5110处识别自主车辆的操作环境,并且在5170处识别自主车辆的操作环境或操作环境的方面可以包括更新先前识别的操作环境信息。
在5180处,执行器5100可以确定或检测独特的车辆操作情景是否被解析或是否未被解析。例如,执行器5100可以如上所述地连续地或周期性地接收操作环境信息。执行器5100可以评估所述操作环境信息以确定所述独特的车辆操作情景是否已经被解析。
在一些实施方式中,执行器5100可以确定对应于特定情景操作控制评估模块示例5300的独特的车辆操作情景在5180处未被解析;如5185所指示的,执行器5100可以将在5170处识别的操作环境信息发送到特定情景操作控制评估模块示例5300;并且在5180处的不对特定情景操作控制评估模块示例5300进行实例化可以被省略或被区分。
在一些实施方式中,执行器5100可以确定所述独特的车辆操作情景在5180处被解析,并且可以在5190处不将与被确定在5180处进行解析的独特的车辆操作情景相对应的特定情景操作控制评估模块示例5300进行实例化。例如,执行器5100可以在5120处识别形成用于自主车辆的独特的车辆操作情景的独特的操作状况的集合;可以确定所述操作状况中的一个或多个已经过期;或者在5180处具有的影响自主车辆的操作的概率低于限定的阈值;并且可以不将对应的特定情景操作控制评估模块示例5300进行实例化。
尽管未在图5中明确示出,执行器5100可以在5170处连续地或周期性地重复识别或更新所述操作环境信息,在5180处确定是否解析了所述独特的车辆操作情景,并且响应于在5180处确定未解析所述独特的车辆操作情景,如在5185处所指示的,将在5170处识别的操作环境信息发送到特定情景操作控制评估模块示例5300,直到确定在5180处是否解析了所述独特的车辆操作情景包括确定解析了所述独特的车辆操作情景。
图6是根据本公开的实施方式的堵塞场景6000的示例的图。自主车辆操作管理(例如图5所示的自主车辆操作管理5000)可以包括:自主车辆6100(诸如图1中所示的车辆1000、图2中所示的车辆2100/2110中的一者)、半自主车辆或实现自主驾驶的任何其他车辆,对包括堵塞监测器(例如图4所示的堵塞监测器4200或者图5所示的堵塞监测器5200)的自主车辆操作管理系统(例如图4中所示的自主车辆操作管理系统4000)进行操作,以确定对应于堵塞场景6000的车辆交通运输网的一部分或区域的可用性的概率或对应的堵塞概率。可以操作堵塞监测器与限定的自主车辆操作控制情景结合、或可以操作堵塞监测器独立于限定的自主车辆操作控制情景,来确定可用性的概率。
对应于图6中所示的堵塞场景6000的车辆交通运输网的部分包括:自主车辆6100穿越第一道路6200,接近与第二道路6220的交叉路口6210。交叉路口6210包括人行横道6300。行人6400正在接近所述人行横道6300。周边车辆6500穿越接近所述交叉路口6210的第二道路6220。自主车辆6100的预期路径6110指示自主车辆6100可以通过从第一道路6200向右转到第二道路6220来穿越所述交叉路口6210。使用虚线示出的用于自主车辆6100的可替代的预期路径6120指示自主车辆6100可以通过从第一道路6200向左转到第二道路6220来穿越所述交叉路口6210。
堵塞监测器可以识别行人6400的预期路径6410。例如,传感器信息可以指示行人6400具有超出阈值的速度和与人行横道6300相交的轨迹;车辆交通运输网信息可以指示交叉路口包括监管控制,从而穿越所述交叉路口基于在人行横道上车辆对行人让行的监管控制;或者交叉路口6210可以包括指示行人6400被允许的通行权信号的一个或多个交通控制装置(未示出);并且行人6400的预期路径6410可以被识别为包括行人6400以高概率(例如1.0或100%)穿越所述人行横道6300。
堵塞监测器可以识别所述周边车辆6500的预期路径6510、6520。例如,传感器信息可以指示周边车辆6500正在接近交叉路口6210;车辆交通运输网信息可以指示周边车辆6500可以直线穿越通过交叉路口6210或者可以在交叉路口6210处右转到第一道路6200上;并且堵塞监测器可以识别针对周边车辆6500的直线通过交叉路口的第一预期路径6510,以及右转通过交叉路口的第二预期路径6520。
在一些实施方式中,堵塞监测器可以基于例如周边车辆6500的操作信息来识别所述预期路径6510、6520中的每个预期路径的概率。例如,周边车辆6500的操作信息可以指示超出最大转向阈值的周边车辆的速度;并且第一预期路径6510可以被识别为具有高概率,例如0.9或90%,以及第二预期路径6520可以被识别为具有低概率,例如0.1或10%。
在另一示例中,周边车辆6500的操作信息可以指示在最大转向阈值内的周边车辆的速度,并且第一预期路径6510可以被识别为具有低概率,例如0.1或10%,以及第二预期路径6520可以被识别为具有高概率,例如0.9或90%。
堵塞监测器可以将接近(例如数英尺内,例如三英尺内)行人的预期路径6410的第二道路6220的部分或区域(所述部分或区域与人行横道6300相对应)的可用性的概率识别为低,例如0%,这表示第二道路6220的对应部分在与行人6400穿越人行横道6300相对应的时间段内被堵塞。
堵塞监测器可以确定周边车辆6500的第一预期路径6510和自主车辆6100的预期路径在对应于行人6400穿越人行横道6300的时间段内被所述行人堵塞。
图7是根据本公开的实施方式的包括行人情景的行人场景7000的示例的图。自主车辆操作管理(例如图5所示的自主车辆操作管理5000)可以包括:自主车辆7100(诸如图1中所示的车辆1000、图2中所示的车辆2100/2110中的一者)、半自主车辆或实现自主驾驶的任何其他车辆,对包括行人特定情景操作控制评估模块示例的自主车辆操作管理系统(例如图4中所示的自主车辆操作管理系统4000)进行操作,所述行人特定情景操作控制评估模块示例可以是行人特定情景操作控制评估模块(例如图4中所示的行人特定情景操作控制评估模块4410)的示例,所述行人特定情景操作控制评估模块可以是包括自主车辆7100穿越行人附近的车辆交通运输网的一部分的自主车辆操作控制情景的模型。为了简单和清楚起见,与图7中所示的行人场景7000相对应的车辆交通运输网的部分在顶部取向朝北、在右侧取向朝东。
与图7所示的行人场景7000相对应的车辆交通运输网的部分包括自主车辆7100沿着第一道路7200的车道中的道路段向北穿越,接近第一道路7200与第二道路7220的交叉路口7210。所述交叉路口7210包括穿越第一道路7200的第一人行横道7300和穿越第二道路7220的第二人行横道7310。第一行人7400位于第一道路7200中,在非行人可访问区域内向东移动(乱穿马路)。第二行人7410接近第一人行横道7300并且向西北偏西移动。第三行人7420从西面接近第一人行横道7300。第四行人7430从北面接近第二人行横道7310。
自主车辆操作管理系统可以包括自主车辆操作管理控制器(诸如图4中所示的自主车辆操作管理控制器4100或图5所示的执行器5100)、和堵塞监测器(例如图4所示的堵塞监测器4200或图5所示的堵塞监测器5200)。自主车辆7100可包括一个或多个传感器、一个或多个操作环境监测器或其组合。
在一些实施方式中,自主车辆操作管理系统可以连续地或周期性地进行操作,例如在一系列的时间位置中的每个时间位置处进行操作。为了简单和清楚起见,根据所述一系列的时间位置中的第一个(按顺序来说最早的)时间位置,示出了自主车辆7100、第一行人7400、第二行人7410、第三行人7420和第四行人7430的地理空间位置。尽管为了简单和清楚起见而参考一系列的时间位置进行描述,但是自主车辆操作管理系统的每个单元可以以任何频率进行操作,相应单元的操作可以是同步的或不同步的,并且操作可以与一个或多个时间位置的一个或多个部分同时执行。为了简单和清楚起见,可以从本公开中省略一个或多个时间位置(诸如本文描述的多个时间位置之间的时间位置)的相应描述。
在一个或多个时间位置处,例如在每个时间位置处,自主车辆7100的传感器可以检测与自主车辆7100的操作环境相对应的信息,例如与行人7400、7410、7420、7430中的一个或多个相对应的信息。
在一个或多个时间位置处,例如在每个时间位置处,自主车辆操作管理系统可以识别所述自主车辆7100的预期路径7500、自主车辆7100的路线7510或它们两者。根据第一时间位置,自主车辆7100的预期路径7500指示自主车辆7100可以通过沿着第一道路7200向北继续行进来穿越所述交叉路口7210。自主车辆7100的路线7510指示自主车辆7100可以右转到第二道路7220上。
在一个或多个时间位置处,例如在每个时间位置处,自主车辆7100的操作环境监测器可以识别或生成表示自主车辆7100的操作环境的操作环境信息或操作环境信息的方面,例如响应于接收对应于行人7400、7410、7420的传感器信息,这可以包括将所述传感器信息与行人7400、7410、7420、7430相关联,并且可以输出所述操作环境信息(所述操作环境信息可以包括表示行人7400、7410、7420、7430的信息)至所述自主车辆操作管理控制器。
在一个或多个时间位置处,例如在每个时间位置处,堵塞监测器可以生成可用性信息的概率,所述可用性信息的概率指示车辆交通运输网的一个或多个区域或部分的可用性的相应概率。例如,根据第一时间位置,堵塞监测器可以确定:第一行人7400的预期路径7520,以及接近第一行人7400的预期路径7520和自主车辆7100的预期路径7500或路线7510之间的会聚点的车辆交通运输网的区域或部分的可用性的概率。
在另一示例中,堵塞监测器可确定第二行人7410的预期路径7530、第三行人7420的预期路径7540、以及接近第一人行横道7300的车辆交通运输网的区域或部分的可用性的概率。识别接近第一人行横道7300的所述车辆交通运输网的区域或部分的可用性的概率可以包括:将第二行人7410和第三行人7420识别为优先堵塞的外部对象,并且确定对应的预期路径7530、7540可以在空间和时间上重叠。
在另一示例中,堵塞监测器可以确定一个或多个外部对象的多个预期路径。例如,堵塞监测器可以将第二行人7410的第一预期路径7530识别为具有高概率,并且可以将第二行人7410的第二预期路径7532识别为具有低概率。
在另一示例中,堵塞监测器可以确定第四行人7430的预期路径7550以及接近第二人行横道7310的车辆交通运输网的区域或部分的可用性的概率。
在一些实施方式中,生成所述可用性信息的概率可以包括:生成对应于来自于一系列的时间位置的多个时间位置的车辆交通运输网的相应区域或部分的可用性的概率。堵塞监测器可以将可用性信息的概率输出到自主车辆操作管理控制器,或者可以由自主车辆操作管理控制器访问所述可用性信息的概率。
在一个或多个时间位置处,例如在每个时间位置处,自主车辆操作管理控制器可以生成操作环境信息或者更新先前生成的操作环境信息,这可以包括接收操作环境信息或所述操作环境信息的一部分。
在一个或多个时间位置处,例如在每个时间位置处,自主车辆操作管理控制器可以例如基于由操作环境信息表示的操作环境,来检测或识别一个或多个独特的车辆操作情景,所述操作环境信息可以包括由操作环境监测器输出的操作环境信息、由堵塞监测器输出的可用性信息的概率或其组合。例如,根据第一时间位置,自主车辆操作管理控制器可以检测或识别以下情景中的一者或多者:包括第一行人7400的第一行人情景、包括第二行人7410的第二行人情景、包括第三行人7420的第三行人情景和包括第四行人7430的第四行人情景。
在一个或多个时间位置处,例如在每个时间位置处,自主车辆操作管理控制器可以检测一个或多个先前未检测到的车辆操作情景。例如,根据第一时间位置,自主车辆操作管理控制器可以检测第一车辆操作情景;并且根据一系列的时间位置中的第二时间位置(例如,第一时间位置之后的时间位置),所述自主车辆操作管理控制器可以检测第二车辆操作情景。
在一个或多个时间位置处,例如在每个时间位置处,响应于检测或识别包括第一行人7400的第一行人情景、包括第二行人7410的第二行人情景、包括第三行人7420的第三行人情景或包括第四行人7430的第四行人情景中的一者或多者,自主车辆操作管理控制器可以实例化一个或多个行人特定情景操作控制评估模块示例。
例如,根据第一时间位置,自主车辆操作管理控制器可以检测包括第一行人7400的第一行人情景;所述自主车辆操作管理控制器可以确定对应于第一行人情景的行人特定情景操作控制评估模块是可用的;并且响应于检测到包括第一行人7400的第一行人情景,所述自主车辆操作管理控制器可以实例化第一行人特定情景操作控制评估模块示例。
在另一示例中,自主车辆操作管理控制器可以检测包括第一行人7400的第一行人情景;确定对应于第一行人情景的行人特定情景操作控制评估模块是不可用的;生成对应于第一行人情景的行人特定情景操作控制评估模块并解析所述行人特定情景操作控制评估模块;并响应于检测到包括第一行人7400的第一行人情景,实例化对应于所述第一行人情景的行人特定情景操作控制评估模块示例。
在一些实施方式中,自主车辆操作管理控制器可以基本上同时检测或识别所述行人情景中的一者或多者。例如,自主车辆操作管理控制器可以基本上同时检测或识别包括第二行人7410的第二行人情景和包括第三行人7420的第三行人情景。
在一些实施方式中,自主车辆操作管理控制器可以基本上同时实例化相应的行人特定情景操作控制评估模块中的两个或更多个相应的示例。例如,自主车辆操作管理控制器可以基本上同时检测或识别包括第二行人7410的第二行人情景和包括第三行人7420的第三行人情景,并且可以在实例化对应于第三行人情景的行人特定情景操作控制评估模块示例时,基本上同时实例化对应于第二行人情景的行人特定情景操作控制评估模块示例。
在另一示例中,自主车辆操作管理控制器可以基本上同时检测或识别包括第二行人7410的第一预期路径7530的第二行人情景和包括第二行人7410的第二预期路径7532的第五行人情景;并且可以在实例化对应于第五行人情景的行人特定情景操作控制评估模块示例时,基本上同时实例化对应于第二行人情景的行人特定情景操作控制评估模块示例。
在一个或多个时间位置处,例如在每个时间位置处,自主车辆操作管理控制器可以将操作环境信息(例如新的或更新的操作环境信息)发送或以其他方式提供至先前实例化的或正在运用的特定情景操作控制评估模块示例。
对特定情景操作控制评估模块示例进行实例化或更新可以包括:将操作环境信息或操作环境信息的一部分(诸如传感器信息或可用性的概率)提供至相应的特定情景操作控制评估模块示例,例如,通过将操作环境信息或操作环境信息的一部分发送到相应的特定情景操作控制评估模块示例,或者储存操作环境信息或操作环境信息的一部分,以供相应的特定情景操作控制评估模块示例访问。
在一个或多个时间位置处,例如在每个时间位置处,相应的行人特定情景操作控制评估模块示例可以接收或以其他方式访问对应于相应的自主车辆操作控制情景的操作环境信息。例如,根据第一时间位置,第一行人特定情景操作控制评估模块示例可以接收与第一行人情景相对应的操作环境信息,所述操作环境信息可以包括接近第一行人7400的预期路径7520和自主车辆7100的预期路径7500或路线7510之间的会聚点的车辆交通运输网的区域或部分的可用性信息的概率。
行人特定情景操作控制评估模块可以将行人情景建模为包括表示自主车辆7100的时空位置、相应的行人7400、7410、7420、7430的时空位置以及对应的堵塞概率的状态。行人特定情景操作控制评估模块可以将行人情景建模为包括诸如“停止”(或“等待”)、“前进”和“继续行进”之类的动作。行人特定情景操作控制评估模块可以将行人情景建模为包括状态转换概率,所述状态转换概率表示相应的行人进入自主车辆的预期路径(例如通过穿越与相应的行人相关联的预期路径)的概率。可以基于操作环境信息确定所述状态转换概率。行人特定情景操作控制评估模块可以将行人情景建模为:包括违反交通控制规则的负值奖励,并且包括完成所述行人情景的正值奖励。
在一个或多个时间位置处,例如在每个时间位置处,每个实例化的行人特定情景操作控制评估模块示例可以基于相应的被建模的情景和对应的操作环境信息而生成相应的候选的车辆控制动作,诸如“停止”、“前进”和“继续行进”之类;并且每个实例化的行人特定情景操作控制评估模块示例可以将所述相应的候选的车辆控制动作输出到自主车辆操作管理控制器,例如通过将相应的候选的车辆控制动作发送到自主车辆操作管理控制器,或者存储所述相应的候选的车辆控制动作以供自主车辆操作管理控制器访问。
在一个或多个时间位置处,例如在每个时间位置,自主车辆操作管理控制器可以接收候选的车辆控制动作,所述候选的车辆控制动作来自于相应的实例化的行人特定情景操作控制评估模块示例,并且自主车辆操作管理控制器可以基于所接收的候选的车辆控制动作来识别车辆控制动作,以在对应的时间位置处控制自主车辆7100,并且可以根据所识别的车辆控制动作来控制自主车辆穿越车辆交通运输网或车辆交通运输网的一部分。
在一个或多个时间位置处,例如在每个时间位置处,自主车辆操作管理控制器可以确定所检测到的车辆操作情景中的一个或多个是否已经过期,并且响应于确定一车辆操作情景已经过期,可以不将对应的行人特定情景操作控制评估模块示例进行实例化。
图8是根据本公开的实施方式的包括交叉路口情景的交叉路口场景8000的示例的图。自主车辆操作管理(例如图5所示的自主车辆操作管理5000)可以包括:自主车辆8100(诸如图1中所示的车辆1000、图2中所示的车辆2100/2110中的一者)、半自主车辆或实现自主驾驶的任何其他车辆,对包括交叉路口特定情景操作控制评估模块示例的自主车辆操作管理系统(例如图4中所示的自主车辆操作管理系统4000)进行操作,所述交叉路口特定情景操作控制评估模块示例可以是交叉路口特定情景操作控制评估模块(例如图4中所示的交叉路口特定情景操作控制评估模块4420)的示例,所述交叉路口特定情景操作控制评估模块可以是包括自主车辆8100穿越包括交叉路口的车辆交通运输网的一部分的自主车辆操作控制情景的模型。为了简单和清楚起见,与图8中所示的交叉路口场景8000相对应的车辆交通运输网的部分在顶部取向朝北、在右侧取向朝东。
与图8中所示的交叉路口场景8000相对应的车辆交通运输网的部分包括:自主车辆8100从西向东穿越于第一道路8200,并接近第一道路8200与第二道路8220的交叉路口8210。自主车辆8100的预期路径8110指示自主车辆8100可以直线穿越所述交叉路口8210。使用虚线示出的自主车辆8100的第一可替代的预期路径8120指示自主车辆8100可以通过从第一道路8200右转到第二道路8220来穿越所述交叉路口8210。使用虚线示出的用于自主车辆8100的第二可替代的预期路径8130指示自主车辆8100可以通过从第一道路8200左转第二道路8220来穿越所述交叉路口8210。
示出了第一周边车辆8300沿着第二道路8220的第一南行车道向南穿越接近交叉路口8210。示出了第二周边车辆8310沿着第二道路8220的第一北行车道向北穿越接近交叉路口8210。示出了第三周边车辆8320沿着第二道路8220的第二北行车道向北穿越接近交叉路口8210。示出了第四周边车辆8330沿着第二道路8220的第一北行车道向北穿越接近交叉路口8210。
自主车辆操作管理系统可以包括自主车辆操作管理控制器(诸如图4中所示的自主车辆操作管理控制器4100或图5所示的执行器5100)、和堵塞监测器(例如图4所示的堵塞监测器4200或图5所示的堵塞监测器5200)。自主车辆8100可包括一个或多个传感器、一个或多个操作环境监测器或其组合。
在一些实施方式中,自主车辆操作管理系统可以连续地或周期性地进行操作,例如在一系列的时间位置中的每个时间位置处进行操作。为了简单和清楚起见,根据所述一系列的时间位置中的第一个(按顺序来说最早的)时间位置,示出了自主车辆8100、第一周边车辆8300、第二周边车辆8310、第三周边车辆8320和第四周边车辆8330的地理空间位置。尽管为了简单和清楚起见参考一系列的时间位置进行描述,但是自主车辆操作管理系统的每个单元可以以任何频率进行操作,相应单元的操作可以是同步的或不同步的,并且操作可以与一个或多个时间位置中的一个或多个部分同时执行。为了简单和清楚起见,可以从本公开中省略一个或多个时间位置(诸如本文描述的多个时间位置之间的时间位置)的相应描述。
在一个或多个时间位置处,例如在每个时间位置处,自主车辆8100的传感器可以检测与自主车辆8100的操作环境相对应的信息,例如与周边车辆8300、8310、8320、8330中的一个或多个相对应的信息。
在一个或多个时间位置处,例如在每个时间位置处,自主车辆操作管理系统可以识别所述自主车辆8100的预期路径8110、8120、8130和自主车辆8100的路线(未示出)或上述两者。
在一个或多个时间位置处,例如在每个时间位置处,自主车辆8100的操作环境监测器可以识别或生成表示自主车辆8100的操作环境的操作环境信息或操作环境信息的方面,例如响应于接收对应于周边车辆8300、8310、8320、8330的传感器信息,这可以包括将所述传感器信息与周边车辆8300、8310、8320、8330相关联,并且可以输出所述操作环境信息(所述操作环境信息可以包括表示周边车辆8300、8310、8320、8330的信息)至所述自主车辆操作管理控制器。
在一个或多个时间位置处,例如在每个时间位置处,堵塞监测器可以生成可用性信息的概率,所述可用性信息的概率指示车辆交通运输网的一个或多个区域或部分的可用性的相应概率。例如,堵塞监测器可以确定第一周边车辆8300的一个或多个可能的预期路径8400、8402,第二周边车辆8310的一个或多个可能的预期路径8410、8412,第三周边车辆8320的一个或多个可能的预期路径8420、8422和第四周边车辆8330的预期路径8430。堵塞监测器可以生成可用性信息的概率,所述可用性信息的概率指示对应于自主车辆8100的预期路径8110、自主车辆8100的第一可替代的预期路径8120或自主车辆8100的第二可替代的预期路径8130中的一者或多者的车辆交通运输网的一个或多个区域或部分的可用性的相应概率。
在一些实施方式中,生成所述可用性信息的概率可以包括:生成对应于来自于一系列的时间位置的多个时间位置的车辆交通运输网的相应区域或部分的可用性的概率。堵塞监测器可以将可用性信息的概率输出到自主车辆操作管理控制器或者可以由自主车辆操作管理控制器访问所述可用性信息的概率。
在一个或多个时间位置处,例如在每个时间位置处,自主车辆操作管理控制器可以生成操作环境信息或者更新先前生成的操作环境信息,这可以包括接收操作环境信息或所述操作环境信息的一部分。
在一个或多个时间位置处,例如在每个时间位置处,自主车辆操作管理控制器可以(例如基于由操作环境信息表示的操作环境)检测或识别一个或多个独特的车辆操作情景,所述操作环境信息可以包括由操作环境监测器输出的操作环境信息、由堵塞监测器输出的可用性信息的概率或其组合。例如,自主车辆操作管理控制器可以检测或识别以下情景中的一者或多者:包括第一周边车辆8300的第一交叉路口情景、包括第二周边车辆8310的第二交叉路口情景、包括第三周边车辆8320的第三交叉路口情景和包括第四周边车辆8330的第四交叉路口情景。
在一个或多个时间位置处,例如在每个时间位置处,自主车辆操作管理控制器可以检测一个或多个先前未检测到的车辆操作情景。例如,根据第一时间位置,自主车辆操作管理控制器可以检测第一交叉路口情景;并且根据所述一系列的时间位置中的第二时间位置(例如,第一时间位置之后的时间位置),自主车辆操作管理控制器可以检测第二交叉路口情景。
在一个或多个时间位置处,例如在每个时间位置处,响应于检测或识别第一交叉路口情景、第二交叉路口情景、第三交叉路口情景或第四交叉路口情景中的一者或多者,自主车辆操作管理控制器可以实例化一个或多个交叉路口特定情景操作控制评估模块示例。
在一些实施方式中,自主车辆操作管理控制器可以基本上同时检测或识别所述交叉路口情景中的一者或多者。例如,自主车辆操作管理控制器可以基本上同时检测或识别第二交叉路口情景和第三交叉路口情景。
在一些实施方式中,自主车辆操作管理控制器可以基本上同时实例化相应的交叉路口特定情景操作控制评估模块中的两个或更多个相应的示例。例如,自主车辆操作管理控制器可以基本上同时检测或识别第二交叉路口情景和第三交叉路口情景,并且可以在实例化对应于第三交叉路口情景的交叉路口特定情景操作控制评估模块示例时,基本上同时实例化对应于第二交叉路口情景的交叉路口特定情景操作控制评估模块示例。
在另一示例中,自主车辆操作管理控制器可以基本上同时检测或识别包括第一周边车辆8300的第一预期路径8400的第二交叉路口情景和包括第一周边车辆8300的第二预期路径8402的第五交叉路口情景;并且可以在实例化对应于第五交叉路口情景的交叉路口特定情景操作控制评估模块示例时,基本上同时实例化对应于第二交叉路口情景的交叉路口特定情景操作控制评估模块示例。
在一个或多个时间位置处,例如在每个时间位置处,自主车辆操作管理控制器可以将操作环境信息(例如新的或更新的操作环境信息)发送或以其他方式提供至先前实例化的或正在运用的特定情景操作控制评估模块示例。
对特定情景操作控制评估模块示例进行实例化或更新可以包括:将操作环境信息或操作环境信息的一部分(诸如传感器信息或可用性的概率)提供至相应的特定情景操作控制评估模块示例,例如,通过将操作环境信息或操作环境信息的一部分发送到相应的特定情景操作控制评估模块示例,或者储存操作环境信息或操作环境信息的一部分,以供相应的特定情景操作控制评估模块示例访问。
在一些实施方式中,操作环境信息可以指示自主车辆8100的操作信息(诸如地理空间位置信息、速度信息、加速信息、未决信息、优先级信息或上述信息的组合)以及周边车辆8300、8310、8320、8330中的一个或多个周边车辆的操作信息(诸如地理空间位置信息、速度信息、加速信息、未决信息、优先级信息或上述信息的组合)。未决信息可以指示对应于相应车辆的时间段和相应的地理位置,例如相应的车辆在交叉路口处静止的时间段。优先级信息可以指示与相应的车辆相对应的相对于交叉路口场景8000中的其他车辆的通行权优先级。
交叉路口特定情景操作控制评估模块可以将交叉路口情景建模为包括表示自主车辆8100的时空位置、相应的周边车辆8300、8310、8320、8330的时空位置、未决信息、优先级信息以及对应的堵塞概率的状态。交叉路口特定情景操作控制评估模块可以将交叉路口情景建模为包括诸如“停止”(或“等待”)、“前进”和“继续行进”之类的动作。交叉路口特定情景操作控制评估模块可以将交叉路口情景建模为包括状态转换概率,所述状态转换概率表示相应的交叉路口进入自主车辆的预期路径(例如通过穿越与相应的交叉路口相关联的预期路径)的概率。可以基于操作环境信息确定所述状态转换概率。交叉路口特定情景操作控制评估模块可以将交叉路口情景建模为:包括违反交通控制规则的负值奖励,并且包括完成所述交叉路口情景的正值奖励。
在一个或多个时间位置处,例如在每个时间位置处,相应的交叉路口特定情景操作控制评估模块示例可以接收或以其他方式访问对应于相应的交叉路口情景的操作环境信息。例如,根据第一时间位置,第一交叉路口特定情景操作控制评估模块示例可以接收与第一交叉路口情景相对应的操作环境信息,所述操作环境信息可以包括接近第一周边车辆8300的第一预期路径8400和自主车辆8100的预期路径8110之间的会聚点的车辆交通运输网的区域或部分的可用性信息的概率。
在一个或多个时间位置处,例如在每个时间位置处,每个实例化的交叉路口特定情景操作控制评估模块示例可以基于相应的被建模的情景和对应的操作环境信息而生成相应的候选的车辆控制动作,诸如“停止”、“前进”和“继续行进”;并且每个实例化的交叉路口特定情景操作控制评估模块示例可以将所述相应的候选的车辆控制动作输出到自主车辆操作管理控制器,例如通过将相应的候选的车辆控制动作发送到自主车辆操作管理控制器,或者存储所述相应候选的车辆控制动作以供自主车辆操作管理控制器访问。
在一个或多个时间位置处,例如在每个时间位置处,自主车辆操作管理控制器可以接收来自于相应的实例化的交叉路口特定情景操作控制评估模块示例的候选的车辆控制动作,并且可以基于所接收的候选的车辆控制动作来识别车辆控制动作,以在对应的时间位置处控制自主车辆8100,并且可以根据所识别的车辆控制动作来控制自主车辆8100穿越车辆交通运输网或车辆交通运输网的一部分。
在一个或多个时间位置处,例如在每个时间位置处,自主车辆操作管理控制器可以确定所检测到的交叉路口情景中的一个或多个是否已经过期,并且响应于确定一交叉路口情景已经过期,可以不将对应的交叉路口特定情景操作控制评估模块示例进行实例化。
图9是根据本公开的实施方式的包括车道变更情景的车道变更场景9000的示例的图。自主车辆操作管理(例如图5所示的自主车辆操作管理5000)可以包括:自主车辆9100(诸如图1中所示的车辆1000、图2中所示的车辆2100、2110中的一者)、半自主车辆或实现自主驾驶的任何其他车辆,对包括车道变更特定情景操作控制评估模块示例的自主车辆操作管理系统(例如图4中所示的自主车辆操作管理系统4000)进行操作,所述车道变更特定情景操作控制评估模块示例可以是车道变更特定情景操作控制评估模块(例如图4中所示的车道变更特定情景操作控制评估模块4430)的示例,所述车道变更特定情景操作控制评估模块可以是包括自主车辆9100通过执行车道变更来穿越车辆交通运输网的一部分的自主车辆操作控制情景的模型。为了简单和清楚起见,与图9中所示的车道变更场景9000相对应的车辆交通运输网的部分在顶部取向朝北、在右侧取向朝东。
与图9所示的车道变更场景9000相对应的车辆交通运输网的部分包括沿第一道路9200向北行驶的自主车辆9100。第一条道路9200包括东部的北行车道9210和西部的北行车道9220。自主车辆9100的当前预期路径9110指示自主车辆9100正在东部的北行车道9210中向北行驶。使用虚线示出的自主车辆9100的可替代的预期路径9120指示自主车辆9100可以通过执行从东部的北行车道9210到西部的北行车道9220的车道变更来穿越所述车辆交通运输网。
示出了第一周边车辆9300在所述自主车辆9100的前方(北方)沿着东部的北行车道9210向北行驶。示出了第二周边车辆9400在所述自主车辆9100的后方(南方)沿着西部的北行车道9220向北行驶。
自主车辆操作管理系统可以包括自主车辆操作管理控制器(诸如图4中所示的自主车辆操作管理控制器4100或图5所示的执行器5100)、和堵塞监测器(例如图4所示的堵塞监测器4200或图5所示的堵塞监测器5200)。自主车辆9100可包括一个或多个传感器、一个或多个操作环境监测器或其组合。
在一些实施方式中,自主车辆操作管理系统可以连续地或周期性地进行操作,例如在一系列的时间位置中的每个时间位置处进行操作。为了简单和清楚起见,根据所述一系列的时间位置中的第一个(按顺序来说最早的)时间位置,示出了自主车辆9100、第一周边车辆9300、第二周边车辆9400的地理空间位置。尽管为了简单和清楚起见参考一系列的时间位置进行描述,但是自主车辆操作管理系统的每个单元可以以任何频率进行操作,相应单元的操作可以是同步的或不同步的,并且操作可以与一个或多个时间位置中的一个或多个部分同时执行。为了简单和清楚起见,可以从本公开中省略一个或多个时间位置(诸如本文描述的多个时间位置之间的时间位置)的相应描述。
在一个或多个时间位置处,例如在每个时间位置处,自主车辆9100的传感器可以检测与自主车辆9100的操作环境相对应的信息,例如与周边车辆9300、9400中的一个或多个相对应的信息。
在一个或多个时间位置处,例如在每个时间位置处,自主车辆操作管理系统可以识别所述自主车辆9100的预期路径9110、9120和自主车辆9100的路线(未示出)或上述两者。
在一个或多个时间位置处,例如在每个时间位置处,自主车辆9100的操作环境监测器可以识别或生成表示自主车辆9100的操作环境的操作环境信息或操作环境信息的方面,例如响应于接收对应于周边车辆9300、9400的传感器信息,这可以包括将所述传感器信息与周边车辆9300、9400相关联,并且可以输出所述操作环境信息(所述操作环境信息可以包括表示周边车辆9300、9400的信息)至所述自主车辆操作管理控制器。
在一个或多个时间位置处,例如在每个时间位置处,堵塞监测器可以生成可用性信息的概率,所述可用性信息的概率指示车辆交通运输网的一个或多个区域或部分的可用性的相应概率。例如,堵塞监测器可以确定第一周边车辆9300的一个或多个可能的预期路径9310、9320;第二周边车辆9400的一个或多个可能的预期路径9410、9420。第一周边车辆9300的第一可能的预期路径9310指示第一周边车辆9300穿越在东部的北行车道9210中的车辆交通运输网的对应部分。使用虚线示出的第一周边车辆9300的第二可能的预期路径9320指示第一周边车辆9300通过执行到西部的北行车道9220的车道变更来穿越车辆交通运输网的对应部分。第二周边车辆9400的第一可能的预期路径9410指示第二周边车辆9400穿越在西部的北行车道9220中的车辆交通运输网的对应部分。使用虚线示出的第二周边车辆9400的第二可能的预期路径9420指示第二周边车辆9400通过执行到东部的北行车道9210的车道变更来穿越车辆交通运输网的对应部分。
堵塞监测器可以生成可用性信息的概率,所述可用性信息的概率指示对应于自主车辆9100的预期路径9110或自主车辆9100的可替代的预期路径9120中的一者或多者的车辆交通运输网的一个或多个区域或部分的可用性的相应概率。
在一些实施方式中,生成可用性信息的概率可以包括生成对应于来自一系列的时间位置的多个时间位置的车辆交通运输网的相应区域或部分的可用性的概率。堵塞监测器可以将可用性信息的概率输出到自主车辆操作管理控制器或者可以由自主车辆操作管理控制器访问所述可用性信息的概率。
在一个或多个时间位置处,例如在每个时间位置处,自主车辆操作管理控制器可以生成操作环境信息或者更新先前生成的操作环境信息,这可以包括接收操作环境信息或所述操作环境信息的一部分。
在一个或多个时间位置处,例如在每个时间位置处,自主车辆操作管理控制器可以(例如基于由操作环境信息表示的操作环境)检测或识别一个或多个独特的车辆操作情景,所述操作环境信息可以包括由操作环境监测器输出的操作环境信息、由堵塞监测器输出的可用性信息的概率或其组合。例如,自主车辆操作管理控制器可以检测或识别以下情景中的一者或多者:包括第一周边车辆9300的第一车道变更情景、包括第二周边车辆9400的第二车道变更情景或上述两者。
在一个或多个时间位置处,例如在每个时间位置处,自主车辆操作管理控制器可以响应于检测或识别第一车道变更情景或第二车道变更情景中的一者或多者而实例化一个或多个车道变更特定情景操作控制评估模块示例。
在一个或多个时间位置处,例如在每个时间位置处,自主车辆操作管理控制器可以将操作环境信息(例如新的或更新的操作环境信息)发送或以其他方式提供至先前实例化的或正在运用的特定情景操作控制评估模块示例。
对特定情景操作控制评估模块示例进行实例化或更新可以包括:将操作环境信息或操作环境信息的一部分(诸如传感器信息或可用性的概率)提供至相应的特定情景操作控制评估模块示例,例如,通过将操作环境信息或操作环境信息的一部分发送到相应的特定情景操作控制评估模块示例,或者储存操作环境信息或操作环境信息的一部分,以供相应的特定情景操作控制评估模块示例访问。
在一些实施方式中,操作环境信息可以指示自主车辆9100的操作信息(诸如地理空间位置信息、速度信息、加速信息或上述信息的组合)以及周边车辆9300、9400中的一个或多个周边车辆的操作信息(诸如地理空间位置信息、速度信息、加速信息或上述信息的组合)。
车道变更特定情景操作控制评估模块可以将车道变更情景建模为包括表示自主车辆9100的时空位置、相应的周边车辆9300、9400的时空位置、以及对应的堵塞概率的状态。车道变更特定情景操作控制评估模块可以将车道变更情景建模为包括诸如“维持”、“加速”、“减速”和“继续行进”(变更车道)之类的动作。车道变更特定情景操作控制评估模块可以将车道变更情景建模为包括状态转换概率,所述状态转换概率表示相应的周边车辆9300、9400进入自主车辆9100的预期路径9110、9120的概率。例如,第一周边车辆9300可以通过以小于自主车辆9100速度的速度穿越第一周边车辆9300的可替代的预期路径9320来进入自主车辆9100的可替代的预期路径9120。在另一示例中,第二周边车辆9400可以通过以大于自主车辆9100速度的速度穿越第二周边车辆9400的预期路径9410来进入自主车辆9100的可替代的预期路径9120。可以基于操作环境信息确定所述状态转换概率。车道变更特定情景操作控制评估模块可以将车道变更情景建模为:包括违反交通控制规则的负值奖励,并且包括完成所述车道变更情景的正值奖励。
在一个或多个时间位置处,例如在每个时间位置处,相应的车道变更特定情景操作控制评估模块示例可以接收或以其他方式访问对应于相应的车道变更情景的操作环境信息。例如,第二车道变更特定情景操作控制评估模块示例可以接收与第二车道变更情景相对应的操作环境信息,所述操作环境信息可以包括接近第二周边车辆9400的预期路径9410和自主车辆9100的可替代的预期路径9120之间的会聚点的车辆交通运输网的区域或部分的可用性信息的概率。
在一个或多个时间位置处,例如在每个时间位置处,每个实例化的车道变更特定情景操作控制评估模块示例可以基于相应的被建模的情景和对应的操作环境信息而生成相应的候选的车辆控制动作,诸如“维持”、“加速”、“减速”或“继续行进”之类的动作;并且每个实例化的车道变更特定情景操作控制评估模块示例可以将所述相应的候选的车辆控制动作输出到自主车辆操作管理控制器,例如通过将相应的候选的车辆控制动作发送到自主车辆操作管理控制器,或者存储所述相应的候选的车辆控制动作以供自主车辆操作管理控制器访问。
在一个或多个时间位置处,例如在每个时间位置,自主车辆操作管理控制器可以接收来自于相应的实例化的车道变更特定情景操作控制评估模块示例的候选的车辆控制动作,并且可以基于所接收的候选的车辆控制动作来识别车辆控制动作以在对应的时间位置处控制自主车辆9100,并且可以根据所识别的车辆控制动作来控制自主车辆9100穿越车辆交通运输网或车辆交通运输网的一部分。
在一个或多个时间位置处,例如在每个时间位置处,自主车辆操作管理控制器可以确定所检测到的车道变更情景中的一个或多个是否已经过期,并且响应于确定一车道变更情景已经过期,可以不将对应的车道变更特定情景操作控制评估模块示例进行实例化。
已经描述了上述各个方面、示例和实现方式,以便容易理解非限制性的本公开的内容。相反,本公开涵盖被包括在所附权利要求范围内的各种修改和等同布置,所附权利要求范围应被赋予最广泛的解释,以包含法律允许的所有这样的修改和等同结构。