CN113619604A - 自动驾驶汽车的集成式决控方法、装置及存储介质 - Google Patents

自动驾驶汽车的集成式决控方法、装置及存储介质 Download PDF

Info

Publication number
CN113619604A
CN113619604A CN202110990262.7A CN202110990262A CN113619604A CN 113619604 A CN113619604 A CN 113619604A CN 202110990262 A CN202110990262 A CN 202110990262A CN 113619604 A CN113619604 A CN 113619604A
Authority
CN
China
Prior art keywords
model
path
optimal
ego
road
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110990262.7A
Other languages
English (en)
Other versions
CN113619604B (zh
Inventor
李升波
关阳
任彦刚
余冬杰
成波
陈建宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tsinghua University
Original Assignee
Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tsinghua University filed Critical Tsinghua University
Priority to CN202110990262.7A priority Critical patent/CN113619604B/zh
Publication of CN113619604A publication Critical patent/CN113619604A/zh
Application granted granted Critical
Publication of CN113619604B publication Critical patent/CN113619604B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W60/00Drive control systems specially adapted for autonomous road vehicles
    • B60W60/001Planning or execution of driving tasks
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W50/00Details of control systems for road vehicle drive control not related to the control of a particular sub-unit, e.g. process diagnostic or vehicle driver interfaces
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W50/00Details of control systems for road vehicle drive control not related to the control of a particular sub-unit, e.g. process diagnostic or vehicle driver interfaces
    • B60W2050/0001Details of the control system
    • B60W2050/0019Control system elements or transfer functions
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Automation & Control Theory (AREA)
  • Human Computer Interaction (AREA)
  • Transportation (AREA)
  • Mechanical Engineering (AREA)
  • Traffic Control Systems (AREA)

Abstract

本公开提供的自动驾驶汽车的集成式决控方法、装置及存储介质,本公开包括:根据交通驾驶场景的静态信息构造候选路径集合,对候选路径集合中每一条候选路径考虑交通驾驶场景的动态信息构建路径跟踪模型,在此基础上进一步构造路径优选模型;将路径跟踪模型和路径优选模型分别转化为决控策略求解模型和评价函数求解模型,通过离线方式求解决控策略求解模型和评价函数求解模型,得到最优决控策略和最优评价函数;从自动驾驶汽车出发时刻开始,每一时刻利用最优评价函数选择最优路径,然后使用最优决控策略确定自动驾驶汽车的最优动作,直至到达全局路径终点。本公开的可扩展性强且在线计算效率高。

Description

自动驾驶汽车的集成式决控方法、装置及存储介质
技术领域
本公开属于自动驾驶汽车的自主决控技术领域,特别涉及自动驾驶汽车的集成式决控 方法、装置及存储介质。
背景技术
汽车智能驾驶系统在提高安全性、降低油耗、提高交通效率等方面有巨大潜力。高水 平的智能驾驶依赖于决策和控制的实时性。
现有的车辆决策方法,主要进行运动预测、行为选择和轨迹规划等,分别运算后,最 终得到一条可行轨迹。然而,该方法在处理大规模动态避障任务时无法保证实时性。
现有的车辆控制方法,仅使用车辆决策阶段给出的光滑且符合动力学约束的轨迹进行 跟踪,以得到车辆期望方向盘转角和期望加速度,但该方法未能体现车辆智能性,即不具 有与周围交通参与者的交互避障能力以及对轨迹的选择能力。
发明内容
本公开旨在解决上述问题之一。
为此,本公开的实施例提供的一种可扩展性强且在线计算效率高的自动驾驶汽车的集 成式决控方法,包括:
本公开第一方面实施例提到的自动驾驶汽车的集成式决控方法,包括:
根据交通驾驶场景的静态信息构造候选路径集合,对所述候选路径集合中每一条候选路 径考虑交通驾驶场景的动态信息构建路径跟踪模型,在此基础上进一步构造路径优选模型;
将所述路径跟踪模型和所述路径优选模型分别转化为决控策略求解模型和评价函数 求解模型,通过离线方式求解所述决控策略求解模型和所述评价函数求解模型,得到最优 决控策略和最优评价函数;
从自动驾驶汽车出发时刻开始,每一时刻利用所述最优评价函数选择最优路径,然后 使用所述最优决控策略确定自动驾驶汽车的最优动作,直至到达全局路径终点。
本公开方法的特点及有益效果:
本公开实施例提供的自动驾驶汽车的集成式决控方法,区别于现有的自动驾驶分层式 决控方案,本公开方法集成了决策和控制两个功能模块,形成了静态路径规划和动态优选 跟踪两个设计阶段,从而避免了现有分层式决控方案计算效率低,可扩展性差的问题,具 体地:本公开第一个阶段仅考虑静态交通信息规划候选路径集合;本公开在第二个阶段则 考虑动态交通参与者构造带约束跟踪问题,并离线求解得到决控策略和评价函数,在线应 用时使用评价函数得到最优路径,然后使用决控策略跟踪所选路径。
由于静态路径规划时不考虑动态障碍物,因此该模块计算效率高,实时性好;动态优 选跟踪时将路径优选和跟踪带来的优化计算负担通过离线求解在线应用的手段消除。因此 本公开方法具有决控智能性好、在线计算效率高的优点。另外,对于不同的交通场景,静 态路径规划模块可按道路拓扑规划出相应的候选路径集合,而动态优选跟踪模块则构建得 到形式相同的问题,因此本公开方法具备良好的可扩展性。
在一些实施例中,所述交通驾驶场景的静态信息包括道路结构、限速、路面标识和交 通法规;所述交通驾驶场景的动态信息包括自动驾驶汽车动力学、周围交通参与者和交通 信号灯信息。
在一些实施例中,所述候选路径集合为Π,其表达式为:
Figure BDA0003232058860000021
其中,τi为对将可通行车道Li的车道中心线作为的候选路径经过离散化后得到的离散候选 路径,i∈{1,Nlane},Nlane为自动驾驶汽车可通行的车道数量;
Figure BDA0003232058860000022
为对候离散选路径τi设定的期望速度。
在一些实施例中,所述路径跟踪模型为:
Figure BDA0003232058860000023
xego,k+1=Fego(xego,k,uk) (3)
xsurr,k+1=Fsurr(xego,k,xsurr,k) (4)
xroad,k=Froad(xego,k) (5)
h(xego,k,xsurr,k)≥Dsafe (6)
h(xego,k,xroad,k)≥Dsafe (7)
其中:
式(2)为第i条离散候选路径τi对应的路径跟踪模型的目标函数;
Figure BDA0003232058860000024
为第i条离散候选路 径τi对应的路径跟踪模型的最优目标函数;Ji为第i条离散候选路径τi对应的路径跟踪模型 的目标函数;Np为预测总步数,取值范围为[1,∞);k∈{0,…,Np-1};
Figure BDA0003232058860000025
为第i条离散 候选路径τi的状态,即
Figure BDA0003232058860000031
xego,k为第k步的自动驾驶汽车状态,其中包括 自动驾驶汽车的位置坐标、纵向速度、横向速度、方向角、横摆角速度,长度和宽度;xsurr,k为第k步的周围交通参与者状态,包括周围机动车、周围非机动车和周围行人;xroad,k为 第k步的道路与环境状态,包括自动驾驶汽车距车道边缘的距离和车道限速;uk为第k步的 自动驾驶汽车决控参数,包括自动驾驶汽车的期望加速度与方向盘转角或自动驾驶汽车的 期望轨迹;l为效用函数,包含自动驾驶汽车的位置跟踪误差、速度跟踪误差和控制能量损 耗,用于计算每一时间步下的代价;
式(3)为自动驾驶汽车的动力学模型;Fego(·)为第一非线性映射,反映了自动驾驶汽车 从第k步状态到k+1步状态的转移关系;
式(4)为周围交通参与者的运动学模型;Fsurr(·)为第二非线性映射,反映了周围交通 参与者从第k步状态到第k+1步状态的转移关系;
式(5)为道路与环境模型;Froad(·)为第三非线性映射,反映了第k步道路与环境信息 与第k步自动驾驶汽车状态的关联;
式(6)为自动驾驶汽车与周围交通参与者的安全约束;h(·)为第四非线性映射;Dsafe为 设定的自动驾驶汽车与周围交通参与者间的安全距离;
式(7)为自动驾驶汽车与道路的安全约束。
在一些实施例中,设定所述路径优选模型的目标函数为:
Figure BDA0003232058860000032
在一些实施例中,所述决控策略求解模型为:
Figure BDA0003232058860000033
xego,k+1=Fego(xego,k,uk) (10)
xsurr,k+1=Fsurr(xego,k,xsurr,k) (11)
xroad,k=Froad(xego,k) (12)
uk=πθ(sk) (13)
h(xego,k,xsurr,k)≥Dsafe (14)
h(xego,k,xroad,k)≥Dsafe (15)
其中:
式(9)为所述求解决控策略模型的目标函数;θ为策略参数;
Figure BDA0003232058860000034
表示初始状态s0分布 下的期望性能,所述初始状态分布为不同离散候选路径、自动驾驶汽车状态、周围交通参 与者状态和道路状态的联合分布;uk为自动驾驶汽车决控参数;sk为第k步的自动驾驶汽 车决控策略状态的输入,
Figure BDA0003232058860000041
式(10)、(11)和(12)分别为自动驾驶汽车的动力学模型、周围交通参与者的运动学模 型和道路与环境模型;
式(13)为使用决控策略πθ(·)得到的自动驾驶汽车决控参数uk;决控策略πθ(·)为使用 策略参数θ参数化的第五非线性映射,反映了第k步的自动驾驶汽车决控参数uk与自动驾驶 汽车状态xego,k的关联;
式(14)和(15)分别为自动驾驶汽车与周围交通参与者的安全约束和自动驾驶汽车与道 路的安全约束。
在一些实施例中,所述评价函数求解模型为:
Figure BDA0003232058860000042
xego,k+1=Fego(xego,k,uk) (17)
xsurr,k+1=Fsurr(xego,k,xsurr,k) (18)
xroad,k=Froad(xego,k) (19)
uk=πθ(sk) (20)
其中:
式(16)为所述评价函数求解模型的目标函数,w为评价函数Vw(·)参数,评价函数Vw(·) 为使用w参数化的第六非线性映射,反映了从当前状态到目标函数的关联;式(17)、(18)、 (19)和(20)分别为自动驾驶汽车的动力学模型、周围交通参与者的运动学模型、道路与环 境模型和使用决控策略πθ(·)得到自动驾驶汽车决控参数uk
在一些实施例中,通过下式选择所述最优路径:
Figure BDA0003232058860000043
其中,Iopt为所述最优路径;
Figure BDA0003232058860000046
为所述最优评价函数;si为离散候选路径对应的状态向 量,
Figure BDA0003232058860000044
通过下式确定所述最优动作:
Figure BDA0003232058860000045
其中,u为所述最优动作;
Figure BDA0003232058860000051
为所述最优决控策略;
Figure BDA0003232058860000053
为最优路径Iopt对应的状 态向量,
Figure BDA0003232058860000052
为最优路径的状态。
本公开第二方面实施例提供的自动驾驶汽车的集成式决控装置,包括:
模型构建模块,用于根据交通驾驶场景静态信息构造候选路径集合,对所述候选路径 集合中每一条候选路径考虑交通驾驶场景动态信息构建路径跟踪模型,在此基础上进一步 构造路径优选模型;
离线求解模块,用于将所述路径跟踪模型和所述路径优选模型分别转化为决控策略求 解模型和评价函数求解模型,通过离线方式求解所述决控策略求解模型和所述评价函数求 解模型,得到最优决控策略和最优评价函数;和
在线应用模块,用于从自动驾驶汽车出发时刻开始,每一时刻利用所述最优评价函数 选择最优路径,然后使用所述最优决控策略确定自动驾驶汽车的最优动作,直至到达全局 路径终点。
本公开第三方面实施例提供的计算机可读存储介质,所述计算机可读存储介质存储计 算机指令,所述计算机指令用于使所述计算机执行上述自动驾驶汽车的集成式决控方法。
附图说明
图1是本公开第一方面实施例提供的自动驾驶汽车的集成式决控方法的整体流程图;
图2的(a)和(b)分别是本发明实施例方法生成的静态路径和期望速度;
图3是本公开第二方面实施例提供的自动驾驶汽车的集成式决控装置的结构框图;
图4是本公开第三方面实施例提供的电子设备的结构框图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本 申请进行进一步详细描述。应当理解,此处所描述的具体实施例仅用于解释本申请,并不 用于限定本申请。
相反,本申请涵盖任何由权利要定义的在本申请精髓和范围上做的替代、修改、等效 方法以及方案。进一步,为了使公众对本申请有更好的了解,在下文对本发明的细节描述 中,详尽描述了一些特定的细节部分。对本领域技术人员来说没有这些细节部分的描述也 可以完全理解本申请。
本公开第一方面实施例提供的自动驾驶汽车的集成式决控方法,参见图1,包括:
根据交通驾驶场景的静态信息构造候选路径集合,对候选路径集合中每一条候选路径 考虑交通驾驶场景的动态信息构建路径跟踪模型,在此基础上进一步构造路径优选模型;
将得到的路径跟踪模型和路径优选模型分别转化为决控策略求解模型和评价函数求 解模型,通过离线方式求解决控策略求解模型和评价函数求解模型,得到最优决控策略和 最优评价函数;
从自动驾驶汽车出发时刻开始,每一时刻利用得到的最优评价函数选择最优路径,然 后使用最优决控策略确定自动驾驶汽车的最优动作,直至到达全局路径终点。
在一些实施例中,候选路径集合通过以下步骤构建:
根据含车道线信息的地图,采用道路结构、限速、路面标识、交通法规等交通驾驶场 景的静态信息,结合人工驾驶习惯制定局部候选路径集合,参见图2中(a)。考虑地图中所有车道,排除限行车道,如当前时间段限行车道,特定功能车道等,对每一条可通行车 道Li,i∈{1,Nlane},其中Nlane为当前时段可通行的车道数量,定义可通行车道Li的车道中 心线为候选路径,并将其离散化为N个路径点,本公开采用的离散化方法包括等间距离散 化与等时距离散化。将离散化后的候选路径记为τi。参见图2中(b),为每一条离散候选 路径τi设定对应的期望速度
Figure BDA0003232058860000061
可通过车道限速或车道限速的百分位数设定。定义候 选路径的集合为Π,其表达式为:
Figure BDA0003232058860000062
在一些实施例中,路径跟踪模型通过以下步骤构建:
结合自动驾驶汽车动力学、周围交通参与者、交通信号灯等动态信息,以自动驾驶汽 车动力学模型以及自车和交通驾驶场景的动态信息之间的状态关联为约束,对每条离散候 选路径τi构建路径跟踪模型,数学表达式为:
Figure BDA0003232058860000063
xego,k+1=Fego(xego,k,uk) (3)
xsurr,k+1=Fsurr(xego,k,xsurr,k) (4)
xroad,k=Froad(xego,k) (5)
h(xego,k,xsurr,k)≥Dsafe (6)
h(xego,k,xroad,k)≥Dsafe (7)
其中:
式(2)为第i条离散候选路径τi对应的路径跟踪模型的目标函数,其中
Figure BDA0003232058860000064
为第i条离散候 选路径τi对应的路径跟踪模型的最优目标函数;Ji为第i条离散候选路径τi对应的路径跟踪 模型的目标函数;Np为预测总步数,取值范围为[1,∞);k∈{0,…,Np-1};
Figure BDA0003232058860000065
为第i条 离散候选路径τi的状态,即
Figure BDA0003232058860000071
xego,k为第k步的自动驾驶汽车状态,其中包括自动驾驶汽车的位置坐标、纵向速度、横向速度、方向角、横摆角速度,长度和宽度 等信息;xsurr,k为第k步的周围交通参与者状态,包括周围机动车、周围非机动车和周围行 人等状态;xroad,k为第k步的道路与环境状态,包括自动驾驶汽车距车道边缘的距离和车 道限速等信息;uk为第k步的自动驾驶汽车决控参数,是用于控制车辆动作的参数,自动 驾驶汽车决策参数包括自动驾驶汽车的期望加速度与方向盘转角或自动驾驶汽车的期望 轨迹等;l为效用函数,其中包含自动驾驶汽车的位置跟踪误差、速度跟踪误差和控制能量 损耗等,用于计算每一时间步下的代价。
式(3)为自动驾驶汽车的动力学模型,其中Fego(·)为第一非线性映射,通常由自动驾驶 汽车的二自由度模型和轮胎模型共同决定,反映了自动驾驶汽车从第k步状态到k+1步状 态的转移关系。
式(4)为周围交通参与者的运动学模型,其中Fsurr(·)为第二非线性映射,如使用深度 神经网络拟合得到的模型,反映了周围交通参与者从第k步状态到第k+1步状态的转移关 系。
式(5)为道路与环境模型,其中Froad(·)为第三非线性映射,如使用深度神经网络拟合 得到的模型,反映了第k步道路与环境信息与第k步自动驾驶汽车状态的关联。
式(6)为自动驾驶汽车与周围交通参与者的安全约束,h(·)为第四非线性映射,通常为 自车与交通参与者的距离;Dsafe为设定的自动驾驶汽车与周围交通参与者间的安全距离。 安全距离计算方法主要有:(a)自动驾驶汽车形心与周围交通参与者形心的距离;(b)多 圆覆盖法,即使用多个圆分别将自动驾驶汽车与周围交通参与者覆盖,然后分别约束自动 驾驶汽车多个圆的圆心与周围交通参与者的圆心之间的距离。
式(7)为自动驾驶汽车与道路的安全约束。
在一些实施例中,路径优选模型通过以下步骤构建:
根据构建的路径跟踪模型,设定路径优选模型的目标函数为:
Figure BDA0003232058860000072
路径优选模型的约束条件与路径跟踪模型的约束条件相同。路径优选模型考虑分别求 解minJ1,minJ2,…,
Figure BDA0003232058860000073
然后对比最小的最优解,作为参考路径的选择结果。
在一些实施例中,通过以下步骤将得到的路径跟踪模型转化为决控策略求解模型:
引入决控策略πθ(·),为使用策略参数θ参数化的第五非线性映射,其通常为一深度神 经网络,θ为深度神经网络中的参数,反映了第k步的自动驾驶汽车决控参数uk与自动驾驶 汽车状态xego,k的关联。构造第k步的自动驾驶汽车决控策略状态的输入为sk,其由i条候选 路径τi的状态
Figure BDA0003232058860000074
第k步的自动驾驶汽车状态xego,k、周围交通参与者状 态xsurr,k,道路与环境状态xroad,k构造得到,具体地,
Figure BDA0003232058860000081
转化后的决控策略求解模型如下:
Figure BDA0003232058860000082
xego,k+1=Fego(xego,k,uk) (10)
xsurr,k+1=Fsurr(xego,k,xsurr,k) (11)
xroad,k=Froad(xego,k) (12)
uk=πθ(sk) (13)
h(xego,k,xsurr,k)≥Dsafe (14)
h(xego,k,xroad,k)≥Dsafe (15)
其中:
式(9)为求解决控策略模型的目标函数,优化变量为策略参数θ。
Figure BDA0003232058860000083
表示初始状态分 布下的期望性能,该初始状态分布为不同候选路径、自动驾驶汽车状态、周围交通参与者 状态和道路状态的联合分布,具体地,
Figure BDA0003232058860000084
为不同初始状态s0下{·}的平均性能,即由初 始状态分布采样一定数量的初始状态s0,分别计算相应的{·},最后计算平均所得。
式(10)(11)(12)同式(3)(4)(5)。
式(13)为使用决控策略πθ(·)得到自动驾驶汽车决控参数uk
式(14)(15)同式(6)(7)。
在一些实施例中,通过以下步骤将得到的路径优选模型转化为评价函数求解模型:
引入评价函数Vw(·),其为使用w参数化的第六非线性映射,其通常为一深度神经网络, w为深度神经网络中的参数,该深度神经网络的输入与决控策略输入相同,反映了从当前 状态到目标函数Ji的关联。转化后的评价函数求解模型如下:
Figure BDA0003232058860000085
xego,k+1=Fego(xego,k,uk) (17)
xsurr,k+1=Fsurr(xego,k,xsurr,k) (18)
xroad,k=Froad(xego,k) (19)
uk=πθ(sk) (20)
其中:
式(16)为评价函数求解模型的目标函数,优化变量为评价函数参数w。
式(17)(18)(19)(20)同式(3)(4)(5)(13)。
在一些实施例中,通过离线方式求解决控策略求解模型和评价函数求解模型,得到最 优决控策略和最优评价函数,具体包括以下步骤:
求解上述公式(9)~公式(15)所示决控策略求解模型与公式(16)~公式(20)所示评价函数求解模型,输出最优决控策略
Figure BDA0003232058860000091
与最优评价函数
Figure BDA0003232058860000092
在一些实施例中,从自动驾驶汽车出发时刻开始,每一时刻利用得到的最优评价函数 选择最优路径,然后使用最优决控策略确定自动驾驶汽车的最优动作,直至到达全局路径 终点,具体包括以下步骤:
车辆出发时刻,给定自动驾驶汽车全局路径、自动驾驶汽车状态xego、周围交通参与 者状态xsurr和道路与环境状态xroad
3-1)最优路径选择:按照公式(21)构造各离散候选路径对应的状态向量si,i=1,…,Nlane
Figure BDA0003232058860000093
使用得到的最优评价函数
Figure BDA0003232058860000094
按照公式(22)选择具有最小值的路径作为最优路径 Iopt
Figure BDA0003232058860000095
3-2)最优路径跟踪:获取最优路径下的状态向量
Figure BDA0003232058860000096
Figure BDA0003232058860000097
其中,
Figure BDA0003232058860000098
为最优路径的状态;
使用得到的最优决控策略
Figure BDA0003232058860000099
使用公式(24)计算自动驾驶汽车当前状态下的最优动 作u:
Figure BDA00032320588600000910
自动驾驶汽车执行最优动作u,计算得到的自动驾驶汽车控制量,通常包括自车期望 加速度与自车期望方向盘转角,获取下一时刻的自动驾驶汽车状态和周车状态。
3-3)不断执行步骤3-1)~3-2),直到自动驾驶汽车达到全局路径终点,本方法结束。
本公开实施例提出的动驾驶汽车的集成式决控装置,参见图3,包括:
模型构建模块,用于根据交通驾驶场景静态信息构造候选路径集合,对候选路径集合 中每一条候选路径考虑交通驾驶场景动态信息构建路径跟踪模型,在此基础上进一步构造 路径优选模型;
离线求解模块,用于将模型构建模块得到的路径跟踪模型和路径优选模型分别转化为 决控策略求解模型和评价函数求解模型,通过离线方式求解决控策略求解模型和评价函数 求解模型,得到最优决控策略和最优评价函数;和
在线应用模块,用于从自动驾驶汽车出发时刻开始,每一时刻利用得到的最优评价函 数选择最优路径,然后使用最优决控策略确定自动驾驶汽车的最优动作,直至到达全局路 径终点。
为了实现上述实施例,本公开实施例还提出一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行,用于执行上述实施例的自动驾驶汽车静态路径规 划方法。
下面参考图4,其示出了适于用来实现本公开实施例的电子设备100的结构示意图。其中,需要说明的是,该电子设备100中包括自动驾驶汽车的集成式决控系统,其 中,本公开实施例中的电子设备可以包括但不限于诸如移动电话、笔记本电脑、数字 广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放 器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机、 服务器等等的固定终端。图4示出的电子设备仅仅是一个示例,不应对本公开实施例 的功能和使用范围带来任何限制。
如图4所示,电子设备100可以包括处理装置(例如中央处理器、图形处理器等)101,其可以根据存储在只读存储器(ROM)102中的程序或者从存储装置108加载到 随机访问存储器(RAM)103中的程序而执行各种适当的动作和处理。在RAM 103 中,还存储有电子设备100操作所需的各种程序和数据。处理装置101、ROM 102以 及RAM 103通过总线104彼此相连。输入/输出(I/O)接口105也连接至总线104。
通常,以下装置可以连接至I/O接口105:包括例如触摸屏、触摸板、键盘、鼠标、 摄像头、麦克风等的输入装置106;包括例如液晶显示器(LCD)、扬声器、振动器 等的输出装置107;包括例如磁带、硬盘等的存储装置108;以及通信装置109。通信 装置109可以允许电子设备100与其他设备进行无线或有线通信以交换数据。虽然图 4示出了具有各种装置的电子设备100,但是应理解的是,并不要求实施或具备所有示 出的装置。可以替代地实施或具备更多或更少的装置。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本实施例包括一种计算机程序产品,其包括承载在计算机可读介质 上的计算机程序,该计算机程序包含用于执行流程图中所示方法的程序代码。在这样 的实施例中,该计算机程序可以通过通信装置109从网络上被下载和安装,或者从存 储装置108被安装,或者从ROM 102被安装。在该计算机程序被处理装置101执行时, 执行本公开实施例的方法中限定的上述功能。
需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是—— 但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意 以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多 个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器 (ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只 读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在 本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以 被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读 信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机 可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、 光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质 以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由 指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含 的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设 备执行时,使得该电子设备:根据交通驾驶场景静态信息构造候选路径集合,对候选路径 集合中每一条候选路径考虑交通驾驶场景动态信息构建路径跟踪模型,在此基础上进一步 构造路径优选模型;将得到的路径跟踪模型和路径优选模型分别转化为决控策略求解模型 和评价函数求解模型,通过离线方式求解决控策略求解模型和评价函数求解模型,得到最 优决控策略和最优评价函数;从自动驾驶汽车出发时刻开始,每一时刻利用得到的最优评 价函数选择最优路径,然后使用最优决控策略确定自动驾驶汽车的最优动作,直至到达全 局路径终点。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机 程序代码,上述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、 C++、python,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计 语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为 一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在 远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意 种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者, 可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、 “具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、 结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上 述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、 结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外, 在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示 例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对 重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的 特征可以明示或者隐含地包括至少一个该特征。在本申请的描述中,“多个”的含义 是至少两个,例如两个,三个等,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段 或部分,并且本申请的优选实施方式的范围包括另外的实现,其中可以不按所示出或 讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能, 这应被本申请的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中, 以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以 从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系 统、装置或设备而使用。就本说明书而言,“计算机可读介质”可以是任何可以包含、 存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系 统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包 括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置), 随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM 或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机 可读介质甚至可以是可在其上打印程序的纸或其他合适的介质,因为可以例如通过对 纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理 来以电子方式获得程序,然后将其存储在计算机存储器中。
应当理解,本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上 述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行 的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本 领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑 功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可 编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤, 可以通过程序来指令相关的硬件完成,所开发的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本申请各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成 的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。集成的模 块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一 个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本申请的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本申请 的限制,本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、 替换和变型。

Claims (10)

1.一种自动驾驶汽车的集成式决控方法,其特征在于,包括:
根据交通驾驶场景的静态信息构造候选路径集合,对所述候选路径集合中每一条候选路径考虑交通驾驶场景的动态信息构建路径跟踪模型,在此基础上进一步构造路径优选模型;
将所述路径跟踪模型和所述路径优选模型分别转化为决控策略求解模型和评价函数求解模型,通过离线方式求解所述决控策略求解模型和所述评价函数求解模型,得到最优决控策略和最优评价函数;
从自动驾驶汽车出发时刻开始,每一时刻利用所述最优评价函数选择最优路径,然后使用所述最优决控策略确定自动驾驶汽车的最优动作,直至到达全局路径终点。
2.根据权利要求1所述的集成式决控方法,其特征在于,所述交通驾驶场景的静态信息包括道路结构、限速、路面标识和交通法规;所述交通驾驶场景的动态信息包括自动驾驶汽车动力学、周围交通参与者和交通信号灯信息。
3.根据权利要求1所述的集成式决控方法,其特征在于,所述候选路径集合为Π,其表达式为:
Figure FDA0003232058850000011
其中,τi为对将可通行车道Li的车道中心线作为的候选路径经过离散化后得到的离散候选路径,i∈{1,Nlane},Nlane为自动驾驶汽车可通行的车道数量;
Figure FDA0003232058850000012
为对候离散选路径τi设定的期望速度。
4.根据权利要求3所述的集成式决控方法,其特征在于,所述路径跟踪模型为:
Figure FDA0003232058850000013
xego,k+1=Fego(xego,k,uk) (3)
xsurr,k+1=Fsurr(xego,k,xsurr,k) (4)
xroad,k=Froad(xego,k) (5)
h(xego,k,xsurr,k)≥Dsafe (6)
h(xego,k,xroad,k)≥Dsafe (7)
其中:
式(2)为第i条离散候选路径τi对应的路径跟踪模型的目标函数;
Figure FDA0003232058850000014
为第i条离散候选路径τi对应的路径跟踪模型的最优目标函数;Ji为第i条离散候选路径τi对应的路径跟踪模型的目标函数;Np为预测总步数,取值范围为[1,∞);k∈{0,...,Np-1};
Figure FDA0003232058850000021
为第i条离散候选路径τi的状态,即
Figure FDA0003232058850000022
xego,k为第k步的自动驾驶汽车状态,其中包括自动驾驶汽车的位置坐标、纵向速度、横向速度、方向角、横摆角速度,长度和宽度;xsurr,k为第k步的周围交通参与者状态,包括周围机动车、周围非机动车和周围行人;xroad,k为第k步的道路与环境状态,包括自动驾驶汽车距车道边缘的距离和车道限速;uk为第k步的自动驾驶汽车决控参数,包括自动驾驶汽车的期望加速度与方向盘转角或自动驾驶汽车的期望轨迹;l为效用函数,包含自动驾驶汽车的位置跟踪误差、速度跟踪误差和控制能量损耗,用于计算每一时间步下的代价;
式(3)为自动驾驶汽车的动力学模型;Fego(·)为第一非线性映射,反映了自动驾驶汽车从第k步状态到k+1步状态的转移关系;
式(4)为周围交通参与者的运动学模型;Fsurr(·)为第二非线性映射,反映了周围交通参与者从第k步状态到第k+1步状态的转移关系;
式(5)为道路与环境模型;Froad(·)为第三非线性映射,反映了第k步道路与环境信息与第k步自动驾驶汽车状态的关联;
式(6)为自动驾驶汽车与周围交通参与者的安全约束;h(·)为第四非线性映射;Dsafe为设定的自动驾驶汽车与周围交通参与者间的安全距离;
式(7)为自动驾驶汽车与道路的安全约束。
5.根据权利要求4所述的集成式决控方法,其特征在于,设定所述路径优选模型的目标函数为:
Figure FDA0003232058850000023
6.根据权利要求5所述的集成式决控方法,其特征在于,所述决控策略求解模型为:
Figure FDA0003232058850000024
xego,k+1=Fego(xego,k,uk) (10)
xsurr,k+1=Fsurr(xego,k,xsurr,k) (11)
xroad,k=Froad(xego,k) (12)
uk=πθ(sk) (13)
h(xego,k,xsurr,k)≥Dsafe (14)
h(xego,k,xroad,k)≥Dsafe (15)
其中:
式(9)为所述求解决控策略模型的目标函数;θ为策略参数;
Figure FDA0003232058850000031
表示初始状态s0分布下的期望性能,所述初始状态分布为不同离散候选路径、自动驾驶汽车状态、周围交通参与者状态和道路状态的联合分布;uk为自动驾驶汽车决控参数;sk为第k步的自动驾驶汽车决控策略状态的输入,
Figure FDA0003232058850000032
式(10)、(11)和(12)分别为自动驾驶汽车的动力学模型、周围交通参与者的运动学模型和道路与环境模型;
式(13)为使用决控策略πθ(·)得到的自动驾驶汽车决控参数uk;决控策略πθ(·)为使用策略参数θ参数化的第五非线性映射,反映了第k步的自动驾驶汽车决控参数uk与自动驾驶汽车状态xego,k的关联;
式(14)和(15)分别为自动驾驶汽车与周围交通参与者的安全约束和自动驾驶汽车与道路的安全约束。
7.根据权利要求6所述的集成式决控方法,其特征在于,所述评价函数求解模型为:
Figure FDA0003232058850000033
xego,k+1=Fego(xego,k,uk) (17)
xsurr,k+1=Fsurr(xego,k,xsurr,k) (18)
xroad,k=Froad(xego,k) (19)
uk=πθ(sk) (20)
其中:
式(16)为所述评价函数求解模型的目标函数,w为评价函数Vw(·)参数,评价函数Vw(·)为使用w参数化的第六非线性映射,反映了从当前状态到目标函数的关联;式(17)、(18)、(19)和(20)分别为自动驾驶汽车的动力学模型、周围交通参与者的运动学模型、道路与环境模型和使用决控策略πθ(·)得到自动驾驶汽车决控参数uk
8.根据权利要求7所述的集成式决控方法,其特征在于,通过下式选择所述最优路径:
Figure FDA0003232058850000034
其中,Iopt为所述最优路径;
Figure FDA0003232058850000035
为所述最优评价函数;si为离散候选路径对应的状态向量,
Figure FDA0003232058850000041
通过下式确定所述最优动作:
Figure FDA0003232058850000042
其中,u为所述最优动作;
Figure FDA0003232058850000045
为所述最优决控策略;
Figure FDA0003232058850000046
为最优路径Iopt对应的状态向量,
Figure FDA0003232058850000043
Figure FDA0003232058850000044
为最优路径的状态。
9.一种自动驾驶汽车的集成式决控装置,其特征在于,包括:
模型构建模块,用于根据交通驾驶场景静态信息构造候选路径集合,对所述候选路径集合中每一条候选路径考虑交通驾驶场景动态信息构建路径跟踪模型,在此基础上进一步构造路径优选模型;
离线求解模块,用于将所述路径跟踪模型和所述路径优选模型分别转化为决控策略求解模型和评价函数求解模型,通过离线方式求解所述决控策略求解模型和所述评价函数求解模型,得到最优决控策略和最优评价函数;和
在线应用模块,用于从自动驾驶汽车出发时刻开始,每一时刻利用所述最优评价函数选择最优路径,然后使用所述最优决控策略确定自动驾驶汽车的最优动作,直至到达全局路径终点。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储计算机指令,所述计算机指令用于使所述计算机执行权利要求1-8中任一项所述的自动驾驶汽车的集成式决控方法。
CN202110990262.7A 2021-08-26 2021-08-26 自动驾驶汽车的集成式决控方法、装置及存储介质 Active CN113619604B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110990262.7A CN113619604B (zh) 2021-08-26 2021-08-26 自动驾驶汽车的集成式决控方法、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110990262.7A CN113619604B (zh) 2021-08-26 2021-08-26 自动驾驶汽车的集成式决控方法、装置及存储介质

Publications (2)

Publication Number Publication Date
CN113619604A true CN113619604A (zh) 2021-11-09
CN113619604B CN113619604B (zh) 2023-08-15

Family

ID=78387937

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110990262.7A Active CN113619604B (zh) 2021-08-26 2021-08-26 自动驾驶汽车的集成式决控方法、装置及存储介质

Country Status (1)

Country Link
CN (1) CN113619604B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114750750A (zh) * 2022-04-28 2022-07-15 南阳理工学院 一种自动泊车的最优跟踪控制方法、系统、设备和介质
CN115456392A (zh) * 2022-09-06 2022-12-09 长安大学 一种高速多车多驾驶行为冲突协同决策方法及装置

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108919795A (zh) * 2018-06-01 2018-11-30 中国北方车辆研究所 一种自动驾驶汽车换道决策方法及装置
CN110187639A (zh) * 2019-06-27 2019-08-30 吉林大学 一种基于参数决策框架的轨迹规划控制方法
CN110398969A (zh) * 2019-08-01 2019-11-01 北京主线科技有限公司 自动驾驶车辆自适应预测时域转向控制方法及装置
CN110989577A (zh) * 2019-11-15 2020-04-10 深圳先进技术研究院 自动驾驶决策方法及车辆的自动驾驶装置
CN111273668A (zh) * 2020-02-18 2020-06-12 福州大学 针对结构化道路的无人驾驶汽车运动轨迹规划系统及方法
CN111413966A (zh) * 2020-03-12 2020-07-14 天津大学 一种递进式模型预测无人驾驶规划跟踪协同控制方法
CN111845773A (zh) * 2020-07-06 2020-10-30 北京邮电大学 基于强化学习的自动驾驶车辆微观决策方法
CN112068445A (zh) * 2020-09-23 2020-12-11 北京理工大学 自动驾驶车辆路径规划与路径跟踪集成控制方法及系统
CN112578672A (zh) * 2020-12-16 2021-03-30 吉林大学青岛汽车研究院 基于底盘非线性的无人驾驶汽车轨迹控制系统及其轨迹控制方法
WO2021073079A1 (zh) * 2019-10-17 2021-04-22 南京航空航天大学 一种自动驾驶车辆路径与速度高度耦合的轨迹规划方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108919795A (zh) * 2018-06-01 2018-11-30 中国北方车辆研究所 一种自动驾驶汽车换道决策方法及装置
CN110187639A (zh) * 2019-06-27 2019-08-30 吉林大学 一种基于参数决策框架的轨迹规划控制方法
CN110398969A (zh) * 2019-08-01 2019-11-01 北京主线科技有限公司 自动驾驶车辆自适应预测时域转向控制方法及装置
WO2021073079A1 (zh) * 2019-10-17 2021-04-22 南京航空航天大学 一种自动驾驶车辆路径与速度高度耦合的轨迹规划方法
CN110989577A (zh) * 2019-11-15 2020-04-10 深圳先进技术研究院 自动驾驶决策方法及车辆的自动驾驶装置
CN111273668A (zh) * 2020-02-18 2020-06-12 福州大学 针对结构化道路的无人驾驶汽车运动轨迹规划系统及方法
CN111413966A (zh) * 2020-03-12 2020-07-14 天津大学 一种递进式模型预测无人驾驶规划跟踪协同控制方法
CN111845773A (zh) * 2020-07-06 2020-10-30 北京邮电大学 基于强化学习的自动驾驶车辆微观决策方法
CN112068445A (zh) * 2020-09-23 2020-12-11 北京理工大学 自动驾驶车辆路径规划与路径跟踪集成控制方法及系统
CN112578672A (zh) * 2020-12-16 2021-03-30 吉林大学青岛汽车研究院 基于底盘非线性的无人驾驶汽车轨迹控制系统及其轨迹控制方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114750750A (zh) * 2022-04-28 2022-07-15 南阳理工学院 一种自动泊车的最优跟踪控制方法、系统、设备和介质
CN115456392A (zh) * 2022-09-06 2022-12-09 长安大学 一种高速多车多驾驶行为冲突协同决策方法及装置
CN115456392B (zh) * 2022-09-06 2023-09-05 长安大学 一种高速多车多驾驶行为冲突协同决策方法及装置

Also Published As

Publication number Publication date
CN113619604B (zh) 2023-08-15

Similar Documents

Publication Publication Date Title
US11726477B2 (en) Methods and systems for trajectory forecasting with recurrent neural networks using inertial behavioral rollout
CN112034834B (zh) 使用强化学习来加速自动驾驶车辆的轨迹规划的离线代理
CN111771141B (zh) 自动驾驶车辆中使用3d cnn网络进行解决方案推断的lidar定位
CN112677995B (zh) 一种车辆轨迹规划方法、装置、存储介质及设备
WO2022052406A1 (zh) 一种自动驾驶训练方法、装置、设备及介质
Zheng et al. Bézier curve‐based trajectory planning for autonomous vehicles with collision avoidance
CN110673602B (zh) 一种强化学习模型、车辆自动驾驶决策的方法和车载设备
CN111948938B (zh) 规划用于自动驾驶车辆的开放空间轨迹的松弛优化模型
CN111971574A (zh) 用于自动驾驶车辆的lidar定位的基于深度学习的特征提取
US11307585B2 (en) Introspective competence modeling for AV decision making
CN111771135A (zh) 自动驾驶车辆中使用rnn和lstm进行时间平滑的lidar定位
CN113619604B (zh) 自动驾驶汽车的集成式决控方法、装置及存储介质
CN114212110B (zh) 障碍物轨迹预测方法、装置、电子设备及存储介质
CN110782092A (zh) 无人配送车在非结构化场景中的轨迹规划方法及装置
CN112325898B (zh) 路径规划方法、装置、设备和存储介质
CN115285148B (zh) 自动驾驶车速规划方法、装置、电子设备和存储介质
Chen et al. Target-driven obstacle avoidance algorithm based on DDPG for connected autonomous vehicles
Bertolazzi et al. Efficient re-planning for robotic cars
Reda et al. Path planning algorithms in the autonomous driving system: A comprehensive review
Yu et al. Hierarchical framework integrating rapidly-exploring random tree with deep reinforcement learning for autonomous vehicle
Milanés et al. An approach to driverless vehicles in highways
CN113587950B (zh) 自动驾驶汽车静态路径规划方法、装置及存储介质
Li et al. RDDRL: a recurrent deduction deep reinforcement learning model for multimodal vision-robot navigation
Singh End-to-end autonomous driving using deep learning: A systematic review
CN115810291A (zh) 一种关联目标识别方法、装置、路侧设备及车辆

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant