CN113619604B - 自动驾驶汽车的集成式决控方法、装置及存储介质 - Google Patents

自动驾驶汽车的集成式决控方法、装置及存储介质 Download PDF

Info

Publication number
CN113619604B
CN113619604B CN202110990262.7A CN202110990262A CN113619604B CN 113619604 B CN113619604 B CN 113619604B CN 202110990262 A CN202110990262 A CN 202110990262A CN 113619604 B CN113619604 B CN 113619604B
Authority
CN
China
Prior art keywords
model
path
optimal
automatic driving
ego
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110990262.7A
Other languages
English (en)
Other versions
CN113619604A (zh
Inventor
李升波
关阳
任彦刚
余冬杰
成波
陈建宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tsinghua University
Original Assignee
Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tsinghua University filed Critical Tsinghua University
Priority to CN202110990262.7A priority Critical patent/CN113619604B/zh
Publication of CN113619604A publication Critical patent/CN113619604A/zh
Application granted granted Critical
Publication of CN113619604B publication Critical patent/CN113619604B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W60/00Drive control systems specially adapted for autonomous road vehicles
    • B60W60/001Planning or execution of driving tasks
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W50/00Details of control systems for road vehicle drive control not related to the control of a particular sub-unit, e.g. process diagnostic or vehicle driver interfaces
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W50/00Details of control systems for road vehicle drive control not related to the control of a particular sub-unit, e.g. process diagnostic or vehicle driver interfaces
    • B60W2050/0001Details of the control system
    • B60W2050/0019Control system elements or transfer functions
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Automation & Control Theory (AREA)
  • Human Computer Interaction (AREA)
  • Transportation (AREA)
  • Mechanical Engineering (AREA)
  • Traffic Control Systems (AREA)

Abstract

本公开提供的自动驾驶汽车的集成式决控方法、装置及存储介质,本公开包括:根据交通驾驶场景的静态信息构造候选路径集合,对候选路径集合中每一条候选路径考虑交通驾驶场景的动态信息构建路径跟踪模型,在此基础上进一步构造路径优选模型;将路径跟踪模型和路径优选模型分别转化为决控策略求解模型和评价函数求解模型,通过离线方式求解决控策略求解模型和评价函数求解模型,得到最优决控策略和最优评价函数;从自动驾驶汽车出发时刻开始,每一时刻利用最优评价函数选择最优路径,然后使用最优决控策略确定自动驾驶汽车的最优动作,直至到达全局路径终点。本公开的可扩展性强且在线计算效率高。

Description

自动驾驶汽车的集成式决控方法、装置及存储介质
技术领域
本公开属于自动驾驶汽车的自主决控技术领域,特别涉及自动驾驶汽车的集成式决控 方法、装置及存储介质。
背景技术
汽车智能驾驶系统在提高安全性、降低油耗、提高交通效率等方面有巨大潜力。高水 平的智能驾驶依赖于决策和控制的实时性。
现有的车辆决策方法,主要进行运动预测、行为选择和轨迹规划等,分别运算后,最 终得到一条可行轨迹。然而,该方法在处理大规模动态避障任务时无法保证实时性。
现有的车辆控制方法,仅使用车辆决策阶段给出的光滑且符合动力学约束的轨迹进行 跟踪,以得到车辆期望方向盘转角和期望加速度,但该方法未能体现车辆智能性,即不具 有与周围交通参与者的交互避障能力以及对轨迹的选择能力。
发明内容
本公开旨在解决上述问题之一。
为此,本公开的实施例提供的一种可扩展性强且在线计算效率高的自动驾驶汽车的集 成式决控方法,包括:
本公开第一方面实施例提到的自动驾驶汽车的集成式决控方法,包括:
根据交通驾驶场景的静态信息构造候选路径集合,对所述候选路径集合中每一条候选路 径考虑交通驾驶场景的动态信息构建路径跟踪模型,在此基础上进一步构造路径优选模型;
将所述路径跟踪模型和所述路径优选模型分别转化为决控策略求解模型和评价函数 求解模型,通过离线方式求解所述决控策略求解模型和所述评价函数求解模型,得到最优 决控策略和最优评价函数;
从自动驾驶汽车出发时刻开始,每一时刻利用所述最优评价函数选择最优路径,然后 使用所述最优决控策略确定自动驾驶汽车的最优动作,直至到达全局路径终点。
本公开方法的特点及有益效果:
本公开实施例提供的自动驾驶汽车的集成式决控方法,区别于现有的自动驾驶分层式 决控方案,本公开方法集成了决策和控制两个功能模块,形成了静态路径规划和动态优选 跟踪两个设计阶段,从而避免了现有分层式决控方案计算效率低,可扩展性差的问题,具 体地:本公开第一个阶段仅考虑静态交通信息规划候选路径集合;本公开在第二个阶段则 考虑动态交通参与者构造带约束跟踪问题,并离线求解得到决控策略和评价函数,在线应 用时使用评价函数得到最优路径,然后使用决控策略跟踪所选路径。
由于静态路径规划时不考虑动态障碍物,因此该模块计算效率高,实时性好;动态优 选跟踪时将路径优选和跟踪带来的优化计算负担通过离线求解在线应用的手段消除。因此 本公开方法具有决控智能性好、在线计算效率高的优点。另外,对于不同的交通场景,静 态路径规划模块可按道路拓扑规划出相应的候选路径集合,而动态优选跟踪模块则构建得 到形式相同的问题,因此本公开方法具备良好的可扩展性。
在一些实施例中,所述交通驾驶场景的静态信息包括道路结构、限速、路面标识和交 通法规;所述交通驾驶场景的动态信息包括自动驾驶汽车动力学、周围交通参与者和交通 信号灯信息。
在一些实施例中,所述候选路径集合为Π,其表达式为:
其中,τi为对将可通行车道Li的车道中心线作为的候选路径经过离散化后得到的离散候选 路径,i∈{1,Nlane},Nlane为自动驾驶汽车可通行的车道数量;为对候离散选路径τi设定的期望速度。
在一些实施例中,所述路径跟踪模型为:
xego,k+1=Fego(xego,k,uk) (3)
xsurr,k+1=Fsurr(xego,k,xsurr,k) (4)
xroad,k=Froad(xego,k) (5)
h(xego,k,xsurr,k)≥Dsafe (6)
h(xego,k,xroad,k)≥Dsafe (7)
其中:
式(2)为第i条离散候选路径τi对应的路径跟踪模型的目标函数;为第i条离散候选路 径τi对应的路径跟踪模型的最优目标函数;Ji为第i条离散候选路径τi对应的路径跟踪模型 的目标函数;Np为预测总步数,取值范围为[1,∞);k∈{0,…,Np-1};/>为第i条离散 候选路径τi的状态,即/>xego,k为第k步的自动驾驶汽车状态,其中包括 自动驾驶汽车的位置坐标、纵向速度、横向速度、方向角、横摆角速度,长度和宽度;xsurr,k为第k步的周围交通参与者状态,包括周围机动车、周围非机动车和周围行人;xroad,k为 第k步的道路与环境状态,包括自动驾驶汽车距车道边缘的距离和车道限速;uk为第k步的 自动驾驶汽车决控参数,包括自动驾驶汽车的期望加速度与方向盘转角或自动驾驶汽车的 期望轨迹;l为效用函数,包含自动驾驶汽车的位置跟踪误差、速度跟踪误差和控制能量损 耗,用于计算每一时间步下的代价;
式(3)为自动驾驶汽车的动力学模型;Fego(·)为第一非线性映射,反映了自动驾驶汽车 从第k步状态到k+1步状态的转移关系;
式(4)为周围交通参与者的运动学模型;Fsurr(·)为第二非线性映射,反映了周围交通 参与者从第k步状态到第k+1步状态的转移关系;
式(5)为道路与环境模型;Froad(·)为第三非线性映射,反映了第k步道路与环境信息 与第k步自动驾驶汽车状态的关联;
式(6)为自动驾驶汽车与周围交通参与者的安全约束;h(·)为第四非线性映射;Dsafe为 设定的自动驾驶汽车与周围交通参与者间的安全距离;
式(7)为自动驾驶汽车与道路的安全约束。
在一些实施例中,设定所述路径优选模型的目标函数为:
在一些实施例中,所述决控策略求解模型为:
xego,k+1=Fego(xego,k,uk) (10)
xsurr,k+1=Fsurr(xego,k,xsurr,k) (11)
xroad,k=Froad(xego,k) (12)
uk=πθ(sk) (13)
h(xego,k,xsurr,k)≥Dsafe (14)
h(xego,k,xroad,k)≥Dsafe (15)
其中:
式(9)为所述求解决控策略模型的目标函数;θ为策略参数;表示初始状态s0分布 下的期望性能,所述初始状态分布为不同离散候选路径、自动驾驶汽车状态、周围交通参 与者状态和道路状态的联合分布;uk为自动驾驶汽车决控参数;sk为第k步的自动驾驶汽 车决控策略状态的输入,/>
式(10)、(11)和(12)分别为自动驾驶汽车的动力学模型、周围交通参与者的运动学模 型和道路与环境模型;
式(13)为使用决控策略πθ(·)得到的自动驾驶汽车决控参数uk;决控策略πθ(·)为使用 策略参数θ参数化的第五非线性映射,反映了第k步的自动驾驶汽车决控参数uk与自动驾驶 汽车状态xego,k的关联;
式(14)和(15)分别为自动驾驶汽车与周围交通参与者的安全约束和自动驾驶汽车与道 路的安全约束。
在一些实施例中,所述评价函数求解模型为:
xego,k+1=Fego(xego,k,uk) (17)
xsurr,k+1=Fsurr(xego,k,xsurr,k) (18)
xroad,k=Froad(xego,k) (19)
uk=πθ(sk) (20)
其中:
式(16)为所述评价函数求解模型的目标函数,w为评价函数Vw(·)参数,评价函数Vw(·) 为使用w参数化的第六非线性映射,反映了从当前状态到目标函数的关联;式(17)、(18)、 (19)和(20)分别为自动驾驶汽车的动力学模型、周围交通参与者的运动学模型、道路与环 境模型和使用决控策略πθ(·)得到自动驾驶汽车决控参数uk
在一些实施例中,通过下式选择所述最优路径:
其中,Iopt为所述最优路径;为所述最优评价函数;si为离散候选路径对应的状态向 量,/>
通过下式确定所述最优动作:
其中,u为所述最优动作;为所述最优决控策略;/>为最优路径Iopt对应的状 态向量,/>为最优路径的状态。
本公开第二方面实施例提供的自动驾驶汽车的集成式决控装置,包括:
模型构建模块,用于根据交通驾驶场景静态信息构造候选路径集合,对所述候选路径 集合中每一条候选路径考虑交通驾驶场景动态信息构建路径跟踪模型,在此基础上进一步 构造路径优选模型;
离线求解模块,用于将所述路径跟踪模型和所述路径优选模型分别转化为决控策略求 解模型和评价函数求解模型,通过离线方式求解所述决控策略求解模型和所述评价函数求 解模型,得到最优决控策略和最优评价函数;和
在线应用模块,用于从自动驾驶汽车出发时刻开始,每一时刻利用所述最优评价函数 选择最优路径,然后使用所述最优决控策略确定自动驾驶汽车的最优动作,直至到达全局 路径终点。
本公开第三方面实施例提供的计算机可读存储介质,所述计算机可读存储介质存储计 算机指令,所述计算机指令用于使所述计算机执行上述自动驾驶汽车的集成式决控方法。
附图说明
图1是本公开第一方面实施例提供的自动驾驶汽车的集成式决控方法的整体流程图;
图2的(a)和(b)分别是本发明实施例方法生成的静态路径和期望速度;
图3是本公开第二方面实施例提供的自动驾驶汽车的集成式决控装置的结构框图;
图4是本公开第三方面实施例提供的电子设备的结构框图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本 申请进行进一步详细描述。应当理解,此处所描述的具体实施例仅用于解释本申请,并不 用于限定本申请。
相反,本申请涵盖任何由权利要定义的在本申请精髓和范围上做的替代、修改、等效 方法以及方案。进一步,为了使公众对本申请有更好的了解,在下文对本发明的细节描述 中,详尽描述了一些特定的细节部分。对本领域技术人员来说没有这些细节部分的描述也 可以完全理解本申请。
本公开第一方面实施例提供的自动驾驶汽车的集成式决控方法,参见图1,包括:
根据交通驾驶场景的静态信息构造候选路径集合,对候选路径集合中每一条候选路径 考虑交通驾驶场景的动态信息构建路径跟踪模型,在此基础上进一步构造路径优选模型;
将得到的路径跟踪模型和路径优选模型分别转化为决控策略求解模型和评价函数求 解模型,通过离线方式求解决控策略求解模型和评价函数求解模型,得到最优决控策略和 最优评价函数;
从自动驾驶汽车出发时刻开始,每一时刻利用得到的最优评价函数选择最优路径,然 后使用最优决控策略确定自动驾驶汽车的最优动作,直至到达全局路径终点。
在一些实施例中,候选路径集合通过以下步骤构建:
根据含车道线信息的地图,采用道路结构、限速、路面标识、交通法规等交通驾驶场 景的静态信息,结合人工驾驶习惯制定局部候选路径集合,参见图2中(a)。考虑地图中所有车道,排除限行车道,如当前时间段限行车道,特定功能车道等,对每一条可通行车 道Li,i∈{1,Nlane},其中Nlane为当前时段可通行的车道数量,定义可通行车道Li的车道中 心线为候选路径,并将其离散化为N个路径点,本公开采用的离散化方法包括等间距离散 化与等时距离散化。将离散化后的候选路径记为τi。参见图2中(b),为每一条离散候选 路径τi设定对应的期望速度可通过车道限速或车道限速的百分位数设定。定义候 选路径的集合为Π,其表达式为:
在一些实施例中,路径跟踪模型通过以下步骤构建:
结合自动驾驶汽车动力学、周围交通参与者、交通信号灯等动态信息,以自动驾驶汽 车动力学模型以及自车和交通驾驶场景的动态信息之间的状态关联为约束,对每条离散候 选路径τi构建路径跟踪模型,数学表达式为:
xego,k+1=Fego(xego,k,uk) (3)
xsurr,k+1=Fsurr(xego,k,xsurr,k) (4)
xroad,k=Froad(xego,k) (5)
h(xego,k,xsurr,k)≥Dsafe (6)
h(xego,k,xroad,k)≥Dsafe (7)
其中:
式(2)为第i条离散候选路径τi对应的路径跟踪模型的目标函数,其中为第i条离散候 选路径τi对应的路径跟踪模型的最优目标函数;Ji为第i条离散候选路径τi对应的路径跟踪 模型的目标函数;Np为预测总步数,取值范围为[1,∞);k∈{0,…,Np-1};/>为第i条 离散候选路径τi的状态,即/>xego,k为第k步的自动驾驶汽车状态,其中包括自动驾驶汽车的位置坐标、纵向速度、横向速度、方向角、横摆角速度,长度和宽度 等信息;xsurr,k为第k步的周围交通参与者状态,包括周围机动车、周围非机动车和周围行 人等状态;xroad,k为第k步的道路与环境状态,包括自动驾驶汽车距车道边缘的距离和车 道限速等信息;uk为第k步的自动驾驶汽车决控参数,是用于控制车辆动作的参数,自动 驾驶汽车决策参数包括自动驾驶汽车的期望加速度与方向盘转角或自动驾驶汽车的期望 轨迹等;l为效用函数,其中包含自动驾驶汽车的位置跟踪误差、速度跟踪误差和控制能量 损耗等,用于计算每一时间步下的代价。
式(3)为自动驾驶汽车的动力学模型,其中Fego(·)为第一非线性映射,通常由自动驾驶 汽车的二自由度模型和轮胎模型共同决定,反映了自动驾驶汽车从第k步状态到k+1步状 态的转移关系。
式(4)为周围交通参与者的运动学模型,其中Fsurr(·)为第二非线性映射,如使用深度 神经网络拟合得到的模型,反映了周围交通参与者从第k步状态到第k+1步状态的转移关 系。
式(5)为道路与环境模型,其中Froad(·)为第三非线性映射,如使用深度神经网络拟合 得到的模型,反映了第k步道路与环境信息与第k步自动驾驶汽车状态的关联。
式(6)为自动驾驶汽车与周围交通参与者的安全约束,h(·)为第四非线性映射,通常为 自车与交通参与者的距离;Dsafe为设定的自动驾驶汽车与周围交通参与者间的安全距离。 安全距离计算方法主要有:(a)自动驾驶汽车形心与周围交通参与者形心的距离;(b)多 圆覆盖法,即使用多个圆分别将自动驾驶汽车与周围交通参与者覆盖,然后分别约束自动 驾驶汽车多个圆的圆心与周围交通参与者的圆心之间的距离。
式(7)为自动驾驶汽车与道路的安全约束。
在一些实施例中,路径优选模型通过以下步骤构建:
根据构建的路径跟踪模型,设定路径优选模型的目标函数为:
路径优选模型的约束条件与路径跟踪模型的约束条件相同。路径优选模型考虑分别求 解minJ1,minJ2,…,然后对比最小的最优解,作为参考路径的选择结果。
在一些实施例中,通过以下步骤将得到的路径跟踪模型转化为决控策略求解模型:
引入决控策略πθ(·),为使用策略参数θ参数化的第五非线性映射,其通常为一深度神 经网络,θ为深度神经网络中的参数,反映了第k步的自动驾驶汽车决控参数uk与自动驾驶 汽车状态xego,k的关联。构造第k步的自动驾驶汽车决控策略状态的输入为sk,其由i条候选 路径τi的状态第k步的自动驾驶汽车状态xego,k、周围交通参与者状 态xsurr,k,道路与环境状态xroad,k构造得到,具体地,/>转化后的决控策略求解模型如下:
xego,k+1=Fego(xego,k,uk) (10)
xsurr,k+1=Fsurr(xego,k,xsurr,k) (11)
xroad,k=Froad(xego,k) (12)
uk=πθ(sk) (13)
h(xego,k,xsurr,k)≥Dsafe (14)
h(xego,k,xroad,k)≥Dsafe (15)
其中:
式(9)为求解决控策略模型的目标函数,优化变量为策略参数θ。表示初始状态分 布下的期望性能,该初始状态分布为不同候选路径、自动驾驶汽车状态、周围交通参与者 状态和道路状态的联合分布,具体地,/>为不同初始状态s0下{·}的平均性能,即由初 始状态分布采样一定数量的初始状态s0,分别计算相应的{·},最后计算平均所得。
式(10)(11)(12)同式(3)(4)(5)。
式(13)为使用决控策略πθ(·)得到自动驾驶汽车决控参数uk
式(14)(15)同式(6)(7)。
在一些实施例中,通过以下步骤将得到的路径优选模型转化为评价函数求解模型:
引入评价函数Vw(·),其为使用w参数化的第六非线性映射,其通常为一深度神经网络, w为深度神经网络中的参数,该深度神经网络的输入与决控策略输入相同,反映了从当前 状态到目标函数Ji的关联。转化后的评价函数求解模型如下:
xego,k+1=Fego(xego,k,uk) (17)
xsurr,k+1=Fsurr(xego,k,xsurr,k) (18)
xroad,k=Froad(xego,k) (19)
uk=πθ(sk) (20)
其中:
式(16)为评价函数求解模型的目标函数,优化变量为评价函数参数w。
式(17)(18)(19)(20)同式(3)(4)(5)(13)。
在一些实施例中,通过离线方式求解决控策略求解模型和评价函数求解模型,得到最 优决控策略和最优评价函数,具体包括以下步骤:
求解上述公式(9)~公式(15)所示决控策略求解模型与公式(16)~公式(20)所示评价函数求解模型,输出最优决控策略与最优评价函数/>
在一些实施例中,从自动驾驶汽车出发时刻开始,每一时刻利用得到的最优评价函数 选择最优路径,然后使用最优决控策略确定自动驾驶汽车的最优动作,直至到达全局路径 终点,具体包括以下步骤:
车辆出发时刻,给定自动驾驶汽车全局路径、自动驾驶汽车状态xego、周围交通参与 者状态xsurr和道路与环境状态xroad
3-1)最优路径选择:按照公式(21)构造各离散候选路径对应的状态向量si,i=1,…,Nlane
使用得到的最优评价函数按照公式(22)选择具有最小值的路径作为最优路径 Iopt
3-2)最优路径跟踪:获取最优路径下的状态向量
其中,为最优路径的状态;
使用得到的最优决控策略使用公式(24)计算自动驾驶汽车当前状态下的最优动 作u:
自动驾驶汽车执行最优动作u,计算得到的自动驾驶汽车控制量,通常包括自车期望 加速度与自车期望方向盘转角,获取下一时刻的自动驾驶汽车状态和周车状态。
3-3)不断执行步骤3-1)~3-2),直到自动驾驶汽车达到全局路径终点,本方法结束。
本公开实施例提出的动驾驶汽车的集成式决控装置,参见图3,包括:
模型构建模块,用于根据交通驾驶场景静态信息构造候选路径集合,对候选路径集合 中每一条候选路径考虑交通驾驶场景动态信息构建路径跟踪模型,在此基础上进一步构造 路径优选模型;
离线求解模块,用于将模型构建模块得到的路径跟踪模型和路径优选模型分别转化为 决控策略求解模型和评价函数求解模型,通过离线方式求解决控策略求解模型和评价函数 求解模型,得到最优决控策略和最优评价函数;和
在线应用模块,用于从自动驾驶汽车出发时刻开始,每一时刻利用得到的最优评价函 数选择最优路径,然后使用最优决控策略确定自动驾驶汽车的最优动作,直至到达全局路 径终点。
为了实现上述实施例,本公开实施例还提出一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行,用于执行上述实施例的自动驾驶汽车静态路径规 划方法。
下面参考图4,其示出了适于用来实现本公开实施例的电子设备100的结构示意图。其中,需要说明的是,该电子设备100中包括自动驾驶汽车的集成式决控系统,其 中,本公开实施例中的电子设备可以包括但不限于诸如移动电话、笔记本电脑、数字 广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放 器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机、 服务器等等的固定终端。图4示出的电子设备仅仅是一个示例,不应对本公开实施例 的功能和使用范围带来任何限制。
如图4所示,电子设备100可以包括处理装置(例如中央处理器、图形处理器等)101,其可以根据存储在只读存储器(ROM)102中的程序或者从存储装置108加载到 随机访问存储器(RAM)103中的程序而执行各种适当的动作和处理。在RAM 103 中,还存储有电子设备100操作所需的各种程序和数据。处理装置101、ROM 102以 及RAM 103通过总线104彼此相连。输入/输出(I/O)接口105也连接至总线104。
通常,以下装置可以连接至I/O接口105:包括例如触摸屏、触摸板、键盘、鼠标、 摄像头、麦克风等的输入装置106;包括例如液晶显示器(LCD)、扬声器、振动器 等的输出装置107;包括例如磁带、硬盘等的存储装置108;以及通信装置109。通信 装置109可以允许电子设备100与其他设备进行无线或有线通信以交换数据。虽然图 4示出了具有各种装置的电子设备100,但是应理解的是,并不要求实施或具备所有示 出的装置。可以替代地实施或具备更多或更少的装置。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本实施例包括一种计算机程序产品,其包括承载在计算机可读介质 上的计算机程序,该计算机程序包含用于执行流程图中所示方法的程序代码。在这样 的实施例中,该计算机程序可以通过通信装置109从网络上被下载和安装,或者从存 储装置108被安装,或者从ROM 102被安装。在该计算机程序被处理装置101执行时, 执行本公开实施例的方法中限定的上述功能。
需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是—— 但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意 以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多 个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器 (ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只 读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在 本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以 被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读 信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机 可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、 光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质 以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由 指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含 的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设 备执行时,使得该电子设备:根据交通驾驶场景静态信息构造候选路径集合,对候选路径 集合中每一条候选路径考虑交通驾驶场景动态信息构建路径跟踪模型,在此基础上进一步 构造路径优选模型;将得到的路径跟踪模型和路径优选模型分别转化为决控策略求解模型 和评价函数求解模型,通过离线方式求解决控策略求解模型和评价函数求解模型,得到最 优决控策略和最优评价函数;从自动驾驶汽车出发时刻开始,每一时刻利用得到的最优评 价函数选择最优路径,然后使用最优决控策略确定自动驾驶汽车的最优动作,直至到达全 局路径终点。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机 程序代码,上述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、 C++、python,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计 语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为 一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在 远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意 种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者, 可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、 “具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、 结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上 述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、 结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外, 在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示 例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对 重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的 特征可以明示或者隐含地包括至少一个该特征。在本申请的描述中,“多个”的含义 是至少两个,例如两个,三个等,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段 或部分,并且本申请的优选实施方式的范围包括另外的实现,其中可以不按所示出或 讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能, 这应被本申请的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中, 以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以 从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系 统、装置或设备而使用。就本说明书而言,“计算机可读介质”可以是任何可以包含、 存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系 统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包 括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置), 随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM 或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机 可读介质甚至可以是可在其上打印程序的纸或其他合适的介质,因为可以例如通过对 纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理 来以电子方式获得程序,然后将其存储在计算机存储器中。
应当理解,本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上 述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行 的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本 领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑 功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可 编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤, 可以通过程序来指令相关的硬件完成,所开发的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本申请各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成 的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。集成的模 块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一 个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本申请的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本申请 的限制,本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、 替换和变型。

Claims (5)

1.一种自动驾驶汽车的集成式决控方法,其特征在于,包括:
根据交通驾驶场景的静态信息构造候选路径集合,对所述候选路径集合中每一条候选路径考虑交通驾驶场景的动态信息构建路径跟踪模型,在此基础上进一步构造路径优选模型;
将所述路径跟踪模型和所述路径优选模型分别转化为决控策略求解模型和评价函数求解模型,通过离线方式求解所述决控策略求解模型和所述评价函数求解模型,得到最优决控策略和最优评价函数;
从自动驾驶汽车出发时刻开始,每一时刻利用所述最优评价函数选择最优路径,然后使用所述最优决控策略确定自动驾驶汽车的最优动作,直至到达全局路径终点;
所述候选路径集合为Π,其表达式为:
其中,τi为对将可通行车道Li的车道中心线作为的候选路径经过离散化后得到的离散候选路径,i∈{1,Nlane},Nlane为自动驾驶汽车可通行的车道数量;为对候离散选路径τi设定的期望速度;
所述路径跟踪模型为:
xego,k+1=Fego(xego,k,uk) (3)
xsurr,k+1=Fsurr(xego,k,xsurr,k) (4)
xroad,k=Froad(xego,k) (5)
h(xego,k,xsurr,k)≥Dsafe (6)
h(xego,k,xroad,k)≥Dsafe (7)
其中:
式(2)为第i条离散候选路径τi对应的路径跟踪模型的目标函数;为第i条离散候选路径τi对应的路径跟踪模型的最优目标函数;Ji为第i条离散候选路径τi对应的路径跟踪模型的目标函数;Np为预测总步数,取值范围为[1,∞);k∈{0,…,Np-1};/>为第i条离散候选路径τi的状态,即/>xego,k为第k步的自动驾驶汽车状态,其中包括自动驾驶汽车的位置坐标、纵向速度、横向速度、方向角、横摆角速度,长度和宽度;xsurr,k为第k步的周围交通参与者状态,包括周围机动车、周围非机动车和周围行人;xroad,k为第k步的道路与环境状态,包括自动驾驶汽车距车道边缘的距离和车道限速;uk为第k步的自动驾驶汽车决控参数,包括自动驾驶汽车的期望加速度与方向盘转角或自动驾驶汽车的期望轨迹;l为效用函数,包含自动驾驶汽车的位置跟踪误差、速度跟踪误差和控制能量损耗,用于计算每一时间步下的代价;
式(3)为自动驾驶汽车的动力学模型;Fego(·)为第一非线性映射,反映了自动驾驶汽车从第k步状态到k+1步状态的转移关系;
式(4)为周围交通参与者的运动学模型;Fsurr(·)为第二非线性映射,反映了周围交通参与者从第k步状态到第k+1步状态的转移关系;
式(5)为道路与环境模型;Froad(·)为第三非线性映射,反映了第k步道路与环境信息与第k步自动驾驶汽车状态的关联;
式(6)为自动驾驶汽车与周围交通参与者的安全约束;h(·)为第四非线性映射;Dsafe为设定的自动驾驶汽车与周围交通参与者间的安全距离;
式(7)为自动驾驶汽车与道路的安全约束;
设定所述路径优选模型的目标函数为:
所述决控策略求解模型为:
xego,k+1=Fego(xego,k,uk) (10)
xsurr,k+1=Fsurr(xego,k,xsurr,k) (11)
xroad,k=Froad(xego,k) (12)
uk=πθ(sk) (13)
h(xego,k,xsurr,k)≥Dsafe (14)
h(xego,k,xroad,k)≥Dsafe (15)
其中:
式(9)为所述决控策略求解模型的目标函数;θ为策略参数;表示初始状态s0分布下的期望性能,所述初始状态分布为不同离散候选路径、自动驾驶汽车状态、周围交通参与者状态和道路状态的联合分布;uk为第k步的自动驾驶汽车决控参数;sk为第k步的自动驾驶汽车决控策略状态的输入,/>
式(10)、(11)和(12)分别为自动驾驶汽车的动力学模型、周围交通参与者的运动学模型和道路与环境模型;
式(13)为使用决控策略πθ(·)得到的第k步的自动驾驶汽车决控参数uk;决控策略πθ(·)为使用策略参数θ参数化的第五非线性映射,反映了第k步的自动驾驶汽车决控参数uk与自动驾驶汽车状态xego,k的关联;
式(14)和(15)分别为自动驾驶汽车与周围交通参与者的安全约束和自动驾驶汽车与道路的安全约束;
所述评价函数求解模型为:
xego,k+1=Fego(xego,k,uk) (17)
xsurr,k+1=Fsurr(xego,k,xsurr,k) (18)
xroad,k=Froad(xego,k) (19)
uk=πθ(sk) (20)
其中:
式(16)为所述评价函数求解模型的目标函数,w为评价函数Vw(·)参数,评价函数Vw(·)为使用w参数化的第六非线性映射,反映了从当前状态到目标函数的关联;式(17)、(18)、(19)和(20)分别为自动驾驶汽车的动力学模型、周围交通参与者的运动学模型、道路与环境模型和使用决控策略πθ(·)得到第k步的自动驾驶汽车决控参数uk
2.根据权利要求1所述的集成式决控方法,其特征在于,通过下式选择所述最优路径:
其中,Iopt为所述最优路径;为所述最优评价函数;si为离散候选路径对应的状态向量,/>
通过下式确定所述最优动作:
其中,u为所述最优动作;为所述最优决控策略;/>为最优路径Iopt对应的状态向量,/> 为最优路径的状态。
3.根据权利要求1所述的集成式决控方法,其特征在于,所述交通驾驶场景的静态信息包括道路结构、限速、路面标识和交通法规;所述交通驾驶场景的动态信息包括自动驾驶汽车动力学、周围交通参与者和交通信号灯信息。
4.一种基于权利要求1-3中任一项所述集成式决控方法的自动驾驶汽车的集成式决控装置,其特征在于,包括:
模型构建模块,用于根据交通驾驶场景静态信息构造候选路径集合,对所述候选路径集合中每一条候选路径考虑交通驾驶场景动态信息构建路径跟踪模型,在此基础上进一步构造路径优选模型;
离线求解模块,用于将所述路径跟踪模型和所述路径优选模型分别转化为决控策略求解模型和评价函数求解模型,通过离线方式求解所述决控策略求解模型和所述评价函数求解模型,得到最优决控策略和最优评价函数;和
在线应用模块,用于从自动驾驶汽车出发时刻开始,每一时刻利用所述最优评价函数选择最优路径,然后使用所述最优决控策略确定自动驾驶汽车的最优动作,直至到达全局路径终点。
5.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储计算机指令,所述计算机指令用于使所述计算机执行权利要求1-3中任一项所述的自动驾驶汽车的集成式决控方法。
CN202110990262.7A 2021-08-26 2021-08-26 自动驾驶汽车的集成式决控方法、装置及存储介质 Active CN113619604B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110990262.7A CN113619604B (zh) 2021-08-26 2021-08-26 自动驾驶汽车的集成式决控方法、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110990262.7A CN113619604B (zh) 2021-08-26 2021-08-26 自动驾驶汽车的集成式决控方法、装置及存储介质

Publications (2)

Publication Number Publication Date
CN113619604A CN113619604A (zh) 2021-11-09
CN113619604B true CN113619604B (zh) 2023-08-15

Family

ID=78387937

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110990262.7A Active CN113619604B (zh) 2021-08-26 2021-08-26 自动驾驶汽车的集成式决控方法、装置及存储介质

Country Status (1)

Country Link
CN (1) CN113619604B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114750750B (zh) * 2022-04-28 2024-09-20 南阳理工学院 一种自动泊车的最优跟踪控制方法、系统、设备和介质
CN115456392B (zh) * 2022-09-06 2023-09-05 长安大学 一种高速多车多驾驶行为冲突协同决策方法及装置

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108919795A (zh) * 2018-06-01 2018-11-30 中国北方车辆研究所 一种自动驾驶汽车换道决策方法及装置
CN110187639A (zh) * 2019-06-27 2019-08-30 吉林大学 一种基于参数决策框架的轨迹规划控制方法
CN110398969A (zh) * 2019-08-01 2019-11-01 北京主线科技有限公司 自动驾驶车辆自适应预测时域转向控制方法及装置
CN110989577A (zh) * 2019-11-15 2020-04-10 深圳先进技术研究院 自动驾驶决策方法及车辆的自动驾驶装置
CN111273668A (zh) * 2020-02-18 2020-06-12 福州大学 针对结构化道路的无人驾驶汽车运动轨迹规划系统及方法
CN111413966A (zh) * 2020-03-12 2020-07-14 天津大学 一种递进式模型预测无人驾驶规划跟踪协同控制方法
CN111845773A (zh) * 2020-07-06 2020-10-30 北京邮电大学 基于强化学习的自动驾驶车辆微观决策方法
CN112068445A (zh) * 2020-09-23 2020-12-11 北京理工大学 自动驾驶车辆路径规划与路径跟踪集成控制方法及系统
CN112578672A (zh) * 2020-12-16 2021-03-30 吉林大学青岛汽车研究院 基于底盘非线性的无人驾驶汽车轨迹控制系统及其轨迹控制方法
WO2021073079A1 (zh) * 2019-10-17 2021-04-22 南京航空航天大学 一种自动驾驶车辆路径与速度高度耦合的轨迹规划方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108919795A (zh) * 2018-06-01 2018-11-30 中国北方车辆研究所 一种自动驾驶汽车换道决策方法及装置
CN110187639A (zh) * 2019-06-27 2019-08-30 吉林大学 一种基于参数决策框架的轨迹规划控制方法
CN110398969A (zh) * 2019-08-01 2019-11-01 北京主线科技有限公司 自动驾驶车辆自适应预测时域转向控制方法及装置
WO2021073079A1 (zh) * 2019-10-17 2021-04-22 南京航空航天大学 一种自动驾驶车辆路径与速度高度耦合的轨迹规划方法
CN110989577A (zh) * 2019-11-15 2020-04-10 深圳先进技术研究院 自动驾驶决策方法及车辆的自动驾驶装置
CN111273668A (zh) * 2020-02-18 2020-06-12 福州大学 针对结构化道路的无人驾驶汽车运动轨迹规划系统及方法
CN111413966A (zh) * 2020-03-12 2020-07-14 天津大学 一种递进式模型预测无人驾驶规划跟踪协同控制方法
CN111845773A (zh) * 2020-07-06 2020-10-30 北京邮电大学 基于强化学习的自动驾驶车辆微观决策方法
CN112068445A (zh) * 2020-09-23 2020-12-11 北京理工大学 自动驾驶车辆路径规划与路径跟踪集成控制方法及系统
CN112578672A (zh) * 2020-12-16 2021-03-30 吉林大学青岛汽车研究院 基于底盘非线性的无人驾驶汽车轨迹控制系统及其轨迹控制方法

Also Published As

Publication number Publication date
CN113619604A (zh) 2021-11-09

Similar Documents

Publication Publication Date Title
US11899411B2 (en) Hybrid reinforcement learning for autonomous driving
US20220105961A1 (en) Method for automatic control of vehicle and method for training lane change intention prediction network
CN112677995B (zh) 一种车辆轨迹规划方法、装置、存储介质及设备
WO2022052406A1 (zh) 一种自动驾驶训练方法、装置、设备及介质
CN111771141B (zh) 自动驾驶车辆中使用3d cnn网络进行解决方案推断的lidar定位
CN113619604B (zh) 自动驾驶汽车的集成式决控方法、装置及存储介质
CN114212110B (zh) 障碍物轨迹预测方法、装置、电子设备及存储介质
JP2020083308A (ja) オブジェクト挙動のリアルタイム予測
CN114261400B (zh) 一种自动驾驶决策方法、装置、设备和存储介质
CN110782092A (zh) 无人配送车在非结构化场景中的轨迹规划方法及装置
CN112325898B (zh) 路径规划方法、装置、设备和存储介质
CN115285148B (zh) 自动驾驶车速规划方法、装置、电子设备和存储介质
Gadepally et al. A framework for estimating long term driver behavior
CN116476863A (zh) 基于深度强化学习的自动驾驶横纵向一体化决策方法
CN113997954A (zh) 一种车辆行驶意图预测方法、装置、设备及可读存储介质
CN112649012A (zh) 一种轨迹规划方法、设备、介质及无人设备
Yu et al. Hierarchical framework integrating rapidly-exploring random tree with deep reinforcement learning for autonomous vehicle
CN114475656A (zh) 行驶轨迹预测方法、装置、电子设备以及存储介质
CN113753082A (zh) 无人车轨迹更新方法及装置、控制方法及电子设备
Saha et al. Practical self-driving cars: Survey of the state-of-the-art
CN113587950B (zh) 自动驾驶汽车静态路径规划方法、装置及存储介质
Li et al. RDDRL: a recurrent deduction deep reinforcement learning model for multimodal vision-robot navigation
Grigorescu et al. LVD-NMPC: A learning-based vision dynamics approach to nonlinear model predictive control for autonomous vehicles
AU2020103161A4 (en) An novel method for a smart car - artificial intelligence based autonomous steering control system with voice assistance
CN114004406A (zh) 车辆轨迹预测方法、装置、存储介质及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant