CN112989715B - 一种燃料电池汽车多信号灯车速规划方法 - Google Patents
一种燃料电池汽车多信号灯车速规划方法 Download PDFInfo
- Publication number
- CN112989715B CN112989715B CN202110550474.3A CN202110550474A CN112989715B CN 112989715 B CN112989715 B CN 112989715B CN 202110550474 A CN202110550474 A CN 202110550474A CN 112989715 B CN112989715 B CN 112989715B
- Authority
- CN
- China
- Prior art keywords
- model
- drl
- training
- signal lamp
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Computer Hardware Design (AREA)
- Geometry (AREA)
- Traffic Control Systems (AREA)
- Electric Propulsion And Braking For Vehicles (AREA)
Abstract
Description
技术领域
本发明涉及经济车速规划领域,特别是涉及一种燃料电池汽车多信号灯车速规划方法。
背景技术
通过共享的实时交通信息和对复杂环境的感知,智能网联汽车具有超出人类驾驶员的全局规划和决策能力。利用V2X通讯技术,网联式燃料电池汽车可以获取周边交通基础设施的未来信息和其他交通参与者的实时信息,从而实现经济车速规划。
在交通信号灯环境下,现有的经济车速规划方法主要分为基于优化的方法和基于强化学习的方法。基于优化的方法能够获得最优或者近似最优的全局解,但是计算代价往往很大;基于强化学习尤其是深度强化学习的方法表现出很好的实时性和良好的性能,但是当前的基于深度强化学习的车速规划方法在训练过程中只考虑车辆前方单个交通信号灯的信息,忽略了全局最优性。相比之下,基于前方多个交通信号灯的信息进行决策具有更大的节能潜力。
发明内容
本发明的目的在于弥补现有规划方法的不足,提出一种燃料电池汽车多信号灯车速规划方法,该方法对环境具有很强的自适应能力,并且相比于单信号灯训练深度强化学习车速规划方法表现出更低的氢耗和更好的舒适性。
为实现上述目的,本发明采用以下技术方案:一种燃料电池汽车多信号灯车速规划方法,包括以下步骤:
S4.将训练好的DRL-L模型应用到复杂的测试场景,得到全局经济车速;
进一步地,步骤S1中所述的燃料电池汽车FCV训练模型采用不考虑动力传动部件的质点模型;交通信号灯模型包括信号灯位置模型和信号灯相位时序SPaT模型;
交通信号灯位置模型采用可变信号灯位置,如下所示:
一旦信号灯位于车辆后方,其SPaT信息会被重置并且锁定,如下所示:
进一步地,所述步骤S3中,在训练环境中对DRL网络进行训练,包括以下子步骤:
S32.根据当前状态和随机探索噪声选择动作,并将相关经验添加到经验池;
S34.重复进行S32和S33,直至达到收敛条件。
DRL网络包含actor网络和critic网络以及相对应的目标网络和;DRL网络均包含1个输入层、2个隐藏层和1个输出层;其中,actor网络及其目标网络的输入是状态,输出是动作;critic网络及其目标网络的输入是状态和动作,输出是动作价值;
随机探索噪声选取Ornstein-Uhlenbeck噪声或者高斯噪声。
进一步地,步骤S32中所述的根据当前状态和随机探索噪声选择动作,并将相关经验添加到经验池,具体分别为:
critic网络以最小化损失函数为目标进行参数更新,如下所示:
actor网络使用策略梯度进行参数更新,如下所示:
目标网络参数采用软更新,如下所示:
进一步地,所述步骤S4中,将训练好的DRL-L模型应用到复杂的测试场景,得到全局经济车速,包括以下子步骤:
S41.根据测试场景中信号灯的分布情况按需引入虚拟信号灯,对测试场景进行重构;
S42.按照训练场景的尺度,在测试场景中滚动应用训练好的DRL-L模型;
S43.将DRL模型的输出组合到一起,得到完整的车速规划结果。
进一步地,所述步骤S41中,根据测试场景中信号灯的分布情况按需引入虚拟信号灯,对测试场景进行重构,具体如下所示:
虚拟信号灯的信号状态一直保持绿灯,且虚拟信号灯的位置位于相应路段的中心。
进一步地,步骤S42中所述的按照训练场景的尺度,在测试场景中滚动应用训练好的DRL-L模型,具体如下所示:
每一次模型应用后的环境终端状态应作为下一次应用时的环境初始状态。
进一步地,所述步骤S5中,在电量维持模式下利用动态规划算法DP计算测试场景下全局车速规划结果的氢耗,包括以下子步骤:
S51.建立FCV动力传动系统模型,包括整车功率需求模型、供需端功率平衡模型、氢耗模型和动力电池等效电路模型;
本发明提供的车速规划方法同样适用于包括传统燃油车、混合动力汽车等多种动力类型在内的网联式车辆,车速规划结果能耗评估需依据不同车型进行相应调整。
与现有技术相比,本发明的有益效果是:
(1)本发明面向网联式燃料电池汽车经济车速规划任务,建立了多信号灯DRL训练环境,增强了车辆的环境感知和规划决策能力。
(2)本发明提出了基于可变距离的信号灯位置模型和用三角函数表示的信号灯SPaT模型,有效提高了DRL模型对复杂信号灯行驶环境的自适应能力。
(3)本发明提出的多信号灯车速规划方法具备实时在线应用潜力,并且相比于单信号灯训练方法表现出更好的能耗经济性和舒适性。
附图说明
图1为本发明所提出的燃料电池汽车多信号灯车速规划方法流程图;
图2为本发明中多信号灯训练DRL场景;
图3为本发明中DRL网络训练流程图;
图4为本发明中测试场景下训练好的DRL-L模型应用流程图。
具体实施方式
下面结合附图对本发明的具体实施方式进行详细的描述,但本发明的保护范围不局限于以下所述。
如图1所示,一种燃料电池汽车多信号灯车速规划方法,包括以下步骤:
燃料电池汽车FCV训练模型采用不考虑动力传动部件的质点模型;交通信号灯模型包括信号灯位置模型和信号灯相位时序SPaT模型。
交通信号灯位置模型采用可变信号灯位置,如公式(1)所示:
一旦信号灯位于车辆后方,其SPaT信息会被重置并且锁定,如公式(6)所示:
所述步骤S3具体包括:
DRL网络包含actor网络和critic网络以及相对应的目标网络和。DRL网络均包含1个输入层、2个节点数均为256的隐藏层和1个输出层。其中,actor网络及其目标网络的输入是状态,输出是动作;critic网络及其目标网络的输入是状态和动作,输出是动作价值。
随机探索噪声选取Ornstein-Uhlenbeck噪声。
S32.根据当前状态和随机探索噪声选择动作,并将相关经验添加到经验池。
critic网络以最小化损失函数为目标进行参数更新,如公式(13)所示:
actor网络使用策略梯度进行参数更新,如公式(14)所示:
目标网络参数采用软更新,如公式(15)所示:
S34.重复进行S32和S33,直至达到收敛条件。
S4.将训练好的DRL-L模型应用到复杂的测试场景,得到全局经济车速,如图4所示。
所述步骤S4具体包括:
S41.根据测试场景中信号灯的分布情况按需引入虚拟信号灯,对测试场景进行重构。
虚拟信号灯的信号状态一直保持绿灯,且虚拟信号灯的位置位于相应路段的中心。
S42.按照训练场景的尺度,在测试场景中滚动应用训练好的DRL-L模型。
每一次模型应用后的环境终端状态应作为下一次应用时的环境初始状态。
S43.将DRL模型的输出组合到一起,得到完整的车速规划结果。
所述步骤S5具体包括:
S51.建立FCV动力传动系统模型,包括整车功率需求模型、供需端功率平衡模型、氢耗模型和动力电池等效电路模型;
以上所述是本发明的优选实施方式,应被理解为本发明的保护范围并不局限于这样的特定陈述和实施例。本领域的普通技术人员依据本发明的核心思想所进行的改动和变化,都应在本发明所附权利要求的保护范围内。
Claims (7)
1.一种燃料电池汽车多信号灯车速规划方法,其特征在于,包括以下步骤:
步骤S1中所述的燃料电池汽车FCV训练模型采用不考虑动力传动部件的质点模型;交通信号灯模型包括信号灯位置模型和信号灯相位时序SPaT模型;
交通信号灯位置模型采用可变信号灯位置,如下所示:
一旦信号灯位于车辆后方,其SPaT信息会被重置并且锁定,如下所示:
S4.将训练好的DRL-L模型应用到复杂的测试场景,得到全局经济车速;包括以下子步骤:
S41.根据测试场景中信号灯的分布情况按需引入虚拟信号灯,对测试场景进行重构;具体如下所示:
虚拟信号灯的信号状态一直保持绿灯,且虚拟信号灯的位置位于相应路段的中心;
步骤S42中所述的按照训练场景的尺度,在测试场景中滚动应用训练好的DRL-L模型,具体如下所示:
每一次模型应用后的环境终端状态应作为下一次应用时的环境初始状态;
S42.按照训练场景的尺度,在测试场景中滚动应用训练好的DRL-L模型;
S43.将DRL模型的输出组合到一起,得到完整的车速规划结果;
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110550474.3A CN112989715B (zh) | 2021-05-20 | 2021-05-20 | 一种燃料电池汽车多信号灯车速规划方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110550474.3A CN112989715B (zh) | 2021-05-20 | 2021-05-20 | 一种燃料电池汽车多信号灯车速规划方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112989715A CN112989715A (zh) | 2021-06-18 |
CN112989715B true CN112989715B (zh) | 2021-08-03 |
Family
ID=76337034
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110550474.3A Active CN112989715B (zh) | 2021-05-20 | 2021-05-20 | 一种燃料电池汽车多信号灯车速规划方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112989715B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113779703B (zh) * | 2021-09-22 | 2023-12-22 | 北京理工大学 | 一种燃料电池汽车车速规划与能量管理的联合优化方法 |
CN114103971B (zh) * | 2021-11-23 | 2023-10-10 | 北京理工大学 | 一种燃料电池汽车节能驾驶优化方法及装置 |
CN113978478B (zh) * | 2021-11-23 | 2023-11-21 | 北京理工大学 | 一种基于分层凸优化的燃料电池汽车节能驾驶方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112339756A (zh) * | 2020-10-14 | 2021-02-09 | 天津大学 | 一种基于强化学习的新能源汽车红绿灯路口能量回收优化速度规划算法 |
CN112669629A (zh) * | 2020-12-17 | 2021-04-16 | 北京建筑大学 | 一种基于深度强化学习的实时交通信号控制方法及装置 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4364671B2 (ja) * | 2004-02-25 | 2009-11-18 | 株式会社タカラトミー | 鉄道模型用信号機および鉄道模型用信号機の制御方法 |
US10295364B2 (en) * | 2017-05-26 | 2019-05-21 | Alpine Electronics, Inc. | Obstacle data providing system, data processing apparatus and method of providing obstacle data |
CN108828939B (zh) * | 2018-05-31 | 2021-07-20 | 重庆大学 | 一种考虑驾驶员操作特性的车速引导方法 |
CN110164150B (zh) * | 2019-06-10 | 2020-07-24 | 浙江大学 | 一种基于时间分配和强化学习的交通信号灯控制方法 |
CN110428615B (zh) * | 2019-07-12 | 2021-06-22 | 中国科学院自动化研究所 | 基于深度强化学习单路口交通信号控制方法、系统、装置 |
CN110718077B (zh) * | 2019-11-04 | 2020-08-07 | 武汉理工大学 | 一种行动-评价机制下信号灯优化配时方法 |
CN111243271A (zh) * | 2020-01-11 | 2020-06-05 | 多伦科技股份有限公司 | 一种基于深度循环q学习的单点交叉口信号控制方法 |
CN111267830B (zh) * | 2020-02-10 | 2021-07-09 | 南京航空航天大学 | 一种混合动力公交车能量管理方法、设备和存储介质 |
CN111898211B (zh) * | 2020-08-07 | 2022-11-01 | 吉林大学 | 基于深度强化学习的智能车速度决策方法及其仿真方法 |
CN112580251B (zh) * | 2020-11-16 | 2022-07-12 | 北京理工大学 | 基于交通信息和模型预测控制的混动汽车能量管理方法 |
CN112700663A (zh) * | 2020-12-23 | 2021-04-23 | 大连理工大学 | 基于深度强化学习策略的多智能体智能信号灯路网控制方法 |
-
2021
- 2021-05-20 CN CN202110550474.3A patent/CN112989715B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112339756A (zh) * | 2020-10-14 | 2021-02-09 | 天津大学 | 一种基于强化学习的新能源汽车红绿灯路口能量回收优化速度规划算法 |
CN112669629A (zh) * | 2020-12-17 | 2021-04-16 | 北京建筑大学 | 一种基于深度强化学习的实时交通信号控制方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN112989715A (zh) | 2021-06-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112989715B (zh) | 一种燃料电池汽车多信号灯车速规划方法 | |
CN111061277B (zh) | 一种无人车全局路径规划方法和装置 | |
CN110341690B (zh) | 一种基于确定性策略梯度学习的phev能量管理方法 | |
CN109910909B (zh) | 一种多车运动状态的汽车轨迹网联交互式预测方法 | |
Bai et al. | Deep reinforcement learning based high-level driving behavior decision-making model in heterogeneous traffic | |
CN109726804A (zh) | 一种基于行车预测场和bp神经网络的智能车辆驾驶行为拟人化决策方法 | |
CN114103971B (zh) | 一种燃料电池汽车节能驾驶优化方法及装置 | |
Li et al. | Adaptive traffic signal control model on intersections based on deep reinforcement learning | |
CN114153213A (zh) | 一种基于路径规划的深度强化学习智能车行为决策方法 | |
CN113110052B (zh) | 一种基于神经网络和强化学习的混合能量管理方法 | |
CN112498334B (zh) | 智能网联混合动力汽车的鲁棒能量管理方法及系统 | |
CN115495997A (zh) | 一种基于异构多智能体深度强化学习的新能源汽车生态驾驶方法 | |
CN115534929A (zh) | 基于多元信息融合的插电式混合动力汽车能量管理方法 | |
Wang et al. | Building transportation foundation model via generative graph transformer | |
Gan et al. | Intelligent learning algorithm and intelligent transportation-based energy management strategies for hybrid electric vehicles: a review | |
Huang et al. | Energy saving performance improvement of intelligent connected PHEVs via NN-based lane change decision | |
CN114516336B (zh) | 一种考虑道路约束条件的车辆轨迹预测方法 | |
CN113071508B (zh) | 一种dcps架构下的车辆协同能量管理方法和系统 | |
WO2022028257A1 (zh) | 新能源车辆的能耗回收比预测方法、节能控制方法和系统 | |
CN114954498A (zh) | 基于模仿学习初始化的强化学习换道行为规划方法及系统 | |
Liu et al. | Adaptive eco-driving of fuel cell vehicles based on multi-light trained deep reinforcement learning | |
CN113435026A (zh) | 一种交通管控系统 | |
CN105138768A (zh) | 一种基于社区分解的多智能体系统一致性实现方法 | |
CN117708999B (zh) | 一种面向场景的混动汽车能量管理策略评价方法 | |
Gao et al. | Multi-Vehicles Decision-Making in Interactive Highway Exit: A Graph Reinforcement Learning Approach |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |