CN113085665B - 一种基于td3算法的燃料电池汽车能量管理方法 - Google Patents

一种基于td3算法的燃料电池汽车能量管理方法 Download PDF

Info

Publication number
CN113085665B
CN113085665B CN202110506276.7A CN202110506276A CN113085665B CN 113085665 B CN113085665 B CN 113085665B CN 202110506276 A CN202110506276 A CN 202110506276A CN 113085665 B CN113085665 B CN 113085665B
Authority
CN
China
Prior art keywords
fuel cell
power
battery
network
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110506276.7A
Other languages
English (en)
Other versions
CN113085665A (zh
Inventor
唐小林
周海涛
汪锋
胡晓松
邓忠伟
李佳承
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University
Original Assignee
Chongqing University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University filed Critical Chongqing University
Priority to CN202110506276.7A priority Critical patent/CN113085665B/zh
Publication of CN113085665A publication Critical patent/CN113085665A/zh
Application granted granted Critical
Publication of CN113085665B publication Critical patent/CN113085665B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60LPROPULSION OF ELECTRICALLY-PROPELLED VEHICLES; SUPPLYING ELECTRIC POWER FOR AUXILIARY EQUIPMENT OF ELECTRICALLY-PROPELLED VEHICLES; ELECTRODYNAMIC BRAKE SYSTEMS FOR VEHICLES IN GENERAL; MAGNETIC SUSPENSION OR LEVITATION FOR VEHICLES; MONITORING OPERATING VARIABLES OF ELECTRICALLY-PROPELLED VEHICLES; ELECTRIC SAFETY DEVICES FOR ELECTRICALLY-PROPELLED VEHICLES
    • B60L58/00Methods or circuit arrangements for monitoring or controlling batteries or fuel cells, specially adapted for electric vehicles
    • B60L58/30Methods or circuit arrangements for monitoring or controlling batteries or fuel cells, specially adapted for electric vehicles for monitoring or controlling fuel cells
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T90/00Enabling technologies or technologies with a potential or indirect contribution to GHG emissions mitigation
    • Y02T90/40Application of hydrogen technology to transportation, e.g. using fuel cells

Abstract

本发明涉及一种基于TD3算法的燃料电池汽车能量管理方法,属于新能源汽车领域。该方法包括:S1:获取燃料电池汽车的车辆状态信息、动力电池状态信息以及燃料电池状态信息;S2:建立燃料电池汽车能量管理系统模型,包括:整车纵向动力学模型、燃料电池氢耗模型、动力电池等效电路模型、燃料电池衰退模型、动力电池老化模型;S3:利用TD3算法构建燃料电池汽车能量管理策略,求解包含能耗经济性、燃料电池寿命以及动力电池寿命的多目标优化问题。本发明有效的提升了燃料电池汽车的经济性,同时保证了燃料电池以及动力电池的耐久性。

Description

一种基于TD3算法的燃料电池汽车能量管理方法
技术领域
本发明属于新能源汽车领域,涉及一种基于TD3算法的燃料电池汽车能量管理方法。
背景技术
目前,传统燃油汽车面临着石油资源有限以及尾气排放对环境的污染等难题,因此以清洁能源为燃料的新能源汽车成为汽车行业未来的发展趋势。作为一种理想的化石能源替代品,燃料电池具有效率高、无污染等优势,为此燃料电池混合动力汽车(FCHEV)得到了越来越多汽车厂商的重视。
作为FCHEV的关键技术,能量管理策略不但可以合理分配各动力源的需求功率,而且还能够有效提高车辆效率和燃油经济性。通常情况下,FCHEV的能量管理策略可分为:基于规则和基于优化。然而,现有的能量管理策略通常存在计算量大、优化性能不理想、适应性差等不足,限制着能量管理策略的实际应用。此外,燃料电池以及动力电池的寿命问题是制约燃料电池混合动力汽车发展的瓶颈技术。因此,亟需开展融合燃料电池以及动力电池寿命的能量管理策略的研究。
随着人工智能技术的不断发展,具有自学习以及实时性特点的深度强化学习算法在能量管理中的应用得到了广泛关注。同时,考虑到实际驾驶场景下驾驶员的动作是连续的。为此,综合考虑燃油经济性与系统寿命,提出一种基于连续动作的深度强化学习算法—TD3的能量管理方法。
发明内容
有鉴于此,本发明的目的在于提供一种基于TD3算法的燃料电池汽车能量管理方法,利用具有连续动作的深度强化学习算法—TD3提升燃料电池汽车整体的经济性,同时保证燃料电池以及动力电池的耐久性。
为达到上述目的,本发明提供如下技术方案:
一种基于TD3算法的燃料电池汽车能量管理方法,包括以下步骤:
S1:获取燃料电池汽车的车辆状态信息、动力电池状态信息以及燃料电池状态信息;
S2:建立燃料电池汽车能量管理系统模型,包括:整车纵向动力学模型、燃料电池氢耗模型、动力电池等效电路模型、燃料电池衰退模型、动力电池老化模型;
S3:利用双延迟深度确定性策略梯度算法(Twin Delayed Deep Deterministicpolicy gradient algorithm,TD3)算法构建燃料电池汽车能量管理策略,求解包含能耗经济性、燃料电池寿命以及动力电池寿命的多目标优化问题。
进一步,步骤S1中,所述车辆状态信息包括:车辆的速度、电机转速、电机效率以及传动系统;所述动力电池状态信息包括:电池电流、电压、内阻以及SOC;所述燃料电池状态信息包括:燃料电池的功率、效率以及氢耗。
进一步,步骤S2中,建立的整车纵向动力学模型为:
Figure GDA0003452173920000021
其中,Pdrive为驱动功率,Pm为需求功率,Pbat为电池功率,Pfc为燃料电池功率,mv为车辆的重量,v为速度,a为加速度,Faero为空气阻力,Froll为滚动摩擦,Fgrade为坡度阻力,ηmotor为电机效率,ηDC/DC为DC/DC转换器的效率,ηDC/AC为DC/AC转换器的效率。
进一步,步骤S2中,建立的燃料电池氢耗模型为:
Figure GDA0003452173920000022
其中,
Figure GDA0003452173920000023
为氢耗量,
Figure GDA0003452173920000024
为氢的低热值,ηfc为燃料电池效率,Pfc为燃料电池功率。
进一步,步骤S2中,建立的动力电池等效电路模型为:
Figure GDA0003452173920000025
Figure GDA0003452173920000026
其中,Ibat为锂离子电池电流,Voc为锂离子电池开路电压,Pbat为锂离子电池内阻,Pbat为电池功率,SOC(k+1)为下一时刻电池的荷电状态,SOC(k)为当前时刻电池的荷电状态,Δt为离散时间间隔,Qbat为锂离子电池容量。
进一步,步骤S2中,建立的燃料电池衰退模型为:
Figure GDA0003452173920000027
其中,k1为燃料电池输出功率等于或大于80%额定功率时的电压退化率,k2为燃料电池输出功率小于20%时的电压退化率,k3为瞬时负载变化时每千瓦的电压退化率,Phigh和Plow分别为燃料电池的高功率和低功率阈值,ΔP为每采样时间功率的变化,t1为工作点等于或大于80%额定功率的次数,t2为工作点的输出功率小于20%的次数。
进一步,步骤S2中,建立的动力电池老化模型为:
Qagring=(αSOC+β)·exp((-Ea+η·Crate)/Rgas·TK)Ahz
Figure GDA0003452173920000031
Figure GDA0003452173920000032
Figure GDA0003452173920000033
其中,Qaging为电池的容量衰减,α,β为拟合系数,Ea为活化能,Crate为电流充放电速率,η为Crate的补偿系数,Rgas为气体常数,TK为测试电池时的环境温度(K),Ah为安时通量,z为幂系数,Qaging,k+1为k+1时刻电池的容量衰减,Qaging,k为k时刻电池的容量衰减,ΔAh为k时刻到k+1时刻的安时通量的变化;Aheff为有效安时通量,电池老化的降低是通过最小化Aheff来实现的;σ为严重程度因子,Ibat为锂离子电池电流。
进一步,所述步骤S3具体包括以下步骤:
S31:状态变量空间为包含燃料电池功率Pfc、车辆的转速w、电池的荷电状态SOC以及电池安时通量Ah的集合,表示为:
S={Pfc,w,SOC,Ah}
S32:在TD3算法中,智能体将当前状态S作为演员网络的输入,并输出一个确定的动作;为了进一步的“探索与利用”,通过在确定动作的基础上增加噪声来选择最终动作;动作集A={Pfc};
S33:在智能体采取动作后,获得相应的奖励,奖励函数R定义为:
Figure GDA0003452173920000034
其中,α,β,λ,ω为权重系数;通过调整权重系数来实现燃料电池的氢消耗,燃料电池退化以及电池老化之间的平衡。在TD3算法中,智能体通过不断的学习执行具有较大奖励值的动作。DFC为燃料电池衰退容量,Aheff为有效安时通量。
S34:智能体在采取动作后,获得相应的奖励并且进入下一时刻状态S′,并在经验池中储存经验样本{S,A,R,S′};在经验样本数超过经验池容量时,新的采样经验会覆盖旧的经验;
S35:从经验池中随机抽取小批量经验样本,目标演员网络根据状态S′输出下一时刻动作A′;为了增加评论家网络对于动作波动的稳定性,对动作A′施加随机噪声,即:
A′=πφ′(S′)+∈
其中,πφ′为目标演员网络,∈为随机噪声;
S36:为了解决评论家网络的过估计现象,使用一对独立的评论家网络估计动作值函数;下一时刻的状态与动作作为目标评论家网络的输入,选择两个网络中输出的最小Q值计算目标值y;评论家网络目标值计算公式为:
Figure GDA0003452173920000041
其中,γ为折扣因子,
Figure GDA0003452173920000045
为目标评论家网络输出的Q值;然后,利用平方差损失函数更新评论家网络;
S37:更新策略网络时,使用评论家网络进行更新;其目标是使评论家网络输出的值尽可能的大,为此使用梯度上升法对策略网络进行更新,更新公式为:
Figure GDA0003452173920000042
其中,
Figure GDA0003452173920000043
为在状态S下,遵从π策略,做出动作所得到奖励的期望;
Figure GDA0003452173920000044
为演员网络梯度,
Figure GDA0003452173920000046
为评论家网络梯度。
S38:当评论家网络估值不准确的时候,演员网络会根据不准确的估值往错误的方向进行更新。因此,采用评论家网络延迟更新策略,以保证在策略更新前有效降低估计误差。
本发明的有益效果在于:
1)本发明在能量管理中采用了具有连续动作的深度强化学习算法-TD3,实现了策略的实时性与最优性。
2)本发明摆脱了对路况等先验信息的依赖性,通过不断的学习,实现了对不同路况的自适性。
3)本发明在考虑氢消耗的同时,还考虑到燃料电池以及动力电池的寿命问题。
本发明的其他优点、目标和特征在某种程度上将在随后的说明书中进行阐述,并且在某种程度上,基于对下文的考察研究对本领域技术人员而言将是显而易见的,或者可以从本发明的实践中得到教导。本发明的目标和其他优点可以通过下面的说明书来实现和获得。
附图说明
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作优选的详细描述,其中:
图1为本发明基于TD3算法的燃料电池汽车能量管理方法的流程图;
图2为燃料电池汽车动力系统结构示意图;
图3为TD3算法框架图。
具体实施方式
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需要说明的是,以下实施例中所提供的图示仅以示意方式说明本发明的基本构想,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
请参阅图1~图3,本发明设计了一种兼顾氢耗、燃料电池退化和电池老化的能量管理方法,通过使用具有连续动作的TD3算法,实现该策略的实时性以及最优性,优化了氢耗以及系统的寿命。如图1所述,该能量管理方法具体包括以下步骤:
S1:燃料电池汽车状态信息,包括:
车辆状态信息包括:车辆的速度、电机转速、电机效率,传动系统;
燃料电池状态信息包括:燃料电池的功率、效率以及氢耗;
动力电池状态信息包括:电池电流、电压、内阻以及SOC。
S2:建立燃料电池汽车能量管理系统模型,如图2所示:
S21:搭建整车纵向动力学模型:
Figure GDA0003452173920000051
其中,Pdrive为驱动功率,Pm为需求功率,Pbat为电池功率,Pfc为燃料电池功率,mv为车辆的重量,ηmotor为电机效率,v为速度,a为加速度,Faero为空气阻力,Froll为滚动摩擦,Fgrade为坡度阻力,ηDC/DC为DC/DC转换器的效率,ηDC/AC为DC/AC转换器的效率。
S22:搭建燃料电池氢耗模型:
Figure GDA0003452173920000052
其中,
Figure GDA0003452173920000053
为氢耗量,
Figure GDA0003452173920000054
为氢的低热值,ηfc为燃料电池效率,Pfc为燃料电池功率。
S23:搭建动力电池等效电路模型:
Figure GDA0003452173920000061
Figure GDA0003452173920000062
其中,Ibat为锂离子电池电流,Voc为锂离子电池开路电压,Pbat为锂离子电池内阻,SOC(k+1)为下一时刻电池的荷电状态,SOC(k)为当前时刻电池的荷电状态,Δt为离散时间间隔,Qbat为锂离子电池容量。
S24:搭建燃料电池退化模型:
Figure GDA0003452173920000063
其中,k1为燃料电池输出功率等于或大于80%额定功率时的电压退化率,k2为燃料电池输出功率小于20%时的电压退化率,k3为瞬时负载变化时每千瓦的电压退化率,Phigh和Plow分别为燃料电池的高功率和低功率阈值,ΔP为每采样时间功率的变化,t1为工作点等于或大于80%额定功率的次数,t2为工作点的输出功率小于20%的次数。
S25:搭建动力电池老化模型:
Qaging=(αSOC+β)·exp((-Ea+η·Crate)/Rgas·TK)Ahz
Figure GDA0003452173920000064
Figure GDA0003452173920000065
Figure GDA0003452173920000066
其中,Qaging为电池的容量衰减,α,β为拟合系数,Ea为活化能,Crate为电流充放电速率,η为Crate的补偿系数,Rgas为气体常数,Tk为测试电池时的环境温度(K),Ah为安时通量,z为幂律系数,Qaging,k+1为k+1时刻电池的容量衰减,Qaging,k为k时刻电池的容量衰减,ΔAh为k时刻到k+1时刻的安时通量的变化;Aheff为有效安时通量,电池老化的降低是通过最小化Aheff来实现的;σ为严重程度因子。
S3:利用TD3算法构建燃料电池汽车能量管理策略,求解包含能耗经济性、燃料电池寿命以及动力电池寿命的多目标优化问题。如图3所示,利用TD3算法实现燃料电池汽车的能量管理,降低燃料电池汽车的氢消耗并延长燃料电池以及动力电池的使用寿命,具体为:
S31:状态变量空间为包含燃料电池的功率,车辆的转速,电池的荷电状态以及电池安时通量的集合,表示为:
S={Pfc,w,SOC,Ah}
S32:在TD3算法中,智能体将当前状态S作为演员网络的输入,并输出一个确定的动作。为了进一步的“探索与利用”,通过在确定动作的基础上增加噪声来选择最终动作。动作集A={Pfc};
S33:在智能体采取动作后,获得相应的奖励,奖励函数R定义为:
Figure GDA0003452173920000071
其中,α,β,λ,ω为权重系数。通过调整权重系数来实现燃料电池的氢消耗,燃料电池退化以及电池老化之间的平衡。在TD3算法中,智能体通过不断的学习执行具有较大奖励值的动作。DFC为燃料电池衰退容量,Aheff为有效安时通量。
S34:智能体在采取动作后,获得相应的奖励并且进入下一时刻状态S′,并在经验池中储存经验样本{S,A,R,S′}。在经验样本数超过经验池容量时,新的采样经验会覆盖旧的经验。
S35:从经验池中随机抽取小批量经验样本,目标演员网络根据状态S′输出下一时刻动作A′;为了增加评论家网络对于动作波动的稳定性,对动作A′施加随机噪声,即:
A′=πφ′(S′)+∈
其中,πφ′为目标演员网络,∈为随机噪声。
S36:为了解决评论家网络的过估计现象,使用一对独立的评论家网络估计动作值函数;下一时刻的状态与动作作为目标评论家网络的输入,选择两个网络中输出的最小Q值计算目标值y。评论家网络目标值计算公式为:
Figure GDA0003452173920000072
其中,γ为折扣因子,
Figure GDA0003452173920000073
为目标评论家网络输出的Q值;然后,利用平方差损失函数更新评论家网络。
S37:更新策略网络时,使用评论家网络进行更新,其目标是使评论家网络输出的值尽可能的大,为此使用梯度上升法对策略网络进行更新,更新公式为:
Figure GDA0003452173920000074
其中,
Figure GDA0003452173920000075
为在状态S下,遵从π策略,做出动作所得到奖励的期望;
Figure GDA0003452173920000076
为演员网络梯度,
Figure GDA0003452173920000077
为评论家网络梯度。
S38:当评论家网络估值不准确的时候,演员网络会根据不准确的估值往错误的方向进行更新。因此,采用评论家网络延迟更新策略,以保证在策略更新前有效降低估计误差。
最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。

Claims (5)

1.一种基于TD3算法的燃料电池汽车能量管理方法,其特征在于,该方法包括以下步骤:
S1:获取燃料电池汽车的车辆状态信息、动力电池状态信息以及燃料电池状态信息;
S2:建立燃料电池汽车能量管理系统模型,包括:整车纵向动力学模型、燃料电池氢耗模型、动力电池等效电路模型、燃料电池衰退模型、动力电池老化模型;
建立的整车纵向动力学模型为:
Figure FDA0003452173910000011
其中,Pdrive为驱动功率,Pm为需求功率,Pbat为动力电池功率,Pfc为燃料电池功率,mv为车辆的重量,v为速度,a为加速度,Faero为空气阻力,Froll为滚动摩擦,Fgrade为坡度阻力,ηmotor为电机效率,ηDC/DC为DC/DC转换器的效率,ηDC/AC为DC/AC转换器的效率;
建立的燃料电池衰退模型为:
Figure FDA0003452173910000012
其中,k1为燃料电池输出功率等于或大于80%额定功率时的电压退化率,k2为燃料电池输出功率小于20%时的电压退化率,k3为瞬时负载变化时每千瓦的电压退化率,Phigh和Plow分别为燃料电池的高功率和低功率阈值,ΔP为每采样时间功率的变化,t1为工作点等于或大于80%额定功率的次数,t2为工作点的输出功率小于20%的次数;
建立的动力电池老化模型为:
Qaging=(αSOC+β)·exp((-Ea+η·Crate)/Rgas·TK)Ahz
Figure FDA0003452173910000013
Figure FDA0003452173910000014
Figure FDA0003452173910000015
其中,Qaging为电池的容量衰减,α,β为拟合系数,Ea为活化能,Crate为电流充放电速率,η为Crate的补偿系数,Rgas为气体常数,TK为测试电池时的环境温度,Ah为安时通量,z为幂系数,Qaging,k+1为k+1时刻电池的容量衰减,Qaging,k为k时刻电池的容量衰减,ΔAh为k时刻到k+1时刻的安时通量的变化;Aheff为有效安时通量,σ为严重程度因子,Ibat为锂离子电池电流;
S3:利用TD3算法构建燃料电池汽车能量管理策略,求解包含能耗经济性、燃料电池寿命以及动力电池寿命的多目标优化问题;所述TD3算法是双延迟深度确定性策略梯度算法。
2.根据权利要求1所述的燃料电池汽车能量管理方法,其特征在于,步骤S1中,所述车辆状态信息包括:车辆的速度、电机转速、电机效率以及传动系统;所述动力电池状态信息包括:电池电流、电压、内阻以及SOC;所述燃料电池状态信息包括:燃料电池的功率、效率以及氢耗。
3.根据权利要求1所述的燃料电池汽车能量管理方法,其特征在于,步骤S2中,建立的燃料电池氢耗模型为:
Figure FDA0003452173910000021
其中,
Figure FDA0003452173910000022
为氢耗量,
Figure FDA0003452173910000023
为氢的低热值,ηfc为燃料电池效率,Pfc为燃料电池功率。
4.根据权利要求1所述的燃料电池汽车能量管理方法,其特征在于,步骤S2中,建立的动力电池等效电路模型为:
Figure FDA0003452173910000024
Figure FDA0003452173910000025
其中,Ibat为锂离子电池电流,Voc为锂离子电池开路电压,Rbat为锂离子电池内阻,Pbat为电池功率,SOC(k+1)为下一时刻电池的荷电状态,SOC(k)为当前时刻电池的荷电状态,Δt为离散时间间隔,Qbat为锂离子电池容量。
5.根据权利要求1~4中任意一项所述的燃料电池汽车能量管理方法,其特征在于,所述步骤S3具体包括以下步骤:
S31:状态变量空间为包含燃料电池功率Pfc、车辆的转速w、电池的荷电状态SOC以及电池安时通量Ah的集合,表示为:
S={Pfc,w,SOC,Ah}
S32:在TD3算法中,智能体将当前状态S作为演员网络的输入,并输出一个确定的动作;通过在确定动作的基础上增加噪声来选择最终动作;动作集A={Pfc};
S33:在智能体采取动作后,获得相应的奖励,奖励函数R定义为:
Figure FDA0003452173910000031
其中,α,β,λ,ω为权重系数;DFC为燃料电池衰退容量,Aheff为有效安时通量;
S34:智能体在采取动作后,获得相应的奖励并且进入下一时刻状态S′,并在经验池中储存经验样本{S,A,R,S′};在经验样本数超过经验池容量时,新的采样经验会覆盖旧的经验;
S35:从经验池中随机抽取小批量经验样本,目标演员网络根据状态S′输出下一时刻动作A′;对动作A′施加随机噪声,即:
A'=πφ′(S')+∈
其中,πφ′为目标演员网络,∈为随机噪声;
S36:使用一对独立的评论家网络估计动作值函数;下一时刻的状态与动作作为目标评论家网络的输入,选择两个网络中输出的最小Q值计算目标值y;评论家网络目标值计算公式为:
Figure FDA0003452173910000032
其中,γ为折扣因子,
Figure FDA0003452173910000033
为目标评论家网络输出的Q值;然后,利用平方差损失函数更新评论家网络;
S37:更新策略网络时,使用评论家网络进行更新;使用梯度上升法对策略网络进行更新,更新公式为:
Figure FDA0003452173910000034
其中,
Figure FDA0003452173910000035
为在状态S下,遵从策略π,做出动作所得到奖励的期望;
Figure FDA0003452173910000036
为演员网络梯度,
Figure FDA0003452173910000037
为评论家网络梯度;
S38:当评论家网络估值不准确的时候,演员网络根据不准确的估值往错误的方向进行更新。
CN202110506276.7A 2021-05-10 2021-05-10 一种基于td3算法的燃料电池汽车能量管理方法 Active CN113085665B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110506276.7A CN113085665B (zh) 2021-05-10 2021-05-10 一种基于td3算法的燃料电池汽车能量管理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110506276.7A CN113085665B (zh) 2021-05-10 2021-05-10 一种基于td3算法的燃料电池汽车能量管理方法

Publications (2)

Publication Number Publication Date
CN113085665A CN113085665A (zh) 2021-07-09
CN113085665B true CN113085665B (zh) 2022-02-11

Family

ID=76664825

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110506276.7A Active CN113085665B (zh) 2021-05-10 2021-05-10 一种基于td3算法的燃料电池汽车能量管理方法

Country Status (1)

Country Link
CN (1) CN113085665B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113085666B (zh) * 2021-05-18 2022-05-10 北京理工大学 一种分层式燃料电池汽车节能驾驶方法
CN113492727B (zh) * 2021-08-20 2022-07-19 重庆交通职业学院 一种基于empc的燃料电池混合动力系统控制方法
CN114889498B (zh) * 2022-05-07 2023-12-15 苏州市华昌能源科技有限公司 一种氢电混合动力系统的功率优化分配方法
CN115503559B (zh) * 2022-11-07 2023-05-02 重庆大学 考虑空调系统的燃料电池汽车学习型协同能量管理方法
CN117595261B (zh) * 2024-01-19 2024-03-26 石家庄科林电气股份有限公司 光储微电网能量管理策略优化方法、装置及电子设备

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102417895B1 (ko) * 2017-06-21 2022-07-07 현대자동차주식회사 연료전지 수명 예측 장치 및 방법, 그리고 차량 시스템
CN111976707B (zh) * 2020-09-07 2022-06-03 重庆大学 基于凸优化考虑电机热状态的混合动力汽车能量管理方法
CN112231830B (zh) * 2020-09-30 2022-04-08 浙江大学 基于自适应等效因子的混合动力车辆多目标优化控制方法
CN112287463B (zh) * 2020-11-03 2022-02-11 重庆大学 一种基于深度强化学习算法的燃料电池汽车能量管理方法

Also Published As

Publication number Publication date
CN113085665A (zh) 2021-07-09

Similar Documents

Publication Publication Date Title
CN113085665B (zh) 一种基于td3算法的燃料电池汽车能量管理方法
Li et al. Adaptive energy management strategy for fuel cell/battery hybrid vehicles using Pontryagin's Minimal Principle
CN112287463B (zh) 一种基于深度强化学习算法的燃料电池汽车能量管理方法
Sun et al. An energy management strategy for plug-in hybrid electric vehicles based on deep learning and improved model predictive control
Li et al. Energy management strategy for a series hybrid electric vehicle using improved deep Q-network learning algorithm with prioritized replay
Li et al. A novel combinatorial optimization algorithm for energy management strategy of plug-in hybrid electric vehicle
CN113554337B (zh) 融合交通信息的插电式混动汽车能量管理策略构建方法
CN112526883B (zh) 一种基于智能网联信息的整车能量管理方法
CN107539306A (zh) 基于模糊小脑模型神经网络的汽车转矩分配控制方法
Veerendra et al. Hybrid power management for fuel cell/supercapacitor series hybrid electric vehicle
CN112319462B (zh) 一种插电式混合动力汽车能量管理方法
CN110247451A (zh) 一种锂离子动力电池组全寿命周期均衡控制方法
CN115476841A (zh) 一种基于改进多目标ddpg的插电式混动汽车能量管理方法
CN115284973A (zh) 基于改进多目标Double DQN的燃料电池汽车能量管理方法
Zhang et al. A double‐deep Q‐network‐based energy management strategy for hybrid electric vehicles under variable driving cycles
CN116461391A (zh) 一种燃料电池混动汽车能量管理方法
Zhang et al. Comparative study of equivalent factor adjustment algorithm for equivalent consumption minimization strategy for HEVs
Pérez-Pimentel et al. Power supply management for an electric vehicle using fuzzy logic
Hai et al. Deep learning-based prediction of lithium-ion batteries state of charge for electric vehicles in standard driving cycle
CN115307650A (zh) 一种基于深度学习的电动汽车充电路径规划方法
CN114291067A (zh) 基于预测的混合动力汽车凸优化能量控制方法及系统
CN114670803A (zh) 基于自我监督学习的并联式混合动力汽车能量管理方法
Odeim Optimization of fuel cell hybrid vehicles
Janulin et al. Energy Minimization in City Electric Vehicle using Optimized Multi-Speed Transmission
Yu et al. Research on shift schedule of hybrid bus based on dynamic programming algorithm

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant