CN111959509B - 基于状态空间域电池能量均衡的q学习再生制动控制策略 - Google Patents

基于状态空间域电池能量均衡的q学习再生制动控制策略 Download PDF

Info

Publication number
CN111959509B
CN111959509B CN202010839976.3A CN202010839976A CN111959509B CN 111959509 B CN111959509 B CN 111959509B CN 202010839976 A CN202010839976 A CN 202010839976A CN 111959509 B CN111959509 B CN 111959509B
Authority
CN
China
Prior art keywords
state
energy
battery
soc
req
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010839976.3A
Other languages
English (en)
Other versions
CN111959509A (zh
Inventor
尹燕莉
张刘峰
潘小亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing Jiaotong University
Original Assignee
Chongqing Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing Jiaotong University filed Critical Chongqing Jiaotong University
Priority to CN202010839976.3A priority Critical patent/CN111959509B/zh
Publication of CN111959509A publication Critical patent/CN111959509A/zh
Application granted granted Critical
Publication of CN111959509B publication Critical patent/CN111959509B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W30/00Purposes of road vehicle drive control systems not related to the control of a particular sub-unit, e.g. of systems using conjoint control of vehicle sub-units
    • B60W30/18Propelling the vehicle
    • B60W30/18009Propelling the vehicle related to particular drive situations
    • B60W30/18109Braking
    • B60W30/18127Regenerative braking
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60LPROPULSION OF ELECTRICALLY-PROPELLED VEHICLES; SUPPLYING ELECTRIC POWER FOR AUXILIARY EQUIPMENT OF ELECTRICALLY-PROPELLED VEHICLES; ELECTRODYNAMIC BRAKE SYSTEMS FOR VEHICLES IN GENERAL; MAGNETIC SUSPENSION OR LEVITATION FOR VEHICLES; MONITORING OPERATING VARIABLES OF ELECTRICALLY-PROPELLED VEHICLES; ELECTRIC SAFETY DEVICES FOR ELECTRICALLY-PROPELLED VEHICLES
    • B60L7/00Electrodynamic brake systems for vehicles in general
    • B60L7/10Dynamic electric regenerative braking
    • B60L7/18Controlling the braking effect
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W50/00Details of control systems for road vehicle drive control not related to the control of a particular sub-unit, e.g. process diagnostic or vehicle driver interfaces
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W50/00Details of control systems for road vehicle drive control not related to the control of a particular sub-unit, e.g. process diagnostic or vehicle driver interfaces
    • B60W2050/0001Details of the control system
    • B60W2050/0019Control system elements or transfer functions

Landscapes

  • Engineering & Computer Science (AREA)
  • Transportation (AREA)
  • Mechanical Engineering (AREA)
  • Automation & Control Theory (AREA)
  • Power Engineering (AREA)
  • Human Computer Interaction (AREA)
  • Electric Propulsion And Braking For Vehicles (AREA)

Abstract

本申请提供一种基于状态空间域电池能量均衡的Q学习再生制动控制策略,所述策略包括以下步骤:S1:基于电池能量时域‑空间域转换,确定再生制动参考平均回收能量;S2:构建修正函数,修正所述参考平均回收能量;S3:根据修正后的参考平均回收能量和Q学习算法,确定电机再生转矩最优分配策略,即电机再生转矩分配MAP图;S4:采集在线工况数据,确定所述在线工况数据确定平均车速V、电池荷电状态SOC和需求功率Preq,根据所述需求功率Preq和电池荷电状态SOC在步骤S3的MAP图中确定与所述在线工况数据的对应的电机再生转矩分配值,即获得在线工况电机再生转矩序列。本申请的控制策略能实现再生制动过程中每一状态的电池能量全局均衡控制。

Description

基于状态空间域电池能量均衡的Q学习再生制动控制策略
技术领域
本发明涉及混合动力再生制动控制技术领域,尤其涉及一种基于状态空间域电池能量均衡的Q学习再生制动控制策略。
背景技术
再生制动在制动工况将电动机切换成发电机运转,利用车的惯性带动电动机转子旋转而产生反转力矩,将一部分的动能或势能转化为电能并加以储存或利用,是能量回收的过程。再生制动控制策略是混合动力汽车提高能量利用率的一项关键技术。混合动力汽车电池能量本质上来源于燃油能量与制动回收。在整车运行中,电池起到一个对能量利用率的调节作用,以使得整车的能量流更加的稳定与高效。通过对混合动力汽车电池功能特性的分析可知,电池荷电状态(SOC)在工况结束时要尽可能的与初始SOC接近,因此,在制定混合动力汽车再生制动策略时不仅要确保能量回收最大化,还要确保电池能量全局均衡变化。为了保持再生制动过程中电池能量变化均衡,通过限制SOC保持电池能量变化均衡的方法被广泛应用到再生制动控制策略中,但现有控制方法未能从全局的角度考虑每一状态的电池能量均衡,难以做到能量回收最大化与电池能量变化平衡的均衡控制。
因此,亟需一种能够实现能量回收最大化和保持电池能量全局均衡的再生制动控制方法。
发明内容
有鉴于此,本发明提供一种基于状态空间域电池能量均衡的Q学习再生制动控制策略,其特征在于:所述策略包括以下步骤:
S1:基于电池能量时域-空间域转换,确定再生制动参考平均回收能量;
S2:构建修正函数,修正所述参考平均回收能量;
S3:根据修正后的参考平均回收能量和Q学习算法,确定电机再生转矩最优分配策略,即电机再生转矩分配MAP图;
S4:采集在线工况数据,确定所述在线工况数据确定平均车速V、电池荷电状态SOC和需求功率Preq,根据所述需求功率Preq和电池荷电状态SOC在步骤S3的MAP图中确定与所述在线工况数据的对应的电机再生转矩分配值,即获得在线工况电机再生转矩序列。
进一步,所述再生制动参考平均回收能量采用如法方法确定:
S11:选择离线工况的平均车速为状态,将平均车速离散得到状态集S:
Figure BDA0002641096610000021
其中,S表示状态集合,
Figure BDA0002641096610000022
表示离散后的第一个状态,
Figure BDA0002641096610000023
表示离散后的第k个状态,
Figure BDA0002641096610000024
表示离散后的第n个状态;
S12:将电池时域能量转换到空间域能量,从空间维度计算第k个状态的电池能量变化值Δebk
Figure BDA0002641096610000025
其中,Δebk表示第k个状态电池能量变化值,Δebk-out表示第k个状态驱动过程电池变化的能量,Δebk-in表示第k个状态制动过程电池变化的能量,τ表示第k个状态在时域上发生电池能量变化的时间;
S13:由第k个状态的电池能量变化值Δebk,计算第k个状态的制动过程参考平均回收能量
Figure BDA0002641096610000026
Figure BDA0002641096610000027
其中,
Figure BDA0002641096610000028
表示第k个状态再生制动参考平均回收能量的等效油耗,λ表示等效因子,
Figure BDA0002641096610000029
表示第k个状态再生制动参考平均回收能量;
所述等效因子λ采用如下方法确定:
Figure BDA0002641096610000031
其中,
Figure BDA0002641096610000032
表示电机的平均效率,
Figure BDA0002641096610000033
表示发动机的平均效率,
Figure BDA0002641096610000034
表示电池平均放电效率,
Figure BDA0002641096610000035
表示电池平均充电效率;
所述第k个状态再生制动参考平均回收能量
Figure BDA0002641096610000036
采用如下方法确定:
Figure BDA0002641096610000037
其中,
Figure BDA0002641096610000038
表示第k个状态再生制动参考平均回收能量,Δebk-tra表示第k个状态驱动过程电池能量变化值,Tbk,bra表示第k个状态发生制动的时间;
所述第k个状态驱动部分电池能量变化值Δebk-tra采用如下方法确定;
Δebk,tra=∫tractionΔebk-outdt (6)
其中,Δebk-tra表示第k个状态驱动过程电池能量变化值,Δebk-out表示第k个状态电池驱动过程变化的能量,t表示时间。
进一步,所述修正函数f(ΔPreq,ΔSOC)采用如下方法确定;
Figure BDA0002641096610000039
其中,f(ΔPreq,ΔSOC)表示修正函数,Preq,i表示当前状态第i个需求功率,SOCj表示当前状态第j个电池荷电状态,
Figure BDA00026410966100000310
表示当前状态下的平均需求功率,
Figure BDA00026410966100000311
分别为当前状态下的平均电池荷电状态SOC,SOCref表示参考电池荷电状态的参考值;
所述参考平均回收能量采用如下方法修正:
Figure BDA00026410966100000312
其中,
Figure BDA00026410966100000313
表示第k个状态下Preq,i与SOCj对应的修正后的参考回收能量,Preq,i表示第k个状态的第i个需求功率,SOCj表示第k个状态的第j个电池荷电状态,f(ΔPreq,ΔSOC)表示修正函数,
Figure BDA0002641096610000041
表示第k个状态再生制动参考平均回收能量的等效油耗。
进一步,所述电机再生转矩最优分配MAP图采用如下方法确定:
S31:初始化Q学习算法的探索率ε、学习率α、折扣因子γ和设置迭代次数N和状态变量k,其中,N=1,k=1;
S32:令s=[SOC,v,Preq],a=[Tm],即选择车速v,电池荷电状态SOC和需求功率Preq为状态变量,电机转矩Tm为优化变量;
S33:构建回报函数r(s,a),所述回报函数r(s,a)如下:
Figure BDA0002641096610000042
其中,r(s,a)表示当前状态s与动作a的回报,aele表示当前状态s与对应动作a的电池能量变化值,λ为等效因子,
Figure BDA0002641096610000043
表示当前车速下的需求功率Preq和电池荷电状态SOC对应的参考回收量,β表示权重因子;
S34:确定最小Q(s,a)值对应的动作:
Figure BDA0002641096610000044
其中,π(a|s)表示最小Q(s,a)值对应的动作策略,ε表示探索率,α表示学习率,A(s)表示当前状态s下可行动作的总个数;
S35:更新当前动作Q(s,a)值:
Q(s,a)←Q(s,a)+α[r+γminQ(s',a')-Q(s,a)] (11)
其中,α表示学习率,r表示当前状态s与动作a对应的回报,γ表示折扣因子;
S36:判断k是否小于kfinal,其中,k表示状态变量,kfinal表示最终状态的变量值,即判断当前状态是否为最终状态,若是,则进入下一步,若否,k=k+1,并进入步骤S32;
S37:判断相邻迭代次数的Q(s,a)值的绝对值之差是否小于阈值,若是,表明策略收敛,结束,若否,N=N+1,并进入步骤S32;
收敛后的Q(s,a)值对应的策略作为最优策略。
本发明的有益技术效果:基于电池能量与时间对应的同时又与状态一一对应,本申请将基于电池时域能量关系转换为基于平均车速的电池空间域能量关系,从电池能量空间域的维度出发,建立了以平均车速为状态的离线工况电池能量空间化数值模型,运用Q学习算法,在获得电池能量全局均衡变化策略的同时并运用电池能量空间域全局均衡的理论,在实现电池驱动和制动工况能量平衡的基础上,实现制动能量回收最大化。
附图说明
下面结合附图和实施例对本发明作进一步描述:
图1为本发明的流程图。
图2为本发明获得参考回收能量的流程图。
图3为本发明基于状态空间域电池能量均衡的Q学习再生制动控制策略的流程图。
图4为本申请确定在线工况电机再生转矩序列的流程图。
具体实施方式
以下结合说明书附图对本发明做出进一步的说明:
本发明提供的一种基于状态空间域电池能量均衡的Q学习再生制动控制策略,其特征在于:所述策略包括以下步骤:如图1所示,
S1:基于电池能量时域-空间域转换,确定再生制动参考平均回收能量;
S2:构建修正函数,修正所述参考平均回收能量;
S3:根据修正后的参考平均回收能量和Q学习算法,确定电机再生转矩最优分配策略,即电机再生转矩分配MAP图;其中,MAP图表示发动机在各种工况下所需的点火控制曲线图;
S4:采集在线工况数据,确定所述在线工况数据确定平均车速V、电池荷电状态SOC和需求功率Preq,根据所述需求功率Preq和电池荷电状态SOC在步骤S3的MAP图中确定与所述在线工况数据的对应的电机再生转矩分配值,即获得在线工况电机再生转矩序列。
在本实施例中,如图2所示,所述再生制动参考平均回收能量采用如法方法确定:
S11:选择离线工况的平均车速为状态,将平均车速离散得到状态集S:
Figure BDA0002641096610000061
其中,S表示状态集合,
Figure BDA0002641096610000062
表示离散后的第一个状态,
Figure BDA0002641096610000063
表示离散后的第k个状态,
Figure BDA0002641096610000064
表示离散后的第n个状态;
S12:将电池时域能量转换到空间域能量,从空间维度计算第k个状态的电池能量变化值Δebk
Δebk=∫tractionΔebk-outdτ+∫brakingΔebk-indτ (2)
其中,Δebk表示第k个状态电池能量变化值,Δebk-out表示第k个状态驱动过程电池变化的能量,Δebk-in表示第k个状态制动过程电池变化的能量,τ表示第k个状态在时域上发生电池能量变化的时间;
S13:由第k个状态的电池能量变化值Δebk,计算第k个状态的制动过程参考平均回收能量
Figure BDA0002641096610000065
Figure BDA0002641096610000066
其中,
Figure BDA0002641096610000067
表示第k个状态再生制动参考平均回收能量的等效油耗,λ表示等效因子,
Figure BDA0002641096610000068
表示第k个状态再生制动参考平均回收能量;
所述等效因子λ采用如下方法确定:
Figure BDA0002641096610000069
其中,
Figure BDA00026410966100000610
表示电机的平均效率,
Figure BDA00026410966100000611
表示发动机的平均效率,
Figure BDA00026410966100000612
表示电池平均放电效率,
Figure BDA0002641096610000071
表示电池平均充电效率;
所述第k个状态再生制动参考平均回收能量
Figure BDA0002641096610000072
采用如下方法确定:
Figure BDA0002641096610000073
其中,
Figure BDA0002641096610000074
表示第k个状态再生制动参考平均回收能量,Δebk-tra表示第k个状态驱动过程电池能量变化值,Tbk,bra表示第k个状态发生制动的时间;
所述第k个状态驱动部分电池能量变化值Δebk-tra采用如下方法确定;
Δebk,tra=∫tractionΔebk-outdt (6)
其中,Δebk-tra表示第k个状态驱动过程电池能量变化值,Δebk-out表示第k个状态电池驱动过程变化的能量,t表示时间。
电池时域能量,没有考虑状态驱动过程电池能量全局变化,不能获得每一状态的电池能量全局均衡;将电池时域能量转换为空间域能量可以有效地将独立的状态能量均衡聚类到多种单一状态能量均衡,实现状态的驱动与制动过程电池能量全局均衡。
在本实施例中,所述修正函数f(Preq,SOC)采用如下方法确定;
Figure BDA0002641096610000075
其中,f(ΔPreq,ΔSOC)表示修正函数,Preq,i表示当前状态第i个需求功率,SOCj表示当前状态第j个电池荷电状态,
Figure BDA0002641096610000076
表示当前状态下的平均需求功率,
Figure BDA0002641096610000077
分别为当前状态下的平均电池荷电状态SOC,SOCref表示参考电池荷电状态的参考值;
所述参考平均回收能量采用如下方法修正:
Figure BDA0002641096610000078
其中,
Figure BDA0002641096610000079
表示第k个状态下Preq,i与SOCj对应的修正后的参考回收能量,Preq,i表示第k个状态的第i个需求功率,SOCj表示第k个状态的第j个电池荷电状态,f(ΔPreq,ΔSOC)表示修正函数,
Figure BDA0002641096610000081
表示第k个状态再生制动参考平均回收能量的等效油耗。
对于同一平均车速,其所对应的需求功率Preq和电池SOC有不同的组合。状态组合不同,参考回收能量也是不同的。比如:当Preq较大,SOC较低时,参考回收能量应高于参考平均回收能量;当Preq较小,SOC较高时,参考回收能量应低于参考平均回收能量。在整车再生制动过程优化中,同一平均车速下,不同的Preq和SOC组合回收能量不同。当Preq绝对值高于
Figure BDA0002641096610000082
SOC低于SOCref时,参考回收能量具有增大的趋势;相反,具有减小的趋势。参考回收能量与状态组合的变化趋势,通过修正系数对平均参考回收能量的修正,可以实现不同状态组合回收能量的动态调整,获得能适应不同状态组合的参考回收能量,增强本申请提供的再生制动策略的适应性。
在本实施例中,如图3所示,所述电机再生转矩最优分配MAP图采用如下方法确定:
S31:初始化Q学习算法的探索率ε、学习率α、折扣因子γ和设置迭代次数N和状态变量k,其中,N=1,k=1;
S32:令s=[SOC,v,Preq],a=[Tm],即选择车速v,电池荷电状态SOC和需求功率Preq为状态变量,电机转矩Tm为优化变量;
S33:构建回报函数r(s,a),所述回报函数r(s,a)如下:
Figure BDA0002641096610000083
其中,r(s,a)表示当前状态s与动作a的回报,aele表示当前状态s与对应动作a的电池能量变化值,λ为等效因子,
Figure BDA0002641096610000084
表示当前车速下的需求功率Preq和电池荷电状态SOC对应的参考回收量,β表示##;
S34:确定最小Q(s,a)值对应的动作:
Figure BDA0002641096610000091
其中,π(a|s)表示最小Q(s,a)值对应的动作策略,ε表示探索率,α表示学习率,A(s)表示##;
S35:更新当前动作Q(s,a)值:
Q(s,a)←Q(s,a)+α[r+γminQ(s',a')-Q(s,a)] (11)
其中,α表示学习率,r表示当前状态s与动作a对应的回报,γ表示折扣因子;
S36:判断k是否小于kfinal,其中,k表示状态变量,kfinal表示最终状态的变量值,即判断当前状态是否为最终状态,若是,则进入下一步,若否,k=k+1,并进入步骤S32;
S37:判断相邻迭代次数的Q(s,a)值的绝对值之差是否小于阈值,若是,表明策略收敛,结束,若否,N=N+1,并进入步骤S32;
收敛后的Q(s,a)值对应的策略作为最优策略。
Q学习算法是一种智能算法,将时域状态转化为空间域,可以对每一状态的最优策略进行迭代优化,优化结果为每一状态的最优策略MAP图,降低了优化结果对工况的耦合性,提升了优化结果对其他工况的适应性。
最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。

Claims (3)

1.一种基于状态空间域电池能量均衡的Q学习再生制动控制策略,其特征在于:所述策略包括以下步骤:
S1:基于电池能量时域-空间域转换,确定再生制动参考平均回收能量;
S2:构建修正函数,修正所述参考平均回收能量;
S3:根据修正后的参考平均回收能量和Q学习算法,确定电机再生转矩最优分配策略,即电机再生转矩分配MAP图;
S4:采集在线工况数据,确定所述在线工况数据确定平均车速V、电池荷电状态SOC和需求功率Preq,根据所述需求功率Preq和电池荷电状态SOC在步骤S3的MAP图中确定与所述在线工况数据的对应的电机再生转矩分配值,即获得在线工况电机再生转矩序列;
所述再生制动参考平均回收能量采用如下方法确定:
S11:选择离线工况的平均车速为状态,将平均车速离散得到状态集S:
Figure FDA0003603322690000011
其中,S表示状态集合,
Figure FDA0003603322690000012
表示离散后的第一个状态,
Figure FDA0003603322690000013
表示离散后的第k个状态,
Figure FDA0003603322690000014
表示离散后的第n个状态;
S12:将电池时域能量转换到空间域能量,从空间维度计算第k个状态的电池能量变化值△ebk
△ebk=∫traction△ebk-outdτ+∫braking△ebk-indτ (2)
其中,△ebk表示第k个状态电池能量变化值,△ebk-out表示第k个状态驱动过程电池变化的能量,△ebk-in表示第k个状态制动过程电池变化的能量,τ表示第k个状态在时域上发生电池能量变化的时间;
S13:由第k个状态的电池能量变化值△ebk,计算第k个状态的制动过程参考平均回收能量
Figure FDA0003603322690000015
Figure FDA0003603322690000016
其中,
Figure FDA0003603322690000021
表示第k个状态再生制动参考平均回收能量的等效油耗,λ表示等效因子,
Figure FDA0003603322690000022
表示第k个状态再生制动参考平均回收能量;
所述等效因子λ采用如下方法确定:
Figure FDA0003603322690000023
其中,
Figure FDA0003603322690000024
表示电机的平均效率,
Figure FDA0003603322690000025
表示发动机的平均效率,
Figure FDA0003603322690000026
表示电池平均放电效率,
Figure FDA0003603322690000027
表示电池平均充电效率;
所述第k个状态再生制动参考平均回收能量
Figure FDA0003603322690000028
采用如下方法确定:
Figure FDA0003603322690000029
其中,
Figure FDA00036033226900000210
表示第k个状态再生制动参考平均回收能量,△ebk-tra表示第k个状态驱动过程电池能量变化值,Tbk,bra表示第k个状态发生制动的时间;
所述第k个状态驱动部分电池能量变化值△ebk-tra采用如下方法确定;
△ebk,tra=∫traction△ebk-outdt (6)
其中,△ebk-tra表示第k个状态驱动过程电池能量变化值,△ebk-out表示第k个状态电池驱动过程变化的能量,t表示时间。
2.根据权利要求1所述基于状态空间域电池能量均衡的Q学习再生制动控制策略,其特征在于:所述修正函数f(△Preq,△SOC)采用如下方法确定;
Figure FDA00036033226900000211
其中,f(△Preq,△SOC)表示修正函数,Preq,i表示当前状态第i个需求功率,SOCj表示当前状态第j个电池荷电状态,
Figure FDA00036033226900000212
表示当前状态下的平均需求功率,
Figure FDA00036033226900000213
分别为当前状态下的平均电池荷电状态SOC,SOCref表示参考电池荷电状态的参考值;
所述参考平均回收能量采用如下方法修正:
Figure FDA0003603322690000031
其中,
Figure FDA0003603322690000032
表示第k个状态下Preq,i与SOCj对应的修正后的参考回收能量,Preq,i表示第k个状态的第i个需求功率,SOCj表示第k个状态的第j个电池荷电状态,f(△Preq,△SOC)表示修正函数,
Figure FDA0003603322690000033
表示第k个状态再生制动参考平均回收能量的等效油耗。
3.根据权利要求2所述基于状态空间域电池能量均衡的Q学习再生制动控制策略,其特征在于:所述电机再生转矩最优分配MAP图采用如下方法确定:
S31:初始化Q学习算法的探索率ε、学习率α、折扣因子γ和设置迭代次数N和状态变量k,其中,N=1,k=1;
S32:令s=[SOC,v,Preq],a=[Tm],即选择车速v,电池荷电状态SOC和需求功率Preq为状态变量,电机转矩Tm为优化变量;
S33:构建回报函数r(s,a),所述回报函数r(s,a)如下:
Figure FDA0003603322690000034
其中,r(s,a)表示当前状态s与动作a的回报,aele表示当前状态s与对应动作a的电池能量变化值,λ为等效因子,
Figure FDA0003603322690000035
表示当前车速下的需求功率Preq和电池荷电状态SOC对应的参考回收量,β表示权重因子;
S34:确定最小Q(s,a)值对应的动作:
Figure FDA0003603322690000036
其中,π(a|s)表示最小Q(s,a)值对应的动作策略,ε表示探索率,α表示学习率,A(s)表示当前状态s下可行动作的总个数;
S35:更新当前动作Q(s,a)值:
Q(s,a)←Q(s,a)+α[r+γminQ(s',a')-Q(s,a)] (11)
其中,α表示学习率,r表示当前状态s与动作a对应的回报,γ表示折扣因子;
S36:判断k是否小于kfinal,其中,k表示状态变量,kfinal表示最终状态的变量值,即判断当前状态是否为最终状态,若是,则进入下一步,若否,k=k+1,并进入步骤S32;
S37:判断相邻迭代次数的Q(s,a)值的绝对值之差是否小于阈值,若是,表明策略收敛,结束,若否,N=N+1,并进入步骤S32;
收敛后的Q(s,a)值对应的策略作为最优策略。
CN202010839976.3A 2020-08-19 2020-08-19 基于状态空间域电池能量均衡的q学习再生制动控制策略 Active CN111959509B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010839976.3A CN111959509B (zh) 2020-08-19 2020-08-19 基于状态空间域电池能量均衡的q学习再生制动控制策略

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010839976.3A CN111959509B (zh) 2020-08-19 2020-08-19 基于状态空间域电池能量均衡的q学习再生制动控制策略

Publications (2)

Publication Number Publication Date
CN111959509A CN111959509A (zh) 2020-11-20
CN111959509B true CN111959509B (zh) 2022-06-17

Family

ID=73389406

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010839976.3A Active CN111959509B (zh) 2020-08-19 2020-08-19 基于状态空间域电池能量均衡的q学习再生制动控制策略

Country Status (1)

Country Link
CN (1) CN111959509B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111959509B (zh) * 2020-08-19 2022-06-17 重庆交通大学 基于状态空间域电池能量均衡的q学习再生制动控制策略
CN113342367B (zh) * 2021-07-04 2024-03-29 聊城大学 一种基于Q-Learning强化学习的状态空间缩减方法

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB0123907D0 (en) * 2000-11-03 2001-11-28 Ford Motor Co A method and apparatus for controlling battery charging in a hybrid electric vehicle
CN108832611A (zh) * 2018-06-11 2018-11-16 西南交通大学 一种轨道交通应急电源系统与控制方法
CN110667395A (zh) * 2019-09-30 2020-01-10 重庆大学 基于制动工况的两挡自动变速箱的纯电动汽车换挡规律多目标优化方法
CN110682905A (zh) * 2019-10-12 2020-01-14 重庆大学 基于行驶里程的时域中电池荷电状态参考变化量获取方法
JP2020018159A (ja) * 2018-05-15 2020-01-30 タタ コンサルタンシー サービシズ リミテッドTATA Consultancy Services Limited 負荷需要の時間的−空間的予測を提供する方法及びシステム
CN111267830A (zh) * 2020-02-10 2020-06-12 南京航空航天大学 一种混合动力公交车能量管理方法、设备和存储介质
WO2020143495A1 (zh) * 2019-01-10 2020-07-16 乾碳国际公司 混动商用车再生制动和缓速系统
CN111959509A (zh) * 2020-08-19 2020-11-20 重庆交通大学 基于状态空间域电池能量均衡的q学习再生制动控制策略
CN112977402A (zh) * 2019-12-13 2021-06-18 现代自动车株式会社 混合动力车辆及其控制方法
CN113054751A (zh) * 2021-03-25 2021-06-29 北京交通大学 基于信息交互的城轨交通车地储能系统协调优化方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7621262B2 (en) * 2007-05-10 2009-11-24 Ford Global Technologies, Llc Hybrid thermal energy conversion for HCCI heated intake charge system
US20130204490A1 (en) * 2012-02-08 2013-08-08 Bendix Commercial Vehicle Systems Llc Uphill vehicle orientation adjusted compressor control
JP6187268B2 (ja) * 2014-01-10 2017-08-30 トヨタ自動車株式会社 電動車両
KR101655609B1 (ko) * 2014-12-11 2016-09-07 현대자동차주식회사 하이브리드 자동차의 배터리 충전 상태 제어 장치 및 방법

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB0123907D0 (en) * 2000-11-03 2001-11-28 Ford Motor Co A method and apparatus for controlling battery charging in a hybrid electric vehicle
JP2020018159A (ja) * 2018-05-15 2020-01-30 タタ コンサルタンシー サービシズ リミテッドTATA Consultancy Services Limited 負荷需要の時間的−空間的予測を提供する方法及びシステム
CN108832611A (zh) * 2018-06-11 2018-11-16 西南交通大学 一种轨道交通应急电源系统与控制方法
WO2020143495A1 (zh) * 2019-01-10 2020-07-16 乾碳国际公司 混动商用车再生制动和缓速系统
CN110667395A (zh) * 2019-09-30 2020-01-10 重庆大学 基于制动工况的两挡自动变速箱的纯电动汽车换挡规律多目标优化方法
CN110682905A (zh) * 2019-10-12 2020-01-14 重庆大学 基于行驶里程的时域中电池荷电状态参考变化量获取方法
CN112977402A (zh) * 2019-12-13 2021-06-18 现代自动车株式会社 混合动力车辆及其控制方法
CN111267830A (zh) * 2020-02-10 2020-06-12 南京航空航天大学 一种混合动力公交车能量管理方法、设备和存储介质
CN111959509A (zh) * 2020-08-19 2020-11-20 重庆交通大学 基于状态空间域电池能量均衡的q学习再生制动控制策略
CN113054751A (zh) * 2021-03-25 2021-06-29 北京交通大学 基于信息交互的城轨交通车地储能系统协调优化方法

Also Published As

Publication number Publication date
CN111959509A (zh) 2020-11-20

Similar Documents

Publication Publication Date Title
CN109693578B (zh) 一种燃料电池车整车功率分配控制方法和系统
CN109606137B (zh) 融合成本寿命因素的多源电驱动系统经济性优化方法
CN111959509B (zh) 基于状态空间域电池能量均衡的q学习再生制动控制策略
CN108528436B (zh) 一种内外层嵌套的ecms多目标双层优化方法
CN113022385B (zh) 燃料电池锂电池混合动力系统参数匹配方法
CN112706753B (zh) 一种基于灰狼优化的ecms混动汽车能量管理策略
CN113928187B (zh) 一种燃料电池汽车的能量管理控制方法
CN1539673A (zh) 燃料电池混合动力系统的功率分配方法
CN110126679B (zh) 一种燃料电池最佳工作点的获取方法
CN113022380B (zh) 一种考虑衰减的燃料电池汽车动力电池优化设计方法
Liu et al. Multi-objective optimization of energy management strategy on hybrid energy storage system based on radau pseudospectral method
CN113173108A (zh) 多堆燃料电池控制方法、控制装置、系统及车辆
CN112952862A (zh) 平抑风电功率波动的混合储能分频协调控制器及实现方法
CN116054242A (zh) 光储充用一体化的低碳型农村微电网优化运行控制方法
CN113799659A (zh) 一种燃料电池整车能量分配方法
CN114407873A (zh) 基于状态能量空间化的自适应等效因子的转矩分配控制方法
CN116522498B (zh) 增程式电动车能耗和排放协同优化方法和增程式电动车控制方法
CN112590763A (zh) 一种基于电池热及老化的行星混联混动汽车能量优化方法
CN116409216A (zh) 基于预测的非线性模型控制的燃料电池汽车能量管理方法
CN111645530B (zh) 考虑电池寿命的制动能量滚动优化控制方法
CN110920601B (zh) 一种多异性动力源系统能量配置优化控制的方法
CN115660327A (zh) 一种计及电池运行效率和衰减特性的改进混沌粒子群储能优化配置方法
CN112339573B (zh) 一种基于数学建模的纯电动汽车驱动控制策略优化方法
CN111196167B (zh) 车辆功率控制方法、装置及电动汽车
CN113625567A (zh) 挖掘机回转能量回收控制方法、系统、挖掘机及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant