CN116834511A - 基于Q-learning的纯电动汽车热管理控制方法 - Google Patents
基于Q-learning的纯电动汽车热管理控制方法 Download PDFInfo
- Publication number
- CN116834511A CN116834511A CN202310917248.3A CN202310917248A CN116834511A CN 116834511 A CN116834511 A CN 116834511A CN 202310917248 A CN202310917248 A CN 202310917248A CN 116834511 A CN116834511 A CN 116834511A
- Authority
- CN
- China
- Prior art keywords
- power
- battery
- passenger cabin
- state
- vehicle
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 23
- 238000010438 heat treatment Methods 0.000 claims abstract description 51
- 230000006870 function Effects 0.000 claims description 63
- 238000011156 evaluation Methods 0.000 claims description 17
- 230000009471 action Effects 0.000 claims description 15
- 238000013461 design Methods 0.000 claims description 4
- 230000008569 process Effects 0.000 claims description 4
- 230000001133 acceleration Effects 0.000 claims description 3
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 230000001186 cumulative effect Effects 0.000 claims description 3
- 230000005484 gravity Effects 0.000 claims description 3
- 238000005096 rolling process Methods 0.000 claims description 3
- 238000011234 economic evaluation Methods 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 5
- 239000011159 matrix material Substances 0.000 description 4
- 238000012546 transfer Methods 0.000 description 4
- 238000011217 control strategy Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 238000007476 Maximum Likelihood Methods 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 238000003763 carbonization Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 238000013028 emission testing Methods 0.000 description 1
- 238000003912 environmental pollution Methods 0.000 description 1
- 239000000446 fuel Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Classifications
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60H—ARRANGEMENTS OF HEATING, COOLING, VENTILATING OR OTHER AIR-TREATING DEVICES SPECIALLY ADAPTED FOR PASSENGER OR GOODS SPACES OF VEHICLES
- B60H1/00—Heating, cooling or ventilating [HVAC] devices
- B60H1/00357—Air-conditioning arrangements specially adapted for particular vehicles
- B60H1/00385—Air-conditioning arrangements specially adapted for particular vehicles for vehicles having an electrical drive, e.g. hybrid or fuel cell
- B60H1/00392—Air-conditioning arrangements specially adapted for particular vehicles for vehicles having an electrical drive, e.g. hybrid or fuel cell for electric vehicles having only electric drive means
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60H—ARRANGEMENTS OF HEATING, COOLING, VENTILATING OR OTHER AIR-TREATING DEVICES SPECIALLY ADAPTED FOR PASSENGER OR GOODS SPACES OF VEHICLES
- B60H1/00—Heating, cooling or ventilating [HVAC] devices
- B60H1/00271—HVAC devices specially adapted for particular vehicle parts or components and being connected to the vehicle HVAC unit
- B60H1/00278—HVAC devices specially adapted for particular vehicle parts or components and being connected to the vehicle HVAC unit for the battery
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60H—ARRANGEMENTS OF HEATING, COOLING, VENTILATING OR OTHER AIR-TREATING DEVICES SPECIALLY ADAPTED FOR PASSENGER OR GOODS SPACES OF VEHICLES
- B60H1/00—Heating, cooling or ventilating [HVAC] devices
- B60H1/00642—Control systems or circuits; Control members or indication devices for heating, cooling or ventilating devices
- B60H1/0073—Control systems or circuits characterised by particular algorithms or computational models, e.g. fuzzy logic or dynamic models
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60H—ARRANGEMENTS OF HEATING, COOLING, VENTILATING OR OTHER AIR-TREATING DEVICES SPECIALLY ADAPTED FOR PASSENGER OR GOODS SPACES OF VEHICLES
- B60H1/00—Heating, cooling or ventilating [HVAC] devices
- B60H1/00642—Control systems or circuits; Control members or indication devices for heating, cooling or ventilating devices
- B60H1/00735—Control systems or circuits characterised by their input, i.e. by the detection, measurement or calculation of particular conditions, e.g. signal treatment, dynamic models
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60H—ARRANGEMENTS OF HEATING, COOLING, VENTILATING OR OTHER AIR-TREATING DEVICES SPECIALLY ADAPTED FOR PASSENGER OR GOODS SPACES OF VEHICLES
- B60H1/00—Heating, cooling or ventilating [HVAC] devices
- B60H1/00642—Control systems or circuits; Control members or indication devices for heating, cooling or ventilating devices
- B60H1/00735—Control systems or circuits characterised by their input, i.e. by the detection, measurement or calculation of particular conditions, e.g. signal treatment, dynamic models
- B60H1/00764—Control systems or circuits characterised by their input, i.e. by the detection, measurement or calculation of particular conditions, e.g. signal treatment, dynamic models the input being a vehicle driving condition, e.g. speed
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60H—ARRANGEMENTS OF HEATING, COOLING, VENTILATING OR OTHER AIR-TREATING DEVICES SPECIALLY ADAPTED FOR PASSENGER OR GOODS SPACES OF VEHICLES
- B60H1/00—Heating, cooling or ventilating [HVAC] devices
- B60H1/00642—Control systems or circuits; Control members or indication devices for heating, cooling or ventilating devices
- B60H1/00814—Control systems or circuits characterised by their output, for controlling particular components of the heating, cooling or ventilating installation
- B60H1/00878—Control systems or circuits characterised by their output, for controlling particular components of the heating, cooling or ventilating installation the components being temperature regulating devices
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60L—PROPULSION OF ELECTRICALLY-PROPELLED VEHICLES; SUPPLYING ELECTRIC POWER FOR AUXILIARY EQUIPMENT OF ELECTRICALLY-PROPELLED VEHICLES; ELECTRODYNAMIC BRAKE SYSTEMS FOR VEHICLES IN GENERAL; MAGNETIC SUSPENSION OR LEVITATION FOR VEHICLES; MONITORING OPERATING VARIABLES OF ELECTRICALLY-PROPELLED VEHICLES; ELECTRIC SAFETY DEVICES FOR ELECTRICALLY-PROPELLED VEHICLES
- B60L58/00—Methods or circuit arrangements for monitoring or controlling batteries or fuel cells, specially adapted for electric vehicles
- B60L58/10—Methods or circuit arrangements for monitoring or controlling batteries or fuel cells, specially adapted for electric vehicles for monitoring or controlling batteries
- B60L58/12—Methods or circuit arrangements for monitoring or controlling batteries or fuel cells, specially adapted for electric vehicles for monitoring or controlling batteries responding to state of charge [SoC]
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60L—PROPULSION OF ELECTRICALLY-PROPELLED VEHICLES; SUPPLYING ELECTRIC POWER FOR AUXILIARY EQUIPMENT OF ELECTRICALLY-PROPELLED VEHICLES; ELECTRODYNAMIC BRAKE SYSTEMS FOR VEHICLES IN GENERAL; MAGNETIC SUSPENSION OR LEVITATION FOR VEHICLES; MONITORING OPERATING VARIABLES OF ELECTRICALLY-PROPELLED VEHICLES; ELECTRIC SAFETY DEVICES FOR ELECTRICALLY-PROPELLED VEHICLES
- B60L58/00—Methods or circuit arrangements for monitoring or controlling batteries or fuel cells, specially adapted for electric vehicles
- B60L58/10—Methods or circuit arrangements for monitoring or controlling batteries or fuel cells, specially adapted for electric vehicles for monitoring or controlling batteries
- B60L58/24—Methods or circuit arrangements for monitoring or controlling batteries or fuel cells, specially adapted for electric vehicles for monitoring or controlling batteries for controlling the temperature of batteries
- B60L58/27—Methods or circuit arrangements for monitoring or controlling batteries or fuel cells, specially adapted for electric vehicles for monitoring or controlling batteries for controlling the temperature of batteries by heating
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60L—PROPULSION OF ELECTRICALLY-PROPELLED VEHICLES; SUPPLYING ELECTRIC POWER FOR AUXILIARY EQUIPMENT OF ELECTRICALLY-PROPELLED VEHICLES; ELECTRODYNAMIC BRAKE SYSTEMS FOR VEHICLES IN GENERAL; MAGNETIC SUSPENSION OR LEVITATION FOR VEHICLES; MONITORING OPERATING VARIABLES OF ELECTRICALLY-PROPELLED VEHICLES; ELECTRIC SAFETY DEVICES FOR ELECTRICALLY-PROPELLED VEHICLES
- B60L2240/00—Control parameters of input or output; Target parameters
- B60L2240/10—Vehicle control parameters
- B60L2240/12—Speed
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60L—PROPULSION OF ELECTRICALLY-PROPELLED VEHICLES; SUPPLYING ELECTRIC POWER FOR AUXILIARY EQUIPMENT OF ELECTRICALLY-PROPELLED VEHICLES; ELECTRODYNAMIC BRAKE SYSTEMS FOR VEHICLES IN GENERAL; MAGNETIC SUSPENSION OR LEVITATION FOR VEHICLES; MONITORING OPERATING VARIABLES OF ELECTRICALLY-PROPELLED VEHICLES; ELECTRIC SAFETY DEVICES FOR ELECTRICALLY-PROPELLED VEHICLES
- B60L2240/00—Control parameters of input or output; Target parameters
- B60L2240/40—Drive Train control parameters
- B60L2240/42—Drive Train control parameters related to electric machines
- B60L2240/425—Temperature
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60L—PROPULSION OF ELECTRICALLY-PROPELLED VEHICLES; SUPPLYING ELECTRIC POWER FOR AUXILIARY EQUIPMENT OF ELECTRICALLY-PROPELLED VEHICLES; ELECTRODYNAMIC BRAKE SYSTEMS FOR VEHICLES IN GENERAL; MAGNETIC SUSPENSION OR LEVITATION FOR VEHICLES; MONITORING OPERATING VARIABLES OF ELECTRICALLY-PROPELLED VEHICLES; ELECTRIC SAFETY DEVICES FOR ELECTRICALLY-PROPELLED VEHICLES
- B60L2240/00—Control parameters of input or output; Target parameters
- B60L2240/40—Drive Train control parameters
- B60L2240/54—Drive Train control parameters related to batteries
- B60L2240/545—Temperature
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60L—PROPULSION OF ELECTRICALLY-PROPELLED VEHICLES; SUPPLYING ELECTRIC POWER FOR AUXILIARY EQUIPMENT OF ELECTRICALLY-PROPELLED VEHICLES; ELECTRODYNAMIC BRAKE SYSTEMS FOR VEHICLES IN GENERAL; MAGNETIC SUSPENSION OR LEVITATION FOR VEHICLES; MONITORING OPERATING VARIABLES OF ELECTRICALLY-PROPELLED VEHICLES; ELECTRIC SAFETY DEVICES FOR ELECTRICALLY-PROPELLED VEHICLES
- B60L2260/00—Operating Modes
- B60L2260/40—Control modes
- B60L2260/50—Control modes by future state prediction
- B60L2260/54—Energy consumption estimation
Landscapes
- Engineering & Computer Science (AREA)
- Mechanical Engineering (AREA)
- Physics & Mathematics (AREA)
- Thermal Sciences (AREA)
- Sustainable Energy (AREA)
- Life Sciences & Earth Sciences (AREA)
- Sustainable Development (AREA)
- Power Engineering (AREA)
- Transportation (AREA)
- Fuzzy Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Theoretical Computer Science (AREA)
- Electric Propulsion And Braking For Vehicles (AREA)
Abstract
本发明公开了一种基于Q‑learning的纯电动汽车热管理控制方法,包括:S1.采集车辆当前状态信息;S2.确定车辆需求功率;S3.基于车辆当前状态信息以及车辆需求功率,采用Q‑learning算法求解最优的电池加热功率和最优的乘员舱加热功率;S4.通过最优的电池加热功率和最优的乘员舱加热功率分别对电池以及乘员舱进行加热。本发明能够在实际应用过程中,实时调整热管理控制,将集成热管理系统的温度控制在最佳工作温度范围内。
Description
技术领域
本发明涉及电动汽车热管理领域,具体涉及一种基于Q-learning的纯电动汽车热管理控制方法。
背景技术
近年来,为了缓解环境污染带来的危害,国家提出了“双碳”目标,要求汽车领域朝着低碳化转型。纯电动汽车因其无污染零排放等优点成为未来行业发展的趋势,动力电池作为纯电动汽车唯一动力源,受温度影响严重,尤其在高寒低温场景下更为明显,使得纯电动汽车在市场中进一步推广受到阻碍。
现阶段,将热管理从单一模式向集成模式进行转化管理,已经成为纯电动汽车进行热管理控制的发展趋势,集成模式主要是将电池热管理、电机热管理以及乘员舱热管理等三部分结合起来进行能量管理;目前,现有的技术大多是基于规则或是基于优化的控制策略进行热管理,这些策略的制定多是基于已知的工况进行预先设定,从而导致这些策略对于实时工况的适应性较差,无法满足实时的热管理控制。因此,需要一种基于Q-learning的纯电动汽车热管理控制方法,能够解决以上问题。
发明内容
有鉴于此,本发明的目的是克服现有技术中的缺陷,提供基于Q-learning的纯电动汽车热管理控制方法,能够在实际应用过程中,实时调整热管理控制,将集成热管理系统的温度控制在最佳工作温度范围内。
本发明的基于Q-learning的纯电动汽车热管理控制方法,包括如下步骤:
S1.采集车辆当前状态信息,所述状态信息包括车速、电池温度、电池SOC、电机温度和乘员舱温度;
S2.确定车辆需求功率;
S3.基于车辆当前状态信息以及车辆需求功率,采用Q-learning算法求解最优的电池加热功率和最优的乘员舱加热功率;
S4.通过最优的电池加热功率和最优的乘员舱加热功率分别对电池以及乘员舱进行加热。
进一步,根据驱动力与行驶阻力平衡方程计算得到车辆需求功率Preq:
其中,Pf为行驶阻力消耗的功率;Pi为坡道阻力消耗的功率;Pw为空气阻力消耗的功率;Pj为加速阻力消耗的功率;u为车速;G为汽车重力;f为滚动阻力系数;α为道路坡度;Cd为空气阻力系数;A为迎风面积;δ为旋转质量换算系数;m为汽车质量;t为时间。
进一步,所述步骤S3,具体包括:
S31.初始化状态-动作值函数Q(s,a),将Q(s,a)中的所有元素都赋值为0;
S32.给定探索率ε、学习率α和折扣因子γ,并设定算法迭代次数N;
S33.选择需求功率Preq、电池SOC、电池温度Tbat、乘员舱温度Tcbn作为状态变量,选择电池加热功率Pbat和乘员舱加热功率Pcbn作为控制变量,并设计目标函数和约束条件;
S34.给定初始状态s,根据ε-greedy策略选择状态s的动作a:
其中,A(s)为对应状态s下的动作;
S35.根据ε-greedy策略选择状态s下的动作a并获得回报r和下一状态s';
S36.更新迭代状态-动作值函数Q(s,a):
Q(s,a)←Q(s,a)+α[r(s,a)+γminQ(s',a')-Q(s,a)];
其中,r为状态-动作的立即回报函数;a'为下一状态s'的动作;
S37.若更新迭代后的状态-动作值函数满足设定的误差阈值,则此时的状态-动作值函数收敛,利用收敛后的状态-动作值函Q(s,a),选择最小Q(s,a)值对应的动作为每个状态的最优策略,并将所述最优策略下对应的电池加热功率和乘员舱加热功率作为最优的电池加热功率和最优的乘员舱加热功率。
进一步,设计目标函数,具体包括:
考虑整车经济性、动力性和乘员舱舒适性建立目标函数J:
其中,Q*(s,a)是最优的状态-动作值函数;代表整个求解过程中的累计期望;γ为折扣因子;rt+1为求解阶段t+1下的状态-动作立即回报函数;
根据如下公式确定函数rt+1:
其中,J1(x(k),u(k))'为第k时刻整车经济性评价函数J1(x(k),u(k))进行归一化后的函数;J2(x(k),u(k))'为第k时刻整车动力性评价函数J2(x(k),u(k))进行归一化后的函数;J3(x(k),u(k))'为第k时刻乘员舱舒适性评价函数J3(x(k),u(k))进行归一化后的函数;k取值为1,2,…,K,K为总时间长度;w1、w2、w3为权重系数。
进一步,所述约束条件为:
其中,Tbat(k)为k时刻的电池温度,Tbat_min、Tbat_max分别为电池温度的上限和下限;SOC(k)为k时刻的电池剩余电量,SOCmin、SOCmax分别为电池剩余电量的上限和下限;Tcab(k)为k时刻的乘员舱温度,Tcab_min、Tcab_max分别为乘员舱温度的上限和下限;Pbat(k)为k时刻的电池加热功率,Pbat_min、Pbat_max分别为电池加热功率的上限和下限;Pcab(k)为k时刻的乘员舱加热功率,Pcab_min、Pcab_max分别为乘员舱加热功率的上限和下限。
进一步,根据如下公式确定第k时刻整车经济性评价函数J1(x(k),u(k)):
J1(x(k),u(k))=SOC(k+1)-SOC(k);
其中,SOC(k+1)为第k+1时刻的电池剩余电量;SOC(k)为第k时刻的电池剩余电量;
根据如下公式确定第k时刻整车动力性评价函数J2(x(k),u(k)):
其中,Pbatpwr(k)为第k时刻时电池最大放电功率,t、t+1分别为当前时刻和下一时刻;
根据如下公式确定第k时刻乘员舱舒适性评价函数J3(x(k),u(k)):
其中,Ttar为乘员舱目标温度,Tcab(k)为第k时刻时乘员舱温度。
本发明的有益效果是:本发明公开的一种基于Q-learning的纯电动汽车热管理控制方法,通过获取车辆当前状态信息以及车辆需求功率,采用Q-learning算法求解最优的电池加热功率和最优的乘员舱加热功率,将集成热管理系统的温度控制在最佳工作温度范围内,在一定程度上有效改进了热管理策略对于未知工况的适应能力。
附图说明
下面结合附图和实施例对本发明作进一步描述:
图1为本发明的热管理控制方法流程示意图;
图2为本发明的强化学习示意图;
图3(a)为本发明的WLTC工况下需求功率概率转移矩阵图;
图3(b)为本发明的NEDC工况下需求功率概率转移矩阵图;
图4为本发明的基于Q-learning算法的最优加热功率求解流程示意图。
具体实施方式
以下结合说明书附图对本发明做出进一步的说明,如图所示:
本发明的基于Q-learning的纯电动汽车热管理控制方法,包括如下步骤:
S1.采集车辆当前状态信息,所述状态信息包括车速、电池温度、电池SOC、电机温度和乘员舱温度;
S2.确定车辆需求功率;
S3.基于车辆当前状态信息以及车辆需求功率,采用Q-learning算法求解最优的电池加热功率和最优的乘员舱加热功率;
S4.通过最优的电池加热功率和最优的乘员舱加热功率分别对电池以及乘员舱进行加热。
本实施例中,步骤S2中,根据驱动力与行驶阻力平衡方程计算得到车辆需求功率Preq:
其中,Pf为行驶阻力消耗的功率;Pi为坡道阻力消耗的功率;Pw为空气阻力消耗的功率;Pj为加速阻力消耗的功率;u为车速;G为汽车重力;f为滚动阻力系数;α为道路坡度;Cd为空气阻力系数;A为迎风面积;δ为旋转质量换算系数;m为汽车质量;t为时间。
当然了,为了适应未来工况,可以根据当前的车辆需求功率计算下一工况下的车辆需求功率;根据最大似然估计法和最邻近法,构建出需求功率概率转移矩阵,从而可以得到不同工况下的车辆需求功率,为后续的热管理控制提供了数据支持。其中,如图3所示,分别展示了WLTC工况下以及NEDC工况下的需求功率概率转移矩阵图;WLTC(Worldwideharmonized Light vehicles Test Cycle)工况和NEDC(New European Driving Cycle)工况都是用于汽车燃消耗测试和排放测试的标准化驾驶循环。
本实施例中,如图2及图4所示,所述步骤S3,具体包括:
S31.初始化状态-动作值函数Q(s,a),将Q(s,a)中的所有元素都赋值为0;
S32.给定探索率ε、学习率α和折扣因子γ,并设定算法迭代次数N;
S33.选择需求功率Preq、电池SOC、电池温度Tbat、乘员舱温度Tcbn作为状态变量,选择电池加热功率Pbat和乘员舱加热功率Pcbn作为控制变量,并设计目标函数和约束条件;
S34.给定初始状态s,根据ε-greedy策略选择状态s的动作a:
其中,A(s)为对应状态s下的动作;
S35.根据ε-greedy策略选择状态s下的动作a并获得回报r和下一状态s';
S36.更新迭代状态-动作值函数Q(s,a):
Q(s,a)←Q(s,a)+α[r(s,a)+γminQ(s',a')-Q(s,a)];
其中,r为状态-动作的立即回报函数;a'为下一状态s'的动作;
S37.若更新迭代后的状态-动作值函数满足设定的误差阈值,则此时的状态-动作值函数收敛,利用收敛后的状态-动作值函Q(s,a),选择最小Q(s,a)值对应的动作为每个状态的最优策略,并将所述最优策略下对应的电池加热功率和乘员舱加热功率作为最优的电池加热功率和最优的乘员舱加热功率。其中,误差阈值可以根据实际工况进行设定,比如取值为0.01。
通过上述基于Q-learning算法的解算方法,不断迭代更新控制策略,在处理高度复杂的计算及分析时具有突出的优势,从而得到最优的电池加热功率和最优的乘员舱加热功率。
本实施例中,设计目标函数,具体包括:
在满足乘员舱、动力电池等相关约束条件的情况下,考虑整车经济性、动力性和乘员舱舒适性建立目标函数J:
其中,Q*(s,a)是最优的状态-动作值函数;代表整个求解过程中的累计期望;γ为折扣因子;rt+1为求解阶段t+1下的状态-动作立即回报函数;
根据如下公式确定函数rt+1:
其中,J1(x(k),u(k))'为第k时刻整车经济性评价函数J1(x(k),u(k))进行归一化后的函数;J2(x(k),u(k))'为第k时刻整车动力性评价函数J2(x(k),u(k))进行归一化后的函数;J3(x(k),u(k))'为第k时刻乘员舱舒适性评价函数J3(x(k),u(k))进行归一化后的函数;k取值为1,2,…,K,K为总时间长度;w1、w2、w3为权重系数,取值均为1/3。
本实施例中,所述约束条件为:
其中,Tbat(k)为k时刻的电池温度,Tbat_min、Tbat_max分别为电池温度的上限和下限;SOC(k)为k时刻的电池剩余电量,SOCmin、SOCmax分别为电池剩余电量的上限和下限;Tcab(k)为k时刻的乘员舱温度,Tcab_min、Tcab_max分别为乘员舱温度的上限和下限;Pbat(k)为k时刻的电池加热功率,Pbat_min、Pbat_max分别为电池加热功率的上限和下限;Pcab(k)为k时刻的乘员舱加热功率,Pcab_min、Pcab_max分别为乘员舱加热功率的上限和下限。
本实施例中,根据如下公式确定第k时刻整车经济性评价函数J1(x(k),u(k)):
J1(x(k),u(k))=SOC(k+1)-SOC(k);
其中,SOC(k+1)为第k+1时刻的电池剩余电量;SOC(k)为第k时刻的电池剩余电量;
根据如下公式确定第k时刻整车动力性评价函数J2(x(k),u(k)):
其中,Pbatpwr(k)为第k时刻时电池最大放电功率,t、t+1分别为当前时刻和下一时刻;
根据如下公式确定第k时刻乘员舱舒适性评价函数J3(x(k),u(k)):
其中,Ttar为乘员舱目标温度,Tcab(k)为第k时刻时乘员舱温度。
最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。
Claims (6)
1.一种基于Q-learning的纯电动汽车热管理控制方法,其特征在于:包括如下步骤:
S1.采集车辆当前状态信息,所述状态信息包括车速、电池温度、电池SOC、电机温度和乘员舱温度;
S2.确定车辆需求功率;
S3.基于车辆当前状态信息以及车辆需求功率,采用Q-learning算法求解最优的电池加热功率和最优的乘员舱加热功率;
S4.通过最优的电池加热功率和最优的乘员舱加热功率分别对电池以及乘员舱进行加热。
2.根据权利要求1所述的基于Q-learning的纯电动汽车热管理控制方法,其特征在于:根据驱动力与行驶阻力平衡方程计算得到车辆需求功率Preq:
其中,Pf为行驶阻力消耗的功率;Pi为坡道阻力消耗的功率;Pw为空气阻力消耗的功率;Pj为加速阻力消耗的功率;u为车速;G为汽车重力;f为滚动阻力系数;α为道路坡度;Cd为空气阻力系数;A为迎风面积;δ为旋转质量换算系数;m为汽车质量;t为时间。
3.根据权利要求1所述的基于Q-learning的纯电动汽车热管理控制方法,其特征在于:所述步骤S3,具体包括:
S31.初始化状态-动作值函数Q(s,a),将Q(s,a)中的所有元素都赋值为0;
S32.给定探索率ε、学习率α和折扣因子γ,并设定算法迭代次数N;
S33.选择需求功率Preq、电池SOC、电池温度Tbat、乘员舱温度Tcbn作为状态变量,选择电池加热功率Pbat和乘员舱加热功率Pcbn作为控制变量,并设计目标函数和约束条件;
S34.给定初始状态s,根据ε-greedy策略选择状态s的动作a:
其中,A(s)为对应状态s下的动作;
S35.根据ε-greedy策略选择状态s下的动作a并获得回报r和下一状态s';
S36.更新迭代状态-动作值函数Q(s,a):
Q(s,a)←Q(s,a)+α[r(s,a)+γminQ(s',a')-Q(s,a)];
其中,r为状态-动作的立即回报函数;a'为下一状态s'的动作;
S37.若更新迭代后的状态-动作值函数满足设定的误差阈值,则此时的状态-动作值函数收敛,利用收敛后的状态-动作值函Q(s,a),选择最小Q(s,a)值对应的动作为每个状态的最优策略,并将所述最优策略下对应的电池加热功率和乘员舱加热功率作为最优的电池加热功率和最优的乘员舱加热功率。
4.根据权利要求3所述的基于Q-learning的纯电动汽车热管理控制方法,其特征在于:设计目标函数,具体包括:
考虑整车经济性、动力性和乘员舱舒适性建立目标函数J:
其中,Q*(s,a)是最优的状态-动作值函数;代表整个求解过程中的累计期望;γ为折扣因子;rt+1为求解阶段t+1下的状态-动作立即回报函数;
根据如下公式确定函数rt+1:
其中,J1(x(k),u(k))'为第k时刻整车经济性评价函数J1(x(k),u(k))进行归一化后的函数;J2(x(k),u(k))'为第k时刻整车动力性评价函数J2(x(k),u(k))进行归一化后的函数;J3(x(k),u(k))'为第k时刻乘员舱舒适性评价函数J3(x(k),u(k))进行归一化后的函数;k取值为1,2,…,K,K为总时间长度;w1、w2、w3为权重系数。
5.根据权利要求3所述的基于Q-learning的纯电动汽车热管理控制方法,其特征在于:所述约束条件为:
其中,Tbat(k)为k时刻的电池温度,Tbat_min、Tbat_max分别为电池温度的上限和下限;SOC(k)为k时刻的电池剩余电量,SOCmin、SOCmax分别为电池剩余电量的上限和下限;Tcab(k)为k时刻的乘员舱温度,Tcab_min、Tcab_max分别为乘员舱温度的上限和下限;Pbat(k)为k时刻的电池加热功率,Pbat_min、Pbat_max分别为电池加热功率的上限和下限;Pcab(k)为k时刻的乘员舱加热功率,Pcab_min、Pcab_max分别为乘员舱加热功率的上限和下限。
6.根据权利要求4所述的基于Q-learning的纯电动汽车热管理控制方法,其特征在于:根据如下公式确定第k时刻整车经济性评价函数J1(x(k),u(k)):
J1(x(k),u(k))=SOC(k+1)-SOC(k);
其中,SOC(k+1)为第k+1时刻的电池剩余电量;SOC(k)为第k时刻的电池剩余电量;
根据如下公式确定第k时刻整车动力性评价函数J2(x(k),u(k)):
其中,Pbatpwr(k)为第k时刻时电池最大放电功率,t、t+1分别为当前时刻和下一时刻;
根据如下公式确定第k时刻乘员舱舒适性评价函数J3(x(k),u(k)):
其中,Ttar为乘员舱目标温度,Tcab(k)为第k时刻时乘员舱温度。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310917248.3A CN116834511A (zh) | 2023-07-24 | 2023-07-24 | 基于Q-learning的纯电动汽车热管理控制方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310917248.3A CN116834511A (zh) | 2023-07-24 | 2023-07-24 | 基于Q-learning的纯电动汽车热管理控制方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116834511A true CN116834511A (zh) | 2023-10-03 |
Family
ID=88168952
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310917248.3A Pending CN116834511A (zh) | 2023-07-24 | 2023-07-24 | 基于Q-learning的纯电动汽车热管理控制方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116834511A (zh) |
-
2023
- 2023-07-24 CN CN202310917248.3A patent/CN116834511A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2021159660A1 (zh) | 一种混合动力汽车能量管理方法和系统 | |
CN113071506B (zh) | 考虑座舱温度的燃料电池汽车能耗优化系统 | |
CN112180280A (zh) | 一种考虑电池健康状态的混合动力汽车电池寿命优化方法 | |
CN112319462B (zh) | 一种插电式混合动力汽车能量管理方法 | |
CN110728037B (zh) | 电池容量闭环融合预测方法 | |
CN115996857A (zh) | 用于控制混合动力车辆中的动力总成的方法和系统 | |
CN110341546A (zh) | 一种纯电动车续航里程估算方法 | |
CN101630144A (zh) | 电子节气门的自学习逆模型控制方法 | |
CN115840987A (zh) | 一种基于深度强化学习的混动汽车热管理策略生成方法 | |
CN115130266B (zh) | 用于车辆的热管理控制的方法和系统 | |
CN109657194B (zh) | 一种基于Q-learning和规则的混合动力车辆运行实时能源管理方法 | |
CN110077389B (zh) | 一种插电式混合动力电动汽车能量管理方法 | |
CN112757922A (zh) | 一种车用燃料电池混合动力能量管理方法及系统 | |
CN118103266A (zh) | 用于交通工具中的功率或扭矩分配的自适应实时优化的方法 | |
CN118107410A (zh) | 一种电动汽车智能能量管理方法 | |
CN116278992A (zh) | 一种融合信息物理系统的燃料电池汽车能量管理方法 | |
CN109409571A (zh) | 一种电动汽车充电需求预测方法及装置 | |
CN116394805A (zh) | 一种基于多目标动态规划神经网络的fchev能量管理控制方法 | |
CN116834511A (zh) | 基于Q-learning的纯电动汽车热管理控制方法 | |
CN118706146A (zh) | 一种基于最小能量消耗的混合动力汽车路径规划方法及装置 | |
CN112989699A (zh) | 基于深度强化学习的新能源汽车性能评价方法 | |
CN113901575B (zh) | 一种识别工况后的自适应soc平衡点调整的方法及装置 | |
CN115091923B (zh) | 暖风芯体出风温度获得方法、装置、设备及存储介质 | |
CN117416334A (zh) | 一种燃料电池混合动力汽车能量管理策略的控制方法 | |
CN109668571B (zh) | 基于电量预测和智能能量管理的纯电动垃圾车路径规划方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |