CN111584906A - 一种基于深度强化学习的燃料电池系统的燃料供给方法 - Google Patents

一种基于深度强化学习的燃料电池系统的燃料供给方法 Download PDF

Info

Publication number
CN111584906A
CN111584906A CN202010353990.2A CN202010353990A CN111584906A CN 111584906 A CN111584906 A CN 111584906A CN 202010353990 A CN202010353990 A CN 202010353990A CN 111584906 A CN111584906 A CN 111584906A
Authority
CN
China
Prior art keywords
fuel cell
cell system
mass flow
air compressor
hydrogen
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010353990.2A
Other languages
English (en)
Other versions
CN111584906B (zh
Inventor
周健豪
廖宇晖
刘军
张仁鹏
薛源
薛四伍
顾诚
孙开培
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Aeronautics and Astronautics
Original Assignee
Nanjing University of Aeronautics and Astronautics
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Aeronautics and Astronautics filed Critical Nanjing University of Aeronautics and Astronautics
Priority to CN202010353990.2A priority Critical patent/CN111584906B/zh
Publication of CN111584906A publication Critical patent/CN111584906A/zh
Application granted granted Critical
Publication of CN111584906B publication Critical patent/CN111584906B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01MPROCESSES OR MEANS, e.g. BATTERIES, FOR THE DIRECT CONVERSION OF CHEMICAL ENERGY INTO ELECTRICAL ENERGY
    • H01M8/00Fuel cells; Manufacture thereof
    • H01M8/04Auxiliary arrangements, e.g. for control of pressure or for circulation of fluids
    • H01M8/04298Processes for controlling fuel cells or fuel cell systems
    • H01M8/04694Processes for controlling fuel cells or fuel cell systems characterised by variables to be controlled
    • H01M8/04746Pressure; Flow
    • H01M8/04753Pressure; Flow of fuel cell reactants
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01MPROCESSES OR MEANS, e.g. BATTERIES, FOR THE DIRECT CONVERSION OF CHEMICAL ENERGY INTO ELECTRICAL ENERGY
    • H01M8/00Fuel cells; Manufacture thereof
    • H01M8/04Auxiliary arrangements, e.g. for control of pressure or for circulation of fluids
    • H01M8/04298Processes for controlling fuel cells or fuel cell systems
    • H01M8/04305Modeling, demonstration models of fuel cells, e.g. for training purposes
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01MPROCESSES OR MEANS, e.g. BATTERIES, FOR THE DIRECT CONVERSION OF CHEMICAL ENERGY INTO ELECTRICAL ENERGY
    • H01M8/00Fuel cells; Manufacture thereof
    • H01M8/04Auxiliary arrangements, e.g. for control of pressure or for circulation of fluids
    • H01M8/04298Processes for controlling fuel cells or fuel cell systems
    • H01M8/04694Processes for controlling fuel cells or fuel cell systems characterised by variables to be controlled
    • H01M8/04791Concentration; Density
    • H01M8/04798Concentration; Density of fuel cell reactants
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01MPROCESSES OR MEANS, e.g. BATTERIES, FOR THE DIRECT CONVERSION OF CHEMICAL ENERGY INTO ELECTRICAL ENERGY
    • H01M8/00Fuel cells; Manufacture thereof
    • H01M8/04Auxiliary arrangements, e.g. for control of pressure or for circulation of fluids
    • H01M8/04298Processes for controlling fuel cells or fuel cell systems
    • H01M8/04694Processes for controlling fuel cells or fuel cell systems characterised by variables to be controlled
    • H01M8/04858Electric variables
    • H01M8/04925Power, energy, capacity or load
    • H01M8/0494Power, energy, capacity or load of fuel cell stacks
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01MPROCESSES OR MEANS, e.g. BATTERIES, FOR THE DIRECT CONVERSION OF CHEMICAL ENERGY INTO ELECTRICAL ENERGY
    • H01M2250/00Fuel cells for particular applications; Specific features of fuel cell system
    • H01M2250/20Fuel cells in motive systems, e.g. vehicle, ship, plane
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02EREDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
    • Y02E60/00Enabling technologies; Technologies with a potential or indirect contribution to GHG emissions mitigation
    • Y02E60/30Hydrogen technology
    • Y02E60/50Fuel cells

Landscapes

  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Chemical & Material Sciences (AREA)
  • Electrochemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Chemical & Material Sciences (AREA)
  • Sustainable Energy (AREA)
  • Sustainable Development (AREA)
  • Manufacturing & Machinery (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Software Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Data Mining & Analysis (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Hardware Design (AREA)
  • Geometry (AREA)
  • Fuel Cell (AREA)

Abstract

本发明实施例公开了一种基于深度强化学习的燃料电池系统的燃料供给方法,涉及燃料电池技术领域,能够改善燃料电池的使用效率和寿命。本发明包括:获取燃料电池系统的工况数据的样本集合,根据工况数据的样本集合得到功率需求,DDPG控制器的目标为:在燃料电池系统输出功率,满足能量控制策略需求功率的同时,保持过氧比在预设范围内,工况预测模型包括:氢气流量控制阀模型、空气压缩机模型和燃料电池系统模型;将实际的工况数据输入工况预测模型,得到速度预测序列;利用速度预测序列,得到燃料电池系统的实际功率需求,并根据实际功率需求控制燃料电池系统的氢气流量阀和空气压缩机。本发明适用于氢燃料电池系统。

Description

一种基于深度强化学习的燃料电池系统的燃料供给方法
技术领域
本发明涉及燃料电池技术领域,尤其涉及一种基于深度强化学习中的确定性策略梯度(DDPG)的燃料电池系统的燃料供给方法。
背景技术
在能源逐渐枯竭的今天,传统的化石燃料载具也在尝试变革,新能源汽车、电驱动飞行器、新能源船舶等应运而生,而氢燃料电池混合动力系统,则是其中的一种能源解决方案。
而目前燃料电池系统的燃料供给方法,大多是各种智能算法来控制空气压缩机的电压,目的是为了跟随最佳的过氧比。该种控制方法可以较为优秀的保证燃料电池的工作效率和使用寿命。
但是,这种燃料电池系统的燃料供给方法也存在一些问题:由于燃料电池系统的目的只是跟随最佳过氧比,而由于附件损耗的问题,氢气的供给只是简单的按照一定的比例过量通入,不能够准确及时的满足由能量控制策略分配的燃料电池系统的功率需求。因此,需要突破传统方案的桎梏,进一步现多控制量、多目标的控制。
发明内容
本发明的实施例提供一种基于深度强化学习的燃料电池系统的燃料供给方法,能够及时准确的满足能量控制策略分配的燃料电池功率需求,且燃料电池系统的过氧比能很好的跟随最佳过氧比,改善燃料电池的使用效率和寿命。
为达到上述目的,本发明的实施例采用如下技术方案:
获取燃料电池系统的工况数据的样本集合,根据所述工况数据的样本集合得到功率需求,其中,所述工况数据至少包括:速度信息;利用DDPG控制器和所述功率需求,训练工况预测模型,其中,所述DDPG控制器的目标为:在燃料电池系统输出功率,满足能量控制策略需求功率的同时,保持过氧比在预设范围内,所述工况预测模型包括:氢气流量控制阀模型、空气压缩机模型和燃料电池系统模型;将实际的工况数据输入所述工况预测模型,得到速度预测序列;利用所述速度预测序列,得到所述燃料电池系统的实际功率需求,并根据所述实际功率需求控制所述燃料电池系统的氢气流量阀和空气压缩机。
本发明实施例,属于燃料电池系统燃料供给控制领域,其主要的设计思路包括:建立氢气流量控制阀模型、空气压缩机模型以及燃料电池系统模型,建立DDPG控制器,确定DDPG控制器观测量、动作量、程序提前终止条件还有回报函数的参数,并训练基于DDPG的燃料电池系统燃料供给模型,通过车速预测神经网络得到未来车速,通过DDPG控制器控制汽车行驶。燃料电池系统可以有效的在考虑了附件损耗的前提下,及时准确的满足能量控制策略分配的燃料电池功率需求,且燃料电池系统的过氧比能很好的跟随最佳过氧比,改善燃料电池的使用效率和寿命。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1为本发明实施例提供的基于DDPG的燃料电池系统燃料供给流程图;
图2为本发明实施例提供的氢气供给、空气供给以及燃料电池系统模型图;
图3为本发明实施例提供的DDPG控制器参数设置图;
图4为本发明实施例提供的基于DDPG算法的燃料电池系统燃料供给模型训练流程图;
图5为本发明实施例提供的DDPG算法更新流程图。
具体实施方式
为使本领域技术人员更好地理解本发明的技术方案,下面结合附图和具体实施方式对本发明作进一步详细描述。下文中将详细描述本发明的实施方式,所述实施方式的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施方式是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的任一单元和全部组合。本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语)具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样定义,不会用理想化或过于正式的含义来解释。
本发明实施例提供一种基于深度强化学习的燃料电池系统的燃料供给方法,包括:
S1、获取燃料电池系统的工况数据的样本集合,根据所述工况数据的样本集合得到功率需求。
其中,所述工况数据至少包括:速度信息,例如搭载了燃料电池系统的车辆的驶速度信息,将其转变为功率需求,并根据预设的能量控制策略,可以得到典型工况的燃料电池系统的功率需求,用于模型训练。
S2、利用DDPG控制器和所述功率需求,训练工况预测模型。
其中,所述DDPG控制器的目标为:在燃料电池系统输出功率,满足能量控制策略需求功率的同时,保持过氧比在预设范围内,所述工况预测模型包括:氢气流量控制阀模型、空气压缩机模型和燃料电池系统模型。
保持过氧比在预设范围内,包括:通过理论计算,得到最佳过氧比的数值,保持燃料电池的实际过氧比与最佳过氧比一致,在实际的自动控制中,保持一致不等于燃料电池的实际过氧比与最佳过氧比的数值始终等同,实际过氧比是在以最佳过氧比为中点的一定范围内波动的,而这个波动的范围则可以称为“预设范围”。
S3、将实际的工况数据输入所述工况预测模型,得到速度预测序列。
S4、利用所述速度预测序列,得到所述燃料电池系统的实际功率需求,并根据所述实际功率需求控制所述燃料电池系统的氢气流量阀和空气压缩机。
本发明实施例,属于燃料电池系统燃料供给控制领域,其主要的设计思路包括:建立氢气流量控制阀模型、空气压缩机模型以及燃料电池系统模型,建立DDPG控制器,确定DDPG控制器观测量、动作量、程序提前终止条件还有回报函数的参数,并训练基于DDPG的燃料电池系统燃料供给模型,通过车速预测神经网络得到未来车速,通过DDPG控制器控制汽车行驶。采用本发明,燃料电池系统可以有效的在考虑了附件损耗的前提下,及时准确的满足能量控制策略分配的燃料电池功率需求,且燃料电池系统的过氧比能很好的跟随最佳过氧比,保证燃料电池的使用效率和寿命最佳。
在本实施例中,还包括获取氢气流量控制阀模型:
获取所述氢气流量控制阀的控制输入信号Wfcv=ufcvWfcv,max
其中,在供给歧管中,认为没有水蒸气或者液态水存在。ufcv是氢气流量阀的控制电压,范围是0~1。Wfcv,max是喷嘴全开时的质量流量,所述氢气流量控制阀为可变开度喷嘴。
获取氢气在供给歧管中的动态过程
Figure BDA0002472845470000051
Figure BDA0002472845470000052
是阳极供给歧管中氢气的压力,
Figure BDA0002472845470000053
是氢气的气体常数,Tsm是供给歧管温度,Vsm是供给歧管的体积,
Figure BDA0002472845470000054
是进入阳极供给管道的氢气质量流,
Figure BDA0002472845470000055
是阳极供给歧管流出的氢气质量流,参数的下角标sm,为供给歧管(Supply manifold)的缩写。
在本实施例中,还包括获取空气压缩机模型:
所述空气压缩机的模型包括:
Figure BDA0002472845470000056
其中,ωcp是空气压缩机的转速,下角标cp表示空气压缩机,Jcp是空气压缩机旋转部件的转动惯量,τcm是空气压缩机电机的扭矩,τcp是空气压缩机输出端的扭矩,Psm是空气供给歧管的压力,Ra是空气气体常数,a表示空气Air,Vsm是空气供给歧管的容积,Tcp,out是离开空气压缩机的空气温度,Wcp,out是离开空气压缩机的空气质量流,Tsm,out是空气供给歧管的空气温度,Wsm,out是空气供给歧管的质量流。空气压缩机的流量是由输入空气压缩机的电压以及空气供给歧管的压力所决定的,且认为空气压缩机产生的质量流与离开空气压缩机的质量流一致。
所述空气压缩机的扭矩由输入所述空气压缩机的电压进行控制:
Figure BDA0002472845470000061
其中,u为输入空气压缩机的电压,ηcm为空气压缩机的效率,Rcm为空气压缩机内部电阻,kt和kv都表示空气压缩机电机常数,下角标t、v没有特殊含义,仅用于区分两个不同的参数,通过参数的下角标区分的,kt表示时间相关的常数,kv表示电压相关的常数。
所述空气压缩机产生的空气质量流为:
Figure BDA0002472845470000062
其中,ωc为空气压缩机叶尖速度,下角标c表示Compressor,dc为空气压缩机直径,Wcp为空气压缩机产生的空气质量流,φ为标准化空气压缩机流量比例,ρa为空气密度。
在本实施例中,所述氢气流量阀的质量流为进入阳极供给歧管中的氢气质量流,则
Figure BDA0002472845470000063
当所述阳极供给歧管流出的氢气质量流,全部进入燃料电池时:
Figure BDA0002472845470000064
当所述空气压缩机产生的质量流与离开空气压缩机的质量流一致时:Wcp=Wcp,out
进入燃料电池阴极的质量流包括氧气流、氮气流和水蒸气流:
Figure BDA0002472845470000065
其中,
Figure BDA0002472845470000066
是进入燃料电池的水蒸气质量流,
Figure BDA0002472845470000067
是进入燃料电池的氧气质量流,
Figure BDA0002472845470000068
是进入燃料电池阴极的氮气质量流。
进一步的,本实施例中还包括获取燃料电池系统模型:燃料电池系统的模型主要包括阳极的氢气分压、阴极的氧气和氮气分压还有燃料电池排气歧管处的压力。所述燃料电池系统的模型包括:
Figure BDA0002472845470000071
其中,
Figure BDA0002472845470000072
是燃料电池阳极的氢气分压,
Figure BDA0002472845470000073
是进入燃料电池的氢气质量流,
Figure BDA0002472845470000074
是发生化学反应产生电流的氢气质量流,
Figure BDA0002472845470000075
是离开燃料电池阳极部分的氢气质量流,
Figure BDA0002472845470000076
是燃料电池阴极的氧气分压,
Figure BDA0002472845470000077
是发生化学反应产生电流的氧气质量流,
Figure BDA0002472845470000078
是离开燃料电池阴极的氧气质量流,
Figure BDA0002472845470000079
是燃料电池阴极的氮气分压,
Figure BDA00024728454700000710
是离开燃料电池阴极的氮气质量流,Tst是燃料电池电堆的温度,下角标st表示电堆(Stack),Vrm是排气歧管容积,下角标rm为Return manifold的缩写,Wca,out是燃料电池阴极出口质量流,下角标ca表示阴极(Cathode),Wrm,out是排气歧管出口质量流,Prm是排气歧管处压力。
在本实施例的优选方案中,所述燃料电池系统的最佳的过氧比为2,氧气质量流与氢气质量流的关系为:
Figure BDA00024728454700000711
下角标react表示反应(React)。其具体的原理在于,由于当过氧比小于1甚至略微大于1的时候,都会造成氧饥饿的现象,损害燃料电池的质子交换膜,所以最佳的过氧比是在2附近随着电流的变化而改变。且认为进入燃料电池的氢气与氧气满足1:2时就会立即反应产生电流,则进入燃料电池的氢气将会全部反应无多余氢气排出,则发生化学反应产生电流的氧气质量流与氢气质量流的关系为:
Figure BDA0002472845470000081
进一步获取燃料电池系统的电压:
Figure BDA0002472845470000082
其中,Vfc为燃料电池系统电压,E为能斯特电压,vact为活化损失,vohm为欧姆损失,vconc为浓差极化损失,下角标act、ohm、conc,分别表示:活化的(Active)、欧姆(Ohm)、浓差(concentration)。
所述燃料电池系统的电流与进入燃料电池的氢气质量的关系为:
Figure BDA0002472845470000083
所述燃料电池系统当前的功率则表示为燃料电池系统电压与电流的乘积:P=VfcIst-Pau
式中Pau为燃料电池附件所消耗的功率。
在本实施例中,在利用DDPG控制器和所述功率需求,训练工况预测模型的过程中,包括:
建立DDPG控制器,并将所述DDPG控制器的目标设置为实际燃料电池系统输出功率满足能量控制策略需求功率同时保持最佳过氧比。
通过所述DDPG控制器训练所述燃料电池系统的燃料供给模型。
其中,所述最佳过氧比为:进入所述燃料电池的氧气与发生化学反应产生电流的氧气的比例为:
Figure BDA0002472845470000084
其中,为了保证燃料电池的质子交换膜不受到损坏,且保证最大的燃料电池效率,所述最佳过氧比与电流的关系应维持在:
Figure BDA0002472845470000085
具体的,对所述DDPG控制器的目标进行设置,包括:定义DDPG控制器中的参数,包括:观测量(observation)、控制量(action)、程序提前终止条件(isdone)和回报函数(reward)。构建所述DDPG控制器的用于模型训练的双层神经网络。其中,所述的双层神经网络具体是指:
先依据策略梯度(Policy Gradient)原理建立双层网络结构评论(Critic)网络和行动(Actor)网络,其中行动(Actor)网络根据输入的状态s可以得到动作的输出a=μ(s|θμ),评论(Critic)网络通过计算值的函数Q函数Q(s,a|θQ),并根据根据输入的状态s、动作a,可以得到Q值Q(s,a|θQ)。同时在评论(Critic)网络和行动(Actor)网络里再建立一个双层网络结构分为实时(Online)网络和目标(Target)网络。在评论(Critic)网络和行动(Actor)网络各自的内部,目标(Target)网络和实时(Online)网络的结构是相同的。
在本实施例中,所述观测量(observation)包括:燃料电池系统的需求功率Pref,燃料电池系统实际输出功率P,电池系统实际输出功率与燃料电池系统需求功率的差值ΔP,燃料电池系统实际输出功率P与燃料电池系统需求功率的差值的变化率
Figure BDA0002472845470000091
最佳过氧比
Figure BDA0002472845470000092
参数下角标中的ref为reference的缩写,"参考"的意思,即最佳过氧比是一个理论计算得到的参考值。当前燃料电池系统的过氧比
Figure BDA0002472845470000093
当前燃料电池系统的过氧比与最佳过氧比的差值
Figure BDA0002472845470000094
当前燃料电池系统的过氧比与最佳过氧比的差值的变化率
Figure BDA0002472845470000095
所述控制量(action)包括:氢气流量阀的控制电压ufcv,和输入空气压缩机的电压u,其中,ufcv的下角标中的fcv,为燃料控制阀(Fuel control valve)的缩写。
所述程序提前终止条件(isdone)包括:当燃料电池系统的过氧比
Figure BDA0002472845470000101
时提前终止程序。
所述回报函数(reward)如下:
Figure BDA0002472845470000102
Mt表示惩罚项,当
Figure BDA0002472845470000103
的时候,Mt=1,否则Mt=0。Ms为奖励项,当
Figure BDA0002472845470000104
的时候,Ms=1,否则Ms=0。Md也是奖励项,当
Figure BDA0002472845470000105
的时候,Md=1,否则Md=0,Mt、Ms、Md的下角标t、s、d没有特殊的含义,仅用于区分这三个不同参数。
本实施例中所述的能量控制策略,可以基于具体的应用场景灵活设定,例如:采用市面上正在采用的简单可靠的基于规则的能量控制策略,维持电池的SOC稳定,仅用电池辅助汽车行驶。
本实施例步骤S2中,利用DDPG控制器和所述功率需求,训练工况预测模型,可以理解为:对实时评论(Online Critic)网络和实时行动(Online Actor)网络的参数θQ、θμ进行随机初始化。通过这两个网络参数θQ和θμ来初始化目标评论(Target Critic)网络和目标行动(Target Actor)网络的网络参数θQ′和θμ′,同时建立一个储存空间R作为经验回放(Memory Replay)的储存空间。
初始化完成后,开始进行迭代求解:
通过当前网络加上高斯扰动选择一个动作进行探索,动作at=μ(s|θμ)+Nt,其中Nt是一个高斯扰动。
在当前状态st下执行动作at,得到相应的奖励rt和下一个状态st+1,并且将这个过程形成的元组(st,at,rt,st+1)储存到经验回放(Memory Replay)空间R中。
从经验回放(Memory Replay)空间R随机选择一个小批量的元组数据,作为实时行动(Online Actor)网络和实时评论(Online Critic)网络的训练数据,用(si,ai,ri,si+1)表示单个数据。si为状态,ai为执行动作,ri为相应的奖励,si+1为下一个状态。
下面是关于评论(Critic)网络和行动(Actor)网络的更新:
先进行实时评论(Online Critic)网络的更新:
将当前的状态st输入实时行动(OnlineActor)网络,可以得到当前的动作at。将当前的状态st和动作at输入实时评论(Online Critic)网络可以得到当前的Q值Q(st,atQ)。
将下一时刻的状态st+1输入目标行动(Target Actor)网络可以得到一个动作at′=μ′(st+1μ′),将这个动作at′和下一时刻的状态st+1输入到目标评论(Target Critic)网络可以得到一个Q值Q′(st+1,μ′(st+1μ′)|θQ′),将这个Q值乘上一个学习率γ,加上当前的动作获得的奖励,就可以得到目标的Q值yt
yt=rt+γQ′(st+1,μ′(st+1μ′)|θQ′)
定义实时评论(Online Critic)网络损失(Loss)函数:
Figure BDA0002472845470000111
其中N为元组数据个数。
通过最小化损失(Loss)函数来更新实时评论(Online Critic)网络。
更新实时评论(Online Critic)网络结束后,再进行实时行动(Online Actor)网络的更新:
计算J关于θμ的梯度:
Figure BDA0002472845470000121
依据策略梯度(Policy Gradient)的原理对实时行动(Online Actor)网络进行更新。
最后利用更新完成的实时评论(Online Critic)网络和实时行动(Online Actor)网络的参数θQ和θμ对目标评论(Target Critic)网络和目标行动(Target Actor)网络的网络参数θQ′和θμ′进行更新,更新的模式为逐步的缓慢的更新:
Figure BDA0002472845470000122
式中:τ为更新率,τ远小于1,由此构建一个收敛的神经网络。
计算在当前氢气与空气过量供给系数下的总回报,当总回报达到设定值且收敛或者达到最大训练步数以后,训练结束。当总回报达到设定值且收敛时,此时氢气流量阀的控制电压以及输入空气压缩机的电压对于燃料电池系统的输出功率跟随需求功率还有燃料电池系统的过氧比跟随最佳过氧比的效果最好。
本实施例步骤S4中,利用所述速度预测序列,得到所述燃料电池系统的实际功率需求,并根据所述实际功率需求控制所述燃料电池系统的氢气流量阀和空气压缩机,可以理解为:
先建立神经网络工况预测模型。再通过相关传感器获取汽车的历史车速序列,通过神经网络工况预测模型输出未来车速预测序列。之后,将获取的未来汽车行驶车速作用于当前遵循的能量控制策略,导出燃料电池系统功率需求。然后,获取当前时刻车辆状态的相关信息,完成DDPG控制器中observation的数据采集,作用于已训练完成的DDPG控制器,控制氢气流量阀以及空气压缩机输出。
结合具体举例,说明上述实施例在实际应用场景中的实现方式:
图1是基于DDPG的燃料电池系统燃料供给方法的流程,按照流程示意图,可以完成对基于DDPG的燃料电池系统燃料供给方法的设计:
步骤101,建立氢气流量控制阀模型、空气压缩机模型以及燃料电池系统模型。
图2是氢气流量控制阀模型、空气压缩机模型以及燃料电池系统的具体模型,其详细的模型状态空间方程如下:
氢气流量控制阀为可变开度喷嘴,其模型在稳态下的控制输入信号的线性方程:
Wfcv=ufcvWfcv,max
式中,ufcv是氢气流量阀的控制电压,范围是0~1。Wfcv,max是喷嘴全开时的质量流量。
在供给歧管中,认为没有水蒸气或者液态水存在,则氢气在供给歧管中的动态过程为:
Figure BDA0002472845470000131
式中,
Figure BDA0002472845470000132
是阳极供给歧管中氢气的压力,
Figure BDA0002472845470000133
是氢气的气体常数,Tsm是供给歧管温度,Vsm是供给歧管的体积,
Figure BDA0002472845470000134
是进入阳极供给管道的氢气质量流,
Figure BDA0002472845470000135
是阳极供给歧管流出的氢气质量流。
认为氢气流量阀的质量流为进入阳极供给歧管中的氢气质量流:
Figure BDA0002472845470000136
认为在阳极供给歧管流出的氢气质量流,全部进入燃料电池。
Figure BDA0002472845470000141
空气压缩机的模型包括:
Figure BDA0002472845470000142
式中,ωcp是空气压缩机的转速,Jcp是空气压缩机旋转部件的转动惯量,τcm是空气压缩机电机的扭矩,τcp是空气压缩机输出端的扭矩,Psm是空气供给歧管的压力,Ra是空气气体常数,Vsm是空气供给歧管的容积,Tcp,out是离开空气压缩机的空气温度,Wcp,out是离开空气压缩机的空气质量流,Tsm,out是空气供给歧管的空气温度,Wsm,out是空气供给歧管的质量流。
其中空气压缩机的扭矩由输入空气压缩机的电压进行控制:
Figure BDA0002472845470000143
式中:u为输入空气压缩机的电压,ηcm为空气压缩机的效率,Rcm为空气压缩机内部电阻。
空气压缩机产生的空气质量流如下:
Figure BDA0002472845470000144
式中ωc为空气压缩机叶尖速度,dc为空气压缩机直径,Wcp为空气压缩机产生的空气质量流,φ为标准化空气压缩机流量比例,ρa为空气密度。
认为空气压缩机产生的质量流与离开空气压缩机的质量流一致:
Wcp=Wcp,out
燃料电池系统的模型包括:
Figure BDA0002472845470000151
Figure BDA0002472845470000152
是燃料电池阳极的氢气分压,
Figure BDA0002472845470000153
是进入燃料电池的氢气质量流,
Figure BDA0002472845470000154
是发生化学反应产生电流的氢气质量流,
Figure BDA0002472845470000155
是离开燃料电池阳极部分的氢气质量流,
Figure BDA0002472845470000156
是燃料电池阴极的氧气分压,
Figure BDA0002472845470000157
是进入燃料电池的氧气质量流,
Figure BDA0002472845470000158
是发生化学反应产生电流的氧气质量流,
Figure BDA0002472845470000159
是离开燃料电池阴极的氧气质量流,
Figure BDA00024728454700001510
是燃料电池阴极的氮气分压,
Figure BDA00024728454700001511
是进入燃料电池阴极的氮气质量流,
Figure BDA00024728454700001512
是离开燃料电池阴极的氮气质量流,Tst是燃料电池电堆的温度,Vrm是排气歧管容积,Wca,out是燃料电池阴极出口质量流,Wrm,out是排气歧管出口质量流。
由于当过氧比小于1甚至略微大于1的时候,都会造成氧饥饿的现象,损害燃料电池的质子交换膜,所以最佳的过氧比是在2附近随着电流的变化而改变。
且认为进入燃料电池的氢气与氧气满足1:2时就会立即反应产生电流,则进入燃料电池的氢气将会全部反应无多余氢气排出,则发生化学反应产生电流的氧气质量流与氢气质量流的关系为:
Figure BDA00024728454700001513
则可以得到燃料电池系统的电流是由进入燃料电池的氢气质量流所决定的,有以下关系:
Figure BDA0002472845470000161
燃料电池系统的电压如下:
Figure BDA0002472845470000162
式中Vfc为燃料电池系统电压,E为能斯特电压,vact为活化损失,vohm为欧姆损失,vconc为浓差极化损失。
则燃料电池系统当前的功率可以表示为:
P=VfcIst-Pau
式中Pau为燃料电池附件所消耗的功率。
所述的最佳过氧比具体是指:
进入燃料电池的氧气与发生化学反应产生电流的氧气的比例称为过氧比:
Figure BDA0002472845470000163
其中为了保证燃料电池的质子交换膜不受到损坏,且保证最大的燃料电池效率,最佳过氧比与电流的关系应保证:
Figure BDA0002472845470000164
步骤102,利用深度确定性策略梯度(DDPG)算法,建立DDPG控制器,目标为实际燃料电池系统输出功率满足能量控制策略需求功率同时保持最佳过氧比。
图3是DDPG控制器参数设置图,请参见图3,所述的DDPG控制器具体是指:
步骤401:定义DDPG控制器中的参数,包括:
观测量(observation)、控制量(action)、程序提前终止条件(isdone)和回报函数(reward)。
步骤402:构建用于模型训练的双层神经网络。
所述的观测量(observation)、控制量(action)、程序提前终止条件(isdone)和回报函数(reward)具体是指:
观测量(observation)包括:燃料电池系统的需求功率Pref,燃料电池系统实际输出功率P,电池系统实际输出功率与燃料电池系统需求功率的差值ΔP,燃料电池系统实际输出功率P与燃料电池系统需求功率的差值的变化率ΔP,最佳过氧比
Figure BDA0002472845470000171
当前燃料电池系统的过氧比
Figure BDA0002472845470000172
当前燃料电池系统的过氧比与最佳过氧比的差值
Figure BDA0002472845470000173
当前燃料电池系统的过氧比与最佳过氧比的差值的变化率
Figure BDA0002472845470000174
控制量(action)包括:氢气流量阀的控制电压ufcv,输入空气压缩机的电压u;
程序提前终止条件(isdone)包括:当燃料电池系统的过氧比
Figure BDA0002472845470000175
时提前终止程序。
所述回报函数(reward)如下:
Figure BDA0002472845470000176
Mt表示惩罚项,当
Figure BDA0002472845470000177
的时候,Mt=1,否则Mt=0。Ms为奖励项,当
Figure BDA0002472845470000178
的时候,Ms=1,否则Ms=0。Md也是奖励项,当
Figure BDA0002472845470000179
的时候,Md=1,否则Md=0。
图4是基于DDPG算法的燃料电池系统燃料供给模型训练流程图,请参见图4,开始训练之前需要建立神经网络,所述的建立的双层神经网络具体是指:
先依据策略梯度(Policy Gradient)原理建立双层网络结构评论(Critic)网络和行动(Actor)网络,其中行动(Actor)网络根据输入的状态s可以得到动作的输出a=μ(s|θμ),评论(Critic)网络通过计算值的函数Q函数Q(s,a|θQ),并根据根据输入的状态s、动作a,可以得到Q值Q(s,a|θQ)。
同时在评论(Critic)网络和行动(Actor)网络里再建立一个双层网络结构分为实时(Online)网络和目标(Target)网络。在评论(Critic)网络和行动(Actor)网络各自的内部,目标(Target)网络和实时(Online)网络的结构是相同的。
步骤103,获取氢燃料电池混合动力汽车的典型工况行驶速度信息,将其转变为功率需求,并根据预设的能量控制策略,可以得到典型工况的燃料电池系统的功率需求,用于模型训练。
获取氢燃料电池混合动力汽车的典型工况行驶速度信息,将其转变为功率需求主要是通过驾驶员模型,将速度信息转变为踩下踏板的行程,从而转变为功率需求
依据的能量控制策略具体是指:
采用市面上正在采用的简单可靠的基于规则的能量控制策略,维持电池的SOC稳定,仅用电池辅助汽车行驶。
步骤104,基于建立好的双层神经网络,训练基于DDPG的燃料电池系统燃料供给模型,具体包括:
图4所述的训练神经网络包括:
对实时评论(Online Critic)网络和实时行动(Online Actor)网络的参数θQ、θμ进行随机初始化。通过这两个网络参数θQ和θμ来初始化目标评论(Target Critic)网络和目标行动(Target Actor)网络的网络参数θQ′和θμ′,同时建立一个储存空间R作为经验回放(Memory Replay)的储存空间。
初始化完成后,开始进行迭代求解:
通过当前网络加上高斯扰动选择一个动作进行探索,动作at=μ(s|θμ)+Nt,其中Nt是一个高斯扰动。
在当前状态st下执行动作at,得到相应的奖励rt和下一个状态st+1,并且将这个过程形成的元组(st,at,rt,st+1)储存到经验回放(Memory Replay)空间R中。
从经验回放(Memory Replay)空间R随机选择一个小批量的元组数据,作为实时行动(Online Actor)网络和实时评论(Online Critic)网络的训练数据,用(si,ai,ri,si+1)表示单个数据。si为状态,ai为执行动作,ri为相应的奖励,si+1为下一个状态。
图5是DDPG算法网络更新流程图,请参见图5,关于评论(Critic)网络和行动(Actor)网络的更新如下:
先进行实时评论(Online Critic)网络的更新:
将当前的状态st输入实时行动(OnlineActor)网络,可以得到当前的动作at。将当前的状态st和动作at输入实时评论(Online Critic)网络可以得到当前的Q值Q(st,atQ)。
将下一时刻的状态st+1输入目标行动(Target Actor)网络可以得到一个动作at′=μ′(st+1μ′),将这个动作at′和下一时刻的状态st+1输入到目标评论(Target Critic)网络可以得到一个Q值Q′(st+1,μ′(st+1μ′)|θQ′),将这个Q值乘上一个学习率γ,加上当前的动作获得的奖励,就可以得到目标的Q值yt
yt=rt+γQ′(st+1,μ′(st+1μ′)|θQ′)
定义实时评论(Online Critic)网络损失(Loss)函数:
Figure BDA0002472845470000201
其中N为元组数据个数。
通过最小化损失(Loss)函数来更新实时评论(Online Critic)网络。
更新实时评论(Online Critic)网络结束后,再进行实时行动(Online Actor)网络的更新:
计算J关于θμ的梯度:
Figure BDA0002472845470000202
依据策略梯度(Policy Gradient)的原理对实时行动(Online Actor)网络进行更新。
最后利用更新完成的实时评论(Online Critic)网络和实时行动(Online Actor)网络的参数θQ和θμ对目标评论(Target Critic)网络和目标行动(Target Actor)网络的网络参数θQ′和θμ′进行更新,更新的模式为逐步的缓慢的更新:
Figure BDA0002472845470000203
式中:τ为更新率,τ远小于1,由此构建一个收敛的神经网络。
计算在当前氢气与空气过量供给系数下的总回报,当总回报达到设定值且收敛或者达到最大训练步数以后,训练结束。当总回报达到设定值且收敛时,此时氢气流量阀的控制电压以及输入空气压缩机的电压对于燃料电池系统的输出功率跟随需求功率还有燃料电池系统的过氧比跟随最佳过氧比的效果最好。
步骤105,建立神经网络工况预测模型,通过历史工况对汽车未来行驶工况进行预测,具体包括:
步骤901:建立神经网络工况预测模型。
步骤902:通过相关传感器获取汽车的历史车速序列,通过神经网络工况预测模型输出未来车速预测序列。
步骤903:将获取的未来汽车行驶车速作用于当前遵循的能量控制策略,导出燃料电池系统功率需求。
步骤904:获取当前时刻车辆状态的相关信息,完成DDPG控制器中observation的数据采集,作用于已训练完成的DDPG控制器,控制氢气流量阀以及空气压缩机输出。
步骤905:如此重复步骤902至步骤904,直至汽车完成行驶任务。
本发明实施例中,能够进一步实现多控制量、多目标的控制。能够准确及时的在考虑了附件损耗的前提下,满足燃料电池混合电动汽车的能量控制策略分配给的燃料电池系统的功率需求,且依旧能够较好的跟随燃料电池系统最佳的过氧比。在准确及时的达到所需功率的同时,能够最大限度的提升燃料电池的使用效率和使用寿命。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于设备实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。

Claims (9)

1.一种基于深度强化学习的燃料电池系统的燃料供给方法,其特征在于,包括:
获取燃料电池系统的工况数据的样本集合,根据所述工况数据的样本集合得到功率需求,其中,所述工况数据至少包括:速度信息;
利用DDPG控制器和所述功率需求,训练工况预测模型,其中,所述DDPG控制器的目标为:在燃料电池系统输出功率,满足能量控制策略需求功率的同时,保持过氧比在预设范围内,所述工况预测模型包括:氢气流量控制阀模型、空气压缩机模型和燃料电池系统模型;
将实际的工况数据输入所述工况预测模型,得到速度预测序列;
利用所述速度预测序列,得到所述燃料电池系统的实际功率需求,并根据所述实际功率需求控制所述燃料电池系统的氢气流量阀和空气压缩机。
2.根据权利要求1所述的方法,其特征在于,对所述DDPG控制器的目标进行设置,包括:
定义DDPG控制器中的参数,包括:观测量(observation)、控制量(action)、程序提前终止条件(isdone)和回报函数(reward);
构建所述DDPG控制器的用于模型训练的双层神经网络。
3.根据权利要求2所述的方法,其特征在于,所述观测量(observation)包括:燃料电池系统的需求功率Pref,燃料电池系统实际输出功率P,电池系统实际输出功率与燃料电池系统需求功率的差值ΔP,燃料电池系统实际输出功率P与燃料电池系统需求功率的差值的变化率
Figure FDA0002472845460000011
最佳过氧比
Figure FDA0002472845460000012
当前燃料电池系统的过氧比
Figure FDA0002472845460000013
当前燃料电池系统的过氧比与最佳过氧比的差值
Figure FDA0002472845460000014
当前燃料电池系统的过氧比与最佳过氧比的差值的变化率
Figure FDA0002472845460000015
所述控制量(action)包括:氢气流量阀的控制电压ufcv,和输入空气压缩机的电压u;
所述程序提前终止条件(isdone)包括:当燃料电池系统的过氧比
Figure FDA0002472845460000021
时提前终止程序;
所述回报函数(reward)如下:
Figure FDA0002472845460000022
Mt表示惩罚项,当
Figure FDA0002472845460000023
的时候,Mt=1,否则Mt=0;Ms为奖励项,当
Figure FDA0002472845460000024
的时候,Ms=1,否则Ms=0;Md也是奖励项,当
Figure FDA0002472845460000025
的时候,Md=1,否则Md=0。
4.根据权利要求1所述的方法,其特征在于,还包括获取氢气流量控制阀模型:
获取所述氢气流量控制阀的控制输入信号Wfcv=ufcvWfcv,max,其中,ufcv是氢气流量阀的控制电压,范围是0~1;Wfcv,max是喷嘴全开时的质量流量,所述氢气流量控制阀为可变开度喷嘴;
获取氢气在供给歧管中的动态过程
Figure FDA0002472845460000026
其中,
Figure FDA0002472845460000027
是阳极供给歧管中氢气的压力,
Figure FDA0002472845460000028
是氢气的气体常数,Tsm是供给歧管温度,Vsm是供给歧管的体积,
Figure FDA0002472845460000029
是进入阳极供给管道的氢气质量流,
Figure FDA00024728454600000210
是阳极供给歧管流出的氢气质量流。
5.根据权利要求4所述的方法,其特征在于,还包括获取空气压缩机模型:
所述空气压缩机的模型包括:
Figure FDA0002472845460000031
其中,ωcp是空气压缩机的转速,Jcp是空气压缩机旋转部件的转动惯量,τcm是空气压缩机电机的扭矩,τcp是空气压缩机输出端的扭矩,Psm是空气供给歧管的压力,Ra是空气气体常数,Vsm是空气供给歧管的容积,Tcp,out是离开空气压缩机的空气温度,Wcp,out是离开空气压缩机的空气质量流,Tsm,out是空气供给歧管的空气温度,Wsm,out是空气供给歧管的质量流;
所述空气压缩机的扭矩由输入所述空气压缩机的电压进行控制:
Figure FDA0002472845460000032
其中,u为输入空气压缩机的电压,ηcm为空气压缩机的效率,Rcm为空气压缩机内部电阻,kt和kv则是空气压缩机电机常数;
所述空气压缩机产生的空气质量流为:
Figure FDA0002472845460000033
其中,ωc为空气压缩机叶尖速度,dc为空气压缩机直径,Wcp为空气压缩机产生的空气质量流,φ为标准化空气压缩机流量比例,ρa为空气密度。
6.根据权利要求5所述的方法,其特征在于,所述氢气流量阀的质量流为进入阳极供给歧管中的氢气质量流,则
Figure FDA0002472845460000034
当所述阳极供给歧管流出的氢气质量流,全部进入燃料电池时:
Figure FDA0002472845460000035
当所述空气压缩机产生的质量流与离开空气压缩机的质量流一致时:Wcp=Wcp,out
进入燃料电池阴极的质量流包括氧气流、氮气流和水蒸气流:
Figure FDA0002472845460000036
其中,
Figure FDA0002472845460000037
是进入燃料电池的水蒸气质量流,
Figure FDA0002472845460000038
是进入燃料电池的氧气质量流,
Figure FDA0002472845460000041
是进入燃料电池阴极的氮气质量流。
7.根据权利要求6所述的方法,其特征在于,还包括获取燃料电池系统模型:
所述燃料电池系统的模型包括:
Figure FDA0002472845460000042
其中,
Figure FDA0002472845460000043
是燃料电池阳极的氢气分压,
Figure FDA0002472845460000044
是进入燃料电池的氢气质量流,
Figure FDA0002472845460000045
是发生化学反应产生电流的氢气质量流,
Figure FDA0002472845460000046
是离开燃料电池阳极部分的氢气质量流,
Figure FDA0002472845460000047
是燃料电池阴极的氧气分压,
Figure FDA0002472845460000048
是发生化学反应产生电流的氧气质量流,
Figure FDA0002472845460000049
是离开燃料电池阴极的氧气质量流,
Figure FDA00024728454600000410
是燃料电池阴极的氮气分压,
Figure FDA00024728454600000411
是离开燃料电池阴极的氮气质量流,Tst是燃料电池电堆的温度,Vrm是排气歧管容积,Wca,out是燃料电池阴极出口质量流,Wrm,out是排气歧管出口质量流,Prm是排气歧管处压力。
8.根据权利要求7所述的方法,其特征在于,所述燃料电池系统的最佳的过氧比为2,氧气质量流与氢气质量流的关系为:
Figure FDA00024728454600000412
获取燃料电池系统的电压:
Figure FDA0002472845460000051
其中,Vfc为燃料电池系统电压,E为能斯特电压,vact为活化损失,vohm为欧姆损失,vconc为浓差极化损失;
所述燃料电池系统的电流与进入燃料电池的氢气质量的关系为:
Figure FDA0002472845460000052
所述燃料电池系统当前的功率则表示为燃料电池系统电压与电流的乘积:P=VfcIst
9.根据权利要求6所述的方法,其特征在于,在利用DDPG控制器和所述功率需求,训练工况预测模型的过程中,包括:
建立DDPG控制器,并将所述DDPG控制器的目标设置为实际燃料电池系统输出功率满足能量控制策略需求功率同时保持最佳过氧比;
通过所述DDPG控制器训练所述燃料电池系统的燃料供给模型;
其中,所述最佳过氧比为:进入所述燃料电池的氧气与发生化学反应产生电流的氧气的比例为:
Figure FDA0002472845460000053
所述最佳过氧比与电流的关系应维持在:
Figure FDA0002472845460000054
CN202010353990.2A 2020-04-29 2020-04-29 一种基于深度强化学习的燃料电池系统的燃料供给方法 Active CN111584906B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010353990.2A CN111584906B (zh) 2020-04-29 2020-04-29 一种基于深度强化学习的燃料电池系统的燃料供给方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010353990.2A CN111584906B (zh) 2020-04-29 2020-04-29 一种基于深度强化学习的燃料电池系统的燃料供给方法

Publications (2)

Publication Number Publication Date
CN111584906A true CN111584906A (zh) 2020-08-25
CN111584906B CN111584906B (zh) 2023-06-27

Family

ID=72111837

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010353990.2A Active CN111584906B (zh) 2020-04-29 2020-04-29 一种基于深度强化学习的燃料电池系统的燃料供给方法

Country Status (1)

Country Link
CN (1) CN111584906B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112287463A (zh) * 2020-11-03 2021-01-29 重庆大学 一种基于深度强化学习算法的燃料电池汽车能量管理方法
CN112397747A (zh) * 2020-11-10 2021-02-23 一汽解放汽车有限公司 用于燃料电池发动机的供气控制方法、车辆及存储介质
CN112817240A (zh) * 2020-12-30 2021-05-18 西安交通大学 一种基于深度强化学习算法的离心压缩机调控方法
CN112886039A (zh) * 2021-01-11 2021-06-01 清华大学深圳国际研究生院 一种基于强化学习的压水堆堆芯自动控制方法
CN113314744A (zh) * 2021-04-18 2021-08-27 广西大学 一种双尺度平行强化学习的质子交换膜燃料电池控制方法
CN113782791A (zh) * 2021-08-02 2021-12-10 佛山仙湖实验室 车用质子交换膜燃料电池功率控制方法和系统
CN114103971A (zh) * 2021-11-23 2022-03-01 北京理工大学 一种燃料电池汽车节能驾驶优化方法及装置
CN116995268A (zh) * 2023-06-01 2023-11-03 佛山仙湖实验室 一种质子交换膜燃料电池空气供给系统的控制方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109524693A (zh) * 2018-11-13 2019-03-26 吉林大学 燃料电池空气供给系统模型预测控制方法
CN110103776A (zh) * 2019-05-06 2019-08-09 重庆大学 基于智能迭代学习的燃料电池整车功率需求变化预测方法
CN110335646A (zh) * 2019-07-12 2019-10-15 福州大学 基于深度学习-预测控制的车用燃料电池过氢比控制方法
CN110414157A (zh) * 2019-07-31 2019-11-05 四川嘉垭汽车科技有限公司 质子交换膜燃料电池系统多目标滑模控制方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109524693A (zh) * 2018-11-13 2019-03-26 吉林大学 燃料电池空气供给系统模型预测控制方法
CN110103776A (zh) * 2019-05-06 2019-08-09 重庆大学 基于智能迭代学习的燃料电池整车功率需求变化预测方法
CN110335646A (zh) * 2019-07-12 2019-10-15 福州大学 基于深度学习-预测控制的车用燃料电池过氢比控制方法
CN110414157A (zh) * 2019-07-31 2019-11-05 四川嘉垭汽车科技有限公司 质子交换膜燃料电池系统多目标滑模控制方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
MEYSAM GHEISARNEJAD等: ""A New Adaptive Type-II Fuzzy-Based Deep Reinforcement Learning Control: Fuel Cell Air-Feed Sensors Control "", 《IEEE SENSORS JOURNAL,》 *

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112287463B (zh) * 2020-11-03 2022-02-11 重庆大学 一种基于深度强化学习算法的燃料电池汽车能量管理方法
CN112287463A (zh) * 2020-11-03 2021-01-29 重庆大学 一种基于深度强化学习算法的燃料电池汽车能量管理方法
CN112397747A (zh) * 2020-11-10 2021-02-23 一汽解放汽车有限公司 用于燃料电池发动机的供气控制方法、车辆及存储介质
CN112817240A (zh) * 2020-12-30 2021-05-18 西安交通大学 一种基于深度强化学习算法的离心压缩机调控方法
CN112817240B (zh) * 2020-12-30 2022-03-22 西安交通大学 一种基于深度强化学习算法的离心压缩机调控方法
CN112886039A (zh) * 2021-01-11 2021-06-01 清华大学深圳国际研究生院 一种基于强化学习的压水堆堆芯自动控制方法
CN112886039B (zh) * 2021-01-11 2021-11-23 清华大学深圳国际研究生院 一种基于强化学习的压水堆堆芯自动控制方法
CN113314744A (zh) * 2021-04-18 2021-08-27 广西大学 一种双尺度平行强化学习的质子交换膜燃料电池控制方法
CN113782791A (zh) * 2021-08-02 2021-12-10 佛山仙湖实验室 车用质子交换膜燃料电池功率控制方法和系统
CN114103971A (zh) * 2021-11-23 2022-03-01 北京理工大学 一种燃料电池汽车节能驾驶优化方法及装置
CN114103971B (zh) * 2021-11-23 2023-10-10 北京理工大学 一种燃料电池汽车节能驾驶优化方法及装置
CN116995268A (zh) * 2023-06-01 2023-11-03 佛山仙湖实验室 一种质子交换膜燃料电池空气供给系统的控制方法及装置
CN116995268B (zh) * 2023-06-01 2024-03-01 佛山仙湖实验室 一种质子交换膜燃料电池空气供给系统的控制方法及装置

Also Published As

Publication number Publication date
CN111584906B (zh) 2023-06-27

Similar Documents

Publication Publication Date Title
CN111584906B (zh) 一种基于深度强化学习的燃料电池系统的燃料供给方法
CN109524693B (zh) 燃料电池空气供给系统模型预测控制方法
CN110335646B (zh) 基于深度学习-预测控制的车用燃料电池过氢比控制方法
CN107437627B (zh) 带有多个可选的运行模式的燃料电池车辆
CN108091909B (zh) 一种基于最佳过氧比的燃料电池空气流量控制方法
CN103178281B (zh) 用于控制燃料电池组阳极内压力振荡的系统和方法
JP5505024B2 (ja) 燃料電池自動車及びその制御方法
CN113002370B (zh) 一种燃料电池汽车实时能量管理控制方法
CN114156510B (zh) 一种基于模型预测控制的燃料电池功率跟踪控制方法
CN101622746A (zh) 燃料电池系统
CN111736462B (zh) 一种燃料电池汽车最优氢耗控制方法
CN113090406B (zh) 自学习方法、车辆及可读存储介质
Karaoğlan et al. Investigation of the effects of battery types and power management algorithms on drive cycle simulation for a range-extended electric vehicle powertrain
CN114801788A (zh) 一种新能源汽车能量管理方法、系统、设备和存储介质
CN111063919A (zh) 燃料电池阳极状态监测方法
CN113815437A (zh) 燃料电池混合动力汽车的预测性能量管理方法
CN116001654A (zh) 电池能量控制方法、装置、系统和电子设备
CN116409216A (zh) 基于预测的非线性模型控制的燃料电池汽车能量管理方法
CN114530618B (zh) 基于随机优化算法的燃料电池与空压机匹配建模方法
CN114889580A (zh) 混合动力车辆能量管理控制方法、系统、装置及存储介质
CN115692797A (zh) 一种车用燃料电池水热管理系统优化方法
US9174626B2 (en) Methods and systems for controlling shifting between operating modes in hybrid vehicles
Quan et al. A hierarchical predictive strategy-based hydrogen stoichiometry control for automotive fuel cell power system
CN114340963A (zh) 混合动力车辆中的扭矩分配的管理方法
CN114497649B (zh) 进堆氢气压力传感器的故障识别装置及故障识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant