CN115408948A - 一种氢气加注的最优策略确定方法、系统及电子设备 - Google Patents
一种氢气加注的最优策略确定方法、系统及电子设备 Download PDFInfo
- Publication number
- CN115408948A CN115408948A CN202211269394.1A CN202211269394A CN115408948A CN 115408948 A CN115408948 A CN 115408948A CN 202211269394 A CN202211269394 A CN 202211269394A CN 115408948 A CN115408948 A CN 115408948A
- Authority
- CN
- China
- Prior art keywords
- hydrogen storage
- storage bottle
- hydrogen
- filling
- temperature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 239000001257 hydrogen Substances 0.000 title claims abstract description 432
- 229910052739 hydrogen Inorganic materials 0.000 title claims abstract description 432
- UFHFLCQGNIYNRP-UHFFFAOYSA-N Hydrogen Chemical compound [H][H] UFHFLCQGNIYNRP-UHFFFAOYSA-N 0.000 title claims abstract description 406
- 238000000034 method Methods 0.000 title claims abstract description 46
- 230000009471 action Effects 0.000 claims abstract description 108
- XAGFODPZIPBFFR-UHFFFAOYSA-N aluminium Chemical compound [Al] XAGFODPZIPBFFR-UHFFFAOYSA-N 0.000 claims abstract description 65
- 229910052782 aluminium Inorganic materials 0.000 claims abstract description 65
- 238000011156 evaluation Methods 0.000 claims abstract description 41
- 238000012549 training Methods 0.000 claims abstract description 30
- 125000004435 hydrogen atom Chemical group [H]* 0.000 claims abstract description 24
- 230000008859 change Effects 0.000 claims abstract description 16
- 230000002787 reinforcement Effects 0.000 claims abstract description 10
- VNWKTOKETHGBQD-UHFFFAOYSA-N methane Chemical compound C VNWKTOKETHGBQD-UHFFFAOYSA-N 0.000 claims description 30
- 229920000049 Carbon (fiber) Polymers 0.000 claims description 28
- 239000004917 carbon fiber Substances 0.000 claims description 28
- 239000007789 gas Substances 0.000 claims description 19
- 238000004590 computer program Methods 0.000 claims description 12
- 150000002431 hydrogen Chemical class 0.000 claims description 8
- 238000004364 calculation method Methods 0.000 claims description 7
- 238000006243 chemical reaction Methods 0.000 claims description 6
- 238000013528 artificial neural network Methods 0.000 claims description 2
- 230000037452 priming Effects 0.000 claims 4
- 230000005284 excitation Effects 0.000 claims 1
- 238000012546 transfer Methods 0.000 description 10
- 238000005429 filling process Methods 0.000 description 7
- 239000000463 material Substances 0.000 description 7
- 238000002347 injection Methods 0.000 description 6
- 239000007924 injection Substances 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 238000013461 design Methods 0.000 description 5
- 239000000446 fuel Substances 0.000 description 5
- 238000005984 hydrogenation reaction Methods 0.000 description 5
- 239000011347 resin Substances 0.000 description 5
- 229920005989 resin Polymers 0.000 description 5
- 239000007787 solid Substances 0.000 description 3
- 239000000243 solution Substances 0.000 description 3
- 239000003795 chemical substances by application Substances 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000009472 formulation Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 210000000232 gallbladder Anatomy 0.000 description 2
- 230000005055 memory storage Effects 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 239000002131 composite material Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000004134 energy conservation Methods 0.000 description 1
- 238000005265 energy consumption Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000005431 greenhouse gas Substances 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 239000003345 natural gas Substances 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000005381 potential energy Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000007789 sealing Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000004804 winding Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/28—Design optimisation, verification or simulation using fluid dynamics, e.g. using Navier-Stokes equations or computational fluid dynamics [CFD]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2119/00—Details relating to the type or aim of the analysis or the optimisation
- G06F2119/08—Thermal analysis or thermal optimisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2119/00—Details relating to the type or aim of the analysis or the optimisation
- G06F2119/14—Force analysis or force optimisation, e.g. static or dynamic forces
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02E—REDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
- Y02E60/00—Enabling technologies; Technologies with a potential or indirect contribution to GHG emissions mitigation
- Y02E60/30—Hydrogen technology
- Y02E60/32—Hydrogen storage
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Geometry (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Computer Hardware Design (AREA)
- Mathematical Optimization (AREA)
- Health & Medical Sciences (AREA)
- Mathematical Analysis (AREA)
- Fluid Mechanics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Algebra (AREA)
- Pure & Applied Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Filling Or Discharging Of Gas Storage Vessels (AREA)
Abstract
本发明涉及一种氢气加注的最优策略确定方法、系统及电子设备,属于氢气加注技术领域。本发明利用评估网络模型选取加注速度最快且引起储氢瓶内氢气区的温度及储氢瓶的铝内胆内壁的温度的变化最小的加注动作,作为最优加注动作;利用热力学模型,进行状态更新,利用目标网络模型对评估网络模型进行训练,直到达到加注终点,获得1条加注策略,此时将训练后的评估网络模型的参数复制给目标网络模型,采用上述步骤获取N条加注策略,从中选取最优加注策略。本发明结合储氢瓶的热力学模型与深度强化学习方法实时设计出最优加注策略,实现不同的初始储氢瓶压强、温度与固定加注时间条件下,使储氢瓶内温度上升尽可能小。
Description
技术领域
本发明涉及氢气加注技术领域,特别是涉及一种氢气加注的最优策略确定方法、系统及电子设备。
背景技术
随着与日俱增的化石能源消耗,温室气体的排放对全球气候的影响不断加剧。氢能,作为替代石油和天然气最有潜力的能源之一,备受研究人员关注。燃料电池汽车作为氢能在交通运输领域的主要应用载体也成为汽车行业的下一片蓝海。燃料电池电动汽车相比起动力电池汽车,具有高效率、低噪声、无污染、加注速度快等优势。燃料电池汽车的加注速度和续航里程是由加注过程车载储氢瓶内的压强、温度变化情况决定的。一方面储氢瓶的加注过程中的温升现象引起储氢密度降低,减小燃料电池汽车的续驶里程。另一方面,车载储氢瓶的温度和压强变化对储氢瓶的疲劳损伤有直接关系,所以对储氢瓶的安全性有重要影响。如何针对储氢瓶的不同状态制定加注策略,以提高加注速度,并减小加注过程中引起的储氢瓶内的温度的变化。
发明内容
有鉴于此,本发明提供了一种氢气加注的最优策略确定方法、系统及电子设备,以实现针对储氢瓶的不同状态制定加注策略,提高加注速度,并减小加注过程中引起的储氢瓶内的温度的变化。
为实现上述目的,本发明提供了如下方案:
一种氢气加注的最优策略确定方法,所述方法包括如下步骤:
构建储氢瓶的热力学模型,并将储氢瓶的初始的状态设置为储氢瓶的当前状态;所述状态包括储氢瓶内氢气区的温度、储氢瓶的铝内胆内壁的温度和储氢瓶内氢气的压强;
基于储氢瓶的当前状态,利用评估网络模型选取下一个最优加注动作;所述加注动作包括加注氢气的质量流量,所述最优加注动作为加注速度最快且引起储氢瓶内氢气区的温度及储氢瓶的铝内胆内壁的温度的变化最小的加注动作;
基于所述热力学模型,确定执行所述最优加注动作后所述储氢瓶的状态,作为储氢瓶的当前状态,并根据目标网络模型对评估网络模型进行训练;
返回步骤“基于储氢瓶的当前状态,利用深度强化学习模型选取下一个最优加注动作”,直到达到加注终点,获得第j条加注策略,并将训练后的评估网络模型的参数复制给所述目标网络模型,令j的数值增加1,并将储氢瓶的初始的状态作为储氢瓶的当前状态,返回步骤“基于储氢瓶的当前状态,利用评估网络模型选取下一个最优加注动作”,直到获得N条加注策略;
在N条加注策略中选取最优加注策略;所述最优加注策略为加注速度最快且引起储氢瓶内氢气区的温度及储氢瓶的铝内胆内壁的温度的变化最小的加注策略。
可选的,所述基于所述热力学模型,确定执行所述最优加注动作后所述储氢瓶的状态,具体包括:
基于所述热力学模型,确定执行所述最优加注动作后的储氢瓶内氢气区的温度;
根据储氢瓶内氢气区的温度,基于所述热力学模型,计算储氢瓶的铝内胆内壁的温度和储氢瓶内氢气的压强。
可选的,所述基于所述热力学模型,确定执行所述最优加注动作后的储氢瓶内氢气区的温度,具体包括:
基于所述热力学模型,计算储氢瓶的总等效阻值为:
根据储氢瓶的总等效阻值,确定执行所述最优加注动作后的储氢瓶内氢气区的温度为:
其中,为储氢瓶内氢气区的温度,、和分别为特征温度、转化系数和特征时间;为计算系数,为动能转换系数,γ为比热容比;为加注氢气的温度,T 4为储氢瓶外部大气区的温度,为加注氢气的质量流量,为气体常数,为氢气的等容比热容,为加注氢气的压强,表示数值为的常数,为加注孔的面积,为氢气的等压比热容;为储气瓶内初始的氢气质量,为加注时间。
可选的,所述根据储氢瓶内氢气区的温度,基于所述热力学模型,计算储氢瓶的铝内胆内壁的温度和储氢瓶内氢气的压强,具体包括:
根据所述热力学模型,确定储氢瓶的氢气区与铝内胆内壁的热对流热阻;
根据储氢瓶内氢气区的温度和储氢瓶的氢气区与铝内胆内壁的热对流热阻,计算储氢瓶的铝内胆内壁的温度为:
根据储氢瓶内氢气区的温度,计算储氢瓶内氢气的压强为:
可选的,所述根据目标网络模型对评估网络模型进行训练,具体包括:
根据执行所述最优加注动作后所述储氢瓶的状态计算执行所述最优加注动作的第一奖励值;
将执行所述最优加注动作之前的储氢瓶的状态、所述最优加注动作、所述第一奖励值及执行所述最优加注动作之后的储氢瓶的状态作为经验条,加入经验池;
从所述经验池中选取多个经验条,作为训练经验条;
利用所述目标网络模型,计算执行每个所述训练经验条中的最优加注动作的第二奖励值;
以所述训练经验条中的执行最优加注动作之前的储氢瓶的状态、最优加注动为输入,以所述训练经验条的第二奖励值为输出期望值,训练所述评估网络模型。
可选的,所述第一奖励值的计算公式为:
其中,R 1为第一奖励值,和分别为执行最优加注动作后所述储氢瓶的状态中的储氢瓶内氢气区的温度和储氢瓶的铝内胆内壁的温度,k 1和k 2分别为储氢瓶内氢气区的温度和储氢瓶的铝内胆内壁的温度的重要性系数,为加注氢气的质量流量。
可选的,所述第二奖励值的计算公式为:
可选的,在N条加注策略中选取最优加注策略,具体包括:
利用如下公式计算每条加注策略的总奖励值;
选取总奖励值最大的加注策略作为最优加注策略。
一种氢气加注的最优策略确定系统,所述系统应用于上述的方法,所述系统包括:
初始化模块,用于构建储氢瓶的热力学模型,并将储氢瓶的初始的状态设置为储氢瓶的当前状态;所述状态包括储氢瓶内氢气区的温度、储氢瓶的铝内胆内壁的温度和储氢瓶内氢气的压强;
最优加注动作选取模块,用于基于储氢瓶的当前状态,利用评估网络模型选取下一个最优加注动作;所述加注动作包括加注氢气的质量流量,所述最优加注动作为加注速度最快且引起储氢瓶内氢气区的温度及储氢瓶的铝内胆内壁的温度的变化最小的加注动作;
训练模块,用于基于所述热力学模型,确定执行所述最优加注动作后所述储氢瓶的状态,作为储氢瓶的当前状态,并根据目标网络模型对评估网络模型进行训练;
返回模块,用于返回步骤“基于储氢瓶的当前状态,利用深度强化学习模型选取下一个最优加注动作”,直到达到加注终点,获得第j条加注策略,并将训练后的评估网络模型的参数复制给所述目标网络模型,令j的数值增加1,并将储氢瓶的初始的状态作为储氢瓶的当前状态,返回步骤“基于储氢瓶的当前状态,利用评估网络模型选取下一个最优加注动作”,直到获得N条加注策略;
最优加注策略选取模块,用于在N条加注策略中选取最优加注策略所述最优加注策略为加注速度最快且引起储氢瓶内氢气区的温度及储氢瓶的铝内胆内壁的温度的变化最小的加注策略。
一种电子设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述的方法。
一种计算机可读存储介质,所述存储介质上存储有计算机程序,所述计算机程序被执行时实现上述的方法。
根据本发明提供的具体实施例,本发明公开了以下技术效果:
本发明公开一种氢气加注的最优策略确定方法、系统及电子设备,所述方法包括如下步骤:构建储氢瓶的热力学模型,并将储氢瓶的初始的状态设置为储氢瓶的当前状态;基于储氢瓶的当前状态,利用评估网络模型选取下一个最优加注动作;基于所述热力学模型,确定执行所述最优加注动作后所述储氢瓶的状态,作为储氢瓶的当前状态,并根据目标网络模型对评估网络模型进行训练;返回步骤“基于储氢瓶的当前状态,利用深度强化学习模型选取下一个最优加注动作”,直到达到加注终点,获得第j条加注策略,并将训练后的评估网络模型的参数复制给所述目标网络模型,令j的数值增加1,并将储氢瓶的初始的状态作为储氢瓶的当前状态,返回步骤“基于储氢瓶的当前状态,利用评估网络模型选取下一个最优加注动作”,直到获得N条加注策略;在N条加注策略中选取最优加注策略。本发明结合储氢瓶的热力学模型与深度强化学习方法(评估网络模型和目标网络模型)实时设计出最优加注策略,进而实现在不同的初始储氢瓶压强、温度与固定加注时间条件下,使氢气加注量最多、温度上升尽可能小。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种氢气加注的最优策略确定方法的流程图;
图2为本发明实施例提供的储氢瓶的结构示意图;
图3为本发明实施例提供的储氢瓶传热示意图;
图4为本发明实施例提供的最优加注策略获取的原理图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的目的是提供一种氢气加注的最优策略确定方法、系统及电子设备,以实现针对储氢瓶的不同状态制定加注策略,提高加注速度,并减小加注过程中引起的储氢瓶内的温度的变化。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
目前,氢气加注策略的研究还停留在在加注过程中给出一系列的氢气质量流量的限制条件,不能为初始压强、温度不同的储氢瓶制定最优的加注策略,保证在给定的时间内加注最多的氢气,同时满足压强和温度的限制条件。
武汉理工大学的周鑫在论文车载储氢罐加注过程的模拟与性能预测中,建立了简易储氢瓶热力学模型,给出了在恒质量流量下储氢瓶内氢气温度、压强的变化。但是文中并未给出最优的加注策略,同时忽略储氢瓶壁之间的热传导。
浙江大学的郭进兴在论文高压氢循环试验系统温度控制与能耗优化设计方法研究中,建立了氢循环储氢瓶热力学模型,考虑了高压过程中氢气关键物性参数的变化,给出了恒质量流量下储氢瓶内气体、气瓶外壁温度变化,并设计了氢循环试验系统。但是其复杂的热力学模型不能实时为不同温度、压强下的储氢瓶设计最优的加注策略。
本发明提出一种氢气加注的最优策略确定方法、系统及电子设备,旨在结合储氢瓶热力学模型与深度强化学习方法实时设计出最优加注策略,进而实现在不同的初始储氢瓶压强、温度与固定加注时间条件下,氢气加注量最多、温度上升尽可能小。
实施例1
如图1所示,本发明实施例1提供一种氢气加注的最优策略确定方法,所述方法包括如下步骤:
步骤101,构建储氢瓶的热力学模型,并将储氢瓶的初始的状态设置为储氢瓶的当前状态;所述状态包括储氢瓶内氢气区的温度、储氢瓶的铝内胆内壁的温度和储氢瓶内氢气的压强;
构建储氢瓶的热力学模型具体包括如下步骤:
1、储氢瓶特征参数设计
本发明实施例中采用的储氢瓶的结构如图2所示,整个储氢瓶分为四个区域。区域①为储氢瓶内部氢气区,存储氢气;区域②为铝内胆层,主要起气体密封和缠绕芯模的作用,基本不承受载荷;区域③为碳纤维层,采用碳纤维浸渍树脂,主要为储氢瓶提供强度,满足承载要求;区域④是大气区。储氢瓶的具体参数如表1所示。
表1 储氢瓶尺寸参数(mm)
铝内胆公称外径 | 234 |
铝内胆壁厚 | 5 |
碳纤维层公称外径 | 270 |
碳纤维层壁厚 | 13 |
公称总长度 | 875 |
2、储氢瓶的热力学建模
在热力学模型中,为了方便计算传热面积和储氢瓶体积,储氢瓶可视为两个半球壳加一个圆筒。由于储氢瓶长度比厚度大得多,所以其传热是沿着壁厚方向。并且在氢气加注开始时,这四个区域的温度都相同,为20℃。假设整个过程是一维稳态导热,并且无内热源。换热过程如图3所示,图3中,T 1为储氢瓶内氢气区的温度,T 2_in 为储氢瓶的铝内胆内壁的温度,T mid 为铝内胆与碳纤维层交界处的温度,T 3_out 为大气区与碳纤维层外壁的交界处的温度,T 4为大气区的温度,两个气体区会与相接触的固体层进行对流换热,固体层之间存在热传导,各区域热传导率如表2所示。
表2 储氢瓶材料热传导率(W/m*K)
铝 | 238 |
碳纤维 | 5.95 |
树脂 | 0.3 |
由于碳纤维层是由体积分数为65%的碳纤维与体积分数为35%的树脂组成,该层的热传导率需要用复合材料热传导率计算公式计算。
氢气区与铝内胆内壁的热对流热阻:
铝内胆内壁与铝内胆外壁的热传导热阻分为两个部分,第一个是中间圆筒壁热阻,第二个是两个半球壳热阻:
其中,是铝内胆与碳纤维层交界处的半径,单位为,是铝内胆层圆筒壁的热阻,单位为,是铝内胆层两个半球壳的热阻,单位为,是铝内胆的热阻,单位为,是铝内胆层的热传导率,单位为,为铝内胆与碳纤维层交界处的半径。
碳纤维层热阻计算与铝内胆层类似:
大气区与碳纤维层外壁的热对流内阻:
氢气在高压过程中不满足理想气体条件,建立的实际气体状态方程:
其中,为储氢瓶内氢气的质量,单位为kg,是储氢瓶初始氢气质量,单位为kg,为加注氢气的质量流量,即采取的动作,单位为,t为加注时间,是加注孔的面积,单位为,c是氢气加注的速度,单位为m/s,是储氢瓶的容积,单位为,是氢气的等容比热容,单位为J/kg*K,是氢气的等压比热容,单位为J/kg*K,为储氢瓶的总等效阻值,为储氢瓶的氢气区与铝内胆内壁的热对流热阻,为储氢瓶的铝内胆的热阻,为储氢瓶的碳纤维层的热阻,为大气区与储氢瓶的碳纤维层外壁的热对流内阻,为氢气区氢气的比内能,为加注氢气的比焓。
令:
展开式如下:
其中,为储氢瓶内氢气区的温度,、和分别为特征温度、转化系数和特征时间;为计算系数,为动能转换系数,γ为比热容比;为加注氢气的温度,T 4为储氢瓶外部大气区的温度,为加注氢气的质量流量,为气体常数,为氢气的等容比热容,为加注氢气的压强,表示数值为的常数,为加注孔的面积,为氢气的等压比热容;为储气瓶内初始的氢气质量,为加注时间。
t小于等于5,是因为每5秒钟,采取一个动作。更新状态时,将t=5代入,获得新的T 1。
其中n是一个常数,需要初始条件确定。第一步的初始条件为t=0,T 1=293.15K。第二步的初始条件t=0,T 1是第一步的结果。
同时由于该储氢瓶热力学模型是一维稳态导热模型,各部分传热速率相等,只要求解出储氢瓶氢气的温度,就可以获取同时刻下铝内胆内壁温度。
每一步更新T 1之后,就可以更新T 2_in 。
步骤102,基于储氢瓶的当前状态,利用评估网络模型选取下一个最优加注动作;所述加注动作包括加注氢气的质量流量,所述最优加注动作为加注速度最快且引起储氢瓶内氢气区的温度及储氢瓶的铝内胆内壁的温度的变化最小的加注动作。
步骤103,基于所述热力学模型,确定执行所述最优加注动作后所述储氢瓶的状态,作为储氢瓶的当前状态,并根据目标网络模型对评估网络模型进行训练。
步骤104,返回步骤“基于储氢瓶的当前状态,利用深度强化学习模型选取下一个最优加注动作”,直到达到加注终点,获得第j条加注策略,并将训练后的评估网络模型的参数复制给所述目标网络模型,令j的数值增加1,并将储氢瓶的初始的状态作为储氢瓶的当前状态,返回步骤“基于储氢瓶的当前状态,利用评估网络模型选取下一个最优加注动作”,直到获得N条加注策略。
步骤105,在N条加注策略中选取最优加注策略;所述最优加注策略为加注速度最快且引起储氢瓶内氢气区的温度及储氢瓶的铝内胆内壁的温度的变化最小的加注策略。
示例性的,如图4所示,步骤102-105具体包括如下步骤:
将整个储氢瓶视为一个智能体(Agent),其状态空间为储氢瓶内氢气区的温度、压强和铝内胆内壁的温度。因为氢气加注过程是一个升温过程,而材料的最高温度出现在铝内胆内壁。加氢速度每五秒钟更新一次,动作空间则设置加氢速度0.5g/s-4g/s,公差为0.5g/s,共8个动作。奖励函数需要同时考虑加氢速度和温度变化,温度的上升过大会导致材料的热疲劳,加氢速度则影响到加氢用时。加注的终点则是储氢瓶内部的压强达到70MP。
求解最优策略需要的参数设置:设置气加注氢气的温度,气加注氢气的压强,储氢瓶的初始状态(储氢瓶内氢气区的温度T 1、储氢瓶内氢气的压强P 1的初始值),迭代总次数N和两个神经网络(评价网络模型和目标网络模型)。
动作选择:输入当前的状态值到评估网络模型,评估网络模型给出当前状态下采取每个动作的预估奖励,选取预估奖励值最大的动作,即为最优加注动作,基于上述热力学模型获得执行该最优加注动作后到达新的状态,和分别为执行最优加注动作后所述储氢瓶的状态中的储氢瓶内氢气区的温度和储氢瓶的铝内胆内壁的温度,为执行最优加注动作之后储氢瓶内氢气的压强,根据、以及加注氢气的质量流量,计算出一个真实奖励值,即第一奖励值,其计算公式为:
经验回放:抽取一批个数为I的经验条,作为训练经验条,i表示第i个训练经验条,其取值范围为1至I之间的整数,为第i个训练经验条中的执行最优加注动作之前的储氢瓶的状态,为行第i个训练经验条中的最优加注动作,为第i个训练经验条中执行最优加注动作的第一奖励值、为第i个训练经验条中执行最优加注动作之后的储氢瓶的状态。
判断是否到达加注终点,如果中,则表示达到加注终点,为执行最优加注动作之后储氢瓶内氢气的压强,将评价网络模型的权重参数复制给目标网络模型,否则就更新当前状态为,记录该步采取的动作,并进行总奖励更新,重复进行动作选择、记忆储存、经验回放、训练网络步骤。
本发明实施例引入目标网络模型主要的作用是增加了学习的稳定性。在权重更新(训练评估网络模型)的过程中,只更新评估网络模型的权重,而不更新目标网络模型的权重。这样,更新权重时的不会在每次训练中变化,是一个固定的目标。
判断迭代次数是否达到规定的总迭代次数(即加注策略的数量达到N,其中N为加注策略的条数阈值,其中加注策略的条数与迭代次数一一对应,因为每一次迭代过程中均可获得一条加注策略),如果超出总迭代次数,则选取历次迭代中最大的对应的加注策略(即多个加注动作组成的动作序列)作为最优的加注策略。
实施例2
本发明实施例2提供一种氢气加注的最优策略确定系统,所述系统应用于实施例1中的方法,所述系统包括:
初始化模块,用于构建储氢瓶的热力学模型,并将储氢瓶的初始的状态设置为储氢瓶的当前状态;所述状态包括储氢瓶内氢气区的温度、储氢瓶的铝内胆内壁的温度和储氢瓶内氢气的压强。
最优加注动作选取模块,用于基于储氢瓶的当前状态,利用评估网络模型选取下一个最优加注动作;所述加注动作包括加注氢气的质量流量,所述最优加注动作为加注速度最快且引起储氢瓶内氢气区的温度及储氢瓶的铝内胆内壁的温度的变化最小的加注动作。
训练模块,用于基于所述热力学模型,确定执行所述最优加注动作后所述储氢瓶的状态,作为储氢瓶的当前状态,并根据目标网络模型对评估网络模型进行训练。
返回模块,用于返回步骤“基于储氢瓶的当前状态,利用深度强化学习模型选取下一个最优加注动作”,直到达到加注终点,获得第j条加注策略,并将训练后的评估网络模型的参数复制给所述目标网络模型,令j的数值增加1,并将储氢瓶的初始的状态作为储氢瓶的当前状态,返回步骤“基于储氢瓶的当前状态,利用评估网络模型选取下一个最优加注动作”,直到获得N条加注策略。
最优加注策略选取模块,用于在N条加注策略中选取最优加注策略所述最优加注策略为加注速度最快且引起储氢瓶内氢气区的温度及储氢瓶的铝内胆内壁的温度的变化最小的加注策略。
实施例3
本发明实施例3提供一种电子设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现实施例1中的方法。
实施例4
本发明实施例4提供一种计算机可读存储介质,所述存储介质上存储有计算机程序,所述计算机程序被执行时实现实施例1中的方法。
基于上述实施例本发明的技术方案的优点如下:
本发明实施例在建立储氢瓶的热力学模型时考虑了储氢瓶固体层的热传导,同时根据实际情况简化储氢瓶传热模型为一维稳态传热且无内热源。该模型贴合实际,而且计算简单,实时性好。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
本发明实施例中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。
Claims (10)
1.一种氢气加注的最优策略确定方法,其特征在于,所述方法包括如下步骤:
构建储氢瓶的热力学模型,并将储氢瓶的初始的状态设置为储氢瓶的当前状态;所述状态包括储氢瓶内氢气区的温度、储氢瓶的铝内胆内壁的温度和储氢瓶内氢气的压强;
基于储氢瓶的当前状态,利用评估网络模型选取下一个最优加注动作;所述加注动作包括加注氢气的质量流量;所述最优加注动作为加注速度最快且引起储氢瓶内氢气区的温度及储氢瓶的铝内胆内壁的温度的变化最小的加注动作;
基于所述热力学模型,确定执行所述最优加注动作后所述储氢瓶的状态,作为储氢瓶的当前状态,并根据目标网络模型对评估网络模型进行训练;
返回步骤“基于储氢瓶的当前状态,利用深度强化学习模型选取下一个最优加注动作”,直到达到加注终点,获得第j条加注策略,将训练后的评估网络模型的参数复制给所述目标网络模型,令j的数值增加1,并将储氢瓶的初始的状态作为储氢瓶的当前状态,返回步骤“基于储氢瓶的当前状态,利用评估网络模型选取下一个最优加注动作”,直到获得N条加注策略;
在N条加注策略中选取最优加注策略;所述最优加注策略为加注速度最快且引起储氢瓶内氢气区的温度及储氢瓶的铝内胆内壁的温度的变化最小的加注策略。
2.根据权利要求1所述的氢气加注的最优策略确定方法,其特征在于,所述基于所述热力学模型,确定执行所述最优加注动作后所述储氢瓶的状态,具体包括:
基于所述热力学模型,确定执行所述最优加注动作后的储氢瓶内氢气区的温度;
根据储氢瓶内氢气区的温度,基于所述热力学模型,计算储氢瓶的铝内胆内壁的温度和储氢瓶内氢气的压强。
3.根据权利要求2所述的氢气加注的最优策略确定方法,其特征在于,所述基于所述热力学模型,确定执行所述最优加注动作后的储氢瓶内氢气区的温度,具体包括:
基于所述热力学模型,计算储氢瓶的总等效阻值为:
根据储氢瓶的总等效阻值,确定执行所述最优加注动作后的储氢瓶内氢气区的温度为:
4.根据权利要求2所述的氢气加注的最优策略确定方法,其特征在于,所述根据储氢瓶内氢气区的温度,基于所述热力学模型,计算储氢瓶的铝内胆内壁的温度和储氢瓶内氢气的压强,具体包括:
根据所述热力学模型,确定储氢瓶的氢气区与铝内胆内壁的热对流热阻;
根据储氢瓶内氢气区的温度和储氢瓶的氢气区与铝内胆内壁的热对流热阻,计算储氢瓶的铝内胆内壁的温度为:
根据储氢瓶内氢气区的温度,计算储氢瓶内氢气的压强为:
5.根据权利要求1所述的氢气加注的最优策略确定方法,其特征在于,所述根据目标网络模型对评估网络模型进行训练,具体包括:
根据执行所述最优加注动作后所述储氢瓶的状态计算执行所述最优加注动作的第一奖励值;
将执行所述最优加注动作之前的储氢瓶的状态、所述最优加注动作、所述第一奖励值及执行所述最优加注动作之后的储氢瓶的状态作为经验条,加入经验池;
从所述经验池中选取多个经验条,作为训练经验条;
利用所述目标网络模型,计算执行每个所述训练经验条中的最优加注动作的第二奖励值;
以所述训练经验条中的执行最优加注动作之前的储氢瓶的状态、最优加注动为输入,以所述训练经验条的第二奖励值为输出期望值,训练所述评估网络模型。
8.一种氢气加注的最优策略确定系统,其特征在于,所述系统应用于权利要求1-7任一项所述的方法,所述系统包括:
初始化模块,用于构建储氢瓶的热力学模型,并将储氢瓶的初始的状态设置为储氢瓶的当前状态;所述状态包括储氢瓶内氢气区的温度、储氢瓶的铝内胆内壁的温度和储氢瓶内氢气的压强;
最优加注动作选取模块,用于基于储氢瓶的当前状态,利用评估网络模型选取下一个最优加注动作;所述加注动作包括加注氢气的质量流量,所述最优加注动作为加注速度最快且引起储氢瓶内氢气区的温度及储氢瓶的铝内胆内壁的温度的变化最小的加注动作;
训练模块,用于基于所述热力学模型,确定执行所述最优加注动作后所述储氢瓶的状态,作为储氢瓶的当前状态,并根据目标网络模型对评估网络模型进行训练;
返回模块,用于返回步骤“基于储氢瓶的当前状态,利用深度强化学习模型选取下一个最优加注动作”,直到达到加注终点,获得第j条加注策略,并将训练后的评估网络模型的参数复制给所述目标网络模型,令j的数值增加1,并将储氢瓶的初始的状态作为储氢瓶的当前状态,返回步骤“基于储氢瓶的当前状态,利用评估网络模型选取下一个最优加注动作”,直到获得N条加注策略;
最优加注策略选取模块,用于在N条加注策略中选取最优加注策略;所述最优加注策略为加注速度最快且引起储氢瓶内氢气区的温度及储氢瓶的铝内胆内壁的温度的变化最小的加注策略。
9.一种电子设备,其特征在于,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至7中任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述存储介质上存储有计算机程序,所述计算机程序被执行时实现如权利要求1至7中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211269394.1A CN115408948B (zh) | 2022-10-18 | 2022-10-18 | 一种氢气加注的最优策略确定方法、系统及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211269394.1A CN115408948B (zh) | 2022-10-18 | 2022-10-18 | 一种氢气加注的最优策略确定方法、系统及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115408948A true CN115408948A (zh) | 2022-11-29 |
CN115408948B CN115408948B (zh) | 2023-01-10 |
Family
ID=84167772
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211269394.1A Active CN115408948B (zh) | 2022-10-18 | 2022-10-18 | 一种氢气加注的最优策略确定方法、系统及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115408948B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116293418A (zh) * | 2023-04-20 | 2023-06-23 | 西南交通大学 | 一种基于能耗控制的加氢站设备压力优化配置方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120267002A1 (en) * | 2009-10-21 | 2012-10-25 | Nel Hydrogen As | Method for the operation and control of gas filling |
CN110939859A (zh) * | 2018-09-21 | 2020-03-31 | 国家能源投资集团有限责任公司 | 加氢控制装置及方法 |
CN112765907A (zh) * | 2021-01-12 | 2021-05-07 | 同济大学 | 一种车载储氢瓶快速加注方案的优化方法和系统 |
CN114509951A (zh) * | 2022-04-21 | 2022-05-17 | 浙江浙能航天氢能技术有限公司 | 一种基于神经网络的加氢自适应控制方法及装置 |
CN115169088A (zh) * | 2022-06-21 | 2022-10-11 | 张家港氢云新能源研究院有限公司 | 一种针对深冷高压储氢瓶的疲劳寿命预测方法 |
-
2022
- 2022-10-18 CN CN202211269394.1A patent/CN115408948B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120267002A1 (en) * | 2009-10-21 | 2012-10-25 | Nel Hydrogen As | Method for the operation and control of gas filling |
CN110939859A (zh) * | 2018-09-21 | 2020-03-31 | 国家能源投资集团有限责任公司 | 加氢控制装置及方法 |
CN112765907A (zh) * | 2021-01-12 | 2021-05-07 | 同济大学 | 一种车载储氢瓶快速加注方案的优化方法和系统 |
CN114509951A (zh) * | 2022-04-21 | 2022-05-17 | 浙江浙能航天氢能技术有限公司 | 一种基于神经网络的加氢自适应控制方法及装置 |
CN115169088A (zh) * | 2022-06-21 | 2022-10-11 | 张家港氢云新能源研究院有限公司 | 一种针对深冷高压储氢瓶的疲劳寿命预测方法 |
Non-Patent Citations (1)
Title |
---|
何广利等: "基于国产三型瓶的氢气加注技术开发", 《储能科学与技术》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116293418A (zh) * | 2023-04-20 | 2023-06-23 | 西南交通大学 | 一种基于能耗控制的加氢站设备压力优化配置方法 |
CN116293418B (zh) * | 2023-04-20 | 2024-10-11 | 西南交通大学 | 一种基于能耗控制的加氢站设备压力优化配置方法 |
Also Published As
Publication number | Publication date |
---|---|
CN115408948B (zh) | 2023-01-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109606137B (zh) | 融合成本寿命因素的多源电驱动系统经济性优化方法 | |
CN107785935B (zh) | 计及风险及机组组合的电网风电消纳能力评估方法 | |
Guo et al. | Investigations on temperature variation within a type III cylinder during the hydrogen gas cycling test | |
CN115408948B (zh) | 一种氢气加注的最优策略确定方法、系统及电子设备 | |
CN105930901A (zh) | 一种基于rbpnn的变压器故障诊断方法 | |
CN111798111B (zh) | 一种综合能源系统供能可靠性评估方法及计算机系统 | |
CN110194172A (zh) | 基于增强型神经网络插电式混合动力乘用车能量管理方法 | |
Li et al. | Optimization of hybrid energy management system based on high-energy solid-state lithium batteries and reversible fuel cells | |
CN105140958A (zh) | 含光伏电源的配电网规划方法 | |
CN115840987A (zh) | 一种基于深度强化学习的混动汽车热管理策略生成方法 | |
CN115423161A (zh) | 基于数字孪生的多能耦合优化调度方法及系统 | |
CN117227700B (zh) | 串联混合动力无人履带车辆的能量管理方法及系统 | |
CN112150024A (zh) | 一种综合能源系统多场景能效评估方法 | |
Karaoğlan et al. | Investigation of the effects of battery types and power management algorithms on drive cycle simulation for a range-extended electric vehicle powertrain | |
CN112989699B (zh) | 基于深度强化学习的新能源汽车性能评价方法 | |
Cao et al. | Optimization of battery energy storage system size and power allocation strategy for fuel cell ship | |
CN107977741A (zh) | 冷热电联供微网系统的能量调度优化方法 | |
CN114444803A (zh) | 电动汽车充电站充电负荷预测方法、系统、终端及介质 | |
CN113465221A (zh) | 一种低碳排放的冷热电联产系统及其控制方法 | |
CN115423297A (zh) | 基于拉格朗日乘子的园区综合能源系统可靠性评估方法 | |
CN116294286A (zh) | 一种新型化工企业废水回收的高效制冷调节器 | |
CN113836840A (zh) | 一种考虑不均匀温升的ⅳ型管束瓶充氢膨胀量预测方法 | |
Luo et al. | Optimal estimation of MC parameter in SAE J2601 hydrogen refuelling protocol based on modified formula and artificial neural networks | |
Nnaemeka et al. | Application of Low-Temperature Phase Change Materials to Enable the Cold Weather Operability of B100 Biodiesel in Diesel Trucks | |
Bäumler et al. | A Reinforcement Learning Based Energy Management Strategy for Fuel Cell/Battery Hybrid System: A Novel Reward Function Approach |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |