CN109193075A - 基于强化学习的纯电动汽车动力电池冷却系统控制方法 - Google Patents
基于强化学习的纯电动汽车动力电池冷却系统控制方法 Download PDFInfo
- Publication number
- CN109193075A CN109193075A CN201811135929.XA CN201811135929A CN109193075A CN 109193075 A CN109193075 A CN 109193075A CN 201811135929 A CN201811135929 A CN 201811135929A CN 109193075 A CN109193075 A CN 109193075A
- Authority
- CN
- China
- Prior art keywords
- network
- online
- power battery
- parameter
- movement
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- H—ELECTRICITY
- H01—ELECTRIC ELEMENTS
- H01M—PROCESSES OR MEANS, e.g. BATTERIES, FOR THE DIRECT CONVERSION OF CHEMICAL ENERGY INTO ELECTRICAL ENERGY
- H01M10/00—Secondary cells; Manufacture thereof
- H01M10/60—Heating or cooling; Temperature control
- H01M10/61—Types of temperature control
- H01M10/613—Cooling or keeping cold
-
- H—ELECTRICITY
- H01—ELECTRIC ELEMENTS
- H01M—PROCESSES OR MEANS, e.g. BATTERIES, FOR THE DIRECT CONVERSION OF CHEMICAL ENERGY INTO ELECTRICAL ENERGY
- H01M10/00—Secondary cells; Manufacture thereof
- H01M10/60—Heating or cooling; Temperature control
- H01M10/62—Heating or cooling; Temperature control specially adapted for specific applications
- H01M10/625—Vehicles
-
- H—ELECTRICITY
- H01—ELECTRIC ELEMENTS
- H01M—PROCESSES OR MEANS, e.g. BATTERIES, FOR THE DIRECT CONVERSION OF CHEMICAL ENERGY INTO ELECTRICAL ENERGY
- H01M10/00—Secondary cells; Manufacture thereof
- H01M10/60—Heating or cooling; Temperature control
- H01M10/63—Control systems
- H01M10/633—Control systems characterised by algorithms, flow charts, software details or the like
-
- H—ELECTRICITY
- H01—ELECTRIC ELEMENTS
- H01M—PROCESSES OR MEANS, e.g. BATTERIES, FOR THE DIRECT CONVERSION OF CHEMICAL ENERGY INTO ELECTRICAL ENERGY
- H01M10/00—Secondary cells; Manufacture thereof
- H01M10/60—Heating or cooling; Temperature control
- H01M10/65—Means for temperature control structurally associated with the cells
- H01M10/656—Means for temperature control structurally associated with the cells characterised by the type of heat-exchange fluid
- H01M10/6567—Liquids
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02E—REDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
- Y02E60/00—Enabling technologies; Technologies with a potential or indirect contribution to GHG emissions mitigation
- Y02E60/10—Energy storage using batteries
Landscapes
- Engineering & Computer Science (AREA)
- Manufacturing & Machinery (AREA)
- Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Electrochemistry (AREA)
- General Chemical & Material Sciences (AREA)
- Automation & Control Theory (AREA)
- Feedback Control In General (AREA)
Abstract
本发明涉及一种基于深度强化学习的纯电动汽车冷却系统控制方法,包括:第一步获取纯电动汽车动力电池温度、动力电池工作电流,以及环境温度信息;构建DDPG算法模型,进行强化学习训练,得到一组最优电子水泵PID控制参数;通过PID输入量得出PID控制量,并基于该PID控制量控制电子水泵工作;电子水泵工作改变动力电池冷却系统中冷却液的流量,达到动力电池降温的目的,同时将动力电池信息传递给环境感知模块,返回第一步,循环整个流程。本发明将深度强化学习引入PID控制算法中,深度强化学习能较好的跟环境交互,具有自学习功能,适应不确定系统的动态特性,因此能适应纯电动汽车运行环境复杂多变的特性,在不同的实际场景下实现在线控制。
Description
技术领域
本发明涉及纯电动汽车热管理技术领域,尤其是一种基于强化学习的纯电动汽车动力电池冷却系统控制方法。
背景技术
目前电动汽车采用的冷却电子水泵大多利用开关式的控制方式,这种方法主要是根据目标值设定一个期望的温度值,然后根据这个目标值来设置控制温度的上限值。如果温度超过了这个范围值,电子水泵开启降温,否则不启动,让冷却液在冷却循环中自然冷却。除此之外,还有模糊控制、专家系统以及集成智能控制等。
其中,开关式的控制方式主要存在的问题是:会在某些特定的环境中使得电子水泵频繁的开启,严重影响了电子水泵的使用寿命;同时由于电子水泵启动时以最大转速工作,造成大量的功率无效的消耗,运行的成本会大大增加。模糊控制对于难以建立精确模型而可根据经验控制的系统的控制效果较好,但存在模糊规则的设计、过于依赖人工设计而无法运用于延时大的系统。专家系统能较好的利用专家经验知识,但存在知识获取依赖人工以及推理能力较弱的不足。集成智能控制算法根据不同智能控制算法的优点进行结合,但仍无法完全避免结合的智能控制算法本身的不足。
发明内容
本发明的首要目的在于提供一种能适应纯电动汽车运行环境复杂多变的特性,在不同的实际场景下实现在线控制,降低人工设计难度,减小能量损耗的基于强化学习的纯电动汽车动力电池冷却系统控制方法。
为实现上述目的,本发明采用了以下技术方案:一种基于强化学习的纯电动汽车动力电池冷却系统控制方法,该方法包括下列顺序的步骤:
(1)获取纯电动汽车动力电池温度、动力电池工作电流,以及环境温度信息;
(2)基于纯电动汽车动力电池温度、动力电池工作电流,以及环境温度信息确定状态空间,基于待优化的PID参数构建动作空间,基于动力电池温度与最佳工作温度的温度差以及电子水泵转速加速度的加权平方和确定回报函数,并基于所述状态空间、动作空间和回报函数构建DDPG算法模型;对所构建的DDPG算法模型进行强化学习训练,得到一组最优电子水泵PID控制参数;
(3)通过PID输入量得出PID控制量,并基于该PID控制量控制电子水泵工作;
(4)电子水泵工作改变动力电池冷却系统中冷却液的流量,达到动力电池降温的目的,同时将动力电池信息传递给环境感知模块,返回步骤(1)。
所述步骤(2)中构建DDPG算法模型具体是指:
确定DDPG算法状态空间、动作空间和回报函数;
状态空间包含3个元素:动力电池温度、动力电池工作电流和环境温度;
动作空间包含3个PID控制参数,分别为:比例参数KP、微分参数KI和积分参数KD;
回报函数:单次动作的回报r定义为动力电池温度与最佳工作温度的温度差以及电子水泵转速加速度的加权平方和;到目前为止的所有动作的累积总回报定义为:
式中:γ为折扣因子;ri为单次动作的回报。
所述步骤(2)中对所构建的DDPG算法模型进行强化学习训练,得到一组最优电子水泵PID控制参数具体是指:
构建评价网络和动作网络,其中评价网络进行Q函数计算得到Q值:Q(s,a|θQ),输入为状态s、动作a,输出为Q函数Q(s,a|θQ),包含3个隐藏层,都是FC全连接网络层;动作网络进行状态s到动作的映射得到a=μ(s|θμ),输入为状态s,输出为动作a,包含1个隐藏层,采用FC全连接网络层;
评价网络分为Online评价网络和Target评价网络,动作网络分为Online动作网络和Target动作网络;Target评价网络和Online评价网络结构相同,Target动作网络和Online动作网络结构相同;
对Online评价网络和Online动作网络的参数θQ、θμ进行随机初始化;通过这两个网络参数θQ和θμ来初始化Target评价网络和Target动作网络的网络参数θQ′和θμ′,同时开辟一个空间R作为Memory Replay经验回放的储存空间;
初始化完成后,开始进行迭代求解:
通过当前网络加上高斯扰动选择一个动作进行探索,动作at=μ(s|θμ)+Nt,其中Nt是一个高斯扰动;
在当前状态st下执行动作at,得到相应的奖励rt和下一个状态st+1,并且将这个过程形成的元组(st,at,rt,st+1)储存到Memory Replay空间R中;
从Memory Replay空间R随机选择一个小批量的元组数据,作为Online动作网络和Online评价网络的训练数据,用(si,ai,ri,si+1)表示单个数据;si为状态,ai为执行动作,ri为相应的奖励,si+1为下一个状态;
更新Online评价网络:
定义Online评价网络Loss函数:
其中,yi为标签:yi=ri+γQ′(si+1,μ′(si+1|θμ′)|θQ′),N为元组数据个数;
求出Loss函数关于θQ的梯度:通过最小化Loss函数来更新Online评价网络;
更新Online评价网络结束后,再进行Online动作网络的更新:
计算J(θμ)的梯度:
依据梯度下降的原则对Online动作网络进行更新;
最后利用更新的Online评价网络和Online动作网络的参数θQ和θμ对Target评价网络和Target动作网络的网络参数θQ′和θμ′进行更新:
式中:τ为更新率,τ<<1,由此构建一个收敛的神经网络;
计算当前PID控制参数KP、KI、KD下的总回报,当J(θμ)达到最小值时,当前的控制策略达到最优;当J(θμ)非最小值时,依据策略梯度更新策略,重新选择KP、KI、KD参数,实施控制;循环网络更新流程,即首先更新Online评价网络,再进行Online动作网络的更新,最后利用更新的Online评价网络和Online动作网络的参数θQ和θμ对Target评价网络和Target动作网络的网络参数θQ′和θμ′进行更新,使得不同状态下对应的控制策略的总回报J(θμ)达到最小值时,此时PID参数KP、KI、KD最优,PID的控制量逼近期望值。
在所述步骤(3)中,采用如下公式计算控制量:
其中KP,KI,KD分别表示比例、微分和积分参数;输入量e(t)为动力电池当前温度与期望温度的差值,控制量u(t)为电子水泵的转速。
由上述技术方案可知,本发明的优点在于:第一,本发明将深度强化学习引入PID控制算法中,深度强化学习能较好的跟环境交互,具有自学习功能,适应不确定系统的动态特性,因此能适应纯电动汽车运行环境复杂多变的特性,在不同的实际场景下实现在线控制;第二,本发明无需根据纯电动汽车不同工作环境、不同工况人工设计控制规则,降低人工设计难度;第三,本发明将电子水泵的加速度作为考量因素,在保证动力电池温度要求的同时,使电子水泵的转速趋于平稳,避免电子水泵频繁启停,延长电子水泵使用寿命,同时尽力避免高转速的情况发生,减小能量损耗。
附图说明
图1 本发明的控制方法流程图;
图2 管道水头损失特性曲线;
图3 评价网络结构图;
图4 动作网络结构图;
图5 DDPG算法更新流程图。
具体实施方式
如图1所示,一种基于强化学习的纯电动汽车动力电池冷却系统控制方法,该方法包括下列顺序的步骤:
(1)获取纯电动汽车动力电池温度、动力电池工作电流,以及环境温度信息;
(2)基于纯电动汽车动力电池温度、动力电池工作电流,以及环境温度信息确定状态空间,基于待优化的PID参数构建动作空间,基于动力电池温度与最佳工作温度的温度差以及电子水泵转速加速度的加权平方和确定回报函数,并基于所述状态空间、动作空间和回报函数构建DDPG算法模型;对所构建的DDPG算法模型进行强化学习训练,得到一组最优电子水泵PID控制参数;
(3)通过PID输入量得出PID控制量,并基于该PID控制量控制电子水泵工作;
(4)电子水泵工作改变动力电池冷却系统中冷却液的流量,达到动力电池降温的目的,同时将动力电池信息传递给环境感知模块,返回步骤(1)。通过得到的PID控制量输入相应的PWM波,控制电子水泵工作,使动力电池冷却系统中冷却液循环流动,给动力电池降温;同时电池管理系统(BMS)采集动力电池的当前电流、温度信息,温度传感器采集空气温度信息。
如图1所示,控制算法模块就是控制电子水泵转速的控制算法即DDPG算法,根据不同的环境状态即动力电池温度、电流、环境温度等,得出一组最佳PID控制参数即KP,KI,KD。环境感知模块即电池管理系统、空气温度传感器等,用来采集环境状态信息即动力电池温度、电流、环境温度等,传递给控制算法模块。
在水力学中,水流经过管道时,一定存在管道水头损失,其值为:
∑h=KQ2
式中:K——代表长度、直径已定的管道的沿程摩阻和局部阻力之和的系数。
如图2所示,纵坐标hA表示水泵输出流量为QA时管道中每单位重量液体所需消耗的能量值,可以看到管道系统中,通过的流量增大时,每单位重量液体在整个管道中消耗的能量以平方倍增大。换句话说,当热管理系统所需的冷却液相同时,电子水泵以短时间高转速的方式工作比以长时间低转速的方式工作消耗的能量大。本发明采用DDPG算法作为该动力电池冷却系统控制算法,用以解决连续的动作空间中的问题。将电子水泵的加速度作为考量因素,在保证动力电池温度要求的同时,使电子水泵的转速趋于平稳,避免电子水泵频繁启停,延长电子水泵使用寿命;同时尽力避免高转速的情况发生,减小能量损耗。
所述步骤(2)中构建DDPG算法模型具体是指:
确定DDPG算法状态空间、动作空间和回报函数;
状态空间包含3个元素:动力电池温度、动力电池工作电流和环境温度;
动作空间包含3个PID控制参数,分别为:比例参数KP、微分参数KI和积分参数KD;
回报函数:单次动作的回报r定义为动力电池温度与最佳工作温度的温度差以及电子水泵转速加速度的加权平方和;到目前为止的所有动作的累积总回报定义为:
式中:γ为折扣因子;ri为单次动作的回报。
所述步骤(2)中对所构建的DDPG算法模型进行强化学习训练,得到一组最优电子水泵PID控制参数具体是指:
构建评价网络和动作网络,其中评价网络进行Q函数计算得到Q值:Q(s,a|θQ),输入为状态s、动作a,输出为Q函数Q(s,a|θQ),包含3个隐藏层,都是FC全连接网络层,如图3所示;;动作网络进行状态s到动作的映射得到a=μ(s|θμ),输入为状态s,输出为动作a,包含1个隐藏层,采用FC全连接网络层,如图4所示;
评价网络分为Online评价网络和Target评价网络,动作网络分为Online动作网络和Target动作网络;Target评价网络和Online评价网络结构相同,Target动作网络和Online动作网络结构相同;
对Online评价网络和Online动作网络的参数θQ、θμ进行随机初始化;通过这两个网络参数θQ和θμ来初始化Target评价网络和Target动作网络的网络参数θQ′和θμ′,同时开辟一个空间R作为Memory Replay经验回放的储存空间;
初始化完成后,开始进行迭代求解:
通过当前网络加上高斯扰动选择一个动作进行探索,动作at=μ(s|θμ)+Nt,其中Nt是一个高斯扰动;
在当前状态st下执行动作at,得到相应的奖励rt和下一个状态st+1,并且将这个过程形成的元组(st,at,rt,st+1)储存到Memory Replay空间R中;
从Memory Replay空间R随机选择一个小批量的元组数据,作为Online动作网络和Online评价网络的训练数据,用(si,ai,ri,si+1)表示单个数据;si为状态,ai为执行动作,ri为相应的奖励,si+1为下一个状态;
更新Online评价网络,如图5中①所示:
定义Online评价网络Loss函数:
其中,yi为标签:yi=ri+γQ′(si+1,μ′(si+1|θμ′)|θQ′),N为元组数据个数;
求出Loss函数关于θQ的梯度:通过最小化Loss函数来更新Online评价网络;
更新Online评价网络结束后,再进行Online动作网络的更新,如图5中②所示:
计算J(θμ)的梯度:
依据梯度下降的原则对Online动作网络进行更新;
最后利用更新的Online评价网络和Online动作网络的参数θQ和θμ对Target评价网络和Target动作网络的网络参数θQ′和θμ′进行更新,如图5中③所示:
式中:τ为更新率,τ<<1,由此构建一个收敛的神经网络;
计算当前PID控制参数KP、KI、KD下的总回报,当J(θμ)达到最小值时,当前的控制策略达到最优;当J(θμ)非最小值时,依据策略梯度更新策略,重新选择KP、KI、KD参数,实施控制;循环网络更新流程,即首先更新Online评价网络,再进行Online动作网络的更新,最后利用更新的Online评价网络和Online动作网络的参数θQ和θμ对Target评价网络和Target动作网络的网络参数θQ′和θμ′进行更新,使得不同状态下对应的控制策略的总回报J(θμ)达到最小值时,此时PID参数KP、KI、KD最优,PID的控制量逼近期望值。期望值是指能够保证动力电池维持在26℃,且转速趋向稳定的电子水泵的转速。所述J(θμ)最小值是计算机通过梯度求解的。
在所述步骤(3)中,采用如下公式计算控制量:
其中KP,KI,KD分别表示比例、微分和积分参数;输入量e(t)为动力电池当前温度与期望温度的差值,控制量u(t)为电子水泵的转速。
综上所述,本发明将深度强化学习引入PID控制算法中,深度强化学习能较好的跟环境交互,具有自学习功能,适应不确定系统的动态特性,因此能适应纯电动汽车运行环境复杂多变的特性,在不同的实际场景下实现在线控制。
Claims (4)
1.一种基于深度强化学习的纯电动汽车冷却系统控制方法,该方法包括下列顺序的步骤:
(1)获取纯电动汽车动力电池温度、动力电池工作电流,以及环境温度信息;
(2)基于纯电动汽车动力电池温度、动力电池工作电流,以及环境温度信息确定状态空间,基于待优化的PID参数构建动作空间,基于动力电池温度与最佳工作温度的温度差以及电子水泵转速加速度的加权平方和确定回报函数,并基于所述状态空间、动作空间和回报函数构建DDPG算法模型;对所构建的DDPG算法模型进行强化学习训练,得到一组最优电子水泵PID控制参数;
(3)通过PID输入量得出PID控制量,并基于该PID控制量控制电子水泵工作;
(4)电子水泵工作改变动力电池冷却系统中冷却液的流量,达到动力电池降温的目的,同时将动力电池信息传递给环境感知模块,返回步骤(1)。
2.根据权利要求1所述的基于深度强化学习的纯电动汽车冷却系统控制方法,其特征在于:所述步骤(2)中构建DDPG算法模型具体是指:
确定DDPG算法状态空间、动作空间和回报函数;
状态空间包含3个元素:动力电池温度、动力电池工作电流和环境温度;
动作空间包含3个PID控制参数,分别为:比例参数KP、微分参数KI和积分参数KD;
回报函数:单次动作的回报r定义为动力电池温度与最佳工作温度的温度差以及电子水泵转速加速度的加权平方和;到目前为止的所有动作的累积总回报定义为:
式中:γ为折扣因子;ri为单次动作的回报。
3.根据权利要求1所述的基于深度强化学习的纯电动汽车冷却系统控制方法,其特征在于:所述步骤(2)中对所构建的DDPG算法模型进行强化学习训练,得到一组最优电子水泵PID控制参数具体是指:
构建评价网络和动作网络,其中评价网络进行Q函数计算得到Q值:Q(s,a|θQ),输入为状态s、动作a,输出为Q函数Q(s,a|θQ),包含3个隐藏层,都是FC全连接网络层;动作网络进行状态s到动作的映射得到a=μ(s|θμ),输入为状态s,输出为动作a,包含1个隐藏层,采用FC全连接网络层;
评价网络分为Online评价网络和Target评价网络,动作网络分为Online动作网络和Target动作网络;Target评价网络和Online评价网络结构相同,Target动作网络和Online动作网络结构相同;
对Online评价网络和Online动作网络的参数θQ、θμ进行随机初始化;通过这两个网络参数θQ和θμ来初始化Target评价网络和Target动作网络的网络参数θQ′和θμ′,同时开辟一个空间R作为Memory Replay经验回放的储存空间;
初始化完成后,开始进行迭代求解:
通过当前网络加上高斯扰动选择一个动作进行探索,动作at=μ(s|θμ)+Nt,其中Nt是一个高斯扰动;
在当前状态st下执行动作at,得到相应的奖励rt和下一个状态st+1,并且将这个过程形成的元组(st,at,rt,st+1)储存到Memory Replay空间R中;
从Memory Replay空间R随机选择一个小批量的元组数据,作为Online动作网络和Online评价网络的训练数据,用(si,ai,ri,si+1)表示单个数据;si为状态,ai为执行动作,ri为相应的奖励,si+1为下一个状态;
更新Online评价网络:
定义Online评价网络Loss函数:
其中,yi为标签:yi=ri+γQ′(si+1,μ′(si+1|θμ′)|θQ′),N为元组数据个数;
求出Loss函数关于θQ的梯度:通过最小化Loss函数来更新Online评价网络;
更新Online评价网络结束后,再进行Online动作网络的更新:
计算J(θμ)的梯度:
依据梯度下降的原则对Online动作网络进行更新;
最后利用更新的Online评价网络和Online动作网络的参数θQ和θμ对Target评价网络和Target动作网络的网络参数θQ′和θμ′进行更新:
式中:τ为更新率,τ<<1,由此构建一个收敛的神经网络;
计算当前PID控制参数KP、KI、KD下的总回报,当J(θμ)达到最小值时,当前的控制策略达到最优;当J(θμ)非最小值时,依据策略梯度更新策略,重新选择KP、KI、KD参数,实施控制;循环网络更新流程,即首先更新Online评价网络,再进行Online动作网络的更新,最后利用更新的Online评价网络和Online动作网络的参数θQ和θμ对Target评价网络和Target动作网络的网络参数θQ′和θμ′进行更新,使得不同状态下对应的控制策略的总回报J(θμ)达到最小值时,此时PID参数KP、KI、KD最优,PID的控制量逼近期望值。
4.根据权利要求1所述的基于深度强化学习的纯电动汽车冷却系统控制方法,其特征在于:在所述步骤(3)中,采用如下公式计算PID控制量:
其中KP,KI,KD分别表示比例、微分和积分参数;输入量e(t)为动力电池当前温度与期望温度的差值,控制量u(t)为电子水泵的转速。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811135929.XA CN109193075B (zh) | 2018-09-28 | 2018-09-28 | 基于强化学习的纯电动汽车动力电池冷却系统控制方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811135929.XA CN109193075B (zh) | 2018-09-28 | 2018-09-28 | 基于强化学习的纯电动汽车动力电池冷却系统控制方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109193075A true CN109193075A (zh) | 2019-01-11 |
CN109193075B CN109193075B (zh) | 2020-06-05 |
Family
ID=64907543
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811135929.XA Active CN109193075B (zh) | 2018-09-28 | 2018-09-28 | 基于强化学习的纯电动汽车动力电池冷却系统控制方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109193075B (zh) |
Cited By (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109686050A (zh) * | 2019-01-18 | 2019-04-26 | 桂林电子科技大学 | 基于云服务与深度神经网络的车内环境监测预警方法 |
CN110134165A (zh) * | 2019-05-13 | 2019-08-16 | 北京鹏通高科科技有限公司 | 一种用于环境监测与控制的强化学习方法及系统 |
CN110515411A (zh) * | 2019-09-05 | 2019-11-29 | 江苏环保产业技术研究院股份公司 | 一种水处理加药量控制方法及系统 |
CN110531617A (zh) * | 2019-07-30 | 2019-12-03 | 北京邮电大学 | 多无人机3d悬停位置联合优化方法、装置和无人机基站 |
CN110649281A (zh) * | 2019-09-30 | 2020-01-03 | 西安新衡科测控技术有限责任公司 | 一种ht-pem甲醇水燃料电池冷却液循环控制系统及控制方法 |
CN111082107A (zh) * | 2019-12-31 | 2020-04-28 | 潍柴动力股份有限公司 | 一种热管理方法及相关装置 |
CN111224195A (zh) * | 2020-01-14 | 2020-06-02 | 合肥工业大学 | 电池组散热系统及其散热方法 |
CN110308655B (zh) * | 2019-07-02 | 2020-10-23 | 西安交通大学 | 一种基于a3c算法的伺服系统补偿方法 |
CN111976540A (zh) * | 2020-09-14 | 2020-11-24 | 东方醒狮(福建)储能科技有限公司 | 一种锂离子动力储能电池热管理方法及系统 |
CN112103593A (zh) * | 2019-06-17 | 2020-12-18 | 比亚迪股份有限公司 | 车辆热管理方法、装置、车辆及存储介质 |
CN112947627A (zh) * | 2021-02-24 | 2021-06-11 | 金陵科技学院 | 一种基于ddpg-模糊pid的温度控制方法 |
CN112947134A (zh) * | 2019-11-26 | 2021-06-11 | 横河电机株式会社 | 装置、方法和记录介质 |
CN113034210A (zh) * | 2021-04-28 | 2021-06-25 | 重庆大学 | 一种基于数据驱动场景下车辆行驶成本评价方法 |
CN113050430A (zh) * | 2021-03-29 | 2021-06-29 | 浙江大学 | 一种基于鲁棒强化学习的排水系统控制方法 |
CN113224412A (zh) * | 2021-03-31 | 2021-08-06 | 联合汽车电子有限公司 | 动力电池的控温方法、ampc控制器、热管理系统及介质 |
CN113419419A (zh) * | 2021-06-24 | 2021-09-21 | 上海电机学院 | 一种新能源汽车的热管理系统 |
CN113685258A (zh) * | 2021-07-15 | 2021-11-23 | 东风汽车集团股份有限公司 | 发动机电子水泵的控制方法及终端设备 |
CN114156567A (zh) * | 2021-11-19 | 2022-03-08 | 同济大学 | 一种基于机器学习的动力电池热管理系统 |
CN115130266A (zh) * | 2021-03-24 | 2022-09-30 | 纬湃科技投资(中国)有限公司 | 用于车辆的热管理控制的方法和系统 |
CN115832532A (zh) * | 2023-02-14 | 2023-03-21 | 广东采日能源科技有限公司 | 液冷储能系统的控制方法、装置及系统 |
FR3131660A1 (fr) * | 2022-01-04 | 2023-07-07 | Psa Automobiles Sa | Systeme de contrôle thermique a intelligence artificielle, procede et vehicule sur la base d’un tel systeme |
CN116565383A (zh) * | 2023-05-30 | 2023-08-08 | 成都赛力斯科技有限公司 | 一种电池冷却方法、装置及车辆 |
CN117097227A (zh) * | 2023-10-17 | 2023-11-21 | 深圳市华科科技有限公司 | 电机的调速控制方法及相关装置 |
CN117231599A (zh) * | 2023-11-14 | 2023-12-15 | 上海海维工业控制有限公司 | 基于pid的液压执行机构驱动力控制方法 |
CN117409557A (zh) * | 2023-12-14 | 2024-01-16 | 成都格理特电子技术有限公司 | 基于动态分析的检测高温报警方法 |
US11960267B2 (en) | 2020-04-24 | 2024-04-16 | Yokogawa Electric Corporation | Control apparatus, control method, and storage medium |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007165243A (ja) * | 2005-12-16 | 2007-06-28 | Sanyo Electric Co Ltd | 燃料電池熱電併給装置 |
CN101000972A (zh) * | 2006-12-28 | 2007-07-18 | 奇瑞汽车有限公司 | 用于混合动力汽车的电池热控制装置 |
CN202965937U (zh) * | 2012-12-18 | 2013-06-05 | 潍柴动力股份有限公司 | 一种电动汽车高压部件的冷却装置 |
CN107479368A (zh) * | 2017-06-30 | 2017-12-15 | 北京百度网讯科技有限公司 | 一种基于人工智能的训练无人机控制模型的方法及系统 |
CN107943022A (zh) * | 2017-10-23 | 2018-04-20 | 清华大学 | 一种基于强化学习的pid机车自动驾驶优化控制方法 |
CN108051999A (zh) * | 2017-10-31 | 2018-05-18 | 中国科学技术大学 | 基于深度强化学习的加速器束流轨道控制方法及系统 |
-
2018
- 2018-09-28 CN CN201811135929.XA patent/CN109193075B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007165243A (ja) * | 2005-12-16 | 2007-06-28 | Sanyo Electric Co Ltd | 燃料電池熱電併給装置 |
CN101000972A (zh) * | 2006-12-28 | 2007-07-18 | 奇瑞汽车有限公司 | 用于混合动力汽车的电池热控制装置 |
CN202965937U (zh) * | 2012-12-18 | 2013-06-05 | 潍柴动力股份有限公司 | 一种电动汽车高压部件的冷却装置 |
CN107479368A (zh) * | 2017-06-30 | 2017-12-15 | 北京百度网讯科技有限公司 | 一种基于人工智能的训练无人机控制模型的方法及系统 |
CN107943022A (zh) * | 2017-10-23 | 2018-04-20 | 清华大学 | 一种基于强化学习的pid机车自动驾驶优化控制方法 |
CN108051999A (zh) * | 2017-10-31 | 2018-05-18 | 中国科学技术大学 | 基于深度强化学习的加速器束流轨道控制方法及系统 |
Cited By (39)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109686050A (zh) * | 2019-01-18 | 2019-04-26 | 桂林电子科技大学 | 基于云服务与深度神经网络的车内环境监测预警方法 |
CN110134165A (zh) * | 2019-05-13 | 2019-08-16 | 北京鹏通高科科技有限公司 | 一种用于环境监测与控制的强化学习方法及系统 |
CN110134165B (zh) * | 2019-05-13 | 2020-12-25 | 北京鹏通高科科技有限公司 | 一种用于环境监测与控制的强化学习方法及系统 |
CN112103593A (zh) * | 2019-06-17 | 2020-12-18 | 比亚迪股份有限公司 | 车辆热管理方法、装置、车辆及存储介质 |
CN110308655B (zh) * | 2019-07-02 | 2020-10-23 | 西安交通大学 | 一种基于a3c算法的伺服系统补偿方法 |
CN110531617A (zh) * | 2019-07-30 | 2019-12-03 | 北京邮电大学 | 多无人机3d悬停位置联合优化方法、装置和无人机基站 |
CN110515411A (zh) * | 2019-09-05 | 2019-11-29 | 江苏环保产业技术研究院股份公司 | 一种水处理加药量控制方法及系统 |
CN110649281A (zh) * | 2019-09-30 | 2020-01-03 | 西安新衡科测控技术有限责任公司 | 一种ht-pem甲醇水燃料电池冷却液循环控制系统及控制方法 |
CN110649281B (zh) * | 2019-09-30 | 2022-05-06 | 西安新衡科测控技术有限责任公司 | 一种ht-pem甲醇水燃料电池冷却液循环控制系统及控制方法 |
CN112947134A (zh) * | 2019-11-26 | 2021-06-11 | 横河电机株式会社 | 装置、方法和记录介质 |
CN111082107A (zh) * | 2019-12-31 | 2020-04-28 | 潍柴动力股份有限公司 | 一种热管理方法及相关装置 |
CN111082107B (zh) * | 2019-12-31 | 2021-08-20 | 潍柴动力股份有限公司 | 一种热管理方法及相关装置 |
CN111224195A (zh) * | 2020-01-14 | 2020-06-02 | 合肥工业大学 | 电池组散热系统及其散热方法 |
US11960267B2 (en) | 2020-04-24 | 2024-04-16 | Yokogawa Electric Corporation | Control apparatus, control method, and storage medium |
CN111976540A (zh) * | 2020-09-14 | 2020-11-24 | 东方醒狮(福建)储能科技有限公司 | 一种锂离子动力储能电池热管理方法及系统 |
CN111976540B (zh) * | 2020-09-14 | 2021-08-31 | 东方醒狮(福建)储能科技有限公司 | 一种锂离子动力储能电池热管理方法及系统 |
CN112947627A (zh) * | 2021-02-24 | 2021-06-11 | 金陵科技学院 | 一种基于ddpg-模糊pid的温度控制方法 |
CN112947627B (zh) * | 2021-02-24 | 2021-11-23 | 金陵科技学院 | 一种基于ddpg-模糊pid的温度控制方法 |
CN115130266B (zh) * | 2021-03-24 | 2024-09-27 | 纬湃科技投资(中国)有限公司 | 用于车辆的热管理控制的方法和系统 |
CN115130266A (zh) * | 2021-03-24 | 2022-09-30 | 纬湃科技投资(中国)有限公司 | 用于车辆的热管理控制的方法和系统 |
CN113050430A (zh) * | 2021-03-29 | 2021-06-29 | 浙江大学 | 一种基于鲁棒强化学习的排水系统控制方法 |
CN113224412A (zh) * | 2021-03-31 | 2021-08-06 | 联合汽车电子有限公司 | 动力电池的控温方法、ampc控制器、热管理系统及介质 |
CN113224412B (zh) * | 2021-03-31 | 2023-01-06 | 联合汽车电子有限公司 | 动力电池的控温方法、ampc控制器、热管理系统及介质 |
CN113034210A (zh) * | 2021-04-28 | 2021-06-25 | 重庆大学 | 一种基于数据驱动场景下车辆行驶成本评价方法 |
CN113419419A (zh) * | 2021-06-24 | 2021-09-21 | 上海电机学院 | 一种新能源汽车的热管理系统 |
CN113685258B (zh) * | 2021-07-15 | 2022-06-28 | 东风汽车集团股份有限公司 | 发动机电子水泵的控制方法及终端设备 |
CN113685258A (zh) * | 2021-07-15 | 2021-11-23 | 东风汽车集团股份有限公司 | 发动机电子水泵的控制方法及终端设备 |
CN114156567A (zh) * | 2021-11-19 | 2022-03-08 | 同济大学 | 一种基于机器学习的动力电池热管理系统 |
CN114156567B (zh) * | 2021-11-19 | 2024-03-26 | 同济大学 | 一种基于机器学习的动力电池热管理系统 |
FR3131660A1 (fr) * | 2022-01-04 | 2023-07-07 | Psa Automobiles Sa | Systeme de contrôle thermique a intelligence artificielle, procede et vehicule sur la base d’un tel systeme |
CN115832532A (zh) * | 2023-02-14 | 2023-03-21 | 广东采日能源科技有限公司 | 液冷储能系统的控制方法、装置及系统 |
CN116565383A (zh) * | 2023-05-30 | 2023-08-08 | 成都赛力斯科技有限公司 | 一种电池冷却方法、装置及车辆 |
CN116565383B (zh) * | 2023-05-30 | 2024-03-01 | 重庆赛力斯凤凰智创科技有限公司 | 一种电池冷却方法、装置及车辆 |
CN117097227A (zh) * | 2023-10-17 | 2023-11-21 | 深圳市华科科技有限公司 | 电机的调速控制方法及相关装置 |
CN117097227B (zh) * | 2023-10-17 | 2024-01-26 | 深圳市华科科技有限公司 | 电机的调速控制方法及相关装置 |
CN117231599A (zh) * | 2023-11-14 | 2023-12-15 | 上海海维工业控制有限公司 | 基于pid的液压执行机构驱动力控制方法 |
CN117231599B (zh) * | 2023-11-14 | 2024-02-02 | 上海海维工业控制有限公司 | 基于pid的液压执行机构驱动力控制方法 |
CN117409557A (zh) * | 2023-12-14 | 2024-01-16 | 成都格理特电子技术有限公司 | 基于动态分析的检测高温报警方法 |
CN117409557B (zh) * | 2023-12-14 | 2024-02-20 | 成都格理特电子技术有限公司 | 基于动态分析的检测高温报警方法 |
Also Published As
Publication number | Publication date |
---|---|
CN109193075B (zh) | 2020-06-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109193075A (zh) | 基于强化学习的纯电动汽车动力电池冷却系统控制方法 | |
CN111267831B (zh) | 一种混合动力车辆智能变时域模型预测能量管理方法 | |
Coraci et al. | Online transfer learning strategy for enhancing the scalability and deployment of deep reinforcement learning control in smart buildings | |
Zhang et al. | Ship motion attitude prediction based on an adaptive dynamic particle swarm optimization algorithm and bidirectional LSTM neural network | |
CN111126605B (zh) | 一种基于强化学习算法的数据中心机房控制方法及装置 | |
CN111884213A (zh) | 一种基于深度强化学习算法的配电网电压调节方法 | |
CN113741449B (zh) | 一种面向海空协同观测任务的多智能体控制方法 | |
CN110406526A (zh) | 基于自适应动态规划的并联混合动力汽车能量管理方法 | |
Peirelinck et al. | Domain randomization for demand response of an electric water heater | |
CN115544899B (zh) | 基于多智能体深度强化学习的水厂取水泵站节能调度方法 | |
CN115793445B (zh) | 一种基于多智能体深度强化学习的混合动力汽车控制方法 | |
CN109779736B (zh) | 一种发动机电控硅油风扇的节能优化控制方法及系统 | |
CN115840987A (zh) | 一种基于深度强化学习的混动汽车热管理策略生成方法 | |
CN115732810A (zh) | 一种电动汽车电池包加温系统控制方法 | |
Hajidavalloo et al. | NMPC-based integrated thermal management of battery and cabin for electric vehicles in cold weather conditions | |
CN115130266A (zh) | 用于车辆的热管理控制的方法和系统 | |
CN116045443A (zh) | 基于室内温度最优化控制的建筑空调能耗预测方法 | |
CN110509914A (zh) | 一种并联式混合动力汽车的能耗优化方法 | |
CN111572407B (zh) | 一种混动汽车热管理系统及其控制方法 | |
Choi et al. | Reinforcement Learning-based Controller for Thermal Management System of Electric Vehicles | |
Jiang et al. | Short-term power load forecasting based on PSO-GRU | |
Chen et al. | Optimal load distribution control for airport terminal chiller units based on deep reinforcement learning | |
Wu et al. | Battery health-considered energy management strategy for a dual-motor two-speed battery electric vehicle based on a hybrid soft actor-critic algorithm with memory function | |
Hu et al. | Path planning of robotic fish in unknown environment with improved reinforcement learning algorithm | |
Wan et al. | Energy Scheduling Strategy of Ice Storage Air Conditioning System Based on Deep Reinforcement Learning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |