CN114322208B - 基于深度强化学习的智能园区空调负荷调控方法和系统 - Google Patents
基于深度强化学习的智能园区空调负荷调控方法和系统 Download PDFInfo
- Publication number
- CN114322208B CN114322208B CN202111532228.1A CN202111532228A CN114322208B CN 114322208 B CN114322208 B CN 114322208B CN 202111532228 A CN202111532228 A CN 202111532228A CN 114322208 B CN114322208 B CN 114322208B
- Authority
- CN
- China
- Prior art keywords
- air conditioner
- data
- load
- historical
- cooling water
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 65
- 230000002787 reinforcement Effects 0.000 title claims abstract description 32
- 238000004378 air conditioning Methods 0.000 claims abstract description 47
- 238000005265 energy consumption Methods 0.000 claims abstract description 34
- 238000007781 pre-processing Methods 0.000 claims abstract description 17
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims description 85
- 239000000498 cooling water Substances 0.000 claims description 80
- 230000006870 function Effects 0.000 claims description 28
- 230000008569 process Effects 0.000 claims description 17
- 230000008859 change Effects 0.000 claims description 16
- 230000009471 action Effects 0.000 claims description 12
- 238000010606 normalization Methods 0.000 claims description 10
- 238000012545 processing Methods 0.000 claims description 9
- 238000010276 construction Methods 0.000 claims description 8
- 238000005457 optimization Methods 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 6
- 230000015654 memory Effects 0.000 claims description 6
- 238000012549 training Methods 0.000 claims description 6
- 238000013528 artificial neural network Methods 0.000 claims description 5
- 230000007787 long-term memory Effects 0.000 claims description 5
- 230000006403 short-term memory Effects 0.000 claims description 5
- 230000006399 behavior Effects 0.000 claims description 4
- 238000006243 chemical reaction Methods 0.000 claims description 4
- 230000007704 transition Effects 0.000 claims description 4
- 230000001105 regulatory effect Effects 0.000 abstract 1
- 230000009286 beneficial effect Effects 0.000 description 4
- 230000005611 electricity Effects 0.000 description 3
- 230000008034 disappearance Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 238000005094 computer simulation Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000001483 mobilizing effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010248 power generation Methods 0.000 description 1
- 238000005057 refrigeration Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Landscapes
- Air Conditioning Control Device (AREA)
Abstract
本发明提供一种基于深度强化学习的智能园区空调负荷调控方法、系统、存储介质和电子设备,涉及空调负荷预测技术领域。本发明包括采集并预处理园区的历史数据;根据预处理后的历史气象数据和历史负荷数据,构建园区空调负荷短期预测模型,获取园区的空调负荷预测数据;根据预处理后的空调历史运行数据和空调负荷预测数据,构建园区空调制冷系统能耗优化的学习模型;采用深度强化学习方法进行寻优,获取园区的最优空调负荷调控方案。基于园区空调负荷短期预测值对园区空调负荷进行整体调控,提高园区能源的利用效率和整体经济性;在园区空调负荷预测的基础上对园区空调负荷进行优化调控,对于实现园区空调系统节能运行也有重要意义。
Description
技术领域
本发明涉及空调负荷预测技术领域,具体涉及一种基于深度强化学习的智能园区空调负荷调控方法、系统、存储介质和电子设备。
背景技术
目前,我国电力供需仍是紧张状态,仅靠单一的增加发电规模无法应对这一状态,必须调动负荷侧资源参与电网调峰,才能有效缓解电力供需矛盾。智能园区存在用电、用热、用冷等多种用能需求,用电量占全社会用电量很大比重,智能园区空调的集中使用不仅增大电网峰谷差,而且给电网的安全稳定运行带来隐患,针对智能园区内空调负荷容量大、可控性较强等特点,提前预测出园区空调系统的负荷,在满足智能园区空调负荷需求且保证安全高效运行的情况下,根据空调负荷需求的变化,及时调整制冷机组的相关运行参数,对于降低整个园区空调综合能耗具有决定性作用。
现有的技术方案框架是:在园区空调负荷预测阶段,采用白箱方法,根据详细的建筑物理参数、建筑设计参数以及气象参数,通过计算或者模拟仿真的方式预测空调负荷;在园区空调负荷调控阶段,采用占空比控制的直接负荷控制方法,根据一定时间内空调的实际运行时间与总时间之比得到功率的占空比,在特定的功率开启关闭空调,实现对空调负荷的优化调控。
但是,上述技术方案在仿真建模过程中有对数据进行假设和简化的过程,导致预测结果会有误差,进而影响了园区能源的利用效率。
发明内容
(一)解决的技术问题
针对现有技术的不足,本发明提供了一种基于深度强化学习的智能园区空调负荷调控方法、系统、存储介质和电子设备,解决了园区能源的利用效率低的技术问题。
(二)技术方案
为实现以上目的,本发明通过以下技术方案予以实现:
一种基于深度强化学习的智能园区空调负荷调控方法,包括:
S1、采集并预处理园区的历史数据,所述历史数据包括历史气象数据、历史负荷数据和空调历史运行数据;
S2、根据预处理后的所述历史气象数据和历史负荷数据,构建园区空调负荷短期预测模型,获取所述园区的空调负荷预测数据;
S3、根据预处理后的所述空调历史运行数据和所述空调负荷预测数据,构建园区空调制冷系统能耗优化的学习模型;
S4、根据所述学习模型,采用基于策略的深度强化学习方法进行寻优,获取所述园区的最优空调负荷调控方案。
优选的,所述智能园区空调负荷调控方法还包括:
S5、将最优空调负荷调控方案实时推送给空调机房管理人员,指导管理人员及时调整各运行参数。
优选的,所述S1中:
所述历史气象数据包括1周前逐小时室外温度;
所述历史负荷数据包括1周前对应时刻负荷值、24h前对应时刻负荷值、3h前对应时刻负荷值、2h前对应时刻负荷值、1h前对应时刻负荷值;
所述空调历史运行数据包括1周前对应时刻的冷却水泵流量、冷冻水泵流量、冷却水进水温度和冷冻水出水温度,24h前对应时刻的冷却水泵流量、冷冻水泵流量、冷却水进水温度和冷冻水出水温度,3h前对应时刻的冷却水泵流量、冷冻水泵流量、冷却水进水温度和冷冻水出水温度,2h前对应时刻的冷却水泵流量、冷冻水泵流量、冷却水进水温度和冷冻水出水温度,1h前对应时刻冷却水泵流量、冷冻水泵流量、冷却水进水温度和冷冻水出水温度。
优选的,所述S1中预处理过程包括对所述历史数据进行归一化处理;
(1)对于所述历史气象数据和历史负荷数据,具体的归一化处理过程为:
其中,p′表示归一化后的历史气象数据或者历史负荷数据,p表示原始的历史气象数据或者历史负荷数据,max(p)表示原始的历史气象数据或者历史负荷数据中的最大值,min(p)表示原始的历史气象数据或者历史负荷数据中的最小值;
(2)对于所述空调历史运行数据,具体的归一化处理过程为:
Cmin=Hmin-α|Hmax-Hmin|
Cmax=Hmax+α|Hmax-Hmin|
其中,H(j)′为归一化后的空调历史运行数据,H(j)为归一化前的空调历史运行数据,Cmax和Cmin为待归一化的空调历史运行数据序列的最大值和最小值,α为预设的比例因子。
优选的,所述S2中基于长短期记忆神经网络训练获取所述园区空调负荷短期预测模型。
优选的,所述S3中的学习模型的构建过程,具体包括:
S31、将负荷预测数据q、冷却水泵流量Lc、冷冻水泵流量Lf、冷却水进水温度冷冻水出水温度/>作为所述学习模型的状态/>即所述学习模型的输入为状态S;
S32、将冷却水泵流量Lc、冷冻水泵流量Lf、冷却水进水温度冷冻水出水温度作为所述学习模型的动作/>
S33、以制冷机组的总能耗最小为目标建立奖励函数:
其中Pc为冷却水泵流量变化下的制冷机组能耗,Pf为冷冻水泵流量变化下的制冷机组能耗,为冷却水进水温度变化下的制冷机组能耗,/>为冷冻水出水温度变化下的制冷机组能耗。
优选的,所述S4具体包括:
S41、对actor网络π(S;θπ)和critic网络Q(S;A;θQ)进行初始化,基于行为策略选择随机化的冷却水泵流量、冷冻水泵流量、冷却水进水温度及冷冻水出水温度动作;
S42、整个环境执行选定的动作,获得奖励Rt,然后进入下一个冷却水泵流量、冷冻水泵流量、冷却水进水温度及冷冻水出水温度的状态St+1,并将该一系列转换(St,Rt,St+1)将存储在经验回放池中;
S43、达到预设条件后,从所述经验回放池中随机选择确定数量的转换以更新actor网络和critic网络的参数;
S44、计算损失函数,通过损失函数进一步更新策略网络参数,损失函数如下:
其中,为critic网络的目标Q值,L(θQ)为损失函数,M为选择的转换的个数;
S45、通过策略梯度函数更新策略,如此循环直到奖励最大化时寻优完成,获得所述园区的最优空调负荷调控方案,策略梯度函数如下:
其中,ηQ为学习速率。
一种基于深度强化学习的智能园区空调负荷调控系统,包括:
预处理模块,用于采集并预处理园区的历史数据,所述历史数据包括历史气象数据、历史负荷数据和空调历史运行数据;
预测模块,用于根据预处理后的所述历史气象数据和历史负荷数据,构建园区空调负荷短期预测模型,获取所述园区的空调负荷预测数据;
构建模块,用于根据预处理后的所述空调历史运行数据和所述空调负荷预测数据,构建园区空调制冷系统能耗优化的学习模型;
获取模块,用于根据所述学习模型,采用基于策略的深度强化学习方法进行寻优,获取所述园区的最优空调负荷调控方案。
一种存储介质,其存储有用于基于深度强化学习的智能园区空调负荷调控的计算机程序,其中,所述计算机程序使得计算机执行如上所述的智能园区空调负荷调控方法。
一种电子设备,包括:
一个或多个处理器;
存储器;以及
一个或多个程序,其中所述一个或多个程序被存储在所述存储器中,并且被配置成由所述一个或多个处理器执行,所述程序包括用于执行如上所述的智能园区空调负荷调控方法。
(三)有益效果
本发明提供了一种基于深度强化学习的智能园区空调负荷调控方法、系统、存储介质和电子设备。与现有技术相比,具备以下有益效果:
本发明包括采集并预处理园区的历史数据,所述历史数据包括历史气象数据、历史负荷数据和空调历史运行数据;根据预处理后的所述历史气象数据和历史负荷数据,构建园区空调负荷短期预测模型,获取所述园区的空调负荷预测数据;根据预处理后的所述空调历史运行数据和所述空调负荷预测数据,构建园区空调制冷系统能耗优化的学习模型;根据所述学习模型,采用基于策略的深度强化学习方法进行寻优,获取所述园区的最优空调负荷调控方案。基于园区空调负荷短期预测值进一步对园区空调负荷进行整体调控,提高园区能源的利用效率和整体经济性;在园区空调负荷预测的基础上对园区空调负荷进行优化调控对于实现园区空调系统节能运行也有重要意义。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种基于深度强化学习的智能园区空调负荷调控方法的流程示意图;
图2为本发明实施例提供的一种基于深度强化学习的智能园区空调负荷调控系统的结构框图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本申请实施例通过提供一种基于深度强化学习的智能园区空调负荷调控方法、系统、存储介质和电子设备,解决了园区能源的利用效率低的技术问题的技术问题。
本申请实施例中的技术方案为解决上述技术问题,总体思路如下
本发明实施例包括采集并预处理园区的历史数据,所述历史数据包括历史气象数据、历史负荷数据和空调历史运行数据;根据预处理后的所述历史气象数据和历史负荷数据,构建园区空调负荷短期预测模型,获取所述园区的空调负荷预测数据;根据预处理后的所述空调历史运行数据和所述空调负荷预测数据,构建园区空调制冷系统能耗优化的学习模型;根据所述学习模型,采用基于策略的深度强化学习方法进行寻优,获取所述园区的最优空调负荷调控方案。基于园区空调负荷短期预测值进一步对园区空调负荷进行整体调控,提高园区能源的利用效率和整体经济性;在园区空调负荷预测的基础上对园区空调负荷进行优化调控对于实现园区空调系统节能运行也有重要意义。
为了更好的理解上述技术方案,下面将结合说明书附图以及具体的实施方式对上述技术方案进行详细的说明。
实施例:
第一方面,如图1所示,本发明实施例提供了一种基于深度强化学习的智能园区空调负荷调控方法,包括:
S1、采集并预处理园区的历史数据,所述历史数据包括历史气象数据、历史负荷数据和空调历史运行数据;
S2、根据预处理后的所述历史气象数据和历史负荷数据,构建园区空调负荷短期预测模型,获取所述园区的空调负荷预测数据;
S3、根据预处理后的所述空调历史运行数据和所述空调负荷预测数据,构建园区空调制冷系统能耗优化的学习模型;
S4、根据所述学习模型,采用基于策略的深度强化学习方法进行寻优,获取所述园区的最优空调负荷调控方案。
本发明实施例基于园区空调负荷短期预测值进一步对园区空调负荷进行整体调控,提高园区能源的利用效率和整体经济性;在园区空调负荷预测的基础上对园区空调负荷进行优化调控对于实现园区空调系统节能运行也有重要意义。
下面将结合具体内容详细介绍上述技术方案的各个步骤:
S1、采集并预处理园区的历史数据,所述历史数据包括历史气象数据、历史负荷数据和空调历史运行数据。
具体的,所述历史气象数据包括1周前逐小时室外温度;
所述历史负荷数据包括1周前对应时刻负荷值、24h前对应时刻负荷值、3h前对应时刻负荷值、2h前对应时刻负荷值、1h前对应时刻负荷值;
所述空调历史运行数据包括1周前对应时刻的冷却水泵流量、冷冻水泵流量、冷却水进水温度和冷冻水出水温度,24h前对应时刻的冷却水泵流量、冷冻水泵流量、冷却水进水温度和冷冻水出水温度,3h前对应时刻的冷却水泵流量、冷冻水泵流量、冷却水进水温度和冷冻水出水温度,2h前对应时刻的冷却水泵流量、冷冻水泵流量、冷却水进水温度和冷冻水出水温度,1h前对应时刻冷却水泵流量、冷冻水泵流量、冷却水进水温度和冷冻水出水温度。
本发明实施例从多方面考虑了影响园区空调能耗的因素,建立的能耗模型精度较高,能得到准确的园区空调负荷调控方案。
所述S1中预处理过程包括对所述历史数据进行归一化处理;
(1)对于所述历史气象数据和历史负荷数据,具体的归一化处理过程为:
其中,p′表示归一化后的历史气象数据或者历史负荷数据,p表示原始的历史气象数据或者历史负荷数据,max(p)表示原始的历史气象数据或者历史负荷数据中的最大值,min(p)表示原始的历史气象数据或者历史负荷数据中的最小值;
(2)对于所述空调历史运行数据,具体的归一化处理过程为:
Cmin=Hmin-α|Hmax-Hmin|
Cmax=Hmax+α|Hmax-Hmin|
其中,H(j)′为归一化后的空调历史运行数据,H(j)为归一化前的空调历史运行数据,Cmax和Cmin为待归一化的空调历史运行数据序列的最大值和最小值,α为预设的比例因子。
S2、根据预处理后的所述历史气象数据和历史负荷数据,构建园区空调负荷短期预测模型,获取所述园区的空调负荷预测数据。
所述S2中基于长短期记忆神经网络训练获取所述园区空调负荷短期预测模型;具体包括:
(1)对t时刻的历史气象数据向量化处理,乘上t-1时刻模型的输出,并乘上一个权重参数作为模型的输入,历史负荷数据作为模型的输出;
(2)将输入信息经过遗忘门、更新门和输出门输出得到园区空调负荷的预测值;
(3)将输出的负荷预测值与真实负荷数据之间的差距作为损失,不断地调整模型的参数,直到损失最小时,模型训练完成。
本发明实施例采用长短期记忆神经网络训练获取上述园区空调负荷短期预测模型,用于对园区空调负荷进行预测,预测准确率更高,并且避免了处理长序列数据问题时的梯度消失问题。
S3、根据预处理后的所述空调历史运行数据和所述空调负荷预测数据,构建园区空调制冷系统能耗优化的学习模型。
所述S3中的学习模型的构建过程,具体包括:
S31、将负荷预测数据q、冷却水泵流量Lc、冷冻水泵流量Lf、冷却水进水温度冷冻水出水温度/>作为所述学习模型的状态/>即所述学习模型的输入为状态S;
S32、将冷却水泵流量Lc、冷冻水泵流量Lf、冷却水进水温度冷冻水出水温度作为所述学习模型的动作/>
S33、以制冷机组的总能耗最小为目标建立奖励函数:
其中Pc为冷却水泵流量变化下的制冷机组能耗,Pf为冷冻水泵流量变化下的制冷机组能耗,为冷却水进水温度变化下的制冷机组能耗,/>为冷冻水出水温度变化下的制冷机组能耗。
S4、根据所述学习模型,采用基于策略的深度强化学习方法进行寻优,获取所述园区的最优空调负荷调控方案;具体包括:
S41、对actor网络π(S;θπ)和critic网络Q(S;A;θQ)进行初始化,基于行为策略选择随机化的冷却水泵流量、冷冻水泵流量、冷却水进水温度及冷冻水出水温度动作;
S42、整个环境执行选定的动作,获得奖励Rt,然后进入下一个冷却水泵流量、冷冻水泵流量、冷却水进水温度及冷冻水出水温度的状态St+1,并将该一系列转换(St,Rt,St+1)将存储在经验回放池中;
S43、达到预设条件后,从所述经验回放池中随机选择确定数量的转换以更新actor网络和critic网络的参数;
S44、计算损失函数,通过损失函数进一步更新策略网络参数,损失函数如下:
其中,为critic网络的目标Q值,L(θQ)为损失函数,M为选择的转换的个数;
S45、通过策略梯度函数更新策略,如此循环直到奖励最大化时寻优完成,获得所述园区的最优空调负荷调控方案,策略梯度函数如下:
其中,ηQ为学习速率。
特别的,本发明实施例提供的基于深度强化学习的智能园区空调负荷调控方法还包括:
S5、将最优空调负荷调控方案实时推送给空调机房管理人员,指导管理人员及时调整各运行参数。
第二方面,如图2所示,本发明实施例提供了一种基于深度强化学习的智能园区空调负荷调控系统,包括:
预处理模块,用于采集并预处理园区的历史数据,所述历史数据包括历史气象数据、历史负荷数据和空调历史运行数据;
预测模块,用于根据预处理后的所述历史气象数据和历史负荷数据,构建园区空调负荷短期预测模型,获取所述园区的空调负荷预测数据;
构建模块,用于根据预处理后的所述空调历史运行数据和所述空调负荷预测数据,构建园区空调制冷系统能耗优化的学习模型;
获取模块,用于根据所述学习模型,采用基于策略的深度强化学习方法进行寻优,获取所述园区的最优空调负荷调控方案。
第三方面,本发明实施例提供了一种存储介质,其存储有用于基于深度强化学习的智能园区空调负荷调控的计算机程序,其中,所述计算机程序使得计算机执行如上所述的智能园区空调负荷调控方法。
一种电子设备,包括:
一个或多个处理器;
存储器;以及
一个或多个程序,其中所述一个或多个程序被存储在所述存储器中,并且被配置成由所述一个或多个处理器执行,所述程序包括用于执行如上所述的智能园区空调负荷调控方法。
可理解的是,本发明实施例提供的基于深度强化学习的智能园区空调负荷调控系统、存储介质和电子设备与本发明实施例提供的基于深度强化学习的智能园区空调负荷调控方法相对应,其有关内容的解释、举例和有益效果等部分可以参考智能园区空调负荷调控方法中的相应部分,此处不再赘述。
综上所述,与现有技术相比,具备以下有益效果:
1、本发明实施例基于园区空调负荷短期预测值进一步对园区空调负荷进行整体调控,提高园区能源的利用效率和整体经济性;在园区空调负荷预测的基础上对园区空调负荷进行优化调控对于实现园区空调系统节能运行也有重要意义。
2、本发明实施例从多方面考虑了影响园区空调能耗的因素,建立的能耗模型精度较高,能得到准确的园区空调负荷调控方案。
3、本发明实施例采用长短期记忆神经网络训练获取上述园区空调负荷短期预测模型,用于对园区空调负荷进行预测,预测准确率更高,并且避免了处理长序列数据问题时的梯度消失问题。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (7)
1.一种基于深度强化学习的智能园区空调负荷调控方法,其特征在于,包括:
S1、采集并预处理园区的历史数据,所述历史数据包括历史气象数据、历史负荷数据和空调历史运行数据;
S2、根据预处理后的所述历史气象数据和历史负荷数据,构建园区空调负荷短期预测模型,获取所述园区的空调负荷预测数据;
S3、根据预处理后的所述空调历史运行数据和所述空调负荷预测数据,构建园区空调制冷系统能耗优化的学习模型;
S4、根据所述学习模型,采用基于策略的深度强化学习方法进行寻优,获取所述园区的最优空调负荷调控方案;
所述S1中:
所述历史气象数据包括1周前逐小时室外温度;
所述历史负荷数据包括1周前对应时刻负荷值、24h前对应时刻负荷值、3h前对应时刻负荷值、2h前对应时刻负荷值、1h前对应时刻负荷值;
所述空调历史运行数据包括1周前对应时刻的冷却水泵流量、冷冻水泵流量、冷却水进水温度和冷冻水出水温度,24h前对应时刻的冷却水泵流量、冷冻水泵流量、冷却水进水温度和冷冻水出水温度,3h前对应时刻的冷却水泵流量、冷冻水泵流量、冷却水进水温度和冷冻水出水温度,2h前对应时刻的冷却水泵流量、冷冻水泵流量、冷却水进水温度和冷冻水出水温度,1h前对应时刻冷却水泵流量、冷冻水泵流量、冷却水进水温度和冷冻水出水温度;
所述S3中的学习模型的构建过程,具体包括:
S31、将负荷预测数据q、冷却水泵流量Lc、冷冻水泵流量Lf、冷却水进水温度冷冻水出水温度/>作为所述学习模型的状态/>即所述学习模型的输入为状态S;
S32、将冷却水泵流量Lc、冷冻水泵流量Lf、冷却水进水温度冷冻水出水温度/>作为所述学习模型的动作/>
S33、以制冷机组的总能耗最小为目标建立奖励函数:
其中Pc为冷却水泵流量变化下的制冷机组能耗,Pf为冷冻水泵流量变化下的制冷机组能耗,为冷却水进水温度变化下的制冷机组能耗,/>为冷冻水出水温度变化下的制冷机组能耗;
所述S4具体包括:
S41、对actor网络π(S;θπ)和critic网络Q(S;A;θQ)进行初始化,基于行为策略选择随机化的冷却水泵流量、冷冻水泵流量、冷却水进水温度及冷冻水出水温度动作;
S42、整个环境执行选定的动作,获得奖励Rt,然后进入下一个冷却水泵流量、冷冻水泵流量、冷却水进水温度及冷冻水出水温度的状态St+1,并将该一系列转换(St,Rt,St+1)存储在经验回放池中;
S43、达到预设条件后,从所述经验回放池中随机选择确定数量的转换以更新actor网络和critic网络的参数;
S44、计算损失函数,通过损失函数进一步更新策略网络参数,损失函数如下:
其中,为critic网络的目标Q值,L(θQ)为损失函数,M为选择的转换的个数;
S45、通过策略梯度函数更新策略,如此循环直到奖励最大化时寻优完成,获得所述园区的最优空调负荷调控方案,策略梯度函数如下:
其中,ηQ为学习速率。
2.如权利要求1所述的智能园区空调负荷调控方法,其特征在于,还包括:
S5、将最优空调负荷调控方案实时推送给空调机房管理人员,指导管理人员及时调整各运行参数。
3.如权利要求1所述的智能园区空调负荷调控方法,其特征在于,所述S1中预处理过程包括对所述历史数据进行归一化处理;
(1)对于所述历史气象数据和历史负荷数据,具体的归一化处理过程为:
其中,p′表示归一化后的历史气象数据或者历史负荷数据,p表示原始的历史气象数据或者历史负荷数据,max(p)表示原始的历史气象数据或者历史负荷数据中的最大值,min(p)表示原始的历史气象数据或者历史负荷数据中的最小值;
(2)对于所述空调历史运行数据,具体的归一化处理过程为:
Cmin=Hmin-α|Hmax-Hmin|
Cmax=Hmax+α|Hmax-Hmin|
其中,H(j)′为归一化后的空调历史运行数据,H(j)为归一化前的空调历史运行数据,Cmax和Cmin为待归一化的空调历史运行数据序列的最大值和最小值,α为预设的比例因子。
4.如权利要求1所述的智能园区空调负荷调控方法,其特征在于,所述S2中基于长短期记忆神经网络训练获取所述园区空调负荷短期预测模型。
5.一种基于深度强化学习的智能园区空调负荷调控系统,其特征在于,包括:
预处理模块,用于采集并预处理园区的历史数据,所述历史数据包括历史气象数据、历史负荷数据和空调历史运行数据;
预测模块,用于根据预处理后的所述历史气象数据和历史负荷数据,构建园区空调负荷短期预测模型,获取所述园区的空调负荷预测数据;
构建模块,用于根据预处理后的所述空调历史运行数据和所述空调负荷预测数据,构建园区空调制冷系统能耗优化的学习模型;
获取模块,用于根据所述学习模型,采用基于策略的深度强化学习方法进行寻优,获取所述园区的最优空调负荷调控方案;
所述预处理模块中:
所述历史气象数据包括1周前逐小时室外温度;
所述历史负荷数据包括1周前对应时刻负荷值、24h前对应时刻负荷值、3h前对应时刻负荷值、2h前对应时刻负荷值、1h前对应时刻负荷值;
所述空调历史运行数据包括1周前对应时刻的冷却水泵流量、冷冻水泵流量、冷却水进水温度和冷冻水出水温度,24h前对应时刻的冷却水泵流量、冷冻水泵流量、冷却水进水温度和冷冻水出水温度,3h前对应时刻的冷却水泵流量、冷冻水泵流量、冷却水进水温度和冷冻水出水温度,2h前对应时刻的冷却水泵流量、冷冻水泵流量、冷却水进水温度和冷冻水出水温度,1h前对应时刻冷却水泵流量、冷冻水泵流量、冷却水进水温度和冷冻水出水温度;
所述构建模块中的学习模型的构建过程,具体包括:
S31、将负荷预测数据q、冷却水泵流量Lc、冷冻水泵流量Lf、冷却水进水温度冷冻水出水温度/>作为所述学习模型的状态/>即所述学习模型的输入为状态S;
S32、将冷却水泵流量Lc、冷冻水泵流量Lf、冷却水进水温度冷冻水出水温度/>作为所述学习模型的动作/>
S33、以制冷机组的总能耗最小为目标建立奖励函数:
其中Pc为冷却水泵流量变化下的制冷机组能耗,Pf为冷冻水泵流量变化下的制冷机组能耗,为冷却水进水温度变化下的制冷机组能耗,/>为冷冻水出水温度变化下的制冷机组能耗;
所述获取模块具体用于:
S41、对actor网络π(S;θπ)和critic网络Q(S;A;θQ)进行初始化,基于行为策略选择随机化的冷却水泵流量、冷冻水泵流量、冷却水进水温度及冷冻水出水温度动作;
S42、整个环境执行选定的动作,获得奖励Rt,然后进入下一个冷却水泵流量、冷冻水泵流量、冷却水进水温度及冷冻水出水温度的状态St+1,并将该一系列转换(St,Rt,St+1)存储在经验回放池中;
S43、达到预设条件后,从所述经验回放池中随机选择确定数量的转换以更新actor网络和critic网络的参数;
S44、计算损失函数,通过损失函数进一步更新策略网络参数,损失函数如下:
其中,为critic网络的目标Q值,L(θQ)为损失函数,M为选择的转换的个数;
S45、通过策略梯度函数更新策略,如此循环直到奖励最大化时寻优完成,获得所述园区的最优空调负荷调控方案,策略梯度函数如下:
其中,ηQ为学习速率。
6.一种存储介质,其特征在于,其存储有用于基于深度强化学习的智能园区空调负荷调控的计算机程序,其中,所述计算机程序使得计算机执行如权利要求1~4任一项所述的智能园区空调负荷调控方法。
7.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储器;以及
一个或多个程序,其中所述一个或多个程序被存储在所述存储器中,并且被配置成由所述一个或多个处理器执行,所述程序包括用于执行如权利要求1~4任一项所述的智能园区空调负荷调控方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111532228.1A CN114322208B (zh) | 2021-12-15 | 2021-12-15 | 基于深度强化学习的智能园区空调负荷调控方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111532228.1A CN114322208B (zh) | 2021-12-15 | 2021-12-15 | 基于深度强化学习的智能园区空调负荷调控方法和系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114322208A CN114322208A (zh) | 2022-04-12 |
CN114322208B true CN114322208B (zh) | 2023-08-18 |
Family
ID=81051736
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111532228.1A Active CN114322208B (zh) | 2021-12-15 | 2021-12-15 | 基于深度强化学习的智能园区空调负荷调控方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114322208B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115202202B (zh) * | 2022-06-20 | 2024-09-20 | 山东大学 | 一种基于人工智能算法的用电设备控制方法及系统 |
CN115451534B (zh) * | 2022-09-02 | 2024-05-24 | 东联信息技术有限公司 | 基于强化学习分场景的机房空调节能方法 |
CN117168080B (zh) * | 2023-10-30 | 2024-02-02 | 南通百源制冷设备有限公司 | 一种节能用的螺旋速冻机状态控制方法 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108386971A (zh) * | 2018-01-28 | 2018-08-10 | 浙江博超节能科技有限公司 | 中央空调节能自控系统 |
CN111126605A (zh) * | 2020-02-13 | 2020-05-08 | 创新奇智(重庆)科技有限公司 | 一种基于强化学习算法的数据中心机房控制方法及装置 |
KR102114989B1 (ko) * | 2019-12-10 | 2020-05-26 | 한국산업기술시험원 | 심층 강화 학습 알고리즘을 적용한 공기조화기 정밀 학습 시스템 및 그 방법 |
CN111735178A (zh) * | 2020-07-15 | 2020-10-02 | 西安木牛能源技术服务有限公司 | 基于精英主义和svr回归算法的空调节能系统及优化方法 |
CN112415924A (zh) * | 2020-10-30 | 2021-02-26 | 南京华盾电力信息安全测评有限公司 | 一种空调系统节能优化方法及系统 |
KR102227514B1 (ko) * | 2020-08-25 | 2021-03-12 | 한국산업기술시험원 | 심층 강화학습 알고리즘을 활용한 공기조화기 컴포넌트 운전포인트 서치 시스템 |
CN113283156A (zh) * | 2021-03-29 | 2021-08-20 | 北京建筑大学 | 一种基于深度强化学习的地铁站空调系统节能控制方法 |
KR20210103609A (ko) * | 2020-02-13 | 2021-08-24 | (주)엔키아 | 강화학습을 이용한 공기조화기 최적 제어 시스템 |
-
2021
- 2021-12-15 CN CN202111532228.1A patent/CN114322208B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108386971A (zh) * | 2018-01-28 | 2018-08-10 | 浙江博超节能科技有限公司 | 中央空调节能自控系统 |
KR102114989B1 (ko) * | 2019-12-10 | 2020-05-26 | 한국산업기술시험원 | 심층 강화 학습 알고리즘을 적용한 공기조화기 정밀 학습 시스템 및 그 방법 |
CN111126605A (zh) * | 2020-02-13 | 2020-05-08 | 创新奇智(重庆)科技有限公司 | 一种基于强化学习算法的数据中心机房控制方法及装置 |
KR20210103609A (ko) * | 2020-02-13 | 2021-08-24 | (주)엔키아 | 강화학습을 이용한 공기조화기 최적 제어 시스템 |
CN111735178A (zh) * | 2020-07-15 | 2020-10-02 | 西安木牛能源技术服务有限公司 | 基于精英主义和svr回归算法的空调节能系统及优化方法 |
KR102227514B1 (ko) * | 2020-08-25 | 2021-03-12 | 한국산업기술시험원 | 심층 강화학습 알고리즘을 활용한 공기조화기 컴포넌트 운전포인트 서치 시스템 |
CN112415924A (zh) * | 2020-10-30 | 2021-02-26 | 南京华盾电力信息安全测评有限公司 | 一种空调系统节能优化方法及系统 |
CN113283156A (zh) * | 2021-03-29 | 2021-08-20 | 北京建筑大学 | 一种基于深度强化学习的地铁站空调系统节能控制方法 |
Non-Patent Citations (1)
Title |
---|
李荣鹏.面向绿色蜂窝网的流量预测分析与智能化基站管理策略研究.2017,第2017卷(第3期),全文. * |
Also Published As
Publication number | Publication date |
---|---|
CN114322208A (zh) | 2022-04-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114322208B (zh) | 基于深度强化学习的智能园区空调负荷调控方法和系统 | |
CN110866641B (zh) | 计及源储荷协同的多能互补系统两级优化调度方法及系统 | |
CN110458443B (zh) | 一种基于深度强化学习的智慧家庭能量管理方法及系统 | |
CN105320118B (zh) | 基于云平台的空调系统电力需求响应控制方法 | |
CN111735178B (zh) | 基于精英主义和svr回归算法的空调节能系统及优化方法 | |
CN113739365A (zh) | 中央空调冷站群控节能控制方法、装置、设备及存储介质 | |
CN114282729A (zh) | 一种基于负荷预测的冰蓄冷空调优化调度方法 | |
CN116227883A (zh) | 一种基于深度强化学习的智能家庭能量管理系统预测决策一体化调度方法 | |
He et al. | Predictive control optimization of chiller plants based on deep reinforcement learning | |
CN114498649A (zh) | 主动配电网建筑热负荷控制方法、装置、电子设备和存储介质 | |
CN115577828A (zh) | 一种基于数据驱动建模和优化的空调冷冻站系统群控方法 | |
Kazmi et al. | Demonstrating model-based reinforcement learning for energy efficiency and demand response using hot water vessels in net-zero energy buildings | |
CN118485208A (zh) | 知识融合深度强化学习的计及舒适度的家庭能量调度方法 | |
Shen et al. | Advanced control framework of regenerative electric heating with renewable energy based on multi-agent cooperation | |
CN116485044A (zh) | 一种电网交互型高效商业建筑智能运行优化方法 | |
CN116880169A (zh) | 一种基于深度强化学习的峰值功率需求预测控制方法 | |
CN117081045A (zh) | 面向农业园区的源荷储协同调度方法、系统及相关装置 | |
CN116227725A (zh) | 一种建筑物空调系统的负荷预测方法、装置及电子设备 | |
CN114543273B (zh) | 一种集中空调供冷系统自适应深度学习优化节能控制算法 | |
CN116576498A (zh) | 基于空气源热泵和楼宇换热机组的供热系统协调控制方法 | |
Hussein et al. | Energy saving by reinforcement learning for multi-chillers of HVAC systems | |
CN115526504A (zh) | 泵站供水系统节能调度方法、系统、电子设备及存储介质 | |
CN115526112A (zh) | 一种基于机器学习的建筑碳排放动态寻优管控系统及方法 | |
CN114115398A (zh) | 一种建筑物冷水机组需求响应控制方法及装置 | |
CN112290535A (zh) | 基于深度策略优化的电-气综合能源系统在线调度方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |