CN114322208B

CN114322208B - 基于深度强化学习的智能园区空调负荷调控方法和系统

Info

Publication number: CN114322208B
Application number: CN202111532228.1A
Authority: CN
Inventors: 周开乐; 彭宁; 费志能; 丁涛
Original assignee: Hefei University of Technology
Current assignee: Hefei University of Technology
Priority date: 2021-12-15
Filing date: 2021-12-15
Publication date: 2023-08-18
Anticipated expiration: 2041-12-15
Also published as: CN114322208A

Abstract

本发明提供一种基于深度强化学习的智能园区空调负荷调控方法、系统、存储介质和电子设备，涉及空调负荷预测技术领域。本发明包括采集并预处理园区的历史数据；根据预处理后的历史气象数据和历史负荷数据，构建园区空调负荷短期预测模型，获取园区的空调负荷预测数据；根据预处理后的空调历史运行数据和空调负荷预测数据，构建园区空调制冷系统能耗优化的学习模型；采用深度强化学习方法进行寻优，获取园区的最优空调负荷调控方案。基于园区空调负荷短期预测值对园区空调负荷进行整体调控，提高园区能源的利用效率和整体经济性；在园区空调负荷预测的基础上对园区空调负荷进行优化调控，对于实现园区空调系统节能运行也有重要意义。

Description

基于深度强化学习的智能园区空调负荷调控方法和系统

技术领域

本发明涉及空调负荷预测技术领域，具体涉及一种基于深度强化学习的智能园区空调负荷调控方法、系统、存储介质和电子设备。

背景技术

目前，我国电力供需仍是紧张状态，仅靠单一的增加发电规模无法应对这一状态，必须调动负荷侧资源参与电网调峰，才能有效缓解电力供需矛盾。智能园区存在用电、用热、用冷等多种用能需求，用电量占全社会用电量很大比重，智能园区空调的集中使用不仅增大电网峰谷差，而且给电网的安全稳定运行带来隐患，针对智能园区内空调负荷容量大、可控性较强等特点，提前预测出园区空调系统的负荷，在满足智能园区空调负荷需求且保证安全高效运行的情况下，根据空调负荷需求的变化，及时调整制冷机组的相关运行参数，对于降低整个园区空调综合能耗具有决定性作用。

现有的技术方案框架是：在园区空调负荷预测阶段，采用白箱方法，根据详细的建筑物理参数、建筑设计参数以及气象参数，通过计算或者模拟仿真的方式预测空调负荷；在园区空调负荷调控阶段，采用占空比控制的直接负荷控制方法，根据一定时间内空调的实际运行时间与总时间之比得到功率的占空比，在特定的功率开启关闭空调，实现对空调负荷的优化调控。

但是，上述技术方案在仿真建模过程中有对数据进行假设和简化的过程，导致预测结果会有误差，进而影响了园区能源的利用效率。

发明内容

(一)解决的技术问题

针对现有技术的不足，本发明提供了一种基于深度强化学习的智能园区空调负荷调控方法、系统、存储介质和电子设备，解决了园区能源的利用效率低的技术问题。

(二)技术方案

为实现以上目的，本发明通过以下技术方案予以实现：

一种基于深度强化学习的智能园区空调负荷调控方法，包括：

S1、采集并预处理园区的历史数据，所述历史数据包括历史气象数据、历史负荷数据和空调历史运行数据；

S2、根据预处理后的所述历史气象数据和历史负荷数据，构建园区空调负荷短期预测模型，获取所述园区的空调负荷预测数据；

S3、根据预处理后的所述空调历史运行数据和所述空调负荷预测数据，构建园区空调制冷系统能耗优化的学习模型；

S4、根据所述学习模型，采用基于策略的深度强化学习方法进行寻优，获取所述园区的最优空调负荷调控方案。

优选的，所述智能园区空调负荷调控方法还包括：

S5、将最优空调负荷调控方案实时推送给空调机房管理人员，指导管理人员及时调整各运行参数。

优选的，所述S1中：

所述历史气象数据包括1周前逐小时室外温度；

所述历史负荷数据包括1周前对应时刻负荷值、24h前对应时刻负荷值、3h前对应时刻负荷值、2h前对应时刻负荷值、1h前对应时刻负荷值；

所述空调历史运行数据包括1周前对应时刻的冷却水泵流量、冷冻水泵流量、冷却水进水温度和冷冻水出水温度，24h前对应时刻的冷却水泵流量、冷冻水泵流量、冷却水进水温度和冷冻水出水温度，3h前对应时刻的冷却水泵流量、冷冻水泵流量、冷却水进水温度和冷冻水出水温度，2h前对应时刻的冷却水泵流量、冷冻水泵流量、冷却水进水温度和冷冻水出水温度，1h前对应时刻冷却水泵流量、冷冻水泵流量、冷却水进水温度和冷冻水出水温度。

优选的，所述S1中预处理过程包括对所述历史数据进行归一化处理；

(1)对于所述历史气象数据和历史负荷数据，具体的归一化处理过程为：

其中，p′表示归一化后的历史气象数据或者历史负荷数据，p表示原始的历史气象数据或者历史负荷数据，max(p)表示原始的历史气象数据或者历史负荷数据中的最大值，min(p)表示原始的历史气象数据或者历史负荷数据中的最小值；

(2)对于所述空调历史运行数据，具体的归一化处理过程为：

C_min＝H_min-α|H_max-H_min|

C_max＝H_max+α|H_max-H_min|

其中，H(j)′为归一化后的空调历史运行数据，H(j)为归一化前的空调历史运行数据，C_max和C_min为待归一化的空调历史运行数据序列的最大值和最小值，α为预设的比例因子。

优选的，所述S2中基于长短期记忆神经网络训练获取所述园区空调负荷短期预测模型。

优选的，所述S3中的学习模型的构建过程，具体包括：

S31、将负荷预测数据q、冷却水泵流量L_c、冷冻水泵流量L_f、冷却水进水温度冷冻水出水温度/>作为所述学习模型的状态/>即所述学习模型的输入为状态S；

S32、将冷却水泵流量L_c、冷冻水泵流量L_f、冷却水进水温度冷冻水出水温度作为所述学习模型的动作/>

S33、以制冷机组的总能耗最小为目标建立奖励函数：

其中P_c为冷却水泵流量变化下的制冷机组能耗，P_f为冷冻水泵流量变化下的制冷机组能耗，为冷却水进水温度变化下的制冷机组能耗，/>为冷冻水出水温度变化下的制冷机组能耗。

优选的，所述S4具体包括：

S41、对actor网络π(S；θ^π)和critic网络Q(S；A；θ^Q)进行初始化，基于行为策略选择随机化的冷却水泵流量、冷冻水泵流量、冷却水进水温度及冷冻水出水温度动作；

S42、整个环境执行选定的动作，获得奖励R_t，然后进入下一个冷却水泵流量、冷冻水泵流量、冷却水进水温度及冷冻水出水温度的状态S_t+1，并将该一系列转换(S_t，R_t，S_t+1)将存储在经验回放池中；

S43、达到预设条件后，从所述经验回放池中随机选择确定数量的转换以更新actor网络和critic网络的参数；

S44、计算损失函数，通过损失函数进一步更新策略网络参数，损失函数如下：

其中，为critic网络的目标Q值，L(θ^Q)为损失函数，M为选择的转换的个数；

S45、通过策略梯度函数更新策略，如此循环直到奖励最大化时寻优完成，获得所述园区的最优空调负荷调控方案，策略梯度函数如下：

其中，η_Q为学习速率。

一种基于深度强化学习的智能园区空调负荷调控系统，包括：

预处理模块，用于采集并预处理园区的历史数据，所述历史数据包括历史气象数据、历史负荷数据和空调历史运行数据；

预测模块，用于根据预处理后的所述历史气象数据和历史负荷数据，构建园区空调负荷短期预测模型，获取所述园区的空调负荷预测数据；

构建模块，用于根据预处理后的所述空调历史运行数据和所述空调负荷预测数据，构建园区空调制冷系统能耗优化的学习模型；

获取模块，用于根据所述学习模型，采用基于策略的深度强化学习方法进行寻优，获取所述园区的最优空调负荷调控方案。

一种存储介质，其存储有用于基于深度强化学习的智能园区空调负荷调控的计算机程序，其中，所述计算机程序使得计算机执行如上所述的智能园区空调负荷调控方法。

一种电子设备，包括：

一个或多个处理器；

存储器；以及

一个或多个程序，其中所述一个或多个程序被存储在所述存储器中，并且被配置成由所述一个或多个处理器执行，所述程序包括用于执行如上所述的智能园区空调负荷调控方法。

(三)有益效果

本发明提供了一种基于深度强化学习的智能园区空调负荷调控方法、系统、存储介质和电子设备。与现有技术相比，具备以下有益效果：

本发明包括采集并预处理园区的历史数据，所述历史数据包括历史气象数据、历史负荷数据和空调历史运行数据；根据预处理后的所述历史气象数据和历史负荷数据，构建园区空调负荷短期预测模型，获取所述园区的空调负荷预测数据；根据预处理后的所述空调历史运行数据和所述空调负荷预测数据，构建园区空调制冷系统能耗优化的学习模型；根据所述学习模型，采用基于策略的深度强化学习方法进行寻优，获取所述园区的最优空调负荷调控方案。基于园区空调负荷短期预测值进一步对园区空调负荷进行整体调控，提高园区能源的利用效率和整体经济性；在园区空调负荷预测的基础上对园区空调负荷进行优化调控对于实现园区空调系统节能运行也有重要意义。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的一种基于深度强化学习的智能园区空调负荷调控方法的流程示意图；

图2为本发明实施例提供的一种基于深度强化学习的智能园区空调负荷调控系统的结构框图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本申请实施例通过提供一种基于深度强化学习的智能园区空调负荷调控方法、系统、存储介质和电子设备，解决了园区能源的利用效率低的技术问题的技术问题。

本申请实施例中的技术方案为解决上述技术问题，总体思路如下

本发明实施例包括采集并预处理园区的历史数据，所述历史数据包括历史气象数据、历史负荷数据和空调历史运行数据；根据预处理后的所述历史气象数据和历史负荷数据，构建园区空调负荷短期预测模型，获取所述园区的空调负荷预测数据；根据预处理后的所述空调历史运行数据和所述空调负荷预测数据，构建园区空调制冷系统能耗优化的学习模型；根据所述学习模型，采用基于策略的深度强化学习方法进行寻优，获取所述园区的最优空调负荷调控方案。基于园区空调负荷短期预测值进一步对园区空调负荷进行整体调控，提高园区能源的利用效率和整体经济性；在园区空调负荷预测的基础上对园区空调负荷进行优化调控对于实现园区空调系统节能运行也有重要意义。

为了更好的理解上述技术方案，下面将结合说明书附图以及具体的实施方式对上述技术方案进行详细的说明。

实施例：

第一方面，如图1所示，本发明实施例提供了一种基于深度强化学习的智能园区空调负荷调控方法，包括：

本发明实施例基于园区空调负荷短期预测值进一步对园区空调负荷进行整体调控，提高园区能源的利用效率和整体经济性；在园区空调负荷预测的基础上对园区空调负荷进行优化调控对于实现园区空调系统节能运行也有重要意义。

下面将结合具体内容详细介绍上述技术方案的各个步骤：

S1、采集并预处理园区的历史数据，所述历史数据包括历史气象数据、历史负荷数据和空调历史运行数据。

具体的，所述历史气象数据包括1周前逐小时室外温度；

本发明实施例从多方面考虑了影响园区空调能耗的因素，建立的能耗模型精度较高，能得到准确的园区空调负荷调控方案。

所述S1中预处理过程包括对所述历史数据进行归一化处理；

(2)对于所述空调历史运行数据，具体的归一化处理过程为：

C_min＝H_min-α|H_max-H_min|

C_max＝H_max+α|H_max-H_min|

S2、根据预处理后的所述历史气象数据和历史负荷数据，构建园区空调负荷短期预测模型，获取所述园区的空调负荷预测数据。

所述S2中基于长短期记忆神经网络训练获取所述园区空调负荷短期预测模型；具体包括：

(1)对t时刻的历史气象数据向量化处理，乘上t-1时刻模型的输出，并乘上一个权重参数作为模型的输入，历史负荷数据作为模型的输出；

(2)将输入信息经过遗忘门、更新门和输出门输出得到园区空调负荷的预测值；

(3)将输出的负荷预测值与真实负荷数据之间的差距作为损失，不断地调整模型的参数，直到损失最小时，模型训练完成。

本发明实施例采用长短期记忆神经网络训练获取上述园区空调负荷短期预测模型，用于对园区空调负荷进行预测，预测准确率更高，并且避免了处理长序列数据问题时的梯度消失问题。

S3、根据预处理后的所述空调历史运行数据和所述空调负荷预测数据，构建园区空调制冷系统能耗优化的学习模型。

所述S3中的学习模型的构建过程，具体包括：

S33、以制冷机组的总能耗最小为目标建立奖励函数：

S4、根据所述学习模型，采用基于策略的深度强化学习方法进行寻优，获取所述园区的最优空调负荷调控方案；具体包括：

其中，η_Q为学习速率。

特别的，本发明实施例提供的基于深度强化学习的智能园区空调负荷调控方法还包括：

第二方面，如图2所示，本发明实施例提供了一种基于深度强化学习的智能园区空调负荷调控系统，包括：

第三方面，本发明实施例提供了一种存储介质，其存储有用于基于深度强化学习的智能园区空调负荷调控的计算机程序，其中，所述计算机程序使得计算机执行如上所述的智能园区空调负荷调控方法。

一种电子设备，包括：

一个或多个处理器；

存储器；以及

可理解的是，本发明实施例提供的基于深度强化学习的智能园区空调负荷调控系统、存储介质和电子设备与本发明实施例提供的基于深度强化学习的智能园区空调负荷调控方法相对应，其有关内容的解释、举例和有益效果等部分可以参考智能园区空调负荷调控方法中的相应部分，此处不再赘述。

综上所述，与现有技术相比，具备以下有益效果：

1、本发明实施例基于园区空调负荷短期预测值进一步对园区空调负荷进行整体调控，提高园区能源的利用效率和整体经济性；在园区空调负荷预测的基础上对园区空调负荷进行优化调控对于实现园区空调系统节能运行也有重要意义。

2、本发明实施例从多方面考虑了影响园区空调能耗的因素，建立的能耗模型精度较高，能得到准确的园区空调负荷调控方案。

3、本发明实施例采用长短期记忆神经网络训练获取上述园区空调负荷短期预测模型，用于对园区空调负荷进行预测，预测准确率更高，并且避免了处理长序列数据问题时的梯度消失问题。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种基于深度强化学习的智能园区空调负荷调控方法，其特征在于，包括：

S4、根据所述学习模型，采用基于策略的深度强化学习方法进行寻优，获取所述园区的最优空调负荷调控方案；

所述S1中：

所述历史气象数据包括1周前逐小时室外温度；

所述空调历史运行数据包括1周前对应时刻的冷却水泵流量、冷冻水泵流量、冷却水进水温度和冷冻水出水温度，24h前对应时刻的冷却水泵流量、冷冻水泵流量、冷却水进水温度和冷冻水出水温度，3h前对应时刻的冷却水泵流量、冷冻水泵流量、冷却水进水温度和冷冻水出水温度，2h前对应时刻的冷却水泵流量、冷冻水泵流量、冷却水进水温度和冷冻水出水温度，1h前对应时刻冷却水泵流量、冷冻水泵流量、冷却水进水温度和冷冻水出水温度；

所述S3中的学习模型的构建过程，具体包括：

S32、将冷却水泵流量L_c、冷冻水泵流量L_f、冷却水进水温度冷冻水出水温度/>作为所述学习模型的动作/>

S33、以制冷机组的总能耗最小为目标建立奖励函数：

其中P_c为冷却水泵流量变化下的制冷机组能耗，P_f为冷冻水泵流量变化下的制冷机组能耗，为冷却水进水温度变化下的制冷机组能耗，/>为冷冻水出水温度变化下的制冷机组能耗；

所述S4具体包括：

S42、整个环境执行选定的动作，获得奖励R_t，然后进入下一个冷却水泵流量、冷冻水泵流量、冷却水进水温度及冷冻水出水温度的状态S_t+1，并将该一系列转换(S_t,R_t,S_t+1)存储在经验回放池中；

其中，η_Q为学习速率。

2.如权利要求1所述的智能园区空调负荷调控方法，其特征在于，还包括：

3.如权利要求1所述的智能园区空调负荷调控方法，其特征在于，所述S1中预处理过程包括对所述历史数据进行归一化处理；

(2)对于所述空调历史运行数据，具体的归一化处理过程为：

C_min＝H_min-α|H_max-H_min|

C_max＝H_max+α|H_max-H_min|

4.如权利要求1所述的智能园区空调负荷调控方法，其特征在于，所述S2中基于长短期记忆神经网络训练获取所述园区空调负荷短期预测模型。

5.一种基于深度强化学习的智能园区空调负荷调控系统，其特征在于，包括：

获取模块，用于根据所述学习模型，采用基于策略的深度强化学习方法进行寻优，获取所述园区的最优空调负荷调控方案；

所述预处理模块中：

所述历史气象数据包括1周前逐小时室外温度；

所述构建模块中的学习模型的构建过程，具体包括：

S33、以制冷机组的总能耗最小为目标建立奖励函数：

所述获取模块具体用于：

其中，η_Q为学习速率。

6.一种存储介质，其特征在于，其存储有用于基于深度强化学习的智能园区空调负荷调控的计算机程序，其中，所述计算机程序使得计算机执行如权利要求1～4任一项所述的智能园区空调负荷调控方法。

7.一种电子设备，其特征在于，包括：

一个或多个处理器；

存储器；以及

一个或多个程序，其中所述一个或多个程序被存储在所述存储器中，并且被配置成由所述一个或多个处理器执行，所述程序包括用于执行如权利要求1～4任一项所述的智能园区空调负荷调控方法。