CN112966444B - 一种建筑多能源系统智慧能量优化方法及装置 - Google Patents

一种建筑多能源系统智慧能量优化方法及装置 Download PDF

Info

Publication number
CN112966444B
CN112966444B CN202110270444.7A CN202110270444A CN112966444B CN 112966444 B CN112966444 B CN 112966444B CN 202110270444 A CN202110270444 A CN 202110270444A CN 112966444 B CN112966444 B CN 112966444B
Authority
CN
China
Prior art keywords
energy storage
energy
storage system
power
time slot
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110270444.7A
Other languages
English (en)
Other versions
CN112966444A (zh
Inventor
余亮
谢玮玮
秦书琪
岳东
窦春霞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Posts and Telecommunications
Original Assignee
Nanjing University of Posts and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Posts and Telecommunications filed Critical Nanjing University of Posts and Telecommunications
Priority to CN202110270444.7A priority Critical patent/CN112966444B/zh
Publication of CN112966444A publication Critical patent/CN112966444A/zh
Application granted granted Critical
Publication of CN112966444B publication Critical patent/CN112966444B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J3/00Circuit arrangements for ac mains or ac distribution networks
    • H02J3/008Circuit arrangements for ac mains or ac distribution networks involving trading of energy or energy transmission rights
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J3/00Circuit arrangements for ac mains or ac distribution networks
    • H02J3/28Arrangements for balancing of the load in a network by storage of energy
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2111/00Details relating to CAD techniques
    • G06F2111/04Constraint-based CAD
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2111/00Details relating to CAD techniques
    • G06F2111/08Probabilistic or stochastic CAD
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2119/00Details relating to the type or aim of the analysis or the optimisation
    • G06F2119/06Power analysis or power optimisation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Power Engineering (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Computer Hardware Design (AREA)
  • Geometry (AREA)
  • Probability & Statistics with Applications (AREA)
  • Feedback Control In General (AREA)
  • Supply And Distribution Of Alternating Current (AREA)

Abstract

本发明公开了一种建筑多能源系统智慧能量优化方法及装置,方法的设计步骤如下:获取建筑多能源系统的当前环境状态;将所述当前环境状态输入到训练好的深度神经网络;通过深度神经网络输出建筑多能源系统行为;对所述建筑多能源系统的行为按照能量存储系统储能水平动态性和运行约束进行重调整,并计算得到热能存储系统注入/释放功率、天然气锅炉输出功率以及建筑多能源系统与大电网之间的能量交易量;根据上述结论对建筑多能源系统进行控制。本发明方法无需知晓任何不确定性参数的先验信息和明确的建筑热动态性模型。相比现有方法,本发明方法可有效降低运行成本且具有更强的鲁棒性和通用性。

Description

一种建筑多能源系统智慧能量优化方法及装置
技术领域
本发明涉及一种建筑多能源系统智慧能量优化方法,属于人工智能与智慧建筑能源系统交叉领域。
背景技术
建筑在全世界能源消耗和碳排放总量中占有很大的比重。2019年,全球建筑消耗的能源占全球能源总量约30%,产生的碳排放占全球碳排放总量约28%。目前全球能源供给主要依赖化石燃料等不可再生能源,导致能源枯竭问题和环境污染问题日益严重。近年来,氢能因其具有清洁、可再生、来源广泛、储运方便、利用率高等优点受到了广泛关注,被公认为一种很有前景的化石燃料替代品。此外,氢能存储系统与其他储能系统(如热能存储系统、电能存储系统)的协调运行有助于提升建筑能量效率。因此,优化具有氢电热混合储能建筑多能源系统的运行非常重要。
现有研究提出了若干针对具有氢电热混合储能的建筑多能源系统的能量优化方法,这些方法的目标是最小化系统运行成本(主要包括能量成本和碳排放成本等)。尽管上述研究取得了一定的进展,但均未考虑建筑热动态性,这意味着高建筑热惯性(即建筑室内温度由于初始激励(如突然停止加热)呈现弱化和延迟反应的现象)并未被充分利用以降低系统运行成本。然而,当将建筑热动态性考虑在具有氢电热混合储能的建筑多能源系统中时,系统优化运行面临四个方面的挑战:(1)存在大量不确定性系统参数。如可再生能源发电功率输出、电价、外部温度、用户占用状态、负荷等;(2)存在大量时间和空间耦合运行约束。例如氢能/电能/热能存储系统储能水平存在时间耦合关系,不同能源设备之间需要满足功率平衡、热能平衡导致了空间耦合关系的产生;(3)氢能存储系统中燃料电池同时产生电和热导致电能流和热能流之间存在耦合,这意味着三种能量流所涉及的设备间需要相互协调以达到最优化系统运行成本的目的;(4)很难建立既准确又易于建筑控制的明确建筑热动态性模型。即使该模型存在,获取并维持该模型将是一项非常耗时且容易出错的过程。当同时考虑上述挑战时,现有需知晓明确建筑热动态性模型的建筑微电网能量管理方法(如:随机规划、健壮性规划、模型预测控制、李雅普诺夫最优化)均不再适用。
发明内容
为了克服存在的上述挑战,本发明提供了一种建筑多能源系统智慧能量优化方法,其目的是在维持室内舒适温度范围的前提下最小化具有氢电热混合储能建筑多能源系统运行成本。提出的方法无需知晓明确的建筑热动态性模型和任何不确定性系统参数的先验信息。
为达到上述目的,本发明是采用下述技术方案实现的:
第一方面,本发明提供了一种建筑多能源系统智慧能量优化方法,包括如下步骤:
获取建筑多能源系统的当前环境状态;
将所述当前环境状态输入到训练好的深度神经网络;
通过深度神经网络输出建筑多能源系统行为;
对所述建筑多能源系统的行为按照能量存储系统储能水平动态性和运行约束进行重调整,并计算得到热能存储系统注入/释放功率、天然气锅炉输出功率以及建筑多能源系统与大电网之间的能量交易量;
根据所述建筑多能源系统的行为和计算所得的热能存储系统注入/释放功率、天然气锅炉输出功率以及建筑多能源系统与大电网之间的能量交易量,对建筑多能源系统进行控制。
进一步的,所述环境状态的表达式如下:
Figure BDA0002974128410000031
式中,vt表示t时隙的买电价格,Ppv,t表示t时隙太阳能发电机的发电功率;Pload,t表示t时隙的电负载需求;μe,t为t时隙大电网的碳排放率;Bt为t时隙电能存储系统中的储能水平;
Figure BDA0002974128410000032
分别表示t-1时隙电解槽和燃料电池的开关状态;Ht为t时隙氢能存储系统中的储能水平;Qth,t为t时隙热能存储系统中储能水平;βin,t为t时隙的室内温度;βout,t为t时隙的室外温度;t表示当前时隙,此处,时隙是指建筑多能源系统执行连续两次行为决策的时间间隔;
所述行为的表达式如下:
at=(ab,t,ah,t,Psp,t) (2)
式中,ab,t为电能存储系统在t时隙的充电/放电功率,若ab,t>0,则电能存储系统充电功率Pbc,t=ab,t且Pbd,t=0;否则,Pbd,t=ab,t且Pbc,t=0;ah,t表示t时隙电解槽输入功率/燃料电池输出功率,若ah,t>0,则电解槽输入功率Pel,t=ah,t且燃料电池输出功率Pfc,t=0;否则,Pfc,t=ah,t且Pel,t=0;Psp,t表示t时隙供给建筑物的热功率;
所述奖励的表达式如下:
rt+1=r1,t+1thr2,t+1 (3)
式中,
Figure BDA0002974128410000033
其中C1,t为t时隙建筑多能源系统与大电网交互的能量成本;C2,t为t时隙碳排放成本;C3,t为t时隙电能存储系统的折旧成本;C4,t为t时隙氢能存储系统的启动、关闭、运行和维护成本;C5,t为t时隙热能存储系统的折旧成本;C6,t为t时隙天然气购买成本;r2,t+1为t时隙热不适成本;πth是正权重系数。
进一步的,对所述建筑多能源系统的当前行为按照能量存储系统储能水平动态性和运行约束进行重调整的方法包括:根据电能存储系统储能水平动态性、氢能存储系统储能水平动态性以及与电能存储系统相关的运行约束、与氢能存储系统相关的运行约束、与热负载需求相关的运行约束对所述建筑多能源系统的行为进行重调整;
所述电能存储系统储能水平的动态性如下式:
Figure BDA0002974128410000041
式中,Bt+1表示t+1时隙电能存储系统中的储能水平;Bt表示t时隙电能存储系统中的储能水平;ηbc和ηbd分别表示电能存储系统的充电和放电效率系数;Pbc,t和Pbd,t分别表示t时隙电能存储系统的充电功率和放电功率;Pbc,t≥0且Pbd,t≤0;
所述氢能存储系统储能水平的动态性如下式:
Figure BDA0002974128410000042
式中,Ht+1表示t+1时隙氢能存储系统的储能水平;Ht表示t时隙氢能存储系统的储能水平;Pel,t和Pfc,t分别表示电解槽的输入功率和燃料电池的输出功率;ωel和ωfc分别表示电解槽和燃料电池的转换系数;Pel,t≥0且Pfc,t≤0;
所述与电能存储系统相关的运行约束包括:
Figure BDA0002974128410000051
式中,Bmin和Bmax分别是电能存储系统的最小和最大储能水平;
Figure BDA0002974128410000052
为电能存储系统的最大充电、放电功率;
所述与氢能存储系统相关的运行约束包括:
0≤Ht≤Hmax
Figure BDA0002974128410000053
Pel,t·Pfc,t=0,
式中,Hmax是氢罐的最大存储容量;
Figure BDA0002974128410000054
Figure BDA0002974128410000055
分别是电解槽和燃料电池的额定功率;
所述与热负载需求相关的运行约束包括:
βmin≤βin,t≤βmax,βin,t+1=F(Psp,tout,tin,tt),
Figure BDA0002974128410000056
式中,βmin和βmax分别表示舒适温度范围的下限和上限;F表示建筑热动态性模型;εt表示t时隙随机热扰动;
Figure BDA0002974128410000057
表示最大热输入功率。
进一步的,计算得到热能存储系统注入/释放功率、天然气锅炉输出功率以及建筑多能源系统与大电网之间的能量交易量的方法包括:根据所述调整后的行为、热能存储系统的运行约束、天然气锅炉运行约束、热能平衡约束、热能存储系统中储能水平的动态性和功率平衡约束计算热能存储系统注入/释放功率、天然气锅炉输出功率以及建筑多能源系统与大电网之间的能量交易量;
所述与热能存储系统相关的运行约束包括:
Figure BDA0002974128410000058
Ptd,t·Ptc,t=0,
式中,
Figure BDA0002974128410000059
是热能存储系统的最大容量;
Figure BDA00029741284100000510
Figure BDA00029741284100000511
分别是热能存储系统的最大释放功率和最大注入功率;
所述天然气锅炉运行约束为:
Figure BDA00029741284100000512
式中,Pgb,t为t时隙天然气锅炉输出的热功率;
所述热能平衡约束为:Qfc,t≥(Ptc,t+Ptd,t+Psp,t-Pgb,t)Δt;
所述功率平衡约束为:
Pg,t+Ppv,t-Pfc,t-Pbd,t=Pel,t+Pload,t+Pbc,t (6)
式中,Pg,t为t时隙建筑多能源系统与大电网之间的能量交易量;
所述热能存储系统的注入/释放功率、天然气锅炉输出功率以及建筑多能源系统与大电网之间的能量交易量计算方法为:比较建筑热负载需求的热供给功率Psp,t和燃料电池释放功率Pfc,t之间的大小,若前者大于后者,则根据热能存储系统运行约束、天然气锅炉运行约束、热能平衡约束以及热能存储系统中储能水平的动态性计算热能存储系统释放的热功率和由天然气锅炉补充的热功率;反之,则根据热能存储系统运行约束、热能平衡约束以及热能存储系统中储能水平的动态性计算热能存储系统释放的热功率,此时天然气锅炉输出的热功率为零;建筑多能源系统与大电网之间的能量交易量Pg,t可根据功率平衡约束计算得出。
进一步的,所述对建筑多能源系统进行控制的方法包括生成建筑多能源系统控制决策,所述建筑多能源系统控制决策包括:电能存储系统充/放功率、氢能存储系统输入/输出功率、建筑热负载需求的热供给功率、热能存储系统的注入/释放功率、天然气锅炉输出功率、以及建筑多能源系统与大电网之间的能量交易量。
进一步的,所述经验转移元组的优先级计算如下:
pl=|δl|+ζ (7)
式中,pl为第l个经验转移元组的优先级;δl表示与第l个经验转移元组相关的时间差分误差;ζ用来保证时间差分误差为0的经验转移元组也有被选中的概率。
进一步的,所述利用基于优先经验回放的深度确定性策略梯度算法更新深度神经网络权重的方法包括:
所述评论家网络通过最小化损失函数更新权重参数,损失函数表达式为:
Figure BDA0002974128410000071
式中,K表示随机抽取的经验转移元组个数;ωk=(NmPk)表示经验转移元组k的重要性采样权重;其中,Nm表示经验池大小,
Figure BDA0002974128410000072
表示抽取经验转移元组k的概率,参数0≤σ≤1用来补偿非均匀概率Pk;yk表示目标Q值;Q(sk,ak|θ)表示权重为θ的评论家网络输出的预期Q值;
所述行动者网络通过策略梯度更新权重参数,策略梯度表达式为:
Figure BDA0002974128410000073
式中,
Figure BDA0002974128410000074
表示权重为
Figure BDA0002974128410000075
的行动者网络。
进一步的,所述深度神经网络包括一个行动者网络,一个目标行动者网络、一个评论家网络和一个目标评论家网络;其中,智能体的行动者网络和目标行动者网络结构相同,评论家网络和目标评论家网络结构相同;行动者网络输入层的神经元个数与环境状态st的分量数相同,输出层的神经元个数与行为at的分量数相同。
第二方面,本发明提供了一种建筑多能源系统智慧能量优化装置,包括:
状态获取模块:用于获取建筑多能源系统的当前环境状态;
行为输出模块:用于根据当前环境状态输出建筑多能源系统行为,并定期从学习模块拷贝训练好的行动者网络参数;所述建筑多能源系统行为包括电能存储系统充/放功率、氢能存储系统输入/输出功率和建筑热负载需求的热供给功率;
经验存储模块:用于存储训练深度神经网络的经验转移元组及其优先级;
学习模块:用于定期从经验存储模块抽取小批量经验转移元组,并利用基于优先经验回放的确定性策略梯度算法对神经网络进行训练以获得行为选择的最优策略,所述最优策略包括训练好的行动者网络参数;
重调整模块:用于对所述建筑多能源系统的行为按照能量存储系统储能水平动态性和运行约束进行重调整,并计算得到建筑多能源系统的热能存储系统的注入/释放功率、天然气锅炉输出功率以及建筑多能源系统与大电网之间的能量交易量。
与现有技术相比,本发明所达到的有益效果:本发明方法无需知晓任何不确定性参数的先验信息和明确的建筑热动态性模型,适用性更广。相比现有方法,本发明方法可在维持室内温度在舒适范围的前提下有效降低运行成本且具有更强的鲁棒性和通用性。
附图说明
图1是本发明提供的建筑多能源系统智慧能量优化方法设计流程图;
图2是本发明方法实施例的训练曲线收敛图;
图3是本发明方法实施例与其他方案的运行成本对比图;
图4是本发明方法实施例与其他方案的室内温度对比图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清晰,下面结合附图对本发明作进一步详细说明。应当理解,此处所描述的具体实施例仅仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。
实施例一:
如图1所示,本实施例提供的建筑多能源系统智慧能量优化方法设计流程图,本实施例的方法是针对具有氢电热混合储能的建筑多能源系统的能量优化方法,所述方法包括如下步骤:
步骤一:将在考虑建筑热动态性和维持室内温度在舒适范围的情况下具有氢电热混合储能的建筑多能源系统运行成本最小化问题建模为马尔可夫决策过程,并设计相应的环境状态、行为以及奖励函数。
在上述具有氢电热混合储能的建筑多能源系统运行成本最小化问题中,目标函数是建筑多能源系统运行成本,包括t时隙建筑多能源系统与大电网交互的能量成本C1,t,t时隙碳排放成本C2,t,t时隙电能存储系统的折旧成本C3,t,t时隙氢能存储系统的启动、关闭、运行和维护成本C4,t,t时隙热能存储系统的折旧成本C5,t,t时隙天然气购买成本C6,t,其表达式如下:
Figure BDA0002974128410000091
C2,t=μcμe,tPg,tΔt (2)
C3,t=ψBESS(|Pbc,t|+|Pbd,t|) (3)
Figure BDA0002974128410000092
C5,t=ψTESS(|Ptc,t|+|Ptd,t|) (5)
Figure BDA0002974128410000093
式中,vt和τt分别表示t时隙买电价格和卖电价格;Pg,t为t时隙建筑多能源系统与大电网交互的能量交易量;μc是碳排放成本系数,单位为RMB/kg;μe,t为t时隙大电网的碳排放率;ψBESS是电池折旧系数,单位为RMB/kW;Pbc,t和Pbd,t分别表示电能存储系统的充电功率和放电功率;
Figure BDA0002974128410000101
Figure BDA0002974128410000102
分别表示氢能存储系统中组件x(x∈{el,fc})的运行和维护成本、启动成本和关闭成本,其中,“el”和“fc”分别表示电解槽和燃料电池;
Figure BDA0002974128410000103
Figure BDA0002974128410000104
分别表示与组件x的开关状态、启动状态和关闭状态相关的逻辑指示变量,其中,
Figure BDA0002974128410000105
ψTESS是热能存储系统折旧系数,单位为RMB/kW;Ptc,t和Ptd,t分别表示t时隙热能存储系统的注入功率和释放功率;ηgb表示天然气转换为热能的转换效率;Pgb,t表示氢能存储系统输出的热功率;λgb表示天然气价格,单位为RMB/kWh。
在上述具有氢电热混合储能的建筑多能源系统运行成本最小化问题中,需考虑各时隙能量存储系统中的储能水平,具体如下:
(1)氢能存储系统储能水平的动态性可表示为:
Figure BDA0002974128410000106
式中,Ht+1表示t+1时隙氢能存储系统的储能水平;Ht表示t时隙氢能存储系统的储能水平;Pel,t和Pfc,t分别表示电解槽的输入功率和燃料电池的输出功率;ωel(单位:Nm3/kWh)和ωfc(单位:kWh/Nm3)分别表示电解槽和燃料电池的转换系数。在此,Pel,t和Pfc,t被赋予了不同的符号(即Pel,t≥0,Pfc,t≤0)。
(2)电能存储系统储能水平的动态性可表示为:
Figure BDA0002974128410000107
式中,Bt+1表示t+1时隙电能存储系统中的储能水平;Bt表示时隙t时电能存储系统中的储能水平;ηbc和ηbd分别表示电能存储系统的充电和放电效率系数。在此,Pbc,t和Pbd,t被赋予了不同的符号(即Pbc,t≥0,Pbd,t≤0)。
(3)热能存储系统中储能水平的动态性可表示为:
Figure BDA0002974128410000111
式中,Qth,t+1表示t+1时隙在热能存储系统中的储能水平;Qth,t表示t时隙在热能存储系统的储能水平;ηtc和ηtd分别表示热能存储系统的注入效率和释放效率。在此,Ptc,t和Ptd,t被赋予了不同的符号(即Ptc,t≥0,Ptd,t≤0)。
在上述具有氢电热混合储能的建筑多能源系统运行成本最小化问题中,需要考虑的约束有:与电能存储系统相关的运行约束、与氢能存储系统相关的运行约束、与热能存储系统相关的运行约束、与热负载需求相关的运行约束、与天然气锅炉相关的运行约束、与功率平衡相关的约束以及与热能平衡相关的约束,具体如下:
(1)电能存储系统需满足以下运行约束:Bmin≤Bt≤Bmax
Figure BDA0002974128410000112
Figure BDA0002974128410000113
Pbc,t·Pbd,t=0,式中,Bmin和Bmax分别是电能存储系统的最小和最大能量水平;
Figure BDA0002974128410000114
分别为电能存储系统的最大充电、放电功率。
(2)氢能存储系统应满足以下运行约束:0≤Ht≤Hmax
Figure BDA0002974128410000115
Figure BDA0002974128410000116
Pel,t·Pfc,t=0,式中,Hmax是氢罐的最大存储容量;
Figure BDA0002974128410000117
Figure BDA0002974128410000118
分别是电解槽和燃料电池的额定功率。
(3)热能存储系统需满足以下运行约束:
Figure BDA0002974128410000119
Figure BDA00029741284100001110
Ptd,t·Ptc,t=0,式中,
Figure BDA00029741284100001111
是热能存储系统的最大容量;
Figure BDA00029741284100001112
Figure BDA00029741284100001113
分别是热能存储系统的最大释放功率和最大注入功率。
(4)热负载需求满足以下运行约束:βmin≤βin,t≤βmax
Figure BDA00029741284100001114
βin,t+1=F(Psp,tout,tin,tt),式中,βmin和βmax分别表示舒适温度范围的下限和上限;F表示建筑热动态性模型;εt表示t时隙的随机热扰动;
Figure BDA0002974128410000121
表示最大热输入功率。
(5)天然气锅炉需满足以下运行约束:
Figure BDA0002974128410000122
式中,Pgb,t为t时隙天然气锅炉输出的热功率。
(6)功率平衡需满足以下约束:Pg,t+Ppv,t-Pfc,t-Pbd,t=Pel,t+Pload,t+Pbc,t,式中,Pg,t为t时隙建筑多能源系统与大电网之间的能量交易量。
(7)热能平衡需满足以下约束:Qfc,t≥(Ptc,t+Ptd,t+Psp,t-Pgb,t)Δt。
马尔可夫决策过程是解决不确定性环境下多阶段决策问题的通用框架。采用折扣因子的马尔可夫决策过程通常定义为一个五元组:M=(S,A,P,R,γ)。其中,S是环境状态集合,A是行为集合,P是转移概率函数,R是奖励函数,γ∈[0,1]为折扣因子。在马尔可夫决策过程中,智能体基于当前状态选择行为并将其作用于环境,环境返回奖励并转移到下一状态。在此过程中,智能体不断与环境进行交互以最大化累积折扣奖励的期望值进而发现最优策略。由于基于优先经验回放的深度确定性策略梯度算法无需状态转移函数的信息,因此本实施例中,主要设计环境状态、行为和奖励函数,分别如下:
(1)环境状态。上述具有氢电热混合储能的建筑多能源系统运行成本最小化问题中,目标函数的计算取决于以下状态信息:t时隙买电价格vt、t时隙太阳能发电机发电功率Ppv,t、t时隙电负载需求Pload,t、t时隙大电网碳排放率μe,t、t时隙电能存储系统储能水平Bt、t-1时隙电解槽和燃料电池开关状态
Figure BDA0002974128410000123
Figure BDA0002974128410000124
t时隙氢能存储系统储能水平Ht、t时隙热能存储系统储能水平Qth,t、t时隙室内温度βin,t和t时隙室外温度βout,t。因此环境状态可表示为:
Figure BDA0002974128410000131
(2)行为。在具有氢电热混合储能的建筑多能源系统中,控制决策包括Pbc,t、Pbd,t、Pel,t、Pfc,t、Ptc,t、Ptd,t、Pgb,t、Pg,t。为简单起见,令ab,t表示电能存储系统在t时隙的充电/放电功率,为了确保电能存储系统储能水平动态性和电能存储系统运行约束不会被违背,对ab,t进行重调整:当ab,t>0时,
Figure BDA0002974128410000132
且Pbd,t=0;否则,Pbc,t=0且
Figure BDA0002974128410000133
类似地,令ah,t表示t时隙电解槽输入功率/燃料电池输出功率,为了确保电能存储系统储能水平动态性和氢能存储系统的运行约束不会被违背,则当ah,t>0时,
Figure BDA0002974128410000134
且Pfc,t=0,否则Pel,t=0且
Figure BDA0002974128410000135
一旦确定了Pfc,t,即可根据下式
Qfc,t=ηh2eηhrPfc,tΔt (11)
获得燃料电池产生的热能Qfc,t,式中,ηh2e为热电比,ηhr为热恢复系数。
接下来,根据热能平衡约束确定Ptc,t、Ptd,t、Psp,t、Pgb,t的值。为了简化行为设计,我们为热能存储系统、热负载需求和氢能存储系统分配不同的优先级。具体而言,我们首先确定
Figure BDA0002974128410000136
的值,以便可以保持舒适的温度范围。当Qfc,t>Psp,tΔt时,热能存储系统将在热能注入模式下运行,即Ptd,t=0且
Figure BDA0002974128410000137
在这种情况下,Pgb,t=0。当Qfc,t≤Psp,tΔt时,热能存储系统将以热能释放模式运行,即Ptc,t=0且
Figure BDA0002974128410000141
在这种情况下,
Figure BDA0002974128410000142
因此,实际热供应量
Figure BDA0002974128410000143
由于可以根据ab,t、ah,t和Psp,t的值计算Ptc,t、Ptd,t、Pgb,t和Pg,t的值,因此,实际行为设计为:
at=(ab,t,ah,t,Psp,t) (12)
(3)奖励函数。由于具有氢电热混合储能的建筑多能源系统运行成本最小化问题的目的是在维持舒适温度范围的同时最小化建筑多能源系统的运行成本,因此奖励包括两部分,即对运行成本施加的惩罚r1,t+1和对热不适施加的惩罚r2,t+1
Figure BDA0002974128410000144
Figure BDA0002974128410000145
因此,奖励可表示为
rt+1=r1,t+1thr2,t+1 (15)
式中,πth是以RMB/°F为单位的正权重系数。
步骤二:利用基于优先经验回放的深度确定性策略梯度算法训练建筑多能源系统相关的深度神经网络以获得行为选择的最优策略。具体步骤如下:
(1)获取建筑多能源系统的当前环境状态;
(2)深度神经网络根据所述当前环境状态,输出建筑多能源系统的当前行为;
(3)对所述建筑多能源系统的当前行为按照能量存储系统储能水平动态性和运行约束进行重调整,并计算得到热能存储系统注入/释放功率、天然气锅炉输出功率以及建筑多能源系统与大电网之间的能量交易量。
(4)根据所述当前行为和计算所得热能存储系统注入/释放功率、天然气锅炉输出功率以及建筑多能源系统与大电网之间的能量交易量,对建筑多能源系统进行控制;
(5)获取建筑多能源系统的下一时隙奖励和下一时隙环境状态;
(6)计算当前经验转移元组(即,所述当前环境状态st、所述当前行为at、所述下一时隙奖励rt+1、所述下一时隙环境状态st+1)的优先级;
(7)将经验转移元组及其优先级存储至经验池中;
(8)从经验池中抽取小批量训练样本,利用基于优先经验回放的深度确定性策略梯度算法更新深度神经网络的权重。
上述提及的经验转移元组的优先级可计算如下:
pl=|δl|+ζ (16)
式中,pl为第l个经验转移元组的优先级;δl表示与第l个经验转移元组相关的时间差分误差;ζ用来保证差分误差为0的经验转移元组也有被选中的概率。
上述提及的神经网络,其特征是:所述深度神经网络包括一个行动者网络,一个目标行动者网络、一个评论家网络和一个目标评论家网络。其中,智能体的行动者网络和目标行动者网络结构相同,评论家网络和目标评论家网络结构相同。行动者网络输入层的神经元个数与环境状态st的分量数相同,输出层的神经元个数与行为at的个数相同。评论家网络通过最小化损失函数更新权重参数,损失函数表达式为:
Figure BDA0002974128410000151
式中,K表示随机抽取的经验转移元组个数;ωk=(NmPk)表示经验转移元组k的重要性采样权重。其中,Nm表示经验池大小,
Figure BDA0002974128410000161
表示抽取经验转移元组k的概率,参数0≤σ≤1用来补偿非均匀概率Pk;yk表示目标Q值;Q(sk,ak|θ)表示权重为θ的评论家网络输出的预期Q值。行动者网络通过策略梯度更新权重参数,策略梯度表达式为:
Figure BDA0002974128410000162
式中,
Figure BDA0002974128410000163
表示权重为
Figure BDA0002974128410000164
的行动者网络。
步骤三:将训练好的最优策略部署在实际建筑环境中用于建筑多能源系统实时能量优化,具体步骤如下:
(1)获取建筑多能源系统的当前环境状态;
(2)将所述当前环境状态输入到训练好的深度神经网络;
(3)深度神经网络输出建筑多能源系统行为;
(4)对所述建筑多能源系统的行为按照能量存储系统储能水平动态性和运行约束进行重调整,并计算得到热能存储系统注入/释放功率、天然气锅炉输出功率以及建筑多能源系统与大电网之间的能量交易量;
(5)根据所述建筑多能源系统的行为和计算所得的热能存储系统注入/释放功率、天然气锅炉输出功率以及建筑多能源系统与大电网之间的能量交易量,对建筑多能源系统进行控制。
如图2所示,是本发明方法实施例的平均奖励曲线收敛过程。值得注意的是,本发明仿真所用的数据均为真实数据,其中电价数据为2020年11月和12月的北京商业电价;电负载和室外温度数据来源于Pecan Street数据库;太阳能辐射数据为NREL太阳辐射研究实验室采集的2019年11月和12月期间的数据。由曲线可知,随着片段数的增加,平均奖励逐渐增加并变得越来越稳定,这表明了所提方法具有良好的收敛性。
如图3所示,是本发明方法实施例与其他方案的运行成本对比图。方案一不使用任何能量存储系统,而是采用ON/OFF策略控制加热需求所需热输入功率。具体而言,仅通过太阳能发电机和大电网满足电负载,通过氢能存储系统满足热负载需求。另外,如果βt<βmin,则
Figure BDA0002974128410000171
如果βt>βmax,则Psp,t=0。方案二在没有协调的情况下调度电能流和热能流。具体而言,电能存储系统和氢能存储系统均使用贪婪算法调度,当vt=vmin和vt=vmax时,贪婪算法分别最大化Pel,t/Pbc,t和最小化Pfc,t/Pbd,t,vmin和vmax分别为最小电价和最大电价。此外,采用ON/OFF策略控制满足热需求的热输入功率。方案三假定在已获取所有不确定性参数信息的前提下调度所有能量存储系统。尽管此类信息在现实系统运行中难以获得,但是该方案可以为所提出的方法提供性能下限,在此仅作为最优性能参考。由图3可以看出,与方案一和方案二相比,所提方法可分别降低运行成本24.86%和5.12%。尽管所提出的方法相比方案三具有更高的运行成本,但二者的相对差距小于8.43%。由于获得方案三中假定的完美信息并不实际,故所提方法实用性最好,且在无需知晓明确建筑热动态性模型的前提下拥有近似最优性能。
图4展示了本发明方法实施例与其他方案的室内温度对比图。由图可知,与方案一和方案二相比,所提方法可实现更小的温度偏离。
表1不同随机热扰动下所的健壮性比较表
Figure BDA0002974128410000172
Figure BDA0002974128410000181
表1展示了本发明方法在多种随机热扰动下的健壮性。为了模拟建筑热环境,采用如下环境热动态性模型:βin,t+1=0.9βin,t+0.1(βout,t+7.143Psp,t)+εt,其中:热扰动εt遵循参数为[-χ,χ]华氏度的均匀分布。我们考虑了χ={0.9,1.8,2.4}三种情况。可以看出,所提出方法可取得比方案一和方案二更好的性能。与方案三相比,所提方法有时能以较小的温度偏离换取更低的运行成本。此外,所提方法在三种情况下均可提供有效决策,而方案三在当χ=2.4时无法提供可行解。因此,所提方法具有很强的健壮性和通用性。
实施例二:
一种建筑多能源系统智慧能量优化装置,其特征在于,所述建筑多能源系统智慧能量优化装置包括:
状态获取模块:用于获取建筑多能源系统的当前环境状态。
行为输出模块:用于根据当前环境状态输出建筑多能源系统行为(包括电能存储系统充/放功率、氢能存储系统输入/输出功率和建筑热负载需求的热供给功率),并定期从神经网络模块拷贝训练好的行动者网络参数。
经验存储模块:用于存储训练神经网络的经验转移元组及其优先级。
学习模块:用于定期从经验存储模块抽取小批量经验转移元组,并利用基于优先经验回放的确定性策略梯度算法对神经网络进行训练以获得行为选择的最优策略。
重调整模块:用于对所述建筑多能源系统的行为按照能量存储系统储能水平动态性和运行约束进行重调整,并计算得到建筑多能源系统的热能存储系统的注入/释放功率、天然气锅炉输出功率以及建筑多能源系统与大电网之间的能量交易量。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和变形,这些改进和变形也应视为本发明的保护范围。

Claims (8)

1.一种建筑多能源系统智慧能量优化方法,其特征在于,包括如下步骤:
获取建筑多能源系统的当前环境状态;
将所述当前环境状态输入到训练好的深度神经网络;
通过深度神经网络输出建筑多能源系统行为;
对所述建筑多能源系统的行为按照能量存储系统储能水平动态性和运行约束进行重调整,并计算得到热能存储系统注入/释放功率、天然气锅炉输出功率以及建筑多能源系统与大电网之间的能量交易量;
根据所述建筑多能源系统的行为和计算所得的热能存储系统注入/释放功率、天然气锅炉输出功率以及建筑多能源系统与大电网之间的能量交易量,对建筑多能源系统进行控制;
所述热能存储系统的注入/释放功率、天然气锅炉输出功率以及建筑多能源系统与大电网之间的能量交易量计算方法为:比较建筑热负载需求的热供给功率Psp,t和燃料电池释放功率Pfc,t之间的大小,若前者大于后者,则根据热能存储系统运行约束、天然气锅炉运行约束、热能平衡约束以及热能存储系统中储能水平的动态性计算热能存储系统释放的热功率和由天然气锅炉补充的热功率;反之,则根据热能存储系统运行约束、热能平衡约束以及热能存储系统中储能水平的动态性计算热能存储系统释放的热功率,此时天然气锅炉输出的热功率为零;建筑多能源系统与大电网之间的能量交易量Pg,t可根据功率平衡约束计算得出;
深度神经网络的训练过程包括如下步骤:
获取建筑多能源系统的当前环境状态;
通过深度神经网络根据所述当前环境状态,输出建筑多能源系统的当前行为;
对所述建筑多能源系统的当前行为按照能量存储系统储能水平动态性和运行约束进行重调整,并计算得到热能存储系统注入/释放功率、天然气锅炉输出功率以及建筑多能源系统与大电网之间的能量交易量;
根据所述当前行为和计算所得热能存储系统注入/释放功率、天然气锅炉输出功率以及建筑多能源系统与大电网之间的能量交易量,对建筑多能源系统进行控制;
获取建筑多能源系统的下一时隙奖励和下一时隙环境状态;
计算当前经验转移元组的优先级;所述当前经验转移元组包括当前环境状态、当前行为、下一时隙奖励和下一时隙环境状态;
将经验转移元组及其优先级存储至经验池中;
从经验池中抽取小批量训练样本,利用基于优先经验回放的深度确定性策略梯度算法更新深度神经网络的权重参数;
所述环境状态的表达式如下:
Figure FDA0003717416570000021
式中,vt表示t时隙的买电价格,Ppv,t表示t时隙太阳能发电机的发电功率;Pload,t表示t时隙的电负载需求;μe,t为t时隙大电网的碳排放率;Bt为t时隙电能存储系统中的储能水平;
Figure FDA0003717416570000022
分别表示t-1时隙电解槽和燃料电池的开关状态;Ht为t时隙氢能存储系统中的储能水平;Qth,t为t时隙热能存储系统中储能水平;βin,t为t时隙的室内温度;βout,t为t时隙的室外温度;t表示当前时隙,此处,时隙是指建筑多能源系统执行连续两次行为决策的时间间隔;
所述行为的表达式如下:
at=(ab,t,ah,t,Psp,t) (2)
式中,ab,t为电能存储系统在t时隙的充电/放电功率,若ab,t>0,则电能存储系统充电功率Pbc,t=ab,t且表示t时隙电能存储系统的放电功率Pbd,t=0;否则,表示t时隙电能存储系统的放电功率Pbd,t=ab,t且Pbc,t=0;ah,t表示t时隙电解槽输入功率/燃料电池输出功率,若ah,t>0,则电解槽输入功率Pel,t=ah,t且燃料电池输出功率Pfc,t=0;否则,Pfc,t=ah,t且Pel,t=0;Psp,t表示t时隙供给建筑物的热功率;
所述奖励的表达式如下:
rt+1=r1,t+1thr2,t+1 (3)
式中,
Figure FDA0003717416570000031
其中C1,t为t时隙建筑多能源系统与大电网交互的能量成本;C2,t为t时隙碳排放成本;C3,t为t时隙电能存储系统的折旧成本;C4,t为t时隙氢能存储系统的启动、关闭、运行和维护成本;C5,t为t时隙热能存储系统的折旧成本;C6,t为t时隙天然气购买成本;r2,t+1为t时隙热不适成本;πth是正权重系数。
2.根据权利要求1所述的建筑多能源系统智慧能量优化方法,其特征在于,对所述建筑多能源系统的当前行为按照能量存储系统储能水平动态性和运行约束进行重调整的方法包括:根据电能存储系统储能水平动态性、氢能存储系统储能水平动态性以及与电能存储系统相关的运行约束、与氢能存储系统相关的运行约束、与热负载需求相关的运行约束对所述建筑多能源系统的行为进行重调整;
所述电能存储系统储能水平的动态性如下式:
Figure FDA0003717416570000041
式中,Bt+1表示t+1时隙电能存储系统中的储能水平;Bt表示t时隙电能存储系统中的储能水平;ηbc和ηbd分别表示电能存储系统的充电和放电效率系数;Pbc,t和Pbd,t分别表示t时隙电能存储系统的充电功率和放电功率;Pbc,t≥0且Pbd,t≤0;
所述氢能存储系统储能水平的动态性如下式:
Figure FDA0003717416570000042
式中,Ht+1表示t+1时隙氢能存储系统的储能水平;Ht表示t时隙氢能存储系统的储能水平;Pel,t和Pfc,t分别表示电解槽的输入功率和燃料电池的输出功率;ωel和ωfc分别表示电解槽和燃料电池的转换系数;Pel,t≥0且Pfc,t≤0;
所述与电能存储系统相关的运行约束包括:
Bmin≤Bt≤Bmax
Figure FDA0003717416570000043
Pbc,t·Pbd,t=0,
式中,Bmin和Bmax分别是电能存储系统的最小和最大储能水平;
Figure FDA0003717416570000044
为电能存储系统的最大充电、放电功率;
所述与氢能存储系统相关的运行约束包括:
0≤Ht≤Hmax
Figure FDA0003717416570000045
Pel,t·Pfc,t=0,
式中,Hmax是氢罐的最大存储容量;
Figure FDA0003717416570000046
Figure FDA0003717416570000047
分别是电解槽和燃料电池的额定功率;
所述与热负载需求相关的运行约束包括:
βmin≤βin,t≤βmax,βin,t+1=F(Psp,tout,tin,tt),
Figure FDA0003717416570000048
式中,βmin和βmax分别表示舒适温度范围的下限和上限;F表示建筑热动态性模型;εt表示t时隙随机热扰动;
Figure FDA0003717416570000051
表示最大热输入功率。
3.根据权利要求2所述的建筑多能源系统智慧能量优化方法,其特征在于,计算得到热能存储系统注入/释放功率、天然气锅炉输出功率以及建筑多能源系统与大电网之间的能量交易量的方法包括:根据所述调整后的行为、热能存储系统的运行约束、天然气锅炉运行约束、热能平衡约束、热能存储系统中储能水平的动态性和功率平衡约束计算热能存储系统注入/释放功率、天然气锅炉输出功率以及建筑多能源系统与大电网之间的能量交易量;
与热能存储系统相关的运行约束包括:
Figure FDA0003717416570000052
Ptd,t·Ptc,t=0,
式中,
Figure FDA0003717416570000053
是热能存储系统的最大容量;
Figure FDA0003717416570000054
Figure FDA0003717416570000055
分别是热能存储系统的最大释放功率和最大注入功率;
所述天然气锅炉运行约束为:
Figure FDA0003717416570000056
式中,Pgb,t为t时隙天然气锅炉输出的热功率;
所述热能平衡约束为:Qfc,t≥(Ptc,t+Ptd,t+Psp,t-Pgb,t)Δt;
所述功率平衡约束为:
Pg,t+Ppv,t-Pfc,t-Pbd,t=Pel,t+Pload,t+Pbc,t (6)
式中,Pg,t为t时隙建筑多能源系统与大电网之间的能量交易量。
4.根据权利要求1所述的建筑多能源系统智慧能量优化方法,其特征在于,所述对建筑多能源系统进行控制的方法包括生成建筑多能源系统控制决策,所述建筑多能源系统控制决策包括:电能存储系统充/放功率、氢能存储系统输入/输出功率、建筑热负载需求的热供给功率、热能存储系统的注入/释放功率、天然气锅炉输出功率、以及建筑多能源系统与大电网之间的能量交易量。
5.根据权利要求1所述的建筑多能源系统智慧能量优化方法,其特征在于,所述经验转移元组的优先级计算如下:
pl=|δl|+ζ (7)
式中,pl为第l个经验转移元组的优先级;δl表示与第l个经验转移元组相关的时间差分误差;ζ用来保证时间差分误差为0的经验转移元组也有被选中的概率。
6.根据权利要求1所述的建筑多能源系统智慧能量优化方法,其特征在于,所述利用基于优先经验回放的深度确定性策略梯度算法更新深度神经网络权重参数的方法包括:
评论家网络通过最小化损失函数更新权重参数,损失函数表达式为:
Figure FDA0003717416570000061
式中,K表示随机抽取的经验转移元组个数;ωk=(NmPk)表示经验转移元组k的重要性采样权重;其中,Nm表示经验池大小,
Figure FDA0003717416570000062
表示抽取的第k个经验转移元组(sk,ak,sk+1,rk+1)的概率,参数0≤σ≤1用来补偿非均匀概率Pk;yk表示目标Q值;Q(sk,ak|θ)表示权重为θ的评论家网络输出的预期Q值;
行动者网络通过策略梯度更新权重参数,策略梯度表达式为:
Figure FDA0003717416570000063
式中,
Figure FDA0003717416570000064
表示权重为
Figure FDA0003717416570000065
的行动者网络。
7.根据权利要求1至5中任一项所述的建筑多能源系统智慧能量优化方法,其特征在于,所述深度神经网络包括一个行动者网络,一个目标行动者网络、一个评论家网络和一个目标评论家网络;其中,智能体的行动者网络和目标行动者网络结构相同,评论家网络和目标评论家网络结构相同;行动者网络输入层的神经元个数与环境状态st的分量数相同,输出层的神经元个数与行为at的分量数相同。
8.一种建筑多能源系统智慧能量优化装置,其特征在于,包括:
状态获取模块:用于获取建筑多能源系统的当前环境状态;
行为输出模块:用于根据当前环境状态输出建筑多能源系统行为,并定期从学习模块拷贝训练好的行动者网络参数;所述建筑多能源系统行为包括电能存储系统充/放功率、氢能存储系统输入/输出功率和建筑热负载需求的热供给功率;
经验存储模块:用于存储训练深度神经网络的经验转移元组及其优先级;
学习模块:用于定期从经验存储模块抽取小批量经验转移元组,并利用基于优先经验回放的确定性策略梯度算法对神经网络进行训练以获得行为选择的最优策略,所述最优策略包括训练好的行动者网络参数;
重调整模块:用于对所述建筑多能源系统的行为按照能量存储系统储能水平动态性和运行约束进行重调整,并计算得到建筑多能源系统的热能存储系统的注入/释放功率、天然气锅炉输出功率以及建筑多能源系统与大电网之间的能量交易量;
所述热能存储系统的注入/释放功率、天然气锅炉输出功率以及建筑多能源系统与大电网之间的能量交易量计算方法为:比较建筑热负载需求的热供给功率Psp,t和燃料电池释放功率Pfc,t之间的大小,若前者大于后者,则根据热能存储系统运行约束、天然气锅炉运行约束、热能平衡约束以及热能存储系统中储能水平的动态性计算热能存储系统释放的热功率和由天然气锅炉补充的热功率;反之,则根据热能存储系统运行约束、热能平衡约束以及热能存储系统中储能水平的动态性计算热能存储系统释放的热功率,此时天然气锅炉输出的热功率为零;建筑多能源系统与大电网之间的能量交易量Pg,t可根据功率平衡约束计算得出;
深度神经网络的训练过程包括如下步骤:
获取建筑多能源系统的当前环境状态;
通过深度神经网络根据所述当前环境状态,输出建筑多能源系统的当前行为;
对所述建筑多能源系统的当前行为按照能量存储系统储能水平动态性和运行约束进行重调整,并计算得到热能存储系统注入/释放功率、天然气锅炉输出功率以及建筑多能源系统与大电网之间的能量交易量;
根据所述当前行为和计算所得热能存储系统注入/释放功率、天然气锅炉输出功率以及建筑多能源系统与大电网之间的能量交易量,对建筑多能源系统进行控制;
获取建筑多能源系统的下一时隙奖励和下一时隙环境状态;
计算当前经验转移元组的优先级;所述当前经验转移元组包括当前环境状态、当前行为、下一时隙奖励和下一时隙环境状态;
将经验转移元组及其优先级存储至经验池中;
从经验池中抽取小批量训练样本,利用基于优先经验回放的深度确定性策略梯度算法更新深度神经网络的权重参数;
所述环境状态的表达式如下:
Figure FDA0003717416570000091
式中,vt表示t时隙的买电价格,Ppv,t表示t时隙太阳能发电机的发电功率;Pload,t表示t时隙的电负载需求;μe,t为t时隙大电网的碳排放率;Bt为t时隙电能存储系统中的储能水平;
Figure FDA0003717416570000092
分别表示t-1时隙电解槽和燃料电池的开关状态;Ht为t时隙氢能存储系统中的储能水平;Qth,t为t时隙热能存储系统中储能水平;βin,t为t时隙的室内温度;βout,t为t时隙的室外温度;t表示当前时隙,此处,时隙是指建筑多能源系统执行连续两次行为决策的时间间隔;
所述行为的表达式如下:
at=(ab,t,ah,t,Psp,t) (2)
式中,ab,t为电能存储系统在t时隙的充电/放电功率,若ab,t>0,则电能存储系统充电功率Pbc,t=ab,t且表示t时隙电能存储系统的放电功率Pbd,t=0;否则,表示t时隙电能存储系统的放电功率Pbd,t=ab,t且Pbc,t=0;ah,t表示t时隙电解槽输入功率/燃料电池输出功率,若ah,t>0,则电解槽输入功率Pel,t=ah,t且燃料电池输出功率Pfc,t=0;否则,Pfc,t=ah,t且Pel,t=0;Psp,t表示t时隙供给建筑物的热功率;
所述奖励的表达式如下:
rt+1=r1,t+1thr2,t+1 (3)
式中,
Figure FDA0003717416570000093
其中C1,t为t时隙建筑多能源系统与大电网交互的能量成本;C2,t为t时隙碳排放成本;C3,t为t时隙电能存储系统的折旧成本;C4,t为t时隙氢能存储系统的启动、关闭、运行和维护成本;C5,t为t时隙热能存储系统的折旧成本;C6,t为t时隙天然气购买成本;r2,t+1为t时隙热不适成本;πth是正权重系数。
CN202110270444.7A 2021-03-12 2021-03-12 一种建筑多能源系统智慧能量优化方法及装置 Active CN112966444B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110270444.7A CN112966444B (zh) 2021-03-12 2021-03-12 一种建筑多能源系统智慧能量优化方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110270444.7A CN112966444B (zh) 2021-03-12 2021-03-12 一种建筑多能源系统智慧能量优化方法及装置

Publications (2)

Publication Number Publication Date
CN112966444A CN112966444A (zh) 2021-06-15
CN112966444B true CN112966444B (zh) 2022-08-16

Family

ID=76277578

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110270444.7A Active CN112966444B (zh) 2021-03-12 2021-03-12 一种建筑多能源系统智慧能量优化方法及装置

Country Status (1)

Country Link
CN (1) CN112966444B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113869742B (zh) * 2021-09-29 2024-03-05 国网江苏省电力有限公司 基于行动家和评论家网络的综合供需侧的电力调度系统
CN114123273A (zh) * 2021-11-12 2022-03-01 青海综合能源服务有限公司 一种风电-光伏-储能联合系统的控制方法及系统

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110458443A (zh) * 2019-08-07 2019-11-15 南京邮电大学 一种基于深度强化学习的智慧家庭能量管理方法及系统

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110458443A (zh) * 2019-08-07 2019-11-15 南京邮电大学 一种基于深度强化学习的智慧家庭能量管理方法及系统

Also Published As

Publication number Publication date
CN112966444A (zh) 2021-06-15

Similar Documents

Publication Publication Date Title
Li et al. Sizing of a stand-alone microgrid considering electric power, cooling/heating, hydrogen loads and hydrogen storage degradation
Hannan et al. Binary particle swarm optimization for scheduling MG integrated virtual power plant toward energy saving
CN109523065B (zh) 一种基于改进量子粒子群算法的微能源网优化调度方法
Qi et al. Low-carbon community adaptive energy management optimization toward smart services
CN111008748B (zh) 包括电动汽车充电负荷的微电网经济调度优化方法
CN111555281B (zh) 一种电力系统灵活性资源配置仿真方法及装置
CN108009693A (zh) 基于两级需求响应的并网微电网双层优化方法
CN112966444B (zh) 一种建筑多能源系统智慧能量优化方法及装置
CN108985524B (zh) 一种多能互补系统的协调控制方法
Li et al. Model-based multi-objective predictive scheduling and real-time optimal control of energy systems in zero/low energy buildings using a game theory approach
CN110796279A (zh) 一种多能互补优化运行方法与系统
CN112131712B (zh) 客户侧多能源系统多目标优化方法和系统
CN111668878A (zh) 一种可再生微能源网的优化配置方法和系统
CN114362241A (zh) 一种基于新能源最大消纳及发电成本最优的混合调度方法
Zhu et al. Multi-objective optimal scheduling of an integrated energy system under the multi-time scale ladder-type carbon trading mechanism
CN115169916A (zh) 一种基于安全经济的电热综合能源控制方法
CN116432824A (zh) 基于多目标粒子群的综合能源系统优化方法及系统
Li et al. Intraday multi-objective hierarchical coordinated operation of a multi-energy system
CN112883630A (zh) 用于风电消纳的多微网系统日前优化经济调度方法
Zhang et al. Low carbon multi‐objective scheduling of integrated energy system based on ladder light robust optimization
CN116468215A (zh) 计及源荷不确定性的综合能源系统调度方法及装置
Fan et al. Multi-agent deep reinforced co-dispatch of energy and hydrogen storage in low-carbon building clusters
CN114971071A (zh) 计及风光接入和电热混合储能的园区综合能源系统时序规划方法
Xie et al. Optimal Scheduling of Integrated Energy Systems with Multiple CCHPs for High Efficiency and Low Emissions
Nyong-Bassey A Concise Review of Energy Management Strategies for Hybrid Energy Storage Systems

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant