CN114696351A - 一种电池储能系统动态优化方法、装置、电子设备和存储介质 - Google Patents
一种电池储能系统动态优化方法、装置、电子设备和存储介质 Download PDFInfo
- Publication number
- CN114696351A CN114696351A CN202210243348.8A CN202210243348A CN114696351A CN 114696351 A CN114696351 A CN 114696351A CN 202210243348 A CN202210243348 A CN 202210243348A CN 114696351 A CN114696351 A CN 114696351A
- Authority
- CN
- China
- Prior art keywords
- energy storage
- storage system
- battery energy
- power
- time
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004146 energy storage Methods 0.000 title claims abstract description 136
- 238000005457 optimization Methods 0.000 title claims abstract description 74
- 238000000034 method Methods 0.000 title claims abstract description 58
- 230000009471 action Effects 0.000 claims abstract description 45
- 238000007599 discharging Methods 0.000 claims abstract description 25
- 230000003993 interaction Effects 0.000 claims abstract description 23
- 230000005611 electricity Effects 0.000 claims abstract description 12
- 230000006870 function Effects 0.000 claims description 34
- 238000005070 sampling Methods 0.000 claims description 13
- 230000032683 aging Effects 0.000 claims description 10
- 238000010276 construction Methods 0.000 claims description 5
- 230000005540 biological transmission Effects 0.000 claims description 3
- 230000007704 transition Effects 0.000 claims description 3
- 230000008569 process Effects 0.000 description 10
- 238000004422 calculation algorithm Methods 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 6
- 230000002787 reinforcement Effects 0.000 description 6
- 230000006399 behavior Effects 0.000 description 5
- 230000008901 benefit Effects 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000012983 electrochemical energy storage Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02J—CIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
- H02J3/00—Circuit arrangements for ac mains or ac distribution networks
- H02J3/28—Arrangements for balancing of the load in a network by storage of energy
- H02J3/32—Arrangements for balancing of the load in a network by storage of energy using batteries with converting means
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
- G06Q10/06313—Resource planning in a project environment
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02J—CIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
- H02J3/00—Circuit arrangements for ac mains or ac distribution networks
- H02J3/28—Arrangements for balancing of the load in a network by storage of energy
- H02J3/32—Arrangements for balancing of the load in a network by storage of energy using batteries with converting means
- H02J3/322—Arrangements for balancing of the load in a network by storage of energy using batteries with converting means the battery being on-board an electric or hybrid vehicle, e.g. vehicle to grid arrangements [V2G], power aggregation, use of the battery for network load balancing, coordinated or cooperative battery charging
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2111/00—Details relating to CAD techniques
- G06F2111/04—Constraint-based CAD
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02J—CIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
- H02J2203/00—Indexing scheme relating to details of circuit arrangements for AC mains or AC distribution networks
- H02J2203/20—Simulating, e g planning, reliability check, modelling or computer assisted design [CAD]
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Evolutionary Computation (AREA)
- Marketing (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Power Engineering (AREA)
- Health & Medical Sciences (AREA)
- Entrepreneurship & Innovation (AREA)
- Geometry (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Health & Medical Sciences (AREA)
- Public Health (AREA)
- General Engineering & Computer Science (AREA)
- Primary Health Care (AREA)
- Computer Hardware Design (AREA)
- Software Systems (AREA)
- Medical Informatics (AREA)
- Water Supply & Treatment (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biodiversity & Conservation Biology (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- Artificial Intelligence (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Supply And Distribution Of Alternating Current (AREA)
Abstract
本发明提出一种电池储能系统动态优化方法、装置、电子设备和存储介质,属于电力系统运行和控制技术领域。其中,所述方法包括:将电池储能系统的能量状态、所述电池储能系统所在电网和大电网之间的交互功率、电价、所述电池储能系统所在电网和所述大电网交互的设定功率构成状态变量,将各节点发电机有功功率、所述电池储能系统的充电功率和放电功率构成动作变量,建立电池储能系统优化模型;构建关于状态变量和动作变量的奖励函数;求解优化模型求解,得到各时刻的所述动作变量即为所述电池储能系统的优化结果。本发明运速度快,可实现对电池储能实时优化,提高电网提供辅助服务的能力,提升电网的运行效率。
Description
技术领域
本发明属于电力系统运行和控制技术领域,特别涉及一种电池储能系统动态优化方法、装置、电子设备和存储介质。
背景技术
随着电动汽车使用数量的不断增加,未来电动汽车将广泛接入电网。电动汽车的充电和放电行为将对电网产生不可忽视的影响,这既是挑战也是机遇。电动汽车电池的使用寿命与充放电功率密切相关,不合理的充放电功率将缩短电池使用寿命,同时会增加电池起火的安全风险。由于电动汽车的数量急剧增加,大规模电动汽车接入电网后对电网会造成冲击,导致配电网线路过载、电压跌落、配电网损耗增加、配电变压器过载等一系列问题,甚至会超出局部配电网的承受能力,给电网安全运行带来隐患,因此有必要通过对电动汽车的使用规律和使用特性进行分析,并对电动汽车的充放电模式进行建模,进而合理规划和设计充电站的地理位置和容量,提高电网的安全裕度。
电动汽车的出现通常需要建造储能电站。储能电站的建设可以缓解电网的供电缺口,提高设备的利用效率,以满足短期最大负荷。在许多储能技术路线中,电化学储能装置的响应时间为毫秒级,与水电、火电等常规功率调节方法相比具有很大的技术优势。电池储能电站具有跟踪负荷变化能力强、响应速度快、控制准确、双向调节和调峰填谷双重功能,是重要的调峰电源。未来,能量接入的形式主要分布在虚拟电厂中。因此,电力系统必须响应传统服务不断变化的需求,为能源资源共享和平衡创造新的机会。将数百万用户拥有的发电机和储能系统互连所形成的网络可以作为一个平台,帮助匹配供需,减少能源投资的低效重复。因此,如何将电池储能系统有效地集成到虚拟电厂中是一个迫切需要研究的问题。
然而,电池储能系统的运行过程是多阶段、动态的,并且电池的寿命与其充放电行为密切相关。在储能系统的长期优化运行中,电池的老化成本不容忽视。如果将电池的老化成本考虑到优化模型中,将导致电池储能优化问题变得非凸且难以处理。为了应对这些挑战,基于强化学习的先进控制技术被广泛应用于储能系统的优化运行中。电网中的强化学习算法是一种基于与电网环境交互信息的决策方法,有利于虚拟电厂中的最优控制。演员-评论家算法是强化学习方法的一种,它包含两个部分:一个是策略梯度,另一个是时序差分学习。通过评论家的打分和演员的决策之间的互动,学习过程得以进行。演员-评论家算法的结构用来指导储能系统的充放电行为,然而传统演员-评论家方法存在不确定性建模复杂、收敛性差以及状态空间过大导致求解困难等问题,对于实际技术应用造成的的缺陷。
发明内容
本发明的目的是为克服已有技术的不足之处,提出一种电池储能系统动态优化方法、装置、电子设备和存储介质。本发明通过将电池储能系统调度过程建模成多阶段随机优化模型,提出了一种改进的双延迟深度确定性策略梯度算法,通过改进强化学习过程中样本的抽样策略,减少搜索空间,加快收敛速度,运算速度快,占用计算资源少,特别适合含大规模电网拓扑的优化运算,不仅可以对电池储能进行实时优化,还能提高电网提供辅助服务的能力,提高电网的运行效率。
本发明第一方面实施例提出一种电池储能系统动态优化方法,包括:
1)将电池储能系统的能量状态、所述电池储能系统所在电网和大电网之间的交互功率、电价、所述电池储能系统所在电网和所述大电网交互的设定功率构成状态变量,将各节点发电机有功功率、所述电池储能系统的充电功率和放电功率构成动作变量,建立电池储能系统优化模型;
2)构建关于所述状态变量和所述动作变量的奖励函数;
3)根据所述优化模型和所述奖励函数,利用双延迟深度确定性策略梯度方法对所述优化模型求解,得到各时刻的所述动作变量即为所述电池储能系统的优化结果。
在本发明的一个具体实施例中,所述建立电池储能系统优化模型,包括:
1-1)建立电池储能系统优化模型的目标函数:
其中,t为时间决策变量,st为t时刻的状态,at为t时刻的动作,R(st+i,at+i)为在状态st+i下采取动作at+i所产生的奖励,Pr为转移概率,γ为衰减系数;为与条件概率Prt+i|Prt+i-1相关的期望值,上标代表随机变量;
其中,定义t时刻的动作at和状态st如下:
其中,Pgi,t为节点i在t时刻的发电机有功功率;分别为t时刻电池储能系统的充电功率和放电功率;Et为t时刻电池储能系统的能量状态,P0,t为t时刻电池储能系统所在电网和大电网之间的交互功率,ct为t时刻实时电价,为t时刻电池储能系统所在电网和大电网交互的设定功率;
1-2)建立电池储能系统优化模型的约束条件,具体如下:
1-2-1)线性化DistFlow潮流模型约束;
其中,i、j和k均为电池储能系统所在电网的节点,Pki,t和Qki,t分别为支路(k,i)在t时刻的有功功率和无功功率,Vk,t和Vi,t分别为节点k和节点i在t时刻的电压幅值,Pli,t和Qli,t分别为节点i在t时刻的负载有功功率和负载无功功率,Pgi,t和Qgi,t分别为节点i在t时刻的发电机有功功率和发电机无功功率,rki和xki分别为支路(k,i)的电阻和电抗;T为优化的时刻集合,N为电池储能系统所在电网的所有节点集合;
1-2-2)并网点功率约束;
1-2-3)虚拟电厂的运行约束;
1-2-4)电池储能充放电和老化模型约束;
其中,Et为t时刻电池储能系统的能量状态,ηch,ηdis分别为电池储能系统充电小女和放电效率,CN为直到电池报废的电池循环次数,ε为可调系数,Emax为电池储能系统的最大容量,VB为电池的电压水平,Et ,分别为t时刻电池储能系统能量状态的下限和上限。
在本发明的一个具体实施例中,所述奖励函数表达式如下:
Rt(st,at)=α1R1,t(st,at)+α2R2,t(st,at)+α3R3,t(st,at)+α4R4,t(st,at)+α5R5,t(st,at) (15)
其中,Rt为t时刻的奖励函数,αi为第i项权重系数,i=1,2,3,4,5;
其中,ai,bi,ci分别为发电机i的二次项成本系数、一次项成本系数和常数项成本系数,ΩG为发电机的集合;
其中,c1,t,c2,t分别为利用分时电价产生的收益系数,Δt为间隔时间;
其中,Lt,C分别为电池储能系统生命周期吞吐量和电池储能系统投资成本;
R1,t(st,at)和R2,t(st,at)分别为t时刻发电机的运行成本和储能的运行成本,R3,t(st,at)为t时刻系统跟踪和大电网交互功率的误差成本,R4,t(st,at)为t时刻电压越界的惩罚成本,R5,t(st,at)为t时刻电池储能系统的老化成本。
在本发明的一个具体实施例中,所述根据所述优化模型和所述奖励函数,利用双延迟深度确定性策略梯度方法对所述优化模型求解,得到各时刻的所述动作变量即为所述电池储能系统的优化结果,包括:
分别建立两个actor网络和两个critic网络,表达式如下:
其中,actor网络根据状态st输出t时刻动作at,目标actor网络根据t+1时刻的状态st+1输出t时刻目标动作critic网络根据动作at和状态st计算critic目标网络根据目标动作和下一个状态St+1计算 和θi分别为actor网络和第i个critic网络的参数,和θ′i分别为actor目标网络和critic目标网络的参数;
其中,各网络的参数更新表达式如下:
θ′i←αθ′i+(1-α)θi (26)
在当前时刻结束后,更新经验池,表达式如下:
D←D∪{(st,at,Rt,st+1)} (27)
经验池更新后,对经验池的样本进行采样,利用采样得到的样本在下一个当前时刻更新网络;其中,第m个样本的采样概率为:
其中,ym是通过式(22)计算的第m个样本的目标Q值,Qm(s,a)是第m个样本的当前Q值,n为样本总数;
每个当前时刻的动作at即为当前时刻的优化结果;所述优化结果中包括当前时刻电池储能系统的充电功率和放电功率,以实现电池储能系统的动态优化。
本发明第二方面实施例提出一种电池储能系统动态优化装置,包括:
优化模型构建模块,用于将电池储能系统的能量状态、所述电池储能系统所在电网和大电网之间的交互功率、电价、所述电池储能系统所在电网和所述大电网交互的设定功率构成状态变量,将各节点发电机有功功率、所述电池储能系统的充电功率和放电功率构成动作变量,建立电池储能系统优化模型;
奖励函数构建模块,用于构建关于所述状态变量和所述动作变量的奖励函数;
求解模块,用于根据所述优化模型和所述奖励函数,利用双延迟深度确定性策略梯度方法对所述优化模型求解,得到各时刻的所述动作变量即为所述电池储能系统的优化结果。
本发明第三方面实施例提出一种电子设备,包括:
至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;
其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被设置为用于执行上述一种电池储能系统动态优化方法。
本发明第四方面实施例提出一种计算机可读存储介质,所述计算机可读存储介质存储计算机指令,所述计算机指令用于使所述计算机执行上述一种电池储能系统动态优化方法。
本发明的优点及有益效果在于:
1.本发明采用改进的双延迟深度确定性策略梯度方法,对电池储能系统进行精细化建模,将储能的老化成本考虑到优化运行中,改进了传统强化学习的经验池的随机搜索策略。相较于现有的基于强化学习的电网优化方法,本发明的求解空间大幅降低,求解速度显著提高,更适合部署在实际电力系统中。
2.本发明采用了改进的柔性演员评论家算法对储能系统进行优化调度,在奖励函数的设计中考虑多种因素对于电池充放电行为的影响,将电池储能系统调度过程建模成多阶段随机优化问题,不仅可以对电池储能进行实时优化,还能提高电网提供辅助服务的能力,提高电网的运行效率。
附图说明
图1为本发明实施例提出的一种电池储能系统动态优化方法的整体流程图。
具体实施方式
本发明实施例提出的一种电池储能系统动态优化方法、装置、电子设备和存储介质,下面结合附图和具体实施例进一步详细说明如下。
本发明第一方面实施例提出一种电池储能系统动态优化方法,整体流程如图1所示,包括以下步骤:
1)建立电池储能系统优化模型,该模型由目标函数和约束条件构成;具体步骤如下:
1-1)建立电池储能系统优化模型的目标函数,表达式如下:
其中,t为时间决策变量,st为t时刻的状态,at为t时刻的动作,R(st+i,at+i)为在状态st+i下采取动作at+i所产生的奖励,Pr为转移概率,γ为衰减系数。为与条件概率Prt+i|Prt+i-1相关的期望值,上标是为了区分确定性变量和随机变量,因为是相当于决策时间t来说的未来的未知状态,所以被建模成随机变量。
在本实施例的强化问题中,定义t时刻的动作at和状态st如下:
其中,Pgi,t为节点i(发电机节点)在t时刻的发电机有功功率;分别为t时刻电池储能系统的充电和放电功率;Et为t时刻电池储能系统的能量状态,P0,t为t时刻电池储能系统所在电网和大电网之间的交互功率,ct为t时刻实时电价,为t时刻电池储能系统所在电网和大电网交互的设定功率。
1-2)建立电池储能系统优化模型的约束条件,具体如下:
1-2-1)LinearizedDistFlow(线性化DistFlow)潮流模型约束;
其中,i、j和k均为电池储能系统所在电网的节点,,Pki,t和Qki,t分别为支路(k,i)在t时刻的有功功率和无功功率,Vk,t和Vi,t分别为节点k和节点i在t时刻的电压幅值,Pli,t和Qli,t分别为节点i在t时刻的负载有功功率和负载无功功率,Pgi,t和Qgi,t分别为节点i在t时刻的发电机有功功率和发电机无功功率,rki和xki分别为支路(k,i)的电阻和电抗。T为优化的时刻集合,N为电池储能系统所在电网的所有节点集合。
1-2-2)并网点功率约束;
1-2-3)虚拟电厂的运行约束;
1-2-4)电池储能充放电和老化模型约束;
其中,Et为t时刻电池储能系统的能量状态,ηch,ηdis分别为电池储能系统充电和放电效率,CN为直到电池报废的电池循环次数,ε为可调系数(本实施例的具体值为),Emax为电池储能系统的最大容量,VB为电池的电压水平,Et ,分别为t时刻电池储能系统能量状态的下限和上限。
式(11)描述了电池储能系统的充放电过程,式(13)描述了电池储能系统的寿命吞吐量,式(14)描述了电池储能系统的老化水平。
2)根据步骤1)建立的优化模型,结合仿真模型,定义奖励函数;
Rt(st,at)=α1R1,t(st,at)+α2R2,t(st,at)+α3R3,t(st,at)+α4R4,t(st,at)+α5R5,t(st,at) (15)
其中,Rt为t时刻的奖励函数,αi(i=1,2,3,4,5)为第i项的权重系数(本实施例分别为0.1、0.05、0.07、0.05和0.05),权重系数为自动调参结果,实施例表明权重系数只有数量级发生变化的时候优化结果才有显著变化,具体的定义如下:
其中,ai,bi,ci分别为发电机i的二次项成本系数、一次项成本系数和常数项成本系数,ΩG为发电机的集合。
其中,c1,t,c2,t分别为利用分时电价产生的收益系数,Δt为间隔时间。
其中,Lt,C分别为电池储能系统生命周期吞吐量和电池储能系统投资成本。
R1,t(st,at)和R2,t(st,at)分别为t时刻发电机的运行成本和储能的运行成本,R3,t(st,at)为t时刻系统跟踪和大电网交互功率的误差成本,R4,t(st,at)为t时刻电压越界的惩罚成本,R5,t(st,at)为t时刻电池储能系统的老化成本。
3)对优化模型求解;
3-1)本发明实施例采用改进的双延迟深度确定性策略梯度求解方法,包含两个critic网络用于对动作进行评估,并选取更小的Q值来更新:
其中,actor网络根据状态st输出当前的动作at。目标actor网络根据t+1时刻的状态st+1输出t时刻目标动作critic网络根据动作at和状态st计算(值函数网络),critic目标网络根据目标动作和下一个状态st+1计算(值函数网络)。和θi分别为actor网络和第i个critic网络的参数,和θ′i分别为actor目标网络和critic目标网络的参数。本实施例中,各网络初始参数均为随机初始化。
式(21)通过最小化损失来学习最优策略对应的行为值函数式(22)是用贝尔曼方程算出两个动作的估值,并取最小值,式(23)添加了小方差的噪声到目标策略中并平均小批次更新动作期望值,表示ε噪声服从截断的正态分布,(-c,c)为截断区间。
各网络的参数更新公式如下:
θ′i←αθ′i+(1-α)θi (26)
3-2)利用改进传统的双延迟深度确定性策略梯度算法的抽样策略;
传统方法将经验数据存在经验池中D,在t=t+1,重新获取电网运行状态信息st+1,利用计算回馈变量值Rt,并采用随机抽样策略来更新神经网络参数,随机抽样策略不能保证采样数据的质量。
在本发明实施例中,在经验池中,有更高的值的数据理当被选取,经验池的更新表达式如下:
D←D∪{(st,at,Rt,st+1)} (27)
因此本发明定义样本采样概率,第m个样本的采样概率:
其中,ym是通过式(22)计算的第m个样本的目标Q值,Qm(s,a)是第m个样本的当前Q值,n为样本总数。
采样完成返回步骤3)重复运行。
本实施例的求解过程是从初始化以后就利用当前Q值网络不断输出当前时刻的动作at即为当下的优化结果,同时不断更新各个网络用于之后的优化。
各时刻的动作at即为本实施例所得到的优化结果,根据电池储能系统当前时刻的状态,得到每一个时刻的电池储能系统的充放电功率,即完成电池储能系统的动态优化。
为实现上述实施例,本发明第二方面实施例提出一种电池储能系统动态优化装置,包括:
优化模型构建模块,用于将电池储能系统的能量状态、所述电池储能系统所在电网和大电网之间的交互功率、电价、所述电池储能系统所在电网和所述大电网交互的设定功率构成状态变量,将各节点发电机有功功率、所述电池储能系统的充电功率和放电功率构成动作变量,建立电池储能系统优化模型;
奖励函数构建模块,用于构建关于所述状态变量和所述动作变量的奖励函数;
求解模块,用于根据所述优化模型和所述奖励函数,利用双延迟深度确定性策略梯度方法对所述优化模型求解,得到各时刻的所述动作变量即为所述电池储能系统的优化结果。
为实现上述实施例,本发明第三方面实施例提出一种电子设备,包括:
至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;
其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被设置为用于执行上述一种电池储能系统动态优化方法。
为实现上述实施例,本发明第四方面实施例一种计算机可读存储介质,所述计算机可读存储介质存储计算机指令,所述计算机指令用于使所述计算机执行上述一种电池储能系统动态优化方法。
需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备执行上述实施例的一种电池储能系统动态优化方法。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本申请的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本申请的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本申请的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得程序,然后将其存储在计算机存储器中。
应当理解,本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本申请各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本申请的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本申请的限制,本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。
Claims (7)
1.一种电池储能系统动态优化方法,其特征在于,包括:
1)将电池储能系统的能量状态、所述电池储能系统所在电网和大电网之间的交互功率、电价、所述电池储能系统所在电网和所述大电网交互的设定功率构成状态变量,将各节点发电机有功功率、所述电池储能系统的充电功率和放电功率构成动作变量,建立电池储能系统优化模型;
2)构建关于所述状态变量和所述动作变量的奖励函数;
3)根据所述优化模型和所述奖励函数,利用双延迟深度确定性策略梯度方法对所述优化模型求解,得到各时刻的所述动作变量即为所述电池储能系统的优化结果。
2.根据权利要求1所述的优化方法,其特征在于,所述建立电池储能系统优化模型,包括:
1-1)建立电池储能系统优化模型的目标函数:
其中,t为时间决策变量,st为t时刻的状态,at为t时刻的动作,R(st+i,at+i)为在状态st+i下采取动作at+i所产生的奖励,Pr为转移概率,γ为衰减系数;为与条件概率Prt+i|Prt+i-1相关的期望值,上标代表随机变量;
其中,定义t时刻的动作at和状态st如下:
其中,Pgi,t为节点i在t时刻的发电机有功功率;分别为t时刻电池储能系统的充电功率和放电功率;Et为t时刻电池储能系统的能量状态,P0,t为t时刻电池储能系统所在电网和大电网之间的交互功率,ct为t时刻实时电价,为t时刻电池储能系统所在电网和大电网交互的设定功率;
1-2)建立电池储能系统优化模型的约束条件,具体如下:
1-2-1)线性化DistFlow潮流模型约束;
其中,i、j和k均为电池储能系统所在电网的节点,Pki,t和Qki,t分别为支路(k,i)在t时刻的有功功率和无功功率,Vk,t和Vi,t分别为节点k和节点i在t时刻的电压幅值,Pli,t和Qli,t分别为节点i在t时刻的负载有功功率和负载无功功率,Pgi,t和Qgi,t分别为节点i在t时刻的发电机有功功率和发电机无功功率,rki和xki分别为支路(k,i)的电阻和电抗;T为优化的时刻集合,N为电池储能系统所在电网的所有节点集合;
1-2-2)并网点功率约束;
1-2-3)虚拟电厂的运行约束;
1-2-4)电池储能充放电和老化模型约束;
3.根据权利要求2所述的优化方法,其特征在于,所述奖励函数表达式如下:
Rt(st,at)=α1R1,t(st,at)+α2R2,t(st,at)+α3R3,t(st,at)+α4R4,t(st,at)+α5R5,t(st,at) (15)
其中,Rt为t时刻的奖励函数;αi为第i项权重系数,i=1,2,3,4,5;
其中,ai,bi,ci分别为发电机i的二次项成本系数、一次项成本系数和常数项成本系数,ΩG为发电机的集合;
其中,c1,t,c2,t分别为利用分时电价产生的收益系数,Δt为间隔时间;
其中,Lt,C分别为电池储能系统生命周期吞吐量和电池储能系统投资成本;
R1,t(st,at)和R2,t(st,at)分别为t时刻发电机的运行成本和储能的运行成本,R3,t(st,at)为t时刻系统跟踪和大电网交互功率的误差成本,R4,t(st,at)为t时刻电压越界的惩罚成本,R5,t(st,at)为t时刻电池储能系统的老化成本。
4.根据权利要求3所述的优化方法,其特征在于,所述根据所述优化模型和所述奖励函数,利用双延迟深度确定性策略梯度方法对所述优化模型求解,得到各时刻的所述动作变量即为所述电池储能系统的优化结果,包括:
分别建立两个actor网络和两个critic网络,表达式如下:
其中,actor网络根据状态st输出t时刻动作at,目标actor网络根据t+1时刻的状态st+1输出t时刻目标动作critic网络根据动作at和状态st计算critic目标网络根据目标动作和下一个状态st+1计算 和θi分别为actor网络和第i个critic网络的参数,和θi′分别为actor目标网络和critic目标网络的参数;
其中,各网络的参数更新表达式如下:
θ′i←αθ′i+(1-α)θi (26)
在当前时刻结束后,更新经验池,表达式如下:
D←D∪{(st,at,Rt,st+1)} (27)
经验池更新后,对经验池的样本进行采样,利用采样得到的样本在下一个当前时刻更新网络;其中,第m个样本的采样概率为:
其中,ym是通过式(22)计算的第m个样本的目标Q值,Qm(s,a)是第m个样本的当前Q值,n为样本总数;
每个当前时刻的动作at即为当前时刻的优化结果;所述优化结果中包括当前时刻电池储能系统的充电功率和放电功率,以实现电池储能系统的动态优化。
5.一种电池储能系统动态优化装置,其特征在于,包括:
优化模型构建模块,用于将电池储能系统的能量状态、所述电池储能系统所在电网和大电网之间的交互功率、电价、所述电池储能系统所在电网和所述大电网交互的设定功率构成状态变量,将各节点发电机有功功率、所述电池储能系统的充电功率和放电功率构成动作变量,建立电池储能系统优化模型;
奖励函数构建模块,用于构建关于所述状态变量和所述动作变量的奖励函数;
求解模块,用于根据所述优化模型和所述奖励函数,利用双延迟深度确定性策略梯度方法对所述优化模型求解,得到各时刻的所述动作变量即为所述电池储能系统的优化结果。
6.一种电子设备,其特征在于,包括:
至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;
其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被设置为用于执行上述权利要求1-4任一项所述的方法。
7.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储计算机指令,所述计算机指令用于使所述计算机执行权利要求1-4任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210243348.8A CN114696351A (zh) | 2022-03-11 | 2022-03-11 | 一种电池储能系统动态优化方法、装置、电子设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210243348.8A CN114696351A (zh) | 2022-03-11 | 2022-03-11 | 一种电池储能系统动态优化方法、装置、电子设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114696351A true CN114696351A (zh) | 2022-07-01 |
Family
ID=82138832
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210243348.8A Pending CN114696351A (zh) | 2022-03-11 | 2022-03-11 | 一种电池储能系统动态优化方法、装置、电子设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114696351A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115313447A (zh) * | 2022-10-10 | 2022-11-08 | 深圳先进技术研究院 | 一种混合储能系统充放电状态实时优化控制方法 |
CN115864611A (zh) * | 2023-02-24 | 2023-03-28 | 国网浙江省电力有限公司宁波市北仑区供电公司 | 储能电池安全储能管理方法、系统、设备及存储介质 |
CN115953011A (zh) * | 2023-03-10 | 2023-04-11 | 中国铁塔股份有限公司 | 通信基站储能资源调度方法及设备 |
CN116169702A (zh) * | 2023-04-26 | 2023-05-26 | 江苏为恒智能科技有限公司 | 基于强化学习算法的大规模储能预测模型及充放电策略 |
CN116937631A (zh) * | 2023-09-18 | 2023-10-24 | 众至诚信息技术股份有限公司 | 一种基于数据处理的电能存储管理系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109687530A (zh) * | 2019-01-08 | 2019-04-26 | 南京工程学院 | 一种考虑阻塞和储能分时电价的电网混合滚动调度方法 |
US20210350049A1 (en) * | 2020-05-11 | 2021-11-11 | International Business Machines Corporation | Optimizing control actions of a control system via automatic dimensionality reduction of a mathematical representation of the control system |
CN113972645A (zh) * | 2021-10-18 | 2022-01-25 | 南京工程学院 | 基于多智能体深度确定策略梯度算法的配电网优化方法 |
CN114123256A (zh) * | 2021-11-02 | 2022-03-01 | 华中科技大学 | 一种适应随机优化决策的分布式储能配置方法及系统 |
-
2022
- 2022-03-11 CN CN202210243348.8A patent/CN114696351A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109687530A (zh) * | 2019-01-08 | 2019-04-26 | 南京工程学院 | 一种考虑阻塞和储能分时电价的电网混合滚动调度方法 |
US20210350049A1 (en) * | 2020-05-11 | 2021-11-11 | International Business Machines Corporation | Optimizing control actions of a control system via automatic dimensionality reduction of a mathematical representation of the control system |
CN115605817A (zh) * | 2020-05-11 | 2023-01-13 | 国际商业机器公司(Us) | 经由控制系统的数学表示的自动降维优化控制系统的控制动作 |
CN113972645A (zh) * | 2021-10-18 | 2022-01-25 | 南京工程学院 | 基于多智能体深度确定策略梯度算法的配电网优化方法 |
CN114123256A (zh) * | 2021-11-02 | 2022-03-01 | 华中科技大学 | 一种适应随机优化决策的分布式储能配置方法及系统 |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115313447A (zh) * | 2022-10-10 | 2022-11-08 | 深圳先进技术研究院 | 一种混合储能系统充放电状态实时优化控制方法 |
CN115864611A (zh) * | 2023-02-24 | 2023-03-28 | 国网浙江省电力有限公司宁波市北仑区供电公司 | 储能电池安全储能管理方法、系统、设备及存储介质 |
CN115864611B (zh) * | 2023-02-24 | 2023-08-08 | 国网浙江省电力有限公司宁波市北仑区供电公司 | 储能电池安全储能管理方法、系统、设备及存储介质 |
CN115953011A (zh) * | 2023-03-10 | 2023-04-11 | 中国铁塔股份有限公司 | 通信基站储能资源调度方法及设备 |
CN116169702A (zh) * | 2023-04-26 | 2023-05-26 | 江苏为恒智能科技有限公司 | 基于强化学习算法的大规模储能预测模型及充放电策略 |
CN116169702B (zh) * | 2023-04-26 | 2023-08-11 | 江苏为恒智能科技有限公司 | 一种基于强化学习算法的大规模储能充放电方法以及模型 |
CN116937631A (zh) * | 2023-09-18 | 2023-10-24 | 众至诚信息技术股份有限公司 | 一种基于数据处理的电能存储管理系统 |
CN116937631B (zh) * | 2023-09-18 | 2023-11-21 | 众至诚信息技术股份有限公司 | 一种基于数据处理的电能存储管理系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Luo et al. | Short‐term operational planning framework for virtual power plants with high renewable penetrations | |
CN114696351A (zh) | 一种电池储能系统动态优化方法、装置、电子设备和存储介质 | |
Kuznetsova et al. | Reinforcement learning for microgrid energy management | |
Mir et al. | Employing a Gaussian Particle Swarm Optimization method for tuning Multi Input Multi Output‐fuzzy system as an integrated controller of a micro‐grid with stability analysis | |
Salkuti | Day-ahead thermal and renewable power generation scheduling considering uncertainty | |
Machlev et al. | A review of optimal control methods for energy storage systems-energy trading, energy balancing and electric vehicles | |
JP2017187371A (ja) | 気象予測装置及び風力発電所 | |
CN113962446B (zh) | 一种微电网群协同调度方法、装置、电子设备和存储介质 | |
Varzaneh et al. | Optimal energy management for PV‐integrated residential systems including energy storage system | |
Gabbar et al. | Performance optimization of integrated gas and power within microgrids using hybrid PSO–PS algorithm | |
CN116169698A (zh) | 一种新能源平稳消纳的分布式储能优化配置方法及系统 | |
Zhang et al. | Physical-model-free intelligent energy management for a grid-connected hybrid wind-microturbine-PV-EV energy system via deep reinforcement learning approach | |
CN117833285A (zh) | 一种基于深度强化学习的微电网储能优化调度方法 | |
Härtel et al. | Minimizing energy cost in pv battery storage systems using reinforcement learning | |
Zhang et al. | Optimal energy management of hybrid power system with two-scale dynamic programming | |
CN112952831B (zh) | 一种负荷侧储能提供堆叠服务的日内优化运行策略 | |
Liu et al. | Deep reinforcement learning for real-time economic energy management of microgrid system considering uncertainties | |
Ren et al. | Bayesian network based real-time charging scheduling of electric vehicles | |
CN117879059A (zh) | 新能源电网的优化调度方法、装置、计算机设备及介质 | |
CN115360717B (zh) | 用于综合能源的配电网调度方法、系统、设备及介质 | |
CN107016470A (zh) | 风力发电场风能预测方法和装置 | |
CN111799820A (zh) | 一种电力系统双层智能混合零星云储能对抗调控方法 | |
Kou et al. | Transmission constrained economic dispatch via interval optimization considering wind uncertainty | |
Die et al. | Optimal approach in the EMS of microgrids based on online forecasts | |
Sage et al. | Economic Battery Storage Dispatch with Deep Reinforcement Learning from Rule-Based Demonstrations |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |