CN113346543B - 一种分布式微网电压多层协同控制方法 - Google Patents

一种分布式微网电压多层协同控制方法 Download PDF

Info

Publication number
CN113346543B
CN113346543B CN202110620175.2A CN202110620175A CN113346543B CN 113346543 B CN113346543 B CN 113346543B CN 202110620175 A CN202110620175 A CN 202110620175A CN 113346543 B CN113346543 B CN 113346543B
Authority
CN
China
Prior art keywords
voltage
state
voltage control
layer
control system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110620175.2A
Other languages
English (en)
Other versions
CN113346543A (zh
Inventor
殷林飞
罗仕逵
邱耀
高放
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangxi University
Original Assignee
Guangxi University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangxi University filed Critical Guangxi University
Priority to CN202110620175.2A priority Critical patent/CN113346543B/zh
Publication of CN113346543A publication Critical patent/CN113346543A/zh
Application granted granted Critical
Publication of CN113346543B publication Critical patent/CN113346543B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J3/00Circuit arrangements for ac mains or ac distribution networks
    • H02J3/38Arrangements for parallely feeding a single network by two or more generators, converters or transformers
    • H02J3/381Dispersed generators
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J3/00Circuit arrangements for ac mains or ac distribution networks
    • H02J3/12Circuit arrangements for ac mains or ac distribution networks for adjusting voltage in ac networks by changing a characteristic of the network load
    • H02J3/16Circuit arrangements for ac mains or ac distribution networks for adjusting voltage in ac networks by changing a characteristic of the network load by adjustment of reactive power
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J2203/00Indexing scheme relating to details of circuit arrangements for AC mains or AC distribution networks
    • H02J2203/20Simulating, e g planning, reliability check, modelling or computer assisted design [CAD]
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02EREDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
    • Y02E40/00Technologies for an efficient electrical power generation, transmission or distribution
    • Y02E40/30Reactive power compensation

Landscapes

  • Engineering & Computer Science (AREA)
  • Power Engineering (AREA)
  • Feedback Control In General (AREA)

Abstract

本发明提供一种分布式微网电压多层协同控制方法,该方法能解决目前微网电压控制中存在的能源响应灵活性不足与决策优化不充分的问题。首先,提出分布式微网电压多层协同控制框架将微网分为四个电压调控层。所提框架采用改进的执行依赖双启发式动态规划方法对电压控制系统的第一层执行调度;采用一致性方法对电压控制系统的第二层进行优化;采用线性优化方法对电压控制系统的第三层进行调度;采用量子多智能体协同强化学习对电压控制系统的第四层执行决策。所提分布式微网电压多层协同控制方法,对电压控制系统进行调度时考虑了不同层能源调节特性以及不同层能源策略的协调,能够优化电压控制的响应灵活性和决策准确性。

Description

一种分布式微网电压多层协同控制方法
技术领域
本发明属于电力系统电压控制领域,涉及多层协同的电压控制方法,适用于电力系统与微网的电压控制。
背景技术
随着电网规模增大,系统运行工况复杂导致无功功率增加了随机性,对电力系统的电压稳定调节形成了挑战。其次,随着用户用电质量要求的提高,电网对电压合格率的考核也提出了更高的要求。传统的电压控制方式由于缺少考虑可再生能源大规模并网导致的无功功率的随机、大幅扰动,且受限于无功响应灵活性不足,难适应电压质量优质和经济地调度目的。
根据优化控制的周期和目标不同,电压控制分为一次电压控制,二次电压控制和三次电压控制。针对不同的电压控制目标,电压控制方面涌现了许多研究;如基于比例-积分-微分调节控制的灰色预测理论,基于数学优化方法以及非洲水牛优化方法应用于自动电压调节。然而,这些方法受限于方法静态参数的设置,当系统发生改变,使用同样的参数获得的结果将失去最优性。传统数学解析式方法过度依赖模型的准确性,与之相对的一些智能方法,如遗传方法、粒子群优化方法、灰狼方法、飞蛾扑火方法和蜻蜓方法,强化学习,深度神经网络等在求解问题时,不需要建立系统准确的解析式模型。智能方法通过拟合数据特征得到系统的解,从而提高系统求解的准确性。
由于启发式方法的近似求解特性,在求解组合问题时能够降低问题状态规模,结合启发式方法的电压控制策略提高了求解的效率。由于具有适应系统状态、实现策略自动更新的能力,强化学习方法能应用于解决电网电压控制问题。由于具有对离散动作过程和连续动作过程系统的学习策略的连续性,强化学习、深度Q网络、深度确定性策略梯度等的深度强化学习被应用于求解电压控制问题。然而,现有研究中深度学习的网络对系统的适应性缺乏关注,强化学习部分对强化学习的计算效率缺乏关注,这些情况会导致求解方法维数灾问题,影响系统要求的实时性。
发明内容
本发明提出一种分布式微网电压多层协同控制方法,该方法将微网分为四个电压调控层,并采用四种相互协调的优化方法对微网电压进行实时调度与控制;分别采用改进的执行依赖双启发式动态规划方法,一致性方法,线性优化方法以及量子多智能体协同强化学习方法。其中执行依赖双启发式动态规划属于三次电压控制,一致性方法属于二次电压控制,线性优化方法和量子多智能体协同强化学习方法属于一次电压控制。四个调控层方法之间进行联动提高了电压控制质量和降低微网功率损耗。该方法在使用过程中的步骤为:
(1)将目标微网系统电压控制装置按类型和调节方式划分四个调控层;
(2)对电压控制系统的第一层采用改进的执行依赖双启发式动态规划方法优化微网无功装置;
(3)对电压控制系统的第二层采用一致性方法优化决策智能体决策信息同步性;
(4)对电压控制系统的第三层采用线性优化方法;
(5)对电压控制系统的第四层采用量子多智能体协同强化学习方法;
(6)电压控制系统的四层控制中心之间进行通信,并根据相邻层的决策和电压控制系统的状态变量信息优化下一次决策动作。
在分布式微网系统优化中通过设置优化目标函数以满足电压控制的要求。将微网系统一次电压控制表示为线性下垂函数:
ΔQi,t=-ωi(Vi,t-Vi pre) (1)
式中,ΔQi,t为i节点t时刻无功功率增加量,ωi为电压下垂系数,Vi,t为当前电压幅值,Vi pre为预测电压幅值。为降低微网功率损耗,电压控制目标描述为:
Figure GDA0003804214890000021
Figure GDA0003804214890000022
Figure GDA0003804214890000023
ΔQi,t=-ωiΔVi,t (5)
Figure GDA0003804214890000024
Figure GDA0003804214890000025
式(2)中Ni为节点集合,Pi loss为节点i的网络损耗,式(3)为功率平衡约束,Si,j表示流入/流出i节点t时刻的功率,式(6)为电压约束,Vi
Figure GDA0003804214890000026
分别为电压上限和下限,式(7)为无功约束,Q i
Figure GDA0003804214890000027
分别为功率上限和下限。
动态规划是求解随机,非线性系统的一种有效方法,但是在实际应用中却因为求解状态变量增多而导致计算复杂,甚至产生维数灾。而自适应动态规划建立神经网络拟合替代系统传统数学解析式模型获取近似解,缓解了因为状态量增加而导致求解维数灾问题,能够有效替代动态规划。将电力系统视为离散非线性系统,系统的状态变量与系统关系描述为
x(t+1)=F[x(t),u(t)] (8)
式中,t为决策时间序列,取t=0,1,2,...,l,x(t)为t时刻状态变量,在电压控制中
Figure GDA0003804214890000031
u(t)为对应t时刻的控制变量,在电压控制中u(t)=[ΔQ1,t,ΔQ2,t,…,ΔQn,t],为了评估控制决策的质量,控制变量的性能指标函数J[x(t)]表示为:
Figure GDA0003804214890000032
式中,U为效用函数或者损失函数,耦合时间差分形式或耦合的Bellman方程损失函数表示为:
J[x(t)]=U[x(t),u(t)]+J[x(t+1)] (10)
式中,根据Bellman最优原则,动态规划从t时刻开始决策的最优成本J*[x(t)]表示为:
Figure GDA0003804214890000033
式中,min()为取极小值。于是,决策控制变量为使得决策成本最小化,表示为:
Figure GDA0003804214890000034
式中,u*(t)为最优控制变量
由式(8)-(12)知道,为获得控制变量最优解,动态规划需要搜索所有x(t+1),并需要获得t+1,t+2,…时刻的最优决策序列。对于一个实际问题来说,动态规划是耗时的而且是难以实现的。自适应动态规划通过自适应评价系统逼近动态规划性能函数,一定程度上缓解了系统因规模增大导致的求解困难问题。许多研究基于自适应动态规划的研究提出了不同的自适应评价系统模型,如启发式动态规划,双启发式规划,全局化双启发式规划,执行依赖启发式动态规划以及执行依赖双启发式动态规划。典型的自适应动态规划的自适应评价系统包含了执行模块,模型模块和评价模块。由于模型模块需要建立对整个系统的拟合,因此模型模块将需要使用大量的计算内存来模拟系统。一些不需要建立系统模型模块的自适应动态规划结构,如执行依赖启发式动态规划和执行依赖双启发式动态规划,在执行依赖启发式动态规划和执行依赖双启发式动态规划的自适应评价系统中仅需要建立执行模块和评价模块两个部分。相比于执行依赖启发式动态规划,基于梯度的时间差分解形式的执行依赖双启发式动态规划在求解问题时对系统的时间灵敏度更为灵敏。因此,执行依赖双启发式动态规划的决策都将会在实时性和准确性上优于执行依赖启发式动态规划。定义执行依赖双启发式动态规划优化的性能指标函数V*[x(t),u(t)]为:
Figure GDA0003804214890000041
式中,u*(t),u*(t+1),u*(t+2),u*(t+3)为最优控制决策,上式改写成:
V*[x(t),u*(t)]=V*[x(t-1),u*(t-1)]-U[x(t),u*(t)] (14)
根据式(14)建立电力系统电压控制的近似模型。为获得式(2)的系统第一层最优控制决策,本发明方法采用改进的执行依赖双启发式动态规划方法优化微网无功装置,采用深度简单循环单元近似损失函数J[x(t)]。当J[x(t)]与性能指标函数V*[x(t),u(t)]之差在误差允许范围内,即认为深度简单循环单元的拟合是准确的。改进的执行依赖双启发式动态规划方法框架包含的执行网络和评价网络采用深度简单循环单元来构建。简单循环单元是循环神经网络的变体,与常用的长短时记忆网络和门控循环单元相比,简单循环单元的计算复杂度更低,并能够有效拟合系统特征。深度简单循环单元由多个简单循环单元层构成,深度结构使得简单循环单元能够拟合更复杂系统特征。深度简单循环单元由多层简单循环单元构成,深度简单循环单元的参数连接关系描述为:
ft=σ(Wfxt+vf⊙ct-1+bf) (15)
ct=ft⊙ct-1+(1-ft)⊙(Wxt) (16)
rt=σ(Wrxt+vr⊙ct-1+br)ht (17)
ht=rt⊙ct+(1-rt)⊙xt (18)
式中,W,Wf和Wr为参数矩阵,vf,vr和br为参数向量,xt为输入变量,ct为状态序列,⊙表示Hadamard乘积。式(15)中遗忘门ft控制信息流,式(16)中状态向量ct根据ft自适应平均前一个状态ct-1和当前观测Wxt。公式(15)和(16)为深度简单循环网络的轻循环部分。轻循环部分通过使用Hadamard乘积和优化参数连接关系减轻循环神经网络参数计算复杂度。公式(17)和(18)为深度简单循环单元的高速网络部分。高速网络部分通过引入门控降低参数反向传播过程计算复杂度,以缓解因网络深度加深导致的梯度信息回流受阻网络训练难进行的问题。
参数更新上,选择Nadam梯度优化方法优化深度简单循环单元网络。随机梯度下降是深度神经网络梯度优化常用的优化方法,随机梯度下降优化抗干扰能力强,但是存在收敛慢,易陷入局部最优的缺点。此外,一些网络梯度优化方法,如RMSprop、Adam、Nadam方法,针对不同的网络优化目标取得了不错的优化效果。其中Nadam基于集成了随机梯度下降的一阶动量和RMSprop二阶动量优点的Adam,较Adam的学习率优化约束更强。
在电压控制系统的第二层,采用一致性方法协调电压调节装备的信息交换,以实现分布式电压控制的一致性。对于电压控制系统的每个智能体,一阶时间连续一致性方法描述为:
Figure GDA0003804214890000051
式中,xi(t)为第i个智能体在t时刻的状态,Ni为智能体集合。对于一阶时间离散的一致性方法,通过马尔科夫链形式xi(t+1)=P(t)x(t),其中P(t)为Ni×Ni的随机数矩阵,且存在[P(t)]ij=pij≥0,
Figure GDA0003804214890000052
则第i个智能体在t+1时刻的状态为:
Figure GDA0003804214890000053
各智能体之间通过信息交换,将相邻智能体的状态信息进行更新迭代,当智能体状态
Figure GDA0003804214890000054
其中
Figure GDA0003804214890000055
为常数,则认为系统达到一致性,此时各智能体状态描述为:
x1=x2=x3...=xn (21)
一致性方法用于电压控制系统的第二层,能够通过在智能体之间交换信息,从而使各智能体间能够进行决策时数据同步和实时性,实现微网系统的经济稳定运行。
在电压控制系统的第三层,采用线性优化方法对第三层电压控制装置进行指令分配。根据微网电压-无功功率下垂控制特性设置第三层调度目标函数为:
Figure GDA0003804214890000056
式中,Ni为节点集合,Ni,k为接入节点i的无功装置集合,ui,k,t为t时刻第k个无功装置状态取值0或1,
Figure GDA0003804214890000057
为t时刻第k个无功装置无功增量,ΔQi,t为i节点t时刻无功增量,ΔQi,t=-ωi(Vi,t-Vi pre),ωi为电压下垂系数,Vi,t为当前电压幅值,Vi pre为预测电压幅值。无功装置的控制策略描述为:
Figure GDA0003804214890000058
式中,ri,k为t时刻第k个无功装置的功率调节系数。
在电压控制系统的第四层,采用量子多智能体协同强化学习方法。强化学习的目标是学习从状态S到动作A之间的一种映射,即,智能体学习的策略为:π:S×Ui∈SA(i)→[0,1],每个状态的期望折扣奖励最大化的目标函数表示为
Figure GDA0003804214890000059
式中,π(s,a)为对应学习策略π根据s选择动作a的概率,
Figure GDA0003804214890000061
为t时刻一步奖励的期望值,γ∈[0,1]为折扣因子,
Figure GDA0003804214890000062
为状态转移的概率,V(s)为状态值函数。
对于状态-动作对,存在相似的值函数和Bellman方程,在策略π根据s采取动作a的值
Figure GDA0003804214890000063
描述为:
Figure GDA0003804214890000064
式中,Q(s,a)为状态值函数,
Figure GDA0003804214890000065
取得最优值目标描述为:
Figure GDA0003804214890000066
对于Q-学习,值函数Q(s,a)的一步更新规则为:
Q(st,at)←(1-α)Q(st,at)+α(rt+1+γmaxa′Q(st+1,a′)) (27)
式中,α为学习率,rt+1为t+1时刻一步奖励的期望值。
然而,强化学习的状态-动作Q值矩阵中,每个状态对应了m个决策动作,因此对于n个状态变量Q值矩阵的规模为n×m;随着系统规模增大,状态变量数量增多将耗费更多的计算资源。因此将量子思想引入强化学习时将有效降低强化学习计算资源需求量。
量子位是组成量子计算的基本单位,与传统位的概念相同,量子位状态取为|0>或|1>。当量子位处于叠加状态时,量子位ψ状态描述为状态|0>或|1>的线性组合
ψ=α|0>+β|1> (28)
式中,α和β均为复系数。描述量子的这种特殊状态称为状态叠加原理。对于具有n个量子位的系统,用n量子位张量积表示为
Figure GDA0003804214890000067
式中,
Figure GDA0003804214890000068
为张量积,
Figure GDA0003804214890000069
Cx为复系数,|Cx|2表示|x>在状态|φ>下出现的概率,x取2n个值,所以叠加态描述为从0到2n-1之间整数的叠加态。在量子强化学习中,状态/动作与强化学习中的状态/动作概念相同。定义Ns和Na分别表示状态和动作,存在
Ns≤2m≤Ns,Na≤2n≤Na (30)
式中,m和n分别为状态和动作的选择数。分别使用m和n位去表示状态集S={|si>}和动作集A={|aj>},得到对应关系
Figure GDA0003804214890000071
Figure GDA0003804214890000072
因此,量子多智能体协同强化学习方法状态更新描述为:
V(s)←(1-α)V(s)+αγV(s′)+αr (33)
式中,V(s)决策状态,α为学习率,r为奖励值,γ∈[0,1]为折扣因子。
结合上式,量子多智能体协同强化学习方法优化微网系统电压控制过程描述为:
(1)初始化参数/变量;
①初始化状态和动作,并赋值相同的叠加值:
Figure GDA0003804214890000073
Figure GDA0003804214890000074
②在状态|s(m)>和动作
Figure GDA0003804214890000075
下初始化:
Figure GDA0003804214890000076
Figure GDA0003804214890000077
③设置循环的最大迭代次数为500;
(2)执行循环迭代操作,直到所有状态|ΔV(s)|<ε或超出最大迭代次数时终止
①从
Figure GDA0003804214890000078
中输入状态|s>;
②观察动作值
Figure GDA0003804214890000079
获得动作|a>;
③执行动作|a>,观察下一状态|s′>以及智能体的奖励r;
④更新状态值V(s)←(1-α)V(s)+αγV(s′)+αr;
⑤执行Grover迭代操作L次更新概率振幅。
附图说明
图1是本发明方法提出的改进的执行依赖双启发式动态规划方法结构及第一层电压控制流程的示意图。
图2是本发明方法的量子多智能体协同强化学习控制系统及第四层电压控制流程的示意图。
图3是本发明方法的分布式微网电压多层协同控制框架示意图。
具体实施方式
本发明提出的一种分布式微网电压多层协同控制方法,结合附图详细说明如下:
图1是本发明方法提出的改进的执行依赖双启发式动态规划方法结构及第一层电压控制流程的示意图,改进的执行依赖双启发式动态规划方法结构和第一层电压控制流程的步骤描述为:(1)样本数据参数初始化。对电压控制系统的状态变量x(t)和控制变量u(t)进行归一化,并进行批量化处理。(2)神经网络的初始化。初始化执行网络和评价网络的vf、vr和br参数向量、状态ct、学习速率(la,lc)和隐含层维度;设定执行网络和评价网络的最大迭代次数(Na,Nc,)。(3)网络数据前向传播。电压控制系统状态量x作为执行网络的输入,经前向传播计算公式(8)-(12)得到对应输出um;接着,将x和um作为评价网络输入经过前向传播计算得到输出yp。(4)计算网络预测yp与实际值ya均方误差
Figure GDA0003804214890000081
判断emes是否满足误差要求。(5)若emes未满足误差要求,且未达到最大迭代次数,则利用反向传播计算执行网络和评价网络参数的梯度,并对参数进行更新。(6)t←t+1。(7)重复第3步到第6步,直到满足设定的收敛条件时结束。(8)通过训练的执行网络和评价网络用于系统第一层电压控制。将电压控制系统的状态变量x(t)输入执行网络获得对应的控制变量u(t)。将u(t)以及t+1时刻x(t+1)输入评价网络,得到
Figure GDA0003804214890000082
Figure GDA0003804214890000083
Figure GDA0003804214890000084
叠加值反馈给执行网络,辅助执行网络进行决策。
图2是本发明方法的量子多智能体协同强化学习控制系统及第四层电压控制流程的示意图。量子多智能体协同强化学习方法的控制过程分为离线学习和在线的训练两个部分。在离线学习部分,量子多智能体协同强化学习方法按以下步骤完成离线训练:(1)初始化参数/变量包括:①初始化状态和动作,并赋值相同的叠加值:
Figure GDA0003804214890000085
Figure GDA0003804214890000086
②在状态|s(m)>和动作
Figure GDA0003804214890000087
下初始化:
Figure GDA0003804214890000088
Figure GDA0003804214890000089
③设置循环的最大迭代次数为500。(2)执行循环迭代操作,直到所有状态|ΔV(s)|<ε或超出最大迭代次数时终止;包括:①从
Figure GDA00038042148900000810
中输入状态|s>;②观察动作值
Figure GDA0003804214890000091
获得动作|a>;③执行动作|a>,观察下一状态|s′>以及智能体的奖励r;④更新状态值V(s)←(1-α)V(s)+αγV(s′)+αr;⑤执行Grover迭代操作L次更新概率振幅。完成离线训练后,用于在线训练的量子多智能体协同强化学习方法控制系统从电力系统中获得电压控制装置以及各节点的电压状态信息,根据这些状态信息做出相应的动作。同时,根据决策动作与实际控制效果的奖励微调状态-动作Q值矩阵。
图3是本发明方法的分布式微网电压多层协同控制框架示意图。分布式微网电压多层协同控制框架采用分层控制结构,分层控制结构在控制优化时能够根据电压控制装置特性做出决策,且层与层之间相互协调约束,能够维持系统的安全稳定和控制经济性。针对电压控制系统中不同类别的电压调节装置,本发明方法的分布式微网电压多层协同控制框架采用四个不同的调控层优化方法进行控制。在分布式微网电压多层协同控制框架的第一层采用改进的执行依赖双启发式动态规划执行调度。在微网电压控制的第一层中,根据系统状态量和决策动作设置深度简单循环单元,将经过归一化处理的系统状态量作为执行网络的输入,获得决策执行动作。在微网电压控制的第二层中采用一致性方法,一致性方法通过在智能体之间交换信息,使得各智能体间能够进行决策时数据同步和实时性。在微网电压控制的第三层中采用线性优化方法对无功装置进行调度。在微网电压控制的第四层中采用量子多智能体协同强化学习方法优化电压控制系统。其中,微网电压控制的第一和第二层属于电压系统级控制,微网电压控制的第三和第四层属于电压装备级控制。四个电压调控层间相互进行通信协调,并根据相邻层的决策和电压控制系统的状态变量信息优化下一次决策动作。此外,相连接的微网间通过信息交流和功率的流通促进系统电压的安全稳定。

Claims (1)

1.一种分布式微网电压多层协同控制方法,其特征在于,将微网分为四个电压调控层,并采用四种相互协调的优化方法对微网电压进行实时调度与控制;该方法在使用过程中的步骤为:
(1)将目标微网系统电压控制装置按类型和调节方式划分四个调控层;
(2)对电压控制系统的第一层采用改进的执行依赖双启发式动态规划方法优化微网无功装置;
改进的执行依赖双启发式动态规划方法框架包含的执行网络和评价网络采用深度简单循环单元来构建;深度简单循环单元由多层简单循环单元构成,深度简单循环单元的参数连接关系描述为:
ft=σ(Wfxt+vf⊙ct-1+bf)
ct=ft⊙ct-1+(1-ft)⊙(Wxt)
rt=σ(Wrxt+vr⊙ct-1+br)ht
ht=rt⊙ct+(1-rt)⊙xt
式中,W,Wf和Wr为参数矩阵,vf,vr和br为参数向量,xt为输入变量,ct为状态序列,⊙表示Hadamard乘积;遗忘门ft控制信息流,状态向量ct根据ft自适应平均前一个状态ct-1和当前观测Wxt;ft=σ(Wfxt+vf⊙ct-1+bf)和ct=ft⊙ct-1+(1-ft)⊙(Wxt)为深度简单循环网络的轻循环部分;轻循环部分通过使用Hadamard乘积和优化参数连接关系减轻循环神经网络参数计算复杂度;rt=σ(Wrxt+vr⊙ct-1+br)ht和ht=rt⊙ct+(1-rt)⊙xt为深度简单循环单元的高速网络部分;高速网络部分通过引入门控降低参数反向传播过程计算复杂度,以缓解因网络深度加深导致的梯度信息回流受阻网络训练难进行的问题;参数更新上,选择Nadam梯度优化方法优化深度简单循环单元网络参数;
(3)对电压控制系统的第二层采用一致性方法优化决策智能体决策信息同步性;
对于电压控制系统的每个智能体,一阶时间连续一致性方法描述为:
Figure FDA0003099226550000011
式中,xi(t)为第i个智能体在t时刻的状态,Ni为智能体集合;对于一阶时间离散的一致性方法,通过马尔科夫链形式xi(t+1)=P(t)x(t),其中P(t)为Ni×Ni的随机数矩阵,且存在[P(t)]ij=pij≥0,
Figure FDA0003099226550000021
则第i个智能体在t+1时刻的状态为:
Figure FDA0003099226550000022
各智能体之间通过信息交换,将相邻智能体的状态信息进行更新迭代,当智能体状态
Figure FDA0003099226550000023
其中
Figure FDA0003099226550000024
为常数,则认为系统达到一致性,此时各智能体状态描述为:x1=x2=x3...=xn
(4)对电压控制系统的第三层采用线性优化方法;
采用线性优化方法对第三层电压控制装置进行指令分配;根据微网电压-无功功率下垂控制特性设置第三层调度目标函数为:
Figure FDA0003099226550000025
式中,Ni为节点集合,Ni,k为接入节点i的无功装置集合,ui,k,t为t时刻第k个无功装置状态取值0或1,
Figure FDA0003099226550000026
为t时刻第k个无功装置无功增量,ΔQi,t为i节点t时刻无功增量,ΔQi,t=-ωi(Vi,t-Vi pre),ωi为电压下垂系数,Vi,t为当前电压幅值,Vi pre为预测电压幅值;无功装置的控制策略描述为:
Figure FDA0003099226550000027
式中,ri,k为t时刻第k个无功装置的功率调节系数;
(5)对电压控制系统的第四层采用量子多智能体协同强化学习方法;
量子多智能体协同强化学习方法优化微网系统电压控制过程描述为:
(5.1)初始化参数/变量;
①初始化状态和动作,并赋值相同的叠加值:
Figure FDA0003099226550000028
Figure FDA0003099226550000029
其中,
Figure FDA00030992265500000210
Cx为复系数,|Cx|2表示|x>在状态|φ>下出现的概率;m和n分别为状态和动作的选择数;
②在状态|s(m)>和动作
Figure FDA00030992265500000211
下初始化:
Figure FDA00030992265500000212
Figure FDA00030992265500000213
③设置循环的最大迭代次数为500;
(5.2)执行循环迭代操作,直到所有状态|ΔV(s)|<ε或超出最大迭代次数时终止;
①从
Figure FDA0003099226550000031
中输入状态|s>;
②观察动作值
Figure FDA0003099226550000032
获得动作|a>;
③执行动作|a>,观察下一状态|s′>以及智能体的奖励r;
④更新状态值V(s)←(1-α)V(s)+αγV(s′)+αr;其中,V(s)决策状态,α为学习率,r为奖励值,γ∈[0,1]为折扣因子;
⑤执行Grover迭代操作L次更新概率振幅;
(6)电压控制系统的四层控制中心之间进行通信,并根据相邻层的决策和电压控制系统的状态变量信息优化下一次决策动作。
CN202110620175.2A 2021-06-03 2021-06-03 一种分布式微网电压多层协同控制方法 Active CN113346543B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110620175.2A CN113346543B (zh) 2021-06-03 2021-06-03 一种分布式微网电压多层协同控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110620175.2A CN113346543B (zh) 2021-06-03 2021-06-03 一种分布式微网电压多层协同控制方法

Publications (2)

Publication Number Publication Date
CN113346543A CN113346543A (zh) 2021-09-03
CN113346543B true CN113346543B (zh) 2022-10-11

Family

ID=77475156

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110620175.2A Active CN113346543B (zh) 2021-06-03 2021-06-03 一种分布式微网电压多层协同控制方法

Country Status (1)

Country Link
CN (1) CN113346543B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113991641B (zh) * 2021-09-28 2023-07-28 广西大学 一种新型电力系统分布式协同量子q学习发电控制方法
CN114362262B (zh) * 2021-12-02 2023-09-29 国网电力科学研究院有限公司 一种基于有功自适应缩减的电压调节系统及调节方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108418487A (zh) * 2018-02-11 2018-08-17 东南大学 一种用于电动汽车的速度脉动抑制方法
CN108470233A (zh) * 2018-02-01 2018-08-31 华北电力大学 一种智能电网的需求响应能力评估方法和计算设备
CN111404731A (zh) * 2020-03-05 2020-07-10 山东工商学院 一种基于双启发式算法的sdn网络控制器部署方法及系统
CN112202196A (zh) * 2020-08-18 2021-01-08 广西大学 一种双馈风力发电机的量子深度强化学习控制方法
CN112260287A (zh) * 2020-12-19 2021-01-22 高生凯 一种新型光伏微网下垂无功补偿控制方法
CN112564118A (zh) * 2020-11-23 2021-03-26 广西大学 一种分布式可拓展量子深宽度学习的实时电压控制方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105552895B (zh) * 2015-12-30 2018-02-06 国家电网公司 一种基于多层次启发式动态规划的电力系统动态等值法
US11527955B2 (en) * 2018-03-26 2022-12-13 The Board Of Trustees Of The University Of Alabama Systems, methods and devices for control of DC/DC converters and a standalone DC microgrid using artificial neural networks

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108470233A (zh) * 2018-02-01 2018-08-31 华北电力大学 一种智能电网的需求响应能力评估方法和计算设备
CN108418487A (zh) * 2018-02-11 2018-08-17 东南大学 一种用于电动汽车的速度脉动抑制方法
CN111404731A (zh) * 2020-03-05 2020-07-10 山东工商学院 一种基于双启发式算法的sdn网络控制器部署方法及系统
CN112202196A (zh) * 2020-08-18 2021-01-08 广西大学 一种双馈风力发电机的量子深度强化学习控制方法
CN112564118A (zh) * 2020-11-23 2021-03-26 广西大学 一种分布式可拓展量子深宽度学习的实时电压控制方法
CN112260287A (zh) * 2020-12-19 2021-01-22 高生凯 一种新型光伏微网下垂无功补偿控制方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于全局双启发动态规划的城轨列车运行调整方法;任庆民;《中国优秀博硕士学位论文全文数据库(硕士) 工程科技Ⅱ辑》;20190115(第12期);C033-341 *

Also Published As

Publication number Publication date
CN113346543A (zh) 2021-09-03

Similar Documents

Publication Publication Date Title
Li et al. Coordinated load frequency control of multi-area integrated energy system using multi-agent deep reinforcement learning
CN109685252B (zh) 基于循环神经网络和多任务学习模型的建筑能耗预测方法
CN113346543B (zh) 一种分布式微网电压多层协同控制方法
CN105678407A (zh) 一种基于人工神经网络的日用电量预测方法
Deb et al. Forecasting energy consumption of institutional buildings in Singapore
CN105631528A (zh) 一种基于nsga-ii和近似动态规划的多目标动态最优潮流求解方法
Maruta et al. Synthesis of fixed-structure robust controllers using a constrained particle swarm optimizer with cyclic neighborhood topology
CN108960485A (zh) 一种源-荷互动电力市场下的在线字典学习概率最优潮流方法
CN116862551A (zh) 一种考虑用户隐私保护的新能源消纳电价决策方法
Atiyha et al. An improved cost estimation for unit commitment using back propagation algorithm
Zhu et al. Mutigroup-based phasmatodea population evolution algorithm with mutistrategy for iot electric bus scheduling
CN113505492A (zh) 一种基于数字孪生技术的跨流域调水工程的调度方法
Zhang et al. Stability analysis of sampled-data control system and its application to electric power market
Li et al. Implicit stochastic optimization with data mining for reservoir system operation
Chanfreut et al. Distributed model predictive control based on dual decomposition with neural-network-based warm start
CN113935600A (zh) 一种基于深度学习的自适应经济调度系统及方法
Dey et al. Reinforcement Learning Building Control: An Online Approach with Guided Exploration using Surrogate Models
He et al. Composite socio-technical systems: A method for social energy systems
CN112909954A (zh) 一种基于生成对抗神经网络的微电网分层控制策略
Yang et al. Complex dynamics of Cournot game with bounded rationality in an oligopolistic electricity market
Ivanova et al. Lazy safety controller synthesis with multi-scale adaptive-sampling abstractions of nonlinear systems
Sheng et al. Research on Application of Neural Network Based on Cloud Computing in Power Load Forecasting
Kang et al. Power flow coordination optimization control method for power system with DG based on DRL
Skobelev et al. Measuring Adaptability of" Swarm Intelligence" for Resource Scheduling and Optimization in Real Time.
Rang et al. A Long Short-Term Memory Prediction-Based Dynamic Multi-Objective Evolutionary Optimization Algorithm

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant