CN111064201B - 一种基于网络拓扑优化控制的配电网电压优化调节方法 - Google Patents

一种基于网络拓扑优化控制的配电网电压优化调节方法 Download PDF

Info

Publication number
CN111064201B
CN111064201B CN201911408157.7A CN201911408157A CN111064201B CN 111064201 B CN111064201 B CN 111064201B CN 201911408157 A CN201911408157 A CN 201911408157A CN 111064201 B CN111064201 B CN 111064201B
Authority
CN
China
Prior art keywords
knowledge
switch
distribution network
action
source
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911408157.7A
Other languages
English (en)
Other versions
CN111064201A (zh
Inventor
王蓓蓓
胥鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southeast University
Original Assignee
Southeast University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southeast University filed Critical Southeast University
Priority to CN201911408157.7A priority Critical patent/CN111064201B/zh
Publication of CN111064201A publication Critical patent/CN111064201A/zh
Application granted granted Critical
Publication of CN111064201B publication Critical patent/CN111064201B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J3/00Circuit arrangements for ac mains or ac distribution networks
    • H02J3/12Circuit arrangements for ac mains or ac distribution networks for adjusting voltage in ac networks by changing a characteristic of the network load
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J3/00Circuit arrangements for ac mains or ac distribution networks
    • H02J3/04Circuit arrangements for ac mains or ac distribution networks for connecting networks of the same frequency but supplied from different sources
    • H02J3/06Controlling transfer of power between connected networks; Controlling sharing of load between connected networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Power Engineering (AREA)
  • Supply And Distribution Of Alternating Current (AREA)

Abstract

本发明公开了一种基于网络拓扑优化控制的配电网电压优化调节方法:从历史数据中提取发生过电压时的典型源荷状态集,学习对应状态下的经验知识;初步构建拓扑优化经验知识库,知识库中存储历史中不同源荷状态下预学习最终收敛时的经验知识;以新任务的源荷状态去匹配知识库中最相似的源荷状态,匹配成功后直接进行知识迁移。若匹配不成功,则基于无知识迁移的强化学习求解,并将收敛结果作为新的经验知识补充进知识库。本发明提出的一种基于网络拓扑优化控制的配网电压调节方法,充分考虑了新一代配网网络拓扑调节的灵活性,缓解了传统配网调压资源逐渐满足不确定性电网调压需求的问题,节省外部调节设备的建设成本,保证电网安全经济运行。

Description

一种基于网络拓扑优化控制的配电网电压优化调节方法
技术领域
本发明属于配网电压调节技术领域,具体涉及一种基于网络拓扑优化控制的配电网电压优化调节方法。
背景技术
传统配电网量测系统的欠缺导致对于网络全局信息的把控不足,电压控制一般采用局部调节方式,一种是调节变电站有载调压器(On-load Tap Changer,OLTC)分接头,但其对于长馈线末端的电压调节效果不明显;另一种是分组自动投切负荷端的并联电容器组,但需要安装大量的并联电容器,所需成本较高。同时,分布式电源的接入大大加大了配电网调压的压力,导致出现已有调压资源耗尽仍无法有效调压的情况。拓扑结构作为配电网中的调节资源,可用来解决降低有功损耗、均衡负荷、提高可靠性、改善供电质量等问题。本发明提出一种一种基于网络拓扑优化控制的配电网电压调节方法,并采用具有知识迁移能力的强化学习算法(Q-learning with knowledge,QWK)进行求解,相对于传统的电压调节方法,该方法充分利用现有网络拓扑的调节能力,不需要增加配电网电压控制资源的进一步投资,具有一定的经济价值。
发明内容
本发明为了弥补现有配网电压调节资源的不足,提供了一种基于网络拓扑优化控制的配电网电压优化调节方法,所给出的电压调节方法在完成电压控制目标的前提下,提高了拓扑资源的利用效率,规避了大量外接调压资源的投入,提高了电网运行控制的经济性。
一种基于网络拓扑优化控制的配电网电压优化调节方法,包括以下步骤:
步骤1、从历史数据中提取发生过电压时的典型源荷状态集,初始化知识矩阵,其中源荷状态包括分布式电源出力、负荷水平;
步骤2、基于当前知识矩阵,配电网中开关根据ε-greedy动作策略选择动作,结合基于图论的简化图网络拓扑生成方法形成一组满足拓扑约束的开关状态;
步骤3、根据步骤2中形成的开关状态和此时的配电网源荷状态进行配电网潮流计算,并根据潮流计算结果计算奖励函数、更新知识矩阵以及退火参数;
步骤4、若未达到设定的最大迭代次数,则转到步骤2,否则转到步骤5;
步骤5、初步构建拓扑优化经验知识库,拓扑优化经验知识库中存储不同源荷状态下经过步骤2至3的预学习最终收敛时的经验知识以及对应的源荷状态;
步骤6、以新任务中的源荷状态去匹配拓扑优化经验知识库中最相似的源荷状态,匹配到的作为源任务,直接进行知识迁移,基于历史知识经验,实现实时情况下电压优化问题的秒级求解;若匹配不成功,则基于无知识迁移的强化学习求解,并将最终知识矩阵作为新的经验知识补充进拓扑优化经验知识库。
进一步的,步骤2中具体为:
1)对配电网的第i个开关建立一个2*2的知识矩阵Qi与之对应,将每个开关的动作空间定义为下一个开关的环境,在每次确定一个开关的动作后,才基于此动作去确定下一个开关的动作,即各开关的动作按编号顺序依次确定;
2)配电网中开关根据ε-greedy动作策略选择动作,ε-greedy公式如下:
Figure GDA0003661973180000021
其中,A表示开关的动作空间,a表示开关的动作,P表示随机生成的在(0,1)内的数,Qi(si,a)表示第i个开关在环境si、动作a下的Q值,ar表示随机选择的动作;
3)基于简化网络的寻优空间压缩:简化处理原配电网网络G,建立简化网络
Figure GDA0003661973180000029
与G的映射关系,将ε-greedy动作策略中智能体在G上的探索过程转移到
Figure GDA00036619731800000210
上,实现寻优空间的压缩;
为了在
Figure GDA0003661973180000022
上找到满足放射性约束的解,随机断开Noff条支路后,进一步判断
Figure GDA0003661973180000023
是否有环,若无环则满足放射性约束,若有环则重新随机断开Noff条支路并判断是否有环,直到无环;其中Noff=N-Nnode+Nsub,N为
Figure GDA0003661973180000024
上的总支路数,Nnode
Figure GDA0003661973180000025
上的总节点数,Nsub
Figure GDA0003661973180000026
中的变电站数;
简化网络
Figure GDA0003661973180000027
建立具体步骤如下:
1)闭合G中的所有支路开关;
2)删除未与其他节点构成环的支路;
3)若第i个节点相连的边数li>2,则将与其相连的支路合并为一条支路,得到简化网络
Figure GDA0003661973180000028
判断环的方法如下:
1)若第i个节点相连的边数li=1,则删除该节点以及与其相连的支路;
2)若剩余节点中存在相连的边数大于等于2的节点,则存在环,否则不存在环。
进一步的,步骤3中具体为:
1)奖励函数设计
所有开关都做完动作选择之后,通过计算适应度函数来对第i个开关的动作ai进行奖励评估,设计的奖励函数R为:
Figure GDA0003661973180000031
Figure GDA0003661973180000032
式中,K为正常数,f为适应度函数,当新环境下的适应度越低,智能体选择动作得到的奖励就越高,γ为惩罚因子,V为配电网节点的标准电压,n为配电网总节点数;H为开关执行动作之后进行潮流计算不满足约束的个数,具体约束如下:
Figure GDA0003661973180000033
式中,Pi,Grid/Qi,Grid、Pi,Load/Qi,Grid、Pi,DG/Qi,DG分别为节点i有功/无功注入、负荷有功/无功需求与DG有功/无功出力,Vi、Vj为节点i和j的电压,Gij、Bij分别为配电网线路ij的电导和电纳,δij为节点i和j之间的电压相角差;
Figure GDA0003661973180000034
为节点i电压幅值上下限;
Figure GDA0003661973180000035
为支路j上允许流过的最大电流;T为放射性网络结构;
2)根据新环境与奖励更新知识
Figure GDA0003661973180000036
式中,α、β分别为学习、折扣因子,0<α,β<1;Rk+1为第k+1次迭代的奖励函数,sk为第k次迭代中的环境,ak为第k次迭代中的动作,
Figure GDA0003661973180000037
分别为第k+1次、第k次迭代中第i个开关在状态
Figure GDA0003661973180000038
动作
Figure GDA0003661973180000039
下对应的Q值,
Figure GDA00036619731800000310
为第k次迭代中第i个开关在状态sk+1下所有动作对应Q值的最大值;
3)退火参数
借鉴模拟退火机制动态计算ε-greedy中ε的值:
Figure GDA0003661973180000041
Tk+1=δTk
式中,Tk、Tk+1为第k、k+1次迭代中的温度值,δ为等比降温系数,ε0为初始贪婪系数,T0为温度初值。
进一步的,步骤6中知识迁移方法如下:
将预学习中的知识矩阵
Figure GDA0003661973180000042
作为新任务的初始知识矩阵
Figure GDA0003661973180000043
Figure GDA0003661973180000044
Figure GDA0003661973180000045
式中,Snew为新任务,Ssource为拓扑优化经验知识库中的源任务,D(Snew,Ssource)为新任务和源任务的相似性度量函数,NLoad、NDG分别为负荷个数与DG个数,
Figure GDA0003661973180000046
为新任务与源任务中的源荷出力/需求,
Figure GDA0003661973180000047
为迁移阈值,当有多个源任务满足要求时,选最相似的源任务进行迁移。
采用本发明的技术方案,可实现如下有益效果:本发明提供了一种基于网络拓扑优化控制的配电网电压调节方法,与现有的配网调压方式相比其优点是充分利用现有网络拓扑的调节能力,不需要增加配电网电压控制资源的进一步投资,具有一定的经济价值。
附图说明
图1为IEEE14节点标准配电网络;
图2为4节点算例下收敛结果,其中,(a)为DG为30MVA,(b)为DG为55MVA,(c)为DG为80MVA;
图3为收敛曲线;
图4为本发明方法的总流程图;
图5为分布式记忆存储示意图;
图6为基于简化网络的放射性拓扑生成示意图。
具体实施方式
下面结合附图和具体的实施例对本发明技术方案作进一步的详细描述,以使本领域的技术人员可以更好的理解本发明并能予以实施,但所举实施例不作为对本发明的限定。
实施例按照本发明所述步骤进行:
一种基于网络拓扑优化控制的配电网电压优化调节方法,包括以下步骤:
步骤1、进行线下学习,从历史数据中提取发生过电压时的典型源荷状态(包括分布式电源出力、负荷水平)集,初始化知识矩阵;
步骤2、为了解决开关数量众多而导致的知识矩阵维数灾难,采用分布式记忆存储方式记录学习经验。基于步骤1中初始化的知识矩阵,系统中开关根据ε-greedy动作策略选择状态,为了使得最终开关组合满足网络拓扑约束,这里结合了基于图论的简化图网络拓扑生成方法,最终形成一组满足拓扑约束的开关状态;
步骤3、根据步骤2中的最终开关状态和此时的网络源荷状态进行网络潮流计算,并根据结果计算奖励函数,更新知识矩阵以及退火参数;
步骤4、若未达到最大迭代次数,则转到步骤2,否则转到步骤5。
步骤5、经过线下预学习,初步构建拓扑优化经验知识库,知识库中存储历史中不同源荷状态下预学习最终收敛时的经验知识;
步骤6、进行线上学习,以当前网络的源荷状态去匹配知识库中最相似的源荷状态,匹配成功后直接进行知识迁移。若匹配不成功,则基于无知识迁移的强化学习求解,并将收敛结果作为新的经验知识补充进知识库。
其中,步骤2包括:
1)分布式记忆存储
对于网络拓扑优化问题,控制变量为各分段开关、联络开关,每个开关有“闭合”与“断开”两个动作,若用经典Q表去记录所有开关的动作组合,当m增加时,Q的规模会呈指数级规律增加,导致“维度灾难”,无法正常存储与更新Q表参数。
如图5所示,为了实现存储方式的降维,提出一种分布式知识存储方式。对网络中的开关进行编号,考虑对配电网的第i个开关建立一个2*2的知识矩阵Qi与之对应,将每个变量的动作空间定义为下一个变量的环境,在每次确定一个开关变量的动作后,才基于此动作去确定下一个开关变量的动作,即各变量的动作按编号顺序依次确定。通过“状态—动作”的链式联系,各开关变量实现了集中式知识矩阵的分布式学习,大大减小动作空间。
2)动作策略
配电网中第i个开关在状态si下需要作出动作选择ai,如果仅仅依据Q值大小选取策略,很容易陷入局部最优。在扩张与探索之间达到平衡是强化学习算法研究中的主要问题,一般采用ε-greedy策略进行优化,即第i个开关以概率ε选择对应状态下Q值最大的动作,同时以(1-ε)的概率随机选择动作ar,以保证能够在解空间里尽可能的探索,ε-greedy公式如下:
Figure GDA0003661973180000061
其中,A表示开关的动作空间,a表示开关的动作,P表示随机生成的在(0,1)内的数,Qi(si,a)表示第i个开关在环境si、动作a下的Q值,ar表示随机选择的动作。
在ε-greedy策略中,ε为固定值,其值越大,收敛越快,也越容易陷入局部最优。
3)基于简化网络的寻优空间压缩
在ε-greedy策略中,p≥ε时,各开关会相互独立的随机选择动作,即所有开关组合会被等概率的选中。实际上,开关组合集合中的大量解并不满足网络拓扑约束,这些解的存在严重干扰了智能体探索最优解的效率。
如图6所示,通过简化处理原网络G,建立简化网络
Figure GDA0003661973180000062
与G的映射关系,将开关在G上的探索过程转移到
Figure GDA0003661973180000063
上,实现寻优空间的压缩。具体步骤如下:
1)闭合G中的所有支路开关;
2)删除未与其他节点构成环的支路;
3)若第i个节点相连的边数li>2,则将与其相连的支路合并为一条支路,得到简化网络
Figure GDA0003661973180000064
为了在
Figure GDA0003661973180000065
上找到满足放射性约束的解,首先计算需要断开的支路数:Noff=N-Nnode+Nsub式中,Noff为需要断开的支路数,N为
Figure GDA0003661973180000066
上的总支路数,Nnode
Figure GDA0003661973180000067
上的总节点数,Nsub
Figure GDA0003661973180000068
中的变电站数。随机断开Noff条支路后,进一步判断
Figure GDA0003661973180000069
是否有环,若无环则满足放射性约束,若有环则重新随机断开Noff条支路并判断是否有环,直到无环。
判断环的方法如下:
1)若第i个节点相连的边数li=1,则删除该节点以及与其相连的支路;
2)若剩余节点中存在相连的边数大于等于2的节点,则存在环,否则不存在环。
其中,步骤3包括:
1)奖励函数设计
所有开关都做完动作选择之后,通过计算适应度函数来对第i个开关的动作ai进行奖励评估。奖励函数的设计与要解决的目标问题直接相关,需要在满足约束条件的前提下求解节点电压偏移达到最小的网络拓扑,所以设计奖励函数如下:
Figure GDA0003661973180000071
Figure GDA0003661973180000072
式中,K为正常数,f为适应度函数,当新环境下的适应度越低,智能体选择动作得到的奖励就越高,γ为惩罚因子,V为配电网节点的标准电压,n为配电网总节点数;H为开关执行动作之后进行潮流计算不满足约束的个数,具体约束如下:
Figure GDA0003661973180000073
式中,Pi,Grid/Qi,Grid、Pi,Load/Qi,Grid、Pi,DG/Qi,DG分别为节点i有功/无功注入、负荷有功/无功需求与DG有功/无功出力,Vi、Vj为节点i和j的电压,Gij、Bij分别为配电网线路ij的电导和电纳,δij为节点i和j之间的电压相角差;
Figure GDA0003661973180000074
为节点i电压幅值上下限;
Figure GDA0003661973180000075
为支路j上允许流过的最大电流;T为放射性网络结构。
2)根据新环境与奖励更新知识
在第k次迭代中,开关根据当前的系统状态sk,按照一定的规则选择动作ak,此时环境变化为新状态sk+1,并给开关返回由奖励函数R确定的奖励,最终开关根据新环境与奖励更新知识:
Figure GDA0003661973180000076
式中,α、β分别为学习、折扣因子,0<α,β<1;Rk+1为第k+1次迭代的奖励函数,sk为第k次迭代中的环境,ak为第k次迭代中的动作,
Figure GDA0003661973180000077
分别为第k+1次、第k次迭代中第i个开关在状态sk、动作ak下对应的Q值,
Figure GDA0003661973180000078
为第k次迭代中第i个开关在状态sk+1下所有动作对应Q值的最大值。
3)退火参数
事实上,在探索前期,开关尚缺乏有效信息,应该以较大的概率在解空间里搜索,随着学习进程的推进,其积累的经验知识趋于精确,没必要继续大概率的探索活动。借鉴模拟退火机制动态计算ε-greedy中ε的值:
Figure GDA0003661973180000081
Tk+1=δTk
式中,Tk、Tk+1为第k、k+1次迭代中的温度值,δ为等比降温系数,ε0为初始贪婪系数,T0为温度初值,T0需要根据具体问题设置。
其中,步骤6中将预学习中的知识矩阵
Figure GDA0003661973180000082
作为新任务的初始知识矩阵
Figure GDA0003661973180000083
Figure GDA0003661973180000084
Figure GDA0003661973180000085
式中,Snew为新任务,Ssource为拓扑优化经验知识库中的源任务,D(Snew,Ssource)为新任务和源任务的相似性度量函数,NLoad、NDG分别为负荷个数与DG个数,
Figure GDA0003661973180000086
为新任务与源任务中的源荷出力/需求,
Figure GDA0003661973180000087
为迁移阈值,当有多个源任务满足要求时,选最相似的源任务进行迁移。
实施例
步骤1中选取IEEE14节点标准配电网络为仿真对象,该网络共16条支路,1个电源节点,基准电压为27kV,基准功率为100MVA,如图1所示。
算例仿真分为线下学习与线上学习两部分,分别设置相关参数如表1所示:
表1设置相关参数
参数 范围 线下 线上
α (0,1) 0.2 0.3
β (0,1) 0.1 0.2
K (0,∞) 1 1
γ (0,∞) 0.2 0.2
δ (0.5,1) 0.95 0.90
T<sub>0</sub> (0,∞) 500 500
ε<sub>0</sub> (0,1) 0.2 0.5
以变电站有载调压器和调节外接电容器组联合调压为例来说明传统调压方法在面对DG接入时的局限性。OLTC通过驱动变压器分接头动作,实现电压调节,电容器通过吸收无功功率进行电压调节。设置节点2,7具有最高吸收10MVA的可连续调节电容器组及同步增大规模的DG。DG接入规模较小时,通过OLTC与电容器组联合调压,能够将节点的电压控制在合理范围内。但当DG规模增至50MVA以上时,节点7、5的电压相继越限,此时OLTC与电容器组调压资源已经消耗殆尽,即随着分布式DG接入规模的增大,传统调压手段可能出现不足,导致电压越限无法解决的问题。
设定节点2、7的DG大小为30MVA,经过仿真试验,各智能体收敛后得到最终的知识矩阵,根据贪婪原则进一步生成最终拓扑策略,14节点算例下收敛结果如图2所示。
图2中的(a)中,节点2、7的DG为30MVA时,进行拓扑调节后,首先节点7的过电压问题都得到有效解决,降至电压上限以下,其次抬升了部分由于离变电站较远而导致的电压较低节点,即充分发挥了DG对于配网节点电压的支撑作用,又解决了由于支撑过大而导致的过电压问题,网络电压偏移现象大大改善;
图2中的(b)中,DG提升至55MVA后,节点5、7发生过电压,传统方法已出现不足,而本发明提出的拓扑调压方案依然可以很好解决过电压问题,说明网络拓扑作为调压资源具有良好的适用性;
图2中的(c)中,DG提升至80MVA后,经过拓扑调节后只解决了节点2、5的电压问题,节点7由于电压问题过于严重,仍存在过电压现象,这里说明网络拓扑作为调压资源,同样存在调节上限,当过电压问题过于严重时,可以考虑配合其他调节资源协同调压。
本发明如图4所示,具体步骤如下:
步骤1:初始化如表1所示的算法参数,进而判断任务类型是否属于实时电压优化,若否,则进行线下知识积累,转步骤2,若是,则进行线上实时求解,转步骤3。
步骤2:根据历史数据获取源荷状态,初始化知识矩阵,根据算法主体求解电压优化,并将收敛的知识矩阵加入知识库,作为经验知识。
步骤3:获取实时源荷状态,计算该源荷状态与知识库中各源荷状态的相似性度量函数值,若最小值小于相似度阈值,则以最小相似度度量函数值对应的源荷状态作为源任务进行知识迁移,根据算法主体求解电压优化;若最小值大于相似度阈值,初始化知识矩阵,根据算法主体求解电压优化,并将收敛的知识矩阵加入知识库,作为经验知识。
其中,算法主体的步骤:
步骤1:随机生成P,判断是否小于ε,若是,转步骤2,若否,转步骤3;
步骤2:各开关根据当前环境,选择动作空间里Q值最大的动作,转步骤4;
步骤3:根据原配电网络生成简化网络,随机断开Noff条支路,判断是否有环,若有环,则重新随机,直到无环,并记录此时对应的简化网络结构,根据简化网络到原网络的映射关系生成原网络的拓扑结构,并将该结构对应的各变量动作作为本次迭代各变量的动作,转步骤4;
步骤4:根据各开关的动作,进行配电网的潮流计算,根据结果计算奖励函数,而后更新知识矩阵,更新退火参数,若迭代次数大于最大迭代次数,则输出最终知识矩阵,否则迭代次数加1,转步骤1。
进一步地,步骤3中线上学习结果如下:
经过对于网络历史源荷状态的大量线下学习,知识库已经积累了丰富的经验知识,在实时发生DG突发性大幅波动导致过电压时,可以运用历史经验知识快速进行拓扑优化,实现网络安全经济运行。为了进一步对比测试本发明方法的性能,采用遗传算法(genetic algorithm,GA)与粒子群算法(particle swarm optimization,PSO)对问题进行建模求解,收敛曲线如图3所示。
对新的源荷状态进行线上优化求解,迭代次数设为50,四种算法各求解10次,图3给出最优迭代收敛结果。为进一步比较各算法的性能,统计10次求解结果于表2。
表2 10次求解结果
Figure GDA0003661973180000101
表2中,从目标函数来看,四种算法都具备收敛到最优解的能力,但只有本发明算法可以保证每次收敛到最优解;从收敛时间来看,本发明算法在求解速度上具有较大优势,可达到其他算法求解速度最高20倍以上。所以无论是求解质量还是求解速度,本发明算法都具有一定优势,说明在引入知识迁移后,算法在一开始即可获得较优的先验知识,在线上相似新任务下只需较小迭代步数即可获得较高质量的解。

Claims (3)

1.一种基于网络拓扑优化控制的配电网电压优化调节方法,其特征在于,包括以下步骤:
步骤1、从历史数据中提取发生过电压时的典型源荷状态集,初始化知识矩阵,其中源荷状态包括分布式电源出力、负荷水平;
步骤2、基于当前知识矩阵,配电网中开关根据ε-greedy动作策略选择动作,结合基于图论的简化图网络拓扑生成方法形成一组满足拓扑约束的开关状态;具体为:
1)对配电网的第i个开关建立一个2*2的知识矩阵Qi与之对应,将每个开关的动作空间定义为下一个开关的环境,在每次确定一个开关的动作后,才基于此动作去确定下一个开关的动作,即各开关的动作按编号顺序依次确定;
2)配电网中开关根据ε-greedy动作策略选择动作,ε-greedy公式如下:
Figure FDA0003671277910000011
其中,A表示开关的动作空间,a表示开关的动作,P表示随机生成的在(0,1)内的数,
Qi(si,a)表示第i个开关在环境si、动作a下的Q值,ar表示随机选择的动作;
3)基于简化网络的寻优空间压缩:简化处理原配电网网络G,建立简化网络
Figure FDA0003671277910000012
与G的映射关系,将ε-greedy动作策略中智能体在G上的探索过程转移到
Figure FDA0003671277910000013
上,实现寻优空间的压缩;
为了在
Figure FDA0003671277910000014
上找到满足放射性约束的解,随机断开Noff条支路后,进一步判断
Figure FDA0003671277910000015
是否有环,若无环则满足放射性约束,若有环则重新随机断开Noff条支路并判断是否有环,直到无环;其中Noff=N-Nnode+Nsub,N为
Figure FDA0003671277910000016
上的总支路数,Nnode
Figure FDA0003671277910000017
上的总节点数,Nsub
Figure FDA0003671277910000018
中的变电站数;
简化网络
Figure FDA0003671277910000019
建立具体步骤如下:
1)闭合G中的所有支路开关;
2)删除未与其他节点构成环的支路;
3)若第i个节点相连的边数li>2,则将与其相连的支路合并为一条支路,得到简化网络
Figure FDA00036712779100000110
判断环的方法如下:
1)若第i个节点相连的边数li=1,则删除该节点以及与其相连的支路;
2)若剩余节点中存在相连的边数大于等于2的节点,则存在环,否则不存在环;
步骤3、根据步骤2中形成的开关状态和此时的配电网源荷状态进行配电网潮流计算,并根据潮流计算结果计算奖励函数、更新知识矩阵以及退火参数;
步骤4、若未达到设定的最大迭代次数,则转到步骤2,否则转到步骤5;
步骤5、初步构建拓扑优化经验知识库,拓扑优化经验知识库中存储不同源荷状态下经过步骤2至3的预学习最终收敛时的经验知识以及对应的源荷状态;
步骤6、以新任务中的源荷状态去匹配拓扑优化经验知识库中最相似的源荷状态,匹配到的作为源任务,直接进行知识迁移,基于历史知识经验,实现实时情况下电压优化问题的秒级求解;若匹配不成功,则基于无知识迁移的强化学习求解,并将最终知识矩阵作为新的经验知识补充进拓扑优化经验知识库。
2.根据权利要求1所述的一种基于网络拓扑优化控制的配电网电压优化调节方法,其特征在于,步骤3中具体为:
1)奖励函数设计
所有开关都做完动作选择之后,通过计算适应度函数来对第i个开关的动作ai进行奖励评估,设计的奖励函数R为:
Figure FDA0003671277910000021
Figure FDA0003671277910000022
式中,K为正常数,f为适应度函数,当新环境下的适应度越低,智能体选择动作得到的奖励就越高,γ为惩罚因子,V为配电网节点的标准电压,n为配电网总节点数;H为开关执行动作之后进行潮流计算不满足约束的个数,具体约束如下:
Figure FDA0003671277910000023
式中,Pi,Grid/Qi,Grid、Pi,Load/Qi,Grid、Pi,DG/Qi,DG分别为节点i有功/无功注入、负荷有功/无功需求与DG有功/无功出力,Vi、Vj为节点i和j的电压,Gij、Bij分别为配电网线路ij的电导和电纳,δij为节点i和j之间的电压相角差;Vi min、Vi max为节点i电压幅值上下限;
Figure FDA0003671277910000024
为支路j上允许流过的最大电流;T为放射性网络结构;
2)根据新环境与奖励更新知识
Figure FDA0003671277910000031
式中,α、β分别为学习、折扣因子,0<α,β<1;Rk+1为第k+1次迭代的奖励函数,sk为第k次迭代中的环境,ak为第k次迭代中的动作,
Figure FDA0003671277910000032
分别为第k+1次、第k次迭代中第i个开关在状态
Figure FDA0003671277910000033
动作
Figure FDA0003671277910000034
下对应的Q值,
Figure FDA0003671277910000035
为第k次迭代中第i个开关在状态sk+1下所有动作对应Q值的最大值;
3)退火参数
借鉴模拟退火机制动态计算ε-greedy中ε的值:
Figure FDA0003671277910000036
Tk+1=δTk
式中,Tk、Tk+1为第k、k+1次迭代中的温度值,δ为等比降温系数,ε0为初始贪婪系数,T0为温度初值。
3.根据权利要求1所述的一种基于网络拓扑优化控制的配电网电压优化调节方法,其特征在于,步骤6中知识迁移方法如下:
将预学习中的知识矩阵
Figure FDA0003671277910000037
作为新任务的初始知识矩阵
Figure FDA0003671277910000038
Figure FDA0003671277910000039
Figure FDA00036712779100000310
式中,Snew为新任务,Ssource为拓扑优化经验知识库中的源任务,D(Snew,Ssource)为新任务和源任务的相似性度量函数,NLoad、NDG分别为负荷个数与DG个数,
Figure FDA00036712779100000311
为新任务与源任务中的源荷出力/需求,
Figure FDA00036712779100000312
为迁移阈值,当有多个源任务满足要求时,选最相似的源任务进行迁移。
CN201911408157.7A 2019-12-31 2019-12-31 一种基于网络拓扑优化控制的配电网电压优化调节方法 Active CN111064201B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911408157.7A CN111064201B (zh) 2019-12-31 2019-12-31 一种基于网络拓扑优化控制的配电网电压优化调节方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911408157.7A CN111064201B (zh) 2019-12-31 2019-12-31 一种基于网络拓扑优化控制的配电网电压优化调节方法

Publications (2)

Publication Number Publication Date
CN111064201A CN111064201A (zh) 2020-04-24
CN111064201B true CN111064201B (zh) 2022-07-15

Family

ID=70305423

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911408157.7A Active CN111064201B (zh) 2019-12-31 2019-12-31 一种基于网络拓扑优化控制的配电网电压优化调节方法

Country Status (1)

Country Link
CN (1) CN111064201B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113036772B (zh) * 2021-05-11 2022-07-19 国网江苏省电力有限公司南京供电分公司 一种基于深度强化学习的配电网拓扑电压调节方法
CN113346504B (zh) * 2021-06-17 2022-06-28 国家电网有限公司 基于数据知识驱动的主动配电网电压控制方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110348048A (zh) * 2019-05-31 2019-10-18 国网河南省电力公司郑州供电公司 基于考虑热岛效应负荷预测的配电网优化重构方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110348048A (zh) * 2019-05-31 2019-10-18 国网河南省电力公司郑州供电公司 基于考虑热岛效应负荷预测的配电网优化重构方法

Also Published As

Publication number Publication date
CN111064201A (zh) 2020-04-24

Similar Documents

Publication Publication Date Title
CN109768573B (zh) 基于多目标差分灰狼算法的配电网无功优化方法
Sancha et al. Secondary voltage control: analysis, solutions and simulation results for the Spanish transmission system
CN110768262B (zh) 一种基于节点聚类分区的有源配电网无功电源配置方法
CN109861211B (zh) 一种基于数据驱动的配电网动态重构方法
CN111064201B (zh) 一种基于网络拓扑优化控制的配电网电压优化调节方法
CN113612239A (zh) 配电台区多目标三相负荷不平衡相序调整方法及系统
CN112418496B (zh) 一种基于深度学习的配电台区储能配置方法
CN111614110B (zh) 一种基于改进多目标粒子群算法的受端电网储能优化配置方法
CN115313403A (zh) 一种基于深度强化学习算法的实时电压调控方法
CN117808151A (zh) 一种基于粒子群-遗传融合算法的变电站无功优化方法
CN117913789A (zh) 一种分布式光储参与配电网改进多目标优化控制方法
CN112186764B (zh) 一种配电网设备的接入优化方法、装置及电子设备
CN113364057A (zh) 一种配电网调控方法、装置及终端设备
Selim et al. Power losses and energy cost minimization using shunt capacitors installation in distribution systems
CN117394366A (zh) 一种含多微网的主动配电网不确定性分层调度方法
CN111146815B (zh) 一种智能配电网分布式发电规划配置方法
CN113690930B (zh) 基于nsga-iii算法的分布式光伏电源中长期选址定容方法
Wang et al. New method of reactive power compensation for oilfield distribution network
CN112488442B (zh) 基于深度强化学习算法及源荷不确定性的配电网重构方法
CN111130150B (zh) 基于IPM-intPSO的两阶段动态无功优化方法
CN110829440B (zh) 一种三相中低压一体化配电网电压控制方法及系统
CN113270867A (zh) 一种薄弱电网潮流无解自动调整方法
Akbari Optimal Placement and Scheduling of Switched Capacitor Banks Using Multi-Objective Hybrid Optimization Algorithm under Load Uncertainty Conditions
Shan et al. A voltage control method for distribution networks based on TCN and MPGA under cloud edge collaborative architecture
CN107423847A (zh) 一种分布式智能配电网的电力负荷预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant