CN111666713B - 一种电网无功电压控制模型训练方法及系统 - Google Patents

一种电网无功电压控制模型训练方法及系统 Download PDF

Info

Publication number
CN111666713B
CN111666713B CN202010413883.4A CN202010413883A CN111666713B CN 111666713 B CN111666713 B CN 111666713B CN 202010413883 A CN202010413883 A CN 202010413883A CN 111666713 B CN111666713 B CN 111666713B
Authority
CN
China
Prior art keywords
voltage control
model
reactive voltage
control model
reactive
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010413883.4A
Other languages
English (en)
Other versions
CN111666713A (zh
Inventor
吴文传
刘昊天
孙宏斌
王彬
郭庆来
夏天
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tsinghua University
Original Assignee
Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tsinghua University filed Critical Tsinghua University
Priority to CN202010413883.4A priority Critical patent/CN111666713B/zh
Publication of CN111666713A publication Critical patent/CN111666713A/zh
Priority to US17/025,154 priority patent/US11689021B2/en
Application granted granted Critical
Publication of CN111666713B publication Critical patent/CN111666713B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/06Electricity, gas or water supply
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B9/00Simulators for teaching or training purposes
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J13/00Circuit arrangements for providing remote indication of network conditions, e.g. an instantaneous record of the open or closed condition of each circuitbreaker in the network; Circuit arrangements for providing remote control of switching means in a power distribution network, e.g. switching in and out of current consumers by using a pulse code signal carried by the network
    • H02J13/00001Circuit arrangements for providing remote indication of network conditions, e.g. an instantaneous record of the open or closed condition of each circuitbreaker in the network; Circuit arrangements for providing remote control of switching means in a power distribution network, e.g. switching in and out of current consumers by using a pulse code signal carried by the network characterised by the display of information or by user interaction, e.g. supervisory control and data acquisition systems [SCADA] or graphical user interfaces [GUI]
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J3/00Circuit arrangements for ac mains or ac distribution networks
    • H02J3/001Methods to deal with contingencies, e.g. abnormalities, faults or failures
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J3/00Circuit arrangements for ac mains or ac distribution networks
    • H02J3/18Arrangements for adjusting, eliminating or compensating reactive power in networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2113/00Details relating to the application field
    • G06F2113/04Power grid distribution networks
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J2203/00Indexing scheme relating to details of circuit arrangements for AC mains or AC distribution networks
    • H02J2203/20Simulating, e g planning, reliability check, modelling or computer assisted design [CAD]
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02EREDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
    • Y02E40/00Technologies for an efficient electrical power generation, transmission or distribution
    • Y02E40/30Reactive power compensation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02EREDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
    • Y02E40/00Technologies for an efficient electrical power generation, transmission or distribution
    • Y02E40/70Smart grids as climate change mitigation technology in the energy generation sector
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02EREDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
    • Y02E60/00Enabling technologies; Technologies with a potential or indirect contribution to GHG emissions mitigation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/40Display of information, e.g. of data or controls
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S40/00Systems for electrical power generation, transmission, distribution or end-user application management characterised by the use of communication or information technologies, or communication or information technology specific aspects supporting them
    • Y04S40/20Information technology specific aspects, e.g. CAD, simulation, modelling, system security

Abstract

本发明提供了一种电网无功电压控制模型训练方法,所述方法包括:建立电网仿真模型;根据电网无功电压控制目标,建立无功电压优化模型;结合电网仿真模型和无功电压优化模型,搭建基于对抗马尔科夫决策过程的交互训练环境;通过联合对抗训练算法训练电网无功电压控制模型;将训练后的电网无功电压控制模型迁移到在线系统。本发明所训练得到的电网无功电压控制模型,相较于传统方法,具备可迁移的特性,可以直接用于在线电网无功电压控制。相较于现有的基于强化学习的电网优化方法,本发明的在线控制训练成本与安全隐患大幅降低,更适合部署在实际电网系统中。

Description

一种电网无功电压控制模型训练方法及系统
技术领域
本发明属于电力系统运行和控制技术领域,特别涉及一种电网无功电压控制模型训练方法及系统。
背景技术
近年来,分布式可再生能源发电设备(DG,Distributed Generation)渗透率的不断提高,使新能源场站及其汇集区的电网调控愈发重要。DG作为一种灵活性资源,其装机容量往往大于其额定有功功率,且响应速度快,存在大量的可调控空间。为了解决大规模DG并网功率倒送带来的电压越限、设备脱网和网损严重等问题,针对DG的电网无功电压控制系统已成为关键措施。然而,由于电网的真实物理系统模型难以获得,传统基于模型的优化方法无法保障控制效果,常常出现控制指令远离最优点、电网运行在次优状态的情况。因此,数据驱动的无模型的优化方法,特别是近年来发展迅速的深度强化学习方法,是电网无功电压控制的重要手段。但数据驱动的深度强化学习方法,往往需要大量的在线训练,这既产生了高昂的训练成本,又导致了额外的安全隐患。
为了应对在线训练效率低下带来的成本问题与安全问题,可以采用提前用仿真模型进行离线训练的方式。然而,由于离线模型并非真实物理系统的电网模型,存在模型偏差,如果采用一般的深度强化学习方法,训练得到的离线模型没有可迁移的特性。这就意味着,将离线训练得到的模型用在在线系统上时,在开始阶段可能出现控制效果不理想的问题。因此,有必要研究一种电网无功电压控制模型训练方法,训练出具备可迁移特性的深度强化学习模型,使其可以安全高效地应用到在线电网无功电压控制系统上,在避免模型不完备带来控制偏差的同时,节省在线训练的成本,大幅提高在线控制的安全性与效率。
发明内容
针对上述问题,本发明提供了一种电网无功电压控制模型训练方法,所述方法包括:
建立电网仿真模型;
根据电网无功电压控制目标,建立无功电压优化模型;
结合电网仿真模型和无功电压优化模型,搭建基于对抗马尔科夫决策过程的交互训练环境;
通过联合对抗训练算法训练电网无功电压控制模型;
将训练后的电网无功电压控制模型迁移到在线系统。
进一步地,所述建立电网仿真模型,包括:
对于n+1个节点的区域电网,构建无向图,如下:
Π(N,E)
其中,N为电网节点集合,E为电网支路集合,E=(i,j)∈N×N,i、j均为电网节点。
进一步地,所述建立电网仿真模型,还包括:
构建电网潮流方程,如下:
Figure BDA0002494208260000021
Figure BDA0002494208260000022
Figure BDA0002494208260000023
其中,Vii分别为电网节点i的电压幅值和相角,所述Vj,θj分别为电网节点j的电压幅值和相角,Gij,Bij分别为电网支路ij的电导和电纳,Pij,Qij分别为电网支路ij的有功功率和无功功率,θij为电网支路ij的相角差;
对于电网节点j∈N,其功率的表达式如下:
Figure BDA0002494208260000024
Figure BDA0002494208260000025
其中,Pj,Qj分别为电网节点j的有功功率和无功功率注入,Gsh,i,Bsh,i分别为电网节点i的接地电导、电纳,PDj,QDj分别为电网节点j的有功功率和无功功率负荷,PGj,QGj分别为电网节点j基于分布式可再生能源发电设备的有功出力和无功出力,QCj为电网节点j基于静止无功补偿器的无功出力,NIB为电网接入的分布式可再生能源发电设备的电网节点集合,NCD为电网接入的静止无功补偿器的电网节点集合,K(i)为节点i所连接的所有支路的对端节点集合,
Figure BDA0002494208260000031
进一步地,所述无功电压优化模型如下:
Figure BDA0002494208260000032
Figure BDA0002494208260000033
Figure BDA0002494208260000034
Figure BDA0002494208260000035
其中,
Figure BDA0002494208260000036
分别为电网节点i的电压下限与上限,
Figure BDA0002494208260000037
分别为电网节点i的静止无功补偿器无功出力下限与上限,
Figure BDA0002494208260000038
分别为电网节点i的分布式可再生能源发电设备装机容量与有功功率出力上限。
进一步地,所述搭建基于对抗马尔科夫决策过程的交互训练环境,具体包括以下步骤:
A1、构建对抗马尔科夫决策过程状态变量,表达式如下:
s=(P,Q,V,t)
其中,P,Q分别为电网节点有功功率、无功功率注入向量,V为电网节点电压向量,t为训练中的时间变量;
A2、构建回馈变量,表达式如下:
Figure BDA0002494208260000039
其中,CV为电压抑制系数,ReLU为非线性函数,定义为ReLU(x)=max(0,x);
A3、构建无功电压控制模型动作变量ap,表达式如下:
ap=(QG,QC)
其中,QG,QC均为无功功率出力向量;
A4、构建对抗模型动作变量ao,表达式如下:
ao=(G,B)
其中,G,B分别为所有线路电导和电纳组成的向量。
进一步地,所述通过联合对抗训练算法训练电网无功电压控制模型,具体包括以下步骤:
B1、定义强化学习目标函数,表达式如下:
Figure BDA0002494208260000041
其中,γ为折合系数,αpo分别无功电压控制模型和对抗模型的最大熵乘子,πp为无功电压控制模型策略,πo为对抗模型策略,πp(·|st),πo(·|st)分别无功电压控制模型策略函数和对抗模型策略函数,定义为状态st下的动作概率分布,通过深度神经网络进行拟合,H为熵函数;
B2、通过再参数化方法,转换无功电压控制模型策略函数和对抗模型策略函数的形式,表达式分别如下:
Figure BDA0002494208260000042
Figure BDA0002494208260000043
其中,θ为无功电压控制模型策略网络参数,ω为对抗模型策略网络参数,μθ(s)和σθ(s)分别为无功电压控制模型的均值和方差函数,μω(s)和σω(s)分别为对抗模型的均值和方差函数,N(0,I)为标准高斯分布函数,ξpo分别无功电压控制模型和对抗模型的随机变量,s为对抗马尔科夫决策过程状态变量;
B3、定义联合对抗值函数网络
Figure BDA0002494208260000044
表达式如下:
Figure BDA0002494208260000045
其中,s'为t+1时刻的对抗马尔科夫决策过程状态变量,a'p,a'o分别为t+1时刻的无功电压控制模型和对抗模型的动作变量,πp(a'p|s'),πo(a'o|s')分别为t+1时刻的无功电压控制模型动作概率值和对抗模型动作概率值;
计算联合对抗值函数网络
Figure BDA0002494208260000046
的估计值,如下:
Figure BDA0002494208260000047
其中,
Figure BDA0002494208260000048
分别为t+1时刻的无功电压控制模型和对抗模型的预估动作变量;
采用下式对联合对抗值函数网络
Figure BDA0002494208260000049
进行训练:
Figure BDA00024942082600000410
其中,φ为参数,πp(·|s'),πo(·|s')分别为t+1时刻的无功电压控制模型策略函数和对抗模型策略函数;
B4、训练无功电压控制模型策略网络,表达式如下:
Figure BDA0002494208260000051
进一步地,所述熵函数H的表达式如下:
Figure BDA0002494208260000052
进一步地,所述将训练后的电网无功电压控制模型迁移到在线系统,具体包括以下步骤:
C1、获取最优联合对抗值函数网络
Figure BDA0002494208260000053
与当前无功电压控制模型策略πp
C2、通过下式
Figure BDA0002494208260000054
将联合对抗值函数网络边际化;
C3、将边际化后的联合对抗值函数网络与无功电压控制模型策略网络形成的无功电压控制模型策略πp部署到在线系统;
C4、初始化时间变量t=0,初始化经验库
Figure BDA0002494208260000055
经验库D表达式如下:
Figure BDA0002494208260000056
其中,st为t时刻对抗马尔科夫决策过程状态变量,
Figure BDA0002494208260000057
为t时刻无功电压控制模型动作变量,
Figure BDA0002494208260000058
为t时刻对抗模型动作变量,rt为t时刻回馈变量,s′t为t+1时刻的对抗马尔科夫决策过程状态变量。
进一步地,所述方法还包括无功电压控制模型持续在线学习,具体包括以下步骤:
S1、从区域电网的量测装置获得量测数据,形成对应的状态变量st=(P,Q,V,t);
S2、从经验库中抽取一组经验DB∈D,B为数量;
S3、在DB上更新无功电压控制模型;
S4、利用无功电压控制模型策略网络,生成t时刻最优动作at=tanh(μθ(st)+σθ(st)⊙ξ)=(QG,QC);
S5、将所述最优动作通过遥调系统下发给被控设备;
S6、t=t+1,返回步骤S1。
本发明还提供了一种电网无功电压控制模型训练系统,所述系统包括:
仿真模型模块,用于建立电网仿真模型;
优化模型模块,用于根据电网无功电压控制目标,建立无功电压优化模型;
训练环境搭建模块,用于结合电网仿真模型和无功电压优化模型,搭建基于对抗马尔科夫决策过程的交互训练环境;
训练模块,用于通过联合对抗训练算法训练电网无功电压控制模型;
迁移模块,用于将训练后的电网无功电压控制模型迁移到在线系统。
本发明所训练得到的电网无功电压控制模型,相较于传统方法,具备可迁移的特性。本发明仅需电网仿真模型,训练得到的模型可以直接用于在线电网无功电压控制。由于模型已经提前掌握电网的基本运行规律,无需在实际物理系统上做出大范围的试探性调控动作,进而节省了高昂的在线训练成本。相较于现有的基于强化学习的电网优化方法,本发明的在线控制训练成本与安全隐患大幅降低,更适合部署在实际电网系统中。
本发明所训练的可迁移模型,不仅可以直接部署在电网无功电压控制系统中,还能够在线持续挖掘控制过程数据,适应电网的模型变化,从而保证了电网无功电压控制指令的有效性,提升电网运行的高效性与安全性。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在说明书、权利要求书以及附图中所指出的结构来实现和获得。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了本发明实施例的电网无功电压控制模型训练方法流程图;
图2示出了本发明实施例的电网无功电压控制模型训练系统示意图;
图3示出了本发明实施例的电网无功电压控制模型训练架构图;
图4示出了本发明实施例的电网无功电压控制模型训练装置示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地说明,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明提供了一种电网无功电压控制模型训练方法,示例性的,图1示出了本发明实施例的电网无功电压控制模型训练方法流程图,如图1所示,所述方法包括以下步骤:
步骤1:建立电网仿真模型,所述电网仿真模型包括基于n+1个节点的区域电网的无向图、电网潮流方程、电网中各个电网节点功率表达式以及电网参数,具体如下:
对于一个n+1个节点的区域电网,构建一个无向图Π(N,E),其中N为电网节点集合,N=0,...,n,E为电网支路集合,E=(i,j)∈N×N,i、j均为电网节点。构建电网潮流方程,如下所示:
Figure BDA0002494208260000071
其中,Vii分别为电网节点i的电压幅值和相角,所述Vj,θj分别为电网节点j的电压幅值和相角,Gij,Bij分别为电网支路ij的电导和电纳,Pij,Qij分别为电网支路ij的有功功率和无功功率,θij为电网支路ij的相角差。
对于电网节点j∈N,其功率的表达式如下:
Figure BDA0002494208260000081
其中,Pj,Qj分别为电网节点j的有功功率和无功功率注入,Gsh,i,Bsh,i分别为电网节点i的接地电导、电纳,PDj,QDj分别为电网节点j的有功功率和无功功率负荷,PGj,QGj分别为电网节点j基于DG(分布式可再生能源发电设备)的有功出力和无功出力,QCj为电网节点j基于静止无功补偿器(SVC,static var compensator)的无功出力,NIB为电网接入DG的电网节点集合,NCD为电网接入静止无功补偿器的电网节点集合,K(i)为节点i所连接的所有支路的对端节点集合。不失一般性地,
Figure BDA0002494208260000082
步骤2:根据电网无功电压控制目标,即根据能够使得电网达到最小化网络损耗,保证各电网节点电压在限制范围内的控制目标,建立无功电压优化模型,表达式如下:
Figure BDA0002494208260000083
其中,
Figure BDA0002494208260000084
分别为电网节点i的电压下限与上限,
Figure BDA0002494208260000085
分别为电网节点i的静止无功补偿器无功出力下限与上限,
Figure BDA0002494208260000086
分别为电网节点i的DG装机容量与有功功率出力上限。
步骤3:结合电网仿真模型与无功电压优化模型,搭建基于对抗马尔科夫决策过程(AMDP)的交互训练环境,具体包括如下步骤:
3.1、采用电网系统量测的数据,构建对抗马尔科夫决策过程状态变量,表达式如下:
s=(P,Q,V,t) (4)
其中,P,Q分别为电网节点有功功率、无功功率注入向量,V为电网节点电压向量,t为训练中的时间变量。
3.2、基于无功电压优化模型,构建回馈变量,表达式如下:
Figure BDA0002494208260000091
其中,CV为电压抑制系数,典型值取1000,ReLU为非线性函数,定义为ReLU(x)=max(0,x)。
3.3、对于可控灵活性资源无功功率,如分布式可再生能源发电设备和静止无功补偿器的无功功率等,构建无功电压控制模型动作变量ap,表达式如下:
ap=(QG,QC) (6)
其中,QG,QC均为无功功率出力向量。
3.4、对于电网仿真模型参数不确定性,即参数误差的可能范围,构建对抗模型动作变量ao,用于对无功电压控制模型进行干扰,表达式如下:
ao=(G,B) (7)
其中,G,B分别为所有线路电导和电纳组成的向量。
步骤4:通过联合对抗训练算法训练电网无功电压控制模型,具体包括如下步骤:
4.1、定义强化学习目标函数,表达式如下:
Figure BDA0002494208260000092
其中,γ为折合系数,典型值取0.95,αpo分别对应无功电压控制模型和对抗模型的最大熵乘子,典型值取0.1,πp(·|st),πo(·|st)分别对应无功电压控制模型策略函数和对抗模型策略函数,定义为状态st下的动作概率分布,通过深度神经网络进行拟合,H为熵函数,表达式如下:
Figure BDA0002494208260000093
4.2、通过再参数化方法,转换无功电压控制模型策略函数和对抗模型策略函数的形式,表达式分别如下:
Figure BDA0002494208260000094
其中,θ为无功电压控制模型策略网络参数,ω为对抗模型策略网络参数,μθ(s)和σθ(s)分别为无功电压控制模型的均值和方差函数,μω(s)和σω(s)分别为对抗模型的均值和方差函数,N(0,I)为标准高斯分布函数,ξpo分别无功电压控制模型和对抗模型的随机变量,s为对抗马尔科夫决策过程状态变量。
4.3、定义并训练联合对抗值函数网络
Figure BDA0002494208260000101
其中φ为参数,值函数网络代表对应状态与动作下的期望回馈,通过贝尔曼方程得出
Figure BDA0002494208260000102
的递推形式,表达式如下:
Figure BDA0002494208260000103
其中,s'为t+1时刻的对抗马尔科夫决策过程状态变量,a'p,a'o分别为t+1时刻的无功电压控制模型和对抗模型的动作变量,πp(a'p|s'),πo(a'o|s')分别为t+1时刻的无功电压控制模型动作概率值和对抗模型动作概率值。
由上,可计算
Figure BDA0002494208260000104
的估计值用于训练,如下所示:
Figure BDA0002494208260000105
其中,
Figure BDA0002494208260000106
分别为t+1时刻的无功电压控制模型和对抗模型的预估动作变量。
训练联合对抗值函数网络
Figure BDA0002494208260000107
时可采用下式:
Figure BDA0002494208260000108
其中,φ为参数,πp(·|s'),πo(·|s')分别为t+1时刻的无功电压控制模型策略函数和对抗模型策略函数。
4.4、训练无功电压控制模型策略网络,表达式如下:
Figure BDA0002494208260000109
步骤5:将训练后的无功电压控制模型迁移到在线系统,具体包括如下步骤:
5.1、经过上述多轮训练,直到达到收敛状态,得到最优联合对抗值函数网络
Figure BDA00024942082600001010
与当前无功电压控制模型策略πp,停止训练过程。
5.2、通过下式
Figure BDA0002494208260000111
将联合对抗值函数网络边际化。
5.3、将边际化后的联合对抗值函数网络与无功电压控制模型策略网络形成的无功电压控制模型策略πp部署到在线系统。
5.4、初始化时间变量t=0,初始化经验库
Figure BDA0002494208260000112
经验库D为所有历史经验组成的集合,经验库D表达式如下:
Figure BDA0002494208260000113
其中,st为t时刻对抗马尔科夫决策过程状态变量,
Figure BDA0002494208260000114
为t时刻无功电压控制模型动作变量,
Figure BDA0002494208260000115
为t时刻对抗模型动作变量,rt为t时刻回馈变量,st′为t+1时刻的对抗马尔科夫决策过程状态变量。
步骤6:无功电压控制模型持续在线学习,具体包括如下步骤:
6.1、从区域电网的量测装置获得量测数据,形成对应的状态变量st=(P,Q,V,t)。
6.2、从经验库中抽取一组经验DB∈D,数量为B,典型值为64。
6.3、利用式(13)与式(14),在DB上更新无功电压控制模型。
6.4、利用无功电压控制模型策略网络,生成t时刻最优动作at=tanh(μθ(st)+σθ(st)⊙ξ)=(QG,QC)。
6.5、将上述最优动作通过遥调系统下发给被控设备,其中,遥调系统用于接受并执行遥调命令,对远程的控制量设备进行远程调试,被控设备包括分布式可再生能源发电设备和静止无功补偿器。
6.6、t=t+1,返回步骤6.1。
本发明还提供了一种能够实现上述方法的电网无功电压控制模型训练系统,如图2所示,所述系统包括:仿真模型模块、优化模型模块、训练环境搭建模块、训练模块、迁移模块和学习模块。具体的,仿真模型模块用于建立电网仿真模型,如上述步骤1;优化模型模块用于根据电网无功电压控制目标,建立无功电压优化模型,如上述步骤2;训练环境搭建模块用于结合电网仿真模型和无功电压优化模型,搭建基于对抗马尔科夫决策过程的交互训练环境,如上述步骤3;训练模块用于通过联合对抗训练算法训练电网无功电压控制模型,如上述步骤4;迁移模块用于将训练后的电网无功电压控制模型迁移到在线系统,如上述步骤5;学习模块用于无功电压控制模型持续在线学习,如上述步骤6。
示例性的,图3示出了本发明实施例的电网无功电压控制模型训练架构图,如图3所示,包括区域电网调控中心服务器,区域电网控制器及区域电网,其中,所述区域电网包括n+1个节点,为了便于描述,本实施例中以5个电网节点为例,每个电网节点上均设有量测装置,并且根据需求选择性的在一个电网节点或多个电网节点上设置分布式可再生能源发电设备或静止无功补偿器,本实施例选择在其中一个电网节点上设置分布式可再生能源发电设备,在其中另一个电网节点上设置静止无功补偿器,分布式可再生能源发电设备与静止无功补偿器不能同时存在于同一个电网节点上。需要说明的是,在实际的物理系统上,DG和SVC可以存在于同一个电网节点上。具体的,量测装置包括电压量测装置、电流量测装置和功率量测装置,其中,电压量测装置用于量测各个电网节点的电压,电流量测装置用于量测各个电网节点的电流,功率量测装置用于量测各个电网节点的有功功率和无功功率,从而获得各电网节点的有功功率向量、无功功率向量及电压向量。所述量测装置可以采用传感器,例如,电压量测装置为电压传感器、电流量测装置为电流传感器,但不限于此。
区域电网调控中心服务器根据电网系统中各电网节点量测装置量测的数据建立无功电压控制模型,无功电压控制模型建立步骤如上述步骤1-步骤5,区域电网调控中心服务器建立的无功电压控制模型将部署到在线系统中,即区域电网控制器中,无功电压控制模型在区域电网控制器中持续在线学习。具体的,所述区域电网与区域电网控制器之间采用遥调系统进行通信,所述区域电网中各个电网节点的量测装置通过所述遥调系统向所述区域电网控制器传送所述量测装置量测的数据,包括各个电网节点的有功、无功功率注入向量及电网节点电压向量,所述区域电网控制器根据所述量测装置量测的数据控制所述无功电压控制模型在线学习,学习步骤如上述步骤6。所述无功电压控制模型持续在线学习,生成最优无功电压控制策略,并将最优无功电压控制策略下发至区域电网中的所述分布式可再生能源发电设备和静止无功补偿器,控制所述分布式可再生能源发电设备和静止无功补偿器进行相应动作。
本发明还提出了一种计算机可读存储介质,所述计算机可读存储介质中存储有逻辑指令,处理器可以调用计算机可读存储介质中的逻辑指令,以执行上述实施例的方法,如图4所示,图4中以一个处理器和一个计算机可读存储介质为例。
此外,上述的计算机可读存储介质中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用。
上述的计算机可读存储介质可用于存储软件程序、计算机可执行程序,如本实施例中的方法对应的程序指令/模块。处理器通过运行存储在计算机可读存储介质中的软件程序、指令以及模块,从而执行功能应用以及数据处理,即实现上述实施例中的用于无功电压控制模型训练的方法。
计算机可读存储介质可包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据终端设备的使用所创建的数据等。此外,计算机可读存储介质可以包括高速随机存取存储器,还可以包括非易失性存储器。
本实施例通过将电网仿真模型与真实物理系统模型的误差视为训练中的扰动,建立对抗马尔科夫决策过程,同步训练对抗模型,利用模型误差干扰无功电压控制模型,进而使无功电压控制模型对模型误差鲁棒,从而训练出可迁移的深度强化学习模型。本实施例充分利用电网仿真模型的内在信息,所得到的模型可以安全高效地迁移到在线电网无功电压控制中,大幅提高了数据驱动的电网无功电压控制方法的效率与安全性,特别适合模型不完备问题严重的区域电网使用,既节省了重复维护精确模型带来的高昂成本,又避免了数据驱动电网无功电压控制方法在线学习所产生的安全性问题,适合大规模推广。
尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (8)

1.一种电网无功电压控制模型训练方法,其特征在于,所述方法包括:
建立电网仿真模型;
根据电网无功电压控制目标,建立无功电压优化模型;
结合电网仿真模型和无功电压优化模型,搭建基于对抗马尔科夫决策过程的交互训练环境;
通过联合对抗训练算法训练电网无功电压控制模型;
将训练后的电网无功电压控制模型迁移到在线系统;
所述搭建基于对抗马尔科夫决策过程的交互训练环境,具体包括以下步骤:
A1、构建对抗马尔科夫决策过程状态变量,表达式如下:
s=(P,Q,V,t)
其中,P,Q分别为电网节点有功功率、无功功率注入向量,V为电网节点电压向量,t为训练中的时间变量;
A2、构建回馈变量,表达式如下:
Figure FDA0003617382190000011
其中,CV为电压抑制系数,ReLU为非线性函数,定义为ReLU(x)=max(0,x),Pi(t)为t时刻节点i有功功率注入,Vi(t)为t时刻节点i电压,
Figure FDA0003617382190000012
为设定的电压最大值,V为设定的电压最小值;
A3、构建无功电压控制模型动作变量ap,表达式如下:
ap=(QG,QC)
其中,QG,QC均为无功功率出力向量;
A4、构建对抗模型动作变量ao,表达式如下:
ao=(G,B)
其中,G,B分别为所有线路电导和电纳组成的向量;
所述通过联合对抗训练算法训练电网无功电压控制模型,具体包括以下步骤:
B1、定义强化学习目标函数,表达式如下:
Figure FDA0003617382190000013
其中,γ为折合系数,αpo分别无功电压控制模型和对抗模型的最大熵乘子,πp为无功电压控制模型策略,πo为对抗模型策略,πp(·|st),πo(·|st)分别无功电压控制模型策略函数和对抗模型策略函数,定义为状态st下的动作概率分布,通过深度神经网络进行拟合,H为熵函数;
B2、通过再参数化方法,转换无功电压控制模型策略函数和对抗模型策略函数的形式,表达式分别如下:
Figure FDA0003617382190000021
Figure FDA0003617382190000022
其中,θ为无功电压控制模型策略网络参数,ω为对抗模型策略网络参数,μθ(s)和σθ(s)分别为无功电压控制模型的均值和方差函数,μω(s)和σω(s)分别为对抗模型的均值和方差函数,N(0,I)为标准高斯分布函数,ξpo分别无功电压控制模型和对抗模型的随机变量,s为对抗马尔科夫决策过程状态变量;
B3、定义联合对抗值函数网络
Figure FDA0003617382190000023
表达式如下:
Figure FDA0003617382190000024
其中,s'为t+1时刻的对抗马尔科夫决策过程状态变量,a'p,a'o分别为t+1时刻的无功电压控制模型和对抗模型的动作变量,πp(a'p|s'),πo(a'o|s')分别为t+1时刻的无功电压控制模型动作概率值和对抗模型动作概率值,s为对抗马尔科夫决策过程状态变量,ap、ao分别为无功电压控制模型和对抗模型的动作变量;
计算联合对抗值函数网络
Figure FDA0003617382190000025
的估计值,如下:
Figure FDA0003617382190000026
其中,
Figure FDA0003617382190000027
分别为t+1时刻的无功电压控制模型和对抗模型的预估动作变量,r为回馈变量;
采用下式对联合对抗值函数网络
Figure FDA0003617382190000028
进行训练:
Figure FDA0003617382190000029
其中,φ为参数,πp(·|s'),πo(·|s')分别为t+1时刻的无功电压控制模型策略函数和对抗模型策略函数;
B4、训练无功电压控制模型策略网络,表达式如下:
Figure FDA0003617382190000031
2.根据权利要求1所述的电网无功电压控制模型训练方法,其特征在于,所述建立电网仿真模型,包括:
对于n+1个节点的区域电网,构建无向图,如下:
Π(N,E)
其中,N为电网节点集合,E为电网支路集合,E=(i,j)∈N×N,i、j均为电网节点。
3.根据权利要求2所述的电网无功电压控制模型训练方法,其特征在于,所述建立电网仿真模型,还包括:
构建电网潮流方程,如下:
Figure FDA0003617382190000032
Figure FDA0003617382190000033
Figure FDA0003617382190000034
其中,Vii分别为电网节点i的电压幅值和相角,所述Vjj分别为电网节点j的电压幅值和相角,Gij,Bij分别为电网支路ij的电导和电纳,Pij,Qij分别为电网支路ij的有功功率和无功功率,θij为电网支路ij的相角差;
对于电网节点j∈N,其功率的表达式如下:
Figure FDA0003617382190000035
Figure FDA0003617382190000036
其中,Pj,Qj分别为电网节点j的有功功率和无功功率注入,Gsh,i,Bsh,i分别为电网节点i的接地电导、电纳,PDj,QDj分别为电网节点j的有功功率和无功功率负荷,PGj,QGj分别为电网节点j基于分布式可再生能源发电设备的有功出力和无功出力,QCj为电网节点j基于静止无功补偿器的无功出力,NIB为电网接入的分布式可再生能源发电设备的电网节点集合,NCD为电网接入的静止无功补偿器的电网节点集合,K(i)为节点i所连接的所有支路的对端节点集合,
Figure FDA0003617382190000041
4.根据权利要求2所述的电网无功电压控制模型训练方法,其特征在于,所述无功电压优化模型如下:
Figure FDA0003617382190000042
Figure FDA0003617382190000043
Figure FDA0003617382190000044
Figure FDA0003617382190000045
其中,Vi ,
Figure FDA0003617382190000046
分别为电网节点i的电压下限与上限,QCi ,
Figure FDA0003617382190000047
分别为电网节点i的静止无功补偿器无功出力下限与上限,SGi,
Figure FDA0003617382190000048
分别为电网节点i的分布式可再生能源发电设备装机容量与有功功率出力上限;Pj为电网节点j的有功功率,QGi为电网节点i基于DG的无功出力,QCi为电网节点i的静止无功补偿器无功出力,Vi为电网节点i的电压。
5.根据权利要求1所述的电网无功电压控制模型训练方法,其特征在于,所述熵函数H的表达式如下:
Figure FDA0003617382190000049
6.根据权利要求5所述的电网无功电压控制模型训练方法,其特征在于,所述将训练后的电网无功电压控制模型迁移到在线系统,具体包括以下步骤:
C1、获取最优联合对抗值函数网络
Figure FDA00036173821900000410
与当前无功电压控制模型策略πp
C2、通过下式
Figure FDA00036173821900000411
将联合对抗值函数网络边际化;
C3、将边际化后的联合对抗值函数网络与无功电压控制模型策略网络形成的无功电压控制模型策略πp部署到在线系统;
C4、初始化时间变量t=0,初始化经验库
Figure FDA00036173821900000412
经验库D表达式如下:
Figure FDA00036173821900000413
其中,st为t时刻对抗马尔科夫决策过程状态变量,
Figure FDA00036173821900000414
为t时刻无功电压控制模型动作变量,
Figure FDA00036173821900000415
为t时刻对抗模型动作变量,rt为t时刻回馈变量,s′t为t+1时刻的对抗马尔科夫决策过程状态变量。
7.根据权利要求6所述的电网无功电压控制模型训练方法,其特征在于,所述方法还包括无功电压控制模型持续在线学习,具体包括以下步骤:
S1、从区域电网的量测装置获得量测数据,形成对应的状态变量st=(P,Q,V,t);
S2、从经验库中抽取一组经验DB∈D,B为数量;
S3、在DB上更新无功电压控制模型;
S4、利用无功电压控制模型策略网络,生成t时刻最优动作at=tanh(μθ(st)+σθ(st)⊙ξ)=(QG,QC);
S5、将所述最优动作通过遥调系统下发给被控设备;
S6、t=t+1,返回步骤S1。
8.一种电网无功电压控制模型训练系统,其特征在于,所述系统包括:
仿真模型模块,用于建立电网仿真模型;
优化模型模块,用于根据电网无功电压控制目标,建立无功电压优化模型;
训练环境搭建模块,用于结合电网仿真模型和无功电压优化模型,搭建基于对抗马尔科夫决策过程的交互训练环境;
训练模块,用于通过联合对抗训练算法训练电网无功电压控制模型;
迁移模块,用于将训练后的电网无功电压控制模型迁移到在线系统;
所述搭建基于对抗马尔科夫决策过程的交互训练环境,具体包括以下步骤:
A1、构建对抗马尔科夫决策过程状态变量,表达式如下:
s=(P,Q,V,t)
其中,P,Q分别为电网节点有功功率、无功功率注入向量,V为电网节点电压向量,t为训练中的时间变量;
A2、构建回馈变量,表达式如下:
Figure FDA0003617382190000051
其中,CV为电压抑制系数,ReLU为非线性函数,定义为ReLU(x)=max(0,x),Pi(t)为t时刻节点i有功功率注入,Vi(t)为t时刻节点i电压,
Figure FDA0003617382190000052
为设定的电压最大值,V为设定的电压最小值;
A3、构建无功电压控制模型动作变量ap,表达式如下:
ap=(QG,QC)
其中,QG,QC均为无功功率出力向量;
A4、构建对抗模型动作变量ao,表达式如下:
ao=(G,B)
其中,G,B分别为所有线路电导和电纳组成的向量;
所述通过联合对抗训练算法训练电网无功电压控制模型,具体包括以下步骤:
B1、定义强化学习目标函数,表达式如下:
Figure FDA0003617382190000061
其中,γ为折合系数,αpo分别无功电压控制模型和对抗模型的最大熵乘子,πp为无功电压控制模型策略,πo为对抗模型策略,πp(·|st),πo(·|st)分别无功电压控制模型策略函数和对抗模型策略函数,定义为状态st下的动作概率分布,通过深度神经网络进行拟合,H为熵函数;
B2、通过再参数化方法,转换无功电压控制模型策略函数和对抗模型策略函数的形式,表达式分别如下:
Figure FDA0003617382190000062
Figure FDA0003617382190000063
其中,θ为无功电压控制模型策略网络参数,ω为对抗模型策略网络参数,μθ(s)和σθ(s)分别为无功电压控制模型的均值和方差函数,μω(s)和σω(s)分别为对抗模型的均值和方差函数,N(0,I)为标准高斯分布函数,ξpo分别无功电压控制模型和对抗模型的随机变量,s为对抗马尔科夫决策过程状态变量;
B3、定义联合对抗值函数网络
Figure FDA0003617382190000064
表达式如下:
Figure FDA0003617382190000065
其中,s'为t+1时刻的对抗马尔科夫决策过程状态变量,a'p,a'o分别为t+1时刻的无功电压控制模型和对抗模型的动作变量,πp(a'p|s'),πo(a'o|s')分别为t+1时刻的无功电压控制模型动作概率值和对抗模型动作概率值,s为对抗马尔科夫决策过程状态变量,ap、ao分别为无功电压控制模型和对抗模型的动作变量;
计算联合对抗值函数网络
Figure FDA0003617382190000066
的估计值,如下:
Figure FDA0003617382190000071
其中,
Figure FDA0003617382190000072
分别为t+1时刻的无功电压控制模型和对抗模型的预估动作变量,r为回馈变量;
采用下式对联合对抗值函数网络
Figure FDA0003617382190000073
进行训练:
Figure FDA0003617382190000074
其中,φ为参数,πp(·|s'),πo(·|s')分别为t+1时刻的无功电压控制模型策略函数和对抗模型策略函数;
B4、训练无功电压控制模型策略网络,表达式如下:
Figure FDA0003617382190000075
CN202010413883.4A 2020-05-15 2020-05-15 一种电网无功电压控制模型训练方法及系统 Active CN111666713B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202010413883.4A CN111666713B (zh) 2020-05-15 2020-05-15 一种电网无功电压控制模型训练方法及系统
US17/025,154 US11689021B2 (en) 2020-05-15 2020-09-18 Power grid reactive voltage control model training method and system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010413883.4A CN111666713B (zh) 2020-05-15 2020-05-15 一种电网无功电压控制模型训练方法及系统

Publications (2)

Publication Number Publication Date
CN111666713A CN111666713A (zh) 2020-09-15
CN111666713B true CN111666713B (zh) 2022-07-08

Family

ID=72383830

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010413883.4A Active CN111666713B (zh) 2020-05-15 2020-05-15 一种电网无功电压控制模型训练方法及系统

Country Status (2)

Country Link
US (1) US11689021B2 (zh)
CN (1) CN111666713B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021263010A2 (en) * 2020-06-26 2021-12-30 X Development Llc Electrical power grid modeling
CN112801303A (zh) * 2021-02-07 2021-05-14 中兴通讯股份有限公司 一种智能流水线处理方法、装置、存储介质及电子装置
CN113328435B (zh) * 2021-05-26 2022-12-09 国网河北省电力有限公司 一种基于强化学习的主动配电网有功无功联合控制方法
CN114188997A (zh) * 2021-12-07 2022-03-15 国网甘肃省电力公司电力科学研究院 一种高占比新能源电源接入区域电网的动态无功优化方法
CN115752076B (zh) * 2022-10-27 2023-12-01 成都飞创科技有限公司 一种冷却循环水系统控制方法
CN115912384A (zh) * 2022-12-21 2023-04-04 国网湖北省电力有限公司经济技术研究院 改善特高压直流受端含高比例新能源系统的电压稳定方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103208803B (zh) * 2013-04-18 2015-02-04 国家电网公司 风电和光电集中并网的无功电压优化控制方法
CN108599180B (zh) * 2018-02-02 2019-10-25 国网江西省电力有限公司经济技术研究院 一种考虑功率随机性的配电网无功电压优化方法
US20200327411A1 (en) * 2019-04-14 2020-10-15 Di Shi Systems and Method on Deriving Real-time Coordinated Voltage Control Strategies Using Deep Reinforcement Learning
CN110474339B (zh) * 2019-08-07 2022-06-03 国网福建省电力有限公司 一种基于深度发电负荷预测的电网无功控制方法

Also Published As

Publication number Publication date
CN111666713A (zh) 2020-09-15
US11689021B2 (en) 2023-06-27
US20210359517A1 (en) 2021-11-18

Similar Documents

Publication Publication Date Title
CN111666713B (zh) 一种电网无功电压控制模型训练方法及系统
CN111564849B (zh) 基于两阶段深度强化学习的电网无功电压控制方法
CN110535146B (zh) 基于深度确定策略梯度强化学习的电力系统无功优化方法
Lopez-Garcia et al. Artificial neural networks in microgrids: A review
US11336092B2 (en) Multi-objective real-time power flow control method using soft actor-critic
Lu et al. The PID Controller Based on the Artificial Neural Network and the Differential Evolution Algorithm.
Su et al. Deep belief network enabled surrogate modeling for fast preventive control of power system transient stability
Guo et al. Policy approximation in policy iteration approximate dynamic programming for discrete-time nonlinear systems
Liu et al. Data-driven optimal tracking control for discrete-time systems with delays using adaptive dynamic programming
CN113363998B (zh) 一种基于多智能体深度强化学习的配电网电压控制方法
Yousefian et al. A review of neural network based machine learning approaches for rotor angle stability control
CN111799808B (zh) 基于多智能体深度强化学习的电压分布式控制方法及系统
CN113489015A (zh) 一种基于强化学习的配电网多时间尺度无功电压控制方法
Zhang et al. Deep reinforcement learning for load shedding against short-term voltage instability in large power systems
CN113315131A (zh) 一种电网运行方式智能调节方法及系统
CN115588998A (zh) 一种基于图强化学习的配电网电压无功优化方法
Chaturvedi et al. Experimental studies with a generalized neuron-based power system stabilizer
Yin et al. Quantum deep reinforcement learning for rotor side converter control of double-fed induction generator-based wind turbines
CN113872213B (zh) 一种配电网电压自主优化控制方法及装置
Zeng et al. Distributed deep reinforcement learning-based approach for fast preventive control considering transient stability constraints
Wang et al. Transient stability preventive control based on graph convolution neural network and transfer deep reinforcement learning
CN111224427A (zh) 一种微电网自适应反孤岛扰动负载阻抗值预测方法及装置
Liu et al. Deep reinforcement learning-based voltage control method for distribution network with high penetration of renewable energy
CN113852082A (zh) 一种电力系统暂态稳定预防控制方法和装置
CN113240072A (zh) 一种用于直流微电网集群的基于深度学习的预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant