CN116822806A - 电网的调度方法、电子设备及可读存储介质 - Google Patents
电网的调度方法、电子设备及可读存储介质 Download PDFInfo
- Publication number
- CN116822806A CN116822806A CN202210239430.3A CN202210239430A CN116822806A CN 116822806 A CN116822806 A CN 116822806A CN 202210239430 A CN202210239430 A CN 202210239430A CN 116822806 A CN116822806 A CN 116822806A
- Authority
- CN
- China
- Prior art keywords
- power grid
- scheduling
- decision
- action
- scheduled
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 99
- 238000003860 storage Methods 0.000 title claims abstract description 13
- 230000009471 action Effects 0.000 claims abstract description 334
- 238000012549 training Methods 0.000 claims description 42
- 238000013528 artificial neural network Methods 0.000 claims description 20
- 238000005457 optimization Methods 0.000 claims description 20
- 230000015654 memory Effects 0.000 claims description 13
- 238000010801 machine learning Methods 0.000 claims description 11
- 238000010248 power generation Methods 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 6
- 230000000875 corresponding effect Effects 0.000 description 73
- 230000002787 reinforcement Effects 0.000 description 27
- 238000004088 simulation Methods 0.000 description 27
- 238000013138 pruning Methods 0.000 description 19
- 230000008569 process Effects 0.000 description 18
- 238000010586 diagram Methods 0.000 description 17
- 230000006870 function Effects 0.000 description 13
- 230000008859 change Effects 0.000 description 11
- 238000009826 distribution Methods 0.000 description 7
- 238000013507 mapping Methods 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 238000012216 screening Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 238000011156 evaluation Methods 0.000 description 4
- 230000004913 activation Effects 0.000 description 3
- 230000015556 catabolic process Effects 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 210000002569 neuron Anatomy 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 230000032683 aging Effects 0.000 description 2
- 230000033228 biological regulation Effects 0.000 description 2
- 239000003990 capacitor Substances 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000007476 Maximum Likelihood Methods 0.000 description 1
- 101100499229 Mus musculus Dhrsx gene Proteins 0.000 description 1
- 230000004931 aggregating effect Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000011960 computer-aided design Methods 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 230000003278 mimic effect Effects 0.000 description 1
- 238000004867 photoacoustic spectroscopy Methods 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 238000002922 simulated annealing Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02J—CIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
- H02J13/00—Circuit arrangements for providing remote indication of network conditions, e.g. an instantaneous record of the open or closed condition of each circuitbreaker in the network; Circuit arrangements for providing remote control of switching means in a power distribution network, e.g. switching in and out of current consumers by using a pulse code signal carried by the network
- H02J13/00006—Circuit arrangements for providing remote indication of network conditions, e.g. an instantaneous record of the open or closed condition of each circuitbreaker in the network; Circuit arrangements for providing remote control of switching means in a power distribution network, e.g. switching in and out of current consumers by using a pulse code signal carried by the network characterised by information or instructions transport means between the monitoring, controlling or managing units and monitored, controlled or operated power network element or electrical equipment
- H02J13/00022—Circuit arrangements for providing remote indication of network conditions, e.g. an instantaneous record of the open or closed condition of each circuitbreaker in the network; Circuit arrangements for providing remote control of switching means in a power distribution network, e.g. switching in and out of current consumers by using a pulse code signal carried by the network characterised by information or instructions transport means between the monitoring, controlling or managing units and monitored, controlled or operated power network element or electrical equipment using wireless data transmission
- H02J13/00026—Circuit arrangements for providing remote indication of network conditions, e.g. an instantaneous record of the open or closed condition of each circuitbreaker in the network; Circuit arrangements for providing remote control of switching means in a power distribution network, e.g. switching in and out of current consumers by using a pulse code signal carried by the network characterised by information or instructions transport means between the monitoring, controlling or managing units and monitored, controlled or operated power network element or electrical equipment using wireless data transmission involving a local wireless network, e.g. Wi-Fi, ZigBee or Bluetooth
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02J—CIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
- H02J13/00—Circuit arrangements for providing remote indication of network conditions, e.g. an instantaneous record of the open or closed condition of each circuitbreaker in the network; Circuit arrangements for providing remote control of switching means in a power distribution network, e.g. switching in and out of current consumers by using a pulse code signal carried by the network
- H02J13/00032—Systems characterised by the controlled or operated power network elements or equipment, the power network elements or equipment not otherwise provided for
- H02J13/00036—Systems characterised by the controlled or operated power network elements or equipment, the power network elements or equipment not otherwise provided for the elements or equipment being or involving switches, relays or circuit breakers
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02J—CIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
- H02J3/00—Circuit arrangements for ac mains or ac distribution networks
- H02J3/007—Arrangements for selectively connecting the load or loads to one or several among a plurality of power lines or power sources
- H02J3/0075—Arrangements for selectively connecting the load or loads to one or several among a plurality of power lines or power sources for providing alternative feeding paths between load and source according to economic or energy efficiency considerations, e.g. economic dispatch
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02J—CIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
- H02J2203/00—Indexing scheme relating to details of circuit arrangements for AC mains or AC distribution networks
- H02J2203/20—Simulating, e g planning, reliability check, modelling or computer assisted design [CAD]
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- Power Engineering (AREA)
- Theoretical Computer Science (AREA)
- Marketing (AREA)
- Entrepreneurship & Innovation (AREA)
- General Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Operations Research (AREA)
- Development Economics (AREA)
- Quality & Reliability (AREA)
- Health & Medical Sciences (AREA)
- Game Theory and Decision Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Educational Administration (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Supply And Distribution Of Alternating Current (AREA)
Abstract
本申请涉及电力技术领域,具体涉及一种电网的调度方法、电子设备及可读存储介质。其中,电网的调度方法包括获取电网系统的第一电网状态信息;将第一电网状态信息分别输入多个电网决策模型,得到多个决策结果,其中,每个所述电网决策模型对应至少一个待调度对象,电网决策模型输出的决策结果为对对应的待调度对象的调度动作的决策,并且不同的电网决策模型所对应的待调度对象的调度动作的决策复杂度不同;根据多个电网决策模型的决策结果生成第一调度计划,并执行第一调度计划。本申请中的电网的调度方法利用多个电网调度模型进行决策,可以减少每次被决策的待调度对象数量,降低每次决策的难度,快速、有效地完成电网的调度。
Description
技术领域
本申请涉及电力技术领域,具体涉及一种电网的调度方法、电子设备及可读存储介质。
背景技术
电力网络(下文称电网)的调度是指,对电网中的发电机组、母线闸刀、线路闸刀等设备的状态进行调整,使得电能可以从发电机安全、稳定到达各个用户的用电设备。电网的调度是电网能够稳定、安全运行的核心,因此,电网的调度需全面、及时、准确地把握电网系统的运行状况。一般来说,电网的调度,被决策的变量包括发电机组输出电能(下文称发电机组出力)、母线闸刀开闭状态、线路闸刀开闭状态等。故而,对应于被决策的变量,电网的调度受以下条件的约束:发电机组出力的上下界、闸刀的动作频率上下界、电力运输线路的最大传输功率限制、机组发力与用户负荷的实时平衡要求等。例如,图1a所示为一种电网系统的结构图,该电网系统包括设于电站1的发电机组G1、设于电站2的发电机组G2、设于电站3的发电机组G3,发电机组G1、发电机组G2和发电机组G3分别通过母线闸刀、电力传输线(下文称电力线,例如图1a中的电力线1至12)连接至用户的负荷。下面以发电机组G1、发电机组G2和对应的用户的用电设备为例,对电网调度进行介绍。
例如,图1b所示一种电网系统的调度场景示意图,电网系统包括发电机组G1、发电机组G2、母线闸刀S1至S4-2、用电设备S5、用电设备S6。如图1b所示,发电机组G1的出力x1=50Mw,发电机组G2的出力x2=200Mw。用电设备S5可以承载的最大负荷x3=150Mw,用电设备S6可以承载的最大负荷x4=100Mw。则电网系统电能分配可以如下:母线闸刀S2打开后通过电力线向母线闸刀S1传输电能y1=82Mw,通过电力线向母线闸刀S4-2传输电能y4=118Mw。母线闸刀S1打开后,接收母线闸刀S2传输的电能y1=82Mw,并通过电力线向母线闸刀S3传输电能y2=94Mw,通过电力线向母线闸刀S4-1传输电能y3=38Mw。母线闸刀S3通过电力线接收母线闸刀S4-1传输的电能y5=56Mw。此时,母线闸刀S2通过电力线向母线闸刀S4-2传输电能y4=118Mw,但是母线闸刀S2与母线闸刀S4-2之间的电力线的传输电能上限为100Mw,因此需要完成电网调度,即对发电机组、母线闸刀、线路闸刀等设备的状态进行调整。
如图1c所示,为调整后的电网调度的场景示意图。电网调度时,对发电机组G1和发电机组G2的出力均进行调整,并调整各个母线闸刀之间的电力线传输的电能。调整后,发电机组G1的出力x1=130Mw,发电机组G2的出力x2=120Mw。调整后电网系统电能分配可以如下:母线闸刀S2打开后通过电力线向母线闸刀S1传输电能y1=30Mw,通过电力线向母线闸刀S4-2传输电能y4=90Mw。母线闸刀S1打开后,接收母线闸刀S2传输的电能y1=30Mw,并通过电力线向母线闸刀S3传输电能y2=140Mw,通过电力线向母线闸刀S4-1传输电能y3=20Mw。母线闸刀S3通过电力线接收母线闸刀S4-1传输的电能y5=10Mw。
随着电网系统的不断拓展,大容量交直流并列运行、受端局部电网多个直流落点的特高压大电网渐渐形成,对于电网的调度方案需要考虑更多的电力线、闸刀和发电机组,决策难度增大、决策优度受限、决策频率升高。因此,全面、及时、准确地把握系统运行情况,并完成电网的调度尤为重要。
发明内容
本申请实施例提供了一种电网的调度方法、电子设备及可读存储介质,通过多个电网决策模型对待调度对象的调度动作的决策,降低电网决策难度,有效、快速完成电网调度的决策。
第一方面,本申请实施例提供了一种电网的调度方法,包括获取电网系统的第一电网状态信息;将第一电网状态信息分别输入多个电网决策模型,得到多个决策结果,其中,每个电网决策模型对应至少一个待调度对象,电网决策模型输出的决策结果为对对应的待调度对象的调度动作的决策,并且不同的电网决策模型所对应的待调度对象的调度动作的决策复杂度不同;根据多个电网决策模型的决策结果生成第一调度计划,并执行第一调度计划。
可以理解,第一电网状态信息为电网系统的实时电网状态。第一电网状态信息输入到电网决策模型,可以是同时输入,多个电网决策模型同时进行决策,也可以是对电网决策模型进行排序,然后按照排列好的顺序,依次利用电网决策模型分别完成待调度对象的调度动作的决策。待调度对象为电网系统中可以调整的对应设备状态的设备,调度动作为对设备的状态进行改变而执行的动作。
可以理解,待调度对象的调度动作的决策复杂度可以与待调度对象的状态的改变对电网拓扑的影响相关。例如,对于待调度对象母线闸刀,由于母线闸刀的状态(打开状态和闭合状态)的改变对于电网拓扑的改变较大,则母线闸刀的调度动作的决策复杂度较高。再例如,对于待调度对象发电机组,由于发电机组的状态(发电机组出力)的改变不影响电网拓扑,则发电机组的调度动作的决策复杂度较低。系统中可以预设不同待调度对象以及对应的调度动作的决策复杂度等级,不同的电网决策模型所对应的待调度对象的调度动作的决策复杂度等级不同。
本申请实施例中的电网的调度方法,依据待调度对象的调度动作的决策复杂度的不同,分别采用不同的电网决策模型进行调度动作的决策,可以减少每次被决策的待调度对象数量,降低每次决策的难度,快速、有效的完成电网的调度。
在上述第一方面的一种可能的实现中,待调度对象包括下列中的至少一种:母线闸刀,其中,母线闸刀的调度动作包括闭合母线闸刀和打开母线闸刀,电网状态信息包括:母线闸刀的闭合状态和母线闸刀的打开状态;线路闸刀,其中,线路闸刀的调度动作包括闭合线路闸刀和打开线路闸刀,电网状态信息包括:线路闸刀的闭合状态和线路闸刀的打开状态;发电机组,其中,发电机组的调度动作包括对发电机组输出电能的调整,电网状态信息包括:发电机组的输出电能。
可以理解,母线闸刀、线路闸刀、发电机组的调度动作的决策复杂度不同,母线闸刀的状态的改变对于电网拓扑影较大,因此其决策复杂度较高。线路闸刀的状态的改变对电网拓扑的影响较小,因此决策复杂度较低。发电机组的状态的改变对于电网拓扑无影响,因此其决策复杂度较低。因此,在一些实施例中,多个电网决策模型可以包括母线闸刀对应的母线闸刀决策模型、线路闸刀对应的线路闸刀决策模型、发电机组对应的发电机组出力决策模型。在一些实施例中,调度动作的决策复杂度通过决策复杂度等级表示,且线路闸刀和发电机组的调度动作的决策复杂度等级相同,因此多个电网决策模型可以包括母线闸刀对应的母线闸刀决策模型、线路闸刀和发电机组对应的线路闸刀及发电机组出力决策模型。
在上述第一方面的一种可能的实现中,将第一电网状态信息分别输入多个电网决策模型,得到多个决策结果,包括:按照多个电网决策模型的决策所对应的待调度对象的调度动作的决策复杂度从高到低顺序,将第一电网状态信息依次输入多个电网决策模型,得到多个决策结果。
可以理解,依照电网决策模型的调度动作的决策复杂度从高到低的顺序依次完成调度动作的决策,可以优先完成决策复杂度高的待调度对象的调度动作的决策,然后完成决策复杂度低的待调度对象的调度动作的决策,调度动作的决策速度更快。
在上述第一方面的一种可能的实现中,将第一电网状态信息分别输入多个电网决策模型,包括:将符合预设电网条件的第一电网状态信息分别输入多个电网决策模型。
在上述第一方面的一种可能的实现中,预设电网条件包括预设负载率阈值;
将符合预设电网条件的第一电网状态信息分别输入多个电网决策模型,包括:提取第一电网状态信息的特征信息,并根据特征信息确定电网系统的最大线路负载率;确定最大线路负载率大于预设负载率阈值;将第一电网状态信息分别输入多个电网决策模型。
在上述第一方面的一种可能的实现中,电网的调度方法还包括:获取电网系统的待调度对象;根据待调度对象的调度动作的决策复杂度,对待调度对象进行分组,其中决策复杂度是基于预设待调度对象与预设待调度对象的调度动作的决策复杂度的对应关系确定的,并且属于同一组的待调度对象的决策复杂度的差值小于预设复杂度差值阈值;为每组待调度对象训练对应的电网决策模型。
在一些实施例中,电子设备中可以预设不同的待调度对象以及待调度对象的调度动作对应的决策复杂度等级,则根据待调度对象的调度动作的决策复杂度,对待调度对象进行分组,可以为根据待调度对象的调度动作的决策复杂度等级,对待调度对象进行分组。属于同一组的待调度对象的决策复杂度的差值小于预设复杂度差值阈值,可以理解为属于同一组的待调度对象的决策复杂度等级的差值小于预设等级差值阈值。
在上述第一方面的一种可能的实现中,至少部分电网决策模型是利用多个第二电网状态信息和对应的第二调度计划作为训练数据,通过机器学习训练的得到的,并且至少部分电网决策模型为神经网络。
可以理解,在一些实施例中,部分电网决策模型是通过其他训练方式训练得到的,例如通过整合电力调度领域的学科知识设置对应的调度动作决策规则,或者构建对应的优化算法模型,例如元启发算法模型、贪心算法模型等。
在上述第一方面的一种可能的实现中,训练数据的确定包括:根据电网系统的待调度对象的调度动作,生成第一动作集,其中第一动作集中包括每次进行电网调度时,所执行的待调度对象的所有调度动作的组合;获取多个第二电网状态信息,多个第二电网状态信息包括历史电网状态信息和/或仿真电网状态信息;在第一动作集中,利用优化算法,确定第二电网状态信息对应的待调度对象的调度动作的组合作为第二调度计划。
可以理解,第一动作集为电网系统的待调度对象的所有可能的调度动作的组合的集合,例如对于待调度对象为母线闸刀、线路闸刀、发电机组,则第一动作集为所有母线闸刀、线路闸刀、发电机组的可能调度动作组合组成的动作集,第一动作集也可表示为原始动作空间。
在上述第一方面的一种可能的实现中,训练数据的确定还包括:根据多个第二电网状态信息对应的第二调度计划,生成第二动作集。
可以理解,第二动作集为第一动作集的子集,即利用优化算法,在第一动作集中确定第二电网状态信息对应的最优调度动作的组合,然后将寻优得到的所有最优调度动作的组合作为第二动作集。
在一些实施例中,可以对第二调度计划进行去重和筛选,得到第二动作集。去重即去除重复的第二调度计划,筛选指,将第二调度计划中不满足电网调度目标的第二调度计划筛除。其中,电网调度的目标可以包括以下至少之一:电力线路的网损较低、线路闸刀和母线闸刀的动作次数较少、发电机组出力成本较低。
在上述第一方面的一种可能的实现中,将第一电网状态信息输入电网决策模型,得到对应的决策结果包括:将第一电网状态信息输入电网决策模型,并确定第二动作集中概率最高的第二调度计划作为决策结果。
可以理解,训练好的电网决策模型中可以包括第二动作集,电网决策模型决策的过程即在第二动作集中确定对应的第二调度计划的过程。具体地,电网决策模型可以根据输入的第一电网状态信息,计算第二动作集中多个第二调度计划对应的概率,并将概率最高的第二调度计划作为决策结果。
在上述第一方面的一种可能的实现中,优化算法为下列中的至少一种:元启发算法、贪心算法。
在上述第一方面的一种可能的实现中,根据多个电网决策模型的决策结果生成第一调度计划,并执行第一调度计划,包括:
根据根据多个电网决策模型的决策结果生成第一调度计划;
将第一调度计划反馈至调度员,并获取调度员的调度计划调整信息;
根据调度计划调整信息调整第一调度计划,并执行调整后的第一调度计划。
第二方面,本申请实施例提供了一种电子设备,包括:一个或多个处理器;一个或多个存储器;一个或多个存储器存储有一个或多个程序,当一个或者多个程序被一个或多个处理器执行时,使得电子设备执行上述电网的调度方法。
第三方面,本申请实施例提供了一种计算机可读存储介质,存储介质上存储有指令,指令在计算机上执行时使计算机执行上述电网的调度方法。
第四方面,本申请实施例提供了一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被处理器执行时实现上述电网的调度方法。
附图说明
图1a所示为本申请实施例所提供的一种电网系统的结构示意图;
图1b至图1c所示为一些电网调度的场景示意图;
图2a至图2c所示为一些电网的调度方法的流程示意图;
图2d所示为本申请实施例所提供的一种电网调度系统的结构示意图;
图3a所示为本申请实施例所提供的一种服务器的结构示意图;
图3b所示为本申请实施例所提供的一种电网的调度方法的流程示意图;
图4所示为本申请实施例所提供的一种电网的调度方法的流程示意图;
图5所示为本申请实施例所提供的另一种电网的调度方法的流程示意图;
图6所示为本申请实施例所提供的一种调度计划的示意图;
图7a所示为本申请实施例所提供的一种母线闸刀决策模型的训练方法的流程示意图;
图7b所示为本申请实施例所提供的一种断面-动作样本库生成过程的示意图;
图8所示为本申请实施例所提供的一种强化学习模型的训练方法的流程示意图;
图9a和图9b所示为本申请实施例所提供的一些电网的调度方法的流程示意图。
具体实施方式
可以理解,在本申请各实施例中,待调度对象为电网系统中可以调整的对应设备状态的设备,每个待调度对象对应一个调度动作,待调度对象可以是如发电机组、母线闸刀、线路闸刀、调相机、变压器、可投切电容器等。对应的,待调度对象的调度动作包括:如发电机组出力、母线闸刀开闭状态、线路闸刀开闭状态、调相机无功出力、变压器调压分接头的调整、可投切电容器的投切状态等。本申请实施例中的待调度对象可以包括比上述示例中更多或更少的设备,在此不作限制。
如前所述,全面、及时、准确地把握系统运行情况,并完成电网的调度尤为重要。例如,图2a示出了一种电网的调度方法的流程示意图。在该调度方法中,通过人工参与电网调度的方式实现电网调度。例如,可以通过运方人员通过电网仿真程序对电网状态进行仿真,制定对应的运行方式,并将经验编纂成运行方式手册。调度员通过学习运行方式手册中的经验,根据电网状态执行调度计划。
如图2a所示,具体为一种电网的人工调度方法的流程示意图,该调度方法对应的系统包括运行方式部211和电网调度部212。其中,运行方式部211的运方人员通过向电网仿真程序(例如电力系统分析综合程序(Power System Analysis Software Package,PSASP)、电力系统计算机辅助程序(Power Systems Computer Aided Design,PSCAD)、电力系统仿真软件(Bonneville Power Administration,BPA)等程序)输入参数,进行大量离线电网仿真,测试电网在各种边界条件(如重负荷、轻负荷等)下的运行状态,为不同边界条件下的电网制定安全合理的运行方式(即潮流解),并编纂成册,即运行方式手册213。
电网调控部212的调度员首先学习由运方人员制定的运行方式手册213,对各种边界条件下的电网运行获取经验性知识;然后针对实时的电网状态,根据在运行方式手册213中学习到的人工经验与该领域的专家知识,对最优的调度方案作出判断,生成调度动作并下发至实际电网执行。
可以理解,人工调度的方案需要依赖调度员的人工经验与知识水平,过多的人工参与大大提升了人为误操作的几率。同时,随着电网系统的不断拓展,调度员往往关注电网的部分重要指标并进行调度动作的判断,无法细究电网状态的所有细节,调度员的决策难度增大、决策优度受限、决策频率升高。人工调度的实用性低,不能有效、快速完成电网的调度。
为了解决上述问题,图2b示出了一种电网的调度方法的流程示意图。该方法通过制定一个电网经济调度抽象模型,确定在电网处于运行边界时,发电机组出力的方案,以改变电网系统中的发电机组出力。
具体地,如图2b所示,具体为一种电网的经济调度方法的流程示意图。该调度方法对应的系统包括:电网经济调度抽象模型221获取到电网状态,并通过调用求解器222计算出满足调度约束条件且经济成本最优的发电机组出力方案。其中,电网状态对应的电网系统为给定的电网拓扑与用电设备负荷。
可以理解,电网经济调度抽象模型221可以为线性规划(Linear programming,LP)模型、二次规划(Quadratic programming,QP)模型、二阶锥规划(Second order coneprogramming,SOCP)模型等,通过不同应用场景下的电网状态生成的模型。求解器222可以如Cplex、Gurobi等。
可以理解,给定的电网拓扑为电网系统中的母线闸刀、线路闸刀等设备保持不变,只改变发电机组出力。
可以理解,经济调度方法只能够改变发电机组出力,无法考虑线路闸刀、母线闸刀的状态的改变,对于不合理的电网拓扑,经济调度方法无法找到满足调度约束条件且经济成本最优的发电机组出力方案。且电网经济调度抽象模型221的建立对电网状态的需求较高,不准确的电网状态会损害求解结果的优度。经济调度方法的实用性低,不能有效、快速完成电网的调度。
为了解决上述问题,图2c示出了一种电网的调度方法的流程示意图。该方法通过构建一个电网调度的智能体,通过离线数据进行仿真,使得电网调度的智能体能够在输入电网状态后,输出对应的发电机组出力、母线闸刀、线路闸刀的调度动作。
如图2c所示,具体为一种电网的智能调度方法的流程示意图。该方法包括:通过对不同场景下的电网状态的数据特征进行强化学习,得到电网调度的智能体231。具体地,电网调度的智能体231获取t时刻电网系统232的电网状态St,得到对应的动作At,电网系统232执行动作At。电网调度的智能体231可以再次获取调度后的电网系统232的电网状态St+1,并根据电网状态St+1和电网状态St生成关于动作前后的电网状态的关系作为t时刻的奖赏Rt。电网调度的智能体231可以根据t时刻的动作At和奖赏Rt优化其内部的算法。
可以理解,动作At是所有设备的动作集合,例如发电机组、母线闸刀、线路闸刀等设备的所有可能动作集合。
可以理解,上述电网调度方法训练的电网调度的智能体231决策的的调度动作本质上是所有设备的动作集合,例如发电机组、母线闸刀、线路闸刀等设备的所有可能动作集合,因此,智能体的电网调度的动作空间的规模会出现指数爆炸。例如假设有100个闸刀,则智能体中,待选的闸刀动作有2100个,结合发电机组出力的组合动作后,智能体中的动作集空间规模更大,这使得智能体的调度决策更加困难。可见,目前基于强化学习的电网的调度方法,不能有效、快速完成电网的调度。
为解决上述电网调度方法不能有效、快速完成电网的调度的问题,本申请提供了一种电网的调度方法。该方法将多个待调度对象中调度动作的决策复杂度相近的待调度对象划分为一组,进而根据获取到的实时电网状态,按照各组待调度对象的调度动作的决策复杂度从高至低的顺序,依次完成各组调度对象的调度动作的决策,最后将各组决策结果组合,作为调度计划,并将调度计划应用于电网系统。具体地,可以对每组调度对象训练出决策其调度动作的电网决策模型,多个电网决策模型组成电网调度系统。在实施电网调度时,可以通过各个模型以及实时电网状态,完成各组调度对象的调度动作的决策。其中,按照多个调度对象的调度动作的决策复杂度对多个待调度对象进行划分,并分别对每组调度对象的调度动作进行决策,可以减少每次被决策的待调度对象数量,降低每次决策的难度,快速、有效地完成电网的调度。
例如,图2d示出了本申请一些实施例的电网调度系统,该系统包括3个电网决策模型,分别为:对应于待调度对象1和待调度对象2的电网决策模型A、对应于待调度对象3的电网决策模型B、对应于待调度对象4和待调度对象5的电网决策模型C。
其中,待调度对象1和待调度对象2的调度动作的决策复杂度相似,且决策复杂度最高,可以将其划分为一组,并训练得到决策待调度对象1和待调度对象2的调度动作的电网决策模型A。待调度对象3的调度动作的决策复杂度与其余待调度对象均不相同,且决策复杂度次之,将其单独划分为一组,并训练得到决策待调度对象3的调度动作的电网决策模型B。待调度对象4和待调度对象5的调度动作的决策复杂度相似,且决策复杂度最低,可以将其划分为一组,并训练得到决策待调度对象4和待调度对象5的调度动作的电网决策模型C。电网决策模型A、B、C组成电网调度系统,进而,在应用电网调度系统在生成电网调度计划时,获取到电网系统的实施电网状态后,可以依次利用电网决策模型A完成对待调度对象1、待调度对象2的调度动作的决策,利用电网决策模型B完成对待调度对象3的调度动作的决策,利用电网决策模型C完成对待调度对象4、待调度对象5的调度动作的决策,最后将三个电网决策模型的决策结果组合,得到调度计划,并将调度计划应用到电网系统。
可以理解,决策复杂度为对于电网调度来说,待调度对象的调度动作是否容易决策。例如,对于母线闸刀来说,其状态包括闭合状态和打开状态,当对母线闸刀的状态进行改变时,电网的拓扑就会发生较大改变,此种闸刀状态的改变对于电网状态的影响难以确定,因此其决策复杂度较高。再例如对于发电机组,其状态为发电机组出力,且发电机组出力调整时,电网拓扑不会改变,对于发电机组的决策可以通过一个数学模型进行求解得到最优的发电机组出力值,因此发电机组出力的决策的复杂程度较低。
例如,在一些实施例中,待调度对象包括发电机组、母线闸刀、线路闸刀,则由于母线闸刀的开闭状态,对于电网拓扑影响较大,因此决策复杂度较高,而发电机组、线路闸刀对于电网拓扑影响较小,因此决策复杂度较低。故而,可以分别对母线闸刀对应的决策算算法、线路闸刀与发电机组对应的电网决策模型分别进行训练,得到母线闸刀决策模型和线路闸刀与发电机组出力决策模型组成的电网调度系统。
进一步地,在实际应用中,电网调度系统可以实时获取电网状态,当电网调度系统判断电网需要调度时,可以利用母线闸刀决策模型判断母线闸刀需要调度时,生成对应的母线闸刀的调度动作,否则直接进入线路闸刀与发电机组出力决策模型的决策。线路闸刀与发电机组出力决策模型可以根据母线闸刀的调度动作或电网状态,生成发电机组出力和/或线路闸刀的调度动作。电网调度系统根据母线闸刀决策模型和线路闸刀与发电机组出力决策模型的决策结果生成调度计划,并将调度计划给调度员,以判断调度计划是否需要调整。若需要调整,则调度员将调整后的调度计划输送至电网系统完成电网调度,否则直接将调度计划输送至电网系统完成电网调度。
此外,在另一些实施例中,由于线路闸刀的开闭状态对电网拓扑有影响,发电机组出路对电网拓扑无影响,可以将线路闸刀和母线闸刀划分对应一个电网决策模型,发电机组出力对应一个电网决策模型。
可以理解,电网调度系统分别对母线闸刀的调度动作、发电机组出力与线路闸刀的调度动作进行决策,而非直接生成母线闸刀、线路闸刀、机组出力的混合调度动作,可以减小调度动作的决策难度,缩短决策时间,提高电网调度系统的决策效率。
此外,可以理解,在本申请实施例中,在对上述电网决策模型进行训练时,可以采用电网系统处于运行边界(例如电网系统重载或过载等)时的历史电网状态以及在相应电网状态下待调度对象的最优调度动作,和/或通过对电网系统进行仿真,基于电力调度领域的学科知识找到相应电网状态下待调度对象的最优调度动作作为训练数据,如此,可以减少模型对于无效或有害的调度动作的决策训练,解决图2c所示的现有技术中,训练电网调度的智能体231的数据集大多来源于离线仿真时的随机探索,部分训练并不适用于实际电网中且可能会造成电网的崩溃的问题。具体训练方案将在下文进行详细描述。
可以理解,本申请中的电网调度方法可以应用于服务器,服务器可以是云服务器、网络服务器、应用服务器以及管理服务器等具有数据处理功能的设备或服务器。数据处理设备通过交互接口接收大量电网状态集对应的最优调度动作,再通过存储数据的存储器以及数据处理的处理器环节进行机器学习,深度学习,搜索,推理,决策等方式的电网状态和对应最优调度动作的处理。
本申请实施例提供的电网调度方法,采取大量电网状态集对应的最优调度动作对电网决策模型进行训练,减少无效或有害的决策结果,提高最终的调度动作的实用性。同时,将待调度对象进行划分,分别训练电网决策模型,即将电网调度的混合调度动作进行分解,各电网决策模型的决策难度减小,决策时间缩短,电网调度系统的决策效率提高。因此,本申请实施例中的调度方法实用性高,可以有效、快速完成电网调度的决策。
图3a示出了实施本申请的实施例的服务器100的结构示意图,服务器100可以包括处理器110,内部存储器120,接口模块130,电源模块140,无线通信模块150。
可以理解的是,本申请实施例示意的结构并不构成对服务器100的具体限定。在本申请另一些实施例中,服务器100可以包括比图示更多或更少的部件,或者组合某些部件,或者拆分某些部件,或者不同的部件布置。图示的部件可以以硬件,软件或软件和硬件的组合实现。
处理器110可以包括一个或多个处理单元,例如:处理器110可以包括应用处理器(application processor,AP),调制解调处理器,图形处理器(graphics processingunit,GPU),图像信号处理器(image signal processor,ISP),控制器,视频编解码器,数字信号处理器(digital signal processor,DSP),基带处理器,和/或神经网络处理器等。其中,不同的处理单元可以是独立的器件,也可以集成在一个或多个处理器中。
处理器110中还可以设置存储器,用于存储指令和数据。在本申请的实施例中,处理器110可以运行本申请中的电网的调度方法。
内部存储器120可以用于存储计算机可执行程序代码,可执行程序代码包括指令。内部存储器120可以包括存储程序区和存储数据区。其中,存储程序区可存储操作系统,至少一个功能所需的应用程序(比如声音播放功能,图像播放功能等)等。存储数据区可存储服务器100使用过程中所创建的数据(比如音频数据,电话本等)等。在本申请的实施例中,服务器100的内部存储器120可以存储处理器110生成的母线闸刀决策模型、线路闸刀和发电机组出力决策模型。
接口模块130可以用于连接外部存储装置,例如外接硬盘,实现扩展服务器100的存储能力。外接硬盘通过接口模块130与处理器110通信,实现数据存储功能。
电源模块140用于接入电网,为处理器110,内部存储器120等供电。
无线通信模块150可以提供应用在服务器100上的包括无线局域网(wirelesslocal area networks,WLAN)(如无线保真(wireless fidelity,Wi-Fi)网络),蓝牙(bluetooth,BT),全球导航卫星系统(global navigation satellite system,GNSS),调频(frequency modulation,FM),近距离无线通信技术(near field communication,NFC),红外技术(infrared,IR)等的无线通信的解决方案。
下面以待调度对象包括发电机组、母线闸刀、线路闸刀为例,结合图3b至图5对本申请实施例中的一种电网的调度方法进行进一步介绍。可以理解,本申请实施例中的调度方法的实施主体为服务器,下文不作赘述。
图3b和图4所示为本申请实施例中的一种电网调度的流程示意图。
可以理解,本申请实施例中以母线闸刀的调度动作的确定对应母线闸刀决策模型、线路闸刀和发电机组出力的调度动作的确定对应线路闸刀与发电机组出力决策模型为例,对申请实施例的调度方法进行介绍,在其他实施例中,待调度对象可以作其他划分,本申请在此不作赘述。
如图3b和图4所示,电网调度方法包括:
401:电网调度系统300获取电网系统的实时电网状态。
可以理解,实施电网状态为电网调度系统300定时或特定事件驱动下获取到的电网系统的运行状态信息。可以包括电网拓扑结构、刀闸状态、机组出力、电力负荷、线路负载率等。
其中,定时可以理解为特定时间间隔获取一次电网状态,例如5分钟、10分钟、15分钟等,特定事件可以理解为当电网系统中的设备发生故障等,例如电网系统中的线路老化,使得用户设备接收到的电能未达到对应的负荷。
在一些实施例中,可以提取实时电网状态中的特征信息,例如发电机组出力、母线刀闸状态、线路闸刀状态、线路潮流、线路负载率、用户负荷等信息,
402:电网调度系统300判断实时电网状态是否大于设定阈值。
可以理解,在一些实施例中,判断实时电网状态是否大于设定阈值,即对实时电网状态进行特征提取后,根据提取到的特征信息,判断对应的特征信息是否大于设定的阈值。例如,判断发电机组出力是否大约设定阈值等。再例如,根据实时电网状态计算电网的最大线路负载率,并判断最大线路负载率是否大于设定阈值。
若步骤402的判断结果为是,则表明电网状态处于电网运行边界之外,继续运行可能会造成电网崩溃,需要对电网进行调度,执行:
403:电网调度系统300利用训练好的母线闸刀决策模型确定母线闸刀的调度动作。
可以理解,母线闸刀决策模型为预先训练好的、可以根据电网状态输出对应母线闸刀的调度动作的模型。在一些实施例中,母线闸刀决策模型可以是通过对大量电网状态和对应的最优调度动作进行模仿学习和/或强化学习的训练得到的。其中,大量电网状态和对应的最优调度动作可以包括电网系统处于运行边界(例如电网系统重载或过载等)时的历史电网状态以及在相应电网状态下待调度对象的最优调度动作,和/或通过对电网系统进行仿真,基于电力调度领域的学科知识找到相应电网状态下待调度对象的最优调度动作。
具体地,模仿学习是指通过对大量电网状态和对应的最优调度动作进行机器学习,得到一个以电网状态为输入、以母线闸刀的调度动作为输出的机器学习模型(例如神经网络),模仿学习常用于强化学习训练前的热启动。强化学习是机器学习的一个分支,常用于求解序贯决策问题,强调如何基于环境的反馈(称为奖赏),改进从环境状态向动作选择映射的策略,从而最大化长期累积奖赏。在一些实施例中,可以根据大量电网状态和对应的最优调度动作,生成表征电网状态与最优的调度动作的对应关系的专家样本库,并将专家样本库作为机器学习的训练数据。
在一些实施例中,模仿学习得到的机器学习模型即为上述母线闸刀决策模型。在另一些实施例中,可以通过强化学习对模仿学习得到的机器学习模型进行优化。具体地,可以以模拟的电网状态为输入,得到对应的母线闸刀调度动作,并评价得到的母线闸刀的调度动作的好坏,反馈至模仿学习得到的机器学习模型,机器学习模型根据反馈的评价结果对模型进行优化,即如果评价结果为“好”,则之后就多往对应方向发展,如果如果评价结果为“坏”,则之后就尽量避免对应的行为。
在一些实施例中,母线闸刀决策模型包含具有多个调度动作的动作空间,母线闸刀决策模型决策调度动作的过程,即为计算在实施电网状态下,多个调度动作的概率,并输出概率最大的调度动作作为母线闸刀的调度动作的过程。在另一些实施例中,母线闸刀决策模型的决策过程可以为其他形式,本申请对此不作限制。
404:电网调度系统300根据母线闸刀的调度动作,利用训练好的线路闸刀与发电机组出力决策模型确定发电机组出力和线路闸刀的调度动作。
可以理解,发电机组出力和线路闸刀的调度动作是在确定好母线闸刀的调度动作之后确定的。即对于决策复杂度高的待调度对象,可以通过对应的电网决策模型优先决策,使得电网决策模型在确定调度动作时,只需要考虑对应的待调度对象,无需考虑过多的变量,降低决策复杂度高的待调度对象的决策复杂度,可以提高决策速率。而对于决策复杂度低的待调度对象,在决策时考虑决策难度高的待调度对象,对于其决策复杂度的影响较低,决策速率的影响较低,使得电网调度系统300的整体决策速率提高。
可以理解,线路闸刀与发电机组出力决策模型为预先训练好的、表征电网状态与线路闸刀和发电机组出力的调度动作的对应关系的模型。在一些实施例中,线路闸刀与发电机组出力决策模型可以是通过对大量电网状态和对应的最优调度动作进行模仿学习和/或强化学习的训练得到的,如上文母线闸刀决策模型,在此不作赘述。在一些实施例中,线路闸刀与发电机组出力决策模型可以为本领域专家根据实际经验制定的线路闸刀的调整规则以及以电网的最小经济成本为目标的发电机组出力的最优解。其中,线路闸刀的调整规则可例如线路闸刀尽可能处于闭合状态,发电机组出力的最优解可以例如图2b所示的求解器以及电网经济调度抽象模型。
405:电网调度系统300根据母线闸刀的调度动作、发电机组出力和线路闸刀的调度动作生成调度计划,并将调度计划反馈至调度员。
可以理解,电网调度系统300利用母线闸刀决策模型和线路闸刀与发电机组出力决策模型确定好母线闸刀的调度动作、发电机组出力和线路闸刀的调度动作后,会将决策好的调度动作作整合,形成针对于母线闸刀、发电机组出力、线路闸刀的完整的调度计划。
在一些实施例中,电网调度系统300生成调度计划后,可以通过仿真该调度计划,判断执行该调度计划后得到的电网状态是否满足设定的阈值。若满足设定的阈值则将调度计划反馈至调度员,若不满足,则将仿真结果反馈至母线闸刀决策模型和线路闸刀与发电机组出力决策模型,并重新生成调度计划。
406:电网调度系统300获取调度员的调度计划调整信息,并根据调度计划调整信息对调度计划进行调整。
可以理解,调度员根据接收到的调度计划,判断其是否合理和/或是否优秀,是否需要进行调整,并生成对应的调度计划调整信息,反馈至电网调度系统。
在一些实施例中,调度员判断调度计划合理且优秀,即不会使得电网出现崩溃等险情,且能够最大限度地满足电网调度的目标,则生成表征调度计划被采用的调度计划调整信息,并将该调度计划调整信息反馈至电网调度系统300。
在一些实施例中,调度员判断调度计划不合理和/或不优秀,即可能使得电网出现崩溃等险情,或不能够满足电网调度的目标,则调度员可以对调度计划不合理或不优秀的动作进行调整,得到对应的调度计划调整信息,并将该调度计划调整信息反馈至电网调度系统300。
其中,电网调度的目标包括以下至少之一:电力线路的网损较低、线路闸刀和母线闸刀的动作次数较少、发电机组出力成本较低。
可以理解,电力线路的网损较低可以减缓电力线路老化,使得电网的寿命较长,降低经济成本。线路闸刀和母线闸刀的动作次数较少可以减缓闸刀的老化,使得电网的寿命较长,降低经济成本。
407:电网调度系统300将调整后的调度计划下发至电网系统,进行电网调度。
可以理解,电网调度系统300将调整后的调度计划下发至电网系统后,对于电网中的母线闸刀、线路闸刀、发电机组出力的调整,可以例如电网系统自动进行调整,也可以例如工作人员接收到电网系统的提示信息,根据调度计划进行手动调整,本申请实施例的目的在于调度计划的生成,对此不作限制。
可以理解,本申请实施例中,将待调度对象线路闸刀、发电机组出力的调度动作的决策复杂度相似,将其划分为一组,母线闸刀的调度动作的决策复杂度较高,单独划分为一组,并训练得到决策模型:母线闸刀决策模型、线路闸刀与发电机组出力决策模型,即电网调度系统300包括母线闸刀决策模型、线路闸刀与发电机组出力决策模型。同时由于母线闸刀的调度动作的决策复杂度高,在应用电网调度系统生成调度计划时,先利用母线闸刀决策模型决策母线闸刀的调度动作,再利用线路闸刀与发电机组出力决策模型决策线路闸刀的调度动作和发电机组出力,即依次执行步骤403、404。本申请实施例中的电网调度方法可以减少每次被决策的待调度对象数量,降低每次决策的难度,快速、有效地完成电网的调度。
在一些实施例中,待调度对象可以包括比上述实施例中的更多或更少的待调度对象,本申请对此不作限制。
下面结合图5,以具体的实施例对上述电网的调度方法进行进一步介绍。
图5所示为本申请实施例中的一种电网调度的流程示意图。
如图5所示,强化学习智能体可以理解为上文中的母线闸刀决策模型,专家知识可以理解为上文中的线路闸刀与发电机组出力决策模型。电网系统在获取电网的实时电网状态,并根据实时电网状态判断电网需要调度后,将实时电网状态发送至动作(Actor)网络(即电网调度系统300),Actor网络执行下述电网的调度方法:
1.Actor网络根据实时电网状态判断电网是否重载或过载。
进一步地,若判断结果为是,则Actor网络可以提取实时电网状态的特征信息并送入强化学习智能体。强化学习智能体根据实时电网状态的特征信息计算动作空间内各母线闸刀动作(即母线闸刀的调度动作)的概率;然后,依概率降序对动作空间内的母线闸刀动作进行排序,得到动作列表AL。若判断结果为否,则动作列表AL为空列表。
2.遍历动作列表AL中的母线闸刀动作(其中,若动作列表AL为空,则认为母线闸刀动作为“不改变任何母线闸刀状态”),执行下述指令:
a)对于当前母线闸刀动作,依据专家知识中设定的规则A补充线路闸刀动作,依据专家知识中设定的规则B补充发电机组出力动作,从而得到一个完整的调度计划,其中的调度计划可例如图6所示,将在下文进行详细介绍。
示例性地,规则A如下:
仿真母线闸刀动作(abs,i)后的电网状态,遍历每个线路闸刀(LSj):
若LSj处于闭合状态,则继续判断下一个线路闸刀;
若LSj处于打开状态,尝试闭合LSj,并判断合闸后电网的最大线路负载率是否减小:若减小则将LSj合闸的动作添加到线路闸刀动作als,j|abs,i中。
其中abs,i表示第i个母线闸刀的调度动作,LSj表示第j个线路闸刀,als,j|abs,i表示在第i个母线闸刀执行调度动作abs,i时,第j个线路闸刀执行调度动作als,j。
示例性地,规则A如下:
仿真母线闸刀动作和线路闸刀动作的电网状态,通过求解器(例如图2b所示)确定发电机组出力的动作,并将该调度动作添加到发电机组出力动作ag|als,j,abs,i中。其中ag|als,j,abs,i表示在第i个母线闸刀执行调度动作abs,i,且第j个线路闸刀执行调度动作als,j时,发电机组出力动作为ag。
b)仿真调度计划,并获取仿真调度计划后的电网断面,获得仿真后的电网的最大线路负载率。若该最大线路负载率满足设定的安全阈值,则将调度计划输出至调度员;否则进入动作列表AL中下一个母线闸刀动作的判断。
3.调度员根据调度计划判断其是否需要调整。
进一步地,若需要调整,则调度员将调整后的调度计划反馈至Actor网络,Actor网络将调度计划下发至电网系统。同时,Actor网络根据调整后的调度计划,对强化学习智能体和专家知识进行优化。若不需要调整,则调度员向Actor网络反馈调度计划合理且优秀,此时Actor网络可以将生成的调度计划下发至电网系统。
图6所示为本申请实施例中的一种调度计划的示意图。
如图6所示,示例性地,电网系统中包括母线闸刀1至m、线路闸刀1至n、发电机组1至s(即图6中的机组1至s)。则电网调度系统300利用电网决策模型推理电网调度动作生成的调度计划中包括:母线闸刀1至m的状态、线路闸刀1至n的状态、机组1至s的出力状态。实心圆表示闸刀的状态为闭合状态,空心圆表示闸刀的状态为打开状态,3Mw、2Mw、0Mw等表示机组1至s输出的电能值。调度员接收到调度计划后601,会执行下述动作:
611:调度动作调整。具体地,调度员接收到调度计划601后,会结合对应的实时电网状态,判断调度动作是否合理或优秀,若不合理或不优秀,则对调度计划601中的至少部设备的状态进行调整,得到调整后的调度计划,并将调整后的调度计划下发至电网系统并反馈至电网调度系统,进行电网决策模型的优化,即执行步骤612和613。若合理且优秀,则调度员直接将调度计划下发至电网系统,即执行步骤612。
612:动作下发。可以理解,调度员将不需要调整或调整后的调度计划下发至电网系统。
613:调度动作反馈。可以理解,调度员对调度计划进行调整后,将调整后的调度计划反馈至电网调度系统,例如反馈至母线闸刀决策模型的训练集专家样本库中。下面以待调度对象包括发电机组、母线闸刀、线路闸刀为例,结合附图对本申请实施例中的母线闸刀决策模型的训练过程进行介绍。可以理解,本申请实施例中的训练方法的实施主体为服务器,下文不作赘述。
图7a所示为本申请实施例中的一种母线闸刀决策模型的训练方法的流程示意图。
图7b所示为本申请实施例中的一种专家样本库的生成过程示意图。
如图7a所示,母线闸刀决策模型的训练包括四个阶段,具体如下:
1.数据驱动动作空间剪枝阶段
在一些实施例中,数据驱动动作空间剪枝阶段可以收集大量电网状态(下文称给定电网断面,即电网运行时的断面)以及母线闸刀的原始动作空间(Original ActionSpace,OAS),然后基于电力调度领域的学科知识找到相应电网断面下母线闸刀的最优调度动作(或近优调度动作),最终通过集合所有电网断面下的母线闸刀的最优调度动作(或近优调度动作)形成剪枝动作空间(Reduced Action Space,RAS,如图7b中的专家动作样本库712),即上文中的母线闸刀决策模型包含的动作空间。如图7b所示,电网运行断面库711(即上文中的给定电网断面)可以包括电网历史运行断面和电网仿真运行断面。可以理解,原始动作空间对应上文中的第一动作集,为母线闸刀的所有可能的动作组合。
可以理解,基于电力调度领域的学科知识确定的相应电网断面下母线闸刀的最优调度动作(或近优调度动作),可以是人工优选的经验动作,也可以通过对电网断面库信息进行遍历,通过优化算法来求解特定目标生产动作。例如,在一些实施例中,可以通过元启发算法(如遗传算法、粒子群算法)寻找使得最大线路负载率最小化的母线闸刀动作,即为最优调度动作(或近优调度动作)。其中,元启发算法是求解优化问题的通用算法,是随机算法与领域算法相结合的产物。其求解过程是一个迭代生成的过程,通过对不同解的重新组合,实现对原始动作空间的寻优。元启发算法包括粒子群算法、遗传算法、模拟退火算法等。
可以理解,剪枝动作空间中的调度动作由于是基于电力调度领域的学科知识确定的,属于电网调度领域中常用的方法,因此,也可以理解为专家动作。剪枝动作空间对应上文中的第二动作集。
在一些实施例中,得到剪枝动作空间后,还可以对剪枝动作空间进行进行去重与筛选,筛选条件可以例如调度动作重复次数小于给定阈值、调度动作带来的负载率减小的峰值小于给定阈值等,本申请对此不作限制。
本申请实施例中,通过上述数据驱动动作空间剪枝阶段,可以实现对电网调度动作数量级的降维,相比于图2c所示的电网调度的智能体231,可以减少无效乃至有害的随机探索,得到的母线闸刀的调度动作的实用性更强。
2.专家智能体样本生成阶段
可以理解,数据驱动动作空间剪枝阶段得到的剪枝动作空间后,在专家智能体样本生成阶段可以利用优化算法,为每个给定电网断面匹配一个剪枝动作空间中的最优的调度动作,确定给定电网断面与剪枝动作空间中的调度动作的对应关系,作为专家样本库。可以理解,专家样本库中包括多个专家智能体样本。
在一些实施例中,专家智能体样本生成阶段采用的优化算法,可以为建立的能够最小化电网的最大线路负载率的全局搜索策略(例如贪心策略),进而通过确定给定电网断面在该策略下的调度动作,得到给定电网断面与剪枝动作空间的调度动作的对应关系,作为模仿学习阶段的断面-动作样本库(如图7b中的断面-动作样本库713,即专家样本库)。例如,断面-动作样本库可以以给定电网断面为特征,以全局搜索策略确定的调度动作为标签,如图7a中专家智能体样本生成阶段生成的表格,以及模仿学习预训练阶段用于训练神经网络的表格。
可以理解,全局搜索策略可以包括但不限于上述最小化电网的最大线路负载率的其他电网指标,本申请对此不作限制。
3.模仿学习预训练阶段
可以理解,在模仿学习阶段,可以先构建以电网断面为输入、以母线闸刀动作为输出的神经网络,然后基于专家样本库,对神经网络进行训练,使得该神经网络的输入-输出特性逼近专家样本库生成时的表现,即神经网络的输入-输出特性逼近专家样本库阶段中的全局搜索策略的表现。
4.强化学习再训练阶段
可以理解,在强化学习阶段可以设计基于强化学习的模型,即强化学习阶段以模仿学习阶段训练好的神经网络作为热启动,然后结合电网仿真环境进行基于“状态-动作-奖赏”的训练,改进神经网络的调度性能,训练过程可例如图2c中所示。
示例性地,强化学习阶段可以例如:获取大量历史电网断面,输入神经网络生成对应的母线闸刀动作,在结合前文中的规则A和规则B生成线路闸刀动作和发电机组出力。可以将得到的母线闸刀动作和机组出力动作结合,作为电网调度的动作组合,输入电网仿真环境进行仿真,得到调度后的电网断面。强化学习的模型可以根据调度后的电网断面,确定该动作组合的奖赏,完成对神经网的优化。强化学习阶段输的的神经网络模型即为母线闸刀决策模型。
在一些实施例中,线路闸刀和发电机组出力决策模型中包括专家规则库,专家规则库负责更新线路闸刀的调度动作规则和发电机组出力规则。其中,线路闸刀和发电机组出力决策模型基于专家规则库中的线路闸刀的调度动作规则,确定线路闸刀的调度动作。其中,发电机组出力规则可以利用优化算法,求解得到最小经济成本下的发电机组出力。发电机组出力规则为一个连续优化算法,可以快速求解出发电机组出力。具体地,线路闸刀的调度动作规则可以为前文中的规则A,发电机组出力规则可以为前文中的规则B。
下面结合图7a,以具体的实施例,对本申请中的一种母线闸刀决策模型的训练进行进一步介绍。
如图7a所示,母线闸刀决策模型的训练包括四个阶段,具体如下:
1.数据驱动动作空间剪枝阶段
数据驱动动作空间剪枝阶段具体可以包括以下几个步骤:
(11)初始化母线闸刀的调度动作对应的动作空间,例如设置动作集其中S表示母线闸刀的调度动作对应的动作空间。
(12)获取电网运行处于边界的历史电网断面(也已理解为历史边界条件),历史电网断面可以表示为B={b1,b2,b3,……,bn},然后可以根据极大似然估计的方法,用正态分布N(μ,σ)来拟合历史电网断面,得到电网运行时,电网断面的概率分布N*(μ*,σ*)。其中,电网运行处于边界可例如电网重载或过载等。
(13)通过对电网断面的概率分布N*(μ*,σ*)采样,以获得更多电网断面,可以表示为B′={b1,b2,b3,……,bN},其中N>>n。
(14)遍历B'中的每个电网断面,对于第i个电网断面bi,可以根据当前的设备状态做随机扰动,得到使得此时电网断面bi的最大线路负载出现重载或过载;然后,固定和用元启发算法寻找使得最大线路负载率(图7a中表示为rho)最小化的母线闸刀动作z*;最后,将该母线闸刀动作作为相应电网断面下母线闸刀的最优调度动作(或近优调度动作),添加到动作集S中。
(15)对动作集S中的动作进行去重与筛选,其中的筛选条件可以例如母线闸刀动作重复次数小于给定阈值、母线闸刀动作带来的负载率减小的峰值小于给定阈值等,得到去重与筛选后的动作集S'。动作集S'可以作为剪枝后的动作空间,并初始化每个动作的得分为0。
2.专家智能体样本生成阶段
初始化专家样本库为空集,即专家样本库然后,基于数据驱动动作空间剪枝阶段得到的电网断面的概率分布N*(μ*,σ*),继续采样得到更多的电网断面,表示为B″={b1,b2,b3,……,bM},其中M>>N。然后,依序遍历B″中的每一个电网断面,若第t个电网断面bt下发生线路重载或过载,则基于电力调度领域的学科知识生成一个动作组合at(包括线路闸刀动作、母线闸刀动作、发电机组出力),具体流程如下:
(21)遍历动作集S'中的每一个母线闸刀动作abs,i
(22)分别执行前文中的规则A和规则B,得到线路闸刀动作als,j|abs,i和发电机组出力动作ag|als,j,abs,i。
(23)记录动作组合母线闸刀动作abs,i、线路闸刀动作als,j|abs,i和发电机组出力动作ag|als,j,abs,i后电网的最大线路负载率,以及动作组合的分值,表示为min Rhoi,其中Rhoi表示最大线路负载率。
(24)记录动作组合的分值最大的动作动作组合为at。
(25)将断面-动作的对应关系(bt,at)添加到训练样本集T中,并进入下一个电网断面的判断。
3.模仿学习预训练阶段
本阶段可以基于专家智能体样本生成阶段得到的专家样本库进行神经网络的训练。具体地,可以从给定电网断面中提取特征信息,特征信息可以例如发电机组出力、母线刀闸状态、线路闸刀状态、线路负载率、线路潮流、用户负荷等,并将给定电网断面对应的调度动作为标签作为训练标签。可以基于反向传播算法,以监督学习的方式,用上述特征和对应的标签,训练一个以特征为输入,剪枝动作空间中的调度动作的概率为输出的神经网络。
示例性地,上述神经网络的结构如下:
第一层为神经网络的输入层,输入层的神经元数为特征信息的维数;第二、三、四层为全连接隐含层,全连接隐含层的神经元数为特征信息维数的倍数,例如1.2倍,激活函数可以采用ReLu函数;第五层可以采用dropout层,其丢弃概率可以设置为0.2;第六层为全连接隐含层,全连接隐含层的神经元数为特征信息维数的倍数,例如1.2倍,激活函数采用ReLu函数;第七层采用dropout层,其丢弃概率可以设置为0.2;第八层为全连接输出层,输出层的激活函数可以采用SoftMax函数。
在一些实施例中,模仿学习阶段的神经网络可采用深度学习框架进行训练,例如Tensorflow、PyTorch等。
4.强化学习再训练阶段
在一些实施例中,本阶段可以基于动作-奖赏(Actor-Critic)框架,建立强化学习模型如近端策略优化算法(Proximal Policy Optimization,PPO)、柔性致动/评价(softactor-critic,SAC)。为实现强化学习模型训练的热启动,将模仿学习阶段中通过监督学习方法得到的神经网络作为本阶段中强化学习模型的Actor网络。
首先,可以定义从电网断面b到动作组合a的两种映射如下:
映射提取电网断面b的特征信息并送入Actor网络,计算剪枝动作空间内各母线闸刀动作的概率;然后,确定母线闸刀动作的概率的多项分布,并对其进行采样,获得一个母线闸刀动作abs,t。在母线闸刀动作abs,t的基础上,依据规则A补充线路闸刀动作,依据规则B补充发电机组动作,形成动作组合并返回。
映射不进行任何母线闸刀动作,仅依据规则A确定线路闸刀动作,然后依据规则B确定发电机组动作,两者结合后形成组合动作并返回。
示例性地,结合图8,以PPO模型为例,对强化学习模型的训练过程进行介绍。
图8所示为本申请实施例中的一种强化学习模型的训练过程示意图。
如图8所示,该过程包括:
801:初始化Actor-Critic框架。
在一些实施例中,步骤801可以包括将模仿学习预训练阶段训练得到的神经网络赋值给Actor网络,并以一组随机数初始化Critic网络;初始化电网仿真环境,并按时序将历史电网断面输入电网仿真环境;将累计奖赏R设置为零。
802:在电网仿真环境中仿真出最大线路负载率大于给定阈值的第t个电网断面。
在一些实施例中,步骤802可以包括Actor-Critic框架可以获取电网仿真环境中初始化后的电网断面,按照映射调度电网仿真环境直到电网断面的最大线路负载率大于给定阈值。
803:确定对第t个电网断面进行调度所需的动作组合,并确定执行该动作组合后的第t+1个电网断面,以及本次调度的奖赏。
在一些实施例中,步骤803可以包括对于第t个出现当前重载或过载的电网断面bt,按照映射得到动作组合at,并将其发送给电网仿真环境执行。然后确定电网仿真环境执行该动作后的电网断面bt+1和奖赏函数Freward,则可以确定本次交互的奖赏rt=Freward(bt+1),并将rt添加到累计奖赏,累计奖赏可以表示为:R=R+rt。
在一些实施例中,奖赏函数可以采用下述公式进行确定
804:对第t+1个电网断面后的电网进行调度,确定每次调度的奖赏,并在电网断面的最大线路负载率大于给定阈值停止调度。
在一些实施例中,步骤804可以包括得到第t+1个电网断面之后,可以按照映射确定动作组合并发送给电网仿真环境执行。电网仿真环境执行动作组合后,确定本次调度的奖赏并添加到累计奖赏中,直至电网仿真环境中的电网断面的最大线路负载率再次高于给定阈值,记此时的电网断面为bt′。若在此调度过程中,电网仿真环境发生大停电事故或达到终点断面,则将结束标记done记为1,否则结束标记done记为0。
805:根据多次调度的奖赏确定累计奖赏,并根据调度过程中的数据对Actor-Critic框架进行优化。
在一些实施例中,步骤805可以包括记录多次强化学习模型与电网环境的交互过程的交互信息为一个元组(bt,at,R,bt′,done),当元组数达到给定的元组数阈值时,根据PPO模型的优化算法,用这些元组更新Actor-Critic框架中的Actor网络和Critic网络,然后清空这些元组。
在一些实施例中,执行步骤805后,跳转至步骤803,进行下一次的元组的记录,已进行下一次的Actor-Critic框架的优化。
下面结合图9a和图9b,对本申请实施例中的一种电网的调度方法进行介绍。
图9a和图9b所示为本申请实施例中的一种电网的调度方法的流程示意图。
如图9a和图9b所示,该方法包括母线闸刀决策模型③的生成、线路闸刀与发电机组出力决策模型④的生成以及应用母线闸刀决策模型③和线路闸刀与发电机组出力决策模型④完成电网调度。
在一些实施例中,在模型生成部分,可以通过如图7a和7b中的数据驱动动作空间剪枝阶段和专家样本生成阶段生成的专家样本库①以及电网运行断面库,进行神经网络模型的模仿学习和/或强化学习,得到母线闸刀决策模型③。可以通过于电力调度领域的学科知识确定专家规则以得到线路闸刀的调度动作决策规则,通过求解得到最小经济成本下的发电机组出力的优化算法,得到发电机组出力规则。将线路闸刀的调度动作决策规则和发电机组出力规则结合,例如利用包括专家规则和优化算法的专家规则库②,得到线路闸刀与发电机组出力决策模型④。
在一些实施例中,应用包括母线闸刀决策模型③和线路闸刀与发电机组出力决策模型④的电网调度系统300实现调度计划的生成,具体包括:
911:母线闸刀是否需要动作。
具体地,电网调度系统300在确定电网需要调度后,会根据接收到的电网断面判断母线闸刀是否需要动作,例如可以通过判断电网是否重载或过载判断母线闸刀是否需要动作。此判断过程在上文中已经介绍,在此不做赘述。
若步骤911的判断结果为是,则执行:
912:生成母线闸刀动作。
可以理解,步骤911判断结果为是时,可以通过母线闸刀决策模型③生成母线闸刀动作。
913:生成调度计划。
具体地,母线闸刀决策模型③生成的母线闸刀动作反馈至线路闸刀与发电机组出力决策模型④,线路闸刀与发电机组出力决策模型④基于生成的母线闸刀动作,生成对应的线路闸刀动作和发电机组出力。进而,电网调度系统300可以根据母线闸刀动作、线路闸刀动作和发电机组出力,生成调度计划,调度计划可例如图6所示。
若步骤911的判断结果为否,则电网调度系统300直接通过线路闸刀与发电机组出力决策模型④生成对应的线路闸刀动作和发电机组出力,线路闸刀动作和发电机组出力即可作为生成的调度计划。
进一步地,电网调度系统300还可以包括调度动作调整与反馈模块⑤。调度动作调整与反馈模块⑤可以用于与调度员进行交互,例如将调度计划发送至调度员,使得调度员参考并判断调度计划是否合理或优秀,并获取调度员的调度计划反馈,根据调度员的反馈意见,将实时电网断面以及调整后的调度动作反馈至专家样本库进行存储,并基于反馈的数据对母线闸刀决策模型③进行优化。
本申请实施例通过母线闸刀决策模型③以及线路闸刀与发电机组出力决策模型④分别决策母线闸刀动作、线路闸刀动作和发电机组出力,可以减少决策时间,快速生成调度计划。同时,将调度计划发送至调度员进行审核调整,可以降低调度员的操作难度和技术水平,电网调度系统结合人工相配合,可以提高电网调度质量。
在说明书对“一个实施例”或“实施例”的引用意指结合实施例所描述的具体特征、结构或特性被包括在根据本申请公开的至少一个范例实施方案或技术中。说明书中的各个地方的短语“在一个实施例中”的出现不一定全部指代同一个实施例。
本申请公开还涉及用于执行文本中的操作装置。该装置可以专门处于所要求的目的而构造或者其可以包括被存储在计算机中的计算机程序选择性地激活或者重新配置的通用计算机。这样的计算机程序可以被存储在计算机可读介质中,诸如,但不限于任何类型的盘,包括软盘、光盘、CD-ROM、磁光盘、只读存储器(ROM)、随机存取存储器(RAM)、EPROM、EEPROM、磁或光卡、专用集成电路(ASIC)或者适于存储电子指令的任何类型的介质,并且每个可以被耦合到计算机系统总线。此外,说明书中所提到的计算机可以包括单个处理器或者可以是采用针对增加的计算能力的多个处理器涉及的架构。
另外,在本说明书所使用的语言已经主要被选择用于可读性和指导性的目的并且可能未被选择为描绘或限制所公开的主题。因此,本申请公开旨在说明而非限制本文所讨论的概念的范围。
Claims (15)
1.一种电网的调度方法,应用于电子设备,其特征在于,包括:
获取电网系统的第一电网状态信息;
将所述第一电网状态信息分别输入多个电网决策模型,得到多个决策结果,其中,每个所述电网决策模型对应至少一个待调度对象,所述电网决策模型输出的决策结果为对对应的待调度对象的调度动作的决策,并且不同的电网决策模型所对应的待调度对象的调度动作的决策复杂度不同;
根据所述多个电网决策模型的决策结果生成第一调度计划,并执行所述第一调度计划。
2.根据权利要求1所述的电网的调度方法,其特征在于,所述待调度对象包括下列中的至少一种:
母线闸刀,其中,所述母线闸刀的调度动作包括闭合所述母线闸刀和打开所述母线闸刀,所述电网状态信息包括:所述母线闸刀的闭合状态和所述母线闸刀的打开状态;
线路闸刀,其中,所述线路闸刀的调度动作包括闭合所述线路闸刀和打开所述线路闸刀,所述电网状态信息包括:所述线路闸刀的闭合状态和所述线路闸刀的打开状态;
发电机组,其中,所述发电机组的调度动作包括对所述发电机组输出电能的调整,所述电网状态信息包括:所述发电机组的输出电能。
3.根据权利要求1所述的电网的调度方法,其特征在于,将所述第一电网状态信息分别输入多个电网决策模型,得到多个决策结果,包括:
按照所述多个电网决策模型的决策所对应的待调度对象的调度动作的决策复杂度从高到低顺序,将所述第一电网状态信息依次输入所述多个电网决策模型,得到所述多个决策结果。
4.根据权利要求1所述的电网的调度方法,其特征在于,将所述第一电网状态信息分别输入多个电网决策模型,包括:
将符合预设电网条件的所述第一电网状态信息分别输入所述多个电网决策模型。
5.根据权利要求4所述的电网的调度方法,其特征在于,所述预设电网条件包括预设负载率阈值;
所述将符合预设电网条件的所述第一电网状态信息分别输入所述多个电网决策模型,包括:
提取所述第一电网状态信息的特征信息,并根据所述特征信息确定所述电网系统的最大线路负载率;
确定所述最大线路负载率大于预设负载率阈值;
将所述第一电网状态信息分别输入所述多个电网决策模型。
6.根据权利要求1所述的电网的调度方法,其特征在于,还包括:
获取所述电网系统的所述待调度对象;
根据所述待调度对象的调度动作的决策复杂度,对所述待调度对象进行分组,其中所述决策复杂度是基于预设待调度对象与所述预设待调度对象的调度动作的决策复杂度的对应关系确定的,并且属于同一组的待调度对象的决策复杂度的差值小于预设复杂度差值阈值;
为每组待调度对象训练对应的所述电网决策模型。
7.根据权利要求6所述的电网的调度方法,其特征在于,至少部分电网决策模型是利用多个第二电网状态信息和对应的第二调度计划作为训练数据,通过机器学习训练的得到的,并且所述至少部分电网决策模型为神经网络。
8.根据权利要求7所述的电网的调度方法,其特征在于,所述训练数据的确定包括:
根据所述电网系统的待调度对象的调度动作,生成第一动作集,其中所述第一动作集中包括每次进行电网调度时,所执行的所述待调度对象的所有调度动作的组合;
获取所述多个第二电网状态信息,所述多个第二电网状态信息包括历史电网状态信息和/或仿真电网状态信息;
在所述第一动作集中,利用优化算法,确定所述第二电网状态信息对应的所述待调度对象的调度动作的组合作为所述第二调度计划。
9.根据权利要求8所述的电网的调度方法,其特征在于,所述训练数据的确定还包括:
根据所述多个第二电网状态信息对应的所述第二调度计划,生成第二动作集。
10.根据权利要求9所述的电网的调度方法,其特征在于,将所述第一电网状态信息输入所述电网决策模型,得到对应的决策结果包括:
将所述第一电网状态信息输入所述电网决策模型,并确定所述第二动作集中概率最高的第二调度计划作为所述决策结果。
11.根据权利要求8所述的电网的调度方法,其特征在于,所述优化算法为下列中的至少一种:
元启发算法、贪心算法。
12.根据权利要求1所述的电网的调度方法,其特征在于,所述根据所述多个电网决策模型的决策结果生成第一调度计划,并执行所述第一调度计划,包括:
根据根据所述多个电网决策模型的决策结果生成第一调度计划;
将所述第一调度计划反馈至调度员,并获取所述调度员的调度计划调整信息;
根据所述调度计划调整信息调整所述第一调度计划,并执行调整后的所述第一调度计划。
13.一种电子设备,其特征在于,包括:一个或多个处理器;一个或多个存储器;所述一个或多个存储器存储有一个或多个程序,当所述一个或者多个程序被所述一个或多个处理器执行时,使得所述电子设备执行权利要求1至12中任一项所述的电网的调度方法。
14.一种计算机可读存储介质,其特征在于,所述存储介质上存储有指令,所述指令在计算机上执行时使所述计算机执行权利要求1至12中任一项所述的电网的调度方法。
15.一种计算机程序产品,其特征在于,所述计算机程序产品包括指令,该指令在执行时使计算机执行权利要求1至12中任一项所述的电网的调度方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210239430.3A CN116822806A (zh) | 2022-03-11 | 2022-03-11 | 电网的调度方法、电子设备及可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210239430.3A CN116822806A (zh) | 2022-03-11 | 2022-03-11 | 电网的调度方法、电子设备及可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116822806A true CN116822806A (zh) | 2023-09-29 |
Family
ID=88113199
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210239430.3A Pending CN116822806A (zh) | 2022-03-11 | 2022-03-11 | 电网的调度方法、电子设备及可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116822806A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117830029A (zh) * | 2024-03-01 | 2024-04-05 | 华能澜沧江水电股份有限公司 | 一种基于优化算法的集控平台管理系统 |
-
2022
- 2022-03-11 CN CN202210239430.3A patent/CN116822806A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117830029A (zh) * | 2024-03-01 | 2024-04-05 | 华能澜沧江水电股份有限公司 | 一种基于优化算法的集控平台管理系统 |
CN117830029B (zh) * | 2024-03-01 | 2024-04-30 | 华能澜沧江水电股份有限公司 | 一种基于优化算法的集控平台管理系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Sun et al. | A customized voltage control strategy for electric vehicles in distribution networks with reinforcement learning method | |
CN107887903B (zh) | 考虑元件频率特性的微电网鲁棒优化调度方法 | |
Lan et al. | AI-based autonomous line flow control via topology adjustment for maximizing time-series ATCs | |
CN115241885B (zh) | 电网实时调度优化方法、系统、计算机设备及存储介质 | |
Nie et al. | Optimizing the post-disaster control of islanded microgrid: A multi-agent deep reinforcement learning approach | |
CN111179121A (zh) | 基于专家系统与深度逆向强化学习的电网紧急控制方法 | |
CN107947164A (zh) | 一种考虑多重不确定性及相关性的电力系统日前鲁棒调度方法 | |
Xu et al. | Constrained multiobjective global optimisation of longitudinal interconnected power system by genetic algorithm | |
CN103729695A (zh) | 基于粒子群和bp神经网络的短期电力负荷预测方法 | |
CN107977744A (zh) | 一种基于传统Benders分解法的电力系统日前鲁棒调度方法 | |
CN113872213B (zh) | 一种配电网电压自主优化控制方法及装置 | |
CN114696351B (zh) | 一种电池储能系统动态优化方法、装置、电子设备和存储介质 | |
CN112632288A (zh) | 一种基于知识图谱的电力调度系统及方法 | |
Duan et al. | A deep reinforcement learning based approach for optimal active power dispatch | |
CN116345578B (zh) | 基于深度确定性策略梯度的微电网运行优化调度方法 | |
CN112381359B (zh) | 一种基于数据挖掘的多critic强化学习的电力经济调度方法 | |
CN116523327A (zh) | 一种基于强化学习的配电网运行策略智能生成方法及设备 | |
Al Zishan et al. | Adaptive control of plug-in electric vehicle charging with reinforcement learning | |
CN118174355A (zh) | 一种微电网能量优化调度方法 | |
CN116169776A (zh) | 电力系统云边协同人工智能调控方法、系统、介质及设备 | |
CN116822806A (zh) | 电网的调度方法、电子设备及可读存储介质 | |
CN115764950A (zh) | 轨道交通储能系统的控制方法、模型、设备和存储介质 | |
Li et al. | Multiagent deep meta reinforcement learning for sea computing-based energy management of interconnected grids considering renewable energy sources in sustainable cities | |
CN118381095A (zh) | 新能源微电网储能充放电智能控制方法及装置 | |
CN113555876A (zh) | 基于人工智能的线路潮流调控方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication |