CN115953009A

CN115953009A - 电力系统的调度方法、调度决策模型的训练方法

Info

Publication number: CN115953009A
Application number: CN202310181369.6A
Authority: CN
Inventors: 钮孟洋; 杨超; 韩佳澦; 杨程; 仪忠凯; 王伟
Original assignee: Alibaba China Co Ltd
Current assignee: Alibaba China Co Ltd
Priority date: 2023-03-01
Filing date: 2023-03-01
Publication date: 2023-04-11
Anticipated expiration: 2043-03-01
Also published as: CN115953009B

Abstract

本申请公开了一种电力系统的调度方法、调度决策模型的训练方法。其中，该方法包括：获取电力系统的状态信息；将状态信息输入至调度决策模型进行调度决策，生成电力系统的调度策略，其中，调度决策模型是通过对初始决策模型和初始生成模型进行对抗学习得到的，初始决策模型用于基于状态样本生成决策结果，初始生成模型用于基于状态样本和决策结果生成故障结果；基于调度策略对电力系统中的机组设备进行调度。本申请解决了相关技术中电力系统的运行安全性较低的技术问题。

Description

电力系统的调度方法、调度决策模型的训练方法

技术领域

本申请涉及电力系统的调度领域，具体而言，涉及一种电力系统的调度方法、调度决策模型的训练方法。

背景技术

目前电力系统实时调度方法的核心是根据给定的电网结构、参数和发电机、负荷等元件的运行条件，对电力系统各部分稳态运行状态参数进行计算，然而常规的求解方法得到的调度策略通常只考虑正常情况下的安全性，其难以保证在故障发生的情况下正常运行。

针对上述的问题，目前尚未提出有效的解决方案。

发明内容

本申请实施例提供了一种电力系统的调度方法、调度决策模型的训练方法，以至少解决相关技术中电力系统的运行安全性较低的技术问题。

根据本申请实施例的一个方面，提供了一种电力系统的调度方法，包括：获取电力系统的状态信息；将状态信息输入至调度决策模型进行调度决策，生成电力系统的调度策略，其中，调度决策模型是通过对初始决策模型和初始生成模型进行对抗学习得到的，初始决策模型用于基于状态样本生成决策结果，初始生成模型用于基于状态样本和决策结果生成故障结果；基于调度策略对电力系统中的机组设备进行调度。

根据本申请实施例的另一方面，还提供了一种调度决策模型的训练方法，包括：获取电力系统的状态样本；将状态样本输入至初始决策模型进行调度决策，生成电力系统的决策结果；将状态样本和决策结果输入至初始生成模型进行故障生成，生成电力系统的故障结果；基于状态样本、决策结果和故障结果，确定总损失函数值；基于总损失函数值对初始决策模型的决策模型参数和初始生成模型的生成模型参数进行交替更新，得到调度决策模型。

根据本申请实施例的另一方面，还提供了一种电力系统的调度方法，包括：云服务器获取电力系统的状态信息；云服务器将状态信息输入至调度决策模型进行调度决策，生成电力系统的调度策略，其中，调度决策模型是通过对初始决策模型和初始生成模型进行对抗学习得到的，初始决策模型用于基于状态样本生成决策结果，初始生成模型用于基于状态样本和决策结果生成故障结果；云服务器基于调度策略对电力系统中的机组设备进行调度。

根据本申请实施例的另一方面，还提供了一种计算机可读存储介质，计算机可读存储介质包括存储的程序，其中，在程序运行时控制计算机可读存储介质所在设备执行上述实施例中任意一项的方法。

根据本申请实施例的另一方面，还提供了一种电子设备，包括：存储器，存储有可执行程序；处理器，用于运行程序，其中，程序运行时执行上述实施例中任意一项的方法。

在本申请实施例中，首先，获取电力系统的状态信息，然后将状态信息输入到调度决策模型进行调度决策，生成电力系统的调度策略，其中，所述调度决策模型是通过对初始决策模型和初始生成模型进行对抗学习得到的，所述初始决策模型用于基于状态样本生成决策结果，所述初始生成模型用于基于所述状态样本和所述决策结果生成故障结果，最后基于调度策略对电力系统中的机组设备进行调度。容易注意到的是，由于该调度决策模型是通过对初始决策模型和初始生成模型进行对抗学习得到的，因此，通过该调度决策模型得到的调度策略可以考虑到故障的情况，使得通过该调度策略对电力系统中的机组设备进行调度时，在出现故障的情况下也可以安全运行，从而解决相关技术中电力系统的运行安全性较低的技术问题。

容易注意到的是，上面的通用描述和后面的详细描述仅仅是为了对本申请进行举例和解释，并不构成对本申请的限定。

附图说明

此处所说明的附图用来提供对本申请的进一步理解，构成本申请的一部分，本申请的示意性实施例及其说明用于解释本申请，并不构成对本申请的不当限定。在附图中：

图1是根据本申请实施例的一种用于实现电力系统的调度方法的计算机终端（或移动设备）的硬件结构框图；

图2是根据本申请实施例1的电力系统的调度方法的流程图；

图3是根据本申请实施例的一种调度决策模型的训练和部署示意图；

图4是根据本申请实施例的一种调度决策网络的示意图；

图5是根据本申请实施例2的一种调度决策模型的训练方法的流程图；

图6是根据本申请实施例3的一种电力系统的调度方法的流程图；

图7是根据本申请实施例4的一种电力系统的调度装置的示意图；

图8是根据本申请实施例5的一种调度决策模型的训练装置的示意图；

图9是根据本申请实施例6的一种电力系统的调度装置的示意图；

图10是根据本申请实施例的一种计算机终端的结构框图。

具体实施方式

为了使本技术领域的人员更好地理解本申请方案，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分的实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本申请保护的范围。

需要说明的是，本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

首先，在对本申请实施例进行描述的过程中出现的部分名词或术语适用于如下解释：

潮流计算（Power Flow，简称为PF），一种根据给定的电网结构、参数和发电机、负荷等元件的运行条件，确定电力系统各部分稳态运行状态参数的计算方法；

神经网络（Neural Network，简称为NN），一种模仿动物神经网络行为特征，由人工神经节点构成，进行分布式并行信息处理的算法数学模型。这种网络依靠系统的复杂程度，通过调整内部大量节点之间相互连接的关系，从而达到处理信息的目的；

可行性投影（feasibility mapping），一种将调度策略从根据物理规则划分的不可行域投影至可行域的数学建模求解方法；

对抗学习（Adversarial Learning），一种神经网络学习方法，通过设计对抗样本来达成训练鲁棒神经网络的目的。

目前，电力行业可再生能源与灵活性资源大规模并网，电力设备的种类和数量日益增多，电网的稳定运行对电力调度系统的故障对能力提出了新的挑战，电力系统实时调度问题的核心是一系列潮流问题的求解，然而常规求解得到的调度策略通常只考虑正常情况下的安全性和经济性，无法保证故障发生情况下的正常运行，而求解电力系统安全约束潮流问题（Security Constrained Optimal Power Flow，简称为SCOPF）虽然能应对多种预想故障，但其计算规模随着预想故障的增加而指数级扩大，数值求解较为困难，其求解精度和求解速度难以满足实时应用。

目前的调度方法如下：

机组组合调度方法（Security Constrained Unit Commitment，简称为SCUC）：其是以多个时间步的整体目标较优来决定各时刻机组的启停决策以及出力决策的，通常会作为日间调度决策方法，虽然可以提前一天来进行决策，但新能源的波动性导致日级的决策效果很难应对实时的变化情况。

基于强化学习的调度方法：强化学习本身是适用于序贯决策的场景，因此常常用来进行长期目标的更新，其决策响应时间非常快，通常在秒级，但强化学习由于是基于数据驱动的方式来进行学习的，其不善于处理含有硬性约束条件的问题，具体在电网调度场景中，强化学习的决策结果有可能不能满足安全约束，这使得完全基于强化学习进行电网调度的方法存在安全隐患。

日间较优潮流（Optimal Power Flow，简称为OPF）的求解方法：通常可以满足常规情况下的经济型和安全性目标，对于大规模电网实时计算存在一定难度，通常对任意故障没有应对能力。

安全约束较优潮流（Security Constrained Optimal Power Flow，简称为SCOPF）的求解方法：理论上可以求解得到理想中的故障鲁棒的调度策略，但是随着设想的故障集的增大，其问题规模呈指数级增长，即使有一些加速求解的方法，其计算效率依然难以满足实时性要求。

鉴于此，本申请提出了一种结合对抗学习和可行性神经网络的架构，用于快速求解得到调度决策，从而可以支持故障鲁棒的实时调度应用。

实施例1

根据本申请实施例，还提供了一种电力系统的调度方法实施例，需要说明的是，在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行，并且，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤。

本申请实施例一所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。图1是根据本申请实施例的一种用于实现电力系统的调度方法的计算机终端（或移动设备）的硬件结构框图。如图1所示，计算机终端10（或移动设备）可以包括一个或多个（图中采用102a，102b，……，102n来示出）处理器102（处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置）、用于存储数据的存储器104、以及用于通信功能的传输装置106。除此以外，还可以包括：显示器、输入/输出接口（I/O接口）、通用串行总线（USB）端口（可以作为BUS总线的端口中的一个端口被包括）、网络接口、电源和/或相机。本领域普通技术人员可以理解，图1所示的结构仅为示意，其并不对上述电子装置的结构造成限定。例如，计算机终端10还可包括比图1中所示更多或者更少的组件，或者具有与图1所示不同的配置。

应当注意到的是上述一个或多个处理器102和/或其他数据处理电路在本文中通常可以被称为“数据处理电路”。该数据处理电路可以全部或部分的体现为软件、硬件、固件或其他任意组合。此外，数据处理电路可为单个独立的处理模块，或全部或部分的结合到计算机终端10（或移动设备）中的其他元件中的任意一个内。如本申请实施例中所涉及到的，该数据处理电路作为一种处理器控制（例如与接口连接的可变电阻终端路径的选择）。

存储器104可用于存储应用软件的软件程序以及模块，如本申请实施例中的电力系统的调度方法对应的程序指令/数据存储装置，处理器102通过运行存储在存储器104内的软件程序以及模块，从而执行各种功能应用以及数据处理，即实现上述的电力系统的调度方法。存储器104可包括高速随机存储器，还可包括非易失性存储器，如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中，存储器104可进一步包括相对于处理器102远程设置的存储器，这些远程存储器可以通过网络连接至计算机终端10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算机终端10的通信供应商提供的无线网络。在一个实例中，传输装置106包括一个网络适配器（Network Interface Controller，NIC），其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中，传输装置106可以为射频（Radio Frequency，RF）模块，其用于通过无线方式与互联网进行通讯。

显示器可以例如触摸屏式的液晶显示器（LCD），该液晶显示器可使得用户能够与计算机终端10（或移动设备）的用户界面进行交互。

此处需要说明的是，在一些可选实施例中，上述图1所示的计算机设备（或移动设备）可以包括硬件元件（包括电路）、软件元件（包括存储在计算机可读介质上的计算机代码）、或硬件元件和软件元件两者的结合。应当指出的是，图1仅为特定具体实例的一个实例，并且旨在示出可存在于上述计算机设备（或移动设备）中的部件的类型。

在上述运行环境下，本申请提供了如图2所示的电力系统的调度方法。图2是根据本申请实施例1的电力系统的调度方法的流程图。如图2所示，该方法可以包括如下步骤：

步骤S202，获取电力系统的状态信息。

上述的电力系统的状态信息包括但不限于机组出力、负载功率、电网拓扑、线路状态。

上述的电力系统中可以包含多个待进行调度的机组设备，通过获取该电力系统的状态信息，根据该状态信息确定出调度决策，以便根据该调度决策对电力系统中的机组设备进行调度。

步骤S204，将状态信息输入至调度决策模型进行调度决策，生成电力系统的调度策略。

其中，调度决策模型是通过对初始决策模型和初始生成模型进行对抗学习得到的，初始决策模型用于基于状态样本生成决策结果，初始生成模型用于基于状态样本和决策结果生成故障结果。

在一种可选的实施例中，可以在得到电力系统的状态信息之后，对状态信息进行结构化预处理，得到矩阵或向量等神经网络可以处理的格式，以便将预处理后的状态信息输入至调度决策模型进行调度决策，生成电力系统的调度策略。

上述的初始决策模型可以为调度决策网络，其为可行性神经网络，其中，可行性神经网络指的是可以保证输出的调度策略满足无故障情况下的电网可行性约束的神经网络。上述的初始生成模型可以为故障生成网络，其为全连接神经网络。

上述的调度策略可以为电网中的机组发电功率、机组电压调整等。上述的故障结果可以为线路故障、机组故障等。

上述的状态样本用于表示电力系统的状态信息的样本，可以将状态样本输入到初始决策模型中进行调度决策，生成决策结果。其中，状态样本可以包括但不限于机组出力、负载功率、电网拓扑、线路状态。

在一种可选的实施例中，在状态样本为机组出力、负载功率、电网拓扑、线路状态的机组出力的情况下，可以将机组出力、负载功率、电网拓扑、线路状态输入到初始决策模型中进行调度决策，从而可以得到电力系统的决策结果。

上述的决策结果可以是初始决策模型基于状态样本直接生成的决策结果，该初始决策模型在决策的过程中会考虑到故障情况，但是预先未通过该故障情况进行训练。上述的故障结果可以是在该决策结果和状态样本下出现线路故障和/或机组故障的结果。

在一种可选的实施例中，可以先利用初始决策模型对状态样本进行决策，生成决策结果，然后利用初始生成模型对状态样本和决策结果进行处理生成故障结果，可以根据故障结果和决策结果对初始决策模型和初始生成模型进行对抗学习，得到调度决策模型，以便通过该调度决策模型进行决策得到的调度策略可以在故障情况下也能安全运行。

步骤S206，基于调度策略对电力系统中的机组设备进行调度。

在一种可选的实施例中，可以根据该调度策略对电力系统中的机组设备的机组出力、负载功率、电网拓扑、线路状态等进行调度，从而实现电力系统中机组设备的安全运行。

通过上述步骤，首先，获取电力系统的状态信息，然后将状态信息输入到调度决策模型进行调度决策，生成电力系统的调度策略，其中，所述调度决策模型是通过对初始决策模型和初始生成模型进行对抗学习得到的，所述初始决策模型用于基于状态样本生成决策结果，所述初始生成模型用于基于所述状态样本和所述决策结果生成故障结果，最后基于调度策略对电力系统中的机组设备进行调度。容易注意到的是，由于该调度决策模型是通过对初始决策模型和初始生成模型进行对抗学习得到的，因此，通过该调度决策模型得到的调度策略可以考虑到故障的情况，使得通过该调度策略对电力系统中的机组设备进行调度时，在出现故障的情况下也可以安全运行，从而解决相关技术中电力系统的运行安全性较低的技术问题。

本申请上述实施例中，调度决策模型包括：全连接神经网络，其中，将状态信息输入至调度决策模型进行调度决策，生成电力系统的调度策略，包括：将状态信息输入至全连接神经网络进行调度决策，生成电力系统的初始策略；在初始策略满足电力系统的预设约束条件的情况下，确定初始策略为调度策略。

上述的全连接神经网络又称为多层感知机，是一种连接方式较为简单的人工神经网络，是前馈神经网络的一种。

上述的预设约束条件可以为电力系统的可行性约束条件，其中，该可行性约束条件可以为调度策略满足设备操作的约束条件，例如机组功率范围、机组功率调整速率、机组电压范围等；该可行性约束条件还可以为计算潮流方程得到的线路电流，该线路电路不超过线路设计容量等；该可行性约束条件还可以为其他安全约束以及物理规律。此处对预设约束条件不做限定，可以为预先设置的任意约束条件。

在一种可选的实施例中，可以将状态信息输入至全连接神经网络进行调度决策，生成电力系统的初始策略，在初始策略满足电力系统的预设约束条件的情况下，说明该初始策略可以安全运行，此时，可以确定该初始策略为调度策略。

本申请上述实施例中，在初始策略不满足预设约束条件的情况下，该方法还包括：基于初始策略构建目标函数，其中，目标函数用于表征初始策略和调度策略之间的投影距离；基于预设约束条件对目标函数进行求解，得到调度策略。

上述的初始策略可以为不可行调度策略，也即，通过该初始策略难以对电力系统中机组设备进行调度。上述的调度策略为可行调度策略，也即，通过该可行调度策略可以为对电力系统中机组设备进行调度。

上述的目标函数用于尽量的减少从不可行调度策略恢复至可行调度策略的投影距离，也即，用于尽量减少初始策略与调度策略之间的投影距离。

上述的调度策略可以应用于正常运行的电力系统或者可能发生故障的电力系统，通过调度决策可以对电力系统中机组的发电功率、机组电压等进行调整，从而对电力系统中的机组设备进行调度，保证机组设备的正常运行。

在一种可选的实施例中，在得到调度策略之后，可以将调度策略反馈到客户端，用户可以根据调度策略的使用场景对调度策略进行修改，并基于修改后的调度策略对电力系统中的机组设备进行调度；进一步的，可以保存修改后的调度策略，后续在相同的使用场景下，可以直接根据修改后的调度策略对电力系统的机组设备进行调度。

通过初始策略需要满足的预设约束条件对目标函数进行求解，可以得到调度策略。

本申请上述实施例中，在对初始决策模型和初始生成模型进行对抗学习的过程中，初始决策模型的决策模型参数和初始生成模型的生成模型参数是基于总损失函数值进行交替更新的，总损失函数值是基于状态样本、决策结果和故障结果所确定的。

上述的决策模型参数可以为

，上述的生成模型参数可以为

，上述的总损失函数可以为

。

在一种可选的实施例中，基于总损失函数值对决策模型参数和生成模型参数进行交替更新是指，若当前阶段训练初始决策模型，则可以根据总损失函数值中的最小值对初始决策模型的决策模型参数进行更新，即，可以根据

更新初始决策模型的决策模型参数

；若当前阶段训练初始生成模型，则可以根据总损失函数值中的最大值对初始生成模型的生成模型参数进行更新，即，可以根据

更新初始生成模型的生成模型参数

，其中，

用于表示电网状态、

用于表示调度策略，

用于表示电网故障。

本申请上述实施例中，总损失函数值是对第一损失函数值和第二损失函数值进行求和得到的，第一损失函数值用于表征决策结果对应的安全程度，第二损失函数值用于表征决策结果对应的调度成本。

在一种可选的实施例中，基于第一损失函数值和第二损失函数值得到上述的总损失函数值，可以使得通过该总损失函数值对初始决策模型和初始生成模型进行训练，使得最终训练得到的调度决策模型可以兼顾安全程度和调度成本，从而使得调度决策模型在电力系统出现故障的情况下，也可以生成安全性较高且成本较低的调度策略。

本申请上述实施例中，第一损失函数值是基于决策结果和电网潮流确定的，电网潮流是基于电力系统模型、状态样本和决策结果得到的，电力系统模型是基于故障结果构建的。

上述的安全程度可以通过安全性指标表示，电力系统的安全程度越高，则说明安全性指标越高，电力系统的安全程度越低，则说明安全性指标越低；第一损失函数值主要用于评估电网状态的安全性，可以根据第一损失函数

得到第一损失函数值，其中，

表示为电网状态、

表示为调度策略、

表示为电网故障。

上述的电力系统模型可以为电网数据模型。

上述的故障结果可以为当前电网故障。上述的决策结果可以为调度策略。上述的状态样本可以为电网状态。上述的电网潮流可以为线路功率。

在一种可选的实施例中，根据第一损失函数确定第一损失函数值的步骤可以表示为：根据当前电网故障构建电网数学模型，其中，当前电网故障可以为线路断线等，可以基于电网数学模型和电网状态

、调度策略

计算得到电网潮流，例如线路功率等，可以根据调度策略和电网潮流计算安全性指标，其涵盖若干方面，包括但不限于调度策略

中机组功率是否高于装机容量、电网潮流中的线路功率不高于线路的安全上限等。

本申请上述实施例中，第二损失函数值是基于机组设备的发电功率确定的，发电功率是基于故障结果对机组设备的初始发电功率进行调整得到的，初始发电功率是基于调度策略和状态样本确定的。

上述的调度成本可以通过成本指标表示，电力系统的调度成本越高，则说明成本指标越高，电力系统的调度成本越低，则说明成本指标越低，成本指标主要用于评估电网发电的经济性，可以根据第二损失函数

得到第二损失函数值。

在一种可选的是实施例中，根据第二损失函数确定第二损失函数值的步骤可以表示为：根据调度策略

得到电网中各个机组的发电功率

∈

，

是所调度的机组数量，根据当前电网故障

更新机组发电功率

，也即基于故障结果对机组设备的初始发电功率进行调整得到发电功率，例如故障机组发电功率降低至0，各个机组的发电成本通常可以表示为各个机组发电功率的多项式，例如

＋

＋

＋…＋

，

∈

是这些机组的

阶成本系数，也即，上述的第二损失函数值。

本申请结合对抗学习和可行性神经网络的技术架构，训练深度神经网络用于故障鲁棒电网实时调度策略生成，实施的过程分为训练和部署两个部分。

图3是根据本申请实施例的一种调度决策模型的训练和部署示意图，如图3所示，训练过程设计了一个用于调度决策的可行性神经网络和一个用于故障生成的全连接神经网络进行对抗学习，具体流程如下：

1）对电力系统的状态信息进行结构化预处理，得到矩阵或者向量等神经网络可以处理的格式，作为输入变量x，其中，输入变量x包括但不限于机组出力、负载功率、电网拓扑、线路状态；

2）可以将输入变量x送入调度决策网络，得到输出调度策略

，其中，

为调度决策网络的参数，调度策略通常包含电网中的机组发电功率、机组电压调整等；

3）将调度策略y和电网状态信息x同时输入故障生成网络，得到电网故障

，其中，

为故障生成网络的参数，生成的故障z一般是线路或机组故障等；

4）计算电网状态为x时，电网故障z发生的情况下，调度策略y的安全性指标

和成本指标

，相加得到训练损失函数

=

＋

；

5）交替更新调度决策网络和故障生成网络：

a，若当前阶段训练调度决策网络，根据更新调度决策网络参数

；

b，若当前阶段训练故障生成网络，根据更新故障生成网络参数

；

循环执行上述步骤1）至5），直至调度决策网络和故障生成网络均区域收敛，训练得到调度决策模型。

如图3所示，部署阶段使用的是用于调度决策的可行性神经网络，具体流程描述为：

1）加载训练阶段训练完毕的调度决策网络

；

2）对电力系统的状态信息进行结构化预处理，得到矩阵或向量等神经网络可以处理的格式，作为输入变量x；

3）将输入变量送入调度决策网络，得到输出调度策略

，

4）基于调度策略y进行指令下发，以便对电力系统中的机组设备进行调度。

图4是根据本申请实施例的一种调度决策网络的示意图，如图4所示，调度决策网络所采用的可行性神经网络是一种特殊设计的神经网络，主要用于保证输出调度策略y满足无故障情况下的电网可行性约束，包含一个全连接神经网络、一个可行性判断模块、一个可行性恢复模块。执行流程可以如下：

1）将电力系统的状态信息进行结构化预处理，得到矩阵或向量等神经网络可以处理的格式，作为输入变量x；

2）将输入变量输入到全连接神经网络中，得到初步调度策略

；

3）计算初步调度策略

是否满足电网可行性，可行性包括：a，调度策略满足设备操作约束，如机组功率范围、机组功率调整速率、机组电压范围等；b，计算潮流方程得到线路电流，线路电流不超过线路设计容量等；c，其他安全约束以及物理规律；

4）若

通过可行性判断，则y=

；

5）若

未通过可行性判断，则执行可行性恢复模块，可行性恢复模块可以表示为寻找可行域内部的投影距离解，本申请试用的数据建模计算可行性恢复可以表示：

obj.

s.t.

a，优化问题的目标函数是最小化从不可行调度策略

恢复至可行调度策略y的投影距离，表示为

的p范数

；

b，优化问题的约束是

，表示可行调度策略y需要满足的可行性约束。

本申请提出的结合对抗学习和可行性神经网络的技术架构，可以用于电力系统中故障鲁棒的实时调度，能够保障多种预设故障下的电网安全稳定运行，安全保障强，决策效率高，可适用于大规模电网，本申请能够达到的技术效果如下：

1）故障鲁棒、安全保障强：传统的实时调度方式只能计算无故障情况下比较好的策略，但是难以保证故障发生时电网的安全运行，本申请采用可行性神经网络可以保证调度策略在没有故障情况下安全可行，同时在对抗学习中建模多种电网故障，训练后所生成的调度策略在故障发生时依然能够保持电网的安全稳定运行，具备更强的安全保障；

2）决策效率高，可以适用于大规模电网实时调度：本申请在部署决策时，可以不逐一求解故障下的调整策略，可以计算神经网络前向推理，决策效率显著高于传统方法，即使针对大规模电网也能实现实时调度。

需要说明的是，对于前述的各方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本申请并不受所描述的动作顺序的限制，因为依据本申请，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作和模块并不一定是本申请所必须的。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质（如ROM/RAM、磁碟、光盘）中，包括若干指令用以使得一台终端设备（可以是手机，计算机，服务器，或者网络设备等）执行本申请各个实施例的方法。

实施例2

根据本申请实施例，还提供了一种调度决策模型的训练方法实施例，需要说明的是，在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行，并且，虽然在流程图中示出了逻辑顺序，但在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤。

图5是根据本申请实施例2的一种调度决策模型的训练方法的流程图，如图5所示，该方法可以包括如下步骤：

步骤S502，获取电力系统的状态样本。

步骤S504，将状态样本输入至初始决策模型进行调度决策，生成电力系统的决策结果。

步骤S506，将状态样本和决策结果输入至初始生成模型进行故障生成，生成电力系统的故障结果。

步骤S508，基于状态样本、决策结果和故障结果，确定总损失函数值。

步骤S510，基于总损失函数值对初始决策模型的决策模型参数和初始生成模型的生成模型参数进行交替更新，得到调度决策模型。

通过上述步骤，获取电力系统的状态样本；将状态样本输入至初始决策模型进行调度决策，生成电力系统的决策结果；将状态样本和决策结果输入至初始生成模型进行故障生成，生成电力系统的故障结果；基于状态样本、决策结果和故障结果，确定总损失函数值；基于总损失函数值对初始决策模型的决策模型参数和初始生成模型的生成模型参数进行交替更新，得到调度决策模型，实现了通过训练得到调度决策模型来提高电力系统的运行安全性。容易注意到的是，由于该调度决策模型是通过对初始决策模型和初始生成模型进行对抗学习得到的，因此，通过该调度决策模型得到的调度策略可以考虑到故障的情况，使得通过该调度策略对电力系统中的机组设备进行调度时，在出现故障的情况下也可以安全运行，从而解决相关技术中电力系统的运行安全性较低的技术问题。

本申请上述实施例中，基于状态样本、决策结果和故障结果，确定总损失函数值包括：基于状态样本、决策结果和故障结果，确定第一损失函数值和第二损失函数值，其中，第一损失函数值用于表征决策结果对应的安全程度，第二损失函数值用于表征决策结果对应的调度成本；对第一损失函数值和第二损失函数值进行求和，得到总损失函数值。

本申请上述实施例中，基于状态样本、决策结果和故障结果，确定第一损失函数值包括:基于故障结果构建电力系统模型；基于电力系统模型、状态样本和决策结果，确定电网潮流；基于决策结果和电网潮流，确定第一损失函数值。

本申请上述实施例中，基于状态样本、决策结果和故障结果，确定第二损失函数值包括:基于调度策略和状态样本，确定机组设备的初始发电功率；基于故障结果对初始发电功率进行调整，得到机组设备的发电功率；基于发电功率确定第二损失函数值。

实施例3

根据本申请实施例，还提供了一种电力系统的调度方法实施例，需要说明的是，在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行，并且，虽然在流程图中示出了逻辑顺序，但在某些情况下，可以以不同于此的顺序执行所示出或描述的步骤。

图6是根据本申请实施例3的一种电力系统的调度方法的流程图，如图6所示，该方法可以包括如下步骤：

步骤S602，云服务器获取电力系统的状态信息。

步骤S604，云服务器将状态信息输入至调度决策模型进行调度决策，生成电力系统的调度策略。

在一种可选的实施例中，云服务器可以在得到电力系统的状态信息之后，对状态信息进行结构化预处理，得到矩阵或向量等神经网络可以处理的格式，以便将预处理后的状态信息输入至调度决策模型进行调度决策，生成电力系统的调度策略。

在一种可选的实施例中，云服务器在状态样本为机组出力、负载功率、电网拓扑、线路状态的机组出力的情况下，可以将机组出力、负载功率、电网拓扑、线路状态输入到初始决策模型中进行调度决策，从而可以得到电力系统的决策结果。

在一种可选的实施例中，云服务器可以先利用初始决策模型对状态样本进行决策，生成决策结果，然后利用初始生成模型对状态样本和决策结果进行处理生成故障结果，可以根据故障结果和决策结果对初始决策模型和初始生成模型进行对抗学习，得到调度决策模型，以便通过该调度决策模型进行决策得到的调度策略可以在故障情况下也能安全运行。

步骤S606，云服务器基于调度策略对电力系统中的机组设备进行调度。

在一种可选的实施例中，可以通过云服务器根据该调度策略对电力系统中的机组设备的机组出力、负载功率、电网拓扑、线路状态等进行调度，从而实现电力系统中机组设备的安全运行。

通过上述步骤，首先，通过云服务器获取电力系统的状态信息，然后通过云服务器将状态信息输入到调度决策模型进行调度决策，生成电力系统的调度策略，其中，调度决策模型是通过对初始决策模型和初始生成模型进行对抗学习得到的，初始决策模型用于基于状态样本生成决策结果，初始生成模型用于基于状态样本和决策结果生成故障结果，最后通过云服务器基于调度策略对电力系统中的机组设备进行调度。容易注意到的是，由于该调度决策模型是通过对初始决策模型和初始生成模型进行对抗学习得到的，因此，通过该调度决策模型得到的调度策略可以考虑到故障的情况，使得通过该调度策略对电力系统中的机组设备进行调度时，在出现故障的情况下也可以安全运行，从而解决相关技术中电力系统的运行安全性较低的技术问题。

本申请上述实施例中，调度决策模型包括：全连接神经网络，其中，云服务器将状态信息输入至调度决策模型进行调度决策，生成电力系统的调度策略，包括：云服务器将状态信息输入至全连接神经网络进行调度决策，生成电力系统的初始策略；云服务器在初始策略满足电力系统的预设约束条件的情况下，确定初始策略为调度策略。

在一种可选的实施例中，云服务器可以将状态信息输入至全连接神经网络进行调度决策，生成电力系统的初始策略，在初始策略满足电力系统的预设约束条件的情况下，说明该初始策略可以安全运行，此时，可以确定该初始策略为调度策略。

本申请上述实施例中，云服务器在初始策略不满足预设约束条件的情况下，方法还包括：云服务器基于初始策略构建目标函数，其中，目标函数用于表征初始策略和调度策略之间的投影距离；云服务器基于预设约束条件对目标函数进行求解，得到调度策略。

在一种可选的实施例中，云服务器在得到调度策略之后，可以将调度策略反馈到客户端，用户可以根据调度策略的使用场景对调度策略进行修改，并基于修改后的调度策略对电力系统中的机组设备进行调度；进一步的，云服务器可以保存修改后的调度策略，后续在相同的使用场景下，可以直接根据修改后的调度策略对电力系统的机组设备进行调度。通过初始策略需要满足的预设约束条件对目标函数进行求解，可以得到调度策略。

需要说明的是，本申请上述实施例中涉及到的优选实施方案与实施例1提供的方案以及应用场景、实施过程相同，但不仅限于实施例1所提供的方案。

实施例4

根据本申请实施例，还提供了一种用于实施上述电力系统的调度方法的电力系统的调度装置，图7是根据本申请实施例4的一种电力系统的调度装置的示意图，如图7所示，该装置700包括：获取模块702、决策模块704、调度模块706。

其中，获取模块用于获取电力系统的状态信息；决策模块用于将状态信息输入至调度决策模型进行调度决策，生成电力系统的调度策略，其中，调度决策模型是通过对初始决策模型和初始生成模型进行对抗学习得到的，初始决策模型用于基于状态样本生成决策结果，初始生成模型用于基于状态样本和决策结果生成故障结果；调度模块用于基于调度策略对电力系统中的机组设备进行调度。

此处需要说明的是，上述获取模块702、决策模块704、调度模块706对应于实施例1的步骤S202至步骤S206，三个模块与对应的步骤所实现的实例和应用场景相同，但不限于上述实施例一所公开的内容。需要说明的是，上述模块或单元可以是存储在存储器（例如，存储器104）中并由一个或多个处理器（例如，处理器102a，102b，……，102n）处理的硬件组件或软件组件，上述模块也可以作为装置的一部分可以运行在实施例1提供的计算机终端10中。

本申请上述实施例中，调度决策模型包括：全连接神经网络，其中，决策模块，包括：决策单元、确定单元。

其中，决策单元用于将状态信息输入至全连接神经网络进行调度决策，生成电力系统的初始策略；确定单元用于在初始策略满足电力系统的预设约束条件的情况下，确定初始策略为调度策略。

本申请上述实施例中，该装置还包括：构建模块、求解模块。

其中，构建模块用于基于初始策略构建目标函数，其中，目标函数用于表征初始策略和调度策略之间的投影距离；求解模块用于基于预设约束条件对目标函数进行求解，得到调度策略。

实施例5

根据本申请实施例，还提供了一种用于实施上述调度决策模型的训练方法的调度决策模型的训练度装置，图8是根据本申请实施例5的一种调度决策模型的训练装置的示意图，如图8所示，该装置800包括：获取模块802、决策模块804、生成模块806、确定模块808、更新模块810。

其中，获取模块用于获取电力系统的状态样本；决策模块用于将状态样本输入至初始决策模型进行调度决策，生成电力系统的决策结果；生成模块用于将状态样本和决策结果输入至初始生成模型进行故障生成，生成电力系统的故障结果；确定模块用于基于状态样本、决策结果和故障结果，确定总损失函数值；更新模块用于基于总损失函数值对初始决策模型的决策模型参数和初始生成模型的生成模型参数进行交替更新，得到调度决策模型。

此处需要说明的是，上述获取模块802、决策模块804、生成模块806、确定模块808、更新模块810对应于实施例2的步骤S502至步骤S510，五个模块与对应的步骤所实现的实例和应用场景相同，但不限于上述实施例一所公开的内容。需要说明的是，上述模块或单元可以是存储在存储器（例如，存储器104）中并由一个或多个处理器（例如，处理器102a，102b，……，102n）处理的硬件组件或软件组件，上述模块也可以作为装置的一部分可以运行在实施例1提供的计算机终端10中。

本申请上述实施例中，确定模块包括：确定单元、求和单元。

其中，确定单元用于基于状态样本、决策结果和故障结果，确定第一损失函数值和第二损失函数值，其中，第一损失函数值用于表征决策结果对应的安全程度，第二损失函数值用于表征决策结果对应的调度成本；求和单元，用于对第一损失函数值和第二损失函数值进行求和，得到总损失函数值。

本申请上述实施例中，确定单元还用于基于故障结果构建电力系统模型；确定单元还用于基于电力系统模型、状态样本和决策结果，确定电网潮流；确定单元还用于基于决策结果和电网潮流，确定第一损失函数值。

本申请上述实施例中，确定单元还用于基于调度策略和状态样本，确定机组设备的初始发电功率；确定单元还用于基于故障结果对初始发电功率进行调整，得到机组设备的发电功率；确定单元还用于基于发电功率确定第二损失函数值。

实施例6

根据本申请实施例，还提供了一种用于实施上述电力系统的调度方法的电力系统的调度装置，图9是根据本申请实施例6的一种电力系统的调度装置的示意图，如图9所示，该装置900包括：获取模块902、生成模块904、调度模块906。

其中，获取模块用于通过云服务器获取电力系统的状态信息；生成模块用于通过云服务器将状态信息输入至调度决策模型进行调度决策，生成电力系统的调度策略，其中，调度决策模型是通过对初始决策模型和初始生成模型进行对抗学习得到的，初始决策模型用于基于状态样本生成决策结果，初始生成模型用于基于状态样本和决策结果生成故障结果；调度模块用于通过云服务器基于调度策略对电力系统中的机组设备进行调度。

此处需要说明的是，上述获取模块902、生成模块904、调度模块906对应于实施例3的步骤S602至步骤S606，三个模块与对应的步骤所实现的实例和应用场景相同，但不限于上述实施例一所公开的内容。需要说明的是，上述模块或单元可以是存储在存储器（例如，存储器104）中并由一个或多个处理器（例如，处理器102a，102b，……，102n）处理的硬件组件或软件组件，上述模块也可以作为装置的一部分可以运行在实施例一提供的计算机终端10中。

本申请上述实施例中，调度决策模型包括：全连接神经网络，其中，生成模块包括：生成单元、确定单元。

其中，生成单元用于通过云服务器将状态信息输入至全连接神经网络进行调度决策，生成电力系统的初始策略；确定单元用于通过云服务器在初始策略满足电力系统的预设约束条件的情况下，确定初始策略为调度策略。

其中，构建模块用于云服务器基于初始策略构建目标函数，其中，目标函数用于表征初始策略和调度策略之间的投影距离；求解模块用于云服务器基于预设约束条件对目标函数进行求解，得到调度策略。

实施例7

本申请的实施例可以提供一种电子设备，该电子设备可以是电子设备群中的任意一个电子设备。可选地，在本实施例中，上述电子设备也可以替换为移动终端等终端设备。

可选地，在本实施例中，上述电子设备可以位于计算机网络的多个网络设备中的至少一个网络设备。

在本实施例中，上述电子设备可以执行电力系统的调度方法中以下步骤的程序代码：获取电力系统的状态信息；将状态信息输入至调度决策模型进行调度决策，生成电力系统的调度策略，其中，调度决策模型是通过对初始决策模型和初始生成模型进行对抗学习得到的，初始决策模型用于基于状态样本生成决策结果，初始生成模型用于基于状态样本和决策结果生成故障结果；基于调度策略对电力系统中的机组设备进行调度。

可选地，图10是根据本申请实施例的一种计算机终端的结构框图。如图10所示，该计算机终端A可以包括：一个或多个（图中仅示出一个）处理器102、存储器104、存储控制器、以及外设接口，其中，外设接口与射频模块、音频模块和显示器连接。

其中，存储器可用于存储软件程序以及模块，如本申请实施例中的电力系统的调度方法和装置对应的程序指令/模块，处理器通过运行存储在存储器内的软件程序以及模块，从而执行各种功能应用以及数据处理，即实现上述的电力系统的调度方法。存储器可包括高速随机存储器，还可以包括非易失性存储器，如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中，存储器可进一步包括相对于处理器远程设置的存储器，这些远程存储器可以通过网络连接至终端A。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

处理器可以通过传输装置调用存储器存储的信息及应用程序，以执行下述步骤：获取电力系统的状态信息；将状态信息输入至调度决策模型进行调度决策，生成电力系统的调度策略，其中，调度决策模型是通过对初始决策模型和初始生成模型进行对抗学习得到的，初始决策模型用于基于状态样本生成决策结果，初始生成模型用于基于状态样本和决策结果生成故障结果；基于调度策略对电力系统中的机组设备进行调度。

可选的，上述处理器还可以执行如下步骤的程序代码：将状态信息输入至全连接神经网络进行调度决策，生成电力系统的初始策略；在初始策略满足电力系统的预设约束条件的情况下，确定初始策略为调度策略。

可选的，上述处理器还可以执行如下步骤的程序代码：基于初始策略构建目标函数，其中，目标函数用于表征初始策略和调度策略之间的投影距离；基于预设约束条件对目标函数进行求解，得到调度策略。

可选的，上述处理器还可以执行如下步骤的程序代码：在对初始决策模型和初始生成模型进行对抗学习的过程中，初始决策模型的决策模型参数和初始生成模型的生成模型参数是基于总损失函数值进行交替更新的，总损失函数值是基于状态样本、决策结果和故障结果所确定的。

可选的，上述处理器还可以执行如下步骤的程序代码：总损失函数值是对第一损失函数值和第二损失函数值进行求和得到的，第一损失函数值用于表征决策结果对应的安全程度，第二损失函数值用于表征决策结果对应的调度成本。

可选的，上述处理器还可以执行如下步骤的程序代码：第一损失函数值是基于决策结果和电网潮流确定的，电网潮流是基于电力系统模型、状态样本和决策结果得到的，电力系统模型是基于故障结果构建的。

可选的，上述处理器还可以执行如下步骤的程序代码：第二损失函数值是基于机组设备的发电功率确定的，发电功率是基于故障结果对机组设备的初始发电功率进行调整得到的，初始发电功率是基于调度策略和状态样本确定的。

处理器可以通过传输装置调用存储器存储的信息及应用程序，以执行下述步骤：获取电力系统的状态样本；将状态样本输入至初始决策模型进行调度决策，生成电力系统的决策结果；将状态样本和决策结果输入至初始生成模型进行故障生成，生成电力系统的故障结果；基于状态样本、决策结果和故障结果，确定总损失函数值；基于总损失函数值对初始决策模型的决策模型参数和初始生成模型的生成模型参数进行交替更新，得到调度决策模型。

可选的，上述处理器还可以执行如下步骤的程序代码：基于状态样本、决策结果和故障结果，确定第一损失函数值和第二损失函数值，其中，第一损失函数值用于表征决策结果对应的安全程度，第二损失函数值用于表征决策结果对应的调度成本；对第一损失函数值和第二损失函数值进行求和，得到总损失函数值。

可选的，上述处理器还可以执行如下步骤的程序代码：基于故障结果构建电力系统模型；基于电力系统模型、状态样本和决策结果，确定电网潮流；基于决策结果和电网潮流，确定第一损失函数值。

可选的，上述处理器还可以执行如下步骤的程序代码：基于调度策略和状态样本，确定机组设备的初始发电功率；基于故障结果对初始发电功率进行调整，得到机组设备的发电功率；基于发电功率确定第二损失函数值。

处理器可以通过传输装置调用存储器存储的信息及应用程序，以执行下述步骤：云服务器获取电力系统的状态信息；云服务器将状态信息输入至调度决策模型进行调度决策，生成电力系统的调度策略，其中，调度决策模型是通过对初始决策模型和初始生成模型进行对抗学习得到的，初始决策模型用于基于状态样本生成决策结果，初始生成模型用于基于状态样本和决策结果生成故障结果；云服务器基于调度策略对电力系统中的机组设备进行调度。

可选的，上述处理器还可以执行如下步骤的程序代码：云服务器将状态信息输入至全连接神经网络进行调度决策，生成电力系统的初始策略；云服务器在初始策略满足电力系统的预设约束条件的情况下，确定初始策略为调度策略。

可选的，上述处理器还可以执行如下步骤的程序代码：云服务器基于初始策略构建目标函数，其中，目标函数用于表征初始策略和调度策略之间的投影距离；云服务器基于预设约束条件对目标函数进行求解，得到调度策略。

采用本申请实施例，首先，获取电力系统的状态信息，然后将状态信息输入到调度决策模型进行调度决策，生成电力系统的调度策略，其中，调度决策模型是通过对初始决策模型和初始生成模型进行对抗学习得到的，初始决策模型用于基于状态样本生成决策结果，初始生成模型用于基于状态样本和决策结果生成故障结果，最后基于调度策略对电力系统中的机组设备进行调度。容易注意到的是，由于该调度决策模型是通过对初始决策模型和初始生成模型进行对抗学习得到的，因此，通过该调度决策模型得到的调度策略可以考虑到故障的情况，使得通过该调度策略对电力系统中的机组设备进行调度时，在出现故障的情况下也可以安全运行，从而解决相关技术中电力系统的运行安全性较低的技术问题。

本领域普通技术人员可以理解，图10所示的结构仅为示意，计算机终端也可以是智能手机（如Android手机、iOS手机等）、平板电脑、掌上电脑以及移动互联网设备（MobileInternet Devices，MID）、PAD等终端设备。图10其并不对上述电子装置的结构造成限定。例如，计算机终端A还可包括比图10中所示更多或者更少的组件（如网络接口、显示装置等），或者具有与图10所示不同的配置。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成，该程序可以存储于一计算机可读存储介质中，存储介质可以包括：闪存盘、只读存储器（Read-Only Memory，ROM）、随机存取器（RandomAccess Memory，RAM）、磁盘或光盘等。

实施例8

本申请的实施例还提供了一种存储介质。可选地，在本实施例中，上述存储介质可以用于保存上述实施例一所提供的电力系统的调度方法所执行的程序代码。

可选地，在本实施例中，上述存储介质可以位于计算机网络中计算机终端群中的任意一个计算机终端中，或者位于移动终端群中的任意一个移动终端中。

可选地，在本实施例中，存储介质被设置为存储用于执行以下步骤的程序代码：获取电力系统的状态信息；将状态信息输入至调度决策模型进行调度决策，生成电力系统的调度策略，其中，调度决策模型是通过对初始决策模型和初始生成模型进行对抗学习得到的，初始决策模型用于基于状态样本生成决策结果，初始生成模型用于基于状态样本和决策结果生成故障结果；基于调度策略对电力系统中的机组设备进行调度。

可选地，上述存储介质还被设置为存储用于执行以下步骤的程序代码：将状态信息输入至全连接神经网络进行调度决策，生成电力系统的初始策略；在初始策略满足电力系统的预设约束条件的情况下，确定初始策略为调度策略。

可选地，上述存储介质还被设置为存储用于执行以下步骤的程序代码：基于初始策略构建目标函数，其中，目标函数用于表征初始策略和调度策略之间的投影距离；基于预设约束条件对目标函数进行求解，得到调度策略。

可选地，上述存储介质还被设置为存储用于执行以下步骤的程序代码：在对初始决策模型和初始生成模型进行对抗学习的过程中，初始决策模型的决策模型参数和初始生成模型的生成模型参数是基于总损失函数值进行交替更新的，总损失函数值是基于状态样本、决策结果和故障结果所确定的。

可选地，上述存储介质还被设置为存储用于执行以下步骤的程序代码：总损失函数值是对第一损失函数值和第二损失函数值进行求和得到的，第一损失函数值用于表征决策结果对应的安全程度，第二损失函数值用于表征决策结果对应的调度成本。

可选地，上述存储介质还被设置为存储用于执行以下步骤的程序代码：第一损失函数值是基于决策结果和电网潮流确定的，电网潮流是基于电力系统模型、状态样本和决策结果得到的，电力系统模型是基于故障结果构建的。

可选地，上述存储介质还被设置为存储用于执行以下步骤的程序代码：第二损失函数值是基于机组设备的发电功率确定的，发电功率是基于故障结果对机组设备的初始发电功率进行调整得到的，初始发电功率是基于调度策略和状态样本确定的。

可选地，在本实施例中，存储介质被设置为存储用于执行以下步骤的程序代码：获取电力系统的状态样本；将状态样本输入至初始决策模型进行调度决策，生成电力系统的决策结果；将状态样本和决策结果输入至初始生成模型进行故障生成，生成电力系统的故障结果；基于状态样本、决策结果和故障结果，确定总损失函数值；基于总损失函数值对初始决策模型的决策模型参数和初始生成模型的生成模型参数进行交替更新，得到调度决策模型。

可选地，上述存储介质还被设置为存储用于执行以下步骤的程序代码：基于状态样本、决策结果和故障结果，确定第一损失函数值和第二损失函数值，其中，第一损失函数值用于表征决策结果对应的安全程度，第二损失函数值用于表征决策结果对应的调度成本；对第一损失函数值和第二损失函数值进行求和，得到总损失函数值。

可选地，上述存储介质还被设置为存储用于执行以下步骤的程序代码：基于故障结果构建电力系统模型；基于电力系统模型、状态样本和决策结果，确定电网潮流；基于决策结果和电网潮流，确定第一损失函数值。

可选地，上述存储介质还被设置为存储用于执行以下步骤的程序代码：基于调度策略和状态样本，确定机组设备的初始发电功率；基于故障结果对初始发电功率进行调整，得到机组设备的发电功率；基于发电功率确定第二损失函数值。

可选地，在本实施例中，存储介质被设置为存储用于执行以下步骤的程序代码：云服务器获取电力系统的状态信息；云服务器将状态信息输入至调度决策模型进行调度决策，生成电力系统的调度策略，其中，调度决策模型是通过对初始决策模型和初始生成模型进行对抗学习得到的，初始决策模型用于基于状态样本生成决策结果，初始生成模型用于基于状态样本和决策结果生成故障结果；云服务器基于调度策略对电力系统中的机组设备进行调度。

可选地，上述存储介质还被设置为存储用于执行以下步骤的程序代码：云服务器将状态信息输入至全连接神经网络进行调度决策，生成电力系统的初始策略；云服务器在初始策略满足电力系统的预设约束条件的情况下，确定初始策略为调度策略。

可选地，上述存储介质还被设置为存储用于执行以下步骤的程序代码：云服务器基于初始策略构建目标函数，其中，目标函数用于表征初始策略和调度策略之间的投影距离；云服务器基于预设约束条件对目标函数进行求解，得到调度策略。

上述本申请实施例序号仅仅为了描述，不代表实施例的优劣。

在本申请的上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中，应该理解到，所揭露的技术内容，可通过其它的方式实现。其中，以上所描述的装置实施例仅仅是示意性的，例如所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，单元或模块的间接耦合或通信连接，可以是电性或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备（可为个人计算机、服务器或者网络设备等）执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、只读存储器（ROM，Read-Only Memory）、随机存取存储器（RAM，Random Access Memory）、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述仅是本申请的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本申请原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本申请的保护范围。

Claims

1.一种电力系统的调度方法，其特征在于，包括：

获取电力系统的状态信息；

将所述状态信息输入至调度决策模型进行调度决策，生成所述电力系统的调度策略，其中，所述调度决策模型是通过对初始决策模型和初始生成模型进行对抗学习得到的，所述初始决策模型用于基于状态样本生成决策结果，所述初始生成模型用于基于所述状态样本和所述决策结果生成故障结果；

基于所述调度策略对所述电力系统中的机组设备进行调度。

2.根据权利要求1所述的方法，其特征在于，所述调度决策模型包括：全连接神经网络，其中，将所述状态信息输入至调度决策模型进行调度决策，生成所述电力系统的调度策略，包括：

将所述状态信息输入至所述全连接神经网络进行调度决策，生成所述电力系统的初始策略；

在所述初始策略满足所述电力系统的预设约束条件的情况下，确定所述初始策略为所述调度策略。

3.根据权利要求2所述的方法，其特征在于，在所述初始策略不满足所述预设约束条件的情况下，所述方法还包括：

基于所述初始策略构建目标函数，其中，所述目标函数用于表征所述初始策略和所述调度策略之间的投影距离；

基于所述预设约束条件对所述目标函数进行求解，得到所述调度策略。

4.根据权利要求1所述的方法，其特征在于，在对所述初始决策模型和所述初始生成模型进行对抗学习的过程中，所述初始决策模型的决策模型参数和所述初始生成模型的生成模型参数是基于总损失函数值进行交替更新的，所述总损失函数值是基于所述状态样本、所述决策结果和所述故障结果所确定的。

5.根据权利要求4所述的方法，其特征在于，所述总损失函数值是对第一损失函数值和第二损失函数值进行求和得到的，所述第一损失函数值用于表征所述决策结果对应的安全程度，所述第二损失函数值用于表征所述决策结果对应的调度成本。

6.一种调度决策模型的训练方法，其特征在于，包括：

获取电力系统的状态样本；

将所述状态样本输入至初始决策模型进行调度决策，生成所述电力系统的决策结果；

将所述状态样本和所述决策结果输入至初始生成模型进行故障生成，生成所述电力系统的故障结果；

基于所述状态样本、所述决策结果和所述故障结果，确定总损失函数值；

基于所述总损失函数值对所述初始决策模型的决策模型参数和所述初始生成模型的生成模型参数进行交替更新，得到调度决策模型。

7.根据权利要求6所述的方法，其特征在于，基于所述状态样本、所述决策结果和所述故障结果，确定总损失函数值包括：

基于所述状态样本、所述决策结果和所述故障结果，确定第一损失函数值和第二损失函数值，其中，所述第一损失函数值用于表征所述决策结果对应的安全程度，所述第二损失函数值用于表征所述决策结果对应的调度成本；

对所述第一损失函数值和所述第二损失函数值进行求和，得到所述总损失函数值。

8.根据权利要求7所述的方法，其特征在于，基于所述状态样本、所述决策结果和所述故障结果，确定第一损失函数值包括:

基于所述故障结果构建电力系统模型；

基于所述电力系统模型、所述状态样本和所述决策结果，确定电网潮流；

基于所述决策结果和电网潮流，确定所述第一损失函数值。

9.一种电力系统的调度方法，其特征在于，包括：

云服务器获取电力系统的状态信息；

所述云服务器将所述状态信息输入至调度决策模型进行调度决策，生成所述电力系统的调度策略，其中，所述调度决策模型是通过对初始决策模型和初始生成模型进行对抗学习得到的，所述初始决策模型用于基于状态样本生成决策结果，所述初始生成模型用于基于所述状态样本和所述决策结果生成故障结果；

所述云服务器基于所述调度策略对所述电力系统中的机组设备进行调度。

10.根据权利要求9所述的方法，其特征在于，所述调度决策模型包括：全连接神经网络，其中，所述云服务器将所述状态信息输入至调度决策模型进行调度决策，生成所述电力系统的调度策略，包括：

所述云服务器将所述状态信息输入至所述全连接神经网络进行调度决策，生成所述电力系统的初始策略；

所述云服务器在所述初始策略满足所述电力系统的预设约束条件的情况下，确定所述初始策略为所述调度策略。

11.根据权利要求10所述的方法，其特征在于，所述云服务器在所述初始策略不满足所述预设约束条件的情况下，所述方法还包括：

所述云服务器基于所述初始策略构建目标函数，其中，所述目标函数用于表征所述初始策略和所述调度策略之间的投影距离；

所述云服务器基于所述预设约束条件对所述目标函数进行求解，得到所述调度策略。

12.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质包括存储的程序，其中，在所述程序运行时控制所述计算机可读存储介质所在设备执行权利要求1至11中任意一项所述的方法。

13.一种电子设备，其特征在于，包括：

存储器，存储有可执行程序；

处理器，用于运行所述程序，其中，所述程序运行时执行权利要求1至11中任意一项所述的方法。