CN114943448A

CN114943448A - 一种微电网优化调度模型的构建方法和系统

Info

Publication number: CN114943448A
Application number: CN202210565552.1A
Authority: CN
Inventors: 陈卫东; 吴宁; 吴晓锐; 郭敏; 肖静; 姚知洋; 韩帅; 谭志广; 郑毅; 赵金宝
Original assignee: Electric Power Research Institute of Guangxi Power Grid Co Ltd
Current assignee: Electric Power Research Institute of Guangxi Power Grid Co Ltd
Priority date: 2022-05-23
Filing date: 2022-05-23
Publication date: 2022-08-26

Abstract

本发明属于电力领域，尤其涉及微电网优化调度模型的构建方法和系统，包括根据输入输出参数，建立调度的理论运行模型；通过理论运行模型和历史运行数据得到实际运行样本集合；基于监督学习处理实际运行样本集合得到离线运行模型；基于环境反馈的强化学习优化离线运行模型得到微电网优化调度模型。通过理论运行模型，能够结合微电网的具体情况设置输入输出参数以解释调度的过程；基于监督学习处理通过理论运行模型和历史运行数据得到实际运行样本集合,可以根据实际结果修正理论运行模型，提高解释调度过程的能力；基于环境反馈的强化学习优化离线运行模型，能够进一步优化得到微电网优化调度模型来解释微电网调度的过程。

Description

一种微电网优化调度模型的构建方法和系统

技术领域

本发明属于电力领域，尤其涉及一种微电网优化调度模型的构建方法和系统。

背景技术

社会上已经开展了大量的针对微电网的研究工作，如微电网的构架、并网/离网运行模式及其保护、微电网协调控制策略、孤岛控制策略、能量管理与经济调度、微电网运行标准的研究以及智能微电网工程建设与运营模式等等相关研究，且具有广泛的工程实践经验。微电网的有功优化调度问题本质上是一种非线性、多约束、多目标的复杂系统优化问题。

长久以来电网调度机构都是通过“离线计算、在线匹配”的模式来解决传统电力系统绝大部分的运行问题，现有的微电网能量管理控制策略实质上也是基于工程人员经验和认知。随着微电网的发展，强间歇性可再生能源高比例接入、高渗透率电力电子装备、多能源耦合、能源市场交易多参与主体博弈行为、多时间尺度动态互相影响等因素将深刻改变甚至颠覆传统的系统运行控制模式。以现有的微电网调度运行方法以及工程实践经验，并不足以面对微电网发展带来的挑战。

发明内容

为了解决或者改善上述问题，本发明提供了一种微电网优化调度模型的构建方法和系统，具体技术方案如下：

本发明提供一种微电网优化调度模型的构建方法，包括：根据微电网相关的输入输出参数，建立调度的理论运行模型；通过所述理论运行模型和历史运行数据得到实际运行样本集合；基于监督学习处理所述实际运行样本集合得到离线运行模型；基于环境反馈的强化学习优化所述离线运行模型得到所述微电网优化调度模型。

优选的，所述根据微电网相关的输入输出参数，建立调度的理论运行模型包括：以所述输入输出参数作为所述理论运行模型的输入输出参数；以发电机组约束参数、负荷约束参数、存储约束参数和系统约束参数作为所述理论运行模型的约束条件；以经济调度参数、环境影响参数和安全运行风险参数作为所述理论运行模型的目标函数。

优选的，所述实际运行样本集合包括不同输入输出参数之间的组合的运行样本；对应的，所述基于监督学习处理所述实际运行样本集合得到离线运行模型包括：基于马尔可夫决策过程描述所述理论运行模型，基于监督学习建立关于所述组合的运行样本的所述离线运行模型。

优选的，所述基于环境反馈的强化学习优化所述离线运行模型得到所述微电网优化调度模型包括：结合所述微电网的实时运行数据和所述离线运行模型，形成决策模型；采集并解析所述实时运行数据，得到当前运行状态信息、上一时刻状态信息和对应的策略回报值，以形成经验样本；通过所述经验样本训练所述决策模型以更新对应参数。

优选的，所述通过所述经验样本训练所述决策模型以更新对应参数包括：根据当前未更新的目标网络参数计算动作预估值以及相应的目标评价值，得到评价网络训练的损失函数L，更新主评价网络的参数；更新主策略网络的参数、目标网络的策略网络和评价网络的参数。

本发明提供一种微电网优化调度模型的构建系统，包括：第一单元，用于根据微电网相关的输入输出参数，建立调度的理论运行模型；第二单元，用于通过所述理论运行模型和历史运行数据得到实际运行样本集合；第三单元，用于基于监督学习处理所述实际运行样本集合得到离线运行模型；第四单元，用于基于环境反馈的强化学习优化所述离线运行模型得到所述微电网优化调度模型。

本发明的有益效果为：根据微电网相关的输入输出参数，建立调度的理论运行模型，能够结合微电网的具体情况设置合适的输入输出参数以建立理论运行模型来解释调度的过程；通过理论运行模型和历史运行数据得到实际运行样本集合，基于监督学习处理实际运行样本集合得到离线运行模型,可以根据实际结果修正理论运行模型，提高解释调度过程的能力；基于环境反馈的强化学习优化离线运行模型，能够进一步优化得到微电网优化调度模型来解释微电网调度的过程。

附图说明

图1是根据本发明的微电网优化调度模型的构建方法的示意图；

图2是根据本发明的微电网优化调度模型的构建系统的示意图。

主要附图标记说明：

1-第一单元，2-第二单元，3-第三单元，4-第四单元。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

应当理解，当在本说明书和所附权利要求书中使用时，术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在，但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。

还应当理解，在本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样，除非上下文清楚地指明其它情况，否则单数形式的“一”、“一个”及“该”意在包括复数形式。

还应当进一步理解，在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合，并且包括这些组合。

为了解决或者改善电力系统的网络安全问题，提出如图1所示的本发明提供一种微电网优化调度模型的构建方法，包括：S1、根据微电网相关的输入输出参数，建立调度的理论运行模型；S2、通过所述理论运行模型和历史运行数据得到实际运行样本集合；S3、基于监督学习处理所述实际运行样本集合得到离线运行模型；S4、基于环境反馈的强化学习优化所述离线运行模型得到所述微电网优化调度模型。

微电网由于电网结构和接入负载的不同，微电网在运行过程中，产生的主要输入和输出参数的类型和各自的重要性也不一样。以微电网相关的输入/输出参数，作为合适的数学模型的输入/输出参数，上建立理论运行模型，用于解释微电网的有功优化调度的原理/过程/结构。

历史运行数据为采集微电网过往的运行数据得到的数据。结合历史运行数据和理论运行模型，可以得到在理论运行模型处理下的实际运行样本集合。其原理在于，通过处理算法/数学模型，将采集到的大量按照一定规则进行处理，以验证数据是否符合一定的规律或者从数据中得到一些结论。在本方案中，通过理论运行模型处理历史运行数据，得到的有关于微电网在运行过程中产生的说明数据关联性的数据样本的集合，即实际运行样本集合。

监督学习是指利用一组已知类别的样本调整分类器的参数，使其达到所要求性能的过程，也称为监督训练。其中，样本的类型已经由实际运行样本集合得到。通过监督学习处理实际运行样本集合得到离线运行模型，能够提高解释调度的能力。

环境反馈的强化学习主要是通过微电网的实时反馈来优化离线运行模型以强化解释调度的能力。

所述根据微电网相关的输入输出参数，建立调度的理论运行模型包括：以所述输入输出参数作为所述理论运行模型的输入输出参数；以发电机组约束参数、负荷约束参数、存储约束参数和系统约束参数作为所述理论运行模型的约束条件；以经济调度参数、环境影响参数和安全运行风险参数作为所述理论运行模型的目标函数。

所述实际运行样本集合包括不同输入输出参数之间的组合的运行样本；对应的，所述基于监督学习处理所述实际运行样本集合得到离线运行模型包括：基于马尔可夫决策过程描述所述理论运行模型，基于监督学习建立关于所述组合的运行样本的所述离线运行模型。

所述基于环境反馈的强化学习优化所述离线运行模型得到所述微电网优化调度模型包括：结合所述微电网的实时运行数据和所述离线运行模型，形成决策模型；采集并解析所述实时运行数据，得到当前运行状态信息、上一时刻状态信息和对应的策略回报值，以形成经验样本；通过所述经验样本训练所述决策模型以更新对应参数。

所述通过所述经验样本训练所述决策模型以更新对应参数包括：根据当前未更新的目标网络参数计算动作预估值以及相应的目标评价值，得到评价网络训练的损失函数L，更新主评价网络的参数；更新主策略网络的参数、目标网络的策略网络和评价网络的参数。

本发明提供如图2所示一种微电网优化调度模型的构建系统，包括：第一单元1，用于根据微电网相关的输入输出参数，建立调度的理论运行模型；第二单元2，用于通过所述理论运行模型和历史运行数据得到实际运行样本集合；第三单元3，用于基于监督学习处理所述实际运行样本集合得到离线运行模型；第四单元4，用于基于环境反馈的强化学习优化所述离线运行模型得到所述微电网优化调度模型。

系统运行的流程包括：

步骤1：构建微电网调度预制数学模型(同理论运行模型)

确定微电网通用的输入输出向量，输入向量通常包含柴油机组、燃气机组、燃料电池机组、小水电机组、风电机组、光伏机组、可调节负荷、可中断负荷、储能机组、以及环境及系统相关向量，X_i为柴油机组的输入向量，参数包含柴油机组的数量、燃料成本参数、启动成本、停机成本、上一时段柴油机组的出力、最短启动时间、最短停机时间、初始运行时间、初始停运时间、初始运行状态；X_j为微型燃气轮机机组的输入向量，参数包含微型燃气轮机机组的数量、工作效率、天然气的价格、低热值；X_k为燃料电池机组的输入向量，参数包含燃料电池机组的数量、工作效率；X_s为小水电机组的输入向量，参数包含小水电机组的数量、维护成本、单位运行成本、单位电价补偿、经济发电功率；X_w为风电机组的输入向量，参数包含风电机组的数量、单位弃风补偿电价；X_v为光伏机组的输入向量，参数包含风电机组的数量、单位弃风补偿电价；X_f为可调节负荷的输入向量，参数包含可调节负荷的数量、单位损失成本；X_h为可中断负荷的输入向量，参数包含可中断负荷的数量、单位损失成本；X_m为储能设备的输入向量，参数包含储能的数量、充电效率、放电效率、充放电成本、最大容量、最大最小荷电状态；X_n为与环境影响相关的输入向量，参数包括污染物的种类、治理污染物的费用和排污系数；X_p为与系统相关的输入向量，参数包括大电网的购售电价、微网与大电网联络线交换功率的上下限、目标函数的权重向量、固定联络线功率控制二进制参数、固定联络线功率数值。

输出向量中的参数包括各柴油机组、微型燃气轮机机组、燃料电池机组、小水电机组等可控机组的出力，以及风电机组弃风功率、光伏机组弃光功率、储能设备的充放电功率、微电网与大电网的交换功率。

之后考虑经济调度、环境影响、安全运行风险系数三个目标，确定目标函数：minF＝ω₁·F₁+ω₂·F₂+ω₃·F₃。其中，F为总目标函数，ω₁、ω₂、ω₃为权重，F₁、F₂、F₃为三个目标函数。其中微电网有功经济优化调度目标函数考虑柴油机组的运行成本、启动成本和停机成本，燃气轮机机组的运行成本，燃料电池机组的运行成本，小水电机组的运行成本，风电机组的弃电成本，光伏机组的弃电成本，可调节负荷和可削减负荷的成本，储能元件的退化成本，微电网系统与大电网之间的购售电成本等，给出以经济调度为目标的函数表达式。环境成本主要考虑碳排放以及其它污染气体及颗粒物排放对环境的影响，主要考虑微电网中的可控分布式发电机组污染物的排放，可再生能源和能源储存造成的污染物排放认为是零，需要使微电网对于排污花费的费用越小越好。光伏和风电属于清洁能源，但是作为微电源，它具有不可控性，很容易受气候影响。但是微电网系统中含有这两种电源，所以会影响整个系统的稳定性，而储能系统的备用容量可以增加系统的稳定性，微电网系统运行风险系数越小越好。

最后，确定约束条件，包括可控分布式发电机组约束(可控分布式发电机组的爬坡约束、可控分布式发电机组的出力约束、柴油机组的机组状态指示变量约束、最小启停时间约束等)、可再生能源机组约束(风电机组和光伏发电机组的运行约束等)、负荷元件约束(可调节负荷和可中断负荷的上下限约束等)、储能元件约束(储能元件充放电状态约束、储能元件充放电功率的上下限约束、储能元件的容量约束等)、以及系统约束(微电网系统与外部电网联络线功率约束、功率平衡约束等)，形成微电网的通用有功优化调度预制模型，为之后基于监督学习的有功调度离线训练提供监督模型。

步骤2：基于监督学习的微电网有功调度离线训练

微电网有功优化调度预制数学模型为特定微电网提供了一系列的输入、输出数据集，通过输入微电网真实机组的运行数据，生成相应时刻的机组组合状态与可控分布式发电系统的出力、微电网与电网交互的电量、储能电池的充电功率和放电功率、风电机组和光伏的实际出力、可调节负荷的负荷调节量和可中断负荷的负荷削减量，为微电网有功调度离线训练提供大量的监督学习模型样本(即实际运行样本集合)。

在监督学习模型离线训练样本库构建的基础上，构建离线训练模型，具体地，先将微电网实时有功优化调度描述为离散时间步长的马尔可夫决策过程，包括环境、智能体、状态、动作、状态转移、奖励、动作价值函数的具体表达，接着基于所建立的微电网有功调度人工智能模型离线训练样本库得到监督学习模型，构造XGBoost、GBDT、随机森林等基于监督学习的人工智能模型。

最终实现输入当前微电网实时运行数据后，实时生成微电网有功优化调度的动作决策信息。(即结合所述微电网的实时运行数据和所述离线运行模型，形成决策模型)

步骤3：基于环境反馈强化学习的微电网有功实时在线决策

基于DDPG等强化算法的微电网有功优化调度的学习流程：具体地，后台数据处理收集当前微电网运行状态信息，以及上一时刻回报值和状态信息，形成样本单元存入数据池中。从样本存储数据池中重采样D个样本单元(s_t,a_t,r_t,s_t+1),(t＝1,2,L,D)存入经验池用于训练，即经验样本回放，以此来打破数据之间地关联性。

优化过程中，首先，根据当前未更新的目标网络参数计算动作预估值以及相应的目标评价值，得到评价网络训练的损失函数L，更新主评价网络的参数。然后，更新主策略网络的参数、目标网络的策略网络和评价网络的参数。通过训练深度神经网络，更新主网络和目标网络的参数。当前网络的参数是随着训练而不断更新的，目标网络不进行训练，它的参数是一段时间前的当前网络的参数。根据更新后的目标网络得到当前动作值，并输出到主动配电网中潮流控制模块和各个微电网控制模块。采集t+1时刻微电网的状态信息s_t+1作为新的样本，并进行下一个时刻的学习和计算。DDPG优化过程运用深度卷积神经网络处理微电网运行数据，具有强大的自主寻优能力。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元，能够以电子硬件、计算机软件或者二者的结合来实现，为了清楚地说明硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各示例的组成。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

在本申请所提供的实施例中，应该理解到，单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元可结合为一个单元，一个单元可拆分为多个单元，或一些特征可以忽略等。

最后应说明的是：以上各实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述各实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的范围，其均应涵盖在本发明的权利要求和说明书的范围当中。

Claims

1.一种微电网优化调度模型的构建方法，其特征在于，包括：

根据微电网相关的输入输出参数，建立调度的理论运行模型；

通过所述理论运行模型和历史运行数据得到实际运行样本集合；

基于监督学习处理所述实际运行样本集合得到离线运行模型；

基于环境反馈的强化学习优化所述离线运行模型得到所述微电网优化调度模型。

2.根据权利要求1所述微电网优化调度模型的构建方法，其特征在于，所述根据微电网相关的输入输出参数，建立调度的理论运行模型包括：

以所述输入输出参数作为所述理论运行模型的输入输出参数；

以发电机组约束参数、负荷约束参数、存储约束参数和系统约束参数作为所述理论运行模型的约束条件；

以经济调度参数、环境影响参数和安全运行风险参数作为所述理论运行模型的目标函数。

3.根据权利要求2所述微电网优化调度模型的构建方法，其特征在于，所述实际运行样本集合包括不同输入输出参数之间的组合的运行样本；

对应的，所述基于监督学习处理所述实际运行样本集合得到离线运行模型包括：

基于马尔可夫决策过程描述所述理论运行模型，基于监督学习建立关于所述组合的运行样本的所述离线运行模型。

4.根据权利要求3所述微电网优化调度模型的构建方法，其特征在于，所述基于环境反馈的强化学习优化所述离线运行模型得到所述微电网优化调度模型包括：

结合所述微电网的实时运行数据和所述离线运行模型，形成决策模型；

采集并解析所述实时运行数据，得到当前运行状态信息、上一时刻状态信息和对应的策略回报值，以形成经验样本；

通过所述经验样本训练所述决策模型以更新对应参数。

5.根据权利要求4所述微电网优化调度模型的构建方法，其特征在于，所述通过所述经验样本训练所述决策模型以更新对应参数包括：

根据当前未更新的目标网络参数计算动作预估值以及相应的目标评价值，得到评价网络训练的损失函数L，更新主评价网络的参数；

更新主策略网络的参数、目标网络的策略网络和评价网络的参数。

6.一种微电网优化调度模型的构建系统，其特征在于，包括：

第一单元，用于根据微电网相关的输入输出参数，建立调度的理论运行模型；

第二单元，用于通过所述理论运行模型和历史运行数据得到实际运行样本集合；

第三单元，用于基于监督学习处理所述实际运行样本集合得到离线运行模型；

第四单元，用于基于环境反馈的强化学习优化所述离线运行模型得到所述微电网优化调度模型。

7.根据权利要求6所述微电网优化调度模型的构建系统，其特征在于，所述根据微电网相关的输入输出参数，建立调度的理论运行模型包括：

8.根据权利要求7所述微电网优化调度模型的构建系统，其特征在于，所述实际运行样本集合包括不同输入输出参数之间的组合的运行样本；

9.根据权利要求8所述微电网优化调度模型的构建系统，其特征在于，所述基于环境反馈的强化学习优化所述离线运行模型得到所述微电网优化调度模型包括：

通过所述经验样本训练所述决策模型以更新对应参数。

10.根据权利要求9所述微电网优化调度模型的构建系统，其特征在于，所述通过所述经验样本训练所述决策模型以更新对应参数包括：