CN113555870B

CN113555870B - 一种基于Q-learning光伏预测的配电网多时间尺度优化调度方法

Info

Publication number: CN113555870B
Application number: CN202110845507.7A
Authority: CN
Inventors: 钱仲豪; 茅雷; 周亮; 袁松; 李云鹏; 陆凌; 徐晓轶
Original assignee: Nantong Power Supply Co Of State Grid Jiangsu Electric Power Co
Current assignee: Nantong Power Supply Co Of State Grid Jiangsu Electric Power Co
Priority date: 2021-07-26
Filing date: 2021-07-26
Publication date: 2023-10-13
Anticipated expiration: 2041-07-26
Also published as: CN113555870A

Abstract

本发明提供了一种基于Q‑learning光伏预测的配电网多时间尺度优化调度方法，包括以下步骤：(1)：基于光伏出力的历史数据，利用K‑means的聚类算法对所述光伏出力进行聚类；(2)：根据光伏出力聚类结果分为不同的场景，利用Q‑learning光伏预测方法分别对不同场景下光伏出力进行预测，有效的提高光伏出力的预测精度；(3)：基于光伏预测数据，建立配电网多时间尺度优化调度模型，主要分为日前优化，日内滚动优化以及实施反馈优化，通过缩小时间尺度进一步提高预测精度。本发明提供一种基于Q‑learning光伏预测的配电网多时间尺度优化调度方法，能够有效应对光伏出力的不确定性，实现配电网高效优化调度。

Description

一种基于Q-learning光伏预测的配电网多时间尺度优化调度方法

技术领域

本发明属于配电网运行与规划技术领域，特别涉及一种基于Q-learning光伏预测的配电网多时间尺度优化调度方法。

背景技术

近年来，多时间尺度优化调度越来越多的应用到配电网的优化调度中。过往学者为了改善配电系统内风电、光伏出力随机性和负荷波动导致的电压稳定性问题，建立了基于模型预测控制的配电网多时间尺度无功优化模型，包含日前优化调节层和实时滚动调控层。提出了一种主动配电网多时间尺度优化调度方法，该方法在研究电量电价弹性对电动汽车充电影响机理的基础上，基于不同时间尺度可再生能源预测数据，决策电动汽车、储能和柔性负荷的调用。分析配电网内可调资源有功无功协调特性，提出基于模型预测控制的主动配电网多时间尺度有功无功协调调度方法。

上述方法虽然通过缩小时间尺度可以有效的提升了配电网在应对可再生能源能源不确定性方面的能力，但是上述方法均未对光伏出力的预测方法进行研究。光伏出力的准确预测有助于电网调度部门实时地调整调度策略，故在配电网的优化调度中，光伏出力的预测方法是一个重要研究热点。目前，国内外的许多学者已经针对配电网分布式优化调度进行深入研究。过往学者采用隐马尔可夫链模型，分析历史数据并基于求得的状态转换矩阵，对光伏短期出力进行直接预测；也有学者首先利用相空间重构对光伏出力时序混沌特性进行论证与分析，再在点空间向量的基础上使用RBF神经网络进行可再生能源出力超短期预测，上述关于光伏预测的研究都很少提及考虑天气因素，光伏出力受天气影响较大，为了更加准确的预测，考虑天气因素是十分必要的。如今微电网发展迅速，远离大陆的海岛通常使用微网的方式运行。而由于地处偏远地区，气象局很难实时准确地掌握当地的天气信息。

本发明涉及一种基于Q-learning光伏预测的配电网多时间尺度优化调度方法，建立的基于Q-learning光伏预测方法的配电网多时间尺度优化模型，能够有效应对光伏出力的不确定性，实现配电网高效优化调度。同时所提模型中采用多时间尺度的优化调度方法，使得所提调度方法更有实际意义。本发明主要工作及创新点如下：1)提出一种结合K-means聚类和Q-learning算法的光伏预测方法；2)提出基于Q-learning光伏预测方法的配电网多时间尺度优化模型。

发明内容

本发明提供一种基于Q-learning光伏预测的配电网多时间尺度优化调度方法，能够有效应对光伏出力的不确定性，实现配电网高效优化调度。

本发明具体为一种基于Q-learning光伏预测的配电网多时间尺度优化调度方法，所述配电网多时间尺度优化调度方法包括以下步骤：

步骤(1)：基于光伏出力的历史数据，利用K-means的聚类算法对所述光伏出力进行聚类；

步骤(2)：根据所述光伏出力聚类结果分为不同的场景，利用Q-learning光伏预测方法分别对不同场景下所述光伏出力进行预测，有效的提高光伏出力的预测精度；

步骤(3)：基于光伏预测数据，建立所述配电网多时间尺度优化调度模型，主要分为日前优化，日内滚动优化以及实时反馈优化，通过缩小时间尺度进一步提高预测精度。

步骤(1)中，将历史时段进行信息离散化，将所述历史时段每天分为n个时间区间，并将相应预测负荷以相同时间尺度离散化，为建立一个含多时段的，动态的多尺度优化模型做准备；紧接着将历史光伏出力信息基于K-means聚类，以实时辐射度变化衰减程度、出力时间以及实际出力为聚类特征，依据实际光伏的历史数据，对24小时每个采样间隔分别进行光伏出力的聚类分析；最终将所述历史数据的各采样间隔数据划分为晴天(k＝1)、阴天(k＝2)、雨天(k＝3)，其中k为天气场景编号。

步骤(2)中，在对所述历史数据进行天气场景聚类划分之后，参照光伏实时天气状况，采用Q-learning算法对天气场景的历史数据进行强化学习：首先，将光伏的出力离散化，将光伏出力分为若干个离散的状态区间；其次，设置若干个奖励矩阵R，其中n为步长，/>表示t时刻对t+n时刻的延时奖励值，/>为所述光伏出力总的状态区间数；

对于训练集中每种状态的转换，都在R中相应位置累加入延时奖励值，不存在的状态转换置负数。

利用智能体(Agent)进行无监督学习，设置与R相似的状态变换矩阵Q；所述矩阵Q被初始化为0，在智能体对训练集的不断学习中，所述矩阵Q在反复的经历中不断累加奖励，所述矩阵Q的行代表所述智能体当前的状态，列代表到达下一个状态的可能的动作；Q-learning能够由一组时间序列的状态来得出未来各状态的收益，对于经验累加至状态转换矩阵Q的方法，对Bellman方程进行适当修改，从而考虑之前状态对未来状态的影响：Q(s',s)＝Q(s',s)+γ[-Q(s',s)+R(s”,s)+γ²[R(s”',s)+γ³[R(s””,s)+......]]]，其中，s′代表s之前的状态，s″代表s′之前的状态，以此类推；γ是时间相关因素；所述智能体对历史数据的掌握可以由所述矩阵Q全部表征，其中包括每一种状态到另一种状态累计奖励；

步骤(3)中，所建立的所述配电网多时间尺度优化调度优化目标如下：

(1)所述日前优化

所述配电网日前优化模型是在保证电网安全性前提下，日运行成本最小为目标函数，具体如下所示：

其中，F^DA为日前优化总运行成本，为日前阶段上级电网的购电成本，/>为光伏发电成本、/>为微型燃气轮机发电成本、/>为可控负荷的发电成本、/>为储能装置的发电成本、/>为有载调压器的操作成本、/>为投切电容器的操作成本；

其中，/>为所述配电网所连接的所述微型燃气轮机的集合，N_t为调度周期(24h)，c₁、c₂、c₃分别为所述微型燃气轮机的成本系数，P_DG,i,t为t时刻i节点所连接的所述微型燃气轮机的有功出力，Δt为时间间隔(1h)；

其中，/>为所述配电网所连接的所述可控负荷的集合，r_IL为所述可控负荷的成本系数，P_IL,i,t为t时刻i节点所连接的所述可控负荷的有功出力；

其中，/>为所述配电网所连接的所述储能装置的集合，r_ESS为所述储能装置的成本系数，/>为t时刻i节点所连接的所述储能装置的充放电功率；

其中，/>为所述配电网所连接的所述有载调压器的集合，r_OLTC为所述有载调压器的成本系数，ΔU_OLTC,i,T为t时刻i节点所连接的所述有载调压器的档位变化；

其中，/>为所述配电网所连接的所述投切电容器的集合，r_CB为所述投切电容器的成本系数，ΔU_CB,i,T为t时刻i节点所连接的所述投切电容器的档位变化；

(2)所述日内滚动优化

所述配电网日内滚动优化模型是在日前优化确定慢动作设备运行状态的基础上，以未来MΔT(4h)运行成本最小为目标函数，具体如下所示：

其中，F^DI为日内滚动优化的运行成本，/>为日内滚动阶段所述上级电网的购电成本，/>为日内滚动阶段所述微型燃气轮机的发电成本，/>为日内滚动阶段所述储能装置的发电成本；其具体计算公式和日前阶段类似；

(3)所述实时反馈优化

实时反馈校正是在日内滚动确定各可调可控设备的出力基础上，以所述可调可控设备的出力调整为目标函数，具体如下所示：

其中，为实时反馈阶段所述配电网中可调可控变量的集合，具体包括所述光伏有功无功出力P_PV和Q_PV，所述微型燃气轮机的有功无功出力P_DG和Q_DG，无功补偿装置的无功出力Q_SVC以及所述储能装置的充放电功率/>和/>u^FK ^,real、Δu^FK、u^DI分别为实际的可控变量的出力值，所述可控变量的出力调整量以及日内滚动阶段所求的可控量的出力值；

建立的所述配电网多时间尺度优化调度约束如下：

(1)系统安全约束

其中V_i,t为t时刻i节点电压值，V_ij,t为t时刻ij支路的电流值，V_i ^min、V_i ^max分别为i节点电压的上下限，/>为ij支路的电流值的上限；

(2)可调可控资源约束

所述可调可控资源主要包括所述光伏、可中断负荷、所述无功补偿装置、分组投切电容器组、所述微型燃气轮机、所述有载调压器以及所述储能装置，具体约束如下所示：

所述光伏约束：P_PV,i,t≤P_PV,i,t,pre,Q_PV,i,t≤Q_PV,i,t,pre，

所述可中断负荷约束：

所述无功补偿装置SVC约束：

所述分组投切电容器组约束：

所述微型燃气轮机约束：

所述有载调压器约束：

所述储能装置约束：

其中，P_PV,i,t为t时刻i节点所连接的所述光伏的有功出力；Q_PV,i,t、Q_SVC,i,t、Q_CB,i,t和Q_DG,i,t分别为t时刻i节点所连接的所述光伏、所述无功补偿装置、所述投切电容器组以及所述微型燃气轮机的无功出力；P_PV,i,t,pre、Q_PV,i,t,pre分别为所述光伏有功无功出力预测值；为i节点所连接的所述可中断负荷的最大值；/>分别为所述无功补偿装置无功出力上下限；Q_CB,step,i,t为每组所述电容器的无功功率；σ_CB,i,t为t时刻i节点所连接的所述电容器投入组数；N_CB,i、K_CB,i分别为所述电容器组的最大投切次数以及每次投切的最大组数；/> 分别为i节点所连接的所述微型燃气轮机有功无功出力最大值；/>分别为i节点所连接的所述微型燃气轮机爬坡功率的上下限；M_ij,t为t时刻ij支路所连接所述有载调压器的档位；/>为ij支路OLTC档位的上下限；k_ij0和Δk_ij为ij支路OLTC初始档位以及相邻两个档位差值；E_bat,i,t为t时刻i节点所连接的所述储能装置电量；/>为所述储能装置电量最大值；P_i ^ch,max、P_i ^dis,max分别为i节点所连接的所述储能装置充放电功率最大值；η_ch、η_dis为充放电效率；

(3)Disflow潮流约束

其中，P_ij,t、Q_ij,t、I_ij,t分别为t时刻ij支路的有功功率、无功功率以及电流值；V_j,t为t时刻j节点的电压值；分别为i节点j节点的有功无功负荷；r_ij、x_ij分别为支路ij的电阻电抗。

与现有技术相比，有益效果是：所述配电网多时间尺度优化调度方法建立的基于Q-learning光伏预测方法的配电网多时间尺度优化模型，能够有效应对光伏出力的不确定性，实现配电网高效优化调度。同时所提模型中采用多时间尺度的优化调度方法，使得所提调度方法更有实际意义。

附图说明

图1为本发明一种基于Q-learning光伏预测的配电网多时间尺度优化调度方法的工作流程图；

图2为光伏出力预测流程图。

具体实施方式

下面结合附图对本发明一种基于Q-learning光伏预测的配电网多时间尺度优化调度方法的具体实施方式做详细阐述。

如图1所示，配电网多时间尺度优化调度方法包括以下步骤：

利用智能体(Agent)进行无监督学习，设置与R相似的状态变换矩阵Q；所述矩阵Q被初始化为0，在智能体对训练集的不断学习中，所述矩阵Q在反复的经历中不断累加奖励，所述矩阵Q的行代表所述智能体当前的状态，列代表到达下一个状态的可能的动作；Q-learning能够由一组时间序列的状态来得出未来各状态的收益，对于经验累加至状态转换矩阵Q的方法，对Bellman方程进行适当修改，从而考虑之前状态对未来状态的影响：Q(s',s)＝Q(s',s)+γ[-Q(s',s)+R(s”,s)+γ²[R(s”',s)+γ³[R(s””,s)+......]]]，其中，s′代表s之前的状态，s″代表s′之前的状态，以此类推；γ是时间相关因素；所述智能体对历史数据的掌握可以由所述矩阵Q全部表征，其中包括每一种状态到另一种状态累计奖励；故在对训练集中的所有数据训练分析后，将主动配电网优化调度分析之前各可再生能源出力，时间，天气作为初始状态，依据训练得出的矩阵Q选择奖励值高的行为，可以对光伏的出力进行短时间多时间尺度的预测。如图2所示，为光伏出力预测流程图。

基于某光伏公司#1～#200逆变器三年半出力实际数据，使用K-means聚类进行光伏出力的聚类分析，依据实际天气情况将历史数据划分为三类场景：晴天，阴天，雨天。以1h为时间间隔进行聚类。

(1)所述日前优化

(2)所述日内滚动优化

(3)所述实时反馈优化

建立的所述配电网多时间尺度优化调度约束如下：

(1)系统安全约束

(2)可调可控资源约束

所述光伏约束：P_PV,i,t≤P_PV,i,t,pre,Q_PV,i,t≤Q_PV,i,t,pre，

所述可中断负荷约束：

所述无功补偿装置SVC约束：

所述分组投切电容器组约束：

所述微型燃气轮机约束：

所述有载调压器约束：

所述储能装置约束：

(3)Disflow潮流约束

最后应该说明的是，结合上述实施例仅说明本发明的技术方案而非对其限制。所属领域的普通技术人员应当理解到，本领域技术人员可以对本发明的具体实施方式进行修改或者等同替换，但这些修改或变更均在申请待批的权利要求保护范围之中。

Claims

1.一种基于Q-learning光伏预测的配电网多时间尺度优化调度方法，其特征在于，所述配电网多时间尺度优化调度方法包括以下步骤：

步骤1：基于光伏出力的历史数据，利用K-means的聚类算法对所述光伏出力进行聚类：将历史时段进行信息离散化，将所述历史时段每天分为n个时间区间，并将相应预测负荷以相同时间尺度离散化，为建立一个含多时段的、动态的多尺度优化模型做准备；紧接着将历史光伏出力信息基于K-means聚类，以实时辐射度变化衰减程度、出力时间以及实际出力为聚类特征，依据实际光伏的历史数据，对24小时每个采样间隔分别进行光伏出力的聚类分析；最终将所述历史数据的各采样间隔数据划分为晴天k＝1、阴天k＝2、雨天k＝3，其中k为天气场景编号；

步骤2：根据所述光伏出力聚类结果分为不同的场景，利用Q-learning光伏预测方法分别对不同场景下所述光伏出力进行预测，提高光伏出力的预测精度：

在对所述历史数据进行天气场景聚类划分之后，参照光伏实时天气状况，采用Q-learning算法对天气场景的历史数据进行强化学习：首先，将光伏的出力离散化，将光伏出力分为若干个离散的状态区间；其次，设置若干个奖励矩阵R，

其中n为步长，/>表示t时刻对t+n时刻的延时奖励值，/>为所述光伏出力总的状态区间数；

利用智能体Agent进行无监督学习，设置与R相似的状态变换矩阵Q；所述矩阵Q被初始化为0，在智能体对训练集的不断学习中，所述矩阵Q在反复的经历中不断累加奖励，所述矩阵Q的行代表所述智能体当前的状态，列代表到达下一个状态的可能的动作；Q-learning能够由一组时间序列的状态来得出未来各状态的收益，对于经验累加至状态转换矩阵Q的方法，对Bellman方程进行适当修改，从而考虑之前状态对未来状态的影响：Q(s',s)＝Q(s',s)+γ[-Q(s',s)+R(s”,s)+γ²[R(s”',s)+γ³[R(s””,s)+......]]]，其中，s′代表s之前的状态，s″代表s′之前的状态；γ是时间相关因素；所述智能体对历史数据的掌握可以由所述矩阵Q全部表征，其中包括每一种状态到另一种状态累计奖励；

步骤3：基于光伏预测数据，建立配电网多时间尺度优化调度模型，分为日前优化、日内滚动优化以及实时反馈优化，通过缩小时间尺度进一步提高预测精度。

2.根据权利要求1所述的一种基于Q-learning光伏预测的配电网多时间尺度优化调度方法，其特征在于，步骤3中，建立的所述配电网多时间尺度优化调度优化目标如下：

(1)所述日前优化

其中，/>为所述配电网所连接的所述微型燃气轮机的集合，N_t为调度周期，c₁、c₂、c₃分别为所述微型燃气轮机的成本系数，P_DG,i,t为t时刻i节点所连接的所述微型燃气轮机的有功出力，Δt为时间间隔；

(2)所述日内滚动优化

所述配电网日内滚动优化模型是在日前优化确定慢动作设备运行状态的基础上，以未来MΔT运行成本最小为目标函数，具体如下所示：

其中，F^DI为日内滚动优化的运行成本，/>为日内滚动阶段所述上级电网的购电成本，/>为日内滚动阶段所述微型燃气轮机的发电成本，/>为日内滚动阶段所述储能装置的发电成本；

(3)所述实时反馈优化

其中，为实时反馈阶段所述配电网中可调可控变量的集合，具体包括所述光伏有功无功出力P_PV和Q_PV，所述微型燃气轮机的有功无功出力P_DG和Q_DG，无功补偿装置的无功出力Q_SVC以及所述储能装置的充放电功率/>和/>u^FK,real、Δu^FK、u^DI分别为实际的可控变量的出力值，所述可控变量的出力调整量以及日内滚动阶段所求的可控量的出力值；

建立的所述配电网多时间尺度优化调度约束如下：

(1)系统安全约束

(2)可调可控资源约束

所述光伏约束：P_PV,i,t≤P_PV,i,t,pre,Q_PV,i,t≤Q_PV,i,t,pre，

所述可中断负荷约束：

所述无功补偿装置SVC约束：

所述分组投切电容器组约束：

所述微型燃气轮机约束：

所述有载调压器约束：

所述储能装置约束：

其中，P_PV,i,t为t时刻i节点所连接的所述光伏的有功出力；Q_PV,i,t、Q_SVC,i,t、Q_CB,i,t和Q_DG,i,t分别为t时刻i节点所连接的所述光伏、所述无功补偿装置、所述投切电容器组以及所述微型燃气轮机的无功出力；P_PV,i,t,pre、Q_PV,i,t,pre分别为所述光伏有功无功出力预测值；为i节点所连接的所述可中断负荷的最大值；/>分别为所述无功补偿装置无功出力上下限；Q_CB,step,i,t为每组所述电容器的无功功率；σ_CB,i,t为t时刻i节点所连接的所述电容器投入组数；N_CB,i、K_CB,i分别为所述电容器组的最大投切次数以及每次投切的最大组数；分别为i节点所连接的所述微型燃气轮机有功无功出力最大值；/>分别为i节点所连接的所述微型燃气轮机爬坡功率的上下限；M_ij,t为t时刻ij支路所连接所述有载调压器的档位；/>为ij支路OLTC档位的上下限；k_ij0和Δk_ij为ij支路OLTC初始档位以及相邻两个档位差值；E_bat,i,t为t时刻i节点所连接的所述储能装置电量；/>为所述储能装置电量最大值；P_i ^ch,max、P_i ^dis,max分别为i节点所连接的所述储能装置充放电功率最大值；η_ch、η_dis为充放电效率；

(3)Disflow潮流约束