CN111860969A - 一种基于强化学习算法的输电网扩展规划方法 - Google Patents

一种基于强化学习算法的输电网扩展规划方法 Download PDF

Info

Publication number
CN111860969A
CN111860969A CN202010605469.3A CN202010605469A CN111860969A CN 111860969 A CN111860969 A CN 111860969A CN 202010605469 A CN202010605469 A CN 202010605469A CN 111860969 A CN111860969 A CN 111860969A
Authority
CN
China
Prior art keywords
state
planning
line
constraint
algorithm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010605469.3A
Other languages
English (en)
Other versions
CN111860969B (zh
Inventor
沈力
魏明奎
王渝红
蔡绍荣
江栗
胡胜杰
路亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan University
Southwest Branch of State Grid Corp
Original Assignee
Sichuan University
Southwest Branch of State Grid Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan University, Southwest Branch of State Grid Corp filed Critical Sichuan University
Priority to CN202010605469.3A priority Critical patent/CN111860969B/zh
Publication of CN111860969A publication Critical patent/CN111860969A/zh
Application granted granted Critical
Publication of CN111860969B publication Critical patent/CN111860969B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/067Enterprise or organisation modelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • General Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Development Economics (AREA)
  • Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Educational Administration (AREA)
  • Supply And Distribution Of Alternating Current (AREA)

Abstract

本发明公开了一种基于强化学习算法的输电网扩展规划方法,属于电网规划技术领域,先基于获取电网规划待选线路集,构建适用于电网规划的QTEP算法环境、状态、动作和智能体,并设计自适应因子;再综合考虑投资成本和可靠性成本,以规划周期内综合经济最优为目标,以电网运行约束、N‑1电网安全约束和蒙特卡洛误差约束为约束条件,建立优化模型;最后根据优化模型,结合综合特性反馈奖励函数与算法收敛条件,以强化学习思路求解优化模型,得到最优综合经济性的输电网扩展规划方案。本发明首次将强化学习思路应用至输电网扩展规划,求解思路贴合规划人员,所得规划方案合理准确,能有效提升输电网扩展规划的效率及准确性。

Description

一种基于强化学习算法的输电网扩展规划方法
技术领域
本发明属于电网规划技术领域,特别涉及是一种基于强化学习算法的输电网扩展规划方法。
背景技术
输电网扩展规划是确定在什么时间、什么地方、建设什么类型和容量的输变电工程。随着我国电网不断建设,我国已经进入大电网时代,电网规模的增大导致输电网扩展规划问愈发难以求解。
现阶段,输电网扩展规划问题的常用求解方法分为数学优化方法和启发式算法两类。其中数学优化方法将非线性的优化模型转化线性化进行求解,常用方法为整数规划、线性规划等。数学优化方法理论上来说能得到最优解,但模型线性化后的最优解可能失真,且电网互联背景下,数学优化方法存在计算量大、求解困难等问题,难以服务于工程实际。启发式算法是近代以来新兴的一类算法,是通过模拟自然界中的一些现象的求解方法,常用方法有粒子群算法、遗传算法、蚂蚁算法等。启发式算法的计算模式贴近人的思考模式,易于理解,但由于收敛性问题,一般能得到几组局部最优解,难以给出全局最优解。
随着电网规模的不断扩大和电力系统复杂程度的不断加深,数学优化方法和启发式算法愈发难以满足输电网扩展规划问题求解,因此,需在当前理论的基础上,引入新方法,适应电网互联背景下的输电网扩展规划问题求解。
发明内容
本发明的目的在于:针对上述存在的问题,本发明提供一种基于强化学习算法的输电网扩展规划方法。通过构建适用于输电网扩展规划的QTEP算法(Q-learning forTransmission Expansion Planning),求解以综合经济成本最优为目标的输电网扩展规划优化模型,最终得到适应电网互联背景下的最优扩展规划方案。
本发明采用的技术方案如下:
一种基于强化学习算法的输电网扩展规划方法,包括以下步骤:
步骤1:根据现状电网建设情况,确定线路待选集F,以线路待选集F为基础,构建强化学习的环境、状态、动作及对应智能体,构建适用于输电网扩展规划的QTEP算法;
步骤2:设定自适应因子λ,修正Q值计算方法,来提升QTEP算法的收敛速度;
步骤3:以规划周期内综合经济成本最小为目标构建目标函数,以电网运约束、N-1电网安全约及蒙特卡洛误差约束为约束条件,建立综合考虑经济性和可靠性的电网扩展规划优化模型;
步骤4:根据步骤3建立的优化模型,设计QTEP算法的综合特性反馈奖励函数和收敛条件,利用QTEP算法求解优化模型,得到综合考虑经济行和可行性的最优输电网扩展规划模型。
优选的,步骤1所述的强化学习的环境、状态、动作及对应智能体,以及QTEP算法构建步骤为:
步骤1.1:根据现状电网建设情况,确定由n条线路组成的线路待选集 F={l1,l2,…,lk,…,ln},其中lk为第k条待建设线路;
步骤1.2:构建QTEP算法环境为线路待选集F={l1,l2,…,lk,…,ln}本身,即所有可选的待建设线路;
步骤1.3:构建QTEP算法状态为智能体根据线路待选集F给出的当前规划方案;
步骤1.4:构建QTEP算法动作为改变当前规划方案的线路待选集状态;
步骤1.5:建立智能体动作更新策略,即每一次动作仅改变一条线路状态;
步骤1.6:构建QTEP算法智能体,智能体为状态和动作两个属性的集合。
优选的,步骤2中设计的自适应因子λ,Q值计算方法修正为:
Figure BDA0002560934660000021
Figure BDA0002560934660000022
式中,Q(si,ai)为状态si下对应动作ai的Q值,
Figure BDA0002560934660000023
为状态si下对应动作ai的反馈奖励,γ为折现率;
Figure BDA0002560934660000024
为当智能体执行动作ai转移至状态si+1时,智能体在状态si+1下的建设线路的数量;n为待选线路总量。通过加入自适应因子λ会使智能体根据后续状态的已建设线路数量对Q值更新方式进行修正,在已建设线路数量较多时加快学习速度,提升算法的收敛速度。
优选的,步骤3中的目标函数为规划方案投资成本与可靠性成本之和的最小值,投资成本为等年值法折算的年平均费用,可靠性成本通过蒙特卡洛等分散法求得。
优选的,目标函数表达式为:
Figure BDA0002560934660000025
式中,Cf为综合经济成本;r为预期投资收益,a0为投资服务年限,a1为规划建设年限,三者组合为投资年平均费用系数;ρ为线路年维护费用系数;F={l1,l2,…,ln}表示为由n条线路组成的线路待选集;
Figure BDA0002560934660000031
为线路lk的投资成本;
Figure BDA0002560934660000032
表示线路lk的建设情况,0表示为建设,1表示投建线路;Φ为系统状态集合,w为其中某一状态,系统转移至该状态的概率由PΦ(w) 表示;Pw,b在该状态下的是节点b的缺供电量,而cw,b为其失电成本;Θ为节点集合,包含电力系统所有节点;T表示负荷持续总时间。
优选的,步骤3中约束条件包括电网运行约束、N-1电网安全约束、蒙特卡洛误差约束,在N-1情况下,引入发电机和线路实际运行因子
Figure BDA0002560934660000033
0表示发电机停运或线路断开,1表示正常运行,
Figure BDA0002560934660000034
Figure BDA0002560934660000035
在一次计算中仅有一个状态为0,约束条件表达式如下:
Figure BDA0002560934660000036
式中,Gb为节点b处发电机的集合;Fb为连接节点b的线路集合;GΘ为系统所有发电机集合;
Figure BDA0002560934660000037
Pfh,b分别表示发电机gj的有功出力、线路lk的有功潮流和节点b处的负荷值;
Figure BDA0002560934660000038
为线路k的电纳值;θk1、θk0分别为线路k两端所连节点的相角,θk1代表潮流流出节点,θk0为潮流流入节点;
Figure BDA0002560934660000039
为线路k的极限传输容量;
Figure BDA00025609346600000310
PG,j分别为发电机gj的有功出力上、下限;
Figure BDA00025609346600000311
为节点b处负荷最大值;
Figure BDA00025609346600000312
θB分别为节点b相角的上、下限;θo表示平衡节点的相角,其值为0;NS为蒙特卡洛等分散法计算所得方差,η为允许误差。
上述各式分别表示电力系统的节点功率平衡约束、系统有功平衡约束、线路潮流约束、线路容量约束、发电机的有功出力约束、负荷缺供电量约束、节点相角约束和平衡节点相角约束;N-1条件下的节点功率平衡约束、N-1条件下的系统有功平衡约束、N-1条件下的线路潮流约束;蒙特卡洛误差约束。
优选的,所述步骤4中的综合特性反馈奖励函数是根据智能体当前状态的综合经济成本和智能体在单轮学习中动作次数的分段函数,表达式为:
Figure BDA0002560934660000041
式中,Cfinit为初始成本;ω为智能体在一轮学习中的动作次数,μ为智能体状态首次满足N-1电网安全约束;当ω≤μ时,若智能体状态不满足N-1电网安全约束,属于未成熟状态,反馈奖励0;ω>μ时,若智能体状态仍不满足N-1电网安全约束,则该状态属于不可行状态,则反馈奖励-M,M为任意大正整数;若智能体状态满足N-1电网安全约束校验,则计算当前状态建设成本Cf,依照上式反馈奖励值。
进一步地,步骤4中收敛条件为智能体完成N次学习动作,N为设定次数。同时,定义每K次学习动作为一轮学习,每K次学习动作后重置智能体状态,保留Q值的同时使智能体从原始网架开始重新学习。
相较于现有技术,本发明的有益效果是:
(1)本发明根据输电网扩展规划特征,构建了适用于输电网扩展规划的QTEP算法,将电网规划过程抽象为机器学习过程,创新了输电网扩展规划问题的求解方法;
(2)本发明通过设计的自适应因子λ和综合特性反馈奖励函数,减少了模型求解计算量,在较少的计算时间内得到了电网最优扩展规划方案,同时在优化模型中引入可靠性成本,考虑了规划方案的经济性和可靠性,得出综合最后的规划方案,克服了目前方法求解速度与求解精度不能兼顾的弊端。
(3)本发明基于QTEP算法的输电网扩展规划方法不仅能够准确给出具有最优综合经济成本的规划方案,兼顾输电网规划的经济性和可靠性,还能贴合规划人员的思考模式,在不同场景下给出当场景下的最优结果,将智能体学习过程进行可视化处理,重现智能体对电网的规划过程,能帮助电网规划人员选择安全可靠、经济合理的规划方案。
附图说明
图1为本发明的结构示意图;
图2为本发明的拓扑结构示意图;
图中标记为:11-激光器,12-激光聚焦单元,13-纳米标志物盒,14-微型光谱仪一,15- 缓冲反应皿一,16-间质液吸附装置,17-激光调制器,18-微处理器,19-显示模块,110-差分电路模块,111-半透半反透镜,112-全反镜,113-微型光谱仪二,114-缓冲反应皿二。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明,即所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。
实施例1
本实施例以IEEE 24-RTS系统为例对本发明进行验证,基于QTEP算法的输电网扩展规划流程图如图1所示。IEEE 24-RTS系统模型包含24条母线,29个输电走廊,38条输电线路,32个发电机,拓扑结构如图2所示,各线路投资成本均已折算为等年值。
具体实施方案如下:
步骤1:根据现状电网建设情况,确定线路待选集F,以线路待选集F为基础,构建强化学习的环境、状态、动作及对应智能体,构建适用于输电网扩展规划的QTEP算法;
本实施例基于IEEE 24-RTS系统,设计及原有线路,总计选取n=88条待选线路组成线路待选集F,则步骤1中QTEP算法环境、状态、动作和智能体的具体构建步骤为:
步骤1.1:根据现状电网建设情况,确定由n条线路组成的线路待选集 F={l1,l2,…,lk,…,ln},其中lk为第k条待建设线路;
步骤1.2:构建QTEP算法环境为线路待选集F={l1,l2,…,lk,…,ln}本身,即所有可选的待建设线路;
步骤1.3:构建QTEP算法状态为智能体根据线路待选集F给出的当前规划方案作;
步骤1.4:构建QTEP算法动作为改变当前规划方案的线路待选集状态;
步骤1.5:建立智能体动作更新策略,具体可表述为,每一次动作仅改变一条线路状态;
步骤1.6:构建QTEP算法智能体,智能体为状态和动作两个属性的集合。
步骤2:设定自适应因子λ,修正Q值计算方法;
基于自适应因子λ修正Q值计算方法的具体方法为:
Figure BDA0002560934660000051
Figure BDA0002560934660000061
式中,Q(si,ai)为状态si下对应动作ai的Q值,
Figure BDA0002560934660000062
为状态si下对应动作ai的反馈奖励,γ为折现率;
Figure BDA0002560934660000063
表当智能体执行动作ai转移至状态si+1时,智能体在状态si+1下的建设线路的数量;n为待选线路总量,本实施例中取88;加入自适应因子λ会使智能体根据后续状态的已建设线路数量对Q值更新方式进行修正,在已建设线路数量较多时加快学习速度,提升算法的收敛速度。
步骤3:以规划周期(1年)内综合经济成本最小为目标,以电网运行约束、N-1电网安全约束和蒙特卡洛误差约束为约束条件,建立综合考虑经济性和可靠性的输电网扩展规划优化模型;
本实施例基于直流潮流模型,建立优化模型的目标函数和约束条件如下:
步骤3.1:优化模型目标函数表达式为:
Figure BDA0002560934660000064
式中,Cf为综合经济成本;r为预期投资收益,a0为投资服务年限,a1为规划建设年限,三者组合为投资年平均费用系数;ρ为线路年维护费用系数;F={l1,l2,…,ln}表示为由n条线路组成的线路待选集;
Figure BDA0002560934660000065
为线路lk的投资成本;
Figure BDA0002560934660000066
表示线路lk的建设情况,0表示为建设, 1表示投建线路;规划方案的可靠性成本由蒙特卡洛等分散法求得;Φ为系统状态集合,w 为其中某一状态,系统转移至该状态的概率由PΦ(w)表示;Pw,b在该状态下的是节点b的缺供电量,而cw,b为其失电成本;Θ为节点集合,包含电力系统所有节点;T表示负荷持续总时间;
步骤3.2:约束条件包括电网运行约束、N-1电网安全约束、蒙特卡洛误差约束,在N-1 情况下,引入发电机和线路实际运行因子
Figure BDA0002560934660000067
0表示发电机停运或线路断开,1表示正常运行,
Figure BDA0002560934660000068
Figure BDA0002560934660000069
在一次计算中仅有一个状态为0,约束条件表达式如下:
Figure BDA0002560934660000071
式中,Gb为节点b处发电机的集合;Fb为连接节点b的线路集合;GΘ为系统所有发电机集合;
Figure BDA0002560934660000072
Pfh,b分别表示发电机gj的有功出力、线路lk的有功潮流和节点b处的负荷值;
Figure BDA0002560934660000073
为线路k的电纳值;θk1、θk0分别为线路k两端所连节点的相角,θk1代表潮流流出节点,θk0为潮流流入节点;
Figure BDA0002560934660000074
为线路k的极限传输容量;
Figure BDA0002560934660000075
PG,j分别为发电机gj的有功出力上、下限;
Figure BDA0002560934660000076
为节点b处负荷最大值;
Figure BDA0002560934660000077
θB分别为节点b相角的上、下限;θo表示平衡节点的相角,其值为0;NS为蒙特卡洛等分散法计算所得方差,η为允许误差;
上述各式分别表示电力系统的节点功率平衡约束、系统有功平衡约束、线路潮流约束、线路容量约束、发电机的有功出力约束、负荷缺供电量约束、节点相角约束和平衡节点相角约束;N-1条件下的节点功率平衡约束、N-1条件下的系统有功平衡约束、N-1条件下的线路潮流约束;蒙特卡洛误差约束。
步骤4:根据建立的优化模型,设计QTEP算法的综合特性反馈奖励函数与收敛条件,利用QTEP算法求解优化模型,得到综合考虑经济性和可靠性的最终输电网扩展规划方案。
综合特性反馈奖励函数具体是根据智能体当前状态的综合经济成本和智能体在单轮学习中动作次数的分段函数,表达式为:
Figure BDA0002560934660000081
式中,Cfinit为初始成本;ω为智能体在一轮学习中的动作次数,μ为智能体状态首次满足N-1电网安全约束。当ω≤μ时,若智能体状态不满足N-1电网安全约束,属于未成熟状态,反馈奖励0;ω>μ时,若智能体状态仍不满足N-1电网安全约束,则该状态属于不可行状态,则反馈奖励-M,M为任意大正整数;若智能体状态满足N-1电网安全约束校验,则计算当前状态建设成本Cf,依照上式反馈奖励值。
将本发明在两种不同规划场景下计算所得的输电网扩展规划方案与采用方法二所得的扩展规划方案进行对比,如表1所示。
表1不同方法线路脆弱性排序结果对比
Figure BDA0002560934660000082
表1中,场景1和场景2分别为规划总成本最小和可靠性成本最小,方法二为基于电网损耗的输电网扩展规划方法。由于电网在未进行扩展规划时不满足N-1电网安全约束(母线 7与其他母线仅有1条支路相连),可靠性成本非常高,为45.98M$,因此在场景1下,智能体会对电网进行多条线路扩建,综合权衡投资成本与可靠性成本。与方法二相比,由于方法二的规划方案仅考虑了N-1电网安全约束,以电网损耗最小为目标,未计及可靠性成本,导致给出的规划方案难以满足社会正常用电需求,在系统故障时出现负荷削减概率与严重程度均大于场景1给出的规划方案。场景1中,规划方案投资成本为15.97M$,虽然线路投资较方法二的10.44M$大,但是场景1规划方案下可靠性成本已降低至3.85M$,极大的降低了系统故障时失负荷出现的概率与严重程度,在提升电网可靠性的同时取得了最高的经济总收益。
我国电网供电可靠性是电网运行的首要目标,旨在绝大部分情况下都首要保障社会的用电可靠性。此场景下电网规划的目标为满足可靠性成本足够小的情况下计算规划的最小投资成本。由表1可知,场景2下总计规划线路14条,比场景1下规划线路多出3条,投资成本总计高出4.41M$,但此时可靠性成本已降低至0.02M$,仅当电网出现严重故障时才会发生少量失负荷。尽管总成本比场景1高出了0.58M$,但该规划方案保障了社会用电的可靠性,具有最优的社会效益。
实施例表明,本发明所提基于强化学习算法的输电网扩展规划方法不仅能够准确给出具有最优综合经济成本的规划方案,兼顾输电网规划的经济性和可靠性,还能贴合规划人员的思考模式,在不同场景下给出当场景下的最优结果。将智能体学习过程进行可视化处理,重现智能体对电网的规划过程,能帮助电网规划人员选择安全可靠、经济合理的规划方案。
以上所述实施例仅表达了本申请的具体实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请保护范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请技术方案构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。

Claims (7)

1.一种基于强化学习算法的输电网扩展规划方法,其特征在于,包括以下步骤:
步骤1:根据现状电网建设情况,确定线路待选集F,以线路待选集F为基础,构建强化学习的环境、状态、动作及对应智能体,构建适用于输电网扩展规划的QTEP算法;
步骤2:设定自适应因子λ,修正Q值计算方法,来提升QTEP算法的收敛速度;
步骤3:以规划周期内综合经济成本最小为目标构建目标函数,以电网运约束、N-1电网安全约及蒙特卡洛误差约束为约束条件,建立综合考虑经济性和可靠性的电网扩展规划优化模型;
步骤4:根据步骤3建立的优化模型,设计QTEP算法的综合特性反馈奖励函数和收敛条件,利用QTEP算法求解优化模型,得到综合考虑经济行和可行性的最优输电网扩展规划模型。
2.根据权利要求1所述的一种基于强化学习算法的输电网扩展规划方法,其特征在于,步骤1所述的强化学习的环境、状态、动作及对应智能体,以及QTEP算法构建步骤为:
步骤1.1:根据现状电网建设情况,确定由n条线路组成的线路待选集F={l1,l2,…,lk,…,ln},其中lk为第k条待建设线路;
步骤1.2:构建QTEP算法环境为线路待选集F={l1,l2,…,lk,…,ln}本身,即所有可选的待建设线路;
步骤1.3:构建QTEP算法状态为智能体根据线路待选集F给出的当前规划方案;
步骤1.4:构建QTEP算法动作为改变当前规划方案的线路待选集状态;
步骤1.5:建立智能体动作更新策略,即每一次动作仅改变一条线路状态;
步骤1.6:构建QTEP算法智能体,智能体为状态和动作两个属性的集合。
3.根据权利要求1所述的一种基于强化学习算法的输电网扩展规划方法,其特征在于,步骤2中设计的自适应因子λ,Q值计算方法修正为:
Figure FDA0002560934650000011
Figure FDA0002560934650000012
式中,Q(si,ai)为状态si下对应动作ai的Q值,
Figure FDA0002560934650000013
为状态si下对应动作ai的反馈奖励,γ为折现率;
Figure FDA0002560934650000014
为当智能体执行动作ai转移至状态si+1时,智能体在状态si+1下的建设线路的数量;n为待选线路总量。
4.根据权利要求1所述的一种基于强化学习算法的输电网扩展规划方法,其特征在于,步骤3中的目标函数为规划方案投资成本与可靠性成本之和的最小值,投资成本为等年值法折算的年平均费用,可靠性成本通过蒙特卡洛等分散法求得。
5.根据权利要求4所述的一种基于强化学习算法的输电网扩展规划方法,其特征在于,
目标函数表达式为:
Figure FDA0002560934650000021
式中,Cf为综合经济成本;r为预期投资收益,a0为投资服务年限,a1为规划建设年限;ρ为线路年维护费用系数;F={l1,l2,…,ln}表示为由n条线路组成的线路待选集;
Figure FDA0002560934650000022
为线路lk的投资成本;
Figure FDA0002560934650000023
表示线路lk的建设情况,0表示为建设,1表示投建线路;Φ为系统状态集合,w为其中某一状态,系统转移至该状态的概率由PΦ(w)表示;Pw,b在该状态下的是节点b的缺供电量,而cw,b为其失电成本;Θ为节点集合,包含电力系统所有节点;T表示负荷持续总时间。
6.根据权利要求1所述的一种基于强化学习算法的输电网扩展规划方法,其特征在于,步骤3中约束条件包括电网运行约束、N-1电网安全约束、蒙特卡洛误差约束,在N-1情况下,引入发电机和线路实际运行因子
Figure FDA0002560934650000024
0表示发电机停运或线路断开,1表示正常运行,
Figure FDA0002560934650000025
Figure FDA0002560934650000026
在一次计算中仅有一个状态为0,约束条件表达式如下:
Figure FDA0002560934650000027
式中,Gb为节点b处发电机的集合;Fb为连接节点b的线路集合;GΘ为系统所有发电机集合;
Figure FDA0002560934650000031
Pfh,b分别表示发电机gj的有功出力、线路lk的有功潮流和节点b处的负荷值;
Figure FDA0002560934650000032
为线路k的电纳值;θk1、θk0分别为线路k两端所连节点的相角,θk1代表潮流流出节点,θk0为潮流流入节点;
Figure FDA0002560934650000033
为线路k的极限传输容量;
Figure FDA0002560934650000034
P G,j分别为发电机gj的有功出力上、下限;
Figure FDA0002560934650000035
为节点b处负荷最大值;
Figure FDA0002560934650000036
θ B分别为节点b相角的上、下限;θo表示平衡节点的相角,其值为0;NS为蒙特卡洛等分散法计算所得方差,η为允许误差。
7.根据权利要求1所述的一种基于强化学习算法的输电网扩展规划方法,其特征在于,
所述步骤4中的综合特性反馈奖励函数是根据智能体当前状态的综合经济成本和智能体在单轮学习中动作次数的分段函数,表达式为:
Figure FDA0002560934650000037
式中,Cfinit为初始成本;ω为智能体在一轮学习中的动作次数,μ为智能体状态首次满足N-1电网安全约束;当ω≤μ时,若智能体状态不满足N-1电网安全约束,属于未成熟状态,反馈奖励0;ω>μ时,若智能体状态仍不满足N-1电网安全约束,则该状态属于不可行状态,则反馈奖励-M,M为任意大正整数;若智能体状态满足N-1电网安全约束校验,则计算当前状态建设成本Cf,依照上式反馈奖励值。
CN202010605469.3A 2020-06-29 2020-06-29 一种基于强化学习算法的输电网扩展规划方法 Active CN111860969B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010605469.3A CN111860969B (zh) 2020-06-29 2020-06-29 一种基于强化学习算法的输电网扩展规划方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010605469.3A CN111860969B (zh) 2020-06-29 2020-06-29 一种基于强化学习算法的输电网扩展规划方法

Publications (2)

Publication Number Publication Date
CN111860969A true CN111860969A (zh) 2020-10-30
CN111860969B CN111860969B (zh) 2023-11-28

Family

ID=72989137

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010605469.3A Active CN111860969B (zh) 2020-06-29 2020-06-29 一种基于强化学习算法的输电网扩展规划方法

Country Status (1)

Country Link
CN (1) CN111860969B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113126963A (zh) * 2021-03-15 2021-07-16 华东师范大学 一种基于强化学习的ccsl综合方法及系统
CN114169117A (zh) * 2021-12-13 2022-03-11 国家电网有限公司 一种基于改进粒子群算法的输电网扩展规划方法
CN118194489A (zh) * 2024-05-15 2024-06-14 湖北华中电力科技开发有限责任公司 一种基于强化学习的输电网扩展规划方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103116865A (zh) * 2013-03-08 2013-05-22 华北电力大学 一种多维度协同电网规划的方法
CN105226638A (zh) * 2015-09-06 2016-01-06 清华大学 基于改进教与学算法的电力系统可用输电能力计算方法
US20180241209A1 (en) * 2017-02-17 2018-08-23 Tsinghua University Dispatching method and device for integrated transmission and distribution network
CN108847667A (zh) * 2018-08-03 2018-11-20 国网山东省电力公司经济技术研究院 一种考虑电网结构优化的输电网扩展规划方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103116865A (zh) * 2013-03-08 2013-05-22 华北电力大学 一种多维度协同电网规划的方法
CN105226638A (zh) * 2015-09-06 2016-01-06 清华大学 基于改进教与学算法的电力系统可用输电能力计算方法
US20180241209A1 (en) * 2017-02-17 2018-08-23 Tsinghua University Dispatching method and device for integrated transmission and distribution network
CN108847667A (zh) * 2018-08-03 2018-11-20 国网山东省电力公司经济技术研究院 一种考虑电网结构优化的输电网扩展规划方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
孙东磊;赵龙;秦敬涛;韩学山;杨明;王明强;: "基于学习理论的含光储联合系统的输电网双层规划", 山东大学学报(工学版), no. 04 *
范宏;程浩忠;金华征;严健勇;张丽;: "考虑经济性可靠性的输电网二层规划模型及混合算法", 中国电机工程学报, no. 16, pages 1 - 7 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113126963A (zh) * 2021-03-15 2021-07-16 华东师范大学 一种基于强化学习的ccsl综合方法及系统
CN113126963B (zh) * 2021-03-15 2024-03-12 华东师范大学 一种基于强化学习的ccsl综合方法及系统
CN114169117A (zh) * 2021-12-13 2022-03-11 国家电网有限公司 一种基于改进粒子群算法的输电网扩展规划方法
CN118194489A (zh) * 2024-05-15 2024-06-14 湖北华中电力科技开发有限责任公司 一种基于强化学习的输电网扩展规划方法及系统

Also Published As

Publication number Publication date
CN111860969B (zh) 2023-11-28

Similar Documents

Publication Publication Date Title
CN108988316B (zh) 一种交直流混合配电系统网架结构优化配置方法
CN113011670B (zh) 配电网故障应急抢修调度-故障恢复协同方法及装置
CN111860969A (zh) 一种基于强化学习算法的输电网扩展规划方法
CN112217202A (zh) 考虑灵活性投资的分布式新能源、储能与配电网规划方法
CN102983629B (zh) 一种在线电力系统恢复辅助决策方法
WO2018058804A1 (zh) 通用型包含恒功率和下垂控制的微电网群分布式控制方法
CN110266038A (zh) 一种多虚拟电厂分布式协调调控方法
CN111079972A (zh) 一种主动配电网可靠性规划方法、设备及介质
CN111725798A (zh) 一种用于直流微电网集群的分布式经济调度预测控制方法
CN116565906A (zh) 一种提升有源配电网韧性的储能双层优化配置方法
CN107332277B (zh) 一种考虑源储荷运行特性的有源配电网孤岛运行方法
CN112467748A (zh) 三相不平衡主动配电网双时标分布式电压控制方法及系统
CN107179688B (zh) 考虑蒙特卡罗状态抽样截尾的电力系统可靠性分析方法
CN117875161A (zh) 考虑多故障不确定性的源网荷协同弹性提升方法及系统
CN117522014A (zh) 一种考虑多重不确定性的储配网联合规划方法
CN111952964A (zh) 一种配电网多时段故障恢复模型的解耦方法
CN111651889A (zh) 输电系统高风险事件筛选方法、装置、设备及存储介质
CN115133540B (zh) 一种配电网无模型的实时电压控制方法
CN110705070A (zh) 一种分布式能源系统多阶段滚动优化规划方法
CN114498749A (zh) 主动配电系统孤岛划分和自主运行方法及系统
CN113991686A (zh) 一种多能耦合配电系统故障恢复方法、装置及存储介质
CN111262272A (zh) 一种基于时延孤岛微电网的系统控制方法
CN116826780B (zh) 基于主从的有限时间一致性的储能二次调频控制方法
Sun et al. A fast island partition method of distribution network with energy storage based on electricity sufficiency and power balance information
CN114336749B (zh) 一种配电网优化方法、系统、装置及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant