CN113837654B - 一种面向多目标的智能电网分层调度方法 - Google Patents
一种面向多目标的智能电网分层调度方法 Download PDFInfo
- Publication number
- CN113837654B CN113837654B CN202111195681.8A CN202111195681A CN113837654B CN 113837654 B CN113837654 B CN 113837654B CN 202111195681 A CN202111195681 A CN 202111195681A CN 113837654 B CN113837654 B CN 113837654B
- Authority
- CN
- China
- Prior art keywords
- unit
- power grid
- score
- power
- layer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 44
- 230000009471 action Effects 0.000 claims abstract description 48
- 238000005457 optimization Methods 0.000 claims abstract description 38
- 230000007613 environmental effect Effects 0.000 claims abstract description 31
- 238000013210 evaluation model Methods 0.000 claims abstract description 15
- 238000004458 analytical method Methods 0.000 claims abstract description 10
- 239000003795 chemical substances by application Substances 0.000 claims description 58
- 238000011156 evaluation Methods 0.000 claims description 29
- 238000004422 calculation algorithm Methods 0.000 claims description 12
- 239000013598 vector Substances 0.000 claims description 9
- 238000012887 quadratic function Methods 0.000 claims description 3
- 238000012549 training Methods 0.000 claims description 3
- 238000010977 unit operation Methods 0.000 claims description 2
- 238000013473 artificial intelligence Methods 0.000 abstract description 2
- 238000005516 engineering process Methods 0.000 abstract 1
- 238000011158 quantitative evaluation Methods 0.000 abstract 1
- 230000006870 function Effects 0.000 description 12
- 238000004364 calculation method Methods 0.000 description 9
- 238000005265 energy consumption Methods 0.000 description 6
- 238000004088 simulation Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000011234 economic evaluation Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 230000002787 reinforcement Effects 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 230000008092 positive effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
- G06Q10/06311—Scheduling, planning or task assignment for a person or group
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02J—CIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
- H02J3/00—Circuit arrangements for ac mains or ac distribution networks
- H02J3/38—Arrangements for parallely feeding a single network by two or more generators, converters or transformers
- H02J3/46—Controlling of the sharing of output between the generators, converters, or transformers
- H02J3/466—Scheduling the operation of the generators, e.g. connecting or disconnecting generators to meet a given demand
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02J—CIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
- H02J2203/00—Indexing scheme relating to details of circuit arrangements for AC mains or AC distribution networks
- H02J2203/20—Simulating, e g planning, reliability check, modelling or computer assisted design [CAD]
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Engineering & Computer Science (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Marketing (AREA)
- Entrepreneurship & Innovation (AREA)
- General Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Operations Research (AREA)
- Development Economics (AREA)
- Quality & Reliability (AREA)
- Educational Administration (AREA)
- Game Theory and Decision Science (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Power Engineering (AREA)
- Supply And Distribution Of Alternating Current (AREA)
Abstract
本发明是一种面向多目标的智能电网分层调度方法,涉及电网控制及人工智能技术。本发明方法包括:构建多目标电网运行评估模型,对电网运行状态从安全、经济和环保性三方面评估;建立双层调度结构,下层决策层对调度策略在局部进行优化,上层优化层对调度策略在全局进行优化;决策层对电网中每个机组建立一个智能体,智能体输出为机组的有功功率输出调整值;优化层包含三个多层感知器,分别用于评估电网的安全、经济和环保性;双层调度结构优化调度策略后,还使用拓扑分析法调整优化动作,避免在电网调度中出现孤岛。本发明实现在安全、经济、环保三个维度对电网运行状态进行量化评估,获取的调度策略更加有效,且适用于大规模电网的实时调度。
Description
技术领域
本发明属于电网控制与人工智能交叉领域,具体涉及一种面向多目标的智能电网分层调度方法。
背景技术
智能调度作为智能电网的核心,往往需要在考虑复杂的安全约束的基础上,实现经济效益最大化。同时,可再生能源使用率提升,从而导致调度难度进一步加大。
电网调度中的多目标优化研究受到了学术界和工业界的广泛关注。针对电网安全约束经济调度(Security-constrained Economic Dispatching,SCED)问题,有学者提出了一种基于深度学习的主动约束识别的智能预选方法,利用堆叠去噪自编码器来提取系统工作条件与SCED的有源约束集之间的非线性关系。为了解决SCED算法计算成本高的问题,有学者提出了一种基于深度神经网络的优化策略,通过频域分析得到分解分量的最佳频率分界点,然后将光伏功率分解为低频和高频分量,利用卷积神经网络(CNN)对低频和高频分量进行预测,并通过加法重构得到最终的预测结果。然而,他们都没有考虑到新能源对电网的影响。为了使系统运行成本最小化和可再生能源消耗最大化,有学者将调度问题建模为多步马尔可夫决策过程,不考虑电网运行的复杂约束和规则,选取火电机组的启停状态和不同类型电站的功率输出作为优化变量,引入深度确定性策略梯度算法来解决决策问题。有学者建立了多目标粒子群优化算法,引入小概率逃逸机制,克服了清洁能源的间歇性和波动性,保证了电力系统的安全运行,但由于算法复杂度高,不能应用于大规模电网的实时调度。
由于多智能体和分布式系统的灵活性和扩展性较强,研究人员也将其广泛应用于大规模电网调度。有学者提出了一种基于深度强化学习的数据驱动多智能体框架,用于并联无功补偿器的离线选址和尺寸以及在线控制,以克服与精确系统模型相关的计算复杂度高和扩展性差的问题,增强电压弹性。针对动态经济调度问题,有学者提出了一种分布式强化学习优化算法,将状态-动作-值函数近似与基于乘子拆分的分布式优化相结合,以解决先验知识不足的问题。有学者提出了一种分层多智能体深度确定性策略梯度(Hierarchical Multi-agent Deep Deterministic Policy Gradient,HMA-DDPG)算法,考虑了AGC调度系统的经济性和安全性,来辅助自动增益控制(Automatic GenerationControl,AGC)调度。为了减少智能体对全局信息的依赖,有学者提出了一种基于分布式Q学习的优化算法来实现经济调度,将经济调度和单位承诺表述为统一的形式,Q学习的优化算法以在线方式运行,不需要关于实际成本函数计算公式的先验信息,能够处理此类成本函数难以获得的情况。
目前的智能电网调度方法存在以下不足:首先,没有同时考虑安全约束、经济和环境保护多目标调度,电网的安全运行是根本,而经济和环保是电力市场环境和可持续发展的必然要求。此外,多智能体之间的关系不够紧密,对多智能体框架缺乏全局评估。
发明内容
本发明针对目前智能电网调度方法存在的不足,提出了一种面向多目标的智能电网分层调度方法,基于深度确定性策略梯度算法(Deep Deterministic Policy Gradient,DDPG),采用分层架构以及多智能的设计,通过决策层中多智能体间的合作、博弈以及优化层网络的全局评估,实现局部和全局电网的安全性、经济性和环保性保障。
本发明的一种面向多目标的智能电网分层调度方法,包括如下步骤:
步骤一、构建多目标电网运行评估模型,从安全、经济、环保三个维度对电网运行状态评估;
步骤二、建立双层调度结构,包括下层决策层和上层优化层,通过决策层对调度策略在局部进行优化,通过优化层对调度策略在全局进行优化;
步骤三、获取电网中所有机组周围电网的状态,利用双层调度结构对调度策略进行优化,计算全局评价结果与局部评价结果的综合得分反馈给智能体,智能体调整动作,并重新计算综合得分,选取综合得分最高的动作作为优化动作;使用拓扑分析法调整优化动作,避免在电网调度中出现孤岛,并作为最终动作输出。
所述步骤一中,多目标电网运行评估模型,在安全维度,选取机组无功功率、机组电压越限值和支路电流越限值进行安全性得分计算;在经济维度,对每个机组的运行费用及启停费用进行计算,经济性得分与费用支出呈反比;在环保维度,获取所有机组有功功率输出,求得新能源占比,作为环保性得分。
所述步骤二中,决策层采用多智能体结构,电网中每个机组对应一个智能体,各智能体对机组及其周围的局部电网进行观测,输出动作为机组的有功功率输出调整值,计算动作的奖励并反馈给智能体;所计算的智能体动作的奖励为局部评价结果。
所述步骤二中,优化层包含三个多层感知器,分别计算电网在所述模型中的安全性得分、经济性得分和环保性得分,将三个得分按预设的权重平均,作为全局评价结果,对动作进行优化。设N为电网中所有机组数量,M为电网中所有支路数量;计算安全性得分的多层感知器的输入是2N+M维向量,由N个智能体的动作奖励、M条支路的电流值和N台机组的电压值组成;计算、经济性得分和环保性得分的两个多层感知器的输入均为2N维向量,由N个智能体的动作奖励和N台机组的电压值组成。
相对于现有技术,本发明的优点与积极效果在于:(1)本发明方法提出了一种多目标电网运行评估模型,对电网运行的安全性、经济性和环保性进行量化,从而实现客观评价电网调度效果的目的。(2)本发明设计了分层多目标智能电网调度方法来实现智能电网的多目标调度,采用了双层框架和多智能体结构,使调度策略更加有效,加强智能体之间的合作博弈关系,加快收敛速度,进而适用于大规模电网的实时调度。(3)本发明方法为了避免因电流过大造成支路断开而引起孤岛的问题,采用了拓扑分析方法进行决策优化,以保证电网的安全性。
附图说明
图1是本发明实施例面向多目标的智能电网分层调度方法的流程示意图;
图2是本发明实施例面向多目标的智能电网分层调度方法的实现架构图。
具体实施方式
下面将结合附图和实施例对本发明作进一步的详细说明。
本发明首先构建了一个多目标电网运行评估模型,在安全、经济、环保三个维度对电网运行状态进行量化评估,从而评价电网调度策略的效果;在此基础上,本发明实现了一种面向多目标的智能电网分层调度方法,在实现电网安全调度的同时,实现经济效益以及新能源使用率最大化。
本发明构建的多目标电网运行评估模型,主要从安全、经济、环保三个维度对电网运行状态评估。在安全性方面,本发明模型选取了机组无功功率和电压越限值、支路电流越限值三个指标进行量化,分别加权后,得到安全性得分;在经济方面,本发明模型对每个机组的运行费用及启停费用进行计算,而经济性得分则与费用支出呈反比;在环保性上,本发明模型获取所有机组有功功率输出,求得新能源占比,即为环保性得分。使用本发明构建的模型可以实时评估电网运行状态,从而评价调度决策的效果。
(1)安全目标:安全是电网调度的基本目标,本发明选取机组无功功率越限值、机组电压越限值和支路电流越限值进行安全性评估,具体安全性得分scoresec的计算如下:
其中,代表t时刻机组i无功功率越限值,/>代表t时刻机组i电压越限值,/>代表t时刻支路j电流越限值;Wq、Wv和Wb分别为机组无功功率越限值、电压越限值和支路电流越限值的权重系数。NG为电网的机组总数;NB为电网的支路总数。Nstep为智能体每回合中的步数,步数即时间步数。
对机组无功功率越限值计算评估的公式如下:
其中,为t时刻机组i是否运行的状态值,为0-1二元变量,取值为1时代表运行,取值为0代表未运行;/>为机组i在t时刻的无功功率;/>和/>为机组i的无功功率最大值和最小值。
对机组电压越限值计算评估的公式如下:
其中,为机组i在t时刻的电压;/>和/>为机组i电压的最大值和最小值。
对支路电流越限值计算评估的公式如下:
其中,代表支路j在t时刻的电流值,Tj代表支路j的热极限。
(2)经济目标:经济性是电力系统运行的重要指标,目标是使电力系统的成本最小化,总成本包括机组的运行成本和启动-停止成本。经济性得分scoreeco与成本cost呈负相关,具体计算公式如下:
其中,和/>分别代表机组i的运行费用和启停费用。
机组运行费用是机组有功功率的二次函数,具体计算如下:
其中,为机组i在t时刻的有功功率;而ai、bi和ci分别为二次项、一次项和常数项系数。
机组i在t时刻的启停费用为固定值,如下:
其中,为机组i的启动费用。
(3)环保目标:环境目标是使电力系统尽可能多地使用可再生能源,因此本发明模型将可再生能源利用率作为环保性评分scoreenv,计算如下:
其中,NR为新能源机组的数量;为机组i的最大功率。
本发明的面向多目标的智能电网分层调度方法,采用双层架构,分为下层决策层以及上层优化层,对调度决策分别在局部和全局进行优化。决策层采用多智能体结构,每个智能体基于DDPG算法观察电网的局部状态,通过Actor网络给出各机组的有功调整值,并通过Critic网络计算各动作的局部评价。优化层包含三个多层感知器(Multi-layerPerceptron,MLP),用于评估安全、经济和环境因素,按照本发明提供的评估模型计算安全性得分、经济得分和环保性得分,将三个评分结果按一定权重加权求和,作为全局评价结果,对动作进行优化。
(一)下面说明决策层的实现。
(1)状态空间:决策层中各智能体对机组及其周围的局部电网进行观测。本发明实施例中,每个机组对应一个智能体。本发明选取12个观测值作为智能体的输入,来表征局部电网的运行状态。状态空间定义为:
其中,代表机组i在t时刻的运行状态;智能电网建模为图,总线抽象为图中的节点,N′L为与机组i在同一节点的负载个数;NL为电网中所有负载的个数;/>为t时刻负载j的有功功率,/>为t时刻负载i的有功功率,/>为t时刻负载j的无功功率;最后两行代表与机组i相连的两条负载率最高的支路参数,rho、P_or和a_or分别代表支路的负载率、有功功率以及电流值,下角标1和2分别标记两条支路。
(2)动作空间:本发明中各智能体的输出动作即为机组的有功功率输出调整值。对于智能体i来说,在t时刻其动作空间为adjmax为机组有功功率输出的调整值。
(3)奖励函数:电网运行仿真器会基于电网运行状态,结合多目标电网运行评估模型,计算得到局部奖励,并反馈给相应的智能体。首先,根据多目标电网运行评估模型中安全性得分的计算方法,利用该机组以及其所连支路的参数,得到局部安全性得分。同时,为了保证机组的发电量满足负荷需求,在奖励函数中增加了输出奖励,其公式为:
其中,Output_rewardi为智能体i的输出奖励。W_r是新能源机组有功功率占比,W_t是火电机组有功功率占比。NT为火电机组的数量,NR为新能源电机组的数量。
在奖励函数中,设置局部安全性得分占0.6,输出奖励占0.4,对智能体的安全性得分和输出奖励进行加权求和,得到智能体动作的奖励值。
(二)下面说明优化层的实现。
优化层中有三个网络,分别基于MLP对整个电网的安全性、经济性和环保性进行评估。安全性评估网络的输入是2N+M维向量,由N个智能体中Critic网络输出、M条支路的电流值和N台机组的电压值组成。此处,N为电网中所有机组数量,对应NG;M对应NB。经济评价网络和环境评价网络的输入是2N维向量,由N个智能体中Critic网络输出和N台机组的电压值组成。
这些网络以多目标电网运行评估模型计算的结果为标签,采用有监督学习的方式进行训练。全局评价综合了三个网络的评价结果,本发明实施例中,安全评价占0.6,经济评价和环境评价均占0.2。
本发明的电网分层多智能体多目标调度方法,结合下面实施例,对目标智能电网在电网运行仿真器中建模仿真,然后如图1所示,基于本发明提出的多目标电网运行评估模型和双层调度结构,实现的一个流程步骤如下:
步骤1:初始化决策层中智能体以及优化层中三个评估网络;
步骤2:获取电网中所有机组周围电网的状态;
步骤3:将局部电网观测量输入对应的智能体,获取每台机组的动作及其所对应的局部评价得分;局部评价得分即智能体动作的奖励值;
步骤4:获取电网的全局观测量;全局观测量是指优化层的输入中需要的全局电网的参数,即所有支路电流和所有机组电压;
步骤5:将全局观测量与局部得分输入优化层中的安全、经济、环保评估网络,得到安全、经济和环保得分;
步骤6:将安全、经济和环保得分加权求和得到全局得分,并将全局得分与局部得分进行综合,将二者加权求和回传至智能体,对动作进行调整,选取综合得分最高的动作作为优化动作;
步骤7:使用拓扑分析法调整优化动作,避免在电网调度中出现孤岛,并作为最终动作;
在电网调度中,一旦因断线造成孤岛,电网运行环境就会崩溃。为了避免这一问题,本发明采用了拓扑分析方法调整优化动作。当动作下发至电网仿真环境前,会进行预演。在预演中,当因支路i电流过大导致断路从而造成孤岛时,采用广度优先算法搜索离该支路最近的两台发电机组,调整其有功输出减少10%。
步骤8:将最终动作下发至电网运行仿真器,基于多目标电网运行评估模型得到仿真器反馈的局部得分以及全局安全、经济和环保得分,并更新电网状态;
步骤9:将观测量、动作以及反馈数据存入经验池,并在经验池中抽取部分数据更新智能体以及评估网络;观测量是指观测的电网中机组周围电网的状态,动作是指机组的有功功率输出调整值,反馈数据是指由电网运行仿真器反馈的局部得分以及全局安全、经济和环保得分;
步骤10:重复步骤2~步骤9,训练智能体以及评估网络。
实施例:
本发明实施例中利用基于IEEE118总线系统的电网运行仿真器对本发明方法进行测试和评估,如图2所示。对电网的仿真参数设置如表1和表2所示。机组一共53个,标记为U1~U53。
表1电网仿真参数
参数名称 | 值 |
新能源机组台数 | 18 |
火电机组台数 | 35 |
支路条数 | 117 |
负载数 | 91 |
Wq | 20 |
Wv | 20 |
Wb | 10 |
adjmax | 10 |
W_r | 0.3 |
W_t | 0.7 |
表2电网中机组参数
本发明采用人工神经网络拟合Actor、Critic以及全局评估函数。对于决策层中每个智能体的Actor网络而言,输入的形式是大小为(12,1)的向量。每个Actor和Critic网络都包含三层网络。其中,对于Actor网络,为了拟合动作的取值范围,采用tanh函数作为最后一层的激活函数。在优化层,安全性、经济性和环保性评估网络输入的向量为(283,1)、(106,1)和(106,1)。表3列出了网络中完整的超参数。
表3本发明决策层和优化层的网络参数设置表
上表中,输入(12,1)代表输入为12*1的向量,全连接层(12,7)代表全连接层参数,即(前神经元个数,后神经元个数)。
如图2所示,进行多智能体Q学习。输入状态St和智能体的动作at、奖励rt分别对应上述智能体的状态空间、动作空间和奖励函数中的记载。每个智能体的在线网络和目标网络的结构相同,在线网络依据策略梯度更新Actor网络,根据Q函数计算损失函数L,γ为折扣因子,E表示对每个样本求均值,r代表的是仿真器返回的奖励值。
为了验证本发明面向多目标的智能电网分层调度方法的有效性,对本发明方法中三个模块——决策层、优化层和拓扑分析法,依次累加测试调度效果。实验结果如表4前三行所示,通过安全评分、一天平均成本、新能源消纳,来评价方法的有效性。决策层有53个智能体来调整53台机组的有功输出。在此基础上增加优化层,可以优化整个电网的安全、经济和环境目标。最后,增加了拓扑分析方法,避免了孤岛问题。仿真结果表明,添加优化层后,安全评分提高了13.51%,可再生能源消耗提高了40.38%,成本降低了0.35%。向多目标的智能电网分层调度方法的安全性评分比未采用拓扑分析方法的高13.05%,成本和可再生能源消耗差异不显著。
表4
将本发明面向多目标的智能电网分层调度方法与分布式比例控制(参考文献[9])和二分法(参考文献[10])进行比较,评价不同调度方法的安全性能、成本和新能源消纳。本发明将比例控制和二分法的收敛误差设为10-3、10-5、10-7,进行了六组对比实验。
参考文献[9]S.Yang,S.Tan and J.Xu,"Consensus Based Approach forEconomic Dispatch Problemin a Smart Grid,"IEEE Transactions on Power Systems,vol.28,no.4,pp.4416-4426,Nov.2013.
参考文献[10]H.Xing,Y.Mou,M.Fu and Z.Lin,"Distributed Bisection Methodfor Economic Power Dispatch in Smart Grid,"IEEE Transactions on PowerSystems,vol.30,no.6,pp.3024-3035,Nov.2015.
仿真结果如表4所示,本发明面向多目标的智能电网分层调度方法具有最好的全局评价结果。面向多目标的智能电网分层调度方法的安全评分平均比其他两种调度方法高13.53%。调度成本比分布式二分法和比例控制分别低2.81%和0.79%。此外,对于可再生能源消纳,面向多目标的智能电网分层调度方法比其他两种方法平均高70.48%。
除说明书所述的技术特征外,均为本专业技术人员的已知技术。本发明省略了对公知组件和公知技术的描述,以避免赘述和不必要地限制本发明。
上述实施例中所描述的实施方式也并不代表与本申请相一致的所有实施方式,在本发明技术方案的基础上,本领域技术人员不需要付出创造性的劳动即可做出的各种修改或变形仍在本发明的保护范围内。
Claims (7)
1.一种面向多目标的智能电网分层调度方法,其特征在于,包括如下步骤:
步骤一、构建多目标电网运行评估模型,从安全、经济、环保三个维度对电网运行状态评估;
所述模型,在安全维度,选取机组无功功率、机组电压越限值和支路电流越限值进行安全性得分计算;在经济维度,对每个机组的运行费用及启停费用进行计算,经济性得分与费用支出呈反比;在环保维度,获取所有机组有功功率输出,求得新能源占比,作为环保性得分;
步骤二、建立双层调度结构,包括下层决策层和上层优化层,通过决策层对调度策略在局部进行优化,通过优化层对调度策略在全局进行优化;
所述决策层采用多智能体结构,电网中每个机组对应一个智能体,各智能体对机组及其周围的局部电网进行观测,输出动作为机组的有功功率输出调整值,计算动作的奖励并反馈给智能体;所计算的智能体动作的奖励为局部评价结果;
所述决策层中,每个智能体基于DDPG算法观察电网的局部状态,通过Actor网络给出各机组的有功调整值,并通过Critic网络计算各动作的局部评价;其中,智能体的输入为局部电网的运行状态,状态空间表征为:
其中,代表机组i在t时刻的运行状态;N′L为电网中与机组i在同一总线的负载个数;为机组i在t时刻的有功功率;/>为机组i在t时刻的无功功率;/>为机组i在t时刻的电压;NL为电网中所有负载的个数;/>为t时刻负载j的有功功率,/>为t时刻负载i的有功功率,/>为t时刻负载j的无功功率;最后两行代表与机组i相连的两条负载率最高的支路参数,rho、P_or和a_or分别代表支路的负载率、有功功率以及电流值,下角标1和2分别标记两条支路;
所述优化层包含三个多层感知器,分别计算电网在所述模型中的安全性得分、经济性得分和环保性得分,将三个得分按预设的权重加权求和,作为全局评价结果;设N为电网中所有机组数量,M为电网中所有支路数量;计算安全性得分的多层感知器的输入是2N+M维向量,由N个智能体的动作奖励、M条支路的电流值和N台机组的电压值组成;计算、经济性得分和环保性得分的两个多层感知器的输入均为2N维向量,由N个智能体的动作奖励和N台机组的电压值组成;
步骤三、获取电网中所有机组周围电网的状态,利用双层调度结构对调度策略进行优化,计算全局评价结果与局部评价结果的综合得分反馈给智能体,智能体调整动作,并重新计算综合得分,选取综合得分最高的动作作为优化动作;使用拓扑分析法调整优化动作,避免在电网调度中出现孤岛,并作为最终动作输出。
2.根据权利要求1所述的方法,其特征在于,所述的步骤一中,多目标电网运行评估模型,根据下式计算安全性得分scoresec,如下:
其中,NG为电网的机组总数;NB为电网的支路总数;代表t时刻机组i无功功率越限值,/>代表t时刻机组i电压越限值,/>代表t时刻支路j电流越限值;Wq、Wv和Wb分别为机组无功功率越限值、电压越限值和支路电流越限值的权重系数;Nstep为时间步数;
对机组无功功率越限值如下计算:
其中,为机组i在t时刻的无功功率;/>和/>分别为机组i的无功功率最大值和最小值;/>为t时刻机组i是否运行的状态值,取值为1时代表运行,取值为0代表未运行;
对机组电压越限值如下计算:
其中,为机组i在t时刻的电压;/>和/>为机组i电压的最大值和最小值;
对支路电流越限值如下计算:
其中,代表支路j在t时刻的电流值,Tj代表支路j的热极限。
3.根据权利要求1所述的方法,其特征在于,所述的步骤一中,多目标电网运行评估模型,根据下式计算经济性得分scoreeco,如下:
其中,NG为电网的机组总数;为t时刻机组i的运行费用;/>为t时刻机组i的启停费用;Nstep为时间步数;
机组运行费用是机组有功功率的二次函数,如下计算:
其中,为机组i在t时刻的有功功率;/>为t时刻机组i是否运行的状态值,取值为1时代表运行,取值为0代表未运行;ai、bi和ci分别为二次函数的二次项、一次项和常数项系数;
机组启停费用为固定值,如下计算:
其中,为机组i的启动费用。
4.根据权利要求1所述的方法,其特征在于,所述的步骤一中,多目标电网运行评估模型,根据下式计算环保性得分scoreenv,如下:
其中,NR为新能源机组的数量;为机组i的最大功率;Nstep为时间步数。
5.根据权利要求1所述的方法,其特征在于,所述的步骤二中,决策层的实现还包括:
智能体的输出动作为机组的有功功率输出调整值;设智能体i在t时刻的动作空间表示为adjmax为调整值;
设计奖励函数:首先,根据多目标电网运行评估模型计算智能体对应的机组及其周围的局部电网的安全性得分;同时,为了保证机组的发电量满足负荷需求,在奖励函数中增加了输出奖励如下:
其中,Output_rewardi为智能体i的输出奖励;W_r是新能源机组有功功率占比,W_t是火电机组有功功率占比;NT为火电机组的数量,NR为新能源电机组的数量;
对智能体的安全性得分和输出奖励进行加权求和得到动作的奖励;其中,智能体的安全性得分占0.6,输出奖励占0.4。
6.根据权利要求1所述的方法,其特征在于,所述的步骤二中,在优化层,设置安全性得分的权重为0.6,设置经济性得分和环保性得分的权重均为0.2。
7.根据权利要求1所述的方法,其特征在于,所述的方法在训练智能体以及多层感知器时,将待研究智能网络在电网运行仿真器中进行仿真,执行步骤三,将最终动作下发至电网运行仿真器,电网运行仿真器基于多目标电网运行评估模型反馈局部评价结果以及全局的安全性得分、经济性得分和环保性得分,并更新电网状态;将电网状态观测量、智能体动作以及电网运行仿真器反馈的数据存入经验池,在经验池中抽取数据更新智能体以及多层感知器。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111195681.8A CN113837654B (zh) | 2021-10-14 | 2021-10-14 | 一种面向多目标的智能电网分层调度方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111195681.8A CN113837654B (zh) | 2021-10-14 | 2021-10-14 | 一种面向多目标的智能电网分层调度方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113837654A CN113837654A (zh) | 2021-12-24 |
CN113837654B true CN113837654B (zh) | 2024-04-12 |
Family
ID=78968767
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111195681.8A Active CN113837654B (zh) | 2021-10-14 | 2021-10-14 | 一种面向多目标的智能电网分层调度方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113837654B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108600379A (zh) * | 2018-04-28 | 2018-09-28 | 中国科学院软件研究所 | 一种基于深度确定性策略梯度的异构多智能体协同决策方法 |
CN110728406A (zh) * | 2019-10-15 | 2020-01-24 | 南京邮电大学 | 基于强化学习的多智能体发电优化调度方法 |
CN111563188A (zh) * | 2020-04-30 | 2020-08-21 | 南京邮电大学 | 一种移动多智能体协同目标搜索方法 |
CN112149347A (zh) * | 2020-09-16 | 2020-12-29 | 北京交通大学 | 基于深度强化学习的配电网负荷转供方法 |
CN112507614A (zh) * | 2020-12-01 | 2021-03-16 | 广东电网有限责任公司中山供电局 | 一种分布式电源高渗透率地区电网综合优化方法 |
CN113128753A (zh) * | 2021-03-24 | 2021-07-16 | 国网湖北省电力有限公司检修公司 | 一种基于深度强化学习的操作票操作顺序智能生成方法 |
CN113141012A (zh) * | 2021-04-24 | 2021-07-20 | 西安交通大学 | 基于深度确定性策略梯度网络的电网潮流调控决策推理方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200327411A1 (en) * | 2019-04-14 | 2020-10-15 | Di Shi | Systems and Method on Deriving Real-time Coordinated Voltage Control Strategies Using Deep Reinforcement Learning |
-
2021
- 2021-10-14 CN CN202111195681.8A patent/CN113837654B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108600379A (zh) * | 2018-04-28 | 2018-09-28 | 中国科学院软件研究所 | 一种基于深度确定性策略梯度的异构多智能体协同决策方法 |
CN110728406A (zh) * | 2019-10-15 | 2020-01-24 | 南京邮电大学 | 基于强化学习的多智能体发电优化调度方法 |
CN111563188A (zh) * | 2020-04-30 | 2020-08-21 | 南京邮电大学 | 一种移动多智能体协同目标搜索方法 |
CN112149347A (zh) * | 2020-09-16 | 2020-12-29 | 北京交通大学 | 基于深度强化学习的配电网负荷转供方法 |
CN112507614A (zh) * | 2020-12-01 | 2021-03-16 | 广东电网有限责任公司中山供电局 | 一种分布式电源高渗透率地区电网综合优化方法 |
CN113128753A (zh) * | 2021-03-24 | 2021-07-16 | 国网湖北省电力有限公司检修公司 | 一种基于深度强化学习的操作票操作顺序智能生成方法 |
CN113141012A (zh) * | 2021-04-24 | 2021-07-20 | 西安交通大学 | 基于深度确定性策略梯度网络的电网潮流调控决策推理方法 |
Non-Patent Citations (2)
Title |
---|
Multi-Agent Deep Reinforcement Learning for Sectional AGC Dispatch;Jiawen Li等;IEEE Access;第8卷;全文 * |
雷震.《IETM智能计算技术》.北京邮电大学出版社,2020,第52-53页. * |
Also Published As
Publication number | Publication date |
---|---|
CN113837654A (zh) | 2021-12-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110365057B (zh) | 基于强化学习的分布式能源参与配电网调峰调度优化方法 | |
Li et al. | Probabilistic charging power forecast of EVCS: Reinforcement learning assisted deep learning approach | |
CN111242443B (zh) | 基于深度强化学习的能源互联网中虚拟电厂经济调度方法 | |
CN109347149A (zh) | 基于深度q值网络强化学习的微电网储能调度方法及装置 | |
Sun et al. | Multi-objective optimization dispatching of a micro-grid considering uncertainty in wind power forecasting | |
Mandal et al. | Daily combined economic emission scheduling of hydrothermal systems with cascaded reservoirs using self organizing hierarchical particle swarm optimization technique | |
Yang et al. | DISTRIBUTED OPTIMAL DISPATCH OF VIRTUAL POWER PLANT BASED ON ELM TRANSFORMATION. | |
Han et al. | An autonomous control technology based on deep reinforcement learning for optimal active power dispatch | |
CN116454926B (zh) | 一种面向配网三相不平衡治理的多类型资源协同调控方法 | |
CN116451880B (zh) | 一种基于混合学习的分布式能源优化调度方法及装置 | |
CN114243797A (zh) | 一种分布式电源优化调度方法、系统、设备及存储介质 | |
CN118174355A (zh) | 一种微电网能量优化调度方法 | |
CN117172097A (zh) | 基于云边协同与多智能体深度学习的配电网调度运行方法 | |
Li et al. | Distributed deep reinforcement learning for integrated generation‐control and power‐dispatch of interconnected power grid with various renewable units | |
CN117039981A (zh) | 一种面向含新能源的大规模电网优化调度方法、装置、存储介质 | |
CN113141012A (zh) | 基于深度确定性策略梯度网络的电网潮流调控决策推理方法 | |
Dong et al. | Stochastic optimal scheduling strategy for a campus-isolated microgrid energy management system considering dependencies | |
CN117833316A (zh) | 一种用户侧储能动态优化运行的方法 | |
CN113837654B (zh) | 一种面向多目标的智能电网分层调度方法 | |
CN116896112A (zh) | 主动配电网分布式电源协同优化运行方法及系统 | |
CN114707613B (zh) | 基于分层的深度策略梯度网络的电网调控方法 | |
Li et al. | Short-Term Power Load Forecasting Based on ICEEMDAN-GRA-SVDE-BiGRU and Error Correction Model | |
Hu et al. | Prediction of river water quality based on neural network model | |
Qiu et al. | Distribution Network Topology Control Using Attention Mechanism-Based Deep Reinforcement Learning | |
Cao et al. | Day-ahead scheduling based on reinforcement learning with hybrid action space |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |