CN112381146B - 虚拟电厂下的分布式资源自组织聚合与协同控制方法 - Google Patents

虚拟电厂下的分布式资源自组织聚合与协同控制方法 Download PDF

Info

Publication number
CN112381146B
CN112381146B CN202011278673.5A CN202011278673A CN112381146B CN 112381146 B CN112381146 B CN 112381146B CN 202011278673 A CN202011278673 A CN 202011278673A CN 112381146 B CN112381146 B CN 112381146B
Authority
CN
China
Prior art keywords
adaptive
aggregation
self
organizing
main body
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011278673.5A
Other languages
English (en)
Other versions
CN112381146A (zh
Inventor
何光宇
周欢
肖居承
吴清
李志勇
邵洁
潘迪涵
宁道龙
温蜀陇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Qianguan Energy Saving Technology Co ltd
Hainan Electric Power School Hainan Electric Power Technical School
Shanghai Jiaotong University
Original Assignee
Shanghai Qianguan Energy Saving Technology Co ltd
Hainan Electric Power School Hainan Electric Power Technical School
Shanghai Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Qianguan Energy Saving Technology Co ltd, Hainan Electric Power School Hainan Electric Power Technical School, Shanghai Jiaotong University filed Critical Shanghai Qianguan Energy Saving Technology Co ltd
Priority to CN202011278673.5A priority Critical patent/CN112381146B/zh
Publication of CN112381146A publication Critical patent/CN112381146A/zh
Priority to US17/516,606 priority patent/US20220158487A1/en
Application granted granted Critical
Publication of CN112381146B publication Critical patent/CN112381146B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J15/00Systems for storing electric energy
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B15/00Systems controlled by a computer
    • G05B15/02Systems controlled by a computer electric
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/11Complex mathematical operations for solving equations, e.g. nonlinear equations, general mathematical optimization problems
    • G06F17/12Simultaneous equations, e.g. systems of linear equations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/08Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
    • G06Q10/083Shipping
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J3/00Circuit arrangements for ac mains or ac distribution networks
    • H02J3/28Arrangements for balancing of the load in a network by storage of energy
    • H02J3/32Arrangements for balancing of the load in a network by storage of energy using batteries with converting means
    • H02J3/322Arrangements for balancing of the load in a network by storage of energy using batteries with converting means the battery being on-board an electric or hybrid vehicle, e.g. vehicle to grid arrangements [V2G], power aggregation, use of the battery for network load balancing, coordinated or cooperative battery charging
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J3/00Circuit arrangements for ac mains or ac distribution networks
    • H02J3/38Arrangements for parallely feeding a single network by two or more generators, converters or transformers
    • H02J3/381Dispersed generators
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J2203/00Indexing scheme relating to details of circuit arrangements for AC mains or AC distribution networks
    • H02J2203/10Power transmission or distribution systems management focussing at grid-level, e.g. load flow analysis, node profile computation, meshed network optimisation, active network management or spinning reserve management
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02EREDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
    • Y02E40/00Technologies for an efficient electrical power generation, transmission or distribution
    • Y02E40/70Smart grids as climate change mitigation technology in the energy generation sector
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computational Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Power Engineering (AREA)
  • Operations Research (AREA)
  • Primary Health Care (AREA)
  • Water Supply & Treatment (AREA)
  • Public Health (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)

Abstract

本发明涉及电气工程及其自动化技术领域,具体提出了一种虚拟电厂下的分布式资源自组织聚合与协同控制方法,通过自组织聚合实现各个适应性主体间的相互协作,驱动整体朝节能降耗,提升虚拟电厂整体运行效率的方向演化,最终实现对海量分布式能源资源的动态耦合与协同控制;本方法能够通过主体的自组织聚合,实现资源的优化组合与协同控制,降低整体调控成本,显著提升虚拟电厂的运行效率;同时提出了虚拟电厂的多层级自组织聚合方法,为揭示系统的涌现机理提供了底层机制;且本方法提出了适应性主体自组织聚合的实现方法,能够快速、准确的求解适应性主体组合的最优联合行为及收益,加速自组织聚合的收敛过程,提升整体决策效率。

Description

虚拟电厂下的分布式资源自组织聚合与协同控制方法
技术领域
本发明涉及电气工程及其自动化技术领域,具体涉及一种虚拟电厂下的分布式资源自组织聚合与协同控制方法。
背景技术
现有的分布式能源资源协同控制方法一类是从博弈的角度研究分布式能源资源的相互作用,还有一类则采用分散式协同控制的方法实现分布式能源资源的相互协调。
现有方法存在以下缺点:(1)大多只关注系统最终收敛的“稳态”条件,且假设分布式能源资源具备完全信息且完全理性,在系统不均衡时会主动改变行为直到共同将系统推向稳态为止;(2)对于分布式能源资源相互作用的动态过程刻画不足,且没有将个体的状态、行为与环境特征有机结合,难以揭示系统质变的涌现机理。
基于上述问题的存在,本方案建立一种虚拟电厂下的分布式资源自组织聚合与协同控制方法。
发明内容
本发明的目的在于提供一种虚拟电厂下的分布式资源自组织聚合与协同控制方法,通过自组织聚合实现各个适应性主体间的相互协作,驱动整体朝节能降耗,提升虚拟电厂整体运行效率的方向演化。最终实现对海量分布式能源资源的动态耦合与协同控制。
为实现上述目的,本发明提供如下技术方案,虚拟电厂下的分布式资源自组织聚合与协同控制方法,包括以下步骤:
步骤一:定义适应性主体的自组织聚合的基本规则;
以两个主体为例,定义:
规则1:最小适应度聚合:
式中μA和μB分别表示未聚合前A和B的环境适应度,和/>分别表示聚合后A和B的环境适应度;
规则2:最大适应度聚合:
表示聚合后最大适应度个体得到提升;
规则3:平均适应度聚合:
表示聚合后整体的平均适应度得到提升;
规则4:自定义适应度聚合:
fμ为适应度的某个自定义函数,表示聚合后适应性主体朝既定的方向提升
基于所述基本原则,适应性主体能够实现从简单的个体聚合成为复杂的个体,即介主体;
步骤二:建立适应性主体动态自组织层级结构;
基于上述4条规则,适应性主体能够实现从简单的个体聚合成为复杂的个体,在CAS中称为介主体(Meta-Agents)。此时介主体之间、介主体与环境之间的相互作用发生了变化,介主体与介主体将继续聚合形成更大的主体,从而实现自下而上,逐级聚合的层级结构;
假设虚拟电厂是一个由适应性主体自组织形成的m层结构,则:
式中L(i)表示第i层结构,是由其下一层级L(i-1)的适应性主体按照一定规则形成的聚合体,x表示层级中的某个适应性主体;
定义第i层的聚合规则R(i)表示为:
式中Rulei代表是的是第i条规则,λk为第k条规则的权重系数,取值范围[0,1],且代数和为1。
步骤三:通过观察训练主体动态自组织层级结构,实现虚拟电厂下的资源的优化组合与协同控制。
当采用自下而上、自组织的方式对分布式能源资源进行聚合,虚拟电厂本身就可以视为一个分布式能源资源经过若干层级的聚合后形成的适应性主体,并且这种层级和组合方式都是动态变化的。虚拟电厂能够展现出多大的灵活性取决于下层个体如何联系、如何耦合、如何适应。因此,将虚拟电厂对分布式能源资源的控制这一优化问题转换成多主体协同演化的模拟问题,即通过观察分布式能源资源的演化过程实现分布式能源资源协同控制的目标。
与现有技术相比,本发明的有益效果是:
(1)本方法能够通过主体的自组织聚合,实现资源的优化组合与协同控制,降低整体调控成本,显著提升虚拟电厂的运行效率;
(2)提出了虚拟电厂的多层级自组织聚合方法,为揭示系统的涌现机理提供了底层机制;
(3)提出了适应性主体自组织聚合的实现方法,能够快速、准确的求解适应性主体组合的最优联合行为及收益,加速自组织聚合的收敛过程,提升整体决策效率。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明中适应性主体协同演化示意图;
图2为本发明中适应性主体多层级自组织体系结构;
图3为基于QMIX算法的适应性主体自组织聚合训练过程;
图4为基于QMIX算法的适应性主体在线自组织聚合流程。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
步骤1建立多主体协同演化模型
以度电成本为基础构建适应性主体适应性测度函数,定义:
式中E为某时段适应性主体的用电量,B为该时段的发电收益,且有B=E·Pc,Pc为该时段的电价;C为调控成本,取值与调控量为严格的凸函数关系;L为运维、惩罚等其他成本;R为环境的奖励值;ε为一个较大的正常数,确保分母不小于0;f(A)为适应性主体在某时段内的度电成本,为方便理解,取其倒数使得度电成本越低时,适应度越大。
步骤2基于QMIX算法的自组织聚合优化
2.1基于马尔科夫博弈的自组织过程
分布式能源资源的状态变化只依赖于当前时段的状态与行为,因此适应性主体的演化是一个马尔科夫过程;
采用马尔科夫博弈刻画适应性主体的自组织聚合,以如下五元组对该过程进行定义:
<N,S,A1,…,An,T,R1,…Rn> (7)
其中N={1,2,…,n}表示n个适应性主体,S为适应性主体组合的联合状态空间,Ai表示第i个适应性主体的动作空间,T为联合行为的状态转移矩阵,Ri为第i个适应性主体所得的回报。
2.2多主体强化学习目标
多主体强化学习的目标可以表示为下式:
式中:s∈S,代表适应性主体组合后某种状态组合,πi(s,ai)代表第i个适应性主体在状态为s的情况下采取策略πi的动作为ai;Vi(s)为第i种组合在状态为s的条件下的状态值函数,Qi(s)则为该状态下的动作值函数,在分布式能源资源的自组织聚合问题中,Q值为组织中个体适应度的代数和,即*号代表该值的理论最优值,γ为折扣因子。
2.3QMIX算法及训练流程
QMIX算法是由Tabish Rashid提出的一种高效的值函数分解算法,算法在VDN算法的基础上,采用一个混合网络对适应性主体局部值函数进行合并,并在训练学习过程中加入全局状态信息辅助提高算法性能。
基于QMIX算法的训练过程如图3,主要包括基于DRQN的适应性主体代理网络训练和基于混合网络的全局训练两部分;
1)基于DRQN的适应性主体代理网络训练
首先,单个适应性主体无法获得完整全局状态,是一个部分可观马尔科夫决策过程,采用DRQN对部分可观测条件下适应性主体的决策行为及Q值进行求解;算法的基本功能可以表述为:
即通过输入为当前的观测即组合中其他适应性主体采取的动作,以及上一时刻的自身的动作/>来得到当前时刻的动作/>和Q值,并记录样本;其中/>为第i个适应性主体从初始状态开始,适应性主体动作-观测的样本记录;
DRQN在DQN的结构上,将卷积层最后一层的全连接层替换为LSTM模型的变种GRU,并通过ht记录t时段隐藏层的状态参数。
2)基于混合网络的全局训练
QMIX采用集中式学习的方法得到分布式策略,联合动作值函数的训练过程并不记录每一个适应性主体的值,只需要确保联合值函数上执行的最优行为和每个适应性主体上执行的最优行为集产生相同的结果:
式中argmaxQi为第i个适应性主体动作值函数的最大Q值,argmaxQtot为联合值函数的最大Q值;如此,每个适应性主体在训练过程中只需要采用贪婪策略选择动作ai使得argmaxQi最大化来参与分散决策过程;
为使式(10)成立,QMIX将其转换成单调性约束,并采用混合网络来实现:
混合网络的基本功能可以表述为:
即混合网络通过输入各适应性主体在t时段采取的最优动作Q值以及系统的状态st;输出为混合网络的权值Wj和偏移量b;为确保权值非负,采用线性网络以及绝对值激活函数保证输出不为负,混合网络最后一层的偏移量通过两层网络以及ReLU激活函数得到非线性映射网络;
QMIX的全局训练损失函数为:
式中为第i个全局样本,θ为网络参数;
通过上述集中训练方法,任意适应性主体组合在判断“融合”还是“分裂”时,能够快速的求得该组合的最大适应度及对应的最优联合行为,适应性主体在线自组织聚合的基本流程如图4。
在本说明书的描述中,参考术语“一个实施例”、“示例”、“具体示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
以上公开的本发明优选实施例只是用于帮助阐述本发明。优选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本说明书的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本发明的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本发明。本发明仅受权利要求书及其全部范围和等效物的限制。

Claims (4)

1.虚拟电厂下的分布式资源自组织聚合与协同控制方法,其特征在于,包括以下步骤:
步骤一:定义适应性主体的自组织聚合的基本规则;
基于所述基本原则,适应性主体能够实现从简单的个体聚合成为复杂的个体,即介主体;
步骤二:建立适应性主体动态自组织层级结构;
基于步骤一,介主体之间、介主体与环境之间的相互作用发生了变化,设计聚合规则,使得介主体与介主体之间继续聚合形成更大的主体,从而形成自下而上,逐级聚合的层级结构;
步骤三:通过观察训练主体动态自组织层级结构,实现虚拟电厂下的资源的优化组合与协同控制;
步骤一中,以度电成本为基础构建适应性主体适应性测度函数,定义:
式中E为某时段适应性主体的用电量,B为该时段的发电收益,且有B=E·Pc,Pc为该时段的电价;C为调控成本,取值与调控量为严格的凸函数关系;L为运维、惩罚成本;R为环境的奖励值;ε为一个较大的正常数,确保分母不小于0;f(A)为适应性主体在某时段内的度电成本,为方便理解,取其倒数使得度电成本越低时,适应度越大;
步骤二中,设计聚合规则,其步骤如下;
假设虚拟电厂是一个由适应性主体自组织形成的m层结构,则:
式中L(i)表示第i层结构,是由其下一层级L(i-1)的适应性主体按照一定规则形成的聚合体,x表示层级中的某个适应性主体;
定义第i层的聚合规则R(i)表示为:
式中Rulei代表是的是第i条规则,λk为第k条规则的权重系数,取值范围[0,1],且代数和为1;
步骤三中,采用QMIX算法对适应性主体进行训练,主要包括基于DRQN的适应性主体代理网络训练和基于混合网络的全局训练两部分;
基于DRQN的适应性主体代理网络训练的过程如下:
首先,单个适应性主体无法获得完整全局状态,是一个部分可观马尔科夫决策过程,采用DRQN对部分可观测条件下适应性主体的决策行为及Q值进行求解;算法的基本功能可以表述为:
即通过输入为当前的观测即组合中其他适应性主体采取的动作,以及上一时刻的自身的动作/>来得到当前时刻的动作/>和Q值,并记录样本;其中/>为第i个适应性主体从初始状态开始,适应性主体动作-观测的样本记录;
DRQN在DQN的结构上,将卷积层最后一层的全连接层替换为LSTM模型的变种GRU,并通过ht记录t时段隐藏层的状态参数;
基于混合网络的全局训练的步骤如下:
QMIX采用集中式学习的方法得到分布式策略,联合动作值函数的训练过程并不记录每一个适应性主体的值,只需要确保联合值函数上执行的最优行为和每个适应性主体上执行的最优行为集产生相同的结果:
式中argmaxQi为第i个适应性主体动作值函数的最大Q值,argmaxQtot为联合值函数的最大Q值;如此,每个适应性主体在训练过程中只需要采用贪婪策略选择动作ai使得argmaxQi最大化来参与分散决策过程;
为使式(10)成立,QMIX将其转换成单调性约束,并采用混合网络来实现:
混合网络的基本功能可以表述为:
即混合网络通过输入各适应性主体在t时段采取的最优动作Q值以及系统的状态st;输出为混合网络的权值Wj和偏移量b;为确保权值非负,采用线性网络以及绝对值激活函数保证输出不为负,混合网络最后一层的偏移量通过两层网络以及ReLU激活函数得到非线性映射网络;
QMIX的全局训练损失函数为:
式中为第i个全局样本,θ为网络参数;
通过式(9)-(13)的训练方法,任意适应性主体组合在判断“融合”还是“分裂”时,能够快速的求得该组合的最大适应度及对应的最优联合行为。
2.根据权利要求1所述的虚拟电厂下的分布式资源自组织聚合与协同控制方法,其特征在于:
步骤一中,定义适应性主体相互作用的基本规则,以两个主体为例,定义:
规则一:最小适应度聚合:
式中μA和μB分别表示未聚合前A和B的环境适应度,和/>分别表示聚合后A和B的环境适应度;
规则二:最大适应度聚合:
表示聚合后最大适应度个体得到提升;
规则三:平均适应度聚合:
表示聚合后整体的平均适应度得到提升;
规则四:自定义适应度聚合:
fμ为适应度的某个自定义函数,表示聚合后适应性主体朝既定的方向提升。
3.根据权利要求2所述的虚拟电厂下的分布式资源自组织聚合与协同控制方法,其特征在于,采用马尔科夫博弈刻画适应性主体的自组织聚合,以如下五元组对该过程进行定义:
<N,S,A1,…,An,T,R1,…Rn> (7)
其中N={1,2,…,n}表示n个适应性主体,S为适应性主体组合的联合状态空间,Ai表示第i个适应性主体的动作空间,T为联合行为的状态转移矩阵,Ri为第i个适应性主体所得的回报。
4.根据权利要求3所述的虚拟电厂下的分布式资源自组织聚合与协同控制方法,其特征在于,多主体强化学习的目标可以表示为下式:
式中:s∈S,代表适应性主体组合后某种状态组合,πi(s,ai)代表第i个适应性主体在状态为s的情况下采取策略πi的动作为ai;Vi(s)为第i种组合在状态为s的条件下的状态值函数,Qi(s)则为该状态下的动作值函数,在分布式能源资源的自组织聚合问题中,Q值为组织中个体适应度的代数和,即*号代表该值的理论最优值,γ为折扣因子。
CN202011278673.5A 2020-11-16 2020-11-16 虚拟电厂下的分布式资源自组织聚合与协同控制方法 Active CN112381146B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202011278673.5A CN112381146B (zh) 2020-11-16 2020-11-16 虚拟电厂下的分布式资源自组织聚合与协同控制方法
US17/516,606 US20220158487A1 (en) 2020-11-16 2021-11-01 Self-organizing aggregation and cooperative control method for distributed energy resources of virtual power plant

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011278673.5A CN112381146B (zh) 2020-11-16 2020-11-16 虚拟电厂下的分布式资源自组织聚合与协同控制方法

Publications (2)

Publication Number Publication Date
CN112381146A CN112381146A (zh) 2021-02-19
CN112381146B true CN112381146B (zh) 2024-05-21

Family

ID=74584670

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011278673.5A Active CN112381146B (zh) 2020-11-16 2020-11-16 虚拟电厂下的分布式资源自组织聚合与协同控制方法

Country Status (2)

Country Link
US (1) US20220158487A1 (zh)
CN (1) CN112381146B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112418636B (zh) * 2020-11-17 2024-03-22 海南省电力学校(海南省电力技工学校) 虚拟电厂自组织聚合运行调度方法
CN115049323B (zh) * 2022-08-16 2022-11-15 东方电子股份有限公司 一种基于分布式资源协同的虚拟电厂监督系统
CN115663804A (zh) * 2022-11-02 2023-01-31 深圳先进技术研究院 基于深度强化学习的电力系统调控方法
CN117539640B (zh) * 2024-01-09 2024-03-26 南京邮电大学 一种面向异构推理任务的边端协同系统及资源分配方法
CN117592621B (zh) * 2024-01-19 2024-04-23 华北电力大学 一种虚拟电厂集群两阶段调度优化方法
CN118017523A (zh) * 2024-04-09 2024-05-10 杭州鸿晟电力设计咨询有限公司 一种电力系统的电压控制方法、装置、设备及介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008132924A1 (ja) * 2007-04-13 2008-11-06 Nec Corporation 仮想計算機システムおよびその最適化方法
CN102111295A (zh) * 2011-01-06 2011-06-29 哈尔滨工程大学 分布式系统中多层次测度网络关系构建方法
GB202004421D0 (en) * 2020-03-26 2020-05-13 Centrica Business Solutions Belgium N V System for demand response coordination across multiple assest pools
CN111915125A (zh) * 2020-06-08 2020-11-10 清华大学 虚拟电厂多类型资源优化组合方法及系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140310243A1 (en) * 2010-08-16 2014-10-16 Mr. Steven James McGee Heart beacon cycle

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008132924A1 (ja) * 2007-04-13 2008-11-06 Nec Corporation 仮想計算機システムおよびその最適化方法
CN102111295A (zh) * 2011-01-06 2011-06-29 哈尔滨工程大学 分布式系统中多层次测度网络关系构建方法
GB202004421D0 (en) * 2020-03-26 2020-05-13 Centrica Business Solutions Belgium N V System for demand response coordination across multiple assest pools
CN111915125A (zh) * 2020-06-08 2020-11-10 清华大学 虚拟电厂多类型资源优化组合方法及系统

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
An adaptive decentralized economic dispatch method for virtual power plant;Lianxin Dong 等;《Applied Energy》;1-15 *
Optimal Operation of Virtual Power Plant Considering Power-to-Hydrogen Systems;Yan Meng 等;《2022 IEEE Power & Energy Society General Meeting (PESGM)》;1-5 *
基于双层模糊机会约束规划的虚拟电厂优化调度;段翩 等;《电工技术学报》;第31卷(第9期);58-67 *
多能互补微网鲁棒多目标运行优化;王鲁浩;《中国博士学位论文全文数据库 (工程科技Ⅱ辑)》;C042-70 *
虚拟电厂自组织聚合运行调度方法;王芬 等;《电力建设》;第42卷(第4期);79-88 *

Also Published As

Publication number Publication date
CN112381146A (zh) 2021-02-19
US20220158487A1 (en) 2022-05-19

Similar Documents

Publication Publication Date Title
CN112381146B (zh) 虚拟电厂下的分布式资源自组织聚合与协同控制方法
CN107769237B (zh) 基于电动汽车接入的多能源系统协同调度方法及装置
CN104636801B (zh) 一种基于优化bp神经网络的预测输电线路可听噪声方法
Song et al. Coordinated optimization on energy capture and torque fluctuation of wind turbines via variable weight NMPC with fuzzy regulator
Huang et al. An integrated computational intelligence approach to product concept generation and evaluation
CN106920008A (zh) 一种基于改进粒子群优化bp神经网络的风电功率预测方法
CN109193756B (zh) 一种风电接入系统的场景解耦动态经济调度模型求解方法
CN114362196A (zh) 一种多时间尺度主动配电网电压控制方法
CN114217524A (zh) 一种基于深度强化学习的电网实时自适应决策方法
CN113363998A (zh) 一种基于多智能体深度强化学习的配电网电压控制方法
CN104734175A (zh) 一种实现风电机组风速功率曲线的智能修正方法
CN110264012A (zh) 基于经验模态分解的可再生能源功率组合预测方法及系统
CN108764588A (zh) 一种基于深度学习的温度影响电力预测方法
CN114358520A (zh) 一种电力系统经济调度决策的方法、系统、装置及介质
CN111861231A (zh) 一种基于决策树的飞行训练特情智能生成方法
CN114679372A (zh) 一种基于节点相似性的图注意力网络的链路预测方法
CN112564189A (zh) 一种有功无功协调优化控制方法
CN109950933B (zh) 一种基于改进粒子群算法的风光储联合调峰优化方法
CN110532057A (zh) 一种容器的资源使用量预测方法
CN116542137A (zh) 一种分布式资源协同调度的多智能体强化学习方法
CN116306270A (zh) 一种预测燃料电池性能及关键输入参数寻优的方法
CN114362151B (zh) 一种基于深度强化学习和级联图神经网络的潮流收敛性调整方法
CN113884928B (zh) 一种基于燃料电池健康度校正的多堆分布式控制方法
CN115759775A (zh) 一种考虑公平性的ncfi碳排放责任分摊方法及装置
CN110210113B (zh) 基于确定性策略梯度的风电场动态等值参数智能校核方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant