CN114372645A - 基于多智能体强化学习的供能系统优化方法及系统 - Google Patents

基于多智能体强化学习的供能系统优化方法及系统 Download PDF

Info

Publication number
CN114372645A
CN114372645A CN202210281045.5A CN202210281045A CN114372645A CN 114372645 A CN114372645 A CN 114372645A CN 202210281045 A CN202210281045 A CN 202210281045A CN 114372645 A CN114372645 A CN 114372645A
Authority
CN
China
Prior art keywords
agent
energy
reinforcement learning
supply system
energy supply
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210281045.5A
Other languages
English (en)
Inventor
刘帅
周飞龙
王瑞琪
王小文
赵浩然
孙波
张洪亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong University
Original Assignee
Shandong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong University filed Critical Shandong University
Priority to CN202210281045.5A priority Critical patent/CN114372645A/zh
Publication of CN114372645A publication Critical patent/CN114372645A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Marketing (AREA)
  • General Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Public Health (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Water Supply & Treatment (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了一种基于多智能体强化学习的供能系统优化方法及系统,属于综合能源系统的设计及其运行优化技术领域,获取多源分布式供能系统的运行参量数据;根据获取的运行参量数据,以经济效益最大和能源利用率最大构建目标函数,采用多智能体强化学习算法对目标函数进行求解,得到各能源单元对应的智能体优化控制策略;其中,目标函数中还包括各个智能体之间的收益偏差最小的目标;本发明实现了功能系统各智能体的控制策略优化,极大的提高了多源能源系统的控制能力。

Description

基于多智能体强化学习的供能系统优化方法及系统
技术领域
本发明涉及综合能源系统的设计及其运行优化技术领域,特别涉及一种基于多智能体强化学习的供能系统优化方法及系统。
背景技术
本部分的陈述仅仅是提供了与本发明相关的背景技术,并不必然构成现有技术。
目前,对可再生能源的高效率利用成为了研究的重点。一些小型园区或者居民区可用土地面积广阔,且易于搭建能源供应网络,所以针对于园区的可再生综合能源系统是综合能源系统利用的重要试点地。
当前的分布式能源系统主要是单一能源的利用,例如分布式光伏,分布式天然气等,单一能源的分布式供能方式在一定程度上会造成占用场地过大,难以支撑较大的区域用电或者能源浪费较多等问题;而多源的分布式供能方式则会造成能源转化多样性和能源的生产比例动态性,这会使机组的结构十分复杂,耦合关系比较强,而且对不同能源的供应控制也是一个比较困难的问题;由于不同能源的生产比例或者供应方式也会关乎到收益问题和能否按照实际所需对园区进行能源供应,同时也会面临着数据搜集和分析以及效益评估等多种影响收益和供给度因素的影响,现有的优化控制系统或者人工控制难以做到全方位因素的优化和实时的优化。
发明内容
为了解决现有技术的不足,本发明提供了一种基于多智能体强化学习的供能系统优化方法及系统,实现了功能系统各智能体的控制策略优化,极大的提高了多源能源系统的控制能力。
为了实现上述目的,本发明采用如下技术方案:
本发明第一方面提供了一种基于多智能体强化学习的供能系统优化方法。
一种基于多智能体强化学习的供能系统优化方法,包括以下过程:
获取多源分布式供能系统的运行参量数据;
根据获取的运行参量数据,以经济效益最大和能源利用率最大构建目标函数,采用多智能体强化学习算法对目标函数进行求解,得到各能源单元对应的智能体优化控制策略;
其中,目标函数中还包括各个智能体之间的收益偏差最小的目标。
本发明第二方面提供了一种基于多智能体强化学习的供能系统优化系统。
一种基于多智能体强化学习的供能系统优化系统,包括:
数据获取模块,被配置为:获取多源分布式供能系统的运行参量数据;
优化控制模块,被配置为:根据获取的运行参量数据,以经济效益最大和能源利用率最大构建目标函数,采用多智能体强化学习算法对目标函数进行求解,得到各能源单元对应的智能体优化控制策略;
其中,目标函数中还包括各个智能体之间的收益偏差最小的目标。
与现有技术相比,本发明的有益效果是:
1、本发明所述的基于多智能体强化学习的供能系统优化方法及系统,实现了功能系统各智能体的控制策略优化,极大的提高了多源能源系统的控制能力。
2、本发明所述的基于多智能体强化学习的供能系统优化方法及系统,既考虑了对能源的综合利用又兼顾了其能源利用率和经济效益,使得系统更加稳定,收敛速度更快。
3、本发明所述的基于多智能体强化学习的供能系统优化方法及系统,通过MADDPG算法求解分布式能源调度优化模型,对模型的适应性较强,通过对历史数据的学习选择最优策略,有效地提高了能源利用效率和经济效益。
4、本发明所述的基于多智能体强化学习的供能系统优化方法及系统,采用强化学习的方法训练所构建的分布式供能网络,证明了非线性模拟函数的准确性和高性能、可收敛,所设计的在线网络和目标网络,使得强化学习的过程更加稳定,收敛速度更快。
本发明附加方面的优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
构成本发明的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。
图1为本发明实施例1提供的分布式综合能源系统的结构示意图。
图2为本发明实施例1提供的基于多智能体强化学习的供能系统优化方法的原理示意图。
图3为本发明实施例1提供的基于多智能体强化学习的供能系统优化方法的流程示意图。
具体实施方式
下面结合附图与实施例对本发明作进一步说明。
应该指出,以下详细说明都是示例性的,旨在对本发明提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本发明的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
实施例1:
如图1、图2和图3所示,本发明实施例提供了一种分布式的综合能源系统,同时给出了该综合能源系统的运行优化方法。本实施例所述系统使用光伏、风力和生物质燃气供电,使用生物质燃气供气,是一种多源的供能系统。其每一种能源由单一的智能体进行控制,综合考虑不同时段能源的供需平衡,经济效益等因素,对得到的能源输出,能源消耗量和经济效益做出计算,由多个智能体进行信息共享,最终找到全局最优的解决方案,控制光伏和风力发电的运行功率以及生物质燃气的能源分派(供气量和用来发电量),最终得到所要的优化目标。
具体的,包括以下内容:
S1:利用实地考察的方式和统计学方法获取综合能源系统安装所在地的地理位置、历史用能数据、预测用能数据和日期用能特征数据等,确定综合能源系统的搭建规模和位置。
S2:建立分布式综合能源系统的控制模型,确定系统目标函数和相关约束条件,形成原始优化问题。
(1)本实施例在单一智能体强化学习优化模型的基础上,综合考虑了分布式能源的运行情况,建立以经济效益和能源利用率最大为目标的多目标优化控制模型。
经济效益最大问题:
Figure 490835DEST_PATH_IMAGE001
(1)
对于一个拥有m个智能体(分布式能源)的系统,每个智能体都有自己的局部目标函数
Figure 656368DEST_PATH_IMAGE002
,表示其经济效益,其
Figure 598916DEST_PATH_IMAGE003
表示优化变量,为
Figure 36851DEST_PATH_IMAGE004
的形式。
Figure 519785DEST_PATH_IMAGE005
(2)
其中,
Figure 992354DEST_PATH_IMAGE006
表示各个分布式模块在各个时段的能源输出的收益,Co表示能源并网量,p表示价格,Cm表示运维成本。
能源利用率最大化问题:
Figure 105804DEST_PATH_IMAGE007
(3)
局部目标函数
Figure 339689DEST_PATH_IMAGE008
表示其能源利用率。
Figure 563997DEST_PATH_IMAGE009
(4)
其中,
Figure 687811DEST_PATH_IMAGE010
表示能源需求量,
Figure 972162DEST_PATH_IMAGE011
表示能源生产量。
(2)本实施例在运行中受到约束,主要是供需平衡的约束
Figure 384689DEST_PATH_IMAGE012
(5)
Figure 225737DEST_PATH_IMAGE013
(6)
其中,第一个约束表示供电量
Figure 407319DEST_PATH_IMAGE014
与需求量
Figure 596992DEST_PATH_IMAGE015
的差值在一定的范围内,其中
Figure 559132DEST_PATH_IMAGE016
为下限,
Figure 125243DEST_PATH_IMAGE017
为上限,下限目的是对供电量留有一定裕度,防止突然增加的能源需求,第二个约束是供气量
Figure 738496DEST_PATH_IMAGE018
与需求量
Figure 99070DEST_PATH_IMAGE019
差值,原理同第一个约束。
S3:定好优化目标以及约束之后,将分布式能源分布式优化问题转化为多智能体强化学习寻求最优控制策略的问题。
首先将该问题进一步建模表示为
Figure 486189DEST_PATH_IMAGE020
(7)
其中,I表示智能体的集合,S表示有限状态集合(目前的能源供需);
Figure 918307DEST_PATH_IMAGE021
表示智能体
Figure 808903DEST_PATH_IMAGE023
的有限动作集合(表示为风光系统的功率控制,以及生物质燃气的控制和分派),
Figure 419007DEST_PATH_IMAGE024
表示为动作选择的概率,R表示得到的奖赏(表示为经济效益和能源利用率的加权和,也就是优化目标)。
设置惩罚项,当智能体的供给状态不满足约束条件时,视为惩罚项,将受益直接置零,会使得智能体调整供给策略,在满足供需问题时才会进一步考虑经济效益和能量利用率的问题。
S4:多智能体强化学习中的智能体合作问题。
每一个管控能源的智能体可能会面临着追求自身短期利益而做出损害长期利益的行为,例如在控制风、光和气的智能体可能为因为自己的经济效益和能源利用率最大而忽略其他智能体的收益,从而对全局收益造成影响。因此在决策中引入一种奖励方法,促进智能体之间的合作。假定每一个智能体关心自己与其他个体的收益偏差,那么其会在学习过程中寻求一个平衡,既保持自身对独立奖励的渴望,也保证与他人的奖励偏差在一定的范围内。
其方法模型如下:
Figure 27843DEST_PATH_IMAGE025
(8)
其中:
Figure 201335DEST_PATH_IMAGE026
为智能体的动作,F i 、F j 、F k 为每个动作下的收益函数,
Figure 274333DEST_PATH_IMAGE027
分别为可变系数,其决定了上述迭代过程中各个智能体对其他智能体收益的逼近程度。
S5:模型求解得到最优目标。在前面几个步骤将能源系统的最优运行以及问题初步定义。对分布式能源系统来说,它能够检测到系统的供给量和需求量,也能计算出单个智能体系统的过去时段内能源利用率和经济效益。因此可以通过这些历史数据得到一个策略将优化问题看成是一个寻求最优策略的问题。也就是说控制系统可以根据园区的历史用电量和用气量和自身的状态来进行下一步动作的预估,从下一步的所有策略中寻求一个最优的策略。
假设每一个智能体的策略参数表示成一个策略参数集合
Figure 242289DEST_PATH_IMAGE028
Figure 338421DEST_PATH_IMAGE029
表示m个智能体的策略集合。
针对该能源系统,优化目标为经济效益和能源利用率。
定义奖励:
Figure 364539DEST_PATH_IMAGE030
(9)
其中,r i,t 为当前时刻的奖励,αω为权值,f i g i 为前文定义的优化目标。
针对第i个智能体的累计期望奖励:
Figure 229727DEST_PATH_IMAGE031
(10)
其中,E为期望,s为状态分布,α为动作分布,γ为折扣率,
Figure 430901DEST_PATH_IMAGE032
表示随着时间的推移,未来的收益对策略的影响变小。
针对随机策略,求解策略梯度期望:
Figure 14329DEST_PATH_IMAGE033
(11)
其中,oi表示第i个智能体的观测,πi表示当前智能体的策略函数,E为期望,s为当前时刻智能体的控制状态,
Figure 264045DEST_PATH_IMAGE034
表示第i个智能体的各自的动作价值函数,由于是每个智能体独立学习自己的
Figure 62368DEST_PATH_IMAGE035
函数,因此每个智能体可以有不同的奖励函数,同时利用步骤四的最小化偏差收益,因此可以完成合作任务。
下面我们拓展到确定性策略
Figure 372127DEST_PATH_IMAGE036
,梯度公式为:
Figure 442851DEST_PATH_IMAGE037
(12)
Figure 558574DEST_PATH_IMAGE038
是上述中提到的针对每个智能体建立的动作价值函数,D是一个经验存储,元素组成为
Figure 398354DEST_PATH_IMAGE039
。θ为策略参数集,αi表示智能体的动作,oi表示智能体对环境的观测值,
Figure 190599DEST_PATH_IMAGE040
为当前状态下的策略梯度。
在实际智能体对分布式能源系统进行调节时,由于每个智能体的策略都在更新迭代,从而导致每个分布式能源的智能体所面对的环境也处在不断变化之中。
为了解决上述环境动态变换所引起的迭代不收敛问题,我们让某个智能体的策略μi由一个具有K个子策略的集合构成,在每一个训练的情节中只是用一个子策略
Figure 483040DEST_PATH_IMAGE041
(简写为
Figure 340137DEST_PATH_IMAGE042
),对每一个智能体,我们最大化其策略集合的整体奖励:
Figure 96741DEST_PATH_IMAGE043
(13)
其中,E为期望,s为状态分布,α为动作分布,γ为折扣率,
Figure 748302DEST_PATH_IMAGE044
表示随着时间的推移,未来的收益对策略的影响变小。k表示K集中的一个策略。
并且我们为每一个子策略k构建一个记忆存储
Figure 793619DEST_PATH_IMAGE045
,优化策略集合的整体效果,因此针对每一个子策略的更新梯度为:
Figure 1877DEST_PATH_IMAGE046
(14)
Figure 550670DEST_PATH_IMAGE047
是上述中提到的针对每个智能体建立的动作价值函数,D是一个经验存储,元素组成为
Figure 701029DEST_PATH_IMAGE048
,θ为策略参数集。αi表示智能体的动作,oi表示智能体对环境的观测值。
Figure DEST_PATH_IMAGE049
为当前状态下的策略梯度。
通过利用历史数据进行上述的策略迭代,实现奖励最大化。最终得到分布式供能单元的最优策略行为,从而实现了对供能系统的运行优化。在满足用户需求下,对能源系统调度运行达到最大的经济效益和能源利用。
实施例2:
本发明实施例2提供了一种基于多智能体强化学习的供能系统优化系统,包括:
数据获取模块,被配置为:获取多源分布式供能系统的运行参量数据;
优化控制模块,被配置为:根据获取的运行参量数据,以经济效益最大和能源利用率最大构建目标函数,采用多智能体强化学习算法对目标函数进行求解,得到各能源单元对应的智能体优化控制策略;
其中,目标函数中还包括各个智能体之间的收益偏差最小的目标。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random AccessMemory,RAM)等。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种基于多智能体强化学习的供能系统优化方法,其特征在于:
包括以下过程:
获取多源分布式供能系统的运行参量数据;
根据获取的运行参量数据,以经济效益最大和能源利用率最大构建目标函数,采用多智能体强化学习算法对目标函数进行求解,得到各能源单元对应的智能体优化控制策略;
其中,目标函数中还包括各个智能体之间的收益偏差最小的目标。
2.如权利要求1所述的基于多智能体强化学习的供能系统优化方法,其特征在于:
所述目标函数包括约束:供电量与需求量的差值在预设范围内。
3.如权利要求2所述的基于多智能体强化学习的供能系统优化方法,其特征在于:
所述目标函数包括约束:供气量与需求量的差值在预设范围内。
4.如权利要求3所述的基于多智能体强化学习的供能系统优化方法,其特征在于:
当智能体的供给状态不满足约束条件时,视为惩罚项,将收益直接置零,使得智能体调整供给策略,在满足约束条件进行优化控制。
5.如权利要求1所述的基于多智能体强化学习的供能系统优化方法,其特征在于:
经济效益最大为各能源单元对应的经济效益的加和的最大化。
6.如权利要求1所述的基于多智能体强化学习的供能系统优化方法,其特征在于:
能源利用率最大化各能源单元对应的能源利用率的加和的最大化。
7.如权利要求1所述的基于多智能体强化学习的供能系统优化方法,其特征在于:
所述供能系统使用光伏、风力和生物质燃气供电,使用生物质燃气供气;
优化控制策略包括:光伏发电和风力发电的最优运行功率以及生物质燃气的最优能源分派。
8.一种基于多智能体强化学习的供能系统优化系统,其特征在于:
包括:
数据获取模块,被配置为:获取多源分布式供能系统的运行参量数据;
优化控制模块,被配置为:根据获取的运行参量数据,以经济效益最大和能源利用率最大构建目标函数,采用多智能体强化学习算法对目标函数进行求解,得到各能源单元对应的智能体优化控制策略;
其中,目标函数中还包括各个智能体之间的收益偏差最小的目标。
9.如权利要求8所述的基于多智能体强化学习的供能系统优化系统,其特征在于:
所述目标函数包括约束:供电量与需求量的差值在预设范围内,供气量与需求量的差值在预设范围内。
10.如权利要求9所述的基于多智能体强化学习的供能系统优化系统,其特征在于:
当智能体的供给状态不满足约束条件时,视为惩罚项,将收益直接置零,使得智能体调整供给策略,在满足约束条件进行优化控制。
CN202210281045.5A 2022-03-22 2022-03-22 基于多智能体强化学习的供能系统优化方法及系统 Pending CN114372645A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210281045.5A CN114372645A (zh) 2022-03-22 2022-03-22 基于多智能体强化学习的供能系统优化方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210281045.5A CN114372645A (zh) 2022-03-22 2022-03-22 基于多智能体强化学习的供能系统优化方法及系统

Publications (1)

Publication Number Publication Date
CN114372645A true CN114372645A (zh) 2022-04-19

Family

ID=81146532

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210281045.5A Pending CN114372645A (zh) 2022-03-22 2022-03-22 基于多智能体强化学习的供能系统优化方法及系统

Country Status (1)

Country Link
CN (1) CN114372645A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117252043A (zh) * 2023-11-17 2023-12-19 山东大学 针对区域多能互补能源系统的多目标优化调度方法及装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110728406A (zh) * 2019-10-15 2020-01-24 南京邮电大学 基于强化学习的多智能体发电优化调度方法
CN111291890A (zh) * 2020-05-13 2020-06-16 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) 一种博弈策略优化方法、系统及存储介质
CN112419775A (zh) * 2020-08-12 2021-02-26 华东师范大学 基于强化学习的数字孪生智慧停车方法及系统
CN113609778A (zh) * 2021-08-11 2021-11-05 山东大学 一种综合能源系统多目标优化方法及系统
CN113902040A (zh) * 2021-11-15 2022-01-07 中国电力科学研究院有限公司 电-热综合能源系统协调优化方法、系统、设备及存储介质
CN114091759A (zh) * 2021-11-23 2022-02-25 山东大学 一种综合能源系统多层博弈优化运行方法及系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110728406A (zh) * 2019-10-15 2020-01-24 南京邮电大学 基于强化学习的多智能体发电优化调度方法
CN111291890A (zh) * 2020-05-13 2020-06-16 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) 一种博弈策略优化方法、系统及存储介质
CN112419775A (zh) * 2020-08-12 2021-02-26 华东师范大学 基于强化学习的数字孪生智慧停车方法及系统
CN113609778A (zh) * 2021-08-11 2021-11-05 山东大学 一种综合能源系统多目标优化方法及系统
CN113902040A (zh) * 2021-11-15 2022-01-07 中国电力科学研究院有限公司 电-热综合能源系统协调优化方法、系统、设备及存储介质
CN114091759A (zh) * 2021-11-23 2022-02-25 山东大学 一种综合能源系统多层博弈优化运行方法及系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117252043A (zh) * 2023-11-17 2023-12-19 山东大学 针对区域多能互补能源系统的多目标优化调度方法及装置
CN117252043B (zh) * 2023-11-17 2024-04-09 山东大学 针对区域多能互补能源系统的多目标优化调度方法及装置

Similar Documents

Publication Publication Date Title
Gharehchopogh et al. A comprehensive survey on symbiotic organisms search algorithms
Liao et al. An adaptive artificial bee colony algorithm for long-term economic dispatch in cascaded hydropower systems
Lin et al. Hierarchical model predictive control of Venlo-type greenhouse climate for improving energy efficiency and reducing operating cost
Siahkali et al. Electricity generation scheduling with large-scale wind farms using particle swarm optimization
CN110276698A (zh) 基于多智能体双层协同强化学习的分布式可再生能源交易决策方法
CN111561732B (zh) 基于人工智能的换热站供热调节方法及系统
Ji et al. Inexact stochastic risk-aversion optimal day-ahead dispatch model for electricity system management with wind power under uncertainty
CN104915737A (zh) 基于风险控制含大规模风电的电力系统协调经济调度方法
CN109149648A (zh) 一种自适应宽度动态规划智能发电控制方法
CN112686571A (zh) 基于动态自适应建模的综合智慧能源优化调度方法及系统
Pandey et al. Applications of artificial intelligence in power system operation, control and planning: a review
Niu et al. Cooperation search algorithm for power generation production operation optimization of cascade hydropower reservoirs
CN114372645A (zh) 基于多智能体强化学习的供能系统优化方法及系统
Yang et al. Data-driven optimal dynamic dispatch for hydro-PV-PHS integrated power system using deep reinforcement learning approach
CN113765154B (zh) 一种高弹性电网源网荷储多元协同优化控制方法
Ghavifekr Application of heuristic techniques and evolutionary algorithms in microgrids optimization problems
Anwar et al. Proximal policy optimization based reinforcement learning for joint bidding in energy and frequency regulation markets
Shi et al. Ultra-short-term wind power interval prediction based on multi-task learning and generative critic networks
Feng et al. Adaptive Neural-Based fuzzy inference system and cooperation search algorithm for simulating and predicting discharge time series under hydropower reservoir operation
Zhang et al. Flexible selection framework for secondary frequency regulation units based on learning optimisation method
Shi et al. Rolling horizon wind-thermal unit commitment optimization based on deep reinforcement learning
Ji et al. Total consumption controlled water allocation management for multiple sources and users with inexact fuzzy chance-constrained programming: a case study of Tianjin, China
Zois et al. Integrated platform for automated sustainable demand response in smart grids
Pang et al. A bi-objective low-carbon economic scheduling method for cogeneration system considering carbon capture and demand response
Rastgou et al. An adaptive modified firefly algorithm to unit commitment problem for large-scale power systems

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination