CN112862281A - 综合能源系统调度模型构建方法、装置、介质及电子设备 - Google Patents
综合能源系统调度模型构建方法、装置、介质及电子设备 Download PDFInfo
- Publication number
- CN112862281A CN112862281A CN202110107505.8A CN202110107505A CN112862281A CN 112862281 A CN112862281 A CN 112862281A CN 202110107505 A CN202110107505 A CN 202110107505A CN 112862281 A CN112862281 A CN 112862281A
- Authority
- CN
- China
- Prior art keywords
- scheduling
- reinforcement learning
- network
- learning model
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 62
- 230000002787 reinforcement Effects 0.000 claims abstract description 78
- 238000012549 training Methods 0.000 claims abstract description 56
- VNWKTOKETHGBQD-UHFFFAOYSA-N methane Chemical compound C VNWKTOKETHGBQD-UHFFFAOYSA-N 0.000 claims abstract description 40
- 230000006870 function Effects 0.000 claims abstract description 39
- 230000009471 action Effects 0.000 claims abstract description 32
- 238000005457 optimization Methods 0.000 claims abstract description 29
- 239000003345 natural gas Substances 0.000 claims abstract description 20
- 238000010248 power generation Methods 0.000 claims abstract description 18
- 238000009826 distribution Methods 0.000 claims abstract description 16
- 238000013528 artificial neural network Methods 0.000 claims abstract description 15
- 238000003860 storage Methods 0.000 claims description 28
- 239000003795 chemical substances by application Substances 0.000 claims description 18
- 238000004590 computer program Methods 0.000 claims description 15
- 239000007789 gas Substances 0.000 claims description 14
- 238000004364 calculation method Methods 0.000 claims description 8
- 238000010276 construction Methods 0.000 claims description 6
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 claims description 5
- 229910052799 carbon Inorganic materials 0.000 claims description 5
- 238000005265 energy consumption Methods 0.000 claims description 5
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 238000007599 discharging Methods 0.000 claims description 3
- 238000004146 energy storage Methods 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 13
- 239000002609 medium Substances 0.000 description 13
- 230000008569 process Effects 0.000 description 7
- 238000011217 control strategy Methods 0.000 description 5
- 230000008878 coupling Effects 0.000 description 4
- 238000010168 coupling process Methods 0.000 description 4
- 238000005859 coupling reaction Methods 0.000 description 4
- 230000003993 interaction Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000001186 cumulative effect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- UFHFLCQGNIYNRP-UHFFFAOYSA-N Hydrogen Chemical compound [H][H] UFHFLCQGNIYNRP-UHFFFAOYSA-N 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 239000012120 mounting media Substances 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000000087 stabilizing effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
- G06Q10/06312—Adjustment or analysis of established resource schedule, e.g. resource or task levelling, or dynamic rescheduling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Engineering & Computer Science (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Marketing (AREA)
- Entrepreneurship & Innovation (AREA)
- General Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Operations Research (AREA)
- Development Economics (AREA)
- Quality & Reliability (AREA)
- Educational Administration (AREA)
- Game Theory and Decision Science (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Supply And Distribution Of Alternating Current (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请实施例公开了一种综合能源系统的调度方法、装置、介质及电子设备。所述方法包括:收集新能源发电功率以及电负荷、天然气负荷的历史数据,作为训练样本;并设置综合能源系统的优化目标;构建深度强化学习模型的元素,所述元素包括状态变量,动作变量、回报函数、折扣因子、记忆库容量;其中,所述深度强化学习模型包括:行动器,在线策略网络及其目标策略网络,评判器,以及在线网络及其目标网络;基于所述深度强化学习模型对训练样本进行迭代,确定调度周期内的调度策略。本技术方案,通过深度神经网络自动、自适应地学习源荷概率分布,训练好的模型,能够在秒级内快速、在线地给出优化调度策略。
Description
技术领域
本申请实施例涉及能源互联网综合能源系统优化运行领域,尤其涉及一种综合能源系统调度模型构建方法、装置、介质及电子设备。
背景技术
随着科学技术的不断发展,当前世界范围内日益增长的能源需求与环境生态保护之间矛盾凸显,提高能源利用效率,寻求替代性新能源已成为世界各国能源变革的必经之路。灵活的燃气轮机组为平抑间歇性新能源出力提供了保障;对于电网难以消纳的新能源出力,可将其通过电转气(P2G)技术转化为天然气/氢气大规模存储于天然气管道中。电力系统与天然气系统逐步呈现深度耦合的趋势,通过构建充分协同的电-气互联综合能源系统,提高能源利用效率,以实现系统间的灵活运行与多能互补。
能源互联网综合能源系统的优化运行基础理论及求解问题涉及的控制参量众多,运行状态随机多变,各类状态变量高度耦合,往往为一个复杂的非线性、非凸优化问题。同时,能源互联网集中控制方式随着控制设备的增多,计算量呈指数级增加。因此,采用传统计算方法难以解决能源互联网的优化运行问题。
随着人工智能技术的兴起和发展,强化学习在电力系统的优化控制中越来越受到重视。强化学习模型通过与环境的不断交互,实现经验的逐渐积累和策略的持续改进。尤其是深度神经网络与强化学习结合后的深度强化学习模型,具有更好的自适应学习能力和非凸优化、非线性问题的优化决策能力,适合于解决综合能源系统的优化调度问题。
发明内容
本申请实施例提供一种综合能源系统调度模型构建方法、装置、介质及电子设备,克服传统方法收敛速度慢、决策时间长、无法适应源荷随机性场景、需要大量简化假设等问题,通过深度神经网络自动、自适应地学习源荷概率分布,在秒级内快速、在线地给出优化调度策略。
第一方面,本申请实施例提供了一种综合能源系统调度模型构建方法,所述方法包括:
获取新能源发电功率以及电负荷、天然气负荷的历史数据,作为训练样本;并设置综合能源系统的优化目标;
从训练样本和优化目标中提取状态变量,动作变量、回报函数、折扣因子和记忆库容量,作为深度强化学习模型的训练元素,对深度强化学习模型进行迭代训练;训练后生成针对不同随机调度场景,生成调度策略的调度模型。
本申请提供的综合能源系统调度模型构建方法,通过深度强化学习与环境的不断交互,更新神经网络参数,并自适应学习电-气耦合能源系统的源荷不确定性,无需引入机理简化假设;能够在线、实时地给出优化调度策略。生成连续控制策略,相比于传统离散型强化学习模型,避免了动作离散化导致的计算误差。能够适用于新能源随机多场景下的优化调度策略,且具有良好的可扩展性。
进一步的,所述优化目标包括:运行成本最小、碳排放量最小、新能源消纳率最高中的至少一种。
进一步的,所述深度强化学习模型包括:行动器和评判器;所述对所述深度强化学习模型进行迭代训练,包括:
对构建的深度强化学习模型进行初始化;所述初始化包括设置训练迭代次数和每一次迭代的调度周期;
从调度周期内的第一个时刻开始,计算该时刻的综合能源系统的能流分布,得到系统环境的状态变量,并利用回报函数计算此刻系统的运行成本;
将所述状态变量输入至深度强化学习模型的行动器中,输出调度策略作为动作变量;
所述调度策略叠加一个正态分布的噪声后,作用于综合能源系统,得到下一状态变量;
将所述状态变量、所述动作变量、所述运行成本、所述下一状态变量以及是否为终止状态的5元组,存入强化学习智能体的经验回放单元;并从强化学习智能体的经验回放单元中抽取预设数量的样本,对行动器和评价器进行更新,持续迭代,直至迭代收敛稳定,得到训练好的深度强化学习模型。
在本实施例中,训练时采用深度学习对输入的综合能源系统的状态变量,生成输出策略,将调度策略作用于综合能源后继续生成状态变量,此过程中与环境不断交互,更新网络参数,采用克服传统方法收敛速度慢、决策时间长、无法适应源荷随机性场景、需要大量简化假设等问题,通过深度神经网络自动、自适应地学习源荷概率分布,能够在秒级内快速、在线地给出优化调度策略。
进一步的,所述训练元素中:状态变量,为各时刻系统的能流分布;动作变量,为系统的控制变量,包括常规机组发电功率,燃气轮机功率,电转气功率,储能充放电功率;回报函数,为每时刻系统的优化目标分类;记忆库容量,为强化学习智能体的记忆库容量,当智能体存储的5元组个数超过该容量值时,则随机删除记忆库中的某一个5元组,存储新的5元组。
进一步的,所述针对不同随机调度场景,生成调度策略的调度模型,生成调度策略时包括:
获取未来一个调度周期内的新能源发电功率以及电负荷、天然气负荷需求,在调度周期内的每一时间步,向深度强化学习模型的行动器中输入系统的运行状态,逐个生成各时刻的调度策略。
进一步的,所述行动器包括行动器在线策略网络及其目标策略网络;所述评判器包括在评判器线网络及其目标网络四个神经网络;所述对行动器和评价器进行更新时,包括以下步骤:
设置折扣因子等价式;
将折扣因子等价式代入预设损失函数中计算,采用预设损失函数更新评判器在线网络Q;
采用下式更新行动器的在线策略网络μ
采用软更新方式,更新行动器目标网络μ'和评判器目标网络Q'。
进一步,所述预设损失函数采用如下公式:
其中,yn表示折扣因子等价式;yn=rn+γQ′(sn+1,μ′(sn+1|θμ′)|θQ′),n=1,2...m;
θQ为在线网络Q的参数;Sn为系统状态变量,an为调度策略。
第二方面,本申请实施例提供了一种综合能源系统的调度模型构建装置,所述装置包括:
训练样本收集模块,用于获取新能源发电功率以及电负荷、天然气负荷的历史数据,作为训练样本;并设置综合能源系统的优化目标;
模型构建模块,用于构建深度强化学习模型,从训练样本和优化目标中提取状态变量,动作变量、回报函数、折扣因子和记忆库容量,作为深度强化学习模型的训练元素;
调度策略迭代模块,用于对深度强化学习模型进行迭代训练,训练后生成针对不同随机调度场景,生成调度策略的调度模型。
第三方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本申请实施例所述的综合能源系统的调度方法。
第四方面,本申请实施例提供了一种电子设备,包括存储器,处理器及存储在存储器上并可在处理器运行的计算机程序,所述处理器执行所述计算机程序时实现如本申请实施例所述的综合能源系统的调度方法。
本申请实施例所提供的技术方案,收集新能源发电功率以及电负荷、天然气负荷的历史数据,作为训练样本;并设置综合能源系统的优化目标;构建深度强化学习模型的元素,所述元素包括状态变量,动作变量、回报函数、折扣因子、记忆库容量;其中,所述深度强化学习模型包括:行动器,在线策略网络及其目标策略网络,评判器,以及在线网络及其目标网络;基于所述深度强化学习模型对训练样本进行迭代,确定调度周期内的调度策略。该方法能够克服传统方法收敛速度慢、决策时间长、无法适应源荷随机性场景、需要大量简化假设等问题,通过深度神经网络自动、自适应地学习源荷概率分布,训练好的模型,能够在秒级内快速、在线地给出优化调度策略。
附图说明
构成本申请的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是本申请实施例提供的综合能源系统的调度模型构建方法的流程图;
图2(a)是本申请实施例提供的一种综合能源系统的调度模型中深度强化学习的示意图;
图2(b)是本申请实施例提供的一种综合能源系统的调度模型构建方法中训练的流程图;
图3是本申请实施例提供的综合能源系统的调度装置的结构示意图;
图4是本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将参考附图并结合实施例来详细说明本发明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
以下详细说明均是示例性的说明,旨在对本发明提供进一步的详细说明。除非另有指明,本发明所采用的所有技术术语与本申请所属领域的一般技术人员的通常理解的含义相同。本发明所使用的术语仅是为了描述具体实施方式,而并非意图限制根据本发明的示例性实施方式。
图1是本申请实施例提供的综合能源系统的调度方法的流程图,本实施例可适用于综合能源系统的调度的情况,该方法可以由本申请实施例所提供的综合能源系统的调度装置执行,该装置可以由软件和/或硬件的方式来实现,并可集成于电子设备中。
如图1所示,综合能源系统的调度方法包括:
S110、获取新能源发电功率以及电负荷、天然气负荷的历史数据,作为训练样本;并设置综合能源系统的优化目标。
具体的,收集新能源(光伏、风电等)发电功率以及电负荷、天然气负荷的历史数据,存入数据库中,作为训练样本。
在本实施例中,可选的,所述优化目标包括:运行成本最小、碳排放量最少、新能源消纳率最高中的至少一种。
设置综合能源系统的优化目标(如运行成本最小、碳排放量最小、新能源消纳率最高等)。
S120、从训练样本和优化目标中提取状态变量,动作变量、回报函数、折扣因子和记忆库容量,作为深度强化学习模型的训练元素;
其中,状态变量,为各时刻系统的能流分布;
动作变量,为系统的控制变量,包括常规机组发电功率,燃气轮机功率,电转气功率,储能充放电功率;
回报函数,为每时刻系统的优化目标分类;
记忆库容量,为强化学习智能体的记忆库容量,当智能体存储的5元组个数超过该容量值时,则随机删除记忆库中的某一个5元组,存储新的5元组。
其中,所述深度强化学习模型包括:行动器,在线策略网络及其目标策略网络,评判器,以及在线网络及其目标网络。
面向电-气耦合的综合能源系统,构建相应的深度强化学习模型,包括状态变量S,动作变量A、回报函数R、折扣因子γ、记忆库容量M;强化学习模型包含四个神经网络,分别为行动器(Actor)在线策略网络μ及其目标策略网络μ',和评判器(Critic)在线网络Q及其目标网络Q'。
在本实施例中,可选的,所述行动器,所述在线策略网络及其目标策略网络,所述评判器,以及所述在线网络及其目标网络均采用全连接神经网络构建。
S130、训练后得到针对不同随机调度场景,生成调度策略的调度模型。
在本方案中,具体的,基于所述深度强化学习模型对训练样本进行迭代,训练过程包括:
按照预设的训练迭代轮数,根据每一轮的调度周期,调度策略生成的时间间隔,确定每一轮调度周期生成调度策略的次数;
如图2(a)所示,从调度周期内的第一个时刻开始,计算该时刻的综合能源系统的能流分布,得到系统环境的状态变量,以及此刻系统的运行成本;
将所述状态变量输入至深度强化学习模型的行动器中,输出调度策略作为动作变量;
所述调度策略叠加一个正态分布的噪声后,作用于综合能源系统,得到下一状态变量;
将所述状态变量、所述调度策略、所述下一状态变量、回报函数以及是否为终止状态的5元组,存入强化学习智能体的经验回放单元;并从强化学习智能体的经验回放单元中抽取预设数量的样本,对行动器和评价器进行更新,持续迭代,直至迭代收敛稳定,得到训练好的深度强化学习模型。
设总的训练迭代轮数为N,每一轮的调度周期为T,调度策略生成的时间间隔为λ,则每一轮调度周期共需生成p=T/λ次调度策略。从调度周期内的第一个时刻tn(n=0)开始,计算该时刻的综合能源系统的能流分布,可得到系统环境的状态变量Sn,以及此刻系统的运行成本Rn。Sn输入至强化学习模型的行动器μ中,输出调度策略(动作变量)An。An控制策略作用于能源系统,得到系统的下一个状态Sn+1。
将当前状态Sn,动作An,下一状态Sn+1,奖励Rn,是否为终止状态is_end的5元组存入智能体的经验回放单元。
从智能体的经验回放单元中随机抽取m个样本。
采用样本更新行动器μ和评判器Q。
采用软更新方式,更新行动器目标网络μ'和评判器目标网络Q'。
本方案中,可选的,在对行动器和评价器进行更新之后,所述方法还包括:
持续迭代,直至迭代收敛稳定,得到深度强化学习模型。
上述过程持续进行,直至迭代收敛稳定,保存模型。此时整个调度周期内的累积回报函数R达到最大。
在上述技术方案的基础上,可选的,在得到深度强化学习模型之后,所述方法还包括:
采用训练好的深度强化学习模型进行未来调度策略生成;包括:预测未来一个调度周期内的新能源发电功率以及电负荷、天然气负荷需求,在调度周期内的每一时间步,向深度强化学习模型的行动器中输入系统的运行状态,逐个生成各时刻的调度策略。
采用训练好的模型进行未来调度策略生成。预测未来一个调度周期内的新能源(光伏、风电等)发电功率以及电负荷、天然气负荷需求,在调度周期内的每一时间步,向强化学习的行动器中输入系统的运行状态,逐个生成各时刻的调度策略。
图2(b)是本申请实施例提供的一种综合能源系统的调度方法的流程图。本方案包括以下几个步骤:
所述步骤1具体包括:
步骤101收集新能源(光伏、风电等)发电功率以及电负荷、天然气负荷的历史数据,存入数据库中,作为训练样本。历史数据的采样周期与调度周期一致,例如每一个小时生成一次调度策略,则源荷数据也为每小时一个数据点。
步骤102设置综合能源系统的优化目标,包括系统运行成本、碳排放量、新能源消纳率等。
步骤2为深度强化学习模型的构建过程,具体包括:
步骤201构建强化学习模型的各项元素,包括:状态变量S,即各时刻系统的能流分布;动作变量A,即系统的控制变量,例如常规机组发电功率,燃气轮机功率,电转气(P2G)功率,储能充放电功率等;回报函数R,即每时刻系统的优化目标分类;折扣因子;强化学习智能体的记忆库容量M。
步骤202强化学习模型包含四个神经网络,分别为行动器(Actor)在线策略网络μ及其目标策略网络μ',和评判器(Critic)在线网络Q及其目标网络Q',均采用全连接神经网络构建。在线策略网络μ及其目标策略网络μ'结构相同,网络参数分别为θμ和θμ′,输入层维度为状态变量S的个数,输出为动作的个数;评判器在线网络Q及其目标网络Q'结构相同,网络参数分别为θQ和θQ′,输出维度为1。
步骤3具体包括:
步骤301设总的训练迭代轮数为N,每一轮的调度周期为T,调度策略生成的时间间隔为λ,则每一轮调度周期共需生成p=T/λ次调度策略。
步骤302从调度周期内的第一个时刻tn(n=0)开始,计算该时刻的综合能源系统的能流分布,可得到系统环境的状态变量Sn,以及此刻系统的运行成本Rn。
步骤304Sn输入至强化学习模型的行动器μ中,输出调度策略(动作变量)An。An控制策略叠加一个正态分布(正态分布的方程随迭代的进行逐渐减小)的噪声后,作用于能源系统,得到系统的下一个状态Sn+1。
步骤4将当前状态Sn,动作An,下一状态Sn+1,奖励Rn,是否为终止状态is_end的5元组{Sn,An,Sn+1,Rn,is_end}存入强化学习智能体的经验回放单元。
步骤5从智能体的经验回放单元中随机抽取m个样本。
步骤6是对智能体的评判器Q和行动器μ的神经网络参数更新过程,具体如下:
步骤601设置设置折扣因子等价式;
yn=rn+γQ′(sn+1,μ′(sn+1|θμ′)|θQ′),n=1,2...m (公式1)
然后,采用如下损失函数更新评判器Q参数
yn表示折扣因子等价式;θQ为在线网络Q的参数;Sn为系统状态变量,an为调度策略。
步骤602采用下式更新行动器的在线策略网络μ
步骤7采用软更新方式,更新行动器目标网络μ'和评判器目标网络Q',即
θQ′←τθQ+(1-τ)θQ′ (4)
θμ′←τθμ+(1-τ)θμ′ (5)
其中,τ为更新系数,可设置为0.01。
步骤8上述步骤3-7的过程持续进行,直至迭代收敛稳定,保存深度强化学习模型。此时整个调度周期内的累积回报函数R达到最大。
步骤9采用训练好的模型进行未来调度策略生成。预测未来一个调度周期内的新能源(光伏、风电等)发电功率以及电负荷、天然气负荷需求,在调度周期内的每一时间步,向强化学习的行动器μ中输入系统的运行状态,逐个生成各时刻的调度策略。
本发明不依赖于具体的物理模型,因此也不需要进行大量的简化假设,而是直接自适应地学习源荷随机性分布,避免了因随机性简化导致的计算误差。
训练后的强化学习模型能够针对不同的随机调度场景,在线快速给出调度策略,无需重新进行模型训练,策略生成速度更快。
本发明属于无模型的优化方法,具有较好地可扩展性。相比于传统方法,生成的策略为连续控制策略,降低了因为控制动作离散化导致的计算误差。
本方案,通过深度强化学习与环境的不断交互,更新神经网络参数,并自适应学习电-气耦合能源系统的源荷不确定性,无需引入机理简化假设;能够在线、实时地给出优化调度策略。生成连续控制策略,相比于传统离散型强化学习模型,避免了动作离散化导致的计算误差。该方法能够适用于新能源随机多场景下的优化调度策略,且具有良好的可扩展性。
图3是本申请实施例提供的综合能源系统的调度装置的结构示意图。如图3所示,所述装置包括:
训练样本收集模块310,用于获取新能源发电功率以及电负荷、天然气负荷的历史数据,作为训练样本;并设置综合能源系统的优化目标;
模型构建模块320,用于构建深度强化学习模型,从训练样本和优化目标中提取状态变量,动作变量、回报函数、折扣因子和记忆库容量,作为深度强化学习模型的训练元素,所述深度强化学习模型包括:行动器,在线策略网络及其目标策略网络,评判器,以及在线网络及其目标网络四个神经网络;
调度策略迭代模块330,用于对深度强化学习模型进行迭代训练,训练后生成针对不同随机调度场景,生成调度策略的调度模型。上述产品可执行本申请实施例所提供的方法,具备执行方法相应的功能模块和有益效果。
本申请实施例还提供一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行一种综合能源系统的调度方法,该方法包括:
收集新能源发电功率以及电负荷、天然气负荷的历史数据,作为训练样本;并设置综合能源系统的优化目标;
构建深度强化学习模型的元素,所述元素包括状态变量,动作变量、回报函数、折扣因子、记忆库容量;其中,所述深度强化学习模型包括:行动器,在线策略网络及其目标策略网络,评判器,以及在线网络及其目标网络;
基于所述深度强化学习模型对训练样本进行迭代,确定调度周期内的调度策略。存储介质——任何的各种类型的存储器电子设备或存储电子设备。术语“存储介质”旨在包括:安装介质,例如CD-ROM、软盘或磁带装置;计算机系统存储器或随机存取存储器,诸如DRAM、DDR RAM、SRAM、EDO RAM,兰巴斯(Rambus)RAM等;非易失性存储器,诸如闪存、磁介质(例如硬盘或光存储);寄存器或其它相似类型的存储器元件等。存储介质可以还包括其它类型的存储器或其组合。另外,存储介质可以位于程序在其中被执行的计算机系统中,或者可以位于不同的第二计算机系统中,第二计算机系统通过网络(诸如因特网)连接到计算机系统。第二计算机系统可以提供程序指令给计算机用于执行。术语“存储介质”可以包括可以驻留在不同位置中(例如在通过网络连接的不同计算机系统中)的两个或更多存储介质。存储介质可以存储可由一个或多个处理器执行的程序指令(例如具体实现为计算机程序)。
当然,本申请实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的综合能源系统的调度操作,还可以执行本申请任意实施例所提供的综合能源系统的调度方法中的相关操作。
本申请实施例提供了一种电子设备,该电子设备中可集成本申请实施例提供的综合能源系统的调度装置。图4是本申请实施例提供的一种电子设备的结构示意图。如图4所示,本实施例提供了一种电子设备400,其包括:一个或多个处理器420;存储装置410,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器420执行,使得所述一个或多个处理器420实现本申请实施例所提供的综合能源系统的调度方法,该方法包括:
收集新能源发电功率以及电负荷、天然气负荷的历史数据,作为训练样本;并设置综合能源系统的优化目标;
构建深度强化学习模型的元素,所述元素包括状态变量,动作变量、回报函数、折扣因子、记忆库容量;其中,所述深度强化学习模型包括:行动器,在线策略网络及其目标策略网络,评判器,以及在线网络及其目标网络;
基于所述深度强化学习模型对训练样本进行迭代,确定调度周期内的调度策略。当然,本领域技术人员可以理解,处理器420还实现本申请任意实施例所提供的综合能源系统的调度方法的技术方案。
图4显示的电子设备400仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图4所示,该电子设备400包括处理器420、存储装置410、输入装置430和输出装置440;电子设备中处理器420的数量可以是一个或多个,图4中以一个处理器420为例;电子设备中的处理器420、存储装置410、输入装置430和输出装置440可以通过总线或其他方式连接,图4中以通过总线450连接为例。
存储装置410作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块单元,如本申请实施例中的综合能源系统的调度方法对应的程序指令。
存储装置410可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据终端的使用所创建的数据等。此外,存储装置410可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储装置410可进一步包括相对于处理器420远程设置的存储器,这些远程存储器可以通过网络连接。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入装置430可用于接收输入的数字、字符信息或语音信息,以及产生与电子设备的用户设置以及功能控制有关的键信号输入。输出装置440可包括显示屏、扬声器等电子设备。
上述实施例中提供的综合能源系统的调度装置、介质及电子设备可执行本申请任意实施例所提供的综合能源系统的调度方法,具备执行该方法相应的功能模块和有益效果。未在上述实施例中详尽描述的技术细节,可参见本申请任意实施例所提供的综合能源系统的调度方法。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
由技术常识可知,本发明可以通过其它的不脱离其精神实质或必要特征的实施方案来实现。因此,上述公开的实施方案,就各方面而言,都只是举例说明,并不是仅有的。所有在本发明范围内或在等同于本发明的范围内的改变均被本发明包含。
Claims (10)
1.一种综合能源系统调度模型构建方法,其特征在于,包括:
获取新能源发电功率以及电负荷、天然气负荷的历史数据,作为训练样本;并设置综合能源系统的优化目标;
从训练样本和优化目标中提取状态变量,动作变量、回报函数、折扣因子和记忆库容量,作为深度强化学习模型的训练元素,对深度强化学习模型进行迭代训练;
训练后得到针对不同随机调度场景,生成调度策略的调度模型。
2.根据权利要求1所述的方法,其特征在于,所述优化目标包括:运行成本最小、碳排放量最小、新能源消纳率最高中的至少一种。
3.根据权利要求1所述的方法,其特征在于,所述深度强化学习模型包括:行动器和评判器;所述对所述深度强化学习模型进行迭代训练,包括:
对构建的深度强化学习模型进行初始化;所述初始化包括设置训练迭代次数和每一次迭代的调度周期;
从调度周期内的第一个时刻开始,计算该时刻的综合能源系统的能流分布,得到系统环境的状态变量,并利用回报函数计算此刻系统的运行成本;
将所述状态变量输入至深度强化学习模型的行动器中,输出调度策略作为动作变量;
所述调度策略叠加一个正态分布的噪声后,作用于综合能源系统,得到下一状态变量;
将所述状态变量、所述动作变量、所述运行成本、所述下一状态变量以及是否为终止状态的5元组,存入强化学习智能体的经验回放单元;并从强化学习智能体的经验回放单元中抽取预设数量的样本,对行动器和评价器进行更新,持续迭代,直至迭代收敛稳定,得到训练好的深度强化学习模型。
6.根据权利要求1所述的方法,其特征在于,所述训练元素中:
状态变量,为各时刻系统的能流分布;
动作变量,为系统的控制变量,包括常规机组发电功率,燃气轮机功率,电转气功率,储能充放电功率;
回报函数,为每时刻系统的优化目标分类;
记忆库容量,为强化学习智能体的记忆库容量,当智能体存储的5元组个数超过该容量值时,则随机删除记忆库中的某一个5元组,存储新的5元组。
7.根据权利要求1所述的方法,其特征在于,所述针对不同随机调度场景,生成调度策略的调度模型,生成调度策略时包括:
获取未来一个调度周期内的新能源发电功率以及电负荷、天然气负荷需求,在调度周期内的每一时间步,向深度强化学习模型的行动器中输入系统的运行状态,逐个生成各时刻的调度策略。
8.一种综合能源系统的调度模型构建装置,其特征在于,包括:
训练样本收集模块,用于获取新能源发电功率以及电负荷、天然气负荷的历史数据,作为训练样本;并设置综合能源系统的优化目标;
模型构建模块,用于构建深度强化学习模型,从训练样本和优化目标中提取状态变量,动作变量、回报函数、折扣因子和记忆库容量,作为深度强化学习模型的训练元素;
调度策略迭代模块,用于对深度强化学习模型进行迭代训练,训练后生成针对不同随机调度场景,生成调度策略的调度模型。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一项所述的综合能源系统的调度方法。
10.一种电子设备,包括存储器,处理器及存储在存储器上并可在处理器运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1-7中任一项所述的综合能源系统的调度方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110107505.8A CN112862281A (zh) | 2021-01-26 | 2021-01-26 | 综合能源系统调度模型构建方法、装置、介质及电子设备 |
PCT/CN2021/115751 WO2022160705A1 (zh) | 2021-01-26 | 2021-08-31 | 综合能源系统调度模型构建方法、装置、介质及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110107505.8A CN112862281A (zh) | 2021-01-26 | 2021-01-26 | 综合能源系统调度模型构建方法、装置、介质及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112862281A true CN112862281A (zh) | 2021-05-28 |
Family
ID=76009360
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110107505.8A Pending CN112862281A (zh) | 2021-01-26 | 2021-01-26 | 综合能源系统调度模型构建方法、装置、介质及电子设备 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN112862281A (zh) |
WO (1) | WO2022160705A1 (zh) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113552802A (zh) * | 2021-07-22 | 2021-10-26 | 泰铂(上海)环保科技股份有限公司 | 重卡智能空调控制方法及系统 |
CN113780688A (zh) * | 2021-11-10 | 2021-12-10 | 中国电力科学研究院有限公司 | 一种电热联合系统的优化运行方法、系统、设备及介质 |
CN113779871A (zh) * | 2021-08-26 | 2021-12-10 | 清华大学 | 一种电热耦合系统调度方法、装置、电子设备及其存储介质 |
CN113902040A (zh) * | 2021-11-15 | 2022-01-07 | 中国电力科学研究院有限公司 | 电-热综合能源系统协调优化方法、系统、设备及存储介质 |
CN113935463A (zh) * | 2021-09-30 | 2022-01-14 | 南方电网数字电网研究院有限公司 | 一种基于人工智能控制方法的微电网控制器 |
CN113962429A (zh) * | 2021-09-03 | 2022-01-21 | 华南理工大学 | 一种求解负荷置换的优化方法、系统、装置及介质 |
CN114665478A (zh) * | 2022-05-23 | 2022-06-24 | 国网江西省电力有限公司电力科学研究院 | 一种基于多目标深度强化学习的主动配电网重构方法 |
WO2022160705A1 (zh) * | 2021-01-26 | 2022-08-04 | 中国电力科学研究院有限公司 | 综合能源系统调度模型构建方法、装置、介质及电子设备 |
CN116154771A (zh) * | 2023-04-17 | 2023-05-23 | 阿里巴巴达摩院(杭州)科技有限公司 | 电力设备的控制方法、设备控制方法及电子设备 |
CN116562464A (zh) * | 2023-07-03 | 2023-08-08 | 南京菁翎信息科技有限公司 | 一种基于深度强化学习的电力系统低碳优化调度方法 |
WO2024022194A1 (zh) * | 2022-07-26 | 2024-02-01 | 中国电力科学研究院有限公司 | 电网实时调度优化方法、系统、计算机设备及存储介质 |
CN117498306A (zh) * | 2023-10-08 | 2024-02-02 | 湖南第一师范学院 | 一种微电网优化调度方法、系统、介质、设备及终端 |
Families Citing this family (47)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115102238B (zh) * | 2022-08-29 | 2022-11-15 | 北京邮电大学 | 电力供应方法、装置、电子设备及存储介质 |
CN115147014A (zh) * | 2022-08-31 | 2022-10-04 | 国网浙江省电力有限公司宁波供电公司 | 一种综合能源系统的多目标均衡分配方法 |
CN115693916B (zh) * | 2022-09-07 | 2023-05-30 | 国网安徽省电力有限公司宿州供电公司 | 一种变电站直流电源智能在线监测方法及系统 |
CN115459320B (zh) * | 2022-09-16 | 2024-09-03 | 国网湖北省电力有限公司电力科学研究院 | 一种多点分布式储能系统聚合控制智能决策方法及装置 |
CN115239028B (zh) * | 2022-09-22 | 2022-12-09 | 北京邮电大学 | 综合能源调度方法、装置、设备及存储介质 |
CN115361301B (zh) | 2022-10-09 | 2023-01-10 | 之江实验室 | 一种基于dqn的分布式计算网络协同流量调度系统与方法 |
CN115657771B (zh) * | 2022-11-09 | 2024-07-23 | 国网湖南省电力有限公司 | 一种基于多智能体协同的大型商超综合体能效提升方法 |
CN115936195B (zh) * | 2022-11-23 | 2024-07-12 | 合肥工业大学 | 智能小区能源优化方法、系统、电子设备和存储介质 |
CN115528712B (zh) * | 2022-11-23 | 2023-06-20 | 国网天津市电力公司滨海供电分公司 | 一种源网荷储备不同区储能容量平衡方法及系统 |
CN115809597B (zh) * | 2022-11-30 | 2024-04-30 | 东北电力大学 | 强化学习紧急直流功率支援的频率稳定系统及方法 |
CN115907178B (zh) * | 2022-11-30 | 2023-12-15 | 中国地质大学(武汉) | 一种净生态系统co2交换量的预测方法 |
CN116341836B (zh) * | 2023-02-22 | 2024-04-09 | 国网山东省电力公司德州供电公司 | 一种园区综合能源系统多能源市场运营方法及系统 |
CN116307136A (zh) * | 2023-02-24 | 2023-06-23 | 国网安徽省电力有限公司营销服务中心 | 一种基于深度强化学习的能源系统参数优化方法、系统、装置及存储介质 |
CN116822694A (zh) * | 2023-04-04 | 2023-09-29 | 中国石油大学(北京) | 用于预测天然气管网气体发热量的方法、装置及存储介质 |
CN116468425B (zh) * | 2023-04-23 | 2023-10-10 | 北京理工大学 | 多态系统的联合运维优化方法、电子设备和计算机可读存储介质 |
CN116345577B (zh) * | 2023-05-12 | 2023-08-08 | 国网天津市电力公司营销服务中心 | 风-光-储微电网能量调控优化方法、设备及存储介质 |
CN116436013B (zh) * | 2023-06-13 | 2023-08-18 | 中国电力科学研究院有限公司 | 配电系统功率分配方法、系统、计算机设备及存储介质 |
CN116485042B (zh) * | 2023-06-16 | 2023-09-01 | 国网上海能源互联网研究院有限公司 | 一种基于负荷聚类的园区能源系统运行的优化方法及装置 |
CN116542498B (zh) * | 2023-07-06 | 2023-11-24 | 杭州宇谷科技股份有限公司 | 基于深度强化学习的电池调度方法、系统、装置及介质 |
CN116894354B (zh) * | 2023-09-11 | 2023-12-26 | 国网浙江省电力有限公司 | 一种多能源耦合环节的碳流计算方法及系统 |
CN116938323B (zh) * | 2023-09-18 | 2023-11-21 | 中国电子科技集团公司第五十四研究所 | 一种基于强化学习的卫星转发器资源分配方法 |
CN116954089B (zh) * | 2023-09-21 | 2023-12-12 | 威海润蓝水处理设备有限公司 | 一种mvr刮板结晶控制系统 |
CN116996443B (zh) * | 2023-09-25 | 2024-01-23 | 之江实验室 | 一种结合gnn和sac模型的网络协同流量调度方法与系统 |
CN116991388B (zh) * | 2023-09-26 | 2024-01-09 | 之江实验室 | 一种深度学习编译器的图优化序列生成方法及装置 |
CN116993128B (zh) * | 2023-09-26 | 2023-12-26 | 国网江西省电力有限公司电力科学研究院 | 一种综合能源系统深度强化学习低碳调度方法及系统 |
CN117077986B (zh) * | 2023-10-16 | 2024-01-30 | 华中科技大学 | 电力系统极端运行风险场景的态势感知方法及相关设备 |
CN117113858B (zh) * | 2023-10-23 | 2024-02-06 | 北京中环信科科技股份有限公司 | 一种氢气系统的预警方法及装置 |
CN117650553B (zh) * | 2023-10-25 | 2024-07-09 | 四川大学 | 基于多智能体深度强化学习的5g基站储能电池充放电调度方法 |
CN117132089B (zh) * | 2023-10-27 | 2024-03-08 | 邯郸欣和电力建设有限公司 | 用电策略优化调度方法及装置 |
CN117422254B (zh) * | 2023-10-30 | 2024-07-26 | 深圳市蓝宇飞扬科技有限公司 | 智慧园区的信息处理方法、装置、设备及存储介质 |
CN117311159A (zh) * | 2023-10-30 | 2023-12-29 | 上海新华控制技术集团科技有限公司 | 控制系统的自适应调节方法、装置、存储介质及电子设备 |
CN117200225B (zh) * | 2023-11-07 | 2024-01-30 | 中国电力科学研究院有限公司 | 考虑涵盖电动汽车集群的配电网优化调度方法及相关装置 |
CN117455183B (zh) * | 2023-11-09 | 2024-08-27 | 国能江苏新能源科技开发有限公司 | 一种基于深度强化学习的综合能源系统优化调度方法 |
CN117856284B (zh) * | 2023-11-29 | 2024-06-07 | 国家电网有限公司华东分部 | 基于深度强化学习的电网频率的控制方法及装置 |
CN117527870B (zh) * | 2023-12-07 | 2024-05-03 | 东莞信易电热机械有限公司 | 一种塑胶成型的控制方法及系统 |
CN117521920B (zh) * | 2023-12-29 | 2024-04-05 | 湖南工商大学 | 应用于能源系统的协同优化方法和装置 |
CN117808259A (zh) * | 2023-12-30 | 2024-04-02 | 湖南工商大学 | 一种能源调度策略的获取方法及装置 |
CN117540938B (zh) * | 2024-01-10 | 2024-05-03 | 杭州经纬信息技术股份有限公司 | 基于td3强化学习优化的集成式建筑能耗预测方法及系统 |
CN117578534B (zh) * | 2024-01-17 | 2024-05-07 | 深圳市名洋能源科技有限公司 | 光伏储能系统的调度方法、装置、设备及存储介质 |
CN118131045A (zh) * | 2024-01-22 | 2024-06-04 | 北京大学 | 基于多孔电极老化模型的移动储能在线决策方法及装置 |
CN117669993B (zh) * | 2024-01-30 | 2024-07-02 | 南方科技大学 | 一种渐进式充电设施规划方法、装置、终端及存储介质 |
CN117808171B (zh) * | 2024-02-29 | 2024-08-02 | 山东大学 | 综合能源系统低碳优化调度方法、系统、存储介质及设备 |
CN117933666B (zh) * | 2024-03-21 | 2024-07-12 | 合肥壹号智能科技有限公司 | 一种密集仓储机器人调度方法、装置、介质、设备及系统 |
CN117977718B (zh) * | 2024-04-01 | 2024-09-13 | 浙电(宁波北仑)智慧能源有限公司 | 基于源网荷储的协调调度优化方法及系统 |
CN118278288B (zh) * | 2024-05-20 | 2024-08-09 | 深圳市中科建设集团有限公司 | 基于bim的建筑弱电系统设计辅助方法及计算机系统 |
CN118249519B (zh) * | 2024-05-28 | 2024-09-10 | 国网江西省电力有限公司电力科学研究院 | 一种分布式新能源接入有源配电网状态感知方法及系统 |
CN118469104A (zh) * | 2024-07-12 | 2024-08-09 | 杭州电子科技大学 | 基于可变时间常数梯度算法的综合能源系统优化调度方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112117760A (zh) * | 2020-08-13 | 2020-12-22 | 国网浙江省电力有限公司台州供电公司 | 基于双q值网络深度强化学习的微电网能量调度方法 |
CN112186799A (zh) * | 2020-09-22 | 2021-01-05 | 中国电力科学研究院有限公司 | 基于深度强化学习的分布式能源系统自治控制方法及系统 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111064229B (zh) * | 2019-12-18 | 2023-04-07 | 广东工业大学 | 基于q学习的风-光-气-蓄联合动态经济调度优化方法 |
CN111738529B (zh) * | 2020-07-28 | 2022-12-23 | 南方电网科学研究院有限责任公司 | 基于强化学习的综合能源系统需求响应方法、系统及设备 |
CN112214883B (zh) * | 2020-09-24 | 2022-08-19 | 中国海洋石油集团有限公司 | 一种微能源网综合能源系统运行优化方法和系统 |
CN112862281A (zh) * | 2021-01-26 | 2021-05-28 | 中国电力科学研究院有限公司 | 综合能源系统调度模型构建方法、装置、介质及电子设备 |
-
2021
- 2021-01-26 CN CN202110107505.8A patent/CN112862281A/zh active Pending
- 2021-08-31 WO PCT/CN2021/115751 patent/WO2022160705A1/zh active Application Filing
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112117760A (zh) * | 2020-08-13 | 2020-12-22 | 国网浙江省电力有限公司台州供电公司 | 基于双q值网络深度强化学习的微电网能量调度方法 |
CN112186799A (zh) * | 2020-09-22 | 2021-01-05 | 中国电力科学研究院有限公司 | 基于深度强化学习的分布式能源系统自治控制方法及系统 |
Non-Patent Citations (2)
Title |
---|
乔骥 等: "基于柔性行动器-评判器深度强化学习的电-气综合能源系统优化调度" * |
陈前斌 等: "异构云无线接入网架构下面向混合能源供应的动态资源分配及能源管理算法" * |
Cited By (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022160705A1 (zh) * | 2021-01-26 | 2022-08-04 | 中国电力科学研究院有限公司 | 综合能源系统调度模型构建方法、装置、介质及电子设备 |
CN113552802B (zh) * | 2021-07-22 | 2022-05-24 | 泰铂(上海)环保科技股份有限公司 | 重卡智能空调控制方法及系统 |
CN113552802A (zh) * | 2021-07-22 | 2021-10-26 | 泰铂(上海)环保科技股份有限公司 | 重卡智能空调控制方法及系统 |
CN113779871A (zh) * | 2021-08-26 | 2021-12-10 | 清华大学 | 一种电热耦合系统调度方法、装置、电子设备及其存储介质 |
CN113779871B (zh) * | 2021-08-26 | 2024-08-06 | 清华大学 | 一种电热耦合系统调度方法、装置、电子设备及其存储介质 |
CN113962429B (zh) * | 2021-09-03 | 2024-04-05 | 华南理工大学 | 一种求解负荷置换的优化方法、系统、装置及介质 |
CN113962429A (zh) * | 2021-09-03 | 2022-01-21 | 华南理工大学 | 一种求解负荷置换的优化方法、系统、装置及介质 |
CN113935463A (zh) * | 2021-09-30 | 2022-01-14 | 南方电网数字电网研究院有限公司 | 一种基于人工智能控制方法的微电网控制器 |
CN113780688A (zh) * | 2021-11-10 | 2021-12-10 | 中国电力科学研究院有限公司 | 一种电热联合系统的优化运行方法、系统、设备及介质 |
CN113780688B (zh) * | 2021-11-10 | 2022-02-18 | 中国电力科学研究院有限公司 | 一种电热联合系统的优化运行方法、系统、设备及介质 |
CN113902040A (zh) * | 2021-11-15 | 2022-01-07 | 中国电力科学研究院有限公司 | 电-热综合能源系统协调优化方法、系统、设备及存储介质 |
WO2023082697A1 (zh) * | 2021-11-15 | 2023-05-19 | 中国电力科学研究院有限公司 | 电-热综合能源系统协调优化方法、系统、设备、介质及程序 |
CN114665478B (zh) * | 2022-05-23 | 2022-10-11 | 国网江西省电力有限公司电力科学研究院 | 一种基于多目标深度强化学习的主动配电网重构方法 |
CN114665478A (zh) * | 2022-05-23 | 2022-06-24 | 国网江西省电力有限公司电力科学研究院 | 一种基于多目标深度强化学习的主动配电网重构方法 |
WO2024022194A1 (zh) * | 2022-07-26 | 2024-02-01 | 中国电力科学研究院有限公司 | 电网实时调度优化方法、系统、计算机设备及存储介质 |
CN116154771A (zh) * | 2023-04-17 | 2023-05-23 | 阿里巴巴达摩院(杭州)科技有限公司 | 电力设备的控制方法、设备控制方法及电子设备 |
CN116562464A (zh) * | 2023-07-03 | 2023-08-08 | 南京菁翎信息科技有限公司 | 一种基于深度强化学习的电力系统低碳优化调度方法 |
CN116562464B (zh) * | 2023-07-03 | 2023-09-19 | 南京菁翎信息科技有限公司 | 一种基于深度强化学习的电力系统低碳优化调度方法 |
CN117498306A (zh) * | 2023-10-08 | 2024-02-02 | 湖南第一师范学院 | 一种微电网优化调度方法、系统、介质、设备及终端 |
CN117498306B (zh) * | 2023-10-08 | 2024-07-23 | 湖南第一师范学院 | 一种微电网优化调度方法、系统、介质、设备及终端 |
Also Published As
Publication number | Publication date |
---|---|
WO2022160705A1 (zh) | 2022-08-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112862281A (zh) | 综合能源系统调度模型构建方法、装置、介质及电子设备 | |
CN113511082B (zh) | 基于规则和双深度q网络的混合动力汽车能量管理方法 | |
CN110929948B (zh) | 基于深度强化学习的完全分布式智能电网经济调度方法 | |
CN111934335A (zh) | 一种基于深度强化学习的集群电动汽车充电行为优化方法 | |
CN112117760A (zh) | 基于双q值网络深度强化学习的微电网能量调度方法 | |
CN109347149A (zh) | 基于深度q值网络强化学习的微电网储能调度方法及装置 | |
CN110481536B (zh) | 一种应用于混合动力汽车的控制方法及设备 | |
CN112491094B (zh) | 一种混合驱动的微电网能量管理方法、系统及装置 | |
CN116345578B (zh) | 基于深度确定性策略梯度的微电网运行优化调度方法 | |
CN116014715A (zh) | 一种基于数字孪生的综合能源控制方法及系统 | |
CN118365099B (zh) | 一种多agv调度方法、装置、设备及存储介质 | |
CN114156893A (zh) | 面向新能源消纳场景的电网调度方法、装置、设备及介质 | |
Liu et al. | Multi-agent quantum-inspired deep reinforcement learning for real-time distributed generation control of 100% renewable energy systems | |
CN117039981A (zh) | 一种面向含新能源的大规模电网优化调度方法、装置、存储介质 | |
CN117937568A (zh) | 一种家庭微电网能源管理方法及系统 | |
CN117833316A (zh) | 一种用户侧储能动态优化运行的方法 | |
CN117691586A (zh) | 基于行为克隆的新能源基地微电网优化运行方法及系统 | |
CN117277346A (zh) | 一种基于多智能体系统的储能调频方法、装置及设备 | |
CN115829258A (zh) | 基于多项式混沌近似动态规划的电力系统经济调度方法 | |
CN114048576A (zh) | 一种稳定电网输电断面潮流的储能系统智能化控制方法 | |
CN114435165A (zh) | 一种充电桩的充电方法、装置、电子设备和存储介质 | |
Wang et al. | A fast converged voltage control method based on deep reinforcement learning | |
CN112613229A (zh) | 混合动力设备的能量管理方法、模型训练方法及装置 | |
CN113705067B (zh) | 一种微网优化运行策略生成方法、系统、设备及存储介质 | |
CN118381095B (zh) | 新能源微电网储能充放电智能控制方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210528 |