CN111275572A - 一种基于粒子群和深度强化学习的机组调度系统及方法 - Google Patents

一种基于粒子群和深度强化学习的机组调度系统及方法 Download PDF

Info

Publication number
CN111275572A
CN111275572A CN202010043546.0A CN202010043546A CN111275572A CN 111275572 A CN111275572 A CN 111275572A CN 202010043546 A CN202010043546 A CN 202010043546A CN 111275572 A CN111275572 A CN 111275572A
Authority
CN
China
Prior art keywords
target
particle swarm
input
reinforcement learning
deep reinforcement
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010043546.0A
Other languages
English (en)
Other versions
CN111275572B (zh
Inventor
于长军
林志赟
韩志敏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Dianzi University
Original Assignee
Hangzhou Dianzi University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Dianzi University filed Critical Hangzhou Dianzi University
Priority to CN202010043546.0A priority Critical patent/CN111275572B/zh
Publication of CN111275572A publication Critical patent/CN111275572A/zh
Application granted granted Critical
Publication of CN111275572B publication Critical patent/CN111275572B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Feedback Control In General (AREA)

Abstract

本发明公开了一种基于粒子群和深度强化学习的机组调度系统及方法,系统包括粒子群模块和深入强化学习模型,其中所述深入强化学习模型包括评估网络、经验回放池、目标网络和损失函数,其中,所述粒子群模块的输入为负荷需求,输出连接所述评估网络,评估网络输出Q估计值和所述经验回放池;所述经验回放池输出连接所述目标网络,所述目标网络输出Q目标值,Q目标值与Q估计值均输入所述损失函数,损失函数的输出再反馈给评估网络。本发明在优化机组调度的同时,切实从节约燃煤量的角度出发,既要满足负荷要求,也要在每一度电上至少节约出0.1克燃煤量,同时实现底层设备与机组调度控制一体化的控制优化。

Description

一种基于粒子群和深度强化学习的机组调度系统及方法
技术领域
本发明属于信息控制领域,涉及一种基于粒子群和深度强化学习的机组调度系统及方法。
背景技术
电力机组经济调度是电力系统运行中的重要环节,由于其多约束,非线性和高维度的特点,一直成为学术学者的研究对象。机组经济调度优化的意义对电力系统不仅仅是提高工作运行效率,更大大提升了电力企业的综合效益,减小了环境影响,而且人工智能的应用实现了系统自动化和智能化。
电力经济调度可以理解为:在保证满足电力生产的前提下,安全且充分调度各机组的发电生产,使得发电成本最低。目前有很多关于机组经济优化问题的研究,比如遗传算法,蚁群算法,粒子群算法,神经网络,强化学习以及各种不同算法相融合产生的算法。随着电力系统的发展,机组经济调度复杂程度增加,在原有的机组经济优化的问题中添加了不同的约束,如机组启停时间成本,机组爬坡消耗成本等等。然而,所有研究中只是在原有系统中优化了机组调度,但无法实现底层设备参数一体化的控制优化,从而无法进一步优化所需燃煤量。
发明内容
为解决上述问题,本发明的目的在于提供一种基于粒子群和深度强化学习的机组调度系统,包括粒子群模块和深入强化学习模型,其中所述深入强化学习模型包括评估网络、经验回放池、目标网络和损失函数,其中,
所述粒子群模块的输入为负荷需求,输出连接所述评估网络,评估网络输出Q估计值和所述经验回放池;所述经验回放池输出连接所述目标网络,所述目标网络输出Q目标值,Q目标值与Q估计值均输入所述损失函数,损失函数的输出再反馈给评估网络。
优选地,所述粒子群模块输出目标燃煤量和底层可控设备参数,目标燃煤量作为输入状态,底层可控设备参数作为输入动作。
优选地,所述评估网络向所述经验回放池输出的为目标燃煤量、底层可控设备参数、预估奖励和下一状态的目标燃煤量。
优选地,所述经验回放池向所述目标网络输出的为下一状态的目标燃煤量。
优选地,所述粒子群模块中粒子数为80,惯性权重w=1,学习因子c1=c2=2.01,粒子的最大速度为1,迭代次数为1500次,适应值函数为:
Figure BDA0002368581920000021
其中ai,bi,ci为各机组能耗系数;粒子位置和速度更新公式为:
Figure BDA0002368581920000022
其中,k表示迭代步数,α为收缩因子,
Figure BDA0002368581920000023
pbest为粒子历史中最优位置,gbest为全部粒子中最优位置,rand()为随机函数取值范围是[0,1]。
基于上述目的,本发明还提供了一种上述基于粒子群和深度强化学习的机组调度系统的方法,包括以下步骤:
S10,根据负荷需求利用粒子群模块优化得出所有机组出力:以符合需求指令为目标,在各个机组发力的约束下,利用粒子群模块对所有机组进行合理分配,所得结果为各个机组的生产值;
S20,根据机组出力计算燃煤量:根据燃煤量和机组出力的转化公式计算得到燃煤量和平均燃煤量、即为每度电的燃煤量,目标燃煤量为平均燃煤量至少再减少1g燃煤量每度电;
S30,将目标燃煤量作为输入状态,风水煤等底层可调节设备参数作为输入动作,输入到深度强化学习模型中;
S40,以目标燃煤量为目标,调控底层可控设备参数,所得结果在目标燃煤量的前提下,得到所有底层设备控制器的最优参数;
S50,根据目标燃煤量和机组负荷需求得到新的燃煤量和成本;按照新的成本和负荷需求重新利用粒子群模块规划机组输出,重复S10-S40,根据目标燃煤量得到底层设备最优参数,最后根据新的成本函数重新规划机组出力。
优选地,S40中,将目标燃煤量作为输入状态s,底层可控设备参数作为输入动作a,输入到深度强化学习模型的评估网络中,评估网络自主学习得到达到下一状态的预估奖励,并将Q估计值输入损失函数,将输入状态s,输入动作a,预估奖励r和下一状态s’组合并存输入经验回放池中,以下一状态s’作为输入状态输入到目标网络中得到实际可得的奖励,即为Q目标值,将Q目标值和Q估计值的差作为深度强化学习模型的反馈再次输入评估网络,提升学习性能。
与现有技术相比,本发明至少有以下有益效果:在优化机组调度的同时,切实从节约燃煤量的角度出发,既要满足负荷需求,也要在每一度电上至少节约出0.1克燃煤量,同时实现底层设备与机组调度控制一体化的控制优化。本发明组合了粒子群模块和深度强化学习模型。粒子群模块有参数少、易实现、寻找全局最优等特点,在机组调度优化问题上有着普遍的应用。深度强化学习模型是深度学习和强化学习的结合,深度学习具有较强的感知能力,但缺乏一定的决策能力;而强化学习具有决策能力,将两者结合起来优势互补,对复杂系统感知决策问题提供了解决思路。
附图说明
图1为本发明实施例的基于粒子群和深度强化学习的机组调度系统的结构框图;
图2为本发明具体实施例的基于粒子群和深度强化学习的机组调度方法的步骤流程图;
图3为本发明实施例的基于粒子群和深度强化学习的机组调度的对机组出力分配优化前后的变化图;
图4为本发明实施例的基于粒子群和深度强化学习的机组调度优化机组出力过程中的电厂成本的变化过程示意图;
图5为本发明实施例的基于粒子群和深度强化学习系统的损失函数的变化过程示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
相反,本发明涵盖任何由权利要求定义的在本发明的精髓和范围上做的替代、修改、等效方法以及方案。进一步,为了使公众对本发明有更好的了解,在下文对本发明的细节描述中,详尽描述了一些特定的细节部分。对本领域技术人员来说没有这些细节部分的描述也可以完全理解本发明。
系统实施例1
参见图1,所示为本发明一实施例的基于粒子群和深度强化学习的机组调度系统包括粒子群模块10和深入强化学习模型20,其中所述深入强化学习模型20包括评估网络21、经验回放池22、目标网络23和损失函数24,其中,
粒子群模块10的输入为负荷需求,输出连接评估网络21,评估网络21输出Q估计值和经验回放池22;经验回放池22输出连接目标网络23,目标网络23输出Q目标值,Q目标值与Q估计值均输入损失函数24,损失函数24的输出再反馈给评估网络21。
系统实施例2
粒子群模块10输出目标燃煤量和底层可控设备参数,目标燃煤量作为输入状态,底层可控设备参数作为输入动作。
评估网络21向经验回放池22输出的为目标燃煤量、底层可控设备参数、预估奖励和下一状态的目标燃煤量。
经验回放池22向目标网络23输出的为下一状态的目标燃煤量。
粒子群模块10中粒子数为80,惯性权重w=1,学习因子c1=c2=2.01,粒子的最大速度为1,迭代次数为1500次,适应值函数为:
Figure BDA0002368581920000051
Figure BDA0002368581920000052
其中ai,bi,ci为各机组能耗系数;粒子位置和速度更新公式为:
Figure BDA0002368581920000053
其中,k表示迭代步数,α为收缩因子,
Figure BDA0002368581920000054
pbest为粒子历史中最优位置,gbest为全部粒子中最优位置,rand()为随机函数取值范围是[0,1]。
深度强化学习模型20中的参数设置:使用fixed Q-network和经验回放池22实现深度强化学习。其中fixed Q-network中的评估网络21和目标网络23均为5层隐藏层,每层为20个神经元,每5步替换目标网络的参数,激活函数为
Figure BDA0002368581920000055
学习率为0.01,ε-greedy设置为0.9,奖励衰减值γ为0.9,记忆存储为500,奖励规则为若高于负荷要求则为+1,若低于负荷要求则为-1,若满足负荷要求则为0,迭代次数为300次,深度强化学习奖励函数是以成本函数为基础设计。输入层为观测值(Observation),动作(Action)为二次风挡板开度a,磨煤机速度b,皮带转速c,给水量阀门开度d,给水泵功率e。观测表如表1所示,其中,C为平均燃煤量,C-0.1、C-0.2、C-0.3、C-0.4、C-0.5为目标平均燃煤量,即为最少节省0.1g、0.2g、0.3g、0.4g和0.5g燃煤量每度电。
表1观测表
Figure BDA0002368581920000056
方法实施例
参见图2,一种上述基于粒子群和深度强化学习的机组调度系统的方法,包括以下步骤:
S10,根据负荷需求利用粒子群模块优化得出所有机组出力:以符合需求指令为目标,在各个机组发力的约束下,利用粒子群模块对所有机组进行合理分配,所得结果为各个机组的生产值;
S20,根据机组出力计算燃煤量:根据燃煤量和机组出力的转化公式计算得到燃煤量和平均燃煤量、即为每度电的燃煤量,目标燃煤量为平均燃煤量至少再减少1g燃煤量每度电;
S30,将目标燃煤量作为输入状态,风水煤等底层可调节设备参数作为输入动作,输入到深度强化学习模型中;
S40,以目标燃煤量为目标,调控底层可控设备参数,所得结果在目标燃煤量的前提下,得到所有底层设备控制器的最优参数;
S50,根据目标燃煤量和机组负荷需求得到新的燃煤量和成本;按照新的成本和负荷需求重新利用粒子群模块规划机组输出,重复S10-S40,根据目标燃煤量得到底层设备最优参数,最后根据新的成本函数重新规划机组出力。
具体实施例中,S40中,将目标燃煤量作为输入状态s,底层可控设备参数作为输入动作a,输入到深度强化学习模型的评估网络中,评估网络自主学习得到达到下一状态的预估奖励,并将Q估计值输入损失函数,将输入状态s,输入动作a,预估奖励r和下一状态s’组合并存输入经验回放池中,以下一状态s’作为输入状态输入到目标网络中得到实际可得的奖励,即为Q目标值,将Q目标值和Q估计值的差作为深度强化学习模型的反馈再次输入评估网络,提升学习性能。
具体实施例中
首先利用粒子群模块根据负荷需求优化各个机组出力,得到的仿真效果参见图3,图4。
图3为利用收缩因子粒子群模块10对机组出力分配优化前后的变化图,横坐标为机组数,共40个机组。纵坐标为每个机组的出力情况。黑色柱状图为优化前的机组初始出力,白色柱状图为优化后的机组出力。
图4为优化机组出力过程中的电厂成本的变化过程。横坐标为方法迭代步数,纵坐标为电厂成本。从图中可以看出随着方法迭代,曲线一直呈现下降趋势,电厂成本也在不断下降。
根据以下公式利用优化后的各机组出力计算出燃煤量:
Figure BDA0002368581920000071
Figure BDA0002368581920000072
其中B为锅炉燃烧量(t/h),N为机组输出功率(MW),Qnet,ar为燃煤收到基低位发热量(kJ/kg),29271为标煤低位发热量(kJ/kg),fb为发电标煤耗(g/kWh)。
将燃煤量除以负荷需求得出每度电的煤耗量C,划分5个目标燃煤量状态(state),分别为C-0.1、C-0.2、C-0.3、C-0.4和C-0.5,将观测值(observation)输入深度强化学习模型,所得效果参见图5,
图5为深度强化学习模型20中损失函数的变化过程,横坐标为深度强化学习的学习步数,纵坐标为深度强化学习中预测误差的变化情况。因为输入是一个不断探索的过程,并且输入的数据是根据学习情况所获得,所以曲线并不是光滑的曲线。
根据新的燃煤成本和原有的负荷要求重新利用粒子群模块规划机组出力,完成整个机组调度的优化。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (7)

1.一种基于粒子群和深度强化学习的机组调度系统,其特征在于,包括粒子群模块和深入强化学习模型,其中所述深入强化学习模型包括评估网络、经验回放池、目标网络和损失函数,其中,
所述粒子群模块的输入为负荷需求,输出连接所述评估网络,评估网络输出Q估计值和所述经验回放池;所述经验回放池输出连接所述目标网络,所述目标网络输出Q目标值,Q目标值与Q估计值均输入所述损失函数,损失函数的输出再反馈给评估网络。
2.根据权利要求1所述的基于粒子群和深度强化学习的机组调度系统,其特征在于,所述粒子群模块输出目标燃煤量和底层可控设备参数,目标燃煤量作为输入状态,底层可控设备参数作为输入动作。
3.根据权利要求1所述的基于粒子群和深度强化学习的机组调度系统,其特征在于,所述评估网络向所述经验回放池输出的为目标燃煤量、底层可控设备参数、预估奖励和下一状态的目标燃煤量。
4.根据权利要求1所述的基于粒子群和深度强化学习的机组调度系统,其特征在于,所述经验回放池向所述目标网络输出的为下一状态的目标燃煤量。
5.根据权利要求1所述的基于粒子群和深度强化学习的机组调度系统,其特征在于,所述粒子群模块中粒子数为80,惯性权重w=1,学习因子c1=c2=2.01,粒子的最大速度为1,迭代次数为1500次,适应值函数为:
Figure FDA0002368581910000011
其中ai,bi,ci为各机组能耗系数;粒子位置和速度更新公式为:
Figure FDA0002368581910000012
其中,k表示迭代步数,α为收缩因子,
Figure FDA0002368581910000013
pbest为粒子历史中最优位置,gbest为全部粒子中最优位置,rand()为随机函数取值范围是[0,1]。
6.一种采用权利要求1-5之一所述的基于粒子群和深度强化学习的机组调度系统的方法,其特征在于,包括以下步骤:
S10,根据负荷需求利用粒子群模块优化得出所有机组出力:以符合需求指令为目标,在各个机组发力的约束下,利用粒子群模块对所有机组进行合理分配,所得结果为各个机组的生产值;
S20,根据机组出力计算燃煤量:根据燃煤量和机组出力的转化公式计算得到燃煤量和平均燃煤量、即为每度电的燃煤量,目标燃煤量为平均燃煤量至少再减少1g燃煤量每度电;
S30,将目标燃煤量作为输入状态,风水煤等底层可调节设备参数作为输入动作,输入到深度强化学习模型中;
S40,以目标燃煤量为目标,调控底层可控设备参数,所得结果在目标燃煤量的前提下,得到所有底层设备控制器的最优参数;
S50,根据目标燃煤量和机组负荷需求得到新的燃煤量和成本;按照新的成本和负荷需求重新利用粒子群模块规划机组输出,重复S10-S40,根据目标燃煤量得到底层设备最优参数,最后根据新的成本函数重新规划机组出力。
7.根据权利要求6所述的方法,其特征在于,所述S40中,将目标燃煤量作为输入状态s,底层可控设备参数作为输入动作a,输入到深度强化学习模型的评估网络中,评估网络自主学习得到达到下一状态的预估奖励,并将Q估计值输入损失函数,将输入状态s,输入动作a,预估奖励r和下一状态s’组合并存输入经验回放池中,以下一状态s’作为输入状态输入到目标网络中得到实际可得的奖励,即为Q目标值,将Q目标值和Q估计值的差作为深度强化学习模型的反馈再次输入评估网络,提升学习性能。
CN202010043546.0A 2020-01-15 2020-01-15 一种基于粒子群和深度强化学习的机组调度系统及方法 Active CN111275572B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010043546.0A CN111275572B (zh) 2020-01-15 2020-01-15 一种基于粒子群和深度强化学习的机组调度系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010043546.0A CN111275572B (zh) 2020-01-15 2020-01-15 一种基于粒子群和深度强化学习的机组调度系统及方法

Publications (2)

Publication Number Publication Date
CN111275572A true CN111275572A (zh) 2020-06-12
CN111275572B CN111275572B (zh) 2023-07-11

Family

ID=71001640

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010043546.0A Active CN111275572B (zh) 2020-01-15 2020-01-15 一种基于粒子群和深度强化学习的机组调度系统及方法

Country Status (1)

Country Link
CN (1) CN111275572B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112016811A (zh) * 2020-08-04 2020-12-01 四叶草(苏州)智能科技有限公司 一种基于强化学习的agv智能调度系统及方法
CN114647191A (zh) * 2022-03-28 2022-06-21 华北电力大学 一种基于锅炉热负荷均衡分配的制粉系统优化调度方法
CN118471456A (zh) * 2024-07-12 2024-08-09 广东医通软件有限公司 一种急诊医疗资源的调度方法、系统、设备与存储介质

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012143424A1 (fr) * 2011-04-19 2012-10-26 Ge Energy Products France Snc Système et procédé de commande d'une installation de production d'énergie électrique
US20140277599A1 (en) * 2013-03-13 2014-09-18 Oracle International Corporation Innovative Approach to Distributed Energy Resource Scheduling
CN104682405A (zh) * 2015-03-31 2015-06-03 福州大学 一种基于禁忌粒子群算法的配电网无功优化方法
CN108108532A (zh) * 2017-12-06 2018-06-01 华南理工大学 运用粒子群算法优化功率电子电路的方法
CN108390369A (zh) * 2017-12-31 2018-08-10 天津求实智源科技有限公司 电力负荷总功率实时分解方法与系统
CN108539784A (zh) * 2018-04-13 2018-09-14 华南理工大学 基于需求侧响应的微电网最优机组及分时电价的优化方法
CN109347149A (zh) * 2018-09-20 2019-02-15 国网河南省电力公司电力科学研究院 基于深度q值网络强化学习的微电网储能调度方法及装置
US20190236446A1 (en) * 2018-01-29 2019-08-01 Lawrence Livermore National Security, Llc Optimization control technology for building energy conservation
CN110414725A (zh) * 2019-07-11 2019-11-05 山东大学 预测决策一体化的风电场储能系统调度方法及装置
CN110515303A (zh) * 2019-09-17 2019-11-29 余姚市浙江大学机器人研究中心 一种基于ddqn的自适应动态路径规划方法
CN110518580A (zh) * 2019-08-15 2019-11-29 上海电力大学 一种考虑微网主动优化的主动配电网运行优化方法
CN110535146A (zh) * 2019-08-27 2019-12-03 哈尔滨工业大学 基于深度确定策略梯度强化学习的电力系统无功优化方法

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012143424A1 (fr) * 2011-04-19 2012-10-26 Ge Energy Products France Snc Système et procédé de commande d'une installation de production d'énergie électrique
US20140277599A1 (en) * 2013-03-13 2014-09-18 Oracle International Corporation Innovative Approach to Distributed Energy Resource Scheduling
CN104682405A (zh) * 2015-03-31 2015-06-03 福州大学 一种基于禁忌粒子群算法的配电网无功优化方法
CN108108532A (zh) * 2017-12-06 2018-06-01 华南理工大学 运用粒子群算法优化功率电子电路的方法
CN108390369A (zh) * 2017-12-31 2018-08-10 天津求实智源科技有限公司 电力负荷总功率实时分解方法与系统
US20190236446A1 (en) * 2018-01-29 2019-08-01 Lawrence Livermore National Security, Llc Optimization control technology for building energy conservation
CN108539784A (zh) * 2018-04-13 2018-09-14 华南理工大学 基于需求侧响应的微电网最优机组及分时电价的优化方法
CN109347149A (zh) * 2018-09-20 2019-02-15 国网河南省电力公司电力科学研究院 基于深度q值网络强化学习的微电网储能调度方法及装置
CN110414725A (zh) * 2019-07-11 2019-11-05 山东大学 预测决策一体化的风电场储能系统调度方法及装置
CN110518580A (zh) * 2019-08-15 2019-11-29 上海电力大学 一种考虑微网主动优化的主动配电网运行优化方法
CN110535146A (zh) * 2019-08-27 2019-12-03 哈尔滨工业大学 基于深度确定策略梯度强化学习的电力系统无功优化方法
CN110515303A (zh) * 2019-09-17 2019-11-29 余姚市浙江大学机器人研究中心 一种基于ddqn的自适应动态路径规划方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
叶琳 等: "深度学习在电力系统中的应用研究综述" *
周念成 等: "深度学习在智能电网中的应用现状分析与展望" *
钱建生 等: "深度学习耦合粒子群优化SVM的瓦斯浓度预测" *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112016811A (zh) * 2020-08-04 2020-12-01 四叶草(苏州)智能科技有限公司 一种基于强化学习的agv智能调度系统及方法
CN114647191A (zh) * 2022-03-28 2022-06-21 华北电力大学 一种基于锅炉热负荷均衡分配的制粉系统优化调度方法
CN118471456A (zh) * 2024-07-12 2024-08-09 广东医通软件有限公司 一种急诊医疗资源的调度方法、系统、设备与存储介质

Also Published As

Publication number Publication date
CN111275572B (zh) 2023-07-11

Similar Documents

Publication Publication Date Title
CN112186743B (zh) 一种基于深度强化学习的动态电力系统经济调度方法
Li et al. Coordinated load frequency control of multi-area integrated energy system using multi-agent deep reinforcement learning
Zheng et al. Distributed model predictive control for on-connected microgrid power management
CN111934335A (zh) 一种基于深度强化学习的集群电动汽车充电行为优化方法
CN111340274A (zh) 一种基于虚拟电厂参与的综合能源系统优化方法和系统
CN111275572A (zh) 一种基于粒子群和深度强化学习的机组调度系统及方法
CN112529256B (zh) 考虑多重不确定性的分布式电源集群日前调度方法和系统
CN106712075B (zh) 一种考虑风电并网系统安全约束的调峰策略优化方法
Xi et al. Automatic generation control based on multiple-step greedy attribute and multiple-level allocation strategy
CN116001624A (zh) 基于深度强化学习的一桩多联电动汽车有序充电方法
CN114648165B (zh) 一种基于多智能体博弈的多热源供热系统优化调度方法
CN112966444B (zh) 一种建筑多能源系统智慧能量优化方法及装置
CN112668791A (zh) 热电联供系统的优化方法
CN112952847B (zh) 考虑用电需求弹性的多区域主动配电系统调峰优化方法
CN117057553A (zh) 一种基于深度强化学习的家庭能源需求响应优化方法及系统
CN115544899A (zh) 基于多智能体深度强化学习的水厂取水泵站节能调度方法
CN112132379A (zh) 考虑经济性的新能源跨区域消纳评估方法和存储介质
CN115207977A (zh) 一种有源配电网深度强化学习实时调度方法及系统
CN113869742B (zh) 基于行动家和评论家网络的综合供需侧的电力调度系统
CN117455183A (zh) 一种基于深度强化学习的综合能源系统优化调度方法
CN109066769B (zh) 风电全消纳下虚拟电厂内部资源调度控制方法
CN117791643A (zh) 风光水火储协同博弈的电网智能调频方法及系统
CN117791645A (zh) 储能辅助电网调频方法及系统
CN115411776B (zh) 住宅综合能源系统的热电协同调度方法及装置
CN113824116B (zh) 一种基于混合时间尺度drl的综合能源在线调度方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant