CN111047071A - 基于深度迁移学习和Stackelberg博弈的电力系统实时供需互动方法 - Google Patents

基于深度迁移学习和Stackelberg博弈的电力系统实时供需互动方法 Download PDF

Info

Publication number
CN111047071A
CN111047071A CN201911037001.2A CN201911037001A CN111047071A CN 111047071 A CN111047071 A CN 111047071A CN 201911037001 A CN201911037001 A CN 201911037001A CN 111047071 A CN111047071 A CN 111047071A
Authority
CN
China
Prior art keywords
power system
demand
leader
learning
time supply
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911037001.2A
Other languages
English (en)
Other versions
CN111047071B (zh
Inventor
周宇
胡卫丰
景春明
周洪益
余涛
曾江
瞿凯平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China University of Technology SCUT
State Grid Jiangsu Electric Power Co Ltd
Yancheng Power Supply Co of State Grid Jiangsu Electric Power Co Ltd
Original Assignee
South China University of Technology SCUT
State Grid Jiangsu Electric Power Co Ltd
Yancheng Power Supply Co of State Grid Jiangsu Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China University of Technology SCUT, State Grid Jiangsu Electric Power Co Ltd, Yancheng Power Supply Co of State Grid Jiangsu Electric Power Co Ltd filed Critical South China University of Technology SCUT
Priority to CN201911037001.2A priority Critical patent/CN111047071B/zh
Publication of CN111047071A publication Critical patent/CN111047071A/zh
Application granted granted Critical
Publication of CN111047071B publication Critical patent/CN111047071B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/067Enterprise or organisation modelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Marketing (AREA)
  • Tourism & Hospitality (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Water Supply & Treatment (AREA)
  • Public Health (AREA)
  • Primary Health Care (AREA)
  • Educational Administration (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Supply And Distribution Of Alternating Current (AREA)

Abstract

本发明提供了一种基于深度迁移学习和Stackelberg博弈的电力系统实时供需互动方法,该方法基于Stackelberg博弈对策,构建了同时实现供需侧利益最大化的电力系统实时供需互动模型。并针对所构建的模型,提出了一种基于深度迁移学习的优化算法。该算法基于强化学习机制,对数学模型的依赖程度低,可求解含阀点效应的电力系统非凸供需互动模型;适用于Stackelberg博弈对策构建的分布式框架;并且可以通过深度神经网络有效利用历史优化任务的遗留信息进行迁移学习,明显提升新优化任务的求解速度,可快速高效地求解实时供需互动模型。

Description

基于深度迁移学习和Stackelberg博弈的电力系统实时供需 互动方法
技术领域
本发明涉及电力系统实时供需互动领域,特别是涉及基于深度迁移学习和Stackelberg博弈的电力系统实时供需互动方法。
背景技术
经济调度是电力系统日常调度的重要环节,其目的是满足功率平衡等运行约束条件下最小化系统的发电成本,对系统的经济安全运行具有重要意义。而随着智能用电的发展,在一定范围内可调节的柔性负荷越来越多,如空调、洗衣机等可转移负荷和电动汽车、储能等双向可控负荷。从需求响应中挖掘系统调节潜能改善供需关系正在成为一种新的趋势。因此,如何正确引导需求侧参与调度运行是智能电网需要关注的问题。
由于经济调度和需求响应都参与能源市场,并且时刻满足平衡约束条件,所以两者是相互影响的。一方面,用户将调整用电需求以最大化利润来响应市场,需求响应的结果会影响负荷曲线;另一方面,经济调度将导致市场价格等条件发生变化,这将改变需求响应的结果。如果经济调度和需求响应单方面进行,则较难交互收敛。
发明内容
本发明提供基于深度迁移学习和Stackelberg博弈的电力系统实时供需互动方法。该方法基于强化学习机制,对数学模型的依赖程度低,可求解含阀点效应的电力系统非凸供需互动模型;适用于Stackelberg博弈对策构建的分布式框架;并且可以通过深度学习有效利用历史优化任务的遗留信息进行迁移学习,明显提升新优化任务的求解速度,可快速高效地求解实时供需互动模型。
本发明具体为基于深度迁移学习和Stackelberg博弈的电力系统实时供需互动方法,包括以下步骤:
步骤S1、初始化算法参数;
步骤S2、获取发电机成本参数、发电机约束参数、用户需求参数,负荷效用参数,用户约束参数;获取新优化任务的负荷参数;
步骤S3、对任务进行分类并形成初始知识矩阵,若为源任务,则随机形成源任务初始知识矩阵;若为新任务,则基于深度学习提炼出新任务初始知识矩阵;
步骤S4、利用种群进行寻优;
步骤S5、从能量管理系统中获取其他跟随者当前的最佳策略;
步骤S6、计算每个个体的目标函数;
步骤S7、计算奖励函数;
步骤S8、更新知识矩阵;
步骤S9、将当前的最优策略告知领导者,由领导者修正最优策略并重新计算每个个体的目标函数;
步骤S10、判断是否达到最大迭代次数,若达到,输出相应任务的最优知识矩阵;否则,返回动作选择步骤,迭代继续进行。
进一步的,所述步骤S1中的算法参数包括学习因子α、折扣因子γ、种群大小J、二进制串长度M、奖励常数pm、奖励校正系数cf、贪婪探索率ε和最大迭代次数kmax
进一步的,所述步骤S4中的利用种群进行寻优具体为:
Figure BDA0002251792300000021
式中,q0是0到1之间的随机数;ε是采取贪婪寻优法则策略的概率;arand是采取随机寻优策略的概率。
进一步的,所述步骤S6中的目标函数具体为:
跟随者的效益函数为:
Figure BDA0002251792300000022
其中,
Figure BDA0002251792300000023
是平衡机组的发电成本,
Figure BDA0002251792300000024
是平衡机组的有功功率,
Figure BDA0002251792300000025
是除去平衡机组和第t个跟随者后,其余发电机的发电成本与柔性负荷效益之差,Ft随着跟随者PGi或PDj的变化而变化;
领导者平衡机组的效益函数为:
Figure BDA0002251792300000026
其中,
Figure BDA0002251792300000027
表示当前所有追随者的最优策略集,包括了当前所有发电机和柔性负荷的最优有功输出和有功需求。
进一步的,所述步骤S7中的奖励函数具体为:
Figure BDA0002251792300000031
Figure BDA0002251792300000032
其中,
Figure BDA0002251792300000033
代表在第i个智能体的第k次迭代中,种群中最优个体的目标函数最小值;
Figure BDA0002251792300000034
代表了第i个智能体的第k次迭代中的目标函数;pm是一个为正的倍数;cf表示为了保证奖励函数为正的校正系数;
Figure BDA0002251792300000035
表示第i个智能体的第k次迭代中最优个体的状态-动作对集合。
进一步的,所述步骤S8中的更新知识矩阵具体为:
Figure BDA0002251792300000036
式中,α是学习因子;γ是折扣因子;上标k和j分别表示第k次迭代和第j个个体;下标i和m分别表示第i个智能体和第m个二进制位;ΔQ是知识增量;J为一次迭代中的种群大小;(s,a)表示状态-动作对;R(sk,sk+1,ak)是在动作ak发生时从状态sk转换到状态sk+1的奖励函数;aim是可选动作。
进一步的,所述步骤S9具体包括:
Figure BDA0002251792300000037
式中,p为领导者的可选策略;
Figure BDA0002251792300000038
是在领导者采取策略p后各跟随者的最优策略集合;
Figure BDA0002251792300000039
为第i个跟随者的最优策略;Uleader为领导者的效益函数;Ui为第i个跟随者的效益函数;Ai为跟随者的策略域;
Figure BDA00022517923000000310
为领导者的最优策略;
Figure BDA00022517923000000311
为领导者的可选策略;
Figure BDA00022517923000000312
为所有跟随者的最优策略。
进一步的,所述Stackelberg博弈的电力系统实时供需互动模型中,选取一台容量约束范围较大的发电机作为平衡机组,并将其设置为领导者,用于供需互动的“集中协调”,从而使系统在满足功率平衡的约束下总体经济效益最大化。所述Stackelberg博弈的电力系统实时供需互动模型中,跟随者在观察到平衡机组给出的决策后,假定在博弈场上除自身外其他跟随者功率不变,选择一个使得自身效益函数最大的策略。
进一步的,所述基于深度迁移的电力系统实时供需互动优化算法采用Q学习算法展开快速优化,采用状态-动作的二进制编码技术,将原来的大规模知识矩阵可以分解成几个小规模知识矩阵Qim。所述基于深度迁移的电力系统实时供需互动优化算法,采用一群合作的个体同时与环境交互学习的方式,大大提高了学习的效率。所述基于深度迁移的电力系统实时供需互动优化算法,通过种群中的合作个体共享并更新相应的知识矩阵实现寻优,知识更新采用局部贪婪的方式进行,以保证算法的全局收敛效果。
本发明的基于深度迁移学习和Stackelberg博弈的电力系统实时供需互动方法相对于现有技术具有如下的优点及效果:
(1)本发明设计的基于深度迁移学习和Stackelberg博弈的电力系统实时供需互动方法,充分挖掘了供给侧发电机和需求侧柔性负荷的互动优化调度空间,实现了“分布式自律计算与集中协调”的互动框架,最大化系统的整体效益。
(2)本发明设计的基于深度迁移学习和Stackelberg博弈的电力系统实时供需互动方法,对优化模型的依赖程度较低,不仅可以有效解决含发电机阀点效应的非凸优化问题,还可以满足分布式计算的要求。
(3)本发明设计的基于深度迁移学习和Stackelberg博弈的电力系统实时供需互动方法,利用深度置信网络对历史优化任务的最优知识进行高精度提炼,明显节省寻优时间,可以满足大规模电力系统的供需互动实时优化需求。
(4)本发明设计的基于深度迁移学习和Stackelberg博弈的电力系统实时供需互动方法,采用了相互联系的状态-动作链,有效避免了“维数灾难”。
(5)本发明设计的基于深度迁移学习和Stackelberg博弈的电力系统实时供需互动方法,采用一群合作的个体同时与环境交互学习的方式,大大提高了学习效率,寻优进程明显加快。
附图说明
图1为本发明的基于深度迁移学习和Stackelberg博弈的电力系统实时供需互动方法的流程图;
图2为本发明的知识矩阵利用深度神经网络展开知识迁移的过程示意图。
具体实施方式
下面结合附图对本发明基于深度迁移学习和Stackelberg博弈的电力系统实时供需互动方法的具体实施方式做详细阐述。
请参考图1,本发明的一个实施方式提供一种基于深度迁移学习和Stackelberg博弈的电力系统实时供需互动方法。该实施方式从电网供需互动的实际模型出发,博弈者对应于供给侧的发电机和需求侧的柔性负荷。因此,参与互动博弈的任一发电机或柔性负荷均可选为领导者。该基于深度迁移学习和Stackelberg博弈的电力系统实时供需互动方法包括以下步骤:
步骤S1,初始化算法参数。
基于深度迁移学习的电力系统实时供需互动方法算法的寻优效果受到学习因子α、折扣因子γ、种群大小J、二进制串长度M、奖励常数pm、奖励校正系数cf、贪婪探索率ε、最大迭代次数kmax等的影响。上述参数的初始值设置表1所示:
表1 算法参数设置
参数 取值范围 预学习 在线学习
α 0<α<1 0.9 0.5
γ 0<γ<1 0.1 0.1
J J≥1 20 10
M M≥1 16 16
pm pm≥0 2000 2000
cf cf≥0 2×104 2×104
ε 0<ε<1 0.9 0.95
kmax kmax≥2 50 20
步骤S2,获取获取发电机成本参数、发电机约束参数、用户需求参数,负荷效用参数,用户约束参数。
该实施例包含了279个节点(110千伏、220千伏和500千伏),12个发电厂,375条支路和13120兆瓦的装机容量。在该实施例中,核电站,天然气发电厂和垃圾发电厂用于满足刚性负荷需求,不参与实时供需互动优化。因此只有其余的6台燃煤发电机用于平衡柔性负载。此外,110千伏或以上的71个柔性负荷都参与优化。发电机的主要参数如下表2所示。源任务为从日负荷曲线中选取出来的典型负荷断面。
表2 燃煤发电机的主要参数
Figure BDA0002251792300000051
步骤S3,对任务进行分类并形成初始知识矩阵,若为源任务,则随机形成源任务初始知识矩阵;若为新任务,则基于深度学习提炼出新任务初始知识矩阵。知识矩阵利用深度神经网络展开知识迁移的过程如图2所示。
步骤S4,利用种群进行寻优。具体如下:
Figure BDA0002251792300000061
式中,q0是0到1之间的随机数;ε是采取贪婪寻优法则策略的概率;arand是采取随机寻优策略的概率。
步骤S5,从能量管理系统中获取其他跟随者当前的最佳策略。
步骤S6,计算每个个体的目标函数。具体如下:
跟随者的效益函数为:
Figure BDA0002251792300000062
其中,
Figure BDA0002251792300000063
是平衡机组的发电成本,
Figure BDA0002251792300000064
是平衡机组的有功功率,
Figure BDA0002251792300000065
是除去平衡机组和第t个跟随者后,其余发电机的发电成本与柔性负荷效益之差,Ft随着跟随者PGi或PDj的变化而变化。
领导者平衡机组的效益函数为:
Figure BDA0002251792300000066
其中,
Figure BDA0002251792300000067
表示当前所有追随者的最优策略集,包括了当前所有发电机和柔性负荷的最优有功输出和有功需求。
步骤S7,计算奖励函数。具体如下:
Figure BDA0002251792300000068
Figure BDA0002251792300000069
其中,
Figure BDA00022517923000000610
代表在第i个智能体的第k次迭代中,种群中最优个体的目标函数最小值;
Figure BDA00022517923000000611
代表了第i个智能体的第k次迭代中的目标函数;pm是一个为正的倍数;cf表示为了保证奖励函数为正的校正系数;
Figure BDA0002251792300000071
表示第i个智能体的第k次迭代中最优个体的状态-动作对集合。
步骤S8,更新知识矩阵。具体如下:
Figure BDA0002251792300000072
式中,α是学习因子;γ是折扣因子;上标k和j分别表示第k次迭代和第j个个体;下标i和m分别表示第i个智能体和第m个二进制位;ΔQ是知识增量;J为一次迭代中的种群大小;(s,a)表示状态-动作对;R(sk,sk+1,ak)是在动作ak发生时从状态sk转换到状态sk+1的奖励函数;aim是可选动作。
步骤S9,将当前的最优策略告知领导者,由领导者修正最优策略并重新计算每个个体的目标函数。具体如下:
Figure BDA0002251792300000073
式中,p为领导者的可选策略;
Figure BDA0002251792300000074
是在领导者采取策略p后各跟随者的最优策略集合;
Figure BDA0002251792300000075
为第i个跟随者的最优策略;Uleader为领导者的效益函数;Ui为第i个跟随者的效益函数;Ai为跟随者的策略域。
Figure BDA0002251792300000076
为领导者的最优策略;
Figure BDA0002251792300000077
为领导者的可选策略;
Figure BDA0002251792300000078
为所有跟随者的最优策略。
步骤S10,判断是否达到最大迭代次数,若达到,输出相应任务的最优知识矩阵;否则,返回步骤S4,迭代继续进行。
通过以上步骤就可以得到电力系统的实时供需互动结果,同时实现电网侧和用户侧的利益最大化。
上述基于深度迁移学习和Stackelberg博弈的电力系统实时供需互动方法,该方法基于Stackelberg博弈对策的电力系统实时供需互动模型,充分挖掘了供给侧发电机和需求侧柔性负荷的互动优化调度空间,实现了“分布式自律计算与集中协调”的互动框架,最大化系统的整体效益。所提出的基于深度迁移学习的优化算法对优化模型的依赖程度较低,不仅可以有效解决含发电机阀点效应的非凸优化问题,还可以满足分布式计算的要求。该算法利用深度置信网络对历史优化任务的最优知识进行高精度提炼,明显节省寻优时间,可以满足大规模电力系统的供需互动实时优化需求。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (7)

1.基于深度迁移学习和Stackelberg博弈的电力系统实时供需互动方法,其特征在于,所述方法具体包括以下步骤:
步骤S1、初始化算法参数;
步骤S2、获取发电机成本参数、发电机约束参数、用户需求参数,负荷效用参数,用户约束参数;获取新优化任务的负荷参数;
步骤S3、对任务进行分类并形成初始知识矩阵,若为源任务,则随机形成源任务初始知识矩阵;若为新任务,则基于深度学习提炼出新任务初始知识矩阵;
步骤S4、利用种群进行寻优;
步骤S5、从能量管理系统中获取其他跟随者当前的最佳策略;
步骤S6、计算每个个体的目标函数;
步骤S7、计算奖励函数;
步骤S8、更新知识矩阵;
步骤S9、将当前的最优策略告知领导者,由领导者修正最优策略并重新计算每个个体的目标函数;
步骤S10、判断是否达到最大迭代次数,若达到,输出相应任务的最优知识矩阵;否则,返回动作选择步骤,迭代继续进行。
2.根据权利要求1所述的基于深度迁移学习和Stackelberg博弈的电力系统实时供需互动方法,其特征在于,所述步骤S1中的算法参数包括学习因子α、折扣因子γ、种群大小J、二进制串长度M、奖励常数pm、奖励校正系数cf、贪婪探索率ε和最大迭代次数kmax
3.根据权利要求1所述的基于深度迁移学习和Stackelberg博弈的电力系统实时供需互动方法,其特征在于,所述步骤S4中的利用种群进行寻优具体为:
Figure FDA0002251792290000011
式中,q0是0到1之间的随机数;ε是采取贪婪寻优法则策略的概率;arand是采取随机寻优策略的概率。
4.根据权利要求1所述的基于深度迁移学习和Stackelberg博弈的电力系统实时供需互动方法,其特征在于,所述步骤S6中的目标函数具体为:
跟随者的效益函数为:
Figure FDA0002251792290000021
其中,ft slack是平衡机组的发电成本,PG slack是平衡机组的有功功率,ft other是除去平衡机组和第t个跟随者后,其余发电机的发电成本与柔性负荷效益之差,Ft随着跟随者PGi或PDj的变化而变化;
领导者平衡机组的效益函数为:
Figure FDA0002251792290000022
其中,
Figure FDA0002251792290000023
表示当前所有追随者的最优策略集,包括了当前所有发电机和柔性负荷的最优有功输出和有功需求。
5.根据权利要求1所述的基于深度迁移学习和Stackelberg博弈的电力系统实时供需互动方法,其特征在于,所述步骤S7中的奖励函数具体为:
Figure FDA0002251792290000024
Figure FDA0002251792290000025
其中,Fi Best代表在第i个智能体的第k次迭代中,种群中最优个体的目标函数最小值;Fi kj代表了第i个智能体的第k次迭代中的目标函数;pm是一个为正的倍数;cf表示为了保证奖励函数为正的校正系数;SAi Best表示第i个智能体的第k次迭代中最优个体的状态-动作对集合。
6.根据权利要求1所述的基于深度迁移学习和Stackelberg博弈的电力系统实时供需互动方法,其特征在于,所述步骤S8中的更新知识矩阵具体为:
Figure FDA0002251792290000026
式中,α是学习因子;γ是折扣因子;上标k和j分别表示第k次迭代和第j个个体;下标i和m分别表示第i个智能体和第m个二进制位;ΔQ是知识增量;J为一次迭代中的种群大小;(s,a)表示状态-动作对;R(sk,sk+1,ak)是在动作ak发生时从状态sk转换到状态sk+1的奖励函数;aim是可选动作。
7.根据权利要求1所述的基于深度迁移学习和Stackelberg博弈的电力系统实时供需互动方法,其特征在于,所述步骤S9具体包括:
Figure FDA0002251792290000031
式中,p为领导者的可选策略;
Figure FDA0002251792290000032
是在领导者采取策略p后各跟随者的最优策略集合;
Figure FDA0002251792290000033
为第i个跟随者的最优策略;Uleader为领导者的效益函数;Ui为第i个跟随者的效益函数;Ai为跟随者的策略域;
Figure FDA0002251792290000034
为领导者的最优策略;
Figure FDA0002251792290000035
为领导者的可选策略;
Figure FDA0002251792290000036
为所有跟随者的最优策略。
CN201911037001.2A 2019-10-29 2019-10-29 基于深度迁移学习和Stackelberg博弈的电力系统实时供需互动方法 Active CN111047071B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911037001.2A CN111047071B (zh) 2019-10-29 2019-10-29 基于深度迁移学习和Stackelberg博弈的电力系统实时供需互动方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911037001.2A CN111047071B (zh) 2019-10-29 2019-10-29 基于深度迁移学习和Stackelberg博弈的电力系统实时供需互动方法

Publications (2)

Publication Number Publication Date
CN111047071A true CN111047071A (zh) 2020-04-21
CN111047071B CN111047071B (zh) 2022-06-24

Family

ID=70232573

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911037001.2A Active CN111047071B (zh) 2019-10-29 2019-10-29 基于深度迁移学习和Stackelberg博弈的电力系统实时供需互动方法

Country Status (1)

Country Link
CN (1) CN111047071B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111626527A (zh) * 2020-06-10 2020-09-04 太原理工大学 计及可调度电动汽车快/慢充放电形式的智能电网深度学习调度方法
CN112132350A (zh) * 2020-09-27 2020-12-25 广东电网有限责任公司 一种实时需求响应方法和装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090119239A1 (en) * 2007-10-15 2009-05-07 University Of Southern California Agent security via approximate solvers
CN106779248A (zh) * 2017-01-11 2017-05-31 南方电网科学研究院有限责任公司 一种基于极限迁移学习的电力系统经济调度分散q方法
CN108347062A (zh) * 2018-01-12 2018-07-31 华南理工大学 基于势博弈的微电网能量管理分布式多目标协同优化算法
CN109784545A (zh) * 2018-12-24 2019-05-21 深圳供电局有限公司 一种基于多智能体的分布式能源枢纽的调度方法
CN110048461A (zh) * 2019-05-16 2019-07-23 广东电网有限责任公司 一种多虚拟电厂分散自律优化方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090119239A1 (en) * 2007-10-15 2009-05-07 University Of Southern California Agent security via approximate solvers
CN106779248A (zh) * 2017-01-11 2017-05-31 南方电网科学研究院有限责任公司 一种基于极限迁移学习的电力系统经济调度分散q方法
CN108347062A (zh) * 2018-01-12 2018-07-31 华南理工大学 基于势博弈的微电网能量管理分布式多目标协同优化算法
CN109784545A (zh) * 2018-12-24 2019-05-21 深圳供电局有限公司 一种基于多智能体的分布式能源枢纽的调度方法
CN110048461A (zh) * 2019-05-16 2019-07-23 广东电网有限责任公司 一种多虚拟电厂分散自律优化方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
吴杰: "基于博弈论的微电网能源优化调度算法的研究", 《中国优秀博硕士学位论文全文数据库(硕士)工程科技Ⅱ辑》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111626527A (zh) * 2020-06-10 2020-09-04 太原理工大学 计及可调度电动汽车快/慢充放电形式的智能电网深度学习调度方法
CN111626527B (zh) * 2020-06-10 2023-02-03 太原理工大学 计及可调度电动汽车快/慢充放电形式的智能电网深度学习调度方法
CN112132350A (zh) * 2020-09-27 2020-12-25 广东电网有限责任公司 一种实时需求响应方法和装置

Also Published As

Publication number Publication date
CN111047071B (zh) 2022-06-24

Similar Documents

Publication Publication Date Title
Wang et al. Optimal bidding strategy for microgrids in joint energy and ancillary service markets considering flexible ramping products
Zhou et al. Multi-energy net load forecasting for integrated local energy systems with heterogeneous prosumers
Glotić et al. Short-term combined economic and emission hydrothermal optimization by surrogate differential evolution
Peng et al. Dynamic economic dispatch for wind-thermal power system using a novel bi-population chaotic differential evolution algorithm
Zeynal et al. Improving lagrangian relaxation unit commitment with cuckoo search algorithm
Wu et al. A diploid genetic approach to short-term scheduling of hydro-thermal system
Gjorgiev et al. A multi-objective optimization based solution for the combined economic-environmental power dispatch problem
CN109615146B (zh) 一种基于深度学习的超短时风功率预测方法
Dey et al. Dynamic cost analysis of a grid connected microgrid using neighborhood based differential evolution technique
CN111401604B (zh) 电力系统负荷功率预测方法及储能电站功率分配方法
CN112036611A (zh) 一种计及风险的电网优化规划方法
Zhang et al. MOEA/D-based probabilistic PBI approach for risk-based optimal operation of hybrid energy system with intermittent power uncertainty
CN111047071B (zh) 基于深度迁移学习和Stackelberg博弈的电力系统实时供需互动方法
CN108155673B (zh) 考虑发电侧组合发电不确定性的电力系统优化调度方法
CN111062514A (zh) 一种电力系统规划方法及系统
Liu et al. Flexible network planning of autonomy microgrid
CN113988714A (zh) 计及多重不确定性的园区综合能源系统动态规划方法、设备及介质
CN112713615B (zh) 电—气综合能源系统快速协调调度方法及系统
Postolov et al. Adaptive genetic algorithm for hydro-thermal unit commitment considering the security constraints
Mu et al. A two-stage scheduling method for integrated community energy system based on a hybrid mechanism and data-driven model
Zhang et al. A double-deck deep reinforcement learning-based energy dispatch strategy for an integrated electricity and district heating system embedded with thermal inertial and operational flexibility
CN111767621A (zh) 一种基于知识迁移q学习算法的多能源系统优化调度方法
CN110674460B (zh) 基于E-Seq2Seq技术的数据驱动型机组组合智能决策方法
Yadav Hybridization of particle swarm optimization with differential evolution for solving combined economic emission dispatch model for smart grid
CN111967646A (zh) 一种虚拟电厂可再生能源优化配置方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant