CN112381271B - 一种快速对抗深度置信网络的分布式多目标优化加速方法 - Google Patents
一种快速对抗深度置信网络的分布式多目标优化加速方法 Download PDFInfo
- Publication number
- CN112381271B CN112381271B CN202011189644.1A CN202011189644A CN112381271B CN 112381271 B CN112381271 B CN 112381271B CN 202011189644 A CN202011189644 A CN 202011189644A CN 112381271 B CN112381271 B CN 112381271B
- Authority
- CN
- China
- Prior art keywords
- network
- formula
- optimization
- pareto
- power
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 53
- 238000005457 optimization Methods 0.000 title claims abstract description 48
- 230000001133 acceleration Effects 0.000 title claims abstract description 12
- 230000008569 process Effects 0.000 claims abstract description 10
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 claims abstract description 9
- 229910052799 carbon Inorganic materials 0.000 claims abstract description 9
- 230000006870 function Effects 0.000 claims description 41
- 239000013598 vector Substances 0.000 claims description 21
- 238000012549 training Methods 0.000 claims description 17
- 238000013508 migration Methods 0.000 claims description 10
- 230000005012 migration Effects 0.000 claims description 10
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims description 10
- 210000004027 cell Anatomy 0.000 claims description 6
- 238000010248 power generation Methods 0.000 claims description 6
- 238000013528 artificial neural network Methods 0.000 claims description 4
- 230000005540 biological transmission Effects 0.000 claims description 4
- 150000001875 compounds Chemical class 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 claims description 3
- 238000007476 Maximum Likelihood Methods 0.000 claims description 2
- 230000006978 adaptation Effects 0.000 claims description 2
- 238000013507 mapping Methods 0.000 claims description 2
- 210000002569 neuron Anatomy 0.000 claims description 2
- 238000010606 normalization Methods 0.000 claims description 2
- 238000004088 simulation Methods 0.000 claims description 2
- 230000003213 activating effect Effects 0.000 claims 1
- 230000003247 decreasing effect Effects 0.000 claims 1
- 238000000605 extraction Methods 0.000 claims 1
- 230000017105 transposition Effects 0.000 claims 1
- 230000000694 effects Effects 0.000 abstract description 2
- 230000004927 fusion Effects 0.000 abstract description 2
- 239000000243 solution Substances 0.000 description 21
- 241000282414 Homo sapiens Species 0.000 description 7
- 238000010586 diagram Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 230000004083 survival effect Effects 0.000 description 2
- 239000007983 Tris buffer Substances 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000001351 cycling effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000004146 energy storage Methods 0.000 description 1
- 239000011664 nicotinic acid Substances 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/004—Artificial life, i.e. computing arrangements simulating life
- G06N3/006—Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02J—CIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
- H02J3/00—Circuit arrangements for ac mains or ac distribution networks
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02J—CIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
- H02J3/00—Circuit arrangements for ac mains or ac distribution networks
- H02J3/008—Circuit arrangements for ac mains or ac distribution networks involving trading of energy or energy transmission rights
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Entrepreneurship & Innovation (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Marketing (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Power Engineering (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Artificial Intelligence (AREA)
- Development Economics (AREA)
- Game Theory and Decision Science (AREA)
- Primary Health Care (AREA)
- Educational Administration (AREA)
- Water Supply & Treatment (AREA)
- Public Health (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提出一种快速对抗深度置信网络的分布式多目标优化加速方法,该方法包括了生成式对抗网络的样本数据生成方法和基于深度置信网络的调度优化决策加速方法。首先,通过纳什博弈帕累托多目标优化方法,综合考虑低成本、低碳排放和高舒适度三个目标进行优化。然后,通过生成式对抗网络生成大量样本数据,为深度置信网络的调度优化决策提供数据支持。最后,通过已完成预学习的深度置信网络实现群体智能决策,从而实现信息‑物理‑社会融合能源系统(微元网)的整体最优调度。本发明所提的方法,考虑了能源的社会性,实现了多目标优化的最佳折中,可以利用有限的信息生成大量的数据以辅助决策过程,达到加速优化过程的效果。
Description
技术领域
本发明属于电力系统最优调度与控制决策领域,涉及一种基于人工智能技术的多目标优化加速方法,适用于电力系统的优化调度。
背景技术
现如今分布式可再生能源发电技术发展迅速,以风能和光伏为代表的可再生能源发电系统的大量接入,给传统电网带来了极大的挑战。一直以来,电力系统的调度控制体系是集控式的,即通过输电运营商和配电运营商对电力系统进行层次性管理。这种管理模式对只有传统发电厂的电力系统是有效的,然而当大量的出力大小不确定和波动大的分布式电源接入后,这种响应速度慢的调度控制体系就难以实现功率的合理分配。近年来,微电网技术得到了广泛的研究和发展,微电网是将分布式电源、负荷和储能系统组合为一个可控的整体,它既可以工作在并网模式,为主网提供频率支撑或电压支撑;也可以工作在并网模式,保证内部配电线路的电压稳定和内部负荷的用电需求,通过集控式的优化调度方法可以满足功率的平衡。但是随着系统的规模扩大,这种集中能源管理系统要从各个部分收集大量的数据,进行大规模的计算,得出的结果往往难以满足要求,同时随着物联网技术的发展和电力市场改革的深入,人类社会信息对电力系统的影响进一步加深。
因此,在调度控制时就需要考虑社会因素的影响,从而导致了优化目标个数增多。同时,随着电网拓扑结构的复杂度上升和样本数据容量的增加,传统的多目标优化方法迭代求解过程将会非常缓慢。
发明内容
本发明所提的一种快速对抗深度置信网络的分布式多目标优化加速方法,该方法包括了利用生成式对抗网络的样本数据生成方法和基于深度置信网络的调度优化决策加速方法。首先,通过纳什博弈帕累托多目标优化方法,综合考虑低成本、低碳排放和高舒适度三个目标进行优化。然后,利用生成式对抗网络生成大量样本数据,为深度置信网络的调度优化决策提供数据支持,通过已完成预学习的深度置信网络实现群体智能决策,从而实现信息-物理-社会融合能源系统(微元网)的整体最优调度。
为了协调成本、碳排放和用户舒适度三者之间的关系,本发明采用多目标优化模型。提出的三个目标函数分别如下:
1)发电成本最小:
式中,n和m分别为微元网中火电机组和水电机组的数量;Pthi、Phyi、Pw和Ppv分别为火电、水电、风电和光伏所发出的有功功率;Cthi(Pthi)、Chyi(Phyi)、Cw(Pw)和Cpv(Ppv)分别为火电、水电、风电和光伏的发电成本。
2)碳排放量最小:
式中,αi、βi和γi分别为火电机组的碳排放系数;Pthi为火电机组的出力。
3)用户舒适度最高:
式中,N为微元网中用户的数量;v(i)和g(i)为惩罚函数;Tr和Tw分别为当前室温和水温;fr和fw分别为当前室温和水温与用户期望室温和水温差的平方,计算公式如下:
fr(Tr(i))=(Tr(i)-Er(i))2 (4)
fw(Tw(i))=(Tw(i)-Ew(i))2 (5)
式中,Er和Ew分别为用户期望室温和水温。
等式和不等式约束可由下式表示:
式中,Ploss为总有功损耗;Pload为总有功负荷;Qthi、Qhyi、Qw和Qpv分别为火电、水电、风电和光伏所发出的无功功率;Qloss为总无功损耗;Qload为总无功负荷;PG和QG分别代表各个类型发电机的有功和无功出力;PG,min和PG,max分别为有功出力的最小和最大值;QG,min和QG,max分别为无功出力的最小值和最大值;Vj为节点j的电压;Vj,min和Vj,max分别为节点j的最小电压和最大电压;Si为线路传输功率;Si,max为线路最大传输功率;Tr,max和Tw,max分别为最高室温和最高水温。
本发明采用帕累托多目标优化方法,可以用如下数学式来表示优化过程:
MinFi(X),i=1,2,...,Mobj (7)
式中,Fi是第i个目标函数;X为决策向量;Mobj为目标函数的个数,本发明中Mobj=3。
约束条件:
式中,Mineq为不等式约束的个数;Meq为等式约束的个数;Mdv为决策向量的个数;gi(X)为不等式约束的表达式;hi(X)为等式约束的表达式;Li和Ui分别为第i个决策向量Xi的最小值和最大值。帕累托多目标优化最终是得到一组优化解而不是一个最优解,如果解向量Xa优于解向量Xb(如式(9)所示),则解向量Xb即可被解向量Xa覆盖或支配。
任何不受其它解支配的解则称为非支配解,在整个搜索空间中都不能被覆盖或被支配的解就是帕累托最优解,将这些解映射到目标空间的适应度向量为帕累托前沿,可表示为:
式中,PF为帕累托前沿;X*为一组帕累托最优解。
将所有满足约束条件的多个初始可行解定义为多个原始人类个体,纳什博弈帕累托多目标优化方法的每个循环周期内部落都要经历部落划分、部落繁衍和部落迁徙三个阶段,不断地逼近最佳“栖息地”,即逼近帕累托前沿。
为了提高生存率,原始人类会自发的形成许多部落,各部落间保持着一定的距离。首先根据一个随机选择的目标函数值对全部个体按降序进行排列。然后,在每一个循环周期中,均匀地选择Ntr个初始成员,以每个初始成员为基础形成部落,并且计算出每个个体和初始成员的欧式距离(如式(11)所示)。最后,根据个体间的距离来将剩下的成员分配到各个部落。
式中,dij为个体i与个体j之间的距离;fi k与fj k分别为第i个个体与第j个个体的第k个目标值;fkmax与fkmin分别为第k个目标的最大值与最小值;N0为个体数;Ntr为部落数;Dim为目标函数个数。
划分好部落后,根据非支配排序和共享度计算出每个个体的适应度,然后根据逼近帕累托前沿的程度,将每个部落成员分配了不同的角色,分别为强者(强者中共享度最小的为首领)、平民和迁徙者。
若现有的生存空间减小,一些个体就会迁徙到其它适合生存的空间来:
xi k=rand (12)
式中,xi k为第k个目标函数中的第i个个体的位置;rand代表取随机数,其范围为[xkmin,xkmax];xkmax和xkmin分别为第k个目标函数中每个个体位置的最大和最小值。
一般来说,非支配个体的数量将随着方法的循环而增加,该方法将通过迭代逐步降低迁移概率来动态调整迁移者的数量:
式中,pmig为迁徙概率;pmax和pmin分别为最大和最小迁徙概率;It为当前迭代次数;Itmax为最大迭代次数;sinh()为双曲正弦函数;Cmig和kmig分别为确定双曲正弦函数的变化斜率。
纳什博弈平衡:
式中,hij是对应的第i个目标函数的第j个帕累托优化解(PF中的第j个元素);vi表示为第i个目标函数的拟合值期望的上限;Mpf是预先指定的大小,表示有限的PF集;ωi是对于第i个目标函数的相对重要性的权重。
约束条件:
式中,fij是对应于第i个目标函数的第j个帕累托优化解的规范适应值。
帕累托部落进化方法是一种模拟原始人类社会性活动的启发式仿生方法。将所有满足约束条件的多个初始可行解定义为多个原始人类个体,纳什博弈帕累托多目标优化方法的每个循环周期内部落都要经历部落划分、部落繁衍和部落迁徙三个阶段,不断地逼近最佳“栖息地”,即逼近帕累托前沿。每一次迭代过程都要经历三个阶段,同时也需要进行多次迭代,因此非常耗时。针对帕累托多目标优化方法的这一缺陷,本发明提出了基于深度置信网络的调度优化决策加速方法。该方法具体步骤如下:
(1)随机选取m个样本进行k次迭代;
(2)得到一组训练数据Xi=[x1,x2,...,xn]i=1,2,...,(m×k),将其输入到深度置信网络进行预学习;
(3)将所有样本数据输入已完成预学习的深度置信网络中,得到初步最优解Xpr;
(4)在Xpr附近选取新的样本,再利用纳什博弈帕累托多目标优化方法求解最优解。
本发明所采用的深度置信网络是一个多层的概率生成模型,由多个受限波尔兹曼机和一个回归层栈式叠加而成。其中,受限波尔兹曼机是对玻尔兹曼机的简化,是一个两层的神经网络。输入层由可见变量v构成,v之间无权值连接;输出层由隐藏变量h构成,h之间也无权值连接。仅在v和h之间存在权值连接,且v和h只能取0或1,两种状态。
可见单元可由向量v=[v1,v2,v3,...,vn]T表示,隐藏单元可由向量h=[h1,h2,h3,...,hm]T表示,内部参数向量可表示为θ,T表示转置,那么基于能量模型联合概率分布为:
式中,Z(θ)为归一化因子;exp()为指数函数;E(v,h;θ)为能量函数,可表示为:
式中,ai为可见单元i的偏置;bj为隐藏单元j的偏置;wij为可见单元i与隐藏单元j的神经元连接权重。
当可见变量v给定时,隐藏变量h可表示为:
同样地,当隐藏变量h给定时,可见变量v可表示为:
受限玻尔兹曼机训练的目的是使可见层v的联合概率密度最大,对于一个训练样本集S={v1,v2,...,vs},v1、v2、…、vs分别为第1个到第s个样本数据,需要调整参数θ使得对数似然函数L(θ)最大,由极大似然估计原理可得:
多层受限波尔兹曼机可以通过贪婪学习的逐层预训练方式提取输入数据的隐含特征。完成了前向预训练后,需要进行反向调整,回归层就起到了反向微调的作用,把提取的数据隐含特征映射到输出值上。上述两个阶段完成后,即完成了深度置信网络的参数θ的学习。
通过生成式对抗网络可以生成海量的模拟场景,构成深度置信网络的样本数据产生系统。该网络由一个生成器和一个判别器构成,生成器的目的是尽量生成接近真实样本分布的数据,判别器的目的是尽量判别输入的数据是来自真实样本集还是生成器。生成器和判别器的目标函数分别如下:
式中,log()表示求对数,Pdata为真实数据样本分布,在本发明中代表来自微元网的真实运行数据的分布;D(x)为真实数据x在判别器D中判别为真的概率;表示当x服从真实样本分布时求期望;Pz为噪声分布;D(G(z))为生成的数据G(z)在判别器D中判别为真的概率;表示z服从噪声分布时求期望。
网络总目标可以描述为:
生成式对抗网络绕过了复杂的生成器数据概率分布求取过程,而是用一个深度神经网络加上噪声分布来逼近生成器数据的概率分布。其优化问题是一个最小最大问题,生成器和判别器相互博弈,实现共同提升。
附图说明
图1是本发明方法的总流程图。
图2是帕累托部落进化方法的计算框架图。
图3是深度置信网络的框架图。
具体实施方式
本发明提出的一种快速对抗深度置信网络的分布式多目标优化加速方法,结合附图详细说明如下:
图1是本发明方法的总流程图,具体包括以下步骤:
(1)构建多目标优化函数,综合考虑低成本、低碳排放和高舒适度三个目标进行优化;
(2)随机选取m个样本进行k次迭代,得到一组训练数据Xi=[x1,x2,...,xn]i=1,2,...,(m×k),将其输入到深度置信网络进行预学习;
(3)利用生成式对抗网络,生成海量虚拟场景,构成深度置信网络的样本数据产生系统,并且将所有样本数据输入已完成预学习的深度置信网络中,得到初步最优解Xpr;
(4)在初步最优解Xpr附近选取样本数据,再次利用纳什博弈帕累托多目标优化方法,实现微元网的快速调度优化决策。
图2是帕累托部落进化方法的计算框架图,将所有满足约束条件的多个初始可行解定义为多个原始人类个体,纳什博弈帕累托多目标优化方法的每个循环周期内部落都要经历部落划分、部落繁衍和部落迁徙三个阶段,不断地逼近最佳“栖息地”,即逼近帕累托前沿。
为了提高生存率,原始人类会自发的形成许多部落,各部落间保持着一定的距离。首先根据一个随机选择的目标函数值对全部个体按降序进行排列;然后,在每一个循环周期中,均匀地选择Ntr个初始成员,以每个初始成员为基础形成部落,并且计算出每个个体和初始成员的欧式距离;最后,根据个体间的距离来将剩下的成员分配到各个部落。
划分好部落后,根据非支配排序和共享度计算出每个个体的适应度,然后根据逼近帕累托前沿的程度,将每个部落成员分配了不同的角色,分别为强者(强者中共享度最小的为首领)、平民和迁徙者。
得到多个帕累托前沿之后,采用基于纳什博弈平衡的决策方法确定最优折中解。
图3是深度置信网络的框架图,本发明所采用的深度置信网络是一个多层的概率生成模型,由多个受限波尔兹曼机和一个回归层栈式叠加而成。其中,受限波尔兹曼机是对波尔兹曼机的简化,是一个两层的神经网络。输入层由可见变量v构成,v之间无权值连接;输出层由隐藏变量h构成,h之间也无权值连接。仅在v和h之间存在权值连接,且v和h只能取0或1两种状态。
受限波尔兹曼机可以通过贪婪学习的逐层预训练方式提取输入数据的隐含特征。完成了前向预训练后,需要进行反向调整,回归层就起到了反向微调的作用,把提取的数据隐含特征映射到输出值上。上述两个阶段完成后,即完成了深度置信网络的参数θ的学习。
Claims (3)
1.一种快速对抗深度置信网络的分布式多目标优化加速方法,其特征在于,该方法提出优化加速方法和样本数据生成方法,即基于深度置信网络的调度优化决策加速方法和利用生成式对抗网络的样本数据生成方法;同时提出纳什博弈帕累托多目标优化方法,该方法在使用过程中的步骤为:
(1)提出纳什博弈帕累托多目标优化方法,综合考虑低成本、低碳排放和高舒适度三个目标进行优化,将得到的结果用来训练深度置信网络;
三个目标函数分别如下:
式中,n和m分别为微元网中火电机组和水电机组的数量,Pthi、Phyi、Pw和Ppv分别为火电、水电、风电和光伏所发出的有功功率,Cthi(Pthi)、Chyi(Phyi)、Cw(Pw)和Cpv(Ppv)分别为火电、水电、风电和光伏的发电成本;
式中,αi、βi和γi为火电机组的碳排放系数,Pthi为火电机组的出力;
式中,N为微元网中用户的数量,v(i)和g(i)为惩罚函数,Tr和Tw分别为当前室温和当前水温,fr和fw分别为当前室温和水温与用户期望室温差和水温差的平方,计算公式如下:
fr(Tr(i))=(Tr(i)-Er(i))2,
fw(Tw(i))=(Tw(i)-Ew(i))2,
式中,Er和Ew分别为用户期望室温和期望水温;
等式和不等式约束由下式表示:
式中,Ploss为总有功损耗,Pload为总有功负荷,Qthi、Qhyi、Qw和Qpv分别为火电、水电、风电和光伏所发出的无功功率,Qloss为总无功损耗,Qload为总无功负荷,PG和QG分别代表各个类型发电机的有功和无功出力,PG,min和PG,max分别为有功出力的最小值和最大值,QG,min和QG,max分别为无功出力的最小值和最大值,Vj为节点j的电压,Vj,min和Vj,max分别为节点j的最小电压和最大电压,Si为线路传输功率,Si,max为线路最大传输功率,Tr,max和Tw,max分别为最高室温和最高水温;
帕累托多目标优化方法用如下数学式来表示优化过程:
MinFi(X),i=1,2,...,Mobj,
式中,Fi为第i个目标函数;X为决策向量;Mobj为目标函数的个数,Mobj=3;
约束条件:
式中,Mineq为不等式约束的个数,Meq为等式约束的个数,Mdv为决策向量的个数,gi(X)为不等式约束的表达式,hi(X)为等式约束的表达式,Li和Ui分别为第i个决策向量Xi的最小值和最大值;帕累托多目标优化最终是得到一组优化解;如果解向量Xa优于解向量Xb,则解向量Xb即被解向量Xa覆盖或支配,如下式;
在整个搜索空间中都不能被覆盖或被支配的解即为帕累托最优解,将这些解映射到目标空间的适应度向量为帕累托前沿,表示为:
PF={F=(F1(X),F2(X),...,FMobj(X))|X∈X*},
式中,PF为帕累托前沿,X*为一组帕累托最优解;
纳什博弈帕累托多目标优化方法的每个循环周期内部落都经历部落划分、部落繁衍和部落迁徙三个阶段;不断地逼近最佳“栖息地”,即逼近帕累托前沿;首先,根据一个随机选择的目标函数值对全部个体按降序进行排列;然后,在每一个循环周期中,均匀地选择Ntr个初始成员,以每个初始成员为基础形成部落,并且计算出每个个体和初始成员的欧式距离;最后,根据个体间的距离来将剩下的成员分配到各个部落,每个个体和初始成员的欧式距离的计算式如下:
式中,dij为个体i与个体j之间的欧式距离,fi k与fj k分别为第i个个体与第j个个体的第k个目标值,fkmax与fkmin分别为第k个目标的最大值与最小值,N0为个体数,Ntr为部落数,Dim为目标函数个数;
若现有的生存空间减小,一些个体就会迁徙到其它适合生存的空间来:
xi k=rand
式中,xi k为第k个目标函数中的第i个个体的位置,rand代表取随机数,其范围为[xkmin,xkmax],xkmax和xkmin分别为第k个目标函数中每个个体位置的最大值和最小值;
非支配个体的数量将随着循环而增加,通过迭代逐步降低迁移概率来动态调整迁移者的数量:
式中,pmig为迁徙概率,pmax和pmin分别为最大和最小迁徙概率,It为当前迭代次数,Itmax为最大迭代次数,sinh()为双曲正弦函数,Cmig和kmig分别为确定双曲正弦函数的变化斜率;
纳什博弈平衡由下式表示:
式中,hij是对应的第i个目标函数的第j个帕累托优化解(PF中的第j个元素),vi表示为第i个目标函数的拟合值期望的上限,Mpf是预先指定的大小,表示有限的PF集,ωi是对于第i个目标函数的相对重要性的权重,fij是对应于第i个目标函数的第j个帕累托优化解的规范适应值;
约束条件:
(2)利用生成式对抗网络,生成海量虚拟场景,构成深度置信网络的样本数据产生系统;
(3)将所有样本数据输入已完成预学习的深度置信网络中,即通过已完成网络参数θ学习的深度置信网络得到初步最优解Xpr;
深度置信网络,具有多层神经网络结构,特征提取能力强,通过预学习获取输入的训练样本数据与输出的初步最优值之间的关系;一旦完成预学习,深度置信网络能够快速从海量样本中获取初步最优值;深度置信网络是一个多层的概率生成模型,由多个受限波尔兹曼机和一个回归层栈式叠加而成,输入层由可见变量v构成,输出层由隐藏变量h构成;
可见单元由向量v=[v1,v2,v3,...,vn]T表示,隐藏单元由向量h=[h1,h2,h3,...,hm]T表示,内部参数表示为θ,T表示转置,基于能量模型联合概率分布为:
式中,Z(θ)为归一化因子,exp()为指数函数,E(v,h;θ)为能量函数,表示为:
式中,ai为可见单元i的偏置,bj为隐藏单元j的偏置,wij为可见单元i与隐藏单元j的神经元连接权重;
当可见变量v给定时,隐藏变量h表示为:
当隐藏变量h给定时,可见变量v表示为:
受限玻尔兹曼机训练的目的是使可见层v的联合概率密度最大,对于一个训练样本集S={v1,v2,...,vs},v1、v2、…、vs分别为第1个到第s个样本数据,需要调整参数θ使得对数似然函数L(θ)最大,由极大似然估计原理得:
多层受限波尔兹曼机通过贪婪学习的逐层预训练方式提取输入数据的隐含特征;完成前向预训练后,需要进行反向调整;回归层起到反向微调的作用,把提取的数据隐含特征映射到输出值上;上述两个阶段完成后,即完成深度置信网络的参数θ的学习;
(4)在初步最优解Xpr附近选取样本数据,再次利用纳什博弈帕累托多目标优化方法,实现微元网的快速调度优化决策。
3.如权利要求1所述的快速对抗深度置信网络的分布式多目标优化加速方法,其特征在于,所述步骤(4)中提出的纳什博弈帕累托多目标优化方法,重复步骤(1)的优化过程即可。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011189644.1A CN112381271B (zh) | 2020-10-30 | 2020-10-30 | 一种快速对抗深度置信网络的分布式多目标优化加速方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011189644.1A CN112381271B (zh) | 2020-10-30 | 2020-10-30 | 一种快速对抗深度置信网络的分布式多目标优化加速方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112381271A CN112381271A (zh) | 2021-02-19 |
CN112381271B true CN112381271B (zh) | 2022-07-15 |
Family
ID=74576057
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011189644.1A Active CN112381271B (zh) | 2020-10-30 | 2020-10-30 | 一种快速对抗深度置信网络的分布式多目标优化加速方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112381271B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113159681B (zh) * | 2021-04-20 | 2023-02-14 | 华南理工大学 | 一种基于博弈强化学习的多式联运动态路径规划方法 |
CN113592553B (zh) * | 2021-08-02 | 2023-10-17 | 广西大学 | 一种竞争条件生成式对抗网络的云储能双层优化控制方法 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108347062B (zh) * | 2018-01-12 | 2019-12-10 | 华南理工大学 | 基于势博弈的微电网能量管理分布式多目标协同优化算法 |
US11557390B2 (en) * | 2018-04-30 | 2023-01-17 | Elekta, Inc. | Radiotherapy treatment plan modeling using generative adversarial networks |
CN109948589B (zh) * | 2019-03-31 | 2022-12-06 | 西安电子科技大学 | 基于量子深度信念网络的人脸表情识别方法 |
CN110119846A (zh) * | 2019-05-10 | 2019-08-13 | 湘潭大学 | 一种用于中期电力负荷预测的多目标深度信念网络 |
CN110363399A (zh) * | 2019-06-25 | 2019-10-22 | 广西大学 | 一种混合深度对抗网络滚动强化学习博弈策略 |
CN110535123B (zh) * | 2019-08-28 | 2021-04-20 | 广西大学 | 一种快速的解析式分布式多目标多微网经济调度优化方法 |
CN111555368B (zh) * | 2020-05-15 | 2022-12-06 | 广西大学 | 一种综合能源系统的深度生成式对抗网络调度与控制方法 |
-
2020
- 2020-10-30 CN CN202011189644.1A patent/CN112381271B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN112381271A (zh) | 2021-02-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Fathi et al. | Intelligent MPPT for photovoltaic panels using a novel fuzzy logic and artificial neural networks based on evolutionary algorithms | |
Yap et al. | Artificial intelligence based MPPT techniques for solar power system: A review | |
CN111553587B (zh) | 一种基于对抗学习模型的新能源场景生成方法及系统 | |
CN109886473B (zh) | 一种考虑下游生态的流域风光水系统多目标优化调度方法 | |
Kavousi-Fard | Modeling uncertainty in tidal current forecast using prediction interval-based SVR | |
CN112381271B (zh) | 一种快速对抗深度置信网络的分布式多目标优化加速方法 | |
Chen et al. | An improved NSGA-III algorithm for reservoir flood control operation | |
Liu et al. | A fault diagnosis intelligent algorithm based on improved BP neural network | |
CN112330487B (zh) | 一种光伏发电短期功率预测方法 | |
Wong et al. | Optimal PID controller design for AVR system | |
Yong | An improved artificial fish swarm algorithm for optimal operation of cascade reservoirs | |
CN109670655B (zh) | 一种电力系统多目标粒子群优化调度方法 | |
CN114282646A (zh) | 基于两阶段特征提取和改进BiLSTM的光功率预测方法及系统 | |
CN112819192A (zh) | 一种基于蜂群算法优化的rf_gru网络短期电力负荷预测方法 | |
Xu et al. | Competitive search algorithm: a new method for stochastic optimization | |
CN118174355A (zh) | 一种微电网能量优化调度方法 | |
CN116108982A (zh) | 一种水库群多目标调度合作搜索方法及系统 | |
Yin et al. | Multimodal hierarchical distributed multi-objective moth intelligence algorithm for economic dispatch of power systems | |
CN116207797B (zh) | 一种配电网多串并联设备协调优化控制方法 | |
CN116799807A (zh) | 含分布式电源配电网规划方法 | |
CN116647140A (zh) | 一种光伏储能逆变器的功率控制方法 | |
CN116882543A (zh) | 一种虚拟电厂源-荷协调优化调度方法 | |
CN107168052B (zh) | 一种mmc-hvdc系统控制参数优化方法 | |
Wei et al. | Application of improved artificial neural networks in short-term power load forecasting | |
CN114897253A (zh) | 基于多智能体的电能路由器调度优化方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |