CN112381271B - 一种快速对抗深度置信网络的分布式多目标优化加速方法 - Google Patents

一种快速对抗深度置信网络的分布式多目标优化加速方法 Download PDF

Info

Publication number
CN112381271B
CN112381271B CN202011189644.1A CN202011189644A CN112381271B CN 112381271 B CN112381271 B CN 112381271B CN 202011189644 A CN202011189644 A CN 202011189644A CN 112381271 B CN112381271 B CN 112381271B
Authority
CN
China
Prior art keywords
network
formula
optimization
pareto
power
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011189644.1A
Other languages
English (en)
Other versions
CN112381271A (zh
Inventor
殷林飞
徐紫东
高放
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangxi University
Original Assignee
Guangxi University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangxi University filed Critical Guangxi University
Priority to CN202011189644.1A priority Critical patent/CN112381271B/zh
Publication of CN112381271A publication Critical patent/CN112381271A/zh
Application granted granted Critical
Publication of CN112381271B publication Critical patent/CN112381271B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J3/00Circuit arrangements for ac mains or ac distribution networks
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J3/00Circuit arrangements for ac mains or ac distribution networks
    • H02J3/008Circuit arrangements for ac mains or ac distribution networks involving trading of energy or energy transmission rights

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Marketing (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Power Engineering (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Primary Health Care (AREA)
  • Educational Administration (AREA)
  • Water Supply & Treatment (AREA)
  • Public Health (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提出一种快速对抗深度置信网络的分布式多目标优化加速方法,该方法包括了生成式对抗网络的样本数据生成方法和基于深度置信网络的调度优化决策加速方法。首先,通过纳什博弈帕累托多目标优化方法,综合考虑低成本、低碳排放和高舒适度三个目标进行优化。然后,通过生成式对抗网络生成大量样本数据,为深度置信网络的调度优化决策提供数据支持。最后,通过已完成预学习的深度置信网络实现群体智能决策,从而实现信息‑物理‑社会融合能源系统(微元网)的整体最优调度。本发明所提的方法,考虑了能源的社会性,实现了多目标优化的最佳折中,可以利用有限的信息生成大量的数据以辅助决策过程,达到加速优化过程的效果。

Description

一种快速对抗深度置信网络的分布式多目标优化加速方法
技术领域
本发明属于电力系统最优调度与控制决策领域,涉及一种基于人工智能技术的多目标优化加速方法,适用于电力系统的优化调度。
背景技术
现如今分布式可再生能源发电技术发展迅速,以风能和光伏为代表的可再生能源发电系统的大量接入,给传统电网带来了极大的挑战。一直以来,电力系统的调度控制体系是集控式的,即通过输电运营商和配电运营商对电力系统进行层次性管理。这种管理模式对只有传统发电厂的电力系统是有效的,然而当大量的出力大小不确定和波动大的分布式电源接入后,这种响应速度慢的调度控制体系就难以实现功率的合理分配。近年来,微电网技术得到了广泛的研究和发展,微电网是将分布式电源、负荷和储能系统组合为一个可控的整体,它既可以工作在并网模式,为主网提供频率支撑或电压支撑;也可以工作在并网模式,保证内部配电线路的电压稳定和内部负荷的用电需求,通过集控式的优化调度方法可以满足功率的平衡。但是随着系统的规模扩大,这种集中能源管理系统要从各个部分收集大量的数据,进行大规模的计算,得出的结果往往难以满足要求,同时随着物联网技术的发展和电力市场改革的深入,人类社会信息对电力系统的影响进一步加深。
因此,在调度控制时就需要考虑社会因素的影响,从而导致了优化目标个数增多。同时,随着电网拓扑结构的复杂度上升和样本数据容量的增加,传统的多目标优化方法迭代求解过程将会非常缓慢。
发明内容
本发明所提的一种快速对抗深度置信网络的分布式多目标优化加速方法,该方法包括了利用生成式对抗网络的样本数据生成方法和基于深度置信网络的调度优化决策加速方法。首先,通过纳什博弈帕累托多目标优化方法,综合考虑低成本、低碳排放和高舒适度三个目标进行优化。然后,利用生成式对抗网络生成大量样本数据,为深度置信网络的调度优化决策提供数据支持,通过已完成预学习的深度置信网络实现群体智能决策,从而实现信息-物理-社会融合能源系统(微元网)的整体最优调度。
为了协调成本、碳排放和用户舒适度三者之间的关系,本发明采用多目标优化模型。提出的三个目标函数分别如下:
1)发电成本最小:
Figure BDA0002752371950000021
式中,n和m分别为微元网中火电机组和水电机组的数量;Pthi、Phyi、Pw和Ppv分别为火电、水电、风电和光伏所发出的有功功率;Cthi(Pthi)、Chyi(Phyi)、Cw(Pw)和Cpv(Ppv)分别为火电、水电、风电和光伏的发电成本。
2)碳排放量最小:
Figure BDA0002752371950000022
式中,αi、βi和γi分别为火电机组的碳排放系数;Pthi为火电机组的出力。
3)用户舒适度最高:
Figure BDA0002752371950000023
式中,N为微元网中用户的数量;v(i)和g(i)为惩罚函数;Tr和Tw分别为当前室温和水温;fr和fw分别为当前室温和水温与用户期望室温和水温差的平方,计算公式如下:
fr(Tr(i))=(Tr(i)-Er(i))2 (4)
fw(Tw(i))=(Tw(i)-Ew(i))2 (5)
式中,Er和Ew分别为用户期望室温和水温。
等式和不等式约束可由下式表示:
Figure BDA0002752371950000024
式中,Ploss为总有功损耗;Pload为总有功负荷;Qthi、Qhyi、Qw和Qpv分别为火电、水电、风电和光伏所发出的无功功率;Qloss为总无功损耗;Qload为总无功负荷;PG和QG分别代表各个类型发电机的有功和无功出力;PG,min和PG,max分别为有功出力的最小和最大值;QG,min和QG,max分别为无功出力的最小值和最大值;Vj为节点j的电压;Vj,min和Vj,max分别为节点j的最小电压和最大电压;Si为线路传输功率;Si,max为线路最大传输功率;Tr,max和Tw,max分别为最高室温和最高水温。
本发明采用帕累托多目标优化方法,可以用如下数学式来表示优化过程:
MinFi(X),i=1,2,...,Mobj (7)
式中,Fi是第i个目标函数;X为决策向量;Mobj为目标函数的个数,本发明中Mobj=3。
约束条件:
Figure BDA0002752371950000031
式中,Mineq为不等式约束的个数;Meq为等式约束的个数;Mdv为决策向量的个数;gi(X)为不等式约束的表达式;hi(X)为等式约束的表达式;Li和Ui分别为第i个决策向量Xi的最小值和最大值。帕累托多目标优化最终是得到一组优化解而不是一个最优解,如果解向量Xa优于解向量Xb(如式(9)所示),则解向量Xb即可被解向量Xa覆盖或支配。
Figure BDA0002752371950000032
任何不受其它解支配的解则称为非支配解,在整个搜索空间中都不能被覆盖或被支配的解就是帕累托最优解,将这些解映射到目标空间的适应度向量为帕累托前沿,可表示为:
Figure BDA0002752371950000033
式中,PF为帕累托前沿;X*为一组帕累托最优解。
将所有满足约束条件的多个初始可行解定义为多个原始人类个体,纳什博弈帕累托多目标优化方法的每个循环周期内部落都要经历部落划分、部落繁衍和部落迁徙三个阶段,不断地逼近最佳“栖息地”,即逼近帕累托前沿。
为了提高生存率,原始人类会自发的形成许多部落,各部落间保持着一定的距离。首先根据一个随机选择的目标函数值对全部个体按降序进行排列。然后,在每一个循环周期中,均匀地选择Ntr个初始成员,以每个初始成员为基础形成部落,并且计算出每个个体和初始成员的欧式距离(如式(11)所示)。最后,根据个体间的距离来将剩下的成员分配到各个部落。
Figure BDA0002752371950000041
式中,dij为个体i与个体j之间的距离;fi k与fj k分别为第i个个体与第j个个体的第k个目标值;fkmax与fkmin分别为第k个目标的最大值与最小值;N0为个体数;Ntr为部落数;Dim为目标函数个数。
划分好部落后,根据非支配排序和共享度计算出每个个体的适应度,然后根据逼近帕累托前沿的程度,将每个部落成员分配了不同的角色,分别为强者(强者中共享度最小的为首领)、平民和迁徙者。
若现有的生存空间减小,一些个体就会迁徙到其它适合生存的空间来:
xi k=rand (12)
式中,xi k为第k个目标函数中的第i个个体的位置;rand代表取随机数,其范围为[xkmin,xkmax];xkmax和xkmin分别为第k个目标函数中每个个体位置的最大和最小值。
一般来说,非支配个体的数量将随着方法的循环而增加,该方法将通过迭代逐步降低迁移概率来动态调整迁移者的数量:
Figure BDA0002752371950000042
式中,pmig为迁徙概率;pmax和pmin分别为最大和最小迁徙概率;It为当前迭代次数;Itmax为最大迭代次数;sinh()为双曲正弦函数;Cmig和kmig分别为确定双曲正弦函数的变化斜率。
纳什博弈平衡:
Figure BDA0002752371950000043
式中,hij是对应的第i个目标函数的第j个帕累托优化解(PF中的第j个元素);vi表示为第i个目标函数的拟合值期望的上限;Mpf是预先指定的大小,表示有限的PF集;ωi是对于第i个目标函数的相对重要性的权重。
约束条件:
Figure BDA0002752371950000051
式中,fij是对应于第i个目标函数的第j个帕累托优化解的规范适应值。
帕累托部落进化方法是一种模拟原始人类社会性活动的启发式仿生方法。将所有满足约束条件的多个初始可行解定义为多个原始人类个体,纳什博弈帕累托多目标优化方法的每个循环周期内部落都要经历部落划分、部落繁衍和部落迁徙三个阶段,不断地逼近最佳“栖息地”,即逼近帕累托前沿。每一次迭代过程都要经历三个阶段,同时也需要进行多次迭代,因此非常耗时。针对帕累托多目标优化方法的这一缺陷,本发明提出了基于深度置信网络的调度优化决策加速方法。该方法具体步骤如下:
(1)随机选取m个样本进行k次迭代;
(2)得到一组训练数据Xi=[x1,x2,...,xn]i=1,2,...,(m×k),将其输入到深度置信网络进行预学习;
(3)将所有样本数据输入已完成预学习的深度置信网络中,得到初步最优解Xpr
(4)在Xpr附近选取新的样本,再利用纳什博弈帕累托多目标优化方法求解最优解。
本发明所采用的深度置信网络是一个多层的概率生成模型,由多个受限波尔兹曼机和一个回归层栈式叠加而成。其中,受限波尔兹曼机是对玻尔兹曼机的简化,是一个两层的神经网络。输入层由可见变量v构成,v之间无权值连接;输出层由隐藏变量h构成,h之间也无权值连接。仅在v和h之间存在权值连接,且v和h只能取0或1,两种状态。
可见单元可由向量v=[v1,v2,v3,...,vn]T表示,隐藏单元可由向量h=[h1,h2,h3,...,hm]T表示,内部参数向量可表示为θ,T表示转置,那么基于能量模型联合概率分布为:
Figure BDA0002752371950000052
式中,Z(θ)为归一化因子;exp()为指数函数;E(v,h;θ)为能量函数,可表示为:
Figure BDA0002752371950000053
式中,ai为可见单元i的偏置;bj为隐藏单元j的偏置;wij为可见单元i与隐藏单元j的神经元连接权重。
当可见变量v给定时,隐藏变量h可表示为:
Figure BDA0002752371950000061
式中,
Figure BDA0002752371950000062
为sigmoid激活函数。
同样地,当隐藏变量h给定时,可见变量v可表示为:
Figure BDA0002752371950000063
受限玻尔兹曼机训练的目的是使可见层v的联合概率密度最大,对于一个训练样本集S={v1,v2,...,vs},v1、v2、…、vs分别为第1个到第s个样本数据,需要调整参数θ使得对数似然函数L(θ)最大,由极大似然估计原理可得:
Figure BDA0002752371950000064
式中,
Figure BDA0002752371950000065
表示求当对数似然函数L(θ)取最大值时θ的值;s为训练样本数据的个数;vk为第k个样本数据。
多层受限波尔兹曼机可以通过贪婪学习的逐层预训练方式提取输入数据的隐含特征。完成了前向预训练后,需要进行反向调整,回归层就起到了反向微调的作用,把提取的数据隐含特征映射到输出值上。上述两个阶段完成后,即完成了深度置信网络的参数θ的学习。
通过生成式对抗网络可以生成海量的模拟场景,构成深度置信网络的样本数据产生系统。该网络由一个生成器和一个判别器构成,生成器的目的是尽量生成接近真实样本分布的数据,判别器的目的是尽量判别输入的数据是来自真实样本集还是生成器。生成器和判别器的目标函数分别如下:
Figure BDA0002752371950000066
Figure BDA0002752371950000067
式中,log()表示求对数,Pdata为真实数据样本分布,在本发明中代表来自微元网的真实运行数据的分布;D(x)为真实数据x在判别器D中判别为真的概率;
Figure BDA0002752371950000068
表示当x服从真实样本分布时求期望;Pz为噪声分布;D(G(z))为生成的数据G(z)在判别器D中判别为真的概率;
Figure BDA0002752371950000069
表示z服从噪声分布时求期望。
网络总目标可以描述为:
Figure BDA0002752371950000071
生成式对抗网络绕过了复杂的生成器数据概率分布求取过程,而是用一个深度神经网络加上噪声分布来逼近生成器数据的概率分布。其优化问题是一个最小最大问题,生成器和判别器相互博弈,实现共同提升。
附图说明
图1是本发明方法的总流程图。
图2是帕累托部落进化方法的计算框架图。
图3是深度置信网络的框架图。
具体实施方式
本发明提出的一种快速对抗深度置信网络的分布式多目标优化加速方法,结合附图详细说明如下:
图1是本发明方法的总流程图,具体包括以下步骤:
(1)构建多目标优化函数,综合考虑低成本、低碳排放和高舒适度三个目标进行优化;
(2)随机选取m个样本进行k次迭代,得到一组训练数据Xi=[x1,x2,...,xn]i=1,2,...,(m×k),将其输入到深度置信网络进行预学习;
(3)利用生成式对抗网络,生成海量虚拟场景,构成深度置信网络的样本数据产生系统,并且将所有样本数据输入已完成预学习的深度置信网络中,得到初步最优解Xpr
(4)在初步最优解Xpr附近选取样本数据,再次利用纳什博弈帕累托多目标优化方法,实现微元网的快速调度优化决策。
图2是帕累托部落进化方法的计算框架图,将所有满足约束条件的多个初始可行解定义为多个原始人类个体,纳什博弈帕累托多目标优化方法的每个循环周期内部落都要经历部落划分、部落繁衍和部落迁徙三个阶段,不断地逼近最佳“栖息地”,即逼近帕累托前沿。
为了提高生存率,原始人类会自发的形成许多部落,各部落间保持着一定的距离。首先根据一个随机选择的目标函数值对全部个体按降序进行排列;然后,在每一个循环周期中,均匀地选择Ntr个初始成员,以每个初始成员为基础形成部落,并且计算出每个个体和初始成员的欧式距离;最后,根据个体间的距离来将剩下的成员分配到各个部落。
划分好部落后,根据非支配排序和共享度计算出每个个体的适应度,然后根据逼近帕累托前沿的程度,将每个部落成员分配了不同的角色,分别为强者(强者中共享度最小的为首领)、平民和迁徙者。
得到多个帕累托前沿之后,采用基于纳什博弈平衡的决策方法确定最优折中解。
图3是深度置信网络的框架图,本发明所采用的深度置信网络是一个多层的概率生成模型,由多个受限波尔兹曼机和一个回归层栈式叠加而成。其中,受限波尔兹曼机是对波尔兹曼机的简化,是一个两层的神经网络。输入层由可见变量v构成,v之间无权值连接;输出层由隐藏变量h构成,h之间也无权值连接。仅在v和h之间存在权值连接,且v和h只能取0或1两种状态。
受限波尔兹曼机可以通过贪婪学习的逐层预训练方式提取输入数据的隐含特征。完成了前向预训练后,需要进行反向调整,回归层就起到了反向微调的作用,把提取的数据隐含特征映射到输出值上。上述两个阶段完成后,即完成了深度置信网络的参数θ的学习。

Claims (3)

1.一种快速对抗深度置信网络的分布式多目标优化加速方法,其特征在于,该方法提出优化加速方法和样本数据生成方法,即基于深度置信网络的调度优化决策加速方法和利用生成式对抗网络的样本数据生成方法;同时提出纳什博弈帕累托多目标优化方法,该方法在使用过程中的步骤为:
(1)提出纳什博弈帕累托多目标优化方法,综合考虑低成本、低碳排放和高舒适度三个目标进行优化,将得到的结果用来训练深度置信网络;
三个目标函数分别如下:
1)发电成本最小:
Figure FDA0003673582320000011
式中,n和m分别为微元网中火电机组和水电机组的数量,Pthi、Phyi、Pw和Ppv分别为火电、水电、风电和光伏所发出的有功功率,Cthi(Pthi)、Chyi(Phyi)、Cw(Pw)和Cpv(Ppv)分别为火电、水电、风电和光伏的发电成本;
2)碳排放量最小:
Figure FDA0003673582320000012
式中,αi、βi和γi为火电机组的碳排放系数,Pthi为火电机组的出力;
3)用户舒适度最高:
Figure FDA0003673582320000013
式中,N为微元网中用户的数量,v(i)和g(i)为惩罚函数,Tr和Tw分别为当前室温和当前水温,fr和fw分别为当前室温和水温与用户期望室温差和水温差的平方,计算公式如下:
fr(Tr(i))=(Tr(i)-Er(i))2
fw(Tw(i))=(Tw(i)-Ew(i))2
式中,Er和Ew分别为用户期望室温和期望水温;
等式和不等式约束由下式表示:
Figure FDA0003673582320000021
式中,Ploss为总有功损耗,Pload为总有功负荷,Qthi、Qhyi、Qw和Qpv分别为火电、水电、风电和光伏所发出的无功功率,Qloss为总无功损耗,Qload为总无功负荷,PG和QG分别代表各个类型发电机的有功和无功出力,PG,min和PG,max分别为有功出力的最小值和最大值,QG,min和QG,max分别为无功出力的最小值和最大值,Vj为节点j的电压,Vj,min和Vj,max分别为节点j的最小电压和最大电压,Si为线路传输功率,Si,max为线路最大传输功率,Tr,max和Tw,max分别为最高室温和最高水温;
帕累托多目标优化方法用如下数学式来表示优化过程:
MinFi(X),i=1,2,...,Mobj
式中,Fi为第i个目标函数;X为决策向量;Mobj为目标函数的个数,Mobj=3;
约束条件:
Figure FDA0003673582320000022
式中,Mineq为不等式约束的个数,Meq为等式约束的个数,Mdv为决策向量的个数,gi(X)为不等式约束的表达式,hi(X)为等式约束的表达式,Li和Ui分别为第i个决策向量Xi的最小值和最大值;帕累托多目标优化最终是得到一组优化解;如果解向量Xa优于解向量Xb,则解向量Xb即被解向量Xa覆盖或支配,如下式;
Figure FDA0003673582320000023
在整个搜索空间中都不能被覆盖或被支配的解即为帕累托最优解,将这些解映射到目标空间的适应度向量为帕累托前沿,表示为:
PF={F=(F1(X),F2(X),...,FMobj(X))|X∈X*},
式中,PF为帕累托前沿,X*为一组帕累托最优解;
纳什博弈帕累托多目标优化方法的每个循环周期内部落都经历部落划分、部落繁衍和部落迁徙三个阶段;不断地逼近最佳“栖息地”,即逼近帕累托前沿;首先,根据一个随机选择的目标函数值对全部个体按降序进行排列;然后,在每一个循环周期中,均匀地选择Ntr个初始成员,以每个初始成员为基础形成部落,并且计算出每个个体和初始成员的欧式距离;最后,根据个体间的距离来将剩下的成员分配到各个部落,每个个体和初始成员的欧式距离的计算式如下:
Figure FDA0003673582320000031
式中,dij为个体i与个体j之间的欧式距离,fi k与fj k分别为第i个个体与第j个个体的第k个目标值,fkmax与fkmin分别为第k个目标的最大值与最小值,N0为个体数,Ntr为部落数,Dim为目标函数个数;
若现有的生存空间减小,一些个体就会迁徙到其它适合生存的空间来:
xi k=rand
式中,xi k为第k个目标函数中的第i个个体的位置,rand代表取随机数,其范围为[xkmin,xkmax],xkmax和xkmin分别为第k个目标函数中每个个体位置的最大值和最小值;
非支配个体的数量将随着循环而增加,通过迭代逐步降低迁移概率来动态调整迁移者的数量:
Figure FDA0003673582320000032
式中,pmig为迁徙概率,pmax和pmin分别为最大和最小迁徙概率,It为当前迭代次数,Itmax为最大迭代次数,sinh()为双曲正弦函数,Cmig和kmig分别为确定双曲正弦函数的变化斜率;
纳什博弈平衡由下式表示:
Figure FDA0003673582320000033
式中,hij是对应的第i个目标函数的第j个帕累托优化解(PF中的第j个元素),vi表示为第i个目标函数的拟合值期望的上限,Mpf是预先指定的大小,表示有限的PF集,ωi是对于第i个目标函数的相对重要性的权重,fij是对应于第i个目标函数的第j个帕累托优化解的规范适应值;
约束条件:
Figure FDA0003673582320000041
(2)利用生成式对抗网络,生成海量虚拟场景,构成深度置信网络的样本数据产生系统;
(3)将所有样本数据输入已完成预学习的深度置信网络中,即通过已完成网络参数θ学习的深度置信网络得到初步最优解Xpr
深度置信网络,具有多层神经网络结构,特征提取能力强,通过预学习获取输入的训练样本数据与输出的初步最优值之间的关系;一旦完成预学习,深度置信网络能够快速从海量样本中获取初步最优值;深度置信网络是一个多层的概率生成模型,由多个受限波尔兹曼机和一个回归层栈式叠加而成,输入层由可见变量v构成,输出层由隐藏变量h构成;
可见单元由向量v=[v1,v2,v3,...,vn]T表示,隐藏单元由向量h=[h1,h2,h3,...,hm]T表示,内部参数表示为θ,T表示转置,基于能量模型联合概率分布为:
Figure FDA0003673582320000042
式中,Z(θ)为归一化因子,exp()为指数函数,E(v,h;θ)为能量函数,表示为:
Figure FDA0003673582320000043
式中,ai为可见单元i的偏置,bj为隐藏单元j的偏置,wij为可见单元i与隐藏单元j的神经元连接权重;
当可见变量v给定时,隐藏变量h表示为:
Figure FDA0003673582320000044
式中,
Figure FDA0003673582320000045
为sigmoid激活函数;
当隐藏变量h给定时,可见变量v表示为:
Figure FDA0003673582320000046
受限玻尔兹曼机训练的目的是使可见层v的联合概率密度最大,对于一个训练样本集S={v1,v2,...,vs},v1、v2、…、vs分别为第1个到第s个样本数据,需要调整参数θ使得对数似然函数L(θ)最大,由极大似然估计原理得:
Figure FDA0003673582320000051
式中,
Figure FDA0003673582320000052
表示求当对数似然函数L(θ)取最大值时θ的值,s为训练样本数据的个数,vk为第k个样本数据;
多层受限波尔兹曼机通过贪婪学习的逐层预训练方式提取输入数据的隐含特征;完成前向预训练后,需要进行反向调整;回归层起到反向微调的作用,把提取的数据隐含特征映射到输出值上;上述两个阶段完成后,即完成深度置信网络的参数θ的学习;
(4)在初步最优解Xpr附近选取样本数据,再次利用纳什博弈帕累托多目标优化方法,实现微元网的快速调度优化决策。
2.如权利要求1所述的快速对抗深度置信网络的分布式多目标优化加速方法,其特征在于,所述步骤(2)中提出的生成式对抗网络;通过该网络生成海量的模拟场景,构成深度置信网络的样本数据产生系统,解决电力系统中真实数据样本少,训练数据不够的问题,生成器和判别器的目标函数分别如下:
Figure FDA0003673582320000053
Figure FDA0003673582320000054
式中,log()表示求对数,Pdata为真实样本数据的分布,代表来自微元网的真实运行数据的分布,D(x)为真实样本数据x在判别器D中判别为真的概率,
Figure FDA0003673582320000055
表示当x服从真实样本分布时求期望;Pz为噪声分布,D(G(z))为生成的数据G(z)在判别器D中判别为真的概率,
Figure FDA0003673582320000057
表示z服从噪声分布时求期望;
网络总目标描述为:
Figure FDA0003673582320000056
3.如权利要求1所述的快速对抗深度置信网络的分布式多目标优化加速方法,其特征在于,所述步骤(4)中提出的纳什博弈帕累托多目标优化方法,重复步骤(1)的优化过程即可。
CN202011189644.1A 2020-10-30 2020-10-30 一种快速对抗深度置信网络的分布式多目标优化加速方法 Active CN112381271B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011189644.1A CN112381271B (zh) 2020-10-30 2020-10-30 一种快速对抗深度置信网络的分布式多目标优化加速方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011189644.1A CN112381271B (zh) 2020-10-30 2020-10-30 一种快速对抗深度置信网络的分布式多目标优化加速方法

Publications (2)

Publication Number Publication Date
CN112381271A CN112381271A (zh) 2021-02-19
CN112381271B true CN112381271B (zh) 2022-07-15

Family

ID=74576057

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011189644.1A Active CN112381271B (zh) 2020-10-30 2020-10-30 一种快速对抗深度置信网络的分布式多目标优化加速方法

Country Status (1)

Country Link
CN (1) CN112381271B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113159681B (zh) * 2021-04-20 2023-02-14 华南理工大学 一种基于博弈强化学习的多式联运动态路径规划方法
CN113592553B (zh) * 2021-08-02 2023-10-17 广西大学 一种竞争条件生成式对抗网络的云储能双层优化控制方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108347062B (zh) * 2018-01-12 2019-12-10 华南理工大学 基于势博弈的微电网能量管理分布式多目标协同优化算法
US11557390B2 (en) * 2018-04-30 2023-01-17 Elekta, Inc. Radiotherapy treatment plan modeling using generative adversarial networks
CN109948589B (zh) * 2019-03-31 2022-12-06 西安电子科技大学 基于量子深度信念网络的人脸表情识别方法
CN110119846A (zh) * 2019-05-10 2019-08-13 湘潭大学 一种用于中期电力负荷预测的多目标深度信念网络
CN110363399A (zh) * 2019-06-25 2019-10-22 广西大学 一种混合深度对抗网络滚动强化学习博弈策略
CN110535123B (zh) * 2019-08-28 2021-04-20 广西大学 一种快速的解析式分布式多目标多微网经济调度优化方法
CN111555368B (zh) * 2020-05-15 2022-12-06 广西大学 一种综合能源系统的深度生成式对抗网络调度与控制方法

Also Published As

Publication number Publication date
CN112381271A (zh) 2021-02-19

Similar Documents

Publication Publication Date Title
Fathi et al. Intelligent MPPT for photovoltaic panels using a novel fuzzy logic and artificial neural networks based on evolutionary algorithms
Yap et al. Artificial intelligence based MPPT techniques for solar power system: A review
CN111553587B (zh) 一种基于对抗学习模型的新能源场景生成方法及系统
CN109886473B (zh) 一种考虑下游生态的流域风光水系统多目标优化调度方法
Kavousi-Fard Modeling uncertainty in tidal current forecast using prediction interval-based SVR
CN112381271B (zh) 一种快速对抗深度置信网络的分布式多目标优化加速方法
Chen et al. An improved NSGA-III algorithm for reservoir flood control operation
Liu et al. A fault diagnosis intelligent algorithm based on improved BP neural network
CN112330487B (zh) 一种光伏发电短期功率预测方法
Wong et al. Optimal PID controller design for AVR system
Yong An improved artificial fish swarm algorithm for optimal operation of cascade reservoirs
CN109670655B (zh) 一种电力系统多目标粒子群优化调度方法
CN114282646A (zh) 基于两阶段特征提取和改进BiLSTM的光功率预测方法及系统
CN112819192A (zh) 一种基于蜂群算法优化的rf_gru网络短期电力负荷预测方法
Xu et al. Competitive search algorithm: a new method for stochastic optimization
CN118174355A (zh) 一种微电网能量优化调度方法
CN116108982A (zh) 一种水库群多目标调度合作搜索方法及系统
Yin et al. Multimodal hierarchical distributed multi-objective moth intelligence algorithm for economic dispatch of power systems
CN116207797B (zh) 一种配电网多串并联设备协调优化控制方法
CN116799807A (zh) 含分布式电源配电网规划方法
CN116647140A (zh) 一种光伏储能逆变器的功率控制方法
CN116882543A (zh) 一种虚拟电厂源-荷协调优化调度方法
CN107168052B (zh) 一种mmc-hvdc系统控制参数优化方法
Wei et al. Application of improved artificial neural networks in short-term power load forecasting
CN114897253A (zh) 基于多智能体的电能路由器调度优化方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant