CN107256440A - 一种基于帝国主义竞争算法的碳‑能复合流求解方法 - Google Patents
一种基于帝国主义竞争算法的碳‑能复合流求解方法 Download PDFInfo
- Publication number
- CN107256440A CN107256440A CN201710406502.8A CN201710406502A CN107256440A CN 107256440 A CN107256440 A CN 107256440A CN 201710406502 A CN201710406502 A CN 201710406502A CN 107256440 A CN107256440 A CN 107256440A
- Authority
- CN
- China
- Prior art keywords
- mrow
- msubsup
- msub
- msup
- mtd
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 229910052799 carbon Inorganic materials 0.000 title claims abstract description 51
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 title claims abstract description 40
- 238000000034 method Methods 0.000 title claims abstract description 32
- 239000011159 matrix material Substances 0.000 claims abstract description 42
- 230000003993 interaction Effects 0.000 claims abstract description 5
- 230000008901 benefit Effects 0.000 claims abstract description 4
- 230000009471 action Effects 0.000 claims description 22
- 230000006870 function Effects 0.000 claims description 17
- 230000005012 migration Effects 0.000 claims description 11
- 238000013508 migration Methods 0.000 claims description 11
- 230000007246 mechanism Effects 0.000 claims description 9
- 238000005457 optimization Methods 0.000 claims description 8
- 230000008569 process Effects 0.000 claims description 8
- 230000006641 stabilisation Effects 0.000 claims description 6
- 238000011105 stabilization Methods 0.000 claims description 6
- 230000007613 environmental effect Effects 0.000 claims description 4
- 238000011217 control strategy Methods 0.000 claims description 3
- 230000008859 change Effects 0.000 claims description 2
- 238000013461 design Methods 0.000 description 5
- 238000002347 injection Methods 0.000 description 4
- 239000007924 injection Substances 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 230000009977 dual effect Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000005611 electricity Effects 0.000 description 3
- 240000002853 Nelumbo nucifera Species 0.000 description 2
- 235000006508 Nelumbo nucifera Nutrition 0.000 description 2
- 235000006510 Nelumbo pentapetala Nutrition 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 238000009434 installation Methods 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 239000000243 solution Substances 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000000205 computational method Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 208000028659 discharge Diseases 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000005431 greenhouse gas Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010248 power generation Methods 0.000 description 1
- 238000012913 prioritisation Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/004—Artificial life, i.e. computing arrangements simulating life
- G06N3/006—Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/12—Computing arrangements based on biological models using genetic models
- G06N3/126—Evolutionary algorithms, e.g. genetic algorithms or genetic programming
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Business, Economics & Management (AREA)
- Mathematical Physics (AREA)
- Biophysics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Economics (AREA)
- Data Mining & Analysis (AREA)
- Strategic Management (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Mathematical Analysis (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Marketing (AREA)
- Computational Mathematics (AREA)
- Pure & Applied Mathematics (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Mathematical Optimization (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Evolutionary Computation (AREA)
- Computational Linguistics (AREA)
- Genetics & Genomics (AREA)
- Primary Health Care (AREA)
- Algebra (AREA)
- Databases & Information Systems (AREA)
- Water Supply & Treatment (AREA)
- Physiology (AREA)
- Public Health (AREA)
- Development Economics (AREA)
Abstract
本发明涉及到一种基于帝国主义竞争算法的碳‑能复合流求解方法,通过采用基于多元文化迁移的帝国主义竞争强化学习算法来对电力系统的碳‑能复合流进行优化,各个帝国采用强化学习算法中的值函数矩阵作为其文化矩阵,各寻优国家通过与环境的相互作用对文化矩阵进行更新,并依据文化矩阵进行动作选择以提高策略的全局性,文化矩阵中的知识会被实时存储并通过多元文化迁移以提高后续新任务的寻优效率;本发明所采用的方法是基于文化迁移的帝国主义竞争强化学习算法是一种较新的智能算法,具有收敛速度快、全局收敛性更强以及稳定性更高等优点,从而实现大规模电力系统的快速碳‑能复合流优化。
Description
技术领域:
本发明涉及电力系统碳-能复合流优化领域,特别是涉及一种基于帝国主义竞争算法的碳-能复合流求解方法。
背景技术:
近年来,由以CO2为主的温室气体所引起的环境恶化问题愈发严重,碳减排及低碳经济成为工业界和学术界广泛关注的重点问题。电力产业是CO2的主要排放者之一,有义务更有责任开展低碳电力建设。然而,目前的很多低碳电力研究如:计及低碳资源的机组组合、计及低碳资源的经济调度以及碳捕获与碳封存技术等,都只关注了发电侧的碳排放,却没有从电网侧的角度出发,展开低碳电网调度。目前,已经有学者依据潮流追踪法提出了电网侧与输电损耗有关的碳排放量的计算方法,为将电网侧碳排放量控制与电网的运行控制和潮流控制进行深层次的联系提供了可能。电力系统最优碳-能复合流模型就是从电网侧的利益出发,以电网低碳、经济及安全运行为目标所建立的优化模型。然而,上述模型中,发电侧和电网侧只关心自己的碳足迹和碳排放,无疑会造成碳排放的双重计算,因此,亟需将电力系统的碳排放总量在发电侧、电网侧以及用户侧之间进行合理分摊。
此外,电力系统的最优碳-能复合流模型为一多约束多变量的非线性规划问题,传统的牛顿法、内点法以及二次规划法等过分依赖于确定的数学模型;而新兴的人工智能算法如蚁群算法、人工蜂群算法、遗传算法、粒子群算法以及强化学习算法等,又因为所解决的问题较为复杂而迭代缓慢,甚至因“维数灾难”而无法寻优。
发明内容:
本申请提出一种基于多元文化迁移帝国主义竞争强化学习算法的电力系统最优碳-能复合流求解方法。通过在电力系统最优碳-能复合流模型中引入碳排放责任分摊机制,对发电侧、电网侧、用户侧的碳排放进行合理核算。通过建立文化矩阵,以及帝国内外的竞争机制、帝国间文化交流机制和多元文化迁移机制,对电网侧的无功功率进行快速合理分配,实现电网低碳、经济和安全运行。
为了解决上述技术问题,本发明是通过以下技术方案实现的:一种基于帝国主义竞争算法的碳-能复合流求解方法,通过采用基于多元文化迁移的帝国主义竞争强化学习算法来对电力系统的碳-能复合流进行优化,其特征在于,包括以下步骤;
步骤S1:初始化帝国主义竞争算法参数;初始化帝国个数、帝国主义国家个数及其殖民地国家个数;
步骤S2:获取发电机出力参数、机端电压参数、网络拓扑结构参数、变压器参数、无功补偿装置参数以及源任务负荷参数;
步骤S3:获取新优化任务的负荷参数;
步骤S4:根据电力系统碳-能复合流优化目标分为有功网损目标、电网侧碳排放目标以及电压稳定目标,加权后作为适应度函数,具体如下式所示:
有功网损目标:
电网侧碳排放目标:Cg=αpCloss+(1-βc)αpCL
其中,
电压稳定目标:
适应度函数:
式中,μ1、μ2、μ3为权重系数,满足:μ1∈[0,1],μ2∈[0,1],μ3∈[0,1],μ1+μ2+μ3=1;Vi和Vj分别是节点i和节点j的电压幅值;θij是节点i和节点j的相角差;Vi max、 Vi min分别是负荷节点i的电压上下限;bij、gij分别为线路i-j的电导和电纳;ajw (-1)是发电机w在节点j处的有功注入权重;ΔPij是线路i-j的有功损耗;Pj’是等效无损网络中j节点总有功注入;NL表示线路集合;
步骤S5:根据电力系统的潮流约束、电压稳定约束、无功补偿容量约束以及其他约束条件,确定基本电力系统碳-能复合流模型,如下式所示:
式中:x为控制变量向量,包括发电机机端电压、有载调压变压器分接头位置、无功补偿装置的补偿容量等;PGi、QGi分别代表节点i的发电有功输出和无功输出;PDi、QDi分别代表节点i的有功需求和无功需求;QCi、Vi分别为节点i的无功补偿容量和电压;Tk为变压器分接头变比;Sl为第l条线路的复功率;Ni为节点集合;NG为机组集合;NC为无功补偿装置集合;NT为变压器分接头集合;
步骤S6:根据基本电力系统碳-能复合流模型及约束条件初始化可控变量,所述可控变量包括:发电机机端电压、无功补偿装置容量以及变压器变比;
步骤S7:对上述步骤中的当前任务进行分类,若为源任务,则随机形成源任务初始文化矩阵;若为新任务,则基于多元文化迁移提炼出新任务初始文化矩阵,新任务初始文化矩阵从源任务最优文化矩阵得到;设源任务最优文化矩阵为新任务初始文化矩阵为得到的计算过程如下式:
且有:
式中:reh为针对第e个帝国,第h个源任务和新任务之间的相似度,满足0≤reh≤1;步骤S8:各寻优国家根据所属帝国的文化矩阵进行动作选择,进而求得其适应度函数,动作选择机制如下式所示:
式中:ag为贪婪动作,即文化价值最大的动作,满足:ε为在区间[0,1]内均匀分布的随机数;ε0是贪婪探索率;Pei为帝国e第i个动作的动作概率矩阵;
步骤S9:确定各帝国的帝国主义国家,如下式所示:
式中:impe为帝国e的帝国主义国家;couej为帝国e中的第j个国家(包括帝国主义国家和殖民地);
步骤S10:各国家与环境交互后得到其立即奖励函数值,如下式所示:
式中:K为奖励常数,满足K>0;SAe imp为帝国e中帝国主义国家的状态-动作对集合;
步骤S11:各个寻优国家展开有序寻优,共同更新文化矩阵,如下式所示:
式中:α是文化学习因子;γ为折扣因子;上标i和j分别代表第i个文化矩阵(即第i个可控变量)及第j个国家(帝国主义国家或殖民地国家);e是第e个帝国; Qe表示帝国e的文化矩阵,R(sk,sk+1,ak)为寻优国家由状态sk经动作ak转移到状态sk+1所获得的立即奖励函数值;(sk,ak)是第k次迭代的状态-动作对;Je是第e 个帝国的国家集合;I是可控变量集合;E是帝国集合;ai和Ai分别为可控变量 xi的可选动作值和动作集合;
步骤S12:帝国间文化交流:落后帝国向最强帝国展开不同程度的文化学习,最强帝国引导落后帝国学习较先进的文化,加快寻优进程,如下式所示:
式中:de是帝国e与最强势力帝国之间标准化文化差异;emp是势力最强的帝国;步骤S13:通过帝国间竞争,占领最弱帝国的最弱殖民地,最强帝国可获得侵占权,如下式所示:
式中:σ0为最强帝国侵占因子(σ0为常数,且满足σ0∈[0,1])eag为侵占国;σ为一个在区间[0,1]内均匀分布的随机数;pe为帝国e的争夺实力;TPmax为最弱帝国的总势力;
步骤S14:判断是否达到最大迭代次数,若达到,输出发电机端电压、无功补偿装置容量及变压器变比的控制策略;否则,返回步骤S8,迭代继续进行。
作为优选,所述步骤S7中reh越大,新任务从源任务h最优文化矩阵中获取的信息就越多,为使得源任务历史学习经验得以最大化利用,reh如下式所示:
|LDe|=2e
式中:LDe是帝国e的源任务集合,表征与帝国e的新任务最相似的2e个源任务;PD nt为新任务的有功负荷;ΔPD e,max是LDe中的任务与新任务的最大有功偏差值;Tf是迁移因子;相似度满足:re1+re2+…+reH=1。
与现有技术相比,本发明的有益之处是:本发明通过采用基于多元文化迁移的帝国主义竞争强化学习算法来对电力系统的碳-能复合流进行优化,并且,在电力系统碳-能复合流模型中考虑电力生产商与电力消费者之间的碳排放责任分摊,避免碳排放的双重核算;各个帝国采用强化学习算法中的值函数矩阵作为其文化矩阵,各寻优国家通过与环境的相互作用对文化矩阵进行更新,并依据文化矩阵进行动作选择以提高策略的全局性;文化矩阵中的知识会被实时存储并通过多元文化迁移以提高后续新任务的寻优效率;另外,采用帝国内外的竞争机制提升殖民地的多样性,并令落后帝国向最强帝国进行文化学习以加快寻优进程;所采用的基于文化迁移的帝国主义竞争强化学习算法是一种较新的智能算法,相对于其它以遗传算法、蚁群算法以及粒子群算法等的人工智能方法,具有收敛速度快、全局收敛性更强以及稳定性更高等优点,从而实现大规模电力系统的快速碳-能复合流优化。
附图说明:
下面结合附图对本发明进一步说明。
图1为本发明方法的流程图;
图2为所述实时例的电网拓扑及基本信息示意图;
图3为所示实施例的源任务点及新任务日负荷曲线。
具体实施方式:
下面结合附图及具体实施方式对本发明进行详细描述:
请参考图1、图2和图3所示,本发明的一个实施方式提供一种基于帝国主义竞争算法的碳-能复合流求解方法,是基于多元文化迁移的帝国主义竞争强化学习算法的电力系统最优碳-能复合流求解方法,该实施方式从电网侧的角度出发,通过对电网侧无功功率的合理分配,实现电网低碳、经济及安全运行;算例中把目标函数中权重系数μ1、μ2、μ3、都设为1,表示经济性、低碳性和安全性对于电网同等重要,该方法包括以下步骤:
步骤S1,初始化算法参数;
基于多元文化迁移的帝国主义竞争强化学习算法的寻优效果受到文化学习因子α、折扣因子γ、势力权重系数ξ、最强帝国侵占因子σ0、贪婪探索率ε0、奖励常数K、惩罚因子η、帝国集合初始大小|E|0、帝国e的国家集合初始大小|Je|0和迁移因子Tf等的影响,将上述参数的初始值设置表1所示:
表1ICRL参数设置
步骤S2,获取发电机出力参数、机端电压参数、网络拓扑结构参数、变压器参数、无功补偿装置参数以及源任务负荷参数。
发电机出力参数及机端电压参数由MATLAB的matpower程序包计算得到,网络拓扑结构参数、变压器参数及无功补偿装置参数如图2所示,源任务为从日负荷曲线中选取出来的典型负荷断面,如图3所示。
步骤S3,获取新优化任务的负荷参数,新优化任务的负荷参数由日负荷曲线获得,如图3所示。
步骤S4,根据电力系统碳-能复合流优化目标分为有功网损目标、电网侧碳排放目标以及电压稳定目标,加权后作为适应度函数,具体如下:
有功网损目标:
电网侧碳排放目标:Cg=αpCloss+(1-βc)αpCL
其中,
电压稳定目标:
适应度函数:
式中,μ1、μ2、μ3为权重系数,满足:μ1∈[0,1],μ2∈[0,1],μ3∈[0,1],μ1+μ2+μ3=1;Vi和Vj分别是节点i和节点j的电压幅值;θij是节点i和节点j的相角差;Vi max、 Vi min分别是负荷节点i的电压上下限;bij、gij分别为线路i-j的电导和电纳;ajw (-1)是发电机w在节点j处的有功注入权重;ΔPij是线路i-j的有功损耗;Pj’是等效无损网络中j节点总有功注入;NL表示线路集合。αp是生产商责任分摊系数,满足0≤αp≤1,表征发电厂分摊αp配额的碳排放至电网侧;βc是消费者责任分摊系数,满足0≤βc≤1,表征电网侧分摊βc配额的碳排放量至用户侧;Je是第e个帝国的国家集合。
步骤S5,由电力系统潮流约束、电压稳定约束、无功补偿容量约束以及其他约束条件,确定基本电力系统碳-能复合流模型,如下式所示:
式中:x为控制变量向量,包括发电机机端电压、有载调压变压器分接头位置、无功补偿装置的补偿容量等;PGi、QGi分别代表节点i的发电有功输出和无功输出;PDi、QDi分别代表节点i的有功需求和无功需求;QCi、Vi分别为节点i 的无功补偿容量和电压;Tk为变压器分接头变比;Sl为第l条线路的复功率;Ni为节点集合;NG为机组集合;NC为无功补偿装置集合;NT为变压器分接头集合。
步骤S6,根据基本电力系统碳-能复合流模型及约束条件初始化可控变量,包括:发电机机端电压、无功补偿装置容量以及变压器变比,初始值采用 MATLAB中matpower软件包中‘case57’文件所给定的初始值;
步骤S7,对当前任务进行分类,若为源任务,则随机形成源任务初始文化矩阵;若为新任务,则基于多元文化迁移提炼出新任务初始文化矩阵。
设源任务最优文化矩阵为新任务初始文化矩阵为得到的计算过程如下式所示:
且有:
式中:reh为针对第e个帝国,第h个源任务和新任务之间的相似度,满足 0≤reh≤1。reh越大,新任务从源任务h最优文化矩阵中获取的信息就越多。为了防止不合理的文化迁移对在线学习带来的负面影响,各个帝国所学习的源任务的个数不尽相同,因此,总有一个帝国以最合理的方式占展开文化迁移,使得源任务历史学习经验得以最大化利用,如下式所示:
|LDe|=2e
式中:LDe是帝国e的源任务集合,表征与帝国e的新任务最相似的2e个源任务,PD nt为新任务的有功负荷;ΔPD e,max是LDe中的任务与新任务的最大有功偏差值;Tf是迁移因子;相似度满足:re1+re2+…+reH=1。
步骤S8,各寻优国家根据所属帝国的文化矩阵进行动作选择,进而求得其适应度函数,动作选择机制如下式所示:
式中:ag为贪婪动作,即文化价值最大的动作,满足:ε为在区间[0,1]内均匀分布的随机数;ε0是贪婪探索率;Pei为帝国e第i个动作的动作概率矩阵。
步骤S9,帝国内竞争:确定各帝国的帝国主义国家。各个国家的势力由其适应度函数值的大小来决定,适应度函数值越大,势力越小,因此,每次迭代中适应度函数值最小的国家为当前帝国内的帝国主义国家,而其他国家被迫沦为殖民地。即:
式中:impe为帝国e的帝国主义国家;couej为帝国e中的第j个国家(包括帝国主义国家和殖民地)。
步骤S10,各国家与环境交互后得到其立即奖励函数值,如下式所示:
式中:K为奖励常数,满足K>0;SAe imp为帝国e中帝国主义国家的状态- 动作对集合。
步骤S11,为避免经典强化学习中的“维数灾难”,令每个国家对每个变量都建立文化矩阵,在上一个变量确定的情况下进行下一个变量的动作选择;由此,上一个变量的既定动作即为下一个变量的状态,各个寻优国家沿着这样的状态-动作链展开有序寻优,共同更新文化矩阵,如下式所示:
式中:α是文化学习因子;γ为折扣因子;上标i和j分别代表第i个文化矩阵(即第i个可控变量)及第j个国家(帝国主义国家或殖民地国家);e是第e 个帝国;Qe表示帝国e的文化矩阵,R(sk,sk+1,ak)为寻优国家由状态sk经动作ak转移到状态sk+1所获得的立即奖励函数值;(sk,ak)是第k次迭代的状态-动作对; Je是第e个帝国的国家集合;I是可控变量集合;E是帝国集合;ai和Ai分别为可控变量xi的可选动作值和动作集合。
步骤S12,帝国间文化交流:落后帝国向最强帝国展开不同程度的文化学习,引导落后帝国学习较先进的文化,加快寻优进程,如下式所示:
式中:de是帝国e与最强势力帝国之间标准化文化差异;emp是势力最强的帝国。
步骤S13,通过帝国间竞争,占领最弱帝国的最弱殖民地。引入最强帝国侵占因子σ0(常数,且满足σ0∈[0,1]),使最强帝国可在一定概率内直接获得侵占权,如下式所示:
式中:eag为侵占国;σ为一个在区间[0,1]内均匀分布的随机数;pe为帝国e 的争夺实力;TPmax为最弱帝国的总势力。
步骤S14,判断是否达到最大迭代次数,若达到,输出发电机端电压、无功补偿装置容量及变压器变比的控制策略;否则,返回步骤S8,迭代继续进行。
通过以上步骤就可以得到电网侧最优碳-能复合流的优化方案,从电网侧立场出发,实现电网的低碳、经济和安全运行。
本发明的基于多元文化迁移的帝国主义竞争强化学习算法的电力系统最优碳-能复合流求解方法相对于现有技术具有如下的优点及效果:
(1)本发明设计的基于多元文化迁移的帝国主义竞争强化学习算法的电力系统最优碳-能复合流求解方法,加入了对发电侧、电网侧和用电侧之间的碳排放责任分摊的考虑,避免了碳排放的双重计算。
(2)本发明设计的基于多元文化迁移的帝国主义竞争强化学习算法的电力系统最优碳-能复合流求解方法,加入了文化矩阵,依据文化矩阵所进行的动作选择将大幅提升解的全局性。
(3)本发明设计的基于多元文化迁移的帝国主义竞争强化学习算法的电力系统最优碳-能复合流求解方法,采用了相互联系的状态-动作链,有效避免了“维数灾难”。
(4)本发明设计的基于多元文化迁移的帝国主义竞争强化学习算法的电力系统最优碳-能复合流求解方法,采用了帝国间文化交流机制,使得落后帝国得以向势力最强的帝国展开学习,寻优进程明显加快。
(5)本发明设计的基于多元文化迁移的帝国主义竞争强化学习算法的电力系统最优碳-能复合流求解方法,采用了多元文化迁移机制,使得各个帝国最大化地利用源任务的学习经验,不仅提高了寻优速率,也使寻优具有较高的稳定性。
上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
Claims (2)
1.一种基于帝国主义竞争算法的碳-能复合流求解方法,通过采用基于多元文化迁移的帝国主义竞争强化学习算法来对电力系统的碳-能复合流进行优化,其特征在于,包括以下步骤;
步骤S1:初始化帝国主义竞争算法参数,包括文化学习因子α、折扣因子γ、势力权重系数ξ、最强帝国侵占因子σ0、贪婪探索率ε0、奖励常数K、惩罚因子η、帝国集合初始大小|E|0、帝国e的国家集合初始大小|Je|0和迁移因子Tf;初始化帝国个数、帝国主义国家个数及其殖民地国家个数;
步骤S2:获取发电机出力参数、机端电压参数、网络拓扑结构参数、变压器参数、无功补偿装置参数以及源任务负荷参数;
步骤S3:获取新优化任务的负荷参数;
步骤S4:根据电力系统碳-能复合流优化目标分为有功网损目标、电网侧碳排放目标以及电压稳定目标,加权后作为适应度函数,具体如下式所示:
有功网损目标:
电网侧碳排放目标:Cg=αpCloss+(1-βc)αpCL
其中,
电压稳定目标:
适应度函数:
式中,μ1、μ2、μ3为权重系数,满足:μ1∈[0,1],μ2∈[0,1],μ3∈[0,1],μ1+μ2+μ3=1;
步骤S5:根据电力系统的潮流约束、电压稳定约束、无功补偿装置的补偿容量约束以及其他约束条件,确定基本电力系统碳-能复合流模型,如下式所示:
<mfenced open = "{" close = "">
<mtable>
<mtr>
<mtd>
<mrow>
<mi>min</mi>
<mi> </mi>
<mi>f</mi>
<mrow>
<mo>(</mo>
<mi>x</mi>
<mo>)</mo>
</mrow>
<mo>=</mo>
<msub>
<mi>&mu;</mi>
<mn>1</mn>
</msub>
<msub>
<mi>P</mi>
<mrow>
<mi>l</mi>
<mi>o</mi>
<mi>s</mi>
<mi>s</mi>
</mrow>
</msub>
<mo>+</mo>
<msub>
<mi>&mu;</mi>
<mn>2</mn>
</msub>
<msub>
<mi>C</mi>
<mi>g</mi>
</msub>
<mo>+</mo>
<msub>
<mi>&mu;</mi>
<mn>3</mn>
</msub>
<msub>
<mi>V</mi>
<mi>d</mi>
</msub>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mrow>
<mi>s</mi>
<mo>.</mo>
<mi>t</mi>
<mo>.</mo>
<mfenced open = "{" close = "">
<mtable>
<mtr>
<mtd>
<mrow>
<msub>
<mi>P</mi>
<mrow>
<mi>G</mi>
<mi>i</mi>
</mrow>
</msub>
<mo>-</mo>
<msub>
<mi>P</mi>
<mrow>
<mi>D</mi>
<mi>i</mi>
</mrow>
</msub>
<mo>-</mo>
<msub>
<mi>V</mi>
<mi>i</mi>
</msub>
<munder>
<mi>&Sigma;</mi>
<mrow>
<mi>j</mi>
<mo>&Element;</mo>
<msub>
<mi>N</mi>
<mi>i</mi>
</msub>
</mrow>
</munder>
<msub>
<mi>V</mi>
<mi>j</mi>
</msub>
<mrow>
<mo>(</mo>
<mrow>
<msub>
<mi>g</mi>
<mrow>
<mi>i</mi>
<mi>j</mi>
</mrow>
</msub>
<msub>
<mi>cos&theta;</mi>
<mrow>
<mi>i</mi>
<mi>j</mi>
</mrow>
</msub>
<mo>+</mo>
<msub>
<mi>b</mi>
<mrow>
<mi>i</mi>
<mi>j</mi>
</mrow>
</msub>
<msub>
<mi>sin&theta;</mi>
<mrow>
<mi>i</mi>
<mi>j</mi>
</mrow>
</msub>
</mrow>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mn>0</mn>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mrow>
<msub>
<mi>Q</mi>
<mrow>
<mi>G</mi>
<mi>i</mi>
</mrow>
</msub>
<mo>-</mo>
<msub>
<mi>Q</mi>
<mrow>
<mi>D</mi>
<mi>i</mi>
</mrow>
</msub>
<mo>-</mo>
<msub>
<mi>V</mi>
<mi>i</mi>
</msub>
<munder>
<mi>&Sigma;</mi>
<mrow>
<mi>j</mi>
<mo>&Element;</mo>
<msub>
<mi>N</mi>
<mi>i</mi>
</msub>
</mrow>
</munder>
<msub>
<mi>V</mi>
<mi>j</mi>
</msub>
<mrow>
<mo>(</mo>
<mrow>
<msub>
<mi>g</mi>
<mrow>
<mi>i</mi>
<mi>j</mi>
</mrow>
</msub>
<msub>
<mi>sin&theta;</mi>
<mrow>
<mi>i</mi>
<mi>j</mi>
</mrow>
</msub>
<mo>-</mo>
<msub>
<mi>b</mi>
<mrow>
<mi>i</mi>
<mi>j</mi>
</mrow>
</msub>
<msub>
<mi>cos&theta;</mi>
<mrow>
<mi>i</mi>
<mi>j</mi>
</mrow>
</msub>
</mrow>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mn>0</mn>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mrow>
<msubsup>
<mi>Q</mi>
<mrow>
<mi>G</mi>
<mi>i</mi>
</mrow>
<mi>min</mi>
</msubsup>
<mo>&le;</mo>
<msub>
<mi>Q</mi>
<mrow>
<mi>G</mi>
<mi>i</mi>
</mrow>
</msub>
<mo>&le;</mo>
<msubsup>
<mi>Q</mi>
<mrow>
<mi>G</mi>
<mi>i</mi>
</mrow>
<mi>max</mi>
</msubsup>
<mo>,</mo>
<mi>i</mi>
<mo>&Element;</mo>
<msub>
<mi>N</mi>
<mi>G</mi>
</msub>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mrow>
<msubsup>
<mi>V</mi>
<mi>i</mi>
<mi>min</mi>
</msubsup>
<mo>&le;</mo>
<msub>
<mi>V</mi>
<mi>i</mi>
</msub>
<mo>&le;</mo>
<msubsup>
<mi>V</mi>
<mi>i</mi>
<mi>max</mi>
</msubsup>
<mo>,</mo>
<mi>i</mi>
<mo>&Element;</mo>
<msub>
<mi>N</mi>
<mi>i</mi>
</msub>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mrow>
<msubsup>
<mi>Q</mi>
<mrow>
<mi>C</mi>
<mi>i</mi>
</mrow>
<mi>min</mi>
</msubsup>
<mo>&le;</mo>
<msub>
<mi>Q</mi>
<mrow>
<mi>C</mi>
<mi>i</mi>
</mrow>
</msub>
<mo>&le;</mo>
<msubsup>
<mi>Q</mi>
<mrow>
<mi>C</mi>
<mi>i</mi>
</mrow>
<mi>max</mi>
</msubsup>
<mo>,</mo>
<mi>i</mi>
<mo>&Element;</mo>
<msub>
<mi>N</mi>
<mi>C</mi>
</msub>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mrow>
<msubsup>
<mi>T</mi>
<mi>k</mi>
<mi>min</mi>
</msubsup>
<mo>&le;</mo>
<msub>
<mi>T</mi>
<mi>k</mi>
</msub>
<mo>&le;</mo>
<msubsup>
<mi>T</mi>
<mi>k</mi>
<mi>max</mi>
</msubsup>
<mo>,</mo>
<mi>k</mi>
<mo>&Element;</mo>
<msub>
<mi>N</mi>
<mi>T</mi>
</msub>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mrow>
<mo>|</mo>
<msub>
<mi>S</mi>
<mi>l</mi>
</msub>
<mo>|</mo>
<mo>&le;</mo>
<msubsup>
<mi>S</mi>
<mi>l</mi>
<mi>max</mi>
</msubsup>
<mo>,</mo>
<mi>l</mi>
<mo>&Element;</mo>
<msub>
<mi>N</mi>
<mi>L</mi>
</msub>
</mrow>
</mtd>
</mtr>
</mtable>
</mfenced>
</mrow>
</mtd>
</mtr>
</mtable>
</mfenced>
式中:x为控制变量向量;
步骤S6:根据基本电力系统碳-能复合流模型及约束条件初始化可控变量,所述可控变量包括:发电机机端电压、无功补偿装置的补偿容量以及变压器变比;
步骤S7:对上述步骤中的当前任务进行分类,若为源任务,则随机形成源任务初始文化矩阵;若为新任务,则基于多元文化迁移提炼出新任务初始文化矩阵,新任务初始文化矩阵从源任务最优文化矩阵得到;设源任务最优文化矩阵为新任务初始文化矩阵为得到的计算过程如下式:
且有:
式中:reh为针对第e个帝国,第h个源任务和新任务之间的相似度,满足0≤reh≤1;
步骤S8:各寻优国家根据所属帝国的文化矩阵进行动作选择,进而求得其适应度函数,动作选择机制如下式所示:
<mrow>
<msubsup>
<mi>a</mi>
<mrow>
<mi>k</mi>
<mo>+</mo>
<mn>1</mn>
</mrow>
<mrow>
<mi>i</mi>
<mi>j</mi>
</mrow>
</msubsup>
<mo>=</mo>
<mfenced open = "{" close = "">
<mtable>
<mtr>
<mtd>
<mrow>
<msub>
<mi>a</mi>
<mi>g</mi>
</msub>
<mo>,</mo>
</mrow>
</mtd>
<mtd>
<mtable>
<mtr>
<mtd>
<mrow>
<mi>i</mi>
<mi>f</mi>
</mrow>
</mtd>
<mtd>
<mrow>
<mi>&epsiv;</mi>
<mo>&le;</mo>
<msub>
<mi>&epsiv;</mi>
<mn>0</mn>
</msub>
</mrow>
</mtd>
</mtr>
</mtable>
</mtd>
</mtr>
<mtr>
<mtd>
<mrow>
<mi>arg</mi>
<munder>
<mrow>
<mi>m</mi>
<mi>a</mi>
<mi>x</mi>
</mrow>
<mrow>
<msup>
<mi>a</mi>
<mi>i</mi>
</msup>
<mo>&Element;</mo>
<msub>
<mi>A</mi>
<mi>i</mi>
</msub>
</mrow>
</munder>
<mrow>
<mo>(</mo>
<msubsup>
<mi>P</mi>
<mrow>
<mi>k</mi>
<mo>+</mo>
<mn>1</mn>
</mrow>
<mrow>
<mi>e</mi>
<mi>i</mi>
</mrow>
</msubsup>
<mo>(</mo>
<mrow>
<msubsup>
<mi>s</mi>
<mrow>
<mi>k</mi>
<mo>+</mo>
<mn>1</mn>
</mrow>
<mrow>
<mi>i</mi>
<mi>j</mi>
</mrow>
</msubsup>
<mo>,</mo>
<msup>
<mi>a</mi>
<mi>i</mi>
</msup>
</mrow>
<mo>)</mo>
<mo>-</mo>
<mi>r</mi>
<mi>a</mi>
<mi>n</mi>
<mi>d</mi>
<mo>(</mo>
<mrow>
<mn>0</mn>
<mo>,</mo>
<mn>1</mn>
</mrow>
<mo>)</mo>
<mo>)</mo>
</mrow>
<mo>,</mo>
</mrow>
</mtd>
<mtd>
<mrow>
<mi>o</mi>
<mi>t</mi>
<mi>h</mi>
<mi>e</mi>
<mi>r</mi>
<mi>w</mi>
<mi>i</mi>
<mi>s</mi>
<mi>e</mi>
</mrow>
</mtd>
</mtr>
</mtable>
</mfenced>
</mrow>
<mrow>
<msubsup>
<mi>P</mi>
<mrow>
<mi>k</mi>
<mo>+</mo>
<mn>1</mn>
</mrow>
<mrow>
<mi>e</mi>
<mi>i</mi>
</mrow>
</msubsup>
<mrow>
<mo>(</mo>
<mrow>
<msubsup>
<mi>s</mi>
<mrow>
<mi>k</mi>
<mo>+</mo>
<mn>1</mn>
</mrow>
<mrow>
<mi>i</mi>
<mi>j</mi>
</mrow>
</msubsup>
<mo>,</mo>
<msup>
<mi>a</mi>
<mi>i</mi>
</msup>
</mrow>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mfrac>
<mrow>
<msubsup>
<mi>Q</mi>
<mrow>
<mi>k</mi>
<mo>+</mo>
<mn>1</mn>
</mrow>
<mrow>
<mi>e</mi>
<mi>i</mi>
</mrow>
</msubsup>
<mrow>
<mo>(</mo>
<mrow>
<msubsup>
<mi>s</mi>
<mrow>
<mi>k</mi>
<mo>+</mo>
<mn>1</mn>
</mrow>
<mrow>
<mi>i</mi>
<mi>j</mi>
</mrow>
</msubsup>
<mo>,</mo>
<msup>
<mi>a</mi>
<mi>i</mi>
</msup>
</mrow>
<mo>)</mo>
</mrow>
</mrow>
<mrow>
<munder>
<mi>&Sigma;</mi>
<mrow>
<msup>
<mi>a</mi>
<mo>&prime;</mo>
</msup>
<mo>&Element;</mo>
<msub>
<mi>A</mi>
<mi>i</mi>
</msub>
</mrow>
</munder>
<msubsup>
<mi>Q</mi>
<mrow>
<mi>k</mi>
<mo>+</mo>
<mn>1</mn>
</mrow>
<mrow>
<mi>e</mi>
<mi>i</mi>
</mrow>
</msubsup>
<mrow>
<mo>(</mo>
<mrow>
<msubsup>
<mi>s</mi>
<mrow>
<mi>k</mi>
<mo>+</mo>
<mn>1</mn>
</mrow>
<mrow>
<mi>i</mi>
<mi>j</mi>
</mrow>
</msubsup>
<mo>,</mo>
<msup>
<mi>a</mi>
<mo>&prime;</mo>
</msup>
</mrow>
<mo>)</mo>
</mrow>
</mrow>
</mfrac>
</mrow>
式中:ag为贪婪动作,满足:ε为在区间[0,1]内均匀分布的随机数;ε0是贪婪探索率;Pei为帝国e第i个动作的动作概率矩阵;
步骤S9:确定各帝国的帝国主义国家,如下式所示:
<mrow>
<msup>
<mi>imp</mi>
<mi>e</mi>
</msup>
<mo>=</mo>
<mi>arg</mi>
<munder>
<mrow>
<mi>m</mi>
<mi>i</mi>
<mi>n</mi>
</mrow>
<mrow>
<mi>j</mi>
<mo>&Element;</mo>
<msup>
<mi>J</mi>
<mi>e</mi>
</msup>
</mrow>
</munder>
<mrow>
<mo>(</mo>
<mi>F</mi>
<mi>i</mi>
<mi>t</mi>
<mo>(</mo>
<mrow>
<msup>
<mi>cou</mi>
<mrow>
<mi>e</mi>
<mi>j</mi>
</mrow>
</msup>
</mrow>
<mo>)</mo>
<mo>)</mo>
</mrow>
</mrow>
式中:impe为帝国e的帝国主义国家;couej为帝国e中的第j个国家(包括帝国主义国家和殖民地);
步骤S10:各国家与环境交互后得到其立即奖励函数值,如下式所示:
<mrow>
<msup>
<mi>R</mi>
<mrow>
<mi>i</mi>
<mi>j</mi>
</mrow>
</msup>
<mrow>
<mo>(</mo>
<mrow>
<msubsup>
<mi>s</mi>
<mi>k</mi>
<mrow>
<mi>i</mi>
<mi>j</mi>
</mrow>
</msubsup>
<mo>,</mo>
<msubsup>
<mi>s</mi>
<mrow>
<mi>k</mi>
<mo>+</mo>
<mn>1</mn>
</mrow>
<mrow>
<mi>i</mi>
<mi>j</mi>
</mrow>
</msubsup>
<mo>,</mo>
<msubsup>
<mi>a</mi>
<mi>k</mi>
<mrow>
<mi>i</mi>
<mi>j</mi>
</mrow>
</msubsup>
</mrow>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mfenced open = "{" close = "">
<mtable>
<mtr>
<mtd>
<mrow>
<mfrac>
<mi>K</mi>
<mrow>
<mi>F</mi>
<mi>i</mi>
<mi>t</mi>
<mrow>
<mo>(</mo>
<mrow>
<msup>
<mi>imp</mi>
<mi>e</mi>
</msup>
</mrow>
<mo>)</mo>
</mrow>
</mrow>
</mfrac>
<mo>,</mo>
</mrow>
</mtd>
<mtd>
<mrow>
<mi>i</mi>
<mi>f</mi>
<mrow>
<mo>(</mo>
<mrow>
<msubsup>
<mi>s</mi>
<mi>k</mi>
<mrow>
<mi>i</mi>
<mi>j</mi>
</mrow>
</msubsup>
<mo>,</mo>
<msubsup>
<mi>a</mi>
<mi>k</mi>
<mrow>
<mi>i</mi>
<mi>j</mi>
</mrow>
</msubsup>
</mrow>
<mo>)</mo>
</mrow>
<mo>&Element;</mo>
<msubsup>
<mi>SA</mi>
<mrow>
<mi>i</mi>
<mi>m</mi>
<mi>p</mi>
</mrow>
<mi>e</mi>
</msubsup>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mrow>
<mn>0</mn>
<mo>,</mo>
</mrow>
</mtd>
<mtd>
<mrow>
<mi>o</mi>
<mi>t</mi>
<mi>h</mi>
<mi>e</mi>
<mi>r</mi>
<mi>w</mi>
<mi>i</mi>
<mi>s</mi>
<mi>e</mi>
</mrow>
</mtd>
</mtr>
</mtable>
</mfenced>
</mrow>
式中:K为奖励常数,满足K>0;SAe imp为帝国e中帝国主义国家的状态-动作对集合;
步骤S11:各个寻优国家展开有序寻优,共同更新文化矩阵,如下式所示:
<mfenced open = "" close = "">
<mtable>
<mtr>
<mtd>
<mrow>
<msubsup>
<mi>Q</mi>
<mrow>
<mi>k</mi>
<mo>+</mo>
<mn>1</mn>
</mrow>
<mrow>
<mi>e</mi>
<mi>i</mi>
</mrow>
</msubsup>
<mo>(</mo>
<mrow>
<msubsup>
<mi>s</mi>
<mi>k</mi>
<mrow>
<mi>i</mi>
<mi>j</mi>
</mrow>
</msubsup>
<mo>,</mo>
<msubsup>
<mi>a</mi>
<mi>k</mi>
<mrow>
<mi>i</mi>
<mi>j</mi>
</mrow>
</msubsup>
</mrow>
<mo>)</mo>
<mo>=</mo>
<msubsup>
<mi>Q</mi>
<mi>k</mi>
<mrow>
<mi>e</mi>
<mi>i</mi>
</mrow>
</msubsup>
<mrow>
<mo>(</mo>
<msubsup>
<mi>s</mi>
<mi>k</mi>
<mrow>
<mi>i</mi>
<mi>j</mi>
</mrow>
</msubsup>
<mo>,</mo>
<msubsup>
<mi>a</mi>
<mi>k</mi>
<mrow>
<mi>i</mi>
<mi>j</mi>
</mrow>
</msubsup>
<mo>)</mo>
</mrow>
<mo>+</mo>
<mi>&alpha;</mi>
<mo>&lsqb;</mo>
<msup>
<mi>R</mi>
<mrow>
<mi>i</mi>
<mi>j</mi>
</mrow>
</msup>
<mo>(</mo>
<mrow>
<msubsup>
<mi>s</mi>
<mi>k</mi>
<mrow>
<mi>i</mi>
<mi>j</mi>
</mrow>
</msubsup>
<mo>,</mo>
<msubsup>
<mi>s</mi>
<mrow>
<mi>k</mi>
<mo>+</mo>
<mn>1</mn>
</mrow>
<mrow>
<mi>i</mi>
<mi>j</mi>
</mrow>
</msubsup>
<mo>,</mo>
<msubsup>
<mi>a</mi>
<mi>k</mi>
<mrow>
<mi>i</mi>
<mi>j</mi>
</mrow>
</msubsup>
</mrow>
<mo>)</mo>
<mo>+</mo>
<mi>&gamma;</mi>
<munder>
<mrow>
<mi>m</mi>
<mi>a</mi>
<mi>x</mi>
</mrow>
<mrow>
<msup>
<mi>a</mi>
<mi>i</mi>
</msup>
<mo>&Element;</mo>
<msub>
<mi>A</mi>
<mi>i</mi>
</msub>
</mrow>
</munder>
<msubsup>
<mi>Q</mi>
<mi>k</mi>
<mrow>
<mi>e</mi>
<mi>i</mi>
</mrow>
</msubsup>
<mo>(</mo>
<mrow>
<msubsup>
<mi>s</mi>
<mrow>
<mi>k</mi>
<mo>+</mo>
<mn>1</mn>
</mrow>
<mrow>
<mi>i</mi>
<mi>j</mi>
</mrow>
</msubsup>
<mo>,</mo>
<mi>a</mi>
</mrow>
<mo>)</mo>
<mo>-</mo>
<msubsup>
<mi>Q</mi>
<mi>k</mi>
<mrow>
<mi>e</mi>
<mi>i</mi>
</mrow>
</msubsup>
<mo>(</mo>
<mrow>
<msubsup>
<mi>s</mi>
<mi>k</mi>
<mrow>
<mi>i</mi>
<mi>j</mi>
</mrow>
</msubsup>
<mo>,</mo>
<msubsup>
<mi>a</mi>
<mi>k</mi>
<mrow>
<mi>i</mi>
<mi>j</mi>
</mrow>
</msubsup>
</mrow>
<mo>)</mo>
<mo>&rsqb;</mo>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mrow>
<mi>j</mi>
<mo>&Element;</mo>
<msup>
<mi>J</mi>
<mi>e</mi>
</msup>
<mo>;</mo>
<mi>i</mi>
<mo>&Element;</mo>
<mi>I</mi>
<mo>;</mo>
<mi>e</mi>
<mo>&Element;</mo>
<mi>E</mi>
</mrow>
</mtd>
</mtr>
</mtable>
</mfenced>
式中:Qe表示帝国e的文化矩阵,R(sk,sk+1,ak)为寻优国家由状态sk经动作ak转移到状态sk+1所获得的立即奖励函数值;(sk,ak)是第k次迭代的状态-动作对;Je是第e个帝国的国家集合;I是可控变量集合;E是帝国集合;ai和Ai分别为可控变量xi的可选动作值和动作集合;
步骤S12:帝国间文化交流:落后帝国向最强帝国展开不同程度的文化学习,最强帝国引导落后帝国学习较先进的文化,加快寻优进程,如下式所示:
<mfenced open = "{" close = "">
<mtable>
<mtr>
<mtd>
<mrow>
<msubsup>
<mi>Q</mi>
<mrow>
<mi>k</mi>
<mo>+</mo>
<mn>1</mn>
</mrow>
<mrow>
<mi>e</mi>
<mi>i</mi>
</mrow>
</msubsup>
<mo>=</mo>
<msubsup>
<mi>Q</mi>
<mrow>
<mi>k</mi>
<mo>+</mo>
<mn>1</mn>
</mrow>
<mrow>
<mi>e</mi>
<mi>i</mi>
</mrow>
</msubsup>
<mo>+</mo>
<msup>
<mi>d</mi>
<mi>e</mi>
</msup>
<mo>&times;</mo>
<mi>r</mi>
<mi>a</mi>
<mi>n</mi>
<mi>d</mi>
<mrow>
<mo>(</mo>
<mrow>
<mn>0</mn>
<mo>,</mo>
<mn>1</mn>
</mrow>
<mo>)</mo>
</mrow>
<mo>&times;</mo>
<mrow>
<mo>(</mo>
<mrow>
<msubsup>
<mi>Q</mi>
<mrow>
<mi>k</mi>
<mo>+</mo>
<mn>1</mn>
</mrow>
<mrow>
<msub>
<mi>e</mi>
<mrow>
<mi>m</mi>
<mi>p</mi>
</mrow>
</msub>
<mi>i</mi>
</mrow>
</msubsup>
<mo>-</mo>
<msubsup>
<mi>Q</mi>
<mrow>
<mi>k</mi>
<mo>+</mo>
<mn>1</mn>
</mrow>
<mrow>
<mi>e</mi>
<mi>i</mi>
</mrow>
</msubsup>
</mrow>
<mo>)</mo>
</mrow>
<mo>,</mo>
<mi>e</mi>
<mo>&Element;</mo>
<mi>E</mi>
<mo>;</mo>
<mi>i</mi>
<mo>&Element;</mo>
<mi>I</mi>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mrow>
<msup>
<mi>d</mi>
<mi>e</mi>
</msup>
<mo>=</mo>
<mfrac>
<mrow>
<msup>
<mi>TP</mi>
<mi>e</mi>
</msup>
<mo>-</mo>
<munder>
<mi>min</mi>
<mrow>
<msup>
<mi>e</mi>
<mo>&prime;</mo>
</msup>
<mo>&Element;</mo>
<mi>E</mi>
</mrow>
</munder>
<mrow>
<mo>(</mo>
<mrow>
<msup>
<mi>TP</mi>
<msup>
<mi>e</mi>
<mo>&prime;</mo>
</msup>
</msup>
</mrow>
<mo>)</mo>
</mrow>
</mrow>
<mrow>
<munder>
<mi>max</mi>
<mrow>
<msup>
<mi>e</mi>
<mo>&prime;</mo>
</msup>
<mo>&Element;</mo>
<mi>E</mi>
</mrow>
</munder>
<mrow>
<mo>(</mo>
<mrow>
<msup>
<mi>TP</mi>
<msup>
<mi>e</mi>
<mo>&prime;</mo>
</msup>
</msup>
</mrow>
<mo>)</mo>
</mrow>
<mo>-</mo>
<munder>
<mi>min</mi>
<mrow>
<msup>
<mi>e</mi>
<mo>&prime;</mo>
</msup>
<mo>&Element;</mo>
<mi>E</mi>
</mrow>
</munder>
<mrow>
<mo>(</mo>
<mrow>
<msup>
<mi>TP</mi>
<msup>
<mi>e</mi>
<mo>&prime;</mo>
</msup>
</msup>
</mrow>
<mo>)</mo>
</mrow>
</mrow>
</mfrac>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mrow>
<msub>
<mi>e</mi>
<mrow>
<mi>m</mi>
<mi>p</mi>
</mrow>
</msub>
<mo>=</mo>
<mi>arg</mi>
<munder>
<mi>min</mi>
<mrow>
<mi>e</mi>
<mo>&Element;</mo>
<mi>E</mi>
</mrow>
</munder>
<mrow>
<mo>(</mo>
<mrow>
<msup>
<mi>TP</mi>
<mi>e</mi>
</msup>
</mrow>
<mo>)</mo>
</mrow>
</mrow>
</mtd>
</mtr>
</mtable>
</mfenced>
式中:de是帝国e与最强势力帝国之间标准化文化差异;emp是势力最强的帝国;
步骤S13:通过帝国间竞争,最强帝国占领最弱帝国的最弱殖民地,最强帝国可获得侵占权,如下式所示:
<mrow>
<msub>
<mi>e</mi>
<mrow>
<mi>a</mi>
<mi>g</mi>
</mrow>
</msub>
<mo>=</mo>
<mfenced open = "{" close = "">
<mtable>
<mtr>
<mtd>
<mrow>
<msub>
<mi>e</mi>
<mrow>
<mi>m</mi>
<mi>p</mi>
</mrow>
</msub>
<mo>,</mo>
</mrow>
</mtd>
<mtd>
<mrow>
<mi>i</mi>
<mi>f</mi>
<mi>&sigma;</mi>
<mo>&le;</mo>
<msub>
<mi>&sigma;</mi>
<mn>0</mn>
</msub>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mrow>
<mi>arg</mi>
<munder>
<mrow>
<mi>m</mi>
<mi>a</mi>
<mi>x</mi>
</mrow>
<mrow>
<mi>e</mi>
<mo>&Element;</mo>
<mi>E</mi>
</mrow>
</munder>
<mrow>
<mo>(</mo>
<msup>
<mi>p</mi>
<mi>e</mi>
</msup>
<mo>-</mo>
<mi>r</mi>
<mi>a</mi>
<mi>n</mi>
<mi>d</mi>
<mo>(</mo>
<mrow>
<mn>0</mn>
<mo>,</mo>
<mn>1</mn>
</mrow>
<mo>)</mo>
<mo>)</mo>
</mrow>
<mo>,</mo>
</mrow>
</mtd>
<mtd>
<mrow>
<mi>o</mi>
<mi>t</mi>
<mi>h</mi>
<mi>e</mi>
<mi>r</mi>
<mi>w</mi>
<mi>i</mi>
<mi>s</mi>
<mi>e</mi>
</mrow>
</mtd>
</mtr>
</mtable>
</mfenced>
</mrow>
<mrow>
<msup>
<mi>p</mi>
<mi>e</mi>
</msup>
<mo>=</mo>
<mfrac>
<mrow>
<msup>
<mi>TP</mi>
<mi>max</mi>
</msup>
<mo>-</mo>
<msup>
<mi>TP</mi>
<mi>e</mi>
</msup>
</mrow>
<mrow>
<munder>
<mi>&Sigma;</mi>
<mrow>
<msup>
<mi>e</mi>
<mo>&prime;</mo>
</msup>
<mo>&Element;</mo>
<mi>E</mi>
</mrow>
</munder>
<mrow>
<mo>(</mo>
<mrow>
<msup>
<mi>TP</mi>
<mi>max</mi>
</msup>
<mo>-</mo>
<msup>
<mi>TP</mi>
<msup>
<mi>e</mi>
<mo>&prime;</mo>
</msup>
</msup>
</mrow>
<mo>)</mo>
</mrow>
</mrow>
</mfrac>
</mrow>
<mrow>
<msup>
<mi>TP</mi>
<mrow>
<mi>m</mi>
<mi>a</mi>
<mi>x</mi>
</mrow>
</msup>
<mo>=</mo>
<munder>
<mrow>
<mi>m</mi>
<mi>a</mi>
<mi>x</mi>
</mrow>
<mrow>
<msup>
<mi>e</mi>
<mo>&prime;</mo>
</msup>
<mo>&Element;</mo>
<mi>E</mi>
</mrow>
</munder>
<mrow>
<mo>(</mo>
<msup>
<mi>TP</mi>
<msup>
<mi>e</mi>
<mo>&prime;</mo>
</msup>
</msup>
<mo>)</mo>
</mrow>
</mrow>
式中:σ0为最强帝国侵占因子(σ0为常数,且满足σ0∈[0,1])eag为侵占国;σ为一个在区间[0,1]内均匀分布的随机数;pe为帝国e的争夺实力;TPmax为最弱帝国的总势力;
步骤S14:判断是否达到最大迭代次数,若达到,输出发电机端电压、无功补偿装置容量及变压器变比的控制策略;否则,返回步骤S8,迭代继续进行。
2.根据权利要求1所述的基于帝国主义竞争算法的碳-能复合流求解方法,其特征在于:所述步骤S7中reh越大,新任务从源任务h最优文化矩阵中获取的信息就越多,为使得源任务历史学习经验得以最大化利用,reh如下式所示:
<mrow>
<msub>
<mi>r</mi>
<mrow>
<mi>e</mi>
<mi>h</mi>
</mrow>
</msub>
<mo>=</mo>
<mfenced open = "{" close = "">
<mtable>
<mtr>
<mtd>
<mrow>
<mfrac>
<mrow>
<mo>&lsqb;</mo>
<msub>
<mi>T</mi>
<mi>f</mi>
</msub>
<mo>+</mo>
<msubsup>
<mi>&Delta;P</mi>
<mi>D</mi>
<mrow>
<mi>e</mi>
<mo>,</mo>
<mi>m</mi>
<mi>a</mi>
<mi>x</mi>
</mrow>
</msubsup>
<mo>&rsqb;</mo>
<mo>-</mo>
<mo>|</mo>
<msubsup>
<mi>P</mi>
<mi>D</mi>
<mi>h</mi>
</msubsup>
<mo>-</mo>
<msubsup>
<mi>P</mi>
<mi>D</mi>
<mrow>
<mi>n</mi>
<mi>t</mi>
</mrow>
</msubsup>
<mo>|</mo>
</mrow>
<mrow>
<munder>
<mo>&Sigma;</mo>
<mrow>
<mi>h</mi>
<mo>&Element;</mo>
<msup>
<mi>LD</mi>
<mi>e</mi>
</msup>
</mrow>
</munder>
<mo>{</mo>
<mo>&lsqb;</mo>
<msub>
<mi>T</mi>
<mi>f</mi>
</msub>
<mo>+</mo>
<msubsup>
<mi>&Delta;P</mi>
<mi>D</mi>
<mrow>
<mi>e</mi>
<mo>,</mo>
<mi>max</mi>
</mrow>
</msubsup>
<mo>&rsqb;</mo>
<mo>-</mo>
<mo>|</mo>
<msubsup>
<mi>P</mi>
<mi>D</mi>
<mi>h</mi>
</msubsup>
<mo>-</mo>
<msubsup>
<mi>P</mi>
<mi>D</mi>
<mrow>
<mi>n</mi>
<mi>t</mi>
</mrow>
</msubsup>
<mo>|</mo>
<mo>}</mo>
</mrow>
</mfrac>
<mo>,</mo>
</mrow>
</mtd>
<mtd>
<mrow>
<mi>i</mi>
<mi>f</mi>
<mi> </mi>
<mi>h</mi>
<mo>&Element;</mo>
<msup>
<mi>LD</mi>
<mi>e</mi>
</msup>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mrow>
<mn>0</mn>
<mo>,</mo>
</mrow>
</mtd>
<mtd>
<mrow>
<mi>o</mi>
<mi>t</mi>
<mi>h</mi>
<mi>e</mi>
<mi>r</mi>
<mi>w</mi>
<mi>i</mi>
<mi>s</mi>
<mi>e</mi>
</mrow>
</mtd>
</mtr>
</mtable>
</mfenced>
</mrow>
<mrow>
<msubsup>
<mi>&Delta;P</mi>
<mi>D</mi>
<mrow>
<mi>e</mi>
<mo>,</mo>
<mi>m</mi>
<mi>a</mi>
<mi>x</mi>
</mrow>
</msubsup>
<mo>=</mo>
<munder>
<mrow>
<mi>m</mi>
<mi>a</mi>
<mi>x</mi>
</mrow>
<mrow>
<mi>h</mi>
<mo>&Element;</mo>
<msup>
<mi>LD</mi>
<mi>e</mi>
</msup>
</mrow>
</munder>
<mrow>
<mo>(</mo>
<mo>|</mo>
<msubsup>
<mi>P</mi>
<mi>D</mi>
<mi>h</mi>
</msubsup>
<mo>-</mo>
<msubsup>
<mi>P</mi>
<mi>D</mi>
<mrow>
<mi>n</mi>
<mi>t</mi>
</mrow>
</msubsup>
<mo>|</mo>
<mo>)</mo>
</mrow>
</mrow>
|LDe|=2e
式中:LDe是帝国e的源任务集合,表征与帝国e的新任务最相似的2e个源任务,PD nt为新任务的有功负荷;ΔPD e,max是LDe中的任务与新任务的最大有功偏差值;Tf是迁移因子;相似度满足:re1+re2+…+reH=1。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710406502.8A CN107256440A (zh) | 2017-06-01 | 2017-06-01 | 一种基于帝国主义竞争算法的碳‑能复合流求解方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710406502.8A CN107256440A (zh) | 2017-06-01 | 2017-06-01 | 一种基于帝国主义竞争算法的碳‑能复合流求解方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107256440A true CN107256440A (zh) | 2017-10-17 |
Family
ID=60023002
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710406502.8A Pending CN107256440A (zh) | 2017-06-01 | 2017-06-01 | 一种基于帝国主义竞争算法的碳‑能复合流求解方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107256440A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107844866A (zh) * | 2017-11-21 | 2018-03-27 | 云南电网有限责任公司玉溪供电局 | 一种基于帝国主义竞争算法的家庭智能用电管理方法 |
CN109103901A (zh) * | 2018-10-22 | 2018-12-28 | 重庆邮电大学 | 一种基于dsica算法的电力系统多目标无功优化方法 |
CN115145709A (zh) * | 2022-07-19 | 2022-10-04 | 华南师范大学 | 低碳大数据人工智能方法和医康养生态系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105023056A (zh) * | 2015-06-26 | 2015-11-04 | 华南理工大学 | 基于群智能强化学习的电网最优碳能复合流获取方法 |
CN106570584A (zh) * | 2016-11-02 | 2017-04-19 | 北京工商大学 | 基于改进帝国主义竞争算法的城市轨道交通乘客路径选择方法 |
-
2017
- 2017-06-01 CN CN201710406502.8A patent/CN107256440A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105023056A (zh) * | 2015-06-26 | 2015-11-04 | 华南理工大学 | 基于群智能强化学习的电网最优碳能复合流获取方法 |
CN106570584A (zh) * | 2016-11-02 | 2017-04-19 | 北京工商大学 | 基于改进帝国主义竞争算法的城市轨道交通乘客路径选择方法 |
Non-Patent Citations (2)
Title |
---|
XIAOSHUN ZHANG ET AL: "Equilibrium-inspired multiagent optimizer with extreme transfer learning for decentralized optimal carbon-energy combined-flow of large-scale power systems", 《ELSEVIER》 * |
郭乐欣: "基于多主体强化学习的碳能复合流无功优化算法研究", 《中国优秀硕士学位论文全文数据库工程科技II辑》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107844866A (zh) * | 2017-11-21 | 2018-03-27 | 云南电网有限责任公司玉溪供电局 | 一种基于帝国主义竞争算法的家庭智能用电管理方法 |
CN109103901A (zh) * | 2018-10-22 | 2018-12-28 | 重庆邮电大学 | 一种基于dsica算法的电力系统多目标无功优化方法 |
CN109103901B (zh) * | 2018-10-22 | 2021-11-12 | 重庆邮电大学 | 一种基于dsica算法的电力系统多目标无功优化方法 |
CN115145709A (zh) * | 2022-07-19 | 2022-10-04 | 华南师范大学 | 低碳大数据人工智能方法和医康养生态系统 |
CN115145709B (zh) * | 2022-07-19 | 2024-05-17 | 华南师范大学 | 低碳大数据人工智能方法和医康养生态系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110535146A (zh) | 基于深度确定策略梯度强化学习的电力系统无功优化方法 | |
CN106058855A (zh) | 协调储能与柔性负荷的主动配电网多目标优化调度方法 | |
CN103441506B (zh) | 不同时间尺度下多目标协调分散风电场无功优化控制方法 | |
Huang et al. | Comparative study of evolutionary computation methods for active–reactive power dispatch | |
CN103280821A (zh) | 智能配电系统多时段动态无功优化方法 | |
CN105790282B (zh) | 一种含upfc电网的无功优化分析系统和方法 | |
CN107492892A (zh) | 一种多目标有功调度求解方法及系统 | |
Mathur et al. | A comprehensive analysis of intelligent controllers for load frequency control | |
CN105186499A (zh) | 一种配电网多目标概率最优潮流模糊建模与求解方法 | |
CN107256440A (zh) | 一种基于帝国主义竞争算法的碳‑能复合流求解方法 | |
CN107069807A (zh) | 含不确定性预算调节的无平衡节点微网鲁棒调度方法 | |
CN107546773A (zh) | 一种基于图论的区域多微电网动态组网方法 | |
CN107330251A (zh) | 一种基于云遗传算法的风功率预测方法 | |
CN108306346A (zh) | 一种配电网无功补偿节能方法 | |
CN108242812A (zh) | 基于模块度优化的双阶段无功电压分区方法及系统 | |
CN109034587A (zh) | 一种协调多种可控单元的主动配电系统优化调度方法 | |
CN106602593A (zh) | 微电网多目标转化单目标的方法 | |
CN104578091B (zh) | 一种含多源电网的无延时最优无功协调控制系统及方法 | |
CN110336285A (zh) | 基于iboa的电力系统最优经济潮流计算方法 | |
CN105720591A (zh) | 一种电力系统无功优化方法及系统 | |
Ren | Optimal site selection for thermal power plant based on rough sets and multi-objective programming | |
CN109950933B (zh) | 一种基于改进粒子群算法的风光储联合调峰优化方法 | |
CN116054152A (zh) | 一种考虑经济效益的风光储参与配电网源网荷储协同优化控制的方法 | |
Huang et al. | Optimal active-reactive power dispatch using an enhanced differential evolution algorithm | |
Elkhidir et al. | SVC-based controller design via ant colony optimization algorithm |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20171017 |