CN112953286A - 基于Q-Learning算法同容量三相逆变器并联环流抑制方法 - Google Patents

基于Q-Learning算法同容量三相逆变器并联环流抑制方法 Download PDF

Info

Publication number
CN112953286A
CN112953286A CN202110294981.5A CN202110294981A CN112953286A CN 112953286 A CN112953286 A CN 112953286A CN 202110294981 A CN202110294981 A CN 202110294981A CN 112953286 A CN112953286 A CN 112953286A
Authority
CN
China
Prior art keywords
inverter
impedance
output
learning
current
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110294981.5A
Other languages
English (en)
Other versions
CN112953286B (zh
Inventor
彭云建
王腾飞
孙伟杰
康睿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China University of Technology SCUT
Original Assignee
South China University of Technology SCUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China University of Technology SCUT filed Critical South China University of Technology SCUT
Priority to CN202110294981.5A priority Critical patent/CN112953286B/zh
Publication of CN112953286A publication Critical patent/CN112953286A/zh
Application granted granted Critical
Publication of CN112953286B publication Critical patent/CN112953286B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02MAPPARATUS FOR CONVERSION BETWEEN AC AND AC, BETWEEN AC AND DC, OR BETWEEN DC AND DC, AND FOR USE WITH MAINS OR SIMILAR POWER SUPPLY SYSTEMS; CONVERSION OF DC OR AC INPUT POWER INTO SURGE OUTPUT POWER; CONTROL OR REGULATION THEREOF
    • H02M7/00Conversion of ac power input into dc power output; Conversion of dc power input into ac power output
    • H02M7/42Conversion of dc power input into ac power output without possibility of reversal
    • H02M7/44Conversion of dc power input into ac power output without possibility of reversal by static converters
    • H02M7/48Conversion of dc power input into ac power output without possibility of reversal by static converters using discharge tubes with control electrode or semiconductor devices with control electrode
    • H02M7/53Conversion of dc power input into ac power output without possibility of reversal by static converters using discharge tubes with control electrode or semiconductor devices with control electrode using devices of a triode or transistor type requiring continuous application of a control signal
    • H02M7/537Conversion of dc power input into ac power output without possibility of reversal by static converters using discharge tubes with control electrode or semiconductor devices with control electrode using devices of a triode or transistor type requiring continuous application of a control signal using semiconductor devices only, e.g. single switched pulse inverters
    • H02M7/5387Conversion of dc power input into ac power output without possibility of reversal by static converters using discharge tubes with control electrode or semiconductor devices with control electrode using devices of a triode or transistor type requiring continuous application of a control signal using semiconductor devices only, e.g. single switched pulse inverters in a bridge configuration

Landscapes

  • Engineering & Computer Science (AREA)
  • Power Engineering (AREA)
  • Inverter Devices (AREA)

Abstract

本发明公开了一种基于Q‑Learning算法同容量三相逆变器并联环流抑制方法,该方法包括下述步骤:建立输出线路阻抗参数未知的同容量三相逆变器并联系统动态模型,完成线路阻抗和负载阻抗对逆变器并联运行环流的解耦;基于输出线路阻抗参数未知的三相逆变器并联系统动态模型,采用下垂控制策略引入虚拟阻抗控制环,实现增益参数可调节的虚拟阻抗下垂控制方法;采用强化学习Q‑Learning算法对多台逆变器输出无功功率之间的偏差进行学习,通过调节虚拟阻抗增益系数的方法降低各条线路阻抗之间的差异,抑制环流。本发明实现了三相逆变器并联运行在线路阻抗参数未知的情形下降低逆变器输出线路阻抗的差异,达到抑制环流的效果。

Description

基于Q-Learning算法同容量三相逆变器并联环流抑制方法
技术领域
本发明涉及逆变器并联控制技术领域,具体涉及一种基于Q-Learning算法同容量三相逆变器并联环流抑制方法。
背景技术
随着新能源技术的快速发展,以太阳能和风能为主导的可再生能源发电技术正在得到越来越广泛的应用。由于太阳能风能等新能源在地理位置上的分布不均,并且单个太阳能阵列或者风轮机输出的功率有限,而逆变器作为新能源发电技术中的核心器件,构建逆变器并联系统变得非常重要。但是由于各个逆变器和公共交流母线之间的线路阻抗不同,使得逆变器并联之后会出现线路之间的大环流破坏整个逆变器并联系统稳定性的问题。
在逆变器并联控制领域,现有的下垂控制策略是最常使用的方法,但是该方法不能应对多台逆变器输出线路阻抗差异而导致环流的问题。
发明内容
为了克服现有技术存在的缺陷与不足,本发明提供一种基于Q-Learning算法同容量三相逆变器并联环流抑制方法,将强化学习Q-Learning算法和下垂控制策略以及增加虚拟阻抗方法结合起来,实现在各个逆变器线路阻抗参数未知的情况下动态调节线路虚拟阻抗,减少逆变器输出线路阻抗的差异,从而达到抑制并联逆变器之间环流的效果。
本发明的第二目的在提供一种基于Q-Learning算法同容量三相逆变器并联环流抑制系统。
本发明的第三目的在于提供一种存储介质。
本发明的第四目的在于提供一种计算设备。
为了达到上述目的,本发明采用以下技术方案:
本发明提供一种基于Q-Learning算法同容量三相逆变器并联环流抑制方法,包括下述步骤:
建立输出线路阻抗参数未知的同容量三相逆变器并联系统动态模型,完成线路阻抗和负载阻抗对逆变器并联运行环流的解耦;
基于输出线路阻抗参数未知的三相逆变器并联系统动态模型,采用下垂控制策略引入虚拟阻抗控制环,实现增益参数可调节的虚拟阻抗下垂控制方法;
采用强化学习Q-Learning算法对多台逆变器输出无功功率之间的偏差进行学习,通过调节虚拟阻抗增益系数的方法降低各条线路阻抗之间的差异,抑制环流。
作为优选的技术方案,所述建立输出线路阻抗参数未知的同容量三相逆变器并联系统动态模型,具体步骤包括:
建立逆变器并联系统的数学模型,表示为:
Figure BDA0002983984670000021
其中,Vo,k(s)、Io,k(s)分别表示各台逆变器输出电压和电流,Zline,k表示各台逆变器与交流母线之间的连线阻抗,Ubus(s)为交流母线电压,Iload(s)为负载端总的负载电流,并且母线电压和负载端电压相等,Zload为公共负载,Iload,k(s)为流入各负载的电流,k表示并联系统中任意一台逆变器;
每台逆变器输出环流的表达式为:
Figure BDA0002983984670000022
设计每台逆变器的输出线路阻抗满足:
mkZline,k=mjZline,j k,j=1,2,...,n
优化后的每台逆变器输出环流的表达式为:
Figure BDA0002983984670000031
每台逆变器输出的环流与逆变器输出电压、各逆变器加权平均值电压以及输出线路阻抗有关,完成了逆变器并联运行时环流和负载的解耦。
作为优选的技术方案,所述采用下垂控制策略引入虚拟阻抗控制环,具体步骤包括:
在下垂控制电路的基础之上搭建反馈回路,所述反馈回路中包括基础的阻抗常数和可调节的增益系数,所述反馈回路的输入为逆变器输出电流值,回路中的虚拟阻抗值为控制器中电感电流、初始阻抗常数以及虚拟阻抗增益系数的乘积,在下垂控制环中减掉虚拟阻抗值,最后将二者比较后的电压差值输入电压比例积分控制单元和电流比例单元,再经过坐标变换以及SPWM调制生成开关管的控制信号对三相逆变桥进行控制。
作为优选的技术方案,所述采用下垂控制策略引入虚拟阻抗控制环,加入虚拟阻抗的数学模型表示为:
U'dqref(s)=Udqref(s)-Z(s)I(s)W
其中,U′dqref(s)为加入虚拟阻抗之后给到电压电流内环的参考电压,Udqref(s)为传统下垂控制下给到电压电流内环的参考电压,Z(s)为需加入的基础阻抗常数,I(s)为逆变器输出电流,W为虚拟阻抗增益系数。
作为优选的技术方案,所述采用强化学习Q-Learning算法对多台逆变器输出无功功率之间的偏差进行学习,具体步骤包括:
将各逆变器输出的无功功率和平均无功功率的偏差作为环境状态,对并联系统中每台逆变器都引入强化学习控制器,并由此建立环境状态集合S,表示为:
S={ΔQ1 ΔQ2 ... ΔQi ... ΔQT}
ΔQ=Q-Qload/N
其中,ΔQi表示单台逆变器输出无功功率和平均无功功率的偏差等级,Q表示单台逆变器输出的无功功率,Qload表示总负载无功功率,N表示并联系统中逆变器总数,ΔQ表示任意一台逆变器输出无功功率和平均无功功率的偏差;
对每台逆变器定义动作集合A:
A={ΔW1 ΔW2 ... ΔWi ... ΔWK}
其中,ΔWi表示虚拟阻抗增益系数的不同增益值,并且将所加增益系数值分为K个等级;
在环境状态集合S和动作集合A的前提下,定义奖励函数R,表示为:
Figure BDA0002983984670000041
其中,(Si,Ai)表示逆变器并联系统中任意第j台逆变器所处状态Si时执行动作Ai后可以获得的奖励,ΔQ表示任意一台逆变器输出无功功率和平均无功功率的偏差,ΔQ1、ΔQ2、ΔQ3、ΔQ4表示对五无功功率偏差设置的偏差范围边界值,α1、α2、α3、α3表示针对不同无功功率偏差区间设计的控制参数;
根据环境状态集合S和动作集合A建立状态动作价值表,所述动作价值表每一行代表状态集合S中的一个状态,每一列代表动作集合A中的一个动作,所述动作价值表中的任意一项表示在该状态下执行该动作得到的奖励,记录学习的结果,获得最佳决策,建立强化学习Q-learning算法模型;
根据强化学习Q-learning算法模型对逆变器的控制器进行迭代训练;
控制器根据状态动作价值表自动找寻最佳虚拟阻抗增益系数,增益系数乘上虚拟阻抗常数以及输出电流构建逆变器输出线路阻抗的补偿,对线路阻抗进行补偿调整。
作为优选的技术方案,所述强化学习Q-learning算法模型表示为:
Qk+1(Si,Ai)=Qk(Si,Ai)+α[R(Si,Ai)+γ·maxQk(Si+1,A)-Qk+1(Si,Ai)]
其中,Qk+1(Si,Ai)表示算法迭代至第k+1回合时状态动作价值表中Si行和Ai列对应的价值,Qk(Si,Ai)表示算法迭代至第k回合时状态动作价值表中Si行和Ai列对应的价值;α表示学习率,且0<α<1;γ表示折扣因子,当γ=0时只考虑立即奖励,当γ=1时,长期奖励和立即奖励地位一样;R(Si,Ai)表示在状态Si时执行动作Ai所能得到的奖励;maxQk(Si+1,A)表示状态动作价值表中第Si+1行的最大价值。
作为优选的技术方案,所述根据强化学习Q-learning算法模型对逆变器的控制器进行迭代训练,具体步骤包括:
初始化状态动作价值表,表中的价值赋初始值都为0;
强化学习控制器不断地给出虚拟阻抗的可调增益值,并同时采集逆变器输出的无功功率和平均无功功率的偏差;
迭代训练后学习算法收敛,强化学习控制器找到最佳的虚拟阻抗增益值使得无功功率偏差降到预设水平,训练设定迭代次数后输出训练好的状态动作价值表。
为了达到上述第二目的,本发明采用以下技术方案:
一种基于Q-Learning算法同容量三相逆变器并联环流抑制系统,包括:动态模型构建模块、虚拟阻抗下垂控制模块和偏差学习模块;
所述动态模型构建模块用于建立输出线路阻抗参数未知的同容量三相逆变器并联系统动态模型,完成线路阻抗和负载阻抗对逆变器并联运行环流的解耦;
所述虚拟阻抗下垂控制模块用于基于输出线路阻抗参数未知的三相逆变器并联系统动态模型,采用下垂控制策略引入虚拟阻抗控制环,实现增益参数可调节的虚拟阻抗下垂控制方法;
所述偏差学习模块用于采用强化学习Q-Learning算法对多台逆变器输出无功功率之间的偏差进行学习,通过调节虚拟阻抗增益系数的方法降低各条线路阻抗之间的差异,抑制环流。
为了达到上述第三目的,本发明采用以下技术方案:
一种存储介质,存储有程序,所述程序被处理器执行时实现如上述基于Q-Learning算法同容量三相逆变器并联环流抑制方法。
为了达到上述第四目的,本发明采用以下技术方案:
一种计算设备,包括处理器和用于存储处理器可执行程序的存储器,所述处理器执行存储器存储的程序时,实现如上述基于Q-Learning算法同容量三相逆变器并联环流抑制方法。
本发明与现有技术相比,具有如下优点和有益效果:
(1)本发明采用强化学习Q-Learning算法对逆变器输出无功功率偏差进行学习的方案,解决了相同容量并联逆变器间无功功率不均分的技术问题,达到了均分逆变器输出无功功率的效果。
(2)本发明采用了结合Q-Learning算法、虚拟阻抗以及无功功率偏差进行学习的方案,解决了线路阻抗参数未知情形下并联逆变器间环流过大的技术问题,达到了降低线路阻抗差异,抑制环流的效果。
附图说明
图1为本发明电压型三相逆变器并联系统等效电路图;
图2为本发明逆变器并联系统环流示意图;
图3为本发明下垂控制结构图;
图4为本发明基于虚拟阻抗的下垂控制结构图;
图5为本发明强化学习Q-learning算法训练流程图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
实施例1
本实施例提供一种基于Q-Learning算法的同容量三相逆变器并联环流抑制方法,包括下述步骤:
S1:建立输出线路阻抗参数未知的同容量三相逆变器并联系统动态模型,实现线路阻抗和负载阻抗对逆变器并联运行环流的解耦;
如图1所示,图中所有符号均为频域表达式,根据电压型逆变器并联系统等效电路图,由基尔霍夫电压电流定律,可以得到并联系统电压电流方程:
Figure BDA0002983984670000071
Figure BDA0002983984670000072
Io,1(s)+Io,2(s)+Io,3(s)+...+Io,n=Iload(s) (1-3)
其中,Vo,k(s)、Io,k(s)分别表示各台逆变器输出电压和电流,Zline,k表示各台逆变器与交流母线之间的连线阻抗,Ubus(s)为交流母线电压,Iload(s)为负载端总的负载电流,并且母线电压和负载端电压相等;Zload为公共负载,Iload,k(s)为流入各负载的电流;k表示并联系统中任意一台逆变器,k=1,2…n。
联立式(1-1)、(1-2)和(1-3)进行化简,可以得到每台逆变器的输出电流,也即逆变器并联系统的数学模型:
Figure BDA0002983984670000081
根据式(1-4)并联系统的数学模型进一步推导出系统环流模型。当整个逆变器并联系统稳定运行时,交流母线电压和负载电流也是稳定不变的,因而此时各台逆变器按照各自自身的容量对负载功率进行均分,其本质就是按照各自容量的权重系数对负载电流进行均分。因此,可假设第k台逆变器的理想输出电流为It,k(s),则有:
It,k(s)=mkIload(s) (1-5)
其中,mk表示第k台逆变器的容量在所有并联逆变器中的权重值;因此,根据基尔霍夫电流定律,在n台逆变器并联系统中,则有:
m1+m2+...+mk+...+mn=1 (1-6)
进而,可以推出每一台逆变器输出环流的定义式:
Ih,k(s)=Io,k(s)-mkIload(s) (1-7)
其中,Io,k(s)和Iload(s)分别表示第k台逆变器的输出电流和总的负载电流,Ih,k(s)表示第k台逆变器输出的环流,mk表示第k台逆变器的自身容量占所有逆变器总容量的比例(或者说权重)。
根据式(1-7)可以知道,逆变器并联系统中的环流会从一台逆变器流入另一台逆变器,进而对系统造成影响,如图2所示,图为两台三相电压型逆变器并联环流示意。
根据环流定义式,即联立式(1-4)和(1-7),可进一步推出每台逆变器输出环流的表达式:
Figure BDA0002983984670000091
由式(1-8)可知,每台逆变器输出的环流还与负载阻抗Zload有关,因此可以对该环流模型进行改进,设计每台逆变器的输出线路阻抗都满足下式:
mkZline,k=mjZline,j k,j=1,2,...,n (1-9)
联立式(1-8)和(1-9),可以得到优化后的每台逆变器输出环流的表达式:
Figure BDA0002983984670000092
由式(1-10)分析可知,每台逆变器输出的环流与逆变器输出电压、各逆变器加权平均值电压以及输出线路阻抗有关,而与负载阻抗无关,即通过式(1-9)的设计方法消除负载对并联逆变器间环流的影响,同时该方式也完成了逆变器并联运行时环流和负载的解耦。而式(1-9)则为后续学习算法的工作提供了前提,在逆变器输出线路阻抗未知的情形下,学习的目标即为式(1-9)的情况。
S2:基于输出线路阻抗参数未知的三相逆变器并联系统动态模型,采用下垂控制策略,引入虚拟阻抗控制环,实现增益参数可调节的虚拟阻抗下垂控制方法;
具体步骤为:
针对式(1-10)中给出的环流模型,采用下垂控制可以很好的抑制环流并且实现功率均分,如图3所示,按照下述下垂控制公式设计三相逆变器的控制器:
Figure BDA0002983984670000093
其中,f,fn分别为下垂控制逆变器当前输出电压频率和逆变器额定输出电压频率,m为有功功率下垂系数,P,Pn分别为逆变器当前输出有功功率和逆变器额定输出有功功率;U,Un分别为逆变器当前输出电压幅值和逆变器额定输出电压幅值,n为无功功率下垂系数,Q,Qn分别为逆变器当前输出无功功率和逆变器额定输出无功功率。
如图4所示,在下垂控制电路的基础之上搭建新的反馈回路,反馈回路中包括基础的阻抗常数和可调节的增益系数,并且该反馈回路的输入为逆变器输出电流值,回路中的虚拟阻抗值即为控制器中电感电流、初始阻抗常数以及虚拟阻抗增益系数的乘积;而后在下垂控制环中减掉虚拟阻抗值,最后将二者比较后的电压差值输入电压比例积分控制单元和电流比例单元,再经过坐标变换以及SPWM调制生成开关管的控制信号对三相逆变桥进行控制。
加入虚拟阻抗的数学模型为:
U'dqref(s)=Udqref(s)-Z(s)I(s)W (2-2)
其中,U′dqref(s)为加入虚拟阻抗之后给到电压电流内环的参考电压,Udqref(s)为传统下垂控制下给到电压电流内环的参考电压,Z(s)为需加入的基础阻抗常数,I(s)为逆变器输出电流,W为虚拟阻抗增益系数,可自动调节。
在原有下垂控制的基础之上加入虚拟阻抗反馈环,并且环中包含基础阻抗常数和可调增益系数的控制手段,可以实现只调节控制器中的增益系数W的大小以改变逆变器输出线路阻抗的效果。
S3:采用强化学习Q-Learning算法对多台逆变器输出无功功率之间的偏差进行学习,通过调节虚拟阻抗增益系数的方法降低各条线路阻抗之间的差异,抑制环流。
具体步骤为:
结合式(1-10)和式(1-11)分析可知,抑制多台逆变器并联系统中环流有两个办法,一是减小并联逆变器间输出电压的差异,二是增大并联逆变器的输出线路阻抗;又根据下垂控制可知,逆变器输出的无功功率和逆变器输出电压幅值具有一定的关系,并且,逆变器输出电压幅值又与逆变器输出线路阻抗相关,因而可将逆变器输出无功功率和其输出线路阻抗进行联系。
在以上思路的基础上,引入强化学习方法;首先,将各逆变器输出的无功功率和平均无功功率的偏差作为环境状态,对并联系统中每台逆变器都引入强化学习控制器,并由此建立环境状态集合S:
S={ΔQ1 ΔQ2 ... ΔQi ... ΔQT} (3-1)
ΔQ=Q-Qload/N (3-2)
其中,式(3-1)中ΔQi表示单台逆变器输出无功功率和平均无功功率的偏差等级,在状态集合S中可根据实际情况可总共设置T个偏差等级;式(3-2)中Q表示单台逆变器输出的无功功率,Qload表示总负载无功功率,N表示并联系统中逆变器总数,ΔQ表示任意一台逆变器输出无功功率和平均无功功率的偏差。
对每台逆变器定义动作集合A:
A={ΔW1 ΔW2 ... ΔWi ... ΔWK} (3-3)
其中,式(3-3)中ΔWi表示虚拟阻抗增益系数的不同增益值,并且将所加增益系数值分为K个等级,即动作集合A中共有K个动作。
在上述定义的环境状态集合和动作集合的前提下,定义算法中的奖励函数R:
Figure BDA0002983984670000111
其中,式(3-4)中Rj(Si,Ai)表示逆变器并联系统中任意第j台逆变器所处状态Si时执行动作Ai后可以获得的奖励,ΔQ表示任意一台逆变器输出无功功率和平均无功功率的偏差;ΔQ1、ΔQ2、ΔQ3、ΔQ4表示对五无功功率偏差设置的偏差范围边界值,实际应用中可以设置更多的边界值对范围区间进一步细化;α1、α2、α3、α3表示针对不同无功功率偏差区间设计的控制参数。
根据以上定义的环境状态集合S和动作集合A建立状态动作价值表,即Q表,该表中的每一行代表状态集合S中的一个状态,每一列代表动作集合A中的一个动作,表中的任意一项表示在该状态下执行该动作可以得到的奖励,以记录学习的结果,从而获得最佳决策,而后建立强化学习Q-learning算法模型:
Figure BDA0002983984670000121
其中,Qk+1(Si,Ai)表示算法迭代至第k+1回合时Q表中Si行和Ai列对应的价值,同理,Qk(Si,Ai)表示算法迭代至第k回合时Q表中Si行和Ai列对应的价值;α表示学习率,且0<α<1;γ表示折扣因子,当γ=0时只考虑立即奖励,当γ=1时,长期奖励和立即奖励地位一样;R(Si,Ai)表示在状态Si时执行动作Ai所能得到的奖励;maxQk(Si+1,A)表示Q表中第Si+1行的最大价值。
最后,根据式(3-5)表示的算法对逆变器的控制器进行迭代训练,如图5所示,首先初始化一张Q表,表中的价值赋初始值都为0;而后强化学习控制器不断地给出虚拟阻抗的可调增益值,并同时采集逆变器输出的无功功率和平均无功功率的偏差;最后通过多次的试错学习之后,该学习算法会收敛,即强化学习控制器可以找到最佳的虚拟阻抗增益值使得无功功率偏差降到较低水平。根据实际要求训练一定的次数之后可以得到一张训练好的Q表;
最后控制器根据Q表自动找寻最佳虚拟阻抗增益系数,Q表记录下来逆变器处在任意一个状态时可以选取的最佳调优策略,而控制可以根据此时逆变器所处状态去查询Q表,以获得调整增益系数的值来达到最佳状态;
而后增益系数乘上虚拟阻抗常数以及输出电流可构建逆变器输出线路阻抗的补偿,即补偿是指各逆变器线路阻抗之间存在差异,为消除这一差异可以对一台逆变器的线路阻抗进行补偿调整,以达到和另一台逆变器的线路阻抗相同,则线路阻抗差异就通过虚拟阻抗的方式得到补偿,从而实现环流抑制的效果,并且也能提高系统的动态响应速度。
实施例2
本实施例提供一种基于Q-Learning算法同容量三相逆变器并联环流抑制系统,包括:动态模型构建模块、虚拟阻抗下垂控制模块和偏差学习模块;
在本实施例中,动态模型构建模块用于建立输出线路阻抗参数未知的同容量三相逆变器并联系统动态模型,完成线路阻抗和负载阻抗对逆变器并联运行环流的解耦;
在本实施例中,虚拟阻抗下垂控制模块用于基于输出线路阻抗参数未知的三相逆变器并联系统动态模型,采用下垂控制策略引入虚拟阻抗控制环,实现增益参数可调节的虚拟阻抗下垂控制方法;
在本实施例中,偏差学习模块用于采用强化学习Q-Learning算法对多台逆变器输出无功功率之间的偏差进行学习,通过调节虚拟阻抗增益系数的方法降低各条线路阻抗之间的差异,抑制环流。
实施例3
本实施例提供一种存储介质,存储介质可以是ROM、RAM、磁盘、光盘等储存介质,该存储介质存储有一个或多个程序,所述程序被处理器执行时,实现实施例1的基于Q-Learning算法同容量三相逆变器并联环流抑制方法。
实施例4
本实施例提供一种计算设备,所述的计算设备可以是台式电脑、笔记本电脑、智能手机、PDA手持终端、平板电脑或其他具有显示功能的终端设备,该计算设备包括该计算设备包括处理器和存储器,存储器存储有一个或多个程序,处理器执行存储器存储的程序时,实现实施例1的基于Q-Learning算法同容量三相逆变器并联环流抑制方法。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。

Claims (10)

1.一种基于Q-Learning算法同容量三相逆变器并联环流抑制方法,其特征在于,包括下述步骤:
建立输出线路阻抗参数未知的同容量三相逆变器并联系统动态模型,完成线路阻抗和负载阻抗对逆变器并联运行环流的解耦;
基于输出线路阻抗参数未知的三相逆变器并联系统动态模型,采用下垂控制策略引入虚拟阻抗控制环,实现增益参数可调节的虚拟阻抗下垂控制方法;
采用强化学习Q-Learning算法对多台逆变器输出无功功率之间的偏差进行学习,通过调节虚拟阻抗增益系数的方法降低各条线路阻抗之间的差异,抑制环流。
2.根据权利要求1所述的基于Q-Learning算法同容量三相逆变器并联环流抑制方法,其特征在于,所述建立输出线路阻抗参数未知的同容量三相逆变器并联系统动态模型,具体步骤包括:
建立逆变器并联系统的数学模型,表示为:
Figure FDA0002983984660000011
其中,Vo,k(s)、Io,k(s)分别表示各台逆变器输出电压和电流,Zline,k表示各台逆变器与交流母线之间的连线阻抗,Ubus(s)为交流母线电压,Iload(s)为负载端总的负载电流,并且母线电压和负载端电压相等,Zload为公共负载,Iload,k(s)为流入各负载的电流,k表示并联系统中任意一台逆变器;
每台逆变器输出环流的表达式为:
Figure FDA0002983984660000012
设计每台逆变器的输出线路阻抗满足:
mkZline,k=mjZline,j k,j=1,2,...,n
优化后的每台逆变器输出环流的表达式为:
Figure FDA0002983984660000021
每台逆变器输出的环流与逆变器输出电压、各逆变器加权平均值电压以及输出线路阻抗有关,完成了逆变器并联运行时环流和负载的解耦。
3.根据权利要求1所述的基于Q-Learning算法同容量三相逆变器并联环流抑制方法,其特征在于,所述采用下垂控制策略引入虚拟阻抗控制环,具体步骤包括:
在下垂控制电路的基础之上搭建反馈回路,所述反馈回路中包括基础的阻抗常数和可调节的增益系数,所述反馈回路的输入为逆变器输出电流值,回路中的虚拟阻抗值为控制器中电感电流、初始阻抗常数以及虚拟阻抗增益系数的乘积,在下垂控制环中减掉虚拟阻抗值,最后将二者比较后的电压差值输入电压比例积分控制单元和电流比例单元,再经过坐标变换以及SPWM调制生成开关管的控制信号对三相逆变桥进行控制。
4.根据权利要求1或3所述的基于Q-Learning算法同容量三相逆变器并联环流抑制方法,其特征在于,所述采用下垂控制策略引入虚拟阻抗控制环,加入虚拟阻抗的数学模型表示为:
U'dqref(s)=Udqref(s)-Z(s)I(s)W
其中,U′dqref(s)为加入虚拟阻抗之后给到电压电流内环的参考电压,Udqref(s)为传统下垂控制下给到电压电流内环的参考电压,Z(s)为需加入的基础阻抗常数,I(s)为逆变器输出电流,W为虚拟阻抗增益系数。
5.根据权利要求1所述的基于Q-Learning算法同容量三相逆变器并联环流抑制方法,其特征在于,所述采用强化学习Q-Learning算法对多台逆变器输出无功功率之间的偏差进行学习,具体步骤包括:
将各逆变器输出的无功功率和平均无功功率的偏差作为环境状态,对并联系统中每台逆变器都引入强化学习控制器,并由此建立环境状态集合S,表示为:
S={ΔQ1 ΔQ2 ... ΔQi ... ΔQT}
ΔQ=Q-Qload/N
其中,ΔQi表示单台逆变器输出无功功率和平均无功功率的偏差等级,Q表示单台逆变器输出的无功功率,Qload表示总负载无功功率,N表示并联系统中逆变器总数,ΔQ表示任意一台逆变器输出无功功率和平均无功功率的偏差;
对每台逆变器定义动作集合A:
A={ΔW1 ΔW2 ... ΔWi ... ΔWK}
其中,ΔWi表示虚拟阻抗增益系数的不同增益值,并且将所加增益系数值分为K个等级;
在环境状态集合S和动作集合A的前提下,定义奖励函数R,表示为:
Figure FDA0002983984660000031
其中,(Si,Ai)表示逆变器并联系统中任意第j台逆变器所处状态Si时执行动作Ai后可以获得的奖励,ΔQ表示任意一台逆变器输出无功功率和平均无功功率的偏差,ΔQ1、ΔQ2、ΔQ3、ΔQ4表示对五无功功率偏差设置的偏差范围边界值,α1、α2、α3、α3表示针对不同无功功率偏差区间设计的控制参数;
根据环境状态集合S和动作集合A建立状态动作价值表,所述动作价值表每一行代表状态集合S中的一个状态,每一列代表动作集合A中的一个动作,所述动作价值表中的任意一项表示在该状态下执行该动作得到的奖励,记录学习的结果,获得最佳决策,建立强化学习Q-learning算法模型;
根据强化学习Q-learning算法模型对逆变器的控制器进行迭代训练;
控制器根据状态动作价值表自动找寻最佳虚拟阻抗增益系数,增益系数乘上虚拟阻抗常数以及输出电流构建逆变器输出线路阻抗的补偿,对线路阻抗进行补偿调整。
6.根据权利要求1所述的基于Q-Learning算法同容量三相逆变器并联环流抑制方法,其特征在于,所述强化学习Q-learning算法模型表示为:
Qk+1(Si,Ai)=Qk(Si,Ai)+α[R(Si,Ai)+γ·maxQk(Si+1,A)-Qk+1(Si,Ai)]
其中,Qk+1(Si,Ai)表示算法迭代至第k+1回合时状态动作价值表中Si行和Ai列对应的价值,Qk(Si,Ai)表示算法迭代至第k回合时状态动作价值表中Si行和Ai列对应的价值;α表示学习率,且0<α<1;γ表示折扣因子,当γ=0时只考虑立即奖励,当γ=1时,长期奖励和立即奖励地位一样;R(Si,Ai)表示在状态Si时执行动作Ai所能得到的奖励;maxQk(Si+1,A)表示状态动作价值表中第Si+1行的最大价值。
7.根据权利要求1所述的基于Q-Learning算法同容量三相逆变器并联环流抑制方法,其特征在于,所述根据强化学习Q-learning算法模型对逆变器的控制器进行迭代训练,具体步骤包括:
初始化状态动作价值表,表中的价值赋初始值都为0;
强化学习控制器不断地给出虚拟阻抗的可调增益值,并同时采集逆变器输出的无功功率和平均无功功率的偏差;
迭代训练后学习算法收敛,强化学习控制器找到最佳的虚拟阻抗增益值使得无功功率偏差降到预设水平,训练设定迭代次数后输出训练好的状态动作价值表。
8.一种基于Q-Learning算法同容量三相逆变器并联环流抑制系统,其特征在于,包括:动态模型构建模块、虚拟阻抗下垂控制模块和偏差学习模块;
所述动态模型构建模块用于建立输出线路阻抗参数未知的同容量三相逆变器并联系统动态模型,完成线路阻抗和负载阻抗对逆变器并联运行环流的解耦;
所述虚拟阻抗下垂控制模块用于基于输出线路阻抗参数未知的三相逆变器并联系统动态模型,采用下垂控制策略引入虚拟阻抗控制环,实现增益参数可调节的虚拟阻抗下垂控制方法;
所述偏差学习模块用于采用强化学习Q-Learning算法对多台逆变器输出无功功率之间的偏差进行学习,通过调节虚拟阻抗增益系数的方法降低各条线路阻抗之间的差异,抑制环流。
9.一种存储介质,存储有程序,其特征在于,所述程序被处理器执行时实现如权利要求1-7任一项所述基于Q-Learning算法同容量三相逆变器并联环流抑制方法。
10.一种计算设备,包括处理器和用于存储处理器可执行程序的存储器,其特征在于,所述处理器执行存储器存储的程序时,实现如权利要求1-7任一项所述基于Q-Learning算法同容量三相逆变器并联环流抑制方法。
CN202110294981.5A 2021-03-19 2021-03-19 基于Q-Learning算法同容量三相逆变器并联环流抑制方法 Active CN112953286B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110294981.5A CN112953286B (zh) 2021-03-19 2021-03-19 基于Q-Learning算法同容量三相逆变器并联环流抑制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110294981.5A CN112953286B (zh) 2021-03-19 2021-03-19 基于Q-Learning算法同容量三相逆变器并联环流抑制方法

Publications (2)

Publication Number Publication Date
CN112953286A true CN112953286A (zh) 2021-06-11
CN112953286B CN112953286B (zh) 2023-04-21

Family

ID=76226630

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110294981.5A Active CN112953286B (zh) 2021-03-19 2021-03-19 基于Q-Learning算法同容量三相逆变器并联环流抑制方法

Country Status (1)

Country Link
CN (1) CN112953286B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113285497A (zh) * 2021-06-15 2021-08-20 阳光电源股份有限公司 一种储能系统无功环流的消除方法、装置及储能系统
CN113300409A (zh) * 2021-06-21 2021-08-24 华北电力大学 基于母线电压相角跟踪的多换流器均流控制方法
CN113448425A (zh) * 2021-07-19 2021-09-28 哈尔滨工业大学 一种基于强化学习的动态并行应用程序能耗运行时优化方法及系统
CN115864525A (zh) * 2022-11-21 2023-03-28 深圳市鸿嘉利新能源有限公司 微网电流控制方法及微网电流控制系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105429170A (zh) * 2015-11-11 2016-03-23 中南大学 一种基于可调虚拟阻抗的微网逆变器下垂控制方法
CN106712106A (zh) * 2016-12-13 2017-05-24 重庆大学 一种可抑制并联运行逆变器环流的虚拟阻抗在线调节法
CN107181281A (zh) * 2017-06-22 2017-09-19 同济大学 一种孤岛微网并联逆变器间环流抑制方法
CN111431216A (zh) * 2020-03-18 2020-07-17 国网浙江嘉善县供电有限公司 一种采用q学习的高比例光伏微网无功均分控制方法
CN112398173A (zh) * 2020-11-27 2021-02-23 湖南工业大学 一种基于虚拟阻抗的低压微电网功率均分控制方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105429170A (zh) * 2015-11-11 2016-03-23 中南大学 一种基于可调虚拟阻抗的微网逆变器下垂控制方法
CN106712106A (zh) * 2016-12-13 2017-05-24 重庆大学 一种可抑制并联运行逆变器环流的虚拟阻抗在线调节法
CN107181281A (zh) * 2017-06-22 2017-09-19 同济大学 一种孤岛微网并联逆变器间环流抑制方法
CN111431216A (zh) * 2020-03-18 2020-07-17 国网浙江嘉善县供电有限公司 一种采用q学习的高比例光伏微网无功均分控制方法
CN112398173A (zh) * 2020-11-27 2021-02-23 湖南工业大学 一种基于虚拟阻抗的低压微电网功率均分控制方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
YUNJIAN PENG,ET AL.: "Reinforcement Q-Learning Algorithm for H∞ Tracking Control of Unknown Discrete-Time Linear Systems", 《IEEE TRANSACTIONS ON SYSTEMS, MAN, AND CYBERNETICS: SYSTEMS》, vol. 50, no. 11, 30 November 2020 (2020-11-30), pages 4109 - 4122, XP011814289, DOI: 10.1109/TSMC.2019.2957000 *
代大一: "组合式三相逆变器并联系统下垂控制技术研究", 《中国优秀硕士学位论文全文数据库(工程科技II辑)》, 15 January 2020 (2020-01-15), pages 042 - 1078 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113285497A (zh) * 2021-06-15 2021-08-20 阳光电源股份有限公司 一种储能系统无功环流的消除方法、装置及储能系统
CN113300409A (zh) * 2021-06-21 2021-08-24 华北电力大学 基于母线电压相角跟踪的多换流器均流控制方法
CN113448425A (zh) * 2021-07-19 2021-09-28 哈尔滨工业大学 一种基于强化学习的动态并行应用程序能耗运行时优化方法及系统
CN113448425B (zh) * 2021-07-19 2022-09-09 哈尔滨工业大学 一种基于强化学习的动态并行应用程序能耗运行时优化方法及系统
CN115864525A (zh) * 2022-11-21 2023-03-28 深圳市鸿嘉利新能源有限公司 微网电流控制方法及微网电流控制系统
CN115864525B (zh) * 2022-11-21 2023-10-03 深圳市鸿嘉利新能源有限公司 微网电流控制方法及微网电流控制系统

Also Published As

Publication number Publication date
CN112953286B (zh) 2023-04-21

Similar Documents

Publication Publication Date Title
CN112953286A (zh) 基于Q-Learning算法同容量三相逆变器并联环流抑制方法
Panda et al. Application of swarm optimisation‐based modified algorithm for selective harmonic elimination in reduced switch count multilevel inverter
Al-Majidi et al. A novel maximum power point tracking technique based on fuzzy logic for photovoltaic systems
Kim et al. Model predictive control method for CHB multi‐level inverter with reduced calculation complexity and fast dynamics
Roslan et al. Particle swarm optimization algorithm-based PI inverter controller for a grid-connected PV system
CN108736519B (zh) 一种光伏电站的虚拟同步发电机自适应控制方法及装置
CN113359938B (zh) 一种基于非奇异快速终端滑模控制的光伏系统最大功率点跟踪方法
Gupta et al. Power quality improvement of solar photovoltaic transformer-less grid-connected system with maximum power point tracking control
Bayhan et al. Predictive control of power electronic converters
Tchouani Njomo et al. Nonlinear neuro-adaptive control for MPPT applied to photovoltaic systems
Qin et al. An improved modulation method for modular multilevel converters based on particle swarm optimization
Kumaresan et al. Improved secant-based global flexible power point tracking in photovoltaic systems under partial shading conditions
CN111525581B (zh) 含不平衡负载微电网系统的电压控制方法
Kumar et al. Genetic algorithm based approach for optimization of conducting angles in cascaded multilevel inverter
CN110518625B (zh) 一种可变学习率bp-pid控制的并网逆变器直流分量抑制方法
CN113904578B (zh) 单相级联h桥变流器的无权重系数模型预测控制方法
Tan et al. Intelligent controlled shunt active power filter for voltage and current harmonic compensation in microgrid system
Yang et al. Improved weighted average current control of LCL grid‐connected inverter and analysis of its order reduction characteristics
CN117081110B (zh) 一种多机并联新能源虚拟惯量振荡抑制方法及相关装置
CN110320958A (zh) 基于泰勒公式的最大功率跟踪方法、系统及终端设备
Tang et al. Model predictive power control with Kalman filter for grid‐tied inverter with parameter variation
Tah et al. Shunt active filter based on radial basis function neural network and pq power theory
Dash et al. Non-linear control of parallel AC voltage source converter high-voltage DC system using a hybrid input-output linearization evolutionary fuzzy controller
Teng et al. Nonsingular fast terminal sliding mode control for two-stage converters of AC island photovoltaic microgrid
Song et al. Global Maximum Power Point Tracking for PV Conversion Systems Under Partial Shadings: NNIDA Based Approach

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant