CN110566406B - 基于强化学习的风电机组实时变桨距鲁棒控制系统及方法 - Google Patents

基于强化学习的风电机组实时变桨距鲁棒控制系统及方法 Download PDF

Info

Publication number
CN110566406B
CN110566406B CN201910982917.9A CN201910982917A CN110566406B CN 110566406 B CN110566406 B CN 110566406B CN 201910982917 A CN201910982917 A CN 201910982917A CN 110566406 B CN110566406 B CN 110566406B
Authority
CN
China
Prior art keywords
wind
network
value
action
angular speed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910982917.9A
Other languages
English (en)
Other versions
CN110566406A (zh
Inventor
陈芃
韩德志
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Maritime University
Original Assignee
Shanghai Maritime University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Maritime University filed Critical Shanghai Maritime University
Priority to CN201910982917.9A priority Critical patent/CN110566406B/zh
Publication of CN110566406A publication Critical patent/CN110566406A/zh
Priority to US17/260,323 priority patent/US20220186709A1/en
Priority to PCT/CN2020/091720 priority patent/WO2021073090A1/zh
Application granted granted Critical
Publication of CN110566406B publication Critical patent/CN110566406B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F03MACHINES OR ENGINES FOR LIQUIDS; WIND, SPRING, OR WEIGHT MOTORS; PRODUCING MECHANICAL POWER OR A REACTIVE PROPULSIVE THRUST, NOT OTHERWISE PROVIDED FOR
    • F03DWIND MOTORS
    • F03D7/00Controlling wind motors 
    • F03D7/02Controlling wind motors  the wind motors having rotation axis substantially parallel to the air flow entering the rotor
    • F03D7/022Adjusting aerodynamic properties of the blades
    • F03D7/0224Adjusting blade pitch
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F03MACHINES OR ENGINES FOR LIQUIDS; WIND, SPRING, OR WEIGHT MOTORS; PRODUCING MECHANICAL POWER OR A REACTIVE PROPULSIVE THRUST, NOT OTHERWISE PROVIDED FOR
    • F03DWIND MOTORS
    • F03D7/00Controlling wind motors 
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F03MACHINES OR ENGINES FOR LIQUIDS; WIND, SPRING, OR WEIGHT MOTORS; PRODUCING MECHANICAL POWER OR A REACTIVE PROPULSIVE THRUST, NOT OTHERWISE PROVIDED FOR
    • F03DWIND MOTORS
    • F03D7/00Controlling wind motors 
    • F03D7/02Controlling wind motors  the wind motors having rotation axis substantially parallel to the air flow entering the rotor
    • F03D7/04Automatic control; Regulation
    • F03D7/042Automatic control; Regulation by means of an electrical or electronic controller
    • F03D7/043Automatic control; Regulation by means of an electrical or electronic controller characterised by the type of control logic
    • F03D7/046Automatic control; Regulation by means of an electrical or electronic controller characterised by the type of control logic with learning or adaptive control, e.g. self-tuning, fuzzy logic or neural network
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F05INDEXING SCHEMES RELATING TO ENGINES OR PUMPS IN VARIOUS SUBCLASSES OF CLASSES F01-F04
    • F05BINDEXING SCHEME RELATING TO WIND, SPRING, WEIGHT, INERTIA OR LIKE MOTORS, TO MACHINES OR ENGINES FOR LIQUIDS COVERED BY SUBCLASSES F03B, F03D AND F03G
    • F05B2270/00Control
    • F05B2270/30Control parameters, e.g. input parameters
    • F05B2270/304Spool rotational speed
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F05INDEXING SCHEMES RELATING TO ENGINES OR PUMPS IN VARIOUS SUBCLASSES OF CLASSES F01-F04
    • F05BINDEXING SCHEME RELATING TO WIND, SPRING, WEIGHT, INERTIA OR LIKE MOTORS, TO MACHINES OR ENGINES FOR LIQUIDS COVERED BY SUBCLASSES F03B, F03D AND F03G
    • F05B2270/00Control
    • F05B2270/30Control parameters, e.g. input parameters
    • F05B2270/32Wind speeds
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F05INDEXING SCHEMES RELATING TO ENGINES OR PUMPS IN VARIOUS SUBCLASSES OF CLASSES F01-F04
    • F05BINDEXING SCHEME RELATING TO WIND, SPRING, WEIGHT, INERTIA OR LIKE MOTORS, TO MACHINES OR ENGINES FOR LIQUIDS COVERED BY SUBCLASSES F03B, F03D AND F03G
    • F05B2270/00Control
    • F05B2270/30Control parameters, e.g. input parameters
    • F05B2270/327Rotor or generator speeds
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F05INDEXING SCHEMES RELATING TO ENGINES OR PUMPS IN VARIOUS SUBCLASSES OF CLASSES F01-F04
    • F05BINDEXING SCHEME RELATING TO WIND, SPRING, WEIGHT, INERTIA OR LIKE MOTORS, TO MACHINES OR ENGINES FOR LIQUIDS COVERED BY SUBCLASSES F03B, F03D AND F03G
    • F05B2270/00Control
    • F05B2270/30Control parameters, e.g. input parameters
    • F05B2270/328Blade pitch angle
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F05INDEXING SCHEMES RELATING TO ENGINES OR PUMPS IN VARIOUS SUBCLASSES OF CLASSES F01-F04
    • F05BINDEXING SCHEME RELATING TO WIND, SPRING, WEIGHT, INERTIA OR LIKE MOTORS, TO MACHINES OR ENGINES FOR LIQUIDS COVERED BY SUBCLASSES F03B, F03D AND F03G
    • F05B2270/00Control
    • F05B2270/30Control parameters, e.g. input parameters
    • F05B2270/335Output power or torque
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F05INDEXING SCHEMES RELATING TO ENGINES OR PUMPS IN VARIOUS SUBCLASSES OF CLASSES F01-F04
    • F05BINDEXING SCHEME RELATING TO WIND, SPRING, WEIGHT, INERTIA OR LIKE MOTORS, TO MACHINES OR ENGINES FOR LIQUIDS COVERED BY SUBCLASSES F03B, F03D AND F03G
    • F05B2270/00Control
    • F05B2270/40Type of control system
    • F05B2270/404Type of control system active, predictive, or anticipative
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F05INDEXING SCHEMES RELATING TO ENGINES OR PUMPS IN VARIOUS SUBCLASSES OF CLASSES F01-F04
    • F05BINDEXING SCHEME RELATING TO WIND, SPRING, WEIGHT, INERTIA OR LIKE MOTORS, TO MACHINES OR ENGINES FOR LIQUIDS COVERED BY SUBCLASSES F03B, F03D AND F03G
    • F05B2270/00Control
    • F05B2270/70Type of control algorithm
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F05INDEXING SCHEMES RELATING TO ENGINES OR PUMPS IN VARIOUS SUBCLASSES OF CLASSES F01-F04
    • F05BINDEXING SCHEME RELATING TO WIND, SPRING, WEIGHT, INERTIA OR LIKE MOTORS, TO MACHINES OR ENGINES FOR LIQUIDS COVERED BY SUBCLASSES F03B, F03D AND F03G
    • F05B2270/00Control
    • F05B2270/70Type of control algorithm
    • F05B2270/709Type of control algorithm with neural networks
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02EREDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
    • Y02E10/00Energy generation through renewable energy sources
    • Y02E10/70Wind energy
    • Y02E10/72Wind turbines with rotation axis in wind direction

Landscapes

  • Engineering & Computer Science (AREA)
  • Mechanical Engineering (AREA)
  • Combustion & Propulsion (AREA)
  • General Engineering & Computer Science (AREA)
  • Sustainable Development (AREA)
  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Sustainable Energy (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Fuzzy Systems (AREA)
  • Evolutionary Computation (AREA)
  • Fluid Mechanics (AREA)
  • Wind Motors (AREA)

Abstract

本发明提供一种基于强化学习的风电机组实时变桨距鲁棒控制系统及方法。所述系统包含:风速采集系统,采集风场风速值;风机信息采集模块,采集风轮角速度;强化信号生成模块,根据采集的风轮角速度和额定风轮角速度生成强化信号;变桨距鲁棒控制模块,包含动作网络和评价网络,动作网络根据风场风速值、风轮角速度生成动作值输出至评价网络,评价网络根据强化信号和所述动作值进行学习训练,生成累计回报值输出至动作网络,动作网络根据累计回报值进行学习训练更新动作值并输出;控制信号生成模块,连接动作网络,生成接收的动作值生成对应的控制信号;风力发电机根据所述控制信号调整桨距角,实现调整风轮角速度,保证风机输出功率平稳。

Description

基于强化学习的风电机组实时变桨距鲁棒控制系统及方法
技术领域
本发明涉及风力发电技术领域,特别是一种基于强化学习的风电机组实时变桨距鲁棒控制系统及方法。
背景技术
目前,新能源技术得到了国际社会的高度重视,加快发展可再生能源成为全球各国的解决环境和能源问题的必经之路,同时也是未来经济和技术发展的重中之重。风能作为一种可再生能源,具有免费、清洁、无污染的特点。风力发电与大部分可再生能源发电技术相比有着很大竞争优势。在中国很多地区,风能资源十分丰富。发展风力发电,可以为国民经济发展提供重要保障。
风电场所处地区的自然环境及风电机组控制变量的随机性决定了风电系统是一个非线性系统,为了保证风电机组的安全稳定运行,必须使风电机组在不同风况中始终保持输出功率稳定。一般需要了解风电场的自然环境和风电机组工作特性,这就需要设计智能实时控制系统,根据不同的情况采取对应的工作方式,使风能的利用率达到最理想的状态,既保证风电机组输出电能的稳定,也需要保障风电机组在复杂自然环境的安全工作。为了减弱风速模型中的不确定因素对风电机组的影响,许多研究者设计了反馈控制器来解决该影响。但是,其中大部分对动态学要求较高,
现有技术中基于最优控制的反馈控制器通常是离线设计的,其需要通过求解哈密顿-雅可比-贝尔曼(Hamilton-Jacobi-Bellman,HJB)方程或贝尔曼方程,并利用系统动力学的完整知识,达到系统性能指标的最大值(或最小值)。利用HJB方程或贝尔曼方程的离线解来确定非线性系统的最优控制策略,这往往是难以或不可能求解的。
目前,风力机变桨距控制方案的研究方法很多。其中,提出了采用模糊自适应PID控制来调节液压驱动变螺距系统。但是在应用过程中需要根据实际情况对算法参数进行重置,并没有很好的泛化。另外有人提出了一种基于MBC坐标变换的比例积分共振(PI-R)俯仰控制方法。它可以抑制不平衡负载的低频和高频分量,但这些分量很容易受到其他随机频率分量的干扰。
发明内容
本发明的目的在于本发明的目的在于提供一种基于强化学习的风电机组实时变桨距鲁棒控制系统及方法。为了克服多风况下对风机输出电能控制的困难,本发明将包含动作网络和评价网络的强化学习模块应用于对风机桨距角的控制,根据实时采集的风速和风轮角速度,控制风机桨距角。本发明通过反馈给强化学习模块一个强化信号,使该强化学习模块得知下一步的控制中继续采取或避免采取与上一步相同的控制措施。通过本发明使风电机组的风轮角速度保持在指定范围内,间接控制风能利用率变化平稳。
为了达到上述目的,本发明提供一种基于强化学习的风电机组实时变桨距鲁棒控制系统,包含:
风速采集系统,根据采集风场的风速数据生成实时风速值;
风机信息采集模块,连接风力发电机,用于采集风力发电机的风轮角速度;
强化信号生成模块,信号连接所述风机信息采集模块,根据采集的风轮角速度和额定风轮角速度实时生成强化信号;
变桨距鲁棒控制模块,其为强化学习模块,包括动作网络和评价网络;所述动作网络信号连接所述风速采集系统、风机信息采集模块,用于根据接收的所述实时风速值、风轮角速度生成动作值并输出至所述评价网络;评价网络还信号连接所述风速采集系统、风机信息采集模块、强化信号生成模块,用于根据接收的所述实时风速值、风轮角速度、动作值生成累计回报值,并根据接收的所述强化信号进行学习训练,迭代更新所述累计回报值和评价网络;动作网络根据更新后的累计回报值进行学习训练,迭代更新动作网络和所述动作值;
控制信号生成模块,信号连接设置在所述强化学习模块、风力发电机之间,根据设定的映射函数,生成与动作网络迭代更新的动作值对应的控制信号;风力发电机根据所述控制信号调整桨距角,实现调整风轮角速度。
所述动作网络、评价网络均为BP神经网络,动作网络、评价网络均采用反向传播算法进行学习训练。
一种基于强化学习的风电机组实时变桨距鲁棒控制方法,采用本发明所述的基于强化学习的风电机组实时变桨距鲁棒控制系统实现的,包含步骤:
S1、风速采集系统采集风场的风速数据,根据所述风速数据生成风场的实时风速值v(t);风机信息采集模块采集风力发电机的风轮角速度ω(t);其中,t表示采样时间;
S2、强化信号生成模块比较风轮角速度ω(t)与额定风轮角速度,生成强化信号r(t);通过所述强化信号r(t)指示风轮角速度ω(t)和额定风轮角速度的差值是否在预设误差范围内;
S3、动作网络以风速采集系统得到的风速值v(t)、v(t-1)和风轮角速度ω(t)作为输入,经过动作网络计算得出t时刻的动作值u(t);
S4、将风速值v(t)、v(t-1)、风轮角速度ω(t)和动作值u(t)作为评价网络的输入,经过评价网络计算的得到累计回报值J(t);
S5、评价网络结合强化信号r(t)进行学习训练,通过迭代更新评价网络的网络权值和所述累计回报值J(t);
S6、动作网络利用步骤S5得到的更新的累计回报值J(t)进行学习训练,通过迭代更新动作网络的网络权值、所述动作值u(t);
S7、动作网络根据所述强化信号r(t),判断风轮角速度ω(t)和额定风轮角速度的差值在预设误差范围内时,动作网络输出u(t),进入S8;否则,动作网络不输出u(t),进入S1;
S8、控制信号生成模块根据预设的映射函数规则,生成与步骤S6得到的动作值u(t)对应的桨距角度值β,并生成与该桨距角度值β对应的控制信号;风力发电机根据所述控制信号改变风力发电机的桨距角,实现调整风轮角速度ω(t);将t更新为t+1重复步骤S1~S8。
步骤S1所述风速采集系统采集风场的风速数据,根据所述风速数据生成风场的实时风速值v(t),具体包含:
S11、风速采集系统根据已采集的风速值v(1)~v(t-1)生成平均风速值
Figure GDA0002535299750000031
t表示采样时间;
S12、根据自回归滑动平均方法计算生成t采样时间的湍流速度v′(t),
Figure GDA0002535299750000041
其中,a(t)为高斯分布的白噪声序列,n为自回归阶数,m为滑动平均阶数;αi为自回归系数,βj为滑动平均系数;
S13、生成t采样时间的风速值
Figure GDA0002535299750000042
步骤S2中强化信号r(t)的生成方法具体是指,若风轮角速度ω(t)和额定风轮角速度的差值在预设误差范围内,则取r(t)的值为0;否则,取r(t)的值为-1。
步骤S5具体包含:
S51、设定评价网络的预测误差ec(k)为:ec(k)=αJ(k)-[J(k-1)-r(k)],α为折扣因子;设定评价网络的待最小化的目标函数Ec(k)为:
Figure GDA0002535299750000043
Figure GDA0002535299750000044
k表示迭代次数;J(k)为第k次迭代后,将步骤S4中所述风速值v(t)、风轮角速度ω(t)和动作值u(t)作为评价网络的输入,由评价网络输出的结果;r(k)等于步骤S2所述的r(t),其不随迭代次数改变;
S52、设定评价网络权值更新规则为:wc(k+1)=wc(k)+Δwc(k),根据所述评价网络权值更新规则迭代更新评价网络权值;
wc(k)是评价网络权值在第k次迭代的结果,Δwc(k)是第k次迭代时评价网络权值的改变值,
Figure GDA0002535299750000045
lc(k)是评价网络学习步长;
S53、当迭代次数k达到设定的评价网络更新上限值,或者评价网络的预测误差ec(k)小于设定的第一误差阈值,停止迭代;评价网络将J(k)输出至动作网络。
步骤S6具体包含:
S61、设定动作网络的预测误差为:ea(k)=J(k)-Uc(k),其中Uc(k)为动作网络的最终期望值,其取值为0;设定动作网络的目标函数为:
Figure GDA0002535299750000046
Figure GDA0002535299750000051
k表示迭代次数;J(k)等于步骤S53中评价网络的输出值,其不随迭代次数改变;
S62、设定动作网络权值更新规则为:wa(k+1)=wa(k)+Δwa(k),根据所述动作网络权值更新规则迭代更新动作网络权值;
其中,wa(k)是动作网络权值在第k次迭代的结果,wa(k+1)是动作网络权值在第k+1次迭代的结果,Δwa(k)是第k次迭代时动作网络权值的改变值,
Figure GDA0002535299750000052
la(k)是动作网络学习步长;u(k)为第k次迭代时输出的动作值;
S63、当迭代次数k达到设定的动作网络更新上限值,或者动作网络的预测误差ea(k)小于设定的第二误差阈值,停止迭代;将步骤S3中的风速值v(t)、v(t-1)和风轮角速度ω(t)作为动作网络的输入,通过动作网络得到更新的t时刻的动作值u(t)。
步骤S8所述映射函数规则,具体是指:
若u(t)大于等于0,取桨距角度值β为预设的一个正数;若u(t)小于0,取桨距角度值β为预设的一个负数。
与现有技术相比,本发明具有以下优点:
1)发明的基于强化学习的风电机组实时变桨距鲁棒控制系统及方法包含强化学习模块,其包含动作网络和评价网络。所述动作网络和评价网络根据实时采集的风速和风轮角速度,通过学习训练的方法,实时生成一个控制信号调整风机桨距角。本发明还通过反馈给强化学习模块一个强化信号,使该强化学习模块得知下一步的控制中继续采取或避免采取与上一步相同的控制措施。本发明能够实时控制风轮角速度在额定角速度下的稳定性,并能较好地调节桨距角的变化,使之变化平缓。与现有技术中的变桨距控制方法相比,本发明对风电机组设备损害较低,有利于延长设备使用寿命。
2)现有技术中的最优控制通常通过解决哈密顿-雅可比-贝尔曼方程进行离线设计,达到使给定的系统性能指标达到极大值(或极小值),需要完全的系统动力学知识。然而通过HJB方程的离线解来决定非线性系统最优控制策略总是会遇到求解困难或者是不可能求解的情况。本发明仅需通过实时检测的风轮角速度和风速,利用强化学习模块自主的学习训练即可保证风机输出功率稳定。本发明具有计算迅速、控制精确、反应灵敏等优点,对动态学要求较低。本发明适用范围广,效果稳定可靠。
附图说明
为了更清楚地说明本发明技术方案,下面将对描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一个实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图:
图1为本发明的基于强化学习的风电机组实时变桨距鲁棒控制系统结构示意图;
图2为本发明的基于强化学习的风电机组实时变桨距鲁棒控制方法流程示意图;
图3为本发明的动作网络示意图;
图4为本发明的评价网络示意图;
图中:1、风速采集系统;2、强化信号生成模块;3、变桨距鲁棒控制模块;31、动作网络;32、评价网络;4、控制信号生成模块;5、风机信息采集模块。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明提供一种基于强化学习的风电机组实时变桨距鲁棒控制系统,如图1所示,包含:
风速采集系统1,根据采集风场的风速数据生成实时风速值;
风机信息采集模块5,连接风力发电机,用于采集风力发电机的风轮角速度;
强化信号生成模块2,信号连接所述风机信息采集模块5,根据采集的风轮角速度和额定风轮角速度实时生成强化信号;
变桨距鲁棒控制模块3,其为强化学习模块,包括动作网络31和评价网络32;所述动作网络31信号连接所述风速采集系统1、风机信息采集模块5,用于根据接收的所述实时风速值、风轮角速度生成动作值并输出至所述评价网络32;评价网络32还信号连接所述风速采集系统1、风机信息采集模块5、强化信号生成模块2,用于根据接收的所述实时风速值、风轮角速度、动作值生成累计回报值,并根据接收的所述强化信号进行学习训练,迭代更新所述累计回报值和评价网络32;动作网络31根据更新后的累计回报值进行学习训练,迭代更新动作网络31和所述动作值;
控制信号生成模块4,信号连接设置在所述强化学习模块、风力发电机之间,根据设定的映射函数,生成与动作网络31迭代更新的动作值对应的控制信号;风力发电机根据所述控制信号调整桨距角,实现调整风轮角速度。
所述动作网络31、评价网络32均为BP神经网络,动作网络31、评价网络32均采用反向传播算法进行学习训练。
已知风电机组是一种对风能进行利用的设备,反映其工作状态的主要因素是根据风速变化而发生改变的功率参数。在风电机组能量传动模型中,存在风能利用系数Cp,Cp可近似表示为
Figure GDA0002535299750000071
Figure GDA0002535299750000072
其中β为桨距角,λ为叶尖速比。叶尖速比是风轮叶片尖端线速度与风速之比,是用来表述风电机组特性的一个重要参数,其表达式为
Figure GDA0002535299750000073
ω为风轮转动的角速度,R为风轮半径,v为风速。可以看出通过改变桨距角可以改变风能利用率,因此,设定根据动作网络31的输出值改变桨距角。
已知风电机组的动态方程为
Figure GDA0002535299750000074
J为风轮的转动惯量,ρ为空气密度,A为风轮扫及面积,Te为发动机的反力矩,CT可由表达式
Figure GDA0002535299750000075
得到。从所述动态方程可以看出风能利用率与风轮角速度,风速相关,因此将风轮角速度,风速作为动作网络31和评价网络32的输入。
一种基于强化学习的风电机组实时变桨距鲁棒控制方法,采用本发明所述的基于强化学习的风电机组实时变桨距鲁棒控制系统实现的,如图2所示,包含步骤:
S1、风速采集系统1采集风场的风速数据,根据所述风速数据生成风场的实时风速值v(t);风机信息采集模块5采集风力发电机的风轮角速度ω(t);其中,t表示采样时间;
步骤S1所述风速采集系统1采集风场的风速数据,根据所述风速数据生成风场的实时风速值v(t),具体包含:
S11、风速采集系统1根据已采集的风速值v(1)~v(t-1)生成平均风速值
Figure GDA0002535299750000081
t表示采样时间;
S12、根据自回归滑动平均方法计算生成t采样时间的湍流速度v′(t),
Figure GDA0002535299750000082
其中,a(t)为高斯分布的白噪声序列,n为自回归阶数,m为滑动平均阶数;αi为自回归系数,βj为滑动平均系数;
S13、生成t采样时间的风速值
Figure GDA0002535299750000083
S2、强化信号生成模块2比较风轮角速度ω(t)与额定风轮角速度,生成强化信号r(t);若风轮角速度ω(t)和额定风轮角速度的差值在预设误差范围内,则取r(t)的值为0,表示t时对风机的控制不是消极的,在之后相似状态下可以采取类似的控制;否则,取r(t)的值为-1,其表示t时对风机的控制是消极的,在之后相似状态下避免采取类似的控制;
S3、动作网络31以风速采集系统1得到的风速值v(t)、v(t-1)和风轮角速度ω(t)作为输入,经过动作网络31计算得出t时刻的动作值u(t);
如图3所示,在本发明的实施例中,动作网络31为三层的BP神经网络,包含输入层、输出层和一个隐藏层。u(t)是由以下公式计算得出:
Figure GDA0002535299750000084
Figure GDA0002535299750000085
Figure GDA0002535299750000086
其中
Figure GDA0002535299750000087
是t采样时刻动作网络31第j个输入层节点到第i个隐藏层节点的权值,
Figure GDA0002535299750000091
是t采样时刻动作网络31第i个隐藏层节点到输出节点的权值;xj是输入层第j个节点的输入,mi是动作网络31隐藏层第i个节点的输入;ni是动作网络31隐藏层第i个节点的输出;v是动作网络31输出层的输入;u是动作网络31输出层的输出,根据u控制风力发电机的桨距角。
S4、将风速值v(t)、v(t-1)、风轮角速度ω(t)和动作值u(t)作为评价网络32的输入,经过评价网络32计算的得到累计回报值J(t);如图4所示,在本发明的实施例中,评价网络32为三层的BP神经网络,包含输入层、输出层和一个隐藏层。J(t)是由以下公式计算得出:
Figure GDA0002535299750000092
其中
Figure GDA0002535299750000093
是t采样时刻评价网络第i个输入层节点到第j个隐藏层节点的权值,
Figure GDA0002535299750000094
是t采样时刻评价网络第i个隐藏层节点到输出层节点的权值;qi(t)是评价网络第i个隐藏层节点输入;pi(t)是评价网络第i个隐藏层节点的输出;Nh是评价网络隐藏层节点总数;n+1是评价网络输入的总数包括动作网络31的输出u(t),在本发明的实施例中,n为3。
S5、评价网络32结合强化信号r(t)进行学习训练,通过迭代更新评价网络32的网络权值和所述累计回报值J(t);
步骤S5具体包含:
S51、设定评价网络32的预测误差ec(k)为:ec(k)=αJ(k)-[J(k-1)-r(k)],α为折扣因子;设定评价网络32的待最小化的目标函数Ec(k)为:
Figure GDA0002535299750000095
k表示迭代次数;J(k)为第k次迭代后,将步骤S4中所述风速值v(t)、风轮角速度ω(t)和动作值u(t)作为评价网络32的输入,由评价网络输出的结果;r(k)等于步骤S2所述的r(t),其不随迭代次数改变;
S52、设定评价网络权值更新规则为:wc(k+1)=wc(k)+Δwc(k),根据所述评价网络权值更新规则迭代更新评价网络权值;
wc(k)是评价网络权值在第k次迭代的结果,Δwc(k)是第k次迭代时评价网络权值的改变值
Figure GDA0002535299750000101
lc(k)是评价网络学习步长;评价网络32的初始权值是随机的;
如图4所示,
Figure GDA0002535299750000102
为评价网络隐藏层到输出层的权值,更新公式为:
Figure GDA0002535299750000103
同理,
Figure GDA0002535299750000104
为评价网络输入层到隐藏层的权值,更新公式为:
Figure GDA0002535299750000105
Figure GDA0002535299750000106
所述评价网络权值更新规则是根据链式法则和反向传播算法得来的。链式法则是微积分中的求导法则,定理如下:若函数u=φ(x)及v=ψ(x)都在点x可导,函数z=f(u,v)在对应点(u,v)具有连续偏导数,则符合函数z=f[φ(x),ψ(x)]在对应点x可导,且其导数可用下列公式计算:
Figure GDA0002535299750000107
反向传播算法是适合于多层神经元网络的一种学习算法,它主要由两个环节(激励传播、权重更新)反复循环迭代,逐层求出目标函数对各神经元权值的偏导数,构成目标函数对权值向量的梯量,作为修改权值的依据,直到网络的对输入的响应达到预定的目标范围为止。
S53、当迭代次数k达到设定的评价网络更新上限值,或者评价网络32的预测误差ec(k)小于设定的第一误差阈值,停止迭代;评价网络32将J(k)输出至动作网络31。
S6、动作网络31利用步骤S5得到的更新的累计回报值J(t)进行学习训练,通过迭代更新动作网络31的网络权值、所述动作值u(t);
步骤S6具体包含:
S61、设定动作网络31的预测误差为:ea(k)=J(k)-Uc(k),其中Uc(k)为动作网络31的最终期望值,其取值为0;设定动作网络31的目标函数为:
Figure GDA0002535299750000111
k表示迭代次数;J(k)等于步骤S53中评价网络32的输出值,其不随迭代次数改变;
S62、设定动作网络权值更新规则为:wa(k+1)=wa(k)+Δwa(k),根据所述动作网络权值更新规则迭代更新动作网络权值;
其中,wa(k)是动作网络权值在第k次迭代的结果,wa(k+1)是动作网络权值在第k+1次迭代的结果,Δwa(k)是第k次迭代时动作网络权值的改变值,
Figure GDA0002535299750000112
动作网络的初始权值是随机的;
la(k)是动作网络学习步长;u(k)是第k次迭代时输出的动作值;
S63、当迭代次数k达到设定的动作网络更新上限值,或者动作网络的预测误差ea(k)小于设定的第二误差阈值,停止迭代;将步骤S3中的风速v(t)、v(t-1)和风轮角速度ω(t)作为动作网络31的输入,通过动作网络得到更新的t时刻的动作值u(t)。
S7、动作网络根据所述强化信号r(t),判断风轮角速度ω(t)和额定风轮角速度的差值在预设误差范围内时,动作网络输出u(t),进入S8;否则,动作网络不输出u(t),进入S1;
在本发明中,不管前一次控制成功与否,本次动作网络和评价网络的学习训练都是要进行的,使得动作网络和评价网络对输入的数据形成记忆。在评价网络和动作网络各自的学习训练结束后,再判断是否将本次学习的结果输出。
S8、控制信号生成模块4根据预设的映射函数规则,生成与步骤S6得到的动作值u(t)对应的桨距角度值β,并生成与该桨距角度值β对应的控制信号;若u(t)大于等于0,取桨距角度值β为预设的一个正数;若u(t)小于0,取桨距角度值β为预设的一个负数。根据风电机组传动模型可知,β为正值可以使风轮角速度变小,β为负值可以使风轮角速度变大。风力发电机根据所述控制信号改变风力发电机的桨距角,实现调整风轮角速度ω(t);将t更新为t+1重复步骤S1~S8。
本发明的基于强化学习的风电机组实时变桨距鲁棒控制方法中,动作网络31产生一个动作值后,评价网络32评价该动作值,结合强化信号更新评价网络32的权值,得出累计回报值。利用得到的累计回报值返回去影响动作网络31的权值更新,以便得到一个当前最优的动作网络输出值,既更新后的动作值。通过该动作值实现对风机桨距角的控制。
与现有技术相比,本发明具有以下优点:
1)发明的基于强化学习的风电机组实时变桨距鲁棒控制系统及方法包含强化学习模块,其包含动作网络31和评价网络32。所述动作网络31和评价网络32根据实时采集的风速和风轮角速度,通过学习训练的方法,实时生成一个控制信号调整风机桨距角。本发明还通过反馈给强化学习模块一个强化信号,使该强化学习模块得知下一步的控制中继续采取或避免采取与上一步相同的控制措施。本发明能够实时控制风轮角速度在额定角速度下的稳定性,并能较好地调节桨距角的变化,使之变化平缓。与现有技术中的变桨距控制方法相比,本发明对风电机组设备损害较低,有利于延长设备使用寿命。
2)现有技术中的最优控制通常通过解决哈密顿-雅可比-贝尔曼方程进行离线设计,达到使给定的系统性能指标达到极大值(或极小值),需要完全的系统动力学知识。然而通过HJB方程的离线解来决定非线性系统最优控制策略总是会遇到求解困难或者是不可能求解的情况。本发明仅需通过实时检测的风轮角速度和风速,利用强化学习模块自主的学习训练即可保证风机输出功率稳定。本发明具有计算迅速、控制精确、反应灵敏等优点,对动态学要求较低。本发明适用范围广,效果稳定可靠。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (8)

1.一种基于强化学习的风电机组实时变桨距鲁棒控制系统,其特征在于,包含:
风速采集系统,根据采集风场的风速数据生成实时风速值;
风机信息采集模块,连接风力发电机,用于采集风力发电机的风轮角速度;
强化信号生成模块,信号连接所述风机信息采集模块,根据采集的风轮角速度和额定风轮角速度实时生成强化信号;
变桨距鲁棒控制模块,其为强化学习模块,包括动作网络和评价网络;所述动作网络信号连接所述风速采集系统、风机信息采集模块,用于根据接收的所述实时风速值、风轮角速度生成动作值并输出至所述评价网络;评价网络还信号连接所述风速采集系统、风机信息采集模块、强化信号生成模块,用于根据接收的所述实时风速值、风轮角速度、动作值生成累计回报值,并根据接收的所述强化信号进行学习训练,迭代更新所述累计回报值和评价网络;动作网络根据更新后的累计回报值进行学习训练,迭代更新动作网络和所述动作值;
控制信号生成模块,信号连接设置在所述强化学习模块、风力发电机之间,根据设定的映射函数,生成与动作网络迭代更新的动作值对应的控制信号;风力发电机根据所述控制信号调整桨距角,实现调整风轮角速度。
2.如权利要求1所述的基于强化学习的风电机组实时变桨距鲁棒控制系统,其特征在于,所述动作网络、评价网络均为BP神经网络,动作网络、评价网络均采用反向传播算法进行学习训练。
3.一种基于强化学习的风电机组实时变桨距鲁棒控制方法,采用如权利要求1至2任一所述的基于强化学习的风电机组实时变桨距鲁棒控制系统实现的,其特征在于,包含步骤:
S1、风速采集系统采集风场的风速数据,根据所述风速数据生成风场的实时风速值v(t);风机信息采集模块采集风力发电机的风轮角速度ω(t);其中,t表示采样时间;
S2、强化信号生成模块比较风轮角速度ω(t)与额定风轮角速度,根据比较结果生成强化信号r(t);通过所述强化信号r(t)指示风轮角速度ω(t)和额定风轮角速度的差值是否在预设误差范围内;
S3、动作网络以风速采集系统得到的风速值v(t)、v(t-1)和风轮角速度ω(t)作为输入,经过动作网络计算得出t时刻的动作值u(t);
S4、将风速值v(t)、v(t-1)、风轮角速度ω(t)和动作值u(t)作为评价网络的输入,经过评价网络计算的得到累计回报值J(t);
S5、评价网络结合强化信号r(t)进行学习训练,通过迭代更新评价网络的网络权值和所述累计回报值J(t);
S6、动作网络利用步骤S5得到的更新的累计回报值J(t)进行学习训练,通过迭代更新动作网络的网络权值、所述动作值u(t);
S7、动作网络根据所述强化信号r(t),判断风轮角速度ω(t)和额定风轮角速度的差值在预设误差范围内时,动作网络输出u(t),进入S8;否则,动作网络不输出u(t),进入S1;
S8、控制信号生成模块根据预设的映射函数规则,生成与步骤S6得到的动作值u(t)对应的桨距角度值β,并生成与该桨距角度值β对应的控制信号;风力发电机根据所述控制信号改变风力发电机的桨距角,实现调整风轮角速度ω(t);将t更新为t+1重复步骤S1~S8。
4.如权利要求3所述的基于强化学习的风电机组实时变桨距鲁棒控制方法,其特征在于,步骤S1所述风速采集系统采集风场的风速数据,根据所述风速数据生成风场的实时风速值v(t),具体包含:
S11、风速采集系统根据已采集的风速值v(1)~v(t-1)生成平均风速值
Figure FDA0002535299740000021
t表示采样时间;
S12、根据自回归滑动平均方法计算生成t采样时间的湍流速度v′(t),
Figure FDA0002535299740000022
其中,a(t)为高斯分布的白噪声序列,n为自回归阶数,m为滑动平均阶数;αi为自回归系数,βj为滑动平均系数;
S13、生成t采样时间的风速值
Figure FDA0002535299740000023
5.如权利要求3所述的基于强化学习的风电机组实时变桨距鲁棒控制方法,其特征在于,步骤S2中强化信号r(t)的生成方法具体是指,若风轮角速度ω(t)和额定风轮角速度的差值在预设误差范围内,则取r(t)的值为0;否则,取r(t)的值为-1。
6.如权利要求3所述的基于强化学习的风电机组实时变桨距鲁棒控制方法,其特征在于,步骤S5具体包含:
S51、设定评价网络的预测误差ec(k)为:ec(k)=αJ(k)-[J(k-1)-r(k)],α为折扣因子;设定评价网络的待最小化的目标函数Ec(k)为:
Figure FDA0002535299740000031
Figure FDA0002535299740000032
k表示迭代次数;J(k)为第k次迭代后,将步骤S4中所述风速值v(t)、风轮角速度ω(t)和动作值u(t)作为评价网络的输入,由评价网络输出的结果;r(k)等于步骤S2所述的r(t),其不随迭代次数改变;
S52、设定评价网络权值更新规则为:wc(k+1)=wc(k)+Δwc(k),根据所述评价网络权值更新规则迭代更新评价网络权值;
wc(k)是评价网络权值在第k次迭代的结果,Δwc(k)是第k次迭代时评价网络权值的改变值,
Figure FDA0002535299740000033
lc(k)是评价网络学习步长;
S53、当迭代次数k达到设定的评价网络更新上限值,或者评价网络的预测误差ec(k)小于设定的第一误差阈值,停止迭代;评价网络将J(k)输出至动作网络。
7.如权利要求3所述的基于强化学习的风电机组实时变桨距鲁棒控制方法,其特征在于,步骤S6具体包含:
S61、设定动作网络的预测误差为:ea(k)=J(k)-Uc(k),其中Uc(k)为动作网络的最终期望值,其取值为0;设定动作网络的目标函数为:
Figure FDA0002535299740000034
Figure FDA0002535299740000035
k表示迭代次数;J(k)等于步骤S53中评价网络的输出值,其不随迭代次数改变;
S62、设定动作网络权值更新规则为:wa(k+1)=wa(k)+Δwa(k),根据所述动作网络权值更新规则迭代更新动作网络权值;
其中,wa(k)是动作网络权值在第k次迭代的结果,wa(k+1)是动作网络权值在第k+1次迭代的结果,Δwa(k)是第k次迭代时动作网络权值的改变值,
Figure FDA0002535299740000041
la(k)是动作网络学习步长;u(k)为第k次迭代时输出的动作值;
S63、当迭代次数k达到设定的动作网络更新上限值,或者动作网络的预测误差ea(k)小于设定的第二误差阈值,停止迭代;将步骤S3中的风速值v(t)、v(t-1)和风轮角速度ω(t)作为动作网络的输入,通过动作网络得到更新的t时刻的动作值u(t)。
8.如权利要求3所述的基于强化学习的风电机组实时变桨距鲁棒控制方法,其特征在于,步骤S8所述映射函数规则,具体是指:
若u(t)大于等于0,取桨距角度值β为预设的一个正数;若u(t)小于0,取桨距角度值β为预设的一个负数。
CN201910982917.9A 2019-10-16 2019-10-16 基于强化学习的风电机组实时变桨距鲁棒控制系统及方法 Active CN110566406B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201910982917.9A CN110566406B (zh) 2019-10-16 2019-10-16 基于强化学习的风电机组实时变桨距鲁棒控制系统及方法
US17/260,323 US20220186709A1 (en) 2019-10-16 2020-05-22 Reinforcement learning-based real time robust variable pitch control of wind turbine systems
PCT/CN2020/091720 WO2021073090A1 (zh) 2019-10-16 2020-05-22 基于强化学习的风电机组实时变桨距鲁棒控制系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910982917.9A CN110566406B (zh) 2019-10-16 2019-10-16 基于强化学习的风电机组实时变桨距鲁棒控制系统及方法

Publications (2)

Publication Number Publication Date
CN110566406A CN110566406A (zh) 2019-12-13
CN110566406B true CN110566406B (zh) 2020-08-04

Family

ID=68785114

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910982917.9A Active CN110566406B (zh) 2019-10-16 2019-10-16 基于强化学习的风电机组实时变桨距鲁棒控制系统及方法

Country Status (3)

Country Link
US (1) US20220186709A1 (zh)
CN (1) CN110566406B (zh)
WO (1) WO2021073090A1 (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110566406B (zh) * 2019-10-16 2020-08-04 上海海事大学 基于强化学习的风电机组实时变桨距鲁棒控制系统及方法
CN111245008B (zh) * 2020-01-14 2021-07-16 香港中文大学(深圳) 一种风场协同控制方法及装置
CN111608868B (zh) * 2020-05-27 2021-03-26 上海海事大学 风力发电系统最大功率跟踪自适应鲁棒控制系统及方法
CN113883008B (zh) * 2021-11-23 2023-06-16 南瑞集团有限公司 一种可抑制多扰动因素的风机模糊自适应变桨距控制方法
CN114889644B (zh) * 2022-05-07 2024-04-16 华南理工大学 复杂场景下的无人驾驶汽车决策系统及决策方法
CN115407648B (zh) * 2022-11-01 2023-02-03 北京百脉朝宗科技有限公司 无人机桨距角的调整方法、装置、设备及可读存储介质
FR3142782A1 (fr) 2022-12-05 2024-06-07 IFP Energies Nouvelles Procédé de contrôle d’une ferme d’éoliennes au moyen d’une méthode d’apprentissage par renforcement
CN116757101B (zh) * 2023-08-21 2023-11-07 湖南科技大学 一种基于机理模型和神经网络的机舱风速修正方法和系统

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9347430B2 (en) * 2013-04-12 2016-05-24 King Fahd University Of Petroleum And Minerals Adaptive pitch control system for wind generators
CN104595106B (zh) * 2014-05-19 2018-11-06 湖南工业大学 基于强化学习补偿的风力发电变桨距控制方法
CN104454347B (zh) * 2014-11-28 2018-09-07 云南电网公司电力科学研究院 一种独立变桨距风力发电机桨距角的控制方法
CN105545595B (zh) * 2015-12-11 2018-02-27 重庆邮电大学 基于径向基神经网络的风力机反馈线性化功率控制方法
CN105673325A (zh) * 2016-01-13 2016-06-15 湖南世优电气股份有限公司 基于rbf神经网络pid的风电机组独立变桨控制方法
US20180335018A1 (en) * 2017-05-16 2018-11-22 Frontier Wind, Llc Turbine Loads Determination and Condition Monitoring
CN107061164B (zh) * 2017-06-07 2019-05-10 哈尔滨工业大学 一种考虑执行机构不确定的风机变桨距滑模自适应控制方法
CN108196444A (zh) * 2017-12-08 2018-06-22 重庆邮电大学 基于反馈线性化滑模与scg的变桨风力机控制与辨识方法
CN110566406B (zh) * 2019-10-16 2020-08-04 上海海事大学 基于强化学习的风电机组实时变桨距鲁棒控制系统及方法

Also Published As

Publication number Publication date
WO2021073090A1 (zh) 2021-04-22
US20220186709A1 (en) 2022-06-16
CN110566406A (zh) 2019-12-13

Similar Documents

Publication Publication Date Title
CN110566406B (zh) 基于强化学习的风电机组实时变桨距鲁棒控制系统及方法
CN101603502B (zh) 一种基于人工智能的风能控制方法
CN105048499B (zh) 基于模型预测控制的风电并网实时调度方法及系统
CN111608868B (zh) 风力发电系统最大功率跟踪自适应鲁棒控制系统及方法
Hosseini et al. Output power levelling for DFIG wind turbine system using intelligent pitch angle control
CN110374804B (zh) 一种基于深度确定性策略梯度补偿的变桨距控制方法
CN103184972B (zh) 兆瓦级异步双馈风机转矩/桨距控制器参数自整定方法
CN103235620A (zh) 基于全局变量预测模型的温室环境智能控制方法
CN104732300B (zh) 一种基于模糊分区理论的神经网络风功率短期预测方法
CN106446494A (zh) 基于小波包‑神经网络的风光功率预测方法
CN103410660A (zh) 基于支持向量机的风力发电变桨距自学习控制方法
CN104595106A (zh) 基于强化学习补偿的风力发电变桨距控制方法
CN109737008A (zh) 风电机组智能变桨控制系统及方法、风电机组
Barrera-Cardenas et al. Optimal LQG controller for variable speed wind turbine based on genetic algorithms
Malmir et al. Controlling megawatt class WECS by ANFIS network trained with modified genetic algorithm
Hosseini et al. Improving response of wind turbines by pitch angle controller based on gain-scheduled recurrent ANFIS type 2 with passive reinforcement learning
CN111258211A (zh) 一种基于模糊神经元pid的微电网频率控制系统及方法
Dang et al. Model predictive control for maximum power capture of variable speed wind turbines
Hosseini et al. Control of pitch angle in wind turbine based on doubly fed induction generator using fuzzy logic method
Wang et al. Wind power compound model-free adaptive predictive control based on full wind speed
CN110297496A (zh) 电力巡检机器人的控制方法、装置、电子设备及存储介质
CN113494416B (zh) 一种基于lstm的变桨距控制方法设计
CN111749847B (zh) 一种风力发电机桨距在线控制方法、系统和设备
CN110210113B (zh) 基于确定性策略梯度的风电场动态等值参数智能校核方法
Shahravanmehr et al. LQG controller based on fuzzy logic to control the power of wind turbine

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant