CN103809440A - 一种用于自动控制的附加控制器设计方法 - Google Patents

一种用于自动控制的附加控制器设计方法 Download PDF

Info

Publication number
CN103809440A
CN103809440A CN201410036793.2A CN201410036793A CN103809440A CN 103809440 A CN103809440 A CN 103809440A CN 201410036793 A CN201410036793 A CN 201410036793A CN 103809440 A CN103809440 A CN 103809440A
Authority
CN
China
Prior art keywords
control
control object
vector
controller
state
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410036793.2A
Other languages
English (en)
Other versions
CN103809440B (zh
Inventor
刘锋
郭文涛
刘璋玮
梅生伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tsinghua University
Original Assignee
Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tsinghua University filed Critical Tsinghua University
Priority to CN201410036793.2A priority Critical patent/CN103809440B/zh
Publication of CN103809440A publication Critical patent/CN103809440A/zh
Application granted granted Critical
Publication of CN103809440B publication Critical patent/CN103809440B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Feedback Control In General (AREA)

Abstract

本发明涉及一种用于自动控制的附加控制器设计方法,属于自动控制技术领域。本设计方法包括采用基于近似动态规划的附加学习结构的在线自趋优控制的技术,使控制器的设计不依赖精确数学模型,通过在线学习给出最优附加控制器。本设计方法可以在被控对象的在线运行中进行,无需停机就可以进行控制器的参数设计;可以根据用户设定的控制效果评价函数改善控制对象的控制效果,能广泛适用于各类控制对象,满足多种控制要求。本设计方法对控制对象的参数和结构变化具有自适应能力,能使控制对象始终保持最优性能,提高控制系统在各类条件下的运行效益。

Description

一种用于自动控制的附加控制器设计方法
技术领域
本发明涉及一种用于自动控制的附加控制器的设计方法,属于自动控制技术领域。
技术背景
控制系统在运行过程中,不可避免会发生参数和结构的改变。传统的比例积分微分控制(Proportional-Integral-Derivative,PID)控制器无法对这类变化进行自适应调整,从而导致控制系统性能下降。
最优控制方法能通过系统化、解析化的设计手段给出系统的最优控制。但最优控制方法严格依赖系统的精确数学模型,当存在建模误差或模型改变时,控制器的最优性不再成立,极端情形下甚至可能导致系统失稳。
鲁棒控制方法通过最小化干扰增益来设计具有鲁棒性的控制器,实现一定的抗干扰能力。但鲁棒控制方法也依赖于标称系统的精确数学模型,适应能力有限。且鲁棒控制考虑了所有可能的干扰情形,针对最恶劣干扰进行控制器设计,在一定程度上牺牲了最优性能。
自适应控制方法,包括间接自适应控制和直接自适应控制,可以针对系统变化对控制器进行自适应调整。间接自适应控制通过在线辨识系统模型实现自适应,但系统辨识特别是大系统辨识本身是一个尚未充分解决的问题,因此间接自适应控制的可行性有待提高。直接自适应控制虽避免了模型辨识的问题,但一般不能保证最优性能。
综上,现有控制方法存在依赖精确数学模型、不能适应系统变化、无法实现最优性能等缺陷。
发明内容
本发明的目的是提出一种用于自动控制的附加控制器设计方法,采用基于近似动态规划(Approximate Dynamic Programming,ADP)附加学习结构的在线自趋优控制的技术,使控制器的设计不依赖精确数学模型,通过在线学习给出最优附加控制器,以优化控制系统的性能。
本发明提出的用于自动控制的附加控制器设计方法,包括以下步骤:
(1)设控制对象为:
xk+1=F(xk,uk)
其中,x为控制对象的状态,k为控制对象状态的采样时间,k=1,2,3...,xk为控制对象在第k个采样时刻的状态向量,该状态向量中包含多个状态分量,用xk(1),xk(2),xk(3),...表示状态分量,uk为控制器输出的控制参数,F(xk,uk)为控制对象在当前采样时刻的控制参数uk和当前采样时刻的状态xk与下一采样时刻的状态xk+1的关系函数;
(2)设自动控制系统中存在一个使控制对象稳定的原控制器uo,k=uo(xk),uo,k表示原控制器输出的控制参数,在自动控制系统中加入一个附加控制器us,k=us(xk),其中us,k表示附加控制器输出的控制参数,将附加控制器输出的控制参数us,k与原控制器输出的控制参数uo,k叠加后的控制参数uk=uo,k+us,k作用于控制对象;
(3)将附加控制器初始化为零输出控制器,
Figure BDA0000462018460000021
其中上标0表示迭代次数,初始化时令迭代次数i=0;
(4)利用下式,计算得到在附加控制器的作用下控制对象在第k个采样点的控制效果U(xk,uk):
U(xk,us,k)=P(xk)+us,k TRus,k
其中,P(xk)为控制对象的状态控制效果,P(xk)是控制对象在第k个采样时刻的状态向量xk的正定函数,即P(xk)≥0,P(xk)=0当且仅当xk=0时成立,
Figure BDA0000462018460000022
为控制对象的附加控制参数控制效果,R是一个正定矩阵,
Figure BDA0000462018460000023
Figure BDA0000462018460000024
当且仅当us,k=0时成立;
(5)定义控制对象从第k个采样点开始的累积控制效果为:
Q ( x k , u s , k ) = Σ i = k ∞ U ( x i , u s ( x i ) )
建立一个控制对象的累积控制效果逼近函数如下:
Q(xk,us,k)=WTΦ(xk,uk)
其中,Φ(xk,uk)是累积控制效果逼近函数的基函数向量,基函数向量为控制对象的状态分量xk(1),xk(2),xk(3),...的偶次多项式组合,W为控制效果逼近函数的参数向量,参数向量的计算过程如下:
(5‐1)采集控制对象的N个状态向量,根据N个状态向量,计算得到控制效果逼近函数的基函数向量Φ(xk,uk),并分别计算每相邻两个采样点的基函数向量之差
Figure BDA0000462018460000031
将计算得到的多个基函数向量之差
Figure BDA0000462018460000032
按时间顺序按行排列成矩阵,记为将计算得到的控制效果
Figure BDA0000462018460000034
按时间顺序按行排列成向量,记为
Figure BDA0000462018460000035
(5‐2)通过下式计算第i次迭代的累积控制效果逼近函数
Figure BDA0000462018460000036
的参数向量W(i)
Figure BDA0000462018460000037
其中
Figure BDA0000462018460000038
Figure BDA0000462018460000039
的伪逆;
(6)设定一个控制对象的累积控制效果逼近函数的训练精度εV,取值范围为10-6-102,若控制对象在相邻两次迭代的累积控制效果逼近函数之差的绝对值小于训练精度εV,则得到附加控制器
Figure BDA00004620184600000310
若控制对象在相邻两次迭代的累积控制效果逼近函数之差的绝对值大于或等于训练精度εV,则进行步骤(7);
(7)更新迭代次数,使i=i+1;
(8)采用下式,更新附加控制器:
u s , k ( i ) = u s ( i ) ( x k ) = arg min u s , k Q ( i ) ( x k , u s , k ) ;
其中
Figure BDA00004620184600000312
表示使累积控制效果Q(i)(xk,us,k)取最小值时附加控制参数us,k的值,更新完成后返回步骤(5)。
本发明提出的用于自动控制的附加控制器设计方法,其优点是:
1、本发明提出的附加控制器,可以在控制对象在线运行过程中加入,在不影响原有控制器使用的情况下改善控制对象的控制效果,因此能够提高控制系统的运行效益。
2、本发明的附加控制器的设计方法,可以根据用户设定的控制效果评价函数改善控制对象的控制效果,能广泛适用于各类控制对象,满足多种控制要求。
3、本发明的附加控制器的设计方法,不需要控制对象的数学模型,避免了建立控制对象数学模型中的复杂问题,降低了附加控制器的设计难度,提高了本发明控制器设计方法的实用性。
4、本发明设计方法,对控制对象的参数和结构变化具有自适应能力,能使控制对象始终保持最优性能,提高控制系统在各类条件下的运行效益。
具体实施方式
本发明提出的用于自动控制的附加控制器设计方法,包括以下步骤:
(1)设控制对象为:
xk+1=F(xk,uk)
其中,x为控制对象的状态(该状态即被控系统的位置、速度、温度等参数),k为控制对象状态的采样时间,k=1,2,3...,xk为控制对象在第k个采样时刻的状态向量,该状态向量中包含多个状态分量,用xk(1),xk(2),xk(3),...表示状态分量,uk为控制器输出的控制参数(如控制力、控制电压等),F(xk,uk)为控制对象在当前采样时刻的控制参数uk和当前采样时刻的状态xk与下一采样时刻的状态xk+1的关系函数;
(2)设自动控制系统中存在一个使控制对象稳定的原控制器uo,k=uo(xk),uo,k表示原控制器输出的控制参数,由于控制对象参数和工况的变化,以及设计方法的局限性,原控制器uo,k=uo(xk)的性能有可能偏离最优工作状态,甚至不满足工程实际的要求。在自动控制系统中加入一个附加控制器us,k=us(xk)来优化原控制器的控制效果,其中us,k表示附加控制器输出的控制参数,将附加控制器输出的控制参数us,k与原控制器输出的控制参数uo,k叠加后的控制参数uk=uo,k+us,k作用于控制对象;
(3)将附加控制器初始化为零输出控制器,
Figure BDA0000462018460000041
其中上标0表示迭代次数,初始化时令迭代次数i=0;
(4)利用下式,计算得到在附加控制器的作用下控制对象在第k个采样点的控制效果U(xk,uk):
U(xk,us,k)=P(xk)+us,k TRus,k
其中,P(xk)为控制对象的状态控制效果(如位置偏移、温度偏离等),P(xk)是控制对象在第k个采样时刻的状态向量xk的正定函数,即P(xk)≥0,P(xk)=0当且仅当xk=0时成立,
Figure BDA0000462018460000051
为控制对象的附加控制参数控制效果(如附加控制器消耗的能量等),R是一个正定矩阵,一般取为对角元素为正数的对角矩阵,
Figure BDA0000462018460000052
Figure BDA0000462018460000053
当且仅当us,k=0时成立;
(5)定义控制对象从第k个采样点开始的累积控制效果为:
Q ( x k , u s , k ) = Σ i = k ∞ U ( x i , u s ( x i ) )
本发明设计附加控制器的目的即是使累积控制效果最小。建立一个控制对象的累积控制效果逼近函数如下:
Q(xk,us,k)=WTΦ(xk,uk)
其中,Φ(xk,uk)是累积控制效果逼近函数的基函数向量,基函数向量为控制对象的状态分量xk(1),xk(2),xk(3),...的偶次多项式组合,(例如一个控制对象包括xk(1)和xk(2)两个状态分量,选择多项式次数为4,则 Φ ( x k ) = [ x k 2 ( 1 ) , x k ( 1 ) x k ( 2 ) , x k 2 ( 2 ) , x k 4 ( 1 ) , x k 3 ( 1 ) x k ( 2 ) , x k 2 ( 1 ) x k 2 ( 2 ) , x k ( 1 ) x k 3 ( 2 ) , x k 4 ( 2 ) ] T ) , W为控制效果逼近函数的参数向量,参数向量的计算过程如下:
(5‐1)将附加控制器
Figure BDA0000462018460000056
应用于控制对象,采集控制对象的N个状态向量,根据N个状态向量,计算得到控制效果逼近函数的基函数向量Φ(xk,uk),并分别计算每相邻两个采样点的基函数向量之差
Figure BDA0000462018460000057
将计算得到的多个基函数向量之差按时间顺序按行排列成矩阵,记为
Figure BDA0000462018460000059
将计算得到的控制效果
Figure BDA00004620184600000510
按时间顺序按行排列成向量,记为
Figure BDA0000462018460000061
(5‐2)通过下式计算第i次迭代的累积控制效果逼近函数
Figure BDA0000462018460000062
的参数向量W(i)
其中
Figure BDA0000462018460000064
的伪逆;伪逆又称为Moore-Penrose伪逆,常用于求解线性最小二乘问题;
(6)设定一个控制对象的累积控制效果逼近函数的训练精度εV,取值范围为10-6-102,即当训练之后的累积控制效果逼近函数与训练之前的累积控制效果逼近函数之差小于该值时,训练即可停止。若控制对象在相邻两次迭代的累积控制效果逼近函数之差的绝对值小于训练精度εV,则得到附加控制器
Figure BDA0000462018460000066
若控制对象在相邻两次迭代的累积控制效果逼近函数之差的绝对值大于或等于训练精度εV,则进行步骤(7);
(7)更新迭代次数,使i=i+1;
(8)采用下式,更新附加控制器:
u s , k ( i ) = u s ( i ) ( x k ) = arg min u s , k Q ( i ) ( x k , u s , k ) ;
其中
Figure BDA0000462018460000068
表示使累积控制效果Q(i)(xk,us,k)取最小值时附加控制参数us,k的值,更新完成后返回步骤(5)。
在本实施例中,本发明提出的一种用于自动控制的附加控制器设计方法被应用于电力系统的负荷频率控制问题,控制对象如下:
x · = - 1 / T P K P / T P 0 0 0 - 1 / T T 1 / T T 0 - 1 / ( RT G ) 0 - 1 / T G - 1 / T G K E 0 0 0 x + 0 0 1 / T G 0 u
其中,TG为发电机调速器时间常数,R为调速器下垂系数,KE为调速器积分增益,TT为发电机原动机时间常数,KP为系统增益,TP为系统时间常数,状态向量x=[Δf ΔPg ΔXg ΔE]T,Δf为频率偏差,ΔPg为发电机有功功率偏差,ΔXg为调速器位置输出偏差,ΔE为积分环节输出偏差。在此例中,可认为x(1)=Δf,x(2)=ΔPg,x(3)=ΔXg,x(4)=ΔE。
控制对象的参数为:TP=15.04,KP=120.3,TT=0.2730,TG=0.07280,R=2.002,KE=0.6,采样时间间隔0.01s。本发明的设计方法的参数选为:控制效果 U ( x k , u s , k ) = 0.01 ( x k 2 ( 1 ) + x k 2 ( 2 ) + x k 2 ( 3 ) + x k 2 ( 4 ) + u s , k 2 ) , 累积控制效果逼近函数的基函数向量Φ(xk,us,k)为状态分量的全部二次组合,即 [ x k 2 ( 1 ) , x k 2 ( 2 ) , x k 2 ( 3 ) , x 4 2 ( 4 ) , x 4 ( 1 ) x k ( 2 ) , x k ( 1 ) x k ( 3 ) , x k ( 1 ) x k ( 4 ) , x k ( 2 ) x k ( 3 ) , x k ( 2 ) x k ( 4 ) , x k ( 3 ) x k ( 4 ) ] , 用于代价函数逼近的采样点数N=1000,控制对象的累积控制效果逼近函数的训练精度εV=10-4
按照发明内容中的步骤设计该系统的附加控制器,得到如下式所示的附加控制器
us,k=-4.60x(1)-6.86x(2)-0.92x(3)+0.36x(4)
在该附加控制器的作用下,控制对象的累积控制效果从2.54降低到0.80,说明了本发明的有效性。

Claims (1)

1.一种用于自动控制的附加控制器设计方法,其特征在于该设计方法包括以下步骤:
(1)设控制对象为:
xk+1=F(xk,uk)
其中,x为控制对象的状态,k为控制对象状态的采样时间,k=1,2,3...,xk为控制对象在第k个采样时刻的状态向量,该状态向量中包含多个状态分量,用xk(1),xk(2),xk(3),...表示状态分量,uk为控制器输出的控制参数,F(xk,uk)为控制对象在当前采样时刻的控制参数uk和当前采样时刻的状态xk与下一采样时刻的状态xk+1的关系函数;
(2)设自动控制系统中存在一个使控制对象稳定的原控制器uo,k=uo(xk),uo,k表示原控制器输出的控制参数,在自动控制系统中加入一个附加控制器us,k=us(xk),其中us,k表示附加控制器输出的控制参数,将附加控制器输出的控制参数us,k与原控制器输出的控制参数uo,k叠加后的控制参数uk=uo,k+us,k作用于控制对象;
(3)将附加控制器初始化为零输出控制器,
Figure FDA0000462018450000011
其中上标0表示迭代次数,初始化时令迭代次数i=0;
(4)利用下式,计算得到在附加控制器的作用下控制对象在第k个采样点的控制效果U(xk,uk):
U(xk,us,k)=P(xk)+us,k TRus,k
其中,P(xk)为控制对象的状态控制效果,P(xk)是控制对象在第k个采样时刻的状态向量xk的正定函数,即P(xk)≥0,P(xk)=0当且仅当xk=0时成立,为控制对象的附加控制参数控制效果,R是一个正定矩阵,
Figure FDA0000462018450000013
Figure FDA0000462018450000014
当且仅当us,k=0时成立;
(5)定义控制对象从第k个采样点开始的累积控制效果为:
Q ( x k , u s , k ) = Σ i = k ∞ U ( x i , u s ( x i ) )
建立一个控制对象的累积控制效果逼近函数如下:
Q(xk,us,k)=WTΦ(xk,uk)
其中,Φ(xk,uk)是累积控制效果逼近函数的基函数向量,基函数向量为控制对象的状态分量xk(1),xk(2),xk(3),...的偶次多项式组合,W为控制效果逼近函数的参数向量,参数向量的计算过程如下:
(5‐1)采集控制对象的N个状态向量,根据N个状态向量,计算得到控制效果逼近函数的基函数向量Φ(xk,uk),并分别计算每相邻两个采样点的基函数向量之差
Figure FDA0000462018450000021
将计算得到的多个基函数向量之差按时间顺序按行排列成矩阵,记为
Figure FDA0000462018450000023
将计算得到的控制效果
Figure FDA0000462018450000024
按时间顺序按行排列成向量,记为
(5‐2)通过下式计算第i次迭代的累积控制效果逼近函数
Figure FDA0000462018450000026
的参数向量W(i)
Figure FDA0000462018450000027
其中
Figure FDA0000462018450000028
的伪逆;
(6)设定一个控制对象的累积控制效果逼近函数的训练精度εV,取值范围为10-6-102,若控制对象在相邻两次迭代的累积控制效果逼近函数之差的绝对值小于训练精度εV,则得到附加控制器
Figure FDA00004620184500000210
若控制对象在相邻两次迭代的累积控制效果逼近函数之差的绝对值大于或等于训练精度εV,则进行步骤(7);
(7)更新迭代次数,使i=i+1;
(8)采用下式,更新附加控制器:
u s , k ( i ) = u s ( i ) ( x k ) = arg min u s , k Q ( i ) ( x k , u s , k ) ;
其中
Figure FDA00004620184500000212
表示使累积控制效果Q(i)(xk,us,k)取最小值时附加控制参数us,k的值,更新完成后返回步骤(5)。
CN201410036793.2A 2014-01-25 2014-01-25 一种用于自动控制的附加控制器设计方法 Active CN103809440B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410036793.2A CN103809440B (zh) 2014-01-25 2014-01-25 一种用于自动控制的附加控制器设计方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410036793.2A CN103809440B (zh) 2014-01-25 2014-01-25 一种用于自动控制的附加控制器设计方法

Publications (2)

Publication Number Publication Date
CN103809440A true CN103809440A (zh) 2014-05-21
CN103809440B CN103809440B (zh) 2017-01-04

Family

ID=50706390

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410036793.2A Active CN103809440B (zh) 2014-01-25 2014-01-25 一种用于自动控制的附加控制器设计方法

Country Status (1)

Country Link
CN (1) CN103809440B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105870942A (zh) * 2016-05-18 2016-08-17 中国电力科学研究院 一种基于近似动态规划算法的一次调频附加学习控制方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105870942A (zh) * 2016-05-18 2016-08-17 中国电力科学研究院 一种基于近似动态规划算法的一次调频附加学习控制方法
CN105870942B (zh) * 2016-05-18 2022-04-29 中国电力科学研究院 一种基于近似动态规划算法的一次调频附加学习控制方法

Also Published As

Publication number Publication date
CN103809440B (zh) 2017-01-04

Similar Documents

Publication Publication Date Title
US10732585B2 (en) Self-configuring extremum-seeking control system
Mi et al. Decentralized sliding mode load frequency control for multi-area power systems
US20160132027A1 (en) Dither switching extremum seeking control
Ma et al. Optimal real-time control of wind turbine during partial load operation
CN103383127B (zh) 用于调节通风系统的方法
Geng et al. Linear and nonlinear schemes applied to pitch control of wind turbines
CN106933202A (zh) 利用基于所估计的状态信息的间歇重新初始化的前馈控制
Chan et al. Predictive control with adaptive model maintenance: Application to power plants
Nandiganahalli et al. Delay-tolerant adaptive robust tracking control of uncertain time-delay systems
US20170025851A1 (en) Aggregate Load Controllers and Associated Methods
Alfehaid et al. Speed control of permanent magnet synchronous motor using extended high-gain observer
CN103809440A (zh) 一种用于自动控制的附加控制器设计方法
Li et al. Wind turbine pitch control and load mitigation using an L1 adaptive approach
Hawkins et al. Region II wind power capture maximization using robust control and estimation with alternating gradient search
Raza et al. Feedback linearization using high gain observer for nonlinear electromechanical actuator
Sunori et al. Model predictive control system design for boiler turbine process
Patete et al. Stability of self‐tuning control based on Lyapunov function
Sajjadi-Kia et al. Modified anti-windup compensators for stable plants: dynamic anti-windup case
Sawyer Gain-scheduled control of a quadcopter UAV
Wu et al. Robust tracking of the flight path angle of aircraft based on UDE and IID
Abbas et al. Comparative analysis of analog controllers for DC-DC buck converter
KR20110115797A (ko) 비례적분미분제어기 및 그 제어 방법
Buonomano et al. Building temperature control using an enhanced MRAC approach
Bernard et al. CDM application on power system as a load frequency controller
Fleischmann et al. Controller design point selection for linearized gain scheduling

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant