CN109116731A - 一种切换线性系统的数据驱动最优控制方法 - Google Patents

一种切换线性系统的数据驱动最优控制方法 Download PDF

Info

Publication number
CN109116731A
CN109116731A CN201810846864.3A CN201810846864A CN109116731A CN 109116731 A CN109116731 A CN 109116731A CN 201810846864 A CN201810846864 A CN 201810846864A CN 109116731 A CN109116731 A CN 109116731A
Authority
CN
China
Prior art keywords
matrix
time
switching
moment
linear system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810846864.3A
Other languages
English (en)
Other versions
CN109116731B (zh
Inventor
甘明刚
张弛
陈杰
窦丽华
张蒙
赵金刚
白永强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Institute of Technology BIT
Original Assignee
Beijing Institute of Technology BIT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Institute of Technology BIT filed Critical Beijing Institute of Technology BIT
Priority to CN201810846864.3A priority Critical patent/CN109116731B/zh
Publication of CN109116731A publication Critical patent/CN109116731A/zh
Application granted granted Critical
Publication of CN109116731B publication Critical patent/CN109116731B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/042Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Complex Calculations (AREA)

Abstract

本发明公开了一种切换线性系统的数据驱动最优控制方法,能够在具体的子系统模型未知的情况下,只根据可测的系统状态量对切换线性系统进行最优切换时间的结算,从而有效实现切换线性系统的最优切换控制。该方法包括如下步骤:利用采样数据根据时变矩阵的递推式从终端时刻倒推各时刻的时变矩阵;在已估计出的时变矩阵的基础上利用采样数据根据系统状态和时变矩阵之间的相互关系推导代价函数偏导的估计;将已估计出的代价函数偏导应用于梯度下降算法实现切换时间的更新;根据计算的最优切换时间对切换线性系统进行切换控制。

Description

一种切换线性系统的数据驱动最优控制方法
技术领域
本发明涉及切换控制系统技术领域,具体涉及一种切换线性系统的数据驱动最优控制方法。
背景技术
在切换系统控制中,由于不确定性因素的存在,子系统模型可能会发生改变,可能难以获得子系统模型或者精确的子系统模型,此时传统的基于模型的方法已经不能解决问题或者难以保证良好的性能。因此,如果在控制过程中不能准确得到系统模型,就需要研究一种不依赖于系统模型的控制算法。
发明内容
有鉴于此,本发明提供了一种切换线性系统的数据驱动最优控制方法,能够在具体的子系统模型未知的情况下,只根据可测的系统状态量对切换线性系统进行最优切换时间的结算,从而有效实现切换线性系统的最优切换控制。
为达到上述目的,本发明的技术方案为:一种切换线性系统的数据驱动最优控制方法,所针对的切换线性系统的状态方程为
其中为系统状态x(t)的导数,x(t)∈Rn为系统状态,x(t)状态量可测,Rn是指n维实数空间,即x(t)具有n个状态分量x(t)=[x1(t),x2(t),...,xn(t)]T;Ai∈Rn×n是未知的子系统矩阵,Rn×n为n×n维实数空间;i∈{0,1,2,...,N}是切换线性系统设定的子系统切换顺序索引,N是切换次数;ti是切换时间,即为切换线性系统的控制量,满足
t0<t1<…<tN-1<tN<tN+1=tf;其中t0=0是初始时间,tf是终端时间。
切换线性系统的有限时间代价函数为:
其中Qf为终端加权矩阵,Qf为给定的正定对阵矩阵,满足Q是指给定的加权矩阵,根据实际需要进行设定,Q为给定的正定对阵矩阵,满足Q=QT≥0。
在优化过程中,对于任意x(t)∈Rn和t∈[t0,tf),切换线性系统从时刻t的状态x(t)开始,其代价函数为:
xT(t)为x(t)的转置;P(t)为时变矩阵,P(t)为对称的并且满足如下条件:
为P(t)的导数。
针对切换线性系统,采用如下步骤进行最优切换时间控制:
步骤1、针对时变矩阵P(t):
其中δt为时间间隔,取值较小,一般在(0,0.1)之间。
将式(5)两端均左乘x(t′)T并右乘x(t′)得到:
其中t′是一个与时刻t无关的时刻;根据积分中值定理,得到:
其中θ1为[0,1]之间的常数。
x(t′+δt)-x(t′)=Aix(t′+θ2δt)·δt,0≤θ2≤1,t′,t′+δt∈[ti,ti+1) (8)
其中θ2为[0,1]之间的常数。
将(7)和(8)代入(6)可得:
x(t′)TP(t+δt)x(t′)-x(t′)TP(t)x(t′)
=-2x(t′)TP(t)(x(t′+δt)-x(t′))-x(t′)TQx(t′)·δt+er1(t,t′)+er2(t,t′)
其中t∈[ti,ti+1),t′∈[ti,ti+1)。
er1(t,t′)为关于t′时刻和t时刻的第一误差;
er1((t,t′)=-2x(t′)T(P(t+θ1δt)-P(t))Aix(t′)·δt。
er2(t,t′)为关于t′时刻和t时刻的第二误差;
er2(t,t′)=2x(t′)TP(t)Ai(x(t′+θ2δt)-x(t′))·δt。
得到P(t)和P(t+δt)之间的关系式如下:
3x(t′)TP(t)x(t′)-2x(t′)TP(t)x(t′+δt)=x(t′)TP(t+δt)x(t′)+x(t′)TQx(t′)·δt-er1(t,t′)-er2(t,t′) (9)
式(9)中第一误差er1(t,t′)和第二误差er2(t,t′)忽略不计,得到如下估计:
其中为时变矩阵P(t)的估计值。
引入克罗内克Kronecker积表示(10):
其中cs(*)是矩阵*的列展开。
建立如下状态参数矩阵:包括第一状态参数矩阵Ci、第二状态参数矩阵Di、第三状态参数矩阵Ei、第四状态参数矩阵Er1(t)以及第五状态参数矩阵Er2(t);i=0,1,2,...N。
其中x(t′i1)~x(t′il)分别为t′i1~t′il时刻的系统状态,ti<t′i1<t′i2<…<t′il<ti+1,l是正整数。
Di=[d(t′i1),d(t′i2),...,d(t′il)]T;其中
其中r取值为1~l;x(t′ir)=[x1(t′ir),x2(t′ir),...,xn(t′ir)]T,x1(t′ir),x2(t′ir),...,xn(t′ir)为t′ir时刻系统状态x(t′ir)中的n个状态分量;i=0,1,2,...N。
Ei=[ei1,ei2,...,eil]T;其中其中x1(t′ir+δt)~xn(t′ir+δt)为t′ir+δt时刻系统状态x(t′ir+δt)中的n个状态分量。
Er1(t)=[er1((t,t′i1),er1((t,t′i2),...,er1((t,t′il)]T;其中er1((t,t′ir)为关于t′ir时刻和t时刻的第一误差;r=1,2,...l。
Er2(t)=[er2((t,t′i1),er2((t,t′i2),...,er2((t,t′il)]T;其中er2((t,t′ir)为关于t′ir时刻和t时刻的第二误差;r=1,2,...l。
采用状态参数矩阵与(9)到(11)结合,获得:
(3Di-2Ei)·css(P(t))=Di·css(P(t+δt))+Ci·cs(Q)·δt-Er1(t)-Er2(t)(12)
其中css(*)是对称矩阵*∈Rn×n去除重复元素的列展开。
若3Di-2Ei列满秩,式(13)直接求解:
t∈[ti,ti+1)。
步骤2、代价函数对切换时间ti的偏导数为:
Jti=x(ti)TP(ti)(Ai-1-Ai)x(ti) (15)
由式(1)和式(4)得到:
用克罗内克kronecker积形式表示为:
状态参数矩阵还包括第六状态参数矩阵Fj、第七状态参数矩阵Gj以及第八状态参数矩阵h(ti);建立Fj和Gj;j=0,1,2,...N。
Gj=[g(t′j1),g(t′j2),...,g(t′jl)]T;其中
tj<t′j1<t′j2<…<t′jl<tj+1,t′jl+δt′<tj+1
其中t′,t′+δt∈[tj,tj+1),进而得到:
(Fj-Cj)·cs(P(ti))=2Gj·csa(P(ti)Aj) (16)
csa(*)是矩阵*∈Rn×n的变换,具体变换形式为:
*为矩阵B,bjr是矩阵B第j行第r列的元素;
若Gj列满秩,获得csa(P(ti)Aj)的近似值:
通过式(17)的求解结果估计偏导数如下:
其中第八状态参数矩阵为:
步骤3、采用如下迭代步骤计算最优切换时间:
S1、设置迭代次数k=0,切换时间的初始值为切换时间的初始值为随机设定时刻。
S2、获取切换时间并测得切换线性系统的状态数据。
S3、取i=1,2,…,N和j=0,1,2,…N,依据步骤2计算状态参数矩阵Di,Ei,Cj,Gj,Fj和h(ti)。
S4、分别按照式(14)、(17)和(18)估计
S5、更新切换时间:其中α为预设的步长,α取值在0~1之间。
S6、判断是否成立,若不成立,令k自增1,返回到S2;若成立此时为最优切换时间。
其中ε预设的阈值,其中ε<0.1。
根据计算的最优切换时间对切换线性系统进行切换控制。
有益效果:
本发明利用切换线性系统的工业过程中产生大量的过程数据,对系统状态量进行测量,并利用测量得到的系统状态量,对时变矩阵进行估计、对代价函数关于切换时间的偏导进行估计,并最终实现最优切换时间的更新。时变矩阵的估计利用采样数据根据时变矩阵的递推式从终端时刻倒推各时刻的时变矩阵;代价函数偏导的估计在已估计出的时变矩阵的基础上利用采样数据根据系统状态和时变矩阵之间的相互关系进行推导;切换时间的更新将已估计出的代价函数偏导应用于梯度下降算法即可实现。该方法不需要知道具体的子系统模型,只要状态量可测,便可有效实现切换系统的最优控制。
附图说明
图1为MATLAB仿真切换系统状态轨迹图;
图2为MATLAB仿真切换时间图;
图3为MATLAB仿真代价函数对比图;
图4为MATLAB仿真代价函数对切换时间的偏导对比图;
图5为本发明提供的切换线性系统的数据驱动最优控制方法的流程图。
具体实施方式
下面结合附图并举实施例,对本发明进行详细描述。
本发明提供了一种切换线性系统的数据驱动最优控制方法,针对如下切换线性系统进行切换控制:
切换线性系统的状态方程为
其中为系统状态x(t)的导数,x(t)∈Rn为系统状态,x(t)状态量可测,Rn是指n维实数空间,即x(t)具有n个状态变量x(t)=[x1(t),x2(t),...,xn(t)]T;Ai∈Rn×n是未知的子系统矩阵,Rn×n为n×n维实数空间;i∈{0,1,2,...,N}是切换线性系统设定的子系统切换顺序索引,N是切换次数;ti是切换时间,即为切换线性系统的控制量,满足
t0<t1<…<tN-1<tN<tN+1=tf;其中t0=0是初始时间,tf是终端时间。
切换线性系统的有限时间代价函数为:
其中Qf为终端加权矩阵,Qf为给定的正定对阵矩阵,满足Q是指给定的加权矩阵,根据实际需要进行设定,Q为给定的正定对阵矩阵,满足Q=QT≥0。
在优化过程中,对于任意x(t)∈Rn和t∈[t0,tf),切换线性系统从时刻t的状态x(t)开始,其代价函数为:
xT(t)为x(t)的转置;P(t)为时变矩阵,P(t)为对称的并且满足如下条件:
为P(t)的导数;
针对切换线性系统,采用如图5所示的步骤进行最优切换时间控制:
步骤1、对时变矩阵P(t)进行估计,具体过程如下
针对时变矩阵P(t):
其中δt为时间间隔,取值较小,一般在(0,0.1)之间(实际中可以取0.001s)。将式(5)两端均左乘x(t′)T并右乘x(t′)得到:
其中t′是一个与时刻t无关的时刻;根据积分中值定理,得到:
其中θ1为[0,1]之间的常数;
x(t′+δt)-x(t′)=Aix(t′+θ2δt)·δt,0≤θ2≤1,t′,t′+δt∈[ti,ti+1) (8)
其中θ2为[0,1]之间的常数。
将(7)和(8)代入(6)可得:
x(t′)TP(t+δt)x(t′)-x(t′)TP(t)x(t′)
=-2x(t′)TP(t)(x(t′+δt)-x(t′))-x(t′)TQx(t′)·δt+er1(t,t′)+er2(t,t′)
其中t∈[ti,ti+1),t′∈[ti,ti+1);
er1(t,t′)为关于t′时刻和t时刻的第一误差;
er1((t,t′)=-2x(t′)T(P(t+θ1δt)-P(t))Aix(t′)·δt。
er2(t,t′)为关于t′时刻和t时刻的第二误差;
er2(t,t′)=2x(t′)TP(t)Ai(x(t′+θ2δt)-x(t′))·δt;
得到P(t)和P(t+δt)之间的关系式如下:
3x(t′)TP(t)x(t′)-2x(t′)TP(t)x(t′+δt)=x(t′)TP(t+δt)x(t′)+x(t′)TQx(t′)·δt-er1(t,t′)-er2(t,t′) (9)
式(9)中第一误差er1(t,t′)和第二误差er2(t,t′)忽略不计,得到如下估计:
其中为时变矩阵P(t)的估计值;
引入克罗内克Kronecker积表示(10):
其中cs(*)是矩阵*的列展开;例如的列。
建立如下状态参数矩阵:包括第一状态参数矩阵Ci、第二状态参数矩阵Di、第三状态参数矩阵Ei、第四状态参数矩阵Er1(t)以及第五状态参数矩阵Er2(t);i=0,1,2,...N。
其中x(t′i1)~x(t′il)分别为t′i1~t′il时刻的系统状态,ti<t′i1<t′i2<…<t′il<ti+1,l是正整数。
Di=[d(t′i1),d(t′i2),...,d(t′il)]T;其中
其中r取值为1~l;x(t′ir)=[x1(t′ir),x2(t′ir),...,xn(t′ir)]T,x1(t′ir),x2(t′ir),...,xn(t′ir)为t′ir时刻系统状态x(t′ir)中的n个状态分量;i=0,1,2,...N。
Ei=[ei1,ei2,...,eil]T;其中其中x1(t′ir+δt)~xn(t′ir+δt)为t′ir+δt时刻系统状态x(t′ir+δt)中的n个状态分量。
Er1(t)=[er1((t,t′i1),er1((t,t′i2),...,er1((t,t′il)]T;其中er1((t,t′ir)为关于t′ir时刻和t时刻的第一误差;r=1,2,...l。
Er2(t)=[er2((t,t′i1),er2((t,t′i2),...,er2((t,t′il)]T;其中er2((t,t′ir)为关于t′ir时刻和t时刻的第二误差;r=1,2,...l。
采用状态参数矩阵与(9)到(11)结合,获得:
(3Di-2Ei)·css(P(t))=Di·css(P(t+δt))+Ci·cs(Q)·δt-Er1(t)-Er2(t)(12)
其中css(*)是对称矩阵*∈Rn×n去除重复元素的列展开;例如:
bjr是矩阵B第j行第r列的元素。
若3Di-2Ei列满秩,式(13)直接求解:
t∈[ti,ti+1)。
步骤2、对代价函数关于切换时间的偏导进行估计,具体过程如下:
代价函数对切换时间ti的偏导数为:
由式(1)和式(4)得到:
用克罗内克kronecker积形式表示为:
状态参数矩阵还包括第六状态参数矩阵Fj、第七状态参数矩阵Gj以及第八状态参数矩阵h(ti);建立Fj和Gj;j=0,1,2,...N。
Gj=[g(t′j1),g(t′j2),...,g(t′jl)]T;其中
tj<t′j1<t′j2<…<t′jl<tj+1,t′jl+δt′<tj+1
其中t′,t′+δt∈[tj,tj+1),进而得到:
(Fj-Cj)·cs(P(ti))=2Gj·csa(P(ti)Aj) (16)
csa(*)是矩阵*∈Rn×n的变换,具体变换形式为:
*为矩阵B,bjr是矩阵B第j行第r列的元素。
若Gj列满秩,获得csa(P(ti)Aj)的近似值:
通过式(17)的求解结果估计偏导数如下:
其中第八状态参数矩阵为:
步骤3、采用如下迭代步骤计算最优切换时间:
S1、设置迭代次数k=0,切换时间的初始值为tk,切换时间的初始值为随机设定时刻。
S2、获取切换时间并测得切换线性系统的状态数据。
S3、取i=1,2,…,N和j=0,1,2,…N,依据步骤2计算状态参数矩阵Di,Ei,Cj,Gj,Fj和h(ti)。
S4、分别按照式(14)、(17)和(18)估计
的估计值;
S5、更新切换时间:其中α为预设的步长,α取值在0~1之间,具体实现过程中取经验值。
S6、判断是否成立,若不成立,令k自增1,返回到S2;若成立此时为最优切换时间。
其中ε预设的阈值,其中ε<0.1。
步骤4、根据计算的最优切换时间对切换线性系统进行切换控制。
本发明实施例中,利用matlab对上述方法进行仿真。考虑具有两个子系统的自治切换线性系统:
系统参数设置为:t0=0,tf=1,x(0)=[0.55,0.55]T
代价函数定义为:
目标是寻找最优切换时间使得该代价函数最小。
选择初始切换时间为:采样周期为T=0.001,步长为α=0.1。应用数据驱动最优控制方法,经过18次迭代,可得最优切换时间的近似值(是实际的最优解),其相对应的最优代价近似值为0.3259。应用的状态轨迹如图1所示。
图2中,随着迭代次数的增加,切换时间t1逐渐收敛到近似最优切换时间。
图3中,随着迭代次数的增加,数据驱动方法得到的代价J逐渐收敛到近似最优代价,在此过程中,J的值始终和使用系统模型所求的代价值J0保持相近。图4中,随着迭代次数的增加,数据驱动方法所求的导数逐渐收敛到0,在此过程中,的值始终和使用系统模型所求的导数值保持相近。该仿真验证了所提方法的有效性。
综上所述,以上仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (1)

1.一种切换线性系统的数据驱动最优控制方法,其特征在于,
所述切换线性系统的状态方程为
其中为系统状态x(t)的导数,x(t)∈Rn为系统状态,x(t)状态量可测,Rn是指n维实数空间,即x(t)具有n个状态x(t)=[x1(t),x2(t),...,xn(t)]T Ai∈Rn×n是未知的子系统矩阵,Rn×n为n×n维实数空间;i∈{0,1,2,...,N}是所述切换线性系统设定的子系统切换顺序索引,N是切换次数;ti是切换时间,即为所述切换线性系统的控制量,满足
t0<t1<…<tN-1<tN<tN+1=tf;其中t0=0是初始时间,tf是终端时间;
所述切换线性系统的有限时间代价函数为:
其中Qf为终端加权矩阵,Qf为给定的正定对阵矩阵,满足Q是指给定的加权矩阵,根据实际需要进行设定,Q为给定的正定对阵矩阵,满足Q=QT≥0;
在优化过程中,对于任意x(t)∈Rn和t∈[t0,tf),所述切换线性系统从时刻t的状态x(t)开始,其代价函数为:
xT(t)为x(t)的转置;P(t)为时变矩阵,P(t)为对称的并且满足如下条件:
为P(t)的导数;
针对所述切换线性系统,采用如下步骤进行最优切换时间控制:
步骤1、针对所述时变矩阵P(t):
其中δt为时间间隔,取值在(0,0.1)之间;
将式(5)两端均左乘x(t′)T并右乘x(t′)得到:
其中t′是一个与时刻t无关的时刻;根据积分中值定理,得到:
其中θ1为[0,1]之间的常数;
x(t′+δt)-x(t′)=Aix(t′+θ2δt)·δt,0≤θ2≤1,t′,t′+δt∈[ti,ti+1) (8)
其中θ2为[0,1]之间的常数;
将(7)和(8)代入(6)可得:
x(t′)TP(t+δt)x(t′)-x(t′)TP(t)x(t′)
=-2x(t′)TP(t)(x(t′+δt)-x(t′))-x(t′)TQx(t′)·δt+er1(t,t′)+er2(t,t′)
其中t∈[ti,ti+1),t′∈[ti,ti+1);
er1(t,t′)为关于t′时刻和t时刻的第一误差;
er1((t,t′)=-2x(t′)T(P(t+θ1δt)-P(t))Aix(t′)·δt;
er2(t,t′)为关于t′时刻和t时刻的第二误差;
er2(t,t′)=2x(t′)TP(t)Ai(x(t′+θ2δt)-x(t′))·δt;
得到P(t)和P(t+δt)之间的关系式如下:
3x(t′)TP(t)x(t′)-2x(t′)TP(t)x(t′+δt)=x(t′)TP(t+δt)x(t′)+x(t′)TQx(t′)·δt-er1(t,t′)-er2(t,t′) (9)
式(9)中第一误差er1(t,t′)和第二误差er2(t,t′)忽略不计,得到如下估计:
其中为时变矩阵P(t)的估计值;
引入克罗内克Kronecker积表示(10):
其中cs(*)是矩阵*的列展开;
建立如下状态参数矩阵:包括第一状态参数矩阵Ci、第二状态参数矩阵Di、第三状态参数矩阵Ei、第四状态参数矩阵Er1(t)以及第五状态参数矩阵Er2(t);i=0,1,2,...N;
其中x(t′i1)~x(t′il)分别为t′i1~t′il时刻的系统状态,ti<t′i1<t′i2<…<t′il<ti+1,l是正整数;
Di=[d(t′i1),d(t′i2),...,d(t′il)]T;其中
其中r取值为1~l;x(t′ir)=[x1(t′ir),x2(t′ir),...,xn(t′ir)]T,x1(t′ir),x2(t′ir),...,xn(t′ir)为t′ir时刻系统状态x(t′ir)中的n个状态分量;i=0,1,2,...N;
Ei=[ei1,ei2,...,eil]T;其中其中x1(t′ir+δt)~xn(t′ir+δt)为t′ir+δt时刻系统状态x(t′ir+δt)中的n个状态分量;
Er1(t)=[er1((t,t′i1),er1((t,t′i2),...,er1((t,t′il)]T;其中er1((t,t′ir)为关于t′ir时刻和t时刻的第一误差;r=1,2,...l;
Er2(t)=[er2((t,t′i1),er2((t,t′i2),...,er2((t,t′il)]T;其中er2((t,t′ir)为关于t′ir时刻和t时刻的第二误差;r=1,2,...l;
采用所述状态参数矩阵与(9)到(11)结合,获得:
(3Di-2Ei)·css(P(t))=Di·css(P(t+δt))+Ci·cs(Q)·δt-Er1(t)-Er2(t) (12)
其中css(*)是对称矩阵*∈Rn×n去除重复元素的列展开;
若3Di-2Ei列满秩,式(13)直接求解:
步骤2、代价函数对切换时间ti的偏导数为:
由式(1)和式(4)得到:
用克罗内克kronecker积形式表示为:
所述状态参数矩阵还包括第六状态参数矩阵Fj、第七状态参数矩阵Gj以及第八状态参数矩阵h(ti);建立Fj和Gj;j=0,1,2,...N;
Gj=[g(t′j1),g(t′j2),...,g(t′jl)]T;其中
tj<t′j1<t′j2<…<t′jl<tj+1,t′jl+δt′<tj+1
其中t′,t′+δt∈[tj,tj+1),进而得到:
(Fj-Cj)·cs(P(ti))=2Gj·csa(P(ti)Aj) (16)
csa(*)是矩阵*∈Rn×n的变换,具体变换形式为:
*为矩阵B,bjr是矩阵B第j行第r列的元素;
若Gj列满秩,获得csa(P(ti)Aj)的近似值:
通过式(17)的求解结果估计偏导数如下:
其中第八状态参数矩阵为:
步骤3、采用如下迭代步骤计算最优切换时间:
S1、设置迭代次数k=0,切换时间的初始值为所述切换时间的初始值为随机设定时刻;
S2、获取切换时间并测得所述切换线性系统的状态数据;
S3、取i=1,2,…,N和j=0,1,2,…N,依据步骤2计算状态参数矩阵Di,Ei,Cj,Gj,Fj和h(ti);
S4、分别按照式(14)、(17)和(18)估计
S5、更新切换时间:其中α为预设的步长,α取值在0~1之间;
S6、判断是否成立,若不成立,令k自增1,返回到S2;若成立此时为最优切换时间;
其中ε预设的阈值,其中ε<0.1;
步骤4、根据计算的最优切换时间对所述切换线性系统进行切换控制。
CN201810846864.3A 2018-07-27 2018-07-27 一种切换线性系统的数据驱动最优控制方法 Active CN109116731B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810846864.3A CN109116731B (zh) 2018-07-27 2018-07-27 一种切换线性系统的数据驱动最优控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810846864.3A CN109116731B (zh) 2018-07-27 2018-07-27 一种切换线性系统的数据驱动最优控制方法

Publications (2)

Publication Number Publication Date
CN109116731A true CN109116731A (zh) 2019-01-01
CN109116731B CN109116731B (zh) 2020-07-07

Family

ID=64863477

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810846864.3A Active CN109116731B (zh) 2018-07-27 2018-07-27 一种切换线性系统的数据驱动最优控制方法

Country Status (1)

Country Link
CN (1) CN109116731B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110888323A (zh) * 2019-11-26 2020-03-17 大连理工大学 一种用于切换系统智能优化的控制方法
CN111665719A (zh) * 2020-06-11 2020-09-15 大连海事大学 一种具有时效性与稳定性的补给船同步控制算法
CN113325705A (zh) * 2021-04-30 2021-08-31 同济大学 一种线性切换系统的砰-砰控制方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105739310A (zh) * 2016-02-16 2016-07-06 北京理工大学 一种基于多模型的伺服系统自适应控制系统
CN107490962A (zh) * 2017-08-08 2017-12-19 北京理工大学 一种数据驱动的伺服系统最优控制方法
CN107561929A (zh) * 2017-07-25 2018-01-09 北京理工大学 一种伺服系统的无模型鲁棒自适应优化方法
CN107728465A (zh) * 2017-09-12 2018-02-23 北京理工大学 一种基于混合系统的自适应优化控制方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105739310A (zh) * 2016-02-16 2016-07-06 北京理工大学 一种基于多模型的伺服系统自适应控制系统
CN107561929A (zh) * 2017-07-25 2018-01-09 北京理工大学 一种伺服系统的无模型鲁棒自适应优化方法
CN107490962A (zh) * 2017-08-08 2017-12-19 北京理工大学 一种数据驱动的伺服系统最优控制方法
CN107728465A (zh) * 2017-09-12 2018-02-23 北京理工大学 一种基于混合系统的自适应优化控制方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
JINGANG ZHAO 等: "Adaptive optimal control for a class of uncertain systems with saturating actuators and external disturbance using integral reinforcement learning", 《2017 11TH ASIAN CONTROL CONFERENCE》 *
JINGANG ZHAO: "Optimization based on motion planning of nonholonomic nonlinear systems using global adaptive dynamic programming", 《2016 31ST YOUTH ACADEMIC ANNUAL CONFERENCE OF CHINESE ASSOCIATION OF AUTOMATION》 *
MENG ZHANG 等: "Adaptive dynamic programming and optimal stabilization for linear systems with time-varying uncertainty", 《2017 11TH ASIAN CONTROL CONFERENCE》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110888323A (zh) * 2019-11-26 2020-03-17 大连理工大学 一种用于切换系统智能优化的控制方法
CN111665719A (zh) * 2020-06-11 2020-09-15 大连海事大学 一种具有时效性与稳定性的补给船同步控制算法
CN111665719B (zh) * 2020-06-11 2022-11-22 大连海事大学 一种具有时效性与稳定性的补给船同步控制算法
CN113325705A (zh) * 2021-04-30 2021-08-31 同济大学 一种线性切换系统的砰-砰控制方法
CN113325705B (zh) * 2021-04-30 2022-09-30 同济大学 一种线性切换系统的砰-砰控制方法

Also Published As

Publication number Publication date
CN109116731B (zh) 2020-07-07

Similar Documents

Publication Publication Date Title
CN109116731A (zh) 一种切换线性系统的数据驱动最优控制方法
Biradar et al. Reduced-order modeling of linear time invariant systems using big bang big crunch optimization and time moment matching method
Zou et al. Design of fractional order predictive functional control for fractional industrial processes
Spall An overview of the simultaneous perturbation method for efficient optimization
Shinbrot et al. Using the sensitive dependence of chaos (the ‘‘butterfly effect’’) to direct trajectories in an experimental chaotic system
Chai et al. A novel global MPPT technique using improved PS-FW algorithm for PV system under partial shading conditions
Swinburne et al. Unsupervised calculation of free energy barriers in large crystalline systems
CN106502092A (zh) 一种采用改进混合粒子群算法的热工过程模型参数辨识方法
CN104573248A (zh) 基于emd的光纤陀螺温度漂移多尺度极限学习机训练方法
CN109754013B (zh) 一种基于无迹卡尔曼滤波的电力系统混合量测融合方法
CN104933307A (zh) 基于粒子群优化算法的太阳电池隐式方程参数辨识方法
CN108710301A (zh) 一种采用Maxwell模型对压电陶瓷作动器迟滞非线性在线辨识和补偿的方法及系统
Adel et al. Model order reduction using artificial neural networks
CN114861881A (zh) 一种应用机器学习优化超冷原子蒸发冷却参数的方法
Zhao et al. Nonlinear state estimation for fermentation process using cubature Kalman filter to incorporate delayed measurements
Chen Robust design with dynamic characteristics using stochastic sequential quadratic programming
CN113945997A (zh) 一种基于解析四维集合变分的提高海洋预报精度的方法
de Koning et al. Efficient free-energy calculations by the simulation of nonequilibrium processes
CN108052003A (zh) 基于光电平台精确模型的自抗扰控制器设计系统
CN108520141B (zh) 一种压电陶瓷作动器的迟滞非线性模拟方法
Yan et al. Adaptive neural network control for a class of strict feedback non-linear time delay systems
Chithapuram et al. Artificial Intelligence learning based on proportional navigation guidance
Wu et al. Two-dimensional temperature distribution estimation for a cross-flow planar solid oxide fuel cell stack
Liu et al. Differential evolution algorithm based on simulated annealing
CN102221373B (zh) 基于自由节点递推b样条的传感器非线性补偿方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant