CN113608437A - 具有丢包和多时滞的网络控制系统的最优控制研究方法 - Google Patents

具有丢包和多时滞的网络控制系统的最优控制研究方法 Download PDF

Info

Publication number
CN113608437A
CN113608437A CN202110798111.1A CN202110798111A CN113608437A CN 113608437 A CN113608437 A CN 113608437A CN 202110798111 A CN202110798111 A CN 202110798111A CN 113608437 A CN113608437 A CN 113608437A
Authority
CN
China
Prior art keywords
equation
formula
controller
optimal
matrix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110798111.1A
Other languages
English (en)
Other versions
CN113608437B (zh
Inventor
梁笑
吕传志
刘瑞国
高学辉
张桂林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Linyi University
Original Assignee
Shandong University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong University of Science and Technology filed Critical Shandong University of Science and Technology
Priority to CN202110798111.1A priority Critical patent/CN113608437B/zh
Publication of CN113608437A publication Critical patent/CN113608437A/zh
Application granted granted Critical
Publication of CN113608437B publication Critical patent/CN113608437B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/042Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Feedback Control In General (AREA)

Abstract

本发明公开了一种具有丢包和多时滞的网络控制系统的最优控制研究方法,属于网络控制领域。本文分析了带有乘性噪声、丢包、输入和量测时滞的离散网络控制系统中的最优输出反馈控制和镇定性问题。对于带有丢包和量测时滞的乘性噪声系统,首次给出了递归的最优估计器。基于该估计器,利用极大值原理求得了最优输出反馈控制器。同时给出了有限时间范围内最优控制问题可解的充分必要条件。最后,基于标准的可观性假设,证明了在均方意义下设计的控制器可以使得系统方程镇定,当且仅当耦合的黎卡提方程有唯一解。

Description

具有丢包和多时滞的网络控制系统的最优控制研究方法
技术领域
本发明属于网络控制领域,具体涉及一种具有丢包和多时滞的网络控制系统的最优控制 研究方法。
背景技术
网络控制系统(NCSs)是一种反馈控制系统,该系统的控制环通过一个共享通信网络形 成闭合回路,且在通信网络中,系统信号(如参考输入、控制输入、设备输出等)可以在所 有的系统组件(如传感器、控制器、执行器等)中进行传输。与传统的控制系统相比,网络控制系统具有布线少、成本低、系统灵活性高和可维护性强等特点,因此在工业控制、过程控制、工程系统、航空航天系统、智能系统等实际应用中得到广泛的发展。
近年来出现了很多关于网络控制系统的热点问题,其中包括网络安全、容错网络控制系 统、分散和分布式网络控制系统、云网络控制系统等。在这些控制系统中经常出现丢包和网 络时滞的情形,这是由于节点故障或信息冲突以及信号采样或接收延迟所导致的。值得注意 的是,如果丢包和时滞超过了一定的期望值,装置或者设备可能会受到损坏,或者性能有所 下降。考虑到控制信号的传输经过一个不可靠的信道时,通过使用随机极大值原理,给出了 控制输入存在时滞时的最优控制器。针对具有量测丢包的网络控制系统,给出了最优估计器 的递推式和最优控制器的显示解。当系统输入不仅存在时滞,也存在从控制器到执行器之间 传输的数据丢包时,通过利用动态规划方法,给出了最优控制器的显式解。针对具有信息不 对称的网络控制系统,通过引入极大值原理,分别给出了有限时间和无限时间内的最优控制 问题可解的充分必要条件。
可以看出,以上的这些研究所讨论的问题都不够完善,对于带有乘性噪声的网络控制系 统,当有丢包和多时滞发生时,特别是系统中存在量测时滞时,很少有文章对此进行研究。 当系统中没有量测时滞时,最优估计器可以直接用量测数据进行设计,并且基于设计的估计 器可以求解最优控制器,分析稳定性问题。但是,上述研究成果有一个共同的缺陷,即没有 考虑系统中有量测时滞的情况,这使得所求得的控制器在实际中的应用有一定的局限性。本 文所讨论的问题如图1所示,当传感器的信号通过一个不可靠的信道进行传输时,会产生量 测丢包和量测时滞,而且在控制器到执行器的信号传输过程中存在输入时滞。由于量测时滞 的存在,量测数据{yk}不能直接用于估计器的设计。而且基于现有的估计器,最优输出反馈 控制器无法求解。换句话说,当系统中同时存在丢包和多时滞时,输出反馈控制和稳定性问 题将会变得更加的复杂。
发明内容
针对现有技术中存在的上述技术问题,本发明提出了一种具有丢包和多时滞的网络控制 系统的最优控制研究方法,设计合理,克服了现有技术的不足,具有良好的效果。
为了实现上述目的,本发明采用如下技术方案:
具有丢包和多时滞的网络控制系统的最优控制研究方法,首先给出如下定义:符号
Figure BDA0003163542730000021
表 示n维欧氏空间;上标'表示矩阵的转置;实数矩阵M>0表示矩阵M是正定的;实数矩阵M≥0 表示矩阵M是半正定的;
Figure BDA0003163542730000022
表示指示函数,即当元素
Figure BDA00031635427300000219
时,有
Figure BDA0003163542730000023
否则有
Figure BDA0003163542730000024
是由随机过程X所产生的自然滤波;E[·]是数学期望且
Figure BDA0003163542730000025
是关于
Figure BDA0003163542730000026
的条件期望;P(X)表 示当事件X发生时的概率;I表示单位矩阵;δkl表示克罗内克函数,即当k=l时有δkl=1,否 则有δkl=0;
所述方法具体包括如下步骤:
步骤1:利用带有时滞的量测数据{yk}设计出了最优估计器;
步骤2:利用极大值原理,解出了最优控制器,并给出了有限时间范围内可解的充分必 要条件;且最优控制器的增益为耦合的黎卡提方程的解;
步骤3:通过定义一个李雅普诺夫函数,得出系统在均方意义下是可镇定的,当且仅当 给定的耦合的黎卡提方程有唯一解。
优选地,在步骤2中,具体设计如下:
有限时间的情况
问题描述
考虑下面带有丢包、输入时滞和量测时滞的乘性噪声系统:
Figure BDA0003163542730000027
yk=ωkxk-θ, (2);
其中,
Figure BDA0003163542730000028
代表状态向量,
Figure BDA0003163542730000029
代表控制器,
Figure BDA00031635427300000210
代表其协方差为
Figure BDA00031635427300000211
的标 量高斯白噪声;
Figure BDA00031635427300000212
代表量测过程,ωk是服从概率为P(ωk=1)=p=1-q∈[0,1]的伯努利分布; A,
Figure BDA00031635427300000213
B,
Figure BDA00031635427300000214
是具有适当维数的常值矩阵,d和θ(>0)分别表示输入时滞和量测时滞;初始值x0表 示均值为μ,协方差为Θ的高斯随机向量,初始控制器ui,i=-d,...,θ-1的值是已知的,而且
Figure BDA00031635427300000215
k}和x0彼此相互独立;
系统(1)和(2)的性能指标定义为:
Figure BDA00031635427300000216
其中,常值矩阵
Figure BDA00031635427300000217
分别是用来平衡状态向量和输入向量的权重矩阵, xN+1为终端状态向量,
Figure BDA00031635427300000218
为有界的常数终端加权矩阵;
对于具有丢包和多时滞的乘性噪声系统,控制器uk只允许访问量测过程{yθ,...,yk},也 就是说,uk
Figure BDA0003163542730000031
可量测的;为了方便起见,将
Figure BDA0003163542730000032
表示为
Figure BDA0003163542730000033
同时,将
Figure BDA0003163542730000034
表示为
Figure BDA0003163542730000035
Figure BDA0003163542730000036
表示为
Figure BDA0003163542730000037
问题1对于系统(1)和(2),利用量测数据{yk},找到一个
Figure BDA0003163542730000038
可量测的控制器uk使得目标函数(3)最小;
为了确保问题的可解性,给出下面的假设:
假设1目标函数(3)中矩阵满足Q≥0,R>0和MN+1≥0;
最优估计
在求解最优控制器之前,首先给出最优估计器的表达式;为了表示方便,将估计器表示 为
Figure BDA0003163542730000039
下面给出本小节的重要定理:
定理1对于系统的状态方程(1)和量测方程(2),最优估计器的递推式为:
Figure BDA00031635427300000310
其中
Figure BDA00031635427300000311
初始值为
Figure BDA00031635427300000312
且有
Figure BDA00031635427300000313
和P(ψk=1)=q=1-p,θ≤k≤N,
Figure BDA00031635427300000314
表示指示函数;
除此之外,由系统方程(1)能够直接计算得到
Figure BDA00031635427300000315
证首先计算最优估计器的初始值
Figure BDA00031635427300000316
令yθ=ωθx0=h,则由条件期望的定义得到
Figure BDA00031635427300000317
其中,P(xθ=ri|yθ=h)表示在yθ=h发生的情况下xθ取值为ri的条件概率;下面进行讨论:
1)对于量测数据yθ,当出现数据丢包时,也就是说yθ=h=0,此时有 P(xθ=ri,yθ=0)=P(xθ=ri)P(yθ=0),则由(5)能够得到
Figure BDA00031635427300000318
2)当没有发生丢包时,也即yθ=h≠0,则由(5)能够得到
Figure BDA00031635427300000319
因此,结合式(6)和(7),估计器的初始值表示为
Figure BDA0003163542730000041
由于系统噪声
Figure BDA0003163542730000042
和{ωk}是相互独立的,则通过系统状态方程(1)得到
Figure BDA0003163542730000043
下面进一步分析最优估计器的一般形式
Figure BDA0003163542730000044
θ≤k≤N;
为了方便起见,令Yk={yθ,...,yk};类比式(5),利用条件期望的定义,可得
Figure BDA0003163542730000045
分类讨论如下:
1)若yθ=yθ+1...=yk=0,则有
P(xk=ri,yθ=0,yθ+1=0,...,yk=0)=P(xk=ri)P(yθ=0,yθ+1=0,...,yk=0);
因此,根据式(8)可得
E[xk|yθ=hθ,yθ+1=hθ+1,...,yk=hk]=Exk(9);
2)若有yk=hk=0,
Figure BDA0003163542730000046
Figure BDA0003163542730000047
其中{θ,θ+1,...,k-1}= {iθ,iθ+1,...,ik-1},iθ<iθ+1<...<ij;此时有
Figure BDA0003163542730000048
Figure BDA0003163542730000049
则根据式(8)可得
Figure BDA00031635427300000410
3)若k时刻没有数据丢包,即yk=hk≠0,估计器能够表示为
Figure BDA00031635427300000411
其中yk=ωkxk-θ,且上式第二行利用了状态{xk}的马尔可夫特性;
由式(1)和(11)可得
Figure BDA00031635427300000412
同理可得
Figure BDA00031635427300000413
则由式(12)和(13),式(11)中的估计器
Figure BDA00031635427300000414
能够写成递推的形式,如下:
Figure BDA0003163542730000051
综上所述,由式(9)-(11)可得最优估计器的形式为
Figure BDA0003163542730000052
同时由系统方程(1)直接计算可得
Figure BDA0003163542730000053
下面对式(14)作进一步的化简;利用指示函数的特性可知
Figure BDA0003163542730000054
Figure BDA0003163542730000055
因此,当yθ=yθ+1...=yk=0时,由式(16),式(14)能够写为
E[xk|yθ,...,yk]=Exk=AE[xk-1|Yk-1]+Buk-d-1 (18);
同时,若有
Figure BDA0003163542730000056
其中iθ<iθ+1<...<ij<...≤ik-1,则
1)当ij<k-1时,即
Figure BDA0003163542730000057
且yk-1=0,由式(17),式(14)能够写为
Figure BDA0003163542730000058
2)当ij=k-1时,即yk-1≠0,由式(17),式(14)能够写为
Figure BDA0003163542730000059
因此,由式(14),(18)-(20),并将
Figure BDA00031635427300000510
定义为ψk,得到最优估计器的递推形式为
Figure BDA00031635427300000511
上式即为式(4);
最优输出反馈控制
为了得到问题1的解,对系统状态方程(1)和目标函数(3)应用极大值原理得到如下 的共态方程:
λN=MN+1xN+1 (21);
Figure BDA00031635427300000512
Figure BDA00031635427300000513
其中
Figure BDA00031635427300000514
下面给出问题1完整的解;
定理2基于假设1,对于系统(1)和(2,问题1有唯一的解,当且仅当矩阵Δk>0, k=d+θ,...,N;且设计的令目标函数(3)最小的最优输出反馈控制器为
Figure BDA00031635427300000515
其中估计器
Figure BDA0003163542730000061
满足下式
Figure BDA0003163542730000062
估计器
Figure BDA0003163542730000063
已经在定理1中给出,且增益Δk+d和Γk+d满足
Figure BDA0003163542730000064
Figure BDA0003163542730000065
在式(25)和(26)中,矩阵
Figure BDA0003163542730000066
Ψkk满足下列的黎卡提差分方程
Figure BDA0003163542730000067
Figure BDA0003163542730000068
Figure BDA0003163542730000069
Figure BDA00031635427300000610
Φk=(1-q)A′Ψk+1A+A′Φk+1A, (31);
式(27)-(31)中的终端条件为
Figure BDA00031635427300000611
同时可得式(3)中的最优目标函数为
Figure BDA00031635427300000612
且状态和共态之间的关系满足下式
Figure BDA00031635427300000613
推论令
Figure BDA00031635427300000614
对式(27)-(31)两端从i=3到d+1进行累加,得到下面耦合的黎卡提方程
Figure BDA00031635427300000615
Figure BDA00031635427300000616
Figure BDA00031635427300000617
Φk=(1-q)A′Ψk+1A+A′Φk+1A, (37);
上式中的终端值为ΞN+1=ΠN+1=MN+1,且矩阵Δk和Γk能够直接计算得到
Figure BDA00031635427300000618
Figure BDA00031635427300000619
下面给出定理2的证明:
证首先给出必要性的证明,即在假设1的前提下,如果问题1有唯一解,式(25)中的矩阵Δk,d+θ≤k≤N是严格正定的;定义新的目标函数为
Figure BDA0003163542730000071
令式(40)中的k=N,得到
J(N)=E[xN′QxN+uN-d′RuN-d]+xN+1′MN+1xN+1
将系统的状态方程(1)代入上式,则J(N)能够写成状态xN和控制器uN-d的二次型形式, 且由于控制器解的唯一性,该二次型必然是正定的;令状态xN=0,得到
Figure BDA0003163542730000072
因此ΔN>0成立;
下面计算最优控制器;由式(1)和(21),平衡方程(23)能够写为
Figure BDA0003163542730000073
因此,当k=N时的最优控制器为
Figure BDA0003163542730000074
明显式(41)满足式(24);
接下来说明k=N时的共态方程具有式(33)的形式;利用式(1)、(21)、(22)和(41),得到
Figure BDA0003163542730000075
上式满足式(33),且矩阵MN 1
Figure BDA0003163542730000076
分别满足式(27)和(28);
为了进一步分析一般情况,并利用数学归纳法,取d+θ≤l≤N,当k≥l+1,假设式(25) 中的矩阵是正定的,且控制器uk-d和共态λk-1的表达式为式(24)和(33);接下来证明该情形 在k=l时也成立;
首先需要证明矩阵Δl的可逆性;由式(1)、(22)和(23),得到
Figure BDA0003163542730000077
将上式从k=l+1到N进行累加,得到
Figure BDA0003163542730000078
利用上式以及式(21),并令式(40)中的k=l,则J(l)表示成
Figure BDA0003163542730000079
Figure BDA0003163542730000081
将式(33)代入上式,并令xl=0,则J(l)被写成
Figure BDA0003163542730000082
由于最优控制器解ul-d的唯一性,则式(25)中矩阵Δl是严格正定的,也即Δl>0成立;
下面求解最优控制器;将式(33)代入式(23)得到
Figure BDA0003163542730000083
则最优控制器的解为
Figure BDA0003163542730000084
其中矩阵Δl和Γl分别满足式(25)和(26);因此,最优控制器(24)在k=l时也成立;
最后证明状态和共态之间的关系式满足式(33),如下:
Figure BDA0003163542730000085
显然该式成立;这就完成了必要性的证明;
下面给出充分性的证明,即当式(25)中的矩阵Δk>0,k=d+θ,...,N时,证明问题1有 唯一解;定义
Figure BDA0003163542730000086
则由式(1)、(25)-(31),能够计算得到VN(k+1,xk+1)如下
Figure BDA0003163542730000087
Figure BDA0003163542730000091
令VN(k,xk)和VN(k+1,xk+1)作差,得到
Figure BDA0003163542730000092
对式(41)两端从k=d+θ到N进行累加,得到
Figure BDA0003163542730000093
利用上式将目标函数写为
Figure BDA0003163542730000094
在上式中,x0,ui,i=-d,...,θ-1已经初始化,对于0≤k≤d+θ-1,xk能够由初始值进行求 解,且矩阵Δk是严格正定的;因此,令目标函数取到最小值,最优控制器的唯一性即可得证, 且满足式(24)。
优选地,在步骤3中,具体设计如下:
无限时间的情况
问题描述
为了分析系统的镇定性,求解系统(1)和(2)在无限时间时的镇定问题;当N→+∞时 考虑如下的性能指标:
Figure BDA0003163542730000101
首先给出下面几个重要的定义:
定义1对于给定的初始值x0,u-d,...,uθ-1,且控制器uk-d=0,k≥d+θ,如果有
Figure BDA0003163542730000102
则称方程(1)为渐进均方稳定的;
定义2方程(1)在均方意义下是可镇定的,当存在一个
Figure BDA0003163542730000103
可量测的控制器
Figure BDA0003163542730000104
k≥θ,其中L和Li(i=1,...,d+θ)是常值矩阵,且满足
Figure BDA0003163542730000105
使得 (1)的闭环系统是渐进均方稳定的;
定义3对于下面的随机系统
Figure BDA0003163542730000106
为了方便起见,将上述系统简记为
Figure BDA0003163542730000107
基于假设1,有Q=C'C成立;如果有下式成立
Figure BDA0003163542730000108
则称系统
Figure BDA0003163542730000109
是完全可观测的;
问题2找到一个
Figure BDA00031635427300001010
可测的控制器uk-d使得系统(1)是渐进均方稳定的,同时使得 目标函数(44)最小;
假设2
Figure BDA00031635427300001011
是完全可观测的;
问题2的解
为了表述清晰,将矩阵Δkk,
Figure BDA00031635427300001012
Ψkkkk写为Δk(N),Γk(N),
Figure BDA00031635427300001013
Ψk(N), Φk(N),Ξk(N),Πk(N);由于终端值MN+1=0,故上述矩阵都为时不变矩阵;
下面给出几个重要引理:
引理1基于假设1,得到Πk(N)≥Ξk(N)≥0,
Figure BDA00031635427300001014
Φk(N)<0和
Figure BDA00031635427300001015
证在定理1中已经证得了Δk(N)>0,k≥d+θ,由式(28)-(31)能够直接观察得出矩阵
Figure BDA00031635427300001016
Ψk(N),Φk(N)都是负定的;接下来证明Πk(N)≥Ξk(N)≥0和
Figure BDA00031635427300001019
成立;定义
Figure BDA00031635427300001017
其中m≥d+θ;由式(3)和(32)能够类比得到式(45)的最优解为
Figure BDA00031635427300001018
Figure BDA0003163542730000111
对式(46)分析如下:
Figure BDA0003163542730000112
其中有
Figure BDA0003163542730000113
同理可得
Figure BDA0003163542730000114
Figure BDA0003163542730000115
则由式(46)-(49);得到
Figure BDA0003163542730000116
由于状态xd+θ是随机变量,因此,得到
Ξd+θ(m)≥0;
也即
Figure BDA0003163542730000117
由定理2看出
Figure BDA0003163542730000118
则必有
Figure BDA0003163542730000119
利用Ξd+θ(m),
Figure BDA00031635427300001110
Figure BDA00031635427300001111
的时 不变特性,令m=N+d+θ-k,则有Ξk(N)=Ξd+θ(N+d+θ-k)≥0,
Figure BDA00031635427300001112
Figure BDA00031635427300001113
因此不等式Πk(N)≥Ξk(N)≥0,
Figure BDA00031635427300001114
Figure BDA00031635427300001115
也成立;
引理2基于假设1和2,存在一个常数N0>0,使得当N>N0时,有Ξd+θ(N)>0;
证对于式(46),选定状态向量xd+θ(≠0),则有
Figure BDA00031635427300001116
假设Ξd+θ(N)=0成立,那么式(46)能够写为
Figure BDA00031635427300001117
其中
Figure BDA00031635427300001118
Figure BDA00031635427300001119
分别代表最优状态策略和最优控制器;由假设1可知,Q=C'C≥0且R>0, 再由式(51)能够观察得出
Figure BDA00031635427300001120
则系统方程(1)能够写成
Figure BDA0003163542730000121
基于定义3和假设2,得到xd+θ=0,矛盾;因此假设不成立,则有N0>0,使得当N>N0时,有Ξd+θ(N)>0成立;
引理3系统方程(1)是可镇定的,当且仅当不等式
Figure BDA0003163542730000122
成立;
证首先给出充分性的证明;显然,如果
Figure BDA0003163542730000123
成立,则必有
Figure BDA0003163542730000124
基于 定义2可知系统方程(1)是可镇定的;
下面证明必要性,即若系统方程(1)是可镇定的,则不等式
Figure BDA0003163542730000125
成立;
由定义2可知,存在
Figure BDA0003163542730000126
使得系统方程(1)是渐进均方稳定的;定 义如下矩阵
Figure BDA0003163542730000127
Figure BDA0003163542730000128
利用上述矩阵可将系统方程(1)转变为一个新的状态方程为
Figure BDA0003163542730000129
且控制器uk能够写为
Figure BDA00031635427300001210
将式(53)代入式(52)得到
Figure BDA00031635427300001211
回顾定义2可知,控制器
Figure BDA0003163542730000131
可使系统方程(1)渐进均方稳定,也即存在
Figure BDA0003163542730000132
同时,我们能够得到
Figure BDA00031635427300001315
则由式(54)能够直接得到
Figure BDA0003163542730000133
且有
Figure BDA0003163542730000134
因此可得
Figure BDA0003163542730000135
利用式(55),能够得到
Figure BDA0003163542730000136
也即
Figure BDA0003163542730000137
定理3系统方程在均方意义下是可镇定的,当且仅当推论中耦合的黎卡提方程有唯一解, 且有Π≥Ξ>0,M1≥0,Ψ,Φ≤0和Mj≤0,j=2,...,d+1:
Figure BDA0003163542730000138
Figure BDA0003163542730000139
Ψ=-(A′)dΓ′Δ-1ΓAd+qA′ΨA (58);
Φ=(1-q)A′ΨA+A′ΦA (59);
其中Δ和Γ为
Figure BDA00031635427300001310
Figure BDA00031635427300001311
使系统镇定的控制器为
Figure BDA00031635427300001312
式(44)对应的最优目标函数为
Figure BDA00031635427300001313
其中
Figure BDA00031635427300001314
下面给出定理3的证明:
必要性:即若系统方程(1)是均方可镇定的,则式(34)-(39)中耦合的黎卡提方程有唯一解,且Π≥Ξ>0,Ψ,Φ≤0;
首先给出矩阵Ξd+θ(N),Πd+θ(N),Ψd+θ(N)和Φd+θ(N)关于N的单调性证明;回顾式(32)和(42), 最优目标函数能够写为
Figure BDA0003163542730000141
其中,
Figure BDA0003163542730000142
且uj=0,j=-d,...,-1,
Figure BDA0003163542730000143
Figure BDA0003163542730000144
下面对式(65)进行讨论:
1)如果有x0=Ex0成立,则由定理1可以得到
Figure BDA0003163542730000145
那么式(65)能够写为
Figure BDA0003163542730000146
由于J*(N)≤J*(N+1)能够得到
Figure BDA0003163542730000147
也即 Π0(N)≤Π0(N+1)成立;
2)如果有Ex0=0成立,能够得到
Figure BDA0003163542730000148
类比上述分析得
Figure BDA0003163542730000149
3)对于给定的xd+θ,由式(46),令m=N,可有H*(N)≤H*(N+1),则可得
Figure BDA00031635427300001410
也即Ξd+θ(N)≤Ξd+θ(N+1)成立;
综上所述,看出Π0(N),
Figure BDA00031635427300001411
和Ξd+θ(N)关于N是单调递增的;
下面证明上述矩阵是有界的;由定义2知,存在控制器
Figure BDA00031635427300001412
使得系统方程(1)镇 定;选定一常数λ使得Q≤λI,
Figure BDA00031635427300001413
成立;则有
Figure BDA00031635427300001414
其中c和c1是常数;因此,得到
Figure BDA0003163542730000151
再由式(50),可知
Figure BDA0003163542730000152
上式表明矩阵Ξd+θ(N)是有界的;
类比式(65)进行如下讨论:
1)若x0=Ex0,则有
Figure BDA0003163542730000153
故有
Figure BDA0003163542730000154
上式表明矩阵
Figure BDA0003163542730000155
是有界的;
2)若Ex0=0,则有
Figure BDA0003163542730000156
故有
Figure BDA0003163542730000157
得出
Figure BDA0003163542730000158
也是有界的;
综上可知矩阵Ξd+θ(N),Π0(N),
Figure BDA0003163542730000159
Ψ0(N)和Φ0(N)都是收敛的;且上述矩阵都是时不变矩 阵,即有
Ξd+θ(N)=Ξ0(N-d-θ),Πd+θ(N)=Π0(N-d-θ);
Figure BDA00031635427300001510
Ψd+θ(N)=Ψ0(N-d-θ);
Φd+θ(N)=Φ0(N-d-θ);
因此,存在矩阵Ξ,Π,M1,Ψ和Φ,满足
Figure BDA00031635427300001511
Figure BDA00031635427300001512
Figure BDA00031635427300001513
同时,在式(25),(26),(28)和(29)两端取极限也可得到收敛值为
Figure BDA00031635427300001514
Figure BDA00031635427300001515
因此,当时间变量N→+∞,式(56)-(61)是成立的;且利用引理1和2直接得到,Π≥Ξ>0, M1≥0,Ψ<0,Φ<0和Mj≤0,j=2,...,d+1;
最后证明式(56)-(59)的解是唯一的;现假设存在另外一组解H,F,P和K也满足式(56)-(59);当有x0=Ex0时,对式(66)两端取极限,得到
J*(N)=E(x′0Πx0)=E(x′0Fx0);
则有Π=F;而且若有Ex0=0,可得
J*(N)=E{x′00(N)-qΨ0(N)-qΦ0(N)]x0}
=E{x′0[F0(N)-qP0(N)-qK0(N)]x0};
由式(30)和(31),看出Φk(N)依赖于Ψk(N),也即若Ψ0(N)≠P0(N),则有Φ0(N)≠K0(N),这 与上述方程式矛盾;故在该方程两侧取极限得到Ψ=P,Φ=K;同时,对于给定的xd+θ,在式 (51)两端取极限,直接得到E(x′d+θΞxd+θ)=E(x′d+θHxd+θ),则有Ξ=H;综上可知式(56)-(61) 的解是唯一的;
充分性:若式(56)-(61)中耦合的黎卡提方程有唯一解,则控制器(62)能够使得系统方程(1)镇定;
首先,令
Figure BDA0003163542730000161
同时经计算也能够得到
Figure BDA0003163542730000162
则对k≥d+θ,有
Figure BDA0003163542730000163
Figure BDA0003163542730000164
从式(69)看出,控制器
Figure BDA0003163542730000165
满足式(62),且函数V(k,xk)关于N是单调递减的; 同时经计算可得到
Figure BDA0003163542730000166
上式表明函数V(k,xk)是有界的,由单调有界原理可知函数V(k,xk)是收敛的;
因此,通过式(69)得到
Figure BDA0003163542730000171
再由式(50)可得
Figure BDA0003163542730000172
在式(71)两端取极限并利用式(70),可得
Figure BDA0003163542730000173
利用引理2知Ξd+θ(N)>0,则有
Figure BDA0003163542730000174
也即式(62)中的控制器能够使得系统方程 (1)镇定;
接下来证明控制器(62)可使目标函数(44)最小为(63);对式(68)两端从k=0到N进行累加,得到
Figure BDA0003163542730000175
其中V(0,x0)和V(N+1,xN+1)已在式(67)中给出定义;利用射影定理可有
Figure BDA0003163542730000176
我们已经得到控制器(62)能够使得系统(1)镇定,因此有
Figure BDA0003163542730000177
Figure BDA0003163542730000178
在式(72)两端对N取极限,目标函数(44)能够写为
Figure BDA0003163542730000179
通过以上的分析,控制器(62)可以使得目标函数(44)最小,且最优目标函数为式(63)。
本发明所带来的有益技术效果:
本文分析了带有乘性噪声、丢包、输入和量测时滞的离散网络控制系统中的最优输出反 馈控制和镇定性问题。对于带有丢包和量测时滞的乘性噪声系统,首次给出了递归的最优估 计器。基于该估计器,利用极大值原理求得了最优输出反馈控制器。同时给出了有限时间范 围内最优控制问题可解的充分必要条件。最后,基于标准的可观性假设,证明了在均方意义 下设计的控制器可以使得系统方程镇定,当且仅当耦合的黎卡提方程有唯一解。
附图说明
图1为带有丢包和多时滞的网络控制系统图。
图2为控制器为
Figure BDA0003163542730000181
时系统的状态轨迹E(x′kxk)图。
图3为控制器为
Figure BDA0003163542730000182
时系统的状态轨迹E(x′kxk)图。
具体实施方式
下面结合附图以及具体实施方式对本发明作进一步详细说明:
具有丢包和多时滞的网络控制系统的最优控制研究方法,首先给出如下定义:符号
Figure BDA0003163542730000183
表 示n维欧氏空间;上标'表示矩阵的转置;实数矩阵M>0表示矩阵M是正定的;实数矩阵M≥0 表示矩阵M是半正定的;
Figure BDA0003163542730000184
表示指示函数,即当元素
Figure BDA0003163542730000185
时,有
Figure BDA0003163542730000186
否则有
Figure BDA0003163542730000187
是由随机过程X所产生的自然滤波;E[·]是数学期望且
Figure BDA0003163542730000188
是关于
Figure BDA0003163542730000189
的条件期望;P(X)表 示当事件X发生时的概率;I表示单位矩阵;δkl表示克罗内克函数,即当k=l时有δkl=1,否 则有δkl=0;
所述方法具体包括如下步骤:
步骤1:利用带有时滞的量测数据{yk}设计出了最优估计器;
步骤2:利用极大值原理,解出了最优控制器,并给出了有限时间范围内可解的充分必 要条件;且最优控制器的增益为耦合的黎卡提方程的解;
步骤3:通过定义一个李雅普诺夫函数,得出系统在均方意义下是可镇定的,当且仅当 给定的耦合的黎卡提方程有唯一解。
在步骤2中,具体设计如下:
有限时间的情况
问题描述
考虑下面带有丢包、输入时滞和量测时滞的乘性噪声系统:
Figure BDA00031635427300001810
yk=ωkxk-θ, (2);
其中,
Figure BDA0003163542730000191
代表状态向量,
Figure BDA0003163542730000192
代表控制器,
Figure BDA0003163542730000193
代表其协方差为
Figure BDA0003163542730000194
的标 量高斯白噪声;
Figure BDA0003163542730000195
代表量测过程,ωk是服从概率为P(ωk=1)=p=1-q∈[0,1]的伯努利分布; A,
Figure BDA0003163542730000196
B,
Figure BDA0003163542730000197
是具有适当维数的常值矩阵,d和θ(>0)分别表示输入时滞和量测时滞;初始值x0表 示均值为μ,协方差为Θ的高斯随机向量,初始控制器ui,i=-d,...,θ-1的值是已知的,而且
Figure BDA0003163542730000198
k}和x0彼此相互独立;
系统(1)和(2)的性能指标定义为:
Figure BDA0003163542730000199
其中,常值矩阵
Figure BDA00031635427300001910
分别是用来平衡状态向量和输入向量的权重矩阵, xN+1为终端状态向量,
Figure BDA00031635427300001911
为有界的常数终端加权矩阵;
对于具有丢包和多时滞的乘性噪声系统,控制器uk只允许访问量测过程{yθ,...,yk},也 就是说,uk
Figure BDA00031635427300001912
可量测的;为了方便起见,将
Figure BDA00031635427300001913
表示为
Figure BDA00031635427300001914
同时,将
Figure BDA00031635427300001915
表示为
Figure BDA00031635427300001916
Figure BDA00031635427300001917
表示为
Figure BDA00031635427300001918
问题1对于系统(1)和(2),利用量测数据{yk},找到一个
Figure BDA00031635427300001919
可量测的控制器uk使得目标函数(3)最小;
为了确保问题的可解性,给出下面的假设:
假设1目标函数(3)中矩阵满足Q≥0,R>0和MN+1≥0;
最优估计
在求解最优控制器之前,首先给出最优估计器的表达式;为了表示方便,将估计器表示 为
Figure BDA00031635427300001920
下面给出本小节的重要定理:
定理1对于系统的状态方程(1)和量测方程(2),最优估计器的递推式为:
Figure BDA00031635427300001921
其中
Figure BDA00031635427300001922
初始值为
Figure BDA00031635427300001923
且有
Figure BDA00031635427300001924
和P(ψk=1)=q=1-p,θ≤k≤N,
Figure BDA00031635427300001925
表示指示函数;
除此之外,由系统方程(1)能够直接计算得到
Figure BDA00031635427300001926
证首先计算最优估计器的初始值
Figure BDA00031635427300001927
令yθ=ωθx0=h,则由条件期望的定义得到
Figure BDA0003163542730000201
其中,P(xθ=ri|yθ=h)表示在yθ=h发生的情况下xθ取值为ri的条件概率;下面进行讨论:
1)对于量测数据yθ,当出现数据丢包时,也就是说yθ=h=0,此时有 P(xθ=ri,yθ=0)=P(xθ=ri)P(yθ=0),则由(5)能够得到
Figure BDA0003163542730000202
2)当没有发生丢包时,也即yθ=h≠0,则由(5)能够得到
Figure BDA0003163542730000203
因此,结合式(6)和(7),估计器的初始值表示为
Figure BDA0003163542730000204
由于系统噪声
Figure BDA0003163542730000205
和{ωk}是相互独立的,则通过系统状态方程(1)得到
Figure BDA0003163542730000206
下面进一步分析最优估计器的一般形式
Figure BDA0003163542730000207
θ≤k≤N;
为了方便起见,令Yk={yθ,...,yk};类比式(5),利用条件期望的定义,可得
Figure BDA0003163542730000208
分类讨论如下:
1)若yθ=yθ+1...=yk=0,则有
P(xk=ri,yθ=0,yθ+1=0,...,yk=0)=P(xk=ri)P(yθ=0,yθ+1=0,...,yk=0);
因此,根据式(8)可得
E[xk|yθ=hθ,yθ+1=hθ+1,...,yk=hk]=Exk (9);
2)若有
Figure BDA0003163542730000209
Figure BDA00031635427300002010
其中{θ,θ+1,...,k-1}= {iθ,iθ+1,...,ik-1},iθ<iθ+1<...<ij;此时有
Figure BDA00031635427300002011
Figure BDA00031635427300002012
则根据式(8)可得
Figure BDA00031635427300002013
3)若k时刻没有数据丢包,即yk=hk≠0,估计器能够表示为
Figure BDA00031635427300002014
Figure BDA0003163542730000211
其中yk=ωkxk-θ,且上式第二行利用了状态{xk}的马尔可夫特性;
由式(1)和(11)可得
Figure BDA0003163542730000212
同理可得
Figure BDA0003163542730000213
则由式(12)和(13),式(11)中的估计器
Figure BDA0003163542730000214
能够写成递推的形式,如下:
Figure BDA0003163542730000215
综上所述,由式(9)-(11)可得最优估计器的形式为
Figure BDA0003163542730000216
同时由系统方程(1)直接计算可得
Figure BDA0003163542730000217
下面对式(14)作进一步的化简;利用指示函数的特性可知
Figure BDA0003163542730000218
Figure BDA0003163542730000219
因此,当yθ=yθ+1...=yk=0时,由式(16),式(14)能够写为
E[xk|yθ,...,yk]=Exk=AE[xk-1|Yk-1]+Buk-d-1 (18);
同时,若有
Figure BDA00031635427300002110
其中iθ<iθ+1<...<ij<...≤ik-1,则
1)当ij<k-1时,即
Figure BDA00031635427300002111
且yk-1=0,由式(17),式(14)能够写为
Figure BDA00031635427300002112
2)当ij=k-1时,即yk-1≠0,由式(17),式(14)能够写为
Figure BDA00031635427300002113
因此,由式(14),(18)-(20),并将
Figure BDA00031635427300002114
定义为ψk,得到最优估计器的递推形式为
Figure BDA00031635427300002115
上式即为式(4);
最优输出反馈控制
为了得到问题1的解,对系统状态方程(1)和目标函数(3)应用极大值原理得到如下 的共态方程:
λN=MN+1xN+1 (21);
Figure BDA0003163542730000221
Figure BDA0003163542730000222
其中
Figure BDA0003163542730000223
下面给出问题1完整的解;
定理2基于假设1,对于系统(1)和(2,问题1有唯一的解,当且仅当矩阵Δk>0, k=d+θ,...,N;且设计的令目标函数(3)最小的最优输出反馈控制器为
Figure BDA0003163542730000224
其中估计器
Figure BDA0003163542730000225
满足下式
Figure BDA0003163542730000226
估计器
Figure BDA0003163542730000227
已经在定理1中给出,且增益Δk+d和Γk+d满足
Figure BDA0003163542730000228
Figure BDA0003163542730000229
在式(25)和(26)中,矩阵
Figure BDA00031635427300002210
Ψkk满足下列的黎卡提差分方程
Figure BDA00031635427300002211
Figure BDA00031635427300002212
Figure BDA00031635427300002213
Figure BDA00031635427300002214
Φk=(1-q)A′Ψk+1A+A′Φk+1A, (31);
式(27)-(31)中的终端条件为
Figure BDA00031635427300002215
ΨN+1=0,ΦN+1=0;
同时可得式(3)中的最优目标函数为
Figure BDA00031635427300002216
且状态和共态之间的关系满足下式
Figure BDA00031635427300002217
推论令
Figure BDA00031635427300002218
对式(27)-(31)两端从i=3到d+1进行累加,得到下面耦合的黎卡提方程
Figure BDA0003163542730000231
Figure BDA0003163542730000232
Figure BDA0003163542730000233
Φk=(1-q)A′Ψk+1A+A′Φk+1A, (37);
上式中的终端值为ΞN+1=ΠN+1=MN+1,且矩阵Δk和Γk能够直接计算得到
Figure BDA0003163542730000234
Figure BDA0003163542730000235
下面给出定理2的证明:
证首先给出必要性的证明,即在假设1的前提下,如果问题1有唯一解,式(25)中的矩阵Δk,d+θ≤k≤N是严格正定的;定义新的目标函数为
Figure BDA0003163542730000236
令式(40)中的k=N,得到
J(N)=E[xN′QxN+uN-d′RuN-d]+xN+1′MN+1xN+1
将系统的状态方程(1)代入上式,则J(N)能够写成状态xN和控制器uN-d的二次型形式, 且由于控制器解的唯一性,该二次型必然是正定的;令状态xN=0,得到
Figure BDA0003163542730000237
因此ΔN>0成立;
下面计算最优控制器;由式(1)和(21),平衡方程(23)能够写为
Figure BDA0003163542730000238
因此,当k=N时的最优控制器为
Figure BDA0003163542730000239
明显式(41)满足式(24);
接下来说明k=N时的共态方程具有式(33)的形式;利用式(1)、(21)、(22)和(41),得到
Figure BDA00031635427300002310
上式满足式(33),且矩阵
Figure BDA00031635427300002311
Figure BDA00031635427300002312
分别满足式(27)和(28);
为了进一步分析一般情况,并利用数学归纳法,取d+θ≤l≤N,当k≥l+1,假设式(25) 中的矩阵是正定的,且控制器uk-d和共态λk-1的表达式为式(24)和(33);接下来证明该情形 在k=l时也成立;
首先需要证明矩阵Δl的可逆性;由式(1)、(22)和(23),得到
Figure BDA0003163542730000241
将上式从k=l+1到N进行累加,得到
Figure BDA0003163542730000242
利用上式以及式(21),并令式(40)中的k=l,则J(l)表示成
Figure BDA0003163542730000243
将式(33)代入上式,并令xl=0,则J(l)被写成
Figure BDA0003163542730000244
由于最优控制器解ul-d的唯一性,则式(25)中矩阵Δl是严格正定的,也即Δl>0成立;
下面求解最优控制器;将式(33)代入式(23)得到
Figure BDA0003163542730000245
则最优控制器的解为
Figure BDA0003163542730000246
其中矩阵Δl和Γl分别满足式(25)和(26);因此,最优控制器(24)在k=l时也成立;
最后证明状态和共态之间的关系式满足式(33),如下:
Figure BDA0003163542730000247
显然该式成立;这就完成了必要性的证明;
下面给出充分性的证明,即当式(25)中的矩阵Δk>0,k=d+θ,...,N时,证明问题1有 唯一解;定义
Figure BDA0003163542730000251
则由式(1)、(25)-(31),能够计算得到VN(k+1,xk+1)如下
Figure BDA0003163542730000252
令VN(k,xk)和VN(k+1,xk+1)作差,得到
Figure BDA0003163542730000253
对式(41)两端从k=d+θ到N进行累加,得到
Figure BDA0003163542730000254
利用上式将目标函数写为
Figure BDA0003163542730000255
Figure BDA0003163542730000261
在上式中,x0,ui,i=-d,...,θ-1已经初始化,对于0≤k≤d+θ-1,xk能够由初始值进行求 解,且矩阵Δk是严格正定的;因此,令目标函数取到最小值,最优控制器的唯一性即可得证, 且满足式(24)。
在步骤3中,具体设计如下:
无限时间的情况
问题描述
为了分析系统的镇定性,求解系统(1)和(2)在无限时间时的镇定问题;当N→+∞时 考虑如下的性能指标:
Figure BDA0003163542730000262
首先给出下面几个重要的定义:
定义1对于给定的初始值x0,u-d,...,uθ-1,且控制器uk-d=0,k≥d+θ,如果有
Figure BDA0003163542730000263
则称方程(1)为渐进均方稳定的;
定义2方程(1)在均方意义下是可镇定的,当存在一个
Figure BDA0003163542730000264
可量测的控制器
Figure BDA0003163542730000265
其中L和Li(i=1,...,d+θ)是常值矩阵,且满足
Figure BDA0003163542730000266
使得 (1)的闭环系统是渐进均方稳定的;
定义3对于下面的随机系统
Figure BDA0003163542730000267
为了方便起见,将上述系统简记为
Figure BDA0003163542730000268
基于假设1,有Q=C'C成立;如果有下式成立
Figure BDA0003163542730000269
则称系统
Figure BDA00031635427300002610
是完全可观测的;
问题2找到一个
Figure BDA00031635427300002611
可测的控制器uk-d使得系统(1)是渐进均方稳定的,同时使得 目标函数(44)最小;
假设2
Figure BDA00031635427300002612
是完全可观测的;
问题2的解
为了表述清晰,将矩阵Δkk,
Figure BDA00031635427300002613
Ψkkkk写为Δk(N),Γk(N),
Figure BDA00031635427300002614
Ψk(N), Φk(N),Ξk(N),Πk(N);由于终端值MN+1=0,故上述矩阵都为时不变矩阵;
下面给出几个重要引理:
引理1基于假设1,得到Πk(N)≥Ξk(N)≥0,
Figure BDA0003163542730000271
Φk(N)<0和
Figure BDA0003163542730000272
证在定理1中已经证得了Δk(N)>0,k≥d+θ,由式(28)-(31)能够直接观察得出矩阵
Figure BDA0003163542730000273
Ψk(N),Φk(N)都是负定的;接下来证明Πk(N)≥Ξk(N)≥0和
Figure BDA0003163542730000274
成立;定义
Figure BDA0003163542730000275
其中m≥d+θ;由式(3)和(32)能够类比得到式(45)的最优解为
Figure BDA0003163542730000276
对式(46)分析如下:
Figure BDA0003163542730000277
其中有
Figure BDA0003163542730000278
同理可得
Figure BDA0003163542730000279
Figure BDA00031635427300002710
则由式(46)-(49);得到
Figure BDA00031635427300002711
由于状态xd+θ是随机变量,因此,得到
Ξd+θ(m)≥0;
也即
Figure BDA00031635427300002712
由定理2看出
Figure BDA00031635427300002713
则必有
Figure BDA00031635427300002714
利用Ξd+θ(m),
Figure BDA00031635427300002715
Figure BDA00031635427300002716
的时 不变特性,令m=N+d+θ-k,则有Ξk(N)=Ξd+θ(N+d+θ-k)≥0,
Figure BDA00031635427300002717
Figure BDA00031635427300002718
因此不等式Πk(N)≥Ξk(N)≥0,
Figure BDA00031635427300002719
Figure BDA00031635427300002720
也成立;
引理2基于假设1和2,存在一个常数N0>0,使得当N>N0时,有Ξd+θ(N)>0;
证对于式(46),选定状态向量xd+θ(≠0),则有
Figure BDA0003163542730000281
假设Ξd+θ(N)=0成立,那么式(46)能够写为
Figure BDA0003163542730000282
其中
Figure BDA0003163542730000283
Figure BDA0003163542730000284
分别代表最优状态策略和最优控制器;由假设1可知,Q=C'C≥0且R>0, 再由式(51)能够观察得出
Figure BDA0003163542730000285
则系统方程(1)能够写成
Figure BDA0003163542730000286
基于定义3和假设2,得到xd+θ=0,矛盾;因此假设不成立,则有N0>0,使得当N>N0时,有Ξd+θ(N)>0成立;
引理3系统方程(1)是可镇定的,当且仅当不等式
Figure BDA0003163542730000287
成立;
证首先给出充分性的证明;显然,如果
Figure BDA0003163542730000288
成立,则必有
Figure BDA0003163542730000289
基于 定义2可知系统方程(1)是可镇定的;
下面证明必要性,即若系统方程(1)是可镇定的,则不等式
Figure BDA00031635427300002810
成立;
由定义2可知,存在
Figure BDA00031635427300002811
使得系统方程(1)是渐进均方稳定的;定 义如下矩阵
Figure BDA00031635427300002812
Figure BDA00031635427300002813
利用上述矩阵可将系统方程(1)转变为一个新的状态方程为
Figure BDA0003163542730000291
且控制器uk能够写为
Figure BDA0003163542730000292
将式(53)代入式(52)得到
Figure BDA0003163542730000293
回顾定义2可知,控制器
Figure BDA0003163542730000294
可使系统方程(1)渐进均方稳定,也即存在
Figure BDA0003163542730000295
同时,我们能够得到
Figure BDA0003163542730000296
则由式(54)能够直接得到
Figure BDA0003163542730000297
且有
Figure BDA0003163542730000298
因此可得
Figure BDA0003163542730000299
利用式(55),能够得到
Figure BDA00031635427300002910
也即
Figure BDA00031635427300002911
定理3系统方程在均方意义下是可镇定的,当且仅当推论中耦合的黎卡提方程有唯一解, 且有Π≥Ξ>0,M1≥0,Ψ,Φ≤0和Mj≤0,j=2,...,d+1:
Figure BDA00031635427300002912
Figure BDA00031635427300002913
Ψ=-(A′)dΓ′Δ-1ΓAd+qA′ΨA (58);
Φ=(1-q)A′ΨA+A′ΦA (59);
其中Δ和Γ为
Figure BDA00031635427300002914
Figure BDA00031635427300002915
使系统镇定的控制器为
Figure BDA00031635427300002916
式(44)对应的最优目标函数为
Figure BDA0003163542730000301
其中
Figure BDA0003163542730000302
下面给出定理3的证明:
必要性:即若系统方程(1)是均方可镇定的,则式(34)-(39)中耦合的黎卡提方程有唯一解,且Π≥Ξ>0,Ψ,Φ≤0;
首先给出矩阵Ξd+θ(N),Πd+θ(N),Ψd+θ(N)和Φd+θ(N)关于N的单调性证明;回顾式(32)和(42), 最优目标函数能够写为
Figure BDA0003163542730000303
其中,
Figure BDA0003163542730000304
且uj=0,j=-d,...,-1,
Figure BDA0003163542730000305
Figure BDA0003163542730000306
下面对式(65)进行讨论:
1)如果有x0=Ex0成立,则由定理1可以得到
Figure BDA0003163542730000307
那么式(65)能够写为
Figure BDA0003163542730000308
由于J*(N)≤J*(N+1)能够得到
Figure BDA0003163542730000309
也即 Π0(N)≤Π0(N+1)成立;
2)如果有Ex0=0成立,能够得到
Figure BDA00031635427300003010
类比上述分析得
Figure BDA00031635427300003011
3)对于给定的xd+θ,由式(46),令m=N,可有H*(N)≤H*(N+1),则可得
Figure BDA0003163542730000311
也即Ξd+θ(N)≤Ξd+θ(N+1)成立;
综上所述,看出Π0(N),
Figure BDA0003163542730000312
和Ξd+θ(N)关于N是单调递增的;
下面证明上述矩阵是有界的;由定义2知,存在控制器
Figure BDA0003163542730000313
使得系统方程(1)镇 定;选定一常数λ使得Q≤λI,
Figure BDA0003163542730000314
成立;则有
Figure BDA0003163542730000315
其中c和c1是常数;因此,得到
Figure BDA0003163542730000316
再由式(50),可知
Figure BDA0003163542730000317
上式表明矩阵Ξd+θ(N)是有界的;
类比式(65)进行如下讨论:
1)若x0=Ex0,则有
Figure BDA0003163542730000318
故有
Figure BDA00031635427300003115
上式表明矩阵
Figure BDA0003163542730000319
是有界的;
2)若Ex0=0,则有
Figure BDA00031635427300003110
故有
Figure BDA00031635427300003111
得出
Figure BDA00031635427300003112
也是有界的;
综上可知矩阵Ξd+θ(N),Π0(N),
Figure BDA00031635427300003113
Ψ0(N)和Φ0(N)都是收敛的;且上述矩阵都是时不变矩 阵,即有
Ξd+θ(N)=Ξ0(N-d-θ),Πd+θ(N)=Π0(N-d-θ);
Figure BDA00031635427300003114
Ψd+θ(N)=Ψ0(N-d-θ);
Φd+θ(N)=Φ0(N-d-θ);
因此,存在矩阵Ξ,Π,M1,Ψ和Φ,满足
Figure BDA0003163542730000321
Figure BDA0003163542730000322
Figure BDA0003163542730000323
同时,在式(25),(26),(28)和(29)两端取极限也可得到收敛值为
Figure BDA0003163542730000324
Figure BDA0003163542730000325
因此,当时间变量N→+∞,式(56)-(61)是成立的;且利用引理1和2直接得到,Π≥Ξ>0, M1≥0,Ψ<0,Φ<0和Mj≤0,j=2,...,d+1;
最后证明式(56)-(59)的解是唯一的;现假设存在另外一组解H,F,P和K也满足式(56)-(59);当有x0=Ex0时,对式(66)两端取极限,得到
J*(N)=E(x′0Πx0)=E(x′0Fx0);
则有Π=F;而且若有Ex0=0,可得
J*(N)=E{x′00(N)-qΨ0(N)-qΦ0(N)]x0}
=E{x′0[F0(N)-qP0(N)-qK0(N)]x0};
由式(30)和(31),看出Φk(N)依赖于Ψk(N),也即若Ψ0(N)≠P0(N),则有Φ0(N)≠K0(N),这 与上述方程式矛盾;故在该方程两侧取极限得到Ψ=P,Φ=K;同时,对于给定的xd+θ,在式 (51)两端取极限,直接得到E(x′d+θΞxd+θ)=E(x′d+θHxd+θ),则有Ξ=H;综上可知式(56)-(61) 的解是唯一的;
充分性:若式(56)-(61)中耦合的黎卡提方程有唯一解,则控制器(62)能够使得系统方程(1)镇定;
首先,令
Figure BDA0003163542730000326
同时经计算也能够得到
Figure BDA0003163542730000327
则对k≥d+θ,有
Figure BDA0003163542730000328
=E[x′kQxk+u′k-dRuk-d]≥0。 (69);
从式(69)看出,控制器
Figure BDA0003163542730000331
满足式(62),且函数V(k,xk)关于N是单调递减的; 同时经计算可得到
Figure BDA0003163542730000332
上式表明函数V(k,xk)是有界的,由单调有界原理可知函数V(k,xk)是收敛的;
因此,通过式(69)得到
Figure BDA0003163542730000333
再由式(50)可得
Figure BDA0003163542730000334
在式(71)两端取极限并利用式(70),可得
Figure BDA0003163542730000335
利用引理2知Ξd+θ(N)>0,则有
Figure BDA0003163542730000336
也即式(62)中的控制器能够使得系统方程 (1)镇定;
接下来证明控制器(62)可使目标函数(44)最小为(63);对式(68)两端从k=0到N进行累加,得到
Figure BDA0003163542730000337
其中V(0,x0)和V(N+1,xN+1)已在式(67)中给出定义;利用射影定理可有
Figure BDA0003163542730000338
Figure BDA0003163542730000341
我们已经得到控制器(62)能够使得系统(1)镇定,因此有
Figure BDA0003163542730000342
Figure BDA0003163542730000343
在式(72)两端对N取极限,目标函数(44)能够写为
Figure BDA0003163542730000344
通过以上的分析,控制器(62)可以使得目标函数(44)最小,且最优目标函数为式(63)。
仿真例子
例1令系统方程(1)和目标函数(3)的参数为
A=0.8,
Figure BDA0003163542730000345
σ2=1,d=3,θ=2
x0=1,u1=0.8,ui=0,i=-3,...,0
Q=R=1,N=7,MN+1=0。
利用推论直接计算可以得到
Ξ5=1.7101,Ξ6=1.5399,Ξ7=1
Π5=2.6821,Π6=1.8900,Π7=1
Ψ5=0,Ψ6=0,Ψ7=0
Φ5=0,Φ6=0,Φ7=0
Δ5=2.0570,Δ6=1.6500,Δ7=1
Γ5=1.2404,Γ6=0.7600,Γ7=0。
从上述值中可以看出对于k=4,5,6有Δk>0,因此由定理2可知输出反馈控制问题有唯一 解。计算得到的最优控制器为
Figure BDA0003163542730000346
u4=0。
例2该数值算例证明了对于无限时间的情况,在定理3中设计的控制器可以使系统方程 (1)镇定。考虑系统方程(1)和目标函数(3)的参数为
A=0.4,
Figure BDA0003163542730000347
B=0.4,
Figure BDA0003163542730000348
σ2=1,d=4,θ=3
x0=1,u1=0.5,u2=1,ui=0,i=-4,...,0
Q=R=1>0,
且假设1和2都满足。通过解式(56)-(61)可以得到
Ξ=2.2074,Π=31.4114,Ψ=-0.0165,Φ=-0.0025
Δ=21.4310,Γ=22.9407,
明显有Π>Ξ>0,Ψ<0和Φ<0。由定理3可知,在均方意义下求得的控制器uk-d=-1.0704
Figure BDA0003163542730000351
可以使得系统方程(1)镇定。如图所示,系统状态是渐进均方稳定的。
例3为了证明定理3的有效性,根据例2的描述,选择另外一个控制器uk-d=-4.5596
Figure BDA0003163542730000352
其中该控制器的增益也是解式(56)-(61)中耦合的黎卡提方程得到的。此时相关的 仿真例子如图所示,可以明显的看出选定的控制器不能使系统方程(1)镇定。
本文分析了带有乘性噪声、丢包、输入和量测时滞的离散网络控制系统中的最优输出反 馈控制和镇定性问题。对于带有丢包和量测时滞的乘性噪声系统,首次给出了递归的最优估 计器。基于该估计器,利用极大值原理求得了最优输出反馈控制器。同时给出了有限时间范 围内最优控制问题可解的充分必要条件。最后,基于标准的可观性假设,证明了在均方意义 下设计的控制器可以使得系统方程镇定,当且仅当耦合的黎卡提方程有唯一解。
当然,上述说明并非是对本发明的限制,本发明也并不仅限于上述举例,本技术领域的 技术人员在本发明的实质范围内所做出的变化、改型、添加或替换,也应属于本发明的保护 范围。

Claims (3)

1.具有丢包和多时滞的网络控制系统的最优控制研究方法,其特征在于:首先给出如下定义:符号
Figure FDA0003163542720000011
表示n维欧氏空间;上标'表示矩阵的转置;实数矩阵M>0表示矩阵M是正定的;实数矩阵M≥0表示矩阵M是半正定的;
Figure FDA0003163542720000012
表示指示函数,即当元素
Figure FDA00031635427200000123
时,有
Figure FDA0003163542720000013
否则有
Figure FDA0003163542720000014
Figure FDA0003163542720000015
是由随机过程X所产生的自然滤波;E[·]是数学期望且
Figure FDA0003163542720000016
是关于
Figure FDA0003163542720000017
的条件期望;P(X)表示当事件X发生时的概率;I表示单位矩阵;δkl表示克罗内克函数,即当k=l时有δkl=1,否则有δkl=0;
所述方法具体包括如下步骤:
步骤1:利用带有时滞的量测数据{yk}设计出了最优估计器;
步骤2:利用极大值原理,解出了最优控制器,并给出了有限时间范围内可解的充分必要条件;且最优控制器的增益为耦合的黎卡提方程的解;
步骤3:通过定义一个李雅普诺夫函数,得出系统在均方意义下是可镇定的,当且仅当给定的耦合的黎卡提方程有唯一解。
2.根据权利要求1所述的具有丢包和多时滞的网络控制系统的最优控制研究方法,其特征在于:在步骤2中,具体设计如下:
有限时间的情况
问题描述
考虑下面带有丢包、输入时滞和量测时滞的乘性噪声系统:
Figure FDA0003163542720000018
yk=ωkxk-θ, (2);
其中,
Figure FDA0003163542720000019
代表状态向量,
Figure FDA00031635427200000110
代表控制器,
Figure FDA00031635427200000111
代表其协方差为
Figure FDA00031635427200000112
的标量高斯白噪声;
Figure FDA00031635427200000113
代表量测过程,ωk是服从概率为P(ωk=1)=p=1-q∈[0,1]的伯努利分布;A,
Figure FDA00031635427200000114
B,
Figure FDA00031635427200000115
是具有适当维数的常值矩阵,d和θ(>0)分别表示输入时滞和量测时滞;初始值x0表示均值为μ,协方差为Θ的高斯随机向量,初始控制器ui,i=-d,...,θ-1的值是已知的,而且
Figure FDA00031635427200000116
k}和x0彼此相互独立;
系统(1)和(2)的性能指标定义为:
Figure FDA00031635427200000117
其中,常值矩阵
Figure FDA00031635427200000118
分别是用来平衡状态向量和输入向量的权重矩阵,xN+1为终端状态向量,
Figure FDA00031635427200000119
为有界的常数终端加权矩阵;
对于具有丢包和多时滞的乘性噪声系统,控制器uk只允许访问量测过程{yθ,...,yk},也就是说,uk
Figure FDA00031635427200000120
可量测的;为了方便起见,将
Figure FDA00031635427200000121
表示为
Figure FDA00031635427200000122
同时,将
Figure FDA0003163542720000021
表示为
Figure FDA0003163542720000022
Figure FDA0003163542720000023
表示为
Figure FDA0003163542720000024
问题1对于系统(1)和(2),利用量测数据{yk},找到一个
Figure FDA0003163542720000025
可量测的控制器uk使得目标函数(3)最小;
为了确保问题的可解性,给出下面的假设:
假设1目标函数(3)中矩阵满足Q≥0,R>0和MN+1≥0;
最优估计
在求解最优控制器之前,首先给出最优估计器的表达式;为了表示方便,将估计器表示为
Figure FDA0003163542720000026
下面给出本小节的重要定理:
定理1对于系统的状态方程(1)和量测方程(2),最优估计器的递推式为:
Figure FDA0003163542720000027
其中
Figure FDA0003163542720000028
初始值为
Figure FDA0003163542720000029
且有
Figure FDA00031635427200000210
和P(ψk=1)=q=1-p,θ≤k≤N,
Figure FDA00031635427200000211
表示指示函数;
除此之外,由系统方程(1)能够直接计算得到
Figure FDA00031635427200000212
证首先计算最优估计器的初始值
Figure FDA00031635427200000213
令yθ=ωθx0=h,则由条件期望的定义得到
Figure FDA00031635427200000214
其中,P(xθ=ri|yθ=h)表示在yθ=h发生的情况下xθ取值为ri的条件概率;下面进行讨论:
1)对于量测数据yθ,当出现数据丢包时,也就是说yθ=h=0,此时有P(xθ=ri,yθ=0)=P(xθ=ri)P(yθ=0),则由(5)得到
Figure FDA00031635427200000215
2)当没有发生丢包时,也即yθ=h≠0,则由(5)得到
Figure FDA00031635427200000216
因此,结合式(6)和(7),估计器的初始值表示为
Figure FDA00031635427200000217
由于系统噪声
Figure FDA0003163542720000031
和{ωk}是相互独立的,则通过系统状态方程(1)得到
Figure FDA0003163542720000032
下面进一步分析最优估计器的一般形式
Figure FDA0003163542720000033
θ≤k≤N;
为了方便起见,令Yk={yθ,...,yk};类比式(5),利用条件期望的定义,可得
Figure FDA0003163542720000034
分类讨论如下:
1)若yθ=yθ+1...=yk=0,则有
P(xk=ri,yθ=0,yθ+1=0,...,yk=0)=P(xk=ri)P(yθ=0,yθ+1=0,...,yk=0);
因此,根据式(8)得
E[xk|yθ=hθ,yθ+1=hθ+1,...,yk=hk]=Exk (9);
2)若有yk=hk=0,
Figure FDA0003163542720000035
Figure FDA0003163542720000036
其中{θ,θ+1,...,k-1}={iθ,iθ+1,...,ik-1},iθ<iθ+1<...<ij;此时有
Figure FDA0003163542720000037
Figure FDA0003163542720000038
则根据式(8)得
Figure FDA0003163542720000039
3)若k时刻没有数据丢包,即yk=hk≠0,估计器能够表示为
Figure FDA00031635427200000310
其中yk=ωkxk-θ,且上式第二行利用了状态{xk}的马尔可夫特性;
由式(1)和(11)得
Figure FDA00031635427200000311
同理可得
Figure FDA00031635427200000312
则由式(12)和(13),式(11)中的估计器
Figure FDA00031635427200000313
能够写成递推的形式,如下:
Figure FDA00031635427200000314
综上所述,由式(9)-(11)得最优估计器的形式为
Figure FDA0003163542720000041
同时由系统方程(1)直接计算得
Figure FDA0003163542720000042
下面对式(14)作进一步的化简;利用指示函数的特性知
Figure FDA0003163542720000043
Figure FDA0003163542720000044
因此,当yθ=yθ+1...=yk=0时,由式(16),式(14)能够写为
E[xk|yθ,...,yk]=Exk=AE[xk-1|Yk-1]+Buk-d-1 (18);
同时,若有
Figure FDA0003163542720000045
其中iθ<iθ+1<...<ij<...≤ik-1,则
1)当ij<k-1时,即
Figure FDA0003163542720000046
且yk-1=0,由式(17),式(14)能够写为
Figure FDA0003163542720000047
2)当ij=k-1时,即yk-1≠0,由式(17),式(14)能够写为
Figure FDA0003163542720000048
因此,由式(14),(18)-(20),并将
Figure FDA0003163542720000049
定义为ψk,得到最优估计器的递推形式为
Figure FDA00031635427200000410
上式即为式(4);
最优输出反馈控制
为了得到问题1的解,对系统状态方程(1)和目标函数(3)应用极大值原理得到如下的共态方程:
λN=MN+1xN+1 (21);
Figure FDA00031635427200000411
Figure FDA00031635427200000412
其中
Figure FDA00031635427200000413
下面给出问题1完整的解;
定理2基于假设1,对于系统(1)和(2),问题1有唯一的解,当且仅当矩阵Δk>0,k=d+θ,...,N;且设计的令目标函数(3)最小的最优输出反馈控制器为
Figure FDA00031635427200000414
其中估计器
Figure FDA00031635427200000415
满足下式
Figure FDA0003163542720000051
估计器
Figure FDA0003163542720000052
已经在定理1中给出,且增益Δk+d和Γk+d满足
Figure FDA0003163542720000053
Figure FDA0003163542720000054
在式(25)和(26)中,矩阵
Figure FDA0003163542720000055
Ψkk满足下列的黎卡提差分方程
Figure FDA0003163542720000056
Figure FDA0003163542720000057
Figure FDA0003163542720000058
Figure FDA0003163542720000059
Φk=(1-q)A′Ψk+1A+A′Φk+1A, (31);
式(27)-(31)中的终端条件为
Figure FDA00031635427200000510
ΨN+1=0,ΦN+1=0;
同时可得式(3)中的最优目标函数为
Figure FDA00031635427200000511
且状态和共态之间的关系满足下式
Figure FDA00031635427200000512
推论令
Figure FDA00031635427200000513
对式(27)-(31)两端从i=3到d+1进行累加,得到下面耦合的黎卡提方程
Figure FDA00031635427200000514
Figure FDA00031635427200000515
Figure FDA00031635427200000516
Φk=(1-q)A′Ψk+1A+A′Φk+1A, (37);
上式中的终端值为ΞN+1=ΠN+1=MN+1,且矩阵Δk和Γk能够直接计算得到
Figure FDA00031635427200000517
Figure FDA00031635427200000518
下面给出定理2的证明:
证首先给出必要性的证明,即在假设1的前提下,如果问题1有唯一解,式(25)中的矩阵Δk,d+θ≤k≤N是严格正定的;定义新的目标函数为
Figure FDA00031635427200000519
令式(40)中的k=N,得到
J(N)=E[xN′QxN+uN-d′RuN-d]+xN+1′MN+1xN+1
将系统的状态方程(1)代入上式,则J(N)能够写成状态xN和控制器uN-d的二次型形式,且由于控制器解的唯一性,该二次型必然是正定的;令状态xN=0,得到
Figure FDA0003163542720000061
因此ΔN>0成立;
下面计算最优控制器;由式(1)和(21),平衡方程(23)能够写为
Figure FDA0003163542720000062
因此,当k=N时的最优控制器为
Figure FDA0003163542720000063
明显式(41)满足式(24);
接下来说明k=N时的共态方程具有式(33)的形式;利用式(1)、(21)、(22)和(41),得到
Figure FDA0003163542720000064
上式满足式(33),且矩阵MN 1
Figure FDA0003163542720000065
分别满足式(27)和(28);
为了进一步分析一般情况,并利用数学归纳法,取d+θ≤l≤N,当k≥l+1,假设式(25)中的矩阵是正定的,且控制器uk-d和共态λk-1的表达式为式(24)和(33);接下来证明该情形在k=l时也成立;
首先需要证明矩阵Δl的可逆性;由式(1)、(22)和(23),得到
Figure FDA0003163542720000066
将上式从k=l+1到N进行累加,得到
Figure FDA0003163542720000067
利用上式以及式(21),并令式(40)中的k=l,则J(l)表示成
Figure FDA0003163542720000068
将式(33)代入上式,并令xl=0,则J(l)被写成
Figure FDA0003163542720000071
由于最优控制器解ul-d的唯一性,则式(25)中矩阵Δl是严格正定的,也即Δl>0成立;
下面求解最优控制器;将式(33)代入式(23)得到
Figure FDA0003163542720000072
则最优控制器的解为
Figure FDA0003163542720000073
其中矩阵Δl和Γl分别满足式(25)和(26);因此,最优控制器(24)在k=l时也成立;
最后证明状态和共态之间的关系式满足式(33),如下:
Figure FDA0003163542720000074
显然该式成立;这就完成了必要性的证明;
下面给出充分性的证明,即当式(25)中的矩阵Δk>0,k=d+θ,...,N时,证明问题1有唯一解;定义
Figure FDA0003163542720000075
则由式(1)、(25)-(31),能够计算得到VN(k+1,xk+1)如下
Figure FDA0003163542720000076
Figure FDA0003163542720000081
令VN(k,xk)和VN(k+1,xk+1)作差,得到
Figure FDA0003163542720000082
对式(41)两端从k=d+θ到N进行累加,得到
Figure FDA0003163542720000083
利用上式将目标函数写为
Figure FDA0003163542720000084
在上式中,x0,ui,i=-d,...,θ-1已经初始化,对于0≤k≤d+θ-1,xk能够由初始值进行求解,且矩阵Δk是严格正定的;因此,令目标函数取到最小值,最优控制器的唯一性即得证,且满足式(24)。
3.根据权利要求1所述的具有丢包和多时滞的网络控制系统的最优控制研究方法,其特征在于:在步骤3中,具体设计如下:
无限时间的情况
问题描述
为了分析系统的镇定性,求解系统(1)和(2)在无限时间时的镇定问题;当N→+∞时考虑如下的性能指标:
Figure FDA0003163542720000091
首先给出下面几个重要的定义:
定义1对于给定的初始值x0,u-d,...,uθ-1,且控制器uk-d=0,k≥d+θ,如果有
Figure FDA0003163542720000092
则称方程(1)为渐进均方稳定的;
定义2方程(1)在均方意义下是可镇定的,当存在一个
Figure FDA0003163542720000093
可量测的控制器
Figure FDA0003163542720000094
其中L和Li(i=1,...,d+θ)是常值矩阵,且满足
Figure FDA0003163542720000095
使得(1)的闭环系统是渐进均方稳定的;
定义3对于下面的随机系统
Figure FDA0003163542720000096
为了方便起见,将上述系统简记为
Figure FDA0003163542720000097
基于假设1,有Q=C'C成立;如果有下式成立
Figure FDA0003163542720000098
则称系统
Figure FDA0003163542720000099
是完全可观测的;
问题2找到一个
Figure FDA00031635427200000910
可测的控制器uk-d使得系统(1)是渐进均方稳定的,同时使得目标函数(44)最小;
假设2
Figure FDA00031635427200000911
是完全可观测的;
问题2的解
为了表述清晰,将矩阵Δkk,
Figure FDA00031635427200000919
Ψkkkk写为Δk(N),Γk(N),
Figure FDA00031635427200000912
Ψk(N),Φk(N),Ξk(N),Πk(N);由于终端值MN+1=0,故上述矩阵都为时不变矩阵;
下面给出几个重要引理:
引理1基于假设1,得到Πk(N)≥Ξk(N)≥0,
Figure FDA00031635427200000913
Ψk(N)<0,Φk(N)<0和
Figure FDA00031635427200000914
证在定理1中已经证得了Δk(N)>0,k≥d+θ,由式(28)-(31)能够直接观察得出矩阵
Figure FDA00031635427200000915
Ψk(N),Φk(N)都是负定的;接下来证明Πk(N)≥Ξk(N)≥0和
Figure FDA00031635427200000916
成立;定义
Figure FDA00031635427200000917
其中m≥d+θ;由式(3)和(32)能够类比得到式(45)的最优解为
Figure FDA00031635427200000918
Figure FDA0003163542720000101
对式(46)分析如下:
Figure FDA0003163542720000102
其中有
Figure FDA0003163542720000103
同理得
Figure FDA0003163542720000104
Figure FDA0003163542720000105
则由式(46)-(49);得到
Figure FDA0003163542720000106
由于状态xd+θ是随机变量,因此,得到
Ξd+θ(m)≥0;
也即
Figure FDA0003163542720000107
由定理2看出
Figure FDA0003163542720000108
则必有
Figure FDA0003163542720000109
利用Ξd+θ(m),
Figure FDA00031635427200001010
Figure FDA00031635427200001011
的时不变特性,令m=N+d+θ-k,则有Ξk(N)=Ξd+θ(N+d+θ-k)≥0,
Figure FDA00031635427200001012
Figure FDA00031635427200001013
因此不等式Πk(N)≥Ξk(N)≥0,
Figure FDA00031635427200001014
Figure FDA00031635427200001015
也成立;
引理2基于假设1和2,存在一个常数N0>0,使得当N>N0时,有Ξd+θ(N)>0;
证对于式(46),选定状态向量xd+θ(≠0),则有
Figure FDA00031635427200001016
假设Ξd+θ(N)=0成立,那么式(46)能够写为
Figure FDA00031635427200001017
其中
Figure FDA00031635427200001018
Figure FDA00031635427200001019
分别代表最优状态策略和最优控制器;由假设1可知,Q=C'C≥0且R>0,再由式(51)能够观察得出
Figure FDA00031635427200001020
则系统方程(1)能够写成
Figure FDA0003163542720000111
基于定义3和假设2,得到xd+θ=0,矛盾;因此假设不成立,则有N0>0,使得当N>N0时,有Ξd+θ(N)>0成立;
引理3系统方程(1)是可镇定的,当且仅当不等式
Figure FDA0003163542720000112
成立;
证首先给出充分性的证明;显然,如果
Figure FDA0003163542720000113
成立,则必有
Figure FDA0003163542720000114
基于定义2可知系统方程(1)是可镇定的;
下面证明必要性,即若系统方程(1)是镇定的,则不等式
Figure FDA0003163542720000115
成立;
由定义2可知,存在
Figure FDA0003163542720000116
使得系统方程(1)是渐进均方稳定的;定义如下矩阵
Figure FDA0003163542720000117
Figure FDA0003163542720000118
利用上述矩阵可将系统方程(1)转变为一个新的状态方程为
Figure FDA0003163542720000119
且控制器uk能够写为
Figure FDA00031635427200001110
将式(53)代入式(52)得到
Figure FDA00031635427200001111
回顾定义2知,控制器
Figure FDA0003163542720000121
使系统方程(1)渐进均方稳定,也即存在
Figure FDA0003163542720000122
同时,我们能够得到
Figure FDA0003163542720000123
则由式(54)能够直接得到
Figure FDA0003163542720000124
且有
Figure FDA0003163542720000125
因此得
Figure FDA0003163542720000126
利用式(55),能够得到
Figure FDA0003163542720000127
也即
Figure FDA0003163542720000128
定理3系统方程在均方意义下是镇定的,当且仅当推论中耦合的黎卡提方程有唯一解,且有Π≥Ξ>0,M1≥0,Ψ,Φ≤0和Mj≤0,j=2,...,d+1:
Figure FDA0003163542720000129
Figure FDA00031635427200001210
Ψ=-(A′)dΓ′Δ-1ΓAd+qA′ΨA (58);
Φ=(1-q)A′ΨA+A′ΦA (59);
其中Δ和Γ为
Figure FDA00031635427200001211
Figure FDA00031635427200001212
使系统镇定的控制器为
Figure FDA00031635427200001213
式(44)对应的最优目标函数为
Figure FDA00031635427200001214
其中
Figure FDA00031635427200001215
下面给出定理3的证明:
必要性:即若系统方程(1)是均方能够镇定的,则式(34)-(39)中耦合的黎卡提方程有唯一解,且Π≥Ξ>0,Ψ,Φ≤0;
首先给出矩阵Ξd+θ(N),Πd+θ(N),Ψd+θ(N)和Φd+θ(N)关于N的单调性证明;回顾式(32)和(42),最优目标函数能够写为
Figure FDA0003163542720000131
其中,
Figure FDA0003163542720000132
且uj=0,j=-d,...,-1,
Figure FDA0003163542720000133
Figure FDA0003163542720000134
下面对式(65)进行讨论:
1)如果有x0=Ex0成立,则由定理1可以得到
Figure FDA0003163542720000135
那么式(65)能够写为
Figure FDA0003163542720000136
由于J*(N)≤J*(N+1)能够得到
Figure FDA0003163542720000137
也即Π0(N)≤Π0(N+1)成立;
2)如果有Ex0=0成立,能够得到
Figure FDA0003163542720000138
类比上述分析得
Figure FDA0003163542720000139
3)对于给定的xd+θ,由式(46),令m=N,可有H*(N)≤H*(N+1),则得
Figure FDA00031635427200001310
也即Ξd+θ(N)≤Ξd+θ(N+1)成立;
综上所述,看出Π0(N),
Figure FDA00031635427200001311
和Ξd+θ(N)关于N是单调递增的;
下面证明上述矩阵是有界的;由定义2知,存在控制器
Figure FDA00031635427200001312
使得系统方程(1)镇定;选定一常数λ使得Q≤λI,
Figure FDA00031635427200001313
成立;则有
Figure FDA00031635427200001314
其中c和c1是常数;因此,得到
Figure FDA0003163542720000141
再由式(50),知
Figure FDA0003163542720000142
上式表明矩阵Ξd+θ(N)是有界的;
类比式(65)进行如下讨论:
1)若x0=Ex0,则有
Figure FDA0003163542720000143
故有
Figure FDA0003163542720000144
上式表明矩阵
Figure FDA0003163542720000145
是有界的;
2)若Ex0=0,则有
Figure FDA0003163542720000146
故有
Figure FDA0003163542720000147
得出
Figure FDA0003163542720000148
也是有界的;
综上知矩阵Ξd+θ(N),Π0(N),
Figure FDA0003163542720000149
Ψ0(N)和Φ0(N)都是收敛的;且上述矩阵都是时不变矩阵,即有
Ξd+θ(N)=Ξ0(N-d-θ),Πd+θ(N)=Π0(N-d-θ);
Figure FDA00031635427200001410
Φd+θ(N)=Φ0(N-d-θ);
因此,存在矩阵Ξ,Π,M1,Ψ和Φ,满足
Figure FDA00031635427200001411
Figure FDA00031635427200001412
Figure FDA00031635427200001413
同时,在式(25),(26),(28)和(29)两端取极限得到收敛值为
Figure FDA00031635427200001414
Figure FDA00031635427200001415
因此,当时间变量N→+∞,式(56)-(61)是成立的;且利用引理1和2直接得到,Π≥Ξ>0,M1≥0,Ψ<0,Φ<0和Mj≤0,j=2,...,d+1;
最后证明式(56)-(59)的解是唯一的;现假设存在另外一组解H,F,P和K也满足式(56)-(59);当有x0=Ex0时,对式(66)两端取极限,得到
J*(N)=E(x′0Πx0)=E(x′0Fx0);
则有Π=F;而且若有Ex0=0,得
J*(N)=E{x′00(N)-qΨ0(N)-qΦ0(N)]x0}
=E{x′0[F0(N)-qP0(N)-qK0(N)]x0};
由式(30)和(31),看出Φk(N)依赖于Ψk(N),也即若Ψ0(N)≠P0(N),则有Φ0(N)≠K0(N),这与上述方程式矛盾;故在该方程两侧取极限得到Ψ=P,Φ=K;同时,对于给定的xd+θ,在式(51)两端取极限,直接得到E(x′d+θΞxd+θ)=E(x′d+θHxd+θ),则有Ξ=H;综上知式(56)-(61)的解是唯一的;
充分性:若式(56)-(61)中耦合的黎卡提方程有唯一解,则控制器(62)能够使得系统方程(1)镇定;
首先,令
Figure FDA0003163542720000151
同时经计算也能够得到
Figure FDA0003163542720000152
则对k≥d+θ,有
Figure FDA0003163542720000153
从式(69)看出,控制器
Figure FDA0003163542720000154
满足式(62),且函数V(k,xk)关于N是单调递减的;同时经计算得到
Figure FDA0003163542720000155
上式表明函数V(k,xk)是有界的,由单调有界原理知函数V(k,xk)是收敛的;
因此,通过式(69)得到
Figure FDA0003163542720000161
再由式(50)得
Figure FDA0003163542720000162
在式(71)两端取极限并利用式(70),得
Figure FDA0003163542720000163
利用引理2知Ξd+θ(N)>0,则有
Figure FDA0003163542720000164
也即式(62)中的控制器能够使得系统方程(1)镇定;
接下来证明控制器(62)能够使目标函数(44)最小为(63);对式(68)两端从k=0到N进行累加,得到
Figure FDA0003163542720000165
其中V(0,x0)和V(N+1,xN+1)已在式(67)中给出定义;利用射影定理有
Figure FDA0003163542720000166
我们已经得到控制器(62)能够使得系统(1)镇定,因此有
Figure FDA0003163542720000167
Figure FDA0003163542720000168
在式(72)两端对N取极限,目标函数(44)能够写为
Figure FDA0003163542720000169
通过以上的分析,控制器(62)能够使得目标函数(44)最小,且最优目标函数为式(63)。
CN202110798111.1A 2021-07-15 2021-07-15 具有丢包和多时滞的网络控制系统的最优控制研究方法 Active CN113608437B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110798111.1A CN113608437B (zh) 2021-07-15 2021-07-15 具有丢包和多时滞的网络控制系统的最优控制研究方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110798111.1A CN113608437B (zh) 2021-07-15 2021-07-15 具有丢包和多时滞的网络控制系统的最优控制研究方法

Publications (2)

Publication Number Publication Date
CN113608437A true CN113608437A (zh) 2021-11-05
CN113608437B CN113608437B (zh) 2023-11-03

Family

ID=78337600

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110798111.1A Active CN113608437B (zh) 2021-07-15 2021-07-15 具有丢包和多时滞的网络控制系统的最优控制研究方法

Country Status (1)

Country Link
CN (1) CN113608437B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114895645A (zh) * 2022-03-31 2022-08-12 中国地质大学(武汉) 考虑非零均值噪声的网络控制系统性能极限分析方法
CN115113597A (zh) * 2022-07-19 2022-09-27 厦门大学 一种基于有限时间稳定的对称组合大系统的分散控制方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1999010783A1 (en) * 1997-08-22 1999-03-04 Voyan Technology A method for real-time nonlinear system state estimation and control
US6047221A (en) * 1997-10-03 2000-04-04 Pavilion Technologies, Inc. Method for steady-state identification based upon identified dynamics
CN109597306A (zh) * 2018-12-13 2019-04-09 济南大学 一种丢包网络控制系统的跟踪控制器设计方法
CN109932905A (zh) * 2019-03-08 2019-06-25 辽宁石油化工大学 一种基于非策略的观测器状态反馈的优化控制方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1999010783A1 (en) * 1997-08-22 1999-03-04 Voyan Technology A method for real-time nonlinear system state estimation and control
US6047221A (en) * 1997-10-03 2000-04-04 Pavilion Technologies, Inc. Method for steady-state identification based upon identified dynamics
CN109597306A (zh) * 2018-12-13 2019-04-09 济南大学 一种丢包网络控制系统的跟踪控制器设计方法
CN109932905A (zh) * 2019-03-08 2019-06-25 辽宁石油化工大学 一种基于非策略的观测器状态反馈的优化控制方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114895645A (zh) * 2022-03-31 2022-08-12 中国地质大学(武汉) 考虑非零均值噪声的网络控制系统性能极限分析方法
CN114895645B (zh) * 2022-03-31 2024-04-16 中国地质大学(武汉) 考虑非零均值噪声的网络控制系统性能极限分析方法
CN115113597A (zh) * 2022-07-19 2022-09-27 厦门大学 一种基于有限时间稳定的对称组合大系统的分散控制方法

Also Published As

Publication number Publication date
CN113608437B (zh) 2023-11-03

Similar Documents

Publication Publication Date Title
Ma et al. Finite-time event-triggered H∞ control for switched systems with time-varying delay
Su Cooperative global output regulation of second-order nonlinear multi-agent systems with unknown control direction
Zhu et al. Robust distributed fault estimation for a network of dynamical systems
CN113608437A (zh) 具有丢包和多时滞的网络控制系统的最优控制研究方法
CN109541944A (zh) 含通信时滞的离散网络化多智能体系统有限时间控制方法
Tan et al. Consensus of networked multi-agent systems with diverse time-varying communication delays
Hammouri et al. Constant gain observer for continuous-discrete time uniformly observable systems
Stanković et al. Asynchronous distributed blind calibration of sensor networks under noisy measurements
Pérez-Cruz et al. Exponential synchronization of chaotic xian system using linear feedback control
Xiong et al. An integral sliding mode approach to distributed control of coupled networks with measurement Quantization
Garcia et al. Parameter estimation in time-triggered and event-triggered model-based control of uncertain systems
Gan et al. Anti-synchronization for periodic BAM neural networks with Markov scheduling protocol
Ma et al. Optimal linear filter for systems with random delay and packet dropout compensations
Wang et al. Leader‐following consensus control of second‐order nonlinear multi‐agent systems with applications to slew rate control
Berkel et al. An event-triggered cooperation approach for robust distributed model predictive control
Sun et al. Fast finite-time consensus tracking for first-order multi-agent systems with unmodelled dynamics and disturbances
Wigren Networked and delayed recursive identification of nonlinear systems
Liu et al. Optimal linear filtering for networked systems with communication constraints, fading measurements, and multiplicative noises
Lai et al. Adaptive finite-time projective synchronization of complex networks with nonidentical nodes and quantized time-varying delayed coupling
Jin et al. Adaptive finite-time pinned and regulation synchronization of disturbed complex networks
Jiang et al. Optimal tracking control of networked systems subject to model uncertainty and additive colored Gaussian noise
Zhang et al. Optimal model reduction of discrete-time descriptor systems
Li et al. Global Distributed Fault-Tolerant Consensus Control of Nonlinear Delayed Multiagent Systems with Hybrid Faults
CN113589691A (zh) 一种通信受限网络化系统的信号跟踪控制方法及系统
Ao et al. Consensus for time-delay multi-agent systems with H∞ performance in finite frequency domains

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20230922

Address after: 276000 west side of north section of Industrial Road, Lanshan District, Linyi, Shandong

Applicant after: LINYI University

Address before: 579 qianwangang Road, Huangdao District, Qingdao City, Shandong Province

Applicant before: SHANDONG University OF SCIENCE AND TECHNOLOGY

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant