CN111190350A - 一种数据驱动的网络控制系统时延主动补偿控制方法 - Google Patents

一种数据驱动的网络控制系统时延主动补偿控制方法 Download PDF

Info

Publication number
CN111190350A
CN111190350A CN202010035401.6A CN202010035401A CN111190350A CN 111190350 A CN111190350 A CN 111190350A CN 202010035401 A CN202010035401 A CN 202010035401A CN 111190350 A CN111190350 A CN 111190350A
Authority
CN
China
Prior art keywords
data
matrix
input
formula
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010035401.6A
Other languages
English (en)
Inventor
付伟
唐�谦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing Industry Polytechnic College
Original Assignee
Chongqing Industry Polytechnic College
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing Industry Polytechnic College filed Critical Chongqing Industry Polytechnic College
Priority to CN202010035401.6A priority Critical patent/CN111190350A/zh
Publication of CN111190350A publication Critical patent/CN111190350A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/042Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations

Abstract

本发明涉及网络控制技术领域,公开了一种数据驱动的网络控制系统时延主动补偿控制方法,从数据角度出发,通过系统输入输出数据计算系统输入输出误差序列,构造闭环子空间从而计算闭环子空间矩阵,克服了开环子空间方法的有偏性;通过构造预测模型,设计闭环子空间预测控制算法及补偿结构,主动补偿网络时延的影响;同时考虑系统实时性,采用一种简便的递推计算式更新参数矩阵以替代复杂的矩阵分解算法,从而减小最优多步控制量的在线递推计算量,减小了计算复杂度,提高了系统的实时性。

Description

一种数据驱动的网络控制系统时延主动补偿控制方法
技术领域
本发明涉及网络控制技术领域,具体涉及一种数据驱动的网络控制系统时延主动补偿控制方法。
背景技术
当前,云控制系统(Cloud control system,CCS)的研究和应用还存在许多挑战。将工业云接入生产过程,这对于网络时延、性能以及计算力都提出了非常高的要求。云控制系统是网络控制系统(Networked control system,NCS)的进一步扩展。因此,对NCS时延、错序、性能及稳定性的研究是云控制系统的基础理论,也是构建工业云平台的核心,具有非常重要的现实意义。
由于实际生产过程是复杂多变的,通过网络连接的控制系统往往无法建模。随着通信技术、物联网技术的发展,能够获取并存储系统在运行过程中产生的海量数据。从数据角度出发,利用各种智能算法实现系统自主控制,将是这一研究领域的趋势。
子空间方法也是一种基于数据的方法,也在各行业实际系统中得到了应用,并取得了良好的效果。子空间方法理论得到了很大发展和应用,但在一些基本问题上还没有形成较系统和完备的理论,比如系统稳定性以及估计误差的收敛性问题。目前,子空间方法已经应用到网络控制系统中以辨识系统矩阵,但现有方法假设系统输入与噪声不相关,导致了估计的偏差性,从而使控制器不能满足系统性能要求。
发明内容
基于以上问题,本发明提供一种数据驱动的网络控制系统时延主动补偿控制方法,从数据角度出发,通过输入输出数据计算系统输入输出误差序列,构造闭环子空间从而计算闭环子空间矩阵,克服开环子空间方法的有偏性;通过构造预测模型,设计闭环子空间预测控制算法及补偿结构,主动补偿网络时延的影响,克服时延的影响;同时考虑系统实时性,采用一种简便的参数矩阵递推更新方法替代复杂的矩阵分解算法,从而减小最优多步控制量的在线递推计算量,减小了计算复杂度,提高了系统的实时性。
为解决以上技术问题,本发明提供了一种数据驱动的网络控制系统时延主动补偿控制方法,包括如下步骤:
S1、获取控制系统输入数据和输出数据,在云服务器中将输入输出数据转换成Hankel矩阵形式;
S2、分析系统输入与噪声之间的相关性,计算输入输出误差序列,构造闭环系统的扩展子空间,利用子空间方法,根据输入输出数据辨识系统矩阵;
S3、根据系统矩阵建立控制系统的状态模型;
S4、根据系统状态模型设计预测控制算法,设立目标性能函数,计算最优多步预测控制量序列,主动补偿网络时延影响;
S5、根据输入输出数据对矩阵参数进行更新,滚动计算最优多步控制量序列,实现最优多步控制量的在线递推计算,减小计算量,提高系统实时性。
进一步地,步骤S1中Hankel矩阵的建立方法为:考虑输入输出数据离散线性时不变状态空间信息形式:
Figure BDA0002365805430000021
其中A、B、C为具有相应维数的常矩阵,K为卡尔曼滤波增益,e(k)为噪声序列;xk∈Rn为系统状态,系统输出为yk∈Rm,作用于被控对象的控制量uk∈Rl
对式(1)进行迭代可得如下的输入输出方程:
Figure BDA0002365805430000022
Figure BDA0002365805430000023
Figure BDA0002365805430000024
其中Xp和Xf代表系统“过去”和“将来”的状态矩阵,Up、Uf、Yp、Yf、Ef为Hankel矩阵。
进一步地,步骤S2中闭环系统的扩展子空间构造过程为:
因数据传输存在时延现象,控制器的状态空间模型需考虑时延因素:
Figure BDA0002365805430000025
式中τ为传输时延,v为白噪声输入,控制器输入即为系统输出y,控制器输出即为系统输入u,控制器状态向量为xc;考虑时延因素,将Bc,Dc参数改为受时延影响的变量形式,模型改写为
Figure BDA0002365805430000031
用下列暂态形式替代式(1)和(3)的白噪声项e(k)、v(k)
Figure BDA0002365805430000032
Figure BDA0002365805430000033
其中输入输出序列
Figure BDA0002365805430000034
是k0至k时刻的有限维序列;u(k)、y(k)在W[k0 k)上的投影分别用u(k)/W[k0 k)和y(k)/W[k0 k)表示;当(k-k0)→∞时,
Figure BDA0002365805430000035
Figure BDA0002365805430000036
系统状态向量和控制器状态向量的kalman估计由下述投影计算:
Figure BDA0002365805430000037
其值根据输入输出序列的更新通过下式进行更新:
Figure BDA0002365805430000038
Figure BDA0002365805430000039
Figure BDA00023658054300000310
分别表示由白噪声向量
Figure BDA00023658054300000311
张成的Hilbert空间;则上式中W[k0 k+1)可计算为
Figure BDA00023658054300000312
Figure BDA00023658054300000313
表示直和运算;闭环系统因此可改写为:
Figure BDA00023658054300000314
Figure BDA00023658054300000315
将式(5)中的
Figure BDA00023658054300000316
用u(k),
Figure BDA00023658054300000317
的函数形式来表示,并代回到(4)式计算,令
Figure BDA00023658054300000318
可得到
Figure BDA00023658054300000319
Figure BDA00023658054300000320
定义
Figure BDA00023658054300000321
Figure BDA00023658054300000322
则有
Figure BDA0002365805430000041
Figure BDA0002365805430000042
当lim(k-k0)→∞时,limB(k)→B,limBc(k)→Bc,limDc(k)→Dc,limL(k)→L,从而
Figure BDA0002365805430000043
定义
Figure BDA0002365805430000044
Figure BDA0002365805430000045
Figure BDA0002365805430000046
将式(1)的等式两边对
Figure BDA0002365805430000047
作正交投影可得到
Figure BDA0002365805430000048
从(6)式可知,状态变化量
Figure BDA0002365805430000049
与噪声
Figure BDA00023658054300000410
Figure BDA00023658054300000411
线性相关,即系统形成闭环后所引入的噪声与系统输入具有相关性;定义误差向量
Figure BDA00023658054300000412
并构造如下的闭环子空间
Figure BDA00023658054300000413
其中,
Figure BDA00023658054300000414
若定义
Figure BDA00023658054300000415
则有以下等式成立,
Figure BDA00023658054300000416
Figure BDA00023658054300000417
设式(1)表示的系统为n阶系统,如果对于任意整数s>n,满足
Figure BDA00023658054300000418
Figure BDA00023658054300000419
为系统的状态空间,
Figure BDA00023658054300000420
定义如下:
Figure BDA00023658054300000421
由此,可通过闭环子空间方法对系统矩阵进行辨识;首先构造输入输出矩阵以及误差向量,根据式(7)构造扩展子空间,将Y[k k+s]沿子空间∑[k k+s]
Figure BDA00023658054300000422
分解成两部分之和
Figure BDA00023658054300000423
上式第二项可表示为
Figure BDA00023658054300000424
而式(9)的第一项可作为ΓNX[k k+s]的近似,即
Figure BDA00023658054300000425
然后通过矩阵SVD分解可得到矩阵ΓN,最后分别计算出系统矩阵A,B,C;
采用扩展子空间方法对系统矩阵{A,B,C}的估计为一致估计,由式(2)可知
Figure BDA0002365805430000051
对上式进行斜投影
Figure BDA0002365805430000052
根据扩展子空间∑[k k+s]的定义以及斜投影的性质,上式第二项为零,则
Figure BDA0002365805430000053
若上式成立,当s→∞时,系统矩阵的估计值
Figure BDA0002365805430000054
为一致估计,即
Figure BDA0002365805430000055
进一步地,步骤S4中最优多步预测控制量序列的计算方法为:控制器根据反馈时延情况在线递推计算控制量序列,并发送至执行器;在式(1)中,令
Figure BDA0002365805430000056
系统可表示为:
Figure BDA0002365805430000057
k时刻控制器收到的数据[u(k),y(k)]实际为k-τsc时刻传感器端发送的数据[u(k-τsc),y(k-τsc)];控制器根据数据包时间戳计算反馈时延τsc并进行补偿;若p+N-1个数据对[u(k),y(k)]为已知,对系统表达式迭代展开可得到
Figure BDA0002365805430000058
其中Yk=[y(k-N+1)y(k-N+2)…y(k)]
Figure BDA0002365805430000059
Ek=[e(k-N+1)e(k-N+2)…e(k)]
Figure BDA00023658054300000510
Xk-p=[x(k-p-N+1)x(k-p-N+2)…x(k-p)]
Zp称为过去输入输出数据矩阵;根据系统因果关系,在N足够大的条件下,
Figure BDA0002365805430000061
对式(10)的最小二乘问题进行求解,可得到Ξ0的估计值
Figure BDA0002365805430000062
上标
Figure BDA00023658054300000614
表示穆尔-彭诺斯广义逆(Moore-Penrose),式(11)的求解可通过矩阵LQ分解进行:
Figure BDA0002365805430000063
Figure BDA0002365805430000064
假设预测长度为f,令
Figure BDA0002365805430000065
在k时刻可预测未来f步系统输出[14]
Figure BDA0002365805430000066
其中
Figure BDA0002365805430000067
Figure BDA0002365805430000068
Figure BDA0002365805430000069
假定参考信号序列为
γ[k+1,k+f)=[rT(k+1)rT(k+2)…rT(k+f-1)]T设定如下目标函数:
Figure BDA00023658054300000610
式中Q,R为正定加权矩阵;令
Figure BDA00023658054300000611
可计算出最优预测控制量序列:
Figure BDA00023658054300000612
其中,
Figure BDA00023658054300000613
通过式(13)、(14)和(15)可看出,若实时更新
Figure BDA0002365805430000071
Γ和Λ,就能实时计算最优多步控制量序列。
进一步地,步骤S5中对矩阵参数的更新具体算法为:数据更新过程中,考虑在线实时性问题,找出参数在k+1时刻与k时刻的递推关系来实现参数的更新,在获得新数据u(k+1)和y(k+1)后,将向量[uT(k-p+1)、yT(k-p+1)、uT(k-p+2)、yT(k-p+2)...uT(k)、yT(k)]T加入到Zp的最后一列,而把第一列旧向量剔除,保持数据量不变,令:
Zn=[uT(k-p+1)yT(k-p+1)uT(k-p+2)yT(k-p+2)…uT(k)yT(k)]T
ZO=[uT(k-p-N+2)yT(k-p-N+2)uT(k-p-N+3)yT(k-p-N+
3)…uT(k-N+1)yT(k-N+1)]T
Yn=[y(k+1)],
Figure BDA0002365805430000072
Yo=[y(k-N+1)],
Figure BDA0002365805430000073
Figure BDA0002365805430000074
则W1、W2、W3和W4满足如下关系:
[W1 W2]=[W3 W4]
于是有[W1 W2][W1 W2]T=[W3 W4][W3 W4]T
Figure BDA0002365805430000075
根据性质,i=j,
Figure BDA0002365805430000076
和i≠j,
Figure BDA0002365805430000077
并令
Figure BDA0002365805430000078
Figure BDA0002365805430000079
将式(16)展开,并根据矩阵相等理论,可得到下列递推公式:
Figure BDA00023658054300000710
于是可按式(12)对
Figure BDA00023658054300000711
进行更新
Figure BDA00023658054300000712
由此,只需要离线计算一次
Figure BDA00023658054300000713
Figure BDA00023658054300000714
此后的每个采样时刻得到新的输入输出数据后,就可通过式(17)和(18)在线更新
Figure BDA00023658054300000715
再通过式(14)求出新的Γ和Λ,最后通过式(15)计算最新的最优预测控制量序列。
与现有技术相比,本发明的有益效果是:
1)本发明考虑系统输入与噪声之间的相关性,在闭环条件下构造扩展子空间,利用子空间理论,从输入输出数据中辨识系统矩阵,从而建立系统模型。将子空间理论与预测控制方法相结合设计控制器,计算最优多步预测控制量序列,对网络时延进行有效补偿;克服了开环状态下子空间方法的有偏性。
2)设计了一种简单的参数矩阵更新方法以替代复杂的矩阵LQ分解,降低了在线递推计算量,提高系统实时性。
附图说明
图1为实施例中主动补偿型网络控制系统结构图;
图2为实施例中伪随机二值序列输入信号;
图3为实施例中用于辨识的直流电机输出响应;
图4为实施例中总时延小于等于2T时的闭环系统阶跃响应;
图5为实施例中总时延小于等于4T时的闭环系统阶跃响应;
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,下面结合实施例和附图,对本发明作进一步的详细说明,本发明的示意性实施方式及其说明仅用于解释本发明,并不作为对本发明的限定。
实施例:
问题描述:NCS系统结构如图1所示,控制器至执行器的前向通道以及传感器至控制器的反馈通道均有网络连接;被控对象为离散对象。输入输出数据经采集后以[u(k),y(k)]的格式打包,由发送器经网络传送至控制器,由控制器计算控制量。执行器端设有延迟补偿器,接收控制器发送的数据主动补偿时延的影响。
为便于后续理论分析,对系统作以下假设:
假设1:传感器周期性地对数据进行采样;在执行器和控制器端,当数据到达后立即动作;在反馈网络中,数据传输不存在时序错乱和丢包现象。
假设2:数据以单包形式传送,均带有时间戳。控制器端和延迟补偿器均设有足够容量的先进先出(FIFO)缓存区,延迟补偿器的缓存区保存一定时序的数据包。
本实施例中的数据驱动的网络控制系统时延主动补偿控制方法具体包括如下步骤:
S1、获取控制系统输入数据和输出数据,在云服务器中将输入输出数据转换成Hankel矩阵形式;
S2、分析系统输入与噪声之间的相关性,计算输入输出误差序列,构造闭环系统的扩展子空间,利用子空间方法,根据输入输出数据辨识系统矩阵;
S3、根据系统矩阵建立控制系统的状态模型;
S4、根据系统状态模型设计预测控制算法,设立目标性能函数,计算最优多步预测控制量序列,主动补偿网络时延影响;
S5、根据输入输出数据对矩阵参数进行更新,滚动计算最优多步控制量序列,实现最优多步控制量的在线递推计算,减小计算量,提高系统实时性。
本实施例中闭环子空间方法对系统矩阵{A,B,C}估计的算法步骤如下:
①根据输入输出数据构造矩阵
Figure BDA0002365805430000091
②计算暂态形式的向量e(k),v(k),从而得到
Figure BDA0002365805430000092
通过式(7)构造闭环子空间
Figure BDA0002365805430000093
③计算斜投影
Figure BDA0002365805430000094
④通过矩阵SVD分解求出ΓN
⑤估计系统矩阵
Figure BDA0002365805430000095
Figure BDA0002365805430000096
上述步骤的具体算法为:
利用输入输出数据辨识系统状态空间矩阵;考虑如下离散线性时不变状态空间新息形式:
Figure BDA0002365805430000097
其中A、B、C为具有相应维数的常矩阵,K为卡尔曼滤波增益,e(k)为噪声序列;xk∈Rn为系统状态,系统输出为yk∈Rm,作用于被控对象的控制量uk∈Rl
对式(1)进行迭代可得如下的输入输出方程[15]
Figure BDA0002365805430000098
Figure BDA0002365805430000099
Figure BDA0002365805430000101
其中Xp和Xf代表系统“过去”和“将来”的状态矩阵,Up、Uf、Yp、Yf、Ef为Hankel矩阵;数据传输存在时延现象,控制器的状态空间模型需考虑时延因素:
Figure BDA0002365805430000102
式中τ为传输时延,v为白噪声输入,控制器输入即为系统输出y,控制器输出即为系统输入u,控制器状态向量为xc;考虑时延因素,将Bc,Dc参数改为受时延影响的变量形式,模型改写为
Figure BDA0002365805430000103
用下列暂态形式替代式(1)和(3)的白噪声项e(k)、v(k)
Figure BDA0002365805430000104
Figure BDA0002365805430000105
其中输入输出序列
Figure BDA0002365805430000106
是k0至k时刻的有限维序列;u(k)、y(k)在W[k0 k)上的投影分别用u(k)/W[k0 k)和y(k)/W[k0 k)表示;当(k-k0)→∞时,
Figure BDA0002365805430000107
系统状态向量和控制器状态向量的kalman估计由下述投影计算:
Figure BDA0002365805430000108
其值根据输入输出序列的更新通过下式进行更新:
Figure BDA0002365805430000109
Figure BDA00023658054300001010
Figure BDA00023658054300001011
分别表示由白噪声向量
Figure BDA00023658054300001012
张成的Hilbert空间;则上式中W[k0 k+1)可计算为
Figure BDA00023658054300001013
Figure BDA00023658054300001014
表示直和运算;闭环系统因此可改写为:
Figure BDA00023658054300001015
Figure BDA00023658054300001016
将式(5)中的
Figure BDA0002365805430000111
用u(k),
Figure BDA0002365805430000112
的函数形式来表示,并代回到(4)式计算,令
Figure BDA0002365805430000113
可得到
Figure BDA0002365805430000114
Figure BDA0002365805430000115
定义
Figure BDA0002365805430000116
Figure BDA0002365805430000117
则有
Figure BDA0002365805430000118
Figure BDA0002365805430000119
当lim(k-k0)→∞时,limB(k)→B,limBc(k)→Bc,limDc(k)→Dc,limL(k)→L,从而
Figure BDA00023658054300001110
定义
Figure BDA00023658054300001111
Figure BDA00023658054300001112
Figure BDA00023658054300001113
将式(1)的等式两边对
Figure BDA00023658054300001114
作正交投影可得到
Figure BDA00023658054300001115
从(6)式可知,状态变化量
Figure BDA00023658054300001116
与噪声
Figure BDA00023658054300001117
Figure BDA00023658054300001118
线性相关,即系统形成闭环后所引入的噪声与系统输入具有相关性;如果采用开环子空间方法会带来一定的偏差性;针对这种情况,本文定义误差向量
Figure BDA00023658054300001119
并构造如下的闭环子空间
Figure BDA00023658054300001120
其中,
Figure BDA00023658054300001121
Figure BDA00023658054300001122
若定义
Figure BDA00023658054300001123
则有以下等式成立,
Figure BDA00023658054300001124
Figure BDA00023658054300001125
设式(1)表示的系统为n阶系统,如果对于任意整数s>n,满足
Figure BDA0002365805430000121
Figure BDA0002365805430000122
为系统的状态空间,
Figure BDA0002365805430000123
定义如下:
Figure BDA0002365805430000124
由此,可通过闭环子空间方法对系统矩阵进行辨识;首先构造输入输出矩阵以及误差向量,根据式(7)构造扩展子空间,将Y[k k+s]沿子空间∑[k k+s]
Figure BDA00023658054300001216
分解成两部分之和
Figure BDA0002365805430000125
上式第二项可表示为
Figure BDA0002365805430000126
而式(9)的第一项可作为ΓNX[k k+s]的近似,即
Figure BDA0002365805430000127
然后通过矩阵SVD分解可得到矩阵ΓN,最后分别计算出系统矩阵A,B,C。
采用扩展子空间方法对系统矩阵{A,B,C}的估计为一致估计,由式(2)可知
Figure BDA0002365805430000128
对上式进行斜投影
Figure BDA0002365805430000129
根据扩展子空间∑[k k+s]的定义以及斜投影的性质,上式第二项为零,则
Figure BDA00023658054300001210
若上式成立,当s→∞时,系统矩阵的估计值
Figure BDA00023658054300001211
为一致估计,即
Figure BDA00023658054300001212
Figure BDA00023658054300001213
控制器设计
控制器根据反馈时延情况在线递推计算控制量序列,并发送至执行器。在式(1)中,令
Figure BDA00023658054300001214
系统可表示为
Figure BDA00023658054300001215
k时刻控制器收到的数据[u(k),y(k)]实际为k-τsc时刻传感器端发送的数据[u(k-τsc),y(k-τsc)];控制器根据数据包时间戳计算反馈时延τsc并进行补偿;若p+N-1个数据对[u(k),y(k)]为已知,对系统表达式迭代展开可得到
Figure BDA0002365805430000131
其中Yk=[y(k-N+1)y(k-N+2)…y(k)]
Figure BDA0002365805430000132
Ek=[e(k-N+1)e(k-N+2)…e(k)]
Figure BDA0002365805430000133
Xk-p=[x(k-p-N+1)x(k-p-N+2)…x(k-p)]
Zp称为过去输入输出数据矩阵;根据系统因果关系,在N足够大的条件下,
Figure BDA0002365805430000134
对式(10)的最小二乘问题进行求解,可得到Ξ0的估计值[17]
Figure BDA0002365805430000135
上标
Figure BDA0002365805430000136
表示穆尔-彭诺斯广义逆(Moore-Penrose),可通过矩阵LQ分解对式(11)求解:
Figure BDA0002365805430000137
Figure BDA0002365805430000138
假设预测长度为f,令
Figure BDA0002365805430000139
在k时刻可预测未来f步系统输出[14]
Figure BDA00023658054300001310
其中
Figure BDA00023658054300001311
U[k,k+f-1)=[uT(k)uT(k+1)…uT(k+f-2)]T
Figure BDA0002365805430000141
假定参考信号序列为
γ[k+1,k+f)=[rT(k+1)rT(k+2)…rT(k+f-1)]T,设定如下目标函数:
Figure BDA0002365805430000142
式中Q,R为正定加权矩阵;令
Figure BDA0002365805430000143
可计算出最优预测控制量序列:
Figure BDA0002365805430000144
其中,
Figure BDA0002365805430000145
Figure BDA0002365805430000146
通过式(13)、(14)和(15)可看出,若实时更新
Figure BDA0002365805430000147
Γ和Λ,就能实时计算最优多步控制量序列;而如果用式(12)进行矩阵LQ分解来更新
Figure BDA0002365805430000148
则过于复杂不适于在线计算;为提高系统实时性,本发明采用一种较为简便的递推计算方法;在获得新数据u(k+1)和y(k+1)后,将向量[uT(k-p+1) yT(k-p+1) uT(k-p+2) yT(k-p+2)…uT(k)yT(k)]T加入到Zp的最后一列,而把第一列旧向量剔除,保持数据量不变;令:
Zn=[uT(k-p+1)yT(k-p+1)uT(k-p+2)yT(k-p+2)…uT(k)yT(k)T
Z0=[uT(k-p-N+2)yT(k-p-N+2)uT(k-p-N+3)yT(k-p-N+
3)…uT(k-N+1)yT(k-N+1)]T
Yn=[y(k+1)],
Figure BDA0002365805430000149
Yo=[y(k-N+1)],
Figure BDA00023658054300001410
Figure BDA00023658054300001411
则W1、W2、W3和W4满足如下关系:
[W1 W2]=[W3 W4]
于是有[W1 W2][W1 W2]T=[W3 W4][W3 W4]T
Figure BDA00023658054300001412
根据性质,i=j,
Figure BDA0002365805430000151
和i≠j,
Figure BDA0002365805430000152
并令
Figure BDA0002365805430000153
Figure BDA0002365805430000154
将式(16)展开,并根据矩阵相等理论,可得到下列递推公式:
Figure BDA0002365805430000155
于是可按式(12)对
Figure BDA0002365805430000156
进行更新
Figure BDA0002365805430000157
由此,只需要离线计算一次
Figure BDA0002365805430000158
Figure BDA0002365805430000159
此后每个采样时刻得到新的输入输出数据后,就可通过式(17)和(18)在线更新
Figure BDA00023658054300001510
而不是每个时刻都通过式(12)的矩阵LQ分解进行求解,再通过式(14)求出新的Γ和Λ,最后通过式(15)计算最新的最优预测控制量序列。
控制器收到传感器数据包,根据时间戳计算反馈时延
Figure BDA00023658054300001511
利用本文控制算法主动补偿反馈时延和前向时延的影响;控制数据包的数据长度因
Figure BDA00023658054300001512
的不同而不同。若k时刻控制量序列计算为:[u(k+1|k),u(k+2|k),…,u(k+f-1|k)],则其中的
Figure BDA00023658054300001513
个控制量
Figure BDA00023658054300001514
将被打包成一个块包发送给执行器。执行器端的延迟补偿器根据时间戳选择最新时序的控制包存于缓存区,并计算总时延,根据总时延从序列中挑选控制数据作用于被控对象。比如总时延为
Figure BDA00023658054300001515
时,则从序列中选择控制量
Figure BDA00023658054300001516
通过计算系统输入输出误差序列,构造闭环子空间从而计算闭环子空间矩阵,克服开环子空间方法的有偏性;通过构造预测模型,设计闭环子空间预测控制算法及补偿结构,主动补偿网络时延的影响,克服时延的影响;同时考虑系统实时性,采用一种简便的参数矩阵更新方法替代复杂的矩阵分解算法,从而减小最优多步控制量的在线递推计算量,减小了计算复杂度,提高了系统实时性。
实验验证
以一个单输入单输出的二阶直流电机伺服系统为实验对象,对本发明提出的控制方法进行验证。直流电机模型由传递函数来描述:
Figure BDA00023658054300001517
设采样周期T=0.04s,反馈时延和前向时延上界均为2T。首先将传递函数离散化为状态空间模型
Figure BDA0002365805430000161
y(k)=[0.00700.0061]x(k)
电机转速由系统输出y表示,电机输入电压由系统输入u表示。为辨识系统矩阵参数,将图2的伪随机二值信号施加于被控对象,得到图3所示的输出信号。
将本发明方法与开环子空间方法作比较。在开环子空间方法中,先不考虑加入反馈闭环,通过输入输出数据构建Hankel矩阵,再按相应算式及矩阵Q-R分解方法,计算出Lw和Lu
Figure BDA0002365805430000162
Figure BDA0002365805430000163
然后根据Lw和Lu在线计算未来控制输入序列。
采用本发明方法对被控对象进行线辨识,得到系统矩阵的估计值:
Figure BDA0002365805430000164
取p=10,f=5,N=100,Q=I,R=I,按本发明控制算法主动补偿时延影响;图4和图5分别表示总时延小于等于2T、4T时,两种不同方法的阶跃响应情况;从性能上看,本发明方法明显好于开环子空间方法。
如上即为本发明的实施例。上述实施例以及实施例中的具体参数仅是为了清楚表述发明验证过程,并非用以限制本发明的专利保护范围,本发明的专利保护范围仍然以其权利要求书为准,凡是运用本发明的说明书及附图内容所作的等同结构变化,同理均应包含在本发明的保护范围内。

Claims (5)

1.一种数据驱动的网络控制系统时延主动补偿控制方法,其特征在于,包括如下步骤:
S1、获取控制系统输入数据和输出数据,在云服务器中将输入输出数据转换成Hankel矩阵形式;
S2、分析系统输入与噪声之间的相关性,计算输入输出误差序列,构造闭环系统的扩展子空间,利用子空间方法,根据输入输出数据辨识系统矩阵;
S3、根据系统矩阵建立控制系统的状态模型;
S4、根据系统状态模型设计预测控制算法,设立目标性能函数,计算最优多步预测控制量序列,主动补偿网络时延影响;
S5、根据输入输出数据对矩阵参数进行更新,滚动计算最优多步控制量序列,实现最优多步控制量的在线递推计算,减小计算量,提高系统实时性。
2.根据权利要求1所述的一种数据驱动的网络控制系统时延主动补偿控制方法,其特征在于:步骤S1中Hankel矩阵的建立方法为:考虑输入输出数据离散线性时不变状态空间信息形式:
Figure FDA0002365805420000011
其中A、B、C为具有相应维数的常矩阵,K为卡尔曼滤波增益,e(k)为噪声序列;xk∈Rn为系统状态,系统输出为yk∈Rm,作用于被控对象的控制量uk∈Rl
对式(1)进行迭代可得如下的输入输出方程:
Figure FDA0002365805420000012
Figure FDA0002365805420000013
Figure FDA0002365805420000014
其中Xp和Xf代表系统“过去”和“将来”的状态矩阵,Up、Uf、Yp、Yf、Ef为Hankel矩阵。
3.根据权利要求2所述的一种数据驱动的网络控制系统时延主动补偿控制方法,其特征在于,步骤S2中闭环系统的扩展子空间构造过程为:
因数据传输存在时延现象,控制器的状态空间模型需考虑时延因素:
Figure FDA0002365805420000021
式中τ为传输时延,v为白噪声输入,控制器输入即为系统输出y,控制器输出即为系统输入u,控制器状态向量为xc;考虑时延因素,将Bc,Dc参数改为受时延影响的变量形式,模型改写为
Figure FDA0002365805420000022
用下列暂态形式替代式(1)和(3)的白噪声项e(k)、v(k)
Figure FDA0002365805420000023
Figure FDA0002365805420000024
其中输入输出序列
Figure FDA0002365805420000025
是k0至k时刻的有限维序列;u(k)、y(k)在W[k0k)上的投影分别用u(k)/W[k0k)和y(k)/W[k0k)表示;当(k-k0)→∞时,
Figure FDA0002365805420000026
Figure FDA0002365805420000027
系统状态向量和控制器状态向量的kalman估计由下述投影计算:
Figure FDA0002365805420000028
其值根据输入输出序列的更新通过下式进行更新:
Figure FDA0002365805420000029
Figure FDA00023658054200000210
Figure FDA00023658054200000211
分别表示由白噪声向量
Figure FDA00023658054200000212
张成的Hilbert空间;则上式中W[k0k+1)可计算为
Figure FDA00023658054200000213
Figure FDA00023658054200000214
表示直和运算;闭环系统因此可改写为:
Figure FDA00023658054200000215
Figure FDA00023658054200000216
将式(5)中的
Figure FDA00023658054200000217
用u(k),
Figure FDA00023658054200000218
的函数形式来表示,并代回到(4)式计算,令
Figure FDA00023658054200000219
可得到
Figure FDA00023658054200000220
Figure FDA0002365805420000031
定义
Figure FDA0002365805420000032
Figure FDA0002365805420000033
则有
Figure FDA0002365805420000034
Figure FDA0002365805420000035
Figure FDA0002365805420000036
当lim(k-k0)→∞时,limB(k)→B,limBc(k)→Bc,limDc(k)→Dc,limL(k)→L,从而
Figure FDA0002365805420000037
定义
Figure FDA0002365805420000038
Figure FDA0002365805420000039
Figure FDA00023658054200000310
将式(1)的等式两边对
Figure FDA00023658054200000311
作正交投影可得到
Figure FDA00023658054200000312
从(6)式可知,状态变化量
Figure FDA00023658054200000313
与噪声
Figure FDA00023658054200000314
Figure FDA00023658054200000315
线性相关,即系统形成闭环后所引入的噪声与系统输入具有相关性;定义误差向量
Figure FDA00023658054200000316
并构造如下的闭环子空间:
Figure FDA00023658054200000317
其中,
Figure FDA00023658054200000318
若定义
Figure FDA00023658054200000319
则有以下等式成立,
Figure FDA00023658054200000320
Figure FDA00023658054200000321
设式(1)表示的系统为n阶系统,如果对于任意整数s>n,满足
Figure FDA00023658054200000322
Figure FDA00023658054200000323
为系统的状态空间,
Figure FDA00023658054200000324
定义如下:
Figure FDA00023658054200000325
由此,可通过闭环子空间方法对系统矩阵进行辨识;首先构造输入输出矩阵以及误差向量,根据式(7)构造扩展子空间,将Y[kk+s]沿子空间∑[kk+s]
Figure FDA00023658054200000326
分解成两部分之和
Figure FDA0002365805420000041
上式第二项可表示为
Figure FDA0002365805420000042
而式(9)的第一项可作为ΓNX[kk+s]的近似,即
Figure FDA0002365805420000043
然后通过矩阵SVD分解可得到矩阵ΓN,最后分别计算出系统矩阵A,B,C;
采用扩展子空间方法对系统矩阵{A,B,C}的估计为一致估计,由式(2)可知
Figure FDA0002365805420000044
对上式进行斜投影
Figure FDA0002365805420000045
根据扩展子空间∑[kk+s]的定义以及斜投影的性质,上式第二项为零,则
Figure FDA0002365805420000046
若上式成立,当s→∞时,系统矩阵的估计值
Figure FDA0002365805420000047
为一致估计,即
Figure FDA0002365805420000048
4.根据权利要求3所述的一种数据驱动的网络控制系统时延主动补偿控制方法,其特征在于,步骤S4中最优多步预测控制量序列的计算方法为:控制器根据反馈时延情况在线递推计算控制量序列,并发送至执行器;在式(1)中,令
Figure FDA0002365805420000049
系统可表示为:
Figure FDA00023658054200000410
k时刻控制器收到的数据[u(k),y(k)]实际为k-τsc时刻传感器端发送的数据[u(k-τsc),y(k-τsc)];控制器根据数据包时间戳计算反馈时延τsc并进行补偿;若p+N-1个数据对[u(k),y(k)]为已知,对系统表达式迭代展开可得到
Figure FDA00023658054200000411
其中Yk=[y(k-N+1) y(k-N+2) … y(k)]
Figure FDA00023658054200000412
Ek=[e(k-N+1) e(k-N+2) … e(k)]
Figure FDA0002365805420000051
Xk-p=[x(k-p-N+1) x(k-p-N+2) … x(k-p)]
Zp称为过去输入输出数据矩阵;根据系统因果关系,在N足够大的条件下,
Figure FDA0002365805420000052
对式(10)的最小二乘问题进行求解,可得到Ξ0的估计值
Figure FDA0002365805420000053
上标
Figure FDA0002365805420000054
表示穆尔-彭诺斯广义逆(Moore-Penrose),式(11)的求解可通过矩阵LQ分解进行:
Figure FDA0002365805420000055
Figure FDA0002365805420000056
假设预测长度为f,令
Figure FDA0002365805420000057
在k时刻可预测未来f步系统输出[14]
Figure FDA0002365805420000058
其中
Figure FDA0002365805420000059
U[k,k+f-1)=[uT(k) uT(k+1) … uT(k+f-2)]T
Figure FDA00023658054200000510
假定参考信号序列为:
γ[k+1,k+f)=[rT(k+1) rT(k+2) …rT(k+f-1)]T
设定如下目标函数:
Figure FDA0002365805420000061
式中Q,R为正定加权矩阵;令
Figure FDA0002365805420000062
可计算出最优预测控制量序列:
Figure FDA0002365805420000063
其中,
Figure FDA0002365805420000064
通过式(13)、(14)和(15)可看出,若实时更新
Figure FDA0002365805420000065
Γ和Λ,就能实时计算最优多步控制量序列。
5.根据权利要求4所述的一种数据驱动的网络控制系统时延主动补偿控制方法,其特征在于,步骤S5中对矩阵参数的更新具体算法为:数据更新过程中,考虑在线实时性问题,找出参数在k+1时刻与k时刻的递推关系来实现参数的更新,在获得新数据u(k+1)和y(k+1)后,将向量[uT(k-p+1)、yT(k-p+1)、uT(k-p+2)、yT(k-p+2)…uT(k)、yT(k)]T加入到Zp的最后一列,而把第一列旧向量剔除,保持数据量不变,令:
Zn=[uT(k-p+1) yT(k-p+1) uT(k-p+2) yT(k-p+2) … uT(k) yT(k)]T
Zo=[uT(k-p-N+2) yT(k-p-N+2) uT(k-p-N+3) yT(k-p-N+3) … uT(k-N+1) yT(k-N+1)]T
Yn=[y(k+1)],
Figure FDA0002365805420000066
Yo=[y(k-N+1)],
Figure FDA0002365805420000067
Figure FDA0002365805420000068
则W1、W2、W3和W4满足如下关系:
[W1 W2]=[W3 W4]
于是有[W1 W2][W1 W2]T=[W3 W4][W3 W4]T
Figure FDA0002365805420000069
根据性质,i=j,
Figure FDA00023658054200000610
和i≠j,
Figure FDA00023658054200000611
并令
Figure FDA00023658054200000612
Figure FDA00023658054200000613
将式(16)展开,并根据矩阵相等理论,可得到下列递推公式:
Figure FDA00023658054200000614
于是可按式(12)对
Figure FDA0002365805420000071
进行更新
Figure FDA0002365805420000072
从上式可看出,只需要离线计算一次
Figure FDA0002365805420000073
Figure FDA0002365805420000074
此后的每个采样时刻得到新的输入输出数据后,就可通过式(17)和(18)在线更新
Figure FDA0002365805420000075
再通过式(14)求出新的Γ和Λ,最后通过式(15)计算最新的最优预测控制量序列。
CN202010035401.6A 2020-01-14 2020-01-14 一种数据驱动的网络控制系统时延主动补偿控制方法 Pending CN111190350A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010035401.6A CN111190350A (zh) 2020-01-14 2020-01-14 一种数据驱动的网络控制系统时延主动补偿控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010035401.6A CN111190350A (zh) 2020-01-14 2020-01-14 一种数据驱动的网络控制系统时延主动补偿控制方法

Publications (1)

Publication Number Publication Date
CN111190350A true CN111190350A (zh) 2020-05-22

Family

ID=70708162

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010035401.6A Pending CN111190350A (zh) 2020-01-14 2020-01-14 一种数据驱动的网络控制系统时延主动补偿控制方法

Country Status (1)

Country Link
CN (1) CN111190350A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112636719A (zh) * 2020-12-17 2021-04-09 郑州轻工业大学 数据丢失和信道噪声干扰下的ilc系统输入信号滤波方法
CN112650251A (zh) * 2020-12-24 2021-04-13 北京理工大学 基于云计算的主从式多智能体预测控制系统及方法
CN115134162A (zh) * 2022-07-15 2022-09-30 西南民族大学 一种工业控制系统恶意威胁的检测和补偿方法及电子设备

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109491247A (zh) * 2018-11-19 2019-03-19 北京理工大学 一种数据驱动预测云控制方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109491247A (zh) * 2018-11-19 2019-03-19 北京理工大学 一种数据驱动预测云控制方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
付伟: "网络控制系统长时延和丢包的主动补偿控制方法研究", 《中国博士学位论文全文数据库 信息科技辑》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112636719A (zh) * 2020-12-17 2021-04-09 郑州轻工业大学 数据丢失和信道噪声干扰下的ilc系统输入信号滤波方法
CN112636719B (zh) * 2020-12-17 2023-10-13 郑州轻工业大学 数据丢失和信道噪声干扰下的ilc系统输入信号滤波方法
CN112650251A (zh) * 2020-12-24 2021-04-13 北京理工大学 基于云计算的主从式多智能体预测控制系统及方法
CN115134162A (zh) * 2022-07-15 2022-09-30 西南民族大学 一种工业控制系统恶意威胁的检测和补偿方法及电子设备

Similar Documents

Publication Publication Date Title
Zou et al. Finite-time bipartite synchronization of switched competitive neural networks with time delay via quantized control
CN111190350A (zh) 一种数据驱动的网络控制系统时延主动补偿控制方法
Sahoo et al. Near optimal event-triggered control of nonlinear discrete-time systems using neurodynamic programming
Liu et al. Adaptive fixed-time hierarchical sliding mode control for switched under-actuated systems with dead-zone constraints via event-triggered strategy
CN112327633A (zh) 具有时滞和干扰的领导跟随多智能体系统一致性的方法
CN113406886B (zh) 单连杆机械臂的模糊自适应控制方法、系统及存储介质
Zhao et al. A predictive control-based approach to networked Hammerstein systems: Design and stability analysis
Li et al. Event-triggered group consensus for one-sided Lipschitz multi-agent systems with input saturation
Fei et al. A discontinuous Lyapunov function approach for hybrid event-triggered control of T–S fuzzy systems
Xiong et al. Fixed-time adaptive observer-based time-varying formation control for multi-agent systems with directed topologies
Xu et al. Channel modeling and LQG control in the presence of random delays and packet drops
Li et al. Adaptive event-triggered finite-time H∞ control for fuzzy semi-Markovian jump systems with immeasurable premise variables
Cao et al. A distributed predictive formation control strategy for cyber-physical multi-agent systems under communication constraints
Li et al. Distributed adaptive leader-following consensus control of connected Lagrangian systems with input hysteresis quantization and time-varying control gain
Berkel et al. An event-triggered cooperation approach for robust distributed model predictive control
Fu et al. Dynamic event-triggered adaptive control for uncertain stochastic nonlinear systems
Tran et al. A modified generic second order algorithm with fixed-time stability
WO2022257185A1 (zh) 一种基于人工神经网络的机器人外界接触力估计方法
Long et al. Finite-time consensus of nonlinear multi-agent systems via impulsive time window theory: a two-stage control strategy
Heydari et al. Robust event-triggered model predictive control of polytopic LPV systems: An input-to-state stability approach
Qi et al. Adaptive learning control for triggered switched systems based on unknown direction control gain function
CN114488786A (zh) 一种基于a3c和事件触发的网络化伺服系统控制方法
Yu et al. A data-driven distributed adaptive control approach for nonlinear multi-agent systems
Elamin et al. On the steady-state error covariance matrix of Kalman filtering with intermittent observations in the presence of correlated noises at the same time
Li et al. Adaptive reduced parameters fault-tolerant tracking control for stochastic multiagent systems with simplified memory event-triggered strategy

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200522

RJ01 Rejection of invention patent application after publication