CN113325718A - 一种考虑跟踪误差约束的最优跟踪控制方法、系统、处理设备、存储介质 - Google Patents

一种考虑跟踪误差约束的最优跟踪控制方法、系统、处理设备、存储介质 Download PDF

Info

Publication number
CN113325718A
CN113325718A CN202110648719.6A CN202110648719A CN113325718A CN 113325718 A CN113325718 A CN 113325718A CN 202110648719 A CN202110648719 A CN 202110648719A CN 113325718 A CN113325718 A CN 113325718A
Authority
CN
China
Prior art keywords
optimal
error
tracking
equation
controller
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110648719.6A
Other languages
English (en)
Inventor
王桐
王雨佳
邱剑彬
纪文强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harbin Institute of Technology
Original Assignee
Harbin Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harbin Institute of Technology filed Critical Harbin Institute of Technology
Priority to CN202110648719.6A priority Critical patent/CN113325718A/zh
Publication of CN113325718A publication Critical patent/CN113325718A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/042Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance

Abstract

本发明提供一种考虑跟踪误差约束的最优跟踪控制方法,包括以下步骤:步骤1.建立大规模系统的数学模型;步骤2.把含有约束的跟踪误差转化为没有约束的误差;步骤3.利用转换后的误差设计性能指标并利用自适应动态规划技术设计最优跟踪控制器;步骤4.利用互联倒立摆系统仿真验证所提方法的有效性。本发明在考虑跟踪误差约束下设计了最优跟踪控制器;简化了关于大规模互联系统的最优跟踪控制器方案的设计。

Description

一种考虑跟踪误差约束的最优跟踪控制方法、系统、处理设 备、存储介质
技术领域
本发明涉及最优跟踪控制技术领域,具体来说是一种考虑跟踪误差约束的最优跟踪控制方法、系统、处理设备、存储介质。
背景技术
大规模系统一般指由多个子系统互联而成的系统。此类系统广泛存在于电力和化工等领域。由于大规模互联系统的多变量,高度非线性和强耦合等特性,设计有效的控制器尤为困难。现有的针对此类系统的控制器设计方法中使用的最多的是集散控制,它考虑互联项并对每个子系统设计一个局部控制器而保证整个控制系统的稳定。随着控制任务越来越复杂,我们也希望控制器在保证闭环系统稳定的同时,在要求的性能指标下是最优的。因此,关于大规模系统的最优控制得到了人们的关注。同时,在控制器设计过程中,系统暂态响应也是一项重要的评价指标。因此,预设性能控制也得到了广泛的研究。虽然,已有学者对大规模系统的预设性能最优控制问题进行研究。但由于最优控制方法的局限性,也即是性能指标在有限或无限时间域内应为有界值,我们一般在被控系统零平衡点处设计控制器。然而,实际中很多系统并不满足此条件,即使可以通过坐标变换使之满足假设条件,系统的平衡点需要事先已知。综上所述,现有的最优控制方案仍然存在以下几个难题:
1)如何在满足跟踪误差约束下设计最优跟踪控制器。
2)如何针对一类含有非零平衡点的大规模互联系统设计最优跟踪控制器。
如申请号为202010665160.3公开的一种基于预设性能的超高声速飞行器姿态控制方法,该专利考虑了预设性能提出了一种基于超高声速飞行器姿态控制方案。首先,建立高超声速姿态控制数学模型;接着,引入扩张观测器对未知函数进行估计和补偿;最后,利用反步控制技术设计控制器。该方法存在以下两点缺点:
1)只考虑了性能约束并没有考虑最优问题;
2)设计的控制器适合单个系统,不能应用于大规模系统。
再如申请号为201810799985.7公开的一种基于自适应动态规划的分布式最优协同容错控制方法,该专利利用自适应动态规划技术设计了一种分布式最优容错控制方案。首先建立大规模被控对象的模型;接着利用最优控制理论设计最优控制器;最后,设计估计器估计系统中发生的未知故障,进而设计一种分布式最优容错控制方法。该方法存在以下缺点:
1)此方案缺少仿真验证或者实验验证;
2)此方案没有考虑性能约束的问题。
因此,如果针对一类含有非零平衡点的大规模系统设计一种预设性能最优控制器成为一个新的难题。
发明内容
本发明所要解决的技术问题在于针对含有非零平衡点的大规模系统设计一种考虑跟踪误差约束的最优跟踪控制方法。
本发明通过以下技术手段实现解决上述技术问题的:
一种考虑跟踪误差约束的最优跟踪控制方法,包括以下步骤:
步骤1.建立大规模系统的数学模型;
步骤2.把含有约束的跟踪误差转化为没有约束的误差;
步骤3.利用转换后的误差设计性能指标并利用自适应动态规划技术设计最优跟踪控制器;
步骤4.利用互联倒立摆系统仿真验证所提方法的有效性。
本发明在考虑跟踪误差约束下设计了最优跟踪控制器;简化了关于大规模互联系统的最优跟踪控制器方案的设计。
进一步的,所述步骤1具体为:
考虑子系统如下的互联大规模系统
Figure BDA0003110241110000021
其中i=1,2,…,N表示第i个子系统,xi,1和xi,2代表子系统的两个状态变量,
Figure BDA0003110241110000022
Figure BDA0003110241110000023
代表子系统的非线性函数,
Figure BDA0003110241110000024
代表系统的互联项,ui代表子系统的控制输入,yi代表子系统的输出,
Figure BDA0003110241110000025
为系统的状态向量;令yi,r代表系统的输出参考信号。
进一步的,所述步骤2具体为:定义系统的跟踪误差为
Figure BDA0003110241110000026
其中
Figure BDA0003110241110000027
为参考信号yi,r的导数,假设跟踪误差受到以下约束
Figure BDA0003110241110000031
其中
Figure BDA0003110241110000032
其中k i,1k i,2
Figure BDA0003110241110000033
Figure BDA0003110241110000034
是与约束有关的正常数,ρi,1和ρi,2是性能函数,表示如下
Figure BDA0003110241110000035
li,1,li,2为正常数。接下来为了方便控制器设计,把形如公式(3)的含有约束的误差ei,1,ei,2转换为不含约束的误差zi,1,zi,2
定义
Figure BDA0003110241110000036
Figure BDA0003110241110000037
因此,得到
Figure BDA0003110241110000038
对以上两个变量求导,得
Figure BDA0003110241110000039
定义
Figure BDA0003110241110000041
所以
Figure BDA0003110241110000042
进一步的,所述步骤3具体为:定义一个新的变量如下
Ei=λizi,1+zi,2 (12)
式(12)的导数为
Figure BDA0003110241110000043
定义性能指标为
Figure BDA0003110241110000044
其中qi和ri为正常数;根据公式(14),得哈密顿方程如下
Figure BDA0003110241110000045
其中
Figure BDA0003110241110000046
为性能指标函数对变量Ei的偏导数;
定义最优性能指标为
Figure BDA0003110241110000047
把公式(1),(11),(13),(16)带入到公式(15)得最优控制器如下
Figure BDA0003110241110000051
其中
Ai,1=ri
Figure BDA0003110241110000052
Figure BDA0003110241110000053
Figure BDA0003110241110000054
由于最优性能指标未知,不能利用公式(17)直接获得最优控制器,我们引入神经网络学习算法来逼近最优控制器;首先设计一个神经网络逼近性能指标
Figure BDA0003110241110000055
其中,W是最优权值向量,h是基函数向量,o(Ei)为神经网络得逼近误差,对上式关于Ei求偏导得
Figure BDA0003110241110000056
把公式(19)带入公式(15),并根据公式(1),(2),(11),(12)和(13)得
Figure BDA0003110241110000057
Figure BDA0003110241110000061
表示权值的估计向量,并把它代入到公式(15)得
Figure BDA0003110241110000062
公式(20)减去公式(21),并定义权值估计误差为
Figure BDA0003110241110000063
Figure BDA0003110241110000064
定义代价函数为
Figure BDA0003110241110000065
则神经网络权值的更新率可以设计为
Figure BDA0003110241110000066
其中
Figure BDA0003110241110000067
为正常数,因此,最优控制器的近似表达如下
Figure BDA0003110241110000068
与上述方法对应的,本发明还提供一种考虑跟踪误差约束的最优跟踪控制系统,包括:
数学模型建立模块,建立大规模系统的数学模型;
跟踪误差转换模块,把含有约束的跟踪误差转化为没有约束的误差;
最优跟踪控制器设计模块,利用转换后的误差设计性能指标并利用自适应动态规划技术设计最优跟踪控制器;
验证模块,利用互联倒立摆系统仿真验证所提方法的有效性。
进一步的,所述数学模型建立模块执行过程具体为:
考虑子系统如下的互联大规模系统
Figure BDA0003110241110000071
其中i=1,2,…,N表示第i个子系统,xi,1和xi,2代表子系统的两个状态变量,
Figure BDA0003110241110000072
Figure BDA0003110241110000073
代表子系统的非线性函数,
Figure BDA0003110241110000074
代表系统的互联项,ui代表子系统的控制输入,yi代表子系统的输出,
Figure BDA0003110241110000075
为系统的状态向量;令yi,r代表系统的输出参考信号。
进一步的,所述跟踪误差转换模块执行过程具体为:定义系统的跟踪误差为
Figure BDA0003110241110000076
其中
Figure BDA0003110241110000077
为参考信号yi,r的导数,假设跟踪误差受到以下约束
Figure BDA0003110241110000078
其中
Figure BDA0003110241110000079
其中k i,1k i,2
Figure BDA00031102411100000710
Figure BDA00031102411100000711
是与约束有关的正常数,ρi,1和ρi,2是性能函数,表示如下
Figure BDA00031102411100000712
li,1,li,2为正常数,接下来为了方便控制器设计,把形如公式(3)的含有约束的误差ei,1,ei,2转换为不含约束的误差zi,1,zi,2
定义
Figure BDA00031102411100000713
Figure BDA0003110241110000081
因此,得到
Figure BDA0003110241110000082
对以上两个变量求导,得
Figure BDA0003110241110000083
定义
Figure BDA0003110241110000084
所以
Figure BDA0003110241110000085
进一步的,所述最优跟踪控制器设计模块执行过程具体为:定义一个新的变量如下
Ei=λizi,1+zi,2 (37)
式(12)的导数为
Figure BDA0003110241110000086
定义性能指标为
Figure BDA0003110241110000087
其中qi和ri为正常数;根据公式(14),得哈密顿方程如下
Figure BDA0003110241110000091
其中
Figure BDA0003110241110000092
为性能指标函数对变量Ei的偏导数;
定义最优性能指标为
Figure BDA0003110241110000093
把公式(1),(11),(13),(16)带入到公式(15)得最优控制器如下
Figure BDA0003110241110000094
其中
Ai,1=ri
Figure BDA0003110241110000095
Figure BDA0003110241110000096
Figure BDA0003110241110000097
由于最优性能指标未知,不能利用公式(17)直接获得最优控制器,我们引入神经网络学习算法来逼近最优控制器;首先设计一个神经网络逼近性能指标
Figure BDA0003110241110000098
其中,W是最优权值向量,h是基函数向量,o(Ei)为神经网络得逼近误差,对上式关于Ei求偏导得
Figure BDA0003110241110000099
把公式(19)带入公式(15),并根据公式(1),(2),(11),(12)和(13)得
Figure BDA0003110241110000101
Figure BDA0003110241110000102
表示权值的估计向量,并把它代入到公式(15)得
Figure BDA0003110241110000103
公式(20)减去公式(21),并定义权值估计误差为
Figure BDA0003110241110000104
Figure BDA0003110241110000105
定义代价函数为
Figure BDA0003110241110000106
则神经网络权值的更新率可以设计为
Figure BDA0003110241110000107
其中
Figure BDA0003110241110000108
为正常数,因此,最优控制器的近似表达如下
Figure BDA0003110241110000109
本发明还提供一种处理设备,包括至少一个处理器,以及与所述处理器通信连接的至少一个存储器,其中:所述存储器存储有可被处理器执行的程序指令,所述处理器调用所述程序指令能够执行上述的方法。
本发明还提供一种计算机可读存储介质,所述计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行上述的方法。
本发明的优点在于:
本发明在考虑跟踪误差约束下设计了最优跟踪控制器;由于现有的最优跟踪控制器一般分为两部分完成,一部分用来设计稳态控制器,一部分用来设计反馈控制器。而本专利所设计的最优性能指标,可以直接求解出最优跟踪控制器,简化了关于大规模互联系统的最优跟踪控制器方案的设计。
附图说明
图1为采用本发明实施例中考虑跟踪误差约束的最优跟踪控制方法所获得的最优控制系统框图;
图2为本发明实施例中考虑跟踪误差约束的最优跟踪控制方法步骤3中验证所用的互联倒立摆系统结构示意图;
图3为图2中互联倒立摆系统应用本发明后的跟踪信号和实际输出信号随时间的变化曲线图;
图4为图2中互联倒立摆系统应用本发明后的跟踪误差信号随时间的变化曲线图及预设的跟踪约束函数随时间的变化曲线图;
图5为图2中互联倒立摆系统应用本发明后系统的控制输入变化曲线图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。本实施例公开一种考虑跟踪误差约束的最优跟踪控制方法,如图1所示,包括以下步骤:
步骤1.建立大规模系统的数学模型;
具体方法为:
考虑子系统如下的互联大规模系统
Figure BDA0003110241110000111
其中i=1,2,…,N表示第i个子系统,xi,1和xi,2代表子系统的两个状态变量,
Figure BDA0003110241110000121
Figure BDA0003110241110000122
代表子系统的非线性函数,
Figure BDA0003110241110000123
代表系统的互联项,ui代表子系统的控制输入,yi代表子系统的输出,
Figure BDA0003110241110000124
为系统的状态向量。令yi,r代表系统的输出参考信号,则我们需要设计控制器使互联系统在跟踪误差约束下最优。
步骤2.含有约束的跟踪误差变量转换;具体为:定义系统的跟踪误差为
Figure BDA0003110241110000125
其中
Figure BDA0003110241110000126
为参考信号yi,r的导数。假设跟踪误差受到以下约束
Figure BDA0003110241110000127
其中
Figure BDA0003110241110000128
其中k i,1,ki,2
Figure BDA0003110241110000129
Figure BDA00031102411100001210
是与约束有关的正常数,ρi,1和ρi,2是性能函数,它们表示如下
Figure BDA00031102411100001211
li,1,li,2为正常数。接下来为了方便控制器设计,把形如公式(3)的含有约束的误差ei,1,ei,2转换为不含约束的误差zi,1,zi,2
定义
Figure BDA00031102411100001212
Figure BDA00031102411100001213
因此,我们得到
Figure BDA0003110241110000131
对以上两个变量求导,得
Figure BDA0003110241110000132
定义
Figure BDA0003110241110000133
所以
Figure BDA0003110241110000134
步骤3.设计性能指标并利用自适应动态规划技术设计最优跟踪控制器;
具体为:定义一个新的变量如下
Ei=λizi,1+zi,2 (62)
它的导数为
Figure BDA0003110241110000135
定义性能指标为
Figure BDA0003110241110000136
其中qi和ri为正常数。根据公式(14),得哈密顿方程如下
Figure BDA0003110241110000141
其中
Figure BDA0003110241110000142
为性能指标函数对变量Ei的偏导数。
定义最优性能指标为
Figure BDA0003110241110000143
把公式(1),(11),(13),(16)带入到公式(15)得最优控制器如下
Figure BDA0003110241110000144
其中
Ai,1=ri
Figure BDA0003110241110000145
Figure BDA0003110241110000146
Figure BDA0003110241110000147
由于最优性能指标未知,不能利用公式(17)直接获得最优控制器,我们引入神经网络学习算法来逼近最优控制器。首先设计一个神经网络逼近性能指标
Figure BDA0003110241110000148
其中,W是最优权值向量,h是基函数向量,o(Ei)为神经网络得逼近误差,对上式关于Ei求偏导得
Figure BDA0003110241110000149
(69)
把公式(19)带入公式(15),并根据公式(1),(2),(11),(12)和(13)得
Figure BDA0003110241110000151
Figure BDA0003110241110000152
表示权值的估计向量,并把它代入到公式(15)得
Figure BDA0003110241110000153
公式(20)减去公式(21),并定义权值估计误差为
Figure BDA0003110241110000154
Figure BDA0003110241110000155
定义代价函数为
Figure BDA0003110241110000156
则神经网络权值的更新率可以设计为
Figure BDA0003110241110000157
其中
Figure BDA0003110241110000158
为正常数。因此,最优控制器的近似表达如下
Figure BDA0003110241110000159
至此,针对子系统如公式(1)所示的大规模系统的预设性能最优控制器设计完毕。此控制方案的方框图如图1所示。
步骤4.利用互联倒立摆系统仿真验证所提方法的有效性。具体为:
考虑如图2所示的互联倒立摆系统,模型如下所示
Figure BDA0003110241110000161
其中,u1和u2为控制输入,θ1和θ2为系统的输出。我们将通过此专利提出的方法,设计此系统的控制输入,使倒立摆系统的两个角度θ1和θ2跟踪上给定的参考信号。系统参数为m1=2kg,m2=2.5kg,g=9.81m/s2,l=0.5m,r=0.5m,b=0.4m,k=100N/m,J1=0.5kg和J2=0.625kg。参考信号设计为y1r=y2r=sin(0.2πt),控制参数设计为λ1=λ2=3,pi,1=1.3,ri,1=0.1,pi,2=0.5和ri,1=0.1。仿真结果如图3-5所示。其中,图3给出了系统的跟踪曲线图,图4为系统的跟踪误差变化图。由图3和图4可以看出,本实施例所提的方法可以获得一个很好的跟踪效果。同时,图4可以看到,系统的跟踪误差始终保持在设计的误差约束范围内。图5给出了系统的控制输入随时间的变化。因此,可以看出,即使系统含有非零平衡点,本实施例所提的控制算法仍然可以实现系统的预设性能最优控制。
综上,本实施例提供的在考虑跟踪误差约束下设计了最优跟踪控制器方法,简化了关于大规模互联系统的最优跟踪控制器方案的设计。
与上述方法对应的,本实施例还公开一种考虑跟踪误差约束的最优跟踪控制系统,包括:
数学模型建立模块,具体方法为:
考虑子系统如下的互联大规模系统
Figure BDA0003110241110000162
其中i=1,2,…,N表示第i个子系统,xi,1和xi,2代表子系统的两个状态变量,
Figure BDA0003110241110000163
Figure BDA0003110241110000171
代表子系统的非线性函数,
Figure BDA0003110241110000172
代表系统的互联项,ui代表子系统的控制输入,yi代表子系统的输出,
Figure BDA0003110241110000173
为系统的状态向量。令yi,r代表系统的输出参考信号,则我们需要设计控制器使互联系统在跟踪误差约束下最优。
误差变量转换模块,含有约束的跟踪误差变量转换;具体为:定义系统的跟踪误差为
Figure BDA0003110241110000174
其中
Figure BDA0003110241110000175
为参考信号yi,r的导数。假设跟踪误差受到以下约束
Figure BDA0003110241110000176
其中
Figure BDA0003110241110000177
其中k i,1,ki,2
Figure BDA0003110241110000178
Figure BDA0003110241110000179
是与约束有关的正常数,ρi,1和ρi,2是性能函数,它们表示如下
Figure BDA00031102411100001710
li,1,li,2为正常数。接下来为了方便控制器设计,把形如公式(3)的含有约束的误差ei,1,ei,2转换为不含约束的误差zi,1,zi,2
定义
Figure BDA00031102411100001711
Figure BDA00031102411100001712
因此,我们得到
Figure BDA0003110241110000181
对以上两个变量求导,得
Figure BDA0003110241110000182
定义
Figure BDA0003110241110000183
所以
Figure BDA0003110241110000184
最优跟踪控制器设计模块,利用转换后的误差设计性能指标并利用自适应动态规划技术设计最优跟踪控制器:定义一个新的变量如下
Ei=λizi,1+zi,2 (88)
它的导数为
Figure BDA0003110241110000185
定义性能指标为
Figure BDA0003110241110000186
其中qi和ri为正常数。根据公式(14),得哈密顿方程如下
Figure BDA0003110241110000191
其中
Figure BDA0003110241110000192
为性能指标函数对变量Ei的偏导数。
定义最优性能指标为
Figure BDA0003110241110000193
把公式(1),(11),(13),(16)带入到公式(15)得最优控制器如下
Figure BDA0003110241110000194
其中
Ai,1=ri
Figure BDA0003110241110000195
Figure BDA0003110241110000196
Figure BDA0003110241110000197
由于最优性能指标未知,不能利用公式(17)直接获得最优控制器,我们引入神经网络学习算法来逼近最优控制器。首先设计一个神经网络逼近性能指标
Figure BDA0003110241110000198
其中,W是最优权值向量,h是基函数向量,o(Ei)为神经网络得逼近误差,对上式关于Ei求偏导得
Figure BDA0003110241110000199
把公式(19)带入公式(15),并根据公式(1),(2),(11),(12)和(13)得
Figure BDA0003110241110000201
Figure BDA0003110241110000202
表示权值的估计向量,并把它代入到公式(15)得
Figure BDA0003110241110000203
公式(20)减去公式(21),并定义权值估计误差为
Figure BDA0003110241110000204
Figure BDA0003110241110000205
定义代价函数为
Figure BDA0003110241110000206
则神经网络权值的更新率可以设计为
Figure BDA0003110241110000207
其中
Figure BDA0003110241110000208
为正常数。因此,最优控制器的近似表达如下
Figure BDA0003110241110000209
至此,针对子系统如公式(1)所示的大规模系统的预设性能最优控制器设计完毕。此控制方案的方框图如图1所示。
验证模块,利用互联倒立摆系统仿真验证所提方法的有效性。具体为:
考虑如图2所示的互联倒立摆系统,模型如下所示
Figure BDA0003110241110000211
其中,u1和u2为控制输入,θ1和θ2为系统的输出。我们将通过此专利提出的方法,设计此系统的控制输入,使倒立摆系统的两个角度θ1和θ2跟踪上给定的参考信号。系统参数为m1=2kg,m2=2.5kg,g=9.81m/s2,l=0.5m,r=0.5m,b=0.4m,k=100N/m,J1=0.5kg和J2=0.625kg。参考信号设计为y1r=y2r=sin(0.2πt),控制参数设计为λ1=λ2=3,pi,1=1.3,ri,1=0.1,pi,2=0.5和ri,1=0.1。仿真结果如图3-5所示。其中,图3给出了系统的跟踪曲线图,图4为系统的跟踪误差变化图。由图3和图4可以看出,本实施例所提的方法可以获得一个很好的跟踪效果。同时,图4可以看到,系统的跟踪误差始终保持在设计的误差约束范围内。图5给出了系统的控制输入随时间的变化。因此,可以看出,即使系统含有非零平衡点,本实施例所提的控制算法仍然可以实现系统的预设性能最优控制。
本实施例还提供一种处理设备,包括至少一个处理器,以及与所述处理器通信连接的至少一个存储器,其中:所述存储器存储有可被处理器执行的程序指令,所述处理器调用所述程序指令能够执行上述的方法。
本实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行上述的方法。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种考虑跟踪误差约束的最优跟踪控制方法,其特征在于,包括以下步骤:
步骤1.建立大规模系统的数学模型;
步骤2.把含有约束的跟踪误差转化为没有约束的误差;
步骤3.利用转换后的误差设计性能指标并利用自适应动态规划技术设计最优跟踪控制器;
步骤4.利用互联倒立摆系统仿真验证所提方法的有效性。
2.根据权利要求1所述的一种考虑跟踪误差约束的最优跟踪控制方法,其特征在于,所述步骤1具体为:
考虑子系统如下的互联大规模系统
Figure FDA0003110241100000011
其中i=1,2,…,N表示第i个子系统,xi,1和xi,2代表子系统的两个状态变量,
Figure FDA0003110241100000012
Figure FDA0003110241100000013
代表子系统的非线性函数,
Figure FDA0003110241100000014
代表系统的互联项,ui代表子系统的控制输入,yi代表子系统的输出,
Figure FDA0003110241100000015
为系统的状态向量;令yi,r代表系统的输出参考信号。
3.根据权利要求2所述的一种考虑跟踪误差约束的最优跟踪控制方法,其特征在于,所述步骤2具体为:定义系统的跟踪误差为
Figure FDA0003110241100000016
其中
Figure FDA0003110241100000017
为参考信号yi,r的导数,假设跟踪误差受到以下约束
Figure FDA0003110241100000018
其中
Figure FDA0003110241100000019
其中k i,1k i,2
Figure FDA00031102411000000110
Figure FDA00031102411000000111
是与约束有关的正常数,ρi,1和ρi,2是性能函数,表示如下
Figure FDA00031102411000000112
li,1,li,2为正常数,接下来为了方便控制器设计,把形如公式(3)的含有约束的误差ei,1,ei,2转换为不含约束的误差zi,1,zi,2
定义
Figure FDA0003110241100000021
Figure FDA0003110241100000022
因此,得到
Figure FDA0003110241100000023
对以上两个变量求导,得
Figure FDA0003110241100000024
定义
Figure FDA0003110241100000025
所以
Figure FDA0003110241100000026
4.根据权利要求3所述的一种考虑跟踪误差约束的最优跟踪控制方法,其特征在于,所述步骤3具体为:定义一个新的变量如下
Ei=λizi,1+zi,2 (114)
式(12)的导数为
Figure FDA0003110241100000031
定义性能指标为
Figure FDA0003110241100000032
其中qi和ri为正常数;根据公式(14),得义哈密顿方程如下
Figure FDA0003110241100000033
其中
Figure FDA0003110241100000034
为性能指标函数对变量Ei的偏导数;
定义最优性能指标为
Figure FDA0003110241100000035
把公式(1),(11),(13),(16)带入到公式(15)得最优控制器如下
Figure FDA0003110241100000036
其中
Ai,1=ri
Figure FDA0003110241100000037
Figure FDA0003110241100000038
Figure FDA0003110241100000039
由于最优性能指标未知,不能利用公式(17)直接获得最优控制器,我们引入神经网络学习算法来逼近最优控制器;首先设计一个神经网络逼近性能指标
Figure FDA0003110241100000041
其中,Wi是最优权值向量,hi是基函数向量,oi(Ei)为神经网络的逼近误差,对上式关于Ei求偏导得
Figure FDA0003110241100000042
把公式(19)带入公式(15),并根据公式(1),(2),(11),(12)和(13)得
Figure FDA0003110241100000043
Figure FDA0003110241100000044
表示权值的估计向量,并把它代入到公式(15)得
Figure FDA0003110241100000045
公式(20)减去公式(21),并定义
Figure FDA0003110241100000046
Figure FDA0003110241100000047
定义代价函数为
Figure FDA0003110241100000048
则神经网络权值的更新率可以设计为
Figure FDA0003110241100000049
其中
Figure FDA0003110241100000051
为正常数,因此,最优控制器的近似表达如下
Figure FDA0003110241100000052
5.一种考虑跟踪误差约束的最优跟踪控制系统,其特征在于,包括:
数学模型建立模块,建立大规模系统的数学模型;
跟踪误差转换模块,把含有约束的跟踪误差转化为没有约束的误差;
最优跟踪控制器设计模块,利用转换后的误差设计性能指标并利用自适应动态规划技术设计最优跟踪控制器;
验证模块,利用互联倒立摆系统仿真验证所提方法的有效性。
6.根据权利要求5所述的一种考虑跟踪误差约束的最优跟踪控制系统,其特征在于,所述数学模型建立模块执行过程具体为:
考虑子系统如下的互联大规模系统
Figure FDA0003110241100000053
其中i=1,2,…,N表示第i个子系统,xi,1和xi,2代表子系统的两个状态变量,
Figure FDA0003110241100000054
Figure FDA0003110241100000055
代表子系统的非线性函数,
Figure FDA0003110241100000056
代表系统的互联项,ui代表子系统的控制输入,yi代表子系统的输出,
Figure FDA0003110241100000057
为系统的状态向量;令yi,r代表系统的输出参考信号。
7.根据权利要求6所述的一种考虑跟踪误差约束的最优跟踪控制系统,其特征在于,所述跟踪误差转换模块执行过程具体为:定义系统的跟踪误差为
Figure FDA0003110241100000058
其中
Figure FDA0003110241100000059
为参考信号yi,r的导数,假设跟踪误差受到以下约束
Figure FDA00031102411000000510
其中
Figure FDA0003110241100000061
其中k i,1k i,2
Figure FDA0003110241100000062
Figure FDA0003110241100000063
是与约束有关的正常数,ρi,1和ρi,2是性能函数,表示如下
Figure FDA0003110241100000064
li,1,li,2为正常数,接下来为了方便控制器设计,把形如公式(3)的含有约束的误差ei,1,ei,2转换为不含约束的误差zi,1,zi,2
定义
Figure FDA0003110241100000065
Figure FDA0003110241100000066
因此,得到
Figure FDA0003110241100000067
对以上两个变量求导,得
Figure FDA0003110241100000068
定义
Figure FDA0003110241100000071
所以
Figure FDA0003110241100000072
8.根据权利要求7所述的一种考虑跟踪误差约束的最优跟踪控制系统,其特征在于,所述最优跟踪控制器设计模块执行过程具体为:定义一个新的变量如下
Ei=λizi,1+zi,2 (139)
式(12)的导数为
Figure FDA0003110241100000073
定义性能指标为
Figure FDA0003110241100000074
其中qi和ri为正常数;根据公式(14),得哈密顿方程如下
Figure FDA0003110241100000075
其中
Figure FDA0003110241100000076
为性能指标函数对变量Ei的偏导数;
定义最优性能指标为
Figure FDA0003110241100000077
把公式(1),(11),(13),(16)带入到公式(15)得最优控制器如下
Figure FDA0003110241100000081
其中
Ai,1=ri
Figure FDA0003110241100000082
Figure FDA0003110241100000083
Figure FDA0003110241100000084
由于最优性能指标未知,不能利用公式(17)直接获得最优控制器,我们引入神经网络学习算法来逼近最优控制器;首先设计一个神经网络逼近性能指标
Figure FDA0003110241100000085
其中,Wi是最优权值向量,hi是基函数向量,oi(Ei)为神经网络的逼近误差,对上式关于Ei求偏导得
Figure FDA0003110241100000086
把公式(19)带入公式(15),并根据公式(1),(2),(11),(12)和(13)得
Figure FDA0003110241100000087
Figure FDA0003110241100000088
表示权值的估计向量,并把它代入到公式(15)得
Figure FDA0003110241100000091
公式(20)减去公式(21),并定义权值估计误差为
Figure FDA0003110241100000092
Figure FDA0003110241100000093
定义代价函数为
Figure FDA0003110241100000094
则神经网络权值的更新率可以设计为
Figure FDA0003110241100000095
其中
Figure FDA0003110241100000096
为正常数,因此,最优控制器的近似表达如下
Figure FDA0003110241100000097
9.一种处理设备,其特征在于,包括至少一个处理器,以及与所述处理器通信连接的至少一个存储器,其中:所述存储器存储有可被处理器执行的程序指令,所述处理器调用所述程序指令能够执行如权利要求1至4任一所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行如权利要求1至4任一所述的方法。
CN202110648719.6A 2021-06-10 2021-06-10 一种考虑跟踪误差约束的最优跟踪控制方法、系统、处理设备、存储介质 Pending CN113325718A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110648719.6A CN113325718A (zh) 2021-06-10 2021-06-10 一种考虑跟踪误差约束的最优跟踪控制方法、系统、处理设备、存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110648719.6A CN113325718A (zh) 2021-06-10 2021-06-10 一种考虑跟踪误差约束的最优跟踪控制方法、系统、处理设备、存储介质

Publications (1)

Publication Number Publication Date
CN113325718A true CN113325718A (zh) 2021-08-31

Family

ID=77421292

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110648719.6A Pending CN113325718A (zh) 2021-06-10 2021-06-10 一种考虑跟踪误差约束的最优跟踪控制方法、系统、处理设备、存储介质

Country Status (1)

Country Link
CN (1) CN113325718A (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106681140A (zh) * 2016-12-23 2017-05-17 西北工业大学 一种不确定大系统低复杂度鲁棒保性能分散控制方法
CN107450316A (zh) * 2017-08-10 2017-12-08 哈尔滨工业大学 贴片机驱动系统的采样自适应鲁棒控制方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106681140A (zh) * 2016-12-23 2017-05-17 西北工业大学 一种不确定大系统低复杂度鲁棒保性能分散控制方法
CN107450316A (zh) * 2017-08-10 2017-12-08 哈尔滨工业大学 贴片机驱动系统的采样自适应鲁棒控制方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
WANG YUJIA 等: "Decentralized optimal tracking control for large-scale nonlinear systems with tracking error constraints", 《HTTPS://DOI.ORG/10.1002/ACS.3248》 *
马敏 等: "含有执行器故障的非线性切换互联大系统的自适应模糊Backstepping容错控制", 《南京信息工程大学学报》 *

Similar Documents

Publication Publication Date Title
Cho et al. Composite model reference adaptive control with parameter convergence under finite excitation
Wu et al. Practical adaptive fuzzy control of nonlinear pure-feedback systems with quantized nonlinearity input
Liu et al. Reinforcement learning design-based adaptive tracking control with less learning parameters for nonlinear discrete-time MIMO systems
Wang et al. Adaptive finite-time tracking control of switched nonlinear systems
Chen et al. Fuzzy approximation-based adaptive control of nonlinear delayed systems with unknown dead zone
Yang et al. Adaptive neural prescribed performance tracking control for near space vehicles with input nonlinearity
Liu et al. Observer-based adaptive fuzzy tracking control for a class of uncertain nonlinear MIMO systems
Chen et al. Novel adaptive neural control design for nonlinear MIMO time-delay systems
Wang et al. Direct adaptive neural control for stabilization of nonlinear time-delay systems
Liu et al. Model‐free adaptive control method for a class of unknown MIMO systems with measurement noise and application to quadrotor aircraft
He Non-fragile passive controller design for nonlinear Markovian jumping systems via observer-based controls
Li et al. Decentralized adaptive neural control of nonlinear systems with unknown time delays
Dastres et al. Neural-network-based adaptive backstepping control for a class of unknown nonlinear time-delay systems with unknown input saturation
Beyhan et al. Stable modeling based control methods using a new RBF network
Zhang et al. Fuzzy adaptive control of nonlinear MIMO systems with unknown dead zone outputs
Fan et al. Adaptive nearly optimal control for a class of continuous-time nonaffine nonlinear systems with inequality constraints
Si et al. Decentralized adaptive neural control for interconnected stochastic nonlinear delay-time systems with asymmetric saturation actuators and output constraints
Li et al. Prescribed performance trajectory tracking fault-tolerant control for dynamic positioning vessels under velocity constraints
Li et al. Finite-time composite learning control for trajectory tracking of dynamic positioning vessels
CN113325717B (zh) 基于互联大规模系统的最优容错控制方法、系统、处理设备、存储介质
Liu et al. Online H∞ control for continuous-time nonlinear large-scale systems via single echo state network
Yuan et al. Event-based adaptive horizon nonlinear model predictive control for trajectory tracking of marine surface vessel
Yoshimura Adaptive fuzzy dynamic surface control for a class of stochastic MIMO discrete-time nonlinear pure-feedback systems with full state constraints
Tanemura et al. Closed-loop data-driven estimation on passivity property
CN113325718A (zh) 一种考虑跟踪误差约束的最优跟踪控制方法、系统、处理设备、存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20210831

RJ01 Rejection of invention patent application after publication