CN113568306A - 考虑状态约束和控制增益的倒立摆系统控制方法及系统 - Google Patents

考虑状态约束和控制增益的倒立摆系统控制方法及系统 Download PDF

Info

Publication number
CN113568306A
CN113568306A CN202110691975.3A CN202110691975A CN113568306A CN 113568306 A CN113568306 A CN 113568306A CN 202110691975 A CN202110691975 A CN 202110691975A CN 113568306 A CN113568306 A CN 113568306A
Authority
CN
China
Prior art keywords
inverted pendulum
pendulum system
function
control
unknown
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110691975.3A
Other languages
English (en)
Other versions
CN113568306B (zh
Inventor
牛奔
苏薇
张家鸣
王晓梅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong Normal University
Original Assignee
Shandong Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong Normal University filed Critical Shandong Normal University
Priority to CN202110691975.3A priority Critical patent/CN113568306B/zh
Publication of CN113568306A publication Critical patent/CN113568306A/zh
Application granted granted Critical
Publication of CN113568306B publication Critical patent/CN113568306B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/042Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Feedback Control In General (AREA)

Abstract

本公开提供了一种考虑状态约束和控制增益的倒立摆系统控制方法及系统,所述方案包括:构建倒立摆系统的非线性模型,并将倒立摆系统的相关状态约束引入所述非线性模型;根据倒立摆系统控制目标以及倒立摆系统的结构,确定所述倒立摆系统的系统误差函数以及BLF函数;采用具有自适应律的径向基神经网络对所述倒立摆系统中的完全未知非线性函数进行逼近;并基于特定增益抑制不等式对所述系统误差函数进而优化求解,构建最优倒立摆系统控制器;基于所述最优倒立摆系统控制器,实现对所述倒立摆系统指定性能的自适应跟踪控制。

Description

考虑状态约束和控制增益的倒立摆系统控制方法及系统
技术领域
本公开属于随机系统控制技术领域,尤其涉及一种考虑状态约束和控制增益的倒立摆系统控制方法及系统。
背景技术
本部分的陈述仅仅是提供了与本公开相关的背景技术信息,不必然构成在先技术。
众所周知,随机干扰在实际应用中经常发生,其性质是导致控制系统不稳定的原因之一。因此,近年来,越来越多的研究都集中在随机系统的稳定性控制上。发明人发现,现有的大部分理论都忽略了状态约束的影响,从而导致系统性能不佳,其中,关于非线性系统的研究,其只考虑确定性的非线性系统,而并非随机系统;关于随机个案的研究,其仍有许多困难需要进一步解决;同时,需要说明的是,未知的控制增益也会导致随机系统的不确定性和控制器设计的复杂性,然而,尚未有针对具有未知控制增益和全状态约束的MIMO(Multi-Input Multi-Output)随机非线性系统(特别是倒立摆系统)的研究。
发明内容
本公开为了解决上述问题,提供了一种考虑状态约束和控制增益的倒立摆系统控制方法及系统,所述方案采用具有自适应律的径向基神经网络处理倒立摆系统中含有的完全未知非线性函数,并通过将BLF与自适应反步技术相结合,实现对所述倒立摆系统指定性能的自适应跟踪控制。
根据本公开实施例的第一个方面,提供了一种考虑状态约束和控制增益的倒立摆系统控制方法,包括:
构建倒立摆系统的非线性模型,并将倒立摆系统的相关状态约束引入所述非线性模型;
根据倒立摆系统控制目标以及倒立摆系统的结构,确定所述倒立摆系统的系统误差函数以及BLF函数;
采用具有自适应律的径向基神经网络对所述倒立摆系统中的完全未知非线性函数进行逼近;并基于特定增益抑制不等式对所述系统误差函数进而优化求解,构建最优倒立摆系统控制器;
基于所述最优倒立摆系统控制器,实现对所述倒立摆系统指定性能的自适应跟踪控制。
进一步的,所述具有自适应律的径向基神经网络,具体表示如下:
Figure BDA0003126490690000021
其中,W为理想加权向量,S为高斯函数,所述自适应律
Figure BDA0003126490690000022
与RBF神经网络的加权向量
Figure BDA0003126490690000023
的关系为
Figure BDA0003126490690000024
进一步的,根据所述径向基神经网络的基向量来确定最优的自适应律,通过不断迭代调节所述自适应律的参数使倒立摆系统误差函数逼近到零。
进一步的,所述自适应反步算法具体为:基于确定好的所述倒立摆系统的系统误差函数以及BLF函数,以最小化系统误差函数为目的,运用反步法逐步对所述控制器和自适应律进行调整,使倒立摆系统趋于最优状态。
进一步的,所述倒立摆系统的非线性模型,具体表示如下:
Figure BDA0003126490690000025
其中,x=[x1,x2,...,xn]T是系统状态,y∈R是系统输出,b是未知控制增益常数,u是控制器的输入,i=1,2,...,n和
Figure BDA0003126490690000026
是局部利普希茨参数未知光滑非线性函数,t是时间,w是独立标准布朗运动,
Figure BDA0003126490690000027
根据本公开实施例的第二个方面,提供了一种考虑全状态约束和未知控制增益的倒立摆系统控制系统,包括:
模型构建单元,其用于构建倒立摆系统的非线性模型,并将倒立摆系统的相关状态约束引入所述非线性模型;
BLF函数确定单元,其用于根据倒立摆系统控制目标以及倒立摆系统的结构,确定所述倒立摆系统的系统误差函数以及BLF函数;
未知控制增益处理单元,其用于采用具有自适应律的径向基神经网络对所述倒立摆系统中的完全未知非线性函数进行逼近;并基于特定增益抑制不等式对所述系统误差函数进而优化求解,构建最优倒立摆系统控制器;
跟踪控制单元,其用于基于所述最优倒立摆系统控制器,实现对所述倒立摆系统指定性能的自适应跟踪控制。
根据本公开实施例的第三个方面,提供了一种控制器,包括存储器、处理器及存储在存储器上运行的计算机程序,所述处理器执行所述程序时实现所述的一种考虑全状态约束和未知控制增益的倒立摆系统控制方法。
根据本公开实施例的第四个方面,提供了一种非暂态计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现所述的一种考虑全状态约束和未知控制增益的倒立摆系统控制方法。
与现有技术相比,本公开的有益效果是:
(1)本公开所述方案采用一种特定增益抑制不等式方法来消除未知的控制增益,并利用BLF函数来解决完全状态约束问题,并基于李亚普诺夫稳定性分析,所提出的控制策略可以有效地保证所有系统变量在不违反完全状态约束的情况下的概率有界,其跟踪误差收敛为零。
(2)本公开所述方案首次针对倒立摆系统提出了一种自适应渐近跟踪控制方案,同时考虑了含有全状态约束和未知控制增益,与现有的自适应控制器相比,所述方案在自适应反步算法中引入了一种特定增益抑制不等式,从而消除了假设控制增益是已知的假设,而且考虑了跟踪问题,相比自适应有界控制结果更为普遍。
本公开附加方面的优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本公开的实践了解到。
附图说明
构成本公开的一部分的说明书附图用来提供对本公开的进一步理解,本公开的示意性实施例及其说明用于解释本公开,并不构成对本公开的不当限定。
图1为本公开实施例一中所述的考虑全状态约束和未知控制增益的倒立摆系统控制方法流程图;
图2为本公开实施例一中所述的二阶倒立摆系统模型;
图3(a)为本公开实施例一中所述控制方法的跟踪性能与现有控制器性能比较曲线;
图3(b)为本公开实施例一中所述控制方法的多输入多输出系统的第一个系统的跟踪性能与现有控制器性能比较曲线
图4为本公开实施例一中所述控制方法的多输入多输出系统的第二个系统的跟踪误差曲线;
图5(a)为本公开实施例一中所述的第一个系统的第一个子系统的自适应律示意图曲线图;
图5(b)为本公开实施例一中所述的第一个系统的第二个子系统的自适应律示意图曲线图;
图5(c)为本公开实施例一中所述的第二个系统的第一个子系统的自适应律示意图曲线图;
图5(d)为本公开实施例一中所述的第二个系统的第二个子系统的自适应律示意图曲线图。
具体实施方式
下面结合附图与实施例对本公开做进一步说明。
应该指出,以下详细说明都是例示性的,旨在对本公开提供进一步的说明。除非另有指明,本公开使用的所有技术和科学术语具有与本公开所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本公开的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。
实施例一:
本实施例的目的是提供一种考虑全状态约束和未知控制增益的倒立摆系统控制方法。
一种考虑全状态约束和未知控制增益的倒立摆系统控制方法,包括:
构建倒立摆系统的非线性模型,并将倒立摆系统的相关状态约束引入所述非线性模型;
根据倒立摆系统控制目标以及倒立摆系统的结构,确定所述倒立摆系统的系统误差函数以及BLF函数;
采用具有自适应律的径向基神经网络对所述倒立摆系统中的完全未知非线性函数进行逼近;并基于特定增益抑制不等式对所述系统误差函数进而优化求解,构建最优倒立摆系统控制器;
基于所述最优倒立摆系统控制器,实现对所述倒立摆系统指定性能的自适应跟踪控制。
具体的,为了便于理解,以下结合附图对本公开所述方案进行详细说明:
在本实施例中,设计了一种全状态约束和未知控制增益的倒立摆系统的指定性能控制算法,其中,所述指定性能具体指让倒立摆系统的运动状态达到预先设定的运动状态,通俗的讲,就是使倒立摆系统的运动状态与我们的参考信号yd保持同步状态,其最终目的是将系统误差函数逼近到零,具体的,所述控制方法主要分为四个步骤:步骤1,构建非线性模型;步骤2,确定BLF函数和特定的增益抑制不等式;步骤3,定义系统误差函数;步骤4,设计虚拟控制器、自适应律,最终确定实际控制器;最后,对所述控制方法进行验证。
优选地,步骤1中,所述倒立摆系统采用的非线性模型包括:
Figure BDA0003126490690000061
其中,x=[x1,x2,...,xn]T是系统状态,y∈R是系统输出,b是未知控制增益常数,u是虚拟控制器的输入,i=1,2,...,n和
Figure BDA0003126490690000062
是局部Lipschitz参数未知光滑非线性函数,t是时间,w是独立标准布朗运动,
Figure BDA0003126490690000063
优选地,步骤1中,所述状态约束范围为:
Figure BDA0003126490690000064
其中,
Figure BDA0003126490690000065
是正常数,x指倒立摆系统的状态输入,并对倒立摆系统的每一个状态输入根据需求设定一个上下界的约束。具体的,所述倒立摆系统的状态参数主要包括:小车质量,摆杆质量,小车摩擦系数,摆杆转动轴心到杆质心的长度,摆杆惯量;通过设计以小车加速度为系统输入,以摆杆角度为系统输出的被控对象模型。
优选地,所述步骤2中,所述倒立摆系统的BLF函数(barrier Lyapunov函数)具体如下:
Figure BDA0003126490690000066
其中,设计参数ki,bj>0,
Figure BDA00031264906900000611
Figure BDA0003126490690000067
Figure BDA0003126490690000068
是θ的估计,θ为神经网络权值参数;
所述特定增益抑制不等式定义为:
Figure BDA0003126490690000069
Figure BDA00031264906900000610
其中,t∈[0,tw),vj(t),j=1,2,...,n是一个光滑的函数,tw为大于零的时间值,vj即本公开中所述的自适应律函数,Z(t)是一个光滑的函数,即确定好的BLF函数,由于需要对其进行微分,故需要所述BLF函数为光滑函数;LZ(t)为确定好的BLF函数的微分形式,其中,ρ,χ表示未知正常数,bj是未知正变量。
优选地,步骤3进一步包括:定义倒立摆系统误差函数,具体为,
zi,j=xi,j-ydi
其中,zi,j是坐标变换之后的状态变量,ydi为跟踪信号。以倒立摆系统而言,所述系统误差函数具体指让倒立摆系统的运动状态达到我们想要的运动状态,言外之意,与我们的参考信号ydi保持同步状态,即我们的最终目的是将系统误差函数z(倒立摆系统的状态输入x与跟踪系统函数ydi的误差)逼近到零。
优选地,步骤4进一步包括以下步骤:
步骤4.1:确定虚拟控制器,具体为:
Figure BDA0003126490690000071
其中,设计参数ki,j>0,ai,j>0,
Figure BDA0003126490690000072
为所述径向基神经网络的基函数向量,α是虚拟控制器,Ist是控制增益函数,
Figure BDA0003126490690000073
是等价虚拟控制单元,k是设计的参数,a是设计的参数,z是系统误差函数,S是高斯函数,
Figure BDA0003126490690000074
是自适应的估计。
步骤4.2,对所述BLF函数进行微分处理,并将系统误差函数、系统误差函数的导数,以及倒立摆系统的非线性函数模型的变量带入到所述特定的BLF微分函数不等式,即可得到下式,其中,
Figure BDA0003126490690000075
Figure BDA0003126490690000076
为所述的虚拟控制器。
Figure BDA0003126490690000077
其中,
Figure BDA0003126490690000078
是坐标变量,
Figure BDA0003126490690000079
是约束
Figure BDA00031264906900000710
范围的参数,
Figure BDA00031264906900000711
是系统的函数,
Figure BDA00031264906900000712
是系统的未知增益常数,ydi是跟踪系统函数,
Figure BDA00031264906900000713
是设计的参数,另外有
Figure BDA0003126490690000081
Figure BDA0003126490690000082
Figure BDA0003126490690000083
的误差,
Figure BDA0003126490690000084
Figure BDA0003126490690000085
的估计。
采用具有自适应律的径向基神经网络对所述倒立摆系统中的完全未知非线性函数进行处理(即对所述完全未知非线性函数进行逼近,这里利用了径向基神经网络可以有效对任意非线性函数进行描述的功能),所述完全未知非线性函数,表示如下:
Figure BDA0003126490690000086
其中,所述具有自适应律的径向基神经网络是基于经典的RBF神经网络,并定义所述自适应律
Figure BDA0003126490690000087
与RBF神经网络的加权向量
Figure BDA0003126490690000088
的关系为
Figure BDA0003126490690000089
此处的*表示最优;具体的,所述RBF神经网络具体表示为
Figure BDA00031264906900000810
其中,W为理想加权向量,S为高斯函数,Young不等式的形式为:对于
Figure BDA00031264906900000811
有如下关系:
Figure BDA00031264906900000812
其中,ε>0,r>1,t>1,(r-1)(t-1)=1。
步骤4.3,利用所述具有自适应律的径向基神经网络对所述完全未知非线性函数进行逼近处理,同时,基于young不等式,得到下式:
Figure BDA00031264906900000813
其具体步骤如下:
根据
Figure BDA00031264906900000814
通过径向基神经网络中的加权向量变形得到:
Figure BDA00031264906900000815
其中,ε为
Figure BDA0003126490690000091
Figure BDA0003126490690000092
之间的误差;
基于所述young不等式,得到:
Figure BDA0003126490690000093
带入上文中的公式:
Figure BDA0003126490690000094
得到公式:
Figure BDA0003126490690000095
步骤4.4,虚拟控制器设计为
Figure BDA0003126490690000096
Figure BDA0003126490690000097
其中设计参数
Figure BDA0003126490690000098
步骤4.5,通过引入自适应律,得到:
Figure BDA0003126490690000099
Figure BDA00031264906900000910
步骤4.6,利用young不等式,得到:
Figure BDA0003126490690000101
步骤4.7,根据倒立摆系统中的各系统进行叠加,得到最终的控制器
Figure BDA0003126490690000102
Figure BDA0003126490690000103
其中,m表示一共有几阶倒立摆系统,i泛指其中任意一阶倒立摆系统。ni表示每一阶倒立摆系统中子系统的数量,ji表示某一阶倒立摆系统的任意一个子系统,i∈[1,m],ji∈[1,ni]。
整理如上式子得到:
Figure BDA0003126490690000104
其中,
Figure BDA0003126490690000105
Figure BDA0003126490690000106
在[0,t]上积分,得到:
Figure BDA0003126490690000107
Figure BDA0003126490690000108
Figure BDA0003126490690000109
所述方案的整体思路是,首先对每一个子系统确定误差函数,然后设计BLF函数,进行一系列的求导转换过程得到每一个子系统的最优的控制器和自适应律,然后将这所有的子系统都累加起来组成了本案例的闭环系统,继而得到本案例闭环系统的总体最优控制器和自适应律。
进一步的,为了证明本公开所述方案的有效性,进行了如下实验:
以图2中所述的倒立摆系统为例(二阶倒立摆系统),
(1)其非线性模型具体描述如下:
第一系统:
Figure BDA0003126490690000111
第二系统:
Figure BDA0003126490690000112
其中,所述第一系统和第二系统对应于所述二阶倒立摆系统的每一阶,而第一子系统和第二子系统则对应于每一阶倒立摆系统中的相应子系统。
(2)其控制器状态参数选取如下:
k1,b1=k1,b2=k2,b1=k2,b2=15,k1,1=k2,1=230,k1,2=k2,2=10,R1,1=R1,2=R2,1=R2,2=1,r1,1=r1,2=r2,1=r2,2=10,a1,1=a1,2=a2,1=a2,2=0.01,σ1,1=σ1,2=σ2,1=σ2,2=1.
(3)仿真参数初始化如下:
[x1(0),x2(0),x3(0)]T=[0.1,0.1,0.1]T
Figure BDA0003126490690000113
Figure BDA0003126490690000114
其仿真结果如图3至图5所示。图3(a)-图3(b)是系统的跟踪性能曲线。从图3可以看出,与现有的结果相比,本公开设计的控制器使系统具有更好的跟踪性能。图4表示倒立摆系统的跟踪误差曲线,从图4可以看出本公开设计的控制器能够保证跟踪误差到零。图5(a)-图5(d)分别展示了图2中所述倒立摆系统的不同系统的不同子系统中的自适应律示意图。
本公开所述方案通过引入一种新的barrier Lyapunov函数(BLF),并针对考虑的系统引入特定的增益抑制不等式,提出了一种新的控制算法,包括如下步骤:首先考虑了一类多输入多输出(MIMO)随机非线性系统,采用具有自适应律的径向基(RBF)神经网络处理系统中含有的完全未知非线性函数,接着将BLF与自适应反步技术相结合,设计了针对实现指定性能的控制算法的自适应跟踪控制器。本公开所述方案首次针对MIMO随机非线性系统提出了一种新的自适应渐近跟踪控制方案,同时考虑了含有全状态约束和未知控制增益,与现有的自适应控制器相比,所述方案在自适应反步算法中引入了一种特定增益抑制不等式,从而消除了假设控制增益是已知的假设,而且考虑了跟踪问题,相比自适应有界控制结果更为普遍。
实施例二:
本实施例的目的是提供一种考虑全状态约束和未知控制增益的倒立摆系统控制系统。
一种考虑全状态约束和未知控制增益的倒立摆系统控制系统,包括:
模型构建单元,其用于构建倒立摆系统的非线性模型,并将倒立摆系统的相关状态约束引入所述非线性模型;
BLF函数确定单元,其用于根据倒立摆系统控制目标以及倒立摆系统的结构,确定所述倒立摆系统的系统误差函数以及BLF函数;
未知控制增益处理单元,其用于采用具有自适应律的径向基神经网络对所述倒立摆系统中的完全未知非线性函数进行逼近;并基于特定增益抑制不等式对所述系统误差函数进而优化求解,构建最优倒立摆系统控制器;
跟踪控制单元,其用于基于所述最优倒立摆系统控制器,实现对所述倒立摆系统指定性能的自适应跟踪控制。
在更多实施例中,还提供:
一种控制器,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成实施例一中所述的方法。为了简洁,在此不再赘述。
应理解,本实施例中,处理器可以是中央处理单元CPU,处理器还可以是其他通用处理器、数字信号处理器DSP、专用集成电路ASIC,现成可编程门阵列FPGA或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器可以包括只读存储器和随机存取存储器,并向处理器提供指令和数据、存储器的一部分还可以包括非易失性随机存储器。例如,存储器还可以存储设备类型的信息。
一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时,完成实施例一中所述的方法。
实施例一中的方法可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器、闪存、只读存储器、可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。为避免重复,这里不再详细描述。
本领域普通技术人员可以意识到,结合本实施例描述的各示例的单元即算法步骤,能够以电子硬件或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本公开的范围。
上述实施例提供的一种考虑全状态约束和未知控制增益的倒立摆系统控制方法及系统可以实现,具有广阔的应用前景。
以上所述仅为本公开的优选实施例而已,并不用于限制本公开,对于本领域的技术人员来说,本公开可以有各种更改和变化。凡在本公开的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本公开的保护范围之内。
上述虽然结合附图对本公开的具体实施方式进行了描述,但并非对本公开保护范围的限制,所属领域技术人员应该明白,在本公开的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本公开的保护范围以内。

Claims (10)

1.一种考虑状态约束和控制增益的倒立摆系统控制方法,其特征在于,包括:
构建倒立摆系统的非线性模型,并将倒立摆系统的相关状态约束引入所述非线性模型;
根据倒立摆系统控制目标以及倒立摆系统的结构,确定所述倒立摆系统的系统误差函数以及BLF函数;
采用具有自适应律的径向基神经网络对所述倒立摆系统中的完全未知非线性函数进行逼近;并基于特定增益抑制不等式对所述系统误差函数进而优化求解,构建最优倒立摆系统控制器;
基于所述最优倒立摆系统控制器,实现对所述倒立摆系统指定性能的自适应跟踪控制。
2.如权利要求1所述的一种考虑状态约束和控制增益的倒立摆系统控制方法,其特征在于,所述具有自适应律的径向基神经网络,具体表示如下:
Figure FDA0003126490680000011
其中,W为理想加权向量,S为高斯函数,所述自适应律
Figure FDA0003126490680000012
与RBF神经网络的加权向量
Figure FDA0003126490680000013
的关系为
Figure FDA0003126490680000014
3.如权利要求2所述的一种考虑状态约束和控制增益的倒立摆系统控制方法,其特征在于,根据所述径向基神经网络的基向量来确定最优的自适应律,通过不断迭代调节所述自适应律的参数使倒立摆系统误差函数逼近到零。
4.如权利要求1所述的一种考虑状态约束和控制增益的倒立摆系统控制方法,其特征在于,所述自适应反步算法具体为:基于确定好的所述倒立摆系统的系统误差函数以及BLF函数,以最小化系统误差函数为目的,运用反步法逐步对所述控制器和自适应律进行调整,使得倒立摆系统趋于最优状态。
5.如权利要求1所述的一种考虑状态约束和控制增益的倒立摆系统控制方法,其特征在于,所述特定增益抑制不等式具体为:
Figure FDA0003126490680000021
Figure FDA0003126490680000022
其中,t∈[0,tw),vj(t),j=1,2,...,n是一个光滑的函数,tw为大于零的时间值,vj即所述的自适应律函数,Z(t)是一个光滑的函数,即确定好的BLF函数,由于需要对其进行微分,故需要所述BLF函数为光滑函数;LZ(t)为确定好的BLF函数的微分形式,其中,ρ,χ表示未知正常数,bj是未知正变量。
6.如权利要求1所述的一种考虑状态约束和控制增益的倒立摆系统控制方法,其特征在于,所述状态约束具体包括:倒立摆系统的每一个输入状态、倒立摆系统的输出以及倒立摆系统所跟的跟踪信号的相关约束。
7.如权利要求1所述的一种考虑状态约束和控制增益的倒立摆系统控制方法,其特征在于,所述倒立摆系统非线性模型,具体表示如下:
Figure FDA0003126490680000023
其中,x=[x1,x2,...,xn]T是系统状态,y∈R是系统输出,b是未知控制增益常数,u是控制器的输入,i=1,2,...,n和
Figure FDA0003126490680000025
是局部利普希茨参数未知光滑非线性函数,t是时间,w是独立标准布朗运动,
Figure FDA0003126490680000024
8.一种考虑全状态约束和未知控制增益的倒立摆系统控制系统,其特征在于,包括:
模型构建单元,其用于构建倒立摆系统的非线性模型,并将倒立摆系统的相关状态约束引入所述非线性模型;
BLF函数确定单元,其用于根据倒立摆系统控制目标以及倒立摆系统的结构,确定所述倒立摆系统的系统误差函数以及BLF函数;
未知控制增益处理单元,其用于采用具有自适应律的径向基神经网络对所述倒立摆系统中的完全未知非线性函数进行逼近;并基于特定增益抑制不等式对所述系统误差函数进而优化求解,构建最优倒立摆系统控制器;
跟踪控制单元,其用于基于所述最优倒立摆系统控制器,实现对所述倒立摆系统指定性能的自适应跟踪控制。
9.一种控制器,包括存储器、处理器及存储在存储器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-7任一项所述的一种考虑全状态约束和未知控制增益的倒立摆系统控制方法。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7任一项所述的一种考虑全状态约束和未知控制增益的倒立摆系统控制方法。
CN202110691975.3A 2021-06-22 2021-06-22 考虑状态约束和控制增益的倒立摆系统控制方法及系统 Active CN113568306B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110691975.3A CN113568306B (zh) 2021-06-22 2021-06-22 考虑状态约束和控制增益的倒立摆系统控制方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110691975.3A CN113568306B (zh) 2021-06-22 2021-06-22 考虑状态约束和控制增益的倒立摆系统控制方法及系统

Publications (2)

Publication Number Publication Date
CN113568306A true CN113568306A (zh) 2021-10-29
CN113568306B CN113568306B (zh) 2024-01-30

Family

ID=78162496

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110691975.3A Active CN113568306B (zh) 2021-06-22 2021-06-22 考虑状态约束和控制增益的倒立摆系统控制方法及系统

Country Status (1)

Country Link
CN (1) CN113568306B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101933964B1 (ko) * 2017-06-21 2018-12-31 중앙대학교 산학협력단 임의로 스위치 된 불확실한 비아핀 비선형 시스템의 적응 관측기 기반 출력 제약 추종을 이용한 제어 장치
CN109188906A (zh) * 2018-09-13 2019-01-11 辽宁工业大学 一种具有时变位移约束的汽车主动座椅悬架系统控制方法
CN111736600A (zh) * 2020-06-10 2020-10-02 哈尔滨工程大学 一种时滞非对称时变全状态约束下的水面无人艇轨迹跟踪控制方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101933964B1 (ko) * 2017-06-21 2018-12-31 중앙대학교 산학협력단 임의로 스위치 된 불확실한 비아핀 비선형 시스템의 적응 관측기 기반 출력 제약 추종을 이용한 제어 장치
CN109188906A (zh) * 2018-09-13 2019-01-11 辽宁工业大学 一种具有时变位移约束的汽车主动座椅悬架系统控制方法
CN111736600A (zh) * 2020-06-10 2020-10-02 哈尔滨工程大学 一种时滞非对称时变全状态约束下的水面无人艇轨迹跟踪控制方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
YAN-JUN LIU , SHAOCHENG TONG: "Barrier Lyapunov functions for Nussbaum gain adaptive control of full state constrained nonlinear systems", AUTOMATICA *
王春晓等: "控制方向未知的全状态约束非线性系统的鲁棒自适应跟踪控制", 控制理论与应用, vol. 35, no. 2 *
祁林等: "随机互联非线性系统的神经网络约束控制", 河南城建学院学报, vol. 29, no. 4 *
耿宝亮;胡云安;李静;赵永涛;: "控制增益为未知函数的不确定系统预设性能反演控制", 自动化学报, no. 11 *
陈龙胜;王琦;: "状态和输入受约束的非仿射不确定系统鲁棒自适应控制", 应用科学学报, no. 02 *

Also Published As

Publication number Publication date
CN113568306B (zh) 2024-01-30

Similar Documents

Publication Publication Date Title
CN110138612B (zh) 一种基于QoS模型自校正的云软件服务资源分配方法
Engelbrecht Particle swarm optimization: Velocity initialization
Ma et al. Improved robustness and safety for autonomous vehicle control with adversarial reinforcement learning
Liniger et al. Racing miniature cars: Enhancing performance using stochastic MPC and disturbance feedback
CN115993781B (zh) 抗网络攻击无人集群系统协同控制方法、终端及存储介质
Shou et al. Finite‐time formation control and obstacle avoidance of multi‐agent system with application
Li et al. A hierarchical structure of observer-based adaptive fuzzy-neural controller for MIMO systems
CN110095981A (zh) 一种自抗扰控制器参数的整定方法、装置和电子设备
Fu et al. A cross‐coupling control approach for coordinated formation of surface vessels with uncertain disturbances
CN102749843B (zh) 一种自适应反馈保护动态面控制器结构及设计方法
CN117452827B (zh) 一种欠驱动无人艇轨迹跟踪控制方法
CN115128960A (zh) 一种基于深度强化学习双足机器人运动控制方法及系统
CN112130584B (zh) 基于命令滤波的四旋翼飞行器有限时间自适应控制方法
CN113568306A (zh) 考虑状态约束和控制增益的倒立摆系统控制方法及系统
CN113219825A (zh) 一种四足机器人单腿轨迹跟踪控制方法及系统
CN113485099B (zh) 一种非线性离散时间系统的在线学习控制方法
Laflamme et al. Application of self-tuning Gaussian networks for control of civil structures equipped with magnetorheological dampers
CN110351241B (zh) 一种基于GWA优化的工业网络DDoS入侵检测系统分类方法
Qiming et al. Residual Sarsa algorithm with function approximation
CN116500893B (zh) 一种高阶多智能体的强化学习优化控制器构建方法及系统
Münker et al. Hierarchical model predictive control for local model networks
Li et al. Model predictive control for constrained robot manipulator visual servoing tuned by reinforcement learning
CN118068694A (zh) 一种自适应神经网络模糊积分滑模控制方法及装置
Yu et al. Neural-based adaptive integral sliding mode tracking control for nonlinear interconnected systems
Wang et al. Optimal control for a class of unknown nonlinear systems via the iterative GDHP algorithm

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant