CN114879658B - 一种气垫船轨迹跟踪控制方法 - Google Patents

一种气垫船轨迹跟踪控制方法 Download PDF

Info

Publication number
CN114879658B
CN114879658B CN202210336388.7A CN202210336388A CN114879658B CN 114879658 B CN114879658 B CN 114879658B CN 202210336388 A CN202210336388 A CN 202210336388A CN 114879658 B CN114879658 B CN 114879658B
Authority
CN
China
Prior art keywords
hovercraft
control
derivative
approximation
disturbance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210336388.7A
Other languages
English (en)
Other versions
CN114879658A (zh
Inventor
夏元清
孔祥煜
戴荔
翟弟华
孙中奇
詹玉峰
崔冰
张金会
邹伟东
刘坤
吴楚格
郭泽华
李怡然
张元�
闫莉萍
高寒
杨辰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Institute of Technology BIT
Original Assignee
Beijing Institute of Technology BIT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Institute of Technology BIT filed Critical Beijing Institute of Technology BIT
Priority to CN202210336388.7A priority Critical patent/CN114879658B/zh
Publication of CN114879658A publication Critical patent/CN114879658A/zh
Application granted granted Critical
Publication of CN114879658B publication Critical patent/CN114879658B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course or altitude of land, water, air, or space vehicles, e.g. automatic pilot
    • G05D1/02Control of position or course in two dimensions
    • G05D1/0206Control of position or course in two dimensions specially adapted to water vehicles
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T90/00Enabling technologies or technologies with a potential or indirect contribution to GHG emissions mitigation

Abstract

本发明公开了一种气垫船轨迹跟踪控制方法,通过采用微分平坦方法将将欠驱动的气垫船模型转化为全驱动的系统,并基于全驱动模型使用自抗扰控制方法设计控制器,将建模误差和外部扰动作为扩张状态实时估计并进行补偿,方便了控制器的设计提高了气垫船系统控制的抗扰性。

Description

一种气垫船轨迹跟踪控制方法
技术领域
本发明属于气垫船自动控制技术领域,具体涉及一种气垫船轨迹跟踪控制方法。
背景技术
气垫船使用空气作为船只底部的气垫,即通常是由持续不断供应的低压气体形成气垫。因此,气垫船与水面的摩擦力很小,气垫船除了在水上运动,还可以在某些比较平滑的陆路或是结冰的水面等地形上行驶,气垫船的模型如图2所示。
气垫船按航行状态可分为全垫式和侧壁式。全垫式气垫船四周用尼龙等物料围成一个软性的围裙,利用风机把空气充入底部形成气垫,推进则多数使用空气螺旋桨或喷气方式。全垫式气垫船时速可达70节,具备两栖能力,可以在陆上行驶,这种气垫船在军事上用作两栖登陆非常合适,能在很多排水式登陆艇无法行驶的海岸登陆。侧壁式气垫船,亦称表面效应船只,在船底两侧有刚性侧壁插入水中,只在首尾用软性的围裙,推进可以使用传统水下螺旋桨或喷水机,与全垫式相比,侧壁式气垫船的托力较大,适合作大型舰艇,但不具两栖能力。
气垫船被广泛应用于浅滩登陆,野外救援和民用或军用航运等方面。但由于气垫船特殊的工作原理和结构,气垫船具有难以建模,欠驱动,非线性强,外部扰动较大的特点,使得气垫船的精准操控是非常困难的,因此非常需要研究一种气垫船的轨迹跟踪控制方法。
气垫船的轨迹跟踪控制问题吸引了国内外众多学者的广泛关注,常用的方法包括基于变结构模糊方法的轨迹跟踪控制、基于神经网络的航向控制方法、基于多段控制器的全垫升气垫船轨迹跟踪控制、基于滑模控制的航向角控制、反步法和李雅普诺夫法等。其中,基于神经网络的航向控制方法能够更加精准地控制航向角。
综上所述,现有方法都依赖于比较准确的数学模型,而且有大量的研究人员在对气垫船进行精准的建模,然而气垫船属于复杂对象,尤其是其在运动过程中可能遇到的来自水和风的扰动一般是无法被提前建模的,因此,仍很难得到其精准的模型,现有的基于模型的控制方法也就不能保证控制的最优性和自适应性,且控制器的抗扰能力也比较差,缺乏主动抗扰能力。
发明内容
有鉴于此,本发明提供了一种气垫船轨迹跟踪控制方法,通过将气垫船系统由欠驱动系统转换为全驱动系统,采用自抗扰控制方法实现了对气垫船系统轨迹的跟踪控制。
本发明提供的一种气垫船轨迹跟踪控制方法,包括以下步骤:
步骤1、采用微分平坦方法建立气垫船的全驱动气垫船模型,如公式(1)所示:
Figure BDA0003568570300000021
其中,x1为气垫船的位置坐标中的横坐标x,x2为横坐标x的一阶导数,x3为横坐标x的二阶导数,x4为横坐标x的三阶导数,x5为横坐标方向上的扰动,y1为气垫船的位置坐标中的纵坐标y,y2为纵坐标y的一阶导数,y3为纵坐标y的二阶导数,y4为纵坐标y的三阶导数,y5为纵坐标方向上的扰动,∈x为扰动
Figure BDA0003568570300000022
的导数,∈y为扰动
Figure BDA0003568570300000031
的导数,h为采样时间间隔,k为第k个采样时刻,U1为气垫船的x方向广义输入,U2为气垫船的y方向广义输入;
步骤2、针对所述全驱动气垫船模型,采用自抗扰控制方法构建气垫船轨迹跟踪控制器实现对气垫船轨迹的跟踪控制,所述气垫船轨迹跟踪控制器包括气垫船微分跟踪器、气垫船扩张状态观测器和基于状态反馈和扰动补偿的控制策略;
所述气垫船微分跟踪器如公式(2)所示:
Figure BDA0003568570300000032
其中
Figure BDA0003568570300000033
为x1的近似值,
Figure BDA0003568570300000034
为x2的近似值,
Figure BDA0003568570300000035
为x3的近似值,
Figure BDA0003568570300000036
为x4的近似值,fx(k)为x的四阶导数的近似值,
Figure BDA0003568570300000037
为y1的近似值,
Figure BDA0003568570300000038
为y2的近似值,
Figure BDA0003568570300000039
为y3的近似值,
Figure BDA00035685703000000310
为y4的近似值,fy(k)为y的四阶导数的近似值,r1为气垫船微分跟踪器的x方向参数,r2为气垫船微分跟踪器的y方向参数;
所述气垫船扩张状态观测器如公式(3)所示:
Figure BDA00035685703000000311
其中,e2为x方向的跟踪误差,e2为y方向的跟踪误差,z11,z12,z13,z14,z15分别是x1,x2,x3,x4,x5的估计值,z21,z22,z23,z24,z25分别是y1,y2,y3,y4,y5的估计值,b11,b12,...,b25是观测器参数;
基于状态反馈和扰动补偿的控制策略中的控制率如公式(4)所示:
Figure BDA0003568570300000041
其中,φx为x方向的控制率,φy为y方向的控制率,k11,k12,...,k24为控制参数。
进一步地,所述气垫船轨迹跟踪控制器的控制率为采用强化学习算法进行计算,计算方式包括:
构建Critic网络和Actor网络分别用于拟合气垫船系统在当前状态下的最优控制策略和最优价值函数,其中,所述Critic网络为具有4个输入节点、16个隐藏层节点和4个输出节点的全连接网络,所述Actor网络为具有4个输入节点、16个隐藏层节点和1个输出节点的全连接网络,以所述Actor网络的输出作为气垫船系统的广义控制输入U1和U2,同时得到优化的控制率φx和φy
有益效果:
1、本发明通过采用微分平坦方法将将欠驱动的气垫船模型转化为全驱动的系统,并基于全驱动模型使用自抗扰控制方法设计控制器,将建模误差和外部扰动作为扩张状态实时估计并进行补偿,方便了控制器的设计提高了气垫船系统控制的抗扰性。
2、本发明通过将强化学习算法引入气垫船系统的自抗扰控制器,能够获取优化的控制策略,得到更优的控制率,从而有效避免了现有自抗扰控制方法中手动调试的过程,能够有效地节省人力和时间,此外,由于自抗扰控制方法对扰动的估计与补偿特性能够为强化学习算法提供一个稳定的学习环境,从而保证了强化学习算法的收敛性,节约了学习时间,因此,采用强化学习算法与自抗扰控制方法结合实现气垫船系统的跟踪控制,能够进一步地提高跟踪控制的鲁棒性和自适应性。
附图说明
图1为本发明提供的一种气垫船轨迹跟踪控制方法的流程图。
图2为气垫船的3D模型示意图。
图3为采用本发明提供的一种气垫船轨迹跟踪控制方法得到的气垫船横轴位置跟踪效果图。
图4为采用本发明提供的一种气垫船轨迹跟踪控制方法得到的气垫船纵轴位置跟踪效果图。
图5为采用传统ADRC方法得到的气垫船横轴跟踪控制鲁棒性曲线图。
图6为采用本发明提供的一种气垫船轨迹跟踪控制方法得到的气垫船横轴跟踪控制鲁棒性曲线图。
图7为采用传统ADRC方法得到的气垫船纵轴跟踪控制鲁棒性曲线图。
图8为采用本发明提供的一种气垫船轨迹跟踪控制方法得到的气垫船纵轴跟踪控制鲁棒性曲线图。
具体实施方式
下面结合附图,对本发明进行详细描述。
本发明提供的一种气垫船轨迹跟踪控制方法,其基本思想是:采用微分平坦方法建立全驱动气垫船模型,采用自抗扰控制方法构建气垫船轨迹跟踪控制器实现对气垫船的轨迹跟踪控制,在此基础进一步的引入强化学习算法考虑气垫船的扰动得到更优的控制输入,从而进一步提高控制精度。
本发明提供的一种气垫船轨迹跟踪控制方法,如图1所示,具体包括以下步骤:
步骤1、针对气垫船的技术特征,采用微分平坦方法建立全驱动气垫船模型。
本发明基于现有多种气垫船建模方法描述了气垫船的技术特征,采用如下公式表示:
Figure BDA0003568570300000061
其中,(x,y)表示气垫船的位置坐标,ψ表示气垫船的航向角度,τu表示气垫船的纵向控制力矩,τr表示气垫船的横向控制力矩,u表示气垫船的纵向速度,v表示气垫船的横向速度,r表示气垫船的偏航角速度,
Figure BDA0003568570300000062
表示x的导数,
Figure BDA0003568570300000063
表示y的导数,
Figure BDA0003568570300000064
表示ψ的导数,
Figure BDA0003568570300000065
表示u的导数,
Figure BDA0003568570300000066
表示v的导数,
Figure BDA0003568570300000067
表示r的导数。
通常情况下,通过获取气垫船的位置坐标和航向角度即可实现对气垫船轨迹的跟踪,通过控制气垫船的纵向控制力矩和横向控制力矩即可实现对气垫船的控制。本发明需要解决的问题就是如何计算出合适的控制输入实现对气垫船的轨迹跟踪控制。如公式(1)所示的气垫船的技术特征,可知气垫船的控制过程为两输入三输出的形式,因此气垫船系统本身属于欠驱动系统。但是,现有技术中已有的针对欠驱动系统的控制方法不是很成熟,而关于全驱动系统的控制方法已经有非常成熟的研究成果,因此,本发明的技术思路是将欠驱动系统转化为全驱动系统,即将气垫船系统转换为全驱动系统。
平坦性是系统的一种特性,是将线性时不变系统理论中的可控性扩展到非线性动力系统中,从而得到微分平坦理论,具有平坦性的系统称为平坦系统。平坦系统具有(虚拟的)平坦输出,可以用平坦输出以及其有限微分的组合来表示所有的状态以及输入。在本发明中,采用微分平坦法寻找气垫船系统的平坦输出,即可将气垫船的位置坐标(x,y)和航向角度ψ三个被控状态转换为气垫船的位置坐标(x,y)两个状态,从而实现气垫船系统从欠驱动系统到全驱动系统的转化。
本发明选用微分平坦法将气垫船系统转换为全驱动系统,建立全驱动气垫船模型,全驱动气垫船模型如下式表示:
Figure BDA0003568570300000071
下面说明建立全驱动气垫船模型的理论推导过程:
首先,基于平坦系统理论经过平坦性证明,可以确定气垫船系统的平坦输出为x和y,其他状态和控制输入可以表达为如下形式:
Figure BDA0003568570300000072
Figure BDA0003568570300000073
Figure BDA0003568570300000074
Figure BDA0003568570300000075
Figure BDA0003568570300000076
Figure BDA0003568570300000077
其次,为了建立两输入两输出的平坦系统,对以下方程求导,方程如公式(8)所示,直到同时出现平坦输出x、y和控制输入τur
Figure BDA0003568570300000078
经过连续求导,得出平坦输出的四阶导数满足平坦输出的要求,因此建立如下气垫船系统的全驱动系统模型:
Figure BDA0003568570300000081
其中
Figure BDA0003568570300000082
Figure BDA0003568570300000083
为扰动。定义U1,U2为如下形式的广义输入:
Figure BDA0003568570300000084
得到简化后的全驱动模型:
Figure BDA0003568570300000085
将平坦输出及其导数定义为如下状态:
Figure BDA0003568570300000086
可以将全驱动模型改写为积分串联形式:
Figure BDA0003568570300000087
其中,∈x为扰动
Figure BDA0003568570300000088
的导数,∈y为扰动
Figure BDA0003568570300000089
的导数。假设采样时间间隔为h,k表示第k个采样时刻,则积分串联模型可以离散化为如下形式:
Figure BDA0003568570300000091
其中,x1为气垫船的位置坐标中的横坐标x,x2为横坐标x的一阶导数,x3为横坐标x的二阶导数,x4为横坐标x的三阶导数,x5为横坐标方向上的扰动,y1为气垫船的位置坐标中的纵坐标y,y2为纵坐标y的一阶导数,y3为纵坐标y的二阶导数,y4为纵坐标y的三阶导数,y5为纵坐标方向上的扰动。
本发明就以上述积分串联离散模型作为气垫船系统的全驱动气垫船模型。
步骤2、针对步骤1建立的全驱动气垫船模型,采用自抗扰控制方法构建气垫船轨迹跟踪控制器实现对气垫船轨迹的跟踪控制。
本发明针对步骤1得到的气垫船系统的积分串联离散模型设计基于自抗扰控制的气垫船轨迹跟踪控制器,下面详细说明气垫船轨迹跟踪控制器的设计过程和方法。
自抗扰控制是由中国科学院的韩京清研究员吸收工程中比例积分微分控制(PID控制),并独立于复杂数学模型提出的一种应对非线性、不确定性和扰动的控制方法。作为一种经典的控制方法,自抗扰控制由于其不依赖于精准的模型,能对建模误差和外部扰动进行及时的估计和补偿等优势,成为学术界研究的热点,也是工业界常用的控制方法。自抗扰控制方法主要包括构建微分跟踪器和扩张状态观测器,并确定基于状态反馈和扰动补偿控制策略。
其中,微分跟踪器,能得到被跟踪信号的微分信号,使用微分跟踪器的目的是给被跟踪信号安排过渡过程,将阶跃信号等快速变化的信号转化为变化较为缓慢的信号,同时能够得到信号的微分信息,从而使得反馈控制率既能够快速响应,又不会过度超调。扩张状态观测器是状态观测器的一种,在自抗扰控制中,由于被控制系统的实际模型不一定和理论模型完全一致,因此自抗扰控制将所有的未建模部分和外部扰动,统一看作系统的扩张状态,这样既免去了精准建模的困难,也能够得到系统的扰动信息,这是自抗扰的精髓思想,被控制系统所有的状态和扰动都能被扩张状态观测器估计得到,为反馈控制率提供系统信息。基于状态反馈和扰动补偿的控制策略包括反馈控制率和扰动补偿的计算,反馈控制率的计算是基于被控制系统的状态反馈,计算跟踪误差并根据误差得到反馈控制率;扰动补偿是在反馈控制率基础上减去系统的扰动得到控制输入,以实现对扰动的补偿得到较好的控制效果。
由此可见,自抗扰控制方法尤其适用于具有模型复杂、运动过程中受到的扰动影响因素多特点的气垫船系统的控制。
本发明采用自抗扰控制方法及步骤1构建的全驱动气垫船模型建立气垫船轨迹跟踪控制器。气垫船轨迹跟踪控制器的建立过程,主要包括气垫船微分跟踪器和气垫船扩张状态观测器的构建,以及基于状态反馈和扰动补偿控制策略的设计。
其中,气垫船微分跟踪器如下式所示:
Figure BDA0003568570300000101
其中
Figure BDA0003568570300000102
为x1的近似值,
Figure BDA0003568570300000103
为x2的近似值,
Figure BDA0003568570300000104
为x3的近似值,
Figure BDA0003568570300000105
为x4的近似值,fx(k)为x的四阶导数的近似值,
Figure BDA0003568570300000106
为y1的近似值,
Figure BDA0003568570300000107
为y2的近似值,
Figure BDA0003568570300000108
为y3的近似值,
Figure BDA0003568570300000109
为y4的近似值,fy(k)为y的四阶导数的近似值。
气垫船扩张状态观测器如下式所示:
Figure BDA0003568570300000111
其中z11,z12,z13,z14,z15分别是x1,x2,x3,x4,x5的估计值,z21,z22,z23,z24,z25分别是y1,y2,y3,y4,y5的估计值,b11,b12,...,b25是观测器参数,可以通过带宽法获取。
基于状态反馈和扰动补偿的控制策略包含两个部分,第一部分是基于系统的状态反馈设计控制率,计算跟踪误差并根据误差得到反馈控制率如下所示:
Figure BDA0003568570300000112
对于线性自抗扰控制方法,φxy通常为如下线性形式:
Figure BDA0003568570300000113
其中,k11,k12,...,k24为控制参数。
第二部分是在反馈控制率基础上减去系统的扰动,实现对扰动的补偿,以得到较好的控制效果,得到的广义控制输入U1,U2为如下形式:
Figure BDA0003568570300000114
步骤3、采用强化学习的方法计算反馈控制率,具体来说,构建Critic网络和Actor网络分别用于拟合气垫船系统在当前状态下的最优控制策略和最优价值函数,其中,Critic网络为具有4个输入节点、16个隐藏层节点和4个输出节点的全连接网络,Actor网络为具有4个输入节点、16个隐藏层节点和1个输出节点的全连接网络。其中,以Actor网络的输出作为气垫船的广义控制输入U1,U2,通过强化学习模型的训练得到最优的反馈控制率φxy,从而进一步优化了气垫船的广义控制输入U1,U2
在现有的自抗扰控制技术研究中,反馈控制率φxy的优化一直是研究热点和难点,而且现有技术中已有一些比较成熟的方法可以使用,如:带宽法、非线性切换法和线性切换法等,采用现有方法就能够解决本发明的技术问题。自抗扰控制器需要设计误差反馈控制率,但目前主流的方法很难保证参数的自适应性和最优性而且过分依赖于人的经验,不具有普适性。尤其是当需要调节的参数较多的时候,手动调节很难得到合适的参数。因此,为了进一步得到更优的控制效果,本发明还提出了采用强化学习模型计算反馈控制率的方法。
强化学习,又称再励学习或增强学习,是机器学习的范式和方法论之一,用于描述和解决智能体在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题。强化学习能够通过迭代训练的方式解决优化问题,得到最优解。在本方法中,使用强化学习设计优化的反馈控制策略。
定义跟踪误差矩阵:
ex(k)=[e11(k),e12(k),e13(k),e14(k)]T,ey(k)=[e21(k),e22(k),e23(k),e24(k)]T以及权重矩阵Q,R为正定矩阵。根据最优化理论,定义如下形式的值函数:
Figure BDA0003568570300000121
其中0<γ≤1为折扣因子,根据贝尔曼最优性理论,最优值函数
Figure BDA0003568570300000122
应满足如下贝尔曼方程:
Figure BDA0003568570300000123
对最优值函数偏导可以得到最优控制策略为如下形式:
Figure BDA0003568570300000131
一般来说,最优值函数是很难显式求解的,因此在本方法中设计了Actor网络和Critic网络,分别用于拟合系统在当前状态下的最优控制策略和最优价值函数。
定义如下形式的Critic网络,
Figure BDA0003568570300000132
其中φcxcy为激励函数;
Figure BDA0003568570300000133
为权重矩阵;
Figure BDA0003568570300000134
是Critic网络的输出,用来拟合最优价值函数。定义如下形式的Actor网络,
Figure BDA0003568570300000135
其中φU10U20为激励函数;
Figure BDA0003568570300000136
为权重矩阵;
Figure BDA0003568570300000137
用来拟合最优控制策略。在网络的训练过程中,让Critic网络满足贝尔曼方程,Actor网络符合最优价值函数的偏导数,因此定义Critic网络的拟合误差如下:
Figure BDA0003568570300000138
Figure BDA0003568570300000139
训练过程使用梯度下降的方法,使得拟合误差收敛到可接受范围内。
同理定义Actor网络的拟合误差如下:
Figure BDA00035685703000001310
根据训练误差的导数,Critic网络和Actor网络的权重矩阵更新过程如下:
Figure BDA0003568570300000141
Figure BDA0003568570300000142
其中rcy>0,rcx>0,
Figure BDA0003568570300000143
是权重矩阵的学习率。
通过训练使得Critic网络与贝尔曼方程的拟合误差减小到允许范围内。在每次训练过程中,使用Actor网络拟合最优控制策略,并使用Actor网络的输出作为系统的控制输入,开始下一次训练。通过设置合理的训练终止条件可以得到收敛的Actor和Critic网络,从而得到优化广义控制输入U1,U2
为了验证本发明提出的一种气垫船轨迹跟踪控制方法的控制效果,进行了仿真实验,图3和图4是根据实验数据得到的控制效果图。此外,为了与现有技术作对比,本发明选取传统ADRC方法进行对比实验,图5、图6、图7及图8为根据实验结果绘制的,当t=1.6s时刻气垫船系统存在扰动的情况下,本发明提供的一种气垫船轨迹跟踪控制方法与传统ADRC方法的鲁棒性对比图。仿真实验结果表明,本发明提供的一种气垫船轨迹跟踪控制方法具有更好的鲁棒性和自适应性。
综上所述,以上仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (2)

1.一种气垫船轨迹跟踪控制方法,其特征在于,包括以下步骤:
步骤1、采用微分平坦方法建立气垫船的全驱动气垫船模型,如公式(1)所示:
Figure FDA0004055161100000011
其中,x1为气垫船的位置坐标中的横坐标x,x2为横坐标x的一阶导数,x3为横坐标x的二阶导数,x4为横坐标x的三阶导数,x5为横坐标方向上的扰动,y1为气垫船的位置坐标中的纵坐标y,y2为纵坐标y的一阶导数,y3为纵坐标y的二阶导数,y 4为纵坐标y的三阶导数,y 5为纵坐标方向上的扰动,x为扰动
Figure FDA00040551611000000110
的导数,y为扰动
Figure FDA0004055161100000019
的导数,h为采样时间间隔,k为第k个采样时刻,U1为气垫船的x方向广义输入,U2为气垫船的y方向广义输入;
步骤2、针对所述全驱动气垫船模型,采用自抗扰控制方法构建气垫船轨迹跟踪控制器实现对气垫船轨迹的跟踪控制,所述气垫船轨迹跟踪控制器包括气垫船微分跟踪器、气垫船扩张状态观测器和基于状态反馈和扰动补偿的控制策略;
所述气垫船微分跟踪器如公式(2)所示:
Figure FDA0004055161100000012
其中
Figure FDA0004055161100000013
为x1的近似值,
Figure FDA0004055161100000014
为x2的近似值,
Figure FDA0004055161100000015
为x3的近似值,
Figure FDA0004055161100000016
为x4的近似值,fx(k)为x的四阶导数的近似值,
Figure FDA0004055161100000017
为y1的近似值,
Figure FDA0004055161100000018
为y2的近似值,
Figure FDA0004055161100000021
为y3的近似值,
Figure FDA0004055161100000022
为y4的近似值,fy(k)为y的四阶导数的近似值,r1为气垫船微分跟踪器的x方向参数,r2为气垫船微分跟踪器的y方向参数,x(k+1)为x在第k+1个采样时刻的取值,y(k+1)为y在第k+1个采样时刻的取值;
所述气垫船扩张状态观测器如公式(3)所示:
Figure FDA0004055161100000023
其中,e1为x方向的跟踪误差,e2为y方向的跟踪误差,z11,z12,z13,z14,z15分别是x1,x2,x3,x4,x5的估计值,z21,z22,z23,z24,z25分别是y1,y2,y3,y4,y5的估计值,b11,b12,...,b25是观测器参数;
基于状态反馈和扰动补偿的控制策略中的控制率如公式(4)所示:
Figure FDA0004055161100000024
Figure FDA0004055161100000025
其中,φx为x方向的控制率,φy为y方向的控制率,k11,k12,...,k24为控制参数。
2.根据权利要求1所述的一种气垫船轨迹跟踪控制方法,其特征在于,所述气垫船轨迹跟踪控制器的控制率为采用强化学习算法进行计算,计算方式包括:
构建Critic网络和Actor网络分别用于拟合气垫船系统在当前状态下的最优控制策略和最优价值函数,其中,所述Critic网络为具有4个输入节点、16个隐藏层节点和4个输出节点的全连接网络,所述Actor网络为具有4个输入节点、16个隐藏层节点和1个输出节点的全连接网络,以所述Actor网络的输出作为气垫船系统的广义控制输入U1和U2,同时得到优化的控制率φx和φy
CN202210336388.7A 2022-03-28 2022-03-28 一种气垫船轨迹跟踪控制方法 Active CN114879658B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210336388.7A CN114879658B (zh) 2022-03-28 2022-03-28 一种气垫船轨迹跟踪控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210336388.7A CN114879658B (zh) 2022-03-28 2022-03-28 一种气垫船轨迹跟踪控制方法

Publications (2)

Publication Number Publication Date
CN114879658A CN114879658A (zh) 2022-08-09
CN114879658B true CN114879658B (zh) 2023-03-03

Family

ID=82668554

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210336388.7A Active CN114879658B (zh) 2022-03-28 2022-03-28 一种气垫船轨迹跟踪控制方法

Country Status (1)

Country Link
CN (1) CN114879658B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107015562A (zh) * 2017-04-26 2017-08-04 华南理工大学 一种满足预设跟踪性能的欠驱动水面船舶控制方法
CN108828955A (zh) * 2018-08-16 2018-11-16 大连海事大学 基于有限时间扩张状态观测器的精准航迹跟踪控制方法
CN109189071A (zh) * 2018-09-25 2019-01-11 大连海事大学 基于模糊观测器的鲁棒自适应无人船路径跟踪控制方法
CN109856976A (zh) * 2019-03-12 2019-06-07 哈尔滨工程大学 一种基于自适应交叉粒子群优化的气垫船航迹跟踪自抗扰控制方法
CN110018687A (zh) * 2019-04-09 2019-07-16 大连海事大学 基于强化学习方法的无人水面船最优轨迹跟踪控制方法
CN110647154A (zh) * 2019-10-29 2020-01-03 大连海事大学 基于模糊状态观测器的智能船舶自动舵系统航向轨迹跟踪设计方法
CN111949036A (zh) * 2020-08-25 2020-11-17 重庆邮电大学 一种轨迹跟踪控制方法、系统及两轮差速移动机器人

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11577723B2 (en) * 2020-06-29 2023-02-14 Uatc, Llc Object trajectory association and tracking

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107015562A (zh) * 2017-04-26 2017-08-04 华南理工大学 一种满足预设跟踪性能的欠驱动水面船舶控制方法
CN108828955A (zh) * 2018-08-16 2018-11-16 大连海事大学 基于有限时间扩张状态观测器的精准航迹跟踪控制方法
CN109189071A (zh) * 2018-09-25 2019-01-11 大连海事大学 基于模糊观测器的鲁棒自适应无人船路径跟踪控制方法
CN109856976A (zh) * 2019-03-12 2019-06-07 哈尔滨工程大学 一种基于自适应交叉粒子群优化的气垫船航迹跟踪自抗扰控制方法
CN110018687A (zh) * 2019-04-09 2019-07-16 大连海事大学 基于强化学习方法的无人水面船最优轨迹跟踪控制方法
CN110647154A (zh) * 2019-10-29 2020-01-03 大连海事大学 基于模糊状态观测器的智能船舶自动舵系统航向轨迹跟踪设计方法
CN111949036A (zh) * 2020-08-25 2020-11-17 重庆邮电大学 一种轨迹跟踪控制方法、系统及两轮差速移动机器人

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
沈剑毅.全垫升气垫船登滩运动特性分析.2018,第第1卷卷(第第1卷期),第26-31页. *

Also Published As

Publication number Publication date
CN114879658A (zh) 2022-08-09

Similar Documents

Publication Publication Date Title
CN110850719B (zh) 一种基于强化学习的空间非合作目标参数自整定追踪方法
CN110083061B (zh) 一种轮式移动机器人控制方法
CN109901403A (zh) 一种自主水下机器人神经网络s面控制方法
CN110597061A (zh) 一种多智能体完全分布式自抗扰时变编队控制方法
CN110262494B (zh) 一种同构多无人艇系统的协同学习与编队控制方法
CN114779645B (zh) 一种有向固定通信拓扑下胸鳍拍动式机器鱼编队控制方法
CN109799818B (zh) 多参数化路径导引的无人船协同操纵控制器的设计方法
CN114047773B (zh) 一种基于扩张状态观测器的水下集矿机器人反步滑模自适应姿态控制方法
CN111897324A (zh) 基于fa-ladrc的无人船艇航向控制系统
Shen et al. Dynamic surface control for tracking of unmanned surface vessel with prescribed performance and asymmetric time-varying full state constraints
CN113671962A (zh) 一种无人驾驶铰接式清扫车的横向控制方法
CN113848887A (zh) 一种基于mlp方法的欠驱动无人艇轨迹跟踪控制方法
CN115202349A (zh) 基于通信干扰的多移动机器人协同编队控制方法、装置、设备及存储介质
CN114967714A (zh) 一种自主式水下机器人抗扰运动控制方法及系统
CN114879658B (zh) 一种气垫船轨迹跟踪控制方法
CN113093804B (zh) 基于反演滑模控制的无人艇编队控制方法和控制系统
CN109828454B (zh) 基于海况等级切换的多策略融合auv运动控制方法
CN109189080B (zh) 基于模糊理论的多自主海洋航行器系统分布式控制方法
CN116449703A (zh) 一种有限时间框架下的auh编队协同控制方法
CN115903820A (zh) 多无人艇追逃博弈控制方法
CN114004035B (zh) 一种水面无人艇目标跟踪控制方法
CN115951581A (zh) 一种基于改进empc的高速无人艇路径跟踪控制方法
CN115857501A (zh) 一种网络化多移动机器人分布式保性能包含控制方法
CN111830832B (zh) 仿生滑翔机器海豚平面路径跟踪方法及系统
CN116125881B (zh) 一种有向切换拓扑胸鳍拍动式机器鱼编队切换控制方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant