CN115562005A - 一种基于复合学习的水面船舶动态事件触发控制方法 - Google Patents

一种基于复合学习的水面船舶动态事件触发控制方法 Download PDF

Info

Publication number
CN115562005A
CN115562005A CN202211125909.0A CN202211125909A CN115562005A CN 115562005 A CN115562005 A CN 115562005A CN 202211125909 A CN202211125909 A CN 202211125909A CN 115562005 A CN115562005 A CN 115562005A
Authority
CN
China
Prior art keywords
ship
design
formula
composite
dynamic event
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211125909.0A
Other languages
English (en)
Inventor
祝贵兵
马勇
卢金树
喻淑兰
陈超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Ocean University ZJOU
Original Assignee
Zhejiang Ocean University ZJOU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Ocean University ZJOU filed Critical Zhejiang Ocean University ZJOU
Priority to CN202211125909.0A priority Critical patent/CN115562005A/zh
Publication of CN115562005A publication Critical patent/CN115562005A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/042Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Feedback Control In General (AREA)

Abstract

本发明属于船舶自动控制技术领域,具体涉及一种基于复合学习的水面船舶动态事件触发控制方法,包括:建立船舶数学模型;设计神经网络状态观测器;设计控制律的控制指令。本发明通过采用神经网络逼近技术对船舶数学模型中纵向、转向中非线性动态不确定项进行重构,建立有限时间扰动估计器,对纵向、转向中包括未知外部扰动和不可接近部分在内的整体不确定性进行在线重构,能够实现复杂不确定性的快速、准确在线重构,释放了在线干扰估计技术对船舶运动模型的精确要求,扩大了在线干扰估计技术的应用范围,引入事件触发控制方法,抑制驱动器不必要的磨损。

Description

一种基于复合学习的水面船舶动态事件触发控制方法
技术领域
本发明属于水面船舶自动控制技术领域,具体涉及一种基于复合学习的水面船舶动态事件触发控制方法。
背景技术
水面船舶对于各种海上作业活动至关重要,如海洋勘探、海上运输、海洋勘测等。船舶在航行过程中,航行环境复杂多变,经常遭遇风、浪、流影响,同时船舶本身存在着诸多不确定性,如船舶参数的不确定性、传感设备的测量不确定性、推进系统的突发故障等等,这些都给智能船舶的安全航行带来了极大的挑战。由于外部环境、船舶操纵特性,船舶的动力学部分必然受到内部动态不确定性和未知外部扰动的影响。值得注意的是,在运动控制设计中处理这些不确定性,会对控制性能产生重大影响,如控制精度、稳定时间、稳定性能等。针对以上问题,相关现有技术公开如下:为应对内部和/外部不确定性造成的不利影响,文献《Disturbance observer-based adaptive intelligent control of marine vesselwith position and heading constraint condition related to desired output》和文献《Event-triggered finite-time tracking control of underactuated MSVs basedon neural network disturbance observer》利用基于自适应神经网络的扰动观测器重建包括内部动态不确定性和未知外部扰动的复合不确定性。为了进一步提高复合不确定性的重建精度,文献《Composite neural dynamic surface control of a class ofuncertain nonlinear systems in strict-feedback form》引入了串-并行估计模型(SPEM),构建了与文献《Composite neural learning fault-tolerant control forunderactuated vehicles with event-triggered input》中动态相同的并行动态,并设计了一种改进的自适应律。需要指出的是,上述工作一般要求船舶速度已知。显然,由于传感器故障或其他问题,船舶的速度信息可能无法直接取得。针对这一问题,文献《Event-triggered composite adaptive fuzzy output-feedback control for path followingof autonomous surface vessels》基于神经网络的状态观测器的思想设计了一种基于模糊的状态观测器,并引入了SPEM,然后开发了一种基于复合学习的自适应模糊输出反馈路径跟踪控制方案。应该指出的是,尽管上述中的工作有效地解决了船舶速度信息未知的问题,但没有充分考虑扰动估计精度问题。针对这一问题,在现有的工作中,很少有针对船舶速度未知条件下设计扰动观测器的文献。在缺乏船舶速度信息的情况下,能否对内部和外部不确定性进行分类重建一直是一个悬而未决的问题。
从实际角度来看,安装在船舶上的执行器会遭受响应频率等的物理约束。此外,由于船体和设备的振动、测量噪声等,会加剧机械磨损。为了减少机械磨损并确保控制命令保持在执行器的工作范围内,有效的措施是降低控制律与执行器之间控制命令的传输频率。为了实现这一点,文献《Event-triggered approximate optimal path-followingcontrol for unmanned surface vehicles with state constraints》采用事件触发控制(ETC)方法解决路径跟踪问题,与连续时间控制相比,ETC下的控制方案不仅减少了控制律计算的控制命令的传输次数,而且保持了满意的控制性能。应该指出的是,事件触发协议(ETP),包括内部触发、外部触发和复合触发。上述文献中提出的ETP均属于静态ETP。与静态ETP相比,动态触发协议(DETP)可以进一步减少事件数量,同时保持可接受的控制性能。但在船舶速度未知情况下,将动态触发控制方法应用于解决具有内部和外部不确定性的控制问题,现有文献中很少讨论。
因此,亟需开发一种基于复合学习的水面船舶动态事件触发控制方法,以解决上述问题。
发明内容
本发明的目的是提供一种基于复合学习的水面船舶动态事件触发自适应神经输出反馈控制方法。
为了解决上述技术问题,本发明提供了一种基于复合学习的水面船舶动态事件触发控制方法,包括:
步骤1:建立船舶数学模型;
步骤2:设计神经网络状态观测器;
步骤3:设计控制律的控制指令。
本发明充分利用自适应神经网络和扰动观测器的独特优势,解决了在船舶速度未知情况下,对内部、外部不确定进行重构与补偿。为了提高控制性能,在backstepping设计框架下,为了提高重构精度,引入串-并行估计模型,通过嵌入预测误差和复合扰动的估计值来设计复合学习律。并在控制律和执行器之间建立动态事件触发协议,减少执行器的机械磨损。
进一步地,
所述步骤1中建立的船舶数学模型为:
Figure BDA0003848662940000031
Figure BDA0003848662940000032
式中η=[x,y,ψ]T表示船舶在惯性坐标系中位置(x,y)和航向角ψ;
υ=[u,v,r]T为附体坐标系下船舶的速度向量,且u、v、r分别表示船体坐标系中船舶的前向速度、横漂速度、艏摇角速度;
R(ψ)是由
Figure BDA0003848662940000041
给出的旋转矩阵;
M∈R3×3是惯性矩阵;
f(υ)是非线性动力学,包括科里奥利向心项和阻尼项;
τ=[τ123]T是推进系统产生的控制输入矢量;
τd=[τd,1d,2d,3]T是由风、流、波等引起的未知、时变的外部扰动矢量。
进一步地,
所述步骤2包括:依据船舶数学模型,利用自适应神经网络和扰动观测器技术,提出了一种分类重构思想,通过状态观测器和扰动观测器之间的耦合设计,设计了一种新的自适应神经网络状态观测器。用于在速度未知情况下,对水面船舶遭受的复合不确定影响进行重构:
根据式(1)和式(2),船舶的动态写为
Figure BDA0003848662940000042
式中,β(υ,τ)=Μ-1(τ-f(υ))、
Figure BDA0003848662940000043
考虑到假设2,β(υ,τ)和
Figure BDA0003848662940000044
在基于神经网络的状态观测器的设计中不可使用,根据引理3,未知项β(υ,τ)可以通过神经网络近似技术在线重构;
Figure BDA0003848662940000049
式中,ζ=[υTT]T
Figure BDA0003848662940000045
为权重矩阵,
Figure BDA0003848662940000046
是基函数向量,并且εo是近似误差向量。这里
Figure BDA00038486629400000410
ρi(ζ)=[ρi,1(ζ),…,ρi,l(ζ)]T且||εo||≤ει其中ει>0是未知常量;
进一步,
Figure BDA0003848662940000047
可以写成
Figure BDA0003848662940000048
式中,
Figure BDA0003848662940000051
是复合扰动,根据神经网络的逼近理论和假设1,存在一个未知常数
Figure BDA0003848662940000052
满足
Figure BDA0003848662940000053
其中,
假设1为:外部扰动τd其导数未知且有界,即:存在未知常量
Figure BDA0003848662940000054
Figure BDA0003848662940000055
满足
Figure BDA0003848662940000056
Figure BDA0003848662940000057
将位置、速度、复合扰动和
Figure BDA00038486629400000528
的估计定义为
Figure BDA0003848662940000058
Figure BDA0003848662940000059
Figure BDA00038486629400000510
Figure BDA00038486629400000511
Figure BDA00038486629400000512
Figure BDA00038486629400000513
Figure BDA00038486629400000514
由基于如下状态观测器取得:
Figure BDA00038486629400000515
式中,
Figure BDA00038486629400000516
σ为辅助变量,κ>0、κ1>0和κ2>0为观测器增益;
为了获得复合扰动ω的估计值
Figure BDA00038486629400000527
设计如下辅助变量δo∈R3
δo=ω-κoυ;(7)
式中,κ0>0是一个设计常数,由式(7)可知,如果取得
Figure BDA00038486629400000517
Figure BDA00038486629400000518
则可以得到复合扰动ω的估计,而根据式(6),可以得到
Figure BDA00038486629400000519
为了获得
Figure BDA00038486629400000520
设计如下动态:
Figure BDA00038486629400000521
进一步,复合扰动的估计值为:
Figure BDA00038486629400000522
Figure BDA00038486629400000523
可以得到
Figure BDA00038486629400000524
进一步,取
Figure BDA00038486629400000525
的导数,并利用式(5)和(7)-(9)可得
Figure BDA00038486629400000526
式中,
Figure BDA0003848662940000061
神经网络状态观测器的误差为:
Figure BDA0003848662940000062
神经网络状态观测中,神经网络的自适应律设计为:
Figure BDA0003848662940000063
式中,Ko=diag(Ko,1,Ko,2,Ko,3)是一个设计矩阵,Ko,i为常数,k3是一个设计常数。
进一步地,
所述步骤3包括:依据水面船舶数学模型采用引入串并联估计模型来获得预测误差,然后通过嵌入预测误差和复合扰动估计来设计复合学习律,并在控制律和执行器之间建立了动态事件触发协议:
定义位置误差eη∈R3和速度误差eυ∈R3
eη=η-ηr;(13)
eυ=υ-α;(14)
式中,α∈R3为αυ∈R3的滤波形式,α∈R3可通过以下多变量滤波器获得
Figure BDA0003848662940000064
其中,J>0是滤波器的时间常数;设
Figure BDA0003848662940000065
得到
Figure BDA0003848662940000066
对eη微分并代入上式可得
Figure BDA0003848662940000067
设计虚拟控制函数αυ
Figure BDA0003848662940000071
式中,c1∈R3×3是对称正定设计矩阵;
Figure BDA0003848662940000072
对eυ微分,并代入式(2)可得
Figure BDA0003848662940000073
式中,
Figure BDA0003848662940000074
Figure BDA0003848662940000075
根据假设1和假设2,式(19)中存在两个未知项,即F(υ)和τd。控制律τ中不直接使用F(υ)和τd,根据神经网络在线重构理论,F(υ)可以在线重构,但τd不能在线重构,因为它状态η和υ无关;
其中,假设2为:惯性矩阵M包括标准部分M0和不确定部分δM即M=M0+δM,且δM和f(υ)完全未知;
进一步,利用引理2,可以得到
Figure BDA0003848662940000076
式中,
Figure BDA0003848662940000077
ρ(ν)=[ρ1(ν)T2(ν)T3(ν)T]T、ευ=[ευ,1υ,2υ,3]T
根据NN的逼近原理,误差向量ευ满足
Figure BDA0003848662940000078
Figure BDA0003848662940000079
Figure BDA00038486629400000710
为常数;
Figure BDA00038486629400000711
根据假设1和
Figure BDA00038486629400000712
存在未知常数
Figure BDA00038486629400000713
使得
Figure BDA00038486629400000714
此外,将式(20)和
Figure BDA00038486629400000715
代入式(19)得
Figure BDA00038486629400000716
水面船舶的轨迹跟踪控制律设计如下:
Figure BDA00038486629400000717
Figure BDA00038486629400000718
式中,c2∈R3×3是对称正定设计矩阵,
Figure BDA00038486629400000719
Figure BDA00038486629400000720
Figure BDA00038486629400000721
的估计,
Figure BDA00038486629400000722
是τw的估计值;
动态事件触发协议为:
Figure BDA0003848662940000081
aι和bι是设计常数,θι由以下动态
Figure BDA0003848662940000082
式中,ρι∈R+为设计常数,θι(0)为θι的初始值。
复合扰动的估计
Figure BDA0003848662940000083
可通过以下扰动观测器获得;
Figure BDA0003848662940000084
式中,
Figure BDA0003848662940000085
是辅助变量δw的估计值。这里,
Figure BDA0003848662940000086
其中κw是用户设计的常数。在这项工作中,为了获得δw的估计值,设计了以下动态:
Figure BDA0003848662940000087
式中,
Figure BDA00038486629400000814
是正定设计矩阵,μ∈R3×3是一个预测误差变量,在后续过程中设计;
将预测误差变量定义为
Figure BDA0003848662940000088
式中,
Figure BDA0003848662940000089
是eυ的预测值;
通过建立串行-并行估计模型取得预测值
Figure BDA00038486629400000810
Figure BDA00038486629400000811
自适应律
Figure BDA00038486629400000812
设计为:
Figure BDA00038486629400000813
式中,Kc∈R3×3为正定设计矩阵,κc∈R+为设计常数。
与现有技术相比,本发明的有益效果是:
本发明通过采用神经网络逼近技术对船舶数学模型中纵向、转向中非线性动态不确定项进行重构,建立有限时间扰动估计器,对纵向、转向中包括未知外部扰动和不可接近部分在内的整体不确定性进行在线重构,能够实现复杂不确定性的快速、准确在线重构,释放了在线干扰估计技术对船舶运动模型的精确要求,扩大了在线干扰估计技术的应用范围,引入事件触发控制方法,抑制驱动器不必要的磨损。
本发明的其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明流程图;
图2本发明的x-y平面的跟踪性能曲线图;
图3本发明提供的参考位置与实际位置响应曲线图;
图4本发明的跟踪误差变化曲线图;
图5本发明的控制输入曲线图;
图6本发明的权值向量估计值范数的变化曲线图;
图7本发明的速度及其估计值的变化曲线图;
图8本发明的观测器误差的变化曲线图;
图9本发明的触发时间与触发瞬间的响应图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1
在本实施例中,如图1至图9所示,本实施例提供了一种基于复合学习的水面船舶动态事件触发控制方法,本船舶动态事件触发控制方法包括:
步骤1:建立船舶数学模型;
步骤2:设计神经网络状态观测器;
步骤3:设计控制律的控制指令。
本发明充分利用自适应神经网络和扰动观测器的独特优势,提出了一种分类重构的思想,实现了状态观测器和扰动观测器之间的耦合器设计。解决了在船舶速度未知情况下,遭受内部、外部不确定性影响下的控制问题。进一步,为了提高控制性能,在backstepping设计框架下,为了提高重构精度,引入串-并行估计模型,通过嵌入预测误差和复合扰动的估计值来设计复合学习律。并在控制律和执行器之间建立动态事件触发协议,减少执行器的机械磨损。最后,提出了一种新的动态事件触发复合学习自适应神经输出反馈控制方案。与先前研究相较,本发明所设计的控制方案,能够实现复合不确定性的快速、准确在线重构,释放了在线扰动估计技术对船舶运动模型的精确要求,扩大了在线扰动估计技术的应用范围,引入动态事件触发控制方法,抑制执行器不必要的机械磨损。
在本实施例中,所述建立船舶数学模型的方法包括:
Figure BDA0003848662940000101
Figure BDA0003848662940000111
式中η=[x,y,ψ]T表示船舶在惯性坐标系中位置(x,y)和航向角ψ;
υ=[u,v,r]T为附体坐标系下船舶的速度向量,且u、v、r分别表示船体坐标系中船舶的前向速度、横漂速度、艏摇角速度;
R(ψ)是由
Figure BDA0003848662940000112
给出的旋转矩阵;
旋转矩阵R(ψ)具有以下属性:
属性1:矩阵R(ψ)是正交的,即||R(ψ)||=1和R-1(ψ)=RT(ψ);
属性2:
Figure BDA0003848662940000113
其中
Figure BDA0003848662940000114
注1:根据属性2,可以得到
Figure BDA0003848662940000115
Figure BDA0003848662940000116
M∈R3×3是惯性矩阵;
f(υ)是非线性动力学,包括科里奥利向心项和阻尼项;
τ=[τ123]T是推进系统产生的控制输入矢量;
τd=[τd,1d,2d,3]T是由风、流、波等引起的未知、时变的外部扰动矢量;
为了便于设计和分析,给出了以下假设:
假设1:外部扰动τd其导数未知且有界,即:存在未知常量
Figure BDA0003848662940000117
Figure BDA0003848662940000118
满足
Figure BDA0003848662940000119
Figure BDA00038486629400001110
假设2:惯性矩阵M包括标准部分M0和不确定部分δM即M=M0+δM,且δM和f(υ)完全未知;
假设3:参考轨迹ηr=[xr,yrr]T具有一阶、二阶导数;
假设4:速度υ在控制设计中未知;
为船舶跟踪控制设计与分析,给出如下定义与定理:
引理1:对于任意标量p和q以及正常数b,m和n,如果m和n满足m>1,n>1和(m-1)(n-1)=1,有
Figure BDA0003848662940000121
引理2:对于任何给定的非线性函数
Figure BDA0003848662940000122
Rn→R紧集上定义的
Figure BDA0003848662940000123
有一个NN
Figure BDA0003848662940000124
所以对于任何给定的正标量ε,
Figure BDA0003848662940000125
式中,
Figure BDA00038486629400001223
Figure BDA0003848662940000126
分别为权重向量和基函数向量,满足
Figure BDA0003848662940000127
和这里,
Figure BDA0003848662940000128
和ε为常数,l>1是节点数。基函数
Figure BDA0003848662940000129
选择为高斯函数,即:
Figure BDA00038486629400001210
式中,ι′i=[ιi,1,…,ιi,l]T和ωi
Figure BDA00038486629400001211
中心点向量值和宽度。
引理3:对于具有高斯函数的径向基函数向量,如果
Figure BDA00038486629400001212
为输入向量,且
Figure BDA00038486629400001213
Figure BDA00038486629400001214
Figure BDA00038486629400001215
分别是常数和有界向量,存在有界函数向量
Figure BDA00038486629400001216
使得
Figure BDA00038486629400001217
式中,
Figure BDA00038486629400001218
Figure BDA00038486629400001219
为常数。
基于神经网络的状态观测器设计
根据式子(1)和式子(2),船舶的动态可写为
Figure BDA00038486629400001220
式中,β(υ,τ)=Μ-1(τ-f(υ))、
Figure BDA00038486629400001221
考虑到假设2,β(υ,τ)和
Figure BDA00038486629400001222
在基于神经网络的状态观测器的设计中不可使用。
根据引理3,未知项β(υ,τ)可以通过神经网络近似技术在线重构。
Figure BDA00038486629400001323
式中,ζ=[υTT]T
Figure BDA0003848662940000131
为权重矩阵,
Figure BDA0003848662940000132
是基函数向量,并且εo是近似误差向量。这里
Figure BDA00038486629400001324
ρi(ζ)=[ρi,1(ζ),…,ρi,l(ζ)]T且||εo||≤ει其中ει>0是未知常量。
进一步,
Figure BDA0003848662940000133
可以写成
Figure BDA0003848662940000134
式中,
Figure BDA0003848662940000135
是集总扰动。根据神经网络的逼近理论和假设1,存在一个未知常数
Figure BDA0003848662940000136
满足
Figure BDA0003848662940000137
将位置、速度、集中扰动和
Figure BDA00038486629400001325
的估计定义为
Figure BDA0003848662940000138
Figure BDA0003848662940000139
Figure BDA00038486629400001310
Figure BDA00038486629400001311
Figure BDA00038486629400001312
Figure BDA00038486629400001313
Figure BDA00038486629400001314
由基于如下神经的状态观测器取得:
Figure BDA00038486629400001315
式中,
Figure BDA00038486629400001316
σ为辅助变量,κ>0、κ1>0和κ2>0为观测器增益。
为了获得集中扰动ω的估计值
Figure BDA00038486629400001317
设计如下辅助变量δo∈R3
δo=ω-κoυ;(12)
式中,κ0>0是一个设计常数。由式(12)可知,如果取得
Figure BDA00038486629400001318
Figure BDA00038486629400001319
则可以得到复合扰动ω的估计,而根据式(11),可以得到
Figure BDA00038486629400001320
为了获得
Figure BDA00038486629400001321
设计如下动态:
Figure BDA00038486629400001322
进一步,复合扰动估计为:
Figure BDA0003848662940000141
Figure BDA0003848662940000142
可以得到
Figure BDA0003848662940000143
进一步,取
Figure BDA0003848662940000144
的导数,并利用式子(10)和(12)-(14)可得
Figure BDA0003848662940000145
式中,
Figure BDA0003848662940000146
神经网络状态观测器的误差为:
Figure BDA0003848662940000147
Figure BDA0003848662940000148
在神经网络状态观测中,神经网络的权重自适应律设计为:
Figure BDA0003848662940000149
式中,Ko=diag(Ko,1,Ko,2,Ko,3)是一个设计矩阵,Ko,i为常数,k3是一个设计常数。
控制律设计
针对具有内部/外部不确定性和速度不可测量的MSV,在反推设计框架下,利用基于神经的状态观测器(10)等方法、自适应神经技术和扰动观测器技术,设计了一种事件触发的自适应神经输出反馈控制律。整个设计过程包括两个步骤。
在控制设计之前,定义以下位置误差eη∈R3和速度误差eυ∈R3
eη=η-ηr;(18)
eυ=υ-α;(19)
式中,α∈R3为αυ∈R3的滤波形式,这里,α∈R3可通过以下多变量滤波器获得
Figure BDA0003848662940000151
其中,J>0是滤波器的时间常数。设
Figure BDA0003848662940000152
得到
Figure BDA0003848662940000153
对eη微分并使用(1)、(28)和(29)可得
Figure BDA0003848662940000154
设计虚拟控制函数αυ
Figure BDA0003848662940000155
式中,c1∈R3×3是对称正定设计矩阵。
利用式(22)可得
Figure BDA0003848662940000156
步骤2:区分eυ并使用(2)可得
Figure BDA0003848662940000157
式中,
Figure BDA0003848662940000158
Figure BDA0003848662940000159
根据假设1和2,我们知道(24)中存在两个未知项,即F(υ)和τd。显然,控制律τ中不直接使用F(υ)和τd。根据NN的在线重构理论,F(υ)可以在线重构,但τd不能在线重构,因为它状态η和υ无关。
进一步,利用引理2,可以得到
Figure BDA00038486629400001510
式中,
Figure BDA00038486629400001511
ρ(ν)=[ρ1(ν)T2(ν)T3(ν)T]T、ευ=[ευ,1υ,2υ,3]T。根据NN的逼近原理,误差向量ευ满足
Figure BDA00038486629400001512
Figure BDA00038486629400001513
Figure BDA00038486629400001514
Figure BDA00038486629400001515
为常数。
Figure BDA00038486629400001516
根据假设1和
Figure BDA00038486629400001517
存在未知常数
Figure BDA00038486629400001518
使得
Figure BDA00038486629400001519
此外,将(25)和
Figure BDA00038486629400001520
代入(24)可得
Figure BDA0003848662940000161
此外,船舶的轨迹跟踪控制律设计如下
Figure BDA0003848662940000162
Figure BDA0003848662940000163
式中,c2∈R3×3是对称正定设计矩阵,
Figure BDA0003848662940000164
Figure BDA0003848662940000165
Figure BDA00038486629400001618
的估计,
Figure BDA0003848662940000166
是τw的估计;
动态事件触发协议(DETP)
Figure BDA0003848662940000167
aι和bι是设计常数,θι由以下动态
Figure BDA0003848662940000168
式中,ρι∈R+为设计常数,θι(0)为θι的初始值。
复合扰动的估计
Figure BDA0003848662940000169
可通过以下扰动观测器获得
Figure BDA00038486629400001610
式中,
Figure BDA00038486629400001611
是辅助变量δw的估计值。这里,
Figure BDA00038486629400001612
其中κw是用户设计的常数。在这项工作中,为了获得δw的估计值,设计了以下动态
Figure BDA00038486629400001613
式中,
Figure BDA00038486629400001614
是正定设计矩阵,μ∈R3×3是一个预测误差变量,在后续过程中设计。
将预测误差变量定义为
Figure BDA00038486629400001615
式中,
Figure BDA00038486629400001616
是eυ的预测值。
通过建立串行-并行估计模型取得预测值
Figure BDA00038486629400001617
Figure BDA0003848662940000171
自适应律
Figure BDA0003848662940000172
设计为:
Figure BDA0003848662940000173
式中,Kc∈R3×3为正定设计矩阵,κc∈R+为设计常数。
对基于复合学习的水面船舶动态事件触发自适应神经控制方法进行仿真验证研究,验证有效性。
仿真试验时,模型参数如下所示:
m11=200,m22=250,m33=80,d11=70,d22=100,d23=40,d32=40,d33=80。
参考轨迹ηr
Figure BDA0003848662940000174
方程产生。
式中,τr=[1,0.2cos2(0.01πt),0.3sin2(0.01πt)]T
外界扰动设置为:
Figure BDA0003848662940000175
这里,
Figure BDA0003848662940000176
由一阶马尔可夫过程
Figure BDA0003848662940000177
生成,
Figure BDA0003848662940000178
为零均值高斯白噪声过程。dw由以下时变函数叠加产生:
Figure BDA0003848662940000179
设计参数选择为κ=120、κ1=4.5、κ2=10、κo=1、κ3=5、κc=0.01、J=0.01、Ko=diag([30I7,30I7,30I7])、c1=diag([0.6,0.5,0.7])、ρι=(1,1,1)、κw=diag([6,6,3])、
Figure BDA00038486629400001710
κp=diag([10,10,5])、Π=diag(2,2,3)Φ=diag(3,3,2)、c2=diag([35,35,42])、aι=(2,1,1)、bι=(2,1.5,0.5)。
初始条件选择为:
Figure BDA00038486629400001711
υ(0)=[0.1m/s,0.1m/s,0.01rad/s]T,其余均设置为0。
β(ζ)和
Figure BDA00038486629400001712
的节点数分别为6和12,中心分别在[-2,2]×[-2,2]×[-2,2]×[-20,20]×[-25,25]×[-20,20]和
Figure BDA00038486629400001713
范围内均匀分布,宽度设置为ωl,o=4和ωl,υ=2。
本实施例利用软件进行计算机仿真研究,结果如图2至图9所示。此外,为了证明所提出的控制方案在工作中的优越性,仿真与文献《Control of fully actuated oceansurface vessels using a class of feedforward approximators》所提出的连续时间自适应神经复合学习控制方案和基于高增益观测器的自适应神经输出反馈控制方案进行对比。图2-3显示了船舶的跟踪控制性能。从中可以发现,所提出的方案可以迫使船舶遵循参考轨迹,并获得满意的控制性能。位置误差和航向误差的曲线如图4所示,这表明位置误差是有界的,所提出的控制方案可以保证令人满意的控制精度,同时自适应神经网络和扰动观测器可以有效补偿复合不确定性。图5绘制了控制输入的变化曲线,从中可以清楚地看出,执行器控制输入是有界的和合理的。图6显示了神经网络权值的2-范数曲线,这意味着其是有界的。图7显示了船舶速度及其估计值的变化曲线,图8绘制了船舶位置和航向的估计误差曲线。图7-8表明基于神经网络的状态观测器,在船舶遭受内部和外部不确定性的影响下,可以准确地重构船舶的速度。图9显示了事件触发的瞬间和事件触发的时间间隔,这清楚地说明执行器控制命令不是无限期传输的,即不会发生ETC方法引起的芝诺现象。图2-3,我们可以清楚地发现,连续时间控制和基于高增益观测器的控制也可以迫使船舶遵循预定的参考轨迹,与本发明提出的控制方案相同。从图4和表1中可以清楚地看到,本发明提出的ETC方案和连续控制方案下的跟踪控制精度几乎相同,并且优于基于高增益观测器的控制方案下的跟踪控制精度,这是由于自适应神经网络不能重构外部扰动。从图5和表2可以得出,三种控制方案下的控制输入是有界的和合理的,但平均能量我们提出的方案的功耗最高,这意味着ETC需要通过增加能耗来补偿ETC造成的控制命令信号损失。
Figure BDA0003848662940000191
表1
综上所述,本发明考虑船舶在内外复合扰动的影响下,设计了一种基于复合学习的动态事件触发控制方法。充分利用神经网络和扰动估计技术的特殊优势,提出了一种分类重构思想,并将其应用于状态观测器和控制律的控制设计中。在状态观测器的设计中,提出了一种基于自适应神经网络的状态观测器与干扰观测器的耦合设计方法。为了提高控制性能,通过在控制律设计中引入串并行估计模型,设计了一种改进的自适应律。此外,为了减少执行器机械磨损,通过引入额外的动态变量,开发了一种新型的动态事件触发协议。最后,在逆推设计框架下,提出了一种新的基于复合学习的动态事件触发控制方案。
本申请中选用的各个器件(未说明具体结构的部件)均为通用标准件或本领域技术人员知晓的部件,其结构和原理都为本技术人员均可通过技术手册得知或通过常规实验方法获知。
在本发明实施例的描述中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
在本发明的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
以上述依据本发明的理想实施例为启示,通过上述的说明内容,相关工作人员完全可以在不偏离本项发明技术思想的范围内,进行多样的变更以及修改。本项发明的技术性范围并不局限于说明书上的内容,必须要根据权利要求范围来确定其技术性范围。

Claims (5)

1.一种基于复合学习的水面船舶动态事件触发控制方法,其特征在于,包括:
步骤1:建立船舶数学模型;
步骤2:设计神经网络状态观测器;
步骤3:设计控制律的控制指令。
2.如权利要求1所述的基于复合学习的水面船舶动态事件触发控制方法,其特征在于,
所述步骤1中的船舶数学模型为:
Figure FDA0003848662930000011
Figure FDA0003848662930000012
式中η=[x,y,ψ]T表示船舶在惯性坐标系中位置(x,y)和航向角ψ;
υ=[u,v,r]T为附体坐标系下船舶的速度向量,且u、v、r分别表示船体坐标系中船舶的前向速度、横漂速度、艏摇角速度;
R(ψ)是由
Figure FDA0003848662930000013
给出的旋转矩阵;
M∈R3×3是惯性矩阵;
f(υ)是非线性动力学,包括科里奥利向心项和阻尼项;
τ=[τ123]T是推进系统产生的控制输入矢量;
τd=[τd,1d,2d,3]T是外部扰动矢量。
3.如权利要求1所述的基于复合学习的水面船舶动态事件触发控制方法,其特征在于,
所述步骤2包括:
根据船舶数学模型,设计如下状态观测器:
Figure FDA0003848662930000021
式中,
Figure FDA0003848662930000022
σ为辅助变量,κ>0、κ1>0和κ2>0为观测器增益;
为获得辅助变量δo∈R3的估计值
Figure FDA0003848662930000023
设计如下动态:
Figure FDA0003848662930000024
式中,κ0>0是一个设计常数,如果取得
Figure FDA0003848662930000025
Figure FDA0003848662930000026
则可以得到复合扰动ω的估计;
复合扰动的估计值为:
Figure FDA0003848662930000027
Figure FDA0003848662930000028
可以得到
Figure FDA0003848662930000029
神经网络状态观测中,神经网络的自适应律设计为:
Figure FDA00038486629300000210
式中,Ko=diag(Ko,1,Ko,2,Ko,3)是一个设计矩阵,Ko,i为常数,k3是一个设计常数。
4.如权利要求1所述的基于复合学习的水面船舶动态事件触发控制方法,其特征在于,
所述步骤3包括:依据水面船舶数学模型,在矢量backstepping的设计框架下,设计扰动观测器,并将串并联估计模型引入以建立运动学通道的预估器,从而获得速度跟踪误差的预测误差,然后将预测误差、速度跟踪误差和复合扰动估计作为参数自适应的激励条件,从而设计复合学习律;进一步,在控制律和执行器之间建立动态事件触发协议。
5.如权利要求1所述的基于复合学习的水面船舶动态事件触发控制方法,其特征在于,所述步骤3具体包括:
水面船舶的轨迹跟踪控制律设计如下:
Figure FDA0003848662930000031
Figure FDA0003848662930000032
式中,c2∈R3×3是对称正定设计矩阵,
Figure FDA0003848662930000033
Figure FDA0003848662930000034
Figure FDA00038486629300000318
的估计,
Figure FDA0003848662930000035
是τw的估计值;
控制律中的动态事件触发协议为:
Figure FDA0003848662930000036
aι和bι是设计常数,θι由以下动态
Figure FDA0003848662930000037
θι(0)=0;
式中,ρι∈R+为设计常数,θι(0)为θι的初始值;
控制律中的扰动观测器为:
Figure FDA0003848662930000038
式中,
Figure FDA0003848662930000039
是辅助变量δw的估计值,这里,
Figure FDA00038486629300000310
其中κw是用户设计的常数,为获得δw的估计值,设计了以下动态:
Figure FDA00038486629300000311
式中,
Figure FDA00038486629300000312
是正定设计矩阵,μ∈R3×3是一个预测误差变量;
控制律中的串行-并行估计模型取得预测值
Figure FDA00038486629300000313
Figure FDA00038486629300000314
式中,
Figure FDA00038486629300000315
是eυ的预测值,预测误差变量定义为
Figure FDA00038486629300000316
自适应律
Figure FDA00038486629300000317
设计为:
Figure FDA0003848662930000041
式中,Kc∈R3×3为正定设计矩阵,κc∈R+为设计常数。
CN202211125909.0A 2022-09-16 2022-09-16 一种基于复合学习的水面船舶动态事件触发控制方法 Pending CN115562005A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211125909.0A CN115562005A (zh) 2022-09-16 2022-09-16 一种基于复合学习的水面船舶动态事件触发控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211125909.0A CN115562005A (zh) 2022-09-16 2022-09-16 一种基于复合学习的水面船舶动态事件触发控制方法

Publications (1)

Publication Number Publication Date
CN115562005A true CN115562005A (zh) 2023-01-03

Family

ID=84741198

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211125909.0A Pending CN115562005A (zh) 2022-09-16 2022-09-16 一种基于复合学习的水面船舶动态事件触发控制方法

Country Status (1)

Country Link
CN (1) CN115562005A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116340585A (zh) * 2023-05-25 2023-06-27 亿海蓝(北京)数据技术股份公司 船舶信息的处理方法、装置和可读存储介质
CN117150901A (zh) * 2023-08-31 2023-12-01 哈尔滨理工大学 一种节约通信资源的动力定位船位置观测器设计方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116340585A (zh) * 2023-05-25 2023-06-27 亿海蓝(北京)数据技术股份公司 船舶信息的处理方法、装置和可读存储介质
CN117150901A (zh) * 2023-08-31 2023-12-01 哈尔滨理工大学 一种节约通信资源的动力定位船位置观测器设计方法
CN117150901B (zh) * 2023-08-31 2024-06-07 哈尔滨理工大学 一种节约通信资源的动力定位船位置观测器设计方法

Similar Documents

Publication Publication Date Title
Djordjevic et al. Data-driven control of hydraulic servo actuator based on adaptive dynamic programming.
Zhao et al. Boundary disturbance observer-based control of a vibrating single-link flexible manipulator
Liu et al. Bounded neural network control for target tracking of underactuated autonomous surface vehicles in the presence of uncertain target dynamics
Djordjevic et al. Data-driven control of hydraulic servo actuator: An event-triggered adaptive dynamic programming approach
Zou et al. Fixed-time attitude tracking control for rigid spacecraft without angular velocity measurements
Chen et al. Adaptive neural output feedback control of uncertain nonlinear systems with unknown hysteresis using disturbance observer
CN115562005A (zh) 一种基于复合学习的水面船舶动态事件触发控制方法
Wang et al. Finite‐time extended state observer‐based exact tracking control of an unmanned surface vehicle
Hu et al. Dynamic output feedback control of a flexible air-breathing hypersonic vehicle via T–S fuzzy approach
Zhang et al. Practical constrained dynamic positioning control for uncertain ship through the minimal learning parameter technique
Yuan et al. Active disturbance rejection control for the ranger neutral buoyancy vehicle: A delta operator approach
Mu et al. Modeling and identification of podded propulsion unmanned surface vehicle and its course control research
Bell et al. Global exponential tracking control for an autonomous surface vessel: An integral concurrent learning approach
Sun et al. Active disturbance rejection control of surface vessels using composite error updated extended state observer
Yang et al. Neural network dynamic surface position control of n‐joint robot driven by PMSM with unknown load observer
Lv et al. Speed and heading control of an unmanned surface vehicle based on state error PCH principle
Lv et al. Robust state‐error port‐controlled Hamiltonian trajectory tracking control for unmanned surface vehicle with disturbance uncertainties
Li et al. Anti-disturbance control for attitude and altitude systems of the helicopter under random disturbances
Lin et al. Nonsingular Fast Terminal Adaptive Neuro‐sliding Mode Control for Spacecraft Formation Flying Systems
CN112068444A (zh) 一种采用非线性自适应滑模的飞行器攻角控制方法
Zheng et al. Fixed‐time extended state observer‐based trajectory tracking control for autonomous underwater vehicles
Wang et al. Robust trajectory tracking control of underactuated surface vehicles with prescribed performance
CN110908389A (zh) 一种针对不确定水下机器人的自适应快速速度跟踪控制方法
Lin et al. Robust finite‐time H‐infinity control with transients for dynamic positioning ship subject to input delay
Cui et al. Fixed‐Time Trajectory Tracking Control of Autonomous Surface Vehicle with Model Uncertainties and Disturbances

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination