CN112327638A - 一种具有指定性能并带有输入饱和限制的无人船轨迹跟踪最优控制方法 - Google Patents

一种具有指定性能并带有输入饱和限制的无人船轨迹跟踪最优控制方法 Download PDF

Info

Publication number
CN112327638A
CN112327638A CN202011416183.7A CN202011416183A CN112327638A CN 112327638 A CN112327638 A CN 112327638A CN 202011416183 A CN202011416183 A CN 202011416183A CN 112327638 A CN112327638 A CN 112327638A
Authority
CN
China
Prior art keywords
function
performance
representing
follows
optimal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011416183.7A
Other languages
English (en)
Other versions
CN112327638B (zh
Inventor
赵红
杨忱
高颖
李堃
沈士为
薛皓原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dalian Maritime University
Original Assignee
Dalian Maritime University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dalian Maritime University filed Critical Dalian Maritime University
Priority to CN202011416183.7A priority Critical patent/CN112327638B/zh
Publication of CN112327638A publication Critical patent/CN112327638A/zh
Application granted granted Critical
Publication of CN112327638B publication Critical patent/CN112327638B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/042Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Control Of Position, Course, Altitude, Or Attitude Of Moving Bodies (AREA)
  • Feedback Control In General (AREA)

Abstract

本发明提供一种具有指定性能并带有输入饱和限制的无人船轨迹跟踪最优控制方法,包括:建立无人水面船数学模型,设定无人水面船的期望轨迹数学模型;引入控制器输入饱和函数;将系统的性能约束转化为等价的性能约束,得到指定性能控制方法的期望轨迹数学模型;基于引入的所述控制器输入饱和函数以及指定性能控制方法的期望轨迹数学模型,设计无人船轨迹跟踪最优控制率;设计神经网络权重更新率。本发明的技术方案考虑控制器存在输入饱和限制,当外界干扰过大时,控制器不会因为输入饱和特性使得跟踪效果变差,当需要提高系统的控制性能而对系统的指定性能进行设计时,就需要用到指定性能的控制方法,使得系统的暂态性能得到保证。

Description

一种具有指定性能并带有输入饱和限制的无人船轨迹跟踪最 优控制方法
技术领域
本发明涉及强化学习与水面无人船的轨迹跟踪技术领域,具体而言,尤其涉及一种具有指定性能并带有输入饱和限制的无人船轨迹跟踪最优控制方法。
背景技术
如今人工智能技术已经广泛应用于控制领域,特别是无人船系统中。与传统船舶相比无人船可以很好的处理复杂多变的海上环境并且减少人为因素和不确定扰动的影响。强化学习是一个解决最优控制问题的高效的解决方法。它可以解决传统的最优控制问题中求解哈密尔顿-雅克比-贝尔曼方程不易的缺点。Werbos提出一种基于强化学习并使用演员-评论家神经网络的最优控制框架。通过使用演员-评论家神经网络可以逼近成本函数和控制策略,从而满足最优准则且避免了维数灾难问题。
当外界存在较大的风浪流等干扰时,控制器需要较大的值来克服干扰。但当控制器中存在饱和特性时,往往不能达到控制要求,因此需要考虑在控制器存在饱和时的轨迹跟踪控制问题。同时当系统的误差需要保持在一定范围内时,往往对控制的精度要求比较高,因此需要考虑在控制器存在饱和时系统的指定性能轨迹跟踪控制问题。
发明内容
根据上述提出的技术问题,而提供一种具有指定性能并带有输入饱和限制的无人船轨迹跟踪最优控制方法。本发明考虑控制器存在输入饱和限制,当外界干扰过大时,控制器不会因为输入饱和特性使得跟踪效果变差,当需要提高系统的控制性能而对系统的指定性能进行设计时,就需要用到指定性能的控制方法,使得系统的暂态性能得到保证。
本发明采用的技术手段如下:
一种具有指定性能并带有输入饱和限制的无人船轨迹跟踪最优控制方法,
包括如下步骤:
S1、建立无人水面船数学模型,设定无人水面船的期望轨迹数学模型;
S2、基于设定的所述期望轨迹数学模型,引入控制器输入饱和函数;
S3、将系统的性能约束转化为等价的性能约束,得到指定性能控制方法的期望轨迹数学模型;
S4、基于引入的所述控制器输入饱和函数以及指定性能控制方法的期望轨迹数学模型,设计无人船轨迹跟踪最优控制率;
S5、基于设计的所述无人船轨迹跟踪最优控制率,进一步设计神经网络权重更新率。
进一步地,所述步骤S1具体包括:
S11、定义两个坐标系,分别为北东坐标系XOY和附体坐标系XBOBYB,将北东坐标系XOY视作惯性坐标系,取地球任一点O为坐标原点,OX指向正北,OY指向正东;将附体坐标系XBOBYB视作非惯性坐标系,船舶左右对称时,取其中心为坐标原点OB,OBXB轴沿着船舶中线指向船艏方向,OBYB轴垂直指向右舷;
S12、建立无人水面船数学模型,如下所示:
Figure BDA0002815092560000021
v=τ′(u)+f(v)
其中,η=[x,y,ψ]T,x、y表示无人水面船运动位置矢量,ψ∈[0,2π]表示艏向角;R(ψ)表示地球坐标系和船体坐标系之间的转换矩阵;ν=[u,v,r]T表示附体坐标系下无人水面船运动的速度矢量,u、v、r分别表示其纵荡速度、横荡速度、艏摇速度;τ′=M-1τ,τ=[τuvr]T表示船舶控制输入向量,τu、τv、τr分别表示纵荡控制力、横荡控制力、艏摇控制力;f(v)表示系统动态向量,f(v)=-M-1(C(v)v+D(v)v),M(t)=MT(t)>0表示包含附加质量的惯性矩阵,C(v)表示斜对称矩阵,D(v)表示阻尼矩阵;
S13、设定无人水面船的期望轨迹数学模型,如下所示:
Figure BDA0002815092560000031
其中,xd=[ηd T,vd T]Td=[xd,ydd]T和νd=[ud,vd,rd]T分别表示无人水面船跟踪的期望位置向量及速度向量。
进一步地,所述步骤S2具体包括:
S21、引入控制器输入饱和函数,其表达式如下:
Figure BDA0002815092560000032
其中,μi表示无人船系统的控制输入,i=u,v,r;τi,M是τ(μi)的上界,τ(μi)表示具有饱和特性的控制输入;sat(μi)是μi的饱和函数;
S22、将上述sat(μi)函数逼近为一个光滑的函数,如下表示:
Figure BDA0002815092560000033
则引入的控制器输入饱和函数最终表示如下:
sat(μi)=J(μi)+σ(μi)
其中,σ(μi)表示有界函数,J(μi)逼近饱和函数的平滑函数。
S23、考虑系统的误差方程:
Figure BDA0002815092560000034
其中,
Figure BDA0002815092560000038
ηe表示位置误差,ηe=η-ηd,η表示船舶实际位置,ηd表示船舶参考位置;ve表示速度误差,ve=v-vd-h,v表示船舶实际速度,vd表示船舶参考速度,h表示辅助变量,满足
Figure BDA0002815092560000035
μ表示控制输入,
Figure BDA0002815092560000036
Figure BDA0002815092560000037
进一步地,所述步骤S3具体包括:
S31、将系统的指定性能描述为如下形式:
i,minμi(t)≤ei(t)≤δi,maxμi(t)
其中μi(t)是正定的并且是递减的平滑函数,且带有
Figure BDA0002815092560000039
δi,min与δi,max为符号参数,性能函数被选择为指数形式
Figure BDA00028150925600000310
其中aii,0i,∞是适当的正定常数;
S32、针对性能函数的特性,μi,0>μi,∞,-δi,minμi(0)≤ei(0)≤δi,maxμi(0),跟踪的误差的性能边界由性能函数μi(t)和常数δi,mini,max共同决定,因此,对跟踪误差进行转换,跟踪误差被重新定义为:
ei(t)=μi(t)Φi(zi(t))
其中,zi是转换的误差,Φi是平滑且递减的函数,表示如下:
Figure BDA0002815092560000041
上述函数的反函数为:
Figure BDA0002815092560000042
因此转化的形式可以被写为:
Figure BDA0002815092560000043
其中,
Figure BDA0002815092560000044
S33、将转换的误差动力学写为以下的等价的形式:
Figure BDA0002815092560000045
其中,z=[zx,zy,zj,zu,zv,zr]T
Figure BDA0002815092560000046
是位置的系统误差方程,并且ρ=diag[ρxyjuvr]T
Figure BDA00028150925600000414
Figure BDA0002815092560000047
是时变的控制增益;
Figure BDA0002815092560000048
在包括原点的集合
Figure BDA0002815092560000049
内是利普西茨连续的,系统动态方程中的
Figure BDA00028150925600000410
是有界的,即
Figure BDA00028150925600000411
对于常数bf,bg是恒成立的,因此,如果存在一个连续的控制器μ∈Ωμ使得系统保持稳定,那么该系统就是可控的;
S34、设计系统的消耗函数,如下所示:
Figure BDA00028150925600000412
其中,t表示当前时间;γ表示折扣因子。
进一步地,所述步骤S4具体包括:
S41、定义最优成本函数,如下:
Figure BDA00028150925600000413
其中,r(z,μ*)=zTΛzz+μ*TΛμμ*,Λzμ均为正定矩阵;zT表示误差矢量的转置;
S42、根据上述定义的最优成本函数,得到哈密尔顿-雅克比-贝尔曼方程,如下:
Figure BDA0002815092560000051
其中,
Figure BDA00028150925600000519
表示成本函数对误差矢量的梯度;
S43、得到无人船最优控制率,如下:
Figure BDA0002815092560000052
进一步地,所述步骤S5具体包括:
S51、根据前馈神经网络的全局逼近特性,将最优代价函数表示为:
Figure BDA0002815092560000053
其中,
Figure BDA0002815092560000054
表示评判器神经网络理想的权重向量,N表示神经元的个数,
Figure BDA0002815092560000055
表示神经网络输入向量基函数,εc表示有界神经网络函数逼近误差;
S52、设计所述最优成本函数的逼近函数,表示如下:
Figure BDA0002815092560000056
其中,
Figure BDA0002815092560000057
表示
Figure BDA0002815092560000058
的估计;
Figure BDA0002815092560000059
表示神经网络输入的向量基函数;
S53、基于上述设计的逼近函数,得到哈密尔顿-雅克比-贝尔曼方程,如下:
Figure BDA00028150925600000510
则最优控制器为:
Figure BDA00028150925600000511
其中,
Figure BDA00028150925600000512
表示
Figure BDA00028150925600000513
的估计,通过梯度下降方法得到:
Figure BDA00028150925600000514
其中,Γc表示正定矩阵;
Figure BDA00028150925600000515
S54、计算执行器更新率
Figure BDA00028150925600000516
其计算公式如下:
Figure BDA00028150925600000517
其中,ka为常数,
Figure BDA00028150925600000518
为正定矩阵。
较现有技术相比,本发明具有以下优点:
本发明提供的具有指定性能并带有输入饱和限制的无人船轨迹跟踪最优控制方法,考虑控制器存在输入饱和限制,当外界干扰过大时,控制器不会因为输入饱和特性使得跟踪效果变差,当需要提高系统的控制性能而对系统的指定性能进行设计时,就需要用到指定性能的控制方法,使得系统的暂态性能得到保证,更加具有实际工程意义。
基于上述理由本发明可在强化学习与水面无人船的轨迹跟踪等领域广泛推广。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图做以简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明方法流程图。
图2为本发明实施例提供的无人船位置跟踪图。
图3为本发明实施例提供的无人船速度跟踪图。
图4为本发明实施例提供的无人船位置误差图。
图5为本发明实施例提供的无人船速度误差图。
图6为本发明实施例提供的无人船轨迹跟踪图。
图7为本发明实施例提供的评论家神经网络权重更新图。
图8为本发明实施例提供的演员神经网络权重更新图。
图9为本发明实施例提供的无人船控制律图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
如图1所示,本发明提供了一种具有指定性能并带有输入饱和限制的无人船轨迹跟踪最优控制方法,包括如下步骤:
S1、建立无人水面船数学模型,设定无人水面船的期望轨迹数学模型;
具体实施时,作为本发明优选的实施方式,所述步骤S1具体包括:
S11、定义两个坐标系,分别为北东坐标系XOY和附体坐标系XBOBYB,将北东坐标系XOY视作惯性坐标系,取地球任一点O为坐标原点,OX指向正北,OY指向正东;将附体坐标系XBOBYB视作非惯性坐标系,船舶左右对称时,取其中心为坐标原点OB,OBXB轴沿着船舶中线指向船艏方向,OBYB轴垂直指向右舷;
S12、建立无人水面船数学模型,如下所示:
Figure BDA0002815092560000071
Figure BDA0002815092560000072
其中,η=[x,y,ψ]T,x、y表示无人水面船运动位置矢量,ψ∈[0,2π]表示艏向角;R(ψ)表示地球坐标系和船体坐标系之间的转换矩阵;ν=[u,v,r]T表示附体坐标系下无人水面船运动的速度矢量,u、v、r分别表示其纵荡速度、横荡速度、艏摇速度;τ′=M-1τ,τ=[τuvr]T表示船舶控制输入向量,τu、τv、τr分别表示纵荡控制力、横荡控制力、艏摇控制力;f(v)表示系统动态向量,f(v)=-M-1(C(v)v+D(v)v),M(t)=MT(t)>0表示包含附加质量的惯性矩阵,C(v)表示斜对称矩阵,D(v)表示阻尼矩阵;
S13、设定无人水面船的期望轨迹数学模型,如下所示:
Figure BDA0002815092560000081
其中,xd=[ηd T,vd T]Td=[xd,ydd]T和νd=[ud,vd,rd]T分别表示无人水面船跟踪的期望位置向量及速度向量。
S2、基于设定的所述期望轨迹数学模型,引入控制器输入饱和函数;
具体实施时,作为本发明优选的实施方式,所述步骤S2具体包括:
S21、引入控制器输入饱和函数,其表达式如下:
Figure BDA0002815092560000082
其中,μi表示无人船系统的控制输入,i=u,v,r;τi,M是τ(μi)的上界,τ(μi)表示具有饱和特性的控制输入;sat(μi)是μi的饱和函数;
S22、将上述sat(μi)函数逼近为一个光滑的函数,如下表示:
Figure BDA0002815092560000083
则引入的控制器输入饱和函数最终表示如下:
sat(μi)=J(μi)+σ(μi)
其中,σ(μi)表示有界函数,J(μi)逼近饱和函数的平滑函数。
S23、考虑系统的误差方程:
Figure BDA0002815092560000084
其中,
Figure BDA0002815092560000085
ηe表示位置误差,ηe=η-ηd,η表示船舶实际位置,ηd表示船舶参考位置;ve表示速度误差,ve=v-vd-h,v表示船舶实际速度,vd表示船舶参考速度,h表示辅助变量,满足
Figure BDA0002815092560000086
μ表示控制输入,
Figure BDA0002815092560000087
Figure BDA0002815092560000088
S3、将系统的性能约束转化为等价的性能约束,得到指定性能控制方法的期望轨迹数学模型;
具体实施时,作为本发明优选的实施方式,所述步骤S3具体包括:
S31、将系统的指定性能描述为如下形式:
i,minμi(t)≤ei(t)≤δi,maxμi(t)
其中μi(t)是正定的并且是递减的平滑函数,且带有
Figure BDA0002815092560000089
δi,min与δi,max为符号参数,性能函数被选择为指数形式
Figure BDA0002815092560000091
其中aii,0i,∞是适当的正定常数;
S32、针对性能函数的特性,μi,0>μi,∞,-δi,minμi(0)≤ei(0)≤δi,maxμi(0),跟踪的误差的性能边界由性能函数μi(t)和常数δi,mini,max共同决定,因此,对跟踪误差进行转换,跟踪误差被重新定义为:
ei(t)=μi(t)Φi(zi(t))
其中,zi是转换的误差,Φi是平滑且递减的函数,表示如下:
Figure BDA0002815092560000092
上述函数的反函数为:
Figure BDA0002815092560000093
因此转化的形式可以被写为:
Figure BDA0002815092560000094
其中,
Figure BDA0002815092560000095
S33、将转换的误差动力学写为以下的等价的形式:
Figure BDA0002815092560000096
其中,z=[zx,zy,zj,zu,zv,zr]T
Figure BDA0002815092560000097
是位置的系统误差方程,并且ρ=diag[ρxyjuvr]T
Figure BDA00028150925600000915
Figure BDA0002815092560000098
是时变的控制增益;
Figure BDA0002815092560000099
在包括原点的集合
Figure BDA00028150925600000910
内是利普西茨连续的,系统动态方程中的
Figure BDA00028150925600000911
是有界的,即
Figure BDA00028150925600000912
对于常数bf,bg是恒成立的,因此,如果存在一个连续的控制器μ∈Ωμ使得系统保持稳定,那么该系统就是可控的;
S34、设计系统的消耗函数,如下所示:
Figure BDA00028150925600000913
其中,t表示当前时间;γ表示折扣因子。
S4、基于引入的所述控制器输入饱和函数以及指定性能控制方法的期望轨迹数学模型,设计无人船轨迹跟踪最优控制率;
具体实施时,作为本发明优选的实施方式,所述步骤S4具体包括:
S41、定义最优成本函数,如下:
Figure BDA00028150925600000914
其中,r(z,μ*)=zTΛzz+μ*TΛμμ*,Λzμ均为正定矩阵;zT表示误差矢量的转置;
S42、根据上述定义的最优成本函数,得到哈密尔顿-雅克比-贝尔曼方程,如下:
Figure BDA0002815092560000101
其中,
Figure BDA0002815092560000102
表示成本函数对误差矢量的梯度;
S43、得到无人船最优控制率,如下:
Figure BDA0002815092560000103
S5、基于设计的所述无人船轨迹跟踪最优控制率,进一步设计神经网络权重更新率。
具体实施时,作为本发明优选的实施方式,所述步骤S5具体包括:
S51、根据前馈神经网络的全局逼近特性,将最优代价函数表示为:
Figure BDA0002815092560000104
其中,
Figure BDA0002815092560000105
表示评判器神经网络理想的权重向量,N表示神经元的个数,
Figure BDA0002815092560000106
表示神经网络输入向量基函数,εc表示有界神经网络函数逼近误差;
S52、设计所述最优成本函数的逼近函数,表示如下:
Figure BDA0002815092560000107
其中,
Figure BDA00028150925600001018
表示
Figure BDA0002815092560000108
的估计;
Figure BDA0002815092560000109
表示神经网络输入的向量基函数;
S53、基于上述设计的逼近函数,得到哈密尔顿-雅克比-贝尔曼方程,如下:
Figure BDA00028150925600001010
则最优控制器为:
Figure BDA00028150925600001011
其中,
Figure BDA00028150925600001012
表示
Figure BDA00028150925600001013
的估计,通过梯度下降方法得到:
Figure BDA00028150925600001014
其中,Γc表示正定矩阵;
Figure BDA00028150925600001015
S54、计算执行器更新率
Figure BDA00028150925600001016
其计算公式如下:
Figure BDA00028150925600001017
其中,ka为常数,
Figure BDA0002815092560000111
Γa为正定矩阵。
为了验证本发明方法的有效性,进行了仿真实验,从附图2-9可以看出本发明方法跟踪的优越性,图2为无人船位置跟踪图,可以看出船舶在非常短的时间内跟踪上;图3为速度跟踪图,可见虽然前期的速度有波动,但是在较短的时间内也达到跟踪效果。图4和图5分别是位置误差和速度误差,从这两个误差图中可以看出误差最终都在零附近波动并可以满足无人船系统指定性能控制效果。图6为船舶的旋转仿真实验,船舶参考轨迹为一个圆,可以看出跟踪效果很好;图7和图8分别是评论家权重更新律和演员权重更新率,可见船舶在较短时间内进行训练然后稳定,达到跟踪效果;图9为船舶跟踪控制律,可见船舶在有饱和输入限制时,通过辅助变量的设计使得船舶在具有饱和限制时仍可以达到跟踪效果,解决了船舶输入饱和限制。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (6)

1.一种具有指定性能并带有输入饱和限制的无人船轨迹跟踪最优控制方法,其特征在于,包括如下步骤:
S1、建立无人水面船数学模型,设定无人水面船的期望轨迹数学模型;
S2、基于设定的所述期望轨迹数学模型,引入控制器输入饱和函数;
S3、将系统的性能约束转化为等价的性能约束,得到指定性能控制方法的期望轨迹数学模型;
S4、基于引入的所述控制器输入饱和函数以及指定性能控制方法的期望轨迹数学模型,设计无人船轨迹跟踪最优控制率;
S5、基于设计的所述无人船轨迹跟踪最优控制率,进一步设计神经网络权重更新率。
2.根据权利要求1所述的具有指定性能并带有输入饱和限制的无人船轨迹跟踪最优控制方法,其特征在于,所述步骤S1具体包括:
S11、定义两个坐标系,分别为北东坐标系XOY和附体坐标系XBOBYB,将北东坐标系XOY视作惯性坐标系,取地球任一点O为坐标原点,OX指向正北,OY指向正东;将附体坐标系XBOBYB视作非惯性坐标系,船舶左右对称时,取其中心为坐标原点OB,OBXB轴沿着船舶中线指向船艏方向,OBYB轴垂直指向右舷;
S12、建立无人水面船数学模型,如下所示:
Figure FDA0002815092550000011
Figure FDA0002815092550000012
其中,η=[x,y,ψ]T,x、y表示无人水面船运动位置矢量,ψ∈[0,2π]表示艏向角;R(ψ)表示地球坐标系和船体坐标系之间的转换矩阵;ν=[u,v,r]T表示附体坐标系下无人水面船运动的速度矢量,u、v、r分别表示其纵荡速度、横荡速度、艏摇速度;τ′=M-1τ,τ=[τuvr]T表示船舶控制输入向量,τu、τv、τr分别表示纵荡控制力、横荡控制力、艏摇控制力;f(v)表示系统动态向量,f(v)=-M-1(C(v)v+D(v)v),M(t)=MT(t)>0表示包含附加质量的惯性矩阵,C(v)表示斜对称矩阵,D(v)表示阻尼矩阵;
S13、设定无人水面船的期望轨迹数学模型,如下所示:
Figure FDA0002815092550000021
其中,xd=[ηd T,vd T]Td=[xd,ydd]T和νd=[ud,vd,rd]T分别表示无人水面船跟踪的期望位置向量及速度向量。
3.根据权利要求1所述的具有指定性能并带有输入饱和限制的无人船轨迹跟踪最优控制方法,其特征在于,所述步骤S2具体包括:
S21、引入控制器输入饱和函数,其表达式如下:
Figure FDA0002815092550000022
其中,μi表示无人船系统的控制输入,i=u,v,r;τi,M是τ(μi)的上界,τ(μi)表示具有饱和特性的控制输入;sat(μi)是μi的饱和函数;
S22、将上述sat(μi)函数逼近为一个光滑的函数,如下表示:
Figure FDA0002815092550000023
则引入的控制器输入饱和函数最终表示如下:
sat(μi)=J(μi)+σ(μi)
其中,σ(μi)表示有界函数,J(μi)逼近饱和函数的平滑函数。
S23、考虑系统的误差方程:
Figure FDA0002815092550000024
其中,
Figure FDA0002815092550000025
ηe表示位置误差,ηe=η-ηd,η表示船舶实际位置,ηd表示船舶参考位置;ve表示速度误差,ve=v-vd-h,v表示船舶实际速度,vd表示船舶参考速度,h表示辅助变量,满足
Figure FDA0002815092550000026
μ表示控制输入,
Figure FDA0002815092550000027
4.根据权利要求1所述的具有指定性能并带有输入饱和限制的无人船轨迹跟踪最优控制方法,其特征在于,所述步骤S3具体包括:
S31、将系统的指定性能描述为如下形式:
i,minμi(t)≤ei(t)≤δi,maxμi(t)
其中,μi(t)是正定的并且是递减的平滑函数,且带有limt→∞μi(t)=μi,∞,i=x,y,ψ,u,v,r,δi,min与δi,max为符号参数,性能函数被选择为指数形式μi(t)=(μi,0i,∞)e-aiti,∞,其中,aii,0i,∞是适当的正定常数;
S32、针对性能函数的特性,μi,0>μi,∞,-δi,minμi(0)≤ei(0)≤δi,maxμi(0),跟踪的误差的性能边界由性能函数μi(t)和常数δi,mini,max共同决定,因此,对跟踪误差进行转换,跟踪误差被重新定义为:
ei(t)=μi(t)Φi(zi(t))
其中,zi是转换的误差,Φi是平滑且递减的函数,表示如下:
Figure FDA0002815092550000031
上述函数的反函数为:
Figure FDA0002815092550000032
因此转化的形式可以被写为:
Figure FDA0002815092550000033
其中,
Figure FDA0002815092550000034
S33、将转换的误差动力学写为以下的等价的形式:
Figure FDA0002815092550000035
Figure FDA0002815092550000036
制增益;
Figure FDA0002815092550000037
在包括原点的集合
Figure FDA0002815092550000038
内是利普西茨连续的,系统动态方程中的
Figure FDA0002815092550000039
是有界的,即
Figure FDA00028150925500000310
对于常数bf,bg是恒成立的,因此,如果存在一个连续的控制器μ∈Ωμ使得系统保持稳定,那么该系统就是可控的;
S34、设计系统的消耗函数,如下所示:
Figure FDA00028150925500000311
其中,t表示当前时间;γ表示折扣因子。
5.根据权利要求1所述的具有指定性能并带有输入饱和限制的无人船轨迹跟踪最优控制方法,其特征在于,所述步骤S4具体包括:
S41、定义最优成本函数,如下:
Figure FDA00028150925500000312
其中,r(z,μ*)=zTΛzz+μ*TΛμμ*,Λzμ均为正定矩阵;zT表示误差矢量的转置;
S42、根据上述定义的最优成本函数,得到哈密尔顿-雅克比-贝尔曼方程,如下:
Figure FDA0002815092550000041
其中,
Figure FDA0002815092550000042
表示成本函数对误差矢量的梯度;
S43、得到无人船最优控制率,如下:
Figure FDA0002815092550000043
6.根据权利要求1所述的具有指定性能并带有输入饱和限制的无人船轨迹跟踪最优控制方法,其特征在于,所述步骤S5具体包括:
S51、根据前馈神经网络的全局逼近特性,将最优代价函数表示为:
Figure FDA0002815092550000044
其中,
Figure FDA0002815092550000045
表示评判器神经网络理想的权重向量,N表示神经元的个数,
Figure FDA0002815092550000046
表示神经网络输入向量基函数,εc表示有界神经网络函数逼近误差;
S52、设计所述最优成本函数的逼近函数,表示如下:
Figure FDA0002815092550000047
其中,
Figure FDA0002815092550000048
表示
Figure FDA0002815092550000049
的估计;
Figure FDA00028150925500000410
表示神经网络输入的向量基函数;
S53、基于上述设计的逼近函数,得到哈密尔顿-雅克比-贝尔曼方程,如下:
Figure FDA00028150925500000411
则最优控制器为:
Figure FDA00028150925500000412
其中,
Figure FDA00028150925500000413
表示
Figure FDA00028150925500000414
的估计,通过梯度下降方法得到:
Figure FDA00028150925500000415
其中,Γc表示正定矩阵;
Figure FDA00028150925500000416
S54、计算执行器更新率
Figure FDA00028150925500000417
其计算公式如下:
Figure FDA00028150925500000418
其中,ka为常数,
Figure FDA00028150925500000419
Γa为正定矩阵。
CN202011416183.7A 2020-12-03 2020-12-03 一种具有指定性能并带有输入饱和限制的无人船轨迹跟踪最优控制方法 Active CN112327638B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011416183.7A CN112327638B (zh) 2020-12-03 2020-12-03 一种具有指定性能并带有输入饱和限制的无人船轨迹跟踪最优控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011416183.7A CN112327638B (zh) 2020-12-03 2020-12-03 一种具有指定性能并带有输入饱和限制的无人船轨迹跟踪最优控制方法

Publications (2)

Publication Number Publication Date
CN112327638A true CN112327638A (zh) 2021-02-05
CN112327638B CN112327638B (zh) 2022-11-01

Family

ID=74301623

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011416183.7A Active CN112327638B (zh) 2020-12-03 2020-12-03 一种具有指定性能并带有输入饱和限制的无人船轨迹跟踪最优控制方法

Country Status (1)

Country Link
CN (1) CN112327638B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113189867A (zh) * 2021-03-24 2021-07-30 大连海事大学 一种考虑位姿与速度受限的无人船自学习最优跟踪控制方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109358499A (zh) * 2018-09-25 2019-02-19 大连海事大学 基于速度与航向双重制导的无人船精确路径跟踪控制方法
CN109752957A (zh) * 2019-01-11 2019-05-14 大连海事大学 一种无人艇的制导指令调节器结构及设计方法
CN111308890A (zh) * 2020-02-27 2020-06-19 大连海事大学 一种带有指定性能的无人船数据驱动强化学习控制方法
CN111679585A (zh) * 2020-07-03 2020-09-18 大连海事大学 一种具有输入饱和受限的无人船强化学习自适应跟踪控制方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109358499A (zh) * 2018-09-25 2019-02-19 大连海事大学 基于速度与航向双重制导的无人船精确路径跟踪控制方法
CN109752957A (zh) * 2019-01-11 2019-05-14 大连海事大学 一种无人艇的制导指令调节器结构及设计方法
CN111308890A (zh) * 2020-02-27 2020-06-19 大连海事大学 一种带有指定性能的无人船数据驱动强化学习控制方法
CN111679585A (zh) * 2020-07-03 2020-09-18 大连海事大学 一种具有输入饱和受限的无人船强化学习自适应跟踪控制方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113189867A (zh) * 2021-03-24 2021-07-30 大连海事大学 一种考虑位姿与速度受限的无人船自学习最优跟踪控制方法
CN113189867B (zh) * 2021-03-24 2023-11-14 大连海事大学 一种考虑位姿与速度受限的无人船自学习最优跟踪控制方法

Also Published As

Publication number Publication date
CN112327638B (zh) 2022-11-01

Similar Documents

Publication Publication Date Title
CN111679585B (zh) 一种具有输入饱和受限的无人船强化学习自适应跟踪控制方法
CN110018687B (zh) 基于强化学习方法的无人水面船最优轨迹跟踪控制方法
CN108008628B (zh) 一种不确定欠驱动无人艇系统的预设性能控制方法
Deng et al. Event-triggered robust fuzzy path following control for underactuated ships with input saturation
CN111308890B (zh) 一种带有指定性能的无人船数据驱动强化学习控制方法
CN108319140B (zh) 一种重定义输出式无模型自适应航向控制方法及系统
CN107807657B (zh) 一种基于路径规划的挠性航天器姿态自适应控制方法
CN111198502B (zh) 基于干扰观测器和模糊系统的无人艇航迹跟踪控制方法
CN112650233A (zh) 死区限制下基于反步法与自适应动态规划的无人船轨迹跟踪最优控制方法
Hu et al. Sliding mode control unified with the uncertainty and disturbance estimator for dynamically positioned vessels subjected to uncertainties and unknown disturbances
CN112947375B (zh) 一种考虑未知死区的复合自适应容错控制器设计方法
Gao et al. Command filtered finite/fixed-time heading tracking control of surface vehicles
CN113821035A (zh) 无人船轨迹追踪控制方法和装置
Jiang et al. Neural network based adaptive sliding mode tracking control of autonomous surface vehicles with input quantization and saturation
CN113848887A (zh) 一种基于mlp方法的欠驱动无人艇轨迹跟踪控制方法
Zhang et al. Adaptive neural fault-tolerant control for USV with the output-based triggering approach
CN112327638B (zh) 一种具有指定性能并带有输入饱和限制的无人船轨迹跟踪最优控制方法
CN112363393A (zh) 无人艇动力定位的无模型自适应预设性能控制方法
Tang et al. Robust fixed-time trajectory tracking control of the dynamic positioning ship with actuator saturation
CN116088309B (zh) 一种基于故障辨识的水面船复合学习容错控制方法
Gao et al. Data-driven model-free resilient speed control of an autonomous surface vehicle in the presence of actuator anomalies
Liu et al. Robust adaptive self-Structuring neural network bounded target tracking control of underactuated surface vessels
CN112558465B (zh) 一种带有输入限制的未知无人船有限时间强化学习控制方法
Hou et al. Robust nonlinear model predictive control for ship dynamic positioning using Laguerre function
Zheng et al. Stability analysis and TS fuzzy dynamic positioning controller design for autonomous surface Vehicles based on sampled-data control

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant