CN116578106A - 一种面向沿海声层析观测的水下直升机编队控制方法 - Google Patents
一种面向沿海声层析观测的水下直升机编队控制方法 Download PDFInfo
- Publication number
- CN116578106A CN116578106A CN202310545997.8A CN202310545997A CN116578106A CN 116578106 A CN116578106 A CN 116578106A CN 202310545997 A CN202310545997 A CN 202310545997A CN 116578106 A CN116578106 A CN 116578106A
- Authority
- CN
- China
- Prior art keywords
- representing
- error
- underwater
- neural network
- state
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000015572 biosynthetic process Effects 0.000 title claims abstract description 94
- 238000000034 method Methods 0.000 title claims abstract description 42
- 238000003325 tomography Methods 0.000 title claims abstract description 13
- 230000006870 function Effects 0.000 claims abstract description 85
- 238000013528 artificial neural network Methods 0.000 claims abstract description 52
- 238000006243 chemical reaction Methods 0.000 claims abstract description 27
- 230000007246 mechanism Effects 0.000 claims abstract description 17
- 239000011159 matrix material Substances 0.000 claims description 18
- 238000013461 design Methods 0.000 claims description 16
- 230000003044 adaptive effect Effects 0.000 claims description 12
- 238000005259 measurement Methods 0.000 claims description 9
- 230000009897 systematic effect Effects 0.000 claims description 6
- 230000009466 transformation Effects 0.000 claims description 6
- 238000013016 damping Methods 0.000 claims description 4
- 238000012546 transfer Methods 0.000 claims description 3
- 238000005299 abrasion Methods 0.000 description 6
- 230000000737 periodic effect Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 238000011217 control strategy Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000005265 energy consumption Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 241001235534 Graphis <ascomycete fungus> Species 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004587 chromatography analysis Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 238000009827 uniform distribution Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05D—SYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
- G05D1/00—Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
- G05D1/04—Control of altitude or depth
- G05D1/06—Rate of change of altitude or depth
- G05D1/0692—Rate of change of altitude or depth specially adapted for under-water vehicles
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T90/00—Enabling technologies or technologies with a potential or indirect contribution to GHG emissions mitigation
Landscapes
- Engineering & Computer Science (AREA)
- Aviation & Aerospace Engineering (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Automation & Control Theory (AREA)
- Feedback Control In General (AREA)
Abstract
本发明公开了一种面向沿海声层析观测的水下直升机编队控制方法,属于机械控制技术领域,方法包括:建立多个水下直升机的动力学模型,合并动力学模型中的复杂不确定项,得到包含第二状态变量的简化动力学模型;计算系统转换误差;建立基于径向基函数神经网络和扰动观测器的龙伯格状态观测器获取第二状态变量;设计扰动观测器获取确定的系统外部时变扰动和径向基函数神经网络逼近误差的总和;设计径向基函数神经网络权重系数更新率,设计协同编队控制器;引入动态阈值的事件触发机制,设置协同编队控制器的更新条件;利用协同编队控制器计算得到跟踪经验值;根据跟踪经验值,引入学习机制,重新设计扰动观测器和协同编队控制器对轨迹进行跟踪。
Description
技术领域
本发明属于机械控制技术领域,具体涉及一种面向沿海声层析观测的水下直升机编队控制方法。
背景技术
沿海声层析(Coastal Acoustic Tomography,简称CAT)是一种通过声学方法测量海洋动力特性的遥感技术,能通过布置较少的观测站位,实现沿海海域大面积的温度场、流场观测。然而,受限于固定式的部署模式,CAT技术目前仍然局限在海洋浅表面二维平面观测,且缺乏调整、拓展与再部署的能力,在一定程度上制约了该技术的发展。
水下直升机(Autonomous Underwater Helicopter,简称水下直升机)以其独特的外形设计和推进器布置结构,可以实现垂直起降、全周回转与定点悬停,克服了传统鱼雷型自主式潜水器(Autonomous Underwater Vehicle,简称AUV)低操纵性的缺陷,成为了海洋观测技术良好的载体。
若要合理控制水下直升机编队模拟传统沿海声层析站位,需要一种适配该场景的高精度编队控制方法,然而,现有的高精度编队控制方案通常依赖于控制模型的精确性,在存在未知时变扰动及参数不确定情况下,控制器不能控制水下直升机进行准确的轨迹跟踪,而且目前的控制器在处理动态不确定性的情况时往往需要重复自适应获取相关数据,影响控制器工作效率,目前的控制器往往会设定固定更新率,即使不需要对控制器进行更新也会持续更新,导致水下直升机的执行器部件出现不必要的磨损。
发明内容
为了解决现有技术通常依赖于控制模型的精确性,在存在未知时变扰动及参数不确定情况下,控制器不能控制水下直升机进行准确的轨迹跟踪,而且目前的控制器在处理动态不确定性的情况时往往需要重复自适应获取相关数据,影响控制器工作效率,目前的控制器往往会设定固定更新率,即使不需要对控制器进行更新也会持续更新,导致水下直升机的执行器部件出现不必要的磨损的技术问题,本发明提供一种面向沿海声层析观测的水下直升机编队控制方法。
本发明提供一种面向沿海声层析观测的水下直升机编队控制方法,包括:
S101:建立多个水下直升机的动力学模型,合并动力学模型中的复杂不确定项,得到包含第一状态变量和第二状态变量的简化动力学模型,其中,第二状态变量为不可测高阶速度量;
S102:引入性能函数与误差变换函数,计算系统转换误差;
S103:建立基于径向基函数神经网络和扰动观测器的龙伯格状态观测器,利用龙伯格状态观测器获取第二状态变量;
S104:选取李雅普诺夫函数,结合系统转换误差,确定系统外部时变扰动和径向基函数神经网络逼近误差的总和;
S105:设计扰动观测器获取系统外部时变扰动和径向基函数神经网络逼近误差的总和;
S106:设计径向基函数神经网络权重系数更新率,结合龙伯格状态观测器和扰动观测器,设计协同编队控制器;
S107:引入动态阈值的事件触发机制,设置协同编队控制器的更新条件,以降低协同编队控制器的更新率;
S108:利用自适应方法获取径向基函数神经网络权重系数估计值,根据径向基函数神经网络权重系数估计值,利用协同编队控制器计算得到跟踪经验值;
S109:根据跟踪经验值,引入学习机制,重新设计扰动观测器和协同编队控制器,学习并存储复杂不确定项的跟踪经验值,得到基于经验的扰动观测器和基于经验的协同编队控制器;
S110:利用龙伯格状态观测器、基于经验的扰动观测器、动态阈值的事件触发机制和基于经验的协同编队控制器控制多个水下直升机对轨迹进行跟踪。
与现有技术相比,本发明至少具有以下有益效果:
本发明设计一种基于经验的协同编队控制器,使水下直升机编队系统在存在建模不确定性和未知时变扰动的影响下,仍然能精确的跟踪虚拟领航者水下直升机的轨迹,当水下直升机编队跟踪周期轨迹时,动力学模型中的复杂不确定性能够被每一个水下直升机以协同学习的方式逼近,协同学习所得到的跟踪经验值能够被储存,并在下一个跟踪周期用于逼近动力学的复杂不确定项,而不是重复地使用自适应方法获得神经网络的权重系数,提高控制器控制性能,节省能源消耗,减少不必要的机械磨损,提升水下直升机的续航,降低故障率。
附图说明
下面将以明确易懂的方式,结合附图说明优选实施方式,对本发明的上述特性、技术特征、优点及其实现方式予以进一步说明。
图1是本发明提供的一种面向沿海声层析观测的水下直升机编队控制方法的流程示意图;
图2是本发明提供的一种面向沿海声层析观测观测的水下直升机编队示意图。
具体实施方式
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对照附图说明本发明的具体实施方式。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图,并获得其他的实施方式。
为使图面简洁,各图中只示意性地表示出了与发明相关的部分,它们并不代表其作为产品的实际结构。另外,以使图面简洁便于理解,在有些图中具有相同结构或功能的部件,仅示意性地绘示了其中的一个,或仅标出了其中的一个。在本文中,“一个”不仅表示“仅此一个”,也可以表示“多于一个”的情形。
还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
在本文中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
另外,在本发明的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
在一个实施例中,参考说明书附图1,本发明提供的一种面向沿海声层析观测的水下直升机编队控制方法的流程示意图。参照说明书附图2,本发明提供的一种面向沿海声层析观测观测的水下直升机编队示意图。
从图2可以看出,用于CAT观测的AUH编队结构由一个虚拟AUH领航者和N个实际AUH跟随者组成,虚拟AUH“领航者”沿参考轨迹ηd运动,第i个AUH“跟随者”沿参考轨迹ηr,i运动,其中ηd根据实际需求设计,ηr,i可由确定,式中,/>为第i个AUH“跟随者”与“领航者”的相对位置,其数值决定了编队构型,可由CAT站位需求确定。
在实际使用过程中,用于CAT观测的AUH编队系统的通讯拓扑结构由无向图描述,其中,/>表示由N个AUH组成的顶点集合,/>表示边集合。相关邻接矩阵/>为对称的半正定矩阵,当第i个AUH能够接收第k个AUH的信息时aik=1,反之,aik=0。定义/>为顶点v1邻点的集合,同时,如果则定义下标/>度矩阵定义为/>其中,/>对称矩阵Laplacian阵定义为/>
需要说明的是,对于本发明中的一些必要假设分别是:无向图是连通的。AUH在世界坐标系下的位置及偏角ηi是可测的,在体坐标系下的线速度和角速度νi是不可测的。未知的外部时变扰动及其对时间的一阶导数是有界的,但是上界是未知的。编队参考轨迹ηd和它对时间的导数/>是光滑、有界的,并且是周期或类周期信号。
本发明提供的一种面向沿海声层析观测的水下直升机编队控制方法,包括:
S101:建立多个水下直升机的动力学模型,合并动力学模型中的复杂不确定项,得到包含第一状态变量和第二状态变量的简化动力学模型,其中,第二状态变量为不可测高阶速度量。
需要说明的是,通过建立动力学模型,研究人员可以深入了解水下直升机的运动规律、特性和响应,这对于设计控制系统、路径规划和轨迹跟踪等应用非常重要。通过建立动力学模型,研究人员可以分析系统的稳定性、响应速度和鲁棒性等性能指标。此外,该模型还可以用于设计控制器、观测器和估计器,以实现对水下直升机的自主控制和导航,建立多个水下直升机的动力学模型,为进一步的研究、控制和规划提供基础,以提高水下直升机的性能和应用能力。
在一种可能的实施方式中,S101具体包括:
S1011:引入水下直升机动力学模型,建立多个水下直升机的动力学模型:
其中,下标表示第i个水下直升机,/>表示水下直升机在地球坐标系下的坐标位置及偏角,J(ηi)表示地球坐标系与体坐标系之间的坐标转换矩阵,νi=[ui,υi,wi,pi,qi,ri]T表示水下直升机在体坐标下的线速度与角速度,M表示质量惯性矩阵,C0(νi)和D0(νi)分别表示科氏力和向心力矩阵,以及水动力阻尼矩阵,ΔC(νi)和D0(νi)分别表示科氏力和向心力矩阵中的不确定部分,以及水动力阻尼矩阵中的不确定部分,g表示水下直升机的重力和浮力产生的力和力矩矩阵,Δ(ηi,νi)=[Δ1,Δ2,Δ3,Δ4,Δ5,Δ6]T表示未建模动力学,/>表示未知时变扰动,/>表示控制输入;
S1012:合并水下直升机动力学模型中的复杂不确定项,得到合并后的简化动力学模型:
其中,J1=J(ηi)M-1,Fi=-J(ηi)M-1ΔC(νi)νi-J(ηi)M-1ΔD(νi)νi-J(ηi)M-1Δ(ηi,νi)表示复杂不确定项,其中,x1i表示第一状态变量,x2i表示第二状态变量。
S102:引入性能函数与误差变换函数,计算系统转换误差。
需要说明的是,通过引入性能函数与误差变换,将原始的“约束”系统转换为等效的“无约束”系统,并用李雅普诺夫理论证明该“无约束”系统的稳定性,从而可以使收敛速度、超调以及跟踪误差获得预先设定的性能的方法。
在一种可能的实施方式中,S102具体包括:
S1021:引入性能函数:
其中,ρ0、ρ∞和k1为预先给定的正常数,ρ0表示性能函数初值,ρ∞表示性能函数终值,k1表示可调整参数,可调整参数可以调整性能函数的收敛速度;
S1022:引入误差转换关系式,选择误差转换函数,确定误差转换函数的约束条件:
e1,ij=ρij(t)Tij(z1,ij),j=1,...,6
其中,e1,ij表示追踪误差,ρij(t)表示性能函数,z1,ij表示系统转换误差,Tij(z1,ij)表示误差转换函数,L∞表示有界函数构成的空间;
S1023:根据误差转换关系式、误差转换函数和约束条件,计算得到系统转换误差:
其中,Tij(z1,ij)表示误差转换函数,它是光滑的单调递增函数。
S103:建立基于径向基函数神经网络和扰动观测器的龙伯格状态观测器,利用龙伯格状态观测器获取第二状态变量。
其中,龙伯格状态观测器是一种特定类型的状态观测器,利用了径向基函数神经网络和扰动观测器。径向基函数神经网络是一种神经网络结构,常用于函数逼近和模式识别任务。扰动观测器则用于估计系统的外部扰动和模型误差。在控制系统中,状态观测器的作用是通过测量系统的输出和已知输入,估计系统的内部状态变量。通过观测器可以获取系统内部的状态信息,即使某些状态无法直接测量。
其中,在设计编队控制器时,需要用到状态变量x1i,x2i的信息,然而,由于体坐标系下的线速度和角速度νi是不可测的,无法直接得到x2i的信息,因此本专利引入龙伯格状态观测器观测高阶量x2i。由于AUH的动力学模型中存在多种动力学不确定性和外部时变扰动,本专利将径向基函数神经网络(RBFNN,Radial Basis Function Neural Network)、扰动观测器与龙伯格观测器结合,观测状态变量x2i。
需要说明的是,通过该观测器,可以对水下直升机的内部状态进行估计和观测,即使第二状态变量无法直接测量。这对于控制系统设计和实现非常有用。通过获取第二状态变量的估计值,可以更准确地了解系统的状态,从而设计更有效的控制策略和算法。此外,基于龙伯格状态观测器的设计,还可以提高系统的鲁棒性和抗干扰能力。
在一种可能的实施方式中,S103具体包括:
S1031:结合待设计增益对角矩阵计算第一状态变量观测值的第一状态观测误差和第二状态变量观测值的第二状态观测误差:
其中,分别表示第一状态观测误差和第一状态观测误差,L1i,L2i表示待设计增益对角矩阵,/>为扰动观测误差,/>表示径向基函数神经网络的逼近误差;
S1032:将第一状态观测误差和第二状态观测误差合并表达为矩阵形式的观测误差:
其中,
S1033:基于径向基函数神经网络和扰动观测器建立龙伯格状态观测器:
其中,分别表示第一状态变量观测值和第二状态变量观测值,/>表示输出变量观测值,/>表示扰动观测器对外部时变扰动τd,i的观测值,/>表示径向基函数神经网络对复杂不确定项的逼近值;
S1034:利用龙伯格状态观测器获取第二状态变量。
S104:选取李雅普诺夫函数,结合系统转换误差,确定系统外部时变扰动和径向基函数神经网络逼近误差的总和。
其中,李雅普诺夫函数是一种在控制理论中常用的函数,用于描述系统的稳定性和收敛性。通过选取适当的李雅普诺夫函数,可以评估系统的稳定性和性能,并进行控制器设计和分析。
需要说明的是,将李雅普诺夫函数与系统转换误差结合起来,目的是确定系统的外部时变扰动和径向基函数神经网络逼近误差的总和。系统转换误差是指实际系统输出与期望输出之间的差异。通过将这些误差与李雅普诺夫函数相结合,可以量化系统的误差和偏差,并进行进一步的分析和控制。通过确定系统的误差项,其中包括外部时变扰动和径向基函数神经网络逼近误差,并对这些误差进行分析和评估,可以更好地了解系统的性能,并设计相应的控制策略以实现所需的性能指标。
在一种可能的实施方式中,S104具体包括:
S1041:定义第一误差变量:
e1,i=ηi-ηr,i=x1i-ηr,i;
S1042:计算系统转换误差对时间的一阶导数:
其中,Υi=diag[χi1,χi2,χi3,χi4,χi5,χi6],Θi=diag[θi1,θi2,θi3,θi4,θi5,θi6],
S1043:选取李雅普诺夫函数为:
S1044:结合系统转换误差,计算李雅普诺夫函数对时间的导数函数:
S1045:选取导数函数中的虚拟控制量,定义第二误差变量:
其中,表示虚拟控制量,αi表示虚拟控制率;
S1046:设计虚拟控制率:
其中,K1,i=diag[k1,i1,...,k1,i6]表示设计参数矩阵;
S1047:将虚拟控制量带入导数函数:
S1048:计算第二误差变量对时间的导数,获取虚拟空置率的导函数:
其中,表示第二误差变量对时间的导数,/>虚拟空置率的导函数;
S1049:根据虚拟空置率的导函数,确定系统外部时变扰动和径向基函数神经网络逼近误差的总和:
di=J1τd,i+εi
其中,di表示系统外部时变扰动和径向基函数神经网络逼近误差的总和。
S105:设计扰动观测器获取系统外部时变扰动和径向基函数神经网络逼近误差的总和。
在一种可能的实施方式中,扰动观测器具体为:
其中,表示扰动观测误差对时间的导数,li>0表示设计参数,/>ξi表示扰动观测器状态变量。
S106:设计径向基函数神经网络权重系数更新率,结合龙伯格状态观测器和扰动观测器,设计协同编队控制器。
在一种可能的实施方式中,S106还包括:
S1061:设计径向基函数神经网络权重系数更新率
其中,Γ1,ij>0,σij>0,γ2,ij>0表示设计参数,aik表示第i个和第k个水下直升机之间是否有信息交换,项为单体水下直升机自适应项,/>表示水下直升机的一致性协同自适应项;
S1062:结合径向基函数神经网络权重系数更新率、龙伯格状态观测器和扰动观测器,设计协同编队控制器τi:
S107:引入动态阈值的事件触发机制,设置协同编队控制器的更新条件,以降低协同编队控制器的更新率。
其中,事件触发机制是触发条件由设计者指定,当系统的状态满足事件触发条件时,控制器将在此时刻更新,这个时刻被称为当前触发瞬间,反之,控制器在下一次事件触发前,会保留上一个触发瞬间计算的数值。控制器更新频率过高将使执行器产生连续变化,加重执行器的机械磨损,在一定程度上限制了协同编队控制器的实际应用。
需要说明的是,将基于观测得到的状态变量,在反步法框架下设计AUHs协同编队控制器。进一步地,引入动态阈值的事件触发机制,编队控制器只有在事件触发条件得到满足时才会更新,由此降低控制器的更新率,减少执行器的机械磨损。
在一种可能的实施方式中,S107具体包括:
S1071:引入中间控制率,确定执行器更新协议:
tk≤t<tk+1,k=0,1,2,...
其中,φi(t)表示中间控制率,其中,中间空置率具体表示将保持第k个事件触发瞬间tk的对应值,直至下一次触发瞬间tk+1时更新,/>m1,ι,/>表示设计参数,满足/>m1>0,ι∈(0,1),/> 表示执行器更新协议,tk表示第k个事件触发瞬间;
S1072:根据中间控制率和执行器更新协议,计算测量误差:
其中,表示测量误差;
S1073:结合测量误差,得到协同编队控制器的更新条件,并按照更新条件设置协同编队控制器:
S108:利用自适应方法获取径向基函数神经网络权重系数估计值,根据径向基函数神经网络权重系数估计值,利用协同编队控制器计算得到跟踪经验值。
其中,在控制系统中,自适应方法是一种用于调节和更新参数的技术,以使系统能够自动适应不确定性和变化条件。通过自适应方法,可以实时估计神经网络的权重系数,以便更好地逼近系统的动态行为和非线性特性。
需要说明的是,利用自适应方法获取径向基函数神经网络权重系数的估计值,并根据这些估计值利用协同编队控制器计算跟踪经验值。通过不断更新权重系数的估计值,可以提高神经网络的逼近精度和性能,从而实现更准确的编队控制。基于自适应方法通过估计神经网络的权重系数,利用协同编队控制器计算跟踪经验值,有助于提高编队系统的控制精度和鲁棒性,使编队系统能够更好地跟踪预定的目标轨迹。利用自适应方法获取径向基函数神经网络权重系数的估计值,并利用协同编队控制器计算跟踪经验值,这对于提高编队系统的控制性能和适应性非常重要,使其能够更好地实现目标的跟踪和控制。
S109:根据跟踪经验值,引入学习机制,重新设计扰动观测器和协同编队控制器,学习并存储复杂不确定项的跟踪经验值,得到基于经验的扰动观测器和基于经验的协同编队控制器。
需要说明的是,对于任意连续的周期信号xi,如果xi被限制在紧集那么对于中心点均布在区域Ωζ的RBFNN,其中/>回归子向量Sζ(xi)是持续激活的,即满足局部PE条件。对于具有假设一和假设四成立的动力学系统,对于每一个AUH,如果存在一个足够大的紧集/>使得对于t>0的任意时刻,都有/>那么对于任意有界的初始条件/>有以下结论成立:闭环信号的局部PE条件是满足的。沿参考周期轨迹/>(RBFNN的输入信号xi(t)由Ti时刻开始),局部RNFBB的权重系数估计值/>将收敛至最优值/>的小邻域内。对动力学复杂不确定项Fi(xi)的局部精确逼近能够同时由/>和/>实现。
具体地,式中,/> 为系统的状态变量收敛至一定范围后的某一时间区间。/>在数值上与εi相近。因此,基于经验的/>能够沿/>局部精确逼近动力学不确定项Fi(xi),通过自适应方法获得的RBFNN权重系数估计值/>被控制器学习并储存在/>在追踪周期轨迹的过程中,使用经验/>处理相似的动力学不确定项Fi(xi),而不是反复地通过自适应方法,由此提高控制器的控制性能。
需要说明的是,在该步骤中,引入学习机制使得基于神经网络的协同编队控制器在自适应过程中具备学习能力,能够学习动力学的复杂不确定项并储存获得的知识,经验值在控制器中通过协同RBFNN的权重系数体现。进一步地,学习获得的跟踪经验值将被用于搭建基于经验的协同编队控制器,在追踪周期轨迹的过程中,使用跟踪经验值处理相似的动力学不确定项,而不是反复地通过自适应方法,由此提高控制器的控制性能。
在一种可能的实施方式中,S109具体包括:
S1091:结合跟踪经验值和扰动观测器,设计得到基于经验的扰动观测器:
S1092:结合跟踪经验值和协同编队控制器,设计得到基于经验的协同编队控制器:
S110:利用龙伯格状态观测器、基于经验的扰动观测器、动态阈值的事件触发机制和基于经验的协同编队控制器控制多个水下直升机对轨迹进行跟踪。
需要说明的是,在这种情况下水下直升机编队能够在追踪参考轨迹的同时保持预设的编队构型。闭环自适应系统的所有信号一致最终有界。在性能函数的限制下系统达到预设的瞬态和稳态性能,追踪误差e1,ij收敛至0值附近的小邻域。
在一种可能的实施方式中,S110具体包括:
S1101:通过龙伯格状态观测器观测第二状态变量,通过基于经验的扰动观测器观测系统外部时变扰动;
S1102:在动态阈值的事件触发机制的约束下,利用经验的协同编队控制器控制多个水下直升机对轨迹进行跟踪。
需要说明的是,将之前设计的各个组件整合起来,形成一个完整的编队控制系统,利用龙伯格状态观测器用于获取系统的状态信息,基于经验的扰动观测器用于估计外部扰动和逼近误差,动态阈值的事件触发机制用于触发控制器的更新,基于经验的协同编队控制器用于控制多个水下直升机以跟踪给定的轨迹。实现多个水下直升机的编队控制,使它们能够协同工作以跟踪预定的轨迹。通过整合龙伯格状态观测器、基于经验的扰动观测器、动态阈值的事件触发机制和基于经验的协同编队控制器,编队系统可以实现对轨迹的准确跟踪和控制。
在实际使用过程中,本专利在仿真实验中引入4个搭载CAT设备的AUH用于证明所设计的编队控制方法的有效性。表1给出了AUH编队的初始状态。一种常见的CAT观测站位是矩形站位,矩形的顶点代表AUH所在的位置。本专利选择所需的相对偏移量为 以实现期望的矩形编队观测构型。AUH的建模不确定性可以表示为Δ(ηi,vi)=[Δ1,Δ2,Δ3,Δ4,Δ5,Δ6]T,其中,
Δ6=0.2ri 2。
表1
参照表2,可以看出,对于每个控制自由度,期望的编队跟踪稳态跟踪误差不超过0.02,表2列出了性能函数的参数值。
表2
参数 | ρi0 | ρi∞ | k1 |
数值 | 5 | 0.02 | 0.8 |
本专利构建了带宽为6,中心在[-4,4]上均匀分布,且节点数为200的RBFNNs和j=1-6用于估计建模不确定性。邻域集合为描述通信拓扑结构,以实现合作学习策略,AUH的状态观测器,扰动观测器,自适应律,和编队控制器的增益设置如下:L1i=diag[15,15,15,15,15,15],L2i=diag[50,50,50,50,50,50],K1,i=diag[5,5,5,5,5,5],K2,i=diag[4,4,4,4,4,4]。根据仿真结果发现,采用基于神经网络和基于经验的协同控制策略,水下直升机的跟踪误差始终保持在性能函数的预设范围内。另一方面,由于有效地利用了已获取和存储的知识,而无需重新适应建模不确定性,控制器获得的跟踪误差超调量小于控制器获得的跟踪误差超调量。
与现有技术相比,本发明至少具有以下有益效果:
本发明设计一种基于经验的协同编队控制器,使水下直升机编队系统在存在建模不确定性和未知时变扰动的影响下,仍然能精确的跟踪虚拟领航者水下直升机的轨迹,当水下直升机编队跟踪周期轨迹时,动力学模型中的复杂不确定性能够被每一个水下直升机以协同学习的方式逼近,协同学习所得到的跟踪经验值能够被储存,并在下一个跟踪周期用于逼近动力学的复杂不确定项,而不是重复地使用自适应方法获得神经网络的权重系数,提高控制器控制性能,节省能源消耗,减少不必要的机械磨损,提升水下直升机的续航,降低故障率。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种面向沿海声层析观测的水下直升机编队控制方法,其特征在于,包括:
S101:建立多个水下直升机的动力学模型,合并所述动力学模型中的复杂不确定项,得到包含第一状态变量和第二状态变量的简化动力学模型,其中,所述第二状态变量为不可测高阶速度量;
S102:引入性能函数与误差变换函数,计算系统转换误差;
S103:建立基于径向基函数神经网络和扰动观测器的龙伯格状态观测器,利用所述龙伯格状态观测器获取所述第二状态变量;
S104:选取李雅普诺夫函数,结合所述系统转换误差,确定系统外部时变扰动和径向基函数神经网络逼近误差的总和;
S105:设计扰动观测器获取所述系统外部时变扰动和径向基函数神经网络逼近误差的总和;
S106:设计径向基函数神经网络权重系数更新率,结合所述龙伯格状态观测器和所述扰动观测器,设计协同编队控制器;
S107:引入动态阈值的事件触发机制,设置所述协同编队控制器的更新条件,以降低所述协同编队控制器的更新率;
S108:利用自适应方法获取径向基函数神经网络权重系数估计值,根据所述径向基函数神经网络权重系数估计值,利用所述协同编队控制器计算得到跟踪经验值;
S109:根据所述跟踪经验值,引入学习机制,重新设计所述扰动观测器和所述协同编队控制器,学习并存储所述复杂不确定项的跟踪经验值,得到基于经验的扰动观测器和基于经验的协同编队控制器;
S110:利用所述龙伯格状态观测器、所述基于经验的扰动观测器、所述动态阈值的事件触发机制和所述基于经验的协同编队控制器控制多个所述水下直升机对轨迹进行跟踪。
2.根据权利要求1所述的水下直升机编队控制方法,其特征在于,所述S101具体包括:
S1011:引入水下直升机动力学模型,建立多个水下直升机的动力学模型:
其中,下标表示第i个水下直升机,/>表示所述水下直升机在地球坐标系下的坐标位置及偏角,J(ηi)表示地球坐标系与体坐标系之间的坐标转换矩阵,νi=[ui,υi,wi,pi,qi,ri]T表示所述水下直升机在体坐标下的线速度与角速度,M表示质量惯性矩阵,C0(νi)和D0(νi)分别表示科氏力和向心力矩阵,以及水动力阻尼矩阵,ΔC(νi)和D0(νi)分别表示科氏力和向心力矩阵中的不确定部分,以及水动力阻尼矩阵中的不确定部分,g表示所述水下直升机的重力和浮力产生的力和力矩矩阵,Δ(ηi,νi)=[Δ1,Δ2,Δ3,Δ4,Δ5,Δ6]T表示未建模动力学,/>表示未知时变扰动,/>表示控制输入;
S1012:合并所述水下直升机动力学模型中的复杂不确定项,得到合并后的简化动力学模型:
其中,J1=J(ηi)M-1,Fi=-J(ηi)M-1ΔC(νi)νi-J(ηi)M-1ΔD(νi)νi-J(ηi)M-1Δ(ηi,νi)表示所述复杂不确定项,其中,x1i表示第一状态变量,x2i表示第二状态变量。
3.根据权利要求1所述的水下直升机编队控制方法,其特征在于,所述S102具体包括:
S1021:引入所述性能函数:
其中,ρ0、ρ∞和k1为预先给定的正常数,ρ0表示性能函数初值,ρ∞表示性能函数终值,k1表示可调整参数,所述可调整参数可以调整所述性能函数的收敛速度;
S1022:引入误差转换关系式,选择误差转换函数,确定所述误差转换函数的约束条件:
其中,e1,ij表示追踪误差,ρij(t)表示所述性能函数,z1,ij表示系统转换误差,Tij(z1,ij)表示所述误差转换函数,L∞表示有界函数构成的空间;
S1023:根据所述误差转换关系式、所述误差转换函数和所述约束条件,计算得到所述系统转换误差:
4.根据权利要求1所述的水下直升机编队控制方法,其特征在于,所述S103具体包括:
S1031:结合待设计增益对角矩阵计算所述第一状态变量观测值的第一状态观测误差和所述第二状态变量观测值的第二状态观测误差:
其中,分别表示所述第一状态观测误差和所述第一状态观测误差,L1i,L2i表示待设计增益对角矩阵,/>为扰动观测误差,/>表示所述径向基函数神经网络的逼近误差;
S1032:将所述第一状态观测误差和所述第二状态观测误差合并表达为矩阵形式的观测误差:
其中,
S1033:基于径向基函数神经网络和扰动观测器建立所述龙伯格状态观测器:
其中,分别表示第一状态变量观测值和第二状态变量观测值,/>表示输出变量观测值,/>表示所述扰动观测器对外部时变扰动τd,i的观测值,/>表示径向基函数神经网络对所述复杂不确定项的逼近值;
S1034:利用所述龙伯格状态观测器获取所述第二状态变量。
5.根据权利要求1所述的水下直升机编队控制方法,其特征在于,所述S104具体包括:
S1041:定义第一误差变量:
e1,i=ηi-ηr,i=x1i-ηr,i;
S1042:计算所述系统转换误差对时间的一阶导数:
其中,Υi=diag[χi1,χi2,χi3,χi4,χi5,χi6],Θi=diag[θi1,θi2,θi3,θi4,θi5,θi6],
S1043:选取李雅普诺夫函数为:
S1044:结合所述系统转换误差,计算所述李雅普诺夫函数对时间的导数函数:
S1045:选取所述导数函数中的虚拟控制量,定义第二误差变量:
其中,表示所述虚拟控制量,αi表示虚拟控制率;
S1046:设计所述虚拟控制率:
其中,K1,i=diag[k1,i1,...,k1,i6]表示设计参数矩阵;
S1047:将所述虚拟控制量带入所述导数函数:
S1048:计算所述第二误差变量对时间的导数,获取所述虚拟空置率的导函数:
其中,表示所述第二误差变量对时间的导数,/>所述虚拟空置率的导函数;
S1049:根据所述虚拟空置率的导函数,确定所述系统外部时变扰动和径向基函数神经网络逼近误差的总和:
di=J1τd,i+εi
其中,di表示所述系统外部时变扰动和径向基函数神经网络逼近误差的总和。
6.根据权利要求1所述的水下直升机编队控制方法,其特征在于,所述扰动观测器具体为:
其中,表示扰动观测误差对时间的导数,li>0表示设计参数,/>ξi表示扰动观测器状态变量。
7.根据权利要求1所述的水下直升机编队控制方法,其特征在于,所述S106还包括:
S1061:设计所述径向基函数神经网络权重系数更新率
其中,Γ1,ij>0,σij>0,γ2,ij>0表示设计参数,aik表示第i个和第k个水下直升机之间是否有信息交换,项为单体水下直升机自适应项,/>表示所述水下直升机的一致性协同自适应项;
S1062:结合所述径向基函数神经网络权重系数更新率、所述龙伯格状态观测器和所述扰动观测器,设计所述协同编队控制器τi:
8.根据权利要求1所述的水下直升机编队控制方法,其特征在于,所述S107具体包括:
S1071:引入中间控制率,确定执行器更新协议:
其中,φi(t)表示所述中间控制率,其中,所述中间空置率具体表示将保持第k个事件触发瞬间tk的对应值,直至下一次触发瞬间tk+1时更新,/>m1,ι,/>表示设计参数,满足 表示所述执行器更新协议,tk表示第k个事件触发瞬间;
S1072:根据所述中间控制率和所述执行器更新协议,计算测量误差:
其中,表示所述测量误差;
S1073:结合所述测量误差,得到所述协同编队控制器的更新条件,并按照所述更新条件设置所述协同编队控制器:
9.根据权利要求1所述的水下直升机编队控制方法,其特征在于,所述S109具体包括:
S1091:结合所述跟踪经验值和所述扰动观测器,设计得到所述基于经验的扰动观测器:
S1092:结合所述跟踪经验值和所述协同编队控制器,设计得到所述基于经验的协同编队控制器:
10.根据权利要求5所述的水下直升机编队控制方法,其特征在于,所述S110具体包括:
S1101:通过所述龙伯格状态观测器观测所述第二状态变量,通过所述基于经验的扰动观测器观测所述系统外部时变扰动;
S1102:在所述动态阈值的事件触发机制的约束下,利用所述经验的协同编队控制器控制多个所述水下直升机对轨迹进行跟踪。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310545997.8A CN116578106A (zh) | 2023-05-12 | 2023-05-12 | 一种面向沿海声层析观测的水下直升机编队控制方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310545997.8A CN116578106A (zh) | 2023-05-12 | 2023-05-12 | 一种面向沿海声层析观测的水下直升机编队控制方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116578106A true CN116578106A (zh) | 2023-08-11 |
Family
ID=87540803
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310545997.8A Pending CN116578106A (zh) | 2023-05-12 | 2023-05-12 | 一种面向沿海声层析观测的水下直升机编队控制方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116578106A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117331317A (zh) * | 2023-12-01 | 2024-01-02 | 东海实验室 | 一种基于宽度学习的欠驱动水下直升机合围控制方法 |
CN117369267A (zh) * | 2023-10-31 | 2024-01-09 | 东海实验室 | 一种事件触发框架下水下直升机合围编队控制方法和系统 |
-
2023
- 2023-05-12 CN CN202310545997.8A patent/CN116578106A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117369267A (zh) * | 2023-10-31 | 2024-01-09 | 东海实验室 | 一种事件触发框架下水下直升机合围编队控制方法和系统 |
CN117369267B (zh) * | 2023-10-31 | 2024-04-30 | 东海实验室 | 一种事件触发框架下水下直升机合围编队控制方法和系统 |
CN117331317A (zh) * | 2023-12-01 | 2024-01-02 | 东海实验室 | 一种基于宽度学习的欠驱动水下直升机合围控制方法 |
CN117331317B (zh) * | 2023-12-01 | 2024-02-20 | 东海实验室 | 一种基于宽度学习的欠驱动水下直升机合围控制方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Cao et al. | Observer-based dynamic event-triggered control for multiagent systems with time-varying delay | |
CN116578106A (zh) | 一种面向沿海声层析观测的水下直升机编队控制方法 | |
CN110806759B (zh) | 一种基于深度强化学习的飞行器航线跟踪方法 | |
US11693373B2 (en) | Systems and methods for robust learning-based control during forward and landing flight under uncertain conditions | |
Wang et al. | Adaptive dynamic surface control for cooperative path following of marine surface vehicles with input saturation | |
CN110161847B (zh) | 一种基于分布式奇异观测器的无人机编队系统传感器故障估计方法 | |
CN109725644A (zh) | 一种高超声速飞行器线性优化控制方法 | |
Liu et al. | Robust trajectory tracking control of marine surface vessels with uncertain disturbances and input saturations | |
CN110286691B (zh) | 基于线性微分包含的多无人机编队控制方法 | |
Zhang et al. | Probabilistic planning and risk evaluation based on ensemble weather forecasting | |
Lin et al. | Distributed game strategy design with application to multi-agent formation control | |
CN117390498B (zh) | 一种基于Transformer模型的固定翼集群无人机飞行能力评估方法 | |
CN109582030A (zh) | 一种调整无人机姿态控制中待整定参数方法及相关装置 | |
CN116360470A (zh) | 一种多水下直升机协同编队控制方法 | |
CN111158386B (zh) | 一种干扰自主免疫的无人机姿态控制系统及实现方法 | |
Biannic et al. | Surrogate models for aircraft flight control: some off-line and embedded applications | |
Pushpangathan et al. | Robust simultaneously stabilizing decoupling output feedback controllers for unstable adversely coupled nano air vehicles | |
CN116700300A (zh) | 一种多auv分布式集群的鲁棒自适应一致性控制方法 | |
CN115755009A (zh) | 一种多水下机器人分布式协同定位方法及系统 | |
CN111216146B (zh) | 一种适用于网络化机器人系统的二部一致性量化控制方法 | |
Das et al. | DroneDiffusion: Robust Quadrotor Dynamics Learning with Diffusion Models | |
Ding et al. | Dynamics Event-Triggered-Based Time-Varying Bearing Formation Control for UAVs | |
CN117331317B (zh) | 一种基于宽度学习的欠驱动水下直升机合围控制方法 | |
CN118192275B (zh) | 六轴振动台的解耦控制方法及系统 | |
Gondal et al. | Modified State Observer Based Two-Way ETNAC Design For Uncertain Linear Systems |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |