CN109901403A - 一种自主水下机器人神经网络s面控制方法 - Google Patents

一种自主水下机器人神经网络s面控制方法 Download PDF

Info

Publication number
CN109901403A
CN109901403A CN201910277202.3A CN201910277202A CN109901403A CN 109901403 A CN109901403 A CN 109901403A CN 201910277202 A CN201910277202 A CN 201910277202A CN 109901403 A CN109901403 A CN 109901403A
Authority
CN
China
Prior art keywords
output
control
neural network
auv
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910277202.3A
Other languages
English (en)
Other versions
CN109901403B (zh
Inventor
孙延超
万磊
唐文政
秦洪德
杜雨桐
张栋梁
李凌宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harbin Engineering University
Original Assignee
Harbin Engineering University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harbin Engineering University filed Critical Harbin Engineering University
Priority to CN201910277202.3A priority Critical patent/CN109901403B/zh
Publication of CN109901403A publication Critical patent/CN109901403A/zh
Application granted granted Critical
Publication of CN109901403B publication Critical patent/CN109901403B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Feedback Control In General (AREA)

Abstract

一种自主水下机器人神经网络S面控制方法,涉及一种自主水下机器人的控制方法。为了解决现有的AUV的S面控制方法存在难以获得最优的控制参数或难以适应复杂变化的海洋环境从而影响运动控制效果的问题。本发明针对AUV控制模型,以S面控制方法对AUV进行闭环控制,在每个控制节拍内由S面控制环节输出控制量,控制器内部S面控制环节的控制参数k1与k2由基于神经网络的预测模型实现多步预测环节、反馈校正环节与滚动优化环节确定。本发明适用于自主水下机器人控制。

Description

一种自主水下机器人神经网络S面控制方法
技术领域
本发明属于控制技术领域,具体涉及一种自主水下机器人的控制方法。
背景技术
随着海洋战略地位的提高,近些年自主水下机器人(autonomous underwatervehicle,AUV)的重要性也日益凸显。AUV涉及计算机、控制、材料等多个学科领域,并融合了先进设计制造技术、能源与推进技术、水下导航技术与水下通信技术等多项关键技术。其中,运动控制技术是AUV技术的重要内容,只有AUV具备良好的控制性能,才能够保证在复杂的海洋环境中顺利完成作业任务。
作为一种常用的AUV运动控制方法,S面控制融合模糊控制与PID控制的思想,采用sigmoid曲面函数来拟合控制对象,目前已成功应用于多型AUV。但是在目前的工程应用中,S面控制器主要由设计者依靠经验以试凑方式来完成参数设定与调整。该参数调整方式效率低下,往往难以获得最优甚至良好的一组控制参数,甚至有时因参数设置不当而影响控制器的运动控制效果。
发明内容
本发明为了解决现有的AUV的S面控制方法存在难以获得最优的控制参数或难以适应复杂变化的海洋环境从而影响运动控制效果的问题。
一种自主水下机器人神经网络S面控制方法,针对AUV控制模型,以S面控制方法对AUV进行闭环控制,在每个控制节拍内由S面控制环节输出控制量,控制器内部S面控制环节的控制参数k1与k2由基于神经网络的预测模型实现多步预测环节、反馈校正环节与滚动优化环节确定;具体过程如下:
步骤1、神经网络预测模型环节:
周期性记录AUV航行过程中的控制量与状态量,获得神经网络模型的训练样本;采用BP学习算法对Elman神经网络进行离线训练,实现对AUV动力学模型的辨识;
采用离线训练后的神经网络作为单步预测模型,并采用递推多步预测的方式,将其在时域内进行串联来建立多步预测模型,从而组成控制器的预测模型环节;
步骤2、反馈校正环节:
反馈校正环节根据上一时刻的模型预测输出与AUV实际输出之间的偏差,对当前参数设置节拍内的预测模型输出进行修正;
步骤3、滚动优化环节:
滚动优化环节选取改进ITAE准则作为性能指标函数;在ITAE准则基础上,引入超调惩罚系数以提高对超调的敏感度,从而增强控制器对超调的抑制能力,其表达式如下
式中,α为超调惩罚函数,非超调状态下取α=1,超调状态下则α>1;误差量eΦ(t)为yp(t+d/t)与AUV运动控制目标量yin的差值;
将控制参数k1与k2作为状态S,将Φp(S')-Φp(S)作为增量Δ,通过模拟退火算法进行状态更新,并最终确定最优的状态,从而确定控制参数k1与k2
其中,Φp(S)表示状态S对应的Φp;S'为更新的状态。
本发明具有以下有益效果:
本发明解决了现有的AUV的S面控制方法存在难以获得最优的控制参数或难以适应复杂变化的海洋环境从而影响运动控制效果的问题,本发明所提出的基于神经网络模型的预测S面控制具有较强的抗干扰能力,能够适应自主水下机器人作业环境中的各种变化。
在本发明的仿真实验中,在高低频正弦输入与方波输入下,对比控制模型与神经网络模型的响应输出,可以看出Elman神经网络的输出响应均同控制模型较为接近。在纵向速度、艏向与深度控制的仿真实验中,分别采用两种模型作为控制器的预测模型,通过对比控制效果可以看出,二者均能够达到控制目标且几乎无稳态误差与超调量。此外,由于预测模型更加符合调整后的状态,基于神经网络的预测S面控制在收敛速度方面有一定提升。
综上所述,采用Elman神经网络能够实现对自主水下机器人动力学模型的辨识,并可以预测S面控制器的多步递推预测模型。相比基于机理模型的预测S面控制,基于神经网络的预测S面控制可以更好地适应自主水下机器人的动态特性变化,并且能够在纵向速度、深度与艏向控制中实现超调量低、稳态误差小且无振荡的控制效果。
附图说明
图1为基于神经网络模型的预测S面控制器的基本结构图;
图2为纵向速度控制对应的输入信号曲线图(高频正弦信号);
图3为纵向速度控制对应的输出响应曲线图(高频正弦信号);
图4为纵向速度控制对应的输入信号曲线图(低频正弦信号);
图5为纵向速度控制对应的输出响应曲线图(低频正弦信号);
图6为纵向速度控制对应的输入信号曲线图(幅值为500、占空比为50%的方波信号);
图7为纵向速度控制对应的输出响应曲线图(幅值为500、占空比为50%的方波信号);
图8为纵向速度控制对应的预测S面控制器的控制效果曲线图;
图9为艏向控制对应的输出响应曲线图(高频正弦信号);
图10为艏向控制对应的输出响应曲线图(低频正弦信号);
图11为艏向控制对应的输出响应曲线图(幅值为800、占空比为50%的方波信号);
图12为艏向控制对应的控制效果曲线图;
图13为深度控制对应的输出响应曲线图(高频正弦信号);
图14为深度控制对应的输出响应曲线图(低频正弦信号);
图15为深度控制对应的输出响应曲线图(幅值为500、占空比为50%的方波信号);
图16为深度控制对应的控制效果曲线图。
具体实施方式
具体实施方式一:
在说明本实施方式前,先对参数进行说明;
控制器结构相关参数:
k1,k2分别为S面控制器的控制参数;u为S面控制模块输出的控制量;yin为AUV运动控制目标量;ym为预测模型模块输出的AUV状态的预测值;yp为反馈校正模块输出的AUV状态的预测值;yout为AUV实际输出的状态量;N为每个参数调整节拍内所包含控制节拍的数量。
S面控制环节相关参数:
Os为控制输出;为AUV实际状态量与目标量之间偏差的变化率;Tmax为自主水下机器人所能提供最大推力(力矩);Tc为反归一化后实际输出的推力(力矩);δ为通过自适应方式得到的固定干扰力。
预测结构环节相关参数:
ui为输入层第i个神经元的输入量;S1与S2为输入层和隐含层的节点数;w(1)为结构层与隐含层间权值;w(2)为输入层与隐含层间权值;w(3)为隐含层与输出层间权值;θ(1)为隐含层单元阈值;θ(2)为输出层单元阈值;yk为第k个神经元节点的输出值;为第k个神经元节点的期望值;Np为学习样本数量;η为学习率;em为反馈校正模块对预测模型模块输出值的修正量;Φp为性能指标评价函数;eΦ为误差量;α为超调惩罚系数;ω为给定步长;β为降温衰减率。
一种自主水下机器人神经网络S面控制方法,针对AUV控制模型,基于神经网络模型的预测S面控制器的基本结构如图1所示。该控制器以经典S面控制方法对自主水下机器人的闭环控制为基础,在每个控制节拍内由S面控制环节输出控制量。但是同经典S面控制不同,控制器内部S面控制环节的控制参数k1与k2无需人工预设,而是由预测结构在每个参数设置节拍内完成设置与调整。
需要强调的是,这里的预测结构与传统预测控制器有本质上的不同,该结构仅负责为S面控制器输出控制参数,并非为被控对象输出控制量。由于频繁地调整控制参数不仅无法有效提高控制效果,还会大幅增加系统运算负担。因此,预测结构采用单独的参数设置节拍,每个参数设置节拍对应S面控制器的N个控制节拍,即:在预测结构完成一次参数设置后,S面控制环节将采用这组参数完成N个控制节拍的控制量计算,直到下个参数调整节拍由预测结构重新设置控制参数。
基于神经网络模型的预测S面控制器主要包含S面控制环节与预测结构两部分。在每个控制节拍内,S面控制环节为控制对象输出控制量,实现AUV的闭环运动控制。在每个参数设置节拍内,预测结构求解有限时域内的最优控制参数,实现S面控制模块的控制参数设置。该结构内部包括基于神经网络的预测模型实现多步预测、反馈校正与滚动优化三个环节。图1中Z-1表示调用上一时刻的历史数据。
该控制器使用AUV的航行数据作为训练样本对神经网络进行离线训练,可以更方便地建立预测模型。此外,当AUV根据任务内容变化进行调整后,可以直接在现场更新样本数据,经过训练得到更加符合当前负载情况的预测模型。因此,本发明所提出的基于神经网络模型的预测S面控制器具有较强的实用性与适应性。
(1)S面控制:
S面控制采用光滑Sigmoid曲面替代整个模糊控制规则库的折线面,并通过调整S面偏移来消除固定偏差,其函数表达式如下
式中,Os表示控制输出,通过归一化处理后取[-1,1];e与表示控制输入,分别为实际的AUV状态量与当前时刻目标量之间偏差与对应的变化率,同样通过归一化处理;k1与k2表示控制参数,分别对应偏差与偏差变化率,取(0,+∞);Tmax表示自主水下机器人所能提供最大推力(力矩);Tc表示反归一化后实际输出的推力(力矩),也就是S面控制输出的控制量u(t);δ为通过自适应方式得到的固定干扰力。
其中,固定干扰力δ的调节流程如下:
1)为偏差率设定一个阈值,判断是否小于设定阈值,若是则转步骤2),否则转步骤3);
2)将该自由度的偏差值e存入存储数组,同时将计数器加1,并判断当前计数器是否达到触发阈值,若达到阈值则转步骤4),否则转步骤3);
3)将存储数组首位移除,并将后面所有数值前移一位,并将计数器减1,转步骤1);
4)计算存储数组内数值的加权平均,用于计算自主水下机器人运动控制输出的偏移量,从而自适应调整控制器输出以消除固定控制偏差,并将存储数组与计数器重置,执行下一循环。
经典S面控制仅有的两个控制参数k1与k2对控制输出具有重要影响,若增大k1而减小k2,能够提高收敛速度,缩短上升时间,但可能导致超调量增加;而减小k1而增大k2,能够降低超调,使控制更加平稳。通过对控制参数k1与k2进行调节,可以将控制解算输出中偏差与偏差变化率所占比重平衡到合理范围,从而实现达到良好的运动控制效果。
同线性的常规PD控制相比,具有非线性控制曲面的经典S面控制更加适用于自主水下机器人的运动控制。此外,模糊控制需要根据实际情况对隶属度函数、模糊变量与模糊规则等众多内部要素进行调整,而经典S面控制所包含控制参数较少,能够极大简化参数调整过程,因此具有更强的实用性。
(2)神经网络预测模型环节设计:
预测模型环节负责提供一定时域内对AUV未来状态的预测数据,该环节每次计算的输入与输出如下式
ym(t+d/t)=fm[ym(t+d-1/t),u(t+d/t)] (2)
式中,ym(t+d/t)为在t时刻对预测时域内t+d时刻AUV状态的预测,当d=1时,ym(t+d-1/t)=yout(t-1),即使用上一时刻AUV的实际输出计算初始时刻模型输出;u(t+d/t)为在t时刻由S面控制器输出的预测时域内t+d时刻的控制量;fm[·]为神经网络递推模型的非线性函数。
假设作为非线性动态系统的AUV可以用下式来表示
y(k)=h(y(k-1),y(k-2),...y(k-ny),u(k-d),u(k-d-1),...u(k-nu)) (3)
式中,u(k)与y(k)分别为系统的输入与输出;nu与ny分别为输入与输出的阶次,d为时滞,h(·)为未知的非线性函数。
本发明采用2-15-15-1结构的Elman神经网络对AUV动力学模型进行辨识,取输入阶次ny与输出阶次nu为1。
输入层包含u(t-1)与y(t-1)两个神经元,即AUV前一时刻的控制量与状态量。输出层为控制响应y(t),即当前时刻的状态量。
Elman神经网络内各层输入输出关系具体如下
输入层:
输入
输出
隐含层:
输入
输出
结构层:
输入
输出
输出层:
输入
输出
式中,i为输入层神经元的序号,j为隐层神经元的序号,k为结构层神经元的序号,l为输出层神经元的序号;ui为输入层第i个神经元的输入量,S1与S2为输入层和隐层的节点数,w(1)为结构层与隐含层间权值;w(2)为输入层与隐含层间权值;w(3)为隐含层与输出层间权值;θ(1)为隐含层单元阈值;θ(2)为输出层单元阈值;f(·)与g(·)为激活函数。
周期性记录AUV航行过程中的控制量与状态量,可以获得神经网络模型的训练样本。随后根据现场收集的样本数据,采用BP学习算法对Elman神经网络进行离线训练,实现对AUV动力学模型的辨识。定义各反馈误差信号如下
式中,yk为第k个神经元节点的输出值;为第k个神经元节点的期望值;Np为学习样本数量。的导数;的导数;
各层神经元连接权值的修正公式如下
各层神经元阈值的修正公式如下
式中,η为学习率,取[0,1]。
对于递推多步预测的方式,在k+1时刻的系统输出值为
在此基础上对k+2时刻的预测输出为
则由递推原理可以得到预测p步后的结果为
当取输入阶次ny与输出阶次nu为1时:
采用离线训练后的神经网络作为单步预测模型,并采用递推多步预测的方式,将其在时域内进行串联来建立多步预测模型,从而组成控制器的预测模型环节。
(3)反馈校正环节设计:
AUV属于强非线性系统,再加上海洋环境复杂多变,导致模型预测输出与系统实际输出之间难免存在差异。因此引入反馈校正机制,对模型预测数据进行一定程度的修正,从而使预测结构的输出建立在更贴近实际的数据基础上。
反馈校正模块将根据上一时刻的模型预测输出与AUV实际输出之间的偏差,对当前参数设置节拍内的预测模型输出进行修正,具体如下式
yp(t+d/t)=ym(t+d/t)+em(t) (18)
em(t)=yout(t-1)-ym(t-1/t-2) (19)
ym(t-1/t-2)=fm[yout(t-2),u(t-1)] (20)
式中,yp(t+d/t)表示在t时刻对预测周期内t+d时刻模型预测值修正后的输出;em(t)为t时刻的修正量;ym(t+d/t)为预测模型在t时刻对预测时域内t+d时刻AUV状态的预测值,即ym(t-1/t-2)为预测模型在t-2时刻对预测时域内t-1时刻AUV状态的预测值,即yout(t-2)为t-2时刻AUV实际输出的状态量。
(4)滚动优化环节设计:
在滚动优化环节的计算中,首先结合目标状态量与修正后的一组预测值计算当前控制参数的评价值,随后在解空间中根据评价值进行搜索,从而得到一组最优控制参数。
为了评价一组控制参数的控制效果,滚动优化环节选取改进ITAE准则作为性能指标函数。在ITAE准则基础上,引入超调惩罚系数以提高对超调的敏感度,从而增强控制器对超调的抑制能力,其表达式如下
式中,α为超调惩罚函数,非超调状态下取α=1,超调状态下则α>1;误差量eΦ(t)为yp(t+d/t)与AUV运动控制目标量yin的差值。
滚动优化环节内部采用模拟退火算法求解优化问题,算法流程如下:
(1)随机选取状态S作为初始状态,并取较高初始温度T0,选定马尔科夫链初始长度L0,计算性能指标Φp并初始化迭代次数L=0;状态S即为控制参数k1与k2
(2)对当前状态做随机扰动从而产生一个新状态S′,具体如下式
S'=S+Rand(0,1)ω (22)
式中,ω为给定步长,Rand(0,1)为随机数。
(3)计算增量Δ如下式
Δ=Φp(S')-Φp(S) (23)
其中,Φp(S)表示状态S对应的Φp
(4)若Δ<0,则令S'=S,然后转至(6);
(5)若Δ>0,产生随机数p,当p<exp(-Δ/T)时,令S'=S,否则S不变;然后转至(6);
(6)令L=L+1,若L<L0则返回(2);否则转至(7);
(7)根据下式进行降温
T=βT
式中,β为衰减率。
(8)检查退火过程是否结束,若未结束则令L=0,转至(2);否则转至(9);
(9)以当前状态S为最优解,输出所对应的控制参数k1与k2,结束算法。
模拟退火算法与初始值无关,算法求得的解与初始解状态无关。该算法具有具有并行性与渐近收敛性,已在理论上被证明是一种以概率l收敛于全局最优解的全局优化算法。
具体实施方式二:
本实施方式所述的AUV控制模型可以有多种形式,即本发明的控制方法可以应用于多种形式的AUV控制模型。在一些实施例中,自主水下机器人控制建模过程如下:
建立以下两种右手坐标系:一是固定坐标系E-ξηζ,固定于地球;二是运动坐标系O-xyz,随水下机器人运动[4]。固定坐标系E-ξηζ的原点E可选地球上任意一点,ξ轴位于水平面,并以水下机器人主航向在水平面的投影为正向;η轴同样位于水平面,按右手法则将Eξ轴顺时针旋转90°即是;ζ轴垂直于ξEη坐标平面,指向地心为正。固定坐标系下定义水下机器人的位置向量为[ξ η ζ],姿态向量为运动坐标系O-xyz的原点O一般选在水下机器人重心处,x、y和z轴均经过O点并分别位于水线面、横剖面和纵中剖面,正向根据右手系的规定分别指向自主水下机器人的首端、右侧和底部。运动坐标系下定义自主水下机器人的线速度向量为[u v w],角速度向量为[p q r]。
假设固定坐标系与运动坐标系重合,各个姿态角的定义如下:艏向角为ξ轴与x轴在水平面的夹角,右转为正;纵倾角θ为ξ轴与x轴在垂直面的夹角,尾倾为正;横倾角ψ为xOz平面与通过x轴的垂直平面xOζ之间的夹角,右倾为正。
将固定坐标系内的位置与姿态角统一为向量运动坐标系内的线速度与角速度统一为向量v=[u v w p q r]T,根据参考文献[4]中的推导,自主水下机器人运动学公式为
式中转换矩阵J(η)=diag(J1(η),J2(η)),其中线速度转换矩阵为
角速度转换矩阵为
由于纵倾角θ=±90°时,转换矩阵J2(η)并没有意义,因此对纵倾角进行限定:
国内外普遍应用的水下机器人控制模型如下[5]
式中,M为惯性矩阵,其中包含附加质量;C(υ)为科氏向心力矩阵,其中包含附加质量;D(υ)为流体阻尼矩阵;g(η)为重力与浮力的力与力矩向量;τ为执行机构的力与力矩向量。
惯性矩阵M=MRB+MA,其中MRB为刚体质量矩阵,如下式
式中,m为质量,I为惯量项,[xG yG zG]为重心在运动坐标系下坐标。
对于航行过程中完全潜入水中的自主水下机器人,附加质量矩阵MA内各系数均为常数,如下式
式中,等均为水动力导数,需要AUV的拘束模型实验数据并结合计算流体力学与系统辨识技术等来获取。
科氏向心力矩阵C(v)=CRB(v)+CA(v),其中CRB(v)为刚体向心力矩阵,如下式
CA(v)科氏力矩阵为
式中,各系数如下
流体阻尼矩阵D(v)=Dl+Dn(v),其中Dl为线性阻尼矩阵如下式
Dl=-diag{Xu Yv Zw Kp Mq Nr} (33)
非线性组逆矩阵Dn(v)为
Dn(v)=-diag{Xu|u||u| Yv|v||v| Zw|w||w| Kp|p||p| Mq|q||q| Nr|r||r|} (34)
重力与浮力的力与力矩向量g(η)如下式
式中,W为重力,B为浮力,[xB,yB,zB]为浮心在运动坐标系下坐标;
执行机构的力与力矩向量τ如下式
τ=[X Y Z K M N]T (36)
式中,X、Y与Z为三轴推力,K、M与N为三轴转矩。
实际工程情况,对以上AUV运动模型进行以下几项简化:
(1)设置重心与运动坐标系原点重合;
(2)将重力与浮力配置相等,且浮心在重心正上方;
(3)假设结构具有对称性,即在xGz平面左右对称且在yGz平面上下对称;
(4)忽略横滚运动;
(5)执行机构能够产生的力与力矩仅包括纵向推力、垂向推力、转艏力矩与俯仰力矩。
此外,由于AUV六自由度运动模型复杂程度较高,为进一步方便控制器设计,将其分解为水平面与垂直面[6]。
综上所述,本文建立AUV控制模型如下:
水平面内控制模型为
垂直面内控制模型为
其他步骤和参数与具体实施方式一相同。
具体实施方式三:
本实施方式中,所述Elman神经网络内各层输入输出关系是通过如下方式确定的:
采用Elman神经网络建立控制器的多步递推预测模型,标准Elman神经网络结构一般分为输入层、隐含层、结构层与输出层,其非线性状态空间表达式如下
式中,u(t)为输入层在t时刻的输入;y(t)为输入层在t时刻的输出;xc(t)为结构层在t时刻的输出;x(t)为隐含层在t时刻的输出;w(1)为结构层与隐含层间权值;w(2)为输入层与隐含层间权值;w(3)为隐含层与输出层间权值;θ(1)为隐含层单元阈值;θ(2)为输出层单元阈值;f(·)与g(·)为激活函数。
取f(·)为Sigmoid函数
则有
f'(x)=f(x)[1-f(x)] (41)
g(·)为Pureline函数,即
y(t)=w(3)·x(t)+θ(2) (42)
则有
Elman神经网络各层输出输出关系如下
式中,S1与S2为输入层和隐层的节点数。
在训练过程中,Elman神经网络根据输出值与期望值之间的偏差,按照从输出层到输入层的方向反向传播,对各层各节点的权值与阈值进行调整。本发明基于梯度下降法,采用BP算法沿误差函数的负梯度方向实现神经学习,均方差误差函数定义如下
式中,yk为第k个神经元节点的输出值;为第k个神经元节点的期望值;Np为学习样本数量。
根据梯度下降原理的权值修正公式为
式中,η为学习率,取[0,1]。
首先根据式(52),并结合各层输入输出关系式(40)到式(51),求出偏差E对各层权值的偏导
式中,定义各反馈误差信号如下
代入式(53),得到各层神经元连接权值的修正公式
同理,得到阈值修正公式如下
其他步骤和参数与具体实施方式一相同。
实施例
通过仿真实验来验证本发明的控制方法的效果,在进行仿真实验之前,首先将本发明与现有技术方案进行一下比较说明:
a、滑模变结构控制方法
滑模变结构控制器能够根据当前状态动态地调整系统沿着预定的滑动模态轨迹运动,具有实现简单、响应迅速且抗扰动能力强等优点。文献[7]设计了自适应滑模控制器,能够通过评估外界干扰来自适应调整控制器,从而提高系统鲁棒性。文献[8]设计了一种滑模控制器进行欠驱动水下机器人轨迹跟踪控制,并仿真证明该控制器在有界扰动下的鲁棒性。文献[9]为在一定纵向速度范围内工作的过驱动水下机器人设计了滑模变结构的艏向控制器。
然而,滑模变结构控制的缺点在于当状态轨迹到达滑模面之后,难于严格地沿着滑模面向平衡点滑动,而是在滑模面的两侧来回穿越,从而产生颤动,即抖振问题。相比之下,本发明所提出的基于神经网络模型的预测S面控制的控制面平滑,能够实现控制平稳、超调量低、稳态误差小的良好效果。
b、自适应控制方法
同常规反馈控制相比,自适应控制需要模型与扰动先验知识比更少,而主要依靠在系统运行过程中收集信息来调整控制器,从而具有较强适应能力。文献[10]在自主水下机器人的纵向与垂向速度控制中应用了自适应策略,从而提高了控制器对非线性动态有界扰动的鲁棒性。文献[11]将模糊控制与自适应控制相结合,通过模糊逻辑动态调整控制器参数的自适应律。文献[12]通过对径向基神经网络权值进行自适应调整,提高了PD神经滑模控制器的控制性能,并通过仿真以及水池实验证明了该控制器在自主水下机器人区域跟踪控制中具有良好控制效果。
但是,在对非线性系统的控制中,自适应控制要求控制对象对外界干扰有较强的抑制能力并且对参数变化有较低的敏感程度,而身处复杂海洋环境的自主水下机器人很难满足这一要求。相比之下,本发明所提出的基于神经网络模型的预测S面控制具有较强的抗干扰能力,能够适应自主水下机器人作业环境中的各种变化。
为验证本发明所提出控制方法的运动控制性能,在MATLAB环境下进行运动控制仿真实验,具体包括水平面内的速度与艏向控制以及垂直面内的深度控制。
首先,采集在给定信号下调整后控制模型的输出响应,以此作为样本数据对Elman神经网络进行离线训练,从而得到神经网络预测模型。随后,为了验证神经网络对自主水下机器人动力学模型的辨识效果,对调整后控制模型与神经网络模型分别施加高频正弦信号、低频正弦信号以及方波信号,对比二者的输出响应差异。最后,分别以未调整的控制模型以及离线训练的神经网络模型作为预测模型,对比预测S面控制器的控制效果,证明基于神经网络模型的预测S面控制方法对负载调整的适应性。
控制器的参数设置如下:
1)选取控制节拍为0.1s,参数调整节拍为3s,预测时域为8s。
2)S面控制环节:
根据式(2),S面控制器仅有两个控制参数k1与k2需要设定。令初始时刻为第一个参数预测周期,即预测结构将自主完成S面控制参数k1与k2的设置而无需手动选取初值。
3)神经网络预测模型环节:
采用离线训练后满足误差限要求的神经网络作为预测模型,其中取Elman神经网络的输入阶次ny与输出阶次nu为1,网络结构为2-15-15-1,学习率为0.001,自反馈系数为0.01。;
4)反馈校正环节:
无参数需要设置。
5)滚动优化环节:
对于SA算法,设置初始温度T0=1000,迭代次数上限L0=100,温度衰减系数β=0.9。
此外,仿真实验中运动控制对象采用3.1节所建立的AUV控制模型,部分参数赋值见表1。
表1水动力系数汇总
仿真结果:
1、纵向速度控制:
对水平面内的AUV纵向动力学模型施加激励信号,并记录输出的纵向速度作为训练样本数据,其中激励信号如式(58)。
u(t)=(500-0.05t)·sin(10πt/(10+t)) (58)
u(t)=500sin(0.5πt) (59)
u(t)=500sin(0.05πt) (60)
为了验证训练后Elman神经网络对模型的辨识效果,首先施加如式(59)的高频正弦信号,得到控制模型与神经网络模型的响应,如图2至图3所示。
随后施加如式(60)的低频正弦信号,得到控制模型与神经网络模型的响应,如图4至图5所示。
最终施加幅值为500、占空比为50%的方波信号,得到控制模型与神经网络模型的响应,如图6至图7所示。
分别以未调整的控制模型以及离线训练的神经网络模型作为预测模型,对比预测S面控制器的控制效果,如图8所示。
2、艏向控制:
对水平面内的AUV艏向动力学模型施加激励信号,并记录输出的艏向角速度作为训练样本数据,其中激励信号如式(61)。
u(t)=(800-0.05t)·sin(10πt/(10+t)) (61)
u(t)=800sin(0.5πt) (62)
u(t)=800sin(0.05πt) (63)
首先施加如式(62)的高频正弦信号,控制模型与神经网络模型的响应如图9所示。
随后施加如式(63)的低频正弦信号,控制模型与神经网络模型的响应如图10所示。
最终施加幅值为800、占空比为50%的方波信号,控制模型与神经网络模型的响应如图11所示。
分别以未调整的控制模型以及离线训练的神经网络模型作为预测模型,对比预测S面控制器的控制效果,如图12所示。
3、深度控制:
对水平面内的“橙鲨”自主水下机器人纵向动力学模型施加激励信号,并记录输出的纵向速度作为训练样本数据,其中激励信号如式(64)所示。
u(t)=(500-0.05t)·sin(10πt/(10+t)) (64)
u(t)=500sin(0.5πt) (65)
u(t)=500sin(0.05πt) (66)
首先施加如式(65)的高频正弦信号,控制模型与神经网络模型的响应如图13所示。
随后施加如式(66)的低频正弦信号,控制模型与神经网络模型的响应如图14所示。
最终施加幅值为500、占空比为50%的方波信号,控制模型与神经网络模型的响应如图15所示。
分别以未调整的控制模型以及离线训练的神经网络模型作为预测模型,对比预测S面控制器的控制效果,如图16所示。
4、仿真分析:
在高低频正弦输入与方波输入下,对比控制模型与神经网络模型的响应输出,可以看出Elman神经网络的输出响应均同控制模型较为接近。在纵向速度、艏向与深度控制的仿真实验中,分别采用两种模型作为控制器的预测模型,通过对比控制效果可以看出,二者均能够达到控制目标且几乎无稳态误差与超调量。此外,由于预测模型更加符合调整后的状态,基于神经网络的预测S面控制在收敛速度方面有一定提升。
综上所述,采用Elman神经网络能够实现对自主水下机器人动力学模型的辨识,并可以预测S面控制器的多步递推预测模型。相比基于机理模型的预测S面控制,基于神经网络的预测S面控制可以更好地适应自主水下机器人的动态特性变化,并且能够在纵向速度、深度与艏向控制中实现超调量低、稳态误差小且无振荡的控制效果。
参考文献
[1]刘学敏,徐玉如.水下机器人运动的S面控制方法[J].海洋工程,2001,19(3):81-84.
[2]刘建成,于华男,徐玉如.水下机器人改进的S面控制方法[J].哈尔滨工程大学学报,2002,23(1):33-36.
[3]杨汉桥,林晓辉.遗传算法与模拟退火法寻优能力综述[J].机械制造与自动化,2010,39(2):73-75.
[4]施生达.潜艇操纵性[M].国防工业出版社,1995.
[5]HassanK.Khalil.非线性系统(第三版)[M].2005.
[6]毕凤阳.欠驱动自主水下航行器的非线性鲁棒控制策略研究[D].哈尔滨工业大学,2010.
[7]陈巍,魏延辉,曾建辉,等.AUV纵倾角动态面滑模自适应控制[J].火力与指挥控制,2016,41(6):73-76.
[8]Elmokadem T,Zribi M,Youcef-Toumi K.Terminal sliding mode controlfor the trajectory tracking of underactuated Autonomous Underwater Vehicles[J].Ocean Engineering,2016,129.
[9]Tanakitkorn K,Wilson P A,Turnock S R,et al.Sliding mode headingcontrol of an overactuated,hover-capable autonomous underwater vehicle withexperimental verification[J].Journal of Field Robotics,2017,in Press(1).
[10]张利军,齐雪,赵杰梅,等.垂直面欠驱动自治水下机器人定深问题的自适应输出反馈控制[J].控制理论与应用,2012,29(10):001371-1376.
[11]Lakhekar G V,Waghmare L M.Robust maneuvering of autonomousunderwater vehicle:an adaptive fuzzy PI sliding mode control[J].IntelligentService Robotics,2017,10(3):1-18.
[12]张铭钧,褚振忠.自主式水下机器人自适应区域跟踪控制[J].机械工程学报,2014,50(19):50-57.

Claims (9)

1.一种自主水下机器人神经网络S面控制方法,针对AUV控制模型,以S面控制方法对AUV进行闭环控制,其特征在于,在每个控制节拍内由S面控制环节输出控制量,控制器内部S面控制环节的控制参数k1与k2由基于神经网络的预测模型实现多步预测环节、反馈校正环节与滚动优化环节确定;具体过程如下:
步骤1、神经网络预测模型环节:
周期性记录AUV航行过程中的控制量与状态量,获得神经网络模型的训练样本;采用BP学习算法对Elman神经网络进行离线训练,实现对AUV动力学模型的辨识;
采用离线训练后的神经网络作为单步预测模型,并采用递推多步预测的方式,将其在时域内进行串联来建立多步预测模型,从而组成控制器的预测模型环节;
步骤2、反馈校正环节:
反馈校正环节根据上一时刻的模型预测输出与AUV实际输出之间的偏差,对当前参数设置节拍内的预测模型输出进行修正;
步骤3、滚动优化环节:
滚动优化环节选取改进ITAE准则作为性能指标函数;在ITAE准则基础上,引入超调惩罚系数以提高对超调的敏感度,从而增强控制器对超调的抑制能力,其表达式如下
式中,α为超调惩罚函数,非超调状态下取α=1,超调状态下则α>1;误差量eΦ(t)为yp(t+d/t)与AUV运动控制目标量yin的差值;
将控制参数k1与k2作为状态S,将Φp(S')-Φp(S)作为增量Δ,通过模拟退火算法进行状态更新,并最终确定最优的状态,从而确定控制参数k1与k2
其中,Φp(S)表示状态S对应的Φp;S'为更新的状态。
2.根据权利要求1所述的一种自主水下机器人神经网络S面控制方法,其特征在于,步骤1所述神经网络预测模型环节的具体过程包括以下步骤:
预测模型环节每次计算的输入与输出如下式
ym(t+d/t)=fm[ym(t+d-1/t),u(t+d/t)]
式中,ym(t+d/t)为在t时刻对预测时域内t+d时刻AUV状态的预测,当d=1时,ym(t+d-1/t)=yout(t-1),即使用上一时刻AUV的实际输出计算初始时刻模型输出;u(t+d/t)为在t时刻由S面控制器输出的预测时域内t+d时刻的控制量;fm[·]为神经网络递推模型的非线性函数;
作为非线性动态系统的AUV用下式来表示
y(k)=h(y(k-1),y(k-2),...y(k-ny),u(k-d),u(k-d-1),...u(k-nu))
式中,u(k)与y(k)分别为系统的输入与输出;nu与ny分别为输入与输出的阶次,d为时滞,h(·)为未知的非线性函数;
输入层包含u(t-1)与y(t-1)两个神经元,即AUV前一时刻的控制量与状态量;输出层为控制响应y(t),即当前时刻的状态量;
Elman神经网络内各层输入输出关系具体如下
输入层:
输入
输出
隐含层:
输入
输出
结构层:
输入
输出
输出层:
输入
输出
式中,i为输入层神经元的序号,j为隐层神经元的序号,k为结构层神经元的序号,l为输出层神经元的序号;ui为输入层第i个神经元的输入量,S1与S2为输入层和隐层的节点数,w(1)为结构层与隐含层间权值;w(2)为输入层与隐含层间权值;w(3)为隐含层与输出层间权值;θ(1)为隐含层单元阈值;θ(2)为输出层单元阈值;f(·)与g(·)为激活函数;
周期性记录AUV航行过程中的控制量与状态量,获得神经网络模型的训练样本;采用BP学习算法对Elman神经网络进行离线训练,实现对AUV动力学模型的辨识;定义各反馈误差信号如下
式中,yk为第k个神经元节点的输出值;为第k个神经元节点的期望值;Np为学习样本数量;的导数;的导数;
各层神经元连接权值的修正公式如下
各层神经元阈值的修正公式如下
式中,η为学习率,取[0,1];
对于递推多步预测的方式,在k+1时刻的系统输出值为
其中,ny为输入阶次,nu为输出阶次;
在此基础上对k+2时刻的预测输出为
则由递推原理得到预测p步后的结果为
采用离线训练后的神经网络作为单步预测模型,并采用递推多步预测的方式,将其在时域内进行串联来建立多步预测模型,从而组成控制器的预测模型环节。
3.根据权利要求2所述的一种自主水下机器人神经网络S面控制方法,其特征在于,步骤2所述反馈校正环节的具体过程包括以下步骤:
反馈校正环节根据上一时刻的模型预测输出与AUV实际输出之间的偏差,对当前参数设置节拍内的预测模型输出进行修正,具体如下式
yp(t+d/t)=ym(t+d/t)+em(t)
em(t)=yout(t-1)-ym(t-1/t-2)
ym(t-1/t-2)=fm[yout(t-2),u(t-1)]
式中,yp(t+d/t)表示在t时刻对预测周期内t+d时刻模型预测值修正后的输出;em(t)为t时刻的修正量;ym(t+d/t)为预测模型在t时刻对预测时域内t+d时刻AUV状态的预测值,即ym(t-1/t-2)为预测模型在t-2时刻对预测时域内t-1时刻AUV状态的预测值,即yout(t-2)为t-2时刻AUV实际输出的状态量。
4.根据权利要求1、2或3所述的一种自主水下机器人神经网络S面控制方法,其特征在于,步骤3所述通过模拟退火算法进行状态更新的具体过程如下:
(1)随机选取状态S作为初始状态,并取初始温度T0,选定马尔科夫链初始长度L0,计算性能指标Φp,并初始化迭代次数L=0;
(2)对当前状态做随机扰动从而产生一个新状态S′,具体如下式
S'=S+Rand(0,1)ω
式中,ω为给定步长,Rand(0,1)为随机数;
(3)计算增量Δ如下式
Δ=Φp(S')-Φp(S)
其中,Φp(S)表示状态S对应的Φp
(4)若Δ<0,则令S'=S,然后转至(6);
(5)若Δ>0,产生随机数p,当p<exp(-Δ/T)时,令S'=S,否则S不变;然后转至(6);
(6)令L=L+1,若L<L0则返回(2);否则转至(7);
(7)根据下式进行降温
T=βT
式中,β为衰减率;
(8)检查退火过程是否结束,若未结束则令L=0,转至(2);否则转至(9);
(9)以当前状态S为最优解,输出所对应的控制参数k1与k2,结束。
5.根据权利要求2或3所述的一种自主水下机器人神经网络S面控制方法,其特征在于,所述输入阶次ny与输出阶次nu为1。
6.根据权利要求1、2或3所述的一种自主水下机器人神经网络S面控制方法,其特征在于,所述的Elman神经网络采用2-15-15-1结构,即:输入层包含2个神经元,隐含层包含15个神经元,结构层包含15个神经元,输出层1个神经元。
7.根据权利要求1、2或3所述的一种自主水下机器人神经网络S面控制方法,其特征在于,所述的Elman神经网络非线性状态空间表达式如下
式中,u(t)为输入层在t时刻的输入;y(t)为输入层在t时刻的输出;xc(t)为结构层在t时刻的输出;x(t)为隐含层在t时刻的输出;w(1)为结构层与隐含层间权值;w(2)为输入层与隐含层间权值;w(3)为隐含层与输出层间权值;θ(1)为隐含层单元阈值;θ(2)为输出层单元阈值;f(·)与g(·)为激活函数;
取f(·)为Sigmoid函数
则有
f'(x)=f(x)[1-f(x)]
g(·)为Pureline函数,即
y(t)=w(3)·x(t)+θ(2)
则有
8.根据权利要求1所述的一种自主水下机器人神经网络S面控制方法,其特征在于,所述的S面控制函数表达式如下
式中,Os表示控制输出,通过归一化处理后取[-1,1];e与分别为实际的AUV状态量与当前时刻目标量之间偏差与对应的变化率;k1与k2表示控制参数,分别对应偏差与偏差变化率,取(0,+∞);Tmax表示自主水下机器人所能提供最大推力;Tc表示反归一化后实际输出的推力,也就是S面控制输出的控制量u(t);δ为通过自适应方式得到的固定干扰力。
9.根据权利要求8所述的一种自主水下机器人神经网络S面控制方法,其特征在于,所述固定干扰力δ的调节流程如下:
1)为设定一个阈值,判断是否小于设定阈值,若是则转步骤2),否则转步骤3);
2)将该自由度的偏差e存入存储数组,同时将计数器加1,并判断当前计数器是否达到触发阈值,若达到阈值则转步骤4),否则转步骤3);
3)将存储数组首位移除,并将后面所有数值前移一位,并将计数器减1,转步骤1);
4)计算存储数组内数值的加权平均,用于计算自主水下机器人运动控制输出的偏移量,从而自适应调整控制器输出以消除固定控制偏差,并将存储数组与计数器重置,执行下一循环。
CN201910277202.3A 2019-04-08 2019-04-08 一种自主水下机器人神经网络s面控制方法 Active CN109901403B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910277202.3A CN109901403B (zh) 2019-04-08 2019-04-08 一种自主水下机器人神经网络s面控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910277202.3A CN109901403B (zh) 2019-04-08 2019-04-08 一种自主水下机器人神经网络s面控制方法

Publications (2)

Publication Number Publication Date
CN109901403A true CN109901403A (zh) 2019-06-18
CN109901403B CN109901403B (zh) 2022-07-29

Family

ID=66955438

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910277202.3A Active CN109901403B (zh) 2019-04-08 2019-04-08 一种自主水下机器人神经网络s面控制方法

Country Status (1)

Country Link
CN (1) CN109901403B (zh)

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111131042A (zh) * 2019-12-19 2020-05-08 华南理工大学 一种水下通信的多模态路由算法
CN111176122A (zh) * 2020-02-11 2020-05-19 哈尔滨工程大学 一种基于双bp神经网络q学习技术的水下机器人参数自适应反步控制方法
CN111337931A (zh) * 2020-03-19 2020-06-26 哈尔滨工程大学 一种auv目标搜索方法
CN111665722A (zh) * 2020-06-18 2020-09-15 哈尔滨工程大学 一种基于预测控制的海浪主动补偿控制方法
CN111665861A (zh) * 2020-05-19 2020-09-15 中国农业大学 一种轨迹跟踪控制方法、装置、设备和存储介质
CN112327634A (zh) * 2020-11-27 2021-02-05 江苏科技大学 基于bp神经网络s面控制的水下机器人姿态控制方法
CN112363538A (zh) * 2020-11-09 2021-02-12 哈尔滨工程大学 一种速度信息不完备下的auv区域跟踪控制方法
CN112947506A (zh) * 2021-04-28 2021-06-11 哈尔滨工程大学 基于量子鲨鱼机制的auv全局路径规划方法
CN113050420A (zh) * 2021-03-04 2021-06-29 山东大学 基于s面控制和td3的auv路径跟踪方法及系统
CN113128096A (zh) * 2021-04-28 2021-07-16 青岛澎湃海洋探索技术有限公司 一种获取水下航行器直航附加质量方法
CN113485390A (zh) * 2021-08-26 2021-10-08 湖南大学 一种抗洋流扰动的自主水下机器人动力定位方法和系统
CN113654559A (zh) * 2021-08-20 2021-11-16 青岛澎湃海洋探索技术有限公司 基于多模型观测校正的auv导航方法
CN114012733A (zh) * 2021-11-29 2022-02-08 江苏科技大学 一种用于pc构件模具划线的机械臂控制方法
CN114296489A (zh) * 2021-12-04 2022-04-08 北京工业大学 基于事件触发的rbf-pid城市固废焚烧过程炉膛温度控制方法
CN116880519A (zh) * 2023-08-15 2023-10-13 武汉船舶职业技术学院 一种基于滑模变结构的潜器运动控制方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1718378A (zh) * 2005-06-24 2006-01-11 哈尔滨工程大学 浮游式水下机器人运动的s面控制方法
CN104268625A (zh) * 2014-10-09 2015-01-07 哈尔滨工程大学 一种基于海洋环境信息的自主式水下潜器航迹预测方法
CN107239075A (zh) * 2017-04-19 2017-10-10 哈尔滨工程大学 自主水下航行器平面直线航线跟踪的智能s面制导控制方法
CN109213180A (zh) * 2018-07-13 2019-01-15 哈尔滨工程大学 立扁体auv下潜过程中的安全抛载及深度控制方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1718378A (zh) * 2005-06-24 2006-01-11 哈尔滨工程大学 浮游式水下机器人运动的s面控制方法
CN104268625A (zh) * 2014-10-09 2015-01-07 哈尔滨工程大学 一种基于海洋环境信息的自主式水下潜器航迹预测方法
CN107239075A (zh) * 2017-04-19 2017-10-10 哈尔滨工程大学 自主水下航行器平面直线航线跟踪的智能s面制导控制方法
CN109213180A (zh) * 2018-07-13 2019-01-15 哈尔滨工程大学 立扁体auv下潜过程中的安全抛载及深度控制方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
何斌: "DSRV运动控制中参数自寻优典型方法研究", 《中国优秀硕士学位论文全文数据库 工程科技Ⅱ辑》 *
孙玉山 等: "改进的模拟退火算法在水下机器人S面运动控制参数优化中的应用", 《兵工学报》 *

Cited By (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111131042B (zh) * 2019-12-19 2021-05-14 华南理工大学 一种水下通信的多模态路由方法
CN111131042A (zh) * 2019-12-19 2020-05-08 华南理工大学 一种水下通信的多模态路由算法
CN111176122A (zh) * 2020-02-11 2020-05-19 哈尔滨工程大学 一种基于双bp神经网络q学习技术的水下机器人参数自适应反步控制方法
CN111337931A (zh) * 2020-03-19 2020-06-26 哈尔滨工程大学 一种auv目标搜索方法
CN111337931B (zh) * 2020-03-19 2022-11-15 哈尔滨工程大学 一种auv目标搜索方法
CN111665861A (zh) * 2020-05-19 2020-09-15 中国农业大学 一种轨迹跟踪控制方法、装置、设备和存储介质
CN111665722A (zh) * 2020-06-18 2020-09-15 哈尔滨工程大学 一种基于预测控制的海浪主动补偿控制方法
CN112363538A (zh) * 2020-11-09 2021-02-12 哈尔滨工程大学 一种速度信息不完备下的auv区域跟踪控制方法
CN112327634A (zh) * 2020-11-27 2021-02-05 江苏科技大学 基于bp神经网络s面控制的水下机器人姿态控制方法
CN112327634B (zh) * 2020-11-27 2022-04-26 江苏科技大学 基于bp神经网络s面控制的水下机器人姿态控制方法
CN113050420B (zh) * 2021-03-04 2022-02-18 山东大学 基于s面控制和td3的auv路径跟踪方法及系统
CN113050420A (zh) * 2021-03-04 2021-06-29 山东大学 基于s面控制和td3的auv路径跟踪方法及系统
CN113128096A (zh) * 2021-04-28 2021-07-16 青岛澎湃海洋探索技术有限公司 一种获取水下航行器直航附加质量方法
CN112947506B (zh) * 2021-04-28 2022-08-02 哈尔滨工程大学 基于量子鲨鱼机制的auv全局路径规划方法
CN112947506A (zh) * 2021-04-28 2021-06-11 哈尔滨工程大学 基于量子鲨鱼机制的auv全局路径规划方法
CN113654559A (zh) * 2021-08-20 2021-11-16 青岛澎湃海洋探索技术有限公司 基于多模型观测校正的auv导航方法
CN113485390A (zh) * 2021-08-26 2021-10-08 湖南大学 一种抗洋流扰动的自主水下机器人动力定位方法和系统
CN113485390B (zh) * 2021-08-26 2022-05-03 湖南大学 一种抗洋流扰动的自主水下机器人动力定位方法和系统
CN114012733A (zh) * 2021-11-29 2022-02-08 江苏科技大学 一种用于pc构件模具划线的机械臂控制方法
CN114296489A (zh) * 2021-12-04 2022-04-08 北京工业大学 基于事件触发的rbf-pid城市固废焚烧过程炉膛温度控制方法
CN114296489B (zh) * 2021-12-04 2022-09-20 北京工业大学 基于事件触发的rbf-pid城市固废焚烧过程炉膛温度控制方法
CN116880519A (zh) * 2023-08-15 2023-10-13 武汉船舶职业技术学院 一种基于滑模变结构的潜器运动控制方法
CN116880519B (zh) * 2023-08-15 2024-03-08 武汉船舶职业技术学院 一种基于滑模变结构的潜器运动控制方法

Also Published As

Publication number Publication date
CN109901403B (zh) 2022-07-29

Similar Documents

Publication Publication Date Title
CN109901403A (zh) 一种自主水下机器人神经网络s面控制方法
CN107748566B (zh) 一种基于强化学习的水下自主机器人固定深度控制方法
CN110238839B (zh) 一种利用环境预测优化非模型机器人多轴孔装配控制方法
CN109343350A (zh) 一种基于模型预测控制的水下机器人路径跟踪控制方法
CN112904728B (zh) 一种基于改进型趋近律的机械臂滑模控制轨迹跟踪方法
CN110450156B (zh) 多自由度机械臂系统自适应模糊控制器的优化设计方法
CN110850719B (zh) 一种基于强化学习的空间非合作目标参数自整定追踪方法
CN108803321A (zh) 基于深度强化学习的自主水下航行器轨迹跟踪控制方法
CN111176122B (zh) 一种基于双bp神经网络q学习技术的水下机器人参数自适应反步控制方法
CN111650832B (zh) 一种水下多足步行机器人机械足姿态跟踪控制方法
CN114047773A (zh) 一种基于扩张状态观测器的水下集矿机器人反步滑模自适应姿态控制方法
Shen et al. Dynamic surface control for tracking of unmanned surface vessel with prescribed performance and asymmetric time-varying full state constraints
CN111240345A (zh) 一种基于双bp网络增强学习框架的水下机器人轨迹跟踪方法
CN109946972A (zh) 基于在线学习模型技术的水下机器人预测控制系统及方法
CN113093526A (zh) 一种基于强化学习的无超调pid控制器参数整定方法
CN109901622A (zh) 一种基于机理模型的自主水下机器人预测s面控制方法
Gong et al. Three-dimensional optimal trajectory tracking control of underactuated AUVs with uncertain dynamics and input saturation
CN117452827A (zh) 一种欠驱动无人艇轨迹跟踪控制方法
CN112230545A (zh) 一种基于ppga自适应优化pid参数的auv航向角控制方法
CN117032209A (zh) 一种欠驱动船舶鲁棒自适应神经网络控制方法
Zhang et al. Depth control of AUV using sliding mode active disturbance rejection control
Sun et al. Cascaded UUV trajectory tracking control based on model predictive and sliding mode control
CN114706298B (zh) 一种基于预设性能的usv鲁棒无模型轨迹跟踪控制器设计方法
CN109176529A (zh) 一种空间机器人协调运动的新型自适应模糊控制方法
CN110703792B (zh) 基于增强学习的水下机器人姿态控制方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant