CN115755603A - 船舶运动模型参数智能灰箱辨识方法、船舶运动控制方法 - Google Patents

船舶运动模型参数智能灰箱辨识方法、船舶运动控制方法 Download PDF

Info

Publication number
CN115755603A
CN115755603A CN202211398481.7A CN202211398481A CN115755603A CN 115755603 A CN115755603 A CN 115755603A CN 202211398481 A CN202211398481 A CN 202211398481A CN 115755603 A CN115755603 A CN 115755603A
Authority
CN
China
Prior art keywords
ship
generator
motion
data
discriminator
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211398481.7A
Other languages
English (en)
Inventor
朱曼
张家辉
文元桥
周春辉
肖长诗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan University of Technology WUT
Sanya Science and Education Innovation Park of Wuhan University of Technology
Original Assignee
Wuhan University of Technology WUT
Sanya Science and Education Innovation Park of Wuhan University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan University of Technology WUT, Sanya Science and Education Innovation Park of Wuhan University of Technology filed Critical Wuhan University of Technology WUT
Priority to CN202211398481.7A priority Critical patent/CN115755603A/zh
Publication of CN115755603A publication Critical patent/CN115755603A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T90/00Enabling technologies or technologies with a potential or indirect contribution to GHG emissions mitigation

Landscapes

  • Feedback Control In General (AREA)

Abstract

本发明公开了一种船舶运动模型参数智能灰箱辨识方法、船舶运动控制方法,其中的辨识方法将建立的船舶操纵响应模型作为待辨识的生成器,其将随机变量输入生成器产生模拟数据;能够根据输入改变对应的船舶机理模型;一组服从高斯噪声分布的随机序列z经生成器后输出一组离散的模拟数据;判别器对模拟数据与真实数据进行判别训练,对生成器进行更新,达到参数辨识的目的。本发明中的一种船舶运动模型参数智能灰箱辨识方法,为船舶的非线性动力学模型辨识提供了有效的途径,辨识精度较高,收敛速度更快,且在较少的数据量情况下能达到更高的精度,为解决船舶这类非线性特性明显、运动状态复杂的运动辨识建模问题提供了一种有效智能新思路。

Description

船舶运动模型参数智能灰箱辨识方法、船舶运动控制方法
技术领域
本发明涉及船舶操纵运动建模技术领域,尤其涉及一种船舶运动模型参数智能灰箱辨识方法、船舶运动控制方法。
背景技术
21世纪以来,海洋在各个国家的战略布局中的地位逐渐上升,人类对海洋资源的开发和投入也逐渐增大,各个国家对海上技术的发展也逐渐重视起来。同时,计算机和信息技术的飞速发展极大地推动了国内外各种船舶与海洋工程装备的技术变革。船舶的设计和航行需要考虑船舶运动过程中的各种因素,而船舶运动是一个复杂的过程,受多变量耦合、多因素干扰、复杂流体动力学、随机不确定性等方面的共同作用,船舶运动数学模型是船舶运动仿真与控制问题的核心。
船舶自主航行控制需要尽可能准确地建立船舶操纵运动模型,传统的建立船舶运动数学模型的方法是根据(ship manoeuvring mathematical model group,MMG)模型结构或者Abkowitz模型结构,求解其中的水动力导数。求解水动力导数的方法中,经验公式估算十分快速,但是准确性依赖于所积累的数据和船型;约束模试验数据准确,但是成本太高,也存在尺度效应问题;机理建模应用耗费大量的计算资源、需要丰富的人工经验。
传统的辨识方法如最小二乘法和极大似然法等由于精度过度依赖模型和初值,逐渐被以神经网络为代表的新型辨识方法取代。近年来,扩展卡尔曼滤波器(ExtendedKalman Filter,EKF)、支持向量机(Support Vector Machine,SVM)、萤火虫算法、人工蜂群算法和多目标群智能算法等都被应用在了船舶系统辨识领域。以神经网络为代表的不依赖经典船舶数学模型结构的辨识方法要想得到准确的辨识结果,需要输入输出数据中包含船舶完整的操纵性信息;以EKF为代表的对经典船舶数学模型中的水动力导数进行辨识的方法由于已经引入了数学模型结构这一先验信息,往往需要更少的数据进行辨识,但辨识的精度十分依赖经典数学模型结构,并且存在参数漂移和动力相消的问题。
发明内容
本发明提供了一种船舶运动模型参数智能灰箱辨识方法、船舶运动控制方法,用以解决或者至少部分解决现有技术中的方法存在的参数漂移和动力相消而导致的模型参数辨识效果不佳的技术问题。
为了解决上述技术问题,本发明第一方面提供了一种船舶运动模型参数智能灰箱辨识方法,包括:
采集船舶的运动序列,运动序列包括船舶运动过程中的操纵信息;
构建生成对抗网络,生成对抗网络包括生成器和判别器,其中,将船舶操纵响应模型作为生成器,对生成器进行初始化,将卷积神经网络作为判别器,生成器用于根据输入的运动序列生成目标船舶的运动反馈信息,判别器用以判定输入数据是生成器生成的数据还是真实的船舶运动数据;
将采集到船舶的运动序列输入构建的生成对抗网络,将判别器输出的判别正确的概率作为奖励值,并通过卷积神经网络技术与策略梯度法反馈给生成器,调整生成器和判别器的损失,直到满足预设条件,保存船舶操纵响应模型的参数,实现船舶运动模型参数辨识。
在一种实施方式中,船舶操纵响应模型采用船舶二阶非线性操纵响应方程表示:
Figure BDA0003934055830000021
其中,K为船舶旋回性指数,δ为舵角,δr为压舵角,
Figure BDA0003934055830000022
为舵角的变化率,r为旋回角速度,
Figure BDA0003934055830000023
为旋回角加速度,
Figure BDA0003934055830000024
为旋回角加速度,α为非线性项系数,T1、T2和T3为时间常数。
在一种实施方式中,所述方法还包括将船舶操纵响应模型进行离散化,具体包括:将船舶二阶非线性操纵响应方程离散化为如下形式:
Figure BDA0003934055830000025
其中,y(k)为船舶k时刻艏向角的值,y(k-1)、y(k-2)分别为船舶k-1时刻艏向角的值和船舶k-2时刻艏向角的值δ(k)为船舶k时刻实际舵角,δ(k-3)、δ(k-2)分别为船舶k-3时刻、k-2时刻的实际舵角,h为步长;令
Figure BDA0003934055830000026
Figure BDA0003934055830000027
将上述离散化方程式转换成如下线性模型:
f(x,k)=y(k)-2y(k-1)+y(k-2)=A·x(k)。
在一种实施方式中,对生成器进行初始化,包括:
选用极大似然估计法对生成器进行预训练,对船舶操纵响应模型的参数进行初始化。
在一种实施方式中,判别器具体用于:
当输入数据来自船舶的真实运动数据x时,判别器的目标使得输出概率值D(x)趋近于1,
当输入数据由生成器生成时,判别器的目标为正确判断数据来源,使得输出的概率D(G(z))趋近于0,此时,输入数据为由生成器根据输入的运动序列和初始参数生成的目标船舶的运动反馈信息。
在一种实施方式中,训练过程中,判别器的损失函数为:
Figure BDA0003934055830000031
其中,Y∈Pdata表示输入数据来自船舶的真实运动数据,Y∈Gθ表示数据来自于生成器生成的数据,D(X,Y)中,D表示X,Y的取值范围,相当于(X,Y);
Figure BDA0003934055830000032
表示在输入数据来自船舶的真实运动数据样本分布的前提下,求D(X,Y)的对数的方差,
Figure BDA0003934055830000033
表示在输入数据来自生成器生成的数据样本分布的前提下,求1-D(X,Y)的对数方差。
在一种实施方式中,训练过程中,将判别器输出的判别正确的概率作为奖励值,并通过卷积神经网络技术与策略梯度法反馈给生成器,生成器的目标函数表示为:
Figure BDA0003934055830000034
其中,X为船舶状态,(Y1:t,X)=(y1,…,yt,X)为当前yt时刻的船舶状态,Y1:T-1=y1;y2;…yT,表示生成器从1到T-1时间段所产生的船舶目标序列,θG为生成器G的损失量,
Figure BDA0003934055830000035
为判别器D产生的奖励,
Figure BDA0003934055830000036
为动作值函数,判别器在状态(Y1:T-1,X)时,依据策略Gθ,采取动作yT所产生的积累奖励为估算动作值函数,将判别器所判别正确的概率作为奖励值
Figure BDA0003934055830000037
Figure BDA0003934055830000038
其中,b(X,Y1:T)表示用于减少奖励值方差的基准值,D(X,Y1:T)表示(X,Y1:T)的取值范围,中间状态的动作值函数,采用基于策略G的蒙特卡洛搜索策略得到,其中,N次蒙特卡洛搜索策略可以表示为:
Figure BDA0003934055830000039
其中,(Y1:t,X)=(y1,…,yt,X),表示当前船舶的状态,
Figure BDA00039340558300000310
为基于策略G取样的船舶运动数据序列,下标TN为蒙特卡洛搜索的船舶运动数据序列样本长度。
在一种实施方式中,判别器根据所采样的N个运动序列得出N个奖励值,中间状态的最终奖励值为N个奖励值的平均值,动作值函数分为两种情况,表示如下:
Figure BDA0003934055830000041
根据奖励值更新判别器后,交替更新生成器,依据生成器的目标函数,对其进行梯度求解计算出船舶生成器的参数:
Figure BDA0003934055830000042
Figure BDA0003934055830000043
为梯度符号,函数在该点处的方向导数沿着该方向取得最大值,即函数在该点处沿着该方向变化最快;t表示当前状态的时间;T′表示总时间;Gθ(yt|Y1:t-1,X)表示策略Gθ下的yt在(Y1:t-1,X)集合中的解;p(yt|Y1:t-1,X)表示yt的解为(Y1:t-1,X)集合内的概率。
基于同样的发明构思,本发明第二方面提供了一种船舶运动控制方法,基于第一方面所述的船舶运动模型参数智能灰箱辨识方法实现,所述方法包括:利用参辨识后的船舶操纵响应模型根据输入的船舶操作信息生成对应的运动反馈信息,以对船舶运动进行控制。
相对于现有技术,本发明的优点和有益的技术效果如下:
本发明提出了船舶运动模型参数智能灰箱辨识方法,主要包括数据采集、模型构建和模型训练三个步骤,其中采集船舶的运动序列作为训练数据对生成对抗网络进行训练,生成对抗网络中,船舶操纵响应模型作为生成器,卷积神经网络作为判别器,生成器能够根据输入的运动序列生成目标船舶的运动反馈信息,判别器用以判定输入数据是生成器生成的数据还是真实的船舶运动数据;将采集到船舶的运动序列输入构建的生成对抗网络对其进行训练,将判别器输出的判别正确的概率作为奖励值,并通过卷积神经网络技术与策略梯度法反馈给生成器,并调整生成器和判别器的损失,直到满足预设条件,保存船舶操纵响应模型的参数,实现船舶运动模型参数辨识。由于使用了神经网络中的生成式对抗网络模型算法,其具有良好的非线性函数逼近能力,为船舶的非线性动力学模型辨识提供了有效的途径,辨识精度较高,收敛速度更快,且在较少的数据量情况下能达到更高的精度;对船舶运动模型的数据离散等特点,本发明设计了应用含策略梯度反馈的生成式对抗网络技术改进模型进行参数辨识,解决了船舶运动模型中输出序列离散的问题,提升了模型参数辨识的效果(降低了误差,使得输出序列质量更高等)。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种船舶运动模型参数智能灰箱辨识方法的整体流程示意图;
图2是本发明实施例提供的生成式对抗网络模型结构。
图3为本发明实施例提供的改进的生成式对抗网络的训练算法的伪代码图。
图4为本发明实施例提供的船舶运动模型参数智能灰箱辨识方法具体实现流程图。
具体实施方式
本发明适用于船舶操纵运动建模技术领域,提供了一种船舶运动模型参数智能灰箱辨识方法,将建立的船舶操纵响应模型作为待辨识的生成器,将随机变量(采集的船舶操纵信息)输入生成器产生模拟数据(反馈信息),即一组服从高斯噪声分布的随机序列z经生成器后输出一组离散的模拟数据,训练过程中,根据输入的运动序列调整生成器的参数:即改变船舶操纵响应模型;判别器对模拟数据与真实数据进行判别训练,对生成器进行更新,达到参数辨识的目的。本发明中的一种船舶运动模型参数智能灰箱辨识方法,为船舶的非线性动力学模型辨识提供了有效的途径,辨识精度较高,收敛速度更快,且在较少的数据量情况下能达到更高的精度,为解决船舶这类非线性特性明显、运动状态复杂的运动辨识建模问题提供了一种有效智能新思路。
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一
本发明实施例提供了一种船舶运动模型参数智能灰箱辨识方法,包括:
采集船舶的运动序列,运动序列包括船舶运动过程中的操纵信息;
构建生成对抗网络,生成对抗网络包括生成器和判别器,其中,将船舶操纵响应模型作为生成器,对生成器进行初始化,将卷积神经网络作为判别器,生成器用于根据输入的运动序列生成目标船舶的运动反馈信息,判别器用以判定输入数据是生成器生成的数据还是真实的船舶运动数据;
将采集到船舶的运动序列输入构建的生成对抗网络,将判别器输出的判别正确的概率作为奖励值,并通过卷积神经网络技术与策略梯度法反馈给生成器,调整生成器和判别器的损失,直到满足预设条件,保存船舶操纵响应模型的参数,实现船舶运动模型参数辨识。
请参见图1,是本发明实施例提供的一种船舶运动模型参数智能灰箱辨识方法的整体流程示意图。请参见图2,是本发明实施例提供的生成式对抗网络模型结构。
具体实施过程中,输入船舶操纵响应模型的运动序列为一组随机变量,通过该模型后,生成一组离散的模拟数据G(z),即目标船舶的运动反馈信息。判别器则根据输入数据输出数据来源的概率。
在一种实施方式中,船舶操纵响应模型采用船舶二阶非线性操纵响应方程表示:
Figure BDA0003934055830000061
其中,K为船舶旋回性指数,δ为舵角,δr为压舵角,
Figure BDA0003934055830000062
为舵角的变化率,r为旋回角速度,
Figure BDA0003934055830000063
为旋回角加速度,
Figure BDA0003934055830000064
为旋回角加速度,α为非线性项系数,T1、T2和T3为时间常数。
具体来说,为反映船舶运动对舵角变化的响应,设定船舶二阶非线性操纵响应方程。时间常数T1、T2和T3会随着船舶的运动而改变。
在一种实施方式中,所述方法还包括将船舶操纵响应模型进行离散化,具体包括:将船舶二阶非线性操纵响应方程离散化为如下形式:
Figure BDA0003934055830000065
其中,y(k)为船舶k时刻艏向角的值,y(k-1)、y(k-2)分别为船舶k-1时刻艏向角的值和船舶k-2时刻艏向角的值,δ(k)为船舶k时刻实际舵角,δ(k-3)、δ(k-2)分别为船舶k-3时刻、k-2时刻的实际舵角,h为步长;
T为船舶追随性指数,表征转首对操舵响应的快慢;T=T1+T2-T3;K为船舶旋回性指数,表征船舶回转性能的好坏;需要辨识的参数主要包括K和T。
Figure BDA0003934055830000066
Figure BDA0003934055830000067
将上述离散化方程式转换成如下线性模型:
f(x,k)=y(k)-2y(k-1)+y(k-2)=A·x(k)。
在一种实施方式中,对生成器进行初始化,包括:
选用极大似然估计法对生成器进行预训练,对船舶操纵响应模型的参数进行初始化。
具体来说,生成器模型通过前述的离散化和转换操,变成基于船舶运动模型特征的可微分方程组,生成器在初始化阶段,由于缺少判别器的训练,选用极大似然估计法预训练生成器模型,对船舶操纵响应模型的参数进行初始化,在判别器对其进行训练时,生成器根据判别器的奖励函数对其系统参数策略调参,使自身损失函数Obj(θG)最大化。
在一种实施方式中,判别器具体用于:
当输入数据来自船舶的真实运动数据x时,判别器的目标使得输出概率值D(x)趋近于1,
当输入数据由生成器生成时,判别器的目标为正确判断数据来源,使得输出的概率D(G(z))趋近于0,此时,输入数据为由生成器根据输入的运动序列和初始参数生成的目标船舶的运动反馈信息。
运动序列具体是指连续时间上对船舶进行一系列操纵而产生的运动特征,比如速度、舵角、方位角等指标的变化。
具体地,训练过程中,判别器通过最小化判别器的损失函数优化自身判别能力,输出一个对当前输入是船舶真实数据还是模拟数据的判别概率。输入的运动序列可以用x1;x2;…xT表示,分别表示从时刻1到时刻T的运动操纵信息,输出的反馈信息可以用y1;y2;…yT表示,表示时刻1到时刻T的运动控制信息。
在一种实施方式中,训练过程中,判别器的损失函数为:
Figure BDA0003934055830000071
其中,Y∈Pdata表示输入数据来自船舶的真实运动数据,Y∈Gθ表示数据来自于生成器生成的数据,D(X,Y)中,D表示X,Y的取值范围,相当于(X,Y);
Figure BDA0003934055830000072
表示在输入数据来自船舶的真实运动数据样本分布的前提下,求D(X,Y)的对数的方差;
Figure BDA0003934055830000073
表示在输入数据来自生成器生成的数据样本分布的前提下,求1-D(X,Y)的对数方差。
具体来说,判别器作为一个二分类器,在船舶运动过程中,输出信息的状态变量只与上一时刻状态变量有关,这种短期依赖问题在生成器D建模过程中根据爬坡约束进行限制,选用卷积神经网络构建判别器模型,通过最小化判别器损失函数以得到最优解。
在一种实施方式中,训练过程中,将判别器输出的判别正确的概率作为奖励值,并通过卷积神经网络技术与策略梯度法反馈给生成器,生成器的目标函数表示为:
Figure BDA0003934055830000081
其中,X为船舶状态,(Y1:t,X)=(y1,…,yt,X)为当前yt时刻的船舶状态,Y1:T-1=y1;y2;…yT,表示生成器从1到T-1时间段所产生的船舶目标序列,θG为生成器G的损失量,
Figure BDA0003934055830000082
为判别器D产生的奖励,
Figure BDA0003934055830000083
为动作值函数,判别器在状态(Y1:T-1,X)时,依据策略Gθ,采取动作yT所产生的积累奖励为估算动作值函数,将判别器所判别正确的概率作为奖励值
Figure BDA0003934055830000084
Figure BDA0003934055830000085
其中,b(X,Y1:T)表示用于减少奖励值方差的基准值,D(X,Y1:T)表示(X,Y1:T)的取值范围,中间状态的动作值函数,采用基于策略G的蒙特卡洛搜索策略得到,其中,N次蒙特卡洛搜索策略可以表示为:
Figure BDA0003934055830000086
其中,(Y1:t,X)=(y1,…,yt,X),表示当前船舶的状态,
Figure BDA0003934055830000087
为基于策略G取样的船舶运动数据序列,下标TN为蒙特卡洛搜索的船舶运动数据序列样本长度。
请参见图3,为本发明实施例提供的改进的生成式对抗网络的训练算法的伪代码图。请参见图4,为本发明实施例提供的船舶运动模型参数智能灰箱辨识方法具体实现流程图。
具体来说,通过生成器产生基于船舶数据的目标运动数据分布,并根据判别器判别数据分布来自真实运动数据还是生成器生成数据,通过卷积神经网络技术与策略梯度法相结合,将判别器的输出结果作为策略梯度的奖励对生成器进行反馈训练,得到训练好的生成对抗网络,其中包括训练好的生成器,即为参数辨识后的船舶操纵响应模型。
由于判别器仅能得到一个完成的船舶运动数据序列的奖励值,在不完全序列中,D(X,Y1:T)无法获得,为估算中间状态的动作值函数,采用基于策略G的蒙特卡洛搜索策略,采样剩余未知的序列,从而近似动作值函数,而N次蒙特卡洛搜索策略可以表示为:
在一种实施方式中,判别器根据所采样的N个运动序列得出N个奖励值,中间状态的最终奖励值为N个奖励值的平均值,动作值函数分为两种情况,表示如下:
Figure BDA0003934055830000088
根据奖励值更新判别器后,交替更新生成器,依据生成器的目标函数,对其进行梯度求解计算出船舶生成器的参数:
Figure BDA0003934055830000091
Figure BDA0003934055830000092
为梯度符号,函数在该点处的方向导数沿着该方向取得最大值,即函数在该点处沿着该方向变化最快;t表示当前状态的时间;T′表示总时间;Gθ(yt|Y1:t-1,X)表示策略Gθ下的yt在(Y1:t-1,X)集合中的解;p(yt|Y1:t-1,X)表示yt的解为(Y1:t-1,X)集合内的概率。
以下结合具体实施例对本发明的具体实现进行详细描述。
如图1至3所示,作为本发明一个实施例提供的一种船舶运动模型参数智能灰箱辨识方法,包括生成式对抗网络,所述生成式对抗网络的训练方式包括生成器和判别器,具体方法步骤如下:
步骤一、建立的船舶操纵响应模型作为待辨识的生成器;
步骤二、一组服从高斯噪声分布的随机序列z经生成器后输出一组离散的模拟数据G(z);
步骤三、判别器对模拟数据G(z)与真实数据x进行判别训练,将其判别准确率作为奖励值,并通过卷积神经网络技术与策略梯度法反馈回生成器,对生成器序列的梯度进行更新,达到参数辨识的目的。
在本实施例中,本发明为船舶的非线性动力学模型辨识提供了有效的途径,辨识精度较高,收敛速度更快,且在较少的数据量情况下能达到更高的精度,解决了船舶运动模型中输出序列离散的问题,从算法的提出、构造到效果验证均给出了完整的理论证明,提供了理论支撑,并且具有较强的泛化能力,基于其辨识结果开展的多种操纵运动实验均能很好地拟合真实的艏向角变化。
作为本发明一个实施例提供的一种船舶运动模型参数智能灰箱辨识方法,包括生成式对抗网络,生成式对抗网络是一种深度学习模型,是近年来复杂分布上无监督学习最具前景的方法之一,模型通过框架中两个模块:生成器和判别器的互相博弈学习产生与真实样本相同分布特性的输出;其中生成器的主要作用是产生与真实数据相似的值,模拟现实环境;而判别器的主要目标旨在尽量正确地判别输入数据的来源,训练生成器模拟数据分布的能力,由此两者通过零和博弈实现学习优化过程,最终达到一个纳什均衡。
以国际标准船模“Mariner”为仿真实验对象,其初始航速为15节,设置舵角饱和限制为40°,舵角速率限制为2.5°/s,具体方法步骤如下:
步骤一、建立“Mariner”船舶操纵响应模型,在操纵船舶运动过程中,最直观的表现参数为船舶的艏向角和角速度;
步骤二、由于实际采集数据为离散数据,故在辨识前需要将模型进行离散化。首先,将
Figure BDA0003934055830000101
代入得:
Figure BDA0003934055830000102
上式中,ψ(k)ψ(k)和δ(k)δ(k)分别为k时刻的“Mariner”船舶的艏向角和实际舵角;
步骤三、上述为连续微分方程,使用差商代替微商进行前向差分,可以得到如下的离散式:
Figure BDA0003934055830000103
Figure BDA0003934055830000104
步骤四、收集“Mariner”船舶响应模型的数据分布的观测序列,得到需辨识的数据序列S={S1:T},其中S为不同类型的运动参数,T为观测的时间:
Figure BDA0003934055830000105
步骤五、初始化生成器模型Gθ和判别器模型Dθ,生成器的模型为根据机理模型所建立的基于“Mariner”船舶运动模型特征的可微分方程组,生成器在初始化阶段,选用极大似然估计法预训练生成器模型,从而初始化船舶系统参数。
Figure BDA0003934055830000106
步骤六、基于采取的数据序列S,用极大似然估计法预训练“Mariner”船舶的生成器模型Gθ,计算判别器在状态(Y1:T-1,S)时,依照策略Gθ,采取动作yT所产生的积累奖励:
Figure BDA0003934055830000107
步骤七、根据当前“Mariner”船舶生成器模型产生可用于训练的反馈;
步骤八、基于给定的“Mariner”船舶生成器,以最小化损失函数预训练判别器,同时采用基于策略G的蒙特卡洛搜索策略采样剩余未知的序列,从而近似动作值函数:
Figure BDA0003934055830000111
步骤九、进入“Mariner”船舶生成器训练过程;
步骤十、生成“Mariner”船舶生成器序列Y1:T=(y1,···,yT);
步骤十一、计算t从1到T阶段的奖励函数Q(a=yt;s=Y1:t-1),确定“Mariner”船舶模型的最终结构:
Figure BDA0003934055830000112
且模型数据满足下式:
f(x,k)=y(k)-2y(k-1)+y(k-2)=A·x(k);
f(x,k)=y(k)-2y(k-1)+y(k-2)=A·x(k)
步骤十二、通过策略梯度算法更新“Mariner”船舶生成器的参数θ:
Figure BDA0003934055830000113
步骤十三、进入“Mariner”船舶判别器训练过程。用当前的生成器模型产生模拟数据与所给的真实样本结合来训练判别器模型,输出判别器参数
Figure BDA0003934055830000114
步骤十四、重复步骤七至步骤十一,对“Mariner”船舶的生成器和判别器进行交替训练,直至辨识的船舶运动参数结果收敛,达到预期目标条件结束,完成辨识的循环过程。
与现有技术相比,本发明的有益效果是:
首先,推导了船舶的操纵运动模型,并且进行相应的仿真数值数据采取,确定了需辨识的模型,对所建立的辨识模型进行简化,以便进行后续的参数辨识设计;然后,确定了生成式对抗网络最优函数的形式,并在此基础上增加了策略梯度算法,便于对离散的数据进行处理;最后,根据辨识结果进行船舶Zig-Zag仿真实验以及旋回仿真实验,结果验证了本发明所提出的改进生成式对抗网络辨识算法的可靠性、准确性和优越性。
本发明使用了神经网络中的生成式对抗网络模型算法,其具有良好的非线性函数逼近能力,为船舶的非线性动力学模型辨识提供了有效的途径,辨识精度较高,收敛速度更快,且在较少的数据量情况下能达到更高的精度;
针对船舶运动模型的数据离散等特点,本发明设计了应用含策略梯度反馈的生成式对抗网络技术改进模型进行参数辨识,解决了船舶运动模型中输出序列离散的问题;
本发明的改进型生成式对抗网络辨识算法的理论基础,从算法的提出、构造到效果验证均给出了完整的理论证明,提供了理论支撑,并且具有较强的泛化能力,基于其辨识结果开展的多种操纵运动实验均能很好地拟合真实的艏向角变化。
实施例二
基于同样的发明构思,本实施例提供了一种船舶运动控制方法,基于实施例一所述的船舶运动模型参数智能灰箱辨识方法实现,所述方法包括:利用参辨识后的船舶操纵响应模型根据输入的船舶操作信息生成对应的运动反馈信息,以对船舶运动进行控制。
由于本发明实施例二所介绍的船舶运动控制方法为基于实施例一种的模型而实施的运动控制方法,故而基于本发明实施例一所介绍的方法,本领域所属人员能够了解该方法的具体实施方式,故而在此不再赘述。凡是基于本发明实施例一中的模型进行运动控制的方法都属于本发明所欲保护的范围。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明实施例进行各种改动和变型而不脱离本发明实施例的精神和范围。这样,倘若本发明实施例的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (9)

1.船舶运动模型参数智能灰箱辨识方法,其特征在于,包括:
采集船舶的运动序列,运动序列包括船舶运动过程中的操纵信息;
构建生成对抗网络,生成对抗网络包括生成器和判别器,其中,将船舶操纵响应模型作为生成器,对生成器进行初始化,将卷积神经网络作为判别器,生成器用于根据输入的运动序列生成目标船舶的运动反馈信息,判别器用以判定输入数据是生成器生成的数据还是真实的船舶运动数据;
将采集到船舶的运动序列输入构建的生成对抗网络,将判别器输出的判别正确的概率作为奖励值,并通过卷积神经网络技术与策略梯度法反馈给生成器,调整生成器和判别器的损失,直到满足预设条件,保存船舶操纵响应模型的参数,实现船舶运动模型参数辨识。
2.如权利要求1所述的船舶运动模型参数智能灰箱辨识方法,其特征在于,船舶操纵响应模型采用船舶二阶非线性操纵响应方程表示:
Figure FDA0003934055820000011
其中,K为船舶旋回性指数,δ为舵角,δr为压舵角,
Figure FDA0003934055820000012
为舵角的变化率,r为旋回角速度,
Figure FDA0003934055820000013
为旋回角加速度,
Figure FDA0003934055820000014
为旋回角加速度,α为非线性项系数,T1、T2和T3为时间常数。
3.如权利要求2所述的船舶运动模型参数智能灰箱辨识方法,其特征在于,所述方法还包括将船舶操纵响应模型进行离散化,具体包括:将船舶二阶非线性操纵响应方程离散化为如下形式:
Figure FDA0003934055820000015
其中,y(k)为船舶k时刻艏向角的值,y(k-1)、y(k-2)分别为船舶k-1时刻艏向角的值和船舶k-2时刻艏向角的值δ(k)为船舶k时刻实际舵角,δ(k-3)、δ(k-2)分别为船舶k-3时刻、k-2时刻的实际舵角,h为步长;令
Figure FDA0003934055820000016
Figure FDA0003934055820000017
将上述离散化方程式转换成如下线性模型:
f(x,k)=y(k)-2y(k-1)+y(k-2)=A·x(k)。
4.如权利要求1所述的船舶运动模型参数智能灰箱辨识方法,其特征在于,对生成器进行初始化,包括:
选用极大似然估计法对生成器进行预训练,对船舶操纵响应模型的参数进行初始化。
5.如权利要求1所述的船舶运动模型参数智能灰箱辨识方法,其特征在于,判别器具体用于:
当输入数据来自船舶的真实运动数据x时,判别器的目标使得输出概率值D(x)趋近于1,
当输入数据由生成器生成时,判别器的目标为正确判断数据来源,使得输出的概率D(G(z))趋近于0,此时,输入数据为由生成器根据输入的运动序列和初始参数生成的目标船舶的运动反馈信息。
6.如权利要求1所述的船舶运动模型参数智能灰箱辨识方法,其特征在于,训练过程中,判别器的损失函数为:
Figure FDA0003934055820000021
其中,Y∈Pdata表示输入数据来自船舶的真实运动数据,Y∈Gθ表示数据来自于生成器生成的数据,D(X,Y)中,D表示X,Y的取值范围,相当于(X,Y);
Figure FDA0003934055820000022
表示在输入数据来自船舶的真实运动数据样本分布的前提下,求D(X,Y)的对数的方差,
Figure FDA0003934055820000023
表示在输入数据来自生成器生成的数据样本分布的前提下,求1-D(X,Y)的对数方差。
7.如权利要求1所述的船舶运动模型参数智能灰箱辨识方法,其特征在于,训练过程中,将判别器输出的判别正确的概率作为奖励值,并通过卷积神经网络技术与策略梯度法反馈给生成器,生成器的目标函数表示为:
Figure FDA0003934055820000024
其中,X为船舶状态,(Y1:t,X)=(y1,…,yt,X)为当前yt时刻的船舶状态,Y1:T-1=y1;y2;…yT,表示生成器从1到T-1时间段所产生的船舶目标序列,θG为生成器G的损失量,
Figure FDA0003934055820000025
为判别器D产生的奖励,
Figure FDA0003934055820000026
为动作值函数,判别器在状态(Y1:T-1,X)时,依据策略Gθ,采取动作yT所产生的积累奖励为估算动作值函数,将判别器所判别正确的概率作为奖励值
Figure FDA0003934055820000027
Figure FDA0003934055820000028
其中,b(X,Y1:T)表示用于减少奖励值方差的基准值,D(X,Y1:T)表示(X,Y1:T)的取值范围,中间状态的动作值函数,采用基于策略G的蒙特卡洛搜索策略得到,其中,N次蒙特卡洛搜索策略可以表示为:
Figure FDA0003934055820000031
其中,(Y1:t,X)=(y1,…,yt,X),表示当前船舶的状态,
Figure FDA0003934055820000032
为基于策略G取样的船舶运动数据序列,下标TN为蒙特卡洛搜索的船舶运动数据序列样本长度。
8.如权利要求7所述的船舶运动模型参数智能灰箱辨识方法,其特征在于,判别器根据所采样的N个运动序列得出N个奖励值,中间状态的最终奖励值为N个奖励值的平均值,动作值函数分为两种情况,表示如下:
Figure FDA0003934055820000033
根据奖励值更新判别器后,交替更新生成器,依据生成器的目标函数,对其进行梯度求解计算出船舶生成器的参数:
Figure FDA0003934055820000034
Figure FDA0003934055820000035
为梯度符号,函数在该点处的方向导数沿着该方向取得最大值,即函数在该点处沿着该方向变化最快;t表示当前状态的时间;T′表示总时间;Gθ(yt|Y1:t-1,X)表示策略Gθ下的yt在(Y1:t-1,X)集合中的解;p(yt|Y1:t-1,X)表示yt的解为(Y1:t-1,X)集合内的概率。
9.一种船舶运动控制方法,其特征在于,基于如权利要求1至8任一项所述的船舶运动模型参数智能灰箱辨识方法实现,所述方法包括:利用参辨识后的船舶操纵响应模型根据输入的船舶操作信息生成对应的运动反馈信息,以对船舶运动进行控制。
CN202211398481.7A 2022-11-09 2022-11-09 船舶运动模型参数智能灰箱辨识方法、船舶运动控制方法 Pending CN115755603A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211398481.7A CN115755603A (zh) 2022-11-09 2022-11-09 船舶运动模型参数智能灰箱辨识方法、船舶运动控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211398481.7A CN115755603A (zh) 2022-11-09 2022-11-09 船舶运动模型参数智能灰箱辨识方法、船舶运动控制方法

Publications (1)

Publication Number Publication Date
CN115755603A true CN115755603A (zh) 2023-03-07

Family

ID=85368520

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211398481.7A Pending CN115755603A (zh) 2022-11-09 2022-11-09 船舶运动模型参数智能灰箱辨识方法、船舶运动控制方法

Country Status (1)

Country Link
CN (1) CN115755603A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117195567A (zh) * 2023-09-14 2023-12-08 中国船舶集团有限公司第七零七研究所九江分部 面向操纵运动的船舶多变量操纵响应模型的参数辨识方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117195567A (zh) * 2023-09-14 2023-12-08 中国船舶集团有限公司第七零七研究所九江分部 面向操纵运动的船舶多变量操纵响应模型的参数辨识方法
CN117195567B (zh) * 2023-09-14 2024-03-26 中国船舶集团有限公司第七零七研究所九江分部 船舶多变量响应模型构建及面向操纵运动的参数辨识方法

Similar Documents

Publication Publication Date Title
CN108803321B (zh) 基于深度强化学习的自主水下航行器轨迹跟踪控制方法
CN107255923A (zh) 基于rbf辨识的ica‑cmac神经网络的欠驱动无人艇航迹跟踪控制方法
CN106338919B (zh) 基于增强学习型智能算法的无人艇航迹跟踪控制方法
CN110909859A (zh) 基于对抗结构化控制的仿生机器鱼运动控制方法、系统
CN110658814B (zh) 一种应用于船舶运动控制的自适应船舶运动建模方法
CN101833338A (zh) 无人潜航器垂直面欠驱动运动控制方法
CN113359448A (zh) 一种针对时变动力学的自主水下航行器轨迹跟踪控制方法
CN112182972B (zh) 一种船舶操纵运动adam局部加权回归辨识建模方法
CN115016496A (zh) 基于深度强化学习的水面无人艇路径跟踪方法
CN107065575A (zh) 基于人工蜂群算法的无人艇航向控制模型的参数辨识方法
CN111079936A (zh) 基于强化学习的波动鳍推进水下作业机器人追踪控制方法
CN114199248B (zh) 一种基于混合元启发算法优化anfis的auv协同定位方法
CN114859910A (zh) 基于深度强化学习的无人船路径跟随系统及方法
CN109145451A (zh) 一种高速滑翔飞行器的运动行为识别与航迹估计方法
CN114357872A (zh) 一种基于stacking模型融合的船舶运动黑箱辨识建模与运动预测方法
CN115755603A (zh) 船舶运动模型参数智能灰箱辨识方法、船舶运动控制方法
CN107315348B (zh) 一种基于惩罚式小波网络的无人潜航器位姿控制方法
CN101251868A (zh) 水下潜器运动机理模型与递归神经网络并行建模方法
CN115033022A (zh) 面向移动平台基于专家经验的ddpg无人机降落方法
CN114819068A (zh) 一种混合型目标航迹预测方法及系统
CN112348223A (zh) 一种基于深度学习的导弹飞行轨迹预测方法
Meng et al. A Fully-Autonomous Framework of Unmanned Surface Vehicles in Maritime Environments Using Gaussian Process Motion Planning
Song et al. A local-and-global attention reinforcement learning algorithm for multiagent cooperative navigation
Wang et al. Data-driven path-following control of underactuated ships based on antenna mutation beetle swarm predictive reinforcement learning
CN114528638A (zh) 基于强化学习的船舶运动大多步实时预测混合方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination