CN116859924A - 面向目标围捕的模糊优先级零空间行为融合编队方法 - Google Patents

面向目标围捕的模糊优先级零空间行为融合编队方法 Download PDF

Info

Publication number
CN116859924A
CN116859924A CN202310823152.0A CN202310823152A CN116859924A CN 116859924 A CN116859924 A CN 116859924A CN 202310823152 A CN202310823152 A CN 202310823152A CN 116859924 A CN116859924 A CN 116859924A
Authority
CN
China
Prior art keywords
behavior
formation
unmanned
target
priority
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310823152.0A
Other languages
English (en)
Inventor
廖煜雷
陈聪聪
李浩瀚
唐小雨
孙加起
马腾
李晔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harbin Engineering University
Original Assignee
Harbin Engineering University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harbin Engineering University filed Critical Harbin Engineering University
Priority to CN202310823152.0A priority Critical patent/CN116859924A/zh
Publication of CN116859924A publication Critical patent/CN116859924A/zh
Pending legal-status Critical Current

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T90/00Enabling technologies or technologies with a potential or indirect contribution to GHG emissions mitigation

Landscapes

  • Control Of Position, Course, Altitude, Or Attitude Of Moving Bodies (AREA)

Abstract

面向目标围捕的模糊优先级零空间行为融合编队方法,属于多机器人编队控制领域。本发明解决了现有目标围捕的编队控制方法中行为的优先级一般设置成固定的方式,而行为的优先级划分难度大,强行划分导致任务的执行效率低的问题。本发明设计三个行为,首先获得当前时刻无人艇、障碍物与目标物的位置信息,进行误差计算得到三个行为的系数后,归一化至模糊论域,模糊推理得到当前时刻总行为优先级权重,根据当前时刻总行为优先级权重确定下一时刻各行为优先级。三个行为按当前行为的优先级进行融合得到当前时刻多艘无人艇的速度矢量矩阵,进行解算得到下一时刻各无人艇的期望速度与期望航向,对相应的无人艇的航速和航向进行控制。用于海上目标围捕。

Description

面向目标围捕的模糊优先级零空间行为融合编队方法
技术领域
本发明属于多机器人编队控制领域。
背景技术
海洋环境复杂多变,依靠单艘无人艇(海上机器人)难以完成海上多样化的任务,多无人艇协同完成任务是解决此问题的重要途经,因此,多无人艇协同控制得到高度重视和广泛研究。多海上机器人协同控制或编队控制,是指多个机器人在到达目的地的过程中,保持某种队形,同时又要适应环境约束(例如存在障碍物和空间的物理限制等)的控制技术。多机器人编队控制问题是一个典型性和通用性的多机器人协调问题,是多机器人协调问题的基础,是多机器人系统中最重要也是最基本的问题,值得深入细致的研究。
为解决多机器人编队问题,常采用两种思想:集中式编队控制、分布式编队控制。相比于集中式方法,分布式因其可靠性高、开放性强、灵活性强,而成为对机器人集群编队的研究热点。零空间行为融合为分布式编队控制的一种典型应用。
专利号:CN 108829113 A,名称为“一种多机器人编队自适应零空间行为融合方法”,提供一种多机器人的编队控制方法,该方法根据机器人在运动过程中反馈得到的运动信息,解算得到增益系数,融合运动行为步骤,得到最终的速度和方向。求解出来的速度不受概况环境的改变而改变,具有很好的自适应性。但是该方法中各个行为的优先级是固定的,当在一个时刻达到或者基本达到最高优先级行为的期望时,优先级不变就会导致低优先级行为达到期望的速度很缓慢,不利于低优先级行为的执行。
专利号:CN 115248599 B,名称为“一种变优先级的多机器人零空间行为融合编队方法”,提出了一种基于变优先级零空间行为融合算法的多机器人编队方法,设计了四个行为,通过给行为设置容错区间,根据多机器人系统是否在行为容错区间之内来更新行为的优先级,能够在保证高优先级行为完成的同时,提高低优先级行为的执行效率。但是该方法行为优先级变化规则很简单,行为优先级的变化频率较快,导致无人艇的编队会出现较大的振荡,不利已围捕任务的执行。
综上所述,目前的零空间行为融合编队方法的应用基本都是把行为的优先级设置成固定的,这就导致低优先级行为执行的很缓慢。在一些任务中行为的优先级很难划分,强行划分成固定的优先级会降低任务的执行效率。
发明内容
本发明目的是为了解决现有目标围捕的编队控制方法中行为的优先级一般设置成固定的方式,而行为的优先级划分难度大,强行划分导致任务的执行效率低的问题,本发明提供了一种面向目标围捕的模糊优先级零空间行为融合编队方法。
面向目标围捕的模糊优先级零空间行为融合编队方法,该方法包括:
根据目标围捕任务采用零空间行为融合方法设计三个行为,行为1至3分别是:趋向目标行为、环境避障行为和队形保持行为;
根据当前时刻多艘无人艇位姿信息、障碍物位置和目标位置进行误差计算,确定多艘无人艇的趋向目标行为系数d1′、多艘无人艇的环境避障行为系数d2′和多艘无人艇的队形保持行为系数d3′;
通过3个量化因子分别对d1′、d2′和d3′进行归一化化处理,得到的d1至d3作为模糊优先级处理模型的输入,通过模糊优先级处理模型预测出当前时刻总行为优先级权重Pw;其中,d1至d3分别为d1′至d3′归一化后的值;
通过当前时刻总行为优先级权重Pw确定下一时刻三个行为的优先级,并按下一时刻三个行为的优先级通过零空间行为融合方法进行行为融合,得到该时刻多艘无人艇的速度矢量矩阵v,对多艘无人艇的速度矢量矩阵v进行解算得到编队中各艘无人艇的期望速度vd与期望航向ψd,并对其相应的无人艇的航速和航向进行控制。
作为优选,确定多艘无人艇的趋向目标行为系数d1′的实现方式包括:
根据编队中所有无人艇位置信息,确定编队的队形中心的实时坐标pc,再根据pc和pt计算
其中,xc为队形中心的横坐标,yc为队形中心的纵坐标,pc=[xc yc]T,pt为目标位置,pt=[xt yt]T,xt为目标位置的横坐标,yt为目标位置的纵坐标。
作为优选,确定多艘无人艇的环境避障行为系数d2′的实现方式包括:
根据编队中所有无人艇位置信息和障碍物位置,确定各无人艇距离障碍物的距离dio,并根据所有无人艇距离障碍物的距离,得到d′2=f′(d1o,d2o,…,dno);
dio为第i艘无人艇与障碍物间距离,i=1,2,……n,f′(d1o,d2o,…,dno)为各无人艇与障碍物间距离的函数。
作为优选,确定多艘无人艇的队形保持行为系数d3′的实现方式包括:
根据编队中所有无人艇位置信息,得到编队的队形中心的实时坐标pc,根据pc计算各无人艇与队形中心间的距离div,再根据div计算d′3=f″(d1v,d2v,…,dnv);
div为第i艘无人艇与队形中心之间的距离,i=1,2,……n,pc=[xc yc]T,xc为队形中心的横坐标,yc为队形中心的纵坐标,f″(d1v,d2v,…,dnv)为各无人艇与队形中心之间距离的函数。
作为优选,
其中,和/>分别代表第j条规则中d1至d3分别对应的隶属度值,ωj为第j条规则的权重,sj为第j条规则的输出,j=1,2,……m。
作为优选,当前时刻总行为优先级权重Pw与下一时刻三个行为的优先级间关系为:
其中,Pa、Pb、Pc分别为趋向目标行为、环境避障行为和队形保持行为的优先级。
作为优选,当前时刻总行为优先级权重Pw与下一时刻多艘无人艇的速度矢量矩阵v间的对应关系为:
其中,va、vb和vc分别为趋向目标行为、环境避障行为和队形保持行为的数学模型,I为单位矩阵,为Ja的广义逆矩阵,Ja为趋向目标行为的雅可比矩阵,/>为Jb的广义逆矩阵,Jb为环境避障行为的雅可比矩阵,/>为Jc的广义逆矩阵,Jc为队形保持行为的雅可比矩阵。
作为优选,趋向目标行为的数学模型va为:
其中,为趋向目标行为的雅可比矩阵Ja的广义逆矩阵,Λa为趋向目标行为的增益系数矩阵,pei为第i艘无人艇的期望位置,pei=[xei yei]T,xei为第i艘无人艇期望位置的横坐标,yei为第i艘无人艇期望位置的纵坐标,pi为第i艘无人艇实时坐标,pi=[xi yi]T,xi为第i艘无人艇的实时横坐标,yi为第i艘无人艇的实时纵坐标,i=1,2,……n,Die为第i艘无人艇实时位置和期望位置之间的距离,vmax为无人艇的最大航速,r1为无人艇第一限制系数。
作为优选,环境避障行为的数学模型vb为:
其中,为环境避障行为的雅可比矩阵Jb的广义逆矩阵,Λb为环境避障行为的增益系数矩阵,doe为无人艇与障碍物之间的安全距离,dio为第i个无人艇距离障碍物的距离,i=1,2,……n,vmax为无人艇的最大航速,r2为无人艇第二限制系数,xi为第i艘无人艇的实时横坐标,yi为第i艘无人艇的实时纵坐标,xo为障碍物的横坐标,yo为障碍物的纵坐标。
作为优选,队形保持行为的数学模型vc为:
其中,为队形保持行为的雅可比矩阵Jc的广义逆矩阵,Λc为队形保持行为的增益系数矩阵,dve为无人艇与队形中心之间的距离的期望值,div为第i艘无人艇与队形中心之间的距离,i=1,2,……n,xi为第i艘无人艇的实时横坐标,yi为第i艘无人艇的实时纵坐标,xv为队形中心的横坐标,yv为队形中心的纵坐标,vmax为无人艇的最大航速,r3为无人艇第三限制系数。
本发明所述的面向目标围捕的模糊优先级零空间行为融合编队方法首先获得当前时刻无人艇(SUV)、障碍物与目标物的位置信息,进行误差计算得到d′1、d′2、d′3,然后通过第一至第三量化因子kf1、kf2、kf3归一化至模糊论域(即kf1·d′1、kf2·d′2、kf3·d′3),由模糊推理得到当前时刻总行为优先级权重,通过判断得到下一时刻各行为优先级。三个行为按照行为的优先级进行融合得到多艘无人艇的速度矢量矩阵v,进行解算得到无人艇的期望速度vd与期望航向ψd,vd和ψd分别是无人艇航向控制子系统和航速控制子系统的输入,对其相应的无人艇的航速和航向进行控制。
本发明的优点:
本发明所述的面向目标围捕的模糊优先级零空间行为融合编队方法,根据糊推理得到的当前时刻总行为优先级权重来确定下一时刻各行为的优先级,根据当前确定的各行为的优先级进行零空间行为融合来得到多艘无人艇的速度矢量矩阵v,并对其解算得到下一时刻各无人艇的期望速度vd与期望航向ψd,对其相应的无人艇的航速和航向进行控制,来提高任务的执行效率。避免了现有技术中把行为的优先级设置成固定的零空间行为融合编队方法,强行行为的优先级划分导致低优先级行为执行的缓慢的缺陷。本发明可有效提高低优先级行为执行效率,进而提高任务执行效率。
本发明提出一种面向目标围捕的模糊优先级零空间行为融合编队方法,依据当前时刻的行为优先级进行行为融合得到无人艇的期望航向和期望速度,对下一时刻无人艇的航速和航向进行控制,能够有效解决传统NSB行为融合编队控制方法中行为优先级固定不变会导致任务执行效率低的问题,保证多无人艇能够安全快速的围捕到目标。
本发明主要面向海上执行目标围捕任务。
附图说明
图1是本发明所述面向目标围捕的模糊优先级零空间行为融合编队方法的原理示意图;其中,σ1至σ3分别为针对行为1至行为3的控制函数,ψd1至ψdn分别为第一至第n艘无人艇的期望航向,vd1至vdn分别为第一至第n艘无人艇的期望速度。
图2为采用现有技术中标准NSB编队方法进行双无人艇围捕目标时,双无人艇围捕目标轨迹图;
图3为采用现有技术中标准NSB编队方法进行双无人艇围捕目标时,双无人艇航速响应曲线图;
图4为采用现有技术中标准NSB编队方法进行双无人艇围捕目标时,双无人艇航向响应曲线;
图5为采用本发明模糊优先级零空间行为融合编队方法进行双无人艇围捕目标时,双无人艇围捕目标轨迹图;
图6为采用本发明模糊优先级零空间行为融合编队方法进行双无人艇围捕目标时,双无人艇航速响应曲线图;
图7为采用本发明模糊优先级零空间行为融合编队方法进行双无人艇围捕目标时,双无人艇航向响应曲线。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
为了解决现有目标围捕的编队控制方法中,行为的优先级一般设置成固定的方式,而行为的优先级划分难度大,强行划分导致任务的执行效率低的问题。本实施方式所述的面向目标围捕的模糊优先级零空间行为融合编队方法,并非强行行为的优先级固定划分,而是根据糊推理得到当前时刻总行为优先级权重,根据其当前时刻总行为优先级权重来确定下一时刻各行为的优先级,最后根据当前确定的各行为的优先级进行零空间行为融合来提高任务的执行效率。参见图1,本实施方式的方法包括:
根据目标围捕任务采用零空间行为融合方法设计三个行为,行为1至3分别是:趋向目标行为、环境避障行为和队形保持行为;
根据当前时刻多艘无人艇位姿信息、障碍物位置和目标位置进行误差计算,确定多艘无人艇的趋向目标行为系数d1′、多艘无人艇的环境避障行为系数d2′和多艘无人艇的队形保持行为系数d3′;
通过3个量化因子分别对d1′、d2′和d3′进行归一化化处理,得到的d1至d3作为模糊优先级处理模型的输入,通过模糊优先级处理模型预测出当前时刻总行为优先级权重Pw;其中,d1至d3分别为d1′至d3′归一化后的值;
通过当前时刻总行为优先级权重Pw确定下一时刻三个行为的优先级,并按下一时刻三个行为的优先级通过零空间行为融合方法进行行为融合,得到该时刻多艘无人艇的速度矢量矩阵v,对多艘无人艇的速度矢量矩阵v进行解算得到编队中各艘无人艇的期望速度vd与期望航向ψd,并对其相应的无人艇的航速和航向进行控制。
零空间(Null-Spaced-Based,NSB)行为融合方法是由Filippo Arrichiello提出的一种新的基于行为的编队控制方法。NSB方法将任务分解成多个子行为,按照设定的规则确定不同行为的优先级,利用零空间矩阵思想将低优先级的行为输出向高优先级的行为输出上进行投影,实现不同优先级行为的融合,当存在多个不同优先级行为时,采用零空间方法对不同行为输出的速度进行融合,将低优先级的行为输出的速度投影到高优先级的零空间上,能够在完成高优先级行为时,部分完成低优先级行为。
本发明为保证多无人艇协同围捕目标能够顺利进行,设计了如下三个行为:行为1至3分别是:趋向目标行为、环境避障行为和队形保持行为,定义多艘无人艇的趋向目标行为系数为d1′、多艘无人艇的趋向目标行为系数为d2′、多艘无人艇的队形保持行为系数为d3′,通过当前时刻多艘无人艇位姿信息、障碍物位置和目标位置进行误差计算,得到d1′至d′3,并将到d′1、d′2、d′3分别通过第一至第三量化因子kf1、kf2、kf3归一化至模糊论域后,得到d1至d3作为模糊优先级处理模型的输入,定义上述三个行为的总优先级权重Pw为模糊优先级处理模型的输出,根据总优先级权重Pw来确定三个行为的优先级。
确定多艘无人艇的趋向目标行为系数d1′的实现方式包括:根据编队中所有无人艇位置信息,确定编队的队形中心的实时坐标pc,再根据pc和pt计算其中,xc为队形中心的横坐标,yc为队形中心的纵坐标,pc=[xc yc]T,pt为目标位置,pt=[xtyt]T,xt为目标位置的横坐标,yt为目标位置的纵坐标。
确定多艘无人艇的环境避障行为系数d2′的实现方式包括:根据编队中所有无人艇位置信息和障碍物位置,确定各无人艇距离障碍物的距离dio,并根据所有无人艇距离障碍物的距离,得到d′2=f′(d1o,d2o,…,dno);dio为第i艘无人艇与障碍物间距离,i=1,2,……n,f′(d1o,d2o,…,dno)为各无人艇与障碍物间距离的函数。函数f′(d1o,d2o,…,dno)采用现有技术实现,只要能体现各无人艇与障碍物间距离的关系即可。确定多艘无人艇的队形保持行为系数d3′的实现方式包括:根据编队中所有无人艇位置信息,得到编队的队形中心的实时坐标pc,根据pc计算各无人艇与队形中心间的距离div,再根据div计算d′3=f″(d1v,d2v,…,dnv);div为第i艘无人艇与队形中心之间的距离,i=1,2,……n,pc=[xc yc]T,xc为队形中心的横坐标,yc为队形中心的纵坐标,f″(d1v,d2v,…,dnv)为各无人艇与队形中心之间距离的函数。函数f″(d1v,d2v,…,dnv)采用现有技术实现,只要能体现各无人艇与队形中心之间距离的关系即可。
行为1的数学模型(趋向目标行为的数学模型):
无人艇趋向目标贯穿于“目标围捕”全过程,无人艇的最大航速为vmax,无人艇实时坐标pi=[xi yi]T(i=1,2,…n),队形中心的实时坐标pc,目标位置为pt=[xt yt]T,多无人艇的期望位置分别为pei=[xei yei]T(i=1,2,…n)。趋向目标行为的数学模型va如下所示:
其中,为趋向目标行为的雅可比矩阵Ja的广义逆矩阵,Λa为趋向目标行为的增益系数矩阵,pei为第i艘无人艇的期望位置,pei=[xei yei]T,xei为第i艘无人艇期望位置的横坐标,yei为第i艘无人艇期望位置的纵坐标,pi为第i艘无人艇实时坐标,pi=[xi yi]T,xi为第i艘无人艇的实时横坐标,yi为第i艘无人艇的实时纵坐标,i=1,2,……n,Die为第i艘无人艇实时位置和期望位置之间的距离,r1为无人艇第一限制系数。
行为2的数学模型(环境避障行为数学模型):
无人艇在围捕目标的过程中要规避障碍物。dio是第i个无人艇距离障碍物的距离,定义无人艇与障碍物之间的安全距离为doe,d2是与dio相关的多无人艇的环境避障行为系数,根据实际情况自行设定。环境避障行为数学模型vb如下所示:
其中,为环境避障行为的雅可比矩阵Jb的广义逆矩阵,Λb为环境避障行为的增益系数矩阵,doe为无人艇与障碍物之间的安全距离,dio为第i个无人艇距离障碍物的距离,i=1,2,……n,vmax为无人艇的最大航速,r2为无人艇第二限制系数,xi为第i艘无人艇的实时横坐标,yi为第i艘无人艇的实时纵坐标,xo为障碍物的横坐标,yo为障碍物的纵坐标。
行为3的数学模型(队形保持行为的数学模型):
div是第i个无人艇与队形中心之间的距离,d3是与div相关的多无人艇的队形保持行为系数,根据实际情况自行设定,无人艇与队形中心之间的距离的期望值dve。队形保持行为数学模型vc如下所示:
其中,为队形保持行为的雅可比矩阵Jc的广义逆矩阵,Λc为队形保持行为的增益系数矩阵,dve为无人艇与队形中心之间的距离的期望值,div为第i艘无人艇与队形中心之间的距离,i=1,2,……n,xi为第i艘无人艇的实时横坐标,yi为第i艘无人艇的实时纵坐标,xv为队形中心的横坐标,yv为队形中心的纵坐标,vmax为无人艇的最大航速,r3为无人艇第三限制系数。
本发明将多无人艇围捕海上目标任务分解为三个行为,行为1可保证多多无人艇能够围捕到目标,行为2可保证无人艇不会与环境中的障碍物发生碰撞,行为3可保证多无人艇以一定的队形完成对目标的围捕。这三个行为在一起构成了多无人艇海上目标围捕任务的整体,保证多无人艇可以按照一定队形安全地围捕到目标。
式中Λa、Λb、Λc是设定的增益系数,使得求解出来的速度可同时兼顾效率与无人艇机动性能,其中r1、r2、r3为限制系数,避免发生“饱和规划”现象,保证了规划得到的速度始终在无人艇的机动范围内。
输入量d1′、d2′和d3′的模糊论域定义为[0,1],隶属度权重论域为[0,1],定义d1′、d2′和d3′模糊描述为{VB,B,S,VS},即{很大,大,小,很小}。
该三输入单输出的模糊优先级处理模型中每条规则的权重系数的计算方法均为乘积法,输出采用加权平均法,式中,和/>分别代表第j条规则中d1至d3分别对应的隶属度值,ωj为第j条规则的权重,sj为第j条规则的输出,j=1,2,……m,Pw为模糊推理结果,即总行为优先级权重。
总行为优先级权重Pw与三个行为的优先级间关系为:
其中,Pa、Pb、Pc分别为趋向目标行为、环境避障行为和队形保持行为的优先级。Pa、Pb、Pc的值越小证明优先级的等级越高。
则总优先级权重Pw对应的速度矢量矩阵v为:
其中,va、vb和vc分别为趋向目标行为、环境避障行为和队形保持行为的数学模型,I为单位矩阵,为Ja的广义逆矩阵,Ja为趋向目标行为的雅可比矩阵,/>为Jb的广义逆矩阵,Jb为环境避障行为的雅可比矩阵,/>为Jc的广义逆矩阵,Jc为队形保持行为的雅可比矩阵。
验证试验:进行了双无人艇围捕目标的仿真对比实验,验证明本发明的技术效果,其中,设置双无人艇的起始位置分别为(-5,5)、(5,-5),目标位置为(100,100),目标速度为0.1m/s,目标航向为30°,无人艇的最大速度1.5m/s,三个行为的初始优先级从高到低依此为:行为2、行为3、行为1。
在相同设置参数的情况下,现有技术中标准NSB编队方法的仿真结果如图2-图4所示:采用本发明模糊优先级零空间行为融合编队方法的仿真结果如图5-图7所示:
由图3所示的航速响应曲线得知,采用现有技术中的标准NSB行为融合编队方法围捕到目标所用的时间为217s,结合图6所示的航速响应曲线得知,采用本发明模糊优先级零空间行为融合编队方法围捕到目标所用的时间为168.5s,相较于标准NSB行为融合编队方法围捕效率提高了22.4%,较大程度的提高了围捕目标的效率。
虽然在本文中参照了特定的实施方式来描述本发明,但是应该理解的是,这些实施例仅仅是本发明的原理和应用的示例。因此应该理解的是,可以对示例性的实施例进行许多修改,并且可以设计出其他的布置,只要不偏离所附权利要求所限定的本发明的精神和范围。应该理解的是,可以通过不同于原始权利要求所描述的方式来结合不同的从属权利要求和本文中所述的特征。还可以理解的是,结合单独实施例所描述的特征可以使用在其他所述实施例中。

Claims (10)

1.面向目标围捕的模糊优先级零空间行为融合编队方法,其特征在于,该方法包括:
根据目标围捕任务采用零空间行为融合方法设计三个行为,行为1至3分别是:趋向目标行为、环境避障行为和队形保持行为;
根据当前时刻多艘无人艇位姿信息、障碍物位置和目标位置进行误差计算,确定多艘无人艇的趋向目标行为系数d1′、多艘无人艇的环境避障行为系数d2′和多艘无人艇的队形保持行为系数d3′;
通过3个量化因子分别对d1′、d2′和d3′进行归一化化处理,得到的d1至d3作为模糊优先级处理模型的输入,通过模糊优先级处理模型预测出当前时刻总行为优先级权重Pw;其中,d1至d3分别为d1′至d3′归一化后的值;
通过当前时刻总行为优先级权重Pw确定下一时刻三个行为的优先级,并按下一时刻三个行为的优先级通过零空间行为融合方法进行行为融合,得到该时刻多艘无人艇的速度矢量矩阵v,对多艘无人艇的速度矢量矩阵v进行解算得到编队中各艘无人艇的期望速度vd与期望航向ψd,并对其相应的无人艇的航速和航向进行控制。
2.根据权利要求1所述的面向目标围捕的模糊优先级零空间行为融合编队方法,其特征在于,确定多艘无人艇的趋向目标行为系数d1′的实现方式包括:
根据编队中所有无人艇位置信息,确定编队的队形中心的实时坐标pc,再根据pc和pt计算
其中,xc为队形中心的横坐标,yc为队形中心的纵坐标,pc=[xc yc]T,pt为目标位置,pt=[xt yt]T,xt为目标位置的横坐标,yt为目标位置的纵坐标。
3.根据权利要求1所述的面向目标围捕的模糊优先级零空间行为融合编队方法,其特征在于,确定多艘无人艇的环境避障行为系数d2′的实现方式包括:
根据编队中所有无人艇位置信息和障碍物位置,确定各无人艇距离障碍物的距离dio,并根据所有无人艇距离障碍物的距离,得到d′2=f′(d1o,d2o,…,dno);
dio为第i艘无人艇与障碍物间距离,i=1,2,……n,f′(d1o,d2o,…,dno)为各无人艇与障碍物间距离的函数。
4.根据权利要求1所述的面向目标围捕的模糊优先级零空间行为融合编队方法,其特征在于,确定多艘无人艇的队形保持行为系数d3′的实现方式包括:
根据编队中所有无人艇位置信息,得到编队的队形中心的实时坐标pc,根据pc计算各无人艇与队形中心间的距离div,再根据div计算d3′=f″(d1v,d2v,…,dnv);
div为第i艘无人艇与队形中心之间的距离,i=1,2,……n,pc=[xc yc]T,xc为队形中心的横坐标,yc为队形中心的纵坐标,f″(d1v,d2v,…,dnv)为各无人艇与队形中心之间距离的函数。
5.根据权利要求1所述的面向目标围捕的模糊优先级零空间行为融合编队方法,其特征在于,
其中,和/>分别代表第j条规则中d1至d3分别对应的隶属度值,ωj为第j条规则的权重,sj为第j条规则的输出,j=1,2,……m。
6.根据权利要求1所述的面向目标围捕的模糊优先级零空间行为融合编队方法,其特征在于,当前时刻总行为优先级权重Pw与下一时刻三个行为的优先级间关系为:
其中,Pa、Pb、Pc分别为趋向目标行为、环境避障行为和队形保持行为的优先级。
7.根据权利要求1所述的面向目标围捕的模糊优先级零空间行为融合编队方法,其特征在于,当前时刻总行为优先级权重Pw与下一时刻多艘无人艇的速度矢量矩阵v间的对应关系为:
其中,va、vb和vc分别为趋向目标行为、环境避障行为和队形保持行为的数学模型,I为单位矩阵,为Ja的广义逆矩阵,Ja为趋向目标行为的雅可比矩阵,/>为Jb的广义逆矩阵,Jb为环境避障行为的雅可比矩阵,/>为Jc的广义逆矩阵,Jc为队形保持行为的雅可比矩阵。
8.根据权利要求1所述的面向目标围捕的模糊优先级零空间行为融合编队方法,其特征在于,趋向目标行为的数学模型va为:
其中,为趋向目标行为的雅可比矩阵Ja的广义逆矩阵,Λa为趋向目标行为的增益系数矩阵,pei为第i艘无人艇的期望位置,pei=[xei yei]T,xei为第i艘无人艇期望位置的横坐标,yei为第i艘无人艇期望位置的纵坐标,pi为第i艘无人艇实时坐标,pi=[xi yi]T,xi为第i艘无人艇的实时横坐标,yi为第i艘无人艇的实时纵坐标,i=1,2,……n,Die为第i艘无人艇实时位置和期望位置之间的距离,vmax为无人艇的最大航速,r1为无人艇第一限制系数。
9.根据权利要求1所述的面向目标围捕的模糊优先级零空间行为融合编队方法,其特征在于,环境避障行为的数学模型vb为:
其中,为环境避障行为的雅可比矩阵Jb的广义逆矩阵,Λb为环境避障行为的增益系数矩阵,doe为无人艇与障碍物之间的安全距离,dio为第i个无人艇距离障碍物的距离,i=1,2,……n,vmax为无人艇的最大航速,r2为无人艇第二限制系数,xi为第i艘无人艇的实时横坐标,yi为第i艘无人艇的实时纵坐标,xo为障碍物的横坐标,yo为障碍物的纵坐标。
10.根据权利要求1所述的面向目标围捕的模糊优先级零空间行为融合编队方法,其特征在于,队形保持行为的数学模型vc为:
其中,为队形保持行为的雅可比矩阵Jc的广义逆矩阵,Λc为队形保持行为的增益系数矩阵,dve为无人艇与队形中心之间的距离的期望值,div为第i艘无人艇与队形中心之间的距离,i=1,2,……n,xi为第i艘无人艇的实时横坐标,yi为第i艘无人艇的实时纵坐标,xv为队形中心的横坐标,yv为队形中心的纵坐标,vmax为无人艇的最大航速,r3为无人艇第三限制系数。
CN202310823152.0A 2023-07-06 2023-07-06 面向目标围捕的模糊优先级零空间行为融合编队方法 Pending CN116859924A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310823152.0A CN116859924A (zh) 2023-07-06 2023-07-06 面向目标围捕的模糊优先级零空间行为融合编队方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310823152.0A CN116859924A (zh) 2023-07-06 2023-07-06 面向目标围捕的模糊优先级零空间行为融合编队方法

Publications (1)

Publication Number Publication Date
CN116859924A true CN116859924A (zh) 2023-10-10

Family

ID=88231711

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310823152.0A Pending CN116859924A (zh) 2023-07-06 2023-07-06 面向目标围捕的模糊优先级零空间行为融合编队方法

Country Status (1)

Country Link
CN (1) CN116859924A (zh)

Similar Documents

Publication Publication Date Title
CN108803321B (zh) 基于深度强化学习的自主水下航行器轨迹跟踪控制方法
Wang et al. A multilayer path planner for a USV under complex marine environments
CN109871031B (zh) 一种固定翼无人机的轨迹规划方法
Sun et al. AUV path following controlled by modified Deep Deterministic Policy Gradient
CN109784201B (zh) 基于四维风险评估的auv动态避障方法
Botteghi et al. On reward shaping for mobile robot navigation: A reinforcement learning and SLAM based approach
Shirzadeh et al. Trajectory tracking of a quadrotor using a robust adaptive type-2 fuzzy neural controller optimized by cuckoo algorithm
CN111882047B (zh) 一种基于强化学习与线性规划的快速空管防冲突方法
Wang et al. Distributed collision avoidance of multiple robots with probabilistic buffered voronoi cells
Wei et al. Safe control with neural network dynamic models
CN112612209A (zh) 基于指令滤波神经网络控制器的全驱动船舶轨迹跟踪控制方法及系统
Zhang et al. Recurrent neural network-based model predictive control for multiple unmanned quadrotor formation flight
Ure et al. Enhancing situational awareness and performance of adaptive cruise control through model predictive control and deep reinforcement learning
CN110865655B (zh) 无人机系统中无人机的编队和避障控制方法
CN113900449B (zh) 多无人机轨迹规划方法、装置、无人机及存储介质
Yu et al. Adaptive simplified surge-heading tracking control for underwater vehicles with thruster’s dead-zone compensation
CN117452827B (zh) 一种欠驱动无人艇轨迹跟踪控制方法
CN113419424B (zh) 减少过估计的模型化强化学习机器人控制方法及系统
Xiong et al. Surrounding vehicle trajectory prediction and dynamic speed planning for autonomous vehicle in cut-in scenarios
CN113093804B (zh) 基于反演滑模控制的无人艇编队控制方法和控制系统
Hamad et al. Path Planning of Mobile Robot Based on Modification of Vector Field Histogram using Neuro-Fuzzy Algorithm.
CN116859924A (zh) 面向目标围捕的模糊优先级零空间行为融合编队方法
Liu et al. Robust adaptive self-Structuring neural network bounded target tracking control of underactuated surface vessels
Fu et al. Adaptive safety motion control for underactuated hovercraft using improved integral barrier lyapunov function
CN110703792B (zh) 基于增强学习的水下机器人姿态控制方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination