CN116859924A

CN116859924A - 面向目标围捕的模糊优先级零空间行为融合编队方法

Info

Publication number: CN116859924A
Application number: CN202310823152.0A
Authority: CN
Inventors: 廖煜雷; 陈聪聪; 李浩瀚; 唐小雨; 孙加起; 马腾; 李晔
Original assignee: Harbin Engineering University
Current assignee: Harbin Engineering University
Priority date: 2023-07-06
Filing date: 2023-07-06
Publication date: 2023-10-10

Abstract

面向目标围捕的模糊优先级零空间行为融合编队方法，属于多机器人编队控制领域。本发明解决了现有目标围捕的编队控制方法中行为的优先级一般设置成固定的方式，而行为的优先级划分难度大，强行划分导致任务的执行效率低的问题。本发明设计三个行为，首先获得当前时刻无人艇、障碍物与目标物的位置信息，进行误差计算得到三个行为的系数后，归一化至模糊论域，模糊推理得到当前时刻总行为优先级权重，根据当前时刻总行为优先级权重确定下一时刻各行为优先级。三个行为按当前行为的优先级进行融合得到当前时刻多艘无人艇的速度矢量矩阵，进行解算得到下一时刻各无人艇的期望速度与期望航向，对相应的无人艇的航速和航向进行控制。用于海上目标围捕。

Description

面向目标围捕的模糊优先级零空间行为融合编队方法

技术领域

本发明属于多机器人编队控制领域。

背景技术

海洋环境复杂多变，依靠单艘无人艇(海上机器人)难以完成海上多样化的任务，多无人艇协同完成任务是解决此问题的重要途经，因此，多无人艇协同控制得到高度重视和广泛研究。多海上机器人协同控制或编队控制，是指多个机器人在到达目的地的过程中，保持某种队形，同时又要适应环境约束(例如存在障碍物和空间的物理限制等)的控制技术。多机器人编队控制问题是一个典型性和通用性的多机器人协调问题，是多机器人协调问题的基础，是多机器人系统中最重要也是最基本的问题，值得深入细致的研究。

为解决多机器人编队问题，常采用两种思想：集中式编队控制、分布式编队控制。相比于集中式方法，分布式因其可靠性高、开放性强、灵活性强，而成为对机器人集群编队的研究热点。零空间行为融合为分布式编队控制的一种典型应用。

专利号：CN 108829113 A，名称为“一种多机器人编队自适应零空间行为融合方法”，提供一种多机器人的编队控制方法，该方法根据机器人在运动过程中反馈得到的运动信息，解算得到增益系数，融合运动行为步骤，得到最终的速度和方向。求解出来的速度不受概况环境的改变而改变，具有很好的自适应性。但是该方法中各个行为的优先级是固定的，当在一个时刻达到或者基本达到最高优先级行为的期望时，优先级不变就会导致低优先级行为达到期望的速度很缓慢，不利于低优先级行为的执行。

专利号：CN 115248599 B，名称为“一种变优先级的多机器人零空间行为融合编队方法”，提出了一种基于变优先级零空间行为融合算法的多机器人编队方法，设计了四个行为，通过给行为设置容错区间，根据多机器人系统是否在行为容错区间之内来更新行为的优先级，能够在保证高优先级行为完成的同时，提高低优先级行为的执行效率。但是该方法行为优先级变化规则很简单，行为优先级的变化频率较快，导致无人艇的编队会出现较大的振荡，不利已围捕任务的执行。

综上所述，目前的零空间行为融合编队方法的应用基本都是把行为的优先级设置成固定的，这就导致低优先级行为执行的很缓慢。在一些任务中行为的优先级很难划分，强行划分成固定的优先级会降低任务的执行效率。

发明内容

本发明目的是为了解决现有目标围捕的编队控制方法中行为的优先级一般设置成固定的方式，而行为的优先级划分难度大，强行划分导致任务的执行效率低的问题，本发明提供了一种面向目标围捕的模糊优先级零空间行为融合编队方法。

面向目标围捕的模糊优先级零空间行为融合编队方法，该方法包括：

根据目标围捕任务采用零空间行为融合方法设计三个行为，行为1至3分别是：趋向目标行为、环境避障行为和队形保持行为；

根据当前时刻多艘无人艇位姿信息、障碍物位置和目标位置进行误差计算，确定多艘无人艇的趋向目标行为系数d₁′、多艘无人艇的环境避障行为系数d₂′和多艘无人艇的队形保持行为系数d₃′；

通过3个量化因子分别对d₁′、d₂′和d₃′进行归一化化处理，得到的d₁至d₃作为模糊优先级处理模型的输入，通过模糊优先级处理模型预测出当前时刻总行为优先级权重P_w；其中，d₁至d₃分别为d₁′至d₃′归一化后的值；

通过当前时刻总行为优先级权重P_w确定下一时刻三个行为的优先级，并按下一时刻三个行为的优先级通过零空间行为融合方法进行行为融合，得到该时刻多艘无人艇的速度矢量矩阵v，对多艘无人艇的速度矢量矩阵v进行解算得到编队中各艘无人艇的期望速度v_d与期望航向ψ_d，并对其相应的无人艇的航速和航向进行控制。

作为优选，确定多艘无人艇的趋向目标行为系数d₁′的实现方式包括：

根据编队中所有无人艇位置信息，确定编队的队形中心的实时坐标p_c，再根据p_c和p_t计算

其中，x_c为队形中心的横坐标，y_c为队形中心的纵坐标，p_c＝[x_c y_c]^T，p_t为目标位置，p_t＝[x_t y_t]^T，x_t为目标位置的横坐标，y_t为目标位置的纵坐标。

作为优选，确定多艘无人艇的环境避障行为系数d₂′的实现方式包括：

根据编队中所有无人艇位置信息和障碍物位置，确定各无人艇距离障碍物的距离d_io，并根据所有无人艇距离障碍物的距离，得到d′₂＝f′(d_1o,d_2o,…,d_no)；

d_io为第i艘无人艇与障碍物间距离，i＝1,2，……n，f′(d_1o,d_2o,…,d_no)为各无人艇与障碍物间距离的函数。

作为优选，确定多艘无人艇的队形保持行为系数d₃′的实现方式包括：

根据编队中所有无人艇位置信息，得到编队的队形中心的实时坐标p_c，根据p_c计算各无人艇与队形中心间的距离d_iv，再根据d_iv计算d′₃＝f″(d_1v,d_2v,…,d_nv)；

d_iv为第i艘无人艇与队形中心之间的距离，i＝1,2，……n，p_c＝[x_c y_c]^T，x_c为队形中心的横坐标，y_c为队形中心的纵坐标，f″(d_1v,d_2v,…,d_nv)为各无人艇与队形中心之间距离的函数。

作为优选，

其中，和/>分别代表第j条规则中d₁至d₃分别对应的隶属度值，ω_j为第j条规则的权重，s_j为第j条规则的输出，j＝1,2，……m。

作为优选，当前时刻总行为优先级权重P_w与下一时刻三个行为的优先级间关系为：

其中，P_a、P_b、P_c分别为趋向目标行为、环境避障行为和队形保持行为的优先级。

作为优选，当前时刻总行为优先级权重P_w与下一时刻多艘无人艇的速度矢量矩阵v间的对应关系为：

其中，v_a、v_b和v_c分别为趋向目标行为、环境避障行为和队形保持行为的数学模型，I为单位矩阵，为J_a的广义逆矩阵，J_a为趋向目标行为的雅可比矩阵，/>为J_b的广义逆矩阵，J_b为环境避障行为的雅可比矩阵，/>为J_c的广义逆矩阵，J_c为队形保持行为的雅可比矩阵。

作为优选，趋向目标行为的数学模型v_a为：

其中，为趋向目标行为的雅可比矩阵J_a的广义逆矩阵，Λ_a为趋向目标行为的增益系数矩阵，p_ei为第i艘无人艇的期望位置，p_ei＝[x_ei y_ei]^T，x_ei为第i艘无人艇期望位置的横坐标，y_ei为第i艘无人艇期望位置的纵坐标，p_i为第i艘无人艇实时坐标，p_i＝[x_i y_i]^T，x_i为第i艘无人艇的实时横坐标，y_i为第i艘无人艇的实时纵坐标，i＝1,2，……n，D_ie为第i艘无人艇实时位置和期望位置之间的距离，v_max为无人艇的最大航速，r₁为无人艇第一限制系数。

作为优选，环境避障行为的数学模型v_b为：

其中，为环境避障行为的雅可比矩阵J_b的广义逆矩阵，Λ_b为环境避障行为的增益系数矩阵，d_oe为无人艇与障碍物之间的安全距离，d_io为第i个无人艇距离障碍物的距离，i＝1,2，……n，v_max为无人艇的最大航速，r₂为无人艇第二限制系数，x_i为第i艘无人艇的实时横坐标，y_i为第i艘无人艇的实时纵坐标，x_o为障碍物的横坐标，y_o为障碍物的纵坐标。

作为优选，队形保持行为的数学模型v_c为：

其中，为队形保持行为的雅可比矩阵J_c的广义逆矩阵，Λ_c为队形保持行为的增益系数矩阵，d_ve为无人艇与队形中心之间的距离的期望值，d_iv为第i艘无人艇与队形中心之间的距离，i＝1,2，……n，x_i为第i艘无人艇的实时横坐标，y_i为第i艘无人艇的实时纵坐标，x_v为队形中心的横坐标，y_v为队形中心的纵坐标，v_max为无人艇的最大航速，r₃为无人艇第三限制系数。

本发明所述的面向目标围捕的模糊优先级零空间行为融合编队方法首先获得当前时刻无人艇(SUV)、障碍物与目标物的位置信息，进行误差计算得到d′₁、d′₂、d′₃，然后通过第一至第三量化因子kf₁、kf₂、kf₃归一化至模糊论域(即kf₁·d′₁、kf₂·d′₂、kf₃·d′₃)，由模糊推理得到当前时刻总行为优先级权重，通过判断得到下一时刻各行为优先级。三个行为按照行为的优先级进行融合得到多艘无人艇的速度矢量矩阵v，进行解算得到无人艇的期望速度v_d与期望航向ψ_d，v_d和ψ_d分别是无人艇航向控制子系统和航速控制子系统的输入，对其相应的无人艇的航速和航向进行控制。

本发明的优点：

本发明所述的面向目标围捕的模糊优先级零空间行为融合编队方法，根据糊推理得到的当前时刻总行为优先级权重来确定下一时刻各行为的优先级，根据当前确定的各行为的优先级进行零空间行为融合来得到多艘无人艇的速度矢量矩阵v，并对其解算得到下一时刻各无人艇的期望速度v_d与期望航向ψ_d，对其相应的无人艇的航速和航向进行控制，来提高任务的执行效率。避免了现有技术中把行为的优先级设置成固定的零空间行为融合编队方法，强行行为的优先级划分导致低优先级行为执行的缓慢的缺陷。本发明可有效提高低优先级行为执行效率，进而提高任务执行效率。

本发明提出一种面向目标围捕的模糊优先级零空间行为融合编队方法，依据当前时刻的行为优先级进行行为融合得到无人艇的期望航向和期望速度，对下一时刻无人艇的航速和航向进行控制，能够有效解决传统NSB行为融合编队控制方法中行为优先级固定不变会导致任务执行效率低的问题，保证多无人艇能够安全快速的围捕到目标。

本发明主要面向海上执行目标围捕任务。

附图说明

图1是本发明所述面向目标围捕的模糊优先级零空间行为融合编队方法的原理示意图；其中，σ₁至σ₃分别为针对行为1至行为3的控制函数，ψ_d1至ψ_dn分别为第一至第n艘无人艇的期望航向，v_d1至v_dn分别为第一至第n艘无人艇的期望速度。

图2为采用现有技术中标准NSB编队方法进行双无人艇围捕目标时，双无人艇围捕目标轨迹图；

图3为采用现有技术中标准NSB编队方法进行双无人艇围捕目标时，双无人艇航速响应曲线图；

图4为采用现有技术中标准NSB编队方法进行双无人艇围捕目标时，双无人艇航向响应曲线；

图5为采用本发明模糊优先级零空间行为融合编队方法进行双无人艇围捕目标时，双无人艇围捕目标轨迹图；

图6为采用本发明模糊优先级零空间行为融合编队方法进行双无人艇围捕目标时，双无人艇航速响应曲线图；

图7为采用本发明模糊优先级零空间行为融合编队方法进行双无人艇围捕目标时，双无人艇航向响应曲线。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例，都属于本发明保护的范围。

需要说明的是，在不冲突的情况下，本发明中的实施例及实施例中的特征可以相互组合。

为了解决现有目标围捕的编队控制方法中，行为的优先级一般设置成固定的方式，而行为的优先级划分难度大，强行划分导致任务的执行效率低的问题。本实施方式所述的面向目标围捕的模糊优先级零空间行为融合编队方法，并非强行行为的优先级固定划分，而是根据糊推理得到当前时刻总行为优先级权重，根据其当前时刻总行为优先级权重来确定下一时刻各行为的优先级，最后根据当前确定的各行为的优先级进行零空间行为融合来提高任务的执行效率。参见图1，本实施方式的方法包括：

零空间(Null-Spaced-Based,NSB)行为融合方法是由Filippo Arrichiello提出的一种新的基于行为的编队控制方法。NSB方法将任务分解成多个子行为，按照设定的规则确定不同行为的优先级，利用零空间矩阵思想将低优先级的行为输出向高优先级的行为输出上进行投影，实现不同优先级行为的融合，当存在多个不同优先级行为时，采用零空间方法对不同行为输出的速度进行融合，将低优先级的行为输出的速度投影到高优先级的零空间上，能够在完成高优先级行为时，部分完成低优先级行为。

本发明为保证多无人艇协同围捕目标能够顺利进行，设计了如下三个行为：行为1至3分别是：趋向目标行为、环境避障行为和队形保持行为，定义多艘无人艇的趋向目标行为系数为d₁′、多艘无人艇的趋向目标行为系数为d₂′、多艘无人艇的队形保持行为系数为d₃′，通过当前时刻多艘无人艇位姿信息、障碍物位置和目标位置进行误差计算，得到d₁′至d′₃，并将到d′₁、d′₂、d′₃分别通过第一至第三量化因子kf₁、kf₂、kf₃归一化至模糊论域后，得到d₁至d₃作为模糊优先级处理模型的输入，定义上述三个行为的总优先级权重P_w为模糊优先级处理模型的输出，根据总优先级权重P_w来确定三个行为的优先级。

确定多艘无人艇的趋向目标行为系数d₁′的实现方式包括：根据编队中所有无人艇位置信息，确定编队的队形中心的实时坐标p_c，再根据p_c和p_t计算其中，x_c为队形中心的横坐标，y_c为队形中心的纵坐标，p_c＝[x_c y_c]^T，p_t为目标位置，p_t＝[x_ty_t]^T，x_t为目标位置的横坐标，y_t为目标位置的纵坐标。

确定多艘无人艇的环境避障行为系数d₂′的实现方式包括：根据编队中所有无人艇位置信息和障碍物位置，确定各无人艇距离障碍物的距离d_io，并根据所有无人艇距离障碍物的距离，得到d′₂＝f′(d_1o,d_2o,…,d_no)；d_io为第i艘无人艇与障碍物间距离，i＝1,2，……n，f′(d_1o,d_2o,…,d_no)为各无人艇与障碍物间距离的函数。函数f′(d_1o,d_2o,…,d_no)采用现有技术实现，只要能体现各无人艇与障碍物间距离的关系即可。确定多艘无人艇的队形保持行为系数d₃′的实现方式包括：根据编队中所有无人艇位置信息，得到编队的队形中心的实时坐标p_c，根据p_c计算各无人艇与队形中心间的距离d_iv，再根据d_iv计算d′₃＝f″(d_1v,d_2v,…,d_nv)；d_iv为第i艘无人艇与队形中心之间的距离，i＝1,2，……n，p_c＝[x_c y_c]^T，x_c为队形中心的横坐标，y_c为队形中心的纵坐标，f″(d_1v,d_2v,…,d_nv)为各无人艇与队形中心之间距离的函数。函数f″(d_1v,d_2v,…,d_nv)采用现有技术实现，只要能体现各无人艇与队形中心之间距离的关系即可。

行为1的数学模型(趋向目标行为的数学模型)：

无人艇趋向目标贯穿于“目标围捕”全过程，无人艇的最大航速为v_max，无人艇实时坐标p_i＝[x_i y_i]^T(i＝1,2,…n)，队形中心的实时坐标p_c，目标位置为p_t＝[x_t y_t]^T，多无人艇的期望位置分别为p_ei＝[x_ei y_ei]^T(i＝1,2,…n)。趋向目标行为的数学模型v_a如下所示：

其中，为趋向目标行为的雅可比矩阵J_a的广义逆矩阵，Λ_a为趋向目标行为的增益系数矩阵，p_ei为第i艘无人艇的期望位置，p_ei＝[x_ei y_ei]^T，x_ei为第i艘无人艇期望位置的横坐标，y_ei为第i艘无人艇期望位置的纵坐标，p_i为第i艘无人艇实时坐标，p_i＝[x_i y_i]^T，x_i为第i艘无人艇的实时横坐标，y_i为第i艘无人艇的实时纵坐标，i＝1,2，……n，D_ie为第i艘无人艇实时位置和期望位置之间的距离，r₁为无人艇第一限制系数。

行为2的数学模型(环境避障行为数学模型)：

无人艇在围捕目标的过程中要规避障碍物。d_io是第i个无人艇距离障碍物的距离，定义无人艇与障碍物之间的安全距离为d_oe，d₂是与d_io相关的多无人艇的环境避障行为系数，根据实际情况自行设定。环境避障行为数学模型v_b如下所示：

行为3的数学模型(队形保持行为的数学模型)：

d_iv是第i个无人艇与队形中心之间的距离，d₃是与d_iv相关的多无人艇的队形保持行为系数，根据实际情况自行设定，无人艇与队形中心之间的距离的期望值d_ve。队形保持行为数学模型v_c如下所示：

本发明将多无人艇围捕海上目标任务分解为三个行为，行为1可保证多多无人艇能够围捕到目标，行为2可保证无人艇不会与环境中的障碍物发生碰撞，行为3可保证多无人艇以一定的队形完成对目标的围捕。这三个行为在一起构成了多无人艇海上目标围捕任务的整体，保证多无人艇可以按照一定队形安全地围捕到目标。

式中Λ_a、Λ_b、Λ_c是设定的增益系数，使得求解出来的速度可同时兼顾效率与无人艇机动性能，其中r₁、r₂、r₃为限制系数，避免发生“饱和规划”现象，保证了规划得到的速度始终在无人艇的机动范围内。

输入量d₁′、d₂′和d₃′的模糊论域定义为[0，1]，隶属度权重论域为[0，1]，定义d₁′、d₂′和d₃′模糊描述为{VB,B,S,VS}，即{很大,大,小,很小}。

该三输入单输出的模糊优先级处理模型中每条规则的权重系数的计算方法均为乘积法，输出采用加权平均法，式中，和/>分别代表第j条规则中d₁至d₃分别对应的隶属度值，ω_j为第j条规则的权重，s_j为第j条规则的输出，j＝1,2，……m，P_w为模糊推理结果，即总行为优先级权重。

总行为优先级权重P_w与三个行为的优先级间关系为：

其中，P_a、P_b、P_c分别为趋向目标行为、环境避障行为和队形保持行为的优先级。P_a、P_b、P_c的值越小证明优先级的等级越高。

则总优先级权重P_w对应的速度矢量矩阵v为：

验证试验：进行了双无人艇围捕目标的仿真对比实验，验证明本发明的技术效果，其中，设置双无人艇的起始位置分别为(-5,5)、(5,-5)，目标位置为(100,100)，目标速度为0.1m/s，目标航向为30°，无人艇的最大速度1.5m/s，三个行为的初始优先级从高到低依此为：行为2、行为3、行为1。

在相同设置参数的情况下，现有技术中标准NSB编队方法的仿真结果如图2-图4所示：采用本发明模糊优先级零空间行为融合编队方法的仿真结果如图5-图7所示：

由图3所示的航速响应曲线得知，采用现有技术中的标准NSB行为融合编队方法围捕到目标所用的时间为217s，结合图6所示的航速响应曲线得知，采用本发明模糊优先级零空间行为融合编队方法围捕到目标所用的时间为168.5s，相较于标准NSB行为融合编队方法围捕效率提高了22.4％，较大程度的提高了围捕目标的效率。

虽然在本文中参照了特定的实施方式来描述本发明，但是应该理解的是，这些实施例仅仅是本发明的原理和应用的示例。因此应该理解的是，可以对示例性的实施例进行许多修改，并且可以设计出其他的布置，只要不偏离所附权利要求所限定的本发明的精神和范围。应该理解的是，可以通过不同于原始权利要求所描述的方式来结合不同的从属权利要求和本文中所述的特征。还可以理解的是，结合单独实施例所描述的特征可以使用在其他所述实施例中。

Claims

1.面向目标围捕的模糊优先级零空间行为融合编队方法，其特征在于，该方法包括：

2.根据权利要求1所述的面向目标围捕的模糊优先级零空间行为融合编队方法，其特征在于，确定多艘无人艇的趋向目标行为系数d₁′的实现方式包括：

3.根据权利要求1所述的面向目标围捕的模糊优先级零空间行为融合编队方法，其特征在于，确定多艘无人艇的环境避障行为系数d₂′的实现方式包括：

4.根据权利要求1所述的面向目标围捕的模糊优先级零空间行为融合编队方法，其特征在于，确定多艘无人艇的队形保持行为系数d₃′的实现方式包括：

根据编队中所有无人艇位置信息，得到编队的队形中心的实时坐标p_c，根据p_c计算各无人艇与队形中心间的距离d_iv，再根据d_iv计算d₃′＝f″(d_1v,d_2v,…,d_nv)；

5.根据权利要求1所述的面向目标围捕的模糊优先级零空间行为融合编队方法，其特征在于，

6.根据权利要求1所述的面向目标围捕的模糊优先级零空间行为融合编队方法，其特征在于，当前时刻总行为优先级权重P_w与下一时刻三个行为的优先级间关系为：

7.根据权利要求1所述的面向目标围捕的模糊优先级零空间行为融合编队方法，其特征在于，当前时刻总行为优先级权重P_w与下一时刻多艘无人艇的速度矢量矩阵v间的对应关系为：

8.根据权利要求1所述的面向目标围捕的模糊优先级零空间行为融合编队方法，其特征在于，趋向目标行为的数学模型v_a为：

9.根据权利要求1所述的面向目标围捕的模糊优先级零空间行为融合编队方法，其特征在于，环境避障行为的数学模型v_b为：

10.根据权利要求1所述的面向目标围捕的模糊优先级零空间行为融合编队方法，其特征在于，队形保持行为的数学模型v_c为：