CN112558471B

CN112558471B - 一种基于动态事件触发的航天器编队离散分布式非合作博弈方法

Info

Publication number: CN112558471B
Application number: CN202011334538.8A
Authority: CN
Inventors: 袁源; 张鹏; 孙冲
Original assignee: Northwestern Polytechnical University
Current assignee: Northwestern Polytechnical University
Priority date: 2020-11-24
Filing date: 2020-11-24
Publication date: 2022-05-24
Anticipated expiration: 2040-11-24
Also published as: CN112558471A

Abstract

本发明提供一种基于动态事件触发的航天器编队离散分布式非合作博弈方法，包括如下步骤，步骤1构建航天器编队非合作博弈模型，个体航天器建立相邻航天器之间的通信连接，获取相邻航天器的状态信息；步骤2在航天器编队非合作博弈模型上建立分布式全局信息估计器，个体航天器建立与不相邻航天器之间的通信连接，个体航天器展开对航天器编队的全局信息进行估计；步骤3根据个体航天对航天器编队的全局信息展开估计，建立航天器编队信号传输的动态事件触发机制，输出个体航天器对全局信息估计数值；步骤4基于动态事件触发机制所输出的全局信息估计数值设计纳什平衡离散更新策略，完成航天器编队离散分布式非合作博弈策略。

Description

一种基于动态事件触发的航天器编队离散分布式非合作博弈方法

技术领域

本发明涉及飞行器决策领域，具体为一种基于动态事件触发的航天器编队离散分布式非合作博弈方法。

背景技术

从20世纪90年代起，随着微小卫星和分布式空间系统等航天技术的发展，航天器编队飞行技术的概念一经提出，便以其独特的优势成为目前航天领域的研究热点。航天器编队具有功能多样化、成本低、可靠性高、扩展性强等优点。近年来，随着在空间任务中国际合作越来越广泛，由多个国家组成的大型航天器编队成为未来空间探索建设中主要发展趋势。因此，寻求一种航天器编队的非合作博弈方法尤为重要。此外，在航天器编队执行任务过程中，个体航天器之间需要进行频繁的信息交互，这往往要消耗大量的能量。对于能量有限的航天器来说，设计一种信号传输协议，降低不必要的信号传输，进而节约能量，显得尤其重要。

针对多智能体系统的非合作博弈策略，目前已经提出了多种求解方法。常见的有基于梯度信息的纳什平衡连续求解方法、基于一致性协议的连续求解方法。目前大部分实际系统中都采用数字信号传输与控制，然而以上求解方法主要针对的是连续系统，不能适用于现代数字控制系统。因此，目前亟需设计一种离散纳什平衡求解方法，便于工程实现。此外，事件触发机制广泛应用于各类大型系统中，用以减少信号传输频率。目前，主要存在两类事件触发机制：静态事件触发与动态事件触发。与前者相比，动态事件触发机制具有更低的信号传输频率。然而，如何把动态事件触发机制与航天器编队的非合作博弈策略相结合，设计一种基于动态事件触发的离散分布式非合作博弈方法一直是目前的一个难题。本发明专利提出了一种基于动态事件触发的离散分布式非合作博弈方法，既能保证纳什平衡点的求解，也能降低信号传输频率，节约能量。

发明内容

针对现有技术中的航天器编队的非合作博弈策略无法与动态事件触发机制相结合，则存在只能保证纳什平衡点的求解，无法降低信号传输频率和节约能量的问题，本发明提供一种基于动态事件触发的航天器编队离散分布式非合作博弈方法，该方法既能保证纳什平衡点的求解，也能降低信号传输频率，节约能量。

本发明是通过以下技术方案来实现：

一种基于动态事件触发的航天器编队离散分布式非合作博弈方法，包括如下步骤，

步骤1，构建航天器编队非合作博弈模型，个体航天器建立相邻航天器之间的通信连接，获取相邻航天器的状态信息；

步骤2，在航天器编队非合作博弈模型上建立分布式全局信息估计器，个体航天器建立与不相邻航天器之间的通信连接，个体航天器展开对航天器编队的全局信息进行估计；

步骤3，根据个体航天对航天器编队的全局信息展开估计，建立航天器编队信号传输的动态事件触发机制，输出个体航天器对全局信息估计数值；

步骤4，基于动态事件触发机制所输出的全局信息估计数值设计纳什平衡离散更新策略，完成航天器编队离散分布式非合作博弈策略。

优选的，步骤1中，建立n个航天器编队的通信拓扑图模型

其中V表示顶点组成的集合，V＝{v₁,v₂,…,v_n}是由有限个顶点组成的集合，v_i顶点表示第i个航天器；

表示航天器之间通信的链路；

为边集合；A＝[a_ij]为权重邻接矩阵，通过通信拓扑图模型

建立通信拓扑图模型

的Laplacian矩阵。

进一步的，通信拓扑图模型

的Laplacian矩阵为L＝D-A，其中，L为通信拓扑图模型

的Laplacian矩阵；D为对角矩阵，D＝diag{d₁,d₂,…,d_n}，

为第i个航天器的邻居航天器集合，

A＝[a_ij]为权重邻接矩阵。

优选的，步骤1中，建立第i个航天器的成本函数J_i(x_i,x_-i)，其中 J_i(x_i,x_-i)为已知的关于x_i的严格凸函数，

为第i个航天器的状态；

表示实数域；n_i为x_i的维数；x_-i表示除了第i个航天器的状态的所有其他航天器状态，即

优选的，步骤2中，定义

为第i个航天器对第j个航天器状态的估计值：

其中，

指第i个航天器对其它航天器状态的估计值；

为第i个航天器对其它航天器状态的估计值加上自身状态值；k表示迭代步数，属于正整数集。

进一步的，第i航天器估计其他航天的状态，建立如下状态估计器：

其中，

表示第j个航天器的邻居航天器经过通信网络收到的估计信息；

指第i个航天器对其它航天器状态的估计值；

为第i个航天器对其它航天器状态的估计值加上自身状态值；S_i为一个实数矩阵；μ_k为第k时刻的步长，且满足如下条件：

其中k表示迭代步数，属于正整数集。

更进一步的，S_i的具体形式为：

其中，n_<i＝∑_j<i n_j,n_>i＝∑_j>i n_j；S_i为一个实数矩阵，n表示航天器个数，I表示单位矩阵，0表示元素全部为零的矩阵。

优选的，步骤3中，对于第j个航天器，定义事件触发时刻序列为

对于

第j个航天器的邻居航天器收到的第 j个航天器的估计值为：

建立如下事件触发函数：

其中，

表示第k-1步与第k步的状态误差；

表示触发阈值，k₁为可调参数，ζ_j,k为一个内部动态变量，

为第i个航天器对其它航天器状态的估计值加上自身状态值；

表示第k-1步的信号传输值；

通过引入ζ_j,k可有效降低触发次数，且ζ_j,k满足如下动态方程：

其中，κ₂为可调参数，e_j,k为第j个航天器的传输估计值与实际估计值在第k时刻的误差，即

参数κ₁和k₂满足k₁>1,

为了保证纳什求解策略收敛到纳什平衡点，触发阈值

需满足如下不等式：

其中，β和δ为可调参数，满足β>0,0<δ<1；

表示触发阈值；

ξ_j,k表示动态事件触发机制的可调参数；ω_j,k表示动态事件触发机制的可调参数；

为了保证触发阈值

在状态稳定时趋向于0，ω_j,k,ξ_j,k表达式分别为：

对于第i个航天器，当

时，才会触发第i个航天器向其邻居航天器

传输状态信息，其中Φ表示动态事件触发函数；

为第i个航天器的邻居航天器集；ω_j,k表示动态事件触发机制的可调参数。

优选的，步骤4中，基于动态事件触发机制，设计如下纳什平衡离散更新策略u_i,k：

其中，R_i为一个实数矩阵，R_i的具体形式为：

μ_k表示第k时刻的步长；

为第i个航天器对其它航天器状态的估计值加上自身状态值；

表示第j个航天器的邻居航天器经过通信网络收到的估计信息；J_i表示成本函数

为成本函数

的梯度，即

u_i,k不断更新状态x_i,k，最终收敛于纳什平衡点

与现有技术相比，本发明具有以下有益的技术效果：

本发明提供一种基于动态事件触发的离散分布式非合作博弈方法，通过构建航天器编队非合作博弈模型，构成了航天器编队系统，为航天器编队离散分布式非合作博弈策略提供了基础，在航天器编队非合作博弈模型上建立分布式全局信息估计器，个体航天器建立与不相邻航天器之间的通信连接，个体航天器展开对航天器编队的全局信息进行估计；并通过航天器编队信号传输的动态事件触发机制，输出个体航天器对全局信息估计数值，可大大降低信号传输频率，节约能量，实现了纳什平衡点的求法。

进一步的，建立n个航天器编队的通信拓扑图模型，为后续分布式非合作博弈策略和动态事件触发提供了基础。

进一步的，建立通信拓扑图模型g的Laplacian矩阵，可有效简化后续分布式非合作博弈策略的表达。

进一步的，建立第i个航天器的成本函数，描述目标函数与航天器状态的函数关系。

进一步的，定义

为第i个航天器对第j个航天器状态的估计值，便于将航天器编队信号传输的动态时间触发机制进行输出。；

进一步的，建立航天器编队信号传输的动态事件触发机制，有效的减少了信号传输频率。

进一步的，设计如下纳什平衡离散更新策略u_i,k，保证纳什平衡点的求解。

附图说明

图1为本发明基于动态事件触发的航天器编队离散分布式非合作博弈方法的流程图。

具体实施方式

下面结合具体的实施例对本发明做进一步的详细说明，所述是对本发明的解释而不是限定。

实施例

本发明提供一种基于动态事件触发的航天器编队离散分布式非合作博弈方法，如图1所示，包括如下步骤，

本发明中建立n个航天器编队的通信拓扑图模型

其中

表示顶点组成的集合，

是由有限个顶点组成的集合，v_i顶点表示第i个航天器；

表示航天器之间通信的链路；

为边集合； A＝[a_ij]为权重邻接矩阵，通过通信拓扑图模型

建立通信拓扑图模型

的 Laplacian矩阵。

通信拓扑图模型

的Laplacian矩阵为L＝D-A，其中，L为通信拓扑图模型

的Laplacian矩阵；D为对角矩阵，D＝diag{d₁,d₂,…,d_n}，

为第i个航天器的邻居航天器集合，

[a_ij]为权重邻接矩阵，本发明中令n＝7，故：

建立第i个航天器的成本函数J_i(x_i,x_-i)，其中J_i(x_i,x_-i)为已知的关于x_i的严格凸函数，

为第i个航天器的状态；

示实数域；n_i为x_i的维数；x_-i表示除了第i个航天器的状态的所有其他航天器状态，即

在本实例中，n_i＝1，J_i(x_i,x_-i)具体函数形式如下：

其中，c_i是成本价格参数，b_i是权重参数，P_i,max为x_i的最大值约束，g_i,j是航天器i到航天器j的信道增益，σ_j为第j个航天器收到的背景噪声。具体数值如下：

c_i＝0.1,P_i,max＝3,b_i＝1,σ_i＝10^-6，

为了实现纳什平衡点，建立如下离散状态更新方程：

x_i,k+1＝x_i,k+u_i,k

其中，x_i,k为第i个航天器第k时刻的状态；u_i,k为第i个航天器第k时刻的更新策略。

建立分布式全局信息估计器

在航天器编队中，由于个体航天器i只能与其邻居航天器

进行通信，仅能获取其邻居航天器的状态信息，因此，个体航天器i需要对航天器编队的全局信息进行估计。首先定义

为第i个航天器对第j个航天器状态的估计值；令

其中，

指第i个航天器对其它航天器状态的估计值；

对于第i个航天器，为了估计其它航天器的状态，建立如下状态估计器：

其中，

表示第j个航天器的邻居航天器经过通信网络收到的估计信息。 μ_k为第k时刻的步长，满足如下条件：

S_i为一个实数矩阵，具体形式为：

其中，

为了减少信号传输频率，建立航天器编队信号传输的动态事件触发机制。对于第j个航天器，定义事件触发时刻序列为

对于

第j个航天器的邻居航天器收到的第j个航天器的估计值为：

建立如下事件触发函数：

其中，

表示第k-1步与第k步的状态误差；

表示触发阈值，κ₁为可调参数，ζ_j,k为一个内部动态变量，

为第i个航天器对其它航天器状态的估计值加上自身状态值；

表示第k-1步的信号传输值；

通过引入ζ_j,k可有效降低触发次数，且ζ_j,k且满足如下动态方程：

其中，其中，k₂为可调参数，e_j,k为第j个航天器的传输估计值与实际估计值在第k时刻的误差，即

参数k₁和k₂满足k₁>1,

为了保证纳什求解策略收敛到纳什平衡点，触发阈值

满足如下不等式：

其中，β和δ为可调参数，满足β>0,0<δ<1；

表示触发阈值； ξ_j,k表示动态事件触发机制的可调参数；ω_j,k表示动态事件触发机制的可调参数；

为了保证触发阈值

在状态稳定时趋向于0，ω_j,k,ξ_j,k表达式分别为：

对于第i个航天器，当

时，才会触发第i个航天器向其邻居航天器

传输状态信息，其中Φ表示动态事件触发函数；

为第i个航天器的邻居航天器集；ω_j,k表示动态事件触发机制的可调参数；

在本实例中，κ₁＝3.7,κ₂＝0.8,β＝80,δ＝0.4,μ_k＝0.05(k+1)^-0.01。

基于动态事件触发机制，设计如下纳什平衡离散更新策略u_i,k，其表达式如下：

R_i为一个实数矩阵，R_i的具体形式为：

μ_k表示第k时刻的步长；

为第i个航天器对其它航天器状态的估计值加上自身状态值；

表示第j个航天器的邻居航天器经过通信网络收到的估计信息； J_i表示成本函数

为成本函数

的梯度，即

u_i,k不断更新状态x_i,k，最终收敛于纳什平衡点

本发明所设计的离散分布式非合作博弈策略易于在工程中实现；采用的动态事件触发机制可大大降低个体航天器之间的信息交互频率，节约能量。

本发明未详细说明部分属于领域技术人员公知常识。

Claims

1.一种基于动态事件触发的航天器编队离散分布式非合作博弈方法，其特征在于，包括如下步骤，

建立n个航天器编队的通信拓扑图模型

其中

表示顶点组成的集合，

是由有限个顶点组成的集合，v_i顶点表示第i个航天器；

表示航天器之间通信的链路；

为边集合；A＝[a_ij]为权重邻接矩阵，通过通信拓扑图模型

建立通信拓扑图模型

的Laplacian矩阵；

通信拓扑图模型

的Laplacian矩阵为L＝D-A，其中，L为通信拓扑图模型

的Laplacian矩阵；D为对角矩阵，D＝diag{d₁,d₂,…,d_n}，

为第i个航天器的邻居航天器集合，

A＝[a_ij]为权重邻接矩阵；

为第i个航天器的状态；

定义

为第i个航天器对第j个航天器状态的估计值：

其中，

指第i个航天器对其它航天器状态的估计值；

为第i个航天器对其它航天器状态的估计值加上自身状态值；k表示迭代步数，属于正整数集；

第i航天器估计其他航天的状态，建立如下状态估计器：

其中，

指第i个航天器对其它航天器状态的估计值；

其中k表示迭代步数，属于正整数集；

S_i的具体形式为：

其中，n_＜i＝∑_j＜in_j,n_＞i＝∑_j＞ib_j；S_i为一个实数矩阵，n表示航天器个数，I表示单位矩阵，0表示元素全部为零的矩阵；

对于第j个航天器，定义事件触发时刻序列为

对于

第j个航天器的邻居航天器收到的第j个航天器的估计值为：

建立如下事件触发函数：

其中，

表示第k-1步与第k步的状态误差；

为第i个航天器对其它航天器状态的估计值加上自身状态值；

表示第k-1步的信号传输值；

参数κ₁和κ₂满足κ₁＞1,

为了保证纳什求解策略收敛到纳什平衡点，触发阈值

需满足如下不等式：

其中，β和δ为可调参数，满足β＞0,0＜δ＜1；

表示触发阈值；ξ_j,k表示动态事件触发机制的可调参数；_j,k表示动态事件触发机制的可调参数；

为了保证触发阈值

在状态稳定时趋向于0，ω_j,k,ξ_j,k表达式分别为：

对于第i个航天器，当

时，才会触发第i个航天器向其邻居航天器j，

传输状态信息，其中Φ表示动态事件触发函数；

步骤4，基于动态事件触发机制所输出的全局信息估计数值设计纳什平衡离散更新策略，完成航天器编队离散分布式非合作博弈策略；

基于动态事件触发机制，设计如下纳什平衡离散更新策略u_i,k：

其中，R_i为一个实数矩阵，R_i的具体形式为：

μ_k表示第k时刻的步长；

为第i个航天器对其它航天器状态的估计值加上自身状态值；

表示第j个航天器的邻居航天器经过通信网络收到的估计信息；J_i表示成本函数，

为成本函数

的梯度，即

u_i,k不断更新状态x_i,k，最终收敛于纳什平衡点