CN112558471B - 一种基于动态事件触发的航天器编队离散分布式非合作博弈方法 - Google Patents
一种基于动态事件触发的航天器编队离散分布式非合作博弈方法 Download PDFInfo
- Publication number
- CN112558471B CN112558471B CN202011334538.8A CN202011334538A CN112558471B CN 112558471 B CN112558471 B CN 112558471B CN 202011334538 A CN202011334538 A CN 202011334538A CN 112558471 B CN112558471 B CN 112558471B
- Authority
- CN
- China
- Prior art keywords
- spacecraft
- spacecrafts
- ith
- state
- formation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000015572 biosynthetic process Effects 0.000 title claims abstract description 54
- 238000000034 method Methods 0.000 title claims abstract description 21
- 238000004891 communication Methods 0.000 claims abstract description 36
- 230000007246 mechanism Effects 0.000 claims abstract description 30
- 230000008054 signal transmission Effects 0.000 claims abstract description 21
- 239000011159 matrix material Substances 0.000 claims description 28
- 238000013461 design Methods 0.000 claims description 6
- 230000014509 gene expression Effects 0.000 claims description 5
- 230000001960 triggered effect Effects 0.000 claims description 3
- 230000005540 biological transmission Effects 0.000 claims description 2
- 238000005755 formation reaction Methods 0.000 description 39
- 238000011161 development Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 108091092878 Microsatellite Proteins 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B13/00—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
- G05B13/02—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
- G05B13/04—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
- G05B13/042—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Automation & Control Theory (AREA)
- Mobile Radio Communication Systems (AREA)
Abstract
本发明提供一种基于动态事件触发的航天器编队离散分布式非合作博弈方法,包括如下步骤,步骤1构建航天器编队非合作博弈模型,个体航天器建立相邻航天器之间的通信连接,获取相邻航天器的状态信息;步骤2在航天器编队非合作博弈模型上建立分布式全局信息估计器,个体航天器建立与不相邻航天器之间的通信连接,个体航天器展开对航天器编队的全局信息进行估计;步骤3根据个体航天对航天器编队的全局信息展开估计,建立航天器编队信号传输的动态事件触发机制,输出个体航天器对全局信息估计数值;步骤4基于动态事件触发机制所输出的全局信息估计数值设计纳什平衡离散更新策略,完成航天器编队离散分布式非合作博弈策略。
Description
技术领域
本发明涉及飞行器决策领域,具体为一种基于动态事件触发的航天器编 队离散分布式非合作博弈方法。
背景技术
从20世纪90年代起,随着微小卫星和分布式空间系统等航天技术的发 展,航天器编队飞行技术的概念一经提出,便以其独特的优势成为目前航天 领域的研究热点。航天器编队具有功能多样化、成本低、可靠性高、扩展性 强等优点。近年来,随着在空间任务中国际合作越来越广泛,由多个国家组 成的大型航天器编队成为未来空间探索建设中主要发展趋势。因此,寻求一 种航天器编队的非合作博弈方法尤为重要。此外,在航天器编队执行任务过 程中,个体航天器之间需要进行频繁的信息交互,这往往要消耗大量的能量。 对于能量有限的航天器来说,设计一种信号传输协议,降低不必要的信号传 输,进而节约能量,显得尤其重要。
针对多智能体系统的非合作博弈策略,目前已经提出了多种求解方法。 常见的有基于梯度信息的纳什平衡连续求解方法、基于一致性协议的连续求 解方法。目前大部分实际系统中都采用数字信号传输与控制,然而以上求解 方法主要针对的是连续系统,不能适用于现代数字控制系统。因此,目前亟 需设计一种离散纳什平衡求解方法,便于工程实现。此外,事件触发机制广 泛应用于各类大型系统中,用以减少信号传输频率。目前,主要存在两类事 件触发机制:静态事件触发与动态事件触发。与前者相比,动态事件触发机 制具有更低的信号传输频率。然而,如何把动态事件触发机制与航天器编队 的非合作博弈策略相结合,设计一种基于动态事件触发的离散分布式非合作 博弈方法一直是目前的一个难题。本发明专利提出了一种基于动态事件触发 的离散分布式非合作博弈方法,既能保证纳什平衡点的求解,也能降低信号 传输频率,节约能量。
发明内容
针对现有技术中的航天器编队的非合作博弈策略无法与动态事件触发机 制相结合,则存在只能保证纳什平衡点的求解,无法降低信号传输频率和节 约能量的问题,本发明提供一种基于动态事件触发的航天器编队离散分布式 非合作博弈方法,该方法既能保证纳什平衡点的求解,也能降低信号传输频 率,节约能量。
本发明是通过以下技术方案来实现:
一种基于动态事件触发的航天器编队离散分布式非合作博弈方法,包括 如下步骤,
步骤1,构建航天器编队非合作博弈模型,个体航天器建立相邻航天器 之间的通信连接,获取相邻航天器的状态信息;
步骤2,在航天器编队非合作博弈模型上建立分布式全局信息估计器, 个体航天器建立与不相邻航天器之间的通信连接,个体航天器展开对航天器 编队的全局信息进行估计;
步骤3,根据个体航天对航天器编队的全局信息展开估计,建立航天器 编队信号传输的动态事件触发机制,输出个体航天器对全局信息估计数值;
步骤4,基于动态事件触发机制所输出的全局信息估计数值设计纳什平 衡离散更新策略,完成航天器编队离散分布式非合作博弈策略。
优选的,步骤1中,建立n个航天器编队的通信拓扑图模型其中V表示顶点组成的集合,V={v1,v2,…,vn}是由有限个顶点组成的集合,vi顶点表示第i个航天器;表示航天器之间通信的链路;为边集 合;A=[aij]为权重邻接矩阵,通过通信拓扑图模型建立通信拓扑图模型 的Laplacian矩阵。
进一步的,通信拓扑图模型的Laplacian矩阵为L=D-A,其中,L为 通信拓扑图模型的Laplacian矩阵;D为对角矩阵,D=diag{d1,d2,…,dn}, 为第i个航天器的邻居航天器集合, A=[aij]为权重邻接矩阵。
优选的,步骤1中,建立第i个航天器的成本函数Ji(xi,x-i),其中 Ji(xi,x-i)为已知的关于xi的严格凸函数,为第i个航天器的状态;表示实数域;ni为xi的维数;x-i表示除了第i个航天器的状态的所有其他航 天器状态,即
进一步的,第i航天器估计其他航天的状态,建立如下状态估计器:
其中,表示第j个航天器的邻居航天器经过通信网络收到的估计信息; 指第i个航天器对其它航天器状态的估计值;为第i个航天器对其它 航天器状态的估计值加上自身状态值;Si为一个实数矩阵;μk为第k时刻的 步长,且满足如下条件:
其中k表示迭代步数,属于正整数集。
更进一步的,Si的具体形式为:
其中,n<i=∑j<i nj,n>i=∑j>i nj;Si为一个实数矩阵,n表示航天器 个数,I表示单位矩阵,0表示元素全部为零的矩阵。
通过引入ζj,k可有效降低触发次数,且ζj,k满足如下动态方程:
ξj,k表示动态事件触发机制的可调参数;ωj,k表示动态事件触发机制的可调 参数;
优选的,步骤4中,基于动态事件触发机制,设计如下纳什平衡离散更 新策略ui,k:
其中,Ri为一个实数矩阵,Ri的具体形式为: μk表示第k时刻的步长;为第i个航天器对其它 航天器状态的估计值加上自身状态值;表示第j个航天器的邻居航天器经 过通信网络收到的估计信息;Ji表示成本函数为成本函数的梯 度,即ui,k不断更新状态xi,k,最终收敛于纳什平衡点
与现有技术相比,本发明具有以下有益的技术效果:
本发明提供一种基于动态事件触发的离散分布式非合作博弈方法,通过 构建航天器编队非合作博弈模型,构成了航天器编队系统,为航天器编队离 散分布式非合作博弈策略提供了基础,在航天器编队非合作博弈模型上建立 分布式全局信息估计器,个体航天器建立与不相邻航天器之间的通信连接, 个体航天器展开对航天器编队的全局信息进行估计;并通过航天器编队信号 传输的动态事件触发机制,输出个体航天器对全局信息估计数值,可大大降 低信号传输频率,节约能量,实现了纳什平衡点的求法。
进一步的,建立n个航天器编队的通信拓扑图模型,为后续分布式非合 作博弈策略和动态事件触发提供了基础。
进一步的,建立通信拓扑图模型g的Laplacian矩阵,可有效简化后续分 布式非合作博弈策略的表达。
进一步的,建立第i个航天器的成本函数,描述目标函数与航天器状态 的函数关系。
进一步的,建立航天器编队信号传输的动态事件触发机制,有效的减少 了信号传输频率。
进一步的,设计如下纳什平衡离散更新策略ui,k,保证纳什平衡点的求 解。
附图说明
图1为本发明基于动态事件触发的航天器编队离散分布式非合作博弈方 法的流程图。
具体实施方式
下面结合具体的实施例对本发明做进一步的详细说明,所述是对本发明 的解释而不是限定。
实施例
本发明提供一种基于动态事件触发的航天器编队离散分布式非合作博弈 方法,如图1所示,包括如下步骤,
步骤1,构建航天器编队非合作博弈模型,个体航天器建立相邻航天器 之间的通信连接,获取相邻航天器的状态信息;
步骤2,在航天器编队非合作博弈模型上建立分布式全局信息估计器, 个体航天器建立与不相邻航天器之间的通信连接,个体航天器展开对航天器 编队的全局信息进行估计;
步骤3,根据个体航天对航天器编队的全局信息展开估计,建立航天器 编队信号传输的动态事件触发机制,输出个体航天器对全局信息估计数值;
步骤4,基于动态事件触发机制所输出的全局信息估计数值设计纳什平 衡离散更新策略,完成航天器编队离散分布式非合作博弈策略。
本发明中建立n个航天器编队的通信拓扑图模型其中表 示顶点组成的集合,是由有限个顶点组成的集合,vi顶点 表示第i个航天器;表示航天器之间通信的链路;为边集合; A=[aij]为权重邻接矩阵,通过通信拓扑图模型建立通信拓扑图模型的 Laplacian矩阵。
通信拓扑图模型的Laplacian矩阵为L=D-A,其中,L为通信拓扑图 模型的Laplacian矩阵;D为对角矩阵,D=diag{d1,d2,…,dn}, 为第i个航天器的邻居航天器集合, [aij]为权重邻接矩阵,本发明中令n=7,故:
建立第i个航天器的成本函数Ji(xi,x-i),其中Ji(xi,x-i)为已知的关于xi的严格凸函数,为第i个航天器的状态;示实数域;ni为xi的维 数;x-i表示除了第i个航天器的状态的所有其他航天器状态,即 在本实例中,ni=1,Ji(xi,x-i)具体函数形式如下:
其中,ci是成本价格参数,bi是权重参数,Pi,max为xi的最大值约束,gi,j是航天器i到航天器j的信道增益,σj为第j个航天器收到的背景噪声。具体 数值如下:
ci=0.1,Pi,max=3,bi=1,σi=10-6,
为了实现纳什平衡点,建立如下离散状态更新方程:
xi,k+1=xi,k+ui,k
其中,xi,k为第i个航天器第k时刻的状态;ui,k为第i个航天器第k时刻 的更新策略。
建立分布式全局信息估计器
在航天器编队中,由于个体航天器i只能与其邻居航天器进行通 信,仅能获取其邻居航天器的状态信息,因此,个体航天器i需要对航天器 编队的全局信息进行估计。首先定义为第i个航天器对第j个航天器状态 的估计值;令
对于第i个航天器,为了估计其它航天器的状态,建立如下状态估计器:
Si为一个实数矩阵,具体形式为:
通过引入ζj,k可有效降低触发次数,且ζj,k且满足如下动态方程:
在本实例中,κ1=3.7,κ2=0.8,β=80,δ=0.4,μk=0.05(k+1)-0.01。
基于动态事件触发机制,设计如下纳什平衡离散更新策略ui,k,其表达 式如下:
Ri为一个实数矩阵,Ri的具体形式为:μk表示第k时刻的步长;为第i个航天器对其它航天器状态的估计值加上自 身状态值;表示第j个航天器的邻居航天器经过通信网络收到的估计信息; Ji表示成本函数为成本函数的梯度,即ui,k不断更新状态xi,k,最终收敛于纳什平衡点
本发明所设计的离散分布式非合作博弈策略易于在工程中实现;采用的 动态事件触发机制可大大降低个体航天器之间的信息交互频率,节约能量。
本发明未详细说明部分属于领域技术人员公知常识。
Claims (1)
1.一种基于动态事件触发的航天器编队离散分布式非合作博弈方法,其特征在于,包括如下步骤,
步骤1,构建航天器编队非合作博弈模型,个体航天器建立相邻航天器之间的通信连接,获取相邻航天器的状态信息;
建立n个航天器编队的通信拓扑图模型其中表示顶点组成的集合,是由有限个顶点组成的集合,vi顶点表示第i个航天器;表示航天器之间通信的链路;为边集合;A=[aij]为权重邻接矩阵,通过通信拓扑图模型建立通信拓扑图模型的Laplacian矩阵;
通信拓扑图模型的Laplacian矩阵为L=D-A,其中,L为通信拓扑图模型的Laplacian矩阵;D为对角矩阵,D=diag{d1,d2,…,dn}, 为第i个航天器的邻居航天器集合,A=[aij]为权重邻接矩阵;
建立第i个航天器的成本函数Ji(xi,x-i),其中Ji(xi,x-i)为已知的关于xi的严格凸函数,为第i个航天器的状态;表示实数域;ni为xi的维数;x-i表示除了第i个航天器的状态的所有其他航天器状态,即
步骤2,在航天器编队非合作博弈模型上建立分布式全局信息估计器,个体航天器建立与不相邻航天器之间的通信连接,个体航天器展开对航天器编队的全局信息进行估计;
第i航天器估计其他航天的状态,建立如下状态估计器:
其中,表示第j个航天器的邻居航天器经过通信网络收到的估计信息;指第i个航天器对其它航天器状态的估计值;为第i个航天器对其它航天器状态的估计值加上自身状态值;Si为一个实数矩阵;μk为第k时刻的步长,且满足如下条件:
其中k表示迭代步数,属于正整数集;
Si的具体形式为:
其中,n<i=∑j<inj,n>i=∑j>ibj;Si为一个实数矩阵,n表示航天器个数,I表示单位矩阵,0表示元素全部为零的矩阵;
步骤3,根据个体航天对航天器编队的全局信息展开估计,建立航天器编队信号传输的动态事件触发机制,输出个体航天器对全局信息估计数值;
通过引入ζj,k可有效降低触发次数,且ζj,k满足如下动态方程:
步骤4,基于动态事件触发机制所输出的全局信息估计数值设计纳什平衡离散更新策略,完成航天器编队离散分布式非合作博弈策略;
基于动态事件触发机制,设计如下纳什平衡离散更新策略ui,k:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011334538.8A CN112558471B (zh) | 2020-11-24 | 2020-11-24 | 一种基于动态事件触发的航天器编队离散分布式非合作博弈方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011334538.8A CN112558471B (zh) | 2020-11-24 | 2020-11-24 | 一种基于动态事件触发的航天器编队离散分布式非合作博弈方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112558471A CN112558471A (zh) | 2021-03-26 |
CN112558471B true CN112558471B (zh) | 2022-05-24 |
Family
ID=75043512
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011334538.8A Active CN112558471B (zh) | 2020-11-24 | 2020-11-24 | 一种基于动态事件触发的航天器编队离散分布式非合作博弈方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112558471B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114047758B (zh) * | 2021-11-08 | 2024-06-14 | 东南大学 | 基于Q-learning的多移动机器人编队方法 |
CN114826933B (zh) * | 2022-06-29 | 2022-09-09 | 中国人民解放军国防科技大学 | 一种基于节点位置未知的非协作式拓扑推断方法 |
CN115616913A (zh) * | 2022-07-05 | 2023-01-17 | 北京理工大学 | 基于分布式演化博弈的模型预测无领导者编队控制方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108445748A (zh) * | 2018-02-02 | 2018-08-24 | 北京航空航天大学 | 一种基于事件触发机制的自适应航天器姿态跟踪控制方法 |
CN109002058A (zh) * | 2018-09-10 | 2018-12-14 | 北京航空航天大学 | 基于事件触发的航天器编队飞行相对位置协同控制方法 |
CN109379125A (zh) * | 2018-09-30 | 2019-02-22 | 北京航空航天大学 | 一种多智能体编队控制方法及系统 |
CN109491396A (zh) * | 2018-12-28 | 2019-03-19 | 辽宁工业大学 | 一种多智能体事件驱动编队控制系统及方法 |
CN109507880A (zh) * | 2018-10-17 | 2019-03-22 | 东北大学 | 一种事件驱动策略的多智能体一致性控制方法 |
CN111638726A (zh) * | 2020-05-27 | 2020-09-08 | 北京理工大学 | 基于事件触发通信的多无人机编队一致性控制方法 |
-
2020
- 2020-11-24 CN CN202011334538.8A patent/CN112558471B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108445748A (zh) * | 2018-02-02 | 2018-08-24 | 北京航空航天大学 | 一种基于事件触发机制的自适应航天器姿态跟踪控制方法 |
CN109002058A (zh) * | 2018-09-10 | 2018-12-14 | 北京航空航天大学 | 基于事件触发的航天器编队飞行相对位置协同控制方法 |
CN109379125A (zh) * | 2018-09-30 | 2019-02-22 | 北京航空航天大学 | 一种多智能体编队控制方法及系统 |
CN109507880A (zh) * | 2018-10-17 | 2019-03-22 | 东北大学 | 一种事件驱动策略的多智能体一致性控制方法 |
CN109491396A (zh) * | 2018-12-28 | 2019-03-19 | 辽宁工业大学 | 一种多智能体事件驱动编队控制系统及方法 |
CN111638726A (zh) * | 2020-05-27 | 2020-09-08 | 北京理工大学 | 基于事件触发通信的多无人机编队一致性控制方法 |
Non-Patent Citations (2)
Title |
---|
Dynamic Event-Triggered State Estimation for Discrete-Time Singularly Perturbed Systems With Distributed Time-Delays;Lei Ma 等;《IEEE Transactions on Systems, Man, and Cybernetics: Systems》;20181113;第50卷(第9期);第3258-3268页 * |
Fault-Tolerant Optimal Control for Discrete-Time Nonlinear System Subjected to Input Saturation: A Dynamic Event-Triggered Approach;Peng Zhang 等;《IEEE Transactions on Cybernetics》;20190701;第51卷(第6期);第2956-2968页 * |
Also Published As
Publication number | Publication date |
---|---|
CN112558471A (zh) | 2021-03-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112558471B (zh) | 一种基于动态事件触发的航天器编队离散分布式非合作博弈方法 | |
CN111638726B (zh) | 基于事件触发通信的多无人机编队一致性控制方法 | |
CN111176327B (zh) | 一种多智能体系统合围控制方法及系统 | |
CN114422363B (zh) | 一种无人机搭载ris辅助通信系统容量优化方法及装置 | |
CN111284732B (zh) | 一种基于事件触发通信的航天器抗干扰姿态协同控制方法 | |
CN110673649A (zh) | 基于拓扑优化的时变信道下无人机编队一致性控制方法、系统、装置及存储介质 | |
CN109687845B (zh) | 一种鲁棒的簇稀疏正则化多任务自适应滤波器网络 | |
CN109756946B (zh) | 一种多智能体协同调控编队方法 | |
CN106330219A (zh) | 一种基于递归网络的无源互调干扰对消系统及方法 | |
CN112099516B (zh) | 一种基于模糊线性化理论的卫星集群姿态跟踪控制方法 | |
CN112291800A (zh) | 一种针对多卫星通讯网络的抗网络攻击图博弈控制方法 | |
CN113886460A (zh) | 低带宽分布式深度学习方法 | |
Talebi et al. | Distributed Kalman filtering: Consensus, diffusion, and mixed | |
CN113258984B (zh) | 多用户自适应频偏消除方法、装置、存储介质及低轨卫星通信系统 | |
CN114124185B (zh) | 一种优化irs辅助通信系统中相移矩阵的低复杂度方法 | |
CN106982099A (zh) | 一种基于链路噪声的变步长分布式自适应参数估计方法 | |
CN114564044B (zh) | 一种输入限幅事件触发的无人机有限时间编队控制方法 | |
CN115967421A (zh) | 一种分布式天线系统下联合参数估计与信号重构的方法及系统 | |
CN113515066B (zh) | 一种非线性多智能体系统动态事件触发控制方法 | |
CN112747742B (zh) | 一种基于卡尔曼滤波的终端位置自适应更新方法 | |
CN115980810A (zh) | 一种基于因子图优化的精密单点定位方法 | |
CN113655474A (zh) | 针对组网雷达目标跟踪的功率带宽联合分配方法 | |
CN111666688A (zh) | 一种修正的角度失配结合稀疏贝叶斯学习的信道估计算法 | |
CN112714165B (zh) | 一种基于组合机制的分布式网络协作策略优化方法和装置 | |
CN114326818B (zh) | 一种基于动态事件触发的无人机输出反馈协同控制系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |