CN112558471A - 一种基于动态事件触发的航天器编队离散分布式非合作博弈方法 - Google Patents

一种基于动态事件触发的航天器编队离散分布式非合作博弈方法 Download PDF

Info

Publication number
CN112558471A
CN112558471A CN202011334538.8A CN202011334538A CN112558471A CN 112558471 A CN112558471 A CN 112558471A CN 202011334538 A CN202011334538 A CN 202011334538A CN 112558471 A CN112558471 A CN 112558471A
Authority
CN
China
Prior art keywords
spacecraft
formation
dynamic event
spacecrafts
ith
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011334538.8A
Other languages
English (en)
Other versions
CN112558471B (zh
Inventor
袁源
张鹏
孙冲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Northwestern Polytechnical University
Original Assignee
Northwestern Polytechnical University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northwestern Polytechnical University filed Critical Northwestern Polytechnical University
Priority to CN202011334538.8A priority Critical patent/CN112558471B/zh
Publication of CN112558471A publication Critical patent/CN112558471A/zh
Application granted granted Critical
Publication of CN112558471B publication Critical patent/CN112558471B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/042Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本发明提供一种基于动态事件触发的航天器编队离散分布式非合作博弈方法,包括如下步骤,步骤1构建航天器编队非合作博弈模型,个体航天器建立相邻航天器之间的通信连接,获取相邻航天器的状态信息;步骤2在航天器编队非合作博弈模型上建立分布式全局信息估计器,个体航天器建立与不相邻航天器之间的通信连接,个体航天器展开对航天器编队的全局信息进行估计;步骤3根据个体航天对航天器编队的全局信息展开估计,建立航天器编队信号传输的动态事件触发机制,输出个体航天器对全局信息估计数值;步骤4基于动态事件触发机制所输出的全局信息估计数值设计纳什平衡离散更新策略,完成航天器编队离散分布式非合作博弈策略。

Description

一种基于动态事件触发的航天器编队离散分布式非合作博弈 方法
技术领域
本发明涉及飞行器决策领域,具体为一种基于动态事件触发的航天器编 队离散分布式非合作博弈方法。
背景技术
从20世纪90年代起,随着微小卫星和分布式空间系统等航天技术的发 展,航天器编队飞行技术的概念一经提出,便以其独特的优势成为目前航天 领域的研究热点。航天器编队具有功能多样化、成本低、可靠性高、扩展性 强等优点。近年来,随着在空间任务中国际合作越来越广泛,由多个国家组 成的大型航天器编队成为未来空间探索建设中主要发展趋势。因此,寻求一 种航天器编队的非合作博弈方法尤为重要。此外,在航天器编队执行任务过 程中,个体航天器之间需要进行频繁的信息交互,这往往要消耗大量的能量。 对于能量有限的航天器来说,设计一种信号传输协议,降低不必要的信号传 输,进而节约能量,显得尤其重要。
针对多智能体系统的非合作博弈策略,目前已经提出了多种求解方法。 常见的有基于梯度信息的纳什平衡连续求解方法、基于一致性协议的连续求 解方法。目前大部分实际系统中都采用数字信号传输与控制,然而以上求解 方法主要针对的是连续系统,不能适用于现代数字控制系统。因此,目前亟 需设计一种离散纳什平衡求解方法,便于工程实现。此外,事件触发机制广 泛应用于各类大型系统中,用以减少信号传输频率。目前,主要存在两类事 件触发机制:静态事件触发与动态事件触发。与前者相比,动态事件触发机 制具有更低的信号传输频率。然而,如何把动态事件触发机制与航天器编队 的非合作博弈策略相结合,设计一种基于动态事件触发的离散分布式非合作 博弈方法一直是目前的一个难题。本发明专利提出了一种基于动态事件触发 的离散分布式非合作博弈方法,既能保证纳什平衡点的求解,也能降低信号 传输频率,节约能量。
发明内容
针对现有技术中的航天器编队的非合作博弈策略无法与动态事件触发机 制相结合,则存在只能保证纳什平衡点的求解,无法降低信号传输频率和节 约能量的问题,本发明提供一种基于动态事件触发的航天器编队离散分布式 非合作博弈方法,该方法既能保证纳什平衡点的求解,也能降低信号传输频 率,节约能量。
本发明是通过以下技术方案来实现:
一种基于动态事件触发的航天器编队离散分布式非合作博弈方法,包括 如下步骤,
步骤1,构建航天器编队非合作博弈模型,个体航天器建立相邻航天器 之间的通信连接,获取相邻航天器的状态信息;
步骤2,在航天器编队非合作博弈模型上建立分布式全局信息估计器, 个体航天器建立与不相邻航天器之间的通信连接,个体航天器展开对航天器 编队的全局信息进行估计;
步骤3,根据个体航天对航天器编队的全局信息展开估计,建立航天器 编队信号传输的动态事件触发机制,输出个体航天器对全局信息估计数值;
步骤4,基于动态事件触发机制所输出的全局信息估计数值设计纳什平 衡离散更新策略,完成航天器编队离散分布式非合作博弈策略。
优选的,步骤1中,建立n个航天器编队的通信拓扑图模型
Figure BDA0002796802800000021
其中V表示顶点组成的集合,V={v1,v2,…,vn}是由有限个顶点组成的集合,vi顶点表示第i个航天器;
Figure BDA0002796802800000031
表示航天器之间通信的链路;
Figure BDA0002796802800000032
为边集 合;A=[aij]为权重邻接矩阵,通过通信拓扑图模型
Figure BDA0002796802800000033
建立通信拓扑图模型
Figure BDA0002796802800000034
的Laplacian矩阵。
进一步的,通信拓扑图模型
Figure BDA0002796802800000035
的Laplacian矩阵为L=D-A,其中,L为 通信拓扑图模型
Figure BDA0002796802800000036
的Laplacian矩阵;D为对角矩阵,D=diag{d1,d2,…,dn},
Figure BDA0002796802800000037
Figure BDA0002796802800000038
为第i个航天器的邻居航天器集合,
Figure BDA0002796802800000039
A=[aij]为权重邻接矩阵。
优选的,步骤1中,建立第i个航天器的成本函数Ji(xi,x-i),其中 Ji(xi,x-i)为已知的关于xi的严格凸函数,
Figure BDA00027968028000000310
为第i个航天器的状态;
Figure BDA00027968028000000311
表示实数域;ni为xi的维数;x-i表示除了第i个航天器的状态的所有其他航 天器状态,即
Figure BDA00027968028000000312
优选的,步骤2中,定义
Figure BDA00027968028000000313
为第i个航天器对第j个航天器状态的估计 值:
Figure BDA00027968028000000314
Figure BDA00027968028000000315
其中,
Figure BDA00027968028000000316
指第i个航天器对其它航天器状态的估计值;
Figure BDA00027968028000000317
为第i个航天器 对其它航天器状态的估计值加上自身状态值;k表示迭代步数,属于正整数 集。
进一步的,第i航天器估计其他航天的状态,建立如下状态估计器:
Figure BDA00027968028000000318
其中,
Figure BDA00027968028000000319
表示第j个航天器的邻居航天器经过通信网络收到的估计信息;
Figure BDA00027968028000000320
指第i个航天器对其它航天器状态的估计值;
Figure BDA00027968028000000321
为第i个航天器对其它 航天器状态的估计值加上自身状态值;Si为一个实数矩阵;μk为第k时刻的 步长,且满足如下条件:
Figure BDA0002796802800000041
其中k表示迭代步数,属于正整数集。
更进一步的,Si的具体形式为:
Figure BDA0002796802800000042
其中,n<i=∑j<i nj,n>i=∑j>i nj;Si为一个实数矩阵,n表示航天器 个数,I表示单位矩阵,0表示元素全部为零的矩阵。
优选的,步骤3中,对于第j个航天器,定义事件触发时刻序列为
Figure BDA0002796802800000043
Figure BDA0002796802800000044
对于
Figure BDA0002796802800000045
第j个航天器的邻居航天器收到的第 j个航天器的估计值为:
Figure BDA0002796802800000046
建立如下事件触发函数:
Figure BDA0002796802800000047
其中,
Figure BDA0002796802800000048
Figure BDA0002796802800000049
表示第k-1步与第k步的状态误差;
Figure BDA00027968028000000410
表 示触发阈值,k1为可调参数,ζj,k为一个内部动态变量,
Figure BDA00027968028000000411
为第i个航天器 对其它航天器状态的估计值加上自身状态值;
Figure BDA00027968028000000412
表示第k-1步的信号传输 值;
通过引入ζj,k可有效降低触发次数,且ζj,k满足如下动态方程:
Figure BDA00027968028000000413
其中,κ2为可调参数,ej,k为第j个航天器的传输估计值与实际估计值 在第k时刻的误差,即
Figure BDA00027968028000000414
参数κ1和k2满足k1>1,
Figure BDA00027968028000000415
Figure BDA00027968028000000416
为了保证纳什求解策略收敛到纳什平衡点,触发阈值
Figure BDA00027968028000000417
需满足如下不等 式:
Figure BDA00027968028000000418
其中,β和δ为可调参数,满足β>0,0<δ<1;
Figure BDA00027968028000000419
表示触发阈值;
ξj,k表示动态事件触发机制的可调参数;ωj,k表示动态事件触发机制的可调 参数;
为了保证触发阈值
Figure BDA0002796802800000051
在状态稳定时趋向于0,ωj,kj,k表达式分别为:
Figure BDA0002796802800000052
Figure BDA0002796802800000053
对于第i个航天器,当
Figure BDA0002796802800000054
时,才会触发第i个航天器向 其邻居航天器
Figure BDA0002796802800000055
传输状态信息,其中Φ表示动态事件触发函数;
Figure BDA0002796802800000056
为第i个航天器的邻居航天器集;ωj,k表示动态事件触发机制的可调参数。
优选的,步骤4中,基于动态事件触发机制,设计如下纳什平衡离散更 新策略ui,k
Figure BDA0002796802800000057
其中,Ri为一个实数矩阵,Ri的具体形式为:
Figure BDA0002796802800000058
Figure BDA0002796802800000059
μk表示第k时刻的步长;
Figure BDA00027968028000000510
为第i个航天器对其它 航天器状态的估计值加上自身状态值;
Figure BDA00027968028000000511
表示第j个航天器的邻居航天器经 过通信网络收到的估计信息;Ji表示成本函数
Figure BDA00027968028000000512
为成本函数
Figure BDA00027968028000000513
的梯 度,即
Figure BDA00027968028000000514
ui,k不断更新状态xi,k,最终收敛于纳什平衡点
Figure BDA00027968028000000515
与现有技术相比,本发明具有以下有益的技术效果:
本发明提供一种基于动态事件触发的离散分布式非合作博弈方法,通过 构建航天器编队非合作博弈模型,构成了航天器编队系统,为航天器编队离 散分布式非合作博弈策略提供了基础,在航天器编队非合作博弈模型上建立 分布式全局信息估计器,个体航天器建立与不相邻航天器之间的通信连接, 个体航天器展开对航天器编队的全局信息进行估计;并通过航天器编队信号 传输的动态事件触发机制,输出个体航天器对全局信息估计数值,可大大降 低信号传输频率,节约能量,实现了纳什平衡点的求法。
进一步的,建立n个航天器编队的通信拓扑图模型,为后续分布式非合 作博弈策略和动态事件触发提供了基础。
进一步的,建立通信拓扑图模型g的Laplacian矩阵,可有效简化后续分 布式非合作博弈策略的表达。
进一步的,建立第i个航天器的成本函数,描述目标函数与航天器状态 的函数关系。
进一步的,定义
Figure BDA0002796802800000061
为第i个航天器对第j个航天器状态的估计值,便于 将航天器编队信号传输的动态时间触发机制进行输出。;
进一步的,建立航天器编队信号传输的动态事件触发机制,有效的减少 了信号传输频率。
进一步的,设计如下纳什平衡离散更新策略ui,k,保证纳什平衡点的求 解。
附图说明
图1为本发明基于动态事件触发的航天器编队离散分布式非合作博弈方 法的流程图。
具体实施方式
下面结合具体的实施例对本发明做进一步的详细说明,所述是对本发明 的解释而不是限定。
实施例
本发明提供一种基于动态事件触发的航天器编队离散分布式非合作博弈 方法,如图1所示,包括如下步骤,
步骤1,构建航天器编队非合作博弈模型,个体航天器建立相邻航天器 之间的通信连接,获取相邻航天器的状态信息;
步骤2,在航天器编队非合作博弈模型上建立分布式全局信息估计器, 个体航天器建立与不相邻航天器之间的通信连接,个体航天器展开对航天器 编队的全局信息进行估计;
步骤3,根据个体航天对航天器编队的全局信息展开估计,建立航天器 编队信号传输的动态事件触发机制,输出个体航天器对全局信息估计数值;
步骤4,基于动态事件触发机制所输出的全局信息估计数值设计纳什平 衡离散更新策略,完成航天器编队离散分布式非合作博弈策略。
本发明中建立n个航天器编队的通信拓扑图模型
Figure BDA0002796802800000071
其中
Figure BDA00027968028000000717
表 示顶点组成的集合,
Figure BDA0002796802800000072
是由有限个顶点组成的集合,vi顶点 表示第i个航天器;
Figure BDA0002796802800000073
表示航天器之间通信的链路;
Figure BDA0002796802800000074
为边集合; A=[aij]为权重邻接矩阵,通过通信拓扑图模型
Figure BDA0002796802800000075
建立通信拓扑图模型
Figure BDA0002796802800000076
的 Laplacian矩阵。
通信拓扑图模型
Figure BDA0002796802800000077
的Laplacian矩阵为L=D-A,其中,L为通信拓扑图 模型
Figure BDA0002796802800000078
的Laplacian矩阵;D为对角矩阵,D=diag{d1,d2,…,dn},
Figure BDA0002796802800000079
Figure BDA00027968028000000710
Figure BDA00027968028000000711
为第i个航天器的邻居航天器集合,
Figure BDA00027968028000000712
Figure BDA00027968028000000713
[aij]为权重邻接矩阵,本发明中令n=7,故:
Figure BDA00027968028000000714
建立第i个航天器的成本函数Ji(xi,x-i),其中Ji(xi,x-i)为已知的关于xi的严格凸函数,
Figure BDA00027968028000000715
为第i个航天器的状态;
Figure BDA00027968028000000716
示实数域;ni为xi的维 数;x-i表示除了第i个航天器的状态的所有其他航天器状态,即
Figure BDA0002796802800000081
Figure BDA0002796802800000082
在本实例中,ni=1,Ji(xi,x-i)具体函数形式如下:
Figure BDA0002796802800000083
其中,ci是成本价格参数,bi是权重参数,Pi,max为xi的最大值约束,gi,j是航天器i到航天器j的信道增益,σj为第j个航天器收到的背景噪声。具体 数值如下:
ci=0.1,Pi,max=3,bi=1,σi=10-6
Figure BDA0002796802800000084
为了实现纳什平衡点,建立如下离散状态更新方程:
xi,k+1=xi,k+ui,k
其中,xi,k为第i个航天器第k时刻的状态;ui,k为第i个航天器第k时刻 的更新策略。
建立分布式全局信息估计器
在航天器编队中,由于个体航天器i只能与其邻居航天器
Figure BDA0002796802800000085
进行通 信,仅能获取其邻居航天器的状态信息,因此,个体航天器i需要对航天器 编队的全局信息进行估计。首先定义
Figure BDA0002796802800000086
为第i个航天器对第j个航天器状态 的估计值;令
Figure BDA0002796802800000087
其中,
Figure BDA0002796802800000091
指第i个航天器对其它航天器状态的估计值;
Figure BDA0002796802800000092
为第i个航天器 对其它航天器状态的估计值加上自身状态值;k表示迭代步数,属于正整数 集。
对于第i个航天器,为了估计其它航天器的状态,建立如下状态估计器:
Figure BDA0002796802800000093
其中,
Figure BDA0002796802800000094
表示第j个航天器的邻居航天器经过通信网络收到的估计信息。 μk为第k时刻的步长,满足如下条件:
Figure BDA0002796802800000095
Si为一个实数矩阵,具体形式为:
Figure BDA0002796802800000096
其中,
Figure BDA0002796802800000097
为了减少信号传输频率,建立航天器编队信号传输的动态事件触发机制。 对于第j个航天器,定义事件触发时刻序列为
Figure BDA0002796802800000098
对于
Figure BDA0002796802800000099
第j个航天器的邻居航天器收到的第j个航天器的估计值为:
Figure BDA00027968028000000910
建立如下事件触发函数:
Figure BDA00027968028000000911
其中,
Figure BDA00027968028000000912
Figure BDA00027968028000000913
表示第k-1步与第k步的状态误差;
Figure BDA00027968028000000914
表 示触发阈值,κ1为可调参数,ζj,k为一个内部动态变量,
Figure BDA00027968028000000915
为第i个航天器 对其它航天器状态的估计值加上自身状态值;
Figure BDA00027968028000000916
表示第k-1步的信号传输 值;
通过引入ζj,k可有效降低触发次数,且ζj,k且满足如下动态方程:
Figure BDA0002796802800000101
其中,其中,k2为可调参数,ej,k为第j个航天器的传输估计值与实际估 计值在第k时刻的误差,即
Figure BDA0002796802800000102
参数k1和k2满足k1>1,
Figure BDA0002796802800000103
Figure BDA0002796802800000104
为了保证纳什求解策略收敛到纳什平衡点,触发阈值
Figure BDA0002796802800000105
满足如下不 等式:
Figure BDA0002796802800000106
其中,β和δ为可调参数,满足β>0,0<δ<1;
Figure BDA0002796802800000107
表示触发阈值; ξj,k表示动态事件触发机制的可调参数;ωj,k表示动态事件触发机制的可调 参数;
为了保证触发阈值
Figure BDA0002796802800000108
在状态稳定时趋向于0,ωj,kj,k表达式分别为:
Figure BDA0002796802800000109
Figure BDA00027968028000001010
对于第i个航天器,当
Figure BDA00027968028000001011
时,才会触发第i个航天器向 其邻居航天器
Figure BDA00027968028000001012
传输状态信息,其中Φ表示动态事件触发函数;
Figure BDA00027968028000001013
为第i个航天器的邻居航天器集;ωj,k表示动态事件触发机制的可调参数;
在本实例中,κ1=3.7,κ2=0.8,β=80,δ=0.4,μk=0.05(k+1)-0.01
基于动态事件触发机制,设计如下纳什平衡离散更新策略ui,k,其表达 式如下:
Figure BDA00027968028000001014
Ri为一个实数矩阵,Ri的具体形式为:
Figure BDA00027968028000001015
μk表示第k时刻的步长;
Figure BDA00027968028000001016
为第i个航天器对其它航天器状态的估计值加上自 身状态值;
Figure BDA0002796802800000111
表示第j个航天器的邻居航天器经过通信网络收到的估计信息; Ji表示成本函数
Figure BDA0002796802800000112
为成本函数
Figure BDA0002796802800000113
的梯度,即
Figure BDA0002796802800000114
ui,k不断更新状态xi,k,最终收敛于纳什平衡点
Figure BDA0002796802800000115
本发明所设计的离散分布式非合作博弈策略易于在工程中实现;采用的 动态事件触发机制可大大降低个体航天器之间的信息交互频率,节约能量。
本发明未详细说明部分属于领域技术人员公知常识。

Claims (9)

1.一种基于动态事件触发的航天器编队离散分布式非合作博弈方法,其特征在于,包括如下步骤,
步骤1,构建航天器编队非合作博弈模型,个体航天器建立相邻航天器之间的通信连接,获取相邻航天器的状态信息;
步骤2,在航天器编队非合作博弈模型上建立分布式全局信息估计器,个体航天器建立与不相邻航天器之间的通信连接,个体航天器展开对航天器编队的全局信息进行估计;
步骤3,根据个体航天对航天器编队的全局信息展开估计,建立航天器编队信号传输的动态事件触发机制,输出个体航天器对全局信息估计数值;
步骤4,基于动态事件触发机制所输出的全局信息估计数值设计纳什平衡离散更新策略,完成航天器编队离散分布式非合作博弈策略。
2.根据权利要求1所述的一种基于动态事件触发的航天器编队离散分布式非合作博弈方法,其特征在于,步骤1中,建立n个航天器编队的通信拓扑图模型
Figure FDA0002796802790000011
其中
Figure FDA0002796802790000012
表示顶点组成的集合,
Figure FDA0002796802790000013
是由有限个顶点组成的集合,vi顶点表示第i个航天器;
Figure FDA0002796802790000014
表示航天器之间通信的链路;
Figure FDA0002796802790000015
为边集合;A=[aij]为权重邻接矩阵,通过通信拓扑图模型
Figure FDA0002796802790000016
建立通信拓扑图模型
Figure FDA0002796802790000017
的Laplacian矩阵。
3.根据权利要求2所述的一种基于动态事件触发的航天器编队离散分布式非合作博弈方法,其特征在于,通信拓扑图模型
Figure FDA0002796802790000018
的Laplacian矩阵为L=D-A,其中,L为通信拓扑图模型
Figure FDA0002796802790000019
的Laplacian矩阵;D为对角矩阵,D=diag{d1,d2,…,dn},
Figure FDA00027968027900000110
Figure FDA00027968027900000111
为第i个航天器的邻居航天器集合,
Figure FDA00027968027900000112
A=[aij]为权重邻接矩阵。
4.根据权利要求1所述的一种基于动态事件触发的航天器编队离散分布式非合作博弈方法,其特征在于,步骤1中,建立第i个航天器的成本函数Ji(xi,x-i),其中Ji(xi,x-i)为已知的关于xi的严格凸函数,
Figure FDA00027968027900000113
为第i个航天器的状态;
Figure FDA0002796802790000021
表示实数域;ni为xi的维数;x-i表示除了第i个航天器的状态的所有其他航天器状态,即
Figure FDA0002796802790000022
5.根据权利要求1所述的一种基于动态事件触发的航天器编队离散分布式非合作博弈方法,其特征在于,步骤2中,定义
Figure FDA0002796802790000023
为第i个航天器对第j个航天器状态的估计值:
Figure FDA0002796802790000024
Figure FDA0002796802790000025
其中,
Figure FDA0002796802790000026
指第i个航天器对其它航天器状态的估计值;
Figure FDA0002796802790000027
为第i个航天器对其它航天器状态的估计值加上自身状态值;k表示迭代步数,属于正整数集。
6.根据权利要求5所述的一种基于动态事件触发的航天器编队离散分布式非合作博弈方法,其特征在于,第i航天器估计其他航天的状态,建立如下状态估计器:
Figure FDA0002796802790000028
其中,
Figure FDA0002796802790000029
表示第j个航天器的邻居航天器经过通信网络收到的估计信息;
Figure FDA00027968027900000210
指第i个航天器对其它航天器状态的估计值;
Figure FDA00027968027900000211
为第i个航天器对其它航天器状态的估计值加上自身状态值;Si为一个实数矩阵;μk为第k时刻的步长,且满足如下条件:
Figure FDA00027968027900000212
其中k表示迭代步数,属于正整数集。
7.根据权利要求6所述的一种基于动态事件触发的航天器编队离散分布式非合作博弈方法,其特征在于,Si的具体形式为:
Figure FDA0002796802790000031
其中,n<i=∑j<inj,n>i=∑j>inj;Si为一个实数矩阵,n表示航天器个数,I表示单位矩阵,0表示元素全部为零的矩阵。
8.根据权利要求1所述的一种基于动态事件触发的航天器编队离散分布式非合作博弈方法,其特征在于,步骤3中,对于第j个航天器,定义事件触发时刻序列为
Figure FDA0002796802790000032
对于
Figure FDA0002796802790000033
第j个航天器的邻居航天器收到的第j个航天器的估计值为:
Figure FDA0002796802790000034
建立如下事件触发函数:
Figure FDA0002796802790000035
其中,
Figure FDA0002796802790000036
Figure FDA0002796802790000037
表示第k-1步与第k步的状态误差;
Figure FDA0002796802790000038
表示触发阈值,κ1为可调参数,ζj,k为一个内部动态变量,
Figure FDA0002796802790000039
为第i个航天器对其它航天器状态的估计值加上自身状态值;
Figure FDA00027968027900000310
表示第k-1步的信号传输值;
通过引入ζj,k可有效降低触发次数,且ζj,k满足如下动态方程:
Figure FDA00027968027900000311
其中,κ2为可调参数,ej,k为第j个航天器的传输估计值与实际估计值在第k时刻的误差,即
Figure FDA00027968027900000312
参数κ1和κ2满足κ1>1,
Figure FDA00027968027900000313
Figure FDA00027968027900000314
为了保证纳什求解策略收敛到纳什平衡点,触发阈值
Figure FDA00027968027900000315
需满足如下不等式:
Figure FDA00027968027900000316
其中,β和δ为可调参数,满足β>0,0<δ<1;
Figure FDA00027968027900000317
表示触发阈值;ξj,k表示动态事件触发机制的可调参数;ωj,k表示动态事件触发机制的可调参数;
为了保证触发阈值
Figure FDA0002796802790000041
在状态稳定时趋向于0,ωj,kj,k表达式分别为:
Figure FDA0002796802790000042
Figure FDA0002796802790000043
对于第i个航天器,当
Figure FDA0002796802790000044
时,才会触发第i个航天器向其邻居航天器
Figure FDA0002796802790000045
传输状态信息,其中Φ表示动态事件触发函数;
Figure FDA0002796802790000046
为第i个航天器的邻居航天器集;ωj,k表示动态事件触发机制的可调参数。
9.根据权利要求1所述的一种基于动态事件触发的航天器编队离散分布式非合作博弈方法,其特征在于,步骤4中,基于动态事件触发机制,设计如下纳什平衡离散更新策略ui,k
Figure FDA0002796802790000047
其中,Ri为一个实数矩阵,Ri的具体形式为:
Figure FDA0002796802790000048
μk表示第k时刻的步长;
Figure FDA0002796802790000049
为第i个航天器对其它航天器状态的估计值加上自身状态值;
Figure FDA00027968027900000410
表示第j个航天器的邻居航天器经过通信网络收到的估计信息;Ji表示成本函数
Figure FDA00027968027900000411
为成本函数
Figure FDA00027968027900000412
的梯度,即
Figure FDA00027968027900000413
ui,k不断更新状态xi,h,最终收敛于纳什平衡点
Figure FDA00027968027900000414
CN202011334538.8A 2020-11-24 2020-11-24 一种基于动态事件触发的航天器编队离散分布式非合作博弈方法 Active CN112558471B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011334538.8A CN112558471B (zh) 2020-11-24 2020-11-24 一种基于动态事件触发的航天器编队离散分布式非合作博弈方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011334538.8A CN112558471B (zh) 2020-11-24 2020-11-24 一种基于动态事件触发的航天器编队离散分布式非合作博弈方法

Publications (2)

Publication Number Publication Date
CN112558471A true CN112558471A (zh) 2021-03-26
CN112558471B CN112558471B (zh) 2022-05-24

Family

ID=75043512

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011334538.8A Active CN112558471B (zh) 2020-11-24 2020-11-24 一种基于动态事件触发的航天器编队离散分布式非合作博弈方法

Country Status (1)

Country Link
CN (1) CN112558471B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114047758A (zh) * 2021-11-08 2022-02-15 南京云智控产业技术研究院有限公司 基于Q-learning的多移动机器人编队方法
CN114826933A (zh) * 2022-06-29 2022-07-29 中国人民解放军国防科技大学 一种基于节点位置未知的非协作式拓扑推断方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108445748A (zh) * 2018-02-02 2018-08-24 北京航空航天大学 一种基于事件触发机制的自适应航天器姿态跟踪控制方法
CN109002058A (zh) * 2018-09-10 2018-12-14 北京航空航天大学 基于事件触发的航天器编队飞行相对位置协同控制方法
CN109379125A (zh) * 2018-09-30 2019-02-22 北京航空航天大学 一种多智能体编队控制方法及系统
CN109491396A (zh) * 2018-12-28 2019-03-19 辽宁工业大学 一种多智能体事件驱动编队控制系统及方法
CN109507880A (zh) * 2018-10-17 2019-03-22 东北大学 一种事件驱动策略的多智能体一致性控制方法
CN111638726A (zh) * 2020-05-27 2020-09-08 北京理工大学 基于事件触发通信的多无人机编队一致性控制方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108445748A (zh) * 2018-02-02 2018-08-24 北京航空航天大学 一种基于事件触发机制的自适应航天器姿态跟踪控制方法
CN109002058A (zh) * 2018-09-10 2018-12-14 北京航空航天大学 基于事件触发的航天器编队飞行相对位置协同控制方法
CN109379125A (zh) * 2018-09-30 2019-02-22 北京航空航天大学 一种多智能体编队控制方法及系统
CN109507880A (zh) * 2018-10-17 2019-03-22 东北大学 一种事件驱动策略的多智能体一致性控制方法
CN109491396A (zh) * 2018-12-28 2019-03-19 辽宁工业大学 一种多智能体事件驱动编队控制系统及方法
CN111638726A (zh) * 2020-05-27 2020-09-08 北京理工大学 基于事件触发通信的多无人机编队一致性控制方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
LEI MA 等: "Dynamic Event-Triggered State Estimation for Discrete-Time Singularly Perturbed Systems With Distributed Time-Delays", 《IEEE TRANSACTIONS ON SYSTEMS, MAN, AND CYBERNETICS: SYSTEMS》 *
PENG ZHANG 等: "Fault-Tolerant Optimal Control for Discrete-Time Nonlinear System Subjected to Input Saturation: A Dynamic Event-Triggered Approach", 《IEEE TRANSACTIONS ON CYBER​​NETICS》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114047758A (zh) * 2021-11-08 2022-02-15 南京云智控产业技术研究院有限公司 基于Q-learning的多移动机器人编队方法
CN114826933A (zh) * 2022-06-29 2022-07-29 中国人民解放军国防科技大学 一种基于节点位置未知的非协作式拓扑推断方法

Also Published As

Publication number Publication date
CN112558471B (zh) 2022-05-24

Similar Documents

Publication Publication Date Title
CN112558471B (zh) 一种基于动态事件触发的航天器编队离散分布式非合作博弈方法
CN110456807B (zh) 一种多航天器一致性动态增益控制方法
CN111638726B (zh) 基于事件触发通信的多无人机编队一致性控制方法
CN111176327B (zh) 一种多智能体系统合围控制方法及系统
CN110673649B (zh) 基于拓扑优化的时变信道下无人机编队一致性控制方法、系统、装置及存储介质
CN112291800B (zh) 一种针对多卫星通讯网络的抗网络攻击图博弈控制方法
CN111147409B (zh) 一种低轨卫星信道自适应均衡方法
CN108965186B (zh) 一种低轨卫星移动通信系统下行时频同步方法
CN111284732A (zh) 一种基于事件触发通信的航天器抗干扰姿态协同控制方法
Talebi et al. Distributed Kalman filtering: Consensus, diffusion, and mixed
CN110032204B (zh) 输入时延下多空间飞行器姿态协同控制方法
CN113258984A (zh) 多用户自适应频偏消除方法、装置及低轨卫星通信系统
CN106982099A (zh) 一种基于链路噪声的变步长分布式自适应参数估计方法
CN114124185B (zh) 一种优化irs辅助通信系统中相移矩阵的低复杂度方法
CN112099516A (zh) 一种基于模糊线性化理论的卫星集群姿态跟踪控制方法
CN113515066B (zh) 一种非线性多智能体系统动态事件触发控制方法
CN115967421A (zh) 一种分布式天线系统下联合参数估计与信号重构的方法及系统
CN112747742B (zh) 一种基于卡尔曼滤波的终端位置自适应更新方法
CN115980810A (zh) 一种基于因子图优化的精密单点定位方法
Han et al. Bias-compensated LMS algorithm for sparse systems over adaptive network
CN112714165B (zh) 一种基于组合机制的分布式网络协作策略优化方法和装置
CN114326818B (zh) 一种基于动态事件触发的无人机输出反馈协同控制系统
CN110954153B (zh) 一种分布式自适应组合系数优化方法
CN114993108B (zh) 一种基于全状态动态约束的分布式周期事件触发饱和协同制导方法
Narayanan et al. Approximate optimal distributed control of nonlinear interconnected systems using nonzero-sum games

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant