CN112862306B

CN112862306B - 一种面向时敏移动目标跟踪的多星在线协同任务规划方法

Info

Publication number: CN112862306B
Application number: CN202110158011.2A
Authority: CN
Inventors: 刘晓路; 何磊; 杨文沅; 闻珺; 沈大勇; 王涛; 姚锋; 陈英武; 陈盈果; 陈宇宁; 吕济民
Original assignee: National University of Defense Technology
Current assignee: National University of Defense Technology
Priority date: 2021-02-04
Filing date: 2021-02-04
Publication date: 2023-07-07
Anticipated expiration: 2041-02-04
Also published as: CN112862306A

Abstract

本发明提供一种面向时敏移动目标跟踪的多星在线协同任务规划方法，所述方法针对MSOCMPMT问题，提出了单卫星在线任务计划方法和多卫星在线协同方法。在单卫星在线任务计划方法中，采用动态优先级设计和更新机制，候选子任务调度集的生成算法以及候选子任务调度方案的选择策略。在多卫星在线协同方法中，设计了任务规划冲突解决策略以及TPMT维护和转移策略。以上方法有效解决了面向移动目标跟踪的多卫星的冲突协商和合作机制问题。

Description

一种面向时敏移动目标跟踪的多星在线协同任务规划方法

技术领域

本发明涉及卫星控制领域，具体涉及一种面向时敏移动目标跟踪的多星在线协同任务规划方法。

背景技术

离线任务规划对于移动目标来说，由于对不确定性因素响应过慢，很容易造成任务的丢失。MSOCMPMT(Multi-Satellite Online Collaborative Mission Planning forMobile Target)问题则考虑在线的闭环反馈，能够很好地响应动态不确定信息。问题考虑的不确定性因素主要为以下两点：

1.新任务的到达与生成是不确定的。新任务的到达主要来源于系统外部任务源，由于外部环境的难以预知性，新任务的到达是随机的。新任务的生成则来源于系统内部，依据当前数据融合结果出来的，依赖于观测的后验结果，同样具备不确定性。这两类可以归结为任务的动态不确定性特征。

2.目标运动的不确定性。目标运动的不确定性源自于目标位置的不确定性。尽管目标是短期可预测的，但是每次跟踪融合获得的目标位置与精度都是后验的，因此同样存在不确定性。

MSOCMSMT问题可以分为三个子问题。首先，如何将全局优化目标分解为多个子目标，从而可以在单个卫星上建立规划器或调度器。其次，如何根据指定的任务和多星系统的能力来构建结构或体系结构。第三，如何设计和完善多计划者或计划者之间解决冲突的协商与合作机制。解决MSOCMSMT问题是不确定环境下的动态决策过程，这需要有效的决策来改善系统的响应能力和整体性能。因此，选择合适的组织结构以及相关模型可以得到更好的解决方案。

发明内容

本发明的目的是通过以下技术方案实现的。

为了解决上述问题，本发明提供了一种面向时敏移动目标跟踪的多星在线协同任务规划方法，所述方法包括：

卫星网络系统由多卫星组成，每个卫星可作为代理Agent卫星，每个代理Agent卫星均维护其唯一的互斥目标池；

步骤1：确定单卫星在线任务规划结果；

步骤1.1：根据优先级确定要分配卫星资源的运动目标；

所述根据优先级确定要分配卫星资源的运动目标，具体包括：

获取运动目标重要度Imp^tgt和目标跟踪精度Pcs^tgt；

按照下述公式定义运动目标的动态优先级：

其中Pri^tgt(t)为运动目标的动态优先级，c为常数，并且为了使低重要度目标能够分配到跟踪资源，通常c≥1；l为预测轨迹误差与时间关系的线性函数斜率；Wid^sat为卫星的有效载荷宽度；Npt^tgt为任务最新一次获取融合处理信息的时间；[I_max,Imin]为目标重要度Imp^tgt的置信区间，且有Imp^tgt∈[I_min,I_max]。

步骤1.2：针对运动目标生成候选跟踪子任务集；

所述针对运动目标生成候选跟踪子任务集，具体包括：

卫星将在接收到目标tgt的融合信息后评估并更新优先级；

在确定为要分配资源的目标后，按照四个阶段来生成候选子任务集：

阶段1：计算目标的可见窗口；

阶段2：采用规划时间和通信延迟更新卫星姿态信息；

阶段3：利用最小姿态转换时间约束来计算每个卫星对目标的最早执行窗口；

阶段4：根据子任务组属性关系，裁剪执行时间窗口以获得候选子任务。

步骤1.3：针对所述步骤2)中生成的候选跟踪子任务集选择最佳候选跟踪子任务方案；

所述针对所述步骤2)中生成的候选跟踪子任务集选择最佳候选跟踪子任务方案，具体包括：

采用基于空间角度的最优选择策略选择最佳候选跟踪子任务，即选择最佳空间布局卫星以实现最佳跟踪效果的子任务，

其中，最佳候选跟踪子任务由

确定；

或者，采用基于时间的最优选择策略，即选择最早的跟踪子任务，

其中，最佳候选跟踪子任务

确定。

进一步地，选择基于时间的最优选择策略，以避免因频繁执行任务切换而造成的通信延迟成本。

步骤2：实现多卫星在线协同任务处理；

步骤2.1：基于请求-响应算法实现多代理Agent卫星任务协同执行；

所述基于请求-响应算法实现多代理Agent卫星任务协同执行，具体包括：

代理Agent卫星将请求发送到目标代理Agent卫星，然后目标代理Agent 卫星根据自身状态以及环境参数决定是否响应请求；

目标代理Agent卫星接受请求后，请求代理Agent卫星将与目标代理Agent 卫星达成协议。

进一步地，当目标代理Agent卫星接收到多个请求时，使用FCFS(First ComeFirst Service)原则进行响应。

步骤2.2：实现运动目标的维护与转移。

所述实现运动目标的维护与转移，具体包括：

采用“前瞻两步”规划方法，即每次规划目标的下下次跟踪子任务；

每个目标跟踪任务为成对的，并且跟踪任务的执行者承担着决策星(负责数据收集，融合，规划和协商)和从星(数据收集和传输)的作用，其中决策性负责数据收集、融合、规划和协商，从星负责数据收集和传输；

决策卫星执行如下步骤来维护和转移互斥目标池中的目标：

步骤2.2.1：激活计划：当每个决策卫星接近执行前一个决策卫星角色发送的子任务时，它将接收上一个跟踪子任务的融合信息，然后激活目标池中的相应目标以触发目标下一个跟踪子任务的规划。

步骤2.2.2：执行计划：经过任务规划和星间协商，选择目标距离可见窗口最长的子任务执行卫星作为下一个决策星，并将子任务发送到决策卫星和从星，目标转移到下一个决策卫星。

步骤2.2.3：收集，合并和发送数据：决策卫星收集并整合自身和从星的数据，并将目标融合信息发送给下一个决策星。

本发明的优点在于：

(1)提出了DPBH(Dynamic Priority Based Heuristic)算法来解决SSOMP(Single Satellite Online Mission Planning)问题，并设计了RRB(Request -ResponseBased)冲突解决机制来实现多卫星在线协同。

(2)基于动态优先级设置和更新机制，实现对跟踪目标的选定，使得优先级最高的目标能够被优先分配到资源；并且采用目标重要度Imp^tgt和目标跟踪精度Pcs^tgt构造目标动态优先级，提高了目标选定的准确性；

(3)选定采用基于时间的最优选择策略，能够缩短卫星的姿态操纵时间可以提高卫星的利用率，同时避免因频繁执行任务切换而造成的通信延迟成本；

(3)基于请求-响应(Request-Response Based,RRB)的协商机制来解决卫星间的规划冲突；

(4)设计了具有互斥目标池的分散式协同架构，利用了系统的分布式计算功能，节省了通信成本；

(5)设计一种目标维护和转移机制，选择具有目标可见时间窗口最长的卫星作为下一个决策卫星，避免频繁切换决策卫星，从而使决策卫星执行更多的同一目标跟踪任务，并避免过度的姿态转换。将目标直接转移到下一个决策卫星，由决策星统筹任务规划，进而提高资源分配的合理性。

附图说明

通过阅读下文优选实施方式的详细描述，各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的，而并不认为是对本发明的限制。而且在整个附图中，用相同的参考符号表示相同的部件。在附图中：

附图1示出了具有互斥目标池的分散式协同架构；

附图2示出了多颗自主卫星在线调度系统；

附图3示出了面向MSOCMPMT问题的分散式任务规划流程图；

附图4示出了轨迹3D展示与预测误差统计分析；

附图5示出了线性拟合预测轨迹误差；

附图6示出了候选子任务生成示意图；

附图7示出了基于空间和时间视角的最优子任务选择策略；

附图8示出了RRB星间协商与任务冲突消解机制；

附图9示出了TPMT维护与转移机制。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施方式。虽然附图中显示了本公开的示例性实施方式，然而应当理解，可以以各种形式实现本公开而不应被这里阐述的实施方式所限制。相反，提供这些实施方式是为了能够更透彻地理解本公开，并且能够将本公开的范围完整的传达给本领域的技术人员。

根据本发明的实施方式，提出一种面向时敏移动目标跟踪的多星在线协同任务规划方法。

MSOCMPMT的主要过程在于考虑不确定性因素与系统硬约束的条件下，合理的协同分配跟踪资源与协同任务规划，实现系统对TPMT跟踪效能的最大化(跟踪目标数目最大化以及目标跟踪精度最高)。

MSOCMPMT问题中考虑的卫星平台约束主要为以下几类约束：

1.时间窗口约束。除了空间几何位置的可见性，传感器探测距离、探测背景噪声影响以及卫星平台的机动能力都能够影响卫星对目标的跟踪可行性。受限于这些约束，卫星与目标之间存在非连续的可探测时间段(可见时间窗口)。跟踪任务只能够在这些时间窗口内安排。

2.转换时间约束。跟踪观测平台考虑的是新一代敏捷对地观测卫星平台，具备三轴姿态机动能力。同一卫星相邻两次跟踪任务之间卫星需要通过姿态机动完成跟踪所需的姿态转换，这种姿态转换需要一定的时间，而且依赖前一任务的结束姿态，即转换时间是时间依赖的。

3.电量约束。卫星能够通过充放电实现星上能源的补充与输出，但卫星存储电量存在上限，其放电深度都存在一定阈值，这些阈值是不能够违背的。

MSOCMPMT问题具备多种不确定性，对任务的全局信息难以把握，所以更难求出一个任务的全局最优解。为了保障卫星有效进行任务规划，抓住问题的主要矛盾，确定研究边界，现依据实际运行情况对研究中的MSOCMPMT问题做以如下假设：

(1)一颗卫星携带单一的跟踪传感器，同一时刻仅对一个目标成像；

(2)统筹考虑阳照区与地影区的影响，卫星在每圈的充电速度是恒定的；

(3)跟踪任务和任务姿态转换两个动作均对卫星电量产生消耗，由于跟踪是在姿态机动时进行数据采集，因此跟踪比姿态转换更加耗电；

(4)跟踪任务和任务姿态转换对电量的消耗与活动执行时间成正比；

(5)卫星具备星上数据处理与融合功能，减少了星地之间的数据传输，缓解了星上固存压力，因此忽略星上存储约束；

(6)每次任务的跟踪时长是固定的，采用数据融合所需的最短阈值。单次跟踪任务时长不得小于一定阈值，否则会影响数据融合中滤波算法的效果。同时，单次跟踪任务时长不能大于一定阈值，否则目标可能贵脱离传感器视场范围。

TPMT(Time-sensitive and Predictable Mobile Target)跟踪是一个闭环决策过程，它取决于不确定环境下卫星的决策能力，以提高目标跟踪的响应能力和有效性。跟踪TPMT需要一定数量的空间覆盖范围和时间分辨率，而高度可靠的系统可以保证目标不会丢失。因此，分散的协作结构是一个不错的选择。在跟踪过程中，识别的TPMT属性信息不断变化，可以指导后续子任务的生成。同时，任务规划还需要卫星状态信息。TPMT属性信息和卫星状态信息都需要同步更新，以确保更好的解决方案。然而，分散系统的任务通常是在整个网络上共享的，这需要巨大的计算量和通信成本。考虑到系统的规模扩展和通信成本，本发明提出了一种改进的具有互斥目标池的分散式协同架构，如图1所示。在这种结构下，每颗卫星保留一个互斥的目标池，这意味着每个TPMT的存在都是唯一的，并且还将随着任务计划过程的进行在系统节点之间传输。这样可以在保证系统可靠性的前提下，降低整个系统的通信成本，避免单个节点的计算量过大。

一.单颗卫星自主调度

采用DCSMETP协同架构研究MSOCMPMT问题。MSOCMPMT问题是一类典型的不确定环境下的序贯决策问题，根据问题特征在DCSMETP协同架构下首先采用 MDP针对单星在线任务规划(SSOMP)问题进行标准化建模。这实际上采用的是一种典型的对全局优化目标进行分解的思想。在DCSMETP协同架构下，需要针对任务池中的维护的任务进行规划。但跟踪依赖的并非单一的观测资源。搭载在单星上的规划器并非是针对单星的任务规划，而是面向目标的任务规划。这里，SSOMP问题实际上是针对维护的目标的资源分配问题。

面向SSOMP问题的MDP模型的定义为一个五元组<T,S,A,P,R>，其中：

(1)T为决策时刻点集，选择决策时刻的集合。

(2)S为状态集合，即该问题中系统达到的所有状态集合。s∈S， s＝{S^sat,S^tgt}为单星依赖星间链路获取的状态信息，其中

为所有卫星的状态信息，/>

为单星维护的任务状态信息。对于卫星sat_i来说，其状态信息为/>

其中，/>

为卫星sat_i的位置速度信息，/>

为卫星的剩余电量信息，/>

为卫星sat_i最新安排的跟踪任务的任务结束时间，/>

为卫星sat_i最新安排的跟踪任务的任务结束姿态；对于任务tgt_j来说，其状态信息为/>

其中，/>

为任务tgt_j最新一次获取融合处理信息的时间，/>

为任务tgt_j最新一次数据融合处理出的位置速度，/>

为任务tgt_j最新数据融合后得到的位置精度信息，/>

任务tgt_j最新一次数据融合处理后的目标属性信息，/>

为任务tgt_j根据获取的/>

的综合评估获得的任务优先级。

(3)A为单星能够执行的所有动作集合。对于a_k∈A，a_k＝{Tsu_k,1,Tsu_k,2}，即当前时刻卫星所能选择的单次跟踪分配给来两颗卫星的子任务信息。对于子任务Tsu_k＝{sat_k,tgt_k,Tbt_k,Tet_k,Tct_k,Tba_k,Tea_k,Egy_k}，Tbt_k表示子任务Tsu_k开始时间， Tet_k表示子任务Tsu_k结束时间，Tct_k表示子任务Tsu_k持续时间，Tba_k表示子任务 Tsu_k开始姿态，Tea_k表示子任务Tsu_k结束姿态，Egy_k表示子任务Tsu_k消耗的电量。显然，对于子任务组Tsu_k存在以下关系：

(4)P:S×A→∏(S)为状态转移函数，表示在给定的状态和动作的前提下，能够到达下一个状态的概率分布，其中

表示处于状态s，执行动作a，到达状态s'的概率；

(5)R:S×A→⁺为报酬函数，表示在给定目前状态和动作的情况下所获得的立即报酬，R(s,a)表示在状态s，执行动作a时所能得到的瞬时报酬值；

系统循环执行以下两个步骤与环境不断迭代交互：首先在系统状态为s∈S 时，系统执行动作a，得到了瞬时报酬

然后系统按照转移分布T(s,a,s')转向新的状态s'，它为系统提供了处于s'的信息。MDP优化决策的目标是寻找一个最优策略π，以最大化期望折扣报酬值：

其中，r_m是t^m时刻瞬时报酬值，γ为折扣因子，0<γ≤1。系统的下一个状态和期望报酬只与当前的状态和动作有关而与历史无关，因此系统优化决策求解过程满足马尔可夫属性。

在最优策略π^*下，所有信念状态的折扣报酬期望值组成最优值函数V^*，根据Bellman方程，可得：

与之对应，最优策略π^*为：

由以上公式可以看出，MDP是一个不断优化求解过程，其优化目标是当前时刻回报与下一时刻期望回报的累加。通过对性能指标的优化，就可以获得系统最优的决策序列以及最终的回报效用值。并且随着任务的执行，时间不断向前推移，新任务不断通过策略实现规划。因此，MDP十分适合于卫星动态优化决策问题的建模与计算。

令u_k为执行目标Tsu_k跟踪子任务获得的收益，O^m为时刻t_m前卫星的选择的子任务集合，定义决策变量如下：

则跟踪收益为：

跟踪优化的目标为最大化跟踪目标数和跟踪精度。跟踪精度由于是后验的，并不好量化，这里采用跟踪时长与目标优先级来替代跟踪精度的收益。对于最大化跟踪目标数，我们考虑采用惩罚机制来限制高优先级任务对资源的长期占用。若每次选择子任务导致其他目标丢失的数目为n_k(t_m)，则总收益为：

其中，ω₁,ω₂≥0，为跟踪目标精度和跟踪目标数目的权重，不同的取值反映了不同的偏好。针对上述优化目标函数，需要满足以下约束条件：

(1)观测时间窗口约束，即任务的跟踪时间不得超出其可见时间窗口：

(2)任务之间的姿态机动时间约束。即对于同一颗卫星来说，两个连续观测任务中，前一个任务的观测结束时间加上机动时间不得超过后一个任务的观测开始时间ts，i≠j，表示卫星观测子任务Tsu_i和Tsu_j之间的姿态转换时间：

(3)卫星能量约束，即任意时刻卫星上能量存量不能低于卫星可消耗的能量阈值，E表示卫星保持的最低能量阈值，E_m表示时间k时刻卫星上的电量数值：

二.多颗卫星自主调度

对于多颗敏捷卫星网络，每颗卫星可以看做一个代理Agent卫星，各个代理Agent卫星独立地根据自身状态与观测进行本地决策。各代理Agent卫星之间通过星间链路交换信息并更新自身的状态信念，从而实现各Agent之间的计划协调。基于DEC-MDP思想，可以将多星系统划分为若干有限相对独立的卫星优化决策子系统，然后针对各子系统分别优化求解。基于这种系统分解的思想，可以建立多星分布式协同优化决策框架，如图2所示，在分布式协同优化决策结构下，多星协同任务调度系统被划分为若干相对独立的决策子系统，整体系统的动作由所有子系统的动作所组成，每颗卫星具有一个本地MDP决策模块，卫星之间可以通过星间链路进行信息交换，但星间通信可能会存在延迟。

令SAT＝{sat₁,sat₂,...,sat_Ns}为系统中卫星集合，其中N_s为卫星数量。设第n颗卫星的策略为π_n，则整个卫星系统的策略可以改写成如下形式：

整个系统的收益值函数为N_s颗卫星收益的总和。整个卫星系统包含N_s个相对独立的优化决策问题，每个优化问题对应一颗卫星。

对于卫星sat_n，可以得到如下本地优化决策模型：

s.t.

基于MOSCMPMT所现存的问题，本发明提出了DPBH(Dynamic Priority BasedHeuristic)算法来解决SSOMP(Single Satellite Online Mission Planning) 问题，并设计了RRB(Request-Response Based)冲突解决机制来实现多卫星在线协同。

MSOCMSMT问题的优化目标是最大程度地提高多星系统的性能，即在扩展系统总体容量的同时更加关注重要目标。所以以下两点是关键：

(1)快速准确的决策。在TPMT跟踪的闭环反馈中，为快速响应不确定事件(目标属性的变化或生成新目标)，需要在星上做出快速而准确的决策。

(2)简单有效的协商。星上快速高效的协商，可以保证卫星之间的有序协调，实现协作任务的及时分配，避免因通信延迟而造成的规划滞后。

基于对问题特征的分析，设计了图3所示的规划框架流程图。从流程图中可以看出，解决MSOCMPMT问题的框架可以分为两部分：单卫星在线任务计划模块和多卫星在线协同模块。在前一个模块中，考虑了动态优先级设计和更新机制，候选子任务调度集的生成算法以及候选子任务调度方案的选择策略。在后者中，设计了任务规划冲突解决策略以及TPMT维护和转移策略。

步骤1：确定单卫星在线任务规划结果；

单卫星任务规划是一个实时在线决策问题。整个卫星网络系统可以看作是一个多代理Agent卫星系统，每个作为代理Agent卫星的卫星都维护其唯一的互斥目标池。每个代理Agent卫星需要为每个跟踪目标连续分配跟踪资源，这需要三个过程来实现，即需要确定要分配资源的目标，生成相应的候选跟踪子任务集并选择最佳候选跟踪子任务方案。我们提出了一种用于目标决策的基于动态优先级的启发式(DPBH)算法，并讨论了两种最佳候选跟踪子任务选择策略。

步骤1.1：根据优先级确定要分配卫星资源的运动目标；

动态优先级的设计对于整个系统的跟踪效率非常重要。它不仅需要考虑整个卫星系统对多个目标的跟踪能力，而且还需要为重要目标分配更多的卫星资源。因此，引入两个属性来构造目标的动态优先级，即目标重要度Imp^tgt和目标跟踪精度Pcs^tgt。目标重要性是对目标属性的评估，该评估是在系统最近进行的目标跟踪信息融合评估之后获得的，而且在较高置信度信息融合评估之后的值是固定的。目标重要性可以表示为通过融合最新目标跟踪信息而获得的目标属性Pty^tgt的函数，如下公式所示：

Imp^tgt(t)＝f(Pty^tgt)t≥Npt^tgt

同样，如果函数g(·)用于描述目标跟踪精度对动态优先级的影响，则可以通过加法关系来构造动态优先级如下所示

Pri^tgt(t)＝Imp^tgt+g(Pcs^tgt,Npt^tgt)t≥Npt^tgt

目标重要性来自卫星用户对目标关注度或者效用的评估，通过避免目标离开卫星搭载传感器的视场范围来建立目标跟踪精度与动态优先级之间的关系。在跟踪TPMT的过程中，可以预测目标运动轨迹。预测是要判断目标的意图，并在兼顾多个目标采用分时跟踪的同时不丢失目标。但是，此类预测通常会存在误差，这种误差会随着时间的推移而增长。图4(a)显示了TPMT的实际和预测轨迹的一组3D坐标，而图4(b)显示了实际和预测轨迹之间的误差。如果仅考虑误差最大的坐标方向，可以从图中看到，以卫星Wid^sat＝40km的有效载荷宽度为例，目标离开目标后381秒后将失去跟踪轨道。

假设目标t的实际位置和预测位置分别为(x^act,y^act,z^act)和(x^pre,y^pre,z^pre)。保守起见，我们不使用最大单坐标方向的误差，而是使用如下所示的欧几里德距离计算来测量目标预测轨迹的误差。

由于两个跟踪任务之间的间隔不能太长，因此将前600s的预测时间与距离误差数据线性拟合，结果显示在图5中。从图中可以看出，两者的皮尔逊相关系数为0.9999，这意味着可以通过线性关系表示两者之间的关系。因此，若目标重要度Imp^tgt∈[I_min,I_max]，并且预测轨迹误差与时间关系的线性函数斜率为l，则可以按照下述公式定义目标的动态优先级并依此进行更新。

步骤1.2：针对运动目标生成候选跟踪子任务集；

根据更新的动态优先级选定优先级最高的目标之后，有必要为目标生成相应的候选跟踪子任务集，以利于后续选择最佳跟踪子任务。多星离线任务计划只需要考虑任务之间最短的姿态转换时间约束，而对于在线任务计划，还必须考虑任务规划计算时间和卫星间通信时间的影响。否则，由于数据计算和通信延迟引起的卫星状态变化，将导致规划的任务失败。

卫星将在接收到目标tgt的融合信息后评估并更新优先级。一旦决定被确定为要分配资源的目标，它就需要经历四个阶段来生成候选子任务集：1.计算目标的可见窗口；2.考虑规划时间和通信延迟更新卫星姿态信息；3.考虑最小姿态转换时间约束来计算每个卫星对目标的最早执行窗口；4.根据子任务组属性关系，裁剪执行时间窗口以获得候选子任务。特别是，第二阶段对于可行的候选子任务集生成至关重要。如图6中所示，这种情况不需要更新sat₂的任务结束姿态，但是对于sat₁，由于其规划时间和通信延迟超过了最近任务的结束时间，卫星状态信息需要在后续计算中进行更新。算法1中显示了候选子任务调度集生成算法的伪代码。在这里，我们在第3阶段介绍牛顿迭代思想，以搜索任务的最早执行时间。

输入：所有卫星的状态信息，S^sat；所选目标状态信息，

决策触发时刻， t^trig；单个任务规划耗时，T^plan；单次协商通信延迟，T^delay；最大迭代次数，N^iter；迭代解决方案精度，P^iter。

输出：候选子任务调度集，A＝{Tsu_k,1,Tsu_k,2}。

对于候选子任务的选择，我们考虑了两种策略：1.从局部优化的角度出发，采用基于空间角度的最优选择策略，即选择最佳空间布局卫星以实现最佳跟踪效果的子任务(由

确定)；2.从全局优化的角度出发，采用基于时间的最优选择策略，即选择最早的跟踪子任务(由/>

确定)。

从图7(a)可以看出，由{Sat₁,Sat₂}组成的候选子任务优于{Sat₃,Sat₄}，因为它们具有较大的观测角和较短的平均观测距离(

θ_1,2>θ_3,4)，这样对TPMT可以带来更好的跟踪效果，从而使跟踪精度迅速收敛。相反，图7(b) 中显示的策略优先考虑较早执行的由{Sat₁,Sat₂}组成的候选子任务组合，通常最早执行卫星也是上一个任务的执行者，可以减少目标的跟踪间隙以及卫星在两个任务之间的姿态转换时间。从全局优化的角度来看，我们更倾向于选择后者，因为缩短卫星的姿态操纵时间可以提高卫星的利用率，同时避免因频繁执行任务切换而造成的通信延迟成本。

步骤2：实现多卫星在线协同任务处理；

每颗卫星都可以生成其计划和调度解决方案，但是，每颗卫星只能同时执行一项任务，这导致并非所有卫星计划解决方案都可以实施，因此有必要解决多颗卫星之间的冲突。在这里，我们将设计一个基于请求-响应 (Request-Response Based,RRB)的协商机制来解决规划冲突，该机制的思想是代理Agent卫星将请求发送到目标代理Agent卫星，然后目标代理Agent卫星根据自己的状态以及环境状况决定是否响应请求。目标代理Agent卫星接受请求后，请求代理Agent卫星将与目标代理Agent卫星达成协议。当目标代理 Agent卫星接收到多个请求时，它使用FCFS(First Come First Service)原则来首先响应。图8中显示了该机制的示例。

其中，FCFS算法具体包括：

将代理Agent卫星的请求消息按照请求时间顺序存入队列尾部，并在当前任务执行完毕后，目标代理Agent卫星从队列头部获取下一执行任务；

目标代理Agent卫星将执行记录存入本地存储器中；

当同一时刻有多个请求消息时，目标代理Agent卫星获取在当前时间之前的预设时间内所执行的任务记录，并获取所服务的卫星请求中的卫星信息；

目标代理Agent卫星根据在预设历史时间段内所服务的卫星请求中的卫星信息、自身根据自己的状态、环境状况选择下一个响应的请求代理Agent卫星；

进一步地，当A与B两个代理Agent卫星在同一时刻向目标代理Agent卫星进行请求时，选择目标代理Agent卫星在预设历史时间段内所服务的次数较少的卫星，如A卫星，进行响应；

当预设历史时间段内不存在有关A与B两个代理Agent卫星的服务记录时，随机选择A或B进行响应；

当目标代理Agent卫星获取请求卫星信息后，根据请求更新目标代理Agent 卫星的临时状态，当不满足状态或环境状况所需的预设条件时，记录队首卫星信息，获取队首位置的下一位置卫星信息，并继续更新目标代理Agent卫星的临时状态以判断是否满足响应下一位置卫星请求的状态和环境状况条件；

当目标代理Agent卫星执行完毕队首位置的下一位置卫星请求后，删除下一位置卫星请求信息，并继续获取队首位置卫星请求信息。

在图8中，Sat₁将tgt_k的子任务的请求发送给Sat₂和Sat₃来执行。Sat₂和Sat₃将根据请求更新卫星的临时状态，以确保FCFS规则的有效性并执行任务约束检查。一旦满足能源消耗和姿态转换，它将响应需求，否则将不响应。Sat₁将在收到Sat₂和Sat₃的响应结果后做出决定。只要Sat₂或Sat₃拒绝请求，规划的子任务就会失败，需要更新子任务并重新发送请求。如果请求成功，则子任务将分别发送到Sat₂和Sat₃。值得注意的是，当子任务的执行者包括请求者本身时，此时只有一个子任务用于发送请求。在图中，Sat₂向卫星Sat_n发送请求时就是这种情况。对应于这两种情况的通信延迟是不同的。根据之前的通信假设，当与2颗卫星协商时，通信延迟为

当与1颗卫星协商时，通信延迟为/>

步骤2.2：实现运动目标的维护与转移。

在图1中，针对本研究的问题设计了具有互斥目标池的分散式协同架构。这种设计利用了系统的分布式计算功能，还节省了通信成本。但是，存在两个问题：1.目标固定在特定的卫星上。一旦卫星发生故障，很容易丢失维护目标，系统可靠性低。2.当卫星向目标分配资源时，仅考虑其自身维护的目标，但其自身维护可能与其他卫星维护的目标之间存在资源冲突，从而导致分配效果降低。因此，在多卫星协调机制中，除了考虑任务之间的协商和冲突解决外，还需要设计一种目标维护和转移机制。

以三颗卫星的对同一目标的跟踪来分析目标维护和转移的卫星间协调机制。使用“前瞻两步”规划的机制，即每次规划目标的下下次跟踪子任务。每个目标跟踪任务都是成对的，并且跟踪任务的执行者承担着决策星(负责数据收集，融合，规划和协商)和从星(数据收集和传输)的作用。决策卫星需要执行以下4个步骤来维护和转移互斥目标池中的目标：

1)激活计划。当每个决策卫星接近执行前一个决策卫星角色发送的子任务时，它将接收上一个跟踪子任务的融合信息，然后激活目标池中的相应目标以触发目标下一个跟踪子任务的规划。

2)执行计划。经过任务规划和星间协商，选择目标距离可见窗口最长的子任务执行卫星作为下一个决策星，并将子任务发送到决策卫星和从星，目标转移到下一个决策卫星。

3)收集，合并和发送数据。决策卫星收集并整合自身和从星的数据，并将目标融合信息发送给下一个决策星。

图9介绍了设计机制的主要思想。Sat₃首先充当决策卫星，接收到最后一个决策卫星的目标融合信息后，激活目标池中的相应目标并在TP₁触发规划；决策星选择将由Sat₂和Sat₃执行的子任务Tsu₁，同时将目标窗口最长的Sat₂指定为下一个决策星并转移目标；决策星执行上一个决策卫星规划的子任务Tsu₀，从Sat₁收集子任务数据并执行融合，然后合并目标信息将其发送到下一个决策星Sat₂。随后的步骤将根据此规则进行。

选择具有目标可见时间窗口最长的卫星作为下一个决策卫星，因为它可以避免频繁切换决策卫星，从而使决策卫星执行更多的同一目标跟踪任务，并避免过度的姿态转换。将目标直接转移到下一个决策卫星是为了考虑下一个决策卫星具有更多的窗口资源，这也意味着目标向具有资源冲突的决策星聚集，由决策星统筹任务规划，进而提高资源分配的合理性。

本实施方式提供了一种面向时敏移动目标跟踪的多星在线协同任务规划方法，该方法所具有的优点在于：

(6)设计了基于FCFS规则的请求-响应机制，并在多个卫星在同一时刻进行请求时，引入历史服务记录信息进行响应请求卫星的选择；同时，当针对当前请求卫星的目标代理Agent卫星不满足状态和环境要求时，直接获取下一队首下一位置的卫星请求信息并进行判断和响应，减少了等待时间；以上进一步提高了对卫星请求响应的准确性和效率。

以上所述，仅为本发明较佳的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到的变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以所述权利要求的保护范围为准。

Claims

1.一种面向时敏移动目标跟踪的多星在线协同任务规划方法，其特征在于，所述方法包括如下步骤：

步骤1：确定单卫星在线任务规划结果；

步骤1.1：根据优先级确定要分配卫星资源的运动目标；

获取运动目标重要度Imp^tgt和目标跟踪精度Pcs^tgt；

按照下述公式定义运动目标的动态优先级：

其中Pri^tgt(t)为运动目标的动态优先级，c为常数，并且为了使低重要度目标能够分配到跟踪资源，通常c≥1；l为预测轨迹误差与时间关系的线性函数斜率；Wid^sat为卫星的有效载荷宽度；Npt^tgt为任务最新一次获取融合处理信息的时间；[I_max,Imin]为目标重要度Imp^tgt的置信区间，且有Imp^tgt∈[I_min,I_max]；

步骤1.2：针对运动目标生成候选跟踪子任务集；

所述针对运动目标生成候选跟踪子任务集，具体包括：

卫星将在接收到目标tgt的融合信息后评估并更新优先级；

阶段1：计算目标的可见窗口；

阶段2：采用规划时间和通信延迟更新卫星姿态信息；

阶段3：利用最小姿态转换时间约束来计算每个卫星对目标的最早执行窗口；阶段4：根据子任务组属性关系，裁剪执行时间窗口以获得候选子任务；

步骤1.3：针对所述步骤1.2中生成的候选跟踪子任务集选择最佳候选跟踪子任务方案；

步骤2：实现多卫星在线协同任务处理；

代理Agent卫星将请求发送到目标代理Agent卫星，然后目标代理Agent卫星根据自身状态以及环境参数决定是否响应请求；

目标代理Agent卫星接受请求后，请求代理Agent卫星将与目标代理Agent卫星达成协议；

步骤2.2：实现运动目标的维护与转移；

所述实现运动目标的维护与转移，具体包括：

每个目标跟踪任务为成对的，并且跟踪任务的执行者承担着决策卫星和从星的作用，其中决策性负责数据收集、融合、规划和协商，从星负责数据收集和传输；决策卫星执行如下步骤来维护和转移互斥目标池中的目标：

步骤2.2.1：激活计划：当每个决策卫星接近执行前一个决策卫星角色发送的子任务时，它将接收上一个跟踪子任务的融合信息，然后激活目标池中的相应目标以触发目标下一个跟踪子任务的规划；

步骤2.2.2：执行计划：经过任务规划和星间协商，选择目标距离可见窗口最长的子任务执行卫星作为下一个决策卫星，并将子任务发送到决策卫星和从星，目标转移到下一个决策卫星；

步骤2.2.3：收集，合并和发送数据：决策卫星收集并整合自身和从星的数据，并将目标融合信息发送给下一个决策卫星。

2.根据权利要求1所述的方法，所述针对所述步骤1.2中生成的候选跟踪子任务集选择最佳候选跟踪子任务方案，具体包括：

其中，最佳候选跟踪子任务由

确定；

其中，最佳候选跟踪子任务

确定。

3.根据权利要求2所述的方法，其特征在于，选择基于时间的最优选择策略，以避免因频繁执行任务切换而造成的通信延迟成本。

4.根据权利要求3所述的方法，其进一步包括：当目标代理Agent卫星接收到多个请求时，使用FCFS(First Come First Service)原则进行响应。