CN109669354A

CN109669354A - 状态空间下快速高效的航天器自主任务规划修复方法

Info

Publication number: CN109669354A
Application number: CN201811373845.XA
Authority: CN
Inventors: 徐瑞; 陈超; 崔平远; 朱圣英; 高艾
Original assignee: Beijing Institute of Technology BIT
Current assignee: Beijing Institute of Technology BIT
Priority date: 2018-11-19
Filing date: 2018-11-19
Publication date: 2019-04-23

Abstract

本发明公开的状态空间下快速高效的航天器自主任务规划修复方法，属于航空航天技术领域。本发明针对原有航天器任务规划结果，采用状态回退的方法得到航天器不同时刻的回退目标状态；根据任务执行失败时的航天器状态与某一时刻的回退目标状态之间的谓词组成差异，对回退目标状态进行约简，获得新的回退目标状态；采用后向搜索策略，得到不含时间信息的初步任务规划修复解；为确保该初步解与回退目标状态之间不发生冲突，模拟执行并判断结果的一致性；对模拟执行结果一致的初步任务规划修复解，进行时间调度即能够获得带有时间信息的航天器自主任务规划修复方案。本发明具有计算量小、计算速度快、算法实现简单高效的优点。

Description

状态空间下快速高效的航天器自主任务规划修复方法

技术领域

本发明涉及一种基于不同时刻回退目标状态的快速高效的航天器自主任务规划修复方法，属于航空航天技术领域。

背景技术

随着人工智能智能技术的不断进步和发展，航天器的自主性逐渐成为航天领域的热门研究方向之一。对于近地卫星，其任务操作指令的上传局限于地面测站的测控弧段，导致当卫星在测控区域之外执行任务失败时，地面很难及时有效地使其恢复正常；对于深空探测器，其与地球之间的通信存在巨大时延，一旦任务执行过程中出现差错，将会影响整个任务地完成。因此，航天器需要具备自主任务规划修复能力，实现自我决策和实施，提升安全性和任务回报。

在智能体的任务规划修复算法领域上，国内外众多学者进行了深入的研究，同时也涌现出了许多理论和方法，如基于修补规则的任务修复方法、基于启发式的任务规划修复方法、基于目标回退的任务规划修复方法等。虽然每种算法都有各自的优点，但是也很难克服自身存在的缺陷。

例如基于修补规则的任务修复方法根据人的经验对不同错误进行修复，高效准确，但是不能涵盖所有错误类型；基于启发式的任务规划修复方法直接利用现有规划器的启发式进行修复，简单有效，但是只能处理初始条件或者目标状态发生改变的情况；基于目标回退的任务规划修复方法对原规划进行分段预处理，减少了实际修复的耗费时间，但是无法解决每段中最后一个动作执行失败的问题。此外，这些方法都不能处理带有时间信息的动作执行失败的问题。

发明内容

针对航天器任务执行失败时需要进行自主修复的问题，为了克服现有规划修复算法的计算量大、实现复杂、应用范围受限等困难，本发明公开的状态空间下快速高效的航天器自主任务规划修复方法要解决的技术问题是：实现状态空间下快速高效的航天器自主任务规划修复，即用于实现确定任务执行失败时航天器为恢复正常应该采取的活动序列，且具有计算量小、计算速度快、算法实现简单高效的优点。

本发明的目的是通过下述技术方案实现的。

本发明公开的状态空间下快速高效的航天器自主任务规划修复方法，针对原有航天器任务规划结果，采用状态回退的方法得到航天器不同时刻的回退目标状态。并根据任务执行失败时的航天器状态与某一时刻的回退目标状态之间的谓词组成差异，对回退目标状态进行约简，获得新的回退目标状态。采用后向搜索策略，得到不含时间信息的初步任务规划修复解。为确保该初步解与回退目标状态之间不发生冲突，模拟执行并判断结果的一致性。对模拟执行结果一致的初步任务规划修复解，进行时间调度即能够获得带有时间信息的航天器自主任务规划修复方案。航天器执行所述方案，即能够实现自主任务规划修复。

本发明公开的状态空间下快速高效的航天器自主任务规划修复方法，包括如下步骤：

步骤一、由原始任务规划结果得到航天器不同时刻的回退目标状态。

根据航天器原始任务规划结果中的活动序列和活动的执行时间，依据规划领域中活动的前提和效果，由目标状态出发，对执行时间相同的活动按照公式(1)进行状态回退，得到不同时刻航天器的回退目标状态，直至初始状态。

式中，t_S、都表示具体时刻，S是t_S时刻航天器的状态，S’是时刻航天器的回退目标状态，且是状态S下上一个可执行活动的开始时间，即a是航天器原始任务规划结果中用于回退的活动，开始时间等于a.add是a的添加效果，a.pre是a的前提条件。对于目标状态，规定其开始时间为t_∞。

步骤二、根据任务执行失败时刻的航天器状态与某一时刻的回退目标状态之间的谓词组成差异，对回退目标状态进行约简，得到简化后的回退目标状态。

获得任务执行失败时航天器的状态S_cur和某时刻对应的回退目标状态，根据其谓词组成差异，将相同部分存入集合common，将回退目标状态中不重复的部分存入集合S_exp。S_exp即为简化后的回退目标状态。回退目标状态默认为任务执行失败时刻的回退目标状态。

步骤三、由简化后的回退目标状态开始进行后向搜索，获得不含时间的初步任务规划修复解。

创建一个集合open，将S_exp存入其中，用于存放任务规划修复过程中待搜索节点的信息；同时创建一个空的树型数据结构tree，用于存放任务规划修复过程的扩展节点信息，然后开始搜索规划修复解，包括如下步骤：

步骤3.1：取出open中的第一个元素O₁，放入tree中；

步骤3.2：找到元素O₁的所有支持动作supportActs。其中，集合supportActs中的每一个动作满足以下条件：元素O₁包含动作的所有添加效果且不包含动作的任何删除效果；

步骤3.3：选取supportActs中的一个动作，应用公式(1)，得到回退状态S_regress；

步骤3.4：将回退状态S_regress置入open，并判断回退状态S_regress是否可以在当前状态S_cur下发生，即判断关系式是否成立。

条件a.若不成立，转步骤3.3；

条件b.若supportActs为空，该状态下没有更多可用的支持动作，返回步骤3.1，遍历open集合中的元素；

条件c.若open为空，该时刻的目标状态不可达，搜索下一时刻的回退目标状态，返回步骤二；

条件d.若遍历所有回退目标状态后仍然没有找到解，直接退出，修复失败；

条件e.若成立，在tree中按照从叶节点到根节点的顺序提取活动序列，并将其置入集合repairActs，即为不含时间信息的初步任务规划修复解。

步骤四、对得到的不含时间信息的初步任务规划修复解进行模拟执行，得到模拟执行后的状态。

在当前状态S_cur下按照公式(2)依次应用repairActs中的活动，得到模拟执行后的状态S_derived。

S_derived＝S\a.del∪a.add (2)

式中，S是航天器的状态，S_derived是在S下应用动作a后得到的状态，a的前提条件在S下得到满足，a.add是a的添加效果，a.del是a的删除效果。

步骤五、判断模拟执行后状态的一致性，并根据判断结果执行步骤六或返回步骤三。

判断关系式是否成立，用于确认初步规划修复解没有破坏回退目标状态。

条件a.若成立，回退目标状态得到满足，即初步规划修复解满足要求。此时，需要进行后续处理，增加时间信息，转步骤六；

条件b.若不成立，找出common中未出现在S_derived的谓词，置入集合todo，并令S_exp＝todo，返回步骤三。

步骤六、对于一致的初步任务规划修复解，以任务执行失败的时刻为当前时间，并考虑时间增量以预留出部分时间用于实际的任务规划修复求解过程，采用时间调度方法对得到的初步任务规划修复解安排执行时间，输出规划修复活动序列，即输出修复后的航天器自主任务规划方案。

步骤七：执行修复后的航天器自主任务规划方案，使航天器从失败状态转移到合适的目标状态，从而实现航天器任务执行失败时的自主恢复操作，即实现状态空间下快速高效的航天器自主任务规划修复。

有益效果：

1、本发明公开的状态空间下快速高效的航天器自主任务规划修复方法，利用原始任务规划结果中活动的执行时间信息构造不同时刻的回退目标状态，能够对简单的并行动作进行状态回退，并处理由于简单并行动作执行失败而引起的修复问题，更加贴合实际应用。

2、本发明公开的状态空间下快速高效的航天器自主任务规划修复方法，针对活动执行失败，利用不同状态之间谓词组成的差异，削减回退目标状态空间大小，有针对性地控制搜索方向，减少不必要的节点扩展，降低搜索节点数目，加快求解速度，即具有计算量小、计算速度快的优点。

3、本发明公开的状态空间下快速高效的航天器自主任务规划修复方法，为避免因削减回退目标状态空间大小而引起的回退目标状态不满足的情况，采用模拟执行的方式检查初步任务规划修复解的一致性，通过多次修复得到最终满足要求的修复活动序列，保证解的合理性。

4、本发明公开的状态空间下快速高效的航天器自主任务规划修复方法，对得到的初步任务规划修复解进行时间调度，安排活动执行时间，便于航天器执行，实用性好；且不依赖于具体的失败动作，通用性好，便于实现航天器自主任务规划修复。

附图说明

图1是状态空间下快速高效的航天器自主任务规划修复方法流程图。

图2是航天器规划领域中的活动模型。

具体实施方式

为了更好的说明本发明的目的和优点，下面结合附图与实施例对本发明做进一步解释。

为了验证方法的可行性，选择国际智能规划大赛上的卫星规划领域模型，模型包含的具体活动类型、参数、前提、效果如图2所示。

本实施例公开的状态空间下的航天器自主任务规划修复方法，具体实施步骤如下：

假设卫星需要对不同地点采用不同模式进行观测，对spot1进行红外成像，对spot2进行光谱成像，对spot3进行光学成像，且完成这些任务后需要对日定向。该任务用谓词进行描述即(and(have_image spot1infrared)(have_image spot2spectrograph)(have_image spot3image)(pointing satellite Sun))。在图2中的规划领域下，利用规划器Sapa得到规划结果如表1所示。

表1规划结果

开始时间	活动	持续时间
			0	(switch_on instrument0satellite)	2
0	(turn_to satellite ins0calibratespot spot2)	1.526
			2	(calibrate satellite instrument0ins0calibratespot)	37.3
2	(turn_to satellite spot1ins0calibratespot)	25.96
			39.3	(take_image satellite spot1instrument0infrared)	7
46.3	(turn_to satellite spot2spot1)	49.61
			95.91	(take_image satellite spot2instrument0spectrograph)	7
102.91	(switch_off instrument0satellite)	1
			102.91	(turn_to satellite ins1calibratespot spot2)	35.34
103.91	(switch_on instrument1satellite)	2
			138.25	(calibrate satellite instrument1ins1calibratespot)	15.9
138.25	(turn_to satellite spot3ins1calibratespot)	30.24
			168.49	(take_image satellite spot3instrument1image)	7
175.49	(turn_to satellite Sun spot3)	67.65

根据公式(1)，从规划结果最后一个动作开始，采用逆序进行回退，构建不同时刻的回退目标状态。此时，S＝{(have_image spot1infrared)(have_imagespot2spectrograph)(have_image spot3image)(pointing satellite Sun)}，没有其它动作与最后一个动作turn_to同时发生，所以根据图2中的活动模型，turn_to.pre＝{(pointing satellite spot3)}，turn_to.add＝{(pointing satellite Sun)}，则S’＝{(have_image spot1infrared)(have_image spot2spectrograph)(have_imagespot3image)(pointing satellite spot3)}。将得到的S’加入回退目标状态序列之中，继续下一个阶段回退，不再赘述。最终得到的不同时刻的回退目标状态如表2所示。

表2不同时刻的回退目标状态

航天器在对地点spot1进行红外成像的过程中相机未校准，即表1中的第5个动作(take_image satellite spot1instrument0infrared)因前提条件(calibratedinstrument0)未得到满足而执行失败，此时由传感器感知得到航天器的状态如下：

S_cur＝{(supports instrument0spectrograph)(supportsinstrument0infrared)

(supports instrument1image)(supports instrument2infrared)

(calibration_target instrument1ins1calibratespot)

(calibration_target instrument0ins0calibratespot)

(calibration_target instrument2ins2calibratespot)

(on_board instrument2satellite)(power_on instrument0)

(pointing satellite spot1)(on_board instrument0satellite)

(on_board instrument1satellite)(supports instrument2image)}，

而此时t＝39.3，对应的回退目标状态是表2中的第3项，即

S＝{(on_board instrument1satellite)(supports instrument1image)

(calibration_target instrument1ins1calibratespot)(calibratedinstrument0)

(on_board instrument0satellite)(power_on instrument0)

(supports instrument0spectrograph)(pointing satellite spot1)

(supports instrument0infrared)}，

由此可以看出S与S_cur之间存在大量冗余谓词，进行筛选后，不然发现

common＝{(on_board instrument1satellite)(supports instrument1image)

(on_board instrument0satellite)(power_on instrument0)

(calibration_target instrument1ins1calibratespot)

(supports instrument0spectrograph)(pointing satellite spot1)

(supports instrument0infrared)}，

而S_exp＝{(calibrated instrument0)}。

创建一个集合open，将S_exp存入其中，即open＝{(calibrated instrument0)}；同时创建一个空的树型数据结构tree，用于存放任务规划修复过程的扩展节点信息，然后开始搜索规划修复解，包括如下步骤：

步骤3.1：取出open中的第一个元素O₁，放入tree中；

O₁＝{(calibrated instrument0)}，取出O₁后，open为空，而tree＝{(calibratedinstrument0)}。

步骤3.2：找到元素O₁的所有支持动作supportActs。其中，集合supportActs中的每一个动作满足以下条件：元素O₁包含动作的所有添加效果且动作的删除效果不包含在元素O₁中；

根据图2中的活动模型，根据其添加效果是否包含该元素{(calibratedinstrument0)}，可以得到支持动作supportActs如下：

{(calibrate satellite instrument0ins0calibratespot)}；

此时，动作a＝(calibrate satellite instrument0ins0calibratespot)，其添加效果为a.add＝{(calibrated instrument0)}，其前提条件为a.pre＝{(on_boardinstrument0satellite)(power_on instrument0)(calibration_targetinstrument0ins0calibratespot)(pointing satellite ins0calibratespot)}，由此可得S_regress＝a.pre。

条件a.若不成立，转步骤3.3；

open＝{(pointing satellite ins0calibratespot)}，通过比对可以发现S_cur不包含S_regress中的谓词(pointing satellite ins0calibratespot)，所以关系式不成立，执行步骤3.3。

此时supportActs为空，转步骤3.1，取出open中的元素(pointing satelliteins0calibratespot)，而tree存在节点1(calibrated instrument0)、2(pointingsatellite ins0calibratespot)以及一条边，记录节点之间的关系：节点1可以由节点2通过动作(calibrate satellite instrument0ins0calibratespot)达成。这时候，支持动作如下：

SupportsActs＝{(turn_to satellite ins0calibratespotins2calibratespot)

(turn_to satellite ins0calibratespot ins1calibratespot)

(turn_to satellite ins0calibratespot spot1)

(turn_to satellite ins0calibratespot spot2)

(turn_to satellite ins0calibratespot spot3)

(switch_on instrument0satellite)}

继续执行以上步骤，总共经过4次后，得到满足关系式的回退状态，此时

S_regress＝{(on_board instrument0satellite)(pointing satellite spot1)

(power_on instrument0)

(calibration_target instrument0ins0calibratespot)}。

根据树tree中存储的数据信息，从回退状态所在的节点开始按照叶节点向根节点的顺序进行动作的提取，最终得到的不含时间信息的初步任务规划修复解如下：

repairActs＝{(turn_to satellite ins0calibratespot spot1)

(calibrate satellite instrument0ins0calibratespot)}

依据图2中的活动模型可知repairActs中动作的添加效果、删除效果如表3所示。

表3 repairActs中活动的添加效果和删除效果

在当前状态S_cur下按公式(2)依次应用这些动作后得到的状态如下：

S_derived＝{(supports instrument0spectrograph)(supportsinstrument0infrared)

(supports instrument1image)(supports instrument2infrared)

(calibration_target instrument1ins1calibratespot)

(calibration_target instrument0ins0calibratespot)

(calibration_target instrument2ins2calibratespot)

(on_board instrument2satellite)(power_on instrument0)

(on_board instrument0satellite)(on_board instrument1satellite)

(supports instrument2image)(pointing satellite ins0calibratespot)

(calibrated instrument0)}。

通过对比不难发现S_derived中不包含谓词(pointing satellite spot1)，关系式不成立，目标回退状态没有得到完全满足，S_exp＝todo＝{(pointingsatellite spot1)}，转步骤三，得到新的repairActs＝{(turn_to satellitespot1ins0calibratespot)}，应用该动作后得到状态

S_derived＝{(supports instrument0spectrograph)(supportsinstrument0infrared)

(supports instrument1image)(supports instrument2infrared)

(calibration_target instrument1ins1calibratespot)

(calibration_target instrument0ins0calibratespot)

(calibration_target instrument2ins2calibratespot)

(on_board instrument2satellite)(power_on instrument0)

(on_board instrument0satellite)(on_board instrument1satellite)

(supports instrument2image)(pointing satellite spot1)

(calibrated instrument0)}，

满足关系式回退目标状态得到满足，转步骤六进行后续处理，增加时间信息。此时修复结果repairActs如下，

repairActs＝{(turn_to satellite ins0calibratespot spot1)

(calibrate satellite instrument0ins0calibratespot)

(turn_to satellite spot1ins0calibratespot)}。

由步骤二和表1可知，动作执行失败时的时刻为t＝39.3，考虑时间增量为10个时间单位，则未来动作执行时间的起始时刻为49.3。因此，结合动作的持续时间可初步得到修复解的动作执行时间分别为t(turn_to satellite ins0calibratespot spot1)＝49.3，t(calibrate satellite instrument0ins0calibratespot)＝49.3+25.96＝75.26，t(turn_to satellite spot1ins0calibratespot)＝75.26+25.96＝101.22。将该结果与原有规划结果中未执行的部分作为输入，调用Sapa规划中的时间调度函数greedyPostProObj.getPlan()，即可获得最终的任务规划修复方案，如表4所示。

表4任务规划修复方案

开始时间	活动	持续时间
			49.3	(turn_to satellite ins0calibratespot spot1)	25.96
75.26	(calibrate satellite instrument0ins0calibratespot)	37.3
			75.26	(turn_to satellite spot1ins0calibratespot)	25.96
112.56	(take_image satellite spot1instrument0infrared)	7
			119.56	(turn_to satellite spot2spot1)	49.61
169.17	(take_image satellite spot2instrument0spectrograph)	7
			176.17	(switch_off instrument0satellite)	1
176.17	(turn_to satellite ins1calibratespot spot2)	35.34
			177.17	(switch_on instrument1satellite)	2
211.51	(calibrate satellite instrument1ins1calibratespot)	15.9
			211.51	(turn_to satellite spot3ins1calibratespot)	30.24
241.75	(take_image satellite spot3instrument1image)	7
			248.75	(turn_to satellite Sun spot3)	67.65

本实施例在普通的PC机上运行，搜索节点数为8，平均运行时间为5ms，而重规划搜索节点数为114，耗时23ms，可以看出搜索节点数目大大减少，求解时间得到显著降低。从表4的结果可以看出，所得的任务规划修复方案所含步骤合理，从实用性方面验证了本实施例方法的合理性和工程应用价值。

以上所述的具体描述，对发明的目的、技术方案和有益效果进行进一步详细说明，所应理解的是，以上所述仅为本发明的具体实施例而已，并不用于限定本发明的保护范围，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.状态空间下快速高效的航天器自主任务规划修复方法，其特征在于：包括如下步骤，

步骤一、由原始任务规划结果得到航天器不同时刻的回退目标状态；

步骤二、根据任务执行失败时刻的航天器状态与某一时刻的回退目标状态之间的谓词组成差异，对回退目标状态进行约简，得到简化后的回退目标状态；

步骤三、由简化后的回退目标状态开始进行后向搜索，获得不含时间的初步任务规划修复解；

步骤四、对得到的不含时间信息的初步任务规划修复解进行模拟执行，得到模拟执行后的状态；

步骤五、判断模拟执行后状态的一致性，并根据判断结果执行步骤六或返回步骤三；

2.如权利要求1所述的状态空间下快速高效的航天器自主任务规划修复方法，其特征在于：还包括步骤七，执行修复后的航天器自主任务规划方案，使航天器从失败状态转移到合适的目标状态，从而实现航天器任务执行失败时的自主恢复操作，即实现状态空间下快速高效的航天器自主任务规划修复。

3.如权利要求1或2所述的状态空间下快速高效的航天器自主任务规划修复方法，其特征在于：步骤一具体实现方法为，

根据航天器原始任务规划结果中的活动序列和活动的执行时间，依据规划领域中活动的前提和效果，由目标状态出发，对执行时间相同的活动按照公式(1)进行状态回退，得到不同时刻航天器的回退目标状态，直至初始状态；

式中，t_S、都表示具体时刻，S是t_S时刻航天器的状态，S’是时刻航天器的回退目标状态，且是状态S下上一个可执行活动的开始时间，即a是航天器原始任务规划结果中用于回退的活动，开始时间等于a.add是a的添加效果，a.pre是a的前提条件；对于目标状态，规定其开始时间为t_∞。

4.如权利要求3所述的状态空间下快速高效的航天器自主任务规划修复方法，其特征在于：步骤二具体实现方法为，

获得任务执行失败时航天器的状态S_cur和某时刻对应的回退目标状态，根据其谓词组成差异，将相同部分存入集合common，将回退目标状态中不重复的部分存入集合S_exp；S_exp即为简化后的回退目标状态；回退目标状态默认为任务执行失败时刻的回退目标状态。

5.如权利要求4所述的状态空间下快速高效的航天器自主任务规划修复方法，其特征在于：步骤三具体实现方法为，

创建一个集合open，将S_exp存入其中，用于存放任务规划修复过程中待搜索节点的信息；同时创建一个空的树型数据结构tree，用于存放任务规划修复过程的扩展节点信息，然后开始搜索规划修复解，包括如下步骤，

步骤3.1：取出open中的第一个元素O₁，放入tree中；

步骤3.2：找到元素O₁的所有支持动作supportActs；其中，集合supportActs中的每一个动作满足以下条件：元素O₁包含动作的所有添加效果且不包含动作的任何删除效果；

步骤3.4：将回退状态S_regress置入open，并判断回退状态S_regress是否可以在当前状态S_cur下发生，即判断关系式是否成立；

条件a.若不成立，转步骤3.3；

6.如权利要求5所述的状态空间下快速高效的航天器自主任务规划修复方法，其特征在于：步骤四具体实现方法为，

在当前状态S_cur下按照公式(2)依次应用repairActs中的活动，得到模拟执行后的状态S_derived；

S_derived＝S\a.del∪a.add (2)

7.如权利要求6所述的状态空间下快速高效的航天器自主任务规划修复方法，其特征在于：步骤五具体实现方法为，

判断关系式是否成立，用于确认初步规划修复解没有破坏回退目标状态；

条件a.若成立，回退目标状态得到满足，即初步规划修复解满足要求；此时，需要进行后续处理，增加时间信息，转步骤六；