CN110619478A

CN110619478A - 基于指针神经网络的单星应急任务规划方法及系统

Info

Publication number: CN110619478A
Application number: CN201910898342.2A
Authority: CN
Inventors: 胡笑旋; 王执龙; 夏维; 马华伟; 靳鹏; 罗贺; 王国强; 孙海权; 王云辉; 胡玉可; 晏冰
Original assignee: Hefei Polytechnic University
Current assignee: Hefei Polytechnic University
Priority date: 2019-09-23
Filing date: 2019-09-23
Publication date: 2019-12-27
Anticipated expiration: 2039-09-23
Also published as: CN110619478B

Abstract

本发明提供一种基于指针神经网络的单星应急任务规划方法及系统，属于卫星的调度技术领域。该方法包括从任务需求数据集中形成多条训练数据；生成应急任务规划方案；判断迭代次数是否大于或等于次数阈值；在判断迭代次数小于次数阈值的情况下，计算收益；判断迭代次数是否等于初始值；在判断迭代次数等于初始值时，根据收益更新参数；在判断迭代次数不等于初始值时，根据平滑收益更新参数；更新迭代次数；在判断迭代次数大于或等于次数阈值的情况下，测试指针神经网络，判断是否满足精度要求；在判断不满足精度要求时，重置迭代次数为初始值；在判断指针神经网络满足精度要求的情况下，接收实际的任务需求；采用指针神经网络生成应急任务规划方案。

Description

基于指针神经网络的单星应急任务规划方法及系统

技术领域

本发明涉及卫星的调度技术领域，具体地涉及一种基于指针神经网络的单星应急任务规划方法及系统。

背景技术

成像卫星是获取地地面图像信息的重要手段，具有重要的战略价值和广泛的应用需求。卫星应急任务规划技术居于成像卫星任务管控平台的中枢位置，主要负责解决资源争用和任务冲突问题，优化卫星的使用效益，面向当前卫星资源有限、成像需求繁多、响应时效性强的现状，更具重要意义。

卫星应急任务规划问题是一类高复杂性、高时效性的组合优化问题。传统精确求解算法虽然能够求得问题的精确解，但存在算法复杂度高、占用的系统资源多、求解时间长等的技术问题。当前解决卫星应急任务规划问题常用启发式算法和智能算法，如遗传算法、紧急搜索算法和模拟退火算法等。该类算法虽然能够求得问题近似解，具有良好的求解时间，但算法稳定性较差，易陷入局部最优解、对设计的启发式规则较为依赖，方法泛化能力较差，规划结果需要人工二次调整。

发明内容

本发明实施方式的目的是提供一种基于指针神经网络的单星应急任务规划方法、系统及存储介质，该应急任务规划方法可以提高卫星形成卫星应急任务规划方案的速度和准确性。

为了实现上述目的，本发明实施方式提供一种基于指针神经网络的单星应急任务规划方法，该应急任务规划方法包括：

初始化指针神经网络和迭代次数；

从单个卫星的任务需求数据集中随机抽取以形成多条训练数据

对所述每条训练数据进行预处理；

对预处理后的每条训练数据的时间窗数据进行嵌入处理以形成嵌入向量；

采用指针神经网络根据所述嵌入向量生成应急任务规划方案；

判断当前的迭代次数是否大于或等于预设的次数阈值；

在判断所述迭代次数小于所述次数阈值的情况下，计算所述应急任务规划方案的收益；

判断所述迭代次数是否等于初始值；

在判断所述迭代次数等于所述初始值的情况下，根据所述收益采用反向梯度法更新所述指针神经网络的参数；

在判断所述迭代次数不等于所述初始值的情况下，根据当前的所述收益与上一次迭代过程中的收益计算平滑收益，采用反向梯度法根据所述平滑收益更新所述指针神经网络的参数；

更新所述迭代次数并再次从单个卫星的任务需求数据集中随机抽取以形成多条训练数据；

在判断所述迭代次数大于或等于所述次数阈值的情况下，采用预设的测试集测试所述指针神经网络，判断所述指针神经网络是否满足精度要求；

在判断所述指针神经网络不满足所述精度要求的情况下，重置所述迭代次数为所述初始值，再次从单个卫星的任务需求数据集中随机抽取以形成多条训练数据；

在判断所述指针神经网络满足所述精度要求的情况下，接收实际的任务需求；

采用所述指针神经网络根据实际的所述任务需求生成应急任务规划方案。

可选地，每条所述训练数据包括多个任务，每个所述任务包括多个时间窗，对每条训练数据进行预处理包括：

向每条所述训练数据中添加虚拟任务，其中，所述虚拟任务的所有元素为0；

采用添加虚拟时间窗的方式对较短的所述任务进行填充以使得每个所述任务包括的所述时间窗的数量相同。

可选地，所述应急任务规划方案包括用于执行所述任务的时间窗序列，所述应急任务规划方法进一步包括：

根据公式(1)计算所述收益，

其中，m为所述训练数据的数量，n为所述应急任务规划方案的所述时间窗序列的长度，W_ij为所述任务的权重，wei_sum为所述收益。

可选地，所述应急任务规划方法进一步包括：

根据公式(2)计算所述平滑收益，

wei＝αwei_sum_t-1+(1-α)wei_sum_t， (2)

其中，wei为所述平滑收益，α为预设值，wei_sum_t-1为上一次迭代过程中的所述收益，wei_sum_t为当前的所述收益。

可选地，所述指针神经网络包括多个编码单元和输入嵌入模块，首个所述编码单元分别与输入嵌入模块、相邻的所述编码单元连接，连接在两个所述编码单元之间的所述编码单元与所述输入嵌入模块连接，最后一个所述编码单元与上一个相邻的所述编码单元、所述输入嵌入模块连接；

对预处理后的每条训练数据的时间窗数据进行嵌入处理以形成嵌入向量包括：

所述输入嵌入模块对所述时间窗数据进行处理以形成所述嵌入向量；

采用指针神经网络根据所述嵌入向量生成应急任务规划方案包括：

针对每条所述训练数据，每个所述编码单元顺次接收所述输入嵌入模块发送的所述任务的一个时间窗；

首个所述编码单元用于接收所述训练数据中的第一个所述时间窗，根据第一个所述时间窗生成对应的编码向量；

连接在相邻的两个所述编码单元之间的所述编码单元用于接收上一个所述编码单元发送的所述编码向量和所述输入嵌入模块发送的对应次序的时间窗，根据接收到的所述编码向量和所述时间窗生成对应的所述编码向量；

最后一个所述编码单元用于接收上一个所述编码单元发送的所述编码向量和所述输入嵌入模块发送的当前的所述任务的最后一个所述时间窗，根据接收到的所述编码向量和所述时间窗生成对应的所述编码向量。

可选地，采用指针神经网络根据所述嵌入向量生成应急任务规划方案包括：

每个所述编码单元根据公式(3)至(8)对所述嵌入向量进行计算以生成对应的所述编码向量，

i＝σ(w_iix+b_ii+w_hih+b_hi)， (3)

f＝σ(w_ifx+b_if+w_hfh+b_hf)， (4)

g＝tanh(w_igx+b_ig+w_hgh+b_hg)， (5)

o＝σ(w_iox+b_io+w_hoh+b_ho)， (6)

c′＝f*c+i*g， (7)

h′＝otanh(c′)， (8)

其中，i为所述指针神经网络的更新门参数，f为所述指针神经网络的遗忘门参数，g为所述指针神经网络的更新信息向量，o为所述指针神经网络的过滤门参数，c′为所述编码单元的状态向量，h′为所述编码向量，σ为sigmoid函数，x为所述嵌入向量，h为上一个所述编码单元的输出的编码向量，其中，第一个所述编码单元接收的所述编码向量中的所有元素为0，w_ii、b_ii、w_hi、b_hi、w_if、b_if、w_hf、b_hf、b_ig、w_hg、b_hg、w_io、b_io、w_ho、b_ho为所述指针神经网络中的待优化的参数。

可选地，所述指针神经网络进一步包括多个解码单元和指针注意力机制，首个所述解码单元与最后一个所述编码单元、所述指针注意力机制连接，连接在两个相邻的所述解码单元之间的所述解码单元与所述指针注意力机制连接，最后一个所述解码单元与上一个相邻的所述解码单元和所述指针注意力机制连接，所述指针注意力机制还有与所述输入嵌入模块连接；

首个所述解码单元接收最后一个所述编码单元发送的所述编码向量和所述指针神经网络的可调的初始化输入参数，根据所述编码向量和所述输入参数生成对应的所述解码向量；

所述指针注意力机制接收所述解码单元发送的所述解码向量和所述输入嵌入模块发送的所述嵌入向量，根据所述解码向量和所述嵌入向量确定所述任务的时间窗，根据预设的约束条件和所述时间窗对剩余的每个所述时间窗进行筛选，删除不满足所述约束条件的时间窗，输出所述时间窗并向下一个所述解码单元发送所述时间窗对应的所述嵌入向量；

非首个所述解码单元接收上一个所述解码单元的所述解码向量和所述指针注意力机制发送的所述嵌入向量，根据接收到的所述解码向量和所述嵌入向量生成对应的所述解码向量。

可选地，所述约束条件包括所述时间窗的唯一性的约束、能量的约束和存储容量的约束中的至少一者。

本发明的另一方面还提供一种基于指针神经网络的单星应急任务规划系统，所述应急任务规划系统包括处理器，所述处理器用于执行上述任一所述的应急任务规划方法。

本发明的再一方面还提供一种存储介质，所述存储介质存储有指令，所述指令用于被机器读取以使得所述机器执行上述任一所述的应急任务规划方法。

通过上述技术方案，本发明提供的基于指针神经网络的单星应急任务规划方法、系统及存储介质通过从卫星的任务需求数据集中随机抽取任务数据集，采用该任务数据集对指针式神经网络进行训练，以较小的数据集训练指针式神经网络，降低了对系统资源的占用；另一方面，采用训练好的指针式神经网络对卫星的任务需求进行规划，能够自主发现应急任务规划过程中的启发式规则，降低了整体方法对于人工设计的启发式规则的依赖，可以有效地提高卫星的单星应急任务规划方法的泛化能力。

本发明实施方式的其它特征和优点将在随后的具体实施方式部分予以详细说明。

附图说明

附图是用来提供对本发明实施方式的进一步理解，并且构成说明书的一部分，与下面的具体实施方式一起用于解释本发明实施方式，但并不构成对本发明实施方式的限制。在附图中：

图1是根据本发明的一个实施方式的基于指针神经网络的单星应急任务规划方法的流程图；

图2是根据本发明的一个实施方式的指针神经网络的结构框图。

具体实施方式

以下结合附图对本发明实施方式的具体实施方式进行详细说明。应当理解的是，此处所描述的具体实施方式仅用于说明和解释本发明实施方式，并不用于限制本发明实施方式。

在本发明实施方式中，在未作相反说明的情况下，使用的方位词如“上、下、顶、底”通常是针对附图所示的方向而言的或者是针对竖直、垂直或重力方向上而言的各部件相互位置关系描述用词。

另外，若本发明实施方式中有涉及“第一”、“第二”等的描述，则该“第一”、“第二”等的描述仅用于描述目的，而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外，各个实施方式之间的技术方案可以相互结合，但是必须是以本领域普通技术人员能够实现为基础，当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在，也不在本发明要求的保护范围之内。

如图1所示是根据本发明的一个实施方式的基于指针神经网络的单星应急任务规划方法的流程图。在图1中，该应急任务规划方法可以包括：

在步骤S100中，初始化指针神经网络和迭代次数。在该实施方式中，该指针神经网络可以是本领域人员所知的神经网络。对于该迭代次数，可以是本领域人员所知的初始化方式，例如将迭代次数初始化为0或1的初始值。

在步骤S110中，从单个卫星的任务需求数据集中随机抽取以多条训练数据。由于现有技术中的任务需求数据集极其庞大，如果直接以这样的任务数据需求数据集对指针神经网络进行训练，虽然可以得到符合要求的指针神经网络。但是，这样的训练过程会占用大量的系统资源，使得训练的效率低下，难以满足现有技术中的硬件条件。因此，在该实施方式中，从任务需求数据集中随机抽取的多条训练数据不仅可以反映整个任务需求数据集的分布变化，在训练的过程中也可以大大减少系统的负担，很好地满足现有技术的硬件要求。另外，训练的速度以及效率也相对大大提高。对于该训练数据的具体形式，可以是本领域人员针对实际的卫星的硬件条件来制定。在本发明的一个示例中，每条训练数据可以包括多个任务，每个任务可以包括多个(用于执行该任务的)时间窗。对于每个时间窗，可以是例如包括时间窗的序号、圈号、时间窗的权重、时间窗的开始时间、持续时间、存储容量以及需要耗费的卫星的能量。在该示例中，也可以采用公式(1)示出的形式表示每个时间窗，

Win_ij＝[Win_Id,C_Id,W_i,ST,DT,Sa,SL]， (1)

其中，Win_ij为第i个任务的第j个时间窗，Win_Id为该时间窗的序号，C_Id为时间窗的圈号，W_i为该时间窗的权重，ST为时间窗的开始时间，DT为时间窗的结束时间，Sa为时间窗的存储容量，SL为在该时间窗内卫星执行任务需要耗费的能量。

相应的，可以采用公式(2)表示每个任务，

[Win₁₁,Win₁₂,Win₂₁,...,Win_n1]， (2)。

在步骤S120中，对每条训练数据进行预处理。在该实施方式中，虽然以公式(1)和公式(2)的形式表示每个时间窗和任务数据，可以便于将该训练数据的时间窗数据应用于指针神经网络的训练中。但是，针对每个任务，由于每个任务的时间窗的数量可能不同，那么采用公式(2)的形式来表示每个任务就会导致每个任务的的序列的长度的不同，这样会影响指针神经网络的迭代运算，导致无法完成对指针神经网络的训练。因此，在该实施方式中，可以采用添加虚拟时间窗的方式来使得每个任务的序列的长度相同。对于该虚拟时间窗，可以是例如所有元素均为0的序列。

另一方面，考虑到每个应急任务规划方案中所包括的任务的数量可能不同，这样也会导致每个应急任务规划方案的长度的不同，这同样也会影响指针神经网络后续的批量训练迭代运算。那么，类似地，在该实施方式中，可以采用添加虚拟任务的方式来使得每个应急任务规划方案的长度相同。对于该虚拟任务，可以是例如包括多个虚拟时间窗并且每个虚拟时间窗中的元素均为0。

在步骤S130中，对每条训练数据进行嵌入处理以形成嵌入向量。对于该嵌入处理以及嵌入向量的生成方式，可以是本领域人员所知的多种方式。在发明的一个实施方式中，可以是采用公式(3)对该训练数据进行处理以形成嵌入向量，

Embedded＝input*Em， (3)。

在步骤S140中，采用指针神经网络针对每条训练数据根据嵌入向量生成应急任务规划方案。在该实施方式中，指针神经网络针对每条训练数据根据该嵌入向量生成应急任务规划方案的具体方式可以是本领域人员所知的多种。在该实施方式中，该具体方式可以是包括编码和解码两个部分。对于编码，在本发明的一个示例中，以图2中所示出的指针神经网络为例。在图2中，该指针神经网络可以包括多个编码单元01和输入嵌入模块02。首个编码单元01可以分别与输入嵌入模块02、相邻的编码单元01连接；连接在两个编码单元01之间的编码单元01可以与输入嵌入模块02连接；最后一个编码单元01可以与上一个相邻的编码单元01、输入嵌入模块02连接。

该编码的具体方式可以是例如：

1、输入嵌入模块02对每条训练数据进行处理以形成嵌入向量；

2、针对每条训练数据，每个编码单元01顺次接收输入嵌入模块02发送的任务的一个时间窗；

3、首个编码单元01用于接收任务中的第一个时间窗，根据第一个时间窗生成对应的编码向量；

4、连接在相邻的两个编码单元01之间的编码单元01用于接收上一个编码单元01发送的编码向量和输入嵌入模块02发送的对应次序的时间窗，根据编码向量和时间窗生成对应的编码向量；

5、最后一个编码单元01用于接收上一个编码单元01发送的编码向量和输入嵌入模块02发送的当前的任务的最后一个时间窗，根据编码向量和时间窗生成对应的编码向量。

另外，在示例中，由于每个编码单元01顺次接收输入嵌入模块02发送的任务的一个时间窗，那么该编码单元01的数量可以是每个任务的时间窗的数量相同。对于每个编码单元生成对应的编码向量的具体方式，也可以是本领域人员所知的多种，在该示例中，可以是例如根据公式(4)至(9)生成该编码向量，

i＝σ(w_iix+b_ii+w_hih+b_hi)， (4)

f＝σ(w_ifx+b_if+w_hfh+b_hf)， (5)

g＝tanh(w_igx+b_ig+w_hgh+b_hg)， (6)

o＝σ(w_iox+b_io+w_hoh+b_ho)， (7)

c′＝f*c+i*g， (8)

h′＝otanh(c′)， (9)

其中，i为指针神经网络的更新门参数，f为指针神经网络的遗忘门参数，g为指针神经网络的更新信息向量，o为指针神经网络的过滤门参数，c′为编码单元的状态向量，h′为编码向量，σ为sigmoid函数，x为嵌入向量，h为上一个编码单元的输出的编码向量，其中，第一个编码单元接收的编码向量中的所有元素为0，w_ii、b_ii、w_hi、b_hi、w_if、b_if、w_hf、b_hf、b_ig、w_hg、b_hg、w_io、b_io、w_ho、b_ho为指针神经网络中的待优化的参数。

对于解码，以图2中示出的指针神经网络为例。在图2中，该指针神经网络可以进一步包括多个解码单元03和指针注意力机制04。首个解码单元03与最后一个编码单元01、指针注意力机制04连接；连接在两个相邻的解码单元03之间的解码单元03与指针注意力机制04连接；最后一个解码单元03与上一个相邻的解码单元03和指针注意力机制04连接；指针注意力机制04还有与输入嵌入模块02连接。

那么，针对每条训练数据该解码的具体方式可以是例如：

1、首个解码单元03接收最后一个编码单元01发送的编码向量和指针神经网络的可调的初始化输入参数，根据编码向量和输入参数生成对应的解码向量；

2、指针注意力机制04接收解码单元03发送的解码向量和输入嵌入模块02发送的嵌入向量，根据解码向量和嵌入向量确定任务的时间窗，根据预设的约束条件和时间窗对剩余的每个时间窗进行筛选，删除不满足约束条件的时间窗(例如将该时间窗的选择的概率设置为负无穷)，输出时间窗并向下一个解码单元03发送时间窗对应的嵌入向量；

3、非首个解码单元03可以接收上一个解码单元03的解码向量和指针注意力机制04发送的嵌入向量，根据该解码向量和嵌入向量生成对应的解码向量。

另外，对于该约束条件，可以是本领域人员基于实际的条件来确定，例如考虑到同一个时间窗，卫星只能够执行一个任务，那么可以对时间窗的唯一性进行检验；又或者在该时间窗内，考虑卫星的能量不一定能够完成该任务，那么该约束也可以包括能量的检验；再或者在该时间窗内，卫星能够存储的数据的容量不一定能够满足条件，那么该约束也可以包括对时间窗的存储容量的检验。

在步骤S150中，判断当前的迭代次数是否大于或等于预设的次数阈值。

在步骤S160中，在判断迭代次数小于次数阈值的情况下，计算应急任务规划方案的收益。对于该收益的计算方式，可以是本领域人员所知的多种形式。在本发明的一个示例中，可以是例如根据公式(10)计算该收益，

其中，m为训练数据的数量，n为应急任务规划方案中的时间序列的长度，W_ij为任务的权重，wei_sum为收益。

在步骤S170中，判断迭代次数是否等于初始值。

在步骤S180中，在判断迭代次数等于初始值的情况下，根据该收益采用反向梯度法更新指针神经网络的参数。

在步骤S190中，在判断迭代次数不等于初始值的情况下，根据当前的收益与上一次迭代过程中的收益计算平滑收益，采用反向梯度法根据平滑收益更新指针神经网络的参数。对于该平滑收益的计算方式，可以是本领域人员所知的多种，在本发明的一个示例中，该计算方式可以是例如根据公式(11)计算该平滑收益，

wei＝αwei_sum_t-1+(1-α)wei_sum_t， (11)

其中，wei为平滑收益，α为预设值，wei_sum_t-1为上一次迭代过程中的收益，wei_sum_t为当前的收益。

在步骤S200中，更新迭代次数并再次从单个卫星的任务需求数据集中随机抽取以形成该多条训练数据(返回执行步骤S110)。

在步骤S210中，在判断迭代次数大于或等于次数阈值的情况下(此时说明指针神经网络的训练次数已经足够)，采用预设的测试集测试指针神经网络，判断指针神经网络是否满足精度要求。对于判断该指针神经网络是否满足精度要求的方式，可以是例如将指针神经网络基于测试集输出的应急任务规划方案与预设的测试集的应急任务规划方案进行比对，从而判断该指针神经网络是否满足条件。

在步骤S220中，在判断该指针神经网络不满足精度要求的情况下，重置迭代次数为初始值，再次从单个卫星的任务需求数据集中随机抽取以形成所述训练数据(返回执行步骤S110)。

在步骤S230中，在判断指针神经网络满足精度要求的情况下，接收实际的任务需求。

在步骤S240中，采用指针神经网络根据实际的任务需求生成应急任务规划方案。

本发明的另一方面还提供一种基于指针神经网络的单星应急任务规划系统，该应急任务规划系统可以包括处理器，该处理器可以用于执行如上述任一的应急任务规划方法。

本发明的再一方面还提供一种存储介质，该存储介质可以存储有指令，该指令可以用于被机器读取以使得机器执行如上述任一的应急任务规划方法。

以上结合附图详细描述了本发明例的可选实施方式，但是，本发明实施方式并不限于上述实施方式中的具体细节，在本发明实施方式的技术构思范围内，可以对本发明实施方式的技术方案进行多种简单变型，这些简单变型均属于本发明实施方式的保护范围。

另外需要说明的是，在上述具体实施方式中所描述的各个具体技术特征，在不矛盾的情况下，可以通过任何合适的方式进行组合。为了避免不必要的重复，本发明实施方式对各种可能的组合方式不再另行说明。

本领域技术人员可以理解实现上述实施方式方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，该程序存储在一个存储介质中，包括若干指令用以使得一个(可以是单片机，芯片等)或处理器(processor)执行本发明各个实施方式所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-OnlyMemory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

此外，本发明实施方式的各种不同的实施方式之间也可以进行任意组合，只要其不违背本发明实施方式的思想，其同样应当视为本发明实施方式所公开的内容。

Claims

1.一种基于指针神经网络的单星应急任务规划方法，其特征在于，所述应急任务规划方法包括：

初始化指针神经网络和迭代次数；

对所述每条训练数据进行预处理；

判断当前的迭代次数是否大于或等于预设的次数阈值；

判断所述迭代次数是否等于初始值；

2.根据权利要求1所述的应急任务规划方法，其特征在于，每条所述训练数据包括多个任务，每个所述任务包括多个时间窗，对每条训练数据进行预处理包括：

3.根据权利要求2所述的应急任务规划方法，其特征在于，所述应急任务规划方案包括用于执行所述任务的时间窗序列，所述应急任务规划方法进一步包括：

根据公式(1)计算所述收益，

4.根据权利要求2所述的应急任务规划方法，其特征在于，所述应急任务规划方法进一步包括：

根据公式(2)计算所述平滑收益，

wei＝αwei_sum_t-1+(1-α)wei_sum_t， (2)

5.根据权利要求2所述的应急任务规划方法，其特征在于，所述指针神经网络包括多个编码单元和输入嵌入模块，首个所述编码单元分别与输入嵌入模块、相邻的所述编码单元连接，连接在两个所述编码单元之间的所述编码单元与所述输入嵌入模块连接，最后一个所述编码单元与上一个相邻的所述编码单元、所述输入嵌入模块连接；

6.根据权利要求5所述的应急任务规划方法，其特征在于，采用指针神经网络根据所述嵌入向量生成应急任务规划方案包括：

i＝σ(w_iix+b_ii+w_hih+b_hi)， (3)

f＝σ(w_ifx+b_if+w_hfh+b_hf)， (4)

g＝tanh(w_igx+b_ig+w_hgh+b_hg)， (5)

o＝σ(w_iox+b_io+w_hoh+b_ho)， (6)

c′＝f*c+i*g， (7)

h′＝otanh(c′)， (8)

7.根据权利要求5所述的应急任务规划方法，其特征在于，所述指针神经网络进一步包括多个解码单元和指针注意力机制，首个所述解码单元与最后一个所述编码单元、所述指针注意力机制连接，连接在两个相邻的所述解码单元之间的所述解码单元与所述指针注意力机制连接，最后一个所述解码单元与上一个相邻的所述解码单元和所述指针注意力机制连接，所述指针注意力机制还有与所述输入嵌入模块连接；

8.根据权利要求7所述的应急任务规划方法，其特征在于，所述约束条件包括所述时间窗的唯一性的约束、能量的约束和存储容量的约束中的至少一者。

9.一种基于指针神经网络的单星应急任务规划系统，其特征在于，所述应急任务规划系统包括处理器，所述处理器用于执行如权利要求1至8任一所述的应急任务规划方法。

10.一种存储介质，其特征在于，所述存储介质存储有指令，所述指令用于被机器读取以使得所述机器执行如权利要求1至8任一所述的应急任务规划方法。