CN114826378B

CN114826378B - 基于数据驱动的星间链路调度方法及系统

Info

Publication number: CN114826378B
Application number: CN202210407705.XA
Authority: CN
Inventors: 陈盈果; 杨青; 李远航; 杜永浩; 柳金明; 何磊; 贺仁杰; 姚锋; 陈宇宁; 吕济民; 刘晓路; 陈英武
Original assignee: National University of Defense Technology
Current assignee: National University of Defense Technology
Priority date: 2022-03-14
Filing date: 2022-04-19
Publication date: 2023-10-24
Anticipated expiration: 2042-04-19
Also published as: CN114826378A

Abstract

本发明提供了一种基于数据驱动的星间链路调度方法及系统，通过将连续时间段进行离散化处理，得到离散后的每个时间片上的卫星状态即境内星还是境外星，将每个时间片上的卫星视为节点，将卫星产生的数据看成商品，构建时变网络多商品流模型，将一个卫星空间位置连续变化的星间链路调度问题转化为一个具有时变特性的多商品流问题，因此得到星间链路调度方法。实验表明，与其他方法相比，本发明提出的方法具有更好的优化性能和质量，以900颗卫星星座为研究对象中，在没有影响通信质量的情况下将其通信时延降低了40％左右。

Description

基于数据驱动的星间链路调度方法及系统

技术领域

本发明属于卫星任务调度规划领域，尤其是涉及一种基于数据驱动的星间链路调度方法及系统。

背景技术

航空航天技术和无线通信技术得到了迅速发展，尤其是卫星资源在卫星物联网、遥感遥测、导航增强等方面发挥重要作用。目前单一卫星资源已经无法满足人们的实际需求，需要使用多颗卫星组网技术执行相关任务。例如GPS导航系统和北斗导航系统是由高轨道卫星和中轨道卫星以及对地静止轨道卫星等组成，用来执行全球定位、测距任务；OneWeb星座计划、Starlink计划以及中国航天企业提出的鸿雁、虹云的卫星网络建设计划主要服务于全球通信任务，包括语音、数据等移动服务，电视节目、应急通信等固定服务以及互联网、物联网、多媒体等新型服务。所以面对用户规模的不断扩张、海量的任务需求、数据传输的爆炸式增长，卫星网络将会承受巨大的压力。另外，随着“星地一体化”、“空天一体化”以及“智能星群”等新兴技术的相继提出，星间信息通讯也逐渐成为关键技术。所以如何改进卫星星座的网络结构、提升卫星数据传输效率以及进行有效的星间管理是一个急迫解决的问题。而优化星间链路调度则是解决该问题的重要途经。

星间链路是指一条连通两个卫星的无线通讯链路。星间链路调度则是指一个星座内决策在什么时间，卫星之间的建链关系。星间链路的作用是可以将测控弧外的数据传回到地面的管控部门。星间链路调度的功能是高效的将测控弧外的数据传回地面站。星间链路调度问题ISLSP(inter-satellite link scheduling problem)主要有三个难点，①卫星相对地球的位置是时刻变化的(除静止轨道卫星)，这将导致整个过程是连续变化的，难以通过优化手段进行求解；②星座卫星数量多，时隙多，问题解空间巨大。一个星座内有R颗卫星、一个周期的时间为T_z，星与星之间的平均一个可见时间段为T秒，数据传输过程需t秒(包括建链、传输、断链过程)，那么其解空间为③卫星连接约束复杂，求解难度高。为了保证卫星之间信息传输时，链路具有速度快、精度高、抗干扰强的特点。所以目前卫星连接使用的是窄波束星间链接，这种连接方式导致在某一时刻卫星仅能进行一次建链且是双向建链。此外，星座规模巨大。低轨通信卫星星座主要目的是实现全球组网，为全球的人与物实现移动通信保障与宽带通信服务。所以其在进行全球覆盖时必然会导致星座规模的增大。一般低轨通信卫星星座规模是常规导航星座的几倍到几十倍之间。②星间可见时间短。由于低轨卫星一般的轨道高度在500km-1500km之间，系统运行周期少于2小时。所以其可见时间相对中高轨卫星可见时间是极短的。③要求毫秒级的数据传输速度。虽然低轨卫星具备轨道低、信号延迟和衰减率低的优点，但其对数据传输速度要求较高，需要达到毫秒级传输速度。

发明内容

本发明要解决的技术问题是怎样快速在大量的低轨卫星间快速构建星间链路，从而进行星间的数据传输，提出了一种基于数据驱动的星间链路调度方法及系统。

为解决上述技术问题，本发明所采用的技术方案是：

一种基于数据驱动的星间链路调度方法，包括以下步骤：

步骤1：获取参与调度的任务集与卫星集；

步骤2：将连续时间段进行离散化处理，得到离散后的每个时间片上的卫星状态即境内星还是境外星，将每个时间片上的卫星视为节点；

步骤3：在每个时间片上增加一个终点卫星节点和一个虚拟层中间节点，将卫星上产生的数据看作商品，根据每个时间片上的卫星状态构建时变网络多商品流模型；

步骤4：对所述时变网络多商品流模型进行求解得到星间链路调度方案并输出。

本发明还提供了一种基于数据驱动的星间链路调度系统，包括以下模块：

输入模块：用于获取参与调度的任务集与卫星集；

多商品流模型构建模块：用于将连续时间段进行离散化处理，得到离散后的每个时间片上的卫星状态即境内星还是境外星，将每个时间片上的卫星视为节点，在每个时间片上增加一个终点卫星节点和一个虚拟层中间节点，将卫星上产生的数据看作商品，根据每个时间片上的卫星状态构建时变网络多商品流模型；

求解输出模块：用于对所述时变网络多商品流模型进行求解得到星间链路调度方案并输出。

采用上述技术方案，本发明具有如下有益效果：

本发明一种基于数据驱动的星间链路调度方法及系统，通过将连续时间段进行离散化处理，得到离散后的每个时间片上的卫星状态即境内星还是境外星，将每个时间片上的卫星视为节点，将卫星产生的数据看成商品，构建时变网络多商品流模型，将一个卫星空间位置连续变化的星间链路调度问题转化为一个具有时变特性的多商品流问题，因此得到星间链路调度方法。

本发明所使用的数据驱动的的并行自适应大邻域搜索方法，使用数据驱动的初始解生成方法得到初始解，为每个初始解分配一个规则，自适应大邻域搜索策略算法与规则组合形成具有不同规则的改进的自适应大邻域搜索算法I-ALNS方法。最后以并行调度的方法，各个初始解在不同规则的I-ALNS方法下分别被优化，并且每经过一定代数，算法根据规则进化机制评估不同规则的作用，来提高整体性能。与其他方法相比，这个被提出的方法有更好的优化性能和质量。实验表明，以900颗卫星星座为研究对象中，在没有影响通信质量的情况下将其通信时延降低了40％左右。

附图说明

图1为超帧中具有两个连续时隙的星间链路ISL(Inter-Satellite Link)描述(4颗卫星，1个地面站)；

图2为本发明系统流程图；

图3为大规模低轨道通信卫星星座星间链路调度问题LLCSC-ISLSP(large-scalelow orbit communication satellite constellations inter-satellite linkscheduling problem)转变为多商品流模型MCFP(multi-commodity flow Problem)的转换示意图；

图4为数据驱动算法生成初始解的结构示意图；

图5为并行自适应大邻域搜索算法的结构示意图；

图6为卫星负荷和时延计算图示意图；

图7为计算延迟方法的说明示意图；

图8为不同算法调度结果对比图，(a)为中国区域，(b)为世界区域；

图9为不同初始解生成策略的调度结果对比图，(a)为“境外星”与“境内星”数量之比接近6.5∶1，(b)为“境外星”与“境内星”之比为8∶1；

图10为DP-ALNS解决方案性能验证图，(a)为“境内星”与“境外星”数量之比为1∶8，(b)为一组实验数据测试十次的效果图，(c)为分别设定λ＝0.1，λ＝0.5，λ＝0.9，不同的λ值代表前一个T代优化结果对本次各算法得分的影响；

图11为T_s＝100,500,1000时，为不同算子分数更新迭代的优化结果；

图12为T₁＝50,100,500，不同邻域算子切换迭代优化结果。

具体实施方式

下面将结合附图对本发明的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

对于星间链路调度问题ISLSP，本发明采用虚拟拓扑策略，将连续时间段进行离散化处理。在卫星网络中选择合适的离散粒度构建关系快照，每个快照包含所有节点的信息。相邻两个快照之间的时间跨度被定义为一个超帧(一个调度周期)。为了保证拓扑快照与实际星座的拓扑接近，将一个超帧的时间长度设定为0.5s.同时，将卫星与卫星之间的数据传输时间设为25ms，每个数据传输时间被称为一个时隙(timeslot)。如图1所示，在一个超帧内，“境内星”被定义为与地面站可建链的卫星，相反与地面站不可建链(在测控弧外)的卫星被称为“境外星”。星间链路调度的目的是将境外星存储的数据快速下传到地面站，来降低星上数据传输时延。

为了解决本发明的问题，做出以下假设：

1)卫星在每个时隙内都会产生数据，境内星实时将数据下传，境外星需要使用星间链路将数据传到境内星，然后再下传。

2)在一个确定的调度时间段内，其他动态或者不确定的因素不再被考虑。

3)每颗卫星仅装备一个星间链路调度天线，也就是在任意时刻卫星仅能与其可见星集合中的一颗星建链或者与自身建链(将数据存储在该星上)。

4)本发明没有考虑卫星的数据存储容量和星间天线的数据传输容量。

5)在数据进行传输过程中，不会存在数据丢失或者传输失败的情况。

图1至图12示出了本发明一种基于数据驱动的星间链路调度方法的具体实施例，如图2所示，包括以下步骤：

步骤1：获取参与调度的任务集与卫星集；

步骤2：将连续时间段进行离散化处理，得到离散后的每个时间片上的卫星状态即境内星还是境外星，将每个时间片上的卫星视为节点。

如图3所示，图3(a)为各时隙星间链路连接方案。图3(b)是从图3(a)中不同时隙的不同连接方案中获得的一组时间片组成的时变网络。比如，图3(a)中时隙1的连接方案显然能够被展示在图3(b)中时间片1与时间片2的星间链路中。然后，需要建立一个模型，将图3(b)中的时变网络转换为图3(c)中的时变网络多商品流模型。

本实施例中，如图3所示，将每个时间片上的卫星视为一个节点，第一层的境外星为初始节点，其他层的境外星既是初始节点也是中间节点，境内星视为中间节点，而境外星产生的数据可视为商品。定义节点⑤为终点(地面站)，图3(c)中可以看到每层网络中都存在一个节点⑤，这与时变网络多商品流模型MCF的特点不符合。如果节点⑤当作一个中间节点，需要增加一个未知终点与节点⑤相连来满足MCF的特点。但分析发现，无论节点⑤是终点还是中间节点对于求解是没有影响的。所以为了尽量简化模型，将节点⑤定义为终点。本实施例中，增加了虚拟层与节点⑥。由于星间链路调度是一个周期性的工作，而多商品流网络不存在周期性。所以通过约束一个超帧内首时隙的星上数据传输时延来解决这个问题。具体来说，设定一个阈值R，每个超帧内的首时隙时延要小于R，并且每个超帧内最末时隙中境外星产生的数据的时延被定义为R，由此，我们保证了连续两个超帧的星间链路调度方案不冲突，保障了总体星间链路调度方案的可行性。但其中存在的一个问题是最末时隙的数据不会回流到终点，导致与MCFP特征不符，对此我们增加了节点⑥。节点⑥为虚拟中间节点，其存在的目的是将最末时隙的数据通过节点⑥和虚拟层流到终点，满足了多商品流特点。对于星间链路的单一链路和双向连接的特点，也对应的映射到多商品流网络中。因此将图3(b)成功转化为图3(c)，下一步我们可以对图3(c)的网络进行建模和求解。

本实施例中，所述时变网络多商品流模型为：

目标函数：

式(1)表示使所有商品的总延迟最小化；S＝{s₁，…，s_|S|}是时变网络内的卫星集合，|S|表示时变网络内卫星集合中卫星的数量；i、i′表示第i、i′个卫星s_i、s_i′，

sd＝{s₁，…，s_|sd|}是卫星集合中的境内星集合，|sd|表示卫星集合中境内星的数量；

sf＝{s_|sd|+1，…，s_|S|}是卫星集合中的境外星集合；

s_|S|+1是地面站，为增加的终点卫星节点，s_|S|+2是虚拟星，为增加的虚拟层中间节点；

TS＝{ts₁，…，ts_|TS|}是一个超帧中时变网络内的时隙集合，共有|TS|+1个时间片，|TS|表示时隙数量；

T＝{t₁，…，t_|TS|+1}是时变网络多商品流模型的层数，其中t₁表示卫星的初始状态层；

t_|TS|+2和t_|TS|+3分别是虚拟层I和虚拟层II，其中在t_|TS|+2层中所有卫星仅与虚拟星可见，在t_|TS|+3层中仅虚拟星和终点可见；n′_ij表示时变网络多商品流模型上第j层的第i个卫星节点，n′_i′j′表示时变网络多商品流模型上第j′层的第i′个卫星节点；R表示卫星从产生数据到传输至境内星所需的最大建链跳数；

C＝{c₁，…，c_l，…，c_|C|}是时变网络多商品流模型中商品集合，|C|＝(|S|-|sd|)*(|TS|)，表示商品的总数量；

c_l，l＝(m+(|S|-|sd|)(n-1))，表示第(m+(|S|-|sd|)(n-1))个商品，所述商品为境外卫星上产生的数据；商品序号从时变网络多商品流模型的第一层开始进行编号，其中m＝1，...，|S|-|sd|，n＝1，...，(|TS|+1)，

n′_k(|TS|₊₁₎表示第|TS|+1层上的第k个卫星节点；

n′_{(|S|+2)(|TS|+2)}表述第|TS|+2层上的第|S|+2个卫星节点；

约束条件1：

约束条件1表示每个境外星节点仅能建链一次；

<n′_ij，n′_i′j′>代表第j层的第i个卫星节点与第j′层的第i′个卫星节点相连的边；

约束条件2：

i，i′＝1，...，|S|+2；j，j′＝1，...，|TS|+2，C_lεC (3)

约束条件2表示两个节点所建立的链路是双向的，

约束条件3：

约束条件3表示境内星节点到地面站终点的链路是固定的，同时虚拟层的虚拟节点到终点的链路也是固定的；

约束条件4：

约束条件4表示卫星从产生数据到传输至境内星所需建链的跳数小于等于最大建链跳数；

本发明将卫星与卫星之间的数据传输时间视为定值，即每个时隙间卫星建链进行数据传输所产生的时延为定值；因此，数据传输时延可由卫星从产生数据到传输至境内星所需建链的跳数表示，即约束条件4不等式左边所示内容。

约束条件5：

i，i′＝1，...，|S|+2，j，j′＝1，...，(|TS|+2)，c_l∈C，l＝1，...，|C| (6)

约束条件5表示节点之间可见才能建链，同时建链才能数据传输；

V＝[v<n′₁₁，n′₁₁>，…，v<n′_{(|S|+2)(|TS|+3)}，n′_{(|S|+2)(|TS|+3)}>]为星间可见性矩阵，v<n′_ij，n′_ij′>表示卫星节点n′_ij和n′_i′j′是否可见，若可见则v<n′_ij，n′_i′j′>等于1，否则为0；

约束条件6：

i＝(|sd|+1)，...，|S|，j＝1，...，(|TS|+1) (7)

约束条件6是网络中的流守恒约束，表示的是仅有境外星节点能产生数据，并被视为起始节点；其中n′(_|s|+2)j′表示第j′层的第|s|+2节点，也就是第j′层上的虚拟星节点；

约束条件7：

i＝1，...，(|S|+2)，j＝(n+1)，...，(|TS|+2) (8)

约束条件7是网络中的流守恒约束，表示的是除产生数据的节点和地面站节点外，其他节点均为中间节点；

约束条件8：

c_l∈C，j＝2，...，(|TS|+2) (9)

约束条件8是网络中的流守恒约束，表示的是所有地面站终端只能接受数据，并被视为终端节点。

本实施例中，对所述时变网络多商品流模型进行求解的方法是数据驱动的并行自适应大邻域搜索方法。具体为：

步骤4.1：输入卫星集合S，时隙集合TS，星间可见性集合V；

步骤4.2：使用数据驱动算法生成初始解，并计算该初始解下的目标函数值；

如图4所示，本实施例中使用数据驱动算法生成初始解的方法是：

步骤4.2.1：随机生成初始解；

步骤4.2.2：遍历一个超帧内的所有时隙；

步骤4.2.3：依次遍历每一个时隙内的所有卫星；

步骤4.2.4：遍历每颗卫星的可连接星集合预测该卫星的星间链路连接概率；

本实施例中，星间链路连接概率的预测方法是使用训练好的概率预测模型进行预测。所述概率预测模型使用极端梯度提升算法EXtreme Gradient Boosting(XGBoost)进行训练，训练集为采用随机初始解生成策略生成初始解，将该初始解输入到并行自适应大邻域搜索方法进行搜索得到的解集。训练集在进行训练时，提取的解的特征如表1所示：

表1概率预测模型的特征

步骤4.2.5：将连接概率最高的卫星作为该卫星的连接星，进行链路连接并更新初始解；

步骤4.2.6：在完成一个超帧内所有时隙的遍历后，得到由数据驱动算法产生的初始解并输出。

本实施例中，由于大规模低轨道通信卫星星座星间链路调度问题LLCSC-ISLSP是一个解空间巨大的问题，所以不仅要求数据驱动的并行自适应大邻域搜索算法(data-driven parallel adaptive large neighborhood search)DP-ALNS算法具有很好的自适应性，也需要将其初始解的质量尽可能的提高。对于LCSC-ISLSP问题，初始解就是一个超帧内的星间链路调度方案。一般来说初始解的生成方法是随机生成或者贪婪策略生成，但这种方式就提升算法的性能而言，很难产生效果。数据驱动方法可以非常有效地提高初始解的质量，但很难在端到端的解决方案中使用。本发明根据LLCSC-ISLSP问题中的可见性约束和星间链路连接特点，将每颗卫星的可连接星集合进行缩减，然后在初始解生成过程中使用数据驱动方法。本发明LLCSC-ISLSP利用数据驱动方法预测卫星与其可见卫星建立连接的概率。但需要明确的是，概率预测模型不可以被直接使用在生成星间链路调度方案，主要有两个原因：①训练集是通过缺少数据驱动的并行自适应大邻域搜索方法DP-ALNS方法计算得到的，之后被使用训练预测模型。那么使用该预测模型得到的方案必然不会好于DP-ALNS算法的计算结果；②当一颗卫星在连接不同的卫星时，可能会出现两种链接方案的目标函数值相同的。这种情况会导致收集到的数据集不准确，并间接导致预测模型不准确。通过以上分析，将数据驱动方法应用于初始解的生成，提升初始解的质量，使得算法能够在更短时间内收敛，提高求解效率。

步骤4.3：将所述初始解输入给并行自适应大邻域搜索方法进行求解，得到最优解并输出。

本实施例中，如图5所示，步骤4.3中的并行自适应大邻域搜索方法是指：

步骤4.3.1：将规则自适应层中的每个规则与自适应大邻域搜索算法ALNS(adaptivelarge neighborhood search)结合，得到与自适应层中规则数量相同的具有不同规则的改进的自适应大邻域搜索算法I-ALNS(the improved ALNS)算法，使用这些具有不同规则的I-ALNS算法对所述初始解进行并行搜索，每个I-ALNS算法在经过T轮迭代后输出一个历史最优解和历史最优解集。

本实施例中，规则自适应层可以在算法迭代超过T次时被激活。规则自适应层由8个元启发式规则组成，对解决大规模问题有较好的效果，8个元启发式规则如下：

规则1：Hill Climbing(HC).这是最简单的元启发式规则，也是所有元启发式规则的基础。其主要原理是不断接受非劣解，来提高解的质量。

规则2：Tabu Search(TS).TS算法最主要的特点是使用禁忌表记录优化过程中的局部最优解或产生局部最优解的操作，达到跳出局部最优、寻找优质解空间的效果。对于大规模低轨道通信卫星星座星间链路调度问题LLCSC-ISLSP，我们使用禁忌表记录邻域操作过程。首先定义一个建链三元组{timeslot，satellite，satellite_connect}和一个断链三元组{timeslot，satellite，satellite-disconnect}，之后每次进行邻域操作时，邻域变化会导致多个卫星重新连接，同时也会导致多个卫星断开连接。所以一个邻域操作会被多个三元组记录，并生成一个禁忌动作集合。邻域解是否是禁忌解的条件是邻域行为是否存在于禁忌列表的2/3以上。

规则3：SimulatedAnnealing(SA).SA算法是效仿固定退火过程。在进行模拟退火降温时，算法会概率性地接收劣解，达到跳出局部最优的效果。而影响SA算法的最主要的因素是初始退火温度t₀和退火函数。初始退火温度主要通过实验设定，退火函数采用的是对数退火函数(10)。

规则4：Late Acceptance Hill Climbing(LAHC).LAHC算法的关键步骤是可接受一段时间(步)以前的解，作为跳出局部最优的手段。该算法既具备HC的收敛渐进性，又具有跳出局部最优的智能性。

规则5：Iterated Local Search(ISL).ISL通过定期地对当前解实施扰动，打乱当前解存在的隐藏结构，来达到跳出局部最优的目的。LLCSC-ISLSP是一个规模大，容易陷入局部最优的问题。而ISL能够实现较大程度的扰动，非常适合求解LLCSC-ISLSP。

除了以上五种现存的应用非常广泛的元启发式规则，本发明还是用SA-TS，LAHC-TS，ISL-TS规则。上述八种规则被使用在自适应规则进化层，并通过并行搜索方式，实现算法之间的“竞争”，从而达到“优胜劣汰”的效果。规则自适应层使用所有规则，通过并行搜索实现规则之间的竞争与合作。

本实施例中，多个不同规则的I-ALNS算法对初始解进行并行搜索，其中每一个规则的I-ALNS算法对所述初始解进行搜索的方法是：

骤4.3.1.1：输入初始解及该初始解的目标函数值，设当前解为S_C、最优解为S_B和历史最优解集，并将初始解赋值给S_C和S_B，初始化各算子的初始权重为1、初始分数为0。

本实施例中，启发式算子能够帮助算法从当前解的邻域中搜索到新的优质解。根据LLCSC-ISLSP的问题特征，在ALNS算法内部共设计了8种启发式算子，其中6种大邻域算子，2种小邻域算子。由于该问题的约束复杂，大邻域算子在被使用时，会出现部分邻域解无法被搜索到。所以引入了小邻域算子。小邻域算子的目的就是弥补大邻域算子搜索能力不足的缺点。

大邻域算子用于删除一些卫星链接，并在解决方案中插入一些卫星链接。每个算子从当前解决方案S_c中选择m个卫星链路，删除它们并记录这些未连接的卫星节点。然后，当满足约束时，这些未连接的卫星节点将重新连接。本发明定义了六种不同的大邻域启发式算法。

1)时隙间的卫星交换算子：这个算子会随机的选择两个时隙并且随机的选择一个卫星节点，之后交换这两个时隙内该卫星节点的连接方案。值得注意的是，为了满足问题中卫星单一建链和双向建链约束，在进行交换过程中算子不仅要考虑选定卫星节点的连接同时也要考虑选定卫星节点的连接星节点以及后续更多的卫星节点。所以在算子在执行邻域搜索时，多个卫星节点的连接方案会被改变。但是过大的邻域会导致算子失效，我们设定一个阈值δ＝4，来限制每次操作调整卫星连接方案数量。

2)时隙内的卫星交换算子：类似上一个算子，这个算子会随机选择一个时隙内的两个卫星节点，交换其连接方案。同时也需要δ来限制每次操作调整卫星连接方案数量。

3)时隙交换算子：不同时隙的卫星连接方案基本不同，因此交换两个时隙有利于破坏解的结构，避免陷入局部最优。

4)时隙复制算子：与时隙交换算子类似，随机的将一个时隙的星间链路连接方案复制给另一个时隙。

5)最大时延卫星选择算子：首先根据(11)计算得到最大时延的时隙，之后在最大时延的时隙中找到时延最大的卫星连接方案。最后从该卫星的连接星集合中随机选择一颗卫星重新进行连接。

6)基于时延和负载的卫星选择算子：每颗卫星节点的时延是指卫星节点上的数据从当前时隙传输到境内星或者末时隙的时间延迟。每颗卫星节点的负载是指截至到当前卫星所处时隙时，该卫星节点上存在的数据量。如图6所示，在当前时隙内卫星④的负载为5(卫星在每个时隙都会产生数据)，时延为1。在这个算子中，首先随机选择一个时隙中的ρ颗星，计算ρ颗星的负载和时延。之后将ρ颗星按照负载降序排列、按照时延升序排列，分别得到集合S_load和S_delay.最后按照高负载低时延的选择原则，依次将卫星之间建链。这个算子的主要思想是将负载高的卫星节点上的数据先下传到境内星。

大邻域算子在进行邻域搜索时，会受到单一建链和双向建链约束的影响。结果就是部分邻域空间内的解无法被搜索到，因此设计了两种小邻域算子。

1)未连接星-未连接星交换算子：在使用大邻域算子进行邻域变换后，会产生一部分未连接卫星节点或者成为自己内部连接卫星节点。针对此设计了该算子去改善这个问题。这个算子会随机选择一个时隙，计算得到这个时隙内未连接卫星节点集合S_disconnect。在满足约束情况下随机从S_disconnect中选取两个卫星节点，进行建链。

2)未连接星-连接星交换算子：除了未连接星-未连接星交换算子，未连接卫星节点集合S_disconnect也可以与已有连接方案的卫星节点进行建链

本实施例中，采用逆向变邻域的方法来解决大小邻域的切换问题。常规的变邻域方法是优先选用小邻域进行搜索，大邻域的作用是帮助小邻域跳出局部最优。而本实施例中我们优先选用大邻域进行搜索，小邻域的作用是弥补大邻域搜索缺点。具体操作为当大邻域持续搜索T_l代解的质量依然没有提升时，算法会自适应的切换邻域。此外，在迭代过程中，引用文献“Ropke S，Pisinger D.An adaptive large neighborhood searchheuristic for the pickup and delivery problem with time windows[J].Transportation science，2006，40(4)：455-472”中的方法对算子的分数和选择概率的进行更新。

步骤4.3.1.2：根据算子的选择概率选择一个算子进行邻域搜索生成新的解。

步骤4.3.1.3：将新的解赋值给当前解案S_C，若新的解优于最优解S_B，则用新的解更新最优解S_B，根据当前算法的规则确定是否接受新的解，如果接受新的解则将新的解添加进历史最优解集；更新被选择算子的分数，若连续进行了T_s次代，则更新各算子的权重及选择概率，并初始化各算子的分数；

其中算子的分数更新方法为：

如果新的解优于最优解S_B；

如果新的解劣于最优解S_B但被接受；

如果新的解劣于最优解S_B且未被接受；

其中，i表示迭代的次数，表示第i次迭代时算子j的分数，σ₁，σ₂，σ₃为常数，代表不同的分数增量；

算子的权重更新方法为：

其中，w^j表示本轮迭代中第j个算子更新后的权重，w^j′表示上一轮迭代中第j个算子更新后的权重，π^j表示第j个算子的分数，θ为权重更新过程中上一轮迭代所得的算子权重所占的比重；

选择概率的更新方法为：

/>

P_j表示第j个算子的选择概率，n表示算子的数量。

步骤4.3.1.4：若达到终止条件，则输出历史最优解集和最优解S_B，S_B为历史最优解，否则转至步骤4.3.2，若连续T_l次迭代中最优解S_B不变，则进行大小邻域算子的切换选择算子。

步骤4.3.2：将每个I-ALNS算法产生的历史最优解集合并成一个历史最优解合集并计算历史最优解合集中每个解的目标函数值。

本实施例中，目标函数值的计算方法是：采用动态规划方法进行计算，从末时隙向首时隙使用目标函数也就是公式1来计算数据传输的跳数。动态规划方法为文献“RichardBellman..Dynamic programming[M].1957”中给出的方法。

步骤4.3.3：根据目标函数值降序原则，对所述历史最优解合集进行排序，并选择前n_s个解构成当前最优解集。

当前最优解集是具有不同规则的I-ALNS算法“并行”计算结果的集中体现。在并行搜索中，不同规则的算法在不同的线程上执行。算法在执行T次迭代后，各个线程均会输出一个历史最优解集。我们将这些历史最优解集合并成一个历史最优解合集。

首先，定义线程数n_t、规则数n_r、不同规则的算法历史最优解集为在本发明中n_t＝n_r＝8，所以当前最优解集C_S被计算在(13)-(15)，其中/>为解/>的目标函数值。

其中，U_S表示历史最优解集合集，|U_S|为历史最优解集合集的数量，表示各规则下的算法得到的历史最优解集，S_i表示最优解合集中的第i个解，i₁、i₂为最优解合集中的任意两个解的序号；当前最优解集C_S是指将历史最优解集合集按照目标函数值进行降序排列，取前n_s个最优解形成的。

步骤4.3.4：对所述当前最优解集，计算规则自适应层中每个规则的贡献度，所述贡献度是指当前最优解集中来自各个I-ALNS算法的解所占的比例。

规则贡献度的计算：在获取当前最优解集C_S后，使用(16)计算各个规则的贡献度。其中，表示第i个规则为当前最优解集C_S贡献的解的个数，|C_S|为当前最优解集中解的个数，n_r为规则的数量。

步骤4.3.5：根据每个规则当前T轮迭代的贡献度与上一个T轮迭代的贡献度，计算规则得分。每个规则会被给与一个得分。这个分数取决于这个规则在过去T代内的性能，而这个性能具体表现在这个规则对应的算法产出的最优历史解集合。这个得分也将决定算法的“竞争力”。在并行搜索中，不同规则的算法在不同的线程上执行。

计算规则得分的方法是：

其中，sc^t表示第i个规则的得分，表示第i个规则上一次迭代的得分，λ为权重，在第一个T代，/>为0，/>表示第i个规则的贡献度的计算；

步骤4.3.6：根据每个规则的规则得分进行规则淘汰与协同，使规则自适应层中的规则自适应。

本实施例中，需要根据每个规则的规则得分对规则进行进化，也就是对规则进行淘汰和协同。淘汰是指将各个规则的得分进行归一化处理之后，连续两次迭代得分最低的规则将会被淘汰。协同是指在当前最优解集中，选择目标函数值最高的两个解，交换部分信息片段，并将交换后的解替换历史最优解集中的解。交换部分信息片段是指：即随机选择n_a个时间片上的卫星节点，交换两个解对应卫星节点的数传路径。需要注意的是，为了满足卫星建链约束，在交换两个最优解的部分信息片段后，避免不了会触发违反约束，交换后将违反约束的部分进行微调，目的是尽量少的改变原有方案。协同有利于破坏解序列上算子产生的隐藏结构。规则进化过程的作用是淘汰掉表现差的规则，避免浪费计算资源，同时交换优质规则的部分解接序列，降低陷入局部最优的风险。

步骤4.3.7：转步骤4.3.1，分别使用规则自适应层中剩余的规则所对应的I-ALNS算法对上一轮T轮迭代所产生的历史最优解作为初始解进行并行搜索，直至达到规则自适应层所要求的迭代次数，或者达到自适应大邻域搜索算法ALNS收敛条件时，将当前最优解集中目标函数值最高的解作为最优解输出。本实施例中，使用规则自适应层中剩余的规则所对应的I-ALNS算法对上一轮T轮迭代所产生的历史最优解进行并行搜索是指，将上一轮T轮迭代所产生的历史最优解即上一轮T轮迭代产生的最优解S_B，作为初始解输入给I-ALNS算法，如果该历史最优解因为协同进行了部分信息片段交换，那么历史最优解为交换了部分信息后的解。

通过求解时变网络多商品流模型，可以确定每个商品的路径，也就是每个卫星所产生数据在星间链路之间传播的路径，因此时变网络多商品流模型的优化目标就是找到一个可行解，使所有商品的平均时延最小。

计算解的目标函数值时，采用动态规划方法代替递归方法来进行计算。具体来说，每两颗卫星连接后都存在两种数据传输方案，比如a与b星相连，那么数据可能从a传输到b，也可能从b传输到a。需要选择最小时延的传输路径来保证总时延最低。而如果是使用递归方法从首时隙进行计算，那么在计算每一个卫星节点时不仅需要判断当前节点的传输方向，还需要判断和当前节点有关的后续节点的数据传输方向，计算量巨大。我们使用动态规划方法进行计算，从末时隙开始计算到首时隙，极大的降低了计算解的目标函数值过程需要的时间。如图7是一个3时隙5卫星节点计算过程，如果使用递归方法计算1-4卫星节点的最短时延，则需要计算8条路径，而我们使用动态规划方法计算1-4卫星节点的最短时延仅需要计算1条路径。

本发明还提出了一种基于数据驱动的星间链路调度系统，包括以下模块：

输入模块：用于获取参与调度的任务集与卫星集；

实验验证：

为了验证本发明数据驱动的并行自适应大邻域搜索算法DP-ALNS的有效性，本文进行了20次实验，

算法用Java 1.8.0编写，数据训练用Python 3.7中的XGBOOST实现。实验对象是STARLINK星座。实验使用Intel(R)Core(TM)i9-9900处理器进行，处理器频率为3.10Ghz，运行在Windows 7系统中，内存为16gb。下面主要说明场景的配置。

由于不同的星座采用不同的工作模式、设计方法和传输技术，不同国家的星座在建设、管理和应用方面存在显著差异。与此同时，几乎没有研究人员在研究LLCSC-ISLSP。因此，使用一个通用的基准来测试星间链路ISL调度算法是不合理的。对于这个问题，没有比较数据和竞争启发式存在。分析问题特点，构建了大规模低轨道通信卫星星座星间链路调度问题LLCSC-ISLSP标准测试集。此外，每个通讯星座的数据下传时延取决于境内星的数量，而境内星的数量是取决于地面站的数量。所以我们根据地面站的分布设定了两个大场景：中国区域分布和世界分布。同时分别在大场景下设定了两个地面站数量不同的小场景。具体的地面分布位置见表2.为了验证算法的鲁棒性和比较不同规模星群的差异性，我们在每个小场景中设置了以100颗卫星为间隔的从100到900的星群。每个星群的属性包括境外星数量、境内星数量、地面站数量和星间可见性矩阵，如表3所示。

表2：地面站位置分布

表3：不同规模的星座信息

DP-ALNS中某些参数的取值固定如下：

算法终止代数：T_max＝200000；

规则进化代数：T＝5000；

算子分数增量：σ₁＝0.1，σ₂＝0.05，σ₃＝0.001；

禁忌规则中的禁忌表长度：L_tabu＝1000；

逾期规则中的逾期表长度：L_o＝100；

模拟退火规则中的初始温度：t₀＝100；

局部迭代规则中的扰动条件：T_d＝1000。

1)与其他算法的比较

Du等人利用数据驱动的启发式辅助记忆算法(data-driven heuristic assistedmemetic algorithm，DHMA)成功地解决了导航卫星系统星间链路调度问题，并提出了常规调度方法和快速调度方法。DHMA方法的实验结果好于现有研究导航卫星系统的相关算法，因此DHMA是我们主要的竞争对象。Liu等人将ALNS方法应用在大规模的组合优化问题中，也取得了很好的求解效果。启发式方法HR的表现结果一般。所以在求解LLCSC-ISLSP时，ALNS也是一个有力的竞争对象。此外，本实验还采用了保证每个“境外星”连接“境内星”数量在所有时隙中平衡的启发式规则作为比较方法。最后，随机生成初始解的P-ALNS方法(theparallel large neighborhood search method，RP-ALNS)也被使用在其中.计算实验得到的目标函数值，即该问题中的平均时延，如表4和表5所示。

表4：中国区域

表5：世界区域

表4-5分别比较了中国地区分布和全球分布的各种算法。对于每个区域，生成10个实验场景。计算每个场景中的平均CPU时间和平均时间延迟(每个结果是十次实验的平均值)。时间延迟是指卫星在时间片中将其数据传输给“境内星”的时间。因此平均时间延迟是指所有境外星将其上存储的数据传输到境内星的时间与所有数据被传输的次数的比值。理想情况下一颗境外星仅需要一个时延即可将数据传输到境内星。

比较平均时延指标能够发现，图8(a)中国区域10个场景的实验结果普遍劣于图8(b)世界区域的实验结果，这种情况主要是由于在世界范围内，无论什么时刻与地面站可连接的卫星(境内星)数量是更多的，保证了境外星可以用更短的时延将数据传回境内星。对比这些调度算法得出，应用在导航卫星系统中的最好的DHMA算法竟然是表现最糟糕的。造成这种情况的原因主要有两点，一个是导航卫星系统规模小，算法不适用于大规模星群的应用。另一个是DHMA算法解码机制是在两颗卫星处于连接状态时以时间顺序原则将数据传输至下一颗星。而DP-ALNS算法的解码机制时在两颗卫星处于连接状态时以就近原则将数据保存在本星或传输至连接星，最大限度的缩短数据传输需要的时间成本。另外，HR的表现结果也一般。从表4中更显然的看出，ALNS，RP-ALNS和DP-ALNS算法均有较好的效果的原因在于，它们的算子设计和解码方式等均是我们自己提出的，进一步证明了本文研究的价值。其中，RP-ALNS和DP-ALNS算法的表现是十分接近的且最优的，两者主要的不同是初始解的生成方法。这也导致了其计算时间的差别。

在比较不同算法的求解时间发现，DHMA算法依然是最差的，主要在于其构造邻域解的方法是随机构造，不存在冲突检查阶段，这就导致了大量时间耗费在构造可行解上。这也是其不适用求解大规模场景的主要原因。HR只需要通过策略构造解，而不存在求解过程，这就使得其时间消耗很低，所以这种方法是适用应急情况。虽然RP-ALNS和DP-ALNS具有相似的求解效果，但它们的求解时间不同。由于采用数据驱动的方法，DP-ALNS解决问题的时间消耗较低。

可知，DP-ALNS无论是对中国区域的实验场景还是世界区域的实验场景均有最优的求解效果和最低的时间消耗。另外在实验过程中发现，本发明DP-ALNS算法的优化结果是十分稳定的。

作为DP-ALNS算法的组成部分，概率预测模型、规则进化层和算子适应层将进一步进行实验分析和测试。

(a)概率预测模型的效果：

除了为求解初始解生成而设计的概率预测模型外，还测试了均衡连接策略、自连接策略和随机连接策略进行比较。

①均衡连接策略：尽可能保证每颗卫星连接的境内星数量平衡，同时使用负载优先策略使得负载过大的卫星优先连接境内星。

②自连接策略：初始状态下每颗卫星将不会连接其他卫星，仅与自己连接。这种方式排除了初始解结构对问题求解的影响。

③随机连接策略：每颗卫星的连接卫星从卫星的可见卫星集中随机选取，按均匀概率分布。

这次测试是基于中国900颗卫星的实验场景。实验结果如图9(a)所示，900个卫星实验中，自连接策略产生的初始解目标函数值约为13.5。虽然这个初始解并不影响算法的求解效果，但在求解过程中耗时非常大。另外，平衡连接策略在50000次迭代之前有一个主要的优势，因为它的初始解决方案大大提高了解决方案的质量。但其缺点是解的结构过于固定，导致算法在接下来的迭代中求解效果较差。概率预测模型的初始解生成方法是最优的，保证了算法在10万次左右的收敛性，大大降低了时间成本。值得一提的是，随机生成方法也能产生良好的结果，因为当“境外星”与“境内星”数量之比接近6.5∶1时，调度结果3.1已经接近最优调度。这一结果表明，并不是随机生成策略有良好的效果，而是概率预测模型没有充分发挥其作用。因此，增加了“境外星”与“境内星”之比为8∶1的实验，结果如图9(b)所示，表明概率预测模型具有明显优势。最后，得出结论，概率预测模型不仅可以显著提高解决方案的质量，而且对解结构的隐性收益有很大帮助。

(b)规则自适应层的测试：

本发明中的规则自适应层也是本文DP-ALNS算法的一个主要创新。它的函数不仅可以输出更好的最优解，而且在算法初始解变化的情况下，保证算法具有稳定的优化效果。因此，本实验表明规律演化过程是必不可少的.

同样，本发明使用的实验场景为中国区域900颗星的场景，为了能体现算法的优势，我们依然将境内星数量与境外星数量设置为1∶8，如图10(a)。图中的实线代表算法规则正在运行，虚线代表此条规则对应的算法已经被淘汰。我们能够看出在这个问题上各个规则的运行效果基本不同，效果差的规则对应的算法被淘汰，而规则适应度高的个体会相互协作，最终找到最优解。但从各个规则的算法运行效果来看，算法的稳定性是被质疑的。所以我们针对这个问题，进行了算法稳定性测试，如图10(b)是一组实验数据测试十次的效果图，其中算法的优化趋势基本一致，在图10(b)的放大图中可看到优化结果可以保证在±0.02个单位以内。图10(c)是分别设定λ＝0.1，λ＝0.5，λ＝0.9，不同的λ值代表前一个T代优化结果对本次各算法得分的影响，结果λ的取值基本不会对算法结果产生影响，所以我们取λ＝0.5。综上证实了DP-ALNS算法的稳定性是良好的。

(c)：自适应层算子的设计：

算法中设计了许多函数运算符，在求解过程中需要识别这些运算符的作用。

图11和图12是确定算子分数更新算子代数和大小邻域算子切换代数，同时分别展现了在较优代数时，算子的使用次数。图11是分别取T_s＝100,500,1000时，算法的运行效果。比较后我们取T_s＝500。表6是T_s＝500时，不同规则的算法中各个算子的选择概率，其中包括6种大邻域算子和2种小邻域算子。结果发现，大邻域算子中的知识型算子的使用次数远远大于随机型算子，所以可以说明知识型算子在算法优化过程中起到十分关键的作用，但是不能够说明其他算子没有作用，比如在模拟退火SA-TS和禁忌搜索ILS中算子5也起到了十分重要的作用。小邻域算子中的算子2是更有效果的，因为在算法迭代后期，每个解结构中很少存在自身连接的卫星节点。所以这种情况也是十分合理的。另外，比较明显的延迟接受爬山(Late Acceptance Hill Climbing)LAHC规则算法各个算子使用比较平均，不是因为各算子的作用效果类似，是因为对于本发明的问题，LAHC规则算法起不到很好的作用，其结果不存在代表性。类似的方式，我们在图12确定了大小邻域算子的切换代数T_l＝100。表7是在各参数确定的情况下，不同规则算法的算子选择概率。值得一提的是，通过上述实验，我们发现知识型算子的效果是远远好于随机型算子的，所以在接下来的研究中可以继续构建符合问题特点的知识型算子或者使用数据驱动的方式继续构建算子，这可能会进一步提高算法效果。

表6为当T_s＝500，不同规则的算法中各算子的选择概率

表7为T_l＝500，不同规则的算法中各算子选择概率对比

大规模低轨卫星星座星间链路调度问题是卫星管控部门急需解决的问题。若该问题能够被很好的求解，那它将产生巨大的军用、商用和民用价值。现有的数据驱动预测方法、元启发式方法和并行调度等已经被用于解决小规模组合优化问题，但几乎没有算法被提出解决类似于LLCSC-ISLSP特性的组合优化问题。

以ALNS框架为基础，本文提出的DP-ALNS算法是由概率预测模型、规则进化机制、并行调度方法以及ALNS框架中的大邻域搜索策略组成。首先，概率预测模型被使用计算卫星与卫星之间连接的可行性。并与LLCSC-ISLSP问题中的可见性约束和星间链路连接特点结合得到初始解生成方法。根据初始解生成方法得到初始解集合，同时每个初始解被分配一个规则。之后大邻域搜索策略与规则组合形成具有不同规则的ALNS方法。最后以并行调度的方法，各个初始解在不同规则的ALNS方法下分别被优化，并且每经过一定代数，算法根据规则进化机制评估不同规则的作用，来提高整体性能。与其他方法相比，这个被提出的方法有更好的优化性能和质量。

所提出方法的高效性能可以归因于两个新思想。第一是基于概率准则来进行初始解构建，这个方法在并行调度之前对卫星与卫星的连接概率进行计算，计算结果作为初始解生成的重要依据，有助于降低问题规模，提高算法时效性。另一个是自适应机制，在这个算法中，不仅存在算子的自适应机制，还具有规则的自适应机制。传统ALNS使用的是模拟退火规则对解评估。由于规则使用单一，传统ALNS很难适用于所有问题。所以我们同时使用多种规则，规则之间存在协同和竞争，以达到算法与问题之间的更高效的匹配，提高算法的优化效果。

本文针对大规模低轨通信卫星星座卫星间链路调度问题(LLCSC-ISLSP)，提出了一种时间离散网络多商品流(TDN-MCF)模型和一种数据驱动的并行自适应大邻域搜索(DP-ALNS)算法。在低轨通信卫星星座背景下的星间链路调度领域，这个研究是一个基础且十分重要的工作。以900颗卫星星座为研究对象中，我们在没有影响通信质量的情况下将其通信时延降低了40％左右。

本文的主要工作是提出TDN-MCF模型和DP-ALNS算法。这个模型将一个卫星空间位置连续变化的星间链路调度问题转化为一个具有时变特性的多商品流问题。这个算法提出了概率预测的构建解和多层自适应的思想，很好的解决了算法的时效性和优化效果。此外，这个模型可以被使用在多种类型的星间链路调度问题中，并且算法更能够被使用在其他类型的大规模组合优化问题中。

最后应说明的是：以上各实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述各实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims

1.一种基于数据驱动的星间链路调度方法，其特征在于，包括以下步骤：

步骤1：获取参与调度的任务集与卫星集；

步骤4：对所述时变网络多商品流模型进行求解得到星间链路调度方案并输出；

所述时变网络多商品流模型为：

目标函数：

目标函数表示使所有商品的总延迟最小化；S＝{s₁，…，s_|S|}是时变网络内的卫星集合，|S|表示时变网络内卫星集合中卫星的数量；i、i′表示第i、i′个卫星s_i、s_i′；

sf＝{s_|sd|+1，…，s_|S|}是卫星集合中的境外星集合；

TS＝{ts₁，…，ts_|TS|}是一个超帧中时变网络内的时隙集合，|TS|表示时隙数量，共有|TS|+1个时间片；

n′_k(|TS|+1)表示第|TS|+1层上的第k个卫星节点；

n′_{(|S|+2)(|TS|+2)}表述第|TS|+2层上的第|S|+2个卫星节点；

约束条件1：

约束条件1表示每个境外星节点仅能建链一次；

约束条件2：

i，i′＝1，…，|S|+2；j，j′＝1，…，|TS|+2，c_l∈C

约束条件2表示两个节点所建立的链路是双向的，

约束条件3：

约束条件4：

约束条件4表示第一层网络首时隙中境外星节点的数据传输时延≤R；

约束条件4表示卫星从产生数据到传输至境内星所需建链的次数小于最大建链次数；

本发明将卫星与卫星之间的数据传输时间视为定值，即每个时隙间卫星建链进行数据传输所产生的时延为定值；因此，数据传输时延可由卫星从产生数据到传输至境内星所需建链的次数表示，即约束条件4不等式左边所示内容；

约束条件5：

i，i′＝1，…，|S|+2，j，j′＝1，…，(|TS|+2)，c_l∈C，l＝1，…，|C|

V＝[v<n′₁₁，n′₁₁>，…，v<n′_{(|S|+2)(|TS|+3)}，n′_{(|S|+2)(|TS|+3)}>]为星间可见性矩阵，v<n′_ij，n′_i′j′>表示卫星节点n′_ij和n′_i′j′是否可见，若可见则v<n′_ij，n′_i′j′>等于l，否则为0；

约束条件6：

约束条件6是网络中的流守恒约束，表示的是仅有境外星节点能产生数据，并被视为起始节点；其中n′_(|s|+2)j′表示第j′层的第|s|+2节点，也就是第j′层上的虚拟星节点；

约束条件7：

约束条件8：

2.根据权利要求1所述的星间链路调度方法，其特征在于，步骤4中对所述时变网络多商品流模型进行求解的方法是数据驱动的并行自适应大邻域搜索方法；

数据驱动的并行自适应大邻域搜索方法是：

步骤4.1：输入卫星集合S，时隙集合TS，星间可见性集合V；

3.根据权利要求2所述的星间链路调度方法，其特征在于，所述并行自适应大邻域搜索方法是指：

步骤4.3.1：将规则自适应层中的每个规则与自适应大邻域搜索算法ALNS结合，得到与规则自适应层中规则数量相同的具有不同规则的改进的自适应大邻域搜索算法I-ALNS算法，使用这些具有不同规则的I-ALNS算法对所述初始解进行并行搜索，每个I-ALNS算法在经过T轮迭代后输出一个历史最优解和历史最优解集；

步骤4.3.2：将所有规则的I-ALNS算法产生的历史最优解集合并成一个历史最优解合集并计算历史最优解合集中每个解的目标函数值；

步骤4.3.3：根据目标函数值降序原则，对所述历史最优解合集进行排序，并选择前ns个解构成当前最优解集；

步骤4.3.4：对所述当前最优解集，计算规则自适应层中每个规则的贡献度，所述贡献度是指当前最优解集中来自各个I-ALNS算法的解所占的比例；

步骤4.3.5：根据每个规则当前T轮迭代的贡献度与上一个T轮迭代的贡献度，计算每个规则的规则得分；

步骤4.3.6：根据每个规则的规则得分进行规则淘汰与协同，使规则自适应层中的规则自适应；

步骤4.3.7：转步骤4.3.1，分别使用规则自适应层中剩余的规则所对应的I-ALNS算法对上一轮T轮迭代所产生的历史最优解作为初始解进行并行搜索，直至达到规则自适应层所要求的迭代次数，或者达到自适应大邻域搜索算法ALNS收敛条件时，将当前最优解集中目标函数值最高的解作为最优解输出。

4.根据权利要求3所述的星间链路调度方法，其特征在于，步骤4.2中使用数据驱动算法生成初始解的方法是：

步骤4.2.1：随机生成初始解；

步骤4.2.2：遍历一个超帧内的所有时隙；

步骤4.2.3：依次遍历每一个时隙内的所有卫星；

5.根据权利要求4所述的星间链路调度方法，其特征在于，步骤4.2.4中星间链路连接概率的预测方法是使用训练好的概率预测模型进行预测。

6.根据权利要求5所述的星间链路调度方法，其特征在于，所述概率预测模型使用极端梯度提升算法进行训练，训练集为采用随机初始解生成策略生成初始解，将该初始解输入到权利要求4中的并行自适应大邻域搜索方法进行搜索得到的解集。

7.根据权利要求3所述的星间链路调度方法，其特征在于，步骤4.3.1中多个不同规则的I-ALNS算法对初始解进行并行搜索，其中每一个规则的I-ALNS算法对所述初始解进行搜索的方法是：

步骤4.3.1.1：输入初始解及该初始解的目标函数值，设当前解为S_C、最优解为S_B和历史最优解集，并将初始解赋值给S_C和S_B，初始化各算子的初始权重为1、初始分数为0；

步骤4.3.1.2：根据算子的选择概率选择一个算子进行邻域搜索生成新的解；

其中算子的分数更新方法为：

如果新的解优于最优解SB；

如果新的解劣于最优解SB但被接受；

如果新的解劣于最优解SB且未被接受；

算子的权重更新方法为：

选择概率的更新方法为：

P_j表示第j个算子的选择概率，n表示算子的数量；

步骤4.3.1.4：若达到终止条件，则输出历史最优解集和最优解S_B，S_B作为历史最优解输出，否则转至步骤4.3.2，若连续T_l次迭代中最优解S_B不变，则进行大小邻域算子的切换选择算子。

8.根据权利要求3所述的星间链路调度方法，其特征在于，步骤4.3.5中计算规则得分的方法是：

其中，scⁱ表示第i个规则的得分，表示第i个规则上一次迭代的得分，λ为权重，在第一个T代，/>为0，/>表示第i个规则的贡献度的计算；

在获取当前最优解集C_S后，使用上式计算各个规则的贡献度，其中，表示第i个规则在当前最优解集C_S贡献的解的个数，|C_S|为当前最优解集中解的个数，n_r为规则的数量。

9.根据权利要求3所述的星间链路调度方法，其特征在于，目标函数值的计算方法是：采用动态规划方法进行计算，从末时隙向首时隙使用目标函数计算数据传输的跳数。

10.根据权利要求3所述的星间链路调度方法，其特征在于，步骤4.3.6中根据每个规则的规则得分进行规则淘汰与协同的方法是：

规则淘汰是指，将各个规则的得分进行归一化处理，连续两次规则得分最低的规则从规则自适应层中删除；

协同：在当前最优解集中，选择目标函数值最高的两个解，交换部分信息片段。

11.一种基于数据驱动的星间链路调度系统，其特征在于，包括以下模块：

输入模块：用于获取参与调度的任务集与卫星集；

求解输出模块：用于对所述时变网络多商品流模型进行求解得到星间链路调度方案并输出：

所述时变网络多商品流模型为：

目标函数：

sf＝{s_|sd|+1，…，s_|S|}是卫星集合中的境外星集合；

T＝{t₁，…，t_|TS|+1}是时变网络多商品流模型的层数，其中t1表示卫星的初始状态层；

n′_k(|TS|+1)表示第|TS|+1层上的第k个卫星节点；

n′_{(|S|+2)(|TS|+2)}表述第|TS|+2层上的第|S|+2个卫星节点；

约束条件1：

约束条件1表示每个境外星节点仅能建链一次；

约束条件2：

i，i′＝1，…，|S|+2；j，j′＝1，…，|TS|+2，c_l∈C

约束条件2表示两个节点所建立的链路是双向的，

约束条件3：

约束条件4：

约束条件5：

i，i′＝1，...，|S|+2，j，j′＝1，...，(|TS|+2)，c_l∈C，l＝1，...，|C|

V＝[v<n′₁₁，n′₁₁>，…，v<n′_{(|S|+2)(|TS|+3)}，n′_{(|S|+2)(|TS|+3)}>]为星间可见性矩阵，v<n′_ij，n′_i′j′>表示卫星节点n′_ij和n′_i′j′是否可见，若可见则v<n′_ij，n′_i′j′>等于1，否则为0；

约束条件6：

约束条件7：

约束条件8：