发明内容
本发明的目的是提供基于深度学习的卫星网络资源动态分配方法、系统及装置,在多用户同时申请卫星资源的情景下利用分配决策模型动态的调整卫星链路分配策略,能够简化资源申请流程,提升资源分配的稳定性。
本发明的上述技术目的是通过以下技术方案得以实现的:基于深度学习的卫星网络资源动态分配方法,其特征是:包括如下步骤:
获取当前卫星资源分配任务的参数;
根据卫星资源分配任务的参数的实时数据和对应的历史记录数据,生成卫星资源分配数据库;
根据卫星资源分配数据库设立分配决策模型,分配决策模型包括设立的建链任务状态空间、即时评价函数以及最优参数函数;
将历史记录数据设为训练样本,对分配决策模型进行深度学习训练,得到卫星资源分配的最优值;
根据卫星资源分配的最优值进行卫星网络资源分配。
作为本发明的一种优选技术方案,卫星资源分配任务的参数包括任务名称
、任务类型
、任务等级
、开始时间
、结束时间
、申请带宽
、所属网系
、参与任务的单位信息
、人员信息
、设备信息
。
作为本发明的一种优选技术方案,卫星资源分配数据库中存储了包括记录每次卫星通信建链后的网络延迟时间的权值参数
和以卫星资源分配任务的参数为标识,且包括当前申请在内的相同标识的
次参数申请记录数据。
作为本发明的一种优选技术方案,建立分配决策模型的过程为:
将正在处理的建链任务的状态空间的集合设为
,集合中的每个状态
;执行建链过程所有可设置的参数值用参数向量A表示,在某一时刻设置的参数值
,其中
,根据
变化到
,建链任务的状态也从
变化到
;每一个状态变化设定一个即时评价函数
,即
对应
同时对应
,
对应
同时对应
,状态一直转移下去;
其中,建链训练过程成功获得最大带宽,获得最大评价值100,表明建链成功,则训练一轮结束;如果未能获得最大带宽,则训练评价值为1;如果未能分配带宽,则训练评价值为0;
建链任务根据卫星资源分配数据库中的历史记录数据进行深度学习计算,得到参数设置策略
,在这个策略每一次执行下,参数设置都会趋近于最优参数;设函数
为最优参数函数,
为强化学习执行的步骤数,t为当前正在进行的强化学习步骤数,则有 :
。
作为本发明的一种优选技术方案,计算得出卫星资源分配的最优值的过程为:
将卫星资源分配数据库中的所有历史记录数据设定为训练样本,每个样本都由
表示,并设定一个阈值
评价样本数量符合训练要求;
对于每个样本,计算
值,并选取参数集合a对应的最优评价值
,其中
表示第i次计算的阈值
,
表示下一状态的建链任务的状态空间的集合,
表示下一状态的执行建链过程所有可设置的建链参数值;
对每次强化学习的
函数进行迭代计算,设
为迭代损耗系数,设
为学习率,则有:
;
每次迭代完成计算两次迭代之间的差异函数,
并通过梯度下降算法更新最优值,此时为一次学习过程结束,并记录学习次数+1;
判断状态
是否存在建链网络通信不畅的情况,如果是,则停止本次训练,并跳转下一状态重新开始训练,并更新状态
,继续重复上述过程,并最终得到最优解。
作为本发明的一种优选技术方案,所述根据卫星资源分配的最优值进行卫星网络资源分配的过程为:
根据最优解,匹配出适合用户使用的资源,通过任务执行区域的经纬度和面积,匹配出在任务执行区间没有被使用的预案,预案中绑定的有波束和波束转发器资源,如果没有合适的预案,根据适合用户使用的资源手动新增预案;
根据任务填写的信息以及预案的历史评分对可用预案进行排序,匹配度最高的预案排在最前面,同等匹配度评分高的预案排在前面;
用户手动选择预案或者自动使用综合评分和匹配度最高的预案,任务执行结束后,系统自动回收预案,并提示用户对使用的预案进行评分。
基于深度学习的卫星网络资源动态分配系统,包括:
参数获取模块,用于获取当前卫星资源分配任务的参数;
数据库生成模块,用于根据卫星资源分配任务的参数的实时数据和对应的历史记录数据,生成卫星资源分配数据库;
模型建立模块,用于根据卫星资源分配数据库设立分配决策模型,分配决策模型包括设立的建链任务状态空间、即时评价函数以及最优参数函数;
模型计算模块,用于将历史记录数据设为训练样本,对分配决策模型进行深度学习训练,得到卫星资源分配的最优值;
资源分配模块,用于根据卫星资源分配的最优值进行卫星网络资源分配。
基于深度学习的卫星网络资源动态分配装置,包括处理器和存储器,所述存储器存储有所述处理器可执行的计算机程序,所述处理器执行所述计算机程序时实现上述的方法。
综上所述,本发明具有以下有益效果:能够对现有的卫星资源分配任务的相关参数的数据进行整合,得到卫星资源分配数据库;在卫星资源分配数据库的基础上使用深度学习方法得到分配决策模型并能够计算出卫星资源分配的最优值;从而方便根据卫星资源分配的最优值进行合理的卫星网络资源分配,实现了每个用户卫星链路参数的分配的精准预测,同时在多用户同时申请的情景下利用分配决策模型动态的调整卫星链路分配策略,能够简化资源申请流程,提升资源分配的稳定性,以最优化的分配方案,帮助每个参与用户节约了带宽资源,提高了系统总的资源利用率。
具体实施方式
以下结合附图对本发明作进一步详细说明。
本发明提供一种基于深度学习的卫星网络资源动态分配方法,如图1所示,包括如下步骤:
S1、获取当前卫星资源分配任务的参数,即与分配卫星链路资源相关的影响参数,具体的,卫星资源分配任务的参数包括任务名称
、任务类型
、任务等级
、开始时间
、结束时间
、申请带宽
、所属网系
、参与任务的单位信息
、人员信息
、设备信息
,在申请新的建链任务时,用户填写的开始时间
不能早于当前系统时间,用户所填基本信息会作为初次计算此次申请所能分配的链路资源的输入参数。
S2、根据卫星资源分配任务的参数的实时数据和对应的历史记录数据,生成卫星资源分配数据库,当在申请新的建链任务时,此步骤中会利用现有的卫星资源分配任务的参数的实时数据和对应的历史记录数据,对卫星资源分配数据库进行初始化,确保当前进行卫星资源分配时是使用的最新数据库,从而准确度更高;卫星资源分配数据库中存储了包括记录每次卫星通信建链后的网络延迟时间的权值参数
和以任务名称
、任务类型
、任务等级
、开始时间
、结束时间
、申请带宽
、所属网系
、参与任务的单位信息
、人员信息
、设备信息
为标识,且包括当前申请在内的相同标识的
次参数申请记录数据;其中记录每次卫星通信建链后的网络延迟时间的权值参数
可以衡量每次建链任务实际的通信效果。
S3、如图2所示,根据卫星资源分配数据库设立分配决策模型,分配决策模型包括设立的建链任务状态空间、即时评价函数以及最优参数函数;
具体过程为:
卫星通信网络的建链任务包括处于已建链的通信任务、正在拆链的通信任务、其它正要申请建链的通信任务,当前正在处理的建链任务可以认为是智能体的状态变化,所以可以将正在处理的建链任务的状态空间的集合设为
,集合中的每个状态
;执行建链过程所有可设置的参数值用参数向量A表示,在某一时刻设置的参数值
,其中
,根据
变化到
,建链任务的状态也从
变化到
;每一个状态变化设定一个即时评价函数
,即
对应
同时对应
,
对应
同时对应
,状态一直转移下去;
建链任务的目标是在卫星网络资源中找到最优的参数设置,以最短建链时间或最大的数据传输带宽完成此次建链任务的数据发送,建链任务的参数变化考虑以下三种情况:
第一种情况:任务名称
、任务类型
、任务等级
三个参数决定建链时间的长短和任务分配,例如建链名称为预约式建链,任务类型为长链接,任务等级为一般,则需要等网管中心优先分配其它任务等级为高的建链任务,则建链时间可能增长,分配带宽也可能降低,则需要通过模型的训练过程找到当前卫星网络内最优的任务名称,任务类型以及任务等级分配。
第二种情况:开始时间
、结束时间
、申请带宽
,这三个参数配置影响实际建链任务执行效率,比如开始时间,结束时间距离当前分配时间较长,则网管中心有足够时间避免冲突,分配给当前建链任务较高带宽。反之,如果开始时间,结束时间距离当前时间很短,则网管中心很难分配高带宽,则需要通过模型的训练过程找到当前卫星网络内最短建链时间和最大带宽。
第三种情况:所属网系
、参与任务的单位信息
、人员信息
、设备信息
,这四个参数决定链路的实际传输距离,如果分配网系,参与单位,人员信息和设备信息不是最短路径的建链距离,则会增大链路延迟,增加实际传输时间,降低实际传输带宽。但最短距离链路覆盖的网系,参与单位,人员信息和设备信息有可能产生冲突,则需要通过模型的训练过程找到相对最短建链路径。
综合以上三种情况考虑,分配决策模型在每次参数状态变化的学习过程中,需要把建链的时间,带宽和链路延迟向最优目标逼近,所以设计即时评价函数
如下:
即时评价函数
解释如下,建链训练过程成功获得最大带宽,获得最大评价值100,表明建链成功,则训练一轮结束。如果未能获得最大带宽,或者训练评价值为1,如果未能分配成功,则训练评价值为0。此评价函数能够保证建链过程迭代成功,达到最大带宽分配。
建链任务根据卫星资源分配数据库中的历史记录数据进行深度学习计算,得到参数设置策略
,在这个策略每一次执行下,参数设置都会趋近于最优参数;设函数
为最优参数函数,
为强化学习执行的步骤数,t为当前正在进行的强化学习步骤数,则有 :
。
S4、将历史记录数据设为训练样本,对分配决策模型进行深度学习训练,得到卫星资源分配的最优值,具体过程为:
将卫星资源分配数据库中的所有历史记录数据设定为训练样本,每个样本都由
表示,并设定一个阈值
评价样本数量是否符合训练要求;
对于每个样本,计算
值,并选取参数集合a对应的最优评价值
,其中
表示第i次计算的阈值
,
表示下一状态的建链任务的状态空间的集合,
表示下一状态的执行建链过程所有可设置的建链参数值;
对每次强化学习的
函数进行迭代计算,设
为迭代损耗系数,设
为学习率,则有:
;需要注意的是:
越小学习速度越慢,
越大学习速度越快,但过大的
可能会发生震荡,算法不收敛;
每次迭代完成计算两次迭代之间的差异函数,
并通过梯度下降算法更新最优值,此时为一次学习过程结束,并记录学习次数+1;
判断状态
是否存在建链网络通信不畅的情况,如果是,则停止本次训练,并跳转下一状态重新开始训练,并更新状态
,继续重复上述过程,并最终得到最优解;
采用仿真模拟方法对本发明的深度学习进行仿真验证,仿真结果如图3所示,随着迭代计算次数的增加,卫星通信网络剩余带宽的利用率增大。
S5、如图4所示,根据卫星资源分配的最优值进行卫星网络资源分配。
S51、根据最优解,匹配出适合用户使用的资源,通过任务执行区域的经纬度和面积,匹配出在任务执行区间没有被使用的预案,预案中绑定的有波束和波束转发器资源,如果没有合适的预案,根据适合用户使用的资源手动新增预案。
S52、根据任务填写的信息以及预案的历史评分对可用预案进行排序,匹配度最高的预案排在最前面,同等匹配度评分高的预案排在前面,可以方便用户更直观的看到匹配度最高的预案,节省了用户选择合适预案的时间。
S53、用户可以手动选择预案或者自动使用综合评分和匹配度最高的预案,任务执行结束后,系统会自动回收此预案,用户可以对此段资源进行评分,以便下次匹配的准确性。
S54、任务执行的过程中如果有等级比较高的任务需要用到此预案,用户可以暂停任务为的高等级的任务让出预案,高等级任务结束后用户可以再次重新开始任务,重新开始任务需要判断原始预案是否可用,可用即可继续执行任务,不可用则需用户手动撤销任务或者等待预案被回收。
S55、任务如果提前完成,用户可以选择撤销任务,如图5所示,撤销任务后的逻辑和正常结束一致。
S56、任务如果在规定时间内没有完成,用户可以申请延长任务,如果申请延长任务使用的预案,在延长的结束时间区间内没有被其他任务占用,在申请通过后即可正常延长,如果被占用,则需用户重新申请任务。
对应于上述的方法,本发明还提供了一种基于深度学习的卫星网络资源动态分配系统,包括:
参数获取模块,用于获取当前卫星资源分配任务的参数;
数据库生成模块,用于根据卫星资源分配任务的参数的实时数据和对应的历史记录数据,生成卫星资源分配数据库;
模型建立模块,用于根据卫星资源分配数据库设立分配决策模型,分配决策模型包括设立的建链任务状态空间、即时评价函数以及最优参数函数;
模型计算模块,用于将历史记录数据设为训练样本,对分配决策模型进行深度学习训练,得到卫星资源分配的最优值;
资源分配模块,用于根据卫星资源分配的最优值进行卫星网络资源分配。
对应于上述的方法和系统,本发明还提供了一种基于深度学习的卫星网络资源动态分配装置,其特征是:包括处理器和存储器,存储器存储有处理器可执行的计算机程序,处理器执行计算机程序时实现上述的方法。
本发明提供的方法、系统及装置,能够对现有的卫星资源分配任务的相关参数的数据进行整合,得到卫星资源分配数据库;在卫星资源分配数据库的基础上使用深度学习方法得到分配决策模型并能够计算出卫星资源分配的最优值;从而方便根据卫星资源分配的最优值进行合理的卫星网络资源分配,实现了每个用户卫星链路参数的分配的精准预测,同时在多用户同时申请的情景下利用分配决策模型动态的调整卫星链路分配策略,能够简化资源申请流程,提升资源分配的稳定性,以最优化的分配方案,帮助每个参与用户节约了带宽资源,提高了系统总的资源利用率。
以上所述仅是本发明的优选实施方式,本发明的保护范围并不仅局限于上述实施例,凡属于本发明思路下的技术方案均属于本发明的保护范围。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理前提下的若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。