CN109767128A - 基于机器学习的成像卫星自主任务规划方法 - Google Patents
基于机器学习的成像卫星自主任务规划方法 Download PDFInfo
- Publication number
- CN109767128A CN109767128A CN201910034280.0A CN201910034280A CN109767128A CN 109767128 A CN109767128 A CN 109767128A CN 201910034280 A CN201910034280 A CN 201910034280A CN 109767128 A CN109767128 A CN 109767128A
- Authority
- CN
- China
- Prior art keywords
- task
- meta
- meta task
- time
- satellite
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于机器学习的成像卫星自主任务规划方法,包括步骤1:并将本轨元任务按照可见时间窗开始时间进行排序;步骤2:当当前时间为决策时间点时,将元任务设为当前元任务。步骤3:提取当前元任务的特征变量,通过基于机器学习的星上自主任务规划模型判断是否执行当前元任务,如果判断为执行,则输出当前元任务的观测时间窗,在观测时间窗开始时执行当前元任务,如果不能执行,则删除当前元任务;步骤4:判断是否已经规划完本轨元任务,如果已经规划完,则结束,否则返回步骤2。本发明所能达到的有益效果是:与传统卫星任务规划方法相比,规划时间短,任务执行效率高,且能根据环境变化实时进行规划。
Description
技术领域
本发明属于卫星任务规划领域,尤其涉及一种基于机器学习的成像卫星自主任务规划方法。
背景技术
传统的卫星任务规划管控模式是基于地面集中管控的,整个卫星对地观测的流程是从用户提交需求到用户拿到产品的闭环流程,如图1所示。①用户首先向管控部门提交成像任务请求;②管控部门结合气象信息对任务进行预处理,转化为任务规划的标准任务信息格式;③管控部门再结合卫星、地面站的信息进行任务规划,生成最终的任务调度方案;④管控部门根据任务调度方案生成载荷控制计划及跟踪接收计划发送给卫星测控部门;⑤卫星测控部门通过地面站与星地链路将载荷控制指令上注给卫星;⑥卫星进行任务观测;⑦卫星将获取的图像数据通过星地链路与地面站传输给卫星测控部门;⑧测控部门将图像数据发送给数据处理中心进行加工处理;⑨数据处理中心将加工后的图像反馈给用户。这样就完成了整个卫星对地观测的闭环流程。卫星任务规划主要是指其中的步骤②、③、④,属于卫星管控部门所负责的工作。
从图1可以看出,这个观测流程涉及用户、卫星管控部门、卫星测控部门以及数据处理中心多个单位,每个单位业务不统一,交互不方便。任务规划时依据的气象信息和卫星、地面站信息并非实时信息,存在一定滞后性。而且我国地面站都建于国内,目前星间链路也不完善,而有限的测控资源在整个流程中起到了至关重要的作用,影响指令的上注和数据的回收。整体上说,传统的卫星对地观测流程可以完成卫星对部分目标的信息获取,但已然是无法胜任新的需求与挑战。传统卫星对地观测流程的弊端可总结如下:
(1)整个流程过于复杂繁琐,用户从提出需求到获得图像信息周期往往较长,无法满足用户对于时效性的要求;
(2)卫星任务规划属于离线作业,属于静态调度范畴,规划方案不能与实时变化的环境相适应;
(3)对测控资源(星地链路、星间链路)过于依赖,星地之间无法实时通信;
(4)缺乏辅助分析手段,缺乏自动化处理流程,很多情况下需要对系统运行数据进行手工修改操作,应急调整流程复杂,人机交互操作繁多,极易出现错误操作。
我们可以看出卫星在整个过程中只是指令执行者,执行地面上注的姿态调整、成像、数传等指令,不能对星上环境和状态的变化做出实时响应,导致很多任务由于不满足约束而无法完成,卫星实际运行效率比预计的要低。
以敏捷卫星为例,详细分析传统的任务规划流程,如图2所示。由于用户方面对卫星轨道和参数等信息并不一定了解,通常用户提出的需求信息往往只包含目标的地理位置信息(目标的经度、维度、高度)和其他需求信息(如最晚观测时间、最低观测质量、优先级、目标成像次数、成像模式、所用载荷类型等),用户提供的地理位置信息无法直接用于任务规划,需要将位置信息与轨道预报、星历预报、地影预报、测站预报等信息相结合,计算出任务的可见时间窗等信息,目的是将所有的需求信息转化为卫星任务规划的标准格式,这个过程称为任务预处理过程。接着,卫星管控部门整合各类资源信息和任务预处理结果,生成任务规划方案,进而形成卫星观测计划和数据回传计划。根据观测计划生成载荷控制指令,最后将指令发送给测控中心,数传计划发送给地面站[47]。
上述过程中,完成任务预处理后,需要解决卫星任务规划问题。由于传统卫星任务规划将各类资源信息看作已知信息,所以此类问题可以看作是静态优化问题。由于约束复杂,待规划的任务数量大,目前还没有一种非常有效的方法能够在有限的时间内求得其最优解。在实际工程中,一般采用智能优化方法和启发式规则对卫星任务规划问题进行求解。
现有技术中无论是对于非敏捷卫星还是敏捷卫星,在地面集中管控的模式下,从收集用户需求、用户需求筹划、多星协同调度、单星任务规划等全过程的研究已基本可以实现对成像卫星可靠且有效控制。基于地面集中管控模式的卫星任务规划流程已经被各国的卫星管控部门广泛接受,而且业务已经十分熟练,为成像卫星的推广和高效利用奠定了坚实的基础。然而,随着卫星能力的提升和用户要求的提高,对卫星运控的可靠性和资源利用率的要求也随之升高,基于地面集中管控模式的卫星任务规划已逐渐无法满足所有用户的成像需求,例如在2016年浙江丽水泥石流等突发事件中,为了调用我国资源系列成像卫星对泥石流区域进行成像,需要花费大量的人力对卫星成像计划重新编排并上注,并且在卫星图像回传并经过分析之前,即使是经验丰富的操作人员也很难提出下一步成像任务,导致整个链路时间过长,无法很好地响应时效性要求较高的需求。
发明内容
本发明要解决的技术问题是针对现有卫星地面集中管控模式规划时间长,任务执行效率低,且不能根据环境变化实时规划的问题,提出了一种充分利用历史规划方案的经验进行机器学习,通过星上自主规划来提高卫星任务规划效率的基于机器学习的成像卫星自主任务规划方法。
为解决该问题,本发明所采用的技术方案是:
基于机器学习的成像卫星自主任务规划方法,包括以下步骤:
步骤1:根据地面上注的任务预处理信息,获取到本轨的元任务信息,并将本轨元任务按照可见时间窗开始时间进行排序;
步骤2:当当前时间与排在元任务序列第一的元任务可见时间窗的开始时间有α时间间隔的提前量时,将该元任务设为当前元任务。
步骤3:提取当前元任务的特征变量,通过基于机器学习的星上自主任务决策模型判断是否执行当前元任务,如果判断为执行,则输出当前元任务的观测时间窗,在观测时间窗开始时执行当前元任务,如果不能执行,则删除当前元任务;
步骤4:判断是否已经规划完本轨元任务,如果已经规划完,则结束,否则返回步骤2。
进一步地,所述元任务的特征变量是指元任务的实时任务特征变量、实时卫星特征变量、实时场景特征变量。
进一步地,所述基于机器学习的星上自主任务决策模型的训练方法是:
步骤3.1:从历史规划方案库中提取出历史元任务的特征变量以及决策结果组成样本训练集和测试集;
步骤3.2:使用训练集通过机器学习算法在地面对自主任务决策模型进行训练;
步骤3.3:使用测试集对训练后的自主任务决策模型进行验证评价,当正确率大于所允许的阈值时,得到训练好的自主任务决策模型;
步骤3.4:将训练好的自主任务决策模型嵌入到星上。
进一步地,所述步骤3中执行当前元任务之后,还包括步骤3’:检查元任务序列中的后续元任务,删除掉与当前元任务冲突的元任务,并更新元任务序列,所述冲突是指由于当前元任务的执行,导致某个元任务剩余的可见时间不足以完成整个观测或导致两个元任务之间的空余时间不足以完成卫星的姿态机动;
进一步地,将已经执行的元任务特征变量和决策结果发送给地面,添加到历史规划方案库中,对自主任务决策模型学习训练。
进一步地,在步骤2之前,还包括步骤1’,当有应急任务到达时,将应急任务按照可见时间窗开始时间插入到元任务序列中.
进一步地,所述任务特征变量包括任务收益、任务观测所需电量、任务观测所需存储、与当前任务冲突的任务可见时长之和、与当前任务冲突的任务收益之和;所述卫星特征变量包括卫星剩余电量、卫星剩余存储;所述场景特征变量包括剩余任务的观测所需电量之和、剩余任务的观测所需存储之和、剩余任务的收益之和。
与现有技术相比,本发明取得的有益效果是:
本发明基于机器学习的成像卫星自主任务规划方法,通过将元任务按照可见时间窗开始时间进行排序,然后通过基于机器学习的自主任务决策模型对元任务进行决策是否执行,每次只决策当前元任务是否执行,只确定当前任务的观测时间,这种基于时间序的序列决策思想符合星上不确定性环境的要求,能够根据星上环境的变化实时做出实时反应,保证规划结果的鲁棒性。同时自主任务决策模型在通过机器学习进行训练后,结合以往历史规划方案的经验,充分地发挥自主任务决策模型快速决策的优势,每次决策过程的计算复杂度并不高,与传统卫星任务规划方法相比,规划时间短,任务执行效率高,且能根据环境变化实时进行规划。
附图说明
图1为传统卫星规划流程图;
图2为传统的敏捷卫星任务规划流程图;
图3为本发明流程图;
图4为决策时间点示意图;
图5为自主任务决策模型训练闭环流程图;
图6为自主任务决策模型示意图;
图7为任务冲突度描述示意图;
图8为元任务冲突决策顺序示意图;
图9为元任务冲突决策过程示意图;
图10为历史规划与自主任务规划在平均观测总收益上的对比图;
图11为历史规划与自主任务规划在平均任务完成数上的对比图;
图12为历史规划与自主任务规划在平均运行时间上的对比图;
图13为BP神经网络结构;
图14为激活函数示意图;
图15为BP神经网络生成自主任务决策模型流程。
具体实施方式
首先明确一下概念,本发明所称元任务是指,由于卫星可能在多轨上都对同一个目标可见,将完成对这个目标的观测称之为“任务”,这个目标的每一个观测机会称之为“元任务”。例如,某个目标在卫星的第3轨、第4轨、第9轨可见,那么在第3、4、9轨上每一个观测机会都被称为这个目标的“元任务”,可以选择其中任意一个元任务执行,即完成了对该目标的观测。目标的每一个元任务与其可见时间窗一一对应,决策某元任务是否执行即决策是否在其对应的可见时间窗安排观测。因此,对于非敏捷卫星的自主任务规划问题就可以表述为求解每个元任务的决策结果。对于敏捷卫星,还需要确定每个元任务的观测开始时间和结束时间。
图1至图15示出了本发明基于机器学习的成像卫星自主任务规划方法的一种实施例,本方法包括以下步骤:如图3所示,
步骤1:根据地面上注的任务预处理信息,获取到本轨的元任务信息,并将本轨元任务按照可见时间窗开始时间进行排序;
步骤2:当当前时间与排在元任务序列第一的元任务可见时间窗的开始时间有α时间间隔的提前量时,称该提前量的时间点为决策时间点,将该元任务设为当前元任务;
自主任务决策需要有一定提前量,保证在元任务可见时间窗开始时间之前完成决策。但又不能提前太多,否则决策时依据的特征变量可能与元任务的实时特征变量具有一定差距。如图4所示,自主任务决策时间节点与可见时间窗开始时间之间有α的时间间隔提前量,当元任务的可见时间窗的开始时间与当前时间节点的间隔等于α提前量时,将该元任务被设置为当前元任务,开始进行是否执行的决策。α值的大小可以根据实际情况进行调整,由地面管控部门给定。
步骤3:提取当前元任务的特征变量,通过基于机器学习的星上自主任务决策模型判断是否执行当前元任务,如果判断为执行,则输出当前元任务的观测时间窗,在观测时间窗开始时执行当前元任务,如果不能执行,则删除当前元任务。
基于机器学习的星上自主任务决策模型的训练方法是:
步骤3.1:从历史规划方案库中提取出历史元任务的特征变量以及决策结果组成样本训练集和测试集;如图5所示的自主任务决策模型训练闭环流程图。图6给出了自主任务决策模型示意图,根据提取的元任务特征变量,通过自主任务决策模型决策后,输出是否执行的0-1决策结果。
本实施例中,元任务的特征变量是指元任务的实时任务特征变量、实时卫星特征变量、实时场景特征变量。其中任务特征变量包括任务收益、任务观测所需电量、任务观测所需存储、与当前任务冲突的任务可见时长之和、与当前任务冲突的任务收益之和。卫星特征变量包括:卫星剩余电量、卫星剩余存储。场景特征变量包括:剩余任务的观测所需电量之和、剩余任务的观测所需存储之和、剩余任务的收益之和。各特征变量的具体解释为:
①任务收益(pi):任务收益越高的元任务被执行的概率越高,任务收益是指任务的观测收益,具体是指....
②任务观测所需电量(ei):如果单个元任务的观测所需电量过多,可能会导致执行该元任务之后该轨的其他元任务因为超过卫星电量上限而无法执行,所以任务观测所需电量越少的元任务被执行的概率越高。
③任务观测所需存储(si):如果单个元任务的观测所需存储过多,可能会导致执行该元任务之后该轨的其他元任务因为超过卫星存储上限而无法执行,所以任务观测所需存储越少的元任务被执行的概率越高。
④与当前任务冲突的任务可见时长之和与当前任务冲突的定义一种是观测时间窗重叠,另一种是两个元任务之间的时间间隔小于姿态转换时间。若判断出当前元任务与已经执行的元任务之间存在任务冲突,则不予执行。本实施例中用与当前任务冲突的任务可见时长之和来描述“冲突度”的概念,如图5所示,阴影部分就是当前元任务可见时间窗与后续元任务可见时间窗冲突的部分,与当前任务冲突的任务可见时长之和即是将这些阴影部分求和的总时长。这个特征的值越大,说明当前元任务与后续元任务的冲突度越高,如果执行了当前元任务,则后续任务因为冲突而无法执行的概率越高,因此,该特征值越小的元任务被执行的概率越高。
⑤与当前任务冲突的任务收益之和在图7中,将阴影部分所属元任务的收益累计求和,即为与当前任务冲突的任务收益之和。这个特征的值越大,说明与当前元任务冲突的元任务的累积“重要程度”越高,如果执行了当前的元任务,后续的元任务因冲突而无法执行导致的总收益损失的程度可能越高。因此,该特征值越小的元任务被执行的概率越高。
卫星特征变量:⑥卫星剩余电量、⑦卫星剩余存储。
⑥卫星剩余电量若执行当前元任务时,剩余的电量还很充足,则执行该元任务的概率可能较大;若是剩余的电量不足,为了给后续更高收益的元任务预留资源,则执行该元任务的概率较小。
⑦卫星剩余存储若执行当前元任务时剩余的存储还很充足,则执行该元任务的概率可能较大;若是剩余的存储不足,为了给后续更高收益的元任务预留资源,则执行该元任务的概率较小。
场景特征变量:⑧剩余任务的观测所需电量之和、⑨剩余任务的观测所需存储之和、⑩剩余任务的收益之和。
⑧剩余任务的观测所需电量之和在决策当前元任务是否执行时,若剩余元任务的观测所需电量之和相对于卫星剩余电量较大,说明后续部分元任务很有可能因为不满足电量的约束而导致无法观测,则执行该元任务的概率可能较小;若剩余元任务的观测所需电量之和相对于卫星剩余电量较小,说明约束不紧,则执行该元任务的概率可能较大。
⑨剩余任务的观测所需存储之和在决策当前元任务是否执行的时候,若剩余元任务的观测所需存储之和相对于卫星剩余存储较大,说明后续部分元任务很有可能因为不满足存储的约束而导致无法观测,则执行该元任务的概率可能较小;若剩余元任务的观测所需存储之和相对于卫星剩余存储较小,说明约束不紧,则执行该元任务的概率可能较大。
⑩剩余任务的收益之和引入本特征变量主要是用来描述剩余元任务的“重要程度”。决策当前元任务是否执行的时候,若剩余元任务的收益之和较大,则可能因为执行当前元任务而导致后续部分元任务无法执行,造成较大的收益损失,因此执行该元任务的概率可能较小;若剩余元任务的收益之和较小,说明即使有损失也损失不大,则执行该元任务的概率可能较大。
以上的十维特征变量组成一个特征变量集合:
用这个集合来描述当前元任务rik(元任务rik与任务的可见时间窗twik一一对应),作为自主任务决策模型的输入,当前元任务是否执行的决策变量(decik,执行为1,未执行为0)为自主任务决策模型的输出。
历史规划结果的数据中含了任务、卫星、场景的相关信息,以及元任务的执行结果,从这些历史规划结果中挖掘有用的数据指导卫星任务规划,一定能大大提升任务规划的效率。本发明的地面部分来进行模型训练,在图5中,首先从历史规划数据中提取样本数据,其中包含本发明需要的特征变量与决策结果,生成训练集和测试集。“0-1”决策问题可以看作为二分类问题,利用机器学习的分类算法,依据训练集对自主任务决策模型进行训练,依据测试集对训练后决策模型进行验证评价,生成最终的自主任务决策模型。以上是地面部分的全部工作。星上部分首先将训练好的自主任务决策模型嵌入到自主任务规划方法中。然后,依据星上实时的特征变量,利用自主任务决策模型对当前的元任务进行执行与否的决策。对于非敏捷卫星完成了对规划周期内所有元任务的决策即完成了整个任务规划,对于敏捷卫星还要给决策结果为执行的元任务安排观测的开始时间与结束时间,生成最终的任务规划结果。将规划结果发送给地面,添加到历史规划结果中,供自主任务决策模型学习训练,进一步优化改进。
步骤3.2:使用样本训练集通过机器学习算法在地面对自主任务决策模型进行训练;
步骤3.3:使用测试集对训练后的自主任务决策模型进行验证评价,当满足样本预测准确度阈值时,得到训练好的自主任务决策模型;
步骤3.4:将训练好的自主任务决策模型嵌入到星上。
本发明的自主任务决策模型分为地面部分和星上部分,地面部分的主要职能就是训练自主任务决策模型供星上进行决策,星上部分的职能就是利用自主任务决策模型进行决策,基于决策结果进一步完成整个任务规划,得到的规划结果也能作为地面的训练数据。整个方法是一个闭环的结构,如图5所示。本发明地面负责利用历史规划方案对自主任务决策模型进行训练,星上利用训练好的模型进行实时决策。目前,星载计算机的计算能力与存储水平还不足以使得训练部分在星上完成,利用地面强大的计算优势训练好自主任务决策模型后供星上使用。当星载计算机发展到一定水平后,可根据星上的规划结果进行星上自学习、自完善。
步骤4:判断是否已经规划完本轨元任务,如果已经规划完,则结束,否则返回步骤2。
本发明采用按轨规划的规划框架,以元任务为单位进行任务规划。完成了对所有元任务的规划,也就完成了对所有任务的规划。将本轨元任务按照可见时间窗开始时间进行排序,按照时间轴顺序依次对本轨元任务通过自主任务规划模型进行决策,每次只决策当前元任务是否执行,只确定当前任务的观测时间。并且考虑到决策需要一定的时间进行,因此在元任务可见时间窗的开始时间之前的α时间间隔的提前量时开始对当前元任务进行决策,这种基于时间序的单步决策思想的优势就是能够根据星上环境的变化实时做出调整,保证规划结果的鲁棒性,并且每次决策过程的计算复杂度并不高,适应于星上的计算能力。并且通过基于机器学习的星上自主任务决策模型,在地面管控部门将任务信息预处理后上注到星上,由星上自主任务决策模型根据实时的元任务特征变量来决定是否执行当前元任务,缩短了任务规划时间,提高了任务执行效率,且能根据环境信息实时进行决策。
本实施例中,在步骤3卫星执行完当前元任务之后,还包括步骤3’:检查元任务序列中的后续元任务,删除掉与当前元任务冲突的元任务,并更新元任务序列。针对星上环境的不确定性,本发明基于目前元任务的实时特征变量进行决策,按照时间轴向后推进,在每次执行完一个元任务或删除一个元任务后,进行约束检查,删除掉与当前元任务冲突的元任务,因为冲突的元任务没必要对其进行决策,更新后续元任务序列以便于后续元任务的决策。如图7所示,冲突主要表现为由于当前元任务的执行,导致某个元任务剩余的可见时间不足以完成整个观测或导致两个元任务之间的空余时间不足以完成卫星的姿态机动,因此没有必要对与当前元任务冲突的后续元任务进行决策,将其删除来更新元任务序列。元任务冲突决策顺序如图8所示,其中元任务2与元任务3相互冲突,元任务2 的可见时间窗开始时间早于元任务3。当元任务2执行时,进行约束检查删除序列中的元任务3;当元任务2不执行时,对元任务3进行决策。元任务冲突决策过程示意图如图9所示,约束检查的过程相当于一个“剪枝”的过程,对整个决策过程进行了简化。
对于整个规划周期来说,规划周期内每一轨根据上述过程进行自主任务规划,每一个元任务执行成功后为了保证只用安排一次观测的约束,将后续轨道中该目标下的其他元任务删除。
本实施例中,将已经执行的元任务特征变量和决策结果结果发送给地面,添加到历史规划方案库中,对自主任务决策模型学习训练。可以进一步优化改进决策模型。
本实施例中,在步骤2之前,还包括步骤1’,当有应急任务到达时,将应急任务按照可见时间窗开始时间插入到元任务序列中。在有应急任务到达时,则中断任务规划进程,获取应急任务信息,将应急任务在本轨的元任务插入到时间序列中,更新序列中元任务的特征变量。本发明面对应急任务动态到达时,可以实时对元任务序列进行更新,再基于实时的特征变量对应急任务以及被应急任务影响的其他元任务进行合理的决策,既保证全局的总收益,又保证应急任务的快速响应需求。
本发明对于非敏捷卫星和敏捷卫星都适用,只是非敏捷卫星只需要决策是否执行,而敏捷卫星在决策为执行时,还需要给元任务安排观测的开始时间与结束时间。
本实施例中对自主任务决策模型使用的机器学习算法有以下几种:
1、基于BP神经网络的自主任务决策模型设计。
(1)基本要素
得益于较强的学习性能,BP神经网络是使用最广泛的模型之一。BP神经网络结构见图14。
BP神经网络的缺点就是需要设置的参数过多,一个参数设置不恰当就可能导致学习的结果不理想。基于BP神经网络生成自主任务决策模型,需要设定网络输入层、隐含层、输出层以及其他参数等基本要素。表1为经过实验优化后的基本参数。
表1神经网络参数
参数名称 | 参数取值 |
输入层神经元个数 | 10 |
隐含层层数 | 1 |
隐含层神经元个数 | 10 |
输出层神经元个数 | 1 |
最大训练次数 | 1000 |
学习率 | 0.001 |
精度要求 | 0.001 |
输入层的神经元个数与元任务特征变量的维数相同,设置为10个,每个神经元分别对应输入所提取的特征变量。输出层的神经元个数与决策变量的维数相同,设置为1个,输出为decik。本实施例选取单隐含层的网络结构,该层设置 10个神经元。最大训练次数设置为1000,过小可能导致训练精度不够,过大很容易使得神经网络过拟合。学习率设置为0.001,其控制着算法每一轮迭代中的更新步长,过小可能导致收敛速度慢,过大可能导致出现振荡。精度要求设置为0.001。激活函数为logsig类型,其表达式见式(3-1),函数图像见图14
f(x)loqsig=1/(1+e-x)#(3-1)
(2)主要流程
BP神经网络生成自主任务决策模型的具体流程如图15所示。①首先初始化神经元的权重、阈值、以及各个参数;②输入训练集的数据信息到输入层的神经元;③计算隐含层的输出;④计算输出层的输出;⑤计算输出层的误差;⑥判断误差是否达到精度要求,若达到,则结束流程;⑦判断是否达到最大迭代次数,若达到,则结束流程;⑧计算隐藏层的误差;⑨调整网络的权重和阈值,跳转到第③步。
训练好后,得到确定的网络权重和阈值,需要决策时输入元任务的特征变量,输出为“0-1”决策结果。
2、基于支持向量机的自主任务决策模型设计
(1)基本要素
SVM可以利用核函数将非线性问题转化为线性可分,与BP神经网络一样具有较强的泛化能力,对于处理高维空间的决策问题具有很好的表现。表2为经过实验优化后的基本参数。
表2支持向量机参数
参数名称 | 参数取值 |
输入维数 | 10 |
输出维数 | 1 |
惩罚系数 | 10 |
最大训练次数 | 1000 |
核函数 | 高斯核函数 |
核函数中σ参数 | 8 |
输入维数与特征变量的维数相同,设置为10个,分别对应输入元任务的十维特征变量。输出维数与决策变量的维数相同,设置为1个,输出为decik。惩罚系数设定为10,其值越大拟合非线性的能力越强。最大训练次数设置为1000,同样过小可能导致训练精度不够,过大可能使得过拟合。本实施例中选取高斯核函数(高斯径向基函数)作为SVM的核函数,考虑到元任务的特征变量有十维,数据集并非线性可分,采用高斯核函数将数据集映射到高维空间,转化为线性可分。其表达式见式(1)。其中的σ参数设置为8,为高斯核函数的带宽。
(2)主要流程
SVM的目的是建立一个空间超平面,使得该超平面两侧距离超平面最近的样本点之间的距离最大化,从而达到最优分类的目的。具体流程为①利用高斯核函数将样本转化为线性可分;②随机生成一个超平面;③不断移动超平面,直到达到上述SVM的最优分类目的。每当有新的样本需要分类时,只需要计算新样本位于超平面哪一侧,即被分为对应的类别。
3、基于随机森林的自主任务决策模型设计
(1)基本要素
RF基于集成学习的思想,将每一颗决策树的分类结果进行汇总,输出最终的分类结果。具有分类准确率高、可处理高维数据、可评估特征重要性等优势,特别是其可评估特征重要性这一特点,适合于我们问题的背景。因为我们并未对提取的十维特征变量进行重要性评估,换句话说,我们并不知道这十维特征变量对决策结果的影响程度。RF可以在训练决策模型的过程中,自适应地依据特征变量的重要程度,优先选择重要的特征变量进行分类决策,这一点对于有效训练出高效的决策模型十分重要。RF的参数个数相比于BP神经网络和SVM较少,表 3为经过实验优化后的基本参数。
表3随机森林参数
参数名称 | 参数取值 |
输入维数 | 10 |
输出维数 | 1 |
决策树个数 | 100 |
随机选择特征个数 | 4 |
输入维数与特征变量的维数相同,设置为10个,分别对应输入元任务的十维特征变量。输出维数与决策变量的维数相同,设置为1个,输出为decik。决策树的个数设定为100。随机选择特征个数的推荐值为log2d,其中d为特征变量的个数(本文为10),因此将随机选择特征个数设定为4。
(2)主要流程
RF是以每个决策树为基础的分类算法。对于样本数量为N的训练集,每个决策树随机且有放回地从训练集中抽取N个样本进行训练。这样的随机性保证了每个决策树的决策都具有一定的代表性,进而使得总体的结果更加科学。对于特征变量维数为M样本,随机选择m个(m<M,本文m为4,M为10)特征变量,每当决策树分枝的时候,从这m个特征变量中选择最优的。而且在训练决策树的过程中,没有剪枝操作。这样的随机性使得RF不容易陷入过拟合,而且具有很好的抗噪能力。
当然基于机器学习的算法还有很多,本发明只是举例了这几种算法来对自主任务决策模型进行训练。
下面通过实验来进行验证本发明的效果。
本实施例中选择综合性能最好的基于随机森林的自主任务决策模型用于自主任务规划方法中。将历史规划结果(Historical Planning Results,HPR)与自主任务规划结果(Autonomous Mission Planning,AMP)进行对比,评价指标有平均观测总收益、平均任务完成数、平均运行时间。本实施例中,历史规划方案根据规划周期内任务数量的不同进行分组,共分为15组,分别为50,75, 100,……,375,400。每一组中部分历史规划方案用作生成训练集,部分用作生成测试集。确定好特征变量后,从历史规划方案中提取出每个元任务的特征变量集合,与其对应的决策变量共同组成一个样本。将同组的用作生成训练集的历史任务规划方案的所有样本集中在一起,组成该组的训练集。将同组的用作生成测试集的历史任务规划方案的所有样本集中在一起,组成该组的测试集。如此对应着不同的组别,生成15组训练集与测试集。每组包含10个历史规划方案,上述评价指标取10个的平均值,实验结果如表4所示。
表4历史规划结果与自主任务规划结果对比
从表4中,我们可以得出以下结论:
(1)在平均观测总收益上,AMP相比于HPR略低,但是总体上相差不大, AMP与HPR在平均任务总收益上比值最低的一组(任务数量400)其比值为94.76%,而在小规模的任务组中(任务数量50,75)比值最高可达到100%。AMP和HPR 在平均观测总收益上的比值随着任务数量的增加呈现下降趋势。
(2)同样,在平均任务完成数上,AMP相比于HPR略低,但是总体上相差不大,AMP与HPR在平均任务完成数上比值最低的一组(任务数量375的一组) 其比值为95.00%,而在小规模的任务组中(任务数量50,75)比值最高可达到 100%。AMP和HPR在平均任务完成数上的比值随着任务数量的增加呈现下降趋势。
(3)但是,在平均运行时间上,AMP与HPR不是一个数量级,AMP的平均运行时间大大低于HPR,HPR最长平均运行时间已经达到602.03s,而AMP只有1.87s (任务数量400的一组),HPR和AMP在平均运行时间上的比值最高达到334倍 (任务数量350的一组)。HPR和AMP在平均运行时间上的比值随着任务数量的增加呈现上升趋势。
(4)从平均运行时间的标准差中可以看出,AMP的平均运行时间对于不同任务规模的波动小,比较稳定;HPR的平均运行时间对于任务规模变化波动较大。
历史规划结果与自主任务规划结果在平均观测总收益上的对比如图10所示。从图10中,我们可以直观地看出HPR的平均观测总收益比AMP略高,但相差不大,进一步印证了结论(1)。
同样地,历史规划结果与自主任务规划结果在平均任务完成数上的对比如图 11所示。从图11中,我们可以直观地看出HPR的平均任务完成数比AMP略高,但相差不大,进一步印证了结论(2)。
历史规划结果与自主任务规划结果在平均运行时间上的对比如图12所示。从图12中,我们可以直观地看出HPR的平均运行时间比AMP高很多,任务规模越大差别越明显。而且随着任务规模的增大,HPR的平均运行时间变化明显,而 AMP变化不大,进一步印证了结论(3)与结论(4)。
下面对上述所得实验结论进行分析:
对于结论(1),AMP的平均观测总收益比HPR略低是因为以历史规划结果为训练集训练出的自主任务决策模型效果不会超过原训练集的决策效果,存在部分元任务决策错误,导致整体的总收益不如历史规划结果。但是,总收益相差不大,进一步证明了自主任务决策模型的决策效果。对于大规模的任务组,由于训练集正反样本数量不均衡,导致决策模型的性能下降。对于结论(2),同样的道理,部分元任务决策错误使得总体上任务的完成数降低。对于大规模的任务组,由于训练集正反样本数量不均衡,导致决策模型的性能下降。对于结论(3),相比于HPR,AMP极大地提升了任务规划的效率,星上自主任务决策实质上只是一个匹配过程,不存在以往任务规划中的迭代寻优过程,极大地降低了计算的复杂度,这是本文自主任务规划方法最大的优势。对于结论(4),以往规划方法对于大规模的算例,计算复杂度呈现乘法甚至指数级飙升,所花费的时间代价大大增加。而本文自主任务规划方法对于大规模算例,其主体自主任务决策部分的计算复杂度只是呈现加法级上升,对于不同任务规模的算例运行时间波动小,稳定性高。
通过上述实验可以说明,通过与传统卫星任务规划方法相比,本发明规划时间短,任务执行效率高,且能根据环境变化实时进行规划。
以上仅是本发明的优选实施方式,本发明的保护范围并不仅局限于上述实施例,凡属于本发明思路下的技术方案均属于本发明的保护范围。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理前提下的若干改进和润饰,应视为本发明的保护范围。
Claims (7)
1.一种基于机器学习的成像卫星自主任务规划方法,其特征在于:包括以下步骤:
步骤1:根据地面上注的任务预处理信息,获取到本轨的元任务信息,并将本轨元任务按照可见时间窗开始时间进行排序;
步骤2:当当前时间与排在元任务序列第一的元任务可见时间窗的开始时间有α时间间隔的提前量时,称该提前量的时间点为决策时间点,将该元任务设为当前元任务。
步骤3:提取当前元任务的特征变量,通过基于机器学习的星上自主任务决策模型判断是否执行当前元任务,如果判断为执行,则输出当前元任务的观测时间窗,在观测时间窗开始时执行当前元任务,如果不能执行,则删除当前元任务;
步骤4:判断是否已经规划完本轨元任务,如果已经规划完,则结束,否则返回步骤2。
2.根据权利要求1所述的基于机器学习的成像卫星自主任务规划方法,其特征在于:所述元任务的特征变量是指元任务的实时任务特征变量、实时卫星特征变量、实时场景特征变量。
3.根据权利要求2所述的基于机器学习的成像卫星自主任务规划方法,其特征在于:步骤3中所述基于机器学习的星上自主任务决策模型的训练方法是:
步骤3.1:从历史规划方案库中提取出历史元任务的特征变量以及决策结果组成样本训练集和测试集;
步骤3.2:使用训练集通过机器学习算法在地面对自主任务决策模型进行训练;
步骤3.3:使用测试集对训练后的自主任务决策模型进行验证评价,当正确率大于所允许的阈值时,得到训练好的自主任务决策模型;
步骤3.4:将训练好的自主任务决策模型嵌入到星上。
4.根据权利要求3所述的基于机器学习的成像卫星自主任务规划方法,其特征在于:所述步骤3中执行当前元任务之后,还包括步骤3’:检查元任务序列中的后续元任务,删除掉与当前元任务冲突的元任务,并更新元任务序列,所述冲突是指由于当前元任务的执行,导致某个元任务剩余的可见时间不足以完成整个观测或导致两个元任务之间的空余时间不足以完成卫星的姿态机动。
5.根据权利要求1所述的基于机器学习的成像卫星自主任务规划方法,其特征在于:还包括步骤5:将已经执行的元任务特征变量和决策结果发送给地面,添加到历史规划方案库中,对自主任务决策模型学习训练。
6.根据权利要求1所述的基于机器学习的成像卫星自主任务规划方法,其特征在于:在步骤2之前,还包括步骤1’,当有应急任务到达时,将应急任务按照可见时间窗开始时间插入到元任务序列中。
7.根据权利要求1至6中任一项所述的基于机器学习的成像卫星自主任务规划方法,其特征在于:所述任务特征变量包括任务收益、任务观测所需电量、任务观测所需存储、与当前任务冲突的任务可见时长之和、与当前任务冲突的任务收益之和;所述卫星特征变量包括卫星剩余电量、卫星剩余存储;所述场景特征变量包括剩余任务的观测所需电量之和、剩余任务的观测所需存储之和、剩余任务的收益之和。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910034280.0A CN109767128B (zh) | 2019-01-15 | 2019-01-15 | 基于机器学习的成像卫星自主任务规划方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910034280.0A CN109767128B (zh) | 2019-01-15 | 2019-01-15 | 基于机器学习的成像卫星自主任务规划方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109767128A true CN109767128A (zh) | 2019-05-17 |
CN109767128B CN109767128B (zh) | 2021-06-11 |
Family
ID=66452969
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910034280.0A Active CN109767128B (zh) | 2019-01-15 | 2019-01-15 | 基于机器学习的成像卫星自主任务规划方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109767128B (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111369142A (zh) * | 2020-03-04 | 2020-07-03 | 中国电子科技集团公司第五十四研究所 | 一种自主遥感卫星任务生成方法 |
CN111414998A (zh) * | 2020-04-21 | 2020-07-14 | 中国人民解放军国防科技大学 | 一种基于深度神经网络的遥感卫星资源调度算法选择方法 |
CN112232594A (zh) * | 2020-11-06 | 2021-01-15 | 中国人民解放军国防科技大学 | 一种多星应急观测任务规划方法、装置和计算机设备 |
CN112504235A (zh) * | 2020-11-16 | 2021-03-16 | 长光卫星技术有限公司 | 一种小卫星在轨自主成像方法 |
CN113128828A (zh) * | 2021-03-05 | 2021-07-16 | 中国科学院国家空间科学中心 | 一种基于多智能体强化学习的卫星观测分布式在线规划方法 |
CN113128903A (zh) * | 2021-05-06 | 2021-07-16 | 中国电子科技集团公司第五十四研究所 | 一种卫星任务需求配置方法及系统 |
CN113515360A (zh) * | 2021-06-11 | 2021-10-19 | 武汉大学 | 卫星观测在线调度方法、装置、设备及存储介质 |
CN113779267A (zh) * | 2021-09-13 | 2021-12-10 | 中国人民解放军国防科技大学 | 一种基于意图的星上智能任务决策方法 |
CN114399652A (zh) * | 2021-12-20 | 2022-04-26 | 军事科学院系统工程研究院网络信息研究所 | 基于雷达图智能匹配的多指标体系geo卫星轨位选取方法 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106529826A (zh) * | 2016-11-30 | 2017-03-22 | 中国电子科技集团公司第五十四研究所 | 一种基于超启发式算法的多星对地观测任务规划调度方法 |
US9738403B1 (en) * | 2013-12-30 | 2017-08-22 | Terra Bella Technologies Inc. | Parallel calculation of satellite access windows and native program implementation framework |
CN107392382A (zh) * | 2017-07-28 | 2017-11-24 | 中国电子科技集团公司第五十四研究所 | 一种高分辨率地球静止轨道成像卫星观测任务规划方法 |
CN107798388A (zh) * | 2017-11-23 | 2018-03-13 | 航天天绘科技有限公司 | 基于Multi‑Agent与DNN的测控资源调度分配的方法 |
CN108022045A (zh) * | 2017-12-01 | 2018-05-11 | 中国人民解放军国防科技大学 | 一种分布估计方法 |
CN108021433A (zh) * | 2017-12-01 | 2018-05-11 | 中国人民解放军国防科技大学 | 一种多星星簇的目标观测方法 |
CN108037986A (zh) * | 2017-12-01 | 2018-05-15 | 中国人民解放军国防科技大学 | 一种双星星簇的目标观测方法 |
CN108335012A (zh) * | 2017-12-26 | 2018-07-27 | 佛山科学技术学院 | 一种智能遥感卫星层次化分布式自主协同任务规划系统 |
CN108717572A (zh) * | 2018-05-31 | 2018-10-30 | 佛山科学技术学院 | 基于结构化神经网络的成像任务可调度性预测方法 |
CN108804220A (zh) * | 2018-01-31 | 2018-11-13 | 中国地质大学(武汉) | 一种基于并行计算的卫星任务规划算法研究的方法 |
CN109087023A (zh) * | 2018-08-23 | 2018-12-25 | 中南大学 | 一种基于分治策略的多星观测分层调度方法及系统 |
CN109146126A (zh) * | 2018-07-02 | 2019-01-04 | 上海卫星工程研究所 | 基于时间窗口离散化的卫星成像任务最优路径规划方法 |
-
2019
- 2019-01-15 CN CN201910034280.0A patent/CN109767128B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9738403B1 (en) * | 2013-12-30 | 2017-08-22 | Terra Bella Technologies Inc. | Parallel calculation of satellite access windows and native program implementation framework |
CN106529826A (zh) * | 2016-11-30 | 2017-03-22 | 中国电子科技集团公司第五十四研究所 | 一种基于超启发式算法的多星对地观测任务规划调度方法 |
CN107392382A (zh) * | 2017-07-28 | 2017-11-24 | 中国电子科技集团公司第五十四研究所 | 一种高分辨率地球静止轨道成像卫星观测任务规划方法 |
CN107798388A (zh) * | 2017-11-23 | 2018-03-13 | 航天天绘科技有限公司 | 基于Multi‑Agent与DNN的测控资源调度分配的方法 |
CN108022045A (zh) * | 2017-12-01 | 2018-05-11 | 中国人民解放军国防科技大学 | 一种分布估计方法 |
CN108021433A (zh) * | 2017-12-01 | 2018-05-11 | 中国人民解放军国防科技大学 | 一种多星星簇的目标观测方法 |
CN108037986A (zh) * | 2017-12-01 | 2018-05-15 | 中国人民解放军国防科技大学 | 一种双星星簇的目标观测方法 |
CN108335012A (zh) * | 2017-12-26 | 2018-07-27 | 佛山科学技术学院 | 一种智能遥感卫星层次化分布式自主协同任务规划系统 |
CN108804220A (zh) * | 2018-01-31 | 2018-11-13 | 中国地质大学(武汉) | 一种基于并行计算的卫星任务规划算法研究的方法 |
CN108717572A (zh) * | 2018-05-31 | 2018-10-30 | 佛山科学技术学院 | 基于结构化神经网络的成像任务可调度性预测方法 |
CN109146126A (zh) * | 2018-07-02 | 2019-01-04 | 上海卫星工程研究所 | 基于时间窗口离散化的卫星成像任务最优路径规划方法 |
CN109087023A (zh) * | 2018-08-23 | 2018-12-25 | 中南大学 | 一种基于分治策略的多星观测分层调度方法及系统 |
Non-Patent Citations (1)
Title |
---|
邢立宁: "基于BP神经网络的星上任务可调度性预测方法", 《中国管理科学》 * |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111369142B (zh) * | 2020-03-04 | 2023-04-18 | 中国电子科技集团公司第五十四研究所 | 一种自主遥感卫星任务生成方法 |
CN111369142A (zh) * | 2020-03-04 | 2020-07-03 | 中国电子科技集团公司第五十四研究所 | 一种自主遥感卫星任务生成方法 |
CN111414998A (zh) * | 2020-04-21 | 2020-07-14 | 中国人民解放军国防科技大学 | 一种基于深度神经网络的遥感卫星资源调度算法选择方法 |
CN111414998B (zh) * | 2020-04-21 | 2024-01-19 | 中国人民解放军国防科技大学 | 一种基于深度神经网络的遥感卫星资源调度算法选择方法 |
CN112232594A (zh) * | 2020-11-06 | 2021-01-15 | 中国人民解放军国防科技大学 | 一种多星应急观测任务规划方法、装置和计算机设备 |
CN112504235A (zh) * | 2020-11-16 | 2021-03-16 | 长光卫星技术有限公司 | 一种小卫星在轨自主成像方法 |
CN113128828A (zh) * | 2021-03-05 | 2021-07-16 | 中国科学院国家空间科学中心 | 一种基于多智能体强化学习的卫星观测分布式在线规划方法 |
CN113128828B (zh) * | 2021-03-05 | 2022-03-08 | 中国科学院国家空间科学中心 | 一种基于多智能体强化学习的卫星观测分布式在线规划方法 |
CN113128903A (zh) * | 2021-05-06 | 2021-07-16 | 中国电子科技集团公司第五十四研究所 | 一种卫星任务需求配置方法及系统 |
CN113515360A (zh) * | 2021-06-11 | 2021-10-19 | 武汉大学 | 卫星观测在线调度方法、装置、设备及存储介质 |
CN113515360B (zh) * | 2021-06-11 | 2023-08-15 | 武汉大学 | 卫星观测在线调度方法、装置、设备及存储介质 |
CN113779267B (zh) * | 2021-09-13 | 2023-07-11 | 中国人民解放军国防科技大学 | 一种基于意图的星上智能任务决策方法 |
CN113779267A (zh) * | 2021-09-13 | 2021-12-10 | 中国人民解放军国防科技大学 | 一种基于意图的星上智能任务决策方法 |
CN114399652A (zh) * | 2021-12-20 | 2022-04-26 | 军事科学院系统工程研究院网络信息研究所 | 基于雷达图智能匹配的多指标体系geo卫星轨位选取方法 |
Also Published As
Publication number | Publication date |
---|---|
CN109767128B (zh) | 2021-06-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109767128A (zh) | 基于机器学习的成像卫星自主任务规划方法 | |
CN104573106B (zh) | 一种基于案例推理技术的城市建设智能审批方法 | |
CN105095643B (zh) | 面向动态环境的成像卫星自主任务规划方法 | |
Grubler | The rise and fall of infrastructures: dynamics of evolution and technological change in transport | |
CN108256671A (zh) | 一种基于学习型遗传算法的多任务多资源滚动分配方法 | |
Khmeleva et al. | Fuzzy-logic controlled genetic algorithm for the rail-freight crew-scheduling problem | |
CN106022614A (zh) | 一种基于最近邻聚类的神经网络数据挖掘方法 | |
CN113077109B (zh) | 一种机巡计划智能调度系统、方法、设备及介质 | |
CN107330588A (zh) | 一种多基地异构无人机协同侦察的任务规划方法 | |
Zhang et al. | Construction-based optimization approaches to airline crew rostering problem | |
CN107220724A (zh) | 客流量预测方法及装置 | |
Grachev et al. | Methods and tools for developing intelligent systems for solving complex real-time adaptive resource management problems | |
CN109190900A (zh) | 一种分布式约束优化模型求解agv调度系统任务分配的方法 | |
CN105184038A (zh) | 面向资源利用率的成像卫星任务规划绩效评估方法 | |
CN115759386B (zh) | 一种民航航班执飞结果预测方法、装置及电子设备 | |
CN116578569A (zh) | 卫星时空轨迹数据关联分析方法 | |
Chesalin et al. | Intelligent quality management tools for digital production and knowledge management system for their application | |
Golpayegani et al. | The logical precedence network planning of projects, considering the finish-to-start (FS) relations, using neural networks | |
Rogachev et al. | Management and Optimization of Sistematic Water Adjustment by Economic-Mathematic Modeling Methods and AI | |
Aksvonov et al. | Development of a hybrid decision-making method based on a simulation-genetic algorithm in a web-oriented metallurgical enterprise information system | |
Ma et al. | Research on power grid infrastructure project intelligent management platform based on digital twin technology | |
CN111311037A (zh) | 一种对自定义施工计划编制、进度汇总与数据分析的方法 | |
Xing et al. | An overview of cuckoo-inspired intelligent algorithms and their applications | |
LU505438B1 (en) | Multi-aircraft task scheduling method based on mixed integer programming | |
Hazirbaba et al. | Designing strategy dimension of the organization based on big data analytics capability |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |