CN104504520A - 一种基于神经网络的深空探测器自主任务规划方法 - Google Patents

一种基于神经网络的深空探测器自主任务规划方法 Download PDF

Info

Publication number
CN104504520A
CN104504520A CN201410812327.9A CN201410812327A CN104504520A CN 104504520 A CN104504520 A CN 104504520A CN 201410812327 A CN201410812327 A CN 201410812327A CN 104504520 A CN104504520 A CN 104504520A
Authority
CN
China
Prior art keywords
deep space
state
neural network
action
subsystem
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410812327.9A
Other languages
English (en)
Other versions
CN104504520B (zh
Inventor
徐瑞
李朝玉
崔平远
朱圣英
尚海滨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Institute of Technology BIT
Original Assignee
Beijing Institute of Technology BIT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Institute of Technology BIT filed Critical Beijing Institute of Technology BIT
Priority to CN201410812327.9A priority Critical patent/CN104504520B/zh
Publication of CN104504520A publication Critical patent/CN104504520A/zh
Application granted granted Critical
Publication of CN104504520B publication Critical patent/CN104504520B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations
    • G06Q10/06315Needs-based resource requirements planning or analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/086Learning methods using evolutionary algorithms, e.g. genetic algorithms or genetic programming

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Development Economics (AREA)
  • Physiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Data Mining & Analysis (AREA)
  • Biomedical Technology (AREA)
  • Educational Administration (AREA)
  • Artificial Intelligence (AREA)
  • Game Theory and Decision Science (AREA)
  • Evolutionary Biology (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Control Of Position, Course, Altitude, Or Attitude Of Moving Bodies (AREA)
  • Feedback Control In General (AREA)

Abstract

本发明涉及一种基于神经网络的深空探测器自主任务规划方法,属于深空探测技术领域。本发明方法通过建立深空探测器系统模型,定义深空探测器系统自主任务规划问题,确定自主任务规划系统的输入输出,建立神经网络模型,利用深空探测器仿真系统产生的仿真数据对神经网络进行训练,训练后的神经网络能够在给定一组输入后,得到理想的输出。本发明能在多个子系统需要协调的情况下、满足探测器实时性要求;能够快速得到规划解,弥补采用地面站控制的通讯延迟的缺点,有助于大大提高深空探测器自主任务规划的效率,满足探测器实时性要求,规划时间短、效率高,更加适合实时性要求高的深空探测器。

Description

一种基于神经网络的深空探测器自主任务规划方法
技术领域
本发明涉及一种基于神经网络的深空探测器自主任务规划方法,属于深空探测技术领域。
背景技术
在深空环境下,深空探测器根据空间环境的感知和认识及深空探测器本身的能力和状态,利用计算机软件技术、人工智能技术等,依据一段时间内的任务目标,对若干可供选择的动作及所提供的资源约束施行推理,自动地生成一组时间有序动作序列,称一个“规划”(plan),该规划一旦执行,便可以将探测器的状态成功转移到期望的目标状态。
对于自主任务规划问题,能够在动态变化环境下快速规划是智能行为的一大能力。并且深空探测器与目标距离远、飞行时间长、所处环境动态多变,传统地面站-航天器这样的控制方法已经无法满足操作费用、实时性、通讯网络等各项要求。为达到较高的实时性要求,当前使用的方法是基于启发式的规划方法,将规划问题看作搜索问题,利用启发式函数引导搜索,从而实现快速规划的目的。目前,已有相关规划技术应用到了探索太空的项目中,如深空一号中自治远程代理系统、哈勃天文望远镜长期任务调度软件SPIKE等。随着任务量的增加,利用启发式的任务规划方法显得有所欠缺,比如在编码之前需要清楚知道系统及环境特点,采用合适的算法以及启发式函数,但是合适的启发式函数并不容易找到。此外随着任务复杂度的增加,搜索空间增大,规划速度减慢等。
神经网络作为除符号式人工智能之外另一条实现人工智能的主要途径,因具有计算并行性、学习能力强、解决复杂问题的特点受到各个领域的欢迎。目前神经网络在规划领域主要应用于机器人的路径规划。例如,Baomin Feng提出了神经网络模型用于空间机器人的鲁棒控制,而提出的ANN利用RBF处理各种不确定性。YoussefBassil利用多层感知器进行探测器的路径规划,对探测器进行导航,从而避开路面的障碍顺利达到目标。Roy Glasius等人曾利用Hopfield神经网络在静态和动态环境中为机器人选出一条合适的路径,使机器计算能力加快。
发明内容
本发明针对深空探测器自主任务规划问题,为克服现有的基于启发式的规划方法中设计启发式困难、搜索空间大、规划速度减慢等缺点,提出一种基于神经网络的深空探测器自主任务规划方法,能在多个子系统需要协调的情况下、满足探测器实时性要求。
本发明通过设计神经网络模型实现,具体实现步骤如下:
步骤1,建立深空探测器系统模型。
深空探测器系统SYS具有m个子系统:
SYS={sys1,sys2,...,sysi,...,sysm},(1≤i≤m)
其中sysi表示第i个子系统。
深空探测器系统活动状态指m个子系统可能处于的状态集合,设第i个子系统的状态集合为 表示第i个子系统的n-1个可能的状态,则整个探测器系统的状态集合为S={S1,S2,...,Si,...,Sn}。
对于给定的一个任务Gk,与之对应的目标状态为gk,即在完成任务Gk后探测器处于的状态,且其中gk∈S。
为了完成任务,达到目标状态,各个子系统需要采取相应的动作,那么第i个子系统能供选择的动作集合为其中x为该子系统总共能够执行的动作数,每个子系统x的值不同;表示第i个子系统可执行的第1个任务,表示第i个子系统可执行的第2个任务,表示第i个子系统可执行的第x个任务。那么整个探测器动作集合为A={A1,A2,...,Ai,...,Am}。
给定任务目标Gk后,深空探测器系统将当前所处状态作为初始状态s0(当前所处状态为S中的一个元素)。在自主规划过程中,每个子系统在一时间点上只执行一个动作,各个子系统间动作具有并行性,且有充足的时间执行完本子系统动作。
步骤2,根据步骤1中建立的深空探测器系统模型,定义深空探测器系统自主任务规划问题,确定自主任务规划系统的输入输出。
在对规划问题进行描述时,需要包括深空探测器的状态、可以执行的动作、状态之间的转换关系、需要完成的任务。采用经典规划理论对深空探测器自主任务规划问题进行定义。自主任务规划系统的输入是:初始状态、任务目标、领域知识。输出是:一个最佳规划解,即开始于初始状态、满足于星上的各种约束条件并能在成功执行后将深空探测器状态转移到目标状态的一个动作序列。
将深空探测器上状态转移问题Σ用一个三元组进行表示:
Σ=(S,A,γ)
其中,S表示整个探测器系统的状态集合,A表示探测器动作集合,γ为状态转移函数,用于描述状态之间的转换关系。
那么,深空探测器上的自主任务规划问题用一个三元组表示:
P=(Σ,s0,gk)
深空探测器上任务规划问题P的解是由多个深空探测器可执行的活动组成的规划序列,表示为
Π=<π12,...πj,...πh>
πj为探测器系统执行的第j个动作序列,h指探测器系统一共需要执行h个动作序列;且其中表示第i个子系统在第j个动作序列应该执行的活动。状态转移函数如下式所示:
当规划序列的解为空时,状态不转移,仍为s0;当规划序列的解非空,且第一个动作π1对当前状态s0可执行,则相继执行动作序列,直到最后的状态。
步骤3,建立神经网络模型,利用深空探测器仿真系统产生的仿真数据对神经网络进行训练,训练后的神经网络能够在给定一组输入后,得到理想的输出。步骤2中定义的任务规划问题P和动作序列πj分别为神经网络的输入和输出。
神经网络采用三层(不含输入层)感知器模型,并利用学习率可变的动量BP(ErrorBack Propagation,误差反向传播)算法进行训练。神经网络的输入为当前需要解决的规划问题Pnow=[Snow,Gk],其中Snow表示当前探测器各个子系统的状态集合,且 表示第i个子系统当前所处的状态。
神经网络在任务规划系统中主要根据探测器当前状态选取深空探测器下一步可执行的动作,因此神经网络的输出层输出为每个系统需执行的动作集合
Output = &pi; j = [ a j 1 , a j 2 , . . . , a j i , . . . , a j m ] - - - ( 2 )
组织具有代表性的数据进行神经网络训练,训练数据由深空探测仿真得到。当神经网络经过训练达到误差限定(即输出与期望值之间的误差)时,再用于自主任务规划系统。
步骤4,步骤3中建立的神经网络模型加入自主任务规划系统,用于动作选取。将深空探测器当前状态Snow和任务目标Gk作为神经网络的输入,经神经网络的选择,输出下一步要执行的动作。
进行第一次动作选取时,输入为深空探测器当前状态Snow=s0
步骤5,对步骤4中神经网络选取的动作进行可执行判断,判断条件为选取的动作是否与上一步选取的动作相同,若相同则不可执行。若可执行,则直接得到下一步的状态,若不能执行,则要经过恢复原始状态的处理后得到新的动作,然后重新输入神经网络得到下一个新状态。
步骤6,对得到的新状态进行判断,是否达到了目标状态,若达到,则可直接输出动作序列,若没有达到,则将新状态作为神经网络输入,重复步骤4-6,直至找到合适的动作序列为止。
有益效果
本发明设计了基于神经网络的自主任务规划方法,能够快速得到规划解,弥补采用地面站控制的通讯延迟的缺点,有助于大大提高深空探测器自主任务规划的效率,满足探测器实时性要求。与基于启发式的任务规划法相比较,解决同样的任务,规划时间短、效率高,更加适合实时性要求高的深空探测器。
附图说明
图1是本发明的基于神经网络的自主任务规划方法流程图;
图2是具体实施方式中基于神经网络的自主任务规划方法(ANN)与基于启发式的自主任务规划方法(EUROPA)解决相同任务时花费的时间比较图。
具体实施方式
本发明的目的是针对目前深空探测器自主任务规划问题,提出一种基于神经网络的自主任务规划方法,是一种在多个子系统需要协调的情况下、满足探测器实时性要求的方法。
本发明通过设计神经网络模型实现,其流程如图1所示,具体实现步骤如下:
步骤1,建立深空探测器系统模型。
深空探测器具有5个子系统,分别为导航系统、推进系统、姿态系统、通信系统和相机系统。
SYS={sys1,sys2,sys3,sys4,sys5}
探测器活动状态指分系统可能处于的状态,例如相机系统可能处于关闭状态,第i个系统的状态集合为则整个探测器的状态集合为S={S1,S2,S3,S4,S5}。
对于给定的一个任务Gk,与之对应的目标状态为gk,且其中gk∈S。
为了完成任务,达到目标状态,各个系统需要采取相应的动作,那么第i个系统可供选择的动作集合为x为该系统总共能够执行的动作数,每个系统x的值是不同的,则探测器动作集合为A={A1,A2,...,Ai,...,Am}。
给定任务目标Gk后,深空探测器各个系统需要根据当前所处状态s0,需要采取一定的动作,但并不是所有系统都需要做出反应。例如姿态系统当前所处状态为对日定向,任务为电池充电,那么姿态系统保持当前状态即可,而不需要执行任何操作。每个系统在一时间点上只能执行一个动作,在动作执行过程中,考虑系统间动作的并行性,但是不考虑动作执行时间长短,即有充足的时间执行完动作。
步骤2,根据步骤1中建立的深空探测器系统模型,定义深空探测器系统自主任务规划问题,确定自主任务规划系统的输入输出。
在对规划问题进行描述时,需要包括深空探测器的状态、可以执行的动作、状态之间的转换关系、需要完成的任务。采用经典规划理论对深空探测器自主任务规划问题进行描述。
深空探测器上状态转移问题用一个三元组进行表示:
Σ=(S,A,γ)
深空探测器上的任务规划问题用一个三元组表示:
P=(Σ,s0,g)
深空探测器上任务规划问题的解是由多个深空探测器可执行的活动组成的序列,表示为
Π=<π12,...πj,...πh>
πj为探测器执行的第j个动作序列,且其中表示第i个子系统在第j次应该执行的活动;活动的执行最终结果状态集合包含目标集合。状态转移函数如式(1)所示,当规划序列的解π为空时,状态不转移,仍为s;当π非空,且第一个动作对当前状态可执行,则相继执行动作序列,直到最后的状态。
深空探测器自主任务规划的输入是:初始状态、任务目标、领域知识。输出是:一个合理的规划,即开始于初始状态、满足于星上的各种约束条件并能在成功执行后将深空探测器状态转移到目标状态的一个动作序列。
步骤3,建立神经网络模型,利用仿真数据对神经网络进行训练。
神经网络采用基于学习率可变的动量BP算法的三层(不含输入层)多层感知器,神经网络的输入为Pnow=[Snow,Gk],其中Snow表示当前探测器各个分系统的状态集合,且 表示第i个分系统当前所处的状态,m表示探测器有m个子系统;Gk则表示给定的任务。
任务规划系统的输出为深空探测器可执行活动的序列,而神经网络在任务规划系统中主要根据探测器当前状态选取深空探测器下一步可执行的动作,因此神经网络的输出层输出为每个系统需执行的动作集合
Output = &pi; j = [ a j 1 , a j 2 , . . . , a j i , . . . , a j m ] - - - ( 2 )
组织具有代表性的数据进行神经网络训练,训练数据来自深空探测仿真系统产生。当神经网络经过训练达到误差限定时,再用于实际应用。
步骤4,将深空探测器当前状态和任务目标作为神经网络的输入,经神经网络的选择,输出下一步要执行的动作,。
步骤5,对神经网络选取的动作进行可执行判断,若可执行,则直接得到下一步的状态,若不能执行,则要经过恢复原始状态的处理后得到新的动作,然后才可以得到下一状态。
步骤6,对新状态进行判断,是否达到了目标状态,若达到,则可直接输出动作序列,若没有达到,则将新状态作为神经网络输入,重复步骤4-6,直至找到合适的动作序列为止。
将基于神经网络的自主任务规划方法(ANN)与基于启发式的自主任务规划方法(EUROPA)解决相同任务时花费的时间作比较,实验环境为Intel(R)Core(TM)i7-2600CPU,4.00GB RAM,在给定相同深空探测器自主规划任务和初始状态下,实验结果如图2所示,图中虚线部分表示基于启发式的自主任务规划方法(EUROPA);实线部分表示基于神经网络的自主任务规划方法(ANN)。由图中可看出,ANN比EUROPA规划时间低两个数量级。

Claims (2)

1.一种基于神经网络的深空探测器自主任务规划方法,其特征在于:具体包括如下步骤:
步骤1,建立深空探测器系统模型;
深空探测器系统SYS具有m个子系统:
SYS={sys1,sys2,...,sysi,...,sysm},1≤i≤m
其中sysi表示第i个子系统;
深空探测器系统活动状态指m个子系统可能处于的状态集合,设第i个子系统的状态集合为 表示第i个子系统的n-1个可能的状态,则整个探测器系统的状态集合为S={S1,S2,...,Si,...,Sn};
对于给定的一个任务Gk,与之对应的目标状态为gk,即在完成任务Gk后探测器处于的状态,且其中gk∈S;
第i个子系统能供选择的动作集合为其中x为该子系统总共能够执行的动作数,每个子系统x的值不同;表示第i个子系统可执行的第1个任务,表示第i个子系统可执行的第2个任务,表示第i个子系统可执行的第x个任务;那么整个探测器动作集合为A={A1,A2,...,Ai,...,Am};
给定任务目标Gk后,深空探测器系统将当前所处状态作为初始状态s0;在自主规划过程中,每个子系统在一时间点上只执行一个动作,各个子系统间动作具有并行性,且有充足的时间执行完本子系统动作;
步骤2,根据步骤1中建立的深空探测器系统模型,定义深空探测器系统自主任务规划问题,确定自主任务规划系统的输入输出;
将深空探测器上状态转移问题Σ用一个三元组进行表示:
Σ=(S,A,γ)
其中,γ为状态转移函数;
深空探测器上的自主任务规划问题用一个三元组表示:
P=(Σ,s0,gk)
深空探测器上任务规划问题P的解是由多个深空探测器可执行的活动组成的规划序列,表示为
Π=<π12,...πj,...πh>
πj为探测器系统执行的第j个动作序列,h指探测器系统一共需要执行h个动作序列;且其中表示第i个子系统在第j个动作序列应该执行的活动;状态转移函数如下式所示:
&gamma; = &gamma; ( s 0 , &Pi; ) = s 0 , h = 0 &gamma; ( &gamma; ( s 0 , &pi; 1 ) , < &pi; 2 , . . . , &pi; h > ) , h > 0 且π1对s0可执行
当规划序列的解为空时,状态不转移,仍为s0;当规划序列的解非空,且第一个动作π1对当前状态s0可执行,则相继执行动作序列,直到最后的状态;
步骤3,建立神经网络模型,利用深空探测器仿真系统产生的仿真数据对神经网络进行训练,训练后的神经网络能够在给定一组输入后,得到理想的输出;步骤2中定义的任务规划问题P和动作序列πj分别为神经网络的输入和输出;
步骤4,步骤3中建立的神经网络模型加入自主任务规划系统,用于动作选取;将深空探测器当前状态Snow和任务目标Gk作为神经网络的输入,经神经网络的选择,输出下一步要执行的动作;
进行第一次动作选取时,输入为深空探测器当前状态Snow=s0
步骤5,对步骤4中神经网络选取的动作进行可执行判断,判断条件为选取的动作是否与上一步选取的动作相同,若相同则不可执行;若可执行,则直接得到下一步的状态,若不能执行,则要经过恢复原始状态的处理后得到新的动作,然后重新输入神经网络得到下一个新状态;
步骤6,对得到的新状态进行判断,是否达到了目标状态,若达到,则可直接输出动作序列,若没有达到,则将新状态作为神经网络输入,重复步骤4-6,直至找到合适的动作序列为止。
2.根据权利要求1所述的一种基于神经网络的深空探测器自主任务规划方法,其特征在于:所述神经网络采用三层感知器模型,并利用学习率可变的动量误差反向传播算法进行训练;神经网络的输入为当前需要解决的规划问题Pnow=[Snow,Gk],其中Snow表示当前探测器各个子系统的状态集合,且 S now = [ s now 1 , s now 2 , . . . , s now i , . . . , s now m ] , 表示第i个子系统当前所处的状态;
神经网络在任务规划系统中主要根据探测器当前状态选取深空探测器下一步可执行的动作,因此神经网络的输出层输出为每个系统需执行的动作集合
Output = &pi; j = [ a j 1 , a j 2 , . . . , a j i , . . . , a j m ]
组织具有代表性的数据进行神经网络训练,训练数据由深空探测仿真得到;当神经网络经过训练达到误差限定时,再用于自主任务规划系统。
CN201410812327.9A 2014-12-23 2014-12-23 一种基于神经网络的深空探测器自主任务规划方法 Expired - Fee Related CN104504520B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410812327.9A CN104504520B (zh) 2014-12-23 2014-12-23 一种基于神经网络的深空探测器自主任务规划方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410812327.9A CN104504520B (zh) 2014-12-23 2014-12-23 一种基于神经网络的深空探测器自主任务规划方法

Publications (2)

Publication Number Publication Date
CN104504520A true CN104504520A (zh) 2015-04-08
CN104504520B CN104504520B (zh) 2017-11-24

Family

ID=52945915

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410812327.9A Expired - Fee Related CN104504520B (zh) 2014-12-23 2014-12-23 一种基于神经网络的深空探测器自主任务规划方法

Country Status (1)

Country Link
CN (1) CN104504520B (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106446397A (zh) * 2016-09-20 2017-02-22 北京理工大学 一种基于状态目标性的启发式航天器任务规划方法
CN107491310A (zh) * 2017-08-15 2017-12-19 北京理工大学 一种深空探测自主任务规划约束推理的自动编码方法
CN107562066A (zh) * 2017-09-04 2018-01-09 北京理工大学 一种航天器多目标启发式排序任务规划方法
CN108491997A (zh) * 2018-02-09 2018-09-04 中国科学院空间应用工程与技术中心 一种复杂任务的规划方法及系统
CN108596335A (zh) * 2018-04-20 2018-09-28 浙江大学 一种基于深度强化学习的自适应众包方法
CN109343554A (zh) * 2018-11-02 2019-02-15 北京理工大学 一种基于状态转换代价值的启发式航天器任务规划方法
CN111645073A (zh) * 2020-05-29 2020-09-11 武汉理工大学 一种机器人视觉语义导航方法、装置及系统
CN112859603A (zh) * 2021-01-07 2021-05-28 北京理工大学 航天器灵活任务规划序列鲁棒执行方法
CN114139776A (zh) * 2021-11-15 2022-03-04 昆明理工大学 一种基于认知图谱的深空探测任务规划方法及系统
CN114399225A (zh) * 2022-01-24 2022-04-26 北京理工大学 一种基于Q-Learning的深空探测器任务规划方法
CN114707646A (zh) * 2022-01-26 2022-07-05 电子科技大学 基于远程推理的分布式人工智能实践平台

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
崔平远等: "深空探测器自主技术发展现状与趋势", 《航空学报》 *
徐瑞等: "基于Agent的自主探测器软件结构", 《计算机工程与应用》 *
林元等: "基于重点任务优先规则的快速卫星任务规划方法", 《电子技术与软件工程》 *

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106446397A (zh) * 2016-09-20 2017-02-22 北京理工大学 一种基于状态目标性的启发式航天器任务规划方法
CN106446397B (zh) * 2016-09-20 2019-09-10 北京理工大学 一种基于状态目标性的启发式航天器任务规划方法
CN107491310A (zh) * 2017-08-15 2017-12-19 北京理工大学 一种深空探测自主任务规划约束推理的自动编码方法
CN107491310B (zh) * 2017-08-15 2020-08-21 北京理工大学 一种深空探测自主任务规划约束推理的自动编码方法
CN107562066B (zh) * 2017-09-04 2020-01-07 北京理工大学 一种航天器多目标启发式排序任务规划方法
CN107562066A (zh) * 2017-09-04 2018-01-09 北京理工大学 一种航天器多目标启发式排序任务规划方法
CN108491997A (zh) * 2018-02-09 2018-09-04 中国科学院空间应用工程与技术中心 一种复杂任务的规划方法及系统
CN108596335A (zh) * 2018-04-20 2018-09-28 浙江大学 一种基于深度强化学习的自适应众包方法
CN109343554A (zh) * 2018-11-02 2019-02-15 北京理工大学 一种基于状态转换代价值的启发式航天器任务规划方法
CN111645073A (zh) * 2020-05-29 2020-09-11 武汉理工大学 一种机器人视觉语义导航方法、装置及系统
CN112859603A (zh) * 2021-01-07 2021-05-28 北京理工大学 航天器灵活任务规划序列鲁棒执行方法
CN112859603B (zh) * 2021-01-07 2022-02-22 北京理工大学 航天器灵活任务规划序列鲁棒执行方法
CN114139776A (zh) * 2021-11-15 2022-03-04 昆明理工大学 一种基于认知图谱的深空探测任务规划方法及系统
CN114139776B (zh) * 2021-11-15 2024-04-23 昆明理工大学 一种基于认知图谱的深空探测任务规划方法及系统
CN114399225A (zh) * 2022-01-24 2022-04-26 北京理工大学 一种基于Q-Learning的深空探测器任务规划方法
CN114399225B (zh) * 2022-01-24 2024-08-02 北京理工大学 一种基于Q-Learning的深空探测器任务规划方法
CN114707646A (zh) * 2022-01-26 2022-07-05 电子科技大学 基于远程推理的分布式人工智能实践平台
CN114707646B (zh) * 2022-01-26 2023-06-02 电子科技大学 基于远程推理的分布式人工智能实践平台

Also Published As

Publication number Publication date
CN104504520B (zh) 2017-11-24

Similar Documents

Publication Publication Date Title
CN104504520B (zh) 一种基于神经网络的深空探测器自主任务规划方法
CN102402712B (zh) 基于神经网络的机器人强化学习初始化方法
CN102819264B (zh) 移动机器人路径规划q学习初始化方法
CN109739090A (zh) 一种自主式水下机器人神经网络强化学习控制方法
CN112115550B (zh) 基于Mogrifier-BiGRU的飞行器机动轨迹预测方法
CN102622418B (zh) 一种基于bp神经网络的预测装置及设备
CN105654729A (zh) 一种基于卷积神经网络的短时交通流量预测方法
CN105160417A (zh) 基于改进nsga-ii算法的航天器任务规划求解方法
He et al. Scheduling multiple agile earth observation satellites with an edge computing framework and a constructive heuristic algorithm
CN108921298A (zh) 强化学习多智能体沟通与决策方法
Cheng et al. Research status of artificial neural network and its application assumption in aviation
CN104636801A (zh) 一种基于优化bp神经网络的预测输电线路可听噪声方法
CN104850009A (zh) 一种基于捕食逃逸鸽群优化的多无人飞行器编队协调控制方法
CN105182973A (zh) 多机器人追捕者围捕单移动目标的自适应围捕装置与方法
CN104217258A (zh) 一种电力负荷条件密度预测方法
CN106022471A (zh) 基于粒子群优化算法的小波神经网络模型船舶横摇实时预测方法
CN104317297A (zh) 一种未知环境下机器人避障方法
CN106407932B (zh) 基于分数阶微积分与广义逆神经网络的手写数字识别方法
Zhang et al. Graph-based path decision modeling for hypersonic vehicles with no-fly zone constraints
Li A hierarchical autonomous driving framework combining reinforcement learning and imitation learning
Amir et al. Priority neuron: A resource-aware neural network for cyber-physical systems
Li et al. Improved Q-learning based route planning method for UAVs in unknown environment
Zhang et al. Short-term Traffic Flow Prediction With Residual Graph Attention Network.
Song et al. Search and tracking strategy of autonomous surface underwater vehicle in oceanic eddies based on deep reinforcement learning
Qiu et al. Obstacle avoidance planning combining reinforcement learning and RRT* applied to underwater operations

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20171124

Termination date: 20201223

CF01 Termination of patent right due to non-payment of annual fee