CN112141369B - 一种航天器平移靠拢段自主交会对接的决策与控制方法 - Google Patents
一种航天器平移靠拢段自主交会对接的决策与控制方法 Download PDFInfo
- Publication number
- CN112141369B CN112141369B CN202011074168.9A CN202011074168A CN112141369B CN 112141369 B CN112141369 B CN 112141369B CN 202011074168 A CN202011074168 A CN 202011074168A CN 112141369 B CN112141369 B CN 112141369B
- Authority
- CN
- China
- Prior art keywords
- spacecraft
- control
- autonomous
- decision
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003032 molecular docking Methods 0.000 title claims abstract description 47
- 238000000034 method Methods 0.000 title claims abstract description 44
- 230000006399 behavior Effects 0.000 claims abstract description 63
- 210000001503 joint Anatomy 0.000 claims abstract description 33
- 238000010168 coupling process Methods 0.000 claims abstract description 25
- 238000005859 coupling reaction Methods 0.000 claims abstract description 25
- 238000004088 simulation Methods 0.000 claims abstract description 25
- 230000008878 coupling Effects 0.000 claims abstract description 24
- 230000003993 interaction Effects 0.000 claims abstract description 19
- 238000013519 translation Methods 0.000 claims abstract description 17
- 238000011002 quantification Methods 0.000 claims abstract description 11
- 239000011664 nicotinic acid Substances 0.000 claims abstract description 9
- 238000013528 artificial neural network Methods 0.000 claims abstract description 7
- 239000011159 matrix material Substances 0.000 claims abstract description 4
- 230000002787 reinforcement Effects 0.000 claims abstract description 4
- 230000007246 mechanism Effects 0.000 claims description 14
- 230000008030 elimination Effects 0.000 claims description 12
- 238000003379 elimination reaction Methods 0.000 claims description 12
- 230000006870 function Effects 0.000 claims description 12
- 238000012549 training Methods 0.000 claims description 11
- 238000004422 calculation algorithm Methods 0.000 claims description 10
- 230000008569 process Effects 0.000 claims description 10
- 238000005312 nonlinear dynamic Methods 0.000 claims description 9
- 230000009471 action Effects 0.000 claims description 8
- 230000007613 environmental effect Effects 0.000 claims description 8
- 238000013136 deep learning model Methods 0.000 claims description 7
- 210000002569 neuron Anatomy 0.000 claims description 6
- 230000008447 perception Effects 0.000 claims description 6
- 238000011160 research Methods 0.000 claims description 6
- 238000013459 approach Methods 0.000 claims description 4
- 230000001133 acceleration Effects 0.000 claims description 3
- 230000004913 activation Effects 0.000 claims description 3
- 238000006073 displacement reaction Methods 0.000 claims description 3
- 238000005265 energy consumption Methods 0.000 claims description 3
- 238000011156 evaluation Methods 0.000 claims description 3
- 238000002474 experimental method Methods 0.000 claims description 3
- 238000007620 mathematical function Methods 0.000 claims description 3
- 238000003672 processing method Methods 0.000 claims description 3
- 230000035484 reaction time Effects 0.000 claims description 3
- 238000000926 separation method Methods 0.000 claims description 3
- 230000000007 visual effect Effects 0.000 claims description 3
- 230000001808 coupling effect Effects 0.000 claims 1
- 230000008901 benefit Effects 0.000 description 5
- 230000009977 dual effect Effects 0.000 description 3
- 102000016550 Complement Factor H Human genes 0.000 description 2
- 108010053085 Complement Factor H Proteins 0.000 description 2
- 230000019771 cognition Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- XOFYZVNMUHMLCC-ZPOLXVRWSA-N prednisone Chemical compound O=C1C=C[C@]2(C)[C@H]3C(=O)C[C@](C)([C@@](CC4)(O)C(=O)CO)[C@@H]4[C@@H]3CCC2=C1 XOFYZVNMUHMLCC-ZPOLXVRWSA-N 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Classifications
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B64—AIRCRAFT; AVIATION; COSMONAUTICS
- B64G—COSMONAUTICS; VEHICLES OR EQUIPMENT THEREFOR
- B64G1/00—Cosmonautic vehicles
- B64G1/22—Parts of, or equipment specially adapted for fitting in or to, cosmonautic vehicles
- B64G1/64—Systems for coupling or separating cosmonautic vehicles or parts thereof, e.g. docking arrangements
- B64G1/646—Docking or rendezvous systems
Landscapes
- Engineering & Computer Science (AREA)
- Remote Sensing (AREA)
- Aviation & Aerospace Engineering (AREA)
- Control Of Position, Course, Altitude, Or Attitude Of Moving Bodies (AREA)
- Feedback Control In General (AREA)
Abstract
一种航天器平移靠拢段自主交会对接的决策与控制方法,属于交会对接领域。包括步骤:建立面向优先注意维度决策的场景分类矩阵,研究平移靠拢段手控交会对接的人‑机‑环境耦合交互量化模型;解析航天员、航天器、环境及动态联合扰动之间的关系,建立不同交会对接场景下的行为决策指令规则集;基于深度神经网络和半物理仿真实验,建立自主追踪航天器驾驶员先验模型;基于深度强化学习和全物理仿真实验,建立追踪航天器自主行为决策模型;研究包含顶层决策和底层控制的仿生式分层控制架构,实现追踪航天器自主行为决策与控制。本发明通过引入类脑思维思想,解决航天器平移靠拢阶段的自主交会对接方式缺少人工控制的灵活性和智能性问题。
Description
技术领域
本发明涉及交会对接领域,具体涉及一种航天器平移靠拢段自主交会对接的决策与控制方法。
背景技术
空间交会对接是在轨航天器的常规空间活动,在在轨装配、回收、补给、维修及空间救援等领域得到广泛应用。在交会对接过程中,追踪航天器的飞行可以分为远程导引、近程导引、平移靠拢三个阶段,目前,前两个阶段已经实现自动化,而在整个任务中起到关键性作用的平移靠拢段交会对接,在一些重要空间任务中一般采用航天员手动控制或地面站遥感控制方式完成。随着航天任务数量的日益增长和任务类型的逐渐多样化,航天员及地面站在回路的平移靠拢段交会对接操作模式需要大量人力及设备进行实时监控与指令上传,任务成本显著增加,而且这种大回路用于高轨或深空区域的空间任务时可能会因为通信延迟、不确定性等因素导致任务失败,加之这个平移靠拢过程需要极为精细的操作,极为耗费时间和精力,如果对接时间过长会造成航天员体力消耗过大,甚至会导致整个任务的失败。所以,发展航天器平移靠拢段自主交会对接技术是未来航天器技术发展的必然趋势。
与传统的遥控操作、手动操作、自动控制等交会对接操控方式相比,自主控制方式不依靠航天员与地面站,完全由航天器上设备自主实现平移靠拢段交会对接,能够降低资源消耗和技术风险,可以用来解决那些用传统操控方式难以解决的复杂问题,在在轨服务、空间救援及深空探索等领域具有广阔的应用前景。尽管具有诸多优势,但平移靠拢段自主交会对接方式存在的难以复现人工控制方式灵活性和智能性问题已经成为制约其在空间交会对接任务中规模化和重要化应用的瓶颈。
突破这一瓶颈问题的一种新思路是利用类脑思维思想,即模拟人的思维机制特别是人的信息处理及决策机制,基于平移靠拢段手控交会对接的人-机-环境耦合交互机理进行行为决策与控制,充分结合人控智能灵活和自控稳定可靠的双重优势,提高自主交会对接任务的效率和成功率。为了完成交会对接从传统操控方式到智能化自主控制方式的跨越,需要突破系列的理论和技术难题。平移靠拢段自主交会对接的决策问题是一个多变量、强耦合的多解数学问题,现有的自主行为决策方法过度依赖人工智能算法,对环境和任务适应性差,如何充分模拟人的智能,从操作人员的认知、决策和操作各层面提取完成任务的认知过程和特征,建立具有自主决策能力的模型,实现基于人-机-环境耦合交互机理的自主行为决策十分重要;在安全性要求很高的领域,传统控制理论依然是一个相对完善的工具,能够从理论上保证其响应时间、稳定性和收敛性,如何结合非线性控制器的优势,实现基于自主行为决策结果的航天器跟踪控制是需要突破的关键问题。
发明内容
本发明解决的技术问题是:针对平移靠拢阶段的自主交会对接方式缺少人工控制的灵活性和智能性的问题,提出一种航天器平移靠拢段自主交会对接的决策与控制方法,实现追踪航天器的自主行为决策与控制。
本发明的技术解决方案是:一种航天器平移靠拢段自主交会对接的决策与控制方法,步骤如下:
(1)建立面向优先注意维度决策的场景分类矩阵,研究平移靠拢段手控交会对接的人-机-环境耦合交互量化模型;
(2)解析航天员、航天器、环境及动态联合扰动之间的关系,建立不同交会对接场景下的行为决策指令规则集;
(3)基于深度神经网络和半物理仿真实验,建立自主追踪航天器驾驶员先验模型;
(4)基于深度强化学习和全物理仿真实验,建立追踪航天器自主行为决策模型;
(5)研究包含顶层决策和底层控制的仿生式分层控制架构,实现追踪航天器自主行为决策与控制。
进一步地,所述平移靠拢段交会对接操控过程采用六自由度控制方式,交会对接决策的流程为:首先选择优先注意维度,然后根据选择的操作顺序分别确定执行偏差消除控制的时间及输出量。
进一步地,所述步骤(1)中建立人-机-环境耦合交互量化模型的方法为:
a.获取影响手控交会对接中航天员操控行为的航天员因素H(视野范围)、M航天器因素(执行器性能)和环境因素E(对接状态信息),提取可观测性尺寸、最大控制冲量、状态特征等关键参数;
b.确定人、机和环境各自的动态扰动ΔH(反应时间、操作频率),ΔM(航天器的软硬件故障、工作能耗等)、ΔE(相对运动参数变化等),利用数学函数描述它们的耦合作用关系,确定三个因素之间的耦合扰动项集合Δ,并确定偏差消除操控行为p+;
c.采用多变量非线性回归方法建立人-机-环境耦合交互量化模型:
进一步地,所述步骤(2)中建立行为决策指令规则集的方法为:构建统一的信息描述及处理方法,引入多物理约束条件(安全控制区域、动力学约束等),根据选择的操作顺序分别确定执行偏差消除控制的时间及输出量,建立不同交会对接场景下的行为决策指令规则集,为驾驶员先验模型的建立提供决策基础。
进一步地,所述步骤(3)中建立自主追踪航天器驾驶员先验模型的方法为:
a.根据之前对平移靠拢段手控交会对接人-机-环境耦合交互机理的研究结果,将航天员手控交会对接时的闭环操控流程定义为受自身、航天器和环境三方面因素综合影响的非线性动态系统,由此确定深度学习模型中输入层的输入值向量和输出层的神经元个数;
b.采用深度神经网络反向传播算法建立深度学习模型,确定总层数、各隐藏层神经元个数,并选用交叉熵损失函数和Sigmoid激活函数的组合提高算法收敛速度,提取能表征航天员感知、决策、操控等关键参数,如姿态和平移感知阈值、用于决定加速或减速程度的安全范围阈值、单位偏移控制输出量等;
c.利用驾驶模拟平台能提供逼真仿真环境和操作人员在环功能的特性,针对不同场景下的平移靠拢段手控交会对接任务开展半物理仿真实验,通过训练操作人员面向追踪航天器仿真模型的实际操控过程采集大量样本数据;
d.利用行为决策指令规则集和样本数据对模型进行离线训练,解决由于训练样本不足导致模型陷入局部极值点的问题,量化出能够精确逼近航天员行为动作的自主追踪航天器驾驶员先验模型。
进一步地,所述步骤(4)中建立追踪航天器自主行为决策模型的方法为:
a.在驾驶员先验模型的基础上,考虑到驾驶员先验模型在环的非线性动态系统具有连续的状态及动作空间,采用基于Actor-Critic结构的深度确定性策略梯度算法建立追踪航天器自主行为决策模型的推理机制;
b.针对非线性动态系统建立行为环境马尔可夫决策模型,基于驾驶员先验模型的研究结果确定模型的状态空间和动作空间,制定奖励函数,以累积航天器接收的环境奖赏反馈最大为原则形成评价机制;
c.开展多任务(不同交会对接状态下的任务)、多约束(安全控制区域约束、接近走廊和分离走廊约束、动力学约束等)的自主交会对接模拟实验,对自主行为决策模型进行更新迭代;
d.将自主行为决策程序迁移到交会对接全物理仿真系统中的追踪模拟器,通过开展相关实验利用实验结果对自主行为决策模型参数进一步更新迭代。
进一步地,所述步骤(5)中仿生式分层控制架构为:
a.将有限时间控制器植入自主行为决策框架,分别用于顶层决策和底层控制,采用手动操作模式作为备份解决自主航天器无法处理的交会对接操控问题,通过建立两者之间切换条件的数学表达,构建两种控制模式之间切换的触发条件及触发规则;
b.在分层控制架构中,规划层选择优先注意维度生成操作顺序,本能层根据操作顺序针对每一个维度确定执行偏差消除控制的时间以及输出量进而生成航天器运动轨迹,有限时间控制层控制航天器对生成的位姿轨迹进行跟踪;;
c.当出现安全裕度过低或自主交会对接无法进行的情况时,感受器的反馈信息将触发慎思层的反射触发规则模块,该模块立即通知规划层终止当前运动,由航天员手动操作完成交会对接。
与现有技术相比,本发明的有益效果是:本发明综合考虑了航天员因素、航天器因素和环境因素之间的耦合关系,建立了平移靠拢段手控交会对接的人-机-环境耦合交互量化模型;用计算机模拟平移靠拢段手控交会对接中航天员操控流程表现出特定的行为规律,建立了自主追踪航天器驾驶员先验模型;设计仿生式分层控制架构实现追踪航天器自主行为决策与控制,并采用手动操作模式作为备份解决自主航天器无法处理的交会对接操控问题。本发明利用类脑思维思想,充分结合人控智能灵活和自控稳定可靠的双重优势,提高自主交会对接任务的效率和成功率。
附图说明
为使得本发明中的技术方案,下面将会选取一些附图对本发明进行阐述。下述附图仅为本发明的一些实例;使用者可根据该附图获得其他类似的附图。其中:
图1为本发明的技术路线示意图。
具体实施方式
下面将更加深刻,完整的阐述本发明实施案例中的技术方案。所述实施案例为部分是实施案例。使用者可根据本发明,不需付出创造性劳动的获得其他实施案例。该“其他实施案例”均属于本发明保护的范围。
如图1所示,一种航天器平移靠拢段自主交会对接的决策与控制方法,包括以下步骤:
(1)建立面向优先注意维度决策的场景分类矩阵,研究平移靠拢段手控交会对接的人-机-环境耦合交互量化模型;
(2)解析航天员、航天器、环境及动态联合扰动之间的关系,建立不同交会对接场景下的行为决策指令规则集;
(3)基于深度神经网络和半物理仿真实验,建立自主追踪航天器驾驶员先验模型;
(4)基于深度强化学习和全物理仿真实验,建立追踪航天器自主行为决策模型;
(5)研究包含顶层决策和底层控制的仿生式分层控制架构,实现追踪航天器自主行为决策与控制。
根据本发明的一种实施方式,在平移靠拢段交会对接操控过程中采用六自由度控制方式,交会对接决策的流程为:首先选择优先注意维度,然后根据选择的操作顺序分别确定执行偏差消除控制的时间及输出量。
基于以上实施方式,在上述步骤(1)中建立人-机-环境耦合交互量化模型的方法为:
a.获取影响手控交会对接中航天员操控行为的航天员因素H(视野范围)、M航天器因素(执行器性能)和环境因素E(对接状态信息),提取可观测性尺寸、最大控制冲量、状态特征等关键参数;
b.确定人、机和环境各自的动态扰动ΔH(反应时间、操作频率),ΔM(航天器的软硬件故障、工作能耗等)、ΔE(相对运动参数变化等),利用数学函数描述它们的耦合作用关系,确定三个因素之间的耦合扰动项集合Δ,并确定偏差消除操控行为p+;
c.采用多变量非线性回归方法建立人-机-环境耦合交互量化模型:
在上述步骤(2)中建立行为决策指令规则集的方法为:构建统一的信息描述及处理方法,引入多物理约束条件(安全控制区域、动力学约束等),根据选择的操作顺序分别确定执行偏差消除控制的时间及输出量,建立不同交会对接场景下的行为决策指令规则集,为驾驶员先验模型的建立提供决策基础。
在上述步骤(3)中建立自主追踪航天器驾驶员先验模型的方法为:
a.根据之前对平移靠拢段手控交会对接人-机-环境耦合交互机理的研究结果,将航天员手控交会对接时的闭环操控流程定义为受自身、航天器和环境三方面因素综合影响的非线性动态系统,由此确定深度学习模型中输入层的输入值向量和输出层的神经元个数;
b.采用深度神经网络反向传播算法建立深度学习模型,确定总层数、各隐藏层神经元个数,并选用交叉熵损失函数和Sigmoid激活函数的组合提高算法收敛速度,提取能表征航天员感知、决策、操控等关键参数,如姿态和平移感知阈值、用于决定加速或减速程度的安全范围阈值、单位偏移控制输出量等;
c.利用驾驶模拟平台能提供逼真仿真环境和操作人员在环功能的特性,针对不同场景下的平移靠拢段手控交会对接任务开展半物理仿真实验,通过训练操作人员面向追踪航天器仿真模型的实际操控过程采集大量样本数据;
d.利用行为决策指令规则集和样本数据对模型进行离线训练,解决由于训练样本不足导致模型陷入局部极值点的问题,量化出能够精确逼近航天员行为动作的自主追踪航天器驾驶员先验模型。
在上述步骤(4)中建立追踪航天器自主行为决策模型的方法为:
a.在驾驶员先验模型的基础上,考虑到驾驶员先验模型在环的非线性动态系统具有连续的状态及动作空间,采用基于Actor-Critic结构的深度确定性策略梯度算法建立追踪航天器自主行为决策模型的推理机制;
b.针对非线性动态系统建立行为环境马尔可夫决策模型,基于驾驶员先验模型的研究结果确定模型的状态空间和动作空间,制定奖励函数,以累积航天器接收的环境奖赏反馈最大为原则形成评价机制;
c.开展多任务(不同交会对接状态下的任务)、多约束(安全控制区域约束、接近走廊和分离走廊约束、动力学约束等)的自主交会对接模拟实验,对自主行为决策模型进行更新迭代;
d.将自主行为决策程序迁移到交会对接全物理仿真系统中的追踪模拟器,通过开展相关实验利用实验结果对自主行为决策模型参数进一步更新迭代。
在上述步骤(5)中仿生式分层控制架构为:
a.将有限时间控制器植入自主行为决策框架,分别用于顶层决策和底层控制,采用手动操作模式作为备份解决自主航天器无法处理的交会对接操控问题,通过建立两者之间切换条件的数学表达,构建两种控制模式之间切换的触发条件及触发规则;
b.在分层控制架构中,规划层选择优先注意维度生成操作顺序,本能层根据操作顺序针对每一个维度确定执行偏差消除控制的时间以及输出量进而生成航天器运动轨迹,有限时间控制层控制航天器对生成的位姿轨迹进行跟踪;;
c.当出现安全裕度过低或自主交会对接无法进行的情况时,感受器的反馈信息将触发慎思层的反射触发规则模块,该模块立即通知规划层终止当前运动,由航天员手动操作完成交会对接。
综上所述,本发明综合考虑了航天员因素、航天器因素和环境因素之间的耦合关系,建立了平移靠拢段手控交会对接的人-机-环境耦合交互量化模型;用计算机模拟平移靠拢段手控交会对接中航天员操控流程表现出特定的行为规律,建立了自主追踪航天器驾驶员先验模型;设计仿生式分层控制架构实现追踪航天器自主行为决策与控制,并采用手动操作模式作为备份解决自主航天器无法处理的交会对接操控问题。本发明利用类脑思维思想,充分结合人控智能灵活和自控稳定可靠的双重优势,提高自主交会对接任务的效率和成功率。
以上所述仅为本发明的一个实施方式而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (2)
1.一种航天器平移靠拢段自主交会对接的决策与控制方法,其特征在于,包括以下步骤:
(1)建立面向优先注意维度决策的场景分类矩阵,研究平移靠拢段手控交会对接的人-机-环境耦合交互量化模型;
建立人-机-环境耦合交互量化模型的方法为:
a.获取影响手控交会对接中航天员操控行为的航天员因素:视野范围,航天器因素:执行器性能,环境因素/>:对接状态信息,提取可观测性尺寸、最大控制冲量、状态特征的关键参数;
b.确定人、机和环境各自的动态扰动:反应时间、操作频率,/>:航天器的软硬件故障、工作能耗,/>:相对运动参数变化,利用数学函数描述它们的耦合作用关系,确定三个因素之间的耦合扰动项集合/>,并确定偏差消除操控行为/>;
c.采用多变量非线性回归方法建立人-机-环境耦合交互量化模型:
;
(2)解析航天员、航天器、环境及动态联合扰动之间的关系,建立不同交会对接场景下的行为决策指令规则集;
建立行为决策指令规则集的方法为:构建统一的信息描述及处理方法,引入多物理约束条件包括安全控制区域和动力学约束,根据选择的操作顺序分别确定执行偏差消除控制的时间及输出量,建立不同交会对接场景下的行为决策指令规则集,为驾驶员先验模型的建立提供决策基础;
(3)基于深度神经网络方法建立能够提取航天员行为动作特性的深度学习模型,研究驾驶员先验模型的离线训练方法,建立自主追踪航天器驾驶员先验模型;
建立自主追踪航天器驾驶员先验模型的方法为:
a.根据之前对平移靠拢段手控交会对接人-机-环境耦合交互机理的研究结果,将航天员手控交会对接时的闭环操控流程定义为受自身、航天器和环境三方面因素综合影响的非线性动态系统,由此确定深度学习模型中输入层的输入值向量和输出层的神经元个数;
b.采用深度神经网络反向传播算法建立深度学习模型,确定总层数、各隐藏层神经元个数,并选用交叉熵损失函数和Sigmoid激活函数的组合提高算法收敛速度,提取能表征航天员感知、决策、操控的关键参数,包括姿态和平移感知阈值、用于决定加速或减速程度的安全范围阈值、单位偏移控制输出量;
c.利用驾驶模拟平台能提供逼真仿真环境和操作人员在环功能的特性,针对不同场景下的平移靠拢段手控交会对接任务开展半物理仿真实验,通过训练操作人员面向追踪航天器仿真模型的实际操控过程采集大量样本数据;
d.利用行为决策指令规则集和样本数据对模型进行离线训练,解决由于训练样本不足导致模型陷入局部极值点的问题,量化出能够精确逼近航天员行为动作的自主追踪航天器驾驶员先验模型;
(4)基于深度强化学习的训练方式,建立追踪航天器自主行为决策的泛化机制,通过交会对接全物理仿真实验更新迭代自主行为决策模型参数,建立追踪航天器自主行为决策模型;
建立追踪航天器自主行为决策模型的方法为:
a.在驾驶员先验模型的基础上,考虑到驾驶员先验模型在环的非线性动态系统具有连续的状态及动作空间,采用基于Actor-Critic结构的深度确定性策略梯度算法建立追踪航天器自主行为决策模型的推理机制;
b.针对非线性动态系统建立行为环境马尔可夫决策模型,基于驾驶员先验模型的研究结果确定模型的状态空间和动作空间,制定奖励函数,以累积航天器接收的环境奖赏反馈最大为原则形成评价机制;
c.开展多任务即不同交会对接状态下的任务,多约束包括安全控制区域约束、接近走廊和分离走廊约束和动力学约束的自主交会对接模拟实验,对自主行为决策模型进行更新迭代;
d.将自主行为决策程序迁移到交会对接全物理仿真系统中的追踪模拟器,通过开展相关实验利用实验结果对自主行为决策模型参数进一步更新迭代;
(5)研究包含顶层决策和底层控制的仿生式分层控制架构,实现追踪航天器自主行为决策与控制;
仿生式分层控制架构为:
a.将有限时间控制器植入自主行为决策框架,分别用于顶层决策和底层控制,采用手动操作模式作为备份解决自主航天器无法处理的交会对接操控问题,通过建立两者之间切换条件的数学表达,构建两种控制模式之间切换的触发条件及触发规则;
b.在分层控制架构中,规划层选择优先注意维度生成操作顺序,本能层根据操作顺序针对每一个维度确定执行偏差消除控制的时间以及输出量进而生成航天器运动轨迹,有限时间控制层控制航天器对生成的位姿轨迹进行跟踪;
c.当出现安全裕度过低或自主交会对接无法进行的情况时,感受器的反馈信息将触发慎思层的反射触发规则模块,该模块立即通知规划层终止当前运动,由航天员手动操作完成交会对接。
2.根据权利要求1所述的一种航天器平移靠拢段自主交会对接的决策与控制方法,其特征在于,所述平移靠拢段手控交会对接操控过程采用六自由度控制方式,交会对接决策的流程为:首先选择优先注意维度,然后根据选择的操作顺序分别确定执行偏差消除控制的时间及输出量。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011074168.9A CN112141369B (zh) | 2020-10-09 | 2020-10-09 | 一种航天器平移靠拢段自主交会对接的决策与控制方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011074168.9A CN112141369B (zh) | 2020-10-09 | 2020-10-09 | 一种航天器平移靠拢段自主交会对接的决策与控制方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112141369A CN112141369A (zh) | 2020-12-29 |
CN112141369B true CN112141369B (zh) | 2023-10-20 |
Family
ID=73952707
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011074168.9A Active CN112141369B (zh) | 2020-10-09 | 2020-10-09 | 一种航天器平移靠拢段自主交会对接的决策与控制方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112141369B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112455727B (zh) * | 2021-02-01 | 2021-04-20 | 北京航空航天大学 | 飞行器系统的布局方法、装置、可读存储介质及电子设备 |
CN112896558B (zh) * | 2021-03-19 | 2022-09-23 | 湖南工学院 | 一种基于多维度数据的手控交会对接人因失误识别方法 |
CN113916254A (zh) * | 2021-07-22 | 2022-01-11 | 北京控制工程研究所 | 一种停靠式抓捕的航天器自主交会对接试验方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105109711A (zh) * | 2015-06-19 | 2015-12-02 | 北京控制工程研究所 | 一种航天器交会对接仿真系统 |
CN106094565A (zh) * | 2016-06-13 | 2016-11-09 | 北京航空航天大学 | 一种航天器自主交会控制系统地面仿真试验方法 |
CN107792404A (zh) * | 2017-09-20 | 2018-03-13 | 北京控制工程研究所 | 一种交会对接平移靠拢段的安全带确定方法 |
CN108375904A (zh) * | 2018-02-28 | 2018-08-07 | 北京航空航天大学 | 一种非合作目标航天器交会对接最终段饱和控制方法 |
CN110262280A (zh) * | 2019-02-26 | 2019-09-20 | 北京控制工程研究所 | 航天器交会对接飞行控制智能数据分析与决策支持系统 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105974822B (zh) * | 2016-06-13 | 2019-02-22 | 北京航空航天大学 | 一种航天器自主绕飞交会控制系统地面验证装置的验证方法 |
-
2020
- 2020-10-09 CN CN202011074168.9A patent/CN112141369B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105109711A (zh) * | 2015-06-19 | 2015-12-02 | 北京控制工程研究所 | 一种航天器交会对接仿真系统 |
CN106094565A (zh) * | 2016-06-13 | 2016-11-09 | 北京航空航天大学 | 一种航天器自主交会控制系统地面仿真试验方法 |
CN107792404A (zh) * | 2017-09-20 | 2018-03-13 | 北京控制工程研究所 | 一种交会对接平移靠拢段的安全带确定方法 |
CN108375904A (zh) * | 2018-02-28 | 2018-08-07 | 北京航空航天大学 | 一种非合作目标航天器交会对接最终段饱和控制方法 |
CN110262280A (zh) * | 2019-02-26 | 2019-09-20 | 北京控制工程研究所 | 航天器交会对接飞行控制智能数据分析与决策支持系统 |
WO2020173020A1 (zh) * | 2019-02-26 | 2020-09-03 | 北京控制工程研究所 | 航天器交会对接飞行控制智能数据分析与决策支持系统 |
Non-Patent Citations (1)
Title |
---|
晁建刚 ; 徐晓静 ; .航天员交会对接模拟训练仿真关键技术研究.系统仿真学报.2013,(08),全文. * |
Also Published As
Publication number | Publication date |
---|---|
CN112141369A (zh) | 2020-12-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112141369B (zh) | 一种航天器平移靠拢段自主交会对接的决策与控制方法 | |
Yu et al. | Adaptive fuzzy trajectory tracking control of an under-actuated autonomous underwater vehicle subject to actuator saturation | |
WO2022012265A1 (en) | Robot learning from demonstration via meta-imitation learning | |
CN112162564B (zh) | 基于模仿学习和强化学习算法的无人机飞行控制方法 | |
Ferdaus et al. | Towards the use of fuzzy logic systems in rotary wing unmanned aerial vehicle: a review | |
Handelman et al. | Robotic skill acquisition based on biological principles | |
CN114169066A (zh) | 基于微纳星群抵近侦察的空间目标特性测量、侦察方法 | |
Wang et al. | A continuous actor-critic reinforcement learning approach to flocking with fixed-wing UAVs | |
Ma et al. | Target tracking control of UAV through deep reinforcement learning | |
Peng et al. | Model-based deep reinforcement learning for data-driven motion control of an under-actuated unmanned surface vehicle: Path following and trajectory tracking | |
Sammut | Automatic construction of reactive control systems using symbolic machine learning | |
Zareb et al. | Evolutionary autopilot design approach for UAV quadrotor by using GA | |
Sun et al. | A Fuzzy-Based Bio-Inspired Neural Network Approach for Target Search by Multiple Autonomous Underwater Vehicles in Underwater Environments. | |
Xu et al. | Algorithms and applications of intelligent swarm cooperative control: A comprehensive survey | |
Li et al. | Review on key technologies of space intelligent grasping robot | |
Li et al. | A warm-started trajectory planner for fixed-wing unmanned aerial vehicle formation | |
Jin et al. | Methods for blended shared control of hydraulic excavators with learning and prediction | |
Shukla et al. | Imitation learning for neural network autopilot in fixed-wing unmanned aerial systems | |
CN115289917B (zh) | 基于深度学习的火箭子级着陆实时最优制导方法及系统 | |
Mettler et al. | Receding horizon trajectory planning with an environment-based cost-to-go function | |
Obaid et al. | Obstacle avoidance in unmanned aerial vehicles using image segmentation and deep learning | |
Medeiros | Learn to Fly: Cloning the Behavior of a Pilot | |
King et al. | Design and simulation of a wide area search mission: an implementation of an autonomous systems reference architecture | |
Huang et al. | Integrated planning and control for formation reconfiguration of multiple spacecrafts: A predictive behavior control approach | |
Jiang et al. | Safely Learn to Fly Aircraft From Human: An Offline-Online Reinforcement Learning Strategy and Its Application to Aircraft Stall Recovery |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |