CN116051632B

CN116051632B - 一种双通道transformer卫星六自由度姿态估计算法

Info

Publication number: CN116051632B
Application number: CN202211612567.5A
Authority: CN
Inventors: 任元; 叶瑞达; 陈晓岑; 王煜晶; 王丽芬; 朱向阳; 吴昊; 张睿祺
Original assignee: Peoples Liberation Army Strategic Support Force Aerospace Engineering University
Current assignee: Peoples Liberation Army Strategic Support Force Aerospace Engineering University
Priority date: 2022-12-06
Filing date: 2022-12-14
Publication date: 2023-12-05
Anticipated expiration: 2042-12-14
Also published as: CN116051632A

Abstract

一种双通道transformer卫星六自由度姿态估计算法。所述算法流程包括：卫星图像数据预处理模块，通过EfficientNet主干网络提取图像特征，并随机选取主干网络层中的特征分别输入至双通道transformer位姿推理网络，经过位姿优化联合损失函数计算模型输出与标签损失距离，并反向传播给模型进行迭代训练。针对预测信息特点设计了一种四元数熵激活函数，将旋转量transformer模块输出的四元数信息进行归一化，有效提升了旋转量推理精度。设计了一种位姿优化联合损失函数，通过调节优化因子平衡旋转量和平移量误差值，从而提升模型的训练效果。该算法解决了空间非合作目标位姿估计中探测流程繁琐、效率低等问题，为在轨探测提供了一种智能算法。

Description

一种双通道transformer卫星六自由度姿态估计算法

技术领域

本发明涉及目标探测领域，特别涉及一种双通道transformer卫星六自由度姿态估计算法。

背景技术

非合作目标位姿估计是航天领域亟需解决的难题，其在导航、太空垃圾清理、交会对接和在轨维修等方面都具有极具重要的应用价值。针对在轨工作的特殊环境，基于低质量、低功耗单目相机的姿态估计算法为空间应用提供一种切实可行的方案，受到了国内外科研机构和研究人员的广泛关注，其中部分科研机构针对单目视觉相机非合作目标位姿估计展开了相关研究和半物理仿真实验。与单目相机相比，激光雷达和深度相机的作用范围小、体积大、功耗高，且在使用时更受制于复杂的空间环境。因此，使用单目相机拍摄的数据更符合非合作目标位姿估计。

随着transformer模型在语音识别领域使用，受到了工业界和学术界的广泛关注，该模型在自然语言处理、语音识别等时序信息特征中获得巨大的成功。其核心组件自注意力机制具备强大的特征提取和时序关联能力，即融合了卷积神经网络和循环神经网络的优点。随后在计算机视觉领域，以vision transformer和DETR为首的transformer模型在图像识别和目标检测等视觉领域取得了优异的成绩。

公开号CN 114842078A的发明专利公开了“一种基于深度学习的双通道卫星姿态估计网络”，使用了ResNet作为特征提取主干网络，使用了两种不同的网络进行位姿回归，但在旋转量推理中未对四元数推理值进行归一化，其推理精度较低。授权公开号CN109931925B的发明专利公开了“基于序列图像轴线的空间翻滚卫星自旋姿态优化估计方法”，通过采集序列二维卫星图像，提取序列二维卫星图像轴线，确定卫星姿态信息，该方法过程繁琐、识别效率低。

发明内容

(一)发明目的

本发明的目的是提供通过一种双通道transformer卫星六自由度姿态估计算法。本发明通过使用深度学习智能方法，提出了一种双通道transformer卫星六自由度姿态估计算法，首先使用EfficientNet主干网络提取图像特征，并随机选取主干网络层中的特征分别输入至双通道transformer位姿推理网络，经过位姿优化联合损失函数计算模型输出与标签损失距离，并反向传播给模型进行迭代训练，有效解耦了卫星姿态的平移量和旋转量，成功解决了基于单目视觉的空间非合作目标位姿估计中探测流程繁琐、效率低等问题。

(二)技术方案

本发明的技术解决方案，一种双通道transformer卫星六自由度姿态估计算法，其特征在于，包括：卫星图像数据预处理模块，通过EfficientNet主干网络提取图像特征，并随机选取主干网络层中的特征分别输入至双通道transformer位姿推理网络，经过位姿优化联合损失函数计算模型输出与标签损失距离，并反向传播给模型进行迭代训练，该方法的由如下步骤构成。

卫星图像数据预处理模块，卫星图像需要进行相关预处理，使得卫星图像能够按照指定尺寸输入至EfficientNet主干网络中，同时可根据数据集特点进行相关数据增强，如随机亮度、对比度调整和模糊等处理手段。

经过预处理后的图像数据，输入至EfficientNet主干网络中，其输入尺寸为224*224*3的特征图，使用32个3*3*3、步长为2*2的卷积层，经过归一化和Swish激活函数处理后得到112*112*32的特征图，在经过初步处理后，特征进入16个不同的MBConv层，最后输出大小为7*7*1280的特征图。并随机选取主干网络层中的特征分别输入至双通道transformer位姿推理网络。

双通道transformer位姿推理网络包括：平移量transformer和旋转量transformer；其中旋转量transformer主要由多个transformer组件、展平层和含四个神经元的全连接层组成，神经元使用四元数熵激活函数，平移量transformer主要由多个transformer组件、展平层和含三个神经元的全连接层组成。经过EfficientNet主干网络提取的特征经过双通道transformer位姿推理网络后，会分别输出3个值和4个值，分别对应卫星姿态的平移量旋转量，其中，在旋转量transformer中，使用的四元数熵激活函数，主要解决卫星姿态的旋转量[q₀,q₁,q₂,q₃]受q₀ ²+q₁ ²+q₂ ²+q₃ ²＝1约束的问题，其表达式为：

该激活函数输出四个值，输出结果符合卫星姿态旋转信息的特点。

位姿优化联合损失函数计算模型输出与标签损失距离，通过调节优化因子平衡旋转量和平移量误差值，提升模型的训练效果，其中平移量损失函数为，

L_t＝||t_gt-t_est||₂ (2)L_t为平移量损失距离，旋转量损失函数，

L_q＝||q_gt-q_est||₂ (3)

L_q为旋转量损失距离，位姿优化联合损失函数，

L_loss＝L_texp(-s_t)+L_qexp(-s_q) (4)

其中，L_q为位姿联合损失距离，t_gt和q_gt是真实标签，t_est和q_est是模型推理值，s_t和s_q是优化因子，用来调节平移量损失函数和旋转量损失函数比重系数，计算出的损失值反向传播给模型进行迭代训练。

本发明实现了一种双通道transformer卫星六自由度姿态估计算法，提出一种双通道transformer网络，成功解耦了卫星姿态的旋转量和平移量。针对预测信息特点设计了一种四元数熵激活函数，将旋转量transformer模块输出的四元数信息进行归一化，有效提升了旋转量推理精度。设计了一种位姿优化联合损失函数，通过调节优化因子平衡旋转量和平移量误差值，从而提升模型的训练效果。

(三)本发明的主要优点

本发明的上述技术方案具有如下优点：本发明被用于卫星六自由度姿态估计，提出了一种双通道transformer网络，可以有效解耦卫星姿态的旋转量和平移量。针对预测信息特点设计了一种四元数熵激活函数，将旋转量transformer模块输出的四元数信息进行归一化，有效提升了旋转量推理精度。

附图说明

图1是本发明的流程框架图；

图2是本发明实施例EfficientNet主干网络结构图。

具体实施方式

为使本发明的技术方案、优点和目的更加清楚明了，结合具体实例说明了方法流程并参照附图，对本发明的技术方案进一步说明。

本发明实施例1，一种双通道transformer卫星六自由度姿态估计算法，参见图1，按下述步骤进行：

使用欧空局提供的公开数据集SPEED，该数据集的训练集中有12000张合成图像，测试集有2998张合成图像，并提供了5张带标签的真实图像，图像尺寸大小为1920×1200像素。该数据集通过半物理仿平台拍摄“Tango”卫星模型，通过后处理技术剔除相关背景，并在部分图像中随机添加地球背景，丰富数据集信息，提供数据集的可靠性和鲁棒性。

对SPEED中的卫星图像数据进行预处理，使用随机亮度进行卫星图像数据增强，并将图片处理成224*224*3的尺寸。

经过预处理后的图像数据，输入至EfficientNet主干网络中，其输入尺寸为224*224*3的特征图，使用32个3*3*3、步长为2*2的卷积层，经过归一化和Swish激活函数处理后得到112*112*32的特征图，在经过初步处理后，特征进入16个不同的MBConv层，最后输出大小为7*7*1280的特征图，其结构如图2所示。

随机选取EfficientNet主干网络的特征图，分别输入至平移量transformer和旋转量transformer中。在旋转量transformer中，使用M个transformer组件，通过transformer的特征经过展平层生成512*1的特征，随后进入由四个神经元组成的全连接层，该全连接层的神经元使用四元数熵激活函数，其公式为：

在平移量transformer中，使用N个transformer组件，通过transformer的特征经过展平层生成512*1的特征，随后进入由三个神经元组成的全连接层，可通过调试M和N得到最优模型。

由平移量transformer输入的三个值，使用公式，

L_t＝||t_gt-t_est||₂ (2)

得到平移量损失值L_t，由旋转量transformer输入的四个值，使用公式，

L_q＝||q_gt-q_est||₂ (3)

得到旋转量损失值L_q，使用位姿优化联合损失函数，

L_loss＝L_texp(-s_t)+L_qexp(-s_q) (4)

计算模型输出值和标签损失距离L_loss，并反向传播给模型进行的迭代训练。

针对卫星姿态估计结果，欧空局提供了相关评价指标，其中旋转量的评分标准E_R为旋转向量误差的夹角：

E_R＝2arccos(|<q_est,q_gt>|) (5)

平移量的评分指标E_T为估计值与真值误差的L2范数归一化值，

使用E_R和E_T作为旋转量和平移量评分指标。

进行消融实验，按照3≤N≤9、3≤M≤9的完成实验，通过对比实验结果选取最优transformer组件数量。

本发明说明书中未作详细描述的内容属于本领域专业技术人员公知的现有技术。

Claims

1.一种双通道transformer卫星六自由度姿态估计方法，其特征在于，包括：卫星图像数据预处理模块，通过EfficientNet主干网络提取图像特征，并随机选取主干网络层中的特征分别输入至双通道transformer位姿推理网络，经过位姿优化联合损失函数计算模型输出与标签损失距离，并反向传播给模型进行迭代训练，该方法的步骤包括如下：

(1)卫星图像数据预处理：

卫星图像需要进行相关预处理，使得卫星图像能够按照指定尺寸输入至EfficientNet主干网络中，同时根据数据集特点进行数据增强，包括随机亮度、对比度调整和模糊处理手段；

(2)EfficientNet主干网络：

输入尺寸为224*224*3的特征图，使用32个3*3*3、步长为2*2的卷积层，经过归一化和Swish激活函数处理后得到112*112*32的特征图，在经过初步处理后，特征进入16个不同的MBConv层，最后输出大小为7*7*1280的特征图；

(3)双通道transformer位姿推理网络：

双通道transformer位姿推理网络包括：平移量transformer和旋转量transformer；其中旋转量transformer由多个transformer组件、展平层和含四个神经元的全连接层组成，神经元使用四元数熵激活函数，平移量transformer由多个transformer组件、展平层和含三个神经元的全连接层组成；

(4)位姿优化联合损失函数：

该损失函数由平移量损失函数和旋转量损失函数组成，然后由学习参数控制两个损失函数的平衡，其中平移量损失函数为，

L_t＝||t_gt-t_est||₂ (1)

L_t为平移量损失距离，旋转量损失函数，

L_q＝||q_gt-q_est||₂ (2)

L_q为旋转量损失距离，位姿优化联合损失函数，

L_loss＝L_texp(-s_t)+L_qexp(-s_q) (3)

其中，L_loss为位姿优化联合损失距离，t_gt和q_gt是真实标签，t_est和q_est是模型推理值，s_t和s_q是优化因子，用来调节平移量损失函数和旋转量损失函数比重系数，计算出的损失值反向传播给模型进行迭代训练；

双通道transformer位姿推理网络中的四元数熵激活函数，针对卫星姿态的旋转量四元数[q₀,q₁,q₂,q₃]受q₀ ²+q₁ ²+q₂ ²+q₃ ²＝1的约束，设计了一种四元数熵激活函数，其表达式为：