CN117093848A

CN117093848A - 一种基于注意力机制的双层壁结构特征提取方法

Info

Publication number: CN117093848A
Application number: CN202310891253.1A
Authority: CN
Inventors: 黄俊杰; 邱璐; 程泽源; 王燕嘉; 童自翔; 朱剑琴
Original assignee: Beihang University
Current assignee: Beihang University
Priority date: 2023-07-20
Filing date: 2023-07-20
Publication date: 2023-11-21

Abstract

一种基于注意力机制的双层壁结构特征提取方法，涉及航空发动机冷却结构技术领域，解决现有基于深度学习方法的双层壁结构换热特性/强度性能快速评估模型在特征提取上的局限性，导致模型无法准预测等问题，该方法通过子区域切分模块将双层壁结构切分为若干个子区域，利用深度学习方法中的自注意力(self‑attention)机制，通过自注意力特征提取模块在所有子区域上做自注意力计算操作，最终获得全场信息特征张量。本发明方法能够有效地从双层壁结构单元全场信息中提取特征，利用该特征投入下游任务，如换热特性预测、强度性能预测，能够有效提升预测模型的预测精度和泛化性。

Description

一种基于注意力机制的双层壁结构特征提取方法

技术领域

本发明涉及航空发动机冷却结构技术领域，具体涉及一种基于注意力机制的双层壁结构特征提取方法。

背景技术

航空发动机是决定飞机性能的重要武器装备，当前航空发动机朝着高推重比趋势发展。涡轮前温度是决定航空发动机推力的重要指标，通常而言，提升涡轮前温度能够有效提升发动机性能，但也会导致热端部件面临更加严峻的工作环境。双层壁结构是一种高效冷却结构，能够用于燃烧室、涡轮叶片等热端部件，相较于传统的冷却结构，能够有效提升涡轮前温度，有助于发动机推重比的增长。双层壁冷却结构通过在内外壁密集开孔引导冷气冲击外壁并形成气膜，在内外壁之间使用多个圆柱连接增大了换热面积，高效结合了冲击换热、圆肋对流换热、气膜隔热三种换热形式，因此具备较强的换热能力，但其复杂的结构也导致在设计过程对其性能的评估将耗费较多的资源。

随着人工智能等信息技术的快速发展，一些基于深度学习方法的双层壁结构换热特性/强度性能快速评估模型逐渐提出。对于基于深度学习方法的模型而言，特征提取是影响模型预测性能的重要步骤。现有模型的特征提取主要采用卷积的形式：利用卷积网络自动提取特征，将双层壁结构抽象为三维张量，利用二维卷积或三维卷积加池化操作提取特征。当前的特征提取方法主要存在的问题是：卷积操作的感受也取决于卷积核的大小，通常取3×3或者5×5的小卷积核，因此基于卷积的特征提取操作存在局部性，难以提取表征全场信息的特征。这导致在实际应用中，当双层壁结构全场信息发生变化时，模型无法准确地预测。现有技术采用的卷积操作虽对局部特征提取能力强，能够适用于计算机视觉等以图像为数据的领域，但是对于物理场信息而言，信息通常是连续的，局部信息不具备表征全场的能力，因此采用卷积提取的特征鲁棒性弱，基于该特征的深度学习模型无法有效泛化。

因此，一种能够有效提取双层壁结构全场特征的特征提取方法亟待提出。

发明内容

本发明为解决现有基于深度学习方法的双层壁结构换热特性/强度性能快速评估模型在特征提取上的局限性，导致模型无法准预测等问题，提供一种基于注意力机制的双层壁结构特征提取方法，该方法的优势主要体现在能够综合全场信息提取特征，使得特征更加明显，有利于预测性能的提升。

一种基于注意力机制的双层壁结构特征提取方法，该方法的实现过程为：

步骤一、将双层壁结构单元进行子区域切分，获得输入张量；

步骤二、基于自注意力机制的全场信息特征提取；

采用三个全连接神经网络，将步骤一获得的输入张量分别传入全连接神经网络，获得三个二维张量，分别定义为Q矩阵、K矩阵和V矩阵；

步骤三、将步骤二所述的Q矩阵、K矩阵和V矩阵进行计算，获得注意力矩阵，并将所述注意力矩阵经过归一化和全连接神经网络非线性映射后，重复步骤二和步骤三，最终的全场信息特征张量。

进一步地，该方法通过子区域切分模块和自注意力特征提取模块实现，所述子区域切分模块用于将双层壁结构切分为若干个子区域，获得输入张量；

所述自注意力特征提取模块采用全连接神经网络进行Q矩阵、K矩阵和V矩阵提取，获得注意力矩阵。

进一步地，步骤一中，将双层壁结构的固体域在长宽高三个维度上均匀截取P_h,P_w,P_d段，获得P_h×P_w×P_d个子区域切片，将子区域的总数定为N；每个子区域切片在二维均匀网格下采样，获得形状为C,H,W的三维向量，其中H为长度维度采样频率，W为宽度维度采样频率，C为节点存储的坐标信息和物理信息的总数；将表征子区域的三维向量转化为C,H×W的二维向量，所有的子区域表示为形状为N,C,H×W的三维张量，所述三维张量作为输入张量。

进一步地，步骤二中，定义三个全连接神经网络，mlp1，mlp2，mlp3，将输入张量传入全连接神经网络，获得三个N,H×W的二维张量。

进一步地，步骤三中，将Q矩阵、K矩阵和V矩阵按下公式计算，获得注意力矩阵；

式中，d_k为输入张量第三维度的大小H×W，softmax()为激活函数；

所述注意力矩阵N,H×W，并将所述注意力矩阵进行归一化和全连接神经网络非线性映射后，重复步骤二和步骤三，获得最终的全场信息特征张量。

本发明的有益效果：

本发明所述的基于注意力机制的双层壁结构单元特征提取方法，利用深度学习方法中的自注意力(self-attention)机制，能够有效地从双层壁结构单元全场信息中提取特征，利用该特征投入下游任务，如换热特性预测、强度性能预测，能够有效提升预测模型的预测精度和泛化性。

附图说明

图1为本发明所述的一种基于注意力机制的双层壁结构特征提取方法中子区域切分模块示意图；

图2为自注意力特征提取模块示意图。

具体实施方式

结合图1和图2说明本实施方式，一种基于注意力机制的双层壁结构特征提取方法，该方法通过子区域切分模块将双层壁结构切分为若干个子区域，利用深度学习方法中的自注意力(self-attention)机制，通过自注意力特征提取模块在所有子区域上做自注意力计算操作，最终获得全场信息特征张量。具体过程为：

一、双层壁结构单元子区域切分；

采用子区域切分模块将双层壁结构的固体域在长宽高三个维度上均匀截取P_h,P_w,P_d段，得到P_h×P_w×P_d个子区域切片，将子区域的总数定为N。每个子区域切片在二维均匀网格下采样，得到形状如(C,H,W)的三维向量，其中H为长度维度采样频率，W为宽度维度采样频率，C为节点存储的坐标信息和物理信息的总数。将输入张量中表征子区域的三维向量展平为形状如(C,H×W)的二维向量，因此，所有的子区域可表示为形状如(N,C,H,W)的四维张量，该张量命名为输入张量。

二、基于自注意力机制的全场信息特征提取(基于自注意力机制的特征抽取器)；

首先采用全连接神经网络进行quary、key、value矩阵提取。即：分别定义三个全连接神经网络mlp1，mlp2，mlp3，将所述四维张量展平后的输入张量(N,C,H×W)传入对应全连接神经网络，得到三个形如(N,H×W)的二维张量，分别称为Q(quary矩阵)、K(key矩阵)、V(value矩阵)。然后进行注意力矩阵计算；将quary、key、value矩阵按如下公式进行计算，得到注意力矩阵。

其中，d_k是输入张量第三维度的大小H×W，softmax()是一种激活函数。

注意力矩阵的形状为(N,H×W)。将注意力矩阵进行归一化和全连接神经网络非线性映射后，将以上流程重复L次，得到最终的全场特征信息。将得到的特征作为下游任务的输入，如换热特性预测、强度性能预测等，能够有效提升预测模型的预测精度和泛化性。

以上所述实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本发明的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干变形和改进，这些都属于本发明的保护范围，因此，本发明专利的保护范围应以所附权利要求为准。

Claims

1.一种基于注意力机制的双层壁结构特征提取方法，其特征是：该方法由以下步骤实现：

步骤二、基于自注意力机制的全场信息特征提取；

2.根据权利要求1所述的一种基于注意力机制的双层壁结构特征提取方法，其特征在于：该方法通过子区域切分模块和自注意力特征提取模块实现，所述子区域切分模块用于将双层壁结构切分为若干个子区域，获得输入张量；

3.根据权利要求1所述的一种基于注意力机制的双层壁结构特征提取方法，其特征在于：步骤一中，将双层壁结构的固体域在长宽高三个维度上均匀截取P_h,P_w,P_d段，获得P_h×P_w×P_d个子区域切片，将子区域的总数定为N；每个子区域切片在二维均匀网格下采样，获得形状为C,H,W的三维向量，其中H为长度维度采样频率，W为宽度维度采样频率，C为节点存储的坐标信息和物理信息的总数；将表征子区域的三维向量转化为C,H×W的二维向量，所有的子区域表示为形状为N,C,H,W的四维张量，所述四维张量作为输入张量。

4.根据权利要求1所述的一种基于注意力机制的双层壁结构特征提取方法，其特征在于：步骤二中，定义三个全连接神经网络，mlp1，mlp2，mlp3，将输入张量展平为N,C,H×W的形式传入全连接神经网络，获得三个N,H×W的二维张量。

5.根据权利要求1所述的一种基于注意力机制的双层壁结构特征提取方法，其特征在于：步骤三中，将Q矩阵、K矩阵和V矩阵按下公式计算，获得注意力矩阵；