CN117093848A - 一种基于注意力机制的双层壁结构特征提取方法 - Google Patents
一种基于注意力机制的双层壁结构特征提取方法 Download PDFInfo
- Publication number
- CN117093848A CN117093848A CN202310891253.1A CN202310891253A CN117093848A CN 117093848 A CN117093848 A CN 117093848A CN 202310891253 A CN202310891253 A CN 202310891253A CN 117093848 A CN117093848 A CN 117093848A
- Authority
- CN
- China
- Prior art keywords
- matrix
- attention
- wall structure
- double
- fully
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000605 extraction Methods 0.000 title claims abstract description 22
- 230000007246 mechanism Effects 0.000 title claims abstract description 20
- 238000000034 method Methods 0.000 claims abstract description 21
- 239000011159 matrix material Substances 0.000 claims description 43
- 238000013528 artificial neural network Methods 0.000 claims description 18
- 238000005070 sampling Methods 0.000 claims description 6
- 230000011218 segmentation Effects 0.000 claims description 6
- 238000013507 mapping Methods 0.000 claims description 5
- 230000004913 activation Effects 0.000 claims description 3
- 238000010606 normalization Methods 0.000 claims description 3
- 239000007787 solid Substances 0.000 claims description 3
- 238000001816 cooling Methods 0.000 abstract description 7
- 238000013135 deep learning Methods 0.000 abstract description 6
- 238000013210 evaluation model Methods 0.000 abstract description 3
- 230000009286 beneficial effect Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000002485 combustion reaction Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 238000012938 design process Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000009413 insulation Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0499—Feedforward networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Computational Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Algebra (AREA)
- Databases & Information Systems (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Investigating Or Analyzing Materials Using Thermal Means (AREA)
Abstract
一种基于注意力机制的双层壁结构特征提取方法,涉及航空发动机冷却结构技术领域,解决现有基于深度学习方法的双层壁结构换热特性/强度性能快速评估模型在特征提取上的局限性,导致模型无法准预测等问题,该方法通过子区域切分模块将双层壁结构切分为若干个子区域,利用深度学习方法中的自注意力(self‑attention)机制,通过自注意力特征提取模块在所有子区域上做自注意力计算操作,最终获得全场信息特征张量。本发明方法能够有效地从双层壁结构单元全场信息中提取特征,利用该特征投入下游任务,如换热特性预测、强度性能预测,能够有效提升预测模型的预测精度和泛化性。
Description
技术领域
本发明涉及航空发动机冷却结构技术领域,具体涉及一种基于注意力机制的双层壁结构特征提取方法。
背景技术
航空发动机是决定飞机性能的重要武器装备,当前航空发动机朝着高推重比趋势发展。涡轮前温度是决定航空发动机推力的重要指标,通常而言,提升涡轮前温度能够有效提升发动机性能,但也会导致热端部件面临更加严峻的工作环境。双层壁结构是一种高效冷却结构,能够用于燃烧室、涡轮叶片等热端部件,相较于传统的冷却结构,能够有效提升涡轮前温度,有助于发动机推重比的增长。双层壁冷却结构通过在内外壁密集开孔引导冷气冲击外壁并形成气膜,在内外壁之间使用多个圆柱连接增大了换热面积,高效结合了冲击换热、圆肋对流换热、气膜隔热三种换热形式,因此具备较强的换热能力,但其复杂的结构也导致在设计过程对其性能的评估将耗费较多的资源。
随着人工智能等信息技术的快速发展,一些基于深度学习方法的双层壁结构换热特性/强度性能快速评估模型逐渐提出。对于基于深度学习方法的模型而言,特征提取是影响模型预测性能的重要步骤。现有模型的特征提取主要采用卷积的形式:利用卷积网络自动提取特征,将双层壁结构抽象为三维张量,利用二维卷积或三维卷积加池化操作提取特征。当前的特征提取方法主要存在的问题是:卷积操作的感受也取决于卷积核的大小,通常取3×3或者5×5的小卷积核,因此基于卷积的特征提取操作存在局部性,难以提取表征全场信息的特征。这导致在实际应用中,当双层壁结构全场信息发生变化时,模型无法准确地预测。现有技术采用的卷积操作虽对局部特征提取能力强,能够适用于计算机视觉等以图像为数据的领域,但是对于物理场信息而言,信息通常是连续的,局部信息不具备表征全场的能力,因此采用卷积提取的特征鲁棒性弱,基于该特征的深度学习模型无法有效泛化。
因此,一种能够有效提取双层壁结构全场特征的特征提取方法亟待提出。
发明内容
本发明为解决现有基于深度学习方法的双层壁结构换热特性/强度性能快速评估模型在特征提取上的局限性,导致模型无法准预测等问题,提供一种基于注意力机制的双层壁结构特征提取方法,该方法的优势主要体现在能够综合全场信息提取特征,使得特征更加明显,有利于预测性能的提升。
一种基于注意力机制的双层壁结构特征提取方法,该方法的实现过程为:
步骤一、将双层壁结构单元进行子区域切分,获得输入张量;
步骤二、基于自注意力机制的全场信息特征提取;
采用三个全连接神经网络,将步骤一获得的输入张量分别传入全连接神经网络,获得三个二维张量,分别定义为Q矩阵、K矩阵和V矩阵;
步骤三、将步骤二所述的Q矩阵、K矩阵和V矩阵进行计算,获得注意力矩阵,并将所述注意力矩阵经过归一化和全连接神经网络非线性映射后,重复步骤二和步骤三,最终的全场信息特征张量。
进一步地,该方法通过子区域切分模块和自注意力特征提取模块实现,所述子区域切分模块用于将双层壁结构切分为若干个子区域,获得输入张量;
所述自注意力特征提取模块采用全连接神经网络进行Q矩阵、K矩阵和V矩阵提取,获得注意力矩阵。
进一步地,步骤一中,将双层壁结构的固体域在长宽高三个维度上均匀截取Ph,Pw,Pd段,获得Ph×Pw×Pd个子区域切片,将子区域的总数定为N;每个子区域切片在二维均匀网格下采样,获得形状为C,H,W的三维向量,其中H为长度维度采样频率,W为宽度维度采样频率,C为节点存储的坐标信息和物理信息的总数;将表征子区域的三维向量转化为C,H×W的二维向量,所有的子区域表示为形状为N,C,H×W的三维张量,所述三维张量作为输入张量。
进一步地,步骤二中,定义三个全连接神经网络,mlp1,mlp2,mlp3,将输入张量传入全连接神经网络,获得三个N,H×W的二维张量。
进一步地,步骤三中,将Q矩阵、K矩阵和V矩阵按下公式计算,获得注意力矩阵;
式中,dk为输入张量第三维度的大小H×W,softmax()为激活函数;
所述注意力矩阵N,H×W,并将所述注意力矩阵进行归一化和全连接神经网络非线性映射后,重复步骤二和步骤三,获得最终的全场信息特征张量。
本发明的有益效果:
本发明所述的基于注意力机制的双层壁结构单元特征提取方法,利用深度学习方法中的自注意力(self-attention)机制,能够有效地从双层壁结构单元全场信息中提取特征,利用该特征投入下游任务,如换热特性预测、强度性能预测,能够有效提升预测模型的预测精度和泛化性。
附图说明
图1为本发明所述的一种基于注意力机制的双层壁结构特征提取方法中子区域切分模块示意图;
图2为自注意力特征提取模块示意图。
具体实施方式
结合图1和图2说明本实施方式,一种基于注意力机制的双层壁结构特征提取方法,该方法通过子区域切分模块将双层壁结构切分为若干个子区域,利用深度学习方法中的自注意力(self-attention)机制,通过自注意力特征提取模块在所有子区域上做自注意力计算操作,最终获得全场信息特征张量。具体过程为:
一、双层壁结构单元子区域切分;
采用子区域切分模块将双层壁结构的固体域在长宽高三个维度上均匀截取Ph,Pw,Pd段,得到Ph×Pw×Pd个子区域切片,将子区域的总数定为N。每个子区域切片在二维均匀网格下采样,得到形状如(C,H,W)的三维向量,其中H为长度维度采样频率,W为宽度维度采样频率,C为节点存储的坐标信息和物理信息的总数。将输入张量中表征子区域的三维向量展平为形状如(C,H×W)的二维向量,因此,所有的子区域可表示为形状如(N,C,H,W)的四维张量,该张量命名为输入张量。
二、基于自注意力机制的全场信息特征提取(基于自注意力机制的特征抽取器);
首先采用全连接神经网络进行quary、key、value矩阵提取。即:分别定义三个全连接神经网络mlp1,mlp2,mlp3,将所述四维张量展平后的输入张量(N,C,H×W)传入对应全连接神经网络,得到三个形如(N,H×W)的二维张量,分别称为Q(quary矩阵)、K(key矩阵)、V(value矩阵)。然后进行注意力矩阵计算;将quary、key、value矩阵按如下公式进行计算,得到注意力矩阵。
其中,dk是输入张量第三维度的大小H×W,softmax()是一种激活函数。
注意力矩阵的形状为(N,H×W)。将注意力矩阵进行归一化和全连接神经网络非线性映射后,将以上流程重复L次,得到最终的全场特征信息。将得到的特征作为下游任务的输入,如换热特性预测、强度性能预测等,能够有效提升预测模型的预测精度和泛化性。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围,因此,本发明专利的保护范围应以所附权利要求为准。
Claims (5)
1.一种基于注意力机制的双层壁结构特征提取方法,其特征是:该方法由以下步骤实现:
步骤一、将双层壁结构单元进行子区域切分,获得输入张量;
步骤二、基于自注意力机制的全场信息特征提取;
采用三个全连接神经网络,将步骤一获得的输入张量分别传入全连接神经网络,获得三个二维张量,分别定义为Q矩阵、K矩阵和V矩阵;
步骤三、将步骤二所述的Q矩阵、K矩阵和V矩阵进行计算,获得注意力矩阵,并将所述注意力矩阵经过归一化和全连接神经网络非线性映射后,重复步骤二和步骤三,最终的全场信息特征张量。
2.根据权利要求1所述的一种基于注意力机制的双层壁结构特征提取方法,其特征在于:该方法通过子区域切分模块和自注意力特征提取模块实现,所述子区域切分模块用于将双层壁结构切分为若干个子区域,获得输入张量;
所述自注意力特征提取模块采用全连接神经网络进行Q矩阵、K矩阵和V矩阵提取,获得注意力矩阵。
3.根据权利要求1所述的一种基于注意力机制的双层壁结构特征提取方法,其特征在于:步骤一中,将双层壁结构的固体域在长宽高三个维度上均匀截取Ph,Pw,Pd段,获得Ph×Pw×Pd个子区域切片,将子区域的总数定为N;每个子区域切片在二维均匀网格下采样,获得形状为C,H,W的三维向量,其中H为长度维度采样频率,W为宽度维度采样频率,C为节点存储的坐标信息和物理信息的总数;将表征子区域的三维向量转化为C,H×W的二维向量,所有的子区域表示为形状为N,C,H,W的四维张量,所述四维张量作为输入张量。
4.根据权利要求1所述的一种基于注意力机制的双层壁结构特征提取方法,其特征在于:步骤二中,定义三个全连接神经网络,mlp1,mlp2,mlp3,将输入张量展平为N,C,H×W的形式传入全连接神经网络,获得三个N,H×W的二维张量。
5.根据权利要求1所述的一种基于注意力机制的双层壁结构特征提取方法,其特征在于:步骤三中,将Q矩阵、K矩阵和V矩阵按下公式计算,获得注意力矩阵;
式中,dk为输入张量第三维度的大小H×W,softmax()为激活函数;
所述注意力矩阵N,H×W,并将所述注意力矩阵进行归一化和全连接神经网络非线性映射后,重复步骤二和步骤三,获得最终的全场信息特征张量。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310891253.1A CN117093848A (zh) | 2023-07-20 | 2023-07-20 | 一种基于注意力机制的双层壁结构特征提取方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310891253.1A CN117093848A (zh) | 2023-07-20 | 2023-07-20 | 一种基于注意力机制的双层壁结构特征提取方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117093848A true CN117093848A (zh) | 2023-11-21 |
Family
ID=88782601
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310891253.1A Pending CN117093848A (zh) | 2023-07-20 | 2023-07-20 | 一种基于注意力机制的双层壁结构特征提取方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117093848A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117808807A (zh) * | 2024-02-29 | 2024-04-02 | 中国人民解放军国防科技大学 | 光学卫星遥感图像实例级变化检测方法 |
-
2023
- 2023-07-20 CN CN202310891253.1A patent/CN117093848A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117808807A (zh) * | 2024-02-29 | 2024-04-02 | 中国人民解放军国防科技大学 | 光学卫星遥感图像实例级变化检测方法 |
CN117808807B (zh) * | 2024-02-29 | 2024-05-14 | 中国人民解放军国防科技大学 | 光学卫星遥感图像实例级变化检测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zuo et al. | Fast aerodynamics prediction of laminar airfoils based on deep attention network | |
CN108959778B (zh) | 一种基于退化模式一致性的航空发动机剩余寿命预测方法 | |
CN117093848A (zh) | 一种基于注意力机制的双层壁结构特征提取方法 | |
CN115203865B (zh) | 一种基于数字孪生的产品装配过程机械性能在线预测方法 | |
CN115694985B (zh) | 基于tmb的混合网络流量攻击预测方法 | |
Wang et al. | Data-driven methods for low-dimensional representation and state identification for the spatiotemporal structure of cavitation flow fields | |
CN114692488A (zh) | 一种超临界翼型的生成方法、装置、电子设备及存储介质 | |
CN117891005A (zh) | 基于微气象因素时间序列的导地线覆冰预测方法及系统 | |
CN115470726A (zh) | 一种基于深度学习的高超声速进气道流场快速预测方法 | |
He et al. | A new distributed echo state network integrated with an auto-encoder for dynamic soft sensing | |
Du et al. | Quasi-three-dimensional loss prediction model of subsonic compressor cascade based on bidirectional long short-term memory networks and multi-head self-attention | |
CN116227367B (zh) | 直接空冷系统的背压预测模型构建方法、预测方法及装置 | |
CN112541292A (zh) | 一种基于分布式光纤测温原理的海底电缆埋深估计算法 | |
CN115879034B (zh) | 基于机器学习的热带气旋强度监测方法、装置和设备 | |
CN112182026A (zh) | 一种考虑流形排序算法的电网截面数据检索方法 | |
CN116644561A (zh) | 一种燃气涡轮整级叶栅多尺度数值仿真方法 | |
CN117763933A (zh) | 基于深度学习的固体火箭发动机时间序列参数预测方法和预测系统 | |
Zheng et al. | Surge Fault Detection of Aeroengines Based on Fusion Neural Network. | |
Run-Yang et al. | BPNN anomaly data detection algorithm based on gray wolf algorithm to optimize K-means clustering | |
Xiao et al. | Research on the method of hyperspectral and image deep features for bacon classification | |
CN112632728A (zh) | 基于深度学习的透平机械叶型设计及性能预测方法 | |
Wang et al. | Research on Fault Detection and Diagnosis Method of Diesel Engine Air System Based on Deep Learning | |
CN111027626B (zh) | 基于可变形卷积网络的流场识别方法 | |
CN112610339B (zh) | 一种基于适量信息融合卷积神经网络的变循环发动机参数估计方法 | |
CN114169091B (zh) | 工程机械部件剩余寿命的预测模型建立方法及预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |