CN117520950B - 基于注意力知识共享网络的多目标uav故障诊断方法 - Google Patents
基于注意力知识共享网络的多目标uav故障诊断方法 Download PDFInfo
- Publication number
- CN117520950B CN117520950B CN202410011767.8A CN202410011767A CN117520950B CN 117520950 B CN117520950 B CN 117520950B CN 202410011767 A CN202410011767 A CN 202410011767A CN 117520950 B CN117520950 B CN 117520950B
- Authority
- CN
- China
- Prior art keywords
- network
- task
- fli
- fault
- fti
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 75
- 238000003745 diagnosis Methods 0.000 title claims abstract description 48
- 238000005457 optimization Methods 0.000 claims description 21
- 230000006870 function Effects 0.000 claims description 15
- 230000015654 memory Effects 0.000 claims description 8
- 230000003044 adaptive effect Effects 0.000 claims description 6
- 238000011176 pooling Methods 0.000 claims description 6
- 230000009466 transformation Effects 0.000 claims description 4
- 238000000605 extraction Methods 0.000 claims description 3
- 230000008569 process Effects 0.000 description 19
- 230000000052 comparative effect Effects 0.000 description 17
- 238000002474 experimental method Methods 0.000 description 15
- 238000004364 calculation method Methods 0.000 description 9
- 238000012549 training Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000012935 Averaging Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000011084 recovery Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000006403 short-term memory Effects 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- -1 alkyl ketene Chemical compound 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000001808 coupling effect Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000007787 long-term memory Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
- G06N3/0442—Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biophysics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Probability & Statistics with Applications (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Evolutionary Biology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及无人机故障诊断技术领域,公开了一种基于注意力知识共享网络的多目标UAV故障诊断方法,包括以下步骤:步骤1,采集无人机飞行数据;步骤2,搭建AKSN网络以用于进行故障诊断;AKSN网络为基于注意力的知识共享网络;AKSN网络包括用于学习的全局特征的任务共享网络、用于完成UAV故障类型识别任务的FTI任务特制网络和用于完成故障程度识别任务的FLI任务特制网络;FTI任务特制网络和FLI任务特制网络通过任务共享网络共享特征信息;并且,FTI任务特制网络和FLI任务特制网络中均设有SE注意力模块;步骤3,由AKSN网络输出故障诊断结果。本发明能够在小样本条件下,并行完成UAV故障类型识别任务和故障程度识别任务,获取更加全面的故障信息且诊断精准。
Description
技术领域
本发明涉及无人机故障诊断技术领域,具体涉及一种基于注意力知识共享网络的多目标UAV故障诊断方法。
背景技术
随着无人机技术的不断发展和应用领域的拓展,全球无人机市场规模持续增长。在军事领域,无人机被广泛应用于侦察、监视、打击等多种任务;在民用领域,无人机被广泛应用于农业、环保、救援等领域;在商业领域,无人机被广泛应用于快递、测绘、影视制作等多种行业。与此同时,无人机的体积和重量也在不断变小以适应更广的应用场景,无人机也变得更加智能,自动避障、自动跟踪目标等智能化功能都开始普及。
在上述应用环境下,无人机在飞行过程中,容易受到复杂多变的环境因素的影响,从而导致无人机的故障频发,致使无人机无法正常飞行甚至发生坠毁事故,因此,对无人机的故障检测技术就显得尤为重要,是保障无人机正常、安全飞行的基本前提。
而在实际工程中的无人机故障诊断则往往是一个典型的小样本多目标问题。由于无人机运行环境复杂、任务多样,故障数据积累相对较少。这使得在故障诊断过程中缺乏足够的样本数据进行学习和分析,限制了故障诊断的准确性和可靠性。
发明内容
本发明意在提供一种基于注意力知识共享网络的多目标UAV故障诊断方法,能够在小样本条件下,并行完成UAV故障类型识别任务和故障程度识别任务,故障诊断全面且精准。
本发明提供的基础方案为:基于注意力知识共享网络的多目标UAV故障诊断方法,包括以下步骤:
步骤1,采集无人机飞行数据;
步骤2,搭建AKSN网络以用于进行故障诊断;所述AKSN网络为基于注意力的知识共享网络;所述AKSN网络包括用于学习的全局特征的任务共享网络、用于完成UAV故障类型识别任务的FTI任务特制网络和用于完成故障程度识别任务的FLI任务特制网络;所述FTI任务特制网络和FLI任务特制网络通过任务共享网络共享特征信息;并且,所述FTI任务特制网络和FLI任务特制网络中均设有SE注意力模块,所述SE注意力模块用于从任务共享网络中自主选择相对重要的特征信息;
步骤3,由AKSN网络输出故障诊断结果;其中,在AKSN网络的FTI任务特制网络和FLI任务特制网络中均设有全连接层和输出层,由FTI任务特制网络和FLI任务特制网络的输出层分别输出故障类型和故障程度;
FTI任务特制网络在输出故障类型时,其输出层按照下述步骤输出:
FC2(Relu/>;
其中,是输出层的输入,/>是预测为故障类型1的概率,/>是预测为故障类型2的概率,/>是预测为故障类型N的概率;FC1、FC2是全连接层计算操作,/>、/>分别是全连接层FC1和全连接层FC2的权重矩阵;
=argmax/>;
其中,则是argmax函数输出的对应概率最大的故障类型,即为FTI任务特制网络识别的故障类型结果;
FLI任务特制网络在输出故障程度时,其输出层按照下述步骤输出:
FC2(Relu/>;
其中,是输出层的输入,/>是预测故障程度为1的概率,/>是预测故障程度为2的概率,/>是预测故障程度为N的概率;FC1、FC2是全连接层计算操作,/>、/>分别是全连接层FC1和全连接层FC2的权重矩阵;
=argmax/>;
其中,则是argmax函数输出的对应概率最大的故障程度,即为FLI任务特制网络识别的故障程度结果。
本发明的工作原理及优点在于:
本发明提供的基于注意力知识共享网络的多目标UAV故障诊断方法,提出了一种特别的基于注意力知识共享网络,即AKSN网络。其中设置的任务共享网络可以学习所有任务共享的知识,并将其存储在全局特征中。其中设置的FTI任务特制网络和FLI任务特制网络能够并行处理UAV故障类型识别任务和故障程度识别任务。通过任务共享网络共享特征信息,FTI任务特制网络和FLI任务特制网络可以在有限的训练数据下学习和共享FTI任务(UAV故障类型识别任务)和FLI任务(故障程度识别任务)所需的知识,进而在小样本下获取足够的故障诊断知识,有助于达到较高的故障诊断精准度。
并且,在FTI任务特制网络和FLI任务特制网络中均设有SE注意力模块,该模块能够利用注意力权值计算来增强模型在通道信息上的表现能力。面对每个任务,采用一组注意力模块来选择共享网络中的有用知识来提高网络处理不同任务的性能。相比于直接从全局特征中进行学习,该方法能有效减少网络的冗余学习。通过SE注意力模块自动确定共享特征的重要性,并为各自的任务选择有用的知识,每个任务特制网络都能够从任务共享网络中提取包含FTI任务和FLI任务的知识来提高网络模型对每个任务的处理能力,达到更优的故障诊断效果。
附图说明
图1为本发明基于注意力知识共享网络的多目标UAV故障诊断方法实施例的AKSN网络框架图;
图2为本发明基于注意力知识共享网络的多目标UAV故障诊断方法实施例的SE注意力模块结构示意图;
图3为本发明基于注意力知识共享网络的多目标UAV故障诊断方法实施例的AKSN网络框架细节图;
图4为本发明基于注意力知识共享网络的多目标UAV故障诊断方法实施例的实验(1)结果图;
图5为本发明基于注意力知识共享网络的多目标UAV故障诊断方法实施例的优化过程中,DWA算法有效性对比实验的Loss变化过程可视化图;
图6为本发明基于注意力知识共享网络的多目标UAV故障诊断方法实施例的优化过程中,DWA算法有效性对比实验中,本方案的和/>随训练的变化过程图。
具体实施方式
下面通过具体实施方式进一步详细的说明:
实施例基本如附图1所示:基于注意力知识共享网络的多目标UAV故障诊断方法,包括以下步骤:
步骤1,采集无人机飞行数据。
所述无人机飞行数据中反映了无人机的位置、速度、姿态、高度、航向、飞行时间等。本实施例中选取的无人机飞行数据为固定翼无人机飞行数据,其中包含的参数有、/>、/>、/>、/>、/>、/>、/>、/>、/>、/>和/>,其中,/>是空速,/>是偏航角,/>是俯仰角,/>是滚转角,/>、/>和为x、y、z三个方向的线性加速度,/>、/>和/>为x、y、z三个方向的角速率,/>和/>是自动驾驶仪的控制指令。通过精选参数数据,能够有效节省计算资源,提升数据处理效率。
在本步骤中,还对无人机飞行数据进行预处理。所述预处理包括:通过线性插值将所有的参数的采样率统一变为10Hz,使得所有参数的采样点对齐。同时,对所有参数进行归一化处理以使所有参数具有相同的量级,避免单一参数的影响占比过高。
步骤2,搭建AKSN网络以用于进行故障诊断。
如附图3所示,所述AKSN网络为基于注意力的知识共享网络;所述AKSN网络包括用于学习的全局特征的任务共享网络、用于完成UAV故障类型识别任务的FTI任务特制网络和用于完成故障程度识别任务的FLI任务特制网络。
所述FTI任务特制网络和FLI任务特制网络通过任务共享网络共享特征信息;并且,所述FTI任务特制网络和FLI任务特制网络中均设有SE注意力模块,所述SE注意力模块用于从任务共享网络中自主选择相对重要的特征信息。
所述SE注意力模块在自主选择任务共享网络中相对重要的特征信息时,首先对输入数据的每个通道的特征图进行全局池化操作,再按照预设的权重比例对各个通道的输出结果进行加权求和并得到求和总值,再通过非线性变换将求和总值作为最终的输出结果。并且,所述SE注意力模块中设有两个全连接层,以用于学习每个通道的注意力权重。
具体地,本实施例中,上述过程可以看作分为两个步骤:Squeeze(全局信息嵌入)和Excitation(自适应重新校正)。其中Squeeze阶段对每个通道做一次全局平均池化,将通道维度压缩为一个标量。Excitation阶段则对每个通道的特征图做一次非线性变换,使得模型更加关注重要的通道信息。具体操作如下:
首先,在Squeeze步骤中,通过全局平均池化操作,将输入特征图降维为一个长度为C的向量/>。这个步骤可以看作是对每个通道进行全局信息聚合,也就是对于每个通道信息都只有一个数值,如下式所示:
………………式(1);
其中,为Squeeze过程,也就是全局平均池化的过程;H、W、C分别表示特征图的高度、宽度和通道数;z表示通过全局平均池化获取的低维向量。
其次,在Excitation步骤中,采用了两个全连接层进行压缩和恢复,在压缩和恢复的过程中插入了Relu函数来进行非线性变换,以便更好地学习每个通道的注意力权重;最后将输出用Sigmoid激活函数处理,最终得到注意力权重;表达式如下:
………………式(2);
其中,()表示Excitation过程,即为自适应校正过程;FC1、FC2是全连接层计算操作,/>、/>分别是全连接层FC1和全连接层FC2的权重矩阵;/>和Relu分别代表进行和Relu计算。
最后,将得到的注意力权重s作用到输入数据的特征图上,得到经过SE注意力模块加权的特征图Y。经过加权的过程其实就是将输入特征图中的每个通道与对应的注意力权重/>相乘,并求和得到加权特征图Y:
………………式(3);
其中,⊙表示按元素相乘;按照上述步骤,SE注意力模块即可完成对输入特征图的加权处理。
所述FTI任务特制网络和FLI任务特制网络通过任务共享网络共享三次特征信息。
具体地,任务共享网络中设有长短期记忆网络(LSTM层)。FTI任务特制网络和FLI任务特制网络中均设有长短期记忆网络(LSTM层)、ReLU层、全连接层和输出层。
其中,长短期记忆网络可以学习和捕捉序列数据中的时间关系,从而提取有关时间信息的特征。ReLU层用于引入非线性关系,通过ReLU层能够增加网络的表达能力,从而更好地学习和表示复杂的空间特征。
具体地,在AKSN网络中,FTI任务特制网络和FLI任务特制网络具有相同的输入样本,但具有不同的任务标签/>和/>,且输入AKSN网络的数据样本(数据集)定义如下:;其中,i表示第i个样本。
具体应用中,首先,输入AKSN网络的数据样本会先被馈送到任务共享网络中进行特征提取,如下:
…………式(4);
其中,和/>分别是前一时刻的隐藏状态和当前时刻的输入数据,W、V、b为模型的参数,下标i、f、o和c分别代表属于输入门、遗忘门、输出门和存储单元的参数;/>为sigmoid函数;t为时间点,/>、/>和/>分别是t时间点的输入门、遗忘门和输出门。⊙是元素的乘积,/>为t时间点的存储单元。/>为长短期记忆网络t时间点的输出。
其次,将提取到的特征分别送入任务共享网络的下一个长短期记忆网络、FTI任务特制网络和FLI任务特制网络中,如图3所示。在FTI任务特制网络和FLI任务特制网络中,通过网络中的SE注意力模块选择各自任务重要的特征,参照式(1)-(3)完成。同时,在FTI任务特制网络和FLI任务特制网络中再次根据式(4)进行特征提取,获取特征。
最后,任务共享网络的下一个长短期记忆网络获取的特征与特制网络获取的特征/>相加,如式:/>,其中,X表示融合后的特征。
如此,一共经过了三次知识共享后进入FTI任务特制网络和FLI任务特制网络的全连接层进行故障识别,以保证充分共享特征信息,有助于达到更高的故障识别精准度。
此外,在此步骤中,还对AKSN网络进行优化,且采用端到端的反向传播优化方式进行优化。此处采用端到端的学习方式,不需要额外的干预,能够使网络能够更灵活的适应多种故障诊断目标组合,同时允许为每个单独的任务目标定制与众不同的特征。
并且,在进行优化时,使用DWA算法(即动态权重平均算法)设定FTI任务特制网络和FLI任务特制网络的自适应优化强度。
具体地,所述DWA算法的计算方式如下:
;
;
其中,计算的是(0, +∞)范围内的相对下降率,t是迭代Epoch,T表示控制任务权重软度的温度。如果T足够大,则有/>≈1,此时FTI任务和FLI任务等权,即FTI任务特制网络的UAV故障类型识别任务和FLI任务特制网络的故障程度识别任务等权。
本实施例中,T设为2。且,Softmax算子保证=K。由于本实施例中有两个任务(UAV故障类型识别任务和故障程度识别任务),故将K设为2。
基于上述计算方式,可计算得到FTI任务特制网络和FLI任务特制网络的自适应优化强度和/>。
在进行优化时,AKSN网络中,设定的总损失函数为:
;
其中,和/>分别为FTI任务特制网络和FLI任务特制网络的自适应优化强度;/>和分别为FTI任务特制网络和FLI任务特制网络的交叉熵目标函数。
;/>;
其中,N表示样本总数,k表示第k个样本,为真实的故障类型,/>为FTI任务特制网络预测的故障类型;/>为真实的故障程度,/>为FLI任务特制网络预测的故障程度。
步骤3,由AKSN网络输出故障诊断结果。
具体地,通过步骤2获取了优化完成的AKSN网络,在本步骤中,将AKSN网络直接装载在无人机中来诊断无人机的实时状态。
在此步骤中,无人机飞行的实时数据通过步骤1设定的处理程序(即预处理)后输入到AKSN网络中,由FTI任务特制网络和FLI任务特制网络的输出层分别输出故障类型和故障程度。输出层如附图3的最高层所示,由2层全连接层和ReLU层组成;其中,ReLU层能够增强输出层的非线性关系和稳定性。
具体地,FTI任务特制网络在输出故障类型时,其输出层按照下述步骤输出:
FC2(Relu/>;
其中,是输出层的输入,/>是预测为故障类型1的概率,/>是预测为故障类型2的概率,/>是预测为故障类型N的概率;FC1、FC2是全连接层计算操作,/>、/>分别是全连接层FC1和全连接层FC2的权重矩阵;
=argmax/>;
其中,则是argmax函数输出的对应概率最大的故障类型,即为FTI任务特制网络识别的故障类型结果。例如,当/>输出的对应概率最大的故障类型为/>,则指FTI任务特制网络识别得到的故障类型为故障类型2。
FLI任务特制网络在输出故障程度时,其输出层按照下述步骤输出:
FC2(Relu/>;
其中,是输出层的输入,/>是预测故障程度为1的概率,/>是预测故障程度为2的概率,/>是预测故障程度为N的概率;FC1、FC2是全连接层计算操作,/>、/>分别是全连接层FC1和全连接层FC2的权重矩阵;
=argmax/>;
其中,则是argmax函数输出的对应概率最大的故障程度,即为FLI任务特制网络识别的故障程度结果。例如,当/>输出的对应概率最大的故障程度为/>,则指FLI任务特制网络识别得到的故障程度为2。
本实施例提供的一种基于注意力知识共享网络的多目标UAV故障诊断方法,能够在小样本条件下,并行完成UAV故障类型识别任务和故障程度识别任务,故障诊断全面且精准。
特别的是,第一,本方案提出了一种特别的基于注意力知识共享网络,即AKSN网络,能够并行高效地完成多个识别任务。第二,本方案所构建的网络采用了端到端的学习方式,不需要额外的干预,网络模型能够灵活地适应多种故障诊断目标组合,同时允许为每个单独的任务目标定制与众不同的特征。在模型的优化过程中,引入DWA算法来自适应调整FTI任务和FLI任务的优化强度,能够保证任务之间的优化强度保持平衡。
此处引入数个对比例对本方案中所特设的AKSN网络的作用效果进行比对说明。
本方案:基于注意力知识共享网络(AKSN网络)的多目标UAV故障诊断方法;
对比例1:WDCNN方法;该方法为一般的单任务深度学习方法,其具有第一次层宽核。
对比例2:HSMTL方法;该方法为一种硬共享的多任务学习方法,其FTI和FLI任务共同使用相同的底层网络。
对比例3:SHNN方法;该方法为一种专门用于小样本下FW-UAV故障诊断的元学习方法(单任务学习)。它基于孪生网络,采用了串联的CNN+LSTM结构,旨在捕获无人机飞行数据中的时空特征。
对比例4:ASN方法;该方法为一种专门用于小样本下FW-UAV故障诊断的元学习方法(单任务学习)。它基于孪生网络,采用了注意力机制来消除多变量之间的耦合效应。
对比例5:NDDR-CNN方法;该方法为一种先进的多任务学习方法,通过堆叠来自不同任务的特征,并使用1*1卷积和批次标准化进行判别式降维来实现共享。
对比例6:Cross-stitch方法;该方法为一种先进的多任务学习方法,用于自适应加权不同任务的特征融合。
需要说明的是:(1)本文所有的实验均重复5次并取平均值。(2)所有单任务学习的方法分别对FTI和FLI任务单独训练,多任务学习方法联合训练。
实验(1):采用同一组小样本,分别采用上述方法进行无人机故障诊断实验,并将所有的实验均重复进行5次并取平均。具体地,本实验中采用的样本为自现有的7月21号和23号的飞行数据中随机抽取的80个样本,以模拟小样本的设置。其中,80个样本的70%用于训练模型,剩下的30%用于验证模型,并保持最优的模型参数。
在上述样本中的无人机故障信息如表1所示。
表 1 无人机故障信息
实验结果分析如下:
如图4所示,展示了上述各方法在小样本下的实验结果,以准确率作为衡量指标。由图可知,本方案在所有任务中的准确率最好,说明其在有限样本的故障任务中可以很好地共享两个任务之间的知识以获得强大故障分析能力和诊断能力。并且,与如对比例1、对比例3之类的单任务学习案例相比,本方案所采用的多任务学习的方法可以在有限样本下通过共享相关任务中的公共信息,使模型捕获到更多知识,可以更好地处理故障诊断任务。同时,多任务学习可以处理多个故障任务,提供不同角度的故障情况,以便决策者全面地理解,具有良好的应用潜力。
此外,相较于如对比例2、对比例5、对比例6的多任务案例,本方案所采用的共享机制则更为细致且更具针对性,能够利用任务共享网络的多级共享,配合以特定的SE注意力单元实现有用信息的细致捕捉与共享,保证双任务通道均取得最大化的收益。
此处还引入数个有效性对比实验对本方案中AKSN网络的各板块的作用效果进行比对说明。
SE注意力模块有效性对比实验:本方案,有SE注意力模块的AKSN网络。对比例a,去掉SE注意力模块后的AKSN网络。
同样采用实验(1)中的样本数据进行实验,以准确率作为衡量指标,实验结果如表2所示。
表2 验证注意力模块有效性的实验结果
从表2中可知,本方案相对于对比例a,在各项任务上的性能均有提升,准确率较高;具体而言,在7月21日的FTI任务和FLI任务中分别提升了2.72%和2.94%,而在7月23日的FTI任务和FLI任务中分别提升0.50%和10.24%。这些实验结果有力证明了注意力模块的有效性。本方案通过特设的SE注意力模块能够利用注意力权值计算来增强模型在通道信息上的表现能力,能有效减少网络的冗余学习,充分发挥FTI任务特制网络和FLI任务特制网络的任务识别性能。
优化过程中,DWA算法有效性对比实验:本方案,优化过程中采用了DWA算法的AKSN网络。对比例b,优化过程中未采用DWA算法的AKSN网络,且损失函数的权重=/>=1。
同样采用实验(1)中的样本数据进行实验,以准确率作为衡量指标,实验结果如表3所示。
表 3 验证DWA有效性的实验结果
从表3中可知,本方案相对于对比例b,本方案在所有任务中都具有更好的精度,尤其在7月21日的FLI任务中,AKSN比AKSN_无DWA高出了10.36%。结果证明,本方案中的DWA算法设置可以使模型在同时学习多个任务时具有更好的学习能力。
进一步地,如图5所示,展示了本方案和对比例b在训练过程中的Loss变化过程的可视化图形。以及,如图6所示,展示了本方案的和/>随训练的变化过程。通过图5及图6的比对可发现,本方案中的网络模型具有更快速、更稳定的收敛能力,进一步展示了本方案中所设置的DWA算法可以使模型更好地学习两个任务,可保证任务之间的优化强度保持平衡,使得两个任务都能够达到较高的准确率。
以上所述的仅是本发明的实施例,方案中公知的具体结构及特性等常识在此未作过多描述,所属领域普通技术人员知晓申请日或者优先权日之前发明所属技术领域所有的普通技术知识,能够获知该领域中所有的现有技术,并且具有应用该日期之前常规实验手段的能力,所属领域普通技术人员可以在本申请给出的启示下,结合自身能力完善并实施本方案,一些典型的公知结构或者公知方法不应当成为所属领域普通技术人员实施本申请的障碍。应当指出,对于本领域的技术人员来说,在不脱离本发明结构的前提下,还可以作出若干变形和改进,这些也应该视为本发明的保护范围,这些都不会影响本发明实施的效果和专利的实用性。
Claims (8)
1.基于注意力知识共享网络的多目标UAV故障诊断方法,其特征在于,包括以下步骤:
步骤1,采集无人机飞行数据;
步骤2,搭建AKSN网络以用于进行故障诊断;所述AKSN网络为基于注意力的知识共享网络;所述AKSN网络包括用于学习的全局特征的任务共享网络、用于完成UAV故障类型识别任务的FTI任务特制网络和用于完成故障程度识别任务的FLI任务特制网络;所述FTI任务特制网络和FLI任务特制网络通过任务共享网络共享特征信息;并且,所述FTI任务特制网络和FLI任务特制网络中均设有SE注意力模块,所述SE注意力模块用于从任务共享网络中自主选择相对重要的特征信息;
任务共享网络、FTI任务特制网络和FLI任务特制网络中均设有长短期记忆网络,且在FTI任务特制网络和FLI任务特制网络中,所述SE注意力模块设于长短期记忆网络之前;
步骤3,由AKSN网络输出故障诊断结果;其中,在AKSN网络的FTI任务特制网络和FLI任务特制网络中均设有全连接层和输出层,由FTI任务特制网络和FLI任务特制网络的输出层分别输出故障类型和故障程度;
FTI任务特制网络在输出故障类型时,其输出层按照下述步骤输出:
FC2(Relu/>;
其中,是输出层的输入,/>是预测为故障类型1的概率,/>是预测为故障类型2的概率,/>是预测为故障类型N的概率;FC1、FC2是全连接层计算操作,、/>分别是全连接层FC1和全连接层FC2的权重矩阵;
=argmax/>;
其中,则是argmax函数输出的对应概率最大的故障类型,即为FTI任务特制网络识别的故障类型结果;
FLI任务特制网络在输出故障程度时,其输出层按照下述步骤输出:
FC2(Relu/>;
其中,是输出层的输入,/>是预测故障程度为1的概率,/>是预测故障程度为2的概率,/>是预测故障程度为N的概率;FC1、FC2是全连接层计算操作,、/>分别是全连接层FC1和全连接层FC2的权重矩阵;
=argmax/>;
其中,则是argmax函数输出的对应概率最大的故障程度,即为FLI任务特制网络识别的故障程度结果;
在步骤3中,首先,输入AKSN网络的数据样本会先被馈送到任务共享网络中进行特征提取;其次,将提取到的特征分别送入任务共享网络的下一个长短期记忆网络、FTI任务特制网络和FLI任务特制网络中。
2.根据权利要求1所述的基于注意力知识共享网络的多目标UAV故障诊断方法,其特征在于,所述SE注意力模块在从任务共享网络中自主选择相对重要的特征信息时,首先对输入数据的每个通道的特征图进行全局池化操作,再按照预设的权重比例对各个通道的输出结果进行加权求和并得到求和总值,再通过非线性变换将求和总值作为最终的输出结果。
3.根据权利要求2所述的基于注意力知识共享网络的多目标UAV故障诊断方法,其特征在于,所述SE注意力模块中设有两个全连接层,以用于学习每个通道的注意力权重。
4.根据权利要求1所述的基于注意力知识共享网络的多目标UAV故障诊断方法,其特征在于,所述FTI任务特制网络和FLI任务特制网络通过任务共享网络共享三次特征信息。
5.根据权利要求1所述的基于注意力知识共享网络的多目标UAV故障诊断方法,其特征在于,在步骤2中,还对AKSN网络进行优化,且采用端到端的反向传播优化方式进行优化。
6.根据权利要求5所述的基于注意力知识共享网络的多目标UAV故障诊断方法,其特征在于,在进行优化时,使用DWA算法设定FTI任务特制网络和FLI任务特制网络的自适应优化强度。
7.根据权利要求6所述的基于注意力知识共享网络的多目标UAV故障诊断方法,其特征在于,在进行优化时,AKSN网络中,设定的总损失函数为:
;
其中,和/>分别为FTI任务特制网络和FLI任务特制网络的自适应优化强度;/>和分别为FTI任务特制网络和FLI任务特制网络的交叉熵目标函数。
8.根据权利要求7所述的基于注意力知识共享网络的多目标UAV故障诊断方法,其特征在于,;/>;
其中,N表示样本总数,k表示第k个样本,为真实的故障类型,/>为FTI任务特制网络预测的故障类型;/>为真实的故障程度,/>为FLI任务特制网络预测的故障程度。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410011767.8A CN117520950B (zh) | 2024-01-04 | 2024-01-04 | 基于注意力知识共享网络的多目标uav故障诊断方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410011767.8A CN117520950B (zh) | 2024-01-04 | 2024-01-04 | 基于注意力知识共享网络的多目标uav故障诊断方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117520950A CN117520950A (zh) | 2024-02-06 |
CN117520950B true CN117520950B (zh) | 2024-03-19 |
Family
ID=89755260
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410011767.8A Active CN117520950B (zh) | 2024-01-04 | 2024-01-04 | 基于注意力知识共享网络的多目标uav故障诊断方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117520950B (zh) |
Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110361176A (zh) * | 2019-06-05 | 2019-10-22 | 华南理工大学 | 一种基于多任务特征共享神经网络的智能故障诊断方法 |
CN113191215A (zh) * | 2021-04-12 | 2021-07-30 | 西安理工大学 | 融合注意力机制与孪生网络结构的滚动轴承故障诊断方法 |
CN113962251A (zh) * | 2021-09-14 | 2022-01-21 | 中国兵器工业信息中心 | 一种无人机的故障检测方法、装置、电子设备及存储介质 |
CN114714146A (zh) * | 2022-04-08 | 2022-07-08 | 北京理工大学 | 一种同时预测表面粗糙度和刀具磨损的方法 |
CN114925724A (zh) * | 2022-05-07 | 2022-08-19 | 南京航空航天大学 | 一种机械设备故障诊断方法、装置及存储介质 |
CN115077594A (zh) * | 2022-08-09 | 2022-09-20 | 南京航空航天大学 | 基于lstm和近邻信任机制的蜂群无人机故障检测方法 |
CN115204302A (zh) * | 2022-07-22 | 2022-10-18 | 贵州大学 | 一种无人机小样本故障诊断系统及方法 |
CN115444428A (zh) * | 2022-09-01 | 2022-12-09 | 广西师范大学 | 多导联心电图正异常分类方法、系统、介质、设备及终端 |
CN116186520A (zh) * | 2023-03-10 | 2023-05-30 | 沈阳建筑大学 | 一种多任务联合的高压隔离开关故障诊断方法 |
CN116403032A (zh) * | 2023-03-27 | 2023-07-07 | 河北工业大学 | 基于多域信息融合与深度学习的断路器故障评估方法 |
CN116486166A (zh) * | 2023-04-27 | 2023-07-25 | 国网湖北省电力有限公司云梦县供电公司 | 一种基于边缘计算的输电线异物识别检测方法 |
CN116502135A (zh) * | 2023-03-20 | 2023-07-28 | 北京建筑大学 | 一种轴承故障诊断方法及系统 |
CN116754231A (zh) * | 2023-05-04 | 2023-09-15 | 安徽工业大学 | 一种基于RegNet-SES的快速诊断滚动轴承故障方法 |
CN117216522A (zh) * | 2023-09-15 | 2023-12-12 | 江南大学 | 一种基于机器学习的轴承故障类别诊断方法、装置及设备 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20230351177A1 (en) * | 2022-04-29 | 2023-11-02 | University Of South Carolina | Enhanced discriminate feature learning deep residual cnn for multi-task rotating machinery fault diagnosis with information fusion |
-
2024
- 2024-01-04 CN CN202410011767.8A patent/CN117520950B/zh active Active
Patent Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110361176A (zh) * | 2019-06-05 | 2019-10-22 | 华南理工大学 | 一种基于多任务特征共享神经网络的智能故障诊断方法 |
CN113191215A (zh) * | 2021-04-12 | 2021-07-30 | 西安理工大学 | 融合注意力机制与孪生网络结构的滚动轴承故障诊断方法 |
CN113962251A (zh) * | 2021-09-14 | 2022-01-21 | 中国兵器工业信息中心 | 一种无人机的故障检测方法、装置、电子设备及存储介质 |
CN114714146A (zh) * | 2022-04-08 | 2022-07-08 | 北京理工大学 | 一种同时预测表面粗糙度和刀具磨损的方法 |
CN114925724A (zh) * | 2022-05-07 | 2022-08-19 | 南京航空航天大学 | 一种机械设备故障诊断方法、装置及存储介质 |
CN115204302A (zh) * | 2022-07-22 | 2022-10-18 | 贵州大学 | 一种无人机小样本故障诊断系统及方法 |
CN115077594A (zh) * | 2022-08-09 | 2022-09-20 | 南京航空航天大学 | 基于lstm和近邻信任机制的蜂群无人机故障检测方法 |
CN115444428A (zh) * | 2022-09-01 | 2022-12-09 | 广西师范大学 | 多导联心电图正异常分类方法、系统、介质、设备及终端 |
CN116186520A (zh) * | 2023-03-10 | 2023-05-30 | 沈阳建筑大学 | 一种多任务联合的高压隔离开关故障诊断方法 |
CN116502135A (zh) * | 2023-03-20 | 2023-07-28 | 北京建筑大学 | 一种轴承故障诊断方法及系统 |
CN116403032A (zh) * | 2023-03-27 | 2023-07-07 | 河北工业大学 | 基于多域信息融合与深度学习的断路器故障评估方法 |
CN116486166A (zh) * | 2023-04-27 | 2023-07-25 | 国网湖北省电力有限公司云梦县供电公司 | 一种基于边缘计算的输电线异物识别检测方法 |
CN116754231A (zh) * | 2023-05-04 | 2023-09-15 | 安徽工业大学 | 一种基于RegNet-SES的快速诊断滚动轴承故障方法 |
CN117216522A (zh) * | 2023-09-15 | 2023-12-12 | 江南大学 | 一种基于机器学习的轴承故障类别诊断方法、装置及设备 |
Non-Patent Citations (5)
Title |
---|
A novel fault diagnosis method based on CNN and LSTM and its application in fault diagnosis for complex systems;Ting Huang等;《Artificial Intelligence Review》;20210402;第1289-1315页 * |
Fault detection and diagnosis using two‑stage attention‑based variational LSTM in electrolytic copper manufacturing process;Jaejin Yoo等;《The International Journal of Advanced Manufacturing Technology》;20230927;第1269-1288页 * |
基于GRU 和改进注意力机制的多信息融合的EMA 故障诊断方法;彭朝琴等;《北京航空航天大学学报》;20231025;第1-17页 * |
基于LSTM-GAN 的无人机飞行数据异常检测算法;王凤芹等;《中国惯性技术学报》;20220430;第30卷(第2期);第264-271页 * |
基于LSTM的轴承故障诊断方法研究;赵敬娇;《中国优秀硕士学位论文全文数据库 工程科技II辑》;20220815(第(2022)08期);C029-69第4.1.3、4.2.1节 * |
Also Published As
Publication number | Publication date |
---|---|
CN117520950A (zh) | 2024-02-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112256056B (zh) | 基于多智能体深度强化学习的无人机控制方法及系统 | |
CN111667513B (zh) | 一种基于ddpg迁移学习的无人机机动目标跟踪方法 | |
CN112465151A (zh) | 一种基于深度强化学习的多智能体联邦协作方法 | |
CN110222406B (zh) | 一种基于任务阶段复杂性的无人机自主能力评估方法 | |
CN109884897A (zh) | 一种基于深度强化学习的无人机任务匹配与计算迁移方法 | |
CN108320051B (zh) | 一种基于gru网络模型的移动机器人动态避碰规划方法 | |
CN113110546B (zh) | 一种基于离线强化学习的无人机自主飞行控制方法 | |
CN115993781B (zh) | 抗网络攻击无人集群系统协同控制方法、终端及存储介质 | |
CN111445498A (zh) | 一种采用Bi-LSTM神经网络的目标跟踪方法 | |
CN113625569B (zh) | 一种基于混合决策模型的小型无人机防控决策方法及系统 | |
CN116401756A (zh) | 基于深度学习与数据增强的固体火箭发动机性能预测方法、预测系统、存储介质和设备 | |
CN112272074A (zh) | 一种基于神经网络的信息传输速率控制方法及系统 | |
CN111625457A (zh) | 基于改进的dqn算法的虚拟自动驾驶测试优化方法 | |
CN109375642B (zh) | 一种无人机节能控制方法 | |
CN117520950B (zh) | 基于注意力知识共享网络的多目标uav故障诊断方法 | |
US11977383B2 (en) | Intelligent course planning method and controller for unmanned surface vehicle | |
CN113561995A (zh) | 一种基于多维奖励架构深度q学习的自动驾驶决策方法 | |
Gomez et al. | Flight controller optimization of unmanned aerial vehicles using a particle swarm algorithm | |
CN115630566A (zh) | 一种基于深度学习和动力约束的资料同化方法和系统 | |
Khaleghi et al. | Analysis of uav/ugv control strategies in a dddams-based surveillance system | |
CN111562740B (zh) | 基于利用梯度的多目标强化学习算法的自动控制方法 | |
CN114859704A (zh) | 一种针对四旋翼无人机姿态的强化学习优化控制方法 | |
CN117349712B (zh) | 基于时空特征自适应共享网络的无人机故障诊断方法 | |
CN114495036A (zh) | 一种基于三阶段注意力机制的车辆轨迹预测方法 | |
Hao et al. | Flight Trajectory Prediction Using an Enhanced CNN-LSTM Network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |