CN117711430A - 一种基于音频信号和视觉Transformer的电机转子故障诊断方法 - Google Patents

一种基于音频信号和视觉Transformer的电机转子故障诊断方法 Download PDF

Info

Publication number
CN117711430A
CN117711430A CN202311527995.2A CN202311527995A CN117711430A CN 117711430 A CN117711430 A CN 117711430A CN 202311527995 A CN202311527995 A CN 202311527995A CN 117711430 A CN117711430 A CN 117711430A
Authority
CN
China
Prior art keywords
motor
audio
fault diagnosis
audio signals
rotor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311527995.2A
Other languages
English (en)
Inventor
杜博超
李涛泳
黄琬
程远
崔淑梅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhengzhou Research Institute Of Harbin Institute Of Technology
Harbin Institute of Technology
Original Assignee
Zhengzhou Research Institute Of Harbin Institute Of Technology
Harbin Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhengzhou Research Institute Of Harbin Institute Of Technology, Harbin Institute of Technology filed Critical Zhengzhou Research Institute Of Harbin Institute Of Technology
Priority to CN202311527995.2A priority Critical patent/CN117711430A/zh
Publication of CN117711430A publication Critical patent/CN117711430A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Testing Of Devices, Machine Parts, Or Other Structures Thereof (AREA)

Abstract

本发明是一种基于音频信号和视觉Transformer的电机转子故障诊断方法。本发明涉及电机故障诊断技术领域,本发明采集电机、永磁体退磁电机和转子动态偏心电机的不同转速和负载工况运行过程中的音频信号;对采集到的音频信号进行预处理,得到电机当前状态的音频特征;建立转子故障诊断模型训练;根据音频特征,输入至转子故障诊断模型,对电机转子故障进行诊断。

Description

一种基于音频信号和视觉Transformer的电机转子故障诊断 方法
技术领域
本发明涉及电机故障诊断技术领域,是一种基于音频信号和视觉Transformer的电机转子故障诊断方法。
背景技术
永磁同步电动机由于其超高的效率、功率密度和转矩密度,已成为许多工业领域的动力核心。然而,机器经常在复杂的环境中运行,转子经常受到电、磁、热、机械等独特的应力耦合效应,因此其可靠性受到了严峻的挑战。永磁体退磁故障和转子偏心故障是永磁同步电机转子最常见的两种故障,因此准确诊断永磁退磁故障和转子偏心故障对确保安全、提高系统效率和减少损耗具有重要意义。
传统的电机转子故障诊断方法主要有三类方法。第一种方法是基于电机模型的方法,它需要建立电机在不同故障下的数学方程,然后推导出隐藏在电压电流与振动噪音等信号中的故障特征。另一种方法称为电机电流/电压特征分析,它是基于电机电流或电压信号的谐波成分对电机状态进行识别,但往往受到电机极槽配合的影响,且难以准确区分退磁故障与转子偏心故障。第三种是基于振动信号人工智能分类的方法,即通过机器学习等模型对振动信号中隐藏的故障信息进行提取,此类方法往往需要通常需要专门的仪器和设备来采集和分析信号,这增加了设备的成本和使用门槛,侵入性传感器同时会对被测电机产生额外的影响,这些方法也不便于实时监测早期发现故障。
在视觉神经网络领域,卷积神经网络(CNN)因其自身固有的一系列优良特性已得到了广泛应用。然而CNN也存在一些缺陷:1、CNN中的卷积操作(convolution operation)只能捕获局部信息(local information),而不能建立全局图像的长距离连接(long-distance connections)。2、平移不变性。3、池化层的存在会导致许多非常有价值的信息的丢失,同时也会忽略掉整体与部分之间的关联。而视觉Transformer模型的发展已经撼动了CNN的统治地位。通过借鉴CNN中一些优秀的架构设计(金字塔结构、归纳偏置和残差连接等)和训练策略(知识蒸馏),视觉Transformer模型已经在图像分类、目标检测、语义分割等下游任务(downstream tasks)中取得了卓越的性能。
此研究通常先使用麦克风对电机发出的音频信号进行采集,将采集的音频信号传给单片机或笔记本电脑等设备,通过这些平台计算主要的音频特征指标,然后进一步判断故障是否发生。据调查,电机发生故障的电磁噪声和机械噪声特征频率通常不会超过5000Hz,人耳的听觉范围在20-20000Hz,所以使用采集语音信号的麦克风便可满足条件。数字信号分析系统的选择要求具备集成度高,计算能力较强,功耗低,实时性高,抗干扰能力强,系统稳定等特点,通常为计算机和FPGA等平台。
发明内容
本发明通过对故障特征音频进行特征提取实现可视化,通过视觉Transformer的自注意力机制,可以捕捉到物体之间的相对位置信息,能产生对图像理解有利的可解释性结果,通过使用Vision Transformer架构并结合蒸馏技术在保持较高性能的同时减少了模型的参数数量。最终实现转子永磁体退磁和转子偏心故障的智能故障诊断。因此,本发明提供一种基于音频信号和视觉Transformer的电机转子故障诊断方法。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
本发明提供了一种基于音频信号和视觉Transformer的电机转子故障诊断方法,本发明提供了以下技术方案:
一种基于音频信号和视觉Transformer的电机转子故障诊断方法,所述方法包括:
步骤1:采集电机、永磁体退磁电机和转子动态偏心电机的不同转速和负载工况运行过程中的音频信号;
步骤2:对采集到的音频信号进行预处理,得到电机当前状态的音频特征;
步骤3:建立转子故障诊断模型训练;
步骤4:根据步骤2的音频特征,输入至转子故障诊断模型,对电机转子故障进行诊断。
优选地,所述步骤1具体为:
通过INMP441麦克风,对音频信号进行双声道采集后经模数转换、滤波器输入到FPGA中,得到电机、永磁体退磁电机和转子动态偏心电机的不同转速和负载工况运行过程中的音频信号。
优选地,所述步骤2预处理过程包括:
步骤2.1:使用小波阈值去噪对音频信号进行去噪,分解层数为5时去噪后信号的信噪比最高;
选择sym6作为电机音频信号的小波基函数;
阈值通过下式表示:
其中,Ti、σi分别为第i层小波系数的阈值、标准方差,N为样本数;
采用音频信号处理中的硬阈值函数。
优选地,所述步骤2预处理过程还包括:
步骤2.2:计算去噪后的音频信号的梅尔频率倒谱系数MFCC,包括分帧、预处理、离散傅立叶变换DFT、Mel带通滤波、离散余弦变换DCT;物理频率与Mel频率之间关系下式:
Mel(f)=2595×lg(1+f/700)
对噪声信号进行分帧,预处理:加窗、预加重,加窗时使用hamming窗;
对预处理后的每帧信号作离散傅立叶变换,设预处理后的时域信号为S(n),DFT变换后的频域信号S(k)可表示为下式:
求S(k)的平方,得到能量谱,再使用M个Mel带通滤波器进行滤波,第m个滤波器的传递函数为:
其中,f(m)为三角滤波器中心频率,且:
计算每个滤波器组的对数能量,第m个滤波器组的对数能量为:
经离散余弦变换即可得到Mel倒谱系数:
其中,M为Mel滤波器的个数,也是MFCC特征的维数。
优选地,所述步骤2预处理过程还包括:
步骤2.3:原始音频信号经去噪、计算MFCC后,对于每一段音频数据,不同维度的MFCC可以组成一个向量,以不同帧音频数据提取的MFCC为y坐标,x坐标为MFCC维度,z坐标为MFCC的计算数值,以颜色深浅表示,形成一张MFCC图,用于型训练。
优选地,所述步骤3具体为:
步骤3.1:对图像切分为Patch;第二步做线性投影,将正方形的Patch转化成固定维度的嵌入层embedding,并映射到Transformer规定的embedding size的维度
步骤3.2:生成用于分类的类令牌embedding,然后生成序列的位置编码,在位置编码时,使用学习令牌Tokens之间成对关系并且可以与自注意力机制交互的相对位置编码方式;同时在这一步通过引入知识蒸馏机制中的蒸馏令牌distillation token,其与教师模型相连,指导模型训练;
步骤3.3:将所有的embedding输入到Transformer编码器模块,由注意力机制提取全局特征,通过最后的分类头输出分类任务。
优选地,基于不同分辨率导出MFCC特征图,得到特征图10800张数据图,包括健康、退磁、偏心分别3600张,按照70%、20%和10%将数据集划分为训练集、验证集和测试集,输入到Vision Transformer模型中进行训练。
一种基于音频信号和视觉Transformer的电机转子故障诊断系统,所述系统包括:
数据采集模块,所述数据采集模块采集电机、永磁体退磁电机和转子动态偏心电机的不同转速和负载工况运行过程中的音频信号;
预处理模块,所述预处理模块对采集到的音频信号进行预处理,得到电机当前状态的音频特征;
模型建立模块,所述模型建立模块建立转子故障诊断模型训练;
诊断模块,所述诊断模块根据音频特征,输入至转子故障诊断模型,对电机转子故障进行诊断。
一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行,以用于实现如一种基于音频信号和视觉Transformer的电机转子故障诊断方法。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现一种基于音频信号和视觉Transformer的电机转子故障诊断方法。
本发明具有以下有益效果:
本发明与现有技术相比:
本发明在永磁同步电机发生永磁体退磁故障和偏心故障时,转子磁场的对称性被破坏,会引入极对数p相关的分数次谐波,影响气隙磁通密度,进而影响径向电磁力的分布,从而导致电机产生带有故障特征的振动噪声,基于此特征可以将电机转子异常情况进行识别。
对故障特征音频进行特征提取实现可视化,通过视觉Transformer的自注意力机制,可以捕捉到物体之间的相对位置信息,能产生对图像理解有利的可解释性结果,通过使用Vision Transformer架构并结合蒸馏技术在保持较高性能的同时减少了模型的参数数量。最终实现转子永磁体退磁和转子偏心故障的智能故障诊断。
本发明基于音频信号进行特征提取,可以获得电机丰富的时域和频域信息,Mel滤波器组符合人耳听觉特性,避免了诊断的盲目性。
相对基于振动信号,音频信号可以通过非侵入式的方式获取,无需对电机进行拆解或修改,这意味着可以在电机正常运行时进行实时的故障诊断,减少停机时间,提高诊断效率。
通过训练Vision Transformer模型,可以实现对电机故障的自动检测和分类。这种智能化的诊断方法可以提高诊断的速度和准确性,并且能够发现一些难以通过传统方法检测到的故障模式。
Data-efficient image Transformers(DeiT)训练的小型网络模型相对较为轻量,可以在计算资源有限的设备上部署和运行。这对于嵌入式设备和移动设备等资源受限环境下的应用非常有益。
本发明提出了一种基于音频信号和视觉Transformer的电机转子故障诊断方法及系统。该方法和系统通过采集音频信号来提取电机转子故障内部磁场畸变的特征,再通过Vision Transformer模型实现电机转子故障的实时诊断,最终实现了永磁同步电机转子故障诊断,对电机的可靠性以及高精度电机控制有重要意义。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为硬件系统框图;
图2为MFCC特征图;
图3为健康、退磁、偏心电机三分类准确率和损失函数曲线;
图4为健康、退磁、偏心电机三分类混淆矩阵及t-SNE特征可视化示意图;
图5为原理事宜图。
具体实施方式
下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
此外,下面所描述的本发明不同实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互结合。
以下结合具体实施例,对本发明进行了详细说明。
具体实施例一:
根据图1至图5所示,本发明为解决上述技术问题采取的具体优化技术方案是:本发明涉及一种基于音频信号和视觉Transformer的电机转子故障诊断方法,所述方法包括:
步骤1:采集电机、永磁体退磁电机和转子动态偏心电机的不同转速和负载工况运行过程中的音频信号;
所述步骤1具体为:
通过INMP441麦克风,对音频信号进行双声道采集后经模数转换、滤波器输入到FPGA中,得到电机、永磁体退磁电机和转子动态偏心电机的不同转速和负载工况运行过程中的音频信号。
步骤2:对采集到的音频信号进行预处理,得到电机当前状态的音频特征;
所述步骤2预处理过程包括:
步骤2.1:使用小波阈值去噪对音频信号进行去噪,分解层数为5时去噪后信号的信噪比最高;
选择sym6作为电机音频信号的小波基函数;
阈值通过下式表示:
其中,Ti、σi分别为第i层小波系数的阈值、标准方差,N为样本数;
采用音频信号处理中的硬阈值函数。
所述步骤2预处理过程还包括:
步骤2.2:计算去噪后的音频信号的梅尔频率倒谱系数MFCC,包括分帧、预处理、离散傅立叶变换DFT、Mel带通滤波、离散余弦变换DCT;物理频率与Mel频率之间关系下式:
Mel(f)=2595×lg(1+f/700)
对噪声信号进行分帧,预处理:加窗、预加重,加窗时使用hamming窗;
对预处理后的每帧信号作离散傅立叶变换,设预处理后的时域信号为S(n),DFT变换后的频域信号S(k)可表示为下式:
求S(k)的平方,得到能量谱,再使用M个Mel带通滤波器进行滤波,第m个滤波器的传递函数为:
其中,f(m)为三角滤波器中心频率,且:
计算每个滤波器组的对数能量,第m个滤波器组的对数能量为:
经离散余弦变换即可得到Mel倒谱系数:
其中,M为Mel滤波器的个数,也是MFCC特征的维数。
所述步骤2预处理过程还包括:
步骤2.3:原始音频信号经去噪、计算MFCC后,对于每一段音频数据,不同维度的MFCC可以组成一个向量,以不同帧音频数据提取的MFCC为y坐标,x坐标为MFCC维度,z坐标为MFCC的计算数值,以颜色深浅表示,形成一张MFCC图,用于型训练。
步骤3:建立转子故障诊断模型训练;
所述步骤3具体为:
步骤3.1:对图像切分为Patch;第二步做线性投影,将正方形的Patch转化成固定维度的嵌入层embedding,并映射到Transformer规定的embedding size的维度
步骤3.2:生成用于分类的类令牌embedding,然后生成序列的位置编码,在位置编码时,使用学习令牌Tokens之间成对关系并且可以与自注意力机制交互的相对位置编码方式;同时在这一步通过引入知识蒸馏机制中的蒸馏令牌distillation token,其与教师模型相连,指导模型训练;
步骤3.3:将所有的embedding输入到Transformer编码器模块,由注意力机制提取全局特征,通过最后的分类头输出分类任务。
优选地,基于不同分辨率导出MFCC特征图,得到特征图10800张数据图,包括健康、退磁、偏心分别3600张,按照70%、20%和10%将数据集划分为训练集、验证集和测试集,输入到Vision Transformer模型中进行训练。
步骤4:根据步骤2的音频特征,输入至转子故障诊断模型,对电机转子故障进行诊断。
具体实施例二:
本申请实施例二与实施例一的区别仅在于:
本发明提供了一种基于音频信号和视觉Transformer的电机转子故障诊断方法,包括:
步骤一、数据采集:采集健康电机、永磁体退磁电机和转子动态偏心电机的不同转速和负载工况运行过程中的音频信号。本发明使用的是INMP441麦克风,具有高精度24位数据的数字I2S接口,61dBA的高信噪比,-26dBFS的高灵敏度,60Hz至15kHz的平坦频率响应,对音频信号进行双声道采集后经模数转换、滤波器输入到FPGA中等待进一步处理。如图1。
步骤二、信号处理:根据步骤一采集到的数据,需要做以下数据处理:
(1)使用小波阈值去噪算法对步骤一获取到的电机音频信号进行去噪,具体如下:
A、分解层数,对比不同分解层数的降噪效果,分解层数为5时去噪后信号的信噪比最高。
B、小波基函数,小波基函数需要具有正交、对称和紧支的特点,同时和待处理信号具有一定的相似性,经过对比,选择sym6作为电机音频信号的小波基函数。
C、阈值,常用的阈值函数没有考虑分解层数对阈值选择的影响,因此,本发明下式阈值选择方法:
式中:Ti、σi分别为第i层小波系数的阈值、标准方差,N为样本数。
D、阈值函数.常用的阈值函数有硬阈值函数和软阈值函数,本研究使用的是音频信号处理中常用的硬阈值函数。
(2)计算去噪后的音频信号的梅尔频率倒谱系数(MFCC),包括分帧、预处理、离散傅立叶变换(DFT)、Mel带通滤波、离散余弦变换(DCT)等步骤。物理频率与Mel频率之间关系如式2所示。
Mel(f)=2595×lg(1+f/700) (式2)
算法具体步骤如下:
A、对噪声信号进行分帧,预处理(加窗、预加重),预处理的目的是为了补偿分帧所造成的信息损失,加窗时使用hamming窗。
B、对预处理后的每帧信号作离散傅立叶变换。设预处理后的时域信号为S(n),DFT变换后的频域信号S(k)可表示为下式:
C、求S(k)的平方,得到能量谱,再使用M个Mel带通滤波器进行滤波,第m个滤波器的传递函数为:
式中,f(m)为三角滤波器中心频率,且:
D、计算每个滤波器组的对数能力。第m个滤波器组的对数能量为:
E、经离散余弦变换即可得到Mel倒谱系数:
式中,M为Mel滤波器的个数,也是MFCC特征的维数。
(3)原始音频信号经去噪、计算MFCC后,对于每一段音频数据,不同维度的MFCC可以组成一个向量,以不同帧音频数据提取的MFCC为y坐标,x坐标为MFCC维度,z坐标为MFCC的计算数值,以颜色深浅表示,最终可以形成一张MFCC图,从而更易被Vision Transformer模型训练。MFCC图如图2所示。
步骤三、转子故障诊断模型训练:进行诊断前,基于不同分辨率导出MFCC特征图,得到特征图10800张数据图片(健康、退磁、偏心分别3600张),按照70%、20%和10%将数据集划分为训练集、验证集和测试集,输入到Vision Transformer模型中进行训练,具体步骤如下:
(1)图像切分为Patch;第二步做线性投影,将正方形的Patch转化成固定维度的嵌入层(embedding),并映射到Transformer规定的embedding size的维度
(2)生成用于分类的类令牌embedding,然后生成序列的位置编码,在位置编码时,本发明使用可以学习令牌(Tokens)之间成对关系并且可以与自注意力机制交互的相对位置编码方式;同时在这一步通过引入知识蒸馏机制中的蒸馏令牌(distillation token),其与教师模型相连,指导模型训练。
(3)将所有的embedding输入到Transformer编码器模块,由注意力机制提取全局特征,通过最后的分类头输出分类任务。
步骤四、转子故障诊断与性能评估:通过步骤一采集得到的数据,经过步骤二计算,得到电机当前状态的音频特征,输入到步骤三中搭建好的转子故障诊断模型,实现转子永磁体退磁和转子动态偏心的故障诊断。健康电机、退磁电机、偏心电机样本分类结果如图3,测试集准确率可达99.81%。最后通过t-SNE(t-Distributed Stochastic NeighborEmbedding)学习过程可视化和混淆矩阵进行模型性能评估,如图4所示。总体技术方案如图5所示。
具体实施例三:
本申请实施例三与实施例二的区别仅在于:
本发明提供一种基于音频信号和视觉Transformer的电机转子故障诊断系统,所述系统包括:
数据采集模块,所述数据采集模块采集电机、永磁体退磁电机和转子动态偏心电机的不同转速和负载工况运行过程中的音频信号;
预处理模块,所述预处理模块对采集到的音频信号进行预处理,得到电机当前状态的音频特征;
模型建立模块,所述模型建立模块建立转子故障诊断模型训练;
诊断模块,所述诊断模块根据音频特征,输入至转子故障诊断模型,对电机转子故障进行诊断。
具体实施例四:
本申请实施例四与实施例三的区别仅在于:
本发明提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行,以用于实现如一种基于音频信号和视觉Transformer的电机转子故障诊断方法。
具体实施例五:
本申请实施例五与实施例四的区别仅在于:
本发明提供一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其所述处理器执行所述计算机程序时实现一种基于音频信号和视觉Transformer的电机转子故障诊断方法。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或N个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“N个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更N个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或N个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,N个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
以上所述仅是一种基于音频信号和视觉Transformer的电机转子故障诊断方法的优选实施方式,一种基于音频信号和视觉Transformer的电机转子故障诊断方法的保护范围并不仅局限于上述实施例,凡属于该思路下的技术方案均属于本发明的保护范围。应当指出,对于本领域的技术人员来说,在不脱离本发明原理前提下的若干改进和变化,这些改进和变化也应视为本发明的保护范围。

Claims (10)

1.一种基于音频信号和视觉Transformer的电机转子故障诊断方法,其特征是:所述方法包括:
步骤1:采集电机、永磁体退磁电机和转子动态偏心电机的不同转速和负载工况运行过程中的音频信号;
步骤2:对采集到的音频信号进行预处理,得到电机当前状态的音频特征;
步骤3:建立转子故障诊断模型训练;
步骤4:根据步骤2的音频特征,输入至转子故障诊断模型,对电机转子故障进行诊断。
2.根据权利要求1所述的方法,其特征是:所述步骤1具体为:
通过INMP441麦克风,对音频信号进行双声道采集后经模数转换、滤波器输入到FPGA中,得到电机、永磁体退磁电机和转子动态偏心电机的不同转速和负载工况运行过程中的音频信号。
3.根据权利要求2所述的方法,其特征是:所述步骤2预处理过程包括:
步骤2.1:使用小波阈值去噪对音频信号进行去噪,分解层数为5时去噪后信号的信噪比最高;
选择sym6作为电机音频信号的小波基函数;
阈值通过下式表示:
其中,Ti、σi分别为第i层小波系数的阈值、标准方差,N为样本数;
采用音频信号处理中的硬阈值函数。
4.根据权利要求3所述的方法,其特征是:所述步骤2预处理过程还包括:
步骤2.2:计算去噪后的音频信号的梅尔频率倒谱系数MFCC,包括分帧、预处理、离散傅立叶变换DFT、Mel带通滤波、离散余弦变换DCT;物理频率与Mel频率之间关系下式:
Mel(f)=2595×lg(1+f/700)
对噪声信号进行分帧,预处理:加窗、预加重,加窗时使用hamming窗;
对预处理后的每帧信号作离散傅立叶变换,设预处理后的时域信号为S(n),DFT变换后的频域信号S(k)可表示为下式:
求S(k)的平方,得到能量谱,再使用M个Mel带通滤波器进行滤波,第m个滤波器的传递函数为:
其中,f(m)为三角滤波器中心频率,且:
计算每个滤波器组的对数能量,第m个滤波器组的对数能量为:
经离散余弦变换即可得到Mel倒谱系数:
其中,M为Mel滤波器的个数,也是MFCC特征的维数。
5.根据权利要求4所述的方法,其特征是:所述步骤2预处理过程还包括:
步骤2.3:原始音频信号经去噪、计算MFCC后,对于每一段音频数据,不同维度的MFCC可以组成一个向量,以不同帧音频数据提取的MFCC为y坐标,x坐标为MFCC维度,z坐标为MFCC的计算数值,以颜色深浅表示,形成一张MFCC图,用于型训练。
6.根据权利要求5所述的方法,其特征是:所述步骤3具体为:
步骤3.1:对图像切分为Patch;第二步做线性投影,将正方形的Patch转化成固定维度的嵌入层embedding,并映射到Transformer规定的embedding size的维度
步骤3.2:生成用于分类的类令牌embedding,然后生成序列的位置编码,在位置编码时,使用学习令牌Tokens之间成对关系并且可以与自注意力机制交互的相对位置编码方式;同时在这一步通过引入知识蒸馏机制中的蒸馏令牌distillation token,其与教师模型相连,指导模型训练;
步骤3.3:将所有的embedding输入到Transformer编码器模块,由注意力机制提取全局特征,通过最后的分类头输出分类任务。
7.根据权利要求6所述的方法,其特征是:基于不同分辨率导出MFCC特征图,得到特征图10800张数据图,包括健康、退磁、偏心分别3600张,按照70%、20%和10%将数据集划分为训练集、验证集和测试集,输入到Vision Transformer模型中进行训练。
8.一种基于音频信号和视觉Transformer的电机转子故障诊断系统,其特征是:所述系统包括:
数据采集模块,所述数据采集模块采集电机、永磁体退磁电机和转子动态偏心电机的不同转速和负载工况运行过程中的音频信号;
预处理模块,所述预处理模块对采集到的音频信号进行预处理,得到电机当前状态的音频特征;
模型建立模块,所述模型建立模块建立转子故障诊断模型训练;
诊断模块,所述诊断模块根据音频特征,输入至转子故障诊断模型,对电机转子故障进行诊断。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行,以用于实现如权利要求1-7的方法。
10.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征是:所述处理器执行所述计算机程序时实现权利要求1-7的方法。
CN202311527995.2A 2023-11-16 2023-11-16 一种基于音频信号和视觉Transformer的电机转子故障诊断方法 Pending CN117711430A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311527995.2A CN117711430A (zh) 2023-11-16 2023-11-16 一种基于音频信号和视觉Transformer的电机转子故障诊断方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311527995.2A CN117711430A (zh) 2023-11-16 2023-11-16 一种基于音频信号和视觉Transformer的电机转子故障诊断方法

Publications (1)

Publication Number Publication Date
CN117711430A true CN117711430A (zh) 2024-03-15

Family

ID=90156031

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311527995.2A Pending CN117711430A (zh) 2023-11-16 2023-11-16 一种基于音频信号和视觉Transformer的电机转子故障诊断方法

Country Status (1)

Country Link
CN (1) CN117711430A (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113776835A (zh) * 2021-10-11 2021-12-10 山东大学 基于增强梅尔线性频率倒谱系数的滚动轴承故障诊断方法
US20220084732A1 (en) * 2020-09-15 2022-03-17 Hunan University Of Science And Technology PMSM Demagnetization Fault Diagnosis Method Based on Fuzzy Intelligent Learning of Torque Signals
CN116229991A (zh) * 2022-12-26 2023-06-06 江苏核电有限公司 基于mfcc语音特征提取与机器学习的电机故障诊断方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20220084732A1 (en) * 2020-09-15 2022-03-17 Hunan University Of Science And Technology PMSM Demagnetization Fault Diagnosis Method Based on Fuzzy Intelligent Learning of Torque Signals
CN113776835A (zh) * 2021-10-11 2021-12-10 山东大学 基于增强梅尔线性频率倒谱系数的滚动轴承故障诊断方法
CN116229991A (zh) * 2022-12-26 2023-06-06 江苏核电有限公司 基于mfcc语音特征提取与机器学习的电机故障诊断方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
杨东博: "基于声音信号的偏航电机轴承故障识别方法研究", 31 May 2023 (2023-05-31), pages 46 - 54 *

Similar Documents

Publication Publication Date Title
CN110534118B (zh) 基于声纹识别和神经网络的变压器/电抗器故障诊断方法
CN112052796A (zh) 一种基于深度学习的永磁同步电机故障诊断方法
CN110059601B (zh) 一种多特征提取与融合的智能故障诊断方法
CN111044814B (zh) 一种对变压器直流偏磁异常进行辨识的方法及系统
KR20090078075A (ko) Dft와 웨이블렛을 이용한 유도전동기 고장진단방법
CN111983357B (zh) 一种结合声纹检测功能的超声可视化故障检测方法
CN113405825B (zh) 一种基于声音信号的带式输送机故障诊断方法
CN112926728B (zh) 一种永磁同步电机小样本匝间短路故障诊断方法
CN117269754B (zh) 基于卷积神经网络术的ipmsm转子退磁和偏心故障诊断方法
CN113486868A (zh) 一种电机故障诊断方法及系统
CN113125135A (zh) 旋转机械的故障诊断方法、存储介质及电子设备
CN112052712B (zh) 一种电力设备状态监测与故障识别方法及系统
CN116229991A (zh) 基于mfcc语音特征提取与机器学习的电机故障诊断方法
CN115376526A (zh) 一种基于声纹识别的电力设备故障检测方法及系统
CN115910097A (zh) 一种高压断路器潜伏性故障可听声信号识别方法及系统
CN114234061A (zh) 一种基于神经网络的带压运行供水管道漏水音智能判别方法
CN116524273A (zh) 一种发电站尾水管检测方法、装置、设备及存储介质
CN117711430A (zh) 一种基于音频信号和视觉Transformer的电机转子故障诊断方法
CN113034359A (zh) 发电机组定转子缺陷智能诊断方法、装置、计算机设备及存储介质
CN116484258A (zh) 电梯曳引机轴承故障诊断方法
CN114997210A (zh) 一种基于深度学习的机器异响识别检测方法
CN115406522A (zh) 基于声纹识别的电厂设备运行状态研究与应用
CN114152441A (zh) 基于移位窗口变换器网络的滚动轴承故障诊断方法及系统
CN111462038A (zh) 一种基于深度学习的风机齿轮缺陷检测方法
CN117708574B (zh) 一种嵌入物理信息的cnn变转速滚动轴承故障诊断方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination