CN116364108A - 变压器声纹检测方法及装置、电子设备、存储介质 - Google Patents

变压器声纹检测方法及装置、电子设备、存储介质 Download PDF

Info

Publication number
CN116364108A
CN116364108A CN202310351025.5A CN202310351025A CN116364108A CN 116364108 A CN116364108 A CN 116364108A CN 202310351025 A CN202310351025 A CN 202310351025A CN 116364108 A CN116364108 A CN 116364108A
Authority
CN
China
Prior art keywords
mel
transformer
voiceprint
coefficient
cepstrum coefficient
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310351025.5A
Other languages
English (en)
Inventor
项新建
郑雨
李旭
曹光客
刘晓成
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Sheng Guan Technology Co ltd
Zhejiang Lover Health Science and Technology Development Co Ltd
Original Assignee
Hangzhou Sheng Guan Technology Co ltd
Zhejiang Lover Health Science and Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Sheng Guan Technology Co ltd, Zhejiang Lover Health Science and Technology Development Co Ltd filed Critical Hangzhou Sheng Guan Technology Co ltd
Priority to CN202310351025.5A priority Critical patent/CN116364108A/zh
Publication of CN116364108A publication Critical patent/CN116364108A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/24Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being the cepstrum
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/27Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/27Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
    • G10L25/30Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique using neural networks
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Complex Calculations (AREA)

Abstract

本申请了提供一种变压器声纹检测方法及装置、电子设备、存储介质,涉及变压器故障检测的技术领域。通过采集变压器在理想运行状态下的第一声纹信息,并根据对第一声纹信息进行特征提取得到的第一梅尔倒谱系数来训练预设神经网络以得到初始检测模型,再通过采集变压器在复杂环境下的第二声纹信息,并对从第二声纹信息中提取到的第二梅尔倒谱系数进行相应类型标注,将类型标注后的第二梅尔倒谱系数输入到初始检测模型中训练得到最终检测模型,通过最终检测模型对待测声纹信息进行检测,实现高效准确地识别变压器的故障类型。

Description

变压器声纹检测方法及装置、电子设备、存储介质
技术领域
本申请涉及变压器故障检测的技术领域,特别涉及一种变压器声纹检测方法及装置、电子设备、存储介质。
背景技术
变压器在长期运行过程中,随着其使用年限的增加会产生各种故障。当前一般采用溶解气体分析法、红外测温法、局部放电监测法等方法对变压器的故障进行检测。
另一方面,对于变压器内部器件螺丝松动等故障,通过上述方法并不能有效检测出故障原因。由于变压器运行时的声音包含有大量的运行状态信息,变压器正常运行时发出的声音具有一定规律性,当变压器内部存在机械故障时,会产生异常响声。因此可以对变压器发出的异常响声进行检测,从而通过变压器声纹特征的变化来进行变压器故障诊断。
但现有检测方法大多基于理想化数据模型,没有考虑到复杂环境中存在的噪声等多种因素的影响。采用上述理想化模型来对变压器声纹信息进行检测时,会导致检测效果不断下降,进而无法对变压器的故障进行精准识别。
发明内容
本申请的目的在于解决背景技术中提到的技术问题,提供了一种变压器声纹检测方法及装置、电子设备、存储介质。
第一方面,本申请实施例提供了一种变压器声纹检测方法,包括:采集变压器的第一声纹信息,所述第一声纹信息为变压器在理想运行状态下的声音信息;对所述第一声纹信息进行特征提取,得到第一梅尔倒谱系数;将所述第一梅尔倒谱系数输入预设神经网络中进行训练,得到初始检测模型;采集变压器的第二声纹信息,所述第二声纹信息为变压器在复杂环境下的声音信息;对所述第二声纹信息进行特征提取,得到第二梅尔倒谱系数;利用聚类算法、快速独立成分分析算法对第二梅尔倒谱系数的类型进行标注;通过标注后的第二梅尔倒谱系数来训练所述初始检测模型,得到最终检测模型;根据所述最终检测模型对变压器的待测声纹信息进行检测,以实现变压器故障类型的识别。
可选的,所述对所述第一声纹信息进行特征提取,得到第一梅尔倒谱系数具体包括:对第一声纹信息进行高通滤波处理,滤除所述第一声纹信息中的低频分量;将经过高通滤波处理的所述第一声纹信息进行分帧处理;对分帧后的所述第一声纹信息进行加窗处理;将加窗后的所述第一声纹信息进行时频变换;提取时频变换后的所述第一声纹信息的频率响应;对所述频率响应先后进行对数运算以及余弦变换,得到所述第一梅尔倒谱系数。
可选的,所述利用聚类算法、快速独立成分分析算法对第二梅尔倒谱系数的类型进行标注具体包括:以所述第一梅尔倒谱系数为聚类中心,对所述第二梅尔倒谱系数进行聚类计算;将与聚类中心的距离小于第一距离阈值的第二梅尔倒谱系数标注为对应聚类中心的类型;将与聚类中心的距离大于第二距离阈值的第二梅尔倒谱系数进行快速独立成分分析,根据分析结果分别标注为对应类型。
可选的,所述以所述第一梅尔倒谱系数为聚类中心,对所述第二梅尔倒谱系数进行聚类计算具体包括,通过公式:d=1-IOU;
Figure BDA0004161531680000031
进行聚类计算,其中,x1代表第一梅尔倒谱系数中的第一维度特征,x’1代表第二梅尔倒谱系数中的第一维度特征,x2代表第一梅尔倒谱系数中的第二维度特征,x’2代表第二梅尔倒谱系数中的第二维度特征,xn代表第一梅尔倒谱系数中的第n个维度特征,x’n代表第二梅尔倒谱系数中的第n个维度特征,K代表一常数,d代表与聚类中心的距离。
可选的,所述第一距离阈值为0.3,所述第二距离阈值为0.7。
可选的,在利用聚类算法、快速独立成分分析算法对第二梅尔倒谱系数的类型进行标注之前,还包括:通过计算第二梅尔倒谱系数的真实值与其预测值之间的误差,来对第二梅尔倒谱系数进行打分,其中,低于第一分值的第二梅尔倒谱系数用于在后续聚类算法、快速独立成分分析算法下进行类型标注,高于第二分值的第二梅尔倒谱系数用于训练初始检测模型。
第二方面,本申请实施例提供了一种变压器声纹检测装置,包括:第一采集模块,被配置为采集变压器的第一声纹信息,所述第一声纹信息为变压器在理想运行状态下的声音信息;第一特征提取模块,被配置为对所述第一声纹信息进行特征提取,得到第一梅尔倒谱系数;第一训练模块,被配置为将所述第一梅尔倒谱系数输入预设神经网络中进行训练,得到初始检测模型;第二采集模块,被配置为采集变压器的第二声纹信息,所述第二声纹信息为变压器在复杂环境下的声音信息;第二特征提取模块,被配置为对所述第二声纹信息进行特征提取,得到第二梅尔倒谱系数;类型标注模块,被配置为利用聚类算法、快速独立成分分析算法对第二梅尔倒谱系数的类型进行标注;第二训练模块,被配置为通过标注后的第二梅尔倒谱系数来训练所述初始检测模型,得到最终检测模型;检测模块,被配置为根据所述最终检测模型对变压器的待测声纹信息进行检测,以实现变压器故障类型的识别。
可选的,所述类型标注模块包括:中心设置子模块,被配置为以所述第一梅尔倒谱系数为聚类中心,对所述第二梅尔倒谱系数进行聚类计算;第一标注子模块,被配置为将与聚类中心的距离小于第一距离阈值的第二梅尔倒谱系数标注为对应聚类中心的类型;第二标注子模块,被配置为将与聚类中心的距离大于第二距离阈值的第二梅尔倒谱系数进行快速独立成分分析,根据分析结果分别标注为对应类型。
第三方面,本申请实施例提供了一种电子设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行上述的变压器声纹检测方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,所述可读存储介质中存储有计算机程序,当所述计算机程序在计算机上运行时,使得所述计算机执行上述的变压器声纹检测方法。
本申请的有益效果:
本申请实施例提供的变压器声纹检测方法,通过采集变压器在理想运行状态下的第一声纹信息,并根据对第一声纹信息进行特征提取得到的第一梅尔倒谱系数来训练预设神经网络以得到初始检测模型,再通过采集变压器在复杂环境下的第二声纹信息,并对从第二声纹信息中提取到的第二梅尔倒谱系数进行相应类型标注,再将经类型标注的第二梅尔倒谱系数输入到初始检测模型中训练得到最终检测模型,通过最终检测模型对待测声纹信息进行检测,最终实现高效准确地识别变压器的故障类型。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍。
图1为本申请一实施例变压器声纹检测方法的流程示意图;
图2为本申请一实施例提取第一梅尔倒谱系数的流程示意图;
图3为本申请一实施例对第二梅尔倒谱系数的类型进行标注的流程示意图;
图4为本申请一实施例变压器声纹检测装置的装置框图;
图5为本申请一实施例中类型标注模块的装置框图;
图6为本申请一实施例提供的一种电子设备的装置框图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。
本申请实施例首先提供了一种变压器声纹检测方法,用于对待测声纹信息进行检测,以实现高效准确地识别变压器的故障类型。
请参考图1,为本申请一实施例提供的变压器声纹检测方法的流程示意图,该方法包括步骤S110~S180。
步骤S110:采集变压器的第一声纹信息,所述第一声纹信息为变压器在理想运行状态下的声音信息。
在理想运行状态下,变压器声音的频率主要分布在0~2000Hz范围内,且常为50Hz的偶数倍频。
本步骤中,通过传感器来采集变压器在理想运行状态下的声音信息,作为第一声纹信息。
根据奈奎斯特采样定理,采用大于两倍信号最高频率的第一采样频率,对理想状态下的变压器进行音频采样,由于在理想运行状态下,变压器声音的频率主要分布在0~2000Hz范围内,故第一采样频率至少为4000Hz,从而保证采集到的第一声纹信息不存在任何的信息丢失。
示例性的,可采用具有某一灵敏度的传感器,以第一采样频率进行采样,具体的,可通过固定采样总体时长或固定采样总数来进行声音信息的采集,得到变压器的第一声纹信息。此外,在采集到该第一声纹信息后,还可以进行对第一声纹信息进行包括:滤波、去噪、放大等处理。
步骤S120:对所述第一声纹信息进行特征提取,得到第一梅尔倒谱系数。
第一声纹信息中具有不同的特征信息,通过对第一声纹信息进行特征提取,得到第一梅尔倒谱系数,用于表征第一声纹信息,以进行后续检测模型的训练。
请参考图2,为本申请一实施例提取第一梅尔倒谱系数的流程示意图,其中,对第一声纹信息进行特征提取,得到第一梅尔倒谱系数具体包括:步骤S1210~S1260。
步骤S1210:对第一声纹信息进行高通滤波处理,滤除第一声纹信息中的低频分量。
示例性的,可将采集到的第一声纹信息输入至系统函数为:H(Z)=1-μz-1的滤波器中,其中,该滤波器为高通滤波器,且μ通常取值为0.97。通过进行高通滤波处理,滤除第一声纹信息中的低频分量,从而提升第一声纹信息中高频分量,使第一声纹信息的频谱变得平稳。
可以理解,可以采用具有不同参数的滤波器来对第一声纹信息进行高通滤波处理,上述仅为示例,不作为对本申请的限定。
步骤S1220:将经过高通滤波处理的所述第一声纹信息进行分帧处理。
本步骤中,以N个采样点作为一帧,对经过高通滤波处理的第一声纹信息进行分帧处理,以便于后续的数据处理。此外,还可以通过在相邻帧间设置部分重叠,以避免相邻帧间差别过大的问题。
步骤S1230:对分帧后的所述第一声纹信息进行加窗处理。
为了对第一声纹信息进行时频变换,需要先对分帧后的第一声纹信息进行加窗处理。其中,在加窗处理中,窗的类型通常有矩形窗、高斯窗、汉明窗。
一实施例中,将分帧后的第一声纹信息与汉明窗函数:
Figure BDA0004161531680000071
相乘,以得到加汉明窗后的第一声纹信息。可以理解,除了使用汉明窗函数外,还可采用其他类型的窗函数来进行加窗处理,上述仅为示例,不作为对本申请的限定。
步骤S1240:将加窗后的所述第一声纹信息进行时频变换。
本步骤中,通过快速傅里叶变换,将加窗后的第一声纹信息从时域变换到频域。时频变换后的第一声纹信息各帧的频谱可表示为:
Figure BDA0004161531680000081
步骤S1250:提取时频变换后的所述第一声纹信息的频率响应。
本步骤中,采用Mel尺度的三角形滤波器提取第一声纹信息频谱的频率相应,其中,Mel频率可表示为:
Figure BDA0004161531680000082
被提取的第一声纹信息的频率响应为:
Figure BDA0004161531680000083
步骤S1260:对所述频率响应先后进行对数运算以及余弦变换,得到所述第一梅尔倒谱系数。
本步骤中,先对第一声纹信息的频率响应函数Hm(k)进行对数运算:
Figure BDA0004161531680000084
再将对数运算的结果带入离散余弦变换:
Figure BDA0004161531680000085
得到第一梅尔倒谱系数C(n)。其中L为第一梅尔倒谱系数的阶数,M为滤波器个数。
通过上述步骤S1210~S1260,以实现从变压器的第一声纹信息中提取到第一梅尔倒谱系数。
步骤S130:将所述第一梅尔倒谱系数输入预设神经网络中进行训练,得到初始检测模型。
本步骤中,设置初始权值、阈值、隐藏层、各层节点数来建立预设神经网络,并将第一梅尔倒谱系数输入该预设神经网络中进行训练,通过计算输出值与预测值间的误差,对不满足最小误差条件的预设神经网络进行自适应调整,修改隐藏层和节点的数量,直到满足最小误差条件,得到初始检测模型。
本实施例中,采用BP人工神经网络(back-propagation artificial neuralnetwork)作为预设神经网络。其中,预设神经网络的输入层、输出层、隐藏层的节点数满足公式:
Figure BDA0004161531680000091
其中l为隐含层节点数,m为输出层节点数,n为输入层节点数,a为0~10之间的常数。
相应的,预设神经网络的训练损失函数为均方误差函数,该均方误差函数可被表示为:
Figure BDA0004161531680000092
公式中,yi、fxi分别为第i个样本的真实值及其对应的预测值,n为样本的个数。
一实施例中,可将一部分第一梅尔倒谱系数作为第一训练集,另一部分第一梅尔倒谱系数作为第一测试集。第一训练集用于输入到预设神经网络中进行训练得到中间初始检测模型,第一测试集用于输入到上述第一初始检测模型进行训练得到最终初始检测模型,即初始检测模型。
步骤S140:采集变压器的第二声纹信息,所述第二声纹信息为变压器在复杂环境下的声音信息。
在复杂环境中,变压器的声音信息受到变压器负荷、环境温度、天气状态、变压器型号、噪声等多种因素的影响。
由于正常工作的变压器的频率主要分布在0~2000Hz范围内,而机械故障的频率分布在0~4000Hz范围内,故变压器运行声纹与故障声纹存在一定频率段的重叠。此外,在复杂环境下还存在多种无关频率的噪声,例如,人说话的声音在250~5000Hz范围。
本步骤中,通过传感器来采集变压器在复杂环境下的声音信息,作为第二声纹信息。通常认为高于4000Hz的声音信息为其他无关噪声,与故障声纹无关,可先滤除高于4000Hz无关噪声。
根据奈奎斯特采样定理,采用大于两倍信号最高频率的第二采样频率,对复杂环境下的变压器进行音频采样,第二采样频率至少为8000Hz,从而保证采集到的第二声纹信息不存在任何的信息丢失。
步骤S150:对所述第二声纹信息进行特征提取,得到第二梅尔倒谱系数。
第二声纹信息中具有不同的特征信息,通过对第二声纹信息进行特征提取,得到第二梅尔倒谱系数,用于表征第二声纹信息,以进行后续检测模型的训练。
关于对第二声纹信息进行特征提取,得到第二梅尔倒谱系数的具体步骤与提取第一梅尔倒谱系数相类似,具体请参考步骤S1210~S1260中的描述,在此不再赘述。
一实施例中,可通过预设神经网络的均方误差函数,计算第二梅尔倒谱系数的真实值与其预测值之间的误差,来对第二梅尔倒谱系数进行打分。
其中,低于第一分值的第二梅尔倒谱系数用于在后续聚类算法、快速独立成分分析算法下进行类型标注,高于第二分值的第二梅尔倒谱系数用于训练初始检测模型。
示例性的,第一分值为0.3,第二分值为0.7。可以理解,第一分值以及第二分值可被设置为其他值,上述仅为示例,不作为对本申请的限定。
步骤S160:利用聚类算法、快速独立成分分析算法对第二梅尔倒谱系数的类型进行标注。
如果直接将第二梅尔倒谱系数输入初始检测模型进行训练,由于第二梅尔倒谱系数存在其他相关噪声项,易导致模型识别错误。本实施例通过聚类算法、快速独立成分分析算法对第二梅尔倒谱系数的类型进行标注,以实现去噪分离。
请参考图3,为本申请一实施例对第二梅尔倒谱系数的类型进行标注的流程示意图,具体包括:步骤S1610~S1630。
步骤S1610:以所述第一梅尔倒谱系数为聚类中心,对所述第二梅尔倒谱系数进行聚类计算。
一实施例中,通过以下公式:
d=1-IOU;
Figure BDA0004161531680000111
进行聚类计算。
其中,x1代表第一梅尔倒谱系数中的第一维度特征,x’1代表第二梅尔倒谱系数中的第一维度特征,x2代表第一梅尔倒谱系数中的第二维度特征,x’2代表第二梅尔倒谱系数中的第二维度特征,xn代表第一梅尔倒谱系数中的第n个维度特征,x’n代表第二梅尔倒谱系数中的第n个维度特征,K代表一常数,d代表与聚类中心的距离。
上述基于梅尔倒谱系数的聚类方法,具有对梅尔倒谱系数中每个维度的特征都进行充分考虑的优点,从而能得到最佳的聚类结果。
步骤S1620:将与聚类中心的距离小于第一距离阈值的第二梅尔倒谱系数标注为对应聚类中心的类型。
一实施例中,将与聚类中心的距离小于第一距离阈值,该第一距离阈值为0.3的第二梅尔倒谱系数标注为对应聚类中心的类型。
步骤S1630:将与聚类中心的距离大于第二距离阈值的第二梅尔倒谱系数进行快速独立成分分析,根据分析结果分别标注为对应类型。
一实施例中,将与聚类中心的距离大于第二距离阈值,该第二距离阈值为0.7的第二梅尔倒谱系数进行快速独立成分分析,根据分析结果分别标注为对应类型。
本实施例通过利用聚类算法、快速独立成分分析算法对第二梅尔倒谱系数的类型进行标注,解决了采用现有分离算法对第二梅尔倒谱系数中的特征进行分离时,每次只能分离出一种信号且容易出现混叠的缺点。
步骤S170:通过标注后的第二梅尔倒谱系数来训练所述初始检测模型,得到最终检测模型。
本步骤中,将标注后的第二梅尔倒谱系数输入初始检测模型中进行训练。通过计算输出值与预测值间的误差,对不满足最小误差条件的初始检测模型的相应参数进行自适应调整,直到满足最小误差条件,得到最终检测模型。
一实施例中,可将一部分第二梅尔倒谱系数作为第二训练集,另一部分第二梅尔倒谱系数作为第二测试集。第二训练集用于输入到初始检测模型中进行训练得到第一最终检测模型,第二测试集用于输入到上述第一最终检测模型中进行测试得到第二最终检测模型,即最终检测模型。
步骤S180:根据所述最终检测模型对变压器的待测声纹信息进行检测,以实现变压器故障类型的识别。
最后通过最终检测模型对变压器的待测声纹信息进行检测,得到高效准确的变压器故障类型预测结果。
综上所述,本申请实施例的变压器声纹检测方法,通过采集变压器在理想运行状态下的第一声纹信息,并根据对第一声纹信息进行特征提取得到的第一梅尔倒谱系数来训练预设神经网络以得到初始检测模型,再通过采集变压器在复杂环境下的第二声纹信息,并对从第二声纹信息中提取到的第二梅尔倒谱系数进行相应类型标注,在将经类型标注的第二梅尔倒谱系数输入到初始检测模型中训练得到最终检测模型,通过最终检测模型对待测声纹信息进行检测,最终实现高效准确地识别变压器的故障类型。
基于同一发明构思,本申请实施例还提供了一种变压器声纹检测装置。
图4为该变压器声纹检测装置的装置框图,如图4所示,该装置可以包括以下模块:
第一采集模块210,被配置为采集变压器的第一声纹信息,所述第一声纹信息为变压器在理想运行状态下的声音信息;
第一特征提取模块220,被配置为对所述第一声纹信息进行特征提取,得到第一梅尔倒谱系数;
第一训练模块230,被配置为将所述第一梅尔倒谱系数输入预设神经网络中进行训练,得到初始检测模型;
第二采集模块240,被配置为采集变压器的第二声纹信息,所述第二声纹信息为变压器在复杂环境下的声音信息;
第二特征提取模块250,被配置为对所述第二声纹信息进行特征提取,得到第二梅尔倒谱系数;
类型标注模块260,被配置为利用聚类算法、快速独立成分分析算法对第二梅尔倒谱系数的类型进行标注;
第二训练模块270,被配置为通过标注后的第二梅尔倒谱系数来训练所述初始检测模型,得到最终检测模型;
检测模块280,被配置为根据所述最终检测模型对变压器的待测声纹信息进行检测,以实现变压器故障类型的识别。
请参考图5,为本申请一实施例中类型标注模块的装置框图,其中类型标注模块260还包括以下子模块:
中心设置子模块2610,被配置为以所述第一梅尔倒谱系数为聚类中心,对所述第二梅尔倒谱系数进行聚类计算;
第一标注子模块2620,被配置为将与聚类中心的距离小于第一距离阈值的第二梅尔倒谱系数标注为对应聚类中心的类型;
第二标注子模块2630,被配置为将与聚类中心的距离大于第二距离阈值的第二梅尔倒谱系数进行快速独立成分分析,根据分析结果分别标注为对应类型。
上述装置中各个模块的功能和作用的实现过程具体详见上述变压器声纹检测方法中对应步骤的实现过程,在此不再赘述。
基于同一发明构思,本申请实施例还提供了一种电子设备。
图6为本申请一实施例提供的一种电子设备的装置框图。
请参考图6,该电子设备300包括:至少一个处理器310和存储器320,图5中以一个处理器310为例。处理器310和存储器320通过总线330连接,存储器320存储有可被处理器310执行的指令,指令被处理器310执行,以使电子设备300可执行上述的实施例中变压器声纹检测方法的全部或部分流程。
存储器320可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(Static Random Access Memory,简称SRAM),电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory,简称EEPROM),可擦除可编程只读存储器(Erasable Programmable Read Only Memory,简称EPROM),可编程只读存储器(Programmable Red-Only Memory,简称PROM),只读存储器(Read-Only Memory,简称ROM),磁存储器,快闪存储器,磁盘或光盘。
需要说明的是,所述电子设备300仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
本申请还提供了一种计算机可读存储介质,存储介质存储有计算机程序,计算机程序可由处理器310执行以完成本申请提供的变压器声纹检测方法。
在本申请所提供的几个实施例中,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本申请的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
需要说明的是:以上各实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述各实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。

Claims (10)

1.一种变压器声纹检测方法,其特征在于,包括:
采集变压器的第一声纹信息,所述第一声纹信息为变压器在理想运行状态下的声音信息;
对所述第一声纹信息进行特征提取,得到第一梅尔倒谱系数;
将所述第一梅尔倒谱系数输入预设神经网络中进行训练,得到初始检测模型;
采集变压器的第二声纹信息,所述第二声纹信息为变压器在复杂环境下的声音信息;
对所述第二声纹信息进行特征提取,得到第二梅尔倒谱系数;
利用聚类算法、快速独立成分分析算法对第二梅尔倒谱系数的类型进行标注;
通过标注后的第二梅尔倒谱系数来训练所述初始检测模型,得到最终检测模型;
根据所述最终检测模型对变压器的待测声纹信息进行检测,以实现变压器故障类型的识别。
2.根据权利要求1所述的变压器声纹检测方法,其特征在于,所述对所述第一声纹信息进行特征提取,得到第一梅尔倒谱系数具体包括:
对第一声纹信息进行高通滤波处理,滤除所述第一声纹信息中的低频分量;
将经过高通滤波处理的所述第一声纹信息进行分帧处理;
对分帧后的所述第一声纹信息进行加窗处理;
将加窗后的所述第一声纹信息进行时频变换;
提取时频变换后的所述第一声纹信息的频率响应;
对所述频率响应先后进行对数运算以及余弦变换,得到所述第一梅尔倒谱系数。
3.根据权利要求1所述的变压器声纹检测方法,其特征在于,所述利用聚类算法、快速独立成分分析算法对第二梅尔倒谱系数的类型进行标注具体包括:
以所述第一梅尔倒谱系数为聚类中心,对所述第二梅尔倒谱系数进行聚类计算;
将与聚类中心的距离小于第一距离阈值的第二梅尔倒谱系数标注为对应聚类中心的类型;
将与聚类中心的距离大于第二距离阈值的第二梅尔倒谱系数进行快速独立成分分析,根据分析结果分别标注为对应类型。
4.根据权利要求3所述的变压器声纹检测方法,其特征在于,所述以所述第一梅尔倒谱系数为聚类中心,对所述第二梅尔倒谱系数进行聚类计算具体包括,通过公式:
d=1-IOU;
Figure FDA0004161531620000021
进行聚类计算,其中,x1代表第一梅尔倒谱系数中的第一维度特征,x’1代表第二梅尔倒谱系数中的第一维度特征,x2代表第一梅尔倒谱系数中的第二维度特征,x’2代表第二梅尔倒谱系数中的第二维度特征,xn代表第一梅尔倒谱系数中的第n个维度特征,x’n代表第二梅尔倒谱系数中的第n个维度特征,K代表一常数,d代表与聚类中心的距离。
5.根据权利要求4所述的变压器声纹检测方法,其特征在于,所述第一距离阈值为0.3,所述第二距离阈值为0.7。
6.根据权利要求1所述的变压器声纹检测方法,其特征在于,在利用聚类算法、快速独立成分分析算法对第二梅尔倒谱系数的类型进行标注之前,还包括:
通过计算第二梅尔倒谱系数的真实值与其预测值之间的误差,来对第二梅尔倒谱系数进行打分,其中,低于第一分值的第二梅尔倒谱系数用于在后续聚类算法、快速独立成分分析算法下进行类型标注,高于第二分值的第二梅尔倒谱系数用于训练初始检测模型。
7.一种变压器声纹检测装置,其特征在于,包括以下模块:
第一采集模块,被配置为采集变压器的第一声纹信息,所述第一声纹信息为变压器在理想运行状态下的声音信息;
第一特征提取模块,被配置为对所述第一声纹信息进行特征提取,得到第一梅尔倒谱系数;
第一训练模块,被配置为将所述第一梅尔倒谱系数输入预设神经网络中进行训练,得到初始检测模型;
第二采集模块,被配置为采集变压器的第二声纹信息,所述第二声纹信息为变压器在复杂环境下的声音信息;
第二特征提取模块,被配置为对所述第二声纹信息进行特征提取,得到第二梅尔倒谱系数;
类型标注模块,被配置为利用聚类算法、快速独立成分分析算法对第二梅尔倒谱系数的类型进行标注;
第二训练模块,被配置为通过标注后的第二梅尔倒谱系数来训练所述初始检测模型,得到最终检测模型;
检测模块,被配置为根据所述最终检测模型对变压器的待测声纹信息进行检测,以实现变压器故障类型的识别。
8.根据权利要求7所述的变压器声纹检测装置,其特征在于,所述类型标注模块包括:
中心设置子模块,被配置为以所述第一梅尔倒谱系数为聚类中心,对所述第二梅尔倒谱系数进行聚类计算;
第一标注子模块,被配置为将与聚类中心的距离小于第一距离阈值的第二梅尔倒谱系数标注为对应聚类中心的类型;
第二标注子模块,被配置为将与聚类中心的距离大于第二距离阈值的第二梅尔倒谱系数进行快速独立成分分析,根据分析结果分别标注为对应类型。
9.一种电子设备,其特征在于,所述电子设备包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为执行权利要求1~6任意一项所述的变压器声纹检测方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现如权利要求1~6中任一项所述的变压器声纹检测方法。
CN202310351025.5A 2023-03-29 2023-03-29 变压器声纹检测方法及装置、电子设备、存储介质 Pending CN116364108A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310351025.5A CN116364108A (zh) 2023-03-29 2023-03-29 变压器声纹检测方法及装置、电子设备、存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310351025.5A CN116364108A (zh) 2023-03-29 2023-03-29 变压器声纹检测方法及装置、电子设备、存储介质

Publications (1)

Publication Number Publication Date
CN116364108A true CN116364108A (zh) 2023-06-30

Family

ID=86920717

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310351025.5A Pending CN116364108A (zh) 2023-03-29 2023-03-29 变压器声纹检测方法及装置、电子设备、存储介质

Country Status (1)

Country Link
CN (1) CN116364108A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116839883A (zh) * 2023-07-04 2023-10-03 安徽中科昊音智能科技有限公司 一种基于声纹识别的铁塔螺丝松动诊断方法及装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116839883A (zh) * 2023-07-04 2023-10-03 安徽中科昊音智能科技有限公司 一种基于声纹识别的铁塔螺丝松动诊断方法及装置
CN116839883B (zh) * 2023-07-04 2024-02-13 安徽中科昊音智能科技有限公司 一种基于声纹识别的铁塔螺丝松动诊断方法及装置

Similar Documents

Publication Publication Date Title
CN109034046B (zh) 一种基于声学检测的电能表内异物自动识别方法
EP2905780A1 (en) Voiced sound pattern detection
CN107170465B (zh) 一种音频质量检测方法及音频质量检测系统
Zhai et al. Pattern recognition approach to identify loose particle material based on modified MFCC and HMMs
CN111964909A (zh) 滚动轴承运行状态检测方法、故障诊断方法及系统
CN111933185A (zh) 基于知识蒸馏的肺音分类方法、系统、终端及存储介质
CN116364108A (zh) 变压器声纹检测方法及装置、电子设备、存储介质
CN112052712B (zh) 一种电力设备状态监测与故障识别方法及系统
CN113345399A (zh) 一种强噪声环境下的机器设备声音监测方法
Löllmann et al. Comparative study of single-channel algorithms for blind reverberation time estimation
CN112033656A (zh) 一种基于宽带谱处理的机械系统故障检测方法
CN113345443A (zh) 基于梅尔频率倒谱系数的海洋哺乳动物发声检测识别方法
JP2008097361A (ja) 異常監視装置
US11030995B2 (en) Acoustic feature extractor selected according to status flag of frame of acoustic signal
CN116741200A (zh) 一种机车风机故障检测方法及装置
JP2002323371A (ja) 音響診断装置及び音響診断方法
CN114743562B (zh) 一种飞机声纹识别方法、系统、电子设备及存储介质
Arslan A new approach to real time impulsive sound detection for surveillance applications
JP2002538514A (ja) 周波数スペクトラムにおける確率論的信頼度を用いた音声検出方法
CN106098080A (zh) 一种噪声环境下言语识别阈的确定方法及装置
Wan et al. Chatter detection for micro milling considering environment noises without the requirement of dominant frequency
CN111862991A (zh) 一种婴儿哭声的识别方法及系统
CN114093385A (zh) 一种无人机检测方法及装置
CN112908344B (zh) 一种鸟鸣声智能识别方法、装置、设备和介质
CN114566185A (zh) 一种异响自动检测方法、设备及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination