CN114859269A - 一种基于声纹识别技术的电缆故障诊断方法 - Google Patents
一种基于声纹识别技术的电缆故障诊断方法 Download PDFInfo
- Publication number
- CN114859269A CN114859269A CN202210518298.XA CN202210518298A CN114859269A CN 114859269 A CN114859269 A CN 114859269A CN 202210518298 A CN202210518298 A CN 202210518298A CN 114859269 A CN114859269 A CN 114859269A
- Authority
- CN
- China
- Prior art keywords
- spectrogram
- resnet
- diagnosis method
- fault diagnosis
- cable fault
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 45
- 238000003745 diagnosis Methods 0.000 title claims abstract description 31
- 238000005516 engineering process Methods 0.000 title claims abstract description 27
- 238000012549 training Methods 0.000 claims abstract description 26
- 238000000605 extraction Methods 0.000 claims abstract description 19
- 238000001514 detection method Methods 0.000 claims abstract description 17
- 238000013526 transfer learning Methods 0.000 claims abstract description 13
- 238000007781 pre-processing Methods 0.000 claims abstract description 11
- 238000012360 testing method Methods 0.000 claims abstract description 11
- 230000005236 sound signal Effects 0.000 claims description 54
- 238000011176 pooling Methods 0.000 claims description 19
- 230000006870 function Effects 0.000 claims description 16
- 238000013507 mapping Methods 0.000 claims description 9
- 238000001228 spectrum Methods 0.000 claims description 9
- 239000000284 extract Substances 0.000 claims description 5
- 238000012545 processing Methods 0.000 claims description 5
- 230000007774 longterm Effects 0.000 claims description 4
- 230000003595 spectral effect Effects 0.000 claims description 4
- 238000013527 convolutional neural network Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 238000009432 framing Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000015556 catabolic process Effects 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 238000002405 diagnostic procedure Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002035 prolonged effect Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01R—MEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
- G01R31/00—Arrangements for testing electric properties; Arrangements for locating electric faults; Arrangements for electrical testing characterised by what is being tested not provided for elsewhere
- G01R31/50—Testing of electric apparatus, lines, cables or components for short-circuits, continuity, leakage current or incorrect line connections
- G01R31/58—Testing of lines, cables or conductors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/04—Training, enrolment or model building
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/18—Artificial neural networks; Connectionist approaches
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
- Y04S10/52—Outage or fault management, e.g. fault detection or location
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Biomedical Technology (AREA)
- Software Systems (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Probability & Statistics with Applications (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Signal Processing (AREA)
- Image Analysis (AREA)
Abstract
本发明适用于故障检测领域,提供了一种基于声纹识别技术的电缆故障诊断方法,对采集到的信号进行预处理,并使用预处理后的信号生成语谱图。接着,使用ImageNet数据集对ResNet‑18进行预训练提高模型特征提取能力。然后为迎合ImageNet的数据格式使得模型输入统一,将去生成的语谱图集合转化为RGB图像作为训练样本。使用迁移学习将ResNet‑18特征提取层提取连接deepRNN网络,在获取图像特征的基础上捕获信息时序上的信息,建立时序上的长时间依赖关系。将转化为RGB图像的信号作为训练集和测试集训练模型。模型最后利用softmax层来进行对是否存在电缆故障声音的判断。本发明利用新颖的故障诊断方法对电缆状态进行实时检测,具有高效,精确度高且时效性号的优势。
Description
技术领域
本发明属于故障检测领域,尤其涉及一种基于声纹识别技术的电缆故障诊断 方法。
背景技术
随着智能电网发展,电力电缆被应用于城市地下电网、海底输电网等。但随 着电缆运行年限的延长以及用户用电负荷的逐年增加,各种原因引起的电缆故障 也越来越频繁,影响电力系统的可靠供电与安全运行。由于电缆线路铺设的隐蔽 性及测试设备的局限性,一旦发生故障,寻找起来十分麻烦,往往需要花费大量 时间以及人力物力。
近年来,随着物联网技术的飞速发展,异常检测作为机器学习最突出的工业 应用之一,受到了研究者的广泛关注,当前的大多数方法都基于视觉领域的异常 检测。但这类应用存在非常大的局限性,当被检测对象不能被相机完全覆盖时就 会出现问题,导致无法进行预测的盲点。
发明内容
本发明的目的在于提供一种基于声纹识别技术的电缆故障诊断方法,旨在解 决上述背景技术中所提出的技术问题。
为实现上述目的,本发明提供了如下的技术方案。
一种基于声纹识别技术的电缆故障诊断方法,所述诊断方法包括以下步骤:
对采集到的声音信号进行预处理;
使用预处理后的声音信号生成语谱图;
使用ImageNet数据集对ResNet-18进行预训练;
将预处理生成的语谱图集合转化为RGB图像作为训练样本;
使用迁移学习将ResNet-18特征提取层提取连接deepRNN网络,在获取图像 特征的基础上捕获信息时序上的信息,建立时序上的长时间依赖关系;
将转化为RGB图像的声音信号作为训练集和测试集训练模型;
基于训练得到的模型并利用softmax层对是否存在电缆故障声音进行判断。
作为本发明优选实施例技术方案的进一步限定,所述对采集到的声音信号进 行预处理的步骤包括:
对声音信号高频部分加重,使声音信号频谱平坦化;
将一段长的声音信号语音数据划分为若干个片段;
对若干个片段进行加窗处理;
对声音信号进行端点检测,去除声音信号中的静音片段,保留有效的声音片 段。
作为本发明优选实施例技术方案的进一步限定,所述使用预处理后的声音信 号生成语谱图的步骤包括:
首先得到采样量化后的声音信号;
随后对所述声音信号进行傅里叶变换;
采用帕塞瓦尔计算声音信号的能量谱密度并取对数,并进行灰度图映射,获 得声音信号对应的语谱图。
作为本发明优选实施例技术方案的进一步限定,所述对所述声音信号进行傅 里叶变换所采用的公式为:
其中,其中F(ω)为f(t)的像函数,f(t)为F(ω)的原函数,t代表时间,ω代 表频率,e-iωt代表复变函数。
作为本发明优选实施例技术方案的进一步限定,所述进行灰度图映射的步骤 所采用的公式为:
其中,L(i),i=1,...,M2代表信号段的值;P(j,k),j=1,...,M,k=1,...,M 表示图像的像素强度;i代表截取信号样本标号,函数round{·}是舍入函数。
作为本发明优选实施例技术方案的进一步限定,所述使用迁移学习将 ResNet-18特征提取层提取连接deepRNN网络步骤包括:
将转换后的RGB格式的二维语谱图作为模型的输入;
由ResNet-18自动从输入的图片中提取声音片段的个性特征,其中, ResNet-18包含多个卷积层和池化层,其中卷积层能够提取语音片段的不同特 征,池化层则对输入的RGB图进行变形操作;
当ResNet-18对图像处理后的输出作为deepRNN的输入完成进一步的时 序建模。
作为本发明优选实施例技术方案的进一步限定,所述池化层在进行池化操作 时,仅在频率上进行池化,而不在时间上进行池化;其中,所述频率对应于语谱 图高度;所述时间对应于语谱图的宽度。
作为本发明优选实施例技术方案的进一步限定,所述在获取图像特征的基础 上捕获信息时序上的信息,建立时序上的长时间依赖关系的步骤包括:
RGB语谱图经ResNet-18处理后输出C张大小为F×T的小语谱图作为Deep RNN的输入,其中C表示特征映射的数量,F和T则分别是输出的小语谱图的 高度和宽度;
通过堆叠的每一层LSTM-RNN在时间轴上进行反馈循环从而捕获数据的时序 信息,捕获数据在时序上的长期依赖关系。
与现有技术相比,本发明提供的诊断方法通过迁移学习的方法克服了数据缺 乏导致模型预测精度不够的困难。本发明的诊断方法还通过结合ResNet和LSTM 的优点,在避免网络退化的问题下获得强大的特征提取能力并且有力的捕获了声 音数据在时间上的长时间依赖关系,进一步提高了精度。
本发明利用新颖的故障诊断方法对电缆状态进行实时检测,具有高效,精确 度高且时效性号的优势。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术 描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是 本发明的一些实施例。
图1为本发明一种基于声纹识别技术的电缆故障诊断方法的实现流程图;
图2为本发明提供的电缆故障诊断方法的一个子流程图;
图3为本发明提供的电缆故障诊断方法的另一个子流程图;
图4为本发明提供的电缆故障诊断方法的又一个子流程图;
图5为本发明提供的一种计算机设备的结构框图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施 例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用 以解释本发明,并不用于限定本发明。
近年来,随着物联网技术的飞速发展,异常检测作为机器学习最突出的工业 应用之一,受到了研究者的广泛关注,当前的大多数方法都基于视觉领域的异常 检测。但这类应用存在非常大的局限性,当被检测对象不能被相机完全覆盖时就 会出现问题,导致无法进行预测的盲点。
为了应对复杂的电缆环境声音给检测带来的挑战,同时提高检测时效性,本 发明提供了一种基于声纹识别技术的电缆故障诊断方法。
具体的,本发明的基于声纹识别技术的电缆故障诊断方法中,首先,对采集 到的信号进行预处理,使用预加重、分帧加窗、端点检测、语音增强四种技术, 去除静音片段的同时使语音信号频谱平坦化,并使用预处理后的信号生成语谱 图。接着,使用ImageNet数据集对ResNet-18进行预训练提高模型特征提取能 力。然后为迎合ImageNet的数据格式使得模型输入统一,将去生成的语谱图集 合转化为RGB图像作为训练样本。与此同时,使用迁移学习将ResNet-18特征提 取层提取连接deep RNN网络,在获取图像特征的基础上捕获信息时序上的信息, 建立时序上的长时间依赖关系。将转化为RGB图像的信号作为训练集和测试集训 练模型。模型最后利用softmax层来进行对是否存在电缆故障声音的判断。本发明利用新颖的故障诊断方法对电缆状态进行实时检测,具有高效,精确度高且时 效性号的优势。
以下结合具体实施例对本发明的具体实现进行详细描述。
实施例1
如图1所示,在本发明实施例中,一种基于声纹识别技术的电缆故障诊断方 法,所述的电缆故障诊断方法包括:
步骤S101:对采集到的声音信号进行预处理;
步骤S102:使用预处理后的声音信号生成语谱图;
步骤S103:使用ImageNet数据集对ResNet-18进行预训练;
步骤S104:将预处理生成的语谱图集合转化为RGB图像作为训练样本;
步骤S105:使用迁移学习将ResNet-18特征提取层提取连接deepRNN网络, 在获取图像特征的基础上捕获信息时序上的信息,建立时序上的长时间依赖关 系;
步骤S106:将转化为RGB图像的声音信号作为训练集和测试集训练模型;
步骤S107:基于训练得到的模型并利用softmax层对是否存在电缆故障声 音进行判断。
具体的,本发明中,首先,对采集到的信号进行预处理,使用预加重、分帧 加窗、端点检测、语音增强四种技术,去除静音片段的同时使语音信号频谱平坦 化,并使用预处理后的信号生成语谱图。
接着,使用ImageNet数据集对ResNet-18进行预训练提高模型特征提取能 力。然后为迎合ImageNet的数据格式使得模型输入统一,将去生成的语谱图集 合转化为RGB图像作为训练样本。
与此同时,使用迁移学习将ResNet-18特征提取层提取连接deep RNN网络, 在获取图像特征的基础上捕获信息时序上的信息,建立时序上的长时间依赖关 系。将转化为RGB图像的信号作为训练集和测试集训练模型。模型最后利用 softmax层来进行对是否存在电缆故障声音的判断。
本发明利用新颖的故障诊断方法对电缆状态进行实时检测,具有高效,精确 度高且时效性号的优势。
进一步的,如图2所示,在本发明实施例中,所述对采集到的声音信号进行 预处理的步骤S101包括:
步骤S1011:对声音信号高频部分加重,使声音信号频谱平坦化;
步骤S1012:将一段长的声音信号语音数据划分为若干个片段;
步骤S1013:对若干个片段进行加窗处理;
步骤S1014:对声音信号进行端点检测,去除声音信号中的静音片段,保留 有效的声音片段。
其中,由于信号源的物理特性的差异,使得产生的声音信号声纹特性不一。 但声音信号易受各种噪声干扰,对后续工作可能会带来影响。
因此,我们对声音信号进行包括预加重、分帧加窗、端点检测、语音增强的 预处理工作。首先进行预加重处理,其目的是对信号高频部分加重,减小噪声影 响,使语音信号频谱平坦化;随后将一段长的语音数据划分为若干个小片段,即 为分帧。
这些短语音信号能够保持短时平稳状态,可利用平稳过程方法处理。分帧带 来了信号的截断效应,为了使截断处的信号能平滑过渡,需要通过加窗操作实现。 最后对语音信号进行端点检测,目的是去除信号中的静音片段,保留有效的语音 片段。
进一步的,传统使用滤波器提取特征容易丢失频域上的信息,因此本发明通 过生成语谱图的方法来尽可能保留声音信号的特征信息,以便后续卷积神经网络 (CNN)的特征提取。
如图3所示在本发明实施例中,所述使用预处理后的声音信号生成语谱图的 步骤S102包括:
步骤S1021:首先得到采样量化后的声音信号;
步骤S1022:随后对所述声音信号进行傅里叶变换;所述对所述声音信号进 行傅里叶变换所采用的公式为:
其中,其中F(ω)为f(t)的像函数,f(t)为F(ω)的原函数,t代表时间,ω代 表频率,e-iωt代表复变函数。
进一步的,在本发明实施例中,所述使用预处理后的声音信号生成语谱图的 步骤S102还包括:
步骤S1023:采用帕塞瓦尔计算声音信号的能量谱密度并取对数,并进行灰 度图映射,获得声音信号对应的语谱图。
作为优选,所述进行灰度图映射的步骤所采用的公式为:
其中,L(i),i=1,...,M2代表信号段的值;P(j,k),j=1,...,M,k=1,...,M 表示图像的像素强度;i代表截取信号样本标号,函数round{·}是舍入函数。
为了保证预训练模型的输入规格统一(ImageNet为RGB格式图像库),需 将二维灰度图像的语谱图转为RGB格式图像。、
经多种实验表明,CNN在故障检测方面有显著效果。但由于有效声音信号缺 乏,无法训练出深层模型,检测精度受限。为了解决这个问题,本发明引入了迁 移学习策略,利用ImageNet强大的图片数据预训练出ResNet-18作为特征提取 器。
进一步的,如图4所示,在本发明实施例中,所述使用迁移学习将ResNet-18 特征提取层提取连接deepRNN网络步骤步骤S105:包括:
步骤S1051:将转换后的RGB格式的二维语谱图作为模型的输入;
步骤S1052:由ResNet-18自动从输入的图片中提取声音片段的个性特征, 其中,ResNet-18包含多个卷积层和池化层,其中卷积层能够提取语音片段的不 同特征,池化层则对输入的RGB图进行变形操作;
步骤S1053:当ResNet-18对图像处理后的输出作为deepRNN的输入完成 进一步的时序建模。
进一步的,在本发明实施例中,所述池化层在进行池化操作时,仅在频率上 进行池化,而不在时间上进行池化;其中,所述频率对应于语谱图高度;所述时 间对应于语谱图的宽度。
因此,在本发明实施例中,将转换后的RGB格式的二维语谱图作为模型的输 入,由ResNet-18自动从输入的图片中提取声音片段的个性特征。ResNet-18包 含多个卷积层和池化层,其中卷积层能够提取语音片段的不同特征;池化层则可 以对输入的RGB图进行平移、缩放或其他变形操作后,仍然产生相同池化后特征, 从而减少频谱变化导致的影响。其中的池化层在进行池化操作时,仅在频率(对 应于语谱图高度)上进行池化,而没有在时间(对应于语谱图的宽度)上进行池化。 这主要是在时间上池化很可能导致语谱图中时序信息丢失,因此只在频率上对信 号进行池化;当ResNet-18对图像处理后的输出作为deepRNN的输入完成进一 步的时序建模。
作为本发明优选实施例技术方案的进一步限定,所述在获取图像特征的基础 上捕获信息时序上的信息,建立时序上的长时间依赖关系的步骤包括:
步骤S1054:RGB语谱图经ResNet-18处理后输出C张大小为F×T的小语谱 图作为Deep RNN的输入,其中C表示特征映射的数量,F和T则分别是输出 的小语谱图的高度和宽度;
步骤S1055:通过堆叠的每一层LSTM-RNN在时间轴上进行反馈循环从而捕 获数据的时序信息,捕获数据在时序上的长期依赖关系。
ResNet-18虽然在图像方面展现了强大的特征提取能力,但其感受野是有限 的,无法捕捉声音事件中的时间依赖关系。对于长时间的声音数据进行片段式的 截取可能会导致误判,因此捕获时序信息对于系统是十分有用。RGB语谱图经 ResNet-18处理后输出C张大小为F×T的小语谱图作为Deep RNN的输入其中C 表示特征映射的数量,F和T则分别是输出的小语谱图的高度和宽度。通过堆 叠的每一层LSTM-RNN在时间轴上进行反馈循环从而捕获数据的时序信息,捕获 数据在时序上的长期依赖关系。最后通过softmax层来进行对是否存在电缆故障 声音的判断。
将预处理后的数据按照3:2的比例作为训练集和测试集作为输入进行训练 和测试模型,最后通过softmax层来进行对是否存在电缆故障声音的判断。
综上所述,本发明提供的诊断方法通过迁移学习的方法克服了数据缺乏导致 模型预测精度不够的困难。本发明的诊断方法还通过结合ResNet和LSTM的优点, 在避免网络退化的问题下获得强大的特征提取能力并且有力的捕获了声音数据 在时间上的长时间依赖关系,进一步提高了精度。
实施例2
如图5所示,在本发明实施例中,本发明还提供了一种计算机设备。
所述设备200包括存储器201、处理器202以及存储在所述存储器201中并 可在所述处理器202上运行的计算机可读指令,所述处理器202执行所述计算机 可读指令时实现如实施例1所提供的基于声纹识别技术的电缆故障诊断方法。
其中,所述基于声纹识别技术的电缆故障诊断方法包括以下步骤:对采集到 的声音信号进行预处理;使用预处理后的声音信号生成语谱图;使用ImageNet 数据集对ResNet-18进行预训练;将预处理生成的语谱图集合转化为RGB图像作 为训练样本;使用迁移学习将ResNet-18特征提取层提取连接deepRNN网络,在 获取图像特征的基础上捕获信息时序上的信息,建立时序上的长时间依赖关系; 将转化为RGB图像的声音信号作为训练集和测试集训练模型;基于训练得到的模 型并利用softmax层对是否存在电缆故障声音进行判断。
此外,本发明实施例提供的所述设备200还可具有通讯接口203,用于接收 控制指令。
实施例4
在本发明实施例中,本发明还提供了一种可读存储介质。
所述可读存储介质存储有计算机可读指令,所述计算机可读指令被一个或多 个处理器执行时,使得所述一个或多个处理器执行如所提供的基于声纹识别技术 的电缆故障诊断方法。
其中,所述基于声纹识别技术的电缆故障诊断方法包括以下步骤:对采集到 的声音信号进行预处理;使用预处理后的声音信号生成语谱图;使用ImageNet 数据集对ResNet-18进行预训练;将预处理生成的语谱图集合转化为RGB图像作 为训练样本;使用迁移学习将ResNet-18特征提取层提取连接deepRNN网络,在 获取图像特征的基础上捕获信息时序上的信息,建立时序上的长时间依赖关系; 将转化为RGB图像的声音信号作为训练集和测试集训练模型;基于训练得到的模 型并利用softmax层对是否存在电缆故障声音进行判断。
在本发明的各种实施例中,应理解,所述各过程的序号的大小并不意味着执 行顺序的必然先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本 发明实施例的实施过程构成任何限定。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单 元显示的部件可以是或者也可以不是物单元,即可位于一个地方,或者也可以分 布到多个网络单元上。可根据实际的需要选择其中的部分或全部单元来实现本实 施例方案的目的。
另外,在本发明各实施例中的各功能单元可以集成在一个处理单元中,也可 以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。所 述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实 现。
所述集成的单元若以软件功能单元的形式实现并作为独立的产品销售或使 用时,可以存储在一个计算机可获取的存储器中。基于这样的理解,本发明的技 术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或者部 分,可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中, 包括若干请求用以使得一台计算机设备(可以为个人计算机、服务器或者网络设 备等,具体可以是计算机设备中的处理器)执行本发明的各个实施例所述方法的 部分或全部步骤。
在本发明所提供的实施例中,应理解,“与A对应的B”表示B与A相关联, 根据A可以确定B。但还应理解,根据A确定B并不意味着仅仅根据A确定B, 还可以根据A和/或其他信息确定B。
本领域普通技术人员可以理解所述实施例的各种方法中的部分或全部步骤 是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储 介质中,存储介质包括只读存储器(Read-Only Memory,ROM)、随机存储器 (Random Access Memory,11RAM)、可编程只读存储器(Programmable Read-only Memory,PROM)、可擦除可编程只读存储器(Erasable Programmable Read-Only Memory,EPROM)、一次可编程只读存储器(One-time Programma ble Read-Only Memory,OTPROM)、电子抹除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory,EEPROM)、只读光盘(CompactDisc Read-Only Memory,CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于 携带或存储数据的计算机可读的任何其他介质。
以上对本发明实施例公开的信息交互的方法、装置、电子设备及存储介质进 行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述, 以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本 领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有 改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (8)
1.一种基于声纹识别技术的电缆故障诊断方法,其特征在于,所述诊断方法包括以下步骤:
对采集到的声音信号进行预处理;
使用预处理后的声音信号生成语谱图;
使用ImageNet数据集对ResNet-18进行预训练;
将预处理生成的语谱图集合转化为RGB图像作为训练样本;
使用迁移学习将ResNet-18特征提取层提取连接deepRNN网络,在获取图像特征的基础上捕获信息时序上的信息,建立时序上的长时间依赖关系;
将转化为RGB图像的声音信号作为训练集和测试集训练模型;
基于训练得到的模型并利用softmax层对是否存在电缆故障声音进行判断。
2.根据权利要求1所述的基于声纹识别技术的电缆故障诊断方法,其特征在于,所述对采集到的声音信号进行预处理的步骤包括:
对声音信号高频部分加重,使声音信号频谱平坦化;
将一段长的声音信号语音数据划分为若干个片段;
对若干个片段进行加窗处理;
对声音信号进行端点检测,去除声音信号中的静音片段,保留有效的声音片段。
3.根据权利要求2所述的基于声纹识别技术的电缆故障诊断方法,其特征在于,所述使用预处理后的声音信号生成语谱图的步骤包括:
首先得到采样量化后的声音信号;
随后对所述声音信号进行傅里叶变换;
采用帕塞瓦尔计算声音信号的能量谱密度并取对数,并进行灰度图映射,获得声音信号对应的语谱图。
6.根据权利要求3所述的基于声纹识别技术的电缆故障诊断方法,其特征在于,所述使用迁移学习将ResNet-18特征提取层提取连接deepRNN网络步骤包括:
将转换后的RGB格式的二维语谱图作为模型的输入;
由ResNet-18自动从输入的图片中提取声音片段的个性特征,其中,ResNet-18包含多个卷积层和池化层,其中卷积层能够提取语音片段的不同特征,池化层则对输入的RGB图进行变形操作;
当ResNet-18对图像处理后的输出作为deepRNN的输入完成进一步的时序建模。
7.根据权利要求6所述的基于声纹识别技术的电缆故障诊断方法,其特征在于,所述池化层在进行池化操作时,仅在频率上进行池化,而不在时间上进行池化;其中,所述频率对应于语谱图高度;所述时间对应于语谱图的宽度。
8.根据权利要求7所述的基于声纹识别技术的电缆故障诊断方法,其特征在于,所述在获取图像特征的基础上捕获信息时序上的信息,建立时序上的长时间依赖关系的步骤包括:
RGB语谱图经ResNet-18处理后输出C张大小为F×T的小语谱图作为Deep RNN的输入,其中C表示特征映射的数量,F和T则分别是输出的小语谱图的高度和宽度;
通过堆叠的每一层LSTM-RNN在时间轴上进行反馈循环从而捕获数据的时序信息,捕获数据在时序上的长期依赖关系。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210518298.XA CN114859269A (zh) | 2022-05-13 | 2022-05-13 | 一种基于声纹识别技术的电缆故障诊断方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210518298.XA CN114859269A (zh) | 2022-05-13 | 2022-05-13 | 一种基于声纹识别技术的电缆故障诊断方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114859269A true CN114859269A (zh) | 2022-08-05 |
Family
ID=82637420
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210518298.XA Pending CN114859269A (zh) | 2022-05-13 | 2022-05-13 | 一种基于声纹识别技术的电缆故障诊断方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114859269A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115711669A (zh) * | 2022-11-07 | 2023-02-24 | 石家庄宜中机电技术有限公司 | 一种井筒设备故障诊断方法、装置、终端及存储介质 |
CN116665711A (zh) * | 2023-07-26 | 2023-08-29 | 中国南方电网有限责任公司超高压输电公司广州局 | 气体绝缘开关设备在线监测方法、装置和计算机设备 |
-
2022
- 2022-05-13 CN CN202210518298.XA patent/CN114859269A/zh active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115711669A (zh) * | 2022-11-07 | 2023-02-24 | 石家庄宜中机电技术有限公司 | 一种井筒设备故障诊断方法、装置、终端及存储介质 |
CN116665711A (zh) * | 2023-07-26 | 2023-08-29 | 中国南方电网有限责任公司超高压输电公司广州局 | 气体绝缘开关设备在线监测方法、装置和计算机设备 |
CN116665711B (zh) * | 2023-07-26 | 2024-01-12 | 中国南方电网有限责任公司超高压输电公司广州局 | 气体绝缘开关设备在线监测方法、装置和计算机设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114859269A (zh) | 一种基于声纹识别技术的电缆故障诊断方法 | |
CN111325095A (zh) | 基于声波信号的设备健康状态智能检测方法和系统 | |
CN108962231B (zh) | 一种语音分类方法、装置、服务器及存储介质 | |
CN112489623A (zh) | 语种识别模型的训练方法、语种识别方法及相关设备 | |
CN113345460B (zh) | 音频信号处理方法、装置、设备及存储介质 | |
CN113823264A (zh) | 语音识别方法、装置、计算机可读存储介质及计算机设备 | |
WO2019232833A1 (zh) | 语音区分方法、装置、计算机设备及存储介质 | |
CN116912783B (zh) | 核酸检测平台的状态监控方法及系统 | |
CN116741159A (zh) | 音频分类及模型的训练方法、装置、电子设备和存储介质 | |
CN115035887A (zh) | 语音信号的处理方法、装置、设备及介质 | |
CN114994456A (zh) | 一种基于gru音频数据处理的地下电缆接口断裂故障检测方法 | |
CN113761282B (zh) | 视频查重方法、装置、电子设备以及存储介质 | |
CN112735466B (zh) | 一种音频检测方法及装置 | |
CN116959422B (zh) | 多对多的实时语音变音方法、设备及存储介质 | |
CN109767790A (zh) | 一种语音情感识别方法及系统 | |
CN113782044A (zh) | 一种语音增强方法及装置 | |
CN117419915A (zh) | 一种多源信息融合的电机故障诊断方法 | |
CN117528135A (zh) | 语音驱动的脸部视频生成方法、装置、电子设备及介质 | |
CN116884435A (zh) | 一种基于音频提示学习的声音事件检测方法及装置 | |
CN117496990A (zh) | 语音去噪方法、装置、计算机设备及存储介质 | |
CN113488069A (zh) | 基于生成式对抗网络的语音高维特征快速提取方法和装置 | |
CN106782550A (zh) | 一种基于dsp芯片的自动语音识别系统 | |
CN112102830B (zh) | 一种粗颗粒度指令识别方法和装置 | |
KR102300599B1 (ko) | 가중치를 이용한 음성 신호의 스트레스 판별 방법 및 그를 위한 장치 | |
CN118395361B (zh) | 数据不平衡下的桥梁拉索声发射断丝信号识别方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |