CN114859269A

CN114859269A - 一种基于声纹识别技术的电缆故障诊断方法

Info

Publication number: CN114859269A
Application number: CN202210518298.XA
Authority: CN
Inventors: 倪晓璐; 陈荣鑫; 孟庆铭; 周铭权; 郭能俊; 唐雷鸣; 周杰; 陶倩敏
Original assignee: Hangzhou Juqi Information Technology Co ltd
Current assignee: Hangzhou Juqi Information Technology Co ltd
Priority date: 2022-05-13
Filing date: 2022-05-13
Publication date: 2022-08-05

Abstract

本发明适用于故障检测领域，提供了一种基于声纹识别技术的电缆故障诊断方法，对采集到的信号进行预处理，并使用预处理后的信号生成语谱图。接着，使用ImageNet数据集对ResNet‑18进行预训练提高模型特征提取能力。然后为迎合ImageNet的数据格式使得模型输入统一，将去生成的语谱图集合转化为RGB图像作为训练样本。使用迁移学习将ResNet‑18特征提取层提取连接deepRNN网络，在获取图像特征的基础上捕获信息时序上的信息，建立时序上的长时间依赖关系。将转化为RGB图像的信号作为训练集和测试集训练模型。模型最后利用softmax层来进行对是否存在电缆故障声音的判断。本发明利用新颖的故障诊断方法对电缆状态进行实时检测，具有高效，精确度高且时效性号的优势。

Description

一种基于声纹识别技术的电缆故障诊断方法

技术领域

本发明属于故障检测领域，尤其涉及一种基于声纹识别技术的电缆故障诊断方法。

背景技术

随着智能电网发展，电力电缆被应用于城市地下电网、海底输电网等。但随着电缆运行年限的延长以及用户用电负荷的逐年增加，各种原因引起的电缆故障也越来越频繁，影响电力系统的可靠供电与安全运行。由于电缆线路铺设的隐蔽性及测试设备的局限性，一旦发生故障，寻找起来十分麻烦，往往需要花费大量时间以及人力物力。

近年来，随着物联网技术的飞速发展，异常检测作为机器学习最突出的工业应用之一，受到了研究者的广泛关注，当前的大多数方法都基于视觉领域的异常检测。但这类应用存在非常大的局限性，当被检测对象不能被相机完全覆盖时就会出现问题，导致无法进行预测的盲点。

发明内容

本发明的目的在于提供一种基于声纹识别技术的电缆故障诊断方法，旨在解决上述背景技术中所提出的技术问题。

为实现上述目的，本发明提供了如下的技术方案。

一种基于声纹识别技术的电缆故障诊断方法，所述诊断方法包括以下步骤：

对采集到的声音信号进行预处理；

使用预处理后的声音信号生成语谱图；

使用ImageNet数据集对ResNet-18进行预训练；

将预处理生成的语谱图集合转化为RGB图像作为训练样本；

使用迁移学习将ResNet-18特征提取层提取连接deepRNN网络，在获取图像特征的基础上捕获信息时序上的信息，建立时序上的长时间依赖关系；

将转化为RGB图像的声音信号作为训练集和测试集训练模型；

基于训练得到的模型并利用softmax层对是否存在电缆故障声音进行判断。

作为本发明优选实施例技术方案的进一步限定，所述对采集到的声音信号进行预处理的步骤包括：

对声音信号高频部分加重，使声音信号频谱平坦化；

将一段长的声音信号语音数据划分为若干个片段；

对若干个片段进行加窗处理；

对声音信号进行端点检测，去除声音信号中的静音片段，保留有效的声音片段。

作为本发明优选实施例技术方案的进一步限定，所述使用预处理后的声音信号生成语谱图的步骤包括：

首先得到采样量化后的声音信号；

随后对所述声音信号进行傅里叶变换；

采用帕塞瓦尔计算声音信号的能量谱密度并取对数，并进行灰度图映射，获得声音信号对应的语谱图。

作为本发明优选实施例技术方案的进一步限定，所述对所述声音信号进行傅里叶变换所采用的公式为：

其中，其中F(ω)为f(t)的像函数，f(t)为F(ω)的原函数，t代表时间，ω代表频率，e^-iωt代表复变函数。

作为本发明优选实施例技术方案的进一步限定，所述进行灰度图映射的步骤所采用的公式为：

其中，L(i),i＝1,...,M²代表信号段的值；P(j,k)，j＝1,...,M,k＝1,...,M 表示图像的像素强度；i代表截取信号样本标号，函数round{·}是舍入函数。

作为本发明优选实施例技术方案的进一步限定，所述使用迁移学习将 ResNet-18特征提取层提取连接deepRNN网络步骤包括：

将转换后的RGB格式的二维语谱图作为模型的输入；

由ResNet-18自动从输入的图片中提取声音片段的个性特征，其中， ResNet-18包含多个卷积层和池化层，其中卷积层能够提取语音片段的不同特征，池化层则对输入的RGB图进行变形操作；

当ResNet-18对图像处理后的输出作为deepRNN的输入完成进一步的时序建模。

作为本发明优选实施例技术方案的进一步限定，所述池化层在进行池化操作时，仅在频率上进行池化，而不在时间上进行池化；其中，所述频率对应于语谱图高度；所述时间对应于语谱图的宽度。

作为本发明优选实施例技术方案的进一步限定，所述在获取图像特征的基础上捕获信息时序上的信息，建立时序上的长时间依赖关系的步骤包括：

RGB语谱图经ResNet-18处理后输出C张大小为F×T的小语谱图作为Deep RNN的输入，其中C表示特征映射的数量，F和T则分别是输出的小语谱图的高度和宽度；

通过堆叠的每一层LSTM-RNN在时间轴上进行反馈循环从而捕获数据的时序信息，捕获数据在时序上的长期依赖关系。

与现有技术相比，本发明提供的诊断方法通过迁移学习的方法克服了数据缺乏导致模型预测精度不够的困难。本发明的诊断方法还通过结合ResNet和LSTM 的优点，在避免网络退化的问题下获得强大的特征提取能力并且有力的捕获了声音数据在时间上的长时间依赖关系，进一步提高了精度。

本发明利用新颖的故障诊断方法对电缆状态进行实时检测，具有高效，精确度高且时效性号的优势。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例。

图1为本发明一种基于声纹识别技术的电缆故障诊断方法的实现流程图；

图2为本发明提供的电缆故障诊断方法的一个子流程图；

图3为本发明提供的电缆故障诊断方法的另一个子流程图；

图4为本发明提供的电缆故障诊断方法的又一个子流程图；

图5为本发明提供的一种计算机设备的结构框图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

为了应对复杂的电缆环境声音给检测带来的挑战，同时提高检测时效性，本发明提供了一种基于声纹识别技术的电缆故障诊断方法。

具体的，本发明的基于声纹识别技术的电缆故障诊断方法中，首先，对采集到的信号进行预处理，使用预加重、分帧加窗、端点检测、语音增强四种技术，去除静音片段的同时使语音信号频谱平坦化，并使用预处理后的信号生成语谱图。接着，使用ImageNet数据集对ResNet-18进行预训练提高模型特征提取能力。然后为迎合ImageNet的数据格式使得模型输入统一，将去生成的语谱图集合转化为RGB图像作为训练样本。与此同时，使用迁移学习将ResNet-18特征提取层提取连接deep RNN网络，在获取图像特征的基础上捕获信息时序上的信息，建立时序上的长时间依赖关系。将转化为RGB图像的信号作为训练集和测试集训练模型。模型最后利用softmax层来进行对是否存在电缆故障声音的判断。本发明利用新颖的故障诊断方法对电缆状态进行实时检测，具有高效，精确度高且时效性号的优势。

以下结合具体实施例对本发明的具体实现进行详细描述。

实施例1

如图1所示，在本发明实施例中，一种基于声纹识别技术的电缆故障诊断方法，所述的电缆故障诊断方法包括：

步骤S101：对采集到的声音信号进行预处理；

步骤S102：使用预处理后的声音信号生成语谱图；

步骤S103：使用ImageNet数据集对ResNet-18进行预训练；

步骤S104：将预处理生成的语谱图集合转化为RGB图像作为训练样本；

步骤S105：使用迁移学习将ResNet-18特征提取层提取连接deepRNN网络，在获取图像特征的基础上捕获信息时序上的信息，建立时序上的长时间依赖关系；

步骤S106：将转化为RGB图像的声音信号作为训练集和测试集训练模型；

步骤S107：基于训练得到的模型并利用softmax层对是否存在电缆故障声音进行判断。

具体的，本发明中，首先，对采集到的信号进行预处理，使用预加重、分帧加窗、端点检测、语音增强四种技术，去除静音片段的同时使语音信号频谱平坦化，并使用预处理后的信号生成语谱图。

接着，使用ImageNet数据集对ResNet-18进行预训练提高模型特征提取能力。然后为迎合ImageNet的数据格式使得模型输入统一，将去生成的语谱图集合转化为RGB图像作为训练样本。

与此同时，使用迁移学习将ResNet-18特征提取层提取连接deep RNN网络，在获取图像特征的基础上捕获信息时序上的信息，建立时序上的长时间依赖关系。将转化为RGB图像的信号作为训练集和测试集训练模型。模型最后利用 softmax层来进行对是否存在电缆故障声音的判断。

进一步的，如图2所示，在本发明实施例中，所述对采集到的声音信号进行预处理的步骤S101包括：

步骤S1011：对声音信号高频部分加重，使声音信号频谱平坦化；

步骤S1012：将一段长的声音信号语音数据划分为若干个片段；

步骤S1013：对若干个片段进行加窗处理；

步骤S1014：对声音信号进行端点检测，去除声音信号中的静音片段，保留有效的声音片段。

其中，由于信号源的物理特性的差异，使得产生的声音信号声纹特性不一。但声音信号易受各种噪声干扰，对后续工作可能会带来影响。

因此，我们对声音信号进行包括预加重、分帧加窗、端点检测、语音增强的预处理工作。首先进行预加重处理，其目的是对信号高频部分加重，减小噪声影响，使语音信号频谱平坦化；随后将一段长的语音数据划分为若干个小片段，即为分帧。

这些短语音信号能够保持短时平稳状态，可利用平稳过程方法处理。分帧带来了信号的截断效应，为了使截断处的信号能平滑过渡，需要通过加窗操作实现。最后对语音信号进行端点检测，目的是去除信号中的静音片段，保留有效的语音片段。

进一步的，传统使用滤波器提取特征容易丢失频域上的信息，因此本发明通过生成语谱图的方法来尽可能保留声音信号的特征信息，以便后续卷积神经网络 (CNN)的特征提取。

如图3所示在本发明实施例中，所述使用预处理后的声音信号生成语谱图的步骤S102包括：

步骤S1021：首先得到采样量化后的声音信号；

步骤S1022：随后对所述声音信号进行傅里叶变换；所述对所述声音信号进行傅里叶变换所采用的公式为：

进一步的，在本发明实施例中，所述使用预处理后的声音信号生成语谱图的步骤S102还包括：

步骤S1023：采用帕塞瓦尔计算声音信号的能量谱密度并取对数，并进行灰度图映射，获得声音信号对应的语谱图。

作为优选，所述进行灰度图映射的步骤所采用的公式为：

为了保证预训练模型的输入规格统一(ImageNet为RGB格式图像库)，需将二维灰度图像的语谱图转为RGB格式图像。、

经多种实验表明，CNN在故障检测方面有显著效果。但由于有效声音信号缺乏，无法训练出深层模型，检测精度受限。为了解决这个问题，本发明引入了迁移学习策略，利用ImageNet强大的图片数据预训练出ResNet-18作为特征提取器。

进一步的，如图4所示，在本发明实施例中，所述使用迁移学习将ResNet-18 特征提取层提取连接deepRNN网络步骤步骤S105：包括：

步骤S1051：将转换后的RGB格式的二维语谱图作为模型的输入；

步骤S1052：由ResNet-18自动从输入的图片中提取声音片段的个性特征，其中，ResNet-18包含多个卷积层和池化层，其中卷积层能够提取语音片段的不同特征，池化层则对输入的RGB图进行变形操作；

步骤S1053：当ResNet-18对图像处理后的输出作为deepRNN的输入完成进一步的时序建模。

进一步的，在本发明实施例中，所述池化层在进行池化操作时，仅在频率上进行池化，而不在时间上进行池化；其中，所述频率对应于语谱图高度；所述时间对应于语谱图的宽度。

因此，在本发明实施例中，将转换后的RGB格式的二维语谱图作为模型的输入，由ResNet-18自动从输入的图片中提取声音片段的个性特征。ResNet-18包含多个卷积层和池化层，其中卷积层能够提取语音片段的不同特征；池化层则可以对输入的RGB图进行平移、缩放或其他变形操作后，仍然产生相同池化后特征，从而减少频谱变化导致的影响。其中的池化层在进行池化操作时，仅在频率(对应于语谱图高度)上进行池化，而没有在时间(对应于语谱图的宽度)上进行池化。这主要是在时间上池化很可能导致语谱图中时序信息丢失，因此只在频率上对信号进行池化；当ResNet-18对图像处理后的输出作为deepRNN的输入完成进一步的时序建模。

步骤S1054：RGB语谱图经ResNet-18处理后输出C张大小为F×T的小语谱图作为Deep RNN的输入，其中C表示特征映射的数量，F和T则分别是输出的小语谱图的高度和宽度；

步骤S1055：通过堆叠的每一层LSTM-RNN在时间轴上进行反馈循环从而捕获数据的时序信息，捕获数据在时序上的长期依赖关系。

ResNet-18虽然在图像方面展现了强大的特征提取能力，但其感受野是有限的，无法捕捉声音事件中的时间依赖关系。对于长时间的声音数据进行片段式的截取可能会导致误判，因此捕获时序信息对于系统是十分有用。RGB语谱图经 ResNet-18处理后输出C张大小为F×T的小语谱图作为Deep RNN的输入其中C 表示特征映射的数量，F和T则分别是输出的小语谱图的高度和宽度。通过堆叠的每一层LSTM-RNN在时间轴上进行反馈循环从而捕获数据的时序信息，捕获数据在时序上的长期依赖关系。最后通过softmax层来进行对是否存在电缆故障声音的判断。

将预处理后的数据按照3：2的比例作为训练集和测试集作为输入进行训练和测试模型，最后通过softmax层来进行对是否存在电缆故障声音的判断。

综上所述，本发明提供的诊断方法通过迁移学习的方法克服了数据缺乏导致模型预测精度不够的困难。本发明的诊断方法还通过结合ResNet和LSTM的优点，在避免网络退化的问题下获得强大的特征提取能力并且有力的捕获了声音数据在时间上的长时间依赖关系，进一步提高了精度。

实施例2

如图5所示，在本发明实施例中，本发明还提供了一种计算机设备。

所述设备200包括存储器201、处理器202以及存储在所述存储器201中并可在所述处理器202上运行的计算机可读指令，所述处理器202执行所述计算机可读指令时实现如实施例1所提供的基于声纹识别技术的电缆故障诊断方法。

其中，所述基于声纹识别技术的电缆故障诊断方法包括以下步骤：对采集到的声音信号进行预处理；使用预处理后的声音信号生成语谱图；使用ImageNet 数据集对ResNet-18进行预训练；将预处理生成的语谱图集合转化为RGB图像作为训练样本；使用迁移学习将ResNet-18特征提取层提取连接deepRNN网络，在获取图像特征的基础上捕获信息时序上的信息，建立时序上的长时间依赖关系；将转化为RGB图像的声音信号作为训练集和测试集训练模型；基于训练得到的模型并利用softmax层对是否存在电缆故障声音进行判断。

此外，本发明实施例提供的所述设备200还可具有通讯接口203，用于接收控制指令。

实施例4

在本发明实施例中，本发明还提供了一种可读存储介质。

所述可读存储介质存储有计算机可读指令，所述计算机可读指令被一个或多个处理器执行时，使得所述一个或多个处理器执行如所提供的基于声纹识别技术的电缆故障诊断方法。

在本发明的各种实施例中，应理解，所述各过程的序号的大小并不意味着执行顺序的必然先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本发明实施例的实施过程构成任何限定。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物单元，即可位于一个地方，或者也可以分布到多个网络单元上。可根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。

另外，在本发明各实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。所述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元若以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可获取的存储器中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或者部分，可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储器中，包括若干请求用以使得一台计算机设备(可以为个人计算机、服务器或者网络设备等，具体可以是计算机设备中的处理器)执行本发明的各个实施例所述方法的部分或全部步骤。

在本发明所提供的实施例中，应理解，“与A对应的B”表示B与A相关联，根据A可以确定B。但还应理解，根据A确定B并不意味着仅仅根据A确定B，还可以根据A和/或其他信息确定B。

本领域普通技术人员可以理解所述实施例的各种方法中的部分或全部步骤是可以通过程序来指令相关的硬件来完成，该程序可以存储于一计算机可读存储介质中，存储介质包括只读存储器(Read-Only Memory，ROM)、随机存储器 (Random Access Memory，11RAM)、可编程只读存储器(Programmable Read-only Memory，PROM)、可擦除可编程只读存储器(Erasable Programmable Read-Only Memory，EPROM)、一次可编程只读存储器(One-time Programma ble Read-Only Memory，OTPROM)、电子抹除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory，EEPROM)、只读光盘(CompactDisc Read-Only Memory，CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。

以上对本发明实施例公开的信息交互的方法、装置、电子设备及存储介质进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种基于声纹识别技术的电缆故障诊断方法，其特征在于，所述诊断方法包括以下步骤：

对采集到的声音信号进行预处理；

使用预处理后的声音信号生成语谱图；

使用ImageNet数据集对ResNet-18进行预训练；

将预处理生成的语谱图集合转化为RGB图像作为训练样本；

将转化为RGB图像的声音信号作为训练集和测试集训练模型；

2.根据权利要求1所述的基于声纹识别技术的电缆故障诊断方法，其特征在于，所述对采集到的声音信号进行预处理的步骤包括：

对声音信号高频部分加重，使声音信号频谱平坦化；

将一段长的声音信号语音数据划分为若干个片段；

对若干个片段进行加窗处理；

3.根据权利要求2所述的基于声纹识别技术的电缆故障诊断方法，其特征在于，所述使用预处理后的声音信号生成语谱图的步骤包括：

首先得到采样量化后的声音信号；

随后对所述声音信号进行傅里叶变换；

4.根据权利要求3所述的基于声纹识别技术的电缆故障诊断方法，其特征在于，所述对所述声音信号进行傅里叶变换所采用的公式为：

5.根据权利要求3或4所述的基于声纹识别技术的电缆故障诊断方法，其特征在于，所述进行灰度图映射的步骤所采用的公式为：

其中，L(i),i＝1,...,M²代表信号段的值；P(j,k)，j＝1,...,M,k＝1,...,M表示图像的像素强度；i代表截取信号样本标号，函数round{·}是舍入函数。

6.根据权利要求3所述的基于声纹识别技术的电缆故障诊断方法，其特征在于，所述使用迁移学习将ResNet-18特征提取层提取连接deepRNN网络步骤包括：

将转换后的RGB格式的二维语谱图作为模型的输入；

由ResNet-18自动从输入的图片中提取声音片段的个性特征，其中，ResNet-18包含多个卷积层和池化层，其中卷积层能够提取语音片段的不同特征，池化层则对输入的RGB图进行变形操作；

7.根据权利要求6所述的基于声纹识别技术的电缆故障诊断方法，其特征在于，所述池化层在进行池化操作时，仅在频率上进行池化，而不在时间上进行池化；其中，所述频率对应于语谱图高度；所述时间对应于语谱图的宽度。

8.根据权利要求7所述的基于声纹识别技术的电缆故障诊断方法，其特征在于，所述在获取图像特征的基础上捕获信息时序上的信息，建立时序上的长时间依赖关系的步骤包括：