CN117894319A

CN117894319A - 基于机器学习数据生成的小样本声纹识别模型训练方法

Info

Publication number: CN117894319A
Application number: CN202410290482.2A
Authority: CN
Inventors: 张一�; 夏烨; 徐东; 陈双辉; 卢桢; 胡彬; 裔伟; 王菲菲; 吴万聪; 姚柏存
Original assignee: Nanjing Saturn Information Technology Co ltd
Current assignee: Nanjing Saturn Information Technology Co ltd
Priority date: 2024-03-14
Filing date: 2024-03-14
Publication date: 2024-04-16
Anticipated expiration: 2044-03-14
Also published as: CN117894319B

Abstract

本发明属于局部放电故障识别技术领域，公开了一种基于机器学习数据生成的小样本声纹识别模型训练方法，方法包括步骤：采集任务场景中的原始语音信号；使用小波变换算法，将所述原始语音信号分离为环境噪声和局部放电信号，生成局部放电类型数据集；将局部放电类型数据集分为调优训练数据集和预训练数据集，使用同源多簇聚类算法，对所述预训练数据集进行样本空间扩充，生成样本量满足预设要求的预训练扩展数据集；使用预训练扩展数据集对预先构建的神经网络模型进行预训练，使用所述调优训练数据集进行调优训练，得到用于任务场景中局部放电检测的声纹识别模型。本发明能够有效扩增局部放电样本空间，解决当前声纹识别法鲁棒性不够理想等问题。

Description

基于机器学习数据生成的小样本声纹识别模型训练方法

技术领域

本发明属于局部放电故障识别技术领域，涉及基于声纹识别局放类型技术，具体涉及一种基于机器学习数据生成的小样本声纹识别模型训练方法。

背景技术

局部放电（Partial discharge，PD）检测在评估输电线路和配电线路的设备绝缘性能方面具有至关重要的作用。目前对于局部放电的主要检测方法包括超高频测量法、红/紫外检测法和声纹识别法。相比于前两种方法，声纹识别法具有非侵入性、不受电磁干扰、对环境温度变化不敏感等优势。基于声纹原理的检测方案是当前局部放电的重要技术手段。现有的声纹识别方案多数基于机器学习和深度学习，对训练数据样本数量要求较大。然而，限于局部放电的发生频次和现场信号采集的难度，现有的声纹识别方案存在应用场景受限和测试效果欠佳的问题。

一般来说，为更好地实现局部放电信号的特征提取和类型识别，算法应当涵盖两个步骤：对环境噪声和局部放电信号进行分离、基于机器学习和深度学习方法对局部放电信号进行识别。有研究提出基于使用机器学习中的支持向量机算法对采集到的原始信号进行识别。步骤为：

（1）、使用三个排列成L形状的超声传感器来检测声音信号；

（2）、训练支持向量机模型；

（3）、使用支持向量机检测异常值。

机器学习中的支持向量机算法对于训练数据有两个基本要求：一是训练数据应是线性可分的，二是训练数据样本量应足够大。一方面，受限于输、配电线路设备局部放电发生频次和现场信号采集难度，足量而优质的样本量极难获取，不满足上述要求二；另一方面，所采集到的原始信号具有线性难分性，不满足上述要求一。因此，现有技术难以达到理想效果。

发明内容

技术目的：针对上述技术问题，本发明提出了一种基于机器学习数据生成的小样本声纹识别模型训练方法，能够有效扩增局部放电样本空间，解决当前声纹识别法鲁棒性不够理想等问题，设计出的神经网络结构算力需求小，可部署于边缘侧计算设备，能够满足设备的在线检测需求。

技术方案：为实现上述技术目的，本发明采用了如下技术方案：

一种基于机器学习数据生成的小样本声纹识别模型训练方法，包括步骤：

S1、采集任务场景中预设数量的原始语音信号；

S2、使用小波变换算法，对原始语音信号进行波形分析，将所述原始语音信号分离为环境噪声和局部放电信号，所述局部放电信号构成局部放电数据集；根据局部放电信号生成局部放电相位分布图谱PRPD，为划分局部放电类型做准备；

S3、基于任务场景的先验知识，确定任务场景中的局部放电信号特征，基于所述局部放电相位分布图谱PRPD和所述局部放电信号特征，划分局部放电类型，根据局部放电类型，将所述局部放电数据集分成多个局部放电类型训练数据集；

S4、将所述局部放电类型训练数据集分为调优训练数据集和预训练数据集，使用同源多簇聚类算法，对所述预训练数据集进行样本空间扩充，生成样本量满足预设要求的预训练扩展数据集；

S5、使用所述预训练扩展数据集对预先构建的神经网络模型进行预训练，使用所述调优训练数据集对完成预训练的神经网络模型进行调优训练，得到用于任务场景中局部放电检测的声纹识别模型。

优选地，所述步骤S4中，对所述预训练数据集进行样本空间扩充，生成样本量满足预设要求的预训练扩展数据集，具体包括以下步骤：

S4.1、根据局部放电类型，将预训练数据集划分为与局部放电类型对应的多个训练数据集；

S4.2、分别对各个局部放电类型的训练数据集进行样本空间扩充，得到与各个局部放电类型的训练数据集对应的新样本数据集，所述新样本数据集形成所述预训练扩展数据集；

其中，所述步骤S4.2以如下方法进行样本空间扩充：

S4.21、对于每个局部放电类型的训练数据集，采用无放回的随机抽样方法将所述训练数据集划分为多组，每组作为一个子训练簇，每个子训练簇至少有3个样本数据且子训练簇数不小于5；

S4.22、对于每个局部放电类型的训练数据集划分得到的每个子训练簇，使用结合频段能量比的K-means聚类方法进行聚类，聚类中心代表了所在的子训练簇的典型特征，所述聚类中心作为一个生成的数据样本。

优选地，所述步骤S4.22中，使用结合频段能量比的K-means聚类过程如下：

A1、根据放电类型的先验知识，计算不同类型的局部放电信号频段的能量占比；

A2、对于每个局部放电类型的训练数据集划分得到的所有子训练簇，选择k个子训练簇；

A3、从步骤A2选择的k个子训练簇中，分别随机选择一个数据点即样本，得到的k个数据点作为初始的k个聚类中心，k的取值小于子训练簇的总数；

A4、对于各个子训练簇中的每个数据点，计算其与当前所有聚类中心的距离；

A5、通过预设的权重，结合步骤A1计算得到的对应类型的局部放电信号频段的能量占比和步骤A4计算得到的距离，重新计算对应的数据点与当前所有聚类中心的距离，依据重新计算得到的距离，将对应的数据点分配到距离最近的聚类中心所在的子训练簇；

A6、计算每个子训练簇中所有数据点的均值，并将均值作为所在子训练簇的新的聚类中心；

A7、重复步骤A4至A6，直到收敛。

优选地，所述步骤S5中，神经网络以如下方式预先构建：

面向任务场景，设计满足任务场景中设备算力要求的神经网络结构，使用一维卷积神经网络CNN作为分类器，计算过程中使用Conv卷积计算，使用ReLU激活函数，使用MaxPool最大池化采样。

面向局部放电类型训练数据集和神经网络结构，设计考虑样本类型比重的多分类损失函数：

其中，表示局部放电样本总数，/>表示局部放电样本编号，/>表示局部放电类型总数，/>表示局部放电类型编号，/>表示局部放电类型真实标签，/>表示神经网络输出的预测概率，/>表示局部放电类型/>的权重，/>表示平滑项参数。

优选地，所述任务场景为输电线路或配电线路，局部放电类型包括无局部放电、单峰局部放电和双峰局部放电。

一种基于机器学习数据生成的小样本声纹识别模型训练装置，包括：

原始信号采集模块，用于采集任务场景中预设数量的原始语音信号；

波形分析模块，使用小波变换算法，对原始语音信号进行波形分析，将所述原始语音信号分离为环境噪声和局部放电信号，根据局部放电信号生成局部放电相位分布图谱PRPD，构成局部放电数据集，为划分局部放电类型做准备；

局部放电类型定义模块，用于基于任务场景的先验知识，确定任务场景中的局部放电信号特征，基于所述局部放电相位分布图谱PRPD和所述局部放电特征，划分局部放电类型；

样本空间扩充模块，用于将所述局部放电数据集分为调优训练数据集和预训练数据集，使用同源多簇聚类算法，对所述预训练数据集进行样本空间扩充，生成样本量满足预设要求的预训练扩展数据集；

模型训练模块，用所述预训练扩展数据集对预先构建的神经网络模型进行预训练，使用所述调优训练数据集对完成预训练的神经网络模型进行调优训练，得到用于任务场景中局部放电检测的声纹识别模型。

有益效果：由于采用了上述技术方案，本发明具有如下有益效果：

本发明针对训练数据样本数量不足的行业共同痛点，提出一种基于机器学习的同源多簇聚类算法，对局部放电数据样本空间进行有效生成，针对当前声纹识别法鲁棒性不够理想的现状，提出一个适于检测场景的数据特点的神经网络结构，从而实现在小样本条件下的声纹识别神经网络模型训练，该神经网络与所提出的局部放电数据生成算法在实现流程上是承接的关系，局部放电数据生成算法按局部放电类型划分子训练簇，使用机器学习中的K-means聚类方法对每个子训练簇进行聚类，将所得聚类中心作为一个生成的数据样本，从而得到扩增样本空间的目的，解决训练样本难以获取的问题。

附图说明

图1为基于机器学习数据生成的小样本声纹识别模型训练方法的流程图；

图2为使用同源多簇聚类算法生成局部放电数据的流程图；

图3为本发明设计的神经网络的结构示意图。

具体实施方式

下面结合附图对本发明的实施例作详细的说明。

实施例一

本实施例提出一种基于机器学习数据生成的小样本声纹识别模型训练方法，包括以下步骤：

S1、采集任务场景中预设数量的原始语音信号；

S4、将所述局部放电类型数据集分为调优训练数据集和预训练数据集，使用同源多簇聚类算法，对所述预训练数据集进行样本空间扩充，生成样本量满足预设要求的预训练扩展数据集；

以图1所示的输电线路或配电线路的任务场景为例，将本发明方法所含技术要点详细解说如下：

1、原始信号波形分析

使用小波变换算法将原始信号分离为环境噪声和局部放电信号。小波变换是一种时间-频率分析方法，可以将信号分解成不同的频带，并在每个频带中提供关于信号的局部特性的信息。通过对原始信号进行多阶的分解和重构，提取出原始信号中的局部放电信号有效成分，得出相位相关局放图谱（phase resolved partial discharge ，简称PRPD），为后续划分局部放电类型做准备。

2、局部放电类型定义

基于输、配电线路设备巡检专业的先验知识，依照局部放电信号特征，通常需要区分三种类型的PRPD模式，即根据生成的局部放电相位分布图谱PRPD，可以将局部放电信号划分为三种放电类型：无局部放电、单峰局部放电和双峰局部放电，从而按此三种类型构建局部放电类型训练数据集。

3、局部放电数据生成

应用所提出的同源多簇聚类算法，生成多类型局部放电信号。同源多簇聚类算法的原理如附图2所示，算法步骤如下：

a、将所有局部放电类型训练数据集分为预训练数据集和调优训练数据集；

b、对于每个局部放电类型的训练数据集，将其划分为多组，称为一个子训练簇；

c、子训练簇的划分方式采用无放回的随机抽样方法，限制条件为每个子训练簇至少有3个样本数据且子训练簇数不小于5。无放回的随机抽样一方面可以提高训练数据集的样本多样性，有助于模型更好地捕捉数据的分布和特征，另一方面可以减少训练数据的冗余信息，降低模型对某些特定样本的过度依赖，减少过拟合风险，提高模型的泛化能力；

d、对于每个局部放电类型数据集的所有子训练簇，使用机器学习中的K-means聚类方法进行聚类，聚类中心代表了这个子训练簇的典型特征，将此聚类中心作为一个生成的数据样本；

e、遍历局部放电类型数据集，执行上述步骤，直至样本量达到设定需求；

f、形成新的局部放电类型训练数据集，样本数量扩充，样本类型不变。

步骤d中得出的聚类中心，是step-1中定义的每个数据簇中所有样本点的均值，所得均值是一个新数据点，因此能够达到增加样本量的目的。结合图2所示，上排第3个轮廓线中的实心黑点表示每个数据簇中所有样本点的均值，这个均值不在原本的数据集中，而是通过聚类算法生成的，因此拓展了样本空间边界，对应在图2表现为最后样本空间的轮廓线变大了。

上述K-means采用使用结合频段能量比的方法，聚类过程如下：

step-1、选择簇的数量 k；

step-2、随机选择k个数据点作为初始聚类中心；

step-3、对于数据集中的每个数据点，计算它与所有聚类中心的距离以及信号在一定频段上的能量占比并通过相关权重结合作为数据点间距离，然后按照计算得到的数据点间距离，将其分配到距离最近的聚类中心所对应的簇。

不同频段能量占比是局部放电信号与静息信号以及不同类型放电信号之间的重要区分，将频段占比作为参考特征加入聚类过程能为数据集提供更直观、易解释的特征，提升模型的物理可解释性，提高模型对局部放电类型的判断能力；

step-4、对于每个簇，计算该簇中所有数据点的均值，并将均值作为新的聚类中心；

step-5、重复step-3和step-4，直到收敛；

由于所生成的数据与实际生产环境采集的数据同源，因此本发明提出的基于机器学习的同源多簇聚类算法，相比于实验室环境所模拟出的数据更有价值，能够对局部放电数据样本空间进行了有效扩充，解决了训练数据样本数量不足的行业共同痛点。

4、神经网络结构设计

面向输、配电线路设备的在线检测任务场景,设计满足边缘侧设备算力要求的神经网络结构。使用一维卷积神经网络（CNN）作为 PRPD 分类器，如附图 3 所示，输入维度为1920，计算过程中使用Conv卷积计算，使用ReLU激活函数，使用MaxPool最大池化采样，channels表示各局部放电特征图的通道数。中间结果局部放电特征图A~D标出，以体现声纹特征，经过卷积神经网络CNN的处理，特征图的通道数得到了提升，由图3可知，特征图A~D的通道数分别为64、192、384、256。其中，ReLU 激活函数引入了非线性特性，使神经网络能够学习和表示复杂的非线性模式和关系，并且能够缓解梯度消失问题，适用本发明面向的检测场景和数据特点。

其中，表示局部放电样本总数，/>表示局部放电样本编号，/>表示局部放电类型总数，本发明中，/>表示无局部放电、单峰局部放电和双峰局部放电三种类型，/>表示局部放电类型编号，/>，/>表示局部放电类型真实标签，/>表示神经网络的预测概率，/>表示局部放电类型/>的权重，实践经验表明，不同放电类型出现的频率是不同的。因此，模型根据对相关数据的统计引入了这些权重，以修正结果，使得预测更符合实际情况，并进一步减少模型对训练数据的需求。/>为一个很小的正常数，作为平滑项加入传统的交叉熵损失函数，使得对数形式的损失函数在预测概率/>接近于0的情况下也能有一个较合理的，在一定范围内的值，以避免数值计算的不稳定性，提高模型的泛化能力和稳健性。

本发明提出的神经网络结构，基于局部放电数据样本生成算法，实现在小样本条件下的声纹识别神经网络模型训练，能够解决输、配电线路设备局部放电信号自动检测识别的问题。在非侵入性、不受电磁干扰、对环境温度变化不敏感等声纹算法既有特点上，更具准确度高，鲁棒性强的优势。不同于对语谱图进行二维卷积的特征提取方式，本发明所述的神经网络结构采用一维卷积对局部放电信号进行特征提取，计算开销小；4层局部放电特征图（局部放电特征图A~D）的神经网络结构既实现了对局部放电信号的高维特征提取，也避免了深度过大时的信息丢失和计算量溢出，这些特点决定了所述神经网络模型适合部署在边缘侧设备。

5、模型训练

模型训练分为两个步骤。

步骤一是预训练，采用3中局部放电数据生成的数据集作为训练数据；

步骤二是迁移调优训练，采用调优训练数据集进行调优，得出声纹检测模型。

本发明设计出的神经网络结构算力需求小，可部署于边缘侧计算设备，能够满足输、配电线路设备的在线检测需求。

实施例二

本实施例提出一种基于机器学习数据生成的小样本声纹识别模型训练装置，包括：

波形分析模块，使用小波变换算法，对原始语音信号进行波形分析，将所述原始语音信号分离为环境噪声和局部放电信号，根据局部放电信号生成局部放电相位分布图谱PRPD，所述局部放电信号构成局部放电数据集；

以上显示和描述了本发明的基本原理、主要特征和优点。本行业的技术人员应该了解，上述实施例不以任何形式限制本发明，凡采用等同替换或等效变换的方式所获得的技术方案，均落在本发明的保护范围内。

Claims

1.一种基于机器学习数据生成的小样本声纹识别模型训练方法，其特征在于，包括步骤：

S1、采集任务场景中预设数量的原始语音信号；

2.根据权利要求1所述的一种基于机器学习数据生成的小样本声纹识别模型训练方法，其特征在于，所述步骤S4中，对所述预训练数据集进行样本空间扩充，生成样本量满足预设要求的预训练扩展数据集，具体包括以下步骤：

其中，所述步骤S4.2以如下方法进行样本空间扩充：

S4.21、对于每个局部放电类型的训练数据集，采用无放回的随机抽样方法将所述训练数据集中的样本划分为多组，每组作为一个子训练簇，每个子训练簇至少有3个样本数据且子训练簇数不小于5；

S4.22、对于每个局部放电类型的训练数据集划分得到的所有子训练簇，使用结合频段能量比的K-means聚类方法进行聚类，聚类中心代表了所在的子训练簇的典型特征，所述聚类中心作为一个生成的数据样本。

3.根据权利要求2所述的一种基于机器学习数据生成的小样本声纹识别模型训练方法，其特征在于，所述步骤S4.22中，使用的结合频段能量比的K-means聚类过程如下：

A7、重复步骤A4至A6，直到收敛。

4.根据权利要求1所述的一种基于机器学习数据生成的小样本声纹识别模型训练方法，其特征在于，所述步骤S5中，神经网络以如下方式预先构建：

面向任务场景，设计满足任务场景中设备算力要求的神经网络结构，使用一维卷积神经网络CNN作为分类器，所述卷积神经网络CNN包括卷积层、激活函数、池化层和全连接层，计算过程中使用Conv卷积计算，使用ReLU激活函数，使用MaxPool最大池化采样；

5.根据权利要求1所述的一种基于机器学习数据生成的小样本声纹识别模型训练方法，其特征在于，所述任务场景为输电线路或配电线路，局部放电类型包括无局部放电、单峰局部放电和双峰局部放电。

6.一种基于机器学习数据生成的小样本声纹识别模型训练装置，其特征在于，包括：

波形分析模块，用于使用小波变换算法，对原始语音信号进行波形分析，将所述原始语音信号分离为环境噪声和局部放电信号，根据局部放电信号生成局部放电相位分布图谱PRPD，构成局部放电数据集，为划分局部放电类型做准备；

局部放电类型定义模块，用于基于任务场景的先验知识，确定任务场景中的局部放电信号特征，基于所述局部放电相位分布图谱PRPD和所述局部放电特征，划分局部放电类型，根据局部放电类型，将所述局部放电数据集分成多个局部放电类型训练数据集；