CN117894319A - 基于机器学习数据生成的小样本声纹识别模型训练方法 - Google Patents

基于机器学习数据生成的小样本声纹识别模型训练方法 Download PDF

Info

Publication number
CN117894319A
CN117894319A CN202410290482.2A CN202410290482A CN117894319A CN 117894319 A CN117894319 A CN 117894319A CN 202410290482 A CN202410290482 A CN 202410290482A CN 117894319 A CN117894319 A CN 117894319A
Authority
CN
China
Prior art keywords
partial discharge
training
data set
sample
sub
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202410290482.2A
Other languages
English (en)
Other versions
CN117894319B (zh
Inventor
张一�
夏烨
徐东
陈双辉
卢桢
胡彬
裔伟
王菲菲
吴万聪
姚柏存
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Saturn Information Technology Co ltd
Original Assignee
Nanjing Saturn Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Saturn Information Technology Co ltd filed Critical Nanjing Saturn Information Technology Co ltd
Priority to CN202410290482.2A priority Critical patent/CN117894319B/zh
Publication of CN117894319A publication Critical patent/CN117894319A/zh
Application granted granted Critical
Publication of CN117894319B publication Critical patent/CN117894319B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/04Training, enrolment or model building
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/06Decision making techniques; Pattern matching strategies
    • G10L17/14Use of phonemic categorisation or speech recognition prior to speaker recognition or verification
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/18Artificial neural networks; Connectionist approaches
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0272Voice signal separating
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medical Informatics (AREA)
  • Business, Economics & Management (AREA)
  • Game Theory and Decision Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明属于局部放电故障识别技术领域,公开了一种基于机器学习数据生成的小样本声纹识别模型训练方法,方法包括步骤:采集任务场景中的原始语音信号;使用小波变换算法,将所述原始语音信号分离为环境噪声和局部放电信号,生成局部放电类型数据集;将局部放电类型数据集分为调优训练数据集和预训练数据集,使用同源多簇聚类算法,对所述预训练数据集进行样本空间扩充,生成样本量满足预设要求的预训练扩展数据集;使用预训练扩展数据集对预先构建的神经网络模型进行预训练,使用所述调优训练数据集进行调优训练,得到用于任务场景中局部放电检测的声纹识别模型。本发明能够有效扩增局部放电样本空间,解决当前声纹识别法鲁棒性不够理想等问题。

Description

基于机器学习数据生成的小样本声纹识别模型训练方法
技术领域
本发明属于局部放电故障识别技术领域,涉及基于声纹识别局放类型技术,具体涉及一种基于机器学习数据生成的小样本声纹识别模型训练方法。
背景技术
局部放电(Partial discharge,PD)检测在评估输电线路和配电线路的设备绝缘性能方面具有至关重要的作用。目前对于局部放电的主要检测方法包括超高频测量法、红/紫外检测法和声纹识别法。相比于前两种方法,声纹识别法具有非侵入性、不受电磁干扰、对环境温度变化不敏感等优势。基于声纹原理的检测方案是当前局部放电的重要技术手段。现有的声纹识别方案多数基于机器学习和深度学习,对训练数据样本数量要求较大。然而,限于局部放电的发生频次和现场信号采集的难度,现有的声纹识别方案存在应用场景受限和测试效果欠佳的问题。
一般来说,为更好地实现局部放电信号的特征提取和类型识别,算法应当涵盖两个步骤:对环境噪声和局部放电信号进行分离、基于机器学习和深度学习方法对局部放电信号进行识别。有研究提出基于使用机器学习中的支持向量机算法对采集到的原始信号进行识别。步骤为:
(1)、使用三个排列成L形状的超声传感器来检测声音信号;
(2)、训练支持向量机模型;
(3)、使用支持向量机检测异常值。
机器学习中的支持向量机算法对于训练数据有两个基本要求:一是训练数据应是线性可分的,二是训练数据样本量应足够大。一方面,受限于输、配电线路设备局部放电发生频次和现场信号采集难度,足量而优质的样本量极难获取,不满足上述要求二;另一方面,所采集到的原始信号具有线性难分性,不满足上述要求一。因此,现有技术难以达到理想效果。
发明内容
技术目的:针对上述技术问题,本发明提出了一种基于机器学习数据生成的小样本声纹识别模型训练方法,能够有效扩增局部放电样本空间,解决当前声纹识别法鲁棒性不够理想等问题,设计出的神经网络结构算力需求小,可部署于边缘侧计算设备,能够满足设备的在线检测需求。
技术方案:为实现上述技术目的,本发明采用了如下技术方案:
一种基于机器学习数据生成的小样本声纹识别模型训练方法,包括步骤:
S1、采集任务场景中预设数量的原始语音信号;
S2、使用小波变换算法,对原始语音信号进行波形分析,将所述原始语音信号分离为环境噪声和局部放电信号,所述局部放电信号构成局部放电数据集;根据局部放电信号生成局部放电相位分布图谱PRPD,为划分局部放电类型做准备;
S3、基于任务场景的先验知识,确定任务场景中的局部放电信号特征,基于所述局部放电相位分布图谱PRPD和所述局部放电信号特征,划分局部放电类型,根据局部放电类型,将所述局部放电数据集分成多个局部放电类型训练数据集;
S4、将所述局部放电类型训练数据集分为调优训练数据集和预训练数据集,使用同源多簇聚类算法,对所述预训练数据集进行样本空间扩充,生成样本量满足预设要求的预训练扩展数据集;
S5、使用所述预训练扩展数据集对预先构建的神经网络模型进行预训练,使用所述调优训练数据集对完成预训练的神经网络模型进行调优训练,得到用于任务场景中局部放电检测的声纹识别模型。
优选地,所述步骤S4中,对所述预训练数据集进行样本空间扩充,生成样本量满足预设要求的预训练扩展数据集,具体包括以下步骤:
S4.1、根据局部放电类型,将预训练数据集划分为与局部放电类型对应的多个训练数据集;
S4.2、分别对各个局部放电类型的训练数据集进行样本空间扩充,得到与各个局部放电类型的训练数据集对应的新样本数据集,所述新样本数据集形成所述预训练扩展数据集;
其中,所述步骤S4.2以如下方法进行样本空间扩充:
S4.21、对于每个局部放电类型的训练数据集,采用无放回的随机抽样方法将所述训练数据集划分为多组,每组作为一个子训练簇,每个子训练簇至少有3个样本数据且子训练簇数不小于5;
S4.22、 对于每个局部放电类型的训练数据集划分得到的每个子训练簇,使用结合频段能量比的K-means聚类方法进行聚类,聚类中心代表了所在的子训练簇的典型特征,所述聚类中心作为一个生成的数据样本。
优选地,所述步骤S4.22中,使用结合频段能量比的K-means聚类过程如下:
A1、根据放电类型的先验知识,计算不同类型的局部放电信号频段的能量占比;
A2、对于每个局部放电类型的训练数据集划分得到的所有子训练簇,选择k个子训练簇;
A3、从步骤A2选择的k个子训练簇中,分别随机选择一个数据点即样本,得到的k个数据点作为初始的k个聚类中心,k的取值小于子训练簇的总数;
A4、对于各个子训练簇中的每个数据点,计算其与当前所有聚类中心的距离;
A5、通过预设的权重,结合步骤A1计算得到的对应类型的局部放电信号频段的能量占比和步骤A4计算得到的距离,重新计算对应的数据点与当前所有聚类中心的距离,依据重新计算得到的距离,将对应的数据点分配到距离最近的聚类中心所在的子训练簇;
A6、计算每个子训练簇中所有数据点的均值,并将均值作为所在子训练簇的新的聚类中心;
A7、重复步骤A4至A6,直到收敛。
优选地,所述步骤S5中,神经网络以如下方式预先构建:
面向任务场景,设计满足任务场景中设备算力要求的神经网络结构,使用一维卷积神经网络CNN作为分类器,计算过程中使用Conv卷积计算,使用ReLU激活函数,使用MaxPool最大池化采样。
面向局部放电类型训练数据集和神经网络结构,设计考虑样本类型比重的多分类损失函数:
其中,表示局部放电样本总数,/>表示局部放电样本编号,/>表示局部放电类型总数,/>表示局部放电类型编号,/>表示局部放电类型真实标签,/>表示神经网络输出的预测概率,/>表示局部放电类型/>的权重,/>表示平滑项参数。
优选地,所述任务场景为输电线路或配电线路,局部放电类型包括无局部放电、单峰局部放电和双峰局部放电。
一种基于机器学习数据生成的小样本声纹识别模型训练装置,包括:
原始信号采集模块,用于采集任务场景中预设数量的原始语音信号;
波形分析模块,使用小波变换算法,对原始语音信号进行波形分析,将所述原始语音信号分离为环境噪声和局部放电信号,根据局部放电信号生成局部放电相位分布图谱PRPD,构成局部放电数据集,为划分局部放电类型做准备;
局部放电类型定义模块,用于基于任务场景的先验知识,确定任务场景中的局部放电信号特征,基于所述局部放电相位分布图谱PRPD和所述局部放电特征,划分局部放电类型;
样本空间扩充模块,用于将所述局部放电数据集分为调优训练数据集和预训练数据集,使用同源多簇聚类算法,对所述预训练数据集进行样本空间扩充,生成样本量满足预设要求的预训练扩展数据集;
模型训练模块,用所述预训练扩展数据集对预先构建的神经网络模型进行预训练,使用所述调优训练数据集对完成预训练的神经网络模型进行调优训练,得到用于任务场景中局部放电检测的声纹识别模型。
有益效果:由于采用了上述技术方案,本发明具有如下有益效果:
本发明针对训练数据样本数量不足的行业共同痛点,提出一种基于机器学习的同源多簇聚类算法,对局部放电数据样本空间进行有效生成,针对当前声纹识别法鲁棒性不够理想的现状,提出一个适于检测场景的数据特点的神经网络结构,从而实现在小样本条件下的声纹识别神经网络模型训练,该神经网络与所提出的局部放电数据生成算法在实现流程上是承接的关系,局部放电数据生成算法按局部放电类型划分子训练簇,使用机器学习中的K-means聚类方法对每个子训练簇进行聚类,将所得聚类中心作为一个生成的数据样本,从而得到扩增样本空间的目的,解决训练样本难以获取的问题。
附图说明
图1为基于机器学习数据生成的小样本声纹识别模型训练方法的流程图;
图2为使用同源多簇聚类算法生成局部放电数据的流程图;
图3为本发明设计的神经网络的结构示意图。
具体实施方式
下面结合附图对本发明的实施例作详细的说明。
实施例一
本实施例提出一种基于机器学习数据生成的小样本声纹识别模型训练方法,包括以下步骤:
S1、采集任务场景中预设数量的原始语音信号;
S2、使用小波变换算法,对原始语音信号进行波形分析,将所述原始语音信号分离为环境噪声和局部放电信号,所述局部放电信号构成局部放电数据集;根据局部放电信号生成局部放电相位分布图谱PRPD,为划分局部放电类型做准备;
S3、基于任务场景的先验知识,确定任务场景中的局部放电信号特征,基于所述局部放电相位分布图谱PRPD和所述局部放电信号特征,划分局部放电类型,根据局部放电类型,将所述局部放电数据集分成多个局部放电类型训练数据集;
S4、将所述局部放电类型数据集分为调优训练数据集和预训练数据集,使用同源多簇聚类算法,对所述预训练数据集进行样本空间扩充,生成样本量满足预设要求的预训练扩展数据集;
S5、使用所述预训练扩展数据集对预先构建的神经网络模型进行预训练,使用所述调优训练数据集对完成预训练的神经网络模型进行调优训练,得到用于任务场景中局部放电检测的声纹识别模型。
以图1所示的输电线路或配电线路的任务场景为例,将本发明方法所含技术要点详细解说如下:
1、原始信号波形分析
使用小波变换算法将原始信号分离为环境噪声和局部放电信号。小波变换是一种时间-频率分析方法,可以将信号分解成不同的频带,并在每个频带中提供关于信号的局部特性的信息。通过对原始信号进行多阶的分解和重构,提取出原始信号中的局部放电信号有效成分,得出相位相关局放图谱(phase resolved partial discharge ,简称PRPD),为后续划分局部放电类型做准备。
2、局部放电类型定义
基于输、配电线路设备巡检专业的先验知识,依照局部放电信号特征,通常需要区分三种类型的PRPD模式,即根据生成的局部放电相位分布图谱PRPD,可以将局部放电信号划分为三种放电类型:无局部放电、单峰局部放电和双峰局部放电,从而按此三种类型构建局部放电类型训练数据集。
3、局部放电数据生成
应用所提出的同源多簇聚类算法,生成多类型局部放电信号。同源多簇聚类算法的原理如附图2所示,算法步骤如下:
a、将所有局部放电类型训练数据集分为预训练数据集和调优训练数据集;
b、对于每个局部放电类型的训练数据集,将其划分为多组,称为一个子训练簇;
c、子训练簇的划分方式采用无放回的随机抽样方法,限制条件为每个子训练簇至少有3个样本数据且子训练簇数不小于5。无放回的随机抽样一方面可以提高训练数据集的样本多样性,有助于模型更好地捕捉数据的分布和特征,另一方面可以减少训练数据的冗余信息,降低模型对某些特定样本的过度依赖,减少过拟合风险,提高模型的泛化能力;
d、对于每个局部放电类型数据集的所有子训练簇,使用机器学习中的K-means聚类方法进行聚类,聚类中心代表了这个子训练簇的典型特征,将此聚类中心作为一个生成的数据样本;
e、遍历局部放电类型数据集,执行上述步骤,直至样本量达到设定需求;
f、形成新的局部放电类型训练数据集,样本数量扩充,样本类型不变。
步骤d中得出的聚类中心,是step-1中定义的每个数据簇中所有样本点的均值,所得均值是一个新数据点,因此能够达到增加样本量的目的。结合图2所示,上排第3个轮廓线中的实心黑点表示每个数据簇中所有样本点的均值,这个均值不在原本的数据集中,而是通过聚类算法生成的,因此拓展了样本空间边界,对应在图2表现为最后样本空间的轮廓线变大了。
上述K-means采用使用结合频段能量比的方法,聚类过程如下:
step-1、选择簇的数量 k;
step-2、随机选择k个数据点作为初始聚类中心;
step-3、对于数据集中的每个数据点,计算它与所有聚类中心的距离以及信号在一定频段上的能量占比并通过相关权重结合作为数据点间距离,然后按照计算得到的数据点间距离,将其分配到距离最近的聚类中心所对应的簇。
不同频段能量占比是局部放电信号与静息信号以及不同类型放电信号之间的重要区分,将频段占比作为参考特征加入聚类过程能为数据集提供更直观、易解释的特征,提升模型的物理可解释性,提高模型对局部放电类型的判断能力;
step-4、对于每个簇,计算该簇中所有数据点的均值,并将均值作为新的聚类中心;
step-5、重复step-3和step-4,直到收敛;
由于所生成的数据与实际生产环境采集的数据同源,因此本发明提出的基于机器学习的同源多簇聚类算法,相比于实验室环境所模拟出的数据更有价值,能够对局部放电数据样本空间进行了有效扩充,解决了训练数据样本数量不足的行业共同痛点。
4、神经网络结构设计
面向输、配电线路设备的在线检测任务场景,设计满足边缘侧设备算力要求的神经网络结构。使用一维卷积神经网络(CNN)作为 PRPD 分类器,如附图 3 所示,输入维度为1920,计算过程中使用Conv卷积计算,使用ReLU激活函数,使用MaxPool最大池化采样,channels表示各局部放电特征图的通道数。中间结果局部放电特征图A~D标出,以体现声纹特征,经过卷积神经网络CNN的处理,特征图的通道数得到了提升,由图3可知,特征图A~D的通道数分别为64、192、384、256。其中,ReLU 激活函数引入了非线性特性,使神经网络能够学习和表示复杂的非线性模式和关系,并且能够缓解梯度消失问题,适用本发明面向的检测场景和数据特点。
面向局部放电类型训练数据集和神经网络结构,设计考虑样本类型比重的多分类损失函数:
其中,表示局部放电样本总数,/>表示局部放电样本编号,/>表示局部放电类型总数,本发明中,/>表示无局部放电、单峰局部放电和双峰局部放电三种类型,/>表示局部放电类型编号,/>,/>表示局部放电类型真实标签,/>表示神经网络的预测概率,/>表示局部放电类型/>的权重,实践经验表明,不同放电类型出现的频率是不同的。因此,模型根据对相关数据的统计引入了这些权重,以修正结果,使得预测更符合实际情况,并进一步减少模型对训练数据的需求。/>为一个很小的正常数,作为平滑项加入传统的交叉熵损失函数,使得对数形式的损失函数在预测概率/>接近于0的情况下也能有一个较合理的,在一定范围内的值,以避免数值计算的不稳定性,提高模型的泛化能力和稳健性。
本发明提出的神经网络结构,基于局部放电数据样本生成算法,实现在小样本条件下的声纹识别神经网络模型训练,能够解决输、配电线路设备局部放电信号自动检测识别的问题。在非侵入性、不受电磁干扰、对环境温度变化不敏感等声纹算法既有特点上,更具准确度高,鲁棒性强的优势。不同于对语谱图进行二维卷积的特征提取方式,本发明所述的神经网络结构采用一维卷积对局部放电信号进行特征提取,计算开销小;4层局部放电特征图(局部放电特征图A~D)的神经网络结构既实现了对局部放电信号的高维特征提取,也避免了深度过大时的信息丢失和计算量溢出,这些特点决定了所述神经网络模型适合部署在边缘侧设备。
5、模型训练
模型训练分为两个步骤。
步骤一是预训练,采用3中局部放电数据生成的数据集作为训练数据;
步骤二是迁移调优训练,采用调优训练数据集进行调优,得出声纹检测模型。
本发明设计出的神经网络结构算力需求小,可部署于边缘侧计算设备,能够满足输、配电线路设备的在线检测需求。
实施例二
本实施例提出一种基于机器学习数据生成的小样本声纹识别模型训练装置,包括:
原始信号采集模块,用于采集任务场景中预设数量的原始语音信号;
波形分析模块,使用小波变换算法,对原始语音信号进行波形分析,将所述原始语音信号分离为环境噪声和局部放电信号,根据局部放电信号生成局部放电相位分布图谱PRPD,所述局部放电信号构成局部放电数据集;
局部放电类型定义模块,用于基于任务场景的先验知识,确定任务场景中的局部放电信号特征,基于所述局部放电相位分布图谱PRPD和所述局部放电特征,划分局部放电类型;
样本空间扩充模块,用于将所述局部放电数据集分为调优训练数据集和预训练数据集,使用同源多簇聚类算法,对所述预训练数据集进行样本空间扩充,生成样本量满足预设要求的预训练扩展数据集;
模型训练模块,用所述预训练扩展数据集对预先构建的神经网络模型进行预训练,使用所述调优训练数据集对完成预训练的神经网络模型进行调优训练,得到用于任务场景中局部放电检测的声纹识别模型。
以上显示和描述了本发明的基本原理、主要特征和优点。本行业的技术人员应该了解,上述实施例不以任何形式限制本发明,凡采用等同替换或等效变换的方式所获得的技术方案,均落在本发明的保护范围内。

Claims (6)

1.一种基于机器学习数据生成的小样本声纹识别模型训练方法,其特征在于,包括步骤:
S1、采集任务场景中预设数量的原始语音信号;
S2、使用小波变换算法,对原始语音信号进行波形分析,将所述原始语音信号分离为环境噪声和局部放电信号,所述局部放电信号构成局部放电数据集;根据局部放电信号生成局部放电相位分布图谱PRPD,为划分局部放电类型做准备;
S3、基于任务场景的先验知识,确定任务场景中的局部放电信号特征,基于所述局部放电相位分布图谱PRPD和所述局部放电信号特征,划分局部放电类型,根据局部放电类型,将所述局部放电数据集分成多个局部放电类型训练数据集;
S4、将所述局部放电类型训练数据集分为调优训练数据集和预训练数据集,使用同源多簇聚类算法,对所述预训练数据集进行样本空间扩充,生成样本量满足预设要求的预训练扩展数据集;
S5、使用所述预训练扩展数据集对预先构建的神经网络模型进行预训练,使用所述调优训练数据集对完成预训练的神经网络模型进行调优训练,得到用于任务场景中局部放电检测的声纹识别模型。
2.根据权利要求1所述的一种基于机器学习数据生成的小样本声纹识别模型训练方法,其特征在于,所述步骤S4中,对所述预训练数据集进行样本空间扩充,生成样本量满足预设要求的预训练扩展数据集,具体包括以下步骤:
S4.1、根据局部放电类型,将预训练数据集划分为与局部放电类型对应的多个训练数据集;
S4.2、分别对各个局部放电类型的训练数据集进行样本空间扩充,得到与各个局部放电类型的训练数据集对应的新样本数据集,所述新样本数据集形成所述预训练扩展数据集;
其中,所述步骤S4.2以如下方法进行样本空间扩充:
S4.21、对于每个局部放电类型的训练数据集,采用无放回的随机抽样方法将所述训练数据集中的样本划分为多组,每组作为一个子训练簇,每个子训练簇至少有3个样本数据且子训练簇数不小于5;
S4.22、对于每个局部放电类型的训练数据集划分得到的所有子训练簇,使用结合频段能量比的K-means聚类方法进行聚类,聚类中心代表了所在的子训练簇的典型特征,所述聚类中心作为一个生成的数据样本。
3.根据权利要求2所述的一种基于机器学习数据生成的小样本声纹识别模型训练方法,其特征在于,所述步骤S4.22中,使用的结合频段能量比的K-means聚类过程如下:
A1、根据放电类型的先验知识,计算不同类型的局部放电信号频段的能量占比;
A2、对于每个局部放电类型的训练数据集划分得到的所有子训练簇,选择k个子训练簇;
A3、从步骤A2选择的k个子训练簇中,分别随机选择一个数据点即样本,得到的k个数据点作为初始的k个聚类中心,k的取值小于子训练簇的总数;
A4、对于各个子训练簇中的每个数据点,计算其与当前所有聚类中心的距离;
A5、通过预设的权重,结合步骤A1计算得到的对应类型的局部放电信号频段的能量占比和步骤A4计算得到的距离,重新计算对应的数据点与当前所有聚类中心的距离,依据重新计算得到的距离,将对应的数据点分配到距离最近的聚类中心所在的子训练簇;
A6、计算每个子训练簇中所有数据点的均值,并将均值作为所在子训练簇的新的聚类中心;
A7、重复步骤A4至A6,直到收敛。
4.根据权利要求1所述的一种基于机器学习数据生成的小样本声纹识别模型训练方法,其特征在于,所述步骤S5中,神经网络以如下方式预先构建:
面向任务场景,设计满足任务场景中设备算力要求的神经网络结构,使用一维卷积神经网络CNN作为分类器,所述卷积神经网络CNN包括卷积层、激活函数、池化层和全连接层,计算过程中使用Conv卷积计算,使用ReLU激活函数,使用MaxPool最大池化采样;
面向局部放电类型训练数据集和神经网络结构,设计考虑样本类型比重的多分类损失函数:
其中,表示局部放电样本总数,/>表示局部放电样本编号,/>表示局部放电类型总数,/>表示局部放电类型编号,/>表示局部放电类型真实标签,/>表示神经网络输出的预测概率,/>表示局部放电类型/>的权重,/>表示平滑项参数。
5.根据权利要求1所述的一种基于机器学习数据生成的小样本声纹识别模型训练方法,其特征在于,所述任务场景为输电线路或配电线路,局部放电类型包括无局部放电、单峰局部放电和双峰局部放电。
6.一种基于机器学习数据生成的小样本声纹识别模型训练装置,其特征在于,包括:
原始信号采集模块,用于采集任务场景中预设数量的原始语音信号;
波形分析模块,用于使用小波变换算法,对原始语音信号进行波形分析,将所述原始语音信号分离为环境噪声和局部放电信号,根据局部放电信号生成局部放电相位分布图谱PRPD,构成局部放电数据集,为划分局部放电类型做准备;
局部放电类型定义模块,用于基于任务场景的先验知识,确定任务场景中的局部放电信号特征,基于所述局部放电相位分布图谱PRPD和所述局部放电特征,划分局部放电类型,根据局部放电类型,将所述局部放电数据集分成多个局部放电类型训练数据集;
样本空间扩充模块,用于将所述局部放电数据集分为调优训练数据集和预训练数据集,使用同源多簇聚类算法,对所述预训练数据集进行样本空间扩充,生成样本量满足预设要求的预训练扩展数据集;
模型训练模块,用所述预训练扩展数据集对预先构建的神经网络模型进行预训练,使用所述调优训练数据集对完成预训练的神经网络模型进行调优训练,得到用于任务场景中局部放电检测的声纹识别模型。
CN202410290482.2A 2024-03-14 2024-03-14 基于机器学习数据生成的小样本声纹识别模型训练方法 Active CN117894319B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410290482.2A CN117894319B (zh) 2024-03-14 2024-03-14 基于机器学习数据生成的小样本声纹识别模型训练方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410290482.2A CN117894319B (zh) 2024-03-14 2024-03-14 基于机器学习数据生成的小样本声纹识别模型训练方法

Publications (2)

Publication Number Publication Date
CN117894319A true CN117894319A (zh) 2024-04-16
CN117894319B CN117894319B (zh) 2024-05-17

Family

ID=90649210

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410290482.2A Active CN117894319B (zh) 2024-03-14 2024-03-14 基于机器学习数据生成的小样本声纹识别模型训练方法

Country Status (1)

Country Link
CN (1) CN117894319B (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112259106A (zh) * 2020-10-20 2021-01-22 网易(杭州)网络有限公司 声纹识别方法、装置、存储介质及计算机设备
WO2021244079A1 (zh) * 2020-06-02 2021-12-09 苏州科技大学 智能家居环境中图像目标检测方法
CN113791323A (zh) * 2021-09-14 2021-12-14 南京土星视界科技有限公司 基于智能声纹识别技术的便携式异常放电超声检测装置
CN114417926A (zh) * 2022-01-19 2022-04-29 山东大学 一种基于深度卷积生成对抗网络的电力设备局部放电模式识别方法及系统
CN115659248A (zh) * 2022-11-07 2023-01-31 中国长江三峡集团有限公司 一种电力设备缺陷识别方法、装置、设备及存储介质
CN115862639A (zh) * 2022-11-28 2023-03-28 北京智齿博创科技有限公司 一种基于k—均值聚类分析的人工智能语音分析方法
WO2023216760A1 (zh) * 2022-05-07 2023-11-16 腾讯科技(深圳)有限公司 语音处理方法、装置、存储介质、计算机设备及程序产品
CN117093894A (zh) * 2023-07-19 2023-11-21 中用科技有限公司 一种基于神经网络的局部放电建模分析方法、系统和装置
CN117219124A (zh) * 2023-10-08 2023-12-12 国网湖北省电力有限公司超高压公司 一种基于深度神经网络的开关柜声纹故障检测方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021244079A1 (zh) * 2020-06-02 2021-12-09 苏州科技大学 智能家居环境中图像目标检测方法
CN112259106A (zh) * 2020-10-20 2021-01-22 网易(杭州)网络有限公司 声纹识别方法、装置、存储介质及计算机设备
CN113791323A (zh) * 2021-09-14 2021-12-14 南京土星视界科技有限公司 基于智能声纹识别技术的便携式异常放电超声检测装置
CN114417926A (zh) * 2022-01-19 2022-04-29 山东大学 一种基于深度卷积生成对抗网络的电力设备局部放电模式识别方法及系统
WO2023216760A1 (zh) * 2022-05-07 2023-11-16 腾讯科技(深圳)有限公司 语音处理方法、装置、存储介质、计算机设备及程序产品
CN115659248A (zh) * 2022-11-07 2023-01-31 中国长江三峡集团有限公司 一种电力设备缺陷识别方法、装置、设备及存储介质
CN115862639A (zh) * 2022-11-28 2023-03-28 北京智齿博创科技有限公司 一种基于k—均值聚类分析的人工智能语音分析方法
CN117093894A (zh) * 2023-07-19 2023-11-21 中用科技有限公司 一种基于神经网络的局部放电建模分析方法、系统和装置
CN117219124A (zh) * 2023-10-08 2023-12-12 国网湖北省电力有限公司超高压公司 一种基于深度神经网络的开关柜声纹故障检测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
包艳艳 等: "基于SBSS 与CNN 的750kV 变压器与尖板放电混 叠信号的声纹识别", 西南交通大学学报, 27 November 2023 (2023-11-27), pages 1 - 11 *

Also Published As

Publication number Publication date
CN117894319B (zh) 2024-05-17

Similar Documents

Publication Publication Date Title
CN110728224B (zh) 一种基于注意力机制深度Contourlet网络的遥感图像分类方法
CN107368809B (zh) 一种基于稀疏表示和字典学习的轴承故障分类方法
CN104794368A (zh) 基于foa-mksvm的滚动轴承故障分类方法
CN108478216A (zh) 一种基于卷积神经网络的癫痫病发作前期智能预测方法
CN108919067A (zh) 一种用于gis局部放电模式的识别方法
CN112465069A (zh) 一种基于多尺度卷积核cnn的脑电情绪分类方法
CN115381466A (zh) 基于AE和Transformer的运动想象脑电信号分类方法
CN114169377A (zh) 基于g-mscnn的有噪环境中滚动轴承故障诊断方法
CN110502989A (zh) 一种小样本高光谱人脸识别方法及系统
CN115661627A (zh) 一种基于GAF-D3Net的单波束水下目标识别方法
CN106503733A (zh) 基于na‑memd和gmm聚类的有用信号识别方法
CN113369993B (zh) 一种小样本下刀具磨损状态监测方法
CN109102022B (zh) 一种基于支持向量机的光变曲线分类方法
CN113052099B (zh) 一种基于卷积神经网络的ssvep分类方法
CN114091529A (zh) 一种基于生成对抗网络数据增强的脑电情感识别方法
CN110796303A (zh) 一种基于ewt和odbscan的短期电力负荷预测方法
CN117894319B (zh) 基于机器学习数据生成的小样本声纹识别模型训练方法
CN111382792B (zh) 一种基于双稀疏字典稀疏表示的滚动轴承故障诊断方法
CN111239685B (zh) 基于均匀设计和自组织特征映射神经网络的声源定位方法
CN112636328A (zh) 一种中压配电网设备负荷状态辨识方法
CN116504253A (zh) 一种基于频率动态卷积模型的鸟类声音识别方法和系统
CN116350239A (zh) 一种脑电信号专注度分类方法及系统
CN116296338A (zh) 一种旋转机械故障诊断方法
CN116522103A (zh) 基于itd分解和麻雀优化的孪生支持向量机的电能质量扰动分类方法
CN115638965A (zh) 一种基于一维注意力机制和卷积神经网络的旋转机械故障诊断方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant