CN117407797B - 基于增量学习的设备故障诊断方法及模型的构建方法 - Google Patents

基于增量学习的设备故障诊断方法及模型的构建方法 Download PDF

Info

Publication number
CN117407797B
CN117407797B CN202311725756.8A CN202311725756A CN117407797B CN 117407797 B CN117407797 B CN 117407797B CN 202311725756 A CN202311725756 A CN 202311725756A CN 117407797 B CN117407797 B CN 117407797B
Authority
CN
China
Prior art keywords
preset
neural network
training
incremental learning
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311725756.8A
Other languages
English (en)
Other versions
CN117407797A (zh
Inventor
马兵
尹旭
徐瑞涛
曹梅
续敏
王玉石
张博文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong Energy Shuzhiyun Technology Co ltd
Original Assignee
Shandong Energy Shuzhiyun Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong Energy Shuzhiyun Technology Co ltd filed Critical Shandong Energy Shuzhiyun Technology Co ltd
Priority to CN202311725756.8A priority Critical patent/CN117407797B/zh
Publication of CN117407797A publication Critical patent/CN117407797A/zh
Application granted granted Critical
Publication of CN117407797B publication Critical patent/CN117407797B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01HMEASUREMENT OF MECHANICAL VIBRATIONS OR ULTRASONIC, SONIC OR INFRASONIC WAVES
    • G01H17/00Measuring mechanical vibrations or ultrasonic, sonic or infrasonic waves, not provided for in the preceding groups
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/10Pre-processing; Data cleansing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2131Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on a transform domain processing, e.g. wavelet transform
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/217Validation; Performance evaluation; Active pattern learning techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0475Generative networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/094Adversarial learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2123/00Data types
    • G06F2123/02Data types in the time domain, e.g. time-series data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/02Preprocessing
    • G06F2218/04Denoising
    • G06F2218/06Denoising by applying a scale-space analysis, e.g. using wavelet analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/08Feature extraction
    • G06F2218/10Feature extraction by analysing the shape of a waveform, e.g. extracting parameters relating to peaks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/12Classification; Matching

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Abstract

本发明提供一种基于增量学习的设备故障诊断方法及模型的构建方法,涉及数据处理技术领域,包括:获取震动信号数据,将其输入至预先设置的增量学习框架中,并将满足预设融合条件的震动信号数据与增量学习框架中的训练数据集进行融合,构建增量学习样本集;通过增量学习样本集对增量学习框架包括的初始诊断模型进行更新训练,构建设备故障诊断模型。本发明能够使模型学习解决新任务,同时保留之前任务中学习到的知识,能够从实时数据中整合提高分类能力。其中,初始诊断模型基于量子谐振优化的神经网络模型和基于切比雪夫优化的极限学习机算法构建,能够提高分类精度和分类速度;且,可以避免神经网络在参数寻优时陷入局部最优解的现象。

Description

基于增量学习的设备故障诊断方法及模型的构建方法
技术领域
本发明涉及数据处理技术领域,尤其涉及一种基于增量学习的设备故障诊断方法及模型的构建方法。
背景技术
近年来,随着工业设备与系统的不断复杂化,确保其稳定与持续运行变得尤为重要,设备故障诊断技术也随之兴起和发展。故障诊断的主要目标是及时检测、识别并预测设备的不正常行为或故障,以减少停机时间和维护成本。其中,基于震动信号分析的技术受到了广泛关注。这些震动信号包含了丰富的设备健康状况信息,而对这些信号进行有效分析则有助于早期检测潜在故障。传统的设备故障诊断方法通常依赖于经验丰富的技术人员进行手动分析,然而,这种方法存在主观性高、诊断效率低、故障检测精度低等问题。增量学习被视为一种允许机器学习模型从新数据中学习并更新当前模型的技术,由于其不需要重新训练整个模型,使得训练代价大幅减小,尤其对于数据随时间持续更新的设备故障诊断场景尤为重要。
基于此,现有技术存在以下技术问题:(1)现有方法在新数据出现时需要重新训练,浪费算力资源和之前的知识;(2)现有方法将数据特征都被视为同等重要,没有针对性地筛选那些对模型训练最有价值的数据,导致学习效率降低;(3)在实际设备故障识别应用现场中,故障数据采集困难,各故障类别数据通常不均衡,算法存在适应性不强、稳定性差、故障识别精度低等问题。
发明内容
有鉴于此,本发明的目的在于提供一种基于增量学习的设备故障诊断方法及模型的构建方法,可以提高识别精度,并能够处理新数据,且可以筛选出有价值的数据。
第一方面,本发明提供一种基于增量学习的设备故障诊断模型的构建方法,其中,该方法包括:获取预先采集的震动信号数据;震动信号数据为对预设刮板输送机的轴承零部件进行采集的数据;将震动信号数据输入至预先设置的增量学习框架中,并将满足预设融合条件的震动信号数据与增量学习框架中的训练数据集进行融合,构建增量学习样本集;通过增量学习样本集对增量学习框架包括的初始诊断模型进行更新训练;其中,初始诊断模型通过训练数据集训练,且,基于量子谐振优化的神经网络模型和基于切比雪夫优化的极限学习机算法构建;基于更新训练的初始诊断模型构建设备故障诊断模型。
第二方面,本发明实施例还提供一种基于增量学习的设备故障诊断方法,该方法包括:获取待诊断信号;待诊断信号为对目标刮板输送机的轴承零部件采集的信号;将待诊断信号输入至预先构建的设备故障诊断模型中,通过故障诊断模型对待诊断信号进行故障类型分类预测,确定故障分类结果;设备故障诊断模型为基于上述基于增量学习的设备故障诊断模型的构建方法构建的;根据故障分类结果对目标刮板输送机的轴承零部件进行故障诊断。
第三方面,本发明实施例还提供一种电子设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行程序时实现上述方法的步骤。
第四方面,本发明实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,计算机程序被处理器运行时执行上述方法的步骤。
第五方面,本发明实施例还提供一种基于增量学习的设备故障诊断模型的构建装置,该装置包括:数据获取模块,用于获取预先采集的震动信号数据;震动信号数据为对预设刮板输送机的轴承零部件进行采集的数据;数据处理模块,用于将震动信号数据输入至预先设置的增量学习框架中,并将满足预设融合条件的震动信号数据与增量学习框架中的训练数据集进行融合,构建增量学习样本集;训练模块,用于通过增量学习样本集对增量学习框架包括的初始诊断模型进行更新训练;其中,初始诊断模型通过训练数据集训练,且,基于量子谐振优化的神经网络模型和基于切比雪夫优化的极限学习机算法构建;模型生成模块,用于基于更新训练的初始诊断模型构建设备故障诊断模型。
第六方面,本发明实施例还提供一种基于增量学习的设备故障诊断装置,其中,该装置包括:信号获取模块,用于获取待诊断信号;待诊断信号为对目标刮板输送机的轴承零部件采集的信号;执行模块,用于将待诊断信号输入至预先构建的设备故障诊断模型中,通过故障诊断模型对待诊断信号进行故障类型分类预测,确定故障分类结果;设备故障诊断模型为基于上述基于增量学习的设备故障诊断模型的构建方法构建的;输出模块,用于根据故障分类结果对目标刮板输送机的轴承零部件进行故障诊断。
本发明实施例带来了以下有益效果:本发明提供的一种基于增量学习的设备故障诊断方法及模型的构建方法,将震动信号数据和增量学习框架的训练数据集结合,构建增量学习样本集,并通过增量学习样本集对增量学习框架包括的初始诊断模型进行更新训练,构建设备故障诊断模型。增量学习可以从旧任务中获取知识,使模型学习解决新任务,同时保留之前务中学习到的知识,可以避免新数据来时重新训练模型参数。其中,本发明实施例将实时采集的数据输入学习模型中,使故障诊断模型能够学习到实时采集数据中的特征,并在维持原有分类效果的基础上,能够从实时数据中整合提高分类能力。
本发明的其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点在说明书以及附图中所特别指出的结构来实现和获得。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种基于增量学习的设备故障诊断模型的构建方法的流程图;
图2为本发明实施例提供的一种增量学习框架的示意图;
图3为本发明实施例提供的一种基于增量学习的设备故障诊断模型的构建流程图;
图4为本发明实施例提供的另一种基于增量学习的设备故障诊断模型的构建方法的流程图;
图5为本发明实施例提供的一种基于增量学习的设备故障诊断方法的流程图;
图6为本发明实施例提供的一种基于增量学习的设备故障诊断模型的构建装置的结构示意图;
图7为本发明实施例提供的另一种基于增量学习的设备故障诊断模型的构建装置的结构示意图;
图8为本发明实施例提供的一种基于增量学习的设备故障诊断装置的结构示意图;
图9为本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,以下通过特定的具体实例说明本公开的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本公开的其他优点与功效。显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。本公开还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本公开的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。基于本公开中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。
需要说明的是,下文描述在所附权利要求书的范围内的实施例的各种方面。应显而易见,本文中所描述的方面可体现于广泛多种形式中,且本文中所描述的任何特定结构及/或功能仅为说明性的。基于本公开,所属领域的技术人员应了解,本文中所描述的一个方面可与任何其它方面独立地实施,且可以各种方式组合这些方面中的两者或两者以上。举例来说,可使用本文中所阐述的任何数目个方面来实施设备及/或实践方法。另外,可使用除了本文中所阐述的方面中的一或多者之外的其它结构及/或功能性实施此设备及/或实践此方法。
还需要说明的是,以下实施例中所提供的图示仅以示意方式说明本公开的基本构想,图式中仅显示与本公开中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。另外,在以下描述中,提供具体细节是为了便于透彻理解实例。然而,所属领域的技术人员将理解,可在没有这些特定细节的情况下实践方面。
为了便于理解,本发明实施例提供一种基于增量学习的设备故障诊断模型的构建方法,图1示出了本发明实施例提供的一种基于增量学习的设备故障诊断模型的构建方法的流程图,如图1所示,该方法包括以下步骤:
步骤S102,获取预先采集的震动信号数据。
具体的,本发明实施例的数据来源于刮板输送机,刮板输送机具有轴承零部件,且轴承零部件的故障容易导致刮板输送机的故障。故,本发明实施例训练模型的震动信号数据为对预设刮板输送机的轴承零部件进行采集的数据,针对刮板输送机的轴承零部件进行故障诊断。在具体实现时,本发明实施例通过传感器采集刮板输送机的震动信号,震动信号的格式主要为时域内的震动信号数据,可表示为,即,/>为时刻/>下的震动信号。
在一个具体的实施例中,采集得到了时刻到/>的震动信号数据,则该信号序列可以表示为:/>;进一步地,计算信号的均值和方差,为:;/>;其中,/>为信号的均值,/>为信号的方差,/>为震动信号序列的时序长度。
步骤S104,将震动信号数据输入至预先设置的增量学习框架中,并将满足预设融合条件的震动信号数据与增量学习框架中的训练数据集进行融合,构建增量学习样本集。
步骤S106,通过增量学习样本集对增量学习框架包括的初始诊断模型进行更新训练。
步骤S108,基于更新训练的初始诊断模型构建设备故障诊断模型。
本发明提出一种基于增量学习的设备故障诊断模型的构建方法。增量学习可以从旧任务中获取知识,使模型学习解决新任务,同时保留之前务中学习到的知识,可以避免新数据来时重新训练模型参数。基于增量学习思想,本发明提出一种增量学习的神经网络框架,将实时采集的数据输入学习模型中,使故障诊断模型能够学习到实时采集数据中的特征,并在维持原有分类效果的基础上,从实时数据中整合提高分类能力。本发明采用基于样本增量的方式实现故障诊断模型的增量学习。本发明提出的增量学习框架如图2所示,增量学习是连续不断的学习过程,在训练的过程中,假设模型已经学习了前个任务:,在面对新的任务/>和其对应的数据/>时,经过历史数据训练的模型可以利用从旧任务中学习到的先验知识帮助/>的学习,然后利用学习到的知识更新模型。即,增量学习能够在学习新知识的同时,保留先前学到的绝大部分知识,从而使得模型在旧任务和新任务上都能有出色的表现。
在训练过程中,为不同时刻下所采集新的无标签数据,采用伪标签法使用无标签的数据来辅助原始的有标签的数据/>进行训练。具体的,可以使用设备故障诊断模型对无标签数据/>进行预测,并将预测结果/>作为伪标签加入到原始训练集/>中构成新的训练集/>,并再次训练网络。这样可以逐步学习新的类别,并提高模型的性能。
本发明提出的基于增量学习的设备故障诊断方法,将训练完成的故障诊断模型放入增量学习框架中,来完成样本增量学习的功能,基于增量学习的设备故障诊断模型的构建流程如图3所示。具体的,本发明实施例通过下述步骤构建增量学习样本集:通过震动信号数据对增量学习框架中的初始诊断模型进行分类训练,并使用分类训练后的初始诊断模型对增量学习框架中的训练数据集进行分类预测,确定当前初始诊断模型对应的分类精度提升结果;如果分类精度提升结果表征当前初始诊断模型的分类精度提升,则基于震动信号数据构建新训练样本集;从新训练样本集中选择每个样本类别分别对应的目标样本,并将目标样本加入到训练数据集的同一类中,将目标样本和训练数据集进行融合,构建增量学习样本集。
在具体实现时,设备故障诊断模型的训练步骤包括:
1、导入经过旧数据离线训练后得到一个基础的设备故障诊断模型,同时,判断下一时刻的新数据集是否可用,判断的依据为,模型经过新数据的训练后在原始数据中的精度是否有提升,若有提升则新数据集可用,进入下一步骤,若无提升则新数据集不可用,停止训练。
2、在新数据集中对每个类别的样本数据选择m个样本数据进行保存,具体的,将新旧数据同一类别下的数据通过特征聚类获得特征中心,在两特征中心点分别以特征中心间距为球体半径,落于两球内部的新数据点,为被选取的样本点,随后将被选取的样本点加入原始数据集的同一类中,将保存后的融合数据集送入新的任务中,同时进入下一步骤。
3、使用设备故障诊断模型对加入样本后的融合数据集开始训练,生成下一任务对应的模型,判断下一任务对应的数据集可用性,若可用则返回步骤2,若不可用进入下一步骤。
4、终止训练,更新模型参数,并输出当前版本模型。
其中,初始诊断模型通过上述训练数据集训练,且,基于量子谐振优化的神经网络模型和基于切比雪夫优化的极限学习机算法构建。通过提出基于量子谐振优化的神经网络模型,受启发于量子力学中的谐振子模型,将谐振子的动态特性映射到神经网络参数的优化上,实现以物理规律驱动的神经网络参数优化的方式,可以避免神经网络在参数寻优时陷入局部最优解的现象;通过引入切比雪夫优化,以提高网络的稀疏性,从而加速前向传播速度,同时提升分类精度。
本发明实施例提供的一种基于增量学习的设备故障诊断模型的构建方法,提出一种增量学习的神经网络框架,并提出一种基于增量学习的设备故障诊断方法。增量学习可以从旧任务中获取知识,使模型学习解决新任务,同时保留之前务中学习到的知识,可以避免新数据来时重新训练模型参数。其中,本发明实施例将实时采集的数据输入学习模型中,使故障诊断模型能够学习到实时采集数据中的特征,并在维持原有分类效果的基础上,能够从实时数据中整合提高分类能力。
进一步地,进一步的,在上述实施例的基础上,本发明实施例还提供另一种基于增量学习的设备故障诊断模型的构建方法,主要对初始诊断模型的构建方法进行说明,具体的,图4示出了本发明实施例提供的另一种基于增量学习的设备故障诊断模型的构建方法的流程图,如图4所示,该方法包括以下步骤:
步骤S202,获取预先构建的训练数据集。
在具体实现时,本发明实施例的离线训练设备故障诊断模型的方式为采用初始构造的数据集,经样本扩充后得到。具体的,训练数据集的构建方法,包括:
a、获取对轴承零部件预先采集的时域内的震动信号样本。
b、基于震动信号样本所指示的故障类型和位置,对震动信号样本进行标注,生成样本标签。
在具体实现时,参照上述实施例,本发明实施例的数据来源于刮板输送机,则,本发明实施例获取预先通过传感器采集到的刮板输送机的震动信号样本,并对样本进行标注,生成样本标签,以对模型训练。具体的,样本标签包括正常、内圈故障、外圈故障、滚珠故障和复合故障。其中,本发明实施例基于轴承的不同故障类型和其位置,标注为以下5个类别:
标签1-正常:轴承处于正常工作状态,无明显故障。标签2-内圈故障:故障发生在轴承的内圈。标签3-外圈故障:故障发生在轴承的外圈。标签4-滚珠故障:故障发生在轴承的滚珠上。标签5-复合故障:同时存在多种类型的故障。
c、根据样本标签和震动信号样本构建初始样本集,并通过预先设置的基于时间序列的条件生成对抗网络对初始样本集进行数据扩充,生成扩充样本。
其中,条件生成对抗网络包括生成器和判别器;本发明实施例通过将初始样本集输入至生成器中,基于预设的随机噪声和条件向量生成初始样本集对应的伪信号;其中,条件向量包括初始样本集在时域和频域上的六维向量;生成器包括预设的多样性正则项;通过判别器对伪信号进行判别,如果伪信号不满足预设的判别要求,对生成器和判别器进行更新;直到生成器和判别器收敛,将当前伪信号确定为初始样本集对应的扩充样本。
d、基于扩充样本和初始样本集构建训练数据集。
可以理解的是,数据的采集过程是耗时耗力的,尤其是故障数据的采集是十分困难的,由于复杂的现场环境和设备的多种状态,使得数据量不足成为普遍问题。故,本发明提出一种基于时间序列的条件生成对抗网络进行样本生成,进而实现数据扩充,本发明对条件生成对抗网络的结构进行了修改,使生成器在生成数据时考虑到特定的条件。
生成对抗网络由生成器(G)和判别器(D)组成,生成器的任务是生成信号数据,其输入是一个随机噪声/>以及一个条件向量/>
条件向量与噪声z的融合方式为拼接操作,条件向量/>的作用是提供附加的信息,使得生成器/>能够生成具有特定特性的伪信号。为了使得/>能够包含原始震动信号的重要特征,本发明对条件向量/>的获取方式为:
1、根据计算得到的信号的均值和方差/>,进一步计算信号的偏度和峰度,计算方式为:
其中,为信号的标准差,/>为信号的偏度,/>为信号的峰度,/>表示第i个震动信号,/>为震动信号序列的时序长度。
进一步地,通过傅里叶变换,获得信号的频域表示:
其中,是傅里叶变换,/>表示t时刻的震动信号数据,/>为信号的频域表示。
进一步地,对信号的频域表示的幅值进行缩放,设信号频域表示的第/>个数值可以分解为:
其中,是/>的幅值,/>是/>的相位,/>为复数中的虚数单位。
则,经过缩放后,对于每个频率成分,其新的幅值/>为:
其中,为信号频域表示的第/>个数值,/>是一个随机数,取值范围在/>,表示在该频率上的缩放比例;/>是了一个预定义的扩展因子,控制整体的缩放强度。
进一步地,保持相位不变,使用逆傅里叶变换将缩放后的频谱转换回时域,得到增强后的时间序列数据/>
其中,是逆傅里叶变换操作,/>是对/>的幅值进行缩放得到的信号的频域表示。
进一步地,对增强后的时间序列数据求取均值和方差,得到其均值/>和方差
进一步地,计算信号能量,可以表示为:
其中,为信号频域表示的第/>个数值,/>为信号能量。
进一步地,计算主要频率,可以表示为:
其中,为主要频率。
考虑到震动信号在时域和频域上的特性,本发明将上述提取的特性合并为条件向量
条件向是一个六维向量,包含了原始震动信号在时域和频域上的主要特性。通过对该条件向量的设置,可以为生成器/>提供关于原始震动信号特性的信息,使得生成的伪信号更加接近真实的震动信号。
进一步地,生成器输出的是一个合成信号,可以表示为:
其中,表示生成器模型,/>表示条件向量,/>表示生成器的参数,可以表示为:
其中,表示生成器模型。
在条件生成对抗网络的训练过程中,本发明对生成器的损失函数进行改进,引入多样性正则项,可以表示为:
其中,是生成数据的总数。
正则项鼓励生成数据在特定区域有所变化,从而增加了数据的多样性。则,生成器的整体损失函数为:
其中,是正则化系数,/>是原始的生成器损失,计算方式为:
判别器的任务是判断输入的信号/>是真实数据还是生成器生成的数据,其输入是信号/>和条件/>,输出是一个概率值/>,表示输入数据是真实数据的概率,可以表示为:
其中,表示输入数据,可以是真实数据或由生成器生成的数据;/>表示条件向量,/>表示输入数据为真实数据的概率,/>表示判别器的参数,/>表示判别器模型。
在条件生成对抗网络的训练过程中,判别器的损失函数为:
其中,是判别器的输入数据的样本分布,/>是生成样本分布,和/>分别表示在判别器的输入数据的样本分布和生成样本分布上的期望。
在训练过程中,条件生成网络的训练步骤为:
1、初始化生成器和判别器的参数和/>
2、对于每一个训练迭代:
2.1、使用真实数据和生成数据更新判别器,最小化
2.2、使用随机噪声生成数据,更新生成器,最小化
3、重复步骤2,直到模型收敛。
4、重复生成个信号,其中,/>由人为预设。
训练完成后,将生成器生成新的/>个信号数据添加到初始构造的训练数据集中,得到扩充后的训练数据集。
步骤S204,通过预设的数据预处理单元对训练数据集进行数据预处理,输出训练数据集对应的声谱图。
本发明实施例将训练数据集输入至预设的数据预处理单元中,对训练数据集依次进行降噪处理和信号预加重处理,输出高频信号加重后的训练数据集;对高频信号加重后的训练数据集进行分帧与加窗处理,并对加窗后的每帧信号进行短时傅里叶变换,得到信号在不同频率和时间上的分布;基于信号在不同频率和时间上的分布生成声谱图。
具体的,在增量学习框架中,设备故障诊断模型包括数据预处理单元、特征提取单元、故障分类单元。在对故障诊断模型进行训练时,将扩充后的训练数据集输入到数据预处理单元进行数据预处理。具体的,首先进行降噪处理,设扩充后的训练数据集中的设备的震动信号可以分解为:
其中,是观测到的信号,/>是真实的设备震动信号,/>是噪音。
本发明采用小波去噪技术,将信号分解为不同的频率分量,可以表示为:
其中,是小波母函数,/>和/>是变换的参数。
进一步地,根据每个频率分量的能量大小,对信号进行去噪处理,可以表示为:
其中,是阈值,其值根据信号的噪音水平进行选择。
进一步地,进行信号的预加重。预加重的目的是增加信号的高频部分,以弥补信号在高频处的能量衰减,通过一个一阶差分滤波器来实现,可以表示为:
其中,是预加重系数,一般选择在0.9至1.0之间。
进一步地,进行分帧与加窗。震动信号是非平稳的,所以需将其分成多个小的、近似平稳的帧。设帧长为,帧移为/>,则第/>帧的信号为:
进一步地,对每一帧的信号应用汉宁窗进行加窗,可以表示为:
其中,是汉宁窗函数。
进一步地,对加窗后的每帧信号进行短时傅里叶变换:
其中,表示短时傅里叶变换函数。
基于此,可以得到信号在不同频率和时间上的分布,即声谱图。声谱图是表示信号频率随时间变化的二维图像,其中,x轴表示时间,y轴表示频率,每个点(x,y)的强度或颜色表示该频率在该时间的幅度或能量。以一个二维矩阵表示声谱图,其中,矩阵的每一列对应一个时间帧,矩阵的每一行对应一个频率带,矩阵的第个元素表示在第j个时间帧中第i个频率带的能量或幅度。
步骤S206,将声谱图输入至预先设置的特征提取单元中,对声谱图进行特征提取,确定特征提取输出。
其中,本发明实施例的特征提取单元为基于量子谐振优化的神经网络模型。具体的,特征提取单元包括神经网络模型,且,神经网络模型为3层全连接神经网络。本发明实施例将神经网络模型的神经网络参数视作量子系统,确定每层神经网络的神经网络参数分别对应的谐振子的量子态;将声谱图输入至神经网络模型中,基于预设的拉格朗日方程,以及神经网络参数对应的信息量,对神经网络参数进行求解,确定目标神经网络参数;
直到目标神经网络参数收敛,得到构建好的特征提取模型,并将特征提取模型的输出结果确定为特征提取输出。其中,拉格朗日方程包括谐振子的量子态对应的动能和势能;动能用于表征神经网络模型的损失,势能用于表征神经网络参数距离其最优值的距离。
在具体实现时,将预处理单元输出的声谱图输入到特征提取单元,特征提取单元为基于量子谐振优化的神经网络模型,受启发于量子力学中的谐振子模型,将谐振子的动态特性映射到神经网络参数的优化上,实现以物理规律驱动的神经网络参数优化的方式,能够避免神经网络在参数寻优时陷入局部最优解的现象。首先,进行参数化谐振子的设定,神经网络模型为3层全连接神经网络,将神经网络中的权重和偏置/>两者视作量子系统,每一个权重和偏置都对应一个谐振子的量子态。具体的,设权重为/>(其中i表示神经网络中的第i个权重),其对应的谐振子位置为/>。同样地,对于偏置/>(j表示第j个偏置),对应的位置为/>
进一步地,进行动能与势能的定义及映射。具体的,将动能映射为神经网络的损失,训练的过程受动能约束,目标是使得动能不断减小,可以表示为:
其中,为动能目标函数,/>为神经网络的交叉熵损失函数,/>为粒子的质量,/>为损失函数的变化率。
进一步地,将势能映射为权重和偏置距离其最优值的“距离”,可以表示为:
其中,是弹性系数,由人为预设。/>和/>为权重和偏置的当前估计的最优值,/>为势能目标函数。
进一步地,构建拉格朗日方程并进行求解,具体的,定义拉格朗日量为动能和势能之差,可以表示为:
其中,为拉格朗日量。
进一步地,定义一个权重或偏置的信息量为其梯度的绝对值,可以表示为:
其中,和/>分别是权重和偏置的梯度,/>和/>分别是权重和偏置的信息量。/>和/>分别是权重和偏置的拓扑结构,/>和/>分别是权重和偏置的空间频率。
权重和偏置的拓扑结构和/>取决于它们所连接的神经元的活跃度,活跃度可以通过每个神经元的输出值来度量,其计算方式为:/>
其中,表示与权重/>连接的所有神经元的集合,/>表示神经元n的输出值。
权重和偏置的空间频率和/>由权重和偏置在过去几次迭代中的变化幅度来衡量,可以表示为:
其中,是考虑的过去迭代次数,通常可以设置为5或10。
进一步地,在神经网络参数更新时,以权重作为自变量,拉格朗日方程可以表示为:
其中,·表示时间导数。通过求解上述方程,可以得到:
进一步地,解此二阶常微分方程,得到其解为:
其中,是谐振频率,/>为权重的信息量,/>为权重更新学习率。
以偏置作为自变量,拉格朗日方程可以表示为:
其中,·表示时间导数。通过求解上述方程,可以得到:
进一步地,解此二阶常微分方程,得到其解为:
/>
其中,是谐振频率,/>为偏置的信息量,/>为偏置更新学习率。
进一步地,权重更新学习率和偏置更新学习率/>为动态调整的方式进行设置,其动态调整的方式为:
其中,是初始学习率,/>是一个调节参数,/>为权重的历史更新累积量,为偏置的历史更新累积量。
进一步地,权重的历史更新累积量和偏置的历史更新累积量/>计算方式为:
其中,是考虑的过去迭代次数,由人为预设。
基于此,神经网络参数更新的过程即权重和偏置在其初始值和最优值之间振荡,随着时间的推移,振荡的幅度会逐渐减小,最终权重会收敛到最优值,即重复上述过程直到权重和偏置的变化小于预设阈值或达到预定的迭代次数。
步骤S208,将特征提取输出输入至预先设置的故障分类单元中,对故障分类单元进行分类训练,并基于训练好的故障分类单元构建初始诊断模型。
其中,故障分类单元包括基于切比雪夫优化的极限学习机算法,以通过极限学习机算法进行分类训练。在具体实现时,本发明实施例将特征提取输出输入至预设的极限学习机中,确定初始输出权重;利用预设的切比雪夫多项式对极限学习机进行优化,确定更新输出权重。判断当前更新输出权重对应的损失值是否满足预设的损失要求,如果否,对极限学习机的学习速率进行更新,对极限学习机的隐藏层数量进行动态评估调整,并对正则化参数进行更新。直到极限学习机的神经元输出满足预设的训练要求,基于当前极限学习机构建初始诊断模型。极限学习机的隐藏层包括神经元权重,神经元权重根据隐藏层的输出对应于预设的目标输出之间的相关性确定。
具体的,神经网络训练完成后,将神经网络的输出特征输入到故障分类单元。本发明提出一种基于切比雪夫优化的极限学习机算法作为分类器,通过引入切比雪夫优化,以提高网络的稀疏性,从而加速前向传播速度,同时提升分类精度。
具体的,极限学习机是一种单隐层前馈神经网络。其特点是隐层权重和偏置不需要调整,只需要输出权重。其数学模型可以表示为:
其中,是隐层输出矩阵,/>是输出权重,/>是目标输出。
在算法求解过程中,为了获得输出权重,使用以下公式进行计算:
其中,是/>的伪逆。
进一步地,设切比雪夫多项式为,其中/>是阶数。对于极限学习机的输出权重/>,利用切比雪夫多项式进行优化,构造一个新的优化问题:
其中,是正则化参数,/>为初始输出权重;/>为目标输出;/>是隐层输出矩阵。
进一步地,通过求解此优化问题,可以得到新的输出权重,并用于替换传统极限学习机中的输出权重。具体的,对于本优化问题,使用拉格朗日乘子法,可以得到:
其中,是拉格朗日乘子。
进一步地,对求导,并使其等于0,可以得到:
进一步地,对于关于的非线性方程,利用牛顿法可以求得/>,即优化后的输出权重。
进一步地,定义损失函数为:
其中,是第/>个样本的网络输出,而/>是第/>个样本的真实标签。
本发明中极限学习机的学习速率是动态更新的方式进行调整,且更新方式基于损失函数/>的变化率,可以表示为:
其中,是在第/>轮迭代的损失,/>是在第/>轮迭代的损失。/>
进一步地,在动态学习速率的更新过程中,如果为正,则说明损失在增加,则应该降低学习速率,避免震荡。可以表示为:
其中,是一个衰减因子。
如果为负,则说明损失在减少,则可以尝试增加学习速率,加速收敛。可以表示为:
其中,是一个固定的小增量。
基于此,学习速率的动态更新公式可以表示为:
其中,是/>的符号函数,当/>时值为1,当/>时值为-1。
进一步地,极限学习机的隐藏层数量为动态评估调整设置,具体的,定义极限学习机网络的性能度量为,其基于验证集的准确率进行确定,即,给定一个验证集/>,则有:
其中,是第/>个样本的网络输出,/>是其对应的真实标签,/>是指示函数。
进一步地,在每次迭代后会评估的值。若/>值减小,则显示网络性能有所下降,增加更多的隐藏神经元。具体的,本发明引入一个增量/>来表示每次要添加的神经元数量,可以表示为:
其中,是第/>轮迭代后的隐藏神经元数量。
为了确保网络不过于复杂,设置一个上限,隐藏神经元的数量不得超过上限
进一步地,若值增大,则表明网络性能持续提高,减少隐藏神经元的数量,以简化网络结构。则,神经元数量的更新公式为:
其中,限制条件为,/>是设置的最小神经元数量。
基于此,隐藏神经元数量的自适应更新公式为:
/>
其中,是/>的符号函数,当/>时值为-1(性能提高,则减少神经元数量),当/>时值为1(性能下降,则增加神经元数量)。
进一步地,在训练过程中,正则化系数是根据验证集的性能动态调整,具体的,设损失函数/>为:
则,在每个训练迭代中,除了更新参数,还要基于验证集的性能对/>进行更新。如果验证集的错误率上升,则增加/>以引入更强的正则化;反之,则减少。具体的,动态调整公式如下:
其中,是下一次迭代的正则化系数,/>是当前迭代的正则化系数,是正则化系数的学习率,是一个较小的正数。/>是一个符号函数,定义如下:
进一步地,极限学习机的隐藏层神经元的权重是根据其对输出层贡献的大小动态分配。具体的,传统的极限学习机的隐藏层神经元的权重与输出的关系可以表示为:
本发明为每个隐藏层神经元引入一个权重系数,则,输出层的输出可以表示为:
其中,是一个对角矩阵,其对角线上的元素是神经元的权重系数/>
进一步地,为了确定每个神经元的权重系数,本发明引入辅助的目标函数,其基于每个神经元与目标输出之间的相关性,可以表示为:
其中,是第/>个隐藏层神经元的输出/>和目标输出/>之间的相关性。
在对极限学习机的训练过程中,目标是最大化目标函数,则每个神经元的权重系数/>可以通过以下公式迭代地更新:/>
其中,是权重更新的学习率,/>是目标函数相对于权重系数/>的偏导数。
进一步地,进行简化和求导,可以得到:
基于此,每个神经元的权重系数更新都是直接基于其与目标输出之间的相关性。
本发明实施例提供的另一种基于增量学习的设备故障诊断模型的构建方法,提出一种基于时间序列的条件生成对抗网络进行样本生成,对条件生成对抗网络的结构进行了修改,使生成器在生成数据时考虑到特定的条件,以保证充足的训练数据量。还提出基于量子谐振优化的神经网络模型,受启发于量子力学中的谐振子模型,将谐振子的动态特性映射到神经网络参数的优化上,实现以物理规律驱动的神经网络参数优化的方式,可以避免神经网络在参数寻优时陷入局部最优解的现象。此外,还提出一种基于切比雪夫优化的极限学习机算法作为分类器,通过引入切比雪夫优化,以提高网络的稀疏性,从而加速前向传播速度,同时提升分类精度。
进一步的,在上述实施例的基础上,本发明实施例还提供一种基于增量学习的设备故障诊断方法,图5示出了本发明实施例提供的一种基于增量学习的设备故障诊断方法的流程图,如图5所示,该包括以下步骤:
步骤S302,获取待诊断信号。
步骤S304,将待诊断信号输入至预先构建的设备故障诊断模型中,通过故障诊断模型对待诊断信号进行故障类型分类预测,确定故障分类结果。
步骤S306,根据故障分类结果对目标刮板输送机的轴承零部件进行故障诊断。
在具体实现时,待诊断信号为对目标刮板输送机的轴承零部件采集的信号,设备故障诊断模型为基于上述基于增量学习的设备故障诊断模型的构建方法构建的。将待诊断信号输入至预先构建的设备故障诊断模型中后,该模型的输出为训练过程中的样本标签,如,标签1-正常:轴承处于正常工作状态,无明显故障。标签2-内圈故障:故障发生在轴承的内圈。标签3-外圈故障:故障发生在轴承的外圈。标签4-滚珠故障:故障发生在轴承的滚珠上。标签5-复合故障:同时存在多种类型的故障。基于此,可以对目标刮板输送机的轴承零部件进行故障诊断。
本发明实施例提供的一种基于增量学习的设备故障诊断方法,与上述实施例提供的一种基于增量学习的设备故障诊断模型的构建方法具有相同的技术特征,所以也能解决相同的技术问题,达到相同的技术效果。
进一步地,在上述方法实施例的基础上,本发明实施例还提供一种基于增量学习的设备故障诊断模型的构建装置,图6示出了本发明实施例提供的一种基于增量学习的设备故障诊断模型的构建装置的结构示意图,如图6所示,该装置包括:数据获取模块100,用于获取预先采集的震动信号数据;震动信号数据为对预设刮板输送机的轴承零部件进行采集的数据;数据处理模块200,用于将震动信号数据输入至预先设置的增量学习框架中,并将满足预设融合条件的震动信号数据与增量学习框架中的训练数据集进行融合,构建增量学习样本集;训练模块300,用于通过增量学习样本集对增量学习框架包括的初始诊断模型进行更新训练;模型生成模块400,用于基于更新训练的初始诊断模型构建设备故障诊断模型。
本发明实施例提供的一种基于增量学习的设备故障诊断模型的构建装置,与上述实施例提供的一种基于增量学习的设备故障诊断模型的构建方法具有相同的技术特征,所以也能解决相同的技术问题,达到相同的技术效果。
进一步的,本发明实施例还提供了另一种基于增量学习的设备故障诊断模型的构建装置,图7示出了本发明实施例提供的另一种基于增量学习的设备故障诊断模型的构建装置的结构示意图,如图7所示,上述数据处理模块200,还用于通过震动信号数据对增量学习框架中的初始诊断模型进行分类训练,并使用分类训练后的初始诊断模型对增量学习框架中的训练数据集进行分类预测,确定当前初始诊断模型对应的分类精度提升结果;如果分类精度提升结果表征当前初始诊断模型的分类精度提升,则基于震动信号数据构建新训练样本集;从新训练样本集中选择每个样本类别分别对应的目标样本,并将目标样本加入到训练数据集的同一类中,将目标样本和训练数据集进行融合,构建增量学习样本集。
本发明实施例还包括模型构建模块500,用于获取预先构建的训练数据集;通过预设的数据预处理单元对训练数据集进行数据预处理,输出训练数据集对应的声谱图;将声谱图输入至预先设置的特征提取单元中,对声谱图进行特征提取,确定特征提取输出;特征提取单元为基于量子谐振优化的神经网络模型;将特征提取输出输入至预先设置的故障分类单元中,对故障分类单元进行分类训练,并基于训练好的故障分类单元构建初始诊断模型;其中,故障分类单元包括基于切比雪夫优化的极限学习机算法,以通过极限学习机算法进行分类训练。
上述模型构建模块500,还用于获取对轴承零部件预先采集的时域内的震动信号样本;基于震动信号样本所指示的故障类型和位置,对震动信号样本进行标注,生成样本标签;样本标签包括正常、内圈故障、外圈故障、滚珠故障和复合故障;根据样本标签和震动信号样本构建初始样本集,并通过预先设置的基于时间序列的条件生成对抗网络对初始样本集进行数据扩充,生成扩充样本;基于扩充样本和初始样本集构建训练数据集。
条件生成对抗网络包括生成器和判别器;上述模型构建模块500,还用于将初始样本集输入至生成器中,基于预设的随机噪声和条件向量生成初始样本集对应的伪信号;其中,条件向量包括初始样本集在时域和频域上的六维向量;生成器包括预设的多样性正则项;通过判别器对伪信号进行判别,如果伪信号不满足预设的判别要求,对生成器和判别器进行更新;直到生成器和判别器收敛,将当前伪信号确定为初始样本集对应的扩充样本。
上述模型构建模块500,还用于将训练数据集输入至预设的数据预处理单元中,对训练数据集依次进行降噪处理和信号预加重处理,输出高频信号加重后的训练数据集;对高频信号加重后的训练数据集进行分帧与加窗处理,并对加窗后的每帧信号进行短时傅里叶变换,得到信号在不同频率和时间上的分布;基于信号在不同频率和时间上的分布生成声谱图。
特征提取单元包括神经网络模型,且,神经网络模型为3层全连接神经网络;上述模型构建模块500,还用于将神经网络模型的神经网络参数视作量子系统,确定每层神经网络的神经网络参数分别对应的谐振子的量子态;将声谱图输入至神经网络模型中,基于预设的拉格朗日方程,以及神经网络参数对应的信息量,对神经网络参数进行求解,确定目标神经网络参数;其中,拉格朗日方程包括谐振子的量子态对应的动能和势能;动能用于表征神经网络模型的损失,势能用于表征神经网络参数距离其最优值的距离;直到目标神经网络参数收敛,得到构建好的特征提取模型,并将特征提取模型的输出结果确定为特征提取输出。
将特征提取输出输入至预设的极限学习机中,确定初始输出权重;利用预设的切比雪夫多项式对极限学习机进行优化,确定更新输出权重;其中,切比雪夫多项式对应的优化问题包括:
其中,是正则化参数;/>为初始输出权重;/>为目标输出;/>是隐层输出矩阵;判断当前更新输出权重对应的损失值是否满足预设的损失要求,如果否,对极限学习机的学习速率进行更新,对极限学习机的隐藏层数量进行动态评估调整,并对正则化参数进行更新;其中,极限学习机的隐藏层包括神经元权重,神经元权重根据隐藏层的输出对应于预设的目标输出之间的相关性确定;直到极限学习机的神经元输出满足预设的训练要求,基于当前极限学习机构建初始诊断模型。
进一步的,本发明实施例还提供一种基于增量学习的设备故障诊断装置,图8示出了本发明实施例提供的一种基于增量学习的设备故障诊断装置的结构示意图,如图8所示,该装置包括:信号获取模块10,用于获取待诊断信号;待诊断信号为对目标刮板输送机的轴承零部件采集的信号;执行模块20,用于将待诊断信号输入至预先构建的设备故障诊断模型中,通过故障诊断模型对待诊断信号进行故障类型分类预测,确定故障分类结果;设备故障诊断模型为基于上述基于增量学习的设备故障诊断模型的构建方法构建的;输出模块30,用于根据故障分类结果对目标刮板输送机的轴承零部件进行故障诊断。
本发明实施例提供的一种基于增量学习的设备故障诊断装置,与上述实施例提供的一种基于增量学习的设备故障诊断模型的构建方法具有相同的技术特征,所以也能解决相同的技术问题,达到相同的技术效果。
本发明实施例还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述图1至图5任一所示的方法的步骤。
本发明实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,计算机程序被处理器运行时执行上述图1至图5任一所示的方法的步骤。
本发明实施例还提供了一种电子设备的结构示意图,如图9所示,为该电子设备的结构示意图,其中,该电子设备包括处理器91和存储器90,该存储器90存储有能够被该处理器91执行的计算机可执行指令,该处理器91执行该计算机可执行指令以实现上述图1至图5任一所示的方法。
在图9示出的实施方式中,该电子设备还包括总线92和通信接口93,其中,处理器91、通信接口93和存储器90通过总线92连接。
其中,存储器90可能包含高速随机存取存储器(RAM,Random Access Memory),也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。通过至少一个通信接口93(可以是有线或者无线)实现该系统网元与至少一个其他网元之间的通信连接,可以使用互联网,广域网,本地网,城域网等。总线92可以是ISA(Industry StandardArchitecture,工业标准体系结构)总线、PCI(Peripheral Component Interconnect,外设部件互连标准)总线或EISA(Extended Industry Standard Architecture,扩展工业标准结构)总线等,还可以是AMBA(Advanced Microcontroller Bus Architecture,片上总线的标准)总线,其中,AMBA定义了三种总线,包括APB(Advanced Peripheral Bus)总线、AHB(Advanced High-performance Bus)总线和AXI(Advanced eXtensible Interface)总线。总线92可以分为地址总线、数据总线、控制总线等。为便于表示,图9中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
处理器91可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器91中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器91可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital SignalProcessor,简称DSP)、专用集成电路(Application Specific Integrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器91读取存储器中的信息,结合其硬件完成前述图1至图5任一所示的方法。
本发明实施例所提供的一种基于增量学习的设备故障诊断方法及模型的构建方法的计算机程序产品,包括存储了程序代码的计算机可读存储介质,程序代码包括的指令可用于执行前面方法实施例中的方法,具体实现可参见方法实施例,在此不再赘述。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。另外,在本发明实施例的描述中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
在本发明的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
最后应说明的是:以上实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (6)

1.一种基于增量学习的设备故障诊断模型的构建方法,其特征在于,所述方法包括:
获取预先采集的震动信号数据;所述震动信号数据为对预设刮板输送机的轴承零部件进行采集的数据;
将所述震动信号数据输入至预先设置的增量学习框架中,并将满足预设融合条件的所述震动信号数据与所述增量学习框架中的训练数据集进行融合,构建增量学习样本集;
通过所述增量学习样本集对所述增量学习框架包括的初始诊断模型进行更新训练;其中,所述初始诊断模型通过所述训练数据集训练,且,基于量子谐振优化的神经网络模型和基于切比雪夫优化的极限学习机算法构建;
基于更新训练的初始诊断模型构建设备故障诊断模型;
所述训练数据集通过预先设置的基于时间序列的条件生成对抗网络对预设的初始样本集进行数据扩充后构建;所述条件生成对抗网络包括生成器和判别器;通过预先设置的基于时间序列的条件生成对抗网络对预设的初始样本集进行数据扩充的步骤,包括:
将所述初始样本集输入至所述生成器中,基于预设的随机噪声和条件向量生成所述初始样本集对应的伪信号;其中,所述条件向量包括所述初始样本集在时域和频域上的六维向量;所述生成器包括预设的多样性正则项;
通过所述判别器对所述伪信号进行判别,如果所述伪信号不满足预设的判别要求,对所述生成器和所述判别器进行更新;
直到所述生成器和所述判别器收敛,将当前伪信号确定为所述初始样本集对应的扩充样本;
初始诊断模型的构建方法,包括:
获取预先构建的训练数据集;
通过预设的数据预处理单元对所述训练数据集进行数据预处理,输出所述训练数据集对应的声谱图;
将所述声谱图输入至预先设置的特征提取单元中,对所述声谱图进行特征提取,确定特征提取输出;所述特征提取单元为基于量子谐振优化的神经网络模型;
将所述特征提取输出输入至预先设置的故障分类单元中,对所述故障分类单元进行分类训练,并基于训练好的故障分类单元构建初始诊断模型;
其中,所述故障分类单元包括基于切比雪夫优化的极限学习机算法,以通过所述极限学习机算法进行分类训练;
所述特征提取单元包括神经网络模型,且,所述神经网络模型为3层全连接神经网络;
将所述声谱图输入至预先设置的特征提取单元中,对所述声谱图进行特征提取,确定特征提取输出的步骤,包括:
将所述神经网络模型的神经网络参数视作量子系统,确定每层神经网络的神经网络参数分别对应的谐振子的量子态;
将所述声谱图输入至所述神经网络模型中,基于预设的拉格朗日方程,以及所述神经网络参数对应的信息量,对所述神经网络参数进行求解,确定目标神经网络参数;其中,所述拉格朗日方程包括所述谐振子的量子态对应的动能和势能;所述动能用于表征所述神经网络模型的损失,所述势能用于表征所述神经网络参数距离其最优值的距离;
直到所述目标神经网络参数收敛,得到构建好的特征提取模型,并将所述特征提取模型的输出结果确定为特征提取输出;
将所述特征提取输出输入至预先设置的故障分类单元中,对所述故障分类单元进行分类训练,并基于训练好的故障分类单元构建初始诊断模型的步骤,包括:
将所述特征提取输出输入至预设的极限学习机中,确定初始输出权重;
利用预设的切比雪夫多项式对所述极限学习机进行优化,确定更新输出权重;其中,所述切比雪夫多项式对应的优化问题包括:
其中,是正则化参数;/>为初始输出权重;/>为目标输出;/>是隐层输出矩阵;
判断当前更新输出权重对应的损失值是否满足预设的损失要求,如果否,对所述极限学习机的学习速率进行更新,对所述极限学习机的隐藏层数量进行动态评估调整,并对所述正则化参数进行更新;其中,所述极限学习机的隐藏层包括神经元权重,所述神经元权重根据所述隐藏层的输出对应于预设的目标输出之间的相关性确定;
直到所述极限学习机的神经元输出满足预设的训练要求,基于当前极限学习机构建初始诊断模型。
2.根据权利要求1所述的方法,其特征在于,将所述震动信号数据输入至预先设置的增量学习框架中,并将满足预设融合条件的所述震动信号数据与所述增量学习框架中的训练数据集进行融合,构建增量学习样本集的步骤,包括:
通过所述震动信号数据对所述增量学习框架中的初始诊断模型进行分类训练,并使用分类训练后的初始诊断模型对所述增量学习框架中的训练数据集进行分类预测,确定当前初始诊断模型对应的分类精度提升结果;
如果所述分类精度提升结果表征当前初始诊断模型的分类精度提升,则基于所述震动信号数据构建新训练样本集;
从所述新训练样本集中选择每个样本类别分别对应的目标样本,并将所述目标样本加入到所述训练数据集的同一类中,将所述目标样本和所述训练数据集进行融合,构建增量学习样本集。
3.根据权利要求1所述的方法,其特征在于,训练数据集的构建方法,包括:
获取对轴承零部件预先采集的时域内的震动信号样本;
基于所述震动信号样本所指示的故障类型和位置,对所述震动信号样本进行标注,生成样本标签;所述样本标签包括正常、内圈故障、外圈故障、滚珠故障和复合故障;
根据所述样本标签和所述震动信号样本构建初始样本集,并通过预先设置的基于时间序列的条件生成对抗网络对所述初始样本集进行数据扩充,生成扩充样本;
基于所述扩充样本和所述初始样本集构建训练数据集。
4.根据权利要求1所述的方法,其特征在于,通过预设的数据预处理单元对所述训练数据集进行数据预处理,输出所述训练数据集对应的声谱图的步骤,包括:
将所述训练数据集输入至预设的数据预处理单元中,对所述训练数据集依次进行降噪处理和信号预加重处理,输出高频信号加重后的训练数据集;
对高频信号加重后的训练数据集进行分帧与加窗处理,并对加窗后的每帧信号进行短时傅里叶变换,得到信号在不同频率和时间上的分布;
基于所述信号在不同频率和时间上的分布生成声谱图。
5.一种基于增量学习的设备故障诊断方法,其特征在于,所述方法包括:
获取待诊断信号;所述待诊断信号为对目标刮板输送机的轴承零部件采集的信号;
将所述待诊断信号输入至预先构建的设备故障诊断模型中,通过所述故障诊断模型对所述待诊断信号进行故障类型分类预测,确定故障分类结果;所述设备故障诊断模型为基于权利要求1-4任一项所述的基于增量学习的设备故障诊断模型的构建方法构建的;
根据所述故障分类结果对所述目标刮板输送机的轴承零部件进行故障诊断。
6.一种电子设备,其特征在于,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现如权利要求1至5任一项所述的方法的步骤。
CN202311725756.8A 2023-12-15 2023-12-15 基于增量学习的设备故障诊断方法及模型的构建方法 Active CN117407797B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311725756.8A CN117407797B (zh) 2023-12-15 2023-12-15 基于增量学习的设备故障诊断方法及模型的构建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311725756.8A CN117407797B (zh) 2023-12-15 2023-12-15 基于增量学习的设备故障诊断方法及模型的构建方法

Publications (2)

Publication Number Publication Date
CN117407797A CN117407797A (zh) 2024-01-16
CN117407797B true CN117407797B (zh) 2024-03-29

Family

ID=89494827

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311725756.8A Active CN117407797B (zh) 2023-12-15 2023-12-15 基于增量学习的设备故障诊断方法及模型的构建方法

Country Status (1)

Country Link
CN (1) CN117407797B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117713385B (zh) * 2024-02-05 2024-05-03 威海双城电气有限公司 一种基于量子计算和人工智能结合的电力检测系统及方法
CN117851921A (zh) * 2024-03-07 2024-04-09 山东能源数智云科技有限公司 基于迁移学习的设备寿命预测方法及装置

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107316046A (zh) * 2017-03-09 2017-11-03 河北工业大学 一种基于增量补偿动态自适应增强的故障诊断方法
CN113884290A (zh) * 2021-09-28 2022-01-04 江南大学 基于自训练半监督生成对抗网络的调压器故障诊断方法
CN115270956A (zh) * 2022-07-25 2022-11-01 苏州大学 基于持续学习的跨设备增量轴承故障诊断方法
CN115510963A (zh) * 2022-09-20 2022-12-23 同济大学 一种增量式设备故障诊断方法
CN115524527A (zh) * 2022-10-09 2022-12-27 南方电网数字电网研究院有限公司 一种通过电缆附件空间电场反演内部通流导体电压的方法
CN115563565A (zh) * 2022-09-13 2023-01-03 长沙理工大学 一种基于增量学习的电机轴承故障诊断方法及装置
CN116150676A (zh) * 2023-04-19 2023-05-23 山东能源数智云科技有限公司 基于人工智能的设备故障诊断与识别方法及装置
CN116910493A (zh) * 2023-09-12 2023-10-20 山东能源数智云科技有限公司 基于多源特征提取的设备故障诊断模型的构建方法及装置
CN117056734A (zh) * 2023-10-12 2023-11-14 山东能源数智云科技有限公司 基于数据驱动的设备故障诊断模型的构建方法及装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110361176B (zh) * 2019-06-05 2021-11-19 华南理工大学 一种基于多任务特征共享神经网络的智能故障诊断方法
EP4338022A2 (en) * 2021-05-06 2024-03-20 Strong Force IoT Portfolio 2016, LLC Quantum, biological, computer vision, and neural network systems for industrial internet of things

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107316046A (zh) * 2017-03-09 2017-11-03 河北工业大学 一种基于增量补偿动态自适应增强的故障诊断方法
CN113884290A (zh) * 2021-09-28 2022-01-04 江南大学 基于自训练半监督生成对抗网络的调压器故障诊断方法
CN115270956A (zh) * 2022-07-25 2022-11-01 苏州大学 基于持续学习的跨设备增量轴承故障诊断方法
CN115563565A (zh) * 2022-09-13 2023-01-03 长沙理工大学 一种基于增量学习的电机轴承故障诊断方法及装置
CN115510963A (zh) * 2022-09-20 2022-12-23 同济大学 一种增量式设备故障诊断方法
CN115524527A (zh) * 2022-10-09 2022-12-27 南方电网数字电网研究院有限公司 一种通过电缆附件空间电场反演内部通流导体电压的方法
CN116150676A (zh) * 2023-04-19 2023-05-23 山东能源数智云科技有限公司 基于人工智能的设备故障诊断与识别方法及装置
CN116910493A (zh) * 2023-09-12 2023-10-20 山东能源数智云科技有限公司 基于多源特征提取的设备故障诊断模型的构建方法及装置
CN117056734A (zh) * 2023-10-12 2023-11-14 山东能源数智云科技有限公司 基于数据驱动的设备故障诊断模型的构建方法及装置

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
Cost-sensitive classification algorithm combining the Bayesian algorithm and quantum decision tree;Ji, Naihua等;FRONTIERS IN PHYSICS;20230804;第11卷;全文 *
Fault Diagnosis for Power Converters Based on Incremental Learning;Shiqi Zhang等;IEEE Transactions on Instrumentation and Measurement;20230406;第72卷;全文 *
不均衡数据集下基于生成对抗网络的改进深度模型故障识别研究;包萍;刘运节;;电子测量与仪器学报;20190315;第33卷(第03期);全文 *
发电机定子绕组局部放电在线监测关键技术研究;徐永干;万方;20210701;全文 *
基于增量学习的数控机床故障诊断系统;张煜莹等;计量学报;20221114;第43卷(第11期);全文 *

Also Published As

Publication number Publication date
CN117407797A (zh) 2024-01-16

Similar Documents

Publication Publication Date Title
Xu et al. Predicting pipeline leakage in petrochemical system through GAN and LSTM
CN117407797B (zh) 基于增量学习的设备故障诊断方法及模型的构建方法
Hu et al. A hybrid approach based on the Gaussian process with t-observation model for short-term wind speed forecasts
Ramasso et al. Making use of partial knowledge about hidden states in HMMs: an approach based on belief functions
CN111860982A (zh) 一种基于vmd-fcm-gru的风电场短期风电功率预测方法
CN112949828B (zh) 一种基于图学习的图卷积神经网络交通预测方法及系统
Han et al. Network traffic prediction using variational mode decomposition and multi-reservoirs echo state network
Sun et al. A new compound wind speed forecasting structure combining multi-kernel LSSVM with two-stage decomposition technique
CN114297036A (zh) 数据处理方法、装置、电子设备及可读存储介质
CN115376518B (zh) 一种实时噪声大数据的声纹识别方法、系统、设备和介质
CN116822652A (zh) 地铁故障预测方法、装置、电子设备、系统及存储介质
CN117077871A (zh) 基于大数据的能源需求预测模型的构建方法及装置
Chen et al. Fast robust capsule network with dynamic pruning and multiscale mutual information maximization for compound-fault diagnosis
CN117407781B (zh) 基于联邦学习的设备故障诊断方法及装置
Ullah et al. Machine health surveillance system by using deep learning sparse autoencoder
Chang et al. Intelligent fault diagnosis scheme via multi-module supervised-learning network with essential features capture-regulation strategy
Man et al. Bearing Remaining Useful Life Prediction Based on AdCNN and CWGAN under Few Samples
CN116821610B (zh) 一种利用大数据优化风力发电效率的方法
CN113487223A (zh) 一种基于信息融合的风险评估方法和评估系统
CN116303786B (zh) 一种基于多维数据融合算法的区块链金融大数据管理系统
CN114618167A (zh) 反作弊检测模型构建方法以及反作弊检测方法
CN116956197B (zh) 基于深度学习的能源设施故障预测方法、装置及电子设备
CN117892182B (zh) 基于人工智能的索具耐用性测试方法及装置
Liu et al. Recurrent kernel online sequential extreme learning machine with kernel adaptive filter for time series prediction
CN117473275B (zh) 一种数据中心的能耗检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant