CN116432091B - 基于小样本的设备故障诊断方法、模型的构建方法及装置 - Google Patents
基于小样本的设备故障诊断方法、模型的构建方法及装置 Download PDFInfo
- Publication number
- CN116432091B CN116432091B CN202310706927.6A CN202310706927A CN116432091B CN 116432091 B CN116432091 B CN 116432091B CN 202310706927 A CN202310706927 A CN 202310706927A CN 116432091 B CN116432091 B CN 116432091B
- Authority
- CN
- China
- Prior art keywords
- sample
- samples
- fault diagnosis
- training
- feature set
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003745 diagnosis Methods 0.000 title claims abstract description 148
- 238000000034 method Methods 0.000 title claims abstract description 82
- 238000010276 construction Methods 0.000 title claims abstract description 23
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 78
- 238000012545 processing Methods 0.000 claims abstract description 43
- 238000002922 simulated annealing Methods 0.000 claims abstract description 34
- 238000012549 training Methods 0.000 claims description 153
- 238000004364 calculation method Methods 0.000 claims description 18
- 230000002159 abnormal effect Effects 0.000 claims description 8
- 208000037408 Device failure Diseases 0.000 claims description 3
- 230000006870 function Effects 0.000 description 21
- 238000012360 testing method Methods 0.000 description 12
- 230000008569 process Effects 0.000 description 9
- 238000003860 storage Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 238000012795 verification Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 238000001514 detection method Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 238000005457 optimization Methods 0.000 description 5
- 239000003245 coal Substances 0.000 description 4
- 238000004590 computer program Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000005259 measurement Methods 0.000 description 4
- 238000007781 pre-processing Methods 0.000 description 4
- 239000013598 vector Substances 0.000 description 4
- 238000000137 annealing Methods 0.000 description 3
- 238000005065 mining Methods 0.000 description 3
- 238000013145 classification model Methods 0.000 description 2
- 239000002131 composite material Substances 0.000 description 2
- 238000001816 cooling Methods 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 241000282414 Homo sapiens Species 0.000 description 1
- 238000003723 Smelting Methods 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000008485 antagonism Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000000546 chi-square test Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000005283 ground state Effects 0.000 description 1
- 238000009776 industrial production Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 230000007257 malfunction Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000013526 transfer learning Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Testing And Monitoring For Control Systems (AREA)
Abstract
本发明提供了一种基于小样本的设备故障诊断方法、模型的构建方法及装置,涉及设备故障诊断技术领域,其中,根据预先采集的样本数据集中每种训练样本分别对应的样本类别和近邻关系,对每种训练样本进行样本扩充,得到扩充样本。并按照预设的模拟退火算法对扩充样本的特征参数对应的特征集进行迭代处理,确定扩充样本对应的目标特征集。之后将包含目标特征集的扩充样本输入至初始分类器中,构建设备故障诊断模型。本发明对数据精细化处理,可以解决样本量小、样本类别不均衡等现象,并可以避免局部最优解,提高特征选择的效率和准确性。利用本发明提供的设备故障诊断模型对目标设备进行故障诊断,可以保证故障诊断的准确性和效率。
Description
技术领域
本发明涉及设备故障诊断技术领域,尤其是涉及一种基于小样本的设备故障诊断方法、模型的构建方法及装置。
背景技术
随着工业自动化程度的不断提高,机械设备在工业生产中扮演着越来越重要的角色。然而,机械设备的故障也是不可避免的,特别是在长时间的运行和高强度的工作环境下。随着传感器技术、计算机技术、工艺技术和网络技术的迅猛发展,人类对知识的认识、管理和应用水平的提高,使得设备或系统数据的获取、存储、传输、加工、分析和利用得到了有效提升,其中机器学习具有快速处理大量数据、分析提取有效信息等优点,已被越来越多地应用于故障检测与诊断技术中来。
传统的机器学习方法往往基于既得的监测数据,需要人工提取大量的特征,且模型的训练精度受训练样本的数量和质量的限制较大,对设备进行故障检测的精度难以进一步提高。此外,许多设备故障数据集还存在类别不平衡和噪声等问题,这也会影响深度学习模型的性能。为了解决这些问题,近年来出现了基于小样本数据的设备故障诊断方法的研究。这些方法通常采用元学习、迁移学习、对抗生成网络等技术来提高模型的泛化性能和鲁棒性。此外,还有一些研究关注于如何利用领域知识和物理模型等先验知识来提高故障诊断的效果。然而,现有技术对数据处理仍不够精细,对设备进行故障检测的方法鲁棒性和泛化能力仍需进一步提升,而且,现有技术对设备进行故障检测的精度也需要进一步提升。
发明内容
有鉴于此,本发明的目的在于提供一种基于小样本的设备故障诊断方法、模型的构建方法及装置,对数据精细化处理,保证设备故障诊断的检测精度。且,还可以提升方法的鲁棒性和泛化能力。
第一方面,本发明实施例提供了一种基于小样本的设备故障诊断模型的构建方法,该基于小样本的设备故障诊断模型的构建方法包括:获取预先采集的样本数据集;样本数据集包括多种训练样本,其中,多种训练样本包括一种正常运行状态的第一训练样本和多种非正常运行状态的第二训练样本,第一训练样本和第二训练样本分别包括多个特征参数;根据每种训练样本分别对应的样本类别和近邻关系,对每种训练样本进行样本扩充,得到扩充样本;按照预设的模拟退火算法对扩充样本的特征参数对应的特征集进行迭代处理,确定扩充样本对应的目标特征集;将包含目标特征集的扩充样本输入至初始分类器中,构建设备故障诊断模型;设备故障诊断模型用于对目标设备进行故障诊断。
结合第一方面,本发明实施例提供了第一方面的第一种可能的实施方式,其中,根据每种训练样本分别对应的样本类别和近邻关系,对每种训练样本进行样本扩充,得到扩充样本的步骤,包括:从多种训练样本对应的多种样本类别中选择目标样本类别;根据目标样本类别对应的训练样本数量和预设的扩充因子,确定当前样本类别的训练样本对应的样本扩充数量;按照每个训练样本之间的相对距离,确定每个训练样本分别对应的多个近邻样本,并从多个近邻样本中选择目标近邻样本,生成包括目标近邻样本和训练样本的更新样本;根据训练样本的样本类别指示的样本扩充数量,将满足预设的扩充指标的更新样本加入样本数据集,得到扩充样本。
结合第一方面,本发明实施例提供了第一方面的第二种可能的实施方式,其中,扩充样本中包括多个子样本;方法还包括:确定扩充样本中的每个子样本分别对应的多个扩充近邻样本;基于多个扩充近邻样本对子样本进行插值处理,得到插值样本;将插值样本和子样本合并处理,得到更新的扩充样本。
结合第一方面,本发明实施例提供了第一方面的第三种可能的实施方式,其中,按照预设的模拟退火算法对扩充样本的特征参数对应的特征集进行迭代处理,确定扩充样本对应的目标特征集的步骤,包括:从扩充样本中选择初始特征参数指示的初始特征集;确定初始特征集对应的近似特征集;使用模拟退火算法基于近似特征集对初始特征集进行迭代处理,并在迭代处理的迭代结果满足预设的迭代值时,将当前初始特征集确定为扩充样本对应的目标特征集。
结合第一方面,本发明实施例提供了第一方面的第四种可能的实施方式,其中,确定初始特征集对应的近似特征集;使用模拟退火算法基于近似特征集对初始特征集进行迭代处理的步骤,包括:使用第一分类器从扩充样本中寻找初始特征集对应的近似特征集;基于近似特征集,对扩充样本包含的特征集进行调整,得到更新特征集;确定更新特征集对应的目标函数值,并在更新特征集的目标函数值与扩充样本的目标函数值的函数值差满足预设的比较阈值时,接受更新特征集,更新扩充样本;降低模拟退火算法的算法温度,执行从扩充样本中选择初始特征参数指示的初始特征集的步骤。
第二方面,本发明实施例还提供一种基于小样本的设备故障诊断方法,基于小样本的设备故障诊断方法包括:获取目标设备的待测样本;将待测样本输入至预先构建的设备故障诊断模型中,通过设备故障诊断模型对待测样本进行数据分类,并输出分类结果;其中,设备故障诊断模型为基于上述基于小样本的设备故障诊断模型的构建方法构建得到;基于分类结果对目标设备进行故障诊断。
结合第二方面,本发明实施例提供了第二方面的第一种可能的实施方式,其中,将待测样本输入至预先构建的设备故障诊断模型中,通过设备故障诊断模型对待测样本进行数据分类,并输出分类结果的步骤,包括:基于设备故障诊断模型中的扩充样本,计算待测样本和扩充样本之间的数据距离;基于数据距离从扩充样本中确定对应于待测样本的多个初始分类样本;按照预先设置的计算公式确定每个初始分类样本对应的综合参数,并将综合参数最大的初始分类样本对应的样本类别指示为待测样本的分类结果。
结合第二方面,本发明实施例提供了第二方面的第二种可能的实施方式,其中,按照预先设置的计算公式确定每个初始分类样本对应的综合参数的步骤,包括:基于初始分类样本的特征参数对应的高斯距离计算初始分类样本对应的权重值;确定多个初始分类样本中的样本类别,以及每个样本类别对应的类别数量;根据每个初始分类样本的权重值,确定权重均值;将权重均值和样本类别对应的类别数量相乘,得到综合参数。
第三方面,本发明实施例还提供一种基于小样本的设备故障诊断模型的构建装置,基于小样本的设备故障诊断模型的构建装置包括:数据获取模块,用于获取预先采集的样本数据集;样本数据集包括多种训练样本,其中,多种训练样本包括一种正常运行状态的第一训练样本和多种非正常运行状态的第二训练样本,第一训练样本和第二训练样本分别包括多个特征参数;样本扩充模块,用于根据每种训练样本分别对应的样本类别和近邻关系,对每种训练样本进行样本扩充,得到扩充样本;特征处理模块,用于按照预设的模拟退火算法对扩充样本的特征参数对应的特征集进行迭代处理,确定扩充样本对应的目标特征集;模型构建模块,用于将包含目标特征集的扩充样本输入至初始分类器中,构建设备故障诊断模型;设备故障诊断模型用于对目标设备进行故障诊断。
第四方面,本发明实施例还提供一种基于小样本的设备故障诊断装置,基于小样本的设备故障诊断装置包括:样本获取模块,用于获取目标设备的待测样本;执行模块,用于将待测样本输入至预先构建的设备故障诊断模型中,通过设备故障诊断模型对待测样本进行数据分类,并输出分类结果;其中,设备故障诊断模型为基于上述基于小样本的设备故障诊断模型的构建方法构建得到;数据处理模块,用于基于分类结果对目标设备进行故障诊断。
本发明实施例带来了以下有益效果:本发明提供一种基于小样本的设备故障诊断方法、模型的构建方法及装置,可以对数据精细化处理,保证设备故障诊断的检测精度。同时,还可以提升方法的鲁棒性和泛化能力。具体的,本发明根据预先采集的样本数据集中每种训练样本分别对应的样本类别和近邻关系,对每种训练样本进行样本扩充,得到扩充样本,以解决设备故障诊断数据存在样本量小、样本类别不均衡等现象。并按照预设的模拟退火算法对扩充样本的特征参数对应的特征集进行迭代处理,确定扩充样本对应的目标特征集,该算法可以更精确地描述状态之间的相似性,避免局部最优解,以解决设备故障诊断的数据特征冗余问题,提高特征选择的效率和准确性。之后将包含目标特征集的扩充样本输入至初始分类器中,构建设备故障诊断模型。该设备故障诊断模型用于对目标设备进行故障诊断,利用本发明实施例提供的设备故障诊断模型进行故障诊断可以保证故障诊断的准确性和效率。
本发明的其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种基于小样本的设备故障诊断模型的构建方法的流程图;
图2为本发明实施例提供的另一种基于小样本的设备故障诊断模型的构建方法的流程图;
图3为本发明实施例提供的一种基于小样本的设备故障诊断方法的流程图;
图4为本发明实施例提供的另一种基于小样本的设备故障诊断方法的流程图;
图5为本发明实施例提供的一种基于小样本的设备故障诊断模型的构建装置的结构示意图;
图6为本发明实施例提供的一种基于小样本的设备故障诊断装置的结构示意图;
图7为本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为解决上述技术问题,本发明实施例提供的一种基于小样本的设备故障诊断方法、模型的构建方法及装置,对数据精细化处理,保证设备故障诊断的检测精度。且,还可以提升方法的鲁棒性和泛化能力。
为便于对本实施例进行理解,首先对本发明实施例所公开的一种基于小样本的设备故障诊断模型的构建方法进行详细介绍,图1示出了本发明实施例公开的一种基于小样本的设备故障诊断模型的构建方法的流程图,如图1所示,该基于小样本的设备故障诊断模型的构建方法包括以下步骤:
步骤S102,获取预先采集的样本数据集。
步骤S104,根据每种训练样本分别对应的样本类别和近邻关系,对每种训练样本进行样本扩充,得到扩充样本。
步骤S106,按照预设的模拟退火算法对扩充样本的特征参数对应的特征集进行迭代处理,确定扩充样本对应的目标特征集。
步骤S108,将包含目标特征集的扩充样本输入至初始分类器中,构建设备故障诊断模型。
具体地,本发明实施例选用样本数据集对设备故障诊断模型进行训练,设备故障诊断模型用于对目标设备进行故障诊断。其中,样本数据集包括多种训练样本,其中,多种训练样本包括一种正常运行状态的第一训练样本和多种非正常运行状态的第二训练样本,第一训练样本和第二训练样本分别包括多个特征参数。
在具体实现时,本发明选用的样本数据集可以由煤矿大型机械设备采煤机的历史故障数据组成,该样本数据集涵盖了采煤机的22种运行状态,即1种正常状态和21种常见的故障状态,每一种运行状态由唯一的标签标定。此外,在该样本数据集中,采煤机的每一种运行状态均包括多个特征参数进行表示,包括设备输出电压、输出电流、输入电流等参数。采集到设备数据后,采用人工标注的方式进行数据标注,用于后续数据处理和模型训练。
其中,样本数据集不一定均能够用于准确判定目标设备的故障诊断结果,如,设备故障诊断数据存在样本量小、样本类别不均衡等现象,对此,本发明实施例在面对于练样本情况或样本不平衡情况下对样本数据集进行样本扩充。其中,根据每种训练样本分别对应的样本类别和近邻关系,对每种训练样本进行样本扩充,得到扩充样本。
得到扩充样本后,本发明实施例还进行特征选择,从而利用包含目标特征集的扩充样本构建设备故障诊断模型。具体的,为了解决设备故障诊断的数据特征冗余问题,提高故障诊断的准确性和效率,本发明实施例基于多目标优化,并采用一种改进的模拟退火算法对特征集进行迭代处理,确定目标特征集。该方法能够更精确地描述状态之间的相似性,并能够避免局部最优解,进而提高特征选择的效率和准确性,从而使所用数据的质量可以得到保证,以准确进行设备故障诊断。
为了便于理解,在上述实施例的基础上,本发明实施例还提供另一种基于小样本的设备故障诊断模型的构建方法,图2示出了本发明实施例提供的另一种基于小样本的设备故障诊断模型的构建方法的流程图,如图2所示,该方法包括:
步骤S202,获取预先采集的样本数据集。
基于上述实施例的样本数据集,实际设备故障诊断应用中的数据大多数都是存在冗余、缺失、错误等情况,故,本发明实施例还对样本数据集进行数据预处理。采用数据预处理的目的在于使所用数据的质量可以得到保证,以满足后续的学习模型搭建的任务。其中,对于冗余值,本发明实施例对冗余或重复数据进行直接删除操作。对于缺失值,本发明实施例采用均值补齐的方式进行处理。均值补齐即分析该属性特征的信息,判断该属性特征属于数值特征亦或是非数值特征,如果是数值特征的话则计算出该属性在其他剩余所有对象中的平均值,并将这个平均值插补至空缺处;如果是非数值特征的话则采用统计学中的众数原则,统计该属性特征在其他对象中出现的次数,计算出频率,最后选择出现次数最多的值来进行插补工作。对于错误值,采取非参数验证的卡方检验方法进行检测,对疑似的错误数据与正常数据的之间的偏离值进行统计,偏离值越大说明数据异常的可能性越高,偏离值越小说明数据为正常数据的可能性越大。卡方统计的公式如下所示:
其中,为正常数据值,/>为疑似错误数据值,/>为正常数据与疑似错误数据之间的差异程度。如果差异程度较大,则可认定为错误数据进行直接剔除。然后,进行数据的归一化操作,以更好地反映数据和故障类型之间的关系,并减小不同的量级给故障诊断结果带来的影响。因此,本发明实施例采用极差标准化方法对数据进行归一化:
其中,、/>别表示同数据样本中的最小值和最大值,/>表示输入的数据,表示归一化后的数据。
进一步地,设备故障诊断数据存在样本量小、样本类别不均衡等现象,对此,本发明提出了一种创新性的样本扩充算法,在面对于练样本情况或样本不平衡情况下的设备故障诊断数据进行扩充。在具体实现时,通过下述步骤S204-步骤S210得到扩充样本。
步骤S204,从多种训练样本对应的多种样本类别中选择目标样本类别。
步骤S206,根据目标样本类别对应的训练样本数量和预设的扩充因子,确定当前样本类别的训练样本对应的样本扩充数量。
其中,设样本数据集为:/>,该样本数据集D按照经过数据预处理后的数据集合介绍,/>为特征向量,/>是对应的类别标签;/>中包含/>个故障类别,本发明实施例中/>取值为21,/>为所有训练样本数量。
之后,对于每个类别,计算其训练样本数目/>。类别/>为选择的目标样本类别。对于每个训练样本/>,如果其属于类别/>,则计算其需要生成的训练样本数目/>,计算公式如下:
其中,为取整函数,/>为第/>个类别的训练样本数量,/>为第/>个类别的训练样本数量,/>是第/>个类别的扩充因子,通过自适应调整其数值。具体的,扩充因子/>的确定方式如下:
其中,为故障类别数量,/>为所有训练样本数量。
步骤S208,按照每个训练样本之间的相对距离,确定每个训练样本分别对应的多个近邻样本,并从多个近邻样本中选择目标近邻样本,生成包括目标近邻样本和训练样本的更新样本。
确定出当前样本类别的训练样本对应的样本扩充数量后,对于每个训练样本,本发明实施例还找出与之距离最近的/>个训练样本,记为/>。以/>和/>之间的距离/>为例,本算法中使用的距离计算公式如:
其中,和/>为2个训练样本,即/>为训练样本/>的第/>个特征值,/>为训练样本/>的第/>个特征值,每个训练样本都包括对应的多个特征参数,/>为特征参数的维度。训练样本通过其特征值来确定k个距离最近的训练样本。其中,特征值与特征参数性质等同。
确定出距离最近的个训练样本后,对于每个训练样本/>,随机选择其/>个最近邻中的一个训练样本/>,该训练样本/>为上述目标近邻样本,并生成新训练样本/>,也称为更新样本,计算公式如下:
其中,是一个随机数。
步骤S210,根据训练样本的样本类别指示的样本扩充数量,将满足预设的扩充指标的更新样本加入样本数据集,得到扩充样本。
所生成的新训练样本并非全部加入样本数据集中,其中,生成的新训练样本需要满足以下2个条件:1)/>必须与/>在特征空间中足够接近;2)/>必须在特征空间中与其他训练样本足够远。因此,为确保满足上述2个条件,本算法需要计算出生成的新训练样本/>与其他训练样本之间的距离/>,并选择一个最小的距离/>,用来判断生成的新训练样本是否满足条件2)。
具体地,如果,其中/>是一个阈值,那么生成的新训练样本/>就被视为噪声数据,应该被舍弃。否则,生成的新训练样本/>将被加入到数据集中。将新训练样本/>加入到样本数据集中时,对应的类别标签为/>。合并后的样本数据集为/>。此时,可以得到对应的扩充样本。
进一步地,对于中的每个类别/>中的训练样本/>,本发明实施例还可以对其进行插值处理,从而进一步对训练样本进行扩充。在具体实现时,扩充样本中包括训练样本和对应的更新样本,也即,扩充样本中包括多个子样本,本发明实施例确定扩充样本中的每个子样本分别对应的多个扩充近邻样本,基于多个扩充近邻样本对子样本进行插值处理,得到插值样本,并将插值样本和子样本合并处理,得到更新的扩充样本。
具体地,本发明实施例对训练样本进行2个方向上的线性插值,插值的位置计算公式如下:/>
上述公式中,为样本/>到第/>个参考样本的距离(距离的计算方式已在前文给出),/>为第/>个插值点对应的第/>个样本的特征值。/>、/>、/>、/>分别为第1、2、3、4个参考样本的位置,参考样本的选取方式为选取与样本/>在2个固定方向上最近的4个近邻样本。
插值完成后,将插值样本与合并,组成扩充后的训练样本集,表示公式如下:
其中是扩充后训练样本集的特征向量,/>是对应的类别标签,/>为扩充前训练样本的数量,/>为扩充的训练样本数量。
在步骤S204-步骤S210中,本发明实施例所提出的样本扩充方法限定了生成的新训练样本需要满足2个条件,能够避免在生成新训练样本时可能会产生噪声的问题;同时,引入扩充因子/>能够根据不同的样本数据集自适应地调整训练样本扩充数量,提高了算法的可用性和泛化能力;此外,采用了2个方向的线性插值进行样本的进一步扩充,增加了样本数据集的多样性,提高了算法的鲁棒性和可靠性。
进一步地,为了解决设备故障诊断的数据特征冗余问题,提高故障诊断的准确性和效率,本发明提出一种创新性的特征选择算法,该算法基于多目标优化,并采用了一种改进的模拟退火算法,以提高特征选择的效率和准确性。具体地,本发明实施例通过步骤S212-步骤S216进行特征选择。
步骤S212,从扩充样本中选择初始特征参数指示的初始特征集。
步骤S214,确定初始特征集对应的近似特征集。
步骤S216,使用模拟退火算法基于近似特征集对初始特征集进行迭代处理,并在迭代处理的迭代结果满足预设的迭代值时,将当前初始特征集确定为扩充样本对应的目标特征集。
在具体实现时,模拟退火算法是一种启发式优化算法,通过模拟物质退火的过程来实现全局搜索。该算法采用类似于物理退火的过程,先假定在一个高温状态下(相当于算法随机搜索),然后逐渐退火,在每个温度下(相当于算法的每一次状态转移),逐渐冷却(相当于算法局部搜索),最终达到物理基态(相当于算法找到最优解)。其中,本发明采用一种改进的模拟退火算法,即基于近邻分类器的模拟退火算法。该算法将模拟退火过程中的状态表示为一个特征集/>,并将每个状态看作一个解,同时利用/>近邻分类器来进行邻域状态的选择。在具体实现时,设扩充样本的特征集为/>,其中/>表示整个样本数据集的第/>个特征参数。设/>为选择的特征集,/>表示/>中元素的个数;/>表示基于特征集/>进行故障诊断验证分类的准确率,验证分类的分类器选择/>近邻分类器。则多目标特征选择问题可以定义为多目标优化模型/>,公式如下:
其中:
基于此,采用改进的模拟退火算法进行特征集搜索。其中,对应的准确率通过下述过程得到:
1)首先,需要定义符号:e:测试数据集的大小;/>:KNN模型中的/>值,即最近邻的数量;/>:测试数据集的特征向量集合;/>:测试数据集的标签集合;/>:每个测试数据点的最近邻特征向量的集合;/>:每个测试数据点的最近邻标签的集合;/>:KNN模型预测的测试数据集的标签集合;/>:算法的校验准确率。
2)接下来,计算测试数据集中每个数据点的个最近邻(/>和/>)。对于每个测试数据点,计算其最近邻中出现最频繁的标签(/>)。将/>与KNN模型预测的标签进行比较,得到一个相似度得分/>。
3)根据得分计算算法的校验准确率/>:
本发明实施例可以利用该校验准确率ACC计算函数,用于确定基于近似特征集的特征集是否可以被接受。
其中,校验准确率对应的分类结果校验算法可以检验利用KNN分类模型对设备故障数据进行分类的结果是否正确。该算法的创新性主要体现在以下几个方面:(1)结合了KNN模型和最近邻中出现最频繁的标签。传统的KNN模型仅考虑最近邻的距离,但是往往忽略了最近邻中标签的分布情况。该算法将最近邻中出现最频繁的标签和KNN模型预测的标签进行比较,更全面地考虑了测试数据点的分类情况,从而提高了分类准确率。(2)对样本数据集中的噪声和异常数据具有鲁棒性:该算法可以排除测试数据集中的噪声和异常数据对分类结果的影响,从而提高了算法的鲁棒性。
在具体实现时,本发明实施例将近邻分类器作为第一分类器进行特征选择。先进行初始化,在扩充样本中随机生成一个特征集/>,将该特征集/>定义为初始特征集,同时,设当前温度为/>。进一步地,使用第一分类器从扩充样本中寻找初始特征集对应的近似特征集;基于近似特征集,对扩充样本包含的特征集进行调整,得到更新特征集。
在具体实现时,对上述特征集进行循环迭代,其中包括:1) 随机生成一个新的特征集/>,也即,从扩充样本中确定一个特征集/>;2)根据/>近邻分类器寻找与当前状态特征集/>相似度最高的/>个状态,定义为特征集/>。该特征集/>为上述近似特征集。之后,增加特征扰动,以对扩充样本包含的特征集进行调整。具体地,在特征集的基础上,在特征集/>中先随机删除一些特征,再随机添加一些特征,从而对特征集/>进行调整,得到新状态特征集/>。该新状态特征集/>即为上述更新特征集。
之后,确定更新特征集对应的目标函数值,并在更新特征集的目标函数值与扩充样本的目标函数值的函数值差满足预设的比较阈值时,接受更新特征集,更新扩充样本。
在具体实现时,本发明实施例还计算更新特征集的目标函数值,通过目标函数值确定是否接受该更新特征集/>。具体地,通过下述公式计算对应的目标函数值:
该目标函数值中的/>,/>的计算方式与上述/>,的计算方式同理。之后,还需计算与/>之间的函数值差。函数值差通过下述公式计算:
其中,如果,则接受更新特征集/>;否则,以概率/>接受更新特征集/>。对应的,预设的比较阈值可以是0,当上述函数值差/>时,该更新特征集直接被接受;或者按照上述概率/>接受该更新特征集。其中,该算法以一定的概率接受移动,而且这个概率随着时间推移逐渐降低(因为T是逐渐减小的,概率逐渐降低才能趋向稳定)。这里的“一定的概率”的计算参考了金属冶炼的退火过程,这也是模拟退火算法名称的由来。
上述过程完成后,还降低模拟退火算法的算法温度,执行从扩充样本中选择初始特征参数指示的初始特征集的步骤。具体地,将温度降低到/>,其中/>为降温系数,用于设置本算法的降温速度。当重复执行确定近似特征集至降低模拟退火算法的算法温度的步骤,直到满足达到最大迭代次数或目标函数值不再改变时,该循环迭代过程停止。也即,迭代处理的迭代结果满足预设的迭代值,对应的,当前初始特征集为扩充样本对应的目标特征集,其中,该目标特征集是经过多次循环迭代,并接受多次更新特征集的状态,此时,该目标特征集可以保证特征选择的效率和准确性。对应的,扩充样本为包含目标特征集的扩充样本。
对应的,本发明实施例对模拟退火算法进行改进,主要包括以下两点:(1)特征扰动策略:在生成新状态特征集时,原始的模拟退火算法无特征扰动策略,本发明实施例采用了一种特征扰动策略,即先随机删除一些特征,再随机添加一些特征。该策略既能够降低特征集的冗余性,也能够增加特征集的多样性,从而提高特征选择的效率和准确性。(2)邻域定义:在传统的模拟退火算法中,邻域通常定义为在当前状态附近的一些状态,传统的模拟退火算法选择邻域状态时,通常使用基于概率分布的邻域状态选择。而在本发明实施例提出的算法中,采用一种基于/>近邻分类器的邻域定义方法,即将当前状态的邻域定义为与当前状态特征集相似度最高的1个状态。该方法能够更精确地描述状态之间的相似性,并能够避免局部最优解。/>
步骤S218,将包含目标特征集的扩充样本输入至初始分类器中,构建设备故障诊断模型。
当得到包含目标特征集的扩充样本后,将该扩充样本输入至初始分类器中,构建设备故障诊断模型。其中,该设备故障诊断模型利用上述扩充样本对目标设备的待测样本进行分类,从而对目标设备进行故障诊断。
本发明实施例提供的另一种基于小样本的设备故障诊断模型的构建方法,对样本数据集进行数据预处理后,还对样本数据集的训练样本进行数据扩充操作,本发明实施例所提出的样本扩充方法能够避免在生成新训练样本时可能会产生噪声的问题,提高了算法的可用性和泛化能力,增加了数据集的多样性,提高了算法的鲁棒性和可靠性。此外,还使用一种创新性的特征选择算法进行样本特征选择操作,该算法基于多目标优化,并采用了一种改进的模拟退火算法,以提高特征选择的效率和准确性。
进一步地,本发明实施例还提出了一种创新性的分类结果校验算法,该算法可以检验利用KNN分类模型对设备故障数据进行分类的结果是否正确。具体地,可以在特征选择阶段利用校验准确率ACC计算函数,进而确定增加的新状态是否被接受,增加特征集的多样性的同时,还能够保证数据集质量,以提高特征选择的效率和准确性。
进一步地,在上述实施例的基础上,本发明实施例还提供一种基于小样本的设备故障诊断方法,图3示出了本发明实施例提供的一种基于小样本的设备故障诊断方法的流程图,如图3所示,该基于小样本的设备故障诊断方法包括以下步骤:
步骤S302,获取目标设备的待测样本。
步骤S304,将待测样本输入至预先构建的设备故障诊断模型中,通过设备故障诊断模型对待测样本进行数据分类,并输出分类结果。
步骤S306,基于分类结果对目标设备进行故障诊断。
本发明实施例提供的一种设备故障诊断模型为基于上述基于小样本的设备故障诊断模型的构建方法构建得到,其中,该基于小样本的设备故障诊断方法与上述实施例提供的一种基于小样本的设备故障诊断模型的构建方法具有相同的技术特征,所以也能解决相同的技术问题,达到相同的技术效果。
进一步地,本发明实施例还提供另一种基于小样本的设备故障诊断方法,其中,该实施例在于提出一种改进的KNN分类器算法,该算法的创新点在于引入一种改进的距离度量方式,并使用基于最近邻的局部加权回归算法对邻近样本的权重进行动态调整。该算法能够对数据的离群点进行有效处理,并具有较高的可解释性和适应性。
具体地,图4示出了本发明实施例提供的另一种基于小样本的设备故障诊断方法的流程图,如图4所示,该基于小样本的设备故障诊断方法包括以下步骤:
步骤S402,获取目标设备的待测样本。
步骤S404,基于设备故障诊断模型中的扩充样本,计算待测样本和扩充样本之间的数据距离。
步骤S406,基于数据距离从扩充样本中确定对应于待测样本的多个初始分类样本。
在具体实现时,将构建设备故障诊断模型的扩充样本对应的训练数据集定义为,并且,设该训练数据集/>包含/>个样本,此时,训练数据集/>表示为,其中/>表示第i个扩充样本(也即训练样本)的n个特征值,/>表示该扩充样本(也即训练样本)的标签。
假设现需要对一个待测样本进行分类,本发明实施例提出的KNN算法将其分类为与之最近的k个训练样本中标签出现次数最多的类别。具体而言,分类器的计算流程如下:
首先,计算距离度量。使用改进的距离度量方式计算与训练样本集/>中每个扩充样本(也即训练样本)的距离,距离计算公式为:
其中,表示训练集/>中第j个特征的标准差,用于对不同特征之间的尺度进行统一。/>表示待测样本/>的第j个特征,/>表示训练样本/>的第j个特征。
之后,根据距离度量方式找到最近的k个训练样本。这k个训练样本为对应于待测样本的多个初始分类样本。
步骤S408,按照预先设置的计算公式确定每个初始分类样本对应的综合参数,并将综合参数最大的初始分类样本对应的样本类别指示为待测样本的数据分类结果。
得到多个初始分类样本后,本发明实施例还确定每个初始分类样本对应的综合参数,从而根据该综合参数确定数据分类结果。在具体实现时,本发明实施例先基于初始分类样本的特征参数对应的高斯距离计算初始分类样本对应的权重值,再确定多个初始分类样本中的样本类别,以及每个样本类别对应的类别数量,之后根据每个初始分类样本的权重值,确定权重均值。最后将权重均值和样本类别对应的类别数量相乘,得到综合参数。
具体地,本发明实施例使用最近邻的局部加权回归对邻近样本的权重进行动态调整,并计算分类结果。其中,先对每个邻近样本(初始分类样本)计算权重,权重计算公式为:
其中,为最近邻的局部加权回归的高斯距离,用于调整邻近样本的影响程度,计算公式如下:
其中,是欧氏距离符号,/>是核宽度,计算公式如下:/>
经过上述步骤可以得到对应的权重值,之后,还确定多个初始分类样本中的样本类别,以及每个样本类别对应的类别数量。在具体实现时,通过下述公式计算k个近邻样本中每个类别的出现次数,也即样本类别对应的类别数量:
其中,类别的出现次数表示第/>类别在k个近邻样本中出现的数量,表示第/>个样本的标签,/>为计数器,用于统计各个类别标签出现的次数。
根据样本类别的类别数量可以推倒待测样本的分类结果如何,为了确定更加准确的分类结果,本发明实施例还需确定对应类别的综合参数,其中,根据每个初始分类样本的权重值,确定权重均值,之后将权重均值和样本类别对应的类别数量相乘,得到综合参数。在具体实现时,通过下述公式计算各类别的综合得分,也即综合参数:
其中,为k个近邻样本中,每个邻近样本计算权重/>的均值。/>表示第/>类别的综合得分。
得知综合参数后,可以根据各个类别的综合得分,判断待测样本的类别,其中,判断方式为待测样本的k个近邻样本中,综合得分最高的类别。
步骤S410,基于分类结果对目标设备进行故障诊断。
根据综合参数(上述综合得分)最大的样本类别得到待测样本的分类结果后,可以基于该分类结果对目标设备进行故障诊断。
本发明实施例提供的另一种基于小样本的设备故障诊断方法,在进行故障诊断时,对KNN分类器算法引入一种改进的距离度量方式,用于对不同特征之间的尺度进行统一。在原始的欧式距离度量方式中,不同特征之间的尺度可能不同,这会导致在计算距离时,某些特征的贡献更大,从而影响分类结果的准确性。为了解决这个问题,本算法使用了每个特征的标准差来对距离进行归一化,使得每个特征对距离的贡献相等。这样可以有效地消除不同特征之间的尺度影响,提高分类准确性。此外,还使用基于最近邻的局部加权回归算法对邻近样本的权重进行动态调整。传统的KNN算法在计算距离时,所有邻近样本的权重是相等的。这种方法忽略了不同邻近样本对分类结果的贡献程度不同的情况。为了解决这个问题,本算法引入了基于最近邻的局部加权回归方法,对邻近样本的权重进行动态调整。具体而言,最近邻的局部加权回归通过对邻近样本计算权重,并根据权重调整邻近样本对分类结果的影响程度,使得更接近的样本对分类结果的贡献更大,从而提高分类准确性。综上,本发明实施例能够对数据的离群点进行有效处理,并具有较高的可解释性和适应性。
进一步,在上述实施例的基础上,本发明实施例还提供了一种设备故障诊断模型的构建装置,具体地,如图5所示的一种基于小样本的设备故障诊断模型的构建装置的结构示意图,该基于小样本的设备故障诊断模型的构建装置包括:
数据获取模块100,用于获取预先采集的样本数据集;样本数据集包括多种训练样本,其中,多种训练样本包括一种正常运行状态的第一训练样本和多种非正常运行状态的第二训练样本,第一训练样本和第二训练样本分别包括多个特征参数。
样本扩充模块200,用于根据每种训练样本分别对应的样本类别和近邻关系,对每种训练样本进行样本扩充,得到扩充样本。
特征处理模块300,用于按照预设的模拟退火算法对扩充样本的特征参数对应的特征集进行迭代处理,确定扩充样本对应的目标特征集。
模型构建模块400,用于将包含目标特征集的扩充样本输入至初始分类器中,构建设备故障诊断模型;设备故障诊断模型用于对目标设备进行故障诊断。
本发明实施例提供的一种基于小样本的设备故障诊断模型的构建装置,与上述实施例提供的一种基于小样本的设备故障诊断模型的构建方法具有相同的技术特征,所以也能解决相同的技术问题,达到相同的技术效果。
进一步地,上述样本扩充模块200,还用于从多种训练样本对应的多种样本类别中选择目标样本类别;根据目标样本类别对应的训练样本数量和预设的扩充因子,确定当前样本类别的训练样本对应的样本扩充数量;按照每个训练样本之间的相对距离,确定每个训练样本分别对应的多个近邻样本,并从多个近邻样本中选择目标近邻样本,生成包括目标近邻样本和训练样本的更新样本;根据训练样本的样本类别指示的样本扩充数量,将满足预设的扩充指标的更新样本加入样本数据集,得到扩充样本。
扩充样本中包括多个子样本;上述样本扩充模块200,还用于确定扩充样本中的每个子样本分别对应的多个扩充近邻样本;基于多个扩充近邻样本对子样本进行插值处理,得到插值样本;将插值样本和子样本合并处理,得到更新的扩充样本。
上述特征处理模块300,还用于从扩充样本中选择初始特征参数指示的初始特征集;确定初始特征集对应的近似特征集;使用模拟退火算法基于近似特征集对初始特征集进行迭代处理,并在迭代处理的迭代结果满足预设的迭代值时,将当前初始特征集确定为扩充样本对应的目标特征集。
上述特征处理模块300,还用于使用第一分类器从扩充样本中寻找初始特征集对应的近似特征集;基于近似特征集,对扩充样本包含的特征集进行调整,得到更新特征集;确定更新特征集对应的目标函数值,并在更新特征集的目标函数值与扩充样本的目标函数值的函数值差满足预设的比较阈值时,接受更新特征集,更新扩充样本;降低模拟退火算法的算法温度,执行从扩充样本中选择初始特征参数指示的初始特征集的步骤。
进一步,在上述实施例的基础上,本发明实施例还提供了一种基于小样本的设备故障诊断装置,具体地,如图6所示的一种基于小样本的设备故障诊断装置的结构示意图,该设备故障诊断装置包括:
样本获取模块10,用于获取目标设备的待测样本;
执行模块20,用于将待测样本输入至预先构建的设备故障诊断模型中,通过设备故障诊断模型对待测样本进行数据分类,并输出分类结果;
数据处理模块30,用于基于分类结果对目标设备进行故障诊断。
本发明实施例提供的一种设备故障诊断模型为基于上述基于小样本的设备故障诊断模型的构建方法构建得到;其中,该基于小样本的设备故障诊断装置与上述实施例提供的一种基于小样本的设备故障诊断模型的构建方法具有相同的技术特征,所以也能解决相同的技术问题,达到相同的技术效果。
进一步地,上述执行模块20,还用于基于设备故障诊断模型中的扩充样本,计算待测样本和扩充样本之间的数据距离;基于数据距离从扩充样本中确定对应于待测样本的多个初始分类样本;按照预先设置的计算公式确定每个初始分类样本对应的综合参数,并将综合参数最大的初始分类样本对应的样本类别指示为待测样本的数据分类结果。
上述执行模块20,还用于基于初始分类样本的特征参数对应的高斯距离计算初始分类样本对应的权重值;确定多个初始分类样本中的样本类别,以及每个样本类别对应的类别数量;根据每个初始分类样本的权重值,确定权重均值;将权重均值和样本类别对应的类别数量相乘,得到综合参数。
本发明实施例还提供一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述图1至图4任一所示的方法的步骤。
本发明实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行图1至图4任一所示的方法的步骤。
本发明实施例还提供了一种电子设备的结构示意图,如图7所示,为该电子设备的结构示意图,其中,该电子设备包括处理器71和存储器70,该存储器70存储有能够被该处理器71执行的计算机可执行指令,该处理器71执行该计算机可执行指令以实现上述图1至图4任一所示的方法。
在图7示出的实施方式中,该电子设备还包括总线72和通信接口73,其中,处理器71、通信接口73和存储器70通过总线72连接。
其中,存储器70可能包含高速随机存取存储器(RAM,Random Access Memory),也可能还包括非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。通过至少一个通信接口73(可以是有线或者无线)实现该系统网元与至少一个其他网元之间的通信连接,可以使用互联网,广域网,本地网,城域网等。总线72可以是ISA(IndustryStandard Architecture,工业标准体系结构)总线、PCI(Peripheral ComponentInterconnect,外设部件互连标准)总线或EISA(Extended Industry StandardArchitecture,扩展工业标准结构)总线等。总线72可以分为地址总线、数据总线、控制总线等。为便于表示,图7中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
处理器71可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器71中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器71可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital SignalProcessor,简称DSP)、专用集成电路(Application Specific Integrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器71读取存储器中的信息,结合其硬件完成前述图1至图4任一所示的方法。
本发明实施例所提供的一种基于小样本的设备故障诊断方法、模型的构建方法及装置的计算机程序产品,包括存储了程序代码的计算机可读存储介质,所述程序代码包括的指令可用于执行前面方法实施例中所述的方法,具体实现可参见方法实施例,在此不再赘述。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
另外,在本发明实施例的描述中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
在本发明的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
最后应说明的是:以上实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
Claims (9)
1.一种基于小样本的设备故障诊断模型的构建方法,其特征在于,所述基于小样本的设备故障诊断模型的构建方法包括:
获取预先采集的样本数据集;所述样本数据集包括多种训练样本,其中,多种所述训练样本包括一种正常运行状态的第一训练样本和多种非正常运行状态的第二训练样本,所述第一训练样本和所述第二训练样本分别包括多个特征参数;
根据每种所述训练样本分别对应的样本类别和近邻关系,对每种所述训练样本进行样本扩充,得到扩充样本;
按照预设的模拟退火算法对所述扩充样本的特征参数对应的特征集进行迭代处理,确定所述扩充样本对应的目标特征集;
将包含所述目标特征集的扩充样本输入至初始分类器中,构建设备故障诊断模型;所述设备故障诊断模型用于对目标设备进行故障诊断;
所述根据每种所述训练样本分别对应的样本类别和近邻关系,对每种所述训练样本进行样本扩充,得到扩充样本的步骤,包括:
从多种所述训练样本对应的多种样本类别中选择目标样本类别;
根据所述目标样本类别对应的训练样本数量和预设的扩充因子,确定当前样本类别的所述训练样本对应的样本扩充数量;
按照每个所述训练样本之间的相对距离,确定每个训练样本分别对应的多个近邻样本,并从多个所述近邻样本中选择目标近邻样本,生成包括所述目标近邻样本和所述训练样本的更新样本;
根据所述训练样本的所述样本类别指示的所述样本扩充数量,将满足预设的扩充指标的所述更新样本加入所述样本数据集,得到所述扩充样本;
所述预设的扩充指标根据所述更新样本对应于所述训练样本的距离确定。
2.根据权利要求1所述的方法,其特征在于,所述扩充样本中包括多个子样本;所述方法还包括:
确定所述扩充样本中的每个子样本分别对应的多个扩充近邻样本;
基于多个所述扩充近邻样本对所述子样本进行插值处理,得到插值样本;
将所述插值样本和所述子样本合并处理,得到更新的扩充样本。
3.根据权利要求1所述的方法,其特征在于,所述按照预设的模拟退火算法对所述扩充样本的特征参数对应的特征集进行迭代处理,确定所述扩充样本对应的目标特征集的步骤,包括:
从所述扩充样本中选择初始特征参数指示的初始特征集;
确定所述初始特征集对应的近似特征集;
使用所述模拟退火算法基于所述近似特征集对所述初始特征集进行迭代处理,并在所述迭代处理的迭代结果满足预设的迭代值时,将当前初始特征集确定为所述扩充样本对应的目标特征集。
4.根据权利要求3所述的方法,其特征在于,所述确定所述初始特征集对应的近似特征集;使用所述模拟退火算法基于所述近似特征集对所述初始特征集进行迭代处理的步骤,包括:
使用第一分类器从所述扩充样本中寻找所述初始特征集对应的近似特征集;
基于所述近似特征集,对所述扩充样本包含的特征集进行调整,得到更新特征集;
确定所述更新特征集对应的目标函数值,并在所述更新特征集的所述目标函数值与所述扩充样本的目标函数值的函数值差满足预设的比较阈值时,接受所述更新特征集,更新所述扩充样本;
降低所述模拟退火算法的算法温度,执行从所述扩充样本中选择初始特征参数指示的初始特征集的步骤。
5.一种基于小样本的设备故障诊断方法,其特征在于,所述基于小样本的设备故障诊断方法包括:
获取目标设备的待测样本;
将所述待测样本输入至预先构建的设备故障诊断模型中,通过所述设备故障诊断模型对所述待测样本进行数据分类,并输出分类结果;
其中,所述设备故障诊断模型为基于权利要求1~4任一项所述的基于小样本的设备故障诊断模型的构建方法构建得到;
基于所述分类结果对所述目标设备进行故障诊断。
6.根据权利要求5所述的设备故障诊断方法,其特征在于,所述将所述待测样本输入至预先构建的设备故障诊断模型中,通过所述设备故障诊断模型对所述待测样本进行数据分类,并输出分类结果的步骤,包括:
基于所述设备故障诊断模型中的扩充样本,计算所述待测样本和所述扩充样本之间的数据距离;
基于所述数据距离从所述扩充样本中确定对应于所述待测样本的多个初始分类样本;
按照预先设置的计算公式确定每个所述初始分类样本对应的综合参数,并将所述综合参数最大的初始分类样本对应的样本类别指示为所述待测样本的分类结果。
7.根据权利要求6所述的方法,其特征在于,所述按照预先设置的计算公式确定每个所述初始分类样本对应的综合参数的步骤,包括:
基于所述初始分类样本的特征参数对应的高斯距离计算所述初始分类样本对应的权重值;
确定多个所述初始分类样本中的样本类别,以及每个所述样本类别对应的类别数量;
根据每个所述初始分类样本的权重值,确定权重均值;
将所述权重均值和所述样本类别对应的类别数量相乘,得到所述综合参数。
8.一种基于小样本的设备故障诊断模型的构建装置,其特征在于,所述基于小样本的设备故障诊断模型的构建装置包括:
数据获取模块,用于获取预先采集的样本数据集;所述样本数据集包括多种训练样本,其中,多种所述训练样本包括一种正常运行状态的第一训练样本和多种非正常运行状态的第二训练样本,所述第一训练样本和所述第二训练样本分别包括多个特征参数;
样本扩充模块,用于根据每种所述训练样本分别对应的样本类别和近邻关系,对每种所述训练样本进行样本扩充,得到扩充样本;
特征处理模块,用于按照预设的模拟退火算法对所述扩充样本的特征参数对应的特征集进行迭代处理,确定所述扩充样本对应的目标特征集;
模型构建模块,用于将包含所述目标特征集的扩充样本输入至初始分类器中,构建设备故障诊断模型;所述设备故障诊断模型用于对目标设备进行故障诊断;
所述样本扩充模块,还用于从多种所述训练样本对应的多种样本类别中选择目标样本类别;根据所述目标样本类别对应的训练样本数量和预设的扩充因子,确定当前样本类别的所述训练样本对应的样本扩充数量;按照每个所述训练样本之间的相对距离,确定每个训练样本分别对应的多个近邻样本,并从多个所述近邻样本中选择目标近邻样本,生成包括所述目标近邻样本和所述训练样本的更新样本;根据所述训练样本的所述样本类别指示的所述样本扩充数量,将满足预设的扩充指标的所述更新样本加入所述样本数据集,得到所述扩充样本;所述预设的扩充指标根据所述更新样本对应于所述训练样本的距离确定。
9.一种基于小样本的设备故障诊断装置,其特征在于,所述基于小样本的设备故障诊断装置包括:
样本获取模块,用于获取目标设备的待测样本;
执行模块,用于将所述待测样本输入至预先构建的设备故障诊断模型中,通过所述设备故障诊断模型对所述待测样本进行数据分类,并输出分类结果;
其中,所述设备故障诊断模型为基于权利要求1~4任一项所述的基于小样本的设备故障诊断模型的构建方法构建得到;
数据处理模块,用于基于所述分类结果对所述目标设备进行故障诊断。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310706927.6A CN116432091B (zh) | 2023-06-15 | 2023-06-15 | 基于小样本的设备故障诊断方法、模型的构建方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310706927.6A CN116432091B (zh) | 2023-06-15 | 2023-06-15 | 基于小样本的设备故障诊断方法、模型的构建方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116432091A CN116432091A (zh) | 2023-07-14 |
CN116432091B true CN116432091B (zh) | 2023-09-26 |
Family
ID=87085883
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310706927.6A Active CN116432091B (zh) | 2023-06-15 | 2023-06-15 | 基于小样本的设备故障诊断方法、模型的构建方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116432091B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117056734B (zh) * | 2023-10-12 | 2024-02-06 | 山东能源数智云科技有限公司 | 基于数据驱动的设备故障诊断模型的构建方法及装置 |
CN117290732B (zh) * | 2023-11-24 | 2024-03-01 | 山东理工昊明新能源有限公司 | 故障分类模型的构建方法、风电设备故障分类方法及装置 |
CN117312863B (zh) * | 2023-11-29 | 2024-02-02 | 山东理工昊明新能源有限公司 | 故障检测模型的构建方法、电力设备故障检测方法及装置 |
CN117407781B (zh) * | 2023-12-14 | 2024-02-23 | 山东能源数智云科技有限公司 | 基于联邦学习的设备故障诊断方法及装置 |
Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111914253A (zh) * | 2020-08-10 | 2020-11-10 | 中国海洋大学 | 一种入侵检测的方法、系统、设备及可读存储介质 |
WO2021135630A1 (zh) * | 2019-12-31 | 2021-07-08 | 福州大学 | 基于grcmse与流形学习的滚动轴承故障诊断方法 |
CN114707596A (zh) * | 2022-03-30 | 2022-07-05 | 西安热工研究院有限公司 | 一种基于长短期记忆网络的智能化变压器故障诊断方法 |
DE102021201124A1 (de) * | 2021-02-08 | 2022-08-11 | Robert Bosch Gesellschaft mit beschränkter Haftung | Trainieren von bildklassifizierernetzen |
CN114966224A (zh) * | 2022-05-17 | 2022-08-30 | 东南大学 | 基于改进神经网络的模块化多电平变换器电容监测方法 |
WO2022199214A1 (zh) * | 2021-03-26 | 2022-09-29 | 北京沃东天骏信息技术有限公司 | 样本扩展方法、训练方法和系统、及样本学习系统 |
CN115144747A (zh) * | 2022-07-01 | 2022-10-04 | 中南大学 | 一种基于对抗迁移学习的多工况电机故障诊断方法及系统 |
CN115510963A (zh) * | 2022-09-20 | 2022-12-23 | 同济大学 | 一种增量式设备故障诊断方法 |
CN115510965A (zh) * | 2022-09-22 | 2022-12-23 | 同济大学 | 一种基于生成数据融合的轴承不平衡故障诊断方法 |
CN115687925A (zh) * | 2022-10-31 | 2023-02-03 | 中国船舶重工集团公司第七一九研究所 | 针对不平衡样本的故障类型识别方法及装置 |
CN115859099A (zh) * | 2022-11-22 | 2023-03-28 | 上海交通大学 | 样本生成方法、装置、电子设备和存储介质 |
WO2023044979A1 (zh) * | 2021-09-27 | 2023-03-30 | 苏州大学 | 类不平衡数据集下的机械故障智能诊断方法 |
CN115994327A (zh) * | 2023-03-22 | 2023-04-21 | 山东能源数智云科技有限公司 | 基于边缘计算的设备故障诊断方法及装置 |
CN116150676A (zh) * | 2023-04-19 | 2023-05-23 | 山东能源数智云科技有限公司 | 基于人工智能的设备故障诊断与识别方法及装置 |
CN116186641A (zh) * | 2023-04-26 | 2023-05-30 | 四川轻化工大学 | 一种基于特征融合的跨设备滚动轴承小样本故障诊断方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11443242B2 (en) * | 2020-04-21 | 2022-09-13 | International Business Machines Corporation | Iterative training of a machine learning model |
US11486925B2 (en) * | 2020-05-09 | 2022-11-01 | Hefei University Of Technology | Method for diagnosing analog circuit fault based on vector-valued regularized kernel function approximation |
-
2023
- 2023-06-15 CN CN202310706927.6A patent/CN116432091B/zh active Active
Patent Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021135630A1 (zh) * | 2019-12-31 | 2021-07-08 | 福州大学 | 基于grcmse与流形学习的滚动轴承故障诊断方法 |
CN111914253A (zh) * | 2020-08-10 | 2020-11-10 | 中国海洋大学 | 一种入侵检测的方法、系统、设备及可读存储介质 |
DE102021201124A1 (de) * | 2021-02-08 | 2022-08-11 | Robert Bosch Gesellschaft mit beschränkter Haftung | Trainieren von bildklassifizierernetzen |
WO2022199214A1 (zh) * | 2021-03-26 | 2022-09-29 | 北京沃东天骏信息技术有限公司 | 样本扩展方法、训练方法和系统、及样本学习系统 |
WO2023044979A1 (zh) * | 2021-09-27 | 2023-03-30 | 苏州大学 | 类不平衡数据集下的机械故障智能诊断方法 |
CN114707596A (zh) * | 2022-03-30 | 2022-07-05 | 西安热工研究院有限公司 | 一种基于长短期记忆网络的智能化变压器故障诊断方法 |
CN114966224A (zh) * | 2022-05-17 | 2022-08-30 | 东南大学 | 基于改进神经网络的模块化多电平变换器电容监测方法 |
CN115144747A (zh) * | 2022-07-01 | 2022-10-04 | 中南大学 | 一种基于对抗迁移学习的多工况电机故障诊断方法及系统 |
CN115510963A (zh) * | 2022-09-20 | 2022-12-23 | 同济大学 | 一种增量式设备故障诊断方法 |
CN115510965A (zh) * | 2022-09-22 | 2022-12-23 | 同济大学 | 一种基于生成数据融合的轴承不平衡故障诊断方法 |
CN115687925A (zh) * | 2022-10-31 | 2023-02-03 | 中国船舶重工集团公司第七一九研究所 | 针对不平衡样本的故障类型识别方法及装置 |
CN115859099A (zh) * | 2022-11-22 | 2023-03-28 | 上海交通大学 | 样本生成方法、装置、电子设备和存储介质 |
CN115994327A (zh) * | 2023-03-22 | 2023-04-21 | 山东能源数智云科技有限公司 | 基于边缘计算的设备故障诊断方法及装置 |
CN116150676A (zh) * | 2023-04-19 | 2023-05-23 | 山东能源数智云科技有限公司 | 基于人工智能的设备故障诊断与识别方法及装置 |
CN116186641A (zh) * | 2023-04-26 | 2023-05-30 | 四川轻化工大学 | 一种基于特征融合的跨设备滚动轴承小样本故障诊断方法 |
Non-Patent Citations (3)
Title |
---|
基于GAN的轴承故障诊断方法;柴志豪;;内燃机与配件(14);132-133 * |
基于在线半监督学习的故障诊断方法研究;尹刚;张英堂;李志宁;任国全;范红波;;振动工程学报(06);23-28 * |
数据特征选择与分类在机械故障诊断中的应用;李帅位;张栋良;黄昕宇;陈璞;;振动与冲击(02);223-227 * |
Also Published As
Publication number | Publication date |
---|---|
CN116432091A (zh) | 2023-07-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN116432091B (zh) | 基于小样本的设备故障诊断方法、模型的构建方法及装置 | |
US11720821B2 (en) | Automated and customized post-production release review of a model | |
CN116150676B (zh) | 基于人工智能的设备故障诊断与识别方法及装置 | |
CN116910493B (zh) | 基于多源特征提取的设备故障诊断模型的构建方法及装置 | |
WO2021139279A1 (zh) | 基于分类模型的数据处理方法、装置、电子设备及介质 | |
CN116881832B (zh) | 旋转机械设备故障诊断模型的构建方法及装置 | |
CN117056734B (zh) | 基于数据驱动的设备故障诊断模型的构建方法及装置 | |
CN116975741B (zh) | 基于物联网的能源设备故障预测方法、装置及电子设备 | |
CN116451139B (zh) | 一种基于人工智能的直播数据快速分析方法 | |
CN111582315B (zh) | 样本数据处理方法、装置及电子设备 | |
CN117269742A (zh) | 一种高海拔环境下断路器健康状态评估方法、装置及介质 | |
CN111461354A (zh) | 一种面向高维数据的机器学习集成分类方法及软件系统 | |
CN116934385A (zh) | 用户流失预测模型的构建方法、用户流失预测方法及装置 | |
CN117407781B (zh) | 基于联邦学习的设备故障诊断方法及装置 | |
Sürmeli et al. | Multivariate time series clustering and its application in industrial systems | |
CN118070682A (zh) | 基于人工智能的螺旋栓吊环受损评估方法及装置 | |
CN117171690A (zh) | 基于改进标签传播的光伏阵列故障诊断方法、装置及设备 | |
Alohali et al. | Optimal Deep Learning Based Ransomware Detection and Classification in the Internet of Things Environment. | |
CN111401569A (zh) | 超参数优化方法、装置和电子设备 | |
Walkowiak et al. | Algorithm based on modified angle‐based outlier factor for open‐set classification of text documents | |
CN113901616A (zh) | 一种零件的搜索方法和系统 | |
CN116429406B (zh) | 大型机械设备故障诊断模型的构建方法及装置 | |
CN117291314B (zh) | 能源风险识别模型的构建方法、能源风险识别方法及装置 | |
CN113299345B (zh) | 病毒基因分类的方法、装置及电子设备 | |
US20240256967A1 (en) | Classifier training using synthetic training data samples |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |