CN113344295B - 基于工业大数据的设备剩余寿命预测方法、系统及介质 - Google Patents

基于工业大数据的设备剩余寿命预测方法、系统及介质 Download PDF

Info

Publication number
CN113344295B
CN113344295B CN202110728957.8A CN202110728957A CN113344295B CN 113344295 B CN113344295 B CN 113344295B CN 202110728957 A CN202110728957 A CN 202110728957A CN 113344295 B CN113344295 B CN 113344295B
Authority
CN
China
Prior art keywords
data
equipment
residual life
time
health
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110728957.8A
Other languages
English (en)
Other versions
CN113344295A (zh
Inventor
李方
郭炜森
张平
蓝曦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China University of Technology SCUT
Original Assignee
South China University of Technology SCUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China University of Technology SCUT filed Critical South China University of Technology SCUT
Priority to CN202110728957.8A priority Critical patent/CN113344295B/zh
Publication of CN113344295A publication Critical patent/CN113344295A/zh
Application granted granted Critical
Publication of CN113344295B publication Critical patent/CN113344295B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/211Selection of the most significant subset of features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2119/00Details relating to the type or aim of the analysis or the optimisation
    • G06F2119/02Reliability analysis or reliability optimisation; Failure analysis, e.g. worst case scenario performance, failure mode and effects analysis [FMEA]
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Business, Economics & Management (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Economics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Mathematical Physics (AREA)
  • Biophysics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Operations Research (AREA)
  • Marketing (AREA)
  • Medical Informatics (AREA)
  • Computer Hardware Design (AREA)
  • Geometry (AREA)
  • Entrepreneurship & Innovation (AREA)

Abstract

本发明公开了一种基于工业大数据的设备剩余寿命预测方法、系统及介质,其中方法包括以下步骤:采集设备实时运行数据,对实时运行数据进行特征提取和特征选择,获得数据特征;根据数据特征进行数据漂移检测,确定设备所处的健康阶段;根据健康阶段获取相应的剩余寿命预测模型,根据数据特征构建健康因子,将健康因子输入获得的剩余寿命预测模型,输出设备剩余寿命预测结果。本发明根据工业实际生产中实时产生的运行数据,获取设备的健康因子,利用健康因子预测出当前时刻设备的剩余使用寿命,能够更大地利用设备的完整生命周期,减少使用寿命浪费和突然停机带来的时间浪费,使得设备健康管理自动化进行,可广泛应用于设备剩余寿命预测领域。

Description

基于工业大数据的设备剩余寿命预测方法、系统及介质
技术领域
本发明涉及设备剩余寿命预测领域,尤其涉及一种基于工业大数据的设备剩余寿命预测方法、系统及介质。
背景技术
故障预测和健康管理(Prognostic and Health Management,PHM)是指利用大量状态监测数据和信息,借助统计算法或模型来评估和管理装备的健康状态的技术。PHM可以提前对潜在故障进行预测,并结合各种装备信息提供维护决策,实现视情维护,从而提高生产过程的安全性及降低维护成本。剩余使用寿命(Remaining Useful Life,RUL)预测技术是PHM的关键技术之一,可通过分析传感器监测的运行数据或建立合适的退化模型对系统或部件的RUL进行提前预测。RUL可定义为系统或部件可继续正常使用的时间长度,即当前时刻与失效时刻之间的时间间隔。
PHM的实现一般有两种方法,基于数据驱动的方法和基于模型的方法。其中,基于模型的方法往往需要确定精确的物理或数学模型来描述系统退化过程,对于复杂装备来说一般难以建立精确的退化模型。而数据驱动的方法提供了一种重要的RUL预测手段;数据驱动的RUL预测技术主要包括以下几个流程:数据获取、数据预处理、特征工程、模型建立、模型训练与预测。其中,最核心的任务在于建立一个有效的RUL预测模型对监测数据进行处理以实现RUL预测。
发明内容
为至少一定程度上解决现有技术中存在的技术问题之一,本发明的目的在于提供一种基于工业大数据的设备剩余寿命预测方法、系统及介质。
本发明所采用的技术方案是:
一种基于工业大数据的设备剩余寿命预测方法,包括以下步骤:
采集设备实时运行数据,对实时运行数据进行特征提取和特征选择,获得数据特征;
根据数据特征进行数据漂移检测,确定设备所处的健康阶段;
根据健康阶段获取相应的剩余寿命预测模型,根据数据特征构建健康因子,将健康因子输入获得的剩余寿命预测模型,输出设备剩余寿命预测结果。
进一步,所述设备剩余寿命预测方法还包括构建剩余寿命预测模型的步骤,包括:
采集设备在运行阶段的原始数据,根据原始数据进行特征提取和特征选择,获得数据特征;
根据数据特征进行数据漂移检测,确定设备在预设环境下运行的各阶段时间分界点;
根据阶段时间分界点对模型进行分类,根据数据特征构建健康因子,根据健康因子对分类的模型进行训练,获得剩余寿命预测模型。
进一步,所述采集设备在运行阶段的原始数据的步骤包括对数据进行去噪的步骤,包括:
对原始数据进行分析,选择适合所述原始数据的小波函数,以及选择分解层数n,对原始数据进行n层小波分解;
根据每层小波分解的尺度系统和细节系数的统计量,以及原始数据的特点确定阈值的大小;
采用软硬阈值折中方法作为小波阈值去噪的阈值函数,遍历各层小波分解后的尺度系数,带入阈值函数进行阈值处理,得到处理后的各层小波系数;
使用Mallet算法将各层系数重构为信号,得到重构后去噪的原始信号。
进一步,根据原始数据进行特征提取,包括:
提取原始数据的时域和频域的统计量信息;
其中,时域的统计量信息包括均值、方差、标准差以及偏斜度;
均值的表达式为:
Figure BDA0003138617770000021
方差的表达式为:
Figure BDA0003138617770000022
标准差的表达式为:
Figure BDA0003138617770000023
峰值的表达式为:
Figure BDA0003138617770000024
其中,N表示数据点实体总数,xi表示第i个数据实体,μ表示均值,σ表示标准差。
进一步,根据数据特征进行数据漂移检测,确定设备在预设环境下运行的各阶段时间分界点,包括:
根据数据特征,对与原始数据对应的目标标签值进行数据漂移检测;
在数据流中,给定时间区间[0,t],将时间区间内的数据对象集合记为S0,t=d0,…,dt,其中,di=(XI,yi),Xi是n维特征向量
Figure BDA0003138617770000031
yi是类别标签,S0,t服从预设分布P0,t(X,y);
若概念漂移在下一时刻t+1发生,则有P0,t≠Pt+1,∞,判定时刻t+1为设备运行阶段的分界点。
进一步,所述根据健康因子对分类的模型进行训练,包括:
结合卷积神经网络、循环神经网络以及循环神经网络变体,对由健康因子到设备剩余寿命值映射关系进行训练学习。
进一步,所述卷积神经网络的操作包括卷积层操作、卷积反向传播、全连接层操作和全连接层反向传播;
其中,卷积层操作的表达式为:
Figure BDA0003138617770000032
卷积反向传播的表达式为:
Figure BDA0003138617770000033
全连接层操作的表达式为:
Xl=σ(WlXl-1+bl)
全连接层反向传播的表达式为:
Figure BDA0003138617770000034
其中,L表示损失函数输出,
Figure BDA0003138617770000035
表示再第l层卷积神经网络的第j个特征图,l表示神经网络层数,W表示所学习到的权值,δ表示反向传播时的学习率,b表示偏置量,p表示特征图块,K表示卷积核。
本发明所采用的另一技术方案是:
一种基于工业大数据的设备剩余寿命预测系统,包括:
数据采集模块,用于采集设备实时运行数据,对实时运行数据进行特征提取和特征选择,获得数据特征;
偏移确定模块,用于根据数据特征进行数据漂移检测,确定设备所处的健康阶段;
寿命预测模块,用于根据健康阶段获取相应的剩余寿命预测模型,根据数据特征构建健康因子,将健康因子输入获得的剩余寿命预测模型,输出设备剩余寿命预测结果。
本发明所采用的另一技术方案是:
一种基于工业大数据的设备剩余寿命预测系统,包括:
至少一个处理器;
至少一个存储器,用于存储至少一个程序;
当所述至少一个程序被所述至少一个处理器执行,使得所述至少一个处理器实现上所述方法。
本发明所采用的另一技术方案是:
一种存储介质,其中存储有处理器可执行的程序,所述处理器可执行的程序在由处理器执行时用于执行如上所述方法。
本发明的有益效果是:本发明根据工业实际生产中实时产生的运行数据,获取设备的健康因子,利用健康因子预测出当前时刻设备的剩余使用寿命,能够更大地利用设备的完整生命周期,减少使用寿命浪费和突然停机带来的时间浪费,克服了传统设备健康管理中智能依赖人工判断和机器警报的缺陷,使得设备健康管理自动化进行。
附图说明
为了更清楚地说明本发明实施例或者现有技术中的技术方案,下面对本发明实施例或者现有技术中的相关技术方案附图作以下介绍,应当理解的是,下面介绍中的附图仅仅为了方便清晰表述本发明的技术方案中的部分实施例,对于本领域的技术人员而言,在无需付出创造性劳动的前提下,还可以根据这些附图获取到其他附图。
图1是本发明实施例中一种基于工业大数据的设备剩余寿命预测方法的步骤流程图;
图2是本发明实施例中一种基于工业大数据的设备剩余寿命预测方法的示意图;
图3是本发明实施例中数据预处理和设备健康因子构建流程示意图;
图4是本发明实施例中健康因子模型训练和线上预测处理流程示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。对于以下实施例中的步骤编号,其仅为了便于阐述说明而设置,对步骤之间的顺序不做任何限定,实施例中的各步骤的执行顺序均可根据本领域技术人员的理解来进行适应性调整。
在本发明的描述中,需要理解的是,涉及到方位描述,例如上、下、前、后、左、右等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
在本发明的描述中,若干的含义是一个或者多个,多个的含义是两个以上,大于、小于、超过等理解为不包括本数,以上、以下、以内等理解为包括本数。如果有描述到第一、第二只是用于区分技术特征为目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量或者隐含指明所指示的技术特征的先后关系。
本发明的描述中,除非另有明确的限定,设置、安装、连接等词语应做广义理解,所属技术领域技术人员可以结合技术方案的具体内容合理确定上述词语在本发明中的具体含义。
如图1和图2所示,本实施例提供一种基于工业大数据的设备剩余寿命预测方法,包括以下步骤:
S1、构建剩余寿命预测模型。
其中,构建模型包括以下步骤:
S11、采集数据及对数据预处理。
参见图3,根据工业生产设备和所部署传感器的类型,可确定采集的是何种数据,以便于对数据的存储和集成,并转化为能够用于作为系统输入的可用形式,然后使用聚类或分类算法,将数据划分为若干个类别,然后将离群数据剔除,得到粗粒度无效数据剔除,若数据是关于震动、位移、声音等物理量,则根据需要选择性对数据进行去噪声处理,运用小波分解阈值去噪算法:1)首先对数据进行分析,根据参数搜索或依赖专家知识对数据类型进行判断哪一种小波函数适合该数据,并选择合适的分解层数n,对原始数据进行n层小波分解2)根据每层小波分解的尺度系统和细节系数的统计量,以及原始数据的特点决定阈值的大小3)采用软硬阈值折中法作为小波阈值去噪的阈值函数,遍历各层小波分解后的尺度系数,带入阈值函数进行阈值处理,得到处理后的各层小波系数,然后再使用Mallet算法将各层系数重构为信号,则得到了重构后去噪的原始信号。
下一步是特征提取,主要是提取原始信号的时域、频域、时频域的统计量信息,包括但不限于均值、方差、标准差、峰值、裕度值、极差等,由时域得到频域信号采用短时傅里叶变换,时频域信息则采用小波包变换提取各层次的能量作为时频域信息。
最后是特征选择,采用皮尔森系数作为度量特征值域目标标签之间的相关系方法,将相关性最高的k个特征作为最终的特征,然后作为机器学习算法的输入进行建模,最后在预测阶段得到设备剩余寿命的预测值。
本实施例中采用了Python语言,其中小波分解和小波包分解使用pyWavelets包,而特征提取和选择则用了numpy包和Scipy包作为工具。
对于上述步骤,更具体地可详细描述为:
根据前述步骤中对生产设备运行时由传感器采集的原始数据,进行预处理的操作,目的是为了能让接下来的步骤能够理解、处理和使用,其中剔除无效数据是剔除与大部分数据类型相差较大的数据,例如采样频率差别大、数据类型不一致等;去噪操作主要针对易受环境白噪声影响的物理数据,如振动、声音等,而利用小波阈值去噪能够有效地去除大部分高斯白噪声对原始信号的影响,是业内公认的好算法,关键是选取好小波函数和阈值。在具体原理上,小波分解基于小波变换,小波变换改进了短时傅里叶变换对于窗口大小的选择问题,使用小波替换了三角函数,能在信号中获取在不同时间的频率信息,而一般传感器获得的信号是由离散的数据点构成,则对于小波函数
Figure BDA0003138617770000061
j,k∈R;来说采用离散小波变换所得结果为
Figure BDA0003138617770000062
j,k∈R;a0的值一般取2,能更好对能量谱二分化。小波阈值降噪部分,主要是利用了信号处理中有效信号往往比噪声明显的特点(不考虑噪声占优的情况),在选定小波函数然后经过小波分解后,有效信号的小波系数在数值上相比起噪声的系数会更大,利用此特点,求出一个小波系数阈值后,只保留比阈值大的小波系数而舍弃小的值,便可在一定程度上消除噪声,最后再经过Mallet算法对小波系数进行信号重构,便得到最终经过去噪的信号。整个过程可使用符号描述为:对于信号S(k)=f(k)+γe(k)k=0,1,2…n-1,其中,S(k)为原始信号,f(k)为有效信号,e(k)为噪声,γ为噪声系数的标准误差,进行N层小波分解,根据Mallet定理有:
Figure BDA0003138617770000063
而fj进而能够分解为Wj-1+fj-1,其中:
Figure BDA0003138617770000064
Figure BDA0003138617770000065
每层分解是对小波尺度系数进行分解,即fj部分,而阈值去噪剔除则是细节系数部分Wj。去噪阈值的确定是采取启发式阈值,基本阈值取
Figure BDA0003138617770000066
先判定统计量
Figure BDA0003138617770000067
Figure BDA0003138617770000068
Figure BDA0003138617770000069
的关系进而采取不同的阈值。阈值函数采用的是改进的软硬阈值折衷法,如下公式所示:
Figure BDA0003138617770000071
其中
Figure BDA0003138617770000072
是分解第j层、第k个小波系数的估计值,
Figure BDA0003138617770000079
α、n为调节因子,均为整数。
对于小波信号重构步骤,是基于对原始信号进行多级重建的过程,即结合分解后经阈值处理的小波系数进行分解逆运算,对伸缩和小波函数的细化方程,通过对各层不同分辨率下细节和尺度系数进行叠加和变换,逐层还原。具体为在分辨率j下得到总和为:
Figure BDA0003138617770000073
替换上式尺度关系φj,k(t)和ψj,k(t),可得:
Figure BDA0003138617770000074
比较上式两边系数φ(2j+1t-l),可得:
Figure BDA0003138617770000075
特征提取和选择主要考虑到原始信号由于是杂乱且随时间变化而变化的连续信号,是非结构化的,与传统大数据结构化且完整的数据相比,不能直接分析,需要转化为统计量等形式才能使用一般算法建模,而采取频域和时频域的原因是由于时域信息不能很好反应原始信号与设备寿命或性能衰减之间关系,故需要根据设备情况另外考虑频域或时频域信号的特征。其中时域包括但不限于:
均值:
Figure BDA0003138617770000076
方差:
Figure BDA0003138617770000077
标准差:
Figure BDA0003138617770000078
偏斜度:
Figure BDA0003138617770000081
频域则采用快速傅里叶变换得到,由于傅里叶变换在一段较大时间T求得平均值是功率谱密度,其非常适合描述信号的频域特征,根据维纳-辛钦定理可得功率谱密度可以由自相关方程进行傅里叶变换得到,如下所示:
Figure BDA0003138617770000082
对于时频域特征,考虑到时频域特征提取需要有高分辨率和时间高效的要求,则采用的是小波包变换,像小波分解一样进行逐层分解,最终将最后一层的能量系数求出作为时频域特征,小波包分解的公式如下所示:
Figure BDA0003138617770000083
Figure BDA0003138617770000084
其中,n与k是自然数,h(l)和g(l)为不同滤波函数,在Wn(t)函数集合中,W0(t)为尺度函数,W1(t)是小波基函数。最终取末端节点能量值E=|Wj(t)|2作为该节点的时频域特征。
S12、基于数据漂移检测的设备运行阶段估计过程:根据所选择的特征对其进行分析,进行数据漂移检测并确定该类型设备在某环境下运行的各阶段时间分界点。
由于设备健康衰减模型不一定是绝对线性的,也带有非线性的部分,换句话说,通常设备寿命衰减速率不一定都是均匀的,也有可能受到环境的影响,设备运行的性质发生变化,若直接假设均匀递减,势必会导致解释性的缺失和预测准确率的下降。而数据漂移检测能够很好地反应环境变化对设备状态数据分布的影响,借此可以判断设备处于何种运行状态,以便更好地调用模型对其剩余寿命做出预测,得到更准确的预测结果。具体来说,数据漂移检测是根据多个数据特征在某个时间点t+1的分布相对时间点t是否发生了变化来决定数据漂移的发生,若检测到发生了数据漂移,则记录,最后根据先验的标签值确定需要划分多少个阶段,对漂移记录进行处理得到对应的显著漂移点作为阶段的分界点。
具体地,S12具体采用以下方式实现:
根据步骤S11获得的数据各维特征,对目标标签值进行数据漂移检测;
根据大量、没有边界、以高速率由生产设备传感器连续产生的数据对象,即数据流中,给定时间区间[0,t],将该区间内的数据对象集合记为S0,t=d0,…,dt,其中di=(XI,yi),Xi是n维特征向量
Figure BDA0003138617770000091
yi是类别标签,S0,t服从某一分布P0,t(X,y)。若概念漂移在下一时刻t+1发生,则有P0,t≠Pt+1,∞,则可判定时刻t+1为设备运行阶段的分界点。如此类推,在已知的专家解读下的设备一般运行阶段,得到各个运行阶段的分界时间点。
其中,概念漂移定义为数据分布等统计特征随时间发生变化的现象,例如胶片色彩随存放时间,发生变化,过去人们使用手机多用于电话通话,而近年随着移动互联网的发展,手机大多用于浏览多媒体信息。
从统计学特征而言,概念漂移可描述为给定时间区间[0,t],数据服从某一分布X,而在t+1时刻,其分布与前一时刻t不同,则认为t+1时刻发生了概念漂移:
若仅表现为先验概率之不同,则为虚假概念漂移;若仅表现为条件概率之不同,则为真实概念漂移,引发决策边界变化,但其数据之间的相对分布关系没有改变。若上述两者同时发生,则为混合概念漂移。
概念漂移的类别可分为四类:
突然漂移(Sudden Drift):概念在某一时间点发生突变,旧概念立刻变为新概念。
逐步漂移(Gradual Drift):概念在某一个时段中,新概念所占比例逐步增多,最终完全为新概念。
增量漂移(Incremental Drift):概念在某一时段,特征平滑地过渡至新概念。
重现漂移(Reoccurring Drift):在某一时刻发生突然漂移后,新概念保持一段时间后,又突然漂移为原概念。
S13、基于深度学习的剩余寿命预测建模:使用提取到的特征对该设备失效模型进行建模,首先根据该设备类型和提取到的特征数据构建健康因子,然后将其作为机器学习算法的输入进行建模,算法的输出是剩余寿命,如图4所述。
循环神经网络及其变体指的是包括循环神经网络(RNN)、长短期记忆网络(LSTM)和门控单元网络(GRU)等在内的,由循环神经网络(Recurrent neural network,RNN)的细胞循环结构上拓展开的变体,各种变体在RNN的基础结构上进行一定的改良,主要是为了缓解RNN长期依赖的丢失以及在反向传播过程中出现的梯度消失和梯度爆炸等问题。
本实施例的数据建模步骤将采用卷积神经网络和循环神经网络及其变体,充分利用卷积神经网络对数据高维特征提取的能力和循环神经网络及其变体对数据时序信息提取的能力,将两者的优势结合起来,能够更有效地对时序的原始信号进行特征提取,最终建立对设备剩余寿命的更加真实、准确的映射关系。对于卷积神经网络而言,最核心的操作有卷积层和全连接层以及各自的反向传播权值更新,使用公式表达则为:
卷积操作:
Figure BDA0003138617770000101
卷积反向传播:
Figure BDA0003138617770000102
全连接层:
Xl=σ(WlXl-1+bl)
全连接层反向传播:
Figure BDA0003138617770000103
具体步骤为:首先,根据选择到的数据特征,作为网络的输入,组织形式可以是多维向量的数据点,也可以是多维向量组成的二维矩阵,具体由网络结构决定。然后,网络结构包含了循环和卷积部分,若卷积操作是一维卷积,则采用多维向量点的输入形式;若卷积操作是二维卷积,则采用二维矩阵的输入形式。经过若干层卷积和循环网络的特征提取后,输出为健康因子。最后,健康因子经过一个全连接的回归网络,进行回归操作,得到一条拟合后的设备剩余使用寿命(RUL)曲线。
S2、采集设备实时运行数据,对实时运行数据进行特征提取和特征选择,获得数据特征。
S3、根据数据特征进行数据漂移检测,确定设备所处的健康阶段。
S4、根据健康阶段获取相应的剩余寿命预测模型,根据数据特征构建健康因子,将健康因子输入获得的剩余寿命预测模型,输出设备剩余寿命预测结果。
综上所述,本实施例的方法相对于现有技术,具有如下有益效果:
(1)基于漂移检测得出设备运行的阶段性情况,能够更有效地为各个阶段构建模型,更好地描述设备衰减模型,得到更准确的剩余寿命预测。
(2)基于设备原始数据的预处理、特征提取、特征选择、健康因子构建再到设备运行阶段的确定和设备衰减模型的建立。
(3)基于健康因子的构建,找到用于描述机器或设备寿命的最贴切的数据表示,作为模型的输入。
本实施例还提供一种基于工业大数据的设备剩余寿命预测系统,包括:
数据采集模块,用于采集设备实时运行数据,对实时运行数据进行特征提取和特征选择,获得数据特征;
偏移确定模块,用于根据数据特征进行数据漂移检测,确定设备所处的健康阶段;
寿命预测模块,用于根据健康阶段获取相应的剩余寿命预测模型,根据数据特征构建健康因子,将健康因子输入获得的剩余寿命预测模型,输出设备剩余寿命预测结果。
本实施例的一种基于工业大数据的设备剩余寿命预测系统,可执行本发明方法实施例所提供的一种基于工业大数据的设备剩余寿命预测方法,可执行方法实施例的任意组合实施步骤,具备该方法相应的功能和有益效果。
本实施例还提供一种基于工业大数据的设备剩余寿命预测系统,包括:
至少一个处理器;
至少一个存储器,用于存储至少一个程序;
当所述至少一个程序被所述至少一个处理器执行,使得所述至少一个处理器实现图1所示方法。
本实施例的一种基于工业大数据的设备剩余寿命预测系统,可执行本发明方法实施例所提供的一种基于工业大数据的设备剩余寿命预测方法,可执行方法实施例的任意组合实施步骤,具备该方法相应的功能和有益效果。
本申请实施例还公开了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存介质中。计算机设备的处理器可以从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行图1所示的方法。
本实施例还提供了一种存储介质,存储有可执行本发明方法实施例所提供的一种基于工业大数据的设备剩余寿命预测方法的指令或程序,当运行该指令或程序时,可执行方法实施例的任意组合实施步骤,具备该方法相应的功能和有益效果。
在一些可选择的实施例中,在方框图中提到的功能/操作可以不按照操作示图提到的顺序发生。例如,取决于所涉及的功能/操作,连续示出的两个方框实际上可以被大体上同时地执行或所述方框有时能以相反顺序被执行。此外,在本发明的流程图中所呈现和描述的实施例以示例的方式被提供,目的在于提供对技术更全面的理解。所公开的方法不限于本文所呈现的操作和逻辑流程。可选择的实施例是可预期的,其中各种操作的顺序被改变以及其中被描述为较大操作的一部分的子操作被独立地执行。
此外,虽然在功能性模块的背景下描述了本发明,但应当理解的是,除非另有相反说明,所述的功能和/或特征中的一个或多个可以被集成在单个物理装置和/或软件模块中,或者一个或多个功能和/或特征可以在单独的物理装置或软件模块中被实现。还可以理解的是,有关每个模块的实际实现的详细讨论对于理解本发明是不必要的。更确切地说,考虑到在本文中公开的装置中各种功能模块的属性、功能和内部关系的情况下,在工程师的常规技术内将会了解该模块的实际实现。因此,本领域技术人员运用普通技术就能够在无需过度试验的情况下实现在权利要求书中所阐明的本发明。还可以理解的是,所公开的特定概念仅仅是说明性的,并不意在限制本发明的范围,本发明的范围由所附权利要求书及其等同方案的全部范围来决定。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。
计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
在本说明书的上述描述中,参考术语“一个实施方式/实施例”、“另一实施方式/实施例”或“某些实施方式/实施例”等的描述意指结合实施方式或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施方式或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施方式或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施方式或示例中以合适的方式结合。
尽管已经示出和描述了本发明的实施方式,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施方式进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。
以上是对本发明的较佳实施进行了具体说明,但本发明并不限于上述实施例,熟悉本领域的技术人员在不违背本发明精神的前提下还可做作出种种的等同变形或替换,这些等同的变形或替换均包含在本申请权利要求所限定的范围内。

Claims (7)

1.一种基于工业大数据的设备剩余寿命预测方法,其特征在于,包括以下步骤:
采集设备实时运行数据,对实时运行数据进行特征提取和特征选择,获得数据特征;
根据数据特征进行数据漂移检测,确定设备所处的健康阶段;
根据健康阶段获取相应的剩余寿命预测模型,根据数据特征构建健康因子,
将健康因子输入获得的剩余寿命预测模型,输出设备剩余寿命预测结果;
所述设备剩余寿命预测方法还包括构建剩余寿命预测模型的步骤,包括:
采集设备在运行阶段的原始数据,根据原始数据进行特征提取和特征选择,获得数据特征;
根据数据特征进行数据漂移检测,确定设备在预设环境下运行的各阶段时间分界点;
根据阶段时间分界点对模型进行分类,根据数据特征构建健康因子,根据健康因子对分类的模型进行训练,获得剩余寿命预测模型;
根据原始数据进行特征提取,包括:
提取原始数据的时域和频域的统计量信息;
其中,时域的统计量信息包括均值、方差、标准差以及偏斜度;
均值的表达式为:
Figure FDA0003961753590000011
方差的表达式为:
Figure FDA0003961753590000012
标准差的表达式为:
Figure FDA0003961753590000013
峰值的表达式为:
Figure FDA0003961753590000014
其中,N表示数据点实体总数,xi表示第i个数据实体,μ表示均值,σ表示标准差;
所述根据数据特征进行数据漂移检测,确定设备在预设环境下运行的各阶段时间分界点,包括:
根据数据特征,对与原始数据对应的目标标签值进行数据漂移检测;
在数据流中,给定时间区间[0,t],将时间区间内的数据对象集合记为S0,t=d0,…,dt,其中,di=(Xi,yi),Xi是n维特征向量
Figure FDA0003961753590000021
是类别标签,S0,t服从预设分布P0,t(X,y);
若概念漂移在下一时刻t+1发生,则有P0,t≠Pt+1,∞,判定时刻t+1为设备运行阶段的分界点。
2.根据权利要求1所述的一种基于工业大数据的设备剩余寿命预测方法,其特征在于,所述采集设备在运行阶段的原始数据的步骤包括对数据进行去噪的步骤,包括:
对原始数据进行分析,选择适合所述原始数据的小波函数,以及选择分解层数n,对原始数据进行n层小波分解;
根据每层小波分解的尺度系统和细节系数的统计量,以及原始数据的特点确定阈值的大小;
采用软硬阈值折中方法作为小波阈值去噪的阈值函数,遍历各层小波分解后的尺度系数,带入阈值函数进行阈值处理,得到处理后的各层小波系数;
使用Mallet算法将各层系数重构为信号,得到重构后去噪的原始信号。
3.根据权利要求1所述的一种基于工业大数据的设备剩余寿命预测方法,其特征在于,所述根据健康因子对分类的模型进行训练,包括:
结合卷积神经网络、循环神经网络以及循环神经网络变体,对由健康因子到设备剩余寿命值映射关系进行训练学习。
4.根据权利要求3所述的一种基于工业大数据的设备剩余寿命预测方法,其特征在于,所述卷积神经网络的操作包括卷积层操作、卷积反向传播、全连接层操作和全连接层反向传播;
其中,卷积层操作的表达式为:
Figure FDA0003961753590000031
卷积反向传播的表达式为:
Figure FDA0003961753590000032
全连接层操作的表达式为:
Xl=σ(WlXl-1+bl)
全连接层反向传播的表达式为:
Figure FDA0003961753590000033
其中,L表示损失函数输出,
Figure FDA0003961753590000034
表示再第l层卷积神经网络的第j个特征图,l表示神经网络层数,W表示所学习到的权值,δ表示反向传播时的学习率,b表示偏置量,P表示特征图块,K表示卷积核。
5.一种基于工业大数据的设备剩余寿命预测系统,其特征在于,包括:
数据采集模块,用于采集设备实时运行数据,对实时运行数据进行特征提取和特征选择,获得数据特征;
偏移确定模块,用于根据数据特征进行数据漂移检测,确定设备所处的健康阶段;
寿命预测模块,用于根据健康阶段获取相应的剩余寿命预测模型,根据数据特征构建健康因子,将健康因子输入获得的剩余寿命预测模型,输出设备剩余寿命预测结果;
所述设备剩余寿命预测系统还包括构建剩余寿命预测模型的模块,包括:
采集设备在运行阶段的原始数据,根据原始数据进行特征提取和特征选择,获得数据特征;
根据数据特征进行数据漂移检测,确定设备在预设环境下运行的各阶段时间分界点;
根据阶段时间分界点对模型进行分类,根据数据特征构建健康因子,根据健康因子对分类的模型进行训练,获得剩余寿命预测模型;
根据原始数据进行特征提取,包括:
提取原始数据的时域和频域的统计量信息;
其中,时域的统计量信息包括均值、方差、标准差以及偏斜度;
均值的表达式为:
Figure FDA0003961753590000041
方差的表达式为:
Figure FDA0003961753590000042
标准差的表达式为:
Figure FDA0003961753590000043
峰值的表达式为:
Figure FDA0003961753590000044
其中,N表示数据点实体总数,xi表示第i个数据实体,μ表示均值,σ表示标准差;
根据数据特征进行数据漂移检测,确定设备在预设环境下运行的各阶段时间分界点,包括:
根据数据特征,对与原始数据对应的目标标签值进行数据漂移检测;
在数据流中,给定时间区间[0,t],将时间区间内的数据对象集合记为S0,t=d0,…,dt,其中,di=(Xi,yi),Xi是n维特征向量
Figure FDA0003961753590000045
是类别标签,S0,t服从预设分布P0,t(X,y);
若概念漂移在下一时刻t+1发生,则有P0,t≠Pt+1,∞,判定时刻t+1为设备运行阶段的分界点。
6.一种基于工业大数据的设备剩余寿命预测系统,其特征在于,包括:
至少一个处理器;
至少一个存储器,用于存储至少一个程序;
当所述至少一个程序被所述至少一个处理器执行,使得所述至少一个处理器实现权利要求1-4任一项所述方法。
7.一种存储介质,其中存储有处理器可执行的程序,其特征在于,所述处理器可执行的程序在由处理器执行时用于执行如权利要求1-4任一项所述方法。
CN202110728957.8A 2021-06-29 2021-06-29 基于工业大数据的设备剩余寿命预测方法、系统及介质 Active CN113344295B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110728957.8A CN113344295B (zh) 2021-06-29 2021-06-29 基于工业大数据的设备剩余寿命预测方法、系统及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110728957.8A CN113344295B (zh) 2021-06-29 2021-06-29 基于工业大数据的设备剩余寿命预测方法、系统及介质

Publications (2)

Publication Number Publication Date
CN113344295A CN113344295A (zh) 2021-09-03
CN113344295B true CN113344295B (zh) 2023-02-14

Family

ID=77481460

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110728957.8A Active CN113344295B (zh) 2021-06-29 2021-06-29 基于工业大数据的设备剩余寿命预测方法、系统及介质

Country Status (1)

Country Link
CN (1) CN113344295B (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113779882B (zh) * 2021-09-10 2024-05-17 中国石油大学(北京) 设备剩余使用寿命的预测方法、装置、设备及存储介质
CN113988375A (zh) * 2021-09-28 2022-01-28 通号城市轨道交通技术有限公司 铁路道岔故障预测方法及装置
CN114021274A (zh) * 2021-10-27 2022-02-08 广汽本田汽车有限公司 超声波冲头使用寿命检测方法、系统、装置及存储介质
CN114021477B (zh) * 2021-11-18 2024-06-25 江苏科技大学 基于小波包分解和1d-cnn的继电器寿命预测方法
CN114239932A (zh) * 2021-12-01 2022-03-25 深圳供电局有限公司 一种变压器寿命预测方法、装置、计算机设备和存储介质
CN114429249B (zh) * 2022-04-06 2022-08-16 杭州未名信科科技有限公司 钢管束生产设备的寿命预测方法、系统、设备及存储介质
CN114662622B (zh) * 2022-05-24 2022-09-16 深圳市信润富联数字科技有限公司 一种基于小样本数据的phm端到端系统的实现方法
CN116011109B (zh) * 2023-01-13 2023-09-08 北京控制工程研究所 一种航天器寿命预测方法、装置、电子设备及存储介质
CN115840889B (zh) * 2023-02-17 2023-05-26 中国空气动力研究与发展中心计算空气动力研究所 用于转捩预测的特征值的处理方法、装置、设备及介质
CN117809696B (zh) * 2024-02-29 2024-05-10 南京迅集科技有限公司 基于声学分析的工业设备健康评估与故障预测方法和系统
CN118245735A (zh) * 2024-05-27 2024-06-25 俐玛光电科技(北京)有限公司 一种基于电子元件性能数据的检测方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110781592A (zh) * 2019-10-25 2020-02-11 中国人民解放军火箭军工程大学 一种设备剩余寿命的预测方法及系统
CN110781781A (zh) * 2019-10-15 2020-02-11 山东师范大学 一种时间序列概念漂移检测方法、系统、介质及设备
CN112890834A (zh) * 2021-03-01 2021-06-04 福州大学 面向注意力识别的基于机器学习的眼电信号分类器
CN113033643A (zh) * 2021-03-17 2021-06-25 上海交通大学 基于带权重采样的概念漂移检测方法、系统及电子设备

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200090063A1 (en) * 2016-12-16 2020-03-19 Factor Financial Analytics Pty Ltd A method and system for generating a decision-making algorithm for an entity to achieve an objective
TW201915727A (zh) * 2017-09-18 2019-04-16 元智大學 多元感測器之錯誤偵測與分類方法
US10209974B1 (en) * 2017-12-04 2019-02-19 Banjo, Inc Automated model management methods

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110781781A (zh) * 2019-10-15 2020-02-11 山东师范大学 一种时间序列概念漂移检测方法、系统、介质及设备
CN110781592A (zh) * 2019-10-25 2020-02-11 中国人民解放军火箭军工程大学 一种设备剩余寿命的预测方法及系统
CN112890834A (zh) * 2021-03-01 2021-06-04 福州大学 面向注意力识别的基于机器学习的眼电信号分类器
CN113033643A (zh) * 2021-03-17 2021-06-25 上海交通大学 基于带权重采样的概念漂移检测方法、系统及电子设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于卷积神经网络的光伏逆变器故障诊断技术研究;陈旺斌;《中国优秀硕士学位论文全文数据库工程科技II辑》;20210415(第4期);第17-24页 *

Also Published As

Publication number Publication date
CN113344295A (zh) 2021-09-03

Similar Documents

Publication Publication Date Title
CN113344295B (zh) 基于工业大数据的设备剩余寿命预测方法、系统及介质
Chen et al. Health indicator construction of machinery based on end-to-end trainable convolution recurrent neural networks
Maya et al. dLSTM: a new approach for anomaly detection using deep learning with delayed prediction
US8347144B2 (en) False alarm mitigation
Rai et al. A novel health indicator based on the Lyapunov exponent, a probabilistic self-organizing map, and the Gini-Simpson index for calculating the RUL of bearings
US20230108916A1 (en) Method and system for forecasting non-stationary time-series
Wu et al. Layer-wise relevance propagation for interpreting LSTM-RNN decisions in predictive maintenance
CN112414694B (zh) 基于多元状态估计技术的设备多级异常状态识别方法及装置
Wang et al. An integrated approach for process monitoring using wavelet analysis and competitive neural network
Wang et al. Performance degradation assessment of rolling bearing based on convolutional neural network and deep long-short term memory network
Jiang et al. Dual residual attention network for remaining useful life prediction of bearings
Chadha et al. Time series based fault detection in industrial processes using convolutional neural networks
CN113807396A (zh) 一种物联网高维数据异常检测方法、系统、装置及介质
CN116977708B (zh) 一种基于自适应聚合可视图的轴承智能诊断方法及系统
CN114500004A (zh) 一种基于条件扩散概率生成模型的异常检测方法
Yang et al. Remaining useful life prediction based on normalizing flow embedded sequence-to-sequence learning
Lee et al. An explainable deep learning-based prognostic model for rotating machinery
Tambuwal et al. Deep quantile regression for unsupervised anomaly detection in time-series
CN116758922A (zh) 一种用于变压器的声纹监测与诊断方法
CN117473275B (zh) 一种数据中心的能耗检测方法
CN116451081A (zh) 数据漂移的检测方法、装置、终端及存储介质
KR20210126378A (ko) 슬라이딩 윈도우 기법을 이용한 제조설비의 실시간 다변량 이상감지 시스템
Hamdaoui et al. Improved signal processing for bearing fault diagnosis in noisy environments using signal denoising, time–frequency transform, and deep learning
CN117371321A (zh) 一种基于贝叶斯优化的内在可塑性深度回声状态网络软测量建模方法
CN116522070A (zh) 一种机械零部件无监督智能故障诊断方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant