CN114781278B - 一种基于数据驱动的机电设备寿命预测方法及系统 - Google Patents
一种基于数据驱动的机电设备寿命预测方法及系统 Download PDFInfo
- Publication number
- CN114781278B CN114781278B CN202210687754.3A CN202210687754A CN114781278B CN 114781278 B CN114781278 B CN 114781278B CN 202210687754 A CN202210687754 A CN 202210687754A CN 114781278 B CN114781278 B CN 114781278B
- Authority
- CN
- China
- Prior art keywords
- data
- discrete
- time
- abnormal data
- abnormal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2119/00—Details relating to the type or aim of the analysis or the optimisation
- G06F2119/04—Ageing analysis or optimisation against ageing
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Computer Hardware Design (AREA)
- Geometry (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Testing Of Devices, Machine Parts, Or Other Structures Thereof (AREA)
Abstract
本发明涉及机电设备寿命预测技术领域,特别是涉及一种基于数据驱动的机电设备寿命预测方法及系统,包括:获取多设备的数据集;筛选出异常数据;根据异常数据在时间轴上的分布进行周期划分;对不同设备周期划分的结果进行周期组合得到训练集以及测试集;将所述训练集输入选定的数据驱动模型进行训练;将测试集输入训练后的数据驱动模型进行测试;测试结束,根据所得数据驱动模型预测任意一台机电设备的寿命。本发明提供的方法通过筛选异常数据,将多设备的数据进行周期划分后重新组合得到训练集以及测试集,并进行模型的训练及测试、完成寿命预测,在数据划分阶段对数据进行了整合,使模型更为全面准确。
Description
技术领域
本发明涉及机电设备寿命预测技术领域,特别是涉及一种基于数据驱动的机电设备寿命预测方法及系统。
背景技术
数据驱动是相对于模型驱动而言的数据处理分析方法。所谓模型驱动是指构建出模型,利用采集到的数据,根据已构建出的模型分析对象,这种方式有赖于构建出的模型的准确性。与之不同,数据驱动分析方法下,并非构建出一个固定不变的模型,而是利用采集到的数据,对模型进行训练,使模型向数据贴合。
数据驱动的分析方法对于数据信息具有更高的依赖性,但是对数据的适应性也更高,在一些具有明显趋势以及规律波动的数据分析中,数据驱动的分析方法具有明显优势。
机电设备的寿命预测一直是一个研究热点。现有技术提供了一些基于数据驱动的机电寿命的分析方法,这些方法主要从如何挖掘数据信息的角度着手的,例如增加模型深度,使用不同的特征提取方法等,然后,数据驱动的分析方法本身的一个问题是对数据的依赖性太高,如何使数据随机而又能够包含尽可能多的实际情况,是在数据分析时需要解决的问题。
发明内容
基于此,有必要针对上述的问题,提供一种基于数据驱动的机电设备寿命预测方法及系统。
本发明实施例是这样实现的,一种基于数据驱动的机电设备寿命预测方法,所述基于数据驱动的机电设备寿命预测方法包括:
获取多设备的数据集;
筛选出异常数据;
根据异常数据在时间轴上的分布进行周期划分;
对不同设备周期划分的结果进行周期组合得到训练集以及测试集;
将所述训练集输入选定的数据驱动模型进行训练;
将测试集输入训练后的数据驱动模型进行测试;
测试结束,根据所得数据驱动模型预测任意一台机电设备的寿命。
在其中一个实施例中,本发明提供了一种基于数据驱动的机电设备寿命预测系统,所述基于数据驱动的机电设备寿命预测系统包括:
数据采集装置,所述数据采集装置与各设备连接,用于各设备运行参数的实时采集;以及
计算机设备,所述计算机设备与所述数据采集装置连接,用于执行如本发明所述的基于数据驱动的机电设备寿命预测方法。
本发明实施例提供的基于数据驱动的机电设备寿命预测方法通过异常数据的筛选,将数据进行划分,而后将多设备数据的划分结果进行重新组合,使异常数据在组合所得的数据中分布更为均匀,提高了有效数据在训练集以及测试集中的占比,使训练以及测试的过程能够更好地针对异常情况,避免了数据驱动模型训练集与测试集存在较大差异导致的结果偏离较大的问题,提高了模型对真实情况的适应性,可以降低训练及测试时对数据量的要求。
附图说明
图1为一个实施例提供的基于数据驱动的机电设备寿命预测方法的流程图;
图2为一个实施例提供的计算机设备的内部结构框图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
可以理解,本发明所使用的术语“第一”、“第二”等可在本文中用于描述各种元件,但除非特别说明,这些元件不受这些术语限制。这些术语仅用于将第一个元件与另一个元件区分。举例来说,在不脱离本发明的范围的情况下,可以将第一xx脚本称为第二xx脚本,且类似地,可将第二xx脚本称为第一xx脚本。
如图1所示,在一个实施例中,提出了一种基于数据驱动的机电设备寿命预测方法,所述基于数据驱动的机电设备寿命预测方法包括:
获取多设备的数据集;
筛选出异常数据;
根据异常数据在时间轴上的分布进行周期划分;
对不同设备周期划分的结果进行周期组合得到训练集以及测试集;
将所述训练集输入选定的数据驱动模型进行训练;
将测试集输入训练后的数据驱动模型进行测试;
测试结束,根据所得数据驱动模型预测任意一台机电设备的寿命。
在本实施例中,机电设备包括但不限于生产制造中的机床(车床、铣床等)等设备,温控系统中的风机、水泵等设备,还可以包括其它类型的专用或者通用设备。这些设备均存在使用年限,但是使用年限与具体的使用情况以及维护情况有关,本发明即用于这些设备使用过程中的寿命预测,从而实现设备的数字化管理维护。
在本实施例中,这里的多设备是指同型号的多台设备,对于单一设备的寿命预测往往因为数据量不足准确性很低,本发明通过综合多设备的数据可以提高预测的准确性。需要说明的是,设备寿命可以通过其使用时的具体工作参数进行衡量,例如随着使用年限的增加,设备的精度下降,当精度下降到无法修正的程度时,可以认为设备报废。实际的寿命预测即是预测一些关键参数随时间的变化情况,预估设备的报废时间,对每个参数可以单独预测,本发明以多设备就同一参数的变化进行预设来说明。需要说明的是,这里的数据集是多台设备的某一参数的值随时间变化的情况,可以是连续采样也可以是离散采集,不同的采集方式可以得到不同的数据类型。
在本实施例中,异常数据是指波动较大的数据,本发明给出了异常数据具体如何确定的方法。在本实施例中,由于所采集的数据是随时间分布的,可以将时间轴进行周期划分,则每一个周期对应一部分数据,可以将每个周期对应的数据作为一个数据整体输入模型进行训练或者测试。在本实施例中,进行周期划分之后还包括不同设备间数据的重新组合以得到训练集以及测试集。
在本实施例中,对于数据驱动模型的训练以及测试过程可以参考现有技术,本发明不涉及此部分内容的改进。测试结束后,根据设备当前的运行参数可以实现设备寿命的预测。
本发明实施例提供的基于数据驱动的机电设备寿命预测方法通过异常数据的筛选,将数据进行划分,而后将多设备数据的划分结果进行重新组合,使异常数据在组合所得的数据中分布更为均匀,提高了有效数据在训练集以及测试集中的占比,使训练以及测试的过程能够更好地针对异常情况,避免了数据驱动模型训练集与测试集存在较大差异导致的结果偏离较大的问题,提高了模型对真实情况的适应性,可以降低训练及测试时对数据量的要求。
作为本发明的一个可选实施例,所述确定一个筛选范围,根据确定出的筛选范围筛选出异常数据,包括:
确定数据类型,所述数据类型包括连续型以及离散型;
对于连续型,根据均值回归确定筛选出异常数据;
对于离散型,根据线性回归筛选出异常数据。
在本实施例中,对于不同类型的数据采用不同的方法找出异常数据。
作为本发明的一个可选实施例,所述根据均值回归筛选出异常数据,包括:
选定时间窗宽度,在时间轴上以时间窗宽度为步距移动时间窗,计算时间窗每次移动所在位置连续型数据的积分中值,得到连接型数据的系列积分中值;
以时间窗每次移动所在位置的中点为横坐标,以对应连续型数据的积分中值为纵坐标,得到系列中值点;
由系列中值点确定一条贝塞尔曲线;
将所述贝塞尔曲线向上侧平移第一距离得到上边界,将所述贝塞尔曲线向下侧平移第二距离得到下边界;
将位于所述上边界与所述下边界所夹范围之外的数据标记为异常数据。
在本实施例中,可以理解,这时的时间窗是用于数据筛选的一个时间窗口的长度,本质是一个特定的时间长度,每次处理时仅对该段时间内的数据进行处理,故称之为时间窗。在本实施例中,在时间轴上以时间窗宽度为步距移动时间窗,则相邻两个时间窗的距离为0,时间轴被时间窗划分为若干个区域。
在本实施例中,积分中值由下式计算:
在本实施例中,每个时间窗可以计算得到一个积分中值,以时间窗每次移动所在位置的中点为横坐标,以对应连续型数据的积分中值为纵坐标,得到系列中值点。
在本实施例中,由系列中值点可以确定一条贝塞尔曲线,对于其计算方法可以参考现有技术,本发明实施例对此不再赘述。在此基础上,通过将贝塞尔曲线分别向上下两侧平移可以得到上边界以及下边界,超出上边界与下边界所夹区域的数据标记为异常数据。异常数据是相对的,对于数据驱动模型,异常数据是影响数据驱动模型参数的主要数据,本发明并不涉及对异常数据本身的改变,而是通过将异常数据进行拆分重新组合得到训练集以及测试集,以提高训练集以及测试集中数据对于模型训练以及测试的有效性。
作为本发明的一个可选实施例,第一距离与第二距离比值的范围为0.8~1.4,且异常数据对应的时间长度占总时间长度的比例为5%~15%。
在本实施例中,通过选定第一距离与第二距离的比值以及异常数据对应时间长度占总时间长度的比例,可以得到计算得到第一距离与第二距离各自的值。例如取第一距离与第二距离的比值为1,异常数据对应的时间长度占总时间长度的比例取10%,同时向上下两侧移动贝塞尔曲线,实时计算位于上边界与下边界之外的数据对应的时间长度占总时间长度的比例,直到该比例从100%降至10%时停止,得到上边界与下边界,并可以筛选出异常数据。
作为本发明的一个可选实施例,所述根据线性回归筛选出异常数据,包括:
将离散型数据划分为若干个组;
计算每一个组内所有离散点的回归直线;
分别计算每个组内各个离散点到回归直线的平均距离;
对于任意一个离散点,若其到对应回归直线的距离达到所在组内各离散点到回归直线平均距离的1.5倍,则将之记为异常数据。
在本实施例中,这里的分组是将相邻的若干个离散型数据作为一组进行划分的,划分的主要目的是将变化较大的数据分离出来,使这些对数据驱动模型具有重要影响的数据更为均匀地分布于训练集以及测试集中。
由点与直线的公式可以计算每个组内各个离散点到回归直线的距离,并可以计算平均距离。
作为本发明的一个可选实施例,所述将离散型数据划分为若干个组,包括:
计算所有相邻两个离散型数据所在直线与时间轴正方向的夹角的绝对值;
对于任意一个离散型数据,若其与前一个离散型数据所确定的直线与时间轴正方向的夹角、与后一个离散型数据所确定的直线与时间轴正方向的夹角均大于设定阈值,则将该离散型数据标记为独立数据;
对于任意一个离散型数据,若其与前一个离散型数据所确定的直线与时间轴正方向的夹角、与后一个离散型数据所确定的直线与时间轴正方向的夹角有且仅有一个大于设定阈值,则将所确定的直线与时间轴正方向的夹角大于设定阈值的对应两个离散型数据标记为边界数据;
根据设定的每组元素的上限值、所述独立数据以及所述边界数据将离散型数据划分为若干个组。
在本实施例中,这里的设定阀值可以视离散型数据的变化情况由用户自行设定,例如可以设定为70度、85度等。
在本实施例中,设定每组元素的上限值为m(视数据量的大小,m可以取总离散型数据的百万分之一,万分之一等),沿着时间轴的方向,每m个离散型数据作为一个组,每遇到边界数据,则提前结束一组,使边界数据作为下一组的起始数据,每遇到独立数据,则将独立数据本身作为一个独立的组。由此可以将所有离散型数据进行分组。
作为本发明的一个可选实施例,所述根据异常数据在时间轴上的分布进行周期划分,包括:
对于连续型数据:
选取时间跨度最长的一个异常数据对应的时间作为周期初始值;
根据所述周期初始值将连续型数据进行周期划分;
判断划分所得的各个周期时间段内,异常数据是否唯一,若否,取周期初始值的1/n重新进行划分直至划分所得的各个周期时间段内异常数据唯一,若是,完成周期划分;
对于离散型数据:
选取时间跨度最长的若干个相邻异常数据对应的时间作为周期初始值;
根据所述周期初始值将离散型数据进行周期划分;
判断划分所得的各个周期时间段内,异常数据是否唯一,若否,取周期初始值的1/n重新进行划分直至划分所得的各个周期时间段内异常数据唯一,若是,完成周期划分;
其中:n为周期划分的次数。
在本实施例中,选取时间跨度最长的一个异常数据对应的时间作为周期初始值,需要理解,由于数据是连续型的,这里的一个是指超出边界范围的部分连续数据构成的一段曲线(该段曲线除端点外完全位于边界区域外,且该段曲线的两个端点在边界线上),而不是一个数据点,这里是将连续的部分异常数据点作为一个整体来描述,故每个异常数据(曲线段)都对应一个时间跨度。
在本实施例中,根据所述周期初始值将连续型数据进行周期划分,可以理解,将选定的时间跨度最大的异常数据对应的时间作为周期初始值,并使该具有最大时间跨度的异常数据处于一个完整的周期初始值内,以该具有最大时间跨度的异常数据的横轴中点为中心,向横轴左右两侧扩展进行周期划分。
若任意一个划分所得的时间周期内异常数据不唯一,则通过缩小周期初始值的方式重新划分,直至每个周期内最多有一个异常数据。可以理解,对于没有非异常数据同样进行了划分,划分所得的每个周期内,可以全部为异常数据,也可以没有部分为异常数据,部分为非异常数据,还可以全部为非异常数据。
对于离散型数据,与连续型数据的不同仅在于,周期初始值的确定是通过选取时间跨度最长的若干个相邻异常数据确定的,例如点(x3,y3)、(x4,y4)以及(x5,y5)为三个具有最长时间跨度的连续的异常离散点,三个点对应的横轴时间跨度(即x5- x3)为8个时间单位(分、秒、小时、天等,根据不同参数选用的时间单位确定),则周期初始值选定为8个时间单位。
作为本发明的一个可选实施例,所述对不同设备周期划分的结果进行周期组合得到训练集以及测试集,包括:
对同一型号的不同设备的同一参数,判断各设备的异常数据在时间轴上是否存在重叠,若是,将重叠的异常数据的一半划分为训练子集一,另一半划分为测试子集一;
对于非重叠部分的异常数据,根据其在时间轴上的先后顺序,奇数划分为训练子集二,偶数划分为测试子集二;
对于非异常数据,根据其在时间轴上的先后顺序,奇数划分为训练子集三,偶数划分为测试子集三;
将训练子集一、训练子集二以及训练子集三进行组合得到训练集;
将测试子集一、测试子集二以及测试子集三进行组合得到测试集。
在本实施例中,可以理解,将不同设备的同一参数均置于同一时间轴上进行处理,对于连续型数据,这里的重叠是指周期划分之后的曲线段存在相交的情况,则两个周期对应的数据存在重叠(需要注意,不同设备的同一参数的周期长度一般不相同),将重叠的数据按其所在的周期进行划分。对于离散型数据,仅当两个数据点重合时才判断为重叠。
在本实施例中,组合得到训练集或者组合得到测试集,是将多个子集进行合并的过程,对数据本身并没有改动。
作为本发明的一个可选实施例,所述数据驱动模型选自神经网络模型、ELM算法、支持向量机以及BK模型中的一种。
在本实施例中,神经网络模型可以选用卷积神经网络(Convolutional NeuralNetworks,CNN)、循环神经网络(Recurrent Neural Network,RNN)等;ELM算法即ExtremeLearning Machine,极限学习机算法;BK(BP-KNN)模型是BP神经网络与K-最近邻算法(KNN)相耦合所建立的一种数据驱动模型。本发明不涉及模型本身的改进,对于各模型的训练以及测试的具体步骤,可以参考现有技术。
需要说明的是,当数据驱动模型仅能处理离散型数据时,对于本申请中的连续型数据,可以在处理完成后,通过密集采样的方式得到能够输入模型的数据点,采样频率可以选用常用的4.2 MHz、5.5 MHz、5.6MHz等,通常低于4GHz均可。
本发明实施例还提供了一种基于数据驱动的机电设备寿命预测系统,所述基于数据驱动的机电设备寿命预测系统包括:
数据采集装置,所述数据采集装置与各设备连接,用于各设备运行参数的实时采集;以及
计算机设备,所述计算机设备与所述数据采集装置连接,用于执行如本发明所述的基于数据驱动的机电设备寿命预测方法。
在本实施例中,对于机电设备本身记录的数据,这里的数据采集装置可以采用传输线替代,由机电设备直接输出其记录的数据即可;对于机电设备无法直接记录的数据,可以通过相应的传感器进行采集,例如采用温度传感器采集设备的温度数据等。
本发明实施例提供的基于数据驱动的机电设备寿命预测系统通过异常数据的筛选,将数据进行划分,而后将多设备数据的划分结果进行重新组合,使异常数据在组合所得的数据中分布更为均匀,提高了有效数据在训练集以及测试集中的占比,使训练以及测试的过程能够更好地针对异常情况,避免了数据驱动模型训练集与测试集存在较大差异导致的结果偏离较大的问题,提高了模型对真实情况的适应性,可以降低训练及测试时对数据量的要求。
图2示出了一个实施例中计算机设备的内部结构图。该计算机设备具体可以是本发明实施例提供的基于数据驱动的机电设备寿命预测系统中的计算机设备。如图2所示,该计算机设备包括该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、输入装置和显示屏。其中,存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质存储有操作系统,还可存储有计算机程序,该计算机程序被处理器执行时,可使得处理器实现本发明实施例提供的基于数据驱动的机电设备寿命预测方法。该内存储器中也可储存有计算机程序,该计算机程序被处理器执行时,可使得处理器执行本发明实施例提供的基于数据驱动的机电设备寿命预测方法。计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图2中示出的结构,仅仅是与本发明方案相关的部分结构的框图,并不构成对本发明方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提出了一种计算机设备,所述计算机设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取多设备的数据集;
筛选出异常数据;
根据异常数据在时间轴上的分布进行周期划分;
对不同设备周期划分的结果进行周期组合得到训练集以及测试集;
将所述训练集输入选定的数据驱动模型进行训练;
将测试集输入训练后的数据驱动模型进行测试;
测试结束,根据所得数据驱动模型预测任意一台机电设备的寿命。
在一个实施例中,提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时,使得处理器执行以下步骤:
获取多设备的数据集;
筛选出异常数据;
根据异常数据在时间轴上的分布进行周期划分;
对不同设备周期划分的结果进行周期组合得到训练集以及测试集;
将所述训练集输入选定的数据驱动模型进行训练;
将测试集输入训练后的数据驱动模型进行测试;
测试结束,根据所得数据驱动模型预测任意一台机电设备的寿命。
应该理解的是,虽然本发明各实施例的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,各实施例中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本发明所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink) DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
Claims (8)
1.一种基于数据驱动的机电设备寿命预测方法,其特征在于,所述基于数据驱动的机电设备寿命预测方法包括:
获取多设备的数据集;
筛选出异常数据;
根据异常数据在时间轴上的分布进行周期划分;
对不同设备周期划分的结果进行周期组合得到训练集以及测试集;
将所述训练集输入选定的数据驱动模型进行训练;
将测试集输入训练后的数据驱动模型进行测试;
测试结束,根据所得数据驱动模型预测任意一台机电设备的寿命;
所述筛选出异常数据,包括:
确定数据类型,所述数据类型包括连续型以及离散型;
对于连续型,根据均值回归确定筛选出异常数据;
对于离散型,根据线性回归筛选出异常数据;
所述根据均值回归筛选出异常数据,包括:
选定时间窗宽度,在时间轴上以时间窗宽度为步距移动时间窗,计算时间窗每次移动所在位置连续型数据的积分中值,得到连接型数据的系列积分中值;
以时间窗每次移动所在位置的中点为横坐标,以对应连续型数据的积分中值为纵坐标,得到系列中值点;
由系列中值点确定一条贝塞尔曲线;
将所述贝塞尔曲线向上侧平移第一距离得到上边界,将所述贝塞尔曲线向下侧平移第二距离得到下边界;
将位于所述上边界与所述下边界所夹范围之外的数据标记为异常数据。
2.根据权利要求1所述的基于数据驱动的机电设备寿命预测方法,其特征在于,第一距离与第二距离比值的范围为0.8~1.4,且异常数据对应的时间长度占总时间长度的比例为5%~15%。
3.根据权利要求1所述的基于数据驱动的机电设备寿命预测方法,其特征在于,所述根据线性回归筛选出异常数据,包括:
将离散型数据划分为若干个组;
计算每一个组内所有离散点的回归直线;
分别计算每个组内各个离散点到回归直线的平均距离;
对于任意一个离散点,若其到对应回归直线的距离达到所在组内各离散点到回归直线平均距离的1.5倍,则将之记为异常数据。
4.根据权利要求3所述的基于数据驱动的机电设备寿命预测方法,其特征在于,所述将离散型数据划分为若干个组,包括:
计算所有相邻两个离散型数据所在直线与时间轴正方向的夹角的绝对值;
对于任意一个离散型数据,若其与前一个离散型数据所确定的直线与时间轴正方向的夹角、与后一个离散型数据所确定的直线与时间轴正方向的夹角均大于设定阈值,则将该离散型数据标记为独立数据;
对于任意一个离散型数据,若其与前一个离散型数据所确定的直线与时间轴正方向的夹角、与后一个离散型数据所确定的直线与时间轴正方向的夹角有且仅有一个大于设定阈值,则将所确定的直线与时间轴正方向的夹角大于设定阈值的对应两个离散型数据标记为边界数据;
根据设定的每组元素的上限值、所述独立数据以及所述边界数据将离散型数据划分为若干个组。
5.根据权利要求1所述的基于数据驱动的机电设备寿命预测方法,其特征在于,所述根据异常数据在时间轴上的分布进行周期划分,包括:
对于连续型数据:
选取时间跨度最长的一个异常数据对应的时间作为周期初始值;
根据所述周期初始值将连续型数据进行周期划分;
判断划分所得的各个周期时间段内,异常数据是否唯一,若否,取周期初始值的1/n重新进行划分直至划分所得的各个周期时间段内异常数据唯一,若是,完成周期划分;
对于离散型数据:
选取时间跨度最长的若干个相邻异常数据对应的时间作为周期初始值;
根据所述周期初始值将离散型数据进行周期划分;
判断划分所得的各个周期时间段内,异常数据是否唯一,若否,取周期初始值的1/n重新进行划分直至划分所得的各个周期时间段内异常数据唯一,若是,完成周期划分;
其中:n为周期划分的次数。
6.根据权利要求1所述的基于数据驱动的机电设备寿命预测方法,其特征在于,所述对不同设备周期划分的结果进行周期组合得到训练集以及测试集,包括:
对同一型号的不同设备的同一参数,判断各设备的异常数据在时间轴上是否存在重叠,若是,将重叠的异常数据的一半划分为训练子集一,另一半划分为测试子集一;
对于非重叠部分的异常数据,根据其在时间轴上的先后顺序,奇数划分为训练子集二,偶数划分为测试子集二;
对于非异常数据,根据其在时间轴上的先后顺序,奇数划分为训练子集三,偶数划分为测试子集三;
将训练子集一、训练子集二以及训练子集三进行组合得到训练集;
将测试子集一、测试子集二以及测试子集三进行组合得到测试集。
7.根据权利要求1所述的基于数据驱动的机电设备寿命预测方法,其特征在于,所述数据驱动模型选自神经网络模型、ELM算法、支持向量机以及BK模型中的一种。
8.一种基于数据驱动的机电设备寿命预测系统,其特征在于,所述基于数据驱动的机电设备寿命预测系统包括:
数据采集装置,所述数据采集装置与各设备连接,用于各设备运行参数的实时采集;以及
计算机设备,所述计算机设备与所述数据采集装置连接,用于执行如权利要求1-7任意一项所述的基于数据驱动的机电设备寿命预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210687754.3A CN114781278B (zh) | 2022-06-17 | 2022-06-17 | 一种基于数据驱动的机电设备寿命预测方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210687754.3A CN114781278B (zh) | 2022-06-17 | 2022-06-17 | 一种基于数据驱动的机电设备寿命预测方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114781278A CN114781278A (zh) | 2022-07-22 |
CN114781278B true CN114781278B (zh) | 2022-09-27 |
Family
ID=82422054
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210687754.3A Active CN114781278B (zh) | 2022-06-17 | 2022-06-17 | 一种基于数据驱动的机电设备寿命预测方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114781278B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101894185A (zh) * | 2010-06-29 | 2010-11-24 | 北京航空航天大学 | 一种基于动态双极mpnn的小样本数据对象的寿命预测方法 |
CN106201849A (zh) * | 2016-07-01 | 2016-12-07 | 南京航空航天大学 | 一种有限数据驱动的长寿命部件余寿预测方法 |
CN108241901A (zh) * | 2016-12-27 | 2018-07-03 | 全球能源互联网研究院 | 一种基于预测数据的变压器预警评估方法及装置 |
CN111382546A (zh) * | 2020-04-07 | 2020-07-07 | 东方电气集团东方电机有限公司 | 一种基于支持向量机建模对发电机绝缘系统进行寿命预测的方法 |
CN111523226A (zh) * | 2020-04-21 | 2020-08-11 | 南京工程学院 | 一种基于优化多层残差bp深度网络的蓄电池寿命预测方法 |
CN112613646A (zh) * | 2020-12-08 | 2021-04-06 | 上海交通大学烟台信息技术研究院 | 一种基于多维数据融合的设备状态预测方法及系统 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103344923B (zh) * | 2013-08-01 | 2015-07-08 | 哈尔滨工业大学 | 基于ekf方法和nsdp-ar模型融合型锂离子电池循环寿命预测方法 |
CN104091056B (zh) * | 2014-06-27 | 2018-04-17 | 上海网正信息科技有限公司 | 一种实验室设备使用寿命预测系统和方法 |
CN106778010B (zh) * | 2016-12-29 | 2020-01-14 | 中铁十八局集团隧道工程有限公司 | 基于数据驱动支持向量回归机的tbm刀具寿命预测方法 |
CN108008893A (zh) * | 2017-12-01 | 2018-05-08 | 北京小米移动软件有限公司 | 图像处理方法及装置 |
CN108829933B (zh) * | 2018-05-22 | 2023-04-07 | 北京天泽智云科技有限公司 | 一种半导体制造设备的预测性维护与健康管理的方法 |
CN109740634A (zh) * | 2018-12-11 | 2019-05-10 | 中科恒运股份有限公司 | 分类模型训练方法和终端设备 |
CN111382542B (zh) * | 2020-02-26 | 2024-02-02 | 长安大学 | 一种面向全寿命周期的公路机电设备寿命预测系统 |
CN112223290B (zh) * | 2020-10-21 | 2021-11-05 | 哈工大机器人(合肥)国际创新研究院 | 一种关节空间连续点轨迹过渡方法及装置 |
CN114490797A (zh) * | 2020-10-26 | 2022-05-13 | 北京机械设备研究所 | 一种时间序列的定性趋势分析方法和装置 |
CN112765772B (zh) * | 2020-12-25 | 2022-11-04 | 武汉理工大学 | 一种基于数据驱动的动力电池剩余寿命预测方法 |
CN113449463A (zh) * | 2021-06-09 | 2021-09-28 | 重庆锦禹云能源科技有限公司 | 一种基于lstm-dnn的设备寿命预测方法及装置 |
CN113888351A (zh) * | 2021-09-26 | 2022-01-04 | 华能酒泉风电有限责任公司 | 光伏系统的功率预测方法、装置及电子设备 |
-
2022
- 2022-06-17 CN CN202210687754.3A patent/CN114781278B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101894185A (zh) * | 2010-06-29 | 2010-11-24 | 北京航空航天大学 | 一种基于动态双极mpnn的小样本数据对象的寿命预测方法 |
CN106201849A (zh) * | 2016-07-01 | 2016-12-07 | 南京航空航天大学 | 一种有限数据驱动的长寿命部件余寿预测方法 |
CN108241901A (zh) * | 2016-12-27 | 2018-07-03 | 全球能源互联网研究院 | 一种基于预测数据的变压器预警评估方法及装置 |
CN111382546A (zh) * | 2020-04-07 | 2020-07-07 | 东方电气集团东方电机有限公司 | 一种基于支持向量机建模对发电机绝缘系统进行寿命预测的方法 |
CN111523226A (zh) * | 2020-04-21 | 2020-08-11 | 南京工程学院 | 一种基于优化多层残差bp深度网络的蓄电池寿命预测方法 |
CN112613646A (zh) * | 2020-12-08 | 2021-04-06 | 上海交通大学烟台信息技术研究院 | 一种基于多维数据融合的设备状态预测方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN114781278A (zh) | 2022-07-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Calonico et al. | Optimal data-driven regression discontinuity plots | |
CN1881218A (zh) | 聚类装置和聚类方法 | |
Zheng et al. | Joint optimization of lot sizing and condition-based maintenance for a production system using the proportional hazards model | |
CN111325159A (zh) | 故障诊断方法、装置、计算机设备和存储介质 | |
CN108763305A (zh) | 数据特征提取的方法、装置、计算机设备和存储介质 | |
CN114553681B (zh) | 设备状态异常检测方法、装置和计算机设备 | |
CN110866682B (zh) | 基于历史数据的地下电缆预警方法和装置 | |
CN114781278B (zh) | 一种基于数据驱动的机电设备寿命预测方法及系统 | |
CN113110961B (zh) | 设备异常检测方法、装置、计算机设备及可读存储介质 | |
Mao et al. | Tensor representation-based transferability analytics and selective transfer learning of prognostic knowledge for remaining useful life prediction across machines | |
CN108764553B (zh) | 用户规模预测方法、装置及计算机设备 | |
JP7367196B2 (ja) | レジーム・シフトの識別及び分析のための方法及びシステム | |
CN113282876B (zh) | 异常检测中一维时间序列数据生成方法、装置和设备 | |
CN112445842A (zh) | 一种基于时间序列数据的异常值检测方法和系统 | |
CN109767263A (zh) | 营收数据预测方法、装置、计算机设备和存储介质 | |
CN112859192A (zh) | 岩心饱和度预测模型构建方法与岩心饱和度预测方法 | |
CN114676868A (zh) | 物流货量预测方法、装置、计算机设备和存储介质 | |
CN112884052A (zh) | 结构模态参数提取方法、装置、计算机设备及存储介质 | |
CN111125918A (zh) | 基于相似寿命模型和相似寿命的复杂产品可靠性评定方法 | |
CN112948512A (zh) | 位置数据划分方法、装置、计算机设备和存储介质 | |
US20140222817A1 (en) | System and method for grouping segments of data sequences into clusters | |
CN112601074B (zh) | 评价编码器的方法、装置、计算机设备和存储介质 | |
CN110866638A (zh) | 交通量预测模型构建方法、装置、计算机设备和存储介质 | |
CN110795255A (zh) | 数据批量值调整方法、装置、可读存储介质和设备 | |
CN113537323B (zh) | 一种基于lstm神经网络的室内轨迹误差评估方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |