发明内容
本发明提出了一种轴承状态监测振动异常数据检测方法,可搜寻异常样本,定位异常数据段,为轴承状态监测大数据质量保障、异常检测提供了新的思路。
本发明的技术方案如下:
一种轴承状态监测振动异常数据检测方法,包括对轴承振动加速度数据进行采集,本方案基于长短时空融合奇异峰模型,包括
步骤A1,将所采集的原始振动加速度数据作为样本;
步骤A2,以时空窗分割时间序列为子样本,提取每个子样本的内属值;
步骤A3,基于轮廓核原理提取主成分;
步骤A4,以多参膨胀系数最大为优化目标,获得最优参数;
步骤A5,获取多元基因序列,构建得分阈值;
步骤A6,得到溢出阈值边界的样本,作为异常样本,完成异常数据的采集。
作为本方案的进一步优化,所述步骤A1中包括:选取某段时间t,对该段时间t内的振动加速度进行取值,即x=[x1,x2,…xN],其中x为所选取时间段t内振动加速度信号,N为该段时间信号长度。
作为本方案的进一步优化,对时间段t内随机分割时域信号,
以时空窗对振动加速度集合x进行分割,取窗长度为w,将滑动窗口起始段设置在变量x的起始点x1处,形成数据长度为w的子数据段S1;
向末端移动时空窗窗口,以数据集的xγ为起点位置获得第下一个长度为w的子数据段Si,重复向末端移动时空窗窗口的操作,直到选取到子数据段Sn,得到子样本集合S=[S1,S2,…Sn],其中γ=w-τ+1,τ=μw,μ为分隔重叠率。
作为本方案的进一步优化,所述步骤A2还包括,从子样本中提取多维时空卷褶内属值,并把这些特征进行标准化处理,
用标准化操作对每个子样本的多维时空卷褶内属值,即IP值,进行标准化处理,即
,其中z
ij是第i(i=1,2,…n)个子样本的第j(j=1,2,…m)个内属值,
是第j个内属值的均值,b
ij为标准化后的IP值。
作为本方案的进一步优化,所述步骤A3中包括:
步骤A3-1,利用轮廓核原理,滤除特征峰刺的影响,进行特征融合,嵌入到奇异模型中,提取辐射主元;
步骤A3-2,执行开合吸收操作,根据信号特点,根据窗长台阶式搜索空间邻居个数,设置初始值及最大值,确定其增量比特,构造循环迭代硬阈值,满足条件时可自动退出当前开合吸收过程。
作为本方案的进一步优化,所述步骤A3-1包括,步骤A2中n个子样本,每个子样本有m维IP值,得到n*m样本数据矩阵
,其中
,0<i≤n,0<m≤15,求
的轮廓矩阵,并求轮廓矩阵的内属向量,将内数值按照大小顺序从上到下排列成矩阵,取前b行组成新的矩阵作为辐射主元,辐射主元中的每个子向量作为新的子样本。
作为本方案的进一步优化,所述步骤A3-2包括,
在初始窗长w1中,执行台阶式开合操作,具体包括,
计算在该窗长下空间邻居个数k的搜索范围,k表示任意选取步骤A3-1得到的辐射主元子样本,与该子样本距离最临近的k个辐射主元子样本:
k∈[kmin,kmax];
定义循环迭代硬阈值ε,
l为多元基因序列值,β代表循环迭代过程;
更新k值,当δ<ε时,跳出k循环层。
作为本方案的进一步优化,所述步骤A4包括,重复步骤A1-步骤A3,将原始数据进行滑动时空窗分割,在初始窗长为w1的基础上将时空窗的窗长增加,窗长增量比特值为wd,
更新窗长w,当超出最大窗长wmax时跳出w循环层;
其中wmin=w1, wmax=10*wmin;
比较获取最优的l值。
作为本方案的进一步优化,所述步骤A5中,根据数据对象距离和时空密度建立多元基因序列模型,从所述多元基因序列模型中获得多参膨胀系数,根据多参膨胀系数最大原则确定最优粒子,从而自适应获得最优多元基因序列l和得分阈值T。
作为本方案的进一步优化,所述步骤A6中,将所述多元基因序列值l与所述得分阈值T进行对比,超出得分阈值T的数据即判断为异常样本。
本发明的工作原理:
异常数据检测是旋转机械状态监测过程的重要组成部分,也是进行数据清洗、补偿、挖掘的前提,针对旋转机械振动监测数据存在异常问题,本发明提出了一种长短时空融合奇异峰(Long short spatiotemporal fusion singular peak,LSSFSP)模型的异常检测模型。
1.使用时空窗(space-timewindow)有交叉的将时间序列动态分割为不同长度的子样本信号;
2.然后从子样本中提取多维时空卷褶内属(Internal property)值,并把这些特征进行标准化处理,
3.再利用轮廓核(Contour kernel,Ck)原理,滤除特征峰刺的影响,进行特征融合,嵌入到奇异模型中,提取辐射主元;
4.计算LSSFSP模型异常得分值,在此过程中,根据信号特点,台阶式搜索窗长及空间邻居个数,设置初始值及最大值,确定其增量比特(Incremental bit),构造循环迭代硬阈值,满足条件时可自动退出当前开合吸收过程;
5.以奇异粒子飞行轨迹的多参膨胀系数(Multiparametric ExpansionCoefficient)最大为原则获取最优参数,自适应获取多元基因序列用以评价每个子样本的异常程度;
6.最后根据高斯分布(Gaussian distribution)的置信准则,软分配得分阈值,得分溢出边界阈值的样本认为异常样本,并映射到一维时间序列确定异常位置。
本发明的有益效果为,
可对旋转机械状态监测过程振动数据质量评价、异常段检测,减少了人为干预的影响,提高了自适应性。该模型可以量化片段异常程度,定位异常片段。为旋转机械非平稳非线性振动加速度数据异常检测提供了新的思路。
具体实施方式
下面将结合本发明实施例,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都涉及本发明保护的范围。
一种轴承状态监测振动异常数据检测方法,包括对轴承振动加速度数据进行采集,本方案基于长短时空融合奇异峰模型,如说明书附图1所示,包括
步骤A1,将所采集的原始振动加速度数据作为样本;
步骤A2,以时空窗分割时间序列为子样本,提取每个子样本的内属值;
步骤A3,基于轮廓核原理提取主成分;
步骤A4,以多参膨胀系数最大为优化目标,获得最优参数;
步骤A5,获取多元基因序列,构建得分阈值;
步骤A6,得到溢出阈值边界的样本,作为异常样本,完成异常数据的采集。
具体实施例,所述步骤A1中包括:选取某段时间t,对该段时间t内的振动加速度进行取值,即x=[x1,x2,…xN],其中x为所选取时间段t内振动加速度信号,N为该段时间信号长度。振动加速度x为一段采样时间内对应的离散数值,以向量方式存储。当出现尖峰时,表示存在异常冲击。
对时间段t内随机分割时域信号,时空窗定义为时间域上一段采样长度,可以以自由长度随机分割时域信号,保证时空窗长度小于t即可。以时空窗对振动加速度集合x进行分割,取窗长度为w,将滑动窗口起始段设置在变量x的起始点x1处,形成数据长度为w的子数据段S1;向末端移动时空窗窗口,以数据集的xγ为起点位置获得第下一个长度为w的子数据段Si,重复移动时空窗窗口的操作,直到选取到子数据段Sn,得到子样本集合S=[S1,S2,…Sn],其中γ=w-τ+1,τ=μw,分割重叠率为μ,分隔重叠率即为每次所选取的时空窗的窗长的重叠占比,即每相邻时空窗存在部分重叠,重叠率即为重叠的部分占窗长的比例。
例如,首先利用时空窗口采用数据分段的方式将时间序列x进行分离,窗长度为w,将滑动窗口左端放置在数据变量x的起点x1成1个数据长度为w的子数据段S1;移动窗口,以数据集的xγ为起点位置获得第二个长度为w的子数据段S2,第3段的起点为2(w-τ)+1,…,依次向后滑动最终获得n个长度为w子样本。
所述步骤A2还包括,从子样本中提取多维时空卷褶内属值,并把这些特征进行标准化处理,多维内属分量求解模型如下表所示:
表1 多维内属分量求解模型
在上述表格中的模型中,w为子样本S的长度。
取多维时空卷褶内属IP=[in1,in2,…,in15]。
用标准化操作对每个子样本的多维时空卷褶内属值,即IP值,进行标准化处理,即
,其中z
ij是第i(i=1,2,…n)个子样本的第j(j=1,2,…m)个内属值,
是第j个内属值的均值,b
ij为标准化后的IP值。
步骤A3中包括:
步骤A3-1,利用轮廓核原理,滤除特征峰刺的影响,进行特征融合,嵌入到奇异模型中,提取辐射主元;
轮廓核方法实际上是一种特征融合与降维方法,为了提取多维时空卷褶内属值的核心元素,作为辐射主元,基于进行样本异常距离判断。
轮廓核基本原理:
(1)将原始数据按列组成n行m列矩阵X;
(2)求出轮廓矩阵,
(3)求出轮廓矩阵的内属值及对应的内属向量
其中eij为第i个子样本的第j个内属向量;
(4)将内属值大小从上到下按行排列成矩阵,取前b行组成矩阵P(b一般取值选3);
(5)Y=PX即为压缩融合到b维后的数据。
在步骤A3-1中,将步骤A2中n个子样本,每个子样本有m维IP值,得到n*m样本数据矩阵
,其中
,0<i≤n,0<m≤15,m的数值与表1相符,每个m代表一个多维时空卷褶内属值的分量,求
的轮廓矩阵,并求轮廓矩阵的内属向量,将内属值按照大小顺序从上到下排列成矩阵,取前b(b<m即可)行组成新的矩阵作为辐射主元。
步骤A3-2,根据信号特点,台阶式搜索窗长及空间邻居个数,设置初始值及最大值,确定其增量比特,构造循环迭代硬阈值,满足条件时可自动退出当前开合吸收过程,在步骤A3-2中,
将原始数据进行滑动时空窗分割,设初始窗长为w1,窗长增量比特值为wd,
更新窗长,当超出最大窗长t时跳出w循环层;
其中wmin=w1, w1=500和wmax=10*wmin。w1的选取根据经验和实际每个窗长内数据量进行确定,w1一般选定为总长度的1/10,窗长越小,计算量越大,选取总窗长的1/10可以满足计算量和效果的折中。
在不同时空窗窗长下的计算过程中空间邻居个数k搜索范围:
k∈[kmin,kmax];
定义循环迭代硬阈值ε,
l为多元基因序列值,β代表循环迭代过程;
更新k值,当δ<ε时,跳出k循环层。β的循环迭代过程表示所在循环的次数,
其中k
min和k
max可以根据振动加速度采样人为设定,如设定k
min=5,k
max=30,k的增量比特值为1。
值也是根据实际情况人为设定的值一般设置
=0.1。在步骤A3-2中,更新k值,当δ<ε时,则更新k值前后的序列差异不再明显,此时应跳出k循环层。
所述步骤A5中,根据数据对象距离和时空密度建立多元基因序列模型,从所述多元基因序列模型中获得多参膨胀系数,根据多参膨胀系数最大原则确定最优粒子,从而自适应获得最优多元基因序列l和得分阈值T。奇异粒子代表空间中不同的参数组合,其飞行轨迹即为窗长w,空间邻居k搜索变化行踪,根据多参膨胀系数d最大原则确定最优粒子。从而自适应获得最优多元基因序列l。用以评价每个子样本的离群程度,并自适应确定异常值,超出得分阈值T的即为异常样本。
多元基因序列是LSSFSP模型中的异常得分衡量标准,具体计算如下:
首先,将两个数据对象p和o的距离记作d(p,o):
时空密度定义为:
其中Nk(p)为距离对象p空间距离最近的对象集合;
多元基因序列模型为:
多参膨胀系数d:
得分阈值:
T=3*std(l 1 ,l 2 ,…l n )
所述步骤A6中,将所述对象p的多元基因序列值l与所述得分阈值T进行对比,超出得分阈值T的数据即判断为异常样本。
附图中图2是轴承原始振动加速度中幅值数据,其中方框内为信号缺失的波段,图3是经过本方法处理后的得分值和子样本的关系图,中坐标代表得分值虚悬代表得分阈值T,图3中的尖峰与图2中的缺失数据相对应,即数据异常。
附图4为在 2-4秒内出现了幅值极大的毛刺情况,说明所采集的轴承加速度数据异常,图5中子样本10-20反应该段数据的异常评分,超出阈值T说明数据异常。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。