CN112001234A - 一种基于仿射不变度量的旋转机械采样数据聚类方法 - Google Patents

一种基于仿射不变度量的旋转机械采样数据聚类方法 Download PDF

Info

Publication number
CN112001234A
CN112001234A CN202010667235.1A CN202010667235A CN112001234A CN 112001234 A CN112001234 A CN 112001234A CN 202010667235 A CN202010667235 A CN 202010667235A CN 112001234 A CN112001234 A CN 112001234A
Authority
CN
China
Prior art keywords
data
time series
clustering
time
time sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010667235.1A
Other languages
English (en)
Other versions
CN112001234B (zh
Inventor
胡绍林
张清华
王世华
黄晓敏
文成林
谢国
梁家辉
苏乃权
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong University of Petrochemical Technology
Original Assignee
Guangdong University of Petrochemical Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong University of Petrochemical Technology filed Critical Guangdong University of Petrochemical Technology
Priority to CN202010667235.1A priority Critical patent/CN112001234B/zh
Publication of CN112001234A publication Critical patent/CN112001234A/zh
Application granted granted Critical
Publication of CN112001234B publication Critical patent/CN112001234B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/08Feature extraction
    • G06F2218/10Feature extraction by analysing the shape of a waveform, e.g. extracting parameters relating to peaks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/12Classification; Matching

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Signal Processing (AREA)
  • Testing Of Devices, Machine Parts, Or Other Structures Thereof (AREA)

Abstract

本发明公开了一种基于仿射不变度量的旋转机械采样数据聚类方法,通过对数据时间序列进行建模得到时间序列模型,计算时间序列模型中两个时间序列片段的相似性度量对数据时间序列进行建模得到时间序列模型;计算时间序列模型中两个时间序列片段的相似性度量;构建相似度量中位数模型;通过相似度量中位数模型对数据时间序列进行聚类;能够在有效地将通过旋转机械传感器采集的石化机组的数据时间序列,对数据时间序列的仿射变换具有不变性,不会因为时间序列的平移或伸缩而改变度量大小,称为形态相似度量,具有良好容错能力,不会因为野值数据而导致分类错误,其聚类结果的聚类簇具有较好的鲁棒性,本发明属于数据分析技术领域。

Description

一种基于仿射不变度量的旋转机械采样数据聚类方法
技术领域
本发明涉及复杂系统控制工程、数据分析技术领域,具体涉及一种基于仿射不变度量的旋转机械采样数据聚类方法。
背景技术
复杂系统控制工程领域中,不同传感器的采样时序数据在形态变化上大多具有相似性,将形态相似序列有效地聚类成一类,有益于对复杂系统运行过程的监控以及检测相似序列的异常变化。随着石化机组日益趋向大型化和智能化,机组的组成和结构越来越复杂,且常处于高温高压或低温真空状态高速运行,一旦机组发生故障,将给生产厂家带来巨大经济损失,严重威胁着人身安全,因此需要提高其数据聚类的精度和鲁棒性,以减少后续处理的误差和风险。
在石化机组的旋转机械传感器采样数据的数据聚类处理过程中,由振动波形数据可以到很多指标时间序列,如均值指标、波形指标、脉冲指标、裕度指标、峭度指标和峰值指标等构成的时间序列。在进行这些时间序列分析中,最简单且使用最广泛的措施是动态时间规整(DTW)算法:将两个序列在某些时点上压缩,实现两个序列之间“距离”最小。但是,DTW算法存在计算量为O(N2)级,计算复杂度限制了其在大数据序列分析中实际应用,另外,DTW算法缺乏对时间平移不变性和空间伸缩不变性,导致两个形状相似的时间序列可能被判断为不同。
发明内容
本发明的目的在于提出一种基于仿射不变度量的旋转机械采样数据聚类方法,以解决现有技术中所存在的一个或多个技术问题,至少提供一种有益的选择或创造条件。
本发明提供一种基于仿射不变度量的旋转机械采样数据聚类方法,基于石化机组运行过程中旋转机械传感器采集数据的问题,基于形态相似度量,建立一种基于形态“种子”的大数据聚类算法,通过对数据时间序列进行建模得到时间序列模型,计算时间序列模型中两个时间序列片段的相似性度量对数据时间序列进行建模得到时间序列模型;计算时间序列模型中两个时间序列片段的相似性度量;构建相似度量中位数模型,用于计算数据时间序列中任一序列与子集合的相似度量中位数;通过相似度量中位数模型对数据时间序列进行聚类。
本发明的目的是针对上述问题,提供一种基于仿射不变度量的旋转机械采样数据聚类方法,具体包括以下步骤:
S100,采集旋转机械传感器的数据并采样得到数据时间序列;
进一步地,在S100中,所述旋转机械传感器包括旋转传感器、电涡流传感器、激光振动传感器、旋转扭矩传感器,用于采集石化机组的旋转扭矩、电涡流、振动中任意一种物理量数据,石化机组包括驱动机、从动机、电动机、汽轮机、烟气轮机、燃气轮机、发电机、压气机和泵中任意一种或多种旋转机械设备,旋转机械传感器设置于石化机组的转轴上。
进一步地,在S100中,所述数据时间序列包括均值指标时间序列、波形指标时间序列、脉冲指标时间序列、裕度指标时间序列、峭度指标时间序列和峰值指标时间序列,数据时间序列为旋转机械传感器按照时序采集的数据序列构成的时序数据(以下数据时间序列也简称为时间序列)。
S200,对数据时间序列进行建模得到时间序列模型;
进一步地,在S200中,对数据时间序列进行建模得到时间序列模型的方法包括以下步骤:
S201:考虑到实际采样数据时间序列不可避免地包含误差,数据时间序列中两个形态相似的时间序列片段可以建模为:
y1(ti)=a+by2(ti)+ε(ti) (ti=t0+ih,i=1,2,3,…) (1);
其中,y1(ti)、y2(ti)表示数据时间序列中与ti时间点对应的数值,时间序列片段由y1(ti)、y2(ti)构成;a和b是两个待定常数;t0指的是初始时间点,ti指的是第i个时间点;ε(ti)表示非模型部分的随机误差;h表示时间跨度;时间序列片段指的是数据时间序列中的一个连续子序列;
S202:确定参数a和b:对于满足式(1)的任意两个数据时间序列S1、S2,用最小二乘法
Figure BDA0002580942340000021
找到(a,b)来最小数据时间序列S1和S2之间的差,这两个参数确定如下:
Figure BDA0002580942340000022
其中,y1和y2是y1(ti)、y2(ti)的缩写;
Figure BDA0002580942340000023
表示是的f(a,b)取得最小值的参数a,b;S1和S2也是y1(ti)、y2(ti)的缩写;式中,算子
Figure BDA0002580942340000024
为均值算子,表示对应时间序列片段的数据平均值,t表示时间;
S300,计算时间序列模型中两个时间序列片段的相似性度量;
进一步地,在S300中,计算时间序列模型中两个时间序列片段的相似性度量的方法为:利用式(3)构造两个时间序列片段的相似性度量Ds(y2,y1):
Figure BDA0002580942340000031
其中,
Figure BDA0002580942340000032
指的是时间序列长度为s到n的y1和y2两个时间序列片段按公式(1)得到的a和b的值;s为时间序列片段的开始时间点,n为时间序列片段的结束时间点,相似性度量D(Ds(y2,y1))对仿射变换具有不变性,不会因为时间序列的平移或伸缩而改变度量大小,称为形态相似度量;基于形态相似度量,建立一种基于形态“种子”的大数据聚类算法,具有良好容错能力,不会因为野值数据(野值点)而导致分类错误;
S400,构建相似度量中位数模型,用于计算数据时间序列中任一序列与子集合的相似度量中位数;
进一步地,在S400中,构建相似度量中位数模型的方法包括以下步骤:
S401:建立一组可扩展的种子形态或种子模式集合;建立几个典型的形态模式或种子,建立定值、单调递增或单调递减、正弦波、余弦波、二次抛物线中任意一种的多个形态模式或多个种子集合作为种子选集,假定种子选集中包含k个典型形态序列(种子集合),记为
Figure BDA0002580942340000033
其中,
Figure BDA0002580942340000034
是表示第1个时间序列;
Figure BDA0002580942340000035
是表示第k个时间序列;
S402:计算数据时间序列中两个时间序列片段的相似度量中位数的最大值MD和最小值LD:计算任两个种子集合
Figure BDA0002580942340000036
Figure BDA0002580942340000037
全部序列对的相似度量中位数:
Figure BDA0002580942340000038
其中,
Figure BDA0002580942340000039
是中值算子,求相似性度量Ds(y2,y1)的中位数(中值);
计算
Figure BDA00025809423400000310
中所有任两个种子集合
Figure BDA00025809423400000311
Figure BDA00025809423400000312
全部序列对的相似度量中位数的最大值和最小值:
Figure BDA00025809423400000313
其中,函数max用于求集合中元素的最大值,min函数用于求集合中元素的最小值。
S403:构建计算任一数据时间序列zi与子集合的相似度量中位数的相似度量中位数模型KS(zi),任取时序数据集合中的数据时间序列zi,计算zi与种子集
Figure BDA0002580942340000041
的相似度量中位数:
Figure BDA0002580942340000042
计算数据时间序列zi
Figure BDA0002580942340000043
中每个种子集相似度量中位数的最小值的相似度量中位数模型为:
Figure BDA0002580942340000044
S500,通过相似度量中位数模型对数据时间序列进行聚类;
进一步地,在S500中,通过相似度量中位数模型对数据时间序列进行聚类的方法为:
S501,令y为数据时间序列,将y代入KS(zi)得到KS(y);
S502,当KS(y)≥MD,确定满足
Figure BDA0002580942340000045
的两个种子集合
Figure BDA0002580942340000046
Figure BDA0002580942340000047
合并最邻近的种子集合
Figure BDA0002580942340000048
Figure BDA0002580942340000049
为新的
Figure BDA00025809423400000410
Figure BDA00025809423400000411
并构造种子集合
Figure BDA00025809423400000412
实现种子集合的更新;
S503,当KS(y)<MD,确定满足
Figure BDA00025809423400000413
的种子集合
Figure BDA00025809423400000414
将数据时间序列y并入种子集合
Figure BDA00025809423400000415
Figure BDA00025809423400000416
迭代执行步骤S502~S503,直到完成全部数据时间序列的聚类,最终得到数据时间序列的多个聚类类别的聚类簇
Figure BDA00025809423400000417
和聚类簇
Figure BDA00025809423400000418
本发明的有益效果为:本发明公开了一种基于仿射不变度量的旋转机械采样数据聚类方法,能够在有效地将通过旋转机械传感器采集的石化机组的数据时间序列,对数据时间序列的仿射变换具有不变性,不会因为时间序列的平移或伸缩而改变度量大小,称为形态相似度量,具有良好容错能力,不会因为野值数据(野值点)而导致分类错误,其聚类结果的聚类簇具有较好的鲁棒性。
附图说明
通过对结合附图所示出的实施方式进行详细说明,本发明的上述以及其他特征将更加明显,本发明附图中相同的参考标号表示相同或相似的元素,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图,在附图中:
图1所示为本发明的一种基于仿射不变度量的旋转机械采样数据聚类方法的流程图。
具体实施方式
以下将结合实施例和附图对本发明的构思、具体结构及产生的技术效果进行清楚、完整的描述,以充分地理解本发明的目的、方案和效果。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
如图1所示为根据本发明的一种基于仿射不变度量的旋转机械采样数据聚类方法的流程图,下面结合图1来阐述根据本发明的实施方式的方法。
本发明提出一种基于仿射不变度量的旋转机械采样数据聚类方法,具体包括以下步骤:
S100,通过旋转机械传感器采集石化机组的旋转扭矩数据并采样得到数据时间序列;
进一步地,在S100中,所述旋转机械传感器包括旋转传感器、电涡流传感器、激光振动传感器、旋转扭矩传感器,用于采集石化机组的旋转扭矩、电涡流、振动中任意一种物理量数据。
进一步地,在S100中,所述数据时间序列包括均值指标时间序列、波形指标时间序列、脉冲指标时间序列、裕度指标时间序列、峭度指标时间序列和峰值指标时间序列,数据时间序列为旋转机械传感器按照时序采集的数据序列构成的时序数据。
S200,对数据时间序列进行建模得到时间序列模型;
进一步地,在S200中,对数据时间序列进行建模得到时间序列模型的方法包括以下步骤:
S201:考虑到实际采样数据时间序列不可避免地包含误差,数据时间序列中两个形态相似的时间序列片段可以建模为:
y1(ti)=a+by2(ti)+ε(ti) (ti=t0+ih,i=1,2,3,…) (1);
其中,y1(ti)、y2(ti)表示数据时间序列中与ti时间点对应的数值,时间序列片段由y1(ti)、y2(ti)构成,一般而言y1(ti)、y2(ti)构成的时间序列片段长度相等;a和b是两个待定常数;t0指的是初始时间点,ti指的是第i个时间点;ε(ti)表示非模型部分的随机误差;h表示时间跨度;时间序列片段指的是数据时间序列中的一个连续子序列;
S202:确定参数a和b:对于满足式(1)的任意两个数据时间序列S1、S2,用最小二乘法
Figure BDA0002580942340000051
找到(a,b)来最小数据时间序列S1和S2之间的差,这两个参数确定如下:
Figure BDA0002580942340000052
其中,y1和y2是y1(ti)、y2(ti)的缩写;
Figure BDA0002580942340000053
表示是的f(a,b)取得最小值的参数a,b;S1和S2就是y1(ti)、y2(ti);式中,算子
Figure BDA0002580942340000061
为均值算子,表示对应时间序列片段的数据平均值;时间序列片段指的是数据时间序列中的一个连续子序列,t表示时间;
S300,计算时间序列模型中两个时间序列片段的相似性度量;
进一步地,在S300中,计算时间序列模型中两个时间序列片段的相似性度量的方法为:利用式(3)构造两个时间序列片段的相似性度量Ds(y2,y1):
Figure BDA0002580942340000062
其中,
Figure BDA0002580942340000063
指的是时间序列长度为s到n的y1和y2两个时间序列片段按公式(1)得到的a和b的值,
Figure BDA0002580942340000064
也能直接记为a和b;s为时间序列片段的开始时间点,n为时间序列片段的结束时间点,相似性度量D(Ds(y2,y1))对仿射变换具有不变性,不会因为时间序列的平移或伸缩而改变度量大小,称为形态相似度量;基于形态相似度量,建立一种基于形态“种子”的大数据聚类算法,具有良好容错能力,不会因为野值数据而导致分类错误;
S400,构建相似度量中位数模型,用于计算数据时间序列中任一序列与子集合的相似度量中位数;
进一步地,在S400中,构建相似度量中位数模型的方法包括以下步骤:
S401:建立一组可扩展的种子形态或种子模式集合;建立几个典型的形态模式或种子,如定值、单调递增或单调递减、正弦波、余弦波、二次抛物线等的集合作为种子选集,假定该种子选集中包含k个典型形态序列(种子集合),记为
Figure BDA0002580942340000065
其中,
Figure BDA0002580942340000066
是表示第1个时间序列;
Figure BDA0002580942340000067
是表示第k个时间序列;
S402:计算数据时间序列中两个时间序列片段的相似度量中位数的最大值MD和最小值LD:计算任两个种子集合
Figure BDA0002580942340000068
Figure BDA0002580942340000069
全部序列对的相似度量中位数:
Figure BDA00025809423400000610
其中,
Figure BDA00025809423400000611
是中值算子,求相似性度量Ds(y2,y1)的中位数(中值);
计算
Figure BDA00025809423400000612
中所有任两个种子集合
Figure BDA00025809423400000613
Figure BDA00025809423400000614
全部序列对的相似度量中位数的最大值和最小值:
Figure BDA0002580942340000071
其中,函数max用于求集合中元素的最大值,min函数用于求集合中元素的最小值。
S403:构建计算任一数据时间序列y与子集合的相似度量中位数的相似度量中位数模型KS(y),任取时序数据集合中的数据时间序列y,计算y与种子集
Figure BDA0002580942340000072
的相似度量中位数:
Figure BDA0002580942340000073
计算数据时间序列y与
Figure BDA0002580942340000074
中每个种子集相似度量中位数的最小值的相似度量中位数模型为:
Figure BDA0002580942340000075
S500,通过相似度量中位数模型对数据时间序列进行聚类;
进一步地,在S500中,通过相似度量中位数模型对数据时间序列进行聚类的方法为:
当KS(y)≥MD,确定满足
Figure BDA0002580942340000076
的两个种子集合
Figure BDA0002580942340000077
Figure BDA0002580942340000078
合并最邻近的种子集合
Figure BDA0002580942340000079
Figure BDA00025809423400000710
为新的种子集合
Figure BDA00025809423400000711
Figure BDA00025809423400000712
并构造种子集合
Figure BDA00025809423400000713
实现种子集合的更新;
当KS(y)<MD,确定满足
Figure BDA00025809423400000714
的种子集合
Figure BDA00025809423400000715
将数据时间序列y并入种子集合
Figure BDA00025809423400000716
Figure BDA00025809423400000717
继续上述过程,直到完成全部数据时间序列的聚类,最终得到数据时间序列的多个聚类类别的聚类簇
Figure BDA00025809423400000718
和聚类簇
Figure BDA00025809423400000719
(数据时间序列的集合)。
优选地,实施例为:首先设置聚类数k,并建立一组可扩展的包含k个分典型形态序列的种子选集
Figure BDA00025809423400000720
采用式(4)计算类间相似度量。然后任取时序数据集合中的时间序列y,采用式(7)计算时间序列y与
Figure BDA00025809423400000721
中每个种子集相似度量中位数的最小值Ks(y)。接着比较MD和Ks(y)的大小:如果KS(y)≥MD,一定存在两个种子集合
Figure BDA00025809423400000722
Figure BDA00025809423400000723
使得
Figure BDA00025809423400000724
合并最邻近的种子集合
Figure BDA00025809423400000725
Figure BDA00025809423400000726
为新的种子集合
Figure BDA00025809423400000727
Figure BDA00025809423400000728
并构造种子集合
Figure BDA00025809423400000729
实现种子集合的更新;如果KS(y)<MD,一定存在至少一个种子集合
Figure BDA00025809423400000730
使得
Figure BDA00025809423400000731
则将时间序列y并入种子集合
Figure BDA00025809423400000732
Figure BDA00025809423400000733
然后判断是否完成全部序列的聚类,如果继续,则取新的时间序列y,重复上述步骤,直到完成所有序列的分类。
参照图1,其为本发明提供的一种基于仿射不变度量的旋转机械采样数据聚类方法的流程图,对M个采样时序数据片段进行形态聚类,如果两次聚类结果相同,即
Figure BDA0002580942340000081
Figure BDA0002580942340000082
则可以判定系统从时刻tn延续到时刻tN的变化过程发生了状态异常变化,实现对有相似特征的不同对象异常变化检测,tn指的是是第n个时间点,tN指的是第N个时间点。
尽管本公开的描述已经相当详尽且特别对几个所述实施例进行了描述,但其并非旨在局限于任何这些细节或实施例或任何特殊实施例,从而有效地涵盖本公开的预定范围。此外,上文以发明人可预见的实施例对本公开进行描述,其目的是为了提供有用的描述,而那些目前尚未预见的对本公开的非实质性改动仍可代表本公开的等效改动。

Claims (7)

1.一种基于仿射不变度量的旋转机械采样数据聚类方法,其特征在于,所述方法包括以下步骤:
S100,通过旋转机械传感器采集数据并采样得到数据时间序列;
S200,对数据时间序列进行建模得到时间序列模型;
S300,计算时间序列模型中两个时间序列片段的相似性度量;
S400,构建相似度量中位数模型;
S500,通过相似度量中位数模型对数据时间序列进行聚类。
2.根据权利要求1所述的一种基于仿射不变度量的旋转机械采样数据聚类方法,其特征在于,在S100中,所述旋转机械传感器包括旋转传感器、电涡流传感器、激光振动传感器、旋转扭矩传感器,用于采集石化机组的旋转扭矩、电涡流、振动中任意一种物理量数据。
3.根据权利要求1所述的一种基于仿射不变度量的旋转机械采样数据聚类方法,其特征在于,在S100中,所述数据时间序列包括均值指标时间序列、波形指标时间序列、脉冲指标时间序列、裕度指标时间序列、峭度指标时间序列和峰值指标时间序列,数据时间序列为时序数据。
4.根据权利要求1所述的一种基于仿射不变度量的旋转机械采样数据聚类方法,其特征在于,在S200中,对数据时间序列进行建模得到时间序列模型的方法包括以下步骤:
S201:将数据时间序列中两个形态相似的时间序列片段建模为:
y1(ti)=a+by2(ti)+ε(ti)(ti=t0+ih,i=1,2,3,…) (1);
其中,y1(ti)、y2(ti)表示数据时间序列中与ti时间点对应的数值;a和b是两个待定常数;t0指的是初始时间点,ti指的是第i个时间点;ε(ti)表示非模型部分的随机误差;h表示时间跨度;
S202:确定参数a和b:对于满足式(1)的任意两个数据时间序列S1、S2,用最小二乘法
Figure FDA0002580942330000011
找到(a,b)来最小数据时间序列S1和S2之间的差,这两个参数确定如下:
Figure FDA0002580942330000012
其中,y1和y2是y1(ti)、y2(ti)的缩写;
Figure FDA0002580942330000013
表示是的f(a,b)取得最小值的参数a,b;S1和S2也是y1(ti)、y2(ti)的缩写;式中,算子
Figure FDA0002580942330000021
为均值算子,表示对应时间序列片段的数据平均值,t表示时间。
5.根据权利要求1所述的一种基于仿射不变度量的旋转机械采样数据聚类方法,其特征在于,在S300中,计算时间序列模型中两个时间序列片段的相似性度量的方法为:利用式(3)构造两个时间序列片段的相似性度量Ds(y2,y1):
Figure FDA0002580942330000022
其中,
Figure FDA0002580942330000023
指的是时间序列长度为s到n的y1和y2两个时间序列片段按公式(1)得到的a和b的值;s为时间序列片段的开始时间点,n为时间序列片段的结束时间点。
6.根据权利要求1所述的一种基于仿射不变度量的旋转机械采样数据聚类方法,其特征在于,在S400中,构建相似度量中位数模型的方法包括以下步骤:
S401:建立定值、单调递增或单调递减、正弦波、余弦波、二次抛物线中任意一种的多个形态模式或多个种子集合作为种子选集,假定种子选集中包含k个典型形态序列,记为
Figure FDA0002580942330000024
其中,
Figure FDA0002580942330000025
是表示第1个时间序列;
Figure FDA0002580942330000026
是表示第k个时间序列;
S402:计算数据时间序列中两个时间序列片段的相似度量中位数的最大值MD和最小值LD:计算任两个种子集合
Figure FDA0002580942330000027
Figure FDA0002580942330000028
全部序列对的相似度量中位数:
Figure FDA0002580942330000029
其中,
Figure FDA00025809423300000210
是中值算子,用于求相似性度量Ds(y2,y1)的中值;
计算
Figure FDA00025809423300000211
中所有任两个种子集合
Figure FDA00025809423300000212
Figure FDA00025809423300000213
全部序列对的相似度量中位数的最大值和最小值:
Figure FDA00025809423300000214
S403:构建计算任一数据时间序列zi与子集合的相似度量中位数的相似度量中位数模型KS(zi),任取时序数据集合中的数据时间序列zi,计算zi与种子集
Figure FDA00025809423300000215
的相似度量中位数:
Figure FDA00025809423300000216
计算数据时间序列zi
Figure FDA00025809423300000217
中每个种子集相似度量中位数的最小值的相似度量中位数模型为:
Figure FDA0002580942330000031
7.根据权利要求1所述的一种基于仿射不变度量的旋转机械采样数据聚类方法,其特征在于,在S500中,通过相似度量中位数模型对数据时间序列进行聚类的方法为:
S501,令y为数据时间序列,将y代入KS(zi)得到KS(y);
S502,当KS(y)≥MD,确定满足
Figure FDA0002580942330000032
的两个种子集合
Figure FDA0002580942330000033
Figure FDA0002580942330000034
合并最邻近的种子集合
Figure FDA0002580942330000035
Figure FDA0002580942330000036
为新的
Figure FDA0002580942330000037
Figure FDA0002580942330000038
并构造种子集合
Figure FDA0002580942330000039
实现种子集合的更新;
S503,当KS(y)<MD,确定满足
Figure FDA00025809423300000310
的种子集合
Figure FDA00025809423300000311
将数据时间序列y并入种子集合
Figure FDA00025809423300000312
Figure FDA00025809423300000313
迭代执行步骤S502~S503,直到完成全部数据时间序列的聚类,最终得到数据时间序列的多个聚类类别的聚类簇
Figure FDA00025809423300000314
和聚类簇
Figure FDA00025809423300000315
CN202010667235.1A 2020-07-13 2020-07-13 一种基于仿射不变度量的旋转机械采样数据聚类方法 Active CN112001234B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010667235.1A CN112001234B (zh) 2020-07-13 2020-07-13 一种基于仿射不变度量的旋转机械采样数据聚类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010667235.1A CN112001234B (zh) 2020-07-13 2020-07-13 一种基于仿射不变度量的旋转机械采样数据聚类方法

Publications (2)

Publication Number Publication Date
CN112001234A true CN112001234A (zh) 2020-11-27
CN112001234B CN112001234B (zh) 2023-07-21

Family

ID=73467981

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010667235.1A Active CN112001234B (zh) 2020-07-13 2020-07-13 一种基于仿射不变度量的旋转机械采样数据聚类方法

Country Status (1)

Country Link
CN (1) CN112001234B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160069776A1 (en) * 2014-09-09 2016-03-10 Siemens Aktiengesellschaft Pattern Search in Analysis of Underperformance of Gas Turbine
US20160140208A1 (en) * 2013-06-14 2016-05-19 Microsoft Technology Licensing, Llg Fast Grouping of Time Series
US20170365155A1 (en) * 2016-06-17 2017-12-21 Siemens Aktiengesellschaft Method and system for monitoring sensor data of rotating equipment
CN110659699A (zh) * 2019-09-30 2020-01-07 重庆大学 一种基于特征指标降维的分布式双层聚类分析方法
US20200082013A1 (en) * 2018-09-10 2020-03-12 Ciena Corporation Systems and methods for automated feature selection and pattern discovery of multi-variate time-series

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160140208A1 (en) * 2013-06-14 2016-05-19 Microsoft Technology Licensing, Llg Fast Grouping of Time Series
US20160069776A1 (en) * 2014-09-09 2016-03-10 Siemens Aktiengesellschaft Pattern Search in Analysis of Underperformance of Gas Turbine
US20170365155A1 (en) * 2016-06-17 2017-12-21 Siemens Aktiengesellschaft Method and system for monitoring sensor data of rotating equipment
US20200082013A1 (en) * 2018-09-10 2020-03-12 Ciena Corporation Systems and methods for automated feature selection and pattern discovery of multi-variate time-series
CN110659699A (zh) * 2019-09-30 2020-01-07 重庆大学 一种基于特征指标降维的分布式双层聚类分析方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
NAI-QUAN SU: "Fault Diagnosis of Rotating Machinery Based on Dimensionless Inde and Two-sample Distribution Test", 《JOURNAL OF COMPUTERS》 *

Also Published As

Publication number Publication date
CN112001234B (zh) 2023-07-21

Similar Documents

Publication Publication Date Title
Wang et al. A novel weighted sparse representation classification strategy based on dictionary learning for rotating machinery
Liu et al. Global geometric similarity scheme for feature selection in fault diagnosis
CN108959778B (zh) 一种基于退化模式一致性的航空发动机剩余寿命预测方法
CN110008253B (zh) 一种工业数据关联规则挖掘及异常工况预测方法
CN109883720B (zh) 用于辨识叶片多模态振动的叶端定时传感器的布置方法
CN110851963A (zh) 叶端定时传感器的机匣周向布置方法
JP2015075821A (ja) 状態診断方法および状態診断装置
Lyu et al. Remaining useful life estimation with multiple local similarities
CN101603854A (zh) 旋转机械启停阶段非平稳振动信号瞬时频率估计算法
CN112418306B (zh) 基于lstm-svm的燃气轮机压气机故障预警方法
CN118070477B (zh) 一种电力推进系统仿真可信度评估方法
CN111538960B (zh) 基于改进模糊c均值聚类的交流异步电机故障诊断方法
CN114755010A (zh) 一种旋转机械振动故障诊断方法及其系统
CN111881594A (zh) 一种核动力设备的非平稳信号状态监测方法及系统
CN115293274A (zh) 一种基于对抗交替型滑动窗口的时间序列突变点检测方法
CN116950917A (zh) 基于叶尖定时的大型离心压缩机叶片裂纹在线诊断方法
CN112001234B (zh) 一种基于仿射不变度量的旋转机械采样数据聚类方法
Li et al. A novel self-adaptive, multi-peak detection algorithm for blade tip clearance measurement based on a capacitive probe
CN115795999A (zh) 一种长期服役抽水蓄能机组性能异常预警方法
CN115526238A (zh) 一种基于全工况卷积特征记忆的引风机故障预警方法
Ippili et al. Deep learning-based mechanical fault detection and diagnosis of electric motors using directional characteristics of acoustic signals
Zhen et al. Electrical motor current signal analysis using a dynamic time warping method for fault diagnosis
CN117905651B (zh) 一种基于形变分析的结构监测方法
CN118391249B (zh) 大型水泵运行状态监测数据处理方法及装置
CN118568647B (zh) 基于数字孪生的工业设备故障智能检测方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant