CN116756595B - 一种导电滑环故障数据采集监测方法 - Google Patents
一种导电滑环故障数据采集监测方法 Download PDFInfo
- Publication number
- CN116756595B CN116756595B CN202311061798.6A CN202311061798A CN116756595B CN 116756595 B CN116756595 B CN 116756595B CN 202311061798 A CN202311061798 A CN 202311061798A CN 116756595 B CN116756595 B CN 116756595B
- Authority
- CN
- China
- Prior art keywords
- cluster
- data
- split
- time series
- series data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 35
- 238000012544 monitoring process Methods 0.000 title claims abstract description 22
- 230000002159 abnormal effect Effects 0.000 claims abstract description 73
- 238000004458 analytical method Methods 0.000 claims abstract description 34
- 239000011159 matrix material Substances 0.000 claims abstract description 32
- 230000035772 mutation Effects 0.000 claims description 102
- 230000005856 abnormality Effects 0.000 claims description 25
- 238000001514 detection method Methods 0.000 claims description 5
- 238000012545 processing Methods 0.000 abstract description 4
- 238000004364 calculation method Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000005299 abrasion Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01R—MEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
- G01R31/00—Arrangements for testing electric properties; Arrangements for locating electric faults; Arrangements for electrical testing characterised by what is being tested not provided for elsewhere
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2123/00—Data types
- G06F2123/02—Data types in the time domain, e.g. time-series data
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Mathematical Physics (AREA)
- Pure & Applied Mathematics (AREA)
- Computational Mathematics (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Algebra (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Operations Research (AREA)
- Probability & Statistics with Applications (AREA)
- Testing And Monitoring For Control Systems (AREA)
Abstract
本申请涉及数据处理领域,提供一种导电滑环故障数据采集监测方法,包括:采集导电滑环的参数,构建分析矩阵,所述分析矩阵包括多维参数的时间序列数据;利用迭代自组织聚类算法分别对每一时间序列数据进行聚类,得到每一时间序列数据每次迭代对应的初始聚类簇,并从每一时间序列数据对应的初始聚类簇中选出每一时间序列数据对应待分裂聚类簇;基于每一时间序列数据对应的待分裂聚类簇中数据异常情况和数据分布情况确定每一时间序列数据对应的待分裂聚类簇的分裂k值;基于所述分裂k值利用迭代自组织聚类算法分别对每一时间序列数据进行聚类,得到每一时间序列数据对应的最终聚类簇,基于所述最终聚类簇确定导电滑环故障数据。
Description
技术领域
本申请涉及数据处理领域,特别是涉及一种导电滑环故障数据采集监测方法。
背景技术
随着科学技术的进步,导电滑环的发展状况日益改善。目前,导电滑环被广泛应用于自动化、仪表以及电力等机电设备上。但是,不正当的使用导电滑环,使用过程中极易出现异常现象,如导电滑环上滑动电接触界面产生较大的磨损,极其影响导电滑环的性能以及使用寿命。
随着数据处理领域的快速发展,往往通过各种传感器对导电滑环相关数据进行采集,利用数据处理方式提取异常数据,来识别导电滑环的故障。比如,常见的迭代自组织聚类算法,该算法能够自适应聚类的数量,根据聚类结果中聚类簇之间的差异来对异常数据所在的簇进行识别。但是,该算法存在一定的局限性,往往容易陷入局部最优的处境,使得最终的故障监测结果不准确。
发明内容
本发明提供一种导电滑环故障数据采集监测方法,该方法能够提高数据聚类结果的准确度,从而提高故障监测结果的准确性。
第一方面,本申请提供一种导电滑环故障数据采集监测方法,包括:
采集导电滑环的参数,构建分析矩阵,所述分析矩阵包括多维参数的时间序列数据;
利用迭代自组织聚类算法分别对每一时间序列数据进行聚类,得到每一时间序列数据每次迭代对应的初始聚类簇,并从每一时间序列数据对应的初始聚类簇中选出每一时间序列数据对应待分裂聚类簇;
基于每一时间序列数据对应的待分裂聚类簇中数据异常情况和数据分布情况确定每一时间序列数据对应的待分裂聚类簇的分裂k值;
基于所述分裂k值利用迭代自组织聚类算法分别对每一时间序列数据进行聚类,得到每一时间序列数据对应的最终聚类簇,基于所述最终聚类簇确定导电滑环故障数据。
在一可选实施例中,从每一时间序列数据对应的初始聚类簇中选出每一时间序列数据对应待分裂聚类簇,包括:
如果所述初始聚类簇中标准差大于预设标准差上限,则确定所述初始聚类簇为待分裂聚类簇。
在一可选实施例中,基于每一时间序列数据对应的待分裂聚类簇中数据异常情况和数据分布情况确定每一时间序列数据对应的待分裂聚类簇的分裂k值,包括:
计算每一时间序列数据对应的待分裂聚类簇的异常突变率,所述异常突变率表征所述待分裂聚类簇中数据异常情况,所述异常突变率越大,所述待分裂聚类簇中包含异常数据的可能性越高;
计算每一时间序列数据对应的待分裂聚类簇的簇内差异指数,所述簇内差异指数表征所述待分裂聚类簇中数据分布情况,所述簇内差异指数越大,所述待分裂聚类簇中数据分布越离散;
计算每一时间序列数据对应的待分裂聚类簇的异常突变率和簇内差异指数的乘积,对计算的乘积进行归一化,从而得到每一时间序列数据对应的待分裂聚类簇的分裂k值。
在一可选实施例中,计算每一时间序列数据对应的待分裂聚类簇的异常突变率,包括:
确定当前时间序列数据中每一待分裂聚类簇对应的参考数据集;所述参考数据集中的数据为所述分析矩阵中除当前时间序列数据外其他时间序列数据中的数据,且所述参考数据集中数据的采集时间与所述待分裂聚类簇中数据的采集时间对应;
基于所述参考数据集确定当前时间序列数据的所述待分裂聚类簇的异常程度指数;
基于所述待分裂聚类簇中相邻两个数据点的数值之间的差异确定当前时间序列数据的所述待分裂聚类簇中每一数据点的突变程度,从而得到待分裂聚类簇对应的突变程度序列;
基于当前时间序列数据的所述待分裂聚类簇的异常程度指数和突变程度序列计算当前时间序列数据的所述待分裂聚类簇的异常突变率。
在一可选实施例中,基于所述参考数据集确定当前时间序列数据的所述待分裂聚类簇的异常程度指数,包括:
计算当前时间序列数据的所述待分裂聚类簇与所有参考数据集之间的dtw距离之和;
计算当前时间序列数据的所述待分裂聚类簇的变异系数与dtw距离之和的乘积,计算得到的乘积为当前时间序列数据的所述待分裂聚类簇的异常程度指数。
在一可选实施例中,基于所述待分裂聚类簇中相邻两个数据点的数值之间的差异确定当前时间序列数据的所述待分裂聚类簇中每一数据点的突变程度,包括:
计算所述待分裂聚类簇中当前数据点与当前数据点相邻的数据点的数值之间的差异,将计算的差异与所述待分裂聚类簇中数据点的均值之间的比值作为所述待分裂聚类簇中当前数据点的突变程度。
在一可选实施例中,基于当前时间序列数据的所述待分裂聚类簇的异常程度指数和突变程度序列计算当前时间序列数据的所述待分裂聚类簇的异常突变率,包括:
利用突变点检测算法确定突变程度序列中的突变点;
基于当前时间序列数据的所述待分裂聚类簇的异常程度指数,和所述突变程度序列中每个数据点的突变程度与每个突变点的突变程度之间的差异之和之间的乘积确定当前时间序列数据的所述待分裂聚类簇的异常突变率。
在一可选实施例中,计算每一时间序列数据对应的待分裂聚类簇的簇内差异指数,包括:
对每一待分裂聚类簇进行聚类,得到所述待分裂聚类簇对应的类集;
基于所述待分裂聚类簇中不同类集中心之间的差异、不同类集内的均方差计算每一时间序列数据对应的待分裂聚类簇的簇内差异指数。
在一可选实施例中,其中,每一时间序列数据对应的待分裂聚类簇的簇内差异指数的计算方式为:
其中,表示第i维参数的时间序列数据中第j个待分裂聚类簇的簇内差异指数,G表示待分裂聚类簇的类集数目,/>和/>分别表示第i维参数的时间序列数据中第j个待分裂聚类簇中第h个、第r个类集内的数据均值,/>表示第i维参数的时间序列数据中第j个待分裂聚类簇中第h个、第r个类集中心之间的差异,/>表示第i维参数的时间序列数据中第j个待分裂聚类簇中第h个类集内的均方差,/>表示一种判断准则,当/>时,/>取值为1,当/>时,/>取值为0。
在一可选实施例中,基于所述最终聚类簇确定导电滑环故障数据,包括:
计算每一时间序列数据的最终聚类簇中每一待测聚类簇与除待测聚类簇之外的其余聚类簇之间的类间方差之和;
当计算的类间方差之和最大的待测聚类簇确定为异常数据聚类簇,所述异常数据聚类簇为导电滑环故障数据。
本申请的有益效果,区别于现有技术,本申请的导电滑环故障数据采集监测方法,包括:采集导电滑环的参数,构建分析矩阵,所述分析矩阵包括多维参数的时间序列数据;利用迭代自组织聚类算法分别对每一时间序列数据进行聚类,得到每一时间序列数据每次迭代对应的初始聚类簇,并从每一时间序列数据对应的初始聚类簇中选出每一时间序列数据对应待分裂聚类簇;基于每一时间序列数据对应的待分裂聚类簇中数据异常情况和数据分布情况确定每一时间序列数据对应的待分裂聚类簇的分裂k值;基于所述分裂k值利用迭代自组织聚类算法分别对每一时间序列数据进行聚类,得到每一时间序列数据对应的最终聚类簇,基于所述最终聚类簇确定导电滑环故障数据。该方法能够使分裂k值的选取更具完备性、更加合理,避免只考虑一方面情况而产生较大的误差,提高的分裂可靠性以及准确性,提高数据聚类结果的准确度,从而提高故障监测结果的准确性。
附图说明
图1为本发明导电滑环故障数据采集监测方法的一实施例的流程示意图;
图2为图1中步骤S13的一实施例的流程示意图;
图3为图2中步骤S21的一实施例的流程示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请的一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
下面结合附图和实施例对本申请进行详细的说明。
请参见图1,图1为本发明导电滑环故障数据采集监测方法的一实施例的流程示意图,具体包括:
步骤S11:采集导电滑环的参数,构建分析矩阵,所述分析矩阵包括多维参数的时间序列数据。
当导电滑环的滑动电接触界面摩擦磨损较为严重时,会造成巨大的损失,并且产生安全隐患。因此,本发明对导电滑环工作状态下的多维参数进行数据采集,通过异常检测方法提取异常故障数据,进而对导电滑环的故障数据进行实时地监测,防止危险事故的发生。
本发明利用多功能传感器对导电滑环运行中的相关数据进行数据采集,所述多功能传感器是由温度传感器、电流传感器以及电压传感器为一体的多功能传感器,所采集的数据参数分别为工作温度、工作电流以及工作电压。对导电滑环的故障数据参数有很多,实施者可以自行设定所需要的监测的导电滑环相关数据参数,包括但不限制工作温度、工作电流以及工作电压。本发明中所采集数据参数的个数记为m,数据序列的长度n,每隔t时刻对数据进行一次采集,其中m=3,n=500,t=2s。
至此,获得用于采集导电滑环故障数据的多维时间序列数据。根据所获多维时间序列数据,为避免不同维度量纲对数据分析产生的影响,在此对每一维度参数的时间序列数据进行归一化操作,并构造用于分析故障数据的分析矩阵,即:
式子中,A为分析矩阵,、/>和/>分别表示第1个、第2个和第3个数据参数在第n次采集时刻对应采集数据的归一化数据。在一具体实施例中,分析矩阵中,第一个参数可以为温度参数,第二个参数可以为电流参数,第三个参数可以为电压参数。
至此,获得用于提取导电滑环故障异常数据所用的分析矩阵。
步骤S12:利用迭代自组织聚类算法分别对每一时间序列数据进行聚类,得到每一时间序列数据每次迭代对应的初始聚类簇,并从每一时间序列数据对应的初始聚类簇中选出每一时间序列数据对应待分裂聚类簇。
传统的迭代自组织聚类需要对聚类簇进行分裂操作以及合并操作,以求达到全局最优的聚类效果。但是,分裂时k值的选择往往需要根据聚类簇的分布特征进行自适应,以求分裂的效果达到最好。本申请中,为了对故障数据进行监测,结合数据间的数据异常情况和数据分布情况,自适应聚类簇的分裂k值。
在此,为了对聚类簇的特征进行分析,需要先获取初始聚类簇。根据所获分析矩阵,将/>表示第i个参数的时间序列数据,并进行分类区分,其中/>为工作温度的时间序列数据,/>为工作电流的时间序列数据,/>为工作电压的时间序列数据。
由此,根据每行的时间序列数据,/>,利用迭代自组织聚类算法,将每行的时间序列数据/>作为输入,预期聚类数为10,最少样本数目为20,标准差上限为3,最小距离下限为1,每次迭代中最大允许合并次数为2,最大迭代次数为50,以此可以得到每次迭代的初始聚类簇。根据每次迭代过程中的初始聚类簇,通过簇内标准差是否大于既定标准差上限来判断每个聚类簇需要进行聚类簇的分裂操作,以此得到需要分裂的聚类簇。具体的,如果所述初始聚类簇中标准差大于预设标准差上限,则确定所述初始聚类簇为待分裂聚类簇。
步骤S13:基于每一时间序列数据对应的待分裂聚类簇中数据异常情况和数据分布情况确定每一时间序列数据对应的待分裂聚类簇的分裂k值。
具体的,请结合图2,步骤S13包括:
步骤S21:计算每一时间序列数据对应的待分裂聚类簇的异常突变率。
具体的所述异常突变率表征所述待分裂聚类簇中数据异常情况,所述异常突变率越大,所述待分裂聚类簇中包含异常数据的可能性越高。
为了对待分裂聚类簇的分裂k值进行改进,自适应每个待分裂聚类簇的分裂k值,需要对每个待分裂聚类簇的具体特征进行分析。在此,根据分裂k值取值不同所得到的分裂效果,即k值越大,所得到的分裂簇之间的差异越大;k值越小,所得到的分裂簇之间的差异越小。
在此,基于上述的分析,从每一维度的待分裂聚类簇出发进行分析,比如从温度时间序列数据出发,根据所得的待分裂聚类簇进行分析。在此,对待分裂聚类簇进行分析,从相似性的角度出发,当待分裂聚类簇中包含异常数据时,希望所得分裂簇之间的差异较大;当待分裂聚类簇中无异常数据时,希望所得分裂簇之间的差异较小。因为当导电滑环正常工作下,其采集数据无较大的起伏变化,则数据之间有较强的相似性;而当导电滑环运行中产生故障时,所对应的时刻的采集数据会产生较大的起伏变化,则导致数据之间的相似性减小。因此,本申请从相似性的角度分析待分裂聚类簇中数据异常情况。
在一实施例中,请结合图3,步骤S21具体包括:
步骤S31:确定当前时间序列数据中每一待分裂聚类簇对应的参考数据集。
具体的,所述参考数据集中的数据为所述分析矩阵中除当前时间序列数据外其他时间序列数据中的数据,且所述参考数据集中数据的采集时间与所述待分裂聚类簇中数据的采集时间对应。
以当前时间序列数据为温度时间序列数据为例进行说明。例如当前时间序列数据即温度时间序列数据中第j个待分裂聚类簇记为:
从电流时间序列数据中确定的参考数据集记为:
从电压时间序列数据中确定的参考数据集记为:
步骤S32:基于所述参考数据集确定当前时间序列数据的所述待分裂聚类簇的异常程度指数。
具体的,计算当前时间序列数据的所述待分裂聚类簇与所有参考数据集之间的dtw距离之和;计算当前时间序列数据的所述待分裂聚类簇的变异系数与dtw距离之和的乘积,计算得到的乘积为当前时间序列数据的所述待分裂聚类簇的异常程度指数。在一实施例中,当前时间序列数据的所述待分裂聚类簇的异常程度指数的计算公式为:
式子中,表示分析矩阵中第i维时间序列数据中第j个待分裂聚类簇的异常程度指数,/>为DTW距离函数,/>表示分析矩阵中第i维时间序列数据中第j个待分裂聚类簇的变异系数,/>表示参考数据集的数目,/>表示分析矩阵中第i维时间序列数据中第j个待分裂聚类簇,/>表示第b个参考数据集。其中,/>表示当前时间序列数据的所述待分裂聚类簇与所有参考数据集之间的dtw距离之和。
分析矩阵中第i维时间序列数据中第j个待分裂聚类簇的变异系数越大,说明该聚类簇的离散程度越大,一定程度上说明聚类簇内部数据之间的离散程度较大,则异常程度指数/>越大。第i维时间序列数据中第j个待分裂聚类簇与其对应的参考数据集之间的DTW距离/>越大,说明数据之间的相似性越小,由于当导电滑环运行中产生故障时,所对应的时刻的采集数据会产生较大的起伏变化,导致维度数据之间的相似性减小,则异常程度指数/>越大。
步骤S33:基于所述待分裂聚类簇中相邻两个数据点的数值之间的差异确定当前时间序列数据的所述待分裂聚类簇中每一数据点的突变程度,从而得到待分裂聚类簇对应的突变程度序列。
具体的,计算所述待分裂聚类簇中当前数据点与当前数据点相邻的数据点的数值之间的差异,将计算的差异与所述待分裂聚类簇中数据点的均值之间的比值作为所述待分裂聚类簇中当前数据点的突变程度。
在一实施例中,对每个待分裂聚类簇分析其是否包含异常数据,可以从每个待分裂聚类簇本身进行分析,当待分裂聚类簇包含异常数据时,其在异常数据所在的时刻,突变程度较大。在此,根据每个待分裂聚类簇序列,计算其每个数据点的突变程度,即:
式子中,以当前数据点为第q个数据点为例进行说明。表示分析矩阵中第i维时间序列数据中第j个待分裂聚类簇中第q个数据点的突变程度,/>表示分析矩阵中第i维时间序列数据中第j个待分裂聚类簇中的数据点的均值,/>和/>分别表示分析矩阵中第i维时间序列数据中第j个待分裂聚类簇序列中第(q+1)、第q个数据点的数值。
待分裂聚类簇序列中相邻两个数据点数值之间的差异越大,说明在该位置数据的突变程度较大,同时除以待分裂聚类簇中的数据点的均值,避免不同聚类簇之间量纲的影响,使每个数据点的突变程度都能反映数据突变的一般水平。由此,基于每个数据点的突变程度,可以得到每个待分裂聚类簇的突变程度序列,记为/>,即:
式子中,表示分析矩阵中第i维时间序列数据中第j个待分裂聚类簇的突变程度序列,p表示突变程度序列的长度,即突变程度序列中突变程度的数量。
步骤S34:基于当前时间序列数据的所述待分裂聚类簇的异常程度指数和突变程度序列计算当前时间序列数据的所述待分裂聚类簇的异常突变率。
具体的,利用突变点检测算法确定突变程度序列中的突变点。例如根据所得突变程度序列,利用Pettitt突变点检测算法,得到突变程度序列中的突变点。
基于当前时间序列数据的所述待分裂聚类簇的异常程度指数,和所述突变程度序列中每个数据点的突变程度与每个突变点的突变程度之间的差异之和之间的乘积确定当前时间序列数据的所述待分裂聚类簇的异常突变率。
在一具体实施例中,通过度量与突变点的相似性来度量待分裂聚类簇包含异常数据的可能性,因为异常数据会导致突变点较为异常,与数据整体的差异较大,即差异越大,越能体现待分裂聚类簇的异常情况。同时,结合上述计算的异常程度指数,计算每个待分裂聚类簇的异常突变率,即:
式子中,表示分析矩阵中第i维时间序列数据中第j个待分裂聚类簇的异常突变率,/>为归一化函数,/>表示分析矩阵中第i维时间序列数据中第j个待分裂聚类簇的异常程度指数,/>表示分析矩阵中第i维时间序列数据中第j个待分裂聚类簇的突变点数目,p表示分析矩阵中第i维时间序列数据中第j个待分裂聚类簇的突变程度序列中的长度,/>表示分析矩阵中第i维时间序列数据中第j个待分裂聚类簇序列的突变程度序列中第g个数据点的突变程度,/>表示分析矩阵中第i维时间序列数据中第j个待分裂聚类簇序列的突变程度序列中第c个突变点的突变程度。/>表示突变程度序列中每个数据点的突变程度与每个突变点的突变程度之间的差异之和。
待分裂聚类簇的异常程度指数越大,说明维度数据之间的相似度越低,即出现异常数据的可能性越大,则待分裂聚类簇的异常突变率/>越大,即待分裂聚类簇的内部差异越大。同时,每个突变程度与突变点所代表的突变程度之间的差异/>越大,说明该待分裂聚类簇内的数据异常程度越大,则待分裂聚类簇的异常突变率/>越大,即待分裂聚类簇的内部差异越大。
步骤S22:计算每一时间序列数据对应的待分裂聚类簇的簇内差异指数。
所述簇内差异指数表征所述待分裂聚类簇中数据分布情况,所述簇内差异指数越大,所述待分裂聚类簇中数据分布越离散。对每一待分裂聚类簇进行聚类,得到所述待分裂聚类簇对应的类集;基于所述待分裂聚类簇中不同类集中心之间的差异、不同类集内的均方差计算每一时间序列数据对应的待分裂聚类簇的簇内差异指数。
具体的,根据所得的每个待分裂聚类簇,为使待分裂聚类簇内的差异特征更加突出,在此利用k-means聚类算法,聚类数设置为6,对每个待分裂聚类簇进行聚类,将每个聚类结果划分为一个类,由此,可以得到待分裂聚类簇的6个类集。根据类集间差异以及类集内差异,计算每个待分裂聚类簇的簇内差异指数,即:
其中,表示第i维参数的时间序列数据中第j个待分裂聚类簇的簇内差异指数,G表示待分裂聚类簇的类集数目,/>和/>分别表示第i维参数的时间序列数据中第j个待分裂聚类簇中第h个、第r个类集内的数据均值,/>表示第i维参数的时间序列数据中第j个待分裂聚类簇中第h个、第r个类集中心之间的差异,/>表示第i维参数的时间序列数据中第j个待分裂聚类簇中第h个类集内的均方差,/>表示一种判断准则,当/>时,/>取值为1,当/>时,/>取值为0。
每个类集的数据均值一定程度上代表类集的中心位置,不同类集中心之间的差异越大,说明待分裂聚类簇内的差异程度越大,则簇内差异指数/>越大。每个类集内的均方差越大,说明类集的离散程度,一定程度上反映出待分裂聚类簇的离散程度较大,则簇内差异指数/>越大。
步骤S23:计算每一时间序列数据对应的待分裂聚类簇的异常突变率和簇内差异指数的乘积,对计算的乘积进行归一化,从而得到每一时间序列数据对应的待分裂聚类簇的分裂k值。
具体的,每一时间序列数据对应的待分裂聚类簇的分裂k值的计算方式为:
式子中,表示第i维参数的时间序列中第j个待分裂聚类簇的分裂k值,/>为归一化函数,/>表示第i维参数的时间序列中第j个待分裂聚类簇的异常突变率,/>表示第i维参数的时间序列中第j个待分裂聚类簇的簇内差异指数。
待分裂聚类簇的异常突变率越大,说明该待分裂聚类簇越有可能包含异常数据,由于异常数据与正常数据的差异较大,则分裂k值越大。同时,待分裂聚类簇的簇内差异指数/>越大,说明该待分裂聚类簇内部数据分布越离散,且类集中心的差异越大,则分裂k值越大。
步骤S14:基于所述分裂k值利用迭代自组织聚类算法分别对每一时间序列数据进行聚类,得到每一时间序列数据对应的最终聚类簇,基于所述最终聚类簇确定导电滑环故障数据。
根据既定参数:预期聚类数为10,最少样本数目为20,标准差上限为3,最小距离下限为1,每次迭代中最大允许合并次数为2,最大迭代次数为50,以及自适应的分裂k值,利用迭代自组织聚类算法对每一维度时间序列序列进行聚类,得到每一时间序列数据对应的最终聚类簇。
计算每一时间序列数据的最终聚类簇中每一待测聚类簇与除待测聚类簇之外的其余聚类簇之间的类间方差之和;当计算的类间方差之和最大的待测聚类簇确定为异常数据聚类簇,所述异常数据聚类簇为导电滑环故障数据。
具体的,根据上述对每一维度进行聚类得到的最终聚类,由于异常数据聚类簇与其余聚类簇有较大的差异,在此对每一维度时间序列进行异常数据聚类簇的提取。具体在每一维度内计算每个待测聚类簇与其余所有聚类簇的类间方差之和,当某一个待测聚类簇与其余所有聚类簇的类间方差之和最大时,判定该待测聚类簇为异常数据聚类簇。由此,得到每一维度序列中的异常数据聚类簇,即得到所有异常故障数据集合,异常预警模块对异常故障数据所处的采集时刻进行预警,维修员对导电滑环进行维修,确保导电滑环的安全性以及可用性。由此,完成导电滑环故障数据的采集监测方法。
本申请的方法,基于待分裂聚类簇外部特征以及内部特征,外部特征为维度间的相似性,计算异常程度指数,同时结合待分裂聚类簇中每个数据点的突变程度,计算异常突变率,其有益效果在于能较好地反映待分裂聚类簇的异常现象。同时,结合待分裂聚类簇的内部特征,即分布规律,主要基于类集中心的差异,计算簇内差异指数,并结合异常突变率,自适应每个待分裂聚类簇的分裂k值。从外部特征以及内部特征来构建分裂k值,一方面使分裂k值的选取更具完备性,另一方面使分裂k值的选取更加合理,避免只考虑一方面情况而产生较大的误差,提高的分裂可靠性以及准确性。
以上仅为本申请的实施方式,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。
Claims (8)
1.一种导电滑环故障数据采集监测方法,其特征在于,包括:
采集导电滑环的参数,构建分析矩阵,所述分析矩阵包括多维参数的时间序列数据;
利用迭代自组织聚类算法分别对每一时间序列数据进行聚类,得到每一时间序列数据每次迭代对应的初始聚类簇,并从每一时间序列数据对应的初始聚类簇中选出每一时间序列数据对应待分裂聚类簇;
基于每一时间序列数据对应的待分裂聚类簇中数据异常情况和数据分布情况确定每一时间序列数据对应的待分裂聚类簇的分裂k值;
基于所述分裂k值利用迭代自组织聚类算法分别对每一时间序列数据进行聚类,得到每一时间序列数据对应的最终聚类簇,基于所述最终聚类簇确定导电滑环故障数据;
基于每一时间序列数据对应的待分裂聚类簇中数据异常情况和数据分布情况确定每一时间序列数据对应的待分裂聚类簇的分裂k值,包括:
计算每一时间序列数据对应的待分裂聚类簇的异常突变率,所述异常突变率表征所述待分裂聚类簇中数据异常情况,所述异常突变率越大,所述待分裂聚类簇中包含异常数据的可能性越高;
计算每一时间序列数据对应的待分裂聚类簇的簇内差异指数,所述簇内差异指数表征所述待分裂聚类簇中数据分布情况,所述簇内差异指数越大,所述待分裂聚类簇中数据分布越离散;
计算每一时间序列数据对应的待分裂聚类簇的异常突变率和簇内差异指数的乘积,对计算的乘积进行归一化,从而得到每一时间序列数据对应的待分裂聚类簇的分裂k值;
计算每一时间序列数据对应的待分裂聚类簇的异常突变率,包括:
确定当前时间序列数据中每一待分裂聚类簇对应的参考数据集;所述参考数据集中的数据为所述分析矩阵中除当前时间序列数据外其他时间序列数据中的数据,且所述参考数据集中数据的采集时间与所述待分裂聚类簇中数据的采集时间对应;
基于所述参考数据集确定当前时间序列数据的所述待分裂聚类簇的异常程度指数;
基于所述待分裂聚类簇中相邻两个数据点的数值之间的差异确定当前时间序列数据的所述待分裂聚类簇中每一数据点的突变程度,从而得到待分裂聚类簇对应的突变程度序列;
基于当前时间序列数据的所述待分裂聚类簇的异常程度指数和突变程度序列计算当前时间序列数据的所述待分裂聚类簇的异常突变率。
2.根据权利要求1所述的一种导电滑环故障数据采集监测方法,其特征在于,从每一时间序列数据对应的初始聚类簇中选出每一时间序列数据对应待分裂聚类簇,包括:
如果所述初始聚类簇中标准差大于预设标准差上限,则确定所述初始聚类簇为待分裂聚类簇。
3.根据权利要求1所述的一种导电滑环故障数据采集监测方法,其特征在于,基于所述参考数据集确定当前时间序列数据的所述待分裂聚类簇的异常程度指数,包括:
计算当前时间序列数据的所述待分裂聚类簇与所有参考数据集之间的dtw距离之和;
计算当前时间序列数据的所述待分裂聚类簇的变异系数与dtw距离之和的乘积,计算得到的乘积为当前时间序列数据的所述待分裂聚类簇的异常程度指数。
4.根据权利要求1所述的一种导电滑环故障数据采集监测方法,其特征在于,基于所述待分裂聚类簇中相邻两个数据点的数值之间的差异确定当前时间序列数据的所述待分裂聚类簇中每一数据点的突变程度,包括:
计算所述待分裂聚类簇中当前数据点与当前数据点相邻的数据点的数值之间的差异,将计算的差异与所述待分裂聚类簇中数据点的均值之间的比值作为所述待分裂聚类簇中当前数据点的突变程度。
5.根据权利要求1所述的一种导电滑环故障数据采集监测方法,其特征在于,基于当前时间序列数据的所述待分裂聚类簇的异常程度指数和突变程度序列计算当前时间序列数据的所述待分裂聚类簇的异常突变率,包括:
利用突变点检测算法确定突变程度序列中的突变点;
基于当前时间序列数据的所述待分裂聚类簇的异常程度指数,和所述突变程度序列中每个数据点的突变程度与每个突变点的突变程度之间的差异之和之间的乘积确定当前时间序列数据的所述待分裂聚类簇的异常突变率。
6.根据权利要求1所述的一种导电滑环故障数据采集监测方法,其特征在于,计算每一时间序列数据对应的待分裂聚类簇的簇内差异指数,包括:
对每一待分裂聚类簇进行聚类,得到所述待分裂聚类簇对应的类集;
基于所述待分裂聚类簇中不同类集中心之间的差异、不同类集内的均方差计算每一时间序列数据对应的待分裂聚类簇的簇内差异指数。
7.根据权利要求6所述的一种导电滑环故障数据采集监测方法,其特征在于,其中,每一时间序列数据对应的待分裂聚类簇的簇内差异指数的计算方式为:
其中,表示第i维参数的时间序列数据中第j个待分裂聚类簇的簇内差异指数,G表示待分裂聚类簇的类集数目,/>和/>分别表示第i维参数的时间序列数据中第j个待分裂聚类簇中第h个、第r个类集内的数据均值,/>表示第i维参数的时间序列数据中第j个待分裂聚类簇中第h个、第r个类集中心之间的差异,/>表示第i维参数的时间序列数据中第j个待分裂聚类簇中第h个类集内的均方差,/>表示一种判断准则,当/>时,/>取值为1,当/>时,/>取值为0。
8.根据权利要求1所述的一种导电滑环故障数据采集监测方法,其特征在于,基于所述最终聚类簇确定导电滑环故障数据,包括:
计算每一时间序列数据的最终聚类簇中每一待测聚类簇与除待测聚类簇之外的其余聚类簇之间的类间方差之和;
当计算的类间方差之和最大的待测聚类簇确定为异常数据聚类簇,所述异常数据聚类簇为导电滑环故障数据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311061798.6A CN116756595B (zh) | 2023-08-23 | 2023-08-23 | 一种导电滑环故障数据采集监测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311061798.6A CN116756595B (zh) | 2023-08-23 | 2023-08-23 | 一种导电滑环故障数据采集监测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116756595A CN116756595A (zh) | 2023-09-15 |
CN116756595B true CN116756595B (zh) | 2023-12-01 |
Family
ID=87953816
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311061798.6A Active CN116756595B (zh) | 2023-08-23 | 2023-08-23 | 一种导电滑环故障数据采集监测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116756595B (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117007896B (zh) * | 2023-10-07 | 2023-12-12 | 深圳市森瑞普电子有限公司 | 一种应用于导电滑环故障检测的数据处理方法 |
CN117195018B (zh) * | 2023-11-03 | 2024-03-05 | 南通银河水泵有限公司 | 基于多传感器的矿用水泵智能监测系统 |
CN117708613B (zh) * | 2023-12-25 | 2024-05-14 | 北京中微盛鼎科技有限公司 | 一种面向产业链协同运作的数字资源匹配方法 |
CN117609739B (zh) * | 2024-01-19 | 2024-04-05 | 北京云摩科技股份有限公司 | 基于多点形变数据联合分析的结构在线监测方法 |
CN117807550B (zh) * | 2024-02-29 | 2024-05-17 | 山东宙雨消防科技股份有限公司 | 一种建筑消防设施智能化定量检测方法及系统 |
CN118133281B (zh) * | 2024-03-08 | 2024-09-20 | 准检河北检测技术服务有限公司 | 基于人工智能的软件数据安全自动检测方法 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106618483A (zh) * | 2015-10-30 | 2017-05-10 | 西双版纳生物医学研究院 | 基于生理状态应激变异的检测方法及系统和应用 |
CN109871886A (zh) * | 2019-01-28 | 2019-06-11 | 平安科技(深圳)有限公司 | 基于谱聚类的异常点比例优化方法、装置及计算机设备 |
CN111027606A (zh) * | 2019-11-29 | 2020-04-17 | 中国科学院空间应用工程与技术中心 | 一种多模式时间序列异常检测方法、存储介质和设备 |
CN113807612A (zh) * | 2021-10-13 | 2021-12-17 | 四川久远银海软件股份有限公司 | 一种基于心理量表数据的预测方法和装置 |
WO2022151819A1 (zh) * | 2021-01-18 | 2022-07-21 | 北京理工大学 | 一种基于聚类分析的电池系统在线故障诊断方法和系统 |
WO2022168279A1 (ja) * | 2021-02-05 | 2022-08-11 | 日本電信電話株式会社 | クラスタ数設定装置、クラスタ数設定方法及びプログラム |
CN116170208A (zh) * | 2023-02-21 | 2023-05-26 | 北京安信天行科技有限公司 | 一种基于半监督isodata算法的网络入侵实时检测方法 |
CN116502112A (zh) * | 2023-06-29 | 2023-07-28 | 深圳市联明电源有限公司 | 一种新能源电源测试数据管理方法及系统 |
CN116502169A (zh) * | 2023-06-28 | 2023-07-28 | 深圳特力自动化工程有限公司 | 一种基于数据检测的离心脱水机工作状态检测方法 |
CN116628617A (zh) * | 2023-07-25 | 2023-08-22 | 值数科技(北京)有限公司 | 一种基于纳米复合材料实现微型应变监测的方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10956779B2 (en) * | 2015-03-26 | 2021-03-23 | Oracle International Corporation | Multi-distance clustering |
EP3913997B1 (en) * | 2017-06-21 | 2023-08-30 | Google LLC | Generating wireless network access point models using clustering techniques |
-
2023
- 2023-08-23 CN CN202311061798.6A patent/CN116756595B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106618483A (zh) * | 2015-10-30 | 2017-05-10 | 西双版纳生物医学研究院 | 基于生理状态应激变异的检测方法及系统和应用 |
CN109871886A (zh) * | 2019-01-28 | 2019-06-11 | 平安科技(深圳)有限公司 | 基于谱聚类的异常点比例优化方法、装置及计算机设备 |
CN111027606A (zh) * | 2019-11-29 | 2020-04-17 | 中国科学院空间应用工程与技术中心 | 一种多模式时间序列异常检测方法、存储介质和设备 |
WO2022151819A1 (zh) * | 2021-01-18 | 2022-07-21 | 北京理工大学 | 一种基于聚类分析的电池系统在线故障诊断方法和系统 |
WO2022168279A1 (ja) * | 2021-02-05 | 2022-08-11 | 日本電信電話株式会社 | クラスタ数設定装置、クラスタ数設定方法及びプログラム |
CN113807612A (zh) * | 2021-10-13 | 2021-12-17 | 四川久远银海软件股份有限公司 | 一种基于心理量表数据的预测方法和装置 |
CN116170208A (zh) * | 2023-02-21 | 2023-05-26 | 北京安信天行科技有限公司 | 一种基于半监督isodata算法的网络入侵实时检测方法 |
CN116502169A (zh) * | 2023-06-28 | 2023-07-28 | 深圳特力自动化工程有限公司 | 一种基于数据检测的离心脱水机工作状态检测方法 |
CN116502112A (zh) * | 2023-06-29 | 2023-07-28 | 深圳市联明电源有限公司 | 一种新能源电源测试数据管理方法及系统 |
CN116628617A (zh) * | 2023-07-25 | 2023-08-22 | 值数科技(北京)有限公司 | 一种基于纳米复合材料实现微型应变监测的方法 |
Non-Patent Citations (4)
Title |
---|
一种基于初始点密度最大的改进型ISODATA聚类算法;李润青;谢明鸿;黄冰晶;;软件导刊(第12期) * |
基于分裂-合并策略改进多特征聚类算法的风电机组故障分析;梁耘;王维庆;王海云;;可再生能源(第10期) * |
基于最小生成树的层次K-means聚类算法;贾瑞玉;李振;;微电子学与计算机(第03期) * |
聚类分析在电力变压器不良数据识别中的应用;许培德;;湖南工业职业技术学院学报(第02期) * |
Also Published As
Publication number | Publication date |
---|---|
CN116756595A (zh) | 2023-09-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN116756595B (zh) | 一种导电滑环故障数据采集监测方法 | |
US8682824B2 (en) | Method and device for monitoring the state of a facility | |
US10852357B2 (en) | System and method for UPS battery monitoring and data analysis | |
CN112179691B (zh) | 基于对抗学习策略的机械装备运行状态异常检测系统和方法 | |
CN115982602B (zh) | 一种光伏变压器电故障检测方法 | |
CN116879662A (zh) | 基于数据分析的变压器故障检测方法 | |
CN108956111B (zh) | 一种机械部件的异常状态检测方法及检测系统 | |
CN111881594B (zh) | 一种核动力设备的非平稳信号状态监测方法及系统 | |
CN115638875B (zh) | 基于图谱分析的电厂设备故障诊断方法及系统 | |
CN113029242B (zh) | 结构健康监测系统中光纤光栅传感器异常诊断方法 | |
CN117421616B (zh) | 一种矿山竖井井筒检测系统及方法 | |
CN116520068B (zh) | 一种电力数据的诊断方法、装置、设备及存储介质 | |
CN105910806A (zh) | 加注泵早期健康状态监测方法 | |
CN117171604A (zh) | 基于传感器的保温板生产线异常监测系统 | |
CN118376936B (zh) | 一种锂电池状态智能诊断方法及系统 | |
CN116796271A (zh) | 一种居民用能异常识别方法 | |
CN116204825A (zh) | 一种基于数据驱动的生产线设备故障检测方法 | |
CN117554752A (zh) | 电力电缆故障在线检测系统及方法 | |
CN117150244B (zh) | 基于电参数分析的智能配电柜状态监测方法及系统 | |
CN116432054A (zh) | 一种基于聚类分析的局部放电严重程度识别方法 | |
CN115659271A (zh) | 传感器异常检测方法、模型训练方法、系统、设备及介质 | |
CN114490829A (zh) | 一种故障识别方法、装置、设备及存储介质 | |
CN112861957A (zh) | 一种油井运行状态检测方法及装置 | |
CN118669281A (zh) | 一种风电机的在线状态评估方法、装置、设备及存储介质 | |
KR102504421B1 (ko) | 진동 측정 오류 판단 방법 및 이를 이용하는 진동 오류 판별 시스템 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |