CN117609911A - 传感设备的异常识别方法及装置 - Google Patents
传感设备的异常识别方法及装置 Download PDFInfo
- Publication number
- CN117609911A CN117609911A CN202311459058.8A CN202311459058A CN117609911A CN 117609911 A CN117609911 A CN 117609911A CN 202311459058 A CN202311459058 A CN 202311459058A CN 117609911 A CN117609911 A CN 117609911A
- Authority
- CN
- China
- Prior art keywords
- sensing device
- sensing
- data
- time
- data point
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 41
- 230000005856 abnormality Effects 0.000 title claims abstract description 38
- 239000013598 vector Substances 0.000 claims abstract description 95
- 238000007621 cluster analysis Methods 0.000 claims abstract description 20
- 238000000605 extraction Methods 0.000 claims description 25
- 230000002159 abnormal effect Effects 0.000 claims description 24
- 238000004590 computer program Methods 0.000 claims description 24
- 238000004422 calculation algorithm Methods 0.000 claims description 15
- 230000015654 memory Effects 0.000 claims description 14
- 230000004927 fusion Effects 0.000 claims description 10
- 238000003860 storage Methods 0.000 claims description 9
- 238000012800 visualization Methods 0.000 claims description 3
- 238000001514 detection method Methods 0.000 abstract description 19
- 238000010586 diagram Methods 0.000 description 18
- 238000004458 analytical method Methods 0.000 description 9
- 238000012545 processing Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 7
- 230000007246 mechanism Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 230000002123 temporal effect Effects 0.000 description 5
- 238000007635 classification algorithm Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 238000013075 data extraction Methods 0.000 description 3
- 230000000007 visual effect Effects 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 230000006399 behavior Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000003745 diagnosis Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 206010000117 Abnormal behaviour Diseases 0.000 description 1
- 230000003542 behavioural effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000013523 data management Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000007499 fusion processing Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01D—MEASURING NOT SPECIALLY ADAPTED FOR A SPECIFIC VARIABLE; ARRANGEMENTS FOR MEASURING TWO OR MORE VARIABLES NOT COVERED IN A SINGLE OTHER SUBCLASS; TARIFF METERING APPARATUS; MEASURING OR TESTING NOT OTHERWISE PROVIDED FOR
- G01D21/00—Measuring or testing not otherwise provided for
- G01D21/02—Measuring two or more variables by means not covered by a single other subclass
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01D—MEASURING NOT SPECIALLY ADAPTED FOR A SPECIFIC VARIABLE; ARRANGEMENTS FOR MEASURING TWO OR MORE VARIABLES NOT COVERED IN A SINGLE OTHER SUBCLASS; TARIFF METERING APPARATUS; MEASURING OR TESTING NOT OTHERWISE PROVIDED FOR
- G01D18/00—Testing or calibrating apparatus or arrangements provided for in groups G01D1/00 - G01D15/00
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2135—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
- G06F18/21355—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis nonlinear criteria, e.g. embedding a manifold in a Euclidean space
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
- G06F18/24133—Distances to prototypes
- G06F18/24137—Distances to cluster centroïds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/2433—Single-class perspective, e.g. one-against-all classification; Novelty detection; Outlier detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
- G06N3/0442—Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
Abstract
本发明公开了一种传感设备的异常识别方法及装置,其中该方法包括:获取传感设备组中每个传感设备在预设时间内对应的时空特征向量,其中,传感设备组包括多个传感设备,多个传感设备分布于不同的空间位置;对传感设备组包括的各个传感设备对应的时空特征向量进行聚类分析,得到当前聚类结果;将当前聚类结果与多个传感设备的历史聚类结果进行比对,获取比对结果;通过比对结果,识别在预设时间内传感设备组中存在异常的传感设备。本发明提升了故障检测的全面性。
Description
技术领域
本发明涉及设备检测技术领域,尤其涉及传感设备的异常识别方法及装置。
背景技术
柔直换流站作为柔性直流输电工程的重要组成部分,其运行可靠性直接影响整体柔性直流电网的安全稳定高效运行。当前,柔直换流站内的关键设备多为首次应用,设备的运维管理存在大量尚未解决的问题和亟需研究的内容,主要体现在设备长期运行特性和故障机理不明;设备运行数据监测丰富,但数据管控任务量大;现有时空数据复杂,各维度数据关系不明;目前未形成统一的故障特征库。因此,亟待一种用以解决现有技术中故障检测的检测维度较为单一的技术问题的方法。
发明内容
针对现有技术中的问题,本发明实施例提供一种传感设备的异常识别方法及装置,用以解决现有技术中故障检测的检测维度较为单一的技术问题。
本发明实施例提供一种传感设备的异常识别方法,该方法包括:
获取传感设备组中每个传感设备在预设时间内对应的时空特征向量,其中,传感设备组包括多个传感设备,多个传感设备分布于不同的空间位置;
对传感设备组包括的各个传感设备对应的时空特征向量进行聚类分析,得到当前聚类结果;
将当前聚类结果与多个传感设备的历史聚类结果进行比对,获取比对结果;
通过比对结果,识别在预设时间内传感设备组中存在异常的传感设备。
可选的,在本发明一实施例中,获取传感设备组中每个传感设备在预设时间内对应的时空特征向量,包括:获取每个传感设备在预设时间内对应的特征信息;对每个传感设备在预设时间内对应的特征信息分别进行空间特征和时域特征上的提取,获得每个传感设备对应的空间特征向量和时域特征向量;对每个传感设备对应的空间特征向量和时域特征向量进行融合,得到每个传感设备在预设时间内对应的时空特征向量。
可选的,在本发明一实施例中,对传感设备组包括的各个传感设备对应的时空特征向量进行聚类分析,得到当前聚类结果,包括:对各个传感设备对应的时空特征向量进行提取,获取多个传感器中每个传感设备在多个子时段下分别对应的数据点,多个子时段为通过对预设时间进行分割后得到的;通过多个传感器中每个传感设备在多个子时段下分别对应的数据点生成聚类数据集;基于预定算法对聚类数据集进行至少一次划分,生成多个子数据集,多个子数据集的数量等于预定聚类数目,预定聚类数目是通过历史聚类结果得到的;基于多个子数据集获取当前聚类结果。
可选的,在本发明一实施例中,通过比对结果,识别在预设时间内传感设备组中存在异常的传感设备,包括:通过比对结果获取第一类数据点、第二类数据点和第三类数据点,第一类数据点为确定发生异常情况的传感设备对应的数据点,第二类数据点为确定未发生异常情况的传感设备对应的数据点,第三类数据点为疑似发生异常情况的数据点;基于预定义的指定对象终端传输的研判结果对第三类数据点进行判断,获取判断结果,并通过判断结果、第一类数据点和第二类数据点获取在预设时间内传感设备组中存在异常的传感设备。
本发明实施例还提供一种传感设备的异常识别装置,该装置包括:
获取模块,用于获取传感设备组中每个传感设备在预设时间内对应的时空特征向量,其中,传感设备组包括多个传感设备,多个传感设备分布于不同的空间位置;
聚类分析模块,用于对传感设备组包括的各个传感设备对应的时空特征向量进行聚类分析,得到当前聚类结果;
比对模块,用于将当前聚类结果与多个传感设备的历史聚类结果进行比对,获取比对结果;
识别模块,用于通过比对结果,识别在预设时间内传感设备组中存在异常的传感设备。
可选的,在本发明一实施例中,获取模块,包括:第一获取子单元,用于获取每个传感设备在预设时间内对应的特征信息;第一提取子单元,用于对每个传感设备在预设时间内对应的特征信息分别进行空间特征和时域特征上的提取,获得每个传感设备对应的空间特征向量和时域特征向量;融合子单元,用于对每个传感设备对应的空间特征向量和时域特征向量进行融合,得到每个传感设备在预设时间内对应的时空特征向量。
可选的,在本发明一实施例中,聚类分析模块,包括:第二提取子单元,用于对各个传感设备对应的时空特征向量进行提取,获取多个传感器中每个传感设备在多个子时段下分别对应的数据点,多个子时段为通过对预设时间进行分割后得到的;生成子单元,用于通过多个传感器中每个传感设备在多个子时段下分别对应的数据点生成聚类数据集;划分子单元,用于基于预定算法对聚类数据集进行至少一次划分,生成多个子数据集,多个子数据集的数量等于预定聚类数目,预定聚类数目是通过历史聚类结果得到的;可视化子单元,用于基于多个子数据集获取当前聚类结果。
可选的,在本发明一实施例中,识别模块,包括:第二获取子单元,用于通过比对结果获取第一类数据点、第二类数据点和第三类数据点,第一类数据点为确定发生异常情况的传感设备对应的数据点,第二类数据点为确定未发生异常情况的传感设备对应的数据点,第三类数据点为疑似发生异常情况的数据点;判断子单元,用于基于预定义的指定对象终端传输的研判结果对第三类数据点进行判断,获取判断结果,并通过判断结果、第一类数据点和第二类数据点获取在预设时间内传感设备组中存在异常的传感设备。
本发明实施例还提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述传感设备的异常识别方法。
本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现上述传感设备的异常识别方法。
本发明实施例还提供一种计算机程序产品,计算机程序产品包括计算机程序,计算机程序被处理器执行时实现上述传感设备的异常识别方法。
本发明实施例提供的传感设备的异常识别方法,通过获取传感设备组中每个传感设备在预设时间内对应的时空特征向量,其中,传感设备组包括多个传感设备,多个传感设备分布于不同的空间位置;对传感设备组包括的各个传感设备对应的时空特征向量进行聚类分析,得到当前聚类结果;将当前聚类结果与多个传感设备的历史聚类结果进行比对,获取比对结果;通过比对结果,识别在预设时间内传感设备组中存在异常的传感设备。通过多个位于不同位置下的传感设备分别在多个时段内进行异常检测,提高了故障检测的检测维度的全面性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1为本发明实施例中的传感设备的异常识别方法的流程图;
图2为本发明实施例中的多维数据采集和融合的示意图;
图3为本发明实施例中的空间特征提取的示意图;
图4(a)为本发明实施例中的时空特征提取的示意图;
图4(b)为本发明实施例中的另一种的时空特征提取的示意图;
图5为本发明实施例中的数据点的分类与诊断的流程图;
图6为本发明实施例中的优选的传感设备的异常识别方法的流程图;
图7为本发明实施例中的传感设备的异常识别装置的示意图;
图8为本发明实施例提供的电子设备实体结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚明白,下面结合附图对本发明实施例做进一步详细说明。在此,本发明的示意性实施例及其说明用于解释本发明,但并不作为对本发明的限定。
图1为本发明实施例中的传感设备的异常识别方法的流程图,如图1所示,步骤为:
步骤S101,获取传感设备组中每个传感设备在预设时间内对应的时空特征向量,其中,传感设备组包括多个传感设备,多个传感设备分布于不同的空间位置;
在上述步骤中,首先获取传感器设备组中的每个传感器在预设时间段内的时空特征信息,需要说明的是,具体流程如图2所示,图2为本发明实施例中的多维数据采集和融合的示意图,首先采集多维传感器数据(即在空间维度和时间维度的传感设备数据),接着对数据进行预处理,具体包括但不限于去噪声后进行归一化,然后将预处理后的数据分别进行时域特征上以及空域特征上的数据提取,获取时间特征向量以及空间特征向量,最后将这两种向量进行融合,获取时空特征向量。
步骤S102,对传感设备组包括的各个传感设备对应的时空特征向量进行聚类分析,得到当前聚类结果;
在上述步骤中,提取传感设备组中的各个传感设备所对应的时空特征向量中的信息,对这些信息进行聚类,获取聚类结果,以对多个特征向量中的信息进行分类进而便于在后续步骤中获取出现异常状况的传感设备,其中,还可以将聚类后的信息进行可视化处理,以使得结果更加直观。
步骤S103,将当前聚类结果与多个传感设备的历史聚类结果进行比对,获取比对结果;
在上述步骤中,将当前聚类结果与多个传感设备的历史聚类结果进行比对,需要说明的是,历史聚类结果经过了人工标注或者模型识别已经获取了聚类结果中的故障点,利用该历史聚类结果与当前聚类结果进行比对,比对出类别不同的信息,例如,比对结果可以为当前聚类结果与历史聚类结果中不同的数据点,后续通过特征分类算法对与历史聚类结果中不同的数据点进行分类以分类出多类数据点进行判定。步骤S104,通过比对结果,识别在预设时间内传感设备组中存在异常的传感设备。
在上述步骤中,通过比对结果识别出传感设备组中在哪些子时段下的传感设备对应的数据点出现了异常,对该数据点对应的传感设备的对应的子时段进行异常故障分析。
本发明实施例中,与现有技术中的技术方案相比,通过获取传感设备组中每个传感设备在预设时间内对应的时空特征向量,其中,传感设备组包括多个传感设备,多个传感设备分布于不同的空间位置;对传感设备组包括的各个传感设备对应的时空特征向量进行聚类分析,得到当前聚类结果;将当前聚类结果与多个传感设备的历史聚类结果进行比对,获取比对结果;通过比对结果,识别在预设时间内传感设备组中存在异常的传感设备。可以实现从多维度对故障进行识别与分析,从而提升了故障检测的全面性,解决了现有技术中故障检测的检测维度较为单一的技术问题。
可选的,在本发明一实施例中,获取传感设备组中每个传感设备在预设时间内对应的时空特征向量,包括:获取每个传感设备在预设时间内对应的特征信息;对每个传感设备在预设时间内对应的特征信息分别进行空间特征和时域特征上的提取,获得每个传感设备对应的空间特征向量和时域特征向量;对每个传感设备对应的空间特征向量和时域特征向量进行融合,得到每个传感设备在预设时间内对应的时空特征向量。
图3为本发明实施例中的空间特征提取的示意图,如图3所示,时域特征提取模块由多个注意力机制(Attention)-长短时记忆(Long short term memory,LSTM)网络级联而成,每个部件的过程数据和质量数据分别视为网络的输入与输出,训练过程中每个部件的局部质量预测作为下一个部件网络模块的约束,该网络结构提取的特征可以捕捉更多的时域动态特征。空间特征信息体现在局部操作单元内变量之间的互相关性中。空间特征提取致力于挖掘不同变量中隐含的空间相关性,并捕获闭环控制下的过程波动。
接着,将时间特征和空间特征结合,形成时空特征向量,以捕捉不同维度之间的关系。简单地将时间特征向量和空间特征向量通过KPCA算法融合,形成新的特征向量。这种方法可以保留每个维度的原始信息。需要说明的是,KPCA算法是一种用于数据降维的算法,以便于将降维后的时间特征向量和空间特征向量进行融合。
具体地,图4(a)为本发明实施例中的时空特征提取的示意图,如图4(a)所示,首先获取每个传感设备在预设时间内对应的2维时空数据(即特征信息),接着对该2维时空数据进行时间特征和空间特征上的分析,分别生成时间特征向量和空间特征向量。
进一步地,时间特征信息通过时域特征提取模块来采集,时域特征提取模块基于LSTM(长短时记忆网络)和Attention机制的时间特征提取模块可以帮助从序列数据中提取有关时间特征的有用信息。将拟合曲线数据划分为序列,每个序列代表一段时间内的检测量数据。序列长度可以根据时间维度来设置,例如,每小时的数据作为一个序列,通过设计一个或多个LSTM层来处理输入序列并使用LSTM网络来处理序列数据,以捕捉时间序列中的时序关系,并且LSTM网络会自动考虑到不同时间步之间的关联。在LSTM的输出上引入Attention机制,以便模型能够关注序列中的重要部分。Attention机制可以加强模型对关键时间步的关注,从而提取更有代表性的时间特征。将经过Attention加权的LSTM输出序列汇总为单个时间特征向量。这个向量将包含LSTM网络对于整个序列的理解,并考虑了Attention机制的加权。最终的特征向量可以通过全连接层或其他方法输出,以用于后续任务,如故障检测、分类等。
空间特征信息通过空间特征提取模块来采集,空间特征提取模块基于MI(MutualInformation)矩阵和KPCA(KernelPrincipalComponentAnalysis)算法的空间特征提取模块方案可以帮助从多个空间位置的数据中提取出有用的空间特征。具体地,收集来自不同空间位置的传感设备的拟合曲线数据,每个位置的数据作为一个数据样本。首先使用MutualInformation计算两两空间位置之间的信息量,需要说明的是,MI矩阵反映了不同空间位置之间的关联程度,还可以使用直接估计方法或基于密度估计的方法计算MI,接着将MI矩阵作为核矩阵输入到KPCA算法中,KPCA将数据映射到一个高维特征空间,并在该空间中执行PCA算法,需要说明的是,KPCA是一种核技巧的PCA,它能够在非线性空间中进行特征提取。KPCA输出的主成分即为在非线性空间中提取的空间特征,这些特征能够更好地捕捉数据之间的非线性关系和相似性,将从KPCA获得的空间特征整合成单个向量,作为代表不同空间位置之间关系的特征。最终的特征向量可以通过全连接层或其他方法输出,以供后续任务使用。
将时间特征向量和空间特征向量使用时空特征融合模块进行融合,形成时空特征融合模块,以捕捉不同维度之间的关系,即将时间特征向量和空间特征向量连接在一起,形成一个更长的特征向量。这种方法可以保留每个维度的原始信息。具体为,首先对时间特征和空间特征进行加权平均,权重可以根据实际情况进行灵活设置得到,这种方法可以在两个维度之间平衡信息,接着使用降维技术(如PCA)对时间特征和空间特征进行降维,然后将降维后的特征合并。这样对于时空向量进行处理有助于减少特征维度,同时保留主要信息,并且融合结果可以作为输入传递给后续任务,如故障检测、分类、聚类等。
另一方面,图4(b)为本发明实施例中的另一种的时空特征提取的示意图,如图4(b)所示,对于采集出的2维特征信息同时进行空间信息分析和时间信息方面的分析,最后将采集分析结果融合成时空特征向量,图4(b)将该特征向量采集和融合过程通过另一维度直观展现出来。
可选的,在本发明一实施例中,对传感设备组包括的各个传感设备对应的时空特征向量进行聚类分析,得到当前聚类结果,包括:对各个传感设备对应的时空特征向量进行提取,获取多个传感器中每个传感设备在多个子时段下分别对应的数据点,多个子时段为通过对预设时间进行分割后得到的;通过多个传感器中每个传感设备在多个子时段下分别对应的数据点生成聚类数据集;基于预定算法对聚类数据集进行至少一次划分,生成多个子数据集,多个子数据集的数量等于预定聚类数目,预定聚类数目是通过历史聚类结果得到的;基于多个子数据集获取当前聚类结果。
在上述可选的实施例中,首先对各个传感设备对应的时空特征向量进行提取,提取出多个数据点,其中每个数据点对应于每个传感设备的某一子时段,接着进行无监督聚类分析,首先将所有数据点视为一个初始簇(即聚类数据集),然后将该簇分成两个子簇,并计算每个子簇的误差平方和(SSE),选择误差平方和最大的子簇,并将其再次分成两个子簇,重复执行这个过程,直到达到预定的聚类数目(即历史聚类结果得到的预定聚类数目)为止。需要说明的是,通过历史聚类结果来获取预定聚类数目的作用为便于当前聚类结果与历史聚类结果的比对,也即相同数据的类进行比对,更容易获得更直观的比对结果,以具有较高的准确性和稳定性。
需要说明的是,预设时间的划分方式按照一个固定的时间窗口进行时间段的划分,例如,每小时、每天、每分钟等。通过将连续的拟合曲线数据划分为时间段,并将每个时间段的检测量数据构建成序列,可以利用LSTM和Attention等模型来提取时间特征,并从中捕捉时序关系,从而更好地理解数据的变化和趋势,进而更好的进行异常检测。
需要说明的是,本发明的聚类算法包括但不限于:Bisecting K-Means算法。
进一步地,无监督关系聚类可以帮助发现数据中的内在模式和关系,从而将相似的数据点分组到同一类别中。这可以为故障检测、异常检测和系统行为分析提供有用的信息。并且通过聚类,可以得到不同的聚类簇或群组,每个群组代表了拟合曲线数据中相似的关系模式。这些群组通常被称为聚类标识,它们可以帮助识别数据中的不同行为模式。聚类可以帮助找到与其他数据点不同的异常数据点,这些异常可能表示潜在的故障或异常情况。同时,聚类还可以揭示出具有相似性的数据点,这些数据点在行为上可能具有相似的特点。可以揭示不同聚类中的模式和趋势。这有助于理解数据的结构,发现可能的异常或变化,以及从数据中提取有用的信息。
并且通过聚类结果可以分析每个聚类的特点和趋势进而来识别可能的故障模式。例如,某些聚类可能会显示出异常或异常行为。并且对于每个聚类,可以将其代表性的特征向量和模式存储在故障特征库中。这样,当新的数据点进来时,可以通过与特征库中的聚类进行比较来判断其是否与已知的故障模式相似,并且随着新数据的积累,可以定期更新特征库,将新的故障特征添加到库中,并且可能调整现有的聚类标识。
可选的,在本发明一实施例中,通过比对结果,识别在预设时间内传感设备组中存在异常的传感设备,包括:通过比对结果获取第一类数据点、第二类数据点和第三类数据点,第一类数据点为确定发生异常情况的传感设备对应的数据点,第二类数据点为确定未发生异常情况的传感设备对应的数据点,第三类数据点为疑似发生异常情况的数据点;基于预定义的指定对象终端传输的研判结果对第三类数据点进行判断,获取判断结果,并通过判断结果、第一类数据点和第二类数据点获取在预设时间内传感设备组中存在异常的传感设备。
图5为本发明实施例中的数据点的分类与诊断的流程图,如图5所示,首先获取比对结果,接着利用分类算法对比对结果进行处理,需要说明的是,分类算法包括但不限于:SVM算法;具体地,通过分类算法在比对结果中获取出多类特征,通过多类特征分类出每类特征对应的数据点(即多类数据点),具体包括A类特征(对应第一类数据点)和B类特征(对应第三类数据点),在本发明中还获取了第二类数据点,但是并不需要对第二类数据点进行处理,所以没有在图中示出,其中,第一类数据点为确定异常的数据点,第二类数据点为确定未发生异常的数据点,第三类数据点为疑似发生异常的数据点;接着分别对多类数据点进行处理,对第一类数据点进行异常告警处理,对第三类数据点需要首先获取利用指定对象的终端传输来的专家对于第三类数据点的判断结果,通过该专家分析研判对该类数据点进行判断,以判断该数据点对应的传感设备的某一子时段下是否发生了异常,最后将判断结果以及对应的异常情况纳入历史聚类结果数据库中,以完善数据库。
图6为本发明实施例中的优选的传感设备的异常识别方法的流程图,如图6所示,
步骤一、获取传感设备的时间、空间方面的数据提取,以及对数据进行清洗。
步骤二、利用时域特征提取模块、空间特征提取模块、时空特征融合模块,对时空特征向量进行提取、融合。
具体地,利用时域特征提取模块对时间特征进行提取,获取时间特征向量;利用空间特征模块对空间特征进行提取,获取空间特征向量,再利用时空特征融合模块将时间特征向量和空间特征向量进行融合,以获取时空特征向量。
步骤三、基于无监督关系聚类的数据征提取方法,通过逐步将数据点来进行分类,以获取聚类结果。
步骤四、基于聚类结果与历史聚类结果进行比对,通过比对结果获取存在异常的传感设备对应的时段。
步骤五、通过异常结果对历史聚类结果特征库进行更新。
需要说明的是,历史聚类结果数据库可以利用关系数据库MySQL以及图形数据库Neo4j来进行构建,可以适应数据分布的变化。同时使用滑动窗口技术来实时计算一些统计特征,以捕获最近时间段内的数据变化,并且使用增量学习技术,逐步将新数据纳入到特征提取模型中,避免重新训练整个特征提取模型,以减少计算资源和时间的开销。
本发明实施例还提供一种传感设备的异常识别装置,图7为本发明实施例中传感设备的异常识别装置的示意图,如图7所示,该装置包括:
获取模块71,用于获取传感设备组中每个传感设备在预设时间内对应的时空特征向量,其中,传感设备组包括多个传感设备,多个传感设备分布于不同的空间位置;
聚类分析模块72,用于对传感设备组包括的各个传感设备对应的时空特征向量进行聚类分析,得到当前聚类结果;
比对模块73,用于将当前聚类结果与多个传感设备的历史聚类结果进行比对,获取比对结果;
识别模块74,用于通过比对结果,识别在预设时间内传感设备组中存在异常的传感设备。
可选的,在本发明一实施例中,获取模块,包括:第一获取子单元,用于获取每个传感设备在预设时间内对应的特征信息;第一提取子单元,用于对每个传感设备在预设时间内对应的特征信息分别进行空间特征和时域特征上的提取,获得每个传感设备对应的空间特征向量和时域特征向量;融合子单元,用于对每个传感设备对应的空间特征向量和时域特征向量进行融合,得到每个传感设备在预设时间内对应的时空特征向量。
可选的,在本发明一实施例中,聚类分析模块,包括:第二提取子单元,用于对各个传感设备对应的时空特征向量进行提取,获取多个传感器中每个传感设备在多个子时段下分别对应的数据点,多个子时段为通过对预设时间进行分割后得到的;生成子单元,用于通过多个传感器中每个传感设备在多个子时段下分别对应的数据点生成聚类数据集;划分子单元,用于基于预定算法对聚类数据集进行至少一次划分,生成多个子数据集,多个子数据集的数量等于预定聚类数目,预定聚类数目是通过历史聚类结果得到的;可视化子单元,用于基于多个子数据集获取当前聚类结果。
可选的,在本发明一实施例中,识别模块,包括:第二获取子单元,用于通过比对结果获取第一类数据点、第二类数据点和第三类数据点,第一类数据点为确定发生异常情况的传感设备对应的数据点,第二类数据点为确定未发生异常情况的传感设备对应的数据点,第三类数据点为疑似发生异常情况的数据点;判断子单元,用于基于预定义的指定对象终端传输的研判结果对第三类数据点进行判断,获取判断结果,并通过判断结果、第一类数据点和第二类数据点获取在预设时间内传感设备组中存在异常的传感设备。
本发明实施例还提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述传感设备的异常识别方法。
本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现上述传感设备的异常识别方法。
本发明实施例还提供一种计算机程序产品,计算机程序产品包括计算机程序,计算机程序被处理器执行时实现上述传感设备的异常识别方法。
图8为本发明实施例提供的电子设备实体结构示意图,如图8所示,所述电子设备包括:处理器(processor)801、存储器(memory)802和总线803。
其中,所述处理器801、存储器802通过总线803完成相互间的通信。
所述处理器801用于调用所述存储器802中的程序指令,以执行上述各方法实施例所提供的方法。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种传感设备的异常识别方法,其特征在于,包括:
获取传感设备组中每个传感设备在预设时间内对应的时空特征向量,其中,所述传感设备组包括多个传感设备,所述多个传感设备分布于不同的空间位置;
对所述传感设备组包括的各个传感设备对应的时空特征向量进行聚类分析,得到当前聚类结果;
将所述当前聚类结果与所述多个传感设备的历史聚类结果进行比对,获取比对结果;
通过所述比对结果,识别在所述预设时间内所述传感设备组中存在异常的传感设备。
2.如权利要求1所述的方法,其特征在于,获取传感设备组中每个传感设备在预设时间内对应的时空特征向量,包括:
获取每个传感设备在预设时间内对应的特征信息;
对每个传感设备在预设时间内对应的特征信息分别进行空间特征和时域特征上的提取,获得每个传感设备对应的空间特征向量和时域特征向量;
对每个传感设备对应的空间特征向量和时域特征向量进行融合,得到每个传感设备在预设时间内对应的时空特征向量。
3.如权利要求1所述的方法,其特征在于,对所述传感设备组包括的各个传感设备对应的时空特征向量进行聚类分析,得到当前聚类结果,包括:
对所述各个传感设备对应的时空特征向量进行提取,获取所述多个传感器中每个传感设备在多个子时段下分别对应的数据点,所述多个子时段为通过对所述预设时间进行分割后得到的;
通过所述多个传感器中每个传感设备在多个子时段下分别对应的数据点生成聚类数据集;
基于预定算法对所述聚类数据集进行至少一次划分,生成多个子数据集,所述多个子数据集的数量等于所述预定聚类数目,所述预定聚类数目是通过所述历史聚类结果得到的;
基于所述多个子数据集获取所述当前聚类结果。
4.如权利要求1所述的方法,其特征在于,通过所述比对结果,识别在所述预设时间内所述传感设备组中存在异常的传感设备,包括:
通过所述比对结果获取第一类数据点、第二类数据点和第三类数据点,所述第一类数据点为确定发生异常情况的传感设备对应的数据点,所述第二类数据点为确定未发生异常情况的传感设备对应的数据点,所述第三类数据点为疑似发生异常情况的数据点;
基于预定义的指定对象终端传输的研判结果对所述第三类数据点进行判断,获取判断结果,并通过所述判断结果、第一类数据点和第二类数据点获取在所述预设时间内所述传感设备组中存在异常的传感设备。
5.一种传感设备的异常识别装置,其特征在于,包括:
获取模块,用于获取传感设备组中每个传感设备在预设时间内对应的时空特征向量,其中,所述传感设备组包括多个传感设备,所述多个传感设备分布于不同的空间位置;
聚类分析模块,用于对所述传感设备组包括的各个传感设备对应的时空特征向量进行聚类分析,得到当前聚类结果;
比对模块,用于将所述当前聚类结果与所述多个传感设备的历史聚类结果进行比对,获取比对结果;
识别模块,用于通过所述比对结果,识别在所述预设时间内所述传感设备组中存在异常的传感设备。
6.如权利要求5所述的装置,其特征在于,所述获取模块,包括:
第一获取子单元,用于获取每个传感设备在预设时间内对应的特征信息;
第一提取子单元,用于对每个传感设备在预设时间内对应的特征信息分别进行空间特征和时域特征上的提取,获得每个传感设备对应的空间特征向量和时域特征向量;
融合子单元,用于对每个传感设备对应的空间特征向量和时域特征向量进行融合,得到每个传感设备在预设时间内对应的时空特征向量。
7.如权利要求5所述的装置,其特征在于,所述聚类分析模块,包括:
第二提取子单元,用于对所述各个传感设备对应的时空特征向量进行提取,获取所述多个传感器中每个传感设备在多个子时段下分别对应的数据点,所述多个子时段为通过对所述预设时间进行分割后得到的;
生成子单元,用于通过所述多个传感器中每个传感设备在多个子时段下分别对应的数据点生成聚类数据集;
划分子单元,用于基于预定算法对所述聚类数据集进行至少一次划分,生成多个子数据集,所述多个子数据集的数量等于所述预定聚类数目,所述预定聚类数目是通过所述历史聚类结果得到的;
可视化子单元,用于基于多个子数据集获取所述当前聚类结果。
8.如权利要求5所述的装置,其特征在于,所述识别模块,包括:
第二获取子单元,用于通过所述比对结果获取第一类数据点、第二类数据点和第三类数据点,所述第一类数据点为确定发生异常情况的传感设备对应的数据点,所述第二类数据点为确定未发生异常情况的传感设备对应的数据点,所述第三类数据点为疑似发生异常情况的数据点;
判断子单元,用于基于预定义的指定对象终端传输的研判结果对所述第三类数据点进行判断,获取判断结果,并通过所述判断结果、第一类数据点和第二类数据点获取在所述预设时间内所述传感设备组中存在异常的传感设备。
9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至4任一所述方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1至4任一所述方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311459058.8A CN117609911A (zh) | 2023-11-03 | 2023-11-03 | 传感设备的异常识别方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311459058.8A CN117609911A (zh) | 2023-11-03 | 2023-11-03 | 传感设备的异常识别方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117609911A true CN117609911A (zh) | 2024-02-27 |
Family
ID=89954134
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311459058.8A Pending CN117609911A (zh) | 2023-11-03 | 2023-11-03 | 传感设备的异常识别方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117609911A (zh) |
-
2023
- 2023-11-03 CN CN202311459058.8A patent/CN117609911A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111178456B (zh) | 异常指标检测方法、装置、计算机设备和存储介质 | |
Corizzo et al. | Anomaly detection and repair for accurate predictions in geo-distributed big data | |
CN111459700A (zh) | 设备故障的诊断方法、诊断装置、诊断设备及存储介质 | |
US8868985B2 (en) | Supervised fault learning using rule-generated samples for machine condition monitoring | |
US20110191076A1 (en) | Error detection method and system | |
Pavlovski et al. | Hierarchical convolutional neural networks for event classification on PMU measurements | |
CN111367777B (zh) | 告警处理的方法、装置、设备及计算机可读存储介质 | |
US20160255109A1 (en) | Detection method and apparatus | |
CN104050361A (zh) | 一种监狱服刑人员危险性倾向的智能分析预警方法 | |
CN109871002B (zh) | 基于张量标签学习的并发异常状态识别与定位系统 | |
Calvo-Bascones et al. | A collaborative network of digital twins for anomaly detection applications of complex systems. Snitch Digital Twin concept | |
CN117041017B (zh) | 数据中心的智能运维管理方法及系统 | |
Son et al. | Deep learning-based anomaly detection to classify inaccurate data and damaged condition of a cable-stayed bridge | |
CN110956278A (zh) | 重新训练机器学习模型的方法和系统 | |
CN114266289A (zh) | 一种复杂装备健康状态评估方法 | |
CN115373879A (zh) | 一种面向大规模云数据中心智能运维的磁盘故障预测方法 | |
CN113919540A (zh) | 一种生产过程运行状态的监测方法及相关设备 | |
Bond et al. | A hybrid learning approach to prognostics and health management applied to military ground vehicles using time-series and maintenance event data | |
CN117609911A (zh) | 传感设备的异常识别方法及装置 | |
Ren et al. | Machine learning for synchrophasor analysis | |
CN116551466B (zh) | Cnc加工过程中的智能监控系统及其方法 | |
CN113821418B (zh) | 故障根因分析方法及装置、存储介质和电子设备 | |
CN114064441B (zh) | 一种日志异常检测方法、装置及设备 | |
Zhang et al. | A multiscale electricity theft detection model based on feature engineering | |
Zhao et al. | There is a gold mine in flight data: A framework of data mining in civil aviation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |