CN103729444B - 一种基于设备监测数据间潜在关系的异常数据检测方法 - Google Patents

一种基于设备监测数据间潜在关系的异常数据检测方法 Download PDF

Info

Publication number
CN103729444B
CN103729444B CN201310744995.8A CN201310744995A CN103729444B CN 103729444 B CN103729444 B CN 103729444B CN 201310744995 A CN201310744995 A CN 201310744995A CN 103729444 B CN103729444 B CN 103729444B
Authority
CN
China
Prior art keywords
data
equipment
monitoring
vector
potential
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310744995.8A
Other languages
English (en)
Other versions
CN103729444A (zh
Inventor
王建民
刘英博
张力
丁建伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tsinghua University
Original Assignee
Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tsinghua University filed Critical Tsinghua University
Priority to CN201310744995.8A priority Critical patent/CN103729444B/zh
Publication of CN103729444A publication Critical patent/CN103729444A/zh
Application granted granted Critical
Publication of CN103729444B publication Critical patent/CN103729444B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Testing And Monitoring For Control Systems (AREA)

Abstract

本发明涉及一种基于设备监测数据间潜在关系的异常数据检测方法,属于工业设备运行技术领域。该方法首先对设备监测数据进行切分和重组,以有效减少噪声数据的干扰,提高异常检测的精度;然后针对运行周期的相似性,提取一个完整运行周期内监测数据之间的潜在关系,即潜在关系向量,通过对于每个运行周期提取潜在关系向量,构建该组潜在关系向量的正态概率分布模型;最后通过比较每个潜在关系向量与该正态概率分布模型的关系,可以检测出其中对应的异常的监测数据,便于相关部门进一步分析。该异常检测方法能够快速的从海量监测数据中发现异常,并且很好的解决了噪声数据的干扰,是一种十分有效的监测数据中异常数据检测方法。

Description

一种基于设备监测数据间潜在关系的异常数据检测方法
技术领域
本发明涉及一种基于设备监测数据间潜在关系的异常数据检测方法,属于工业设备运行技术领域。
背景技术
近几年,随着物联网(Internet of Things)技术的迅猛发展,基于信息传输技术和传感器技术的状态监测系统(Condition Monitoring System)被广泛的应用到了复杂装备制造行业。状态监测系统利用设备上安装的各种传感器,采集与设备部件相关的监测数据,然后利用无线信息传输技术将采集的监测数据传输到企业的监控中心,监控中心则负责将传回的监测数据进行存储和分析。监测数据作为整个状态监测系统的核心,有效分析监测数据可以极大改善设备的运行状况,提高设备的运行效率,从而提高企业的经济效益。
异常检测作为监测数据分析中非常关键的一环,它重点关注监测数据中和实际故障相关的、运行效率、操作异常相关的数据,并将这些数据从大量监测数据中即时检测出来,交给领域专家进行进一步分析确认,可以减少设备的维修成本、改进设备的设计和制造。跟以往的异常检测方法相比,监测数据的异常检测面临诸多新的挑战:1、数据量大。企业运营设备的数量基数大,设备安装的每个传感器在设备工作状态下持续采集并传输监测数据,监测数据的数据量有了爆发式的增长。例如,以国内某知名机械制造厂商为例,目前该企业每天的监测数据采集量超过30Gb。2、噪声数据大。由于设备的监测数据全部通过传感器采集,并通过无线传输网络传输,结合考虑设备的工作环境和人为非法操作等因素,导致监测数据中存在比较严重的噪声数据,以往的异常检测方法不能很好的处理噪声数据和正常数据。3、异常无法预期。由于设备所处的工作环境和人为操作的各异,会导致设备出现各种各样的故障(异常),而这些异常往往在设备设计、制造阶段是无法预期的。同时,对于异常设备采集的异常的监测数据具体是什么形式,异常监测方法也是缺乏先验知识的,因此基于设备监测数据潜在关系的异常数据检测方法是一种无任何先验知识的无监督方法。
发明内容
本发明的目的是提出基于设备监测数据间潜在关系的异常数据检测方法,在进行异常检测的时考虑设备监测数据的完整性、数据中存在的噪声以及数据量的大小,通过设备监测数据之间的潜在关系,检测异常的监测数据。
本发明提出的基于设备监测数据间潜在关系的异常数据检测方法,包括以下步骤:
(1)在设备上安装K个传感器,每个传感器采集同一种类监测数据,共采集K种监测数据,K种监测数据的集合表达为W={w1,w2,...,wK},设设备的监测数据的采集时间集合为M={t1,t2,...,tN},N表示采集时间点的个数,设备的第k种监测数据为一个向量,表达为Wk={v1,v2,...,vN},其中vn表示设备在时刻tn的第k种监测数据;
(2)根据设备的运行周期对采集时间M={t1,t2,...,tN}进行切分,得到S个采集时间子集,表达为M={WC1,WC2,...,WCS},其中第s个运行周期对应的采集时间子集WCs包含T个采集时间点,即WCs={t1,t2,...,tT},其中每个运行周期的采集时间点相同;
(3)根据切分的采集时间子集,将设备的第k种监测数据Wk切分成S个监测数据子集,设备在第s个运行周期WCS时第k种监测数据为定义每一个Dk为一个工况数据,每个工况数据与设备在一个运行周期下的一类监测数据相对应,其中表示设备在第s个运行周期WCS的tt时刻点的第k种监测数据;
(4)对每个工况数据进行重组,以减少噪声数据的干扰,重组过程为:若工况数据为偶数个,则对工况数据进行两两处理,使工况数据为:若工况数据为奇数,则对工况数据中的前偶数个进行两两处理,使工况数据为:使最后一个工况数据为其中得到重组的工况数据为
(5)对于设备的第s个运行周期WCs,共有K个工况数据,表达为D′={D′1,D′2,…,D′K},其中第k个工况数据表达为计算K个工况数据的协方差矩阵,将该协方差矩阵定义为工况数据的潜在关系矩阵,该潜在关系矩阵表达为:
其中,
根据矩阵特征值λ的定义,存在关系式:其中E表示单位矩阵,根据该关系式,计算得到上述潜在关系矩阵的K个特征值λ12,...,λK,其中λk表示为潜在关系矩阵LCM的第k个特征值,该组特征值组成的向量定义为该组工况数据的潜在关系向量,潜在关系向量表达为LCV={λ12,...,λK},每个潜在关系向量与设备的一个运行周期相对应;
(6)重复步骤(2)~步骤(5),计算得到与设备的每个运行周期相对应的潜在关系向量,所有的潜在关系向量的集合记为其中L表示潜在关系向量的个数,LCV1,LCV2,...,LCVL服从一个如下式所示的K维正态概率分布模型:
其中π表示圆周率,e表示自然对数的底,利用极大似然估计算法,计算得到K维正态概率分布模型的均值向量以及协方差矩阵
(7)根据上述均值向量μ和协方差矩阵∑,对每一个潜在关系向量进行判断,若潜在关系向量属于[μ-3∑,μ+3∑]区间,则判定与该潜在关系向量相对应的工况数据为正常数据;若潜在关系向量在[μ-3∑,μ+3∑]区间之外,则判定与该潜在关系向量相对应的工况数据为异常数据,遍历上述潜在关系向量集合中的每个关系向量,实现对设备异常数据的检测。
本发明提出的基于设备监测数据间潜在关系的异常数据检测方法,其优点是:
1、本发明提出的是基于设备监测数据间潜在关系的异常数据检测方法,能够快速从海量的监测数据中发现异常数据,从而检测到与设备的实际故障相关的运行工况、操作异常等数据,并将数据提交给相关部门进行分析确认,以减少设备的维修成本、改进设备的设计和制造。
2、本发明提出的异常检测方法,能够有效克服监测数据中的噪声数据,从而能够快速的检测出异常数据,提高了异常数据的检测速度和精度。
具体实施方式
本发明提出的基于设备监测数据间潜在关系的异常数据检测方法,包括以下步骤:
(1)在设备上安装K个传感器,每个传感器采集同一种类监测数据,共采集K种监测数据,K种监测数据的集合表达为W={w1,w2,...,wK},设设备的监测数据的采集时间集合为M={t1,2,...,tN},N表示采集时间点的个数,设备的第k种监测数据为一个向量,表达为Wk={v1,v2,...,vN},其中vn表示设备在时刻tn的第k种监测数据;
(2)根据设备的运行周期(设备从开机到关机一次完整的运行时间,例如泵车一次完整的泵送过程)对采集时间M={t1,t2,...,tN}进行切分,得到S个采集时间子集,表达为M={WC1,WC2,...,WCS},其中第s个运行周期对应的采集时间子集WCs包含T个采集时间点,即WCs={t1,t2,...,tT},其中每个运行周期的采集时间点相同;
(3)根据切分的采集时间子集,将设备的第k种监测数据Wk切分成S个监测数据子集,设备在第s个运行周期WCS时第k种监测数据为定义每一个Dk为一个工况数据,每个工况数据与设备在一个运行周期下的一类监测数据相对应,其中表示设备在第s个运行周期WCS的tt时刻点的第k种监测数据;
(4)对每个工况数据进行重组,以减少噪声数据的干扰,重组过程为:若工况数据为偶数个,则对工况数据进行两两处理,使工况数据为:若工况数据为奇数,则对工况数据中的前偶数个进行两两处理,使工况数据为:使最后一个工况数据为其中得到重组的工况数据为
(5)对于设备的第s个运行周期WCS,共有K个工况数据,表达为D′={D′1,′2,…,D′K},其中第k个工况数据表达为计算K个工况数据的协方差矩阵,将该协方差矩阵定义为工况数据的潜在关系矩阵,该潜在关系矩阵表达为:
其中,
根据矩阵特征值λ的定义,存在关系式:其中E表示单位矩阵,根据该关系式,计算得到上述潜在关系矩阵的K个特征值λ12,...,λK,其中λk表示为潜在关系矩阵LCM的第k个特征值,该组特征值组成的向量定义为该组工况数据的潜在关系向量(Latent Correlation Vector),潜在关系向量表达为LCV={λ12,...,λK},每个潜在关系向量与设备的一个运行周期相对应;
(6)重复步骤(2)~步骤(5),计算得到与设备的每个运行周期相对应的潜在关系向量,所有的潜在关系向量的集合记为其中L表示潜在关系向量的个数,LCV1,LCV2,...,LCVL服从一个如下式所示的K维正态概率分布模型:
其中π表示圆周率,e表示自然对数的底,利用极大似然估计算法(MaximumLikelihood Estimation),计算得到K维正态概率分布模型的均值向量以及协方差矩阵
(7)根据上述均值向量μ和协方差矩阵∑,对每一个潜在关系向量进行判断,若潜在关系向量属于[μ-3∑,μ+3∑]区间,则判定与该潜在关系向量相对应的工况数据为正常数据;若潜在关系向量在[μ-3∑,μ+3∑]区间之外,则判定与该潜在关系向量相对应的工况数据为异常数据,遍历上述潜在关系向量集合中的每个关系向量,实现对设备异常数据的检测。

Claims (1)

1.一种基于设备监测数据间潜在关系的异常数据检测方法,其特征在于该方法包括以下步骤:
(1)在设备上安装K个传感器,每个传感器采集同一种类监测数据,共采集K种监测数据,K种监测数据的集合表达为W={w1,w2,...,wK},设设备的监测数据的采集时间集合为M={t1,t2,...,tN},N表示采集时间点的个数,设备的第k种监测数据为一个向量,表达为Wk={v1,v2,...,vN},其中vn表示设备在时刻tn的第k种监测数据;
(2)根据设备的运行周期对采集时间M={t1,t2,...,tN}进行切分,得到S个采集时间子集,表达为M={WC1,WC2,...,WCS},其中第s个运行周期对应的采集时间子集WCs包含T个采集时间点,即WCs={t1,t2,...,tT},其中每个运行周期的采集时间点相同;
(3)根据切分的采集时间子集,将设备的第k种监测数据Wk切分成S个监测数据子集,设备在第s个运行周期WCS时第k种监测数据为定义每一个Dk为一个工况数据,每个工况数据与设备在一个运行周期下的一类监测数据相对应,其中表示设备在第s个运行周期WCS的tt时刻点的第k种监测数据;
(4)对每个工况数据进行重组,以减少噪声数据的干扰,重组过程为:若工况数据为偶数个,则对工况数据进行两两处理,使工况数据为:若工况数据为奇数,则对工况数据中的前偶数个进行两两处理,使工况数据为:使最后一个工况数据为其中得到重组的工况数据为
(5)对于设备的第s个运行周期WCS,共有K个工况数据,表达为D′={D′1,D′2,...,D′K},其中第k个工况数据表达为计算K个工况数据的协方差矩阵,将该协方差矩阵定义为工况数据的潜在关系矩阵,该潜在关系矩阵表达为:
其中,
根据矩阵特征值λ的定义,存在关系式:其中E表示单位矩阵,根据该关系式,计算得到上述潜在关系矩阵的K个特征值λ12,...,λK,其中λk表示为潜在关系矩阵LCM的第k个特征值,该组特征值组成的向量定义为该组工况数据的潜在关系向量,潜在关系向量表达为LCV={λ12,...,λK},每个潜在关系向量与设备的一个运行周期相对应;
(6)重复步骤(2)~步骤(5),计算得到与设备的每个运行周期相对应的潜在关系向量,所有的潜在关系向量的集合记为其中L表示潜在关系向量的个数,LCV1,LCV2,...,LCVL服从一个如下式所示的K维正态概率分布模型:
( LCV 1 , LCV 2 , ... , LCV L ) ~ N ( x | Σ , μ ) = 1 ( 2 π ) K | Σ | 1 2 e - ( x - μ ) T Σ - 1 ( x - μ ) 2 ,
其中π表示圆周率,e表示自然对数的底,利用极大似然估计算法,计算得到K维正态概率分布模型的均值向量以及协方差矩阵
(7)根据上述均值向量μ和协方差矩阵Σ,对每一个潜在关系向量进行判断,若潜在关系向量属于[μ-3Σ,μ+3Σ]区间,则判定与该潜在关系向量相对应的工况数据为正常数据;若潜在关系向量在[μ-3Σ,μ+3Σ]区间之外,则判定与该潜在关系向量相对应的工况数据为异常数据,遍历上述潜在关系向量集合中的每个关系向量,实现对设备异常数据的检测。
CN201310744995.8A 2013-12-30 2013-12-30 一种基于设备监测数据间潜在关系的异常数据检测方法 Active CN103729444B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310744995.8A CN103729444B (zh) 2013-12-30 2013-12-30 一种基于设备监测数据间潜在关系的异常数据检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310744995.8A CN103729444B (zh) 2013-12-30 2013-12-30 一种基于设备监测数据间潜在关系的异常数据检测方法

Publications (2)

Publication Number Publication Date
CN103729444A CN103729444A (zh) 2014-04-16
CN103729444B true CN103729444B (zh) 2017-07-18

Family

ID=50453518

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310744995.8A Active CN103729444B (zh) 2013-12-30 2013-12-30 一种基于设备监测数据间潜在关系的异常数据检测方法

Country Status (1)

Country Link
CN (1) CN103729444B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104462794A (zh) * 2014-11-26 2015-03-25 北京金水永利科技有限公司 一种基于对比统计分析发现环境监测异常数据的算法
CN104902509B (zh) * 2015-05-19 2018-03-30 浙江农林大学 基于top‑k(σ)算法的异常数据检测方法
JP6740247B2 (ja) * 2015-12-01 2020-08-12 株式会社Preferred Networks 異常検出システム、異常検出方法、異常検出プログラム及び学習済モデル生成方法
CN109885556B (zh) * 2019-01-10 2021-12-21 四川长虹电器股份有限公司 一种设备数据模型的实现方法
CN112702219B (zh) * 2019-10-22 2023-01-13 中国移动通信有限公司研究院 物联网网络监测方法、装置、设备及存储介质
CN112560465B (zh) * 2020-12-18 2023-09-19 平安银行股份有限公司 批量异常事件的监控方法、装置、电子设备及存储介质
CN112862127B (zh) * 2021-04-23 2021-07-23 北京瑞莱智慧科技有限公司 一种传感器数据的异常处理方法、装置、电子设备及介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102830662A (zh) * 2011-06-14 2012-12-19 北京三博中自科技有限公司 一种流程工业管网系统的监控系统和方法
CN103302777A (zh) * 2013-06-26 2013-09-18 广东工业大学 一种基于神经网络的轮胎硫化机能耗异常检测方法
CN103473710A (zh) * 2013-08-20 2013-12-25 国家电网公司 一种集中运维系统的故障分级处理方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9405795B2 (en) * 2011-07-20 2016-08-02 Hitachi, Ltd. Stream data processing server and a non-transitory computer-readable storage medium storing a stream data processing program

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102830662A (zh) * 2011-06-14 2012-12-19 北京三博中自科技有限公司 一种流程工业管网系统的监控系统和方法
CN103302777A (zh) * 2013-06-26 2013-09-18 广东工业大学 一种基于神经网络的轮胎硫化机能耗异常检测方法
CN103473710A (zh) * 2013-08-20 2013-12-25 国家电网公司 一种集中运维系统的故障分级处理方法

Also Published As

Publication number Publication date
CN103729444A (zh) 2014-04-16

Similar Documents

Publication Publication Date Title
CN103729444B (zh) 一种基于设备监测数据间潜在关系的异常数据检测方法
CN107941537B (zh) 一种机械设备健康状态评估方法
CN104061445B (zh) 一种基于神经网络的管道泄漏检测方法
CN103336243B (zh) 基于分合闸线圈电流信号的断路器故障诊断方法
CN105376260B (zh) 一种基于密度峰值聚类的网络异常流量监测系统
CN105307200B (zh) 一种基于轨迹的无线传感器网络多维数据异常值检测方法
CN104766175A (zh) 一种基于时间序列分析的电力系统异常数据辨识与修正方法
CN111275288A (zh) 基于XGBoost的多维数据异常检测方法与装置
CN106055919B (zh) 一种基于遥测数据小波变换的卫星异常检测方法
CN102340811A (zh) 无线传感器网络故障诊断方法
CN106934125A (zh) 一种梯形噪声分布的指数模型机械设备剩余寿命预测方法
CN113485302B (zh) 基于多元时序数据的车辆运行过程故障诊断方法及系统
CN103776654A (zh) 多传感器信息融合的故障诊断方法
CN101950327A (zh) 一种基于故障树信息的设备状态预测方法
CN106338406A (zh) 列车牵引电传动系统的在线监测与故障预警系统及方法
CN104571077B (zh) 设备的监视诊断装置
CN102506444B (zh) 基于智能控制的计算机视觉技术的炉膛火焰检测方法
CN109297077B (zh) 监测中深层无干扰地岩热供热系统梯级利用系统的方法
CN103631681A (zh) 一种在线修复风电场异常数据的方法
CN106121622B (zh) 一种基于示功图的有杆泵抽油井的多故障诊断方法
CN102736562A (zh) 面向数控机床故障诊断与故障预报的知识库构建方法
CN102488518A (zh) 一种利用波动指数和提升训练的脑电检测方法和装置
CN105137324B (zh) 一种基于仿真分类模型的多探测点故障元器件定位方法
CN104331846A (zh) 一种窃电行为多源建模与协同分析方法
CN112101420A (zh) 一种相异模型下Stacking集成算法的异常用电用户识别方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant