CN109716356A - 多变量数据中的异常检测 - Google Patents
多变量数据中的异常检测 Download PDFInfo
- Publication number
- CN109716356A CN109716356A CN201780057812.1A CN201780057812A CN109716356A CN 109716356 A CN109716356 A CN 109716356A CN 201780057812 A CN201780057812 A CN 201780057812A CN 109716356 A CN109716356 A CN 109716356A
- Authority
- CN
- China
- Prior art keywords
- data
- coordinate space
- transformed
- assets
- threshold value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title description 21
- 230000005856 abnormality Effects 0.000 title description 12
- 238000012549 training Methods 0.000 claims abstract description 67
- 238000000034 method Methods 0.000 claims abstract description 44
- 230000002159 abnormal effect Effects 0.000 claims abstract description 24
- 238000004458 analytical method Methods 0.000 claims abstract description 23
- 230000009466 transformation Effects 0.000 claims description 43
- 238000000513 principal component analysis Methods 0.000 claims description 39
- 230000001052 transient effect Effects 0.000 claims description 14
- 230000001131 transforming effect Effects 0.000 claims description 11
- 238000009826 distribution Methods 0.000 claims description 10
- 239000004615 ingredient Substances 0.000 claims description 6
- 230000008602 contraction Effects 0.000 claims description 4
- 230000009467 reduction Effects 0.000 claims description 4
- 238000012545 processing Methods 0.000 description 47
- 230000006870 function Effects 0.000 description 35
- 238000004891 communication Methods 0.000 description 32
- 238000005259 measurement Methods 0.000 description 31
- 238000007405 data analysis Methods 0.000 description 27
- 230000000875 corresponding effect Effects 0.000 description 25
- 238000013500 data storage Methods 0.000 description 16
- 238000003860 storage Methods 0.000 description 14
- 238000012423 maintenance Methods 0.000 description 12
- 230000008859 change Effects 0.000 description 11
- 238000012544 monitoring process Methods 0.000 description 11
- 230000008569 process Effects 0.000 description 11
- 230000001960 triggered effect Effects 0.000 description 11
- 238000005516 engineering process Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 9
- 239000000446 fuel Substances 0.000 description 8
- 239000011159 matrix material Substances 0.000 description 8
- 230000004048 modification Effects 0.000 description 8
- 238000012986 modification Methods 0.000 description 8
- 238000007781 pre-processing Methods 0.000 description 8
- 239000012530 fluid Substances 0.000 description 7
- 230000003993 interaction Effects 0.000 description 7
- 239000003795 chemical substances by application Substances 0.000 description 6
- 230000007246 mechanism Effects 0.000 description 5
- 230000004044 response Effects 0.000 description 5
- 230000006399 behavior Effects 0.000 description 4
- 238000007689 inspection Methods 0.000 description 4
- 230000003137 locomotive effect Effects 0.000 description 4
- 230000015654 memory Effects 0.000 description 4
- 241001269238 Data Species 0.000 description 3
- 230000000712 assembly Effects 0.000 description 3
- 238000000429 assembly Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000003745 diagnosis Methods 0.000 description 3
- 230000006855 networking Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- 238000013506 data mapping Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000002156 mixing Methods 0.000 description 2
- 238000006116 polymerization reaction Methods 0.000 description 2
- 238000004393 prognosis Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000000844 transformation Methods 0.000 description 2
- 206010000117 Abnormal behaviour Diseases 0.000 description 1
- 240000002853 Nelumbo nucifera Species 0.000 description 1
- 235000006508 Nelumbo nucifera Nutrition 0.000 description 1
- 235000006510 Nelumbo pentapetala Nutrition 0.000 description 1
- 244000131316 Panax pseudoginseng Species 0.000 description 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 1
- 235000003140 Panax quinquefolius Nutrition 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 238000009412 basement excavation Methods 0.000 description 1
- 230000003796 beauty Effects 0.000 description 1
- 238000009529 body temperature measurement Methods 0.000 description 1
- 238000009933 burial Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000003795 desorption Methods 0.000 description 1
- 230000005684 electric field Effects 0.000 description 1
- 238000013213 extrapolation Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 235000008434 ginseng Nutrition 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000002595 magnetic resonance imaging Methods 0.000 description 1
- 238000003801 milling Methods 0.000 description 1
- 238000003032 molecular docking Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 238000010239 partial least squares discriminant analysis Methods 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 230000003334 potential effect Effects 0.000 description 1
- 238000010248 power generation Methods 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2135—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01D—MEASURING NOT SPECIALLY ADAPTED FOR A SPECIFIC VARIABLE; ARRANGEMENTS FOR MEASURING TWO OR MORE VARIABLES NOT COVERED IN A SINGLE OTHER SUBCLASS; TARIFF METERING APPARATUS; MEASURING OR TESTING NOT OTHERWISE PROVIDED FOR
- G01D21/00—Measuring or testing not otherwise provided for
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/2433—Single-class perspective, e.g. one-against-all classification; Novelty detection; Outlier detection
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Testing And Monitoring For Control Systems (AREA)
- Complex Calculations (AREA)
- Collating Specific Patterns (AREA)
Abstract
本文公开了用于检测从资产相关数据源接收的多变量数据(诸如来自资产的信号数据和/或其他数据)中的异常的系统、设备和方法。根据一示例,一种平台可从资产接收原始坐标空间中的多变量数据,以及将原始坐标空间中的数据变换到具有相对较少维数的经变换坐标空间。另外,该平台可标准化经变换坐标空间中的数据,以及基于经标准化数据与先前经由反映正常资产操作的训练数据定义的一组阈值之间的比较来修改该经标准化数据。之后,该平台可将经修改数据逆变换回到原始坐标空间并执行分析以检测异常。
Description
相关申请的交叉引用
本申请要求于2016年9月1日提交的题为“Detection of Anomalies inMultivariate Data(多变量数据中的异常检测)”的美国临时专利申请No.62/382,629的优先权,该临时申请通过援引整体纳入于此。本申请还要求于2016年12月1日提交的题为“Detection of Anomalies in Multivariate Data(多变量数据中的异常检测)”的美国非临时专利申请No.15/367,012的优先权,该非临时申请通过援引整体纳入于此。
背景
如今,机器(本文中也称为“资产”)在许多行业中无处不在。从跨国转运货物的机车到收割庄稼的农业设备,资产在日常生活中发挥着重要作用。由于资产发挥的作用越来越大,因此监视和分析操作中的资产也变得越来越合乎期望。为了促成这一点,一些人已开发出监视资产属性并检测资产处的异常状况的机制。例如,一种用于监视资产的办法一般涉及分布在整个资产中的各种传感器和/或致动器,这些传感器和/或致动器监视资产的操作状况并向资产上计算机提供反映该资产的操作的信号。作为一个代表性示例,如果资产是机车,则传感器和/或致动器可监视诸如温度、压力、流体液位、电压和/或速度以及其他示例之类的参数。如果由一个或多个传感器和/或致动器输出的信号达到特定值,则资产上计算机可以生成异常状况指示符,诸如“故障码”,该指示符是在资产内已发生异常状况的指示。资产上计算机还可被配置成监视、检测和生成指示诸如资产停机、重启等可能在资产处发生的其他事件的数据。
资产上计算机还可被配置成向远程位置发送反映资产的属性的数据(包括诸如信号数据、异常状况指示符、和/或资产事件指示符之类的操作数据)以供进一步分析。
概览
对监视和分析操作中的资产感兴趣的组织可部署资产数据平台,该资产数据平台被配置成接收和分析各种类型的资产相关数据。例如,资产数据平台可被配置成接收和分析指示资产属性的数据,诸如资产操作数据、资产配置数据、资产位置数据等等。作为另一示例,数据分析平台可被配置成接收和分析资产维护数据,诸如关于检查、保养、和/或维修的数据。作为又一示例,数据分析平台可被配置成接收和分析与资产操作相关的外部数据,诸如天气数据、交通数据等等。数据分析平台也可被配置成接收和分析各种其他类型的资产相关数据。
资产数据平台可从各种不同的源接收这种资产相关数据。作为一个示例,数据分析平台可从资产自身接收资产相关数据。作为另一示例,资产数据平台可从先前接收和/或生成资产相关数据的某个其他平台或系统(例如,组织的现有平台)接收资产相关数据。作为又一示例,资产数据平台可从外部数据源(诸如资产维护数据储存库、交通数据提供商、和/或天气数据提供商)接收资产相关数据。资产数据平台也可从各种其他源接收资产相关数据。
在操作中,在数据源处可能出现会导致由资产数据平台接收的数据中的异常的问题。例如,在给定资产(诸如已发生故障或正在出故障的特定传感器和/或致动器)处可能出现会导致从该给定资产接收的数据中的异常的问题。进而,这些异常会在资产数据平台处造成不期望的影响,诸如不必要的警报和不准确的预测。因此,一般期望资产数据平台对它从资产相关数据源接收的数据执行异常检测。
由资产数据平台接收的某些资产相关数据本质上可以是多变量的。例如,资产通常包括一组传感器和/或致动器,每个传感器和/或致动器用于(1)在资产的操作期间监视相应变量(例如,参数),诸如引擎温度、燃料液位、R.P.M等等,以及(2)输出针对所监视变量的信号值的时间序列,其中每个这种值对应于该值被测量的时间点。如此,资产的信号数据可采取多变量数据的时间序列的形式,其中序列中的每个相应数据点包括由资产的传感器和/或致动器在相应时间点测量的一组信号值。(另外,资产和/或资产数据平台可从资产的信号数据推导出其他变量,在该情形中这些推导出的变量也可被包括在多变量数据中)。在这方面,由资产监视的这组变量可被认为是原始坐标空间的不同维度。然而,这些变量中的许多变量可能是相关的,这会使得更加难以检测多变量数据中的异常。
本文公开了用于检测从资产相关数据源接收的多变量数据(诸如从资产接收的信号数据和/或其他数据)中的异常的经改善的系统、设备和方法。根据本公开,一种资产数据平台可被配置成执行一般涉及以下操作的异常检测过程:(1)接收原始坐标空间中的多变量数据(例如,来自资产的数据),该原始坐标空间具有等于该数据中所包括的变量数目的维数,(2)将所接收到的多变量数据从原始坐标空间变换(或“投影”)到具有比原始坐标空间少的维度的经变换坐标空间,(3)标准化经变换坐标空间中的数据,(4)基于经标准化数据与一组阈值之间的比较来修改经变换坐标空间中的经标准化数据,这组阈值是基于反映正常资产操作的训练数据来定义的,(5)将经修改数据从经变换坐标空间逆变换(或投影)到原始坐标空间,以及(6)分析原始坐标空间中的变换后数据以标识异常。该公开的异常检测过程可采取各种形式并以各种方式来实现。
根据一示例实现,该资产数据平台可接收原始坐标空间中的多变量数据(诸如来自资产的信号数据和/或其他数据),该原始坐标空间具有等于该数据中所包括的变量数目的维数。该接收到的多变量数据在本文中可被称为“观测数据”。在接收到观测数据之后,该资产数据平台可以可任选地在将其投影到经变换坐标空间之前对接收到的观测数据进行预处理,诸如通过归一化原始坐标空间中的数据。
该资产数据平台随后可使用诸如主成分分析(PCA)之类的技术将观测数据从原始坐标空间变换到经变换坐标空间,该PCA基于可从具有相关变量值的一组原始数据产生新的不相关变量(被称为主成分(PC))的线性变换过程。为了实现这一点,该变换可将属于与观测数据相关联的原始坐标空间的维度(例如,对应于变量)减少到足以表示数据的变化性的“隐藏”源的较少数目的PC。例如,如果观测数据点包括大数目的变量值并且因此占用具有大维数的原始坐标空间,则将PCA应用于原始观测数据可将该数据变换到包含减少维数的经变换坐标空间,其中经变换观测数据包括采取上述PC形式的减少数目的变量值。
在将观测数据变换到经变换坐标空间之后,该资产数据平台可标准化经变换观测数据。该标准化可采取各种形式。根据一个示例,标准化可涉及z分数标准化,该z分数标准化基本上重新缩放数据以使得数据遵循标准正态分布(例如,具有等于0的均值和等于1的标准差)。作为这种标准化的结果,数据可以经变换坐标空间的原点为中心。标准化也可采取其他形式。
在标准化经变换坐标空间中的经变换观测数据之后,该资产数据平台可将经标准化数据与一组阈值进行比较,这组阈值是基于反映正常资产操作的训练数据来定义的。在优选实施例中,该组阈值可包括经变换坐标空间中的每个变量的相应阈值,其中每个变量的阈值表示在正常资产操作期间该变量的最大预期值。然而,这组阈值也可以采取其他形式。该资产数据平台可按各种形式基于训练数据来定义该组阈值。
在一种实现中,基于训练数据来为经变换坐标空间定义这组阈值的功能可涉及(1)以类似于上面描述的方式(例如,使用PCA)将训练数据从原始坐标空间变换到经变换坐标空间,(2)以类似于上面描述的方式来标准化经变换坐标空间中的经变换训练数据,(3)对于经变换坐标空间中的每个变量,使用经标准化训练数据值的标准差来确定该变量在经变换坐标空间中的最大预期值。在这方面,这组阈值可有效地定义以经变换坐标空间的原点为中心的多维封闭形状(例如,圆形、椭圆形等等)的边界。这组阈值也可按其他方式来定义。
该资产数据平台可按各种方式来执行经标准化观测数据与这组阈值之间的比较。在优选示例中,该资产数据平台可将经变换坐标空间中的每个变量的观测数据点的值与针对该变量所定义的阈值进行比较,以确定该数据点的值是否超过所定义的阈值。然而,资产数据平台也可按其他方式来执行该比较。
基于经标准化观测数据与这组阈值之间的比较,该资产数据平台随后可修改经变换坐标空间中的经标准化观测数据。例如,如果该资产数据平台基于比较而确定观测数据点在经变换坐标空间中包括至少一个变量值,该至少一个变量值超过针对该变量所定义的阈值,则该资产数据平台可修改观测数据点以使得该至少一个变量值不再超过所定义的阈值。换言之,该资产数据平台可“收缩(shrink)”观测数据点的一个或多个值,以使得数据点落在由这组阈值界定的多维封闭形状内(或者至少更靠近该多维封闭形状)。该资产数据平台可按各种方式来执行该修改。
在一种实现中,该资产数据平台可通过用所定义的阈值替换超过所定义的阈值的任何变量值,来在逐变量的基础上修改经变换坐标空间中的观测数据点。例如,如果给定数据点包括超过变换坐标空间中所定义的阈值的两个变量值,则该资产数据平台可用针对每个这种变量所定义的阈值来替换该变量的值,从而使得减少这两个变量值的幅值。
在另一实现中,该资产数据平台可通过以协调的方式修改数据点的多个值来修改经变换坐标空间中的观测数据点。例如,如果变换坐标空间中的给定数据点被确定为落在由经变换坐标空间中的这组阈值界定的多维封闭形状之外,则该资产数据平台可修改该给定点的一组变量值以使得该数据点被移至经变换坐标空间中的多维封闭形状上的最接近点。该资产数据平台也可按其他方式来修改经变换坐标空间中的观测数据点。
在观测数据已在经变换坐标空间中被修改之后,该资产数据平台可被配置成将经修改观测数据从经变换坐标空间逆变换回到原始坐标空间。在实践中,以此方式在经变换坐标空间中被修改并且随后被投影回到原始坐标空间的所观测数据点可具有与原始坐标空间中接收到的观测数据有意义地不同的至少一个变量值。换言之,在原始坐标空间的至少一个维度中在变换前观测数据点与变换后观测数据点之间可能存在“间隙”,这可指示异常。
在逆变换经修改观测数据之后,该资产数据平台还可被配置成后处理此类数据。
最后,该资产数据平台可被配置成执行对原始坐标空间中的变换后观测数据的分析以标识异常。例如,该资产数据平台可分析变换后观测数据在某个时间段上与原始坐标空间中的变换前观测数据相比较的情况,以标识观测数据中的一个或多个变量看起来异常的实例(例如,至少一个变量值在变换后与变换前观测数据之间存在统计上的显著差异的实例)。基于该分析,该资产数据平台可生成对这种异常的通知,这些通知可被呈现给该平台的感兴趣用户。该资产数据平台还可基于由上述过程生成的数据来执行各种其他功能。
如上面讨论的,本文所提供的各示例涉及检测从资产相关数据源接收的多变量数据(诸如来自资产的信号数据和/或其他数据)中的异常。在一个方面,提供了一种计算设备。该计算设备包括:至少网络接口、至少一个处理器、非瞬态计算机可读介质、以及存储在该非瞬态计算机可读介质上的程序指令。这些程序指令可由至少一个处理器执行以使计算设备进行以下操作:(a)经由网络接口从资产接收原始坐标空间中的多变量数据,该原始坐标空间具有等于该数据中所包括的变量数目的维数;(b)将所接收到的多变量数据从原始坐标空间变换到具有比原始坐标空间少的维度的经变换坐标空间;(c)标准化经变换坐标空间中的数据;(d)基于一组阈值来修改经变换坐标空间中的经标准化数据,其中这组阈值是基于反映正常资产操作的训练数据来定义的;(e)将经修改数据从经变换坐标空间逆变换到原始坐标空间;以及(f)分析原始坐标空间中的经逆变换数据以标识异常。在其他方面,提供了执行与计算设备相同和/或基本上相似功能的非瞬态计算机可读介质和计算机实现的方法。
有利地,所公开的过程可使得更迅速和/或更准确的检测多变量数据中的异常。
本领域普通技术人员将在阅读以下公开内容后领会这些方面以及众多其他方面。
附图简述
图1描绘了其中可实现示例实施例的示例网络配置。
图2描绘了示例资产的简化框图。
图3描绘了示例异常状况指示符和传感器准则的概念图示。
图4描绘了示例平台的结构图。
图5是示例平台的功能框图。
图6是描绘了为经变换坐标空间定义一组阈值的示例流程图。
图7描绘了训练由示例平台获得的数据的概念图示。
图8描绘了所获得的训练数据被变换到经变换坐标空间的概念图示。
图9描绘了经变换训练数据在经变换坐标空间中被标准化的概念图示。
图10描绘了经变换坐标空间中的一组阈值的概念图示。
图11是描绘了检测接收到的资产观测数据中的异常的示例流程图。
图12描绘了成分收缩示例的概念图示。
图13描绘了向量收缩示例的概念图示。
详细描述
以下公开对附图和若干示例性场景作出参考。本领域普通技术人员将理解,这些参考仅仅是出于解释的目的,且因此并不意味着限制。所公开的系统、设备和方法的部分或全部可按各种方式来重新排列、组合、添加、和/或移除,其中的每一种方式都在本文中得到了构想。
I.示例网络配置
现在转到附图,图1描绘了其中可实现示例实施例的示例网络配置100。如图所示,网络配置100在其核心处包括远程计算系统102,该远程计算系统102可被配置为资产数据平台,其可经由通信网络104与诸如代表性资产106和108等一个或多个资产、诸如代表性数据源110等一个或多个数据源以及诸如代表性客户站112等一个或多个输出系统进行通信。应理解,该网络配置也可包括各种其他系统。
大体而言,资产数据平台102(本文中有时被称为“资产状况监视系统”)可采取被配置成接收、摄取、处理、分析资产相关数据和/或提供对资产相关数据的访问的一个或多个计算机系统的形式。例如,平台可以包括具有硬件组件和软件组件的一个或多个服务器(或类似物),这些硬件组件和软件组件被配置成执行本文所公开的用于接收、摄取、处理、分析资产相关数据和/或提供对资产相关数据的访问的一个或多个功能。另外,平台可以包括使得平台用户能够与该平台对接的一个或多个用户接口组件。在实践中,这些计算系统可以位于单个物理位置或分布在多个位置之间,并且可以经由系统总线、通信网络(例如,专用网络)或某一其他连接机制来通信地链接。此外,平台可以被布置成根据数据流技术(诸如TPL数据流或NiFi以及其他示例)来接收和传送数据。平台也可采取其他形式。资产数据平台102以下参照图4更详细地讨论。
如图1中所示,资产数据平台102可以被配置成经由通信网络104与网络配置100中的一个或多个资产、数据源和/或输出系统进行通信。例如,资产数据平台102可以经由通信网络104接收由一个或多个资产和/或数据源发送的资产相关数据。作为另一示例,资产数据平台102可以经由通信网络104传送资产相关数据和/或命令,以供诸如客户站、工作命令系统、零件订购系统等输出系统接收。资产数据平台102也可经由通信网络104参与其他类型的通信。
一般而言,通信网络104可包括一个或多个计算系统以及被配置成促成在资产数据平台102与网络配置100中的一个或多个资产、数据源和/或输出系统之间转移数据的网络基础设施。通信网络104可以是或者可以包括一个或多个广域网(WAN)和/或局域网(LAN),其可以是有线和/或无线的并且可支持安全通信。在一些示例中,通信网络104可包括一个或多个蜂窝网络和/或互联网、以及其他网络。通信网络104可根据诸如LTE、CDMA、GSM、LPWAN、WiFi、蓝牙、以太网、HTTP/S、TCP、CoAP/DTLS等等之类的一个或多个通信协议来操作。虽然通信网络104被示为单个网络,但应当理解,通信网络104可包括其自身通信地链接的多个不同的网络。此外,在示例情形中,通信网络104可促成各网络组件之间的安全通信(例如,经由加密或其他安全措施)。通信网络104也可采取其他形式。
此外,尽管未示出,但资产数据平台102与一个或多个资产、数据源和/或输出系统之间的通信路径可包括一个或多个中间系统。例如,一个或多个资产和/或数据源可以向诸如资产网关或组织的现有平台(未示出)等一个或多个中间系统发送资产相关数据,并且资产数据平台102随后可被配置成从一个或多个中间系统接收资产相关数据。作为另一示例,资产数据平台102可经由诸如主机服务器(未示出)等一个或多个中间系统与输出系统通信。许多其它配置也是可能的。
一般而言,资产106和108可采取被配置成执行一个或多个操作(其可基于字段来定义)的任何设备的形式,并且还可包括被配置成传送指示资产的属性(诸如给定资产的操作和/或配置)的数据的装备。该数据可采取各种形式,其示例可包括信号数据(例如,传感器/致动器数据)、故障数据(例如,故障码)、资产的位置数据、资产的标识数据等等。
资产类型的代表性示例可包括运输机械(例如,机车、航空器、客车、半拖挂卡车、船舶等)、工业机械(例如,挖掘装备、建筑装备、加工装备、组装装备等)、医疗机械(例如,医学成像装备、手术装备、医学监视系统、医学实验室装备等)、实用机械(例如,涡轮机、太阳能农场等)、和无人驾驶飞行器、以及其他示例。另外,每种给定类型的资产可以具有各种不同的配置(例如,品牌、制造商、型号、固件版本等)。
由此,在一些示例中,资产106和108可各自具有相同的类型(例如,一队机车或航空器、一组风力涡轮机、一组铣床、或一组磁共振成像(MRI)机以及其他示例)并且或许可以具有相同的配置(例如,相同的品牌、制造商、型号、固件版本等)。在其他示例中,资产106和108可具有不同的资产类型或不同的配置(例如,不同的品牌、制造商、型号和/或固件版本)。例如,资产106和108可以是施工现场(例如,挖掘现场)或生产设施处的装备的不同部件、以及众多其他示例。本领域普通技术人员将领会,这些仅仅是资产的一些示例,并且众多其他示例在本文中是可能的且得到了构想。
取决于资产的类型和/或配置,资产还可包括被配置成执行一个或多个相应操作的一个或多个子系统。例如,在运输资产的上下文中,子系统可包括引擎、变速器、传动系、燃料系统、电池系统、排气系统、制动系统、电气系统、信号处理系统、发电机、齿轮箱、转子和液压系统,以及众多其他示例。在实践中,资产的多个子系统可按并行方式或顺序地操作以使资产操作。下面参照图2进一步详细讨论代表性资产。
一般而言,数据源110可以是或包括一个或多个计算系统,该一个或多个计算系统被配置成收集、存储和/或提供与资产相关或者以其他方式与资产数据平台102所执行的功能相关的数据。例如,数据源110可以收集并提供源自资产的操作数据(例如,历史操作数据、训练数据等等),在这种情形中,数据源110可以用作这种资产操作数据的替代源。作为另一示例,数据源110可以被配置成提供不源自资产的数据,该数据在本文中可被称为“外部数据”。这种数据源可采取各种形式。
在一种实现中,数据源110可以采取环境数据源的形式,该环境数据源被配置成提供指示资产在其中操作的环境的某种特性的数据。环境数据源的示例包括气象数据服务器、全球导航卫星系统(GNSS)服务器、地图数据服务器和地形数据服务器,其提供关于给定区域的自然和人造特征的信息、以及其他示例。
在另一实现中,数据源110可采取资产管理数据源的形式,该资产管理数据源提供指示可影响资产的操作或维护(例如,资产何时和何地可以操作或接收维护)的实体(例如,其他资产)的事件或状态的数据。资产管理数据源的示例包括提供关于已对资产执行和/或被调度成对资产执行的检查、维护、保养和/或维修的信息的资产维护服务器,提供关于空气、水和/或地面交通的信息的交通数据服务器,提供关于资产在特定日期和/或特定时间的预期路线和/或位置的信息的资产调度服务器,提供关于经过缺陷检测器系统附近的资产的一个或多个操作状况的信息的缺陷检测器系统(也称为“热盒”检测器),提供关于特定供应商具有库存的部件及其价格的信息的部件供应商服务器,以及其他示例。
数据源110还可以采取其他形式,其示例可以包括提供关于流体分析的结果的信息的流体分析服务器,以及提供关于电力消耗的信息的电网服务器,以及其他示例。本领域普通技术人员将领会,这些仅仅是数据源的一些示例,并且众多其他示例是可能的。
在实践中,资产数据平台102可通过“订阅”由数据源提供的服务来从数据源110接收数据。然而,资产数据平台102也可按其他方式从数据源110接收数据。
客户站112可采取被配置成访问资产数据平台102并使得用户能够与该资产数据平台102交互的计算系统或设备的形式。为了促成这一点,客户站可以包括硬件组件,诸如用户接口、网络接口、处理器和数据存储器,以及其他组件。另外,客户站可以配置有使得能够与资产数据平台102交互的软件组件,诸如能够访问由资产数据平台102提供的web应用的web浏览器或者与资产数据平台102相关联的本机客户端应用,以及其他示例。客户站的代表性示例可包括台式计算机、膝上型设备、上网本、平板、智能电话、个人数字助理(PDA)、或现在已知或以后开发的任何其他此类设备。
输出系统的其他示例可以包括工作命令系统,其被配置成输出对机修工等的维修资产的请求,或者零件订购系统,其被配置成对资产的部件下订单并输出其收据,以及其他系统。
应当理解,网络配置100是其中可以实现本文所描述的各实施例的网络的一个示例。众多其他布置是可能的且在本文中得到了构想。例如,其他网络配置可包括未图示的附加组件和/或更多或更少的图示出的组件。
II.示例资产
转到图2,描绘了示例资产200的简化框图。来自图1的资产106和108中的任一者或两者可如资产200那样进行配置。如图所示,资产200可包括一个或多个子系统202、一个或多个传感器204、一个或多个致动器205、中央处理单元206、数据存储208、网络接口210、用户接口212、位置单元214,并且可能还包括本地分析设备220,所有这些可通过系统总线、网络或其他连接机制来以通信方式(直接或间接地)链接。本领域普通技术人员将领会,资产200可包括未示出的附加组件和/或更多或更少的所描绘的组件。
广义上说,资产200可包括被配置成执行一个或多个操作的一个或多个电组件、机械组件、和/或机电组件。在一些情形中,一个或多个组件可被分组到给定子系统202中。
一般而言,子系统202可包括作为资产200的一部分的一组相关组件。单个子系统202可独立地执行一个或多个操作,或者单个子系统202可连同一个或多个其他子系统一起操作以执行一个或多个操作。通常,不同类型的资产且甚至相同类型不同等级的资产可包括不同的子系统。子系统的代表性示例在以上参照图1讨论。
如以上所建议的,资产200可配备有被配置成监视资产200的操作状况的各种传感器204,以及被配置成与资产200或其组件交互并监视资产200的操作状况的各种致动器205。在一些情形中,传感器204和/或致动器205中的一些可基于特定子系统202来被分组。以此方式,传感器204和/或致动器205的组可被配置成监视特定子系统202的操作状况,并且来自该组的致动器可被配置成按可基于这些操作状况改变该特定子系统202的行为的某种方式来与该子系统交互。
一般而言,传感器204可被配置成检测可指示资产200的一个或多个操作状况的物理属性,以及提供对所检测到的物理属性的指示,诸如电信号。在操作中,传感器204可被配置成连续地、周期性地(例如,基于采样频率)、和/或响应于某个触发事件来获得测量。在一些示例中,传感器204可预先配置有用于执行测量的操作参数和/或可根据由中央处理单元206提供的操作参数(例如,指令传感器204获得测量的采样信号)来执行测量。在示例中,不同传感器204可具有不同的操作参数(例如,一些传感器可基于第一频率进行采样,而其他传感器基于第二不同的频率进行采样)。在任何情况下,传感器204可被配置成向中央处理单元206传送指示所测得的物理属性的电信号。传感器204可向中央处理单元206连续地或周期性地提供此类信号。
例如,传感器204可被配置成测量诸如资产200的位置和/或移动之类的物理属性,在该情形中,该传感器可采取GNSS传感器、基于航位推算的传感器、加速度计、陀螺仪、计步器、磁力计等等形式。在示例实施例中,一个或多个此类传感器可与位置单元214集成或者位于与其分离,如以下所讨论的。
另外,各种传感器204可被配置成测量资产200的其他操作状况,其示例可包括温度、压力、速度、加速或减速率、摩擦、功率使用、节流阀位置、燃料使用、流体液位、运行时、电压和电流、磁场、电场、对象的存在或不存在、组件的位置和发电、以及其他示例。本领域普通技术人员将领会,这些仅仅是传感器可被配置成测量的一些示例操作状况。取决于工业应用或特定资产,可使用附加或更少的传感器。
如以上所建议的,致动器205可在某些方面类似于传感器204进行配置。具体而言,致动器205可被配置成检测指示资产200的操作状况的物理属性并按类似于传感器204的方式提供其指示。
此外,致动器205可被配置成与资产200、一个或多个子系统202、和/或其某个组件交互。由此,致动器205可包括被配置成执行机械操作(例如,移动)或以其他方式控制组件、子系统或系统的电机等等。在特定示例中,致动器可被配置成测量燃料流量和改变燃料流(例如,限制燃料流),或者致动器可被配置成测量液压和改变液压(例如,增加或减小液压)。致动器的众多其他示例交互也是可能的且在本文中得到了构想。
一般而言,中央处理单元206可包括一个或多个处理器和/或控制器,其可采取通用或专用处理器或控制器的形式。具体而言,在示例实现中,中央处理单元206可以是或者包括微处理器、微控制器、专用集成电路、数字信号处理器等等。进而,数据存储208可以是或者包括一个或多个非瞬态计算机可读存储介质,诸如光学、磁、有机或闪存存储器、以及其他示例。
中央处理单元206可被配置成储存、访问和执行被储存在数据存储208中的计算机可读程序指令以执行本文所描述的资产的操作。例如,如以上所建议的,中央处理单元206可被配置成从传感器204和/或致动器205接收相应传感器信号。中央处理单元206可被配置成将传感器和/或致动器数据储存在数据存储208中并稍后从该数据存储208访问该数据。另外,中央处理单元206可被配置成访问和/或生成反映资产的配置的数据(例如,型号、资产年龄、所安装的软件版本等等)。
中央处理单元206还可被配置成确定所接收到的传感器和/或致动器信号是否触发任何异常状况指示符,诸如故障码(其是故障数据的一种形式)。例如,中央处理单元206可被配置成在数据存储208中储存异常状况规则,其中每一者都包括表示特定异常状况的给定异常状况指示符和触发该异常状况指示符的相应触发准则。即,每个异常状况指示符与在该异常状况指示符被触发之前必须被满足的一个或多个传感器和/或致动器测量值相对应。在实践中,资产200可用异常状况规则来预编程和/或可从计算系统(诸如资产数据平台102)接收新的异常状况规则或对现有规则的更新。
在任何情况下,中央处理单元206可被配置成确定所接收到的传感器和/或致动器信号是否触发任何异常状况指示符。即,中央处理单元206可确定所接收到的传感器和/或致动器信号是否满足任何触发准则。当这种确定为肯定时,中央处理单元206可生成异常状况数据,并且随后还可致使资产的网络接口210将该异常状况数据传送到资产数据平台102,和/或者致使资产的用户接口212输出异常状况的指示,诸如视觉和/或可听警报。另外,中央处理单元206可数据存储208中(可能利用时间戳)记录正被触发的异常状况指示符的发生。
图3描绘了资产的示例异常状况指示符和相应触发准则的概念图示。具体而言,图3描绘了示例故障码的概念图示。如图所示,表300包括分别对应于传感器A、致动器B和传感器C的列302、304和306以及分别对应于故障码1、2和3的行308、310和312。条目314于是指定对应于给定故障码的传感器准则(例如,传感器值阈值)。
例如,当传感器A检测到大于135转每分钟(RPM)的旋转测量且传感器C检测到大于65°摄氏度(C)的温度测量时故障码1将被触发,当致动器B检测到大于1000伏特(V)的电压测量且传感器C检测到小于55℃的温度测量时故障码2将被触发,而当传感器A检测到大于100RPM的旋转测量、致动器B检测到大于750V的电压测量且传感器C检测到大于60℃的温度测量时故障码3将被触发。本领域普通技术人员将领会,图3仅仅是出于示例和解释的目的而提供的,并且众多其他故障码和/或触发准则是可能的且在本文中得到了构想。
返回参照图2,中央处理单元206可被配置成执行同样用于管理和/或控制资产200的操作的各种附加功能。例如,中央处理单元206可被配置成向子系统202和/或致动器205提供致使该子系统202和/或致动器205执行某个操作(诸如修改节流阀位置)的指令信号。附加地,中央处理单元206可被配置成修改其以此处理来自传感器204和/或致动器205的数据的速率,或者中央处理单元206可被配置成向传感器204和/或致动器205提供致使该传感器204和/或致动器205(举例而言)修改采样率的指令信号。此外,中央处理单元206可被配置成从子系统202、传感器204、致动器205、网络接口210、用户接口212、和/或位置单元214接收信号并且基于此类信号致使操作发生。更进一步,中央处理单元206可被配置成从诸如诊断设备之类的计算设备接收致使中央处理单元206根据被储存在数据存储208中的诊断规则执行一个或多个诊断工具的信号。下面讨论中央处理单元206的其他功能性。
网络接口210可被配置成提供资产200和连接到通信网络104的各种网络组件之间的通信。例如,网络接口210可被配置成促成去往和来自通信网络104的无线通信,并且由此可采取用于传送和接收各种空中(over-the-air)信号的天线结构及相关联装备的形式。其他示例也是可能的。在实践中,网络接口210可根据通信协议进行配置,诸如但不限于以上所描述的那些通信协议中的任一种。
用户接口212可被配置成促成与资产200的用户交互,并且还可被配置成促成致使资产200响应于用户交互执行操作。用户接口212的示例包括触敏接口、机械接口(例如,手柄、按钮、轮、拨号盘、键盘等)和其他输入接口(例如,话筒)、以及其他示例。在一些情形中,用户接口212可包括或提供到诸如显示屏、扬声器、耳机插孔等等之类的输出组件的连通性。
位置单元214可一般被配置成促成执行与地理空间定位/位置和/或导航有关的功能。更具体而言,位置单元214可被配置成促成经由一种或多种定位技术(诸如GNSS技术(例如,GPS、GLONASS、伽利略、北斗等)、三角测量技术等)确定资产200的定位/位置和/或跟踪资产200的移动。如此,位置单元214可包括根据一种或多种特定定位技术来配置的一个或多个传感器和/或接收器。
在示例实施例中,位置单元214可允许资产200向其它系统和/或设备(例如,资产数据平台102)提供指示资产200的位置的位置数据,该位置数据可采取GPS坐标的形式以及其它形式。在一些实现中,资产200可连续地、周期性地、基于触发地或以某种其它方式向其它系统提供位置数据。此外,资产200可独立于或连同其它资产相关数据(例如,连同操作数据)提供位置数据。
本地分析设备220可一般被配置成接收和分析与资产200相关的数据,并且基于这种分析可致使一个或多个操作在资产200处发生。例如,本地分析设备220可接收资产200的操作数据(例如,由传感器204和/或致动器205生成的信号数据)并且基于此类数据可向中央处理单元206、传感器204、和/或致动器205提供致使资产200执行操作的指令。在另一示例中,本地分析设备220可从位置单元214接收位置数据并且基于此类数据,可修改它如何处置针对该资产200的预测模型和/或工作流。其它示例分析和对应的操作也是可能的。
为了促成这些操作中的一些操作,本地分析设备220可包括被配置成将该本地分析设备220耦合到资产的板上(on-board)系统中的一者或多者的一个或多个资产接口。例如,如图2中所示,本地分析设备220可具有到资产的中央处理单元206的接口,其可使得本地分析设备220能够从中央处理单元206接收数据(例如,由传感器204和/或致动器205生成且发送给中央处理单元206的操作数据,或者由位置单元214生成的位置数据)并随后向中央处理单元206提供指令。以此方式,本地分析设备220可经由中央处理单元206间接地与资产200的其他板上系统(例如,传感器204和/或致动器205)对接并从资产200的其他板上系统接收数据。附加地或替换地,如图2中所示,本地分析设备220可具有到一个或多个传感器204和/或致动器205的接口,其可使得本地分析设备220能够与传感器204和/或致动器205直接地通信。本地分析设备220也可按其他方式与资产200的板上系统对接,包括图2中所解说的接口由未示出的一个或多个中间系统促成的可能性。
在实践中,本地分析设备220可使得资产200能够在本地执行高级分析及相关联的操作(诸如执行预测模型及对应的工作流),这些分析和操作可能不能够以其他方式利用其他资产上组件来执行。由此,本地分析设备220可帮助向资产200提供附加处理能力和/或情报。
应当理解,本地分析设备220还可被配置成致使资产200执行与预测模型不相关的操作。例如,本地分析设备220可从远程源(诸如资产数据平台102或输出系统112)接收数据,并且基于所接收到的数据致使资产200执行一个或多个操作。一个特定示例可涉及本地分析设备220从远程源接收针对资产200的固件更新,并随后致使资产200更新其固件。另一特定示例可涉及本地分析设备220从远程源接收诊断指令,并随后根据所接收到的指令致使资产200执行本地诊断工具。众多其他示例也是可能的。
如图所示,除了以上所讨论的一个或多个资产接口之外,本地分析设备220还可包括处理单元222、数据存储224和网络接口226,所有这些可通过系统总线、网络、或其他连接机制来被通信地链接。处理单元222可包括以上关于中央处理单元206所讨论的任何组件。进而,数据存储224可以是或者包括一个或多个非瞬态计算机可读存储介质,其可采取以上所讨论的计算机可读存储介质的任何形式。
处理单元222可被配置成储存、访问和执行被储存在数据存储224中的计算机可读程序指令以执行本文所描述的本地分析设备的操作。例如,处理单元222可被配置成接收由传感器204和/或致动器205生成的相应传感器和/或致动器信号,并且可基于此类信号来执行预测模型和相应的工作流。下面描述其他功能。
网络接口226可以与以上所描述的网络接口相同或类似。在实践中,网络接口226可促成本地分析设备220和资产数据平台102之间的通信。
在一些示例实现中,本地分析设备220可包括可类似于用户接口212的用户接口和/或与其通信。在实践中,用户接口可位于远离本地分析设备220(和资产200)。其他示例也是可能的。
尽管图2示出了本地分析设备220经由一个或多个资产接口物理地且通信地耦合到其相关联的资产(例如,资产200),但是还应当理解,该情形可能并非总是如此。例如,在一些实现中,本地分析设备220可以不物理地耦合到其相关联的资产,而是替代地可位于远离资产200。在这种实现的示例中,本地分析设备220可被无线地、通信地耦合到资产200。其他布置及配置也是可能的。
关于本地分析设备的配置和操作的更多细节请参见通过引用整体纳入于此的美国申请No.14/963,207。
本领域普通技术人员将领会,图2中所示的资产200仅仅是资产的简化表示的一个示例,并且众多其他示例也是可能的。例如,其他资产可包括未图示的附加组件和/或更多或更少的图示出的组件。此外,给定资产可包括被一致操作以执行该给定资产的操作的多个个体资产。其他示例也是可能的。
III.示例平台
图4是从结构角度解说可被包括在示例数据资产平台400中的一些组件的简化框图。根据上面的讨论,数据资产平台400一般可以包括一个或多个计算机系统(例如,一个或多个服务器),并且这些一个或多个计算机系统可以共同包括至少处理器402、数据存储404、网络接口406,并且可能还有用户接口410,所有这些都可以通过诸如系统总线、网络或其他连接机制之类的通信链路408通信地链接。
处理器402可包括一个或多个处理器和/或控制器,其可采取通用或专用处理器或控制器的形式。具体而言,在示例实现中,处理单元402可以包括微处理器、微控制器、专用集成电路、数字信号处理器等等。
数据存储404进而可以包括一个或多个非瞬态计算机可读存储介质,其示例可以包括易失性存储介质(诸如随机存取存储器、寄存器、高速缓存等)以及非易失性存储介质(诸如只读存储器、硬盘驱动器、固态驱动器、闪存、光存储设备等)。
如图4中所示,数据存储404可以置备有使得平台400能够执行本文所公开的各功能的软件组件。这些软件组件一般可采取可由处理器402执行的程序指令的形式,并且可被一起布置成应用、软件开发工具包、工具集等。另外,数据存储404还可置备有被布置成存储与由平台执行的功能相关的数据的一个或多个数据库,数据库的示例包括时间序列数据库、文档数据库、关系数据库(例如,MySQL)、键值数据库和图形数据库等等。该一个或多个数据库还可提供多种语言混合组成的存储。
网络接口406可被配置成促成经由通信网络104在平台400与诸如资产106和108、数据源110和客户站112等各种网络组件之间进行无线和/或有线通信。由此,网络接口406可采取用于执行这些功能的任何合适的形式,示例形式可包括以太网接口、串行总线接口(例如,火线、USB 2.0等)、芯片组以及被适配成促成无线通信的天线和/或提供有线和/或无线通信的任何其它接口。网络接口406还可以包括支持各种不同类型的网络连接的多个网络接口,网络接口的一些示例可以包括Hadoop、FTP、关系数据库、诸如OSI PI等高频数据、诸如XML等批量数据、以及Base64。其他配置也是可能的。
示例数据资产平台400还可以支持用户接口410,用户接口410被配置成促成用户与平台400的交互,并且还可以被配置成促成致使平台400响应于用户交互来执行操作。用户接口410可以包括或提供到各种输入组件的连通性,其示例包括触敏接口、机械接口(例如,手柄、按钮、轮、拨号盘、键盘等),以及其他输入接口(例如,话筒)。另外,用户接口410可包括或提供到各种输出组件的连通性,其示例可包括显示屏、扬声器、耳机插孔等等。其他配置也是可能的,包括用户接口410在通信地耦合到示例平台的客户站内实施的可能性。
现在参照图5,提供了另一简化框图以便从功能角度示出可被包括在示例平台500中的一些组件。例如,如图所示,示例平台500可以包括数据摄入系统502和数据分析系统504,其中每个系统包括被配置成执行特定功能的硬件和软件的组合。平台500还可包括多个数据库506,这些数据库506被包括在和/或以其它方式耦合到数据摄入系统502和数据分析系统504中的一者或多者中。在实践中,这些功能系统可以在单个计算机系统上实现或跨多个计算机系统分布。
数据摄入系统502一般可用于接收资产相关数据并随后将所接收到的数据的至少一部分提供给数据分析系统504。由此,数据摄入系统502可以被配置成从各种源接收资产相关数据,其示例可以包括资产、资产相关数据源或组织的现有平台/系统。由数据摄入系统502接收的数据可以采取各种形式,其示例可以包括模拟信号、数据流和/或网络分组。此外,在一些示例中,数据摄入系统502可以根据给定数据流技术(诸如NiFi接收器等)来配置。
在一些实施例中,在数据摄入系统502从给定源(例如,资产、组织的现有平台/系统、外部资产相关数据源等等)接收数据之前,该源可以置备有数据代理508。一般而言,数据代理508可以是软件组件,其用于访问给定数据源处的资产相关数据,以适当的格式放置数据,并且随后促成将该数据传输到平台500以供数据摄入系统502接收。由此,数据代理508可以使给定源执行诸如压缩和/或解压缩、加密和/或解密、模数和/或数模转换、过滤、放大和/或数据映射等操作。然而,在其他实施例中,给定数据源或许能够在没有数据代理帮助的情况下访问、格式化和/或传送资产相关数据到示例平台500。
由数据摄入系统502接收的资产相关数据可采取各种形式。作为一个示例,资产相关数据可包括与操作中的资产的属性相关的数据,该数据可源自该资产本身或源自外部源。该资产属性数据可包括资产操作数据,诸如信号数据(例如,传感器和/或致动器数据)、故障数据、资产位置数据、天气数据、热盒数据等等。另外,资产属性数据还可包括资产配置数据,诸如指示资产的品牌、制造商、型号、年龄、软件版本等等的数据。作为另一示例,资产相关数据可包括关于资产相关数据的起源的某些属性,诸如源标识符、时间戳(例如,获得信息的日期和/或时间)、以及获得信息的位置的标识符(例如,GPS坐标)。例如,唯一性的标识符(例如,计算机生成的字母、数字、字母数字或类似标识符)可被指派给每个资产,并且可能被指派给每个传感器和致动器,并且可用于标识数据源自的资产、传感器或致动器。这些属性可以以信号签名或元数据、以及其他示例的形式出现。由数据摄入系统502接收的资产相关数据也可采取其他形式。
数据摄入系统502还可被配置成对资产相关数据执行各种预处理功能,以力图向数据分析系统504提供干净、最新、准确、可用等等的数据。
例如,数据摄入系统502可以将所接收到的数据映射到所定义的数据结构中,并且潜在地丢弃不能映射到这些数据结构的任何数据。作为另一示例,数据摄入系统502可评估所接收到的数据的可靠性(或“健康”),并基于该可靠性来采取某些动作,诸如丢弃某些或任何不可靠的数据。作为又一示例,数据摄入系统502可以通过标识平台已经接收到的任何数据并且然后忽略或丢弃这种数据来“重复删除”所接收到的数据。作为又一示例,数据摄入系统502可以确定所接收到的数据与已经存储在平台的数据库506中的数据(例如,相同数据的不同版本)相关,并且随后将所接收到的数据与所存储的数据一起合并为一个数据结构或记录。作为进一步示例,数据摄入系统502可基于接收到的数据来标识要采取的动作(例如,CRUD动作),并随后(例如,经由HTTP报头)向数据分析系统504通知所标识的动作。作为更进一步示例,数据摄入系统502可以将所接收到的数据划分成特定数据类别(例如,通过将不同的数据类别放入不同的队列中)。也可以执行其他功能。
在一些实施例中,数据代理508可能还可以执行或协助这些预处理功能中的某些功能。作为一个可能的示例,数据映射功能可以全部或部分地由数据代理508而不是数据摄入系统502执行。其他示例也是可能的。
数据摄入系统502可进一步被配置成将所接收到的资产相关数据存储在一个或多个数据库506中以供稍后检索。例如,数据摄入系统502可存储从数据代理508接收到的原始数据,并且还可存储因上述一个或多个预处理功能而产生的数据。根据上面的讨论,数据摄入系统502要将该数据存储到的数据库可采取各种形式,其示例包括时间序列数据库、文档数据库、关系数据库(例如,MySOL)、键值数据库、以及图形数据库等等。此外,数据库可提供多种语言混合组成的存储。例如,数据摄入系统502可将所接收到的资产相关数据的有效载荷存储在第一类型的数据库(例如,时间序列或文档数据库)中,并且可将所接收到的资产相关数据的相关联的元数据存储在准许更快速搜索的第二类型的数据库(例如,关系数据库)中。在此类示例中,元数据随后可链接到或关联于存储在其他数据库中的与该元数据相关的资产相关数据。由数据摄入系统502使用的数据库506也可采取各种其他形式。
如图所示,数据摄入系统502随后可以通信地耦合到数据分析系统504。数据摄入系统502与数据分析系统504之间的这一接口可采取各种形式。例如,数据摄入系统502可以经由API通信地耦合到数据分析系统504。其他接口技术也是可能的。
在一种实现中,数据摄入系统502可以向数据分析系统504提供落入以下三个大致类别的数据:(1)信号数据;(2)事件数据;以及(3)资产配置数据。信号数据一般可采取表示由资产处的传感器和/或致动器进行的测量的原始或聚合或推导出的数据的形式。事件数据一般可以采取标识与资产操作相关的事件(诸如与从资产接收的指示符(例如,故障码等等)相对应的故障和/或其他资产事件、检查事件、维护事件、维修事件、流体事件、天气事件等)的数据的形式。并且资产配置信息则可包括关于资产的配置的信息,诸如资产标识符(例如,序列号、型号、型号年份等等)、所安装的软件版本等等。提供给数据分析系统504的数据还可包括其他数据并且也可采取其他形式。
数据分析系统504一般可用于从数据摄入系统502接收数据,分析该数据,并且随后基于该数据来采取各种动作。这些动作可采取各种形式。
作为一个示例,数据分析系统504可以标识要输出到客户站的某些数据(例如,基于从客户站接收的请求),并且随后可以将该数据提供给客户站。作为另一示例,数据分析系统504可以确定某些数据满足预定义规则,并且随后可以响应于该确定而采取某些动作,诸如生成新事件数据或经由客户站向用户提供通知。作为另一示例,数据分析系统504可以使用所接收到的数据来训练和/或执行与资产操作相关的预测模型,并且随后数据分析系统504可以基于预测模型的输出来采取某些动作。作为又一示例,数据分析系统504可以经由API使某些数据可供外部访问。
为了促成这些功能中的一个或多个,数据分析系统504可以被配置成提供(或“驱动”)可以由客户站访问和显示的用户接口。该用户接口可采取各种形式。作为一个示例,用户接口可经由web应用来提供,该web应用一般可包括可以由客户站显示的一个或多个网页以向用户呈现信息并且还获得用户输入。作为另一示例,用户接口可经由在客户站上被安装并运行、但由数据分析系统504“驱动”的本机客户端应用来提供。由数据分析系统504提供的用户接口也可采取其他形式。
除了分析所接收到的数据以供基于这种数据来采取潜在动作之外,数据分析系统504还可以被配置成将所接收到的数据存储到一个或多个数据库506中。例如,数据分析系统504可将所接收到的数据存储到用作主数据库的给定数据库中以向平台用户提供资产相关数据。
在一些实施例中,数据分析系统504还可以支持用于构建、定制和向平台添加附加功能的软件开发工具包(SDK)。这种SDK可以使得能够在该平台的硬编码功能之上定制该平台的功能。
数据分析系统504也可执行各种其他功能。由数据分析系统504执行的一些功能在下文进一步详细地讨论。
本领域普通技术人员将领会,图4-5中所示的示例平台仅仅是可被包括在平台中的组件的简化表示的一个示例,并且众多其他组件也是可能的。例如,其他平台可包括未图示的附加组件和/或更多或更少的图示出的组件。此外,给定平台可包括被一致操作以执行该给定资产的操作的多个个体平台。其他示例也是可能的。
IV.示例操作
现在将在下面进一步详细讨论图1中所描绘的示例网络配置100的操作。为了帮助描述这些操作中的一些操作,可参考流程图来描述可被执行的各操作的组合。在一些情形中,每个框可表示程序代码的模块或部分,该程序代码包括能由处理器执行以实现过程中的特定逻辑功能或步骤的指令。程序代码可被储存在任何类型的计算机可读介质上,诸如非瞬态计算机可读介质。在其他情形中,每个框可表示被布线以执行过程中的特定逻辑功能或步骤的电路系统。此外,流程图中所示的各框可基于特定实施例而被重新排列成不同的顺序、被组合成更少的框、被分成附加的框、和/或被移除。
以下描述可参考其中单个数据源(诸如资产106)向资产数据平台102(其随后执行一个或多个功能)提供数据的示例。应当理解,这仅仅是为了清楚和解释而完成的,而并不意味着限制。在实践中,资产数据平台102一般可能同时从多个源接收数据,并且基于这种聚合的接收到的数据来执行操作。
A.操作数据的收集
如上面提到的,代表性资产106和108中的每一者可采取各种形式并且可被配置成执行数个操作。在非限制性示例中,资产106可采取可操作用于跨美国转运货物的机车的形式。在运送期间,资产106的传感器和/或致动器可获得反映资产106的一个或多个操作状况的数据。传感器和/或致动器可将该数据传送到资产106的处理单元。
处理单元可被配置成从传感器和/或致动器接收数据。在实践中,处理单元可同时或顺序地接收来自多个传感器和/或多个致动器的信号数据。如上面讨论的,在接收该数据时,处理单元可被配置成确定数据是否满足触发任何异常状况指示符的触发准则,该异常状况指示符另外被称为故障(诸如故障码),这是用作资产内已发生异常状况的指示的故障数据。在处理单元确定一个或多个异常状况指示符被触发的情况下,处理单元可被配置成执行一个或多个本地操作,诸如经由用户接口输出所触发的指示符的指示。处理单元还可被配置成从接收自传感器和/或致动器的信号数据推导出其他数据(例如,此类数据的聚合)并且这种推导出的数据可与信号数据包括在一起。
资产106随后可经由资产106的网络接口和通信网络104将资产属性数据(诸如资产操作数据和/或资产配置数据)传送到资产数据平台102。在操作中,资产106可连续地、周期性地、和/或响应于触发事件(例如,异常状况)来向资产数据平台102传送资产属性数据。具体而言,资产106可基于特定频度(例如,每天、每小时、每十五分钟、每分钟一次、每秒一次等)来周期性地传送资产属性数据,或者资产106可被配置成传送操作数据的连续的实时馈送。附加地或替换地,资产106可被配置成基于某些触发来传送资产属性数据,诸如当传感器和/或致动器测量满足针对任何异常状况指示符的触发准则时。资产106也可按其他方式传送资产属性数据。
在实践中,资产106的资产操作数据可包括信号数据(例如,传感器和/或致动器数据)、故障数据、和/或其他资产事件数据(例如,指示资产停机、重启、诊断操作、流体检查、维修等等的数据)。在一些实现中,资产106可被配置成在单个数据流中提供数据,而在其他实现中,资产106可被配置成在多个不同的数据流中提供操作数据。例如,资产106可向资产数据平台102提供信号数据的第一数据流和故障数据的第二数据流。作为另一示例,资产106可向资产数据平台102提供针对资产106上的每个相应传感器和/或致动器的分开的数据流。其他可能性同样存在。
信号数据可采取各种形式。例如,有时,传感器数据(或致动器数据)可包括由资产106的传感器(或致动器)中的每一者获得的测量。而在其他时间,传感器数据(或致动器数据)可包括由资产106的传感器(或致动器)的子集获得的测量。
具体而言,信号数据可包括由与给定的所触发的异常状况指示符相关联的传感器和/或致动器获得的测量。例如,如果所触发的故障码是图3中的故障码1,则传感器数据可以包括由传感器A和传感器C获得的原始测量。附加地或替换地,该数据可包括由不直接与所触发的故障码相关联的一个或多个传感器或致动器获得的测量。继续上一个示例,该数据可附加地包括由致动器B和/或其他传感器或致动器获得的测量。在一些示例中,资产106可基于由分析系统108提供的故障码规则或指令而在操作数据中包括特定传感器数据,该分析系统108可能已例如首先确定了在致动器B正在测量的事物和造成了故障码1被触发的事物之间存在关联。其他示例也是可能的。
更进一步,该数据可基于感兴趣的特定时间而包括来自感兴趣的每个传感器和/或致动器的一个或多个传感器和/或致动器测量,该感兴趣的特定时间可基于数个因素来选择。在一些示例中,该感兴趣的特定时间可以基于采样率。在其他示例中,该感兴趣的特定时间可以基于检测到故障的时间。
具体而言,基于检测到故障的时间,该数据可包括来自感兴趣的每个传感器和/或致动器(例如,与检测到的故障直接或间接地相关联的传感器和/或致动器)的一个或多个相应的传感器和/或致动器测量。该一个或多个测量可基于在检测到的故障的时间附近的特定数量的测量或特定持续时间。
例如,如果资产检测到触发图3中的故障码2的故障,则感兴趣的传感器和致动器可包括致动器B和传感器C。该一个或多个测量可包括由致动器B和传感器C在检测到故障的时间、在故障检测的时间之前不久、在故障检测的时间之后不久、和/或其某种组合处获得的相应一组测量。
类似于信号数据,故障数据可采取各种形式。一般而言,故障数据可包括指示符或采取指示符的形式,该指示符可用于从资产106处可能发生的所有其他类型的故障中唯一性地标识出在资产106处发生的特定类型的故障。该指示符(其可被称为故障码)可采取字母、数字、或字母数字标识符的形式,或者可以采取描述故障类型的字符串的形式,诸如“Overheated Engine(过热的引擎)”或“Out of Fuel(没有燃料)”等等。另外,故障数据可包括关于故障发生的其他信息,包括对何时发生故障(例如,时间戳)以及在何处发生故障(例如,GPS数据)的指示、以及其他示例。与其他类型的事件(例如,维护事件)相关的数据可采取类似形式。
此外,资产配置数据也可采取各种形式。一般而言,资产配置数据涉及与资产“有关”的信息。在一个实例中,资产配置数据可包括数据资产标识信息,诸如型号、型号年份(例如,资产年龄)等等。而在另一实例中,资产数据与资产的特定过去和/或目前配置直接相关。例如,资产属性信息可指示在对资产作出市场修改之后哪些软件版本被安装在资产上和/或在资产上运行,以及其他可能性。
资产数据平台102且尤其是资产数据平台102的数据摄入系统可被配置成从一个或多个资产和/或数据源接收资产属性数据。数据摄入系统可被配置成采集所接收到的数据的至少一部分、对所接收到的数据执行一个或多个操作,并随后将该数据中继到资产数据平台102的数据分析系统。进而,数据分析系统可分析所接收到的数据并基于这种分析来执行一个或多个操作。
B.对多变量资产数据中的异常的检测
如上面提到的,资产数据平台102可被配置成执行异常检测过程,该异常检测过程一般涉及(1)接收原始坐标空间中的多变量数据(例如,来自资产的信号数据和/或其他数据),本文中被称为“观测数据”,该原始坐标空间具有等于数据中的变量数目的维数,(2)将接收到的多变量数据从原始坐标空间变换(或“投影”)到具有比该原始坐标空间少的维度的经变换坐标空间,(3)标准化经变换坐标空间中的数据,(4)基于经标准化数据与一组阈值之间的比较来修改经变换坐标空间中的经标准化数据,该组阈值是基于反映正常资产操作的训练数据来定义的,(5)将经修改数据从经变换坐标空间逆变换(或投影)到原始坐标空间,以及(6)分析原始坐标空间中的变换后数据以标识异常。
在示例实现中,用于促成检测接收到的多变量数据中的异常的上述过程可取决于基于训练数据来定义的一组阈值。在这方面,资产数据平台可被配置成执行训练阶段,其可输出所定义的一组阈值。从训练阶段输出的阈值随后可被用于检测接收到的多变量数据中的异常的过程中。
现在转到图6,提供了描绘用于使用反映正常资产操作的训练数据来为经变换坐标空间定义一组阈值的一种可能的示例方法600的示例流程图。一般而言,经由方法600定义的该组阈值可由资产数据平台102用于执行下面将进一步详细描述的示例方法1100,以修改与由资产数据平台102从资产接收到的多变量数据相对应的值。出于说明目的,示例方法600被描述为由资产数据平台102执行,但该示例方法可由其他设备和/或系统执行。本领域普通技术人员还将领会,流程图600是为了清楚和解释起见而被提供的,并且操作的众多其他组合可用于促成对多变量数据中的异常的标识。
在框602,资产数据平台102可获得反映正常资产操作(例如,不包含异常)的训练数据。例如,训练数据可采取与资产的操作相关的历史时间序列、多变量数据的形式,这些数据可从资产相关数据源(例如,现场中的资产)接收和/或由资产数据平台102生成。在实践中,资产数据平台102可(例如,基于资产类型和/或历史数据源自的资产)选择一组所存储的历史数据,并通过执行对所选择的该组中所包括的数据点分布的分析来确定给定的一组训练数据。在这方面,资产数据平台102可在逐变量的基础上分析该组历史数据以标识反映正常资产操作的一系列数据值。可按各种其他方式来获得训练数据。
图7是示出了可由资产数据平台102使用的时间序列、多变量训练数据的代表性示例的一组标绘700。如图所示,该组标绘700描绘了一组变量标绘,诸如代表性变量标绘702,每一标绘在水平轴(即,704)上具有测得值在时间序列内的编号并在垂直轴(即,706)上具有每个测得值的幅值。在一个代表性示例中,由资产数据平台102接收到的时间序列、多变量训练数据可被认为是一组标绘,每一标绘对应于给定资产处的相应传感器/致动器的输出。例如,可通过在水平轴上示出每个测得值在时间序列内的序列号并在垂直轴上示出每个测得值的幅值,来在表示对变量的时间序列测量的标绘横坐标上查看每个训练变量。从这个意义上来说,训练数据也可被表示为具有多行和多列的测得值的矩阵,每一行对应于特定的时间点,每一列对应于不同的变量。根据上面的讨论,这种矩阵中的每一行随后可被视为原始坐标空间中的相应数据点(即,相应的一组信号值测量),该原始坐标空间具有针对矩阵中的每一列(即,多变量训练数据中的每个变量)的维度。
在获得训练数据之后,在框602,资产数据平台102可按类似于下面参照图11的框1102进一步详细描述的方式来对训练数据执行预处理功能(例如,数据归集)。
在框604,资产数据平台102可将训练数据从原始坐标空间变换到具有比该原始坐标空间少的维度的经变换坐标空间。资产数据平台102可按各种方式来执行该变换。
根据一个示例,资产数据平台102可使用主成分分析(PCA)来将训练数据从原始坐标空间变换到经变换坐标空间。一般而言,PCA基于可从具有相关变量值的原始数据集产生新的不相关变量(被称为主成分(PC))的线性变换过程。换言之,PCA通过将数据变换成没有协方差的一组PC来移除原始坐标空间中的多变量数据的协方差,其中PC的方差“解释”原始坐标空间中的方差和协方差。
为了实现这一点,线性变换可有效地将属于与训练数据相关联的原始坐标空间的维度(例如,对应于变量)减少到足以表示数据的变化性的“隐藏”源的较少数目的PC。例如,如果训练数据点包含大的维数,则将PCA应用于原始训练数据可将该数据变换到包含减少维数的经变换坐标空间,其中经变换训练数据包括采取上述PC形式的减少数目的变量值。
例如,如上面提到的,代表性训练数据可被认为是原始坐标空间中所表示的多变量数据点的时间序列,该原始坐标空间具有针对每个变量的相应维度。在示例实现中,将PCA应用于原始坐标空间中所表示的训练数据点可使得经变换坐标空间具有比原始坐标空间相对较少的维数,其中每个这种维度对应于相应PC。
在实践中,由资产数据平台102在应用PCA时采用的数学变换可按以下方式来定义:第一PCA维度表示训练数据的方差的最大量,其中每个相继的PCA维度与第一PCA维度正交并且解释相对较低的方差量。由于每个相继的PCA维度解释减少的方差量的事实,资产数据平台102经由PCA可以能够关注有限数量的所确定PC(每个PC对应于PCA维度)以充分地评估由于非随机效应引起的训练数据的方差。在这方面,由资产数据平台102为给定的训练数据集选择的PCA维数可由资产数据平台102自动地、基于用户设置和/或偏好、和/或以某种其他方式确定。
作为原始坐标空间相对于经变换坐标空间的维度减少的结果,经变换训练数据点可各自包含相对于原始坐标空间中的训练数据点的较少变量值(例如,矩阵中较少的列)。
在上述示例中,资产数据平台102可使用现在已知或以后开发的与PCA相关的任何变型(包括核PCA、稳健PCA、以及稀疏PCA)将训练数据从原始坐标空间变换到经变换坐标空间。在另外的示例中,资产数据平台102可使用被称为偏最小二乘的坐标变换技术及其变型(包括偏最小二乘判别分析、偏最小二乘路径建模、以及正交投影到潜在结构)将训练数据从原始坐标空间变换到经变换坐标空间。资产数据平台102也可使用其他技术将训练数据从原始坐标空间变换到经变换坐标空间。
图8示出了图7所获得的训练数据被变换到经变换坐标空间的概念图示。如图所示,图8描绘了经变换坐标空间800,该空间800具有相对于三个PCA维度(例如,802、804、806)和原点810来绘制的经变换训练数据点808。
在框606,资产数据平台102可标准化经变换坐标空间中的经变换训练数据。图9描绘了图8的经变换训练数据在经变换坐标空间中被标准化的概念图示。一般而言,标准化的过程被用于描述数学过程,通过该数学过程从数据集的每个值减去该数据集的均值以使数据居中,并将差值除以数据的标准差以重新缩放数据。这种类型的标准化被称为z分数标准化。也可以使用其他统计属性来标准化经变换数据,诸如减去每个PCA维度的中值或众数以使数据居中,或除以每个PCA维度的范围或第95百分位数来重新缩放数据。作为这种标准化的结果,每个经变换训练数据点的变量值可被更新以使得经变换训练数据点以经变换坐标空间的原点为中心。
如图所示,图9描绘了经变换坐标空间800中以原点810为中心的经标准化的经变换训练数据902。
在框608,对于经变换坐标空间中的每个变量,资产数据平台102可分析该变量的经标准化训练数据值的分布,以确定变量在经变换坐标空间中的最大预期值(例如,基于该变量的经标准化训练数据值的标准差)。在这方面,这组阈值可有效地定义以经变换坐标空间的原点为中心的多维封闭形状(例如,圆形、椭圆形等等)的边界。
图10描绘了已基于图9的经标准化的经变换训练数据902来定义的一组阈值的概念图示。如图所示,这组阈值被表示为椭圆体1002,该椭圆体1002有效地定义以经变换坐标空间的原点810为中心的边界。
转回到图6,在框610,资产数据平台102可存储这组阈值以供将来与经变换坐标空间中的观测数据进行比较。
在资产数据平台102被配置成作为预处理的一部分来修改原始坐标空间中的观测数据的实施例中,资产数据平台102还可被配置成基于在框602获得的训练数据来定义原始坐标空间中的变量的阈值。例如,在一种实现中,资产数据平台102可分析与原始坐标空间中的每个变量相对应的训练数据值的分布并且随后确定每个这种变量的最小和/或最大预期值(例如,阈值)。该确定可基于与训练数据值的分布相关的各种度量,其示例可包括标准差和均值以及其他可能性。资产数据平台102也可按其他方式来定义原始坐标空间中的变量的阈值。
图11是描绘了用于检测从(诸)资产相关数据源接收的多变量数据中的异常的一种可能的示例方法1100的示例流程图。出于说明目的,示例方法1100被描述为由资产数据平台102执行,但该示例方法可由其他设备和/或系统执行。本领域普通技术人员还将领会,流程图1100是为了清楚和解释起见而被提供的,并且操作的众多其他组合可用于促成对多变量资产相关数据中的异常的标识。
在框1102,资产数据平台102可从资产相关数据源接收原始坐标空间中的多变量数据,该原始坐标空间具有等于数据中所包括的变量数目的维数。该接收到的数据在本文中可被称为“观测数据”,并且可采取各种形式。在示例实现中,资产(诸如代表性资产106)可包括一组传感器和/或致动器,每一者用于在资产的操作期间监视相应的变量(例如,参数)并输出针对所监视变量的信号值的时间序列,其中每个值对应于该值被测量的时间点。例如,传感器和/或致动器可监视诸如引擎温度、流体液位、R.P.M等变量、以及许多其他示例。如此,资产的信号数据可采取多变量数据的时间序列的形式,其中序列中的每个相应数据点包括由资产的传感器和/或致动器在相应时间点测量的一组信号值。(另外,资产106和/或资产数据平台102可从资产的信号数据推导出其他变量,在该情形中这些推导出的变量也可被包括在多变量数据中)。在实践中,多变量观测数据中的每个不同变量可被认为是数据点的原始坐标空间中的不同维度。
在一个代表性示例中,由资产数据平台102接收到的时间序列、多变量观测可被认为是一组标绘,每一标绘对应于给定资产处的相应传感器/致动器的输出。例如,可通过在水平轴上示出每个测得值在时间序列内的序列号并在垂直轴上示出每个测得值的幅值,来在表示对变量的时间序列测量的标绘横坐标上查看每个观测变量。从这个意义上来说,观测数据也可被表示为具有多行和多列的测得值的矩阵,每一行对应于特定的时间点,每一列对应于不同的变量。根据上面的讨论,这种矩阵中的每一行随后可被视为原始坐标空间中的相应数据点(即,相应的一组信号值测量),该原始坐标空间具有针对矩阵中的每一列(即,多变量数据中的每个变量)的维度。
资产数据平台102可按各种方式来接收前述观测数据,诸如连续地(例如,“实时”地或接近实时地)、周期性地、或“批量”地、以及其他可能性。资产数据平台102从资产相关数据源接收数据的方式可取决于数据源的类型和/或配置、以及其他因素。在任何情形中,资产数据平台102可将接收到的数据存储在第一数据库(诸如附属于数据存储404的数据库)中以供在执行异常检测时使用。
在框1102接收观测数据之后,资产数据平台102还可对原始坐标空间中所表示的观测数据执行某些预处理功能。例如,在一些实施例中,资产数据平台102可修改(或归集)原始坐标空间中不符合针对原始坐标空间中的变量所定义的阈值的某些值。根据此类实施例并且如上所述,资产数据平台102可基于反映正常资产操作的训练数据来定义原始坐标空间中的每个变量的一个或多个阈值(例如,最小和/或最大预期值)。进而,资产数据平台102可被配置成:将接收到的观测数据的值(在预处理之前或之后)与针对原始坐标空间中的变量所定义的阈值进行比较,并随后修改(或归集)不符合所定义的阈值的任何变量值。例如,资产数据平台102可用相应阈值的值来替换高于或低于该阈值的任何变量值。资产数据平台102也可基于以其他方式与阈值的比较来修改接收到的观测数据的值。例如,如果接收到的观测数据值中的一者或多者缺失、或被表示为“非数值”或NaN,则资产数据平台102可用对应信号的均值或中值来填入(或归集)缺失的值。
通常,在框1102接收到的并在原始坐标空间中表示的观测数据可包含与相关变量相对应的值,这可能使得难以检测异常。为了促成突出观测数据的变化性,资产数据平台102可利用坐标变换技术从在原始坐标空间中表示的相关变量产生不相关变量。
在框1104,资产数据平台102可诸如通过采用如上面参照图6的框604所描述的维度减少技术PCA技术来将观测数据从原始坐标空间变换(或“投影”)到具有比原始坐标空间少的维度的经变换坐标空间。
作为原始坐标空间相对于经变换坐标空间的维度减少的结果,经变换观测数据点可各自包含相对于原始坐标空间中的所观测数据点的较少变量值(例如,矩阵中较少的列)。
在框1106,资产数据平台102可按类似于上面参照图6的框606所讨论的方式来标准化经变换坐标空间中的经变换观测数据。即,资产数据平台可对经变换观测数据执行z分数标准化,以使得经标准化的经变换观测数据以经变换坐标空间的原点为中心。
在框1108,资产数据平台102可将经标准化的观测数据与基于反映正常资产操作的训练数据来定义的一组阈值进行比较。该组阈值可采取各种形式并以各种方式来定义。
在优选实施例中,该组阈值可包括针对经变换坐标空间中的每个所选变量(例如,每个PC)的相应阈值,其中每个变量的阈值表示在正常资产操作期间该变量的最大预期值。然而,这组阈值也可以采取其他形式。例如,在一些实例中,基于训练数据来定义的这组阈值可包含与在给定经变换坐标空间中呈现的全部所选变量要少的变量相对应的阈值。在其他实例中,经变换坐标空间中的(诸)给定变量的阈值可与经变换训练数据的除了最大值之外的度量相关联。例如,阈值可与经变换训练数据的分布的第95或第99百分位数相关联。作为另一示例,阈值可被设置为某个常数乘以最大值,诸如经变换训练数据的最大值的2倍或1.5倍。
在一个示例中,这组阈值可被视为经变换坐标空间中的多维封闭形状(例如,圆形、椭圆形等等),该多维封闭形状有效地定义以经变换空间的原点为中心的边界。
资产数据平台102可按各种方式来执行经标准化的经变换观测数据与这组阈值之间的比较。在优选实施例中,资产数据平台102可将经变换坐标空间中的每个相应变量(例如,每个PC)的给定经标准化观测数据点的值与针对该相应变量所定义的阈值进行比较,以确定该数据点的值是否超过所定义的阈值。然而,资产数据平台102也可按其他方式来执行该比较。
在框1110,资产数据平台102可基于经标准化观测数据与这组阈值之间的比较来修改经变换坐标空间中的经标准化观测数据。例如,如果资产数据平台102基于该比较而确定经标准化的经变换观测数据点在经变换坐标空间中包括至少一个变量值(例如,PC值),该至少一个变量值超过针对该变量所定义的阈值,则资产数据平台102可修改观测数据点以使得该至少一个变量值不再超过所定义的阈值。换言之,资产数据平台102可被配置成“收缩”一个或多个经标准化观测数据点的值,以使得数据点落至更接近由这组阈值界定的多维封闭形状(并且也许在该多维封闭形状内)。
在一种实现中,资产数据平台102可通过用针对任何变量(该变量的值超过所定义的阈值)所定义的阈值来替换该变量的值,来在逐变量的基础上(例如,逐PC的基础上)修改经标准化的经变换观测数据点。例如,如果给定数据点包括超过经变换坐标空间中的所定义阈值的两个变量值,则资产数据平台102可用针对每个这种变量所定义的阈值来替换该变量的值,从而使得减少这两个变量值的幅值。该实现可被称为“成分收缩”。
图12描绘了成分收缩示例的概念图示。如图所示,原始观测数据点可包括被示为(Z1,obs,Z2,obs,Z3,obs)的三个PCA变量的值。此外,如图所示,这些值中的两个值(Z1,obs和Z2,obs)在由这组阈值定义的边界之外。将成分收缩应用于该数据点可涉及用这两个变量的阈值来替换这些变量,从而得到具有值(Z1,shrink,Z2,shrink,Z3,obs)的经修改数据点。
在另一实现中,资产数据平台102可通过以协调的方式修改数据点的多个值来修改经变换坐标空间中的观测数据点。例如,如果经变换坐标空间中的给定数据点被确定为位于由经变换坐标空间中的这组阈值界定的多维封闭形状之外,则资产数据平台102可修改给定点的一组变量值以使得数据点有效地移至边界上最接近的点。该实现可被称为“向量收缩”。
图13描绘了向量收缩示例的概念图示。如图所示,原始观测数据点可再次包括被示为(Z1,obs,Z2,obs,Z3,obs)的三个PCA变量的值。此外,如图所示,这些值中的两个值(Z1,obs和Z2,obs)在由这组阈值定义的边界之外。将向量收缩应用于该数据点可涉及:标识包括其中数据点超过边界的PCA维度(此处为第一和第二PCA维度)的坐标空间;在该空间中绘制从所观测数据点到原点的直线;并且随后将数据点移至该直线与边界相交的位置,从而得到具有值(Z1,shrink,Z2,shrink,Z3,obs)的经修改数据点。在该示例中,如图所示,Z1,shrink和Z2,shrink的值可小于阈值。
资产数据平台102也可按其他方式来修改经变换坐标空间中的观测数据点。
在优选实施例中,资产数据平台102将被配置成在框1110修改变换坐标空间中的观测数据,而不管资产数据平台102是否被配置成在预处理期间修改(或归集)原始坐标空间中的观测数据。然而,在一些替换实施例中,被配置成在预处理期间修改原始坐标空间中的观测数据的资产数据平台102则可跳过框1110,以使得它将不会还修改经变换坐标空间中的观测数据。换言之,资产数据平台102可被配置成以任何组合来实现原始坐标空间修改和变换坐标空间修改。
在框1112,资产数据平台102可将经修改观测数据从经变换坐标空间逆变换(或投影)回到原始坐标空间。在实践中,以上面提到的方式在经变换坐标空间中被修改并且随后被投影回到原始坐标空间的观测数据点可具有与原始坐标空间中接收到的观测数据有意义地不同的至少一个变量值。即,在原始坐标空间的至少一个维度中在变换前观测数据点与变换后观测点之间可能存在“间隙”,这可指示异常。
在逆变换经修改观测数据之后,资产数据平台102在一些实例中还可对观测数据执行某些后处理功能。例如,资产数据平台102可将经逆变换的数据“去除归一化”,以便将此类数据有效地与初始接收到的观测数据进行比较。资产数据平台102可执行各种其他后处理功能。
在框1114,资产数据平台102可分析原始坐标空间中的变换后观测数据以标识异常。例如,资产数据平台102可应用异常检测测试来分析变换后观测数据(例如,经逆变换的经修改观测数据)在预定义时间段上与原始坐标空间中的变换前观测数据(例如,接收到的观测数据)相比较的情况,以标识出观测数据中的一个或多个变量看起来异常的实例(例如,至少一个变量值在变换后与变换前观测数据之间存在统计上的显著差异的实例)。
此外,资产数据平台102可利用诊断和预后方法,这些方法分析接收到的观测数据、经变换观测数据、以及异常检测测试结果来确定异常行为是否指示装备故障。这种诊断和预后方法包括但不限于时间序列外推、专家规则、以及机器学习技术。
进而,资产数据平台102可基于该标识来执行各种功能。作为一个示例,资产数据平台102可生成对所标识异常的通知,该通知可诸如在代表性客户站112处用视觉和/或听觉方式呈现给用户。作为另一示例,资产数据平台102可被配置成丢弃标识出异常的资产数据,以使得这种潜在不可靠的数据不被资产数据平台102用于其他目的(例如,用于呈现给用户、训练或执行模型等等)。资产数据平台102也可基于其对异常的标识来执行其他功能。
虽然已在检测资产相关数据中的异常的资产数据平台的上下文中讨论了本文所公开的各技术,但还应当理解,所公开的各概念也可被用于在各种其他上下文中检测异常。
V.结论
以上已描述了所公开的创新的示例实施例。然而,本领域技术人员将理解,在不脱离将由权利要求限定的本发明的真实范围和精神的情况下,可以对所描述的实施例作出改变和修改。
此外,就本文中所描述的示例涉及由诸如“人类”、“操作员”、“用户”或其他实体等参与者执行或发起的操作而言,这仅仅出于示例和解释的目的。除非在权利要求语言中明确叙述,否则权利要求不应当被解释为要求由这些参与者采取动作。
Claims (20)
1.一种计算设备,包括:
网络接口;
至少一个处理器;
非瞬态计算机可读介质;以及
被储存在所述非瞬态计算机可读介质上的程序指令,所述程序指令在由所述至少一个处理器执行时使计算设备进行以下操作:
经由所述网络接口从资产接收原始坐标空间中的多变量数据,所述原始坐标空间具有等于所述数据中所包括的变量数目的维数;
将所接收到的多变量数据从所述原始坐标空间变换到具有比所述原始坐标空间少的维度的经变换坐标空间;
标准化所述经变换坐标空间中的所述数据;
基于一组阈值来修改所述经变换坐标空间中的所述经标准化数据,其中,所述一组阈值是基于反映正常资产操作的训练数据来定义的;
将所述经修改数据从所述经变换坐标空间逆变换到所述原始坐标空间;以及
分析所述原始坐标空间中的所述经逆变换数据以标识异常。
2.如权利要求1所述的计算设备,其特征在于,能执行以使所述计算设备将所接收到的多变量数据从所述原始坐标空间变换到具有比所述原始坐标空间少的维度的经变换坐标空间的所述程序指令包括能执行以使计算设备进行以下操作的程序指令:
将主成分分析(PCA)应用于所述原始坐标空间中所接收到的多变量数据,其中,PCA的应用包括:
标识描述所接收到的多变量数据的变化性的一组主成分;
基于所述一组主成分,将所述原始坐标空间中所接收到的多变量数据线性地变换到所述经变换坐标空间,其中,所述经变换坐标空间的每个维度对应于属于所述一组主成分的一主成分。
3.如权利要求1所述的计算设备,其特征在于,能执行以使所述计算设备分析所述原始坐标空间中的所述经逆变换的经修改数据以标识异常的所述一组阈值包括能执行以使所述计算设备进行以下操作的程序指令:
将所接收到的多变量数据与所述原始坐标空间中的所述经逆变换的经修改数据进行比较;以及
标识至少一个变量值在所接收到的多变量数据与所述经逆变换的经修改数据之间在统计上的显著差异。
4.如权利要求1所述的计算设备,其特征在于,能执行以使所述计算设备标准化所述经变换坐标空间中的所述数据的所述程序指令包括能执行以使所述计算设备进行以下操作的程序指令:
在所述经变换坐标空间中重新缩放所述数据,其中,所述经重新缩放的数据以所述经变换坐标空间的原点为中心并遵循标准正态分布。
5.如权利要求1所述的计算设备,其特征在于,能执行以使计算设备基于所述一组阈值来修改所述经变换坐标空间中的所述经标准化数据的所述程序指令包括能执行以使所述计算设备进行以下操作的程序指令:
将所述经变换坐标空间中的每个维度的给定经标准化数据点的值与针对该维度所定义的阈值进行比较;
确定一个或多个经标准化数据点的值是否超过针对该变量所定义的阈值。
6.如权利要求1所述的计算设备,其特征在于,能执行以使所述计算设备基于所述一组阈值来修改所述经变换坐标空间中的所述经标准化数据的所述程序指令包括能执行以使所述计算设备进行以下操作的程序指令:
标识所述经变换坐标空间中具有超过所定义的阈值的一个或多个维度值的经标准化数据点;
将所述一个或多个维度值中的至少一个维度值的幅值减少到等于所定义的阈值。
7.如权利要求6所述的计算设备,其特征在于,一个或多个维度值的减少基于向量收缩和成分收缩中的至少一者或多者。
8.一种其上储存有指令的非瞬态计算机可读介质,所述指令能执行以使计算系统进行以下操作:
将所接收到的多变量数据从原始坐标空间变换到具有比所述原始坐标空间少的维度的经变换坐标空间;
标准化所述经变换坐标空间中的所述数据;
基于一组阈值来修改所述经变换坐标空间中的所述经标准化数据,其中,所述一组阈值是基于反映正常资产操作的训练数据来定义的;
将所述经修改数据从所述经变换坐标空间逆变换到所述原始坐标空间;以及
分析所述原始坐标空间中的所述经逆变换数据以标识异常。
9.如权利要求8所述的非瞬态计算机可读介质,其特征在于,能执行以使所述计算系统将所接收到的多变量数据从所述原始坐标空间变换到具有比所述原始坐标空间少的维度的经变换坐标空间的所述程序指令包括能执行以使计算设备进行以下操作的程序指令:
将主成分分析(PCA)应用于所述原始坐标空间中所接收到的多变量数据,其中,PCA的应用包括:
标识描述所接收到的多变量数据的变化性的一组主成分;
基于所述一组主成分,将所述原始坐标空间中所接收到的多变量数据线性地变换到所述经变换坐标空间,其中,所述经变换坐标空间的每个维度对应于属于所述一组主成分的一主成分。
10.如权利要求8所述的非瞬态计算机可读介质,其特征在于,能执行以使所述计算系统分析所述原始坐标空间中的所述经逆变换的经修改数据以标识异常的所述一组阈值包括能执行以使所述计算设备进行以下操作的程序指令:
将所接收到的多变量数据与所述原始坐标空间中的所述经逆变换的经修改数据进行比较;以及
标识至少一个变量值在所接收到的多变量数据与所述经逆变换的经修改数据之间在统计上的显著差异。
11.如权利要求8所述的非瞬态计算机可读介质,其特征在于,能执行以使所述计算系统标准化所述经变换坐标空间中的所述数据的所述程序指令包括能执行以使所述计算设备进行以下操作的程序指令:
在所述经变换坐标空间中重新缩放所述数据,其中,所述经重新缩放的数据以所述经变换坐标空间的原点为中心并遵循标准正态分布。
12.如权利要求8所述的非瞬态计算机可读介质,其特征在于,能执行以使计算系统基于所述一组阈值来修改所述经变换坐标空间中的所述经标准化数据的所述程序指令包括能执行以使所述计算设备进行以下操作的程序指令:
将所述经变换坐标空间中的每个维度的给定经标准化数据点的值与针对该维度所定义的阈值进行比较;
确定一个或多个经标准化数据点的值是否超过针对该变量所定义的阈值。
13.如权利要求8所述的非瞬态计算机可读介质,其特征在于,能执行以使所述计算系统基于所述一组阈值来修改所述经变换坐标空间中的所述经标准化数据的所述程序指令包括能执行以使所述计算设备进行以下操作的程序指令:
标识所述经变换坐标空间中具有超过所定义的阈值的一个或多个维度值的经标准化数据点;
将所述一个或多个维度值中的至少一个维度值的幅值减少到等于所定义的阈值。
14.如权利要求13所述的非瞬态计算机可读介质,其特征在于,一个或多个维度值的减少基于向量收缩和成分收缩中的至少一者或多者。
15.一种计算机实现的方法,所述方法包括:
经由网络接口从资产接收原始坐标空间中的多变量数据,所述原始坐标空间具有等于所述数据中所包括的变量数目的维数;
将所接收到的多变量数据从所述原始坐标空间变换到具有比所述原始坐标空间少的维度的经变换坐标空间;
标准化所述经变换坐标空间中的所述数据;
基于一组阈值来修改所述经变换坐标空间中的所述经标准化数据,其中,所述一组阈值是基于反映正常资产操作的训练数据来定义的;
将所述经修改数据从所述经变换坐标空间逆变换到所述原始坐标空间;以及
分析所述原始坐标空间中的所述经逆变换数据以标识异常。
16.如权利要求15所述的计算机实现的方法,其特征在于,将所接收到的多变量数据从所述原始坐标空间变换到具有比所述原始坐标空间少的维度的经变换坐标空间进一步包括:
将主成分分析(PCA)应用于所述原始坐标空间中所接收到的多变量数据,其中,PCA的应用包括:
标识描述所接收到的多变量数据的变化性的一组主成分;
基于所述一组主成分,将所述原始坐标空间中所接收到的多变量数据线性地变换到所述经变换坐标空间,其中,所述经变换坐标空间的每个维度对应于属于所述一组主成分的一主成分。
17.如权利要求15所述的计算机实现的方法,其特征在于,用于分析所述原始坐标空间中的所述经逆变换的经修改数据以标识异常的所述一组阈值进一步包括:
将所接收到的多变量数据与所述原始坐标空间中的所述经逆变换的经修改数据进行比较;以及
标识至少一个变量值在所接收到的多变量数据与所述经逆变换的经修改数据之间在统计上的显著差异。
18.如权利要求15所述的计算机实现的方法,其特征在于,标准化所述经变换坐标空间中的所述数据进一步包括:
在所述经变换坐标空间中重新缩放所述数据,其中,所述经重新缩放的数据以所述经变换坐标空间的原点为中心并遵循标准正态分布。
19.如权利要求15所述的计算机实现的方法,其特征在于,基于所述一组阈值来修改所述经变换坐标空间中的所述经标准化数据进一步包括:
将所述经变换坐标空间中的每个维度的给定经标准化数据点的值与针对该维度所定义的阈值进行比较;
确定一个或多个经标准化数据点的值是否超过针对该变量所定义的阈值。
20.如权利要求15所述的计算机实现的方法,其特征在于,基于所述一组阈值来修改所述经变换坐标空间中的所述经标准化数据包括能执行以使计算设备进行以下操作的程序指令:
标识所述经变换坐标空间中具有超过所定义的阈值的一个或多个维度值的经标准化数据点;
将所述一个或多个维度值中的至少一个维度值的幅值减少到等于所定义的阈值。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201662382629P | 2016-09-01 | 2016-09-01 | |
US62/382,629 | 2016-09-01 | ||
US15/367,012 | 2016-12-01 | ||
US15/367,012 US10474932B2 (en) | 2016-09-01 | 2016-12-01 | Detection of anomalies in multivariate data |
PCT/US2017/049749 WO2018045241A2 (en) | 2016-09-01 | 2017-08-31 | Detection of anomalies in multivariate data |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109716356A true CN109716356A (zh) | 2019-05-03 |
Family
ID=61242842
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201780057812.1A Pending CN109716356A (zh) | 2016-09-01 | 2017-08-31 | 多变量数据中的异常检测 |
Country Status (9)
Country | Link |
---|---|
US (1) | US10474932B2 (zh) |
EP (1) | EP3507744A4 (zh) |
JP (1) | JP2019537764A (zh) |
KR (1) | KR20190039299A (zh) |
CN (1) | CN109716356A (zh) |
AU (1) | AU2017321799A1 (zh) |
CA (1) | CA3035207A1 (zh) |
SG (1) | SG11201901668RA (zh) |
WO (1) | WO2018045241A2 (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111177139A (zh) * | 2019-12-31 | 2020-05-19 | 青梧桐有限责任公司 | 基于数据质量体系的数据质量验证监控及预警方法和系统 |
CN112883258A (zh) * | 2021-01-11 | 2021-06-01 | 北京达佳互联信息技术有限公司 | 信息推荐方法、装置、电子设备及存储介质 |
CN115865751A (zh) * | 2022-11-25 | 2023-03-28 | 南方电网数字平台科技(广东)有限公司 | 基于多态数据的故障检测方法及装置 |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10929421B2 (en) | 2017-06-08 | 2021-02-23 | Sap Se | Suggestion of views based on correlation of data |
US11250343B2 (en) * | 2017-06-08 | 2022-02-15 | Sap Se | Machine learning anomaly detection |
US10635519B1 (en) * | 2017-11-30 | 2020-04-28 | Uptake Technologies, Inc. | Systems and methods for detecting and remedying software anomalies |
DE112018006630T5 (de) | 2017-12-28 | 2020-09-24 | Intel Corporation | Visual fog |
US10607484B2 (en) | 2017-12-28 | 2020-03-31 | Intel Corporation | Privacy-preserving distributed visual data processing |
US11349753B2 (en) * | 2017-12-28 | 2022-05-31 | Intel Corporation | Converged routing for distributed computing systems |
US12099571B2 (en) * | 2018-01-18 | 2024-09-24 | Ge Infrastructure Technology Llc | Feature extractions to model large-scale complex control systems |
DE102018207791A1 (de) * | 2018-05-17 | 2019-11-21 | Continental Teves Ag & Co. Ohg | Verfahren zur Authentifizierung eines von einem Kfz-System eines Fahrzeugs erzeugten Diagnosefehlercodes |
US11181894B2 (en) * | 2018-10-15 | 2021-11-23 | Uptake Technologies, Inc. | Computer system and method of defining a set of anomaly thresholds for an anomaly detection model |
JP2020101980A (ja) * | 2018-12-21 | 2020-07-02 | トヨタ自動車株式会社 | 情報取得装置、情報取得方法、プログラム |
US11797515B2 (en) * | 2020-03-09 | 2023-10-24 | Adobe Inc. | Determining feature contributions to data metrics utilizing a causal dependency model |
CN111352617B (zh) * | 2020-03-16 | 2023-03-31 | 山东省物化探勘查院 | 一种基于Fortran语言的磁法数据辅助整理方法 |
CN111546854B (zh) * | 2020-06-18 | 2021-08-24 | 中南大学 | 一种智能列车空调机组在途识别与诊断方法 |
CN112580022B (zh) * | 2020-12-07 | 2024-06-25 | 北京中电飞华通信有限公司 | 一种主机系统安全预警方法、装置、设备及存储介质 |
US11847111B2 (en) * | 2021-04-09 | 2023-12-19 | Bitdefender IPR Management Ltd. | Anomaly detection systems and methods |
EP4350236A4 (en) * | 2021-06-02 | 2024-06-12 | Mitsubishi Electric Corporation | SYSTEM AND METHOD FOR ASSISTING AN AIR CONDITIONING SYSTEM MAINTENANCE |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040175039A1 (en) * | 2003-03-06 | 2004-09-09 | Animetrics, Inc. | Viewpoint-invariant image matching and generation of three-dimensional models from two-dimensional imagery |
CN1578968A (zh) * | 2001-08-29 | 2005-02-09 | 霍尼韦尔国际公司 | 用于受监督的神经网络学习的组合方法 |
CN101124573A (zh) * | 2003-07-01 | 2008-02-13 | 西麦恩公司 | 用于把来自多维空间的数据投影到具有较少维的空间和对所述数据实行认知分析的方法、计算机程序与计算机可读装置 |
US20090097772A1 (en) * | 2007-10-12 | 2009-04-16 | Microsoft Corporation | Laplacian Principal Components Analysis (LPCA) |
CN102713676A (zh) * | 2009-11-11 | 2012-10-03 | 澳大利亚核能科技组织 | 放射性特征的异常检测 |
US20140365195A1 (en) * | 2013-06-07 | 2014-12-11 | Scientific Design Company, Inc. | System and method for monitoring a process |
Family Cites Families (114)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5633800A (en) | 1992-10-21 | 1997-05-27 | General Electric Company | Integrated model-based reasoning/expert system diagnosis for rotating machinery |
US5566092A (en) | 1993-12-30 | 1996-10-15 | Caterpillar Inc. | Machine fault diagnostics system and method |
JP3366837B2 (ja) | 1997-08-15 | 2003-01-14 | 株式会社小松製作所 | 機械の異常監視装置および方法 |
US6473659B1 (en) | 1998-04-10 | 2002-10-29 | General Electric Company | System and method for integrating a plurality of diagnostic related information |
US6336065B1 (en) | 1999-10-28 | 2002-01-01 | General Electric Company | Method and system for analyzing fault and snapshot operational parameter data for diagnostics of machine malfunctions |
US6622264B1 (en) | 1999-10-28 | 2003-09-16 | General Electric Company | Process and system for analyzing fault log data from a machine so as to identify faults predictive of machine failures |
US6947797B2 (en) | 1999-04-02 | 2005-09-20 | General Electric Company | Method and system for diagnosing machine malfunctions |
US20110208567A9 (en) | 1999-08-23 | 2011-08-25 | Roddy Nicholas E | System and method for managing a fleet of remote assets |
US6442542B1 (en) | 1999-10-08 | 2002-08-27 | General Electric Company | Diagnostic system with learning capabilities |
US6615367B1 (en) | 1999-10-28 | 2003-09-02 | General Electric Company | Method and apparatus for diagnosing difficult to diagnose faults in a complex system |
US7020595B1 (en) | 1999-11-26 | 2006-03-28 | General Electric Company | Methods and apparatus for model based diagnostics |
US6650949B1 (en) | 1999-12-30 | 2003-11-18 | General Electric Company | Method and system for sorting incident log data from a plurality of machines |
US6634000B1 (en) | 2000-02-01 | 2003-10-14 | General Electric Company | Analyzing fault logs and continuous data for diagnostics for a locomotive |
US6725398B1 (en) | 2000-02-11 | 2004-04-20 | General Electric Company | Method, system, and program product for analyzing a fault log of a malfunctioning machine |
US20030126258A1 (en) | 2000-02-22 | 2003-07-03 | Conkright Gary W. | Web based fault detection architecture |
US7739096B2 (en) | 2000-03-09 | 2010-06-15 | Smartsignal Corporation | System for extraction of representative data for training of adaptive process monitoring equipment |
CA2402631C (en) | 2000-03-09 | 2011-10-11 | Smartsignal Corporation | Generalized lensing angular similarity operator |
US6957172B2 (en) | 2000-03-09 | 2005-10-18 | Smartsignal Corporation | Complex signal decomposition and modeling |
US6952662B2 (en) | 2000-03-30 | 2005-10-04 | Smartsignal Corporation | Signal differentiation system using improved non-linear operator |
US6799154B1 (en) | 2000-05-25 | 2004-09-28 | General Electric Comapny | System and method for predicting the timing of future service events of a product |
US6760631B1 (en) | 2000-10-04 | 2004-07-06 | General Electric Company | Multivariable control method and system without detailed prediction model |
US20020091972A1 (en) | 2001-01-05 | 2002-07-11 | Harris David P. | Method for predicting machine or process faults and automated system for implementing same |
US6859739B2 (en) | 2001-01-19 | 2005-02-22 | Smartsignal Corporation | Global state change indicator for empirical modeling in condition based monitoring |
US7233886B2 (en) | 2001-01-19 | 2007-06-19 | Smartsignal Corporation | Adaptive modeling of changed states in predictive condition monitoring |
US7373283B2 (en) | 2001-02-22 | 2008-05-13 | Smartsignal Corporation | Monitoring and fault detection system and method using improved empirical model for range extrema |
US20020183971A1 (en) | 2001-04-10 | 2002-12-05 | Wegerich Stephan W. | Diagnostic systems and methods for predictive condition monitoring |
US7539597B2 (en) | 2001-04-10 | 2009-05-26 | Smartsignal Corporation | Diagnostic systems and methods for predictive condition monitoring |
US6643600B2 (en) | 2001-04-26 | 2003-11-04 | General Electric Company | Method and system for assessing adjustment factors in testing or monitoring process |
US7107491B2 (en) | 2001-05-16 | 2006-09-12 | General Electric Company | System, method and computer product for performing automated predictive reliability |
US6975962B2 (en) | 2001-06-11 | 2005-12-13 | Smartsignal Corporation | Residual signal alert generation for condition monitoring using approximated SPRT distribution |
US7457732B2 (en) | 2001-08-17 | 2008-11-25 | General Electric Company | System and method for measuring quality of baseline modeling techniques |
US7428478B2 (en) | 2001-08-17 | 2008-09-23 | General Electric Company | System and method for improving accuracy of baseline models |
US6892163B1 (en) | 2002-03-08 | 2005-05-10 | Intellectual Assets Llc | Surveillance system and method having an adaptive sequential probability fault detection test |
US7660705B1 (en) | 2002-03-19 | 2010-02-09 | Microsoft Corporation | Bayesian approach for learning regression decision graph models and regression models for time series analysis |
PT1579288T (pt) | 2002-11-04 | 2017-06-23 | Ge Intelligent Platforms Inc | Monitorização do estado do sistema utilizando máquina de aprendizagem local recorrente |
US6823253B2 (en) | 2002-11-27 | 2004-11-23 | General Electric Company | Methods and apparatus for model predictive control of aircraft gas turbine engines |
JP4333331B2 (ja) | 2002-12-20 | 2009-09-16 | セイコーエプソン株式会社 | 故障予測システム及び故障予測プログラム並びに故障予測方法 |
US20040243636A1 (en) | 2003-03-18 | 2004-12-02 | Smartsignal Corporation | Equipment health monitoring architecture for fleets of assets |
US7634384B2 (en) | 2003-03-18 | 2009-12-15 | Fisher-Rosemount Systems, Inc. | Asset optimization reporting in a process plant |
US8645276B2 (en) | 2003-07-11 | 2014-02-04 | Ca, Inc. | Modeling of applications and business process services through auto discovery analysis |
US7127371B2 (en) | 2003-10-08 | 2006-10-24 | Ge Medical Systems Information | Customized medical equipment preventative maintenance method and system |
AU2003295301A1 (en) | 2003-12-23 | 2005-07-14 | Telefonaktiebolaget Lm Ericsson (Publ) | Method and system for efficient routing in ad hoc networks |
EP1706850B1 (en) | 2004-01-09 | 2016-10-26 | United Parcel Service Of America, Inc. | System, method and apparatus for capturing telematics data with an active rfid tag |
US7062370B2 (en) | 2004-03-30 | 2006-06-13 | Honeywell International Inc. | Model-based detection, diagnosis of turbine engine faults |
US7447666B2 (en) | 2004-04-09 | 2008-11-04 | The Boeing Company | System and method for analyzing a pattern in a time-stamped event sequence |
US7280941B2 (en) | 2004-12-29 | 2007-10-09 | General Electric Company | Method and apparatus for in-situ detection and isolation of aircraft engine faults |
US7640145B2 (en) | 2005-04-25 | 2009-12-29 | Smartsignal Corporation | Automated model configuration and deployment system for equipment health monitoring |
US7536364B2 (en) | 2005-04-28 | 2009-05-19 | General Electric Company | Method and system for performing model-based multi-objective asset optimization and decision-making |
US7509235B2 (en) | 2005-08-31 | 2009-03-24 | General Electric Company | Method and system for forecasting reliability of assets |
JP4717579B2 (ja) | 2005-09-30 | 2011-07-06 | 株式会社小松製作所 | 作業機械のメンテナンス作業管理システム |
US7869908B2 (en) | 2006-01-20 | 2011-01-11 | General Electric Company | Method and system for data collection and analysis |
US20080059120A1 (en) | 2006-08-30 | 2008-03-06 | Fei Xiao | Using fault history to predict replacement parts |
US20080059080A1 (en) | 2006-08-31 | 2008-03-06 | Caterpillar Inc. | Method and system for selective, event-based communications |
US8275577B2 (en) | 2006-09-19 | 2012-09-25 | Smartsignal Corporation | Kernel-based method for detecting boiler tube leaks |
US7725293B2 (en) | 2006-12-07 | 2010-05-25 | General Electric Company | System and method for equipment remaining life estimation |
US8311774B2 (en) | 2006-12-15 | 2012-11-13 | Smartsignal Corporation | Robust distance measures for on-line monitoring |
US7548830B2 (en) | 2007-02-23 | 2009-06-16 | General Electric Company | System and method for equipment remaining life estimation |
US8145578B2 (en) | 2007-04-17 | 2012-03-27 | Eagel View Technologies, Inc. | Aerial roof estimation system and method |
US8229769B1 (en) | 2007-06-13 | 2012-07-24 | United Services Automobile Association | Systems and methods for processing overhead imagery |
JP5421913B2 (ja) | 2007-08-03 | 2014-02-19 | スマートシグナル・コーポレーション | 関連するアプリケーションに対する故障パターンマッチング相互参照のためのファジー分類方法 |
US7919940B2 (en) | 2007-10-21 | 2011-04-05 | Ge Intelligent Platforms, Inc. | System and method for jerk limited trajectory planning for a path planner |
US8050800B2 (en) | 2007-10-21 | 2011-11-01 | Ge Intelligent Platforms, Inc. | Method and system for meeting end conditions in a motion control system |
US7962240B2 (en) | 2007-12-20 | 2011-06-14 | Ge Intelligent Platforms, Inc. | Methods and systems for synchronizing a control signal of a slave follower with a master source |
US8352216B2 (en) | 2008-05-29 | 2013-01-08 | General Electric Company | System and method for advanced condition monitoring of an asset system |
US7756678B2 (en) | 2008-05-29 | 2010-07-13 | General Electric Company | System and method for advanced condition monitoring of an asset system |
US7822578B2 (en) | 2008-06-17 | 2010-10-26 | General Electric Company | Systems and methods for predicting maintenance of intelligent electronic devices |
US8285402B2 (en) | 2008-07-14 | 2012-10-09 | Ge Intelligent Platforms, Inc. | Method and system for safety monitored terminal block |
US8024069B2 (en) | 2009-01-28 | 2011-09-20 | Ge Intelligent Platforms, Inc. | System and method for path planning |
CN102844721B (zh) | 2010-02-26 | 2015-11-25 | 株式会社日立制作所 | 故障原因诊断系统及其方法 |
EP2375637A1 (en) | 2010-03-22 | 2011-10-12 | British Telecommunications Public Limited Company | Network routing adaptation based on failure prediction |
US8234420B2 (en) | 2010-07-14 | 2012-07-31 | Ge Intelligent Platforms, Inc. | Method, system, and apparatus for communicating using multiple controllers |
US8532795B2 (en) | 2010-10-04 | 2013-09-10 | General Electric Company | Method and system for offline code validation |
US8862938B2 (en) | 2011-04-18 | 2014-10-14 | General Electric Company | System, method, and apparatus for resolving errors in a system |
EP2700049A4 (en) | 2011-04-20 | 2015-08-19 | Cleveland Clinic Foundation | PREDICTIVE MODELING |
US8620853B2 (en) | 2011-07-19 | 2013-12-31 | Smartsignal Corporation | Monitoring method using kernel regression modeling with pattern sequences |
US9256224B2 (en) | 2011-07-19 | 2016-02-09 | GE Intelligent Platforms, Inc | Method of sequential kernel regression modeling for forecasting and prognostics |
US8660980B2 (en) | 2011-07-19 | 2014-02-25 | Smartsignal Corporation | Monitoring system using kernel regression modeling with pattern sequences |
GB2494416A (en) | 2011-09-07 | 2013-03-13 | Rolls Royce Plc | Asset Condition Monitoring Using Internal Signals Of The Controller |
US8560494B1 (en) | 2011-09-30 | 2013-10-15 | Palantir Technologies, Inc. | Visual data importer |
US8626385B2 (en) | 2012-03-15 | 2014-01-07 | Caterpillar Inc. | Systems and methods for analyzing machine performance |
US9051945B2 (en) | 2012-04-30 | 2015-06-09 | Caterpillar Inc. | System and method for identifying impending hydraulic pump failure |
US8850000B2 (en) | 2012-05-08 | 2014-09-30 | Electro-Motive Diesel, Inc. | Trigger-based data collection system |
US20130325502A1 (en) | 2012-06-05 | 2013-12-05 | Ari Robicsek | System and method for providing syndrome-specific, weighted-incidence treatment regimen recommendations |
US9234750B2 (en) | 2012-07-30 | 2016-01-12 | Caterpillar Inc. | System and method for operating a machine |
US20140060030A1 (en) | 2012-08-31 | 2014-03-06 | Caterpillar Inc. | Hydraulic accumulator health monitor |
RU2015115489A (ru) | 2012-09-24 | 2016-11-20 | Кейтерпиллар Инк. | Управление и контроль операций горных работ |
US9613413B2 (en) | 2012-10-17 | 2017-04-04 | Caterpillar Inc. | Methods and systems for determining part wear based on digital image of part |
US9139188B2 (en) | 2012-11-01 | 2015-09-22 | Caterpillar Inc. | Prediction control strategy for hybrid machinery |
US9151681B2 (en) | 2012-12-19 | 2015-10-06 | Progress Rail Services Corporation | Temperature detector having different types of independent sensors |
US20140170617A1 (en) | 2012-12-19 | 2014-06-19 | Caterpillar Inc. | Monitoring System for a Machine |
US20140184643A1 (en) | 2012-12-27 | 2014-07-03 | Caterpillar Inc. | Augmented Reality Worksite |
US8918246B2 (en) | 2012-12-27 | 2014-12-23 | Caterpillar Inc. | Augmented reality implement control |
US10001518B2 (en) | 2013-02-04 | 2018-06-19 | Abb Schweiz Ag | System and method for power transmission and distribution asset condition prediction and diagnosis |
US9547695B2 (en) | 2013-03-13 | 2017-01-17 | Abb Research Ltd. | Industrial asset event chronology |
US9535808B2 (en) | 2013-03-15 | 2017-01-03 | Mtelligence Corporation | System and methods for automated plant asset failure detection |
US8937619B2 (en) | 2013-03-15 | 2015-01-20 | Palantir Technologies Inc. | Generating an object time series from data objects |
US8909656B2 (en) | 2013-03-15 | 2014-12-09 | Palantir Technologies Inc. | Filter chains with associated multipath views for exploring large data sets |
US8917274B2 (en) | 2013-03-15 | 2014-12-23 | Palantir Technologies Inc. | Event matrix based on integrated data |
US20140330609A1 (en) | 2013-05-01 | 2014-11-06 | International Business Machines Corporation | Performance Driven Municipal Asset Needs and Sustainability Analysis |
US20140330747A1 (en) | 2013-05-01 | 2014-11-06 | International Business Machines Corporation | Asset lifecycle management |
US8799799B1 (en) | 2013-05-07 | 2014-08-05 | Palantir Technologies Inc. | Interactive geospatial map |
WO2014197497A2 (en) | 2013-06-03 | 2014-12-11 | The Morey Corporation | Geospatial asset tracking systems, methods and apparatus for acquiring, manipulating and presenting telematic metadata |
US9665843B2 (en) | 2013-06-03 | 2017-05-30 | Abb Schweiz Ag | Industrial asset health profile |
US8886601B1 (en) | 2013-06-20 | 2014-11-11 | Palantir Technologies, Inc. | System and method for incrementally replicating investigative analysis data |
AU2014302023A1 (en) | 2013-06-26 | 2016-02-11 | Climate Risk Pty Ltd | Computer implemented frameworks and methodologies for enabling risk analysis for a system comprising physical assets |
US8713467B1 (en) | 2013-08-09 | 2014-04-29 | Palantir Technologies, Inc. | Context-sensitive views |
US8689108B1 (en) | 2013-09-24 | 2014-04-01 | Palantir Technologies, Inc. | Presentation and analysis of user interaction data |
US8938686B1 (en) | 2013-10-03 | 2015-01-20 | Palantir Technologies Inc. | Systems and methods for analyzing performance of an entity |
US8812960B1 (en) | 2013-10-07 | 2014-08-19 | Palantir Technologies Inc. | Cohort-based presentation of user interaction data |
US8786605B1 (en) | 2013-10-24 | 2014-07-22 | Palantir Technologies Inc. | Systems and methods for distance and congestion-aware resource deployment |
US8832594B1 (en) | 2013-11-04 | 2014-09-09 | Palantir Technologies Inc. | Space-optimized display of multi-column tables with selective text truncation based on a combined text width |
US8868537B1 (en) | 2013-11-11 | 2014-10-21 | Palantir Technologies, Inc. | Simple web search |
US10410116B2 (en) | 2014-03-11 | 2019-09-10 | SparkCognition, Inc. | System and method for calculating remaining useful time of objects |
US8935201B1 (en) | 2014-03-18 | 2015-01-13 | Palantir Technologies Inc. | Determining and extracting changed data from a data source |
-
2016
- 2016-12-01 US US15/367,012 patent/US10474932B2/en active Active
-
2017
- 2017-08-31 CN CN201780057812.1A patent/CN109716356A/zh active Pending
- 2017-08-31 KR KR1020197008006A patent/KR20190039299A/ko unknown
- 2017-08-31 WO PCT/US2017/049749 patent/WO2018045241A2/en unknown
- 2017-08-31 EP EP17847593.5A patent/EP3507744A4/en not_active Withdrawn
- 2017-08-31 SG SG11201901668RA patent/SG11201901668RA/en unknown
- 2017-08-31 CA CA3035207A patent/CA3035207A1/en active Pending
- 2017-08-31 JP JP2019512303A patent/JP2019537764A/ja active Pending
- 2017-08-31 AU AU2017321799A patent/AU2017321799A1/en not_active Abandoned
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1578968A (zh) * | 2001-08-29 | 2005-02-09 | 霍尼韦尔国际公司 | 用于受监督的神经网络学习的组合方法 |
US20040175039A1 (en) * | 2003-03-06 | 2004-09-09 | Animetrics, Inc. | Viewpoint-invariant image matching and generation of three-dimensional models from two-dimensional imagery |
CN101124573A (zh) * | 2003-07-01 | 2008-02-13 | 西麦恩公司 | 用于把来自多维空间的数据投影到具有较少维的空间和对所述数据实行认知分析的方法、计算机程序与计算机可读装置 |
US20090097772A1 (en) * | 2007-10-12 | 2009-04-16 | Microsoft Corporation | Laplacian Principal Components Analysis (LPCA) |
CN102713676A (zh) * | 2009-11-11 | 2012-10-03 | 澳大利亚核能科技组织 | 放射性特征的异常检测 |
US20140365195A1 (en) * | 2013-06-07 | 2014-12-11 | Scientific Design Company, Inc. | System and method for monitoring a process |
CN105492982A (zh) * | 2013-06-07 | 2016-04-13 | 科学设计公司 | 用于监控工艺的系统及方法 |
Non-Patent Citations (1)
Title |
---|
KAH-CHYE TAN 等: "Ellipsoid representation of reference templates for efficient speaker verification", 《IEEE TRANSACTIONS ON SPEECH AND AUDIO PROCESSING》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111177139A (zh) * | 2019-12-31 | 2020-05-19 | 青梧桐有限责任公司 | 基于数据质量体系的数据质量验证监控及预警方法和系统 |
CN112883258A (zh) * | 2021-01-11 | 2021-06-01 | 北京达佳互联信息技术有限公司 | 信息推荐方法、装置、电子设备及存储介质 |
CN112883258B (zh) * | 2021-01-11 | 2024-05-21 | 北京达佳互联信息技术有限公司 | 信息推荐方法、装置、电子设备及存储介质 |
CN115865751A (zh) * | 2022-11-25 | 2023-03-28 | 南方电网数字平台科技(广东)有限公司 | 基于多态数据的故障检测方法及装置 |
CN115865751B (zh) * | 2022-11-25 | 2024-05-14 | 南方电网数字平台科技(广东)有限公司 | 基于多态数据的故障检测方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
AU2017321799A1 (en) | 2019-04-11 |
KR20190039299A (ko) | 2019-04-10 |
SG11201901668RA (en) | 2019-03-28 |
WO2018045241A2 (en) | 2018-03-08 |
US10474932B2 (en) | 2019-11-12 |
CA3035207A1 (en) | 2018-03-08 |
US20180060703A1 (en) | 2018-03-01 |
JP2019537764A (ja) | 2019-12-26 |
EP3507744A4 (en) | 2020-04-08 |
EP3507744A2 (en) | 2019-07-10 |
WO2018045241A3 (en) | 2019-04-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109716356A (zh) | 多变量数据中的异常检测 | |
US20220398495A1 (en) | Computer System and Method for Detecting Anomalies in Multivariate Data | |
US9842302B2 (en) | Population-based learning with deep belief networks | |
CN109074255A (zh) | 用于提供资产事件和信号数据的可视化的计算机系统和方法 | |
JP5808605B2 (ja) | 異常検知・診断方法、および異常検知・診断システム | |
US20130282336A1 (en) | Anomaly Sensing and Diagnosis Method, Anomaly Sensing and Diagnosis System, Anomaly Sensing and Diagnosis Program and Enterprise Asset Management and Infrastructure Asset Management System | |
EP3223095B1 (en) | Method and apparatus for optimizing diagnostics of rotating equipment | |
CN107851057A (zh) | 预测模型的动态执行 | |
CN110832532A (zh) | 工业资产完整性数据的智能和自动审查 | |
JP2010530062A5 (zh) | ||
WO2018039381A2 (en) | Interface tool for asset fault analysis | |
CN109643256A (zh) | 用于推荐资产修复的计算机架构和方法 | |
US20140188778A1 (en) | Computer-Implemented System for Detecting Anomaly Conditions in a Fleet of Assets and Method of Using the Same | |
CN108780526A (zh) | 基于资产定位的预测模型的处置 | |
WO2019226559A1 (en) | Coordinating execution of predictive models between multiple data analytics platforms to predict problems at an asset | |
WO2018140662A1 (en) | Method and system of identifying environment features for use in analyzing asset operation | |
CN107851233A (zh) | 资产处的本地分析 | |
CN108463806A (zh) | 用于基于预测模型修改数据采集参数的计算机体系结构和方法 | |
US10379982B2 (en) | Computer system and method for performing a virtual load test | |
Bect et al. | Identification of abnormal events by data monitoring: Application to complex systems | |
Dutta et al. | Performance evaluation of south Esk hydrological sensor web: unsupervised machine learning and semantic linked data approach | |
Liu et al. | EXPERIENCE: Algorithms and case study for explaining repairs with uniform profiles over IoT data | |
Huang | Application of the artificial fish school algorithm and particle filter algorithm in the industrial process control particle filtering algorithm for industrial process control | |
Agarwal et al. | Data Architecture and Analytics Requirements for Artificial Intelligence and Machine Learning Applications to Achieve Condition-Based Maintenance | |
Koch et al. | Improving Machinery & Equipment Life Cycle Management Processes |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40008253 Country of ref document: HK |
|
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20190503 |