CN113811829A - 使用在线机器学习检测和预测机器故障 - Google Patents
使用在线机器学习检测和预测机器故障 Download PDFInfo
- Publication number
- CN113811829A CN113811829A CN202080035341.6A CN202080035341A CN113811829A CN 113811829 A CN113811829 A CN 113811829A CN 202080035341 A CN202080035341 A CN 202080035341A CN 113811829 A CN113811829 A CN 113811829A
- Authority
- CN
- China
- Prior art keywords
- machine
- machine fault
- data
- indicative
- sensor data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000010801 machine learning Methods 0.000 title claims description 24
- 238000000034 method Methods 0.000 claims abstract description 139
- 230000008569 process Effects 0.000 claims abstract description 99
- 238000001514 detection method Methods 0.000 claims abstract description 63
- 238000012545 processing Methods 0.000 claims description 14
- 238000009826 distribution Methods 0.000 claims description 10
- 230000006399 behavior Effects 0.000 claims description 5
- 238000007619 statistical method Methods 0.000 claims description 5
- 238000012544 monitoring process Methods 0.000 abstract description 15
- 238000007726 management method Methods 0.000 description 32
- 230000001953 sensory effect Effects 0.000 description 10
- 238000004519 manufacturing process Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 8
- 238000012549 training Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 5
- 239000000243 solution Substances 0.000 description 5
- 230000002159 abnormal effect Effects 0.000 description 4
- 238000000605 extraction Methods 0.000 description 4
- 238000012423 maintenance Methods 0.000 description 4
- 206010000117 Abnormal behaviour Diseases 0.000 description 3
- 238000000354 decomposition reaction Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000007781 pre-processing Methods 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 238000003860 storage Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000005265 energy consumption Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000003542 behavioural effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013075 data extraction Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000001746 injection moulding Methods 0.000 description 1
- 230000007257 malfunction Effects 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000007639 printing Methods 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 238000013403 standard screening design Methods 0.000 description 1
- 238000013107 unsupervised machine learning method Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B23/00—Testing or monitoring of control systems or parts thereof
- G05B23/02—Electric testing or monitoring
- G05B23/0205—Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults
- G05B23/0218—Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults
- G05B23/0224—Process history based detection method, e.g. whereby history implies the availability of large amounts of data
- G05B23/024—Quantitative history assessment, e.g. mathematical relationships between available data; Functions therefor; Principal component analysis [PCA]; Partial least square [PLS]; Statistical classifiers, e.g. Bayesian networks, linear regression or correlation analysis; Neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B23/00—Testing or monitoring of control systems or parts thereof
- G05B23/02—Electric testing or monitoring
- G05B23/0205—Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults
- G05B23/0218—Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults
- G05B23/0243—Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults model based detection method, e.g. first-principles knowledge model
- G05B23/0254—Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults model based detection method, e.g. first-principles knowledge model based on a quantitative model, e.g. mathematical relationships between inputs and outputs; functions: observer, Kalman filter, residual calculation, Neural Networks
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Theoretical Computer Science (AREA)
- Evolutionary Computation (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Automation & Control Theory (AREA)
- Testing And Monitoring For Control Systems (AREA)
Abstract
本文公开了一种用于预测工业机器故的障的方法和机器监控系统。该系统被构造成接收与诸如大型工业机械的机器相关的传感器数据,并选择机器故障的指示性数据特征。该系统然后将不受监督机器故障检测过程和受监督机器故障预测过程应用于所选择的指示性数据特征。当接收到机器的新传感器数据时,将机器故障检测过程应用于与新传感器数据相关联的选定的至少一个指示性数据特征。这允许所公开的系统确定是否检测到至少一个机器故障指示符,如果是,则标记机器故障。然后,系统用新标记的机器故障指示符更新受监督机器故障预测过程,使得受监督机器故障预测过程被连续更新和改进。
Description
相关申请的交叉引用
本申请要求于2019年4月11日提交的美国临时申请号62/832,467的权益,其内容通过引用并入本文。
技术领域
本公开总体上涉及机器的维护系统,并且更具体地涉及使用在线机器学习来自动检测和预测机器故障以用于连续改进和自适应预测模型。
背景技术
通信、处理、云计算、人工智能和其他计算机化技术近年来取得了显著进步,预示着技术和生产的新领域。此外,自20世纪70年代以来或之前采用的许多工业技术至今仍在使用。与这些工业技术相关的现有解决方案通常都有微小的改进,因此只能略微提高生产和产量。
在现代制造实践中,制造商通常需要严格的生产时间表,并提供完美或接近完美的生产质量。因此,每当发生意外的机器故障时,这些制造商都有遭受重大损失的风险。机器故障是指机器偏离正确操作时发生的事件。错误,即与机器的正确或预期状态的偏差,不一定是故障,但可能导致并指示潜在的未来故障。此外,错误可能会导致可能影响性能的异常机器行为。
典型制造商基于故障的平均机器停机时间(即由于机器故障导致生产部分或全部停止的平均时间量)为每年17天,即17天的生产和收入损失。例如,在典型的450兆瓦功率涡轮机的情况下,一天的停机时间可能会使制造商损失超过300万美元的收入。这种停机时间可能具有与修理、安全预防措施等相关的额外成本。
在能源发电厂中,每年要花费数十亿美元来确保可靠性,特别是用于将生产停机时间最小化的备用系统和冗余。此外,监控系统可用于快速识别故障,从而在发生停机时加快恢复生产。然而,现有的监控系统通常仅在停机时间开始之后或之前识别故障。
一些现有的监控和维护解决方案使用检测功能来预测即将到来的机器故障。这种解决方案基于联接到这种机器的传感器收集的数据。传感器数据的处理仅限于传感器收集的信号,并且仅限于静态预测。然而,这些解决方案有几个不足之处,例如随着机器数据的变化而变得过时和不相关,需要对用于处理动态数据的预测机制、静态预测和检测模型进行连续维护等。
因此,提供一种能够克服上述挑战的解决方案将是有利的。
发明内容
下面是本公开的几个示例实施例的概述。提供本概述是为了方便读者提供对这些实施例的基本理解,并不完全限定本公开的范围。该概述不是所有预期实施例的广泛概述,并且既不旨在标识所有实施例的关键或重要元件,也不旨在描绘任何或所有方面的范围。其唯一目的是以简化形式呈现一个或多个实施例的一些概念,作为稍后呈现的更详细描述的序言。为了方便起见,术语“某些实施例”在这里可以用来指本公开的单个实施例或多个实施例。
本文公开的某些实施例包括用于检测和预测工业机器故障的基于在线机器学习的方法。该方法包括接收与至少一个工业机器相关的传感器数据;基于传感器数据的至少一部分生成多个数据特征;从多个数据特征中选择用于机器故障检测的至少一个指示性数据特征;将不受监督机器故障检测过程应用于所选择的至少一个指示性数据特征,其中所述不受监督机器故障检测过程被构造为基于所选择的至少一个指示性数据特征来检测机器故障指示符;接收与所述至少一个工业机器相关的新传感器数据;通过将不受监督机器故障检测过程应用于与新传感器数据相关联的所选择的至少一个指示性数据特征,确定在新传感器数据中是否检测到至少一个机器故障指示符;以及在确定检测到至少一个机器故障指示符时标记该至少一个机器故障指示符,其中在确定没有检测到机器故障指示符时,不受监督机器故障检测过程连续搜索机器故障指示符。
本文公开的某些实施例还包括一种基于在线机器学习的方法的系统,用于检测和预测工业机器故障。该系统包括处理电路;以及存储器,所述存储器包含指令,当由所述处理电路执行时,所述指令将所述系统构造为:接收与至少一个工业机器相关的传感器数据;基于传感器数据的至少一部分生成多个数据特征;从多个数据特征中选择用于机器故障检测的至少一个指示性数据特征;将不受监督机器故障检测过程应用于所选择的至少一个指示性数据特征,其中所述不受监督机器故障检测过程被构造为基于所选择的至少一个指示性数据特征来检测机器故障指示符;接收与所述至少一个工业机器相关的新传感器数据;通过将不受监督机器故障检测过程应用于与新传感器数据相关联的所选择的至少一个指示性数据特征,确定在新传感器数据中是否检测到至少一个机器故障指示符;以及在确定检测到所述至少一个机器故障指示符时标记所述至少一个机器故障指示符,其中在确定没有检测到机器故障指示符时,不受监督机器故障检测过程连续搜索机器故障指示符。
附图说明
在说明书结尾的权利要求中特别指出并明确要求保护本文公开的主题。从下面结合附图的详细描述中,所公开的实施例的前述和其他目的、特征和优点将变得显而易见。
图1是用于描述各种公开实施例的网络图。
图2是根据实施例的机器管理服务器的示意图。
图3是示出根据实施例的用于机器故障的自动检测和预测的方法的流程图。
图4A是示出根据实施例的机器故障检测过程的训练过程的示例曲线图。
图4B是示出根据实施例的机器故障检测或预测过程对新传感器数据的应用的示例图。
具体实施方式
重要的是要注意这里公开的实施例只是这里创新教导的许多有利用途的示例。通常,在本申请的说明书中作出的陈述不一定限制各种要求保护的实施例中的任何一个。此外,某些陈述可能适用于某些发明特征,但不适用于其他特征。通常,除非另有说明,单数元件可以是复数,反之亦然,不失一般性。在附图中,通过多个视图,相同的附图标记表示相同的部件。
各种公开的实施例包括用于使用机器学习技术预测机器故障的方法和机器监控系统。在一实施例中,机器监控系统被构造为接收与机器(例如大型工业机械)相关的传感器数据,并选择机器故障的指示性数据特征。然后,系统将不受监督机器故障检测过程和受监督机器故障预测过程应用于所选指示性数据特征。当接收到机器的新传感器数据时,对与新传感器数据相关联的所选至少一个指示性数据特征应用机器故障检测过程。这允许所公开的系统确定是否检测到至少一个机器故障指示符,如果是,则标记该机器故障。然后,系统被构造为使用新标记的机器故障指示符自动更新受监督机器故障预测过程,使得受监督机器故障预测过程不断更新和改进。
图1示出了用于描述各种公开的实施例的示例网络图100。示例网络图100包括经由网络110通信连接的机器监控系统(MMS)130、管理服务器140、数据库150和客户端设备160。示例网络图100还包括多个传感器120-1到120-n(以下单独称为传感器120并统称为传感器120,仅为了简单起见),其中n是等于或大于1的整数,连接到机器监控系统130。网络110可以是但不限于无线网络、蜂窝或有线网络、局域网(LAN)、广域网(WAN)、城域网(MAN)、互联网、万维网(WWW)、类似网络及其任意组合。
客户端设备160可以是但不限于个人计算机、膝上型计算机、平板计算机、智能电话、可穿戴计算设备或能够接收和显示指示维护和故障定时预测、受监督分析的结果、机器运行数据的不受监督分析等的通知的任何其他设备。
传感器120位于工业机器170附近(例如,在预定阈值内的物理接近)。工业机器170可以是其性能可以经由传感器数据表示的任何机器,例如但不限于、涡轮机、发动机、焊接机、三维(3D)打印机、注射成型机、它们的组合、它们的一部分等。
每个传感器120被构造为基于机器170的操作收集传感器输入,例如但不限于声音信号、超声波信号、光、运动跟踪指示符、温度、能耗指示符等。传感器120可以包括但不限于声音捕捉传感器、运动跟踪传感器、能量消耗计、温度计等。传感器120中的任何一个可以连接到机器170,但不是必须连接到机器170(这种连接在图1中没有示出,仅仅是为了简单起见,并不限制所公开的实施例)。
传感器120连接到机器监控系统130。机器监控系统130可以被构造成存储和预处理从传感器120接收的原始传感器数据。可选地或共同地,机器监控系统130可以被构造成周期性地检索存储在例如数据库150中的收集的传感器数据。
预处理可以包括但不限于数据清理、归一化、重新缩放、重新趋势化、重新格式化、噪声过滤、其组合等。预处理可以还包括数据特征提取。数据特征提取的结果可以包括在机器学习期间由管理服务器140使用的数据特征,以便检测在机器故障发生时指示机器故障的数据特征,或者如下文进一步描述的指示即将发生的机器故障的数据特征。
在一实施例中,管理服务器140可以被构造为在时间戳传感器数据中识别由至少一个统计特征表示的多个数据特征。多个数据特征表示机器的至少一个部件的行为。数据特征提取可以包括但不限于降维技术,例如但不限于奇异值分解、离散傅立叶变换、离散小波变换、线段方法或其组合。当使用这种降维技术时,预处理可以导致例如感官输入的较低维空间。机器监控系统130被构造成将预处理的感官输入发送到管理服务器140。
在一实施例中,管理服务器140被构造成经由网络110接收与至少一个机器(例如,机器170)相关联的时间戳传感器数据。时间戳传感器数据可以从机器监控系统130接收。时间戳传感器数据可以从一个或多个传感器,例如传感器120,接收。传感器数据可以被连续接收并且可以被实时接收。每种类型的传感器数据可以与至少一与机器相关联的、由机器执行的过程等相关。也就是说,第一类型的传感器数据可以与工业机器170的温度相关,第二类型的传感器数据可以与机器170的某个齿轮的速度相关,等等。在另一个实施例中,管理服务器140被构造成接收预处理的传感器数据。
在一实施例中,管理服务器140可以被构造为存储从机器监控系统130接收的传感器数据(原始数据、预处理数据或两者)。替代地或共同地,传感器数据可以存储在数据库150中。数据库150可以进一步存储从与其他机器(也未示出)相关联的多个其他传感器(未示出)收集的感官输入(原始的、预处理的或两者)。数据库150还可以存储指示符、异常模式、行为趋势、故障预测、用于分析感官输入数据的机器学习模型或其组合。在一实施例中,管理服务器140被构造成预处理原始感官输入,如上面进一步描述的。
在一实施例中,管理服务器140被构造成基于接收的传感器数据生成一个或多个数据特征。数据特征可以由数学计算的特征来表示。在另一实施例中,可以通过将预处理的传感器数据和/或每种类型的原始传感器数据转换成由数学计算的特征表示的一个或多个数据特征来执行生成。数据特征可以是原始传感器数据的数学表示,允许以更清晰的方式表示传感器数据。该生成可以使用至少一种统计分析技术来实现。统计分析技术可以包括但不限于计算原始感官输入的平均值、计算原始感官输入的中值、计算原始感官输入的标准偏差等。
在一实施例中,对原始或预处理的传感器数据实施统计分析技术允许管理服务器140生成多个数据特征。数据特征允许便于识别与涉及机器170的多个过程相关联的多个异常之间的关联。也就是说,数据特征是原始的或预处理的传感器数据的新的信息表示,允许识别原始传感器数据中的隐藏结构。在另一个实施例中,转换包括减小原始传感器数据的大小,例如,通过将秒分辨率的原始数据转换成指示分钟分辨率。该变换可以包括奇异值分解、离散傅立叶变换、离散小波变换、线段方法等。
在另一个实施例中,变换包括将原始传感器数据和/或预处理的传感器数据归一化到统一的尺度。也就是说,原始传感器数据可以以不同的尺度呈现,因此管理服务器140可以被构造为通过为所有原始传感器数据生成统一的尺度来归一化原始传感器数据。传感器数据可以包括由第一传感器感测的特定档位、由第二传感器感测的油温等。统一尺度可用于识别不同类型传感器数据之间的关联、不同类型传感器数据的异常行为之间的相关性等。
在一实施例中,管理服务器140被构造为从多个数据特征中选择至少一个指示性数据特征,用于机器故障检测和/或机器故障预测。指示性数据特征是传感器数据的表示,当被分析时,相对于对机器故障预测过程或机器故障检测过程贡献较小的其他数据特征,允许更准确地指示机器故障和/或即将到来的机器故障。
在一实施例中,指示性数据特征的选择是通过扫描大而全面的特征数据库以获得用于检测和预测的信息特征的两个子集来执行的。指示性数据特征可以包括描述性统计特征。事件检测的指示性特征指示一旦已经发生了这样的故障则机器故障。例如,用于机器故障检测的指示性数据特征可以与水温、特定工业机器部件的每分钟转数(RPM)等相关。故障预测的指示性特征是在故障发生之前示出逐渐退化的指示性特征。例如,用于事件预测的指示性数据特征可以与工业机器的振动声级、工业机器的特定部件的油压等相关。应当注意,管理服务器140可以使用由同一传感器感测的感官输入来检测和预测工业机器170中的事件。例如,油压可以是机器故障检测的指示性数据特征,并且它也可以是机器故障预测的指示性数据特征。在监督模型的每次重新训练迭代中迭代执行特征选择。
在另一实施例中,可以至少基于多个数据特征的分布来选择多个指示性数据特征。该分布可以指示多个数据特征之间朝着机器故障发展的关联。在一实施例中,该分布可以指示机器故障期间多个数据特征之间的关联。
在另一实施例中,基于预测机器故障和/或检测机器故障的概率,从多个数据特征中选择至少一个指示性数据特征。例如,包括五个部件的工业机器(例如,机器170)正在被监控,并且在特定时间段期间,与机器170的三个部件相关联的三个指示性数据特征的参数指示每个部件的异常参数。
根据同一示例,管理服务器140可以确定指示性数据特征的分布,即它们中的每一个的异常参数,指示三个指示性数据特征之间的关联,这三个指示性数据特征可以指示即将到来的机器故障。在另一个实施例中,相对于其他数据特征,具有更好的概率来对预测机器故障做出更多贡献的指示性数据特征的选择可以通过识别机器故障之前数据特征分布相对于机器正常状态的增加的变化来实现。
在一实施例中,管理服务器140被构造为将不受监督机器故障检测过程和受监督机器故障预测过程应用于所选择的指示数据特征。不受监督机器故障检测过程被构造成基于所选择的指示性数据特征来检测机器故障指示符。机器故障指示符可以是例如与机器(例如机器170)的至少一个部件的特定参数相关联的指示机器故障的值。例如,某个工业机器的90摄氏度的油温可以被分类为机器故障的指示符。
受监督机器故障预测过程被构造成基于所选择的指示性数据特征来预测机器故障。在一实施例中,不受监督机器故障检测过程和受监督机器故障预测过程可以被应用于至少一部分先前关于一个或多个机器故障指示符被标记或标注的时间戳传感器数据。因此,通过对标记或被标注的传感器数据应用该过程,实现了训练阶段。训练阶段可以包括记录与每个机器故障指示符相关联的特征,例如机器故障的平均值、连续时间等。
在一实施例中,管理服务器140被构造成接收与至少一个机器(例如,机器170)相关的新传感器数据。新传感器数据可以包括从至少一个传感器(例如传感器120)接收的管理服务器140以前从未处理过的信息的至少一部分。也就是说,新传感器数据可以包括例如以前没有记录或标记的机器故障。在一实施例中,新传感器数据可以与至少一个机器170的一个或多个部件相关联。例如,当关于机器170的第一部件接收到相同的传感器数据时,关于机器170的三个其他部件接收到至少一组新的数据。
在一实施例中,管理服务器140被构造为通过将不受监督机器故障检测过程应用于所选择的指示性数据特征或指示性数据特征,来确定在新传感器数据中是否检测到一个或多个机器故障指示符。不受监督机器故障检测过程被设计成检测机器故障指示符和新的机器故障指示符。
在一示例中,在传感器数据中检测到十个机器故障指示符。当在管理服务器140处接收到新传感器数据时,检测到另外两个新的机器故障指示符。在一实施例中,新的机器故障指示符可以与以前从未指示过机器故障的机器部件相关联。在进一步的实施例中,新的机器故障指示符可以与机器部件的已知机器故障类型相关联,但是以不同的新尺度。例如,新的机器故障指示符可以指示由机器发动机的每分钟转数(RPM)表示的异常行为,这是以前从未在机器故障上指示的参数。根据另一个示例,新的机器故障指示符可以指示由机器的油温表示的机器的异常行为,该油温是之前多次对机器故障指示但以不同的尺度指示的参数。
在一实施例中,管理服务器140被构造成在确定检测到一个或多个机器故障指示符时标记该一个或多个机器故障指示符。在一实施例中,可以生成电子标记并将其与每个新的机器故障指示符相关联。电子标记可以包括与机器故障指示符相关的描述性信息,例如指示故障类型、故障水平等的标题。
在一示例中,通过机器故障检测过程检测特定机器的新振动水平,并将其分类为机器故障。根据同一示例,新的振动水平,即与新的振动水平相关联的值,被管理服务器140标记。标记可以包括例如新的振动水平的值、检测到新的振动水平的时间、用于感测新的振动水平的传感器、受新的振动水平影响的机器部件等。应当注意,在确定没有检测到机器故障指示符时,不受监督机器故障检测过程连续搜索机器故障指示符。
在一实施例中,管理服务器140被构造为利用标记的一个或多个机器故障指示符来更新受监督机器故障预测过程,使得受监督机器故障预测过程被连续更新。通过用新标记的机器故障指示符更新机器故障预测过程,机器故障预测过程的预测能力随着时间的推移保持较高。也就是说,使用本文公开的方法训练机器故障预测过程,以预测即使在长时间没有人工干预的情况下的机器故障。预测机器故障可能包括识别如上面进一步讨论的机器传感器数据所示的模式、趋势等。
在一个示例中,这里公开的实施例允许检测和预测工业机器的停机时间。为此目的,管理服务器140需要一初始标记周期,在该周期中,故障是已知的并被标记。该标记的时间范围可以由客户以故障日志的形式提供,或者在没有此类日志可用的情况下在内部生成。当日志数据不可用时,所公开的管理服务器140被构造为继续初始训练并生成两个机器学习模型:一个用于故障检测,另一个用于故障预测(每个基于指示性特征的相关子集)。
这些初始训练的模型随着时间的推移不断更新(以便适应变化和新类型的故障)。由管理服务器140检测到的每个新故障也被反馈到管理服务器140中,并被用来即时(on-the-fly)重新训练检测和预测模型。一旦更新的模型被训练和准备好,它们就替换先前的模型并应用于新的流数据,并且该过程迭代地继续。
在一实施例中,所公开的方法基于在线机器学习技术。在线机器学习是一种机器学习方法,其中数据以连续的顺序变得可用,并用于在每个步骤更新未来数据的最具指示性的预测器,这与批处理学习技术相反,批处理学习技术通过一次学习整个训练数据集来生成最具指示性的预测器。也就是说,通过使用所公开的方法,确定是否检测到新的机器故障指示符的过程连续发生,以及受监督的机器故障预测过程的标记过程和更新过程连续发生。
在一实施例中,所公开的方法可以使用半受监督学习来实现。半受监督学习是一类机器学习任务和技术,通常使用少量已标记数据和大量未标记数据。当使用半受监督学习时,该过程需要从包括标记和未标记数据的数据集学习。半受监督技术是受监督和不受监督机器学习方法的结合。一种这样的技术包括用不受监督机器学习方法完成未标记样本,然后允许在完整的标记数据集上应用受监督方法。
图2示出了根据一个实施例实施的管理服务器140的示例框图。管理服务器140包括联接到存储器220、存储装置230、网络接口240和机器学习(ML)处理器250的处理电路210。在一实施例中,管理服务器140的部件可以经由总线260通信连接。
处理电路210可以实现为一个或多个硬件逻辑部件和电路。例如,但不限于,可以使用的说明性类型的硬件逻辑部件包括现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、系统级芯片系统(SOC)、图形处理单元(GPU)、张量处理单元(TPU)、通用微处理器、微控制器、数字信号处理器(DSP)等,或可以执行信息的计算或其他操纵的任何其他硬件逻辑部件。
存储器220可以是易失性的(例如,RAM)、非易失性的(例如,ROM、闪存等)或其组合。在一种构造中,用于实施本文公开的一个或多个实施例的计算机可读指令可以存储在存储装置230中。
在另一个实施例中,存储器220被构造成存储软件。软件应广义地解释为任何类型的指令,无论是指软件、固件、中间件、微码、硬件描述语言还是其他。指令可以包括代码(例如,源代码格式、二进制代码格式、可执行代码格式或任何其他合适的代码格式)。当由一个或多个处理器执行时,指令使得处理电路210执行这里描述的各种过程。
存储装置230可以是磁存储装置、光存储装置等,并且可以被实现为例如闪存或其他存储技术、CD-ROM、数字多功能盘(DVD)、SSD或可以用于存储期望信息的任何其他介质。
网络接口240允许管理服务器140与机器监控系统130通信,用于例如接收原始和/或预处理的感官输入。另外,网络接口240允许管理服务器140与客户端设备160通信,以便发送例如与机器异常活动、机器故障预测等相关的通知。
机器学习过程250被构造为基于经由网络接口240接收的传感器数据来执行机器学习处理器,如本文进一步描述的。在一实施例中,机器学习单元250还被构造成预测机器故障、更新一个或多个机器故障预测过程等。机器学习过程250可以实现为例如GPU、TPU、通用微处理器、DSP等。
应当理解,这里描述的实施例不限于图2所示的特定架构,并且在不脱离所公开的实施例的范围的情况下,可以同等地使用其他架构。
图3是示出根据实施例的用于检测和预测机器故障的方法的示例流程图300。在一实施例中,该方法可以由机器故障预测器140执行(见图1和2)。
在S310处,接收至少与工业机器(例如,机器170)相关的时间戳传感器数据。时间戳传感器数据可以从机器170的一个或多个传感器接收。每种类型的传感器数据可以与至少一个与机器相关联、由机器执行的过程等相关。
在S320处,基于时间戳传感器数据的至少一部分生成多个数据特征。使用数据提取技术提取数据特征。数据特征提取可以包括但不限于降维技术,例如但不限于奇异值分解、离散傅立叶变换、离散小波变换、线段方法或其组合。在一实施例中,数据特征可以由至少一个统计特征来表示和/或可以表示工业机器的至少一个部件的行为。
在S330处,从多个数据特征中选择用于机器故障检测和机器故障预测中的至少一个的至少一个指示性数据特征。
指示性数据特征是传感器数据的表示,当被分析时,相对于对机器故障预测过程或机器故障检测过程贡献较小的其他数据特征,允许更准确地指示机器故障和/或即将到来的机器故障。如上所述,可以至少基于多个数据特征的分布来选择指示性数据特征。
在S340处,对所选择的至少一个指示性数据特征进行不受监督机器故障检测过程和受监督机器故障预测过程。不受监督机器故障检测过程被构造为基于所选择的至少一个指示性数据特征来检测机器故障指示符,并且受监督机器故障预测过程被构造为基于所选择的至少一个指示性数据特征来预测机器故障,如关于图1进一步讨论的。
在S350处,接收与机器相关的新传感器数据。新传感器数据可以包括从至少一个传感器(例如传感器120)接收的、管理服务器140以前从未处理过的信息的至少一部分,例如已经达到新水平的某个部件的值。
在S360处,基于所选择的至少一个指示数据特征,确定是否在所接收的新传感器数据中检测到一个或多个机器故障指示符,如果是,则执行继续到S370;否则,执行继续到S350。通过将不受监督机器故障检测过程应用于新传感器数据或与新传感器数据相关联的所选至少一个指示性数据特征来实现该确定。应当注意,在确定没有检测到机器故障指示符时,不受监督机器故障检测过程连续搜索机器故障指示符。
在S370处,在确定检测到一个或多个机器故障指示符时,标记一个或多个机器故障指示符。在一实施例中,可以生成电子标记并将其与检测到的每个新机器故障指示符相关联。电子标记可以包括与机器故障指示符相关的描述性信息,如上面进一步讨论的。
在S380处,用标记的一个或多个机器故障指示符更新受监督机器故障预测过程(之前应用的)。在一些实施例中,也可以使用半受监督或自监督方法。需要注意的是,受监督机器故障预测过程是不断更新的。应当进一步注意,更新和标记的一个或多个机器故障指示符可以与已知的或旧的传感器数据合并,该传感器数据与先前检测到并存储在例如数据库150中的机器(例如机器170)相关联。
图4A是示出根据实施例的机器故障检测过程的训练过程的表示的示例曲线图400A。图4A所示的曲线图包括曲线图400A,其中示出了曲线410A,并且表示机器的某个参数的传感器数据,例如机器发动机的每分钟转数(RPM)。曲线420A表示提供给机器故障检测过程的标记的机器故障,其用于训练机器故障检测过程以检测机器故障。机器故障开始的点由430A表示,机器故障结束的点由440A表示。
图4B是示出根据实施例将机器故障检测和/或预测过程应用于新传感器数据的表示的示例曲线图400B。图4B中所示的曲线图包括曲线图400B,其中曲线410B被示出,并且表示机器的某个参数的传感器数据,例如机器发动机的每分钟转数(RPM)。曲线420B表示由机器故障检测过程检测到的新机器故障。
应当注意,与每个新检测到的机器故障相关的信息被用作机器故障检测过程以及机器故障预测过程的输入。经过训练的模型,即过程,随着时间的推移不断更新,以适应变化和新类型的故障。系统检测到的每个新故障也被反馈到系统中,并用于实时或接近实时地重新训练检测和预测模型。一旦更新的过程在确定性水平之上被训练,更新的过程替换先前的过程,并且被应用于新的流式传感器数据,并且该方法迭代地连续。
这里公开的各种实施例可以实施为硬件、固件、软件或其任意组合。此外,软件优选地被实施为有形地包含在程序存储单元或计算机可读介质上的应用程序,该程序存储单元或计算机可读介质由部件、某些设备和/或设备的组合组成。该应用程序可以被上传到包括任何合适架构的机器,并由该机器执行。优选地,机器在计算机平台上实施,该计算机平台具有硬件,例如一个或多个中央处理单元(“CPU”)、存储器和输入/输出接口。计算机平台还可以包括操作系统和微指令代码。这里描述的各种过程和功能可以是微指令代码的一部分或应用程序的一部分,或它们的任意组合,它们可以由CPU执行,无论是否明确示出了这样的计算机或处理器。此外,各种其他外围单元可以连接到计算机平台,例如附加数据存储单元和打印单元。此外,非暂时性计算机可读介质是除暂时性传播信号之外的任何计算机可读介质。
应当理解,本文中使用诸如“第一”、“第二”等名称的任何对元件的引用通常不限制那些元件的数量或顺序。相反,这些名称在本文中通常用作区分两个或更多个元件或元件的实例的便利方法。因此,对第一和第二元件的引用并不意味着在那里可以仅使用两个元件或者第一元件必须以某种方式在第二元件之前。此外,除非另有说明,一组元件包括一个或多个元件。
如本文所用的,短语“至少一个”后跟项目列表意味着可以单独使用所列项目中的任何一个,或者可以使用所列项目中的两个或更多个的任何组合。例如,如果系统被描述为包括“A、B和C中的至少一个”,则该系统可以单独包括A;B单独;C单独;A和B组合;B和C组合;A和C组合;或A、B和C组合。
本文中引用的所有示例和条件语言旨在用于教学目的,以帮助读者理解所公开的实施例的原理和发明人为推进本领域所贡献的概念,并且应被解释为不限于这些具体列举的示例和条件。此外,本文中叙述所公开实施例的原理、方面和实施例及其具体示例的所有陈述旨在涵盖其结构和功能等效物。此外,此类等效物旨在包括当前已知的等效物以及将来开发的等效物,即,无论结构如何,所开发的执行相同功能的任何元件。
Claims (19)
1.一种用于检测和预测工业机器故障的基于在线机器学习的方法,包括:
接收与至少一个工业机器相关的传感器数据;
基于传感器数据的至少一部分生成多个数据特征;
从多个数据特征中选择用于机器故障检测的至少一个指示性数据特征;
将不受监督机器故障检测过程应用于所选择的至少一个指示性数据特征,其中所述不受监督机器故障检测过程被构造为基于所选择的至少一个指示性数据特征来检测机器故障指示符;
接收与所述至少一个工业机器相关的新传感器数据;
通过将不受监督机器故障检测过程应用于与新传感器数据相关联的所选择的至少一个指示性数据特征,确定在新传感器数据中是否检测到至少一个机器故障指示符;和
在确定检测到所述至少一个机器故障指示符时标记所述至少一个机器故障指示符,其中在确定没有检测到机器故障指示符时,所述不受监督机器故障检测过程连续搜索机器故障指示符。
2.根据权利要求1所述的方法,还包括:
从多个数据特征中选择用于机器故障预测的至少一个指示性数据特征;
将受监督机器故障预测过程应用于所选择的至少一个指示性数据特征;
其中所述受监督机器故障预测过程被构造成基于所选择的至少一个指示性数据特征来预测机器故障;和
用标记的至少一个机器故障指示符更新受监督机器故障预测过程,使得受监督机器故障预测过程被连续自动地更新和改进。
3.根据权利要求1所述的方法,其中,所述多个数据特征表示所述至少一机器的至少一部件的行为。
4.根据权利要求1所述的方法,其中,所述多个数据特征是基于至少一种统计方法生成的。
5.根据权利要求1所述的方法,其中,所述至少一个指示性数据特征是基于检测机器故障的概率从所述多个数据特征中选择的。
6.根据权利要求2所述的方法,其中,所述至少一个指示性数据特征是基于预测机器故障的概率从所述多个数据特征中选择的。
7.根据权利要求1所述的方法,还包括:
至少基于所述多个指示性数据特征的分布,从所述多个数据特征中选择多个指示性数据特征,其中所述至少一个分布指示所述多个数据特征之间朝向机器故障的至少一关联。
8.根据权利要求1所述的方法,其中,所述传感器数据的至少一部分预先标记有至少一个机器故障指示符。
9.根据权利要求1所述的方法,其中,确定是否在新传感器数据中检测到至少一个机器故障指示符是基于半受监督机器学习。
10.一种非暂时性计算机可读介质,其上存储有用于使处理电路执行一过程的指令,该过程包括:
接收与至少一个工业机器相关的传感器数据;
基于传感器数据的至少一部分生成多个数据特征;
从多个数据特征中选择用于机器故障检测的至少一个指示性数据特征;
将不受监督机器故障检测过程应用于所选择的至少一个指示性数据特征,其中所述不受监督机器故障检测过程被构造为基于所选择的至少一个指示性数据特征来检测机器故障指示符;
接收与所述至少一个工业机器相关的新传感器数据;
通过将不受监督机器故障检测过程应用于与新传感器数据相关联的所选择的至少一个指示性数据特征,确定在新传感器数据中是否检测到至少一个机器故障指示符;和
在确定检测到所述至少一个机器故障指示符时标记所述至少一个机器故障指示符,其中在确定没有检测到机器故障指示符时,所述不受监督机器故障检测过程连续搜索机器故障指示符。
11.一种用于检测和预测工业机器故障的基于在线机器学习的方法的系统,包括:
处理电路;和
存储器,该存储器包含指令,当由所述处理电路执行时,所述指令将所述系统构造成:
接收与至少一个工业机器相关的传感器数据;
基于传感器数据的至少一部分生成多个数据特征;
从多个数据特征中选择用于机器故障检测的至少一个指示性数据特征;
将不受监督机器故障检测过程应用于所选择的至少一个指示性数据特征,其中所述不受监督机器故障检测过程被构造为基于所选择的至少一个指示性数据特征来检测机器故障指示符;
接收与所述至少一个工业机器相关的新传感器数据;
通过将不受监督机器故障检测过程应用于与新传感器数据相关联的所选择的至少一个指示性数据特征,确定在新传感器数据中是否检测到至少一个机器故障指示符;和
在确定检测到所述至少一个机器故障指示符时,标记所述至少一个机器故障指示符,其中在确定没有检测到机器故障指示符时,所述不受监督机器故障检测过程连续搜索机器故障指示符。
12.根据权利要求11所述的系统,其中,所述系统还被构造成:
从多个数据特征中选择用于机器故障预测的至少一个指示性数据特征;
将所选择的至少一个指示性数据特征应用于受监督机器故障预测过程;
其中所述受监督机器故障预测过程被构造成基于所选择的至少一个指示性数据特征来预测机器故障;和
用标记的至少一个机器故障指示符更新受监督机器故障预测过程,使得受监督机器故障预测过程被连续地和自动地更新和改进。
13.根据权利要求11所述的系统,其中,所述多个数据特征表示所述至少一机器的至少一部件的行为。
14.根据权利要求11所述的系统,其中,所述多个数据特征是基于至少一种统计方法生成的。
15.根据权利要求11所述的系统,其中,所述至少一个指示性数据特征是基于检测机器故障的概率从所述多个数据特征中选择的。
16.根据权利要求12所述的系统,其中,所述至少一个指示性数据特征是基于预测机器故障的概率从所述多个数据特征中选择的。
17.根据权利要求1所述的系统,其中,所述系统还被构造成:
基于所述多个指示性数据特征的至少一分布,从所述多个数据特征中选择多个指示性数据特征,其中所述至少一分布指示所述多个数据特征之间朝向机器故障的至少一关联。
18.根据权利要求17所述的系统,其中,所述传感器数据的至少一部分预先标记有至少一个机器故障指示符。
19.根据权利要求17所述的系统,其中,所述系统还被构造成:
基于半受监督机器学习来确定在新传感器数据中是否检测到至少一个机器故障指示符。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201962832467P | 2019-04-11 | 2019-04-11 | |
US62/832,467 | 2019-04-11 | ||
PCT/US2020/027062 WO2020210227A1 (en) | 2019-04-11 | 2020-04-07 | Detection and prediction of machine failures using online machine learning |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113811829A true CN113811829A (zh) | 2021-12-17 |
Family
ID=72751763
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202080035341.6A Pending CN113811829A (zh) | 2019-04-11 | 2020-04-07 | 使用在线机器学习检测和预测机器故障 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20220058527A1 (zh) |
CN (1) | CN113811829A (zh) |
BR (1) | BR112021020262A2 (zh) |
DE (1) | DE112020001944T5 (zh) |
WO (1) | WO2020210227A1 (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11841772B2 (en) * | 2021-02-01 | 2023-12-12 | Dell Products L.P. | Data-driven virtual machine recovery |
US11796993B2 (en) | 2021-05-12 | 2023-10-24 | Yokogawa Electric Corporation | Systems, methods, and devices for equipment monitoring and fault prediction |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150227838A1 (en) * | 2012-09-17 | 2015-08-13 | Siemens Corporation | Log-based predictive maintenance |
US20160203036A1 (en) * | 2015-01-09 | 2016-07-14 | Ecorithm, Inc. | Machine learning-based fault detection system |
CN106104496A (zh) * | 2014-03-18 | 2016-11-09 | 微软技术许可有限责任公司 | 用于任意时序的不受监督的异常检测 |
US20170083830A1 (en) * | 2013-03-15 | 2017-03-23 | Mtelligence Corporation | System and Methods for Automated Plant Asset Failure Detection |
CN108520080A (zh) * | 2018-05-11 | 2018-09-11 | 武汉理工大学 | 船舶柴油发电机故障预测与健康状态在线评估系统及方法 |
US20180293125A1 (en) * | 2016-01-03 | 2018-10-11 | Presenso, Ltd. | System and method for unsupervised prediction of machine failures |
US20180293516A1 (en) * | 2016-01-10 | 2018-10-11 | Presenso, Ltd. | System and method for validating unsupervised machine learning models |
US20180348747A1 (en) * | 2016-02-09 | 2018-12-06 | Presenso, Ltd. | System and method for unsupervised root cause analysis of machine failures |
CN109120632A (zh) * | 2018-09-04 | 2019-01-01 | 中国人民解放军陆军工程大学 | 基于在线特征选择的网络流异常检测方法 |
CN109522095A (zh) * | 2018-11-27 | 2019-03-26 | 无锡华云数据技术服务有限公司 | 云主机异常故障检测恢复系统、方法及云平台 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108090606A (zh) * | 2017-12-12 | 2018-05-29 | 上海应用技术大学 | 设备故障发现方法及系统 |
-
2020
- 2020-04-07 DE DE112020001944.6T patent/DE112020001944T5/de active Pending
- 2020-04-07 BR BR112021020262A patent/BR112021020262A2/pt unknown
- 2020-04-07 WO PCT/US2020/027062 patent/WO2020210227A1/en active Application Filing
- 2020-04-07 CN CN202080035341.6A patent/CN113811829A/zh active Pending
-
2021
- 2021-10-08 US US17/497,243 patent/US20220058527A1/en active Pending
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150227838A1 (en) * | 2012-09-17 | 2015-08-13 | Siemens Corporation | Log-based predictive maintenance |
US20170083830A1 (en) * | 2013-03-15 | 2017-03-23 | Mtelligence Corporation | System and Methods for Automated Plant Asset Failure Detection |
CN106104496A (zh) * | 2014-03-18 | 2016-11-09 | 微软技术许可有限责任公司 | 用于任意时序的不受监督的异常检测 |
US20160203036A1 (en) * | 2015-01-09 | 2016-07-14 | Ecorithm, Inc. | Machine learning-based fault detection system |
US20180293125A1 (en) * | 2016-01-03 | 2018-10-11 | Presenso, Ltd. | System and method for unsupervised prediction of machine failures |
US20180293516A1 (en) * | 2016-01-10 | 2018-10-11 | Presenso, Ltd. | System and method for validating unsupervised machine learning models |
US20180348747A1 (en) * | 2016-02-09 | 2018-12-06 | Presenso, Ltd. | System and method for unsupervised root cause analysis of machine failures |
CN108520080A (zh) * | 2018-05-11 | 2018-09-11 | 武汉理工大学 | 船舶柴油发电机故障预测与健康状态在线评估系统及方法 |
CN109120632A (zh) * | 2018-09-04 | 2019-01-01 | 中国人民解放军陆军工程大学 | 基于在线特征选择的网络流异常检测方法 |
CN109522095A (zh) * | 2018-11-27 | 2019-03-26 | 无锡华云数据技术服务有限公司 | 云主机异常故障检测恢复系统、方法及云平台 |
Also Published As
Publication number | Publication date |
---|---|
BR112021020262A2 (zh) | 2021-12-07 |
WO2020210227A1 (en) | 2020-10-15 |
US20220058527A1 (en) | 2022-02-24 |
DE112020001944T5 (de) | 2022-01-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20220300857A1 (en) | System and method for validating unsupervised machine learning models | |
US20210397501A1 (en) | System and method for unsupervised prediction of machine failures | |
US11442444B2 (en) | System and method for forecasting industrial machine failures | |
US11243524B2 (en) | System and method for unsupervised root cause analysis of machine failures | |
US11669083B2 (en) | System and method for proactive repair of sub optimal operation of a machine | |
US11733688B2 (en) | System and method for recognizing and forecasting anomalous sensory behavioral patterns of a machine | |
US11933695B2 (en) | System and method for detecting anomalies in sensory data of industrial machines located within a predetermined proximity | |
US20210158220A1 (en) | Optimizing accuracy of machine learning algorithms for monitoring industrial machine operation | |
US20180307218A1 (en) | System and method for allocating machine behavioral models | |
US20220058527A1 (en) | System and method for automated detection and prediction of machine failures using online machine learning | |
Imamverdiyev et al. | Condition monitoring of equipment in oil wells using deep learning | |
KR102212022B1 (ko) | 양수 수차의 건전성 자동 판정 방법 및 이를 위한 시스템 | |
US11822323B2 (en) | Providing corrective solution recommendations for an industrial machine failure | |
CN111611117A (zh) | 硬盘故障的预测方法、装置、设备及计算机可读存储介质 | |
US20240125675A1 (en) | Anomaly detection for industrial assets | |
CN114443398B (zh) | 内存故障预测模型的生成方法、检测方法、装置及设备 | |
Lemus et al. | Using Machine Learning Techniques to Estimate the Remaining Useful Life of a System with Different Types of Datasets | |
Han et al. | Prognostics and Health Management (PHM) System | |
Pandit et al. | Comparative analysis of novel data‐driven techniques for remaining useful life estimation of wind turbine high‐speed shaft bearings | |
CN117951489A (zh) | 水轮机组故障发生度测度方法、装置和计算机设备 | |
Gao et al. | Drift-Aware Anomaly Detection for Non-Stationary Time Series Data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |