CN102141948A - 带噪声的监控器检测和间歇故障隔离 - Google Patents

带噪声的监控器检测和间歇故障隔离 Download PDF

Info

Publication number
CN102141948A
CN102141948A CN2010105613140A CN201010561314A CN102141948A CN 102141948 A CN102141948 A CN 102141948A CN 2010105613140 A CN2010105613140 A CN 2010105613140A CN 201010561314 A CN201010561314 A CN 201010561314A CN 102141948 A CN102141948 A CN 102141948A
Authority
CN
China
Prior art keywords
dog
watch
fault
noise
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2010105613140A
Other languages
English (en)
Inventor
Q·G·邵
R·R·芒努松
D·米勒
B·J·巴顿
D·M·科尔贝
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Honeywell International Inc
Original Assignee
Honeywell International Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Honeywell International Inc filed Critical Honeywell International Inc
Publication of CN102141948A publication Critical patent/CN102141948A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0751Error or fault detection not based on redundancy
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment

Abstract

本发明涉及带噪声的监控器检测和间歇故障隔离。一种检测和诊断系统故障的方法,包括在操作期间尝试检测监控器的带噪声的状态,且结合量化的监控器不确定性等级以支持故障隔离推理。序列概率比统计测试被用于统计地测试监控器的带噪声的状态,且香农熵理论被用于量化监控器的不确定性等级以支持监控器值在故障隔离中的使用。

Description

带噪声的监控器检测和间歇故障隔离
本发明是依照Boeing发包的主合同No.W56HZV-05-C-0724和分包合同Nos.3EC1893 与5EC8407在政府支持下做出的。政府对本发明具有某些权利。
技术领域
本发明总体上涉及数据处理系统和方法,且更具体地涉及从具有间歇系统故障的带噪声的监控器辨别伪故障。
背景技术
间歇故障可能在数据处理系统内在没有进行任何动作比如对系统配置的维修和更换的情况下出现或消失。故障可从其感测信号的间歇现象检测。这种检测可转换为诊断监控,其中“0”指示未检测到故障(解除)而“1”指示检测到故障(指示)。然而,已知系统在辨别由带噪声的监控器或来自可能成为永久故障的间歇故障的瞬态环境状况生成的暂时异常传感器值时是无效的,从而导致例如错误的信息或连接器问题。从可能导致永久故障的间歇故障辨别这些暂时异常传感器值是有利的。
间歇故障的实时检测和诊断已经成为系统诊断的挑战。一方面涉及故障自身的间歇性。同间歇性关联的两个主要挑战是1)不可预测的发生故障的频率,这使得检测变得困难,和2)故障的起因,其不仅取决于所研究系统的潜在故障,而且还取决于不可预测的瞬态环境状况。另一方面涉及用于检测故障的传感器/监控器。待检测的系统没有故障,但是传感器/监控器本身因为它们自身的故障而有噪声,这是很有可能的。
使实时检测和诊断变得困难的是对事件的采样。故障的不可预测性使得难以确定在可能推断出检测到的故障是系统的真实故障、监控器是带噪声的、还是存在需要进一步监控的情况之前,事件应该被监控多长时间。
因此,期望提供一种从间歇系统故障中辨别出伪故障的方法和系统,该伪故障例如可能由产生暂时异常传感器值的瞬态环境状况或带噪声的监控器造成。此外,本发明的其他期望特征和特性将从随后的详细说明和所附权利要求,连同附图和前述的技术领域和背景技术变得显而易见。
发明内容
一种检测和诊断系统故障的方法,包括在操作期间检测监控器的带噪声的状态并且结合量化的监控器不确定性等级以支持故障隔离推理。
另一种检测和诊断系统故障的方法,包括采集数据且执行数据的监控器评价以确定该监控器是否是带噪声的。如果监控器不是带噪声的,则确定故障隔离。如果不能确定监控器不是带噪声的,则采集附加数据。对监控器是否是带噪声的或是否存在间歇故障进行评价。如果不能进行评价,则确定监控器的不确定性。
附图说明
在下文中,将连同下列附图描述本发明,其中相似的数字表示相似的元件,且
图1是适于在实施优选实施例中使用的计算机系统的框图;
图2-6是图示监控器值的五个观察情景的图表;
图7是图示序列概率比测试的图表;
图8是图2-6中五种情景的观察值表;
图9是图8中五种情景的观察值的图表;
图10是不确定性随概率的变化图表;
图11是对于图2情境的不确定性计算值的表;
图12是对于图6情境的不确定性计算值的表;以及
图13是监控器推理架构的流程图。
具体实施方式
下面对发明的详细说明实际上只是示例性的,并且不意图限制本发明或本发明的应用和使用。此外,不意图被前述的技术领域、背景技术、发明内容、或以下的详细说明所给出的任何理论所限制。
本文描述的示例性实施例使用序列概率比测试(SPRT)来统计测试监控器的带噪声的状态。SPRT是贝叶斯统计过程,其要求在执行数据采集之前,详细描述模型的结果期望。如果在数据采集期间满足某些条件,则将就继续数据采集和所收集的数据的解释作出判定。当数据被采集时,计算对数似然比的和。如果该和大于第一预先限定的阈值,则接受第一预先限定的假设,或者如果该和小于第二阈值,则接受第二预先限定的假设。在数据正在被采集时对该数据进行分析允许比经典假设测试得到更早的结论。
香农熵理论被用于量化监控器的不确定性等级以支持监控器值在故障隔离中的使用。在信息论(数据处理)中,熵是对同随机变量有关的不确定性的测量。香农熵是对信息期望值的测量,通常用比特表示。更具体地,当随机变量未知时,香农熵理论是对平均信息内容的测量。例如,如果两个事件是均等可能的,则熵为1(比特),或者如果事件之一绝对会发生,则熵为0。因此随机事件的熵值X为0 ≤ X ≤ 1。香农熵常规上已被用于测量包含在消息中、与可预测的消息部分相反的信息,例如涉及字母或单词重复的出现频率的语言结构或统计属性中的冗余度。
基于所作的判定,在故障诊断推理中可能考虑或可能不考虑监控器。如果基于上述算法,没有检测到带噪声的监控器,且故障间歇超出了预期值,那么宣布故障是间歇性的。
参考图1,可被用来实施本文描述的示例性实施例的数据处理设备100的框图可以被配置为通用计算装置,例如计算机102。数据处理设备100通常包括处理器104,存储器106,和在操作中将各种系统元件耦合到处理器104的系统总线108。处理器104可能包括,例如单一中央处理器(CPU)或并行处理环境。
数据处理设备100进一步包括一个或多个用于存储和读取程序和其他数据的数据存储设备,例如盘驱动器110。盘驱动器110可以包括例如硬盘驱动器,磁盘驱动器,或者光盘驱动器(未显示)中的一个或多个,且通过盘驱动器接口112耦合到系统总线108。这些盘驱动器110和与它们关联的计算机可读介质提供了计算机可读指令、数据结构、程序模块和数据处理设备100所使用的其他数据的非易失性存储。监控器120通过适配器114或其他接口耦合到系统总线108。另外,数据处理设备100可能包括其他外围输出装置(未显示),其包括例如扬声器和打印机。
要指出,本文公开的示例性实施例可以在主机操作系统和一个或多个模块的背景下实施。在计算机编程现有技术中,软件模块可通常被实施为执行特定任务或实施特定抽象数据类型的例程和/或数据结构的集合。
软件模块通常包括可存储于数据处理设备的存储器位置内的指令介质,且通常包括两个部分。第一,软件模块可能列出可以被其他模块或例程访问的常量、数据类型、变量、例程等等。第二,软件模块可以被配置为实施方式,其可以是专用的(或许仅可由模块访问),且包含实际上实施模块基于的例程或子例程的源代码。本文所使用的术语模块因此可以指代软件模块(dule)或其实施方式。这样的模块可单独使用或一起使用以形成可以通过信号承载介质实施的程序产品,所述信号承载介质包括传输介质和可记录介质。
要重点指出的是,尽管在全功能数据处理设备100例如计算机的背景中描述了实施例,但是本领域技术人员将意识到本发明的机制能够被分配为各种形式的程序产品,且意识到所描述的示例性实施例同等地应用,而不管实际用来实行分配的信号承载介质的特定类型。信号承载介质的示例包括,但是不限于,可记录型介质(例如软盘或CD ROM)和传输型介质(例如模拟或数字通信链路)。
可以结合实施例来使用可以存储数据(所述数据可由计算机访问)的任何类型的计算机可读介质,例如磁带,闪存卡,数字多功能光盘(DVD),伯努利盒式磁带(bernoulli cartridge),随机存取存储器(RAM)和只读存储器。
数据处理设备100可以使用到一个或多个远程计算机(未显示)的逻辑连接而在联网环境中操作。使用耦合到数据处理设备或与数据处理设备集成的通信装置来实施这些逻辑连接。要被分析的数据序列可以存在于联网环境中的远程计算机上。远程计算机可以是另一台计算机、服务器、路由器、网络PC、客户端,或者对等装置或者其他公用网络节点。逻辑连接通过网络接口128同数据处理设备100对接。这样的联网环境在办公网络、企业广域计算机网络、内联网和互联网中是常见的。本领域技术人员将意识到所示的网络连接通过举例的方式提供,并且可以使用用于在计算机之间建立通信链路的通信装置和其其他装置。
示例性实施例的算法对如下各项加以区别1)归因于带噪声的监控器的伪故障,2)归因于不可预测环境/操作状况的瞬态故障,和3)待检测的可能导致永久故障的系统的真正间歇故障。算法还将间歇的不确定性等级结合到故障隔离中。
监控系统的监控器(算法)提供指示符,当检测到故障(指示)时,所述指示符取值为1,当无故障(解除)时,其取值为0。监控器可能是来自待检测系统的直接信号(例如心跳),或来自与故障有关现象的导出指示符(例如振动频率)。监控器可被用于指示一个或多个故障,且故障可触发一个或多个监控器。
提供了代表上面讨论的典型间歇情况的五种情景。要指出在下面讨论的图中,数据的记录开始于监控器的值第一次发生变为“1”(指示)时。还要指出在运行时间期间只要数据以连续字符串到达,数据就不必为周期的。尽管仅示出一个监控器,但也可以使用多个监控器和多个故障。
第一种情景(非间歇)是当监控器被触发,且它的值保持为M=1时。这指示永久故障(非间歇),因此M=1可被用于设计以用作故障隔离的证据(图2)。
第二种情景代表当监控器被触发短暂的时间段,并且然后返回到解除的情形(图3)。这种类型的故障典型地由暂时操作/环境状况造成,因此当异常状况停止时指示报告消失。检测这种间歇的常规方法每预先限定的时间段延迟报告指示状态。尽管这种常规方法可能消除一些间歇问题,却有一个根本缺陷,就是间歇的频率难以预测,从而导致预先限定延迟周期变得非常主观。
第三种情景(瞬态故障/状况)代表监控器值在1和0之间来回切换(图4)的情况。尽管仅示出了几个循环,应该理解可能发生许多更多循环。监控器的值最终被固定在M=0(解除)处,指示检测到的故障是瞬态的。这种间歇可能是由于间歇故障或系统在时间段期间频繁经历的瞬态异常状况。
在第四种情景(间歇故障到永久故障)中,监控器观察指示(图5)故障起初是间歇的,然后被转变为永久故障。间歇周期可能比所示的长得多。
在第五种情景(带噪声的监控器或间歇故障)中,在系统的操作期间,监控器值既不固定在0处,也不固定在1处(图6)。这可能是由于带噪声的监控器或连续间歇故障。判定这是由于带噪声的监控器还是由于间歇故障要求附加信息(数据)。这将在随后更详细地讨论。
可以自动区分上述间歇情景,然后使用间歇信息来引导故障隔离的算法在故障诊断中是非常期望的。为了区分间隙检测,统计顺序概率比(SPRT)测试方法被使用。
静态运算参数被限定为p ≤ p1(不带噪声的),以及p ≥ p2(带噪声的),其中p1和p2是用户基于系统对噪声的容限等级限定的(例如p1=0.1 和 p2=0.4)。当真实监控器值为0,但是LRUI记录成1时,误差小于α。当真实监控器值为1,但是LRUI记录成0时,误差小于β。再次,α和β是用户基于系统的误差容限限定的(例如α= 1% 和β = 1%)。对于每个周期性监控的动态观察参数包括1)监控报告的总次数(从第一次监控器报告值1开始)为N_m,和2)监控器已将其状态从0切换到1的总次数(包括初始的1)为N_s。
SPRT主要优点在于它不需要预先限定的样本大小,但是样本大小可以在操作期间累积直到作出判定为止,而不管备择假设(alternative hypothesis)是否正确。这是一个具有吸引力的特征:应用于对由于间歇特征发生的时间段不可预测性引起的间歇故障的检测,且不需要预先限定的延迟周期。
在检测到任何故障之前,假设系统工作正常。因此,零假设(null hypothesis)为M=0(解除,即无故障),并且其对照M=1(指示,即检测到故障)的备择假设测试。基于M的观察值,这种方法可能导致三个结果:1)统计地M=0(接受零,并且拒绝备择假设);2)统计地M=1(拒绝零,并且接受备择假设);和3)未定的(利用现有数据,无法做出判定)。要指出,在这三种情况的任一种中,在给定时间监控器值可以是0或1,并且判定基于累积数据的统计显著性。因此,监控器值的间歇在任何一种情况下都是允许的。对于1)和2),结论是监控器是不带噪声的,且为故障隔离设置监控器值。对于3),或者监控器是带噪声的,或者存在连续间歇故障,且需要其他信息来对情况进行区分。
为了阐明测试,当传感器第一次从0变为1(第一次指示)时,采集数据用于间歇分析,如图4-8和上述讨论所示的那样,且在给定时间采集到的全部数据点作为N_m被计数。在该时间期间,N_m被计数,当M=1时数据点的总数也被计数为N_s。于是在该周期期间M=1的概率为p=N_s/N_m。
较低的概率被限定为p_low (例如10%, 即 0.1),而较高的概率被限定为p_high (例如 90%, 即0.9),以致于当p <= p_low时,接受零假设,其中假的负误差为α(例如,M=1但是被测得为M=0的机率为0.001,即0.1%),且当p >= p_high时,接受备择假设,其中假的正误差为β(例如, M=0但是被测得为M=1的机率为0.001,即0.1%)。当p_low<p<p_high时,如果M=0或M=1则无法进行判定。
给定所观察的监控器值为“1”的概率,即p,和在样本N_m中M=1的N_s数,获得如所观察的样本的概率为:
假设p = p_high (M=1),该概率为:
Figure 705555DEST_PATH_IMAGE002
并且假设p = p_low (M=0),该概率为:
Figure 442567DEST_PATH_IMAGE003
根据SPRT理论,测试标准为:
Figure 28269DEST_PATH_IMAGE004
时,接受备择假设,即M=1。
Figure 458113DEST_PATH_IMAGE005
时,接受零假设,即M=0。
否则,未定。
本质上这是对于两种假设的概率的对数相对似然的测试。
对公式进行一些处理,可得到下列标准,以直接观察变量表示:
当 N_s <= r_low_m时, M=0
当 N_s >= r_high_m时, M=1
Figure 699739DEST_PATH_IMAGE006
当 r_low_m < N_s < r_high_m时,未定
其中
Figure 974862DEST_PATH_IMAGE007
,且
Figure 929918DEST_PATH_IMAGE008
还要指出,N_m是给定时间的全部观察点,而N_s是在N_m个观察中M=1的数据点的总数。图7中示出测试的概念说明。
为了用示例情景阐明方法,限定p_low = 0.1, p_high = 0.95,α = 0.001,β = 0.002。换句话说,当在采样周期期间M=1的概率小于或等于0.1时,监控器值被测得为M=0,其中判定误差为0.1%,而当M=1的概率大于或等于0.95时,监控器值被测得为M=1,其中判定误差为0.2%。给定上述值,h1 = -1.21,h2 = 1.34,且s=0.56。
图8的表示出上述每种情景的M值,其中每种情景总共具有16个观察点(N_m)。每个监控器的N_s是在周期期间观察到的M=1的总数的累积值。例如,对于情景1,由于对于所有观察点,M=1,所以N_s_1随每个附加的M=1的点累积。测试结果在图9中示出。
这些测试结果表明:
早在观察到第四个数据点 时,情景1就被判定为M=1(N_s > r_high)。
情景2被测得为瞬态故障,其中在第八个观察点处,在M=0的连续报告周期 之后判定M=0(N_s < r_low)。
情景3也被测得为瞬态故障,尽管更早的观察示出复杂的间歇模式。在第十个观察点处,判定M=0 (N_s < r_low)。
情景4在更早的阶段被测得为间歇故障,在第十个观察点处转变为永久性的(N_s > r_high)。
情景5未定,因为N_s被限定在r_low和r_high之间(r_low < N_s < r_high)。
要指出,只要操作时间持续,该方法就允许间歇特征持续,且当统计证据足够强时作出判定。在该示例中使用的短间歇周期仅仅为了讨论方便。换句话说,该方法可以容许不可预测的任意长度的间歇周期。
为了实施,该方法的输入为p_low, p_high,α和β,如上述讨论那样,它们可以被提前确定,并且因此是静态数据,且可以是监控器特定的。这些输入数据可以源自于系统要求。在操作期间需要被追踪的唯一动态数据是每个监控器的两个数字,N_m和N_s,一旦监控器被触发,SPRT过程被启动。这是操作期间对资源的极低要求,这使得该方法甚至非常适宜应用于具有数千个监控器的大型系统中。
一旦SPRT判定监控器是不带噪声的,即M=1或M=0,监控器值可正常用于故障隔离的证据,而没有与间歇相关的不确定性。然而,如果未作判定,需要进一步做出判定以便确定监控器是否是带噪声的或是否存在间歇故障。如果没有做出判定,需要包括与故障隔离中的间歇有关的不确定性。
对于故障隔离将不确定性考虑进来需要不确定性被量化。香农熵可以被用于量化不确定性。给定M=1出现在下一个观察中的概率为p(如我们之前限定的那样),则M=0出现在下一个观察中的概率为1-p。香农熵限定不确定性为:
Figure 265084DEST_PATH_IMAGE010
对于0 ≤ H(p) ≤ 1,当p=0或p=1时,非常确定M值是(0或1)。因此,H(p) = 0。当p=0.5时,意味着0和1二者出现的机会相同,并且因此是最不确定(随机)的情况。因此,在这种情况下H(p) = 1。下面的图10示出了不确定性随M=1的概率的变化。
作为示例,情景1和5的H(p)值(不确定性计算)分别示于图11和12的表中。在不确定性由H(p)量化之后,可用于修改证据强度,这通常由监控器对故障模式的检测概率(这里用d表示)和监控器的误报警比率(这里用f表示)测量。由于间歇特征的强不可预测性,通过d和f来预先限定不确定性通常是非常困难的。为了包括来自间歇的不确定性的影响,我们可以修改预先限定的检测概率和误报警比率为:
d u  = d(1-H(p));f u  = f(1+H(p))
换句换说,当不存在不确定性(H(p) = 0)时,原始d和f将不被修改。然而当最不确定的情况发生(H(p) = 1)时,监控器的检测概率将变为0,即根本没有检测能力,且误报警比率被加倍。
基于上面展开的算法,提供如图13所示的针对间歇的推理架构。除了之前讨论过的那些之外,存在算法中所涉及一些其他判定点。当在观察时间期间SPRT不能判定M=0还是M=1时(上述情景5),且如果不确定性为H(p) > 0.9,则在观察的延长周期N_mT之后,进行对带噪声的状态是否归因于监控器或间歇故障的检验。N_mT被限定为系统愿意容许未定的噪声状态直到系统愿意采用附加信息来作出判定为止的周期。这可能和操作周期一样长,如果用户决定这样做的话。不是所有的情况都可得出结论,即使利用附加信息;然而,对于下面的几种情况,可以利用附加信息来得出结论或进行操作。
当监控器仅同一个故障模式有关且故障模式仅具有这一个用于检测的监控器时,不能得出结论带噪声的状态是归因于监控器的故障还是归因于系统的间歇故障。然而,它们中的一个肯定是错误的。在这种情况下,发送报警给用户,然后将监控器指示为带噪声的以避免基于噪声信息的进一步故障推理。要指出,随着每一个新的监控器值进来带噪声监控器仍然处于测试中,因此假使在未来的任何动作或状况影响了监控器值,仍可以进行判定。
当故障模式具有多个与其关联的监控器时,其他监控器的带噪声的状态可被用于区分带噪声的状态是归因于带噪声监控器还是归因于间歇故障。如果其他监控器不是带噪声的,那么就可得出结论测试中的监控器是带噪声的。否则不能作出判定,并且需要进一步观察。
图13公开的方法200的步骤具体包括在监控器处连续接收202监控器值输入(M=0或1)。如果M=0且N_m=0被满足204,则重复步骤202。如果M=0和N_m=0不能被满足206,但是M=1且N_m=0被满足206,则过程被初始化且通过将监控器带噪声的状态设置为未定而更新数据库,且监控器状态和监控器噪声状态被更新。将监控器更新通知发送210到故障模式隔离推断器,重复步骤202。如果M=0且N_m=0和M=1 且 N_m=0都不能被满足,则数据库更新212为N_m = N_m+1,且如果N=1,设置N_s = N_s+1。在步骤214,216中,如果N_s ≤ r_LOW_m或N_S ≥R_high_m中任一个被满足,则数据库被更新242,243以反映监控器是不带噪声的(M=0, M=1,分别),将监控器更新通知发送244到故障模式隔离推断器,且用N_m=0和N_s=0更新246数据库。
如果N_s ≤ r_low_m和N_S ≥R_high_m均不被满足214, 216,则香农熵理论被用于计算218不确定性p=N_s/N_m,H(p)=-p log(p,2)– (1-p)log((1-p), 2),且更新220对于d=d*(1-H(p))和f=f*(1+H(p))的动态值的数据库。如果N_m>N_mT和H(p)>0.9不被满足且监控器是带噪声的,则重复步骤206。然而,如果步骤222被满足而步骤224不被满足,如果存在仅仅具有用于检测的该监控器的任何故障模式则做出确定226。如果没有且如果存在与带噪声的当前监控器相同的故障模式相关联的其他监控器228,则通过将监控器设置230为带噪声的来更新数据库。可替换地,如果步骤226为是,则发送232报警给用户以表示在将监控器设置230为带噪声的之前存在潜在带噪声传感器或系统间歇故障。将监控器更新通知发送234到故障模式隔离推断器,并且重复步骤206。
在步骤210,234和244之后,执行子例程250。子例程250包括确定监控器是否是不带噪声的252,且如果任何新的故障模式与监控器相关联254,则故障模式覆盖(概念上的)被更新256。如果步骤252是肯定的而步骤254是否定的,则故障模式隔离推断被更新258。
本文描述了被设计用于对带噪声监控器和间歇故障的检测和推断的算法和架构。该算法允许在实时操作期间在任何给定的周期内检测间歇,且允许将归因于间歇的不确定性的影响包括在故障隔离中。该算法可以鲁棒地处理并且对永久,瞬态,和间歇故障进行判定,以及带噪声监控器的检测。
尽管在前的详细描述中已给出了至少一个示例性实施例,但是应该意识到存在大量的变化。还应当意识到一个或多个示例性实施例仅仅是示例,且不意图以任何方式限制本发明的范围、应用性或配置。相反,前述的详细说明将提供给本领域技术人员实施本发明的示例性实施例的便利指示图,可以理解可对示例性实施例中描述的元件的功能和布置作出各种改变而不偏离在所附权利要求中说阐明的本发明的范围。

Claims (10)

1. 一种检测和诊断系统故障的方法,包括:
在操作期间尝试确定监控器是否是带噪声的;以及
如果不能确定带噪声的状态,则结合量化的监控器不确定性等级以支持故障隔离推理。
2. 根据权利要求1所述的方法,其中该尝试步骤包括:
设置第一阈值;
设置第二阈值;
采集数据;
当所述数据被采集时,计算对数似然比的和;以及
如果所述和超过第一阈值,则接受第一假设,或者如果所述和小于第二阈值,则接受第二假设。
3. 根据权利要求1所述的方法,进一步包括:
将对带噪声的状态的检测转换为诊断监控。
4. 根据权利要求1所述的方法,其中尝试步骤包括:
区分归因于带噪声监控器的伪故障、归因于不可预测状况的瞬态故障和间歇故障。
5. 一种检测和诊断系统故障的方法,包括:
a)采集数据;
b)执行对所述数据的监控器的第一评价以确定所述监控器是否是带噪声的;
c)如果所述监控器不是带噪声的,则确定故障隔离;
d)如果不能确定所述监控器是带噪声的,则采集附加数据;
e)执行所述监控器是否是带噪声的或是否存在间歇故障的第二评价;
f)如果不能执行所述第二评价,则确定不确定性。
6. 根据权利要求5所述的方法,其中所述确定步骤包括:
使用香农熵理论。
7. 根据权利要求5所述的方法,其中所述步骤b-e包括:
使用序列概率比统计测试。
8. 根据权利要求7所述的方法,其中所述确定步骤包括:
使用香农熵理论。
9. 根据权利要求5所述的方法,进一步包括:
将对带噪声的状态的检测转换为诊断监控。
10. 根据权利要求5所述的方法,其中所述步骤b-e包括:
区分归因于带噪声监控器的伪故障、归因于不可预测状况的瞬态故障和间歇故障。
CN2010105613140A 2010-01-29 2010-11-26 带噪声的监控器检测和间歇故障隔离 Pending CN102141948A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US12/696877 2010-01-29
US12/696,877 US8386849B2 (en) 2010-01-29 2010-01-29 Noisy monitor detection and intermittent fault isolation

Publications (1)

Publication Number Publication Date
CN102141948A true CN102141948A (zh) 2011-08-03

Family

ID=44148353

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2010105613140A Pending CN102141948A (zh) 2010-01-29 2010-11-26 带噪声的监控器检测和间歇故障隔离

Country Status (3)

Country Link
US (1) US8386849B2 (zh)
EP (1) EP2354945A1 (zh)
CN (1) CN102141948A (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120131393A1 (en) * 2010-11-19 2012-05-24 International Business Machines Corporation Detecting System Component Failures In A Computing System
US8527817B2 (en) 2010-11-19 2013-09-03 International Business Machines Corporation Detecting system component failures in a computing system
CN102932194B (zh) * 2011-08-09 2015-08-12 中国银行股份有限公司 基于贝叶斯方法的互联网应用服务监控系统及方法
CN102523137B (zh) * 2011-12-22 2014-10-08 华为技术服务有限公司 一种故障监测方法、装置及系统
US20180225355A1 (en) * 2017-02-07 2018-08-09 International Business Machines Corporation Self-improving classification
CN107356282A (zh) * 2017-06-23 2017-11-17 山东科技大学 分辨率受限情况下高速列车鲁棒间歇传感器故障检测方法
CN111123885B (zh) * 2019-11-29 2022-05-10 南京航空航天大学 一种基于自适应技术的高超声速飞行器间歇故障诊断方法
CN114630352B (zh) * 2020-12-11 2023-08-15 中国移动通信集团湖南有限公司 一种接入设备的故障监测方法和装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5383192A (en) * 1992-12-23 1995-01-17 Intel Corporation Minimizing the likelihood of slip between the instant a candidate for a break event is generated and the instant a microprocessor is instructed to perform a break, without missing breakpoints
CN1149735A (zh) * 1994-05-25 1997-05-14 西门子公司 模块式结构的服务个人计算机

Family Cites Families (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4134642A (en) * 1976-04-16 1979-01-16 Northern Telecom Limited Optical fibre with increased security
US5243686A (en) * 1988-12-09 1993-09-07 Oki Electric Industry Co., Ltd. Multi-stage linear predictive analysis method for feature extraction from acoustic signals
US5260945A (en) 1989-06-22 1993-11-09 Digital Equipment Corporation Intermittent component failure manager and method for minimizing disruption of distributed computer system
US5210704A (en) 1990-10-02 1993-05-11 Technology International Incorporated System for prognosis and diagnostics of failure and wearout monitoring and for prediction of life expectancy of helicopter gearboxes and other rotating equipment
US5293323A (en) * 1991-10-24 1994-03-08 General Electric Company Method for fault diagnosis by assessment of confidence measure
US5602761A (en) 1993-12-30 1997-02-11 Caterpillar Inc. Machine performance monitoring and fault classification using an exponentially weighted moving average scheme
SE504401C2 (sv) 1994-06-02 1997-02-03 Asea Atom Ab Förfarande för att övervaka neutrondetektorer i kärnreaktor
US5586066A (en) 1994-06-08 1996-12-17 Arch Development Corporation Surveillance of industrial processes with correlated parameters
DE19717716C5 (de) * 1996-04-19 2005-09-29 Daimlerchrysler Ag Verfahren zur automatischen Diagnose technischer Systeme
US5668778A (en) * 1996-07-09 1997-09-16 The United States Of America As Represented By The Secretary Of The Navy Method for detecting acoustic signals from an underwater source
US6170436B1 (en) * 1996-07-19 2001-01-09 Loughborough University Innovations Ltd By-catch reduction acoustic device
US6055491A (en) 1997-10-17 2000-04-25 At&T Corp. Method and apparatus for analyzing co-evolving time sequences
US6073089A (en) 1997-10-22 2000-06-06 Baker; Michelle Systems and methods for adaptive profiling, fault detection, and alert generation in a changing environment which is measurable by at least two different measures of state
US6240372B1 (en) 1997-11-14 2001-05-29 Arch Development Corporation System for surveillance of spectral signals
US5987399A (en) 1998-01-14 1999-11-16 Arch Development Corporation Ultrasensitive surveillance of sensors and processes
US5991707A (en) 1998-03-09 1999-11-23 Hydrotec Systems Company, Inc. Method and system for predictive diagnosing of system reliability problems and/or system failure in a physical system
US6594620B1 (en) 1998-08-17 2003-07-15 Aspen Technology, Inc. Sensor validation apparatus and method
US6615040B1 (en) * 1999-01-22 2003-09-02 At&T Corp. Self-configurable wireless systems: spectrum monitoring in a layered configuration
US6510397B1 (en) 1999-03-13 2003-01-21 Textron Systems Corporation Method and apparatus for self-diagnosis of a sensor
US6694285B1 (en) 1999-03-13 2004-02-17 Textron System Corporation Method and apparatus for monitoring rotating machinery
US6947797B2 (en) 1999-04-02 2005-09-20 General Electric Company Method and system for diagnosing machine malfunctions
US6560584B1 (en) 1999-07-22 2003-05-06 Advanced Research & Technology Institute Method and apparatus for prediction of system reliability
GB0007065D0 (en) 2000-03-23 2000-05-10 Simsci Limited Process monitoring and control using self-validating sensors
US7006947B2 (en) 2001-01-08 2006-02-28 Vextec Corporation Method and apparatus for predicting failure in a system
US20020138796A1 (en) 2001-03-23 2002-09-26 Jacob John M. Intelligent performance monitoring in optical networks using FEC statistics
GB2379752A (en) 2001-06-05 2003-03-19 Abb Ab Root cause analysis under conditions of uncertainty
US7076695B2 (en) 2001-07-20 2006-07-11 Opnet Technologies, Inc. System and methods for adaptive threshold determination for performance metrics
US6892163B1 (en) 2002-03-08 2005-05-10 Intellectual Assets Llc Surveillance system and method having an adaptive sequential probability fault detection test
US7451003B2 (en) 2004-03-04 2008-11-11 Falconeer Technologies Llc Method and system of monitoring, sensor validation and predictive fault analysis
DE102004010665B4 (de) * 2004-03-04 2014-09-18 Infineon Technologies Ag Vorrichtung und Verfahren zum Ermitteln eines Zustandsparameters eines zu überwachenden Objektes
SE527758C2 (sv) * 2004-03-16 2006-05-30 Kjell Olsson Metod i elektroniksystem för detektering av olika parametrar med angivande av sannolikhetsvärden
US7444268B1 (en) 2004-03-25 2008-10-28 Sun Microsystems, Inc. Method and apparatus for identifying a drift in a quantized signal in a computer system
US7200524B2 (en) * 2004-05-06 2007-04-03 Carrier Corporation Sensor fault diagnostics and prognostics using component model and time scale orthogonal expansions
US7188050B2 (en) 2004-08-25 2007-03-06 Siemens Corporate Research, Inc. Method and apparatus for detecting out-of-range conditions in power generation equipment operations
ITVA20040059A1 (it) * 2004-12-10 2005-03-10 St Microelectronics Srl Metodo e circuito di filtraggio di glitch
US7380172B2 (en) 2004-12-31 2008-05-27 Microsoft Corporation Expert software diagnostic tool
US8125522B2 (en) * 2006-03-24 2012-02-28 Siemens Industry, Inc. Spurious motion filter
US7533070B2 (en) 2006-05-30 2009-05-12 Honeywell International Inc. Automatic fault classification for model-based process monitoring
WO2008004987A1 (en) * 2006-07-05 2008-01-10 Agency For Science, Technology And Research Method, device and computer program for classifying a received signal
JP4413915B2 (ja) 2006-12-13 2010-02-10 株式会社東芝 異常兆候検出装置および方法
US7412356B1 (en) 2007-01-30 2008-08-12 Lawrence Livermore National Security, Llc Detection and quantification system for monitoring instruments
US7539593B2 (en) 2007-04-27 2009-05-26 Invensys Systems, Inc. Self-validated measurement systems
US8024610B2 (en) 2007-05-24 2011-09-20 Palo Alto Research Center Incorporated Diagnosing intermittent faults
US7904399B2 (en) * 2007-11-15 2011-03-08 International Business Machines Corporation Method and apparatus for determining decision points for streaming conversational data
US7911754B2 (en) * 2008-01-21 2011-03-22 Biosense Webster, Inc. Detection of current leakage through opto-switches

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5383192A (en) * 1992-12-23 1995-01-17 Intel Corporation Minimizing the likelihood of slip between the instant a candidate for a break event is generated and the instant a microprocessor is instructed to perform a break, without missing breakpoints
CN1149735A (zh) * 1994-05-25 1997-05-14 西门子公司 模块式结构的服务个人计算机

Also Published As

Publication number Publication date
EP2354945A1 (en) 2011-08-10
US8386849B2 (en) 2013-02-26
US20110191635A1 (en) 2011-08-04

Similar Documents

Publication Publication Date Title
CN102141948A (zh) 带噪声的监控器检测和间歇故障隔离
US10373065B2 (en) Generating database cluster health alerts using machine learning
US7693982B2 (en) Automated diagnosis and forecasting of service level objective states
US8712726B2 (en) System and method for predicting remaining useful life of device components
JP6088131B2 (ja) タービン性能診断システム及び方法
CN101999101B (zh) 系统运行预测的确定方法
JP6751561B2 (ja) 装置の構成要素の集合を監視するシステムおよび方法
US20110178963A1 (en) system for the detection of rare data situations in processes
JP5768983B2 (ja) 契約違反予測システム、契約違反予測方法および契約違反予測プログラム
JP5025776B2 (ja) 異常診断フィルタ生成装置
US8671315B2 (en) Prognostic analysis system and methods of operation
CN107391335B (zh) 一种用于检查集群健康状态的方法和设备
CN109523027B (zh) 一种基于贝叶斯网络的锅炉运行数据监测方法和装置
US20150279193A1 (en) Method and apparatus for providing environmental management using smart alarms
CN113196311A (zh) 用于识别和预测机器的异常感测行为模式的系统和方法
JP6777142B2 (ja) システム分析装置、システム分析方法、及び、プログラム
JP2013196698A (ja) システム監視
JP6482743B1 (ja) リスク評価装置、リスク評価システム、リスク評価方法、及び、リスク評価プログラム
US8601318B2 (en) Method, apparatus and computer program product for rule-based directed problem resolution for servers with scalable proactive monitoring
CN112882795A (zh) 虚拟机异常诊断方法、装置、设备及存储介质
KR102234054B1 (ko) 리스크 평가 장치, 리스크 평가 시스템, 리스크 평가 방법, 리스크 평가 프로그램 및 데이터 구조
US9397921B2 (en) Method and system for signal categorization for monitoring and detecting health changes in a database system
JP2016004298A (ja) ポンプ異常検知システム、ポンプ異常検知方法、及びポンプ異常検知プログラム
CN111555899B (zh) 告警规则配置方法、设备状态监测方法、装置和存储介质
JP2016003875A (ja) モータ異常検知システム、モータ異常検知方法、及びモータ異常検知プログラム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20110803