CN111721542A - 用于检测故障或模型失配的系统和方法 - Google Patents

用于检测故障或模型失配的系统和方法 Download PDF

Info

Publication number
CN111721542A
CN111721542A CN202010198832.4A CN202010198832A CN111721542A CN 111721542 A CN111721542 A CN 111721542A CN 202010198832 A CN202010198832 A CN 202010198832A CN 111721542 A CN111721542 A CN 111721542A
Authority
CN
China
Prior art keywords
threshold
probability
model
fault
model mismatch
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010198832.4A
Other languages
English (en)
Other versions
CN111721542B (zh
Inventor
D·麦莫奈米
陈炜强
A·M·巴兹
K·R·帕提帕提
S·N·乔什
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toyota Motor Corp
University of Connecticut
Original Assignee
University of Connecticut
Toyota Motor Engineering and Manufacturing North America Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Connecticut, Toyota Motor Engineering and Manufacturing North America Inc filed Critical University of Connecticut
Publication of CN111721542A publication Critical patent/CN111721542A/zh
Application granted granted Critical
Publication of CN111721542B publication Critical patent/CN111721542B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/079Root cause analysis, i.e. error or fault diagnosis
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B23/00Testing or monitoring of control systems or parts thereof
    • G05B23/02Electric testing or monitoring
    • G05B23/0205Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults
    • G05B23/0218Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults
    • G05B23/0243Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults model based detection method, e.g. first-principles knowledge model
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01MTESTING STATIC OR DYNAMIC BALANCE OF MACHINES OR STRUCTURES; TESTING OF STRUCTURES OR APPARATUS, NOT OTHERWISE PROVIDED FOR
    • G01M17/00Testing of vehicles
    • G01M17/007Wheeled or endless-tracked vehicles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0751Error or fault detection not based on redundancy
    • G06F11/0754Error or fault detection not based on redundancy by exceeding limits
    • G06F11/0757Error or fault detection not based on redundancy by exceeding limits by exceeding a time limit, i.e. time-out, e.g. watchdogs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0751Error or fault detection not based on redundancy
    • G06F11/0754Error or fault detection not based on redundancy by exceeding limits
    • G06F11/076Error or fault detection not based on redundancy by exceeding limits by exceeding a count or rate limit, e.g. word- or bit count limit
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/20Pc systems
    • G05B2219/26Pc applications
    • G05B2219/2637Vehicle, car, auto, wheelchair

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Quality & Reliability (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • Software Systems (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Probability & Statistics with Applications (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Operations Research (AREA)
  • Evolutionary Biology (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Automation & Control Theory (AREA)
  • Debugging And Monitoring (AREA)

Abstract

公开了用于检测故障或模型失配的系统和方法。一种系统包括处理器、存储器和一个或多个传感器。传感器可以检测与电子设备相关联的数据。存储器可以存储处理器可执行指令,以:在时间段内计算T2统计量和Q统计量,并基于T2统计量和Q统计量应用模型失配和故障检测逻辑。模型失配和故障检测逻辑可以:经由T2计数器对T2统计量超过T2阈值的连续实例进行计数,基于T2计数器更新故障的概率,经由Q计数器对Q统计量超过Q阈值的连续实例进行计数,基于Q计数器更新模型失配的概率,以及基于故障阈值的概率和模型失配阈值的概率来检测故障或模型失配中的一个。

Description

用于检测故障或模型失配的系统和方法
技术领域
本公开一般而言涉及用于基于与电子设备相关联的操作数据来检测故障或模型失配的系统和/或方法,并且更具体而言涉及通过对计算出的模型度量应用模型失配和故障检测逻辑来实时地检测故障或模型失配。
背景技术
用于检测故障的一些系统和方法可以仅从测试数据计算T2统计量(statistic)和/或Q统计量,并且可以将计算出的T2统计量和/或Q统计量与相应的预定阈值进行比较以预测故障。此类系统和方法常常导致假阳性警报的发出并且不能解决非归因于电子设备的错误操作的操作偏差。
发明内容
在一个实施例中,公开了一种系统,该系统包括处理设备、一个或多个传感器以及非暂态处理器可读存储器部件。一个或多个传感器可以通信地耦合到处理设备并且可以相对于电子设备定位以检测与电子设备相关联的操作数据。非暂态处理器可读存储器部件可以存储编程指令,编程指令在由处理设备执行时使处理设备:基于来自一个或多个传感器的操作数据在时间段内计算至少两个模型度量,其中该至少两个模型度量包括T2统计量和Q统计量,以及基于在该时间段内计算出的T2统计量和Q统计量应用模型失配和故障检测逻辑。模型失配和故障检测逻辑可以:经由T2计数器对计算出的T2统计量超过T2阈值的连续实例进行计数,基于T2计数器更新该时间段内与电子设备相关联的故障的概率,经由Q计数器对计算出的Q统计量超过Q阈值的连续实例进行计数,基于Q计数器更新该时间段内与电子设备相关联的模型失配的概率,以及基于故障阈值的概率和模型失配阈值的概率检测电子设备的故障或模型失配中的一个。
在另一个实施例中,公开了一种系统,该系统包括服务器、车辆、一个或多个传感器以及非暂态处理器可读存储器部件。车辆可以经由计算机网络通信地耦合到服务器。一个或多个传感器可以通信地耦合到车辆并且可以相对于电子设备定位以检测与电子设备相关联的操作数据。非暂态处理器可读存储器部件可以存储编程指令,编程指令在由处理设备执行时使处理设备:基于来自一个或多个传感器的操作数据在时间段内计算至少两个模型度量,其中该至少两个模型度量包括T2统计量和Q统计量,以及基于在该时间段内计算出的T2统计量和Q统计量应用模型失配和故障检测逻辑。模型失配和故障检测逻辑可以:经由T2计数器对计算出的T2统计量超过T2阈值的连续实例进行计数,基于T2计数器更新该时间段内与电子设备相关联的故障的概率,经由Q计数器对计算出的Q统计量超过Q阈值的连续实例进行计数,基于Q计数器更新该时间段内与电子设备相关联的模型失配的概率,以及基于故障阈值的概率和模型失配阈值的概率检测电子设备的故障或模型失配中的一个。
在又一个实施例中,公开了一种计算机实现的方法。该计算机实现的方法可以包括:由处理设备基于来自相对于电子设备定位的一个或多个传感器的与电子设备相关联的操作数据在时间段内计算至少两个模型度量,其中该至少两个模型度量包括T2统计量和Q统计量,以及由处理设备基于在该时间段内计算出的T2统计量和Q统计量应用模型失配和故障检测逻辑。模型失配和故障检测逻辑可以:经由T2计数器对计算出的T2统计量超过T2阈值的连续实例进行计数,基于T2计数器更新该时间段内与电子设备相关联的故障的概率,经由Q计数器对计算出的Q统计量超过Q阈值的连续实例进行计数,基于Q计数器更新该时间段内与电子设备相关联的模型失配的概率,以及基于故障阈值的概率和模型失配阈值的概率检测电子设备的故障或模型失配中的一个。
结合附图,根据以下详细描述,将更加充分地理解本文描述的实施例提供的这些和附加特征。
附图说明
在附图中阐述的实施例本质上是说明性和示例性的,并且不旨在限制由权利要求限定的主题。当结合以下附图阅读时,可以理解说明性实施例的以下详细描述,其中相同的结构用相同的附图标记指示并且其中:
图1示意性地描绘了根据本文所示和描述的实施例的具有用于模型失配和故障监视体系架构的部件的说明性网络;
图2A描绘了根据本文所示和描述的一个或多个实施例的可以用于监视电子设备以检测模型失配和/或故障的车辆的说明性硬件部件的框图;
图2B描绘了车辆的说明性存储器部件的框图,该存储器部件包含根据本文所示和描述的一个或多个实施例的说明性逻辑部件;
图2C描绘了车辆的说明性数据存储设备的框图,该数据存储设备包含根据本文所示和描述的一个或多个实施例的说明性数据部件;
图3A描绘了根据本文所示和描述的一个或多个实施例的可以用于监视电子设备以检测模型失配和/或故障的服务器计算设备的说明性硬件部件的框图;
图3B描绘了服务器计算设备的说明性存储器部件的框图,该存储器部件包含根据本文所示和描述的一个或多个实施例的说明性逻辑部件;
图3C描绘了服务器计算设备的说明性数据存储设备的框图,该数据存储设备包含根据本文所示和描述的一个或多个实施例的说明性数据部件;
图4描绘了根据本文所示和描述的一个或多个实施例的由图2A的车辆的硬件部件和/或图3A的服务器计算设备的硬件部件执行的说明性处理的流程图;
图5A以图形方式描绘了根据本文所示和描述的一个或多个实施例的基于与已知故障电子设备相关联的连续操作数据在相同时间段内的说明性T2统计量图和说明性Q统计量图;
图5B以图形方式描绘了根据本文所示和描述的一个或多个实施例的基于图5A的T2统计量图的说明性的故障的概率和基于图5A的Q统计量图的说明性的模型失配的概率;
图6A以图形方式描绘了根据本文所示和描绘的一个或多个实施例的基于与非故障电子设备相关联的连续操作数据在相同时间段内的说明性T2统计量图和说明性Q统计量图;以及
图6B以图形方式描绘了根据本文所示和描述的一个或多个实施例的基于图6A的T2统计量图的说明性的故障的概率和基于图6A的Q统计量图的说明性的模型失配的概率。
具体实施方式
本文描述的实施例呈现了利用模型失配和故障检测逻辑在车辆上实时地计算与电子设备(例如,电动车辆的功率转换器、半导体器件等)相关联的模型失配的概率和故障的概率的系统和/或方法。可以利用如本文所述的模型失配和故障检测逻辑来计算故障的概率和模型失配的概率。根据各个方面,模型失配和故障检测逻辑可以相对于相应的T2阈值和Q阈值来评估与主成分分析(PCA)模型相关联的T2统计量和/或Q统计量。本公开的模型失配和故障检测逻辑可以通过抑制或拒绝由并非归因于电子设备的错误操作的短漂移(short excursion)(例如,与常规模式、路径或操作水平的偏差)造成的错误警报来向系统和/或方法增加健壮性。根据另外的方面,在可能的模型失配后,本文描述的实施例可以重新训练系统以建立新模型(例如,生成不同的PCA模型或更新现有的PCA模型),以避免与电子设备的故障有关的错误警报。值得注意的是,本文描述的模型失配和故障检测逻辑将概率引入了故障分析,这不仅增加了可解释性,而且还增加了一些统计保证。
电子设备(例如,功率转换器、半导体器件、功率电子模块等)常常在高功率密度和高温下操作。此外,电子设备,特别是位于车辆中的那些电子设备,常常经受环境温度和电源循环次数的大变化。因而,电子设备不仅在频率上而且在热循环范围上都会经受大变化。此类操作和环境条件可以导致电子设备经历老化或降级过程,并最终导致设备故障(例如,键合线故障、管芯附接故障、基板分层等)。非预期的电子设备故障不是理想的。例如,如果车辆的电子设备在驾驶过程中发生故障,那么该车辆可能无法使用,并且会使车辆的乘员处于多种不期望的情况下。因而,对电子设备故障的主动和准确的预测/检测是重要的。
现在参考附图,图1描绘了根据本文所示和描述的实施例的具有用于故障监视体系架构的部件的说明性网络100。如图1中所示,计算机网络105可以包括诸如互联网之类的广域网(WAN)、局域网(LAN)、移动通信网络、公共服务电话网(PSTN)、个人局域网(PAN)、城域网(MAN)、虚拟专用网(VPN)和/或另一种网络。计算机网络105一般可以被配置为电连接一个或多个设备(诸如计算设备和/或其部件)。说明性设备可以包括但不限于车辆110、用户计算设备120和服务器计算设备130。
车辆110一般可以是具有一个或多个车载计算设备的任何车辆。计算设备可以包含用于处理从定位在位于车辆110上或其中的电子设备(例如,功率转换器、半导体器件等)上、其中或附近的传感器接收的数据的硬件。此外,计算设备可以包含用于向车辆110的用户提供界面(例如,图形用户界面(GUI)、可照亮dash消息等)的硬件,其中如果检测到故障,那么界面提供通知(例如,可视化的警告、被照亮的指示灯)。根据各个方面,如果检测到故障,那么车辆计算设备可以在有或没有通知的情况下存储故障。应当理解的是,虽然为了简单起见图1仅描绘了单个车辆110,但是本公开不限于此。即,网络100可以包括多个车辆110,使得对于多个车辆110中的每一个车辆上的多个电子设备中的每一个电子设备,可以基本上同时且独立地完成本文描述的故障检测(例如,经由相应的车载计算设备)。根据本文描述的各种实施例,虽然网络100可以包括计算机网络105、用户计算设备120和服务器计算设备130,但是车辆110可以周期性地和/或间歇地仅连接到计算机网络、用户计算设备120和/或服务器计算设备130和/或与其交互。因而,多个车辆110中的每一个车辆的一个或多个计算设备可以包含硬件和/或软件编程,以处理传感器数据并独立于其它网络100的部件来应用本公开的模型失配和故障检测逻辑。
应当理解的是,根据本文描述的实施例,车辆110仅仅是包含需要模型失配和/或故障检测监视的一个或多个电子设备的系统的说明性示例。即,在不脱离本公开的范围的情况下,可以代替车辆110来监视其它系统。例如,诸如机器人、移动性系统(例如,人工智能设备、自主驾驶汽车系统等)、制造系统、公用事业系统(例如,由公用事业公司提供/利用以分发公用事业服务(诸如电力)的设备)等的系统也可以是本文描述的分布式体系架构的一部分。不管所监视的系统如何,应当立即显而易见的是,网络100中连接的各个部件提供了特别配置和设计的系统,该系统可以被用于检测模型失配和/或故障,如本文所述。
仍然参考图1,用户计算设备120一般可以被用作用户与连接到计算机网络105的其它部件之间的接口。因此,如本文中更详细地描述的,用户计算设备120可以被用于执行一个或多个面向用户的功能,诸如从用户接收一个或多个输入和/或向用户提供信息。因而,如本文中更详细地描述的,用户计算设备120可以包括至少显示器和/或输入硬件。在服务器计算设备130要求监督、更新和/或校正的情况下,用户计算设备120可以被配置为提供期望的监督、更新和/或校正。用户计算设备120还可以被用于将附加数据输入到存储在服务器计算设备130上的数据的语料库中。例如,用户计算设备120可以包含软件编程等,其允许用户查看模型失配和/或故障检测监视数据、审查在多个车辆(包括车辆110)中检测到的故障并相应地提供信息。
服务器计算设备130可以从一个或多个数据源(例如,车辆110)接收数据、分析接收到的数据、生成数据、存储数据、给数据加索引、搜索数据,和/或将数据提供给用户计算设备120和/或车辆110(或其部件)。根据各种实施例,服务器计算设备130可以从车辆110(例如,经由计算机网络105)接收操作数据(例如,传感器数据),并且应用本公开的模型失配和故障检测逻辑。根据各个方面,服务器计算设备130可以独立于车辆110应用模型失配和故障检测逻辑。
应当理解的是,虽然用户计算设备120被描绘为个人计算机并且服务器计算设备130被描绘为服务器,但是这些是非限制性示例。在一些实施例中,任何类型的计算设备(例如,移动计算设备、个人计算机、服务器、基于云的设备网络等)可以被用于这些部件中的任何一个。此外,虽然这些计算设备中的每一个在图1中被示为单件硬件,但这也仅仅是示例。用户计算设备120和服务器计算设备130中的每一个可以表示多个计算机、服务器、数据库、部件等。
图2A示意性地描绘了可以被用于监视车辆110的一个或多个电子设备以检测一个或多个电子设备中的模型失配和/或故障的车辆110的说明性硬件部件的框图。
根据本文所示和描述的实施例,车辆110可以包括具有用于完成本文描述的各种处理的被实施为硬件、软件和/或固件的非暂态计算机可读介质的本地部件200(在本文中也可以被称为车辆部件)。根据各种实施例,本地部件200可以被配置为专门设计用于执行本文描述的功能的专用计算机(例如,特定机器)。仍然参考图2A,本地部件200一般可以是车载车辆计算系统。在一些实施例中,本地部件200可以是多个车辆计算系统。值得注意的是,如本文所述,本地部件200可以被配置为独立于其它网络部件(例如,图1的网络100的计算机网络105、用户计算设备120、服务器计算设备130)处理传感器数据并应用本公开的模型失配和故障检测逻辑。根据一些方面,本地部件200可以利用其它网络部件(例如,图1的网络100的计算机网络105、用户计算设备120、服务器计算设备130)来处理传感器数据和/或应用本公开的模型失配和故障检测逻辑(例如,以利用更快和/或更高效的处理资源)。
再次参考图2A,本地部件200可以包括处理设备205、I/O硬件210、网络接口硬件215、数据存储设备220、非暂态存储器部件230以及一个或多个传感器250。如本文进一步所述,一个或多个传感器250可以定位在位于车辆110上或其中的电子设备(例如,功率转换器、半导体器件等)上、其中、附近或以其它方式与之相关联。诸如总线等的本地接口202可以互连各个部件。
诸如计算机处理单元(CPU)之类的处理设备205可以是本地部件200的中央处理单元,执行计算和逻辑运算以执行程序。单独或与其它部件结合的处理设备205是说明性的处理设备、计算设备、处理器或其组合。处理设备205可以包括被配置为(诸如从数据存储设备220和/或存储器部件230)接收并执行指令的任何处理部件。
存储器部件230可以被配置为易失性和/或非易失性计算机可读介质,并且因此可以包括随机存取存储器240(包括SRAM、DRAM和/或其它类型的随机存取存储器)、只读存储器(ROM)245、闪存、寄存器、光盘(CD)、数字多功能盘(DVD)和/或其它类型的存储部件。存储器部件230可以在其上包括一个或多个编程指令,该编程指令在由处理设备205执行时使处理设备205完成各种处理,诸如本文描述的模型失配和故障检测逻辑以及本文关于图4描述的处理。仍然参考图2A,存储在存储器部件230上的编程指令可以被实施为多个软件逻辑模块,其中每个逻辑模块提供用于完成一个或多个任务的编程指令,如下面关于图2B更详细地描述的。
网络接口硬件215可以包括任何有线或无线联网硬件,诸如调制解调器、LAN端口、无线保真(Wi-Fi)卡、WiMax卡、移动通信硬件和/或用于与其它网络和/或设备通信的其它硬件。例如,网络接口硬件215可以在图1中描绘的网络100的车辆110与其它部件(包括(但不限于)服务器计算设备130)之间提供通信链路。
仍然参考图2A,一般可以是存储介质的数据存储设备220可以包含一个或多个数据存储库,用于存储接收到的数据(例如,传感器数据、训练数据、测试数据等)和/或生成的数据(例如,(一个或多个)PCA模型、T2统计量和Q统计量、与模型失配和故障检测逻辑相关联的计算等)。数据存储设备220可以是任何物理存储介质,包括但不限于硬盘驱动器(HDD)、存储器、可移动存储装置等。虽然数据存储设备220被描绘为本地设备,但是应当理解的是,数据存储设备220可以是远程存储设备,诸如例如服务器计算设备等(例如,图1的服务器计算设备130)。下面将关于图2C进一步描述可以包含在数据存储设备220内的说明性数据。
仍然参考图2A,I/O硬件210可以在本地接口202与车辆110的一个或多个其它部件之间传送信息。例如,I/O硬件210可以充当本地部件200与其它部件(例如,移动电话系统、信息娱乐系统等)之间的接口。在一些实施例中,基于经由其它监视部件从用户接收的一个或多个输入,可以利用I/O硬件210将一个或多个命令传输到车辆110的其它部件。
一个或多个传感器250可以包括用于感测某些车辆部件(特别是电子设备)的特点的各种硬件部件。一个或多个传感器250在其它方面不受本公开的限制。例如,一个或多个传感器250可以是电传感器、温度传感器等。可以由一个或多个传感器250感测和/或测量的说明性特点包括但不限于电流、电压、电阻、温度等。一个或多个传感器250中的每一个可以被定位在要测量或监视的一个或多个电子设备上、与之集成、定位成与之成一直线或与定位成与之相邻。一个或多个传感器250一般可以被配置为感测一个或多个特点(例如,电流、电压、温度等)并且传输与用于检测模型失配和/或故障的一个或多个感测到的特点对应的数据(例如,操作数据),如本文中更详细描述的。作为一个示例,温度传感器可以定位在引擎控制模块的壳体内,以监视与壳体内的特定半导体器件相邻的温度。在这种示例中,被监视的温度不仅可以反映由半导体器件生成的热量,而且还可以反映在壳体的外部生成的热量。作为另一个示例,万用表设备可以定位成与节气门位置传感器成一直线,以监视与节气门位置传感器相关联的电压、电流和/或电阻中的至少一个。在这种示例中,与节气门位置传感器相关联的电压应当在车辆的节气门打开时持续增加,并且应当在车辆的节气门关闭时持续减小。因而,当节气门位置传感器工作时,万用表设备可以检测到异常电压(例如,电压的间隙、不连续的电压斑点)。
在一些实施例中,包含在存储器部件230上的程序指令可以被实施为多个软件模块,其中每个模块提供用于完成一个或多个任务的编程指令。例如,图2B示意性地描绘了根据本文所示和描述的一个或多个实施例的包含说明性逻辑部件的存储器部件230。如图2B中所示,存储器部件230可以被配置为存储各种处理逻辑,诸如例如操作逻辑232、数据收集逻辑234、机器学习逻辑236和/或统计量处理逻辑238(作为示例,每一个都可以被实施为计算机程序、固件或硬件)。操作逻辑232可以包括用于管理本地部件200(图2A)的部件的操作系统和/或其它软件。数据收集逻辑234可以包含用于从一个或多个源(例如,图2A中描绘的一个或多个传感器250、图1中描绘的服务器计算设备130等)收集数据(例如,操作数据)、转换数据、传输数据和/或分析数据的一个或多个软件模块,如本文中更详细地描述的。机器学习逻辑236可以包含用于收集数据(例如,训练数据、测试数据)、分析数据并从数据确定信息(例如,PCA模型)的一个或多个软件模块,如本文中更详细地描述的。统计量处理逻辑238可以包含用于确定某些接收到的数据(例如,操作数据)是否指示模型失配和/或故障的一个或多个软件模块,如本文中更详细地描述的。
图2C示意性地描绘了根据本文所示和描述的一个或多个实施例的本地部件200的存储设备(例如,数据存储设备220)(图2A)内包含的各种数据的框图。如图2C中所示,数据存储设备220可以包括例如传感器数据222、机器学习数据224、统计量处理数据226和/或结果数据228。传感器数据222可以包括例如从一个或多个传感器250(图2A)接收的数据(例如,操作数据)。例如,如上所述,传感器数据222可以包括与节气门位置传感器相关联的电压输出。机器学习数据224一般可以是用于机器学习处理的教学数据和/或测试数据。例如,机器学习数据224可以包括已知为故障的操作数据和/或已知为无故障的操作数据,机器学习逻辑236可以使用该数据来学习何时特定情况指示故障或无故障操作。统计量处理数据226一般可以是由于处理从一个或多个传感器250(图2A)接收到的数据和/或从服务器计算设备130(图1)接收到的数据而生成和/或访问的数据。例如,统计量处理数据226可以包括计算出的T2统计量、计算出的Q统计量、(一个或多个)生成的PCA模型等。结果数据228可以是与是否检测到模型失配和/或故障对应的数据,包括时间数据、位置数据、传输日志等。
应当理解的是,图2A-2C中所示的部件仅仅是说明性的,并不旨在限制本公开的范围。更具体而言,虽然图2A-2C中的部件被示为驻留在车辆110的本地部件200内,但这是非限制性示例。在一些实施例中,部件中的一个或多个可以驻留在本地部件200和/或车辆110的外部。
图3A示意性地描绘了根据本公开的各个方面的服务器计算设备130的说明性硬件部件。如本文所述,服务器计算设备130可以(例如,经由图1的计算机网络105)从车辆110接收操作数据(例如,传感器数据),并且独立于车辆110(图1)应用本公开的模型失配和故障检测逻辑,以监视车辆110的一个或多个电子设备的模型失配和/或故障检测。根据各个方面,服务器计算设备可以类似地监视多个车辆110的模型失配和/或故障检测。
根据本文所示和描述的实施例,服务器计算设备130可以包括用于完成本文描述的各种处理的被实施为硬件、软件和/或固件的非暂态计算机可读介质。根据各种实施例,服务器计算设备130可以被配置为专门设计用于执行本文描述的功能的专用计算机。如所描述的,服务器计算设备130可以被配置为处理接收到的操作数据(例如,传感器数据)并且独立于其它网络部件(例如,图1的网络100的计算机网络105、用户计算设备120、车辆110)应用本公开的模型失配和故障检测逻辑。根据一些方面,服务器计算设备130被配置为不仅可以从车辆110接收操作数据,而且还可以处理传感器数据和/或应用本公开的模型失配和故障检测逻辑(例如,与图2A的本地部件200相比,服务器计算设备130可以是更快和/或更高效的处理资源)。
仍然参考图3A,服务器计算设备130可以包括处理设备305、I/O硬件310、网络接口硬件315、数据存储设备320以及非暂态存储器部件330。诸如总线等的本地接口300可以互连各个部件。
诸如计算机处理单元(CPU)之类的处理设备305可以是服务器计算设备130的中央处理单元,执行计算和逻辑运算以执行程序。单独或与其它部件结合的处理设备305是说明性的处理设备、计算设备、处理器或其组合。处理设备305可以包括被配置为(诸如从数据存储设备320和/或存储器部件330)接收并执行指令的任何处理部件。
存储器部件330可以被配置为易失性和/或非易失性计算机可读介质,并且因此可以包括随机存取存储器340(包括SRAM、DRAM和/或其它类型的随机存取存储器)、只读存储器(ROM)345、闪存、寄存器、光盘(CD)、数字多功能盘(DVD)和/或其它类型的存储部件。存储器部件330可以在其上包括一个或多个编程指令,该编程指令在由处理设备305执行时使处理设备305完成各种处理,诸如本文描述的模型失配和故障检测逻辑以及本文关于图4描述的处理。仍然参考图3A,存储在存储器部件330上的编程指令可以被实施为多个软件逻辑模块,其中每个逻辑模块提供用于完成一个或多个任务的编程指令,如下面关于图3B更详细地描述的。
网络接口硬件315可以包括任何有线或无线联网硬件,诸如调制解调器、LAN端口、无线保真(Wi-Fi)卡、WiMax卡、移动通信硬件和/或用于与其它网络和/或设备通信的其它硬件。例如,网络接口硬件315可以在图1中描绘的网络100的服务器计算设备130与其它部件(包括(但不限于)车辆110)之间提供通信链路。
仍然参考图3A,一般可以是存储介质的数据存储设备320可以包含一个或多个数据存储库,用于存储接收到的数据(例如,传感器数据、训练数据、测试数据等)和/或生成的数据(例如,(一个或多个)PCA模型、T2统计量和Q统计量、与模型失配和故障检测逻辑相关联的计算等)。根据各个方面,此类数据可以从一个或多个车辆110和/或其部件接收或由一个或多个车辆110和/或其部件生成。数据存储设备320可以是任何物理存储介质,包括但不限于硬盘驱动器(HDD)、存储器、可移动存储装置等。下面将关于图3C描述可以包含在数据存储设备320内的说明性数据。
仍然参考图3A,I/O硬件310可以在本地接口300与服务器计算设备130的一个或多个其它部件之间传送信息。在一些实施例中,基于从用户接收的一个或多个输入,可以利用I/O硬件310将一个或多个命令传输到服务器计算设备130的其它部件。
在一些实施例中,包含在存储器部件330上的程序指令可以被实施为多个软件模块,其中每个模块提供用于完成一个或多个任务的编程指令。例如,图3B示意性地描绘了根据本文所示和描述的一个或多个实施例的包含说明性逻辑部件的存储器部件330。如图3B中所示,存储器部件330可以被配置为存储各种处理逻辑,诸如例如操作逻辑332、数据收集逻辑334、机器学习逻辑336和/或统计量处理逻辑338(例如,每一个都可以被实施为计算机程序、固件或硬件)。操作逻辑332可以包括用于管理服务器计算设备130(图3A)的部件的操作系统和/或其它软件。数据收集逻辑334可以包含用于从一个或多个源(例如,图2A中描绘的一个或多个传感器250)收集数据(例如,操作数据)、转换数据、传输数据和/或分析数据的一个或多个软件模块,如本文更详细地描述的。机器学习逻辑336可以包含用于收集数据(例如,训练数据、测试数据)、分析数据并从数据确定信息(例如,PCA模型)的一个或多个软件模块,如本文中更详细地描述的。统计量处理逻辑338可以包含用于确定某些接收到的数据(例如,来自图1的车辆110的操作数据)是否指示模型失配和/或故障的一个或多个软件模块,如本文更详细地描述的。
图3C示意性地描绘了根据本文所示和描述的一个或多个实施例的服务器计算设备130的存储设备(例如,数据存储设备320)(图3A)中包含的各种数据的框图。如图3C中所示,数据存储设备320可以包括例如传感器数据322、机器学习数据324、统计量处理数据326和/或结果数据328。传感器数据322可以包括例如从车辆110(图1)和/或其部件(例如,图2A的本地部件200)和/或从多个车辆110接收和/或传输的数据(例如,来自图2A中的一个或多个传感器250)。例如,如上所述,传感器数据322可以包括与节气门位置传感器相关联的电压输出。机器学习数据324一般可以是用于机器学习处理的教学数据和/或测试数据。例如,机器学习数据324可以包括已知为故障的操作数据和/或已知为无故障的操作数据,机器学习逻辑336可以使用该数据来学习何时特定情况指示故障或无故障操作。统计量处理数据326一般可以是由于处理从车辆110(图1)的一个或多个传感器250(图2A)接收的数据而生成和/或访问的数据。例如,统计量处理数据326可以包括计算出的T2统计量、计算出的Q统计量、(一个或多个)生成的PCA模型等。结果数据328可以是与是否检测到模型失配和/或故障对应的数据,包括时间数据、位置数据、传输日志等。
应当理解的是,图3A-3C中所示的部件仅仅是说明性的,并不旨在限制本公开的范围。更具体而言,虽然图3A-3C中的部件被示为驻留在服务器计算设备130内,但这是非限制性示例。在一些实施例中,部件中的一个或多个可以驻留在服务器计算设备130的外部。类似地,如本文先前描述的,虽然图3A-3C针对服务器计算设备130,但是其它部件(诸如用户计算设备120)可以包括类似的硬件、软件和/或固件。
如上面所提到的,关于图2A-2C和图3A-3C描述的各种部件可以被用于执行一个或多个处理和/或提供用于接收传感器数据、处理传感器数据以及确定是否处理的传感器数据指示了模型失配和/或检测到的故障使得可以采取适当动作的功能。
图4描绘了由本文描述的一个或多个部件执行的说明性处理的流程图。根据各种实施例,图4中描绘的处理的所有步骤可以由车辆的部件(例如,图2A-2C)执行。在这样的方面,可以在车辆上并且实时地执行故障或模型失配的分析和检测。照此,可以避免通信滞后(例如,由于上传和/或下载速度、连接性问题等)。根据其它实施例,图4中描绘的处理的所有步骤可以由服务器计算设备130的部件(例如,图3A-3C)执行。根据另外的实施例,图4中描绘的处理的步骤可以分布在车辆110的部件和服务器计算设备130的部件之间。根据一些方面,当与计算机网络105的连接容易且可靠地可用时(例如,实时或近实时的通信,无或可忽略的通信滞后等),可以发生分布式处理。例如,服务器计算设备130的处理设备305(图3A)可以具有比车辆110的本地部件200的处理设备205(图2A)更快的数据/指令处理速度。在这样的示例中,可以将计算强度大的方面(例如,机器学习、处理与多个车辆相关联的操作数据等)指派给服务器计算设备以实现计算效率。根据还有另外的实施例,图4中描绘的处理的步骤可以由车辆110的部件和服务器计算设备130的部件并发地处理。
参考图4,可以在方框405处接收训练数据,并且可以在方框410处接收测试数据。训练数据和测试数据一般可以是从定位在要测量和/或监视的一个或多个电子设备(例如,功率转换器、半导体器件等)上、与之集成、定位成与之成一直线或定位成与之相邻的一个或多个传感器(图2A)接收的数据。照此,训练数据和测试数据在本文中可以被统称为感测数据(例如,操作数据)。训练数据一般可以指被用于创建和/或重新训练机器学习模型(例如,PCA模型)的数据。测试数据一般可以指被用于测试机器学习模型(例如,PCA模型)以评估其预测能力的数据。例如,测试数据可以是已知与故障电子设备相关联的数据。可以将这种数据应用于机器学习模型,以评估机器学习模型是否可以检测到故障。在方框405处,如果处理由车辆110的本地部件200执行,那么可以直接从一个或多个传感器接收训练数据和/或测试数据。可替代地,在方框405处,如果处理至少部分地由服务器计算设备130执行,那么可以经由计算机网络105(图1)从车辆110接收训练数据和/或测试数据。在这样的方面,可以从网络100中的多个车辆110接收训练数据和/或测试数据。
在一些实施例中,训练数据和测试数据一般可以是相同的数据。即,从一个或多个传感器接收的数据被拆分,其中数据的一部分被指定为训练数据,而另一部分被指定为测试数据。例如,可以将大约60%的数据、大约70%的数据、大约80%的数据、大约90%的数据等指定为训练数据,并将数据的其余部分指定为测试数据。一般应当理解其它百分比不脱离本公开的范围。
在方框415处,车辆110的本地部件200和/或服务器计算设备130可以基于接收到的训练数据来建立或重新训练机器学习模型。根据各个方面,机器学习模型可以被称为多变量统计模型。在这样的方面,车辆110的本地部件200和/或服务器计算设备130可以从训练数据生成统计量(例如,均值、方差、协方差等),并使用那些统计量来建立用于一个或多个感兴趣的电子设备中的每一个的多变量统计模型。根据各个方面,多变量统计模型可以利用主成分分析(PCA)将M维变量空间变换成相互正交的主成分的N维空间。PCA计算M个特征向量和M个特征值的集合(例如,每个特征向量将处理变量数据变换成主成分空间的相应维度,每个特征值与由其对应特征向量表示的方差量成比例),然后通过保留与输出PCA模型中的N个最大特征值对应的N个特征向量来简化主成分空间。值得注意的是,主成分的数量“N”表示在解释较少数据方差(例如,较小的N)的PCA模型与解释较多数据方差(例如,较大的N)的PCA模型之间进行权衡。关于PCA的进一步细节一般地被理解并且超过本公开的范围。
在方框420处,车辆110的本地部件200和/或服务器计算设备130(例如,经由计算机网络105从车辆110)可以从一个或多个传感器(例如,图2A的传感器250)接收操作数据(例如,实时或近实时)。根据图5A和6A,可以在连续的时间段(例如,几个小时等)内接收操作数据。
参考方框425,每个多变量统计模型(例如,PCA模型)可以与一个或多个模型度量相关联。根据本公开的各个方面,一个或多个模型度量可以包括Hotelling的T2和平方预测误差Q。每个模型度量(T2、Q等)可以与估计被监视的处理数据(例如,当前操作数据)与用于建立多变量统计模型的训练数据具有相同(或在统计上不显著不同)的统计量(例如,均值、方差、协方差等)的概率的独特数学方法。换句话说,每个模型度量(T2、Q等)是标量数字,其值表示实际处理监视期间收集的处理数据(例如,操作数据)的统计特点与由多变量统计模型(例如,PCA模型)预测的统计特点之间的偏差的量值。值得注意的是,每个模型度量(T2、Q等)可以与相应的阈值(例如,T2 threshold、Qthreshold等)相关联,并且如果当前计算的模型度量超过其相关联的阈值(例如,T2>T2 threshold、Q>Qthreshold),那么可以检测和/或诊断出故障。关于一个或多个模型度量(T2和/或Q)的计算的细节一般地被理解(例如,经由常规统计算法)并且超过本公开的范围。因而,在方框425处,车辆110的本地部件200和/或服务器计算设备130可以在连续的时间段上计算与接收到的操作数据相关联的T2统计量和Q统计量。
在方框430处,车辆110的本地部件200和/或服务器计算设备130可以应用或执行本公开的模型失配和故障检测逻辑。下面表1中的伪代码说明了模型失配和故障检测逻辑的一种示例实施方式,如本文所述。
Figure BDA0002418608130000181
Figure BDA0002418608130000191
表1
根据各种实施例,联系上面的表1,模型失配和故障检测逻辑可以是包括Q、T2、Qthreshold、T2 threshold、Nprior
Figure BDA0002418608130000192
和CQ的变量的函数,其中Q是本文讨论的平方预测误差模型度量,T2是本文讨论的Hotelling的T2模型度量,Qthreshold是Q的阈值,T2 threshold是T2的阈值,
Figure BDA0002418608130000193
是T2的置信度,CQ是Q的置信度,并且Nprior是先前的观察(例如,运行、循环、迭代等)的数量的下限。根据各个方面,
Figure BDA0002418608130000194
其中R0是概率(例如,如本文所讨论的故障的概率或模型失配的概率)的下限。在这里,根据各种实施例,
Figure BDA0002418608130000195
CQ和R0可以被选择为等于0.99。照此,根据本公开的各个方面,Nprior可以被选择为等于满足这样的约束的值(例如,Nprior≥600)。
进一步根据表1,可以将模型失配和故障检测逻辑设置为初始值:
Figure BDA0002418608130000196
counterQ=0,AQ=0 (2)
其中
Figure BDA0002418608130000197
是对计算出的T2统计量超过T2 threshold的次数进行计数的计数器,counterQ是对计算出的Q统计量超过Qthreshold的次数进行计数的计数器,
Figure BDA0002418608130000198
是与T2统计量相关联的故障的先前概率,并且AQ是与Q统计量相关联的模型失配的先前概率。
在这个背景下,车辆110的本地部件200和/或服务器计算设备130可以将每个计算出的T2统计量与T2 threshold进行比较并如下更新
Figure BDA0002418608130000201
Figure BDA0002418608130000202
ifT2>T2 thresholdthen
Figure BDA0002418608130000203
Figure BDA0002418608130000204
else
Figure BDA0002418608130000205
Figure BDA0002418608130000206
因而,在每个计算的T2统计量大于T2 threshold的情况下,与T2相关联的故障的先前概率(例如,
Figure BDA0002418608130000207
)基于先前观察的数量(例如,对于Nprior≥600)按分数(例如,
Figure BDA0002418608130000208
)增加。否则,在每个计算出的T2统计量小于或等于T2 threshold的情况下,与T2相关联的故障的先前概率(例如,
Figure BDA0002418608130000209
)基于先前观察的数量(例如,对于Nprior≥600),按分数(例如,
Figure BDA00024186081300002010
)减小。根据这样的方面,部分地基于先前/过去的观察,利用T2的每次计算来更新与T2相关联的故障的先前概率(例如,
Figure BDA00024186081300002011
)。
车辆110的本地部件200和/或服务器计算设备130然后可以如下计算故障的概率:
Figure BDA00024186081300002012
其中
Figure BDA00024186081300002013
已经经由方程式3b或方程式4b确定。
更具体而言,可以使用以下概率方程式得出方程式5:
Figure BDA0002418608130000211
其中R是概率(例如,如本文中讨论的故障的概率),R0是那个概率的下限(例如,故障的概率的下限),A是先前概率(例如,故障的先前概率),C是置信度(例如,与T2相关联的置信度),并且n是高于阈值的连续观察的数量(例如,T2高于T2 threshold的连续观察的数量)。
类似地,车辆110的本地部件200和/或服务器计算设备130可以将每个计算出的Q统计量与Qthreshold进行比较并如下更新AQ和counterQ
ifQ>Qthresholdthen
counterQ+=1, (7a)
Figure BDA0002418608130000212
else
counterQ=0, (8a)
Figure BDA0002418608130000213
因而,在每个计算出的Q统计量大于Qthreshold的情况下,与Q相关联的模型失配的先前概率(例如,AQ)基于先前观察的数量(例如,对于Nprior≥600)按分数(例如,
Figure BDA0002418608130000214
)增加。否则,在每个计算出的Q统计量小于或等于Qthreshold的情况下,与Q相关联的模型失配的先前概率(例如,AQ)基于先前观察的数量(例如,对于Nprior≥600)按分数(例如,
Figure BDA0002418608130000215
)减小。根据这样的方面,部分地基于先前/过去的观察,利用Q的每次计算来更新与Q相关联的模型失配的先前概率(例如,AQ)。
车辆110的本地部件200和/或服务器计算设备130然后可以如下计算失配的概率:
Figure BDA0002418608130000221
其中AQ已经经由方程式7b或方程式8b确定。
与以上相似,可以使用方程式6来导出方程式9,其中R是概率(例如,如本文所讨论的模型失配的概率),R0是那个概率的下限(例如,模型失配的概率的下限),A是先前概率(例如,模型失配的先前概率),C是置信度(例如,与Q相关联的置信度),并且n是高于阈值的连续观察的数量(例如,Q高于Qthreshold的连续观察的数量)。
在方框435处,车辆110的本地部件200和/或服务器计算设备130可以使用失配阈值的概率(例如,p_mismatch_threshold)来如下确定是否标记模型失配:
Mismatchflag=p_nismatch>p_mismatch_threshold (10)
其中p_mismatch已经经由方程式9确定。
根据这样的方面,如果标记了模型失配,那么在方框440处,车辆110的本地部件200和/或服务器计算设备130可以重新训练多变量统计模型(例如,PCA模型)。根据各个方面,重新训练多变量统计模型可以包括分别在方框405和方框410处获得新的训练数据和新的测试数据,以及在方框415处建立新的和/或更新后的多变量统计模型(例如,新的PCA模型),如本文先前已描述的。
根据其它方面,如果没有标记模型失配,那么车辆110的本地部件200和/或服务器计算设备130可以在方框445处使用故障阈值的概率(例如,p_fault_threshold)来如下确定是否标记故障:
FaultflaG=p_fault>p_fault_threshold (11)
其中p_fault已经经由方程式5确定。
根据这样的方面,如果未标记故障,那么车辆110的本地部件200和/或服务器计算设备130可以返回到方框420,并且在连续时间段内继续接收和处理操作数据,如所描述的。
根据其它方面,如果标记了故障,那么在方框450处,车辆110的本地部件200和/或服务器计算设备130可以提供故障或可能的故障的通知。根据各个方面,如上所述,可以经由车辆110中的接口将故障或可能的故障通知给车辆用户。根据其它方面,可以向其它联网部件(例如,用户计算设备120和/或服务器计算设备130)通知(例如,经由计算机网络105)故障或可能的故障。
如上所述,随着时间的推移,将计算出的T2统计量和Q统计量与它们相应的阈值T2 threshold和Qthreshold相比较。如果针对当前迭代的T2统计量超过阈值T2 threshold,那么递增连续观察高于阈值的计数器(计数器T 2)(例如,上面的方程式3a),并更新故障的概率(例如,上面的方程式3b和方程式5)。可替代地,如果针对当前迭代的T2统计量等于或低于阈值,那么将计数器(计数器T 2)重置为零(例如,上面的方程式4a),并更新故障的概率(例如,上面的方程式4b和方程式5)。类似地,如果针对当前迭代的Q统计量超过阈值Qthreshold,那么递增连续观察高于阈值的计数器(计数器Q)(例如,上面的方程式7a),并更新模型失配的概率(例如,上面的方程式7b和方程式9)。可替代地,如果针对当前迭代的Q统计量等于或低于阈值Qthreshold,那么将计数器(计数器Q)重置为零(例如,上面的方程式8a),并更新模型失配的概率(例如,上面的方程式8b和方程式9)。
根据这样的方面,在每次迭代时,计算故障的概率和模型失配的概率中的每一个(例如,上面的方程式5和方程式9),并且可以将其与99%阈值进行比较。如果模型失配的概率超过99%阈值(例如,p_mismatch_threshold),那么可以声明模型失配。如果没有同时声明模型失配并且故障的概率超过99%阈值(例如,p_fault_threshold),那么可以声明故障。
根据其它方面,在每次迭代时,计算故障的概率和模型失配的概率中的每一个(例如,上面的方程式5和方程式9),并且可以将其与预定阈值进行比较。
在一些方面,预定阈值可以大于99%(例如,相对不太保守的故障检测和/或相对不太激进的模型失配检测,比错误警报更容易接受可能的设备故障)或小于99%(例如,相对更保守的故障检测和/或相对更激进的模型失配检测,比可能的设备故障更容易接受错误警报)。在一个示例中,预定阈值可以是99.5%而不是99%。在这样的示例中,车辆110的本地部件200和/或服务器计算设备130不仅在图4的方框440处重新训练多变量统计模型(例如,PCA模型)时相对不太激进(例如,可以重新训练Q>Qthreshold的更少、更连续的实例以触发重新训练),而且在图4的方框450处发出故障通知时相对不太保守(例如,可以发出更少的故障通知,T2>T2 threshold的更多的连续实例以触发故障通知)。在另一个示例中,预定阈值可以是98.5%而不是99%。在这样的示例中,车辆110的本地部件200和/或服务器计算设备130不仅可以在图4的方框440处重新训练多变量统计模型(例如,PCA模型)时相对更激进(例如,可以重新训练Q>Qthreshold的更多、更不连续实例以触发重新训练),而且在图4的方框450处发出故障通知时相对更保守(例如,可以发出更多的故障通知,T2>T2 threshold的更少的连续实例以触发故障通知)。因而,本公开的各种实施例可以利用大于99%的预定阈值来进一步抑制或拒绝由并非归因于设备的错误操作的短漂移(例如,与常规模式、路径或操作水平的偏差)造成的错误警报。
在其它方面,对于模型失配的概率和故障的概率,预定阈值可以不同。在一个示例中,模型失配阈值的概率(例如,p_mismatch_threshold)可以小于99%(例如,相对更激进的模型失配检测,可以重新训练Q>Qthreshold的更多、更不连续的实例以触发重新训练)并且故障阈值的概率(例如,p_fault_threshold)可以大于99%(例如,相对不太保守的故障检测,可以发出较少的故障通知,T2>T2 threshold的更多连续的实例来触发故障通知)。在这样的示例中,车辆110的本地部件200和/或服务器计算设备130可以重新训练更多并且可以发布更少的故障通知。在另一个示例中,模型失配阈值的概率(例如,p_mismatch_threshold)可以大于99%(例如,相对不太激进的模型失配检测,可以重新训练Q>Qthreshold的更少、更连续的实例以触发重新训练)并且故障阈值的概率(例如,p_fault_threshold)可以小于99%(例如,相对更保守的故障检测,可以发出更多的故障通知,T2>T2 threshold的更不连续的实例以触发故障通知)。在这样的示例中,车辆110的本地部件200和/或服务器计算设备130可以重新训练更少并且可以发出更多的故障通知。因而,本公开的各种实施例可以利用小于99%的模型失配阈值的概率(例如,p_mismatch_threshold)和大于99%的故障阈值的概率(例如,p_fault_threshold)来进一步抑制或拒绝由并非归因于设备的错误操作的短漂移(例如,与常规模式、路径或操作水平的偏差)造成的错误警报。
在这种背景下,根据本公开的各种实施例,本文所述的模型失配和故障检测逻辑的模型失配阈值的概率(例如,以上方程式10中的p_mismatch_threshold)和/或故障阈值的概率(例如,以上方程式11中的p_fault_threshold)可以被动态修改,以进一步抑制或拒绝由并非归因于设备的错误操作的短漂移(例如,与常规模式、路径或操作水平的偏差)造成的错误警报,如上所述。更具体而言,根据各个方面,车辆110的本地部件200和/或服务器计算设备130可以使用预定的分层阈值组动态地修改模型失配阈值的概率(例如,p_mismatch_threshold)和/或故障阈值的概率(例如,p_fault_threshold)。在一个示例中,预定的分层阈值组可以包括第一层98.5%、第二层99%和第三层99.5%。应当理解的是,在本公开的精神和范围内可以使用各种其它分层阈值。在这样的方面,车辆110的本地部件200和/或服务器计算设备130可以监视p_mismatch和/或p_fault(例如,如经由本文描述的模型失配和故障检测逻辑所更新的)何时超过或将超过第一分层阈值。作为响应,车辆110的本地部件200和/或服务器计算设备130可以将超过的第一分层阈值(例如,98.5%)动态地修改为第二分层阈值(例如,99%),以避免触发重新训练和/或故障。例如,当经由本文描述的模型失配和故障检测逻辑更新的p_mismatch超过或将超过98.5%时,可以将p_mismatch_threshold从98.5%动态地修改为99%。当经由本文描述的模型失配和故障检测逻辑更新的p_fault超过或将超过98.5%时,可以类似地将p_fault_threshold从98.5%动态地修改为99%。p_mismatch_threshold和/或p_fault_threshold可以类似地从预定的分层阈值组的第二分层阈值(例如,99%)动态地修改为第三分层阈值(例如,99.5%)。
此外,预定的分层阈值组的每个层可以与通知级别相关联。在一个示例中,第一层(例如,98.5%)可以与第一通知级别(例如,黄色通知界面指示灯等)相关联,第二层(例如,99%)可以与第二通知级别(例如,橙色警示界面指示灯等)相关联并且第三层(例如,99.5%)可以与第三通知级别(例如,红色警告界面指示灯等)相关联。应当理解的是,在本公开的精神和范围内可以使用其它通知级别。在这样的示例中,车辆110的本地部件200和/或服务器计算设备130可以响应于p_mismatch和/或p_fault(例如,如经由本文描述的模型失配和故障检测逻辑而更新的)超过分层阈值(例如,98.5%、99%、99.5%等)向车辆用户和/或联网部件提供其相关联的通知(例如,黄色通知界面指示灯、橙色警示界面指示灯、红色警告界面指示灯),如本文所描述的。
根据各个方面,可以利用上面的方程式6来确定触发故障的概率(例如,p_fault)的T2高于T2 threshold的连续观察的确切数量(例如,
Figure BDA0002418608130000261
)。如本文所讨论的,方程式6与观察在所选择的区间尺寸(例如,
Figure BDA0002418608130000271
))中高于阈值的观察的C(例如,0.99)对应,其中R0是概率的下限,并且其中
Figure BDA0002418608130000272
CQ和R0可以被选择为等于0.99。因而,方程式6中的“n”可以替换为
Figure BDA0002418608130000273
以便当故障的概率(例如,p_fault)大于故障的概率的下限R0时以置信度
Figure BDA0002418608130000274
确保能够发信号通知故障。
在这种情况下,触发故障的概率(例如,p_fault)的T2高于T2 threshold的连续观察的确切数量可以被计算/近似为四舍五入到最接近的整数的以下方程式12的迭代解。
Figure BDA0002418608130000275
类似地,上面的方程式6可以被用于确定触发模型失配的概率(例如,p_mismatch)的Q高于Qthreshold连续观察的确切数量(例如,nQcritical)。再次,与上面类似,方程式6中的“n”可以被替换为nQcritical=log(1-CQ)/log(R0),以便当模型失配的概率(例如,p_mismatch)大于模型失配的概率的下限R0时以置信度CQ确保能够发信号通知模型失配。
在这种情况下,触发模型失配的概率(例如,p_mismatch)的Q高于Qthreshold的连续观察的确切数量可以被计算/近似为四舍五入到最接近的整数的以下方程式13的迭代解。
Figure BDA0002418608130000276
下面的表2说明了分别使用上面的方程式12和13迭代地计算以触发故障的概率和模型失配的概率的高于阈值的连续观察的确切数量(例如,
Figure BDA0002418608130000277
nQcritical)。值得注意的是,如果在方程式12中选择R0等于
Figure BDA0002418608130000278
那么
Figure BDA0002418608130000279
将小于
Figure BDA00024186081300002710
此外,等于或大于
Figure BDA00024186081300002711
的区间尺寸将在故障的概率(例如,p_fault)大于故障的概率的下限R0时以置信度
Figure BDA00024186081300002712
确保能够发信号通知故障。小于
Figure BDA00024186081300002713
的区间尺寸将是T2高于T2 threshold的连续观察的数量不足以发信号通知故障。类似地,如果在方程式13中选择R0等于CQ,那么AQ将小于CQ。此外,等于或大于nQcritical的区间尺寸将在模型失配的概率(例如,p_mismatch)大于模型失配的概率的下限R0时以置信度CQ确保能够发信号通知模型失配。小于nQcriticaI的区间尺寸将是Q高于Qthreshold的连续观察的数量不足以发信号通知模型失配。
Figure BDA0002418608130000281
表2
图5A以图形方式描绘了根据本公开的各个方面的基于与已知故障电子设备相关联的连续操作数据在相同时间段内的说明性T2统计量图和说明性Q统计量图。图5B以图形方式描绘了根据本公开的各个方面的基于图5A的T2统计量图的说明性的故障的概率(例如,p_fault)和基于图5A的Q统计量图的说明性的模型失配的概率(例如,p_mismatch)。
鉴于图5A,参考图5B,故障的概率(例如,p_fault)在图5A中随着T2高于T2 threshold502(例如,由虚线表示)的每个连续观察而增加。故障的概率的增加归因于T2高于T2 threshold 502的连续观察的增加数量。故障的概率的减小与T2低于T2 threshold 502的每次观察对应。值得注意的是,鉴于图5B,由于Q的观察保持低于Qthreshold(例如,由图5A中的虚线表示),因此模型失配的概率(例如,p_mismatch)保持为零。
图6A以图形方式描绘了根据本公开的各个方面的基于与非故障电子设备相关联的连续操作数据在相同时间段内的说明性T2统计量图和说明性Q统计量图。图6B以图形方式描绘了根据本公开的各个方面的基于图6A的T2统计量图的说明性的故障的概率(例如,p_fault)和基于图6A的Q统计量图的说明性的模型失配的概率(例如,p_mismatch)。
鉴于图6A,参考图6B,由于在图6A中T2的观察保持低于T2 threshold 602(例如,由虚线表示),因此在小时50和小时60之间的故障的概率(例如,p_fault)保持为零。但是,由于在图6A中Q的观察高于Qthreshold 604(例如,由虚线表示),因此在小时50和小时60之间的Q统计量指示与当前多变量统计模型(例如,PCA模型)偏离。如图6B中所描绘的,这种偏离由小时50和小时60之间模型失配的结果概率反映。值得注意的是,(例如,与图4的方框440一致),根据本公开的各个方面,通过发信号通知重新训练(例如,在60小时,49分,54秒时),现有的多变量统计模型(例如,现有的PCA模型)可以由新的PCA模型代替和/或被更新为新的PCA模型。在这样的方面,在重新训练期间,车辆110的本地部件200和/或服务器计算设备130可以忽略T2高于T2 threshold 602的观察(例如,在小时64和小时67之间)以及对应的故障的概率((例如,p_fault),如图6B所描绘的(例如,在小时64和小时67之间)。在缺少图4的处理以及本公开的模型失配和故障检测逻辑的情况下,可以已经发出指示电子设备中的故障的假阳性信号。这种假阳性信号可以导致电子设备不必要的重启和/或更换。
现在应当理解的是,本文描述的系统和方法适于使用本文描述的模型失配和故障检测逻辑来车载且实时地计算模型失配的概率和与电子设备(例如,功率转换器、半导体器件等)相关联的故障的概率。根据各个方面,模型失配和故障检测逻辑不仅相对于相应的T2阈值和Q阈值评估T2统计量和Q统计量,而且还基于其中T2统计量和Q统计量超过相应的T2阈值和Q阈值的连续迭代来递增模型失配的概率和故障的概率,并基于其中T2统计量和Q统计量不超过其相应的T2和Q阈值的每次迭代来递减模型失配的概率和故障的概率。因而,本公开的模型失配和故障检测逻辑可以通过抑制或拒绝由并非归因于电子设备的错误操作的短漂移(例如,与常规模式、路径或操作水平的偏差)造成的错误警报来向系统和/或方法增加健壮性。抑制或拒绝错误警报可以避免不必要的成本(例如,实际上没有缺陷或故障的电子设备的人工和更换成本)、不必要的延迟(例如,由于电子设备重启而引起的不可用性等)和/或不必要的用户挫败感(例如,当没有电子设备实际有缺陷或有故障时的故障灯照明)。
虽然本文已经图示和描述了特定的实施例,但是应当理解的是,在不脱离要求保护的主题的精神和范围的情况下,可以做出各种其它改变和修改。而且,虽然本文已经描述所要求保护的主题的各个方面,但是这些方面不需要结合使用。因此,意图是所附权利要求覆盖在要求保护的主题的范围内的所有这样的改变和修改。

Claims (10)

1.一种系统,包括:
处理设备;
一个或多个传感器,通信地耦合到所述处理设备,其中所述一个或多个传感器相对于电子设备定位,以检测与所述电子设备相关联的操作数据;以及
存储编程指令的非暂态处理器可读存储器部件,所述编程指令在由所述处理设备执行时使所述处理设备:
基于来自所述一个或多个传感器的所述操作数据在时间段内计算至少两个模型度量,其中所述至少两个模型度量包括T2统计量和Q统计量;以及
基于在所述时间段内计算出的T2统计量和Q统计量应用模型失配和故障检测逻辑,其中所述模型失配和故障检测逻辑:
经由T2计数器对计算出的T2统计量超过T2阈值的连续实例进行计数;
基于T2计数器更新所述时间段内与所述电子设备相关联的故障的概率;
经由Q计数器对计算出的Q统计量超过Q阈值的连续实例进行计数;
基于Q计数器更新所述时间段内与所述电子设备相关联的模型失配的概率;以及
基于故障阈值的概率和模型失配阈值的概率检测电子设备的故障或模型失配中的一个。
2.如权利要求1所述的系统,其中,所述编程指令在由所述处理设备执行时还使所述处理设备:
基于预定的分层阈值组动态地修改所述故障阈值的概率或所述模型失配阈值的概率中的至少一个。
3.如权利要求1或2所述的系统,其中,在所述Q统计量超过所述Q阈值的多个连续实例导致所述模型失配的概率超过所述模型失配阈值的概率之后,所述模型失配和故障检测逻辑检测到模型失配。
4.如权利要求3所述的系统,其中,所述模型失配和故障检测逻辑还在检测到模型失配之后重新训练与所述电子设备相关联的多变量统计模型。
5.如权利要求1或2所述的系统,其中,在所述T2统计量超过所述T2阈值的多个连续实例导致所述故障的概率超过所述故障阈值的概率之后,所述模型失配和故障检测逻辑检测到所述电子设备的故障。
6.如权利要求5所述的系统,其中,如果尚未同时检测到模型失配,则所述模型失配和故障检测逻辑检测到所述电子设备的所述故障。
7.一种计算机实现的方法,包括:
由处理设备基于来自相对于电子设备定位的一个或多个传感器的与所述电子设备相关联的操作数据在时间段内计算至少两个模型度量,其中所述至少两个模型度量包括T2统计量和Q统计量;以及
由所述处理设备基于在所述时间段内计算出的T2统计量和Q统计量应用模型失配和故障检测逻辑,其中所述模型失配和故障检测逻辑:
经由T2计数器对计算出的T2统计量超过T2阈值的连续实例进行计数;
基于T2计数器更新所述时间段内与所述电子设备相关联的故障的概率;
经由Q计数器对计算出的Q统计量超过Q阈值的连续实例进行计数;
基于Q计数器更新所述时间段内与所述电子设备相关联的模型失配的概率;以及
基于故障阈值的概率和模型失配阈值的概率检测电子设备的故障或模型失配中的一个。
8.如权利要求7所述的计算机实现的方法,还包括:
至少基于从所述一个或多个传感器接收的训练数据建立主成分分析PCA模型,其中所述至少两个模型度量与所述PCA模型相关联。
9.如权利要求7或8所述的计算机实现的方法,其中,在所述Q统计量超过所述Q阈值的多个连续实例导致所述模型失配的概率超过所述模型失配阈值的概率之后,所述模型失配和故障检测逻辑检测到模型失配。
10.如权利要求7或8所述的计算机实现的方法,其中,在所述T2统计量超过所述T2阈值的多个连续实例导致所述故障的概率超过所述故障阈值的概率之后,所述模型失配和故障检测逻辑检测到所述电子设备的故障。
CN202010198832.4A 2019-03-22 2020-03-20 用于检测故障或模型失配的系统和方法 Active CN111721542B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US16/361,780 2019-03-22
US16/361,780 US11093315B2 (en) 2019-03-22 2019-03-22 Systems and methods for detecting a fault or a model mismatch

Publications (2)

Publication Number Publication Date
CN111721542A true CN111721542A (zh) 2020-09-29
CN111721542B CN111721542B (zh) 2022-08-30

Family

ID=72515939

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010198832.4A Active CN111721542B (zh) 2019-03-22 2020-03-20 用于检测故障或模型失配的系统和方法

Country Status (2)

Country Link
US (1) US11093315B2 (zh)
CN (1) CN111721542B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103761450A (zh) * 2014-02-24 2014-04-30 中国石油大学(华东) 一种基于模糊自适应预测的动态过程故障预报方法
CN103954914A (zh) * 2014-05-16 2014-07-30 哈尔滨工业大学 基于概率集成的锂离子电池剩余寿命直接预测方法
CN106707765A (zh) * 2017-02-27 2017-05-24 华东交通大学 高速动车组跟踪运行实时优化控制方法
CN109407654A (zh) * 2018-12-20 2019-03-01 浙江大学 一种基于稀疏深度神经网络的工业数据非线性因果分析方法
CN109981328A (zh) * 2017-12-28 2019-07-05 中国移动通信集团陕西有限公司 一种故障预警方法及装置

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5813317B2 (ja) 1979-07-05 1983-03-12 株式会社山武 偏位吸収装置
AU2001247336B2 (en) * 2000-03-10 2006-02-02 Smiths Detection, Inc. Control for an industrial process using one or more multidimensional variables
AU2003900857A0 (en) * 2003-02-26 2003-03-13 Commonwealth Scientific And Industrial Research Organisation Method and apparatus for characterising multiphase fluid mixtures
US7447609B2 (en) 2003-12-31 2008-11-04 Honeywell International Inc. Principal component analysis based fault classification
JP2007250748A (ja) * 2006-03-15 2007-09-27 Omron Corp プロセス異常分析装置および方法並びにプログラム
US7587296B2 (en) 2006-05-07 2009-09-08 Applied Materials, Inc. Adaptive multivariate fault detection
US8010321B2 (en) 2007-05-04 2011-08-30 Applied Materials, Inc. Metrics independent and recipe independent fault classes
US8924877B2 (en) * 2007-10-29 2014-12-30 Honeywell International Inc. Apparatus and method for displaying changes in statistical parameters in a process control system
US8676432B2 (en) 2010-01-13 2014-03-18 GM Global Technology Operations LLC Fault prediction framework using temporal data mining
JP5813317B2 (ja) 2010-12-28 2015-11-17 株式会社東芝 プロセス状態監視装置
US9110452B2 (en) * 2011-09-19 2015-08-18 Fisher-Rosemount Systems, Inc. Inferential process modeling, quality prediction and fault detection using multi-stage data segregation
US8959065B2 (en) * 2012-04-09 2015-02-17 Mitek Analytics, LLC System and method for monitoring distributed asset data
GB2501291A (en) 2012-04-19 2013-10-23 Project Vanguard Ltd Diagnostic system with predicted problem cause feedback
US10048996B1 (en) * 2015-09-29 2018-08-14 Amazon Technologies, Inc. Predicting infrastructure failures in a data center for hosted service mitigation actions
US20200041988A1 (en) * 2016-10-21 2020-02-06 Nec Corporation Display method, display device, and program
US11348018B2 (en) * 2017-12-19 2022-05-31 Aspen Technology, Inc. Computer system and method for building and deploying models predicting plant asset failure
US10354462B1 (en) * 2018-04-06 2019-07-16 Toyota Motor Engineering & Manufacturing North America, Inc. Fault diagnosis in power electronics using adaptive PCA
US11101641B2 (en) * 2018-09-24 2021-08-24 S&C Electric Company Fault protection devices and related reclosing methods

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103761450A (zh) * 2014-02-24 2014-04-30 中国石油大学(华东) 一种基于模糊自适应预测的动态过程故障预报方法
CN103954914A (zh) * 2014-05-16 2014-07-30 哈尔滨工业大学 基于概率集成的锂离子电池剩余寿命直接预测方法
CN106707765A (zh) * 2017-02-27 2017-05-24 华东交通大学 高速动车组跟踪运行实时优化控制方法
CN109981328A (zh) * 2017-12-28 2019-07-05 中国移动通信集团陕西有限公司 一种故障预警方法及装置
CN109407654A (zh) * 2018-12-20 2019-03-01 浙江大学 一种基于稀疏深度神经网络的工业数据非线性因果分析方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
ALKAYA ET AL: "Variance sensitive adaptive threshold-based PCA method for fault detection with experimental application", 《ISA TANSACTIONS》 *

Also Published As

Publication number Publication date
CN111721542B (zh) 2022-08-30
US20200301772A1 (en) 2020-09-24
US11093315B2 (en) 2021-08-17

Similar Documents

Publication Publication Date Title
US10223403B2 (en) Anomaly detection system and method
US10585774B2 (en) Detection of misbehaving components for large scale distributed systems
AU2018201487B2 (en) Method and system for health monitoring and fault signature identification
US10670648B2 (en) Systems and methods for determining whether a circuit is operating properly
US10481195B2 (en) Distributed IoT based sensor analytics for power line diagnosis
US20240010100A1 (en) Processing of status data of a battery for aging estimation
WO2011073613A1 (en) A method, apparatus and computer program for diagnosing a mode of operation of a machine
US7912669B2 (en) Prognosis of faults in electronic circuits
US9524223B2 (en) Performance metrics of a computer system
CN110570544A (zh) 飞机燃油系统故障识别方法、装置、设备和存储介质
US11313894B2 (en) Automobile battery failure prediction method and system
KR20170127430A (ko) 센서 오차를 검출, 분류 및/또는 완화하는 방법 및 시스템
CN103324155A (zh) 系统监控
CN113762391A (zh) 冷却系统的状态检测方法、装置、计算机设备和存储介质
US9397921B2 (en) Method and system for signal categorization for monitoring and detecting health changes in a database system
CN108362957B (zh) 设备故障诊断方法、装置、储存介质和电子设备
CN113487086B (zh) 设备剩余使用寿命预测方法、装置、计算机设备和介质
CN111721542B (zh) 用于检测故障或模型失配的系统和方法
CN113295399A (zh) 换流阀元件状态评估方法、装置、电子设备和存储介质
CN117235664A (zh) 配电通信设备的故障诊断方法、系统和计算机设备
US10733533B2 (en) Apparatus and method for screening data for kernel regression model building
CN113572639A (zh) 一种载波网络故障的诊断方法、系统、设备和介质
CN112799911A (zh) 一种节点健康状态检测方法、装置、设备及存储介质
CN117572159B (zh) 基于大数据分析的电力故障检测方法及系统
WO2022127597A1 (en) Methods and devices for anomaly detection

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20231206

Address after: Aichi Prefecture, Japan

Patentee after: Toyota Motor Corp.

Patentee after: University OF CONNECTICUT

Address before: Texas, USA

Patentee before: TOYOTA MOTOR ENGINEERING & MANUFACTURING NORTH AMERICA, Inc.

Patentee before: University OF CONNECTICUT