CN116736071A - 异常检测和保护 - Google Patents

异常检测和保护 Download PDF

Info

Publication number
CN116736071A
CN116736071A CN202310214609.8A CN202310214609A CN116736071A CN 116736071 A CN116736071 A CN 116736071A CN 202310214609 A CN202310214609 A CN 202310214609A CN 116736071 A CN116736071 A CN 116736071A
Authority
CN
China
Prior art keywords
electronic device
power rail
anomaly
rail
power
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310214609.8A
Other languages
English (en)
Inventor
张健学
张坤翔
舒为
艾隆杰·米塔尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tres Private Ltd
Original Assignee
Tres Private Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tres Private Ltd filed Critical Tres Private Ltd
Publication of CN116736071A publication Critical patent/CN116736071A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01RMEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
    • G01R31/00Arrangements for testing electric properties; Arrangements for locating electric faults; Arrangements for electrical testing characterised by what is being tested not provided for elsewhere
    • G01R31/28Testing of electronic circuits, e.g. by signal tracer
    • G01R31/2851Testing of integrated circuits [IC]
    • G01R31/2855Environmental, reliability or burn-in testing
    • G01R31/2872Environmental, reliability or burn-in testing related to electrical or environmental aspects, e.g. temperature, humidity, vibration, nuclear radiation
    • G01R31/2879Environmental, reliability or burn-in testing related to electrical or environmental aspects, e.g. temperature, humidity, vibration, nuclear radiation related to electrical aspects, e.g. to voltage or current supply or stimuli or to electrical loads
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01RMEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
    • G01R31/00Arrangements for testing electric properties; Arrangements for locating electric faults; Arrangements for electrical testing characterised by what is being tested not provided for elsewhere
    • G01R31/28Testing of electronic circuits, e.g. by signal tracer
    • G01R31/2851Testing of integrated circuits [IC]
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01RMEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
    • G01R19/00Arrangements for measuring currents or voltages or for indicating presence or sign thereof
    • G01R19/0046Arrangements for measuring currents or voltages or for indicating presence or sign thereof characterised by a specific application or detail not covered by any other subgroup of G01R19/00
    • G01R19/0053Noise discrimination; Analog sampling; Measuring transients
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01RMEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
    • G01R19/00Arrangements for measuring currents or voltages or for indicating presence or sign thereof
    • G01R19/165Indicating that current or voltage is either above or below a predetermined value or within or outside a predetermined range of values
    • G01R19/16533Indicating that current or voltage is either above or below a predetermined value or within or outside a predetermined range of values characterised by the application
    • G01R19/16538Indicating that current or voltage is either above or below a predetermined value or within or outside a predetermined range of values characterised by the application in AC or DC supplies
    • G01R19/16552Indicating that current or voltage is either above or below a predetermined value or within or outside a predetermined range of values characterised by the application in AC or DC supplies in I.C. power supplies
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01RMEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
    • G01R31/00Arrangements for testing electric properties; Arrangements for locating electric faults; Arrangements for electrical testing characterised by what is being tested not provided for elsewhere
    • G01R31/001Measuring interference from external sources to, or emission from, the device under test, e.g. EMC, EMI, EMP or ESD testing
    • G01R31/002Measuring interference from external sources to, or emission from, the device under test, e.g. EMC, EMI, EMP or ESD testing where the device under test is an electronic circuit

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Microelectronics & Electronic Packaging (AREA)
  • General Engineering & Computer Science (AREA)
  • Environmental & Geological Engineering (AREA)
  • Power Engineering (AREA)
  • Electromagnetism (AREA)
  • Health & Medical Sciences (AREA)
  • Toxicology (AREA)
  • Emergency Protection Circuit Devices (AREA)

Abstract

一种装置,用于检测包括至少两个集成电路的电子系统中的异常,并在必要的情况下消除/减轻该异常。异常检测基于感测连接到该至少两个集成电路的供电轨的电流、电压、或电流和电压两者的特性。当异常发生时,通过一个感测电路感测到该特性与电子系统正常工作时的特性不同来检测异常。

Description

异常检测和保护
相关申请的交叉引用
本申请要求于2022年3月8日递交的新加坡专利申请No.10202202290T的优先权的权益,其内容通过引用整体合并于此,以用于所有目的。
技术领域
各种实施例涉及用于检测电子系统中的异常并在可能的情况下消除或减轻该异常的电子设计。异常可能是由于辐射效应、失灵、计算错误等引起的。
背景技术
在一些应用中(包括地面和空间/卫星应用),电子系统(包括集成电路(IC)、片上系统(SoC)、系统级封装(SiP)等;此后统称为IC)的可靠性体现是最重要的设计考虑因素之一。为了增强电子系统的可靠性,检测异常的发生并在可能的情况下提供消除或减轻异常的手段是有用的。异常可能是由于辐射效应而引起的,辐射效应包括单粒子效应(单粒子闩锁(SEL)、单粒子瞬态和单粒子失常),或者包括总电离剂量、增强的低剂量率效应、中子和质子位移损伤。也可能是由于诸如失灵、计算错误等的非辐射效应故障而引起的。
在SEL异常的情况下,可能会在IC内引起短路,并且这可能导致IC丧失功能并损坏IC。SEL电流(短路电流)的范围很宽。当SEL电流很高(例如,工作电流的5倍)时,很容易借助于阈值(例如,4倍)低于SEL电流的电流传感器来检测到。当超过阈值(即,检测到异常)时,激活电力循环(将特定电力轨(或一些或全部电力轨)断开并重新连接到IC)以消除SEL。
除了SEL之外,还存在短路电流可能非常低(可能远低于IC的工作电流)的微型SEL。在诸如复杂的现场可编程门阵列(FPGA)的一些IC中,微型SEL(以及SEL)电流是可变的。因为其低电流和可变性,所以很难检测到。然而,因为IC中的SEL和微型SEL会损害可靠性,所以检测并消除IC中的SEL和微型SEL两者是重要的。
为了完整起见,诸如SoC(例如,FPGA)之类的复杂集成电路可以被认为是电子系统,并且被认为包括若干IC和/或若干电子器件。
此类异常也可能由于诸如失灵、计算错误等的其他故障而发生,并且随后带有故障的IC所汲取的电流的范围也很大。此类异常也可能难以检测。
到目前为止,对SEL和微型SEL的检测限于监测连接IC的一个引脚的一个电力轨[1]中的电流。还有一些采用机器学习(ML)来检测SEL和微型SEL的新兴尝试。然而,机器学习(ML)的尝试[2]类似地限于监控一个电力轨中的电流,而且算法过于简单,使得检测精度有限。
总之,需要检测IC和电子系统中的异常并且在可能的情况下消除或减轻该异常的更有效方法。
发明内容
根据本公开的一个方面,提供了一种装置,用于检测电子系统中的异常,并在必要的情况下消除/减轻该异常,该电子系统部分包括具有至少两个IC(其可以在一个复杂的IC(例如,FPGA)中)的COTS系统。异常可能是由于辐射效应或非辐射效应故障(诸如失灵和计算错误)引起的。异常检测基于感测电耦接到COTS系统的电流、电压、或电流和电压两者的特性,并且当异常发生时,通过一个感测电路感测到该特性与当电子系统正常工作时的特性不同来检测异常。
在一些实施例中,异常检测方法涉及处理单元(或信号处理电路)的使用,该处理单元(或信号处理电路)具有部分包括在COTS系统中的一个或两个IC或任何其他IC或任何电力管理电路的预表征异常特性。当异常发生时,处理单元将一个或两个IC、任何其他IC、或任何电力管理电路的预表征异常特性与由感测电路感测到的特性进行相关。
在一些实施例中,异常检测方法使COTS系统暂时或永久地与电源电分离,或将其放电至低电压,使得可以消除/减轻电子系统中的异常。
在一些实施例中,异常检测方法涉及模拟处理单元、数字处理单元或混合信号处理单元的使用。
在一些实施例中,异常检测方法涉及使两个感测电路感测电耦接到COTS系统的两个电流、电压、或电流和电压两者的特性。当异常发生时,通过该两个感测电路中的至少一个感测到该特性与电子系统正常工作时的特性不同来检测异常。
在一些实施例中,异常检测方法使一个感测电路感测电耦接到COTS系统的电流、电压、或电流和电压两者的特性,并使一个输出信号监测COTS系统上的工作条件状态。当异常发生时,通过感测电路感测到该特性来检测异常。还通过监测输出信号来检测异常,该输出信号是对COTS系统的工作条件的指示。
在一些实施例中,异常检测方法涉及将感测电路感测到的信号的特性的统计参数用于其异常检测,并且在必要的情况下,通过借助于对该统计参数进行标记、训练和加权的机器学习算法来促进异常检测。
附图说明
在附图中,相同的附图标记在不同的视图中通常指代相同的部分。附图不一定按比例绘制,相反,重点通常在于示出本发明的原理。在下面的描述中,参考以下附图来描述本发明的各种实施例,在附图中:
图1是电子系统的第一示例,该电子系统具有通过根据实施例感测供电轨以检测/鉴定COTS系统中的至少一个电子器件内发生的异常的异常检测方法。
图2的(A)部分是COTS系统内的具有连接器的板载电力管理(包括短路的无源板载电力管理)。
图2的(B)部分是在COTS系统内的具有DC-DC转换器的板载电力管理。
图3是根据本发明实施例的图1中的异常检测方法的框图。
图4是根据本发明实施例的图3中的异常检测方法的框图。
图5的(A)部分是异常特质(从FPGA中提取的SEL电流曲线)的示例。
图5的(B)部分是可能会受到其他条件(诸如温度变化、归因于I/O电路(和/或其他电路)的负载条件、以及由电力循环和恢复(重新启动条件)造成的影响)影响的建模后的异常特质的示例。
图6是根据本发明实施例的图4中的剖析在线异常特质框。
图7是对用于检测异常的七个剖析参数进行排序的示例。
图8是根据本发明实施例的图4中的异常检测框。
图9是电子系统的第二示例,该电子系统具有通过根据本发明实施例感测两个供电轨以检测/鉴定COTS系统中的至少一个电子器件内发生的异常的异常检测方法。
图10是电子系统的第二示例,该电子系统具有通过根据本发明实施例感测供电轨和/或监测COTS系统的输出以检测/鉴定COTS系统中的至少一个电子器件内发生的异常的异常检测方法。
具体实施方式
本文的描述参考附图,该附图以图示的方式示出了可以应用本发明的具体细节和实施例。详细描述这些实施例以使本领域技术人员能够提供本发明。
如本文中所使用的术语“和/或”包括相关列出项目中的一个或多个的任何和所有组合。
图1描绘了向我们发明的系统闩锁检测和保护(SLDAP)电路140以及COTS(商用现货)系统120提供电流(和/或电压)的电源100。COTS系统120可以是商业上可获得的(例如,GPS系统),或者可以是专有的(即,非商业上可获得的)。尽管本发明的SLDAP电路140在这里被描绘为相对于COTS系统120的单独的实体,但它可被并入到COTS系统120中。为了可读性,此后将本发明的SLDAP电路140描述为单独的实体。电子系统190包括我们发明的SLDAP电路140和COTS系统120。
电源100和COTS系统120可以经由电力轨102、供电轨104和开关106电耦接。电源100可以经由电力轨102、开关106和供电轨104向COTS系统120中的板载电力管理122供应组合电流(和/或电压)。板载电源管理122可以经由分布式电力轨124进一步分配电流(和/或电压)以对多个COTS IC供电(例如,从第一COTS IC(COTS-1 130)到第n COTS IC(COTS-n132))。
注意,COTS IC可以是商业上可获得,或者也可能是专有的。此外,如“背景技术”部分所述,诸如SoC(例如,FPGA)之类的复杂集成电路可以被认为是电子系统,并且被认为包括两个或更多个IC和/或两个或更多个电子器件。例如,COTS-1130和COTS-n 132可以是相同的集成电路,例如,FPGA的两个不同部分或两个电子器件。
分布式电力轨124可以形成单个子电力轨或形成两个或更多个子电力轨126至128的共同集合,以向各个COTS IC(或集成电路的不同部分)供应电流(和/或电压)。例如,子电力轨126可以供应电流(和/或电压)以对COTS-1 130供电,子电力轨128可以供应电流(和/或电压)以对COTS-n 132供电,并且其他子电力轨(未示出)可以供应电流(和/或电压)以对其他COTS IC(未示出)供电。子电力轨126和128以及其他子电力轨的电压可以相同,也可以不同。COTS系统120可以构成各种配置,诸如包括至少一个集成电路(例如,FPGA)或COTS IC的配置、COTS IC的评估板、在印刷电路板上具有多个COTS IC的复杂电子系统,并且它可以是商业上可获得的、专有的等。
电源100可以是电池,或来自包括DC-DC转换器、低压降(LDO)调节器等的另一电力管理系统。
可能需要感测/监测至COTS系统120中的板载电力管理122的组合电流(和/或电压)以用于异常(例如SEL或微型SEL)检测。对组合电流(和/或电压)的感测可以被放置在电力轨102或供电轨104上。为了说明,在图1中,对组合电流(和/或电压)的感测可以发生在供电轨104上,其中,可以如感测电路142向我们发明的系统闩锁检测和保护(SLDAP)电路140所指示的来感测/监测供电轨104中的电流(和/或电压);注意,感测电路142可以并入我们发明的SLDAP电路140中。
借助于感测电路142,SLDAP电路140可以执行必要的任务以确定(即,检测或识别)COTS系统120中的一个或多个COTS IC(例如,图1中从COTS-1130至COST-n 132的n个COTS中的一个或多个COTS)中是否发生异常。当检测到异常时,SLDAP电路140可以触发控制线144以对开关106进行电力循环。相反,在未检测到异常的情况下,控制线144可以保持开关106闭合,从而电耦接电力轨102和供电轨104。电力循环可以涉及将供电轨或电源的电压至少暂时地降低到预定电压。
如果对组合电流(和/或电压)的感测发生在电力轨102上,则可以重新定位感测电路142以用于感测电力轨102。借助于与电力轨102相关联的感测电路142,SLDAP电路140和开关106可以执行与之前描述的相同的异常检测操作。
为简单起见,将到COTS系统120的组合电流(和/或电压)称为组合感测参数,其中,该参数可以是电压或电流,或是电流和电压两者。注意,对于电流感测,感测电路142可以包括在供电轨104内插入电子元件(例如,小电阻器),其中,所述电子元件两端的电压是对流过该电子元件的电流的指示。
总的来说,开关106、感测电路142和SLDAP电路140共同地形成我们发明的被称为SLDAP装置180的实施例。此外,SLDAP电路180和COTS系统120构成电子系统190。
考虑SLDAP装置180,其中,目的是检测COTS系统120中(即,出现异常的至少一个COTS IC的至少一个引脚/焊盘(例如,VDD电压输入或I/O)中)的异常。例如,考虑子电力轨126将电流(和/或电压)供应到COTS-1130的引脚156中且子电力轨128将电流(和/或电压)供应到COTS-n 132的引脚158中的情况。当在引脚中发生异常时,该引脚中的电流(和/或该引脚处的电压)可能会经历非预期的瞬时的(和/或经历一段时间的)瞬态(在通常的非异常或标称(通常的)操作中不会发生此类瞬态的意义上而言,这是非预期的)。
该异常电流(和/或电压)具有异常特性,并且此后作为该引脚异常“特质”的基础。为了清楚起见,注意,此后“异常特性”和“异常特质”可互换使用。借助于机器学习(人工智能)等(参见后面的内容),该异常特质可以包括任何空间信号、时间信号、时间顺序信号和与瞬态相关联的推导,以及包括信号处理的角度(诸如在频域)和其他变换(直接的、间接的、线性的、非线性的、迭代的、递归的)。例如,当连接到子电力轨126的引脚156中发生SEL时,非预期的瞬时瞬态电流160(和/或电压)可以是COST-1130的引脚156的SEL(异常)特质的基础。
在一开始,注意,期望(但不是必须)获得COTS系统120中给定COTS IC和所有COTSIC 130至132的所有异常特质,以便于检测每个可能的异常。可以从关于感兴趣的引脚中的电流和该引脚处的电压两者的测量中获得COTS IC的特定引脚(例如3.3V VDD输入电源引脚、或I/O焊盘)的异常特质。由于当电流变化时(包括在异常期间),电压经常会过冲和/或下冲,因此这种也在电压域中的异常特质可以是有用的。异常特质还可以包括在发生异常之前的电流(和/或电压)瞬态和/或波形、在发生异常的时刻的瞬时电流(和/或电压)、以及以及在发生异常这一情况之后的瞬时电流(和/或电压),即包含一系列电流(和/或电压)采样的时间帧。异常特质还可以包括使用来自时域的电流(和/或电压)瞬态等的频域变换。
如果不能从测量中获得COTS IC的引脚的特定异常特质,则可以将“伪”异常特质(诸如不规则电流浪涌(和/或电压瞬态)的曲线)假定为异常特质的基础;不规则可以被解释为非预期的,即,不像通常(即非异常)的标称“无错误”操作,或超出COTS IC正常工作时所预期或已知的情况。此外,还可以从诸如机器学习等的数据科学中建模、或假设、或估计、或获得特定异常特质。此后,术语“异常特质”将包括从诸如机器学习等的数据科学中测量、建模、假设、估计或获得的特质。
注意,典型的COTS IC具有若干供电轨焊盘/引脚和I/O焊盘/引脚(例如,相同或不同的VDD且具有相同或不同的电压、模拟VDD、数字VDD等)。异常可以发生在多于一个供电轨和连接到子电力轨126至128之一的分布式电力轨中。在以下的描述中,当提及特定子电力轨时,假定存在以下可能性:所提及的子电力轨可以包括COTS IC的一个以上的子电力引脚或焊盘,并且各个子电力轨可以有相同或不同的电压。此外,如前所述,诸如SoC(例如,FPGA)之类的复杂集成电路可以被认为是电子系统,并且被认为包括两个或更多个IC和/或两个或更多个电子器件。
异常特质的基础是当COTS-1130出现异常时子供电轨126中的电流(和/或子供电轨126的电压)。当异常发生时,子供电轨126中的异常特质也会出现在分布式电力轨124中,可能在一些有关形式上相同、或有关、或相关、或相似(被称为“相似异常特质”)。例如,非预期的瞬时瞬态电流162(和/或电压)可以是分布式电力轨124中的与作为子供电轨126中的异常特质的非预期的瞬时瞬态电流160(和/或电压)具有某种相关形式(例如,以某种方式具有某种相关性)的相似异常特质。分布式电力轨124中的电流和/或分布式电力轨124的电压还将包括包含COTS-2(未示出)至COTS-n 132的其他COTS IC中的工作电流(和/或该其他COTS IC的电压)的瞬态(和稳态)。
在供电轨104中,将存在“进一步相似异常特质”,该特质在某种形式上可以与分布式电力轨124中的所述相似异常特质和/或与子电力轨126中的异常特质相同、有关、相关或相似。例如,非预期的瞬时瞬态电流164(和/或电压)可以是进一步相似异常特质的基础。类似地,可能存在着:供电轨104中的工作电压和电流的瞬态(和稳态)可以与所述COTS IC(包括COTS-2(未示出)至COTS-n 132)的工作电压和电流在某种形式上相同、有关、或相关、或相似。简而言之,当在COTS系统120中的COTS-1130发生异常时,供电轨104中的组合电流和供电轨104的电压将会包括以下两者:某种形式的进一步相似异常特质(参见后面的内容)、以及COTS系统120中的COTS-2(未示出)至COTS-n 132的工作(暂态和稳态)电流(和/或电压)。
注意,响应于COTS系统120内任何一个COST IC上的异常事件,异常特质、相似异常特质、进一步相似异常特质可以被认为是实时的,在相同时间或几乎在相同时间发生。为简单起见,使用在线异常特质,该在线异常特质指实时异常特质、实时的相似异常特质、或实时的进一步相似异常特质。
异常特质、相似异常特质和进一步相似异常特质可以是预先确定的/预表征的(它们可以通过从诸如机器学习等的数据科学中测量、建模、假设、估计或获得)。
简而言之,SLDAP装置180基于识别出供电轨104中存在着在线特质(例如,图1中的进一步相似异常特质164)来确定在COTS系统120中已经发生异常。这意味着供电轨104中的电流(和/或电压)的瞬态(如前所述,瞬时值或值的帧、转换等)与预表征异常特质“充分相似”;将在后面的信号处理部分中对“充分相似”进行描述。简而言之,SLDAP装置180通过以某种形式识别供电轨104中的进一步相似异常特质(电流和/或电压)来检测COTS系统120中的异常。
现在考虑板载电力管理122仅是图2的(A)部分中的无源连接器(短路),并且子供电轨126中发生异常的情况。因为板载电力管理122是短路,所以供电轨104中的进一步相似异常特质将很大程度上与分布式电力轨124中的相似异常特质相同,并且与子电力轨126中的异常特质相同。
考虑图2的(B)部分中的板载电力管理122是有源的(例如,具有DC-DC转换器),并且子供电轨126中发生异常的情况。供电轨104中的进一步相似异常特质将可能是不同的,但仍然在某种形式上与分布式电力轨124中的相似异常特质以及与子供电轨126中的异常具有一些相似性,或与其有关或相关。
板载电力管理122可以具有其他配置,具有由供电轨104供电的多个DC-DC转换器(或电路)以提供多于一个分布式电力轨或子电力轨,或具有多个DC-DC电路以提供一个或多个分布式电力轨或子供电轨。尽管有这些各种不同的配置,供电轨104中的进一步相似异常特质将可能是不同的,但仍然在某种形式上与分布式电力轨中的相似异常特质以及与子电力轨中的异常特质具有一些相似性,或与其有关或相关。
为了完整起见,注意,板载电力管理中也可以发生异常。在此,上面描述的SLDAP装置180的检测机制将会同样适用。
图3描绘了SLDAP装置180的构建框,该SLDAP装置180具有开关106、具有传感器(例如,电阻器)Rsense 302的感测电路142、具有电流转换电路304和信号处理电路306的SLDAP电路140。注意,电流转换电路304也可以是电压转换电路,或是电流转换电路和电压转换电路两者。为简洁起见,下面的描述主要针对电流,注意,感兴趣的信号也可以是电压,或是电流和电压的组合。
传感器Rsense302用于感测流入到COTS系统120中的组合电流。可以通过测量Rsense两端的电压(V)并将V除以Rsense来实现感测。感测操作可以通过包括在感测电路142中的比较器来实现。电流转换电路304将组合电流处理成处理后的组合电流,以使得信号处理电路306能够识别、检测或鉴定COTS系统120中的任何COTS IC中是否已经发生异常。从组合电流获得的处理后的组合电流可以是数字形式或模拟/混合信号形式。信号处理电路306可以以数字模态、或以模拟/混合信号模态、或以组合的数字和模拟/混合信号模态来对处理后的组合电流进行处理。
针对基于数字模态的说明,图4描绘了具有SLDAP电路140的构建框,该SLDAP电路140具有作为模数电路的电流转换电路304和信号处理电路306,信号处理电路306包括预表征异常特质框410、剖析在线异常特质框412和异常检测框414。预表征异常特质框410存储预表征异常特质。剖析在线异常特质框410将处理后的组合电流剖析为有用的在线异常特质,使得异常检测框414可以对预表征异常特质和在线异常特质之间的相似性进行相关。如果预表征异常特质和在线异常特质之间的相似性高(即,可以观察到COTS系统120中发生异常的可观察性),则SLDAP电路140可以被配置为触发控制线144以对开关106进行电力循环,启动对COTS系统120的电力循环。
图5的(A)部分描绘了借助于激光测试从FPGA提取的(例如,SEL的)异常特质502的示例。异常特质可以从其他IC(例如,可能在辐射下经历诸如SEL之类的异常的微控制器、混合信号芯片、定制/专有IC)中提取。
注意,用于预表征的IC可以与COTS系统120中包括的IC相同,也可以不同。为了改进异常检测,期望预表征异常特质的数据库很大,包括尽可能多的不同条件,并关于任何其他器件(即,不一定是图1中的COTS系统120中的相同器件)。例如,在辐射效应的情况下,使数据库包括来自各种辐射(包括重离子、质子、中子、光子、X射线、电子束等)的异常特质是有用的。图5的(B)部分描绘了可能会受到其他条件(诸如温度变化、归因于I/O电路(和/或其他电路)的负载条件、以及由电力循环和恢复(重新启动条件)造成的影响)影响的建模后的异常特质504的示例。SEL特质502和504是基于电流-时间曲线的。异常特质502和504可以被转换为其他曲线(包括在频域中的曲线)。
图6描绘了剖析在线异常特质框412。剖析过程可以利用基于处理后的组合电流的统计参数(该剖析被称为“按统计参数剖析”602)。使用的参数可以是最大值、最小值、平均值、方差、标准方差、偏度、峰度、中值绝对偏差(MAD)、k统计量、以及这些统计参数的任何组合。这些统计参数在文献中被很好地确认。
剖析过程可以利用基于处理后的组合电流的变化率(这种剖析被称为“按变化率剖析”604。变化率可以被定义为R=函数1的单位变化除以函数2的单位变化。函数1与处理后的组合电流有关,并且函数2与时间单位有关。例如,可能的第一变化率可以被定义为R1=ΔI/Δt,其中I是处理后的组合电流,t是时间,ΔI是组合电流的变化,并且Δt是单位时间变化。可能的第二变化率被定义为R2=ΔIi 2/Δt,其中,Ii 2是处理后的组合电流的平方,t是时间,ΔIi 2是处理后的组合电流的平方的变化,并且Δt是单位时间变化。可能的第三变化率指标(merit)可以被定义为R3=ΔIi 2/Δt2,其中Ii 2是处理后的组合电流的平方,t2是时间的平方,ΔIi 2是处理后的组合电流平方的变化,Δt2是时间的平方的变化。通过对函数1和函数2执行数学变换(例如,加法、减法、乘法和除法),各种其他方式也是可能的。
来自按统计参数剖析602或按变化率剖析604的剖析后的参数可以由特征提取管理604来进一步管理。特征提取管理604可以优先考虑哪些剖析后的参数(或特征)对异常检测具有可能最高的影响。图7描绘了通过对七个剖析后的参数进行排序的示例,该七个剖析后的参数包括用于异常(例如,SEL)检测的MAD 702、标准差(STD)704、平均值706、最大值(MAX)708、K统计量710、方差(VAR)712和最小值(Min)。针对该示例,评估指示MAD 702具有最高影响,而Min 714具有最低影响。话虽如此,保守的方法可以包括将所有这些参数共同用于异常检测(以更高的处理需求为代价),并且定制的方法可以包括将前四个参数用于SEL的检测。
图8描绘了具有异常检测建模子框802和异常阈值子框804的异常检测框414。异常检测建模子框802对预表征异常特质和剖析在线异常特质共同进行分析,旨在提取与异常有关的显着特征。建模算法可以涉及借助于对在线异常特质进行标记、训练和加权的机器学习算法。机器学习检测算法可以包括决策树、随机森林、朴素贝叶斯、支持向量机、K最近邻(KNN)、或卷积神经网络(CNN)。异常阈值激活子框804可以确定异常阈值(异常阈值806),异常阈值806被视为当监测COTS系统120以寻找异常时,通过SLDAP装置180观察到的可能异常。
异常阈值806的值可以取决于建模算法和/或剖析后的参数。例如,对统计参数使用随机森林算法,异常检测决策是二元的,例如,对于COTS系统120中的可能异常事件,异常阈值806被断言为“1”(或“0”),或否则对于在COTS系统120中观察到的非异常事件,则被断言为“0”(或“1”)。对于另一示例,对统计参数使用KNN算法,异常检测决策是概率,例如,对于COTS系统120中的可能异常事件,异常阈值806被计算为>50%,或否则对于COTS系统120中观察到的非异常事件,被计算为<50%。对于又一示例,使用基于变化率参数的相关性算法,异常阈值806是相关性系数,如果相关性系数大于非异常操作与异常操作之间的幅度变化的2倍,则该相关性系数被认为是COTS系统120中的可能异常。否则,将认为是非异常事件。
一旦确定了可能的异常,SLDAP电路140就可以触发控制线144,并且可以针对如何激活控制线144来调整持续时间。
图9进一步描绘了包括本发明的SLDAP装置980和COTS系统920的电子系统990的第二实施例,该SLDAP装置980和COTS系统920是通过连接到两个电源(电源100和电源900)的两条供电轨供电的。注意,尽管电源100和电源900被描绘为两个实体,但它们可以是同一实体。电源100和电源900的电压可以相同也可以不同。为了便于与图1进行对照,在相关情况下,现在在图9中用前面的“第一”来指代图1中的各种实体。
在本发明的该实施例中,SLDAP装置980具有第一电力轨102、第一供电轨104、第二电力轨902和第二供电轨904。第一电力轨102和第二电力轨902可以分别连接到电源100和电源900。第一供电轨104可以经由开关106电耦接到第一电力轨102,并且第二供电轨904可以经由开关906电耦接到第二电力轨902。第一供电轨104和第二供电轨904两者连接到COTS系统920中的板载管理922。
第一感测电路142可以感测第一供电轨104上的组合感测参数,并且感测电路942可以感测第二供电轨904上的组合感测参数。借助于感测电路142和/或感测电路942,SLDAP电路940可以执行必要的任务以确定(即,检测或识别)图9中的n个COTS(COTS系统920中的COTS-1130至COTS-n 132)中的一个或多个COTS中是否已经发生异常。当检测到异常时,SLDAP电路940可以触发控制线144来对开关106进行电力循环,或触发控制线944来对开关906进行电力循环,或触发控制线144和944两者来对开关106和906两者进行电力循环。相反,在未检测到异常的情况下,控制线144可以保持开关106闭合,并且控制线944可以保持开关906闭合,从而电耦接第一电力轨102和第一供电轨104,并电耦接第二电力轨902和第二供电轨104。SLDAP电路940的信号处理电路内的异常检测可以利用第一电力轨104上的组合感测参数和/或第二电力轨904上的组合感测参数。
在本发明的第二实施例的第一变型中,本发明的SLDAP装置980可以通过使第一电力轨104上的组合感测参数和第二电力轨904上的组合感测参数进行相关来改进其对COTS系统920中的异常的检测。
在本发明的第二实施例的第二变型中,本发明的SLDAP装置980可以通过利用本发明的第一实施例(及其各种变型)来对第一供电轨104上的组合感测参数进行相关,以改进其对COTS系统920中的异常的检测。
图10描绘了本发明的第三实施例,其中,图1中的电子系统190现在被重新配置为电子系统1090。在电子系统1090中,COTS系统1003的输出被输入(或反馈)到本发明的SLDAP装置180。在本发明的该第三实施例中,本发明的SLDAP 180可以识别当COTS系统1003的输出是非预期的时(即,输出信号是异于平常的或非预期的)在COTS系统120中已经发生了异常。例如,考虑COTS系统120,其预期输出范围从00:00:00:00到23:59:59:59的时间信号。然而,如果COTS系统120输出超出这些限制的信号,则本发明的SLDAP装置180可以假设COTS系统120中的COTS IC之一已经出现异常。在另一示例中,如果同一COTS系统120非预期地输出重复的时问信号,则本发明的SLDAP装置180可以类似地假设COTS系统中的COTS IC之一已经出现异常。在又一示例中,COTS系统1003的输出被预期为每10ms脉冲一个信号。然而,如果它没有每10ms脉冲一次,则该输出可以被认为是非预期的或异于平常的(即,异常)。当本发明的SDLAP装置180检测到异常的发生时,它将随后通过借助于第一控制线144打开第一开关106来对COTS系统120进行电力循环。
在本发明的第三实施例的第一变型中,本发明的SLDAP 180可以通过利用本发明的第一实施例(及其各种变型)来对COTS系统1003的输出进行相关,以改进其对COTS系统120中的异常的检测。
在本发明的第三实施例的第二变型中,本发明的SLDAP 180可以通过利用本发明的第二实施例(及其各种变型)来对COTS系统1003的输出进行相关,以改进其对COTS系统120中的异常的检测。
尽管在上面的大多数描述中,电流是感测参数,但请注意,电流和电压两者都可以被感测。此外,还可以感测电流和/或电压的变型,例如,与其差分或积分版本。
此外,在与电流和/或电压有关的大多数描述中,并且在大多数情况下,在时域中提及。注意,这些信号可被处理到频域中,并通过各种信号处理算法进行处理。
尽管已经参考特定实施例来具体地示出和描述了本发明,但是本领域普通技术人员应当理解的是,在不脱离本发明构思的精神和范围的情况下,可以进行形式和细节上的多种改变。
参考文献:
[1]J.S.Chang,W.Shu,and J.Jiang,“Electronic Circuit for Single-EventLatch-up Detection and Protection,”US Patent No.10,566,780,18Feb 2020.
[2]Dorise,C.Alonso,A.Subias,L.Trave-Massuyes,L.Baczkowski,andF.Vacher,“Machine Learning as an Alternative to Thresholding for SpaceRadiation High Current Event Detection,”IEEE Trans.Nuclear Science,Sep 2021.
[3]S.M.Mousavi,W.L.Ellsworth,W.Zhu,L.Y.Chuang,and G.C.Beroza,“Earthquake transformer-an attentive deep learning model for simultaneousearthquake detection and phase picking,”Nature Communications,Aug 2020.
[4]A.Nasle,“Real-time prediective systems for intelligent energymonitoring and management of electrical power networks,”US Patent No.9,031,824,12May 2015。

Claims (15)

1.一种用于检测电子系统中的异常的装置,包括:
电力轨,连接在电源和供电轨之间,
所述供电轨,连接到分布式电力轨,
所述分布式电力轨,连接到第一子供电轨和第二子供电轨,
第一电子设备和第二电子设备,
所述第一子供电轨,连接到所述第一电子设备的第一引脚和/或所述第二电子设备的第一引脚,
所述第二子供电轨,连接到所述第一电子设备的第二引脚或所述第二电子设备的第二引脚,
信号处理系统,包括感测电路,
所述感测电路感测所述电力轨或所述供电轨的电流、电压、或电流和电压两者的特性,以及
当所述异常发生在所述第一电子设备、所述第二电子设备、或所述第一电子设备和所述第二电子设备两者中时,通过所述感测电路感测到所述特性与所述电子系统正常工作时的特性不同来检测所述异常。
2.根据权利要求1所述的装置,其中
所述信号处理系统还包括处理单元,
所述处理单元具有所述第一电子设备和/或所述第二电子设备和/或任何其他电子设备的预先表征的异常特性,
所述预先表征是能够通过测量、估计、建模、机器学习方法、或这些方法的组合来获得的,以及
当所述异常发生时,所述异常还能够是借助于以下方式检测的:所述处理单元将所述第一电子设备、所述第二电子设备、任何其他电子设备、或所述第一电子设备和所述第二电子设备和所述任何其他电子设备的组合的预先表征的异常特性与由所述感测电路感测到的信号的特性进行相关。
3.根据权利要求1所述的装置,其中,所述异常是由于所述第一电子设备或所述第二电子设备中的辐射效应或故障引起的,其中
所述辐射效应包括:
单粒子效应,所述单粒子效应包括单粒子闩锁、单粒子瞬态和单粒子翻转,或
总电离剂量,或
增强的低剂量率效应,或
中子和质子位移损伤,以及
所述故障包括:
失灵,或
计算错误。
4.根据权利要求1所述的装置,其中,当检测到所述异常时,
将所述供电轨的电压至少暂时地降低或放电到预定电压,或者
借助于将所述供电轨与所述电力轨断开一段时间并且然后将所述供电轨与所述电力轨重新连接来暂时禁用所述供电轨,或借助于将所述供电轨与所述电力轨断开来永久禁用所述供电轨。
5.根据权利要求4所述的装置,其中
断开、连接、或所述断开和所述连接两者是借助于放置在所述电力轨和所述供电轨之间的开关来实现的,
其中,所述开关是电子的或机械的、或是电子和机械的组合。
6.根据权利要求1所述的装置,其中,电力管理电路放置在所述供电轨和所述分布式电力轨之间,以及
所述异常现在还能够来自所述电力管理电路。
7.根据权利要求6所述的装置,其中,当异常发生时,
所述第一电子设备、所述第二电子设备、或任何其他电子设备的所述预先表征的异常特性能够与所述感测电路在所述电力轨或所述供电轨处感测到的信号的特性相同或不同,以及
如果不同,
所述第一电子设备、所述第二电子设备、或所述任何其他电子设备的所述预先表征的异常特性、或由于电子设备的组合导致的异常特性与所述感测电路感测到的信号的特性相关、或以某种方式相似、或有关。
8.根据权利要求1所述的装置,其中,所述电子系统还包括:
另一电力轨,连接到所述电源和另一供电轨,
所述电力轨和所述另一电力轨能够具有相同或不同的电压,
所述另一供电轨,连接到另一分布式电力轨,
所述另一分布式电力轨,连接到另一第一子供电轨和另一第二子供电轨,
所述另一第一子供电轨,连接到所述第一电子设备的第三引脚或所述第二电子设备的第三引脚,
所述另一第二子供电轨,连接到所述第一电子设备的第四引脚或所述第二电子设备的第四引脚,
所述信号处理系统还包括另一感测电路,
所述另一感测电路感测所述另一第一电力轨或所述另一第一供电轨的电流、电压、或电流和电压两者的特性,以及
当所述异常发生在所述第一电子设备、所述第二电子设备、或所述第一电子设备和所述第二电子设备两者中时,通过所述感测电路、所述另一感测电路、或所述感测电路和所述另一感测电路两者感测所述另一第一电力轨或所述另一第一供电轨的特性与当所述电子系统正常工作时的特性不同来检测所述异常。
9.根据权利要求8所述的装置,其中,当所述异常发生时,所述异常还能够是借助于所述处理单元将以下各方面中的任何方面相关来检测的:
所述第一电子设备、所述第二电子设备、所述任何其他电子设备、或所述第一电子设备和所述第二电子设备和所述任何其他电子设备的组合的预先表征的异常特性,
所述感测电路感测到的信号的特性,或
所述另一感测电路感测到的信号的特性。
10.根据权利要求2所述的装置,其中,所述电子系统具有输出,其中,所述输出被输入到所述处理单元,以及
所述处理器单元通过检测所述输出中的信号是异于平常的或非预期的来检测所述电子系统中的异常。
11.根据权利要求2所述的装置,其中
所述处理单元具有相关性阈值,以及
当相关性超过所述相关性阈值时,检测到所述异常。
12.根据权利要求11所述的装置,其中
所述处理单元将所述感测电路感测到的信号的特性的统计参数用于所述处理单元的异常检测,
其中,所述统计参数能够包括从感测到的信号的特性导出的以下参数中的任何一个或其组合:
感测到的信号的特性的最小值、最大值、平均值、方差、偏度、峰度、标准方差、中值绝对偏差MAD、k统计量、以及各种变化率。
13.根据权利要求12所述的装置,其中,通过借助于对所述统计参数进行标记、训练和加权的机器学习算法来促进异常检测,以及
所述机器学习算法能够包括以下算法中的一种或多种、或其组合:决策树、随机森林、朴素贝叶斯、支持向量机、K最近邻、以及卷积神经网络。
14.根据权利要求13所述的装置,其中
借助于所述机器学习算法,所述相关性阈值是基于概率的,以及
其中,当所述相关性阈值超过50%时,就假设发生了所述异常。
15.根据权利要求12所述的装置,其中
用于异常检测的算法基于相关性系数,以及
所述相关性阈值大于响应于异常发生的相对于异常未发生而增加的相关性系数的两倍。
CN202310214609.8A 2022-03-08 2023-03-07 异常检测和保护 Pending CN116736071A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
SG10202202290T 2022-03-08
SG10202202290T 2022-03-08

Publications (1)

Publication Number Publication Date
CN116736071A true CN116736071A (zh) 2023-09-12

Family

ID=87556002

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310214609.8A Pending CN116736071A (zh) 2022-03-08 2023-03-07 异常检测和保护

Country Status (3)

Country Link
US (1) US20230288470A1 (zh)
EP (1) EP4242669A1 (zh)
CN (1) CN116736071A (zh)

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7907378B2 (en) * 2005-10-20 2011-03-15 Microchip Technology Incorporated Automatic detection of a CMOS device in latch-up and cycling of power thereto
US20070091527A1 (en) * 2005-10-20 2007-04-26 Microchip Technology Incorporated Automatic detection of a CMOS circuit device in latch-up and reset of power thereto
US9582349B1 (en) * 2014-08-20 2017-02-28 Altera Corporation Methods and apparatus for detecting memory bit corruption on an integrated circuit
US9960593B2 (en) * 2015-07-31 2018-05-01 Harris Corporation Single event latchup (SEL) current surge mitigation
US10886723B2 (en) * 2015-07-31 2021-01-05 Harris Corporation Adaptive single event latchup (SEL) current surge mitigation
US10289178B1 (en) * 2017-04-04 2019-05-14 Xilinx, Inc. Configurable single event latch-up (SEL) and electrical overvoltage stress (EOS) detection circuit

Also Published As

Publication number Publication date
EP4242669A1 (en) 2023-09-13
US20230288470A1 (en) 2023-09-14

Similar Documents

Publication Publication Date Title
Hajji et al. Multivariate feature extraction based supervised machine learning for fault detection and diagnosis in photovoltaic systems
US10158220B2 (en) Triple redundant digital protective relay and operating method therefor
Adnan et al. On expected detection delays for alarm systems with deadbands and delay-timers
WO2020015277A1 (zh) 一种基于全景信息的弧光故障识别装置及方法
Huang et al. Dynamic detection of transmission line outages using hidden Markov models
US10606919B2 (en) Bivariate optimization technique for tuning SPRT parameters to facilitate prognostic surveillance of sensor data from power plants
CN103140811A (zh) 用于检测并且去除传感器信号脉冲干扰的系统、方法和设备
CN112531632B (zh) 一种服务器中低成本防烧板保护方法及装置
Li et al. Voltage sensor validation for decentralized power system monitor using polynomial chaos theory
CN116736071A (zh) 异常检测和保护
Wielgosz et al. Looking for a correct solution of anomaly detection in the LHC machine protection system
CN113568494B (zh) 一种硬盘供电电压的检测装置
US11932131B2 (en) Electric vehicle charging monitoring device and method
US10474142B2 (en) Detection of cross-country faults
Wang et al. Free Probability Theory Based Event Detection for Power Grids using IoT-Enabled Measurements
Cannon et al. Modeling common cause failures in systems with triple modular redundancy and repair
US11682896B2 (en) Fault detection in redundant power supplies
Wallace et al. Identification of state parameters for stealthy cyber-events in the power grid using PCA
Zhang et al. PCA-based analog fault detection by combining features of time domain and spectrum
Wang et al. Estimation of failure on-demand probability and malfunction rate values in cyber-physical systems of nuclear power plants
Hsiao et al. Considering ICT in reliability assessment of system protection scheme
Azriyenni et al. Fuzzy Neural Network for Classification Fault In Protection System
Rahmat et al. Reliability Comparison of Uninterruptible Power Supply (UPS) System Configurations
Kokorin et al. Maintenance of protective relays
Butler et al. A neural net based approach for fault diagnosis in distribution networks

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication