CN104991629A - 电源失效侦测系统与其方法 - Google Patents

电源失效侦测系统与其方法 Download PDF

Info

Publication number
CN104991629A
CN104991629A CN201510405799.7A CN201510405799A CN104991629A CN 104991629 A CN104991629 A CN 104991629A CN 201510405799 A CN201510405799 A CN 201510405799A CN 104991629 A CN104991629 A CN 104991629A
Authority
CN
China
Prior art keywords
power
fail
power supply
processing unit
central processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510405799.7A
Other languages
English (en)
Other versions
CN104991629B (zh
Inventor
黄建新
韩应贤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inventec Pudong Technology Corp
Inventec Corp
Original Assignee
Inventec Pudong Technology Corp
Inventec Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inventec Pudong Technology Corp, Inventec Corp filed Critical Inventec Pudong Technology Corp
Priority to CN201510405799.7A priority Critical patent/CN104991629B/zh
Publication of CN104991629A publication Critical patent/CN104991629A/zh
Priority to US14/931,824 priority patent/US9778988B2/en
Application granted granted Critical
Publication of CN104991629B publication Critical patent/CN104991629B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/28Supervision thereof, e.g. detecting power-supply failure by out of limits supervision
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/30Means for acting in the event of power-supply failure or interruption, e.g. power-supply fluctuations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0751Error or fault detection not based on redundancy
    • G06F11/0754Error or fault detection not based on redundancy by exceeding limits
    • G06F11/076Error or fault detection not based on redundancy by exceeding limits by exceeding a count or rate limit, e.g. word- or bit count limit
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1415Saving, restoring, recovering or retrying at system level
    • G06F11/1417Boot up procedures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2015Redundant power supplies
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/805Real-time
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/85Active fault masking without idle spares

Abstract

本发明提供一种电源失效侦测系统与其方法,其中电源失效侦测系统包含主板、板卡、复杂可编程逻辑器件与基板管理控制器模块,其中主板包含中央处理单元电源与非中央处理单元电源,板卡包含板卡电源,基板管理控制器模块包含缓存器。复杂可编程逻辑器件用于当发生电源失效时,执行关机程序;识别电源失效类型,并根据电源失效类型判断是否执行重启程序。若执行重启程序,当重启程序的次数达到默认次数,复杂可编程逻辑器件记录锁定讯息于缓存器。基板管理控制器模块用于记录重启程序的次数,根据锁定讯息执行锁定程序。

Description

电源失效侦测系统与其方法
技术领域
本发明涉及一种侦测技术,特别是涉及一种电源失效侦测系统与其方法。
背景技术
当服务器(Server)内部电源出现问题(例如无法开机上电、开机掉电、按下开关按钮风扇转动后掉电等现象)的时候,以往需要透过使用示波器(Oscilloscope)或者三用电表(Multimeter)依序量测开机时序(Power-on sequence)的电源良好(Power good)讯号以及致能(Enable)讯号等相关讯号来判断电源问题发生在哪一个电源上而导致无法开机。
然而,当服务器组成系统之后,由于主机已经安装于机箱内部,若发生上述问题则难以利用上述的示波器或者三用电表量测开机时序讯号,因此无法在短时间之内判断电源问题发生在哪一个电源上,或者电源问题是否为假性的电源故障(Power fault),例如由于其他的系统配置(Configuration)所造成的错误。
发明内容
鉴于以上所述现有技术的缺点,本发明的目的在于提供一种电源失效侦测系统与其方法,以实现能够识别出服务器系统发生的电源问题,并且实时处理以排除假性的电源故障,进而解决造成的无法开机的问题。
为实现上述目的及其他相关目的,本发明揭示内容之一方案是提供一种电源失效侦测系统,其包含主板(Motherboard)、板卡、复杂可编程逻辑器件(Complex Programmable LogicDevice,CPLD)与基板管理控制器(Baseboard Management Controller,BMC)模块,其中主板包含中央处理单元(Central Processing Unit,CPU)电源与非中央处理单元电源,板卡包含板卡电源,基板管理控制器模块包含缓存器(Register),缓存器电性耦接复杂可编程逻辑器件。复杂可编程逻辑器件用以当发生电源失效时,执行关机(Shutdown)程序;识别电源失效类型,并根据电源失效类型判断是否执行重启(Restart)程序,电源失效类型表示电源失效发生在中央处理单元电源、非中央处理单元电源或板卡电源;若执行重启程序,当重启程序的次数达到默认次数时,记录锁定讯息于缓存器中。基板管理控制器模块用以记录所述重启程序的次数,根据锁定讯息执行锁定程序。
本揭示内容之一实施例中,其中当复杂可编程逻辑器件记录锁定讯息于缓存器中时,传送缓存器的位置讯息至基板管理控制器模块,基板管理控制器模块根据位置讯息读取缓存器的锁定讯息。
本揭示内容之一实施例中,其中当电源失效类型表示电源失效发生在中央处理单元电源时,复杂可编程逻辑器件记录所述锁定讯息于缓存器中。
本揭示内容之一实施例中,其中当电源失效类型表示电源失效发生在板卡电源或非中央处理单元电源时,复杂可编程逻辑器件执行重启程序。
本揭示内容之一实施例中,其中复杂可编程逻辑器件用以经由电源扫描程序记录电源失效发生在中央处理单元电源、非中央处理单元电源或板卡电源内部的电源失效位置。
本发明之另一方案是提供一种电源失效侦测方法,其包含以下步骤:当发生电源失效时,执行关机程序;识别电源失效类型,并根据电源失效类型判断是否执行重启程序,其中电源失效类型表示电源失效发生在主板的中央处理单元电源、主板的非中央处理单元电源或板卡电源;若执行重启程序,当重启程序的次数达到默认次数时,记录锁定讯息于缓存器中,并透过基板管理控制器模块记录重启程序的次数;透过基板管理控制器模块根据所述锁定讯息执行锁定程序。
本揭示内容之一实施例中,还包含:当记录锁定讯息于缓存器中时,传送缓存器的位置讯息至基板管理控制器模块,基板管理控制器模块根据位置讯息读取缓存器的锁定讯息。
本揭示内容之一实施例中,还包含:当电源失效类型表示电源失效发生在中央处理单元电源时,记录锁定讯息于缓存器中。
本揭示内容之一实施例中,还包含:当电源失效类型表示电源失效发生在板卡电源或非中央处理单元电源时,执行重启程序。
本揭示内容之一实施例中,还包含:经由电源扫描程序记录电源失效发生在中央处理单元电源、非中央处理单元电源或板卡电源内部的电源失效位置。
综上所述,本发明所揭示的技术方案可识别服务器系统发生电源失效的电源,而无须逐一量测电源的开机时序,并且根据上述失效电源的不同进行相对应的后续处理,以排除假性的电源故障事件,亦即确认真正的电源故障事件。进一步减少因假性的电源故障事件造成的维修成本。另一方面,若无法透过重启程序排除电源失效,则可透过电源失效的相关信息以改善服务器系统电源失效的错误分析与故障维修过程。
以下将以实施方式对上述的说明作详细的描述,并对本揭示内容的技术方案提供更进一步的解释。
附图说明
为让本揭示内容的上述和其他目的、特征、优点与实施例能更明显易懂,所附图示的说明如下:
图1显示为本发明揭示的技术方案中一实施例的电源失效侦测系统示意图。
图2显示为本发明揭示的技术方案中另一实施例的电源失效侦测方法流程图。
组件标号说明
为让本揭示内容的上述和其他目的、特征、优点与实施例能更明显易懂,所附符号的说明如下:
100:电源失效侦测系统
110:复杂可编程逻辑器件
120:缓存器
130:基板管理控制器模块
140:主板
142:中央处理单元电源
144:非中央处理单元电源
150:板卡
152:板卡电源
200:电源失效侦测方法
S202~S208:步骤
具体实施方式
为了使本揭示内容的叙述更加详尽与完备,可参照附图及以下所述的各种实施例。但所提供的实施例并非用以限制本发明所涵盖的范围;步骤的描述亦非用以限制其执行的顺序,任何由重新组合,所产生具有均等功效的装置,皆为本发明所涵盖的范围。
于实施方式与申请专利范围中,除非内文中对于冠词有所特别限定,否则“一”、与“所述”可泛指一个或多个。
另外,关于本文中所使用的“耦接”及“连接”,均可指二或多个组件相互直接作实体接触或电性接触,或是相互间接作实体接触或电性接触,而“耦接”还可指二或多个组件相互操作或动作。
如图1所绘示,图1显示为本发明揭示的技术方案中一实施例的电源失效侦测系统100示意图。电源失效侦测系统100包含主板(Motherboard)140、板卡150、复杂可编程逻辑器件110(Complex Programmable Logic Device,简称CPLD)与基板管理控制器(BaseboardManagement Controller,简称BMC)模块130,其中主板140包含中央处理单元(CentralProcessing Unit,简称CPU)电源142与非中央处理单元电源144,板卡150包含板卡电源152,基板管理控制器模块130包含缓存器120(Register),缓存器120电性耦接复杂可编程逻辑器件110。
复杂可编程逻辑器件110实时侦测服务器系统内部各个电源的运作状况。举例而言,应用于主板140的主电源包含P12V、P5V、P3V3、PVDDQ、PVCCIN等,而预备(Stand-by)电源包含P12V_STBY、P5V_STBY、P3V3_STBY、P1V8_STBY、P1V_STBY等。于本实施例中,主板上应用的电源可区分为中央处理单元电源142(例如PVCCIN),以及非中央处理单元电源144(例如供应至主板的记忆装置的电源P12V、P5V、P3V3、PVDDQ,以及预备电源P12V_STBY、P5V_STBY、P3V3_STBY、P1V8_STBY、P1V_STBY)。板卡电源152例如供应至服务器背板(Backboard)的电源,其包含预备电源与主电源。
于一实施例中,复杂可编程逻辑器件110实时侦测供应至主板140上的中央处理单元电源142与非中央处理单元电源144,以及供应至板卡的板卡电源152是否发生电源失效。当上述任一电源发生电源失效时,复杂可编程逻辑器件110立即执行关机(Shutdown)程序,识别电源失效类型。复杂可编程逻辑器件110进一步根据电源失效类型判断是否执行重启(Restart)程序。若复杂可编程逻辑器件110执行重启程序,并且顺利重新启动,表示此电源失效为假性的电源故障,无须进行维修。若复杂可编程逻辑器件110无法顺利开机,则反复执行重启程序。当重启程序的次数达到默认次数时(例如预设的默认的次数为3次),记录锁定讯息于缓存器120中,以表示电源失效无法经由重新启动排除。基板管理控制器模块130用以根据锁定讯息执行锁定程序以锁定服务器系统,以避免服务器系统在电源失效问题排除之前因误动作造成二次损害。此外,基板管理控制器模块130还可以用于记录重启程序的次数。因此,复杂可编程逻辑器件110在服务器系统发生电源失效时,识别电源失效类型,并可进一步根据电源失效类型判断是否执行重启程序以排除假性的电源故障事件,亦即确认真正的电源故障事件。上述预设次数可依实际需求设计,并非用以限定本揭示内容,其他合适的预设次数亦涵盖在本揭示内容的范围之内。
以下为根据复杂可编程逻辑器件110对于不同的电源失效类型判断是否执行重启程序的细节描述。于一实施例中,当电源失效类型为中央处理单元电源142失效时,复杂可编程逻辑器件110直接记录锁定讯息于缓存器120中,而不执行重启程序。基板管理控制器模块130根据锁定讯息执行锁定程序以锁定服务器系统,以致于服务器系统在中央处理单元电源142失效问题排除之前无法开机。由于中央处理单元电源失效属于致命的(Fatal)电源失效,因此复杂可编程逻辑器件110直接记录锁定讯息于缓存器120中,而不会对服务器系统执行重启程序。基板管理控制器模块130用以执行服务器系统的锁定程序,以避免误动作造成系统的二次损害。
或者,于另一实施例中,当电源失效类型为主板140的电源失效,并且不是中央处理单元电源142失效(亦即非中央处理单元电源144失效)时,复杂可编程逻辑器件110执行重启程序以尝试排除上述电源失效。若复杂可编程逻辑器件110顺利重新启动,表示此电源失效为假性的电源故障,无须进行维修。若复杂可编程逻辑器件110无法顺利开机,则反复执行重启程序。当重启程序的次数达到默认次数时(例如预设的默认次数为3次),记录锁定讯息于缓存器120中,表示无法经由重新启动排除电源失效的问题。上述预设次数可依实际需求设计,并非用以限定本揭示内容,其他合适的预设次数亦涵盖在本揭示内容的范围之内。
或者,于另一实施例中,当电源失效类型为板卡电源152失效(包含板卡的预备电源失效与板卡的主电源失效)时,复杂可编程逻辑器件110执行重启程序以尝试排除上述电源失效。若复杂可编程逻辑器件110顺利重新启动,表示此电源失效为假性的电源故障,无须进行维修。若复杂可编程逻辑器件110无法顺利开机,则反复执行重启程序。当重启程序的次数达到默认次数时(例如预设的默认次数为3次),记录锁定讯息于缓存器120中,表示无法经由重新启动排除电源失效的问题。上述预设次数可依实际需求设计,并非用以限定本揭示内容,其他合适的预设次数亦涵盖在本揭示内容的范围之内。于一实施例中,当电源失效类型为板卡电源152失效时(包含板卡的预备电源失效与板卡的主电源失效),透过显示设备发出提醒。举例而言,透过灯号装置发出红光,但本揭示内容不以此为限。
于一实施例中,当复杂可编程逻辑器件110记录锁定讯息于缓存器120中时,传送缓存器120的位置讯息至基板管理控制器模块130。基板管理控制器模块130根据位置讯息读取缓存器120的锁定讯息,以执行锁定程序。
于一实施例中,复杂型可程序化逻辑组件210透过程序代码定义电源扫描程序以记录电源失效发生在中央处理单元电源142、非中央处理单元电源144或板卡电源152内部的电源失效位置,因此改善服务器系统电源失效的错误分析与故障维修过程。举例而言,当发生板卡电源152失效时,复杂可编程逻辑器件110用以经由电源扫描程序以记录电源失效发生于板卡上的哪一个电源。因此,若无法经由重启程序排除电源失效问题时,可有效地节省检查电源失效位置的时间。当中央处理单元电源142失效发生,或者非中央处理单元电源144(或板卡电源152)失效发生并且重启程序的次数达到默认次数时,复杂型可程序化逻辑组件210记录锁定讯息于失效的电源的对应脚位(pin)连接的缓存器120中,并传送上述缓存器120的位置讯息至基板管理控制器模块130。
图2显示为本发明揭示的技术方案中另一实施例的电源失效侦测方法200流程图。电源失效侦测方法200包括多个步骤S202~S208,可应用于如图1所示的电源失效侦测系统100中,然通过阅读本案而熟悉本案的技术者应了解到,在本实施例中所提及的步骤,除特别叙明其顺序者外,均可依实际需要调整其前后顺序,甚至可同时或部分同时执行。
以下说明以服务器系统的电源为例。实时侦测服务器系统内部各个电源的运作状况。举例而言,应用于主板的主电源包含P12V、P5V、P3V3、PVDDQ、PVCCIN等,而预备电源包含P12V_STBY、P5V_STBY、P3V3_STBY、P1V8_STBY、P1V_STBY等。于本实施例中,主板上应用的电源可区分为中央处理单元电源(例如PVCCIN),以及非中央处理单元电源(例如供应至主板的记忆装置的电源P12V、P5V、P3V3、PVDDQ,以及预备电源P12V_STBY、P5V_STBY、P3V3_STBY、P1V8_STBY、P1V_STBY)。板卡电源例如供应至服务器背板的电源,其包含预备电源与主电源。
于一实施例中,实时侦测供应至主板上的中央处理单元电源与非中央处理单元电源,以及供应至板卡的电源是否发生电源失效。于步骤S202中,当上述任一电源发生电源失效时,立即执行关机程序。于步骤S204中,识别电源失效类型,并根据电源失效类型判断是否执行重启程序。若重启程序执行并且顺利重新启动,表示此电源失效为假性的电源故障,无须进行维修。若无法顺利开机,则反复执行重启程序。于步骤S206中,若重启程序执行并且当重启程序的次数达到默认次数时(例如预设的默认次数为3次),记录锁定讯息于缓存器中,以表示电源失效无法经由重新启动排除。此外,亦透过基板管理控制器模块记录重启程序的次数。于步骤S208中,透过基板管理控制器模块根据锁定讯息执行锁定程序以锁定服务器系统,以避免服务器系统在电源失效问题排除之前因误动作造成二次损害。因此,在服务器系统发生电源失效时,识别电源失效类型,并可进一步根据电源失效类型判断是否执行重启程序以排除假性的电源故障事件,亦即确认真正的电源故障事件。上述预设次数可依实际需求设计,并非用以限定本揭示内容,其他合适的预设次数亦涵盖在本揭示内容的范围之内。
以下为根据不同的电源失效类型判断是否执行重启程序的细节描述。于一实施例中,当电源失效类型为中央处理单元电源失效时,直接记录锁定讯息于缓存器中,而不执行重启程序。透过基板管理控制器模块根据锁定讯息执行锁定程序以锁定服务器系统,以致于服务器系统在中央处理单元电源失效问题排除之前无法开机。由于中央处理单元电源失效属于致命的电源失效,因此直接记录锁定讯息于缓存器中,而不会对服务器系统执行重启程序。透过基板管理控制器模块执行服务器系统的锁定程序,以避免误动作造成系统的二次损害。
或者,于另一实施例中,当电源失效类型为主板电源失效,并且不是中央处理单元电源失效(亦即非中央处理单元电源失效)时,执行重启程序以尝试排除上述电源失效。若顺利重新启动,表示此电源失效为假性的电源故障,无须进行维修。若无法顺利开机,则反复执行重启程序。当重启程序的次数达到默认次数时(例如预设的默认次数为3次),记录锁定讯息于缓存器中,表示无法经由重新启动排除电源失效的问题。上述预设次数可依实际需求设计,并非用以限定本揭示内容,其他合适的预设次数亦涵盖在本揭示内容的范围之内。
或者,于另一实施例中,当电源失效类型为板卡电源失效(包含板卡的预备电源失效与板卡的主电源失效)时,执行重启程序以尝试排除上述电源失效。若顺利重新启动,表示此电源失效为假性的电源故障,无须进行维修。若无法顺利开机,则反复执行重启程序。当重启程序的次数达到默认次数时(例如预设的默认次数为3次),记录锁定讯息于缓存器中,表示无法经由重新启动排除电源失效的问题。上述预设次数可依实际需求设计,并非用以限定本揭示内容,其他合适的预设次数亦涵盖在本揭示内容的范围之内。于一实施例中,当电源失效类型为板卡电源失效时(包含板卡的预备电源失效与板卡的主电源失效),透过显示设备发出提醒。举例而言,透过灯号装置发出警示光,但本揭示内容不以此为限。
于一实施例中,当记录锁定讯息于缓存器中时,传送缓存器的位置讯息至基板管理控制器模块。基板管理控制器模块根据位置讯息读取缓存器的锁定讯息,以执行锁定程序。
于一实施例中,经由程序代码定义的电源扫描程序以记录电源失效发生在中央处理单元电源、非中央处理单元电源或板卡电源内部的电源失效位置,因此改善服务器系统电源失效的错误分析与故障维修过程。举例而言,当发生板卡电源失效时,经由电源扫描程序以记录电源失效发生于板卡的哪一个电源。因此,若无法经由重启程序排除电源失效问题时,可有效地节省检查电源失效位置的时间。当中央处理单元电源失效发生,或者非中央处理单元电源(或板卡电源)失效发生并且重启程序的次数达到默认次数时,复杂型可程序化逻辑组件记录锁定讯息于失效的电源的对应脚位连接的缓存器中,并传送上述缓存器的位置讯息至基板管理控制器模块。
综上所述,本揭示内容得以经由上述实施例,识别服务器系统发生电源失效的电源,而无须逐一量测电源的开机时序,并且根据上述失效电源的不同进行相对应的后续处理,以排除假性的电源故障事件,亦即确认真正的电源故障事件。进一步减少因假性的电源故障事件造成的维修成本。另一方面,若无法透过重启程序排除电源失效,则可透过电源失效的相关信息以改善服务器系统电源失效的错误分析与故障维修过程。
虽然本揭示内容已以实施方式揭露如上,然其并非用以限定本发明,任何熟悉此技术者,在不脱离本揭示内容的精神和范围内,当可作各种的更动与润饰,因此本发明的保护范围当视本发明的权利要求所界定者为准。

Claims (10)

1.一种电源失效侦测系统,其特征在于,包含:
一主板,包含:
一中央处理单元电源;以及
一非中央处理单元电源;
一板卡,包含一板卡电源;
一复杂可编程逻辑器件,用于当发生电源失效时,执行一关机程序,识别一电源失效类型,并根据所述电源失效类型判断是否执行一重启程序,所述电源失效类型表示电源失效发生在所述中央处理单元电源、所述非中央处理单元电源或所述板卡电源;以及
一基板管理控制器模块,包含:
一缓存器,电性耦接所述复杂可编程逻辑器件;
其中,若所述复杂可编程逻辑器件执行所述重启程序,当所述重启程序的次数达到一默认次数时,记录一锁定讯息于所述缓存器中;所述基板管理控制器模块用于记录所述重启程序的次数,根据所述锁定讯息执行一锁定程序。
2.根据权利要求1所述的电源失效侦测系统,其特征在于,当所述复杂可编程逻辑器件记录所述锁定讯息于所述缓存器中时,传送所述缓存器的一位置讯息至所述基板管理控制器模块,所述基板管理控制器模块根据所述位置讯息读取所述缓存器的所述锁定讯息。
3.根据权利要求1所述的电源失效侦测系统,其特征在于,当所述电源失效类型表示电源失效发生在所述中央处理单元电源时,所述复杂可编程逻辑器件记录所述锁定讯息于所述缓存器中。
4.根据权利要求1所述的电源失效侦测系统,其特征在于,当所述电源失效类型表示电源失效发生在所述板卡电源或所述非中央处理单元电源时,所述复杂可编程逻辑器件执行所述重启程序。
5.根据权利要求1所述的电源失效侦测系统,其特征在于,所述复杂可编程逻辑器件用于经由一电源扫描程序记录电源失效发生在所述中央处理单元电源、所述非中央处理单元电源或所述板卡电源内部的一电源失效位置。
6.一种电源失效侦测方法,其特征在于,包含:
当发生电源失效时,执行一关机程序;
识别一电源失效类型,并根据所述电源失效类型判断是否执行一重启程序,其中所述电源失效类型表示电源失效发生在一主板的一中央处理单元电源、所述主板的一非中央处理单元电源或一板卡电源;
若执行所述重启程序,当所述重启程序的次数达到一默认次数时,记录一锁定讯息于所述缓存器中,并透过一基板管理控制器模块记录所述重启程序的次数;以及
透过所述基板管理控制器模块,根据所述锁定讯息执行一锁定程序。
7.根据权利要求6所述的电源失效侦测方法,其特征在于,还包含:
当记录所述锁定讯息于所述缓存器中时,传送所述缓存器的一位置讯息至所述基板管理控制器模块,所述基板管理控制器模块根据所述位置讯息读取所述缓存器的所述锁定讯息。
8.根据权利要求6所述的电源失效侦测方法,其特征在于,还包含:
当所述电源失效类型表示电源失效发生在所述中央处理单元电源时,记录所述锁定讯息于所述缓存器中。
9.根据权利要求6所述的电源失效侦测方法,其特征在于,还包含:
当所述电源失效类型表示电源失效发生在所述板卡电源或所述非中央处理单元电源时,执行所述重启程序。
10.根据权利要求6所述的电源失效侦测方法,其特征在于,还包含:
经由一电源扫描程序记录电源失效发生在所述中央处理单元电源、所述非中央处理单元电源或所述板卡电源内部的一电源失效位置。
CN201510405799.7A 2015-07-10 2015-07-10 电源失效侦测系统与其方法 Active CN104991629B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201510405799.7A CN104991629B (zh) 2015-07-10 2015-07-10 电源失效侦测系统与其方法
US14/931,824 US9778988B2 (en) 2015-07-10 2015-11-03 Power failure detection system and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510405799.7A CN104991629B (zh) 2015-07-10 2015-07-10 电源失效侦测系统与其方法

Publications (2)

Publication Number Publication Date
CN104991629A true CN104991629A (zh) 2015-10-21
CN104991629B CN104991629B (zh) 2017-11-24

Family

ID=54303445

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510405799.7A Active CN104991629B (zh) 2015-07-10 2015-07-10 电源失效侦测系统与其方法

Country Status (2)

Country Link
US (1) US9778988B2 (zh)
CN (1) CN104991629B (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107092334A (zh) * 2017-04-21 2017-08-25 广东浪潮大数据研究有限公司 一种服务器电源装置故障定位的方法
CN108919935A (zh) * 2018-07-12 2018-11-30 浪潮电子信息产业股份有限公司 一种针对于服务器主板上的电源的监测方法、装置及设备
CN109816807A (zh) * 2019-01-24 2019-05-28 合肥盛东信息科技有限公司 一种养老智能定位预警终端系统
CN109933182A (zh) * 2019-03-20 2019-06-25 浪潮商用机器有限公司 一种服务器掉电诊断方法、装置和系统
CN110806702A (zh) * 2019-11-08 2020-02-18 中核兰州铀浓缩有限公司 一种离心铀浓缩系统tp板卡
WO2020048162A1 (zh) * 2018-09-05 2020-03-12 郑州云海信息技术有限公司 一种基于Whitley平台实现CPLD升级的方法和系统
CN111176921A (zh) * 2020-01-02 2020-05-19 英业达科技有限公司 辅助测试主板的方法及主板
CN111562834A (zh) * 2019-02-13 2020-08-21 深圳富桂精密工业有限公司 双中央处理器电源故障监测系统及其方法
WO2021169260A1 (zh) * 2020-02-26 2021-09-02 苏州浪潮智能科技有限公司 一种系统板卡电源检测方法、装置、设备及存储介质
WO2021212943A1 (zh) * 2020-04-23 2021-10-28 苏州浪潮智能科技有限公司 一种服务器电源的维修方法、装置、设备及介质

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10782764B2 (en) * 2017-02-13 2020-09-22 American Megatrends International, Llc Techniques of emulating an ACPI controller on a service processor
US11031804B2 (en) * 2017-11-06 2021-06-08 Nxp B.V. Power controller
JP2020154431A (ja) 2019-03-18 2020-09-24 キオクシア株式会社 電子機器及び電子機器の情報記録方法
CN110275808B (zh) * 2019-06-27 2023-05-23 浪潮商用机器有限公司 一种转接卡id冲突的检测系统、方法及服务器
CN117234812B (zh) * 2023-11-16 2024-01-30 中科泓泰电子有限公司 一种控制服务器重启的系统及方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6735706B2 (en) * 2000-12-06 2004-05-11 Lattice Semiconductor Corporation Programmable power management system and method
CN102066956A (zh) * 2008-04-14 2011-05-18 努沃尔特股份有限公司 电异常检测方法和系统
TW201227257A (en) * 2010-12-22 2012-07-01 Inventec Corp A monitor system of the power sequence signal and the method

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4562550A (en) * 1983-11-01 1985-12-31 General Electric Company Remote load control relay processor
US4763333A (en) * 1986-08-08 1988-08-09 Universal Vectors Corporation Work-saving system for preventing loss in a computer due to power interruption
US5189598A (en) * 1990-08-14 1993-02-23 Dallas Semiconductor Corporation Dual function microboard with a row of connectors on two edges
US5630142A (en) * 1994-09-07 1997-05-13 International Business Machines Corporation Multifunction power switch and feedback led for suspend systems
US5758174A (en) * 1995-06-07 1998-05-26 International Business Machines Corporation Computer system having a plurality of stored system capability states from which to resume
US5878264A (en) * 1997-07-17 1999-03-02 Sun Microsystems, Inc. Power sequence controller with wakeup logic for enabling a wakeup interrupt handler procedure
JP3376306B2 (ja) * 1998-12-25 2003-02-10 エヌイーシーマイクロシステム株式会社 データ処理装置、そのデータ処理方法
US8255620B2 (en) * 2009-08-11 2012-08-28 Texas Memory Systems, Inc. Secure Flash-based memory system with fast wipe feature
CN102375765A (zh) * 2010-08-19 2012-03-14 鸿富锦精密工业(深圳)有限公司 服务器掉电侦测系统及方法
TWI458995B (zh) 2010-08-24 2014-11-01 Hon Hai Prec Ind Co Ltd 伺服器掉電偵測系統及方法
TWI480726B (zh) 2012-12-11 2015-04-11 Inventec Corp 藉由邊界掃描進行主機板電源供應控制的系統及其方法
KR20150004169A (ko) * 2013-07-02 2015-01-12 삼성전자주식회사 전원공급장치, 이를 구비한 마이크로 서버 및 전원공급방법
US20160197809A1 (en) 2013-09-30 2016-07-07 Hewlett Packard Enterprise Development Lp Server downtime metering

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6735706B2 (en) * 2000-12-06 2004-05-11 Lattice Semiconductor Corporation Programmable power management system and method
CN102066956A (zh) * 2008-04-14 2011-05-18 努沃尔特股份有限公司 电异常检测方法和系统
TW201227257A (en) * 2010-12-22 2012-07-01 Inventec Corp A monitor system of the power sequence signal and the method

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107092334A (zh) * 2017-04-21 2017-08-25 广东浪潮大数据研究有限公司 一种服务器电源装置故障定位的方法
CN108919935A (zh) * 2018-07-12 2018-11-30 浪潮电子信息产业股份有限公司 一种针对于服务器主板上的电源的监测方法、装置及设备
WO2020048162A1 (zh) * 2018-09-05 2020-03-12 郑州云海信息技术有限公司 一种基于Whitley平台实现CPLD升级的方法和系统
CN109816807A (zh) * 2019-01-24 2019-05-28 合肥盛东信息科技有限公司 一种养老智能定位预警终端系统
US11132043B2 (en) 2019-02-13 2021-09-28 Shenzhen Fugui Precision Ind. Co., Ltd. Power failure detecting system and method for dual central processing unit
CN111562834A (zh) * 2019-02-13 2020-08-21 深圳富桂精密工业有限公司 双中央处理器电源故障监测系统及其方法
CN111562834B (zh) * 2019-02-13 2022-01-11 深圳富联富桂精密工业有限公司 双中央处理器电源故障监测系统及其方法
CN109933182A (zh) * 2019-03-20 2019-06-25 浪潮商用机器有限公司 一种服务器掉电诊断方法、装置和系统
CN110806702A (zh) * 2019-11-08 2020-02-18 中核兰州铀浓缩有限公司 一种离心铀浓缩系统tp板卡
CN110806702B (zh) * 2019-11-08 2021-07-20 中核兰州铀浓缩有限公司 一种离心铀浓缩系统tp板卡
CN111176921A (zh) * 2020-01-02 2020-05-19 英业达科技有限公司 辅助测试主板的方法及主板
WO2021169260A1 (zh) * 2020-02-26 2021-09-02 苏州浪潮智能科技有限公司 一种系统板卡电源检测方法、装置、设备及存储介质
WO2021212943A1 (zh) * 2020-04-23 2021-10-28 苏州浪潮智能科技有限公司 一种服务器电源的维修方法、装置、设备及介质

Also Published As

Publication number Publication date
US20170010938A1 (en) 2017-01-12
US9778988B2 (en) 2017-10-03
CN104991629B (zh) 2017-11-24

Similar Documents

Publication Publication Date Title
CN104991629A (zh) 电源失效侦测系统与其方法
US10353763B2 (en) Fault processing method, related apparatus, and computer
CN102016868B (zh) 电子设备装置的不正当拆卸检测方法
CN103995760A (zh) 一种电脑故障检测设备和检测维修方法
CN106547653B (zh) 计算机系统故障状态检测方法、装置及系统
CN105808398A (zh) 一种快速分析定位硬件异常的方法
CN104216746B (zh) 一种星上设备dsp程序地面在线烧写的实时监控和校验方法
CN107436414B (zh) 一种存储系统中bbu的有效性测试方法和装置
CN107678909B (zh) 一种服务器中监控芯片配置状态的电路及方法
CN104320308A (zh) 一种服务器异常检测的方法及装置
CN107451003B (zh) 一种存储系统的测试方法及装置
CN112286709A (zh) 一种服务器硬件故障的诊断方法、诊断装置及诊断设备
CN112527582A (zh) 服务器线缆的检测方法、检测装置、检测设备及存储介质
CN114398913A (zh) 一种燃料装卸系统检测方法、装置、存储介质及电子设备
CN111625386A (zh) 一种针对系统设备上电超时的监控方法和装置
JP2014021577A (ja) 故障予測装置、故障予測システム、故障予測方法、及び、故障予測プログラム
CN101206599B (zh) 计算机主板设备诊断和隔离方法
US9158646B2 (en) Abnormal information output system for a computer system
TWI584114B (zh) 電源失效偵測系統與其方法
CN104750600A (zh) 设备状态记录方法和系统
CN110825547B (zh) 一种基于smbus的pcie卡异常恢复装置及方法
CN111176878A (zh) 一种服务器bbu备电诊断方法、系统、终端及存储介质
CN102541705A (zh) 计算机的测试方法和工装板
US20180277234A1 (en) Failure prevention of bus monitor
CN113076210B (zh) 服务器故障诊断结果通知方法、系统、终端及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant