CN115309250B - 一种提高电源oring可靠性的方法及系统 - Google Patents

一种提高电源oring可靠性的方法及系统 Download PDF

Info

Publication number
CN115309250B
CN115309250B CN202210906329.9A CN202210906329A CN115309250B CN 115309250 B CN115309250 B CN 115309250B CN 202210906329 A CN202210906329 A CN 202210906329A CN 115309250 B CN115309250 B CN 115309250B
Authority
CN
China
Prior art keywords
oring
power supply
line
mos
voltage
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210906329.9A
Other languages
English (en)
Other versions
CN115309250A (zh
Inventor
陈勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN202210906329.9A priority Critical patent/CN115309250B/zh
Publication of CN115309250A publication Critical patent/CN115309250A/zh
Application granted granted Critical
Publication of CN115309250B publication Critical patent/CN115309250B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/28Supervision thereof, e.g. detecting power-supply failure by out of limits supervision
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/30Means for acting in the event of power-supply failure or interruption, e.g. power-supply fluctuations

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Power Sources (AREA)

Abstract

本申请公开了一种提高电源oring可靠性的方法及系统,该方法包括:判断输出电源的电流是否大于等于设定的电流阈值;如果是,启动电源oring‑Mos压差检测;分别对oring线路隔离前电压和oring线路隔离后总线电压进行读取PMBUS值采样;利用公式计算得出任一电源的oring‑Mos压差Voring;判断oring‑Mos压差是否小于等于设定的第一电压阈值;如果否,判定MOS管未完全导通,任一电源的oring‑Mos工作异常;根据任一电源的oring‑Mos压差,将oring线路故障划分为低风险级故障和高风险级故障;根据oring线路故障的风险等级,控制任一电源执行告警响应模式或故障保护响应模式。通过本申请,能够在确保提高电源oring可靠性的同时,有效提高工作效率。

Description

一种提高电源oring可靠性的方法及系统
技术领域
本申请涉及服务器电源可靠性技术领域,特别是涉及一种提高电源oring(多路冗余,并联隔离)可靠性的方法及系统。
背景技术
随着云计算技术的发展,高功率密度服务器的应用越来越广泛,相应地,用户对整个系统可靠性的需求越来越高,为不断地提高系统的整机可靠性,多台电源并机使用的场景被系统应用端广泛采用。
多台电源之间主要通过MOS(Metal Oxide Semiconductor Field EffectTransistor-金属氧化物半导体场效应晶体管)来实现并机隔离,简称oring-Mos。这种方式应用简单,MOS开通时大电流的损耗很小,当某台电源失效时,oring mos关断,实现隔离保护,不影响其它电源的输出。但是,大功率高电流输出电源中多个oring-Mos并联使用,当oring-Mos驱动异常mos无法完全导通的情况,会出现大电流过mos的体内二极管而产生大量损耗以及发热问题,长期工作甚至有可能出现烧PCB的风险,因此,如何提高电源oring的可靠性,是个重要的技术问题。
目前提高电源oring可靠性的方法,主要是从硬件的角度,具体地,修改电源的oring线路,增加对oring-Mos温度和压差的检测线路来监控保护电源,从而提高电源oring的可靠性。
然而目前提高电源oring可靠性的方法中,由于从硬件角度提高电源oring可靠性,改动不够方便,而且对于已经现网运行的设备无法更新优化,因此,目前提高电源oring可靠性的方法不便于操作,执行效率不够高,从而影响对电源oring可靠性的提高效果。
发明内容
本申请提供了一种提高电源oring可靠性的方法及系统,以解决现有技术中提高电源oring可靠性的方法执行效率不够高的问题。
为了解决上述技术问题,本申请实施例公开了如下技术方案:
一种提高电源oring可靠性的方法,所述服务器电源中包括有多个并联连接的oring-Mos,且所述服务器电源中包括互为冗余的电源PSU0(Power Supply Unit,供电单元)和PSU1,PSU0为主电源,PSU1为备用电源,所述方法包括:
服务器电源运行过程中,判断输出电源的电流是否大于等于设定的电流阈值;
如果是,启动PSU0和PSU1的oring-Mos压差检测;
分别对电源的oring线路隔离前电压和oring线路隔离后总线电压进行读取PMBUS值采样;
根据oring线路隔离前电压和oring线路隔离后总线电压的PMBUS寄存器值,利用公式Voring=12V_F-12VRS,计算得出任一电源的oring-Mos压差Voring,其中,12V_F为oring线路隔离前电压,12VRS为Oring线路隔离后总线电压;
判断所述任一电源的oring-Mos压差Voring是否小于等于设定的第一电压阈值;
如果是,判定MOS管完全导通,所述任一电源的oring-Mos工作正常;
如果否,判定MOS管未完全导通,所述任一电源的oring-Mos工作异常;
当所述任一电源的oring-Mos工作异常时,根据所述任一电源的oring-Mos压差,将oring线路故障划分为低风险级故障和高风险级故障;
根据oring线路故障的风险等级,控制所述任一电源执行告警响应模式或故障保护响应模式。
可选地,所述设定的电流阈值为50A。
可选地,所述分别对电源的oring线路隔离前电压和oring线路隔离后总线电压进行读取PMBUS值采样,包括:
BMC通过IIC总线以及对应电源的地址,分别与服务器系统的每个电源通信,读取电源的oring线路隔离前电压12V_F和oring线路隔离后总线电压12VRS的PMBUS值;
BMC对oring线路隔离前电压12V_F PMBUS值进行采样,寄存器赋值为8Bh;
BMC对所述任一电源的oring线路隔离后总线电压12VRS的PMBUS值进行采样,寄存器赋值为B8h。
可选地,根据所述任一电源的oring-Mos压差,将oring线路故障划分为低风险级故障和高风险级故障,包括:
当oring-Mos压差Voring满足:Voring≤第一电压阈值时,判定oring线路无故障;
当oring-Mos压差Voring满足:第一电压阈值<Voring<第二电压阈值时,判定oring线路故障等级为低风险级故障;
当oring-Mos压差Voring满足:Voring≥第二电压阈值时,判定oring线路故障等级为高风险级故障。
可选地,所述第一电压阈值为0.1V,所述第二电压阈值为0.3V。
可选地,所述根据oring线路故障的风险等级,控制所述任一电源执行告警响应模式或故障保护响应模式,包括:
当oring线路故障的风险等级为低风险级故障时,BMC控制所述任一电源执行告警响应模式;
当oring线路故障的风险等级为高风险级故障时,BMC控制所述任一电源执行故障保护响应模式。
可选地,当oring线路故障的风险等级为低风险级故障时,BMC控制所述任一电源执行告警响应模式包括:
当oring线路故障的风险等级为低风险级故障时,BMC发送冷备份指令给所述任一电源;
根据所获取的冷备份指令,所述任一电源关闭均流使能,调低输出电压使得所述任一电源进入待机状态;
当冗余电源中所述任一电源以外的另一电源发生故障时,低风险级故障的所述任一电源由待机状态进入开启工作状态。
可选地,当oring线路故障的风险等级为高风险级故障时,BMC控制所述任一电源执行故障保护响应模式,包括:
当oring线路故障的风险等级为高风险级故障时,BMC发送关机指令给所述任一电源;
根据所获取的关机指令,所述任一电源进入关机状态;
BMC上报所述任一电源oring故障,并记录日志;
根据所获取的更新命令,为所述任一电源槽口更新电源。
一种提高电源oring可靠性的系统,所述服务器电源中包括有多个并联连接的oring-Mos,且所述服务器电源中包括互为冗余的电源PSU0和PSU1,PSU0为主电源,PSU1为备用电源,所述系统包括:
第一判断模块,用于服务器电源运行过程中,判断输出电源的电流是否大于等于设定的电流阈值,如果是,启动PSU0和PSU1的Oring-Mos压差检测,否则,不启动Oring-Mos压差检测;
采样模块,用于分别对电源的oring线路隔离前电压和oring线路隔离后总线电压进行读取PMBUS值采样;
oring-Mos压差计算模块,用于根据oring线路隔离前电压和oring线路隔离后总线电压的PMBUS寄存器值,利用公式Voring=12V_F-12VRS,计算得出任一电源的oring-Mos压差Voring,其中,12V_F为oring线路隔离前电压,12VRS为Oring线路隔离后总线电压;
第二判断模块,用于判断所述任一电源的oring-Mos压差Voring是否小于等于设定的第一电压阈值,如果是,判定MOS管完全导通,所述任一电源的oring-Mos工作正常,如果否,判定MOS管未完全导通,所述任一电源的oring-Mos工作异常;
oring线路故障划分模块,用于当所述任一电源的oring-Mos工作异常时,根据所述任一电源的oring-Mos压差,将oring线路故障划分为低风险级故障和高风险级故障;
响应控制模块,用于根据oring线路故障的风险等级,控制所述任一电源执行告警响应模式或故障保护响应模式。
可选地,所述采样模块包括:
电压读取单元,用于通过IIC总线以及对应电源的地址,分别与服务器系统的每个电源通信,读取电源的oring线路隔离前电压12V_F和oring线路隔离后总线电压12VRS的PMBUS值;
第一采样单元,用于对oring线路隔离前电压12V_F PMBUS值进行采样,寄存器赋值为8Bh;
第二采样单元,用于对所述任一电源的oring线路隔离后总线电压12VRS的PMBUS值进行采样,寄存器赋值为B8h。
本申请的实施例提供的技术方案可以包括以下有益效果:
本申请提供一种提高电源oring可靠性的方法,该方法在判定oring-Mos驱动异常后,首先系统BMC分别对oring线路隔离前电压和oring线路隔离后总线电压进行采样,并根据采样结果更新电源固件,然后利用公式Voring=12V_F-12VRS,计算得出PSU1的oring-Mos压差Voring,根据压差将oring线路故障划分为低风险级故障和高风险级故障,最后根据oring线路故障的风险等级,控制PSU1执行告警响应模式或故障保护响应模式。本实施例采用优化电源固件的方法提高电源oring可靠性,相比于现有技术,本实施例在电源固件中增加对隔离后总线电压12VRS的上报,这种方式所确定的oring-Mos压差更加准确,而且这种方式并不改变原有oring线路,能够有效提高电源oring可靠性。本实施例利用系统BMC对oring-Mos前后压差进行判断和检测,从而监控电源oring Mos的工作状态,进而进行电源相应的响应动作,相比于现有技术中的硬件处理方法,无需修改PCB线路,从电源和系统BMC固件升级的角度覆盖现网运行电源,在确保提高电源oring可靠性的同时,能够有效提高工作效率。另外,本实施例利用BMC监控电源oring线路,相比于现有技术中的硬件处理方法,以及电源自身监控方法,从系统的角度监控电源oring线路,有利于提高监控结果的准确性。
本申请还提供一种提高电源oring可靠性的系统,该系统主要包括:第一判断模块、采样模块、oring-Mos压差计算模块、第二判断模块、oring线路故障划分模块和响应控制模块。这6个模块设置于同一个系统BMC中。通过第一判断模块和第二判断模块的设置,能够确定启动oring-Mos压差检测的时刻和oring-Mos工作异常的时刻。通过采样模块和oring-Mos压差计算模块的设置,计算得出任一电源的oring-Mos压差Voring,最后通过oring线路故障划分模块和响应控制模块,任一电源的oring-Mos工作异常时,根据不同的风险级故障启动相应的保护模式。从系统BMC角度监控电源oring线路,并提高电源oring可靠性,这种提高电源oring可靠性的结构,不必修改电源PCB线路,采用电源固件和BMC固件升级的方法即可覆盖现网运行电源,在确保提高系统运行的可靠性的同时,有利于提高系统的运行效率。而且本实施例的结构只需要固件升级,改动影响较小,操作简单,也有利于提高系统执行效率。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例所提供的一种提高电源oring可靠性的方法的流程示意图;
图2为本实施例中oring-MOS电路原理示意图;
图3为12V输出oring前后的电源DSP(Digital Signal Processing,数字信号处理)采样电路原理示意图;
图4为本申请实施例所提供的一种提高电源oring可靠性的系统的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请中的技术方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
为了更好地理解本申请,下面结合附图来详细解释本申请的实施方式。
参见图1,图1为本申请实施例所提供的一种提高电源oring可靠性的方法的流程示意图。由图1可知,本实施例中提高电源oring可靠性的方法,主要包括如下过程:
S1:服务器电源运行过程中,判断输出电源的电流是否大于等于设定的电流阈值。
本实施例中的电源为服务器电源,服务器电源中包括有多个并联连接的oring-Mos,且服务器电源中包括互为冗余的电源PSU0和PSU1,定义PSU0为主电源,PSU1为备用电源。本实施例中oring-Mos的电路原理图可以参见图2所示。图2是通过两个分立三极管检测电源隔离前12VL电压和12Vo总线电压前后压差,即oring-Mos源极和漏级来自驱动oring-Mos的开通和关断。本实施例中以对备用电源PSU1为例,进行提高电源oring可靠性方法的陈述。
通过检测服务电源正常运行过程中输出电源的电流,当有大电流流经MOS管时能够及时发现,从而避免电源电路产生大量损耗以及发热问题,有利于提高电源oring可靠性。本实施例中设定的电流阈值可以设定为50A。也就是,当输出电源的电流大于等于50A时,执行步骤S2,否则继续执行步骤S1。该设定的电流阈值根据服务器器电源的额定功率确定。
如果输出电源的电流大于等于设定的电流阈值,执行步骤S2:启动PSU0和PSU1的oring-Mos压差检测。
否则,输出电源的电流小于设定的电流阈值,不启动电源的oring-Mos压差检测,继续执行步骤S1。
S3:分别对电源的oring线路隔离前电压和oring线路隔离后总线电压进行读取PMBUS值采样。
具体地,步骤S3包括如下过程:
S31:BMC通过IIC总线以及对应电源的地址,分别与服务器系统的每个电源通信,读取电源的oring线路隔离前电压12V_F和oring线路隔离后总线电压12VRS的PMBUS值。
S32:BMC对oring线路隔离前电压12V_F PMBUS值进行采样,寄存器赋值为8Bh。
本实施例可以利用DSP进行电压采样。本实施例中DSP采样电路的电路原理可以参见图3所示。图3为12V输出oring前后的电源DSP采样电路原理示意图。
S33:BMC对任一电源的oring线路隔离后总线电压12VRS的PMBUS值进行采样,寄存器赋值为B8h。
根据以上步骤S31-S33,DSP会分别采样oring线路隔离前电压12V_F和总线电压12V_RS,本实施例中电源Pmbus除了对隔离前电压12V_F进行了上报,寄存器为8Bh(PMBUS_CMD_READ_VOUT)Linear-16read word。电源Pmbus还增加对隔离后总线电压12V_RS进行上报,赋值寄存器为B8h(PMBUS_CMD_READ_VOUT)Linear-16read word,读法和格式与8Bh一样。
继续参见图1可知,分别对电源的oring线路隔离前电压和oring线路隔离后总线电压进行读取PMBUS值采样之后,执行步骤S4:根据oring线路隔离前电压和oring线路隔离后总线电压的PMBUS寄存器值,利用公式Voring=12V_F-12VRS,计算得出任一电源的oring-Mos压差Voring。其中,12V_F为oring线路隔离前电压,12VRS为Oring线路隔离后总线电压。
S5:判断任一电源的oring-Mos压差Voring是否小于等于设定的第一电压阈值。
如果任一电源的oring-Mos压差Voring小于等于设定的第一电压阈值,执行步骤S6:判定MOS管完全导通,任一电源的oring-Mos工作正常。
如果任一电源的oring-Mos压差Voring大于设定的第一电压阈值,执行步骤S7:判定MOS管未完全导通,任一电源的oring-Mos工作异常。
S8:当任一电源的oring-Mos工作异常时,根据任一电源的oring-Mos压差,将oring线路故障划分为低风险级故障和高风险级故障。
具体地,步骤S8包括如下过程:
S81:当oring-Mos压差Voring满足:Voring≤第一电压阈值时,判定oring线路无故障。
S82:当oring-Mos压差Voring满足:第一电压阈值<Voring<第二电压阈值时,判定oring线路故障等级为低风险级故障。
本实施例以判断PSU1的oring-Mos压差为例。利用BMC对PSU1持续检测3轮,每轮检测2次,每次间隔200ms,检测结果都符合第一电压阈值<Voring<第二电压阈值时,判定oring线路故障等级为低风险级故障。
S83:当oring-Mos压差Voring满足:Voring≥第二电压阈值时,判定oring线路故障等级为高风险级故障。
本实施例中第一电压阈值和第二电压阈值根据MOS管的导通阻抗和输出电流确定,当MOS管完全导通时,导通阻抗很小,通常Voring不到0.1V。
第一电压阈值可以取值0.1V,第二电压阈值可以取值0.3V。该阈值的设置,能够相对准确地评估是否发生oring线路故障,以及oring线路故障的级别,有利于提高对电源oring可靠性评估的效率。
S9:根据oring线路故障的风险等级,控制任一电源执行告警响应模式或故障保护响应模式。
本实施例中根据oring线路故障的风险等级,设置有oring告警点和oring故障点。
具体地,步骤S9包括如下过程:
S91:当oring线路故障的风险等级为低风险级故障时,BMC控制该任一电源执行告警响应模式。
也就是触发oring告警点,执行步骤S91,触发oring故障点执行步骤S92。
进一步地,步骤S91包括如下过程:
S911:当oring线路故障的风险等级为低风险级故障时,BMC发送冷备份指令给该任一电源;
S912:根据所获取的冷备份指令,该任一电源关闭均流使能,调低输出电压使得PSU1进入待机状态;
S913:当冗余电源中该任一电源以外的另一电源发生故障时,低风险级故障的该任一电源由待机状态进入开启工作状态。
由以上步骤S911-S913可知,当oring线路故障的风险等级为低风险级故障时,触发oring告警点,用于提醒系统PSU1电源oring线路有低风险异常。此时BMC给PSU1发送冷备份指令,使得PSU1进入冷备份,PSU1关闭均流使能,PSU1调低输出电压为11.8V,使得PSU1处于待机不流经负载的情况。这种情况能够确保在PSU0出现失效时,PSU1实际Voring压差在0.15V-0.3V之间,为oring故障的低风险级别,即使PSU1工作也不会出现烧板或其他风险,PSU1不是关闭状态,能够及时被唤醒,因此,这种方法当PSU0出现失效时,使得PSU1能够从冷备份转为运行状态,从而确保整个系统不宕机,提高电源oring可靠性,进而提高整个系统的可靠性和稳定性。而PSU0没有故障时,PSU0流经负载电流,负载电流不会流过oring处于低风险级故障的PSU1。
S92:当ring线路故障的风险等级为高风险级故障时,BMC控制该任一电源执行故障保护响应模式。
进一步地,步骤S92包括如下过程:
S921:当oring线路故障的风险等级为高风险级故障时,BMC发送关机指令给该任一电源。
与低风险级故障判断原理相似,在判定oring线路故障位高风险级故障时,本实施例所采用的方法是:利用BMC对PSU1持续检测3轮,每轮检测2次,每次间隔200ms,检测结果都符合Voring>第二电压阈值时,判定oring线路故障等级为高风险级故障。
S922:根据所获取的关机指令,该任一电源进入关机状态。
S923:BMC上报该任一电源oring故障,并记录日志。
通过记录相关日志,便于后续进行故障处理。
S924:根据所获取的更新命令,为该任一电源槽口更新电源。
由步骤S921-S924可知,当oring线路故障的风险等级为高风险级故障时,触发oring故障点,用于提醒系统PSU1电源oring线路有高风险异常。同时BMC给PSU1发送关机指令,PSU0此时正常运行,同时为PSU1槽口更新性能良好的电源,从而避免PSU1d的oring线路故障一直运行。
进一步地,本实施例中针对不同的故障级别,采用不同的指示灯进行显示,有利于用户直观确认oring线路故障,从而提高用户体验。例如:oring线路无故障时,绿灯亮起;oring线路低风险级故障时,故障橙色灯闪,表示告警;oring线路高风险级故障时,故障橙色灯常亮起,表示有故障。
实施例二
在图1-图3所示实施例的基础上参见图4,图4为本申请实施例所提供的一种提高电源oring可靠性的系统的结构示意图。由图4可知,本实施例中提高电源oring可靠性的系统,主要包括:第一判断模块、采样模块、oring-Mos压差计算模块、第二判断模块、oring线路故障划分模块和响应控制模块。这6个模块设置于同一个系统BMC中。服务器电源中包括有多个并联连接的oring-Mos,且所述服务器电源中包括互为冗余的电源PSU0和PSU1,PSU0为主电源,PSU1为备用电源。
其中,第一判断模块,用于服务器电源运行过程中,判断输出电源的电流是否大于等于设定的电流阈值,如果是,启动PSU0和PSU1的Oring-Mos压差检测,否则,不启动oring-Mos压差检测;采样模块,用于分别对电源的oring线路隔离前电压和oring线路隔离后总线电压进行读取PMBUS值采样;oring-Mos压差计算模块,用于根据oring线路隔离前电压和oring线路隔离后总线电压的PMBUS寄存器值,利用公式Voring=12V_F-12VRS,计算得出任一电源的oring-Mos压差Voring,其中,12V_F为oring线路隔离前电压,12VRS为Oring线路隔离后总线电压;第二判断模块,用于判断任一电源的oring-Mos压差Voring是否小于等于设定的第一电压阈值,如果是,判定MOS管完全导通,任一电源的oring-Mos工作正常,如果否,判定MOS管未完全导通,任一电源的oring-Mos工作异常;oring线路故障划分模块,用于当任一电源的oring-Mos工作异常时,根据任一电源的oring-Mos压差,将oring线路故障划分为低风险级故障和高风险级故障;响应控制模块,用于根据oring线路故障的风险等级,控制任一电源执行告警响应模式或故障保护响应模式。
进一步地,采样模块包括:电压读取单元、第一采样单元和第二采样单元。其中,电压读取单元,用于通过IIC总线以及对应电源的地址,分别与服务器系统的每个电源通信,读取电源的oring线路隔离前电压12V_F和oring线路隔离后总线电压12VRS的PMBUS值;第一采样单元,用于对oring线路隔离前电压12V_F PMBUS值进行采样,寄存器赋值为8Bh;第二采样单元,用于对任一电源的oring线路隔离后总线电压12VRS的PMBUS值进行采样,寄存器赋值为B8h。
该实施例中提高电源oring可靠性的系统的工作原理和工作方法,在图1-图3所示的实施例中已经详细阐述,两个实施例之间可以互相参照,在此不再赘述。
以上所述仅是本申请的具体实施方式,使本领域技术人员能够理解或实现本申请。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种提高电源oring可靠性的方法,其特征在于,服务器电源中包括有多个并联连接的oring-Mos,且所述服务器电源中包括互为冗余的电源PSU0和PSU1,PSU0为主电源,PSU1为备用电源,所述方法包括:
服务器电源运行过程中,判断输出电源的电流是否大于等于设定的电流阈值;
如果是,启动PSU0和PSU1的oring-Mos压差检测;
分别对电源的oring线路隔离前电压和oring线路隔离后总线电压进行读取PMBUS值采样;
根据oring线路隔离前电压和oring线路隔离后总线电压的PMBUS寄存器值,利用公式Voring=12V_F-12VRS,计算得出任一电源的oring-Mos压差Voring,其中,12V_F为oring线路隔离前电压,12VRS为Oring线路隔离后总线电压;
判断所述任一电源的oring-Mos压差Voring是否小于等于设定的第一电压阈值;
如果是,判定MOS管完全导通,所述任一电源的oring-Mos工作正常;
如果否,判定MOS管未完全导通,所述任一电源的oring-Mos工作异常;
当所述任一电源的oring-Mos工作异常时,根据所述任一电源的oring-Mos压差,将oring线路故障划分为低风险级故障和高风险级故障;
根据oring线路故障的风险等级,控制所述任一电源执行告警响应模式或故障保护响应模式。
2.根据权利要求1所述的一种提高电源oring可靠性的方法,其特征在于,所述设定的电流阈值为50A。
3.根据权利要求1所述的一种提高电源oring可靠性的方法,其特征在于,所述分别对电源的oring线路隔离前电压和oring线路隔离后总线电压进行读取PMBUS值采样,包括:
BMC通过IIC总线以及对应电源的地址,分别与服务器系统的每个电源通信,读取电源的oring线路隔离前电压12V_F和oring线路隔离后总线电压12VRS的PMBUS值;
BMC对oring线路隔离前电压12V_F PMBUS值进行采样,寄存器赋值为8Bh;
BMC对所述任一电源的oring线路隔离后总线电压12VRS的PMBUS值进行采样,寄存器赋值为B8h。
4.根据权利要求1所述的一种提高电源oring可靠性的方法,其特征在于,根据所述任一电源的oring-Mos压差,将oring线路故障划分为低风险级故障和高风险级故障,包括:
当oring-Mos压差Voring满足:Voring≤第一电压阈值时,判定oring线路无故障;
当oring-Mos压差Voring满足:第一电压阈值<Voring<第二电压阈值时,判定oring线路故障等级为低风险级故障;
当oring-Mos压差Voring满足:Voring≥第二电压阈值时,判定oring线路故障等级为高风险级故障。
5.根据权利要求4所述的一种提高电源oring可靠性的方法,其特征在于,所述第一电压阈值为0.1V,所述第二电压阈值为0.3V。
6.根据权利要求1所述的一种提高电源oring可靠性的方法,其特征在于,所述根据oring线路故障的风险等级,控制所述任一电源执行告警响应模式或故障保护响应模式,包括:
当oring线路故障的风险等级为低风险级故障时,BMC控制所述任一电源执行告警响应模式;
当oring线路故障的风险等级为高风险级故障时,BMC控制所述任一电源执行故障保护响应模式。
7.根据权利要求6所述的一种提高电源oring可靠性的方法,其特征在于,当oring线路故障的风险等级为低风险级故障时,BMC控制所述任一电源执行告警响应模式包括:
当oring线路故障的风险等级为低风险级故障时,BMC发送冷备份指令给所述任一电源;
根据所获取的冷备份指令,所述任一电源关闭均流使能,调低输出电压使得所述任一电源进入待机状态;
当冗余电源中所述任一电源以外的另一电源发生故障时,低风险级故障的所述任一电源由待机状态进入开启工作状态。
8.根据权利要求6所述的一种提高电源oring可靠性的方法,其特征在于,当oring线路故障的风险等级为高风险级故障时,BMC控制所述任一电源执行故障保护响应模式,包括:
当oring线路故障的风险等级为高风险级故障时,BMC发送关机指令给所述任一电源;
根据所获取的关机指令,所述任一电源进入关机状态;
BMC上报所述任一电源oring故障,并记录日志;
根据所获取的更新命令,为所述任一电源槽口更新电源。
9.一种提高电源oring可靠性的系统,其特征在于,服务器电源中包括有多个并联连接的oring-Mos,且所述服务器电源中包括互为冗余的电源PSU0和PSU1,PSU0为主电源,PSU1为备用电源,所述系统包括:
第一判断模块,用于服务器电源运行过程中,判断输出电源的电流是否大于等于设定的电流阈值,如果是,启动PSU0和PSU1的Oring-Mos压差检测,否则,不启动oring-Mos压差检测;
采样模块,用于分别对电源的oring线路隔离前电压和oring线路隔离后总线电压进行读取PMBUS值采样;
oring-Mos压差计算模块,用于根据oring线路隔离前电压和oring线路隔离后总线电压的PMBUS寄存器值,利用公式Voring=12V_F-12VRS,计算得出任一电源的oring-Mos压差Voring,其中,12V_F为oring线路隔离前电压,12VRS为Oring线路隔离后总线电压;
第二判断模块,用于判断所述任一电源的oring-Mos压差Voring是否小于等于设定的第一电压阈值,如果是,判定MOS管完全导通,所述任一电源的oring-Mos工作正常,如果否,判定MOS管未完全导通,所述任一电源的oring-Mos工作异常;
oring线路故障划分模块,用于当所述任一电源的oring-Mos工作异常时,根据所述任一电源的oring-Mos压差,将oring线路故障划分为低风险级故障和高风险级故障;
响应控制模块,用于根据oring线路故障的风险等级,控制所述任一电源执行告警响应模式或故障保护响应模式。
10.根据权利要求9所述的一种提高电源oring可靠性的系统,其特征在于,所述采样模块包括:
电压读取单元,用于通过IIC总线以及对应电源的地址,分别与服务器系统的每个电源通信,读取电源的oring线路隔离前电压12V_F和oring线路隔离后总线电压12VRS的PMBUS值;
第一采样单元,用于对oring线路隔离前电压12V_F PMBUS值进行采样,寄存器赋值为8Bh;
第二采样单元,用于对所述任一电源的oring线路隔离后总线电压12VRS的PMBUS值进行采样,寄存器赋值为B8h。
CN202210906329.9A 2022-07-29 2022-07-29 一种提高电源oring可靠性的方法及系统 Active CN115309250B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210906329.9A CN115309250B (zh) 2022-07-29 2022-07-29 一种提高电源oring可靠性的方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210906329.9A CN115309250B (zh) 2022-07-29 2022-07-29 一种提高电源oring可靠性的方法及系统

Publications (2)

Publication Number Publication Date
CN115309250A CN115309250A (zh) 2022-11-08
CN115309250B true CN115309250B (zh) 2024-05-24

Family

ID=83859687

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210906329.9A Active CN115309250B (zh) 2022-07-29 2022-07-29 一种提高电源oring可靠性的方法及系统

Country Status (1)

Country Link
CN (1) CN115309250B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106104997A (zh) * 2014-03-20 2016-11-09 思科技术公司 用于当N+1冗余电源配置中的Oring‑FET在上电期间发生故障时防止总线电压下降的方法和系统
JP2019193337A (ja) * 2018-04-19 2019-10-31 富士電機株式会社 電源システム
CN111697555A (zh) * 2020-06-12 2020-09-22 中国船舶重工集团公司第七二四研究所 一种并联电源热插拔的控制电路
WO2021212943A1 (zh) * 2020-04-23 2021-10-28 苏州浪潮智能科技有限公司 一种服务器电源的维修方法、装置、设备及介质
CN114138587A (zh) * 2021-10-25 2022-03-04 苏州浪潮智能科技有限公司 服务器电源固件升级的可靠性验证方法、装置和设备

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106104997A (zh) * 2014-03-20 2016-11-09 思科技术公司 用于当N+1冗余电源配置中的Oring‑FET在上电期间发生故障时防止总线电压下降的方法和系统
JP2019193337A (ja) * 2018-04-19 2019-10-31 富士電機株式会社 電源システム
WO2021212943A1 (zh) * 2020-04-23 2021-10-28 苏州浪潮智能科技有限公司 一种服务器电源的维修方法、装置、设备及介质
CN111697555A (zh) * 2020-06-12 2020-09-22 中国船舶重工集团公司第七二四研究所 一种并联电源热插拔的控制电路
CN114138587A (zh) * 2021-10-25 2022-03-04 苏州浪潮智能科技有限公司 服务器电源固件升级的可靠性验证方法、装置和设备

Also Published As

Publication number Publication date
CN115309250A (zh) 2022-11-08

Similar Documents

Publication Publication Date Title
US7908505B2 (en) Apparatus, system, and method for event, time, and failure state recording mechanism in a power supply
CN109975721B (zh) 一种电源监测方法、系统和电源
WO2021159710A1 (zh) 一种bbu故障诊断方法、装置、电子设备及存储介质
US20240272621A1 (en) Method for linkage alarm between gas alarm and gas meter and system thereof
CN107678909B (zh) 一种服务器中监控芯片配置状态的电路及方法
CN111274099A (zh) 一种交换机系统的指示灯控制方法、系统、设备以及介质
CN111309562B (zh) 服务器故障的预测方法、装置、设备和存储介质
CN115808640B (zh) 电源故障检测电路、方法、系统、电子设备及存储介质
CN115685926A (zh) 工业现场数据容错处理方法及容错处理智能优化节能系统
CN117573455B (zh) 一种pcie设备检测系统、方法、装置及产品
CN115309250B (zh) 一种提高电源oring可靠性的方法及系统
US12106916B2 (en) Relay protective device, construction machine, relay protection control method and apparatus
CN112019455B (zh) 一种基于可编程逻辑器件的交换机监控装置及方法
CN105955864B (zh) 电源故障处理方法、电源模块、监控管理模块及服务器
CN117213755A (zh) 燃电系统的密封性故障检测方法、装置、系统和介质
CN113992501A (zh) 一种故障定位系统、方法及计算装置
CN203573310U (zh) 一种内存条安装故障的检测系统
CN107544881B (zh) 一种用来模拟服务器输入电压异常debug卡电路及方法
CN114328135A (zh) 一种设备故障指示方法、装置及相关设备
CN113868034A (zh) 服务器上电检测方法、电子设备及系统
CN114884021B (zh) 一种供电电路的供电控制方法及相关组件
CN114356617B (zh) 注错测试方法、装置、系统及计算设备
CN115955416B (zh) 测试upi降带宽的方法、装置、设备及存储介质
CN118708447A (zh) 硬盘点灯方法、装置、计算机设备和存储介质
CN118069459A (zh) 一种服务器中防烧板的方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant