CN111737077B - 一种服务器板卡防烧板监控系统 - Google Patents
一种服务器板卡防烧板监控系统 Download PDFInfo
- Publication number
- CN111737077B CN111737077B CN202010326816.9A CN202010326816A CN111737077B CN 111737077 B CN111737077 B CN 111737077B CN 202010326816 A CN202010326816 A CN 202010326816A CN 111737077 B CN111737077 B CN 111737077B
- Authority
- CN
- China
- Prior art keywords
- stage
- resistor
- monitoring
- capacitor
- circuit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012544 monitoring process Methods 0.000 title claims abstract description 187
- 230000002265 prevention Effects 0.000 title claims abstract description 17
- 239000003990 capacitor Substances 0.000 claims abstract description 118
- 238000011217 control strategy Methods 0.000 claims abstract description 31
- 239000000428 dust Substances 0.000 claims abstract description 24
- 239000000758 substrate Substances 0.000 claims abstract description 15
- 238000005070 sampling Methods 0.000 claims description 73
- 238000003491 array Methods 0.000 claims description 22
- 238000009825 accumulation Methods 0.000 claims description 10
- 238000012423 maintenance Methods 0.000 claims description 7
- 239000002344 surface layer Substances 0.000 claims description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Chemical compound O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 abstract description 7
- 238000010586 diagram Methods 0.000 description 6
- 238000013461 design Methods 0.000 description 5
- 238000001514 detection method Methods 0.000 description 3
- 230000017525 heat dissipation Effects 0.000 description 3
- 239000002245 particle Substances 0.000 description 3
- 239000010410 layer Substances 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000000034 method Methods 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000008021 deposition Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3058—Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3003—Monitoring arrangements specially adapted to the computing system or computing system component being monitored
- G06F11/3031—Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a motherboard or an expansion card
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computing Systems (AREA)
- Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Testing Of Short-Circuits, Discontinuities, Leakage, Or Incorrect Line Connections (AREA)
Abstract
本发明涉及服务器技术领域,提供一种服务器板卡防烧板监控系统,包括多级短路监测电路、电压比较器以及基板管理控制器,多级短路监测电路对处于当前工作环境下的多级电阻、多级电容和多级PCB走线中的一个或多个进行监控采样,并采样到的输出电压输送至电压比较器;电压比较器将接收到的多级短路监测电路采样到的输出电压与参考电压进行比较,输出电压大于参考电压,则输出高电平,反之输出低电平;根据电压比较器输出的电平信号,基板管理控制器生成控制策略,并将生成的控制策略反馈给对应的部件,从而实现服务器单板积尘水汽导致的烧板问题监测以及服务器短路风险管控及规避的功能。
Description
技术领域
本发明属于服务器技术领域,尤其涉及一种服务器板卡防烧板监控系统。
背景技术
伴随云计算和大数据技术的发展,服务器系统资源需求随之提升,处理器供应商通过处理器计算能力提升及升级多路处理器平台的手段实现系统资源整体升级,极大地提高整个系统的数据处理能力。处理器性能和数量的增加在提升系统资源的同时也增大了单板的器件密度及整机功耗,风扇的散热能力及风道设计决定了高密度板卡的热设计合理性。为满足散热需求,板卡上各芯片被形态各异的散热器覆盖着,另外机箱内各种功能的线缆也进一步挤压机箱空间,留给器件的布局空间急剧压缩,电阻、电容等小封装器件的间距随之减小。服务器运行温湿及空气成分环境各异,冷风区的空气在风扇引入机箱风道完成散热工作的同时也携带了各种水汽及带电离子颗粒,长时间运行就会出现板卡器件积尘的现象,布局紧密的0402及0201封装的电阻、电容电极间及选焊空焊盘间在此时存在水汽及带电离子短路的风险,最终可导致板卡异常短路烧板及系统宕机。此时需要在板卡设计方案内加入电阻积尘短路监测电路,做到防患于未然。
目前,在板卡设计方案内加入电阻积尘短路监测电路的具体实现为:背板防短路烧毁包括以下步骤:在板上的各个连接器处分别设有一温度检测装置,给设于中背板上的处理器上电,给各个温度检测装置上电;给各个模组供电;监控所述各个温度检测装置检测到的温度,若温升变化率缓慢,则整机系统正常启动,若温升变化率异常迅速,则对各个模组进行断电。但是,该方案无法提前监测预防短路情况,只能在功能电路短路问题出现时才能知晓;另外温度传感器放置位置不易确定,存在漏测的风险;高精度温度传感器成本较高,通过I2C监测温升斜率变化逻辑资源占用较多。
发明内容
针对现有技术中的缺陷,本发明提供了一种服务器板卡防烧板监控系统,旨在解决现有技术的防短路监测电路存在无法提前监测预防短路情况,而且存在漏测的风险的问题。
本发明所提供的技术方案是:一种服务器板卡防烧板监控系统,包括多级短路监测电路、电压比较器以及基板管理控制器,其中:
所述多级短路监测电路,设置在服务器机箱入风口处的PCB板上,用于对处于当前工作环境下的多级电阻、多级电容和多级PCB走线中的一个或多个进行监控采样,并采样到的输出电压输送至所述电压比较器;
所述电压比较器,与所述多级短路监测电路连接,用于将接收到的所述多级短路监测电路采样到的输出电压与参考电压进行比较,输出电压大于参考电压,则输出高电平,反之输出低电平;
所述基板管理控制器,与所述电压比较器连接,用于根据所述电压比较器输出的电平信号,生成控制策略,并将生成的控制策略反馈给对应的部件。
作为一种改进的方案,所述多级短路监测电路包括多级电阻短路监测电路、多级电容短路监测电路以及多级PCB走线短路监测电路,其中:
所述多级电阻短路监测电路包括两级监测点和与其对应的两级采样电阻阵列,两级所述采样电阻阵列设置在PCB板上;
所述多级电容短路监测电路包括两级监测点和与其对应的两级采样电容阵列,两级所述采样电容阵列设置在PCB板上;
所述多级PCB走线短路监测电路包括两级监测点和与其对应的两级PCB走线电路,两级所述PCB走线电路设置在所述PCB板上。
作为一种改进的方案,在所述多级电阻短路监测电路中,两级监测点为监测点TP1和监测点TP2,两级采样电阻阵列为第一级采样电阻阵列和第二级采样电阻阵列,所述第一级采样电阻阵列与所述监测点TP1相对应,所述第二级采样电阻阵列与所述监测点TP2相对应;
其中,由0402封装且两两相互平行设置的电阻R3、电阻R4、电阻R5、电阻R6、电阻R7、电阻R8、电阻R9以及电阻R10组成所述第一级采样电阻阵列,由0402封装且两两相互平行设置的电阻R11、电阻R12、电阻R13、电阻R14、电阻R15、电阻R16、电阻R17以及电阻R18组成所述第二级采样电阻阵列;
所述第一级采样电阻阵列之间的电阻器件间距为D1,所述第二级采样电阻阵列之间的电阻器件间距为所述间距D1的0.5倍;
所述电阻R3、电阻R5、电阻R7以及电阻R9分别与电阻R2的一端连接,所述电阻R2的另一端与3V3电源端连接,所述电阻R11、电阻R13、电阻R15以及电阻R17分别与电阻R1的一端连接,所述电阻R1的另一端与3V3电源端连接,所述电阻R1和电阻R2由0603封装,且为上拉电阻,所述电阻R4、电阻R5、电阻R8、电阻R10、电阻R12、电阻R14、电阻R16以及电阻R18均接地。
作为一种改进的方案,所述电阻R3、电阻R4、电阻R7、电阻R8、电阻R11、电阻R12、电阻R15以及电阻R16的电阻CN选焊不上件。
作为一种改进的方案,在所述多级电容短路监测电路中,两级监测点为监测点TP3和监测点TP4,两级采样电容阵列为第一级采样电容阵列和第二级采样电容阵列,所述第一级采样电容阵列与所述监测点TP3相对应,所述第二级采样电容阵列与所述监测点TP4相对应;
其中,由0201封装且两两相互平行设置的电容C3、电容C4、电容C5、电容C6、电容C7、电容C8、电容C9以及电容C10组成所述第一级采样电容阵列,由0402封装且两两相互平行设置的电容C11、电容C12、电容C13、电容C14、电容C15、电容C16、电容C17以及电容C18组成所述第二级采样电容阵列;
所述第一级采样电容阵列之间的电阻器件间距为D2,所述第二级采样电容阵列之间的电阻器件间距为所述间距D2的0.5倍;
所述电容C3、电容C5、电容C7以及电容C9分别与电阻R2的一端连接,所述电阻R2的另一端与3V3电源端连接,所述电容C11、电容C13、电容C15以及电容C17分别与电阻R1的一端连接,所述电阻R1的另一端与3V3电源端连接,所述电阻R1和电阻R2由0603封装,且为上拉电阻,所述电容C4、电容C5、电容C8、电容C10、电容C12、电容C14、电容C16以及电容C18均接地。
作为一种改进的方案,所述电容C3、电容C4、电容C7、电容C8、电容C11、电容C12、电容C15以及电容C16的电容CN选焊不上件。
作为一种改进的方案,在所述多级PCB走线短路监测电路中,两级监测点为监测点TP5和监测点TP6,两级PCB走线电路为第一级PCB走线电路和第二级PCB走线电路,所述第一级PCB走线电路与所述监测点TP5相对应,所述第二级PCB走线电路与所述监测点TP6相对应;
其中,所述第一级PCB走线电路和第二级PCB走线电路均为SI规定表层走线线路暗的蛇形、漏铜且平行的走线,所述第一级PCB走线电路的线路间距为D3,所述第二级PCB走线电路的线路间距为D3的0.5倍。
作为一种改进的方案,所述电压比较器的数量为六个,记为U20j,j=1、2、3、4、5、6,每一个电压比较器的同向输入端与对应的监测点TPj对应连接,反向输入端与参考电压VREFj对应连接,输出端与所述基板管理控制器的接口GPIOj对应连接。
作为一种改进的方案,每一个电压比较器与监测点之间的线路上设有一运算放大器U20j,j=1、2、3、4、5、6,每一个所述运算放大器的输出与输入的比例为1。
作为一种改进的方案,所述基板管理控制器具体包括:
第一控制策略生成单元,用于当所述基板管理控制器的接口GPIO1至接口GPIO6均为高电平时,生成并输出监测结果正常无风险的第一控制策略;
第二控制策略生成单元,用于当GPIO2或GPIO4或GPIO6为低电平时,生成并输出提醒运维人员观察跟踪机箱积尘情况和检查机房空气环境情况的第二控制策略;
第三控制策略生成模块,用于当GPIO1或GPIO3或GPIO5为低时,生成设备短路的第三控制策略。
在本发明实施例中,服务器板卡防烧板监控系统包括多级短路监测电路、电压比较器以及基板管理控制器,多级短路监测电路对处于当前工作环境下的多级电阻、多级电容和多级PCB走线中的一个或多个进行监控采样,并采样到的输出电压输送至电压比较器;电压比较器将接收到的多级短路监测电路采样到的输出电压与参考电压进行比较,输出电压大于参考电压,则输出高电平,反之输出低电平;根据电压比较器输出的电平信号,基板管理控制器生成控制策略,并将生成的控制策略反馈给对应的部件,从而实现服务器单板积尘水汽导致的烧板问题监测以及服务器短路风险管控及规避的功能。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍。在所有附图中,类似的元件或部分一般由类似的附图标记标识。附图中,各元件或部分并不一定按照实际的比例绘制。
图1是本发明提供的服务器板卡防烧板监控系统的结构框图;
图2是本发明提供的多级电阻短路监测电路的结构示意图;
图3是本发明提供的多级电容短路监测电路的结构示意图;
图4是本发明提供的多级PCB走线短路监测电路的结构示意图;
图5是本发明提供的服务器板卡防烧板监控系统的实现示意图。
具体实施方式
下面将结合附图对本发明技术方案的实施例进行详细的描述。以下实施例仅用于更加清楚地说明本发明的、技术方案,因此只作为示例,而不能以此来限制本发明的保护范围。
图1是本发明提供的服务器板卡防烧板监控系统的结构框图,为了便于说明,图中仅给出了与本发明实施例相关的部分。
服务器板卡防烧板监控系统包括多级短路监测电路1、电压比较器2以及基板管理控制器3,其中:
多级短路监测电路1,设置在服务器机箱入风口处的PCB板上,用于对处于当前工作环境下的多级电阻、多级电容和多级PCB走线中的一个或多个进行监控采样,并采样到的输出电压输送至所述电压比较器;
电压比较器2,与所述多级短路监测电路1连接,用于将接收到的所述多级短路监测电路采样到的输出电压与参考电压进行比较,输出电压大于参考电压,则输出高电平,反之输出低电平;
基板管理控制器3,与所述电压比较器2连接,用于根据所述电压比较器输出的电平信号,生成控制策略,并将生成的控制策略反馈给对应的部件,其中,该部件包括主控节点、CPLD/FPGA以及EFUSE等。
在本发明实施例中,多级短路监测电路1设置在机箱入风口处PCB的TOP层,该处为积尘程度最严重区域,该区域监测情况可最大程度反映机箱内单板上全部区域的器件可靠状态。
结合图1所示,多级短路监测电路1包括多级电阻短路监测电路4、多级电容短路监测电路5以及多级PCB走线短路监测电路6,其中:
多级电阻短路监测电路4包括两级监测点和与其对应的两级采样电阻阵列,两级所述采样电阻阵列设置在PCB板上;
多级电容短路监测电路5包括两级监测点和与其对应的两级采样电容阵列,两级所述采样电容阵列设置在PCB板上;
多级PCB走线短路监测电路6包括两级监测点和与其对应的两级PCB走线电路,两级所述PCB走线电路设置在所述PCB板上。
为了便于说明,下述给出上述三个多级短路监测电路的具体实现:
如图2所示,在多级电阻短路监测电路4中,两级监测点为监测点TP1和监测点TP2,两级采样电阻阵列为第一级采样电阻阵列和第二级采样电阻阵列,所述第一级采样电阻阵列与所述监测点TP1相对应,所述第二级采样电阻阵列与所述监测点TP2相对应;
其中,服务器板卡风扇吸入水汽及带电离子粉尘颗粒进机箱,服务器板卡最小电阻封装为0402封装,为了监测板卡电阻在积尘状态下的通断情况,在服务器机箱入风口区域设置采样电路。在单板Layout布局完成后,统计板上两0402电阻间的最小间距D1,在板上放置如图2所示的两级采样电阻阵列。
在该实施例中,由0402封装且两两相互平行设置的电阻R3、电阻R4、电阻R5、电阻R6、电阻R7、电阻R8、电阻R9以及电阻R10组成所述第一级采样电阻阵列,由0402封装且两两相互平行设置的电阻R11、电阻R12、电阻R13、电阻R14、电阻R15、电阻R16、电阻R17以及电阻R18组成所述第二级采样电阻阵列;
第一级采样电阻阵列之间的电阻器件间距为D1,所述第二级采样电阻阵列之间的电阻器件间距为所述间距D1的0.5倍;
电阻R3、电阻R5、电阻R7以及电阻R9分别与电阻R2的一端连接,所述电阻R2的另一端与3V3电源端连接,所述电阻R11、电阻R13、电阻R15以及电阻R17分别与电阻R1的一端连接,所述电阻R1的另一端与3V3电源端连接,所述电阻R1和电阻R2由0603封装,且为上拉电阻,所述电阻R4、电阻R5、电阻R8、电阻R10、电阻R12、电阻R14、电阻R16以及电阻R18均接地。
其中,电阻R3、电阻R4、电阻R7、电阻R8、电阻R11、电阻R12、电阻R15以及电阻R16的电阻CN选焊不上件,模拟板卡上选焊不上件电阻空焊盘间的短路场景。
在该实施例中,当0.5倍间距D1监测电阻正常时,监测点TP2为高电平,当0.5倍D1监测电阻发生短路,监测点TP2为低电平,电平的变化通过电压比较器传递到基板管理控制器,此时基板管理控制器做出低风险告警应答,通知主控节点,提醒运维人员观察跟踪机箱积尘情况和检查机房空气环境情况。当1倍D1监测电阻正常时,监测点TP1为高电平,当1倍D1监测电阻发生短路,监测点TP1为低电平,电平的变化通过电压比较器传递到基板管理控制器,此时基板管理控制器做出高风险告警应答,通知主控节点此单板存在积尘短路问题,需要进行维护清理机箱积尘,同时通过SMBUS总线通知CPLD/GPFA对板卡进行下电处理,避免短路问题蔓延,导致烧板问题出现。
如图3所示,在多级电容短路监测电路5中,两级监测点为监测点TP3和监测点TP4,两级采样电容阵列为第一级采样电容阵列和第二级采样电容阵列,所述第一级采样电容阵列与所述监测点TP3相对应,所述第二级采样电容阵列与所述监测点TP4相对应;
在该实施例中,服务器板卡风扇吸入水汽及带电离子粉尘颗粒进机箱,服务器板卡最小电容封装为0201封装,为了监测板卡电容在积尘状态下的情况,在服务器机箱入风口区域设置采样电路。在单板Layout布局完成后,统计板上两0201电容间的最小间距D2,在板上设计如图3所示的两级采样电容阵列。
其中,由0201封装且两两相互平行设置的电容C3、电容C4、电容C5、电容C6、电容C7、电容C8、电容C9以及电容C10组成所述第一级采样电容阵列,由0402封装且两两相互平行设置的电容C11、电容C12、电容C13、电容C14、电容C15、电容C16、电容C17以及电容C18组成所述第二级采样电容阵列;
第一级采样电容阵列之间的电阻器件间距为D2,所述第二级采样电容阵列之间的电阻器件间距为所述间距D2的0.5倍;
电容C3、电容C5、电容C7以及电容C9分别与电阻R2的一端连接,所述电阻R2的另一端与3V3电源端连接,所述电容C11、电容C13、电容C15以及电容C17分别与电阻R1的一端连接,所述电阻R1的另一端与3V3电源端连接,所述电阻R1和电阻R2由0603封装,且为上拉电阻,所述电容C4、电容C5、电容C8、电容C10、电容C12、电容C14、电容C16以及电容C18均接地。
在本发明实施例中,电容C3、电容C4、电容C7、电容C8、电容C11、电容C12、电容C15以及电容C16的电容CN选焊不上件,模拟板卡上选焊不上件电容空焊盘间的短路场景。
在本发明实施例中,当0.5倍D2监测电容正常时,监测点TP4为高电平,当0.5倍D2监测电容电极间发生短路,监测点TP4为低电平,电平的变化通过电压比较器传递到基板管理控制器,此时基板管理控制器BMC做出低风险告警应答,通知主控节点,提醒运维人员观察跟踪机箱积尘情况和检查机房空气环境情况。当1倍D2监测电容正常时,TP3为高电平,当1倍D2监测电容电极间发生短路,TP1为低电平,电平的变化通过电压比较器传递到BMC,此时基板管理控制器做出高风险告警应答,计算节点通知主控节点此单板存在积尘短路问题,需要进行维护清理机箱积尘,同时通过SMBUS总线通知CPLD对板卡进行下电处理,避免短路问题蔓延,导致烧板问题出现。
如图4所示,在多级PCB走线短路监测电路6中,两级监测点为监测点TP5和监测点TP6,两级PCB走线电路为第一级PCB走线电路和第二级PCB走线电路,所述第一级PCB走线电路与所述监测点TP5相对应,所述第二级PCB走线电路与所述监测点TP6相对应;
其中,第一级PCB走线电路和第二级PCB走线电路均为SI规定表层走线线路暗的蛇形、漏铜且平行的走线,所述第一级PCB走线电路的线路间距为D3,第二级PCB走线电路的线路间距为D3的0.5倍。
在本发明实施例中,当0.5倍D3监测线距走线正常时,监测点TP6为高电平,当0.5倍D3监测线距走线间发生短路,监测点TP6为低电平,电平的变化通过电压比较器传递到基板管理控制器,此时基板管理控制器做出低风险告警应答,计算节点通知主控节点,提醒运维人员观察跟踪机箱积尘情况和检查机房空气环境情况。当1倍D3监测线距走线正常时,TP5为高电平,当1倍D3监测线距走线间发生短路,TP5为低电平,电平的变化通过电压比较器传递到基板管理控制器,此时基板管理控制器做出高风险告警应答,计算节点通知主控节点此单板存在积尘短路问题,需要进行维护清理机箱积尘,同时通过SMBUS总线通知CPLD/GPFA对板卡进行下电处理,避免短路问题蔓延,导致烧板问题出现。
在本发明实施例中,电压比较器的数量为六个,记为U20j,j=1、2、3、4、5、6,每一个电压比较器的同向输入端与对应的监测点TPj对应连接,反向输入端与参考电压VREFj对应连接,输出端与所述基板管理控制器的接口GPIOj对应连接。
在此基础上,每一个电压比较器与监测点之间的线路上设有一运算放大器U20j,j=1、2、3、4、5、6,每一个所述运算放大器的输出与输入的比例为1。
在本发明实施例中,基板管理控制器具体包括:
第一控制策略生成单元,用于当所述基板管理控制器的接口GPIO1至接口GPIO6均为高电平时,生成并输出监测结果正常无风险的第一控制策略;
第二控制策略生成单元,用于当GPIO2或GPIO4或GPIO6为低电平时,生成并输出提醒运维人员观察跟踪机箱积尘情况和检查机房空气环境情况的第二控制策略;
第三控制策略生成模块,用于当GPIO1或GPIO3或GPIO5为低时,生成设备短路的第三控制策略。
为了便于说明,下述结合图5,给出本发明提供的服务器板卡防烧板监控系统的具体实现:
1)TP1到TP6为图2、图3和图4中的监测电路的监测点,TP1,TP2为电阻短路监测点,TP3,TP4为电容短路监测点。TP5,TP6为PCB短路监测点;
2)U10j(j=0,1,2,……6)为按照电压跟随器接法连接的运算放大器,输出与输入比例为1,作用为隔离前后级,减小后级分压对前级的影响;
3)U20j(j=0,1,2,……6)为6个独立的电压比较器,电压比较器两个输入,一个输入是电压跟随器的输出电压Vi,另一输入为参考电压VREFj(j=0,1,2,……n),电压比较器根据两个输入的大小来决定输出电平的高低,如果电压跟随器的输出电压Vi>VREFj,则电压比较器输出高电平;如果电压跟随器的输出电压Vi≤VREFj,则电压比较器输出低电平。本设计将10%的电压降额作为短路风险的判断点,电源为3.3V时,Vi≤3V时,即报短路情况。将电压跟随器的输出Vi分别与参考电压VREFj(j=0,1,2,……6)=3V进行比较后得出不同的高低电平信号给BMC。RjA、RjB、RjC为串阻(j=0,1,2,……6),其中RjA=RjB;
4)BMC负责将电压比较器给出的高低电平信号汇总后给出控制策略;
当GPIO1到GPIO6为高时,监测结果正常,无风险;
当GPIO2或GPIO4或GPIO6为低时,此时BMC做出低风险告警应答,计算节点通知主控节点,提醒运维人员观察跟踪机箱积尘情况和检查机房空气环境情况;
当GPIO1或GPIO3或GPIO5为低时,BMC认为是设备短路,BMC通过CANBUS或I2C通知机房主控节点的BMC,记录该服务器板卡短路风险log,BMC内部通过SMBUS通知CPLD,在CPLD内定时器30分钟内,若CPLD无接受到告警解除信号,主控节点BMC会切换短路告警服务器的计算任务至备份服务器,待业务切换完毕后,问题服务器CPLD会输出Disable POWER的命令完成服务器下电,规避烧板风险;
5)U10j、U20j(j=0,1,2,……6)均使用STANDBY电(系统插上电源线,没按下开机按键时存在的电,即待机电源)供电,不使用主电源P12V供电。
在本发明实施例中,服务器板卡防烧板监控系统包括多级短路监测电路、电压比较器以及基板管理控制器,多级短路监测电路对处于当前工作环境下的多级电阻、多级电容和多级PCB走线中的一个或多个进行监控采样,并采样到的输出电压输送至电压比较器;电压比较器将接收到的多级短路监测电路采样到的输出电压与参考电压进行比较,输出电压大于参考电压,则输出高电平,反之输出低电平;根据电压比较器输出的电平信号,基板管理控制器生成控制策略,并将生成的控制策略反馈给对应的部件,从而实现服务器单板积尘水汽导致的烧板问题监测以及服务器短路风险管控及规避的功能。
以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围,其均应涵盖在本发明的权利要求和说明书的范围当中。
Claims (9)
1.一种服务器板卡防烧板监控系统,其特征在于,包括多级短路监测电路、电压比较器以及基板管理控制器,其中:
所述多级短路监测电路,设置在服务器机箱入风口处的PCB板上,用于对处于当前工作环境下的多级电阻、多级电容和多级PCB走线中的一个或多个进行监控采样,并采样到的输出电压输送至所述电压比较器;
所述电压比较器,与所述多级短路监测电路连接,用于将接收到的所述多级短路监测电路采样到的输出电压与参考电压进行比较,输出电压大于参考电压,则输出高电平,反之输出低电平;
所述基板管理控制器,与所述电压比较器连接,用于根据所述电压比较器输出的电平信号,生成控制策略,并将生成的控制策略反馈给对应的部件;
所述多级短路监测电路包括多级电阻短路监测电路、多级电容短路监测电路以及多级PCB走线短路监测电路,其中:
所述多级电阻短路监测电路包括两级监测点和与其对应的两级采样电阻阵列,两级所述采样电阻阵列设置在PCB板上;
所述多级电容短路监测电路包括两级监测点和与其对应的两级采样电容阵列,两级所述采样电容阵列设置在PCB板上;
所述多级PCB走线短路监测电路包括两级监测点和与其对应的两级PCB走线电路,两级所述PCB走线电路设置在所述PCB板上。
2.根据权利要求1所述的服务器板卡防烧板监控系统,其特征在于,在所述多级电阻短路监测电路中,两级监测点为监测点TP1和监测点TP2,两级采样电阻阵列为第一级采样电阻阵列和第二级采样电阻阵列,所述第一级采样电阻阵列与所述监测点TP1相对应,所述第二级采样电阻阵列与所述监测点TP2相对应;
其中,由0402封装且两两相互平行设置的电阻R3、电阻R4、电阻R5、电阻R6、电阻R7、电阻R8、电阻R9以及电阻R10组成所述第一级采样电阻阵列,由0402封装且两两相互平行设置的电阻R11、电阻R12、电阻R13、电阻R14、电阻R15、电阻R16、电阻R17以及电阻R18组成所述第二级采样电阻阵列;
所述第一级采样电阻阵列之间的电阻器件间距为D1,所述第二级采样电阻阵列之间的电阻器件间距为所述间距D1的0.5倍;
所述电阻R3、电阻R5、电阻R7以及电阻R9分别与电阻R2的一端连接,所述电阻R2的另一端与3V3电源端连接,所述电阻R11、电阻R13、电阻R15以及电阻R17分别与电阻R1的一端连接,所述电阻R1的另一端与3V3电源端连接,所述电阻R1和电阻R2由0603封装,且为上拉电阻,所述电阻R4、电阻R5、电阻R8、电阻R10、电阻R12、电阻R14、电阻R16以及电阻R18均接地。
3.根据权利要求2所述的服务器板卡防烧板监控系统,其特征在于,所述电阻R3、电阻R4、电阻R7、电阻R8、电阻R11、电阻R12、电阻R15以及电阻R16的电阻CN选焊不上件。
4.根据权利要求3所述的服务器板卡防烧板监控系统,其特征在于,在所述多级电容短路监测电路中,两级监测点为监测点TP3和监测点TP4,两级采样电容阵列为第一级采样电容阵列和第二级采样电容阵列,所述第一级采样电容阵列与所述监测点TP3相对应,所述第二级采样电容阵列与所述监测点TP4相对应;
其中,由0201封装且两两相互平行设置的电容C3、电容C4、电容C5、电容C6、电容C7、电容C8、电容C9以及电容C10组成所述第一级采样电容阵列,由0402封装且两两相互平行设置的电容C11、电容C12、电容C13、电容C14、电容C15、电容C16、电容C17以及电容C18组成所述第二级采样电容阵列;
所述第一级采样电容阵列之间的电阻器件间距为D2,所述第二级采样电容阵列之间的电阻器件间距为所述间距D2的0.5倍;
所述电容C3、电容C5、电容C7以及电容C9分别与电阻R2的一端连接,所述电阻R2的另一端与3V3电源端连接,所述电容C11、电容C13、电容C15以及电容C17分别与电阻R1的一端连接,所述电阻R1的另一端与3V3电源端连接,所述电阻R1和电阻R2由0603封装,且为上拉电阻,所述电容C4、电容C5、电容C8、电容C10、电容C12、电容C14、电容C16以及电容C18均接地。
5.根据权利要求4所述的服务器板卡防烧板监控系统,其特征在于,所述电容C3、电容C4、电容C7、电容C8、电容C11、电容C12、电容C15以及电容C16的电容CN选焊不上件。
6.根据权利要求5所述的服务器板卡防烧板监控系统,其特征在于,在所述多级PCB走线短路监测电路中,两级监测点为监测点TP5和监测点TP6,两级PCB走线电路为第一级PCB走线电路和第二级PCB走线电路,所述第一级PCB走线电路与所述监测点TP5相对应,所述第二级PCB走线电路与所述监测点TP6相对应;
其中,所述第一级PCB走线电路和第二级PCB走线电路均为SI规定表层走线线路暗的蛇形、漏铜且平行的走线,所述第一级PCB走线电路的线路间距为D3,所述第二级PCB走线电路的线路间距为D3的0.5倍。
7.根据权利要求6所述的服务器板卡防烧板监控系统,其特征在于,所述电压比较器的数量为六个,记为U20j,j=1、2、3、4、5、6,每一个电压比较器的同向输入端与对应的监测点TPj对应连接,反向输入端与参考电压VREFj对应连接,输出端与所述基板管理控制器的接口GPIOj对应连接。
8.根据权利要求7所述的服务器板卡防烧板监控系统,其特征在于,每一个电压比较器与监测点之间的线路上设有一运算放大器U20j,j=1、2、3、4、5、6,每一个所述运算放大器的输出与输入的比例为1。
9.根据权利要求8所述的服务器板卡防烧板监控系统,其特征在于,所述基板管理控制器具体包括:
第一控制策略生成单元,用于当所述基板管理控制器的接口GPIO1至接口GPIO6均为高电平时,生成并输出监测结果正常无风险的第一控制策略;
第二控制策略生成单元,用于当GPIO2或GPIO4或GPIO6为低电平时,生成并输出提醒运维人员观察跟踪机箱积尘情况和检查机房空气环境情况的第二控制策略;
第三控制策略生成模块,用于当GPIO1或GPIO3或GPIO5为低时,生成设备短路的第三控制策略。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010326816.9A CN111737077B (zh) | 2020-04-23 | 2020-04-23 | 一种服务器板卡防烧板监控系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010326816.9A CN111737077B (zh) | 2020-04-23 | 2020-04-23 | 一种服务器板卡防烧板监控系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111737077A CN111737077A (zh) | 2020-10-02 |
CN111737077B true CN111737077B (zh) | 2023-01-06 |
Family
ID=72647849
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010326816.9A Active CN111737077B (zh) | 2020-04-23 | 2020-04-23 | 一种服务器板卡防烧板监控系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111737077B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112506330B (zh) * | 2020-12-04 | 2023-04-14 | 浪潮电子信息产业股份有限公司 | 一种板级服务器防烧板方法、系统及板级服务器 |
US11988706B2 (en) * | 2021-12-29 | 2024-05-21 | Quanta Computer Inc. | Trace level voltage sensor for multi-layer printed circuit boards |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107462793A (zh) * | 2017-08-18 | 2017-12-12 | 郑州云海信息技术有限公司 | 一种服务器电压相关信号监测装置及监测方法 |
CN110502087A (zh) * | 2019-07-19 | 2019-11-26 | 苏州浪潮智能科技有限公司 | 一种服务器防烧板系统及工作方法 |
CN111009883A (zh) * | 2019-11-29 | 2020-04-14 | 苏州浪潮智能科技有限公司 | 一种防止pcie设备过电流误触发的方法 |
-
2020
- 2020-04-23 CN CN202010326816.9A patent/CN111737077B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107462793A (zh) * | 2017-08-18 | 2017-12-12 | 郑州云海信息技术有限公司 | 一种服务器电压相关信号监测装置及监测方法 |
CN110502087A (zh) * | 2019-07-19 | 2019-11-26 | 苏州浪潮智能科技有限公司 | 一种服务器防烧板系统及工作方法 |
CN111009883A (zh) * | 2019-11-29 | 2020-04-14 | 苏州浪潮智能科技有限公司 | 一种防止pcie设备过电流误触发的方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111737077A (zh) | 2020-10-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10554036B2 (en) | Modular power distribution system and methods | |
US7028125B2 (en) | Hot-pluggable peripheral input device coupling system | |
CN111737077B (zh) | 一种服务器板卡防烧板监控系统 | |
CN102521109B (zh) | 服务器状态监测方法 | |
US6737763B2 (en) | Intelligent load sharing with power limiting scheme for multiple power supplies connected to a common load | |
US8185753B2 (en) | Storage medium for storing power consumption monitor program, power consumption monitor apparatus and power consumption monitor method | |
US6661119B2 (en) | System and method for distributed power supply supporting high currents with redundancy | |
CN115459204B (zh) | 一种并联hsc芯片故障处理装置、方法、设备及介质 | |
CN104564764A (zh) | 服务器系统 | |
CN104571273A (zh) | 风扇控制器以及具有该风扇控制器的服务器系统 | |
JP6137387B1 (ja) | 電源中継ユニット | |
CN210038709U (zh) | 一种电源监控管理扣板 | |
CN114878113B (zh) | 一种液冷服务器漏液检测装置及检测方法 | |
US6876102B2 (en) | Diode fault detection system and method | |
Ahmed et al. | Risk assessment of server outages due to voltage dips in the internal power supply system of a data center | |
CN100485634C (zh) | 采用热事件检测的电路板、系统和方法 | |
CN219811180U (zh) | 计算设备 | |
CN108763022A (zh) | 一种基于i2c协议的智能平台管理接口系统 | |
CN204087119U (zh) | 高可用性的防水耐震键盘 | |
CN113671343B (zh) | 算力板、数据处理设备及计算机服务器 | |
CN218866449U (zh) | Bmc电源检测电路、主板及计算机设备 | |
CN220518217U (zh) | 基于ipmi技术的箱体管理装置 | |
CN115658442A (zh) | 机箱状态监测电路、服务器机箱和服务器系统 | |
CN105811505A (zh) | 具有保护预警功能的电池及具有该电池的电子设备 | |
CN113091391A (zh) | 一种用于蒸发加热器的控制电路及其控制系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |