CN106940676B - 机柜的监控系统 - Google Patents

机柜的监控系统 Download PDF

Info

Publication number
CN106940676B
CN106940676B CN201610012683.1A CN201610012683A CN106940676B CN 106940676 B CN106940676 B CN 106940676B CN 201610012683 A CN201610012683 A CN 201610012683A CN 106940676 B CN106940676 B CN 106940676B
Authority
CN
China
Prior art keywords
logic value
baseboard management
bus
monitoring system
logic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201610012683.1A
Other languages
English (en)
Other versions
CN106940676A (zh
Inventor
王博玮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shencloud Technology Co Ltd
Shunda Computer Factory Co Ltd
Original Assignee
Shencloud Technology Co Ltd
Shunda Computer Factory Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shencloud Technology Co Ltd, Shunda Computer Factory Co Ltd filed Critical Shencloud Technology Co Ltd
Priority to CN201610012683.1A priority Critical patent/CN106940676B/zh
Publication of CN106940676A publication Critical patent/CN106940676A/zh
Application granted granted Critical
Publication of CN106940676B publication Critical patent/CN106940676B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)
  • Cooling Or The Like Of Electrical Apparatus (AREA)

Abstract

一种机柜的监控系统,包含一个总线、多个基板管理控制器、及一个控制单元。该等基板管理控制器在开机启动之后,各自产生一个心跳信号,且各自根据一个对应的判定信号,各自决定操作在一个主控模式及一个从属模式之间。该控制单元接收该等心跳信号,并据以产生该等对应的判定信号,以控制该等基板管理控制器之其中最先正常运作者操作在该主控模式,并控制其余者操作在该从属模式。操作在该主控模式的该基板管理控制器经由该总线获得来自操作在该从属模式的该等基板管理控制器的多个运作数据,以监控一个受监控单元。

Description

机柜的监控系统
技术领域
本发明是有关于一种监控系统,特别是指一种机柜的监控系统。
背景技术
习知的机柜(Rack)包含一个机柜管理控制器(Rack/Chassis ManagementController;RMC/CMC)、至少一个机柜背板(Rack Back Plane;RBP)、至少一个托盘背板(Tray Back Plane;TBP)、至少一个节点(Node)、一个风扇背板(Fan Board;FB)、一个电源分配板(Power Distribution Board;PDB)。每一个机柜背板电连接至少一个托盘背板,每一个托盘背板电连接至少一个节点,每一个节点就是一个服务器节点且包括一个机板管理控制器(Baseboard Management Controller;BMC),该风扇背板包括至少一个风扇,该电源分配板包括至少一个电源模块(Power Supply Unit;PSU)。
参阅图1,举例说明该机柜包含一个机柜管理控制器9、一个机柜背板91、一个电源分配板92、三个电源模块921、922、923、二个托盘背板93、94、一个风扇背板95、五个节点931、932、941、942、943、五个机板管理控制器933、934、944、945、946、三个风扇951、952、953。该等基板管理控制器933、934、944、945、946分别经由该等托盘背板93、94及该风扇背板95电连接该等风扇951、952、953,以各自侦测该对应的风扇951、952、953的运作状况,例如每一个风扇的温度、转速等等。该机柜管理控制器9经由该机柜背板91及该等托盘背板93、94电连接该等基板管理控制器933、934、944、945、946以获得并监看该等风扇951、952、953的运作状况。该机柜管理控制器9还经由该机柜背板91及该风扇背板95电连接该等风扇951、952、953,且根据该等风扇951、952、953的运作状况,控制该等风扇951、952、953的转速,以决定该等风扇951、952、953的散热能力进而调整该机柜内的温度。然而,在这种习知的机柜设计中,要以一个芯片实现该机柜管理控制器9时,因为该机柜管理控制器9需要具有足够的沟通接口及感测接口,且还须具备足够的计算能力,导致该机柜管理控制器9的芯片的复杂度的等级往往相当于该等基板管理控制器933、934、944、945、946的该等控制芯片。
发明内容
本发明的主要目的在于提供一种低复杂度及低成本的机柜的监控系统。
为达上述目的,本发明机柜的监控系统,适用于监控一个受监控单元,并包含一个总线、多个基板管理控制器、一个控制单元。
该等基板管理控制器电连接该总线及该受监控单元,并在开机启动之后,各自产生一个心跳信号,且各自根据一个对应的判定信号,各自决定操作在一个主控模式及一个从属模式之间。操作在该主控模式的该基板管理控制器经由该总线获得来自操作在该从属模式的该等基板管理控制器的多个运作数据,以监控该受监控单元。
该控制单元电连接该等基板管理控制器,以接收来自该等基板管理控制器的该等心跳信号,并根据该等心跳信号,产生该等对应的判定信号,以控制该等基板管理控制器之其中最先正常运作者操作在该主控模式,并控制该等基板管理控制器之其中其余者操作在该从属模式。
优选地,每一个基板管理控制器在开机启动且正常运作时,产生在一个第一逻辑值与一个第二逻辑值之间跳动的该心跳信号。当该控制单元侦测到该等基板管理控制器之其中第一个的该心跳信号在该第一逻辑值与该第二逻辑值之间跳动时,该控制单元将传送至该等基板管理控制器之其中该第一个的该判定信号的逻辑值由一个第三逻辑值改变为一个第四逻辑值。
优选地,操作在该主控模式的该基板管理控制器是运作为一个机柜管理控制器(Rack/Chassis Management Controller;RMC/CMC),以监看并控制该受监控单元。
优选地,当该控制单元侦测到来自运作为该机柜管理控制器的该基板管理器的该心跳信号没有在该第一逻辑值及该第二逻辑值之间跳动时,该控制单元根据一个预定顺序,决定将送至该等基板管理控制器之其余哪一者的该判定信号的逻辑值由该第三逻辑值改变为该第四逻辑值,且该等基板管理控制器之该者的该心跳信号有在该第一逻辑值与该第二逻辑值之间跳动。
优选地,该受监控单元可以包含该计算机系统的多个节点、多个风扇单元、多个电源单元、及多个硬盘之其中任何一者。
优选地,该受监控单元包含多个风扇单元,每一个基板管理控制器适用于电连接该等风扇单元之其中一个对应者。其中,每一个基板管理控制器在正常运作时,侦测所电连接的该风扇单元以获得相关于该对应的风扇单元的该运作数据。操作在该主控模式的该基板管理控制器经由该总线获得操作在该从属模式的该等基板管理控制器所侦测的该等运作数据,以监看并控制该等风扇单元。
优选地,该总线支持智能平台管理接口(Intelligent Platform ManagementInterface;IPMI)、串行输入输出(Serial I/O)、及区域网(Local Area Network;LAN)之其中一种协议。当该总线支持智能平台管理接口时,该总线是一种智能平台管理总线(Intelligent Platform Management Bus;IPMB)。
优选地,该第一逻辑值及该第二逻辑值之其中一者及另一者分别是逻辑1及逻辑0。该第三逻辑值及该第四逻辑值之其中一者及另一者分别是逻辑1及逻辑0。
与现有技术相比,本发明是藉由该控制单元根据该等心跳信号产生该等判定信号,控制该等基板管理控制器之其中最先正常运作者操作在该主控模式,以使得操作在该主控模式的该基板管理控制器根据该等运作数据来监控该至少一个风扇单元,而让整体设计的复杂度相较于先前技术能大幅地降低。
【附图说明】
本发明之其他的特征及功效,将于参照图式的实施方式中清楚地呈现,其中:
图1是一方块图,说明习知的一机柜;及
图2是一方块图,说明本发明机柜的监控系统的一实施例。
【具体实施方式】
参阅图1,本发明机柜的监控系统之实施例适用于一个计算机系统,并包含一个机柜(Rack),及设置在该机柜内的一个总线3、多个基板管理控制器(Baseboard ManagementController;BMC)21~24、与一个控制单元1。在本实施例中,该计算机系统例如是一个服务器机柜(Server Rack),且为方便说明起见,图1以四个基板管理控制器21~24为例作说明。该计算机系统还包含设置在该机柜内的四个风扇单元,及四个机板,该四个机板也就是被视为四个节点(Node),每一个风扇单元包括多个风扇。该等基板管理控制器21~24分别一对一地设置在该等机板上,且分别电连接该等风扇单元。该等基板管理控制器21~24还电连接该总线3,且该总线3支持一种智能平台管理接口(Intelligent Platform ManagementInterface;IPMI)的协议,也就是说,该总线3是一种智能平台管理总线(IntelligentPlatform Management Bus;IPMB)。而在其他实施例中,该风扇单元及该风扇的数量也可以为单数或其他复数,该总线3也可以支持串行输入输出(Serial I/O)及区域网(Local AreaNetwork;LAN)之其中一种协议,不在此限。
每一个基板管理控制器21~24在开机启动后且正常运作时,产生在一个第一逻辑值与一个第二逻辑值之间跳动的一个心跳信号(Heartbeat),并侦测所电连接的该风扇单元以获得相关于该对应的风扇单元的一个运作数据。该第一逻辑值及该第二逻辑值之其中一者及另一者分别是逻辑1及逻辑0,该心跳信号的频率例如是0.5或1赫兹,但不在此限。反之,当每一个基板管理控制器21~24在开机启动前,或是在开机启动后但没有正常运作时,该基板管理控制器21~24产生的该心跳信号的逻辑值会保持在该第一逻辑值或该第二逻辑值,如在逻辑0。每一个风扇单元的该运作数据例如是该风扇单元的该等风扇的转速、温度等等信息。
每一个基板管理控制器21~24根据一个对应的判定信号,决定操作在一个主控模式及一个从属模式之间。操作在该主控模式的该基板管理控制器,例如是21,是运作为一个机柜管理控制器(Rack/Chassis Management Controller;RMC/CMC),并将多个指令经由该总线3分别传送至该等操作在该从属模式的该等基板管理控制器,例如是22~24,以获得来自操作在该从属模式的该等基板管理控制器22~24所监看的该等风扇单元的该等运作数据。此外,操作在该主控模式的该基板管理控制器21会监看所电连接的该风扇单元的该运作数据,因此,操作在该主控模式的该基板管理控制器21能够监看全部的该等风扇单元的运作状况。再者,操作在该主控模式的该基板管理控制器21还根据该等运作数据,控制该等风扇单元的该等风扇,例如转速,以决定该等风扇单元的散热能力进而调整该机柜内的温度。
该控制单元1电连接该等基板管理控制器21~24,以接收来自该等基板管理控制器21~24的该等心跳信号,并根据该等心跳信号,产生该等对应的判定信号。更具体地说,当该控制单元1侦测到该等基板管理控制器21~24之其中第一个,例如是21,的该心跳信号在该第一逻辑值与该第二逻辑值之间跳动时,即当该控制单元1侦测到该等基板管理控制器21~24之其中第一个正常运作时,该控制单元1将传送至该基板管理控制器21的该判定信号的逻辑值由一个第三逻辑值改变为一个第四逻辑值,以控制该基板管理控制器21操作在该主控模式,并控制其余的该等基板管理控制器22~24操作在该从属模式。在本实施例中,该控制单元1是一个微控制器(Micro Control Unit),该第三逻辑值及该第四逻辑值之其中一者及另一者分别是逻辑1及逻辑0,但不在此限。
要特别补充说明的是:在本实施例中,该机柜的监控系统是适用于监看并控制该等风扇单元,相似地,在其他实施例中,该机柜的监控系统也可以适用于监看并控制该计算机系统的多个受监控单元。该等受监控单元可以包含该计算机系统的多个节点、电源单元(如多个电源供应器)、或其他计算机硬件组件等之其中任何一者。举例来说,当该受监控单元包含节点时,运作为机柜管理控制器的机板管理控制器会监控该节点的温度、功耗、SN信息、ID、上电状态、开机状态、硬设备的健康状态、配置信息(如CPU、内存、硬盘、BIOS/BMC版本)、及开关机控制等。当该受监控单元包含电源单元时,运作为机柜管理控制器的机板管理控制器会监控该电源单元的输入功耗、输出功耗、输入电压、输出电压、输入电流、输出电流、开关控制、状态、及工作温度等。
此外,当该控制单元1侦测到来自运作为该机柜管理控制器的该基板管理器21的该心跳信号没有在该第一逻辑值及该第二逻辑值之间跳动时,也就是该基板管理器21发生异常时,该控制单元1根据一个预定顺序,例如藉由该等基板管理控制器21~24所设置的该等机板的位置序号的大小顺序,决定将送至该等基板管理控制器22~24之其余哪一者的该判定信号的逻辑值由该第三逻辑值改变为该第四逻辑值,例如该基板管理控制器23,且该等基板管理控制器22~24之该者23的该心跳信号有在该第一逻辑值与该第二逻辑值之间跳动。
综上所述,该控制单元1根据该等心跳信号产生该等判定信号,控制该等基板管理控制器21~24之其中最先正常运作者操作在该主控模式,以使得操作在该主控模式的该基板管理控制器根据该等运作数据来监控该等风扇单元。从芯片设计的角度来看,该机柜管理控制器的功能改以基板管理控制器来实现,而省掉习知技术中该复杂度高的机柜管理控制器,且所增加的该控制单元1不但功能单纯且线路简单,使得该监控系统的整体设计的复杂度及成本都降低,故确实能达成本发明之目的。
惟以上所述者,仅为本发明之较佳实施例而已,当不能以此限定本发明实施之范围,凡是依本发明申请专利范围及专利说明书内容所作之简单的等效变化与修饰,皆仍属本发明专利涵盖之范围内。

Claims (8)

1.一种机柜的监控系统,适用于监控一个受监控单元,其特征在于,包含:
一个总线;
多个基板管理控制器,电连接该总线及该受监控单元,并在开机启动之后,各自产生一个心跳信号,且各自根据一个对应的判定信号,决定操作在一个主控模式及一个从属模式之间,操作在该主控模式的该基板管理控制器经由该总线获得来自操作在该从属模式的该些基板管理控制器的多个运作数据,以监控该受监控单元,每一个基板管理控制器在开机启动且正常运作时,产生在一个第一逻辑值与一个第二逻辑值之间跳动的该心跳信号;及
一个控制单元,该控制单元是一个微控制器,电连接该些基板管理控制器,以接收来自该些基板管理控制器的该些心跳信号,并根据该些心跳信号,产生该些对应的判定信号,以控制该些基板管理控制器之其中最先正常运作者操作在该主控模式,并控制该些基板管理控制器之其中其余者操作在该从属模式。
2.如权利要求1所述的机柜的监控系统,其特征在于,当该控制单元侦测到该些基板管理控制器之其中第一个的该心跳信号在该第一逻辑值与该第二逻辑值之间跳动时,该控制单元将传送至该些基板管理控制器之其中该第一个的该判定信号的逻辑值由一个第三逻辑值改变为一个第四逻辑值。
3.如权利要求2所述的机柜的监控系统,其特征在于,操作在该主控模式的该基板管理控制器是运作为一个机柜管理控制器,以监看并控制该受监控单元。
4.如权利要求3所述的机柜的监控系统,其特征在于,当该控制单元侦测到来自运作为该机柜管理控制器的该基板管理器的该心跳信号没有在该第一逻辑值及该第二逻辑值之间跳动时,该控制单元根据一个预定顺序,决定将送至该些基板管理控制器之其余哪一者的该判定信号的逻辑值由该第三逻辑值改变为该第四逻辑值,且该些基板管理控制器之该者的该心跳信号有在该第一逻辑值与该第二逻辑值之间跳动。
5.如权利要求4所述的机柜的监控系统,其特征在于,该受监控单元包含一计算机系统的多个节点、多个风扇单元、多个电源单元、及多个硬盘之其中任何一者。
6.如权利要求4所述的机柜的监控系统,其特征在于,该受监控单元包含多个风扇单元,每一个基板管理控制器适用于电连接该些风扇单元之其中一个对应者,其中,每一个基板管理控制器在正常运作时,侦测所电连接的该风扇单元以获得相关于该对应的风扇单元的该运作数据,操作在该主控模式的该基板管理控制器经由该总线获得操作在该从属模式的该些基板管理控制器所侦测的该些运作数据,以监看并控制该些风扇单元。
7.如权利要求5所述的机柜的监控系统,其特征在于,该总线支持智能平台管理接口、串行输入输出、及区域网之其中一种协议,当该总线支持智能平台管理接口时,该总线是一种智能平台管理总线。
8.如权利要求6所述的机柜的监控系统,其特征在于,该第一逻辑值及该第二逻辑值之其中一者及另一者分别是逻辑1及逻辑0,该第三逻辑值及该第四逻辑值之其中一者及另一者分别是逻辑1及逻辑0。
CN201610012683.1A 2016-01-05 2016-01-05 机柜的监控系统 Expired - Fee Related CN106940676B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610012683.1A CN106940676B (zh) 2016-01-05 2016-01-05 机柜的监控系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610012683.1A CN106940676B (zh) 2016-01-05 2016-01-05 机柜的监控系统

Publications (2)

Publication Number Publication Date
CN106940676A CN106940676A (zh) 2017-07-11
CN106940676B true CN106940676B (zh) 2020-07-21

Family

ID=59468497

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610012683.1A Expired - Fee Related CN106940676B (zh) 2016-01-05 2016-01-05 机柜的监控系统

Country Status (1)

Country Link
CN (1) CN106940676B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108040131A (zh) * 2017-11-10 2018-05-15 中国电子科技集团公司第三十二研究所 整机柜服务器自动配置节点管理模块网口地址的方法
CN110018725B (zh) * 2018-01-09 2023-02-10 佛山市顺德区顺达电脑厂有限公司 远端重置计算机系统的基板管理控制器的方法及其系统
CN111077973B (zh) * 2018-10-19 2023-09-05 环达电脑(上海)有限公司 服务器机柜
CN109654053B (zh) * 2018-11-26 2020-05-12 武汉光迅科技股份有限公司 一种机架设备的风扇控制方法和系统
CN109656739A (zh) * 2018-12-10 2019-04-19 英业达科技有限公司 服务方法、系统、主板及计算机可读存储介质

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103793238A (zh) * 2012-10-31 2014-05-14 英业达科技有限公司 机柜与其同时更新多个基本输入输出系统的方法
TW201527958A (zh) * 2013-12-04 2015-07-16 Hon Hai Prec Ind Co Ltd 可自動選擇主從模式的基板管理控制器、電子裝置及方法
CN104899170B (zh) * 2014-03-07 2019-05-10 中兴通讯股份有限公司 分布式智能平台管理总线ipmb连接方法及atca机框

Also Published As

Publication number Publication date
CN106940676A (zh) 2017-07-11

Similar Documents

Publication Publication Date Title
TWI582585B (zh) 機櫃的監控系統
US8656003B2 (en) Method for controlling rack system using RMC to determine type of node based on FRU's message when status of chassis is changed
CN106940676B (zh) 机柜的监控系统
JP6515132B2 (ja) シャーシ管理システム及びシャーシ管理方法
US9965442B2 (en) Node card management in a modular and large scalable server system
CN107179804B (zh) 机柜装置
EP2503735B1 (en) Multi-service node management system, device and method
US8832348B2 (en) Methods and systems for an interposer board
US7191347B2 (en) Non-disruptive power management indication method, system and apparatus for server
US8217531B2 (en) Dynamically configuring current sharing and fault monitoring in redundant power supply modules
CN104503932B (zh) 多主板服务器主基板管理控制器仲裁方法及系统
US9098257B2 (en) Information handling system server architecture for improved management communication
KR20150049572A (ko) 랙 마운트 서버의 전원을 공유하기 위한 시스템 및 그 운영 방법
TW202013131A (zh) 伺服器機櫃
US11733762B2 (en) Method to allow for higher usable power capacity in a redundant power configuration
CN104572400A (zh) 一种单bmc管理多计算板的管理方法及其装置
CN110985426B (zh) 一种PCIE Switch产品的风扇控制系统及方法
TW201729097A (zh) 機櫃裝置
EP2759905A2 (en) Information processing apparatus, method of controlling power consumption, and storage medium
TWI417738B (zh) 一種伺服器系統
CN106647958B (zh) 服务器机柜
CN108150442B (zh) 机柜风扇控制方法及模块
CN114047803A (zh) 计算机主板、双路处理器计算机及四路处理器计算机
US12072746B2 (en) Input current limiting for redundant power supply loss on modular platforms
TW201222232A (en) Multi-motherboard server with power consumption control function and power consumption control method for multi-motherboard server

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20200721

Termination date: 20220105

CF01 Termination of patent right due to non-payment of annual fee