CN110650053A - 机柜以及用于管理机柜的方法和装置 - Google Patents

机柜以及用于管理机柜的方法和装置 Download PDF

Info

Publication number
CN110650053A
CN110650053A CN201910924154.2A CN201910924154A CN110650053A CN 110650053 A CN110650053 A CN 110650053A CN 201910924154 A CN201910924154 A CN 201910924154A CN 110650053 A CN110650053 A CN 110650053A
Authority
CN
China
Prior art keywords
node
bus
board card
cabinet
management unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910924154.2A
Other languages
English (en)
Inventor
田东顺
程子强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Wave Intelligent Technology Co Ltd
Original Assignee
Suzhou Wave Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Wave Intelligent Technology Co Ltd filed Critical Suzhou Wave Intelligent Technology Co Ltd
Priority to CN201910924154.2A priority Critical patent/CN110650053A/zh
Publication of CN110650053A publication Critical patent/CN110650053A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/28Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
    • H04L12/40Bus networks
    • H04L12/40006Architecture of a communication node
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/28Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
    • H04L12/40Bus networks
    • H04L12/40143Bus networks involving priority mechanisms
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/28Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
    • H04L12/40Bus networks
    • H04L2012/40208Bus networks characterized by the use of a particular bus standard
    • H04L2012/40215Controller Area Network CAN

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明实施例公开了机柜,该机柜包括机柜管理单元板卡以及第一数量的节点板卡,机柜管理单元板卡以及每个节点板卡均具有支持多点并发和自动仲裁的总线控制器,并且分别通过各自的总线控制器连接至总线以进行通信,当第一数量的节点板卡之中的第二节点板卡的微控制单元检测到第二节点板卡存在故障的时候,由第二节点板卡的总线控制器向总线发送数据帧格式的通信报文;机柜管理单元板卡在通过其总线控制器接收并且解析由第二节点板卡发送的通信报文之后,向第二节点板卡发送指示。还公开了对应的用于管理机柜的装置以及方法。上述方案能使节点板卡在发现故障时即刻向机柜管理单元板卡报障,机柜管理单元板卡可以及时响应报文,减小故障造成的危害。

Description

机柜以及用于管理机柜的方法和装置
技术领域
本发明涉及机柜管理技术,尤指机柜以及用于管理机柜的方法和装置。
背景技术
随云计算技术的发展,机架式服务器以成本低廉、功能集约和高度模块化等特点,广泛的应用到包括政府、银行和大型企业在内的各种应用场景。在实际应用中,机架式服务器的电源、散热、交换等非计算机体系模块直接安装在机柜内,剩余空间高度部署服务器节点。为了对服务器节点、电源、风扇进行集中监控与管理,机柜管理单元(Rack ManagementController,RMC)管理系统应运而生。RMC管理系统负责侦测和监控众多的功能节点,而且每次执行查询和控制操作时交互的数据总量较多。目前通常采取I2C总线(Inter-Integrated Circuit,集成电路总线)通信的方式将RMC板卡与各个节点板卡直接连接,这样,只能依靠RMC板卡主动发起数据传输,按照顺序轮询各个板卡,以通过各个板卡获取到各个机架服务器及其所在的机柜的状态。如果有节点板卡检测到紧急故障,只能等待RMC板卡轮询到这个节点板卡时,才能向RMC板卡上报故障。
发明内容
为了解决上述技术问题,本发明提供了一种机柜、用于管理机柜的方法和装置,其能够使机柜中的节点板卡更及时地上报故障。
为了达到本申请的目的,本发明实施例提供了一种机柜,该机柜包括机柜管理单元板卡以及第一数量的节点板卡,节点板卡连接于机架式服务器或者机柜中的电源设施,机柜管理单元板卡以及每个节点板卡均具有支持多点并发和自动仲裁的总线控制器,机柜管理单元板卡与节点板卡分别通过各自的总线控制器连接至总线以进行通信,
当第一数量的节点板卡之中的第二节点板卡的微控制单元检测到第二节点板卡存在故障的时候,由第二节点板卡的总线控制器向总线发送数据帧格式的通信报文;
机柜管理单元板卡在通过其总线控制器接收并且解析由第二节点板卡发送的通信报文之后,向第二节点板卡发送指示。
在一个可选的实施例中,当第一数量的节点板卡之中的第二节点板卡的微控制单元检测到第二节点板卡存在故障的时候,第二节点板卡被设置成:检测总线是否空闲:如果总线上有多个节点板卡同时机柜管理单元板卡发送的通信报文,则将通信报文的优先级与在向总线上传的所有通信报文的优先级进行比较;
机柜管理单元板卡被设置成:在由第二节点板卡发送的通信报文的优先级高于其他节点板卡向总线上传的其他通信报文的优先级的时候,通过机柜管理单元板卡的总线控制器在接收并且解析第二节点板卡发送的通信报文之后,向第二节点板卡发送指示。
在一个可选的实施例中,支持多点并发和自动仲裁的总线是控制器局域网络CAN总线;总线控制器是CAN总线控制器。
在一个可选的实施例中,板卡的优先级是在将节点板卡连接至总线之前,根据各个节点板卡所连接的服务器的业务重要性来设置的。
在一个可选的实施例中,CAN总线之中的信号线CANH与信号线CANL采用线与操作的方式来确定总线电平;其中,由节点板卡的CAN总线控制器根据总线电平确定CAN总线上发送的电平是否是由节点板卡发送的。
为了达到本申请的目的,本发明实施例提供了一种用于管理机柜的方法,该机柜包括机柜管理单元板卡以及第一数量的节点板卡,节点板卡连接于机架式服务器或者机柜中的电源设施,机柜管理单元板卡以及每个节点板卡均具有支持多点并发和自动仲裁的总线控制器,机柜管理单元板卡与节点板卡分别通过各自的总线控制器连接至总线以进行通信,方法包括:
当第一数量的节点板卡之中的第二节点板卡的微控制单元检测到第二节点板卡存在故障的时候,由第二节点板卡的总线控制器向总线发送数据帧格式的通信报文;
由机柜管理单元板卡在通过其总线控制器接收并且解析由第二节点板卡发送的通信报文之后,向第二节点板卡发送指示。
在一个可选的实施例中,当第一数量的节点板卡之中的第二节点板卡的微控制单元检测到第二节点板卡存在故障,由第二节点板卡的总线控制器向总线发送数据帧格式的通信报文的步骤包括:
当第一数量的节点板卡之中的第二节点板卡的微控制单元检测到第二节点板卡存在故障的时候,检测总线是否空闲;
如果总线上有多个节点板卡同时机柜管理单元板卡发送的通信报文,则将通信报文的优先级与在向总线上传的其他通信报文的优先级进行比较;其中,数据帧的仲裁段的前三位保留,中间四位为目的节点的标识符,末尾四位为源节点的标识符,并且通信报文的优先级是由仲裁段中的标识符确定的;
由机柜管理单元板卡通过其总线控制器在接收并且解析通信报文之后,向第二节点板卡发送指示的步骤包括:
在由第二节点板卡发送的通信报文的优先级高于其他节点板卡向总线上传的其他通信报文的优先级的时候,由机柜管理单元板卡通过其总线控制器在接收并且解析第二节点板卡发送的通信报文之后,向第二节点板卡发送指示。
在一个可选的实施例中,支持多点并发和自动仲裁的总线是控制器局域网络CAN总线;总线控制器是CAN总线控制器。
在一个可选的实施例中,该方法还包括:
在将节点板卡连接至总线之前,根据各个节点板卡所连接的服务器的业务重要性来设置各个板卡的优先级。
为了达到本申请的目的,本发明实施例提供了一种用于管理机柜的装置,该机柜包括机柜管理单元板卡以及第一数量的节点板卡,节点板卡连接于机架式服务器或者机柜中的电源设施,机柜管理单元板卡以及每个节点板卡均具有支持多点并发和自动仲裁的总线控制器,机柜管理单元板卡与节点板卡分别通过各自的总线控制器连接至总线以进行通信,该装置包括存储器和处理器;
存储器用于存储计算机可读指令;
处理器用于读取计算机可读指令,以执行如下操作:
当第一数量的节点板卡之中的第二节点板卡的微控制单元检测到第二节点板卡存在故障,使第二节点板卡的总线控制器向总线发送数据帧格式的通信报文;
使机柜管理单元板卡在通过其总线控制器接收并且解析由第二节点板卡发送的通信报文之后,向第二节点板卡发送指示。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本申请的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
附图说明
附图用来提供对本发明技术方案的进一步理解,并且构成说明书的一部分,与本申请的实施例一起用于解释本发明的技术方案,并不构成对本发明技术方案的限制。
图1为本发明实施例提供的机柜的内部结构的示意图;
图2为本发明实施例提供的CAN总线标准帧的格式的示意图;
图3为本发明实施例提供的方案中所定义的CAN总线帧的格式的示意图;
图4为本发明实施例提供的用于管理机柜的方法的流程图;
图5为本发明实施例提供的用于管理机柜的装置的框图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚明白,下文中将结合附图对本发明的实施例进行详细说明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。
在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行。并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
为了解决上述技术问题,一方面,本发明提供了一种用于管理机柜的方法,如图1所示,机柜包括机柜管理单元板卡100以及第一数量的节点板卡200,节点板卡200连接于机柜中的机架式服务器或者机柜中的电源设施,机柜管理单元板卡100以及每个节点板卡200均具有支持多点并发和自动仲裁的总线控制器,机柜管理单元板卡100与节点板卡200分别通过各自的总线控制器连接至总线以进行通信。
其中,一个节点板卡200中的MCU可以连接于一个以上的服务器托盘背板(TrayBack Plane,TBP),TBP连接于机架式服务器(例如,1U、2U、4U等规格的服务器),或者一个节点板卡200中的MCU可以通过一个以上的电源管理总线(如图1中的PM Bus1和PM Bus2所示)连接于机柜中的机架式服务器或者机柜中的电源设施(如图1中的PSU_A1、PSU_B2等)。此外,MCU可以连接于对应的机柜的风扇。
通过上述连接关系,节点板卡的微控制单元可以侦测到机柜内的多种信息,以便于机柜管理单元板卡实现如下的功能:
(1)侦测服务器的温度、功耗、ID(标识符)配置、工作状态监控和控制服务器的开关机等;
(2)侦测电源节点的输入输出功耗、电压/电流值、工作状态、故障状态和控制开关等;
(3)侦测风扇节点的转速、功耗、工作状态、故障状态和调控转速等。
本发明实施例中所提到的节点板卡通过其微控制单元来检测到该节点板卡所连接的服务器或者电源设施存在故障,并且机柜管理单元板卡通过在其之上安装的基板管理控制器(Baseboard Management Controller)来处理由节点板卡发送的通信报文,并且由机柜管理单元板卡的基板管理控制器向节点板卡发送指示。在本文中,并不对机柜管理单元板卡以及基板管理控制器进行特别的区分,当描述“机柜管理单元板卡接收并且解析通信报文”的时候,实际上是由机柜管理单元板卡的基板管理控制器接收并且解析通信报文;当描述“机柜管理单元板卡发送指示”的时候,实际上是由机柜管理单元板卡的基板管理控制器发送指示。此外,在本文中并不对节点板卡以及节点板卡的微控制单元进行特别的区分,当描述“节点板卡发送通信报文”的时候,实际上是由节点板卡的微控制单元发送通信报文,也就是说,节点板卡事实上是通过在节点板卡上安装的微控制单元来处理数据。
该机柜包括机柜管理单元板卡以及第一数量的节点板卡,节点板卡连接于机架式服务器或者机柜中的电源设施,机柜管理单元板卡以及每个节点板卡均具有支持多点并发和自动仲裁的总线控制器,机柜管理单元板卡与节点板卡分别通过各自的总线控制器连接至总线以进行通信,
当第一数量的节点板卡之中的第二节点板卡的微控制单元检测到第二节点板卡存在故障,由第二节点板卡的总线控制器向总线发送数据帧格式的通信报文;
由机柜管理单元板卡在通过其总线控制器接收并且解析由第二节点板卡发送的通信报文之后,向第二节点板卡发送指示。
通过上述方式,可以使节点板卡能够在其中的微控制单元检测到其所在的节点板卡所管控的范围(例如,服务器、电源以及风扇的温度、功耗、工作状态)内存在故障的时候,通过该节点板卡连接的总线及时向机柜管理单元板卡上报故障,因此缩短了处理故障的时间,减小了故障所造成的危害。
在一个可选的实施例中,当第一数量的节点板卡之中的第二节点板卡的微控制单元检测到第二节点板卡存在故障的时候,第二节点板卡被设置成:检测总线是否空闲:如果总线上有多个节点板卡同时向机柜管理单元板卡发送的通信报文,则将通信报文的优先级与在向CAN总线上传的所有通信报文的优先级进行比较。
在一个可选的实施例中,支持多点并发和自动仲裁的总线是控制器局域网络CAN总线;总线控制器是CAN总线控制器。
如图2所示,图2示出了作为本发明的一种可选的实施例的CAN总线的标准帧格式,作为从机柜管理单元板卡向节点板卡发送的报文的、或者是从节点板卡向机柜管理单元板卡发送的报文的载体,标准帧中包括11位的仲裁段。在读取标准帧时,是从图2所示的标准帧的左侧向右侧读取。在本发明实施例提供的方案中,标准帧中的11位的仲裁段如图3所示地进行设置,如图3所示,ID10~ID8保留且固定为二进制001,ID7~ID4为目的节点地址和ID3~ID0为源节点地址。对于从节点板卡向机柜管理单元板卡发送的标准帧来说,目的节点是机柜管理单元板卡,源节点是节点板卡。对于从机柜管理单元板卡向节点板卡发送的标准帧来说,目的节点是节点板卡,源节点是机柜管理单元板卡。当节点板卡的节点地址作为目的节点地址时,机柜管理单元板卡的节点地址作为源节点地址。当节点板卡的节点地址作为源节点地址时,机柜管理单元板卡的节点地址作为目的节点地址。因此,当多个节点板卡向机柜管理单元板卡发送通信报文的时候,在从左向右读取通信报文所采用的标准帧的仲裁段的时候,首先读取仲裁段中的保留位,保留位均是二进制001;然后读取仲裁段中的目的节点地址,并且目的节点地址均是机柜管理单元板卡的节点地址,因此也相同;最后读取仲裁段中的源节点地址,源节点地址是为发送通信报文的各个节点板卡分别分配的,因此各有不同,根据源节点地址可以确定在上述多个通信报文中的优先级顺序。通信报文所采用的某个板卡的节点地址可以通过板卡的拨码开关来设置。其中,机柜管理单元板卡的节点地址被设置成使得机柜管理单元板卡具有最高优先级,以便当机柜管理单元板卡在总线空闲的时候向总线发送标准帧的时候,能够立即抢占总线资源,向节点板卡发送报文。因此,机柜管理单元板卡所分配到的节点地址为二进制0001。其他节点板卡所分配到的节点地址为二进制0010-1100。节点板卡发送的报文优先级最高的仲裁段是001 0001 0010,节点板卡的报文优先级最低的仲裁段是001 0001 1111;由此可知,1个机柜管理单元板卡能够通过发送报文来指导的节点板卡的最大数量是15个。每个节点板卡可以连接至少一个机架式服务器或者机柜中的电源设施,因此,可以使得1个机柜管理单元板卡能够管理机柜中的大量的机架式服务器或者电源设施的状态。为了能够管理大量的机架式服务器或者机柜的电源设施的状态,需要在机柜管理单元板卡以及节点板卡之间高速地交换大量数据,并且机架式服务器以及机柜的电源设施可能相距较远,因此还需要传输介质需要强的抗干扰能力,否则有可能发生通信误码。并且I2C总线电平的抗干扰的能力较差,而且没有物理层CRC校验,通信过程中电平信号被干扰出错,导致通信误码。此外,采用I2C连接的方式,会造成线缆数目更多,每个服务器节点对应一组I2C线缆,而且通信速率慢。
通过上述方式,可以根据优先级确定机柜管理单元板卡接收到通信报文的顺序,因此可以使机柜管理单元板卡在多个同时发送的通信报文中优先收到具有更高优先级的节点板卡所发送的通信报文。
在一个可选的实施例中,支持多点并发和自动仲裁的总线是控制器局域网络CAN总线;总线控制器是CAN总线控制器。
基于上述的可选的实施例,进一步地,CAN总线之中的信号线CANH与信号线CANL采用线与操作的方式来确定总线电平;其中,由节点板卡的CAN总线控制器根据总线电平确定CAN总线上发送的电平是否是由节点板卡发送的。
所谓线与,指的是它们任意一开关只要对地导通,这根线就一定是低电平。这种情况就像我们用拉线开关进行通断控制的结果相类似。
在CAN总线中,显性电平是强驱动,隐性电平时弱驱动,因此当有的节点发送显性电平有的节点发送隐性电平时,总线上呈现的肯定是强驱动的状态,这就是CAN总线显性电平可以覆盖隐性电平的原因。
CAN总线的差分电平分为显性电平和隐性电平,显性电平的逻辑为0,隐性电平的逻辑为1,在同一个位时间,一个节点发显性电平,另一个节点发隐性电平,则总线电平为显性电平,这是CAN总线仲裁的基础。1&0=0,显性能覆盖隐性。
例如,节点板卡A发送标准帧中的源节点ID是0011…,节点板卡B发送标准帧中的源节点ID为0010…。总线控制器在向总线发送数据的时候,也同时监测总线。因此,在前3个位发送完毕的时候,两个节点板卡中的总线控制器都认为自己发送成功,但是当发送到第4个位时,总线电平(0&1=0)为0,此时节点板卡A的总线控制器监测到总线上不是自己发送的电平状态,退出发送,节点板卡B的总线控制器成功抢占总线继续完成发送。
在一个可选的实施例中,板卡的优先级是在将节点板卡连接至总线之前,根据各个节点板卡所连接的服务器的业务重要性来设置的。
例如,可以将运行最重要的业务的服务器所在的节点板卡的节点地址设置成使得其在所有节点板卡中具有最高的优先级;可以将运行具有较低的业务重要性的服务器所在的节点板卡的节点地址设置成使得其所在的节点板卡具有相对低的优先级。通过以上的设置,可以使得当其所连接的服务器运行着业务重要性最高的节点板卡的微控制单元检测到该节点板卡所连接的服务器或者电源设施出现异常的时候,能够在总线空闲时立即向机柜管理单元板卡发送报文,通报节点板卡所存在的故障(在此并不限于硬件设施的既定故障,也包括例如风扇过热、电源过电压等有可能造成未来危害的潜在故障)。因此,机柜管理单元板卡可以及时响应报文,管理节点板卡克服故障。
为了解决上述技术问题,另一方面,本发明提供了一种用于管理机柜的方法,如图1所示,机柜包括机柜管理单元板卡100以及第一数量的节点板卡200,节点板卡200连接于机柜中的机架式服务器或者机柜中的电源设施,机柜管理单元板卡100以及每个节点板卡200均具有支持多点并发和自动仲裁的总线控制器,机柜管理单元板卡100与节点板卡200分别通过各自的总线控制器连接至总线以进行通信,如图4所示,该方法包括步骤S101-步骤S103。
步骤S101,当第一数量的节点板卡之中的第二节点板卡的微控制单元(MicroControl Unit,MCU)检测到第二节点板卡存在故障,由第二节点板卡的总线控制器向总线发送数据帧格式的通信报文。
步骤S103,由机柜管理单元板卡在通过其总线控制器接收并且解析由第二节点板卡发送的通信报文之后,向第二节点板卡发送指示。
通过上述方式,可以使节点板卡能够在其中的微控制单元检测到其所在的节点板卡所管控的范围(例如,服务器、电源以及风扇的温度、功耗、工作状态)内存在故障的时候,通过该节点板卡连接的总线及时向机柜管理单元板卡上报故障,因此缩短了处理故障的时间,减小了故障所造成的危害。
在一个可选的实施例中,步骤S101包括:
当第一数量的节点板卡之中的第二节点板卡的微控制单元检测到第二节点板卡存在故障的时候,检测总线是否空闲;
如果总线上有多个节点板卡同时机柜管理单元板卡发送的通信报文,则将通信报文的优先级与在向总线上传的其他通信报文的优先级进行比较;其中,数据帧的仲裁段的前三位保留,中间四位为目的节点的标识符,末尾四位为源节点的标识符,并且通信报文的优先级是由仲裁段中的标识符确定的;
步骤S103包括:
在由第二节点板卡发送的通信报文的优先级高于其他节点板卡向总线上传的其他通信报文的优先级的时候,由机柜管理单元板卡通过其总线控制器在接收并且解析通信报文之后,向第二节点板卡发送指示。
在一个可选的实施例中,支持多点并发和自动仲裁的总线是控制器局域网络CAN总线;总线控制器是CAN总线控制器。
在一个可选的实施例中,板卡的优先级是在将节点板卡连接至总线之前,根据各个节点板卡所连接的服务器的业务重要性来设置的。
在一个可选的实施例中,该方法还包括:
在将节点板卡连接至总线之前,根据各个节点板卡所连接的服务器的业务重要性来设置各个板卡的优先级。
例如,可以将运行最重要的业务的服务器所在的节点板卡的节点地址设置成使得其在所有节点板卡中具有最高的优先级;可以将运行具有较低的业务重要性的服务器所在的节点板卡的节点地址设置成使得其所在的节点板卡具有相对低的优先级。通过以上的设置,可以使得当其所连接的服务器运行着业务重要性最高的节点板卡的微控制单元检测到该节点板卡所连接的服务器或者电源设施出现异常的时候,能够在总线空闲时立即向机柜管理单元板卡发送报文,通报节点板卡所存在的故障。因此,机柜管理单元板卡可以及时响应报文,管理节点板卡克服故障。
另一方面,本发明实施例提供了一种用于管理机柜的装置,如图1所示,机柜包括机柜管理单元板卡以及第一数量的节点板卡,节点板卡连接于机架式服务器或者机柜中的电源设施,机柜管理单元板卡以及每个节点板卡均具有支持多点并发和自动仲裁的总线控制器,机柜管理单元板卡与节点板卡分别通过各自的总线控制器连接至总线以进行通信,如图5所示,该装置包括存储器10和处理器20。
存储器10用于存储计算机可读指令;
处理器20用于读取计算机可读指令,以执行如下操作:
当第一数量的节点板卡之中的第二节点板卡的微控制单元检测到第二节点板卡存在故障,使第二节点板卡的总线控制器向总线发送数据帧格式的通信报文;
使机柜管理单元板卡通过其总线控制器接收并且解析通信报文之后,向第二节点板卡发送指示。
机柜管理单元板卡在较短的时间内完成故障问题的上报和处理工作,避免故障危害扩大。
在一个可选的实施例中,当第一数量的节点板卡之中的第二节点板卡的微控制单元检测到第二节点板卡存在故障,由第二节点板卡的总线控制器向总线发送数据帧格式的通信报文的操作包括:
当第一数量的节点板卡之中的第二节点板卡的微控制单元检测到第二节点板卡存在故障的时候,检测总线是否空闲;
如果总线上有多个节点板卡同时机柜管理单元板卡发送的通信报文,则将通信报文的优先级与在向总线上传的其他通信报文的优先级进行比较;其中,数据帧的仲裁段的前三位保留,中间四位为目的节点的标识符,末尾四位为源节点的标识符,并且通信报文的优先级是由仲裁段中的标识符确定的;
由机柜管理单元板卡通过其总线控制器在接收并且解析通信报文之后,向第二节点板卡发送指示的操作包括:
在由第二节点板卡发送的通信报文的优先级高于其他节点板卡向总线上传的其他通信报文的优先级的时候,由机柜管理单元板卡通过其总线控制器在接收并且解析通信报文之后,向第二节点板卡发送指示。
在一个可选的实施例中,支持多点并发和自动仲裁的总线是控制器局域网络CAN总线;总线控制器是CAN总线控制器。
在一个可选的实施例中,CAN总线之中的信号线CANH与信号线CANL采用线与操作的方式来确定总线电平;其中,由节点板卡的CAN总线控制器根据总线电平确定CAN总线上发送的电平是否是由节点板卡发送的。
在一个可选的实施例中,处理器20用于读取计算机可读指令,以执行如下操作:
在将节点板卡连接至总线之前,根据各个节点板卡所连接的服务器的业务重要性来设置各个板卡的优先级。
虽然本发明所揭露的实施方式如上,但上述的内容仅为便于理解本发明而采用的实施方式,并非用以限定本发明。任何本发明所属领域内的技术人员,在不脱离本发明所揭露的精神和范围的前提下,可以在实施的形式及细节上进行任何的修改与变化,但本发明的专利保护范围,仍须以所附的权利要求书所界定的范围为准。

Claims (10)

1.一种机柜,其特征在于,包括机柜管理单元板卡以及第一数量的节点板卡,所述节点板卡连接于机架式服务器或者机柜中的电源设施,所述机柜管理单元板卡以及每个节点板卡均具有支持多点并发和自动仲裁的总线控制器,所述机柜管理单元板卡与所述节点板卡分别通过各自的总线控制器连接至总线以进行通信,
当所述第一数量的节点板卡之中的第二节点板卡的微控制单元检测到第二节点板卡存在故障的时候,由所述第二节点板卡的总线控制器向所述总线发送数据帧格式的通信报文;
所述机柜管理单元板卡在通过其总线控制器接收并且解析由所述第二节点板卡发送的所述通信报文之后,向所述第二节点板卡发送指示。
2.根据权利要求1所述的机柜,其中,当所述第一数量的节点板卡之中的第二节点板卡的微控制单元检测到第二节点板卡存在故障的时候,所述第二节点板卡被设置成:检测所述总线是否空闲:如果所述总线上有多个节点板卡同时所述机柜管理单元板卡发送的通信报文,则将所述通信报文的优先级与在向总线上传的所有通信报文的优先级进行比较;
所述机柜管理单元板卡被设置成:在由所述第二节点板卡发送的通信报文的优先级高于其他节点板卡向总线上传的其他通信报文的优先级的时候,通过所述机柜管理单元板卡的总线控制器在接收并且解析所述第二节点板卡发送的通信报文之后,向所述第二节点板卡发送指示。
3.根据权利要求1所述的机柜,其特征在于,所述支持多点并发和自动仲裁的总线是控制器局域网络CAN总线;所述总线控制器是CAN总线控制器。
4.根据权利要求1所述的机柜,其特征在于,所述板卡的优先级是在将节点板卡连接至所述总线之前,根据各个节点板卡所连接的服务器的业务重要性来设置的。
5.根据权利要求3所述的机柜,其特征在于,所述CAN总线之中的信号线CANH与信号线CANL采用线与操作的方式来确定总线电平;其中,由所述节点板卡的CAN总线控制器根据所述总线电平确定所述CAN总线上发送的电平是否是由所述节点板卡发送的。
6.一种用于管理机柜的方法,其特征在于,所述机柜包括机柜管理单元板卡以及第一数量的节点板卡,所述节点板卡连接于机架式服务器或者机柜中的电源设施,所述机柜管理单元板卡以及每个节点板卡均具有支持多点并发和自动仲裁的总线控制器,所述机柜管理单元板卡与所述节点板卡分别通过各自的总线控制器连接至总线以进行通信,所述方法包括:
当所述第一数量的节点板卡之中的第二节点板卡的微控制单元检测到第二节点板卡存在故障的时候,由所述第二节点板卡的总线控制器向所述总线发送数据帧格式的通信报文;
由所述机柜管理单元板卡在通过其总线控制器接收并且解析由所述第二节点板卡发送的所述通信报文之后,向所述第二节点板卡发送指示。
7.根据权利要求6所述的方法,其特征在于,所述当所述第一数量的节点板卡之中的第二节点板卡的微控制单元检测到第二节点板卡存在故障,由所述第二节点板卡的总线控制器向所述总线发送数据帧格式的通信报文的步骤包括:
当所述第一数量的节点板卡之中的第二节点板卡的微控制单元检测到第二节点板卡存在故障的时候,检测所述总线是否空闲;
如果所述总线上有多个节点板卡同时所述机柜管理单元板卡发送的通信报文,则将所述通信报文的优先级与在向总线上传的其他通信报文的优先级进行比较;其中,所述数据帧的仲裁段的前三位保留,中间四位为目的节点的标识符,末尾四位为源节点的标识符,并且通信报文的优先级是由所述仲裁段中的标识符确定的;
所述由所述机柜管理单元板卡通过其总线控制器在接收并且解析所述通信报文之后,向所述第二节点板卡发送指示的步骤包括:
在由所述第二节点板卡发送的通信报文的优先级高于其他节点板卡向总线上传的其他通信报文的优先级的时候,由所述机柜管理单元板卡通过其总线控制器在接收并且解析所述第二节点板卡发送的通信报文之后,向所述第二节点板卡发送指示。
8.根据权利要求6所述的方法,其特征在于,所述支持多点并发和自动仲裁的总线是控制器局域网络CAN总线;所述总线控制器是CAN总线控制器。
9.根据权利要求6所述的方法,其特征在于,所述方法还包括:
在将节点板卡连接至所述总线之前,根据各个节点板卡所连接的服务器的业务重要性来设置所述各个板卡的优先级。
10.一种用于管理机柜的装置,其特征在于,所述机柜包括机柜管理单元板卡以及第一数量的节点板卡,所述节点板卡连接于机架式服务器或者机柜中的电源设施,所述机柜管理单元板卡以及每个节点板卡均具有支持多点并发和自动仲裁的总线控制器,所述机柜管理单元板卡与所述节点板卡分别通过各自的总线控制器连接至总线以进行通信,所述装置包括存储器和处理器;
所述存储器用于存储计算机可读指令;
所述处理器用于读取所述计算机可读指令,以执行如下操作:
当所述第一数量的节点板卡之中的第二节点板卡的微控制单元检测到第二节点板卡存在故障,使所述第二节点板卡的总线控制器向所述总线发送数据帧格式的通信报文;
使所述机柜管理单元板卡在通过其总线控制器接收并且解析由所述第二节点板卡发送的所述通信报文之后,向所述第二节点板卡发送指示。
CN201910924154.2A 2019-09-27 2019-09-27 机柜以及用于管理机柜的方法和装置 Pending CN110650053A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910924154.2A CN110650053A (zh) 2019-09-27 2019-09-27 机柜以及用于管理机柜的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910924154.2A CN110650053A (zh) 2019-09-27 2019-09-27 机柜以及用于管理机柜的方法和装置

Publications (1)

Publication Number Publication Date
CN110650053A true CN110650053A (zh) 2020-01-03

Family

ID=68992846

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910924154.2A Pending CN110650053A (zh) 2019-09-27 2019-09-27 机柜以及用于管理机柜的方法和装置

Country Status (1)

Country Link
CN (1) CN110650053A (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1913476A (zh) * 2006-08-04 2007-02-14 哈尔滨工业大学 Can报文优先级产生与检测系统及其方法
CN101507193A (zh) * 2006-07-05 2009-08-12 Tttech电脑技术股份公司 基于can通信控制器及提高数据吞吐量的通信系统的建立方法及设备
CN110048889A (zh) * 2019-04-18 2019-07-23 山东超越数控电子股份有限公司 一种高可靠的机柜管理系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101507193A (zh) * 2006-07-05 2009-08-12 Tttech电脑技术股份公司 基于can通信控制器及提高数据吞吐量的通信系统的建立方法及设备
CN1913476A (zh) * 2006-08-04 2007-02-14 哈尔滨工业大学 Can报文优先级产生与检测系统及其方法
CN110048889A (zh) * 2019-04-18 2019-07-23 山东超越数控电子股份有限公司 一种高可靠的机柜管理系统

Similar Documents

Publication Publication Date Title
CN1863081B (zh) 基板管理控制器的管理系统和方法
CN106603265B (zh) 管理方法、网络装置以及非暂态计算机可读介质
US7861110B2 (en) System, method, and adapter for creating fault-tolerant communication busses from standard components
US9141491B2 (en) Highly available server system based on cloud computing
CN102510344A (zh) 机柜服务器系统
CN111209241A (zh) 整机柜服务器的管理系统
CN111367392B (zh) 一种动态电源管理系统
CN103139248A (zh) 机架系统
CN110048889A (zh) 一种高可靠的机柜管理系统
CN103135732A (zh) 服务器机柜系统
CN103428114A (zh) 一种atca万兆交换板及系统
CN105549696B (zh) 具有机箱管理功能的机架式服务器系统
EP3938865A1 (en) Variable redundancy data center power topology
CN111324503B (zh) 机框管理装置、方法和计算机可读存储介质
CN203554493U (zh) 一种服务器用远程管理接口系统
CN111628944B (zh) 交换机及交换机系统
CN101072088A (zh) 数据备份系统、主控板和数据备份方法
CN110650053A (zh) 机柜以及用于管理机柜的方法和装置
CN110247809B (zh) 双环网控制系统的通信控制方法
CN112201378A (zh) 基于核电厂dcs平台的热备切换方法、系统、终端及介质
CN113608607B (zh) 多节点服务器控制方法和多节点服务器
CN103138975A (zh) 多个机架系统的托管方法
CN112178881B (zh) Rs485网络的自检方法、设备
CN109684136A (zh) 一种灵活配置主控的通信架构系统
CN109491867A (zh) 一种通讯自动恢复方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200103