CN112368982A - 用于机箱管理的多节点发现和主选举过程 - Google Patents

用于机箱管理的多节点发现和主选举过程 Download PDF

Info

Publication number
CN112368982A
CN112368982A CN201980043330.XA CN201980043330A CN112368982A CN 112368982 A CN112368982 A CN 112368982A CN 201980043330 A CN201980043330 A CN 201980043330A CN 112368982 A CN112368982 A CN 112368982A
Authority
CN
China
Prior art keywords
nodes
node
chassis
network
master
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201980043330.XA
Other languages
English (en)
Other versions
CN112368982B (zh
Inventor
哈里基什南·拉贾戈帕兰
卡尼卡·卡卡尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Cisco Technology Inc
Original Assignee
Cisco Technology Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Cisco Technology Inc filed Critical Cisco Technology Inc
Publication of CN112368982A publication Critical patent/CN112368982A/zh
Application granted granted Critical
Publication of CN112368982B publication Critical patent/CN112368982B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/104Peer-to-peer [P2P] networks
    • H04L67/1044Group management mechanisms 
    • H04L67/1051Group master selection mechanisms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3031Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a motherboard or an expansion card
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3041Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is an input/output interface
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3058Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/16Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
    • G06F15/161Computing infrastructure, e.g. computer clusters, blade chassis or hardware partitioning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • H04L49/20Support for services
    • H04L49/201Multicast operation; Broadcast operation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • H04L49/30Peripheral units, e.g. input or output ports
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • H04L49/40Constructional details, e.g. power supply, mechanical construction or backplane
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • H04L49/65Re-configuration of fast packet switches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3055Monitoring arrangements for monitoring the status of the computing system or of the computing system component, e.g. monitoring if the computing system is on, off, available, not available

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Computer Hardware Design (AREA)
  • Software Systems (AREA)
  • Small-Scale Networks (AREA)
  • Hardware Redundancy (AREA)
  • Computer And Data Communications (AREA)

Abstract

在包括多个节点、网络交换机和被配置为管理机箱的共享资源的可编程器件的机箱中,一种方法包括使用网络交换机在多个节点中的相应节点的基板管理控制器之间建立专用网络;和使用该专用网络,自动从多个节点中选择给定节点来充当主节点,以代表多个节点中的所有节点对可编程器件进行编程,从而代表多个节点中的所有节点管理机箱的共享资源。

Description

用于机箱管理的多节点发现和主选举过程
优先权要求
本申请要求于2018年7月19日提交的印度临时专利申请No.201841026961的优先权,其主题通过引用合并于此。
技术领域
本公开涉及共享硬件资源管理。
背景技术
随着行业转向数据中心架构的混合云基础设施模型,对高性能容错计算系统的需求不断增长,所述容错计算系统形成允许对基础设施进行线性缩放的低延迟预置云。在这种系统中,一种流行的实现方式是在一个2U机架机箱中具有四个节点(例如刀片服务器)的集群。这种实现方式允许三个节点形成最小集群,其中一个节点作为活动备用品进行操作以在任何其他单个节点故障的情况下承担负载。每个集群包括均衡量的存储、计算和网络硬件,并通过高速本地总线互连(例如外围组件互连高速(peripheral componentinterconnect express,PCIe))作为单个单元进行操作,以在给定的硬件配置下实现最大性能。这样的配置可以被称为“超融合基础设施”。集群中的每个节点还包括管理其各自主板的基板管理控制器(BMC)。与传统的服务器机箱系统不同,在超融合基础设施中,没有单独的输入/输出(IO)硬件插件模块来进行IO聚合并将数据从机箱发送到通过机架交换机的外顶部连接的存储机柜。与传统架构相比,这种架构的转变通过启用机箱级别的资源共享(包括例如冷却风扇和电源单元(PSU),以及其他共享资源)而使机箱管理“更轻便”。在常规方法中,单独的机箱管理控制器(CMC)及其相同的活动孪生备用品被用于管理此类共享资源。
附图说明
图1是根据示例实施例的多节点机箱的示意图。
图2是描绘根据示例实施例的用于多节点发现的一系列操作的流程图。
图3是描绘根据示例实施例的用于选举主节点的一系列操作的流程图。
图4是描绘根据示例实施例的用于容错过程的一系列操作的流程图。
图5是描绘根据示例实施例的用于主控权(mastership)转移过程的一系列操作的流程图。
图6是描绘根据示例实施例的用于操作节点集群的一系列操作的流程图。
图7描绘根据示例实施例的可以托管和执行主选择逻辑的设备(例如,BMC,节点)。
具体实施方式
综述
在独立权利要求中提出了本发明的方面并且在从属权利要求中提出了优选的特征。一个方面的特征可以单独地或与其他方面结合地应用到每个方面。
在一个实施例中,提供了一种方法。在包括多个节点、网络交换机、和被配置为管理机箱的共享资源的可编程器件的机箱中,所述方法包括使用网络交换机在多个节点中的相应节点的基板管理控制器之间建立专用网络;和使用所述专用网络,自动从多个节点中选择给定节点来充当主节点,以代表多个节点中的所有节点对可编程器件编程,从而代表多个节点中的所有节点管理机箱的共享资源。
在另一实施例中,提供了一种装置,该装置包括:机箱;网络交换机;被配置为管理机箱的共享资源的可编程器件;和被设置在机箱中的多个节点,其中多个节点中的每个节点包括基板管理控制器和用于与网络交换机通信的网络接口,其中多个节点和网络交换机限定专用网络,其中多个节点中的每个节点的相应基板管理控制器被配置为自动从多个节点中选择给定节点来充当主节点,以代表多个节点中的所有节点对可编程器件编程,从而代表多个节点中的所有节点管理机箱的共享资源。
示例实施例
本文提出了通过使机箱上的节点集群中的相应节点的BMC彼此主动通信以智能选择其中之一作为控制和监视共享机箱资源的主节点来在无需依赖单独的机箱管理控制器(CMC)硬件或软件的情况下实现共享硬件资源管理的方法和方法学。更具体地,所公开的实施例定义了发现节点到机箱上的动态插入的独特方式,用于在对等BMC(或节点)之间竞争主控权的方法学,以及请求主控权和将主控权移交给请求对等BMC(或节点)而不丢失机箱管理上下文的独特方式。在实施例中,容错被构建到这些方法的每个阶段中以确保即使在硬件失灵的情况下,也可消除灾难性故障。当错误可能发生时,可以通知用户该错误。
首先参考图1,其是根据示例实施例的多节点机箱(或简称为“机箱”)100的示意图。在所示的示例中,机箱100包括用于容纳四个(计算机,刀片服务器等)节点110的插座(未示出)。每个节点110除了别的之外还包括网络接口112和BMC 120。BMC 120包括处理器121和存储器113,存储器113存储可由处理器121执行的主选择逻辑200。主选择逻辑200的细节在下面更全面地描述。网络接口112被配置为支持多个接口,包括例如两个以太网接口。第一以太网网络接口是到网络117的,该网络117用于通过被构建到机箱100上的多端口交换机118在节点110之间进行专用通信。网络117也可以被称为“专用网络”。在图1的示例中,网络117包括BMC1_ETH、BMC2_ETH、BMC3_ETH、和BMC4_ETH,并且被用于在节点110之间交换管理数据。第二以太网网络接口被用于经由例如企业局域网,通过远程接口来管理BMC。
网络接口112还可以支持集成电路间(I2C)总线BMC1_i2C、BMC2_i2C、BMC3_i2C、BMC4_i2C(包括现场可替换单元(FRU)140)和通用输入/输出接口BMCl_GPIO(3)、BMC2_GPIO(3)、BMC3_GPIO(3)、BMC4_GPIO(3)(“GPIO”)。I2C总线和通用输入/输出接口可以被认为是不同于网络117的通信路径。
提供可编程器件130(例如微处理器,可编程逻辑设备(PLD)或可编程片上系统(PSoC))来控制共享资源,例如,风扇150、电源单元(PSU)160(其提供例如12V主电力和备用电力)、前面板125上的发光二极管(LED)、和温度传感器(未示出)。可编程器件130本身由BMC 120中与成为被指定“主”节点的节点110相关联的一个BMC编程或更新。对可编程器件130进行编程可以包括(重新)安装固件,配置寄存器,和/或更改设置,以及其他可能的编程操作。对可编程器件130的编程或更新可以例如经由I2C总线(或可能经由可编程器件130上的通用IO接口)来执行。在一种实现方式中,GPIO用于检测节点的存在。在节点被插入机箱100中时,相关联的GPIO引脚将接地或被拉至高电压。该接地或高电压信号经由GPIO被提供到可编程器件130,可编程器件130还可以包括用于存储存在和/或有故障节点信息135的存储器。继而,可以通过I2C总线将这样的存在和/或有故障节点信息135提供到每个BMC。这种实现方式提供了容错的辅助方法,用于在插入/弹出节点时检测由于硬件失灵(例如,引脚弯曲,插座损坏等)而导致的内部网络故障。
在实施例中,指定的主节点的主选择逻辑200通过聚合来自机箱100上的所有节点110的数据来监视和控制共享资源。下文描述的方法学定义了如何在节点110中发现机箱100中的多个节点110,以及如何选举主节点。下文还描述一种主控权转移过程,该过程可以处理错误情况,例如在集群中无意中存在多个主节点。
在实施例中,通过网络117的数据传输使用两种类型的数据分组来进行:节点数据分组(通过从节点,即,不是主节点发送)和主数据分组(通过主节点发送)。
主数据分组包括机箱遥测信息(例如风扇150的存在,风扇速度,PSU 160的存在,和电压信息)以及协议版本等其他可能的参数。主数据分组仅由主节点广播到所有从节点。节点数据分组包括被指定的主节点用于控制机箱组件的节点信息。节点信息可以包括温度、所需的风扇速度、插槽ID、协议版本等其他可能的参数。节点信息在节点数据分组中被所有节点110广播到它们的对等方。该节点信息可以被存储在每个节点中,例如在存储器113中。主选择逻辑(或简称为“逻辑”)200被配置为发送和接收主数据分组和节点数据分组,如下所述。
多节点发现
图2是描绘用于多节点发现的一系列操作的流程图。在高级别下,图2中所示的操作使每个节点的数据能够被填充到其自己的共享存储器(例如,存储器113)中。然后,该数据被每个节点每隔例如200ms广播到对等节点。同时,每个节点还通过分配的端口侦听对等节点数据。从对等节点接收节点数据分组也被用作检测节点存在的主要手段。如上所述,经由GPIO收集的信息是检测节点存在的辅助手段。
更具体地,在操作210,在每个节点110上独立操作的逻辑200创建共享存储器位置,以在相应的存储器段中针对机箱100中最大数量的受支持的节点110中的每个节点存储节点数据。在212,逻辑200在共享存储器位置中填充其自己的节点数据。在214,逻辑200通过分配的端口经由广播节点数据分组来发送其自己的节点数据。在216,在例如200ms的延迟之后,逻辑200再次为其本身填充节点数据。以这种方式,每个节点110周期性地收集其自己的节点数据,并且每隔例如200ms通过网络117发送该数据。同时,在218,逻辑200在分配的端口上侦听节点数据分组。在220,确定是否已经接收到任何节点数据分组。如果否,在222确定没有检测到对等节点。另一方面,如果已经接收到节点数据分组,那么在224,确定对等节点已被检测到,并且在共享存储器中更新在这种节点数据分组中接收的数据,从而使得每个BMC 120上的逻辑200能够存储与网络117(即,包括图1所示的四个节点110的集群)中的每个节点110相关联的所有数据。
主选举
现在参考图3,图3是描绘用于选举或指定集群中的节点110中的一个节点作为主节点的一系列操作的流程图。
通常,当节点110启动时,默认情况下其被配置为进入从模式。在从模式中,节点110等待从主节点发送的主数据分组一段由以下公式定义的可变等待时间(wt):
等待时间(wt)=(SlotID)x秒。
一旦经过等待时间,如果未接收到主数据分组,则逻辑200被配置为使从节点获得主控权。针对每个节点110不同的等待时间可以确保没有两个节点110同时获得主控权。如果新节点110加入现有集群,则新节点将捕获主数据分组并将以从模式继续。如果主节点被重新启动/移除,则现有的从节点将重新开始主选举过程。
更具体地,并且如图3所示,在302,逻辑200根据如上所述的公式创建计时器并用“等待时间”秒设置计时器,其中SlotID是机箱100中给定节点110被安装在的插槽的插槽ID。在304,逻辑200在分配的端口上侦听网络117上的主分组。在306,逻辑200确定是否已经接收到主数据分组。如果是,这表明集群中的一个节点110已经正在充当主节点,且因此,在308,逻辑200用“等待时间”秒重新设置计时器,然后过程返回到304以再次监听主数据分组。另一方面,如果在306没有接收到主数据分组,则在310,确定计时器是否已经到期,即,确定是否已在预定时间量(例如2秒)之后。如果计时器已经到期,则在312,逻辑200将节点指定为主节点。
容错机制
现在参考图4,图4是描绘容错过程的一系列操作的流程图。在所选择的无意条件下,网络连接性可能是有缺陷的,这导致给定节点110与将集群节点110连接在一起的交换机118断开连接。例如,这种条件可以包括连接器上的引脚弯曲,或电缆故障。未能接收到其自己或对等节点的通告节点数据分组的节点110被标记为有故障,这会从主节点选举过程中撤出该节点。如前所述,可编程器件130可以跟踪存在哪些节点和/或哪些节点有故障。在实施例中,随后被指定为有故障的现有主节点应当交出主控权,并且这样的事件调用在剩余健康节点之间进行的主控权仲裁逻辑。
在其中没有节点110能够彼此通信的情况下,所有节点110被标记为有故障(例如在可编程器件130中),并且它们都不能参与图3的主选举过程。然后可以发起强力算法(brute force algorithm),该强力算法识别在集群中存在的具有最低插槽ID的节点,并将该节点强制作为主节点。这样做是为了确保在集群中存在主节点,该主节点可以监督机箱功能并管理共享资源。
在多个主节点同时存在于集群中的罕见情况下,可以调用图4的过程来很好地解决该情形。也就是说,如果正在发送主数据分组的节点也从另一节点接收到主数据分组,则图4的过程可以被触发。在这种情形下,逻辑200被配置为使得具有最低插槽ID的节点110继续具有主控权并使其他节点交出主控权。
更具体地,在402,节点110之一(用于该功能的目的的“接收节点”)在分配的端口上接收主数据分组。在404,逻辑200确定该接收节点是否也正在发送主数据分组。也就是说,逻辑200被配置为检测在集群中是否存在多于一个指定主节点。如果在404确定该接收节点不是也正在发送主数据分组,则逻辑200在406确定在集群中仅存在单个主节点,并且不需要进一步的动作。另一方面,如果在404确定该接收节点也正在发送主数据分组,则在408,逻辑200确定该接收节点的插槽ID是否大于主张主控权(凭借发送主数据分组)的另一节点的插槽ID。如果否,则在410,该接收节点继续作为指定的主节点,并且不需要进一步进行任何事情。另一方面,如果该接收节点的插槽ID大于主张主控权的另一节点的插槽ID,则在412,逻辑200被配置为使该接收节点交出主控权。也就是说,逻辑200使该接收节点不再充当主节点。
主控权转移
一旦集群启动并在具有活动的主节点的情况下运行,则可能存在给定从节点请求主控权的情形。例如当给定节点从节点接收到固件更新时,可能会发生这种情形。这样的从节点的BMC 120将希望成为主节点以便对可编程器件130进行编程。以下描述的是用于实现主控权的非破坏性(non-disruptive)转移的方法。
给定从节点可以通过更新其节点数据分组中的相应标志来做出对主控权的请求。指定的主节点在接收到该请求时,决定是否可以授予主控权。主节点在做出这样的决定时可以考虑可能需要继续主控权的关键操作的状态。
如果可以将主控权授予请求从节点,则主节点会通知从节点。从节点在接收到主控权授予时发送确定其准备好取得主控权的确认。这种三段式握手有助于确保很好地转移主控权。在接收到来自请求节点的确认时,主节点交出主控权而请求从节点成为主节点。
现在参考图5,图5示出用于主控权转移过程的一系列操作。如所示,从节点510与主节点520通信。更具体地,在525,从节点510将主控权授予请求发送到主节点520。本领域技术人员将理解,逻辑200被配置为执行上述和随后的操作。在526,主节点520接收主控权授予请求,并且在527,确定主控权是否可以被授予。如果否,则在528,主节点520忽略主控权授予请求。如果可以授予主控权,则主节点520将主控权被授予消息530发送到从节点510。如果在531,例如由于例如两秒的超时而不能授予主控权,则在532可以认为主控权授予请求被拒绝。如果主控权被授予,则从节点510将主控权确认540发送到主节点520。主节点520在541接收主控权确认540,并且然后主节点520在542配置其本身以交出主控权。与交出主控权有关,主节点520将被交出主控权消息550发送到从节点510。从节点510在551接收到该被交出主控权消息,并且此后在552成为集群的主节点。
图6是描绘根据示例实施例的用于操作节点集群的一系列操作的流程图。在602,在包括多个节点、网络交换机、和被配置为管理机箱的共享资源的可编程器件的机箱中,使用该网络交换机在多个节点中的节点的相应基板管理控制器之间建立专用网络。在604,使用专用网络,基板管理控制器自动从多个节点中选择一个节点作为主节点,以代表多个节点中的所有节点来对可编程器件编程,从而代表多个节点中的所有节点管理机箱的共享资源。
本领域技术人员将认识到,结合图2-6描述的数据交换可以经由例如网络117进行。
总之,提供了一种系统和方法,用于发现多个节点并在其中选举主节点的容错且有效的方式。所公开的方法学的特点在于是一种在没有关于事件的事先用户输入的情况下处理动态节点插入和移除的方法。该方法学被配置为通过以下操作来很好地处理网络故障:通过重新配置集群以确保主节点是在连接的节点中选择的并且在任何时间点只有一个主节点存在。
图7描绘了根据示例实施例的主选择逻辑200的设备700(例如节点110)。应当理解的是,图7仅提供一个实施例的图示,并不暗示对可以在其中实现不同实施例的环境的任何限制。可以对所描绘的环境进行许多修改。
如所描绘的,设备700包括总线712,该总线712提供(一个或多个)计算机处理器714、存储器716、永久性存储装置718、通信单元720、和(一个或多个)输入/输出(I/O)接口722之间的通信。总线712可以用任何如下架构来实现:其被设计用于在处理器(例如微处理器,通信和网络处理器等)、系统存储器、外围设备、以及系统内的任何其他硬件组件之间传递数据和/或控制信息。例如,总线712可以用一个或多个总线来实现。
存储器716和永久性存储装置718是计算机可读存储介质。在所描绘的实施例中,存储器716包括随机存取存储器(RAM)724和缓存存储器726。通常,存储器716可以包括任何合适的易失性或非易失性计算机可读存储介质。
可以将一个或多个程序(例如,主选择逻辑200)存储在永久性存储装置718中,以由一个或多个相应的计算机处理器714经由存储器716中的一个或多个存储器来执行。永久性存储装置718可以是磁性硬盘驱动、固态硬驱动、半导体存储设备、只读存储器(ROM)、可擦可编程只读存储器(EPROM)、闪存、或能够存储程序指令或数字信息的任何其他计算机可读存储介质。例如,该一个或多个程序可包括软件指令,所述软件指令在由一个或多个处理器714执行时使计算设备700执行例如图2-6的操作。
由永久性存储装置718使用的介质也可以是可移动的。例如,可移动硬驱动可以被用于永久性存储装置718。其他示例包括光盘和磁盘、拇指驱动、和智能卡,它们被插入到驱动中以传输到另一计算机可读存储介质上,该介质也是永久性存储装置718的一部分。
在这些示例中,通信单元720允许与其他数据处理系统或设备的通信。在这些示例中,通信单元720包括一个或多个网络接口卡。通信单元720可以通过使用物理和无线通信链路之一或二者来提供通信。
(一个或多个)I/O接口722允许与可以连接到计算机设备700的其他设备进行数据的输入和输出。例如,I/O接口722可以提供到外部设备728(例如,键盘、小键盘、触摸屏、和/或一些其他合适的输入设备)的连接。外部设备728还可包括便携式计算机可读存储介质,例如,数据库系统、拇指驱动、便携式光盘或磁盘、以及存储卡。
用于实施实施例的软件和数据可以被存储在这样的便携式计算机可读存储介质上并且可以经由(一个或多个)I/O接口722被加载到永久性存储装置718上。(一个或多个)I/O接口722也可以连接到显示器730。显示器730提供了一种用于向用户显示数据的机构并且可以是例如计算机监视器。
本文描述的程序基于如下的应用被标识:这些程序针对该应用被实现在特定实施例中。然而,应当理解,本文中的任何特定程序术语仅是为了方便而使用,且因此实施例不应限于仅在由此类术语标识和/或暗示的任何特定应用中使用。
与本文描述的操作有关的数据可以被存储在任何常规或其他数据结构(例如,文件,阵列,列表,堆栈,队列,记录等)内并且可以被存储在任何所需的存储单元(例如,数据库,数据或其他存储库,队列等)中。在实体之间传送的数据可以包括任何期望的格式和布置,并且可以包括任何量的任何类型的任何大小的字段以存储数据。用于任何数据集的定义和数据模型可以以任何期望的方式(例如,计算机相关语言,图形表示,列表等)指示总体结构。
本实施例可以采用任何数量的任何类型的用户界面(例如,图形用户界面(GUI),命令行,提示等)来获取或提供信息(例如与抓取网站有关的数据),其中界面可以包括以任何方式布置的任何信息。界面可以包括被设置在任何位置的任何数量的任何类型的输入或致动机构(例如按钮,图标,字段,框,链接等)以经由任何合适的输入设备(例如鼠标,键盘等)输入/显示信息和发起期望的动作。界面屏幕可以包括任何合适的致动器(例如链接,标签等)来以任何方式在屏幕之间导航。
本实施例的环境可以包括任何数量的计算机或其他处理系统(例如,客户端或最终用户系统,服务器系统等)以及以任何期望方式布置的数据库或其他存储库,其中,本实施例可以被应用到任何期望类型的计算环境(例如,云计算,客户端-服务器,网络计算,大型机,独立系统等)。被本实施例采用的计算机或其他处理系统可以由任何数量的任何个人或其他类型的计算机或处理系统(例如台式机,膝上型计算机,PDA,移动设备等)实现,并且可以包括任何市售的操作系统以及市售与定制软件(例如机器学习软件等)的任何组合。这些系统可以包括任何类型的监视器和输入设备(例如,键盘,鼠标,语音识别等)以输入和/或查看信息。
应当理解,本实施例的软件可以以任何期望的计算机语言来实现并且可以由计算机领域的普通技术人员基于说明书中所包含的功能描述和附图中示出的流程图来开发。此外,本文中对执行各种功能的软件的任何引用通常是指在软件控制下执行那些功能的计算机系统或处理器。本实施例的计算机系统可以可替代地由任何类型的硬件和/或其他处理电路系统来实现。
计算机或其他处理系统的各种功能可以以任何方式分布在任何数量的软件和/或硬件模块或单元,处理或计算机系统和/或电路系统中,其中计算机或处理系统可以彼此本地或远程地被设置并经由任何合适的通信介质(例如,LAN,WAN,内联网,互联网,硬线,调制解调器连接,无线等)来通信。例如,本实施例的功能可以以任何方式被分布在各种最终用户/客户端和服务器系统,和/或任何其他中间处理设备中。以上描述的和流程图中示出的软件和/或算法可以以实现本文描述的功能的任何方式进行修改。另外,可以以完成所需操作的任何顺序来执行流程图或描述中的功能。
本实施例的软件可以在用于与独立的系统或通过网络或其他通信介质连接的系统一起使用的固定或便携程序产品装置或设备的非暂时性计算机可用介质(例如磁性或光学介质,磁光介质,软盘,CD-ROM,DVD,存储器设备等)上可获得。
可以通过任何数量的任何类型的通信网络(例如LAN,WAN,互联网,内联网,VPN等)来实现通信网络。本实施例的计算机或其他处理系统可以包括任何常规或其他通信设备以经由任何常规或其他协议在网络上通信。该计算机或其他处理系统可以利用任何类型的连接(例如有线,无线等)来访问网络。可以通过任何合适的通信介质(例如,局域网(LAN),硬线,无线链路,内联网等)来实现本地通信介质。
该系统可以采用任何数量的任何常规或其他数据库、数据储存或存储结构(例如,文件,数据库,数据结构,数据或其他存储库等)来存储信息(例如,与联络中心交互路由有关的数据)。数据库系统可以由任何数量的任何常规或其他数据库、数据储存或存储结构(例如文件,数据库,数据结构,数据或其他存储库等)实现以存储信息(例如与联络中心交互路由有关的数据)。数据库系统可以被包括在服务器和/或客户端系统内或耦合到服务器和/或客户端系统。数据库系统和/或存储结构可以远离计算机或其他处理系统或在计算机或其他处理系统本地,并且可以存储任何期望的数据(例如与联络中心交互路由有关的数据)。
所呈现的实施例可以以各种形式,例如,处于任何可能的集成技术细节水平的系统、方法和/或计算机程序产品。该计算机程序产品可以包括在其上具有用于使处理器进行本文所提出的方面的计算机可读程序指令的(一个或多个)计算机可读存储介质。
该计算机可读存储介质可以是可以保留和存储供指令执行设备使用的指令的有形设备。计算机可读存储介质可以是例如但不限于电子存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备、或前述的任何合适的组合。计算机可读存储介质的更具体示例的非穷举列表包括以下:便携式计算机磁盘,硬盘,随机存取存储器(RAM),只读存储器(ROM),可擦可编程只读存储器(EPROM或闪存),静态随机存取存储器(SRAM),便携式压缩盘只读存储器(CD-ROM),数字多功能磁盘(DVD),记忆棒,软盘,机械编码设备(例如,在其上记录有指令的凹槽中的凸起结构或打孔卡),以及上述的任何合适组合。如本文所使用的,计算机可读存储介质不应被理解为本身是暂时性信号,例如,无线电波或其他自由传播的电磁波,通过波导或其他传输介质传播的电磁波(例如经过光纤电缆的光脉冲),或通过电线传输的电信号。
可以经由网络(例如,互联网、局域网、广域网和/或无线网络)将本文描述的计算机可读程序指令从计算机可读存储介质下载到相应的计算/处理设备或下载到外部计算机或外部存储设备。该网络可以包括铜传输电缆、光传输光纤、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配器卡或网络接口从网络接收计算机可读程序指令并转发计算机可读程序指令以存储在相应的计算/处理设备内的计算机可读存储介质中。
用于进行本实施例的操作的计算机可读程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微码、固件指令、状态设置数据、用于集成电路系统的配置数据,或以一种或多种编程语言(包括面向对象的编程语言(例如Smalltalk,C++等)和过程编程语言(例如“C”编程语言或类似编程语言))的任何组合编写的源代码或目标代码。计算机可读程序指令可以完全在用户计算机上,部分在用户计算机上,作为独立软件包执行,部分在用户计算机上且部分在远程计算机上,或完全在远程计算机或服务器上执行。在后一种情况下,远程计算机可以通过任何类型的网络(包括局域网(LAN)或广域网(WAN))连接到用户计算机,或可以(例如,通过使用互联网服务提供商的互联网)与外部计算机进行连接。在一些实施例中,包括例如可编程逻辑电路系统、现场可编程门阵列(FPGA)、或可编程逻辑阵列(PLA)的电子电路系统可以通过利用计算机可读程序指令的状态信息来执行计算机可读程序指令以个性化该电子电路系统,以便执行本文提出的方面。
本文参考根据实施例的方法、装置(系统)和计算机程序产品的流程图图示和/或框图描述了本实施例的各方面。将理解,流程图图示和/或框图的每个框以及流程图图示和/或框图中的框的组合可以通过计算机可读程序指令来实现。
可以将这些计算机可读程序指令提供到通用计算机、专用计算机或其他可编程数据处理装置的处理器以产生机器,使得经由计算机或其他可编程数据处理装置的处理器执行的指令创建用于实现流程图和/或框图的一个或多个框中指定的功能/动作的手段。这些计算机可读程序指令还可以被存储在计算机可读存储介质中,该计算机可读存储介质可以指导计算机、可编程数据处理装置、和/或其他设备以特定方式起作用,使得在其中存储有指令的计算机可读存储介质包括制品,该制品包括实现在流程图和/或框图的一个或多个框中指定的功能/动作的各方面的指令。
也可以将计算机可读程序指令加载到计算机、其他可编程数据处理装置、或其他设备上,以使得在该计算机、其他可编程装置或其他设备上执行一系列操作步骤以产生计算机实现的过程,使得在该计算机、其他可编程装置或其他设备上执行的指令实现流程图和/或框图的一个或多个框中指定的功能/动作。
附图中的流程图和框图示出根据各种实施例的系统、方法和计算机程序产品的可能实现方式的架构、功能和操作。就这一点而言,流程图或框图中的每个框可以表示指令的模块、片段或部分,其包括用于实现(一个或多个)指定的逻辑功能的一个或多个可执行指令。在一些替代实现方式中,框中指出的功能可以不按图中指出的顺序出现。例如,取决于所涉及的功能,实际上可以基本上同时执行连续示出的两个框,或有时可以以相反的顺序执行这些框。还应注意,框图和/或流程图图示的每个框,以及框图和/或流程图图示中的框的组合可以由基于专用硬件的系统来实现,该基于专用硬件的系统执行指定的功能或动作,或者进行专用硬件和计算机指令的组合。
总之,在一种形式中,提供了一种方法。该方法包括在包括多个节点、网络交换机、和被配置为管理机箱的共享资源的可编程器件的机箱中,使用该网络交换机在多个节点中的节点的相应基板管理控制器之间建立专用网络;和使用该专用网络,自动从多个节点中选择给定节点来充当主节点,以代表多个节点中的所有节点对可编程器件编程,从而代表多个节点中的所有节点管理机箱的共享资源。
该方法可以进一步包括相应基板管理控制器通过与专用网络不同的网络与企业局域网通信,以管理相应基板管理控制器。
在实施例中,共享资源包括以下各项中的至少一个:机箱的风扇、机箱的电源单元、机箱的前面板上的发光二极管(LED)、以及机箱的温度传感器。
该方法还可以包括在多个节点中的每个节点与可编程器件之间提供不同于专用网络的通信路径,该通信路径用于对可编程器件编程。
该通信路径可以是集成电路间(I2C)总线或通用输入输出线之一。
在实施例中,相应基板管理控制器被配置为进行以下操作:经由专用网络周期性地从多个节点中的这些节点中的每个节点接收节点数据,以及存储该节点数据。
该方法还可以包括在以下情况之后使给定节点充当主节点:对来自多个节点中的任何其他节点的主数据分组进行侦听,但在预定时间量之后未接收到来自多个节点中的任何其他节点的主数据分组。
在实施例中,预定时间量是基于机箱上的如下物理插槽来确定的:给定节点被安装在该物理插槽中。
该方法还包括:当给定节点从多个节点中的另一节点接收到主数据分组时,使给定节点不再充当主节点。
该方法还可以包括:从多个节点中的另一节点接收使给定节点不再充当主节点的主授予请求。
在另一种形式中,根据实施例,也可以提供一种设备或装置。该设备可以包括机箱;网络交换机;被配置为管理机箱的共享资源的可编程器件;和被设置在机箱中的多个节点,其中多个节点中的每个节点包括基板管理控制器和与网络交换机通信的网络接口,其中多个节点和网络交换机限定专用网络,其中多个节点中的每个节点的基板管理控制器被配置为自动从多个节点中选择给定节点以充当主节点,以代表多个节点中的所有节点对可编程器件编程,从而代表多个节点中的所有节点管理机箱的共享资源。
在实施例中,每个相应基板管理控制器包括到不同于专用网络的企业局域网的另一网络接口,以管理每个相应基板管理控制器。
在实施例中,共享资源包括以下各项中的至少一个:机箱的风扇、机箱的电源单元、机箱的前面板上的发光二极管(LED)、以及机箱的温度传感器。
该设备可以进一步包括在多个节点中的每个节点与可编程器件之间的通信路径,该通信路径不同于专用网络并被用于对可编程器件编程。
在实施例中,该通信路径可以是集成电路间(I2C)总线或通用输入输出线之一。
在实施例中,基板管理控制器被配置为进行以下操作:经由专用网络周期性地从多个节点中的每个节点接收节点数据,以及存储该节点数据。
在实施例中,多个节点中的给定节点的基板管理控制器被配置为在以下情况之后使给定节点充当主节点:对来自多个节点中的任何其他节点的主数据分组进行侦听,但在预定时间量期间未接收到来自多个节点中的任何其他节点的主数据分组。
在又一种形式中,提供了一种非暂时性计算机可读存储介质,该介质用指令编码,所述指令当由处理器执行时使该处理器进行以下操作:使用网络交换机来在多个节点中的节点的相应基板管理控制器之间建立专用网络;和使用该专用网络,自动从多个节点中选择给定节点来充当主节点,以代表多个节点中的所有节点对可编程器件编程,从而代表多个节点中的所有节点管理机箱的共享资源。
指令还可以包括当由处理器执行时使该处理器进行以下操作的指令:通过不同于专用网络的网络与企业局域网通信以管理相应基板管理控制器。
在实施例中,共享资源包括以下各项中的至少一个:机箱的风扇、机箱的电源单元、机箱的前面板上的发光二极管(LED)、以及机箱的温度传感器。
上面的描述仅是示例性的。在不脱离本文描述的概念的范围以及在权利要求的等同物的范畴和范围内,可以在其中进行各种修改和结构改变。

Claims (21)

1.一种方法,包括:
在包括多个节点、网络交换机、和可编程器件的机箱中,使用所述网络交换机来在所述多个节点中的节点的相应基板管理控制器之间建立专用网络,其中该可编程器件被配置为管理所述机箱的共享资源;和
使用所述专用网络,自动从所述多个节点中选择给定节点来充当主节点,以代表所述多个节点中的所有节点对所述可编程器件进行编程,从而代表所述多个节点中的所有节点管理所述机箱的所述共享资源。
2.根据权利要求1所述的方法,还包括:所述相应基板管理控制器通过不同于所述专用网络的网络与企业局域网通信,以管理所述相应基板管理控制器。
3.根据权利要求1或2所述的方法,其中,所述共享资源包括以下各项中的至少一个:所述机箱的风扇、所述机箱的电源单元、所述机箱的前面板上的发光二极管(LED)、以及所述机箱的温度传感器。
4.根据权利要求1至3中任一项所述的方法,还包括:在所述多个节点中的每个节点与所述可编程器件之间,提供不同于所述专用网络的、用于对所述可编程器件进行编程的通信路径。
5.根据权利要求4所述的方法,其中,所述通信路径是以下各项中的一者:集成电路间(I2C)总线或通用输入输出线。
6.根据权利要求1至5中任一项所述的方法,其中,所述相应基板管理控制器被配置为进行以下操作:经由所述专用网络周期性地从所述多个节点中的每个节点接收节点数据,以及存储所述节点数据。
7.根据权利要求1至6中任一项所述的方法,还包括在如下情况之后使所述给定节点充当所述主节点:对来自所述多个节点中的任何其他节点的主数据分组进行侦听,但在预定时间量后未接收到来自所述多个节点中的任何其他节点的主数据分组。
8.根据权利要求7所述的方法,其中,所述预定时间量是基于所述机箱上的、所述给定节点被安装在其中的物理插槽来确定的。
9.根据权利要求1至8中任一项所述的方法,还包括:当所述给定节点从所述多个节点中的另一节点接收到主数据分组时,使所述给定节点不再充当所述主节点。
10.根据权利要求1至9中任一项所述的方法,还包括:从所述多个节点中的另一节点接收使所述给定节点不再充当所述主节点的主授予请求。
11.一种装置,包括:
机箱;
网络交换机;
可编程器件,被配置为管理所述机箱的共享资源;和
被设置在所述机箱中的多个节点,其中所述多个节点中的每个节点包括基板管理控制器和用于与所述网络交换机进行通信的网络接口,其中所述多个节点和所述网络交换机限定专用网络;
其中,所述多个节点中的每个节点的相应基板管理控制器被配置为:自动从所述多个节点中选择给定节点来充当主节点,以代表所述多个节点中的所有节点对所述可编程器件进行编程,从而代表所述多个节点中的所有节点管理所述机箱的所述共享资源。
12.根据权利要求11所述的装置,其中,每个相应基板管理控制器包括到企业局域网的另一网络接口,以管理每个相应基板管理控制器,其中该企业局域网不同于所述专用网络。
13.根据权利要求11或12所述的装置,其中,所述共享资源包括以下各项中的至少一个:所述机箱的风扇、所述机箱的电源单元、所述机箱的前面板上的发光二极管(LED)、以及所述机箱的温度传感器。
14.根据权利要求11至13中任一项所述的装置,还包括:在所述多个节点中的每个节点与所述可编程设备之间的通信路径,该通信路径不同于所述专用网络并且被用于对所述可编程器件进行编程。
15.根据权利要求14所述的装置,其中,所述通信路径是以下各项中的一者:集成电路间(I2C)总线或通用输入输出线。
16.根据权利要求11至15中任一项所述的装置,其中,所述基板管理控制器被配置为进行以下操作:经由所述专用网络从所述多个节点中的每个节点周期性地接收节点数据,以及存储所述节点数据。
17.根据权利要求11至16中任一项所述的装置,其中,所述多个节点中的所述给定节点的基板管理控制器被配置为在如下情况之后使所述给定节点充当所述主节点:对来自所述多个节点中的任何其他节点的主数据分组进行侦听,但在预定时间量期间未接收到来自所述多个节点中的任何其他节点的主数据分组。
18.一种用指令编码的非暂时性计算机可读存储介质,这些指令当由处理器执行时使所述处理器进行以下操作:
使用网络交换机来在多个节点中的节点的相应基板管理控制器之间建立专用网络;和
使用所述专用网络,自动从所述多个节点中选择给定节点来充当主节点,以代表所述多个节点中的所有节点对可编程器件进行编程,从而代表所述多个节点中的所有节点管理机箱的共享资源。
19.根据权利要求18所述的非暂时性计算机可读存储介质,其中所述指令当由所述处理器执行时,使所述处理器进行以下操作:通过不同于所述专用网络的网络与企业局域网通信,以管理所述相应基板管理控制器。
20.根据权利要求18或19所述的非暂时性计算机可读存储介质,其中所述共享资源包括以下各项中的至少一个:所述机箱的风扇、所述机箱的电源单元、所述机箱的前面板上的发光二极管(LED)、以及所述机箱的温度传感器。
21.一种计算机程序、计算机程序产品或计算机可读介质,包括指令,这些指令当由计算机执行时,使所述计算机执行权利要求1至10中任一项所述的方法的步骤。
CN201980043330.XA 2018-07-19 2019-07-11 用于操作节点集群的方法、装置及可读存储介质 Active CN112368982B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
IN201841026961 2018-07-19
IN201841026961 2018-07-19
US16/453,019 US10979497B2 (en) 2018-07-19 2019-06-26 Multi-node discovery and master election process for chassis management
US16/453,019 2019-06-26
PCT/US2019/041294 WO2020018335A1 (en) 2018-07-19 2019-07-11 Multi-node discovery and master election process for chassis management

Publications (2)

Publication Number Publication Date
CN112368982A true CN112368982A (zh) 2021-02-12
CN112368982B CN112368982B (zh) 2023-05-26

Family

ID=69163272

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980043330.XA Active CN112368982B (zh) 2018-07-19 2019-07-11 用于操作节点集群的方法、装置及可读存储介质

Country Status (4)

Country Link
US (1) US10979497B2 (zh)
EP (1) EP3824605A1 (zh)
CN (1) CN112368982B (zh)
WO (1) WO2020018335A1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113645067A (zh) * 2021-08-03 2021-11-12 加弘科技咨询(上海)有限公司 多节点基板管理控制器的网络管理系统及方法
CN116132964A (zh) * 2022-12-16 2023-05-16 西安电子科技大学 一种降低多节点协同发现延迟的参数设置方法
CN117955868A (zh) * 2024-03-26 2024-04-30 苏州元脑智能科技有限公司 服务器机箱的节点管理方法以及相关装置
CN117955868B (zh) * 2024-03-26 2024-06-07 苏州元脑智能科技有限公司 服务器机箱的节点管理方法以及相关装置

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111092918B (zh) * 2018-10-23 2023-08-18 联想企业解决方案(新加坡)有限公司 计算节点和建立云集群的方法
US11108700B2 (en) * 2019-06-28 2021-08-31 Oracle International Corporation Method and system to implement messaging for cluster elections
US11593583B2 (en) 2019-06-28 2023-02-28 Oracle International Corporation Method and system to implement cluster failure prediction to facilitate split brain resolution
US11445028B2 (en) * 2020-12-30 2022-09-13 Dell Products L.P. System and method for providing secure console access with multiple smart NICs using NC-SL and SPDM
DE102021001792B3 (de) 2021-04-07 2022-05-25 Sew-Eurodrive Gmbh & Co Kg Automatisierungssystem und Verfahren zum Betrieb eines Automatisierungssystems
CN113872796B (zh) * 2021-08-26 2024-04-23 浪潮电子信息产业股份有限公司 服务器及其节点设备信息获取方法、装置、设备、介质
CN114356725B (zh) * 2022-03-22 2022-06-07 苏州浪潮智能科技有限公司 机箱管理系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140344389A1 (en) * 2013-05-17 2014-11-20 Hon Hai Precision Industry Co., Ltd. Server having multiple nodes and method for dynamically setting master node of the server
US20160099886A1 (en) * 2014-10-07 2016-04-07 Dell Products, L.P. Master baseboard management controller election and replacement sub-system enabling decentralized resource management control
EP3240238A1 (en) * 2016-04-27 2017-11-01 Quanta Computer Inc. System and method for reducing management ports of a multiple node chassis system
CN108173959A (zh) * 2018-01-09 2018-06-15 郑州云海信息技术有限公司 一种集群存储系统

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8572031B2 (en) * 2010-12-23 2013-10-29 Mongodb, Inc. Method and apparatus for maintaining replica sets
US9451383B2 (en) * 2011-10-21 2016-09-20 Nokia Technologies Oy Method and apparatus for maintaining one or more communication sessions
WO2013147767A1 (en) * 2012-03-28 2013-10-03 Intel Corporation Configurable and fault-tolerant baseboard management controller arrangement
US20130278412A1 (en) * 2012-04-20 2013-10-24 Detcon, Inc. Networked system and methods for detection of hazardous conditions
DE102014107884A1 (de) * 2014-06-04 2015-12-17 Epcos Ag Relais
US9842013B2 (en) * 2014-10-27 2017-12-12 Aruba Networks, Inc. Dynamic adaptive approach for failure detection of node in a cluster
US9866548B2 (en) * 2014-12-17 2018-01-09 Quanta Computer Inc. Authentication-free configuration for service controllers
CN107736000B (zh) * 2015-06-30 2021-02-26 华为技术有限公司 一种终端与网络设备交互的方法和终端
US20170102952A1 (en) * 2015-10-07 2017-04-13 Dell Products, L.P. Accessing data stored in a remote target using a baseboard management controler (bmc) independently of the status of the remote target's operating system (os)
TWI582585B (zh) * 2015-11-18 2017-05-11 神雲科技股份有限公司 機櫃的監控系統
US20170206110A1 (en) * 2016-01-18 2017-07-20 American Megatrends Inc. Computer System for BMC resource management
US10013319B2 (en) * 2016-08-05 2018-07-03 Nxp Usa, Inc. Distributed baseboard management controller for multiple devices on server boards
US10261821B2 (en) * 2016-12-02 2019-04-16 Dell Products L.P. System and method to expose remote virtual media partitions to virtual machines
US10728086B2 (en) * 2017-03-23 2020-07-28 Dell Products, L.P. System and method for providing a redundant communication path between a server rack controller and one or more server controllers
US10310745B2 (en) * 2017-05-19 2019-06-04 Samsung Electronics Co., Ltd. Method and apparatus for fine tuning and optimizing NVMe-oF SSDs
US20190171602A1 (en) * 2017-12-05 2019-06-06 Samsung Electronics Co., Ltd. Systems and methods for supporting inter-chassis manageability of nvme over fabrics based systems

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140344389A1 (en) * 2013-05-17 2014-11-20 Hon Hai Precision Industry Co., Ltd. Server having multiple nodes and method for dynamically setting master node of the server
US20160099886A1 (en) * 2014-10-07 2016-04-07 Dell Products, L.P. Master baseboard management controller election and replacement sub-system enabling decentralized resource management control
EP3240238A1 (en) * 2016-04-27 2017-11-01 Quanta Computer Inc. System and method for reducing management ports of a multiple node chassis system
CN108173959A (zh) * 2018-01-09 2018-06-15 郑州云海信息技术有限公司 一种集群存储系统

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113645067A (zh) * 2021-08-03 2021-11-12 加弘科技咨询(上海)有限公司 多节点基板管理控制器的网络管理系统及方法
CN116132964A (zh) * 2022-12-16 2023-05-16 西安电子科技大学 一种降低多节点协同发现延迟的参数设置方法
CN116132964B (zh) * 2022-12-16 2024-04-16 西安电子科技大学 一种降低多节点协同发现延迟的参数设置方法
CN117955868A (zh) * 2024-03-26 2024-04-30 苏州元脑智能科技有限公司 服务器机箱的节点管理方法以及相关装置
CN117955868B (zh) * 2024-03-26 2024-06-07 苏州元脑智能科技有限公司 服务器机箱的节点管理方法以及相关装置

Also Published As

Publication number Publication date
WO2020018335A1 (en) 2020-01-23
US10979497B2 (en) 2021-04-13
CN112368982B (zh) 2023-05-26
US20200028902A1 (en) 2020-01-23
EP3824605A1 (en) 2021-05-26

Similar Documents

Publication Publication Date Title
CN112368982B (zh) 用于操作节点集群的方法、装置及可读存储介质
US9983957B2 (en) Failover mechanism in a distributed computing system
CA2783452C (en) Migrating virtual machines among networked servers upon detection of degrading network link operation
US9348653B2 (en) Virtual machine management among networked servers
US8578375B2 (en) Virtual machine administration for data center resource managers
US10404690B2 (en) Authentication-free configuration for service controllers
US10474451B2 (en) Containerized upgrade in operating system level virtualization
JP2016536735A (ja) ハードディスクおよび管理方法
US20150278048A1 (en) Systems and methods for restoring data in a degraded computer system
US20150261677A1 (en) Apparatus and Method of Resolving Protocol Conflicts in an Unordered Network
US20160241432A1 (en) System and method for remote configuration of nodes
US8621260B1 (en) Site-level sub-cluster dependencies
US9780960B2 (en) Event notifications in a shared infrastructure environment
US8769088B2 (en) Managing stability of a link coupling an adapter of a computing system to a port of a networking device for in-band data communications
US11966350B2 (en) Configurable storage server with multiple sockets
US9811345B2 (en) Utilizing computing resources under a disabled processor node without fully enabling the disabled processor node
US11368413B2 (en) Inter-switch link identification and monitoring
US11347675B2 (en) System and method for dynamically configuring storage mapping

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant