CN107124393B - 通过网络的远程主机管理 - Google Patents

通过网络的远程主机管理 Download PDF

Info

Publication number
CN107124393B
CN107124393B CN201710078783.9A CN201710078783A CN107124393B CN 107124393 B CN107124393 B CN 107124393B CN 201710078783 A CN201710078783 A CN 201710078783A CN 107124393 B CN107124393 B CN 107124393B
Authority
CN
China
Prior art keywords
management
packet
network
nic
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710078783.9A
Other languages
English (en)
Other versions
CN107124393A (zh
Inventor
尤瓦尔·伊特金
里然·丽丝
阿米尔·安塞尔
拉恩·索弗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mellanox Technologies Ltd
Original Assignee
Mellanox Technologies Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mellanox Technologies Ltd filed Critical Mellanox Technologies Ltd
Publication of CN107124393A publication Critical patent/CN107124393A/zh
Application granted granted Critical
Publication of CN107124393B publication Critical patent/CN107124393B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/02Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
    • H04L67/025Protocols based on web technology, e.g. hypertext transfer protocol [HTTP] for remote control or remote monitoring of applications
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F13/38Information transfer, e.g. on bus
    • G06F13/42Bus transfer protocol, e.g. handshake; Synchronisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F13/14Handling requests for interconnection or transfer
    • G06F13/36Handling requests for interconnection or transfer for access to common bus or bus system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F13/38Information transfer, e.g. on bus
    • G06F13/40Bus structure
    • G06F13/4004Coupling between buses
    • G06F13/4027Coupling between buses using bus bridges
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/54Interprogram communication
    • G06F9/546Message passing systems or structures, e.g. queues
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/104Peer-to-peer [P2P] networks
    • H04L67/1087Peer-to-peer [P2P] networks using cross-functional networking aspects
    • H04L67/1091Interfacing with client-server systems or between P2P systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/56Provisioning of proxy services
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/22Parsing or analysis of headers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/30Definitions, standards or architectural aspects of layered protocol stacks
    • H04L69/32Architecture of open systems interconnection [OSI] 7-layer type protocol stacks, e.g. the interfaces between the data link level and the physical level
    • H04L69/322Intralayer communication protocols among peer entities or protocol data unit [PDU] definitions
    • H04L69/324Intralayer communication protocols among peer entities or protocol data unit [PDU] definitions in the data link layer [OSI layer 2], e.g. HDLC

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Software Systems (AREA)
  • Computer Hardware Design (AREA)
  • Computer Security & Cryptography (AREA)
  • Computing Systems (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开了通过网络的远程主机管理。一种用于管理主机计算机的方法,该主机计算机包括被配置成独立于主机CPU地执行在遵守第一数据链路协议的管理封包中包含的主机管理指令的管理控制器。该方法包括接收来自根据第一数据链路协议操作的第一网络的管理封包。管理封包被封装在遵守不同于第一数据链路协议的第二数据链路协议的数据封包中。数据封包被发送到根据第二数据链路协议操作的第二网络。发送的数据封包在安装在主机计算机中并且连接于第二网络的网络接口控制器(NIC)中从第二网络被接收。NIC从接收到的数据封包中解封装管理封包,并且将解封装的管理封包经由边带连接传送到管理控制器。

Description

通过网络的远程主机管理
发明领域
本发明总体上涉及计算机系统,并且具体涉及用于通过网络远程管理计算机的方法和系统。
背景
在本领域中,用于远程管理主机计算机的各种技术是已知的。例如,美国专利6,367,035描述了用于在具有中央处理单元(CPU)和辅助单元的主机计算机中诊断并且矫正故障的方法和装置。该装置具有两部分:耦合于主机计算机并且可操作为禁用CPU并且操作和/或询问辅助单元的以服务卡形式的第一部分,以及耦合于第一部分并且可操作为通过第一部分在计算机中诊断故障并且通过第一部分产生至少一些矫正措施的以远程支持站形式的第二部分。第一部分和第二部分被相互远离地定位,并且通过电信链路(诸如,通过调制解调器)连接。
在以上的专利中设想到的各种能力均已在智能平台管理接口(IPMI)规范中被标准化,该规范提供了独立于主机CPU、固件以及操作系统的管理和监测能力。IPMI定义了由系统管理器使用的一组接口以用于计算机系统的带外管理和其操作的监测。通过使用对计算机中的基板管理控制器(BMC)的网络连接而非使用对操作系统或者登入shell的网络连接,IPMI使得管理器即使在计算机断电或者在以其他方式不响应的时候也能管理计算机。通常被实施为嵌入计算机母版的专用微控制器的BMC管理在系统管理软件和平台硬件之间的接口。
概述
下文描述的本发明的实施例提供了实现独立于与计算机连接的网络的类型地远程管理计算机的系统和方法。
根据本发明的实施例,因此提供了用于管理主机计算机的系统,该主机计算机包括中央处理单元(CPU)、系统存储器以及被配置成独立于CPU地执行在遵守第一数据链路协议的管理封包中包含的主机管理指令的管理控制器。该系统包括网桥,该网桥包括第一网络接口控制器(NIC),其被配置成从根据第一数据链路协议操作的第一网络接收管理封包;以及第二NIC,其被配置用于连接于根据不同于第一数据链路协议的第二数据链路协议操作的第二网络。在网桥中的桥接逻辑被配置成将管理封包封装在遵守第二数据链路协议的数据封包中,并且将数据封包经由第二NIC传输到第二网络。被配置用于安装在主机计算机中的第三NIC包括被配置成从第二网络接收数据封包的网络接口以及封包处理电路,该封包处理电路被配置成识别封装管理封包的数据封包,并且解封装和将管理封包经由边带连接传送到管理控制器。
在一些实施例中,第三NIC包括与边带连接分离的并且耦合于CPU和系统存储器的主机接口,并且第三NIC可操作用于经由网络接口发送和接收在系统存储器与第二网络上的其他主机计算机之间传递数据的另外的封包。在公开的实施例中,第三NIC被配置成在主机计算机和第二网络上的其他主机计算机之间建立的多个队列对(QP)上发送和接收另外的封包,同时在被指定用于在网桥和第三NIC之间传递管理封包的另一个QP上接收来自网桥的数据封包。通常,第三NIC被配置成独立于CPU地在指定的QP上建立与第二NIC的通信。
通常,主机计算机包括向CPU和系统存储器供应主要电力的主电源轨以及向管理控制器供应辅助电力的辅助电源轨。在公开的实施例中,第三NIC被连接以从辅助电源轨接收辅助电力,以便即使在CPU掉电的时候也可解封装并且将管理封包经由边带连接传送到管理控制器。在一个实施例中,当CPU掉电时,第三NIC可操作用于响应于经由网桥发送到第三NIC的指令而唤醒CPU。
在一些实施例中,封包处理电路被配置成经由边带连接接收来自管理控制器的另外的管理封包,以封装另外的管理封包,并且将封装后的另外的管理封包经由网络接口通过第二网络发送到第二NIC,以用于由桥接逻辑解封装并且递送到第一网络。
另外地或者可选地,桥接逻辑被配置成将封装管理封包的数据封包发送到在第二网络上的多个主机计算机,同时充当对于多个主机计算机在第一网络上的代理。
在一些实施例中,第一数据链路协议是以太网协议,而第二数据链路协议是InfiniBand(无限带宽技术)协议。在公开的实施例中,管理控制器包括基板管理控制器(BMC),并且管理封包根据智能平台管理接口(IPMI)被发送到BMC。另外地或者可选地,封装管理封包的数据封包根据InfiniBand协议作为不可靠数据报封包在第二网络上被发送。
根据本发明的实施例,还提供了用于管理主机计算机的方法,该主机计算机包括中央处理单元(CPU)、系统存储器以及被配置成独立于CPU地执行在遵守第一数据链路协议的管理封包中包含的主机管理指令的管理控制器。该方法包括从根据第一数据链路协议操作的第一网络接收管理封包。管理封包被封装在遵守不同于第一数据链路协议的第二数据链路协议的数据封包中。数据封包被发送到根据第二数据链路协议操作的第二网络。发送的数据封包在安装在主机计算机并且连接于第二网络的网络接口控制器(NIC)中接收自第二网络。在NIC中,从接收到的数据封包中解封装管理封包。解封装的管理封包从NIC经由边带连接被传送到管理控制器。
从与附图结合的本发明的实施例的下列详细描述中,本发明将得到更完全地理解,其中:
附图简述
图1是根据本发明的实施例示意性示出计算机系统的框图;
图2是根据本发明的实施例示意性示出主机计算机的元件的框图;以及
图3是根据本发明的实施例示意性示出用于配置主机管理服务的方法的梯形图。
实施例的详细描述
标准化的BMC设备和管理协议(诸如,以上提到的IPMI)被设计以通过以太网网络操作。因此,当在不同的网络环境(诸如,InfiniBand网络)中的服务器需要这些设备和协议可以提供的各种管理服务的时候,系统运营商面临困境:或者开发并且建立为非以太网网络环境定制的非标准的管理解决方案,或者部署与用于在服务器中间交换数据的非以太网网络并存的用于管理目的的以太网网络。这两种选项成本高并且复杂。
本文描述的本发明的实施例提供了可选的解决方案,其利用了标准的基于以太网的管理控制器和协议,同时通过非以太网网络传递管理通信量。更一般地,这些实施例可以通过根据第二不同的数据链路协议(例如,诸如InfiniBand或光纤通道)操作的另一第二网络而应用在承载管理流量中,其通过根据(其可以是以太网协议或者任何其他适合的协议的)第一数据链路协议操作的第一网络来发送。然而,出于简单和清楚的目的,以下描述的实施例具体涉及通过InfiniBand网络传递基于以太网的管理流量。
公开的实施例在第一网络和第二网络之间使用网桥(或者用于负载共享和冗余的目的的多个网桥)。网桥包括连接于第一网络并且从第一网络上的管理服务器接收管理封包的第一网络接口控制器(NIC)、以及连接于第二网络的第二NIC。可以在网桥内以硬件和/或软件实施的桥接逻辑将来自第一网络的管理封包封装在遵守第二数据链路协议的数据封包中,并且经由第二NIC向第二网络上的主机计算机发送数据封包。桥接逻辑类似地从由主机计算机通过第二网络发送的数据封包中解封装管理响应封包,用于通过第一网络发送到管理服务器。因此,网桥对于在第二网络上的主机计算机而充当在第一网络上的代理。类似地,相同的网桥对于在第一网络上的(多个)管理服务器而充当在第二网络上的代理。
为了处理封装后的管理封包,在每个受管理的主机计算机中安装的NIC均包括识别封装管理封包的输入数据封包的封包处理逻辑。这个逻辑解封装管理封包并且经由边带连接将管理封包传送到主机计算机中的管理控制器。这个相同的NIC包括主机接口,该主机接口与边带连接分离,并且用于去向和来自主机计算机的CPU和系统存储器的应用数据的交换以及其他进程到进程的通信。因此,除了通过第二网络在数据封包中向网桥传递的以及从网桥传递的封装后的管理流量之外,这个NIC还发送并且接收在系统存储器和第二网络上的其他主机计算机之间传递数据的封包。在NIC和管理控制器之间的边带连接与主机接口分离并且独立于主机接口,并且使管理控制器即使在主机计算机的CPU和其他部件不工作的时候也能够与管理服务器进行通信。
图1是根据本发明的实施例示意性示出计算机系统20的框图。系统20包括管理服务器22,管理服务器22在以太网域24中操作并且管理在InfiniBand域28中部署的多个服务器26。服务器26是主机计算机,服务器26中的每个均包括主机复合体30,并且通过主机通道适配器(HCA)34(其是用于表示在InfiniBand环境中的NIC的术语)连接于InfiniBand网络。服务器26还包括通过边带通道连接于HCA 34的BMC 36。如下文进一步描述地,管理服务器22经由这个边带通道与BMC 36进行通信,以便独立于主机CPU地(有可能包括将主机复合体30从休眠状态唤醒)在服务器26上执行管理功能。
管理服务器22通过将管理封包通过以太网网络38发送到网桥40(其在域24和域28之间进行桥接)来与BMC 36进行通信。管理封包从管理服务器22被发送到服务器26且在形式上遵守以太网协议,并且具有带有对应于对应的服务器26的BMC的目的地址的头部。类似地,从服务器26的BMC 36发送到管理服务器22的管理封包在形式上遵守以太网协议,并且具有带有对应于管理服务器22的目的地址的头部。网桥40在网络38上将自身呈现为用于根据以太网桥接协议向这些目的地址转发的路径(然而事实上,网桥终止并且封装以太网封包,并且随后转发封装后的封包,而非照原来的样子转发实际的以太网封包)。管理封包的内容根据可应用的管理标准(诸如,例如以上提到的IPMI或者由Distributed ManagementTask Force公司(DMTF)发布的Redfish API)来确定。如此前提到的,系统20可以包括多个平行网桥40,以在与服务器26的通信中促进高有效性和高带宽。在这种情况下,每个网桥40均将充当对于某组服务器26的转发路径,并且均将从管理服务器接收指向在服务器组中的服务器26的管理封包。换句话说,任何一个网桥对于网络32上的多个服务器26充当在网络38上的代理。
每个网桥40均包括连接于以太网网络38并且根据以太网数据链路协议操作的至少一个NIC 42、以及连接于InfiniBand网络32并且根据InfiniBand数据链路协议(以及更高层的协议)操作的至少一个HCA 44。NIC 42在网络38上将自身呈现为如以上解释的用于将管理封包转发到目的地址的以太网网桥的端口。为了在网络32上发送并接收封装后的管理封包,HCA 44打开用于与服务器26的HCA 34进行通信的一个或多个队列对(queue pair,QP)。这些QP通常专用于该管理流量,使得HCA 34能够基于数据封包的QP号码而一旦接收到就立即将对应的数据封包识别为包含管理封包,并且因此可以解封装并且将管理封包经由边带通道直接传送到BMC 36。HCA 34和44依靠在网络32上的子网管理器/子网管理功能(SM/SA)48的辅助而独立于在主机复合体30中的主机CPU地自动建立这些管理QP。参考图3,在下文中进一步描述这个通信建立程序。
在网桥40内,桥接逻辑46连接在NIC 42和HCA 44之间,并且负责将经由NIC 42从服务器22接收的以太网管理封包封装成InfiniBand数据封包,并且将这些InfiniBand数据封包经由HCA 44和网络32发送到适当的服务器26的HCA 34。在相反的方向上,服务器26中的HCA 34把由BMC 32生成的管理封包封装在InfiniBand封包中,并且将其发送到网桥40的HCA 44。随后,桥接逻辑46解封装这些封包,并且将管理封包经由NIC 42发送到管理服务器22。桥接逻辑46通常包括主机处理器,该主机处理器可以以软件的方式被编程以执行本文描述的封包处理和通信功能。可选地或者另外地,桥接逻辑46的功能中的至少一些功能可以在专用的或者可编程的硬件逻辑中实施。进一步可选地或者另外地,网桥40可以包括可以在桥接逻辑46中实施的管理服务器22的嵌入式功能。
在本发明的实施例中,封装的InfiniBand数据封包具有下列形式:
Figure BDA0001225065130000061
四个头部字段(LRH、GRH、BTH和DETH)是标准InfiniBand头部,封包的CRC包尾也是这样。具体地,LRH和GRH是局部路由头部和全局路由头部,而BTH和DETH是基本传输头部和数据报扩展传输头部,并且CRC代表一个或多个循环冗余检查字段。BTH指定QP号码以及传输类型,例如,使用不可靠数据报(UD)封包的InfiniBandSEND传输。(通信的可靠性在管理服务器22和BMC 36之间的管理协议级别处理。)可选地,根据系统需求和网络需求,其他合适的封包格式和传输类型可以用于封装的封包。
在以上的图中通过复纵线划分开的数据封包的有效负荷包含原始以太网管理封包以及可选的主机管理头部(HMH)。HMH的值可以通过HCA34和44编写和解析,以指示消息类型(包括对于封装后的管理封包的默认类型)。可以针对状态报告和其他与管理相关的通信而定义其他类型的消息,但是这些指定的协议特征超出了本公开的范围。如以上显示的,管理封包自身包括以太网头部(Eth HDR)和管理指令,它们在封装封包内被实质上不改变的情况下传递。管理服务器22和BMC 36因此能够使用在HCA 34和44之间建立的通信隧道相互进行通信,仿佛管理服务器22和BMC 36都连接于相同以太网。
图2是根据本发明的实施例示意性显示服务器26的细节的框图。HCA34包括连接于InfiniBand网络32的网络接口50、以及经由外围部件总线56(诸如,PCI
Figure BDA0001225065130000071
总线)连接于主机复合体30的主机接口54。主机复合体包括中央处理单元(CPU)58和系统存储器60以及本领域已知的其他部件。在HCA 34中的封包处理逻辑52通常接收并且处理来自在网络32上的其他服务器26的多个QP上的输入封包,并且将封包的有效负荷传送到存储器60,以用于通过运行在CPU 58上的进程进行处理,并且类似地生成封包并且将封包发送到网络32上的其他服务器。这些封包处理和通信功能的细节在本领域中是已知的,并且超出了本公开的范围。
另外,如以上解释的,封包处理逻辑52建立被指定用于向网桥40发送封装后的管理封包以及从网桥40接收封装后的管理封包的至少一个QP。封包处理逻辑52在这个指定的QP上将从网络32接收的数据封包识别为封装管理封包的封包,并且将这些封包传送到封装/解封装逻辑68。(封包处理逻辑52和封装/解封装逻辑68在本文中共同被称作“封装处理电路。”)解封装逻辑解封装并且经由边带连接70将管理封包传送到BMC 36。逻辑68类似地经由边带连接70从BMC 36接收管理响应封包,并且将管理响应封包封装在InfiniBand数据封包中。封包处理逻辑52通过适当的管理QP将这些封包经由网络接口50和网络32发送到网桥40,以用于解封装并且递送到网络38。封装/解封装逻辑68通常包括用于基本封包处理目的的专用的或者可编程的逻辑电路,并且可以额外包括以软件或者固件的形式被编程以执行其他管理功能的嵌入式处理器。另外,逻辑68可以包括检测逻辑以用于检测封装后的“魔术封包”以实现对在管理QP上承载的网络唤醒(WOL)封包的检测。
服务器26还包括供给主电源轨64以向(包括CPU 58和系统存储器60的)主机复合体30供应操作电力的电源62、以及即使在主机复合体掉电的时候也向服务器26的其他元件供应辅助电力的辅助电源轨66。辅助电源轨66除此之外还向BMC 36和HCA 34供应电力。因此,即使在CPU58掉电(例如处于休眠状态)的时候,HCA 34也能够接收、解封装以及经由边带70将管理封包传送到BMC 36。BMC 36通过管理总线72连接于主机复合体30,并且因此在由通过网络32在管理封包中传递的指令指示而唤醒服务器26的时候,能够唤醒服务器26。系统20因此可以通过InfiniBand架构提供“网络唤醒”功能。
图3是根据本发明的实施例示意性示出用于配置主机管理服务的方法的梯形图。这个方法使得网桥40中的HCA 44能够在指定的QP上建立独立于服务器中的CPU 58的、与服务器26中的HCA 34的管理通信。该方法是依靠负责在网络内分配地址以及分发转发信息的SM/SA 48(并且具体地是作为InfiniBand架构的标准逻辑元件的子网管理(SA)部件)的辅助而执行的。SM/SA 48通常是以在服务器26之上的软件的形式或者是以在网络32中的专用处理节点上的软件的形式运行的。
网桥40通过经由HCA 44将其支持由服务器22提供的主机管理(HM)服务的可用性的通告80发送到SM/SA 48来启动图3的方法。该通告通常包括HCA 44的地址(表示为全局标识符(GID,其是根据InfiniBand协议的层3的地址))、分区秘钥(PKEY)以及HM服务的服务参数(诸如服务名称和服务ID)。SM/SA 48响应于该通告创建服务的记录。
当BMC 36随后提示在给定的服务器26中的HCA 34连接于HM服务的时候,HCA 34向SM/SA 48提交查询82,以提供服务的地址。SM/SA 48查阅其服务记录并且据此返回包含HCA44的GID的响应84。为了建立与这个GID的通信,HCA 34向SM/SA 48提交路径查询86,SM/SA48以(包括目的局部标识符(DLID,其是层2的目的地址)和PKEY的)所需要的路径参数88进行响应。
HCA 34现在可以在向HCA 44提交QP请求90中使用路径参数88,指定所请求的服务和PKEY。一旦接收到这个请求,在网桥40中的HCA 44向SM/SA 48提交其自己的路径查询92,并且反过来接收与服务器26的HCA 34进行通信所需要的路径参数94,包括对应于服务器26的GID的DLID和PEKY。使用这些参数,网桥HCA 44现在向服务器HCA 34返回QP响应96,包括向主机管理服务分配的QP号码和秘钥(QKEY)。在这时,服务器HCA 34和网桥HCA 44具有充足的信息来在指定的QP上交换数据封包,并且可以将这些数据封包用于封装在服务器22和BMC 36之间交换的管理封包。通常而非必需地,不可靠数据报(UD)被用于这个目的。
虽然以上的描述涉及可以在管理服务器和管理控制器之间传递隧穿以太网管理流量中使用的、InfiniBand网络的具体特征,但是在(基于以太网协议和其他数据链路协议的)隧穿管理流量中,通过根据其他协议操作的网络中,可以类似地作出必要修正地应用本发明的原理。因此,应认识到以上描述的实施例是通过示例引用的,并且本发明并不限于上文已具体显示和描述的内容。相反,本发明的范围包括上文所描述的各种特征的组合和子组合以及本领域技术人员在阅读以上描述之后将想到的且未在现有技术中公开的其变型和修改。

Claims (22)

1.一种用于管理主机计算机的系统,所述主机计算机包括中央处理单元(CPU)、系统存储器以及被配置成独立于所述CPU来执行在遵守第一数据链路协议的管理封包中包含的主机管理指令的管理控制器,所述系统包括:
网桥,包括:
第一网络接口控制器(NIC),其被配置成接收来自根据所述第一数据链路协议操作的第一网络的所述管理封包;
第二NIC,其被配置用于连接于根据不同于所述第一数据链路协议的第二数据链路协议操作的第二网络;以及
桥接逻辑,其被配置成将所述管理封包,包括头部和所述管理封包中包含的所述主机管理指令,封装在遵守所述第二数据链路协议的数据封包中,并且将所述数据封包经由所述第二NIC发送到所述第二网络,其中所述管理封包遵守所述第一数据链路协议;以及
第三NIC,其被配置用于安装在所述主机计算机中,并且包括:
网络接口,其被配置成接收来自所述第二网络的所述数据封包;以及
封包处理电路,其被配置成识别封装所述管理封包的所述数据封包,并且解封装所述管理封包并且将所述管理封包经由边带连接传送到所述管理控制器。
2.根据权利要求1所述的系统,其中,所述第三NIC包括与所述边带连接分离的并且耦合于所述CPU和系统存储器的主机接口,并且其中,所述第三NIC可操作用于经由所述网络接口发送和接收在所述系统存储器与所述第二网络上的其他主机计算机之间传递数据的另外的封包。
3.根据权利要求2所述的系统,其中,所述第三NIC被配置成在所述主机计算机和所述第二网络上的所述其他主机计算机之间建立的多个队列对(QP)上发送和接收所述另外的封包,同时在被指定用于在所述网桥和所述第三NIC之间传递所述管理封包的另一个QP上接收来自所述网桥的所述数据封包。
4.根据权利要求3所述的系统,其中,所述第三NIC可操作用于独立于所述CPU地在所指定的QP上建立与所述第二NIC的通信。
5.根据权利要求1所述的系统,其中,所述主机计算机包括向所述CPU和系统存储器供应主要电力的主电源轨,以及向所述管理控制器供应辅助电力的辅助电源轨,并且其中,所述第三NIC被连接以从所述辅助电源轨接收所述辅助电力,以便即使在所述CPU掉电的时候,也解封装所述管理封包并且将所述管理封包经由所述边带连接传送到所述管理控制器。
6.根据权利要求5所述的系统,其中,当所述CPU掉电时,所述第三NIC可操作用于响应于经由所述网桥发送到所述第三NIC的指令来唤醒所述CPU。
7.根据权利要求1所述的系统,其中,所述封包处理电路被配置成经由所述边带连接接收来自所述管理控制器的另外的管理封包,以封装所述另外的管理封包,并且将封装后的另外的管理封包经由所述网络接口通过所述第二网络发送到所述第二NIC,以用于由所述桥接逻辑解封装并且递送到所述第一网络。
8.根据权利要求1所述的系统,其中,所述桥接逻辑被配置成将封装所述管理封包的所述数据封包发送到在所述第二网络上的多个主机计算机,同时对于所述多个主机计算机充当在所述第一网络上的代理。
9.根据权利要求1所述的系统,其中,所述第一数据链路协议是以太网协议,而所述第二数据链路协议是InfiniBand协议。
10.根据权利要求9所述的系统,其中,所述管理控制器包括基板管理控制器(BMC),并且所述管理封包根据智能平台管理接口(IPMI)被发送到所述BMC。
11.根据权利要求9所述的系统,其中,封装所述管理封包的所述数据封包根据所述InfiniBand协议作为不可靠数据报封包在所述第二网络上被发送。
12.一种用于管理主机计算机的方法,所述主机计算机包括中央处理单元(CPU)、系统存储器以及被配置成独立于CPU来执行在遵守第一数据链路协议的管理封包中包含的主机管理指令的管理控制器,所述方法包括:
接收来自根据所述第一数据链路协议操作的第一网络的所述管理封包;
将所述管理封包,包括头部和所述管理封包中包含的所述主机管理指令,封装在遵守不同于所述第一数据链路协议的第二数据链路协议的数据封包中,其中所述管理封包遵守所述第一数据链路协议;
将所述数据封包发送到根据所述第二数据链路协议操作的第二网络;
在安装在所述主机计算机中并且连接于所述第二网络的网络接口控制器(NIC)中接收来自所述第二网络的所发送的数据封包;
在所述NIC中,从所接收到的数据封包解封装所述管理封包;并且
将解封装的管理封包从所述NIC经由边带连接传送到所述管理控制器。
13.根据权利要求12所述的方法,其中,所述NIC包括与所述边带连接分离的并且耦合于所述CPU和系统存储器的主机接口,并且其中,所述方法包括通过所述NIC发送和接收在所述系统存储器与所述第二网络上的其他主机计算机之间传递数据的另外的封包。
14.根据权利要求13所述的方法,其中,所述另外的封包在所述主机计算机和所述第二网络上的所述其他主机计算机之间建立的多个队列对(QP)上被发送和接收,并且其中,封装所述管理封包的所述数据封包通过所述NIC在被指定用于传递所述管理封包的另一个QP上被接收。
15.根据权利要求14所述的方法,其中,接收所述发送的数据封包包括独立于所述CPU在所述指定的QP上通过所述NIC建立通信。
16.根据权利要求12所述的方法,其中,所述主机计算机包括向所述CPU和系统存储器供应主要电力的主电源轨,以及向所述管理控制器供应辅助电力的辅助电源轨,并且其中,所述方法包括连接所述NIC,以从辅助电源轨接收所述辅助电力,以便即使在所述CPU掉电的时候,也解封装所述管理封包并且将所述管理封包经由所述边带连接传送到所述管理控制器。
17.根据权利要求16所述的方法,其中,所述方法包括:当所述CPU掉电时,响应于通过所述第二网络发送到所述NIC的指令,通过所述NIC唤醒所述CPU。
18.根据权利要求12所述的方法,还包括经由所述边带连接在所述NIC中接收来自所述管理控制器的另外的管理封包、在所述NIC中封装所述另外的管理封包、以及通过所述第二网络发送封装后的另外的管理封包,以用于解封装并且递送到所述第一网络。
19.根据权利要求12所述的方法,其中,发送所述数据封包包括将封装后的管理封包发送到在所述第二网络上的多个主机计算机,同时对于所述多个主机计算机充当在所述第一网络上的代理。
20.根据权利要求12所述的方法,其中,所述第一数据链路协议是以太网协议,而所述第二数据链路协议是InfiniBand协议。
21.根据权利要求20所述的方法,其中,所述管理控制器包括基板管理控制器(BMC),并且所述管理封包根据智能平台管理接口(IPMI)被发送到所述BMC。
22.根据权利要求20所述的方法,其中,封装所述管理封包的所述数据封包根据所述InfiniBand协议作为不可靠数据报封包在所述第二网络上被发送。
CN201710078783.9A 2016-02-24 2017-02-14 通过网络的远程主机管理 Active CN107124393B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US15/051,750 2016-02-24
US15/051,750 US10146721B2 (en) 2016-02-24 2016-02-24 Remote host management over a network

Publications (2)

Publication Number Publication Date
CN107124393A CN107124393A (zh) 2017-09-01
CN107124393B true CN107124393B (zh) 2020-08-25

Family

ID=59631082

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710078783.9A Active CN107124393B (zh) 2016-02-24 2017-02-14 通过网络的远程主机管理

Country Status (2)

Country Link
US (1) US10146721B2 (zh)
CN (1) CN107124393B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10331598B2 (en) 2017-02-22 2019-06-25 Mellanox Technologies, Ltd. Adding a network port to a network interface card
US11928042B2 (en) * 2020-03-24 2024-03-12 Intel Corporation Initialization and power fail isolation of a memory module in a system
CN113810210B (zh) * 2020-06-15 2024-05-03 戴尔产品有限公司 在redfish上的ipmi
CN112003827B (zh) * 2020-07-27 2022-07-08 山东英信计算机技术有限公司 一种基于并行计算的可配置的Redfish服务解析方法及系统
US11750418B2 (en) * 2020-09-07 2023-09-05 Mellanox Technologies, Ltd. Cross network bridging

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2313931B (en) 1996-06-06 2000-09-06 Adrian Richard White Methods and apparatus for diagnosing and correcting faults in computers
US20040213220A1 (en) 2000-12-28 2004-10-28 Davis Arlin R. Method and device for LAN emulation over infiniband fabrics
US20020162026A1 (en) 2001-02-06 2002-10-31 Michael Neuman Apparatus and method for providing secure network communication
JP4460195B2 (ja) * 2001-08-06 2010-05-12 株式会社日立製作所 パケット転送装置およびルーティング制御装置
US6983303B2 (en) * 2002-01-31 2006-01-03 Hewlett-Packard Development Company, Lp. Storage aggregator for enhancing virtualization in data storage networks
US7245627B2 (en) * 2002-04-23 2007-07-17 Mellanox Technologies Ltd. Sharing a network interface card among multiple hosts
US20080005222A1 (en) * 2006-06-07 2008-01-03 Lambert Timothy M System and Method for Server Information Handling System Management Through Local I/O Devices
US7669000B2 (en) * 2007-10-23 2010-02-23 Brocade Communication Systems, Inc. Host bus adapter with multiple hosts
US8321616B2 (en) 2009-08-12 2012-11-27 Dell Products L.P. System and method for enabling interchangeable dedicated management network interface card access via fabric controller
US20110292807A1 (en) * 2010-05-27 2011-12-01 Hemal Shah Method and system for sideband communication architecture for supporting manageability over wireless lan (wlan)
AU2011265444B2 (en) * 2011-06-15 2015-12-10 Tata Consultancy Services Limited Low latency FIFO messaging system
US8705545B2 (en) * 2011-08-18 2014-04-22 Oracle International Corporation N-way routing packets across an intermediate network
US9712337B2 (en) * 2013-03-06 2017-07-18 Intel Corporation Employing power over ethernet for auxiliary power in computer systems
US9998359B2 (en) 2013-12-18 2018-06-12 Mellanox Technologies, Ltd. Simultaneous operation of remote management and link aggregation
US10148746B2 (en) 2014-01-28 2018-12-04 Mellanox Technologies, Ltd. Multi-host network interface controller with host management
US9729440B2 (en) 2015-02-22 2017-08-08 Mellanox Technologies, Ltd. Differentiating among multiple management control instances using IP addresses
US9985820B2 (en) 2015-02-22 2018-05-29 Mellanox Technologies, Ltd. Differentiating among multiple management control instances using addresses
CN106227636A (zh) 2016-07-20 2016-12-14 国网安徽省电力公司信息通信分公司 一种基于ipmi的数据中心带外管理系统

Also Published As

Publication number Publication date
US10146721B2 (en) 2018-12-04
US20170242819A1 (en) 2017-08-24
CN107124393A (zh) 2017-09-01

Similar Documents

Publication Publication Date Title
CN107124393B (zh) 通过网络的远程主机管理
US8908704B2 (en) Switch with dual-function management port
EP2385660B1 (en) Method and system for offloading tunnel packet processing in cloud computing
US7961737B2 (en) Ethernet/TMPLS hybrid network operation administration and maintenance frame creation method
US9760517B2 (en) Network-USB (NUSB) communication system by which network applications communicate with USB devices over power-over-ethernet (PoE) connection
US20050286510A1 (en) Packet transfer apparatus
US9703747B2 (en) Remote console access of port extenders using protocol extension
CN104993979A (zh) 网络连接监测方法、终端设备及通信系统
CN104144124A (zh) 数据转发方法、装置及系统
US7170892B2 (en) Network element, and associated method, for facilitating communication of data between elemental devices
CN106506306B (zh) 一种数据报文传输的方法和装置
CN101309169A (zh) 一种网络管理方法及网络管理系统、网络设备
CN108306755B (zh) 一种建立管理通道的方法及系统
US11817970B2 (en) Method, device, and system for determining generic routing encapsulation GRE tunnel identifier
CN111917621B (zh) 通信设备的网管服务器与网元的通信方法及系统
WO2019134637A1 (zh) 多类型的层叠虚拟网络互连的方法、装置及系统
CN113709015A (zh) 数据传输方法、电子设备及存储介质
US20230130016A1 (en) Methods and devices for automatically reestablishing media access control security sessions over wide area networks
US9191281B2 (en) Systems and methods for configuring a demarcation device
US11985217B2 (en) Network interface apparatus
WO2023116289A1 (zh) 用户报文转发的方法、网元、电子设备和存储介质
US20230018346A1 (en) Dial-up packet processing method, network element, system, and network device
CN116318336A (zh) 一种卫星终端网管数据的传输方法和系统
JP2013197627A (ja) データ処理装置、データ送受信装置、及びデータ送受信制御方法
CN106790227A (zh) 一种在ip通信网络中采用服务+代理模式构建网络管控总线的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant