CN117648276A - 带外管理系统及方法 - Google Patents

带外管理系统及方法 Download PDF

Info

Publication number
CN117648276A
CN117648276A CN202311403910.XA CN202311403910A CN117648276A CN 117648276 A CN117648276 A CN 117648276A CN 202311403910 A CN202311403910 A CN 202311403910A CN 117648276 A CN117648276 A CN 117648276A
Authority
CN
China
Prior art keywords
access control
media access
equipment
control address
address value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311403910.XA
Other languages
English (en)
Inventor
于泉泉
付水论
王焕超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Metabrain Intelligent Technology Co Ltd
Original Assignee
Suzhou Metabrain Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Metabrain Intelligent Technology Co Ltd filed Critical Suzhou Metabrain Intelligent Technology Co Ltd
Priority to CN202311403910.XA priority Critical patent/CN117648276A/zh
Publication of CN117648276A publication Critical patent/CN117648276A/zh
Pending legal-status Critical Current

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明提供一种带外管理系统及方法,该系统包括主板管理控制器、网络接口卡、中央处理器、至少一个扩展组件;主板管理控制器通过中央处理器获取各扩展组件中各设备的媒体访问控制地址值,根据各设备的媒体访问控制地址值、各设备对应的带外管理指令和主板管理控制器的媒体访问控制地址值生成第一以太网帧,将第一以太网帧发送至网络接口卡;网络接口卡根据第一以太网帧在多个设备中确定待管理设备和待管理设备对应的目标带外管理指令,将目标带外管理指令路由至待管理设备,通过以太网在主板管理控制器、网络接口卡和扩展组件之间建立多主多从的互联关系以传递带外管理指令,实现实时高效地进行计算机设备的带外管理,提高带外管理的可靠性。

Description

带外管理系统及方法
技术领域
本发明涉及计算机技术领域,尤其涉及一种带外管理系统及方法。
背景技术
近年来,伴随着互联网技术的快速发展,云服务和云计算蓬勃兴起,计算机设备作为支撑当前互联网各种应用的关键设备也越来越重要。同时,计算机设备的计算能力和存储密度都出现了爆发式增长。SAS Expander(Serial Attached Small Computer SystemInterface Expander,串行连接小型计算机系统接口扩展器)是基于SAS(Serial AttachedSmall Computer System Interface,串行连接小型计算机系统接口)协议的一种输出扩展器,上行搭配HBA(Host Bus Adapter,主机总线适配器)卡使用,且往往下行的PHY(Physical Layer,物理层)接口数量要大于上行的PHY口数量。通过这种方式实现更多的硬盘接入。
通常,计算机设备的CPU(Central Processing Unit,中央处理器)通过PCIe(Peripheral Component Interconnect Express,高速串行计算机扩展)总线与HBA卡互联;HBA卡的下行总线采用SAS总线与SAS Expander互联;SAS Expander下行总线采用SAS总线可以与硬盘互联,也可以与下一级的SAS Expander互联。
上述这种一级推一级的拓扑结构完全依赖于上级的节点设备的功能特性进行下级的节点设备的带外管理,当上级的节点设备不支持下级的节点设备的管理功能的情况下,则无法在上下级之间进行管理数据透传,进而严重影响计算机设备的带外管理性能。
发明内容
本发明提供一种带外管理系统及方法,用以解决现有技术中在上级的节点设备不支持下级的节点设备的管理功能时无法在上下级之间进行管理数据透传,影响计算机设备的带外管理性能的缺陷,实现实时高效地进行计算机设备的带外管理,提高带外管理的可靠性。
本发明提供一种带外管理系统,包括:主板管理控制器、网络接口卡、中央处理器、至少一个扩展组件;
所述主板管理控制器,通过串行计算机扩展总线与所述中央处理器连接,且通过以太网与所述网络接口卡连接;所述网络接口卡,通过以太网分别与各所述扩展组件中的各设备连接;
所述主板管理控制器,用于通过所述中央处理器获取各所述扩展组件中各设备的媒体访问控制地址值,根据各所述设备的媒体访问控制地址值、各所述设备对应的带外管理指令,以及所述主板管理控制器的媒体访问控制地址值,生成第一以太网帧,并将所述第一以太网帧发送至所述网络接口卡;
所述网络接口卡,用于根据所述第一以太网帧,在多个所述设备中确定待管理设备,以及所述待管理设备对应的目标带外管理指令,并将所述目标带外管理指令路由至所述待管理设备。
根据本发明提供的一种带外管理系统,每一所述扩展组件的多个设备包括主机总线适配器卡和至少一级扩展器;
对于每一所述扩展组件,所述主机总线适配器卡通过串行连接接口与第一级扩展器连接,各级所述扩展器之间通过串行连接接口级联连接;
所述网络接口卡包括与各所述主机总线适配器卡一一对应的以太网连接单元,以及与各级所述扩展器一一对应的以太网连接单元;
所述网络接口卡,通过与各所述主机总线适配器卡对应的以太网连接单元,与各所述主机总线适配器卡连接,并且通过与各级所述扩展器对应的以太网连接单元与各级所述扩展器连接;
所述网络接口卡,还用于:
根据所述第一以太网帧,在多个所述主机总线适配器卡和多级所述扩展器中确定所述待管理设备,以及所述待管理设备对应的目标带外管理指令;
基于所述待管理设备对应的以太网连接单元,将所述目标带外管理指令路由至所述待管理设备。
根据本发明提供的一种带外管理系统,所述网络接口卡,还用于:
通过与所述待管理设备对应的以太网连接单元,接收所述待管理设备根据所述目标带外管理指令反馈的第二以太网帧;
从所述第二以太网帧中解析出目的媒体访问控制地址值;
将所述目的媒体访问控制地址值与所述主板管理控制器的媒体访问控制地址值进行匹配;
在根据匹配结果,确定所述目的媒体访问控制地址值与所述主板管理控制器的媒体访问控制地址值匹配的情况下,将所述第二以太网帧反馈至所述主板管理控制器。
根据本发明提供的一种带外管理系统,所述主板管理控制器,还用于:
从所述第二以太网帧中解析出源媒体访问控制地址值以及所述待管理设备的设备信息;
根据所述源媒体访问控制地址值,确定所述待管理设备的拓扑信息;
根据所述设备信息,确定所述待管理设备的设备状态;
在所述待管理设备发生异常的情况下,根据所述拓扑信息和所述设备状态,生成告警信息。
根据本发明提供的一种带外管理系统,所述网络接口卡,还用于:
从所述第一以太网帧中解析出各所述设备的媒体访问控制地址值;
将各所述设备的媒体访问控制地址值与设备连接列表中的各媒体访问控制地址值进行匹配;其中,所述设备连接列表中的各媒体访问控制地址值为与所述网络接口卡成功建立以太网连接的设备的媒体访问控制地址值;
根据匹配结果,在所述至少一个扩展组件中所有设备的媒体访问控制地址值中,确定与所述设备连接列表中的各媒体访问控制地址值匹配的目标媒体访问控制地址值;
在所述至少一个扩展组件的所有设备中,确定所述目标媒体访问控制地址值所属的目标设备;
将所述目标设备作为所述待管理设备。
根据本发明提供的一种带外管理系统,所述主板管理控制器,还用于:
在监测到任一扩展组件所属的计算机设备上电的情况下,通过所述中央处理器获取任一扩展组件中各设备的媒体访问控制地址值。
根据本发明提供的一种带外管理系统,所述网络接口卡通过串行计算机扩展总线与所述中央处理器连接;
所述网络接口卡,还用于:
将各所述扩展组件中各设备的设备信息传输至所述中央处理器;
和/或,在接收到所述中央处理器发送的处理指令的情况下,根据所述处理指令,在所述至少一个扩展组件的所有设备中确定待处理设备,并将处理指令传输至所述待处理设备。
根据本发明提供的一种带外管理系统,对于各所述扩展组件中的设备、所述主板管理控制器以及所述网络接口卡中每一设备的每一以太网连接单元,所述每一以太网连接单元包括以太网接口、以太网物理层芯片和以太网连接器。
本发明还提供一种带外管理方法,包括:
接收第一以太网帧;
根据所述第一以太网帧,在多个所述设备中确定待管理设备,以及确定所述待管理设备对应的目标带外管理指令,并将所述目标带外管理指令通过以太网路由至所述待管理设备;
其中,所述第一以太网帧是由主板管理控制器通过中央处理器获取各扩展组件中各设备的媒体访问控制地址值,并根据各所述设备的媒体访问控制地址值、各所述设备对应的带外管理指令,以及所述主板管理控制器的媒体访问控制地址值生成的。
根据本发明提供的一种带外管理方法,所述根据所述第一以太网帧,在多个所述设备中确定待管理设备,以及确定所述待管理设备对应的目标带外管理指令,包括:
从所述第一以太网帧中解析出各所述设备的媒体访问控制地址值;
将各所述设备的媒体访问控制地址值与设备连接列表中的各媒体访问控制地址值进行匹配;
根据匹配结果,在至少一个扩展组件中所有设备的媒体访问控制地址值中,确定与所述设备连接列表中的各媒体访问控制地址值匹配的目标媒体访问控制地址值;
在所述至少一个扩展组件的所有设备中,确定所述目标媒体访问控制地址值所属的目标设备,将所述目标设备作为所述待管理设备;
从所述第一以太网帧中解析出所述目标设备对应的带外管理指令,作为所述目标带外管理指令。
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述带外管理方法。
本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述带外管理方法。
本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述带外管理方法。
本发明提供的带外管理系统及方法,通过主板管理控制器通过带内连接向中央处理器获取各扩展组件中各设备的媒体访问控制地址值,然后利用生成的第一以太网帧将各设备的媒体访问控制地址值、各设备对应的带外管理指令和主板管理控制器的媒体访问控制地址值发送给网络接口卡;接着网络接口卡根据第一以太网帧在所连接的多个设备中确定待管理设备,并将待管理设备对应的目标带外管理指令路由至待管理设备,通过以太网在主板管理控制器、网络接口卡和至少一个扩展组件之间建立多主多从的互联关系,以针对每一扩展组件中的每一设备一对一地并行传递带外管理指令,实现实时高效地进行计算机设备的带外管理,提高带外管理的可靠性。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是相关技术提供的存储系统的结构示意图;
图2是本发明提供的带外管理系统的结构示意图;
图3是本发明提供的扩展器相互连接的结构示意图;
图4是本发明提供的带外管理系统的主板背板的结构示意图;
图5是本发明提供的网络接口卡背板的结构示意图;
图6是本发明提供的硬盘背板的结构示意图;
图7是本发明提供的主机总线适配器卡背板的结构示意图;
图8是相关技术提供的常用的扩展器背板的结构示意图;
图9为本发明提供的带外管理系统的带外管理步骤的流程示意图;
图10为本发明提供的带外管理方法的流程示意图;
图11是本发明提供的电子设备的结构示意图。
附图标记:
210:主板管理控制器;220:网络接口卡;230:中央处理器;241:主机总线适配器卡;242:扩展器;243:硬盘。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
近年来,伴随着互联网技术的快速发展,云服务和云计算蓬勃兴起,服务器作为支撑当前互联网各种应用的关键设备也越来越重要。同时,服务器的计算能力和存储密度都出现了爆发式增长。
图1是相关技术提供的存储系统的结构示意图。如图1所示,SAS Expander是基于SAS协议的一种输出扩展器,上行搭配HBA卡使用,且往往下行的PHY口数量要大于上行的PHY口数量。通过这种方式实现更多的硬盘接入。此外,SAS Expander还支持下行PHY口再接入一个SAS Expander,实现级联。总之,SAS Expander在服务器设计中应用非常广泛。
由于SAS Expander在存储系统设计的拓扑有时简单,有时也会根据业务场景变得非常复杂。这种树形拓扑减少了可能影响级联拓扑中终端设备的不公平仲裁。在这种拓扑下,服务器的CPU通过PCIe总线与HBA卡互联;HBA卡的下行总线采用SAS总线与SASExpander互联;SAS Expander下行总线采用SAS总线可以与硬盘互联,也可以与下一级的SAS Expander互联。
这种一级推一级的拓扑结构非常依赖于上级的节点设备的功能特性进行下级的节点设备的带外管理。比如HBA卡不支持主设备端获取SAS Expander侧的机箱管理数据的SES(Secure Easy Setup,安全快速连接设备)的管理功能的情况下,则对应的数据在该节点设备就中止了,无法在上下级之间进行管理数据穿透传递,进而严重影响计算机设备的带外管理性能。
针对上述问题,本实施例提出基于ETH(Ethernet,以太网)的服务器带外存储方案设计,通过在HBA卡、SAS Expander、网卡和BMC之间建立以太网,实现多主多从的互联关系,将带外管理数据经以太网在BMC及各个从设备之间一对一地传递。与传统方式相比,具有传输实时性好、效率高、可靠性好、可扩展性好等优点。
下面结合图2-图8描述本发明的带外管理系统。
图2为本申请提供的带外管理系统的结构示意图,如图2所示,本申请实施例提供的一种带外管理系统,该带外管理系统可以包括:主板管理控制器210、网络接口卡220、中央处理器230、至少一个扩展组件;实线部分是主板管理控制器210、网络接口卡220、中央处理器230和至少一个扩展组件之间的带内管理通信链路,具体是通过串行计算机扩展总线或SAS进行通信;虚线部分是主板管理控制器210、网络接口卡220和至少一个扩展组件之间的带外管理通信链路,该通信链路是通过以太网进行通信的。
如图2所示,所述主板管理控制器210,通过串行计算机扩展总线与所述中央处理器230连接,且通过以太网与所述网络接口卡220连接;所述网络接口卡220,通过以太网分别与各所述扩展组件中的各设备连接;
所述主板管理控制器210,用于通过所述中央处理器230获取各所述扩展组件中各设备的媒体访问控制地址值,根据各所述设备的媒体访问控制地址值、各所述设备对应的带外管理指令,以及所述主板管理控制器210的媒体访问控制地址值,生成第一以太网帧,并将所述第一以太网帧发送至所述网络接口卡220;
其中,各扩展组件中的各设备拥有独立的网络MAC(Media Access ControlAddress,媒体访问控制地址值)地址,也即各设备在以太网中有唯一的MAC地址,用于标识和识别设备。当生成以太网帧向各设备发送带外管理指令时,需要使用每个设备的独立MAC地址,确保帧能够正确地发送到目标设备。
主板管理控制器210首先通过带内方式,从中央处理器230获取各扩展组件中各设备的MAC地址,接着确定各设备对应的带外管理指令,然后根据各扩展组件中各设备的MAC地址、各设备对应的带外管理指令,以及主板管理控制器210的媒体访问控制地址值,生成第一以太网帧,并将第一以太网帧通过以太网接口发送给网络接口卡220。
可选地,生成第一以太网帧可以是主板管理控制器210先根据带外管理指令的特定规范确定第一以太网帧的帧类型,然后将各扩展组件中各设备的MAC地址作为目标MAC地址,将主板管理控制器210的媒体访问控制地址值作为源MAC地址,在满足实际场景的通信需求和协议规范条件下,生成第一以太网帧。
其中,第一以太网帧的帧类型可以是IPv4(Internet Protocol version 4,网际协议版本4)、ARP(Address Resolution Protocol,地址解析协议)、IPv6(InternetProtocol version 6,网际协议版本6)等类型,本实施例对此不作具体地限定。
所述网络接口卡220,用于根据所述第一以太网帧,在多个所述设备中确定待管理设备,以及所述待管理设备对应的目标带外管理指令,并将所述目标带外管理指令路由至所述待管理设备。
接收到主板管理控制器210发送的第一以太网帧后,网络接口卡220可以是对第一以太网帧进行解析,根据解析结果在多个设备中确定待管理设备。
如图2所示,在一些实施例中,每一所述扩展组件的多个设备包括主机总线适配器卡241和至少一级扩展器242;
需要说明的是,至少一个扩展组件可以是包括一个或多个属于同一计算机设备的扩展组件,也可以是包括多个属于不同计算机设备的扩展组件,本实施例对此不作具体地限定。也即,可以通过以太网接口连到机箱内的扩展组件中的各设备,或者需要支持机箱外的带外存储管理,可以通过以太网接口连到机箱外扩展组件,通过网络交换机与其他机箱组成更大的以太网拓扑,由此实现对同一计算机设备的扩展组件的管理或者不同计算机设备的扩展组件的管理。
图3为本实施例提供的扩展器242相互连接的的结构示意图。如图3所示,对于每一所述扩展组件,所述主机总线适配器卡241通过串行连接接口与第一级扩展器242连接,各级所述扩展器242之间通过串行连接接口级联连接;
所述网络接口卡220包括与各所述主机总线适配器卡241一一对应的以太网连接单元250,以及与各级所述扩展器242一一对应的以太网连接单元250;
所述网络接口卡220,通过与各所述主机总线适配器卡241对应的以太网连接单元250,与各所述主机总线适配器卡241连接,并且通过与各级所述扩展器242对应的以太网连接单元250与各级所述扩展器242连接;
所述网络接口卡220,还用于:根据所述第一以太网帧,在多个所述主机总线适配器卡241和多级所述扩展器242中确定所述待管理设备,以及所述待管理设备对应的目标带外管理指令;基于所述待管理设备对应的以太网连接单元250,将所述目标带外管理指令路由至所述待管理设备。
接收到第一以太网帧,网络接口卡220根据第一以太网帧解析出各设备的媒体访问控制地址值,接着获取网络接口卡220所连接的多个主机总线适配器卡241的媒体访问控制地址值,以及网络接口卡220所连接的多个多级扩展器242的媒体访问控制地址值,以供网络接口卡220将多个主机总线适配器卡241的MAC地址和多个多级扩展器的MAC地址,与从第一以太网帧解析出的各设备的MAC地址进行匹配,并根据匹配结果,将网络接口卡220所连接的多个主机总线适配器卡241和多级扩展器中与从第一以太网帧解析出的各设备的MAC地址对应的设备,作为待管理设备。
可以理解的是,若匹配结果显示网络接口卡220所连接的多个主机总线适配器卡241和多级扩展器中,不存在待管理设备,也即不存在设备的MAC地址与从第一以太网帧解析出的各设备的MAC地址可以进行匹配,则直接结束此次带外管理,网络接口卡220还可以进行相应的报错。
获取到待管理设备后,网络接口卡220可以是获取待管理设备对应的以太网连接单元,并根据第一以太网帧获取待管理设备对应的目标带外管理指令。
接着,网络接口卡220可以是将待管理设备对应的目标带外管理指令、待管理设备的MAC地址,以及网络接口卡220自身的MAC地址,共同打包成以太网帧,然后基于待管理设备对应的以太网连接单元路由至待管理设备,以供待管理设备根据对应的目标带外管理指令执行相应的指令。
本实施例中,网络接口卡通过先确定待管理设备并提取目标带外管理指令,然后将指令通过合适的路由路径发送给目标设备,实现带外管理和控制,提供了一种灵活的指令路由方式。
本申请实施例提供的带外管理系统,通过主板管理控制器通过带内连接向中央处理器获取各扩展组件中各设备的媒体访问控制地址值,然后利用生成的第一以太网帧将各设备的媒体访问控制地址值、各设备对应的带外管理指令和主板管理控制器的媒体访问控制地址值发送给网络接口卡;接着网络接口卡根据第一以太网帧在所连接的多个设备中确定待管理设备,并将待管理设备对应的目标带外管理指令路由至待管理设备,通过以太网在主板管理控制器、网络接口卡和至少一个扩展组件之间建立多主多从的互联关系,以针对每一扩展组件中的每一设备一对一地并行传递带外管理指令,实现实时高效地进行计算机设备的带外管理,提高带外管理的可靠性。
在一些实施例中,所述网络接口卡,还用于:通过与所述待管理设备对应的以太网连接单元,接收所述待管理设备根据所述目标带外管理指令反馈的第二以太网帧;从所述第二以太网帧中解析出目的媒体访问控制地址值;将所述目的媒体访问控制地址值与所述主板管理控制器的媒体访问控制地址值进行匹配;在根据匹配结果,确定所述目的媒体访问控制地址值与所述主板管理控制器的媒体访问控制地址值匹配的情况下,将所述第二以太网帧反馈至所述主板管理控制器。
在将目标带外管理指令路由至待管理设备,网络接口卡220可以是通过与待管理设备对应的以太网连接单元250,接收待管理设备执行目标带外管理指令后,根据执行状态和执行结果反馈的第二以太网帧,并解析第二以太网帧中,根据解析结果获取第二以太网帧的目的媒体访问控制地址值。
然后可以是将解析出的目的MAC地址值与主板管理控制器210的MAC地址值进行匹配,判断二者是否一致,若匹配结果显示目的MAC地址值与主板管理控制器210的MAC地址值匹配为一致,则可以是直接通过主板管理控制器210对应的以太网连接单元250,将第二以太网帧反馈至主板管理控制器210。
若匹配结果显示目的MAC地址值与主板管理控制器210的MAC地址值不匹配,则网络接口卡220可以是根据实际场景判断是否为待管理设备反馈出错,在判断结果为待管理设备反馈出错的情况下终止反馈并进行报错;也可以是根据目的媒体访问控制地址值将第二以太网帧转发给对应的目标设备,本实施例对此不作具体地限定。
本实施例中通过网络接口卡解析第二以太网帧中的目的媒体访问控制地址值,并经过匹配媒体访问控制地址值适应性地将第二以太网帧反馈至主板管理控制器,实现接收、解析和转发第二以太网帧,以供主板管理控制器获取待管理设备反馈的信息,并进一步进行管理和控制操作。
在一些实施例中,所述主板管理控制器,还用于:从所述第二以太网帧中解析出源媒体访问控制地址值以及所述待管理设备的设备信息;根据所述源媒体访问控制地址值,确定所述待管理设备的拓扑信息;根据所述设备信息,确定所述待管理设备的设备状态;在所述待管理设备发生异常的情况下,根据所述拓扑信息和所述设备状态,生成告警信息。
在接收到网络接口卡220转发的第二以太网帧后,主板管理控制器210可以是对第二以太网帧进行解析,根据解析结果获取待管理设备的设备信息和源媒体访问控制地址值,也即待管理设备的媒体访问控制地址值,并根据源媒体访问控制地址值确定待管理设备的拓扑信息。
具体地,主板管理控制器210确定待管理设备的拓扑信息可以是首先根据源媒体访问控制地址值,查询主板管理控制器210在以太网中预先存储的用于记录各扩展组件中各设备的MAC地址和接口的MAC地址表,找到与待管理设备相连的其他设备;接着根据MAC地址表中记录的相邻设备的MAC地址和接口信息,可以确定待管理设备与其他设备之间的连接关系。根据这些信息,可以构建出整个待管理设备网络的拓扑图,包括待管理设备之间的连接方式、层次关系等拓扑信息。
接着根据待管理设备的设备信息,判断待管理设备的设备状态是否为异常状态并获取判断结果。其中,设备状态可以是包括正常状态和异常状态。
若判断结果显示待管理设备的设备状态是为异常状态,则主板管理控制器210可以是根据拓扑信息和设备状态生成告警信息。
示例性的,主板管理控制器210生成告警信息可以是首先根据拓扑信息确定待管理设备所处的位置和与其相邻的其他设备,然后根据设备拓扑信息判断该异常设备对整个网络的影响范围,包括其它相邻设备和网络中的其他部分;接着根据异常设备的状态和影响范围,确定异常类型和紧急程度,生成告警信息。
若判断结果显示待管理设备的设备状态是为正常状态状态,则主板管理控制器210可以是根据实际场景继续进行带外管理或者结束本次带外管理,本实施例对此不作具体地限定。
本实施例中通过主板管理控制器根据第二以太网帧判断待管理设备的设备状态,并在待管理设备发生异常时进行示警,实现对待管理设备的设备状态的监控,以便在发生异常时及时采取措施进行处理,保障待管理设备和带外管理系统的安全性与可靠性。
在一些实施例中,所述网络接口卡,还用于:从所述第一以太网帧中解析出各所述设备的媒体访问控制地址值;将各所述设备的媒体访问控制地址值与设备连接列表中的各媒体访问控制地址值进行匹配;其中,所述设备连接列表中的各媒体访问控制地址值为与所述网络接口卡成功建立以太网连接的设备的媒体访问控制地址值;根据匹配结果,在所述至少一个扩展组件中所有设备的媒体访问控制地址值中,确定与所述设备连接列表中的各媒体访问控制地址值匹配的目标媒体访问控制地址值;在所述至少一个扩展组件的所有设备中,确定所述目标媒体访问控制地址值所属的目标设备;将所述目标设备作为所述待管理设备。
网络接口卡220对第一以太网帧进行解析,并根据解析结果获取各设备的媒体访问控制地址值;然后将预先根据与网络接口卡成功建立以太网连接的设备的媒体访问控制地址值配置的设备连接列表中的各媒体访问控制地址值,与各设备的媒体访问控制地址值进行匹配,判断至少一个扩展组件中所有设备的媒体访问控制地址值中,是否存在与设备连接列表中的各媒体访问控制地址值匹配的目标媒体访问控制地址值,并获取匹配结果。
若至少一个扩展组件中所有设备的媒体访问控制地址值中,存在至少一个与设备连接列表中的各媒体访问控制地址值匹配的目标媒体访问控制地址值,则根据匹配结果,在至少一个扩展组件中所有设备的媒体访问控制地址值中,确定与设备连接列表中的各媒体访问控制地址值匹配的目标媒体访问控制地址值;接着根据目标媒体访问控制地址值和所属的设备之间一一对应的映射关系,在至少一个扩展组件的所有设备中,确定目标媒体访问控制地址值所属的目标设备,并目标设备作为待管理设备。
若至少一个扩展组件中所有设备的媒体访问控制地址值中,不存在与设备连接列表中的各媒体访问控制地址值匹配的目标媒体访问控制地址值,则网络接口卡220可以是中断当前带外管理,并直接将匹配结果反馈给主板管理控制器210,也可以是适应性地进行报错,本实施例对此不作具体地限定。
本实施例中网络接口卡通过至少一个扩展组件中所有设备的媒体访问控制地址值与设备连接列表中的各媒体访问控制地址值进行匹配,来识别并确定待管理设备,实现快速准确地获取需要路由带外管理指令的待管理设备,以便后续的管理操作。
在一些实施例中,所述主板管理控制器,还用于:在监测到任一扩展组件所属的计算机设备上电的情况下,通过所述中央处理器获取任一扩展组件中各设备的媒体访问控制地址值。
在向至少一个扩展组件中所有设备发送带外管理指令之前,主板管理控制器210可以是通过带内方式实时监控所有与它连接的计算机设备的上电状态,在监测到任一扩展组件所属的计算机设备上电时,通过串行计算机扩展总线从中央处理器获取任一扩展组件中各设备的媒体访问控制地址值,并将获取到的任一扩展组件中各设备的媒体访问控制地址值与所述的设备以一一对应的映射关系进行存储,以便后续使用。
本实施例中通过主板管理控制器在计算机设备上电时,获取扩展组件中各设备的媒体访问控制地址值,以实现至少一个扩展组件中所有设备的管理和监控,提高系统的可靠性和可维护性。
在一些实施例中,所述网络接口卡通过串行计算机扩展总线与所述中央处理器连接;
所述网络接口卡,还用于:将各所述扩展组件中各设备的设备信息传输至所述中央处理器;和/或,在接收到所述中央处理器发送的处理指令的情况下,根据所述处理指令,在所述至少一个扩展组件的所有设备中确定待处理设备,并将处理指令传输至所述待处理设备。
网络接口卡220还可以是通过带内方式传输各扩展组件中各设备的设备信息至中央处理器230,和/或传输中央处理器230带内发送的处理指令以进行设备管理。
其中,各设备的设备信息可以是包括设备的型号、序列号、状态、配置等信息,用于建立设备清单、进行设备识别和管理。
具体地,网络接口卡220传输中央处理器230带内发送的处理指令可以是首先接收中央处理器230带内发送的处理指令,并对处理指令进行解析,获取各设备的媒体访问控制地址值。
接着网络接口卡220获取至少一个扩展组件的所有设备的媒体访问控制地址值,以供网络接口卡220将至少一个扩展组件的所有设备的MAC地址,与从处理指令解析出的各设备的MAC地址进行匹配,并根据匹配结果,将至少一个扩展组件的所有设备中与从处理指令解析出的各设备的MAC地址对应的设备,作为待管理设备。
可以理解的是,若匹配结果至少一个扩展组件的所有设备中,不存在待管理设备,也即不存在设备的MAC地址与从处理指令解析出的各设备的MAC地址可以进行匹配,则直接结束此次带外管理,网络接口卡220还可以进行相应的报错。
获取到待管理设备后,网络接口卡220可以是获取待管理设备对应的以太网连接单元,并将待管理设备对应的处理指令、待管理设备的MAC地址,以及网络接口卡220自身的MAC地址,共同打包成以太网帧,然后基于待管理设备对应的以太网连接单元路由至待管理设备,以供待管理设备根据对应的处理指令执行相应的指令。
本实施例中通过网络接口卡充当了设备信息传输的桥梁和指令传输的通道,将各设备的信息传递给中央处理器,和/或将中央处理器的处理指令传输给待管理设备,实现对设备的集中管理和控制,有助于带外管理系统的运行、故障排查和性能优化
在一些实施例中,对于各所述扩展组件中的设备、所述主板管理控制器以及所述网络接口卡中每一设备的每一以太网连接单元,所述每一以太网连接单元包括以太网接口、以太网物理层芯片和以太网连接器。
各扩展组件中的设备和主板管理控制器210通过以太网PHY(也即以太网物理层芯片)接口连接到以太网连接器,最终通过以太网与网络接口卡220互联。
其中,以太网接口是用于与计算机或网络设备连接的接口,它负责在设备之间传输数据。以太网接口可以是根据实际场景适应性的采用标准化的物理和电气特性,例如本实施例中以太网接口可以是采用RJ-45(Registered Jack-45,通信引出端连接器)接口类型,本实施例对此不作具体地限定。
其中,以太网物理层芯片是指负责物理层信号调制、解调和传输的芯片或电路,负责将数字数据转换为适合在物理介质上传输的模拟信号;以太网连接器是用于物理连接以太网接口的插头和插座,以太网连接器根据实际场景适应性进行选择,示例性的,本实施例中可以是采用RJ45或SFP(Small Form Pluggable,小型可插拔模块)作为每一以太网连接单元的以太网连接器。
图4为本申请提供的带外管理系统的主板背板的结构示意图。如图4所示,主板管理控制器210可以是通过以太网接口接入以太网物理层芯片,以连接以太网连接器实现以太网通信。其中,以太网连接器可以是根据实际场景进行选择的;示例性的,可以是选择帧速率为最小为10Mbps,最大为100Mbps的RJ-45磁盘作为本实施例中主板管理控制器220的以太网连接单元的以太网连接器,本实施例对此不作具体地限定。
图5为本实施例提供的网络接口卡220背板的结构示意图。如图5所示,网络接口卡220可以是通过以太网接口接入以太网物理层芯片,以连接以太网连接器,分别实现与主板管理控制器210、至少一个主机总线适配器卡241和至少一个扩展器242之间的以太网通信。其中,以太网连接器可以是根据实际场景进行选择的;示例性的,可以是选择帧速率为最小为10Mbps,最大为100Mbps的RJ-45磁盘作为本实施例中网络接口卡220的以太网连接单元的以太网连接器,本实施例对此不作具体地限定。
网络接口卡220可以通过扩展器242连接硬盘243,图6为本实施例提供的硬盘背板的结构示意图。如图6所示,硬盘243可以是通过扩展器242运用以太网接口接入以太网物理层芯片,以连接以太网连接器实现以太网通信。其中,以太网连接器可以是根据实际场景进行选择的;示例性的,可以是选择帧速率为最小为10Mbps,最大为100Mbps的RJ-45磁盘作为本实施例中扩展器242的以太网连接单元的以太网连接器,本实施例对此不作具体地限定。
图7为本实施例提供的主机总线适配器卡241背板的结构示意图。如图7所示,主机总线适配器卡241可以是通过以太网接口接入以太网物理层芯片,以连接以太网连接器实现以太网通信。其中,以太网连接器可以是根据实际场景进行选择的;示例性的,可以是选择帧速率为最小为10Mbps,最大为100Mbps的RJ-45磁盘作为本实施例中主机总线适配器卡241的以太网连接单元的以太网连接器,本实施例对此不作具体地限定。
本实施例中通过以太网接口、以太网物理层芯片和以太网连接器三个组成部分协同工作,使得以太网连接单元能够实现各扩展组件中的设备、主板管理控制器以及网络接口卡之间的数据传输和通信。
图8为相关技术提供的常用的SAS Expander的BP(Backplane背板)的结构示意图。如图8所示,在常用的带外管理方案中,服务器BMC(Baseboard Management Controller,主板管理控制器)通过一路SMBUS(System Management Bus,系统管理总线)总线可以访问HBA卡和SAS Expander,其中SMBUS是一种两线制串行总线,实现起来较为简单。服务器BMC作为主设备,其他HBA卡、SAS Expander作为从设备,主设备采用分时访问的办法,每次与一个从设备发起通讯,其他设备等待,以一主多从的模式实现对每个从设备的带外管理。
而实际场景中服务器BMC采用的SMBUS总线存在访问速率慢、可靠性低、传输效率差等问题,带外管理过程中传输频率从100千赫兹到几兆赫兹,当需要传输大量数据时,SMBUS总线往往耗费时间很长。如固件例行升级受限于传输效率太低,实现起来较困难。
且每个从设备的I2C(Inter-Integrated Circuit,同步半双工的通信总线)访问地址需要设置成不一样的,防止造成地址冲突;而且基于I2C两线制的总线特点,主设备一次只能与一个从设备沟通。当主设备通过扫描从设备的I2C地址,从设备会在ACK(Acknowledgement,正向反馈)位应答;主设备发送读/写指令,从而与从设备建立数据交互,每次都在ACK位应答;完成之后从设备反馈NACK(Negative Acknowledgement,负向反馈),并释放总线占用;主设备再与其他从设备交互,导致带外管理过程中存在传输实时性差的问题。
另外,采用的SMBUS的带外管理方案还存在可靠性差、易被从设备干扰导致总线挂死的问题。当从设备异常时,容易导致SMBUS里的SDA(Serial Data,I2C总线的数据信号线)信号被一直拉低,也即SMBUS挂死的情况;如果主设备没法通过总线监控和恢复手段解决,则只能重新上下电。
而且,SMBUS不支持在工作状态下增加或者删除从设备,SMBUS硬件上不支持带电状态下,从设备从SMBUS总线上接入或者拔出;强制操作可能导致总线挂死。如果需要增加或者删除从设备,需要服务器重新上下电,如果有设备异常导致SMBUS挂死了,也需要重新上下电。
采用的SMBUS的带外管理方案中从设备安装距离及数量也有限制要求。从设备通过线缆或者板上互联的长度不能太长,需要控制在近距离范围内;从设备数量也有上限。如果距离和数量超过了上限,则可能导致信号传输异常。
下面对本实施例提供的带外管理系统的带外管理步骤展开描述;图9为本实施例提供的带外管理系统的带外管理步骤的流程示意图。如图9所示,该带外管理步骤在实际操作场景执行过程中具体包括如下步骤:
步骤901,计算机设备(如服务器)上电;
步骤902,主板管理控制器(以下也称BMC)、网络接口卡(以下也称网卡)、主机总线适配器卡(以下也称HBA卡)、扩展器(以下也称SAS Expander)上电,完成各自以太网物理接口初始化;
步骤903,BMC通过带内方式获取各HBA卡、SAS Expander的MAC地址值;
步骤904,BMC通过以太网接口将BMC的MAC地址值、需要实施带外管理,以及设备的MAC地址值和带外管理指令打包生成第一以太网帧,传递给网卡;
步骤905,网卡检查所接入的扩展组件,将设备连接列表中的各MAC地址值和从第一以太网帧中解析出的各设备的MAC地址值进行匹配;
步骤906,网卡判断设备连接列表中的各MAC地址值和从第一以太网帧中解析出的各设备的MAC地址值是否存在MAC地址匹配。如果有匹配,则确定待管理设备,并继续执行步骤907,否则直接跳转到步骤909,结束此次带外管理;
步骤907,确定待管理设备对应的目标带外管理指令,并将目标带外管理指令路由至待管理设备;
步骤908,网络接口卡根据第二以太网帧确定目的媒体访问控制地址值与主板管理控制器的媒体访问控制地址值匹配的情况下,将第二以太网帧反馈至主板管理控制器;
步骤909,完成并结束此次带外管理。
综上,相比于图8所述的相关技术的带外管理方式,本实施例提供的带外管理系统的带外管理方式通过在HBA卡、SAS Expander、网卡和BMC之间建立以太网,实现多主多从的互联关系,将带外管理数据经以太网在BMC及各个从设备之间一对一地传递,具备传输实时性好、效率高、可靠性好、可扩展性好、灵活性高等优势。
需要说明的是,本申请实施例中,上述各个方法附图所示的带外管理系统均是以结合本申请实施例中的一个附图为例示例性的说明的。具体实现时,上述各个方法附图所示的带外管理系统还可以结合上述实施例中示意的其它可以结合的任意附图实现,此处不再赘述。
下面对本发明提供的带外管理方法进行描述,下文描述的带外管理方法与上文描述的带外管理系统可相互对应参照。
图10为本申请提供的带外管理方法的流程示意图之一。如图10所示,该方法包括如下步骤:
步骤1001,接收第一以太网帧;
其中,所述第一以太网帧是由主板管理控制器通过中央处理器获取各扩展组件中各设备的媒体访问控制地址值,并根据各所述设备的媒体访问控制地址值、各所述设备对应的带外管理指令,以及所述主板管理控制器的媒体访问控制地址值生成的。
其中,至少一个扩展组件可以是包括一个或多个属于同一计算机设备的扩展组件,也可以是包括多个属于不同计算机设备的扩展组件,本实施例对此不作具体地限定。
其中,各扩展组件中的各设备拥有独立的网络MAC地址,也即各设备在以太网中有唯一的MAC地址,用于标识和识别设备。当生成以太网帧向各设备发送带外管理指令时,需要使用每个设备的独立MAC地址,确保帧能够正确地发送到目标设备。
主板管理控制器首先通过带内方式,从中央处理器获取各扩展组件中各设备的MAC地址,接着确定各设备对应的带外管理指令,然后根据各扩展组件中各设备的MAC地址、各设备对应的带外管理指令,以及主板管理控制器的媒体访问控制地址值,生成第一以太网帧,并将第一以太网帧通过以太网接口发送给网络接口卡。
可选地,生成第一以太网帧可以是主板管理控制器先根据带外管理指令的特定规范确定第一以太网帧的帧类型,然后将各扩展组件中各设备的MAC地址作为目标MAC地址,将主板管理控制器210的媒体访问控制地址值作为源MAC地址,在满足实际场景的通信需求和协议规范条件下,生成第一以太网帧。
其中,第一以太网帧的帧类型可以是IPv4、ARP、IPv6等类型,本实施例对此不作具体地限定。
步骤1002,根据所述第一以太网帧,在多个所述设备中确定待管理设备,以及确定所述待管理设备对应的目标带外管理指令,并将所述目标带外管理指令通过以太网路由至所述待管理设备;
接收到主板管理控制器210发送的第一以太网帧后,网络接口卡220可以是对第一以太网帧进行解析,根据解析结果在多个设备中确定待管理设备,接着提取目标带外管理指令,然后将指令发送给目标设备,实现带外管理和控制。
在一些实施例中,所述根据所述第一以太网帧,在多个所述设备中确定待管理设备,以及确定所述待管理设备对应的目标带外管理指令,包括:从所述第一以太网帧中解析出各所述设备的媒体访问控制地址值;将各所述设备的媒体访问控制地址值与设备连接列表中的各媒体访问控制地址值进行匹配;根据匹配结果,在至少一个扩展组件中所有设备的媒体访问控制地址值中,确定与所述设备连接列表中的各媒体访问控制地址值匹配的目标媒体访问控制地址值;在所述至少一个扩展组件的所有设备中,确定所述目标媒体访问控制地址值所属的目标设备,将所述目标设备作为所述待管理设备;从所述第一以太网帧中解析出所述目标设备对应的带外管理指令,作为所述目标带外管理指令。
接收到第一以太网帧,网络接口卡根据第一以太网帧解析出各设备的媒体访问控制地址值,接着获取网络接口卡所连接的多个主机总线适配器卡的媒体访问控制地址值,以及网络接口卡所连接的多个多级扩展器的媒体访问控制地址值,以供网络接口卡将多个主机总线适配器卡的MAC地址和多个多级扩展器的MAC地址,与从第一以太网帧解析出的各设备的MAC地址进行匹配,并根据匹配结果,将网络接口卡所连接的多个主机总线适配器卡和多级扩展器中与从第一以太网帧解析出的各设备的MAC地址对应的设备,作为待管理设备。
可以理解的是,若匹配结果子显示网络接口卡所连接的多个主机总线适配器卡和多级扩展器中,不存在待管理设备,也即不存在设备的MAC地址与从第一以太网帧解析出的各设备的MAC地址可以进行匹配,则直接结束此次带外管理,网络接口卡还可以进行相应的报错。
获取到待管理设备后,网络接口卡可以是获取待管理设备对应的以太网连接单元,并根据第一以太网帧获取待管理设备对应的目标带外管理指令。
接着,网络接口卡可以是将待管理设备对应的目标带外管理指令、待管理设备的MAC地址,以及网络接口卡自身的MAC地址,共同打包成以太网帧,然后基于待管理设备对应的以太网连接单元路由至待管理设备,以供待管理设备根据对应的目标带外管理指令执行相应的指令。
本实施例中,网络接口卡通过先确定待管理设备并提取目标带外管理指令,然后将指令通过合适的路由路径发送给目标设备,实现带外管理和控制,提供了一种灵活的指令路由方式。
本实施例通过主板管理控制器通过带内连接向中央处理器获取各扩展组件中各设备的媒体访问控制地址值,然后利用生成的第一以太网帧将各设备的媒体访问控制地址值、各设备对应的带外管理指令和主板管理控制器的媒体访问控制地址值发送给网络接口卡;接着网络接口卡根据第一以太网帧在所连接的多个设备中确定待管理设备,并将待管理设备对应的目标带外管理指令路由至待管理设备,通过以太网在主板管理控制器、网络接口卡和至少一个扩展组件之间建立多主多从的互联关系,以针对每一扩展组件中的每一设备一对一地并行传递带外管理指令,实现实时高效地进行计算机设备的带外管理,提高带外管理的可靠性。
图11示例了一种电子设备的实体结构示意图,如图11所示,该电子设备可以包括:处理器(processor)1101、通信接口(Communications Interface)1102、存储器(memory)1103和通信总线1104,其中,处理器1101,通信接口1102,存储器1103通过通信总线1104完成相互间的通信。处理器1101可以调用存储器1103中的逻辑指令,以执行带外管理方法,该方法包括:接收第一以太网帧;根据所述第一以太网帧,在多个所述设备中确定待管理设备,以及确定所述待管理设备对应的目标带外管理指令,并将所述目标带外管理指令通过以太网路由至所述待管理设备;其中,所述第一以太网帧是由主板管理控制器通过中央处理器获取各扩展组件中各设备的媒体访问控制地址值,并根据各所述设备的媒体访问控制地址值、各所述设备对应的带外管理指令,以及所述主板管理控制器的媒体访问控制地址值生成的。
此外,上述的存储器1103中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,计算机程序可存储在非暂态计算机可读存储介质上,所述计算机程序被处理器执行时,计算机能够执行上述各方法所提供的带外管理方法,该方法包括:接收第一以太网帧;根据所述第一以太网帧,在多个所述设备中确定待管理设备,以及确定所述待管理设备对应的目标带外管理指令,并将所述目标带外管理指令通过以太网路由至所述待管理设备;其中,所述第一以太网帧是由主板管理控制器通过中央处理器获取各扩展组件中各设备的媒体访问控制地址值,并根据各所述设备的媒体访问控制地址值、各所述设备对应的带外管理指令,以及所述主板管理控制器的媒体访问控制地址值生成的。
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各方法提供的带外管理方法,该方法包括:接收第一以太网帧;根据所述第一以太网帧,在多个所述设备中确定待管理设备,以及确定所述待管理设备对应的目标带外管理指令,并将所述目标带外管理指令通过以太网路由至所述待管理设备;其中,所述第一以太网帧是由主板管理控制器通过中央处理器获取各扩展组件中各设备的媒体访问控制地址值,并根据各所述设备的媒体访问控制地址值、各所述设备对应的带外管理指令,以及所述主板管理控制器的媒体访问控制地址值生成的。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种带外管理系统,其特征在于,包括:主板管理控制器、网络接口卡、中央处理器、至少一个扩展组件;
所述主板管理控制器,通过串行计算机扩展总线与所述中央处理器连接,且通过以太网与所述网络接口卡连接;所述网络接口卡,通过以太网分别与各所述扩展组件中的各设备连接;
所述主板管理控制器,用于通过所述中央处理器获取各所述扩展组件中各设备的媒体访问控制地址值,根据各所述设备的媒体访问控制地址值、各所述设备对应的带外管理指令,以及所述主板管理控制器的媒体访问控制地址值,生成第一以太网帧,并将所述第一以太网帧发送至所述网络接口卡;
所述网络接口卡,用于根据所述第一以太网帧,在多个所述设备中确定待管理设备,以及所述待管理设备对应的目标带外管理指令,并将所述目标带外管理指令路由至所述待管理设备。
2.根据权利要求1所述的带外管理系统,其特征在于,每一所述扩展组件的多个设备包括主机总线适配器卡和至少一级扩展器;
对于每一所述扩展组件,所述主机总线适配器卡通过串行连接接口与第一级扩展器连接,各级所述扩展器之间通过串行连接接口级联连接;
所述网络接口卡包括与各所述主机总线适配器卡一一对应的以太网连接单元,以及与各级所述扩展器一一对应的以太网连接单元;
所述网络接口卡,通过与各所述主机总线适配器卡对应的以太网连接单元,与各所述主机总线适配器卡连接,并且通过与各级所述扩展器对应的以太网连接单元与各级所述扩展器连接;
所述网络接口卡,还用于:
根据所述第一以太网帧,在多个所述主机总线适配器卡和多级所述扩展器中确定所述待管理设备,以及所述待管理设备对应的目标带外管理指令;
基于所述待管理设备对应的以太网连接单元,将所述目标带外管理指令路由至所述待管理设备。
3.根据权利要求2所述的带外管理系统,其特征在于,所述网络接口卡,还用于:
通过与所述待管理设备对应的以太网连接单元,接收所述待管理设备根据所述目标带外管理指令反馈的第二以太网帧;
从所述第二以太网帧中解析出目的媒体访问控制地址值;
将所述目的媒体访问控制地址值与所述主板管理控制器的媒体访问控制地址值进行匹配;
在根据匹配结果,确定所述目的媒体访问控制地址值与所述主板管理控制器的媒体访问控制地址值匹配的情况下,将所述第二以太网帧反馈至所述主板管理控制器。
4.根据权利要求3所述的带外管理系统,其特征在于,所述主板管理控制器,还用于:
从所述第二以太网帧中解析出源媒体访问控制地址值以及所述待管理设备的设备信息;
根据所述源媒体访问控制地址值,确定所述待管理设备的拓扑信息;
根据所述设备信息,确定所述待管理设备的设备状态;
在所述待管理设备发生异常的情况下,根据所述拓扑信息和所述设备状态,生成告警信息。
5.根据权利要求1-4任一项所述的带外管理系统,其特征在于,所述网络接口卡,还用于:
从所述第一以太网帧中解析出各所述设备的媒体访问控制地址值;
将各所述设备的媒体访问控制地址值与设备连接列表中的各媒体访问控制地址值进行匹配;其中,所述设备连接列表中的各媒体访问控制地址值为与所述网络接口卡成功建立以太网连接的设备的媒体访问控制地址值;
根据匹配结果,在所述至少一个扩展组件中所有设备的媒体访问控制地址值中,确定与所述设备连接列表中的各媒体访问控制地址值匹配的目标媒体访问控制地址值;
在所述至少一个扩展组件的所有设备中,确定所述目标媒体访问控制地址值所属的目标设备;
将所述目标设备作为所述待管理设备。
6.根据权利要求1-4任一项所述的带外管理系统,其特征在于,所述主板管理控制器,还用于:
在监测到任一扩展组件所属的计算机设备上电的情况下,通过所述中央处理器获取任一扩展组件中各设备的媒体访问控制地址值。
7.根据权利要求1-4任一项所述的带外管理系统,其特征在于,所述网络接口卡通过串行计算机扩展总线与所述中央处理器连接;
所述网络接口卡,还用于:
将各所述扩展组件中各设备的设备信息传输至所述中央处理器;
和/或,在接收到所述中央处理器发送的处理指令的情况下,根据所述处理指令,在所述至少一个扩展组件的所有设备中确定待处理设备,并将处理指令传输至所述待处理设备。
8.根据权利要求1-4任一项所述的带外管理系统,其特征在于,对于各所述扩展组件中的设备、所述主板管理控制器以及所述网络接口卡中每一设备的每一以太网连接单元,所述每一以太网连接单元包括以太网接口、以太网物理层芯片和以太网连接器。
9.一种带外管理方法,其特征在于,应用于如权利要求1至8任一项所述的带外管理系统,包括:
接收第一以太网帧;
根据所述第一以太网帧,在多个所述设备中确定待管理设备,以及确定所述待管理设备对应的目标带外管理指令,并将所述目标带外管理指令通过以太网路由至所述待管理设备;
其中,所述第一以太网帧是由主板管理控制器通过中央处理器获取各扩展组件中各设备的媒体访问控制地址值,并根据各所述设备的媒体访问控制地址值、各所述设备对应的带外管理指令,以及所述主板管理控制器的媒体访问控制地址值生成的。
10.根据权利要求9所述的带外管理方法,其特征在于,所述根据所述第一以太网帧,在多个所述设备中确定待管理设备,以及确定所述待管理设备对应的目标带外管理指令,包括:
从所述第一以太网帧中解析出各所述设备的媒体访问控制地址值;
将各所述设备的媒体访问控制地址值与设备连接列表中的各媒体访问控制地址值进行匹配;
根据匹配结果,在至少一个扩展组件中所有设备的媒体访问控制地址值中,确定与所述设备连接列表中的各媒体访问控制地址值匹配的目标媒体访问控制地址值;
在所述至少一个扩展组件的所有设备中,确定所述目标媒体访问控制地址值所属的目标设备,将所述目标设备作为所述待管理设备;
从所述第一以太网帧中解析出所述目标设备对应的带外管理指令,作为所述目标带外管理指令。
CN202311403910.XA 2023-10-26 2023-10-26 带外管理系统及方法 Pending CN117648276A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311403910.XA CN117648276A (zh) 2023-10-26 2023-10-26 带外管理系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311403910.XA CN117648276A (zh) 2023-10-26 2023-10-26 带外管理系统及方法

Publications (1)

Publication Number Publication Date
CN117648276A true CN117648276A (zh) 2024-03-05

Family

ID=90046781

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311403910.XA Pending CN117648276A (zh) 2023-10-26 2023-10-26 带外管理系统及方法

Country Status (1)

Country Link
CN (1) CN117648276A (zh)

Similar Documents

Publication Publication Date Title
US10333771B2 (en) Diagnostic monitoring techniques for server systems
US9444633B2 (en) Method and apparatus for providing power over a data network
CN109558371B (zh) 用于与微控制器通信的方法、以及计算系统
US10127170B2 (en) High density serial over LAN management system
US8755265B2 (en) Method and apparatus for receiving power over a data network
TWI605344B (zh) 用於智慧插件節點管理之非臨時性電腦可讀取媒體、計算裝置及方法
US9197490B2 (en) System and method for providing remote management of a switching device
US11128741B2 (en) Auto-negotiation over extended backplane
US9804980B2 (en) System management through direct communication between system management controllers
WO2013120340A1 (zh) 网络接口模块的端口配置方法、装置及框式通信设备
US7502369B2 (en) High speed interface systems and methods
US9779037B2 (en) Establishing connectivity of modular nodes in a pre-boot environment
WO2020088351A1 (zh) 设备信息发送的方法、计算机设备和分布式计算机设备系统
CN112653516B (zh) 一种服务器中访问dimm的方法、系统、设备及介质
US8108736B2 (en) Multi-partition computer system, failure handling method and program therefor
CN117648276A (zh) 带外管理系统及方法
CN106993068B (zh) 一种刀片服务器管理内网ip的自动分配方法
CN114201439A (zh) 服务器信号识别优化方法、系统及存储介质
CN113194048A (zh) 一种动态切换cpu与gpu拓扑的装置及使用方法
CN117834750B (zh) 获取协议数据的装置、方法、系统、设备、介质及服务器
CN117539812A (zh) 服务器及数据传输方法
WO2023060928A1 (zh) 一种与PCIe设备通信的方法、装置及系统
CN118033468A (zh) 电源监测模块复位方法和电源监测系统复位方法
CN208158609U (zh) 机柜服务器系统
CN116126612A (zh) 一种芯片调试方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination