CN105100179A - 服务器集群系统 - Google Patents

服务器集群系统 Download PDF

Info

Publication number
CN105100179A
CN105100179A CN201410226858.XA CN201410226858A CN105100179A CN 105100179 A CN105100179 A CN 105100179A CN 201410226858 A CN201410226858 A CN 201410226858A CN 105100179 A CN105100179 A CN 105100179A
Authority
CN
China
Prior art keywords
controller
ram
lpc
cpu node
administrative unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410226858.XA
Other languages
English (en)
Other versions
CN105100179B (zh
Inventor
贾晓林
贾群
黄平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
XFusion Digital Technologies Co Ltd
Original Assignee
Hangzhou Huawei Digital Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Huawei Digital Technologies Co Ltd filed Critical Hangzhou Huawei Digital Technologies Co Ltd
Priority to CN201410226858.XA priority Critical patent/CN105100179B/zh
Publication of CN105100179A publication Critical patent/CN105100179A/zh
Application granted granted Critical
Publication of CN105100179B publication Critical patent/CN105100179B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Stored Programmes (AREA)

Abstract

本发明实施例提供一种服务器集群系统,通过利用LPC总线的等待机制的特性,将CPU节点通过LPC总线与逻辑单元进行连接,从而实现在多个CPU节点共享一份BIOS固件的前提下,多个CPU节点同时启动。由于多个CPU共享一份BIOS固件,因此,服务器集群系统只需存储一份BIOS固件即可,也就是一个服务器集群系统只需部署一个FLASH来存储BIOS固件,从而,节约成本。

Description

服务器集群系统
技术领域
本发明实施例涉及通信技术,尤其涉及一种服务器集群系统。
背景技术
随着中央处理器(centralprocessingunit,以下简称:CPU)节点的功耗和节点的单板尺寸越来越小,服务器集群系统的CPU节点部署密度越来越高,通常,一个机框内可以部署几十个节点。
现有的服务器集群系统中,每个CPU节点都连接一个用于存储基本输入/输出系统(basicinput/outputsystem,以下简称:BIOS)的闪存(FLASH)。
然而,采用现有技术的方法,随着CPU节点部署密度越来越高,需要部署越来越多的闪存,成本较高。
发明内容
本发明实施例提供一种服务器集群系统,以实现多个CPU节点共享BIOS固件,从而降低成本。
本发明实施例第一方面提供一种服务器集群系统,包括:
M个中央处理器CPU节点、逻辑单元、随机存取存储器RAM和管理单元,所述M为大于等于2的整数;
所述M个CPU节点通过低针计数LPC总线分别与所述逻辑单元相连;
所述RAM和所述管理单元分别与所述逻辑单元相连,所述管理单元用于存储基本输入/输出系统BIOS固件,并在所述系统启动时,将所述BIOS固件加载到所述RAM中,以使所述逻辑单元根据所述M个CPU节点发送的请求,从所述RAM中读取所述BIOS固件,并通过所述LPC总线发送到所述M个CPU节点中。
结合第一方面,在第一种可能的实现方式中,所述管理单元还用于通过以太网接口接收用户的访问数据。
结合第一方面或第一种可能的实现方式,在第二种可能的实现方式中,所述逻辑单元中包含M个LPC从控制器、桥控制器、RAM控制器和管理总线从控制器;
所述M个LPC从控制器、所述RAM控制器和所述管理总线从控制器分别与所述桥控制器连接,所述桥控制器用于对所述M个LPC从控制器、所述RAM控制器和所述管理总线从控制器进行调度和数据转发;
所述M个LPC从控制器与所述M个CPU节点一一对应,并且所述M个LPC从控制器分别与对应的CPU节点相连,用于对所述CPU节点和所述桥控制器之间传输的数据进行协议转换;
所述RAM控制器与所述RAM相连,用于对所述RAM进行控制;
所述管理总线从控制器与所述管理单元相连,用于对所述桥控制器和所述管理单元之间传输的数据进行协议转换。
结合第一方面或第一种可能的实现方式或第二种可能的实现方式,在第三种可能的实现方式中,所述管理单元还用于更新所述管理单元存储的BIOS固件。
本发明实施例提供的服务器集群系统,通过利用LPC总线的协议是等待机制的特性,将CPU节点通过LPC总线与逻辑单元进行连接,从而实现多个CPU节点共享一份BIOS固件的前提下,多个CPU节点同时启动。由于多个CPU共享一份BIOS固件,因此,服务器集群系统只需存储一份BIOS固件即可,也就是一个服务器集群系统只需部署一个闪存来存储BIOS固件,从而,节约成本。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明服务器集群系统实施例一的结构示意图;
图2为本发明CPU节点的一种结构示意图;
图3为本发明CPU节点的另一种结构示意图;
图4为本发明管理单元的结构示意图;
图5为本发明逻辑单元的结构示意图;
图6为本发明LPC读帧的格式示意图;
图7为本发明LPC写帧的格式示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
由于现有的服务器集群系统中,每个CPU节点都需要配置一个闪存,用于存储CPU节点的BIOS固件,成本较高,为了节约成本,本发明提供的服务器集群系统中,多个CPU节点共享一份BIOS固件(通常是指BIOS的数据区文件),因此,服务器集群系统只需存储一份BIOS固件即可,也就是一个服务器集群系统只需部署一个闪存来存储BIOS固件,从而,节约成本,然而,由于服务器集群系统的固有特性,同一个集群系统的所有的CPU节点要同时启动,因此,为了保证多个CPU节点共享一份BIOS固件的前提下,多个CPU节点同时启动,本发明提供的技术方案中,利用低针计数(Lowpincount,以下简称:LPC)总线的等待机制的特性,将CPU节点通过LPC总线与逻辑单元进行连接,从而实现多个CPU节点共享一份BIOS固件的前提下,多个CPU节点同时启动。
下面以具体地实施例对本发明的技术方案进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例不再赘述。
图1为本发明服务器集群系统实施例一的结构示意图,如图1所示,本实施例的系统包括:M个CPU节点、逻辑单元、RAM(作为外部缓存)和管理单元,所述M为大于等于2的整数;其中,M个CPU节点通过LPC总线分别与所述逻辑单元相连;RAM和管理单元分别与所述逻辑单元相连;管理单元用于存储BIOS固件,并在系统启动时,将BIOS固件加载到RAM中,以使逻辑单元根据M个CPU节点发送的请求,从RAM中读取BIOS固件,并通过LPC总线发送到M个CPU节点中。
具体地,图1所示服务器集群系统的上电流程如下:
S201:管理单元将存储的BIOS固件通过逻辑单元加载到RAM中。
S202:CPU节点上电初始化,并通过LPC总线向逻辑单元发送BIOS文件请求。
S203:逻辑单元从RAM中读取BIOS固件,并通过LPC发送给发送请求的CPU节点。
由于RAM的读取速度很快,而LPC总线的速率(一般33M)远小于RAM的速率,加上LPC的等待机制,因此,能够保证CPU节点的同时启动。
本实施例中,通过利用LPC总线的等待机制的特性,将CPU节点通过LPC总线与逻辑单元进行连接,从而实现多个CPU节点共享一份BIOS固件的前提下,多个CPU节点同时启动。由于多个CPU共享一份BIOS固件,因此,服务器集群系统只需存储一份BIOS固件即可,也就是一个服务器集群系统只需部署一个闪存来存储BIOS固件,从而,节约成本。
在上述实施例中,CPU节点的结构如图2所示和图3所示,图2为本发明CPU节点的一种结构示意图,如图2所示,CPU节点包括CPU,输入/输出中心(InputOutputHub,以下简称:IOH),IOH是英特尔的北桥芯片系列名称、输入/输出控制器中心(I/Ocontrollerhub,以下简称:ICH),ICH负责连接PCI总线,IDE设备,I/O设备等,ICH是英特尔的南桥芯片系列名称,以及下挂的双列直插式存储模块(Dual-Inline-Memory-Modules,以下简称:DIMM),串行外设接口(SerialPeripheralInterface,以下简称:SPI)闪存、硬盘驱动器(HardDiskDrive,以下简称:HDD)/以太网接口(GigabitEthernet,以下简称:GE)等输入输出(Input/Output,以下简称:I/O)设备。图3为本发明CPU节点的另一种结构示意图,如图3所示,CPU节点包括单芯片系统(SystemonaChip,以下简称:SOCCPU)、以及下挂的DIMM、SPIFLASH、HDD/GE等I/O设备。在本发明的实施例中,由于多个CPU节点共享一份BIOS固件,因此,CPU节点自身的SPIFLASH中只存放BIOS表像配置信息(每个CPU节点个性化的配置)即可,大概为4K大小,可以大大减小CPU节点自身的SPIFLASH的容量需求。表像配置信息包括安全启动信息、PCIE端口分配信息,软件strap配置等个性化的配置信息。
在上述实施例中,管理单元的结构如图4所示,图4为本发明管理单元的结构示意图,如图4所示,管理节点包括管理CPU、闪存、RAM和以太网接口(图4中以GE/快速以太网(FastEthernet,以下简称:FE)接口示出);其中,闪存用于存储BIOS固件,本发明将闪存集成在管理单元中,因此,管理单元还用于更新管理单元存储的BIOS固件,即闪存中存储的BIOS固件,在进行BIOS固件更新(升级)时,用户可以通过以太网接口访问管理单元,管理单元可以直接通过以太网接口接收更新的BIOS固件,对闪存中的固件进行升级,而无需经过逻辑单元进行调度,升级方式简单、方便和高效。本发明由于多个CPU节点共享一份BIOS固件,因此,升级管理节点中的BIOS固件,就更新了整个服务器集群系统的BIOS固件,维护方便。
在上述实施例中,逻辑单元的结构如图5所示,图5为本发明逻辑单元的结构示意图,如图5所示,逻辑单元中包含M个LPC从(slave)控制器、桥控制器、RAM控制器和管理总线从控制器;M个LPC从控制器、RAM控制器和所述管理总线从控制器分别与所述桥控制器连接,所述桥控制器用于对所述M个LPC从控制器、所述RAM控制器和所述管理总线从控制器进行调度和数据转发;所述M个LPC从控制器与所述M个CPU节点一一对应,并且所述M个LPC从控制器分别与对应的CPU节点相连,用于对所述CPU节点和所述桥控制器之间传输的数据进行协议转换;所述RAM控制器与所述RAM相连,用于对所述RAM进行控制;所述管理总线从控制器与所述管理单元相连,用于对所述桥控制器和所述管理单元之间传输的数据进行协议转换。连接管理单元与管理总线从控制器的总线通常为内部总线(localbus)/快捷外围部件互连标准(PeripheralComponentInterconnectExpress,以下简称:PCIe)等等。
本发明实施例还提供了LPC的写和读的帧格式,其中,图6为本发明LPC读帧的格式示意图,图7为本发明LPC写帧的格式示意图,对于多个CPU节点访问RAM的过程中,LPC的转向/同步(turnaround/synchronization,TAR/SYNC)等待的协议约定,可以解决总线占有冲突的问题,一般情况下TAR为1到2到个时钟(clock)时间,而SYNC时间则可以收到从控制器的控制,可以通过加长SYNC时间来加长等待时间,由于LPC总线的速率(一般33M)远小于RAM的速率,加上LPC的等待机制,可以较好的保证在共享BIOS固件的前提下,多CPU节点同时启动。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (4)

1.一种服务器集群系统,其特征在于,包括:
M个中央处理器CPU节点、逻辑单元、随机存取存储器RAM和管理单元,所述M为大于等于2的整数;
所述M个CPU节点通过低针计数LPC总线分别与所述逻辑单元相连;
所述RAM和所述管理单元分别与所述逻辑单元相连,所述管理单元用于存储基本输入/输出系统BIOS固件,并在所述系统启动时,将所述BIOS固件加载到所述RAM中,以使所述逻辑单元根据所述M个CPU节点发送的请求,从所述RAM中读取所述BIOS固件,并通过所述LPC总线发送到所述M个CPU节点中。
2.根据权利要求1所述的系统,其特征在于,所述管理单元还用于通过以太网接口接收用户的访问数据。
3.根据权利要求1或2所述的系统,其特征在于,所述逻辑单元中包含M个LPC从控制器、桥控制器、RAM控制器和管理总线从控制器;
所述M个LPC从控制器、所述RAM控制器和所述管理总线从控制器分别与所述桥控制器连接,所述桥控制器用于对所述M个LPC从控制器、所述RAM控制器和所述管理总线从控制器进行调度和数据转发;
所述M个LPC从控制器与所述M个CPU节点一一对应,并且所述M个LPC从控制器分别与对应的CPU节点相连,用于对所述CPU节点和所述桥控制器之间传输的数据进行协议转换;
所述RAM控制器与所述RAM相连,用于对所述RAM进行控制;
所述管理总线从控制器与所述管理单元相连,用于对所述桥控制器和所述管理单元之间传输的数据进行协议转换。
4.根据权利要求1~3任一项所述的系统,其特征在于,所述管理单元还用于更新所述管理单元存储的BIOS固件。
CN201410226858.XA 2014-05-23 2014-05-23 服务器集群系统 Active CN105100179B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410226858.XA CN105100179B (zh) 2014-05-23 2014-05-23 服务器集群系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410226858.XA CN105100179B (zh) 2014-05-23 2014-05-23 服务器集群系统

Publications (2)

Publication Number Publication Date
CN105100179A true CN105100179A (zh) 2015-11-25
CN105100179B CN105100179B (zh) 2018-10-19

Family

ID=54579702

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410226858.XA Active CN105100179B (zh) 2014-05-23 2014-05-23 服务器集群系统

Country Status (1)

Country Link
CN (1) CN105100179B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1635472A (zh) * 2003-12-31 2005-07-06 英业达股份有限公司 多处理器计算机系统的开机切换方法
US7293165B1 (en) * 2003-04-03 2007-11-06 Advanced Micro Devices, Inc. BMC-hosted boot ROM interface
CN101231629A (zh) * 2007-01-26 2008-07-30 国际商业机器公司 超传输交换数据处理系统及超传输交换方法
US7853638B2 (en) * 2007-01-26 2010-12-14 International Business Machines Corporation Structure for a flexibly configurable multi central processing unit (CPU) supported hypertransport switching
CN102648453A (zh) * 2009-11-24 2012-08-22 超威半导体公司 分布式多核存储器初始化
CN103475514A (zh) * 2013-09-03 2013-12-25 华为技术有限公司 无bmc的节点、集群系统及bios修复和升级方法
CN103544121A (zh) * 2013-10-25 2014-01-29 杭州华为数字技术有限公司 一种基于微服务系统管理槽位号的方法、设备及系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7293165B1 (en) * 2003-04-03 2007-11-06 Advanced Micro Devices, Inc. BMC-hosted boot ROM interface
CN1635472A (zh) * 2003-12-31 2005-07-06 英业达股份有限公司 多处理器计算机系统的开机切换方法
CN101231629A (zh) * 2007-01-26 2008-07-30 国际商业机器公司 超传输交换数据处理系统及超传输交换方法
US7853638B2 (en) * 2007-01-26 2010-12-14 International Business Machines Corporation Structure for a flexibly configurable multi central processing unit (CPU) supported hypertransport switching
CN102648453A (zh) * 2009-11-24 2012-08-22 超威半导体公司 分布式多核存储器初始化
CN103475514A (zh) * 2013-09-03 2013-12-25 华为技术有限公司 无bmc的节点、集群系统及bios修复和升级方法
CN103544121A (zh) * 2013-10-25 2014-01-29 杭州华为数字技术有限公司 一种基于微服务系统管理槽位号的方法、设备及系统

Also Published As

Publication number Publication date
CN105100179B (zh) 2018-10-19

Similar Documents

Publication Publication Date Title
CN108351813B (zh) 用于在非易失性存储器快速(NVMe)控制器的不同网络地址上使能个别的NVMe输入/输出(IO)队列的方法和装置
US10728024B2 (en) Technologies for providing runtime code in an option ROM
US11016832B2 (en) Cloud-based scale-up system composition
CN106557340B (zh) 一种配置方法及装置
CN108604456B (zh) 在存储器插槽中支持多个存储器类型
CN104798008B (zh) 控制处理器的可配置的峰值性能极限
CN104346317B (zh) 共享资源访问方法和装置
CN103501242A (zh) 资源管理方法和多节点集群设备
CN106547592A (zh) 一种实现新型云服务器电源软件在线更新的设计方法
US20180210850A1 (en) System and Method to Avoid SMBus Address Conflicts via a Baseboard Management Controller
US8037223B2 (en) Reconfigurable I/O card pins
CN204347834U (zh) 一种基于fpga的服务器集群存储系统
CN107624178B (zh) 快速归零的机柜式架构(rsa)和共享存储器控制器(smc)技术
US9280493B2 (en) Method and device for enumerating input/output devices
CN112017700A (zh) 用于存储器装置的动态功率管理网络
CN204347812U (zh) 一种基于fpga的服务器存储电路
CN109117418A (zh) 一种可编程片上系统
CN111104358A (zh) 解聚计算机系统
CN113656076A (zh) 一种基于硬件复用通道的bios启动方法及装置
CN107003932A (zh) 多核处理器系统的缓存目录处理方法和目录控制器
CN102393838A (zh) 数据处理方法及装置、pci-e总线系统、服务器
CN205230035U (zh) 一种基于高端服务器的PCIE Box板卡
US10649943B2 (en) System and method for I/O aware processor configuration
CN206178765U (zh) Ssd单元及ssd设备
CN105100179A (zh) 服务器集群系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20200417

Address after: 518129 Bantian HUAWEI headquarters office building, Longgang District, Guangdong, Shenzhen

Patentee after: HUAWEI TECHNOLOGIES Co.,Ltd.

Address before: 301, A building, room 3, building 301, foreshore Road, No. 310053, Binjiang District, Zhejiang, Hangzhou

Patentee before: Huawei Technologies Co.,Ltd.

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20211222

Address after: 450046 Floor 9, building 1, Zhengshang Boya Plaza, Longzihu wisdom Island, Zhengdong New Area, Zhengzhou City, Henan Province

Patentee after: Super fusion Digital Technology Co.,Ltd.

Address before: 518129 Bantian HUAWEI headquarters office building, Longgang District, Guangdong, Shenzhen

Patentee before: HUAWEI TECHNOLOGIES Co.,Ltd.

TR01 Transfer of patent right