CN104899063B - 一种服务器管理系统及启动方法 - Google Patents

一种服务器管理系统及启动方法 Download PDF

Info

Publication number
CN104899063B
CN104899063B CN201510291025.6A CN201510291025A CN104899063B CN 104899063 B CN104899063 B CN 104899063B CN 201510291025 A CN201510291025 A CN 201510291025A CN 104899063 B CN104899063 B CN 104899063B
Authority
CN
China
Prior art keywords
smc
chips
link
management system
selecting module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510291025.6A
Other languages
English (en)
Other versions
CN104899063A (zh
Inventor
李清石
刘强
赵素梅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Cloud Information Technology Co Ltd
Original Assignee
Inspur Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Group Co Ltd filed Critical Inspur Group Co Ltd
Priority to CN201510291025.6A priority Critical patent/CN104899063B/zh
Publication of CN104899063A publication Critical patent/CN104899063A/zh
Application granted granted Critical
Publication of CN104899063B publication Critical patent/CN104899063B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Power Sources (AREA)

Abstract

本发明公开了一种服务器管理系统及启动方法,包括若干刀片,每个刀片上均设置有管理单元,该管理单元包括SMC芯片和若干BMC芯片,所述SMC芯片和BMC芯片均连接选择模块,该选择模块检测SMC芯片、BMC芯片发出的信号启动情况,提供相应电子开关功能,并根据其启动情况选择是否控制电子开关开启以完成该信号的链路,其启动过程基于该系统完成。该一种服务器管理系统及启动方法与现有技术相比,可避免了启动时机箱复杂电磁环境的信号干扰,从而提高了整个管理系统启动时的可靠性,实用性强。

Description

一种服务器管理系统及启动方法
技术领域
本发明涉及机柜服务器技术领域,具体地说是一种实用性强、服务器管理系统及启动方法。
背景技术
机柜服务器由于具有刀片密度高、部署灵活快速的优点,已经在互联网领域得到了广泛的应用。
服务器管理系统对机柜中的各个刀片及机箱温度、电源和散热等进行管理,由于机柜容纳了多个服务器刀片,机箱内具有复杂的电磁环境,管理系统的稳定性会受到机箱环境的影响,特别是在管理系统启动时,由于各种功能信号连接的干扰,以及可能存在的内核不鲁棒性,容易出现内核崩溃等严重问题,一旦出现问题又很难定位是哪种信号导致了内核启动错误,所以提高服务器管理系统的启动稳定性是需要解决的问题。
为解决上述该问题,现提供一种服务器管理系统及启动方法。
发明内容
本发明的技术任务是针对以上不足之处,提供一种实用性强、服务器管理系统及启动方法。
一种服务器管理系统,其结构包括若干刀片,每个刀片上均设置有管理单元,该管理单元包括SMC芯片和若干BMC芯片,所述SMC芯片和BMC芯片均连接选择模块,该选择模块检测SMC芯片、BMC芯片发出的信号启动情况,提供相应电子开关功能,并根据其启动情况选择是否控制电子开关开启以完成该信号的链路。
所述SMC芯片设置在管理载板上,该管理载板上还设置有管理交换机,上述BMC芯片则分别设置在计算单元、存储单元上,该SMC芯片、管理交换机、BMC芯片均通路连接机箱电源组,即SMC芯片与机箱电源组之间、管理交换机与机箱电源组之间、BMC芯片与机箱电源组之间始终保持通路。
所述SMC芯片、管理交换机、BMC芯片均通过STBY电连接到机箱电源组。
所述SMC芯片接入选择模块后,通过传输IPMB信号的I2C链路选择连接BMC芯片、机箱电源组、机箱风扇组;通过另一I2C链路挂接SMC传感器;通过管理载板上的管理交换机实现网络链路连接;
所述BMC芯片均接入选择模块后,通过通过I2C链路挂接其对应的BMC芯片;通过管理载板上的管理交换机实现网络链路连接。
所述选择模块中包括两种硬件逻辑,一是一对一的端口信号链路连接控制,即SMC芯片与SMC传感器之间的链路、SMC芯片与管理交换机之间的链路、BMC芯片与BMC传感器之间的链路、BMC芯片与管理交换机之间的链路连接控制;二是一对多的端口信号链路连接控制,即SMC芯片与BMC芯片、机箱电源组、机箱风扇组之间的I2C连接链路。
所述选择模块对应各个管理单元的链路上设置有定时器,当检测到某个刀片的管理单元在位时,启动相应管理单元的定时器,若在定时器超时后相应管理单元未正常启动,则发出复位信号使其重启。
一种服务器管理系统启动方法,其具体过程为:
各个管理单元启动完成前,除通过STBY电连接的链路外,其余通过选择模块的链路均呈断开连接状态;
选择模块检测各个管理单元的启动完成信号;
当某个管理单元启动完成后,发送启动完成信号给该选择模块;
选择模块接收到启动完成信号后,闭合控制此管理单元上述未对外建立实质有效连接的信号链路的电子开关;
将此管理单元的功能信号链路接入管理系统并执行相应的管理功能。
本发明的一种服务器管理系统及启动方法,具有以下优点:
本发明提出的一种服务器管理系统及启动方法,通过增加一个根据SMC及各BMC启动完成情况决定各管理单元功能信号是否接入管理系统的硬件模块,使管理系统的各个管理单元在未完成启动尚无法执行相应功能时与管理系统的其他功能模块隔离,在完成启动已可以执行相应功能时融入整个管理系统,避免了启动时机箱复杂电磁环境的信号干扰,从而提高了整个管理系统启动时的可靠性,实用性强,易于推广。
附图说明
附图1是传统的服务器管理系统信号链路的示意图。
附图2是本发明的服务器管理系统信号链路的示意图。
附图3是本发明的两种信号链路的硬件逻辑的示意图。
附图4是本发明的服务器管理系统启动方法的示意图。
具体实施方式
下面结合附图和具体实施例对本发明作进一步说明。
现提供一种服务器管理系统及启动方法,通过增加一个根据SMC及各BMC启动完成情况决定各管理单元功能信号是否接入管理系统的硬件模块,使管理系统的各个管理单元在未完成启动尚无法执行相应功能时与管理系统的其他功能模块隔离,在完成启动已可以执行相应功能时融入整个管理系统,避免了启动时机箱复杂电磁环境的信号干扰,从而提高了整个管理系统启动时的可靠性。
如附图2、图3所示,该一种服务器管理系统,包括若干刀片,每个刀片上均设置有管理单元,该管理单元包括SMC芯片和若干BMC芯片,所述SMC芯片和BMC芯片均连接选择模块,该选择模块检测SMC芯片、BMC芯片发出的信号启动情况,提供相应电子开关功能,并根据其启动情况选择是否控制电子开关开启以完成该信号的链路。
所述SMC芯片设置在管理载板上,该管理载板上还设置有管理交换机,上述BMC芯片则分别设置在计算单元、存储单元上,该SMC芯片、管理交换机、BMC芯片均通路连接机箱电源组,以组成各个管理单元最小系统的相关电路,即SMC芯片与机箱电源组之间、管理交换机与机箱电源组之间、BMC芯片与机箱电源组之间始终保持通路。
所述SMC芯片、管理交换机、BMC芯片均通过STBY电连接到机箱电源组。
所述SMC芯片接入选择模块后,通过传输IPMB信号的I2C链路选择连接BMC芯片、机箱电源组、机箱风扇组;通过另一I2C链路挂接SMC传感器;通过管理载板上的管理交换机实现网络链路连接;
所述BMC芯片均接入选择模块后,通过通过I2C链路挂接其对应的BMC芯片;通过管理载板上的管理交换机实现网络链路连接;
但上述这些连接能否实质生效由上述选择模块决定。
所述选择模块中包括两种硬件逻辑,一是一对一的端口信号链路连接控制,即SMC芯片与SMC传感器之间的链路、SMC芯片与管理交换机之间的链路、BMC芯片与BMC传感器之间的链路、BMC芯片与管理交换机之间的链路连接控制;二是一对多的端口信号链路连接控制,即SMC芯片与BMC芯片、机箱电源组、机箱风扇组之间的I2C连接链路。
所述选择模块对应各个管理单元的链路上设置有定时器,当检测到某个刀片的管理单元在位时,启动相应管理单元的定时器,若在定时器超时后相应管理单元未正常启动,则发出复位信号使其重启。
可见,本发明的实质是,根据启动是否需要,对各个管理单元的对外电气连接分批建立信号链路以屏蔽启动无关连接对启动过程的影响。也就是说,启动完成之前用不到的信号链路没必要在管理单元上电后立即建立实质性的信号通路,因为即使连接也无法使用,等到管理单元启动完成可以执行管理功能时,再建立相应的信号连接,减少了管理系统启动过程中的干扰项。
如附图4所示,一种服务器管理系统启动方法,其具体过程为:
各个管理单元启动完成前,除通过STBY电连接的链路外,其余通过选择模块的链路均呈断开连接状态,即SMC与BMC之间的信号链路、网络链路、SMC和BMC访问各自传感器的I2C链路、以及SMC访问机箱的I2C链路处于断开连接状态;
选择模块检测各个管理单元的启动完成信号;
当某个管理单元启动完成后,发送启动完成信号给该选择模块;
选择模块接收到启动完成信号后,闭合控制此管理单元上述未对外建立实质有效连接的信号链路的电子开关;
将此管理单元的功能信号链路接入管理系统并执行相应的管理功能。
实施例:
一个典型的机柜服务器,有一个管理载板、若干个计算单元和存储单元,及机箱电源、风扇等必备组件,管理载板上有SMC,计算单元和存储单元上有BMC,管理刀片和各计算及存储刀片通过机箱背板建立信号链路,如附图1所示。
本实施例是在机箱背板上增加一个选择模块,即图中的CPLD,机箱背板上原有的与启动无关的I2C和LAN等信号链路由经过机箱背板直接连接各个刀片改为经由选择模块间接连接,各个刀片内部的I2C或者LAN等信号链路也由板内直接连接改为经由机箱背板上的选择模块间接连接,除信号链路改变外,各个器件仍位于原有刀片上,如附图2。当然,刀片内部的信号链路上挂载的器件多为被动器件,不会主动发起与所在刀片管理单元的通信过程,对启动一般无影响,也可保持直接连接方式以简化设计。
选择模块的作用是在检测到某个管理单元启动完成时闭合此管理单元相关的信号链路的电子开关,使该管理单元在启动完成后融入管理系统。结合本发明实施例,以SMC启动前后I2C和LAN信号链路的连接情况为例说明如下:
连接关系:
SMC的I2C1连接选择模块的P11端口,SMC传感器连接选择模块的P12端口;SMC的I2C4连接选择模块的P40端口,机箱风扇组连接选择模块的P43端口,机箱电源组连接选择模块的P44端口;SMC的LAN口连接选择模块的P51端口,管理交换机的一个LAN口连接选择模块的P52端口。
需要注意的是,这里的端口标识不是指的选择模块实际的引脚,也不是单根引脚,而是相应信号所需要的线缆的引脚标识,如I2C1的P11端口指的是I2C1的SDA1和SCL1连接到选择模块的某两个引脚的统一标识。
启动完成信号:
SMC的启动完成信号由选择模块的P1端口输入选择模块。
硬件逻辑:
当SMC未完成启动时,P1端口上无启动完成信号,选择模块断开控制I2C1通往SMC传感器的信号链路通断的K1电子开关,断开控制I2C4通往机箱风扇组和机箱电源组的信号链路通断的K43和K44电子开关,断开控制SMC的LAN口通往管理交换机其中一个LAN口的信号链路通断的K5电子开关;
当SMC完成启动时,选择模块检测到P1端口上的启动完成信号,并闭合上述电子开关,使I2C1、I2C4的部分器件和SMC的LAN接入管理系统。
上述具体实施方式仅是本发明的具体个案,本发明的专利保护范围包括但不限于上述具体实施方式,任何符合本发明的一种服务器管理系统及启动方法的权利要求书的且任何所述技术领域的普通技术人员对其所做的适当变化或替换,皆应落入本发明的专利保护范围。

Claims (5)

1.一种服务器管理系统,其特征在于,包括若干刀片,每个刀片上均设置有管理单元,该管理单元包括SMC芯片和若干BMC芯片,所述SMC芯片和BMC芯片均连接选择模块,该选择模块检测SMC芯片、BMC芯片发出的信号启动情况,并提供相应的电子开关功能;
所述SMC芯片设置在管理载板上,该管理载板上还设置有管理交换机,上述BMC芯片则分别设置在计算单元、存储单元上,该SMC芯片、管理交换机、BMC芯片均通路连接机箱电源组,即SMC芯片与机箱电源组之间、管理交换机与机箱电源组之间、BMC芯片与机箱电源组之间始终保持通路;
所述选择模块中包括两种硬件逻辑,一种是一对一的端口信号链路连接控制,即SMC芯片与SMC传感器之间的链路连接控制、SMC芯片与管理交换机之间的链路连接控制、BMC芯片与BMC传感器之间的链路连接控制、BMC芯片与管理交换机之间的链路连接控制;另一种是一对多的端口信号链路连接控制,即SMC芯片与BMC芯片、机箱电源组、机箱风扇组之间的I2C链路连接控制;其中,在SMC芯片、BMC芯片未完成启动时,选择模块控制其中的端口信号链路均处于断开连接状态,在SMC芯片、BMC芯片完成启动时,选择模块控制其中的端口信号链路处于闭合连接状态。
2.根据权利要求1所述的服务器管理系统,其特征在于,所述SMC芯片、管理交换机、BMC芯片均通过STBY电连接到机箱电源组。
3.根据权利要求1所述的服务器管理系统,其特征在于,所述SMC芯片接入选择模块后,通过传输IPMB信号的I2C链路选择连接BMC芯片、机箱电源组、机箱风扇组;通过另一I2C链路挂接SMC传感器;通过管理载板上的管理交换机实现网络链路连接;
所述BMC芯片均接入选择模块后,通过I2C链路挂接其对应的BMC芯片;通过管理载板上的管理交换机实现网络链路连接。
4.根据权利要求1所述的服务器管理系统,其特征在于,所述选择模块对应各个管理单元的链路上设置有定时器,当检测到某个刀片的管理单元在位时,启动相应管理单元的定时器,若在定时器超时后相应管理单元未正常启动,则发出复位信号使其重启。
5.一种服务器管理系统启动方法,其特征在于,具体过程为:
首先准备权利要求1-4任一项所述的服务器管理系统;
各个管理单元启动完成前,选择模块中的端口信号链路均呈断开连接状态;
选择模块检测各个管理单元的启动完成信号;
当某个管理单元启动完成后,发送启动完成信号给该选择模块;
选择模块接收到启动完成信号后,控制其中与该管理单元相关的端口信号链路呈闭合连接状态;
将此管理单元的功能信号链路接入管理系统并执行相应的管理功能。
CN201510291025.6A 2015-06-01 2015-06-01 一种服务器管理系统及启动方法 Active CN104899063B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510291025.6A CN104899063B (zh) 2015-06-01 2015-06-01 一种服务器管理系统及启动方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510291025.6A CN104899063B (zh) 2015-06-01 2015-06-01 一种服务器管理系统及启动方法

Publications (2)

Publication Number Publication Date
CN104899063A CN104899063A (zh) 2015-09-09
CN104899063B true CN104899063B (zh) 2017-11-21

Family

ID=54031741

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510291025.6A Active CN104899063B (zh) 2015-06-01 2015-06-01 一种服务器管理系统及启动方法

Country Status (1)

Country Link
CN (1) CN104899063B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105468119A (zh) * 2015-11-19 2016-04-06 浪潮电子信息产业股份有限公司 一种多控制端的复位线路的硬件实现方法
CN106452932A (zh) * 2016-12-27 2017-02-22 郑州云海信息技术有限公司 一种具有冗余功能的通信监控方法、装置及系统
CN106850814B (zh) * 2017-02-15 2020-02-14 浪潮集团有限公司 一种增加自定义命令支持实现传感器信息采集的方法
CN108509223B (zh) * 2018-03-15 2021-09-14 联想(北京)有限公司 一种数据处理方法、装置、系统及存储介质
CN109002415A (zh) * 2018-07-27 2018-12-14 浪潮(北京)电子信息产业有限公司 一种服务器及其基于bmc的数据传输装置
CN109450822A (zh) * 2018-10-30 2019-03-08 山东超越数控电子股份有限公司 一种带自身管理功能的交换机结构及控制方法
CN111475218A (zh) * 2020-04-26 2020-07-31 中国长城科技集团股份有限公司 一种服务器的开机方法、服务器及计算机可读存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102413202A (zh) * 2011-11-18 2012-04-11 浪潮电子信息产业股份有限公司 一种刀片服务器管理内网ip的自动分配方法
CN103995575A (zh) * 2014-05-27 2014-08-20 浪潮(北京)电子信息产业有限公司 一种服务器启动方法和服务器
CN104104550A (zh) * 2014-08-04 2014-10-15 浪潮电子信息产业股份有限公司 一种基于bmc卡的交换刀片的管理方案

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030130969A1 (en) * 2002-01-10 2003-07-10 Intel Corporation Star intelligent platform management bus topology

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102413202A (zh) * 2011-11-18 2012-04-11 浪潮电子信息产业股份有限公司 一种刀片服务器管理内网ip的自动分配方法
CN103995575A (zh) * 2014-05-27 2014-08-20 浪潮(北京)电子信息产业有限公司 一种服务器启动方法和服务器
CN104104550A (zh) * 2014-08-04 2014-10-15 浪潮电子信息产业股份有限公司 一种基于bmc卡的交换刀片的管理方案

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于ATCA平台管理控制系统的研究与实现;张峰 等;《第十八届计算机工程与工艺年会暨第四届微处理器技术论坛论文集》;20140930;第2-10页 *

Also Published As

Publication number Publication date
CN104899063A (zh) 2015-09-09

Similar Documents

Publication Publication Date Title
CN104899063B (zh) 一种服务器管理系统及启动方法
CN103107960B (zh) 通过开关卡减少交换结构中交换故障的影响的方法和系统
US10499531B2 (en) Rack level network switch
US10509925B2 (en) Circuit board enclosure and method for communications applications
US20160172901A1 (en) Ups system with network monitoring and attached battery pack information sensing functions
CN107463456A (zh) 一种提升双网卡ncsi管理系统切换效率的系统及方法
US20060218326A1 (en) Blade server system and method of managing same
TW201714432A (zh) 管理方法、服務控制器裝置以及非暫態電腦可讀取媒體
CN103853678B (zh) 板卡管理装置及使用其的板卡管理系统和控制卡
CN109510742A (zh) 一种服务器网卡远程测试方法、装置、终端及存储介质
CN103135732B (zh) 服务器机柜系统
US8959376B2 (en) Sharing power between two or more power sharing servers
CN101326472B (zh) 现场电气设备以及在现场电气设备的数据接口与设备内数据存储器之间建立数据连接的方法
CN113886326A (zh) 一种arm服务器和数据处理方法
CN102281162B (zh) 数据网络和管理网络的融合方法、系统及其装置
US10362375B2 (en) Discovering connection of passive cables
CN206460446U (zh) 一种针对加固计算机主板的监控装置
CN105553865B (zh) 一种fc交换机芯片信用管理测试方法
CN103403563A (zh) 反向供电线路测试系统及设备
CN109039823A (zh) 一种网络系统防火墙检测方法、装置、设备及存储介质
CN111414327B (zh) 网络设备
CN103634237B (zh) 微型电信计算架构机架管理控制器
CN105634871A (zh) 基于AXIe的智能平台管理系统测试仪器
CN103178986B (zh) 服务器机柜及其管理方法
CN106648007B (zh) 一种通用槽位实现方法、装置及通信设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20180806

Address after: 250100 S06 tower, 1036, Chao Lu Road, hi tech Zone, Ji'nan, Shandong.

Patentee after: Shandong wave cloud Mdt InfoTech Ltd

Address before: No. 1036, Shandong high tech Zone wave road, Ji'nan, Shandong

Patentee before: Inspur Group Co., Ltd.

CP03 Change of name, title or address
CP03 Change of name, title or address

Address after: 250100 No. 1036 Tidal Road, Jinan High-tech Zone, Shandong Province, S01 Building, Tidal Science Park

Patentee after: Inspur cloud Information Technology Co., Ltd

Address before: 250100 Ji'nan science and technology zone, Shandong high tide Road, No. 1036 wave of science and Technology Park, building S06

Patentee before: SHANDONG LANGCHAO YUNTOU INFORMATION TECHNOLOGY Co.,Ltd.