CN104317677A - 一种基于Brickland的冗余监控管理系统及方法 - Google Patents

一种基于Brickland的冗余监控管理系统及方法 Download PDF

Info

Publication number
CN104317677A
CN104317677A CN201410511238.0A CN201410511238A CN104317677A CN 104317677 A CN104317677 A CN 104317677A CN 201410511238 A CN201410511238 A CN 201410511238A CN 104317677 A CN104317677 A CN 104317677A
Authority
CN
China
Prior art keywords
bmc
server system
monitoring
smbus
monitoring management
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410511238.0A
Other languages
English (en)
Inventor
牟茜
王守昊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Electronic Information Industry Co Ltd
Original Assignee
Inspur Electronic Information Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Electronic Information Industry Co Ltd filed Critical Inspur Electronic Information Industry Co Ltd
Priority to CN201410511238.0A priority Critical patent/CN104317677A/zh
Publication of CN104317677A publication Critical patent/CN104317677A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Hardware Redundancy (AREA)

Abstract

本发明公开了一种基于Brickland的冗余监控管理系统及方法,搭配两套监控管理系统,针对不同的配置,在其中一套监控管理系统不在位或出现故障时,备用监控管理系统启用,对整个服务器系统的实时监控;在正常状态下,主BMC实时监控服务器系统状态,从BMC通过SMBUS和UART读到服务器系统状态;当主BMC不在位或出现故障时,从BMC对服务器系统进行实时监控。通过本发明,能够提高服务器系统监控管理的稳定性,保证监控管理的可靠性,且系统设置新颖、操作简单,因此具有较好的使用前景。

Description

一种基于Brickland的冗余监控管理系统及方法
技术领域
本发明涉及计算机管理技术,具体地说是一种基于Brickland的冗余监控管理系统及方法。
背景技术
现今随着服务器技术的发展,系统架构越来越复杂,对服务器的状态监控要求也越来越高,通常状况下,一个服务器系统搭配一套管理系统,当管理系统出现故障之后,无法完成对服务器系统的实时监控,无法检测到服务器的健康状况,不能对服务器进行有效维护。
发明内容
本方明针对现有技术存在的不足之处,提供一种基于Brickland的冗余监控管理系统及方法。
本发明所述一种基于Brickland的冗余监控管理系统,其解决所述技术问题采用的技术方案是:所述基于Brickland的冗余监控管理系统及方法, 是在Brickland平台8路服务器系统中,搭配两套监控管理系统,针对不同的配置,在其中一套监控管理系统不在位或出现故障时,备用监控管理系统启用,实现对整个系统的实时监控,以此来提高服务器系统的稳定性。
本发明所述基于Brickland的冗余监控管理系统,其组成部分主要包括服务器系统、Switch和两个独立的BMC管理系统(主BMC及从BMC),其中,服务器系统的SYSSMBUS通过Switch分别连接到这两个BMC管理系统上,并且这两个管理系统通过单独的一组SMBUS和一组UART做心跳,实时通信。
优选的,所述服务器系统通过SYSSMBUS与Switch连接,Switch通过Master SMBUS与主BMC连接,Switch通过Slave SMBUS与从BMC连接。
优选的,所述主BMC和从 BMC两个管理系统通过 SYNC SMBUS和SYNC UART做心跳同步。
本发明所述基于Brickland的冗余监控管理方法,搭配两套监控管理系统,针对不同的配置,在其中一套监控管理系统不在位或出现故障时,备用监控管理系统启用,对整个服务器系统的实时监控;在正常状态下,主BMC实时监控服务器系统状态,从BMC通过SMBUS和UART读到服务器系统状态;当主BMC不在位或出现故障时,服务器系统的SMBUS切换到从BMC,从BMC对服务器系统进行实时监控。
 本发明的一种基于Brickland的冗余监控管理系统及方法和现有技术相比具有的有益效果是:通过本发明,在整个服务器系统中配置两套相对独立的监控管理系统,其中一套监控管理系统出现故障时,可以自动及时切换到备用监控管理系统,可以提高服务器系统监控管理的稳定性,保证监控管理的可靠性。并且该冗余监控管理系统设计新颖、结构简单、容易实现,因此本发明提高了服务器系统的监控管理水平,提高了服务器系统的稳定性,具有较好的推广使用价值。
附图说明
附图1为所述冗余监控管理系统的结构框图;
      附图2为主BMC正常工作时连接示意图;
      附图3 为主BMC故障时连接示意图。
具体实施方式
下面结合具体实施例和附图,对本发明所述一种基于Brickland的冗余监控管理系统及方法的特点和设计内容,作进一步详细说明。
本发明所述基于Brickland的冗余监控管理系统及方法, 是在Brickland平台8路服务器系统中,搭配两套监控管理系统,针对不同的配置,在其中一套监控管理系统不在位或出现故障时,备用监控管理系统启用,实现对整个系统的实时监控,提高服务器系统的稳定性。本发明设计中所基于的Brickland:即‘Brickland’的服务器平台,是由Intel Xeon系列的Ivy Bridge制品处理器与C602J服务器芯片组组成平台代号‘Brickland’的服务器平台。
本发明所述基于Brickland的冗余监控管理系统,其组成部分主要包括服务器系统(System)、Switch和两个独立的BMC管理系统(主BMC及从BMC),其中,服务器系统的SYSSMBUS通过Switch分别连接到这两个BMC管理系统上,并且这两个管理系统通过单独的一组SMBUS和一组UART做心跳,实时通信;在正常状态下,主BMC实时监控服务器状态,从BMC可以通过SMBUS和UART读到服务器状态,主BMC及从BMC均能实时监控到服务器健康状况,当主BMC不在位或出现故障时,服务器系统的SMBUS切换到从BMC,通过从BMC来实现对服务器系统的实时监控。
实施例:
本实施例所述基于Brickland的冗余监控管理系统,如附图1所示,该冗余监控管理系统的组成部分主要包括服务器系统(System)、Switch(转换器,一种物理电子开关)、主BMC(Master BMC)和从BMC(Slave BMC),其中,服务器系统通过SYSSMBUS与Switch连接,Switch通过Master SMBUS与主BMC连接,Switch通过Slave SMBUS与从BMC连接,即服务器系统的SYSSMBUS通过 Switch分别连接到主BMC和从 BMC两个管理系统,两个管理系统通过 SYNC SMBUS和SYNC UART做心跳同步。其中,SYSSMBUS表示指服务器系统的系统管理总线,Master SMBUS表示对应主BMC的系统管理总线,Slave SMBUS表示对应从BMC的系统管理总线,SYNC SMBUS表示时钟同步系统管理总线,SYNC UART表示时钟同步异步串行通信口。
正常状态下,服务器系统的SYS SMBUS连接到Master SBMUS,通过主BMC来监控服务器系统,即主BMC实时监控服务器状态,从 BMC可以通过SYNC SMBUS和SYNC UART从主BMC读到服务器系统监控信息,如图2。这样在正常状态下,通过本实施例所述基于Brickland的冗余监控管理方法,主从BMC两个管理系统均能实时监控到服务器健康状况。
当主BMC不在位或出现故障时,从BMC发现主BMC出现故障向Switch发送CTRL信号,服务器系统的SYS SMBUS通过Switch切换连接到Slave SMBUS,从BMC对服务器系统进行实时监控,如图3;即当主BMC不能监控服务器系统状态时,从 BMC通过CTRL信号将SYS SMBUS切换到Slave SMBUS,进而主BMC与服务器系统交互通信,由从BMC来监控服务器系统。可见,通过本实施例所述基于Brickland的冗余监控管理方法,搭配两套监控管理系统,针对不同的配置,在其中一套监控管理系统不在位或出现故障时,备用管理系统启用,实现对整个服务器系统的实时监控,提高了服务器系统的稳定性。
上述具体实施方式仅是本发明的具体个案,本发明的专利保护范围包括但不限于上述具体实施方式,任何符合本发明的权利要求书的且任何所属技术领域的普通技术人员对其所做的适当变化或替换,皆应落入本发明的专利保护范围。

Claims (6)

1.一种基于Brickland的冗余监控管理系统,其特征在于,其组成部分包括服务器系统、Switch、主BMC及从BMC,其中,服务器系统的SYSSMBUS通过Switch分别连接到主BMC及从BMC上,并且主BMC及从BMC之间通过单独的一组SMBUS和一组UART做心跳实时通信。
2.根据权利要求1所述的一种基于Brickland的冗余监控管理系统,其特征在于,所述服务器系统通过SYSSMBUS与Switch连接,Switch通过Master SMBUS与主BMC连接,Switch通过Slave SMBUS与从BMC连接。
3.根据权利要求2所述的一种基于Brickland的冗余监控管理系统,其特征在于,所述主BMC和从 BMC两个管理系统通过 SYNC SMBUS和SYNC UART做心跳同步。
4.一种基于Brickland的冗余监控管理方法,其特征在于,搭配两套监控管理系统,针对不同的配置,在其中一套监控管理系统不在位或出现故障时,备用监控管理系统启用,对整个服务器系统的实时监控;在正常状态下,主BMC实时监控服务器系统状态,从BMC通过SMBUS和UART读到服务器系统状态;当主BMC不在位或出现故障时,服务器系统的SMBUS切换到从BMC,从BMC对服务器系统进行实时监控。
5.根据权利要求4所述的一种基于Brickland的冗余监控管理方法,其特征在于,正常状态下,服务器系统的SYS SMBUS连接到主SBMUS,通过主BMC来监控服务器系统,从 BMC通过SYNC SMBUS和SYNC UART从主BMC读到服务器系统监控信息。
6.根据权利要求5所述的一种基于Brickland的冗余监控管理方法,其特征在于,当主BMC不在位或出现故障时,从BMC发现主BMC出现故障向Switch发送CTRL信号,服务器系统的SYSSMBUS通过Switch切换连接到从SMBUS,从BMC对服务器系统进行实时监控。
CN201410511238.0A 2014-09-29 2014-09-29 一种基于Brickland的冗余监控管理系统及方法 Pending CN104317677A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410511238.0A CN104317677A (zh) 2014-09-29 2014-09-29 一种基于Brickland的冗余监控管理系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410511238.0A CN104317677A (zh) 2014-09-29 2014-09-29 一种基于Brickland的冗余监控管理系统及方法

Publications (1)

Publication Number Publication Date
CN104317677A true CN104317677A (zh) 2015-01-28

Family

ID=52372912

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410511238.0A Pending CN104317677A (zh) 2014-09-29 2014-09-29 一种基于Brickland的冗余监控管理系统及方法

Country Status (1)

Country Link
CN (1) CN104317677A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107315369A (zh) * 2017-07-12 2017-11-03 郑州云海信息技术有限公司 一种bmc芯片智能协处理装置及处理方法
CN107632907A (zh) * 2017-08-07 2018-01-26 郑州云海信息技术有限公司 一种bmc芯片托管系统及其控制方法
CN107943623A (zh) * 2017-12-13 2018-04-20 郑州云海信息技术有限公司 一种存储系统
CN110321265A (zh) * 2019-05-09 2019-10-11 苏州浪潮智能科技有限公司 一种服务器监控管理装置、方法及系统
CN111737037A (zh) * 2020-06-12 2020-10-02 浪潮(北京)电子信息产业有限公司 基板管理控制方法、主从异构bmc控制系统及存储介质
CN112380083A (zh) * 2020-10-23 2021-02-19 浪潮电子信息产业股份有限公司 一种bmc主备切换稳定性测试方法和系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN201153943Y (zh) * 2008-02-19 2008-11-26 浪潮电子信息产业股份有限公司 一种多心跳信号双控存储控制器
WO2009097729A1 (zh) * 2008-02-04 2009-08-13 Nanjing University Of Science And Technology 高可靠性分布式以太网测控系统
CN202004776U (zh) * 2011-01-07 2011-10-05 北京捷世伟业电子科技有限公司 冗余热切换系统
CN103885860A (zh) * 2014-03-21 2014-06-25 浪潮集团有限公司 一种应用ipmi命令实现bmc双管理热冗余的方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009097729A1 (zh) * 2008-02-04 2009-08-13 Nanjing University Of Science And Technology 高可靠性分布式以太网测控系统
CN201153943Y (zh) * 2008-02-19 2008-11-26 浪潮电子信息产业股份有限公司 一种多心跳信号双控存储控制器
CN202004776U (zh) * 2011-01-07 2011-10-05 北京捷世伟业电子科技有限公司 冗余热切换系统
CN103885860A (zh) * 2014-03-21 2014-06-25 浪潮集团有限公司 一种应用ipmi命令实现bmc双管理热冗余的方法

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107315369A (zh) * 2017-07-12 2017-11-03 郑州云海信息技术有限公司 一种bmc芯片智能协处理装置及处理方法
CN107315369B (zh) * 2017-07-12 2019-12-17 苏州浪潮智能科技有限公司 一种bmc芯片智能协处理装置
CN107632907A (zh) * 2017-08-07 2018-01-26 郑州云海信息技术有限公司 一种bmc芯片托管系统及其控制方法
CN107943623A (zh) * 2017-12-13 2018-04-20 郑州云海信息技术有限公司 一种存储系统
CN110321265A (zh) * 2019-05-09 2019-10-11 苏州浪潮智能科技有限公司 一种服务器监控管理装置、方法及系统
CN111737037A (zh) * 2020-06-12 2020-10-02 浪潮(北京)电子信息产业有限公司 基板管理控制方法、主从异构bmc控制系统及存储介质
CN112380083A (zh) * 2020-10-23 2021-02-19 浪潮电子信息产业股份有限公司 一种bmc主备切换稳定性测试方法和系统
CN112380083B (zh) * 2020-10-23 2023-01-06 浪潮电子信息产业股份有限公司 一种bmc主备切换稳定性测试方法和系统

Similar Documents

Publication Publication Date Title
CN104317677A (zh) 一种基于Brickland的冗余监控管理系统及方法
CN102622279B (zh) 冗余控制系统、方法及管理控制器
US9600370B2 (en) Server system
CN103488551B (zh) 冗余路径功率子系统及其操作方法
CN104102559B (zh) 一种基于冗余心跳链路和对端重启链路的双控制器存储系统
CN103441863A (zh) 一种空管自动化系统中的双服务器热备系统及控制方法
CN104424048A (zh) 用于数据存储的方法和装置
CN102331959A (zh) 伺服器系统
CN102768561B (zh) 一种双桥片主板冗余的设计方法
CN108009115A (zh) 一种具有时钟冗余功能的双节点服务器板卡
CN104503947B (zh) 多路服务器及其信号处理方法
CN104104725A (zh) 一种应用于云计算的分层异构结构的服务器管理系统
US20150318719A1 (en) Charging method and electronic device
CN205485799U (zh) 一种可复用sas、sata信号的硬盘背板
CN105098854B (zh) 充电方法与电子装置
CN203930813U (zh) 一种基于龙芯平台的can总线冗余通信系统
CN102638369B (zh) 一种主备倒换的仲裁方法、装置和系统
CN203876779U (zh) 一种基于dtmf通信的64d闭塞机
CN105652780B (zh) 一种智能立体车库控制系统及方法
CN104391546A (zh) 一种弹性架构配置可变云服务器系统架构
CN204832891U (zh) 高性能多用途处理器卡
CN202838091U (zh) 一种支持sr5690冗余设计的双桥片主板
CN103051407A (zh) 时钟保护方法、系统和相关普通时钟设备
CN202711239U (zh) 一种计算机系统
CN105718231A (zh) 一种刀片式服务器kvm冗余管理系统及管理方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20150128