CN104125312A - 刀片服务器中实现冗余管理模块共用一个ip地址的方法 - Google Patents

刀片服务器中实现冗余管理模块共用一个ip地址的方法 Download PDF

Info

Publication number
CN104125312A
CN104125312A CN201410327044.5A CN201410327044A CN104125312A CN 104125312 A CN104125312 A CN 104125312A CN 201410327044 A CN201410327044 A CN 201410327044A CN 104125312 A CN104125312 A CN 104125312A
Authority
CN
China
Prior art keywords
module
management
blade server
management module
main management
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410327044.5A
Other languages
English (en)
Inventor
刘强
金长新
张雁鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Group Co Ltd
Original Assignee
Inspur Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Group Co Ltd filed Critical Inspur Group Co Ltd
Priority to CN201410327044.5A priority Critical patent/CN104125312A/zh
Publication of CN104125312A publication Critical patent/CN104125312A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Hardware Redundancy (AREA)

Abstract

本发明公开了一种刀片服务器中实现冗余管理模块共用一个IP地址的方法,属于刀片服务器系统中IP地址管理方法,刀片服务器中设置有主管理模块与从管理模块两个冗余管理模块,主管理模块与从管理模块的管理网口设置为相同的IP地址,主管理模块与从管理模块之间互通心跳信息;当主管理模块或从管理模块检测到对方正常工作时,则关闭自身的管理网口,当主管理模块或从管理模块检测到对方宕机后,则开启自身的管理网口;即主管理模块或从管理模块只有一个管理网口开启供刀片服务器登陆管理。本发明实现主从冗余管理模块共用一个IP地址进行管理,当一个管理模块宕机后,无需更改IP地址客户端即可继续进行刀片服务器整机管理工作。

Description

刀片服务器中实现冗余管理模块共用一个IP地址的方法
 
技术领域
本发明涉及一种刀片服务器系统中IP地址管理方法,具体地说是一种刀片服务器中实现冗余管理模块共用一个IP地址的方法。
背景技术
刀片服务器是指在标准高度的机架式机箱内可插装多个卡式的服务器单元,实现高可用和高密度。每一块"刀片"实际上就是一块系统主板。它们可以通过"板载"硬盘启动自己的操作系统,如Windows NT/2000、Linux等,类似于一个个独立的服务器,它们可以通过本地硬盘启动自己的操作系统。在这种模式下,每一块母板运行自己的系统,服务于指定的不同用户群。
随着科技的发展,刀片服务器作为一种高密度服务器在企业机房及数据中心中应用日益广泛,刀片服务器中一个重要特点就是整机中会拥有冗余管理模块,能实现对整机冗余管理。
常用的刀片服务器中主从冗余管理模块管理网口都连入系统局域网,并且主从管理模块管理网口IP地址是在不同网段的,这样当一个管理模块宕机后,需要记住另外一个管理模块IP地址,重新设置管理主机IP网段并登陆另外一个管理模块IP地址对整机进行管理。操作比较复杂,且容易出错。
发明内容
本发明的技术任务是提供一种实现主从冗余管理模块共用一个IP地址进行管理,当一个管理模块宕机后,无需更改IP地址客户端即可继续进行刀片服务器整机管理工作的刀片服务器中实现冗余管理模块共用一个IP地址的方法。
本发明的技术任务是按以下方式实现的,刀片服务器中实现冗余管理模块共用一个IP地址的方法,刀片服务器中设置有主管理模块与从管理模块两个冗余管理模块,主管理模块与从管理模块的管理网口设置为相同的IP地址,主管理模块与从管理模块之间互通心跳信息;当主管理模块或从管理模块检测到对方正常工作时,则关闭自身的管理网口,当主管理模块或从管理模块检测到对方宕机后,则开启自身的管理网口;即主管理模块或从管理模块只有一个管理网口开启供刀片服务器登陆管理。
刀片服务器中实现冗余管理模块共用一个IP地址的方法,包括如下步骤:
(1)、刀片服务器整机中主管理模块与从管理模块背板上通过GPIO上下位设置不同ID,来让管理模块自己识别出自己是主管理模块还是从管理模块;
(2)、主管理模块与从管理模块之间互通心跳信息;
(3)、刀片服务器整机加电启动后,主管理模块与从管理模块的管理网口设置为相同的IP地址;
(4)、启动后从管理模块通过心跳检测到主管理模块在工作后,关闭自身的管理网口; 
(5)、当主管理模块宕机后,从管理模块通过心跳检测发现主管理模块已经不工作了,则重新打开自身管理网口,供客户端登陆从管理模块;
(6)、若主管理模块重新恢复正常,则从管理模块检测到主管理模块正常工作后,再次关闭自己管理网口,客户端登录主管理模块管理界面对刀片服务器整机管理。
刀片服务器中实现冗余管理模块共用一个IP地址的方法,包括如下步骤:
(1)、刀片服务器整机中主管理模块与从管理模块背板上通过GPIO上下位设置不同ID,来让管理模块自己识别出自己是主管理模块还是从管理模块;
(2)、主管理模块与从管理模块之间互通心跳信息;
(3)、刀片服务器整机加电启动后,主管理模块与从管理模块的管理网口的IP地址均设置为192.168.0.100;
(4)、启动后从管理模块通过心跳检测到主管理模块在工作后,关闭自身的管理网口; 刀片服务器系统的局域网内只有主管理模块的192.168.0.100管理网口在工作,客户端登录这个IP地址从而登录刀片服务器管理界面对整机进行管理;
(5)、当主管理模块宕机后,主管理模块的管理网口192.168.0.100则失效,从管理模块通过心跳检测发现主管理模块已经不工作了,则打从管理模块的管理网口,刀片服务器系统的局域网内只有从管理模块的192.168.0.100管理网口在工作,供客户端登陆刀片服务器从管理模块管理界面对整机进行管理;
(6)、若主管理模块重新恢复正常,主管理模块的管理网口192.168.0.100恢复正常,则从管理模块检测到主管理模块正常工作后,再次关闭自己管理网口,客户端登录主管理模块管理界面对刀片服务器整机管理。
主管理模块与从管理模块之间互通心跳信息,即主管理模块与从管理模块之间通过周期性发送信息,判断对方是否工作正常。
互通心跳信息指主管理模块与从管理模块之间通过周期性发送信息,互相判断对方的健康状况,判断对方是否“存活”。如果在指定的时间内仍没有收到对方的心跳信息,就可以怀疑发生故障,再仔细检查确认故障是否发生,确认故障后就要采取必要的措施。
本发明的刀片服务器中实现冗余管理模块共用一个IP地址的方法具有以下优点:
1、对客户端而言,只需要登录同一个IP地址,无论是主管理模块在工作还是从管理模块在工作,都能登录进管理界面,对刀片服务器进行管理,而无需去记录从管理模块IP地址,也无需重新设计客户管理机器网卡IP地址网段;
2、从管理模块通过心跳检测到主管理模块在工作后,就关闭自身的管理网口;这样虽然主管理模块与从管理模块的管理网口IP地址相同,但是从管理模块管理网口已经关闭,不会对主管理模块产生影响;
3、简化用户操作步骤,方便用户进行管理操作。
附图说明
 下面结合附图对本发明进一步说明。
附图1为刀片服务器中实现冗余管理模块共用一个IP地址的方法的流程框图;
  附图2为刀片服务器中实现冗余管理模块共用一个IP地址的方法的实施例3的流程图。
具体实施方式
参照说明书附图和具体实施例对本发明的刀片服务器中实现冗余管理模块共用一个IP地址的方法作以下详细地说明。
实施例1:
本发明的刀片服务器中实现冗余管理模块共用一个IP地址的方法, 刀片服务器中实现冗余管理模块共用一个IP地址的方法,刀片服务器中设置有主管理模块与从管理模块两个冗余管理模块,主管理模块与从管理模块的管理网口设置为相同的IP地址,主管理模块与从管理模块之间互通心跳信息;当主管理模块或从管理模块检测到对方正常工作时,则关闭自身的管理网口,当主管理模块或从管理模块检测到对方宕机后,则开启自身的管理网口;即主管理模块或从管理模块只有一个管理网口开启供刀片服务器登陆管理。
刀片服务器系统中主从冗余管理模块间通过心跳进行通信,判断对方是否在工作,默认情况下主管理槽位上的主管理模块工作,从管理模块作为热备,为避免在同一局域网内相同IP地址产生冲突,从管理模块在启动后通过心跳知道主管理模块在工作中就将自己管理网口关闭,这样虽然主从管理模块管理IP地址相同,但是因从管理模块管理网口已经关闭,所以不会对主管理模块产生影响。当主管理模块宕机后,从管理模块通过心跳信息获得主管理模块已经失效后,将从管理模块管理网口打开,客户端就可以通过登录同一个IP地址登录从管理模块进行刀片服务器整机管理。同理,当更换主管理模块后,从管理模块通过心跳判断主管理模块在工作后,会关闭自己管理网口,当检测到主管理模块宕机后,重新打开自己管理网口,这样客户端无论是主管理模块工作还是从管理模块工作,只需要登录同一个IP地址就可以对整机进行管理。
实施例2:
如图1所示,本发明的刀片服务器中实现冗余管理模块共用一个IP地址的方法,包括如下步骤:
(1)、刀片服务器整机中主管理模块与从管理模块背板上通过GPIO上下位设置不同ID,来让管理模块自己识别出自己是主管理模块还是从管理模块;
(2)、主管理模块与从管理模块之间互通心跳信息;
(3)、刀片服务器整机加电启动后,主管理模块与从管理模块的管理网口设置为相同的IP地址;
(4)、启动后从管理模块通过心跳检测到主管理模块在工作后,关闭自身的管理网口; 
(5)、当主管理模块宕机后,从管理模块通过心跳检测发现主管理模块已经不工作了,则重新打开自身管理网口,供客户端登陆从管理模块;
(6)、若主管理模块重新恢复正常,则从管理模块检测到主管理模块正常工作后,再次关闭自己管理网口,客户端登录主管理模块管理界面对刀片服务器整机管理。
主管理模块与从管理模块之间互通心跳信息,即主管理模块与从管理模块之间通过周期性发送信息,判断对方是否工作正常。
实施例3:
如图2所示,本发明的刀片服务器中实现冗余管理模块共用一个IP地址的方法,包括如下步骤:
(1)、刀片服务器整机中主管理模块与从管理模块背板上通过GPIO上下位设置不同ID,来让管理模块自己识别出自己是主管理模块还是从管理模块;
(2)、主管理模块与从管理模块之间互通心跳信息;
(3)、刀片服务器整机加电启动后,主管理模块与从管理模块的管理网口的IP地址均设置为192.168.0.100;
(4)、启动后从管理模块通过心跳检测到主管理模块在工作后,关闭自身的管理网口; 刀片服务器系统的局域网内只有主管理模块的192.168.0.100管理网口在工作,客户端登录这个IP地址从而登录刀片服务器管理界面对整机进行管理;
(5)、当主管理模块宕机后,主管理模块的管理网口192.168.0.100则失效,从管理模块通过心跳检测发现主管理模块已经不工作了,则打从管理模块的管理网口,刀片服务器系统的局域网内只有从管理模块的192.168.0.100管理网口在工作,供客户端登陆刀片服务器从管理模块管理界面对整机进行管理;
(6)、若主管理模块重新恢复正常,主管理模块的管理网口192.168.0.100恢复正常,则从管理模块检测到主管理模块正常工作后,再次关闭自己管理网口,客户端登录主管理模块管理界面对刀片服务器整机管理。
主管理模块与从管理模块之间互通心跳信息,即主管理模块与从管理模块之间通过周期性发送信息,判断对方是否工作正常。
上述具体实施方式仅是本发明的具体个案,本发明的专利保护范围包括但不限于上述具体实施方式,任何符合本发明的刀片服务器中实现冗余管理模块共用一个IP地址的方法的权利要求书的且任何所属技术领域的普通技术人员对其所做的适当变化或替换,皆应落入本发明的专利保护范围。

Claims (4)

1.刀片服务器中实现冗余管理模块共用一个IP地址的方法,其特征在于刀片服务器中设置有主管理模块与从管理模块两个冗余管理模块,主管理模块与从管理模块的管理网口设置为相同的IP地址,主管理模块与从管理模块之间互通心跳信息;当主管理模块或从管理模块检测到对方正常工作时,则关闭自身的管理网口,当主管理模块或从管理模块检测到对方宕机后,则开启自身的管理网口;即主管理模块或从管理模块只有一个管理网口开启供刀片服务器登陆管理。
2.根据权利要求1所述的刀片服务器中实现冗余管理模块共用一个IP地址的方法,其特征在于包括如下步骤:
(1)、刀片服务器整机中主管理模块与从管理模块背板上通过GPIO上下位设置不同ID,来让管理模块自己识别出自己是主管理模块还是从管理模块;
(2)、主管理模块与从管理模块之间互通心跳信息;
(3)、刀片服务器整机加电启动后,主管理模块与从管理模块的管理网口设置为相同的IP地址;
(4)、启动后从管理模块通过心跳检测到主管理模块在工作后,关闭自身的管理网口; 
(5)、当主管理模块宕机后,从管理模块通过心跳检测发现主管理模块已经不工作了,则重新打开自身管理网口,供客户端登陆从管理模块;
(6)、若主管理模块重新恢复正常,则从管理模块检测到主管理模块正常工作后,再次关闭自己管理网口,客户端登录主管理模块管理界面对刀片服务器整机管理。
3.根据权利要求1所述的刀片服务器中实现冗余管理模块共用一个IP地址的方法,其特征在于包括如下步骤:
(1)、刀片服务器整机中主管理模块与从管理模块背板上通过GPIO上下位设置不同ID,来让管理模块自己识别出自己是主管理模块还是从管理模块;
(2)、主管理模块与从管理模块之间互通心跳信息;
(3)、刀片服务器整机加电启动后,主管理模块与从管理模块的管理网口的IP地址均设置为192.168.0.100;
(4)、启动后从管理模块通过心跳检测到主管理模块在工作后,关闭自身的管理网口; 刀片服务器系统的局域网内只有主管理模块的192.168.0.100管理网口在工作,客户端登录这个IP地址从而登录刀片服务器管理界面对整机进行管理;
(5)、当主管理模块宕机后,主管理模块的管理网口192.168.0.100则失效,从管理模块通过心跳检测发现主管理模块已经不工作了,则打从管理模块的管理网口,刀片服务器系统的局域网内只有从管理模块的192.168.0.100管理网口在工作,供客户端登陆刀片服务器从管理模块管理界面对整机进行管理;
(6)、若主管理模块重新恢复正常,主管理模块的管理网口192.168.0.100恢复正常,则从管理模块检测到主管理模块正常工作后,再次关闭自己管理网口,客户端登录主管理模块管理界面对刀片服务器整机管理。
4.根据权利要求1所述的刀片服务器中实现冗余管理模块共用一个IP地址的方法,其特征在于主管理模块与从管理模块之间互通心跳信息,即主管理模块与从管理模块之间通过周期性发送信息,判断对方是否工作正常。
CN201410327044.5A 2014-07-10 2014-07-10 刀片服务器中实现冗余管理模块共用一个ip地址的方法 Pending CN104125312A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410327044.5A CN104125312A (zh) 2014-07-10 2014-07-10 刀片服务器中实现冗余管理模块共用一个ip地址的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410327044.5A CN104125312A (zh) 2014-07-10 2014-07-10 刀片服务器中实现冗余管理模块共用一个ip地址的方法

Publications (1)

Publication Number Publication Date
CN104125312A true CN104125312A (zh) 2014-10-29

Family

ID=51770576

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410327044.5A Pending CN104125312A (zh) 2014-07-10 2014-07-10 刀片服务器中实现冗余管理模块共用一个ip地址的方法

Country Status (1)

Country Link
CN (1) CN104125312A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104378243A (zh) * 2014-12-05 2015-02-25 浪潮集团有限公司 一种多模式、高可用刀片服务器冗余管理系统构建方法
CN106941529A (zh) * 2017-03-21 2017-07-11 许继电气股份有限公司 一种直流输电监控系统及容灾实现方法
CN108628412A (zh) * 2017-11-30 2018-10-09 英业达科技有限公司 刀锋服务器
CN109254882A (zh) * 2018-09-28 2019-01-22 山东超越数控电子股份有限公司 一种刀片服务器分布式smc管理的实现方法
CN109818797A (zh) * 2019-02-12 2019-05-28 山东超越数控电子股份有限公司 一种刀片服务器smc管理中日志管理方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1525703A (zh) * 2003-02-26 2004-09-01 ��Ϊ�������޹�˾ 对连接因特网协议网络的以太网口进行备份的方法
CN103002065A (zh) * 2012-12-14 2013-03-27 大唐移动通信设备有限公司 一种主用设备与备用设备共用ip地址的方法和装置
US20130121143A1 (en) * 2005-01-18 2013-05-16 Airwalk Communications, Inc. Combined base transceiver station and base station controller data call and quality of service
CN103346923A (zh) * 2013-07-30 2013-10-09 曙光信息产业(北京)有限公司 双机负载均衡设备的管理方法和装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1525703A (zh) * 2003-02-26 2004-09-01 ��Ϊ�������޹�˾ 对连接因特网协议网络的以太网口进行备份的方法
US20130121143A1 (en) * 2005-01-18 2013-05-16 Airwalk Communications, Inc. Combined base transceiver station and base station controller data call and quality of service
CN103002065A (zh) * 2012-12-14 2013-03-27 大唐移动通信设备有限公司 一种主用设备与备用设备共用ip地址的方法和装置
CN103346923A (zh) * 2013-07-30 2013-10-09 曙光信息产业(北京)有限公司 双机负载均衡设备的管理方法和装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104378243A (zh) * 2014-12-05 2015-02-25 浪潮集团有限公司 一种多模式、高可用刀片服务器冗余管理系统构建方法
CN106941529A (zh) * 2017-03-21 2017-07-11 许继电气股份有限公司 一种直流输电监控系统及容灾实现方法
CN108628412A (zh) * 2017-11-30 2018-10-09 英业达科技有限公司 刀锋服务器
CN109254882A (zh) * 2018-09-28 2019-01-22 山东超越数控电子股份有限公司 一种刀片服务器分布式smc管理的实现方法
CN109818797A (zh) * 2019-02-12 2019-05-28 山东超越数控电子股份有限公司 一种刀片服务器smc管理中日志管理方法及系统

Similar Documents

Publication Publication Date Title
CN104125312A (zh) 刀片服务器中实现冗余管理模块共用一个ip地址的方法
US6594775B1 (en) Fault handling monitor transparently using multiple technologies for fault handling in a multiple hierarchal/peer domain file server with domain centered, cross domain cooperative fault handling mechanisms
CN105718785A (zh) 用于免认证组态的计算机实施方式与系统
US8150953B2 (en) Information handling system employing unified management bus
DE10124514A1 (de) Fehlertolerante, gemeinsam genutzte Systemressource mit einem Hochverfügbarkeitskommunikationen bereitstellenden Kommunikationsdurchgang
US7787482B2 (en) Independent drive enclosure blades in a blade server system with low cost high speed switch modules
CN103608794A (zh) 通过移动计算设备远程交付被管usb服务的方法和装置
DE10124482A1 (de) Fehlertolerante Systemressource mit niedriger Latenzzeit, mit übergeordneter Protokollierung von Systemressourcentransaktionen und serverübergreifend gespiegelter Protokollierung von übergeordneten Systemressourcentransaktionen
CN102132252A (zh) 用于虚拟基础设施的集中式控制平面器具
CN106936616A (zh) 备份通信方法和装置
CN102546813A (zh) 一种基于x86 PC架构的高性能集群计算系统
JP7316390B2 (ja) ソフトウェア定義ネットワークにおける切断されたノードのピア発見プロセス
US20090303884A1 (en) Monitoring system, monitoring device, monitored device, and monitoring method
EP3588856A1 (en) Technologies for hot-swapping a legacy appliance with a network functions virtualization appliance
CN109407990A (zh) 一种固态硬盘
CN102611560A (zh) 夹层卡、服务器及服务器系统
CN102346707A (zh) 服务器系统与其操作方法
JP2003132038A5 (zh)
EP2307952A1 (en) Using metadata analysis for monitoring, alerting, and remediation
CN106302117A (zh) 消息传输系统、方法和装置
US7765331B2 (en) Integrated RAID controller and SAS switch
CN106814976A (zh) 集群存储系统及应用其的数据交互方法
CN108599978B (zh) 一种云监控方法和装置
US9826043B2 (en) Method to protect storage systems from discontinuity due to device misconfiguration
US20100034117A1 (en) Parallel vlan and non-vlan device configuration

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20141029

WD01 Invention patent application deemed withdrawn after publication