CN100481004C - 用于重启集群的方法、系统和装置 - Google Patents

用于重启集群的方法、系统和装置 Download PDF

Info

Publication number
CN100481004C
CN100481004C CNB2004800176357A CN200480017635A CN100481004C CN 100481004 C CN100481004 C CN 100481004C CN B2004800176357 A CNB2004800176357 A CN B2004800176357A CN 200480017635 A CN200480017635 A CN 200480017635A CN 100481004 C CN100481004 C CN 100481004C
Authority
CN
China
Prior art keywords
cluster
cluster member
restarting
restarted
reboot
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
CNB2004800176357A
Other languages
English (en)
Other versions
CN1864134A (zh
Inventor
阿加伊·米塔尔
劳拉·许
斯里坎斯·科内鲁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nokia Solutions and Networks Oy
Original Assignee
Nokia Siemens Networks Oy
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nokia Siemens Networks Oy filed Critical Nokia Siemens Networks Oy
Publication of CN1864134A publication Critical patent/CN1864134A/zh
Application granted granted Critical
Publication of CN100481004C publication Critical patent/CN100481004C/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/16Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
    • G06F15/177Initialisation or configuration control
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1415Saving, restoring, recovering or retrying at system level
    • G06F11/1441Resetting or repowering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/40Transformation of program code
    • G06F8/54Link editing before load time
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/4401Bootstrapping
    • G06F9/4405Initialisation of multiprocessor systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/28Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Computer Security & Cryptography (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Quality & Reliability (AREA)
  • Multimedia (AREA)
  • Stored Programmes (AREA)
  • Retry When Errors Occur (AREA)

Abstract

本发明旨在维持集群运行的同时重启集群。由于至少一个集群成员在处理过程中保持活动,因此集群运行可以在重启过程中自动维持。管理员触发重启处理,然后在重启处理过程中不需要执行任何其它步骤。执行一种在不同时间重启集群成员而同时总能维持至少一个集群成员运行的算法。

Description

用于重启集群的方法、系统和装置
背景技术
提供高度可靠性的设备是提供因特网和内联网服务的机构的主要考虑。为了帮助满足这种需求,将几个设备组合成可配置成充当单个设备的集群的技术已经变得可用了。利用集群布置,其意图是一个设备的失败不会显著影响到集群内其余的组件。
启动设备上软件的术语是“booting(启动)”(“bootstrapping”的缩写);当在活动的设备上执行启动时,术语是“rebooting(重启)”。重启通常因为多种原因而执行,包括:激活软件的新版本;及在软件中阻止设备运行的致命错误后恢复设备的功能性。
在集群环境中,由于集群功能性的维护是至关重要的,因此设备的重启需要特定的考虑。但是,重启集群可能会干扰其运行。所需要的是一种重启集群成员使集群运行可以维持的方式。
发明内容
本发明旨在在维持集群运行的同时重启集群。
根据本发明的一方面,集群运行在重启过程中自动维持。在集群重启处理的过程中,至少一个集群成员在其它成员重启的时候保持活动。
根据本发明的另一方面,如管理员的用户触发集群重启处理。管理员不必手动重启每个集群成员。相反,集群重启处理会处理成员的重启。
根据另一方面,执行一种在不同时间重启集群成员的算法。同时重启所有集群成员将导致集群的运行在至少一个成员恢复运行之前丢失。
附图说明
图1说明了示例集群重启环境;
图2说明了可以使用的示例计算设备;
图3示出了集群的示例体系结构;
图4说明了RMB的组件;及
图5示出了根据本发明各方面重启集群的处理。
具体实施方式
在以下本发明示例实施方式的具体描述中,参考构成本发明的一部分并且是作为说明示出的附图,及可以实践本发明的特定的示例实施方式。每种实施方式都描述得足够具体,以便使本领域技术人员能够实践本发明,而且应当理解其它实施方式也可以使用,而且在不背离本发明主旨或范围的前提下可以进行其它变化。因此,以下具体描述不应当从限制的意义上去理解,而且本发明的范围只能由所附权利要求定义。
除非上下文明确地另外指出,贯穿说明书与权利要求,以下术语都采用在此明确关联的意义。
术语“IP”的意思是任何类型的因特网协议。术语“节点”的意思是实现IP的设备。术语“路由器”的意思是转发未明确寻址到它自己的IP包的节点。术语“可路由地址”的意思是接口的标识符,使得包可以发送到由该地址标识的接口。术语“链路”的意思是通过其节点能够通信的通信工具或介质。术语“集群”的意思是配置成充当单个节点的一组节点。
以下缩写贯穿说明书与权利要求使用:RMB=远程管理代理;CS=配置子系统;CLI=命令行接口;CM=集群管理;GUI=图形用户接口;MAC=消息认证码;及NM=网络管理。
参考附图,贯穿视图,相同的编号指示相同的部件。此外,除非另外声明或与公开内容不一致,否则对单数的引用包括对复数的引用。
图1说明了根据本发明各方面的示例集群重启环境。如图所示,重启环境100包括管理计算机105和108、集群130、外部网络110、管理网络120、路由器125及内部网络145。集群130包括布置成充当单个节点的节点135。网络可以是耦合到有线或无线设备的有线或无线网络。
本发明旨在在维持集群运行的同时重启集群。至少一个集群成员在重启处理过程中保持活动。管理员触发重启处理,然后在重启处理过程中不需要执行任何其它步骤。执行一种可以在不同时间重启集群成员,同时总能维持至少一个集群成员运行的算法。
如所说明的,内部网络145是基于IP包的主干网,包括连接网络中支持节点的路由器,如路由器125。路由器是通信网络中加速消息传输的中间设备。当单个网络通过错综复杂的可能连接链接多台计算机时,路由器接收发送的消息并将它们通过可用路由转发到它们正确的目的地。在一组互连的LAN上,路由器充当LAN之间的链路,使得消息可以从一个LAN发送到另一个LAN,该组互连的LAN包括那些基于不同体系结构和协议的LAN。LAN内部的通信链路一般包括双绞线、光纤或同轴电缆,而网络间的通信链路可以使用模拟电话线、包括T1、T2、T3和T4的全部或部分专用数字线、综合业务数字网(ISDN)、数字用户线(DSL)、无线链路或其它通信链路。
管理计算机105通过通信介质耦合到管理网络120。管理计算机108通过通信介质耦合到内部网络145。管理计算机105和108既可以用于管理集群,如集群130,又可以触发集群的重启。
此外,计算机和其它相关的电子设备可以连接到网络110、网络120及网络145。公共因特网本身可以由大量这种互连的网络、计算机和路由器构成。IP网络100可以包括比图1所示多得多的组件。但是,所示出的组件足够公开用于实践本发明的说明性实施方式。
如上所述通信链路中用于发送信息的介质说明了一种类型的计算机可读介质,即通信介质。通常,计算机可读介质包括可以由计算设备访问的任何介质。通信介质一般包含计算机可读指令、数据结构、程序模块或如载波或其它传输机制的调制数据信号中的其它数据,并且包括任何信息传输介质。术语“调制数据信号”的意思是其一个或多个特征以编码信号中信息的方式设置或变化的信号。作为例子,通信介质包括如双绞线、同轴电缆、光纤、波导和其它有线介质的有线介质及如声波、射频、红外线和其它无线介质的无线介质。
图2说明了根据本发明各方面可以使用的示例计算设备。为了说明的目的,节点200仅仅示为具有通常可以在计算设备中找到的组件的子集。能够在本发明中工作的计算设备可以具有比图2所示更多、更少或不同的组件。节点200可以包括各种硬件组件。在非常基本的配置中,组件200一般包括中央处理单元202、系统存储器204和网络组件216。
依赖于计算设备确切的配置和类型,系统存储器204可以包括易失存储器、非易失存储器、数据存储设备等。系统存储器204的这些例子全部都被看作是计算机存储介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存存储器或其它存储器技术,CD-ROM、数字化视频光盘(DVD)或其它光学存储器,磁带、磁盘存储器或其它磁性存储设备,或者任何其它可以用于存储期望信息并且可以由节点200访问的介质。任何此类计算机存储介质都可以是节点200的一部分。
节点200可以包括用于接收输入的输入组件212。输入组件212可以包括键盘、触摸屏、鼠标或其它输入设备。输出组件214可以包括显示器、扬声器、打印机等。
节点200还可以包括用于与IP网络中其它设备通信的网络组件216。特别地,网络组件216使节点200能够与移动节点和对应节点通信。节点200可以配置成使用网络组件216从对应节点和移动节点接收包或向其发送包。通信可以是有线或无线的。
由网络组件216发送和接收的信号是通信介质的一种例子。如在此所使用的,术语计算机可读介质既包括存储介质,又包括通信介质。
节点200的软件组件一般存储在系统存储器204中。系统存储器204一般包括操作系统205、一个或多个应用程序206及数据207。如图所示,系统存储器204还可以包括集群重启程序208。程序208是用于执行与在此所述重启集群相关的操作的组件。程序208包括用于执行与集群重启相关的处理的计算机可执行指令。
图3示出了根据本发明各方面集群的示例体系结构。如图所示,集群300包括节点305、310和315;GUI 320、CLI 325、配置子系统335、340和345,及RMB 350。
GUI和CLI可以配置成显示集群内节点的视图。RMB 350在集群内的节点之间分发信息。
根据一种实施方式,GUI 305配置成在工作站(未示出)上执行,并与设备305的配置子系统325交互。GUI 320提供图形接口,来执行与设备305相关的操作。这些操作中的一种是执行集群的重启。CLI325提供允许用户通过在设备305上执行的应用程序在设备305上执行操作的命令行接口。与设备305关联的GUI和CLI还可以用于触发集群重启。
RMB 350配置成与集群内的设备305和其它设备(设备310及设备315)通信。RMB 350可以包括在设备305中,或者也可以独立于设备305。通常,RMB 305用于在集群成员之间交换信息。
根据一种实施方式,在重启处理过程中,系统获得集群的独占权限。这有助于防止多于一个用户或系统影响在重启过程中的设备。
根据一种实施方式,GUI 320实现为浏览器和Web服务器中的一组Web页面。服务器可以在集群内的设备或独立于集群的设备上运行。服务器可以在全部或部分集群成员上运行。
CLI 325是以文本向用户显示关于设备和集群的集群信息的管理CLI。
当启动重启处理时,RMB 350与要重启的设备的配置子系统交互。根据一种实施方式,当在对一个集群成员的重启过程中发生错误时,重启处理停止。根据一种实施方式,RMB 350可以配置成将设备恢复到重启处理开始之前的配置。这有助于确保所有集群成员都维持相同的属性。当发生问题时,RMB 350可以向GUI和CCLI指示有故障,或者向某个其它位置发送错误。当重启完成后,管理员可以执行其它操作。
重启动作是由应用程序中的控制利用图形用户接口(GUI)或命令行接口(CLI)外壳中的命令触发的。
控制或命令使执行集群重启处理的脚本运行。该脚本通过联系每个集群成员来启动重启,提供使每个成员能够暂时从集群中除去的属性,然后提供使重启操作开始的属性。然后,该脚本检测与设备的联系失败并试图重新建立联系。当脚本建立联系以后,它在内部指示设备现在重启了,并通知管理员哪个设备重启了。根据一种实施方式,启动重启处理的设备在所有其它设备重启之前不会重启。
除了启动重启处理的设备,对所有设备的重启可以顺序(每次一个设备)或并行执行。并行方法减少了将集群恢复到完全运行所需的总时间。
如果重启在任何设备上失败,如由重新建立与该设备联系失败所指示的,则重启处理中断,由此保存未重启的设备的状态。与失败设备的标识符一起,管理员得到集群重启已经过早停止的通知。
图4说明了根据本发明各方面RMB的组件。如图所说明的,RMB400包括RMB客户端420、配置子系统410、RMB服务器440及安全传输435。RMB客户端420包括集群API(应用编程接口)425和远程API430。集群API 425维护关于集群成员的信息。远程API430维护关于每个集群成员的信息并跟踪NM操作。安全传输435传输并接收执行如集群重启操作的NM操作和对消息执行完整性检查的消息。RMB服务器440布置成通过安全传输435与配置子系统410通信并与RMB客户端420通信。
远程管理系统400充当集群内节点的主干。RMB 400提供基础机制,包括:发现集群内的成员;向集群中的设备传输关于NM属性的查询与操作;确保消息的完整性;用于管理应用程序的接口;及与各设备本地配置子系统的接口。RMB 400还包括用于在集群内节点之间发送的消息中传输信息的安全机制。
为了确定集群成员,RMB 400还配置成自动查询节点是否耦合。这些查询是周期性执行的,以帮助确保所有集群成员在任何给定的时间都可用。
根据一种实施方式,RMB 400通过使用数据库事务来确保配置的一致性。例如,在属性要变化的任何时候开始事务,并且如果变化对所有设备成功则应用“提交”数据库操作,而当变化在任何设备失败时应用“回退”操作。RMB可以在内部或通过使用配置子系统的事务能力来实现这些事务。根据一种实施方式,由于这些操作可能是复杂操作,因此使用配置子系统的事务。
RMB客户端420利用集群API 425发现集群的成员设备。
RMB 400利用消息执行系统和NM操作。系统操作包括获得和释放配置锁。当消息要发送时,RMB填充消息头并传输消息。当消息被接收时,RMB检查消息头并且只有消息头域中的值有效时才接收消息。RMB丢弃任何其消息头域中有无效值的消息。
RMB客户端420构成RMB消息的主体并利用集群API425向集群成员传输消息;从成员接收响应;及从消息中提取操作结果。远程API 430向特定的集群成员传输消息并检查响应消息对每个发送出的请求消息是否都接收到了。安全传输435是真正发送和接收消息的传输机制。
RMB客户端可用实现为一组具有良好定义的应用编程接口(API)的共享对象库。CGUI和CCLI可以利用这些API与RMB交互,以执行NM操作。
RMB服务器可用实现为在系统启动时装入的端口监控程序。
RMB安全传输可用实现为安全套接字协议层(SSL)套接字。这通过提供加密RMB消息的能力提供了额外的安全层。
图5示出了根据本发明各方面重启集群的处理。在开始块后,处理500进行到块505,其中获得集群成员列表。集群成员列表用于帮助确保所有的集群成员都被重启。移动到决510,获得从其启动重启的成员的标识符。进行到块515,对除启动重启的成员之外的每个集群成员执行重启。根据一种实施方式,除启动成员以外的集群成员是并行重启的。例如,如果有5个集群成员,则5个成员中的4个是同时重启的。如上面所讨论的,成员可以任何顺序重启,只要至少有一个成员在其它成员重启过程中保持活动。移动到决定块520,确定在对除启动成员以外的成员进行集群重启过程中是否发生错误。当发生错误时,处理进行到块530,其中重启处理中断。转到块525,对启动集群重启的成员执行重启。移动到决定块530,确定在集群重启的任何步骤中是否发生错误。当发生错误时,处理进行到块530,其中重启处理中断。当没有错误时,处理进行到结束块并返回处理其它动作。
以上说明书、例子和数据提供了本发明的完整描述。由于在不背离本发明主旨与范围的前提下可以构造本发明的许多实施方式,因此本发明在于下文所附的权利要求。

Claims (16)

1、一种用于重启集群的方法,包括:
启动集群的重启;
确定集群成员;及
重启每个集群成员而同时至少一个集群成员在其它集群成员重启的时候保持活动,其中重启每个集群成员的步骤包括除去重启的集群成员并确定何时该除去的集群成员已重启。
2、如权利要求1所述的方法,还包括确定启动重启的启动集群成员并控制来自启动集群成员的重启。
3、如权利要求1所述的方法,其中重启每个集群成员而同时至少一个集群成员在其它集群成员重启的时候保持活动的步骤还包括并行重启除该至少一个保持活动的集群成员之外的集群成员。
4、如权利要求2所述的方法,其中该至少一个保持正常运行的集群成员是启动集群成员。
5、如权利要求1所述的方法,其中启动集群的重启的步骤是由用户执行的。
6、如权利要求1所述的方法,其中确定何时该除去的集群成员已重启的步骤还包括试图重新建立与该除去的集群成员的联系。
7、如权利要求1所述的方法,还包括当确定在重启处理过程中发生错误时中断重启处理。
8、一种在维持集群运行的同时重启集群的系统,包括:
网络接口,配置成与集群成员通信;
存储器,配置成存储关于该集群的信息;
远程管理代理,配置成向集群成员分发信息;及
处理器,配置成执行动作,动作包括:
启动集群的重启;
确定集群成员;及
重启每个集群成员,同时至少一个集群成员在其它集群成员重启的时候保持活动,其中重启每个集群成员的步骤包括除去重启的集群成员并确定何时该除去的集群成员已重启。
9、如权利要求8所述的系统,还包括确定启动重启的启动集群成员并控制来自启动集群成员的重启。
10、如权利要求8所述的系统,其中重启每个集群成员的步骤还包括并行重启除该至少一个保持活动的集群成员之外的每一集群成员。
11、如权利要求10所述的系统,其中该至少一个集群成员是启动集群成员。
12、如权利要求8所述的系统,还包括用于启动集群重启的用户接口。
13、如权利要求8所述的系统,其中确定何时该除去的集群成员已重启的步骤还包括试图重新建立与该除去的集群成员的联系。
14、如权利要求8所述的系统,还包括当确定在重启处理过程中发生错误时中断重启处理。
15、一种在维持集群运行的同时重启集群的装置,包括:
其上运行脚本以启动集群重启的装置;
用于确定集群成员的远程管理代理;及
用于重启每个集群成员而同时至少一个集群成员在其它集群成员重启的时候保持活动的脚本,其中用于重启每个集群成员的该脚本包括用于除去重启的集群成员的属性,该脚本确定何时该除去的集群成员已重启。
16、如权利要求15所述的装置,其中确定何时该除去的集群成员已重启的该脚本还包括用于试图重新建立与该除去的集群成员的联系的脚本。
CNB2004800176357A 2003-06-25 2004-06-10 用于重启集群的方法、系统和装置 Expired - Lifetime CN100481004C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/606,645 2003-06-25
US10/606,645 US7076645B2 (en) 2003-06-25 2003-06-25 Method of rebooting a multi-device cluster while maintaining cluster operation

Publications (2)

Publication Number Publication Date
CN1864134A CN1864134A (zh) 2006-11-15
CN100481004C true CN100481004C (zh) 2009-04-22

Family

ID=33540118

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2004800176357A Expired - Lifetime CN100481004C (zh) 2003-06-25 2004-06-10 用于重启集群的方法、系统和装置

Country Status (5)

Country Link
US (1) US7076645B2 (zh)
EP (1) EP1644828A4 (zh)
KR (1) KR100792280B1 (zh)
CN (1) CN100481004C (zh)
WO (1) WO2004114570A2 (zh)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6646953B1 (en) * 2000-07-06 2003-11-11 Rambus Inc. Single-clock, strobeless signaling system
US20040141461A1 (en) * 2003-01-22 2004-07-22 Zimmer Vincent J. Remote reset using a one-time pad
US7469279B1 (en) 2003-08-05 2008-12-23 Cisco Technology, Inc. Automatic re-provisioning of network elements to adapt to failures
US8812635B2 (en) 2003-12-14 2014-08-19 Cisco Technology, Inc. Apparatus and method providing unified network management
US20060075001A1 (en) * 2004-09-30 2006-04-06 Canning Jeffrey C System, method and program to distribute program updates
US7661025B2 (en) * 2006-01-19 2010-02-09 Cisco Technoloy, Inc. Method of ensuring consistent configuration between processors running different versions of software
US7818621B2 (en) * 2007-01-11 2010-10-19 International Business Machines Corporation Data center boot order control
JP5571667B2 (ja) 2008-08-18 2014-08-13 エフ5 ネットワークス、インコーポレイテッド 可用性を維持しながらネットワークトラフィック管理装置をアップグレードする方法
US20120079474A1 (en) * 2010-09-24 2012-03-29 Stephen Gold Reimaging a multi-node storage system
US10481963B1 (en) * 2016-06-29 2019-11-19 Amazon Technologies, Inc. Load-balancing for achieving transaction fault tolerance
US10305970B2 (en) * 2016-12-13 2019-05-28 International Business Machines Corporation Self-recoverable multitenant distributed clustered systems
CN107707595B (zh) * 2017-03-17 2018-06-15 贵州白山云科技有限公司 一种成员组变更方法及装置
US10860078B2 (en) 2018-10-25 2020-12-08 Dell Products, L.P. Managing power request during cluster operations
US11048523B2 (en) 2018-10-25 2021-06-29 Dell Products, L.P. Enabling software sensor power operation requests via baseboard management controller (BMC)

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5469542A (en) * 1991-07-22 1995-11-21 International Business Machines Corporation Serial diagnostic interface bus for multiprocessor systems
US6044461A (en) * 1997-09-16 2000-03-28 International Business Machines Corporation Computer system and method of selectively rebooting the same in response to a system program code update
US6324692B1 (en) * 1999-07-28 2001-11-27 Data General Corporation Upgrade of a program
US6779176B1 (en) * 1999-12-13 2004-08-17 General Electric Company Methods and apparatus for updating electronic system programs and program blocks during substantially continued system execution
US6757836B1 (en) * 2000-01-10 2004-06-29 Sun Microsystems, Inc. Method and apparatus for resolving partial connectivity in a clustered computing system
GB2359385B (en) * 2000-02-16 2004-04-07 Data Connection Ltd Method for upgrading running software processes without compromising fault-tolerance
US6691244B1 (en) * 2000-03-14 2004-02-10 Sun Microsystems, Inc. System and method for comprehensive availability management in a high-availability computer system
US6854069B2 (en) * 2000-05-02 2005-02-08 Sun Microsystems Inc. Method and system for achieving high availability in a networked computer system
EP1231537A1 (de) * 2001-02-09 2002-08-14 Siemens Aktiengesellschaft Automatische Inbetriebnahme eines Clustersystems nach einem heilbaren Fehler
US20030149735A1 (en) * 2001-06-22 2003-08-07 Sun Microsystems, Inc. Network and method for coordinating high availability system services
US6535924B1 (en) 2001-09-05 2003-03-18 Pluris, Inc. Method and apparatus for performing a software upgrade of a router while the router is online

Also Published As

Publication number Publication date
KR20060026877A (ko) 2006-03-24
US20040268112A1 (en) 2004-12-30
WO2004114570A2 (en) 2004-12-29
KR100792280B1 (ko) 2008-01-08
US7076645B2 (en) 2006-07-11
WO2004114570A3 (en) 2005-04-14
EP1644828A4 (en) 2008-01-23
CN1864134A (zh) 2006-11-15
EP1644828A2 (en) 2006-04-12

Similar Documents

Publication Publication Date Title
CN100481004C (zh) 用于重启集群的方法、系统和装置
CN101390336B (zh) 灾难恢复体系结构
US9137111B2 (en) Discovering, validating, and configuring hardware-inventory components
JP5394123B2 (ja) 複数装置管理の方法およびシステム
CN100553202C (zh) 用于动态设备地址管理的方法和系统
CN103460203A (zh) 群集唯一标识符
JP2006500693A (ja) 動的rdfグループ
CN112100005B (zh) 一种Redis副本集的实现方法及装置
US20120271888A1 (en) Automated tape drive sharing in a heterogeneous server and application environment
WO2010057332A1 (en) Provisioning method and system
CN103647820A (zh) 用于分布式集群系统的仲裁方法及仲裁装置
US7499987B2 (en) Deterministically electing an active node
CN100375969C (zh) 集群管理系统、方法和装置
US20040128368A1 (en) Information processing apparatus, network device control method, program for implementing the control method, and storage medium storing the program
Cisco System Error Messages Internetwork Operating System Release 10
CN114915545A (zh) 基于dhcp网络高可用集群的应用调度部署管理方法
Cisco NetCentral NetView Interface User Guide
JPH0591108A (ja) メツセージ通信制御方法および通信システム
Cisco Operational Traps
Cisco Operational Traps
Cisco Operational Traps
Cisco Operational Traps
Cisco Operational Traps
Cisco Operational Traps
JP2016200961A (ja) サーバー障害監視システム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
ASS Succession or assignment of patent right

Owner name: NOKIA AND SIEMENS NETWORKS CO., LTD.

Free format text: FORMER OWNER: NOKIA NETWORKS OY

Effective date: 20080718

C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20080718

Address after: Espoo, Finland

Applicant after: Nokia Siemens Networks Ltd.

Address before: Espoo, Finland

Applicant before: NOKIA Corp.

Effective date of registration: 20080718

Address after: Espoo, Finland

Applicant after: NOKIA Corp.

Address before: Texas, USA

Applicant before: NOKIA Corp.

C14 Grant of patent or utility model
GR01 Patent grant
C56 Change in the name or address of the patentee

Owner name: NOKIA SIEMENS NETWORKS OY

Free format text: FORMER NAME: NOKIA SIEMENS NETWORK CO., LTD.

CP01 Change in the name or title of a patent holder

Address after: Espoo, Finland

Patentee after: NOKIA SOLUTIONS AND NETWORKS OY

Address before: Espoo, Finland

Patentee before: Nokia Siemens Networks Ltd.

CX01 Expiry of patent term
CX01 Expiry of patent term

Granted publication date: 20090422