WO2002023338A3 - Gestionnaire de la disponibilite de ressources du systeme - Google Patents

Gestionnaire de la disponibilite de ressources du systeme Download PDF

Info

Publication number
WO2002023338A3
WO2002023338A3 PCT/US2001/029118 US0129118W WO0223338A3 WO 2002023338 A3 WO2002023338 A3 WO 2002023338A3 US 0129118 W US0129118 W US 0129118W WO 0223338 A3 WO0223338 A3 WO 0223338A3
Authority
WO
WIPO (PCT)
Prior art keywords
hierarchy
processing system
master state
data processing
sets
Prior art date
Application number
PCT/US2001/029118
Other languages
English (en)
Other versions
WO2002023338A2 (fr
WO2002023338A9 (fr
Inventor
Arthur Zaifman
Stephen Ciavaglia
Original Assignee
Tenor Networks Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tenor Networks Inc filed Critical Tenor Networks Inc
Priority to AU2001291069A priority Critical patent/AU2001291069A1/en
Publication of WO2002023338A2 publication Critical patent/WO2002023338A2/fr
Publication of WO2002023338A9 publication Critical patent/WO2002023338A9/fr
Publication of WO2002023338A3 publication Critical patent/WO2002023338A3/fr

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1415Saving, restoring, recovering or retrying at system level
    • G06F11/1441Resetting or repowering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/008Reliability or availability analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Hardware Redundancy (AREA)
  • Retry When Errors Occur (AREA)
  • Computer And Data Communications (AREA)

Abstract

L'invention concerne un procédé hiérarchique et distribué de gestion de la disponibilité (AM) permettant à des composants de récupérer après des défaillances survenues dans un système de traitement de données. La hiérarchie d'éléments AM poursuit une hiérarchie de modalité de défaillance des composants du système de traitement de données. Par exemple, la hiérarchie du système peut comporter des cartes système, des processeurs et des procédés, auquel cas les éléments AM associés peuvent être mis en application au niveau d'un gestionnaire de carte (CM), d'un gestionnaire de système (SM) et d'un gestionnaire de procédés (PM). La hiérarchie AM est conçue pour parvenir à une granularité de défaillances de sorte que les défaillances survenues dans les niveaux hiérarchiques inférieurs aient moins d'impact sur tout le système. Chaque élément AM est chargé de recevoir des notifications de défaillance de la part des composants du système de traitement associés au niveau inférieur suivant de la hiérarchie. Sur cette indication, si l'élément AM détermine que le composant défaillant peut être redémarré, si ce dernier peut l'être, l'élément AM détermine ensuite s'il peut l'être à chaud, à tiède ou à froid, et il le fait sans notification ou implication supplémentaire de la disponibilité dans le système d'autres composants. Un redémarrage à chaud requiert une intégrité complète de l'information d'état, un redémarrage à tiède permet de récupérer la dernière information de bon état connue et un redémarrage à froid entraîne la réinitialisation de l'information d'état. Si le composant ne peut pas être redémarré, la notification est présentée au prochain niveau élevé de la hiérarchie et l'élément AM s'interrompt. Un des procédés AM peut être exécuté comme protocole de gestion d'identité. Ce protocole d'identité fixe un état-maître provisoire, attend pendant un laps de temps prédéterminé, puis fixe un état-maître final uniquement si aucune carte système n'a affirmé d'état-maître provisoire. Le laps de temps d'attente est choisi de façon qu'il soit supérieur au procédé d'initialisation censé être le plus long pour les composants homologues du système.
PCT/US2001/029118 2000-09-18 2001-09-18 Gestionnaire de la disponibilite de ressources du systeme WO2002023338A2 (fr)

Priority Applications (1)

Application Number Priority Date Filing Date Title
AU2001291069A AU2001291069A1 (en) 2000-09-18 2001-09-18 System resource availability manager

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US23339500P 2000-09-18 2000-09-18
US60/233,395 2000-09-18
US95447101A 2001-09-17 2001-09-17
US09/954,471 2001-09-17

Publications (3)

Publication Number Publication Date
WO2002023338A2 WO2002023338A2 (fr) 2002-03-21
WO2002023338A9 WO2002023338A9 (fr) 2003-03-27
WO2002023338A3 true WO2002023338A3 (fr) 2003-10-02

Family

ID=26926891

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/US2001/029118 WO2002023338A2 (fr) 2000-09-18 2001-09-18 Gestionnaire de la disponibilite de ressources du systeme

Country Status (2)

Country Link
AU (1) AU2001291069A1 (fr)
WO (1) WO2002023338A2 (fr)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR3021138B1 (fr) * 2014-05-16 2017-10-06 Bull Architecture de correlation d'evenements pour la surveillance de supercalculateur

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0416732A2 (fr) * 1989-08-01 1991-03-13 Digital Equipment Corporation Remises à zéro sélectives dans un processeur de données
WO1997007638A1 (fr) * 1995-08-15 1997-02-27 Broadcom Eireann Research Limited Systeme de gestion d'un reseau de telecommunications
US5740357A (en) * 1990-04-26 1998-04-14 Digital Equipment Corporation Generic fault management of a computer system
EP0953911A2 (fr) * 1998-04-21 1999-11-03 Lucent Technologies Inc. Procédé et dispositif pour fournir les niveaux échelonnables de la disponibilité d'application

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0416732A2 (fr) * 1989-08-01 1991-03-13 Digital Equipment Corporation Remises à zéro sélectives dans un processeur de données
US5740357A (en) * 1990-04-26 1998-04-14 Digital Equipment Corporation Generic fault management of a computer system
WO1997007638A1 (fr) * 1995-08-15 1997-02-27 Broadcom Eireann Research Limited Systeme de gestion d'un reseau de telecommunications
EP0953911A2 (fr) * 1998-04-21 1999-11-03 Lucent Technologies Inc. Procédé et dispositif pour fournir les niveaux échelonnables de la disponibilité d'application

Also Published As

Publication number Publication date
WO2002023338A2 (fr) 2002-03-21
AU2001291069A1 (en) 2002-03-26
WO2002023338A9 (fr) 2003-03-27

Similar Documents

Publication Publication Date Title
US9460183B2 (en) Split brain resistant failover in high availability clusters
TW531695B (en) Method and apparatus for backing up application code upon power failure during a code update
US9514160B2 (en) Automatic recovery of a failed standby database in a cluster
US6145089A (en) Server fail-over system
WO2017107732A1 (fr) Procédé et système de synchronisation d'état de connexion
CN100549962C (zh) 用于置换资源控制器锁的所有权的装置、系统和方法
US7373545B2 (en) Fault tolerant computer system
US20070168711A1 (en) Computer-clustering system failback control method and system
DE69122713D1 (de) Fehlertolerantes rechnersystem
US20070294363A1 (en) Quorum Establishment Based On A Vote From A Voting Device
US10067548B2 (en) Efficient power-on sequence for a modular information handling system
US8707082B1 (en) Method and system for enhanced granularity in fencing operations
US11592998B2 (en) System and method for secure access to a distributed virtual firmware network drive
CN109471704A (zh) 一种基于消息中间件的柔性事务处理方法
US20120131318A1 (en) Server and method for performing data recovery of the server
CN111132133A (zh) 终端查找方法及装置、存储介质及电子装置
US20060187906A1 (en) Controlling service failover in clustered storage apparatus networks
CN101960435B (zh) 用于执行主机枚举过程的方法和装置
US7370193B2 (en) Computing system being able to quickly switch between an internal and an external networks and a method thereof
CN115396296A (zh) 业务处理方法、装置、电子设备及计算机可读存储介质
WO2002023338A3 (fr) Gestionnaire de la disponibilite de ressources du systeme
WO2007146708A2 (fr) Reprise d'un serveur edge
CN112015563B (zh) 消息队列切换方法、装置、电子设备及存储介质
US7103639B2 (en) Method and apparatus for processing unit synchronization for scalable parallel processing
US8185631B2 (en) Controlling service failover in clustered storage apparatus networks

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A2

Designated state(s): AE AG AL AM AT AU AZ BA BB BG BR BY BZ CA CH CN CO CR CU CZ DE DK DM DZ EC EE ES FI GB GD GE GH GM HR HU ID IL IN IS JP KE KG KP KR KZ LC LK LR LS LT LU LV MA MD MG MK MN MW MX MZ NO NZ PH PL PT RO RU SD SE SG SI SK SL TJ TM TR TT TZ UA UG UZ VN YU ZA ZW

AL Designated countries for regional patents

Kind code of ref document: A2

Designated state(s): GH GM KE LS MW MZ SD SL SZ TZ UG ZW AM AZ BY KG KZ MD RU TJ TM AT BE CH CY DE DK ES FI FR GB GR IE IT LU MC NL PT SE TR BF BJ CF CG CI CM GA GN GQ GW ML MR NE SN TD TG

121 Ep: the epo has been informed by wipo that ep was designated in this application
DFPE Request for preliminary examination filed prior to expiration of 19th month from priority date (pct application filed before 20040101)
COP Corrected version of pamphlet

Free format text: PAGES 1/12-12/12, DRAWINGS, REPLACED BY NEW PAGES 1/12-12/12; DUE TO LATE TRANSMITTAL BY THE RECEIVING OFFICE

REG Reference to national code

Ref country code: DE

Ref legal event code: 8642

122 Ep: pct application non-entry in european phase
NENP Non-entry into the national phase

Ref country code: JP