KR20030067712A - 네트웍 매체 링크상태 기능을 이용한 컴퓨터 클러스터링시스템의 가용도 개선방법 - Google Patents
네트웍 매체 링크상태 기능을 이용한 컴퓨터 클러스터링시스템의 가용도 개선방법 Download PDFInfo
- Publication number
- KR20030067712A KR20030067712A KR10-2003-7008210A KR20037008210A KR20030067712A KR 20030067712 A KR20030067712 A KR 20030067712A KR 20037008210 A KR20037008210 A KR 20037008210A KR 20030067712 A KR20030067712 A KR 20030067712A
- Authority
- KR
- South Korea
- Prior art keywords
- server
- communication link
- computer
- communication
- network
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2023—Failover techniques
- G06F11/2028—Failover techniques eliminating a faulty processor or activating a spare
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2035—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant without idle spare hardware
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/2053—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
- G06F11/2056—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring
- G06F11/2071—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring using a plurality of controllers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2023—Failover techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/2053—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
- G06F11/2094—Redundant storage or storage space
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/953—Organization of data
- Y10S707/959—Network
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
- Y10S707/99938—Concurrency, e.g. lock management in shared database
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Hardware Redundancy (AREA)
- Computer And Data Communications (AREA)
- Debugging And Monitoring (AREA)
- Telephonic Communication Services (AREA)
Abstract
Description
Claims (23)
- 통신 링크에 의해 서로 연결된 제1서버와 제2서버를 포함하며, 컴퓨터 클러스터링 시스템이 붕괴되었을 때 상기 제2서버에 생존권리가 할당되는 컴퓨터 클러스터링 시스템의 가용도 및 신뢰성을 개선하기 위한 방법에 있어서,상기 제1서버에 의해 제2서버로부터 제1서버까지 통신 손실을 검출하는 단계와,통신 링크가 적절히 작동하는지의 여부를 결정하기 위하여, 상기 제1서버가 통신 링크를 분석하는 단계와,통신 링크가 적절히 작동하고 있는 것으로 결정된 경우, 상기 제1서버가 생존권리를 가정하여 계속 작동하는 단계와,통신 링크가 적절히 작동하고 있지 않은 것으로 결정된 경우, 상기 제1서버가 작동을 정지하는 단계를 포함하는 것을 특징으로 하는 컴퓨터 클러스터링 시스템의 가용도 및 신뢰성 개선방법.
- 제1항에 있어서, 통신 손실 검출동작은 제2서버에 의해 생성된 심장박동 신호가 통신 링크상에서 상기 제1서버에 의해 검출될 수 없음을 결정하는 단계를 포함하는 것을 특징으로 하는 컴퓨터 클러스터링 시스템의 가용도 및 신뢰성 개선방법.
- 제2항에 있어서, 상기 통신 링크는 제1서버와 제2서버를 연결하는 전용 링크를 포함하는 것을 특징으로 하는 컴퓨터 클러스터링 시스템의 가용도 및 신뢰성 개선방법.
- 제1항에 있어서, 상기 통신 링크는 컴퓨터 네트웍에서 설정된 실제 채널을 포함하며, 상기 컴퓨터 네트웍은 상호연결된 하나이상의 네트웍 장치를 포함하며, 상기 네트웍 장치는 제1서버 및 제2서버에 상호연결되는 것을 특징으로 하는 컴퓨터 클러스터링 시스템의 가용도 및 신뢰성 개선방법.
- 제1항에 있어서, 상기 제1서버 및 제2서버 각각은 파일 운영체제 및 적어도 하나의 대용량 저장장치를 포함하며; 상기 제1서버 및 제2서버 각각은 다른 네트웍장치로부터의 네트웍 요청을 서비스할 수 있도록 상기 파일 운영체제를 실행하며; 상기 네트웍 요청은 제1서버 및 제2서버의 리소스를 사용하는 요청을 포함하는 것을 특징으로 하는 컴퓨터 클러스터링 시스템의 가용도 및 신뢰성 개선방법.
- 제5항에 있어서, 상기 제1서버의 적어도 하나의 부착된 저장장치로부터 상기 제2서버의 적어도 하나의 부착된 저장장치까지 데이터를 미러링하는 단계와, 상기 제2서버의 적어도 하나의 부착된 저장장치로부터 상기 제1서버의 적어도 하나의 부착된 저장장치까지 데이터를 미러링하는 단계를 부가로 포함하는 것을 특징으로 하는 컴퓨터 클러스터링 시스템의 가용도 및 신뢰성 개선방법.
- 제6항에 있어서, 상기 통신 링크는 제1서버 및 제2서버만을 연결하는 전용의 통신 링크이며; 통신 손실을 검출하는 동작은 통신 링크를 통해 상기 제1서버가 제2서버와의 통신을 시도하는 단계와, 제1서버가 제2서버와 통신할 수 없다고 결정하기 위해 상기 제1서버가 통신 링크를 통해 시도한 통신의 결과를 분석하는 단계를 포함하는 것을 특징으로 하는 컴퓨터 클러스터링 시스템의 가용도 및 신뢰성 개선방법.
- 제1항에 있어서, 통신 링크가 적절히 작동하고 있는지의 여부를 결정하기 위해 통신 링크를 분석하는 단계는, 상기 제1서버가 통신 링크의 전송특성들을 반복해서 체크하고 이러한 특성들이 특정 변수내에 있는지를 결정하는 단계를 부가로 포함하는 것을 특징으로 하는 컴퓨터 클러스터링 시스템의 가용도 및 신뢰성 개선방법.
- 제1항에 있어서, 상기 제1서버가 네트웍 장치에 의해 이루어진 요청을 제2서버로 서비스하는 단계를 부가로 포함하며, 상기 제1서버는 통신 링크가 적절히 작동하고 있는지의 여부를 결정하는 것을 특징으로 하는 컴퓨터 클러스터링 시스템의 가용도 및 신뢰성 개선방법.
- 제9항에 있어서, 제1서버가 제2서버로부터의 통신이 복구되었는지의 여부를 결정하는 단계와, 상기 제2서버가 작동을 정지하는 단계를 부가로 포함하는 것을 특징으로 하는 컴퓨터 클러스터링 시스템의 가용도 및 신뢰성 개선방법.
- 제1항에 있어서, 상기 제1서버의 작동이 정지된 후, 제2서버가 계속 작동하여 제1서버에 의해 이루어진 네트웍 요청을 서비스하는 단계를 부가로 포함하며; 상기 제1서버는 통신 링크가 적절히 작동하고 있지 않음을 결정하는 것을 특징으로 하는 컴퓨터 클러스터링 시스템의 가용도 및 신뢰성 개선방법.
- 통신 링크에 의해 서로 연결된 제1서버와 제2서버를 포함하며, 컴퓨터 클러스터링 시스템이 붕괴되었을 때 상기 제2서버에 생존권리가 할당되며, 상기 각각의 제1서버 및 제2서버가 적어도 하나의 대용량 저장장치에 기입되거나 이로부터 판독되는 데이터로 나타나는 요청을 수신할 수 있도록, 상기 각각의 제1 및 제2 네트웍 서버는 파일 서버 운영체제와, 이와 관련된 적어도 하나의 대용량 저장장치를 포함하는 컴퓨터 클러스터링 시스템의 가용도 및 신뢰성을 개선하기 위한 방법에 있어서,제2서버와 관련된 심장박동 신호가 상기 제1서버에 의해 통신 링크상에서 더 이상 검출되지 않음을 결정하는 단계와,상기 제1서버는 통신 링크의 무결성에 에러가 존재하는지의 여부를 결정하기위해 통신 링크를 분석하는 단계와,상기 제1서버가 통신 링크의 무결성에 에러가 있음을 결정하였을 경우, 상기 제1서버는 작동을 정지하고, 제2서버는 제1서버로 전송될 요청을 서비스할 수 있도록 컴퓨터 클러스터링 시스템을 리포밍하는 단계와,상기 제1서버가 통신 링크의 무결성에 에러가 없음을 결정하였을 경우, 제1서버는 자신에게 생존권리를 할당하고, 상기 제1서버는 제2서버로 전송될 요청을 서비스할 수 있도록 컴퓨터 클러스터링 시스템을 리포밍하는 단계를 포함하는 것을 특징으로 하는 컴퓨터 클러스터링 시스템의 가용도 및 신뢰성 개선방법.
- 제12항에 있어서, 제2서버와 연관된 심장박동 신호가 더 이상 검출되지 않음을 결정하기 전에, 상기 제1서버 및 제2서버가 제1서버의 적어도 하나의 대용량 저장장치와 제2서버의 적어도 하나의 대용량 저장장치에 저장된 데이터를 미러링하는 단계를 부가로 포함하는 것을 특징으로 하는 컴퓨터 클러스터링 시스템의 가용도 및 신뢰성 개선방법.
- 제13항에 있어서, 상기 데이터 미러링 단계는 제1서버와 제2서버 사이의 통신 링크상에 데이터를 전송하는 단계를 포함하는 것을 특징으로 하는 컴퓨터 클러스터링 시스템의 가용도 및 신뢰성 개선방법.
- 제13항에 있어서, 상기 제1서버가 제2서버와 연관된 심장박동 신호가 더 이상 검출되지 않음을 결정하는 단계는, 제1서버가 심장박동 신호를 위해 통신 링크를 반복해서 관찰하는 단계와; 특정 시간주기동안 통신 링크를 반복해서 관찰하는 단계중 상기 제1서버가 심장박동 신호를 검출하지 않았을 때, 상기 제1서버가 심장박동 신호가 더 이상 검출되지 않음을 결정하는 단계를 포함하는 것을 특징으로 하는 컴퓨터 클러스터링 시스템의 가용도 및 신뢰성 개선방법.
- 제12항에 있어서, 상기 제1서버의 컴퓨터 클러스터링 시스템 재구축단계후에, 상기 제1서버가 제2서버와 연관된 심장박동 신호를 다시 검출하는 단계와, 제2서버와 연관된 적어도 하나의 대용량 저장장치에 억세스하기 전에 상기 제2서버가 작동을 정지하는 단계를 부가로 포함하는 것을 특징으로 하는 컴퓨터 클러스터링 시스템의 가용도 및 신뢰성 개선방법.
- 통신 링크에 의해 서로 연결된 제1서버와 제2서버를 포함하며; 컴퓨터 클러스터링 시스템이 붕괴되었을 때 상기 제2서버에 생존권리가 할당되며; 상기 각각의 제1서버 및 제2서버가 적어도 하나의 대용량 저장장치에 기입되거나 이로부터 판독되는 데이터로 나타나는 요청을 수신할 수 있도록, 상기 각각의 제1서버 및 제2서버는 파일 서버 운영체제와, 이와 관련된 적어도 하나의 대용량 저장장치를 포함하는 컴퓨터 클러스터링 시스템의 가용도 및 신뢰성을 개선하기 위한 방법에 있어서,컴퓨터 클러스터링 시스템의 정상 작동중, 제1서버와 연관된 적어도 하나의 대용량 저장장치상의 데이터와 제2서버와 연관된 적어도 하나의 대용량 저장장치상의 데이터를, 통신 링크를 사용하여 제1서버와 제2서버 사이로 전송하므로써 이러한 데이터들을 미러링하는 단계와,제2서버가 적절히 작동하지 않는다는 것을 상기 제1서버가 결정하는 단계와,상기 제1서버가 컴퓨터 클러스터링 시스템을 제어하는 단계와,제1서버가 제2서버로 전송될 파일 서버 요청을 수신할 수 있도록, 상기 제1서버가 컴퓨터 클러스터링 시스템을 재구축하는 단계를 포함하며,상기 제2서버가 적절히 작동하지 않는다는 것을 제1서버가 결정하는 단계는 특정 시간간격중 상기 제1서버가 통신 링크를 분석하는 단계와, 제1서버가 통신 링크상에서 제2서버로부터의 통신 검출에 실패하는 단계와, 상기 제1서버가 통신링크 분석단계에 기초하여 통신링크의 적절한 작동성을 검출하는 단계를 포함하는 것을 특징으로 하는 컴퓨터 클러스터링 시스템의 가용도 및 신뢰성 개선방법.
- 제17항에 있어서, 상기 제1서버가 컴퓨터 클러스터링 시스템을 제어한 후, 제1서버가 제2서버는 적절한 기능성으로 재구축되었음을 결정하는 단계와, 제2서버와 연관된 적어도 하나의 대용량 저장장치에 억세스하기 전에 상기 제2서버가 작동을 정지하는 단계를 부가로 포함하는 것을 특징으로 하는 컴퓨터 클러스터링 시스템의 가용도 및 신뢰성 개선방법.
- 제2서버의 정지에 응답하여 제1서버가 컴퓨터 클러스터링 시스템을 제어하는 방법에서, 제2서버와 상기 제2서버와 제1서버를 상호연결하는 통신 링크를 포함하는 컴퓨터 클러스터링 시스템에 내장된 제1서버에서의 실행에 의한 컴퓨터 프로그램 산출물에 있어서,상기 방법을 실행시키는 컴퓨터-실행가능한 지지를 이송하는 컴퓨터-판독가능한 매체를 포함하며,상기 컴퓨터-실행가능한 지시는 제1서버가 제2서버로부터의 통신 검출에 실패하였을 때 제1서버가 생존권리를 갖는지의 여부를 결정하는 프로그램 코드수단과; 상기 제2서버로부터 통신 손실을 검출하는 프로그램 코드수단과; 통신 손실에 응답하여 통신 링크가 적절히 작동하고 있는지의 여부를 결정하는 프로그램 코드수단과; 통신링크가 적절히 작동하고 있지 않을 때 제1서버의 작동을 정지시키고, 통신 링크가 적절히 작용하는 경우 제1서버가 초기에 생존권리를 갖지 않고 있음에도 불구하고 제1서버를 계속 작동시키는 프로그램 코드수단을 포함하는 것을 특징으로 하는 컴퓨터 프로그램 산출물.
- 제19항에 있어서, 상기 통신 링크는 제1서버와 제2서버 사이에 전용 링크를 포함하는 것을 특징으로 하는 컴퓨터 프로그램 산출물.
- 제19항에 있어서, 상기 통신 링크는 제1서버와 제2서버 및 다수의 네트웍 장치들을 상호연결하는 네트웍에 포함된 실제 채널을 포함하는 것을 특징으로 하는 컴퓨터 프로그램 산출물.
- 제19항에 있어서, 상기 컴퓨터-실행가능한 지시는 제1서버와 제2서버가 서로 통신될 동안 컴퓨터 클러스터링 시스템의 정상 작동중, 제1서버와 연관된 대용량 저장장치와 제2서버와 연관된 대용량 저장장치 사이에서 데이터를 미러링시키는 프로그램 코드수단을 부가로 포함하는 것을 특징으로 하는 컴퓨터 프로그램 산출물.
- 제19항에 있어서, 제1서버가 생권권리를 갖는지의 여부를 결정하는 상기 프로그램 코드수단은 제1서버에 저장된 생존권리 플래그를 검사하는 프로그램 코드수단을 포함하는 것을 특징으로 하는 컴퓨터 프로그램 산출물.
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US25747800P | 2000-12-21 | 2000-12-21 | |
US60/257,478 | 2000-12-21 | ||
US09/855,592 US6785678B2 (en) | 2000-12-21 | 2001-05-14 | Method of improving the availability of a computer clustering system through the use of a network medium link state function |
US09/855,592 | 2001-05-14 | ||
PCT/US2001/049600 WO2002050678A1 (en) | 2000-12-21 | 2001-12-19 | Method of 'split-brain' prevention in computer cluster systems |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20030067712A true KR20030067712A (ko) | 2003-08-14 |
KR100557399B1 KR100557399B1 (ko) | 2006-03-06 |
Family
ID=26945994
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020037008210A KR100557399B1 (ko) | 2000-12-21 | 2001-12-19 | 네트웍 매체 링크상태 기능을 이용한 컴퓨터 클러스터링시스템의 가용도 개선방법 |
Country Status (10)
Country | Link |
---|---|
US (2) | US6785678B2 (ko) |
EP (1) | EP1344133B1 (ko) |
JP (1) | JP4500490B2 (ko) |
KR (1) | KR100557399B1 (ko) |
CN (1) | CN1264092C (ko) |
AT (1) | ATE415661T1 (ko) |
AU (2) | AU3116702A (ko) |
CA (1) | CA2428251A1 (ko) |
DE (1) | DE60136739D1 (ko) |
WO (1) | WO2002050678A1 (ko) |
Families Citing this family (106)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7627694B2 (en) * | 2000-03-16 | 2009-12-01 | Silicon Graphics, Inc. | Maintaining process group membership for node clusters in high availability computing systems |
US20020198996A1 (en) * | 2000-03-16 | 2002-12-26 | Padmanabhan Sreenivasan | Flexible failover policies in high availability computing systems |
US6785678B2 (en) | 2000-12-21 | 2004-08-31 | Emc Corporation | Method of improving the availability of a computer clustering system through the use of a network medium link state function |
US6877107B2 (en) * | 2001-07-05 | 2005-04-05 | Softwired Ag | Method for ensuring operation during node failures and network partitions in a clustered message passing server |
US7685126B2 (en) * | 2001-08-03 | 2010-03-23 | Isilon Systems, Inc. | System and methods for providing a distributed file system utilizing metadata to track information about data stored throughout the system |
US7146524B2 (en) * | 2001-08-03 | 2006-12-05 | Isilon Systems, Inc. | Systems and methods for providing a distributed file system incorporating a virtual hot spare |
DE10143142A1 (de) * | 2001-09-04 | 2003-01-30 | Bosch Gmbh Robert | Verfahren zum Betreiben einer Schaltungsanordnung, die einen Mikrocontroller und ein EEPROM enthält |
JP4434543B2 (ja) * | 2002-01-10 | 2010-03-17 | 株式会社日立製作所 | 分散ストレージシステム、ストレージ装置、およびデータのコピー方法 |
US7181489B2 (en) * | 2002-01-10 | 2007-02-20 | International Business Machines Corporation | Method, apparatus, and program for distributing a document object model in a web server cluster |
US7203748B2 (en) * | 2002-02-15 | 2007-04-10 | International Business Machines Corporation | Method for detecting the quick restart of liveness daemons in a distributed multinode data processing system |
US7127512B2 (en) * | 2002-02-19 | 2006-10-24 | Qualcomm Inc. | Method and apparatus for two-phase commit in data distribution to a web farm |
CA2377649C (en) * | 2002-03-20 | 2009-02-03 | Ibm Canada Limited-Ibm Canada Limitee | Dynamic cluster database architecture |
US7631066B1 (en) * | 2002-03-25 | 2009-12-08 | Symantec Operating Corporation | System and method for preventing data corruption in computer system clusters |
US7058850B2 (en) * | 2002-07-31 | 2006-06-06 | Hewlett-Packard Development Company, L.P. | Method and system for preventing data loss within disk-array pairs supporting mirrored logical units |
US7076687B2 (en) * | 2002-10-16 | 2006-07-11 | Hitachi, Ltd. | System and method for bi-directional failure detection of a site in a clustering system |
EP2284735A1 (en) | 2002-11-14 | 2011-02-16 | Isilon Systems, Inc. | Systems and methods for restriping files in a distributed file system |
US20040181707A1 (en) | 2003-03-11 | 2004-09-16 | Hitachi, Ltd. | Method and apparatus for seamless management for disaster recovery |
JP2004302512A (ja) * | 2003-03-28 | 2004-10-28 | Hitachi Ltd | クラスタコンピューティングシステム、および、そのフェールオーバー方法 |
US7320083B2 (en) * | 2003-04-23 | 2008-01-15 | Dot Hill Systems Corporation | Apparatus and method for storage controller to deterministically kill one of redundant servers integrated within the storage controller chassis |
US7401254B2 (en) * | 2003-04-23 | 2008-07-15 | Dot Hill Systems Corporation | Apparatus and method for a server deterministically killing a redundant server integrated within the same network storage appliance chassis |
US7627780B2 (en) * | 2003-04-23 | 2009-12-01 | Dot Hill Systems Corporation | Apparatus and method for deterministically performing active-active failover of redundant servers in a network storage appliance |
US7565566B2 (en) * | 2003-04-23 | 2009-07-21 | Dot Hill Systems Corporation | Network storage appliance with an integrated switch |
JP2005018510A (ja) * | 2003-06-27 | 2005-01-20 | Hitachi Ltd | データセンタシステム及びその制御方法 |
US7739541B1 (en) | 2003-07-25 | 2010-06-15 | Symantec Operating Corporation | System and method for resolving cluster partitions in out-of-band storage virtualization environments |
US7475134B2 (en) * | 2003-10-14 | 2009-01-06 | International Business Machines Corporation | Remote activity monitoring |
US7225356B2 (en) * | 2003-11-06 | 2007-05-29 | Siemens Medical Solutions Health Services Corporation | System for managing operational failure occurrences in processing devices |
US6859811B1 (en) * | 2004-01-15 | 2005-02-22 | Oracle International Corporation | Cluster database with remote data mirroring |
US7299378B2 (en) * | 2004-01-15 | 2007-11-20 | Oracle International Corporation | Geographically distributed clusters |
US7293198B2 (en) * | 2004-03-25 | 2007-11-06 | Emc Corporation | Techniques for maintaining operation of data storage system during a failure |
US7610373B2 (en) * | 2004-05-27 | 2009-10-27 | International Business Machines Corporation | Voting mechanism for session invalidation processing in an application server cluster |
US8238350B2 (en) | 2004-10-29 | 2012-08-07 | Emc Corporation | Message batching with checkpoints systems and methods |
US8055711B2 (en) | 2004-10-29 | 2011-11-08 | Emc Corporation | Non-blocking commit protocol systems and methods |
US8051425B2 (en) * | 2004-10-29 | 2011-11-01 | Emc Corporation | Distributed system with asynchronous execution systems and methods |
GB0428105D0 (en) * | 2004-12-23 | 2005-01-26 | Ibm | Storage system with multiple copy targeting and disk failure protection |
GB0428108D0 (en) * | 2004-12-23 | 2005-01-26 | Ibm | Storage system with multiple copy targeting |
US8191078B1 (en) * | 2005-03-22 | 2012-05-29 | Progress Software Corporation | Fault-tolerant messaging system and methods |
US20060230245A1 (en) * | 2005-04-08 | 2006-10-12 | Microsoft Corporation | Data storage safety indicator and expander |
US8010498B2 (en) * | 2005-04-08 | 2011-08-30 | Microsoft Corporation | Virtually infinite reliable storage across multiple storage devices and storage services |
WO2006121990A2 (en) * | 2005-05-06 | 2006-11-16 | Marathon Technologies Corporation | Fault tolerant computer system |
US20060271695A1 (en) * | 2005-05-16 | 2006-11-30 | Electronics Line 3000 Ltd. | System for remote secured operation, monitoring and control of security and other types of events |
US7996608B1 (en) | 2005-10-20 | 2011-08-09 | American Megatrends, Inc. | Providing redundancy in a storage system |
US8010829B1 (en) | 2005-10-20 | 2011-08-30 | American Megatrends, Inc. | Distributed hot-spare storage in a storage cluster |
US7797283B2 (en) | 2005-10-21 | 2010-09-14 | Isilon Systems, Inc. | Systems and methods for maintaining distributed data |
US7788303B2 (en) | 2005-10-21 | 2010-08-31 | Isilon Systems, Inc. | Systems and methods for distributed system scanning |
US7917474B2 (en) * | 2005-10-21 | 2011-03-29 | Isilon Systems, Inc. | Systems and methods for accessing and updating distributed data |
US7551572B2 (en) * | 2005-10-21 | 2009-06-23 | Isilon Systems, Inc. | Systems and methods for providing variable protection |
KR100877470B1 (ko) * | 2005-11-22 | 2009-01-07 | 인터내셔널 비지네스 머신즈 코포레이션 | 소프트웨어 제품 사용 제어 방법과 시스템 및 컴퓨터 판독 가능한 저장 매체 |
US7979460B2 (en) | 2006-02-15 | 2011-07-12 | Sony Computer Entainment America Inc. | Systems and methods for server management |
US7848261B2 (en) * | 2006-02-17 | 2010-12-07 | Isilon Systems, Inc. | Systems and methods for providing a quiescing protocol |
US7756898B2 (en) * | 2006-03-31 | 2010-07-13 | Isilon Systems, Inc. | Systems and methods for notifying listeners of events |
JP2007304687A (ja) * | 2006-05-09 | 2007-11-22 | Hitachi Ltd | クラスタ構成とその制御手段 |
US7519855B2 (en) * | 2006-06-15 | 2009-04-14 | Motorola, Inc. | Method and system for distributing data processing units in a communication network |
US7882071B2 (en) * | 2006-08-18 | 2011-02-01 | Isilon Systems, Inc. | Systems and methods for a snapshot of data |
US7590652B2 (en) * | 2006-08-18 | 2009-09-15 | Isilon Systems, Inc. | Systems and methods of reverse lookup |
US7680836B2 (en) * | 2006-08-18 | 2010-03-16 | Isilon Systems, Inc. | Systems and methods for a snapshot of data |
US7680842B2 (en) * | 2006-08-18 | 2010-03-16 | Isilon Systems, Inc. | Systems and methods for a snapshot of data |
US7953704B2 (en) | 2006-08-18 | 2011-05-31 | Emc Corporation | Systems and methods for a snapshot of data |
US7822932B2 (en) * | 2006-08-18 | 2010-10-26 | Isilon Systems, Inc. | Systems and methods for providing nonlinear journaling |
US7899800B2 (en) * | 2006-08-18 | 2011-03-01 | Isilon Systems, Inc. | Systems and methods for providing nonlinear journaling |
US7770063B2 (en) * | 2006-08-26 | 2010-08-03 | International Business Machines Corporation | Simulation of failure recovery within clustered systems |
US8286029B2 (en) | 2006-12-21 | 2012-10-09 | Emc Corporation | Systems and methods for managing unavailable storage devices |
US7593938B2 (en) * | 2006-12-22 | 2009-09-22 | Isilon Systems, Inc. | Systems and methods of directory entry encodings |
US7509448B2 (en) * | 2007-01-05 | 2009-03-24 | Isilon Systems, Inc. | Systems and methods for managing semantic locks |
US7908448B1 (en) | 2007-01-30 | 2011-03-15 | American Megatrends, Inc. | Maintaining data consistency in mirrored cluster storage systems with write-back cache |
US8498967B1 (en) * | 2007-01-30 | 2013-07-30 | American Megatrends, Inc. | Two-node high availability cluster storage solution using an intelligent initiator to avoid split brain syndrome |
JP4505763B2 (ja) * | 2007-01-31 | 2010-07-21 | ヒューレット−パッカード デベロップメント カンパニー エル.ピー. | ノードクラスタの管理 |
US7779048B2 (en) | 2007-04-13 | 2010-08-17 | Isilon Systems, Inc. | Systems and methods of providing possible value ranges |
US8966080B2 (en) | 2007-04-13 | 2015-02-24 | Emc Corporation | Systems and methods of managing resource utilization on a threaded computer system |
US7900015B2 (en) * | 2007-04-13 | 2011-03-01 | Isilon Systems, Inc. | Systems and methods of quota accounting |
US8271757B1 (en) | 2007-04-17 | 2012-09-18 | American Megatrends, Inc. | Container space management in a data storage system |
US7882068B2 (en) * | 2007-08-21 | 2011-02-01 | Isilon Systems, Inc. | Systems and methods for adaptive copy on write |
US7949692B2 (en) * | 2007-08-21 | 2011-05-24 | Emc Corporation | Systems and methods for portals into snapshot data |
US7966289B2 (en) | 2007-08-21 | 2011-06-21 | Emc Corporation | Systems and methods for reading objects in a file system |
US11212733B2 (en) * | 2007-10-08 | 2021-12-28 | Qualcomm Incorporated | Control of wireless transmission based on node status |
US7984324B2 (en) * | 2008-03-27 | 2011-07-19 | Emc Corporation | Systems and methods for managing stalled storage devices |
US7953709B2 (en) * | 2008-03-27 | 2011-05-31 | Emc Corporation | Systems and methods for a read only mode for a portion of a storage system |
US7949636B2 (en) | 2008-03-27 | 2011-05-24 | Emc Corporation | Systems and methods for a read only mode for a portion of a storage system |
US7870345B2 (en) | 2008-03-27 | 2011-01-11 | Isilon Systems, Inc. | Systems and methods for managing stalled storage devices |
CN101299201B (zh) | 2008-05-08 | 2010-06-02 | 成都市华为赛门铁克科技有限公司 | 存储系统数据备份方法及装置 |
US8006129B2 (en) * | 2008-10-03 | 2011-08-23 | Cisco Technology, Inc. | Detecting and preventing the split-brain condition in redundant processing units |
CN101729412B (zh) * | 2009-11-05 | 2012-03-14 | 北京超图软件股份有限公司 | 地理信息服务的分布式层次集群方法和系统 |
US8108715B1 (en) * | 2010-07-02 | 2012-01-31 | Symantec Corporation | Systems and methods for resolving split-brain scenarios in computer clusters |
US8438277B1 (en) * | 2010-12-08 | 2013-05-07 | Symantec Corporation | Systems and methods for preventing data inconsistency within computer clusters |
CN103262046A (zh) * | 2010-12-10 | 2013-08-21 | 日本电气株式会社 | 服务器管理装置、服务器管理方法和程序 |
WO2012083693A1 (zh) * | 2011-07-26 | 2012-06-28 | 华为技术有限公司 | 一种用于集群计算机系统的投票仲裁方法及装置 |
CN102281159A (zh) * | 2011-09-06 | 2011-12-14 | 曙光信息产业(北京)有限公司 | 集群系统的恢复方法 |
US10054933B2 (en) * | 2012-03-27 | 2018-08-21 | Sirqul, Inc. | Controlling distributed device operations |
US20140173330A1 (en) * | 2012-12-14 | 2014-06-19 | Lsi Corporation | Split Brain Detection and Recovery System |
US10250579B2 (en) * | 2013-08-13 | 2019-04-02 | Alcatel Lucent | Secure file transfers within network-based storage |
CN103647820B (zh) * | 2013-12-09 | 2016-11-23 | 华为数字技术(苏州)有限公司 | 用于分布式集群系统的仲裁方法及仲裁装置 |
US9639437B2 (en) * | 2013-12-13 | 2017-05-02 | Netapp, Inc. | Techniques to manage non-disruptive SAN availability in a partitioned cluster |
US9965363B2 (en) * | 2013-12-14 | 2018-05-08 | Netapp, Inc. | Techniques for LIF placement in SAN storage cluster synchronous disaster recovery |
CN105849702A (zh) * | 2013-12-25 | 2016-08-10 | 日本电气方案创新株式会社 | 集群系统,服务器设备,集群系统管理方法和计算机可读记录介质 |
US9483369B2 (en) * | 2014-01-24 | 2016-11-01 | Verizon Patent And Licensing Inc. | Method and apparatus for failover detection and recovery using gratuitous address resolution messages |
US10114691B2 (en) | 2014-04-21 | 2018-10-30 | Hitachi, Ltd. | Information storage system |
JP2016115239A (ja) * | 2014-12-17 | 2016-06-23 | 日本電気株式会社 | フォールトトレラントシステム、フォールトトレラント方法、及び、プログラム |
US10592268B2 (en) * | 2015-04-06 | 2020-03-17 | Hitachi, Ltd. | Management computer and resource management method configured to combine server resources and storage resources and allocate the combined resources to virtual machines |
JP6409812B2 (ja) * | 2016-04-01 | 2018-10-24 | 横河電機株式会社 | 冗長化装置、冗長化システム、及び冗長化方法 |
US10205782B2 (en) | 2016-04-29 | 2019-02-12 | Netapp, Inc. | Location-based resource availability management in a partitioned distributed storage environment |
US10671038B2 (en) * | 2016-07-15 | 2020-06-02 | Fisher-Rosemount Systems, Inc. | Architecture-independent process control |
US10594553B2 (en) | 2016-12-21 | 2020-03-17 | Mastercard International Incorporated | Systems and methods for dynamically commissioning and decommissioning computer components |
US10503427B2 (en) * | 2017-03-10 | 2019-12-10 | Pure Storage, Inc. | Synchronously replicating datasets and other managed objects to cloud-based storage systems |
CN107147528A (zh) * | 2017-05-23 | 2017-09-08 | 郑州云海信息技术有限公司 | 一种存储网关智能防脑裂系统及方法 |
WO2018230197A1 (ja) * | 2017-06-14 | 2018-12-20 | 日立オートモティブシステムズ株式会社 | 車両搭載機器の制御装置 |
CN115396752B (zh) * | 2022-07-29 | 2023-05-26 | 国电南京自动化股份有限公司 | 一种基于Redis的双平面采集数据方法及系统 |
CN116743550B (zh) * | 2023-08-11 | 2023-12-29 | 之江实验室 | 一种分布式存储集群的故障存储节点的处理方法 |
Family Cites Families (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5812748A (en) * | 1993-06-23 | 1998-09-22 | Vinca Corporation | Method for improving recovery performance from hardware and software errors in a fault-tolerant computer system |
US5978565A (en) * | 1993-07-20 | 1999-11-02 | Vinca Corporation | Method for rapid recovery from a network file server failure including method for operating co-standby servers |
US5434994A (en) * | 1994-05-23 | 1995-07-18 | International Business Machines Corporation | System and method for maintaining replicated data coherency in a data processing system |
US5696895A (en) * | 1995-05-19 | 1997-12-09 | Compaq Computer Corporation | Fault tolerant multiple network servers |
US5828889A (en) * | 1996-05-31 | 1998-10-27 | Sun Microsystems, Inc. | Quorum mechanism in a two-node distributed computer system |
US5753034A (en) * | 1996-09-27 | 1998-05-19 | W. R. Grace & Co. -Conn. | Composition and method to remove asbestos |
US6002851A (en) * | 1997-01-28 | 1999-12-14 | Tandem Computers Incorporated | Method and apparatus for node pruning a multi-processor system for maximal, full connection during recovery |
US5892895A (en) * | 1997-01-28 | 1999-04-06 | Tandem Computers Incorporated | Method an apparatus for tolerance of lost timer ticks during recovery of a multi-processor system |
US6151688A (en) * | 1997-02-21 | 2000-11-21 | Novell, Inc. | Resource management in a clustered computer system |
US6134673A (en) * | 1997-05-13 | 2000-10-17 | Micron Electronics, Inc. | Method for clustering software applications |
US6108699A (en) * | 1997-06-27 | 2000-08-22 | Sun Microsystems, Inc. | System and method for modifying membership in a clustered distributed computer system and updating system configuration |
US9197599B1 (en) * | 1997-09-26 | 2015-11-24 | Verizon Patent And Licensing Inc. | Integrated business system for web based telecommunications management |
US6192483B1 (en) * | 1997-10-21 | 2001-02-20 | Sun Microsystems, Inc. | Data integrity and availability in a distributed computer system |
US5999712A (en) * | 1997-10-21 | 1999-12-07 | Sun Microsystems, Inc. | Determining cluster membership in a distributed computer system |
US6279032B1 (en) * | 1997-11-03 | 2001-08-21 | Microsoft Corporation | Method and system for quorum resource arbitration in a server cluster |
US6145089A (en) * | 1997-11-10 | 2000-11-07 | Legato Systems, Inc. | Server fail-over system |
JPH11175488A (ja) | 1997-12-16 | 1999-07-02 | Toshiba Corp | サーバシステムおよびフェールオーバ制御方法 |
US6058400A (en) * | 1998-04-28 | 2000-05-02 | Sun Microsystems, Inc. | Highly available cluster coherent filesystem |
US6421787B1 (en) * | 1998-05-12 | 2002-07-16 | Sun Microsystems, Inc. | Highly available cluster message passing facility |
US6311217B1 (en) * | 1998-06-04 | 2001-10-30 | Compaq Computer Corporation | Method and apparatus for improved cluster administration |
JP2000040986A (ja) | 1998-07-23 | 2000-02-08 | Toshiba Corp | 通信ネットワークの異常検出装置 |
US6393485B1 (en) * | 1998-10-27 | 2002-05-21 | International Business Machines Corporation | Method and apparatus for managing clustered computer systems |
US6438705B1 (en) * | 1999-01-29 | 2002-08-20 | International Business Machines Corporation | Method and apparatus for building and managing multi-clustered computer systems |
US6983317B1 (en) * | 2000-02-28 | 2006-01-03 | Microsoft Corporation | Enterprise management system |
US6618737B2 (en) * | 2000-03-09 | 2003-09-09 | International Business Machines Corporation | Speculative caching of individual fields in a distributed object system |
US7627694B2 (en) * | 2000-03-16 | 2009-12-01 | Silicon Graphics, Inc. | Maintaining process group membership for node clusters in high availability computing systems |
US6609213B1 (en) * | 2000-08-10 | 2003-08-19 | Dell Products, L.P. | Cluster-based system and method of recovery from server failures |
US6785678B2 (en) | 2000-12-21 | 2004-08-31 | Emc Corporation | Method of improving the availability of a computer clustering system through the use of a network medium link state function |
-
2001
- 2001-05-14 US US09/855,592 patent/US6785678B2/en not_active Expired - Lifetime
- 2001-12-19 CN CNB018211305A patent/CN1264092C/zh not_active Expired - Lifetime
- 2001-12-19 DE DE60136739T patent/DE60136739D1/de not_active Expired - Lifetime
- 2001-12-19 AT AT01991440T patent/ATE415661T1/de not_active IP Right Cessation
- 2001-12-19 EP EP01991440A patent/EP1344133B1/en not_active Expired - Lifetime
- 2001-12-19 KR KR1020037008210A patent/KR100557399B1/ko active IP Right Grant
- 2001-12-19 JP JP2002551706A patent/JP4500490B2/ja not_active Expired - Lifetime
- 2001-12-19 AU AU3116702A patent/AU3116702A/xx active Pending
- 2001-12-19 CA CA002428251A patent/CA2428251A1/en not_active Abandoned
- 2001-12-19 WO PCT/US2001/049600 patent/WO2002050678A1/en active IP Right Grant
- 2001-12-19 AU AU2002231167A patent/AU2002231167B2/en not_active Expired - Fee Related
-
2004
- 2004-08-18 US US10/920,601 patent/US7409395B2/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JP4500490B2 (ja) | 2010-07-14 |
US20020083036A1 (en) | 2002-06-27 |
DE60136739D1 (de) | 2009-01-08 |
CN1483163A (zh) | 2004-03-17 |
KR100557399B1 (ko) | 2006-03-06 |
CN1264092C (zh) | 2006-07-12 |
EP1344133B1 (en) | 2008-11-26 |
WO2002050678A1 (en) | 2002-06-27 |
JP2004516575A (ja) | 2004-06-03 |
WO2002050678A8 (en) | 2002-09-19 |
ATE415661T1 (de) | 2008-12-15 |
AU3116702A (en) | 2002-07-01 |
US20050033778A1 (en) | 2005-02-10 |
AU2002231167B2 (en) | 2005-10-06 |
US7409395B2 (en) | 2008-08-05 |
EP1344133A4 (en) | 2007-08-15 |
EP1344133A1 (en) | 2003-09-17 |
US6785678B2 (en) | 2004-08-31 |
CA2428251A1 (en) | 2002-06-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100557399B1 (ko) | 네트웍 매체 링크상태 기능을 이용한 컴퓨터 클러스터링시스템의 가용도 개선방법 | |
US11755435B2 (en) | Cluster availability management | |
US5696895A (en) | Fault tolerant multiple network servers | |
US8464092B1 (en) | System and method for monitoring an application or service group within a cluster as a resource of another cluster | |
USRE42703E1 (en) | System and method for fibrechannel fail-over through port spoofing | |
US6868442B1 (en) | Methods and apparatus for processing administrative requests of a distributed network application executing in a clustered computing environment | |
US7370228B2 (en) | Data processing system and copy processing method thereof | |
KR20030003264A (ko) | 서버의 이중화 방법 및 이중화 서버시스템 | |
JP2005209191A (ja) | 高可用性システムの遠隔エンタープライズ管理 | |
JP2008052407A (ja) | クラスタシステム | |
US6594709B1 (en) | Methods and apparatus for transferring data using a device driver | |
US7120821B1 (en) | Method to revive and reconstitute majority node set clusters | |
KR20030048503A (ko) | 이중화 서버 구조의 데이터 동기화를 위한 통신 시스템 및방법 | |
JP3555047B2 (ja) | 複合コンピュータシステム | |
EP1107119A2 (en) | Extending cluster membership and quorum determinations to intelligent storage systems | |
JP2000020336A (ja) | 二重化通信システム | |
JPS62296264A (ja) | デ−タ処理システムの構成制御方式 | |
KR19990050461A (ko) | 고 가용성 시스템의 오류 처리방법 | |
JPH09160875A (ja) | マルチエージェント相互バックアップ方式 | |
JPH0460750A (ja) | クラスタ停止装置 | |
JPH11203257A (ja) | コンピュータシステム | |
JPS62105243A (ja) | システム障害の復旧装置 | |
Sakai | Integration of PRIMECLUSTER and Mission- Critical IA Server PRIMEQUEST | |
JPH03233734A (ja) | 耐故障制御方式 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
N231 | Notification of change of applicant | ||
A201 | Request for examination | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20130207 Year of fee payment: 8 |
|
FPAY | Annual fee payment |
Payment date: 20140210 Year of fee payment: 9 |
|
FPAY | Annual fee payment |
Payment date: 20150206 Year of fee payment: 10 |
|
FPAY | Annual fee payment |
Payment date: 20160205 Year of fee payment: 11 |
|
FPAY | Annual fee payment |
Payment date: 20170221 Year of fee payment: 12 |
|
FPAY | Annual fee payment |
Payment date: 20180212 Year of fee payment: 13 |
|
FPAY | Annual fee payment |
Payment date: 20190207 Year of fee payment: 14 |